Sei sulla pagina 1di 1343

Analisi armonica:

aspetti classici e numerici

Serie e trasformate di Fourier,


trasformate di Laplace e zeta,
trasformata discreta di Fourier, FFT e wavelets,
filtri e trattamento numerico dei segnali

Massimo A. Picardello
Dipartimento di Matematica
Universit di Roma Tor Vergata
Via della Ricerca Scientica
00133 Roma, Italy
e-mail: picard@mat.uniroma2.it

BOZZA 28.5.2014

13:41

Indice
Prefazione

xiii

Preliminari di Analisi Reale, Complessa e Funzionale


1

1 Panoramica su calcolo ed analisi reale


1.1 Fatti elementari ben noti . . . . . . . . . . . . . . . . . . . .
1.2 Spazi normati e completezza . . . . . . . . . . . . . . . . . .
1.3 Convergenza uniforme . . . . . . . . . . . . . . . . . . . . .
1.3.1 Convergenza di successioni di funzioni . . . . . . . .
1.3.2 Convergenza uniforme di serie . . . . . . . . . . . . .
1.4 Serie di potenze . . . . . . . . . . . . . . . . . . . . . . . . .
1.5 Esercizi . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.6 Serie di Taylor . . . . . . . . . . . . . . . . . . . . . . . . . .
1.6.1 Sviluppabilit in serie di Taylor . . . . . . . . . . . .
1.6.2 Funzioni analitiche reali . . . . . . . . . . . . . . . .
1.6.3 La serie binomiale . . . . . . . . . . . . . . . . . . .
1.7 Spazi p . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.8 Uniforme continuit . . . . . . . . . . . . . . . . . . . . . . .
1.9 Misura ed integrale di Lebesgue . . . . . . . . . . . . . . . .
1.9.1 Insiemi aperti ed insiemi misurabili . . . . . . . . . .
1.9.2 Caratterizzazione della integrabilit secondo Riemann
1.9.3 Funzioni misurabili secondo Lebesgue . . . . . . . . .
1.9.4 Costruzione dellintegrale di Lebesgue . . . . . . . . .
1.10 Topologie e propriet di separazione . . . . . . . . . . . . .
1.11 Caratterizzazione della compattezza . . . . . . . . . . . . .
1.12 Equicontinuit . . . . . . . . . . . . . . . . . . . . . . . . .
i

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

3
3
13
19
19
32
37
43
52
52
54
57
58
68
69
71
81
82
82
92
101
103

ii

INDICE
1.13
1.14
1.15
1.16
1.17
1.18
1.19
1.20
1.21
1.22

1.23

1.24
1.25
1.26
1.27
1.28

1.29

1.30

Topologie deboli indotte da famiglie di funzioni . . . . . . .


Approssimazione con funzioni semicontinue o continue . . .
Funzioni convesse . . . . . . . . . . . . . . . . . . . . . . . .
Spazi Lp . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Inclusioni fra spazi Lp e fra spazi p . . . . . . . . . . . . . .
Densit di C(I) in Lp (I) . . . . . . . . . . . . . . . . . . . .
Dualit fra spazi Lp . . . . . . . . . . . . . . . . . . . . . . .
Integrali multipli . . . . . . . . . . . . . . . . . . . . . . . .
Limiti e continuit in pi variabili . . . . . . . . . . . . . . .
Calcolo in pi variabili e cambio di variabili negli integrali .
1.22.1 Derivate parziali e dierenziale . . . . . . . . . . . .
1.22.2 Derivata complessa e dierenziabilit . . . . . . . .
1.22.3 Regola della catena, invertibilit locale . . . . . . . .
1.22.4 Integrazione per cambiamento di variabile . . . . . .
Integrali dipendenti da un parametro . . . . . . . . . . . . .
1.23.1 Derivazione sotto il segno di integrale . . . . . . . . .
1.23.2 Integrali su domini illimitati, uniformem. convergenti
1.23.3 Integrali con singolarit, uniformemente convergenti .
1.23.4 Esempio: la funzione Gamma . . . . . . . . . . . . .
Misura esterna e Lemma di Vitali . . . . . . . . . . . . . . .
Derivabilit di funzioni monotne . . . . . . . . . . . . . . .
Funzioni di variazione limitata . . . . . . . . . . . . . . . . .

Il teorema fondamentale del calcolo . . . . . . . . . . . . .

Funzioni assolutamente continue . . . . . . . . . . . . . . .


1.28.1 Variazione limitata e misure di Borel . . . . . . . .
1.28.2 Funzioni continue singolari . . . . . . . . . . . . . .
1.28.3 Linsieme di Cantor . . . . . . . . . . . . . . . . . .

Integrali curvilinei e forme dierenziali . . . . . . . . . . . .


1.29.1 Curve regolari . . . . . . . . . . . . . . . . . . . . . .
1.29.2 Curve di lunghezza nita . . . . . . . . . . . . . . . .
1.29.3 Integrali curvilinei di campi scalari . . . . . . . . . .
1.29.4 Altre nozioni di integrale curvilineo . . . . . . . . . .
1.29.5 Campi vettoriali e forme dierenziali . . . . . . . . .
1.29.6 Insiemi connessi . . . . . . . . . . . . . . . . . . . . .
1.29.7 Campi conservativi e forme dierenziali esatte . . . .
1.29.8 Forme dierenziali esatte di classe C 1 . . . . . . . .
Appendice: misura di Lebesgue secondo Carathodory . . .
1.30.1 Misura esterna . . . . . . . . . . . . . . . . . . . . .

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

105
107
114
119
131
132
139
143
148
154
155
161
161
164
167
167
169
172
172
174
177
180
183
187
198
200
201
207
207
210
211
213
218
219
221
223
226
226

INDICE
1.30.2 Insiemi misurabili secondo Lebesgue
1.30.3 I Boreliani sono misurabili . . . . . .
1.30.4 Misura di Lebesgue . . . . . . . . . .
1.31 Appendice: disuguaglianza di Minkowski . .

iii
.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

2 Analisi complessa
2.1 Derivata complessa e dierenziabilit . . . . . . . . . . . . .
2.2 Funzioni olomorfe ed armoniche . . . . . . . . . . . . . . . .
2.3 Indice di avvolgimento . . . . . . . . . . . . . . . . . . . . .
2.4 Invarianza per omotopia e teorema di Cauchy . . . . . . . .
2.5 Formula di Cauchy . . . . . . . . . . . . . . . . . . . . . . .
2.6 Zeri di funzioni olomorfe . . . . . . . . . . . . . . . . . . . .
2.7 Singolarit rimovibili ed essenziali . . . . . . . . . . . . . . .
2.8 Crescita di funzioni olomorfe . . . . . . . . . . . . . . . . . .
2.9 Sviluppi di Laurent . . . . . . . . . . . . . . . . . . . . . . .
2.10 Il teorema dei residui . . . . . . . . . . . . . . . . . . . . . .
2.11 Lindicatore logaritmico . . . . . . . . . . . . . . . . . . . .
2.12 Calcolo di integrali . . . . . . . . . . . . . . . . . . . . . . .
2.12.1 Integrali di funzioni senza singolarit reali . . . . . .
2.12.2 Integrali di funzioni con poli semplici reali . . . . . .
2.12.3 Trasformate di Fourier di funzioni limitate allinnito
2.12.4 La trasformata di Fourier della funzione sinc . . . . .
2.12.5 Integrali di espressioni trigonometriche razionali . . .
2.12.6 Residui: esercizi ed esempi . . . . . . . . . . . . . . .
2.13 La funzione Gamma . . . . . . . . . . . . . . . . . . . . . .
2.14 Prolungamento analitico . . . . . . . . . . . . . . . . . . . .
2.14.1 Il logaritmo complesso: denizione naturale . . . . .
2.14.2 Elementi analitici di funzione . . . . . . . . . . . . .
2.14.3 Prolungamento analitico lungo curve . . . . . . . . .
2.14.4 Primitive complesse e logaritmo . . . . . . . . . . . .
2.14.5 Rami olomor . . . . . . . . . . . . . . . . . . . . . .
2.15 Interpolazione sulle strisce: il teorema di PhragmnLindelf
2.16 Appendice: teorema di Cauchy in un convesso . . . . . . . .

.
.
.
.

228
230
232
233

235
. 235
. 239
. 242
. 244
. 249
. 254
. 255
. 257
. 260
. 265
. 268
. 269
. 270
. 272
. 276
. 277
. 280
. 282
. 294
. 297
. 297
. 298
. 299
. 306
. 315
. 324
. 327

3 Spazi vett. topologici, analisi funzionale


331
3.1 Spazi vettoriali topologici . . . . . . . . . . . . . . . . . . . . 332
3.1.1 Sottospazi e quozienti . . . . . . . . . . . . . . . . . . 333
3.1.2 Intorni stellati . . . . . . . . . . . . . . . . . . . . . . . 335

iv

INDICE

3.2

3.3
3.4
3.5
3.6
3.7
3.8
3.9

3.10
3.11
3.12
3.13

3.14
3.15
3.16
3.17
3.18

3.19
3.20
3.21

3.1.3 Propriet di separazione e di limitatezza . . . . . . . .

Spazi metrizzabili e normabili . . . . . . . . . . . . . . . . .


3.2.1 Spazi vettoriali localmente limitati . . . . . . . . . . .
3.2.2 Spazi metrizzabili . . . . . . . . . . . . . . . . . . . . .
3.2.3 Spazi normabili . . . . . . . . . . . . . . . . . . . . . .
Operatori lineari limitati e funzionali lineari . . . . . . . . . .
3.3.1 Funzionali lineari . . . . . . . . . . . . . . . . . . . . .

Assioma della scelta e principio di massimalit . . . . . . . .


Il teorema di HahnBanach . . . . . . . . . . . . . . . . . . .

Teorema di HahnBanach in forma geometrica . . . . . . . .

Prodotto di spazi compatti . . . . . . . . . . . . . . . . . . .


Dualit su spazi vettoriali topologici . . . . . . . . . . . . . .

Teorema di KreinMilman . . . . . . . . . . . . . . . . . . . .
3.9.1 Separabilit di insiemi convessi con funzionali . . . . .
3.9.2 Teorema di KreinMilman . . . . . . . . . . . . . . .
3.9.3 Punti estremi di sfere in spazi di Banach . . . . . . . .
Il teorema di BanachAlaoglu . . . . . . . . . . . . . . . . . .
Duali di spazi normati e loro topologia debole ; spazi riessivi
3.11.1 Loperatore aggiunto . . . . . . . . . . . . . . . . . . .
Esempi di dualit fra spazi di Banach . . . . . . . . . . . . . .
Il teorema di categoria di Baire . . . . . . . . . . . . . . . . .
3.13.1 Teorema di Baire . . . . . . . . . . . . . . . . . . . . .
3.13.2 Insiemi di prima e di seconda categoria . . . . . . . . .
3.13.3 Basi di Hamel . . . . . . . . . . . . . . . . . . . . . .
Il teorema di uniforme limitatezza . . . . . . . . . . . . . . . .
Il teorema dellapplicazione aperta . . . . . . . . . . . . . . . .
Il teorema del graco chiuso . . . . . . . . . . . . . . . . . . .

Seminorme e spazi localmente convessi . . . . . . . . . . . . .


3.17.1 Famiglie numerabili di seminorme . . . . . . . . . . . .
Esempi di spazi di Frchet . . . . . . . . . . . . . . . . . . . .
3.18.1 Gli spazi C (), D() e DK . . . . . . . . . . . . . .
3.18.2 La topologia di limite induttivo su D() . . . . . . . .

Propriet di HeineBorel . . . . . . . . . . . . . . . . . . . .
3.19.1 Propriet di HeineBorel . . . . . . . . . . . . . . . . .

Esempi esotici: spazi non localmente limitati . . . . . . . . .


3.20.1 C () non localmente limitato . . . . . . . . . . . .

Esempi esotici: spazi non localmente convessi . . . . . . . .


3.21.1 Spazi Lp [0, 1] e Lp (R) per 0 < p < 1 . . . . . . . . . . .

336
339
339
340
342
345
349
350
352
359
362
364
368
368
372
375
379
383
387
387
392
392
393
394
396
398
403
405
405
409
409
412
421
424
426
426
429
429

INDICE

3.21.2 Un compatto numerabile senza punti estremi . . . . . . 431


3.21.3 Spazi p per 0 < p < 1 . . . . . . . . . . . . . . . . . . 432
3.22 Il teorema di interpolazione di RieszThorin . . . . . . . . . . 435

II

Serie e trasformate di Fourier

4 Spazi di Hilbert
4.1 Teorema di migliore approssimazione
4.2 Completezza . . . . . . . . . . . . . .
4.3 Sistemi ortonormali . . . . . . . . . .
4.4 Spazi di Hilbert . . . . . . . . . . . .
4.5 Disuguaglianza di CauchySchwarz .
4.6 Operatori e funzionali lineari, dualit

437
.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

5 Serie di Fourier
5.1 Il sistema trigonometrico . . . . . . . . . . . . . .
5.2 Sviluppi di Fourier in L2 . . . . . . . . . . . . . .
5.3 Esempi di sviluppi di Fourier in L2 . . . . . . . .
5.4 Sviluppi di Fourier in L1 . . . . . . . . . . . . . .
5.5 Problematiche sulle serie di Fourier . . . . . . . .
5.6 Sviluppi di Fourier con periodo arbitrario . . . . .
5.7 Scelta del periodo . . . . . . . . . . . . . . . . . .
5.8 Somme di Dirichlet . . . . . . . . . . . . . . . . .
5.9 Stime puntuali ed uniformi per il resto n-esimo . .
5.10 Visualizzazione del Lemma di RiemannLebesgue
5.11 Gli spazi LIP() . . . . . . . . . . . . . . . . . .
5.12 Convergenza puntuale e uniforme in LIP() . . .
5.13 Completezza del sistema trigonometrico . . . . . .
5.14 La funzione a denti di sega . . . . . . . . . . . . .
5.15 Serie di Fourier di funzioni C 1 a tratti con salti .
5.16 Derivazione ed integrazione di serie di Fourier . .
5.17 Velocit di convergenza della serie di Fourier . . .
5.18 Ordine di innitesimo dei coecienti . . . . . . .
5.19 Fenomeno di Gibbs . . . . . . . . . . . . . . . . .
5.20 Esercizi . . . . . . . . . . . . . . . . . . . . . . .

.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.

439
. 439
. 445
. 448
. 454
. 463
. 464

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

473
. 473
. 480
. 484
. 491
. 491
. 495
. 496
. 497
. 501
. 512
. 514
. 521
. 523
. 531
. 533
. 535
. 539
. 543
. 549
. 559

vi

INDICE

6 Approssimazione trigonometrica e polinomiale


6.1 Convoluzione ed identit approssimate . . . . .
6.2 Nucleo di Fjr ed altri nuclei di sommabilit .
6.2.1 Nucleo di Fjr . . . . . . . . . . . . . .
6.2.2 Nucleo di Poisson . . . . . . . . . . . .
6.2.3 Nucleo di de la Valle-Poussin . . . . .
6.3 Approssimazione con polinomi . . . . . . . . .
7

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

589
. 589
. 602
. 604
. 611
. 616
. 617

Complementi sulle serie di Fourier


621
7.1 Premessa notazionale . . . . . . . . . . . . . . . . . . . . . . . 621
7.2 Serie di Fourier: un approccio facile . . . . . . . . . . . . . . . 622
7.3 Ccoecienti di Fourier di funzioni BV e Lip() . . . . . . . . 628
7.4 Convergenza puntuale di serie di Fourier di funzioni BV . . . 629
7.5 I test di Dini e Jordan . . . . . . . . . . . . . . . . . . . . . . 631
7.6 Convergenza in norma di serie di Fourier . . . . . . . . . . . . 638
7.6.1 Divergenza delle costanti di Lebesgue . . . . . . . . . . 639
7.6.2 Spazi di Banach omogenei sul toro . . . . . . . . . . . 641
7.6.3 Divergenza in norma in L1 e C . . . . . . . . . . . . . 644
7.6.4 La funzione coniugata . . . . . . . . . . . . . . . . . . 648
7.6.5 Una serie trigonometrica coniugata che non di Fourier 656
7.6.6 Lp ammette coniugazione per 1 < p < . . . . . . . . 661
7.6.7 Convergenza in norma in spazi con coniugazione . . . . 665
7.7 Loperatore coniugato di tipo debole 1-1 . . . . . . . . . . . 668
7.7.1 La funzione di distribuzione . . . . . . . . . . . . . . . 668
7.7.2 Lo spazio Lp debole . . . . . . . . . . . . . . . . . . . . 669
7.7.3 Loperatore coniugato di tipo debole 1-1 . . . . . . . 672
7.7.4 Loperatore coniugato manda L log L in L1 . . . . . . 675
7.7.5 Loperatore coniugato come operatore integrale singolare679
7.8 Appendice: il teorema massimale di HardyLittlewood . . . . 679
7.8.1 Operatori massimali . . . . . . . . . . . . . . . . . . . 679
7.8.2 Limitatezza delloperatore massimale di HardyLittlewood680
7.8.3 Limitatezza delloperatore coniugato massimale radiale683
7.9 Insiemi di divergenza puntuale . . . . . . . . . . . . . . . . . . 684

8 Trasformata di Fourier
8.1 Dal discreto al continuo: approccio intuitivo . . . . . . . . .
8.2 Propriet della trasformata di Fourier . . . . . . . . . . . . .
8.3 Trasformata di Fourier della Gaussiana . . . . . . . . . . . .

687
. 687
. 691
. 704

INDICE
8.4
8.5
8.6
8.7
8.8

vii
Teorema di inversione di Fourier . . . . . .
Convoluzione e teorema di Plancherel . . .
Localizzazione nel tempo e nella frequenza
Esercizi . . . . . . . . . . . . . . . . . . .
Varianti dei precedenti esercizi . . . . . . .

.
.
.
.
.

.
.
.
.
.

9 Classe di Schwartz
9.1 Convergenza rispetto a famiglie di seminorme
9.2 Continuit rispetto a famiglie di seminorme .
9.3 Classe di Schwartz . . . . . . . . . . . . . . .
9.4 Completezza di S . . . . . . . . . . . . . . . .
9.5 Operatori lineari continui su S . . . . . . . . .
9.6 Prodotto con funzioni a crescita polinomiale .
9.7 Trasformata di Fourier su S . . . . . . . . . .
9.8 Operatori di convoluzione su S . . . . . . . .
9.9 Appendice: la disuguaglianza di Heisenberg
9.10 Esercizi . . . . . . . . . . . . . . . . . . . . .

III

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

737
. 737
. 741
. 743
. 746
. 748
. 750
. 753
. 758
. 760
. 764

Campionamento e ricostruzione di segnali

10 Campionamento
10.1 Campionamento di segnali . .
10.2 Periodicizzazione . . . . . . .
10.3 Formula di somma di Poisson
10.4 Teorema del campionamento .

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

11 Distribuzioni
11.1 Campionamento e funzionali . . . . . . .
11.2 Funzionali continui e prodotti scalari . .
11.3 Dualit . . . . . . . . . . . . . . . . . . .
11.4 Densit di S e convergenza in S . . . . .
11.5 Distribuzioni temperate . . . . . . . . .
11.6 Serie di distribuzioni temperate . . . . .
11.7 La non una funzione . . . . . . . . .
11.8 Operatori sulle distribuzioni . . . . . . .
11.8.1 Moltiplicazione per una funzione
11.8.2 Derivata . . . . . . . . . . . . . .

.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.

707
709
713
715
724

775
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.

777
777
780
783
786

.
.
.
.

.
.
.
.

.
.
.
.
.
.
.
.
.
.

797
. 797
. 805
. 806
. 812
. 817
. 824
. 831
. 835
. 835
. 836

viii

INDICE
11.9 Derivate, primitive ed approssimazioni in S . .
11.10Supporto di distribuzioni . . . . . . . . . . . . .
11.11Trasformata di Fourier su S . . . . . . . . . . .
11.12Propriet della trasformata di Fourier . . . . . .
11.13Convoluzione con funzioni . . . . . . . . . . . .
11.14Convoluzione con la delta e traslazione . . . . .
11.15Appendice: identit approssimate . . . . . . . .
11.16Esercizi . . . . . . . . . . . . . . . . . . . . . .
11.17Distribuzioni non temperate . . . . . . . . . . .
11.17.1 Lo spazio D . . . . . . . . . . . . . . . .
11.17.2 Convergenza nel senso delle distribuzioni
11.17.3 Supporto e convoluzione di distribuzioni
11.17.4 Distribuzioni e distribuzioni temperate .

.
.
.
.
.
.
.
.
.
.
.
.
.

12 Approssimanti in S del treno di impulsi


12.1 Il treno di impulsi . . . . . . . . . . . . . . . . . .
12.2 Trasformata di Fourier del treno di impulsi . . . .
12.3 Approssimanti di K . . . . . . . . . . . . . . . . .
12.4 Appendice: approssimazione di K con funzioni in
12.5 Appendice: radici dellunit . . . . . . . . . . . .

.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.

. .
. .
. .
S
. .

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.

838
844
845
848
856
858
860
863
897
897
899
900
901

.
.
.
.
.

903
. 903
. 905
. 909
. 913
. 921

13 Ricostruzione ed aliasing
925
13.1 Campionamento e distribuzioni . . . . . . . . . . . . . . . . . 925
13.2 Ricostruzione numerica ingenua . . . . . . . . . . . . . . . . . 933
13.3 Ricostruzione numerica corretta . . . . . . . . . . . . . . . . . 934
13.4 Campionamento di distribuzioni . . . . . . . . . . . . . . . . . 936
13.5 Aliasing . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 942
13.5.1 Campionamento multidimensionale e risoluzione di immagini947
13.6 Ricostruzione di segnali nella pratica quotidiana: preltraggio e stabilit947
13.6.1 Segnali a durata nita . . . . . . . . . . . . . . . . . . 947
13.6.2 Stabilit della ricostruzione sotto perturbazioni dei dati 951
13.6.3 Ricostruzione esatta e ricostruzioni approssimate . . . 952
13.7 Cenni sul campionamento non uniforme . . . . . . . . . . . . . 954

IV

DFT, DCT, FFT, deconvoluzione

14 DFT

963
965

INDICE
14.1 Segnali periodici e discreti . . . . .
14.2 Discretizzazione e DFT . . . . . . .
14.3 Trasformata di Fourier su ZN . . .
14.4 Convoluzione ciclica e DFT . . . .
14.5 Convoluzione non normalizzata . .
14.6 Traslazione e DFT . . . . . . . . .
14.7 Parit e DFT di successioni reali .
14.8 DFT e dilatazioni . . . . . . . . . .
14.9 RDFT . . . . . . . . . . . . . . . .
14.10DCT . . . . . . . . . . . . . . . . .
14.11DFT, periodicizzazione e formula di
14.12Esercizi . . . . . . . . . . . . . . .

ix
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
somma di Poisson
. . . . . . . . . . .

15 FFT
15.1 Dalla DFT alla FFT . . . . . . . . . . . . . . . . . .
15.2 Algoritmi FFT basati sulla decimazione nel tempo . .
15.2.1 Bit reversal . . . . . . . . . . . . . . . . . . .
15.3 Algoritmi FFT basati sulla decimazione in frequenza
15.4 Algoritmi FFT a radice 2 . . . . . . . . . . . . . . . .
15.5 Algoritmi di FFT a radice arbitraria . . . . . . . . .
15.6 Preprocessing e postprocessing . . . . . . . . . . . . .
15.7 Esercizi . . . . . . . . . . . . . . . . . . . . . . . . .

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

16 Lerrore di approssimazione di F con la DFT


16.1 DFT e coecienti di Fourier . . . . . . . . . . . . . . . . .
16.1.1 La formula di somma di Poisson discreta . . . . . .
16.1.2 Dati periodici, spettro limitato: ricostruzione esatta
16.1.3 Dati periodici, spettro illimitato: stima dellerrore .
16.2 DFT e trasformata di Fourier . . . . . . . . . . . . . . . .
16.2.1 Funzioni a supporto compatto . . . . . . . . . . . .
16.2.2 Funzioni a banda spettrale limitata . . . . . . . . .
16.2.3 Supporto e banda spettrale illimitate . . . . . . . .
17 Deconvoluzione e DFT a finestre
17.1 Deconvoluzione non partizionata . . . . . . . . . . . .
17.1.1 Filtri invarianti per traslazione . . . . . . . . .
17.1.2 Soppressione a posteriori dellequalizzazione .
17.2 Convoluzione a nestre; equalizzazione in tempo reale

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.

965
966
972
976
983
985
988
991
994
997
999
1001

.
.
.
.
.
.
.
.

1015
. 1015
. 1017
. 1029
. 1032
. 1038
. 1042
. 1050
. 1054

.
.
.
.
.
.
.
.

1057
. 1058
. 1058
. 1060
. 1062
. 1065
. 1065
. 1069
. 1072

.
.
.
.

1077
. 1077
. 1077
. 1080
. 1086

INDICE
17.3 De-equalizzazione in tempo reale . . . . . . . . . . . . . . . . 1092
17.3.1 Esempi numerici di de-equalizzazione . . . . . . . . . . 1096

V Trasformata di Laplace, trasformata zeta, filtri lineari


1109
18 Trasformata di Laplace
18.1 Trasformata di Laplace, inversione . . . . . .
18.2 Propriet della trasformata di Laplace . . .
18.3 Esempi di trasformate di Laplace . . . . . .
18.4 Trasformata di Laplace della convoluzione .
18.5 Trasformata di Laplace di distribuzioni . . .
18.5.1 Distribuzioni a supporto in R+ . . .
18.5.2 Immagine di L su D . . . . . . . . .
18.5.3 Continuit di L su D . . . . . . . . .
18.5.4 Distribuzioni a supporto bi-illimitato
18.6 L su D e teoremi di PaleyWiener . . . . . .
19 Trasformata zeta
19.1 Trasformata zeta e sue propriet . . . . .
19.2 Inversione della trasformata zeta . . . . .
19.2.1 Metodo iterativo di inversione per
19.3 Trasformata zeta e convoluzione . . . . .

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

. . . . . . . . . .
. . . . . . . . . .
funzioni razionali
. . . . . . . . . .

.
.
.
.
.
.
.
.
.
.

1111
. 1111
. 1117
. 1121
. 1123
. 1125
. 1125
. 1128
. 1130
. 1131
. 1133

.
.
.
.

1143
. 1144
. 1152
. 1159
. 1160

20 Sistemi a tempo discreto: filtri digitali


1167
20.1 Equazioni alle dierenze . . . . . . . . . . . . . . . . . . . . . 1167
20.2 Sistemi a tempo discreto: ltri digitali lineari di ordine nito . 1171
20.2.1 Filtri digitali causali e stabili . . . . . . . . . . . . . . 1174
20.2.2 SubS:Filtri stabili del primo e secondo ordine . . . . . 1179
20.2.3 Risposta allimpulso di ltri causali razionali . . . . . . 1180
20.3 Analisi spettrale di ltri digitali lineari . . . . . . . . . . . . . 1183
20.3.1 Risposta in frequenza di ltri causali . . . . . . . . . . 1186
20.4 Fattorizzazione fase minima + passa-tutto . . . . . . . . . . . 1199
20.4.1 Invertibilit e tri a fase minima; ltri a fase massima o mista1199
20.4.2 Filtri a fase minima . . . . . . . . . . . . . . . . . . . . 1201
20.4.3 Filtri passa-tutto . . . . . . . . . . . . . . . . . . . . . 1205
20.4.4 Fattorizzazione fase minima + passa-tutto . . . . . . . 1211

INDICE

xi

20.4.5 Filtri a retroazione (feedback ) . . . . . . . . . . . . . . 1216


20.5 Filtri AZ e ltri AP . . . . . . . . . . . . . . . . . . . . . . . 1223
20.6 Diagrammi di usso di ltri digitali lineari . . . . . . . . . . . 1223

VI

Wavelets e compressione dei segnali

21 Il sistema di Haar
21.1 Intervalli diadici . . . . . . . . . . . . . . .
21.2 Funzioni semplici diadiche . . . . . . . . .
21.3 Il sistema di Haar su R . . . . . . . . . . .
21.4 Ortogonalit del sistema di Haar . . . . .
21.5 Il Lemma di divisione . . . . . . . . . . . .
21.6 Sistemi ortonormali completi . . . . . . . .
21.7 Completezza del sistema di Haar su R . .
21.8 Il sistema di Haar su [0, 1] . . . . . . . . .
21.9 Ortonormalit del sistema di Haar su [0, 1]
21.10Localizzazione delle discontinuit . . . . .

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

1229
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

22 LAnalisi in Multirisoluzione
22.1 Richiami di analisi di Fourier . . . . . . . . . . . .
22.1.1 Serie di Fourier . . . . . . . . . . . . . . . .
22.1.2 Trasformata di Fourier . . . . . . . . . . . .
22.2 Sistemi ortonormali di traslate . . . . . . . . . . . .
22.3 Analisi di Multirisoluzione . . . . . . . . . . . . . .
22.4 Funzione di scala e ondicella associata ad una MRA
22.5 Esempi di MRA . . . . . . . . . . . . . . . . . . . .
22.5.1 Spline lineari . . . . . . . . . . . . . . . . .
22.5.2 Londicella di Shannon . . . . . . . . . . . .
22.5.3 Ondicelle che non provengono da MRA . . .
23 La Trasformata Discreta di Ondicelle
23.1 Lalgoritmo . . . . . . . . . . . . . . .
23.2 Propriet dei ltri provenienti da MRA
23.3 Filtri . . . . . . . . . . . . . . . . . . .
23.4 QMF . . . . . . . . . . . . . . . . . . .
23.5 La trasformata discreta di ondicelle . .
23.6 QMF che generano MRA . . . . . . . .

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

1231
. 1231
. 1233
. 1234
. 1235
. 1238
. 1239
. 1240
. 1242
. 1242
. 1244

.
.
.
.
.
.
.
.
.
.

1247
. 1247
. 1247
. 1248
. 1251
. 1254
. 1265
. 1267
. 1267
. 1274
. 1275

.
.
.
.
.
.

1277
. 1277
. 1279
. 1280
. 1284
. 1286
. 1288

xii

INDICE
23.6.1 Prodotti inniti . . . . . . . . . . . . . . . . . . . . . . 1289
23.6.2 QMF e funzione di scala . . . . . . . . . . . . . . . . . 1291
23.7 Lalgoritmo a cascata . . . . . . . . . . . . . . . . . . . . . . . 1293

24 Ondicelle a Supporto Compatto


24.1 Lunghezza del ltro e supporto della funzione di
24.2 Ondicelle ed approssimazione . . . . . . . . . .
24.3 Riproducibilit dei polinomi . . . . . . . . . . .
24.4 Le ondicelle di Daubechies . . . . . . . . . . . .
24.5 Fattorizzazione spettrale . . . . . . . . . . . . .

scala
. . .
. . .
. . .
. . .

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

1297
. 1297
. 1300
. 1304
. 1307
. 1311

Prefazione
I primi passi che portarono alla redazione di questo libro furono intrapresi nel 2001 per le esigenze di un insegnamento del secondo anno di Analisi
Armonica presso un Corso di Laurea sulle basi scientifiche, in particolare
matematiche, della comunicazione multimediale che era recentemente stato
istituito presso lUniversit di Roma Tor Vergata e che allora si chiamava
Scienza dei Media e della Comunicazione. La opportunit di introdurre lanalisi di Fourier in qualsiasi corso di studi a base matematica non richiede
spiegazioni. Peraltro, gli studenti di quello specifico Corso di Laurea erano
molto pi interessati alla comunicazione multimediale che non alla matematica, e per questo tentammo di fornirgli ulteriore motivazione inserendo nel
programma dellinsegnamento di Analisi Armonica una applicazione concreta
di loro interesse, cruciale per la ricostruzione nel tempo di segnali noti solo su
una successione equispaziata discreta di campioni: il teorema del campionamento di Shannon. Lapproccio rigoroso a tale risultato necessita solo di un
fatto classico dellanalisi di Fourier, la formula di somma di Poisson: per
la sua visualizzazione precisa, la sua collocazione naturale nellambito della
teoria di Fourier e lo studio dellerrore nel caso in cui le condizioni del teorema siano solo approssimate richiedono di visualizzare i segnali campionati
come distribuzioni discrete. Poich uno degli obiettivi del processo formativo
era la trattazione matematica rigorosa ed esauriente, questo portava ad un
ampliamento notevole del programma abituale di analisi di Fourier. Daltra parte, la necessit imprescindibile di trattare le serie di Fourier portava
inevitabilmente anche ad esporre gli spazi di Hilbert, ed era opportuno dare almeno un cenno sulla trasformata rapida di Fourier e la trasformata di
Fourier discreta. Divenne subito chiaro che il numero di libri di testo da suggerire, e la quantit di incisi e divagazioni necessarie a visualizzare concetti
cos sofisticati in un insegnamento del secondo anno, eccedeva le capacit di
sintesi degli studenti: era pertanto necessario redigere le note del corso sotto
xiii

xiv

PREFAZIONE

forma di un libro unitario.


In quel periodo, si tent anche di fornire agli studenti libri di testo per
tutti i corsi, disponibili gratuitamente online, ed aggiornabili di lezione in
lezione sulla base dei risultati didattici. Come buona norma per corsi inerenti la multimedialit, questi libri di testo dovevano essere navigabili, ossia
dovevano avere almeno la struttura di un ipertesto con link interni per spostarsi da un argomento a quelli logicamente collegati. Pertanto questo libro
redatto come documento in formato pdf, dove tutti i riferimenti matematici
numerati (teoremi, proposizioni, lemmi, corollari, definizioni, esempi, esercizi, riferimenti bibliografici, riferimenti a capitoli e cos via) sono connessioni
di ipertesto. Sottolineamo, come cautela per il lettore, che questo lintendimento del libro: offrire a studenti generalmente con scarse basi e scarsa
memoria dei preliminari matematici la possibilit di rintracciare immediatamente, con un clic del mouse, ciascuno dei risultati citati. Naturalmente,
ci implica che ogni risultato che viene utilizzato viene citato esplicitamente: questo assai fasdtidioso per il lettore anche solo parzialmente esperto,
che vede lesposizione rallentata da continui riferimenti espliciti a fatti perfettamente noti, come ad esempio il teorema fondamentale del calcolo o la
definizione di funzione caratteristica: ma utile per gli studenti pi deboli,
per le cui esigenze il libro fu inizialmente concepito. Inevitabilmente, un lettore non alle prime armi trover la presentazione troppo prolissa: ma daltra
parte, la trattazione ormai molto ampia, ed imprescindibile che i lettori non perdano i contatti con i riferimenti interni. Unaltra conseguenza
fastidiosa di questo stile espositivo il fatto che ogni commento formulato come Nota separata e numerata, invece che come osservazione discorsiva
incidentale.
Il nucleo originale del libro consisteva dei Capitoli 4, 5, 6, 8, 9, 10, 11,
12, 13, 14, 15, ma in forma assai pi concisa. A poco a poco questi capitoli si
arricchirono di nuove sezioni o argomenti, ad esempio esercizi svolti assegnati
in classe od agli esami. In realt, il Capitolo 12 in parte di per s stesso
un esercizio: la sua Appendice 12.4 (e precisamente lEsempio 12.3.7 ed
il Teorema 12.4.3) un elaborato e difficile esercizio sullapprossimazione
uniforme ed in S. Questo argomento esposto solo per stimolare lintuito dei
lettori su questi argomenti invece che il ricorso a metodi pi astratti come la
formula di somma di Poisson, ma esposto non in modo completo: il lettore
non fortemente motivato invitato ad astenersene.
Visto che il libro si stava evolvendo verso unopera con riferimenti (interni o esterni) ai preliminari necessari, cercai di incorporarvi alcuni di tali

xv
preliminari sui quali spesso si sorvolava negli insegnamenti precedenti: solo
cenni alle basi concettuali del Calcolo, ovviamente, ma un trattamento un pochino pi approfondito, sebbene non esauriente, di argomenti pi avanzati di
Calcolo e di Analisi Reale: convergenza uniforme, serie di potenze, uniforme
continuit, calcolo in pi variabili, integrali dipendenti da un parametro, integrali curvilinei, forme differenziali, misura di Lebesgue, spazi Lp , teorema di
Fubini, funzioni di variazione limitata ed assolutamente continue e generalizzazioni del teorema fondamentale del Calcolo. Questi argomenti sono esposti
nel Capitolo preliminare 1, che, a parte leccezione gi citata del Capitolo 12,
lunico nel quale alcune dimostrazioni non sono completamente sviluppate,
e su dettagli talvolta delicati si sorvola, o vengono aggirati a spese del rigore.
In effetti, i contenuti di questo Capitolo coprono gran parte dei corsi preliminari di Analisi del primo e secondo anno, ma sono stati progettati pi
per coprire lacune che come libro di testo. Alcuni punti specifici sono stati
relegati ad appendici. Gli argomenti elementari del Calcolo non sono stati
ridimostrati, ma sono stati enunciati nella Sezione iniziale 1.1, che quindi
viene citata frequentemente: per il lettore con sufficiente competenza per
capire questo libro non dovrebbe averne bisogno, e quindi il suo eventuale
ricorso a questi link ai preliminari della prima Sezione un indizio di inadeguatezza sul quale dovrebbe riflettere e trarre le debite conseguenze. Esigui
cenni minimali di Analisi Funzionale, necessari solo per problemi specifici
pi avanzati su convergenza o divergenza di serie di Fourier e sulla nozione
di convergenza nello spazio delle distribuzioni temperate, sono succintamente
trattati nel Capitolo 3. La parte preliminare completata da una esposizione
sullanalisi complessa in una variabile (Capitolo 2) e sullAnalisi Funzionale
(Capitolo 3), che non sono necessari per il Corso di Laurea in Scienza e
Tecnologia per i Media, ma potrebbero essere usati al Corso di Laurea Magistrale in Matematica come testi di insegnamenti elementari ma abbastanza
esaurienti su questi temi (manca per lo studio delle mappe conformi e la
dimostrazione del teorema di Picard).
Ulteriori approfondimenti sulla convergenza di serie di Fourier sono inclusi
nel Capitolo 7: essi includono una dimostrazione molto pi semplice del teorema di convergenza puntuale di serie di Fourier, dovuta a Chernoff (sulla
quale sono grato ad Alessandro Fig-Talamanca di aver richiamato la mia
attenzione, mettendomi anche a disposizione le sue note [12]), i criteri di convergenza pi avanzati di Dini e Jordan, la convergenza delle serie di Fourier
in Lp per 1 < p < (e quindi il teorema massimale di HardyLittlewood),
la divergenza di serie di Fourier in L1 e L ed esempi di serie di Fourier di

xvi

PREFAZIONE

funzioni continue divergenti in un punto, o divergenti in insiemi di misura


zero pi vasti. Una Sezione dedicata alla funzione coniugata, ed in essa
trova spazio il teorema di rappresentazione integrale di Poisson di funzioni
armoniche in un disco a partire dai loro valori al bordo in L1 , ed il principio del massimo. Tutti questi argomenti non sono qui introdotti in vista
di applicazioni della matematica ad altre scienze, ma sono stimolanti per un
matematico interessato agli aspetti profondi dellanalisi di Fourier. A parte
la Sezione iniziale 7.2, lo stile di questo Capitolo, che tratta argomenti pi
sofisticati, orientato a lettori pi maturi. Ovviamente, tale Capitolo richiede qualche cenno di Analisi Funzionale, e proprio per questo stato scritto il
Capitolo 3, inizialmente come compendio di tali conoscenze elementari, ma
che si poi sviluppato in una trattazione abbastanza esauriente. Proprio per
rendere possibile tale trattazione, nel Capitolo 1 sono state aggiunte parti relative alla topologia (assiomi di separazione, propriet degli spazi topologici,
Lemma di Urysohn e Teorema di estensione di Tietze (Sezione 1.10), e le
loro conseguenze naturali, i teoremi di Egoroff e di Lusin sulla approssimabilit di funzioni misurabili (Sezione 1.14). Questi argomenti sevono solo
come premessa ad alcuni aspetti dellAnalisi Funzionale e come completamento su alcune questioni di densit nelle inclusioni fra spazi di funzioni.
Per rammentarne la non indispensabilit i titoli di queste Sezioni sono stati
contrassegnati con un asterisco.
Un caso emblematico la ripetizione di argomenti pressoch identici in Capitoli diversi, al fine di permetterne la lettura anche a coloro che non fossero
interessati a leggere il Capitolo 3 sullAnalisi Funzionale. Questo succede, ad
esempio, con la completezza di Lp e p , che era stata inizialmente esposta per
p > 1 nel Capitolo 1 sullAnalisi Reale mediante il Teorema di Riesz-Fischer
1.16.26, e poi ripresa in maniera pi diretta nel Capitolo 4 sugli Spazi di Hilbert per presentare enunciati ed esercizi soprattutto nel caso p = 2. Questo
argomento stato poi riutilizzato nella Sottosezione 3.21.1 per evidenziare alcune propriet insolite dei funzionali lineari sugli spazi Lp e p con 0 < p < 1,
e questo ha richiesto di rielaborare il Capitolo 1 per estendere a tale range
insolito di valori di p i risultati precedentemente esposti per p > 1: ci scusiamo con i lettori non interessati se questo crea qualche piccolo disagio, e li
invitiamo a saltare le parti contrassegnate con asterisco.
Ma un caso pi paradossale di ripetizione si ha per lesposizione della dualit
per spazi Lp ed altri spazi di Banach, presentata nella Sezione 1.19 del Capitolo iniziale e riassunta nella Sezione 11.3 del capitolo sulle distribuzioni, al
fine di agevolarne la comprensione a coloro che non avessere letto con cura il

xvii
capitolo iniziale, ma naturalmente riesposta con maggiore profondit in tutto
larco del Capitolo 3 sullAnalisi Funzionale: alcuni enunciati e dimostrazioni sono proprio triplicati!
Anche una parte del Capitolo 6, e precisamente alcuni risultati pi avanzati
dovuti a Lebesgue ed a Fatou sulla convergenza dei convolutori definiti dai
nuclei di Fjr e di Poisson (Sezione 6.2), rivolta a lettori pi maturi,
esclusivamente matematici, e non mirata ad applicazioni (questi risultati, comunque, sono qui esposti per completezza, e non vengono mai ripresi
nel seguito: per far presente questo fatto li abbiamo contrassegnati con dppio
asterisco).
Non sono stati inclusi argomenti di Algebra Lineare e Geometria (aparte
gli spazi di Hilbert) perch essi sono contenuti nel libro online [19] scritto
parallelamente a questo.
A questo punto, la tentazione di includere anche argomenti degli insegnamenti matematici del Corso di Laurea successivi allanalisi di Fourier era
molto forte: questo avrebbe permesso di creare una sorta di libro di testo
matematico unico, ossia di collegare tutti gli argomenti matematici dellintero processo formativo in maniera facilmente navigabile, e sviluppati con una
notazione coerente. Ho omesso gli argomenti dellinsegnamento di base di
Analisi Numerica, ma ho incluso quelli di wavelets, incorporando, nei capitoli 21, 22, 23 e 24, le note redatte per il proprio insegnamento da Sandra
Saliani, a cui esprimo la mia gratitudine. Al momento, per questi capitoli la
revisione della notazione e la predisposizione dei links di ipertesto appena
cominciata: ce ne scusiamo con i lettori.
Naturalmente, in questo modo questopera si avviava a diventare un trattato
pi che un libro. Diventava importante renderla esauriente, nei limiti delle
mie conoscenze, che sono assai limitate nei settori numerici: ma le applicazioni numeriche sono imprescindibili in un processo formativo inizialmente
pensato per le applicazioni della matematica al trattamento di segnali acustici, video e pi in generale multimediali. Un tema importante e naturale era
quello degli errori numerici nel calcolo della FFT e della DFT, presentato
nel Capitolo 16. Alcuni ulteriori argomenti furono originati dalla direzione di tesi di ricerca, ad esempio sulla trasformata di Fourier a finestre e la
deconvoluzione, e sono ora inclusi nel Capitolo 17, che contiene un link ad
un segnale acustico il quale, ovviamente, fruibile solo nella versione online
del libro, ma non in una eventuale versione stampata. Sono grato a Raffaele
Presciutti ed a Stefano Daino per aver messo a mia disposizione la propria
competenza in merito a questi argomenti. Nessuno di questi argomenti

xviii

PREFAZIONE

trattato nel Corso di Laurea in Scienze e Tecnologie per i Media (il nome
attuale del precedente Scienza dei Media e della Comunicazione), o, per
quanto mi consta, in altri corsi di studio in Italia.
C un intero altro settore, legato sia allanalisi di Fourier sia al trattamento dei segnali, che si basa sullanalisi complessa. Lambizioso obiettivo di
presentarlo si sviluppato nei Capitoli 18 (trasformata di Laplace), 19 (trasformata zeta) e 20 (applicazioni della trasformata zeta ai sistemi a tempo
discreto ed al filtraggio di segnali discreti). La analoga trattazione delle applicazioni della trasformata di Laplace alla risoluzione di equazioni differenziali
lineari ordinarie non stata intrapresa, e forse lo sar in futuro. Anche questi argomenti non sono trattati nellambito del Corso di Laurea in Scienze
e Tecnologie per i Media.
In effetti, le prime due Parti di questopera vertono su temi generali, spesso
non applicati, e la terza tratta temi generali che preludono ad applicazioni
(con la notevole eccezione del Capitolo 7 sugli approfondimenti sulle serie di
Fourier, che tratta di temi classici fortemente legati allanalisi funzionale e
non appare in alcun modo appicabile, ma non poteva essere inserito nella prima Parte perch richiede la conoscenza di serie e tyrasformata di Fourier).
Da questo punto in poi lo spirito cambia: le ultime tre Parti si indirizzano
soprattutto a tematiche numerico-applicative (con la parziale eccezione del
capitolo sulla trasformata di Laplace). Per il momento, per, la sesta parte,
ossia la trattazione di un argomento di valenza naturalmente applicativa come le wavelets, stata mantenuta nelle linee di una trattazione puramente
analitica e non numerica.
Unopera cos vasta, ma pur sempre mirata alla didattica elementare per
studenti di media qualit, inevitabilmente deve molto alle fonti bibliografiche:
i contributi originali in questo libro spesso si limitano alla rielaborazione di
argomenti gi presenti in letteratura, ed a volte solo alla realizzazione di note
esplicative e dei moltissimi riferimenti incrociati. Colgo questa opportunit
per elencare con gratitudine quelle fra le fonti bibliografiche che mi sono state
pi utili o mi hanno ispirato di pi: [10], [14], [18], [22], [23]; per le parti
preliminari pi elementari, desidero citare anche [1], [5].
Da questo resoconto dovrebbe essere ormai chiaro che questopera non
vuole essere una esposizione compiuta e finita, bens un lavoro in corso, in
evoluzione, da ampliare, approfondire e correggere dopo ogni lezione, o comunque frequentemente (questa infatti unaltra ragione, oltre alla navigabilit dellipertesto, per mantenerla nella versione online). Ad esempio, nuovi
capitoli o sezioni sono in preparazione. Alla data odierna, i prossimi do-

xix
vrebbero riguardare una trattazione pi esauriente (ma forzatamente molto
incompleta) dei filtri digitali, ad esempio la loro realizzazione come reticoli
o grafi, i filtri di fase minima e linvertibilit e la fattorizzazione spettrale,
ed una trattazione della compressione di immagini tramite wavelets. Ai preliminari di Calcolo verranno aggiunti gli integrali di superficie ed il teorema
della divergenza e del rotore.
Manca un indice analitico, per ora. Sarebbe molto utile in un libro di questa
mole, anche se il formato di ipertesto permette di sostituirlo con gli strumenti di ricerca del computer. Poich i tag di riferimento allindice analitico
non son stati inseriti nel corso della stesura in TeX, farlo a posteriori un
compito molto laborioso e tedioso... ma, col tempo, spero che verr fatto.
Pertanto, anche questa prefazione un lavoro in corso. Il quadro sinottico
delle propedeuticit fra i capitoli, alla data odierna nella prossima pagina.
Frecce tratteggiate indicano propedeuticit facilmente evitabili con una lieve
riscrittura del testo: elenchiamone i casi pi tipici. Una prima, banale freccia tratteggiata legata al fatto che, per studiare lanalisi funzionale su spazi
di Banach, occorre ricordarsi cosa sia la completezza, e quindi le successioni
di Cauchy. Una freccia tratteggiata pi significativa dovuta al fatto che gli
operatori lineari invarianti nel tempo siano convolutori e che la loro limitatezza su L equivalga alla appartenenza a L1 del nucleo di convoluzione,
spiegato nel Capitolo 17 ed utilizzato anche nel capitolo 20; unaltra ha a che
fare con la formula per i coefficienti dello sviluppo di Laurent, ricavata nel
Capitolo 2 ed utilizzata anche nel Capitolo 19; questi fatti sono richiamati
(ed in un caso brevemente ridimostrati) laddove vengono utilizzati. A volte
invece si tratta di argomenti propedeutici delicati, come il teorema di uniforme limitatezza e nel teorema di Banach-Alaoglu sulla compattezza debole del
Capitolo 3, utilizzati pesantemente per la divergenza di serie di Fourier nel
Capitolo 7, ma anche, per breve cenno, nel Capitolo 11 per chiarire la nozione di convergenza nello spazio delle distribuzioni temperate: in effetti qui
vengono rienunciati succintamente, senza dimostrazione, il che sufficiente
per il tipico studente che legge questo libro. Ancora minore lutilizzazione
del teorema di categoria di Baire, limitata ad un cenno sugli insiemi di divergenza delle serie di Fourier. Pertanto, non indispensabile per il lettore
seguire il flusso delle frecce tratteggiate.
A questo proposito, osserviamo anche che vari risultati pi profondi, ed un
intero capitolo (il Capitolo 7), sono esposti per completezza culturale ma
non vengono ripresi nel seguito. Quando questo accade, i singoli enunciati o una intera sottosezione o sezione, o in un caso lintero capitolo sono

xx

PREFAZIONE

contrassegnati con una stelletta.


Anche la terminologia ha a volte un carattere provvisorio, legato a convenienze didattiche momentanee. Un esempio emblematico la scelta del periodo delle funzioni periodiche da sviluppare in serie di Fourier: nei Capitoli 5
(sviluppi in serie di Fourier) e 7 (approfondimenti sulla convergenza di serie
di Fourier), e nella Sezione 6.2 (nuclei di Fjr e di Poisson), viene scelto,
per motivi storici,R il periodo 2, e quindi i coefficienti di Fourier prendono la

1
forma fb(n) = 2
f (t) eint dt. Invece negli altri Capitoli, dove il paragone

fra il caso di funzioni periodiche e quello di funzioni in L1 (R) a volte pi


stringente e si vogliono avere identiche costanti di normalizzazione, scegliamo
R1
il periodo 1 ed i coefficienti di Fourier diventano fb(n) = 2 1 f (t) e2int dt.
2

auspicabile che anche questa anomalia venga prima o poi corretta, con il
mantenere periodo 2 (ed esponenziali eint ) in tutta la trattazione.
Ringrazio vari colleghi che hanno contribuito allo sviluppo di questopera: Andrea Pagano per la stesura in TEXdei capitoli del nucleo originario
(circa un terzo della mole attuale: un compito gi molto laborioso), Federica
Andreano per la prima revisione di quei capitoli, ed Enrico Valdinoci e Francesco Fidaleo per la segnalazione di vari errori e suggerimenti e consigli per
alcune estensioni.

Massimo Picardello

Roma, luglio 2010

xxi
Parte I

Parte II

Parte III

Parte IV

Parte V

Parte VI

Cap. 1

Cap. 4

Cap. 10

Cap. 14

Cap.18

Cap. 21

Cap. 2

Cap. 5

Cap. 11

Cap. 15

Cap. 19

Cap. 22

Cap. 6

Cap. 12

Cap. 16

Cap. 20

Cap. 23

Cap. 7

Cap. 13

Cap. 17

Cap. 3

Cap. 8

Cap. 9

Legenda:
Parte 1: Preliminari
Cap. 1: Preliminari di Calcolo ed Analisi Reale
Cap. 2: Elementi di Analisi Complessa

Cap. 24

xxii

PREFAZIONE
Cap. 3: Brevi cenni di Analisi Funzionale

Parte 2: Serie e trasformate di Fourier


Cap. 4: Spazi di Hilbert
Cap. 5: Serie di Fourier
Cap. 6: Approssimazione trigonometrica e polinomiale
Cap. 7: Complementi sulle serie di Fourier
Cap. 8: Trasformata di Fourier
Cap. 9: Classe di Schwartz
Parte 3: Campionamento e ricostruzione di segnali
Cap. 10: Campionamento
Cap. 11: Distribuzioni
Cap. 12: Approssimanti in S del treno di impulsi
Cap. 14: Ricostruzione ed aliasing
Parte 4: DFT, DCT, FFT, deconvoluzione
Cap. 15: DFT
Cap. 16: FFT
Cap. 17: Lerrore di approssimazione di F con la DFT
Cap. 18: Deconvoluzione e DFT a finestre
Parte 5: Trasformate di Laplace e zeta; filtri
Cap. 19: Trasformata di Laplace
Cap. 20: Trasformata zeta
Cap. 21: Trasformata zeta e sistemi a tempo discreto
Parte 6: Wavelets e compressione dei segnali
Cap. 22: Il sistema di Haar
Cap. 23: Lanalisi in multirisoluzione
Cap. 24: La trasformata discreta di ondicelle
Cap. 25: Ondicelle a supporto compatto

Parte I
Panoramica su Calcolo, Analisi
Reale, Analisi Complessa, Spazi
Vettoriali Topologici ed Analisi
Funzionale

Capitolo 1
Appofondimenti di calcolo
differenziale ed integrale e di
analisi reale
In questo capitolo riassumiamo, sinteticamente e talvolta senza dimostrazioni, vari argomenti di Calcolo e di Analisi Reale preliminari allo studio
dellanalisi matematica, ed in particolare dellanalisi di Fourier.
Per quanto riguarda lAnalisi Reale, la maggior parte dellesposizione tratta
da [22]: rinviamo a questo eccellente riferimento bibliograco per maggiori
dettagli ed approfondimenti. Lesposizione delle disuguaglianze di Hlder e
di Minkowski e della dualit per spazi Lp segue invece un approccio pi rapido ed elegante (si veda, ad esempio, [21]). Le sezioni 1.15, 1.20, 1.24, 1.26,
1.27, 1.28 ed i risultati principali di 1.19 sono interamente tratti da [22]. La
Sezione 1.23 tratta da [18].

1.1

Fatti elementari ben noti

Non possibile comprendere i concetti basilari dellanalisi di Fourier senza


una completa assimilazione del Calcolo e dellAlgebra Lineare. Questo libro
sviluppato per essere consultabile online: per facilitarne la navigazione ipermediale, ci sforziamo di citare ogni risultato utilizzato, anche se questo rende
pignola lesposizione per chi lo legge in versione scritta invece che interattiva.
sorprendente scoprire quanti pochi siano i risultati preliminari elementari
di Calcolo necessari (quelli meno elementari verranno presentati in dettaglio
3

CAPITOLO 1. PANORAMICA SU CALCOLO ED ANALISI REALE

in seguito, anche se dovrebbero essere gi noti). ancora pi sorprendente


osservare che la grande maggioranza di questi risultati sono utilizzati solo per
la comprensione di questo capitolo preliminare e non della analisi di Fourier
che sviluppiamo nel resto del libro. Per comodit del lettore, e per evitare collegamenti ipermediali a documenti esterni, enunciamo i prerequisiti di
base in questa Sezione introduttiva: le dimostrazioni si possono trovare il
qualunque libro di testo di calcolo, ad esempio [5] (o [19] per la numerabilit
dei razionali, il teorema di Weierstrass sullesistenza di massimi e minimi di
funzioni continue sui compatti e lesistenza dei limiti du funzioni monotne
limitate).
Rammentiamo per prima cosa la denizione di punto di accumulazione
di un insieme E in Rn (o pi in generale in uno spazio topologico):
Definizione 1.1.1. Un punto x un punto di accumulazione di E se per
ogni aperto O che contiene x esistono punti di E diversi da x ed appartenenti
a O. Se E un sottoinsieme di un insieme A, un punto x A un punto
limite di E se per ogni intorno O di x esistono punti di E appartenenti ad
O: in particolare, ogni punto di E un punto limite.
Inoltre, rammentiamo la denizione di innitesimo:
Notazione 1.1.2. Date due funzioni f , g a valori reali o complessi denite
su un insieme E ed un punto x0 di accumulazione di E (ad esempio un
(x)
= 0,
suo punto interno), diciamo che f = o(g) per x x0 se limxx0 fg(x)
e che f = O(g) per x x0 se esiste una costante C > 0 tale che, se x
appartiene ad un intorno appropriato di x0 (escluso il punto x0 stesso) si ha
|f (x)| < C|g(x)|.
Inne, richiamiamo la denizione di funzione caratteristica:
Definizione 1.1.3. Per ogni insieme I R, la funzione caratteristica I
la funzione che vale 1 in I e 0 al di fuori.
Nelle dimostrazioni, useremo talvolta il (si veda [19, Capitolo 1, Appendice]).
Ecco la lista degli enunciati elementari di cui faremo uso nel seguito:
Numerabilit dei razionali: Q un insieme numerabile.
Continuit e controimmagini di aperti: una funzione f : X Y fra
due spazi topologici X e Y continua se e solo se la controimmagine

1.1. FATTI ELEMENTARI BEN NOTI

f 1 (O) di ogni aperto O Y un aperto in X (Il lettore non abituato


alla nozione di spazio topologico e di insieme aperto riscriva questa
propriet nel caso in cui X = Rn , Y = Rm e O sia la sfera di centro
a Rm e raggio > 0: allora dire dire che la controimmagine di
ogni tale O aperta equivale a dire che, per ogni punto x tale che
f (x) appartenga a O, essa contiene la sfera di centro x e raggio per
qualche > 0. Si verichi per esercizio che questo fatto equivalente
alla propriet limxa f (x) = f (a).)
Denizione e caratterizzazione degli insiemi compatti: K si dice compatto se da ogni ricoprimento di K con insiemi aperti si pu estrarre un
sottoricoprimento nito. I compatti K in Rn , e pi in generale in uno
spazio metrico, sono caratterizzati dalla propriet che ogni successione in K ammette una sottosuccessione convergente ad un punto di K
(in uno spazio non metrico questa propriet segue dalla compattezza
ma non equivalente). Da questo fatto segue anche che i sottoinsiemi
chiusi di un compatto sono anchessi compatti.
Inoltre i compatti hanno anche altre propriet interessanti che vedremo
in seguito: ad esempio la propriet dellintersezione nita (Nota 1.9.7)
e la propriet di BolzanoWeierstrass (Teorema 1.9.6): queste propriet sono conseguenze della compattezza, e sono ad essa equivalenti in
uno spazio metrico. Per questi approfondimenti si veda la Sezione ??.
Denizione di esponenziale complesso: eit = cos t + i sin t. O equivalentemente, cos t = 12 (eit + eit ) e sin t = 2i1 (eit eit )
Lesponenziale diverge pi rapidamente dei polinomi: per ogni , > 0
si ha limx+ ex /x = . Equivalentemente, limx+ (log x) /x =
0
Esistenza del limite per funzioni monotne: se f : [a, b] R monotna non decrescente, allora esiste limxb f (x) se e solo se f limitata
superiormente, ed in tal caso limxb f (x) = supa6x6b f (x). Analogo
enunciato vale se f non crescente, nel qual caso il limite esiste se f
limitata inferiormente e coincide con lestremo inferiore dei valori di f ,
e se lintervallo di denizione illimitato (ad esempio tutto R); in questultimo caso abbiamo un teorema identico per successioni monotne
(cio per funzioni monotne denite su N anzich R.

CAPITOLO 1. PANORAMICA SU CALCOLO ED ANALISI REALE


Criterio di Cauchy per la convergenza di successioni: una successioni
di numeri reali o complessi di Cauchy (Denizione 1.2.1) se e solo se
convergente.
Teorema del confronto: se f 6 g 6 h sono tre funzioni a valori reali denite in un sottoinsieme E di uno spazio topologico (o pi restrittivamente di Rn ) e x0 un punto di accumulazione di E (o pi restrittivamente,
un punto interno di E), allora se limxx0 f (x) = limxx0 h(x), anche
g ha limite per x x0 e limxx0 g(x) = limxx0 f (x) = limxx0 h(x).
Un enunciato analogo vale per successioni.
Teorema del confronto per serie: combinando i duNotazionee enunciati
precedenti si ottiene il seguente: se una serie a termini non negativi
ed i suoi termini sono maggiorati da quelli di una serie convergente,
allora la serie data convergente.
Teorema del confronto di una serie con un integrale: se f una
Pfunzione
positiva nonRcrescente denita nella semiretta x > 1, la serie
k=1 f (k)

e lintegrale 1 f (x) dx convergono


entrambi
entramR oppure divergono
P
P
bi. Nel primo caso si ha
f
(k)
6
f
(x)
dx
6
f
(k).
k=2
k=1
Rn
P 1
Pi precisamente, ponendo sm,n = nk=m f (k) e tm,n = m f (x) dx, otteniamo per ogni m, n le disuguaglianze sm+1,n 6 tm,n 6 sm,n : quindi
o la serie e lintegrale divergono entrambi oppure
R entrambi
P convergono
con la stessa velocit, nel senso che le code k=m f (k) e m f (x) dx
sono innitesime dello stesso ordine rispetto a m.
Teorema di Weierstrass: una funzione a valori reali continua su un compatto (ad esempio su un intervallo limitato e chiuso in R, o su un
plurirettangolo limitato e chiuso in Rn ) ammette massimo e minimo.
Teorema della permanenza del segno: se f una funzione continua a
valori reali e f (x) > 0 in un punto x interno al dominio di denizione
di f , allora esiste un intorno aperto O di x tale che f > 0 in O. Pi
in generale, se f continua a valori complessi e f (x) 6= 0, allora f
diversa da zero in un intorno di x.
Confronto asintotico fra polinomi ed esponenziali: limx xn eax = 0
per ogni n N, a > 0
Continuit di funzione composta: se f : A B e g : B C sono
continue, allora la loro composizione g f : A C continua.

1.1. FATTI ELEMENTARI BEN NOTI

Regola di derivazione di funzione composta: se A, B, C R e f : A


B e g : B C sono derivabili, allora la loro composizione gf : A C
derivabile, e (g f ) (x) = g (f (x)) f (x).
Se una funzione derivabile pari la sua derivata dispari, e viceversa.
Teorema dei valori intermedi per le funzioni continue: se f : [a, b] R
continua, allora essa assume in [a, b] tutti i valori intermedi fra f (a)
e f (b).
Teorema dei valori intermedi per le funzioni continue sui connessi in
Rn : la propriet precedente vale per le funzioni continue su un insieme connesso in Rn . In tal caso f assume tutti i valori intermedi fra il
proprio valore minimo e massimo, o comunque fra due qualsiasi valori
assunti. (per dimostrarlo, nel caso non fosse gi noto, basta rammentare che un insieme connesso in Rn connesso per archi, nel senso della
successiva Proposizione 1.29.46, e considerare una curva continua fra il
punto in cui viene assunto il primo valore e quello in cui viene assunto
il secondo. La restrizione della funzione f allimmagine di questa curva
una funzione continua su un intervallo di R, e si applica il risultato
precedente.)
Teorema del valor medio di Lagrange: se f : [a, b] R continua su
[a, b] e derivabile in (a, b), allora esiste x (a, b) tale che f (b) f (a) =
f (x) (b a).
Regola della derivata nulla: se due funzioni f e g derivabili su un
insieme connesso vericano f g , allora f g costante.
Teorema della media integrale: se f : [a, b] R continua su [a, b],
Rb
allora integrabile su [a, b] ed esiste x [a, b] tale che a f (t) dt =
(b a) f (x).
Integrabilit di funzioni monotne: se f : [a, b] R monotna e
limitata, allora f e |f | sono integrabili su [a, b] con integrale nito.
Teorema Fondamentale del Calcolo: si veda lenunciato pi sotto, Teorema 1.27.1.
Teorema di integrazione per sostituzione: se f : [a, b] [c, d] ha derivaRd
R f (b)
ta continua e g continua su [c, d], allora c g(x) dx = f (a) g(f (t)) f (t) dt.

CAPITOLO 1. PANORAMICA SU CALCOLO ED ANALISI REALE


(Grazie al Teorema fomdamentale del calcolo enunciato pi sopra, questo teorema equivalente alla precedente regola di derivazione di funzione composta.)
Regola di derivazione del prodotto: se f e g sono derivabili, allora
(f g) = f g + f g . Iterando si ottiene che, se le due funzioni sono
derivabili n volte,
n

D (f g) =

n  
X
n
k=0


dove nk il simbolo combinatorio
prodotto 1 2 n.

n
k

D k f D nk g ,
=

n!
k!(nk)!

, ed il fattoriale n! il

Con lo stesso argomento si prova il Teorema del Binomio di Newton:


per ogni a, b R, n N,
n

(a + b) =

n  
X
n
k=0

ak bnk .

Teorema di integrazione
per parti: se f e g hanno derivata
Rb
R b continua su

[a, b], allora a f (x) g (x) dx = f (b) g(b) f (a) g(a) a f (x) g(x) dx.
(Grazie al Teorema Fondamentale del Calcolo enunciato pi sopra,
questo teorema equivalente alla precedente regola di derivazione del
prodotto.)
P
n
Formula di somma geometrica: se q C, q 6= 1, allora N
n=0 q =
N+1
1q
.
1q
Condizione necessaria per la convergenza di una serie numerica (ma
non suciente, visto il prossimo enunciato) che il suo termine generale
tenda a 0.
P
La serie
n convergente se e solo se > 1.
Si noti che nessuna stima sul tasso di decrescenza dei termini implica
la divergenza di una serie a meno che
P i termini siano monotni decrescenti. Infatti, sia {an } tale che
|an | < , e consideriamo una
nuova successione di indici {nk }. Poniamo bn = 0 a meno che n = nk ,
e bnk = ak . I valori non nulli dei bn sono gli stessi degli an , ma pi

1.1. FATTI ELEMENTARI BEN NOTI

P
P
distanziati: quindi
|bn | =
|an | < , ma la successione bn tende
a zero in maniera arbitrariamente lenta se gli nk crescono in maniera
arbitrariamente veloce. Invece, se la successione dei termini non crescente, le cose vanno diversamente. Poich questo fatto non appare di
solito nei manuali di Calcolo, lo dimostriamo qui:
Lemma 1.1.4.PSia {an > 0} una successione non crescente con limn an =
0. Se la serie n an converge, allora an = o(1/n), ossia limn nan = 0.
Dimostrazione. Per assurdo, supponiamo che limn an 6= 0. Per denizione di limite, allora deve esistere 0 > 0 tale che per ogni k N
esiste nk > k con kank > 0 (osserviamo in particolare che si possono
scegliere gli nk in maniera che crescano in modo arbitrariamente veloce). In altre parole, esiste 0 > 0 ed una sottosuccessione {ank } tale
che ank > 0 /k, e gli indici della sottosuccessione si possono scegliere
a crescita arbitrariamente veloce. Daltra parte, grazie alla monotonia,
per tutti gli indici m con nk1 < m 6 nk si ha am > ank = 0 /k.
Quindi
nk
X
nk nk1
0 .
Sk :=
am >
n
k
n
+1
k1

Ora, se gli nk cresconoP


in modo abbastanza
veloce, limk (nk nk1 )/nk =
P
S
=
. Questa contraddizione
a
=
1, e quindi Sk 0 e
k=0 k
n=0 n
prova lenunciato.

Una propriet analoga a quella precedente per le serie Rvale per gli inte 1
1
grali impropri: lintegrale improprio
R di1 x divergente: 1 x dx = + .
ragione, per < 1, 1 x dx = +; invece, per > 1,
RAmaggior
1
dx
<
.
1 x

Riordinamento di serie: una serie converge alla stessa somma qualunque


sia lordine con cui si sommano i suoi termini se e solo se assolutamente
convergente (ossia la serie dei moduli dei suoi termini convergente).

Stime di Leibnitz per il resto di una serie a segni alterni: se la successione ak > 0 non crescente da un certo indice in poi, ossia se
esiste k0 tale che ak+1 6 ak per ogni k > k0 ,P
ed innitesima, ossia
k
limk ak = 0, allora la serie a segni alterni
k=0 (1) ak (semplicemente) convergente, ed il suo resto n-simo maggiorato dal primo

10 CAPITOLO 1. PANORAMICA SU CALCOLO ED ANALISI REALE


termine omesso:


n


X
X


(1)k ak 6 an+1 .
(1)k ak


k=0

k=0

Teorema di Taylor: se f : (a, b) R derivabile n volte in un


punto x0 (a, b), allora esiste un unico polinomio Pn di grado n
che approssima f a meno di innitesimi rispetto a (x x0 )n , ossia
f (x) = Pn (x) + o ((x x0 )n ) per x x0 , e questo polinomio, detto
polinomio di Taylor di grado n, dato da
Pn (x) =

n
X
f (k) (x0 )
k=0

k!

(x x0 )k .

Inoltre, se n > 0 e f derivabile n + 1 volte in x0 , si ha f (x) Pn (x) =


f (n+1) ()
(x x0 )n+1 per qualche [x0 , x]. Il polinomio di Taylor
(n+1)!
lunico polinomio di grado n le cui prime n derivate in x0 coincidono
con quelle di f .
Completiamo questa Sezione presentando due criteri di convergenza per
serie numeriche che estendono le stime di Leibnitz, i quali potrebbero non
essere noti ad alcuni lettori. Per questo ne presentiamo anche le dimostrazioni. Il primo dei due criteri non necessario per il resto del libro, ma lo
presentiamo insieme ad alcune sue applicazioni a causa della loro rilevanza
in connessione con le serie di Fourier.

Teorema 1.1.5. (Criterio di convergenza di Dirichlet.)


(i) Se ak C e bk R+ sono tali che bk tende
P a zero in maniera monotna
per k e le somme parziali P
An = nk=0 ak sono limitate da qualche
costante C > 0, allora la serie
k=0 ak bk convergente.

(ii) Se invece le serie sono serie di funzioni, dove le somme parziali della
successione di funzioni ak sono uniformemente limitate, e le funzioni bk sono uniformemente convergenti a 0 in maniera non crescente
(ossia bk (x) non crescente per ogni x), allora la serie di funzioni
P

k=0 ak (x)bk (x) converge uniformemente.

1.1. FATTI ELEMENTARI BEN NOTI

11

Dimostrazione. Dimostriamo la parte (i): la dimostrazione, pensata per


successioni di funzioni invece che di numeri, si applica parola per parola
anche per dimostrare (ii).
Vogliamo applicare il criterio di Cauchy: per questo dobbiamo provare che,
per ogni > 0, esiste N intero tale che, per ogni n > m > N, si abbia


n
X



ak bk < .
(1.1)



k=m

Nel primo membro di questa disuguaglianza sostituiamo ak = Ak Ak1 per


ottenere la seguente versione discreta del teorema di integrazione per parti
citato pi sopra:
n
X

ak bk =

k=m

Pertanto

n
X

k=m

Ak bk

n1
X

Ak bk =

k=m

k=m1



n

X


a
b

k k 6 C


k=m

n1
X

n1
X

k=m

Ak (bk bk+1 ) + An bn Am1 bm .

|bk bk1 | + bn + bm

(1.2)
!

(1.3)

Poich {bk } una successione decrescente, possiamo togliere il modulo in


|bk bk1 | = bk bk1 . Pertanto la sommatoria nel lato destro dellultimaPdisuguaglianza, a causa delle cancellazioni successiva, d come somn1
ma
Pn k=m (bk bk1 ) = bm bn . Quindi la disuguaglianza (1.3) diventa
| k=m ak bk | 6 2Cbm . Ora (1.1) segue dallipotesi che limn bm = 0.

Come applicazione, ecco un esempio che fornisce il primo risultato signicativo in questo libro sulla convergenza di serie trigonometriche. Si
confrontino i risultati con il contenuto della Sezione 5.15.
Esempio 1.1.6. Rimandiamo allAppendice in Sezione 12.5 per la dimostrazione della seguente disuguaglianza trigonometrica elementare: per ogni x 6=
2k, con k intero, si ha


N

X
1

inx
,
e
6

| sin x2 |

n N
=

Da questa disuguaglianza segue che la successione einx ha somme parziali


limitate, e quindi lo stesso vale per la parte reale cos(nx) e la parte immaginaria, sin(nx). Pertanto, per il criterio di Dirichlet per la convergenza di serie

12 CAPITOLO 1. PANORAMICA SU CALCOLO ED ANALISI REALE


che
numeriche (Teorema 1.1.5 (i)), per ogni successione bn di numeri
P realiinx
tende a zero in maniera
decrescente, le serie trigonometriche n=1 bn e
,
P
P

n=1 bn sin nx sono convergenti per x 6= 2k.


n=1 bn cos nx,
Inoltre, in ogni intervallo [a, 2 a] con a > 0 le suddette serie sono uniformemente convergenti, per il criterio di Dirichlet per la convergenza uniforme,
Teorema 1.1.5 (ii)).
P
P cos nx P sin nx
einx
Ad esempio, le serie
,

n=1 n
n=1 n ,
n=1 n convergono puntualmente per x 6= 2k per ogni > 0, ed uniformemente in [a, 2 a] per a > 0.
Se > 1 sappiamo
P 1 che queste serie convergono assolutamente, dal confronto
con la serie n=1 n , ed anche uniformemente per il test di Weierstrass (Teorema 1.3.29), ma per 0 < 6 1 la convergenza assai meno ovvia.

Il secondo criterio una variante del precedente. Verr applicato in


seguito solo ad un risultato sulla continuit radiale di serie di potenze al
bordo di convergenza (Teorema di Convergenza radiale di Abel 1.4.11, che
dimostreremo per completezza ma che non verr usato in questo libro.

Teorema 1.1.7. (Criterio di convergenza di Abel.)


P
(i) Se ak sono numeri complessi tali che la serie k ak convergente, e
{bn } una successione di numeri reali monotna limitata (quindi
P convergente, ma non necessariamente al limite 0), allora la serie
k=0 ak bk
convergente.
(ii) Se invece le serie sono serie di funzioni, con la propriet che le somme
parziali della successione di funzioni ak sono uniformemente convergenti, e le funzioni bk sono uniformemente limitate e per P
ogni x la successione ak (x) non crescente, allora la serie di funzioni
k=0 ak (x)bk (x)
converge uniformemente.

Dimostrazione. la dimostrazione pressoch la stessa del criterio di Dirichlet


(Teorema 1.1.5). Anche in questo caso basta dimostrare il criterio di convergenza per le serie numeriche: lo stesso argomento si applica riga per riga alla
convergenza uniforme. Vediamo le dierenze rispetto alla dimostrazione del
criterio di Dirichlet. Nel termine di destra dellidentit (1.2), ora gli addendi
An bn e Am1 bm sono successioni convergenti (perch ciascuna il prodotto
di due successioni convergenti). Anche la somma che costituisce il restante

1.2. SPAZI NORMATI E COMPLETEZZA

13

termine nel lato destro dellidentit converge ad un limite per n , esattamente per lo strsso aergomento usato nella dimostrazione del criterio di
Dirichlet.

1.2

Spazi normati, successioni di Cauchy e completezza

Rammentiamo la denizione di successione di Cauchy di numeri reali.


Definizione 1.2.1. (Successioni di Cauchy.)
Una successione {xn }nN di numeri reali si dice successione di Cauchy se
per ogni > 0 esiste N tale che se n, m > allora |xn xm | < .
Esercizio 1.2.2. Se una successione convergente allora di Cauchy.

Definizione 1.2.3. (Spazio metrico.) Una metrica su un insieme X


una funzione d su X X a valori reali con le seguenti propriet:
(i) per ogni x e y in X, d(x, y) > 0, e d(x, y) = 0 se e solo se x = y;
(i) per ogni x e y in X, d(x, y) = d(y, x) (propriet riflessiva);
(iii) per ogni x, y e z in X, d(x, y) 6 d(x, z) + d(z, y) (disuguaglianza
triangolare).
Uno spazio X munito di una metrica si chiama spazio metrico.
La disuguaglianza triangolare ha questo nome perch, nel caso della distanza
usuale nel piano, essa enuncia il fatto che un lato di un triangolo ha lunghezza
non superiore alla somma degli altri due (il lettore visualizzi per esercizio il
legame fra i due concetti ).
Definizione 1.2.4. (Completezza.) Uno spazio metrico X si dice completo
se ogni successione di Cauchy converge ad un elemento di X (rispetto alla
metrica di X).
Nota 1.2.5. Linsieme dei numeri reali uno spazio metrico completo. Questo
fatto equivalente alla propriet archimedea dei numeri reali [19, Cap. 1
(Appendice)].

14 CAPITOLO 1. PANORAMICA SU CALCOLO ED ANALISI REALE


Nota 1.2.6. Le precedenti denizioni mostrano che in uno spazio metrico
completo (ad esempio R) non vi alcuna dierenza tra successione convergente e successione di Cauchy, ossia una successione convergente se e solo
se di Cauchy.
Osserviamo che la propriet di Cauchy presenta un vantaggio rispetto alla
denizione di limite: permette di dimostrare lesistenza del limite senza che
sia necessario conoscere quale sia il limite a cui converge la successione.

Siano u, v Rn . Ricordiamo che la distanza euclidea di u e v denita


da
v
u n
uX
dist(u, v) = t (ui vi )2 .
(1.4)
i=1

La distanza euclidea di u dallorigine la norma euclidea di u , denita da


v
u n
uX
kuk kuk2 = t
u2i
(1.5)
i=1

In Rn denito anche un prodotto scalare h, i associato alla norma nel senso


che kuk2 = hu, ui per ogni u R. La denizione la seguente: se u, v Rn ,
hu, vi =

n
X

ui vi .

i=1

Definizione 1.2.7. Se u, v Cn , il prodotto scalare denito da


hu, vi =

n
X

ui v i

(1.6)

i=1

Vogliamo introdurre spazi vettoriali di dimensione innita e denire norme e prodotti scalari su tali spazi.
In generale si ha
Definizione 1.2.8. (Norma.) Sia X uno spazio vettoriale su C (di dimensione nita o innita). Unapplicazione
kk : X R+ {0}
x 7 kxk

1.2. SPAZI NORMATI E COMPLETEZZA

15

si dice una norma se valgono le tre propriet seguenti:


(i) kxk = 0 x = 0
(ii) kxk = || kxk

x X, C

(iii) kx + yk 6 kxk + kyk

per ogni x, y X

Lultima propriet si chiama la disuguaglianza triangolare.


Esercizio 1.2.9. Vericare che kk2 denita in (1.5) una norma in Rn .

Estendiamo il concetto di successione di Cauchy a uno spazio normato


qualsiasi.
Definizione 1.2.10. (Distanza in uno spazio normato.) Ricordiamo
che, se X uno spazio normato, la distanza tra u, v in X data da
dist(u, v) = ku vk .
Si dice che questa distanza associata alla norma.
Definizione 1.2.11. (Norme e distanze equivalenti.) Due norme !k k
e k| k| su uno spazio vettoriale V si dicono equivalenti se esiste una costante
C > 0 tale che per ogni vettore v V si abbia
kvk 6 Ck|vk|
(senza perdita di generalit, aumentando il valore di C, la disuguaglianza si
pu esprimere come disuguaglianza stretta, ed infatti di solito cos avviene
nei libri di testo).
Analogamente, due distanze d1 e d2 si dicono equivalenti se esistono A,
B > 0 tali che, per ogni u, v V , si abbia
Ad1 (u, v) < d2 (u, v) < Bd1 (u, v) .
In base a questa denizione, date due norme (o due distanze) equivalenti
ciascuna palla rispetto ad una delle due contenuta in una palla dellaltra e
viceversa.
Ricordiamo la denizione di relazione di equivalenza:

16 CAPITOLO 1. PANORAMICA SU CALCOLO ED ANALISI REALE


Definizione 1.2.12. (Relazione di equivalenza.) Sia I un insieme e sia
una relazione tra gli elementi di I.
una relazione di equivalenza se:
1. a a a I
2. a b se e solo se b a a, b I
3. se a b e b c allora a c a, b, c I
Esercizio 1.2.13. Vericare che lequivalenza di norme una relazione di
equivalenza.

Per la dimostrazione del seguente celebre enunciato rinviamo, ad esempio, a


[19, Appendice, Sezione 2].
Proposizione 1.2.14. (Tutte le norme sono equivalenti in dimensione finita.) In spazi vettoriali di dimensione finita, tutte le norme sono
equivalenti.
Come vedremo in seguito, qusto enunciato non vero su spazi a dimensione
innita. Questo fatto la principale fonte di variet e sottigliezza della
geometria degli spazi normati, della loro struttura di convergenza e del resto
di questo libro.
Norme equivalenti inducono la stessa nozione dei convergenza in V , ai
sensi della prossima denizione.
Definizione 1.2.15. (Successioni convergenti e successioni di Cauchy
in uno spazio normato.) Una successione {un }nN in uno spazio normato
X si dice convergente ad un limite u X se per ogni > 0, esiste N tale
che, se n > , allora kun uk < . La successione si dice di Cauchy se per
ogni > 0, esiste N tale che, se n > , m > , allora kun um k < .
Nota 1.2.16. Uno spazio normato, essendo in particolare uno spazio metrico,
si dice completo se le successioni di Cauchy sono convergenti.

Come naturale studiare la convergenza di successioni, cos lo quella di


serie.

1.2. SPAZI NORMATI E COMPLETEZZA

17

Definizione 1.2.17. (Serie convergenti ed assolutamente sommabili


in uno spazio normato.) Una serie di vettori vi in uno spazio normato X
convergente ad un vettore
s se
converge a s la successione delle sue
somma
PN


somme parziali: limN s i=1 vi = 0. La serie si dice assolutamente
P
sommabile se
i=1 kvi k < .
Nota 1.2.18. Su R, le serie assolutamente sommabili sono anche
P convergenti
n
(ma non vero il viceversa: si pensi alla serie a segni alterni
i=1 (1) /n).
Per, se lo spazio non completo, non tutte le serie assolutamente convergenti sono convergenti. Consideriamo ad esempio il sottospazio Q dei
razionali. Esso un sottospazio di R e quindi uno spazio normato, ma non
completo. Perci esistono successioni in Q che convergono ad un limite
in R ma non in Q (ad esempio, la successione degli approssimanti decimali
di un qualsiasi numero irrazionale). Consideriamo una tale successione di
numeri razionali {vi , i = 0, 1, 2, . . . } assolutamente sommabile ad un numero irrazionale v, e formiamo la successione delle sue dierenze consecutive
!!w0 = v0 e {wi = vi vi1 , i = 1, 2, . . . }. La somma parziale di ordine N
della successione {wi } vale
!!
N
X
i=0

wi = (vN vN 1 ) + (vN 1 vN 2 ) + + (v1 v0 ) + v0


= vN

P
che converge al numero irrazionale v per N . Pertanto la serie
wi
assolutamente sommabile in Q ma non convergente in Q (lo invece nello
spazio completo R).

Nota 1.2.19. I termini di una serie convergente


in norma tendono
P
a 0 in norma.) Se una serie di vettori n=0 vn converge in norma, allora
limn kvn k = 0.

Dimostrazione. La propriet di Cauchy, applicata alla serie convergente dellenunciato, asseriscePche per ogni > 0 esiste un intero N = N tale che, se
N 6 k 6 m, si ha k m
n=k vn k < . Prendendo m = k > N concludiamo che,
per ogni , esiste N tale che kvk k < se k > N: per denizione di limite,
questo equivale a dire che kvk k 0.

In seguito utilizzeremo il seguente criterio di completezza per spazi normati.

18 CAPITOLO 1. PANORAMICA SU CALCOLO ED ANALISI REALE


Lemma 1.2.20. Uno spazio normato X completo se e solo se ogni serie
assolutamente sommabile convergente in X.
Dimostrazione. Supponiamo
P che X sia completo e consideriamo una serie
assolutamente
sommabile
vi . Allora per ogni > 0 esiste un interoPN > 0
P
tale che i>N kvi k < . Indichiamo con sn le somme parziali sn = ni=1 vi .
Allora, se n, m > N, si ha

n
n

X
X
X


kvi k 6
kvi k < .
vi 6
ksn sm k =


i=m+1

i=m+1

i=m+1

Pertanto la successione {sn } di Cauchy (Denizione 1.2.15), e dal momento


che X completo essa converge in X.
Viceversa, supponiamo che le serie assolutamente sommabili in X siano
convergenti e consideriamo una successione {vn } di Cauchy. Vogliamo provare che questa successione converge in X. Grazie alla propriet di Cauchy
esiste una successione crescente di numeri interi nk tali che kvn vm k 6 2k
se n, m > nk . Consideriamo la sottosuccessione vnk e formiamo la successione delle sue dierenze consecutive w1 = v1 e wi = vni vni1 . Come nella
PN
Nota 1.2.18, la somma parziale N-sima
i1 wi vale vN . Ma abbiamo visto
P
che kvN k 6 2N . Quindi la serie
wi assolutamente sommabile, e perci
converge ad un vettore v X.
A questo punto basta mostrare che limn vn = v. Usiamo il fatto che {vn }
di Cauchy: per ogni esiste N tale che kvn vm k < /2 se n, m > N.
Daltra parte, poich vnk v, esiste K tale che kvnk vk < /2 se k > K.
Ora, se scegliamo k > K cos grande che nk > N, abbiamo
kvn vk 6 kvn vnk k + kvnk vk 6
e quindi vn v.


+ =,
2 2

Definizione 1.2.21. (Prodotto scalare.) Sia X uno spazio vettoriale su


C. Unapplicazione
h, i : X X C
(x, y) 7 hx, yi
si dice prodotto scalare se

1.3. CONVERGENZA UNIFORME

19

1. hy, xi = hx, yi x, y X
2. hx + y, zi = hx, zi + hy, zi
3. hx, yi = hx, yi

x, y, z X

x, y X,

4. hx, xi > 0 x X e hx, xi = 0 x = 0


Esercizio 1.2.22. Vericare che h, i denita in (1.6) un prodotto scalare in
Cn .

Nota 1.2.23. Ogni prodotto scalare d luogo ad una norma

kk : X [0, +)

x 7 kxk = hx, xi1/2

1.3
1.3.1

Convergenza uniforme
Convergenza di successioni di funzioni

Cominciamo con la denizione di convergenza puntuale per una successione


di funzioni.
Definizione 1.3.1. (Convergenza puntuale.) Sia x una variabile in un
insieme A R (o C) e {fn (x)}nN , una successione di funzioni. La successione {fn (x)}nN converge puntualmente alla funzione f (x), se per ogni > 0
esiste (, x) N tale che
n > (, x)

|fn (x) f (x)| < ,

cio se, per ogni x in A, si ha


lim fn (x) = f (x)

con velocit di convergenza che pu dipendere dalla scelta di x.

20 CAPITOLO 1. PANORAMICA SU CALCOLO ED ANALISI REALE


Esempio 1.3.2. Poniamo fn (x) = enx con x [0, 1]. Allora

1 se x = 0
nx
lim e
=
0 se 0 < x 6 1
n
Osserviamo che, pur essendo le fn (x) funzioni continue per ogni n N, il
loro limite puntuale una funzione discontinua in x0 = 0.

Esempio 1.3.3. Poniamo fn (x) =

1
n

arctan(nx). Allora

1
arctan(nx) = 0.
n n
lim

In questo caso sia le fn (x) che la funzione limite (che la funzione identicamente uguale a zero) sono continue.
Ci chiediamo quale sia il comportamento della successione delle derivate,
1
1
ossia della successione fn (x) = n1 1+(nx)
2 n = 1+(nx)2
1
=
lim
n 1 + (nx)2

1 se x = 0
0 se x 6= 0

Quindi la successione delle derivate non converge alla derivata della funzione
limite di fn (x).


1 se x [n, n + 1]
Esempio 1.3.4. Poniamo fn (x) = [n,n+1] (x) =
0 se x
/ [n, n + 1]
Allora
lim [n,n+1] (x) = 0.
n

Quindi la funzione limite la funzione identicamente uguale a zero.


Osserviamo che
Z
Z n+1
[n,n+1] (x) dx =
dx = 1 n N,

mentre lintegrale della funzione limite ovviamente zero.


Quindi non possibile passare al limite sotto il segno di integrale, ossia
Z
Z
lim
[n,n+1] (x) dx = 1 6= 0 =
lim [n,n+1] (x) dx
n

1.3. CONVERGENZA UNIFORME

21

Abbiamo visto (Esempio 1.3.2) che la continuit delle funzione fn (x) non
implica la continuit della funzione limite.
Ci chiediamo allora sotto quali condizioni si pu ottenere la continuit della
funzione limite nel caso in cui le funzioni fn (x) siano tutte continue.
In altre parole, sia {fn (x)}nN una successione di funzioni continue in x0 A,
cio le funzioni fn (x) verichino
lim fn (x) = fn (x0 ) n N.

xx0

Ci stiamo domandando sotto quali condizioni si avr limxx0 f (x) = f (x0 ).


In altri termini, ci chiediamo quando possibile scambiare i limiti
lim lim fn (x) = lim lim fn (x) .

xx0 n

n xx0

Una condizione suciente a permettere di scambiare i due limiti la


convergenza uniforme della successione {fn (x)}nN .
Definizione 1.3.5. (Convergenza uniforme.) Una successione di funzioni {fn (x)}nN converge uniformemente a f (x) in A se per ogni > 0 esiste
() (che dipende da , ma non dal punto x) tale che per n > () e per ogni
x A si ha |fn (x) f (x)| < .
Chiaramente si ha:
Corollario 1.3.6. Il limite uniforme di una successione di funzioni, se esiste,
anche il suo limite puntuale (ma non viceversa: il limite puntuale pu
esistere ma non essere anche limite uniforme).
Nota 1.3.7. Se le funzioni fn (x) sono a valori reali per ogni n N, la
disuguaglianza |fn (x) f (x)| < equivalente alle due disuguaglianze
f (x) < fn (x) < f (x) +

(1.7)

Le disuguaglianze (1.7) sono vere per ogni n > (), indipendentemente


dal punto x A. Quindi se n > (), allora il graco di fn (x) contenuto
in un intorno tubolare di ampiezza 2 centrato nel graco di f (x).

22 CAPITOLO 1. PANORAMICA SU CALCOLO ED ANALISI REALE


f(x)+
fn(x)
f(x)
f(x)-

Figura 1.1: Approssimanti di f nella norma uniforme

Nota 1.3.8. Sia I R e sia B(I) lo spazio delle funzioni limitate denite su
I con la norma
kf k = sup |f (x)|.
xI

Allora una successione fn converge a f nello spazio normato B(I) se e solo


se fn converge a f uniformemente. In altre parole la convergenza uniforme
in I coincide con la convergenza rispetto alla norma kk

Esempio 1.3.9. La successione fn (x) = enx con x [0, 1] non converge


uniformemente alla sua funzione limite.
Infatti

|fn (x) f (x)| =

0
enx

se
se

x=0
0<x61
kfn f k = sup |fn (x) f (x)| = 1 .
x[0,1]

Quindi
sup |fn (x) f (x)|

x[0,1]

non tende a zero per n e quindi la successione fn (x) non converge


uniformemente alla funzione f (x), ma solo puntualmente.
Vedremo in seguito che ci si sarebbe potuto dedurre dalla discontinuit
della funzione limite f (x).

1.3. CONVERGENZA UNIFORME


Esercizio 1.3.10.

23

(i) Si mostri che la successione


fn (x) = n3 x2 en

2 x2

non converge uniformemente in (0, +), ma che per ogni a > 0, la


successione {fn } converge uniformemente in (a, +).
(ii) Si mostri che esiste nito il limite
lim
n

fn (x) dx

ed maggiore di zero. Quindi le {fn } convergono puntualmente a zero


in (a, +) (e uniformememte in ogni semiretta propriamente contenuta
in (0, +), ma il loro integrale non tende a zero.
Svolgimento. Sia
2
g(x) = xex .
Allora fn (x) = ng(nx). Nella semiretta positiva, la funzione g ha un solo
punto di massimo x0 , a destra del quale decrescente, e tende a zero allinnito. I valori della funzione hn (x) := g(nx) sono gli stessi di g (la funzione
hn si ottiene da g comprimendone orizzontalmente il graco di un fattore n),
e quindi per la norma uniforme di fn = nhn si trova kfn k = nkgk +.
Daltra parte, se n cos grande che x0 /n < a, il punto di massimo x0 /n della
funzione hn minore di a, ed allora, come abbiamo visto, la funzione hn
decrescente in (a, +). Perci lo anche fn , e quindi la norma uniforme in
(a, +)
2 2
sup fn (x) = fn (a) = n3 a2 en a
{x>a}

che tende a zero quando n . Questo prova la parte (i). Per la parte
(ii), basta applicare il teorema di integrazione per sostituzione (x nx) per
ottenere
Z
Z
Z
+

fn (x) dx = n

g(nx) dx =

g(x) dx ,

indipendente da n.

Esempio 1.3.11.
fn (x) =

1
arctan(nx) 0 .
n
n

24 CAPITOLO 1. PANORAMICA SU CALCOLO ED ANALISI REALE


Quindi la funzione limite puntuale f = 0, e


arctan(nx)

|fn (x) f (x)| =

n
da cui



arctan(nx)
0
sup
n
n
xR

per n . Pertanto la convergenza uniforme.


Consideriamo la successione delle derivate fn (x) =
limite

1
se x = 0
(x) =
0
se x 6= 0
e quindi

|fn (x)

(x)| =

1
.
1+(nx)2

La funzione

se x = 0
se x 6= 0

1
1+(nx)2

Allora
sup |fn (x) (x)| = 1
xR

e non tende quindi a zero per n .


In questo esempio, pur essendo fn (x) una successione uniformemente
convergente, fn (x) converge puntualmente a (x) ma non uniformemente.

Esempio 1.3.12. fn (x) = [n,n+1] (x).


Abbiamo visto che fn (x) converge puntualmente a zero. Ci chiediamo se
tale convergenza sia uniforme.


sup [n,n+1] (x) = 1
xR

non tende a zero per n , quindi la successione non converge uniformemente a zero.

1.3. CONVERGENZA UNIFORME

25

Teorema 1.3.13. (Limiti uniformi di successioni di funzioni limitate.) Sia fn una successione di funzioni limitate uniformemente convergente
ad una funzione limite f . Allora anche f una funzione limitata.
Dimostrazione. Poich fn f nella norma uniforme, ssato esiste n tale
che, per ogni x, vale la disuguaglianza |f (x) fn (x)| < . Pertanto, per ogni
x,
!! kfn k 6 fn (x) < f (x) < fn (x) + 6 kfn k +
e quindi f limitata.

Esempio 1.3.14. Per n > 0, consideriamo la successione di funzioni limitate


fn denite sulla semiretta {x > 0} da

x
se x [0, n)
fn (x) =
n
se x [n, +)

Figura 1.2: Gli approssimanti puntuali della bisettrice non sono approssimanti uniformi

Questa successione non converge uniformemente in conseguenza del Teorema 1.3.13, perch il suo limite puntuale la funzione f (x) = x, che
illimitata, e quindi non pu esserne limite uniforme (Teorema 1.3.13). Senza
usare questo teorema, si pu arrivare alla stessa conclusione direttamente

26 CAPITOLO 1. PANORAMICA SU CALCOLO ED ANALISI REALE


dalla denizione di convergenza uniforme (Denizione 1.3.5), e dal suo Corollario 1.3.6: basta osservare che per ogni n si ha kfn f k = +.

Teorema 1.3.15. (Criterio di Cauchy per la convergenza uniforme


di successioni di funzioni.)
Sia {fn (x)}nN una successione di funzioni definite in un intervallo I .
Allora fn (x) converge uniformemente a una funzione f (x) in I per ogni
> 0, esiste n tale che !! , per ogni x I, se n, m > n ,
|fn (x) fm (x)| < .
Dimostrazione.
() Sia > 0. Dato che fn (x) converge uniformemente a f (x), esiste n
tale che se n > n
|fn (x) f (x)| <
x I.
Sia m > n , allora anche
|fm (x) f (x)| <

x I.

Quindi
|fn (x) fm (x)| = |fn (x) f (x) + f (x) fm (x)|
6 |fn (x) f (x)| + |f (x) fm (x)| 6 2
Quindi
|fn (x) fm (x)| 6 2

x I

() Supponiamo che, per ogni > 0, esista n tale che, se n, m > n , allora
|fn (x) fm (x)| 6 per ogni x I. Quindi la successione {fn (x)}nN di
Cauchy e dunque {fn (x)}nN converge.
Sia
f (x) = lim fn (x), x I.
n

Vogliamo fare vedere che {fn (x)}nN converge a f (x) uniformemente in I.


Sia > 0. Allora esiste n tale che se n, m > n
|fn (x) fm (x)| 6 .

1.3. CONVERGENZA UNIFORME

27

Supponiamo che m > n e scriviamo quindi m = n + k con k N. Allora se


n > n
|fn (x) fn+k (x)| 6 k N, x I.
Quindi

lim |fn (x) fn+k (x)| < .

Daltra parte





lim |fn (x) fn+k (x)| = fn (x) lim fn+k (x) = |fn (x) f (x)| ,

e allora

Quindi, se n > n

|fn (x) f (x)| 6 x I.

|fn (x) f (x)| 6 x I.

cio {fn (x)}nN converge uniformemente a f (x).

Teorema 1.3.16. (Limiti uniformi di successioni di funzioni continue.) Sia {fn (x)}nN una successione di funzioni definite in un intervallo I
e sia x0 I. Se le funzioni fn (x) sono tutte continue in x0 e se la successione
{fn (x)}nN converge uniformemente a una funzione f (x) in I, allora f (x)
continua in x0 .
Dimostrazione. Dato che {fn (x)}nN converge uniformemente a f (x), per
ogni > 0, esiste n tale che per ogni n > n e per ogni x I si ha
|fn (x) f (x)| < .
Daltra parte le funzioni fn (x) sono tutte continue in x0 , quindi se si ssa un
indice n tale che n > n , esiste tale che se !!|x x0 | < si ha
|fn (x) fn (x0 )| < .
Quindi, per ogni > 0, esiste > 0 tale che se |x x0 | <
|f (x) f (x0 )| = |f (x) fn (x) + fn (x) fn (x0 ) + fn (x0 ) f (x0 )|
6 |f (x) fn (x)| + |fn (x) fn (x0 )| + |fn (x0 ) f (x0 )| < 3,
cio f (x) continua in x0 .

28 CAPITOLO 1. PANORAMICA SU CALCOLO ED ANALISI REALE


Teorema 1.3.17. (Convergenza uniforme e passaggio al limite sotto
il segno di integrale.) Sia {fn (x)}nN una successione di funzioni continue
in un intervallo [a, b]. Se {fn (x)} converge uniformemente a una funzione
f (x) in [a, b] allora
lim

fn (x) dx =
a

lim fn (x) dx =

a n

f (x) dx .

Dimostrazione. Dato che {fn (x)} converge uniformemente a f (x) in [a, b],
Rb
f (x) risulta essere continua in [a, b] e quindi ha senso scrivere a f (x) dx.
Sia > 0. Per la convergenza uniforme della successione {fn (x)}, esiste
n tale che per ogni n > n e per ogni x [a, b]
|fn (x) f (x)| < .
Allora per ogni n > n

Z b
Z b

Z b





(fn (x) f (x)) dx
fn (x) dx
f (x) dx =

a
a
a
Z b
Z b
6
|fn (x) f (x)| dx 6
dx = (b a).
a

e quindi
lim

fn (x) dx =

f (x) dx

Esempio 1.3.18. Il precedente Teorema 1.3.17 di passaggio al limite sotto il


segno di integrale vale per successioni uniformemente convergenti su un compatto [a, b], ma non vale su insiemi illimitati.
Infatti, sia fn (x) = 1/2n se n 6 x 6 n e fn (x) = 0 altrimenti. Allora kfn kL (R) = 1/2n tende a zero per n , Re quindi fn converge uni
formemente alla funzione nulla su tutto R, ma fn (x) dx = 1.

Teorema 1.3.19. (Convergenza uniforme e derivabilit.) Sia {fn (x)}nN


una successione di funzioni di classe C 1 ([a, b]) tale che

1.3. CONVERGENZA UNIFORME

29

1. per qualche x0 [a, b], fn (x0 ) converge a f (x0 );


2. fn converge uniformemente ad una funzione g in [a, b].
Allora f C 1 ([a, b]) e f (x) = g(x) per ogni x [a, b]. Inoltre anche fn
converge uniformemente a f in [a, b].
Dimostrazione. Per il Teorema Fondamentale del Calcolo integrale (Teorema
1.27.1) abbiamo che per ogni n N
Z x
fn (x) = fn (x0 ) +
fn (t) dt, per ogni x [a, b] .
x0

Allora
lim fn (x) = lim

fn (x0 ) +

= lim fn (x0 ) + lim


n

fn (t) dt
Z

fn (t) dt, .

Per ipotesi
lim fn (x0 ) = f (x0 ) .

Inoltre la successione {fn } converge uniformemente a g e quindi, per il


Teorema 1.3.17
Z x
Z x
Z x

fn (t) dt =
lim fn (t) dt =
g(t) dt .
lim
n

x0

x0 n

Quindi
f (x) = f (x0 ) +

x0

g(t) dt .

x0

(1.8)

Rx
Analogamente, fn (x) =!!fn (x0 ) + x0 fn (t) dt. Poich fn converge uniformemente a g, per ogni > 0 esiste N > 0 tale che, per ogni n > N, si ha
|fn (t) g(t)| < per ogni t [a, b]. Pertanto, per ogni n > N, prendendo n
sucientemente grande perch si abbia |fn (x0 ) f (x0 )| < , otteniamo

Z x


|fn (t) g(t)| dt
|fn (x) f (x)| 6 |fn (x0 ) f (x0 ) +
x0

6 + |x x0 | 6 (b a + 1)

30 CAPITOLO 1. PANORAMICA SU CALCOLO ED ANALISI REALE


e quindi fn converge uniformemente a f in [a, b].
Ora deriviamo ambo i membri di (1.8):
Z x

d

f (x) =
g(t) dt .
dx
x0
Per il Teorema Fondamentale del Calcolo (Teorema 1.27.1)
Z x

d
g(t) dt = g(x),
dx
x0
quindi f = g e il teorema dimostrato.

Nota 1.3.20. La nozione di convergenza richiesta nellenunciato del Teorema 1.3.19 pu essere formulata in termini di una norma, in analogia con
quanto accade per la convergenza uniforme. Nel caso in oggetto la norma
kf kC 1 = kf k + kf k . Essa si chiama che si chiama norma C 1 , ovvero
norma nello spazio C 1 ([a, b]) delle funzioni derivabili con derivata continua
nellintervallo [a, b]. Questa norma verr studiata pi approfonditamente
nellEsempio 9.1.6.

Nota 1.3.21. Tutti i precedenti teoremi di questa Sezione continuano a valere, con dimostrazione analoga, se invece di considerare una successione di
funzioni fn indicizzata da in indice intero n si prende in esame una famiglia
di funzioni f indicizzata da un parametro reale (o complesso) che tende
ad un limite 0 . A titolo di esempio formuliamo la prossima denizione ed il
prossimo teorema in questa senso.

Il prossimo risultato un parziale reciproco del Teorema 1.3.16: infatti esso mostra che, se il limite continuo, allora la convergenza puntuale
implica quella uniforme, purch abbia luogo su un compatto ed in maniera
puntualmente decrescente. A questo ne anticipiamo luso della nozione di
compattezza (e di sottoricoprimenti niti), per la quale rinviamo alla successiva Denizione 1.9.4. Per concretezza, anticipiamo anche che gli intervalli
limittio e chiusi su R sono compatti.
Teorema 1.3.22. (Dini.) Sia K un insieme compatto e ! siano fn : K
R funzioni continue che convergono puntualmente ovunque ad una funzione
continua f in maniera monotna non crescente, ossia fn+1 (x) 6 fn (x) per
ogni x K. Allora la convergenza uniforme.

1.3. CONVERGENZA UNIFORME

31

Dimostrazione. Fissiamo > 0. Poich le fj convergono puntualmente a


f ed f continua, per ogni y K esistono un indice j ed un sottoinsieme
aperto !U(y, j) K tali che
|fj (x) f (x)| <

(1.9)

per ogni x !U(y, j): infatti, !fj (y) converge a f (y) e quindi (1.9) vericata
per x = y, e, per gli altri x !U(y, j), |fj (x) f (x)| 6 |fj (x) fj (y)| +
|fj (y) f (y)| + |f (y) f (x)|. Quindi (1.9) segue dalla continuit di fj .
Allora la famiglia !U(y, j) forma un ricoprimento aperto di K. Per la compattezza, esiste un sottoricoprimento nito U(y1 , j1 ), . . . , U(ym , jm ) di K. Sia
k = max{j1 , . . . , jm }. Poich la successione fj non crescente, sappiamo che
per ogni i si ha |fk (x)f (x)| < |fji (x)f (x)| < se x U(yi , ji ). Ma poich
lunione degli U(yi , ji ) tutto K, abbiamo che |fk (x) f (x)| < ovunque.
Ora, di nuovo per la monotonia, kfn f k < per ogni n > k.

Esercizio 1.3.23. Si consideri la successione di funzioni


x
.
fn (x) =
1 + en x
Dimostrare che nella semiretta {x > 0} la successione {fn } converge uniformemente a 0.
Suggerimento: per x > 0,
x
x
1
< n =
.
n
1+e x
e x
1 + en
Invece, per x = 0, si ha fn (0) = 0 per ogni n.

Esercizio 1.3.24. Studiare la convergenza uniforme della successione di funzioni fn (x) = (n sin x + cos x)/(2n + 1) per x R.

Esercizio 1.3.25. In quali sottoinsiemi di R la serie

X
x2n
n=1

converge uniformemente?

n3

32 CAPITOLO 1. PANORAMICA SU CALCOLO ED ANALISI REALE

1.3.2

Convergenza uniforme di serie di funzioni

Una serie di funzioni una serie il cui termine n-esimo una funzione
X
fn (x)
n

Definizione
1.3.26. La successione delle somme parziali della serie di funP
zioni n fn (x) la successione di funzioni
Sn (x) =

n
X
k=0

fk (x) n N, x I.

Definizione
P 1.3.27. (Convergenza uniforme di serie.) Una serie di
funzioni k fk (x) denite in I converge uniformemente ad una funzione f
denita in I se la successione delle sue somme parziali {Sn (x)}nN converge
uniformemente a f (x) in I. In tal caso scriviamo che

X
k=0

fk (x) = f (x) uniformemente I.

Teorema 1.3.28. (Criterio di Cauchy per la P


convergenza uniforme di serie di funzioni.) Una serie di funzioni n fn (x) converge uniformemente in I se e solo se per ogni > 0, esiste n tale che se n >
n

n+p

X


fk (x) < p N, x I.



k=n+1

Dimostrazione. Consideriamo la successione delle somme parziali della serie


Sn (x) =

n
X
k=0

fk (x) x I.

Allora il teorema si dimostra applicando a tale successione il criterio di Cauchy per la convergenza uniforme di successioni di funzioni(Teorema 1.3.15).

Teorema 1.3.29. (Test di Weierstrass o della convergenza totale.)


Sia {Mn }nN una successione di numeri non negativi tale che
|fn (x)| 6 Mn

n N, x I.

1.3. CONVERGENZA UNIFORME

33

P
numerica convergente.
Sia, inoltre,
n=0 Mn una serie
P
Allora la serie di funzioni n=0 fn (x) converge uniformemente in I.

Dimostrazione. Dato che, per ogni n N e x I, si ha |fn (x)| 6 Mn ,


otteniamo

n+p
n+p
n+p

X
X
X


Mk .
|f
(x)|
6
f
(x)
6


k
k


k=n+1
k=n+1
k=n+1
P
La serie numerica n=0 Mn convergente e quindi per ogni > 0, esiste n
tale che se n > n

n+p
n+p

X
X


Mk < p N.
Mk =


k=n+1

k=n+1

Allora per ogni > 0 esiste n tale che se n > n



n+p
n+p

X
X


Mk !! 6 p N, x I.
fk (x) 6



k=n+1

k=n+1

Ma laPcondizione di Cauchy equivalente alla convergenza uniforme della


serie

n=0 fn (x) (Teorema 1.3.28).

Esempio 1.3.30. Convergenza puntuale ed uniforme di serie di funzioni a supporti disgiunti.) Il presente esempio anticipa, limitatamente
a ci che riguarda la convergenza puntuale ed uniforme di serie, un esempio
analogo (Esercizio 11.16.32) che estenderemo anche alla convergenza nel senso delle distribuzioni. Consigliamo fortemente al lettore di tracciare i graci
dei termini delle serie e delle loro somme parziali, per evitare confusioni (i
termini delle serie che studieremo nellEsempio 11.16.32 hanno graci pi
semplici: in caso di dubbio il lettore pu considerare quelle funzioni invece
di queste).
Sia c0 la funzione che vale sin x nellintervallo [, ] e 0 altrove, e sia
cn il suo traslato di passo 2n, che vale quindi sin(x 2n) = sin x in
[2n , 2n + ] = [(2n 1), (2n + 1)] e 0 altrove. Consideriamo la
serie

X
cn (x) .
n=1

34 CAPITOLO 1. PANORAMICA SU CALCOLO ED ANALISI REALE


(i) La serie converge puntualmente? La serie converge uniformemente?
La serie converge puntualmente alla funzione S(x) che vale cn (x) nellintervallo [(2n 1), (2n + 1)]. In altre parole, la funzione S somma
della serie vale sin x negli intervalli [(2n 1), (2n + 1)] al variare di
n, e quindi vale sin x su tutto R.
Infatti, poich questi intervalli sono adiacenti, per ogni x si ha cn (x) = 0
per tutti gli interi n tranne che per lunico valore di n (che indichiamo
con nx ) che verica (2n 1) 6 x < (2n + 1) (qui il segno di minore o
uguale a sinistra si potrebbe rimpiazzare col segno di minore, perch ai
punti 2 + 2n tutti gli addendi sono nulli). Questo valoreh nx ifacile
da calcolare, anche se non serve farlo: in eetti si ha nx =

(x+)
2

Quindi, per ogni x, c al pi soltanto un termine non nullo nella serie,


da cui la convergenza puntuale: pertanto ogni somma parziale Sn (x)
vale 0 per n < nx , e per tutti gli n > nx vale sin x. In altre parole,
passato nx il valore delle somme parziali Sn (x) diventa costante rispetto
a n, e quindi ovviamente esse convergono.

La serie per non converge uniformemente. Se la convergenza fosse


uniforme, le somme parziali convergerebbero uniformemente alla somma puntuale S(x) calcolata nella P
parte precedente. Quindi, indicando
con SN la somma parziale SN = N
n=1 cn (x), il resto N-simo S SN
vericherebbe
lim kS SN k = 0.
Invece,

S(x) SN (x) =

cn (x)

n=N +1

vale sin x se x appartiene ad un intervallo del tipo [(2n 1), (2n + 1)]
con n > N, e 0 altrimenti (ossia se x > (2N 1)). Poich in questi
intervalli il seno raggiunge il valore massimo 1 si ha kS SN k = 1
per ogni N, e pertanto non si ha convergenza uniforme.
Una variante di questo ragionamento, pi semplice perch non richiede
il calcolo preliminare della somma S della serie, segue dal criterio di
Cauchy (Teorema 1.3.28): per il momento lasciamo questa variante per
esercizio, rinviando i lettori che non fossero in grado di arontarlo alla
spiegazione dettagliata che troveranno nel seguito alla Nota 1.2.19.

1.3. CONVERGENZA UNIFORME

35

(ii) Consideriamo ora invece la serie

n cn (x) .

n=1

Come cambiano le risposte precedenti se = 1?


In questo caso n = n. Come prima, al pi soltanto un termine della
serie non nullo per ciascun x, e quindi la serie converge puntualmente.
Per questo termine ora vale n sin x. Quindi la somma della serie
illimitata per x (vale n nel punto x = 2 + 2n, dove il seno vale
1), e la serie diverge nella norma uniforme.
(iii) Come cambiano le risposte precedenti se = 21 ?

Come prima, la serie converge puntualmente perch per ogni x ce


al pi un solo addendo non nullo: si tratta del termine con n = nx ,
come sempre. Ora per questo termine si maggiora, in valore assoluto,
1
con il massimo del seno (che ovviamente vale 1) moltiplicato per nx 2 .
Quindi la somma parziale n-sima della serie nulla a destra dei primi
1
n intervalli, e suPciascuno di essi si maggiora con n 2 . Pertanto ora
21
S(x)SN (x) =
cn (x) si maggiora uniformemente con (N +
n=N +1 n
1
1) 2 , che tende a 0 con N, e quindi la serie converge uniformemente.
Cautela: nellultimo passaggio non si pu applicare il test di P
Weierstrass
1
(Teorema 1.3.29), perch la serie numerica dei maggioranti, n 2 , non
converge (Sezione 1.1). Ed in eetti, qui la convergenza uniforme non
segue in realt dal fatto che gli addendi diventino piccoli rapidamente,
bens dal fatto che diventano piccoli anche se lentamente ma i loro
supporti sono disgiunti...

Esercizio 1.3.31. Discutere in dettaglio lanalogo del precedente Esempio



1.3.30 se la funzione c0 ridenita cos: c0 (x) = cos x se x 2 , 2 e
0 altrove.

Esercizio 1.3.32. (i) Sia n la funzione caratteristica dellintervallo [n, n +


1) (quella denita nella SezioneP1.1 che vale 1 se n 6 x < n + 1 e 0
altrove). Si mostri che la serie
n= n converge puntualmente alla
costante 1 ma non converge uniformemente.

36 CAPITOLO 1. PANORAMICA SU CALCOLO ED ANALISI REALE


(ii) Sia n la
funzione caratteristica dellintervallo [0, n). Si mostri che
P
la serie n= n non converge puntualmente: pi precisamente, che
essa diverge per ogni x.
(iii) Sia n laPfunzione caratteristica dellintervallo [0, 1/n). Si mostri che

la serie
n= n diverge in x = 0 ma converge puntualmente per
ogni x 6= 0, e converge uniformemente in ogni intervallo chiuso che non
contiene 0. (Suggerimento: per ogni ssato x 6= 0, solo un numero
nito dei numeri n (x) sono non nulli.)

Dai teoremi sulla continuit e derivabilit ed il passaggio al limite sotto il segno di integrale dimostrati per le successioni di funzioni seguono i
relativi teoremi per le serie di funzioni (si dimostrano considerando la successione delle somme parziali della serie e applicando i suddetti teoremi a
tale successione).
Teorema 1.3.33. (Convergenza uniforme e continuit
di serie di
P
funzioni.) Se una serie di funzioni continue in I,
n=0 fn (x), converge
uniformemente a una funzione f (x) in I, allora f (x) continua in I
Teorema
1.3.34. (Convergenza uniforme ed integrabilit per serie.)
P
f
Sia
n=0 n (x) una serie di funzioni continue in un intervallo [a, b]. Se la
serie converge uniformemente a f (x) in [a, b], allora
Z

f (x) dx =

Z
X
n=0

fn (x) dx.

Teorema
P 1.3.35. (Convergenza uniforme e1 derivabilit per serie.)
Sia n=0 fn (x) una serie di funzioni di classe C (I) tale che
1.

2.

n=0

n=0

fn (x) converge uniformemente a f (x) in I;

fn (x) converge uniformemente a una funzione g(x) in I.

Allora f C 1 (I) e g(x) = f (x) in I

1.4. SERIE DI POTENZE

1.4

37

Serie di potenze

Definizione 1.4.1. Sia an una successione a valori reali o complessi. Una


serie della forma

X
n=1

an (z z0 )n ,

z C (oppure z R)

detta serie di potenze. A meno di una traslazione, quindi senza perdita di


generalit, assumeremo in tutti gli enunciati che sia z0 = 0.
Teorema 1.4.2. (Disco di convergenza di serie di potenze.) Sia

an z n ,

zC

n=1

una serie di potenze, e sia

R=

1
lim supn

p
n
|an |

(1.10)

dove conveniamo che sia R = 0 se il denominatore infinito, e r = + se


il denominatore zero. Allora la serie converge assolutamente per |z| < R e
non converge per |z| > R. Inoltre, la serie converge uniformemente in ogni
compatto contenuto nel disco !BR (0) = {|z| < R}.
Dimostrazione. Per la convergenza, basta p
applicare il criterio della radice
n
(Sezione 1.1), ed osservare che lim supn |an z n | = |z|/R.
Proviamo la convergenza uniforme sui compatti. Per il Teorema di Weierstrass sullesistenza dei massimi di funzioni continue sui compatti (Sezione 1.1), in ogni compatto K contenuto nel disco di convergenza c un punto
w a distanza massima dallorigine, perch, per denizione di continuit, la
distanza una funzione continua. Poich il disco di convergenza ha raggio R,
per ogni z K si ha |z| 6 |w| < R. Allora |an z n | 6 |an w n |, e la convergenza
uniforme segue da questa maggiorazione uniforme rispetto a z e dalla prima parte della dimostrazione grazie al test di Weierstrass (Teorema 1.3.29).

Nota 1.4.3. Se esiste, nito od innito, il limite




an

lim
n an+1

38 CAPITOLO 1. PANORAMICA SU CALCOLO ED ANALISI REALE


allora anche questo limite uguale al raggio di convergenza: basta applicare
il criterio del rapporto (Sezione 1.1) anzich quello della radice.

Corollario 1.4.4. Nel suo disco aperto di convergenza, una serie di potenze
converge ad una funzione continua.
P n 2
P n
P
n
Esempio 1.4.5. Le serie
n=1 z /n hanno tutte e tre
n=1 z /n,
n=1 z ,
raggio di convergenza uguale a 1, quindi il disco di convergenza la palla
con centro lorigine e raggio 1. Sul bordo del disco di convergenza (la circonferenza con centro lorigine e raggio 1) il comportamento delle tre serie
diverso: lo determiniamo sulla base dei criteri di convergenza enunciati nella
Sezione 1.1. La prima non converge, perch il termine generico non tende a
zero. Lultima converge ovunque,
P nperch i coecienti decrescono in modulo
2
a velocit 1/n . La serie
n=1 z /n diverge per z = 1 dove i coecienti
valgono 1/n, e converge puntualmente sul resto della circonferenza per il criterio di Dirichlet (Teorema 1.1.5. In particolare essa converge a z = 1 per
il criterio di Leibnitz sulle serie a segni alterni, che il criterio di Dirichlet
estende agli altri punti z = eit con t 6= 2k (k Z).

Esempio 1.4.6. Determiniamo il raggio di convergenza della serie


X
n! z n .
n

Qui an = n!, e quindi

n!
|an |
= lim
= lim n + 1 = 0.
n+ (n + 1)!
n+
n+ |an+1 |

R = lim

Pertanto la serie converge solo per z = 0.

Teorema 1.4.7. SviluppabilitP


in serie di potenze rispetto a diversi
n
centri di sviluppo.) Sia f (z) =
n=0 an (z z0 ) una serie di potenze con
! raggio di convergenza R > 0, e sia z1 tale che il disco BS (z1 ) contenuto
nel disco di convergenza BR (z0 ), ossia tale che
|z1 z0 | + S!! 6 R .
Allora per ogni k N la serie
bk =

 
X
n
n=k

an (z1 z0 )nk

(1.11)

1.4. SERIE DI POTENZE

39

convergente, e nel disco BS (z1 ) la funzione somma f sviluppabile in serie


di potenze con centro z1 : per ogni z BS (z1 ),
f (z) =

X
k=0

bk (z z1 )k .

(1.12)

Dimostrazione. Dal Teorema del Binomio di Newton (Sezione 1.1) si ha


n  
X
n
(z z1 )k (z1 z0 )nk .
(z z0 ) = (z z1 + z1 z0 ) =
k
n

(1.13)

k=0

Allo stesso modo si ha


n

(|z z1 | + |z1 z0 |) =

n

n  
X
n
k=0

|z z1 |k |z1 z0 |nk .

(1.14)

Poniamo u(n, k) = k an (z z1 )k (z1 z0 )nk se 0 6 k 6 n, e u(n, k) = 0


altrimenti. Allora da (1.13) abbiamo
f (z) =

u(n, k) .

n=0 k=0

Ora mostriamo che la serie doppia nel lato destro di questa identit converge
assolutamente. Sia z BS (z1 ), ossia |z z1 | < S. Poniamo w = z0 + |z
z1 | + |z1 z0 |, ed osserviamo che
|w z0 | < S + |z1 z0 | 6 R
dallidentit (1.11). Pertanto segue da (1.14) che
X

X
n=0 k=0

|u(n, k)| =

X
n=0

|an | (|z z1 | + |z1 z0 |) =

X
n=0

|an | (w z0 )n ,

ma questa serie di potenze converge perch |w z0 | inferiore al suo ! raggio


di convergenza R. Abbiamo quindi convergenza assoluta della serie, e quindi
possiamo riordinarne i termini (Section 1.1) scambiando lordine delle due
somme, ossia sommando prima rispetto a n e poi rispetto a k: in tal modo
si ottiene (1.12).

40 CAPITOLO 1. PANORAMICA SU CALCOLO ED ANALISI REALE


P
n
Lemma
1.4.8.
Una
serie
di
potenze
n=0 an z e la serie delle derivate
P
n1
hanno lo stesso raggio di convergenza. Rem: in questo enunn=1 n an z
ciato, per maggiore generalit, la derivata quella per funzioni di variabile
complessa (si veda in seguito la Definizione 1.22.13). Il lettore per cui questa nozione sia per ora poco familiare pu limitare lattenzione, nel presente
enunciato, a serie di potenze reali.
p
p
n
n
Dimostrazione.
Basta osservare che
lim
sup
|n
a
|an |,
n | = lim supn
n

perch limn n n = 1 (infatti n n = elog n/n e log n diverge pi lentamente


di n (Sezione 1.1)).

Teorema
P 1.4.9.n (Derivazione di serie di potenze.) Se la serie di potenze n=0 an z converge nel disco di raggio R ed ha somma f (z), allora
in questo disco f derivabile (in senso complesso, Definizione 1.22.13) e la
derivata si ottiene derivando per serie, cio termine a termine:

f (z) =

n an z n1 .

n=1

In particolare, se una serie di potenze di una variabile reale converge in un


segmento, al suo interno essa derrivabile termine a termine e la derivata
della serie coincide con la serie delle derivate.
Dimostrazione. Segue immediatamente dal precedente Lemma 1.4.8 e dal
teorema di derivazione per serie, Teorema 1.3.35.

Corollario 1.4.10. (Ogni serie di potenze integrabile termine a


termine.) In ogni intervallo chiuso allinterno
suo intervallo aperto di
Pdel

convergenza, ogni serie di potenze reale f (x) = n=0 an (xx0 )n integrabile


termine a termine, ossia il segno di integrale commuta con quello di serie.
In altre parole, per ogni x tale che |x x0 | < R:
Z

x0

f (t) dt =

X
n=0

an

X
an
(t x0 ) dt =
(x x0 )n+1 .
n
+
1
x0
n=0
x

Dimostrazione. La serie converge uniformemente in [x0 , x] per il teorema


di convergenza (Teorema 1.4.2). Il risultato segue quindi dal teorema di
integrazione per serie (Teorema 1.3.34).

1.4. SERIE DI POTENZE

41

Teorema 1.4.11. (Teorema di convergenza radiale


P di nAbel.) Consideriamo uno sviluppo in serie di potenze f (x) = n=0 an x convergente
nellintervallo aperto (r, r). Se la seriePconverge anche al punto x = r, aln
lora esiste il limite limxr f (x) e vale
n=0 an r . Equivalentemente, se la
serie di potenze di variabile complessa e converge puntualmente su un raggio del disco di convergenza, estremo incluso, allora la sua somma ha limite
radiale lungo quel raggio, ed continua su tutto il raggio estremo incluso.

Dimostrazione. Se la serie converge al punto x = r alloraPil suo raggio

n
spettrale
R verica la disuguaglianza R > r. Scriviamo
=
n=0 an x
P
x n n
a
r
e
consideriamo
la
convergenza
di
questa
serie
nellintervallo
n=0 n r
[0, r]. Poich xr 6 1, la successione di funzioni xr uniformemente limitata,
ed
P
inoltre monotna non crescente. Per ipotesi, la serie geometrica n=0 an r n
convergente. Quindi la serie a secondo membro converge uniformemente
in questo intervallo per il criterio di convergenza uniforme di Abel (Teorema
1.1.7 (ii)): in particolare, la sua somma una funzione continua in [0, r], ed
analogamente in (r, r].

Esercizio 1.4.12. Studiare la convergenza della serie


X
n

1
log 1
n

zn ,

dove > 0. Svolgimento. Sia an = 2n log 1


convergenza della serie

1
n


, allora il raggio di

|an |
=2
n+ |an+1 |

R = lim

Quindi la serie in esame converge assolutamente per |z| < 2 e non converge
per |z| > 2. Inoltre, per |z| = 2 la serie converge assolutamente se > 1:
infatti, se z = 2 ei ( R), allora dalle stime di Leibnitz (Sezione 1.1) per
lo sviluppo di Taylor al primo ordine del logaritmo a x = 1 (che a segni
alterni), o pi semplicemente dal fatto che il logaritmo concavo e quindi il
suo graco sta sotto alla retta tangente al punto x = 1, si vede che




n

1
n
in
2 log 1
6 1
2
e

n

42 CAPITOLO 1. PANORAMICA SU CALCOLO ED ANALISI REALE


P 1
(Sezione 1.1). Analoe la convergenza segue dal confronto con la serie
n
gamente, dallo sviluppo del logaritmo al secondo ordine, segue che





n
2 log 1 1 2n ein > 1 1 > 1
n 2n2

n
2n

se n sucientemente grande. Quindi, per 6 1, la serie diverge se |z| = 2,


sempre grazie al criterio del confronto.

Esercizio 1.4.13. Studiare la convergenza della serie


X
2 n zn.
n

Svolgimento. Qui an = 2
R=

. Quindi

1
1
1

p
p
=
=1
=

n
n
n
lim n |an |
n
lim
2
lim
2
n+
n+

n+

Il raggio di convergenza R = 1, quindi la serie in esame converge per


|z| < 1 e non converge per |z| > 1. Si vede inoltre che per |z| = 1 la serie
non converge perch in tal caso il termine generale non tende a zero.

Esercizio 1.4.14. Studiare la convergenza della serie


X

(n n cos n) z n .
n

Svolgimento. Poich an = n

n cos n, il raggio di convergenza della serie

|n n cos n|
|an |

= lim
R = lim
n+ |n + 1
n+ |an+1 |
n + 1 cos(n + 1)|
=

lim

n+

|1 +

1
n

n
cos n|
n

n+1
cos(n
n

|1

+ 1)|

= 1.

Quindi la serie converge assolutamente per |z| < 1 e non converge per |z| > 1.
Si vede inoltre che per |z| = 1 la serie non converge perch in tal caso il
termine generale non tende a zero.

1.5. ESERCIZI

43

Esercizio 1.4.15. Studiare la convergenza della serie


X (2x)n

n
+
3
n
n

al variare del parametro reale x.


Svolgimento. Qui an = n+31n , ed il raggio di convergenza della serie di
X
zn

potenze
n
+
3
n
n
|an |
= 1.
n+ |an+1 |

R = lim

Quindi la serie converge assolutamente per |x| < 1/2 e non converge per
|x| > 1/2. Dal criterio del confronto (Sezione 1.1) si vede che per x = 1/2 la
serie diverge. Dal Criterio di Leibnitz (Sezione 1.1) si vede che per x = 1/2
la serie converge.

Esercizio 1.4.16. Per k > 0 intero, la serie

xn

n=1

converge puntualmente in (0, 1)? Converge uniformemente in (0, 1)? Svolgimento. Il raggio di convergenza di queste serie, calcolato come in (1.10),
1 per ogni k, quindi le serie convergono tutte puntualmente in (0, 1). I
loro termini sono funzioni crescenti e continue, estendibili con continuit allintervallo (0, 1], dove hanno massimo al punto x = 1 con valore massimo
1: quindi la norma uniforme sullintervallo (0, 1) di ciascun termine vale 1.
Per lo stesso motivo le somme parziali m-sime sono crescenti in (0, 1), hanno
senso anche in (0, 1], e la loro norma uniforme diverge. Non si ha convergenza
uniforme per nessun k intero positivo.

1.5

Ulteriori esercizi sulla convergenza uniforme

Esercizio 1.5.1. In quali sottoinsiemi dellintervallo [2, 2] la serie

X
xn
n=1

n2

44 CAPITOLO 1. PANORAMICA SU CALCOLO ED ANALISI REALE


converge uniformemente?
Esercizio 1.5.2.

1. Utilizzando il test di Weierstrass si dimostri che la serie

X
ek|x|
k=1

k5

converge uniformemente in ogni intervallo limitato contenuto in [0, 1].

2. Si dimostri inoltre che le somme parziali della serie al punto (a),


Sn =

n
X
ek|x|
k=1

k5

formano una successione di Cauchy.


Suggerimento: si maggiorino le somme
N
X
ek|x|
k5
k=M +1

per M, N sucientemente grandi.)

Esercizio 1.5.3.

1. Utilizzando il test di Weierstrass si dimostri che la serie

X
arctan(x k)
k=1

k3

converge uniformemente in ogni intervallo limitato contenuto in [0, 1].


2. Si dimostri inoltre che le somme parziali delle serie al punto (a),
Sn =

n
X
arctan(x k)
k=1

k3

1.5. ESERCIZI

45

formano una successione di Cauchy.


(Suggerimento: si maggiorino le somme
N
X
arctan(x k)
k3
k=M +1

per M, N sucientemente grandi.)

Esercizio 1.5.4.

1. Utilizzando il test di Weierstrass si dimostri che la serie


2

X
e(xk)

k=1

k2

converge uniformemente in ogni intervallo limitato contenuto in [0, 1].


2. Si dimostri inoltre che le somme parziali della serie al punto (a),
Sn =

2
n
X
e(xk)

k2

k=1

formano una successione di Cauchy.


(Suggerimento: si maggiorino le somme
2
N
X
e(xk)
k2
k=M +1

per M, N sucientemente grandi.)

Esercizio 1.5.5.

1. Utilizzando il test di Weierstrass si dimostri che la serie

X
cos xk
k=1

k4

converge uniformemente in ogni intervallo limitato contenuto in [0, 1].

46 CAPITOLO 1. PANORAMICA SU CALCOLO ED ANALISI REALE


2. Si dimostri inoltre che le somme parziali della serie al punto (a),
Sn =

n
X
cos xk
k=1

k4

formano una successione di Cauchy.

(Suggerimento: si maggiorino le somme


N
X
cos xk
k4
k=M +1

per M, N sucientemente grandi.)

Esercizio 1.5.6. In quali sottoinsiemi dellintervallo [0, 4] la serie

X
( x)n
n3
n=1

converge uniformemente?

Esercizio 1.5.7. In quali sottoinsiemi dellintervallo (1, +) la serie

X
(log(x + 1))n

n4

n=1

converge uniformemente?

Esercizio 1.5.8. In quali sottoinsiemi dellintervallo [1, 1] la serie

X
x2n
n=1

converge uniformemente?

n3

Esercizio 1.5.9. In quali sottoinsiemi dellintervallo [1, 1] la serie

X
x2n
n=1

converge uniformemente?

n3

1.5. ESERCIZI

47

Esercizio 1.5.10. Utilizzando il test di Weierstrass dimostrare che la serie

X
arctan(x n)

n3

n=1

converge uniformemente su tutto R.

Esercizio 1.5.11. In quali sottoinsiemi di R la serie


2

X
e(xn)

n=1

n2

converge uniformemente?

Esercizio 1.5.12. In quali sottoinsiemi di R la serie

X
xn
n=1

n4

converge uniformemente?

Esercizio 1.5.13. In quali sottoinsiemi di R la serie

X
arctan(x n)

n2

n=1

converge uniformemente?

Esercizio 1.5.14. In quali sottoinsiemi di R la serie


2

X
ex +n

n=1

n2

converge uniformemente?

Esercizio 1.5.15. In quali sottoinsiemi di R la serie

X
cos(x n)
n=1

converge uniformemente?

n3

48 CAPITOLO 1. PANORAMICA SU CALCOLO ED ANALISI REALE


Esercizio 1.5.16. In quali sottoinsiemi di R la serie

X
arctan(x n)

n3

n=1

converge uniformemente?

Esercizio 1.5.17. In quali sottoinsiemi di R la serie

X
sin(x + n)

n3

n=1

converge uniformemente?

Esercizio 1.5.18. In quali sottoinsiemi di R la serie

X
x2n
n=1

n2

converge uniformemente?

Esercizio 1.5.19. In quali sottoinsiemi di R la serie

X
xn
n=1

n2

converge uniformemente?

Esercizio 1.5.20. In quali sottoinsiemi di R la serie


2

X
e(xn)

n=1

converge uniformemente?

n2

Esercizio 1.5.21. In quali sottoinsiemi dellintervallo [a, a] con a R la


serie

X
xn
n3
n=1
converge uniformemente?

1.5. ESERCIZI

49

x
con R+
Esercizio 1.5.22. Data la successione di funzioni fn (x) = cos
n
stabilire in quali sottoinsiemi di R converge uniformemente.

Esercizio 1.5.23. In quali intervalli [a, b] di R la serie

X
(x + n)3
n=1

n5

converge uniformemente?

Esercizio 1.5.24.
Studiare la convergenza uniforme della successione di funzioni fn (x) = ( x)n nellintervallo [0, 1].

Esercizio 1.5.25. Studiare la convergenza uniforme della successione di fun.


zioni fn (x) = sin(nx)
n2

Esercizio 1.5.26. In quali sottoinsiemi dellintervallo [2, 2] la serie

X
xn
n=1

n3

converge uniformemente?

Esercizio 1.5.27. In quali sottoinsiemi dellintervallo [2, 2] la serie

X
xn
n=1

n2

converge uniformemente?

Esercizio 1.5.28. In quali sottoinsiemi dellintervallo [0, 4] la serie

X
( x)n
n=1

converge uniformemente?

n3

50 CAPITOLO 1. PANORAMICA SU CALCOLO ED ANALISI REALE


Esercizio 1.5.29. In quali sottoinsiemi dellintervallo (0, +) la serie
n

X
e x2

n=1

converge uniformemente?

n2

Esercizio 1.5.30. Sia f (x) = 1/(1 + (x)2). La successione di funzioni fn (x) =


f (x/n) converge puntualmente su R? Converge uniformemente sui compatti? Converge uniformemente su tutto R? Svolgimento. evidente che
fn (x) 1 puntualmente per ogni x. La convergenza non uniforme su
R, perch, per ogni n, si ha kfn 1k = supxR 1 fn (x) = 1, visto che
limx 1 fn (x) = 1 limx fn = 1. Si osservi che lestremo superiore
non un massimo, visto che non viene raggiunto in un punto di R ma solo approssimato allinnito: questo non contraddice il Teorema di Weierstrass sui
massimi e minimi delle funzioni continue sui compatti (Sezione 1.1) perch
stiamo studiando la funzione 1 fn sullintera retta e non su un compatto.
Pertanto questo estremo superiore non pu essere localizzato annullando la
derivata di fn : in tal modo si localizzerebbe il minimo, raggiunto in 0.
Consideriamo ora la convergenza uniforme sui compatti. Ogni compatto in
R contenuto in un intervallo [a, b], con a < b, quindi, senza perdita di generalit, limitiamo lattenzione ad un tale intervallo. Consideriamo dapprima
il caso a < 0 < b. Osserviamo che la funzione 1 fn (x) = 1 1+x12 /n2 il
2

x
1
dilatato di 1 1+x
2 = 1+x2 , e quindi una funzione monotna crescente in
[0, b] e monotna decrescente in [a, 0]. Quindi 1 fn ha minimo in 0, come
gi sapevamo, ma nellintervallo [0, b] ha massimo nel punto b, per monotonia, e nellintervallo [a, 0] ha massimo nel punto a, per la stessa ragione.
Quindi il massimo della funzione 1 fn nellintervallo [a, b] il pi grande
fra i due valori che essa assume in a ed in b; inoltre la funzione 1 fn , come
la funzione f , pari, e quindi il suddetto punto di massimo assunto nel pi
lontano da 0 fra i punti a e b. Senza perdita di generalit, supponiamo che
il pi lontano sia il punto b. Allora kfn 1kL [a, b] = 1 fn (b) = 1 1b12 /n2
tende a zero per n , e quindi si ha convergenza uniforme in [a, b] di fn
alla funzione 1.
Se lintervallo [a, b] tutto contenuto in R+ o R , la convergenza uniforme
segue per restrizione dal caso di intervalli che contengono lorigine.

Esercizio 1.5.31. Sia f (x) = 1/(1 + x2 ) e fn (x) = f (x 1/n). Determinare


se fn converge uniformemente

1.5. ESERCIZI

51

1. sui compatti;
2. su tutto R.
Svolgimento. chiaro che il limite puntuale delle funzioni fn f , dal momento che 1/n tende a zero con n. Per quanto riguarda la convergenza uniforme,
osserviamo che si ha
(fn f )(x) =
Quindi, visto che

2x + n1
1
1
1

.
=
n (1 + (x + n1 )2 )(1 + x2 )
1 + (x + n1 )2 1 + x2

1
1 2
1+(x+ n
)

6 1, abbiamo

1 2|x| + 1
1
1 2|x| + n1
<
< ,
|fn (x) f (x)| 6
2
2
n 1+x
n 1+x
n
perch 2|x| 6 1 + x2 (questo equivale al fatto che (x 1)2 > 0). Quindi fn
converge uniformemente a f su tutto R.
A maggior ragione si ha convergenza uniforme su ogni compatto. Osserviamo che su un compatto, che senza perdita di generalit, come nellesercizio
precedente, possiamo scegliere come [a, b], con a < 0 < b, la funzione fn f
assume un massimo, per il Teorema di Weierstrass citato nellEsercizio precedente, ma questo massimo non viene raggiunto negli estremi dellintervallo:
a dierenza dellesercizio precedente, ora la funzione fn f non monotna
in [a, 0] e in [0, b].

Esercizio 1.5.32. Sia f come nel problema


Pprecedente e fn (x) = f (x n) =
2
1/(1 + (xn) ). Determinare se la serie n=0 fn (x) converge uniformemente
1. sui compatti;
2. su tutto R.
Svolgimento. Le funzioni fn sono tutte traslate della stessa funzione f , e
quindi hanno tutte la stessa norma uniforme: kfn k = 1 per ogni n. Pertanto
la serie non converge uniformemente su R in base alla Nota 1.2.19.
Diversa la situazione sui compatti: l la serie converge uniformemente. Per
questo, come negli esercizi precedenti, basta restringere lattenzione ad un
intervallo [a, b]. Il massimo della funzione fn raggiunto al punto x = n.
A sinistra del loro punto di massimo, le fn sono crescenti. Pertanto, se

52 CAPITOLO 1. PANORAMICA SU CALCOLO ED ANALISI REALE


limitiamo lattenzione agli indici n > b (in tal modo trascuriamo solo un
numero nito di termini, e la convergenza della serie non ne aetta), le fn
sono tutte crescenti in [a, b], e quindi il loro massimo su questo intervallo
viene assunto allestremo destro b, e vale kfn kL [a, b] = 1/(1 + (b n)2 ): si
tratta di un innitesimo dellordine di 1/n2 , e quindi kfn kL [a, b] < C/n2
per qualche costante C > 0, e la serie converge uniformemente per il test di
Weierstrass (Teorema 1.3.29).

1.6

Serie di Taylor

1.6.1

Sviluppabilit in serie di Taylor

Per ragioni di enfasi, dedichiamo questa Sezione specica a reinterpretare


le serie di potenze come serie di Taylor. Al ne di chiarezza, ritorniamo a
considerare serie di potenze con centro non necessariamente in z0 = 0.
Corollario 1.6.1. (Ogni serie di potenze una serie P
di Taylor.) Al
n
linterno del suo disco di convergenza, ogni serie di potenze
n=0 an (z z0 )
P
derivabile infinite volte. Inoltre, ponendo f (z) = n=0 an z n , i coefficienti
an sono necessariamente i coefficienti di Taylor di f al centro di sviluppo:
an =

f (n) (z0 )
.
n!

Dimostrazione. La prima asserzione si ottiene applicando iterativamente


il precedente Teorema 1.4.9. Da questa parte dellenunciato il resto segue
derivando successivamente la funzione somma f : per k 6 n,
f

(k)

(z) =

X
n=k

n(n1) (nk+1) an (zz0 )

nk

X
n=k

n!
an (zz0 )nk .
(n k)!

Ponendo z = z0 in questa uguaglianza sopravvive solo il termine con n = k,


da cui lenunciato.

Esempio 1.6.2. (Lo sviluppo in serie dellesponenziale.) Determiniamo


il raggio di convergenza della serie

X
zn
n=0

n!

1.6. SERIE DI TAYLOR


Sia an =

1
:
n!

53

allora

(n + 1)!
|an |
lim
= lim n + 1 = +.
n+
n+ |an+1 | n+
n!
X zn
Quindi la serie converge per ogni valore di z C. La serie
detta
n!
n
R = lim

serie esponenziale. Osserviamo che, se scriviamo f (z) = ez , si ha f (k) (z) =


f (z) = ez qualunque sia k. Pertanto i coecienti di Taylor a z0 = 0 della
funzione esponenziale
proprio n!1 , e quindi, grazie al Corollario 1.6.1,
P valgono
n
si ha che f (z) = n=0 zn! per ogni z; in particolare, restringendo lattenzione
ad una variabile reale, lidentit vale per lesponenziale reale per ogni x R.
Poich si tratta di una serie di potenze, il raggio di convergenza innito ed
in particolare la serie converge uniformemente su ogni compatto.

Definizione 1.6.3. Data una funzione f C in un intorno aperto di z0 ,


P
f (n) (z0 )
(z z0 )n si chiama serie di Taylor di f con
la serie di potenze
n=0
n!
centro di sviluppo in z0 .
In base al Teorema di Taylor (Sezione 1.1) il resto n-simo della serie di
Taylor di f con centro in x0 verica

En (x; x0 ; f ) f (x)

n
X
f ( k)(z0 )
k=0

k!

(z z0 )k =

f (n+1) ()
(x x0 )n+1 (1.15)
(n + 1)!

per qualche [x0 , x]. La serie di Taylor converge al punto x se e solo se


limn En (x; x0 ; f ) = 0, quindi dalluguaglianza (1.15) e dal fatto ovvio che
il fattoriale cresce pi rapidamente dellesponenziale segue:


Corollario 1.6.4. Se esiste una costante C > 0 tale che f (n) (z0 ) 6 C n per
tutti gli interi n, allora la serie di Taylor di f converge al punto x.

Esempio 1.6.5. La serie di Taylor della funzione esponenziale converge ovunque alla funzione esponenziale, perch la derivata di ex vale ancora ex , e
quindi non dipende da n (per una dimostrazione alternativa si usi il prossimo Teorema 1.6.6). Analogamente, le serie di Taylor di sin x e di cos x
convergono ovunque alle stesse funzioni, perch le loro derivate n-sime sono
sempre uguali a cos x o sin x, e quindi maggiorate da 1 in valore assoluto.

54 CAPITOLO 1. PANORAMICA SU CALCOLO ED ANALISI REALE


Enunciamo il seguente criterio di convergenza della serie di Taylor. Per
la dimostrazione, si veda [1, Capitolo 9, Sezione 20].
Teorema 1.6.6. (Criterio di convergenza di Bernstein.) Sia f
C [x0 , x0 + a]. Se f e tutte le sue derivate sono non negative in [x0 , x0 + a],
allora la serie di Taylor di f converge in ogni punto x [x0 , x0 + a).

1.6.2

Funzioni analitiche reali

Definizione 1.6.7. Una funzione che coincide con la somma della sua serie
di Taylor laddove questa converge si dice amalitica reale.
Nota 1.6.8. Se una funzione sviluppabile in serie di Taylor convergente in
un disco con centro z0 , non detto che in questo disco la serie di Taylor
converga alla funzione che lha generata, tranne ovviamente al centro di sviluppo z0 . Ovviamente, se f la somma della serie, allora f C nel disco di
convergenza e la serie la serie di Taylor di f , ma potrebbe esistere unaltra
funzione g 6= f tale che la serie sia la serie di Taylor anche della funzione g. In
altre parole, stiamo asserendo che possono esistere due diverse funzioni C
in un intorno di z0 con le tutte le derivate uguali in z0 , per ciascun ordine.
Dimostriamo questo asserto con un esempio.

Esempio 1.6.9. (Una funzione non analitica reale.) Mostriamo che la


funzione

2
ex
(sex =
6 0)
f (x) =
0
(sex = 0)
di classe C su tutto R, e le sue derivate in 0 sono tutte nulle: quindi la
serie di Taylor di questa funzione coincide con la serie di Taylor della funzione
identicamente 0, ossia la serie nulla.
evidente che f derivabile innite volte in ogni punto x 6= 0, per
il teorema di derivazione di funzione composta (Sezione 1.1); dimostriamo
quindi che in x = 0 tutte le derivate esistono e sono nulle.
Per determinare le derivate nellorigine necessario calcolare esplicitamente lesistenza ed il valore del limite del rapporto incrementale: non
infatti possibile ricorrere alla regola di derivazione delle funzioni composte
(Sezione 1.1) perch nellorigine cambia la regola in base alla quale la funzione
denita.

1.6. SERIE DI TAYLOR

55

Cominciamo con la derivata prima. Il rapporto incrementale in 0


1 1
f (x) f (0)
= e x2
x
x
ed ha limite 0 per x 0 perch il polinomio al denominatore si annulla con
ordine di innitesimo inferiore a quello dellesponenziale.
Calcoliamo allora la derivata seconda in 0. In ogni x 6= 0 la regola di deriva1
zione di funzione composta fornisce il risultato f (x) = x23 e x2 . Pertanto il
1
rapporto incrementale di f in 0 x24 e x2 , che per la stessa ragione di prima
tende a zero per x 0.
1
Per x 6= 0, abbiamo calcolato la derivata prima f (x) = x23 e x2 grazie alla
regola di derivazione del prodotto e quella di funzione composta (Sezione 1.1).
Iterando lapplicazione di questa regola troviamo la derivata seconda per

1
x 6= 0: f (x) = x64 + x46 e x2 . Generalizzando, asseriamo che la derivata
n-sima f (n) , per x 6= 0, data da
 
1
1
(n)
e x2
f (x) = Pn
x
dove Pn un polinomio di grado 3n.
Dimostriamo questa asserzione per induzione su n (Sezione 1.1). Abbiamo
mostrato che lasserzione vera per n = 1 (e anche per n = 2). Supponiamo
che sia vera per un intero n0 e mostriamo che rimane vera per n0 +1. Lipotesi
quindi che
 
1
1
(n0 )
f (x) = Pn0
e x2
x
dove Pn un polinomio di grado 3n0 . Applicando ancora la regola di derivazione del prodotto e quella di funzione composta ora otteniamo

 
 
1
1
1
2
1
(n0 +1)
f
(x) = 2 Pn0
3 Pn 0
e x2 .
x
x
x
x
Poich la derivata Pn 0 un polinomio di grado 3n0 1, il primo termine
dentro la parentesi un polinomio nella variabile x1 di grado 3n0 + 1. Invece
il secondo termine dentro la parentesi un polinomio nella variabile x1 di
grado 3n0 + 3: quindi lintera parentesi un polinomio di grado 3n0 + 3.
Questo prova lasserzione.
Ora nalmente possiamo calcolare la derivata n-sima nellorigine, come limite
del rapporto incrementale. Mostriamo che questa derivata vale zero per ogni

56 CAPITOLO 1. PANORAMICA SU CALCOLO ED ANALISI REALE


n. Procediamo ancora per induzione. Abbiamo gi visto che f (0) = 0.
Supponiamo che f (n) (0) = 0 e mostriamo che allora anche f (n+1) (0) = 0. Il
rapporto incrementale da utilizzare
1
f (n) (x) f (n) (0)
= Pn
x
x

 
1
1
e x2 .
x

In questa rapporto incrementale, il termine che moltiplica lesponenziale


un polinomio nella variabile x1 (di grado 3n + 1, ma il valore del grado ora
inessenziale). Come prima, il limite del prodotto fra polinomio ed esponenziale lo stesso che avremmo se ci fosse solo lesponenziale e non anche il
polinomio, ossia zero. Quindi anche la derivata f (n+1) vale zero nellorigine.

Esempio 1.6.10. (Approssimazione C del gradino.) Abbiamo visto nel


precedente Esempio 1.6.9 che per ogni > 0 la funzione

2
e(x)
(se x 6= 0)
f (x) =
0
(se x = 0)
di classe C su tutto R, e le sue derivate in 0 sono tutte nulle. Abbiamo
studiato nel precedente Esempio il caso = 1, nel quale questa funzione
ha graco assai prossimo allasse x per |x| < 1 ed assai prossimo alla retta
{y = 1} per |x| > 1. Quando cresce il graco si avvicina sempre di pi a
quello della funzione che vale 0 per |x| < 1 e 1 altrimenti.
Allora anche la funzione

0
(se x 6 0)
+
h (x) =
2
e(x)
(se x > 0)
di classe C su tutto R, e le sue derivate in 0 sono tutte nulle, e lo stesso
+
accade per h
(x) = h (x). I graci di queste due funzioni rappresentano
due gradini arrotondati, il primo a livello zero no allorigine e a salire no
al livello asintotico 1 man mano che ci si sposta a destra dellorigine, il
secondo invece a scendere dal livello asintotico 1 (a ) no al livello zero
raggiunto allorigine e poi mantenuto a destra dellorigine. Allaumentare del
parametro positivo i graci si avvicinano sempre di pi ai gradini ideali.
Traslando queste funzioni otteniamo gradini arrotondati centrati in un punto
reale qualsiasi.

1.6. SERIE DI TAYLOR

57

Moltiplicando due tali traslati otteniamo una forma arrotondata dellonda

quadra: ad esempio, la funzione q (x) = h+


(x + 1) h (x 1) ha per graco
un arrotondamento di classe C della funzione caratteristica dellintervallo
[1, 1] (Denizione 1.1.3).

1.6.3

La serie binomiale

Definizione 1.6.11. (Coefficienti binomiali generalizzati.) Cominciamo con lestendere il coeciente


binomiale na al caso di a reale e non so
lamente intero: poniamo na = a (a 1) (a 2) (a n + 1)/n! . Un
elementare argomento per induzione prova lidentit di Tartaglia
  
 

a
a
a+1
.
(1.16)
+
=
n
n1
n
Proposizione 1.6.12. (La serie binomiale.) Per ogni a R, per ogni
x (1, 1), vale lo sviluppo in serie di potenze
a

(1 + x) =

 
X
a
n=0

xn .

(1.17)

Si osservi che, se a un intero positivo, per ogni intero n > a il coefficiente


binomiale si annulla, e quindi la serie una somma finita, e si riottiene il
Teorema del Binomio di Newton (Sezione 1.1).
Dimostrazione. La derivata della funzione f (x) = (1x)a Df (x) = a (1
x)a1 , la derivata seconda D 2 f (x) = a (a 1) (1 x)a2 = a (1 a) (1
x)a2 , e la sua derivata di ordine n D n f (x) = a (1 a) (2 a) (n
1 a) (1 x)an . In particolare, osserviamo due cose: la prima che
 
a
n
n
;
(1.18)
D f (0) = (1) n!
n
la seconda che per a < 0 e x < 1 tutte le derivate di f sono non negative:
quindi grazie al criterio di Bernstein (Teorema 1.6.6) si conclude che la serie
di Taylor di f converge nellintervallo aperto con centro in x0 = 1 e raggio
2. Per il teorema sul cambiamento di centro di sviluppo (Teorema 1.4.7), la
serie di Taylor di f converge quando si ssa come centro il punto x1 = 0 e
raggio 1 (quindi nellintervallo aperto 1 < x < 1). Daltra parte, lo sviluppo

58 CAPITOLO 1. PANORAMICA SU CALCOLO ED ANALISI REALE


di Taylor di f con centro in 0
per a < 0 e x (1, 1) si ha
a

(1 + x) =



X
a
n=0

k=0

D k f (0)
k!

xk , e quindi segue da (1.18) che

n n

(1) x =



X
a
n=0

(x)n .

Da qui, scambiando x con x, si ottiene lidentit (1.17) dellenunciato per


ogni a < 0.
Ora, per 1 < x < 1, integriamo fra 0 e x entrambi i membri dellidentit
(1.17) appena dimostrata, ed otteniamo
  n+1
X
1
a x
1
a+1
(1 + x)

=
,
a+1
a + 1 n=0 n n + 1

da cui
(1 + x)

a+1


 


X
X
a + 1 n+1
a + 1 a n+1
x
x
=1+
=1+
n
+
1
n
n
+
1
n=0
n=0




X
X
a+1 n
a+1 n
x .
x =
=1+
n
n
n=0
n=1

In tal modo abbiamo esteso lidentit (1.17) un passo pi a destra, ossia per
tutti gli a < 1. Iterando il procedimento otteniamo lenunciato per tutti gli
a R.

1.7

Spazi p

Definizione 1.7.1. (Spazi p .) Sia x = {x1 , x2 , . . . , xn , . . . } una successione


di numeri complessi.
Per ogni p > 1 poniamo

kxkp =
Se kxkp < diciamo che x p .

X
j=1

|xj |p

! p1

1.7. SPAZI P

59

Si notino i due importanti casi particolari seguenti:


p=1
kxk1 =

X
j=1

|xj | .

p=2
kxk2 =

X
j=1

|xj |

! 12

Nota 1.7.2. La norma kk2 generata, nel senso della Nota 1.2.23, al prodotto
scalare
n
X
hx, yi =
xi y i .
i=1

Infatti

hx, xi =

n
X

xi xi =

i=1

n
X
i=1

|xi |2 = kxk22 .

Esercizio 1.7.3. A titolo di richiamo, proponiamo al lettore di dimostrare


la convessit della funzione R x 7 |x|p per p > 1. Chi non ci riuscisse
vericando direttamente la denizione di convessit pu trovare in seguito
un approccio alternativo nella dimostrazione del Teorema 1.16.10.

Definizione 1.7.4. (Spazio .)


successione di numeri complessi.
Se p = +, deniamo

Sia x = {x1 , x2 , x3 , . . . , xn , . . . } una

kxk = sup |xj |.


jN

Se kxk < diciamo che x l .


Intendiamo ora presentare le relazioni di inclusione fra gli spazi p . Lapproccio che seguiamo richiede un calcolo che scorporiamo in un lemma separato.

60 CAPITOLO 1. PANORAMICA SU CALCOLO ED ANALISI REALE


Lemma 1.7.5. Se 1 6 p < e a, b > 0,
(a + b)p > ap + bp .
La disuguaglianza stretta per p > 1, mentre una identit per p = 1.
Invece, per 0 < p < 1,
(a + b)p 6 ap + bp .
Dimostrazione. Se p = 1 ovvio che nellenunciato vale luguaglianza.
Supponiamo allora p 6= 1, p > 0. Per t > 0 poniamo
(t) = (a + tb)p ap tp bp .
Allora (0) = 0, e (t) = pb(a + tb)p1 ptp1 bp non si annulla mai per
t > 0, perch per (t) = 0 si avrebbe (a + tb)p1 = tp1 bp1 : ma poich a,
b e t sono positivi questo equivale a a + tb = tb, assurdo. Inoltre (0) =
pbap1 > 0 (questo il passo che viene meno nel caso p < 1 della seconda
parte dellenunciato, dove p < 1 e la funzione t 7 tp1 non tende a zero per
t 0+ ). Perci ha derivata positiva per t > 0, e quindi (1) > (0) = 0.
Poich (1) = (a + b)p ap bp questo dimostra che vale la disuguaglianza
desiderata in senso stretto.
Nel caso 0 < p < 1, di nuovo non si annulla mai in 0 < t 6 1, ma ora
lim (t) = lim+ pb(a + tb)p1 ptp1 bp = pbap1 pbp lim+ tp1 = .

t0+

t0

t0

Quindi < 0 in (0, 1], e rispetto a prima la disuguaglianza si rovescia.

Esercizio 1.7.6. Si mostri che per p > 1 lenunciato del precedente Lemma
1.7.5 un caso particolare della disuguaglianza di Jensen che enunceremo e
dimostraremo nella Proposizione 1.15.10.
Suggerimento: si consideri una funzione su [0, 1] che assume valore costante
a in una met dellintervallo e b nellaltra met.

Proposizione 1.7.7. (Inclusioni fra spazi p .) Se 0 6 p < q 6 , allora


p q .

1.7. SPAZI P

61

Dimostrazione. Lenunciato equivale ad asserire che, per ogni 0 6 p < q,


esiste C = Cp,q > 0 tale che per ogni successione {an } valga la disuguaglianza
k{an }kp > Cp,q k{an }kq .

Proveremo questa disuguaglianza con C = 1, ovvero


(1.19)

k{an }kp > k{an }kq .

Anzitutto proviamo linclusione 1 q . Segue dal Lemma 1.7.5 che per


ogni q > 1, per ogni successione {an } di numeri complessi e per ogni intero
N si ha
!q
N
N
X
X
|an | >
|an |q .
n=1

n=1

Prendendo lestremo superiore rispetto a N otteniamo k{an }k1 > k{an }kq .
Quindi 1 lq .
Ora prendiamo 0 6 p < q. Mostriamo che k{an }kp > k{an }kq , cio che
!1/p
!1/q

X
X
|an |p
|an |q
>
.
n=1

n=1

Poniamo bn = |an | . Allora {bn } appartiene a 1 e lultima disuguaglianza


diventa
!1/p
!1/q

X
X
bn
>
bq/p
,
n
n=1

n=1

cio

X
n=1

bn >

X
n=1

bq/p
n

!p/q

Quindi la disuguaglianza da provare k{bn }k1 > k{bn }kq/p : questa disuguaglianza vera per la prima parte della dimostrazione, dal momento che
q/p > 1.

Esercizio 1.7.8. Si consideri lo spazio bidimensionale V delle successioni


a = {a0 , a1 , 0, 0, . . . } nulle tranne che per i primi due indici. Si verichi
che linclusione della precedente Proposizione 1.7.7, ossia la disuguaglianza
kakq 6 kakq se 0 6 p < q 6 , equivale alla disuguaglianza provata nel
lemma 1.7.5, ed alle inclusioni fra sfere unitarie illustrate nelle Figure della
successiva Nota 1.7.10.

62 CAPITOLO 1. PANORAMICA SU CALCOLO ED ANALISI REALE


Nota 1.7.9. (Completezza di p .) Dimostreremo in seguito (Corollario
1.16.30) che gli spazi p sono spazi metrici completi, per tutti i p > 0 (ma
P
p 1/p
sono spazi normati solo per p > 1, dove la quantit k{xn }kp = (
n=0 |xn | )
verica la disuguaglianza triangolare e quindi una norma; per p < 1, invece,
non cos, ed infatti le sfere unitarie non sono convesse, come vedremo nella
seguente Nota 1.7.10). Per il caso p = 2 una dimostrazione alternativa (ma
di fatto analoga) viene sviluppata nellEsercizio 4.4.3).

Nota 1.7.10. (Sfere unitarie in sottospazi di dimensione finita in p .)


Consideriamo il sottospazio V di p che consiste delle successioni con solo i
primi due valori non nulli (ovviamente isomorfo a C2 ):
x = (x1 , x2 , 0, 0, . . . )
Lo spazio V chiuso rispetto alla somma e alla moltiplicazione per uno scalare, quindi un sottospazio vettoriale di p . Ovviamente V isomorfo a C2 ,
quindi p contiene un sottospazio isomorfo a C2 . Studiamo la forma geometrica della sfera unitaria di questo sottospazio nelle norma p . Consideriamo
il caso di sottospazi di dimensione due solo per semplicit: gli argomenti valgono per qualsiasi dimensione. Sempre per semplicit limitiamo lattenzione
a sottospazi reali, cio a successioni di numeri reali. Sappiamo gi (Denizione 1.2.11) che su uno spazio a dimensione nita tutte le norme sono
equivalenti, e quindi che queste sfere unitarie, a meno di dilatazione, devono
essere inscatolate una nellaltra; di pi, dalla disuguaglianza (1.19) segue che
la sfera unitaria di p allinterno della sfera unitaria di q per p < q.
Determiniamo la forma di queste sfere: in V (
= R2 ) consideriamo la sfera
unitaria nelle norme p per i diversi valori di p.
Caso p = 1: lequazione della circonferenza unitaria
kxk1 = |x1 | + |x2 |.
La sfera (o palla) unitaria
|x1 | + |x2 | 6 1.
Nel primo quadrante abbiamo x1 > 0 e x2 > 0. Quindi
|x1 | + |x2 | 6 1

x1 + x2 6 1

x2 6 1 x1

1.7. SPAZI P

63

Figura 1.3: La parte nel primo quadrante della sfera unitaria di R2 nella norma 1
e perci si ottiene la gura seguente:
Nel secondo quadrante x1 < 0 e x2 > 0, e quindi
|x1 | + |x2 | 6 1

da cui la seguente gura:

x1 + x2 6 1

x2 6 1 + x1

Figura 1.4: La parte nel secondo quadrante della sfera unitaria di R2 nella norma 1
Nel terzo quadrante x1 < 0 e x2 < 0, da cui

64 CAPITOLO 1. PANORAMICA SU CALCOLO ED ANALISI REALE

|x1 | + |x2 | 6 1

x1 x2 6 1

e pertanto la gura la seguente:

x2 6 1 x1

Figura 1.5: La parte nel terzo quadrante della sfera unitaria di R2 nella norma 1
Nel terzo quadrante x1 > 0 e x2 < 0, da cui
|x1 | + |x2 | 6 1

x1 x2 6 1

ed otteniamo la seguente gura:

x2 6 1 + x1

Mettendo insieme i vari quadranti, troviamo che lintera palla unitaria


quella disegnata nella seguente gura:
Caso p = 2: in questo caso lequazione della circonferenza unitaria
diventa
1
kxk2 = |x1 |2 + |x2 |2 2 .
Pertanto la palla unitaria

|x1 |2 + |x2 |2 6 1

x21 + x22 6 1

cio il cerchio unitario di raggio 1 e centro lorigine.

1.7. SPAZI P

65

Figura 1.6: La parte nel quarto quadrante della sfera unitaria di R2 nella norma 1

Figura 1.7: Sfera unitaria di R2 nella norma 1


p = +
kxk = sup |xj | = max {|x1 |, |x2 |} .
j=1,2

In questo caso la palla unitaria


kxk 6 1.

66 CAPITOLO 1. PANORAMICA SU CALCOLO ED ANALISI REALE

Figura 1.8: Sfera unitaria di R2 nella norma 2

Figura 1.9: Sfera unitari di R2 nella norma


Caso 1 < p < 2: la palla unitaria di p contiene la palla unitaria di 1 ed
contenuta in quella di 2 . In eetti, le sfere unitarie si ingrandiscono
al crescere di p: questo fatto una conseguenza della disuguaglianza
1

(|x1 |p + |x2 |p ) p > (|x1 |r + |x2 |r ) r

se p < r. Lasciamo questa disuguaglianza per esercizio. Suggerimento:


un modo tedioso di risolvere lesercizio quello di ssare, diciamo, 0 <
x1 < 1, ricavare x2 come funzione di p dallequazione (|x1 |p + |x2 |p ) =
1 e mostrare che la soluzione positiva per x2 crescente al crescere

1.7. SPAZI P

67

di p (e quella negativa decrescente: cio la soluzione x2 = x2 (p)


tale che |x2 (p)| cresce con p). Un modo pi brillante consiste nelluso
intelligente delle propriet della convessit: si vedano la Sezione 1.15 e
la Proposizione 1.17 nel seguito.

Figura 1.10: Sfere unitarie di R2 nelle norme p per 1 6 p 6 2

Si osservi che la sfera unitaria nella norma 2 rotonda, cio in ogni


punto ha retta tangente ortogonale al raggio che termina in quel punto. Ci
si pu aspettare un fenomeno di questo genere solo per p = 2, perch solo
per questo valore di p la norma proviene da un prodotto scalare, nel senso
introdotto nella Nota (1.2.23). Infatti, lortogonalit denita solo grazie ad
un prodotto scalare.

Nota 1.7.11. Come nella Nota 1.7.10, immergiamo lo spazio euclideo Cn come
sottospazio in p nel modo seguente:
{x1 , x2 , . . . , xn } 7 {x1 , x2 , . . . , xn , 0, 0, . . . } .
Limmagine di questa immersione un sottospazio chiuso di p , e se p = 2
limmersione una isometria. In particolare, non c ambiguit nellaver
usato lo stesso simbolo per la norma euclidea in (1.5) e per la norma di 2
nella Denizione 1.7.1.

68 CAPITOLO 1. PANORAMICA SU CALCOLO ED ANALISI REALE

1.8

Uniforme continuit

I contenuti di questa Sezione dovrebbero essere gi noti dai corsi elementari


di Calcolo: li riportiamo qui per completezza.
Nota 1.8.1. Rammentiamo che una funzione continua se per ogni x nel suo
dominio di denizione e per ogni > 0 esiste > 0, = x, , tale che, per
ogni y nel dominio di denizione che verica |yx| < si ha |f (y)f (x)| < .
Questa denizione equivale a richiedere che il limite di f valga f (x) quando
la variabile tende a x (ovviamente per ogni x tale che il limite abbia senso,
ossia tale che in ogni sfera con centro in x ci sia almeno un altro punto y dove
f denita: un tale punto x si chiama punto di accumulazione del dominio
di f ).

Definizione 1.8.2. (Uniforme continuit.) Una funzione f uniformemente continua se per ogni > 0 esiste = > 0 tale che, per ogni x, y
dove f denita, si abbia |f (y) f (x)| < . Questa denizione si estende a funzioni denite su Rn o Cn semplicemente sostituendo il modulo in
|f (y) f (x)| con la rispettiva norma euclidea introdotta in (1.5).
chiaro che ogni funzione uniformemente continua anche continua. Si noti
che la dierenza fra continuit ed uniforme continuit consiste nel fatto che
per la seconda dipende da ma non da x, ovvero che, per ogni punto di
accumulazione x del dominio, il limite di f il valore f (x) e la velocit di
convergenza uniforme rispetto a x.
La denizione di uniforme continuit, Denizione 1.8.2, si pu riformulare
come segue.
Definizione 1.8.3. (Modulo di continuit.) Data una funzione f su R,
il suo modulo di continuit la funzione = f su R+ data da
(t) = sup{|f (x) f (y)| : |x y| < t} .
Nota 1.8.4. La funzione modulo di continuit chiaramente non decrescente
sulla semiretta positiva. Segue direttamente dalla Denizione 1.8.2 che f
uniformemente continua se e solo se per ogni > 0 esiste > 0 tale che

(t) < se 0 < t < , ossia se e solo se limt0+ (t) = 0.


Esercizio 1.8.5.

(i) La funzione x uniformemente continua.

1.9. MISURA ED INTEGRALE DI LEBESGUE

69

(ii) La funzione x2 uniformemente continua in ogni intervallo limitato,


ma non lo su tutto R.
(iii) La funzione della parte (ii) ha derivata divergente se x tende allinnito, ma la divergenza della derivata non condizione suciente per
la perdita della uniforme continuit: ad esempio, la funzione x
uniformemente continua.
(iv) La funzione tan(x) uniformemente continua in ogni intervallo chiuso
contenuto in ( 2 , 2 ), ma non lo nellintero intervallo aperto ( 2 , 2 );
pi in generale, ogni funzione che ha un asintoto verticale non uniformemente continua in un intervallo aperto che contiene al suo interno o
ad un suo estremo il punto di singolarit.

Teorema 1.8.6. (Heine.) Sia K un compatto (ossia un insieme limitato e


chiuso, grazie al Teorema di BolzanoWeierstrass 1.9.6) in Rn (o Cn ). Ogni
funzione continua su K v anche uniformemente continua.
Dimostrazione. Per assurdo, supponiamo che f sia continua su K ma non
uniformente continua. Questo vuol dire che esiste > 0 tale che per ogni
intero n, esistono punti xn e yn in K con

ma

|xn yn | <

1
n

|f (xn ) f (yn )| > .

(1.20)
(1.21)

Per la propriet di BolzanoWeierstrass illustrata nel Teorema 1.9.6, da ciascuna delle successioni {xn } e {yn } si pu estrarre una sottosuccessione (rispettivamente {xjn } e {yjn }) convergente ad un limite, ed i due limiti coincidono grazie a (1.20). Sia x questo limite comune. Allora, poich f
continua, deve essere limn !f (xjn ) = f (x) = limn f (yjn ). Questo contraddice
(1.21).

1.9

Misura ed integrale di Lebesgue

Lintegrale di Riemann di una funzione f continua, denita in un intervallo [a, b] R si denito partendo da una partizione dellintervallo [a, b] e

70 CAPITOLO 1. PANORAMICA SU CALCOLO ED ANALISI REALE


costruendo le somme inferiori di rettangoloidi inscritti nel sottograco della funzione in esame e le somme superiori dei rettangoloidi circoscritti. Si
dimostrava che, al variare di tutte le possibili partizioni di [a, b] ciascuna somma inferiore minore o uguale di ogni somma superiore, ed esistono somme
superiori e somme inferiori i cui valori sono arbitrariamente vicini.
Si quindi denito lintegrale di f su [a, b],
Z

f (x) dx

come il numero I tale che ogni somma inferiore minore o uguale a I e ogni
somma inferiore maggiore o uguale a I. In altre parole, come lelemento
di separazione delle due classi, ovvero lestremo superiore delle somme inferiori, coincidente con lestremo inferiore delle somme superiori (assioma delle
sezioni di Dedekind: si veda [19, Appendice Capitolo 1]
Vogliamo ora denire un integrale (lintegrale di Lebesgue) per cui sia
possibile integrare funzioni pi generali di quelle integrabili secondo Riemann,
su una classe di insiemi pi ampia (gli insiemi misurabili ).
Per denire lintegrale di Riemann si parte suddividendo in sottointervalli
il dominio in cui denita la funzione f . Invece per denire lintegrale di
Lebesgue costruiamo rettangoloidi basati su partizioni pi complicate. Gli
insiemi che compongono la partizione non sono pi intervalli contigui. In
eetti non sono pi intervalli: persino per una funzione continua, di solito,
ciascun insieme della partizione una unione di intervalli disgiunti. La partizione del dominio di denizione si ottiene partendo da una partizione in
intervalli disgiunti contigui, non nel dominio di denizione , ma nellimmagine di f . In particolare, possiamo prendere intervalli Jk tutti di lunghezza
uguale . Allora, i corrispondenti insiemi Ik della partizione del dominio della
funzione f sono
Ik = {x : f (x) Jk } = f 1 (Jk ) .
Questo metodo si adatta di pi alla funzione e come conseguenza vedremo
che possibile applicarlo a funzioni meno regolari.
Siamo interessati dunque alla misura di insiemi del tipo f 1 ([a, b]).
Non tutti gli insiemi sono adatti ad essere misurati. Noi consideriamo soltanto funzioni tali che f 1 ([a, b]) sia misurabile in un senso appropriato, che
presenteremo pi oltre nella Denizione 1.9.8.

1.9. MISURA ED INTEGRALE DI LEBESGUE

71

Figura 1.11: Partizione delle ordinate per costruire lintegrale di Lebesgue

1.9.1

Insiemi aperti ed insiemi misurabili

Definizione 1.9.1. (Insiemi aperti.) Un sottoinsieme aperto di R un


insieme O tale che, per ogni x O, esiste un intervallo aperto Ix tale che
x Ix O. Per ogni aperto O, il complementare R \ O si chiama un insieme
chiuso.
Nota 1.9.2. facile vedere che un insieme K chiuso in R se e solo se per
ogni successione di elementi di K che converge ad un limite in R, il limite
appartiene anchesso a K.

Vale il seguente risultato elementare, che non dimostriamo (per la parte


(i) si veda [22, Cap. 2, Sezione 5, Proposizione 8], per la parte (ii) [22, Cap. 2,
Sezione 5, Proposizione 15 e Cap. 7, Sezione 7, Corollario 23]).
Lemma 1.9.3. (i) Ogni insieme aperto in R unione di una famiglia
numerabile di intervalli aperti disgiunti.
(ii) (Heine-Borel.) Un insieme C R limitato e chiuso se e solo se,
per ogni famiglia O di aperti (indicizzati da un indice non necessariamente intero) tale che C O , esiste una sottofamiglia finita
O1 , . . . , On tale che C nj=1 Oj .

72 CAPITOLO 1. PANORAMICA SU CALCOLO ED ANALISI REALE


Definizione 1.9.4. (Insiemi compatti.) Una famiglia O come nel Lemma 1.9.3 (ii) si chiama un ricoprimento aperto di C. La sottofamiglia
O1 , . . . , On si chiama un sottoricoprimento finito. Un insieme C tale cha
da ogni suo ricoprimento aperto si pu estrarre un sottoricoprimento nito
si chiama un insieme compatto.
Nota 1.9.5. Alla luce della precedente Denizione 1.9.4, il Lemma 1.9.3 (ii)
asserisce che i sottoinsiemi di R limitati e chiusi sono compatti: questo fatto
alla base del Teorema di Weierstrass sulla esistenza dei massimi e dei minimi
delle funzioni continue su un intervallo limitato e chiuso (si veda [19, Cap. 16
(Appendice)]).

Dimostriamo una propriet dei compatti che in realt una loro caratterizzazione, e che vale, con opportune varianti e con una dimostrazione diversa, per compatti non solo in Rn ma in qualsiasi spazio metrico [22, Cap. 7,
Sezione 7]) o topologico [22, Cap. 9, Sezione 2, Proposizione 7]).
Teorema 1.9.6. (Bolzano - Weierstrass.) Sia K un compatto in Rn .
Allora da ogni successione {xj } a valori in K si pu estrarre una sottosuccessione convergente ad un punto limite x K; equivalentemente, ogni
successione in K ha un punto di accumulazione.
Dimostrazione. Se la successione nita (ossia consiste di un numero nito di
punti ripetuti) il risultato ovvio, quindi assumiamo che sia innita. Poich
K limitato, racchiuso in un cubo, di lato, diciamo A. Procediamo per
bisezioni successive: dividiamo a met ogni lato del cubo, generando quindi
!!2n sottocubi di lato A2 . Poich la successione innita, ad almeno uno di tali
sottocubi devono appartenere inniti punti della successione. Consideriamo
la sottosuccessione costituita da questi punti, che giacciono in un cubo di lato
A
, ed iteriamo il procedimento di bisezione. Continuando cos selezioniamo,
2
per ogni intero m, una sottosuccessione innita di {xj } che giace in un cubo
Ck di lato 2Ak . Sia xjk il primo punto della successione {xj } che giace in Ck :
allora la sottosuccessione xjk di Cauchy, e quindi convergente ad un punto
x Rn . Poich K chiuso, x deve appartenere a K.
Per provare lequivalenza di questa propriet con lesistenza di punti di
accumulazione, osserviamo per prima cosa che chiaro che x un punto di
accumulazione di {xj }. Viceversa, se un punto x di accumulazione per una
successione {xj }, allora per ogni intero m ci deve essere un indice jm tale che

xjm disti da x meno di m1 , e la sottosuccessione xjm converge a x.

1.9. MISURA ED INTEGRALE DI LEBESGUE

73

Nota 1.9.7. (Propriet dellintersezione finita.) Nel corso della dimostrazione del precedente Teorema 1.9.6 abbiamo provato che la successione
di sottocubi ottenuta tramite bisezioni successive si stringe ad un punto, nel
senso che lintersezione innita dei sottocubi inscatolati Ck non vuota (e
consiste, ovviamente, di un unico punto). Pi in generale, si ha una ulteriore
caratterizzazione della compattezza, chiamata la propriet dellintersezione
finita: un insieme K compatto se ogni famiglia di suoi sottoinsiemi C
tale che per qualunque famiglia nita di indici 1 , . . . , n lintersezione nita
j=1,..., n Cj non vuota ha la propriet che lintersezione totale C non
vuota.

Ora introduciamo famiglie di sottoinsiemi di R su cui denire il concetto


di integrale:
Definizione 1.9.8. (Insiemi misurabili e -algebre.) Sia V una famiglia
di sottoinsiemi di R (questa denizione vale pi in generale per qualsiasi
spazio ambiente X al posto di R). Estendiamo V ad una famiglia M di
sottoinsiemi di R che soddisfa le seguenti propriet:
1. R M, ed ogni elemento di V appartiene a M
2. se A M, allora R \ A M (vogliamo poter integrare nel complemento!)
S
3. se Am M allora !!
m=1 Am M (vogliamo poter integrare un
insieme tramite esaustione!)
Allora la famiglia M di insiemi si chiama la famiglia (o -algebra) degli
insiemi misurabili in R generata da V .
Veniamo ora alla denizione centrale di questa sottosezione: quella di
insiemi misurabili secondo Lebesgue. Una denizione alternativa, che segue
una costruzione dovuta a Caratheodory, presentata nellAppendice 1.30.
Definizione 1.9.9. (-algebra di Borel: insiemi misurabili secondo
Lebesgue.) La -algebra M generata dagli aperti si chiama famiglia (o
-algebra) di Borel, ma in questo libro, dove consideriamo raramente misure
diverse da quella di Lebesgue, indicheremo sempre questi insiemi come gli
insiemi misurabili (secondo Lebesgue).

74 CAPITOLO 1. PANORAMICA SU CALCOLO ED ANALISI REALE


Nota 1.9.10. Ovviamente tutti gli aperti sono misurabili secondo Lebesgue.
Passando ai complementari, tutti i chiusi sono misurabili secondo Lebesgue.
Per gli insiemi misurabili formano una famiglia molto pi vasta degli aperti
e dei chiusi: costruire insiemi non misurabili non un obiettivo elementare
(si veda [22, Chapter 3, Sect. 4]).
invece facile mostrare che per ogni insieme A misurabile secondo Lebesgue
e non vuoto esistono compatti K A ed aperti V A non vuoti. Questo
vero in R, in Rn e pi in generale in qualunque spazio topologico che verica
la seguente propriet di separazione di Hausdorff : dati due punti, esistono un intorno aperto del primo ed un intorno aperto del secondo disgiunti
(esercizio).

Definizione 1.9.11. (Misure di Borel e misure regolari.) Sia M la


-algebra degli insiemi misurabili secondo Lebesgue. Una misura (o pi
precisamente una misura di Borel ) positiva una funzione m : M [0, ]
(possono esistere insiemi di misura innita!) che sia numerabilmente additiva,
ossia tale che se {An } una famiglia numerabile di sottoinsiemi a due a due
disgiunti di M, allora
!

[
X
m
An =
m(An ) .
(1.22)
n=1

n=1

Se i valori di m sono reali ma non positivi, m si chiama una misura (non


positiva). In maniera analoga si denisce una misura complessa m : M
C , o una misura complessa finita m : M C.
Una misura di Borel si dice regolare se per ogni insieme misurabile E e per
ogni > 0 esistono un insieme compatto K ed un insieme aperto V tali che
K E V (si veda la precedente Nota 1.9.10) e (V \ K) < : in altre
parole, se ogni boreliano pu essere invaso da compatti e contornato da aperti
in maniera esaustiva nel senso della misura.
Tutte le misure in questo libro sono tacitamente assunte regolari e nite,
nel senso che nello spazio X dove la misura denita esiste una successione numerabile di di sottoinsiemi misurabili Xn di misura nita tali che
n Xn = X.
Si dice che una misura non ha atomi se ogni insieme di misura positiva
contiene un sottoinsieme di misura strettamente inferiore ma ancora positiva.
Corollario 1.9.12. Sia m una misura positiva e consideriamo una famiglia
decrescente di insiemi misurabili {En , n = 1, 2, . . . } (cio tale che En+1 En
per ogni n), con m(E1 ) < . Allora m (
n=1 En ) = limn m (En ).

1.9. MISURA ED INTEGRALE DI LEBESGUE

75

Dimostrazione. Osserviamo anzitutto che la positivit della misura e la condizione di decrescenza, En+1 En per tutti gli n, assicurano che {m (En )}
sia una successione monotna non crescente di numeri non negativi: pertanto esiste il limite limn m (En ) (Sezione 1.1). In generale questo limite pu
essere nito o innito, ma nel nostro caso, poich abbiamo fatto lipotesi che
! la misura di E1 sia nita, il limite anchesso nito.
Poniamo E =
n e Fn = En \ En+1 . Allora E e gli Fn sono insiemi
n=1 ES
disgiunti e E1 = E
n=1 Fn . Da (1.22) si ha
m (E1 ) = m(E) +

m (Fn ) .

(1.23)

n=1

Daltra parte, anche En = En+1 (En \ En+1 ) = En+1 Fn una decomposizione disgiunta, e quindi, di nuovo, m (Fn ) = m (En ) m (En+1 ). Perci
possiamo riscrivere (1.23) cos:

m (E1 ) = m(E) +

X
n=1

= m(E) + lim

m (En \ En+1 )

k1
X
n=1

m (En \ En+1 )

= m(E) + m (E1 ) lim m (Ek ) .


k

Poich abbiamo supposto che m(E1 ) sia nito, possiamo semplicsrlo ad


entrambi i membri, de cos otteniamo il risultato.

Esercizio 1.9.13. Si costruisca un esempio che mostri che lenunciato del Corollario 1.9.12 non vale nel caso in cui la misura sia innita. Ad esempio, si
consideri R munito della misura di Lebesgue, che verr denita nella successiva Denizione 1.9.20, ma che possiamo anticipare dicendo che la misura di
Lebesgue di un intervallo la sua lunghezza, e quindi la misura di Lebesgue di
tutto
seguente successione di insiemi:
Sla
S R innita. Si prenda
S E0 = R, E1 1=

1
[2n,
2n
+
[2n,
2n
+
1],
E
=
],
.
.
.
,
E
=
2
k
n=
n=
n= [2n, 2n + n ].
2
Allora tutti gli insiemi Ek hanno misura innita, ma la loro intersezione consiste dellinsieme numerabile Z, che ha misura zero.

76 CAPITOLO 1. PANORAMICA SU CALCOLO ED ANALISI REALE


Nota 1.9.14. chiaro dalle Denizioni 1.9.11 e 1.9.8 che ogni misura univocamente determinata dai suoi valori su una famiglia di generatori della
-algebra su cui denita. Questo vale non solo per le misure di Borel,
ma pi in generale per algebre e misure denite in un qualsiasi spazio
ambiente X, nel senso della Denizione 1.9.8.

Definizione 1.9.15. Se E un insieme misurabile, E si dice di misura nulla


se m(E) = 0.
Definizione 1.9.16. Una propriet si dice vericata quasi ovunque (q.o.) se
linsieme su cui non vericata di misura nulla.
Esempio 1.9.17. Due funzioni f : S R e g : S R sono uguali q.o. se
m({x S : f (x) 6= g(x)}) = 0

Dalla additivit numerabile della misura segue:


Corollario 1.9.18. Se {Fn }S una famiglia numerabile di sottoinsiemi di R
tutti di misura nulla, allora n Fn ha misura nulla.
Ancora grazie alla additivit numerabile, dal Lemma 1.9.3 (i) segue immediatamente:

Corollario 1.9.19. Una misura univocamente determinata dai suoi valori


sugli intervalli aperti (o equivalentemente, passando ai complementari, sugli
intervalli chiusi).
Definizione 1.9.20. (Misura di Lebesgue.) La misura m denita su ogni
intervallo aperto (a, b) da
m(a, b) = |b a|
si chiama la misura di Lebesgue su R. Perch questa denizione sia compatibile con la Denizione 1.9.11 di misura di Borel, occorre mostrare che la
misura di Lebesgue numerabilmente additiva: questa dimostrazione viene
posposta allAppendice (Proposizione 1.30.15).

1.9. MISURA ED INTEGRALE DI LEBESGUE

77

Nota 1.9.21. Per futuro riferimento, osserviamo che la denizione di misura,


ed in particolare di misura di Lebesgue, si generalizza immediatamente allo
spazio vettoriale ndimensionale Rn , con coordinate x1 , . . . xn . Basta sostituire gli intervalli aperti con i rettangoli (multidimensionali) {a1 < x1 < b1 ,
a2 < x2 < b2 , . . . , an < xn < bn }: su un tale rettangolo, la misura di
Lebesgue vale |(b1 a1 )(b2 a2 ) . . . (bn an )|.

Esempio 1.9.22. (Una misura di Borel puramente atomica: la misura


che conta.) Si prenda come spazio ambiente non R ma un qualsiasi insieme
numerabile X, ad esempio gli interi Z o gli interi positivi N (ma anche i
razionali Q). Come generatori di una -algebra scegliamo i singoli punti, cio
gli insiemi costituiti da un punto solo (che spesso si chiamano singletons).
A ciascun singleton diamo misura 1. La misura denita su di essi si estende
in maniera unica alla -algebra che essi generano, come osservato nella Nota
1.9.14. chiaro che questa -algebra consiste di tutti i sottoinsiemi di X (X
numerabile, e quindi ogni suo sottoinsieme unione numerabile di singoli
punti!), e che la misura m cos ottenuta quella che su ogni sottoinsieme
U di X ha per valore il numero di punti di U (la sua cardinalit). Questa
misura m si chiama la misura che conta (counting measure).

Esempio 1.9.23. Un punto, o un insieme nito o numerabile, ha misura nulla,


grazie a (1.22). Se ad un insieme misurabile aggiungiamo o eliminiamo un
insieme di misura nulla la misura di Lebesgue non cambia.
In particolare, il campo Q dei numeri razionali un sottoinsieme di R di
misura nulla, dato che un insieme numerabile (Sezione 1.1).


Esercizio 1.9.24. Si provi che il sottoinsieme E R dato da E = +
n=0 En \
Q, dove


1
1
1
1

,
+
,
En =
10n 10n+1 10n 10n+1
misurabile secondo Lebesgue, e se ne calcoli la misura.
Svolgimento. Osserviamo dapprima che gli insiemi En sono disgiunti: questo
segue immediatamente dalla disuguaglianza
1
1
1
1
+ n+2 < n n+1 ,
n+1
10
10
10
10
che vale per ogni n perch equivale a 1/10 1/100 < 1 1/10, banalmente
vera. Perci dalla numerabile additivit della misura (Denizione 1.9.11) (e

78 CAPITOLO 1. PANORAMICA SU CALCOLO ED ANALISI REALE


dallinvarianza per traslazione della misura di Lebesgue) segue



X
X
X
1
2
1
1
= .
m (n En ) =
m(En ) =
m n+1 , n+1 = 2
n
10
10
10
9
n=1
n=0
n=0

Poich linsieme E dierisce da questa unione solo per un insieme di misura


nulla (contenuto in Q), la misura di E (ossia la dierenza delle misure) la
stessa.

Definizione 1.9.25. (Misure assolutamente continue e misure singolari.) Una misura reale o complessa m1 si dice assolutamente continua
rispetto ad unaltra misura m2 denita sulla stessa -algebra (ad esempio
quella di Borel, a cui restringeremo lattenzione nel seguito) se per ogni insieme misurabile E tale che m2 (E) = 0 anche m1 (E) = 0.
Si dice che una misura m ha supporto in un insieme misurabile S se m(E) =
m(E S) per ogni insieme misurabile E, o, equivalentemente (esercizio), se
m(E) = 0 per ogni insieme misurabile E disgiunto da S.
Si dice che due misure m1 e m2 sono mutuamente singolari se esistono due
insiemi disgiunti S1 e S2 tali che mi ha supporto in Si , i = 1, 2..
Notazione
la notazione
R 1.9.26. Useremo spesso nel resto di questa Sezione
R
(E) = E d, e pi in generale anticipiamo la notazione E f d ed alcune
propriet ovvie dellintegrale rispetto ad una misura di Borel: per la denizione esplicita di integrale rispetto ad una misura di Borel rinviamo il lettore
alla successiva sottosezione 1.9.4 (dove lattenzione si limita alla misura di
Lebesgue, ma la costruzione vale in generale).
Il prossimo enunciato, che non dimostriamo, un risultato classico sulla
teoria della misura. Si veda [22, Cap. 11, Sezione 6, Teorema 23], o [23,
Teorema 6.9].
Teorema 1.9.27. (RadonNikodym.)
(i) Siano m1 e m2 due misure su R (rispetto alla stessa -algebra, ad
esempio due misure di Borel) con la propriet che m1 assolutamente
continua rispetto a m2 , nel senso della precedente Definizione 1.9.25.
Allora esiste una funzione misurabile g con integrale finito rospetto a
m2 tale che, per ogni insieme misurabile W , si ha
Z
Z
m1 (W ) =
g(t) dm2(t)
g(t) W (t) dm2 (t)
W

1.9. MISURA ED INTEGRALE DI LEBESGUE

79

dove W la funzione caratteristica di W (Definizione 1.1.3). Se le


due misure sono positive, allora g una funzione positiva.
Ovviamente vale anche limplicazione inversa.
(ii) Se invece m1 non assolutamente continua rispetto a m2 , allora esistono e sono uniche una misura ms singolare rispetto a m2 ed una
funzione g di integrale finito rispetto a m2 tali che, per ogni insieme
misurabile E
Z
m1 (E) = ms (E) +
g(t) dm2(t) .
E

(iii) Scrivendo f1 (x) = m1 (, x) e fs (x) = ms (, x), abbiamo f1 = g e


fs = 0 quasi ovunque.
Definizione 1.9.28. La funzione misurabile g del precedente Teorema 1.9.27
si chiama la derivata di RadonNykodim di m1 rispetto a m2 , e si scrive
g=

dm1
.
dm2

Definizione 1.9.29. Sia una misura reale su R o Rn assolutamente continua rispetto alla misura di Lebesgue m (la quale, per Rn , verr denita
in seguito nella Denizione 1.9.29), con derivata di RadonNykodim g (nel
senso della precedente Denizione 1.9.28). Consideriamo le due misure positive + e assolutamente continue rispetto alla misura di Lebesgue le cui
derivate di RadonNykodim sono, rispettivamente, d+ /dm = max{g, 0} e
d /dm = min{g, 0}. Allora, ovviamente, si ha = + . Deniamo variazione totale della misura la misura || (assolutamente continua
rispetto a m) data da || = + + .
Se una misura complessa assolutamente continua rispetto a m, allora
spezziamo come la combinazione lineare di due misure reali, = Re +
i Im , e deniamo la variazione totale di come || = | Re | + | Im |.
Si introduce una norma sulle misure nite su Rn nel modo seguente:
kk = ||(Rn) .
Una misura di norma nita si dice una misura finita.
Nota 1.9.30. facile vericare che, se m2 una misura reale nita e m1
assolutamente continua Rrispetto a mR2 , allora g = dm1 /dm2 appartiene
a L1 (m2 ) e kgkL1 (m2 ) = |g|dm2 6 |g| d|m2| = km1 k. Ovviamente si

80 CAPITOLO 1. PANORAMICA SU CALCOLO ED ANALISI REALE


ha luguaglianza se m2 una misura positiva: in tal caso d|m1 |/dm2 =
|g|. Lasciamo al lettore il compito di stabilire le corrispondenti relazioni per
misure complesse.

Dalla precedente Nota segue subito questo risultato:

Corollario 1.9.31. Se una misura complessa su Rn , allora per ogni


f L1 () e per ogni insieme misurabile W ,
Z
Z



6
|f | d|| .
f
d


W

Notiamo anche la seguente generalizzazione ovvia del teorema classico


della media integrale (Sezione 1.1):

Proposizione 1.9.32. Se una misura di Borel positiva finita e f una


funzione limitata su un insieme misurabile E, allora
Z
(E) min f 6
f d 6 (E) max f .
E

In
R particolare, se E connesso e f continua, allora esiste E tale che
f d = (E) f () (questultima asserzione segue dalla precedente grazie al
E
teorema dei valori intermedi per le funzioni continue sui connessi, Sezione
1.1).
Chiudiamo questa sottosezione con un altro risultato elementare sugli insiemi misurabili secondo Lebesgue, che non dimostriamo (si veda [22, Cap. 2,
Sezione 3, Proposizione 15 (ii)]). In combinazione con il Lemma 1.9.3 (i), il
prossimo lemma prova in maniera precisa un enunciato suggestivo ma vago
che asserisce che ogni insieme misurabile approssimativamente una unione numerabile di intervalli. In realt si pu provare in maniera precisa un
enunciato pi forte, che si chiama il primo principio di Littlewood, e che in
maniera vaga si enuncia dicendo che ogni insieme misurabile approssimativamente una unione nita di intervalli [22, Cap. 2, Sezione 3, Proposizione
15 (vi)].
Lemma 1.9.33. Per ogni insieme E R misurabile secondo Lebesgue e
per ogni > 0 esiste un aperto O E tale che la misura di Lebesgue del
complemento O \ E verifica la disuguaglianza m(O \ E) < , ed un chiuso
C E tale che m(E \ C) < . In particolare, la misura di Lebesgue una
misura di Borel regolare nel senso della Definizione 1.9.11. Se m(E) <
si pu trovare un tale C limitato (cio compatto). Inoltre, esiste una unione
nita A di intervalli aperti tale che m({A \ E} {E \ A}) < .

1.9. MISURA ED INTEGRALE DI LEBESGUE

1.9.2

81

Relazione tra insiemi misurabili ed integrabilit


secondo Riemann

Definizione 1.9.34. Sia f denita in un intorno di un punto x e tale che


Z
1 x+r
|f (t) f (x)| dt = 0 ,
lim
r0+ 2r xr

ossia che la variazione di f tenda a zero allavvicinarsi a x. Un punto x con


questa propriet si chiama un punto di Lebesgue di f .
Nota 1.9.35. Il valore f (x0 ) che rende x0 un punto di Lebesgue di f , se esiste,
univocamente determinato. Infatti, supponiamo che, se si sceglie
f (x0 ) =
R x+r
y0 , il punto x0 risulti un punto di Lebesgue, ossia limr0+ 1/(2r) xr |y0
f (t)| dt = 0. Mostriamo che, se invece si assegna f (x0 ) = y1 6= y0 , il punto
x0 smette di essere un punto di Lebesgue di f . Infatti, dalla disuguaglianza
triangolare |y1 f (t)| > ||y1 y0 | |y0 f (t)||, segue
Z x+r
Z x+r
1
1
|y1 f (t)| dt >
||y1 y0 | |y0 f (t)|| dt
2r xr
2r xr
Z


1 x+r

>
(|y

y
|

|y

f
(t)|)
dt
1
0
0

2r xr


Z x+r


1
|y0 f (t)| dt
= |y1 y0 |
2r xr
e per r 0 il secondo membro tende a |y1 y0 | > 0.

Esercizio 1.9.36. Ogni punto di continuit di una funzione f anche un punto


di Lebesgue di f .

Teorema 1.9.37. (Lebesgue.) Le funzioni integrabili secondo Riemann sono le funzioni continue quasi ovunque. Se una funzione integrabile secondo
Lebesgue, allora misurabile (si veda la Definizione 1.9.39 subito oltre) e quasi ogni x un punto di Lebesgue di f nel senso della precedente Definizione
1.9.34.
Esempio 1.9.38. La funzione che vale 1 su Q e 0 altrimenti non integrabile
secondo Riemann.

La classe di funzioni integrabili secondo Lebesgue pi ampia. Deniamo


quindi le funzioni misurabili.

82 CAPITOLO 1. PANORAMICA SU CALCOLO ED ANALISI REALE

1.9.3

Funzioni misurabili secondo Lebesgue

Definizione 1.9.39. (Funzioni misurabili.) Una funzione f : S R si


dice misurabile (rispetto ad una misura assegnata, che in questa Sezione si
sottintende essere la misura di Lebesgue) se gli insiemi f 1 (a, b), f 1 (a, +)
e f 1 (, b) sono misurabili, per ogni !a, b R.
Nota 1.9.40. Dal fatto che il complemento, lintersezione nita e lunione
numerabile di insiemi misurabili sono misurabili segue che, se f 1 (a, +)
misurabile per ogni a, lo sono anche f 1 [a, +), f 1 (, b), f 1 (, b] e
f 1 (a, b), per ogni b: quindi nella denizione di funzione misurabile basta
richiedere una qualsiasi di queste condizioni.

Esercizio 1.9.41. Se f e g sono funzioni misurabili, allora le loro combinazioni


lineari sono misurabili, e le funzioni max{f, g} e min{f, g} sono misurabili.
Se E1 ed E2 sono due insiemi disgiunti e f1 una funzione misurabile denita
su E1 ed f2 una funzione misurabile denita su E2 , allora la funzione f
denita su E1 E2 dallincollamento di f1 e f2 , ossia f (x) = f1 (x) se x E1
e f (x) = f2 (x) se x E2 , anchessa misurabile.
Se fn sono misurabili, allora f (x) = limn fn (x), g(x) = supn fn (x) e h(x) =
inf n fn (x) sono anchesse misurabili.

Cominciamo con il denire lintegrale di Lebesgue per una classe di funzioni misurabili elementari.

1.9.4

Costruzione dellintegrale di Lebesgue

Definizione 1.9.42. (Funzioni semplici.) Sia {An , n = 1, 2, . . . , N} una


successione nita di insiemi misurabili disgiunti tali che N
n=1 An = R, n la
funzione caratteristica P
di An (Denizione 1.1.3) e {cn C, n = 1, 2, . . . , N}.
Allora la funzione = N
n=1 cn n si chiama funzione semplice.
Nota 1.9.43. Se E un insieme misurabile allora la sua funzione caratteristica
E una funzione misurabile.
Infatti, se 1 (a, b), allora linsieme controimmagine 1
E (a, b) = E misurabile. Se 0 (a, b) allora 1
(a,
b)
=
R
\
E

misurabile.
Se inne 0
/ (a, b)
E
1
e1
/ (a, b), allora E (a, b) = misurabile.
Quindi 1
E (a, b) un insieme misurabile per tutti gli a, b R, e quindi E
misurabile in virt della Denizione 1.9.39.

1.9. MISURA ED INTEGRALE DI LEBESGUE

83

Pertanto tutte le funzioni semplici sono misurabili. Ovviamente esse sono


anche limitate, perch assumono un numero nito di valori.

Deniamo lintegrale di Lebesgue di una funzione semplice su un insieme


misurabile.
Definizione 1.9.44. Sia E un insieme misurabile e sia s la funzione semplice
s(x) =

n
X

j Aj (x).

j=1

Se m una misura, si denisce integrale di s su E rispetto a m la quantit


Z
n
X
j m(Aj E).
s(x) dx =
E

j=1

Generalmente limiteremo lattenzione al caso della misura di Lebesgue, e


chiameremo lintegrale cos denito integrale di Lebesgue di funzioni semplici.
Si osservi che, nel caso particolare in cui Aj = [aj , bj ) siano intervalli tutti
contenuti in E, si ottiene
Z
n
X
s(x) dx =
j |bj aj |
E

j=1

e quindi, per queste particolari funzioni, che nel seguito chiameremo funzioni
a gradini (Denizione 1.18.1)), lintegrale di Lebesgue coincide con quello di
Riemann.
Esercizio 1.9.45. Sia s(x) = [0, 1 ] + 3[ 1 , 3 ] 2[ 3 ,1] . Allora lintegrale di
2
2 4
4
Lebesgue di s vale 43 .

A partire dallintegrale delle funzioni semplici si denisce lintegrale di


Lebesgue delle funzioni misurabili. Per fare ci abbiamo bisogno del seguente
Teorema 1.9.46. Sia f una funzione misurabile non negativa. Allora esiste
una successione {sn } di funzioni semplici tali che
1. 0 6 s1 6 s2 6 6 f
2. sn (x) f (x) per n per ogni x.

84 CAPITOLO 1. PANORAMICA SU CALCOLO ED ANALISI REALE


Quindi
Definizione 1.9.47. (Integrale di Lebesgue.) Se f una funzione misurabile non negativa ed E un insieme misurabile, lintegrale di f su E
denito da
Z
Z
f (x) dx = sup s(x) dx
E

dove dx denota la misura di Lebesgue, e lestremo superiore preso su tutte


le funzioni semplici tali che 0 6 s 6 f .
In questo modo abbiamo denito lintegrale di Lebesgue di una funzione
misurabile non negativa. Estendiamo la denizione al caso di funzioni a valori
reali o complessi.
Se f una qualsiasi funzione misurabile reale scriviamo f = f+ f con
f+ = max {f, 0} e f = min {f, 0}. Quindi f+ e f sono positive o nulle.
Se f misurabile complessa scriviamo f = (u+ u ) + i(v+ v ), e quindi
lintegrale di Lebesgue di f su un insieme misurabile E denito come la
seguente combinazione lineare dei corrispondenti integrali dei termini non
negativi costituenti:
Z
Z
Z
Z
Z
f (x) dx =
u+ (x) dx
u (x) dx + i v+ (x) dx i v (x) dx .
E

Una denizione analoga si pone per ogni misura m, e stabilisce la nozione


di integrale rispetto a questa misura. La misura che utilizziamo comunemente
in questo libro quella che su ogni intervallo nito in R ha per valore la sua
lunghezza: ma ad esempio, se si considera la misura che conta m introdotta
nellEsempio 1.9.22, lo spazio Lp si identica con lo spazio p della Denizione
1.7.1, i cui elementi sono successioni (esercizio.)
Nota 1.9.48. (Paragone fra gli integrali di Lebesgue e di Riemann.)
Abbiamo gi osservato che, per le funzioni a gradini (Denizione 1.18.1), che
sono un caso particolare delle funzioni semplici, lintegrale di Lebesgue coincide con lusuale integrale di Riemann (si veda la Denizione 1.9.44). Poich
questultimo, per funzioni f > 0 pi generali, denito come lestremo superiore delle funzioni a gradini minoranti f , segue che lintegrale di Lebesgue
coincide con quello di Riemann per tutte le funzioni integrabili secondo Riemann, non negative e a supporto compatto (le funzioni a gradini sono nulle
al di fuori di un intervallo limitato). Se invece f a valori reali ma di segno
non costante, la scindiamo come somma delle sue parti positiva e negativa

1.9. MISURA ED INTEGRALE DI LEBESGUE

85

come abbiamo fatto nella costruzione dellintegrale di Lebesgue (Denizione


1.9.47). In tal modo vediamo subito che, se f a supporto compatto ed
integrabile secondo Riemann, di nuovo lintegrale di Lebesgue coincide con
quello di Riemann. Se invece E = supp f non compatto, allora lintegrale
di Riemann costruito diversamente, come integrale improprio, cio come
limite di integrali di troncamenti di f a intervalli limitati via via pi grandi
che invadono E. In questo caso pu succedere che f sia misurabile ed integrabile secondo Riemann, ma non nel senso di Lebesgue. Infatti, per essere
integrabile secondo Lebesgue, come abbiamo visto nella costruzione, devono essere separatamente integrabili la sua parte positiva e negativa. Quando
questo non succede, pu pero accadere che le oscillazioni di segno producano
cancellazioni di aree fra intervalli consecutivi tali da rendere nito lintegrale
improprio di Riemann. Vedremo nel Lemma 5.19.3 che questo il caso per
la funzione f (x) = sinx x , x > 0, che invece non integrabile secondo Lebesgue
perch le sue parti positive e negative decrescono in media con la velocit
di 1/x, e quindi il loro integrale non nito (Sezione 1.1). Per funzioni non
negative queste compensazioni dovute ai segni non ci sono, ed allora se esiste
lintegrale di Riemann, proprio od improprio, esso coincide con lintegrale di
Lebesgue (ma potrebbe esistere lintegrale di Lebesgue senza che esista quello di Riemann: ad esempio la funzione caratteristica dellinsieme dei numeri
razionali ha integrale 0 secondo Lebesgue si vedano gli Esempi 1.9.23 e
1.9.49 ma lasciamo al lettore la facile verica che essa non integrabile
secondo Riemann).
Osserviamo a questo proposito che, a dierenza dalle funzioni a gradini,
le funzioni semplici, pur avendo un numero nito di valori, non hanno necessariamente supporto compatto (i valori sono costanti su insiemi misurabili
non necessariamente limitati, si veda la Denizione 1.9.42). Pertanto non si
denisce un integrale improprio nel senso di Lebesgue: la costruzione dellintegrale di Lebesgue di una funzione la stessa sia che il suo supporto sia
limitato, sia che sia illimitato.

Esempio 1.9.49. Segue dallEsempio 1.9.23 che, se i valori di f vengono cambiati in un insieme nito di punti, o pi in generale in un insieme di misura
nulla, lintegrale di Lebesgue di f non cambia.

Esercizio 1.9.50. Rivedere lEsecizio 1.9.24 e mostrare che la funzione caratteristica dellinsieme E ivi denito (denita nella Denizione 1.1.3) ha
integrale di Lebesgue 29 (ovviamente: uguale alla misura di Lebesgue di E),

86 CAPITOLO 1. PANORAMICA SU CALCOLO ED ANALISI REALE


ma non integrabile secondo Riemann (basta mostrare che su ogni En la pi
piccola funzione a gradini maggiorante di 1 e la pi grande 0).

Proposizione 1.9.51. Sia {fn : R C, n = 1, 2, . . . } una successione di


funzioni misurabili secondo Lebesgue. Se esiste quasi ovunque il limite f (x) =
limn fn (x), o, nel caso le funzioni fn siano a valori reali, lestremo superiore f (x) = supn fn (x) (oppure lestremo inferiore f (x) = inf n fn (x)), allora
la funzione f misurabile secondo Lebesgue.
Dimostriamo ora tre teoremi, fra loro equivalenti, di fondamentale importanza per il passaggio al limite sotto il segno di integrale. Enunciamo
questi teoremi per lintegrale di Lebesgue, ma le dimostrazioni sono le stesse
per integrali rispetto a qualsiasi misura positiva denita su una -algebra di
insiemi, non necessariamente di Borel e non necessariamente in R.
Teorema 1.9.52. (Lemma di Fatou.) Sia E R un sottoinsieme misurabile (ad esempio R stesso) e {fn : E R+ , n = 1, 2, . . . } una successione
di funzioni misurabili a valori reali non negativi.
Allora la funzione lim inf n fn (x) misurabile secondo Lebesgue, grazie
alla Proposizione 1.9.51, e si ha:
Z
Z
fn (x) dx
lim inf fn (x) dx 6 lim inf
E

(gli integrali possono essere finiti o infiniti).

Dimostrazione. Sia f = lim inf n fn . Passando ad una sottosuccessione, possiamo assumere che fn (x) f (x) per quasi ogni x. Per denizione
di integrale (Denizione 1.9.47), basta dimostrare che, se una funzione
semplice non negativa con 6 f , allora
Z
Z
fn .
(1.24)
6 lim inf
E

Consideriamo dapprima il caso in cui E = . Poich le funzioni semplici assumono solo un numero nito di valori (Denizione 1.9.42), in questo
caso un valore positivo, diciamo a, di deve essere assunto su un insieme
misurabile A di misura innita. Consideriamo la famiglia di insiemi
An = {x E : fk (x) > a k > n} .

1.9. MISURA ED INTEGRALE DI LEBESGUE

87

Gli An sono misurabili perch le funzioni fn lo sono (Denizione 1.9.39),


e sono una famiglia crescente con n. Inoltre n An A dal
che
R momento
R
6 limn fn , e quindi limn m (An ) > m(A) = . Pertanto E fn > An fn >
am (An ) , ed il teorema
vale in questo caso particolare.
R
Allora assumiamo E < . Allora, sempre per il fatto che le funzioni
semplici assumono solo un numero nito di valori, A = {x E : (x) > 0}
un insieme misurabile di misura nita. Denotiamo con M il massimo valore
di , scegliamo un > 0 arbitrario e consideriamo gli insiemi
An = {x E : fk (x) > (1 )(x) k > n} .
Per la stessa ragione di prima, lunione della famiglia crescente di insiemi
misurabili An contiene A. Perci {A \ An } una famiglia decrescente con
intersezione vuota, e quindi segue dal Corollario
1.9.12
R
R che lim
R n m (A
R \ An ) =
0. Osservando che 0 su E \ A, e quindi E A\Ak = A A\Ak =
R
, ora possiamo scrivere che, per k > n,
Ak
Z

fk > (1 )
Z
Z
> (1 )

fk >

Ak

Ak

A\Ak

Z

= (1 )
A\Ak
E
Z

Z
>

( + M) .
E

Poich > 0 arbitrario, la precedente disuguaglianza vale anche quando si


prende lestremo inferiore rispetto a , in altre parole quando si pone = 0,
da cui il risultato.

Teorema 1.9.53. (Teorema di convergenza monotna.)


Sia E R un sottoinsieme misurabile (ad esempio R stesso) e {fn : E
+
R , n = 1, 2, . . . } una successione monotna di funzioni misurabili a valori
reali non negativi, cio tale che, per ogni x R, si ha fn (x) 6 fn+1 (x). Sia
f (x) = limn fn (x) (il limite esiste, finito o infinito, grazie alla condizione
di monotonia (Sezione 1.1), ed una funzione misurabile secondo Lebesgue
grazie alla Proposizione 1.9.51).
Pi in generale, abbandonando la condizione di monotonia che d nome al
teorema, supponiamo solo che fn converga a f quasi ovunque e che 0 6 fn 6
f.
Allora
Z
Z
lim
fn (x) dx =
f (x) dx
n

88 CAPITOLO 1. PANORAMICA SU CALCOLO ED ANALISI REALE


(gli integrali possono essere finiti o infiniti).
R
R
Dimostrazione. La condizione fn 6 f implica E fn 6 E f , e pertanto, dal
Lemma di Fatou (Teorema 1.9.52),
Z
Z
Z
Z
f 6 lim inf
fn 6 lim sup fn 6
f,
E

e quindi il massimo
e minimo limite coincidono (e quindi esiste il limite), e
R
coincidono con E f .

Teorema 1.9.54. (Teorema di convergenza dominata di Lebesgue.)


Sia E R un sottoinsieme misurabile
(ad esempio R stesso) e g una funR
zione misurabile su E tale che E |g| < . Sia {fn : E C, n = 1, 2, . . . }
una successione di funzioni misurabili con la propriet di essere tutte simultaneamente maggiorate da g: cio |fn (x)| 6 g(x) per ogni n e per quasi
ogni x E. Se per quasi ogni x esiste, finita od infinita, la funzione limite
f (x) = limn fn (x), allora
Z
Z
f (x) dx
fn (x) dx =
lim
n

(gli integrali possono essere finiti o infiniti).


Dimostrazione. Spezzando gli integrali delle parti reale ed immaginaria di
fn e f , osserviamo che basta dimostrare il teorema per funzioni fn a valori
reali. Allora g + fn e g fn sono
entrambe non negative,
e dalR Lemma di
R
R
Fatou (Teorema
1.9.52) segue E (g + f ) 6 lim inf n E (g + fn ) e E (g f ) 6
R
lim inf n E (g fn ), da cui
Z
Z
Z
Z
f 6 lim inf
fn 6 lim sup fn 6
f.
E

Da questo il risultato segue come nella dimostrazione del Teorema di Con

vergenza Monotna (Teorema 1.9.53).

Esercizio 1.9.55. Calcolare

R1
0

s(k) (x) dx, dove k un intero positivo e


(k)

s (x) =

X
n=1

xn

1.9. MISURA ED INTEGRALE DI LEBESGUE

89

sono le serie di potenze introdotte nellEsercizio 1.4.16.


Svolgimento. Abbiamo visto nellEsercizio 1.4.16 che queste serie convergono
puntualmente ma non uniformemente in (0, 1). Nondimeno, i loro termini
(k)
sono positivi e quindi, per ogni 0 < x < 1, le loro somme parziali sj (x) =
Pj
nk
crescono al crescere di j. Pertanto possiamo integrare termine a
n=1 x
termine in base al Teorema di Convergenza Montona (Teorema 1.9.53). Il
risultato
Z 1
Z 1

X
X
1
k
(k)
s (x) dx =
,
xn dx =
k
n
+
1
0
0
n=1
n=1
che diverge per k = 1 ma converge se k > 1.

Esercizio 1.9.56.

(i) Nellintervallo {/4 6 x 6 /4} deniamo


fn (x) =

Calcolare limn

n tan x
.
1 + n2 x2

fn (x) dx .

(ii) Nellintervallo {/4 6 x 6 /4} deniamo


gn (x) =
Calcolare limn

4
4

(sin x)n
.
1 + n2 x2

gn (x) dx .

(iii) Nellintervallo {/4 6 x 6 /4} deniamo


hn (x) =
Calcolare limn

n(sin x)n
.
1 + n2 x2

hn (x) dx .

Suggerimento: non si provi a calcolare esplicitamente la primitiva; si usi


invece il Teorema di Convergenza Dominata 1.9.54 oppure il Teorema di
Convergenza monotna 1.9.53, a seconda dei casi.
Svolgimento. Per la parte (i), osserviamo che, nellintervallo [0, /4] la
funzione tangente crescente e convessa, e tan(/4) = 1. Quindi, per
ogni x [0, /4], abbiamo tan x 6 4x/ < 2x, e per parit abbiamo
| tan x| < 2|x| per ogni x [/4, /4]. Quindi, nel nostro dominio di

90 CAPITOLO 1. PANORAMICA SU CALCOLO ED ANALISI REALE


integrazione, |fn (x)| < 2n|x|/(1 + n2 x2 ). Poniamo u(x) = 2|x|/(1 + x2 ), ed
osserviamo che u una funzione limitata (0 6 u(x) 6 1: il valore esatto di
kukL [0, 4 ] irrilevante). Abbiamo quindi
|fn (x)| < n|x|/(1 + n2 x2 ) = u(nx) < kuk < 1 ,
e quindi possiamo applicare il Teorema di Convergenza Dominata 1.9.54 nellintervallo [/4, /4]. Poich u(nx) = n/(1 + n2 x2 ) 0 per n per
ogni x RI = [/4, /4], anche fn (x) = u(nx) tan x tende a 0 con n, ed il
limite di I fn dx vale 0.
Osserviamo che, a parte un numero nito di termini iniziali, la convergenza a
0 di n/(1+n2 x2 ) monotna decrescente, quindi avremmo pi semplicemente
potuto applicare il Teorema di Convergenza Monotna 1.9.53, e risparmiarci
la stima uniforme, che abbiamo invece dato per completezza.
Per la parte (ii), ilprocedimento identico. Questa volta maggioriamo
n
2 2
2 (1 + n x )), che
| sin x| 6 sin /4 = 1/ 2, e quindi |gn (x)| 6 cn (x) := 1/(2
R
R
tende a zero in maniera monotna. Quindi il limite di I |gn | dx 6 I cn dx
di nuovo 0, per il Teorema di Convergenza monotna 1.9.53. Anche in questo
caso, osserviamo che la disuguaglianza |gn | 6 cn implica che le funzioni gn
sono tutte equilimitate da una costante: le cn sono evidentemente minori
di 1. Quindi lo stesso risultato segue anche dal teorema di Convergenza
Dominata. In questo caso la maggiorazione uniforme banale, ma il fatto
che la convergenza sia anche monotna lo altrettanto.
Per la parte
(iii) usiamo lultima maggiorazione che abbiamo provato,
| sin x| 6 1/ 2, da cui
n
n2 2
|hn (x)| 6
.
1 + n2 x2
Poich n < 2n/4 per ogni n N, abbiamo
n

2 4
,
|hn (x)| 6 dn (x) :=
1 + n2 x2
e le funzioni dn tendono a zero in
e sono anche equiliR maniera monotna,
R
mitate dalla costante 1. Quindi I |hn | dx < I dn dx tende a zero, sia per il
Teorema di Convergenza Dominata 1.9.54, sia per il Teorema di Convergenza

monotna 1.9.53.
Esercizio 1.9.57. Siano n N e
fn (x) =

x
.
1 + en x

1.9. MISURA ED INTEGRALE DI LEBESGUE

91

la successione di funzioni dellEsercizio 1.3.23.


(i) Da quellEsercizio sappiamo che tale successione converge a zero uniforRb
memente in [0, ). Mostrare che da questo segue che limn 0 fn (x) dx =
0 per ogni b > 0, e ritrovare lo stesso risultato sia in base al Teorema di
Convergenza Dominata 1.9.54, sia in base al Teorema di Convergenza
monotna 1.9.53.
Suggerimento: per applicare il Teorema di Convergenza Dominata occorre maggiorare tutte le f (n), simultaneamente al variare di n N
(ossia uniformemente rispetto a n) con ununica funzione in L1 [0, b]. A
questo scopo si tenga presente che, per ogni x [0, b],
x
x
6 n = en 6 1 .
n
1+e x
e x
(ii) Si consideri ora la successione
gn (x) =

x ex
1 + en x

nella semiretta {x > 0}. Usando le disuguaglianze dellEsercizio 1.3.23,


od anche la disuguaglianza precedente, si osservi che fn tende a zero uniformemente
in [0, ). Da questo fatto per non segue pi che
R
limn 0 gn (x) dx = 0, perch il dominio di integrazione ora illimitato (si veda lEsempio 1.3.18). Mostrare che invece questo risultato
segue sia dal Teorema di Convergenza Dominata 1.9.54, sia dal Teorema di Convergenza monotna 1.9.53.
Suggerimento: per identicare una funzione f L1 [0, ) che domina
le gn , si osservi che
x ex
6 x ex
n
1+e x
per ogni x > 0.

92 CAPITOLO 1. PANORAMICA SU CALCOLO ED ANALISI REALE

1.10

Topologie e propriet di separazione

Definizione 1.10.1. (Topologia.) Una topologia su un insieme V una


famiglia di sottoinsiemi di V , detti aperti, che contiene linsieme vuoto e
linsieme V ed chiusa sotto le operazioni di unione (qualsiasi, non necessariamente nita o numerabile) e di intersezione nita. I complementi degli
insiemi aperti si chiamano gli insiemi chiusi.
Data una famiglia T di sottoinsiemi di V , la pi piccola topologia che contiene tutti gli insiemi in T si dice la topologia generata da T . Ad esempio, la
topologia su R generata da tutti gli intervalli aperti la consueta topologia
che d luogo alla nozione usuale di convergenza, basata su intorni aperti.
Una base per la topologia un sottoinsieme di aperti dai quali tutti gli altri
si ottengono grazie alloperazione di unione (qualsiasi, non solo numerabile): in altre parole, una famiglia di aperti una base se ogni aperto della
topologia contiene qualche insieme di questa famiglia. Una base locale ad un
punto x consiste di quegli aperti della base che contengono x, e le cui unioni
quindi generano tutti gli intorni aperti di x: ovvero, una famiglia di intorni
aperti di x una base locale se ogni intorno aperto di x contiene un insieme
di questa famiglia. Una sottobase una famiglia di aperti le cui intersezioni
nite formano una base.
Definizione 1.10.2. Si dice che uno spazio topologico X:
(i) verica la propriet di Hausdorff (o T2 ) se per ogni x 6= y X esistono
intorni aperti Ox di x e Oy di y disgiunti;
(ii) normale, ovvero verica la propriet T4 , se i punti sono insiemi chiusi
e per ogni coppia di sottoinsiemi chiusi C1 , C2 X disgiunti esistono
aperti disgiunti O1 e O2 tali che C1 O1 e C1 O2
Corollario 1.10.3. In uno spazio topologico di Hausdorff il limite unico:
se limn xn = x e limn xn = y allora x = y.
Dimostrazione. Ovvio: se x 6= y allora esistono due intorni aperti disgiunti
Ox e Oy rispettivamente di x e y, e quindi, se i punti xn appartengono
denitivamente a Ox , non possono appartenere denitivamente anche a Oy .

Pertanto, la seguente nozione di continuit ha senso negli spazi di Hausdor:

1.10.

TOPOLOGIE E PROPRIET DI SEPARAZIONE

93

Definizione 1.10.4. Dati due spazi topologici di Hausdor X e Y , una funzione f : X Y si dice continua per successioni al punto x se limn f (xn ) =
f (x) quando limn xn = x.
In seguito ci sar utile la seguente osservazione:
Proposizione 1.10.5. Se X e Y sono spazi topologici di Hausdorff, una
funzione f : X Y continua continua per successioni, nel senso della
precedente Definizione 1.10.4. Viceversa, se un punto x di X ha una base
locale numerabile per la topologia, allora se f continua a x anche continua
per successioni a x.
Dimostrazione. chiaro che una funzione f continua anche continua per
successioni, perch se V Y un intorno aperto di f (x) e denotiamo con
U laperto U = f 1 (V ) X, allora ogni successione xn x appartiene
denitivamente a U, e quindi f (xn ) appartiene denitivamente a V , il che
equivale a dire che limn f (xn ) = f (x).
Viceversa, ssato x, sia Un una base locale numerabile di aperti che contengono x. Se per assurdo f non fosse continua a x, esisterebbe un intorno
V Y di f (x) tale che f 1 (V ) non un intorno di x, e quindi f 1 (V ) non
conterrebbe qualcuno degli aperti Un . Questo signica dire che per ogni n
esiste un xn Un tale che xn
/ f 1 (V ). Allaumentare di n abbiamo allora
xn x ma f (xn )
/ V e quindi f (xn ) 9 f (x). Allora f non continua per
successioni al punto x, e questo contraddice lipotesi.

Lemma 1.10.6. Gli insiemi chiusi in uno spazio topologico compatto K sono
compatti.
Gli insiemi compatti in uno spazio di Hausdorff X sono chiusi.
Dimostrazione. Proviamo la prima asserzione. Sia C K chiuso. Si consideri un ricoprimento aperto Ux di C tale che x Ux per ogni x C.
Completiamo questo ricoprimento ad un ricoprimento aperto di tutto K aggiungendo un ulteriore aperto, ossia il complemento C = K \ C, dal quale
possibile estrarre un sottoricoprimento nito per la Denizione 1.9.4 di
compattezza (si osservi che questo sottoricoprimento nito contiene ancora
laperto C a meno che C = K, nel qual caso non cera bisogno di aggiungere
al ricoprimento iniziale laperto K \ C = ). Ora che abbiamo estratto un
sottoricoprimento nito di K, questo anche un sottoricoprimento nito di
C K. Quindi abbiamo dimostrato che da ogni ricoprimento aperto di C si
pu estrarre un sottoricoprimento nito: questo signica che C compatto.

94 CAPITOLO 1. PANORAMICA SU CALCOLO ED ANALISI REALE


Ora proviamo la seconda asserzione. Sia K X un compatto. Per
ogni x K e y
/ K si scelgano due intorni aperti disgiunti Ux e Uy come
nella Denizione 1.10.2. Allora la famiglia Ux : x K forma un ricoprimento aperto di K, dal quale possibile estrarre un sottoricoprimento
nito. Sia {Ux1 , . . . , Uxn } questo sottoricoprimento nito. Allora linsieme
W := ni=1 Uyi disgiunto da K perch K ni=1 Uxi ed aperto perch
intersezione nita di aperti. Quindi ogni y nel complemento di K appartiene
ad un aperto W K: in altre parole, il complemento di K aperto.

Proposizione 1.10.7. Un sottoinsieme chiuso G di uno spazio completo X


completo (ossia, le sue successioni di Cauchy a valori in G convergono a
punti di G).
Dimostrazione. Sia {xn } una successione di Cauchy con xn G. Poich
G X e X completo, questa successione di Cauchy converge ad punto
limite x in X. Poich X metrico, x un punto di accumulazione di G.
Ma G chiuso, e quindi x G.

Proposizione 1.10.8. Siano K e Y spazi topologici con K compatto,


(i) Se f : K Y continua allora Y compatto.
(ii) Se Y di Hausdorff e la funzione continua f biunivoca, allora f ha
inversa continua.
Dimostrazione. Sia Y un ricoprimento aperto di Y , e K la famiglia delle
controimmagini f 1 (A) per A Y. Poich f continua, le controimmagini
O = f 1 (A) sono aperti in K, e ogni punto k K appartiene a qualcuno di
essi, perch f (k) appartiene a qualche A Y. Pertanto K un ricoprimento
aperto di K, e dal momento che K compatto esiste un sottoricoprimento
nito. Le immagini sotto f di questo sottoricoprimento nito formano un
sottoricoprimento nito di Y. Quindi Y compatto, e la parte (i) provata.
Ora supponiamo che Y sia uno spazio di Hausdor e f sia biunivoca (basterebbe assumere che sia iniettiva, e restringere lattenzione al sottoinsieme
compatto di Y dato dalla sua immagine). Se C K chiuso, allora esso
compatto in base alla prima parte del Lemma 1.10.6. Grazie alla parte precedente ne segue che f (C) compatto in Y , ed allora, per la seconda parte del

1.10.

TOPOLOGIE E PROPRIET DI SEPARAZIONE

95

Lemma 1.10.6, f (C) chiuso in Y . Questo prova che f (C) chiuso per ogni
chiuso C in K: scrivendo C = (f 1)1 (C) (perch f biunivoca) vediamo
che f 1 continua(infatti una funzione continua se la controimmagine di
ogni aperto aperta, e quindi se la controimmagine di ogni chiuso chiusa).

Esercizio 1.10.9. Se uno spazio topologico X di Hausdor, esso rimane di


Hausdor in ogni topologia pi forte. Se invece X compatto, esso rimane
compatto in ogni topologia pi debole. Se X compatto e di Hausdor,
la sua topologia unica, nel senso che in ogni topologia strettamente pi
forte X non compatto, ed in ogni topologia strettamente pi debole non
di Hausdor.
Svolgimento. Le prime due asserzioni sono ovvie. Per dimostrare la terza,
consideriamo una topologia pi debole di e la mappa identica di X in
s. Questa mappa ovviamente biunivoca e continua, e quindi ha inversa
continua in base alla precedente Proposizione 1.10.8. Pertanto e sono
topologie equivalenti. Lo stesso argomento vale se si considera una topologia
pi forte di .

Proposizione 1.10.10. (i) Uno spazio topologico X ha la propriet che


i punti sono insiemi chiusi se e solo se, per ogni x, y X, esiste un
aperto O di ciascuno dei due che non contiene laltro (questa propriet
di solito si indica come propriet T1 ).
(ii) Uno spazio topologico che verifica la propriet di Hausdorff T2 verifica
anche la propriet T1 .
(iii) Uno spazio topologico che verifica la propriet T4 verifica anche la
propriet T2 .
(iv) Uno spazio topologico di Hausdorff normale, ossia verifica T4 , se e
solo se per ogni chiuso C ed aperto A tali che C A esiste un aperto
V che li separa nel senso che C V V A.
(v) Se X di Hausdorff, K X compatto e x
/ K, allora esistono due
aperti disgiunti U e V che separano x da K: ossia x U e K V .

96 CAPITOLO 1. PANORAMICA SU CALCOLO ED ANALISI REALE


(vi) Uno spazio compatto e di Hausdorff ha la propriet T4 (terminologia
della Definizione 1.10.2): dati due chiusi disgiunti C e K esistono due
aperti disgiunti che li contengono. Pi in generale, dati un compatto
K ed un chiuso C disgiunti in uno spazio di Hausdorff, esistono due
aperti disgiunti OK e OC tali che K OK e C OC (se X compatto
questa forma dellenunciato chiaramente si riduce a quella precedente,
perch i compatti in uno spazio di Hausdorff sono chiusi, in base al
Lemma 1.10.6).
(vii) Se X uno spazio localmente compatto di Hausdorff, U un aperto in
X e K U compatto, esiste un aperto V a chiusura compatta che li
separa, ossia tale che K V V U.

Dimostrazione. Linsieme costituito dal solo punto x chiuso se e solo se


il suo complemento aperto, ossia se e solo se esiste un intorno di ciascun
y 6= x che non contiene x. Questo prova (i), ed a questo punto (ii) e (iii)
sono ovvie.
Per provare la parte (iv), consideriamo due chiusi C1 e C2 disgiunti e laperto
A := C2 . la disgiunzione C1 C2 = equivale a C1
A. Analogamente,
siano O1 e O2 i due aperti disgiunti della propriet T4 , tali che C1 O1 e
C2 O2 : di nuovo grazie alla disgiunzione, ponendo G := O2 otteniamo un
chiuso tale che O1 G. Allora anche la chiusura O 1 deve essere contenuta
in G, perch la chiusura di O1 lintersezione di tutti i chiusi che contengono O1 . Pertanto abbiamo C1 O1 e O1 A, e che queste inclusioni sono
equivalenti a C1 O1 e C2 O2 . Lenunciato della parte (iv) coincide con
questo se poniamo C1 = C e O1 = V .
Veniamo alla parte (v). Per ogni k K sappiamo che k 6= x. Poich X
di Hausdor, esistono intorni aperti disgiunti Uk x e Vk k. Allora gli
insiemi Vk , al variare di k K, formano un ricoprimento aperto del compatto K, dal quale possiamo estrarre un sottoricoprimento nito {V1 , . . . , Vn }.
Allora lunione nita V := ni=1 Vi un aperto che contiene K, ed disgiunto
dallaperto dato dalla intersezione nita U := ni=1 Ui che contiene x.
Un argomento simile a quello della parte (v) prova la parte (vi). Consideriamo K, C X disgiunti, con K compatto e C chiuso. Per ogni x K
e y C, sappiamo che x 6= y perch K e C sono disgiunti. Poich X di
Hausdor, esistono aperti disgiunti Ox x e Vy y. Poich K compatto,
da questo ricoprimento aperto {Ox : x K} si pu estrarre un sottoricoprimento {O1 , . . . , On } nito. Allora lunione nita O := ni=1 Oi e lintersezione
nita V := ni=1 Vi sono due aperti disgiunti tali che K O, C V .

1.10.

TOPOLOGIE E PROPRIET DI SEPARAZIONE

97

Inne, proviamo la parte (vii). X localmente compatto se e solo se ogni


punto x ha un intorno Ox a chiusura compatta. In tal caso, consideriamo di
nuovo il ricoprimento aperto di K dato da {Ox : x K} ed estraiamone un
sottoricoprimento nito {O1, . . . , On }. Allora lunione nita O := ni=1 Oi
un aperto a chiusura compatta (perch lunione nita) che contiene K. Se
O X, consideriamo linsieme chiuso C := X \O. Dalla parte (vi) sappiamo
che, per ogni x C, c un aperto Vx K tale che x
/ Vx . Pertanto la famiglia degli insiemi {C O Vx : x C} ha intersezione vuota. Ma poich O
compatto, questi insiemi, essendo intersezione di chiusi, sono chiusi e quindi
sono compatti per la prima parte del Lemma 1.10.6. Allora, per la propriet
dellintersezione nita (Nota 1.9.7), esiste una scelta di x1 , . . . , xn C che
producono una intersezione nita vuota: ossia, esistono x1 , . . . , xn C tali
che ni=1 C O V xi = . Allora laperto V = ni=1 O Vxi contenuto nel
compatto V = ni=1 O V xi e questo compatto disgiunto da C.

Nota 1.10.11. Le propriet T1 , T2 e T4 della Denizione 1.10.2 e della Proposizione 1.10.10 sono tre cosiddetti assiomi di separazione che fanno parte
di una famiglia di cinque, ciascuno dei quali implica i precedenti. La propriet T0 si enuncia dicendo che, per ogni coppia di punti x, y X, esiste
un aperto O di uno dei due dei due che non contiene laltro. La propriet T3
vale se i punti sono chiusi e per ogni chiuso C X e per ogni punto x C
esistono aperti disgiunti O1 e O2 tali che x O1 e C O2 . ormai ovvio
che T4 T3 T2 T1 T0 .
In questo libro, per, ci servono solo le propriet T2 e T4 (ed anche T1 ma
solo per poter denire T4 ).

Esercizio 1.10.12. Tutti gli spazi metrici hanno la propriet T4 , ed in particolare la propriet di Hausdor.
Suggerimento: basta porre, nella Denizione 1.10.2, O1 = {z X : d(z, x) <
d/2, dove d la distanza da C1 e C2 , ossia d := inf{d(x, y) : x C1 , y C2 }.
Gli insiemi O1 e O2 sono aperti perch in uno spazio metrico la distanza una
funzione continua (per denizione di spazio metrico), e sono necessariamente
disgiunti a causa della disuguaglianza triangolare (Denizione 1.2.3). Si noti
che la distanza d nita, ed anzi lestremo inferiore che la denisce un
minimo, perch dati due punti x e y a distanza assegnata k, nel calcolare
lestremo inferiore si pu restringere lattenzione alla sfera di raggio k intorno
a x, e quindi ad un compatto.

98 CAPITOLO 1. PANORAMICA SU CALCOLO ED ANALISI REALE


Teorema 1.10.13. (Lemma di Urysohn.) Siano A e B due insiemi chiusi
disgiunti in uno spazio topologico X normale (ossia che verifica la propriet
di separazione T4 della Definizione 1.10.2). Allora esiste una funzione f
continua su X a valori reali compresi fra 0 e 1 tale che f 0 su A e f 1
su B.
Dimostrazione. Fissiamo un intero n > 0 e consideriamo i razionali diadici
rm,n = m/2n , m = 1, 2, . . . 2n 1. Ripetendo iterativamente la costruzione
della parte (iv) della Proposizione 1.10.10 otteniamo una famiglia crescente
di aperti Vm,n , ossia Vm,n
Vm+1,n , tali che A Vm,n e Vm,n B. Ora
aumentiamo la risoluzione di scala passando allintero n+1: i razionali diadici
si raddoppiano, nel senso che rk,n+1 = rm,n se k = 2m e rk,n+1 la media
aritmetica di rm,n e rm+1,n se k = 2nm + 1. Allora possiamo di nuovo iterare
la precedente costruzione ed estenderla ai razionali diadici di generazione
n + 1. Pertanto, per induzione, abbiamo che, per tutti i razionali diadici in
r, s (0, 1), esistono aperti Vr tali che A Vr , Vr B e Vr Vs se r < s.
Ora deniamo una funzione f : X [0, 1] nel modo seguente:
f (x) := inf{r : x Vr , r razionale diadico in (0, 1)} .

(1.25)

Allora f 0 su A e f 1 su B. Resta solo da dimostrare che la funzione f


continua.
Fissato x X, per mostrare che f continua al punto x, per ogni > 0
consideriamo lintervallo aperto I := {s (0, 1) : f (x) < s < f (x) + }.
Per ogni s I laperto Vs contiene x; inoltre per y Ox := Vs \ V f (x)
abbiamo 0 < |f (y) f (x)| < . Quindi Ox un intorno aperto di x tale che
|f (y) f (x)| 6 per ogni y Ox . Pertanto f continua al punto x.

Come conseguenza del Lemma di Urysohn 1.10.13 abbiamo:

Teorema 1.10.14. (Teorema di estensione di Tietze.) Sia X uno spazio


topologico normale, ossia che verifica la propriet T4 della Definizione 1.10.2
(ad esempio uno spazio metrico, come osservato nellEsercizio 1.10.12). Sia
C X un sottoinsieme chiuso, ed f : C R una funzione continua. Allora
esiste una funzione continua su tutto X a valori reali che coincide con f su
C.
Dimostrazione. Normalizziamo f ponendo h(x) = f (x)/(1 + |f (x)|). Allora
h continua a valori reali su C e |h(x)| < 1 per ogni x C. Consideriamo

1.10.

TOPOLOGIE E PROPRIET DI SEPARAZIONE

99

gli insiemi chiusi A := {x C : h(x) 6 1/3} e B := {x C : h(x) > 1/3}.


Per il Lemma di Urysohn (Teorema 1.10.13 esiste una funzione continua a
valori reali u : X [1/3, 1/3] che vale 1/3 su A, 1/3 su B e che verica
la disuguaglianza |u(x)| 6 1/3 per ogni x X. Da queste disuguaglianze
segue che |h u| < 2/3 su tutto C (non su tutto X perch h denita solo
in C).
Riapplichiamo allora lo stesso ragionamento alla funzione h u. Procedendo ricorsivamente in questo modo otteniamo una successione di funzioni un
continue su X a valori reali tali che, per ogni x X,
|un (x)| <

1 2n
2 3n

(1.26)

per ogni x C



n
2n

X


(1.27)
ui (x) < n .
h(x)
3

i=1
P
La disuguaglianza (1.26) implica che le somme ni=1 ui (x) convergono uniP 2m1
formemente su tutto X ad una funzione g tale che |u| 6
i=1 3m = 1. La
disuguaglianza (1.26) implica che in C queste somme convergono uniformemente alla funzione h.
Daltra parte, di nuovo per il Lemma di Urysohn 1.10.13 sappiamo che esiste
una funzione continua v : X [0, 1] che vale 1 su C e 0 su B := {x
X : u(x) = 1}. Allora la funzione g = uv/(1 |uv|) denita ovunque su
X, perch il denominatore non si annulla in quanto 0 6 u 6 1, |v| 6 1 e
|uv| < 1 dal momento che v 0 laddove u = 1. Da questo segue anche
che g continua a valori reali su tutto X. Inne, g estende f come richiesto
nellenunciato: infatti essa coincide con f su C, perch l v 1, u h e
h/(1 h) f in base alla denizione h = f /(1 + |f |).

Unaltra conseguenza interessante del lemma di Urysohn 1.10.13 la


seguente:

Lemma 1.10.15. (Partizione dellunit.) Sia X uno spazio topologico di Hausdorff localmente compatto, K X un sottoinsieme compatto e
{O1 , . . . , On } un ricoprimento aperto finito di K, ossia KP ni=1 Oi . Allora
esistono funzioni continue fi con supporto in Oi tali che ni=1 fi 1 su K.
Dimostrazione. Dato x K sia i = i(x) lindice tale che x Vi . Poich
X localmente compatto, ogni x K ha un intorno aperto Ux a chiusura

100 CAPITOLO 1. PANORAMICA SU CALCOLO ED ANALISI REALE


compatta, e considerando al posto di Ux lintersezione Ux Vi(x) possiamo
assumere Ux Vi = Vi(x) . Restringendo ulteriormente Ux se necessario,
dalla parte (vii) della Proposizione 1.10.10 possiamo supporre anche che, per
ogni x K, Ux sia un compatto contenuto in qualcuno dei Vi . Estraiamo
un sottoricoprimento nito {Ux1 , . . . , Uxn } del compatto K. Fissato i =
1, . . . , n, sia Ji = m {Uxm : Uxm Vi }. Chiaramente, K i Ji . Inoltre,
poich Ji unione nita di compatti, Ji un compatto, quindi un chiuso
perch X di Hausdor (si rammenti la seconda parte del Lemma 1.10.6),
ed inoltre Ji Vi . Allora, in base al lemma di Urysohn 1.10.13, esistono
funzioni continue gi a valori reali ed a supporto compatto tali che gi 1 su
Ji ed il supporto di gi contenuto in Vi .
Poniamo inne f1 = g1 , f= (1 g1 ) g2, . . . , fn = (1 g1 ) . . . (1 gn1 ) gn .
Osserviamo che
f1 + f2 = g1 + g2 g1 g2 = 1 (1 g1 )(1 g2 ) .
In maniera analoga, come si verica immediatamente per induzione,
n
X
i=1

n
Y
fi = 1
(1 gi ) .

(1.28)

i=1

Poich K i Ji , ogni x K appartiene ad almeno un Ji , per il cui indice


i quindi si ha gi (x) = 1. Allora il prodotto P
a secondo membro dellidentit

(1.28) identicamente nullo su K, e quindi ni=1 fi 1 su K.


In Rn vale una versione innitamente dierenziabile di questo stesso
enunciato:

Corollario 1.10.16. (Partizione dellunit C in Rn .) Sia {Sm } una


famiglia numerabile di palle aperte in Rn che formano un ricoprimento di
Rn e tali che ogni compatto interseca solo un numero finitoPdi queste palle.
Allora esistono fm C (Rn ) con supporto in Sm tali che
m=1 fm 1 su
n
tutto R .
Dimostrazione. un facile esercizio per induzione, che utilizza le propriet
dei limiti di forme indeterminate date dal prodotto di esponenziali per polinomi (Sezione 1.1), il mostrare che la funzione h su R denita da h(t) =
exp(t2 /(t2 1)) se |t| < 1 e h(t) = 0 altrimenti C , ha supporto in [1, 1]
ed ha valori in [0, 1]. Chiamiamo rm il raggio della palla Sm e xm il suo
centro, ed indichiamo con um la funzione con supporto in Sm denita da

1.11.

CARATTERIZZAZIONE DELLA COMPATTEZZA

101

2
um (x) = h(kx P
xm k2 /rm
) (qui la norma la norma Euclidea in Rn ). Per
ogni x, la serie
m=1 um (x) una somma nita perch x appartiene solo
ad un numero nito delle palle Sm che formano i supporti dei termini della
serie. Quindi la serie converge puntualmente ad una funzione C sempre
strettamente positiva (il fatto che sia strettamente positiva conseguenza
immediata dellipotesi m Sm = Rn ).
La somma della serie, per, non la costante 1. Pertanto normalizziamo,
ponendo
um
.
fm := P
m=1 um

AlloraPanche le fm sono funzioni C non negative con supporto in Sm , la

serie
m=1 fm (x) ha, per ogni x, un numero nito di termini non nulli e
quindi converge
C , e grazie alla normalizzazione
P ovunque ad una funzione

abbiamo m=1 fm 1 su tutto Rn .

1.11

Caratterizzazione della compattezza

A titolo di approfondimento, esaminiamo i legami fra varie nozioni collegate


alla compattezza.

Teorema 1.11.1. (Generalizzazione della propriet di


BolzanoWeierstrass.) Dato un sottoinsieme chiuso K di uno spazio topologico X che soddisfa la propriet di separazione di Hausdorff (parte (i)
della Definizione 1.10.2), consideriamo le seguenti tre propriet:
(a) K compatto;
(b) ogni successione a valori in K ha una sottosuccessione convergente
(ovvero, ogni sottoinsieme infinito di K ha almeno un punto limite);
(c) X uno spazio metrico e K totalmente limitato, nel senso che, per
ogni > 0, K pu essere ricoperto da una famiglia finita di palle di
raggio (si noti che la nozione di palla, e quindi questa definizione di
totale limitatezza, hanno senso solo in uno spazio metrico).
I legami fra queste propriet sono i seguenti: (a) implica (b); se X uno
spazio metrico, (b) implica (c); se X uno spazio metrico completo, (c)
implica (a). In particolare, in uno spazio metrico completo le tre propriet
sono equivalenti.

102 CAPITOLO 1. PANORAMICA SU CALCOLO ED ANALISI REALE


Dimostrazione. Dimostriamo che (a) implica (b). Assumiamo, per assurdo,
che esista una successione {xn } in K senza punti limite. Grazie alla propriet
di separazione di Hausdor, per ogni n esistono aperti disgiunti O1 , . . . , On
tali che xj appartiene a Oj per j = 1, . . . , n. Infatti, questo esattamente lenunciato della propriet di Hausdor se n = 2. Invece, per n > 2
supponiamo per induzione che O1 , . . . , On1 si possano prendere disgiunti, e
procediamo come segue. Prendiamo un aperto On,j xn e un aperto Aj xj
disgiunti (esistono, di nuovo per la propriet di Hausdor), e rimpiazziamo
O1 con B1 := O1 A1 , O2 con B2 := O2 A2 e cos via no a rimpiazzare
On1 con Bn1 := On1 An1 (si noti che queste intersezioni Bj sono ancora
insiemi aperti a due a due disgiunti, perche erano disgiunti gli Oj ). Inne,
rimpiazziamo On con Bn := On An,1 An,2 An,n1 : ora chiaro che
Bn un aperto disgiunto da ciascuno dei Bj per 1 6 j < n.
Ma allora, si consideri la successione innita di aperti a due a due disgiunti Bn xn , e gli si aggiunga laperto B0 := X \ n {xn }. La famiglia
{Bn : n > 0} un ricoprimento di K, perch tutti i punti di K tranne
gli xn appartengono a B0 , e ciascun xn appartiene al rispettivo Bn . Ma se
si esclude da questa famiglia anche un solo Bm , i restanti aperti smettono
di ricoprire K (se m > 0 viene omesso xm , se m = 0 vengono omessi tutti i
punti di K tranne gli xn ). Quindi dal ricoprimento aperto {Bn : n > 0} non
si pu estrarre un sottoricoprimento nito, e questo contraddice il fatto che
K sia compatto. Pertanto (a) implica (b).
Ora assumiamo che X sia uno spazio metrico e proviamo che (b) implica
(c). Cominciamo a scegliere una successione nita di punti xn K a distanza almeno : ossia, d(xi , xj ) > per ogni 1 6 i, j 6 n. Dallipotesi che
ogni successione innita abbia una sottosuccessione convergente segue che la
successione {xn } debba terminare dopo un numero nito n di passi. Questo
signica che non possiamo trovare un ulteriore punto xn+1 in K a distanza
maggiore di dai precedenti x1 , . . . , xn , e quindi che K viene ricoperto da n
palle di raggio . Pertanto K totalmente limitato, e (b) implica (c).
Inne, assumiamo che valga (c), ma per assurdo non a): in tal caso esiste
un ricoprimento aperto C di K senza sottoricoprimenti niti. Daltra parte, in base allipotesi (c), K coperto da un numero nito di palle chiuse
K1 , . . . , Km di diametro non superiore a 1 (le chiusure delle palle aperte di
diametro minore di 1 prescritte da (c)), quindi almeno una di esse (chiamiamola B1 ) non pu essere ricoperta da un numero nito di aperti di C.
Ora, B1 un chiuso nel compatto K, e quindi compatto (Lemma 1.10.6).
Allora ripetiamo questa analisi per B1 invece che K: il compatto B1 , una

1.12.

EQUICONTINUIT

103

sfera chiusa di diametro minore o uguale a 1, ricoperto da un numero nito


di palle chiuse di diametro minore o uguale a 1/2 almeno una delle quali (chiamiamola B2 ) non pu essere coperta da un numero nito di aperti
di C. Iterando il ragionamento costruiamo una successione di palle chiuse
B1 B2 B3 . . . tali che Bn ha diametro minore o uguale a 1/2n e non
ricopribile con un numero nito di aperti di C. A causa della condizione
sui diametri, i centri bn delle palle Bn costituiscono una successione di Cauchy (esercizio per il lettore: la stessa asserzione rimane vera se si sceglie bn
arbitrariamente in Bn invece che al centro). Ma fra le ipotesi in (c) c la
completezza di K: quindi la succcessione {bn } converge ad un punto b in
n Bn .Questo punto b deve appartenere ad almeno uno degli aperti di C, che
chiamiamo O. Daltra parte, v appartiene a tutte le palle Bn le quali hanno
diametro che tende a zero: ne segue che Bn V per n abbastanza grande.
Ma allora tali Bn sono ricoperti da un numero nito di aperti di C, anzi da
uno solo di essi, V . Questo contraddice la precedente costruzione, e quindi
nega lipotesi di assurdo che K non sia compatto. Pertanto (c) implica (a).

1.12

Equicontinuit e teorema di Ascoli-Arzel

Definizione 1.12.1. (Equicontinuit.) Sia K uno spazio topologico e F


una famiglia di funzioni f : K C. La famiglia F si dice equicontinua se
per ogni > 0 e x K esiste un intorno V = Vx K (indipendente da
f F ) tale che |f (x) f (y)| < per ogni y V e f F .

Esercizio 1.12.2. Per ogni sottoinsieme connesso K R e M > 0, consideriamo la famiglia delle funzioni f che vericano la seguente disuguaglianza
di Lipschitz: esiste Mf > tale che, per ogni x, y K,
??|f (x) f (y)| 6 Mf |x y| .

(1.29)

La costante Mf ! (indipendente da x e y) si chiama la costante di Lipschitz.


Per M > 0 sia FM la famiglia delle funzioni Lipschitziane su K con costanti
di Lipschitz Mf < M. Allora banale vericare che FM una famiglia
equicontinua.

Teorema 1.12.3. (AscoliArzel.) Sia K un compatto in R (o pi in


generale in uno spazio topologico) e F una famiglia di funzioni continue

104 CAPITOLO 1. PANORAMICA SU CALCOLO ED ANALISI REALE


su K che sia equicontinua nel senso della precedente Definizione 1.12.1, e
dominata da ununica funzione a valori finiti, ossia
sup |f (x)| <

(1.30)

f F

per ogni x. Allora F un sottoinsieme totalmente limitato in C(K).


Dimostrazione. Per x K, sia Vx lintorno dato dalla Denizione 1.12.1.
Dal ricoprimento aperto {Vx } estraiamo un sottoricoprimento nito {V1 =
Vx1 . . . , Vn = Vxn }. Pertanto, per ogni x K, abbiamo |f (x) f (xi )| <
quando f F e i lindice (o un indice) per cui x Vi . Ora, in base alla
disuguaglianza (1.30) applicata separatamente in tutti gli aperti Vi , vediamo
che la famiglia F equilimitata, nel senso che esiste C > 0 tale che kf k < C
per ogni f F .
Il fatto che F sia equilimitata ha questa conseguenza cruciale: se D il disco
complesso di centro lorigine e raggio M, la mappa p(f ) = (f (x1 ), . . . , f (xn )),
p : F D n , ha valori nel polidisco D n Cn , che compatto, e quindi
totalmente limitato, in virt del Teorema 1.11.1). Ci vuol dire che, per
ogni f F e > 0, esistono f1 , . . . , fm F tali che la distanza euclidea
da p(f ) ad uno dei punti p(fk ) D n (k = 1, . . . , m) inferiore a . In
particolare, esiste un indice k fra 1 e m tale che |f (xi ) fk (xi )| < per ogni
i da 1 a n. Allora, consideriamo un qualsiasi punto x K e sia i = i(x)
tale che x Vi . Lipotesi di equicontinuit asserisce che |f (x) f (xi )| < e
|fk (x) fk (xi )| < . Quindi, dato x in K, f F e > 0 arbitrari,
|f (x) fk (x)| 6 |f (x) f (xi )| + |f (xi ) fk (xi )| + |fk (xi ) fk (x)| < 3 .
Questo signica che F un insieme totalmente limitato.

Corollario 1.12.4. Per ogni compatto K in uno spazio topologico X che


soddisfa la propriet di separazione di Hausdorff, la chiusura uniforme di
una famiglia equicontinua ed equilimitata F C(K) compatta, ed in particolare ogni successione in F contiene una sottosuccessione uniformemente
convergente.

Dimostrazione. Poich C(K) uno spazio metrico completo, i suoi sottoinsiemi totalmente limitati sono compatti (implicazione (c) (a) del Teorema
1.11.1). Lultima asserzione dellenunciato segue dalla implicazione (a) (b)
dello stesso Teorema.

1.13.

1.13

TOPOLOGIE DEBOLI INDOTTE DA FAMIGLIE DI FUNZIONI105

Topologie deboli indotte da famiglie di


funzioni

Definizione 1.13.1. Date due topologie 1 e 2 su uno spazio tolopogico X,


si dice che 1 pi debole di 2 (o viceversa che la 2 pi forte di 1 ) se ogni
aperto della prima topologia contenuto anche nella seconda: 1 2 .

Proposizione 1.13.2. Consideriamo due topologie 1 2 su uno spazio


topologico X tali che 1 sia di Hausdorff e 2 sia compatta (ossia renda X
uno spazio compatto). Allora 1 = 2 . In altre parole, ogni topologia pi
debole di 1 non pi di Hausdorff, ed ogni topologia pi forte di 2 non
pi compatta: esiste ununica topologia compatta e di Hausdorff.

Dimostrazione. Basta dimostrare che ogni insieme C chiuso rispetto a 2


chiuso anche rispetto a 1 . Infatti, se cos, lo stesso vale per i loro
complementi, ossia tutti gli aperti di 2 appartengono a 1 e quindi 2 1 .
Daltra parte, se C X chiuso rispetto a 2 , allora compatto, grazie alla
prima asserzione del precedente Lemma 1.10.6, perch X compatto nella
topologia 2 . Allora C deve essere compatto anche nella topologia pi debole
1 , perch ogni ricoprimento di C con aperti di 1 anche un ricoprimento
con aperti di 2 e quindi si pu estrarne un sottoricoprimento nito, visto che
X 2 -compatto. Adesso segue dalla seconda asserzione del Lemma 1.10.6
che C, essendo compatto nella topologia di Hausdor 1 , deve essere chiuso
in 1 . Questo conclude la dimostrazione.

Rivolgiamo ora lattenzione a famiglie di funzioni su X.

Definizione 1.13.3. Sia F := {f : X Yf } una famiglia di funzioni su X,


dove le immagini sono spazi topologici che possono essere dierenti al variare
di f . Sia F la topologia su X generata dagli insiemi f 1 (V ) al variare di f
in questa famiglia e di V aperto in Yf . La topologia F si chiama la topologia
debole indotta dalla famiglia di funzioni F . Nel seguito scriveremo spesso w
invece di F .
Il seguente fatto ovvio:
Esercizio 1.13.4. La topologia debole F indotta da F := {f : X Yf } nel
senso della precedente Denizione 1.13.3 la pi debole topologia su X che
rende tutte le funzioni f continue ( perch avesse senso questa continuit
che abbiamo dovuto assumere che le immagini Yf fossero spazi muniti di una
topologia!).

106 CAPITOLO 1. PANORAMICA SU CALCOLO ED ANALISI REALE


Definizione 1.13.5. Si dice che una famiglia F di funzioni su un insieme X
separa i punti di X se per ogni x 6= y in X esiste una funzione f F tale
che f (x) 6= f (y).
Esercizio 1.13.6. Se una famiglia F := {f : X Yf } di funzioni su un insieme X separa i punti nel senso della precedente Denizione 1.13.5 e tutti gli
spazi immagine Yf sono spazi topologici di Hausdor (Denizione 1.10.2), allora la topologia debole indotta da F su X nel senso della Denizione 1.13.3
di Hausdor.
Svolgimento. Dal momento che F separa i punti, per ogni x 6= y in X esiste
almeno una funzione f F tale che f (x) 6= f (y). Poich la topologia di
Yf di Hausdor, esistono in Yf due aperti disgiunti Vx f (x) e Vy
f (y). Le controimmagini Ux = f 1 (Vx ) e Uy = f 1 (Vy ) devono quindi essere
necessariamente disgiunte, ed appartengono alla topologia debole indotta da

F proprio per la sua denizione (Denizione 1.13.3).


Esercizio 1.13.7. Sia F una famiglia di funzioni a valori reali su un insieme
X. Si mostri quanto segue:
(i) Una base per la topologia debole w indotta da F su X consiste degli
insiemi Oy = Oy (; f1 , . . . , fn ) := {x : |fi (x) fi (y)| < , i = 1, . . . , n}
al variare di y X, > 0 e f1 , . . . , fn F .
(ii) Questa topologia w di Hausdor (ossia T2 : Denizione 1.10.2) se e
solo se l famiglia F separa i punti di X, nel senso che per ogni x 6= y
esiste f F tale che f (x) 6= f (y).
(iii) Se F una famiglia di funzioni continue su uno spazio topologico X (la
cui topologia indichiamo con ), allora una base per la topologia debole
w generata dalla famiglia F pi debole della topologia originale ,
e le due topologie coincidono se F separa i punti dai chiusi, nel senso
che, per ogni x X e C X chiuso, esiste f F tale che f (x) = 1 e
f 0 su C.
(iv) Su uno spazio topologico che verica la propriet T4 (o anche solo T3 )
della Denizione 1.10.2 la topologia debole indotta dalla famiglia di
tutte le funzioni continue coincide con la topologia originale.

1.14.

APPROSSIMAZIONE CON FUNZIONI SEMICONTINUE O CONTINUE107

Svolgimento. chiaro che gli insiemi della parte (i) sono tutti contenuti in
ogni topologia che rende continue le funzioni f F , ed banale vericare che
formano una base per una tale topologia, nel senso della Denizione 1.10.1
(questo vero perch gli insiemi Oy (; f1 , . . . , fn ) sono le intersezioni (nite)
degli insiemi Oy (; fi ): per questo tutti gli aperti della topologia si ottengono
da unioni qualsiasi ed intersezioni nite di insiemi di questo tipo).
Questa topologia T2 se e solo se per ogni x 6= y esistono due aperti di base
Ox x e Oy y disgiunti. In particolare y
/ Ox , e quindi per qualche
funzione f F si ha f (y) 6= f (x). Viceversa, se f (x) 6= f (y), allora la
continuit di f assicura che, per qualche > 0, gli insiemi aperti di base
Ox (; f ) e Oy (; f ) sono disgiunti. Questo prova la parte (i).
Veniamo alla parte (ii). La topologia debole w la pi debole che rende
tutte le f F continue. Ma poich abbiamo assunto che queste funzioni
siano gi continue nella topologia originale , la topologia debole deve essere
non pi forte della topologia . Dobbiamo provare che ogni aperto della
seconda gi contenuto nella prima purch per ogni chiuso e per ogni punto
fuori di esso ci sia una funzione in F che li separa.
Sia O un aperto di e x O. Allora x
/ C := O, e per (*) esiste f F tale
che f (x) = 1 ma F 0 su C. Poich f continua, esiste allora un intorno
aperto Ux di x dove f > 1 , ovvero |f (y) f (x)| < per ogni y Ux .
Questo signica che Ux = Ox (; f ) un aperto di base della topologia debole
w . Pertanto ogni x nellaperto O appartiene ad un aperto di base in w
contenuto in O: quindi O unione di parti di base in w e pertanto esso
stesso un aperto di w .
Inne, se lo spazio topologico X verica la propriet T3 , le funzioni continue
separano i punti dai chiusi, e quindi la parte (iv) segue dalla parte (iii).

1.14

Approssimazione di funzioni misurabili con


funzioni continue e semicontinue

Le funzioni misurabili, ed in particolare quelle integrabili, si possono approssimare con funzioni continue o semicontinue.
Definizione 1.14.1. (Funzioni semicontinue.) Una funzione a valori
reali (o ) si dice semicontinua superiormente se per ogni R linsieme

108 CAPITOLO 1. PANORAMICA SU CALCOLO ED ANALISI REALE


{x : f (x) > } aperto, e semicontinua inferiormente se per ogni R
linsieme {x : f (x) < } aperto.
Nota 1.14.2. Una funzione a valori reali continua se e solo se la controimmmagine di ogni intervallo aperto aperta,ossia se allo stesso tempo
semicontinua superiormente ed inferiormente.

Esercizio 1.14.3. (i) Le funzioni caratteristiche (Denizione 1.1.3) degli insiemi aperti sono semicontinue inferiormente, quelle dei chiusi sono
semicontinue superiormente.
(ii) Le funzioni semicontinue sono misurabili (Suggerimento: si veda la
Nota 1.9.40).
(iii) Se f semicontinua superiormente, per ogni > 0 e x esiste un intorno
aperto Ix x tale che, per ogni t Ix , si ha f (t) f (x) > .
(iii) Come conseguenza della parte
R x (iii), se f semicontinua superiormente
allora la funzione F (x) = a f (t) dt verica |F (x) F (y)| > |x y|
per ogni y in un intorno aperto sucientemente piccolo di x.
(iv) Se f semicontinua inferiormente, per ogni > 0 e x esiste un intorno
aperto Ix x tale che, per ogni t Ix , si ha f (t) f (x) < .
(v) Come conseguenza della parte
R x (iv), se f semicontinua inferiormente
allora la funzione F (x) = a f (t) dt verica |F (x) F (y)| < |x y|
per ogni y in un intorno aperto sucientemente piccolo di x.
(vi) Lestremo superiore di una famiglia di funzioni semicontinue inferiormente una funzione semicontinua inferiormente; lestremo inferiore
di una famiglia di funzioni semicontinue superiormente semicontinuo
superiormente.

Ecco la propriet di approssimazione con funzioni semicontinue:


Teorema 1.14.4. (VitaliCarathodory.) Sia X uno spazio di misura
munito di una misura di Borel regolare , ad esempio la retta reale con la
misura di Lebesgue. Per ogni f : X R e > 0 esistono funzioni u
e v semicontinue su X rispettivamente superiormente ed inferiormente tali
che
R u 6 f 6 v, u limitata superiormente, v limitata inferiormente e
(v u) d < .
X

1.14.

APPROSSIMAZIONE CON FUNZIONI SEMICONTINUE O CONTINUE109

Dimostrazione. Basta dimostrare lenunciato per f > 0, perch, una volta


trattato questo caso particolare, ogni funzione a valori reali f si spezza come
somma f = f + f delle sue parti positiva e negativa, dal caso particolare si
ricavano per queste due funzioni non negative gli approssimanti semicontinui
inferiore e superiore u+ 6 f + 6 v + e u 6 f 6 v , e si ottengono gli
approssimanti semicontinui di f come u+ v 6 f = f + f 6 v + u .
Assumiamo quindi f > 0. Sappiamo dal Teorema 1.9.46 che esiste una
successione crescente di funzioni semplici s1 6 s2 6 6 sn 6 . . . tale
che f (x) = lim sn (x) per ogni x. Ponendo s0 = 0Pe considerando le dierenze consecutive dn = sn sn1 otteniamo f =
n=1 dn . Le funzioni dn
sono semplici, e quindi sono combinazioni lineari di funzioni caratteristiche
(Denizione 1.1.3). Questo signica che esistono costanti ci > 0 ed insiemi
misurabili Ei X (non necessariamente disgiunti,
P visto che f non necessariamente una funzione semplice) tali che f =
i=1 ci Ei . Poich i termini
di questa serie sono positivi, le somme parziali sono non decrescenti. Allora,
dal Teorema di Convergenza Monotna (Teorema 1.9.53) segue
Z

f d =

(1.31)

ci (Ei ) .

i=1

Lipotesi f L1 (X, ) implica quindi che la serie a secondo membro converga.


Ora, in base alla Denizione 1.9.11 di misura regolare ed al Lemma 1.9.33,
per ogni i possiamo scegliere un compatto Ki ed un aperto Vi tali che Ki
Ei Vi e ci (Vi \ Ki ) < /2i+1 . Osserviamo che con questa scelta si ha

X
i=1

ci (Vi \ Ki ) <

.
2

(1.32)

P
P
Allora le funzioni v :=
i=1 ci Vi e, per ogni intero N ssato, u :=
i=1 ci Ki
sono semicontinue rispettivamente inferiormente e superiormente, in base
allEsercizio 1.14.3, e u 6 f 6 v. Osserviamo che
vu=

N
X
i=1

ci (Vi Ki ) +

i=N +1

ci Vi 6

X
i=1

ci (Vi Ki ) +

ci Ei .

i=N +1

P
Allora scegliamo N cos grande che si abbia !!
i=N +1 ci (Ei ) < /2 (questo
possibile perch la serie a secondo membro di (1.31) converge). Da questo

110 CAPITOLO 1. PANORAMICA SU CALCOLO ED ANALISI REALE


fatto e dalla disuguaglianza 1.32 segue
Z

(v u) d =

X
i=1

ci (Vi Ki ) +

X
i=1

ci (Ei ) <


+ = .
2 2

Il prossimo enunciato mostra che le funzioni misurabili si approssimano


in misura con funzioni semplici e con funzioni continue.

Proposizione 1.14.5. Sia f una funzione misurabile su [a, b] finita quasi


ovunque. Allora, per ogni > 0, esiste una funzione continua g tale che
|f g| < tranne che su un insieme di misura minore di . Inoltre, se
m 6 f 6 M, si pu scegliere g tale che m 6 g 6 M.
Dimostrazione. Anzitutto, mostriamo che, dato > 0, esiste M tale che
|f | < M tranne che su un insieme di misura minore di /3: in eetti, questo
equivale allipotesi che la misura aM dellinsieme {x : |f (x)| > M} tenda a
zero per M .
Ora mostriamo che, dati questi M e , sullinsieme {x : |f (x)| 6 M} esiste
una funzione semplice h tale che |f h| < . Infatti, basta scegliere una
successione equispaziata di passo minore di di punti y0 = M < y1 <
< yN = M, porre Ei := {x [a, b] : yi 6 f (x) < yi+1} e scegliere come h
la combinazione P
lineare delle funzioni caratteristiche degli insiemi (disgiunti!)
Ei data da h = i yi Ei . Poich f misurabile (Denizione 1.9.39), gli Ei
sono insiemi misurabili e quindi h una funzione semplice, ed ovvio dalla
sua costruzione che verica la disuguaglianza |f h| < laddove |f | 6 M, e
m 6 h 6 M se m 6 f 6 M.
Daltra parte, la misura di Lebesgue regolare (Proposizione 1.18.6, e quindi
gli insiemi Ei sono approssimabili con unioni nite Ai di intervalli aperti a
meno di misura /3 (Lemma 1.9.33). Pertanto le corrispondenti combinazioni
lineari delle funzioni caratteristiche di questi intervalli aperti formano una
funzione a gradini k tale che |h k| < e m 6 k 6 M se m 6 h 6 M.
Ora, ogni funzione a gradini k si approssima con una funzione continua g
tale che g(x) = k(x) eccetto che in un insieme di misura minore di /3, e se
m 6 k 6 M possiamo scegliere m 6 g 6 M: infatti, basta rendere continua
la funzione a gradini rimpiazzandola con raccordi lineari negli intervalli di
ampiezza /3K centrati ai suoi K punti di salto.
Combinando queste tre approssimazioni si ottiene lenunciato.

1.14.

APPROSSIMAZIONE CON FUNZIONI SEMICONTINUE O CONTINUE111

Anche se gi contenuto nella dimostrazione della precedente Proposizione 1.14.5, rienunciamo (e ridimostriamo) il seguente fatto come conseguenza
a s stante:
Esercizio 1.14.6. Sia f una funzione misurabile su [a, b] nita quasi ovunque.
Allora, per ogni > 0, esiste una funzione a gradini t tale che |f t| <
tranne che su un insieme di misura minore di . Inoltre, se m 6 f 6 M, per
ogni > 0 si pu scegliere t tale che m 6 t 6 M + .
Svolgimento. In base alla Proposizione 1.14.5, esiste una funzione continua g
che approssima uniformemente f a meno di /2 tranne che su un insieme di
misura inferiore a , e se i valori di f sono compresi fra m e M si pu scegliere
g entro gli stessi limiti. Daltra parte, per il Teorema di Heine sulla uniforme
continuit (Sezione 1.1), g uniformemente continua in [a, b] o equivalentemente esiste una funzione a gradini t che approssima g uniformente ovunque
a meno di /2 (per maggiori dettagli si consulti la dimostrazione della parte
(i) del Lemma 5.13.4 nel seguito). Ora il risultato segue dalla disuguaglianza
triangolare.

Nota 1.14.7. Largomento che permette di passare da funzioni a gradini a


funzioni continue alla ne della dimostrazione della Proposizione 1.14.5 e
che riformulato in maniera diversa nel precedente Esercizio 1.14.6 verr
riutilizzato per dimostrare che le funzioni C 1 [a, b] sono uniformemente dense
nelle funzioni continue su [a, b] (Lemma 5.13.4).

Ora veniamo al cosiddetto terzo principio di Littlewood, il cui senso


che ogni successione puntualmente convergente di funzioni misurabili quasi
uniformemente convergente. Cominciamo con una variante pi debole della
versione generale. Questa variante asserisce che le successioni {fn } di funzioni misurabili che convergono puntualmente quasi ovunque su un insieme
di misura nita si avvicinano al loro limite anche uniformemente a meno di
insiemi di misura arbitrariamente piccola purch lindice n sia abbastanza
grande, ma per ora lindice al quale lapprossimazione uniforme diventa vera
dipende dalla misura dellinsieme eccezionale.
Lemma 1.14.8. Sia m(E) < e fn una successione di funzioni misurabili
su E tale che, per quasi ogni x E, esiste f (x) tale che limn fn (x) = f (x).
Per ogni , > 0 esistono un sottoinsieme misurabile A E con m(E \A) <
e N > 0 tali che |fn (x) f (x)| < per ogni x E \ A.

112 CAPITOLO 1. PANORAMICA SU CALCOLO ED ANALISI REALE


Dimostrazione. Sappiamo che il limite puntuale f ancora una funzione
misurabile (Esercizio 1.9.41). Pertanto linsieme Bn := {x : |fn (x) f (x)| >
} misurabile, e lo anche
EN :=

n=N

Bn = {x : |fn (x) f (x)| >

per qualche

n > N} .

La famiglia di insiemi EN decrescente, e per quasi ogni x E esiste N


tale
/ EN , perch fn (x) f (x) quasi ovunque. Quindi lintersezione
T che x
E
ha
misura zero, e, visto che EN +1 EN e m(E) < , possiamo
N
N
invocare il Corollario 1.9.12 per concludere che limN EN = 0. Questo signica
che, per ogni > 0, esiste N tale che m(EN ) < . Abbiamo provato che
m({x : |fn (x) f (x)| >

per qualche

n > N}) < .

Questo insieme EN quindi linsieme A dellenunciato.


Pi in generale:

Corollario 1.14.9. (Teorema di Egoroff.) Sia m(E) < e fn una


successione di funzioni misurabili su E tale che converge a f puntualmente
quasi ovunque. Allora per ogni > 0 esiste A E misurabile tale che
m(A) < e fn converge a f uniformemente su E \ A.
Dimostrazione. Applichiamo il Lemma 1.14.8 con tendente a zero, diciamo
= 1/n, e = 2n , per ottenere un sottoinsieme misurabile An E
con m(E \ An ) < 2n e N > 0 tali che |fn (x) f (x)| < 1/n per ogni
x E \ An . Si osservi che, per x E \ n>N An = n>N An := BN , tutte
le funzioni fn con n > si avvicinano a f a meno di 1/N. La famiglia BN
crescente:
P BN BN +1 . Grazie alla additivit numerabile della misura,
m(BN ) 6 n>N 2n . Quindi, ponendo A := N BN , abbiamo m(A) =
, e su E \ A le funzioni fn convergono uniformemente a f .

Inne, il prossimo risultato, talora chiamato secondo principio di Littlewood, illustra lapprossimabilit di funzioni misurabili con funzioni continue.

Teorema 1.14.10. (Lusin.) Sia X uno spazio di misura munito di una


misura di Borel regolare , e A X un insieme misurabile di misura finita:
(A) < (ad esempio un compatto in R con la misura di Lebesgue). Per
ogni f : X C misurabile (o meglio, in L (R, )) con supporto in A, e

1.14.

APPROSSIMAZIONE CON FUNZIONI SEMICONTINUE O CONTINUE113

per ogni > 0, esiste una funzione g continua a supporto compatto su X che
approssima f in misura, nel senso che ({x : f (x) 6= g(x)}) < .
Inoltre si pu scegliere g in modo che kgk 6 kf k
Dimostrazione. Osserviamo anzitutto che si pu restringere lattenzione al
caso in cui A sia compatto, perch la misura regolare, ovvero (Proposizione
1.18.6) ogni insieme di misura nita contiene un sottoinsieme compatto di misura arbitrariamente vicina. Fissato > 0, sappiamo dal Teorema di Egoro
(Corollario 1.14.9) che esiste un sottoinsieme misurabile B A con misura
m(B) < /2 ed una successione di funzioni misurabili {fn : n = 1, 2, . . . } su
A che convergono uniformemente a f in A\B: ad esempio possiamo scegliere
fn in modo che supA\B |fn f | < 1/n.
Ora, in base alla Proposizione 1.14.5, ciascuna funzione fn si pu approssimare a meno di 1/n con una funzione continua gn tranne che su un insieme
En di misura minore di /2n+1. Allora linsieme E := n>1 En ha misura
m(E) 6

m(En ) <

= ,
n+1
2
2
n>1

linsieme B E ha misura minore di ed in A \ (B E) si ha


sup |gn f | 6 sup |gn fn | + sup |fn f | <
n

1
2
1
+ = .
n n
n

Quindi le funzioni gn sono continue in A \ (B E) ed ivi convergono uniformemente a f . Pertanto f continua in D := A \ (B E) (Teorema 1.3.16) e
m(A \ D) = m(B E) < . Per a noi serve un approssimante di f che sia
continuo in tutto A.
Di nuovo perch la misura regolare (Lemma 1.9.33), linsieme D A di
misura nita contiene un sottoinsieme compatto C di misura arbitrariamente
vicina, diciamo m(D \ C) < . In particolare, A \ C = (A \ D) (D \ C) e
m(A \ C) = m(A \ D) + m(D \ C) < 2. Inoltre, per il Teorema 1.10.14 di
estensione di Tietze, esiste una funzione continua g su tutto A che coincide
con f sullinsieme chiuso C. Questa funzione g verica quindi la condizione
dellenunciato se si pone = /2.

114 CAPITOLO 1. PANORAMICA SU CALCOLO ED ANALISI REALE

1.15

Funzioni convesse e disuguaglianza di Jensen

Le propriet elementari delle funzioni convessa di una variabile sono oggetto


di studio nei corsi di base di Analisi Matematica. Le presentiamo qui in
maniera pi completa.
Definizione 1.15.1. (Convessit) Una funzione denita su un intervallo
aperto (a, b) convessa se per ogni , 0 6 6 1, e per ogni x, y in (a, b) vale
la disuguaglianza
(x + (1 )y) 6 (x) + (1 )(y)
Nota 1.15.2. Geometricamente, la propriet di convessit si esprime dicendo
che la corda che unisce ogni coppia di punti del graco di in (a, b) (di ascisse,
diciamo, x e y) sta al di sopra del graco di in (x, y). La propriet opposta
si chiama concavit. Le funzioni lineari sono simultaneamente concave e
convesse, e sono le uniche funzioni con questa propriet.

Definizione 1.15.3. Dati due intervalli (x, y) e (x , y ) in R, diciamo che il


secondo comincia a destra del primo se x 6 x , e nisce a destra del primo
se y 6 y .
Con questa notazione si ha:
Lemma 1.15.4. Se convessa in (a, b) e x,y, x , y (a, b) sono tali che
x < y, x < y e lintervallo I+ (x , y ) comincia a destra e finisce a destra
di I (x, y), allora la pendenza della corda sottesa dai punti estremi del
grafico di in I non superiore a quella della corda sottesa da in I+
(Figura 1.12):
(y ) (x )
(y) (x)
6
.
yx
y x
Dimostrazione. Per comodit consideriamo solo il caso in cui i quattro punti
sono distinti: il caso generale si dimostra allo stesso modo (le disuguaglianza
possono essere uguaglianze).
Supponiamo dapprima che i due intervalli si intersechino, cio che si abbia
x < x < y < y . In tal caso, in conseguenza della interpretazione geometrica

1.15. FUNZIONI CONVESSE

115

Figura 1.12: La pendenza della corda dellintervallo di destra maggiore di quello di


sinistra

della convessit enunciata nella Nota 1.15.2, il punto (x , (x )) del graco


di sta al di sotto (o meglio, non strettamente al di sopra) della corda
che congiunge i punti (x, (x)) e (y, (y)), e quindi della retta che contiene
tale corda. Viceversa il punto (y , (y )) sta al di sopra di tale retta, perch
altrimenti la corda da (x , (x )) a (y , (y )) passerebbe al di sopra del punto
(y, (y)). Questi fatti equivalgono allenunciato in questo caso.
Se invece x < y < x < y , allora il punto (y, (y)) sta al di sotto (cio non
al di sopra) della retta che congiunge i punti (x, (x)) e (x , (x ), e quindi la
pendenza della corda fra (x, (x)) e (y, (y)) non superiore a quella della
corda fra (x, (x)) e (x , (x ). Daltra parte, per lo stesso ragionamento, tale
pendenza non superiore a quella della corda sottesa da (y, (y)) e (x , (x ),
la quale a sua volta non superiore alla pendenza della corda fra (y, (y))
e (y , (y ), che inne non superiore a quella della corda fra (x , (x )) e
(y , (y )). Questo completa la dimostrazione.

Definizione 1.15.5. Siano convessa in (a, b) e x0 (a, b) un punto in


cui esistono nite le derivate destra e sinistra di . Consideriamo una retta
generica che tocca il graco di in x0 (a, b) (ossia di equazione y =
(x0 ) + m(x x0 )). Diciamo che una tale retta subordinata a al punto
x0 se giace al di sotto del suo graco, cio se (x0 ) + m(x x0 ) 6 (x) per
ogni x (a, b).
Corollario 1.15.6. Nella terminologia della precedente Definizione 1.15.5,
una retta subordinata a al punto x0 se e solo se D (x0 ) 6 m 6 D+ (x0 ).
Se le due derivate coincidono, esiste ununica retta subordinata al punto x0
ed la retta tangente al grafico.

116 CAPITOLO 1. PANORAMICA SU CALCOLO ED ANALISI REALE

Figura 1.13: La pendenza delle corde cresce se il punto finale si sposta a destra

Figura 1.14: Varie rette subordinate: ai punti di derivabilit c solo la tangente

La geometria delle corde sottese o subordinate al graco di una funzione


convessa illustrata anche nelle Figure 1.13 e 1.14.
Proposizione 1.15.7. Se convessa in (a, b), allora continua in ogni
sottointervallo chiuso di (a, b). Inoltre le derivate destra D+ e sinistra D
esistono ovunque e coincidono tranne che su un insieme al pi numerabile.
D+ e D sono due funzioni monotne non decrescenti tali che, per ogni x
in (a, b), si ha D (x) 6 D+ (x).
Dimostrazione. Fissiamo a < c < d < b. Per ogni x, y nellintervallo chiuso
[c, d] segue dal Lemma 1.15.4 che
(y) (x)
(b) (d)
(c) (a)
6
6
.
ca
yx
bd

1.15. FUNZIONI CONVESSE


Sia M = max

(c)(a) (b)(d)
, bd
ca

117
o
. Allora per ogni x, y in [c, d]

|(y) (x)| 6 |M||y x|

e quindi continua in [c, d].


Ancora per il Lemma 1.15.4, per ogni x0 in (a, b) la funzione rapporto
incrementale
(x) (x0 )
x 7
x x0
monotna non decrescente, e quindi, a causa dellesistenza dei limiti di
funzioni monotne, ha limiti destro e sinistro niti per x x0 : quindi
D+ (x0 ) e D (x0 ) esistono niti per ogni x0 in (a, b), e D (x0 ) 6 D+ (x0 ).
Ora prendiamo a < x0 < y0 < b, e |h| < y0 x0 . Sia x = x0 + h,
y = y0 + h: allora x < y0 e x0 < y, quindi lintervallo (y0 , y) comincia e
nisce a destra di (x0 , x) (la terminologia quella della Denizione 1.15.3).
Ancora dal Lemma 1.15.4 segue che
(x) (x0 )
(y) (y0)
(y0 + h) (y0 )
(x0 + h) (x0 )
=
6
=
,
h
x x0
y y0
h

e pertanto ciascuna delle due derivate al punto x0 non superiore a ciascuna


di esse a y0 : pi precisamente,
D (x0 ) 6 D+ (x0 ) 6 D (y0) 6 D+ (y0 ) .

(1.33)

Quindi entrambe le derivate sono monotne, e sono uguali in ogni punto in


cui una di esse continua (perch se limx0 y0 D (x0 ) = D (y0), allora
1.33 implica che anche
lim D+ (x0 ) = D (y0 )

x0 y0

(1.34)

e quindi anche laltra derivata ha lo stesso limite a x0 , ed allora nessuna delle


due pu avere salti e, grazie a (1.34), devono essere uguali.
Inne, una funzione monotna pu avere solo un insieme numerabile di
salti, perch la serie dei salti non pu superare lescursione dei valori della
funzione. Quindi le due derivate devono essere continue ovunque tranne che
in un insieme al pi numerabile.

Abbiamo cos provato che la convessit implica la monotonia delle derivate. Viceversa:

118 CAPITOLO 1. PANORAMICA SU CALCOLO ED ANALISI REALE


Proposizione 1.15.8. Se continua su (a, b) ed ammette derivata sinistra
(oppure destra) non decrescente, allora convessa.
Dimostrazione. Supponiamo che la derivata destra di sia non decrescente.
In questa dimostrazione, per semplicit, scriviamo crescente invece che non
decrescente, e se necessario denoteremo come strettamente crescente le funzioni che nora abbiamo chiamato crescenti ; analogamente per le funzioni
decrescenti.
Dire che convessa in (a, b) equivale a dire che per ogni a < x < y < b
la funzione dierenza
(t) = [ty + (1 t)x] t(y) (1 t)(x)

negativa o nulla nellintervallo [0, 1]. Osserviamo che (0) = 0 = (1),


e t 7 D+ (t) = (y x)D+ [ty + (1 t)x] (y) + (x) anchessa una
funzione crescente di t in [0, 1].
Poich continua ha un punto di massimo. Sia t0 tale punto. Se t0 = 1
allora il valore massimo di (1) = 0, e quindi negativa o nulla ed
il risultato dimostrato. Se invece t0 < 1 allora D+ (t0 ) = 0. Daltra
parte, poich D+ crescente, questo implica D+ 6 0 in [0, t0 ]. Allora
(t0 ) 6 (0) = 0, e quindi il massimo valore di negativo o nullo.

Una conseguenza immediata di questi due risultati continuamente usata


nello studio del graco delle funzioni:

Corollario 1.15.9. Una funzione derivabile due volte convessa in un intervallo aperto se e solo se ha derivata seconda non negativa in tutto lintervallo
Proposizione 1.15.10. (Disuguaglianza di Jensen.) Se una funzione convessa su R e f una funzione integrabile definita in [0, 1],
Z 1
 Z 1

f (t) dt 6
(f (t)) dt .
(1.35)
0

Se invece f definita in un intervallo [a, b] la disuguaglianza diventa


Z b

Z b
1

f (t) dt 6
(f (t)) dt .
(1.36)
ba a
a
Dimostrazione. Sia f una funzione ! integrabile sullintervallo [0, 1] e I =
R1
f (t) dt e consideriamo una retta subordinata a al punto I, nel senso del
0

1.16. SPAZI LP

119

Corollario 1.15.6. Scriviamo lequazione di questa retta y = (I) + m(x I).


Dalla denizione di retta subordinata segue che
(f (t)) > (I) + m(f (t) I)
R1
per ogni 0 6 t 6 1. Poich I = 0 f (t) dt, integrando entrambi i termini
di questa equazione sullintervallo [0, 1] si ottiene la disuguaglianza (1.35).
Rb
Se invece f ha supporto in [a, b] poniamo I = a f (t) dt ed otteniamo (1.36)
dallo stesso argomento.

La disuguaglianza di Jensen asserisce che il valore di una funzione convessa al baricentro di una distribuzione di massa f non pi grande del
baricentro dei valori. La denizione di convessit 1.15.1 aerma la stessa cosa
nel caso in cui la distribuzione consista di due soli punti materiali di massa
rispettivamente
x e y. Si noti che, iterando questa denizione, si ottiene che,
PN
se n=0 an = 1,
!
N
N
X
X

an xn 6
an (xn ) ,
n=0

n=0

che una versione discreta della forma integrale della disuguaglianza di


Jensen (1.35).

1.16

Spazi Lp

Un altro esempio di spazi vettoriali di dimensione innita si ottiene, per


1 6 p < , nel modo seguente:
Definizione 1.16.1.

Z
p
L = f : R C misurabile :

|f (x)| dx <

(1.37)

Se le funzioni sono denite non su tutto R ma solo su un sottoinsieme misurabile secondo Lebesgue I R, lintegrale in (1.37) ovviamente si eettua
solo su I, e la sua nitezza individua le funzioni nello spazio Lp (I).
Quando abbiamo bisogno di utilizzare lintegrale rispetto ad una specica
misura m diversa da quella che ad un intervallo associa la sua lunghezza,
allora scriviamo Lp (m), oppure Lp (I, m).

120 CAPITOLO 1. PANORAMICA SU CALCOLO ED ANALISI REALE


Consideriamo la seguente espressione, tramite la quale deniremo una
norma per Lp :
kf kp =

Z

 1p
|f (x)| dx
p

(1.38)

Sia ora p = . Vogliamo denire uno spazio L (R) (o L (I)). Per fare ci
occorre denire lestremo superiore essenziale di una funzione f .
Definizione 1.16.2. (Estremo superiore essenziale e norma L .) Sia
g una funzione denita su R a valori non negativi. Sia S linsieme di tutti i
numeri reali tali che

m g 1 (, ] m ({x : < g(x) 6 }) = 0.

Se S = , poniamo = +.
Se S 6= , poniamo = inf S.
Allora si dice estremo superiore essenziale di g, e si scrive = ess supxR g(x).
Poniamo
kf k = ess supx |f (x)| .
(1.39)
Esercizio 1.16.3. Si mostri che ess supxR f (x) = inf{suptR g(t)} dove lestremo inferiore preso sullinsieme delle funzioni g che coincidono con f
quasi ovunque.
Equivalentemente, si mostri che ess supxR f (x) = inf{ : m{t : f (t) > } =
0}.

Il primo passo per mostrare che, per p > 1, (1.38) una norma provare
la disuguaglianza triangolare, che nel caso della norma in Lp si chiama disuguaglianza di Minkowski. Potremmo darne una dimostrazione diretta (si
veda ad esempio [22, Cap. 6, Sezione 2], ma preferiamo ottenerla in modo
pi elegante come conseguenza di unaltra disuguaglianza, la disuguaglianza
di Hlder, la quale a sua volta richiede un breve calcolo che presenteremo
come lemma separato.
Definizione 1.16.4. (Indici coniugati.) Siano 1 6 p, q 6 . Diciamo
che p e q sono indici coniugati se
1 1
+ =1
p q
dove si intende

= 0.

1.16. SPAZI LP

121

Lemma 1.16.5. Siano 1 6 p, q < due indici coniugati (1/p + 1/q = 1),
e a, b > 0. Allora
1
1
ab!!! 6 ap + bq .
p
q
Dimostrazione. Senza perdita di generalit possiamo assumere 1 < p 6 q <
. Poich 1/p + 1/q = 1 questo implica p 6 2 6 q. Perci la funzione
(x) = xq1 convessa per x > 0 (si riveda lEsercizio 1.7.3, oppure, se non
si svolto quellesercizio, si applichi il Corollario 1.15.9). Osserviamo anche
che la condizione 1/p + 1/q = 1 equivale a p + q = pq, e quindi
(p 1)(q 1) = pq p q + 1 = 1 .

(1.40)

Perci la funzione inversa 1 data da 1 (y) = y p1.


Si consideri il graco di , illustrato nella gura seguente:

xp

III
a

II

Figura 1.15: Grafico di a = bq1


Ra
La regione I ha area 0 ap1 da = ap /p. La somma delle aree delle regioni
Rb
II e III 0 bq1 db = bq /q. Quindi il rettangolo di base b ed altezza a
costituito dallunione di I e II ha area inferiore a ap /p + bq /q. Questo prova
la disuguaglianza.

Teorema 1.16.6. (Disuguaglianza di Hlder.) Se p e q sono indici


coniugati (nel senso della precedente Definizione 1.16.4) e f Lp , g Lq ,
allora
Z
|f g| 6 kf kp kgkq .
(1.41)

122 CAPITOLO 1. PANORAMICA SU CALCOLO ED ANALISI REALE


Vale luguaglianza se e soltanto se una fra f e g nulla quasi ovunque (cio
se f o g la funzione nulla nella classe di equivalenza di Lebesgue), oppure
se |f |p un multiplo di |g|q .
Dimostrazione. Il caso p = 1, q = (o viceversa) ovvio, perci assumiamo
1 < p, q < . La disuguaglianza ovvia se f o g nulla quasi ovunque,
perch allora lo anche il prodotto |f g|. Se entrambe le funzioni non sono
quasi ovunque nulle le loro norme rispettivamente in Lp e Lq sono positive.
Normalizziamo in maniera da avere kf kp = 1 = kgkq , ed applichiamo il
Lemma 1.16.5 al prodotto f (x)g(x), ottenendo
Z
Z
Z
1
1 1
1
p
|f (x)| dx +
|g(x)|q dx = + = 1 . (1.42)
|f (x)g(x)| dx 6
p
q
p q
Abbiamo gi notato che si ha pq = p + q. Perci p = p + q q = pq
q = q(p 1). Quindi, se |f |p un multiplo di |g|q , allora |g| = M|f |p/q =
M|f |p1. In questo caso ovvio che nella disuguaglianza di Hlder vale
luguaglianza. Viceversa, se vale luguaglianza, allora applicando il Lemma
1.16.5 al prodotto di a = |f (x)| e b = |g(x)| si deve avere luguaglianza per
quasi ogni x. Questo signica che la regione III nella gura si restringe ad un
solo punto per quasi ogni x, e cio che a = |f (x)| = (b) = bq1 = |g(x)|q1
quasi ovunque. Poich abbiamo mostrato che q 1 = 1/(p 1), questo
equivale a dire che |f |p = |g|q a meno di normalizzazione (per ottenere (1.42)
abbiamo normalizzato f e g).
Corollario 1.16.7. (Calcolo della norma Lp per dualit sulla sfera
unitaria di Lq .) Per ogni f Lp , 1 6 p 6 ,

 Z



kf kp = sup f g : kgkq = 1 = sup {kf gk1 : kgkq = 1} .

(1.43)

Dimostrazione. Segue dalla disuguaglianza di Hlder (1.41) che kf kp maggiore o uguale dellestremo superiore sul lato destro delluguaglianza. Abbiamo visto alla ne della dimostrazione del Teorema 1.16.6 che vale luguaglianza se scegliamo |g(x)| multiplo di |f (x)|p1 quasi ovunque.

Gli stessi argomenti che provano la disuguaglianza di Hlder per gli spazi
L si applicano parola per parola alle successioni invece che alle funzioni (dopo
p

1.16. SPAZI LP

123

aver rimpiazzato gli integrali con serie), e cio agli spazi p della Denizione
1.7.1 (pi in generale, si applicano agli spazi Lp () dove una qualsiasi
misura di Borel, inclusa la misura discreta nella quale Lp () = p : si vedano
nel seguito la Denizione 1.9.11, lEsempio 1.9.22 e la ne della Denizione
1.9.47).
Si ha quindi:
Corollario 1.16.8. (i) Se p e q sono indici coniugati (Definizione 1.16.4)
e f p , g q , allora

X
n=1

|fn gn | 6 kf kp kgkq .

Vale luguaglianza se e soltanto se una fra f e g la successione nulla


oppure se |f |p un multiplo di |g|q .
(ii) Per ogni f p , 1 6 p 6 ,
n X
o


q
kf k = sup
f g : kgk = 1 = sup {kf gk1 : kgkq = 1} .
p

Nota 1.16.9. Il fatto che con la stessa dimostrazione si provi la disuguaglianza


di Hlder in forma integrale per gli spazi Lp ed in forma discreta (di serie)
per gli spazi p non una coincidenza fortuita. Infatti, in entrambi i casi in
realt abbiamo usato le stesse stime per integrali, ma nel caso discreto questi
integrali non sono stati deniti in termini della misura di Lebesgue, bens di
una misura discreta, la misura che conta, introdotta nellEsempio 1.9.22. Gli
integrali rispetto a questa misura sugli interi sono serie.

Teorema 1.16.10. (Disuguaglianza di Minkowski.) Per ogni coppia di


funzioni misurabili f e g, per ogni p tale che 1 6 p 6 ,vale la disuguaglianza
kf + gkp 6 kf kp + kgkp .

Vale luguaglianza se e solo se una delle due funzioni identicamente nulla


oppure un multiplo dellaltra con un fattore di proporzionalit positivo.
Dimostrazione. La disuguaglianza chiara se p = 1 (e p = ). In generale,
da questo fatto e dallidentit

124 CAPITOLO 1. PANORAMICA SU CALCOLO ED ANALISI REALE


1.43 segue:
kf + gkp = sup {k(f + g)hk1 : khkq = 1}
6 sup {kf hk1 : khkq = 1} + sup {kghk1 : khkq = 1}
= kf kp + kgkp .

Esercizio 1.16.11. NellAppendice 1.31 diamo una dimostrazione diretta della


disuguaglianza di Minkowski che permette di considerare anche il caso 0 <
p < 1, e che mostra che per questi valori di p la disuguaglianza vale nel
verso opposto (Nota 1.31.1), e quindi lespressione kf kp non pi una norma
perch non verica la disuguaglianza triangolare. Rivedendo per analogia
la forma delle sfere negli spazi p (Nota 1.7.10), si determini la forma di
queste sfere per 0 < p < 1 e si osservi che smette di essere convessa. Si
deduca questo fatto dal fatto che non vale la disuguaglianza triangolare. Per
ulteriori approfondimenti si veda la Nota ??, che il presente esercizio anticipa.

.
Nota 1.16.12. Ad essere precisi, lespressione k kp cos denita non una
norma. Infatti esistono funzioni f non identicamente nulle con kf kp = 0.
Un esempio dato dalla funzione caratteristica dei numeri razionali, o pi in
generale dalla funzione caratteristica di un insieme di misura nulla (Esempi
1.9.49 e 1.9.23).
Per ovviare a questo problema e far s che kkp sopra denita sia una norma, si ridenisce lo spazio Lp (R) come uno spazio costituito non da funzioni,
bens da classi di equivalenza di funzioni.

La nozione di relazione di equivalenza stata gi rammentata nella Denizione 1.2.12. Una relazione di equivalenza su un insieme determina una
partizione in classi di equivalenza:
Definizione 1.16.13. Sia a I. La classe di equivalenza di a costituita
da tutti gli elementi b I tali che b a e si indica con [a]. Quindi
[a] = {b I : b a} .

1.16. SPAZI LP

125

Definizione 1.16.14. (Equivalenza quasi ovunque.) Sullinsieme delle


funzioni misurabili introduciamo la seguente relazione di equivalenza:
f g se e solo se f = g quasi ovunque (nel senso stabilito nella Denizione
1.9.16).
Esercizio 1.16.15. Vericare che tale relazione una relazione di equivalenza.

Rideniamo quindi correttamente gli spazi Lp :


Definizione 1.16.16. (Definizione precisa degli spazi Lp .) Gli elementi
di Lp (R) sono classi di equivalenza di funzioni misurabili (secondo la relazione
di equivalenza quasi ovunque denita sopra).
Nota 1.16.17. Se una classe di equivalenza Lp contiene una funzione continua, questa lunico rappresentante continuo della classe. Infatti, se ci
fossero due rappresentanti continui diversi f e g, allora f g sarebbe una
funzione continua non nulla. Prendiamo un punto x in cui f (x) 6= g(x). Per
il teorema degli zeri per le funzioni continue (o teorema di permanenza del
segno: Sezione 1.1) esiste un intorno di aperto O di x tale che f (t) 6= g(t) per
ogni t O. PoichRO contiene un
aperto, ha misura strettamente
R intervallo
p
p
positiva. Pertanto R |f g| > O |f g| > 0, e questo contraddice lassunzione che f e g fossero nella stessa classe di equivalenza Lp . Il ragionamento
analogo per le classi di equivalenza L : visto che f e g non coincidono
su un insieme O di misura positiva, ess sup |f g| deve essere strettamente
positivo (esercizio).

Sugli elementi degli spazi Lp (R) cos deniti lespressione


kf kp =

Z

 1p
|f (x)| dx
p

risulta essere una norma.


Esercizio 1.16.18. (i) Si controlli che kkp verica le tre propriet della
denizione di norma (Denizione 1.2.8).
( ii) Invece, per 0 < p < 1, questa quantit non verica la disuguaglianza
triangolare, e quindi non una norma.

126 CAPITOLO 1. PANORAMICA SU CALCOLO ED ANALISI REALE


Suggerimento: la dimostrazione si basa sul Lemma 1.7.5 (in caso di
dicolt la si pu trovare nella Sottosezione 3.21.1).

Nota 1.16.19. Se I = [a, b] un intervallo reale, o pi in generale un sottoinsieme di R di misura di Lebesgue positiva, possiamo ora denire Lp (I) come
linsieme delle classi di equivalenza di funzioni misurabili su [a, b] tali che
Z

b
a

|f (x)|p dx < .

Nel caso p = , lo spazio L (I) linsieme delle classi di equivalenza di funzioni misurabili su I tali che ess supI f (x) < . Si noti che indispensabile
far ricorso allestremo superiore essenziale, che per sua denizione identico
per tutti i rappresentanti della stessa classe di Lebesgue (Denizione 1.16.2
ed Esercizio 1.16.3). Lestremo superiore ordinario non sarebbe invece ben
denito sulla classe di Lebesgue, perch cambia da rappresentante a rappresentante: infatti esso dipende dai singoli valori f (x) a ciascun punto, e non
solo a meno di insiemi di x di misura zero.

Esercizio 1.16.20. Se la classe di equivalenza quasi ovunque di f L contiene una funzione continua g, allora ess sup |f | = supx |g(x)|. (Si noti che
questa propriet ha senso grazie allunicit del rappresentante continuo (Nota 1.16.17).

Notazione 1.16.21. In analogia a quanto osservato nel precedente Esercizio


1.16.20, spesso nel seguito, con abuso di notazione, scriveremo la norma L
come supx |f (x)| invece che, correttamente, come ess supx |f (x)|.
Esempio 1.16.22. Presentiamo una semplice propriet delle classi di equivalenza Lp la cui dimostrazione ci stata suggerita da E. Valdinoci (comunicazione personale): per ogni intervallo J esistono funzioni f Lp (J) tali che
nella classe di equivalenza Lp di f non esiste alcun rappresentante g che sia
una funzione continua quasi ovunque. A maggior ragione lo stesso enunciato
vale per ogni f Lp (R). Senza perdita di generalit, a meno di cambiamenti
di scala, possiamo assumere J = [0, 1].
Per mostrare questa asserzione, consideriamo un aperto denso in A
[0, 1] con misura di Lebesgue 0 < m(A) < 1. Un tale insieme A si pu

1.16. SPAZI LP

127

costruire ad esempio nel modo seguente. Si consideri un insieme numerabile denso Q [0, 1], ad esempio i razionali, ed indicizziamolo nel modo
ovvio: A = {x0 , x1 , . . . }. Per ogni n N sia In un intervallo aperto
n

di lunghezza
P 3 n che contiene xn . Ora poniamo A = n=1 In ed abbiamo
m(A) 6 n=1 3 < 1, ma m(A) > m(I1 ) > 0 e A Q, quindi A denso in
[0, 1].
Sia f la funzione caratteristica di A. Se nella sua classe di equivalenza esistesse una funzione g continua quasi ovunque, allora osserviamo che linsieme G
dei punti in cui g non assume i valori 0 oppure 1 avrebbe misura zero: infatti,
se G avesse misura positiva, dovrebbe contenere qualche punto di continuit
x0 di g (perch i punti di discontinuit hanno misura 0) con g(x0 ) 6= 0 e
g(x0 ) 6= 1. Per il Teorema di permanenza del segno (vedere Sezione 1.1)
esisterebbe un intervallo aperto K con x K e g(x) 6= 0 e g(x) 6= 1 in K.
Pertanto f 6= g su tutto K, e poich lintervallo aperto K ha misura positiva
questo contraddice il fatto che f e g siano uguali quasi ovunque.
Ma daltra parte, linsieme Z := {x : g(x) = 0} deve avere misura zero,
perch altrimenti, per lo stesso argomento di prima, Z dovrebbe contenere
un punto di continuit x0 di g in cui g(x0 ) = 0. Di nuovo per il Teorema di
permanenza del segno esisterebbe un intervallo aperto X x0 tale che g < 21
su K. Poich A un aperto denso esisterebbe allora un intervallo aperto
J K A. Evidentemente su J avremmo g < 21 ma f = 1, perch per
costruzione f = 1 su A. Quindi, di nuovo, f e g non sarebbero uguali quasi
ovunque.
A questo punto sappiamo che, se nella classe di equivalenza di f esiste una
funzione gR continua
R 1 quasi ovunque, allora g = 1 quasi ovunque. Ma in tal
1
caso, 1 = 0 g = 0 f = m(A) < 1, una contraddizione.

Nota 1.16.23. Come p (Nota 1.7.10), anche Lp (R) contiene un sottospazio


V isomorfo a C2 (o anche R2 ). Infatti sia V il sottospazio di Lp (R) costituito
da tutte le funzioni tali che

t1
t2
f (x) =

se x [0, 1]
se x [1, 2]
altrimenti

con t1 , t2 C.
Al variare di t1 , t2 in C linsieme di tali funzioni costituisce uno spazio
vettoriale isomorfo a C2 .

128 CAPITOLO 1. PANORAMICA SU CALCOLO ED ANALISI REALE


interessante osservare che questo sottospazio isometricamente isomorfo al sottospazio analogo di p costruito nella Nota 1.7.10: in altre parole,
la norma Lp ristretta a V coincide con la norma p sullo spazio complesso
di dimensione 2. Se p = 2, allora la norma L2 ristretta a V coincide con la
norma euclidea (cos come la norma 2 : si riveda la Nota 1.7.11).

Nota 1.16.24. Come nel caso di 2 , anche la norma di L2 (R) proviene da


un prodotto scalare, nel senso della Nota 1.7. Infatti, su L2 (R) il questo
prodotto scalare
Z
hf, gi =
f (x)g(x) dx.

Esercizio 1.16.25. Vericare che si tratta di un prodotto scalare, come introdotto nella Denizione 1.2.7.

La norma kk proviene da tale prodotto scalare, infatti:


Z
Z
|f (x)|2 dx = kf k22 .
hf, f i =
f (x)f (x) dx =

Teorema 1.16.26. (Teorema di Riesz-Fischer.) Sia 1 6 p 6 . Allora


Lp (R) uno spazio normato completo. La stessa cosa vale per Lp (I), dove
I R un insieme misurabile di misura di Lebesgue positiva, ad esempio
un intervallo.
Dimostrazione. Il caso p = ben noto e facile: le successioni di Cauchy
(nella norma uniforme) di funzioni limitate sono limitate (si veda il Teorema
1.3.13 in seguito).
Assumiamo quindi 1 6 p < , ed utilizziamo il criterioPdella convergenza di serie assolutamente sommabili (Lemma
fn una serie
P 1.2.20). Sia
kf
k
sono
tutte
assolutamente sommabile: le somme parziali N
n p
n=1
Psimultan
neamente limitate da qualche costante M > 0. Poniamo gP
n (x) =
k=1 |fk |.
n
La disuguaglianza di Minkowski (1.16.10) implica kgn kp 6 k=1 kfk kp 6 M.
Daltra parte, per ogni x, gn (x) una successione non decrescente di numeri
reali (positivi!), e quindi converge oppure tende a +. La funzione limite
g misurabile (Proposizione 1.9.51), e grazie al Lemma di Fatou (Teorema
1.9.52) si ha |g|p 6 M. In particolare, g nita quasi ovunque.

1.16. SPAZI LP

129

P
Perci, per quasi ogni x, la serie
fn (x) una serie assolutamente sommabile di numeri reali, e quindi convergente ad una somma s(x). Per comodit, nei punti x in cui la serie divergente poniamo s(x) = 0. In tal
modo,Pquasi ovunque, la funzione s il limite puntuale delle somme parziali
sn = nk=1 fk (x),Pe quindi una funzione misurabile. Inoltre |s(x)| 6 g(x)
perch |sn (x)| 6 nk=1 |fk (x)| = gn (x) 6 g(x). Quindi la funzione s appartiene a Lp e |sn (x) s(x)| 6 2g(x). Ora dal Teorema di Convergenza Dominata
(Teorema 1.9.54), applicato alle funzioni |snP
(x) s(x)|p , segue che sn converge a s nella norma di Lp , e quindi la serie n fn converge ad una funzione
somma in Lp .

Nota 1.16.27. Per 0 < p < 1, lo spazio Lp non uno spazio normato (parte
(ii) dellEsercizio 1.16.18). Per la dimostrazione del precedente Teorema
di RieszFischer 1.16.26 vale riga per riga anche in questo caso, eR prova la
completezza di Lp per tutti i p > 0 rispetto alla distanza d(f, g) = |f g|p
(per maggiori dettagli si veda la Sottosezione 3.21.1).

Esercizio 1.16.28. La dimostrazione che abbiamo dato del Teorema di Riesz


Fischer 1.16.26, basata sul criterio della convergenza di serie assolutamente
sommabili (Lemma 1.2.20), un po astratta. Il lettore trovi una dimostrazione pi diretta basata sul prossimo Corollario 1.16.29, che di interesse
intrinseco.

Corollario 1.16.29. Da ogni successione fn di Cauchy in Lp si pu estrarre


una sottosuccessione che converge puntualmente quasi ovunque.
Dimostrazione. Il caso p = relativamente facile e viene lasciato per
esercizio al lettore. Prendiamo 0 6 p < . Poich {fn } di Cauchy, esiste
una sottosuccessione di indici nj tale che
kfnj+1 fnj kp < 2j .

(1.44)

Pk
P
Poniamo allora gk =
i=1 |fni+1 fni | e g =
i=1 |fni+1 fni |. La disuguaglianza di Minkowski (1.16.10) e la precedente disuguaglianza (1.44)
implicano che kgk kp < 1 per ogni k, ed a questo punto dal Lemma di Fatou (Teorema 1.9.52) segue kgkp < 1. Pertanto g(x) < quasi ovunque, e
quindi la serie

X
f (x) := fni +
(fni+1 fni )
(1.45)
i=1

130 CAPITOLO 1. PANORAMICA SU CALCOLO ED ANALISI REALE


converge assolutamente per quasi ogni x (si rammenti la denizione di convergenza assoluta di una serie data nella Sezione 1.1). Per comodit, nellinsieme
di misura nulla dove la serie non converge poniamo f = 0, in modo che f sia
denita ovunque. Ora chiaro che le somme parziali
fni +

k1
X
(fni+1 fni ) = fnk
i=1

convergono alla somma f (x) in (1.45) per quasi ogni x.

Se rimpiazziamo le funzioni con successioni e gli integrali con serie numeriche, lo stesso argomento dimostra il risultato analogo per gli spazi p , che
era stato annunciato nella Nota 1.7.9:
Corollario 1.16.30. Per 0 6 p 6 , gli spazi p sono completi.

Nota 1.16.31. Per p > 1 gli spazi Lp sono completi rispetto alla distanza
indotta dalla norma
 p1
Z
p
,
Np (f ) = kf kp :=
|f |
in seguito al fatto che tale norma denita tramite lintegrale di Lebesgue:
infatti nella dimostrazione della completezza abbiamo usato il Lemma di
Fatou (Teorema 1.9.52), che vale per lintegrale di Lebesgue ( stato usato
per dimostrare il Corollario 1.16.29). Invece, se si fosse denita la norma
usando lintegrale di Riemann, il Lemma di Fatou non sarebbe stato vero
e non avremmo avuto la completezza. Ad esempio, se intorno a ciascun
razionale qk si considera lintervallo di diametro 2k /n centrato in qk , allora
la funzione caratteristica n dellunione di questi intervalli ha norma nita
in Lp e la norma tende a zero se n : in eetti n tende alla funzione
caratteristica dei razionali, che equivale alla funzione zero in Lp di Lebesgue,
ma non integrabile secondo Riemann. La successione n di cauchy in Lp
(secondo Lebesgue e secondo Riemann), ma non converge in Lp di Riemann.
(Cautela: per 0 < p < 1, la quantit Np = kkp non una norma (Esercizio
1.16.18), ma Npp una distanza nella quale Lp completo: si veda la Nota
1.16.27).

Esercizio 1.16.32. Siano f Lp e g L . Il prodotto puntuale f g appartiene


a Lp .

1.17. INCLUSIONI FRA SPAZI LP E FRA SPAZI P

131

Svolgimento. Lenunciato banale se p = , quindi assumiamo p < .


suciente dimostrare il risultato per f a valori non negativi, perch altrimenti
si applica il ragionamento separatamente alle parti positiva e negativa di f :
quindi assumiamo f > 0. Per ogni > 0 esistono una funzioneR semplice u
minorante f ed una funzione semplice v maggiorante f tali che (v u)p <
kgkp. Ora poniamo
U = kgk u e V = kgkv. Allora U(x) 6 f (x)g(x) <
R
V (x), ed inoltre (V U)p < : quindi f g Lp .

1.17

Inclusioni fra spazi Lp e fra spazi p

Proposizione 1.17.1. (Inclusioni fra spazi Lp .) Se I = [a, b] un


intervallo di lunghezza finita e p < q 6 , allora Lq (I) Lp (I).
Dimostrazione. Si tratta di dimostrare che per ogni p < q esiste una costante
C = Cp,q tale che, per ogni f Lq (I), si abbia
kf kp 6 Ckf kq .

(1.46)

Per maggiore chiarezza consideriamo dapprima il caso p = 1. In tal caso


la disuguaglianza da provare
Z
q
Z
|f (t)| dt 6 M |f (t)|q dt
(1.47)
I

dove M = C . Ma questa una conseguenza diretta della disuguaglianza di


Jensen (1.36)per funzioni sullintervallo [a, b], applicata alla funzione convessa
t 7 |t|q (Esercizio 1.7.3); anzi di pi, da quella disuguaglianza vediamo che
1/M la misura dellintervallo I.
Ora consideriamo il caso generale p < q. Il modo pi semplice di procedere
quello di ridursi al caso precedente, ponendo g |f |p . Applicando la
disuguaglianza precedente alle norme di g in L1 (I) e Lq/p (I) si ottiene
Z
p
p
p
p
p q/p
kf kp = kgk1 6 Mkgkq/p =
(|f | )
= kf kpq
(1.48)
I

da cui, se si estrae la radice pesima di entrambi i lati, segue (1.46).

132 CAPITOLO 1. PANORAMICA SU CALCOLO ED ANALISI REALE


Nota 1.17.2. Osserviamo che la famiglia di inclusioni dimostrata per gli spazi
Lp [a, b] (cio che questi spazi diventano pi piccoli al crescere di p) linversa
di quella provata per gli spazi p (Proposizione 1.7.7).
Generalizzando quanto abbiamo fatto nella Nota 1.7.11 , possiamo immergere lo spazio p di successioni nello spazio Lp (R) di funzioni, nel modo seguente. Sia n la funzione caratteristica dellintervallo [n, n + 1) (Denizione
1.1.3). Allora limmersione :
{x1 , x2 , . . . } 7

xn n .

n=1

Poich la norma Lp di ciascuna delle funzioni caratteristiche n di ampiezza 1 vale 1, limmersione una isometria. In particolare, quindi, negli
spazi Lp (R) non pu valere linclusione Lp (R) Lr (R) per r < p, che vale
negli spazi Lp [a, b], perch gli spazi Lp (R) contengono isometricamente gli
spazi p per cui vale linclusione opposta; ma in essi non pu neppure valere linclusione opposta, perch contengono isometricamente Lp [a, b] (basta
prendere una funzione Lp denita in [a, b] e prolungarla a tutto R ponendola
zero al di fuori di questo intervallo).
p
A titolo di esempio, osserviamo che la funzione f (x) = 1/x se x (0, 1]
e zero altrove appartiene a L1 (R) ma non appartiene a L2 (R), mentre la
funzione g(x) = 1/x se x > 1 e zero altrove appartiene a L2 (R) ma non a
L1 (R) (esercizio!).

1.18

Le funzioni continue e le funzioni semplici


sono dense in Lp

Definizione 1.18.1. (Funzioni a gradini.) Sia x = {x0 < x1 < < xN }


una successione nita, e denotiamo con In gli intervalli da essa generati:
In = [xn , xn+1 ). P
Sia n la funzione caratteristica di In (Denizione 1.1.3).
N 1
n si chiama la funzione a gradini, o funzione a scala
La funzione = n=0
generata dalla successione x ; essa denita nellintervallo [x0 , xN ]. Denotiamo allo stesso modo la funzione denita su tutto R prolungando in modo
che valga 0 fuori di tale intervallo.
Analogamente, si denisce funzione a gradini a supporto non compatto la
funzione costruita allo stesso modo ma a partire da una successione bilatera

1.18. DENSIT DI C(I) IN LP (I)

133

{ < x2 < x1 < x0 < x1 < x2 < . . . }, ossia da una partizione di R in un


numero innito di intervalli.
Lemma 1.18.2. Sia I un sottoinsieme misurabile di R. Per ogni funzione
f L (I) (limitata e misurabile secondo Lebesgue) e per ogni > 0 esiste
una funzione semplice (Definizione 1.9.42) tale che
|(x)| 6 |f (x)|
|f (x) (x)| 6 .

(1.49)
(1.50)

Inoltre, per ogni , > 0 esistono una funzione a gradini ed un insieme


misurabile E con misura di Lebesgue minore di tali che, per ogni x
/ E, si
ha
|(x)| 6 |f (x)|
|f (x) (x)| 6 .
Se f a valori reali allora si possono scegliere e a valori reali, e
quindi 0 6 (x) 6 f (x) dove f (x) > 0 e f (x) 6 (x) 6 0 dove f (x) 6 0, ed
analogamente per .


Dimostrazione. Fissiamo > 0 e k N tale che k1 < . Sia In = nk , n+1
.
k
Gli In formano una famiglia di intervalli disgiunti la cui unione tutto R.
Poich f limitata, la sua immagine contenuta nellunione di un sottoinsieme nito degli In . Scriviamo, ad esempio, Im(f ) per limmagine di f (cio
linsieme Im(f ) = {y : y = f (x) per qualche x R}), e poniamo kf k < M
e N = kM: allora abbiamo Im(f ) N
n=N 1 In . Per questi valori di n
1
poniamo Jn = f (In ). Allora {Jn : n = N 1, . . . , N} una famiglia
nita di insiemi misurabili disgiunti tali che N
n=N 1 Jn = R, i quali sono
misurabili in seguito alla Denizione 1.9.39.
Ora costruiamo una funzione semplice che approssima f uniformemente. Il
modo pi facile di procedere, che per non verica il requisito dellapprossimazione per difetto, il seguente. Per comodit scriviamo la funzione
caratteristica di Jn come n invece che con la notazione JP
n che abbiamo
usato nella Denizione 1.1.3, e consideriamo la funzione = N
n=N 1 fn n ,
dove fn = f (xn ) per qualche xn Jn . In realt necessaria una scelta pi
precisa: per denizione, i valori di f nellintervallo Jn appartengono a In ,

134 CAPITOLO 1. PANORAMICA SU CALCOLO ED ANALISI REALE


ma rammentiamo che i valori di f L sono ssati solo quasi ovunque,
possono essere modicati su un insieme di misura zero. Ora, rammentiamo
che lestremo inferiore essenziale di una funzione f su un insieme A denito
come
ess inf A f = sup{ inf f (x) : O A, m(O) = 0}
(1.51)
xA\O

ed in maniera simmetrica si denisce lestremo superiore essenziale. Allora In = [ess inf xAnj f (x), ess supxAnj f (x)) lintervallo compreso fra gli
estremi inferiore e superiore essenziali dei valori di f . In Jn ci pu essere un
sottoinsieme Zn di Jn di misura nulla al quale i valori di f non appartengono.
Daltra parte, i valori di f non sono neppure deniti su un insieme di misura nulla nch non ssiamo una scelta di f nella sua classe di equivalenza
di Lebesgue i cui valori siano deniti ovunque: allora, se facciamo questa
scelta, bisogna scegliere xn Jn \ Zn . Con questa clausola, la funzione
una funzione semplice tale che kf k < quasi ovunque: infatti, se
x Jn , allora f (x) e fn = f (xn ) appartengono entrambi allintervallo In
di lunghezza k1 < . Questo dimostra la parte dellenunciato che riguarda
lapprossimazione con funzioni semplici (le disuguaglianze (1.49) e (1.50)).
Consideriamo ora lapprossimazione con funzioni a gradini, che solo leggermente pi complicata. Per la Nota 1.9.33, per ogni > 0 ssato e
per ogni n = N 1,. . . , N esiste un insieme aperto On Jn tale che
m(On \ Jn ) < /(2N + 2). Sia E = N
n=N 1 On \ Jn . Allora m(E) < .
Inoltre, per il Lemma 1.9.3 (i), per ogni n esiste una famiglia numerabile di
intervalli aperti disgiunti Anj , j = 1, 2, . . . , tale che On =
j=1 Anj . Anche
se gli Anj sono disgiunti per un dato n, possibile che un intervallo An0 j0
intersechi un intervallo An1 j1 con n0 diverso da n1 , perch gli aperti On si
sovrappongono parzialmente: ma questo pu accadere solo su On0 On1 che
un insieme di misura minore di (anzi in realt minore di /(N +1), perch
On0 On1 = (On0 On1 ) \ (Jn0 Jn1 ) = (On0 \ Jn0 ) (On1 \ Jn1 ) ,
dove la prima identit vale dal momento che gli insiemi Jn sono disgiunti.
Ora costruiamo una funzione a gradini che approssima f uniformemente a
meno di un insieme di misura minore di . Come prima, se non ci interessasse
il requisito dellapprossimazione per difetto, il modo pi semplice sarebbe il
seguente. Scriviamo la funzione caratteristica di Anj come nj , e consideriaP
P
mo la funzione a gradini = N
j=1 fnj nj , dove fnj = f (xnj ) per
n=N 1
qualche xnj Jn (di nuovo, pi precisamente scegliamo xnj Jn \ Zn .)

1.18. DENSIT DI C(I) IN LP (I)

135

Di nuovo, per quasi ogni x Anj Jn = Anj \E, entrambi f (x) e fnj = f (xnj )
appartengono allintervallo In di lunghezza k1 < : quindi
|f (x) fnj | <

(1.52)

se x Anj \ E. Perci la funzione a gradini (un insieme numerabile di


gradini) approssima uniformemente f a meno di al di fuori dellinsieme
E di misura minore di .
Per provare lenunciato sulla approssimazione dal di sotto, || < |f | (rispettivamente || < |f |), occorre scegliere funzioni a gradini (rispettivamente, funzioni semplici ) tali che, rispettivamente in Jn ed in Anj \ E, i
loro valori siano quasi ovunque di modulo inferiore a quelli di f . A questo
ne suciente scegliere cnj = ess inf In |f (x)| (denito di nuovo come in
(1.51): in tal modo cnj verica la stessa disuguaglianza (1.52), ed inoltre
cnj 6 |f (x)| se x Anj \ E Jn . Perci la funzione a (inniti) gradini
P
P
= N
j=1 cnj nj soddisfa le disuguaglianze richieste. Analogamente,
n=N
P
P
la funzione semplice dellenunciato si costruisce come = N
j=1 tn n ,
n=N
con tn = ess inf xJn |f (x). ovvio dalla costruzione che a valori reali se
lo f .

Lemma 1.18.3. (L Lp denso in Lp per ogni p.) Se > 0, K > 0


e f Lp con p < , esiste una funzione misurabile fK a supporto compatto
tale che |fK | 6 K e kf fK kp < .
Dimostrazione.
Poich f Lp , esiste un insieme E R al di fuori del quale
R
si ha R\E |f |p < p /2. Poniamo fK uguale a zero fuori di E.
Supponiamo dapprima che f sia a valori reali. Per ogni n > 0 poniamo
fn (x) = f (x) se |f (x)| 6 n, e f (x) = n (rispettivamente, n) se f (x) > n
(rispettivamente, f (x) < n). Allora |fn | 6 n e per quasi ogni x si ha
fn (x) f (x) se n . Inoltre |f fn | 6 |f |, e quindi, dal momento che
la funzione t 7 tp (t > 0) crescente, ne segue che |f fn |p 6 |f |p . Per il
Teorema di Convergenza Dominata (Teorema 1.9.54) si ha
Z
p
lim kf fn k = lim
|f fn |p = 0 .
n
n
R
Pertanto, per qualche K abbastanza grande, E |f fK |p < p /2. Allora
Z
Z
Z
p p
p
p
+
= p ,
(1.53)
|f fK | =
|f fK | +
|f fK |p <
2
2
R
E
R\E

136 CAPITOLO 1. PANORAMICA SU CALCOLO ED ANALISI REALE


da cui lenunciato: kf fK kp < .
Se f a valori complessi si applica questo argomento separatamente alla
parte reale ed immaginaria: le due funzioni a gradini e cos generate
formano la parte reale ed immaginaria della funzione a gradini richiesta.
Lapprossimazione rimane valida perch, scrivendo u = Re f e v = Im f ,
abbiamo kf ( + i)kp 6 ku kp + kv kp , grazie alla disuguaglianza
triangolare per la norma.

Proposizione 1.18.4. (Le funzioni a gradini sono dense in Lp .) Se


1 6 p < e f Lp , per ogni > 0 esiste una funzione a gradini tale che
kf kp 6 .
Lo stesso enunciato vale per p = pur di prendere una funzione a gradini non a supporto compatto, cio associata ad una partizione infinita di R
(Definizione 1.18.1).
Dimostrazione. Nel caso p = lenunciato segue direttamente dal Lemma 1.18.2. Prendiamo quindi 1 6 p < . Fissiamo > 0. Anzitutto
osserviamo che, senza perdita di generalit, possiamo assumere che f abbia
supporto
K compatto. Infatti, per ogni > 0, esiste un compatto K tale che
R
p
|f
(x)|
dx < p /2. Allora, se lenunciato del teorema vale sui compatti,
K
la funzioneR f approssimabile in K con una funzione a gradini in K nel
senso che K |f |p dx < p /2: pertanto, la funzione a gradini ottenuta
quando si prolunga a tutto R ponendola zero al di fuori di K approssima f
in norma Lp a meno di , per lo stesso argomento visto nella disuguaglianza
(1.53).
Assumiamo quindi p < e f Lp a supporto compatto K. Per il Lemma
1.18.3 esiste una funzione fM L tale che |fM | 6 M e kf fM kp < :
la costruzione di questa funzione mostra che |fM | 6 |f | ovunque, e quindi
anche fM ha supporto in K. Poniamo = p . Per il Lemma 1.18.2 esiste
una funzione a gradini tale che || 6 |fM | 6 M ovunque e |fM | 6
/m(K)1/p tranne che su un insieme E di misura minore di , dove peraltro
|fM | 6 |fM | + || 6 2M.
Allora
Z
Z
p
p
|fM | +
|fM |p
kfM kp =
E
K\E
Z
Z
6
|fM |p +
|fM |p < (2M)p + p = (1 + 2p M p )p .
E

1.18. DENSIT DI C(I) IN LP (I)

137

Da questo segue che kfM kp 6 C, dove C = (1 + 2p M p )1/p . Quindi


kf kp 6 kf fM kp + kfM kp 6 (1 + C).

Questo conclude la dimostrazione per p < (se si preferisce avere


invece che (1+C) nellultimo membro della precedente disuguaglianza basta
rimpiazzare ovunque con /(1 + C)).

Lo stesso argomento dimostra che le funzioni a gradini e le funzioni semplici approssimano le funzioni non negative, sia nella norma di Lp sia puntualmente in maniera monotna, e quindi estende il Lemma 1.18.2. Diamo
la dimostrazione per le funzioni semplici:

Corollario 1.18.5. Per ogni f Lp (I), f > 0, esiste una successione di


funzioni semplici s1 , s2 , . . . su I tale che sn (x) 6 sn+1 (x) per ogni n e x e
limn sn (x) = f (x) per quasi ogni x e nel senso di Lp .
Dimostrazione. La dimostrazione ricalca quella del Lemma 1.18.2 e della Proposizione 1.18.4 (si veda anche quella del Lemma 1.18.3): pertanto
suciente accennarla. Fissato M > 0 approssimiamo f con la funzione
fM (x) = min{f (x), M}: come nel caso della dimostrazione della Proposizione 1.18.4, suciente dimostrare che le funzioni semplici approssimano ogni
fM nella norma di Lp e puntualmente quasi ovunque in maniera monotna.
Per ogni > 0 sia N tale che N1 < . Per ogni n poniamo


n+1
n
6 f (x) <
Jn = x :
N
N
e sia n la funzione caratteristica di Jn (Denizione 1.1.3). Osserviamo
PN M nche
n
< M se e solo se n < NM. Allora la funzione semplice sn = n=0 N n
N
verica, per ogni n e x,

n+1
n
1

=
< .
N
N
N
Questo prova la convergenza puntuale monotna; la convergenza in Lp segue dal Teorema di Convergenza Dominata 1.9.54, come nella Proposizione
1.18.4.

0 6 sn (x) 6 fM (x)

fM (x) sn (x) 6

Dimostriamo ora lapprossimabilit delle funzioni in Lp con funzioni continue.


Indichiamo con Coo (R) lo spazio delle funzioni continue a supporto compatto
su R. Vogliamo dimostrare il risultato seguente:

138 CAPITOLO 1. PANORAMICA SU CALCOLO ED ANALISI REALE


Proposizione 1.18.6. (Le funzioni continue a supporto compatto
sono dense in Lp .) Se 1 6 p < e f Lp , per ogni > 0 esiste una
funzione g Coo tale che kf gkp 6 . (Quindi anche il sottospazio di Lp
costituito da funzioni continue che tendono a zero allinfinito, che contiene
quello delle funzioni continue a supporto compatto, denso in Lp (R) per ogni
1 6 p < ).
Dimostrazione. Di questo enunciato si possono dare due diverse dimostrazioni, una elegante e trasparente ma sosticata, laltra artigianale e legata
ad un fatto elementare della teoria della misura che abbiamo appena accennato (lultima asserzione del Lemma 1.9.33, utilizzata in eetti nel prossimo
Lemma 1.18.8).
La dimostrazione elegante si basa sul Teorema di Lusin 1.14.10, in base al
quale ogni funzione misurabile su un insieme nito dierisce da una funzione
continua solo su un insieme di misura arbitrariamente piccola. Allora, se si
considera lo spazio Lp su un insieme compatto, questo rende ovvio che, data
f Lp , per ogni > 0 esiste g Coo tale che kf gkp 6 . Nel caso
generale, invece, occorre prima osservare che, data f , esiste un compatto K
tale che kf kLp (K) < /2, e poi approssimare la funzione f in norma Lp , a
meno di /2, su un intorno U di K a chiusura compatta con una funzione g
continua ovunque ed a supporto in U (non basta approssimare f con g in K
perch la funzione g sarebbe continua in K, ma potrebbe avere discontinuit
sulla frontiera di K: ma se si prende per g una funzione continua ovunque a
supporto compatto che approssima f in K il problema scompare.
La dimostrazione artigianale ma elementare, invece, un corollario diretto
ed ovvio dei prossimi Lemmi 1.18.7 e 1.18.8.

Lemma 1.18.7. Per ogni 1 6 p < , per ogni funzione a gradini e


per ogni > 0 esiste una funzione continua h tale che k hkp < . Se
la funzione a gradini a supporto compatto (cio nulla al di fuori di un
intervallo di lunghezza finita) si pu prendere anche h a supporto compatto.
Dimostrazione. La funzione a gradini costruita su una partizione nita
(se a supporto compatto) o numerabile, cio ha una successione nita o
numerabile di punti di salto xn , (n = 0, 1, 2, . . . ). Sia sn il corrispondente
valore del salto di .
Sia dapprima p < . Consideriamo lintervallo chiuso Jn di ampiezza
2n p /sn centrato in xn . Costruiamo una funzione continua h in modo che
coincida con al di fuori dei Jn (cio nelle zone dove costante), ed in

1.19. DUALIT FRA SPAZI LP

139

Jn interpoli linearmente i valori destro e sinistro di : in altre parole, in


maniera che ivi il suo graco costituisca un raccordo rettilineo che congiunge
i tratti costanti del graco di . Chiaramente h continua, ed in In si ha
| h| 6 21 sn . anche chiaro che h a supporto compatto se lo .
Ora,

hkpp

6
=

n=1

1
2

hkpLp (Jn )

X
sn
n=0

m(Jn )

2n p = p .

n=1

Lemma 1.18.8. Per ogni 1 6 p < , per ogni funzione semplice s e per
ogni > 0 esiste una funzione a gradini tale che ks kp < .
Dimostrazione. Questo risultato conseguenza diretta dellultima asserzione
del Lemma 1.9.33 (approssimazione in misura di insiemi misurabili con unioni
nite di intervalli).

1.19

Dualit fra spazi Lp

Anticipiamo qui le denizioni ed i risultati essenziali della teoria dei funzionali lineari continui su spazi normati, che sar trattata estesamente nelle
Sezioni 3.12 e 4.6, e vastamente ampliata nel Capitolo 3. Le denizioni ed
i risultati della presente Sezione saranno poi brevemente ripresi ed estesi in
Sezione 11.2, e molto approfonditi e generalizzati nel Capitolo 3.
Se V uno spazio normato, dire che T continuo signica dire che
lim T (v) = T (v0 )

vv0

(spesso scriviamo T v invece che T (v)).


Proposizione 1.19.1. Se V, W sono spazi normati e T : V W un
operatore lineare, allora T continuo se e solo se esiste C > 0 tale che, per
ogni v V
kT vkW 6 CkvkV .

140 CAPITOLO 1. PANORAMICA SU CALCOLO ED ANALISI REALE


Dimostrazione: viene lasciata come esercizio al lettore, il quale, in caso di
dicolt, pu trovare la stessa dimostrazione formulata in un ambito pi
generale nella Proposizione 4.6.3 nel seguito.
Definizione 1.19.2. Se V, W sono spazi normati e T : V W un
operatore lineare continuo, allora si chiama norma di T il numero
kT k = inf {C > 0 : kT vkW 6 CkvkV v V }
Definizione 1.19.3. (Spazio duale.) Sia X uno spazio normato. Lo spazio
normato di tutti i funzionali continui su X si chiama spazio duale di X, e si
indica con X .
Definizione 1.19.4. (Funzionali reali e funzionali positivi.) Un funzionale lineare T su Lp si dice reale se T (f ) R per ogni f Lp a valori
reali; si dice positivo se T (f ) > 0 per ogni f Lp a valori non negativi (si
noti che ogni funzionale positivo anche reale).
Lemma 1.19.5. (i) Ogni funzionale lineare T su Lp si spezza in modo
unico come T = Re T + i Im T , con Re T e Im T reali. Se T continuo,
lo sono anche Re T e Im T .
(ii) Ogni funzionale lineare reale T su Lp si spezza in modo unico come
T = T+ T , con T+ e T positivi. Se T continuo, lo sono anche T+
e T .
Dimostrazione. Per ogni funzionale lineare T deniamo (Re T )(f ) = Re T (f )
per tutte le funzioni f a valori reali. ovvio che Re T un funzionale
lineare, e |(Re T )(f )| 6 |T (f )| 6 kT kkf kp, da cui la continuit di Re T ;
analoga dimostrazione vale per Im T . Inne, se f non a valori reali, T (f ) =
T (Re f )+iT (Im f ) = (Re T )f +i(Im T )f , perci T coincide con Re T +i Im T
sulle funzioni a valori reali; poich ogni f Lp combinazione lineare di due
funzioni reali, f = Re f + Im f , si ha T = Re T + i Im T . Questo prova (i).
Per ogni funzionale reale T e per ogni f a valori reali deniamo T+ (f ) =
sup {T (h) : 0 6 h 6 f }. T+ un funzionale positivo: infatti, se f 6 0, si ha
T+ (f ) > T+ (0) = 0. Osserviamo anche che, se f > 0, allora T (f ) = T+ (f ).
Inoltre, per ogni f a valori reali, esprimiamo f come dierenza delle sue parti
positiva e negativa, f = f+ f con f+ = max f, 0 e f = min f, 0. Ora
0 6 f+ 6 |f |, e analogamente per f . Quindi |T+ (f )| 6 |T+ (f+ )|+|T+ (f )| =
|T (f+ )| + |T (f )| 6 2|T (f )|, pertanto kT+ k 6 2kT k. Inne, per ogni f a

1.19. DUALIT FRA SPAZI LP

141

valori reali, T (f ) = T (f+ ) T (f ) = T+ (f ) T (f ), da cui T = T+ T .


Questo prova (ii).

Il prossimo teorema il risultato principale di questa Sezione. Esso asserisce che il duale di Lp coincide con Lq , dove 1 6 p < e q lindice
coniugato a p. Nel caso p = 2 si ottiene che il duale dello spazio di Hilbert
L2 lo stesso spazio L2 , un fatto che verr esteso a tutti gli spazi di Hilbert
nel Teorema di rappresentazione di Riesz 4.6.4.

Teorema 1.19.6. (Dualit fra Lp e Lq .) Sia I R un insieme di misura


di Lebesgue positiva, 1 6 p < e f Lp (I). Sia q lindice coniugato, ossia
tale che 1/p + 1/q = 1 (Definizione 1.16.4). Allora f genera un funzionale
lineare continuo Tf su Lq (I), con kTf k = kf kp , nel modo seguente:
Z
Tf (g) = f (x) g(x) dx .
Viceversa, per ogni funzionale lineare continuo su Lq (I) esiste una tale g.
Quindi il duale di Lp (I) isometricamente isomorfo a Lq (I).
Pi in generale, lenunciato vale, oltre che per Lp (I, m) dove m la misura
di Lebesgue, anche per qualunque altro spazio di misura di Borel, ad esempio
per la misura discreta equidistribuita su Z ( misura che conta), ossia per gli
spazi p .
Dimostrazione. Per la disuguaglianza di Hlder 1.16.6, Tf un funzionale
lineare continuo su Lp con norma non superiore a kf kp . Inoltre, grazie al
Corollario 1.16.7, si ha lisometria: kTf k = kf kp . Pertanto, quello che rimane
da provare che, dato un funzionale continuo T su Lp , esiste una funzione
f Lq tale che T = Tf .
Grazie al Lemma 1.19.5, T combinazione lineare di quattro funzionali
continui positivi nel senso della Denizione 1.19.4, perci basta provare il
risultato per tali funzionali. Supponiamo quindi che T sia positivo. Poich R
si pu invadere con sottoinsiemi misurabili I di misura nita, si pu assumere
che I sia di misura nita.
Ora costruiamo una misura positiva associata a T , nel modo seguente. Per
ogni insieme misurabile A I deniamo (A) = T (A ) dove A la funzione
caratteristica di A (Denizione 1.1.3). Poich A > 0 si ha (A) > 0. Se
{An , n = 1, 2, . . . } una P
famiglia numerabile di insiemi misurabili disgiunti
e A = n An , allora limk kn=1 An = A nella norma di Lp , per il Teorema
di Convergenza Monotna 1.9.53. Poich T continuo, ne segue che (A) =

142 CAPITOLO 1. PANORAMICA SU CALCOLO ED ANALISI REALE


P

(An ), e quindi una misura positiva (Denizione 1.9.11). Come


sempre, denotiamo la misura di Lebesgue con m; osserviamo che, se m(A) =
0, allora A la funzione nulla in Lp , e quindi (A) = 0. Possiamo quindi
applicare il Teorema di Radon-Nikodym 1.9.27: esiste una funzione g
L1 (I), g > 0, tale che
Z
T (A ) = g(x)A (x) dx
n

per ogni insieme misurabile A.


Sia ora h L (I) una funzione non negativa. Poich m(I) < , h Lp (I).
Per il Lemma 1.18.2, esiste una successione di funzioni semplici hn > 0 tali
che, per ogni x I, hn (x) h(x) (la convergenza monotna per ogni
x quando n ), ed ogni hn , essendo una funzione semplice (Denizione 1.9.42), una combinazione lineare nita di funzioni caratteristiche di
intervalli An disgiunti. Di nuovo per il Teorema di Convergenza monotna 1.9.53, limn khn hkp = 0, e poich g limitata anche kghn ghkp 6
kgk khn hkp 0. Poich T continuo,
Z
T (h) = g(x)h(x) dx .
Per ogni K > 0, poniamo IK = {x : g(x) 6 K}, e h = g q1 IK . Poich p e q
sono indici coniugati (Denizione 1.16.4), grazie a (1.40) si ha
p(q 1) = p/(p 1) =

1
1
=
= q.
(p 1)/p
1/q

Perci si ha
Z

IK

g(x)

= T (h) 6 kT k
= kT k

Z

IK

g(x)
IK

IK

(q1)p

1 q1
g dx
.

 p1
dx

Dividendo a sinistra e a destra per


Z

Z

IK

 1q

g(x)q si ottiene

6 kT k .

1.20. INTEGRALI MULTIPLI

143

Poich g limitato, al crescere di K la famiglia IK = {x : g(x) 6 K}


R
1
q q
kgkq 6 kT k. Quindi g Lq (I). Questo
invade I, e quindi IK g(x)
completa la dimostrazione per Lp (I, m) quando m la misura di Lebesgue.
La dimostrazione per qualunque altra misura di Borel identica.

Definizione 1.19.7. (Biduale.) Dato uno spazio normato X, il duale del


suo spazio duale (lo spazio normato X ) si chiama il biduale di X, e si indica
con X .
Notazione 1.19.8. Per indicare lazione di un elemento g di X sugli elementi f dello spazio X, scriveremo hg, f i invece che Tg (f ).
Nota 1.19.9. Prendiamo in esame lo spazio normato completo X = Lp . X si
immerge isometricamente nel proprio biduale. Infatti, se f X e g X , la
applicazione lineare
f 7 hg, f i
identica f con un funzionale continuo su X di norma uguale alla norma di
f , per il Teorema di Dualit 1.19.6.
Pi in generale, lo stesso risultato vero per tutti gli spazi normati
completi: si veda [25, Cap. 4, Sezione 5].

Definizione 1.19.10. (Spazi riflessivi.) Uno spazio normato completo si


chiama riflessivo se isometricamente isomorfo al proprio biduale.
Nota 1.19.11. Dal Teorema di Dualit Lp 1.19.6 segue che, se 1 6 p < ,
Lp riessivo. Invece L non riessivo: il suo duale contiene L1 ma
strettamente pi grande, ed il suo biduale strettamente pi grande di L
stesso. Si vedano maggiori commenti in Sezione 11.2.

1.20

Integrali multipli e scambio dellordine di


integrazione

Definizione 1.20.1. (Misura prodotto.) Siano m1 una misura sullo spazio X e m2 una misura su Y . La loro misura prodotto m1 m2 sul prodotto
cartesiano X Y la misura che, sugli insiemi dati dal prodotto cartesiano

144 CAPITOLO 1. PANORAMICA SU CALCOLO ED ANALISI REALE


E1 E2 (dove Ei un qualsiasi insieme misurabile rispetto a mi , i = 1, 2)
vale
m1 m2 (E1 E2 ) = m1 (E1 )m2 (E2 ).
Notazione 1.20.2. Dato un insieme E nel prodotto cartesiano X Y , per
ogni x X e y Y scriviamo Ex = {y : (x, y) E} e E y = {x : (x, y) E}.
Gli insiemi Ex e E y si chiamano le sezioni di E. Analogamente, se f una
funzione su X Y , denotiamo le sue sezioni fx (y) = f (x, y) e f y (x) = f (x, y)
con fx : Y C e f y : X C, rispettivamente.
Il prossimo risultato una semplice verica che non dimostriamo (si veda
[23, Cap. 7, Teoremi 5 e 6]).
Lemma 1.20.3. Se f misurabile in X Y rispetto a m1 m2 , allora
le sue sezioni fx e f y sono misurabili rispetto a m1 e m2 , rispettivamente.
Inoltre, per ogni E X Y misurabile rispetto alla misura prodotto, le
funzioni (x) = m2 (ExR) e (y) = Rm1 (E y ) sono misurabili rispetto a m1 e
m2 , rispettivamente, e X dm1 = Y dm2 . Infine, se g misurabile su R,
la funzione (x, y) 7 g(x y) misurabile su R2 .
Suggerimento: sebbene non dimostriamo questo lemma tecnico, vogliamo
suggerire almeno come dimostrare lultima asserzione. In base alla Denizione 1.9.39, si tratta di dimostrare che, per ogni > 0, linsieme E :=
{(x, y) : g(x, y) > } misurabile. Poniamo B := {t R : g(t) > }.
Questo insieme misurabile per ogni perch g una funzione misurabile (
si veda nuovamente la Denizione 1.9.39). Ora, E = {(x, y) : x + y B }.
Si tratta di dimostrare che questo insieme misurabile usando il fatto che
la controimmagine sotto la addizione (una funzione continua) di un insieme misurabile (B ). Cautela: questo fatto non automatico, richiede una
dimostrazione accurata, che lasciamo come esercizio.

Grazie al precedente Lemma 1.20.3, ha senso il prossimo enunciato:

Teorema 1.20.4. (Fubini.)


(i) (Teorema di Tonelli.) Sia m1 una misura su uno spazio X, m2
una misura su uno spazio Y , e f : X Y R+ una funzione non
negativa misurabile
R rispetto a m1 mR2 . Consideriamo gli integrali delle
sezioni, (x) = Y fx dm2 e (y) = X fy dm1 (che hanno senso grazie
al Lemma 1.20.3, e che per brevit denotiamo integrali sezionali).

1.20. INTEGRALI MULTIPLI

145

Se f > 0, allora misurabile rispetto a m1 , misurabile rispetto a


m2 e valgono le seguenti formule di riduzione (o formule di integrazione
iterata):
Z

dm1 =

XY

f d(m1 m2 ) =

dm2 .

(1.54)

(ii) (Teorema di Fubini.) Se f L1 (m1 m2 ), allora fx L1 (m2 ) per


quasi ogni x X (rispetto a m1 ), f y L1 (m1 ) per (m2 )quasi ogni
y Y , L1 (m1 ), L1 (m2 ) e valgono le formule di riduzione 1.54.
Dimostrazione.
(i) Consideriamo dapprima il caso elementare delle funzioni caratteristiche
degli insiemi S T con S nella -algebra della misura m1 e T in quella
di m2 . In questo caso il risultato desiderato contenuto nel Lemma
1.20.3. Pertanto, prendendo combinazioni lineari, il risultato vale per
tutte le funzioni semplici m1 m2 misurabili.

Passiamo allora al caso generale: f > 0 una funzione m1 m2 misurabile. Per il Corollario 1.18.5, esiste una successione sn di funzioni semplici su X Y e m1 m2 misurabili che approssimano f
puntualmente in maniera monotna: 0 6 s1 (x, y) 6 s2 (x, y) 6 . . . e
limn sn (x, y) = f (x, y) per ogni x, y. Denotiamo con n e n gli integrali
sezionali e Rdellenunciato associati a sn .RAllora sappiamo che
R
(x)dm1 (x) = XY sn (x, y)d(m1 m2 ) = Y n (y)dm2 (y). Per
X n
ogni x, le funzioni n e n convergono rispettivamente a e (per il
Teorema di Convergenza Montona 1.9.53) in maniera non decrescente, e quindi (1.54) segue da una seconda applicazione del Teorema di
Convergenza Montona.

(ii) Per linearit basta provare il teorema per funzioni a valori reali, dal
momento che quelle a valori complessi sono combinazioni leneari dei
due funzioni reali (la loro parte reale ed immaginaria). Daltra parte,
ogni funzione a valori reali f la dierenza di due funzioni non negative,
la parte positiva f+ e la parte negativa f (denite nella dimostrazione
del Lemma 1.19.5), e f+ , f 6 |f |. Siano + , gli integrali sezionali
associati a f+ , f . Ora dalla parte (i) segue che + , L1 (m1 ).
Osserviamo che fx = (f+ )x (f )x , e dalla parte (i) le funzioni (f+ )x
e (f )x hanno integrale nito per ogni x tale che + , sono nite

146 CAPITOLO 1. PANORAMICA SU CALCOLO ED ANALISI REALE


(rispettivamente). Poich + , L1 (m1 ), questo accade m1 quasi
ovunque. Per questi x, si ha (x) = + (x) (x), ed quindi
L1 (m1 ). Perci le formule di riduzione (1.54) valgono separatamente
per f+ e + e per f e : per sottrazione esse valgono per f e . La
dimostrazione della formula analoga per identica.

Corollario
1.20.5. Sia in generale f a Rvalori complessi e poniamo (x) =
R
|f |x dm2 . Se integrabile, cio se X dm1 < , allora f L1 (m1
Y
m2 ).
Dimostrazione. Basta applicare il precedente Teorema 1.20.4 (i) alla funzione
|f |.

Definizione 1.20.6. (Misura di Lebesgue in Rn e variazione totale). Deniamo la misura di Lebesgue su Rn nel modo seguente, a partire
dalla famiglia dei pluriintervalli (detti anche plurirettangoli) aperti (a, b) =
(a1 , b1 ) (an , bn ) (che genera la -algebra dei Boreliani di Rn ):
m(a, b) = m(a1 , b1 ) m(a2 , b2 ) m(an , bn ) .
R
Esempio 1.20.7. Scriviamo f (x, y) dx dy per gli integrali rispetto alla misura di Lebesgue su R2 . Dalle formule di riduzione (1.54) si ha quindi:


Z
Z Z
Z Z
f (x, y) dx dy =
f (x, y) dy dx =
f (x, y) dx dy
R2

e per ogni rettangolo R = [a, b] [c, d]



Z
Z b Z d
Z
f (x, y) dx dy =
f (x, y) dy dx =
R

Z


f (x, y) dx dy .

Naturalmente, le formule per la riduzione di integrali multipli ad integrali


unidimensionali iterati sono uno strumento fondamentale anche per il calcolo di integrali multipli nel senso di Riemann. Vediamo esempi di integrali
doppi in due o tre coordinate, come richiamo di argomenti che il lettore ha
probabilmente gi studiato in corsi precedenti.

1.20. INTEGRALI MULTIPLI

147

Esercizio 1.20.8. Sia T il triangolo sotteso dallorigine e dai punti (0, 1) e


(1, 0). Osserviamo che i lati di T giacciono sulle tre rette x = 0, y = 0 e
x + y = 1. Quindi dalle formule di riduzione si ottiene


Z
Z 1 Z 1x
Z 1 Z 1y
f (x, y) dx dy =
f (x, y) dy dx =
f (x, y) dx dy .
T

Esercizio 1.20.9. Sia V il tetraedro sotteso dallorigine e dai punti (0, 0, 1),
(0, 1, 0) e (1, 0, 0). Osserviamo che le facce di V giacciono sui piani x = 0,
y = 0, z = 0 e x + y + z = 1. Fissato z = z0 fra 0 e 1, la Sezione del tetraedro
con il piano z = z0 il triangolo z = z0 , 0 6 y 6 1 z0 , 0 6 x 6 1 y z0 .

Quindi dalle formule di riduzione si ottiene


 
Z
Z 1 Z 1z Z 1yz
f (x, y, z) dx dy dz =
f (x, y, z) dx dy dz; .
V

Scrivere le formule di riduzione nellordine opposto di integrazione (prima z,


poi y, poi x). Calcolare lintegrale su V della funzione 1/(x2 + y 2 + z 2 ) , dove
R. Per quali valori di lintegrale nito? Come cambia la risposta se
lintegrando invece 1/(x + y + z) ?

Esercizio 1.20.10. Risolvere lesercizio precedente rimpiazzando il tetraedro


V con il cono C con base il disco nel piano z = 0 centrato nellorigine e di

148 CAPITOLO 1. PANORAMICA SU CALCOLO ED ANALISI REALE


raggio 1, e con vertice nel punto (0, 0, 1). Dimostrare che si ottengono le
formule di riduzione
! !
Z
Z
Z
Z 2 2
1

1y z

1z

f (x, y, z) dx dy dz =

f (x, y, z) dx

dy

dz; .

1y 2 z 2

Esercizio 1.20.11. Risolvere lesercizio precedente rimpiazzando il cono con


la sfera S con centro lorigine e raggio 1. Dimostrare che si ottengono le
formule di riduzione
! !
Z
Z
Z
Z
1

f (x, y, z) dx dy dz =

1z 2

1z 2

1y 2 z 2

f (x, y, z) dx

dy

dz; .

1y 2 z 2

1.21

Limiti e continuit in pi variabili

Sebbene sia dicilmente concepibile che chi si accinge a leggere un trattato


come questo non conosca gi alla perfezione il contenuto della presente Sezione, innumerevoli esempi contrari fra gli studenti universitari ci inducono
ad includerla qui.
Siccome Rn uno spazio normato, la nozione di limite la stessa della
Sezione 1.2, ma ora la vediamo pi in dettaglio. La denizione di limite e di
continuit arcinota.
Definizione 1.21.1. Sia x0 un punto di accumulazione di un insieme A Rn
(se il lettore non vuole rammentare la nozione di punto di accumulazione,
pu semplicarsi la vita restringendo lattenzione ad un punto interno ad A).
Si dice che una funzione f : A C ha limite per x x0 se per ogni
intorno aperto V C di esiste un intorno aperto U Rn di x0 tale che
f (U A) \ {x0 } V . Pi esplicitamente, limxx0 f (x) = se e solo se, per
ogni > 0 esiste > 0 tale che, per ogni x A con 0 < kx x0 k < , si ha
|f (x) | < .
Se x0 A (e quindi f denita al punto x0 , si dice che f continua a x0 se
limxx0 f (x) = f (x0 ).

1.21. LIMITI E CONTINUIT IN PI VARIABILI

149

Per semplicit, limitiamo lattenzione a n = 2. Il seguente enunciato


ovvio:
Corollario 1.21.2. Sia f una funzione definita in un aperto A R2 ,
(x0 , y 0 ) A. Se f ha limite per (x, y) (x0 , y 0), allora la restrizione
g(t) = f (x(t), y(t)) di f a qualsiasi curva (x(t), y(t)) (con 0 6 t 6 1) che
tende a (x0 , y 0 ) (nel senso che x(t) x0 e y(t) y 0 per t 1 ) verifica
limt1 g(t) = .
Un enunciato analogo vale per funzioni su Rn .
Dimostrazione. La dimostrazione segue immediatamente dal fatto che, visto
che (x(t), y(t)) tende a (x0 , y 0) per t 1 , abbiamo che, comunque si scelga
un intorno aperto U di (x0 , y 0), per t sucientemente vicino a 1, i punti
(x(t), y(t)) giacciono in U. Lasciamo ulteriori dettagli al lettore.

Esempio 1.21.3. Il precedente Corollario permette di trovare condizioni necessarie allesistenza del limite in pi dimensioni a partire da opportuni limiti
unidimensionali (lungo curve che tendono al punto limite (x0 , y 0 ). Limitiamo
anche qui lattenzione al caso bidimensionale e ad alcuni esempi tipici
Sia f una funzione denita in un aperto A R2 , (x0 , y 0 ) A.
(i)
lim

(x,y)(x0 ,y 0 )

f (x) =

lim ( lim f (x, y)) = ,

xx0 yy 0

e lo stesso enunciato vale se a destra scambiamo lordine dei due limiti


iterati.
Questo enunciato vale in base al precedente Corollario, perch il limite
iterato corrisponde al limite lungo la curva poligonale consistente di
due segmenti, il primo dei quali quello verticale da (x, y) a (x, y 0), ed
il secondo da (x, y 0) a (x0 , y 0).
(ii)
lim

(x,y)(x0 ,y 0 )

f (x) =

lim f (x0 + ta, y 0 + tb)) =


t0

per ogni a, b non simultaneamente nulli (il caso a = b = 0 non parametrizza una retta che passa per (x0 , y 0 ), bens il punto costante (x0 , y 0)).
Questo enunciato vale in base al precedente Corollario, perch il limite
unidimensionale corrisponde al limite lungo la retta da (x, y) a (x0 , y 0).

150 CAPITOLO 1. PANORAMICA SU CALCOLO ED ANALISI REALE


(iii) Per meglio chiarire il punto precedente, si scelga x0 = y 0 = 0. Allora,
se lim(x,y)(0,0) f (x) = , si ha limt0 f (ta, tb) = per ogni a, b non
simultaneamente nulli.
(iv) Se lim(x,y)(0,0) f (x) = , allora limt0 f (at, bt2 ) = per ogni a, b non
simultaneamente nulli: infatti, il limite unidimensionale corrisponde a
muoversi verso lorigine lungo la parabola (at, bt2 ).
(v) Lasciamo al lettore il compito di scrivere analoghe relazioni per curve
che tendono allorigine polinomialmente con grado maggiore di 2.
Ne segue che, se il limite unidimensionale non esiste lungo una delle curve
in R2 sopra utilizzate, oppure se esiste ma dipende dalla scelta della curva (ad esempio, cambia al cambiare dei parametri a e b), allora il imite
bidimensionale non esiste.

Nota 1.21.4. Cautela: purtroppo, lesistenza dei limiti unidimensionali al lato di destra delle precedenti identit solo una condizione necessaria per lesistenza del limite multidimensionale, come vedremo nel successivo Esempio
1.21.7.

Per chiarire meglio la situazione, riscriviamo la nozione di limite bidimensionale della precedente Denizione in termini di un limite unidimensionale,
ma questa volta con una condizione necessaria e sufficiente per lesistenza
del limite bidimensionale. Senza perdita di generalit, ma sicuri di facilitare
il lettore, consideriamo solo il caso x0 = y 0 = 0, dal quale si passa al caso
generale con una semplice traslazione nel piano.
Corollario 1.21.5. Sia f una funzione definita in un aperto A R2 , (0, 0)
A, e consideriamo la funzione trasformata in coordinate polari:
f(r, ) = f (r cos , r sin ) .
La funzione f ha limite per (x, y) (0, 0) se e solo se
lim sup |f(r, ) | = 0 .

r0+ 06<2

(1.55)

Dimostrazione. La funzione f ha limite per (x, y) (0, 0) se e solo se per


ogni > 0 esiste > 0 tale che, quando la distanza r di (x, y) da (0, 0)
minore di , allora il valore f (r cos , r sin ) dista da meno di , qualunque
sia . Questo equivale a dire che limr0+ sup |f (r cos , r sin ) | = 0.

1.21. LIMITI E CONTINUIT IN PI VARIABILI

151

Nota 1.21.6. Si noti che sarebbe scorretto enunciare la condizione della dimostrazione precedente dicendo che il limite per r 0+ di f (r cos , r sin )
deve valere 0 indipendentemente da : lenunciato giusto che tale limite vale
0 uniformemnete rispetto a . Se dicessimo indipendentemente da , ci signicherebbe che il limite sempre lo stesso (ossia zero) per qualunque fissato
, ossia quando ci si muove in linea retta verso lorigine ad angolo (rispetto
al semiasse x positivo), il che la stessa condizione soltanto necessaria della
parte (iii) dellEsempio 1.21.3.

Esempio 1.21.7.

(i) Sia
f (x, y) =

xy
x2 +y 2

se (x, y) 6= (0, 0)
se x = y = 0

Allora f non continua in (0, 0). Infatti, lungo le semirette (xt , yt ) =


(at, bt), con a, b non simultaneamente nulli e t > 0, si ha f (xt , yt ) =
ab/(a2 + b2 ), quindi f su ciascuna di queste semirette costante, ma la
costante dipende dalla scelta di a e b, ovvero della semiretta.
Alcuni lettori preferiscono scrivere le semirette con lequazione cartesiana invece che parametrica. Qui, ad esempio, se scegliamo y = mx
con m R, troviamo f (x, mx) = m/(1 + m2 ), un valore costante che
per dipende dalla semiretta (dipende dalla sua pendenza m. Nelle
prossime parti di questo esempio utilizzeremo semirette e parabole in
forma cartesiana, ma occorre stare attenti al fatto che in tal modo si
pu perdere qualche semiretta o curva: ad esempio, la retta verticale
x = 0 non si scrive come y = mx perch la sua pendenza innita
rispetto allasse x: occorre invece scriverla nella forma x = ky, in tal
caso con k = 0.
(ii) Sia
g(x, y) =

xy 2
x2 +y 4

se (x, y) 6= (0, 0)
se x = y = 0

La funzione g non continua in (0, 0). In questo caso, per ogni semiretta (xt , yt ) = (at, bt), con a, b non simultaneamente nulli e t > 0, si ha
g(xt , yt ) = ab2 t/(a2 + b2 t2 ), ed il limite per t 0 lungo ogni tale semiretta vale 0: infatti, se a 6= 0, allora il denominatore non innitesimo
ma il numeratore s, mentre per a = 0 il numeratore identicamente
nullo ma il denominatore positivo perch b 6= 0 (rammentiamo che

152 CAPITOLO 1. PANORAMICA SU CALCOLO ED ANALISI REALE


non lecito scegliere sia a sia b uguali a 0). Questultima retta quindi
eccezionale: qui il valore limite 0 non proviene dal fatto che il denomintore non si avvicina a 0, bens dal fatto che il numeratore ci si avvicina
troppo: identicamente nullo! Si ottiene ovviamente lo stesso risultato
dalla rappresentazione cartesiana y = mx oppure x = my.
Nondimeno, la funzione non continua: la condizione era solo necessaria. Sappiamo che la funzione g non continua in (0, 0) perch
g(x, y) = f (x, y 2), dove f la funzione discontinua della precedente
parte (i): ossia, g si ottiene da f grazie ad un cambiamento (quadratico) di variabili, y 7 y 2: quindi basta considerare quelle curve le cui
controimmagini sotto questo cambiamento di variabili sono le semirette
che evidenziano la discontinuit di f . A questo ne si devono considerare gli archi di parabola x = ky 2, e si ottiene, come prima per f ,
il seguente risultato: g(ky 2, y) = k/(k 2 + 1), una costante che dipende
dalla scelta di k. Si osservi che le parabole (ky 2, y) si avvicinano allorigine tangenzialmente allasse y, ovvero la retta verticale che costituisce
la direzione eccezionale considerata prima).
Si noti che la scelta giusta delle curve data da una espressione monomiale di grado tale da simmetrizzare i gradi risultanti nelle variabili x
e y.
(iii) Nella parte precedente di questo esempio abbiamo studiato una funzione discontinua nellorigine il cui limite lungo ogni semiretta verso
lorigine 0. Dimostriamo che questa funzione discontinua col metodo dicile: passando in coordinate polari ed utilizzando la propriet
equivalente (1.55) (nota: di solito questo metodo quello pi facile
quando invece la funzione continua!)
Allora abbiamo
r cos sin2
.
g(r, ) = g(r cos , r sin ) =
cos2 + r 2 sin4
Ancora una volta, dobbiamo mettere in guardia il lettore e prevenirlo da calcolare semplicemente il limite per r 0+ ignorando : in
tal modo si calcolerebbe semplicemente il limite di g sulle semirette
= costante, che sappiamo essere 0. Invece occorre calcolare prima
lestremo superiore rispetto a :
r cos sin2
4
2
2
06<2 cos + r sin

lim+ sup

r0

1.21. LIMITI E CONTINUIT IN PI VARIABILI

153

(qui non serve prendere il valore assoluto perch il limite 0 e |0| = 0).
Al ne di stimare sup {r cos sin2 /(cos2 + r 2 sin4 )} opportuno
prima chiedersi, per ogni r ssato, quale sia il valore di che rende il pi
grande possibile la frazione. Chiamiamo questo valore r . Il fattore r 2 al
denominatore induce a pensare che il secondo addendo, r 2 sin4 , conti
meno del primo, cos2 , per piccoli valori di r, ma cos non nel caso
r si avvicini al valore = /2 per il quale cos = 0: per sappiamo
che questo caso (corrispondente alla retta verticale) comporta che il
numeratore sia identicamente nullo. Nellincertezza su come bilanciare
limportanza dei due addendi al denominatore, opportuno in primo
luogo vericare cosa succede quando essi sono ugualmente grandi, ossia
per r tale che
cos2 r = r 2 sin4 r .

(1.56)

Poich cos2 r = 1 sin2 r , lultima identit unequazione biquadratica in sin r , risolvibile algebricamente (dopo occorre applicare larcoseno per trovare r ), ma pi comodo risolverla trigonometricamente.
Prima per chiediamoci se esiste una soluzione r per tutti i valori
piccoli di r. Per ogni r > 0, al variare di fra 0 e /2, la funzione
7 r 2 sin4 cresce da 0 a r 2 , mentre cos2 decresce da 1 a 0: quindi,
per il Teorema dei valori intermedi per le funzioni continue (si veda
la solita Sezione 1.1) esiste una soluzione r per ogni r, e, per la monotonia, una sola. Quando r piccolo, la funzione 7 r 2 sin4
uniformemente piccola, e quindi r tale che anche cos2 r sia vicino a
0: pertanto r deve avvicinarsi a /2. Possiamo scegliere r indierentemente minore o maggiore di /2, dal momento che le due funzioni
cos2 e r 2 sin4 sono simmetriche intorno a = /2. Facciamo una
scelta, ad esempio r < /2, ma r /2 per r 0+ .
Quindi, non sorprendentemente, la curva r 7 r , sulla quale vogliamo
mostrare che la frazione si mantiene grande per r 0+ , asintotica
a = /2, ossia alla semiretta verticale {x = 0, y > 0} (in realt,
visto che i termini del denominatore sono elevati al quadrato, anche la
semiretta {x = 0, y > 0} va ugualmente bene).
Rammentiamo che volevamo trovare r tale che valga lequazione (1.56).
Ma ora non serve pi! Infatti, ora sappiamo che r esiste, e, da (1.56),
cos r = r sin2 r (poich abbiamo scelto 0 < r < /2, il coseno positivo) ed il segno a primo membro nellestrazione della radice positivo).

154 CAPITOLO 1. PANORAMICA SU CALCOLO ED ANALISI REALE


Pertanto
g(r, r ) =

r cos r sin2 r
r 2 sin4 r
1
=
=
4
4
2
2
2
2
cos + r sin r
2r sin r

e quindi, su questa curva r 7 r , la funzione costantemente uguale


a 1/2, lestremo superiore su non tende a zero con r e la funzione
discontinua.

1.22

Calcolo differenziale in pi variabili e cambiamento di variabili negli integrali multipli

Vogliamo considerare alcuni esempi pi complessi di calcolo di integrali multipli. Questi esempi presumibilmente sono gi noti da precedenti corsi di
Analisi Matematica: pertanto lesposizione sintetica, per maggiori dettagli
si veda un qualunque libro di Analisi Matematica (ad esempio [1] e [5], che
hanno ispirato questa presentazione). Essi sono basati sul cambiamento di
variabili, analogamente al Teorema di Integrazione di Sostituzione per integrali unidimensionali (Sezione 1.1). Questo teorema asserisce che, se una
mappa biunivoca da [a, b] a [c, d] e di classe C 1 (cio derivabile con derivata
continua), allora per ogni funzione integrabile su [c, d] la funzione composta
f integrabile su [c, d] e
Z

f (t) dt =
c

1 (d)

f ((x))(x) dx .

1 (c)

Poich biunivoca e di classe C 1 , facile vedere che essa monotna (non


decrescente oppure non crescente). Nel primo caso 1 (c) = a e 1 (d) = b,
nel secondo avviene il viceversa. Spesso, per semplicit e senza perdita di
generalit, questo teorema viene enunciato nel caso in cui sia non decrescente. Il caso non crescente identico, ma porta ad un rovesciamento dellordine di integrazione, e quindi ad un cambiamento di segno dellintegrale.
Di conseguenza, se si rinuncia ad assumere che sia biunivoca, il teorema
diventa

1.22. CALCOLO IN PI VARIABILI E CAMBIO DI VARIABILI NEGLI INTEGRALI155


Teorema 1.22.1. (Integrazione per sostituzione in una variabile.)
Nelle condizioni e con la notazione suesposte,
Z d
Z b
f (t) dt =
f ((x))|(x)| dx .
c

1.22.1

Derivate parziali e differenziale

Per estendere a pi dimensioni il precedente Teorema 1.22.1 dobbiamo introdurre lanalogo multidimensionale della funzione . Cominciamo col
richiamare la ben nota denizione di derivata parziale:
Definizione 1.22.2. (Derivate parziali e direzionali.) Sia f : Rn C.
Per i = 1, . . . , n si dice che f derivabile in senso parziale rispetto a xi al
punto x0 Rn se la funzione F (t) = f (x01 , . . . , x0i1 , x0i + t, x0i+1 , . . . , x0n )
derivabile al punto t = 0. La derivata parziale si denota con Di f (x0 ) oppure
f
con x
(x0 ), e vale Di f (x0 ) = F (0). Il vettore le cui componenti sono le
i
derivate parziali al punto x0 si chiama il gradiente di f a x0 e si indica
con f (x0 ) oppure con grad f (x0 ). Se n un versore in Rn , scriviamo ora
F (t) = f (x0 + tn), e deniamo la derivata direzionale di f in direzione n
come f
(x0 ) = F (0) (la denizione precedente di derivata parziale i-sima
n
il caso particolare di questa che corrisponde a scegliere al posto di n li-simo
vettore della base canonica).
Vale il seguente lemma sullo scambio dellordine di derivazione, la cui
dimostrazione, basata sul teorema del valor medio di Lagrange (Sezione 1.1)
lasciamo per esercizio al lettore, che pu trovarla in qualunque libro di Calcolo
in pi variabili (ad esempio, [5, 2nda parte, Cap. II, Sez. 7]):
Lemma 1.22.3. (Schwarz.) Se E Rn un aperto e f : E R una
funzione di classe C 2 , allora per ogni i, j = 1, . . . , n e per ogni x E si pu
scambiare lordine delle derivate parziali: Di Dj f (x) = Dj Di f (x).
In pi dimensioni la derivabilit in senso parziale non implica la continuit (ad esempio, la funzione che vale 1 sugli assi coordinati e zero altrove
nellorigine ha derivate parziali nulle ma non continua). La nozione di
dierenziabilit che assicura la continuit la seguente.
Definizione 1.22.4. (Differenziale.) Sia A un aperto in Rn e f : A
C. Si dice che f differenziabile in x0 A se esiste un funzionale lineare

156 CAPITOLO 1. PANORAMICA SU CALCOLO ED ANALISI REALE


: Rn R (Denizione 3.3.13) che approssima f a meno di innitesimi, nel
senso che la dierenza fra f (x) e lapprossimazione lineare f (x0 ) + (x x0 )
innitesima, per x x0 , di ordine superiore al primo:
f (x) f (x0 ) (x x0 )
= 0.
lim
kx x0 k
xx0
In altre parole,
f (x) = f (x0 ) + (x x0 ) + (x)

dove un innitesimo per x 0 (ossia una funzione di x con limite 0 se x


tende a zero).
Il funzionale lineare si chiama il differenziale di f al punto x0 , e si indica
con dfx0 .
Nota 1.22.5. (Interpretazione geometrica del differenziale.) Si osservi
che, se n = 1, ovvero in una dimensione, la nozione di dierenziabilit e di
derivabilit coincidono, e (per funzioni di variabile reale a valori reali) coincidono entrambe con lesistenza della retta tangente al graco. Per funzioni
di variabile complessa a valori complessi questa visualizzazione geometrica
ancora vera in un senso opportuno, ma bisogna considerare rette complesse:
il graco in C2 anzich R2 , e si devono considerare rette in questo spazio bidimensionale complesso (per questioni correlate si veda nel seguito la
nozione di derivata complessa (Denizione 1.22.13).
Invece in pi dimensioni non cos. Poich il graco di una applicazione
lineare su Rn un piano a dimensione n in Rn+1 , una funzione f dierenziabile in x0 se e solo se il suo graco ammette piano tangente al punto x0 :
questo piano ha per equazione y = f (x0 ) + (x x0 ), dove ora y, x e x0 sono
punti in Rn .

Si dimostra facilmente il seguente teorema di derivazione:


Teorema 1.22.6. Sia f : Rn R differenziabile al punto x0 con differenziale . Allora per ogni versore n esiste la derivata direzionale di f nella
direzione n, e vale f
(x0 ) = hf (x0 ), ni, dove h, i denota il prodotto scalare.
n
Viceversa:
Teorema 1.22.7. Sia f una funzione di classe C 1 ad un punto x (cio, le
derivate parziali di f esistono in un intorno di x e sono continue in x. Allora
f differenziabile in x.

1.22. CALCOLO IN PI VARIABILI E CAMBIO DI VARIABILI NEGLI INTEGRALI157


Il Teorema 1.22.6 un caso particolare della regola di derivazione di
funzione composta, detta regola della catena (Corollario 1.22.17), per illustrare la quale occorre estendere la denizione di dierenziale a funzioni
f : Rn Rm .
Definizione 1.22.8. (Differenziale in pi variabili e matrice Jacobiana.) Sia A un aperto in Rn e f : A Rm . Si dice che f differenziabile in
x0 A se esiste una applicazione lineare : Rn Rm (Denizione 3.3.13)
che approssima f a meno di innitesimi:
lim0

xx

f (x) f (x0 ) (x x0 )
= 0.
kx x0 k

Loperatore lineare si chiama il differenziale di f al punto x0 , e si indica


con df (x0 ). La matrice che rappresenta nelle basi canoniche di Rn e Rm si
chiama la matrice Jacobiana di f in x0 , e si indica con J: se fi : Rn R
fi
la i-sima componente di f , allora la matrice J data da Jij = x
(x0 ) =
j
Dj fi (x0 ).
Nota 1.22.9. immediato vedere che f dierenziabile se e solo se lo sono
tutte le sue componenti.

Esempio 1.22.10. La condizione suciente per la dierenziabilit enunciata


nel Teorema 1.22.7 spesso scomoda da vericare, e non deve mascherare
il fatto che la nozione di dierenziabilit nientaltro che una condizione di
sviluppabilit al primo ordine di Taylor (Denizione 1.22.4). Ad esempio, sia

x2 +y 2 sin( x2 +y 2 )

se (x, y) 6= (0, 0)
( x2 +y 2 )3
f (x, y) =
1
se x = 0 = y
6

Non occorre calcolare derivate per mostrare che f dierenziabile nellorigine. Basta mostrare che f sviluppabile secondo Taylor al primo ordine: in
particolare, mostriamo che
f (x, y) f (0, 0)
p
= 0.
(x,y)(0,0)
x2 + y 2
lim

Infatti, questo equivale a dire che f dierenziabile nellorigine con dierenziale nullo. Per calcolare il limite nellultima espressione, osserviamo che

158 CAPITOLO 1. PANORAMICA SU CALCOLO ED ANALISI REALE


essa equivale a

ossia

x2 +y 2 )

( x2 +y 2 )3
p
x2 + y 2

x2 +y 2 sin(

1
6

= o(1) ,

p
p
x2 + y 2 sin( x2 + y 2 ) 1
p
= o( x2 + y 2 ) .
6
( x2 + y 2 )3

Questo equivale a dire che

sin 1
= o() ,
3
6
ossia

3
sin = o(4 ) ,
6

e questultima relazione equivale al ben noto sviluppo di Taylor della funzione


seno (in una sola variabile) al terzo ordine.
Si osservi che, se avessimo invece considerato
g(x, y) =

x2 +y 2 1
e
x2 +y 2

ossia
g(x, y) = h() :=

se

(x, y) 6= (0, 0)

se

x=0=y

e 1
,

la funzione g sarebbe stata continua nellorigine, ma il dierenziale non sarebbe stato nullo, perch e = 1++ 21 2 +o(2 ), e quindi h() = 1+ 21 +o().
In altre parole, h()h(o)
6= o(1). Questo equivale a dire che la funzione g non

ha dierenziale nullo nellorigine, ossia non ha piano tangente orizzontale.


In eetti, non dierenziabile, perch non ha derivate parziali nellorigine.
Infatti, la funzione g a simmetria radiale, e quindi tutte le derivate direzionali coincidono. Calcolaimo allora la derivata parziale Dx+ g(0, 0) nellorigine
nella direzione del semiasse x positivo:
Dx+ g(0, 0)

g(x, 0) g(0, 0)
= lim+
:= lim+
x0
x0
x

ex 1
x

1
ex 1 x
1
= lim+
= ,
2
x0
x
x
2

1.22. CALCOLO IN PI VARIABILI E CAMBIO DI VARIABILI NEGLI INTEGRALI159


di nuovo dallo sviluppo di Taylor, questa volta dellesponenziale, al primo
ordine. Ora, se calcoliamo la derivata nella direzione del semiasse x negativo,
otteniamo di nuovo
Dx g(0, 0)

g(x, 0) g(0, 0)
:= lim
= lim
x0
x0
x
= lim
x0

e|x| 1
|x|

e|x| 1 |x|
1
= .
x |x|
2

Quindi, nellorigine, le derivate parziali sinistra e destra rispetto a x non


coincidono, e quindi non esiste la derivata parziale. Pertanto f non differenziabile, in base alla condizione necessaria del Teorema 1.22.6.

Nota 1.22.11. Possiamo generalizzare quanto osservato per la funzione g nella


seconda parte del precedente Esempio 1.22.10. A questo scopo, rammentiamo che, per funzioni di una variabile derivabili e pari, la derivata dispari
(Sezione 1.1), e quindi la derivata nellorigine deve essere nulla. Analogamente, se una funzione g in pi variabili dierenziabile nellorigine ed ha
simmetria radiale (e quindi tale che tutte le sue sezioni lungo rette passanti per lorigine sono funzioni pari di una variabile), allora g deve avere
derivate direzionali tutte nulle nellorigine. Se per semplicit limitiamo lattenzione a due sole
p variabili (ma il caso generale analogo) e scriviamo di
nuovo h() = h( x2 + y 2) = g(x, y), allora questo signica che g non
dierenziabile nellorigine a meno che si abbia
lim

h() h(0)
= 0,

ossia h() = h(0) + o(). In particolare, h deve avere derivata nulla in 0.

Nota 1.22.12. (Il significato della notazione sul differenziale: forme


differenziali esatte.) In questa Nota, poich dovremo trattare anco a
anco vettori in Rn e coordinate, per evitare ambiguit indichiamo in grassetto i vettori in Rn .
Nel caso particolare di dimensione 1, la notazione che abbiamo introdotto
per il dierenziale di una funzione nella Denizione 1.22.4 sembra portare,
apparentemente, ad una certa ambiguit. Prendiamo ad esempio la funzione

160 CAPITOLO 1. PANORAMICA SU CALCOLO ED ANALISI REALE


f (x) = x: allora il suo dierenziale dfx0 viene indicato con lo stesso simbolo
dx che appare nella notazione per gli integrali. Sappiamo che, in entrambi
i casi, questo simbolo trae le sue radici storiche dalla nozione di incremento
lineare x x0 : ma abbiamo la capacit di chiarirne la natura formale? Nel
caso dellintegrale, il simbolo dx fu introdotto senza una denizione esplicita,
pi o meno come la parentesi
R destra di una coppia di parentesi (la parentesi di
sinistra essendo il simbolo di integrale). Per, nel contesto dellintegrale, al
simbolo dx stata associata una regola di calcolo formale, quella del teorema
di cambiamento di variabile, che nel calcolo formale si traduce nella regola
simbolica df (x) = f (x) dx, dove f un cambiamento di variabili di classe
C 1 (rimandiamo il lettore al teorema di integrazione per sostituzione nella
Sezione 1.1, anche nella forma del successivo Teorema 1.22.1). Nellambito di
n variabili x1 , . . . , xn , possibile introdurre una analoga regola di calcolo formale per una espressione del tipo f1 (x) dx1 + + fn (x) dxn , dove f1 , . . . , fn
sono funzioni continue a valori scalari su Rn , e lo faremo in seguito, parlando
di forme dierenziali nella Sottosezione 1.29.5 sugli integrali a valori scalari
di campi vettoriali lungo curve. Qui, invece, vogliamo concentrarci in via
preliminare sulla natura formale di questo concetto (e quindi, in particolare,
anche del consueto simbolo dx per lintegrale in una dimensione).
Ritorniamo quindi allambiente di Rn . Dal Teorema 1.22.6 sappiamo che
dfx0 (x x0 ) = hf (x0 ), x x0 i. Questo equivale a scrivere dfx0 (x) =
hf (x0 ), xi ed a considerare il dierenziale al punto x0 come il funzionale
lineare su Rn associato al prodotto scalare con il vettore f (x0 ). Per essere
pi precisi, qui stiamo applicando il funzionale associato a f (x0 ) ai vettori
dello spazio tangente al graco di f al punto x0 , ma tutti questi spazi tangenti coincidono con lunico spazio duale (Rn ) Rn . Senza addentrarci qui
nella terminologia degli spazi ani, possiamo far ricorso ad una terminologia
cara ai sici, che sono interessati a questi concetti perch da essi dipende
la modellizzazione del lavoro fatto da un campo di forze su un corpo che si
muove lungo una curva (si veda il successivo Esercizio 1.29.40), e pensare
come ai vettori in questo spazio tangente al punto x0 come vettori applicati
a x0 . Denotiamo con ei i vettori della base canonica di Rn , e con e i i vettori
della base duale in (Rn ) : ovvero, he j , ei i = 1 se i = j e 0 se i 6= j. I funzionali e i sono nientaltro che le proiezioni canoniche sugli assi, nel senso che
he i , xi = xi per ogni vettore x Rn e per ogni i = 1, . . . , n. Con diversa
notazione (quella per le funzioni, senza usare prodotti scalari), e i (x) = xi .
Qui stiamo ora pensando a e i come una funzione da Rn a R (lineare!), la
funzione coordinata iesima: spesso, per semplicit, questa funzione si indi-

1.22. CALCOLO IN PI VARIABILI E CAMBIO DI VARIABILI NEGLI INTEGRALI161


ca con xi . Poich questa funzione lineare ed omogenea, essa coincide con
il proprio dierenziale, ma naturale indicarne il dierenziale con dxi . Se
utilizziamo questa ulteriore notazione, abbiamo
dfx0 =

n
X

Di f (x0 ) e i =

i=1

n
X

Di f (x0 ) dxi .

(1.57)

i=1

P
Al variare di x0 la funzione lineare x0 7 dfx0 = ni=1 Di f (x0 ) dxi , da Rn
a (Rn ) Rn , si chiama un forma differenziale esatta. Pi in generale, con
questa stessa notazione, dataPuna npla di funzioni continue a1 , . . . , an su
Rn , la funzione lineare x0 7 ni=1 ai (x0 ) dxi , da Rn a (Rn ) Rn , si chiama
una forma differenziale lineare. Per uno studio di questi concetti rinviamo
il lettore alla Deniziona 1.29.41 ed alle corrispondenti Sottosezioni 1.29.5,
1.29.7, 1.29.8.

1.22.2

Derivata in senso complesso, differenziabilit ed


equazioni di CauchyRiemann

Anticipiamo qui la denizione di derivata in senso complesso, che verr


studiata in profondit nella Sezione 2.1.
Consideriamo funzioni di variabile complessa e a valori complessi, f :
C C. Per queste funzioni, la nozione di derivata quella naturale (essa
verr ripetuta nella Denizione 2.1.1, in un contesto in cui si studieranno le
sue proprieta peculiari, che qui non servono).
Definizione 1.22.13. (Derivata in senso complesso.) . Sia f : C C,
e sia z0 un punto interno al dominio di denizione di f . Si dice che f
derivabile (in senso complesso) al punto z0 se esiste nito il limite
f (z) f (z0 )
zz0
z z0

f (z0 ) = lim

che in tal caso si chiama la derivata di f a z0 .

1.22.3

Regola della catena, invertibilit locale

Teorema 1.22.14. (Differenziale di funzione composta.) Se f : Rn


Rm differenziabile in x0 A Rn e g : Rm Rk differenziabile in

162 CAPITOLO 1. PANORAMICA SU CALCOLO ED ANALISI REALE


f (x0 ) B Rm , allora la funzione composta h = g f : Rn Rk
differenziabile in x0 ed il suo differenziale la composizione dei differenziali
di f e g:
dh(x0 ) = dg(f (x0)) df (x0 ) .
Nota 1.22.15. In termini matriciali, la matrice Jacobiana di f g il prodotto
righe per colonne delle matrici Jacobiane di g e f (in questo ordine).

Nota 1.22.16. Ovviamente il precedente Teorema 1.22.14 sul dierenziale


di funzione composta vale anche nel caso di funzioni da f : R R, dove i
dierenziali sono le applicazioni lineari banali su R date dalla moltiplicazione
per un numero (la derivata di f : in questo caso la regola di derivazione di
funzione composta si traduce nel fatto che la derivata di tale funzione il
prodotto delle derivate dei due fattori nei punti corrispondenti: (f g) (x) =
f (g(x)) g (x). La stessa regola vale per funzioni f : C C derivabili in
senso complesso (si veda anche la Proposizione ??).

Corollario 1.22.17. (Regola della catena.) Sia A Rn un aperto e


f : A R. Sia B Rk un aperto e : B A. Se differenziabile in
x0 A e f differenziabile in y0 = (x0 ) A, la funzione composta h = f
ammette tutte le derivate parziali al punto x0 e per ogni i = 1, . . . , n si ha
0

Di h(x ) =

n
X

Dk f (y 0) Di k (x0 ) .

k=1

Definizione 1.22.18. (Jacobiano.) Se una funzione f : Rn Rn differenziabile, il determinante della sua matrice Jacobiana j(x) = det J(x)
(Denizione 1.22.8) si chiama la funzione jacobiana, o pi brevemente lo
Jacobiano di f .
Definizione 1.22.19. (Funzioni localmente invertibili.) Siano A e B
due aperti in Rn e f una funzione da A a B. Si dice che f localmente
invertibile in x A se esistono un aperto U A contenente x ed un aperto
V B contenente f (x) tali che f : U V sia biunivoca. La funzione f
localmente invertibile in A se localmente invertibile in tutti i punti di A.
Ad esempio, la trasformazione delle coordinate polari, f1 (r, ) = r cos ,
f1 (r, ) = r sin , 0 6 r < , R, non invertibile perch non iniettiva

1.22. CALCOLO IN PI VARIABILI E CAMBIO DI VARIABILI NEGLI INTEGRALI163


per r = 0 (quando r = 0, f1 (r, ) = f2 (r, ) = 0 qualunque sia ). Se si limita
il dominio di f allaperto r > 0, di nuovo f non invertibile perch non
iniettiva: f (r, + 2) = f (r, ). Per ora f localmente invertibile: basta
limitare lattenzione allaperto A = {r > 0, 0 < < 2}.
Rinviamo il lettore a [5, 2nda parte, Cap. VII, Sez. 5] per una dimostrazione del risultato seguente:
Teorema 1.22.20. (Invertibilit locale di funzioni differenziabili.)
Siano A e B due aperti in Rn e f una funzione da A a B di classe C 1 (A).
Se il determinante jacobiano j(x) non nullo per un x A, allora f
localmente invertibile in x e linversa differenziabile e di classe C 1 in un
intorno del punto f (x).
Esempio 1.22.21. Nel caso di una funzione da R3 a R3 , il Teorema di invertibilit locale 1.22.20 ha una visualizzazione geometrica interessante. Fissiamo
una delle tre coordinate nel dominio di denizione: allora la mappa f , al variare delle altre due coordinate, descrive una supercie bidimensionale in R3
(si tratta di una sezione bidimensionale dellimmagine di f ). Ad esempio,
consideriamo le coordinate sferiche in R3 , che saranno studiate per gli scopi dellintegrazione nel successivo Esercizio 1.22.25, e che sono denite dalla
seguente mappa f : (, , ) 7 (x, y, z):
x = cos sin
y = sin sin
z = cos ,
con > 0, 0 6 < 2, 0 6 6 .
Fissiamo un valore del parametro > 0, che rappresenta la distanza dallorigine. Allora, al variare degli angoli di longitudine e di latitudine ,
limmagine di f la supercie sferica di raggio . Fissiamo = 1 per semplicit. Consideriamo le curve di livello = costante o = costante, ovvero
i paralleli
p () = cos sin e1 + sin sin e2 + cos e3
ed i meridiani
m () = cos sin e1 + sin sin e2 + cos e3 .
Siamo interessati ai vettori tangenti a queste curve, ossia a
p () = D m () = sin sin e1 + cos sin e2

164 CAPITOLO 1. PANORAMICA SU CALCOLO ED ANALISI REALE


e
m () = D m () = cos cos e1 + sin cos e2 sin e3 .
Se non avessimo posto = 1 ora avremmo avuto meridiani e paralleli denotati da m, () e p, (), ed i loro vettori tangenti denotati da m , ()
e p , (), ma lunica dierenza nelle formule sarebbe solo la moltiplicazione
per un fattore .
facile vericare, e geometricamente ovvio, che questi vettori tangenti, allo stesso punto (, ) della supercie sferica, sono perpendicolari. anche
chiaro che i paralleli per = 0 (polo Nord) e = (polo Sud) sono curve
costanti (i due poli), ed i vettori tangenti sono nulli, come immediatamente
vericato visto che sin = 0 in questi due casi. Quindi, ai due poli, la mappa
f non iniettiva, e quindi non localmente invertibile.
Per vericare a questi due punti la perdita di invertibilit locale in base
allenunciato del Teorema 1.22.20 occorre calcolare il determinante jacobiano
j(, , ) di f .
Lasciamo al lettore la verica del fatto seguente: j(, , ) la norma del
prodotto vettoriale dei vettori tangenti m , e p , . Il prodotto vettoriale
di questi due vettori tangenti necessariamnete un vettore radiale, ossia
perpendicolare alla supercie sferica = costante. lasciamo la lettore il
calcolo della sua norma, che risulta essere 2 sin . Osserviamo che la norma,
e quindi il determinante jacobiano, si annullano ai due poli, dove si perde
linvertibilit locale.
In questo esempio, la perdita dellinvertibilit locale dovuta al fatto che,
ai due poli, uno dei due vettori tangenti alle curve di livello diventa nullo.
C, in generale, un altro modo di perdere linvertibilit locale. Immaginiamo
una supercie di livello che, a dierenza della sfera, sia fatta come un nastro
che si stringa ad un punto come quando un foglio di carta viene stretto fra due
dita. In tal caso i vettori tangenti possono non annullarsi, ma allora devono
diventare paralleli, ed il loro prodotto vettore quindi si annulla.

1.22.4

Integrazione per cambiamento di variabile

Enunciamo inne il teorema di cambiamento di variabili per lintegrale di


Lebesgue in Rn (denotando con dx la misura di Lebesgue). Questo teorema
estende a pi dimensioni il Teorema di Integrazione per Sostituzione in una
dimensione (Teorema 1.22.1). Nel caso dellintegrale di Riemann, in cui c

1.22. CALCOLO IN PI VARIABILI E CAMBIO DI VARIABILI NEGLI INTEGRALI165


dierenza fra integrali propri ed impropri, il teorema dovrebbe essere enunciato per funzioni su aperti limitati. Per la dimostrazione, assai complessa,
rimandiamo a [1, Cap. 15].
Teorema 1.22.22. (Cambiamento di variabili negli integrali multipli.) Sia A un aperto in Rn e : A Rn una funzione di classe C 1 (A) e
tale che il suo determinante jacobiano j(x) sia non nullo per ogni x A. Se
f L1 ((A)), allora
Z
Z
f (x) dx =
f ((t))|j(t)| dt .
(A)

Esercizio 1.22.23. (Integrazione in coordinate polari.) Come gi visto,


la trasformazione denita sul dominio > 0, 0 > < 2 dalla regola
x = cos
y = sin ,
e non invertibile (e neppure localmente invertibile) perch non iniettiva
a = 0 (altrove non solo localmente invertibile, ma anche invertibile. Il
dominio dove si perde linvertibilit ha misura di Lebesgue zero, e quindi il
Teorema 1.22.22 continua a valere.
Si calcoli il determinante jacobiano e si provi che vale r. Da qui segue la
formula di integrazione in coordinate polari:
Z

f (x, y) dx dy =

f(, ) d d ,

dove f la funzione composta f(, ) = f (x(, ), y(, )).

immediato trasportare questo esercizio a tre dimensioni:


Esercizio 1.22.24. (Integrazione in coordinate cilindriche.) La trasformazione in coordinate cilindriche con asse z
x = cos
y = sin
(z = z).

166 CAPITOLO 1. PANORAMICA SU CALCOLO ED ANALISI REALE


Provare, come prima, che lo jacobiano vale , e che quindi vale la formula di
cambiamento di variabili
Z Z Z
Z Z 2 Z
f (x, y, z) dx dy dz =
f(, , z) d d dz .

Esercizio 1.22.25. (Integrazione in coordinate sferiche.) La trasformazione in coordinate sferiche in tre dimensioni espressa in termini degli angoli
di latitudine e di longitudine (detti angoli di Eulero) gi introdotti nelle
identit (??) come segue:
x = cos sin
y = sin sin
z = cos ,
con > 0, 0 6 < 2, 0 6 6 .

z
(x, y, z)

cos

sin

x
Figura 1.16: Angoli di Eulero e coordinate sferiche

1.23. INTEGRALI DIPENDENTI DA UN PARAMETRO

167

Di nuovo, si perde linvertibilit, anche locale, nei dominii = 0 (polo


Nord) e = (polo Sud), ma questi domini hanno misura nulla e quindi il
Teorema di cambiamento di Variabili 1.22.22 continua a valere. Si calcoli lo
Jacobiano della trasformazione, che risulta uguale a !2 sin . Pertanto dal
Teorema di Cambiamento di Variabili segue
Z

f (x, y, z) dx dy dz =

f(, , z) 2 sin d d d .

Si ottenga lo stesso risultato scomponendo la trasformazione in coordinate


sferiche come composizione di trasformazioni in coordinate cilindriche, ed
applicando il teorema di composizione per i dierenziali, Teorema 1.22.14.

1.23
1.23.1

Integrali dipendenti da un parametro


Derivazione sotto il segno di integrale

Cominciamo con il dimostrare una propriet di derivazione sotto il segno di


integrale su un compatto, che in seguito estenderemo a integrali su domini
non compatti (quindi impropri, per lintegrale di Riemann).
Teorema 1.23.1. (Derivazione sotto il segno di integrale su un compatto.) Sia R il rettangolo R = {a 6 x 6 b, c 6 y 6 d}, e sia f una funzione
Rb
definita su R tale che, per ogni c 6 y 6 d, lintegrale F (y) = a f (x, y) dx
esista finito, e la derivata rispetto a y, D2 f , sia continua su R. Allora F
derivabile per ogni y [c, d] e

F (y) =

D2 f (x, y) dx .

Dimostrazione. Dal momento che la funzione D2 f continua sul compatto


R, per il Teorema di Heine sulla uniforme continuit (Teorema 1.8.6), essa
uniformemente continua: per ogni > 0 esiste > 0 tale che, se (x, y) e
(x , y ) R distano meno di , allora
!|D2 f (x, y) D2 f (x , y )| < .

(1.58)

168 CAPITOLO 1. PANORAMICA SU CALCOLO ED ANALISI REALE


Per il Teorema del Valor Medio di Lagrange (Sezione 1.1), per ogni x [a, b]
e y, y0 [c, d] esiste = (x, y, y0) [y0 , y] tale che f (x, y) f (x, y0) =
D2 f (x, ).
Consideriamo allora il rapporto incrementale di F a y0 . Si ha:
F (y) F (y0)
=
y y0

b
a

f (x, y) f (x, y0)


dx =
y y0

D2 f (x, ) dx .
a

Ora ssiamo > 0 ed il ad esso associato che rende vera (1.58). Inoltre
prendiamo |y y0| < . Allora anche k(x, ) (x, y0 )k < per ogni x [a, b];
pertanto, per (1.58),
Z b

Z b

F (y) F (y0 )

D2 f (x, y0) dx 6
|D2 f (x, ) D2 f (x, y0 )| dx

y y0
a
a
6 |b a| ,
(1.59)
e quindi limyy0

F (y)F (y0 )
yy0

= F (y0 ).

Un argomento analogo porta alla generalizzazione seguente:


Corollario 1.23.2. (Derivazione sotto il segno di integrale su uno
spazio di misura finita.) Sia A un aperto in R o C, [a, b] un intervallo
in R, o pi in generale [a, b] = [a1 , b1 ] [an , bn ] un pluriintervallo in
Rn , e una misura di Borel finita su [a, b]. Sia Q = [a, b] A, e sia f
una funzione definita su Q tale che, per ogni y A, lintegrale F (y) =
R b1
Rb
. . . ann f (x, y) d(x) esista finito, e la derivata rispetto a y, D2 f (nel senso
a1
reale se A R o complesso della Definizione 1.22.13 se A C) sia continua
su R. Allora F derivabile per ogni y A e

F (y) =

D2 f (x, y) d(x) .
[a,b]

Dimostrazione. Fissiamo y0 A e sia A0 A un disco aperto con centro


in y0 , e A0 la sua chiusura, ancora contenuta in A. Procedendo come nella
dimostrazione del precedente Teorema 1.23.1, applicata al compatto Q0 =
[a, b] A0 , grazie al Corollario 1.9.31 arriviamo al seguente analogo della

1.23. INTEGRALI DIPENDENTI DA UN PARAMETRO

169

disuguaglianza (1.59),


Z

F (y) F (y0 )

D
f
(x,
y
)
d(x)
2
0


y y0
[a,b]
Z
6
|D2 f (x, ) D2 f (x, y0)| d||(x) 6 ||([a, b]) ,
[a,b]

da cui il risultato segue come prima.

Nota 1.23.3. I precedenti risultati di derivazione sotto il segno di integrale


(Teorema 1.23.1 e Corollario 1.23.2), cos come tutte le loro varianti per integrali impropri, che illustreremo nelle prossime Sottosezioni 1.23.2 e 1.23.3,
utilizzano soltanto rapporti incrementali, dierenziabilit ed il Teorema del
Valor Medio di Lagrange, e quindi valgono anche per derivate in senso complesso (Denizione 1.22.13), qualora il parametro rispetto al quale si deriva
sia un parametro complesso.

1.23.2

Integrali su domini illimitati, uniformemente convergenti rispetto ad un parametro

Ora estendiamo il risultato di derivazione sotto il segno di integrale della


Sottosezione 1.23 al caso di integrali su domini illimitati. Siano O Rn un
insieme misurabile secondo Lebesgue illimitato, A Rm , f : O A C.
Per ogni y A vogliamo studiare il seguente integrale improprio sul dominio
O:
Z
F (y) =
f (x, y) dx .
(1.60)
O

Definizione 1.23.4. (Integrale su un dominio illimitato, uniformemente


convergente.) Si dice che lintegrale F (y) in (1.60) uniformemente convergente rispetto a y se per ogni > 0 esiste r0 > 0, che dipende da ma
non da y, tale che, per ogni palla Br Rn con raggio r > r0 e centro,
diciamo, lorigine, si ha

Z



(1.61)
f (x, y) dx < .

R

O\Br

Poniamo Fr (y) = Br f (x, y) dx. Allora (1.61) equivale a dire che, per r ,
Fr (y) converge uniformemente rispetto a y A allintegrale F (y) in (1.60).

170 CAPITOLO 1. PANORAMICA SU CALCOLO ED ANALISI REALE


Questa denizione ha varie conseguenze immediate:
Corollario 1.23.5. Se f continua in O A e lintegrale in (1.60)
uniformemente convergente, allora F continua in A
Corollario 1.23.6. Se in aggiunta alle ipotesi del precedente Corollario ??
si assume cha anche A sia misurabile secondo Lebesgue e se A limitato o
di misura finita oppure se f > 0, allora
Z
Z Z
Z Z
F (y) dy =
f (x, y) dy dx =
f (x, y) dx dy .
A

Lo stesso risultato vale se invece della misura di Lebesgue si considera una misura regolare di Borel assolutamente continua rispetto alla misura di Lebesgue
(Definizione 1.9.25).
Corollario 1.23.7. Se f e D2 f sono continue in O A
R e lintegrale in
(1.60) convergente per ogni y A e lintegrale F2 (y) = O D2 f (x, y) dx
uniformemente convergente, allora (F2 continua per il Corollario ?? e) si
pu scambiare la derivata con lintegrale: per ogni y, F (y) = F2 (y), cio
Z
Z
D2
f (x, y) dx =
D2 f (x, y) dx .
O

Lo stesso risultato vale se invece della misura di Lebesgue si considera una


misura regolare di Borel assolutamente continua rispetto alla misura di Lebesgue.
Corollario 1.23.8. (Test di Weierstrass per la convergenza uniforme
di integrali rispetto a un parametro.) Se esiste g L1 (O) tale che
|f
R (x, y)| 6 |g(x)| per quasi ogni x O e per ogni y A, allora lintegrale
f (x, y) dx uniformemente convergente.
O
Lo stesso risultato vale se invece della misura di Lebesgue si considera una
misura regolare di Borel assolutamente continua rispetto alla misura di Lebesgue.
Accenniamo le dimostrazioni di questi risultati. Nelle ipotesi del Corollario 1.23.5 la funzione f (x, y) continua in Br A. Quindi lintegrale Fr (y)
introdotto nella Denizione
R 1.23.4 una funzione continua di y e converge
uniformemente a F (y) = O f (x, y) dx: dal Teorema 1.3.16 (che fu dimostrato
per il passaggio al limite rispetto ad un indice discreto, ma la dimostrazione

1.23. INTEGRALI DIPENDENTI DA UN PARAMETRO

171

analoga in questo caso continuo) segue che F continua su A, e quindi il


Corollario.
Analogamente si procede per dimostrare il Corollario 1.23.6, nelle cui
ipotesi gli integrali Fr (y) e F (y) sono continui rispetto a y A
R ed il primo
converge
uniformemente al secondo per r . Allora limr A Fr (x) dx =
R
F
(x)
dx
esiste (nito se A limitato) per il Teorema 1.3.17 (anche in
A
questo caso esteso a passaggi al limite rispetto ad un indice continuo anzich
discreto), e nel prodotto cartesiano Br A si pu applicare il Teorema di
Fubini 1.20.4 (i) se f > 0 oppure 1.20.4 (ii) se A limitato o di misura nita
per ottenere
Z

Br

f (x, y) dy dx =

Z Z
A

Br

Fr (y) dy
F (y) dy
A
Z Z
=
f (x, y) dx dy

f (x, y) dx dy =

da cui il Corollario 1.23.6.


La dimostrazione del Corollario 1.23.7 di derivazione sotto il segno di
integrale del tutto analoga: la dimostramo qui con un certo dettaglio.
Fissiamo y0 A e sia A0 A un disco aperto con centro in y0 , e A0 la
sua chiusura, ancora contenuta in A. Poiche lintegrale si assume uniforconvergente,
per ogni > 0 esiste un compatto K in Rn tale che

memente
R


O\K f (x, y) d(x) < .
Procedendo come nella dimostrazione del precedente Teorema 1.23.1, applicata al compatto Q0 = K A0 , grazie al Corollario 1.9.31 arriviamo al
seguente analogo della disuguaglianza (1.59),


Z

F (y) F (y0 )

D
f
(x,
y
)
d(x)
2
0


y y0
O


Z

F (y) F (y0 )

D2 f (x, y0) d(x) +


<
y y0
K
Z
6
|D2 f (x, ) D2 f (x, y0 )| d||(x) + 6 (1 + ||(K)) ,
K

da cui il risultato segue come prima.


Inne, il test di Weierstrass vale perch , se laR funzione maggiorante
g L1 (O), allora per ogni > 0 esiste r0 tale che O\Br |g(x)| dx < per

172 CAPITOLO 1. PANORAMICA SU CALCOLO ED ANALISI REALE


ogni r > r0 . Ma allora, poich |f (x, y)| 6 |g(x)|, la stessa disuguaglianza
vale per f , e quindi il suo integtale verica la condizione di uniformeme
convergenza data nella Denizione 1.23.4.

1.23.3

Integrali di funzioni con singolarit fisse, uniformemente convergenti

Siano ora D Rn un insieme misurabile secondo Lebesgue, U Rm , f :


D U C illimitata, con un unico punto x0 di singolarit (cio tale che per
ogni palla B = Br (x0 ) con centro x0 e raggio r > 0 arbitrario si ha che f
limitata in {D \ B} U). RAnche in questo caso, per ogni y U vogliamo
studiare lintegrale F (y) = D f (x, y) dx, come in (1.60).

Definizione 1.23.9. (Integrale improprio con singolarit al finito uniformemente convergente.) Si dice che lintegrale F (y) in in (1.60) uniformemente
convergente rispetto a y se per ogni > 0 esiste r0 > 0, che dipende da ma
non da y, tale che, per ogni palla B = Br (x0 ) con centro x0 e raggio r < r0
si ha
Z




f (x, y) dx < .
(1.62)

R

D\Br

Poniamo Fr (y) = D\Br f (x, y) dx. Allora (1.62) equivale a dire che, per
r 0+ , Fr (y) converge uniformemente rispetto a y U allintegrale F (y) in
(1.60).

I risultati esposti per gli integrali su domini illimitati dipendenti da un


parametro si ripetono in maniera analoga in questo nuovo contesto: la loro
formulazione e dimostrazione viene lasciata per esercizio.

1.23.4

Esempio: la funzione Gamma

La funzione Gamma, introdotta da L. Euler, lintegrale improprio


Z
(z) =
xz1 ex dx
0

Con z C. Questo integrale improprio sia a causa di una singolarit


a z = 0 sia perch il dominio di integrazione illimitato. Consideriamo
dapprima il caso in cui z reale ! positivo (scriviamo in questo caso s invece

1.23. INTEGRALI DIPENDENTI DA UN PARAMETRO

173

di z). Mostriamo che lintegrale uniformemente convergente se il parametro


s varia in un qualsiasi intervallo nito, a 6 s 6 b. A questo scopo spezziamo
lintegrale:
Z

s1 x

1
s1 x

e dx +
xs1 ex dx
0
1
Z 1
Z
<
xa1 dx +
xb1 ex dx <

e dx =

(1.63)

perch ts < ta per 0 < a < s e 0 < t < 1, e viceversa ts < tb per s < b
e t > 1. Gli ultimi due integrali sono convergenti perch a 1 > 1 e
perch la velocit di decadimento asintotico dellesponenziale predomina sulla
crescita del polinomio (Sezione 1.1). Pertanto lintegrale uniformemente
convergente rispetto al parametro s [a, b] in base al test di Weierstrass
(Corollario 1.23.8 ed il suo analogo per integrali con singolarit al nito).
derivata dellintegrando della funzione ts1 ln tet , e lintegrale
R La
ts1 ln t et dt uniformemente convergente per lo stesso argomento che
0
abbiamo usato per la funzione .
Ritornando ora al parametro complesso z = s + iu osserviamo che |tz | =
s iu
|t | = ts |eiu ln tR| = ts . Pertanto anche gli integrali complessi (z) =
Rt

xz1 ex dx e 0 tz1 ln t et dt sono uniformemente convergenti quando


0
il parametro z verica la condizione 0 < a 6 Re z 6 b < . Quindi, per i
teoremi di derivazione sotto il segno di integrale (Corollario 1.23.7 ed il suo
analogo per integrali con singolarit al nito) ora sappiamo che la funzione
Gamma derivabile rispetto al parametro sotto il segno di integrale, purch
0 < a 6 Re z 6 b < , e si ha
Z

(z) =
tz1 ln t et dt .
0

Se il parametro z si prende complesso, i calcoli che abbiamo fatto ed i teoremi


che abbiamo usato valgono anche per la derivata in senso complesso, grazie
alla Nota 1.23.3, e quindi abbiamo provato che, nel range di variabilit del
parametro 0 < a 6 Re z 6 b < , la funzione Gamma derivabile in senso
complesso. Poich a > 0 arbitrario, questo prova che la Gamma derivabile
per ogni z con Re z > 0.
Si noti per che lintegrale che denisce la Gamma non uniformemente
convergente se il parametro varia in tutta la semiretta (0, +): in eetti,

174 CAPITOLO 1. PANORAMICA SU CALCOLO ED ANALISI REALE


non lo nessuno dei due integrali in cui abbiamo spezzato la Gamma in
(1.63). Infatti, per il primo integrale basta notare che, per ogni > 0,
Z
s
s1 x

,
x e dx > e
s
0
e per 0 lultimo membro non tende a zero uniformemente rispetto a
s = Re z nel dominio s > 0 (tende a zero solo puntualmente).
Analogamente, per il secondo integrale,
Z
Z
s1 x
s1
x e dx > b
exdx = bs1 eb ,
b

e lultimo membro tende s a zero per b + puntualmente per ogni s, ma


non uniformemente rispetto a s nel dominio s > 0.

1.24

Misura esterna e Lemma di Vitali

Il risultato principale di questa Sezione non viene dimostrato. Si rinvia a [22]


per la dimostrazione.
Definizione 1.24.1. (Misura esterna.) Per ogni insieme E R consideriamo le successioni
numerabili di intervalli aperti In tali che E n In , e la
P
serie L = n m(In ) delle loro lunghezze (nita o innita). Si denisce misura esterna di E lestremo inferiore m (E) di L rispetto a tutte le successioni
di intervalli come sopra.
facile vedere che la misura esterna di un intervallo la sua lunghezza, e pi in generale per ogni insieme misurabile A si ha m(A) = m (A);
inoltre m subadditiva (la misura esterna dellunione minore o uguale della somma delle misure (Proposizione 1.30.4), ma non sempre additiva.Per il lettore interessato, diamo una presentazione della misura esterna
nellAppendice 1.30.
Definizione 1.24.2. Sia E R. Si dice che una famiglia di intervalli I
un ricoprimento di Vitali di E se per ogni > 0 e x E esiste un intervallo
I I che contiene x e di lunghezza minore di .
Presentiamo qui due lemmi di ricoprimento, dovuti a Vitali, che giocano
un ruolo cruciale, il primo in in analisi matematica, il secondo in teoria della
misura.

1.24. MISURA ESTERNA E LEMMA DI VITALI

175

Lemma 1.24.3. (Lemma di ricoprimento di Vitali.) Sia B = {B }


una famiglia non vuota di intervalli aperti in un insieme K in R di misura
esterna finita (oppure misurabile secondo Lebesgue e di misura finita), o pi
in generale di palle aperte in un insieme di misura esterna finita in Rn .
Allora esiste una sottofamiglia numerabile {Bn } tale che
1
m (n Bn ) > m ( B )
4
dove m la misura di Lebesgue (ossia la lunghezza, nel caso unidimensionale).
Dimostrazione. Poich K ha misura esterna nita, il numero d1 := sup m(B )
nito. Per denizione di estremo superiore, esiste 1 tale che m(B1 ) > 34 d;
per semplicit scriviamo B1 invece di B1 .
Dimostriamo la seguente asserzione: senza perdita di generalit possiamo
supporre che esistano intervalli in B (o palle, nel caso di dimensione maggiore
di 1) disgiunti da B1 . In eetti, rammentando che ogni intervallo in B ha lunghezza inferiore a 34 m(B1 ), vediamo che, se lasserzionen non fosse vera, lunione U := B di tutti gli intervalli sarebbe (nel casounidimensionale) un
intervallo aperto di lunghezza non superiore a 1 + 2 34 m(B1 ) = 11
m(B1 ),
3
e lenunciato sarebbe dimostrato (la successione di palle consisterebbe della
sola palla B1 ). Il fattore 2 dovuto al fatto che un intervallo unidimensionale
ha due punti estremi: nel caso di palle in Rn con n > 1 la disuguaglianza
triangolare ci d un risultato analogo dove ildiametro dellaperto U = B
n
m(B1 ), e quindi m(U) 6 11
m(B1 ). Questo dimostra las inferiore a 11
3
3
serzione.
Allora poniamo B2 la famiglia di tutte le palle in B1 B che sono disgiunte da B1 . Come prima, esiste B2 B2 tale che m(B2 ) > 43 d2 , dove
d2 := sup{m(B ) : B B2 } 6 d1 . Lo stesso argomento dellasserzione precedente mostra che, senza perdita di generalit, si pu supporre che esistano
intervalli (o palle) in B disgiunti sia da B1 sia da B2 . Sia B3 la famiglia di
tutte le palle che non intersecano n B1 n B2 . Poich B3 B2 , ogni palla
in B3 ha misura inferiore a m(K) m(B1 ) m(B2 ) 6 m(K) d1 43 d2 .
Ripetendo questa procedura, costruiamo iterativamente una successione disgiunta di intervalli (o palle) Bn B di misura che tende a zero. Mostriamo
che questa successione verica la disuguaglianza dellenunciato.
Poich m(Bn ) tende a zero e sup{m(B) : B Bn } 6 dn 6 43 m(Bn ), nessuna
palla B B pu appartenere a tutte le sottofamiglie Bn , ma appartiene solo

176 CAPITOLO 1. PANORAMICA SU CALCOLO ED ANALISI REALE


n la palla concentrica a Bn ma
ad un numero nito di esse. Sia B B e B
di diametro quadruplo. Sia n il pi piccolo intero tale che B
/ Bn (ossia,
per costruzione, tale che B interseca Bn1 ). Allora B sta in Bn1 , e quindi
m(B) 6 34 m(Bn1 ). Consideriamo il caso unidimensionale: in tal caso, come visto prima, ogni intervallo che interseca Bn1 ed ha diametro inferiore
a 43 del diametro di Bn1 contenuto in un intervallo concentrico a Bn1 e
di diametro inferiore a 11
del diametro di Bn1 , e quindi, siccome 11
< 4,
3
3

deve essere strettamente contenuto in Bn1 . Anche nel caso multidimensionale, come accennato sopra, si applica questo ragionamento e vale la stessa
n , e quindi
inclusione. Quindi ogni B B contenuto in n B



m ( B ) < m n Bn 6 m (n Bn ) .

Nota 1.24.4. La scelta del fattore 1/4 nel precedente Lemma di ricoprimento
di Vitali 1.24.3 pu apparire arbitraria ed innaturale. Quanto si pu migliorare? Supponiamo di voler provare che, per qualche 0 < < 1, vale
la disuguaglianza m (n Bn ) > m ( B ) per una opportuna successione
Bn costruita con largomento del Lemma. Questo possibile, ma le scelte delle costanti diventano meno naturali e semplici. In eetti, il fattore
11/3 nellasserzione fatta nella dimostrazione del Lemma si trasformerebbe
, e quindi nella denizione dei Bn occorrerebbe richiedere
in 1 + 2 = 2+

m(Bn ) > 2+ dn . Ad esempio, se si sceglie 1, allora questo ultimo fattore


si avvicina a 1/3.

Corollario 1.24.5 (Vitali). Sia E R di misura esterna finita e B un


ricoprimento di Vitali di E. Allora per ogni esiste
 una famiglia finita

N
B1 , . . . , BN di intervalli in B tale che m E \ n=1 Bn < .

Dimostrazione. Linsieme E0 := B un aperto (perch unione di intervalli) di misura nita perch contenuto in E. Per il precedente Lemma
di Vitali 1.24.3, esiste una sottofamiglia numerabile {Bn } di {B } tale che,
ponendo E1 := B \ n Bn , si ha m(E1 ) < 43 m(E0 ). Poich n Bn ha misura nita, per ogni > 0 esiste una sottofamiglia nita {Bn1 , Bnk } tale che
k
m(
n=1 Bn \ j=1 Bnj ) < : in particolare, esiste una tale sottofamiglia tale
che, ponendo E10 := B \ kj=1 Bnj , si ha m(E10 ) < 45 m(E0 ).
Poich {B } un ricoprimento di Vitali di E, la sottofamiglia {B } di {B }

1.25. DERIVABILIT DI FUNZIONI MONOTNE

177

che consiste di tutte gli intervalli che non sono contenuti in kj=1 Bnj un
ricoprimento di Vitali di E10 , ed iterando il ragionamento troviamo una sottofamiglia nita {Bm1 , Bml } di {B } tale che m(E10 \ lj=1 Bmj ) < 45 m(E10 ) <

4 2
m(E0 ). Ora uniamo le due sottofamiglie
una nuova
5

 nitel per produrre
k
sottofamiglia nita {Bi1 , Bir } = j=1 Bnj p=1 Bmp con la propriet
2
che E2 := E0 \ rq=1 Biq ha misura inferiore a 45 m(E0 ). Per ricorrenza, per ogni N costruiamo cos una sottofamiglia nita {Bs1 , Bst } tali che
N
N
m(E0 \ tu=1 Bsu < 54 m(E0 ). Basta scegliere N tale che 54
< per
avere lenunciato.

1.25

Derivabilit di funzioni monotne

Per ogni funzione f ci sono quattro modi di denire la sua derivata ad ogni
punto x interno al suo dominio di denizione: due derivate destre,
D + f (x) = lim sup
h0+

D+ f (x) = lim inf


+
h0

f (x + h) f (x)
h
f (x + h) f (x)
h

e due derivate sinistre,


D f (x) = lim sup
h0

f (x) f (x h)
h

f (x) f (x h)
.
h0
h
Diciamo che f derivabile in x se queste quattro derivate sono nite ed
uguali, ed in tal caso scriviamo f per il valore comune delle quattro derivate.
chiaro che per una funzione f continua in un intervallo il fatto che una delle
quattro derivate sia sempre non negativa implica che f non decrescente.
Viceversa:
D f (x) = lim inf

Teorema 1.25.1. Sia f non decrescente in [a, b]. Allora f derivabile quasi
ovunque con derivata f finita. Inoltre f misurabile, e
Z b
f (x) dx 6 f (b) f (a) .
a

178 CAPITOLO 1. PANORAMICA SU CALCOLO ED ANALISI REALE


Dimostrazione. Dobbiamo provare che la misura di Lebesgue dellinsieme
dove due qualsiasi delle quattro derivate sono diverse nulla. Mostriamo
solo che ha misura nulla linsieme !E = {x : D + f (x) > D f (x)}: gli altri
insiemi analogamente associati altre alle derivate ed al segno di minore si
trattano allo stesso modo. Sia
!Eu,v = {x : D + f (x) > u > v > D f (x)} .
Poich E coincide con lunione numerabile u,vQ Eu,v basta provare che il
numero s = m (Eu,v ) vale 0 per tutti i razionali u, v.
Per > 0 troviamo un aperto O Eu,v con m(O) = m (O) < s + (esiste
grazie alla Denizione 1.24.1 di misura esterna). Per ogni x Eu,v , il fatto
che O sia aperto e D f (x) < v implica che, per h sucientemente piccolo,
[x h, x] O e f (x) f (x h) < vh. Questi intervalli, al variare di x e
h, formano un ricoprimento di Vitali di Eu,v (Denizione 1.24.2). Pertanto il
Lemma di Vitali ?? assicura che le parti interne di un numero nito di essi,
diciamo In = (xn hn , xn ), n = 1, . . . , N, coprono un sottoinsieme A Eu,v
con m (A) 6 s . Allora
N
X
n=1

f (xn ) f (xn hn ) < v

N
X
n=1

hn < v m(O) < v (s + ) .

Daltra parte, poich D + f (x) > u, per ogni y A esiste k > 0 sucientemente piccolo anch (y, y + k) sia contenuto in qualche In e valga la
disuguaglianza f (y + k) f (y) > uk. Come prima, il Lemma di Vitali ci permette di trovare una famiglia nita J1 , . . . , JM di tali intervalli la cui unione
contiene un sottoinsieme di A di misura esterna minore di s . Sommando
su di essi si trova
M
X
i=1

f (yi + ki ) f (yi ) > v

M
X
n=1

ki > u (s ) .

Per ogni n sommiamo ora solo sugli intervalli Ji In . Allora, poich f


crescente,
X
[f (yi + ki ) f (yi )] 6 f (xn ) f (xn hn ).
Adesso sommiamo su n e troviamo
v (s + ) >

N
X
n=1

f (xn ) f (xn hn ) >

M
X
i=1

f (yi + ki ) f (yi ) > u (s ) .

1.25. DERIVABILIT DI FUNZIONI MONOTNE

179

Poich arbitrario, questa disuguaglianza implica vs > us: ma allora,


visto che si ha v < u, deve essere s = 0. Abbiamo quindi provato che g(x)
(x)
limh0 f (x+h)f
esiste quasi ovunque. Laddove g nita f derivabile e
h

f (x) = g(x).
Mostriamo ora che g misurabile e nita quasi ovunque. Poniamo gn (x) =
n f (x + n1 ) f (x) (ovviamente qui si intende f (x) = f (b) se x > b). Abbiamo appena visto che gn (x) g(x) per quasi ogni x: quindi g misurabile
per la Nota 1.9.41. Inoltre gn > 0 perch f crescente: quindi possiamo
applicare il Lemma di Fatou (Teorema 1.9.52) ed ottenere
Z

g 6 lim inf

= lim inf

gn = lim inf n
a

= f (b) f (a)

b+1/n

f n

1
f (x + ) f (x) dx
n
!

a
a+1/n

= f (b) lim inf

a+1/n

dove lultima disuguaglianza segue dal Teorema della Media Integrale (Sezione 1.1) perch f crescente in [a, a + n1 ]. Quindi g integrabile con integrale
nito, e pertanto deve essere nita quasi ovunque. Pertanto f = g esiste
nita quasi ovunque, ed inoltre vale la disuguaglianza dellenunciato.

Nota 1.25.2. Si osservi


R b che in generale, per funzioni monotne discontinue,
la disuguaglianza a f (x) dx 6 f (b) f (a) del Teorema 1.25.1 non una
uguaglianza. Per costruire un esempio basta prendere f = 0 in [1, 0] e
f = 1 in (0, 1]: allora f denita e vale 0 in [1, 1] eccetto che nel punto 0
dove non denita, ma f (1) f (1) = 1.

Nota 1.25.3. Alcune propriet della misura di Lebesgue in rapporto ad insiemi chiusi ed aperti diventano caratterizzazioni in termini della misura esterna
di Lebesgue. In particolare, il Lemma 1.9.33 si estende al seguente enunciato,
che non viene utilizzato in questo libro e che, pertanto, non dimostriamo (per
la dimostrazione si veda [22, Cap.3, Sez.3, Prop.15]):
Per un sottoinsieme E R le seguenti condizioni sono equivalenti:
(i) E misurabile
(ii) per ogni > 0 esiste un aperto O E tale che m (O \ E) <

180 CAPITOLO 1. PANORAMICA SU CALCOLO ED ANALISI REALE


(iii) per ogni > 0 esiste un chiuso C E tale che m (E \ C) < .

1.26

Funzioni di variazione limitata

Definizione 1.26.1. (Variazione totale e funzioni di variazione limitata.) Usiamo la seguente terminologia: per ogni numero reale a scriviamo
[a]+ = max{a, 0} [a] = min{a, 0}: quindi [a]+ , [a] > 0 e a = [a]+ [a] .
Sia f : [a, b] R e a = x0 < x1 < < xk = b una partizione nita di [a, b].
Chiamiamo
k
X
p=
[f (xi ) f (xi1 )]+
i=1

la variazione positiva di f rispetto a questa partizione,


n=

k
X
i=1

[f (xi ) f (xi1 )]

la variazione negativa, e t = p + n la variazione totale. evidente che


p n = f (b) f (a)

(1.64)

(si tratta della somma telescopica delle dierenze consecutive dei valori di f
sui punti della partizione). Ora poniamo P = Pab = sup p, N = Nab = sup n
e Tf = T = Tab = sup t, dove gli estremi superiori sono presi rispetto a tutte
le partizioni nite di [a, b]. Questi tre numeri si chiamano, rispettivamente,
la variazione positiva, negativa e totale di f sullintervallo [a, b]. Se T <
si dice che f di variazione limitata in [a, b] e si scrive f BV [a, b] e
T := Varf [a, b].
Stabiliamo una denizione identica per le funzioni denite su un intervallo
[a, b] ma a valori in Rn o Cn , semplicemente rimpiazzando il valore assoluto
con la norma euclidea (o qualunque altra: sono tutte equivalenti a dimensione
nita!).
Una denizione analoga si applica a funzioni denite su tutto R.

1.26. FUNZIONI DI VARIAZIONE LIMITATA

181

Esercizio 1.26.2. Dalla Denizione segue che P 6 T 6 P + N; immediato


provare che
T =P +N
e
f (b) f (a) = P N .

(1.65)

Nota 1.26.3. ovvio che le funzioni di variazione limitata in un intervallo


sono limitate. Il viceversa non vero, come mostra il prossimo Esempio
1.26.4.

Esempio 1.26.4. Non tutte le funzioni continue in un intervallo chiuso e


limitato sono a variazione limitata. Ad esempio, la funzione

0
x=0
f (x) =
1
x sin x
0<x61
non monotna a tratti nellintervallo [0, 1], perch oscilla attorno allasse
x un numero illimitato di volte quando x 0+ , per continua in [0, 1]:
lunico punto in cui la continuit non ovvia il punto x = 0 dove segue
dal Teorema del Confronto (Sezione 1.1). Essa non a variazione limitata

Figura 1.17: La funzione x sin x1 non a variazione limitata


nellintervallo [0, 1]. Infatti, per k > 0 consideriamo i punti
x2k+1 =

1
+ 2k

nei quali il graco della funzione tangente a quello della bisettrice del primo
quadrante (quindi f (x2k+1 ) = x2k+1 ), ed i punti
x2k =

3
2

1
+ 2k

182 CAPITOLO 1. PANORAMICA SU CALCOLO ED ANALISI REALE


nei quali il graco tangente allaltra bisettrice (quindi f (x2k ) = x2k ). Agli
estremi dellintervallo [yk , xk ] la funzione f ha segni opposti, e quindi la sua
variazione totale in questintervallo non inferiore a

X
k=1

|f (x2k+1 ) f (x2k )| =

X
k=1

|f (x2k+1 )| + |f (x2k )| =

X
k=1

|x2k+1 | + |x2k |

Poich |x2k+1 | + |x2k | = O( k1 ), la serie diverge.

Esercizio 1.26.5. Si svolga lo stesso calcolo del precedente Esempio 1.26.4 per
la funzione f (0) = 0 e f (x) = x2 sin(1/x2 ) per x 6= 0 e si dimostri che questa
funzione di variazione limitata (la stima nale diventa |x2k+1 | + |x2k | =

O(1/k 2)).
Teorema 1.26.6. f BV [a, b] se e solo se f la differenza di due funzioni
monotne limitate definite su [a, b].
Dimostrazione. Per x [a, b] poniamo g(x) = Pax e h(x) = Nax . Allora
g e h sono funzioni monotne non decrescenti, entrambe con valori niti,
ossia limitate, perch 0 6 Pax 6 Tax 6 Tab < dal momento che f BV , ed
analogamente per Nax . Inoltre, grazie a (1.65), si ha f (x) = f (a)+g(x)h(x),
ed quindi f la dierenza delle due funzioni monotne f (a) + g e h.
Viceversa, se f = g h su [a, b] con g e h non decrescenti denite (e
quindi nite) su [a, b], allora per ogni partizione nita {x1 , . . . , nk } di [a, b]
si ha, come in (1.64),
k
X
i=1

|f (xi ) f (xi1 )| 6

k
X
i=1

|g(xi ) g(xi1 )| +

k
X
i=1

=
e quindi Tab (f ) 6 g(b) g(a) + h(b) h(a) < .

|h(xi ) h(xi1 )|
g(b) g(a) + h(b) h(a)

Corollario 1.26.7. Se la funzione f , definita su un intervallo [a, b] o su tutto


R, di variazione limitata, allora per ogni x0 nel dominio di definizione di
f esistono i limiti destro e sinistro lim x x
0 . Tali limiti sono finiti se f
limitata in un intorno di x0 .

1.27.

IL TEOREMA FONDAMENTALE DEL CALCOLO

183

Dimostrazione. Questo fatto vero per le funzioni monotne, grazie allesistenza dei loro limiti (Sezione 1.1), e quindi anche per le funzioni di variazione
limitata, grazie al precedente Teorema 1.26.6.

Grazie al Teorema 1.25.1, ora otteniamo immediatamente:

Corollario 1.26.8. Se f di variazione limitata in [a, b], allora la derivata


f esiste finita quasi ovunque su [a, b].
Corollario 1.26.9. Una funzione di variazione limitata in [a, b] appartiene
a L1 [a, b].
Dimostrazione. Questo segue immediatamente dal Teorema 1.26.6, perch le
funzioni monotne e limitate in [a, b] sono integrabili in [a, b] con integrale
nito (si veda la Sezione 1.1).

1.27

Il teorema fondamentale del calcolo

Questa e le restanti sezioni di questo Capitolo non sono necessarie per il


seguito, e sono incluse solo per completezza.
La forma elementare del Teorema Fondamentale del Calcolo ben nota:
Teorema 1.27.1. (Teorema Fondamentale del Calcolo per lintegrale
di Riemann, ossia per funzioni C 1 [a, b].)
(i) (Derivata dellintegrale.) Sia f di classe C 1 (cio derivabile con
derivata continua) su un intervallo I R e a, x I. Allora
Z x
f (x) f (a) =
f (t) dt .
a

(ii) (Integrale della derivata.) Viceversa, se per ogni a 6 x 6 b vale


lidentit
Z x
f (x) f (a) =
g(t) dt
a

per qualche g continua su [a, b], allora f di classe C 1 e f = g per ogni


x in [a, b]. (In questo enunciato, laddendo f (a) a primo membro
messo per eleganza e simmetria: lenunciato resta vero anche eliminando questo addendo, o sostituendolo con qualsiasi altra costante, perch
in tal modo il valore della derivata f non cambia.)

184 CAPITOLO 1. PANORAMICA SU CALCOLO ED ANALISI REALE


In questa Sezione dimostriamo tale teorema nelle seguenti ipotesi molto
pi generali.
Sia f integrabile su [a, b] e consideriamo il suo integrale indenito
Z x
F (x) =
f (t) dt
(1.66)
a

dove a 6 x 6 b. Generalizziamo il Teorema 1.27.1 (i) mostrando che la


derivata dellintegrale quasi ovunque uguale allintegrando: F = f quasi
ovunque (Teorema 1.27.6). Vedremo nel Teorema 1.27.5 che il viceversa, cio
lasserzione analoga sullintegrale della derivata, vale se la derivata limitata.
Anzitutto mostriamo che lintegrale di una funzione non negativa assolutamente continuo, nel senso seguente (si veda anche Sezione 1.28):
Lemma 1.27.2. Se f una funzione integrabile (cio con integrale di Lebesgue finito) su un insieme misurabile E R, allora per ogni > 0 esiste
> 0 tale che, per ogni A E con m(A) < , si ha
Z
|f | < .
A

Dimostrazione. Senza perdita di generalit dimostriamo lenunciato per |f |


invece che f , cio assumiamo f > 0. Lenunciato ovvio se f limitata (in
tal caso = /kf k ). Se invece non lo , deniamo il suo troncamento fn
come fn (x) = min{f (x), n}. Allora 0 6 fn 6 n e fn (x) fR (x) per Rogni
x E. Per il TeoremaR di Convergenza Monotna 1.9.53 si ha E fn E f .
Sia allora N tale che E f fN < /2, e scegliamo < /2N. Ora si ha
Z
Z
Z
Z

f=
f fN +
fN <
f fN + Nm(A) < + = .
2 2
A
A
A
E

Lemma 1.27.3. Per ogni f integrabile (con integrale finito) su [a, b], la
funzione F in (1.66) continua e di variazione limitata su [a, b].
Dimostrazione. La continuit il Lemma 1.27.2. Il fatto che F sia di variazione limitata una conseguenza immediata della seguente disuguaglianza,
che vale per ogni partizione a = x0 < x1 < < xk = b :
Z b
k
k Z xi
X
X
|F (xi ) F (xi1 )| 6
|f (t)| dt =
|f (t)| dt .
i=i

i=i

xi1

1.27.

IL TEOREMA FONDAMENTALE DEL CALCOLO

185

Lemma 1.27.4. Se f integrabile su [a, b] e


b, allora f (x) = 0 quasi ovunque.

Rx
a

f (t) dt = 0 per ogni a 6 x 6

Dimostrazione. Una funzione integrabile se e solo se lo sono le parti positive e negative della sua parte reale ed immaginaria (si riveda la Denizione
1.9.47). Quindi basta dimostrare lenunciato per f > 0. In tal caso, supponiamo che f > 0 su un insieme E di misura di Lebesgue m(E) > 0 e
deduciamone una contraddizione.
Poich m(E) > 0, sappiamo dal Lemma 1.9.33 di poter trovare un chiuso
C E con m(C) > 0. Osserviamo che il fatto che f > 0 sul chiuso C implica
R
Rb
f > 0. Allora,
poich
f = 0, se consideriamo laperto O = (a, b) \ C
C
a
R
R
deve valere O f = C f < 0. Per il Lemma 1.9.3 (i) O si decompone come
unione disgiunta di una famiglia numerabile di intervalli aperti (an , bn ). Segue
R bn
R
P
dal Teorema di Convergenza Monotna 1.9.53 che O f =
n=1 an f . Perci
Rb
almeno uno degli addendi non nullo, diciamo anno f 6= 0. Ma allora
o

e quindi almeno uno fra

bno

R ano
a

fe

ano

R bno
a

f=

bno

ano

f 6= 0 ,

f non nullo, il che contraddice lipotesi.

Il prossimo lemma estende a L il Teorema Fondamentale del Calcolo


1.27.1):

Lemma 1.27.5. (Teorema Fondamentale del Calcolo per Rfunzioni


x
(con derivata in) L .) Sia f L [a, b] e F (x) = F (a) + a f (t) dt.
Allora F = f quasi ovunque in [a, b].
Dimostrazione. Per il Lemma 1.27.3 F continua e di variazione limitata in
[a, b], e quindi F esiste nito quasi ovunque per il Corollario 1.26.8. Quindi, 
se consideriamo il rapporto incrementale di passo n1 , fn (x) = n F (x + n1 ) F (x) ,
sappiamo che limn fn (x) = F (x) quasi ovunque. Daltra parte, per come F
R x+1/n
denita si ha fn (x) = n x
f (t) dt, da cui |fn | 6 kf k . Pertanto, per il
Teorema di Convergenza Dominata (Teorema 1.9.54), per ogni a 6 y 6 b si
ha

186 CAPITOLO 1. PANORAMICA SU CALCOLO ED ANALISI REALE



1
F (x) dx
F (x) dx = lim
fn (x) dx = lim n
F x+
n
n
n
a
a
!
Z y+1/n
Z a+1/n
= lim n
F (x) dx n
F (x) dx
Z

= F (y) F (a) =

f (x) dx

grazie al Teorema della Media Integrale (Sezione 1.1)


R y ed al fatto che F
continua. Ora sappiamo che per ogni y [a, b] si ha a (F (x) f (x)) dx =
0, e quindi lenunciato segue dal Lemma 1.27.4.

Finalmente possiamo estendere la parte (i) del Teorema Fondamentale


del Calcolo 1.27.1 al contesto pi generale.
Teorema 1.27.6. (Teorema Fondamentale del Calcolo per Rfunzioni
x
(con derivata in) L1 [a, b].) Sia f L1 [a, b] e F (x) = f (a) + a f (t) dt.
Allora F = f quasi ovunque in [a, b]. (Qui a un punto di Lebesgue di f ,
definito nel Teorema 1.9.37, e quindi in a definito il valore di f , ma in
alternativa basta scegliere f (a) a piacere, visto che la scelta non influenza la
derivata di F ).
Dimostrazione. Come gi osservato nella dimostrazione del Lemma 1.27.4,
basta dimostrare lenunciato per f > 0. Osserviamo anzitutto che questo
signica che F non decrescente. Come nella dimostrazione del Lemma
1.27.2, indichiamo con fn il troncamento di f al di sotto di n: fn (x) =
min{f (x), n}. Allora limn fn = f ; inoltre f fn > 0 e quindi lintegrale
Gn (x) =

f fn

monotna non decrescente. Grazie al Teorema 1.25.1, Gn esiste quasi ovunque, nita Re non negativa. Daltra parte, fn limitata, e quindi, dal Lemma
x
1.27.5, Dx a fn = fn (x) per quasi ogni x. Pertanto, per quasi ogni x [a, b],

F (x) = Dx Gn + Dx

fn > fn (x) .

1.28.

FUNZIONI ASSOLUTAMENTE CONTINUE

187

Ora facciamo tendere n a innito, ed otteniamo F (x) > f (x) quasi ovunque.
Da qui segue
Z b
Z b

F (x) dx >
f (x) dx = F (b) F (a) .
a

Rb
Daltra parte, poich F non decrescente, a F (x) dx 6 F (b) F (a) per il
Teorema 1.25.1. Quindi
Z b
Z b

F (x) dx = F (b) F (a) =


f (x) dx
Ry

e pertanto a (F (x) f (x)) dx = 0. Anche questa volta lenunciato segue


quindi dal Lemma 1.27.4.

Nota 1.27.7. La seconda parte del Teorema Fondamentale del Calcolo (cio
lenunciato del Teorema 1.27.1 (ii)) non vale in un ambito cos generale: non

1
vero che, se una funzione g derivabile
R x quasi ovunque e g L [a, b], allora
per ogni x [a, b] si ha g(x) = g(a)+ a g (t) dt. Ad esempio, sia g la funzione
denita nellintervallo [1, 1] che vale 0 in [1, 0) e 1 in [0, 1]. Allora g

denita ovunque in [1, 1] tranne


R x che nellorigine, e g = 0 (quasi ovunque).
Quindi la funzione integrale 1 g (t) dt la funzione identicamente nulla, e
non coincide con g.
Un problema interessante, che proponiamo al lettore, decidere se una
funzione g derivabile ovunque in un intervallo [a, b] con derivata in L1 [a, b]
sia lintegrale della propria derivata. Una risposta parziale pi sotto nel

Teorema 1.28.9.

1.28

Funzioni assolutamente continue

Definizione 1.28.1. Una funzione f denita in un intervallo [a, b] R a


valori reali si dice assolutamente continua se per ogni > 0 esiste > 0 tale
che, per ogni famiglia nita P
di intervalli disgiunti [xi , yi ] con lunghezza totale
P
n
n
i=1 |f (yi ) f (xi )| < .
i=1 |yi xi | < , si abbia
Stabiliamo una denizione identica per le funzioni denite su un intervallo
[a, b] ma a valori in Rn o Cn , semplicemente rimpiazzando il valore assoluto
con la norma euclidea (o qualunque altra: sono tutte equivalenti a dimensione
nita!).

188 CAPITOLO 1. PANORAMICA SU CALCOLO ED ANALISI REALE


Nota 1.28.2. chiaro che le funzioni assolutamente continue formano uno
spazio vettoriale contenuto in quello delle funzioni continue. Inoltre, grazie
al Lemma 1.27.2, tutti gli integrali indeniti (di integrandi continui) sono
assolutamente continui. Una condizione suciente per la assoluta continuit
ovvia: che f sia derivabile ovunque con derivata limitata. Infatti sotto
questa ipotesi il Teorema di Lagrange (Sezione 1.1) implica immediatamente
la disuguaglianza di Lipschitz introdotta in (??),
|f (yi ) f (xi )| 6 M |yi xi |
per ogni xi e yi , con M = kf k , ed ovvia losservazione che la disuguaglianza di Lipschitz (??) implica la assoluta continuit, e questo dimostra
quanto appena asserito: se f derivabile ovunque e f L , allora f
assolutamente continua.
Studieremo in maggior dettaglio la disuguaglianza di Lipschitz nella Sezione
5.11, e riprenderemo questa semplice osservazione nel Corollario ??).
Per lo stesso motivo, una funzione continua e C 1 a tratti (si veda la Denizione 5.11.8 che diamo nel seguito) in un intervallo [a, b] assolutamente continua; analogamente, lo una funzione continua e C 1 a tratti su R con punti
di singolarit isolati per la derivata (cio privi di punti di accumulazione).

Esempio 1.28.3. Non tutte le funzioni continue in un intervallo sono assolutamente continue. Si consideri la funzione dellEsempio 1.26.4: abbiamo
visto che essa continua in [0, 1]. Questa funzione derivabile con continuit in ogni intervallo [a, 1] con 0 < a < 1, e quindi assolutamente
continua in questi intervalli, grazie alla precedente Nota 1.28.2: per non
assolutamente continua in [0, 1]. Per vericarlo, si considerino i punti xk
introdotti nellEsempio 1.26.4, nei quali il graco della funzione alternativamente
tangente alle due bisettrici degli assi. Abbiamo visto che la serie
P
|f
(x
k+1 ) f (xk )| divergente, e pi precisamente che il termine gek=1
1
nerale tende a zero
Pn per k esattamente come k . Pertanto le somme
parziali sm,n = k=m |f (xk+1 ) f (xk )| con n > m divergono per ogni m
quando n tende ad innito: quindi, ssato un qualsiasi > 0, comunque si
scelga m esiste n = n tale che sm,n > . Daltra parte, x0 = 2 ed i punti {xk , k = 0, . . . , }P
costituiscono una partizione (innita) dellintervallo
2
[0, ]. Perci la serie
k=1 xk xk+1 la lunghezza di questo
P intervallo, e
quindi converge. Ne segue che le somme parziali rm,n = nk=m |xk+1 xk |
con n > m tendono a zero se m tende ad innito: ossia, per ogni > 0,

1.28.

FUNZIONI ASSOLUTAMENTE CONTINUE

189

esiste m = m tale che rm,n < per ogni n > m. Questo signica che, per
ogni ssato, comunque si scelga > 0 la sottosuccessione nita costituita
dai punti xk per m 6 k 6 n non verica la disuguaglianza della Denizione
1.28.1 di assoluta continuit.

Esercizio 1.28.4. Le funzioni assolutamente continue sono anche continue,


mentre i limiti puntuali di funzioni continue non sempre lo sono. Allora, se
fj sono funzioni assolutamente continue che convergono puntualmente ad una
funzione f , non pu essere vero in generale che f sia assolutamente continua.
Eppure, se i punti xi e yi sono quelli scelti nella Denizione 1.28.1, si ha
limj fj (yi ) = f (yi ) e limj fj (xi ) = f (xi ), quindi in particolare
lim
j

n
X
i=1

|fj (yi ) fj (xi )| =

n
X
i=1

|f (yi ) f (xi )| .

A prima vista sembra quindi che la disuguaglianza della Denizione 1.28.1


valga non solo per le fj ma anche per il loro limite puntuale f , e che quindi
anche f sia assolutamente continua: ma abbiamo visto che questo in generale
non vero. Dov lerrore? (Suggerimento: nella denizione di assoluta
continuit, dipende solo da ?)

Esempio 1.28.5. Limiti uniformi di successioni di funzioni assolutamente continue non sono necessariamente assolutamente continui. Si consideri la funzione dei precedenti Esempi 1.26.4 e 1.28.3, e la si consideri denita in un
intervallo [0, a] per qualche a > 0 (oppure [0, +). Essa si annulla ai punti
1
xn = n
, una successione che converge a 0. Approssimiamo f con la funzione
fn su [0, a] denita da fn (x) = 0 se x > xn e fn (x) = f (x) altrimenti. Allora
f fn nulla al di fuori di [0, xn ], ed in [0, xn ] coincide con f , e quindi in
questultimo intervallo verica la disiguaglianza |f (x) fn (x)| = |f (x)| 6 x.
Ne segue che kf fn k 6 xn 0, e quindi fn converge uniformemente a f
sullintervallo [0, a]. Le funzioni fn sono tutte continue e C 1 a tratti in [0, a],
e quindi assolutamente continue in base alla Nota 1.28.2, per il limite f non
assolutamente continuo, come fu mostrato nellEsempio 1.28.3.

Proposizione 1.28.6. Ogni funzione assolutamente continua di variazione


limitata.
Dimostrazione. Scegliamo = 1 nella denizione di assoluta continuit e
prendiamo il valore corrispondente di . Ogni partizione di [a, b] in intervalli disgiunti si pu spezzare (aggiungendo eventualmente ulteriori punti di

190 CAPITOLO 1. PANORAMICA SU CALCOLO ED ANALISI REALE


suddivisione) in un insieme nito di, diciamo, N famiglie di intervalli tutti
mutualmente disgiunti, ciascuna di lunghezza minore di . Osserviamo che
N limitato indipendentemente dalla partizione scelta, perch tutti gli intervalli sono disgiunti, e quindi il numero di sottofamigle di lunghezza non
supera |b a|/. Poich f assolutamente continua, la sua variazione totale
su ciascuna di queste sottofamiglie deve essere inferiore a 1 (per come si
scelto ), e quindi la variazione totale sulla partizione originale inferiore a
N. Prendendo lestremo superiore rispetto a tutte le partizioni otteniamo
che la variazione totale di f in [a, b] inferiore a N.

Ora dal Corollario 1.26.8 segue:

Corollario 1.28.7. Ogni funzione assolutamente continua ha derivata (finita) quasi ovunque.
Ora estendiamo alle funzioni assolutamente continue una propriet ben
nota delle funzioni continue:
Lemma 1.28.8. Se f assolutamente continua in [a, b] e f = 0 quasi
ovunque, allora f costante su [a, b].
Dimostrazione. Per ogni t [a, b] esiste un insieme Et (a, b) di misura di
Lebesgue t a in cui f = 0. Per ogni x Et e > 0 esiste un h > 0 tale che
lintervallo [x, x + h] contenuto in [a, t] (perch Et contenuto nellaperto
(a, b)) e |f (x + h) f (x)| < h (perch f (x) = 0). Grazie al Lemma 1.9.33,
per ogni > 0 esiste un sottoinsieme compatto C Et di misura maggiore
di che pu essere coperto da una famiglia di tali intervalli. Poich C
compatto (Denizione 1.9.4), esso viene ricoperto da una sottofamiglia nita
di tali intervalli (Lemma 1.9.3 (ii)), i quali, eventualmente inserendo altri
punti di suddivisione, si possono prendere con interni disgiunti: indichiamoli
con [xk , yk ], con a = y0 6 x1 < y1 6 x2 < 6 yn 6 xn+1 = t . Ora
prendiamo un > 0 e scegliamo per il numero che corrisponde a > 0
nella Denizione 1.28.1 di assoluta continuit. Ora sappiamo che
n
X
k=0

n
X
k=1

|xk+1 yk | <

|f (yk ) f (xk )| <

n
X
k=1

(yk xk ) < (t a) .

1.28.

FUNZIONI ASSOLUTAMENTE CONTINUE

191

Perci segue dalla assoluta continuit di f e dalla scelta di che


n
X
k=0

|f (xk+1 ) f (yk )| < .

Dalle ultime due disuguaglianze ricaviamo




n
n

X
X


(f (xk+1 ) f (yk )) +
(f (yk ) f (xk )) < + (t a) .
|f (t) f (a)| =


k=0

k=1

Daltra parte, nellultimo membro e sono arbitrari. Prendendo lestremo


inferiore rispetto a queste due quantit si trova che f (t) f (a) = 0, e quindi
f (t) = f (a) per ogni t [a, b].

Teorema 1.28.9. (Teorema Fondamentale del Calcolo e funzioni assolutamente continue.)


R x Se la funzione F un integrale indefinito, cio se
verifica F (x) = F (a) + a f (t) dt per qualche f localmente integrabile (ossia
integrabile sui compatti), allora F assolutamente continua e F = f quasi ovunque. Viceversa, se F assolutamente continua, allora lintegrale
indefinito della propria derivata.

Dimostrazione. La prima parte dellenunciato il Lemma 1.27.2. Viceversa, sia F assolutamente continua in [a, b]: allora di variazione limitata (Proposizione 1.28.6) e derivabile quasi ovunque (Corollari 1.28.7 oppure 1.26.8). Inoltre F la dierenza di due funzioni monotne non decrescenti, F = F1 F2 (Teorema 1.26.6), e quindi |F | 6 F1 + F2 . Pertanto, per il Teorema Fondamentale del Calcolo per L [a, b] (Lemma 1.27.5),
Rb
|F (x)| dx 6 F1 (b) + F2 (b) F1 (a) F2 (a) <R , quindi F L1 [a, b].
a
x
Ne segue che il suo integrale indenito G(x) = a F (t) dt assolutamente
continuo, di nuovo per il Lemma 1.27.2, e quindi lo la dierenza f = F G.
Daltra parte, f = F G = 0 quasi ovunque, di nuovo per il Lemma 1.27.5, e quindi f costante in [a, b] per il Lemma 1.28.8. Poich
f (a) = F (a) G(a) = F (a), ora per ogni x [a, b] si ha
Z x
F (x) = F (a) + G(x) =
F (t) dt .
a

192 CAPITOLO 1. PANORAMICA SU CALCOLO ED ANALISI REALE


Corollario 1.28.10. Se f assolutamente continua in un intervallo [a, b],
allora la variazione totale Tab (f ) di f in [a, b] data da
Tab (f )

b
a

|f (t)| dt .

(1.67)

Analogo risultato vale per funzioni a valori in Rn se dentro lintegrale si


sostituisce il valore assoluto con la norma (ad esempio euclidea).
Dimostrazione. Studiamo dapprima il caso in cui f sia a valori in uno spazio
di dimensione 1 (R o C). elementare provare che la variazione totale Tab
verica la disuguaglianza
Tab

|f (t)| dt .

(1.68)

Infatti, sia {a = t0 < t1 < < tn } una partizione nita di [a, b]. Grazie al
precedente Teorema 1.28.9, si ha
|f (ti ) f (ti1 | 6

ti

ti1

|f (t)| dt .

Quindi la variazione
totale rispetto ad una qualsiasi partizione nita magRb
giorata da a |f (t)| dt. Passando allestremo superiore rispetto alla partizione otteniamo (1.68)
Dimostriamo il viceversa. Poich f L1 [a, b], per ogni > 0 esistono
funzioni a gradini (Denizione 1.18.1)) g 6 f 6 h su [a, b] tali che
Z

b
a

(h(t) g(t)) dt < .

(1.69)

Inttendo se necessario le rispettive partizioni di [a, b] possiamo supporre che


g e h siano a gradini rispetto
Pm +{a = t0 < t1 < < tm =
P allastessa partizione
a

e
h
=
b}. Scriviamo allora g = m
i=1 ai i , dove i la funzione
i=1 i i
caratteristica dellintervallo i = [ti1 , ti ] della partizione, e le costanti a
i ,

a+
sono
rispettivamente
minoranti
e
maggioranti
di
f
quasi
ovunque
in
tale
i
intervallo. Allora, per ogni u, v in i si ha

|f (u) f (v)| 6 a+
i ai

(1.70)

1.28.

FUNZIONI ASSOLUTAMENTE CONTINUE

193

e quindi, per ogni v i , segue da (1.68) che





f (ti ) f (ti1 )
1


f (v) 6
ti ti1
ti ti1
6

1
ti ti1

Z ti



(1.71)
(f (t) f (v)) dt

ti1
Z ti

|f (t) f (v)| dt 6 a+
i ai .
ti1

Dalla disuguaglianza triangolare ora segue


|f (ti ) f (ti1 )|

> |f (v)| a+
i ai ,
ti ti1
ed integrando rispetto a v in i otteniamo
|f (ti ) f (ti1 )| >

ti

ti1

|f (v)| dv (a+
i ai )(ti ti1 ) .

(1.72)

Questa disuguaglianza vale per ogni i. Sommando per i da 1 a m, grazie a


(1.69) abbiamo
m
X
i=1

|f (ti ) f (ti1 )| >

b
a

|f (t)| dt .

(1.73)

Ora prendendo lestremo superiore al variare della partizione troviamo Tab (f ) >
Rb
|f (t)| dt . Poich libero di variare arbitrariamente, passando allea
stremo inferiore rispetto a ricaviamo
Tab (f )

>

|f (t)| dt

ossia la disuguaglianza inversa desiderata.


In seguito ci servir il caso di f a valori in Rn . La disuguaglianza diretta si
dimostra in maniera identica, ma quella inversa lievemente pi complicata.
Evidenziamo le dierenze rispetto allargomento precedente. Ora la derivata
f in L1 [a, b] ma a valori vettoriali (in Rm ), ossia tutte le sue componenti
fj sono in L1 , per j = 1, . . . , n. Consideriamo dunque funzioni a gradini

che vericano quasi ovunque le disuguaglianze


e scriviamole
Pn gj 6 fj 6 hj ,P
rispetto alla partizione di prima come gj = i=1 aji i e hj = ni=1 a+
ji i .

194 CAPITOLO 1. PANORAMICA SU CALCOLO ED ANALISI REALE


Rammentiamo che a dimensione nita tutte le norme sono equivalenti, ed in
particolare equivalenti alla norma 1 , come mostrammo esplicitamente nella
Nota 1.7.10. In particolare, segue da (1.19) che
n
X


fj (u) fj (v)
kf (u) f (v)k 6

j=1

e quindi (1.70) diventa

kf (u) f (v)k 6

n
X
j=1

a+
ji aji

ed in (1.71) basta sostituire la norma al modulo per ottenere



X
n
f (ti ) f (ti1 )



a+
f (v) 6
ji aji .
ti ti1
j=1

Al posto di (1.72) ora si ha


kf (ti ) f (ti1 )k >

ti

ti1

kf (v)k dv

n
X
j=1

a+
ji aji (ti ti1 ) .

P Rb
Poich lultimo addendo al lato destro coincide con nj=1 a (hj gj ), il resto
della dimostrazione procede esattamente come prima salvo per la sostituzione
dei moduli con le norme.

Il seguente corollario un caso particolare semplicissimo di un teorema


pi ambizioso che dimostreremo subito dopo (Teorema 1.28.12).

Corollario 1.28.11. (Teorema Fondamentale del Calcolo per funzioni derivabili ovunque con derivata in L .) Sia f una funzione definita
in un intervallo [a, b], derivabile ovunque in (a, b) e tale che f L [a, b].
Allora f assolutamente continua, ed in particolare, per ogni a, x R,
Z x
f (x) = f (a) +
f (t) dt .
a

Dimostrazione. Notiamo anzitutto che f soddisfa la la disuguaglianza di


Lipschitz (??) e quindi assolutamente continua, come gi osservato nella
Nota 1.28.2. Per lo stesso motivo anche la funzione

1.28.

FUNZIONI ASSOLUTAMENTE CONTINUE

!F (x) := f (a) +

195

f (t) dt

(1.74)

soddisfa la disuguaglianza di Lipschitz ed assolutamente continua, dal


momento che, per ogni u, v [a, x],
Z v
Z v


|F (v) F (u)| =
f (t) dt 6
|f (t)| dt 6 kf k |v u|
u

(lassoluta continuit segue anche dal Lemma 1.27.2 oppure dal Teorema
1.28.9). Pertanto F f assolutamente continua, e, sempre per il Teorema
1.28.9 F = f quasi ovunque. Quindi (F f ) = 0 quasi ovunque in [a, b], e
pertanto F f costante, per il Lemma 1.28.8. Visto che F (a) = f (a), ne
segue che F (x) = f (x) per ogni x, e quindi lenunciato.

Lipotesi che la derivata f sia limitata, nel precedente Corollario 1.28.11,


si pu eliminare. Per questo scopo ricorriamo ad uno strumento pi sosticato, la propriet di approssimazione con funzioni semicontinue (Teorema di
VitaliCarathodory 1.14.4):
Teorema 1.28.12. (Teorema Fondamentale del Calcolo per funzioni
derivabili ovunque con derivata in L1 .) Sia f una funzione definita in
un intervallo [a, b], derivabile ovunque in (a, b) e tale che f L1 [a, b]. Allora
f assolutamente continua, ed in particolare, per ogni a, x R,
Z x
f (x) = f (a) +
f (t) dt .
a

Dimostrazione. Basta provare la disuguaglianza


Z x
f (x) f (a) 6
f (t) dt ,

(1.75)

perch allora, applicando questa stessa disuguaglianza alla funzione f al


posto di f , ricaviamo luguaglianza dellenunciato.
Se f fosse continua, sarebbe anche limitata grazie al Teorema di Weierstrass
(Sezione ??), e quindi lenunciato si ridurrebbe alla semplice propriet del
precedente Corollario 1.28.11. In generale, invece, f non continua, ma
possiamo approssimarla con funzioni semicontinue. Infatti, per ogni > 0, il

196 CAPITOLO 1. PANORAMICA SU CALCOLO ED ANALISI REALE


Teorema di VitaliCarathodory 1.14.4 assicura lesistenza di una funzione g
semicontinua inferiormente in [a, x] tale che f 6 g e
Z x
Z x
g(t) dt <
f (t) dt +
(1.76)
a

Poich [a, x] [a, b] ha misura limitata, possiamo aggiungere a g una costante


positiva abbastanza piccola anch lultima disuguaglianza rimanga vera e
la prima diventi f < g. (Nota: per lo stesso teorema esiste anche una
funzione h semicontinua superiormente tale che f > h e gli integrali delle
due dieriscono meno di . Se utilizzassimo h al posto di g nel resto della
dimostrazione, otterremmo la disuguaglianza reciproca di (1.75), ma pi
semplice ricavarla dallargomento del primo paragrafo della dimostrazione
che ricorre a f invece di f ).
Ora abbiamo bisogno di una piccola approssimazione lineare. Fissiamo > 0
arbitrario, e per a 6 y 6 x poniamo
Z x
F (y) :=
g(t) dt f (y) + f (a) + (y a) .
(1.77)
a

Si noti cheR F continua, perch lo sono f (derivabile ovunque!) e la primitiva


y
G(y) := a g(t) dt continua: la seconda asserzione Rdiscende dal Teorema
y
del Confronto (Sezione 1.1), perch G(y2 ) G(y1 ) = y12 g(t) dt e
Z


y2

y1

Z

f (t) dt <

y2

y1



g(t) dt < (|g(y1)| + ) |y2 y1 |

se y2 sucientemente vicino a y1 , in base alla parte (v) dellEsercizio 1.14.3.


Poich g semicontinua inferiormente, linsieme {t : g(t) > f (y)} un
aperto (Denizione 1.14.1), e questo aperto contiene y perch g > f . Daltra
parte, la derivabilit di f al punto y implica che il rapporto incrementale di
f resti inferiore a f (y) + in tutto un intorno aperto di y. Perci esiste un
intorno Iy := {y y < t < y + y } di y in cui

g(t) > f (y)

(1.78)

f (t) f (y)
< f (y) + .
ty

(1.79)

1.28.

FUNZIONI ASSOLUTAMENTE CONTINUE

Segue da (1.78) e (1.79) che, per ogni t Iy ,


Z v
F (v) F (y) =
g(t) dt f (v) + f (y) + (v y)

197

(1.80)

> (v y) f (y) (v y) (f (y) + ) + (v y) = 0 .


Ma sappiamo che F continua, quindi linsieme dei suoi zeri (che non vuoto
perch F (a) = 0) chiuso in [a, x], quindi compatto, ed allora ha un punto di
massimo y0 [a, x]. Se y0 = x allora F 0 in [a, x]. Se invece y0 < x, allora
F (t) > 0 per y0 < t 6 x. In entrambi i casi, F (x) > 0. Allora, Rpassando
x
al limite per 0 nella denizione (1.77)
R x si trova f (x) f (a) 6 a g(t) dt,
e da (1.76) ora segue f (x) f (a) 6 a f (t) dt + . Dal momento che > 0
arbitrario, prendendo lestremo inferiore su otteniamo (1.75), e quindi il
risultato voluto.

Nota 1.28.13. Il fatto che f esista ovunque non implica necessariamente che
f appartenga a L1 . Ad esempio, la funzione f (x) = x2 sin(1/x2 ) (per x 6= 0)
assolutamente continua (per un ragionamento analogo a quello dellEsercizio 1.26.5), ma la sua derivata, f (x) = 2x sin(1/x2 ) 2x1 cos(1/x2 ) non
appartiene a L1 in nessun intorno dellorigine, a causa della divergenza di
tipo 1/x: facile vericare che questa funzione, anche se oscillante a causa
dellloscillazione del coseno, ha, in valore assoluto, integrale divergente (esercizio). Naturalmente questa funzione ha derivata in L1 [a, b] per ogni [a, b]
che non contenga lorigine, e quindi il precedente Teorema 1.28.12 si applica
a questi intervalli.

Nota 1.28.14. Dal Teorema ??appiamo che, se una funzione f assolutamente continua, allora derivabile quasi ovunque, la derivata f integrabile sui
compatti e f lintegrale indenito della propria derivata (su quei compatti); viceversa, se f un integrale indenito, allora assolutamente continua
e f coincide quasi ovunque con lintegrando. Dal Teorema ??appiamo che,
se f derivabile ovunque con f integrabile sui compatti, allora f assolutamente continua ed lintegrale indenito della propria derivata. Allora
naturale chiedersi se vale il viceversa del primo enunciato, nel senso seguente: se f derivabile quasi ovunque e f integrabile sui compatti, allora f
necessariamente lintegrale indenito della propria derivata? Vedremo nella
Proposizione 1.28.19, forse sorprendentemente, che la risposta no.
A questo ne sono opportuni vari preliminari sul legame fra funzioni con de-

198 CAPITOLO 1. PANORAMICA SU CALCOLO ED ANALISI REALE


rivata integrabile e misure di Borel, che presentiamo nelle prossime Sezioni.

1.28.1

Funzioni di variazione limitata come derivate


di RadonNykodim di misure di Borel

In questa Sottosezione mostriamo che le funzioni di variazione limitata sono


le primitive delle misure di Borel nite:
Teorema 1.28.15. (Funzioni di variazione limitata e misure complesse.)
(i) Sia una misura complessa
su R finita (ossia (R) C). AlloRx
ra la funzione f (x) = d = (, x) di variazione limitata, continua a sinistra (ossia f (x ) := limtx f (t) = f (x) per ogni
x, e limx f (x) = 0. I punti di continuit (bilatera) di f sono
precisamente gli x che non sono atomi di , nel senso che ({x}) = 0.
(ii) Sia f una funzione di variazione limitata, continua a sinistra e tale che
limx f (x) =R 0. Allora esiste una misura complessa finita su R
x
tale che f (x) = d per ogni x, e la sua variazione totale kk della
Definizione 1.9.29 legata alla variazione totale di f della Definizione
1.26.1 dalla relazione Tf (x) = kk(, x).
Dimostrazione. Dimostriamo solo la parte (i): per la dimostrazione di (ii)
rinviamo a [23, Theorem 8.14]. Cominciamo con il dimostrare che la funzione
f (x) = (, x) continua a sinistra. Sia y x . Allora la famiglia di
insiemi Ey := (, y) invade (, x), nel senso che gli Ey sono una famiglia
crescente di sottoinsiemi di (, x). Siccome una misura complessa la somma, cone coecienti 1 e i, di quattro misure reali positive, possiamo assumere che sia una misura positiva. Allora, grazie allinclusione degli insiemi
Ey , la funzione f (y) = (Ey ) non decrescente, e quindi suciente clcolare
il limite per successioni, ovvero limitare lattenzione a successioni crescenti
x1 < x2 < < xn x e mostrare che (, x) = (i Exi ) = limi (Exi ):
ma questo segue dalla numerabile additivit della misura (identit 1.22).
Inoltre,
n
X
i=1

|f (xi ) f (xi1 )| =

n
X
i=1

| ([xi1 , xi ))| 6 ||(, x)

1.28.

FUNZIONI ASSOLUTAMENTE CONTINUE

199

per cui f a variazione limitata e la sua variazione totale verica Tf (x)


Varf [a, x] 6 ||(, x).
Inne, scegliamo una successione decrescente xn : per lo stesso ragionamento di prima, o meglio per il Corollario 1.9.12, limx f (x) =
limn ((, xn )) = (n (, xn )) = () = 0. Questo dimostra la parte
(i).

Corollario 1.28.16. (Formula di integrazione per parti.) Sia g


C 1 [a, b] e f di variazione limitata su [a, b]. Sia f la misura finita associata
a
Rx
f nella parte (ii) del Teorema 1.28.15, ossia tale che tale che f (x) d.
Allora vale la seguente formula di integrazione per parti:
Z b
Z b
g(x) d(x) = g(b) f (b) g(a) f (a)
g (x) f (x) dx
a

purch f sia continua ai punti estremi a e b. Se al punto iniziale a o al


punto finale b non vale lipotesi di continuit, la precedente identit vale ancora se rimpiazziamo i valori f (a) e f (b) rispettivamente con limxa+ f (x) e
limxb f (x) (rammentiamo che le funzioni di variazione limitata ammettono
i limiti destro e sinistro: Corollario 1.26.7).
Dimostrazione.
R xIn base al Teorema Fondamentale del Calcolo (Sezione 1.1),
g(x) g(a) + a g (t) dt. Quindi il primo membro dellidentit nellenunciato
diventa
Z b
Z b
Z bZ x
g(x) d(x) =
g(a) d(x) +
g (t) dt d(x)
(1.81)
a

= (f (b) f (a)) g(a) +

Z bZ
a

g (t) dt d(x) .

Sia + la funzione caratteristica di R+ (ovvero la funzione che vale 1 se


la sua variabile non negativa e zero altrimenti). Allora lultimo integrale
diventa
Z bZ x
Z bZ b

g (t) dt d(x) =
g (t) + (x t) dt d(x) .
a

Poich g continua su [a, b], quindi integrabile, lordine di integrazione si


pu scambiare in base al Teorema di Fubini 1.20.4 (ii), e diventa
Z bZ b
Z b

g (t) d(x) dt =
g (t) (f (b) f (t)) dt

200 CAPITOLO 1. PANORAMICA SU CALCOLO ED ANALISI REALE


= f (a) (g(b) g(a)) + f (b) (g(b) g(a))

g (t) f (t) dt .

Sostituendo questa identit in (1.81) otteniamo lenunciato.

1.28.2

Funzioni assolutamente continue e funzioni continue singolari

Sappiamo che le funzioni assolutamente continue sono a variazione limitata. Il seguente risultato illustra quali funzioni a variazione limitata sono
assolutamente continue.
Definizione 1.28.17. Una funzione continua ovunque, derivabile quasi ovunque con derivata nulla quasi ovunque, si chiama una funzione continua singolare.
Teorema 1.28.18. (Decomposizione di Lebesgue.) Se f di variazione
limitata su R, continua a sinistra e limx f (x) = 0, allora f esiste quasi
ovunque, f L1 (R), ed esiste una seconda funzione fs a variazione limitata,
continua a sinistra e tendente a zero per x , derivabile quasi ovunque
con fs = 0 quasi ovunque, e tale che, per ogni x,
Z x
f (x) = fs (x) +
f (t) dt .

La funzione fs quindi una funzione continua singolare nel senso della precedente Definizione 1.28.17, che viene chiamata la parte singolare di f . Si
ha fs 0 se e solo se f assolutamente continua.
Dimostrazione. In base al Teorema 1.28.15, f (x) = (, x) per qualche
misura di Borel complessa nita e per ogni x. In base al teorema di Radon
Nykodim (parteR(ii) del Teorema 1.9.27), possiamo decomporre (E) come
(E) = s (E)+ E g(t) dt, con s singolare rispetto a e g L1 (R) (in questo
caso rispetto alla misura di Lebesgue). Allora, ponendo fs (x) = s (, x),
segue di nuovo dal Teorema di RadonNykodim 1.9.27, parte (iii), che fs =
0 e f = g quasi ovunque: abbiamo provato lidentit dellenunciato. La
funzione fs identicamente
R x nulla se e solo se s la misura zero (e viceversa),
nel qual caso f (x) = g(t) dt assolutamente continua per il Lemma
1.27.2: questo prova lultima asserzione dellenunciato.

1.28.

FUNZIONI ASSOLUTAMENTE CONTINUE

1.28.3

201

Linsieme ternario di Cantor

In questa Sottosezione mostriamo che lipotesi che la derivata esista ovunque,


nel Teorema 1.28.12, non si pu allentare. Infatti, come annunciato nella
Nota 1.28.19, ora mostriamo il fatto seguente:
Proposizione 1.28.19. (f non necessariamente lintegrale di f se f
esiste solo quasi ovunque.) Esistono funzioni
R x f derivabili quasi ovunque,

1
con f L , ma tali che f (x) 6= f (a) + a f (t) dt. In particolare,esistono
funzioni con derivata nulla quasi ovunque ma non costanti.
Dimostrazione. La dimostrazione consiste nella costruzione di un esempio appropriato. Questa costruzione svolta nel prossimo Esempio 1.28.20.

Esempio 1.28.20. (Insieme di Cantor e funzione di Cantor.) Sia


E0 = [0, 1], E1 = E0 \ (1/3, 2/3), e, per ricorrenza, En un insieme costituito dallunione di 2n intervalli chiusi disgiunti in [0, 1] dal quale si ottiene
En+1 rimuovendo da ciascuno di questi intervalli il terzo centrale. Si noti che
En lunione di 2n intervalli ciascuno dei quali ha lunghezza 3n , e quindi
n
la misura
T di Lebesgue di En (2/3) . Linsieme di Cantor denito da
E = n=1 En ; inoltre, per lo stesso motivo, anche il complemento En in
[0, 1] ununione di intervalli (aperti), ma ciascuno dista dal successivo esattamente 3n , e quindi il complemento di E denso in [0, 1].
Linsieme E chiuso, perch intersezione di chiusi, e compatto perch oltre
ad essere chiuso anche limitato, essendo contenuto in [0, 1]. Il complemento in [0, 1] di E denso, perch Per il Corollario 1.9.12, la sua misura di
Lebesgue
 n

\
2
m(E) = m( En ) = lim
= 0.
n
3
n=1
Ora indichiamo la funzione caratteristica di En con n , e rinormalizziamo
Rx
ponendo hn = (3/2)n n . Allora khn k1 = 1. Poniamo fn (x) = 0 hn (t) dt.
Allora fn (0) = 0, fn (1) = 1, fn non decrescente e costante su ciascun intervallo contenuto in E. Invece
sui 2n intervalli chiusi Jn che compongono En ,
R
ciascuno lungo 3n , si ha Jn hn (t) dt = (3/2)n 3n = 2n . Daltra parte, Jn
lunione di due intervalli chiusi di lunghezza 3(n+1) che sono parti di En+1
e di un intervallo aperto centrale (della stessa lunghezza) che nel complemento di En+1 . Visto che hn+1 normalizzata in modo da essere tre volte

202 CAPITOLO 1. PANORAMICA SU CALCOLO ED ANALISI REALE


maggiore di hn sui primi due
questi sono tre volte pi corti di
R intervalli, man
Jn , si ritrova nuovamente Jn hn+1 (t) dt = 2 . Pertanto, quando si integrano
hn e hn+1 , le funzioni integrali crescono ad una pendenza diversa su ciascuno
degli intervalli Jn di lunghezza 3n che compongono En : la prima delle due
cresce a pendenza costante pari a (3/2)n , la seconda cresce solo nel primo
e nellultimo terzo ma con pendenza (3/2)n+1 e rimane costante nel terzo
centrale. Quindi, al termine dellintervallo Jn , entrambe queste primitive
sono aumentate della stessa quantit 2n , e dopo, nel successivo intervallo nel complemento di En , entrambe rimangono costanti. Di conseguenza,
fn+1 (x) = fn (x) per tutti gli x
/ En . Invece, per x En , diciamo per x in
n
un intervallo dei 2 intervalli che formano En (chiamiamolo J), abbiamo
Z
|fn+1 (x) fn (x)| 6 |hn+1 (t) hn (t)| dt
=

Z

+
J\En+1

JEn+1

|hn+1 (t) hn (t)| dt

 n
 n+1  n !
3
3
3
6
m(J En+1 )
m(J \ En+1 ) +

2
2
2
 n 



3
1 n
3
2 n
=
3 +
1
3
2
3
2
3
 
2
2n .
=
3
P
n
Poich la serie
convergente, dalle ultime due stime segue che {fn }
n=1 2
una successione di Cauchy nella norma uniforme (si completino i dettagli
per esercizio), e quindi converge ad una funzione f continua non decrescente
tale che f (0) = 0, f (1) = 1 e costante in intorni sucientemente piccoli di
ogni x
/ E, quindi con f (x) 0 fuori di E. Poich m(E) = 0, la funzione
f si annulla quasi ovunque, e quindi f una funzione continua singolare
nel senso della Denizione 1.28.17. La funzione f si chiama la funzione di
Cantor.

Nota 1.28.21. (Propriet dellinsieme di Cantor e funzione ternaria


di Cantor.) Linsieme di Cantor ha varie propriet interessanti.
Anzitutto, linsieme di Cantor totalmente sconnesso: la componente connessa di ciascun suo punto x proprio il singleton {x}. Infatti, se la componente

1.28.

FUNZIONI ASSOLUTAMENTE CONTINUE

203

connessa contenesse anche un altro punto y, dovrebbe contenere lintero intervallo (x, y). Chiamiamo d = |y x| la lunghezza di tale intervallo. Sia n
tale che 3n < d. Linsieme En ottenuto dopo i primi n tagli non contiene
intervalli di lunghezza maggiore di 3n , come si vede immediatamente per
induzione, e quindi non pu contenere (x, y).
Esiste un modo pi chiaro ed elegante di provare questo risultato. Ogni
punto nellintervallo [0, 1] P
pu essere scritto come sviluppo in base 3, ossia
n
come la serie convergente
n=1 an /3 , con an = 0, 1 o 2. La serie parte da
n = 1 perch limitiamo lattenzione a sviluppi la cui somma in [0, 1]. Per
il punto 0, tutti gli an sono nulli; per il punto 1, tutti gli an valgono 2, ma
in questo casoP
lo sviluppo non unico se si accetta che gli indici partano da
n
n = 0, perch
= 1 = 1+0/3+0/32 +. . . . Osserviamo che il punto
n=1 2 3
1/3 corrisponde alla successione dei coecienti a1 = 1, a2 = a3 = = 0,
ma anche inP
questo caso lo sviluppo non unico a causa del fatto che la serie

n
geometrica
P n=2 2n3 = 2/9 + 2/27 + . . . converge a 1/3. Analogamente,
2/3 =
n=1 an /3 con a1 = 2, a2 = a3 = = 0, ma anche a1 = 1,
a2 = a3 = = 2. I punti che hanno due diversi sviluppi ternari sono quelli
le cui cifre da un dato indice in poi sono tutti 2 (esattamente come, nel caso di
sviluppi decimali, i numeri con due sviluppi diversi sono quelli con sviluppo
decimale le cui cifre sono denitivamente 9).
Ci svela che i punti estremi dei sottointervalli connessi la cui unione lo
nsimo insieme En la cui intersezione linsieme di Cantor sono esprimibili
con due diversi sviluppi ternari, uno dei quali contiene qualche cifra 1 e laltro
uno sviluppo nito che non contiene la cifra 1. altrettanto facile vedere
che i punti interni di En sono esprimibili con sviluppi ternari inniti i cui
coecienti an valgono 0 o 2, ma mai 1. Linsieme di Cantor E consiste
quindi di tutti i numeri in [0, 1] esprimibili con uno sviluppo ternario che non
contiene la cifra 1: se un numero ha due sviluppi ternari, viene incluso in E
se uno dei due sviluppi non contiene la cifra 1 (questo include in E tutti i
punto estremi dei 22 sottointervalli connessi che formano En , per ogni n).
Considerato lo sviluppo ternario, evidente che linsieme di Cantor
totalmente sconnesso.
dati x,
diciamo x < y, con sviP Infatti,
Py E diversi,
n
n
luppi ternari x = n>1 an /3 e y = n>1 bn /3 consideriamo il primo indice
n0 tale che an 6= P
bn : allora deve essere an0 = 0 e bn0 = 2 (perch x < y),
ed i numeri z = n>1 cn /3n con cn = an = bn per 1 6 n < n0 e cn0 = 1
vericano x < z < y: se si scelgono non tutti i ck = 1 per k > n0 , questi
numeri z hanno uno sviluppo ternario unico e non appartengono a E (perch
lo sviluppo contiene la cifra 1). Quindi E totalmente sconnesso.

204 CAPITOLO 1. PANORAMICA SU CALCOLO ED ANALISI REALE


Unaltra propriet che diventa ovvia alla luce dello sviluppo ternario il
fatto cheP
E sia denso in [0, 1]. Infatti, ogni numero x con sviluppo ternario x = n>1 an /3n approssimabile a meno, diciamo, di 3k con numeri
P
(k)
xk n>1 an /3n il cui sviluppo ternario contiene la cifra 1: basta prendere
(k)
(k)
an = an per n < k e ak = 1.
Sempre lo sviluppo ternario rivela unaltra propriet interessante: ogni
punto di E di accumulazione. Infatti,
ssato > 0, si ssi k intero tale che
P
k
n
3 < . Fissato un
P punto xn = n>1 an /3 di E, consideriamo lintorno di
x di tutti gli y = n>1 bn /3 tali che bn = an per n 6 k, e bn arbitrario per
n > k. Questo intorno ha diametro 3k < e contiene punti di E: tutti gli
y in cui i bn restano diversi da 1 anche per n > k. Quindi esistono punti di
E diversi da x ma arbitrariamente vicini a x.
Manipolando lo sviluppo ternario si perviene ad un risultatoP
ancora pi
n
sorprendente. Si consideri la funzione

che
manda
il
numero
x
=
n>1 an /3
P
appartenente a E nel numero y = n>1 bn /2n [0, 1] tale che bn /an /2, ossia
bn = 0 se an = 0 e bn = 1 se an = 2 (per i punti di E che hanno due sviluppi
ternari dierenti, ovviamente usiamo quello senza la cifra 1). In tal modo si
ottiene qualsiasi successione {bn } di 0 e 1, e quindi qualsiasi sviluppo binario
in [0, 1]: quindi limmagine di lintero intervallo [0, 1]. I punti x, y E
con x < y sono dati da due sviluppi ternari in cui la prima cifra dierente
(diciamo la cifra di indice k) 0 per x e 2 per y: la mappa cambia questa
cifra 2 in 1, ma preserva lordinamento perch la prima cifra binaria dierente
fra (x) e (y) maggiore per y che per x, e quindi (x) < (y). In altre
parole, monotna crescente su E, ed una mappa iniettiva di E su [0, 1].
Estendiamo
il dominio di da E a [0, 1]. Dato uno sviluppo ternario
P
x = n>1 an /3n di un punto arbitrario di [0, 1] (non necessariamente di E),
tronchiamo lo sviluppo al primo indice N tale che aN = 1 (pertanto non lo
tronchiamo aatto se x E, nel qual caso N = ), e poniamo bn P
= an /2 per
n
n < N, bN = aN = 1 e bn = 0 se n > N. Allora il numero y = N
n=1 bn /2
appartiene a [0, 1], ma ora occorre dimostrare che la mappa cos estesa a
tutto [0, 1] ben denita, ossia che i punti con due diversi sviluppi ternari
portano allo stesso sviluppo binario. Ma due sviluppi ternari hanno la stessa
somma x esattamente quando essi coincidono no ad un dato indice n0 , e uno
dei due ha cifre an costantemente uguali a 2 da n0 + 1 in poi (con an0 = 0 o
1), mentre laltro si ottiene dal primo ponendo an = 0 per tutti questi indici
maggiori di n0 , ed aggiungendo 1 (modulo 3) a an0 . Possiamo supporre che
an 6= 1 per n < n0 , visto che leventuale apparire di una cifra 1 arresterebbe

1.28.

FUNZIONI ASSOLUTAMENTE CONTINUE

205

a questa cifra lo sviluppo di (x) senza che la successiva sequenza di cifre 2


consecutive avesse alcuna rilevanza. Consideriamo separatamente i due casi
an0 = 0 e an0 = 1, e per cisscuno di essi i due sviluppi ternari con somma x.
Nel secondo caso,
P an0 = 1n= bn0 e an = 0 per n > n0 . Allora lo sviluppo
binario (x) = n>N bn /2 ottenuto tramite dal primo sviluppo ternario
si arresta alla cifra bN = bn0 = an0 = 1 e la sequenza consecutiva di cifre
2 successive non entra in gioco; invece il secondo sviluppo ternario, che ha
an0 = 1 + 1 = 2 e an = 2 per n > n0 , viene mandato da in una sequenza
di cifre binarie bn0 = 1 e bn = 0 per n > n0 . Quindi le immagini sotto dei
due sviluppi ternari coincidono.
Nel primo caso, i due sviluppi ternari hanno, rispettivamente, an0 = 0 e
an = 2 per n > n0 , e an0 = 1 e an = 0 per n > n0 . Esattamente la stessa
verica ci fa concludere che, di nuovo, le immagini sotto dei due sviluppi
coincidono.
ben denita. Dal fatto che la mappa
P Quindi
PN , applicata
n
a x = n>1 an /3 , d luogo ad uno sviluppo nito y = n=1 bn /2n che si
arresta al primo indice N tale che aN = 1, ossia agli estremi sinistri degli
intervalli scavati da [0, 1] per ottenere gli insiemi En , segue che costante
su ogni intervallo che fa parte del complemento di E. Quindi ora ben
denito su [0, 1], strettamente crescente su E, costante sugli intervalli del
complemento di E, surgettivo su [0, 1], e biunivoco da E a [0, 1]. La mappa
inversa, 1 , non continua, altrimenti sarebbe un omeomorsmo, ovvero
una equivalenza topologica, ma le topologie su E e [0, 1] non sono equivalenti
perch il primo insieme totalmente sconnesso ed il secondo connesso.
Questa estensione della funzione a tutto [0, 1] si chiama la funzione ternaria
di Cantor.

Esempio 1.28.22. (Insiemi di Cantor di misura zero ottenuti rimuovendo terzi non centrati.) Le caratteristiche dellinsieme di Cantor che
rendono vera la Proposizione 1.28.19 non richiedono che la sua costruzione
sia cos simmetrica come labbiamo eettuata, rimuovendo ogni volta i terzi
centrali. Infatti, basta scegliere una qualsiasi successione {n } monotona decrescente con 0 = 1 e limn n = 0 e costruire insiemi En costituiti dallunione
di 2n intervalli disgiunti di lunghezza 2n n , ottenendo ricorsivamente En+1
rimuovendo da ciascuno di questi intervalli che formano En un segmento di
lunghezza 2n (n n+1 ), in modo che ciascun intervallo in En dia luogo a
due intervalli di lunghezza 2(n+1) n+1 . Allora gli insiemi chiusi ET
n costituiscono una famiglia decrescente tale che m(En ) = n , e quindi E =
n=1 En
ancora un compatto non vuoto di misura zero. La costruzione, per, meno

206 CAPITOLO 1. PANORAMICA SU CALCOLO ED ANALISI REALE


elegante perch non pi possibile denire in maniera algebrica la funzione
ternaria di Cantor introdotta prima.

Esempio 1.28.23. (Insiemi di Cantor generalizzati, di misura positiva.) Una variante di misura > 0 dellinsieme di Cantor, chiamato
insieme di Cantor generalizzato E () , si ottiene rimuovendo iterativamen()
te da En 2n segmenti centrali di lunghezza non 3(n+1) (come nel caso del
terzo centrale), ma 3(n+1) . Tutti le deduzioni esposte precedentemente
continuano a valere, e E () un compatto non vuoto tutti i cui punti sono di accumulazione ed il cui complemento denso in [0, 1], ma adesso la
misura di E () non zero. Infatti, la misura dellinsieme ternario di Cantor E zero perch ad ogni passo della costruzione sottraiamo ad En 2n
intervalli di lunghezza 3(n+1) (ovviamente disgiunti da quelli sottratti al
passo precedente), e quindi P
alla ne ci che sottraiamo complessivamente
2
3
n1
1/3 + 2/3 + 4/3 + =
/3n = 1. Nel caso generalizzato, sotn=1 2
() n
traiamo invece da En P
2 segmenti centrali di P
lunghezza 3(n+1) , e quindi

n
n1
n
in totale sottraiamo n=1 2 /3 = /3
n=1 (2/3) = . Pertanto
m(E () ) = 1 .

Nota 1.28.24. Si consideri linsieme di Cantor E di misura zero ottenuto rimuovendo ricorsivamente i terzi centrali a partire dallintervallo [0, 1]. Che
relazione intercorre fra la funzione ternaria
R x di Cantor introdotta nella Nota
1.28.21 e la funzione di Cantor f (x) = 0 E costruita alla ne dellEsempio
1.28.20?
Naturalmente la funzione di Cantor f denibile pi in generale, su insiemi di Cantor ottenuti rimuovendo segmenti non centrati (Esempio 1.28.22)
od anche per insiemi di Cantor generalizzati di misura positiva (Esempio
1.28.23), mentre la funzione ternaria di Cantor no, perch la sua costruzione
si basa su una serie ottenuta proprio dallaritmetica in base 3. Ma se si considera linsieme di Cantor dei terzi centrali, allora che relazione c ?
Entrambe hanno derivata nulla in ciascuno degli intervalli (terzi centrali) via
via rimossi, sono continue, monotne non decrescenti, valgono 0 in 0 e 1 in
1 ed in particolare la loro immagine tutto lintervallo [0, 1]. Si potrebbe
provare a dimostrare che le due funzioni coincidono, usando il fatto che f
approssimata dalle funzioni fn date dalle primitive delle funzioni caratteristiche En dopo le prime n generazioni di rimozioni di terzi centrati, mentre
espressa come una serie convergente approssimata dalle sue somme parziali
n-sime n , le quali sono il troncamento alle prime n cifre ternarie, poi divise

1.29.

INTEGRALI CURVILINEI E FORME DIFFERENZIALI

207

per 2 al ne che limmagine di n sia tutto lintervallo [0, 1] (cautela: questo


un esercizio difficile).

1.29
1.29.1

Integrali curvilinei e forme differenziali

Curve regolari

Definizione 1.29.1. Una curva continua in Rn una funzione r : [a, b]


Rn , continua sullintervallo di denizione [a, b]. In questo libro restringiamo
lattenzione a curve continue, quindi con lespressione curva intendiamo curva
continua. Le curve continue si indicano anche con curve di classe C 0 .
Una curva di classe C k una funzione r : [a, b] Rn derivabile k volte
con derivate continue (agli estremi a e b dellintervallo ovviamente la derivata
quella rispettivamente sinistra o destra).
Una curva si dice chiusa se r(a) = r(b).
Una curva si dice semplice se una funzione biunivoca di [a, b] sulla sua
immagine, tranne ovviamente per lunica eccezione r(a) = r(b) nel caso di
una curva chiusa.
In maniera analoga si deniscono le curve a valori in Cn . Si noti che
una curva una funzione, quindi una legge oraria di percorso, e non la sua
immagine, cio il percorso geometrico.
Definizione 1.29.2. (Curve equivalenti.) Due curve r e s di classe C k ,
denite rispettivamente in [a, b] e [c, d] si dicono equivalenti come curve C k
se esiste un cambiamento di parametrizzazione di classe C k che manda luna
nellaltra, ossia una funzione biunivoca u : [a, b] [c, d] di classe C k insieme
alla sua inversa e tale che r = s u (e quindi anche s = r u1.
Esercizio 1.29.3. Mostrare che questa nozione di equivalenza di curve una
relazione di equivalenza nel senso della Denizione 1.2.12, cio che gode delle
propriet riessiva, simmetrica e transitiva.

Nota 1.29.4. ovvio che se due curve sono equivalenti e la prima semplice
allora lo anche la seconda.

Nota 1.29.5. (Verso di percorrenza.) Consideriamo le funzioni continue e


biunivoche u : [a, b] [c, d]. Poich ogni funzione continua da R a R assume
in ogni intervallo tutti i valori intermedi fra ogni coppia di valori assunti

208 CAPITOLO 1. PANORAMICA SU CALCOLO ED ANALISI REALE


(Teorema dei Valori Intermedi, Sezione 1.1), una tale funzione u biunivoca
solo se monotna; inoltre, se derivabile con inversa anchessa derivabile,
deve essere monotna in senso stretto (altrimenti nei punti di monotonia non
stratta linversa non avrebbe derivata nita). Quindi si danno solo due casi:
u(a) = c

u(b) = d

u(a) = d

u(b) = c

Nel primo caso si dice che lequivalenza conserva il verso, ovvero che le due
curve equivalenti hanno lo stesso verso; nel secondo caso si dice che hanno
verso opposto. In questo senso, lavere lo stesso verso una nuova relazione di equivalenza, pi ne, su ogni classe di equivalenza di curve: questa
nuova relazione di equivalenza ha solo due classi, che si chiamano i versi di
percorrenza della curva.

Esempio 1.29.6. interessante il caso in cui si limita lattenzione a curve


equivalenti tutte denite sullo stesso intervallo [a, b]. In tal caso, un cambiamento di legge oraria che rovescia il verso di percorrenza precisamente una
funzione u da [a, b] in s, biunivoca e monotna decrescente: ad esempio la
funzione u(t) = a + b t, dove t [a, b]. Quindi per ogni curva r un rappresentante della classe di equivalenza di verso opposto s(t) = r(a + b t).

Notazione 1.29.7. La classe di equivalenza delle curve dello stesso verso di


r si indica con r+ , quella delle curve di verso opposto con r .
Nota 1.29.8. chiaro che due curve equivalenti hanno la stessa immagine.
Il viceversa non vero: ad esempio, le curve a valori in R2 denite da
r(t) = (cos t, sin t)
s(t) = (cos t, sin t)

0 6 t 6 2
0 6 t 6 4

hanno entrambe per immagine la circonferenza in R2 di raggio 1 e centro


lorigine, ma non sono equivalenti, perch la prima semplice e la seconda
no (Nota 1.29.4).
Per, se due curve continue r e s sono semplici ed hanno la stessa immagine, allora la funzione u = s1 r un cambiamento di legge oraria da
[a, b] in s biunivoco, che quindi d luogo ad una equivalenza fra le due curve.
Pertanto due curve continue semplici sono equivalenti se e solo se hanno la
stessa immagine.

1.29.

INTEGRALI CURVILINEI E FORME DIFFERENZIALI

209

Esempio 1.29.9. La curva r : [0, ] R2 denita (come nella Nota 1.29.8)


da
r(t) = (cos t, sin t)
0 6 t 6 2
una curva semplice di classe C ed ha per immagine la semicirconferenza
di raggio 1 e centro lorigine giacente nel semipiano superiore. Unaltra curva
con la stessa immagine

s(t) = (t, 1 t2 )
1 6 t 6 1.
Questa seconda curva ha la stessa immagine della prima, semplice e di classe
C 0 ma non C 1 perch la sua derivata diverge agli estremi. Le due curve quindi
sono equivalenti come curve di classe C 0 grazie a quanto osservato nella Nota
1.29.8, ma non sono equivalenti in classe C k con k > 0. Le due curve hanno
versi opposti: in base allEsempio 1.29.6, una curva equivalente a r e dello
stesso verso

p(t) = (t, 1 t2 )
1 6 t 6 1.

Esempio 1.29.10. (Curve di classe C possono avere cuspidi.) Anche la


regolarit di una curva una propriet della legge oraria, non della geometria
dellimmagine. Ad esempio, la curva r(t) = (t3 , t2 ), per t [1, 1], di classe
C , perch le sue componenti sono polinomi, ed ha per immagine larco da
2
x = 1 a x = 1 del graco della funzione f (x) = |x| 3 , che ha una cuspide
nellorigine.
Ci che avviene in questo caso che il vettore velocit r (t) = (3t2 , 2t)
si annulla per t = 0, cio nellistante in cui la curva passa per lorigine.
chiaro che, nei punti in cui il vettore velocit non nullo, esso costituisce un
vettore tangente allimmagine della curva, che quindi in quei punti ammette
un vettore tangente e pertanto non ha cuspidi.
Si badi per che lannullarsi del vettore velocit non comporta sempre
lesistenza di cuspidi. Ad esempio, modichiamo la curva precedente scambiandone le componenti, ovvero poniamo s(t) = (t2 , t3 ), con t [1, 1].
Questa nuova curva ancora polinomiale, quindi di classe C , ed il suo vettore velocit si annulla ancora per t = 0. Per questa volta limmagine della
3
curva giace sul graco della funzione g(x) = |x| 2 , che nellorigine non ha una
cuspide ( tangente allasse x).

210 CAPITOLO 1. PANORAMICA SU CALCOLO ED ANALISI REALE


Definizione 1.29.11. (Concatenazione di curve.) Siano r : [a, b] Rn
e s : [b, c] Rn due curve continue. Se s(b) = r(b) allora la curva r&s :
[a, c] Rn denita da r&s = r se t [a, b] e !r&s = s se t [b, c] continua:
essa si chiama la concatenazione di r e s.
Si pu dimostrare il seguente risultato intuitivo ma non elementare:
Teorema 1.29.12. (Teorema di Jordan.) Sia r una curva (continua)
semplice chiusa in R2 , e C la sua immagine (osserviamo che, poich r
continua ed il suo intervallo dei parametri compatto, anche C un insieme
compatto, quindi limitato; si veda la Sezione 1.1). Allora R2 \ C consiste
di due componenti connesse, entrambe con frontiera C, di cui una limitata
(detta interno di C) e laltra illimitata (detta esterno).

1.29.2

Curve di lunghezza finita

Notazione 1.29.13. Una curva r : [a, b] Rn continua di variazione limitata (Denizione 1.26.1) si dice di lunghezza finita, o anche rettificabile. La
variazione totale di r si chiama la sua lunghezza e si indica con (r).
Dalla Denizione 1.26.1 di variazione limitata segue immediatamente:
Corollario 1.29.14. Sia = {a = t0 < t1 < . . . < tn = b} una partizione
finita di [a, b]. La variazione della curva r rispetto a questa partizione la
lunghezza della spezzata poligonale da essa sottesa, cio
p() =

n
X
i=1

kr(ti ) r(ti1 )k .

La variazione totale di r quindi data da = sup p().


Se una curva di lunghezza finita allora tutte le curve ad essa equivalenti
sono anchesse di lunghezza finita, con la stessa lunghezza.
La lunghezza della concatenazione di due curve continue, nelle ipotesi in cui
questa nozione si definisce (Definizione 1.29.11) la somma delle lunghezze
Dimostrazione. Lunico punto non completamente ovvio lultimo, che lo
diventa se si osserva che una partizione di [a, c] si scinde in una partizione di
[a, b] ed una di [b, c] se essa contiene il punto b, e se non lo contiene possiamo
aggiungerglielo, passando in tal modo ad una partizione pi ne.

1.29.

INTEGRALI CURVILINEI E FORME DIFFERENZIALI

211

Nota 1.29.15. La lunghezza di una curva un invariante della legge oraria


di curve, e non della geometria dellimmagine della curva. Infatti, due curve
non equivalenti con la stessa immagine possono non avere la stessa lunghezza:
ad esempio, le due curve della Nota 1.29.8 hanno entrambe per immagine la
circonferenza con centro lorigine e raggio 1, ma la prima ha lunghezza 2 e
la seconda 4.

Esempio 1.29.16. Esistono curve continue non di lunghezza nita. Ad esempio, abbiamo mostrato nellEsempio 1.26.4 che la curva

0
t=0
r(t) =
1
t sin t
1 < t 6 0
continua ma non a variazione limitata, quindi non di lunghezza nita.

Nota 1.29.17. Consideriamo le curve assolutamente continue (Denizione


1.28.1). Per la Proposizione 1.28.6 esse sono tutte di lunghezza nita.
Per il Teorema 1.28.9, le curve r : [a, b] Rn assolutamente continue sono
precisamente quelle per le quali esiste una funzione integrabile g : [a, b] Rn
tale che, per ogni a 6 a 6 b 6 b, si ha
Z b

g(t) dt .
r(b ) r(a ) =
a

Inoltre, g = r quasi ovunque. In base alla Nota 1.28.2, una classe particolare di queste curve costituita dalle curve continue e C 1 a tratti (ad
esempio le poligonali). Per la denizione precisa di curva C 1 a tratti si veda
la Denizione 5.11.8 che diamo nel seguito.

Dal Corollario 1.28.10 si ha la seguente identit per la lunghezza di una


curva assolutamente continua r : [a, b] Rn :
Rb
Corollario 1.29.18. (r) = a kr (t)k dt.

1.29.3

Integrale lungo una curva di una funzione a valori


scalari

Definizione 1.29.19. Sia f una funzione continua denita sullimmagine di


una curva assolutamente continua r : [a, b] Rn . Allora f r continua, e

212 CAPITOLO 1. PANORAMICA SU CALCOLO ED ANALISI REALE


r appartiene a L1 [a, b], quindi vi appartiene anche kr k. Grazie allEsercizio
1.16.32, il prodotto f r(t)kr k(t) appartiene a L1 [a, b] (se non si vuole usare
lEsercizio 1.16.32, basta imporre la condizione pi forte che la curva r sia di
classe C 1 a tratti: questa condizione suciente per i risultati nel resto di
questo libro).
Si denisce lintegrale di f lungo la curva r il numero
Z
Z b
f ds =
f r(t) kr (t)k dt .
r

Le seguenti propriet dellintegrale seguono direttamente dalla denizione, tranne la propriet (iii) che nientaltro che il Corollario 1.29.18.

Proposizione 1.29.20. (Propriet dellintegrale curvilineo di un campo scalare.) Sia r : [a, b] Rn una curva assolutamente continua, R la
sua immagine in Rn e f una funzione continua su R. Allora
(i) Lintegrale curvilineo un funzionale lineare sullo spazio delle funzioni
continue.
(ii) (Teorema della media.) Questo funzionale continuo, nel senso (si
veda la Sezione 4.6) che
Z
min f (r) 6 f ds 6 max f (r) .
R

Inoltre, esiste t0 [a, b] tale che


R
(iii) (r) = r 1 ds.

f ds = f (r(t0 )) kr (t0 )k.

(iv) (Additivit rispetto al dominio di integrazione.) Se p : [c, d] Rn


una seconda curva assolutamente continua che comincia al punto finale
di r, ossia tale che p(c) = r(b), allora lintegrale sulla curva concatenata
r&s (Definizione 1.29.11) la somma degli integrali separati:
Z
Z
Z
f ds = f ds + f ds .
r&p

Esempio 1.29.21. Se il campo scalare da integrare rappresenta la densit di


un materiale, allora il signicato sico del suo integrale curvilineo lungo una
curva, intesa come un lo di materiale, la massa totale della curva.

1.29.

INTEGRALI CURVILINEI E FORME DIFFERENZIALI

213

Il prossimo risultato mostra che lintegrale curvilineo di una funzione


dipende solo dalla geometria dellimmagine della curva, non dalla sua legge
oraria.
Proposizione 1.29.22. Siano r e p due curve di classe C 1 equivalenti come
curve di classe C 1 (nel senso della DefinizioneR 1.29.2), Re f una funzione
continua sulla loro comune immagine. Allora r f ds = p f ds. La stessa
identit vale per curve di classe C 1 a tratti equivalenti nel senso che ciascun
tratto della prima equivalente nel senso di C 1 al corrispondente tratto della
seconda.
Dimostrazione. Basta assumere che le curve siano di classe C 1 , perch, una
volta dimostrato lenunciato per curve di classe C 1 , esso si estende alle curve
di classe C 1 a tratti per ladditivit rispetto al dominio di integrazione. Sia
u : [a, b] [c, d] il cambiamento di parametrizzazione, cio lapplicazione
biunivoca e C 1 con la sua inversa, che implementa lequivalenza fra r e p,
ossia tale che r = pu. Abbiamo gi osservato che u strettamente monotna
(Nota 1.29.5), e quindi u non si annulla mai. Osserviamo che se u crescente,
cio se u > 0, allora si ha u(a) = c e u(b) = d, altrimenti il viceversa.
Inoltre, per il Teorema di Derivazione di Funzione Composta (Sezione 1.1)
si ha r (t) = p (u(t))u (t), da cui kr (t)k = kp (u(t))k|u(t)|. Pertanto segue
dal Teorema 1.22.1 di integrazione per sostituzione che
Z

f ds =

f (r(t)) kr (t)k dt =

f (p(s)) kp (s)k ds =

u1 (b)
u1 (a)

f (p(u(t))) kp (u(t))k |u(t)| dt

f ds .

Nota 1.29.23. Segue dalla Proposizione 1.29.22 che lintegrale curvilineo di un


campo scalare costante sulla classe di equivalenza della curva rispetto alla
quale denito, ossia invariamnte per equivalenza, e quindi in particolare
non dipende dal verso di percorrenza.

1.29.4

Altre nozioni di integrale curvilineo

Nella precedente sottosezione 1.29.22 abbiamo denito integrali curvilinei di


campi scalari, ed abbiamo mostrato che per essi valgono linearit, teorema

214 CAPITOLO 1. PANORAMICA SU CALCOLO ED ANALISI REALE


della media, additivit rispetto alla concatenazione di curve di integrazione
(Proposizione 1.29.20) ed invarianza per equivalenza (Proposizione 1.29.22):
in particolare essi non dipendono dal verso di percorrenza.
Presentiamo qui due altre varianti diverse di questa denizione, che ci saranno
utili nel seguito.
La prima variante non innovativa: la copia identica della Denizione 1.29.19 nel caso che la funzione da integrare abbia valori vettoriali (la
chiamiamo un campo vettoriale.
Definizione 1.29.24. (Integrale curvilineo a valori vettoriali di un
campo vettoriale.) Sia f : Rn Rk un campo vettoriale e r : [a, b]
Rn una curva assolutamente continua a valori nel dominio di denizione di
f. Chiamiamo integrale a valori vettoriali di f lungo la curva r il seguente
vettore in Rk :
Z
Z
b

f(r(t)) kr (t)k dt .

f ds =

Esercizio 1.29.25. Mostrare che lintegrale curvilineo della precedente Denizione 1.29.24 ha propriet analoghe a quello di campi scalari: linearit,
additivit rispetto alla concatenazione di curve di integrazione, teorema della media per la norma dellintegrale (Proposizione 1.29.20) ed invarianza per
equivalenza (Proposizione 1.29.22): in particolare esso non dipende dal verso
di percorrenza.

Esempio 1.29.26. Se il campo vettoriale f(x) = x, allora il signicato sico


dellintegrale curvilineo a valori vettoriali di un campo vettoriale quello del
baricentro della curva, intesa come un lo di materiale a densit costante.

Definizione 1.29.27. (Integrale curvilineo a valori vettoriali di un


campo scalare.) Sia f : Rn R un campo scalare e r : [a, b] Rn
una curva assolutamente continua a valori nel dominio di denizione di f .
Chiamiamo integrale a valori vettoriali di f lungo la curva r il seguente
vettore in Rn :
Z
Z
b

f (r(t)) r(t) dt .

f ds =

Esempio 1.29.28. Se il campo scalare f rappresenta la densit di un materiale,


allora il signicato sico del suo integrale curvilineo a valori vettoriali lungo

1.29.

INTEGRALI CURVILINEI E FORME DIFFERENZIALI

215

una curva quello del baricentro della curva, intesa come un lo di materiale
a densit data da f .

Esercizio 1.29.29. Mostrare che lintegrale curvilineo della Denizione 1.29.27


gode delle propriet di linearit, additivit rispetto alla concatenazione di
curve di integrazione, teorema della media per la norma dellintegrale (Proposizione 1.29.20), ma non della invarianza per equivalenza (Proposizione
1.29.22). Infatti esso dipende dal verso di percorrenza, ed invariante solo
per cambi di parametrizzazione della curva che preservano il verso; se si rovescia il verso, esso cambia di segno, proprio come lintegrale normale su un
intervallo (che in eetti ne un caso particolare: si veda la prossima Denizione 1.29.30).

Definizione 1.29.30. (Integrale curvilineo di funzioni complesse.)


Rb
Un integrale a f (x) dx (normale, non curvilineo) un caso particolare di un
integrale curvilineo, in cui la parametrizzazione della curva r(t) = t. La
denizione analoga per funzioni di variabile complessa a valori complessi
particolarmente interessante; lintegrale si denisce come un integrale unidimensionale lungo una curva assolutamente continua z : [a, b] C in analogia
al caso reale appena visto, nel modo seguente:
Z
Z b
f (z) dz =
f (z(t)) z(t) dt ,
r

dove il prodotto nellintegrando la moltiplicazione complessa. Si osservi


che lintegrale che si ottiene un numero complesso, ma lo spazio complesso
C, come spazio vettoriale sui reali, isomorfo a R2 . Questo integrale si pu
allora considerare come una nuova versione di integrale a valori vettoriali di
un campo vettoriale f : R2 R2 lungo una curva r : [a, b] R2 . Poich
la moltiplicazione complessa mescola le componenti reale ed immaginaria,
questa nuova denizione di integrale a valori vettoriali di un campo vettoriale,
che vale solo in due dimensioni reali, non coincide con quella precedentemente
introdotta per Rn (Denizione 1.29.24).

Esercizio 1.29.31. Mostrare che lintegrale complesso introdotto nella Denizione 1.29.30 gode delle propriet di linearit, additivit rispetto alla concatenazione di curve di integrazione, teorema della media, invarianza sotto
equivalenza di curve che preservano il verso di percorrenza, e che esso cambia
di segno se si rovescia il verso di percorrenza.

216 CAPITOLO 1. PANORAMICA SU CALCOLO ED ANALISI REALE


RNotazione 1.29.32.RSe C C limmagine della curva r, scriveremo spesso
f (z) dz invece che r f (z) dz . Si noti per che questa notazione ambigua,
C
perch lintegrale dipende non solo dallimmagine della curva, ma anche dal
suo verso di percorrenza, che quindi occorre esplicitare, e (grazie alladditivit
per concatenazione) dal numero di giri percorsi lungo la curva se essa chiusa
(di solito assumeremo che la curva sia semplice, quindi che si percorra solo
un giro.
Esempio 1.29.33. Mostriamo che, se C la circonferenza di raggio r e centro
lorigine nel piano complesso, percorsa una volta in senso antiorario, allora

Z
0
se k 6= 1
k
z dz =
.
2i
se k = 1
C
Infatti, parametrizziamo la curva come z(t) = reit , per 0 6 t 6 2. Allora
Z 2
Z
Z 2
k
k ikt
it
k+1
ei(k+1)t dt
z dz =
r e ire dt = ir
C

e lultimo integrale si annulla se k+1 6= 0 perch le sue parti reale cos((k+1)t)


ed immaginaria sin((k+1)t) sono a media nulla sul periodo, mentre se k+1 =
0 lintegrando vale identicamente 1 ed il risultato
2i.
R 1
1
Pertanto, se poniamo IndC (0) = 2i
dz,
il
valore dellintegrale il
C z
numero di volte che la curva gira intorno a 0 nel percorrere la circonferenza C,
con segno positivo o negativo a seconda che il verso di percorrenza sia orario
o antiorario. Analogamente, per una circonferenza con centro in w C, il
numero di avvolgimenti intorno a w di una curva chiusa che ha per immagine
la circonferenza dato dallindice di avvolgimento
Z
1
1
dz
(1.82)
IndC (w) =
2i C z w

Il precedente Esempio conduce alla seguente denizione:


Definizione 1.29.34. (Indice di avvolgimento.) Deniamo indice di
avvolgimento di una curva r : [a, b] C intorno ad un punto w C il
seguente integrale:
Z
Z b
1
1
1
r (t)
dz =
dt .
Indr (w) =
2i r z w
2i a r(t) w

1.29.

INTEGRALI CURVILINEI E FORME DIFFERENZIALI

217

Nota 1.29.35. Estendendo lEsempio 1.29.33, dimostreremo nella Nota 2.3.3


che lindice di avvolgimento di una curva chiusa r rispetto ad un punto w
misura il numero di giri che la curva compie intorno a w, o, per essere pi
precisi, lincremento dellargomento del numero complesso r(t) w al variare
di t nellintervallo di parametrizzazione della curva.

Osserviamo che in questo contesto il Teorema Fondamentale del Calcolo


1.27.1 assume una forma interessante:
Proposizione 1.29.36. (Teorema di Cauchy per una derivata.) Se
f : C C derivabile in senso complesso (Definizione 1.22.13) con derivata
continua, allora Rper ogni curva chiusa r di classe C 1 a tratti (o assolutamente
continua) si ha r f (z) dz = 0.
Dimostrazione. Scriviamo r : [a, b] C e z(t) = r(t). PerR il Teorema
Fondamentale del Calcolo 1.27.1, lintegrale curvilineo vale r f (z) dz =
Rb
f (z(t)) z (t) dt = f (z(b)) f (z(a)) = 0 perch z(b) = z(a) (la curva
a
chiusa).

n+1

Poich per ogni n 6= 1 la funzione z n la derivata di ! zn+1 , da qui


abbiamo la seguente generalizzazione dellEsempio 1.29.33:
Corollario 1.29.37. Per ogni curva chiusa C si ha:
R
(i) C z n dz = 0 per n = 0, 1, . . .
R
(ii) C z n dz = 0 per n = 2, 3, . . . se 0
/C

La prossima variante della nozione di integrale curvilineo di fondamentale interesse. Ad essa, nella terminologia alternativa di integrale di una
forma differenziale, dedicato il resto dellintera Sezione.

Definizione 1.29.38. (Integrale curvilineo a valori scalari di un campo vettoriale.) Sia f : Rn Rn un campo vettoriale e r : [a, b] Rn
una curva assolutamente continua a valori nel dominio di denizione di f.
Chiamiamo integrale di f lungo la curva r il numero
Z
Z b
f ds =
f(r(t)) r (t) dt .
r

Quando
non c adito a confusione, denotiamo questo integrale anche con
R
f dr.

218 CAPITOLO 1. PANORAMICA SU CALCOLO ED ANALISI REALE


Esempio 1.29.39.
Se f rappresenta un campo di forze, il signicato sico
R
dellintegrale f dr il lavoro svolto dal campo su un punto che si muove
lungo la curva.

Esercizio 1.29.40. Mostrare che lintegrale a valori scalari di un campo vettoriale, cio il lavoro svolto dal campo, ha le propriet di linearit, additivit
rispetto alla concatenazione di curve, invarianza sotto equivalenza di curve
che preservano il verso di percorrenza, e cambia di segno se si rovescia il verso di percorrenza; inne, mostrare che esso gode della propriet della media
nella forma seguente:

Z


f ds 6 (r) max kf(r(t))k


a6t6b

e, se il campo una funzione continua,


Z
f ds = f(r(t0 )) r (t0 )
r

per qualche opportuno t0 [a, b] (qui (r) la lunghezza della curva; per lultima uguaglianza si applichi il Teorema della Media Integrale (Sezione 1.1)).

1.29.5

Integrale curvilineo di un campo vettoriale e forme differenziali

Nella Denizione 1.29.38 abbiamo introdotto lintegrale di un campo vettoriale lungo una curva in Rn ,
Z

f ds =

f(r(t)) r (t) dt =

Z bX
n
a

fi (r(t))ri (t) dt .

i=1

Nella Nota 1.22.12 abbiamo chiamato una espressione di questo tipo una forma dierenziale esatta. Rammentiamo la denizione, rinviando alla suddetta
Nota per quanto concerne la terminologia.
Definizione 1.29.41. (i) Data una npla di funzioni continue
Pn a1 , . . . , an
n
in un dominio aperto A R , la funzione lineare : x 7 i=1 ai (x) dxi ,
da Rn a (Rn ) Rn , si chiama una forma differenziale lineare del primo
ordine.

1.29.

INTEGRALI CURVILINEI E FORME DIFFERENZIALI

219

(ii) Se esiste una funzione f : A Rn R di classe C 1 tale che ai =


Di f per ogni i = 1 , . . . , n, la forma dierenziale df : x 7 dfx =
P
n
i=1 Di f (x) dxi si dice un forma differenziale esatta.
Una forma dierenziale si dice di classe C k se i suoi coecienti sono
funzioni in C k (A) (derivate parziali continue no allordine k). Si noti che,
se f una funzione di classe C k+1 in A, allora df una forma dierenziale
di classe C k .
Deniamo lintegrale di una forma dierenziale lineare del primo ordine
lungo una curva r in un aperto A Rn in accordo con la Denizione 1.29.38:
P
Definizione 1.29.42. Sia = ni=1 ai dxi una forma dierenziale lineare
del primo ordine in un aperto A Rn e r : [a, b] A una curva di classe C 1
con immagine in A (non necessariamente chiusa). Lintegrale di lungo r si
denisce come
Z
Z bX
n
=
ai (r(t)) ri (t) dt .
r

i=1

Nota 1.29.43. Data una forma dierenziale lineare del primo ordine, i suoi
coecienti a1 (x) , . . . , an (x) formano una campo vettoriale f . Rammentiamo
che lintegrale di una forma dierenziale lungo una curva ha il signicato
sico del lavoro svolto
R dal Rcampo su un corpo che si muove lungo la curva
(Esercizio 1.29.40): r = r f dt nel senso della Denizione 1.29.38. Pertanto, per le forme dierenziali lineari del primo ordine valgono le propriet
dellEsercizio 1.29.40. In particolare, lintegrale di una forma dierenziale
lungo una curva lo stesso per tutte le curve nella sua classe di equivalenza
positiva di orientamento (introdotta nella Notazione 1.29.7), ossia percorse
nello stesso verso, mentre lopposto per le curve orientate in senso opposto.
Quindi lintegrale dipende solo dal verso di percorrenza (per il suo segno),
ma non dalla velocit di percorrenza della curva.
Nel seguito ci riferiremo alle forme doerenziali lineari del primo ordine
semplicemente come forme differenziali lineari.

1.29.6

Insiemi connessi

In questa breve sottosezione ci limitiamo a denire gli insiemi connessi in R2


e gli insiemi semplicemente connessi in R2 (o equivalentemente in C).

220 CAPITOLO 1. PANORAMICA SU CALCOLO ED ANALISI REALE


Definizione 1.29.44. (Insiemi connessi.) Un insieme E in uno spazio
topologico, ad esempio Rn , si dice sconnesso se esistono due aperti A e B
= .
tali che E = A B e A B = A B
Con questa notazione, sia V il complementare di A e W il complementare
di B. Allora questa denizione equivale a dire che E sconnesso se e solo
se E V W , dove V e W sono due chiusi ciascuno dei quali interseca E,
ma tali che E V W = . Pertanto, se E sconnesso e chiuso, allora E
lunione di due chiusi disgiunti non vuoti (E V e E W ).
Un insieme che non sconnesso si dice connesso.
Vale il seguente risultato
Proposizione 1.29.45. Limmagine di un insieme connesso sotto una funzione continua un insieme connesso.
Dimostrazione. Sia C un insieme connesso, X uno spazio topologico e f :
C X una funzione continua. Supponiamo per assurdo che f (X) non sia
connesso: allora esistono due aperti disgiunti A e B f (X) tali che f (X) =
A B. La controimmagine di un aperto sotto una funzione continua un
aperto (questa propriet equivalente al;la denizione di continuit, si veda la
Sezione 1.1). Pertanto si avrebbe C = f 1 (A) f 1 (B), una decomposizione
di C come unione disgiunta di due aperti. Questo contraddice il fatto che C
sia connesso.

Una dimostrazione analoga prova il seguente enunciato:

Proposizione 1.29.46. Sia E un aperto connesso in Rn , Per ogni x, y E


esiste una curva C 1 a tratti con immagine in E il cui punto iniziale x ed
il punto finale y.
Dimostrazione. Basta mostrare che x e y sono congiunti da una curva poligonale (e quindi parametrizzabile in modo lineare a tratti, perci C 1 a
tratti).Poich E aperto, esiste un intorno sferico aperto O di x (una palla
aperta con centro x) tutto contenuto in E: questa palla convessa, ed i suoi
punti sono congiunti a x da segmenti, quindi da curve C 1 , giacenti in O.
Questo prova che il sottoinsieme A di E di punti congiunti a x da curve C 1
a tratti con immagine contenuta in E non vuoto. Inoltre, se w A, allora
w E e quindi c una palla aperta con centro w contenuta in E, i cui punti,
come prima, sono congiunti a w da segmenti: questo prova che A aperto.
ma ora, sia B = E \ A. Linsieme B consiste dei punti di E non congiunti a x

1.29.

INTEGRALI CURVILINEI E FORME DIFFERENZIALI

221

da curve C 1 a tratti con immagine in E. Di nuovo, se z B, esiste una palla


aperta con centro z contenuta in E, la quale deve essere contenuta anche in
B, perch, se un suo punto w fosse in E \ B = A, esso sarebbe congiungibile
a x da una curva C 1 a tratti r in E, ma allora lo sarebbe anche z (basterebbe
concatenare r con il segmento da w a z. Quindi anche B aperto. Daltra
parte, poich E connesso, non si pu scomporre E = A B come unione di
due aperti disgiunti non vuoti. Visto che A 6= , deve essere B = e quindi
A = E.

1.29.7

Campi conservativi e forme differenziali esatte

Teorema 1.29.47. Sia una forma differenziale lineare di classe C 0 (ossia


a coefficienti continui) in un aperto connesso E. La forma differenziale
esatta se e solo se vale la propriet seguente:
per ogni coppia di punti x, y E, lintegrale di assume lo stesso valore su
ogni curva C 1 a tratti in E da x a y
(ossia con punto iniziale x e punto finale y: ovviamente, se si scambiano fra
loro i punti iniziale e finale, ossia il verso di percorrenza, lintegrale della
forma sulla curva cambia di segno, come osservato nella Nota 1.29.43). Tali
curve esistono in base alla Proposizione 1.29.46.
Inoltre, sia una forma esatta su E e f una funzione di classe C 1 su E
1
tale
R che = df . Allora, se r una curva C a tratti in E da x a y, si ha
= f (y) f (x). (Per questo motivo, una f tale che df = si chiama
r
una primitiva di ).
P
Dimostrazione. Sia = nj=1 aj dxj una forma di classe C 0 che soddisfa la
propriet di indipendenza dellintegrale dalla curva esposta nellenunciato.
Vogliamo mostrare che esiste una funzione f di Rclasse C 1 tale che = df .
Fissiamo un punto w E e poniamo f (x) = r dove r una curva di
classe C 1 a tratti in E da w a x: questa denizione ha senso proprio grazie
allipotesi che lintegrale non dipenda dalla scelta della curva. Poich E
aperto, esiste una palla aperta in E con centro in x, chiamiamo 2 il suo
raggio. Sia ei liesimo vettore canonico di base e s(t) = x + tei , con
0 6 t 6 1, una curva che ha per immagine un segmento da x a x + ei E.

222 CAPITOLO 1. PANORAMICA SU CALCOLO ED ANALISI REALE


Allora, concatenando le curve come nella Denizione 1.29.11, otteniamo
f (x + ei ) =

=
r&s

= f (x) +

1
0

= f (x) +

n
X

n
X

aj (s(t)) si (t) dt

j=1

aj (x + tei ) dt = f (x) +

ai (x + tei ) dt .

j=1

Poich ai continua per ipotesi, segue da questa identit e dal Teorema


della media integrale (Sezione 1.1) oppure, se si preferisce, dal Teorema
Fondamentale del Calcolo 1.27.1, che
f (x + ei ) f (x)
= lim
Di f (x) = lim
0
0

ai (x + tei ) dt = ai (x) .

Quindi df = .
Viceversa, sia una forma dierenziale esatta, e f tale che = df . Sia
r : [a, b] E una curva di classe C 1 a tratti da x a y. Siano t0 = a < t1 <
t2 < < tm = b tali che ri sia di classe C 1 negli intervalli [tj1 , tj ] , con
j = 1, . . . , m. Allora
Z

=
r

m Z
X
j=1

tj

n
X

tj1 i=1

i f (r(t)) ri (t) dt .

(1.83)

Sappiamo, dal Teorema di derivazione di funzione composta in pi variabili


(regola della catena, Corollario 1.22.17), che
n
X
i=1

i f (r(t)) ri (t) = D(f r)(t) .

Quindi (1.83) diventa


Z

m Z
X
j=1

tj

tj1

m
X
f (r(t)) dt =
(f (r(tj )) f (r(tj1)))
j=1

= f (r(b)) f (r(a)) = f (y) f (x) .

1.29.

INTEGRALI CURVILINEI E FORME DIFFERENZIALI

223

Corollario 1.29.48. In un dominio aperto connesso in Rn , lintegrale di una


forma differenziale di classe C 0 su una qualsiasi curva di classe C 1 a tratti
dipende solo dai punti iniziale e finale della curva (ossia, il campo vettoriale
associato a conservativo, ossia ancora, il lavoro fatto su una curva C 1 a
tratti chiusa zero) se e solo esatta.

1.29.8

Insiemi semplicemente connessi e forme differenziali esatte di classe C 1

Nel Teorema 1.29.47 abbiamo dimostrato una condizione di esattezza di una


forma di classe C 0 equivalente allindipendenza dal percorso. Questa condizione dicile da applicare, perch scomodo cercare di vericarla per
ogni curva regolare a tratti. Una condizione pi comoda vale per forme
dierenziali di classe C 1 , come dimostriamo in questa Sottosezione.
Osserviamo prima una condizione necessaria:
P
Proposizione 1.29.49. Sia = ni=1 ai dxi una forma differenziale esatta
di classe C 1 in un aperto E Rn . Allora le componenti di hanno derivate
incrociate uguali: per ogni i, j = 1, . . . , n si ha
Dj ai = Di aj

(1.84)

identicamente in E.
Dimostrazione. Richiedere che sia esatta di classe C 1 signica richiedere che
esista una funzione primitiva f di classe C 2 tale che = df . La condizione
dellenunciato equivale allidentit Dj Di f = Di Dj f , che vera in base al
Lemma di Schwarz 1.22.3.

In generale, per, la condizione (1.84) non suciente ad assicurare che


una forma dierenziale C 1 a tratti non dipenda dal percorso (e quindi sia
esatta, in base al Teorema 1.29.47), come rivela il seguente esempio:
Esempio 1.29.50. Sia E = R2 \ {0}, e
=

x2

y
x
dy 2
dx
2
+y
x + y2

(quando si hanno due sole variabili, pi comodo scriverle come x, y invece


che x1 , x2 ). Sia 0 6 t 6 2 e s(t) = (cos t, sin t) una curva C chiusa la cui

224 CAPITOLO 1. PANORAMICA SU CALCOLO ED ANALISI REALE


immagine la circonferenza di raggio 1 percorsa una volta in senso antiorario.
Allora la condizione (1.84) vericata ovunque, e
Z
Z 2
=
(cos2 t + sin2 t) dt = 2 ,
s

quindi lintegrale sulla curva chiusa s non nullo e la forma non esatta
(il campo non conservativo).
Osserviamo per che il dominio dove denibile questa forma il piano
bucato: se ad esempio avessimo scelto = x dy y dx, allora la forma
sarebbe stata denita ovunque e non esatta, ma non sarebbe stata vericata

la condizione (1.84).

Definizione 1.29.51. (Insiemi semplicemente connessi.) Un sottoinsieme connesso E del piano si dice semplicemente connesso se non esiste
alcun punto w
/ E ed alcuna curva chiusa r con immagine in E tale che lindice di avvolgimento Indr (w) (introdotto nella Denizione 1.29.34) sia non
nullo: ovvero, se non esiste alcuna curva in E che gira intorno a punti fuori
di E (cio, se linterno dellimmagine delle curve in E tutto contenuto in
E, senza buchi : questultima osservazione per ora intuitiva verr resa precisa
grazie alla nozione di equivalenza omotopica nella Sezione 2.4.
Teorema 1.29.52. Se E un aperto semplicemente connesso in Rn e
una forma differenziale lineare di classe C 1 su E, allora la condizione (1.84)
sufficiente affinch sia esatta.
Dimostrazione. In realt non diamo qui la dimostrazione in dettaglio, ma
rinviamo il lettore ad una dimostrazione simile in un altro capitolo successivo. Lidea la seguente: per prima cosa (Teorema 2.4.6) si dimostra che due
curve omotope possono essere portate luna nellaltra con unomotopia lineare a tratti (ossia, realizzando una interpolazione poligonale, lineare a tratti,
dallimmagine della prima a quella della seconda); poi si dimostra che, sotto
questo tipo di omotopia, lintegrale di una forma dierenziale C 1 a tratti lo
stesso per le due curve (Teorema 2.4.7); inne, si sceglie come prima curva
una curva chiusa e si utilizza il fatto che il dominio semplicemente connesso per scegliere la seconda curva costante (ovvero avente per immagine un
punto solo), e su di essa ovviamente lintegrale zero. I succitati riferimenti
in realt hanno a che fare con integrali lungo curve di funzioni olomorfe su C
(che introdurremo nel successivo Capitolo 2, nella Denizione 2.2.4), le quali, come vedremo, vericano automaticamente la condizione (1.84) in base

1.29.

INTEGRALI CURVILINEI E FORME DIFFERENZIALI

225

alla parte (iv) del Teorema 2.1.5 (equazioni di CauchyRiemann). Quindi la dimostrazione a cui abbiamo rinviato il lettore solo apparentemente
in un altro contesto, tranne per il fatto che lo spazio ambiente, un aperto semplicemente connesso in C R2 ha due sole dimensioni reali (ma la
generalizzazione a pi dimensioni non dovrebbe essere dicile ).

226 CAPITOLO 1. PANORAMICA SU CALCOLO ED ANALISI REALE

1.30

Appendice: approccio di Carathodory alla misura di Lebesgue

In questa Appendice, tratta da [22, Chapter 3, Section 3], introduciamo


gli insiemi misurabili secondo Lebesgue mediante un approccio alternativo
dovuto a Carathodory e basato sulla misura esterna.

1.30.1

Misura esterna

Ripetiamo, per comodit del lettore, la Denizione 1.24.1:


Definizione 1.30.1. (Misura esterna.) Per ogni insieme E R consideriamo le successioni
numerabili di intervalli aperti In tali che E n In , e la
P
serie L = n m(In ) delle loro lunghezze (nita o innita). Si denisce misura esterna di E lestremo inferiore m (E) di L rispetto a tutte le successioni
di intervalli come sopra.
Una denizione analoga vale in Rn se si prendono, al posto degli intervalli
unidimensionali, pluriintervalli n-dimensionali (ossia prodotti cartesiani di n
intervalli sugli n assi coordinati), ed al posto della loro lunghezza ! il loro
iper-volume.
Nota 1.30.2. Se A B allora ogni ricoprimento di B un ricoprimento di
A, e quindi m (A) 6 m (B).

Proposizione 1.30.3. La misura esterna di un intervallo I la sua lunghezza (I).


Dimostrazione. Sia I = [a, b] un intervallo chiuso e limitato. Poich per ogni
> 0 lintervallo (a , a + ) ricopre I, si ha m (I) 6 b a. Dobbiamo
dimostrare che, se I n (an , bn ), allora
X
bn an > b a .
(1.85)
n

Per la propriet di HeineBorel (parte (ii) del Lemma 1.9.3) possiamo limitare lattenzione a ricoprimenti niti {On = (an , bn ), n = 0, . . . , N}. Poich
!I n On , esiste 0 6 n1 6 N tale che a (an1 , bn1 ), ossia an1 < a < bn1 .
Se b 6 bn1 , allora vale la disuguaglianza (1.85), quindi possiamo assumere
bn1 6 b. Daltra parte, bn1 non appartiene allintervallo (an1 , bn1 ), e quindi

1.30. APPENDICE: MISURA DI LEBESGUE SECONDO CARATHODORY227


deve esistere 0 6 n2 6 N tale che bn1 (an2 , bn2 ). Iterando il ragionamento
otteniamo una successione ni [0, . . . , N] con la propriet ani < bni1 < bni .
Poich linsieme degli indici nito, il procedimento termina dopo un numero
nito di passi, ossia con un indice nk tale che b (ank , bnk ). Ne segue che
X
n

bn an >

k
X
i=1

bni ani > bnk an1

(la disuguaglianza stretta perch due intervalli Oni consecutivi si intersecano: contengono entrambi bni ). Siccome, per costruzione, si ha an1 < a <
b < bnk , abbiamo dimostrato la disuguaglianza (1.85), e quindi lenunciato,
per ogni intervallo limitato e chiuso.
Daltra parte, dato un qualunque > 0, ogni intervallo limitato I contenuto
in un intervallo limitato e chiuso K tale che (I) > (K) = m (K) :
ne segue che lenunciato continua a valere per ogni intervallo limitato.
Inne, se I un intervallo illimitato, ossia una semiretta o lintera retta, esso contiene intervalli limitati di lunghezza arbitrariamente grande e quindi,
ovviamente, la sua misura esterna innita.

Proposizione 1.30.4. La misura esterna (numerabilmente) subadditiva:


X
m (n An ) 6
m (An ) .
n

Dimostrazione. Lenunciato ovvio se m (An ) = per un indice n, quindi


possiamo restringere lattenzione al caso in cui tutti gli insiemi An hanno
misura esterna nita. Allora, per la Denizione 1.24.1 di misura esterna, per
ogniP
n, esiste un ricoprimento di An con intervalli aperti {On,i, iN } tale
che i (On,i ) < m (An ) + /2n . Allora la famiglia numerabile di intervalli
aperti {On,i, n,iN } un ricoprimento di n An tale che
XX
X
X
m (n An ) 6
(On,i ) <
m (An ) + 2n = +
m (An ) ,
n

da cui lenunciato.

Il seguente facile esercizio mostra che la misura esterna s denita per


ogni insieme, ma purtroppo non numerabilmente additiva.
Esercizio 1.30.5. Ogni insieme numerabile ha misura esterna nulla.

228 CAPITOLO 1. PANORAMICA SU CALCOLO ED ANALISI REALE

1.30.2

Insiemi misurabili secondo Lebesgue

Reintroduciamo qui gli insiemi misurabili secondo Lebesgue sulla base di


questa denizione dovuta a Carathodory:
Definizione 1.30.6. Un insieme E R misurabile se per ogni insieme
A R vale lidentit m (A) = m (A E) + m (A E) (indichiamo con E
il complemento R \ E).
Nota 1.30.7. ovvio che un insieme misurabile se e solo se lo il suo
complemento, e e R sono misurabili.

Lemma 1.30.8. Tutti gli insiemi di misura esterna nulla sono misurabili.
Dimostrazione. Supponiamo !m (E) = 0. PoichA E E e A E A,
segue dalla Nota 1.30.2 che !m (A E) 6 m (E) = 0, e m (A) > m (A
E) = m (A E) + m (A E). La disuguaglianza opposta segue di nuovo
dalla Nota 1.30.2.

Proposizione 1.30.9. Lunione di due insiemi misurabili misurabile.


Dimostrazione. Siano E1 e E2 due insiemi misurabili. La misurabilit di E2 ,
per denizione, implica
m (A E1 ) = m (A E1 E2 ) + m (A E1 E2 ) .

(1.86)

Osserviamo anche che A (E1 E2 ) = (A E1 ) (A E2 E1 ) (i punti di


A che stanno in E1 o in E2 devono essere in E1 o se no essere in E2 ma non
in E1 ). Quindi, come al solito in base alladditivit (Nota 1.30.2),
m (A (E1 E2 )) 6 m (A E1 ) + m (A E2 E1 ) .

(1.87)

Questo ci fa concludere che E1 E2 misurabile. Infatti, in base a (1.86),


m (A (E1 E2 )) + m (A (E1 E2 ))
= m (A (E1 E2 ))+!m (A E1 E2 )
6 m (A E1 ) + m (A E2 E1 ) + m (A E1 E2 )
ed in base a (1.87)
m (A E1 ) + m (A E2 E1 ) + m (A E1 E2 )
m (A E1 ) + m (A E1 ) = m (A)

1.30. APPENDICE: MISURA DI LEBESGUE SECONDO CARATHODORY229


(lultima uguaglianza vale perch E1 misurabile).

Abbiamo cos provato che la famiglia degli insiemi misurabili contiene


e R ed chiusa rispetto alle operazioni di complemento ed unione finita (in
tal caso si dice che unalgebra di insiemi). Vogliamo provare che anche
una -algebra (Denizione 1.9.8), ossia che chiusa rispetto alloperazione
di unione numerabile.

Proposizione 1.30.10. La famiglia degli insiemi misurabili una -algebra


(Definizione 1.9.8).
Dimostrazione. Dobbiamo dimostrare che, se {En } una successione di insiemi misurabili, anche E := n>0 En misurabile. Osserviamo anzitutto
che suciente limitare lattenzione a successioni {En } di insiemi a due
a due disgiunti, perch se non sono disgiunti basta rimpiazzarli con gli inn1
siemi Bn := En \ m=0
Em , che invece lo sono, ed hanno la stessa unione:
n>0 Bn = n>0 En .
Per mostrare che E misurabile occorre provare che, per ogni insieme A,
si ha m (A) = m (A E) + m (A E) (Denizione 1.30.6). Siccome la
disuguaglianza m (A) 6 m (A E) + m (A E) evidente grazie alla subadditivit nita della misura esterna (un caso particolare della Proposizione
1.30.4), occorre mostrare solo la disuguaglianza inversa,
m (A) > m (A E) + m (A E)

(1.88)

A causa della subadditivit numerabile


della misura esterna (Proposizione
P

1.30.4) abbiamo m (A E) 6
m
(A
Ek ). Perci la disuguaglianza
k=0
(1.88) certamente vera purch sia vero che

m (A) >

X
k=0

m (A Ek ) + m (A E) .

A sua volta, questa disuguaglianza certamente vera purch per ogni intero
n sia vero che
!!m (A) >

n
X
k=0

m (A Ek ) + m (A E) .

(1.89)

Infatti in questultima disuguaglianza il primo membro non dipende da n, e


quindi, facendo tendere n ad innito, da essa si ottiene la precedente.

230 CAPITOLO 1. PANORAMICA SU CALCOLO ED ANALISI REALE


Sia Un := nk=0 Ek : questo insieme unione nita di insiemi misurabili e
quindi un insieme misurabile grazie alla Proposizione 1.30.9. Da questo
fatto, dallovvia relazione di contenimento Un E e dalla Nota 1.30.2
abbiamo
m (A) = m (A Un ) + m (A Un ) > m (A Un ) + m (A E) .
Da questa disuguaglianza segue la disuguaglianza (1.89), il che completa la
dimostrazione, purch proviamo che lunione di una famiglia nita di insiemi misurabili disgiunti Ek (k = 0, . . . , n) verica la propriet di additivit
seguente:
n
X

n
m (A Ek ) .
m (A (k=0 Ek )) =
k=0

Questultimo passo viene dimostrato come enunciato separato nel prossimo

Lemma 1.30.11.

Lemma 1.30.11. La misura esterna di insiemi disgiunti finitamente additiva: se {Ek : k = 0, . . . , n} una famiglia finita di insiemi misurabili
disgiunti, allora

m (A

(nk=0 Ek ))

n
X
k=0

m (A Ek ) .

Dimostrazione. Dimostriamo lenunciato per induzione su n. Per !n = 0


ovvio. Quindi, grazie allipotesi di induzione, dobbiamo solo provare che, per
ogni n,
n1
Ek )) .
m (A (nk=0 Ek )) = m (A En ) + m (A (k=0

(1.90)

Daltra parte, poich gli insiemi Ek sono disgiunti, abbiamo (nk=0 Ek ) En =


n1
Ek . Allora (1.90) segue dalla Denizione 1.30.6
En , e (nk=0 Ek ) En = k=0
di misurabilit e dal fatto che lunione nita nk=0 Ek misurabile.

1.30.3

I Boreliani sono misurabili

Ora mostriamo che i Boreliani (ovvero gli elementi della -algebra generata
dagli intervalli aperti, Denizione 1.9.9) sono insiemi misurabili secondo la
denizione di Carathodory.

1.30. APPENDICE: MISURA DI LEBESGUE SECONDO CARATHODORY231


Lemma 1.30.12. Per ogni a R, la semiretta (a, ) misurabile.

Dimostrazione. Per ogni insieme A poniamo B := A (a, ) e C := A


(, a]. Allora A = B C, e, di nuovo grazie alla subadditivit nita della
misura esterna (come nella dimostrazione della Proposizione 1.30.10), basta
provare che
m (A) > m (B) + m (C) .
(1.91)
Questo certamente vero se m (A) = , quindi assumiamo m (A) < . In
tal caso, per la Denizione 1.24.1 di misura esterna, per ogni > 0 esiste un
ricoprimento numerabile di A con intervalli aperti In tale che
X
(In ) 6 m (A) + .
(1.92)
n

Adesso poniamo Jn := In (a, ) e Kn := In (, a]. Gli insiemi Jn e Kn


sono o vuoti o intervalli disgiunti contigui, e quindi
(In ) = (Jn ) + (Kn ) = m (Jn ) + m (Kn )

(1.93)

(lultima identit segue dal Lemma 1.30.11). Ora notiamo che B n Jn e


C n Kn . Allora dalla monotonia della misura esterna (Nota 1.30.2) e dalla sua subadditivit numerabile
1.30.4) segue rispettivamente
P (Proposizione
P

m (B) 6 m (n Jn ) 6
n m (Jn ) e m (C) 6 m (n Kn ) 6
n m (Kn ).
Sommando queste due disuguaglianze, in base alla identit (1.93) ed alla
disuguaglianza (1.92) otteniamo
X
X
m (B) + m (C) 6
(m (Jn ) + m (Kn )) =
(In ) 6 m (A) + .
n

Poich arbitrario da qui segue (1.91).

Proposizione 1.30.13. I Boreliani sono misurabili.


Dimostrazione. Questo enunciato si dimostra con una estensione standard
a partire dalle semirette considerate nel Lemma precedente. Gli insiemi misurabili formano una -algebra (Proposizione 1.30.10) e (a, ) misurabile
(Lemma 1.30.12). Pertanto, per ogni a, il suo complemento (, a] misurabile e lo anche (, a) = n>0 (, a 1/n]. Allora ogni intervallo
aperto (a, b) = (, b) (a, ) misurabile: dunque la -algebra di Borel,
che generata dagli intervalli aperti, contenuta nella -algebra degli insiemi
misurabili.

232 CAPITOLO 1. PANORAMICA SU CALCOLO ED ANALISI REALE

1.30.4

Misura di Lebesgue

Definizione 1.30.14. Chiamiamo misura di Lebesgue m la restrizione della


misura esterna m (denita su tutti gli insiemi) alla -algebra degli insiemi
misurabili.

Proposizione
P1.30.15. Per ogni successione En di insiemi misurabili si ha
m(n En ) 6
in aggiunta gli insiemi En sono a due a due
n m(En ). Se P
disgiunti, allora m(n En ) = n m(En ).

Dimostrazione. La disuguaglianza segue direttamente dalla propriet corrispondente per la misura esterna (Proposizione 1.30.4). Proviamo allora
lidentit nel caso di una famiglia di insiemi a due a due disgiunti: ancora
una volta grazie alla subadditivit (numerabile) della misura esterna, basta
provare

m(
n=1 En )

m(En ) .

(1.94)

n=1

Consideriamo una famiglia finita di insiemi misurabili En a due a due disgiunti: dal Lemma 1.30.11 segue
la nita additivit di m, ovvero lidentit delleP
nunciato, m(n En ) = n m(En ). Ora passiamo a considerare una famiglia
{En } infinita di insiemi misurabili a due a due
Per ogni k, segue
Pdisgiunti.
k
dalla Nota 1.30.2 e dalla nita additivit che n=1 m(En ) = m(kn=1 En ) 6
m(
n=1 En ). Da qui, facendo tendere n a innito, otteniamo la disuguaglianza
(1.94).

1.31. APPENDICE: DISUGUAGLIANZA DI MINKOWSKI

1.31

233

Appendice: dimostrazione diretta della disuguaglianza di Minkowski

Seguendo [22] diamo una dimostrazione della disuguaglianza di Minkowski


(Teorema 1.16.10) che non richiede la disuguaglianza di Hlder 1.16.6, e che
permette di studiare anche il caso 0 < p < 1.
Dimostrazione(diretta della disuguaglianza di Minkowski, Teorema 1.16.10).
La disuguaglianza chiara se p = , ed anche nei casi in cui kf k o kgk = 0,
perch in questi casi f o g sono nulle quasi ovunque. Supponiamo allora che
1 6 p < e kf k 6= 0, kgk 6= 0. Normalizziamo, in modo che le
norme diventino uguali a 1: cio poniamo f0 = 1 |f |, g0 = 1 |g|. Scriviamo

= +
. Allora 1 = +
. Allora
|f (x) + g(x)|p 6 (|f (x)| + |g(x)|)p

= (f0 (x) + g0 (x))p


= ( + )p (f0 (x) + (1 )g0 (x))p
! 6 ( + )p (f0 (x)p + (1 )g0 (x)p )

dove lultima disuguaglianza segue dalla Denizione 1.15.1 di convessit perch la funzione t 7 tp convessa per t > 0 e p > 1 (Esercizio 1.7.3, oppure,
se non si svolto quellesercizio, si applichi il Corollario 1.15.9). Se p > 1
questa disuguaglianza stretta a meno che f0 = g0 ed f e g abbiano due
valori complessi della stessa fase per ogni x.
Integrando entrambi i termini di questa disuguaglianza si ottiene

kf + gkp 6 ( + )p kf0 kpp + (1 )kg0kpp
p
6 ( + )p = !kf kpp + kgkpp .

Otteniamo la disuguaglianza di Minkowski estraendo le radici p-esime di


entrambi i lati.
Se 1 < p < la disuguaglianza stretta a meno che f0 = g0 quasi
ovunque ed f e g abbiano quasi ovunque lo stesso angolo di fase: questo
equivale a dire che f e g sono multipli una dellaltra per un fattore positivo
(o nullo, naturalmente).

234 CAPITOLO 1. PANORAMICA SU CALCOLO ED ANALISI REALE


Nota 1.31.1. Se 0 < p < 1, la stessa dimostrazione, ed il fatto che per questi
p la funzione t 7 tp concava per t > 0 mostrano che la disuguaglianza vale
nel verso opposto, e quindi per questi p lespressione kf kp non una norma
perch non verica la disuguaglianza triangolare.

Capitolo 2
Analisi complessa
Questo capitolo presenta cenni della parte elementare della teoria delle funzioni f : C 7 C derivabili in senso complesso. Lesposizione ispirata a (ed
in gran parte tratta da) [23, Chapter 10] ed a [1, Chapter 16].

2.1

Derivata in senso complesso, differenziabilit ed equazioni di CauchyRiemann

In questa sottosezione consideriamo funzioni di variabile complessa e a valori


complessi, f : C 7 C. Per queste funzioni, la nozione di derivata quella
ovvia:
Definizione 2.1.1. (Derivata in senso complesso.) . Sia f : C 7 C,
e sia z0 un punto interno al dominio di denizione di f . Si dice che f
derivabile (in senso complesso) al punto z0 se esiste nito il limite
f (z) f (z0 )
zz0
z z0

f (z0 ) = lim

che in tal caso si chiama la derivata di f a z0 .


Nota 2.1.2. (Equazioni di CauchyRiemann.) Possiamo calcolare il limite del rapporto incrementale di f : C 7 C lungo, ad esempio, la direzione
235

236

CAPITOLO 2. ANALISI COMPLESSA

dellasse reale e dellasse immaginario: se z0 = x0 + iy0 otteniamo


f
f (x + iy0 ) f (x0 + iy0 )

(z0 )
xx0
x x0
x

f (z0 ) = lim
f (z0 ) = lim

yy0

(2.1)

f (x0 + iy) f (x0 + iy0 )


1 f

(z0 ) .
iy iy0
i y

Questo equivale a reinterpretare f come funzione da C a R2 e considerare le sue derivate parziali complesse f
(z ) e f
(z ). A causa del fattore
x 0
y 0
i al denominatore nella derivata al variare di y, le precedenti identit ora
diventano
f
f
(z0 ) = i (z0 ) .
(2.2)
x
y
Si osservi che queste derivate parziali sono numeri complessi. Ora separiamone la parte reale dalla parte immaginaria:
Re f
Im f
f
=
+i
x
x
x

(2.3)

ed analogamente per la derivata parziale rispetto a y. Ora elementare


vericare che luguaglianza (2.2) si spezza nel seguente sistema di equazioni
(Equazioni di CauchyRiemann):
Im f
Re f
(z0 ) =
(z0 )
x
y
Re f
Im f
(z0 ) =
(z0 ) .
y
x

(2.4)

Nota 2.1.3. Per una funzione f : C C derivabile in senso complesso, grazie


allunidimensionalit (in senso complesso) del dominio e dellimmagine la
nozione di derivabilit e di dierenziabilit sono equivalenti (Nota 1.22.5).
Pi precisamente, entrambe le nozioni equivalgono alla seguente:
f (z) = f (z0 )+f (z0 ) (zz0 )+o(|zz0 |) := f (z0 )+f (z0 ) (zz0 )+(zz0 )(z)
(2.5)
dove (z) innitesimo per z z0 .
Questo sviluppo soddisfa la Denizione 1.22.4 di dierenziale, perch la moltiplicazione per il numero f (z0 ) , ovviamente, un funzionale lineare sullo

2.1.

DERIVATA COMPLESSA E DIFFERENZIABILIT

237

spazio complesso unidimensionale C (e tutti i funzionali lineari su uno spazio unidimensionale sono moltiplicazioni per un numero). Ma se separiamo le
parti reale ed immaginaria, questo funzionale diventa un funzionale lineare su
R2 , che, nella base canonica, rappresentato da una matrice bidimensionale.
Quale la matrice?
Per semplicit, scegliamo z0 = 0 (non c perdita di generalit, perch ci
si riconduce a questo caso con una traslazione, che non altera derivate e
dierenziali). Scriviamo f (0) = a + ib e z = x + iy. Allora (2.5) diventa
p
f (z) = f (0)+(a+ib)(x+iy)+o(kx+iyk) = axby +i(bx+ay)+o( x2 + y 2 )
(2.6)
dove chiaramente il simbolo o(kzk) rappresenta un innitesimo rispetto a kzk
(Sezione 1.1), quindi del tipo z(z). Ora reinterpretiamo f : C 7 C come
una funzione f : R2 7 R2 : allora dalluguaglianza (2.6) si ricava la seguente
espressione reale delloperatore lineare su R2 determinato dal dierenziale
complesso, in termini di una matrice reale 2 2:
  
 
x
a b
x
df|(0,0)
=
.
y
b a
y
Ma la matrice che rappresenta il dierenziale di una funzione reale fR2 7 R2
data dalla matrice Jacobiana (Denizione 1.22.8), espressa in termini delle
derivate parziali di f come segue:

Re f
Re f
(0)
(0)
x

df|(0,0) =
.
Im f

Im f
(0)
(0)
x
y

Confrontando le dierenti espressioni del dierenziale reale calcolate nelle due


uguaglianze precedenti, ritroviamo le equazioni di CauchyRiemann (2.4).
Inne, la funzione f : C 7 C si pu considerare come una funzione da C
a R2 . In questo caso il suo dierenziale un operatore lineare da C a R2 , e
quindi rappresentato nelle basi canoniche da una matrice consistente di una
sola riga, i cui coecienti sono le derivate parziali complesse di f rispetto
alle variabili x e y, introdotte nella Nota 2.1.2. La nozione di dierenziabilit
per questa riformulazione diventa
f (z) = f (0) +

f
f
(0) x +
(0) y + o(kzk)
x
y

(2.7)

238

CAPITOLO 2. ANALISI COMPLESSA

ed chiaro che, esprimendo le derivate parziali complesse in termini di quelle


reali (ossia delle loro parti reali ed immaginarie) come in (2.3), questa nozione
di dierenziabilit equivale a quella complessa in (2.6), e quindi a quella da
R2 a R2 .

Riassumendo, nella precedente Nota 2.1.3 abbiamo mostrato che una funzione f : C 7 C derivabile in senso complesso se e solo se dierenziabile
in senso complesso, e se lo allora dierenziabile in senso reale (come funzione da R2 in s), e anche come funzione da C a R2 , e le sue derivate parziali
(in senso reale) sono legate dalle equazioni di CauchyRiemann. Il prossimo
risultato, Proposizione 2.1.5, mostra il viceversa: se f dierenziabile in
senso reale e le sue derivate parziali soddisfano le equazioni di Cauchy, allora
f derivabile in senso complesso. Premettiamo una notazione utile.
Notazione 2.1.4. Denotiamo con e i seguenti operatori dierenziali sulle
funzioni f : R2 7 R2 derivabili in senso parziale:


1

=
(2.8)
i
2 x
y


1

=
.
(2.9)
+i
2 x
y
Proposizione 2.1.5. (Condizioni equivalenti alla derivabilit in senso complesso.) Per una funzione f : C 7 C, ad ogni punto z0 interno al
suo dominio di definizione le seguenti propriet sono equivalenti:
(i) f derivabile in z0 in senso complesso;
(ii) f differenziabile in z0 in senso complesso (cio nel senso in cui il
differenziale visto come applicazione lineare da C a C);
(iii) f , o meglio la funzione f : R2 7 R2 che si ottiene su R2 separandone
le parti reale ed immaginaria, differenziabile al punto z0 (nel senso
di R2 ) e le sue derivate parziali soddisfano le equazioni di Cauchy
Riemann (2.4);
(iv) f , vista come funzione da C a R2 , differenziabile al punto z0 (nel senso
di (2.7)) e le sue derivate parziali soddisfano le equazioni di Cauchy
Riemann (2.4);
0.
(v) f

2.2. FUNZIONI OLOMORFE ED ARMONICHE

239

Dimostrazione. Lequivalenza fra (i) e (ii) ed il fatto che ciascuna di queste


due propriet implica (iii) e che (iii) implica (iv) stata dimostrata nella
precedente Nota 2.1.3. Basta quindi mostrare che (iv) implica (v) e che (v)
impica (i). Se f : C 7 R2 dierenziabile al punto z0 = x0 + iy0 nel senso
di (2.7) e le sue derivate parziali soddisfano le equazioni di CauchyRiemann
(2.4), allora la funzione f : C 7 C generata dalle componenti f1 e f2 di f,
ovvero f = f1 + if2 , derivabile in senso complesso al punto z0 . In realt,
vedremo che lo stesso ragionamento prova non solo che (iv) implica (i), ma
che queste due propriet sono equivalenti. Come prima, senza perdita di
generalit limitiamo lattenzione al punto z = 0.
Nelluguaglianza (2.7) sostituiamo x = 12 (z + z) e y = 2i1 (z z) ed otteniamo




f
1 f
f
1 f
(0) i (0) z +
(0) + i (0) z + z(z)
f (z) = f (0) +
2 x
y
2 x
y
z + z(z)
= f (0)z + f (0)
dove, come prima, un innitesimo.
Dividendo entrambi i membri per z 6= 0 otteniamo lespressione del rapporto
incrementale di f in 0:
z
f (z) f (0)
= f (0) + f (0) + (z) .
z
z
La funzione f derivabile in z = 0 se e solo se esiste nito il limite di
questo rapporto incrementale. Perch questo accada, bisogna che il limite
non dipende dal percorso che z segue nel tendere a zero. Daltra parte,
z/z vale costantemente 1 se z giace sullasse reale, e costantemente 1 se
giace sullasse immaginario: quindi il limite non esiste a meno che non si
abbia f (0) = 0, e se invece questa condizione vericata il limite esiste
(e vale f (0)). Per concludere la dimostrazione basta solo osservare che
la condizione di esistenza del limite, ovvero f (0) = 0, non altro che le

equazioni di CauchyRiemann (2.4).

2.2

Funzioni olomorfe ed armoniche; funzione


armonica coniugata

Dora in poi, una funzione derivabile in senso complesso in un insieme aperto


del piano complesso verr chiamata olomorfa:

240

CAPITOLO 2. ANALISI COMPLESSA

Definizione 2.2.1. Una funzione olomorfa se derivabile in senso complesso in ogni punto dellaperto in cui denita, ossia se soddisfa le equazioni
di CauchyRiemann (2.4) ad ogni punto.
Per questa denizione, una funzione f olomorfa ha derivate parziali rispetto ad entrambe le variabili (reali) x e y. Supponiamo che queste derivate
parziali siano derivabili a loro volta in senso parziale con continuit (vedremo
che questo sempre vero: Corollario 2.5.4). Allora, derivando rispetto a x
la prima equazione di CauchyRiemann (2.4) e rispetto a y la seconda, ed
applicando il Lemma di Schwartz 1.22.3, otteniamo
f =

2f
2f
+
0.
x2
y 2

Definizione 2.2.2. Loperatore si chiama loperatore di Laplace. Una


funzione che verica lidentit f = 0 in un aperto E del piano si chiama
armonica in E. Quindi ogni funzione olomorfa armonica.
Sia f olomorfa in un aperto connesso E e scriviamo u := Re f e v := Im f .
Nel caso che u sia identicamente nulla, le equazioni di CauchyRiemann, nella
0 (parte (v) della Proposizione 2.1.5) portano a
forma f
v
v
i
.
x
y
Poich v a valori reali, questo implica che
v
v
0
.
x
y
Pertanto v costante in E. Analogo ragionamento mostra che, se v 0,
allora u costante in E. Abbiamo quindi provato:
Corollario 2.2.3. Se f = u + iv definita in un aperto connesso E C,
allora data u c al pi una sola funzione v, a meno di costanti additive, per
cui f risulta olomorfa in E. Le funzioni u e v sono funzioni armoniche reali,
e la funzione v si chiama la funzione armonica coniugata di u.
Notazione 2.2.4. Le funzioni derivabili in senso complesso, oltre che olomorfe, sono dette anche analitiche, nella regione in cui sono derivabili.
Il quoziente di due funzioni olomorfe, laddove denito (ossia dove il denominatore non si annulla) si chiama una funzione meromorfa.

2.2. FUNZIONI OLOMORFE ED ARMONICHE

241

Le funzioni meromorfe sono esattamente quelle funzioni olomorfe tranne


che in un insieme senza punti di accumulazione nel dominio di denizione (gli
zeri del denominatore) che consiste di singolarit polari. (Per un dimostrazione accurata di questa caratterizzazione, che richiede vari concetti molti
dei quali saranno sviluppati in questo Capitolo, si veda [23, Theorem 16.8]).
Rammentiamo che per le funzioni olomorfe valgono i risultati della Sottosezione 1.22.2, in particolare il legame fra le derivate parziali delle parti reale ed
immaginaria di f stabilito dalle equazioni di CauchyRiemann (Nota 2.1.2),
e la regola di derivazione di funzione composta (Nota 1.22.16).
Inoltre, useremo continuamente le propriet, presentate nelle Sezioni 1.4
e 1.6, delle funzioni f rappresentabili
come serie di potenze, ed in particolar
P
modo il fatto che, se f (z) =
a
(z
z0 )n , allora la convergenza uniforn=0 n
me nei compatti contenuti nel disco aperto si convergenza, f di classe C
allinterno di questo disco, e la serie di potenze la serie di Taylor di f con
centro z0 , ossia an = D (n) f (z0 )/n! per ogni n. Inne, useremo senza ulteriori
commenti la nozione di integrale curvilineo di funzioni complesse (Denizione 1.29.30), e come caso particolare assai frequente quella dellindice di
avvolgimento (Denizione 1.29.34).
Teorema 2.2.5. Sia X uno spazio topologico in cui definita una misura
di Borel complessa finita (Definizione 1.9.11). Allora, per ogni funzione
misurabile : X 7 C e per ogni z
/ (X), la funzione integrale
Z
1
d(x)
(2.10)
f (z) =
X (x) z
sviluppabile in serie di potenze, e quindi in particolare olomorfa.
Dimostrazione. Sia C un aperto tale che (X) = , a e r > 0
tale che il disco Br (a) con centro a e raggio r sia contenuto in . Allora per
ogni x X la distanza |(x) a| maggiore di r, e quindi, se z Br (a),
abbiamo


za
< 1.
q
(x) a
Perci la serie geometrica

n

X
za
(x) a
n=0

242

CAPITOLO 2. ANALISI COMPLESSA

1
= (x)a
(Sezione 1.1), e la convergenza uniforme rispetto a
converge a 1q
(x)z
x X grazie al test di Weierstrass 1.3.29. Pertanto la serie

X
n=0

X
1
(z a)n
=
((x) a)n+1
(x) a n=0

za
(x) a

n

1
uniformemente rispetto a x. Allora possiamo sostituire queconverge a (x)z
sta serie nellintegrando di (2.10) e scambiare la serie con lintegrale (Teorema
di integrazione per serie 1.3.34). In tal modo, per z Br (a), otteniamo

f (z) =

X
n=0

an (z a)n

R
1
dove an = X ((x)a)
n+1 d(x) (questo integrale convergente perch lintegrando non si annulla mai, visto che il modulo del suo denominatore
maggiore di r n+1 ).

2.3

Indice di avvolgimento

Notazione 2.3.1. Dora in avanti, con percorso chiuso, o ciclo, intendiamo


una curva chiusa di classe C 1 a tratti a valori in C, o anche solo assolutamente
continua (e quindi tale che su di essa ha senso lintegrale curvilineo delle
funzioni f : C 7 C, si veda la Denizione 1.29.30).
Teorema 2.3.2. (Indice di avvolgimento.) Siano r : [a, b] 7 C un
percorso chiuso con immagine C = Image(r), = C \ Image(r), e z .
Poniamo w = r(t), e, seguendo la terminologia sviluppata nella Notazione
1.29.32 e nella Definizione 1.29.34, scriviamo
Z
1
1
Indr (z) =
dw .
2i C w z
Allora Indr una funzione su a valori interi, costante sulle componenti
connesse di e nulla sulla componente illimitata.
Dimostrazione. Sappiamo dal Teorema 2.2.5 che lindice di avvolgimento
olomorfo in , quindi in particolare continuo. Poich limmagine continua di
un insieme connesso connessa (Proposizione 1.29.45), se i valori dellindice

2.3. INDICE DI AVVOLGIMENTO

243

di avvolgimento sono interi, allora essi devono essere costanti in ciascuna


componente connessa di . Proviamo quindi che questi valori sono interi.
In base alla Denizione 1.29.30, lintegrale curvilineo si scrive come
1
Indr (z) =
2i

b
a

w (t)
dt ,
w(t) z

(2.11)

ed il fatto che lindice di avvolgimento abbia valori interi equivale alla seguente asserzione:
la funzione
Z s

w (t)
(s) exp
dt
(2.12)
a w(t) z

verifica la condizione (b) = 1.


Osserviamo che la funzione data da un esponenziale e quindi non si
annulla mai. Inoltre, poich z
/ Im(r), il denominatore della frazione nellintegrando non si annulla mai. Pertanto, per il Teorema di derivazione di
funzione composta ed il Teorema fondamentale del calcolo (Sezione 1.1),
continua ovunque e derivabile laddove r lo (quindi ovunque tranne che in
un insieme nito), e
w (s)
(s)
=
.
(2.13)
(s)
w(s) z
(s)
Quindi la funzione continua w(s)z
derivabile quasi ovunque; la sua derivata

(s) (w(s) z) (s) w (s)


,
((w(s) z))2

che vale zero grazie a 2.13, tranne che in un insieme nito di punti. Dal
momento che questa funzione continua, essa costante: poich (a) = 1
ne segue che
w(s) z
(2.14)
(s) =
w(a) z

per ogni a 6 s 6 b. Ma il percorso r chiuso e pertanto w(b) = w(a), da cui


(b) = 1. In tal modo abbiamo provato lasserzione sul valore intero.
Inne, sulla componente illimitata di il denominatore nellintegrale 2.11
pu essere reso arbitrariamente grande (basta scegliere z sucientemente
lontano dallimmagine del percorso r), e quindi il valore intero dellindice di
avvolgimento in questa componente deve essere zero.

244

CAPITOLO 2. ANALISI COMPLESSA

Nota 2.3.3. La formula (2.14) mostra che, allaumentare di s in [a, b], lincremento della parte immaginaria della funzione (s) denita in (2.12) misura
lincremento dellargomento del numero complesso r(s) z durante il percorso di r intorno a z, e che questo incremento vale 2 Indr (z). Quindi il
precedente Teorema 2.3.2 asserisce che per ogni giro che il percorso chiuso
r compie intorno a z lindice di avvolgimento aumenta di 1 se il giro percorso in senso antiorario (il segno positivo dellincremento dellargomento dei
numeri complessi), e diminuisce di 1 se il giro in senso antiorario. Questo
fatto spiega la terminologia indice di avvolgimento.

2.4

Invarianza per omotopia e teorema di Cauchy

In questa Sezione dimostriamo che, in opportuni dominii, lintegrale di una


funzione derivabile su un percorso chiuso vale zero (per una forma preliminare di un enunciato simile si veda la Proposizione 1.29.36). La dimostrazione
che presentiamo si applica a domini semplicemente connessi, introdotti nella
Denizione 1.29.51 e rideniti in maniera pi operativa nel seguito (lequivalenza delle due denizioni sar mostrata nella prossima Sezione). A questo
ne dovremo deformare con continuit i percorsi sui quali calcolare lintegrale curvilineo. Il signicato di questa deformazione continua dato dalla
seguente nozione di omotopia (rinviamo allAppendice 2.16 i lettori interessati solo ad una versione del teorema di Cauchy su insiemi pi elementari,
ad esempio insiemi convessi). .
Definizione 2.4.1. (Omotopia.) Siano r0 e r1 due curve denite entrambe
sullo stesso intervallo [a, b] e
(a) con gli stessi punti iniziali e nali in C, oppure
(b) entrambe chiuse.
(Rammentiamo che le curve si intendono continue, come sempre in questo
libro: si veda la Denizione 1.29.1).
Sia A C un insieme che contiene le immagini di entrambe le curve. Si
dice che le due curve sono omotope in A se esiste una funzione continua
h : [a, b] [0, 1] 7 A tale che

2.4. INVARIANZA PER OMOTOPIA E TEOREMA DI CAUCHY

245

h(t, 0) = r0 (t)
curve);

per ogni t [a, b] (ossia h(, 0) la prima delle due

h(t, 1) = r1 (t)

per ogni t [a, b] (ossia h(, 1) la seconda curva);

nel caso (a), h(a, s) = r0 (a) = r1 (a) e h(b, s) = r0 (b) = r1 (b), ovvero
la deformazione conserva i punti iniziali e nali nelle curve intermedie;
nel caso (b), h(a, s) = h(b, s) per ogni s [0, 1], ovvero la deformazione conserva il fatto che le curve intermedie siano tutte chiuse.
La funzione h si chiama una omotopia.
Se una delle due curve omotope, diciamo r1 , costante, ossia r1 (t) = z1 per
ogni t [a, b], allora si dice che r0 omotopa al punto z1 .
Esercizio 2.4.2. Lomotopia una relazione di equivalenza sullinsieme delle
curve. Osservazione: per dimostrare la propriet transitiva si deve usare
la concatenazione di omotopie: se h0 e h1 sono le omotopie fra r0 e r1 e
rispettivamente fra r1 e r2 , allora lomotopia fra r0 e r2 la concatenazione
fra h0 e h1 ; lasciamo trovare al lettore la denizione precisa.

Nota 2.4.3. La nozione di omotopia permette di rendere rigorosa la nozione


di insieme senza buchi annunciata nella Denizione 1.29.51. Infatti, date
due curve r0 e r1 omotope in un insieme A, possiamo considerare limmagine
della omotopia h(t, s) come unarea (o meglio una supecie) contenuta in
A e parametrizzata dai parametri t e s: si tratta dellarea spazzata dalla
famiglia di curve intermedie h(, s) al variare di s in [0, 1]. Ad esempio, se r0
e r1 hanno gli stessi punti estremi e le curve intermedie sono tutte contenute
nellinsieme il cui perimetro dato dalle immagini di r0 e r1 , allora si intuisce
che questa supercie proprio questo insieme. Ora, se r0 una curva chiusa
omotopa ad un punto, questa intuizione ci fa concludere che il suo interno
senza buchi. Ci porta alla seguente generalizzazione della Denizione
1.29.51.

Definizione 2.4.4. (Nozione omotopica di dominii semplicemente


connessi.) Un insieme A C semplicemente connesso se ogni curva
chiusa con immagine in A omotopa in A ad un punto.
Esempio 2.4.5. (Omotopia lineare.) Se linsieme A ha la propriet che,
per ogni t [a, b], il segmento che congiunge i punti r0 (t) e r1 (t) sia tutto

246

CAPITOLO 2. ANALISI COMPLESSA

contenuto in A, allora le curve r0 e r1 sono omotope: lomotopia la combinazione convessa h(t, s) = sr0 (t) + (1 s)r1 (t). Questa omotopia si chiama
omotopia lineare.
In particolare, in un insieme convesso tutte le curve con gli stessi punti estremi sono omotope, e tutte le curve chiuse sono omotope ad un punto.

Teorema 2.4.6. (Interpolazione poligonale a tratti fra curve.) Siano


r0 e r1 due curve omotope in un aperto A C. Allora esiste un numero
finito di curve lineari a tratti q1 , . . . , qn1 tali che, ponendo q0 = r0 e
qn = r1 , ciascuna qj omotopa in A alla curva successiva tramite una
omotopia lineare (definita nel precedente Esempio 2.4.5).
Dimostrazione. Sia h : [a, b] [0, 1] 7 A lomotopia fra r0 e r1 . Poich
linsieme [a, b] [0, 1] R2 compatto e h ivi continua, allora h uniformemente continua, per il Teorema di Heine 1.8.6. Pertanto, per ogni > 0,
esiste > 0 tale che, se due coppie (s, t), (s , t ) distano nel piano complesso
meno di , allora le loro immagini sotto h distano meno di . Scegliamo due
partizioni {t0 , t1 , . . . , tn } in [a, b] e {s0 , s1 , . . . , sn } in [0, 1] tali che i rettangoli
[ti , ti+1 ] [sj , sj+1 ] abbiano tutti diametro minore di (per ogni i e j). Allora
ciascuno di tali rettangoli ha immagine sotto h contenuta in un disco Aij C
di diametro minore di . Poich A aperto, se si sceglie sucientemente
piccolo si ha che Aij contenuto in A (in realt quanto sia grande il diametro
di questi dischi inessenziale per questo ragionamento, quello che importa
che siano interamente contenuti in A).
Sia allora rsj la curva intermedia data da rsj = h(t, sj ), per 0 < j < n. Consideriamo la curva lineare a tratti qj ottenuta congiungendo con segmenti i
punti consecutivi h(ti , sj ) per 0 6 i 6 n, e poniamo q0 = r0 , qn = r1 . Osserviamo che, per il modo in cui sono stati deniti i dischi Aij , i punti qj (ti ),
qj (ti+1 ), qj+1 (ti ) e qj+1 (ti+1 ) appartengono ad Aij . Poich Aij convesso, i
segmenti
sqj+1(t) + (1 s)qj (t)
giacciono in Aij per ogni (t, s) [tj , tj+1 ][0, 1]. Poich tutti i dischi Aij sono
interni ad A, questo vuol dire che tutti questi segmenti che congiungono le
due curve qj , qj+1 sono contenuti in A. Quindi le due curve sono linearmente
omotope in A.

Ora applichiamo lomotopia agli integrali curvilinei:

2.4. INVARIANZA PER OMOTOPIA E TEOREMA DI CAUCHY

247

Teorema 2.4.7. (Invarianza per omotopia.) Sia f una funzione olomorfa in un aperto A, eccetto al pi su un insieme finito di punti in cui
almeno continua. Siano r0 e r1 due curve C 1 a tratti (o assolutamente
continue) omotope in A. Allora
Z
Z
f dz .
f dz =
r1

r0

Dimostrazione. Grazie al teorema di interpolazione lineare a tratti, possiamo


limitarci a considerare il caso in cui le due curve sono linearmente omotope.
Assumiamo cio che per ogni 0 6 s 6 1 il punto rs (t) = sr1 (t) + (1 s)r0 (t)
appartenga ad A per ogni t [a, b]. Allora rs una curva C 1 a tratti (o
assolutamente continua) con immagine in A.
Per a 6 t 6 b scriviamo d(t) = r1 (t) r0 (t) e riscriviamo le curve intermedie
come rs (t) = r0 (t) + sd(t). Osserviamo che

rs (t) = d(t) ,
s

(2.15)

e quindi, indicando con rs la derivata rispetto alla variabile t, abbiamo



r (t) = d (t) .
s s

(2.16)

I vettori in R2 in queste identit si possono identicare con numeri complessi.


In tal modo ha senso lintegrale curvilineo
(s) =

f (z) dz =

rs

f (rs (t)) rs (t) dt ,

introdotto nella Denizione 1.29.30. Dobbiamo provare che (1) = (0);


mostreremo (equivalentemente) che costante.
Ora per semplicit di notazione continuiamo ad identicare i vettori in R2
con numeri complessi e scriviamo zs (t) = rs (t) e w(t) = d(t). Allora

zs (t) = w(t)
s


zs (t) = w (t) .
s

(2.17)

Derivando sotto il segno di integrale (grazie al Teorema 1.23.1) ed applicando


i teoremi di derivazione del prodotto e di funzione composta (1.1), da (2.15),

248

CAPITOLO 2. ANALISI COMPLESSA

(2.16) e (2.17) otteniamo



Z b
Z b

(s) =
(f zs )(t) + (f zs )(t) zs (t) dt
(f zs )(t) zs (t) dt =
s a
s
s
a
Z b
Z b

=
f (zs (t)) zs (t) zs (t) dt +
f (zs (t)) zs (t) dt
s
s
a
a
Z b
Z b

=
f (zs (t)) w(t) zs (t) dt +
f (zs (t)) w (t) dt

b
(f zs w)(t) dt = f zs w a ,

(2.18)

dove i prodotti nellultima riga sono le consuete moltiplicazioni complesse.


Poich le curve r0 e r1 sono omotope, si ha w(a) = d(a) = r1 (a) r0 (a) = 0,
ed analogamente w(b) = 0. Pertanto lultimo termine in (2.18) si annulla, e
lenunciato dimostrato.

Corollario 2.4.8. Lindice di avvolgimento un invariante omotopico: se


r0 e r1 sono due curve chiuse omotope in un insieme A C e z
/ A, allora
Indr0 (w) = Indr1 (w).
Nota 2.4.9. Il precedente corollario mostra che la nozione di insieme semplicemente connesso presentata nella Denizione 1.29.51 in termini dellindice
di avvolgimento Indr (w) (Denizione 1.29.34 e Sezione 2.3) equivale a quella
espressa in termini di omotopia (Denizione 2.4.4).

Corollario 2.4.10. (Teorema di Cauchy in dominii semplicemente


connessi.) Sia f una funzione olomorfa in un aperto A, eccetto al pi su
un insieme finito di punti in cui almeno continua. Su ogni curva C 1 a tratti
(o assolutamente continua) r omotopa in A ad un punto si ha
Z
f (z) dz = 0 .
r

In particolare, se A semplicemente connesso (Definizione 2.4.4), lintegrale


curvilineo di f si annulla su ogni curva chiusa C 1 a tratti (o assolutamente
continua).

2.5. FORMULA DI CAUCHY

249

Dimostrazione. Basta osservare che, se r omotopa ad una curva costante


q(t) = z0 , in base al precedente Teorema di invarianza 2.4.7 lintegrale vale
Rb
f (q(t)) q (t) dt, che nullo perch q (t) = 0.

a
Chiaramente, possiamo riscrivere questo risultato come segue:

Corollario 2.4.11. Sia f una funzione olomorfa su un dominio A semplicemente connesso, u, w A e 1 , 2 due curve C 1 a tratti (o assolutamente
continua) Rda u a w.R Allora lintegrale di f da u a w indipendente dal
percorso: 1 f dz = 1 f dz.

Nota 2.4.12. Sia r una curva semplice chiusa in C, e consideriamo il suo


interno I ed il suo esterno E, nel senso del Teorema di Jordan 1.29.12. Se
1
z0 E, allora r omotopa ad un punto in I e lintegrando zz
dellindice
0
di avvolgimento ivi olomorfo, quindi, per il teorema di Cauchy (Corollario
2.4.10), lindice di avvolgimento intorno a z0 nullo. Invece, se z0 I, allora
1
olomorfo in I \ {z0 }, e r omotopa in I \ {z0 } ad una circonferenza
zz0
intorno a z0 percorso una volta in senso antiorario od in senso orario: pertanto
in questi due casi, per il Teorema di invarianza omotopica 2.4.7, lindice di
avvolgimento vale rispettivamente 1 o 1. Nel primo caso diciamo che la
curva orientata positivamente, nel secondo che orientata negativamente.

Notazione 2.4.13. Dora in avanti, con curva o percorso intendiamo una


curva di classe C 1 a tratti (o anche solo assolutamente continua).
Un altro corollario del teorema di invarianza omotopica cos importante
che gli dedichiamo lintera prossima Sezione.

2.5

Ricostruzione di funzioni olomorfe dai loro valori al bordo: la formula integrale di


Cauchy

Il prossimo risultato permette di ricostruire i valori di una funzione olomorfa


dentro un dominio semplicemente connesso tramoite un integrale curvilineo
dei suoi valori sul bordo. Il lettore che fosse interessato a questo risultato
solo su insiemi convessi pu ignorare la precedente trattazione dellinvarianza
omotopica e fare riferimento alla presentazione del teorema di Cauchy in tali
insiemi data nellAppendice, Sezione 2.16.

250

CAPITOLO 2. ANALISI COMPLESSA

Corollario 2.5.1. (Formula integrale di Cauchy in un insieme semplicemente connesso.) Se A C un aperto semplicemente connesso,
C una curva chiusa in A e f una funzione olomorfa su A, allora per ogni
z A \ C si ha
Z
f (w)
1
dw .
IndC (z) f (z) =
2i C w z
(z)
Dimostrazione. La funzione h denita su A da h(w) = f (w)f
se w 6= z, e
wzR

h(z) = f (z), continua su A ed olomorfa in A \ {z}. Quindi C h(w) dw = 0


per il teorema di Cauchy (Corollario 2.4.10), e
Z
Z
f (w)
1
1
h(w) dw = 0 .
dw IndC (z) f (z) =
2i C w z
2i C

Corollario 2.5.2. (Formula di Cauchy per le derivate in un insieme


semplicemente connesso.) Nelle ipotesi del precedente Corollario 2.5.1,
per ogni z A e per ogni n > 0 la derivata n-sima di f soddisfa lidentit
Z
f (w)
n!
(n)
dw .
(2.19)
IndC (z)f (z) =
2i C (w z)n+1
Dimostrazione. Procediamo per induzione su n (se necessario si veda la
Sezione 1.1 per riferimenti a questa tecnica di dimostrazione). Il caso n = 0
il precedente Corollario 2.5.1. Se ora (2.19) vale per un dato n, allora,
derivando sotto il segno di integrale (in base al Teorema 1.23.1), si ricava
Z
f (w)
n!
(n)
(n + 1)
dw ,
IndC (z)f (z) =
2i C
(w z)n+2
che precisamente lidentit (2.19) per n + 1.

Corollario 2.5.3. (Le funzioni olomorfe sono serie di potenze.) Per


ogni aperto A C, le funzioni olomorfe su A sono sviluppabili in serie di
potenze ad ogni punto z0 A, convergente nel pi grande disco aperto con
centro z0 contenuto in A.
Dimostrazione. Sia z0 A e R > 0 tale che il disco aperto con centro z0
e raggio R sia contenuto nellaperto A. Per ogni r < R sia Cr la curva

2.5. FORMULA DI CAUCHY

251

data dalla circonferenza con centro z0 e raggio r, percorsa una volta in senso
antiorario. Per il precedente Corollario 2.5.1 per ogni z tale che |z z0 | < r
si ha
Z
f (w)
1
dw
f (z) =
2i Cr w z

(si noti che basta applicare il teorema di Cauchy su dischi: una dimostrazione
diretta del teorema di Cauchy per questo ambiente semplice nellAppendice,
Sezione 2.16).
Ora possiamo applicare il Teorema 2.2.5, con X = [0, 2], (t) = eit e d(t) =
f ((t)) (t) dt e concludere che f sviluppabile in serie di potenze con centro
in z0 . I coecienti dello sviluppo sono i coecienti di Taylor di f (Corollario
1.6.1), che dipendono solo dai valori di f in intorni arbitrariamente piccoli
di z0 , quindi non dipendono dalla scelta di r < R. Quindi si pu scegliere
r arbitrariamente vicino a R ottenendo sempre lo stesso sviluppo: quindi la
serie converge nellintero disco aperto di raggio R.

Corollario 2.5.4. Le funzioni olomorfe su un aperto A C sono tutte e


sole le funzioni sviluppabili in serie di Taylor con centro in ogni punto di
A (e raggio di convergenza dato dalla distanza dal centro di sviluppo alla
frontiera di A). Ogni funzione derivabile una volta in senso complesso in A
derivabile infinite volte.
Dimostrazione. Dal precedente Corollario 2.5.3 sappiamo che le funzioni
olomorfe sono sviluppabili in serie di potenze, quindi in serie di Taylor (Corollario 1.6.1). Viceversa, ogni funzione sviluppabile in serie di potenze con
centro in un punto derivabile innite volte in quel punto (Teorema 1.4.9).

Lemma 2.5.5. Sia A C un aperto convesso, e f una funzione olomorfa su


A. Allora esiste g olomorfa su A tale che g = f . Lo stesso risultato vale se
esiste un sottoinsieme finito F A tale che f continua su A ed olomorfa
in A \ F .
Dimostrazione. Per ogni ssato a A il segmento [a, z] che congiunge a con
un qualsiasi altro punto z di A giace in A, a causa della convessit. Allora
possiamo denire una funzione g su A in questo modo:
Z
g(z) =
f (w) dw .
[a,z]

252

CAPITOLO 2. ANALISI COMPLESSA

Sempre per la convessit, per ogni altro punto z0 A il triangolo con vertici
a, z e z0 giace in A. Lintegrale di f lungo il perimetro di questo triangolo vale 0 per il teorema di Cauchy (Corollario 2.4.10). Qui in realt il
teorema di Cauchy ci serve solo sui triangoli: in questo ambiente lo riproveremo
separatamente nellAppendice, Sezione 2.16 (Lemma 2.16.1). Poich
R
dw
= z z0 , questo equivale, per z 6= z0 , allidentit
[z0 ,z]
Z

1
g(z) g(z0 )
f (z0 ) =
f (w) f (z0 ) dw .
(2.20)
z z0
z z0 [z0 ,z]

Poich f continua in z0 , per ogni > esiste > 0 tale che, se |w z0 | < ,
si ha |f (w) f (z0 )| < . Quindi, per z z0 , il secondo membro di (2.20)
tende a zero: pertanto g (z0 ) = f (z0 ). La stessa asserzione nel caso in cui
f sia olomorfa solo in A \ F si dimostra nello stesso modo, grazie al fatto
che il teorema di Cauchy sul triangolo di vertici a, z e z0 continua a valere
nellipotesi che f sia continua ovunque ed olomorfa in A meno un punto
(Lemma 2.16.1).

Il seguente celebre risultato un inverso del teorema di Cauchy (Corollario


2.4.10).

Corollario 2.5.6. (Teorema


di Morera.) Se A C aperto e f : A 7 C
R
continua e tale che C f (z) dz = 0 per ogni percorso chiuso contenuto in A
(o anche solo per il perimetro di ogni triangolo interamente contenuto in A),
allora f olomorfa in A.
Dimostrazione. Poich A aperto, intorno ad ogni suo punto z linsieme A
contiene un disco aperto D , che convesso. In base al precedente Lemma
2.5.5, esiste una funzione olomorfa g su D tale che g = f . Osserviamo
che, per quanto illustrato nella dimostrazione del Lemma 2.5.5, qui basta
considerare curve la cui immagine sia il perimetro di un triangolo contenuto
in A e che contiene z.
Sappiamo dal Corollario 2.5.4 che le derivate di funzioni olomorfe sono olomorfe: quindi f olomorfa al generico punto z A.

Dai teoremi di Cauchy e di Morera segue questo sorprendente risultato di


rigidit per i limiti di funzioni olomorfe: la convergenza uniforme sui compatti
rispetta lolomora.

Corollario 2.5.7. Se una successione fn di funzioni olomorfe in un aperto


A converge uniformemente sui compatti, allora il limite f una funzione
olomorfa in A.

2.5. FORMULA DI CAUCHY

253

Dimostrazione. Il limite uniforme sui compatti continuo (Teorema 1.3.16):


quindi possiamo integrarlo lungo le curve assolutamente continue (di solito
si riduce lattenzione a curve di classe C 1 a tratti) nel senso della Denizione
1.29.30). Consideriamo una tale curva la cui immagine C sia interamente
contenuta in un disco aperto contenuto in A. Per la convergenza uniforme si
pu passare al limite sotto il segno di integrale (Teorema 1.3.17), e quindi,
poich il disco convesso, segue dal teorema di Cauchy (Corollario 2.4.10)
che
Z
Z
f (z) dz = lim fn (z) dz = 0
n

(qui di nuovo basterebbe limitare lattenzione a curve triangolari ed applicare


il teorema di Cauchy su triangoli, Lemma 2.16.1). In base al teorema di
Morera (ossia al precedente Corollario 2.5.6), questo implica che il limite
f = limn fn olomorfo in A.

Lemma 2.5.8. Sia D C un dominio aperto in C.


(i) Sia {ht } una famiglia di funzioni olomorfe in un dominio D C al
variare di t in un intervallo [a, b] in R o pi in generale in un pluriintervallo [a, b] in Rn , tali che per ogni z D la funzione Hz (t) = ht (z)
d
ht sia continua su [a, b] D.
appartenga a L1 ([a, b]) ed la derivata dz
Allora
per
ogni
misura

di
Borel
finita
su [a, b] la funzione h(z) =
R
R
. . . [a,b] ht (z) d(t) olomorfa, e si pu derivare sotto il segno di
R
R
integrale: h (z) = . . . [a,b] ht (z) d(t).

(ii) Lo stesso teorema di derivazione sotto il segno di integrale vale nelle


ipotesi pi generali che la misura su R o su Rn sia solo sigmafinita nel senso della Definizione 1.9.11, o pi precisamente finita sui
compatti, e la funzione H(t) = supzD ht (z) appartenga a L1 (||).
Dimostrazione. La prima parte conseguenza immediata del Corollario
1.23.2. Per provare laRseconda parte, si consideri
R unRplurirettangolo K = [a, b]
n
in R e siano h(z) = Rn ht (z) d(t), hK (z) = . . . [a,b] ht (z) d(t): dalla prima parte sappiamo che hK olomorfa e si pu derivare sotto il segno di
integrale. Daltro lato, in base al Corollario 1.9.31,
Z
Z
|h(z) hK (z)| 6
|ht (z)| d||(t) 6
|H(t)| d||(t) .
Rn \K

Rn \K

254

CAPITOLO 2. ANALISI COMPLESSA

Lultimo integrale tende a zero quando K invade Rn , grazie allipotesi fatta


su H. Quindi hK tende uniformemente a h quando K invade Rn , e pertanto
anche h olomorfa, grazie al precedente Corollario 2.5.7. Per lo stesso motivo
hK converge uniformemente a h ,Re poich per la prima parte di questa dimostrazione sappiamo che hK (z) = K ht (z) d(t), lo stesso vale per la funzione
h.

2.6

Zeri di funzioni olomorfe

Teorema 2.6.1. (Ordine degli zeri.) Sia A C e f olomorfa su A. Sia


Z {z A : f (z) = 0} il luogo degli zeri di f . Allora o Z = A (cio
f identicamente nulla), oppure Z non ha punti di accumulazione in A
(Definizione 1.1.1) ed un insieme finito o numerabile. In tal caso, per ogni
z0 Z, esiste un unico intero m > 0 (che dipende da z0 ) ed una funzione
olomorfa g su A tali che g(z0 ) 6= 0 e
f (z) = (z z0 )m g(z)

(2.21)

per ogni z A. Lintero m si chiama lordine dello zero di f al punto z0 , e


chiaramente coincide con lordine di infinitesimo di f .
Dimostrazione. Sia W linsieme dei punti di accumulazione di Z. chiaro
dalla continuit di f che W un sottoinsieme di Z. Per ogni z0 W consideriamo un disco Br (z0 ) A di raggio r > 0. Sappiamo che
Pf sviluppabilen
in serie di potenze con centro in z0 : lo sviluppo f (z) = n=0 an (z z0 )
converge per ogni z Br (z0 ) (Corollario 2.5.3). La funzione f identicamente nulla in Br (z0 ) se e solo se tutti i coecienti an sono nulli: in tal
caso z0 un punto interno di Z. SE questo non accade, consideriamo il
pi piccolo intero m tale che am 6= 0, e poniamo g(z) = (z z0 )m f (z)
per z A \ {z0 }, e g(z0 ) = am . Questa funzioneP
olomorfa in A \ {z0 }
n
perch ivi z z0 non si annulla, e verica g(z) =
n=0 am+n (z z0 ) per
ogni z Br (z0 ), perch
Plultima seriendi potenze ha lo stesso raggio di convergenza di f (z) = n=0 an (z z0 ) . Quindi g sviluppabile in serie di
potenze con centro in z0 , e pertanto olomorfa anche al punto z0 (Corollario
2.5.4). Poich g(z0 ) = am 6= 0, la funzione g rimane non nulla in un intorno
di z0 . Quindi z0 un punto isolato: ma questo contraddice lipotesi che sia
un punto di accumulazione. Quindi tutti i punti di W sono punti interni, e
pertanto W aperto. Daltra parte, chiaro dalla Denizione 1.1.1 che se

2.7. SINGOLARIT RIMOVIBILI ED ESSENZIALI

255

un punto v non di accumulazione per Z allora esiste un disco con centro in


v che non contiene punti di z, e quindi che consiste di punti che non sono di
accumulazione per Z: ma allora il complemento di W aperto, quindi W
chiuso.
In tal modo si conclude che W allo stesso tempo aperto e chiuso, e quindi
che A sconnesso, contrariamente allipotesi, a meno che non sia W = A
oppure W = . Nel primo caso Z = A e f identicamente nulla; nel
secondo caso, per ogni compatto K lintersezione W K deve essere vuota
oppure nita (perch le successioni innite in un compatto hanno un punto di
accumulazione, in virt del Teorema di BolzanoWeierstrass 1.9.6). Daltra
parte, C, e quindi A, unione numerabile di compatti (basta considerare i
dischi chiusi con centro ad esempio lorigine e raggio intero positivo): quindi
W unione numerabile di insiemi al pi niti, e quindi un insieme al pi
numerabile.

Corollario 2.6.2. (Unicit del prolungamento.) Se due funzioni olomorfe in un aperto connesso coincidono in un sottoinsieme che ha qualche
punto di accumulazione, allora coincidono dovunque.

2.7

Singolarit rimovibili e singolarit essenziali

Definizione 2.7.1. Se A un aperto, f : A 7 C, z0 A e f olomorfa in


A \ {z0 }, si dice che f ha una singolarit isolata al punto z0 . Se possibile
denire f in z0 in modo tale da renderla olomorfa su tutto A si dice che la
singolarit rimovibile. Se invece per ogni r > 0 limmagine sotto f del disco
bucato Br z0 \ {z0 } densa in C, allora si dice che z0 un punto di singolarit
essenziale.
Lemma 2.7.2. Se A un aperto e f : A 7 C olomorfa in A \ {z0 } e
limitata in un intorno di z0 allora in z0 la funzione f ha una singolarit
rimovibile.
Dimostrazione. La funzione g : A 7 C denita da g(z) = (z z0 )2 f (z)
for z 6= z0 and g(z0 ) = 0 olomorfa in A \ {z0 }, ed in z0 il suo rapporto
incrementale vale (z z0 ) f (z), che tende a 0 per z z0 perch f limitata
in un intorno di z0 . Quindi g olomorfa in A, ed in particolare sviluppabile

256

CAPITOLO 2. ANALISI COMPLESSA

in serie di potenze (Corollario 2.5.3), ed innitesima del secondo ordine


a z0 . Quindi il suo sviluppo in serie di Taylor a z0 si scrive cos: g(z) =
P

n+2
ogni z 6= z0 in un disco aperto di centro z0 , si
n=0 an (z
Pz0 ) . Ora, per
ha f (z) = n=0 an (z z0 )n , e questa identit vale anche in z0 se poniamo
f (z0 ) = a0 . Quindi f sviluppabile in serie di Taylor convergente in un
intorno di z0 , e pertanto olomorfa anche in z0 (Corollario 2.5.4).

Teorema 2.7.3. (Classificazione delle singolarit.) Se A C un


aperto, z0 A e f : A 7 C olomorfa in A \ z0 , allora vale una ed una sola
delle seguenti tre propriet:
(i) z0 un punto di singolarit rimovibile per f (in particolare, in questo
caso si ha |f (z)| se z z0 );
P
aj
(ii) esistono a1 , . . . , am C, con aj 6= 0, tali che f (z) m
j=1 (zz0 )j ha
una singolarit rimovibile in z0 ;
(iii) z0 un punto di singolarit essenziale.
Dimostrazione. In base alla Denizione 2.7.1, se z0 non un punto di singolarit essenziale, devono esistere r > 0, > 0 e w C tali che |f (z) w| >
1
olomorfa nel
se 0 < |z z0 | < r. In tal caso, la funzione g(z) = f (z)w
disco bucato 0 < |z z0 | < r; poich in tale dominio si ha anche |g(z)| < 1 ,
g olomorfa anche in z0 per il precedente Teorema 2.7.2. Ora, consideriamo
i due casi g(z0 ) = 0 e g(z0 ) 6= 0. Nel primo caso, per la continuit, g rimane
non nulla in un intorno del punto z0 , e quindi esistono una costante M > 0 ed
un disco chiuso centrato in z0 tale che per ogni z in esso si ha g(z) > M (per
lesistenza dei minimi di funzioni continue sui compatti: si veda la Sezione
1.1). Allora in questo disco si ha |f (z) w| < M1 , e quindi |f (z) < |w| + M1 :
ossia f ivi limitata. Pertanto, per il precedente Teorema 2.7.2, f olomorfa
anche in z0 e questo punto costituisce una singolarit rimovibile. Abbiamo
provato (i).
Consideriamo ora il secondo caso, g(z0 ) = 0. Sia m > 0 lordine di zero di
g a z0 , denito nellenunciato del Teorema 2.6.1: per quel Teorema ora si ha
g(z) = (z z0 )m h(z) per ogni z nel disco |z z0 | < r, dove h una funzione
olomorfa in questo disco tale che h(z0 ) 6= 0. Questa funzione h non si annulla
neppurev nel resto del disco, perch non vi si annulla g per il modo in cui
stata denita. Allora il suo reciproco k = f rac1h olomorfo e mai nullo in

2.8. CRESCITA DI FUNZIONI OLOMORFE

257

questo disco; la funzione k verica


k(z) =

1
= (z z0 )m (f (z) w) ,
h(z)

(2.22)

e quindi si ha f (z) w = (z z0 )m k(z). Poich k olomorfa


nel disco,
P
essa si sviluppa in serie uniformemente convergente k(z) = n=0 an (z z0 )n .
Sostituendo questo sviluppo in (2.22) otteniamo (ii).

Corollario 2.7.4. Se una funzione f olomorfa in un disco aperto D ma


in nessun disco pi grande con lo stesso centro, allora f ha un punto di
singolarit non rimovibile sulla frontiera di D.
Dimostrazione. Lenunciato segue immediatamente dal Corollario 2.5.4

2.8

Crescita di funzioni olomorfe

Definizione 2.8.1. (Funzioni intere.) Una funzione olomorfa su tutto C


si dice intera.
Teorema 2.8.2. (Liouville.) Una funzione intera limitata costante.
Dimostrazione. Sia f una funzione intera: allora essa sviluppabile in serie
di potenze su tutto il piano complesso. Consideriamo il suo sviluppo con
centro, ad esempio, in z0 =P
0: lo sviluppo converge uniformemente su tutto C
n
(Corollario 2.5.3): f (z) =
n=0 an z . Lasciamo variare z sulla circonferenza
di raggio r ssato: lo sviluppo si scrive come
i

f (re ) =

an r n ein

(2.23)

n=0

Questa serie uniformemente convergente, e quindi lintegrale che rappresenta i coecienti di Fourier della sua somma f (rei ) commuta con la somma.
Grazie allortogonalit degli esponenziali complessi ein , il coeciente di Fourier n-simo della funzione fr () f (rei ) precisamente an r n : quindi la serie
in (2.23) nientaltro che la serie di Fourier di fr . Dalla disuguaglianza di
Bessel (Corollario 4.3.2(iii)) ora segue

X
n=0

|an |2 r 2n = kfr k22 6 kfr k2 .

(2.24)

258

CAPITOLO 2. ANALISI COMPLESSA

Ora, se f limitata, la serie in questa identit limitata: ma le sue somme


parziali crescono in maniera illimitata al crescere di r, e quindi la limitatezza
si pu avere solo se an = 0 per tutti gli n > 0. Pertanto f (z) = a0 per ogni
z: f costante.

Corollario 2.8.3. (Teorema del massimo modulo, o principio del


massimo.) Sia f una funzione olomorfa in un aperto A C. Per ogni
z A e r > 0 tali che il disco con centro z e raggio r sia contenuto in
A, il punto di massimo di |f | su questo disco si trova sulla sua frontiera, o
equivalentemente


|f (z)| 6 max f (z + rei .

Si ha luguaglianza per qualche z e per qualche r > 0 se e solo se f costante


su tutto A.
il massimo
Di conseguenza, se f olomorfa in un aperto D e continua in D,
del modulo di f viene raggiunto unicamente sulla frontiera di questo aperto:
R
kf kL (D) = kf kL (D)
e kf kL ( D) < kf kL (D)
.


Dimostrazione. Se vale f (z + rei ) 6 |f (z)| per ogni 0 6 < 2, allora,
grazie alla disuguaglianza di Bessel analogamente a (2.24), si ha

X
n=0

|an |2 r 2n 6 |f (z)|2 = |a0 |2 .

Lo stesso argomento della dimostrazione del Teorema di Liouville 2.8.2 ora


mostra che an = 0 per ogni n > 0, ossia che f costante. Lultima asserzione
dellenunciato una conseguenza diretta di questo fatto.

Corollario 2.8.4. (Teorema fondamentale dellalgebra.)


Ogni polinoPn
k
mio di grado n a coefficienti complessi, P (z) = k=0 ak z , ha esattamente
n radici, contate con la loro molteplicit (ossia il loro ordine di zero definito
nellenunciato del Teorema 2.6.1).
Dimostrazione. Per induzione sul grado n, suciente provare che il polinomio P ha una radice, ossia si pu scrivere come P (z) = (z z1 ) Q(z) per
qualche P
z1 C. Rinormalizzando, possiamo limitarci a polinomi del tipo
n1
ak z k + z n .
P (z) = k=0

2.8. CRESCITA DI FUNZIONI OLOMORFE

259

Se r abbastanza grande si ha
n1
X


ak r k
r >
n

k=0

perch il termine di grado massimo cresce pi velocemente degli altri. Ne


segue che, per questi valori di r e per 0 6 < 2 si ha
n1
n1
X
X






ak r k + |a0 | > |f (0)| .
ak r k > r n
P (rei ) > r n
k=1

k=0

1
Quindi, se P non ha zeri,
il suo reciproco f = P una funzione intera che
i
verica |f (0)| > f (re ) per tutti i e per r sucientemente grande: questo
contraddice il Teorema del Massimo Modulo (Corollario 2.8.3).

Corollario 2.8.5. (Stime di Cauchy.) Se f olomorfa nel disco di centro


z0 e raggio r > 0, ed il suo modulo ivi limitato da una costante M, allora
per ogni n > 0 la derivata n-sima verifica la stima
(n)

f (z0 ) 6 M n! .
Rn

Dimostrazione. Segue immediatamente dallidentit (2.24) che i coecienti


(n)
an = f n!(z0 ) dello sviluppo di Taylor di fr () = f (rei ) con centro in z0
vericano |an r n | 6 M per ogni 0 < r < R. Prendendo lestremo superiore
rispetto a r si ottiene lenunciato.

Corollario 2.8.6. Se f intera e |f (z)| < C (1 + |z| ) per qualche < 1,


allora f costante.
Dimostrazione. Poich |f (Reit )| < C (1 + R ) < C R per qualche costante
C , facendo tendere R a innito nelle stime di Cauchy del precedente Corollario 2.8.5 si ottiene che tutte le derivate di f sono nulle in z = 0, e quindi il
suo sviluppo di Taylor consiste solo del termine costante.

Da queste stime si deduce il seguente altro sorprendente risultato di rigidit, relativo alle propriet di convergenza di funzioni olomorfe: la convergenza
uniforme sui compatti di funzioni olomorfe equivale alla convergenza in C
(Denizione 11.3.6).

260

CAPITOLO 2. ANALISI COMPLESSA

Corollario 2.8.7. Se una successione fn di funzioni olomorfe in un aperto


(k)
A converge uniformemente sui compatti, allora per ogni k la successione fn
delle derivate k-sime converge uniformemente sui compatti alla derivata ksima del limite, f (k) .
Dimostrazione. Sappiamo gi (Corollario 2.5.7) che il limite f = limn fn
esiste ed olomorfo in A. suciente provare lenunciato per la derivata
prima: applicandolo poi iterativamente lo si trasorta ad una derivata qualsiasi. Per ogni z A, consideriamo la distanza d(z, A di z dalla frontiera A
(se A = C allora questa distanza innita). Osserviamo che tale distanza
una funzione continua (Nota 4.1.2): quindi su ogni compatto K interamente
contenuto in A essa ammette minimo, necessariamente strettamente positivo: d(K, A minzK d(z, A) > 0. Quindi, per ogni raggio r < d(K, A),
il disco chiuso Br (z) con centro z K e raggio r interamente contenuto in
A. Lunione di questi dischi un compatto che indichiamo con U. Quindi
su U si ha convergenza uniforme: limn kfn f kL (U ) = 0. Per ogni z K,
applicando nel disco Br (z) la stima di Cauchy del precedente Corollario 2.8.5
otteniamo
|fn (z) f (z)| 6 kfn f kL (U ) 0 ,
da cui la convergenza uniforme delle derivate.

2.9

Lo sviluppo di Laurent in una corona circolare

Sia f una funzione olomorfa nel disco BR (z0 ) con centro in z0 e raggio R.
Allora f sviluppabileP
in serie di potenze convergente in tale disco: se |z
n
z0 | < R si ha f (z) =
n=0 cn (z z0 ) per opportuni cn C. Se R =
allora f una funzione intera (Denizione 2.8.1).
1
Per semplicit, per il momento scegliamo
 z0 = 0. La sostituzione z 7 z
1
trasforma f nella funzione g(z) = f z . Per la regola di derivazione di
funzione composta (Sezione 1.1), g olomorfa nellanello {z : |z| > R1 }, ed
ammette il seguente sviluppo in serie:
 n X

1
g(z) =
cn
=
cn z n .
z
n=0
n=0

2.9. SVILUPPI DI LAURENT

261

Ora, se consideriamo unaltra funzione h,P


olomorfa nel disco BR (0) con R <

n
R, ossia ivi sviluppabile
come h(z) =
n=0 dn z , la somma u = g + h
P
1
soddisfa u(z) = n= an z n nellanello { R < |z| < R }, dove an = cn se
n < 0 e an = dn se n > 0; se n = 0 possiamo assumere c0 = 0 e a0 = d0 .
P
n
Notazione 2.9.1. Una serie doppia u(z) =
n= an z in cui le somme
sugli indici positivi e su quelli negativi convergono separatamente si chiama
serie di Laurent di f .
Abbiamo quindi provato:

Corollario 2.9.2. Siano


rispettivamente, i raggi di convergenza
P R e nR, P

n
delle
serie
di
potenze
a
z
e
n=0 n
n=1 an z . Se R < R la serie doppia
P
1
n

n= an z converge ad una funzione olomorfa nellanello { R < |z| < R }.

Risultati analoghi si ottengono per funzioni sviluppabili


in dischi con centro

1
in z0 6= 0: in tal caso, invece che g(z)= f z , occore traslare lorigine al

punto z0 , ossia scegliere g(z) = f


Viceversa:

1
zz0

Teorema 2.9.3. (Sviluppo di Laurent.) Se 0 < r0 < r1 e f olomorfa


nellanello A = {z : r0 < |z z0 | < r1 }, allora f si spezza in A come somma
f = f0 + f1 , dove la parte principale f0 e la parte regolare f1 sono definite
da

X
f0 (z) =
cn (z z0 )n
(2.25)
n=1

f1 (z) =

X
n=0

cn (z z0 )n

(2.26)

e le due serie convergono separatamente in A in maniera uniforme (la serie di f0 converge nel disco Br1 (z0 ); la serie di f1 converge nel complemento del disco chiuso Br0 (z0 ). I coefficienti dello sviluppo sono univocamente
determinati dalle identit
Z
f (z)
1
dz
(2.27)
cn =
2i Cr (z z0 )n+1

dove C una curva semplice chiusa che percorre in senso antiorario una
circonferenza con centro z0 contenuta nellanello A (cio tale che il suo raggio
r verifica r0 < r < r1 ) (od equivalentemente una curva omotopicamente
equivalente a questa).

262

CAPITOLO 2. ANALISI COMPLESSA

Dimostrazione. Per ogni z A, la funzione h denita su A da h(w) =


f (w)f (z)

se w 6= z, e h(z)
wz
R = f (z), continua su A ed olomorfa in A \ {z}.
Quindi lintegrale Hr = Cr h(w) dw = 0 indipendente da r (con r0 6 r 6
r1 ), per il teorema di invarianza omotopica (Teorema 2.4.7) (qui le curve Cr
sono linearmente omotope sotto lomotopia data dalla dilatazione con centro
z0 ). In particolare, H0 = H1 : questa uguaglianza si riscrive come
Z

1
dw
wz

1
f1 (z) =
2i

C1

f (w)
dw
wz

f (w)
dw
wz

f (w)
dw .
C1
C0
C1
C0 w z
(2.28)
R 1
1
Daltra parte, 2i C wz dw = IndC (z) lindice di avvolgimento del percorso
C intorno a z (Denizione 1.29.34). Nel nostro caso, z esterno a C0 , quindi
IndC0 (z) = 0, mentre C1 compie un giro intorno a z, quindi IndC1 (z) = 1.
Pertanto (2.28) diventa f (z) = f1 (z) + f1 (z), con
f (z)

1
dw
wz

1
f1 (z) =
2i

C0

f (w)
dw .
wz

(2.29)

Nota bene: si osservi che le identit (2.29) sono pressoch identiche a quella
del Corollario 2.5.1, che in eetti fu ottenuto con la stessa dimostrazione (il
lettore invitato a vericare). Per quel Corollario si riferiva ad una unica
curva, mentre qui abbiamo due circonferenze C0 e C1 ed il punto z nella
loro intercapedine. Per dedurre (2.29) da quel Corollario sarebbe bastato
tracciare un raggio che congiungesse C0 e C1 , e percorrerlo C1 in senso antiorario, poi queto raggio verso linterno, poi C0 in senso orario, poi il raggio
verso lesterno: in questo modo il raggio viene percorso due volte in versi
opposti ed il suo contributo allintegrale si cancella. Per la curva risultante
non semplice: se si preferisce avere una curva semplice occorre prendere
due segmenti paralleli distinti al posto del raggio, arbitrariamente vicini, in
modo che, per continuit, i loro contributi allintegrazione sono arbitrariamente vicini.
Come prima, per il Teorema di invarianza omotopica 2.4.7, gli integrali curvilinei che deniscono f1 e f1 non cambiano se invece che su C1 o C0 integriamo
su Cr con r0 6 r 6 R1 . In seguito sceglieremo lo stesso raggio (ovvero lo
stesso percorso) per entrambi gli integrali.
2.2.5, f1 olomorfa nel disco Br1 (z0 ), e quindi f1 (z) =
Ora,
P per il Teorema
n
n=0 cn (z z0 ) . Calcoliamo i coecienti dello sviluppo. A questo scopo,

2.9. SVILUPPI DI LAURENT

263

nellintegrando dei due integrali curvilinei in (2.29), poniamo


t=

z z0
w z0

(2.30)

ed osserviamo che |z z0 | < r1 e |w z0 | = r1 , da cui |t| < 1. Quindi vale la


P
1tN+1
n
formula di somma geometrica, N
(Sezione 1.1), ovvero
n=0 t =
1t
N

X
1
tN +1
=
tn +
.
1 t n=0
1t

Osserviamo che

1
1t

wz0
:
wz

pertanto

1
1
1
=
.
w z0 1 t
wz

Sostituiamo le ultime due identit nel primo integrale in (2.29):


Z
Z
f (w)
1
f (w)
1
1
dw =
dw
f1 (z) =
2i C1 w z
2i C1 w z0 1 t
Z
N
X
f (w)
n 1
(z z0 )
=
dw
2i C1 (w z0 )n+1
n=0

N +1
Z
f (w) z z0
1
dw
+
2i C1 w z w z0
N
X
=
cn (z z0 )n + RN ,

(2.31)

n=0

dove cn il coeciente in (2.27) ed il termine di resto RN dato da



N +1
Z
Z
f (w) N +1
f (w) z z0
dw .
(2.32)
dw =
RN =
w z0
C1 w z
C1 w z
Si noti che il fattore che contiene t, in questultimo integrale, dipende da w,
ma uniformemente maggiorato in modulo da 1, come osservammo subito
dopo (2.30). Ma allora limN RN = 0, e pertanto segue da (2.31) che f1
soddisfa lo sviluppo in serie (2.25).
Come prima, per il Teorema di invarianza omotopica 2.4.7, lintegrale curvilineo che denisce il coeciente cn non cambia se invece che su C1 integriamo
su Cr con r0 6 r 6 r1 .

264

CAPITOLO 2. ANALISI COMPLESSA

Resta da dimostrare uno sviluppo analogo per f0 . Procediamo come pri0


. Sulla circonferenza Cr0 il numeratore
ma, ma questa volta poniamo t = wz
zz0
ha modulo r0 ed il denominatore ha modulo maggiore (perch z interno allanello A), quindi |t| < 1 e la serie geometrica converge. Di nuovo dalla
formula di somma geometrica abbiamo
N

X
z z0
1
=
=
zw
1 t n=0

w z0
z z0

n

w z0
z z0

N +1

z z0
.
zw

Procedendo come prima ora si trova


N
X

f0 (z) =

n=1

dove

1
bn =
2i

Cr0

bn (z z) )n + RN

f (w)
dw = cn ,
(w z0 )1n

tende a zero
dove cn il coeciente in (2.27), ed il termine di resto RN
quando N . Questo prova lo sviluppo di f0 enunciato in (2.25); inoltre,
come gi prima, lintegrale che esprime i coecienti si pu calcolare, senza
che il risultato cambi, su qualsiasi altra circonferenza con raggio r0 6 r 6 r1 .
Quindi possiamo calcolare i coecienti di f0 e di f1 tramite integrali sulla
stessa circonferenza, ottenendo in tal modo sia pewr la parte regolare sia per

la parte principale la stessa formula (2.27).

Definizione 2.9.4. (Singolarit isolate.) Diciamo che z0 un punto di


singolarit isolato di f se f non olomorfa (e neppure necessariamente denita) in z0 ma esiste un disco privato del suo centro, B (z0 ) = B(z0 ) \ {z0 },
tale che f sia olomorfa in B (z0 ).
Grazie ai risultati della precedente Sezione 2.9, se z0 un punto di singolarit
isolato di f , per ogni z B (z0 ) lo sviluppo di Laurent
f (z) =

n=

cn (z z0 )n

convergente (nel senso che le due serie unilatere dei termini con indici
positivi e negativi convergono separatamente).

2.10. IL TEOREMA DEI RESIDUI

265

Definizione 2.9.5. (Poli di ordine n.) Se z0 una singolarit isolata per


f e nello sviluppo di Laurent
f (z) =

n=

cn (z z0 )n

si ha ck 6= 0 per qualche k > 0, ma cm = 0 per ogni m > k, allora il punto


z0 si dice un polo di ordine n di f .
Nota 2.9.6. Con riferimento alla notazione introdotta nella Denizione 2.7.1,
osserviamo che, se cn = 0 per ogni n = 1, 2, . . . , allora ovviamente z0 una
singolarit rimovibile. Invece, se cn 6= 0 per inniti n > 0, allora z0 una
singolarit essenziale, ma non avremo bisogno di questo fatto, e quindi non
lo dimostriamo.

Esercizio 2.9.7.
0;

(i) La funzione sin z/z ha una singolarit rimovibile in z =

(ii) la funzione cos z/z ha in z = 0 un polo del primo ordine (detto anche
polo semplice);
(ii) la funzione e1/z ha una singolarit essenziale in z = 0.

2.10

Il teorema dei residui

Definizione 2.10.1. (Residuo.)


Sia z0 una singolarit isolata di f (DeP
n
nizione 2.9.4), e f (z) =
n= cn (z z0 ) lo sviluppo di Laurent. Il
coeciente c1 di questo sviluppo si chiama il residuo di f a z0 , e si indica
con Resz=z0 f (z). Si noti che in base a (2.27) si ha
Z
1
c1 =
f (z) dz
2i C
per qualunque circonferenza C contenuta in B (z0 ) percorsa in senso antiorario e che include z0 al suo interno, e che in base al Teorema di invarianza
omotopica 2.4.7 la stessa formula vale per qualsiasi curva semplice chiusa con
immagine contenuta in B (z0 ) ed indice di avvolgimento Ind(z0 ) = 1 (si veda
la Sezione 2.3).

266

CAPITOLO 2. ANALISI COMPLESSA

Nota 2.10.2. Se f ha un polo del primo ordine in z0 , ossia se lo sviluppo di


Laurent

X
f (z) =
ck (z z0 )k
k=1

scon c1 6= 0, allora dal Corollario 1.29.37 segue immediatamente che


Resz=z0 f (z) = lim (z z0 ) f (z) .
zz0

Se invece f ha un polo di ordine n > 1 in z0 , ancora possibile calcolare


il suo residuo in z0 grazie ad un passaggio al limite, come illustrato nella
prossima Proposizione 2.10.4.

Nota 2.10.3. Segue dalla Nota 2.10.2 che, se f (z) = g(z) h(z), dove g ha
un polo del primo ordine al punto z = z0 e h olomorfa a z0 , allora
Resz=z0 f (z) = h(z0 ) Resz=z0 g(z).

Proposizione 2.10.4. Se f olomorfa in un disco bucato di centro z0 ed in


z0 ha un polo di ordine n, allora
1
lim D (n1) ((z z0 )n f (z)) .
(n 1)! zz0
P
Dimostrazione. Moltiplichiamo lo sviluppo di Laurent f (z) =
j=n cj (z
j
n
z0 ) per (z z0 ) : riscalando gli indici della serie otteniamo allora
Resz=z0 f (z) =

f (z)(z z0 ) =

m=0

cmn (z z0 )m .

Derivando n 1 volte otteniamo


D

(n1)

(f (z)(z z0 ) ) =

m=n1

m(m 1) . . . (m n + 2)cmn (z z0 )mn+1 .

Nella serie a secondo membro i termini sono continui rispetto a z e sono


ordinati per potenze successive di z z0 : il primo termine, quello con m =
n 1, ha potenza zero e quindi costante, il secondo lineare in z z0 ,
il terzo quadratico e cos via. Pertanto tutti meno il primo si annullano

2.10. IL TEOREMA DEI RESIDUI

267

in z = z0 . Quindi, passando al limite per z z0 , sopravvive solo il primo


termine e si ottiene
lim D (n1) (f (z)(z z0 )n ) = (n 1)!c1 ,

zz0

ossia lenunciato.

Teorema 2.10.5. (Teorema dei residui.) Sia f una funzione olomorfa in


un aperto O tranne al pi in un numero finito di singolarit isolate z1 , . . . , zn .
Sia r un percorso chiuso omotopo in O ad un punto (Definizione 2.4.1) che
non passa per alcuna di queste singolarit. Allora
Z

f (z) dz = 2i
r

n
X

Indr (zj ) Resz=zj f (z) .

(2.33)

j=1

In particolare, se r una curva semplice percorsa in senso antiorario, allora


Indr (zj ) = 1 per ogni punto di singolarit al suo interno e Indr (zj ) = 0
altrimenti (Nota 2.4.12), e quindi lidentit (2.33) diventa
Z
X
f (z) dz = 2i
Resz=zj f (z) .
(2.34)
r

zj interno a r

Dimostrazione. Sappiamo dalla Nota 1.29.33 che, se C la circonferenza di


raggio r e centro z0 , percorsa una volta in senso antiorario, allora

Z
0
se k 6= 1
k
.
(z z0 ) dz =
2i
se k = 1
C
Pi in generale, grazie al Teorema di invarianza omotopica 2.4.7, per ogni
percorso chiuso r si ha

Z
0
se k 6= 1
k
(z z0 ) dz =
.
(2.35)
2i Indr (z0 )
se k = 1
r
Infatti, se k > 0 lintegrale si annulla per il teorema di Cauchy (Corollario
2.4.10). Invece, se k < 0, ci sono da considerare due casi. Un caso che il
percorso r non contenga z0 al suo interno (quindi Indr (z0 ) = 0, si veda la Nota
2.4.12): allora r omotopo ad un punto, lintegrando olomorfo allinterno
del percorso e lintegrale si annulla per il teorema di invarianza omotopica.

268

CAPITOLO 2. ANALISI COMPLESSA

Laltro caso che il percorso r contenga il punto z0 al suo interno, cio gli giri
intorno: in tal caso r omotopo ad una circonferenza con centro z0 percorsa
un numero di volte pari a Indr (z0 ), e, di nuovo per il teorema di invarianza
omotopica, lintegrale in (2.35) ha il valore dellintegrale sulla circonferenza
percorsa una sola volta in senso antiorario moltiplicato per Indr (z0 ). Questo
dimostra le identit (2.35).
Sia ora fj la parte principale di f nello sviluppo di Laurent intorno a zj (la
terminologia quella del Teorema 2.9.3). In virt di questo teorema, fj
olomorfa in O \ {zj }. Invece f fj olomorfo in zj , perch coincide con
la parte regolare di f a zj . Si noti che f fj , sempre per il Teorema di
Laurent 2.9.3, olomorfa
P in O tranne che nei punti zm con m 6= j. Pertanto
la funzione g = f nj=1 fj olomorfa in tutto O. Poich r omotopa ad
un punto,
dal teorema di Cauchy (nella forma del Corollario 2.4.10) segue
R
che r g(z) dz = 0, ovvero
Z

f (z) dz =

n
X

fj (z) dz .

(2.36)

j=1

Con la notazione
2.9.3, scriviamo ciascuna parte principale fj
P del Teorema k
c
(z

z
)
, una serie uniformemente convergente in
come fj =
j
n=1 k
O \ {zj }. Ora, in ciascun addendo al secondo membro di (2.36) integriamo
termine a termine la corrispondente serie uniformemente convergente (Teorema 1.3.34) ed applichiamo a ciascun termine lidentit (2.35) per ottenere

(2.33) e completare quindi la dimostrazione.

2.11

Lindicatore logaritmico

Rammentiamo la notazione stabilita nel Teorema 2.6.1 e nella nella Denizione 2.9.5). Sia f una funzione non identicamente nulla che nel punto z0 non
ha singolarit oppure ha una singolarit isolata non essenziale (terminologia
come nel Teorema 2.7.3). Sia m il primo indice per cui ilPcoeciente dello
n
sviluppo di Laurent di f a z0 non nullo, ovvero f (z) =
n=m cn (z z0 )
con cm 6= 0. Scriviamo m = mf (z0 ) e diciamo che z0 uno zero di ordine (o
molteplicit) m di f se m > 0, ed un polo di ordine m se m < 0
In conseguenza del fatto che gli zeri di f non hanno punti di accumulazione
(Teorema 2.6.1), in ogni compatto mf (z0 ) nullo tranne al pi per un insieme
nito di punti z0 .

2.12. CALCOLO DI INTEGRALI

269

Teorema 2.11.1. (Indicatore logaritmico del numero di zeri e poli.)


Sia f una funzione olomorfa in un aperto O C tranne al pi per un numero
finito di poli. Sia C una curva chiusa contenuta in O percorsa in senso
positivo (ossia una curva di Jordan orientata positivamente, Nota 2.4.12),
omotopa ad un punto e che non passa per alcuno zero o polo di f . Allora
Z
Z
X
1
1
f (z)
d(log f )(z) =
dz =
IndC (z0 ) mf (z0 ) .
2i C
2i C f (z)
In particolare, se la curva semplice, allora per ogni punto nel suo interno
si ha IndC (z0 ) = 1 (si veda di nuovo la Nota 2.4.12), e quindi
1
2i

f (z)
dz = Nf + Pf
f (z)

dove Nf il numero di zeri e Pf il numero di poli di f allinterno della curva,


contati con la molteplicit.
Dimostrazione. Se f ha uno zero o un polo al punto z0 , allora in una sfera
aperta bucata B(z0 ) \ {z0 } centrata in z0 si ha f (z) = (z z0 )m g(z), con g
olomorfa a z0 ed ivi non nulla (m > 0 se si ha uno zero ovvero m < 0 se si
ha un polo). Perci in questa sfera bucata
f (z)
m (z z0 )m1 g(z) + (z z0 )m g (z)
m
g (z)
=
=
+
.
f (z)
(z z0 )m g(z)
z z0
g(z)
Poich g(z0 ) 6= 0, la funzione g (z)/g(z) olomorfa a z0 . Dalla precedente
identita segue che f /f ha un polo semplice con residuo m esattamente nei
punti in cui f ha uno zero di ordine m, e con residuo m esattamente dove f
ha un polo di ordine m. Pertanto lenunciato segue dal Teorema dei residui
2.10.5.

2.12

Calcolo di integrali con il teorema dei residui

Una parte degli esempi di questa Sezione ripresa dalleccellente esposizione


in [10]; altri da [1].

270

2.12.1

CAPITOLO 2. ANALISI COMPLESSA

Integrali di funzioni senza singolarit reali

Sia f : R 7 R una funzione meromorfa nel semipiano superiore (Denizione


2.2.4), con valori reali sullasse reale, e con sole singolarit polari (nessuna
singolarit essenziale tranne allinnito) ed in numero nito. Un tipico esempio si ottiene partendo da una funzione razionale reale, ossia il quoziente p/q
con p e q polinomi a coecienti reali: in tal caso scriviamo f (z) = p(z)/q(z)
lestensione olomorfa f : C 7 C al piano complesso (che, per inciso, unica,
in base al Corollario 2.6.2).
Supponiamo inoltre che f non abbia poli sullasse reale, e che
(2.37)

f (z) = o(1/|z|)
per |z| . Per funzioni razionali, la stima precedente equivale a
f (z) = O(1/|z|2)

(infatti questa condizione equivale a richiedere che i gradi dei polinomi p e p


verichino grado(q) > grado(p) + 2).
Grazie a (2.37),
R se Cr la circonferenza con centro, diciamo, lorigine e raggio
r, lintegrale Cr f (z) dz tende a zero per r , perch la circonferenza ha
lunghezza proporzionale a r mentre lintegrando maggiorato da un multiplo di 1/r 2 . Da questo fatto e dal Teorema dei residui 2.10.5 traiamo due
conseguenze:
Corollario 2.12.1. (i) Se z1 , . . . , zn sono i poli di f in C (cio, nel caso
f sia una funzione razionale, gli zeri semplici del denominatore, dopo
aver eliminato i fattori comuni col numeratore), si ha
n
X

Resz=zj f (z) = 0 .

j=1

(ii) Se z1+ , . . . , zk+ sono i poli di f nel semipiano superiore e z1 , . . . , zm


sono
quelli nel semipiano inferiore (naturalmente m = k se f razionale a
coefficienti reali), allora dallidentit precedente
k
X
j=1

Resz=zj+ f (z) =

m
X
j=1

Resz=zj f (z)

2.12. CALCOLO DI INTEGRALI

271

e dal Teorema dei residui 2.10.5


Z
Z r
k
X
f (x) dx = lim
f (x) dx = 2i
Resz=zj+ f (z)
r

j=1

= 2i

k
X

Resz=zj f (z) .

j=1

z+2

z+1

-r

r
z-1

z-2

Figura 2.1: Contorno per integrare una funzione meromorfa f (z) = o(1/|z|) senza poli
sullasse reale

Nota 2.12.2. Se la funzione razionale f reale, ossia quoziente di due polinomi a coecienti reali, i suoi poli, che sono gli zeri del denominatore non
compensati da zeri al numeratore, sono simmetrici rispetto allasse reale, perch il complesso coniugato di ogni radice di un polinomio reale ancora una
radice.

Esempio 2.12.3. Dal Teorema fondamentale del calcolo (1.1) sappiamo che
Z
1
dx = ,
2
1 + x

perch lintegrando la derivata della funzione arcotangente. Ricalcoliamo lintegrale applicando il teorema dei residui. Lestensione complessa
dellintegrando
1
f (z) =
i + z2

272

CAPITOLO 2. ANALISI COMPLESSA

ed ha poli nei punti z = i. Il residuo al polo nel semipiano superiore si


calcola come nella Nota 2.10.3:
1
1
1
1
= Resz=i
= .
Resz=i f (z) = Resz=i
(z + i)(z i)
2i
zi
2i
Pertanto, dal Corollario 2.12.1 (ii),
Z

1
dx = .
1 + x2

Esempio 2.12.4. Calcoliamo lintegrale


Z
1+x
dx .
2
2
(1 + x )(4 + x )

In questo caso i poli sono i punti z = i, 2i. Calcoliamo, ancora come nella
Nota 2.10.3, i residui ai poli nel semipiano superiore.
Si ottiene
Resz=i f (z) =

1+i
1
1i
Resz=i
=
2
(2i)(4 + i )
zi
6

1+2i
2i
. Analogamente, Resz=2i f (z) = (4i)(1+4i
2 ) = 12 . Ne segue:


Z

1i 2i
1+x
= .
dx = 2i

2
2
6
12
6
(1 + x )(4 + x )

2.12.2

Integrali di funzioni con poli semplici reali

Nota 2.12.5. Premettiamo anzitutto, estendendo lEsempio 1.29.33 e la Nota


2.3.3, che, se C una semicirconferenza con centro in 0 e raggio r > 0 percorsa
R
in senso antiorario, ad esempio con estremi sullasse reale, si ha C dz
=
z
R itreit
dt = i. Identico risultato si ottiene se langolo di percorrenza del
0 reit
mezzo giro varia da a + . Se il verso di percorrenza orario il risultato
cambia di segno. Risultati identici si ottengono se la circonferenza centrata
in un altro punto z0 . In ogni caso il risultato non dipende dal raggio r > 0
della semicirconferenza.

2.12. CALCOLO DI INTEGRALI

273

2i

Figura 2.2: Contorno per integrare

1+x
(1+x2 )(4+x2 )

Consideriamo ora il caso in cui, in aggiunta a poli nel semipiano superiore ed inferiore, la funzione meromorfa f della precedente Sottosezione 2.12.1
abbia anche qualche polo semplice sullasse reale, diciamo x1 , . . . , xm . Mostriamo che il Teorema dei residui 2.10.5 ci permette di calcolare lintegrale
Z x1 Z x2
Z xm Z 
I lim+
+
++
+
f (x) dx
(2.38)
0

x1 +

xm1 +

xm +

purch f (z) = O (1/|z|2 ) per |z| (ossia se il polinomio al denominatore


ha grado superiore di almeno 2 rispetto a quello al numeratore). Pi in generale, tutti i risultati di questa sottosezione valgono per funzioni f meromorfe
nel semipiano superiore (Denizione 2.2.4) che tendono a zero per |z|
pi velocemente di 1/|z|.
Rammentiamo che si dice che lintegrale in (2.38), calcolato omettendo
intervalli centrati nei punti di singolarit e poi facendo tendere a zero il
diametro di questi intervalli, calcolato nel senso del valore
R principale di
Cauchy, introdotto nellEsempio 11.5.5, e lo si scrive v. p. f (x) dx.

274

CAPITOLO 2. ANALISI COMPLESSA

Nota 2.12.6. Nella situazione in cui lintegrando ha singolarit reali che non
sono poli semplici, lintegrale pu non convergere: ad esempio, se lintegrando
ha singolarit di ordine quadratico, o di ordine pari pi elevato, in un intorno
reale del punto di singolarit lintegrando di segno costante, ed in ciascuno
dei due semi-intorni destro e sinistro non ha integrale nito (Sezione 1.1. In
tale situazione, lintegrale improprio non si pu calcolare con i metodi di
questa Sezione.

Calcoliamo lintegrale utilizzando il percorso di integrazione Cr, illustrato


in Figura 2.3.

2i

-1

-r

Figura 2.3: Contorno per integrare una funzione meromorfa f (z) = o(1/|z|) con poli
reali

Consideriamo il polo x1 . In un intorno di x1 lo sviluppo di Laurent di r


f (z) =

Res f (z)z=x1
+ h(z)
z x1

2.12. CALCOLO DI INTEGRALI

275

con h olomorfa in tale intorno. Sia > 0 sucientemente piccolo anch


la semicirconferenza C1, nel semipiano superiore di centro x1 e raggio
(ossia quella che fa parte del percorso in Figura 2.3) giaccia nel suddetto
intorno.
Sia M il massimo di |h| su C1 . chiaro che vale la disuguaglianza
R


C1 h(z) dz 6 M, ed il secondo membro tende a zero per 0+ . Invece,
per quanto concerne laltro termine dello sviluppo di Laurent (2.12.2), segue
dalla Nota 2.12.5 che
Z

C1

1
dz = i Resz=x1 f (z)
z x1

(2.39)

(il segno negativo perch la semicirconferenza percorsa in senso orario.


Quindi, per 0+ , il contributo allintegrale curvilineo dato dalla semicirconferenza di raggio con centro in x1 tende a i Resz=x1 f (z). Vale un
risultato analogo per ogni polo reale.
Osserviamo ora che il contributo allintegrale curvilineo dato dalla semicirconferenza di raggio r tende a zero quando r perch lintegrando tende
a zero pi velocemente di 1r . Quindi dal Teorema dei residui 2.10.5 possiamo
concludere che
v. p.

f (x) dx +

m
X
l=1

lim

0+

f (z) dz =
Cl,

lim

r,0+

= 2i

k
X

f (z) dz

Cr,

Resz=zj+ f (z) ,

j=1

da cui, grazie a (2.39) ed i commenti subito oltre,


I v. p.

f (x) dx = 2i

k
X

Resz=zj+ f (z) + i

j=1

m
X

Resz=xl f (z) . (2.40)

l=1

Il calcolo analogo sul percorso simmetrico nel semipiano inferiore (percorso


in senso orario) fornisce il seguente risultato:
vp

f (x) dx = 2i

k
X
j=1

Resz=z f (z) i
j

m
X
l=1

Resz=xl f (z) .

276

2.12.3

CAPITOLO 2. ANALISI COMPLESSA

Trasformate di Fourier di funzioni limitate allinfinito

Definizione 2.12.7. Sia E un sottoinsieme di C. Diciamo che una funzione


f : E 7 C limitata allinfinito (ovvero asintoticamente) da una funzione
g : E 7 C se esiste un compatto al di fuori del quale |f | < C|g| per qualche
costante C > 0.
I risultati
sottosezione precedente si estendono al calcolo dellintegraR dellaix
le v. p. f (x) e dx dove f una funzione meromorfa limitata allinnito
da 1/r nel semipiano superiore (o inferiore), e 6= 0 un numero reale.
Si noti che questo integrale esattamente la trasformata di Fourier di f al
punto (calcolato nel senso del valore principale (Esempio 11.5.5) se f ha
singolarit polari semplici sullasse reale).
Per svolgere il calcolo, consideriamo, ad esempio, il caso > 0. Allora
|eiz | = e Im z tende a zero in maniera monotna quando r se z =
rei nel semipiano superiore. Sia r sucientemente grande anch la
semicirconferenza Cr di centro lorigine e raggio r sia al di fuori del compatto
K della Denizione 2.12.7, e sia |f (z)| < C/r al di fuori di K. Poich |eiz | =
e Im z e se z = rei si ha Im z = r sin , lintegrale sulla semicirconferenza si
stima nel modo seguente:

Z
Z
Z Z




C
iz
r sin i


f (z) e dz 6 M
e
re d = r
er sin d .

r
0
Cr
Cr 0
(2.41)
Per r lultimo membro tende a zero per il Teorema di convergenza
monotna di Lebesgue (Teorema 1.9.53), perch lintegrando, per r ,
tende in maniera monotna alla funzione h() che vale 0 in (0, ) e 1 in
= 0, . In alternativa si pu applicare anche il teorema di convergenza
dominata (Teorema 1.9.54), perch al variare di r lintegrando limitato,
uniformemente rispetto a r, dalla funzione costantemente 1 nellintervallo
[0, ].
Il lettore che non fosse familiare con i suddetti teoremi di convergenza per
lintegrale di Lebesgue pu arrivare allo stesso risultato con metodi pi elementari come segue. Osserviamo che, per r , lintegrando er sin
converge puntualmente in [0, ] alla funzione h scritta pi sopra, ma non
uniformemente, perch h non continua negli estremi 0 e . Per la convergenza uniforme nel sottointervallo [, ] per ogni > 0, e quindi,
passando al limite sotto il segno di integrale (Teorema 1.3.17), si ottiene

2.12. CALCOLO DI INTEGRALI

277

R
R
limr er sin d = 0. Daltra parte, 0 er sin d 6 , perch lintegrando
limitato dalla costante 1,R e lo stesso risultato vale per lintegrale
R r sin

e
d. Pertanto limr Cr er sin d < 2, e, poich > 0

arbitrario, prendendo lestremo inferiore rispetto a vediamo che il limite


vale 0.
Ovviamente il residuo di f (z)eiz al polo xj vale eixj Resz=xj f (z) (Nota
2.10.2). Pertanto, dal Teorema dei residui 2.10.5, ora segue che
v. p.

ix

f (x) e

dx = 2i

k
X
j=1

Resz=z + f (z) i
j

m
X

Resz=xl f (z) .

l=1

Possiamo svolgere un calcolo del tutto analogo se < 0 e f limitata


allinnito da 1/r nel semipiano inferiore, integrando su un percorso nel
semipiano inferiore ottenuto ribaltando rispetto allasse delle ascisse quello
appena considerato. In tal modo si ottiene:
v. p.

2.12.4

f (x) eix dx = 2i

k
X
j=1

Resz=zj f (z) + i

m
X

Resz=xl f (z) .

l=1

La trasformata di Fourier della funzione sinc

NellEsercizio 10.1.5 abbiamo calcolato la trasformata di Fourier di una funzione caratteristica: in particolare, segue immediatamente da questo Esercizio e dalla propriet di dilatazione della trasformata di Fourier (Teorema 8.2.4 (iv)) che la trasformata di Fourier di [ 1 , 1 ] la funzione
2 2

sinc = sin introdotta nella Denizione 10.1.4. Non abbiamo calcolato


direttamente la trasformata di Fourier della funzione sinc, perch essa non
appartiene a L1 (R): per appartiene a L2 (R), e quindi possiamo denire la
trasformata di Fourier nel senso di L2 (R) (Nota 8.5.3), o pi in generale nel
senso delle distribuzioni. Grazie al Teorema di inversione per la trasformata
di Fourier per distribuzioni (Proposizione 11.11.4), o anche semplicemente
per L2 (R) (Corollario 8.5.6), possiamo quindi concludere che la trasformata
di Fourier di sin(x)/x la (classe di equivalenza L2 della) funzione caratteristica [ , ] , ossia coincide con questa funzione quasi ovunque (e quindi vi
2 2
coincide nel senso delle distribuzioni date da funzioni localmente integrabili
a crescita polinomiale (Esempio 11.5.4 (i)). In particolare, la trasformata
di Fourier cambia solo a meno di equivalenza (sia nel senso di L2 (R) sia nel

278

CAPITOLO 2. ANALISI COMPLESSA

senso delle distribuzioni) se modichiamo il suo valore ai punti 1. Per analogia con la funzione somma della serie di Fourier della funzione caratteristica
(Teorema 5.15.1 (i)), vogliamo porre il valore della trasformata di Fourier a
questi due punti uguale a 2 , ovvero, se troviamo un modo diretto di calcolarla, ci piacerebbe che questo risultasse essere il valore ai due suddetti punti
estremi dellimmagine.
In eetti, questo approccio indiretto: preferiremmo essere in grado di
calcolare direttamente lintegrale di Fourier. Poich lintegrando non in L1 ,
il calcolo diretto richiede di troncare lintegrale su compatti via via pi grandi
e poi passare al limite al crescere del compatto. Purtroppo, per, non si riesce
a svolgere il calcolo dellintegrale troncato su un compatto: lintegrando non
una funzione elementare e non sappiamo calcolare i suoi valori sugli estremi
di un intervallo, nonostante il fattoR che siamo stati in grado, con tecniche pi

ranate, di calcolare lintegrale sinx x dx su tutto R (pi precisamente


sulla semiretta positiva (Lemma 5.19.3, ma per parit lintegrale su tutta la
retta il doppio di questo).
Siamo quindi soddisfatti nello scoprire che possiamo calcolare direttamente
la trasformata di Fourier grazie al teorema dei residui, come ora illustriamo.
Vogliamo calcolare il limite
Z r
sin x isx
e dx .
lim
R+ r
x
Da quanto visto prima, sappiamo che il risultato deve essere uguale alla
costante in (1, 1) e 0 al di fuori di [1, 1] (perch nella denizione di
trasformata di Fourier abbiamo messo allesponente dellesponenziale un fattore di scala 2, quindi ora dobbiamo prendere s = 2). Auspichiamo che
il risultato sia 2 ai punti estremi dellimmagine, 1. Mostriamo che questo
risultato segue dal teorema dei residui.
Osserviamo che la funzione sinz z eisz non ha una singolarit in z = 0, quindi, in base al teorema di Cauchy (Corollario 2.4.10), lintegrale sul segmento
dellasse reale da r a r coincide con lintegrale sul segmento reale da r a
1, seguito dallintegrale sulla semicirconferenza con centro lorigine e raggio
1 nel semipiano superiore, seguito a sua volta dallintegrale sul segmento reale
da 1 a r: chiamiamo C questo percorso che include la semicirconferenza (con
iz
iz
verso di percorrenza da sinistra a destra). Ora, se scriviamo sin z = e e
2i
e
Z isz
e
r (s) =
dz ,
C z

2.12. CALCOLO DI INTEGRALI

279

vediamo che
Z

1
sin x isx
e dx = (r (s + 1) r (s 1)) .
x
2i

(2.42)

Consideriamo il percorso chiuso Cr+ ottenuto chiudendo C con la semicirconferenza nel semipiano superiore con centro lorigine e raggio r, percorsa in
itz
senso antiorario. Allinterno di questo percorso la funzione e z olomorfa
nella variabile z per ogni t reale, e quindi il Teorema dei residui 2.10.5 asserisce che il suo integrale su questo percorso zero, ovvero che r (t) lopposto
dellintegrale sulla semicirconferenza (percorsa in senso antiorario). Tenendo
conto che sulla semicirconferenza si ha dz = irei d = iz d, troviamo
Z
i
r (t) = i
eitre d .
0

Osserviamo, in particolare, che si ha


r (0) = i .

(2.43)

Daltra parte, poich per ogni s R la funzione eitz vale 1 in z = 0, la


itz
funzione e z ha un polo semplice in z = 0 con residuo 1. Pertanto, se ora
consideriamo il percorso Cr ottenuto chiudendo C con la semicirconferenza
nel semipiano inferiore ribaltata rispetto a quella di prima, adesso dentro
itz
questo percorso c un polo semplice di e z , e lo stesso ragionamento di
prima ora porta allidentit
Z 0
i
r (t) = 2i + i
eirte d .

In questi due integrali, il modulo dellintegrando vale ert sin : poich sin
positivo per 0 < < (ossia nel semipiano superiore Im z > 0) e negativo
in quello inferiore, questo modulo tende a zero in maniera monotna nel
dominio 0 < < (ossia per z nel semipiano superiore) allorch t > 0, e
nel dominio < < 0 (ossia per z nel semipiano inferiore) allorch t < 0.
Pertanto dal Teorema di Convergenza Monotna 1.9.53 abbiamo
lim r (t) = 2i

se t < 0

lim r (t) = 0

se t > 0 .

r
r

(2.44)

280

CAPITOLO 2. ANALISI COMPLESSA

Osserviamo inne che, se |s| > 1, allora s + 1 e s 1 hanno lo stesso segno


(entrambi positivi o entrambi negativi), mentre se |s| < 1, allora s + 1 e s 1
hanno segni opposti (il primo positivo ed il secondo negativo). Da questo
fatto e da (2.42) segue
lim

lim

Zrr

sin x isx
e dx =
x
sin x isx
e dx = 0
x

se |s| < 1
se |s| > 1 .

Rr
Abbiamo cos vericato lidentit limr r sinx x eisx dx = [1,1] per tutti
i valori reali di s eccetto s = 1. Daltra parte, se s = 1 allora s 1 = 0 e
s + 1 = 2, e se s = 1 allora s 1 = 2 e s + 1 = 0. Nel primo caso segue da
(2.43) che r (s1) = r (0) = i, e da (2.44) che limr r (s+1) = 0. Nel
secondo caso invece abbiamo limr r (s 1) = 2i,
R r e r (s + 1) = r (0) =
i. Pertanto segue ancora da (2.42) che limr r sinx x eix dx = 2 . Questo conclude il calcolo diretto della trasformata di Fourier della funzione
sinc, ed indica che il risultato esattamente quanto volevamo, anche ai punti
estremi dellimmagine.

2.12.5

Integrali di espressioni trigonometriche razionali

In questa sottosezione integriamo funzioni razionali in sin t e cos t. Questi


integrali si calcolano tutti come nellesempio seguente.
1
Esempio 2.12.8. Sia a R e f (t) = a cos
. La funzione f periodica di
t
periodo 2: limitiamo lattenzione allintervallo [, ]. Se a = 1, il denominatore ha uno zero di ordine due. Pi precisamente, per a = 1 il
denominatore si annulla in t = 0 ed il suo sviluppo di Taylor comincia con
il termine quadratico 21 t2 , mentre per a = 1 il denominatore si annulla in
t = ed il suo sviluppo di Taylor in questi punti comincia rispettivamente
con il termine f rac12(t ()2 . In base alle caratteristiche di convergenza
degli integrali impropri (Sezione 1.1) concludiamo che la funzione f non
integrabile sul suo periodo se |a| = 1.
Se |a| < 1, la funzione ha due punti di singolarit nel periodo: i punti in
cui cos t = a, che nel caso a = 0 sono in realt tre (pi, 0 e ), ma il primo
e lultimo si possono considerare identicati per periodicit. Poich in questi
punti di singolarit la derivata prima della funzione coseno non nulla, il

2.12. CALCOLO DI INTEGRALI

281

denominatore ha uno zero di ordine uno, e di nuovo la funzione f non integrabile in senso improprio; per questa volta integrabile nel senso del valore
principale di Cauchy (Esempio 11.5.5): lasciamo come esercizio al lettore il
calcolo dellintegrale in analogia al procedimento che stiamo per sviluppare
per il caso |a| > 1 adattato seguendo la linea della Sottosezione 2.12.2.
Trattiamo qui il caso pi facile, quello senza singolarit reali: |a| > 1. Sia
z = eit un numero complesso di modulo 1: allora
cos t =
Quindi

 e2it + 1
1 it
z2 + 1
e + eit =
=
.
2
2eit
2z

1
dt =
a + cos t

|z|=1

z2

1
dz .
+ 2az + 1

Lintegrando ha due

poli semplici in C, entrambi reali: i punti z = a


2
a 1. Poich a2 1 < |a|, se a > 1 z+ sta nel disco unitario e z no,
mentre se a < 1 capita il viceversa. In base alla Nota 2.10.2, il residuo a
z
1
z zpm
=
.
lim
zz z 2 + 2az + 1
z+ z

Pertanto, dal Teorema dei residui 2.10.5 segue


R
1
Se a > 1,
dt = z+4
= a2
2 1
a+cos t
z
R
1
dt = z4
= a2
Se a < 1,
2 1
z+
a+cos t

Pi in generale, supponiamo di voler integrare una funzione f periodica


di periodo, diciamo, 2, senza singolarit in tutto il periodo, avente unestensione meromorfa alla striscia S Re |z| 6 , Im z > 0 (che indichiamo
ancora con f ) senza singolarit essenziali e tale che esiste il limite uniforme limIm z+ f (z) ed costante indipendentemente dalla parte reale di z
(indichiamo con l il valore del limite). Supponiamo inoltre che f non abbia
punti di singolarit sulle semirette Re z = . Rammentiamo che le singolarit non essenziali non possono avere punti di accumulazione (Lemma
2.7.2 e Teorema 2.7.3). Poich il limite limIm z+ f (z) nito, tutti i punti
di singolarit debbono giacere in un sottoinsieme limitato della striscia S,

282

CAPITOLO 2. ANALISI COMPLESSA

quindi in un compatto. Dalla propriet di BolzanoWeierstrass (Teorema


1.9.6) segue che i punti di singolarit dentro la striscia S, che denotiamo con
x1 , . . . , xn , sono in numero nito. Allora lintegrale si pu calcolare con il
Teorema dei residui 2.10.5 come segue:
Proposizione 2.12.9. Nelle ipotesi appena enunciate,
Z

f (t) dt = 2 l + i

n
X
i=1

Resz=xi f (z)

Dimostrazione. Consideriamo il percorso di integrazione dato dal rettangolo


R i cui lati verticali sono Re z = , 0 6 Im z 6 a, ed i lati orizzontali sono
6 Re z 6 , Im z = 0 oppure Im z = a, percorso in senso antiorario. Per
periodicit, la funzione f assume gli stessi valori sui punti alla stessa ordinata
dei lati verticali. Poich questi lati sono percorsi in versi opposti (dallalto al
basso quello di sinistra, dal basso allalto quello di destra) i loro contributi si
eliminano a vicenda.R Sul lato inferiore lintegrale della funzione f lintegrale

sul segmento reale f (t) dt. Se si fa tendere a a +, lintegrale sul lato


superiore, a causa della condizione limIm z+ f (z) = l uniformente e del
Teorema di passaggio al limite uniforme sotto il segno di integrale 1.3.17),
tende a 2l (il segno negativo dovuto al verso di percorrenza da sinistra
a destra). Da queste osservazioni si ricava lenunciato.

2.12.6

Esercizi ed esempi sul calcolo di integrali con i


residui

Il lettore che non riuscisse a risolvere i seguenti esercizi pu trovarne lo


svolgimento in [10].
Esercizio 2.12.10. Sia f una funzione olomorfa con singolarit polari (quindi
isolate, come osservato prima della Proposizione 2.12.9) solo nel semiasse
reale negativo, ed in numero nito, diciamo m. Osserviamo che allora la
funzione f (ez ) periodica di periodo 2 nella direzione immaginaria, ed a
meno di tale periodicit ha poli z1 , . . . , zm tutti con parte immaginaria
(perch ez un numero reale negativo se e solo se Im z = + 2k con k Z.
Supponiamo inne che
f (z) = O(1/|z|) .
(2.45)

2.12. CALCOLO DI INTEGRALI

283

Mostrare che, se 0 < < 1, si ha


Z
m
2i X
x
x
Resz=zi (ez f (ez )) .
e f (e ) dx =
2i
1

i=1
Suggerimento: scelto a reale, si integri sul contorno rettangolare di ascissa fra
a e a e di ordinata fra 0 e 2. Per a sucientemente grande, questo contorno
gira intorno a tutte
Si mostri che, grazie alla condizione (2.45)
le singolarit.

ed al fatto che e(aiy) = ea = o(ea ) (perch < 1), i contributi dei due
segmenti verticali tendono a zero quando a tende a innito. A questo punto
basta osservare che il contributo sul segmento orizzontale alto (il quale
pertcorso da destra a sinistra) ha il segno opposto di quello sul tratto verticale
basso (che lintegrale che si vuol calcolare) moltiplicato per il fattore e2i
(perch il fattore esponenziale sul tratto superiore il prodotto di questo
fattore per lesponenziale sul tratto inferiore).

Esercizio 2.12.11. Utilizzando lapproccio del precedente Esercizio 2.12.10, si


mostri che
Z x

e
dx =
.
x
sin()
1 + e

Esempio 2.12.12. Sia f una funzione meromorfa con un numero nito di


poli semplici z1 , . . . , zn , ma senza poli sul semiasse reale positivo (inclusa
lorigine), e che decresce allinnito nel modo seguente:
 
1
.
(2.46)
f (z) = O
|z|
Un tipico esempio il caso di una funzione razionale f in cui il polinomio
al denominatore abbia grado maggiore o uguale del polinomio al numeratore pi 1. Se il grado del denominatore
R eccede di esattamente 1 quello del
denominatore, lintegrale improprio 0 f (t) dt non converge (Sezione 1.1).
Quindi consideriamo invece lintegrale
Z
f (t)
dt
t
0
dove 0 < < 1 (dal caso particolare di funzioni razionali stiamo siamo
quindi passati a considerare allintegrando una funzione razionale quoziente

284

CAPITOLO 2. ANALISI COMPLESSA

di espressioni a crescita polinomiale non necessariamente di grado intero,


ma con grado del denominatore superiore di pi di 1 rispetto a quello del
denominatore). Ora lintegrale converge (si veda di nuovo la Sezione 1.1).
Per applicare il Teorema dei residui 2.10.5 dobbiamo considerare lestensione dellintegrando ad una funzione meromorfa su C. Qui il problema che
x = e log x una funzione denita sui reali positivi che non si estende ad
una funzione meromorfa su tutto C ma solo su parte del piano complesso, e
non in modo unico. La seguente Nota un inciso per spiegare perch.
Nota 2.12.13. (Il logaritmo complesso.) Incontriamo un problema nellestensione al piano complesso della funzione logaritmo. Sappiamo denire il
logaritmo di un numero reale positivo. Allora, se z complesso, scriviamo
z = |z|ei e, per rispettare la propriet che il logaritmo manda prodotti in
somme, dobbiamo denire il logaritmo complesso come
log z = log |z| + i ,
dove log |z| il consueto logaritmo reale. Naturalmente, il logaritmo complesso deve avere una singolarit nellorigine, perch questo gi accade al
logaritmo reale. Qui supponiamo 0 6 < 2; se varia al di fuori dellintervallo [0, 2), ad esempio se consideriamo = + 2k, si ottiene lo

stesso numero complesso z = |z|ei = |z|ei , ma non lo stesso logaritmo: se

z = |z|ei abbiamo
log z = log |z| + i = log |z| + i + 2ki .
Quindi il logaritmo complesso in realt una funzione a pi valori, inniti
valori che dieriscono ciascuno dal precedente di 2i:
log z = log |z| + i + 2iZ .
Per la denizione di funzione richiede che il valore sia unico. Quindi dobbiamo limitare la variazione dellangolo ad un intervallo ssato di lunghezza
2, ad esempio, come prima, lintervallo [0, 2) (questa si chiama la determinazione principale del logaritmo complesso). Purtroppo, per, ci d luogo
ad una discontinuit: se ora z un numero reale positivo e consideriamo
due altri numeri complessi che lo approssimano, z+ = z + i nel semipiano
superiore (Im z+ = > 0) e z = z i nel semipiano inferiore, allora abbiamo z+ = zei e z = zei = zei(2 , dove adesso gli angoli e 2

2.12. CALCOLO DI INTEGRALI

285

appartengono entrambi allintervallo [0, 2) della determinazione canonica.


Se ora tende a zero, anche tende a zero e si ottiene:
lim z+ = z
lim z = z

e
ma

lim log z+ = log z


lim log z = log z + 2

Pertanto la restrizione a C \ {0} del logaritmo complesso data dalla determinazione principale discontinua sul semiasse reale z > 0. Il problema non si risolve scegliendo altre determinazioni: se ad esempio si prende
6 < + 2, lo stesso calcolo mostra che si ottiene una discontinuit
sulla semiretta uscente dallorigine ad angolo . Pertanto, per avere una
funzione meromorfa, dobbiamo limitare lattenzione ad un sottoinsieme del
piano complesso, scartando una semiretta uscente dallorigine (o, come si
dice, introducendo un taglio). Per la determinazione principale, si limita
lattenzione al piano tagliato C \ {R+ {0}} = C \ {z R, z > 0}.

R
Allora, ritornando allintegrale 0 ft(t)
dt, estendiamo lintegrando alla funzione meromorfa sul piano tagliato f (z)/z ottenuta a partire dalla determinazione principale del logaritmo complesso: z = e log z .
Consideriamo il percorso di integrazione illustrato nella Figura 2.4, contenuto nel piano tagliato, che consiste di due archi di circonferenza, rispettivamente Cr e CR , con raggi r < R, centrate allorigine, unite da due segmenti
orizzontali paralleli al taglio, S+ e S . Faremo tendere i due segmenti al
segmento reale [r, R], ma dai due lati opposti del taglio, e poi faremo tendere
r a zero, R ad innito. Grazie allipotesi che non ci siano poli di f sui reali
positivi o nullo, in tal modo il percorso di integrazione invade una regione
che contiene tutti i poli di f .
Quando facciamo
i due segmenti S+ e S al segmento reale, lintegrale
R Rtendere
f (t)
su S+ tende a r t dt. Invece, per quanto riguarda S , osserviamo che
largomento della variabile z tende a 2, e quindi
z = e log z e2i |z| .
(2.47)
RR
Quindi lintegrale su S tende a e2i r ft(t)
dt.
Ora facciamo tendere rispettivamente a zero e ad innito i raggi interno ed
esterno. Vicino allorigine lintegrando O(|z| ) e quindi lintegrale su Cr
tende a zero con r, perch la lunghezza dellarco proporzionale al raggio r.
Allinnito, lintegrando f (z)/z o(1/|z|) perch f (z) = O(1/|z|), quindi

286

CAPITOLO 2. ANALISI COMPLESSA

x1

x2
x3

x4

Figura 2.4: Contorno per integrare una funzione f (z)/z con f (z) = O(1/|z|) senza poli
reali positivi

anche lintegrale su CR tende a zero per R +, per la stessa ragione di


prima.
Pertanto, quando percorriamo il ciclo in senso antiorario, applicando ad
esso il Teorema dei residui 2.10.5, e poi passiamo al limite come spiegato
sopra, otteniamo


Z
n
X
f (t)
2i
f (z)
dt =
Resz=zi
(2.48)
t
1 e2i i=1
z
0


n
X
2i
f (z)

=
zi Resz=zi
.
1 e2i i=1
z
Esercizio 2.12.14. Mostrare che, per 0 < < 1, si ha
Z

1
dt =

t (1 + t)
sin()
0

2.12. CALCOLO DI INTEGRALI

287

nei due modi seguenti:


applicando il risultato del precedente Esempio 2.12.12 (si usi il percorso
in Figura 2.5);

r
-1

Figura 2.5: Contorno per integrare una funzione f (z)/z con f (z) = O(1/|z|) senza poli
reali positivi

riducendo lintegrale a

e(1)x
dx
1 + ex

mediante la sostituzione t = ex , ed applicando il risultato dellEsercizio


2.12.11 (qui occorre osservare che sin() = sin((1 )), grazie alle
formule di addizione della funzione seno.

288

CAPITOLO 2. ANALISI COMPLESSA

Esempio 2.12.15. Modichiamo il precedente Esempio 2.12.12


  considerando
1
ora funzioni f meromorfe decrescenti allinnito come O |z|
e con un numero nito di singolarit polari, consistenti di un numero nito di poli semplici
z1 , . . . , zn fuori del semiasse reale positivo e di un numero nito di poli semplici x1 , . . . , xm sul semiasse reale positivo (ma non nellorigine). Assumiamo
che sul semiasse reale positivo le uniche singolarit siano poli semplici. Sia
0 < < 1. La presenza di poli semplici sul percorso di integrazione (0, +)
R
rende ora non convergente lintegrale 0 ft(t)
dt, perch lintegrando ha singolarit dellordine di 1/x (pi precisamente, 1/(x xj ), j = 1, . . . , m): si
veda la convergenza di integrali impropri nella Sezione 1.1. Per possiamo
calcolare questo integrale nel senso del valore principale denito nellEsempio
11.5.5.
Usiamo ora il percorso della Figura 2.6.

z1

x1

x2

z2
z3

Figura 2.6: Contorno per integrare una funzione f (z)/z con f (z) = O(1/|z|) senza poli
reali positivi

Calcoliamo lintegrale su questo percorso come nellEsempio 2.12.12, otte-

2.12. CALCOLO DI INTEGRALI

289

nendo come risultato 2i per la somma dei residui dei poli semplici interni
(che sono tutti i poli non reali positivi z1 , . . . , zn se il raggio r delle circonferenze interne abbastanza piccolo ed il raggio R della circonferenza esterna
abbastanza grande. Poi passiamo al limite facendo tendere i tratti orizzontali ai corrispondenti segmenti reali, ed inne facendo tendere r a 0 e R ad
innito. Lintero calcolo rimane come svolto nel suddetto Esempio, tranne
per il fatto che ora abbiamo i contributi aggiuntivi delle semicirconferenze superiori ed inferiori attorno ai poli reali xj , j = 1, . . . , m. Scriviamo
cj = Res (z f (z))z=xj . Al polo semplice xj lintegrando non sviluppabile
secondo Laurent perch il fattore z (nella sua determinazione principale
data da quella del logaritmo in z = e log z , che abbiamo scelto come canonica nella Nota 2.12.13) non meromorfo sul semiasse reale positivo; per
possiamo calcolare gli sviluppi di Laurent a xj nel semipiano superiore ed in
quello inferiore, rispettivamente. Nel semipiano superiore, ossia se Im z > 0,
il fattore z analitico, e quindi verica z = xj + O(|z xj |) (sviluppo
di Taylor); nel semipiano inferiore succede la stessa cosa, ma il valore al punto
xj (che sul taglio della determinazione canonica di z = e log z ) ora non
xj come prima, bens xj e2i , esattamente come abbiamo calcolato in
(2.47). Invece lo sviluppo di Laurent della funzione f (olomorfa in un disco
bucato (ovvero privato del centro) intorno a xj ) lo stesso da entrambi i lati:
1
f (z) = Res f (z)z=xj zx
+ O(1). Quindi i valori dellintegrando sulla semij
1
+ O(1),
circonferenza superiore sono del tipo f (z) = xj Res f (z)z=xj zx
j
1
+ O(1).
mentre su quella inferiore sono f (z) = e2i xj Res f (z)z=xj zx
j
I termini del tipo O(1) sono limitati, e quindi i loro contributi allintegrale
1
tendono a zero con il raggio delle semicirconferenze. Invece lintegrale di zx
j
sulle due semicircenferenze di centro xj (che, rammentiamo, sono percorse in
senso orario) vale su entrambe i (lo abbiamo calcolato direttamente varie
volte, ad esempio in (2.39)).
In conclusione, quando r 0+ i contributi allintegrale dati dai poli sul
semiasse reale positivo tendono a
2i

i 1 + e

m
X

xj Res f (z)z=xj .

j=1

Dobbiamo inserire questo nuovo contributo nel risultato gi ricavato nellEsempio 2.12.12.

290

CAPITOLO 2. ANALISI COMPLESSA

Osserviamo che, in seguito al legame fra seno e coseno ed esponenziale


complesso (Sezione 1.1) vale lidentit
ei + ei
1 + e2i
=
1 + e2i
ei ei
2 cos()
=
= i cot() ,
2i sin()
Da questa identit e dalluguaglianza (2.48) si ricava inne


Z
n
X
2i
f (z)
f (t)

zi Resz=zi
dt =
v. p.
t
1 e2i i=1
z
0
+ cot()

m
X

(2.49)

xj Res f (z)z=xj .

j=1

Esercizio 2.12.16. Si usi il risultato espresso nellidentit (2.49) del precedente


Esempio 2.12.15 per mostrare che per 0 < < 1 si ha
Z
1
v. p.
dt = cot() .

t (1 t)
0
Suggerimento: lunico polo semplice e si trova a z = 1. Il percorso di
integrazione del precedente Esempio ora quello illustrato in Figura 2.7,
percorso in senso antiorario; si noti che gli archi di semicirconferenza interni
(quelli con centro nel polo z = 1) sono percorsi in senso antiorario.

Esempio 2.12.17. Consideriamo inne funzioni f meromorfe nel semipiano superiore, con un numero nito 
di singolarit
tutte fuori dellasse rea
1
le, e decrescenti allinnito come o |z| (ad esempio, nel caso frequente
in cui f una funzione razionale, il grado del denominatore deve essere
maggiore almeno
di due unit rispetto a quello del numeratore, e quindi

1
f (z) = O |z| ).
Vogliamo calcolare lintegrale
Z
f (x) log x dx .
0

2.12. CALCOLO DI INTEGRALI

291

r
R

Figura 2.7: Contorno per integrare

1
x (1x)

A questo ne conveniente integrare su tutto lasse reale, assumendo in aggiunta che f sia pari sullasse reale, ovvero che f (x) = f (x) per ogni x
reale. Per calcolare lintegrale consideriamo lestensione complessa del logaritmo con determinazione data, ad esempio, dallargomento di z compreso
fra 2 e 3
, ovvero con taglio sul semiasse immaginario negativo, e corri2
spondentemente applichiamo il Teorema dei residui 2.10.5 ad un percorso che
non interseca il taglio, come ad esempio quello in Figura 2.8.
Osserviamo che lintegrando f (x) log x ha una singolarit nellorigine solo a
causa del logaritmo, poich invece f continua nellorigine. Allora la sulla semicirconferenza di raggio lintegrando diverge come | log |, ma la lunghezza
del percorso di integrazione proporzionale a . Poich lim0+ log = 0
(Sezione 1.1), il limite per 0+ del contributo allintegrale dato dalla semicirconferenza piccola nullo. Analogamente, sulla circonferenza grande
lintegrando innitesimo rispetto a logr r e la semicirconferenza ha lunghezza
proporzionale a r, quindi anche il suo contributo tende a zero per grandi r

292

CAPITOLO 2. ANALISI COMPLESSA

-r

Figura 2.8: Contorno per integrare f (x) log x

perch limr+ r log r = 0.


Osserviamo anche che, se x reale positivo, si ha x = xei , e quindi il logaritmo complesso, vista la determinazione del logaritmo che abbiamo scelto,
verica log(x) = log(x) + i (si riveda la Nota 2.12.13). Pertanto segue
dallipotesi di parit (f (x) = f (x)) che
Z

f (z) log z dz +

f (z) log z dz = 2

f (x) log x dx + i

f (x) dx .

Da qui, passando a limite per 0+ e r + ed applicando il Teorema


dei residui 2.10.5, otteniamo

2i

k
X
j=1

Resz=zj [f (z) log z] = 2

f (x) log x dx + i

f (x) dx ,

(2.50)

2.12. CALCOLO DI INTEGRALI

293

dove gli zj sono i poli semplici di f nel semipiano superiore. A questo proposito osserviamo qui che, se si parte con una f meromorfa nel semipiano
inferiore, il calcolo rimane valido pur di scegliere un percorso simmetrico
rispetto allasse reale di quello che abbiamo usato.
Ora assumiamo ancora, per comodit, che f abbia valori reali sullasse reale
(cio quando la sua variabile reale). Allora, separando le parti reale ed
immaginaria in (2.50), abbiamo
Z
X
f (x) log x dx = Im
Resz=zj [f (z) log z]
(2.51)
0

Im zi >0

f (x) dx = 2 Re

Resz=zj [f (z) log z] .

(2.52)

Im zi >0

Si
R noti che non solo abbiamo calcolato grazie
R al teorema dei residui lintegrale
f
(x)
log
x
dx,
ma
anche
lintegrale
f (x) dx.

0
0

Esercizio 2.12.18. Usare il Teorema dei residui 2.10.5 per calcolare:


R log x
(i) lintegrale 0 1+x
2 dx ;
(ii) lintegrale

(iii) lintegrale
(iv) lintegrale

R
0

R
0

R
0

1
1+x2

dx ;

log x
(1+x2 )2

dx ;

1
(1+x2 )2

dx .

1
2
Suggerimento: la funzione 1+z
2 O(1/|z| ) per |z| ed ha un polo
semplice solo in z = i; nel semipiano superiore lunico polo in z = i.
log z
1
1
1
Poich i+z
2 = zi z+i , il residuo di 1+z 2 a questo polo


i/2

log i
log z
=
= .
=

z + i z=i
2i
2i
4

Pertanto (i) segue da (2.51):


Z
log x

dx = Im = 0 ,
2
1+x
4
0

294

CAPITOLO 2. ANALISI COMPLESSA

e (ii) segue da (2.52):


Z

1
dx = 2 Re = .
2
1+x
4
2

1
Si osservi che questultimo integrale era gi noto, perch la primitiva di 1+x
2
arctan x (si veda anche lEsempio 2.12.3).
Per calcolare gli integrali (iii) e (iv), si osservi che la funzione (1+z1 2 )2 ha
poli di ordine 2 ai punti z = i. Basta allora calcolare il suo residuo al punto
z = i tramite la Proposizione 2.10.4 ed applicare la Nota 2.10.3 per ottenere

Resz=i

log z

i
= + .
2
2
(1 + z )
8 4

Ora, prendendo la parte reale e immaginaria, otteniamo da (2.51) che lintegrale in (iii) vale 4 , e da (2.52) che lintegrale in (iv) vale 4 .

2.13

Introduzione al prolungamento analitico:


la funzione Gamma

Supponiamo che f sia una funzione olomorfa in un dominio (aperto connesso)


D. Per ogni punto z0 di D, essa esprimibile come sviluppo in serie di
potenze con centro in z0 . Abbiamo gi ossergato il seguente comportamento
di rigidit delle funzioni olomorfe. Se g unaltra funzione olomorfa in z0 che
coincide con f in un intorno di z0 , o anche solo su una successione di punti
che ha z0 come punto di accumulazione, allora f e g coincidono in tutto D;
in particolare, se f e g coincidono localmente (ad esempio se sono uguali con
tutte le loro derivate al punto z0 ), allora coincidono ovunque (Teorema 2.6.1
e Corollario 2.6.2).
Allora, supponiamo di avere due funzioni f e g olomorfe in due domini diversi D1 e D2 , e che lintersezione di D1 e D2 comntenga un aperto (o anche
solo un insieme con un punto di accumulazione, magari un arco di curva).
Allora mettendo insieme f e g nei rispettivi domini otteniamo una funzione
olomorfa denita nellunione D1 D2 , che chiamiamo ancora f e denotiamo con prolungamento analitico di f a D1 D2 . Per quanto visto prima, il
prolungamento analitico unico. Lo sviluppo di Taylor di f intorno a punti
di D1 non converge necessariamente in D2 , e neppure in sottodomini di D2

2.13. LA FUNZIONE GAMMA

295

tranne che per centri di sviluppo contenuti in D1 D2 , ma cambiando appropriatamente centri di sviluppo si ottiene un ricoprimento di D1 D2 in dischi
parzialmente sovrapposti ciascuno dei quali un disco di convergenza della
serie di Taylor di ununica funzione olomorfa che continuiamo a denotare con
f.
Questo implica che se f olomorfa in D e se prendiamo una curva che
comincia dentro D e sviluppiamo secondo Taylor la funzione f con centri
sui punti della curva, allora man mano che ci spostiamo verso lesterno di D
possiamo, cambiando centri di sviluppo, trovare nuove regioni di olomora
per f esterne a D. Se seguiamo quella curva, il prolungamento analitico cos
costruito unico: ma potrebbe dipendere dalla curva che abbiamo percorso.
Se la curva comincia a z0 D e nisce a z
/ D, otteniamo un prolungamento
f che in z olomorfo; ma se avessimo seguito un altro percorso da z0 a z,
avremmo ottenuto la stessa funzione? Questa la domanda alla base della
teoria del prolungamento analitico.
In questa Sezione non arontiamo questo problema, che viene rimandato
alla successiva, ma ci limitiamo ad un esempio facilmente costruibile di prolungamento analitico: quello relativo allestensione del dominio di denizione
della funzione Gamma.
La funzione Gamma stata introdotta nella Sottosezione 1.23.4, dove
abbiamo dimostrato che una funzione olomorfaRdenita nel semipiano D0 :=

{Re z > 0}. Si tratta dellintegrale (z) = 0 xz1 ex dx, che converge
appunto in tale semipiano. Ora ne estendiamo il dominio di denizione grazie
alla seguente formula di ricorrenza, che si ottiene integrando per parti: se
Re z > 0,
Z
Z
 z t 
z x
xz1 ex dx = z(z) ,
(z + 1) =
x e dx = t e 0 + z
0

dove il termine costante si annulla a zero a causa del polinomio e tende a


zero allinnito a causa dellesponenziale. Riscriviamo questa identit come
(z) =

(z + 1)
,
z

ed usiamola per estendere la denizione di Gamma dalla striscia {0 < Re z <


1} alla striscia {1 < Re z < 0}. Purtroppo questa striscia addizionale che
cos aggiungiamo al dominio di denizione disgiunta dal semipiano destro D0 (ne separata dalla retta immaginaria {Re z = 0}. Per possiamo

296

CAPITOLO 2. ANALISI COMPLESSA

eseguire un passaggio intermedio nel prolungamento, estendendo prima alla striscia { 12 < Re z < 21 }: a causa del denominatore nella formula di
ricorrenza, questo passaggio intermedio fornisce lestensione olomorfa richiesta in tutta questa striscia eccetto il punto z = 0. Ora le due striscie di
estensione, {1 < Re z < 0} e { 12 < Re z < 12 , z 6= 0} si sovrappongono
parzialmente, e quindi abbiamo esteso la funzione Gamma al semipiano bucato D1 := {Re z > 1, z 6= 0}. Iterando questo procedimento per ricorrenza,
estendiamo la funzione Gamma al dominio C \ {z = 0, 1, 2, . . . }.
Si osservi che la convergenza dellintegrale che denisce la funzione Gamma
non si estende a nessun punto del semipiano sinistro {Re z < 0}: la Gamma
si estende, ma con una diversa denizione, data da formule di ricorrenza o da
opportuni sviluppi di Taylor, e basata sulla rigidit delle funzioni olomorfe,
non dalla espressione integrale che la denisce nel semipiano destro.
Vogliamo ora determinare il comportamento della funzione Gamma ai
punti interi
negativi N = {z = 0, 1, 2, . . . }. Osserviamo dapprima che
R x
(0) = 0 e dx = 1, e per ricorrenza otteniamo
(n) = (n 1)!(1) = (n 1)! .

Alla stessa maniera, per ogni n > 0 e z


/ N abbiamo
(z + n) = (z n + 1)(z n + 2) . . . (z + 1)z(z) .
Ora studiamo come si comporta la Gamma in prossimit del punto di singolarit n. Scriviamo z = n + w: dalla precedente identit si ha
(z) =

(w + 1)
.
w(w 1)(w 2) . . . (w n)

Pertanto limw0 w(n + w) = (1)n /n, e quindi ai punti {n, n N} ci


sono poli semplici con residuo (1)n /n (si veda la Denizione 2.9.5).
Nota 2.13.1. (Nota terminologica.) Nella Denizione 1.6.7 abbiamo chiamato analitica reale una funzione di (una o pi) variabili reali sviluppabile
in serie di Taylor in un disco di raggio positivo intorno ad ogni punto del
suo dominio di denizione. Lanalogo per funzioni di variabile complessa
dovrebbe indicarsi come funzione analitica complessa, e cos avviene in molti libri ma non in in questo, che riserva a tali funzioni il nome di funzioni
olomorfe. Nondimeno, parliamo di prolungamento analitico invece che di
prolungamento olomorfo. Questo perch il prolungamento di una funzione

2.14. PROLUNGAMENTO ANALITICO

297

f avviene scegliendo un disco iniziale Dz con centro z in cui sviluppiamo f


secondo Taylor, poi scegliendo in questo disco un punto w ed esaminando
lo sviluppo di Taylor di f intorno ad esso: se lo sviluppo converge in un
disco Dw che sborda da (ossia non interamente contenuto in) Dz , abbiamo
esteso la funzione in maniera olomorfa al di fuori di Dz : ma con un altro
sviluppo di Taylor! Quindi ci che viene estesa la propriet di analiticit
(sviluppabilit in serie di Taylor) rispetto a centri diversi.

2.14

Prolungamento analitico

In questo libro, dibattere un tema sosticato come il prolungamento analitico


sarebbe solo necessario per approfondire e generalizzare un esempio elementare di cui abbiamo bisogno e che presentiamo subito con un calcolo diretto,
quello del logaritmo complesso. Nondimeno, diamo una presentazione abbastanza ampia, seppure non completa, dellargomento (omettiamo ad esempio
il piccolo ed il grande teorema di Picard). La presentazione in questa Sezione
tratta da [10, Capitolo 7] e [23, Chapter 16].

2.14.1

Il logaritmo complesso: definizione naturale

Scriviamo la variabile complessa z in forma polare, z = rei . C un modo


obbligato di estendere la funzione logaritmo, originariamente denita sulla
semiretta reale positiva, ad un dominio complesso che la contiene, ed allo
stesso tempo mantenere la propriet del logaritmo di trasformare prodotti in
somme: esso consiste nel denire
ln(z) = ln(rei ) = ln r + i ,

(2.53)

dove ovviamente ln r il consueto logaritmo reale. La funzione logaritmo


complesso cos estesa ovunque derivabile in senso complesso, quindi olomorfa, come si trova immediatamente vericando che valgono le equazioni di
CauchyRiemann (Nota 2.1.2).
Lestensione complessa che abbiamo appena dato ha senso localmente in
C \ {0}, ma purtroppo non globalmente. Supponiamo infatti di percorrere
in senso antiorario la curva 7 rei , la cui immagine la circonferenza con
centro lorigine e raggio r > 0. In ogni punto la denizione (2.53) ha senso,
ma dopo aver compiuto un giro il valore del logaritmo al punto nale eccede

298

CAPITOLO 2. ANALISI COMPLESSA

di 2i quello al punto iniziale: per i due punti coincidono! La denizione


che abbiamo dato non porta quindi ad una funzione ad un solo valore, bens
ad inniti valori (numerabili), separati luno dallaltro di multipli interi di
2i. Secondo la terminologia usuale, questa non una funzione (in analisi
complessa peraltro abituale chiamarla una funzione polidroma, in antitesi
alle funzioni consuete, che vengono chiamate monodrome). Per evitare la
polidromia, occorre restringere la denizione a dominii nel piano complesso
nei quali non sia possibile percorrere giri intorno allorigine (ossia avere curve
con indice di avvolgimento non nullo intorno allorigine: Denizione 1.29.34).
Il dominio pi ovvio il piano complesso scavato di una qualsiasi semiretta
uscente dallorigine.
Nonostante qui non sia indispensabile, il concetto di come estendere in
maniera ben denita ed analitica funzioni da un sottodominio in C ad un
dominio pi grande di tale importanza storica e concettuale che ne diamo
una succinta trattazione nel resto di questa Sezione.

2.14.2

Elementi analitici di funzione

Segue immediatamente dal Corollario 2.6.2 il seguente principio del prolungamento analitico:
Teorema 2.14.1. Siano D0 e D1 due dominii (aperti connessi) in C, e
supponiamo che laperto D := D0 D1 sia non vuoto. Se f0 olomorfa
in D0 , esiste al pi ununica funzione f1 olomorfa in D1 che coincide con
f0 in D (o anche semplicemente in una parte di D che abbia un punto di
accumulazione). Se una tale f1 esiste, la coppia di funzioni f0 e f1 definisce
quindi ununica funzione olomorfa in D0 D1 .
Il Teorema precedente ribadisce che le funzioni olomorfe che si estendono
a dominii pi grandi lo fanno in maniera unica. Ma cosa succede ai loro
sviluppi di Taylor? Lo sviluppo di Taylor con centro in un punto z0 converge
in un disco P
D0 di raggio r0 , che pu essere tutto C. Se il disco di convergenza
n
di f0 (z) =
n=0 an (z z0 ) tutto il piano complesso, sviluppando f0 con
un nuovo
centro di sviluppo in z1 otteniamo una nuova serie di potenze
P
f1 (z) = n=0 bn (zz1 )n che converge di nuovo in tutto C. Invece, se il raggio
di convergenza r0 nito, allora scegliendo un nuovo centro di sviluppo z1 nel
disco D0 otteniamo un nuovo disco di convergenza che potrebbe estendrrsi
fuori di D0 , e dar quindi luogo ad una estensione olomorfa (unica) di f0 fuori
di D0 . Ecco un esempio.

2.14. PROLUNGAMENTO ANALITICO

299

Esempio 2.14.2. Sia


f0 =

X
n=0

(z i)n =

1
1 (z i)

nel disco D0 = {z : |z i| < 1} con centro i e raggio 1. Esprimiamo f0 con


uno sviluppo con centro in 1, scrivendo
n

X
z1
1
1
1
= i
=
= i
1 (z i)
i (z 1)
i
1 z1
i
n=0
=

X
n=0

(i)n+1 (z 1)n .

La serie di potenze allultimo membro una serie geometrica convergente nel


disco D1 = {z : |z 1| < 1}, con raggio 1 e centro in 1. Il disco D1 non
interamente contenuto in D0 e quindi abbiamo costruito un prolungamento
analitico non banale.
I due sviluppi in serie f0 e f1 , convergenti rispettivamente nei dischi D0
e D1 , deniscono quindi ununica funzione olomorfa f in D0 D1 e si chiamano elementi analitici della funzione f , o pi semplicemente elementi della
funzione f .

Notazione 2.14.3. Con maggiore propriet di linguaggio, un elemento analitico una coppia (f, D), dove D un disco aperto in C e f una funzione
olomorfa in D, ossia una serie di Taylor con centro nel centro di D e convergente in D. Un elemento analitico di una funzione olomorfa g del tipo
(f, D) con f coincidente con g in D. Se (f0 , D0 ) e (f1 , D1 ) sono due elementi analitici tali che D = D0 D1 6= e f1 = f2 in D, allora scriviamo
(f0 , D0 ) (f1 , D1 ): lasciamo al lettore la verica banale del fatto che questa
una relazione di equivalenza (le tre propriet riessiva, simmetrica e transitiva sono quasi ovvie). In tal caso, le due funzioni f0 e f1 sono loe restrizioni
rispettivamente a D0 e D1 di ununica funzione olomorfa in D0 D1 .

2.14.3

Monodromia, polidromia e prolungamento analitico lungo curve

Supponiamo di iterare il prolungamento analitico denito nella precedente


Sottosezione 2.14.2 incollando elementi di funzione. In tal modo, a partire da

300

CAPITOLO 2. ANALISI COMPLESSA

(z-i)

(-i)

n+1

(z-i)

Figura 2.9: Due elementi analitici della stessa funzione olomorfa

un elemento centrato in un punto z0 , possiamo arrivare a denire la funzione


prolungata analiticamente in un altro punto z1 in pi di un modo, a seconda di quali dischi di olomora abbiamo incollato nel corso delle iterazioni.
Lesempio della funzione logaritmo complesso presentato nella Sottosezione
2.14.1 mostra che il risultato non necessariamente unico: pu dipendere
dalla scelta dei dischi, ossia da come ci siamo mossi per spostarci da z0 a
z1 . Questo concetto diventa ancora pi chiaro se osserviamo che lunicit del
prolungamento da un disco al successivo non si basa sul fatto che i due elementi analitici coincidano nellintersezione (aperta) dei loro due dischi: basta
che coincidano in un insieme con un punto di accumulazione, ad esempio un
arco di curva (Corollario 2.6.2). Quindi studiamo come prolungare analiticamente funzioni lungo curve, e quando il risultato indipendente dalla scelta
della curva o invece ne dipende. Nel primo caso deniamo il prolungamento
monodromo, nel secondo polidromo.
Definizione 2.14.4. Sia una curva continua da un punto z0 C ad un
punto z1 , e per ogni z nellimmagine di sia fz un elemento analitico (ossia
una serie di potenze convergente in un disco di raggio non nullo con centro

2.14. PROLUNGAMENTO ANALITICO

301

z) con la propriet che le restrizioni allimmagine di dei diversi elementi


coincidono a due a due negli archi di curva dove si sovrappongono i rispettivi
dischi. In tal caso si dice che lelemento nale fz1 il prolungamento analitico
lungo la curva dellelemento iniziale fz0 , e viceversa (ed analogamente, ogni
elemento intermedio prolungamento analitico lungo la curva di ogni altro
elemento). Un prolungamento che non dipende dalla scelta della curva si
chiama monodromo, altrimenti polidromo.
Il prossimo teorema una conseguenza del Corollario 2.6.2.
Teorema 2.14.5. (Unicit del prolungamento analitico.) Ogni elemento analitico (f, D) che ammette una continuazione analitica lungo una
curva continua che passa per il centro di D ammette una sola continuazione
analitica lungo : gli elementi analitici ottenuti al termine di coincidono.
Dimostrazione. Consideriamo due catene di dischi, diciamo {A0 , A1 , . . . , Am }
e {B0 , B1 , . . . , Bk }, che cominciano con D (ovvero A0 = B0 = D) e che
ricoprono entrambe limmagine di , ossia esistono 0 < s1 < s2 < <
sm < 1 e 0 < t1 < t2 < < tk < 1 tali che gli intervalli Ij = [sj , sj+1]
e Ki = [ti , ti+1 ] vericano (Ij ) Aj , (Ki ) Bi per 0 < j < m 1,
0 < i < k 1, e tali che dischi consecutivi in ciascuna catena si intersecano:
Aj Aj+1 6= , Bi Bi+1 6= per tutti questi valori di j e i. Supponiamo
che per tutti questi indici esistano elementi analitici (gj , Aj ) e (hi , Bi ) tali
che g0 = h0 = f su D e (gj , Aj ) (gj+1, Aj+1 ) e (hi , Bi ) (hi+1 , Bi+1 ).
Dobbiamo dimostrare che ogni volta che Ij Ki 6= si ha (gj , Aj ) (hi , Bi ).
Questo vero per ipotesi se i = j = 0. Per assurdo, supponiamo che smetta
di essere vero per i e j sucientemente grandi, e scegliamo i e j che vericano
questa ipotesi fatta per assurdo, ovvero che sia
Aj Bi 6=

(gj , Aj ) 6 (hi , Bi ) ,

(2.54)

e minori possibili, nel senso che i + j sia il minimo valore per cui si incontra
tale propriet. Consideriamo gli intervalli Ij = [sj , sj+1 ] e Ki = [ti , ti+1 ] e
supponiamo che si abbia, ad esempio, ti < sj < ti+1 : ossia, sj Ij Ki .
Rammentiamo che Ij interseca Ij1 , ovvero sj Ij1 Ij . Quindi
(sj ) Aj1 Ai Bj .
Poich i + j minimo fra tutte le coppie di indici per i quali i corrispondenti elementi analitici non sono equivalenti (ossia prolungamenti analitici

302

CAPITOLO 2. ANALISI COMPLESSA

luno dellaltro), necessariamente abbiamo (gj1, Aj1 ) (hi , Bi ). Daltra


parte sapiamo anche che (gj1 , Aj1) (gj , Aj ), e per la propriet transitiva
dellequivalenza abbiamo (gj , Aj ) (hi , Bi ), in contraddizione con (2.54).
Questa contraddizione mostra che per nessuna coppia di indici i e j vale
(2.54).

Corollario 2.14.6. Sia C un dominio connesso, e (f, D) un elemento


analitico di funzione su un disco aperto d con centro w. Sia una qualsiasi
curva continua semplice chiusa che passa per w, e supponiamo che lungo sia
possibile il prolungamento analitico. Sia (g, D ) lelemento analitico di funzione su un disco D con centro w che si ottiene prolungando analiticamente
(f, D) lungo . Se per ogni tale curva si ha che g = f in un intorno di w (nel
qual caso i dischi di olomorfia D e D coincidono, quindi (f, D) = (g, D )),
allora esiste una funzione olomorfa in tutto che estende f , e viceversa.
Dimostrazione. Il prolungamento analitico lungo una curva chiusa riconduce
allelemento analitico di partenza se e solo se il prolungamento analitico lungo due qualsiasi curve dallo stesso punto iniziale w allo stesso punto nale
z porta allo stesso elemento analitico di funzione intorno a z (infatti, concatenando la prima curva con la seconda percorsa a ritroso, si ottiene una
generica curva continua da w a w). Quindi lipotesi del teorema equivale ad
asserire che il prolungamento analitico non dipende dalla curva scelta, nel
qual caso ovviamente denisce una funzione olomorfa che estende tutti gli
elementi analitici lungo i punti della curva. Poich connesso, ogni suo
punto z si pu raggiungere da w tramite una curva continua, e quindi questa
funzione olomorfa denita su tutto .

Nota 2.14.7. Vedremo in seguito, nel corso della dimostrazione del teorema di
monodromia (Corollario 2.14.10) che il prolungamento analitico d sempre
luogo ad una unica estensione olomorfa (ossia non dipende dal percorso,
ovvero ancora riconduce allo stesso elemento di funzione al termine di ogni
curva chiusa) se il dominio semplicemente connesso (Denizione 2.4.4).
In particolare, rimandiamo il lettore al Teorema 2.14.9.

Definizione 2.14.8. Siano 1 e 2 due curve omotope da un punto w a un


punto z in C, sia A C un insieme che contiene le immagini di entrambe
le curve (spesso si sceglie linterno della regione da esse delimitata), e h :
[0, 1] [0, 1] 7 A la mappa continua di omotopia (Denizione 2.4.1): quindi

2.14. PROLUNGAMENTO ANALITICO

303

h(s, 0) = w e h(s, 1) = z per ogni 0 6 s 6 1. Chiamiamo famiglia a un


parametro di curve omotope la famiglia di curve continue da w a z date, per
ciascun 0 6 t 6 1, da t (s) = h(s, t).
Teorema 2.14.9. (i) Date due curve continue 0 e 1 da w a z in un
dominio semplicemente connesso (Definizione 2.4.4), esiste una famiglia ad un parametro {t , 0 6 t 6 1} di curve omotope tali che
0 = 0 e 1 = 1 .
(ii) Se {t , 0 6 t 6 1} una famiglia ad un parametro di curve omotope da
w a z, D un disco aperto con centro in w e (f, D) un elemento analitico
di funzione che ammette continuazione analitica lungo ogni curva t ad
un elemento analitico (gt , Dt ) con Dt centrato in z, allora Dt Du 6=
e (gt , Dt ) (gu , Du ) per ogni t, u (ossia tutti i prolungamenti analitici
gt coincidono in un disco con centro in z).
Dimostrazione. Poich e semplicemente connesso, 1 omotopa in ad
una curva costante z1 e 2 omotopa ad una costante z2 , nel senso che
esistono mappe continue h1 , h2 : [0, 1] [0, 1] 7 tali che:
h1 (t, 0) = 1 (t)
h1 (t, 1) = z1
h2 (t, 0) = 2 (t)
h2 (t, 1) = z2

per
per
per
per

ogni
ogni
ogni
ogni

t [a, b]
t [a, b]
t [a, b]
t [a, b]

Comprimiamo, trasliamo e riettiamo il dominio di variabilit della variabile


come segue:
s in modo da iniziare la costruzione di una omotopia h
1 (t, s) = h1 (t, s/3) ,
h
2 (t, s) = h1 (t, 2 + 1 s ) .
h
3
3
1 (t, 0) = 1 (t), h
1 (t, 1/3) = z1 , h
2 (t, 2/3) = z2 e h
2 (t, 1) = 2 (t).
In tal modo, h
Poich connesso, esiste una curva continua 3 con immagine in che
comincia a z1 e nisce a z2 . Completiamo allora la costruzione dellomotopia
ponendo h
3 (s, t) = 3 (t) per 1/3 < s < 2/3. Allora chiaro che la funzione
h
: [0, 1] [0, 1] 7 denita concatenando queste tre omotopie fornisce la
h
famiglia ad un parametro richiesta nellenunciato: si tratta della funzione

304

CAPITOLO 2. ANALISI COMPLESSA

=h
1 se 0 6 s 6 1/3, h
=h
3 se 1/3 < s < 2/3 e h
=h
2 se 2/3 6 s 6 1.
h
Questo prova la parte (i).
(t)
Nellipotesi della parte (ii), esiste una catena di dischi Bv con centri in
(t)
(t)
ciascun punto t (u) di t ed elementi di funzione (fu , Bv ) tali che le funzioni
(t)
(t)
olomorfe fu : Bv 7 C coincidono nelle intersezioni dei rispettivi dischi
di denizione. Poich la curva t continua, essa ha immagine compatta
(t)
(Sezione 1.1): siccome tale immagine coperta dalla famiglia di dischi Bv ,
da tale immagine si estrae un sottoricoprimento nito, ancora in base ai
risultati della Sezione 1.1. Lunione di questa catena nita di dischi un
intorno tubulare t dellimmagine di t : ossia, esiste t > 0 tale che laperto
t contiene tutti i punti a distanza minore di t da t .
Ora rammentiamo che t (s) = h(s, t) e la mappa h di omotopia continua
nel compatto [0, 1] [0, 1], quindi uniformemente continua, per il Teorema di
Heine 1.8.6. Pertanto, in corrispondenza di t esiste t > 0 tale che
|t (s) t (u)| < t

se 0 6 s, u 6 1, |u t| < t .

Questo signica che, per tali u, limmagine della curva u giace nellintorno
tubulare t di t , e quindi u ricoperta dalla stessa catena nita di dischi
che ricopre t . Pertanto i prolungamenti analitici (gt , Dt ) e (gu , Du ) al punto
nale comune z delle curve t e u coincidono per tutti gli u nellintervallo
aperto Jt := |u t| < t . In tal modo ricopriamo [0, 1] con una famiglia
di intervalli aperti Jt . Di nuovo per compattezza, possiamo ricoprire [0, 1]
con una sottofamiglia nita Jt1 , . . . , Jtn , e quindi ci sono solo al pi n prolungamenti analitici (gt1 , Dt1 ), . . . , (gtn , Dtn ) dierenti con centro in z. Per
ciascuno degli intervalli Jti ha sovrapposizione non vuota col successivo (perch [0, 1] connesso), e quindi (gti , Dti ) (gti+1 , Dti+1 ) per ogni i. Pertanto
tutti i prolungamenti analitici (gt , Dt ) coincidono.

Come conseguenza abbiamo che il prolungamento analitico su dominii


semplicemente connessi sempre monodromo:

Corollario 2.14.10. (Teorema di monodromia.) Sia un dominio


(aperto connesso) semplicemente connesso, D un disco aperto con centro in un punto z0 , (f0 , D0 ) un elemento analitico di funzione (ossia una
serie di Taylor convergente in D) con la propriet che (f0 , D0 ) ammette prolungamento analitico lungo ogni curva di classe C 1 a tratti (o assolutamente
continua) in che comincia a z0 . Allora esiste una funzione olomorfa g su
tale che g coincide con f in D: ovvero, il prolungamento monodromo.

2.14. PROLUNGAMENTO ANALITICO

305

Dimostrazione. Si prolunghi lelemento analitico di funzione (f, D) lungo


dierenti curve C 1 a tratti (o assolutamente continue) da z0 ad un punto
generico z (queste curve esistono perch connesso). Sappiamo che
il prolungamento analitico lungo ogni tale curva porta ad un elemento analitico di funzione intorno a z. Il precedente Teorema 2.14.9 mostra che gli
elementi analitici intorno a z0 che in tal modo si ottengono sono equivalenti,
ossia coincidono in un intorno di z0 , e pertanto deniscono ununica funzione olomorfa a ciascun punto z , indipendente da percorso seguito per
congiungere z0 con z.

La frontiera naturale
Ogni curva chiusa di classe C 1 la frontiera del dominio massimale di
analiticit di una funzione olomorfa, nel senso che il prolungamento analitico
lungo ogni curva (nel senso della Denizione 2.14.4) che comincia allinterno
di (si veda il Teorema di Jordan 1.29.12) non si estende ad alcun punto
allesterno di . In tal caso si dice che la frontiera naturale di analiticit. In questa sottosezione costruiamo manualmente un esempio di funzione
olomorfa allinterno del disco unitario che non si pu prolungare allesterno:
da qui il caso generale segue come applicazione di un risultato classico dellanalisi complessa, il teorema della mappa di Riemann, la cui dimostrazione
per va ioltre gli scopi di questo libro (per una dimostrazione, si veda [23,
Chapter 14, Section 8]). Una dimostrazione alternativa e pi elegante, ma
notevolmente pi complicata, di una funzione olomorfa nel disco che ha il
cerchio come frontiera naturale in [23, Teoremi 16.5 e 16.6]; per unaltra
costruzione elementare, si veda [10, pg. 135].
Cominciamo con losservare che, per ognnumero complesso w di modulo
1, la funzione
1
1 X  z n X z n
fw (z) =
=
=
wz
w n=0 w
w n+1
n=0

(2.55)

ha serie di Taylor con centro in 0 convergente nel disco aperto D di raggio 1


(con una singolarit polare in z = 1). Ora scegliamo una successione {wj }
con |wj | 1 densa nel cerchio C di raggio 1 (la frontiera di D), e consideriamo
la serie
X
f :=
2j fwj .
(2.56)
j>0

306

CAPITOLO 2. ANALISI COMPLESSA

Osserviamo che, per ogni w C e per ogni z in ogni disco chiuso U D vale
la maggiorazione |fw (z)| > 1/, dove > 0 la distanza fra U e C. Pertanto
la serie (2.56) converge uniformemente in U in base al test di Weierstrass
(Teorema 1.3.29).
Incidentalmente, osserviamo che la derivata di fw soddisfa una disuguaglianza
simile. Infatti fw (z) =P1/(w z)2 e quindi |fw (z)| > 1/2 per ogni z in U.
Quindi anche la serie j>0 2j fw j converge uniformemente in U.
chiaro che ogni punto wj una singolarit polare di f . Poich linsieme di questi punti denso nella circonferenza unitaria C, f non pu essere
prolungata analiticamente fuori di C. Rimane solo da dimostrare che f
olomorfa nel disco unitario aperto D. Questo fatto segue in maniera quasi ovvia dal fatto che f una serie uniformemente convergente di funzioni
olomorfe in D, ma ora lo dimostriamo rigorosamente.
Consideriamo la somma parziale di ordine N della serie di Taylor di f con
centro in 0. Per P
il Teorema di derivabilit per serie 1.3.35 sappiamo che f (0)

esiste e f (0) = j>0 2j fw j (0); per un ragionamento identico, una identit


analoga vale per ogni ordine di derivazione. Allora il coeciente di Taylor di
f in 0 di grado N
1 X j (N )
2 fwj (0)
N! j>0

ossia la serie dei coecienti di Taylor di ordine N delle funzioni fwj . Daltra
parte, segue direttamente da (2.55) che il coeciente di Taylor di grado
N di fwj 1/wjN +1. Quindi il coeciente di Taylor di grado N di f
P
j N 1
. Questa serie converge ad un punto di D per il teorema
j>0 2 wj
del confronto per serie (Sezione 1.1), dal momento che |wj | = 1.
Pertanto la serie di Taylor di f converge nel disco unitario D in base al
teorema del raggio di convergenza di serie di potenze (Teorema 1.4.2).

2.14.4

Primitive di funzioni olomorfe e logaritmo complesso

Teorema 2.14.11. (Il teorema fondamentale del calcolo per funzioni


olomorfe.) Sia f una funzione olomorfa in un dominio (aperto connesso)
.
(i) Se una curva di classe C 1 a tratti (o assolutamente continua) con
immagine interamente contenuto in e punto finale z, allora anche

2.14. PROLUNGAMENTO ANALITICO

307

R
g(z) = f (w) dw olomorfa in , e g f . La funzione g si chiama
una primitiva complessa di f (g dipende dalla scelta di e cambia per
una costante additiva al cambiare della curva).
(ii) Se semplicemente connesso (Definizione 2.4.4), allora per ogni
z0 , z si ha
Z
f (z) = f (z0 ) + f (w) dw ,
(2.57)

dove una qualunque curva C a tratti (o assolutamente continua)


contenuta in .
1

Dimostrazione. Proviamo la parte (i). Sia U un intorno aperto di z contenuto


in . In un opportuno sottodisco S di U con centro in z la funzione olomorfa
f sviluppabile in serie di Taylor uniformemente convergente. Si ssi un altro
punto u nellimmagine di , e sia 1 larco nale di curva di gamma che
unisce u a z: scriviamo = 0 + 1 , dove 0 Rla porzione iniziale di .
Integrando termine a termine, vediamo che anche f (w) dw sviluppabile
in serie di Taylor in U, ossia olomorfa in z. Allora
Z
Z
Z
f (w) dw .
f (w) dw +
f (w) dw =

Sappiamo che solo il secondo integrale dipende da z (punto terminale di 1 ):


inoltre esso olomorfo rispetto alla variabile z: quindi lintegrale a primo
membro una funzione olomorfa di z. Come conseguenza del Teorema di
Cauchy (nella forma del Corollario 2.4.11), il risultato non dipende dalla
scelta della curva perch il dominio semplicemente connesso e la funzione
f olomorfa in .
Per calcolare la derivata di g, immaginiamo di prolungare da z a z + s
con s complesso, diciamo lungo il segmento che unisce i numeri complessi z
e z + s, e calcolare il limite del rapporto incrementale
Z
f (z + s) f (z)
1 z+s
=
f (w) dw
s
s z
Ora lidentit g (z) = f (z) segue subito dal Teorema della Media Integrale
(Sezione 1.1).
Ora proviamo la parte (ii).
R In primo luogo mostriamo che lenunciato
ha senso, ossia che lintegrale f (w) dw non dipende dalla scelta della curva ma solo dai suoi punti estremi: poich qui abbiamo assunto che sia

308

CAPITOLO 2. ANALISI COMPLESSA

semplicemente connesso, questo fatto conseguenza del teorema di invarianza per omotopia (Teorema 2.4.7), o equivalentemente del suo corollario, il
TeoremaRdi Cauchy (Corollario 2.4.10. Ora che sappiamo che la funzione
g(z) := f (w) dw ben denita, la prima parte del teorema ci dice che
g f . Poich un dominio, quindi connesso, questo implica che f g
costante (regola della derivata nulla, Sezione 1.1). Daltra parte, se si sceglie
z = z0 , si vede che g(z0 ) = 0 mentre f (z) = fR(z0 ): quindi g f la costante
f (z0 ), ovvero f (z) = f (z0 ) + g(z) = f (z0 ) + f (w) dw.

Corollario 2.14.12. Sia f una funzione olomorfa in un intorno del segmento [0, x] dellasse reale, e una curva C 1 a tratti (o assolutamente conla funzione g(z) =
Rtinua) da 0 a z con immagine contenuta in . Allora

f
(w)
dw

una
primitiva
complessa
di
f
,
ossia
g
=
f
, ed ogni prolunga
Rz
mento analitico della primitiva reale 0 f (w) dw di questa forma.

Dimostrazione. Sappiamo gi dal Teorema 2.14.11 che g una primitiva complessa di f e g = f . Restringendo lattenzione al segmento [0, x], dal Teorema
Fondamentale del Calcolo segue che g = f nel senso reale su questo segmento. Poich g e f sono olomorfe, ne segue che, a meno di costanti additive, g
lunica funzione olomorfa che soddisfa questa condizione. Per completare la
dimostrazione, basta quindi provare che i prolungamenti analitici lungo una
curva di g e di f soddisfano la stessa condizione.
Per ogni s in un disco D1 di centro z che non contiene lorigine, consideriamo una curva con immagine in , di classe C 1 a tratti (o assolutamente
continua), che termina in z. Chiamiamo z0 il punto iniziale di . Un arco
nale della curva sta dentro il dominio semplicemente connesso D1 : sia
w un punto di D1 per cui passa 1 . Spezziamo = 0 + 1 , dove 0
larco iniziale da z0 a w (che pu anche toccare w pi volte) e 1 la continuazione
D1 cheR lascia w e non ci ripassa pi. Allora
R da w a z dentro
R
fw (z) = f (u) du = 0 f (u) du + 1 f (u) du. Al punto w la primitiva g
olomorfa e la derivata termine a termine della sua serie di Taylor la serie di
Taylor di f con centro w: in altre parole, queste serie di Taylor rappresentano
elementi analitici delle funzioni f e g con la propriet che g = f , e gli elementi analitici considerati prima al punto z sono il prolungamento analitico
di questi, dal momento che essi coincidono in un arco della curva intorno a
w. Continuando iterativamente a spezzare 0 e considerare dischi con centro
in punti di questi spezzamenti dove gli sviluppi di Taylor convergono, ci accorgiamo che servono soltanto un numero nito di tali dischi (perch la curva

2.14. PROLUNGAMENTO ANALITICO

309

, essendo continua, ha immagine compatta), e su questa catena di dischi gli


sviluppi di Taylor cos ottenuti formano una catena di elementi analitici a
due a due parzialmente sovrapposti, con la propriet g = f per ciascuno di
essi.

Nel resto di questa Sottosezione dedicheremo molta attenzione al caso


importante del prolungamento analitico lungo una curva della funzione logaritmo.
Per cominciare abbiamo bisogno di un elemento analitico di partenza per
la funzione logaritmo complesso. Una possibilit di estensione consiste nel
considerare una curva con un segmento iniziale sul semiasse reale positivo, dove il logaritmo denito nel senso reale. Ma poich vogliamo partire con un elemento analitico, dobbiamo esprimere il logaritmo come sviluppo di Taylor in un disco. Allora consideriamo un disco con centro al
punto 1. Dallo sviluppo di Taylor
con centro in 1 del logaritmo reale abP
n1 n
biamo P
la formula ln(1 + t) =
(1)
t /n, da cui, ponendo x = 1 + t,
n=1

n1
n
ln x = n=1 (1) (x 1) /n. Allora dobbiamo estendere questo sviluppo
di Taylor a variabile complessa semplicemente complessicando i polinomi di
Taylor, ossia ponendo

X
(z 1)n
ln z =
(1)n1
.
n
n=1

La serie converge nel disco complesso {z : |z 1| < 1}. Osserviamo che,


derivando questa serie di potenze, otteniamo

1
1
= .
1 (1 z)
z
n=1
n=0
(2.58)
Allora, sia una qualunque curva di classe C 1 a tratti (o assolutamente
Rx
continua) con immagine nel disco D := {z : |z1| < 1}. Poich ln(x) = 1 du
u
(qui stiamo integrando il logaritmo ordinario sul semiasse reale, ed usando il
fatto che D ln(x) = 1/x), dal Corollario 2.14.12 si ha
Z z
du
ln(z) =
u
1
D ln(z) =

(1)

n1

(z 1)

n1

(1)n (z 1)n =

se lintegrale eseguito lungo una curva con immagine in D, ed il risultato non


dipende dalla scelta della curva (o alternativamente, senza usare il Corollario,

310

CAPITOLO 2. ANALISI COMPLESSA

basta integrare termine a termine lidentit (2.58)).


Dal Corollario 2.14.12 segue inne la formula del prolungamento analitico
del logaritmo, che rienunciamo per memoria:
Corollario 2.14.13. Ogni elemento analitico fRw del logaritmo complesso,
lungo una curva C 1 a
centrato in un punto w 6= 0, del tipo fw (z) = du
u
tratti (o assolutamente continua) da 1 a z che non passa per lorigine.
A titolo di esempio, consideriamo la curva di classe C 1 a tratti che congiunge
1 con z = rei , con r > 0, data da un tratto iniziale da 1 a r lungo il semiasse
reale positivo, seguito dallarco di circonferenza da r a rei (percorso solo una
volta, senza giri intorno allorigine, ossia con variazione angolare minore di
2). Dal precedente Teorema ?? si ottiene lespressione ln(z) = ln(r) + i. Se
invece larco di circonferenza ha una variazione angolare maggiore di 2, ossia
la curva lungo la circonferenza percorre diciamo N giri intorno allorigine
(considerando N positivo se il percorso antiorario e negativo altrimenti),
allora occorre aggiungere al secondo membro laddendo 2Ni. Questi sono
esattamente i risultati che abbiamo ottenuto per via diretta nella Sottosezione
2.14.1, e ribadiscono il fatto che il prolungamento analitico del logaritmo
polidromo.
Definizione 2.14.14. Consideriamo il disco aperto privo del centro C = {z :
0 < |z a| < r}, e sia f una funzione olomorfa ottenuta dal prolungamento
analitico di un suo elemento. Il punto a si dice punto di diramazione di f se
il prolungamento analitico polidromo in C.
Consideriamo ora il piano complesso esteso con laggiunta di un punto
allinnito (si pu pensare come la compatticazione di C con un punto,
ma ora la topologia non ci serve). Diciamo che il punto un punto di
diramazione di f se 0 lo per la funzione z 7 f (1/z).
Esempio 2.14.15. Enunciamo quanto segue.
(i) Per ogni > 0 e z 6= 0, le funzioni f (z) = 1/z hanno serie di Taylor
convergente nel disco {w : |w z| < |z|} (ovvero il disco aperto con
centro z e raggio tale che lorigine stia nella sua frontiera), ed hanno
prolungamento analitico monodromo a tutto C \ {0}. Non ci sono
quindi punti di diramazione.
(ii) I punti di diramazione del logaritmo complesso sono 0 e .

2.14. PROLUNGAMENTO ANALITICO


(iii) la funzione reale
arctan(x) =

311

1
dt
1 + t2

ha come prolungamento analitico la primitiva complessa di 1/(1 + z 2 ),


ossia la funzione olomorfa
Z z
1
arctan(z) =
dw
2
0 1+w
dove lintegrale si intende su una curva C 1 a tratti (o assolutamente continua) che non passa per i punti i. Ci sono due punti di diramazione:
i.
(iv) Per ogni intero n > 1, la funzione radice n-sima, fn (z) = z 1/n , olomorfa in ciascun disco che non contiene lorigine nel suo interno (non
olomorfa allorigine). Essa ha due punti di diramazione, 0 e . Per
il punto (i) pi sopra la funzione hn (z) = nz n1 olomorfa in C \ {0}
(ha prolungamento analitico monodromo a partire da qualsiasi disco
aperto che non contenga lorigine), ed il prolungamento analitico della
radice n-sima lintegrale
Z

n
z = 1 + n z n1 dz

lungo una qualsiasi curva continua C 1 a tratti (o assolutamente continua) che congiunga 1 a z senza passare per lorigine. Lintegrale
dipende dalla curva scelta se essa ha indice di avvolgimento non nullo
(modulo n) intorno allorigine, e quindi si ha polidromia.
Dimostriamo le quattro asserzioni. Per quanto concerne la parte (i), lunica
singolarit di f (z) = 1/z nellorigine. Se il prolungamento analitico a
partire da un qualunque disco (con centro z0 6= 0) che non contiene lorigine
fosse polidromo, ci sarebbe una curva chiusa C 1 a tratti che gira intorno
allorigine (cio con indice di Ravvolgimento non nullo rispetto allorigine) tale
che lintegrale lungo la curva f dz a secondo membro dellidentit 2.57 del
Teorema Fondamentale sarebbe non nullo. Ma f proporzionale a 1/z +1 ,
che ha un
R polo nellorigine solo per = 0. Per il Teorema dei residui 2.10.5,
quindi, f dz = 0 per ogni > 0 (ed evidentemente anche per ogni 6 0,
visto che per questi la funzione f intera.

312

CAPITOLO 2. ANALISI COMPLESSA

Consideriamo ora la parte (ii). Sappiamo gi che per curve che girano intorno
a 0 (ossia con indice di avvolgimento non nullo rispetto a 0) il logaritmo ha
prolungamento analitico polidromo, quindi 0 un punto di diramazione, ma
nessun altro z C lo , perch il logaritmo olomorfo in qualche disco non
bucato intorno a qualsiasi z 6= 0: l il suo sviluppo di Taylor convergente
ed il logaritmo monodromo, dunque lo rimane anche se buchiamo il disco
togliendogli il centro. Inne, poich ln(1/z) = ln(z), anche un punto
di diramazione.
Veniamo alla parte (iii). Segue dal Corollario 2.14.12 che il prolungamento
analitico della funzione reale arctan(x) dato da
Z z
1
dw
arctan(z) =
2
0 1+w
lungo una qualsiasi curva da 0 a z dentro il dominio di olomora di w 7
1/(1 + w 2) . chiaro che questa funzione olomorfa in C \ {i}: come nella
parte precedente, nessuno di questi punti di diramazione. Mostriamo ora
che i punti i sono invece punti di diramazione. Osserviamo che

Z 
Z z
1 z
1
1
1
dw
arctan(z) =
dw =
+
2
2 0 1 iw 1 + iw
0 1+w
=

1
1 + iz
1
(ln(1 + iz) ln(1 iz)) = ln
.
2i
2i 1 iz

(2.59)

Le uniche singolarit sono i punti i, che corrispondono a zeri delle due


funzioni z 7 1 iz che sono gli argomenti del logaritmo, ed il logaritmo ha
lunico suo punto di diramazione al nito proprio in zero. quindi chiaro
che la funzione arcotangente complessa non ha altri punti di diramazione
al nito che in i. Mostriamo che questi due punti sono di diramazione
prendendo una curva chiusa che gira intorno ad uno dei due punti, diciamo
z = i, e non allaltro (ossia che non incontra la semiretta {it : t 6 1}:
non importa quale di queste curve scegliamo
perch, grazie al Teorema di
R
invarianza omotopica 2.4.7, lintegrale arctan z dz non dipende dalla scelta
di nel dominio semplicemente connesso C \ {it : t 6 1}. Scegliamo allora
la curva pi naturale, la circonferenza con verso antiorario (t) = i + eit , con
0 6 t 6 2. Limmagine dei punti di sotto la funzione z 7 1 + iz la
curva

t 7 1 + i(t) = ieit = ei(t+ 2 ) ,

2.14. PROLUNGAMENTO ANALITICO

313

che per 0 6 t 6 2 compie un giro in senso antiorario intorno al punto


z = i (ossia ha indice di avvolgimento 1). Quindi nel percorrere questa curva
chiusa laddendo ln(1 + iz) in (2.59) aumenta di 2i, e quindi il punto z = i
un punto di diramazione per larcotangente complessa. Se utilizziamo invece
la curva (t) = i + eit segue che z = i un altro punto di diramazione.
In questo caso per limmagine di sotto la funzione z 7 1 iz una
curva che gira intorno al punto i in senso orario. Al termine di un giro,
quindi, laddendo ln(1 + iz) in (2.59) aumenta di 2i. Si osservi che, se si
sceglie una curva chiusa che gira una volta intorno alla coppia di punti i,
ad esempio la circonferenza con centro lorigine a raggio 2, alla ne del giro
i due addendi ln(1 iz) subiscono incrementi che si bilanciano, e quindi su
queste curve larcotangente dopo un giro non cambia.
Poich il logaritmo complesso ha un punto di diramazione a , resta da
vedere se il punto allinnito o no di diramazione per larcotangente. In base
alla Denizione 2.14.14 di punto di diramazione allinnito, questo equivale
a vericare se la funzione arctan(1/z) o no olomorfa in z = 0. Segue da
(2.59) che
arctan(1/z) =

1
1 + i/z
1
z+i
1
ln
= ln
= (ln(z + i) ln(z i)) ,
2i 1 i/z
2i z i
2i

che olomorfa in z = 0 perch lo sono le due funzioni z 7 ln(z i). Quindi


larcotangente complessa non ha un punto di diramazione allinnito.
Consideriamo inne la parte (iv). Scriviamo z 6= 0 in forma polare:
z = ei . Allora


n
z = n ei n
e se una curva chiusa che parte da z ha indice di avvolgimento 1 intorno
allorigine, al suo ritorno a z il valore della funzione diventa

ei

+2
n

=e

2i
n n

ei n

quindi il valore della funzione ottenuto dopo un giro si ottiene moltiplicando


quello di partenza per la prima radice n-sima dellunit (Notazione 14.2.1).
Analogamente, se lindice di avvolgimeno k, al termine della curva, ovvero

al suo ritorno a z dopo k giri, il valore ottenuto e2ik/n n ei/n . Dopo n giri
si ritorna al valore iniziale.
Se invece una curva ha indice di avvolgimento nullo intorno allorigine, allora
al termine della curva largomento non cambiato rispetto allinizio (Nota

314

CAPITOLO 2. ANALISI COMPLESSA

2.3.3), e quindi il valore della funzione radice n-sima non cambia.


Quindi lorigine un punto di diramazione, e non ci sono altri punti di
diramazione al nito.
Mostriamo che c unppunto di diramazione allinnito. Basta mostrare che la
funzione reciproca, n 1/z = z 1/n ha un punto di diramazione in 0. Questo
fatto segue dallo stesso argomento pi sopra, visto che, scrivendo z = ei , si
ottiene z 1/n = 1/n ei/n , e quindi un giro intorno a zero cambia il valore
di di 2 ma moltiplica il valore di z 1/n per la radice dellunit e2i/n .
Se tagliamo il piano complesso con una curva semplice che unisca i due
punti di diramazione, ad esempio una qualsiasi semiretta uscente dallorigine,
allora il piano tagliato un dominio semplicemente connesso in cui il prolungamento analitico monodromo, come al solito per il teorema di monodromia
(Corollario 2.14.10).
Inne, lespressione in forma integrale del prolungamento analitico della
radice n-sima segue dal Corollario 2.14.12.

Nota 2.14.16. Riesaminiamo le parti (ii) e (iii) dellEsempio 2.14.15. Nel


caso della funzione logaritmo, uno dei punti di diramazione 0 e laltro non
in C bens allinnito. Per, se tagliamo il piano con una curva da 0 a
(ad esempio una qualunque semiretta uscente dallorigine), la parte (ii)
del suddetto esempio mostra che si ha monodromia nel piano tagliato (e del
resto, il piano tagliato semplicemente connesso, e si applica il teorema di
monodromia).
Ora consideriamo una funzione con solo due punti di diramazione z, w
C. Senza perdita di generalit, tramite rotazioni e dilatazioni, possiamo assumere che questi due punti siano {i}, come nel caso dellarcotangente.
Se ora tagliamo il piano complesso con due semirette disgiunte che partono
rispettivamente da i e i (e vanno allinnito), stiamo escludendo tutte le
curve che attraversano il taglio, ossia che girano intorno ai punti di diramazione. In tal modo il prolungamento analitico lungo queste curve, ovvero in
questo dominio con taglio, necessariamente monodromo. Anche in questo
caso, comunque, si applica il teorema di monodromia, perch il piano tagliato con queste due semirette semplicemente connesso. Questo il caso
dellarcotangente, che per interessante riconsiderare con maggiore cura.
Prima abbiamo considerato il taglio del piano complesso eettuato con due
semirette, come ad esempio {it : |t| > 1}. Se invece avessimo tagliato il
piano s+con il segmento che congiunge i a i, ossia {it : |t| 6 1}, non si
escludono pi le curve che girano intorno ai punti di diramazione, ma solo

2.14. PROLUNGAMENTO ANALITICO

315

quelle che girano un numero diverso di volte intorno ai punti di diramazione


(ad rsempio, si escludono quelle che girano intorno ad uno dei due punti ma
non allaltro), ed inoltre il piano cos tagliato non semplicemente connesso.
Nondimeno, la parte (iii) dellEsempio 2.14.15 mostra che anche in questo
caso il prolungamento analitico lungo una curva chiusa che non interseca il
taglio riconduce allo stesso elemento analitico iniziale, e quindi monodromo
(Corollario 2.14.6). Si badi per che in realt la funzione arcotangente olomorfa anche allinnito, come mostrato alla ne della parte (iii) dellEsempio
2.14.15, ed il dominio := C {} \ {it : |t| 6 1} semplicemente connesso
(ogni curva che gira intorno al segmento {it : |t| 6 1} viene deformata con
continuit nel punto allinnito semplicemente dalla famiglia di dilatazioni
con centro lorigine, che una omotetia in ).

Espandiamo queste osservazioni nella prossima Sottosezione 2.14.5.

2.14.5

Rami olomorfi

Sia D il disco di convergenza di una serie di Taylor f . Supponiamo che lelemento di funzione (f, D) abbia un prolungamento analitico (gt , Dt ) lungo i
punti di ogni curva continua con immagine in un dominio connesso ad
un disco di convergenza Dt centrato in (t). Abbiamo visto che tale prolungamento monodromo, ovvero denisce una funzione olomorfa in , se
e solo se esso non dipende dalla scelta della curva: per ogni due curve che
cominciano a z e niscono al punto w, diciamo per t = 1, la condizione
che a t = 1 entrambe portino allo stesso elemento di funzione (g1 , D1 ). In
maniera equivalente, la condizione per la monodromia che, per ogni curva
chiusa da z a z lungo cui si ha prolungamento analitico no ad un elemento di funzione nale (g1 , D1 ), si abbia (f, D) = (g1 , D1 ) (Corollario 2.14.6).
Abbiamo anche visto che, se semplicemente connesso e il prolungamento
analitico possibile lungo ogni curva in , allora questa condizione sempre
vericata e si ha monodromia (Corollario 2.14.10).
Definizione 2.14.17. (Rami olomorfi del prolungamento analitico.)
In un dominio connesso C scegliamo un qualunque elemento di funzione
(f, D) (ossia una serie di Taylor f convergente in un disco D con centro in
un punto z ). Supponiamo che valga la condizione seguente:
per ogni curva chiusa in che passa per z (pi precisamente, che contiene z
nella sua immagine), sia possibile il prolungamento analitico di (f, D) e che

316

CAPITOLO 2. ANALISI COMPLESSA

lelemento di funzione che si ottiene al ritorno a z al termine della curva sia


ancora lelemento (f, D).
Allora la funzione olomorfa in che ristretta a D coincide con f , data dal
prolungamento analitico nel senso del Corollario 2.14.10, si chiama il ramo
olomorfo generato da f . Se invece il prolungamento analitico possibile lungo
ogni curva continua in ma non vale la condizione pi sopra formulata lungo
le curve chiuse (ovvero, il prolungamento dipende dalla scelta della curva),
allora sia (g, D1 ) un qualsiasi elemento di funzione che si ottiene a partire
da (f, D) in un disco D1 con centro z percorrendo curve chiuse a partire
da z. Allora diciamo che (g, D1) genera un diverso ramo olomorfo della
funzione polidroma f in un dominio ottenuto tagliando con una curva
continua che includa nella propria immagine tutti i punti di diramazione di
tale funzione polidroma (ovvero, in ogni dominio le cui curve portino ad
un prolungamento analitico monodromo).
Esempio 2.14.18. (Rami olomorfi del logaritmo.) Abbiamo gi studiato
il comportamento della funzione logaritmo in C \ {0}, un dominio in cui il
logaritmo polidromo. Se tagliamo da C limmagine di una qualsiasi curva
semplice continua che parte dallorigine e va allinnito, ad esempio le semirette r (t) = tei , allora il piano tagliato cos ottenuto semplicemente
connesso ed ivi il prolungamento analitico del logaritmo genera un ramo olomorfo. Ad esempio, tradizione scegliere = , e come elemento analitico
di partenza quello che coincide con il logaritmo reale in un intorno del punto
1 sullasse {x > 0}. Calcoliamo quanto vale ln(i) per questa scelta di ramo
olomorfo ( in questa scelta di ramo olomorfo che il logaritmo complesso si
indica con ln invece che con log). Non importa quale curva continua da 1 a i
scegliamo in = , che un dominio semplicemente connesso (e quindi il
prolungamento analitico lungo le curve dipende solo dai punti estremi). Per
convenienza, il lettore potrebbe ad esempio scegliere larco di circonferenza
di centro lorigine e raggio 1 percorso in senso antiorario dal punto 1 (angolo
iniziale 0) al punto i (angolo nale 2 ). Sappiamo dalla identit (2.53), o
equivalentemente dal Corollario 2.14.13, che il risultato ln(i) = i/2. Osserviamo che la circonferenza non poteva essere percorsa in senso orario in
a causa del taglio.
Ora risvolgiamo il calcolo di log(i) per il ramo olomorfo generato dallo stesso
elemento analitico ma nel dominio /4 ottenuto tagliando il piano con la
bisettrice del primo quadrante. Ora il percorso antiorario sulla circonferenza
di raggio centro lorigine e raggio 1 impedito dal taglio, e dobbiamo invece

2.14. PROLUNGAMENTO ANALITICO

317

percorrere tale curva in senso orario: langolo varia da 0 a 2 + 2 = 3/2,


e quindi in questo ramo olomorfo il risultato diventa log(i) = 3i/2. Fissato un qualsiasi taglio come sopra, altri rami olomor si ottengono a partire da
elementi analitici diversi, i quali comunque dieriscono per una costante (da
ciascuno al successivo ottenuto un giro dopo intorno allorigine la dierenza
2i, come visto in (2.53).
Si noti che, nei dominii (connessi) di olomora dei rami olomor del
logaritmo, vale la regola equivalente a (2.53):
log(r0 ei0 ) log(r1 ei1 ) = ln(r0 /r1 ) + i(0 1 ) .

(2.60)

Nota 2.14.19. Due rami olomor della stessa funzione possono essere generati dallo stesso elemento di funzione (f, D) in due dominii diversi 0 e 1 .
Quando questo accade, non detto che i due rami olomor coincidano in
0 1 sebbene coincidano entrambi con f in D: un esempio dato dai due
rami olomor del logaritmo nei dominii 0 e /4 del precedente Esempio
2.14.18. Si noti per che i due rami olomor cos ottenuti dieriscono in differenti componenti connesse di 0 /4 : il calcolo svolto in quellEsempio
mostra che nella componente connessa dellintersezione che contiene il disco
D i due rami olomor coincidono. Questo fatto sempre vero, dal momento
che due funzioni olomorfe che coincidono in un disco D devono coincidere in
ogni connesso che contiene D ed in cui sono entrambi olomorfe (Corollario
2.6.2).

Esempio 2.14.20. (Rami olomorfi dellarcotangente.) Ritorniamo a considerare larcotangente complessa, studiata nella parte (iii) dellEsempio
2.14.15. Ci sono due punti di diramazione, z = i. Calcoliamo il prolungamento dellelemento analitico dellarcotangente che in un segmento dellasse
reale intorno ad un punto > 0 coincide con larcotangente reale, per due
diversi rami olomor. Consideriamo i due dominii 0 = C \ {it : |t| > 1} e
1 = C \ {it : 1 6 t 6 1}. Il dominio 0 semplicemente connesso, e per
il teorema di monodromia (Corollario 2.14.10) sappiamo gi che lelemento analitico considerato si prolunga allunica funzione olomorfa che sullasse
reale coincide con larcotangente reale. Per conferma, se si vuole svolgere il
calcolo del prolungamento lungo le curve, si puo calcolare arctan() lungo
il segmento reale da a :
con il risultato del Teorema
R questo2 coincide
1
2.14.12, ovvero lintegrale (1 + w ) dw della derivata dellarcotangente

318

CAPITOLO 2. ANALISI COMPLESSA

lungo tale segmento reale, ed ovviamente porta al valore dellarcotangente


reale al punto (e del suo prolungamento analitico in un disco con centro
in che coincide con larcotangente reale sul diametro reale).
Invece il dominio 1 non semplicemente connesso, ed il teorema di monodromia non si applica: ma abbiamo osservato nella Nota 2.14.16 che anche in
questo caso vale la propriet di coerenza lungo le curve chiuse enunciata nella
Denizione 2.14.17, ed il prolungamento monodromo. In base alla precedente Nota 2.14.19, il ramo olomorfo determinato in 1 dallo stesso elemento
di funzione di prima denito in un intorno del punto 1 deve coincidere con
quello determinato in 0 nella componente connessa di 0 1 che contiene il
punto 1, ma nel nostro caso tale componente connessa il semipiano destro.
Cosa succede nel semipiano sinistro? Ad esempio, se come prima partiamo
dal punto > 0 e dalla funzione arcotangente reale in un segmento dellasse
reale centrato in , che valore per larcotangente troviamo al punto per
il ramo olomorfo determinato da 1 ?
Per calcolare il risultato possiamo usare lidentit (2.59):
arctan(z) =

1
1 + iz
1
ln
= (ln(1 + iz) ln(1 iz)) .
2i 1 iz
2i

Osserviamo che, a causa di questa identit, il resto di questo Esempio in


realt diventa lo studio della funzione polidroma g(z) = ln((1 iz)/(1 + iz)),
la quale diventa monodroma se tagliamo il piano con il segmento da i a
i (o la coppia di semirette lungo lasse immaginario da questi due punti
allinnito).
Prendiamo per comodit > 1 e scegliamo la curva dal punto al punto data dalla semicirconferenza percorsa in verso antiorario con centro
lorigine e raggio (ma se il verso fosse orario il risultato sarebbe lo stesso,
in base a quanto osservato nella Nota 2.14.16). Denotiamo con la semicirconferenza appena indicata, (t) = eit , con 0 6 t 6 . Per una generica
funzione f su C, indichiamo con f la dierenza dei valori di f fra il punto
nale e quello iniziale di gamma. Pertanto dobbiamo calcolare


1 + iz
+ i arg 1 + iz

g() = g() + g = g() + ln
1 iz
1 iz


1 + iz
+ i arg(1 + iz) i arg(1 iz) . (2.61)
= g() + ln
1 iz

Limmagine dei punti di sotto la funzione z 7 1 + iz la semicirconferenza t 7 1 + i(t) = 1 + ieit , che compie mezzo giro intorno allorigine con

2.14. PROLUNGAMENTO ANALITICO

319

verso antiorario. Essa va da 1 + i a 1 i ed interseca lasse reale nel punto


1 . Invece limmagine di sotto la funzione z 7 1 + iz la semicirconferenza t 7 1 i(t) = 1 ieit , che compie mezzo giro intorno allorigine in
senso orario, va da 1 i a 1 + i ed interseca lasse reale nel punto 1 + :
pertanto si mantiene nel dominio consueto di olomora = C \ (, 0]
del ramo consueto del logaritmo complesso, e si applica lidentit (2.53), ma
ad entrambe le semicirconferenze si applica comunque lidentit (2.60). La
semicirconferenza t 7 1 i(t), (0 6 t 6 ), congiunge 1 i a 1 + i,
e largomento varia da quello di 1 i, ovvero arctan(rho) = arctan
(questa arcotangente quella reale!) a quello di 1+, ovvero arctan . Poich
|1 i| = |1 + i|, in base a (2.53) la variazione del logaritmo lungo questa
semicirconferenza 2i arctan . Analogamente, laltra semicirconferenza va
da 1 + i a 1 i, passando a sinistra dellorigine, ossia intersecando il semiasse reale negativo. Per calcolare la variazione del logaritmo lungo di essa
dobbiamo quindi scegliere un altro dominio tagliato: tagliando ad esempio
lungo il semiasse reale positivo otteniamo un ramo olomorfo del logaritmo
che lungo questa semicirconferenza, in base a (2.60) ha variazione data da
2i 2i arctan . Sottraendo i risultati, otteniamo che la variazione lungo
la semicirconferenza di g(z) = ln(1 + iz) ln(1 iz) esattamente 2i, e
quindi la variazione di arctan z = (ln(1 + iz) ln(1 iz))/2i . Pertanto
arctan() = arctan() + (in questa identit arctan denota il ramo olomorfo dellarcotangente complessa che coincide con larcotangente reale sulla
semiretta positiva). Una volta scelto il dominio con taglio, sia esso 0 o 1 ,
poich questi due dominii sono semplicemente connessi e si ha monodromia
dei rami olomor, larcotangente si spezza in una famiglia di rami olomor.
Dalla formula arctan(z) = 2i1 ln(1 + iz)/(1 iz) e dal fatto che i rami olomor del logaritmo dieriscono di un addendo multiplo di 2i segue che i
rami olomor dellarcotangente dieriscono di multipli di .

Esercizio 2.14.21. Calcolare la variazione dellarcotangente da un lato allaltro del segmento di taglio {iy : |y| 6 1}.

Svolgimento. Rammentando che arctan(z) = 2i1 (ln 1 + iz ln(1 iz)), questo


equivale a calcolare i valori limite sui due lati del taglio della funzione g(z) =
ln 1 + iz ln(1 iz).
Supponiamo di considerare il taglio dato dal segmento che congiunge i punti
i e i, ossia il dominio di monodromia 1 nel precedente Esempio 2.14.20.
Scegliamo il ramo olomorfo che verica la condizione limx0+ ,y0 g(z) = 0
(ossia limx0+ ,y0 arctan z = 0), e calcoliamo (pi in generale) i valori di

320

CAPITOLO 2. ANALISI COMPLESSA

questo ramo olomorfo su tutti i punti dellasse immaginario utilizzando la


identit (2.61).
Cominciamo dai valori sul lato destro del taglio. Indichiamo con g(0+ +iy)
i valori g(iy) ottenuti come limiti dal semipiano destro: prendendo 1 <
y < 1 questi sono i valori limite sul taglio provenendo dal semipiano destro.
Partiamo dal punto di riferimento 0 + +i0 e raggiungiamo 0+ + iy con un
segmento lungo il margine destro del taglio (o se si preferisce, con una
curva leggermente a destra del taglio, che poi spostiamo facendola aderire da
destra al segmento di taglio). Lungo questo segmento gli angoli rispetto ai
punti i non cambiano, ossia arg(1 + iz) = 0 = arg(1 iz). Pertanto,
da (2.61) si ottiene


1 y
= ln 1 y
g(0 + +iy) = ln
1 + y
1+y

(poich |y| < 1, largomento del logaritmo positivo ed il modulo non


occorre).
Ora otteniamo i valori di g(iy) per y > 1, ossia sullasse immaginario
positivo al di sopra del segmento di taglio. Adesso non possiamo usare una
curva che consiste di un segmento rettilineo lungo lasse immaginario da
0 a iy, perch questo segmento passa per il punto i che una singolarit
di g. Dobbiamo aggirare la singolarit come abbiamo fatto nel calcolo dei
residui. Lo facciamo mantenendoci nel semipiano destro, ssando un > 0
e percorrendo la curva data dal segmento da 0 + +i0 a 0 + +i(1 ),
seguita dalla semicirconferenza con centro i e raggio da 0 + +i(1 ) a
i(1 + ) (che compie un mezzo giro in verso antiorario intorno al punto i),
completata inne dal segmento rettilineo da i(1 + ) a iy (si veda la Figura
2.10). Lungo i segmenti rettilinei gli argomenti non variano, ma variano
lungo la semicirconferenza nel modo seguente:
arg(1 + iz) = arg

zi
= arg(z i) =
i

arg(1 iz) = 0 .
Pertanto in questo caso si ottiene


1 y
+ i = ln y 1 + i
g(iy) = ln
1 + y
1+y

(ora 1 + y > 0 ma 1 y < 0, e quindi il modulo porta ad un cambiamento di


segno).

2.14. PROLUNGAMENTO ANALITICO

321

-i

Figura 2.10:

Percorso per il prolungamento analitico dellarcotangente sullasse


immaginario iy per y > 1

Una situazione simmetrica si ha nel calcolo di g(iy) per y < 1. Procediamo con la curva che rasenta da destra il taglio no a distanza dal punto
i, poi prosegue con la semicirconferenza nel semipiano destro di centro i
e raggio (che compie un mezzo giro in verso orario intorno al punto i),
poi continua lungo il semiasse immaginario negativo no al punto iy (Figura
2.11). Ora le variazioni angolari sono le seguenti:

-i

Figura 2.11:

Percorso per il prolungamento analitico dellarcotangente sullasse


immaginario iy per y < 1

322

CAPITOLO 2. ANALISI COMPLESSA


arg(1 + iz) = 0
arg(1 iz) = arg

z+i
= arg(z + i) = .
i

Quindi in questo caso si ottiene




1 y
i = ln y 1 i
g(iy) = ln
1 + y
1+y

(qui 1 + y < 0 e 1 y > 0, ed il modulo porta di nuovo ad un cambiamento


di segno).
Inne, consideriamo i punti sul bordo sinistro del taglio: calcoliamo i
valori di g(0 + iy) per |y| < 1. Seguamo ad esempio la curva che da
0+ +i0 si muove lungo il lato destro del taglio nella direzione positiva dellasse
immaginario no a distanza dal punto i, poi percorre lintera circonferenza
di raggio intorno ad i, da 0+ + i(1 ) a 0 + i(1 ), ed inne scende lungo
il lato sinistro del taglio no al punto 0 + iy. (Figura 2.12). variazione

-i

Figura 2.12: Percorso per il prolungamento analitico dellarcotangente sullasse


immaginario sul lato sinistro del taglio [i, i]
angolare solo lungo la circonferenza, e precisamente
arg(1 + iz) = arg
arg(1 iz) = 0 ,

zi
= arg(z i) = 2
i

2.14. PROLUNGAMENTO ANALITICO

323

e quindi abbiamo


1 y

+ 2i = ln 1 y + 2i
g(0 +iy) = ln
1 + y
1+y

(il numeratore ed il denominatore della frazione sono entrambi positivi, ed il


modulo non serve).
Invitiamo il lettore a vericare il comportamento analogo della funzione
ottenuta ruotando la variabile di /2, ossia moltiplicandola per i: si tratta
della funzione
1z
h(z) = ln
.
1+z
Scegliamo come taglio lintervallo reale [1, 1]. Il lettore pu vericare i
propri calcoli con quelli svolti in [10, Capitolo t, Sezione 7], che la fonte di
questo esercizio.

Esempio 2.14.22. (Rami olomorfi della radice.) Abbiamo visto nella


parte (iv) dellEsempio 2.14.15 che la radice n-sima ha un prolungamento
analitico polidromo in C \ {0}, e che al termine di ogni curva con indice di
avvolgimento k 6= 0 intorno allorigine il valore della radice n-sima cambia
per la moltiplicazione per la k-sima radice dellunit, ma non ci sono altri
punti di diramazione a parte il punto allinnito. Ci sono quindi esattamente
n rami olomor, in un qualunque dominio tagliato con una semiretta uscente
da 0. Per comodit prendiamo il dominio = C \ [0, +). Se prendiamo
un punto > 0 sul lato superiore del taglio e percorriamo la circonferenza
(antioraria) di raggio , al termine ritorniamo a dal lato inferiore. Ilm
valore su tale lato quello di prima moltiplicato per e2i/n . Interessante
il caso della radice quadrata, che ha esattamente due rami olomor, ed al
termine del giro il valore lopposto che allinizio (quindi sui lati del taglio

si ottengono rispettivamentele funzioni e ).


Ad esempio, calcoliamo i nel ramo olomorfo in scelto
in modo
che sul

lato superiore del taglio si abbia la funzione positiva x (ossia, 1+ = 1,


con la notazione del precedente esempio 2.14.20. Per il calcolo, usiamo una
curva qualsiasi che non attraversa il taglio, parte da 1+ e nisce in i: ad
esempio un arco di circonferenza di raggio
1 percorso in senso antiorario.
La variazione angolare /2, e quindi i = ei/4 in questo ramo. Ma se
scegliamo un altro ramo grazie ad un taglio che laascia i punti 1 e i su lati
opposti, ad esempio la bisettrice del primo quadrante, allora occorre scegliere
una curva che gira in senso opposto, ad esempio larco orario della stessa

324

CAPITOLO 2. ANALISI COMPLESSA

circonferenza con variazione angolare di 3i/2. In tal caso il valore della


radice diventa e3i/4 . Osserviamo, come del resto palese, che il primo
valore lopposto del secondo, ossia si ottiene dal secondo moltiplicandolo
per la radice dellunit ei = 1: questo evidentemente necessario, perch
la dierenza fra i due percorsi che abbiamo seguito corrisponde ad un giro
intorno allorigine.

Esercizio 2.14.23. Applicando lesempio precedente


sulla radice, studiamo i

rami olomor della funzione composta f (z) = 1 z 2 .

Svolgimento. La radice ha il solo punto di diramazione al nito nellorigine,


e il radicale 1 z 2 si annulla solo in z = 1, quindi questi sono gli unici punti di diramazione al nito della funzione composta f . Nel dominio tagliato
0 = C \ {(, 1] [1, )}, che semplicemente connesso, esistono quindi
rami olomor, e sono esattamente due perch due sono i rami olomor della
radice: essi sono uno opposto dellaltro, esono identicati dalla
scelta del

2
valore per x nellintervallo reale [1, 1]: o 1 x oppure 1 x2 .
Se invece si considera il dominio tagliato 0 = C\[1, 1], che non semplicemente connesso, procediamo come abbiamo fatto per larcotangente nellEsempio 2.14.22. Basta osservare che ogni curva che gira in senso antiorario
intorno al punto 1 produce dopo un giro un incremento di 2 dellargomento di 1 z, ed ogni curva che gira in senso antiorario intorno a 1 produce
dopo un giro un incremento di 2 dellargomento di 1 + z. Quindi una curva
che gira intorno al taglio [1, 1] lascia invariato arg(1 z) + arg(1 + z) =
arg((1 z)(1 + z)) = arg(1 z 2 ). Daltra parte,

1 z2 =

|1 z 2 |ei

arg(1z 2 )
2

e quindi, al termine del giro, il valore della funzione non cambia: si ha


monodromia del prolungamento analitico. Anche in questo caso si trovano
due rami olomor, opposti uno dellaltro. Lasciamo al lettore di vericare
che i valori ai bordi superiore ed inferiore dei tagli per questi rami olomor
sono opposti uno dellaltro.

2.15

Interpolazione olomorfa sulle strisce

Dal teorema del massimo modulo (Corollario 2.8.3) sappiamo che, se una
funzione f olomorfa in un aperto D e continua sulla sua chiusura, allora il

2.15. INTERPOLAZIONE SULLE STRISCE: IL TEOREMA DI PHRAGMNLINDELF325


suo massimo si trova sulla frontiera. Se f intera (ossia olomorfa su tutto C)
e non cresce troppo rapidamente, ci resta vero, nel senso che f costante
(Corollario 2.8.6), ma altrimenti in generale no. Ad esempio:
Esempio 2.15.1. Sia S1 la striscia S1 = {z C : | Im z| 6 /2}, e
z

f (z) = ee .
Allora se z = x R i valori f (x) = exp(exp x) divergono pi che esponenzialmente, ma, dal momento che exp(i 2 ) = i, i valori di f sulla frontiera
di S1 ,



x
x i
f xi
= ee e 2 = eie ,
2
hanno modulo 1. Analogo risultato si ha per la funzione g(z) = exp(exp(iz))
sulla striscia S2 = {z C : | Re z| 6 /2}.

Il prossimo teorema mostra che, se una funzione olomorfa su una striscia


ha un tasso di crescita esponenziale pi lento che nellEsempio 2.15.1, allora
limitata ed il suo massimo viene assunto sulla frontiera della striscia.
Teorema 2.15.2. (PhragmnLindelf.)
(i) Sia S/2 la striscia S := {z C : | Re z| 6 /2} e f una funzione
olomorfa su S/2 e continua su S /2 . Se per ogni z = x + iy in S e per
qualche costante < 1 e A, M < vale la stima
|f (z)| 6 M eA e

|y|

(2.62)

allora |f | 6 M su tutto S/2 .


(ii) Sia Sa,b la striscia Sa,b := {z C : a < | Re z| < b} e f una funzione
olomorfa su Sa,b e continua su S a,b . Poniamo
M(x) = sup |f (x + iy| .
yR

Se f limitata su S, diciamo |f | 6 K, allora il logaritmo di M una


funzione convbessa in (a, b), ossia
M(x)ba 6 M(a)bx M(b)xa .

326

CAPITOLO 2. ANALISI COMPLESSA

Dimostrazione. Per dimostrare la parte (i), ssiamo tale che 0 < < 1 e
> 0. Poniamo
iz
iz
h (z) = e2 cos(z) = e(e +e ) .
(2.63)
Poich eiz = ei(x+iy) = eix ey e |x| 6 /2 in S/2 , in questa striscia si ha
Re(eiz + eiz ) = 2 cos(x) (ey + ey ) > cos(/2) (ey + ey ) . (2.64)
Poniamo := cos(/2). Dal momento che < 1 abbiamo > 0, e quindi
dalle disuguaglianze (2.15) e (2.64) segue che, per z S/2 ,
|h (z)| = eRe((e

iz +eiz ))

6 e (e

y +ey )

Poich lesponente (ey +ey ) positivo abbiamo |h | < 1 su S/2 , e quindi,


visto che |f | < M, vale la disuguaglianza
|f h | < M

perogni S/2 .

(2.65)

Invece, per ogni z S/2 , dallipotesi (2.62) e dalla disuguaglianza (2.64)


segue

y
y
|y|
|f (z) h (z)| 6 M eA e cos( 2 ) (e +e ) .

Ora osserviamo che cos
> 0 e > . Pertanto lesponente al lato
2
destro dellultima disuguaglianza tende a per |y| e quindi esiste
y0 > 0 tale che |f (z) h (z)| < M per z S/2 e | Im z| = |y| > y0 . Daltra
parte, sappiamo da (2.65) che la stessa disuguaglianza vale per per z S/2 ,
e da questa due stime segue che |f (z) h (z)| < M per ogni z nel bordo del
rettangolo con vertici in /2 iy0 , e quindi, grazie al teorema del massimo
modulo (Corollario 2.8.3), anche allinterno di questo rettangolo. Ma allora
|f h | < M su tutto S/2 . Ora, passando al limite per a 0, abbiamo che
h (z) 1 e quindi |f (z)| 6 M per ogni z S/2 . Questo dimostra la parte
(i).
Veniamo ora alla parte (ii). Cominciamo la dimostrazione sotto lipotesi
aggiuntiva M(a) = M(b) = 1, ossia
|f | 6 1
sulla frontiera di Sa,b . Fissiamo > 0 e per z Sa,b poniamo
g (z) =

1
.
1 + (z a)

(2.66)

2.16. APPENDICE: TEOREMA DI CAUCHY IN UN CONVESSO

327

Poich per z Sa,b si ha Re(za) = xa > 0, si ha anche Re(1+(za)) > 1,


e quindi |1 + (z a)| > 1, da cui |g | < 1. Allora, in base allipotesi (2.66),
|f g | < kf kL (Sa,b ) 6 1

(2.67)

su Sa,b .
Daltra parte, |y| = Im(1+ (za)) 6 |1+ (za)|, e quindi g | < 1/( |y|).
Pertanto, per z Sa,b ,
K
|f (z) g (z)| 6
.
(2.68)
|y|
Ora da (2.67) e (2.68) vediamo che sulla frontiera del rettangolo R :=
Sa,b {|y| 6 K/} vale la disuguaglianza |f g | 6 1: pertanto la stessa
disuguaglianza vale anche allinterno di R grazie al teorema del massimo modulo (Corollario 2.8.3). Daltra parte, questa stessa disuguaglianza vale and
nella parte di Sa,b esterna al rettangolo R grazie a (2.68): quindi vale in tutta la striscia Sa,b . Questo dimostra la parte (ii) dellenunciato sotto lipotesi
aggiuntiva M(a) = M(b) = 1.
Ora abbandoniamo questa ipotesi. Poniamo
m(z) = M(a)(bz)/(ba) M(b)(za)/(ba) := M(a)w (z) M(b)s (z)
dove w(z) = (b z)/(b a) e s(z) = (z a)/(b a). Poich gli esponenziali
w 7 M(a)w = ew ln M (a) e s 7 M(a)s sono funzioni intere mai nulle e per
z Sa,b si ha Re w(z) > 0 e Re s(z) > 0, vediamo che le funzioni M(a)w (z) e
M(b)s (z) sono limitate inferiormente su Sa,b , e quindi ivi limitata la funzione
1/m(z). Inoltre |m(a + iy)| = M(a) e |m(b + iy)| = M(b) per ogni y. Ma
allora f /m ha modulo 1 sui bordi della striscia Sa,b ed continua e limitata
su Sa,b ed olomorfa allinterno. Quindi la funzione f /m verica lipotesi
aggiuntiva con cui abbiamo cominciato questa parte della dimostrazione, ed
allora abbiamo visto che |f /m| 6 1 su Sa,b . Quindi |f | 6 |m|, e questo
lenunciato della parte (ii).

2.16

Appendice: dimostrazione elementare del


teorema di Cauchy in un insieme convesso

In questa Sezione diamo una dimostrazione indipendente, per insiemi convessi, del teorema di Cauchy (Corollario 2.4.10). Cominciamo con dominii
triangolari.

328

CAPITOLO 2. ANALISI COMPLESSA

Lemma 2.16.1. (Il teorema di Cauchy in un triangolo.)


(i) Sia f : C 7 C una funzione olomorfa in un aperto A che contiene un
triangolo chiuso T , ed indichiamo con T la frontiera Rdel triangolo (o
meglio, una curva C 1 a tratti che la percorre). Allora T f (z) dz = 0.

(ii) La stessa conclusione vale se f olomorfa ovunque in A tranne che in


un punto p A.
Dimostrazione.

(i) I punti di mezzo dei lati del triangolo determinano quattro nuovi triangoli simili a quello originale, le cui curve di frontiera C (j) (j = 1, . . . , 4)
sono costituite di due segmenti sulla frontiera C di T ed uno interno a
T , e sono lunghe L/2 se L la lunghezza di C. Il verso di percorrenza
originalmente scelto per C determina quindi per ciascuna delle curve
C (j) un verso di percorrenza compatibile tale che ogni tratto interno
percorso in verso opposto dalle due nuove curve che lo contengono.
Pertanto, se si sommano i quattro integrali curvilinei rispetto al verso
di percorrenza cos indotto, i contributi dei tratti interni si cancellano
a due a due, e ci che rimane
4 Z
X
j=1

C (j)

f (z) dz =

f (z) dz .

Quindi almeno su una delle quattro curve C (j) Ril valore dellintegrale
curvilineo, preso in modulo, non inferiore a 14 C f (z) dz . Ora procediamo per bisezioni successive, ricalcando la dimostrazione del Teorema
di BolzanoWeierstrass 1.9.6. Dopo n suddivisioni si ottengono 4n curve di lunghezza 2n L, almeno una delle quali, che chiameremo Cn ,
verica

Z
Z





n
f (z) dz 6 4
f (z) dz .
(2.69)



C

Cn

Abbiamo gi mostrato nella dimostrazione del Teorema di Bolzano


Weierstrass 1.9.6 (che lintersezione dei triangoli inscatolati Tn con perimetro Cn ottenuti per bisezioni successive consiste di un unico punto
(si veda anche la Nota 1.9.7), che denotiamo con z0 . Quindi z0 T A,
e pertanto f derivabile in z0 .

2.16. APPENDICE: TEOREMA DI CAUCHY IN UN CONVESSO

329

R
Osserviamo a questo punto che Cn dz = 0 per la Proposizione 1.29.36,
R
e Cn (z z0 ) dz = 0 per il Corollario 1.29.37. Quindi
Z
Z

f (z) f (z0 ) f (z0 )(z z0 ) dz .
(2.70)
f (z) dz =
Cn

Cn

Daltra parte, visto che f derivabile a z0 , per ogni > 0 esiste r > 0
tale che, se |z z0 | < r, si ha |f (z) f (z0 ) f (z0 )(z z0 )| < . Allora
segue da (2.70) che, se n cos grande che il triangolo Tn sia contenuto
nel disco |z z0 | < r, si ha
Z
Z
f (z) dz 6
|z z0 |n dz .
Cn

Cn

Osserviamo che z0 Tn , e quindi la sua distanza |z z0 | dal punto


generico z Tn = Cn inferiore al perimetro delRtriangolo, e quindi a
2n L: pertanto dallultima disuguaglianza si ha Cn f (z) dz 6 2n L.
R

f (z) dz 6
A sua volta, da questa disuguaglianza e da (2.69) segue
C
R
L2 . Poich > 0 arbitrario, questo signica che C f (z) dz = 0.

(ii) Sia ora f olomorfa in A \ {p}. Se p


/ T allora la prima parte della
dimostrazione si applica senza varianti. Se invece p T , esaminiamo
separatamente i casi in cui p sia un vertice di T oppure no.

Nel primo caso, scegliamo due punti x, y sulla frontiera di T vicini a p


(entro una distanza da p > 0 ssata), e spezziamo T come unione di un
triangolo T0 con vertici p, x, y e del rimanente quadrilatero. Sezionando
questultimo lungo una diagonale vediamo che esso lunione di due
triangoli in A che non contengono p, e quindi ad essi si applica la prima
parte della dimostrazione. Osserviamo che lintegrale su C si spezza
come somma degli integrali sulla frontiera dei tre triangoli, come prima
per il fatto che i contributi dei tratti interni si cancellano. Pertanto
lintegrale su C semplicemente lintegrale curvilineo sulla frontiera
del triangolo T0 , quello che ha un vertice in p. Questo triangolo ha
diametro inferiore a 2 e quindi perimetro inferiore a 6 (anzi 4 perch
i due lati con estremo in p sono lunghi meno di . Su T0 la funzione |f |
limitata da qualche costante M, per lesistenza dei massimi e minimi
delle funzioni continue su un compatto (Sezione 1.1). In conclusione,
sulla frontiera di T0 (e quindi anche su C) lintegrale limitato da M.
Ora la dimostrazione segue come prima dal fatto che arbitrario.

330

CAPITOLO 2. ANALISI COMPLESSA


Inne, se p un punto di T ma non un vertice, decomponiamo T in
due triangoli (se p sulla sua frontiera) oppure tre triangoli (se p un
punto interno di T ) ciascuno dei quali ha un vertice in p, ad applichiamo
largomento precedente a ciascuno di essi.

Una parte del prossimo teorema discende dal Teorema 2.14.11, ma la


dimostrazione che ne diamo qui pi diretta (ma usa unipotesi pi forte, la
convessit invece della semplice connessione).
Teorema 2.16.2. (Teorema di Cauchy per insiemi convessi.) Sia
A C un aperto convesso, e f una funzione olomorfa su A. Allora esiste g
olomorfa su A tale cheRg = f . Quindi, per ogni curva chiusa assolutamente
continua C A, si ha C f (z) dz = 0, per la Proposizione 1.29.36. Lo stesso
risultato vale se esiste p A tale che f continua su A ed olomorfa in
A \ {p}.
Dimostrazione. Per ogni ssato a A il segmento [a, z] che congiunge a con
un qualsiasi altro punto z di A giace in A, a causa della convessit. Allora
possiamo denire una funzione g su A in questo modo:
Z
g(z) =
f (w) dw .
[a,z]

Sempre per la convessit, per ogni altro punto z0 A il triangolo con vertici
a, z e z0 giace in A. Lintegrale di fR lungo il perimetro di questo triangolo
vale 0 per il Lemma 2.16.1. Poich [z0 ,z] dw = z z0 , questo equivale, per
z 6= z0 , allidentit (2.20):
Z

g(z) g(z0 )
1
f (w) f (z0 ) dw .
f (z0 ) =
z z0
z z0 [z0 ,z]

Poich f continua in z0 , per ogni > esiste > 0 tale che, se |w z0 | < , si
ha |f (w) f (z0 )| < . Quindi, per z z0 , il secondo membro della identit
precedente tende a zero: pertanto g (z0 ) = f (z0 ). La stessa asserzione nel
caso in cui f sia olomorfa solo in A\ {p} si dimostra nello stesso modo, grazie
al fatto che il teorema di Cauchy sul triangolo di vertici a, z e z0 continua a
valere in questa ipotesi (Lemma 2.16.1).

Capitolo 3
Spazi vettoriali topologici ed

analisi funzionale
Questo capitolo di natura pi sosticata ed astratta che il resto della Parte
preliminare, ed necessario solo per alcuni degli argomenti successivi pi sosticati di analisi matematica (tipicamente il Capitolo 7 di approfondimenti
sulle serie di Fourier e la nozione di topologia nello spazio delle distribuzioni
non temperate nella Sezione 11.17 del Capitolo 11 sulle distribuzioni, ed in
parte anche per maggiori approfondimenti sulla topologia di spazi con famiglie separatici di seminorme come la classe di Schwartz (Capitolo 9). Ma
queste nozioni non sono mai necessarie per gli sviluppi sul trattamento dei
segnali, tranne che per un fugace riferimento al teorema di uniforme limitatezza nella denizione di convergenza di distribuzioni (Proposizione 11.5.3).
Quasi sempre, nei pochi casi in cui i contenuti di questo Capitolo vengono
utilizzati nel seguito, essi vengono ivi riassunti in maniera semplicata, per
permettere la comprensione ai lettori non interessati a questi approfondimenti astratti. Si badi per che il punto di vista dellautore di questo trattato
che non dovrebbe essereci un conne netto fra le conoscenza e forse anche
gli interessi di chi si occupa di matematica pura e di matematica applicata,
e quindi il lettore interessato alla teoria dei segnali fortemente incoraggiato
a studiare a fondo anche le parti pi astratte.
Per il succitato motivo di parziale dispensabilit, lintero Capitolo contrassegnato con una stelletta: esso pu essere omesso da parte dei suddetti
lettori. Alcune delle sue Sezioni, a loro volta, sono contrassegnate con una
stelletta: si tratta delle Sezioni che presentano contenuti e risultati apparentemente assai naturali e plausibili, ma che in realt richiedono un maggiore
331

332CAPITOLO 3. SPAZI VETT. TOPOLOGICI, ANALISI FUNZIONALE


senso critico da parte dei lettori pi sosticati (il principio di massimalit
di Hausdor, lassioma della scelta, lesistenza di prodotti cartesiani su insiemi di indici pi che numerabili, la compattezza di un qualsiasi prodotto
cartesiano di insiemi compatti). Inne, altre Sezioni sono contrassegnate con
due asterischi: quelle i cui contenuti sono inclusi per completezza ma non
vengono mai utilizzati in questopera.
La maggior parte della esposizione tratta da [22, Ch.1, Sect. 5, 8; Ch. 10,
Sect. 3, 4, 5, 6, 7] e [25, Ch. 1, 2, 3, 4].

3.1

Spazi vettoriali topologici, spazi di Banach


e di Frchet

Nel resto di questopera, gli unici spazi vettoriali topologici che introdurremo
sono gli spazi di Banach e gli spazi di Frchet, che fra breve deniremo:
limitando lattenzione a questi casi, il lettore pu semplicare parte di questo
Capitolo. Peraltro, per maggiore generalit, presentiamo gli argomenti nel
contesto pi ampio degli spazi vettoriali topologici.
Definizione 3.1.1. Uno spazio vettoriale topologico uno spazio vettoriale
V munito di una topologia rispetto alla quale i punti sono chiusi e le operazioni dello spazio vettoriale sono continue. In particolare, si noti che ogni
traslazione continua e, poich la mappa inversa la traslazione opposta,
ogni traslazione un omeomorsmo, ossia preserva la topologia: dora in poi
diremo che la topologia invariante per traslazione.
Un sottoinsieme A di uno spazio vettoriale topologico V si dice limitato se
per ogni intorno U di 0 in V esiste r = rA,U > 0 tale che A U per tutte
le dilatazioni con || > r.
Una successione {vn } in V si dice di Cauchy se per ogni intorno U dellorigine
esiste un intero N = N(U) tale che vn vm U per ogni n, m > N.
Diciamo che uno spazio vettoriale topologico V
localmente limitato se esiste un intorno limitato dellorigine;
localmente convesso se esiste una base locale della topologia costituita da
insiemi convessi (poich le traslazioni sono operazioni continue, questo equivale a richiedere che esista una base di intorni aperti dellorigine che sono
convessi);
metrizzabile se la topologia indotta da una metrica (necessariamente invariante per traslazione perch ogni traslazione un omeomorsmo);

3.1. SPAZI VETTORIALI TOPOLOGICI

333

un F-spazio se metrizzabile e la topologia completa (come sopra, la


metrica necessariamente invariante per traslazione);
uno spazio di Frchet se un F-spazio localmente convesso, ossia se la sua
topologia localmente convessa ed indotta da una metrica invariante per
traslazione rispetto alla quale V completo;
uno spazio di Banach se la sua topologia indotta da una norma ed
completo in questa norma (rammentiamo che la nozione di norma su uno
spazio vettoriale stata introdotta nella Denizione 1.2.8).
Nota 3.1.2. chiaro che ogni spazio normato localmente limitato e localmente convesso, e che ogni spazio di Banach anche di Frchet.

3.1.1

Sottospazi e quozienti

La topologia di uno spazio vettoriale verica varie propriet piuttosto naturali


ed alcune pi sottili. A titolo di esempio, vediamo due di quelle naturali nei
prossimo esercizi:
Esercizio 3.1.3. Sia V uno spazio vettoriale topologico.
(i) Per ogni A, B V , A + B A + B ;
(ii) Se W un sottospazio di V , anche la sua chiusura W un sottospazio.
Svolgimento. Per ogni a A e b B sia U un intorno di a + b. Poich la
somma una operazione continua da V V in V , ossia la controimmagine
di un aperto U V aperta in V V (Sezione 1.1), esistono intorni aperti
U1 di a e U2 di b tali che U1 + U2 U. Poich a e b appartengono alle
chiusure di A e B rispettivamente, esistono x A U1 e y B U2 .
Quindi x + y (A U1 ) + (B U2 ) = (A + B) (U1 U2 ) (A + B) U:
pertanto lultima intersezione non vuota per ogni intorno U di a + b, e
questo signica che a + b appartiene alla chiusura A + B. Questo dimostra
la parte (i). Per dimostrare (ii), lasciamo al lettore la verica elementare del
fatto che, per ogni scalare e sottoinsieme W V , si ha W = W (se
= 0 ovvio, altrimenti si osservi che la moltiplicazione per continua con
inversa continua, in base alla Denizione 3.1.1 di spazio vettoriale topologico).
Pertanto, per tutti gli scalari e , si ha W +W = W +W , ed il secondo
membro coincide con W + W in base alla parte (i). Allora, se W anche
un sottospazio, W + W W .

334CAPITOLO 3. SPAZI VETT. TOPOLOGICI, ANALISI FUNZIONALE


Per quanto riguarda gli spazi quozienti, rammentiamo le seguenti ben note denizioni in Algebra Lineare.
Definizione 3.1.4. Dato uno spazio vettoriale V ed un sottospazio N, lo
spazio quoziente V /N linsieme delle classi laterali {v + N} al variare di v
in V . Il quoziente uno spazio vetoriale se munito delloperazione naturale
di somma, ovvero {v + N} + {w + N} := {(v + w) + N}: lelemento neutro
rispetto a questa somma la classe laterale di 0 V , ossia N. Loperazione
di somma ben denita, cio non dipende dalla scelta bdei rappresentanti
v e w, perch se v + N = v + N e w + N = w + N, allora v v N e
w w N, e quindi (v + w) + N = (v + w ) + N. La proiezione canonica (o
mappa quoziente) : V V /N denita da (v) = v + N: si tratta di una
appliczione lineare che ha per nucleo N, ossia lorigine nello spazio V /N.
Definizione 3.1.5. (Topologia quoziente.) Se V uno spazio vettoriale
topologico con topologia e N un sottospazio chiuso, introduciamo la
topologia quoziente su V /N data dal lifting di sotto : ossia, gli aperti di
sono i sottoinsiemi di V /N le cui controimmagini sotto sono aperti di .
In questo modo, la mappa quoziente manda aperti in aperti, ed continua
(limmagine inversa di ogni aperto un aperto).
Esercizio 3.1.6. La topologia quoziente introdotta nella precedente Denizione 3.1.5 una topologia di spazio vettoriale. La mappa quoziente
: V V /N manda basi locali della topologia di V in basi locali di ;
in particolare, manda aperti in aperti. Se V un F-spazio, o uno spazio
di Frchet, o di Banach (nel senso della Denizione 3.1.1), lo stesso vale per
V /N.
Svolgimento. Si verica immeditamente che una topologia (ossia chiusa
sotto intersezioni numerabili ed unioni arbitrarie) perch lo . Inoltre, i
punti in N/V sono chiusi, perch sono traslati dellinsieme N che si
assunto chiuso. Se W un intorno dellorigine in V /N, in base al Lemma
3.1.9 esiste un intorno dellorigine in U V tale che U + U 1 W ,
quindi (U) + (U) W : poich manda aperti di in aperti di , questo
signica che la somma in V /N continua. Un argomento analogo vale
per la moltiplicazione per scalari.
chiaro che manda basi locali in basi locali.
Supponiamo inne che V sia un F-spazio con metrica invariante d. Si verica

3.1. SPAZI VETTORIALI TOPOLOGICI

335

immediatamente che la seguente denizione induce una metrica invariante


su V /N (e non dipende dalla scelta dei rappresentanti v e w):
((v), (w)) = inf d(v w, n) .
nN

Questa metrica induce su V /N la topologia , dal momento che manda


la -.palla in V di centro lorigine e raggio r nella palla in N/V con centro
lorigine di V /N e lo stesso raggio. Si noti che, se V uno spazio normato,
questa denizione induce su V /N una norma, detta norma quoziente:
k(v)kV /N = inf kv nkV .
nN

Per completare lesercizio basta mostrare che una metrica completa se lo


d. Sia {un } una successione di Cauchy in V /N (ossia rispetto a ). Scegliamo
una sottosuccessione {unk } tale che (unk , unk+1 < 2k , e punti vk V tali
che (vk ) = unk e d(vk , vk+1 ) < 2k . Dalla formula di somma geometrica
(Sezione 1.1) segue che la successione {vk } di Cauchy in V , e quindi, per
la completezza di d, essa converge a qualche v V . Poich continua,
unk = (vk ) converge a (v). Quindi la successione di Cauchy {un } ha una
sottosuccessione convergente: ma allora essa stessa convergente.

3.1.2

Intorni stellati

Definizione 3.1.7. Un sottoinsieme U 0 di uno spazio vettoriale si dice


stellato se U U per ogni 0 6 < 1.
Lemma 3.1.8. In uno spazio vettoriale topologico, ogni intorno dellorigine
contiene un intorno stellato, ed ogni intorno convesso dellorigine contiene
un intorno convesso stellato (Definizione 3.1.7).

Dimostrazione. Sia X uno spazio vettoriale topologico e U un intorno dellorigine. La continuit della operazione di moltiplicazione per scalari equivale
a dire che esistono = (U) > 0 ed un intorno J = J(U) dellorigine tale che
J U per ogni || < (esercizio: mostrare che questa asserzione signica
che la controimmagine, sotto loperazione di moltiplicazione per scalari, di
un aperto U X un aperto in R X). Allora poniamo O = ||<(U ) J(U):
questo O un aperto (perch unione di aperti), contenuto in U ed stellato,
perch O O per ogni || 6 1.

336CAPITOLO 3. SPAZI VETT. TOPOLOGICI, ANALISI FUNZIONALE


Se inoltre U convesso, poniamo K = {U : || = 1}. Notiamo che
K convesso (perch intersezione di convessi), e che il fatto che O sia
stellato implica che 1 O O per ogni || = 1, e quindi per questi si
ha O = O U. Questo signica che O K: ma allora linterno K 0 di
K contiene un intorno dellorigine, e quindi esso stesso un intorno aperto
dellorigine. Inoltre K stellato. Infatti, essendo un convesso che contiene
lorigine, K stellato nel senso reale, ovvero per ogni suo punto diverso
dallorigine K contiene anche tutti i punti ottenuti contraendo il primo verso
lorigine: rK K per ogni 0 < r < 1. Ma allora K stellato anche in senso
complesso, perch, per ogni || 6 1, scrivendo = reit abbiamo
K = ||=1 U = ||=1 rU ||=1 U = K .
Daltra parte K U e U aperto, quindi anche K 0 U, e K 0 convesso
perch linterno di un convesso (e quindi contiene tutte le corde che congiungono due suoi punti qualsiasi). Rimane da dimostrare che K 0 stellato,
ma questo chiaro visto che abbiamo provato che K stellato.

Ecco una osservazione tanto utile quanto ovvia:

Lemma 3.1.9. Sia V uno spazio vettoriale topologico e U un intorno aperto


di 0. Allora esiste un intorno aperto W di 0 tale che W + W U. Lintorno
W si pu scegliere stellato.
Dimostrazione. Lenunciato equivale a dire che loperazione di somma, (x, y) 7
x + y, una funzione continua. In eetti, proprio perch la somma continua, dallidentit 0 + 0 = 0 sappiamo che esistono intorni A, B di 0 tali che
A + B U. Lenunciato si ottiene se poniamo W = A B. Il fatto che W si
possa scegliere stellato segue dalla prima parte del precedente Lemma 3.1.8.

3.1.3

Propriet di separazione e di limitatezza

Abbiamo bisogno di questa semplice propriet degli spazi vettoriali topologici, che rinforza la propriet della parte (vi) della Proposizione 1.10.10:
Proposizione 3.1.10. Sia V uno spazio vettoriale topologico. Allora, dati
un insieme compatto K ed un chiuso C in V disgiunti, esiste un intorno W
dellorigine tale che K + W disgiunto da C. Se V localmente convesso,
lintorno W si pu scegliere convesso.

3.1. SPAZI VETTORIALI TOPOLOGICI

337

Dimostrazione. Per ogni x K esiste un intorno Ax di x disgiunto da C :


infatti, se C intersecasse ogni intorno di x, allora x sarebbe un punto di
chiusura di C e quindi apparterrebbe a C perch C chiuso, ma questo
non possibile perch K e C sono disgiunti. Scriviamo Ax = x + Ux , con
Ux intorno aperto dellorigine (le traslazioni sono continue, in uno spazio
vettoriale topologico!). Per il precedente Lemma 3.1.9 sappiamo che esistono
intorni D, E di 0 tali che D + E Ux : quindi, ponendo Wx = D E,
sappiamo che ogni x K contenuto in un aperto x + Wx con Wx intorno
aperto dellorigine e Wx + Wx Ux . Se V localmente convesso possiamo
assumere che D e E, e quindi la loro intersezione Wx , siano convessi.
Daltra parte K compatto, e quindi dal ricoprimento aperto {x + Wx } di
K possiamo estrarre un sottoricoprimento nito {x1 + Wx1 , . . . , xn + Wxn }.
Pertanto K = ni=1 (xj + Wxj ). Poniamo W = i = 1n Wxj . Allora W
ancora un intorno aperto dellorigine, convesso se lo sono gli aperti Wxj (in
particolare abbiamo visto che si possono assumere convessi se V localmente
convesso). Inoltre
K+W ni=1 (xj +Wxj +W ) ni=1 (xj +Wxj +Wxj ) ni=1 (xj +Uxj ) = ni=1 Axj
e gli insiemi al lato di destra sono tutti disgiunti da C.

Corollario 3.1.11. Ogni spazio vettoriale topologico di Hausdorff (Definizione 1.10.2).


Dimostrazione. Nella Denizione 3.1.1 di spazio vettoriale topologico abbiamo assunto che i punti siano chiusi (propriet T1 introdotta nella Proposizione
1.10.10). Pertanto la propriet T2 della Denizione 1.10.2 discende dal fatto
assai pi generale che, dati un chiuso C ed un compatto K in uno spazio
vettoriale topologico, esistono intorni aperti disgiunti di C e K: o equivalentemente (grazie allinvarianza per traslazione della topologia), che esiste un
intorno aperto W di 0 tale che laperto C +W disgiunto dallaperto K +W .
Questo fatto stato dimostrato nella precedente Proposizione 3.1.10.

Corollario 3.1.12. Ogni aperto di una base locale di uno spazio vettoriale
topologico contiene la chiusura di un altro aperto di base.

Dimostrazione. Per linvarianza della topologia, possiamo restringere lattenzione ad una base locale allorigine. Nella Proposizione 3.1.10 specializziamo

338CAPITOLO 3. SPAZI VETT. TOPOLOGICI, ANALISI FUNZIONALE


lattenzione al caso particolare in cui il compatto K consista del solo punto
0 e C sia un chiuso che non contiene 0: ne segue che esiste un aperto V che
contiene 0 ed disgiunto da C + V (ossia una versione lievemente pi forte
della propriet (v) della Proposizione 1.10.10). Daltra parte, C + V aperto
(ovvio, unione di aperti, e precisamente traslati di V : lasciamo i dettagli
per esercizio). Quindi anche V disgiunto da C + V , e pertanto anche da C.
Per riportare questo fatto allenunciato, sia U un intorno di 0 membro di una
base locale della topologia, e chiamiamo C il suo complementare, che chiuso: allora, per quanto appena visto, esiste un altro intorno V di 0 tale che V
disgiunto da C, ossia contenuto in U. Se anche lintorno V sta nella base
locale, questo corrisponde allenunciato; se no, V deve contenere un intorno

W di 0 che sta nella base locale, e W V U.


Concludiamo questa Sezione con due utili osservazioni.

Lemma 3.1.13. Se U un intorno di nello spazio vettoriale topologico V ,


allora ogni v V appartiene ad un dilatato rU per r > 0 abbastanza grande:
V = nN nU.
Dimostrazione. Questo vero perch la mappa s 7 sv (da R a V ) continua
per denizione di spazio vettoriale topologico, quindi linsieme {s : sv U}
aperto in R e pertanto contiene 1/r per r abbastanza grande: questo equivale
a v rU per r grande.

Lemma 3.1.14. Sia {vn } una successione di Cauchy in uno spazio vettoriale topologico V localmente limitato (definita, in questo contesto generale,
come nella Definizione 3.1.1). Allora linsieme {vn } costituito dai punti della
successione un insieme limitato.

Proof. Per denizione di successione di Cauchy, per ogni intorno aperto


U dellorigine esiste N tale che vn vN U per ogni n > N. In base al
Lemma 3.1.9 esiste un intorno stellato W dellorigine tale che W + W U.
Daltra parte, per il precedente Lemma 3.1.13, vN sW per ogni s > s0
abbastanza grande: o vN W ed allora possiamo scegliere s0 = 1, o se no
esiste un opportuno s0 > 1. Allora, per ogni n > N e s > s0 > 1,
vn vN + W sW + W sW + sW sU .
Questa inclusione mostra che gli vn con n > N appartengono tutti simultaneamente a sU per s abbastanza grande. Di nuovo per il precedente Lemma

3.2.

SPAZI METRIZZABILI E NORMABILI

339

3.1.13, i restanti punti v1 . . . , vN 1 appartengono anchessi a sU per s abbastanza grande. Quindi, per s abbastanza grande, tutto linsieme {vn }
contenuto nel multiplo sU del generico intorno U di 0, e questo equivale a
dire che limitato.

3.2

Spazi vettoriali topologici che ammettono


una metrica, o una norma

Questa Sezione studia gli spazi vettoriali topologici in maggiore generalit.


Solo pochi di questi risultati sono necessari nelle Sezioni immediatamente
successive, ma gli altri saranno necessari per le Sezioni pi ambiziose 3.17,
3.18, 3.19, 3.20, 3.21.

3.2.1

Spazi vettoriali localmente limitati

Proposizione 3.2.1. Se la topologia di uno spazio vettoriale localmente


limitata, essa ammette basi locali numerabili. Ad esempio, per ogni intorno
limitato U di 0 e per ogni successione cn > 0 che tende a zero, la famiglia
{cn U} una base locale a 0 (numerabile, e consistente di aperti limitati).
Dimostrazione. Al solito, per linvarianza per traslazione della topologia,
basta costruire una base locale numerabile allorigine. In base alla denizione
di base locale (ultima parte della Denizione 1.10.1 questo signica costruire
una famiglia di intorni aperti di 0 tale che ogni intorno aperto di 0 ne contenga
uno. Dal momento che lo spazio vettoriale V localmente limitato, esiste un
intorno limitato J dellorigine (questa terminologia stata introdotta nella
Denizione 3.1.1). Consideriamo una arbitraria successione decrescente di
numeri reali cn 0+ . Mostriamo che gli aperti cn J formano una base locale
a 0 per la topologia. Basta provare che ogni intorno aperto U di 0 contiene
uno degli aperti cn J. Daltra parte, siccome J limitato, esiste s > 0 tale
che J tU per ogni t > s. Allora se n sucientemente grande che scn < 1,
abbiamo J (1/cn )U, e quindi U cn J per tutti gli n abbastanza grandi.

Corollario 3.2.2. Se uno spazio vettoriale topologico V non localmente limitato, esso non contiene alcun aperto limitato, e viceversa, se V
localmente limitato, V contiene aperti limitati.

340CAPITOLO 3. SPAZI VETT. TOPOLOGICI, ANALISI FUNZIONALE


Dimostrazione. Se esiste un aperto limitato in V , ne esiste uno che contiene
lorigine, per linvarianza per traslazione della topologia. Allora, per la precedente Proposizione 3.2.1, esiste una base locale di aperti limitati, e quindi
la topologia localmente limitata. Il viceversa ovvio.

3.2.2

Spazi metrizzabili

Corollario 3.2.3. Sia X uno spazio vettoriale topologico con una base locale numerabile per la sua topologia (ad esempio se X localmente limitato, Proposizione 3.2.1). Allora esiste una base locale di intorni dellorigine
{Vn : n N} tale che
Vn+1 + Vn+1 Vn
(3.1)
per ogni n. Si noti, in particolare, che Vn+1 ( Vn .

Dimostrazione. Questa una conseguenza ovvia del Lemma 3.1.9.

Lemma 3.2.4. Sia X uno spazio vettoriale topologico con una base locale
numerabile per la sua topologia. Sia {Vn } la base locale allorigine ottenuta
nel precedente Corollario
Sia D linsieme dei razionali diadici, ossia
P3.2.3.

delle somme finite r = n=1 cn (r)/2n , dove le cifre binarie cn (r) valgono 0
oppure 1 e solo un numero finito di esse non nullo (quindi 0 6 r < 1:
gli stessi razionali diadici furono introdotti nella dimostrazione del lemma
di Urysohn (Teorema 1.10.13)). Infine, di nuovo in maniera analoga alla
dimostrazione del del lemma di Urysohn , costruiamo una famiglia di insiemi:
per ogni r D sia

X
A(r) =
cj (r)Vj ;
(3.2)

j=1

qui naturalmente ci si riferisce alla somma di opportuni sottoinsiemi di vettori in X, che un sottoinsieme di X), e per completezza poniamo A(r) = X
se r > 1.
Allora al crescere di r gli A(r) formano una successione crescente di intorni
dellorigine, e vale la seguente propriet di subadditivit per inclusione: per
ogni r, s D,
A(r) + A(s) A(r + s) .
(3.3)
Dimostrazione. Il fatto che A(r) A(s) se r < s segue banalmente dalla
inclusione Vn+1 Vn del precedente Corollario 3.2.3, perch se r < s questi

3.2.

SPAZI METRIZZABILI E NORMABILI

341

due razionali diadici hanno le cifre binarie iniziali uguali, ed appena cominciano a dierire s ha la cifra 1 e r la cifra 0. Occorre quindi dimostrare solo
(3.3): omettiamo la dimostrazione, che puramente tecnica e si pu trovare
nellultima parte della dimostrazione di [25, Theorem 1.24].

Teorema 3.2.5. Uno spazio vettoriale topologico V con base locale numerabile per la sua topologia metrizzabile, nel senso che esiste una metrica
d su V che induce la stessa topologia ed invariante per traslazione (ossia
d(u + w, v + w) = d(u, v) per ogni u, v, w V ), e le sfere intorno allorigine sono stellate, nel senso della Definizione 3.1.7. Viceversa, ogni spazio
vettoriale topologico metrizzabile ha basi locali numerabili.

Dimostrazione. Dai Lemmi 3.1.8 e 3.2.3 sappiamo che esiste una base locale
allorigine di intorni stellati {Vn } tali che vale linclusione (3.1), e che, se
X localmente convesso, allora gli intorni di base {Vn } si possono scegliere
convessi.
Come nella dimostrazione del lemma di Urysohn (Teorema 1.10.13), ed in
particolare della denizione (1.25) nella sua dimostrazione, poniamo
f (x) := inf{r D : x A(r)} ,

(3.4)

e deniamo una distanza d(x, y) := f (x y). ovvio che questa d invariante per traslazione. Mostriamo che d una distanza, ossia che verica
le tre propriet delle metriche (Denizione 1.2.3). Cominciamo con la propriet (iii), la disuguaglianza triangolare. In base a (3.4), essa equivale alla
disuguaglianza
f (x + y) 6 f (x) + f (y)
(3.5)
per ogni x, y V . Poich i valori di f sono minori o uguali a 1, questa
disuguaglianza sempre vera se il membro di destra maggiore o uguale a 1,
e quindi possiamo limitare lattenzione a x e y tali che f (x)+f (y) < 1. Poich
i razionale diadici sono densi in [0, 1] e loperazione di somma continua su
R, per ogni > 0 e x e y come sopra esistono r e s in D tali che f (x) < r,
f (y) < s e r + s < f (x) + f (y) + . Le prime due di queste disuguaglianze
equivalgono a x A(r) e y A(s), rispettivamente. Allora, per il Lemma
3.2.4, abbiamo x + y A(r + s), e quindi
f (x + y) 6 r + s < f (x) + f (y) + .
Poich arbitrario, questo implica (3.5). chiaro che f (0) = 0, e quindi
d(x, x) = 0 per ogni x. Inne, mostriamo che d(x, y) > 0 (propriet (i)) della

342CAPITOLO 3. SPAZI VETT. TOPOLOGICI, ANALISI FUNZIONALE


Denizione 1.2.3), e d(x, y) = 0 solo se x = y (propriet (ii)) della stessa
Denizione). Poich gli insiemi A(r) sono stellati, abbiamo che f (x) = f (x)
per ogni x. Poich i Vn sono una base locale allorigine, per ogni x 6= 0 esiste
n tale che x
/ Vn . Ma dalla denione degli A(r) nella identit (3.2) vediamo
che Vn = A(2n ), e quindi f (x) > 2n > 0 grazie a (3.4). Questo completa
la dimostrazione del fatto che d una metrica. Mostriamo inne che essa
induce la stessa topologia di V , ossia che ogni palla centrata allorigine in
questa metrica contenuta in qualcuno degli intorni della base locale {Vn }
e viceversa. Abbiamo appena visto che gli intorni della base locale {Vn }
sono le palle A(2n ) in questa metrica. Inoltre la famiglia A(r) ordinata
per inclusione (A(r) cresce al crescere di r, Lemma 3.2.4), e per ogni altra
palla B centrata nellorigine abbiamo B := {x : f (x) < } = r< A(r).
Pertanto, se < 2n, si ha B Vn .
Viceversa, ovvio che, se V metrizzabile, le palle aperte intorno allorigine di raggio, diciamo, 1/n, formano una base locale numerabile per la
sua topologia. Infatti, per linvarianza per traslazione della topologia, possiamo restringere lattenzione ad aperti U che contengono 0. Per denizione
di aperto, U deve contenere una palla con centro 0 e raggio r > 0, e quindi
anche una palla di raggio 1/n se n abbastanza grande.

Nota 3.2.6. Si noti che nellultima parte della precedente dimostrazione abbiamo implicitamente usato il fatto che le palle in una metrica sono automaticamemte insiemi stellati: in uno spazio vettoriale non metrizzabile un
argomento simile non vale per i dilatati di un qualsiasi intorno U di 0, e per
questo tipo di asserzioni occorre richiedere che U sia limitato, come abbiamo
fatto nella Proposizione 3.2.1.

Il seguente risultato segue immediatamente dal precedente Teorema 3.2.5


e dalla Proposizione 3.2.1. Vedremo che il viceversa non vero (Corollario
3.20.2).
Corollario 3.2.7. Ogni spazio vettoriale localmente limitato metrizzabile.

3.2.3

Spazi normabili

Definizione 3.2.8. (Seminorma.) Una funzione a valori reali su uno


spazio vettoriale V si dice una seminorma se
(i) p subadditiva, ossia verica la disuguaglianza triangolare p(u + v) 6
p(u) + p(v) per ogni u, v;

3.2.

SPAZI METRIZZABILI E NORMABILI

343

(ii) p omogenea, nel senso che p(v) = ||p(v);


(iii) p(v) > 0 per ogni v V .
La nozione di seminorma sar pesantemente utilizzata in relazione alla
classe di Schwartz ed allo spazio delle distribuzioni (Capitoli 9 e 11), e per
questo motivo verr ivi ridenita (Denizione 9.1.1).
Una seminorma, quindi, dierisce da una norma solo perch non in generale
vero che p(v) = 0 solo se il vettore v nullo (propriet (i) della Denizione
1.2.8).
Definizione 3.2.9. Sia C un convesso in uno spazio vettoriale topologico V
che contiene lorigine come punto interno. La funzione di supporto p = pK :
V R+ {0}
p(v) = inf{ > 0 : v/ K} .
(3.6)

(Questa funzione viene chiamata funzionale di Minkowski in [25].)

Lemma 3.2.10. In uno spazio vettoriale topologico V , la funzione di supporto P di un convesso C che contiene lorigine come punto interno soddisfa
le propriet seguenti:
(i) p(v) = p(v) per ogni > 0 e v V ;
(ii) {v : p(v) < 1} C {v : p(v) 6 1} ;
(iii) p(u + v) 6 p(u) + p(v) .

In particolare, p una seminorma, secondo la Definizione 3.2.8 (in generale


p(v) = 0 non implica v = 0: ad esempio, se C un dominio stellato, allora
p(v) = 0 per ogni v C (esercizio)).
Se inoltre C un insieme limitato, allora p una norma.
Dimostrazione. Le prime due propriet sono conseguenza immediata della
denizione, la terza vale perch, se u/ e v/ sono in C, allora una loro
combinazione convessa
u
u
u+v
=
+
+
+ +
che quindi anchessa in C poich C convesso. Questo signica che p(u +
v) 6 + , da cui, prendendo gli estremi inferiori rispetto a e , otteniamo
p(u + v) 6 p(u) + p(v).

344CAPITOLO 3. SPAZI VETT. TOPOLOGICI, ANALISI FUNZIONALE


Ora aggiungiamo lipotesi che C sia limitato. In base alla Proposizione
3.2.1, gli aperti rC con r > 0 formano una base locale a 0 della topologia di
V , la quale di Hausdor, quindi T1 (Proposizione 1.10.10). In particolare,
per ogni v 6= 0 esiste un aperto di base rC che non contiene v. In base alla
denizione (3.6) che denisce p, questo equivale a dire che p(v) > r, e quindi
in particolare p(v) > 0.

Teorema 3.2.11. Uno spazio vettoriale topologico normabile (ossia la


sua topologia indotta da una norma) se e solo se localmente convesso e
localmente limitato (terminologia come nella Definizione 3.1.1).

Dimostrazione. Se V ammette una norma compatibile con la topologia, allora


la palla unitaria B con centro lorigine convessa, grazie alla disuguaglianza
triangolare della norma (esercizio), ed limitata, perch una base locale
allorigine data dagli aperti Br = rB con r > 0, e Br B per ogni
|| > 1/r.
Viceversa, sia U un intorno convesso limitato di 0 in V . Per il Lemma 3.1.8
U contiene un intorno convesso stellato J di 0, anchesso limitato (perch
sottoinsieme di un insieme limitato). Per v V lultima asserzione del
Lemma 3.2.10 fornisce una norma
kvk = p(v) ,
dove p(v) := inf{t : v/t J} la funzione di supporto di J della Denizione
3.2.9.
Osserviamo che la denizione di p ed il fatto che J aperto implicano che
la palla {kvk < r} coincida con rJ: basta dimostrarlo per r = 1, nel qual
caso si ha kvk = p(v) < 1 se e solo se inf{t : v/t J} < 1. Poich la mappa
t 7 v/t continua da R a V , se v J il numero 1 appartiene allaperto
{t : v/t J} e quindi questo estremo inferiore inferiore a 1; il viceversa
ovvio perch J stellato.
In base alla dimostrazione dellultima parte della Proposizione 3.2.1, per
r > 0 le palle rJ (ossia, come appena visto, le palle di norma r) formano una
base locale a 0 per la topologia, e pertanto la topologia di V quella indotta
dalla norma.

3.3. OPERATORI LINEARI LIMITATI E FUNZIONALI LINEARI

3.3

345

Operatori lineari limitati e funzionali lineari

Definizione 3.3.1. (Operatori lineari limitati su spazi vettoriali topologici.) Siano V e W spazi vettoriali topologici localmente limitati e
T : V W un operatore lineare. Si dice che T un operatore limitato se
manda insiemi limitati in insiemi limitati (deniti nella Denizione 3.1.1).
Nota 3.3.2. Si noti che, come banale conseguenza della linearit e della Denizione 3.1.7, ogni operatore lineare manda insiemi stellati in insiemi stellati.

Esercizio 3.3.3. Si mostri che, dallinvaianza derlla topologia per traslazione


(Denizione 3.1.1), segue immediatamente che un operatore lineare su uno
spazio vettoriale topologico continuo se e solo se continuo allorigine.

Proposizione 3.3.4. Siano V e W spazi vettoriali topologici localmente limitati. Ogni operatore lineare continuo T : V W limitato. Viceversa,
se lo spazio vettoriale topologico V metrizzabile, o equivalentemente, se la
sua topologia ha una base locale numerabile (Definizione 1.10.1 e Teorema
3.2.5), e loperatore lineare T limitato, allora T continuo. In particolare,
questo vale se V localmente limitato (Corollario 3.2.7).
(Si noti che, affinch esistano operatori limitati non banali, occorre che gli
spazi V e W siano localmente limitati).
Dimostrazione. Sia T : V W un operatore lineare continuo, B V un
insieme limitato e U W un intorno aperto dellorigine. Poich T (0) = 0
per linearit, la continuit assicura lesistenza di un intorno O dellorigine in
V tale che T (V ) U. Daltra parte, dire che B un insieme limitato signica che B U per tutti i > 0 sucientemente grandi (Denizione 3.1.1).
Pertanto, per tali abbiamo T (B) T (U) = T (U) W , e quindi T (V )
un insieme limitato. Questo prova che T un operatore limitato.
Viceversa, supponiamo che T sia un operatore limitato. Lo spazio V localmente limitato e quindi la topologia di V ha una base locale numerabile, in
base alla Proposizione 3.2.1. Vogliamo dimostrare che T continuo. Indichiamo con 0V e 0W le origini degli spazi V e W . A causa della linearit e
della continuit delle traslazioni negli spazi vettoriali topologici (ci riferiamo

346CAPITOLO 3. SPAZI VETT. TOPOLOGICI, ANALISI FUNZIONALE


di nuovo alla Denizione 3.1.1), basta dimostrare che T continuo allorigine
0V , ossia che, per ogni intorno aperto U di 0W in W , T 1 (U) contiene un
intorno aperto O di 0V in V , od in altre parole che per ogni intorno aperto
U di 0W esiste un aperto O 0V in V tale che T (O) U. Supponiamo
per assurdo che questo sia falso: allora, data una base locale numerabile On
di intorni di 0V della topologia di V , per ogni n esiste vn On tale che
T (vn )
/ U. Quindi xn 0 ma T (vn ) 9 0V = T (0W ). Pertanto f non
continua per successioni allorigine, e quindi non continua, in base alla
Proposizione 1.10.5, che qui si pu applicare grazie al Lemma 3.1.11.

Definizione 3.3.5. (Norma di un operatore lineare su uno spazio


normato.) Siano V e W spazi normati. Segue dalla Denizione 3.3.1 che T :
V W un operatore lineare limitato se e solo se limmagine sotto T di palle
centrate nellorigine contenuta in palle centrate nellorigine. Denotando
con B(V, W ) lo spazio vettoriale degli operatori limitati, per ogni operatore
T B(V, W ), deniamo la norma kT k come lestremo inferiore delle costanti
C > 0 tali che, per ogni v V , si abbia kT vk 6 Ckvk. elementare
osservare che questo estremo inferiore coincide con quello che si avrebbe se la
disuguaglianza fosse stretta (esercizio): in molti libri la denizione di norma
di un operatore lineare data a partire dalla disuguaglianza stretta.
chiaro che gli operatori lineari limitati su spazi normati sono precisamente
quelli di norma nita.
Esercizio 3.3.6. La norma di un operatore, introdotta nella precedente Denizione 3.3.5, soddisfa la denizione di norma sullo spazio vettoriale B(V, W )
(ossia non negativa, nulla solo per loperatore nullo e verica la disuguaglianza triangolare).

Nota 3.3.7. Osserviamo che la norma di un operatore lineare ha il seguente


signicato geometrico: il raggio della pi piccola sfera (nella norma di
W ) che contiene limmagine sotto T della sfera unitaria nella norma di V .
In altre parole, il rapporto fra il raggio della sfera SW W circoscritta
allimmagine di una sfera SV V ed il raggio di SV .

Esercizio 3.3.8. Si verichi che kT k una norma sullo spazio vettoriale degli
operatori limitati.

3.3. OPERATORI LINEARI LIMITATI E FUNZIONALI LINEARI

347

Suggerimento: la disuguaglianza triangolare segue dal fatto che, per ogni


coppia di sottoinsiemi A, B R, si ha sup A + B 6 sup A + sup B.

Corollario 3.3.9. Dati due operatori lineari A : V W e B : U V ,


indichiamo con AB : U W loperatore composto A B. Allora
kABk 6 kAkkBk .
Dimostrazione. Segue immediatamente dalla associativit, grazie alla quale
per ogni vettore u U si ha
k(AB)ukW = kA(Bu)kW 6 kAkkBukV 6 kAkkBkkukU
da cui lenunciato.

Proposizione 3.3.10. Se V uno spazio normato e W uno spazio di


Banach (ossia completo), allora lo spazio B(V, W ), con la norma operatoriale
introdotta nella Definizione 3.3.5, rende B(V, W ) uno spazio di Banach.
Dimostrazione. Sia {Tn } una successione di Cauchy in B(V, W ) : per ogni
> 0 esiste N tale che kTn Tm k < se n, m > N. Ma allora, per ogni
v V , anche {Tn v} una successione di Cauchy in W , dal momento che
kTn v Tm vkW 6 kTn Tm kB(V,W ) kvkV .

(3.7)

Allora, poich W uno spazio di Banach, per ogni v V , esiste il limite


limn Tn v, che indichiamo con T v. evidente che loperatore v 7 T v
lineare.
Inoltre, sappiamo che kTn Tm k < se n, m > N : quindi, in base alla
disuguaglianza (3.7), kTn v Tm vk < kvk, e, passando al limite (nella norma
di W ) per n , ne deduciamo che kT v Tm vk 6 kvk se m > N.
Allora ssiamo un m > N e, dalla Denizione 3.3.5 di norma di T , abbiamo
kT vk 6 (kTm k + ) kvk. Quindi T un operatore limitato e kT Tm k 6
per m > N. Questo equivale al fatto che Tm T nella norma di B(V, W ).

Proposizione 3.3.11. Se V ha dimensione finita, W = V e T diagonale,


allora
kT k = max {|| : autovalore di T } .

348CAPITOLO 3. SPAZI VETT. TOPOLOGICI, ANALISI FUNZIONALE


Se invece T diagonalizzabile, cio se esiste una base di v1 , . . . , vn di V
tale che T manda ogni vettore vi in un suo multiplo i vi , allora loperatore C di cambiamento di base che manda la base canonica nella base dei vi
diagonalizza T , nel senso che C 1 T C diagonale, e
kT k 6 kCkkC 1 k max {|| : autovalore di T } .
Dimostrazione. Supponiamo che T sia diagonale (nella base canonica): cio
che gli autovettori siano e1 , . . . en ), e che gli autovalori siano ordinati in modo
che |1 | > |2 | > > |n |. Allora
Tv = T(

n
X

vi ei ) =

i=1

e quindi
2

kT vk =

n
X
i=1

|i | |vi | 6 |1 |

n
X

i vi ei ,

i=1

n
X
i=1

|vi |2 = |1 |2 kvk2 .

Perci kT k 6 |1 |. Daltra parte, T e1 = 1 e1 , e quindi kT k > |1 |. Ne segue


che
kT k = |1 | = max {|| : autovalore di T } .

Questo prova la prima parte dellenunciato. La seconda parte segue imme

diatamente dalla prima e dal Corollario 3.3.9.

Esercizio 3.3.12. Se un operatore T non diagonalizzabile, la sua norma in


generale maggiore del modulo del massimo autovalore. Ad esempio, su R2
si consideri, per ogni x R, loperatore Tx espresso nella base canonica dalla
matrice


1 x
0 1
Se x 6= 0, loperatore Tx espresso in forma canonica di Jordan e non
diagonalizzabile: ha lunico autovalore 1 con molteplicit 2, e quindi se fosse
diagonalizzabile sarebbe loperatore identit. Provare che la sua norma
maggiore di 1 e diverge al divergere di |x|.

Suggerimento: facile calcolare direttamente la norma, ma lo ancora di


pi utilizzare la Nota 3.3.7.

3.3. OPERATORI LINEARI LIMITATI E FUNZIONALI LINEARI

3.3.1

349

Funzionali lineari

Definizione 3.3.13. Un funzionale lineare F su uno spazio vettoriale topologico V (sul campo complesso) un operatore lineare F : V C.
Se V uno spazio normato e F continuo si denisce la sua norma in base
alla Denizione 3.3.5:
kF k = inf {C > 0 : |F v| 6 Ckvk v V } .

(3.8)

Lo spazio dei funzionali continui su uno spazio vettoriale topologico V si


chiama lo spazio duale di V , e si indica con V . Sappiamo dallEsercizio 3.3.6
che il duale di uno spazio normato uno spazio normato e dalla Proposizione
3.3.10 che il duale di uno spazio di Banach uno spazio di Banach.
Siccome i funzionali lineari sono casi particolari di operatori lineari, sappiamo dalla Proposizione 3.3.4 che un funzionale su uno spazio localmente
limitato continuo se e solo se limitato. Se lo spazio metrizzabile, allora
i funzionali limitati sono continui, ma il viceversa potrebbe non essere vero.
Inoltre:
Proposizione 3.3.14. Sia F un funzionale lineare su uno spazio vettoriale
topologico localmente limitato V . Allora F continuo se e solo se il suo
nucleo Ker F chiuso in V .
Dimostrazione. Se T continuo, allora Ker T , essendo la controimmagine
dellinsieme chiuso {0} in C, chiuso.
Viceversa, supponiamo Ker T chiuso e mostriamo che T un funzionale limitato: questo e la Proposizione Proposizione 3.3.4 implicano che T sia continuo. Possiamo supporre che Ker T non sia denso in V , perch altrimenti,
essendo chiuso, coinciderebbe con tutto V ed in tal caso T = 0 e lenunciato
vale automaticamente. Allora il complemento di ker T ha interno non vuoto.
Pertanto esiste un vettore v
/ Ker T un cui intorno disgiunto da ker T . Poich, per linvarianza per traslazione, gli intorni di v sono i traslati di intorni
dellorigine, questo signica che esiste un intorno U dellorigine, che per il
Lemma 3.1.8 possiamo scegliere stellato, tale che
(v + U) Ker T = .

(3.9)

Allora T (V ) stellato in C (Nota 3.3.2). Ma i sottoinsiemi stellati illimitati di


C sono evidentemente tutto C. Pertanto ci sono due possibilit: o T (U) un

350CAPITOLO 3. SPAZI VETT. TOPOLOGICI, ANALISI FUNZIONALE


sottoinsieme limitato di C, ed in tal caso T un funzionale limitato, oppure
T (U) = C. Ma nel secondo caso, deve esistere w U tale che T (w) = T (v):
allora v + w appartiene a T (v + U) ed anche a Ker T , il che contraddice (3.9).
Quindi T limitato, e perci continuo.

3.4

Assioma della scelta, prodotti cartesiani


infiniti e principio di massimalit di Hausdorff

Questa Sezione, pur essendo indispensabile per il successivo Teorema di


HahnBanach 3.5.3, presenta solo assiomi generali della matematica, i quali
quasi certamente sarebbero considerati ovvi da un qualsiasi lettore inesperto
o non molto critico. Pertanto i lettori in tale condizione sono invitati ad
astenersene, e per questo il titolo della Sezione contrassegnato con una
stelletta.
Un assioma fondamentale spesso assunto in molti campi della matematica
lassioma della scelta, che informalmente dice che, data una qualsiasi famiglia
di insiemi, si ottiene un nuovo insieme non vuoto scegliendone gli elementi
ad uno ad uno daglii insiemi della famiglia. In altre parole, esiste un nuovo
insieme non vuoto ciascuno dei cui elementi appartiene ad uno ed un solo
insieme della famiglia di partenza, e ciascun insieme della famiglia contribuisce un elemento. Che questo nuovo insieme sia costruibile con una procedura
iterativa ovvio se la famiglia iniziale nita o numerabile, ma non ovvio
se la famiglia pi che numerabile (per questo occorre un assioma!). Pi
formalmente:
Assioma 1. (Assioma della scelta.) Sia F una famiglia di insiemi non
vuoti. Esiste una funzione F definita su F che ad ogni insieme A F associa
un elemento F (A) A.
Grazie a questo assioma possibile dare un senso al concetto di prodotto
cartesiano di una famiglia di insiemi pi che numerabile:
Definizione 3.4.1. Sia {A } una famiglia di insiemi indicizzata da un indice
, dove linsieme di indiciQ non necessariamente nito o numerabile.
Allora il prodotto cartesiano A linsieme i cui elementi sono tutti le
successioni genealizzate {a : } (ovvero tutte le funzioni 7 a ) tali

3.4.

ASSIOMA DELLA SCELTA E PRINCIPIO DI MASSIMALIT 351

che a A per ogni indice . (Queste funzioni esistono grazie allassioma


della scelta.)
Definizione 3.4.2. Una relazione su un insieme A si chiama antisimmetrica se per ogni a, b A tali che a b e b a si ha a = b. La relazione si
chiama un ordinamento parziale se antisimmetrica e transitiva: se a b e c
sono elementi di A tali che a b e b c, allora a c. Un tipico esempio
la relazione di inclusione denita sulla famiglia di tutti i sottoinsiemi di
un dato insieme. Se essa anche esaustiva, nel senso che per ogni coppia a,
b A si ha a b oppure b a, allora la relazione si dice un ordinamento
totale (ad esempio la relazione di ordine su R).
Un elemento a A si dice massimale rispetto allordinamento parziale se
non esiste b A, b 6= a, tale che a b; in maniera simmetrica si denisce un
elemento minimale.
Lassioma della scelta ha parecchie altre formulazioni equivalenti, una
delle quali, il principio di massimalit di Hausdor, importante nel resto di
questo Capitolo. Lo enunciamo qui di seguito: per una dimostrazione dellequivalenza con lassioma della scelta si veda [15, pg. 31-36 e Appendice,]. Per
una deduzione pi breve del principio di massimalit di Hausdor a partire
dallassioma della scelta si veda [23, Appendice].
Assioma 2. (Principio di massimalit di Hausdorff.) Dato un qualsiasi insieme X munito di un ordinamento parziale , ogni sottoinsieme
totalmente ordinato di X (rispetto allordinamento ) contenuto in un sottoinsieme totalmente ordinato S massimale (rispetto allinclusione), ossia
tale che, se S T X e T totalmente ordinato (rispetto a ), allora
S = T.
Nota 3.4.3. Lapplicazione tipica quella in cui X = P(A) la famiglia di
tutti i sottoinsiemi di un insieme A, parzialmente ordinata per inclusione. I
sottoinsiemi totalmente ordinati sotto questo ordinamento parziale sono le
famiglie {A } di sottoinsiemi di A inscatolate, ossia consistenti di insiemi
inclusi uno nellaltro al crescwere dellindice. Lassiome asserisce che ogni
sottofamiglia di questo tipo inclusa in una famiglia massimale, ossia tale
che non vi si possono aggiungere altri insiemi senza perdere lordinamento
totale per inclusione.

352CAPITOLO 3. SPAZI VETT. TOPOLOGICI, ANALISI FUNZIONALE

3.5

Il teorema di HahnBanach

Questa Sezione riguarda funzionali lineari deniti su spazi vettoriali ma non


necessariamente continui: anzi, gli spazi vettoriali in generali non sono spazi
normati, non sono neppure spazi vettoriali topologici, e quindi la nozione di
continuit non ha senso. Il problema le estendibilit di un funzionale da
un sottospazio S di V a tutto V . A questo scopo, la nozione di continuit
rispetto ad una norma, ossia |F (v)| 6 Ckvk, viene rimpiazzata con una
maggiorazione con una funzione a valori reali e subadditiva:
Definizione 3.5.1. (Funzioni reali subadditive e seminorme.) Sia V
uno spazio vettoriale. Una funzione p : V R si dice
(i) subadditiva se p(v1 + v2 ) 6 p(v1 ) + p(v2 ) per ogni v1 , v2 V ;
(ii) positivamente omogenea se per ogni v V e > 0 si ha p(v) = p(v)
In generale non vero che p(v) = p(v). Quindi, quando una funzione F su
V maggiorata da una funzione positivamente omogenea e subadditiva, la
maggiorazione solo una maggiorazione per eccesso, ma F potrebbe essere
illimitata inferiormente. Per, se F un funzionale lineare maggiorabile in
modulo con una funzione positivamente omogenea subadditiva, nel senso che
|F (v)| 6 p(v) per ogni v V , allora necessariamente p(v) > 0 per ogni v 6= 0,
e p(0) = 0 per la condizione (ii) di omogeneit. Anche in questo caso, per,
non necessariamente vera lidentit p(v) = p(v), anche se naturalmente
|F (v)| = |F (v) per la linearit di F . Non neppure vero in generale che
p > 0. Al ne di queste maggiorazioni, le funzioni subadditive pi simili alle
norme sono le seminorme che introdurremo nella Denizione 3.2.8.
Cominciamo con il mostrare un risultato preliminare sulla estendibilit
di funzionali maggiorati da funzioni subadditive positivamente omogenee.
Si noti che, anch un funzionale lineare sia maggiorato da una funzione
a valori reali, per prima cosa occorre che il funzionale stesso sia a valori
reali: a causa della linearit, ci richiede che il campo di scalari su cui
denito lo spazio vettoriale sia R e non C (naturalmente ogni spazio vettoriale
sui complessi si pu reinterpretare come uno spazio vettoriale sui reali a
dimensione doppia, ma occorre reinterpretarlo in questo modo per poter dare
un senso ai prossimi enunciati). In seguito presenteremo una variante che si
applica a spazi vettoriali sul campo complesso.

3.5. IL TEOREMA DI HAHNBANACH

353

Lemma 3.5.2. Sia S un sottospazio proprio di uno spazio vettoriale V sul


campo reale, e consideriamo il sottospazio T di V generato da S e da un
nuovo vettore y V \ S : chiaramente V T un sottospazio proprio (di
codimensione 1).
Sia p una funzione subadditiva positivamente omogenea definita su T e f un
funzionale lineare su S (naturalmente a valori reali) tale che f (s) 6 p(s)
per ogni s S. Allora f si estende ad un funzionale lineare F su T (ossia
F |S f ) che verifica su T la stessa maggiorazione: F (t) 6 p(t) per ogni
t T.

Dimostrazione. Lo spazio vettoriale (reale) T generato da S e y consiste delle


combinazioni lineari s + y con s S e R. Ogni estensione lineare F di
f da S a T deve quindi vericare F (s + y) = F (s) + F (y) = f (s) + F (y).
Quindi dobbiamo solo scegliere := F (y) in maniera compatibile con la
condizione F 6 p.
Usiamo la linearit di F e la subadditivit di p per stabilire quali vincoli
sulla scelta di questa condizione comporti: per ogni s1 , S2 S si ha
s1 + s2 = s1 y + y + s2 , e quindi
f (s1 ) + f (s2 ) = f (s1 + s2 ) 6 p(s1 + s2 ) 6 (p(s1 y) + p(s2 + y) .
Separando le variabili otteniamo p(s1 y) + f (s1) 6 p(s2 + y) f (s2), ossia
la condizione
sup(p(s y) + f (s)) 6 inf (p(s + y) f (s)) .
sS

sS

Allora scegliamo tra gli elementi separatori degli insiemi ai due membri,
ossia in modo che
sup(p(s y) + f (s)) 6 6 inf (p(s + y) f (s)) .
sS

sS

(3.10)

Occorre solo vericare che questa scelta di verica la disuguaglianza F (s +


y) f (s) + 6 p(s + y). A questo ne, per prima cosa osserviamo che,
ssato > 0 arbitrario, dalla seconda disuguaglianza in (3.10), applicata al
vettore s/ invece di s, si ottiene, per ogni s S,
s

s
6p
,
(3.11)
+y f

mentre dalla prima si ottiene



s
s
.
(3.12)
y +f
> p

354CAPITOLO 3. SPAZI VETT. TOPOLOGICI, ANALISI FUNZIONALE


Notiamo anche che, se si moltiplicano entrambi i membri di (3.11) per > 0
dalla omogeneit positiva di p si ottiene
6 p(s + y) f (s) .

(3.13)

Invece, se si moltiplicano entrambi i membri di (3.12) per < 0, si ottiene


6 p(s y) f (s) .

(3.14)

Allora, combinando (3.13) e (3.14), ora abbiamo, per > 0,


+ f (s) =6 p(s + y) f (s) + f (s) = p(s + y) ,
e per < 0
+ f (s) =6 p(s + y) f (s) + f (s) = p(s + y) .
Quindi, in entrambi i casi, abbiamo vericato la disuguaglianza richiesta.

Per ottenere lestendibilit del funzionale da S a tutto V , e non soltanto


ad un sottospazio che estende V di una (o di un numero nito) di dimensioni,
dobbiamo ormai invocare solo il principuio di massimalit di Hausdor:

Teorema 3.5.3. (Teorema di HahnBanach per spazi vettoriali reali.) Sia p un funzione subadditiva e positivamente omogenea su uno spazio
vettoriale reale V , nel senso della precedente Definizione 3.5.1, sia S un sottospazio proprio di V e f un funzionale lineare su S che verifica f (s) 6 p(s)
per ogni s S. Allora esiste un funzionale lineare F definito su tutto V , che
estende f nel senso che F |S f , e che verifica la disuguaglianza F (v) 6 p(v)
per ogni v V .
Dimostrazione. Sia linsieme di tutti i funzionali lineari f deniti ciascuno
su un qualche sottospazio Vf V e che vericano f (v) 6 p(v) per ogni
v Vf . Diciamo che un funzionale lineare g estende un altro funzionale
lineare f se Vf Vg e g|Vf f . Lestensione denisce un ordinamento
parziale su : per ogni f , g , f g se g estende f .
In base al principio di massimalit di Hausdor (Assioma 2 della Sezione
3.4), esiste una famiglia {g } totalmente ordinata di funzionali in che
contiene f . Ora cusiamo insieme questi funzionali g per costruire un nuovo
funzionale F che li estende tutti. Come dominio di F scegliamo W := V ,

3.5. IL TEOREMA DI HAHNBANACH

355

e per v V poniamo F (v) = g (v). Lo stesso vettore v pu appartenere


a pi di un sottospazio g (poich {g } una famiglia totalmente ordinata,
i domini V sono inscatolati), ma se v V V allora g estende g e
quindi g (v) = g (v) : questo prova che la denizione di F ben posta,
ossia indipendente dalla scelta di . Il dominio W := V di F un
sottospazio vettoriale di V perch i V sono inscatolati, o pi precisamente
perch, se u, v W , allora u V e v V per qualche , , ma per
lordinamento totale della famiglia dei g deve essere g g o viceversa,
ossia V V o viceversa. Quindi entrambi u e v appartengono al pi grande
di questi due sottospazi, diciamo V , ma allora anche lo loro combinazioni
lineari vi appartengono, e quindi stanno in W . Inoltre, per ogni , R si
ha F (u + v) = g (u + v) = g (u) + g (v) = F (u) + F (v), e quindi
F un funzionale lineare, e per costruzione esso estende tutti i g , quindi in
particolare f . Questa estensione di f massimale, perch, se F G, allora
G estende tutti i g , per dal momento che la famiglia {g } massimale
questo signica che G uno dei g : ma allora G F e quindi G = F per la
propriet antisimmetrica dellordinamento (Denizione 3.4.2).
Rimane solo da dimostrare che W = V . Supponiamo per assurdo che esista
v 6= 0, v V \ W . Grazie al precedente Lemma 3.5.2 sappiamo che esiste una
estensione di F allo spazio generato da W e v che verica ancora, su questo
spazio pi grande, F 6 p : allora F pu essere esteso da un altro funzionale
in e quindi non massimale, una contraddizione.

Esempio 3.5.4. (Limite di Banach.) Sullo spazio (R) delle successioni reali limitate {xn : n N}, consideriamo la funzione p+ ({xn }) :=
lim supn xn . Allora p+ ({ xn }) = p+ ({xn }) per ogni scalare R, e
p+ ({xn + yn }) 6 p+ ({xn }) + p+ ({yn }). Quindi p+ una funzione omogenea subadditiva. Analogamente, la funzione p ({xn }) := lim inf n xn
omogenea, ma superadditiva: p ({xn + yn }) > p ({xn }) + p ({yn }). Ora
consideriamo il sottospazio vettoriale delle successioni che hanno limite nito. La funzione f ({xn }) := limn xn un funzionale lineare sullo spazio
, e su questo sottospazio si ha f = p+ = p . Quindi, grazie al Teorema
3.5.3, f si estende ad un funzionale lineare Lim su tale che Lim 6 p+ .
Daltra parte, Lim({xn }) Lim({xn }) =6 lim sup{xn } = lim inf{xn },
quindi Lim > p su . Quindi lim inf 6 Lim 6 lim sup.
Sullo spazio delle successioni, sia k loperatore di traslazione di passo k,
denito da k ({xn }) = {xnk }
j=1 . chiaro che p+ e p sono invarianti
per traslazione: lim supn xnk = lim sup xn , ed analogamente per il mini-

356CAPITOLO 3. SPAZI VETT. TOPOLOGICI, ANALISI FUNZIONALE


mo limite. Allora anche la loro estensione Lim invariante per traslazione,
perch
0 = lim inf ({xn } k {xn }) = lim inf (xn xnk )
n

6 Limn (xn xnk ) 6 lim sup(xn xnk ) = 0


n

e quindi Lim xn = Lim xnk , per ogni ssato k. Il funzionale Lim su si


chiama il limite di Banach.

Proviamo ora una variante del Teorema di HahnBanach 3.5.3 per spazi
vettoriali complessi:
Teorema 3.5.5. (Teorema di HahnBanach per spazi vettoriali complessi.) Su uno spazio vettoriale V sul campo complesso, sia p una seminorma (come visto nella Definizione 3.5.1, una seminorma una funzione
reale subadditiva ed omogenea, nel senso che
p(v) = ||p(v)

(3.15)

per ogni C e v V . Sia S un sottospazio proprio di V e f un funzionale


su S lineare complesso (ossia rispetto alle combinazioni lineari a coefficienti
complessi) e che verifica |f (s)| 6 p(s) per ogni s S. Allora esiste un
funzionale lineare (complesso) F definito su tutto V , che estende f nel senso
che F |S f , e che verifica la disuguaglianza |F (v)| 6 p(v) per ogni v V .
Dimostrazione. Lo spazio complesso V anche uno spazio vettoriale reale,
ed ogni funzionale lineare complesso F anche un funzionale lineare reale,
ma il viceversa non sempre vero, perch se F un funzionale lineare reale
allora F (v) = F (v) per scalari reali , ma non necessariamente per scalari
complessi. Quei funzionali F : V C lineari in senso reale che sono lineari
su V anche nel senso complesso sono quelli per cui, per ogni v V , si ha
F (v) = F (v) anche quando C : questo equivale a richiedere che valga
lidentit F (iv) = iF (v) per ogni vettore v V .
Allora consideriamo il funzionale f lineare in senso complesso su S, che
pertanto soddisfa lidentit
f (is) = if (s)

(3.16)

per ogni s S. Poniamo g = Re f e h = Im f . I funzionali g e h sono lineari


in senso reale e f = g + ih. Segue da (3.16) che f (is) = g(is) + ih(is) =

3.5. IL TEOREMA DI HAHNBANACH

357

if (s) = i(g(s) + ih(s)) = g(s) h(s), da cui, separando le parti reale ed


immaginaria, si trova g(is) = h(s). In altre parole, per ogni s S,
f (s) = g(s) + ih(s) = g(s) ig(is) .

(3.17)

Daltra parte, g(s) = Re f (s) 6 |f (s)| 6 p(s). Allora, in base alla versione
reale del Teorema di HahnBanach, esiste un funzionale lineare reale G su
tutto V che soddisfa G(v) 6 p(v). Allora poniamo F (v) = G(v) iG(iv).
Sappiamo da (3.17) che F (s) = f (s) per ogni s S, ovvero che F estende
f . Inoltre F lineare nel senso complesso, perch
F (iv) = G(iv) iG(i2 v) = G(iv) + iG(v) = i(G(v) iG(iv)) = iF (v) .
Resta da provare la maggiorazione |F | 6 p. Scriviamo F (v) nella forma
polare, F (v) = |F (v)|eit . Allora F (eit v) = |F (v)| un numero reale (non
negativo), e quindi F (eit v) = G(eit v). Dalla propriet di omogeneit
(3.15) ora segue che |F (v)| = G(eit v) 6 p(eit v) = p(v).

Una parte della dimostrazione precedente merita di essere menzionata


separatamente per la seguente propriet interessante:
Corollario 3.5.6. Un funzionale lineare complesso su uno spazio vettoriale
complesso univocamente determinato dal funzionale reale dato dalla sua
parte reale (e anche dal funzionale lineare reale dato dalla sua parte immaginaria). In particolare, sia W lo spazio vettoriale complesso dato dalla
complessificazione di uno spazio vettoriale reale V , nel senso che i vettori in
W sono del tipo u+iv con u, v V , con loperazione ovvia di moltiplicazione
per scalari complessi (ad esempio la moltiplicazione per i manda u V in
iu W ) e di addizione: (u1 + iv1 ) + (u2 + iv2 ) = (u1 + u2 ) + i(v1 + v2 ). Allora
il duale (complesso) di W la complessificazione del duale (reale) di V , nel
senso che, per ogni f W ,
f (u + iv) = Re f (u) Im f (v) + i(Re f (v) + Im f (u)) .
Dimostrazione. Scriviamo f = Re f + i Im f . Allora segue da (3.16) che
Im f (iv) = i Re f (v), per ogni v. Quindi, una volta data la parte reale di
f , la sua parte immaginaria univocamente determinata. Il viceversa segue
allo stesso modo dalla relazione Re f (iv) = Re(if (v)) = Im f (v).

358CAPITOLO 3. SPAZI VETT. TOPOLOGICI, ANALISI FUNZIONALE


Per lultima asserzione, sia f un funzionale complesso su W . Allora
f (u + iv) = Re f (u + iv) + i Im f (u + iv)
= Re f (u) + Re(if (v)) + i Im f (u) + i Im(if (v))
= Re f (u) Im f (v) + i Im f (u) + i Re f (v) .

Nota 3.5.7. Nella loro piena generalit i teoremi di HahnBanach consentono di estendere funzionali lineari reali maggiorati da funzioni subadditive
(Teorema 3.5.3) o funzionali complessi maggiorati in modulo da seminorme
(Teorema 3.5.5). Un caso particolare quello di funzionali lineari su uno spazio normato maggiorati in modulo dalla norma, ossia continui (Denizione
3.3.13). In tal caso il teorema di HahnBanach 3.5.5 permette costruire un
numero arbitrario di estensioni di un funzionale continuo f su un sottospazio
S chiuso in V (nella norma di V ) ad un funzionale continuo (con la stessa
norma kf k) sullintero spazio V . Ad esempio, in base al Lemma 3.5.2, sappiamo che se S ha codimensione nita d in V , immediato vedere (esercizio
per il lettore) che le estensioni di f sono in corrispondenza biunivoca con lo
spazio quoziente V /S, e quindi sono uno spazio vettoriale di dimensione d.
Naturalmente, se il sottospazio vettoriale S, invece di essere chiuso in V ,
denso (nel qual caso, naturalmente, la noprma di S non la restrizione a S
della norma di V , altrimenti S sarebbe un sottospazio chiuso), allora esiste
ununica estensione continua di f , ovvero f (v) = limsv f (s).

Ecco due esempi di interesse geometrico.


Proposizione 3.5.8. Sia V uno spazio normato. Per ogni v V esiste un
funzionale lineare continuo f su V , di norma 1, tale che f (v) = kvk.

Dimostrazione. Sia S lo spazio unidimensionale generato da v, e poniamo


f (v) = kvk per ogni scalare . Allora f un funzionale di norma 1 su S,
e come notato nellEsempio 3.5.7 esso si sstende ad un funzionale di norma
1 su tutto V .

Corollario 3.5.9. La norma di ogni vettore v in uno spazio normato V


si ottiene con una formula duale a quella in (3.8), calcolando lestremo dei
valori assunti su v dai funzionali continui nella sfera unitaria dello spazio
duale:
kvkV = sup{|f (v)| : f V , kf kV 6 1} .

3.6.

TEOREMA DI HAHNBANACH IN FORMA GEOMETRICA 359

Dimostrazione. Segue subito dalla precedente Proposizione 3.5.8 se osserviamo che, se kf k 6 1, allora |f (v)| 6 kf k kvk < kvk, in base a (3.8).

Il prossimo enunciato mostra che i funzionali continui sugli spazi normati


separano i sottospazi dai punti ad essi esterni:
Proposizione 3.5.10. Sia V uno spazio normato e S un sottospazio. Sia
v V a distanza da S :
kv sk >

per ogni s S .

(3.18)

Allora esiste un funzionale continuo f su V , di norma 1, tale che f (s) = 0


per ogni s S ma f (v) = .
Dimostrazione. Sia T il sottospazio di V generato da S e v. Per ogni vettore
t T si ha t = v + s per qualche scalare e per qualche s S. Deniamo
il seguente funzionale f su T : f (v + s) = . chiaro che f lineare:
f (t1 +t2 ) = f (+1v+s1 +2 v+s2 ) = (1 +2 ) = f (t1 )+f (t2 ). Mostriamo che
kf k 6 1. Per questo basta osservare che, per ogni e s, si ha |f (v + s)| :=
6 kv + sk : ma questo vero perch kv + sk = || kv + s/k > || in
base a (3.18). Cos abbiamo costruito un funzionale f su T tale che f 0
sul sottospazio S, f (v) = e |f (t)| 6 ktk per ogni t T .
Ora, grazie al Teorema di HahnBanach, possiamo estendere f a tutto V in
modo che si abbia |f (v)| 6 kvk per tutti i v (si veda la Nota 3.5.7). Quindi

kf kV = 1.

3.6

Teorema di HahnBanach in forma geometrica e separazione tramite funzionali in


spazi localmente convessi

In questa Appendice, per completezza, presentiamo una formulazione geometrica del Teorema di HahnBanach 3.5.3, enunciandolo in termini di funzionali che separano insiemi convessi, e lo applichiamo per dedurre propriet di
separazione stretta tramite funzionali (Denizione 3.9.1) di insiemi convessi
disgiunti muniti di opportune propriet, ad esempio in spazi localmente convessi. Sappiamo dalla Nota 3.9.6 che per enunciati di questo tipo la convessit
una condizione indispensabile.

360CAPITOLO 3. SPAZI VETT. TOPOLOGICI, ANALISI FUNZIONALE


Teorema 3.6.1. (Teorema di HahnBanach in forma geometrica.)
Siano C1 e C2 due insiemi convessi non vuoti disgiunti in uno spazio vettoriale topologico V . Allora C1 e C2 sono separati da funzionali lineari continui
nel modo seguente.
Se V uno spazio vettoriale reale,
(i) se C1 aperto, esiste un funzionale continuo reale f ed un numero
R tali che
f (a) < 6 f (b)
per ogni a A e b B;
(ii) se C1 compatto e C2 chiuso, e V localmente convesso, esiste un
funzionale continuo reale f e numeri < R tali che
f (a) < < < f (b)
per ogni a A e b B.
Se invece V uno spazio vettoriale complesso, le stesse disuguaglianze sono
soddisfatte dal funzionale reale Re f per qualche funzionale complesso f .
Dimostrazione. suciente dimostrare lenunciato nel caso di spazi vettoriali reali, perch, se V uno spazio complesso, esso anche uno spazio reale,
ed il funzionale reale f dellenunciato per spazi reali si estende in unico modo ad un funzionale complesso g con Re g = f (Corollario 3.5.6), e quindi g
verica lenunciato per spazi complessi.
Assumiamo allora che V sia uno spazio reale. La parte (i) si dimostra grazie
ad un argomento simile a quello che prova la Proposizione 3.9.3 e che riassumiamo qui di seguito. Fissiamo vi Ci (i = 1, 2) e poniamo v0 = v1 v2 .
Allora C := C1 C2 +v0 un intorno convesso di 0, la cui funzione di supporto p veriva P (v0 ) > 1. Sullo spazio S generato da v0 poniamo f (v0 ) = .
Allora, visto che p(v0 ) > 1 si ha f (v) = p(v) se v = v0 con > 0, mentre,
per < 0, si ha f (v0 ) < 0 > p(v0 ). Pertanto f 6 p su S, e, siccome dal
Lemma 3.2.10 sappiamo che la funzione di supporto p una funzione subadditiva positivamente omogenea, segue dal Teorema di HahnBanach 3.5.3 che
f ha una estensione a tutto V che verica ancora f 6 p. Poich sappiamo
che p 6 1 su C (parte (ii) del Lemma 3.2.10), anche f 6 1 su C, ma per
linearit si ha anche f > 1 su C. Pertanto |f | 6 1 su C (C), che
un intorno aperto (convesso) di 0. Ma allora f un funzionale continuo,

3.6.

TEOREMA DI HAHNBANACH IN FORMA GEOMETRICA 361

perch la controimmagine dellaperto (1, 1) R un aperto in V , e per


linearit lo stesso succede per ogni intorno aperto (, ) di zero (si veda
anche la dimostrazione della Proposizione 3.9.4 per estendere la continuit
di f ai punti non nulli tramite una traslazione).
Ora, analogamente alla dimostrazione della Proposizione 3.9.3, per ogni u
C1 e v C2 si ha
f (u) f (v) + 1 = (f (u v + v0 ) 6 p(u v + v0 ) .

(3.19)

f (C1 ) 6 f (C2 ) .

(3.20)

Poich u v + v0 C lultimo membro minore o uguale a 1, ma, dal


momento che C un aperto convesso, la semiretta uscente dallorigine che
passa per il punto u v + v0 interseca la frontiera di C in un punto pi
lontano dallorigine di quanto sia u v + v0 , e quindi p(u v + v0 ) < 1.
Allora segue da (3.19) che f (u) < f (v). Ma ovviamente limmagine di un
convesso tramite un funzionale lineare (reale) un convesso in R, e quindi
Daltra parte C1 aperto. Allora formuliamo la seguente Asserzione: limmagine tramite un funzionale lineare reale non nullo di un aperto un aperto
in R. Per provare questa asserzione, per linearit basta mostrare che questo vero per un intorno aperto di 0 V . Ma ci equivale a provare che
limmagine di un tale intorno contiene, oltre a zero, anche un altro numero
reale : infatti in tal caso per linearit deve contenere tutto laperto (, ).
Basta quindi mostrare che, se per qualche v vicino a 0, si ha f (v) 6= 0. per
questo scopo, visto che f non identicamente nullo, prendiamo un qualsiasi
vettore y tale che f (y) 6= 0 : ogni suo multiplo non nullo verica la stessa
disuguaglianza, ed i multipli sucientemente piccoli sono nel pressato intorno aperto dellorigine. Questo prova lasserzione.
Dallasserzione segue che f (C1 ) aperto, e quindi := supuC1 f (u) verica
f (x) < per ogni x C1 . Da questa disuguaglianza e (3.20) segue che
verica la disuguaglianza della parte (i) dellenunciato.
Veniamo alla parte (ii) ed assumiamo C1 compatto. In base alla Proposizione 3.1.10, esiste un intorno convesso W di 0 in V tale che (C1 +W )C2 = .
Visto che C1 + W un aperto, possaimo applicare la prima parte di questa
dimostrazione e trovare un funzionale reale continuo f tale che f (C1 + W )
e f (C2 ) sono convessi disgiunti in R, e f (C1 + W ) < f (C2 ). Daltra parte,
limmagine continua di un insieme compatto compatta, e quindi f (C1)
un sottoinsieme compatto di f (C1 + V ): pertanto := max f (C1 ) < :=
sup f (C1 + V ). Questo prova la parte (ii).

362CAPITOLO 3. SPAZI VETT. TOPOLOGICI, ANALISI FUNZIONALE

3.7

Compattezza e prodotto di spazi compatti

Teorema 3.7.1. (Teorema di Alexander della sottobase.) Sia X uno


spazio topologico con una sottobase (nel senso della Definizione 1.10.1) A tale
che da ogni ricoprimento con aperti in A si pu estrarre un sottoricoprimento
finito. Allora X compatto.
Dimostrazione. Per assurdo, supponiamo che X non sia compatto, e mostriamo che allora X deve ammettere un ricoprimento con aperti in A (o pi
brevemente, un A-ricoprimento) senza sottoricoprimenti niti.
Indichiamo con C la famiglia di tutti i ricoprimenti aperti di X che non ammettono sottoricoprimenti niti. Lipotesi che X non sia compatto equivale
ad asserire che C non sia vuota. Ordiniamo C per inclusione e consideriamo una sottofamiglia massimale totalmente ordinata P (che esiste in base al
principio di massimalit di Hausdor, Assioma 2) della Sezione 3.4). Poniamo U = {B : B P}.
Proviamo la seguente Asserzione: U un ricoprimento aperto di X senza
sottoricoprimenti finiti, ma massimale con questa propriet, nel senso che,
per ogni aperto V
/ U, la famiglia di aperti U {V } un ricoprimento di
aperti che contiene un sottoricoprimento finito.
Infatti, poich tutte gli elementi di P C sono ricoprimenti aperti di X,
chiaro che anche U lo . Inoltre, dal momento che P totalmente ordinato
per inclusione, ogni sottofamiglia nita di U contenuta in qualche elemento
di P (ossia in qualche ricoprimento aperto senza sottoricoprimenti niti), e
quindi U non ammette sottoricoprimenti niti. Daltra parte, dal momento
che P massimale, se a U si aggiungiamo un aperto ottieniamo un ricoprimento aperto di X che deve contenere un sottoricoprimento nito. Questo
prova lasserzione.
Ora poniamo V = U A. Poich V U, sappiamo dalla prima parte dellAsserzione precedente che V non contiene sottoricoprimenti niti. Allora
completiamo la dimostrazione per assurdo mostrando che scrV un ricoprimento di X (ovviamente, un A-ricoprimento).
Infatti, supponiamo (una seconda volta per assurdo) che esista x X non ricoperto da V, ossia non appartenente ad alcun aperto in V. Per, per la prima
parte dellAsserzione, x O per qualche aperto O U. Ma rammentiamo
che A una sottobase, ossia esiste un numero nito di aperti V1 , . . . , Vn A
tali che x Vi O. Nessuno di questi aperti Vi pu appartenere alla
famiglia V, perch altrimenti x sarebbe ricoperto da V. Allora, per la secon-

3.7.

PRODOTTO DI SPAZI COMPATTI

363

da parte dellAsserzione, esistono n ricoprimenti aperti niti di X del tipo


{W11 , W21 , . . . , Wm1 1 , V1 }, . . . , {W1n , W2n , . . . , Wmn n , Vn }, con tutti gli aperti
k
Wij in U. per semplicit, per 1 6 k 6 n scriviamo Dk = m
j=1 Wjk : ogni Dk
unione finita di aperti in U. Quanto abbiamo osservato equivale a scrivere
X Dk Vk per ogni tale k. Allora
X D1 D2 Dn nk=1 Vk .

(3.21)

Ma H := nk=1 Vk un aperto, e linclusione (3.21) asserisce che, se aggiungiamo laperto H a U, otteniamo un ricoprimento che ammette un sottoricoprimento nito (il sottoricoprimento al lato destro di (3.21). Questo contraddice
la seconda parte della precedente Asserzione: tale contraddizione completa
la dimostrazione per assurdo.

Definizione 3.7.2. Abbiamo introdotto nella Denizione 3.4.1 la nozione di


prodotto cartesiano di una famiglia di insiemi arbitraria
(non necessariamenQ
te numerabile). Sul prodotto cartesiano A = A deniamo le proiezioni
canoniche nel modo ovvio: se a = {a } un elemento di A, poniamo
(a) = a . Deniamo la topologia prodotto come la pi debole topologia
che rende continue tutte le proiezioni canoniche.
Nota 3.7.3. In base alla parte (i) dellEsercizio 1.13.7, una sottobase per
la topologia prodotto costituita dalla famiglia S := S , dove S la
famiglia di tutte le controimmagini 1 (V ) al variare di V fra gli aperti in
A . (Attenzione: S la famiglia
di insiemi {U , : } che coincidono
1
con A se 6= e con (V ) A se = ).

Teorema 3.7.4. (Tychonoff, Cech.) Sia A il prodotto cartesiano di una


famiglia infinita qualsiasi di spazi compatti A , al variare di in un insieme
qualsiasi di indici . Allora A compatto nella topologia prodotto della
Definizione 3.7.2.

Dimostrazione. Sia S la sottobase della topologia prodotto considerata nella


precedente Nota 3.7.3, e C un ricoprimento di A consistente di aperti in
questa sottobase. Consideriamo le restrizioni C := C S . Allora C = C .
Dimostriamo anzitutto che C un ricoprimento di A per almeno un indice
(consigliamo al lettore di ritornare alla precedente Nota 3.7.3 e rendersi
conto che C copre automaticamente il prodotto di tutti gli insiemi A con
6= ). Se non fosse cos, per ogni esisterebbe un punto a A tale

364CAPITOLO 3. SPAZI VETT. TOPOLOGICI, ANALISI FUNZIONALE


che C consisterebbe di aperti disgiunti da 1 (a ). Allora consideriamo il
punto a A tale che (a) = a per ciascun : abbiamo appena visto
che nessun C copre il punto a. Rammentando che C lunione degli C ,
deduciamo che a non appartiene ad alcun elemento del ricoprimento C. Ma
questo contraddice il fatto che C sia un ricoprimento di A.
Allora 21 lmeno un C deve coprire A. Rammentiamo ancora una volta che
C consiste di collezioni di aperti, indicizzate dallindice , che consistono di
tutto A per ogni 6= . Allora il fatto che C copra A equivale a dire che
la componente delle collezioni di aperti in C copre A .
Per A compatto, e quindi esiste un suo sottoricoprimento nito di A ,
ossia, per quanto appena visto, un sottoricoprimento nito di A consistente
di aperti che appartengono a C . Poich C contenuto in C, questo signica
che C ha un sottoricoprimento nito. Poich C costruito a partire dalla
sottobase S, segue dal Teorema della sottobase di Alexander 3.7.1 che A
compatto.

3.8

Dualit su spazi vettoriali topologici

Notazione 3.8.1. Indicheremo spesso con v i punti di uno spazio vettoriale


topologico V , con x i punti dello spazio duale, ossia i funzionali lineari continui (Denizione 3.3.13), e scriveremo hv, x i invece di x (v). In questo modo
lazione di V su V espressa da un funzionale bilineare h, i : V V C,
che indichiamo con il termine dualit.
Siamo anzitutto interessati a studiare la topologia debole indotta su uno
spazio vettoriale topologico V dai suoi funzionali lineari (Denizione 1.13.3).
Premettiamo un lemma.
Lemma 3.8.2. La topologia debole w indotta su uno spazio vettoriale V
dalla famiglia di tutti i suoi funzionali lineari invariante per traslazione
(traslando una base locale ad un punto si ottiene una base locale al punto
traslato), localmente convessa e di Hausdorff (Definizioni 3.1.1 e 1.10.2), ed
in essa le operazioni di somma e di moltiplicazione per scalare sono continue.
Dimostrazione. chiaro che w invariante per traslazione, perch la sua
base locale al punto y data dagli aperti
Oy = Oy (; x1 , . . . , xn ) = {v : |hxi , vi hxi , yi| < , i = 1, . . . , n}

3.8. DUALIT SU SPAZI VETTORIALI TOPOLOGICI

365

della parte (i) dellEsercizio 1.13.7 viene mandata dalla traslazione z nella corrispondente base locale al punto traslato z (y) = y x, grazie alla
linearit dei funzionali xi (esercizio!). Sappiamo anche che w una topologia localmente convessa, perch questa base locale, grazie alla limearit
dei funzionali xi , consiste di insiemi convessi. Ora la propriet di Hausdor
segue direttamente dalla propriet di separazione della Proposizione 3.1.10,
ossia dal fatto che i funzionali lineari separano i punti di V (si veda anche il
Teorema di HahnBanach 3.6.1), e dalla parte (ii) dellEsercizio 1.13.7.
Per mostrare che la somma continua, basta osservare che, se tre vettori
in V soddisfano x = y + z, allora la controimmagine sotto loperazione di
somma di un aperto di base Ox () contiene laperto Oy (/2) Oz (/2), visto
che, di nuovo per la linearit dei funzionali xi , vale lidentit Oy (/2) +
Oz (/2) = Oy+z ().
Analogamente, per mostrare che la moltiplicazione per scalari continua,
prendiamo un aperto della base locale allorigine, O = {v V : |hxi , vi| < }.
Per ogni v V si ha v/s O per tutti gli s R+ cos grandi che si abbia
|hxi , vi| < s per tutti gli indici i = 1, . . . , n. Allora ssiamo v V e > 0,
e tale che sia piccolo, ovvero che verichi
| | < r .

(3.22)

Scegliamo y corrispondentemente vicino a x: y x rO . Allora


y (r + s)O ,

(3.23)

visto che v rO . Scriviamo v y = ( )y + (y v). Allora, in base


a (3.22) e (3.23), ( )y r(r + s)O , mentre (y v) ||rO. Ponendo
gamma := r(r + s) + ||r, da queste inclusioni segue che v y O .
Poich r arbitrario, scegliamolo cos piccolo che si abbia < 1. Allora,
ssato > 0 e v V , esiste un intorno di in R (di raggio r) ed un intorno
di rO di x in V tali che vy appartiene allintorno O dellorigine per ogni
e y in questi due rispettivi intorni. Ci equivale a dire che la moltiplicazione
per scalari una operazione continua su R V .

Proposizione 3.8.3. Sia V uno spazio vettoriale e F uno spazio vettoriale


di funzionali lineari su V che separano i punti di V , nel senso della Definizione 1.13.5. Allora la topologia debole indotta da F rende V uno spazio
vettoriale topologico localmente convesso con duale V = F.

366CAPITOLO 3. SPAZI VETT. TOPOLOGICI, ANALISI FUNZIONALE


Dimostrazione. In base alla Denizione 3.1.1, anch la topologia debole
w indotta da F renda V uno spazio vettoriale topologico occorre che i punti
siano chiusi (questa la propriet di separazione T1 , in base alla parte (i) della
Proposizione 1.10.10) e che le operazioni di spazio vettoriale siano continue.
Dal momento che una topologia di Hausdor necessariamente T1 (come
osservato nella parte (ii) della Proposizione 1.10.10), il lemma 3.8.2 mostra
che questi requisiti sono soddisfatti, e che con questa topologia V diventa
uno spazio vettoriale topologico localmente convesso. Per la denizione di
topologia debole (Denizione 1.13.4), in questa topologia tutti i funzionali
lineari in F sono continui. Quindi F V .
Viceversa, mostriamo che V F. Sia x un funzionale lineare w -continuo
su V : dobbiamo mostrare che x appartiene a F. Per linearit, questo equivale
a dire che x continuo a 0, ossia che la controimmagine sotto x di un intorno
di base (a, a) di 0 = x (0) contiene un aperto di base locale al vettore 0,
ossia un aperto del tipo O = O (x1 , . . . , xn ) per opportuni x1 , . . . , xn F: in
altre parole, |hx , vi| < a per ogni t O. Quindi, in particolare, se hxi , vi = 0
per i = 1, . . . , n, allora hxi , vi| < per ogni > 0, ossia hx i, vi = 0.
Quindi lintersezione dei nuclei N := {v : hx i, vi = 0} per tutti gli indici
i = 1, . . . , n contenuta nel nucleo di x . Allora deniamo una applicazione
lineare : V Cn (oppure : V Rn se V uno spazio vettoriale sul
campo reale) nel modo seguente:
(v) := (hx1 , vi, . . . , hx1 , vi) .
Il nucleo di questa operatore lineare N, ovvero (v1 ) = (v2 ) se hxi , v1 i =
hxi , v1 i per ogni i. Ma allora, visto che N anche contenuto nel nucleo di
x per quanto appena osservato, si ha (v1 ) = (v2 ) se hx , v1 i = hx , v2 i.
Questo signica che x si fattorizza rispetto a , ossia x = L per qualche
funzione L : Cn C (oppure L : Rn R se V uno spazio vettoriale reale).
Poich x e sono applicazioni lineari, deve esserlo anche L. QuindiPesistono
numeri ci nel campo di base (C oppure R) tali che L(t1 , . . . , tn ) = ni=1 ci ti .
Quindi

x (v) = L((v)) =

L(hx1 , vi, . . . , hx1 , vi)

n
X
i=1

ci hxi , vi .

In altre parole, il generico funzionale x V combinazione lineare di opportuni funzionali xi F. Poich abbiamo assunto che F sia uno spazio
vettoriale, da questo segue che x appartiene a F.

3.8. DUALIT SU SPAZI VETTORIALI TOPOLOGICI

367

Supponiamo ora che V sia uno spazio vettoriale topologico con una topologia , e consideriamo la topologia debole w indotta dai funzionali lineari
in V , ossia i funzionali che sono continui rispetto a . Sappiamo che w
(Esercizio 1.13.4). Sappiamo inoltre, dalla parte (iv) dellEsercizio 1.13.7,
che la toplogia debole indotta dalla famiglia di tutte le funzioni continue
coincide con la topologia originale se in essa lo spazio V verica la propriet di separazione T3 della Denizione 1.10.2 e le funzioni continue separano
i punti dai chiusi: ma qui stiamo considerando la famiglia dei funzionali lineari continui, che sono molti meno di tutte le funzioni continue, e quindi
la topologia debole w indotta da essi pu essere pi debole della topologia
originale. Mostriamo che in eetti di solito cos:
Nota 3.8.4. Una base locale (Denizione 1.10.1) di intorni dellorigine della
topologia debole indotta da V consiste degli aperti O := {x : hxi , vi| <
, i = 1, . . . , n}, al variare di x1 , . . . , xn in V (si veda la parte (i) dellEsercizio 1.13.7). Fissiamo questi funzionali e sia N lintersezione dei loro nuclei:
N := v V : hxi , vi = 0, i = 1, . . . , n. La mappa v 7 (hx1 , vi , . . . , hxn , vi))
un operatore lineare da V a Cn ed il suo nucleo N. Quindi dim V 6
n + dim N, e pertanto N ha dimensione innita se questo vero per V . Daltra parte, N O , e quindi ogni intorno di base dellorigine contiene qualche
sottospazio di dimensione innita, se V uno spazio vettoriale topologico a
dimensione innita. In particolare, in tal caso w non 21 una topologia localmente limitata (Denizione 3.1.1). Quindi, in base alla Nota 3.1.2, in tutti
gli spazi normati a dimensione innita la topologia debole strettamente pi
debole della topologia originale, che dora in poi chiameremo topologia forte.

Notazione 3.8.5. Dora in poi riserviamo il nome di topologia debole su uno


spazio vettoriale topologica V per la topologia pi debole che rende continui
tutti i funzionali lineari su V .
Abbiamo visto nella Nota 3.8.4 che, in generale, la topologia debole
strettamente pi debole della topologia forte. A questo punto, per, il Teporema di HahnBanach 3.6.1 implica una conseguenza che mitiga questa
dierenza fra le due topologie:
Proposizione 3.8.6. Sia V uno spazio vettoriale localmente convesso ed
E un sottoinsieme convesso. Allora la chiusura di E nella topologia debole w
coincide con la chiusura nella topologia forte (ossia la topologia originale).

368CAPITOLO 3. SPAZI VETT. TOPOLOGICI, ANALISI FUNZIONALE


Dimostrazione. Poich w , ogni aperto in w gi in , e quindi anche
ogni chiuso. Pertanto la chiusura debole di E w di E , essendo un insieme
chiuso nella topologia debole, un insieme chiuso anche nella topologia .
Ma la chiusura E di E in lintersezione di tutti gli insiemi chiusi in che
contengono E, e quindi E E w . Questa inclusione non richiede lipotesi di
convessit di E: ma il viceversa s.
In eetti, il viceversa equivale a dimostrare che il complemento di E un
aperto nella topologia debole. Sia v0
/ E. Poich E convesso, per il
Teorema di HahnBanach 3.6.1 esistono un funzionale x V ed un elemento
separatore R tali che, per ogni v E, si ha Re x (v0 ) < < Re x (v)
per ogni v E. Pertanto linsieme {u V : Re x (u) < }, che un aperto
nella topologia debole, un intorno di v0 in w disgiunto da E. Cos ogni
punto nel complemento di E ha un intorno debole disgiunto da E, e quindi
E aperto in w . pertanto E chiuso in w , e da questo, analogamente a
prima, segue linclusione E w E.

Poich ogni spazio vettoriale un insieme convesso, da questo segue:

Corollario 3.8.7. Un sottospazio di uno spazio vettoriale localmente convesso V chiuso nella topologia forte se e solo se lo nella topologia debole.
Un convesso in V denso nella topologia forte se e solo se lo in quella
debole.

3.9
3.9.1

Spazi localmente convessi e teorema di Krein


Milman

Separazione di insiemi convessi tramite funzionali

I teoremi di HahnBanach della Sezione 3.5 hanno conseguenze importanti


circa la separabilit di insiemi convessi in spazi vettoriali tramite funzionali
lineari.
Definizione 3.9.1. Si dice che due sottoinsiemi A, B di uno spazio vettoriale
V sono separati da un funzionale lineare reale f V se supvA f (v) 6
inf vB f (v) o viceversa; si dice che i due insiemi sono strettamente separati
da f se la disuguaglianza vale in senso stretto.
Due insiemi sono separati da un funzionale complesso f se sono separati, nel
senso appena indicato, dal funzionale reale Re f .

3.9.

TEOREMA DI KREINMILMAN

369

Abbiamo bisogno di una premessa.


Nota 3.9.2. Rammentiamo che un punto v interno ad un insieme E se esiste
un aperto O E tale che v O. Se E un sottoinsieme di uno spazio vettoriale topologico V , allora questo implica la propriet seguente: lintersezione
con E di ogni retta che passa per v contiene un intervallo aperto. Infatti, se
parametrizziamo la retta come 7 v + x, allora questa una funzione continua di e la controimmagine di O deve essere aperta. facile dimostrare
che un punto che verica questa propriet in un insieme convesso C interno
a C nel senso usuale (esercizio per il lettore; cautela: senza la condizione di
convessit i punti che vericano questa propriet non sono necessariamente
interni nel senso usuale). Poich nel seguito di questa Sezione restringiamo
lattenzione a questa propriet solo su insiemi convessi, indichiamo i punti
che la vericano semplicemente come punti interni.

Proposizione 3.9.3. Siano C1 e C2 due insiemi convessi disgiunti in uno


spazio vettoriale topologico V , uno dei quali contiene un punto interno. Allora esiste un funzionale lineare f non nullo che separa C1 e C2 , nel senso
della Definizione 3.9.1.
Dimostrazione. Diciamo che sia C1 a contenere un punto interno v1 . Allora
C1 C2 (linsieme dei vettori dierenza) convesso (esercizio!) e, per ogni
ssato v2 C2 , il punto v0 := v1 v2 interno a C1 C2 . Allora linsieme
C := C1 C2 v0 un convesso che contiene lorigine. Per v0
/ C perch
0
/ C1 C2 , dal momento che C1 e C2 sono disgiunti.
Allora la funzione di supporto p di C verica
p(v0 ) > 1

(3.24)

per la propriet (ii) del Lemma 3.2.10. Sullo spazio S generato da v0 deniamo il funzionale lineare reale f (v0 ) = , per reale (ed anche per
complesso, ma in questo secondo caso si ottiene un funzionale complesso di
cui sar la parte reale a soddisfare lenunciato, il che quanto comunque contemplato nella Denizione 3.9.1 di separabilit tramite funzionali complessi:
per semplicit quindi, e senza perdita di generalit, limitiamo lattenzione ad
un funzionale reale f ). Dalla linearit di f , dalla propriet (i) del Lemma
3.2.10 e da (3.9.3) segue f 6 p su S. Daltra parte, le propriet (i) e (iii)
del Lemma 3.2.10 dicono che p una funzione subadditiva positivamente
omogenea, e quindi possiamo ora applicare il Teorema di HahnBanach 3.5.3

370CAPITOLO 3. SPAZI VETT. TOPOLOGICI, ANALISI FUNZIONALE


per estendere f ad un funzionale lineare reale su tutto V che verica ancora
f 6 p. Quindi, in particolare, f 6 1 su C, per la propriet (ii) del Lemma
3.2.10.
Siano ora u C1 e v C2 . Allora u v v0 C e 1 > p(u v v0 ) >
f (u v v0 ) f (u) f (v) f (v0 ). Ma f (v0 ) = 1, e quindi lultima disuguaglianza diventa f (u) 6 f (v). Prendendo lestremo superiore rispetto a
u C1 e lestremo inferiore rispetto a v C2 si trova che il funzionale non
nullo f separa C1 e C2 .

Se lo spazio vettoriale localmente convesso (Denizione 3.1.1), allora


valgono propriet di separazione stretta. Il prossimo un esempio: dice che
i punti sono strettamente separati dai chiusi convessi.

Proposizione 3.9.4. Sia V uno spazio vettoriale localmente convesso e v0


V . Sia C un insieme chiuso convesso che non contiene v0 . Allora esiste un
funzionale lineare reale continuo f che separa strettamente {v0 } e C, nel senso della Definizione 3.9.1: ovvero, f (v0 ) < inf vC f (v). Equivalentemente,
esiste un funzionale continuo complesso F tale che Re f (v0 ) < inf vC Re f (v).
Dimostrazione. Una volta dimostrato lenunciato per funzionali reali, quello
per funzionali complessi segue dal Corollario 3.5.6. Quindi nel resto della
dimostrazione restringiamo lattenzione a funzionali reali.
Senza perdita di generalit, tramite una traslazione riduciamo lenunciato al
caso in cui v0 = 0. Poich V localmente convesso e 0
/ C, esiste un intorno
aperto convesso A di 0. Simmetrizziamo prendendo U = A (A), che
ancora un intorno aperto convesso di 0 , ma invariante per riessione intorno
allorigine: U = U. La precedente Proposizione 3.9.3 fornisce un funzionale
lineare non nullo tale che
sup f (v) 6 inf f (c) :=
vU

cC

(3.25)

(in particolare nito). Allora f (v) 6 per ogni v U, quindi anche


per v, da cui, per la linearit di f , anche f (v) = f (v) 6 . Ne segue
che 6 f (v) 6 per ogni v U. Allora dilatiamo U, prendendo in sua
vece U = U. Di nuovo per linearit, |f (v)| < in U . Questo signica che,
per ogni > 0, abbiamo costruito un intorno aperto U di 0 in cui |f | < :
perci il funzionale f continuo nellorigine. Per linearit (e per la continuit
delloperazione di traslazione) f continuo ovunque: f V .
Per completare la dimostrazione occorre solo provare che 0 = f (0) < :=

3.9.

TEOREMA DI KREINMILMAN

371

infvC f (v), ovvero che > 0. Sappiamo che il funzionale f non identicamente nullo: scegliamo w V tale che f (w) > 0, e comprimiamolo in
modo che nisca dentro laperto O, ossia scegliamo uno scalare reale tale
che w O (questo possibile perch lorigine un punto interno di O : si
veda la Nota 3.9.2). Allora, in base a (3.25), f (w) deve essere minore di
e pertanto 0 < f (w) = f (w) < .

In seguito ci servir questa variante della precedente Proposizione 3.9.4,


nella quale assumiamo non che lo spazio sia localmente convesso ma solo che
i funzionali separano i punti, e mostriamo che allora la stessa propriet di
separazione geometrica vale se il convesso anche compatto:

Proposizione 3.9.5. Sia V uno spazio vettoriale su cui i funzionali continui


separano i punti e v0 V . Sia C un insieme compatto convesso che non
contiene v0 . Allora esiste un funzionale lineare reale continuo f che separa
strettamente {v0 } e C, nel senso della Definizione 3.9.1: ovvero, f (v0 ) <
inf vC f (v). Equivalentemente, esiste un funzionale continuo complesso F
tale che Re f (v0 ) < inf vC Re f (v).
Dimostrazione. Linsieme C compatto nella topologia forte di V , ed a maggior ragione lo la topologia debole w . ma in questa topologia V localmente
convesso (Proposizione 3.8.3), e quindi possiqamo applicare la precedente
Proposizione 3.9.4 per ottenere la disuguaglianza desiderata per un opportuno funzionale continuo x rispetto alla topologia debole w . Daltra parte, di
nuovo per la Proposizione 3.8.3, linsieme dei funzionali continui su V munito
della topologia debole coincide con il duale ordinario V . Quindi x V .
Nota 3.9.6. Lenunciato della Proposizione 3.9.4 palesemente falso senza
lipotesi di convessit: se C un insieme connesso ma non convesso, esistono
punti v
/ C che sono combinazioni convesse di punti di C, ed i funzionali
lineari, essendo costanti su iperpiani, non possono separare tali punti v da
C.

Corollario 3.9.7. Su uno spazio vettoriale localmente convesso, i funzionali


continui separano i punti (in particolare, quindi, questo capita per gli spazi
normati e per gli spazi di Frchet: si vedano la Definizione 3.1.1 e la Nota
3.1.2).
Le propriet di separazione tramite funzionali su spazi vettoriali localmente convessi sono ancora pi forti. Esse si basano su una versione geometrica
del teorema di HahnBanach, che in questopera non serve: per completezza
presentiamo questi risultati in una Sezione apposita (Sezione 3.6).

372CAPITOLO 3. SPAZI VETT. TOPOLOGICI, ANALISI FUNZIONALE

3.9.2

Punti estremi e teorema di KreinMilman

Definizione 3.9.8. Sia C un insieme convesso in uno spazio vettoriale V .


Un punto v C un punto estremo di C se non un punto interno di
alcun segmento contenuto in C, ossia se, per ogni coppia x, y V tali che
v = x+(1)y per qualche 0 < < 1, almeno uno fra x e y non appartiene
a K.
Definizione 3.9.9. Dato un sottoinsieme convesso A di uno spazio vettoriale, un sottoinsieme chiuso convesso S A si dice un insieme estremale per A
se nessun punto v A un punto interno di un segmento i cui punti estremi
sono in A ma non in S: in altre parole, se
x, y A e v = x+(1)y

per qualche 0 < < 1 x, y S . (3.26)

In particolare, i punti estremi di A introdotti nella precedente Denizione


3.9.8 sono gli insiemi estremali per A che consistono di un solo punto.
Un insieme si dice estremale se estremale per lintero spazio vettoriale V . Si
noti che se S V estremale (per V ), allora estremale anche per qualsiasi
insieme A tale che S A V .
Corollario 3.9.10. (i) Se lintersezione di una famiglia non vuota di insiemi estremali non vuota, allora estremale.
(ii) Siano A B C tre insiemi convessi. Se A un insieme estremale
per B e B estremale per C, allora A estremale anche per C.
(iii) Se S V un insieme estremale per un chiuso convesso K e f un
funzionale lineare continuo su V , allora il sottoinsieme di S in cui Re f
assume il suo valore massimo ancora un insieme estremale.
(iv) Sia V uno spazio vettoriale su cui i funzionali continui separano i punti (ad esempio uno spazio localmente convesso, in base al Corollario
3.9.7), e S K un insieme (non vuoto) estremale per un compatto
convesso K V . Supponiamo che S sia minimale (ossia che non contenga sottoinsiemi propri estremali per K non vuoti). Allora S consiste
di un solo punto (e quindi un punto estremo di K, come osservato
nella Definizione 3.9.9).
Dimostrazione. Le parti (i) e (ii) seguono direttamente dalla Denizione
3.9.9. Dimostriamo la parte (iii). Sia m = maxvS Re f (v) e Sf = {v S :

3.9.

TEOREMA DI KREINMILMAN

373

Re f (v) = m}. Sia v Sf con v = x + (1 )y per qualche 0 < < 1 e


x, y V . Poich S estremale, x e y appartengono a S, e quindi Re f (x)
e Re f (y) sono minori o uguali a m. Poich Re f (z) = m, per linearit
Re f (x) = Re f (y) = m, ossia x, y Sf . Pertanto Sf un insieme estremale,
e (iii) provato. Ora dimostriamo la parte (iv). Osserviamo anzitutto che
S chiuso (per la Denizione 3.9.9 di insieme estremale) nel compatto K, e
quindi anchesso un insieme compatto (Sezione ??). Se u, v appartengono a
S, esiste un funzionale continuo f su V tale che Re f (u) > Re f (v) (Corollario
3.9.7). Il sottoinsieme Sf S dove Re f assume il proprio valore massimo
non vuoto (per il teorema di Weiestrass sullesistenza dei massimi delle
funzioni continue sul compatto S (Sezione 1.1)) ed estremale in S per la
parte (iii). Quindi Sf un insieme estremale che contiene u ma non v, e
pertanto un estremale minimale non pu contenere due punti diversi.

Esercizio 3.9.11. Mostrare che lunione di una famiglia arbitraria di insiemi


estremali soddisfa la propriet 3.26 ed un insieme convesso; in generale per
non estremale perch non chiuso.

Definizione 3.9.12. Sia V uno spazio vettoriale. Lintersezione H(E) di


tutti gli insiemi convessi che contengono un insieme E V un convesso
che contiene E ed minimale rispetto a questa propriet (ossia, contenuto
in ogni convesso che contiene E). H(E) si chiama l involucro convesso di
E. Lintersezione H(E) di tutti i convessi chiusi che contengono E un
convesso chiuso che contiene E ed minimale rispetto a questa propriet:
esso si chiama linvolucro convesso chiuso di E.
Teorema 3.9.13 (KreinMilman). (i) Sia V uno spazio vettoriale su cui
i funzionali continui separano i punti (ad esempio uno spazio localmente convesso, in base al Corollario 3.9.7) e K V un sottoinsieme
compatto convesso non vuoto. Allora K linvolucro convesso chiuso
dei suoi punti estremi (introdotto nella Definizione 3.9.12).
(ii) Sia V uno spazio localmente convesso, K un compatto in V e E linsieme dei punti estremi di K in V . Allora K contenuto nellinvolucro
convesso chiuso di E: in altre parole, K e E hanno lo stesso involucro
convesso chiuso.
Dimostrazione. La famiglia F di tutti gli insiemi estremali non vuoti per K
parzialmente ordinata per inclusione. Fissato un insieme estremale non vuoto

374CAPITOLO 3. SPAZI VETT. TOPOLOGICI, ANALISI FUNZIONALE


S per K, per il principio di massimalit di Hausdor (Assioma 2 della Sezione
3.4) esiste una sottofamiglia F di F che contiene S ed totalmente ordinata
per inclusione. Poich K compatto, segue dalla propriet dellintersezione
nita (Nota 1.9.7) che lintersezione T di tutti i membri della famiglia F
non vuota. Allora, per la parte (i) del Corollario 3.9.10, T anchesso un
insieme estremale per K: inoltre deve essere un insieme estremale minimale
in K, perch se esistesse un sottoinsieme proprio di T T che fosse un estremale per K, allora T non potrebbe appartenere alla famiglia F (visto che
propriamente contenuto nella sua intersezione) e quindi F non sarebbe una
una famiglia massimale secondo il principio di Hausdor. Questo signica
che ogni estremale non vuoto S in K contiene un estremale minimale non
vuoto. In base alla parte (iv) del Corollario 3.9.10, questo estremale consiste
di un unico punto, e quindi un punto estremo di K. Abbiamo cos provato
che ogni compatto convesso non vuoto K, ed anche ogni suo sottoinsieme
estremale non vuoto, contiene almeno un punto estremo.
Daltra parte, sappiamo dalla parte (iii) del Corollario 3.9.10 che i punti di K
in cui i funzionali reali assumono il proprio massimo sono estremali, ed a loro
volta, per linearit, su questi insiemi estremali i punti di massimo dei funzionali lineari devono essere assunti su punti estremi. Quindi il valore massimo
della parte reale di ogni funzionale continuo f su K coincide con il valore
massimo sullinsieme E dei punti estremi di K: maxK Re f = maxE Re f . Sia
C linvolucro convesso chiuso di E, introdotto nella precedente Denizione
3.9.12. Assumiamo, come nella parte (i), che K sia convesso. Allora C K
dal momento che K convesso e chiuso (la topologia di uno spazio vettoriale
topologico di Hausdor, per il Lemma 3.1.11, ed i compatti in uno spazio
di Hausdor sono chiusi, per la seconda parte del Lemma 1.10.6). Quindi
C un sottoinsieme chiuso di un compatto, e pertanto compatto, per la
prima parte del Lemma 1.10.6. Pertanto, visto che le funzioni continue sui
compatti hanno massimo (teorema di Weierstrass, Sezione 1.1), esiste nito
il numero maxC Re f . Di nuovo per linearit, maxE Re f = maxC Re f , e
quindi, combinando queste due osservazioni, troviamo
max Re f = max Re f .
K

(3.27)

Per assurdo, supponiamo che esista un punto k K tale che k


/ C. Poich
C convesso e chiuso, in base alla Proposizione 3.9.4 esiste un funzionale
continuo f V tale che f (k) > maxC Re f . Ora segue dalla disuguaglianza
(3.27) che x
/ K, una contraddizione. Quindi K = C. Questo prova la parte

3.9.

TEOREMA DI KREINMILMAN

375

(i) dellenunciato.
La stessa argomentazione vale se si assume che V non sia localmente convesso
ma solo che il suo duale separi i punti di V : basta applicare, subito sopra,
la Proposizione 3.9.5 invece della Proposizione 3.9.4. Questo prova la parte
(ii).

Lenunciato del Teorema di KreinMilman 3.9.13 implica evidentemente


lesistenza di punti estremi in ogni convesso compatto, che riassumiamo qui
di seguito come enunciato separato: rammentiamo comunque che un punto
estremo di ogni insieme convesso stato costruito nella dimostrazione del
suddetto teorema. Anticipiamo il fatto che questa conclusione falsa in
spazi non localmente convessi (si veda lesempio costruito nella Sottosezione
3.21.2).
Corollario 3.9.14. Se V uno spazio localmente convesso e K V
compatto, allora esistono sempre punti estremi di K in V .

Corollario 3.9.15. Ogni insieme compatto non vuoto in uno spazio localmente convesso ammette punti estremi.

3.9.3

Esempi di punti estremi di sfere unitarie in spazi


di Banach

Esempio 3.9.16. (Punti estremi delle sfere unitarie di L e C.) Consideriamo il caso degli spazi di Banach L [a, b] e C[a, b] (spazi vettoriali sul
vcmpo complesso, quindi costitiiti di funzioni a valori complessi): il caso di
intervalli illimitati, ad esempio L (R) e C(R), analogo.
Una funzione f nella sfera unitaria di questi spazi tale che f (t)| 6 1 (quasi
ovunque nel caso di L ), e quindi si pu pensare come una curva misurabile
da [a, b] al disco unitario D di C (per quasi ogni t [a, b] nel caso di L ).
Nel caso di f C[a, b] si tratta di una curva continua.
Ora occorre notare che i punti x che giacciono sulla circonferenza di raggio
1 sono punti estremi del disco unitario D, perch ogni segmento in C che
contiene x come punto interno, comunque corto lo si scelga, ha almeno un
punto estremo fuori di D (ed entrambi nel caso il segmento sia tangente a
D, a causa della convessit di D). Invece ogni punto x nel disco unitario
aperto di C combinazione convessa di punti estremi del disco (ossia sulla
sua frontiera). Si pu anzi esprimere x come media aritmetica di due punti di
frontiera: se x 6= 0 si tratta dei due punti di intersezione sulla circonferenza

376CAPITOLO 3. SPAZI VETT. TOPOLOGICI, ANALISI FUNZIONALE


unitaria della retta che passa per x ed perpendicolare al raggio dallorigine
a x (invece il punto x = 0 combinazione convessa di due qualsiasi punti
antipodali sulla frontiera). Si noti che questi due punti dipendono con continuit da x. Questo signica che f la media aritmetica di due funzioni
continue u e v di modulo 1: f (t) = (u(t)+v(t))/2. Se invece f non continua
ma solo misurabile, i due punti u(t) e v(t) sono funzioni misurabili di t.
Da questi argomenti segue che una funzione f nella sfera unitaria dello spazio delle funzioni continue un punto estremo di questa sfera se e solo se
|f (t)| = 1 per ogni t; analogamente, f un punto estremo della sfera unitaria di L se e solo se |f (t)| = 1 quasi ovunque.
Diverso il caso dello spazio delle funzioni continue a valori reali. In questo
ambito la condizione per lestremalit resta ovviamente la stessa, |f (t)| = 1
per ogni t, ma nel caso reale una tale funzione continua se e solo se vale
costantemente 1 o 1. Pertanto i punti estremi della sfera unitaria in questo
spazio sul campo reale sono solo le funzioni costanti 1. La stessa conclusione vale per lo spazio sul campo R delle funzioni continue su un compatto
in R (tranne nel caso banale in cui il compatto consista di un insieme nito
di punti, nel qual caso lo spazio delle funzioni continue a dimensione nita,
o consista di uno spazio con una misura discreta (o pi precisamente puramente atomica: Denizione 1.9.11 ed Esempio 3.9.19), nel qual caso i punti
estremi sono tutte le successioni di modulo 1). Quindi, pi in generale, la
conclusione vale su qualsiasi spazio di misura non atomico.

Corollario 3.9.17. La sfera unitaria nello spazio di Banach (sul campo R)


delle funzioni continue a valori reali (su uno spazio di misura rispetto ad una
misura non puramente atomica, definito in Definizione 1.9.11 ed Esempio
3.9.19) non linvolucro convesso dei propri punti estremi (nel senso della
Definizione 3.9.12).
Dimostrazione. Nel precedente Esempio 3.9.16 abbiamo visto che in questo
spazio ci sono solo due punti estremi, le costanti 1, il cui involucro convesso
quindi un segmento, ossia una sfera unidimensionale.

Esempio 3.9.18. (Punti estremi delle sfere unitarie di Lp .) Consideriamo adesso le sfere unitarie in Lp [a, b]. Poich chiaramente i punti estremi
rimangono invariati se si dilata la sfera, senza perdita di generalit possiamo
assumere che la misura di Lebesgue sia stata normalizzata in maniera che la
misura totale di [a, b] valga 1: ossia, dm = dx/(b a). Per evitare di scrivere

3.9.

TEOREMA DI KREINMILMAN

377

il fattore di normalizzazione in ogni passaggio, consideriamo il caso di Lp [0, 1]


(di nuovo senza perdita di generalit, perch i punti estremi rimangono invariati se si dilata o trasla lintervallo [a, b]).
evidente che nessuna f con kf kp < 1 un punto estremo ( una combinazione convessa delle due funzioni di norma 1 date da f /kf kp : questo
argomento val;e per ogni sfera unitaria in qualunque spazio di Banach), quindi dora in poi limiteremo lattenzione a funzioni di norma 1.
Consideriamo dapprima L1 . Sia f L1 [0, 1] tale che kf k1 = 1. Allora
R esiste
un sottoinsieme proprio E [0, 1] di Rmisura positiva tale che R0 < E |f | < 1
quasi ovunque in E. Poniamo m1 = E |f | e m2 = 1 m1 = [0,1]\E |f |. Poniamo poi f1 (x) = f (x)/m1 se x E, f1 (x) = 0 se x
/ E, ed analogamente
f2 (x) = 0 se x E e f2 (x) = f (x)/m2 se x
/ E. Allora f1 e f2 hanno
supporto disgiunto e fR la loro combinazione convessa f = m1 f1 + m2 f2 .
Notiamo che kf1 k1 = E |f |/m1 = 1, e per la stessa ragione anche kf2 k = 1.
Quindi f non un punto estremo: la sfera unitaria di L1 rispetto alla misura
di Lebesgue non ha punti estremi. Pi in generale, lo stesso argomento vale
per lo spazio L1 () rispetto a qualsiasi misura non puramente atomica (rammentiamo che una misura non ha atomi se ogni insieme di misura positiva
contiene un sottoinsieme di misura strettamente inferiore ma ancora positiva:
Denizione 1.9.11).
lo stesso argomento non funziona per per Lp con 1 < p < . Infatti,
R proviap
mo a generalizzarlo,
ponendo ora f L [0,
kf kRp = 1, m1 = ( E |f |p )1/p
R
R 1] con
p
p
p 1/p
p
e m2 = ( [0,1]\E |f | ) . Ora m1 + m2 = E |f | dx + E |f |p dx = 1, e quindi
(m1 + m2 )p => mp1 + mp2 = 1 per il Lemma 1.7.5. Pertanto ora la combinazione lineare m1 f1 + m2 f2 non pi una combinazione convessa, ed il
precedente argomento non si applica.
Daltra parte, facile provare che, se p > 1 e kf kp = 1, allora f un punto
estremo della sfera unitaria di Lp . Infatti, se p > 1 e f = g + (1 )h
con 0 < < 1 e kgkp = khkp = 1, allora almeno una fra g e h ha norma
Lp maggiore di 1. Infatti, dal momento che per p > 1 la funzione t 7 tp
strettamente convessa in R+ (ha derivata seconda strettamente positiva!), se
kgkp = khkp = 1 si ha
Z 1
Z 1
p
|g(x) + (1 )h(x)| dx <
(|g(x)|p + (1 )|h(x)|p ) dx
0

= kgkpp + (1 )khkpp = 1 .

378CAPITOLO 3. SPAZI VETT. TOPOLOGICI, ANALISI FUNZIONALE


Esempio 3.9.19. (Misure atomiche , delta di Dirac e punti estremi
della sfera unitaria di L1 ().) Per quali misure di Borel sullintervallo
[a, b] (o su un insieme misurabile in R di misura nita) esistono punti estremi
nella sfera unitaria di L1 ()? Come nellEsempio 3.9.18, possiamo assumere
normalizzata da [a, b] = 1, e possiamo assumere [a, b] = [0, 1]. Evidentemente occorre che non si applichi il ragionamento dellEsempio ?? che porta
alla inesistenza di punti estremi nella sfera unitaria di L1 (m) dove m la misura di Lebesgue: in particolare, rivedendo quellargomento, ci accorgiamo
che, per qualche f L1 () di norma 1, non deveResistere un sottoinsieme
proprio E
[0, 1] di misura positiva tale che 0 < E |f | < 1 quasi ovunque
in E. Questo equivale a richiedere che ogni sottoinsieme di [0, 1] abbia misura uguale a 0 o a 1, o equivalentemente che la misura sia puramente
atomica, ossia esistano punti xk [0, 1] tali che, per ogni sottoinsieme misurabile E [0, 1], si abbia (E) = 0 se E non contiene alcuno dei punti xk
(si rivedano la Denizione 1.9.11 e lEsempio 1.9.22). Se c un solo atomo
x0 la misura si chiama la delta di Dirac al punto x0 , e si indica con x0 .
Reintrodurremo la delta di Dirac nel contesto pi generale delle distribuzioni
nella parte (iii) dellEsempio 11.5.4 e ne studieremo in grande dettaglio le
propriet nel resto del Capitolo 11 e poi nei Capitoli 12 e 13.
Le funzioni di norma 1 in L1 (x0 ) sono quelle che valgono 1 al punto x0 .
Due funzioni che coincidono al punto x0 sono nella stessa classe di Lebesgue
rispetto alla misura x0 . Quindi, se una funzione f di norma 1 in L1 (x0 )
combinazione convessa di due funzioni g e h di norma 1, necessariamente le
classi di Lebesgue di f , g e h coincidono: quindi ogni funzione di norma 1
un punto estremo.
Se invece la misura ha due atomi x0 e x1 , ossia se = x0 + (1 )x1 ,
allora le funzioni f L1 () di norma 1 sono le funzioni per le quali |f (x0 )|+
(1 )|f (x1 )| = 1, e fra queste funzioni i punti estremi della sua sfera unitaria L1 sono quelle per cui |f (x0 )| = 0 oppure |f (x1 )| = 0.
Estendendo questo argomento, vediamo che, in presenza di una successione
di atomi {xk } per una misura puramente atomica , i punti estremi della
sfera unitaria sono le funzioni nulle su ogni atomo tranne uno. Se tutti gli
atomi hanno la stessa -misura (nel qual caso sono un numero nito oppure
una misura di variazione totale innita), allora i punti estremi della sfera
unitaria in L1 () sono le funzioni che, prese in modulo, coincidono con le
successioni ek tali che ek (xj ) = kj = 1 se j = k e zero altrimenti (il resto
del dominio, [0, 1] \ {xk }, non conta perch un insieme di -misura zero).

3.10. IL TEOREMA DI BANACHALAOGLU

379

Esempio 3.9.20. (Punti estremi della sfera unitaria di p .) In particolare, se nel precedente Esempio 3.9.19 la misura che conta su Z (introdotta
nellEsempio 1.9.22), allora Lp () isometricamente isomorfo allo spazio p
delle successioni la cui potenza p d luogo ad una serie assolutamente convergente, introdotto nella Denizione 1.7.1, e le successioni ek giocano un ruolo
analogo ai vettori della base canonica nello spazio p su n punti, isomorfo a
Cn .
Analogamente, per la misura con inniti atomi di identica massa, lo spazio
Lp isometricamente isomorfo a p (se gli atomi hanno masse dierenti si
ottengono invece spazi p con peso). Da quanto visto prima ora sappiamo
che tutte le successioni nella sfera unitaria di p sono punti estremi di questa
sfera se 1 < p < , mentre per p = 1 i punti estremi sono solo le successioni
canoniche ek (che in questo contesto discreto sono delte di Dirac) moltiplicate
per un generico numero complesso di modulo 1, e per p = i punti estremi
sono tutte le successioni di modulo 1.
Naturalmente, nel caso particolare di sottospazi a dimensione nita di p dati
da successioni nulle dopo lindice n, questo signica che la sfera unitaria di p
un solido strettamente convesso se 1 < p < , mentre nonb lo per p = 1
o : in tal caso i punti estremi di questo solido sono i vettori che (limitando
lattenzione al modulo delle loro coordinate) giacciono rispettivamente sugli
assi cartesiani o sulle bisettrici dei vari ottanti. per il calcolo esplicito ed il
disegno di queste sfere unitarie nel caso bidimensionale rinviamo il lettore

allEsempio 1.7.10.

3.10

Topologia debole sul duale di uno spazio


vettoriale topologico e teorema di Banach
Alaoglu

Definizione 3.10.1. Per la Proposizione 3.3.10, il duale V di uno spazio di


Banach V anchesso uno spazio di Banach, e quindi lo anche il duale V
di V , che indichiamo come il biduale di V .
Proposizione 3.10.2. (Immersione di uno spazio vettoriale topologico nel suo biduale.) Sia V uno spazio vettoriale topologico con duale V .
La mappa
[v](x ) = x (v) := hx , vi

380CAPITOLO 3. SPAZI VETT. TOPOLOGICI, ANALISI FUNZIONALE


una applicazione lineare di V allo spazio W := Hom(V , C) dei funzionali
lineari su V che separa i punti di V . Questa mappa iniettiva se e solo se
V separa i punti di V (ad esempio se V localmente convesso: Corollario
3.9.7).
Dimostrazione. La linearit evidente. Mostriamo che separa i punti di
V : (x ) = (y ) se e solo se hx , vi = hy , vi per ogni v V , ossia se e solo se
x = y .
Inne, V separa i punti di V se e solo se per ogni v1 6= v2 V esiste x tale
che hx , v1 i =
6 hx , v2 i, ossia (v1 ) 6= (v2 ).

Definizione 3.10.3. (Topologia debole .) La topologia debole indotta su


V dalla famiglia di funzionali continui in V data dallimmagine dellimmersione della precedente Proposizione 3.10.2 si chiama la topologia debole w
di V .
Da questa Denizione e dalla Proposizione 3.8.3 otteniamo immediatamente il fatto seguente:
Corollario 3.10.4. La topologia debole localmente convessa, ed ogni funzionale w -continuo su V del tipo x [v](x ) = hx , vi per qualche
v V.
Nota 3.10.5. Una questione terminologica: nella Proposizione 3.10.2 facciamo
riferimento a W = Hom(V , C) (lo spazio dei funzionali lineari su V ) invece
che al duale V (lo spazio dei funzionali lineari continui su V ), perch la
continuit in generale non ha senso: il duale di uno spazio vettoriale topologico non uno spazio vettoriale topologico. Proprio tramite la costruzione a
cui stiamo procedendo introdurremo su di esso una topologia. Per abbiamo
visto che il duale di uno spazio normato invece in maniera naturale uno
spazio normato, anzi di Banach (Proposizione 3.3.10), e quindi, nel contesto
pi ristretto degli spazi normati, la topologia debole verr reintrodotta con
riferimento allo spazio biduale V (Nota ??).

La topologia debole un esempio di topologia debole, e come tale ,


in eetti, piuttosto magra, come osservato nella Nota 3.8.4. Ora mostriamo
un fatto sorprendente: la topologia debole cos magra che in essa, in
uno spazio normato, la sfera unitaria compatta. Premettiamo un lemma
tecnico.

3.10. IL TEOREMA DI BANACHALAOGLU

381

Lemma 3.10.6. Sia U un intorno dellorigine in uno spazio vettoriale topologico V e F linsieme dei funzionali lineari x su V che verificano |hx , vi| 6
C per qualche C >= 0 e per ogni v U. Allora:
(i) per ogni v V , esiste una costante cv > 0 tale che hx , vi| 6 cv per

ogni
Q x F, e quindi F un sottoinsieme del prodotto cartesiano Z :=
vV Dv , dove Dv la palla di raggio cv /C nel campo di base su cui
definito V (reale o complesso);

(ii) nella topologia prodotto di Z, la chiusura F tale che ogni f F


un funzionale lineare su V .
Dimostrazione. Dato v 6= 0 in V , la retta parametrica che passa per lorigine
e per V deve intersecare laperto U in un aperto di R (perch la moltiplicazione per scalari continua in uno spazio vettoriale topologico: questa stessa
osservazione stata gi esposta nella Denizione 3.9.2). Pertanto, per ogni v
deve esistere un fattore di scala cv tale che v cv U. Allora, vista la denizione di F data nellenunciato, hx , vi| 6 cv per ogni x F: quindi F linsieme

delle funzioni x su V denite


Q da v 7 x (v) Dv , ossia un sottoinsieme del
prodotto cartesiano Z := vV Dv (Denizione 3.4.1). Questo prova la parte
(i).
Ora consideriamo f calF , 1 , lambda2 scalari, v1 , v2 V e > 0 arbitrari.
Linsieme
W := {x Z : |x (vi ) f (vi )| <
e |x (1 v1 + 2 v2 ) f (1 v1 + 2 v2 ) < , i = 1, 2}
un aperto nella topologia prodotto di Z (che, per la Denizione 3.7.2,
altro non se non la topologia debole su Z indotta dalla famiglia di tutte
le funzioni v 7 g(v) Dv ). Per denizione di chiusura, F deve intersecare
questo aperto W . Sia x W F. Poich x stato assunto lineare, ora
abbiamo
f (1 v1 + 2 v2 ) 1 f (v1 ) 2 f (v2 ) =
(f x )(1 v1 + 2 v2 ) 1 (f x )(v1 ) 2 (f x )(v2 ) ,
e quindi
|f (1 v1 + 2 v2 ) 1 f (v1 ) 2 f (v2 )| < (1 + |1 | + |2 |) .
Poich arbitrario, da questo segue che f lineare.

382CAPITOLO 3. SPAZI VETT. TOPOLOGICI, ANALISI FUNZIONALE


Teorema 3.10.7 (BanachAlaoglu). Come nel precedente Lemma 3.10.6, sia
U un intorno dellorigine in uno spazio vettoriale topologico V e F linsieme
dei funzionali lineari x su V che verificano |hx , vi| 6 C per qualche C > 0
e per ogni v U. Allora F un sottoinsieme di V (ossia i funzionali in F
sono necessariamente continui) ed compatto nella topologia debole .
In particolare, se V uno spazio normato, allora la sua sfera unitaria
debolmente compatta (e lo anche qualsiasi altra sfera di raggio finito, il che
equivalente vista linvarianza della topologia per traslazione e dilatazione,
Definizione 3.1.1).
Dimostrazione. ovvio dal Teorema ?? che i funzionali in F sono continui,
visto che essi sono limitati perch mandano lintorno aperto U di 0 in V in
una sfera limitata nel campo di base. Quindi F V .
Sappiamo dalla parte (i) del precedente Lemma 3.10.6 che F immerso nel
prodotto cartesiano Z denito in quel Lemma. Dalla parte (ii) del Lemma
3.10.6 F -chiuso in Z. Ma Z compatto per il Teorema di Tychono
3.7.4, e quindi -compatto per la prima parte del Lemma 1.10.6.
Da queste due considerazioni segue F V Z, e quindi F eredita da V la
topologia debole w indotta da V , e da Z la topologia prodotto . Il prossimo
passo consiste nel dimostrare che queste due topologie su F concidono.
Fissati arbitrariamente > 0, x0 F e v1 , . . . vn V , consideriamo i seguenti
due intorni di base locale a x0 rispettivamente in w e :
W1 := {x V : |hx , vi i hx0 , vi i| < , i = 1, . . . n} ,
W1 := {f Z : |f (vi ) hx0 , vi i| < , i = 1, . . . n} .
Poich abbiamo visto che F V Z, ogni x W1 V che appartiene a F
deve appartenere anche a Z, e quindi la dernizione di W1 e W2 implica che
questo funzionale x sta in W2 : quindi W1 F W2 . Lo stesso argomento
dimostra il viceversa, W2 F W1 . In altre parole, W1 F = W2 F.
Pertanto le basi delle due topologie e w , ristrette a F, coincidono, e quindi
le due topologie coincidono su F.
Ma allora F, che poco sopra abbiamo provato essere compatto nella topologia
, lo anche nella topologia w . Questo completa la dimostrazione.

Corollario 3.10.8. (i) Lo spazio delle funzioni continue su uno spazio topologico non discreto non il duale di uno spazio vettoriale topologico.
(Si noti che, invece, lo spazio L () rispetto ad una qualsiasi misura
di Borel il duale di L1 (): si veda lEsempio 3.12.1 nel seguito).

3.11. DUALI DI SPAZI NORMATI E LORO TOPOLOGIA DEBOLE ; SPAZI RIFLESSIVI383


(ii) Lo spazio L1 () rispetto ad una misura non puramente atomica non
il duale di uno spazio vettoriale topologico. (Vedremo nel seguito che,
invece, lo spazio L1 () rispetto ad una qualsiasi misura di Borel puramente atomica con atomi, diciamo, in {xn } il duale dello spazio c0
delle successioni (pensate come funzioni definite su {xn }) che tendono
a zero allinfinito (si veda la fine dellEsempio 3.12.4), e che Lp () rispetto ad una qualsiasi misura di Borel , con 1 < p 6 , il duale
di Lq (), dove q lindice coniugato di p nel senso della Definizione
1.16.4 (Esempio 3.12.2)).
Dimostrazione. Consideriamo dapprima il caso dello spazio C delle funzioni
continue a valori reali (uno spazio sul campo R). Se C fosse il duale di
uno spazio vettoriale topologico, la sua sfera unitaria sarebbe compatta nella
topologia debole in base al Teorema di BanachAlaoglu ??, e quindi sarebbe
linvolucro convesso dei propri punti estremi in base al Teorema di Krein
Milman 3.9.13 (si noti che il fatto che un punto sia estremo non dipende dalla
topologia, forte o debole che essa sia). Invece non cos, come abbiamo visto
nellEsempio 3.9.16: in eetti, in tale Esempio abbiamo mostrato che, se la
topologia non discreta, linvolucro convesso dei punti estremi uno spazio
vettoriale unidimensionale su R.
Ora passiamo al caso delle funzioni continue a valori complessi (uno spazio
sul campo C). Lo stesso Esempio, combinato con lestensione univoca di
funzionali reali a funzionali complessi (Corollario 3.5.6), mostra che, se la
topologia non discreta, linvolucro convesso dei punti estremi uno spazio
unidimensionale su C, e quindi non pu essere la sfera unitaria dello spazio
delle funzioni continue, che ha dimensione innita. Questo prova la parte (i).
Esattamente per lo stesso argomento, lo spazio L1 () rispetto ad una
misura di Borel non puramente atomica non pu essere il duale di uno spazio
vettoriale topologico, perch la sua sfera unitaria non ha punti estremi (qui

si usa lEsempio 3.9.18). Questo prova la parte (ii).

3.11

Duali di spazi normati e loro topologia


debole ; spazi riflessivi

Sappiamo dallEsercizio 3.3.6 che gli operatori lineari da uno spazio normato
V ad un altro spazio normato W formano uno spazio normato con la norma

384CAPITOLO 3. SPAZI VETT. TOPOLOGICI, ANALISI FUNZIONALE


della Denizione 3.3.5, che qui ripetiamo:
kT k := sup{|T (v)| : kvkV 6 1} ,

(3.28)

Inoltre, segue dalla Proposizione 3.3.10 che se W uno spazio di Banach


allora lo spazio normato degli operatori lineari da V a W risulta uno spazio di
Banach. Allora, come gi osservato alla ne della Denizione 3.3.13, il duale
di uno spazio normato uno spazio normato e dalla Proposizione 3.3.10 che
il duale di uno spazio di Banach uno spazio di Banach. Pi precisamente:
Corollario 3.11.1. Sia V uno spazio normato (reale o complesso), e B la
sua palla unitaria chiusa. Per ogni x V (duale reale o complesso) poniamo
kx k := sup{|hx , vi| : v B} .
Questo definisce su V una norma rispetto alla quale V uno spazio di
Banach.
Dimostrazione. Questo discende immediatamente dallidentit 3.28 e dai
commenti che la accompagnano, visto che R e C sono spazi di Banach.

Corollario 3.11.2. Vale la identit duale di quella del precedente Corollario


3.11.1: se V uno spazio normato (reale o complesso), e B la palla unitaria
chiusa del suo duale, allora per ogni v V abbiamo
kvk := sup{|hx , vi| : x B } .
In altre parole, la mappa x 7 hx , vi un funzionale lineare continuo su V
di norma kvk.
Infine, B compatto nella topologia debole di V (Definizione 3.10.3).
Dimostrazione. chiaro che la mappa v : x 7 hx , vi un funzionale lineare
su V . In base alla Proposizione 3.3.4, per dimostrare che continuo basta
provare che ha norma nita. Allora completiamo la dimostrazione provando
che v ha norma kv kV = kvk.
Applicando al biduale V la denizione di norma vista nel Corollario 3.11.1,
vediamo che
kv kV = sup{|hv , x i| : x B } = sup{|hx , vi| : x B } 6 kvk , (3.29)

3.11. DUALI DI SPAZI NORMATI E LORO TOPOLOGIA DEBOLE ; SPAZI RIFLESSIVI385


dal momento che |hx , vi| 6 kx kV kvkV per la denizione di norma in V (si
veda ad esempio il precedente Corollario 3.11.1). Daltra parte, in base alla
Proposizione 3.5.8, esiste f V di norma 1 tale che hf, vi = kvkV . Quindi
lestremo superiore nella precedente identit (3.29) non inferiore di kvkV .
Questo prova lidentit dellenunciato.
Siano B la palla unitaria chiusa di V e U la palla unitaria aperta. Allora B
la chiusura di U, e quindi, grazie alla formula per la norma di x come estremo
superiore su B data nel precedente Corollario 3.11.1, se ne deduce che un
funzionale x continuo ha norma 1, ovvero in B , se e solo se |hv, x i 6 1 per
ogni v U. Ora la compattezza di B segue dal Teorema di BanachAlaoglu
3.10.7.

Corollario 3.11.3. Se V uno spazio normato di dimensione infinita, la


topologia debole del suo duale V strettamente pi debole della topologia
della norma di V , discussa nel Corollario 3.11.1. (In dimensione finita ogni
spazio vettoriale isomorfo e topologicamente omeomorfo al suo duale, e
quindi le due topologie coincidono).
Dimostrazione. La topologia debole la topologia pi debole nella quale
tutti i funzionali v : x 7 hx , vi sono continui: allora il precedente Corollario
3.11.2 asserisce che la topologia della norma di V pi forte della topologia
debole . Il fatto che a dimensione nita essa sia strettamente pi forte segue
dalla Nota 3.8.4, dal momento che V , come spazio normato, ovviamente
localmente limitato (basta considerare le palle aperte intorno allorigine che
sono limitate).

Lidentit duale del Corollario 3.11.2 si trasporta alla riformulazione della


denizione di norma di operatore lineare limitato fra spazi normati:
Corollario 3.11.4. Siano V , W spazi normati e T : V W un operatore
lineare limitato. Allora la norma di T in B(V, W ) si pu esprimere come
kT k = sup{|hT v, w i| : kvkV 6 1, kw kW 6 1} .
Dimostrazione. Sappiamo dalla Denizione 3.3.5 che kT k := sup{kT vkV :
kvkV 6 1}. Daltra parte, sappiamo dal Corollario 3.11.2 che kT vkV =
sup{|hT v, w i| : kw kW 6 1}. Combinando queste due identit otteniamo
quella nellenunciato.

386CAPITOLO 3. SPAZI VETT. TOPOLOGICI, ANALISI FUNZIONALE


Rammentiamo quanto osservato nella Proposizione 3.10.2: in base al Corollario 3.11.2 che ogni v V denisce un (unico) (v) V nel modo
seguente:
hv, v i := hv , (v)i .
Questa immersione : V V lineare, e gli elementi di (V ) sono esattamente i funzionali lineari continui su V rispetto alla sua topologia debole .
Inoltre, sempre dal Corollario 3.11.2, segue che k(v)kV = kvkV , ossia che
una isometria di V in un sottospazio chiuso di V . Poich V completo,
limmagine (V ) V un sottospazio chiuso di V . Di solito si identica V
con (V ) V e si scrive semplicemente V V . Dal momento che la topologia della norma di V pi forte della topologia debole (Corollario 3.11.3),
i funzionali continui rispetto a questultima possono essere strettamente di
meno, e quindi in generale V ( V .
Definizione 3.11.5. (Spazi di Banach riflessivi.) Uno spazio di Banach
in cui limmersione appena richiamata surgettiva, ossia V := (V ) = V ,
si dice riflessivo.
Nota 3.11.6. (Riflessivit degli spazi Lp con 1 6 p < .) Segue dagli
esempi della Sezione 3.12 che gli spazi Lp e p , per 1 6 p < , sono riessivi.
Infatti, vedremo negli Esempi 3.12.2 e 3.12.4 che il loro duale coincide con lo
spazio Lq (rispettivamente, q ) con p e q indici coniugati (Denizione 1.16.4).
Dal momento che la relazione di coniugazione, 1p + 1q = 1, simmetrica in p
e q, si ottiene che questi spazi coincidono con il proprio biduale.
Invece, e non sono riessivi, e neppure lo sono i loro sottospazi chiusi
dati rispettivamente dalle funzioni continue e limitate C L (ed anche dalle
funzioni continue che tendono a zero allinnito, C0 ) e dalle successioni che
tendono a zero allinnito, c0 . Nei sopracitati Esempi accenniamo al caso di
L [0, 1] e C[0, 1]: il caso generale di spazi di misura qualsiasi, ad esempio
innita, viene lasciato come esercizio al lettore (nel caso di p si veda anche
[25, Esercizio 5 del Capitolo 3]). Si noti che il caso di misura innita include
anche lesempio di , che lo spazio L () rispetto alla misura discreta
che conta gli interi introdotta nellEsempio 1.9.22. In questo caso sappiamo
gi che il duale di strettamente pi grande di 1 , a causa dellesistenza
di un funzionale lineare continuo su che non proviene da 1 , il limite di

Banach studiato nellEsempio 3.5.4.

3.12. ESEMPI DI DUALIT FRA SPAZI DI BANACH

3.11.1

387

Loperatore aggiunto

Teorema 3.11.7. Siano X e Y spazi normati e T : X Y un operatore


limitato. Allora esiste un unico operatore limitato T : X Y tale che
hT x, y i = hx, T y i

(3.30)

per ogni x X e y Y . Inoltre, kT k = kT k.


Dimostrazione. Cominciamo con il denire T su Y , ponendo T y := y T ,
che un funzionale lineare continuo su X perch composizione di mappe
linesri continue. Verichiamo che T soddisfa lidentit (3.30):
hx, T y i := T y (x) = y (T (x)) = hT x, y i .
Dato y Y , questa identit ssa il valore di T y per ogni x X, e quindi
determina un unico operatore T : X Y . Dal fatto che la dualit
una mappa bilineare si verica immediatamante che T una applicazione
lineare. Resta da dimostrare la limitatezza, che segue dal Corollario 3.11.4 e
dallidentit (3.30) in questo modo:
kT k = sup{|hT x, y i| : kxkX 6 1, ky kY 6 1} = sup{|hx, T y i| : kxkX 6 1, ky kY 6 1} = kT k .

Definizione 3.11.8. X e Y spazi normati e T : X Y un operatore


limitato. Loperatore T : X Y introdotto in (3.30) si chiama loperatore
aggiunto di T .

3.12

Esempi di dualit fra spazi di Banach

Dedichiamo questa Sezione a presentare alcuni esempi importanti di dualit


fra spazi di Banach. Questi esempi sono necessari per chiarire il contesto delluso della dualit nel Capitolo 11 sulle distribuzioni: in ogni caso, verranno
riassunti in quel Capitolo (nella Sezione 11.3).
Qui rivediamo ed espandiamo alcuni esempi gi discussi nelle Sezioni 1.16,
1.17, 1.18, 1.19 e 1.7.
Cominciamo con gli spazi normati L2 [0, 1] e L1 [0, 1] (Sezione 1.16). Qui
ed in seguito scegliamo lintervallo [0, 1] per comodit nella normalizzazione

388CAPITOLO 3. SPAZI VETT. TOPOLOGICI, ANALISI FUNZIONALE


degli integrali, ma tutti i risultati che presenteremo valgono, a meno di una
opportuna costante di normalizzazione, per un qualunque intervallo nito
[a, b], od anche, laddove indicato, per lintera retta reale.
Sappiamo che L2 [0, 1] L1 [0, 1] : pi precisamente, per ogni f L2 [0, 1]
si ha kf k1 6 kf k2 , perch
kf k1 =

|f (t)| dt = (|f |, 1)
6 kf k2 k1k2
Z 1  21
= kf k2
dt
0

= kf k2 ,

per la disuguaglianza di CauchySchwarz in L2 (si veda la Proposizione 4.5.1)


oppure per la disuguaglianza di Hlder (Teorema 1.16.6). Daltra parte,
L2 [0, 1] denso in L1 [0, 1], perch contiene il sottospazio C[0, 1] delle funzioni continue, e questo spazio un sottospazio denso in L1 [0, 1] (Proposizione
1.18.6), od anche come conseguenza del teorema di convergenza di identita approssimate in L1 (che presenteremo in seguito come Teorema 6.1.10):
questo fatto verr anche usato nella dimostrazione del Corollario 5.13.8.
Esempio 3.12.1. ((L1 ) = L .) Il duale di L1 [0, 1] (isometricamente) isomorfo a L [0, 1] (la stessa dimostrazione vale, parola per parola, per lo spazio
L1 rispetto a qualsiasi altra misura di Borel). Spieghiamo brevemente perch.
Ogni L [0, 1] d luogo ad un funzionale continuo su L1R[0, 1] nel modo

che vedremo anche nellEsempio 11.2.2: T (f


R) = h, f i = (t)f (t) dt.


Questo funzionale continuo su L1 perch (t)f (t) dt 6 kk kf k1 ,
quindi kT k(L1 ) 6 kk . facile vedere che kT k(L1 ) = kk : scegliamo
una successione di punti xn R sui quali approssima sempre meglio il suo
estremo superiore (o un x su cui raggiunge il proprio massimo assoluto,
se lo ha), ed al posto di f prendiamo identit approssimate in L1 centrate
a questi punti xn (per ogni xn prendiamo un traslato xn n di una identit
approssimata n con n via via pi grande, ossia con graco pi stretto ed
alto). Allora segue dal teorema di convergenza di identit approssimate nella
norma L (che presenteremo in seguito come Teorema 6.1.8), che
kT k = sup {|h, f i| : kf k1 = 1} = kk .

3.12. ESEMPI DI DUALIT FRA SPAZI DI BANACH

389

Abbiamo a suo tempo dimostrato (nella dimostrazione del Teorema 1.19.6)


che ogni funzionale continuo su L1 rappresentabile come integrale pesato

con una funzione. Quindi (L1 [0, 1]) isometricamente isomorfo a L [0, 1].
Questo fatto un caso particolare del Teorema 1.19.6.
Abbiamo gi osservato che lo stesso argomento vale per L1 rispetto a qualsiasi altra misura di Borel, in particolare per funzioni su R invece che su un
intervallo compatto come [0, 1]. In questo caso, unaltra dimostrazione fa uso
del teorema di convergenza di identit approssimate su R (che presenteremo
in seguito: Teorema 6.1.16), e prova che il duale di L1 (R) isometricamente
isomorfo a L (R). Anche questo un caso particolare del Teorema 1.19.6.

Daltra parte, per il Teorema 11.2.1 di rappresentazione di Riesz (che


presenteremo in seguito) si ha che L2 [0, 1] (isometricamente) isomorfo a
L2 [0, 1]. Ma abbiamo appena visto che L2 [0, 1] L1 [0, 1] ed ovvio che
L [0, 1] L2 [0, 1] (esercizio). Quindi abbiamo la catena di inclusioni
L [0, 1] L2 [0, 1] L1 [0, 1]
e

L1 [0, 1]
= L2 [0, 1] .
= L [0, 1] L2 [0, 1]

Ecco quindi che, in questo caso nel quale i sottospazi non sono chiusi (anzi
sono densi, in base al Teorema di convergenza di identit approssimate (cheb
presenteremo in seguito), Teorema 6.1.10), la dualit rovescia la relazione di
inclusione.
Esempio 3.12.2. ((Lp ) = Lq se p1 + 1q = 1.) Pi in generale, prendiamo
indici coniugati 1 6 p < , 1 < q 6 con p1 + 1q = 1 (Denizione 1.16.4;
conveniamo come sempre che, se p = 1 e q = , valga p1 + 1q = 1, per qui
consideriamo solo il caso p = 1, q = , non il viceversa). Rammentiamo
la disuguaglianza di Hlder per funzioni su R (Teorema 1.16.6): per
q
p
q
p
L
R [0, 1] e f L [0, 1] (o rispettivamente per L (R) e f L (R)), si ha
(t)f (t) dt 6 kkq kf kp . Ne segue:
|T (f )| = |h, f i| 6 kkq kf kp .

(3.31)

Di nuovo grazie al teorema (che presenteremo in seguito) di convergenza


di identit approssimate, questa volta nella norma di Lp (Teorema 6.1.10
nel caso di un intervallo nito, e rispettivamente Teorema 6.1.16 nel caso

390CAPITOLO 3. SPAZI VETT. TOPOLOGICI, ANALISI FUNZIONALE


di funzioni su R), si ha come prima che la mappa 7 T descrive un
isomorsmo isometrico di Lq sul duale di Lp :
sup {|h, f i| : kf kLp = 1} = kkq .

(3.32)

In realt non c neppure bisogno del teorema sulle identit approssimate:


ssata in Lq , la norma di T lestremo superiore di |T (f )| al variare di
f nella norma unitaria di Lp , ma questo estremo superiore in realt un
massimo, raggiunto esattamente (come si verica facilmente) quando f , a
meno di normalizzazione, data da f (x) = ei(x) |(x)|q/p . (Qui largomento
(x) la fase della decomposizione polare del numero complesso (x), cio
langolo allesponente nellespressione (x) = |(x)|ei(x) ). Pertanto largomento svluppato in questo Esempio vale anche per lo spazio Lp rispetto a
qualsiasi altra misura di Borel.
Accenneremo nel prossimo Esempio 3.12.3 che il duale di L non si ottiene
in questo modo: esso pi grande di L1 .

Esempio 3.12.3. (Dualit ed inclusioni per spazi Lp [0, 1].) Abbiamo


appena visto che, se p e q sono indici coniugati (nel senso del precedente
Esempio 3.12.2), allora
Lp [0, 1]
= Lq [0, 1]
(isomorsmo isometrico). Si noti che, se 1 < p < r < , la relazione degli
indici coniugati p1 + 1q = 1 rovescia la disuguaglianza quando si passa agli
indici coniugati, e pertanto per 1 < p < r < si ha
L [0, 1] ( Lr [0, 1] ( Lp [0, 1] ( L1 [0, 1]
ma
L1 [0, 1] ( Lp [0, 1] ( Lr [0, 1] ( L [0, 1].
(Il duale di L [0, 1] non viene discusso qui: esso consiste dello spazio delle
misure nitamente additive in [0, 1]. In particolare L [0, 1] ) L1 [0, 1], come
anticipato nel precedente Esempio 3.12.2. Per maggiori dettagli sulla dualit
per gli spazi Lp si consulti [22].)

Esempio 3.12.4. (Dualit ed inclusioni per spazi p .) Simmetricamente,


per gli spazi p si ha (Proposizione 1.7.7):
l 1 ( p ( r (

3.12. ESEMPI DI DUALIT FRA SPAZI DI BANACH


se 1 < p < r < , e

391

= (l1 ) ) q = (p ) ) s = (r )

dove s 6 q e 1p + 1q = 1 = 1s + 1r (indici coniugati, nel senso della Denizione


1.16.4). Ciascuno spazio p denso in ogni spazio r se 1 6 p < q < , e le
inclusioni si rovesciano passando agli spazi duali. Anche questi risultati sugli
spazi p seguono, come prima, dalla disuguaglianza di Hlder, ma questa
volta formulata per successioni numeriche invece che per funzioni. Data
una successione x = {xn C, n Z} q ed unaltra successione y =
{yn C, n Z} p , la disuguaglianza di Hlder per successioni (Corollario
1.16.8) asserisce che, ponendo

X
Tx (y) hx, yi
xn yn ,
n=

abbiamo

|hx, yi| 6 kxkq kykp

(3.33)

|Tx (y)| = sup{|hx, yi| : kykp = 1} = kxkq .

(3.34)

(Corollario 1.16.8 (i)). Da qui, come prima nel caso di una variabile reale
invece che intera, segue che la norma p di una successione x lestremo
superiore della sua norma come funzionale su q (Corollario 1.16.8 (ii)), ossia

e quindi la mappa x 7 Tx un isomorsmo isometrico di q sul duale di p .


Si noti invece che C[0, 1] contenuto in L [0, 1] come sottospazio chiuso, non denso: infatti la norma in questi due spazi la stessa (la norma
uniforme). In questo caso abbiamo gi accennato che la dualit preserva
linclusione, ed infatti si ha che C[0, 1] lo spazio delle misure nite umerabilmente additive su [0, 1], mentre, come gi osservato nellEsempio 3.12.3,
L [0, 1] lo spazio delle misure che sono solo nitamente additive: il primo un sottospazio chiuso del secondo. (Qui, condando che il lettore sia
familiare con lesempio particolare della misura di Lebesgue, rinviamo alla
Denizione 1.9.29 per la norma nello spazio delle misure (norma della variazione totale): per maggiori dettagli sulla teoria della misura si consulti
ancora [22].) Lo stesso argomento vale per lo spazio c0 delle successioni che
tendono a zero allinnito: in ta caso le misure nite si intendono sugli interi, e quindi costituiscono lo spazio 1 delle serie assolutamente convergenti.

392CAPITOLO 3. SPAZI VETT. TOPOLOGICI, ANALISI FUNZIONALE

3.13
3.13.1

Il teorema di categoria di Baire


Teorema di Baire

Questa Sottosezione incidentale, perch dedicata a propriet degli spazi topologici, non degli spazi vettoriali topologici: pur tuttavia, essa ha
applicazioni fondamentali allanalisi funzionale su spazi vettoriali topologici.
Osserviamo anzitutto che i rapporti fra le nozioni topologiche e metriche
(come ad esempio la densit) e la teoria della misura sono talvolta un po sottili, persino negli spazi vettoriali a dimensione nita. Ad esempio, sappiamo
che esistono insiemi numerabili densi in R ma di misura zero, come i razionali.
facile costruire sottoinsiemi densi in R ed aperti, quindi di misura positiva,
ma piccola. Ecco un modo: si numerino i razionali, in maniera da scrivere
Q come una successione {q1 , q2 , . . . }, e si consideri lintervallo aperto Jn di
lunghezza, diciamo, 2n centrato in qn . Allora E = n Jn denso in R perch
contiene Q ma ha misura minore o uguale ad 1. Considerando intervalli Jn di
misura opportunamente piccola e scartando nel corso della costruzione ogni
razionale che appartiene ad uno degli intervalli Jn gi considerati otteniamo
una variante di E che consiste di una unione numerabile di intervalli aperti
disgiunti che densa in R ma di misura arbitrariamente piccola.
Consideriamo questultimo insieme E e trasliamolo di un passo per ottenere un nuovo insieme E con le stesse propriet. Denitivamente si ha
m(Jn ) < /2: per tutti questi valori di n, Jn disgiunto dal suo traslato
Jn , ma interseca comunque altri traslati Jm a causa della densit. In
particolare, ogni razionale qn deve distare meno di una quantit n da uno
dei traslati Jm , e quindi da E , con limn n = 0. Poich i razionali sono
densi, anche lintersezione E E continua ad essere un insieme denso, per
ogni > 0, ed anche aperta perch intersezione di due unioni numerabili disgiunte di intervalli aperti, e lintersezione di due intervalli aperti, se
non vuota, un aperto. Questa osservazione ha a che fare con propriet
topologiche o metriche pi che della misura: essa lega la densit dellintersezione di due sottoinsiemi con una propriet puramente topologica, il fatto di
essere aperti. Se gli insiemi non sono aperti lintersezione di solito vuota:
si pensi a Q ed ad un suo traslato Q di passo irrazionale (in questo caso i
due insiemi hanno misura zero, ma facile adattare lesempio in modo che
uno dei due abbia misura zero e laltro no (ad esempio, scegliendo Q ed un
sottoinsieme dellinsieme E di prima ottenuto scavando da E un insieme
come E di prima ma di misura inferiore a quella di E ).

3.13. IL TEOREMA DI CATEGORIA DI BAIRE

393

Di questa propriet topologica di intersezione esiste una formulazione


molto pi generale, che vale per opportuni spazi topologici che non sono
necessariamente spazi vettoriali topologici:
Teorema 3.13.1 (Baire). Sia V uno spazio metrico completo, oppure uno
spazio di Hausdorff localmente compatto. Allora lintersezione di ogni famiglia numerabile di sottoinsiemi aperti densi un sottoinsieme denso (ovviamente di solito non aperto) di V .
Dimostrazione. Sia {Ej : j = 1, . . . } una successione di sottoinsiemi aperti
densi in V . Dobbiamo dimostrare che ogni sottoinsieme aperto non vuoto
O0 V interseca n En .
Grazie alla densit di En , lintersezione di En con qualsiasi aperto non vuoto
non vuota: quindi possiamo costruire una successione di aperti non vuoti
On tali che On En On1 . Se V uno spazio metrico possiamo scegliere
per On una palla di raggio che tende a zero, ad esempio inferiore a 1/n; se
invece V uno spazio localmente compatto e di Hausdor, possiamo scegliere On compatto, in base alla parte (vii) della Proposizione 1.10.10. In
tal modo, tutti gli On sono contenuti in O0 , e n On n En . Basta quindi
mostrare che n On 6= . Nellipotesi in cui V uno spazio metrico, abbiamo scelto i raggi delle palle inscatolate On in modo che tendano a zero, ed
allora i centri di queste formano una successione di Cauchy (esercizio): poich abbiamo anche assunto V completo, questa successione converge ad un
punto che appartiene necessariamente alla chiusura di tutti gli On , e quindi
n On 6= . Invece, nellipotesi che V sia localmente compatto di Hausdor,
abbiamo scelto gli On compatti, ed allora lintersezione non vuota in base
alla propriet dellintersezione nita (Nota 1.9.7).

Nota 3.13.2. Osserviamo che il complemento di un aperto denso E un chiuso


con interno vuoto, e viceversa: infatti ogni aperto non vuoto O ha intersezione
non vuota con linsieme denso E, e quindi non pu essere contenuto in E.

3.13.2

Insiemi di prima e di seconda categoria

La prossima denizione aiuta a chiarire la dierenza topologica fra insiemi


densi ma numerabili, come i razionali, ed insiemi densi ma pi ricchi, come
gli irrazionali.
Definizione 3.13.3. Si dice che un sottoinsieme di uno spazio topologico
V non denso da nessuna parte se la sua chiusura non contiene aperti. Un

394CAPITOLO 3. SPAZI VETT. TOPOLOGICI, ANALISI FUNZIONALE


insieme si dice magro, o di prima categoria in V , se unione numerabile di
insiemi non densi da nessuna parte; altrimenti, linsieme si dice pieno, o di
seconda categoria.
Nota 3.13.4. In base alla precedente Nota 3.13.2, un insieme non denso
da nessuna parte se e solo se il complemento della sua chiusura un aperto
denso
Ad esempio, gli interi non sono densi da nessuna parte in R, e quindi i
razionali, che sono unione numerabile di dilatati degli interi, sono di seconda
categoria. Invece gli irrazionali non sono una unione numerabile di insiemi
non densi da nessuna parte.
Corollario 3.13.5. Gli spazi metrici completi, e gli spazi localmente compatti
e di Hausdorff, sono di seconda categoria in s stessi.
Dimostrazione. Dobbiamo provare che uno spazio V come nellenunciato non
unione numerabile di sottoinsiemi En non densi da nessuna parte. In eetti,
se per assurdo V = n En , allora n En = V = . Ma la chiusura di En
non contiene aperti, e quindi En un aperto denso, in base alla Nota 3.13.4.
Allora segue dal Teorema di Baire 3.13.1 che n En non pu essere vuoto.

Elenchiamo alcune osservazioni ovvie che ci serviranno nella prossima


Sezione 3.14:

Nota 3.13.6. Le unioni numerabili ed i sottoinsiemi di insiemi di prima categoria sono di prima categoria. Gli omeomorsmi (mappe continue ed invertibili
con inversa continua) preservano la categoria.

3.13.3

Basi di Hamel

Definizione 3.13.7. Una famiglia di vettori in uno spazio vettoriale V


una base di Hamel se un insieme massimale linearmente indipendente.
Corollario 3.13.8. una base di Hamel nello spazio vettoriale V se e
solo se ogni vettore v V si decompone in modo unico come combinazione
lineare di elementi di .
Dimostrazione. Se una base di Hamel, ossia un insieme massimale linearmente indipendente, allora ogni v
/ , aggiunto a , d luogo ad

3.13. IL TEOREMA DI CATEGORIA DI BAIRE

395

un insieme linearmente
dipendente, e quindi esiste una combinazione liPn
neare 0 v + i=1 i i = 0 con coecienti i non tutti nulli. Poich per
{1 , . . . , n } sono linearmente indipendenti, deve
Pessere 0 6= 0, e dividendo la precedente identit per 0 si ottiene v = ni=1 ci vi , con ci = i /0 .
Di nuovo per il fatto che {1 , . . . , n } sono linearmente indipendenti, questa combinazione lineare deve essere unica. Se invece v appartiene gi a ,
lindipendenza lineare di assicura che v non si pu scrivere come combinazionemlineare di altri elementi di , e quindi anche in questo caso si ha
unicit.
Viceversa, se ogni vettore v V si decompone in modo unico come combinazione lineare di elementi di , allora in particolare questo accade per gli
elementi di , e quindi, in base allargomento appena visto, un insieme
linearmente indipendente; inoltre massimale, perch se vi aggiungeiamo un
elemento v, questo elemento si scriverebbe come combinazione lineare di elementi di ma anche nel modo banale v = v, e quindi non si ha pi lunicit
dello sviluppo.

Lemma 3.13.9. Ogni sottospazio di dimensione finita di uno spazio vettoriale topologico chiuso.
Dimostrazione. Sia V uno spazio vettoriale topologico, diciamo sul campo C,
X un sottospazio di dimensione n e F : Cn X un isomorsmo. Essendo
un operatore lineare a dimensione nita (denito su Cn ), F continuo, e,
indicando con B la sfera unitaria aperta in Cn , limmagine K = F (S) della
sfera unitaria chiusa S = B compatta in V . Poich 0
/ K e V di
Hausdor, esiste un intorno O di 0 in V disgunto da K. Per continuit,
possiamo anche scegliere O cos piccolo che O F (B). Sia x un vettore nella
chiusura di X: in base al Lemma 3.1.13, x rO se r abbastanza grande,
quindi x appartiene alla chiusura di X rO F (rB) = F (rB). Daltra
parte, B compatto in Cn e F continua, quindi F (rB) compatto in V ,
e pertanto chiuso per il Lemma 1.10.6 perch V di Hausdor (Corollario
3.1.11). Pertanto x F (rB X, e quindi X chiuso.

Proposizione 3.13.10. Se V uno spazio vettoriale, Wn V sono sottospazi di dimensione finita e V = n Wn , allora V di prima categoria in s
stesso (nel senso della Definizione 3.13.3).
Dimostrazione. In base al Lemma 3.1.13, se V ha dimensione innita il sottospazio Wn di dimensione nita non possono contenere aperti, e quindi Wn

396CAPITOLO 3. SPAZI VETT. TOPOLOGICI, ANALISI FUNZIONALE


un aperto denso, in base alla Nota 3.13.2. Daltra parte, Wn chiuso per
il precedente Lemma 3.13.9, e quindi Wn un aperto denso, ossia Wn non
denso da nessuna parte, ed allora n Wn un insieme di prima categoria
(Denizione 3.13.3).

Allora dal Corollario 3.13.5 del teorema di Baire segue immediatamente:

Corollario 3.13.11. Sia V un F-spazio a dimensione infinita (ossia uno spazio vettoriale a dimensione infinita, munito di una topologia completa indotta da una metrica, necessariamente invariante per traslazione: Definizione
3.1.1). Allora V non ammette basi di Hamel numerabili.

3.14

Il teorema di uniforme limitatezza

La prossima denizione la consueta denizione di equicontinuit, per qui


specializzata al caso di mappe lineari F , per le quali F (x si avvcina a F (y)
se e solo se F (x y) si avvicina allorigine, e quindi, in base allinvarianza
della topologia per traslazione, basta vericare la condizione di continuit
allorigine per averla dappertutto:
Definizione 3.14.1. Una famiglia F di mappe lineari fra due spazi vettoriali
topologici X e Y si dice equicontinua se per ogni intorno B di 0 in Y esiste
un intorno A di 0 in X tale che F (A) B per ogni F F .
Mostriamo che dalla equicontinuit segue la equilimitatezza (gli insiemi
limitati in uno spazio vettoriale topologico sono stati introdotti nella Denizione 3.1.1, e gli operatori limitati fra spazi vettoriali topologici nella
Denizione 3.3.1):
Proposizione 3.14.2. Ogni famiglia equicontinua di operatori lineari fra
spazi vettoriali topologici equilimitata: ossia, per ogni famiglia equicontinua
calF da X a Y , e per ogni insieme limitato A X, esiste un insieme limitato
B Y tale che F (A) B per ogni F F .
Dimostrazione. Dobbiamo mostrare che linsieme B = {F (E) : F F }
limitato.
Sia V un intorno dellorigine in Y . Poich F una famiglia equicontinua,
esiste un intorno U dellorigine in X tale che F (U) V per ogni F F .
Dal momento che A limitato, esiste r > 0 tale che E rU. Allora F (E)

3.14. IL TEOREMA DI UNIFORME LIMITATEZZA

397

F (rU) = rF (U) = rV per ogni F F . linsieme B verica B rV , e


quindi limitato.

Teorema 3.14.3 (BanachSteinhaus). Siano X e Y spazi vettoriali topologici e F una famiglia di operatori lineari continui da X a Y . Sia U linsieme
dei vettori x tali che lorbita Fx := {F (x) : F F } un insieme limitato in
Y . Se U di seconda categoria in X, allora U = X (ossia gli operatori F in
F sono puntualmente equilimitati, e la famiglia F equicontinua (e quindi
equilimitata, per la precedente Proposizione 3.14.2).
Dimostrazione. Siano V e W intorni stellati dellorigine in Y tali che V +V
W . Poich tutte le F F sono continue, linsieme C = {F 1 (V ) : F F }
intersezione di chiusi in X e quindi chiuso. Per ogni x U abbiamo assunto che lorbita Fx sia limitata, quindi contenuta nellaperto nV per qualche
intero n. Questo signica che x F 1 (nV ) per tutti gli F F , e quindi
x nC. In altre parole, U
n=1 nC.
Ora usiamo lipotesi che U sia di seconda categoria in X: allora almeno uno
degli insiemi nC deve essere di seconda categoria, perch altrimenti U sqarebbe unione numerabile di insiemi di prima categoria e quindi anchesso di
prima categoria (Nota 3.13.6). Ma la moltiplicazione per n un omeomorsmo, e quindi, per la stessa Nota, anche C di seconda categoria. Allora
C non pu essere non denso da nessuna parte (Denizione 3.13.3), e siccome
abbiamo visto che C chiuso, deve avere almeno un punto interno z, in base
alla Nota 3.13.2. Allora z C contiene un intorno aperto A dellorigine in
X, e per ogni F F si ha F (A) F (z) F (C) V V W (la prima
inclusione vale perch z U, la seconda per la denizione di C). Quindi F
una famiglia equicontinua.
Ora, in base alla Proposizione 3.14.2, la famiglia F equilimitata: quindi,
per ogni x X, lorbita Fx un insieme limitato in Y . Ci signica che
U = X.

Grazie al Corollario 3.13.5 del teorema di Baire, il Teorema di Banach


Steinhaus 3.14.3 assume la forma abituale seguente:

Corollario 3.14.4. (Principio di uniforme limitatezza per F-spazi.)


Siano X un F-spazio (uno spazio vettoriale con una topologia completa
indotta da una metrica: questo include tutti gli spazi di Frchet e di Banach),
e F una famiglia di operatori lineari da X ad uno spazio vettoriale topologico
Y . Se le orbite Fx := {F (x) : F F } sono limitate in Y per ogni x X,
allora F una famiglia equicontinua.

398CAPITOLO 3. SPAZI VETT. TOPOLOGICI, ANALISI FUNZIONALE


Corollario 3.14.5. (Il limite puntuale preserva la continuit degli
operatori.) Sia {Fn } una successione di operatori lineari continui da un
F-spazio X ad uno spazio vettoriale topologico Y , e supponiamo che per ogni
x X esista il limite F (x) = limn Fn (x). Allora il limite F un operatore
lineare (ovviamente!) e continuo.
Dimostrazione. Il precedente Corollario 3.14.4 implica che la successione
{Fn } equicontinua. Perci, per ogni intorno V dellorigine in Y , esiste
un intorno U dellorigine in X tale che Fn (U) V simultaneamente per
tutti gli n. Pertanto F (U) V , e quindi F continuo allorigine, e pertanto
ovunque, essendo lineare (si veda la seguente Nora di richiamo 3.14.6).

Nota 3.14.6. Grazie allinvarianza per traslazione della topologia degli spazi
ettoriali topologici, una mappa fra spazi vettoriali topologici continua se e
solo se continua allorigine, ed aperta se e solo se aperta allorigine.
Come osservato nel suo enunciato, il Teorema di BanachSteinhaus 3.14.3
asserisce che una condizione di limitatezza puntuale per una famiglia di
operatori lineari su opportuni spazi vettoriali topologici diventa uniforme.
Riformuliamo questa propriet nel caso pi consueto di spazi di Banach.
Corollario 3.14.7. (Principio di uniforme limitatezza per spazi di
Banach.) Siano X e Y spazi di Banach e F una famiglia di operatori
lineari da X a Y puntualmente limitata, nel senso che, per ogni x X, si ha
supF kF (x)k) < . Allora F equicontinua, nel senso che vale la seguente
maggiorazione uniforme sulla sfera unitaria di X: esiste una costante M > 0
tale che, per ogni x con kxk 6 1, si ha kF (x)k 6 M per ogni F F . Quindi,
per linearit, gli operatori in F sono uniformemente limitati: per ogni x X
e F F,
kF (x)k 6 Mkxk .

3.15

Il teorema dellapplicazione aperta

Definizione 3.15.1. Una applicazione F fra spazi topologici X e Y si dice


aperta ad un punto x X se limmagine di ogni intorno di x contiene un
intorno di F (x). Lapplicazione F si dice aperta se aperta ad ogni punto,
ossia se limmagine di ogni aperto in X un aperto in Y .

3.15. IL TEOREMA DELLAPPLICAZIONE APERTA

399

Nota 3.15.2. (i) Evidentemente, se una applicazione aperta F invertibile,


lapplicazione inversa continua, e viceversa: la continuit equivale
proprio al fatto che la controimmagine degli aperti sotto F 1 sia aperta.
(ii) Come al solito, grazie alla linearit ed allinvarianza per traslazione
della topologia, una applicazione lineare F fra spazi topologici aperta
se e solo se aperta allorigine.
Teorema 3.15.3. (Teorema dellapplicazione aperta.) Sia F un operatore lineare continuo da un F-spazio X ad uno spazio vettoriale topologico
Y tale che limmagine F (X) sia di seconda categoria in Y . Allora anche Y
un F-spazio, e F surgettiva ed aperta.
Dimostrazione. Se dimostriamo che F aperta, ne segue che surgettiva,
perch, essendo aperta e lineare, deve mandare X in un sottospazio aperto
di Y , ma lunico sottospazio aperto di Y Y stesso, come conseguenza del
Lemma 3.1.13.
Allora dimostriamo che F aperta, ossia, per la parte (ii) della Nota 3.15.2,
che limmagine F (V ) di ogni intorno V di 0 X contiene un intorno di 0 Y .
A tal ne basta dimostrare la seguente asserzione: sia r > 0 abbastanza
piccolo che la palla aperta V0 di raggio r e centro 0 sia contenuta in V , e, per
n N, sia Vn la palla di centro 0 e raggio 2n r: allora esiste un intorno W
di 0 tale che
(3.35)
W F (V1 ) F (V0 ) .
Dimostriamo tale asserzione. Dal momento che V2 V2 V1 , segue dalla
parte (i) dellEsercizio 3.1.3 che
F (V2 ) F (V2 ) F (V2 ) F (V2 ) F (V1 ) .
Perci, per provare la prima inclusione di (3.35), basta mostrare che F (V1 )
ha interno non vuoto. Questo segue dal Lemma 3.1.13, in base al quale
F (X) = n nF (V2 ), e quindi uno dei dilatati nF (V2 ) deve essere di seconda
categoria in Y : ma allora, poich la dilatazione un omeomorsmo, anche
V2 di seconda categoria (Nota 3.13.6), e quindi la sua chiusura ha interno
non vuoto (Nota 3.13.4).
Ora proviamo la seconda inclusione di (3.35). Vogliamo provare che ogni
y1 F (V1 ) appartiene a F (V1 ). A questo scopo costriamo iterativamente
una successione appropriata, come segue. Osserviamo che, esattamente come
appena dimostrato per F (V1 ), anche F (Vn+1 ) ha interno non vuoto. Allora,

400CAPITOLO 3. SPAZI VETT. TOPOLOGICI, ANALISI FUNZIONALE


per ogni yn F (Vn ), yn F (Vn+1) contiene un intorno dellorigine in Y , e
quindi (yn F (Vn+1 )) F (Vn ) non vuoto. Pertanto esiste xn Vn tale
che F (xn ) yn F (Vn+1 ). Se ora poniamo yn+1 = yn F (xn ), questo
signica che yn+1 F (Vn+1 ). Ma xn tende a zero a velocit esponenziale:
d(xn , 0) < 2n r perch xn sta nella palla Vn che ha questo raggio. Quindi,
in base alla formula di somma geometrica (Sezione 1.1), le somme parziali
P
k
n=1 xn sono una successione di Cauchy in X. Poich X un F-spazio
(ossia completo), questa successione converge a qualche x X, e di nuovo
la formula di somma geometrica rivela che d(x, 0) < r, ossia x V0 . Daltra
parte,
k
k
X
X
F (x) =
F (xn ) =
(yn yn+1 = y1 ym+1 .
(3.36)
n=1

n=1

Daltra parte, xn tende a zero, e quindi anche yn = F (xn ) perch F continua. Quindi segue da 3.36 che x = F (y1) F (V0 ). Questo prova la seconda
inclusione in (3.35), e quindi lasserzione, e come conseguenza il fatto che F
sia una applicazione aperta.
Reata da dimostrare che anche Y un F-spazio. Sia N il nucleo di F . Sappiamo dallEsercizio 3.1.6 che X/N un F-spazio: quindi basta trovare una
immersione, ossia un isomorsmo lineare I : X/N Y , che sia anche un
omeomorsmo. Questo isomorsmo I(x + N) = F (x). Infatti, ovvio che
questo un isomorsmo lineare e che si fattorizza rispetto alla proiezione canonica sul quoziente (Denizione 3.1.4): F (x) = I((x). Mostriamo che i
continuo: per ogni aperto V Y , la controimmagine I 1 (V ) aperta perch
I 1 (V ) = (F 1(V )) (per denizione di I) e aperta (Esercizio 3.1.6) e F
continua. Inne, mostriamo che I una applicazione aperta. Per denizione di I, per ogni aperto O X/N, abbiamo che I(O) = F ( 1 (O) aperto,
perch continua (per la Denizione 3.1.5 di topologia quoziente) e, come
appena visto, F aperta.

Corollario 3.15.4. Siano X e Y F-spazi e F : X Y un operatore lineare


surgettivo e continuo: allora F aperto, e quindi, se F iniettivo, anche
F 1 continuo. In particolare, se X e Y sono spazi di Banach e F : X Y
un operatore lineare iniettivo, surgettivo e continuo, allora per ogni x X
non solo esiste una costante C > 0 tale che
kF (x)kY 6 CkxkX

3.15. IL TEOREMA DELLAPPLICAZIONE APERTA

401

(la pi piccola tale costante essendo naturalmente kF k: Definizione 3.3.5),


ma esiste anche unaltra costante c > 0 tale che
kxkX 6 ckF (x)kY
(la pi piccola tale costante essendo ovviamente kF 1 k).
Dimostrazione. Lo F-spazio Y di seconda categoria in s stesso, per il
Corollario 3.13.5 del teorema di Baire. Allora segue dal Teorema dellapplicazione aperta 3.13.5 segue che F aperto, e quindi, se invertibile, che F 1
continuo. Se la topologia di X e di Y indotta da una norma, ci equivale
alle disuguaglianza dellenunciato.

Corollario 3.15.5. La topologia di un F-spazio massimale, nel senso seguente: se X un F-spazio nella topologia ed anche in una topologia pi
forte + , allora + coincide con .
Dimostrazione. Basta applicare il precedente Corollario 3.15.4 alla mappa
identit da (X, tau+ ) a (X, ), che continua visto che + .

Esercizio 3.15.6. (Sottospazi chiusi di Lp [0, 1].) Siano 1 6 p < e S


un sottospazio di C[0, 1] Lp [0, 1] chiuso come sottospazio di Lp [0, 1] (ossia
nella norma di) Lp ). Si provino i seguenti risultati.
(i) Esiste una costante C > 0 tale che, per ogni f S, kf kp 6 kf k 6
Ckf kp .
(ii) S chiuso come sottospazio di C[0, 1] (ossia nella norma uniforme).
(iii) Sia q lindice coniugato di p, ossia 1q = 1 1p (Denizione 1.16.4). Allora,
per ogni x [0, 1], esiste un nucleo riproducente gx Lq [0, 1] tale che,
per tutte le funzioni f S, si ha
Z 1
f (x) =
f (t) gx (t) dt .
0

(iv) Se fn S converge debolmente in Lp ad una funzione f S, allora fn


converge a f puntualmente ovunque in [0, 1].
(v) Se fn S converge debolmente in Lp ad una funzione f S, allora fn
ammette una sottosuccessione che converge a f nella norma di Lp (ed
in tutte le norme Lr con 1 6 r < )).

402CAPITOLO 3. SPAZI VETT. TOPOLOGICI, ANALISI FUNZIONALE


(vi) Dora in poi limitiamo lattenzione al caso particolare p = 2. Lo spazio
S con le propriet della parte (i) un sottospazio localmente compatto
di L2 [0, 1].
(vii) Sempre nel caso p = 2, S ha dimensione nita.
Svolgimento. ovvio che kf kp 6 kf k per ogni f in Lp [0, 1], quindi anche
per f S. Inoltre, S C[0, 1] Lp [0, 1] chiuso in Lp [0, 1], e lidentit
una applicazione lineare ed iniettiva da S a Lp [0, 1], ed continua perch sui
compatti la convergenza uniforme implica quella in Lp . Pertanto la disuguaglianza kf k 6 Ckf kp segue per ogni f S dal Corollario 3.15.4. Questo
prova (i), e prova anche che le norme kf k e kf kp su S sono equivalenti, e
quindi che S anche chiuso nella norma uniforme, ossia (ii).
Per ogni x [0, 1] il funzionale x (f ) = f (x) un funzionale lineare su C[0, 1]
evidentemente continuo nella norma uniforme (perch |f (x)| 6 kf k ), e
quindi anche nella norma di Lp , per la parte (ii). Allora x si estende ad un
funzionale continuo su tutto Lp [0, 1], per il teorema di HahnBanach (Teorema 3.5.5). Abbiamo visto nellEsempio 3.12.2 che tutti questi funzionali, e
quindi in particolare x , si rappresentano
R 1 come nella parte (iii) tramite una
q
funzione gx L [0, 1] come T (f ) = 0 f (t) gx (t) dt. Questo prova (iii). Si
noti che T lestensione di HahnBanach su tutto Lp [0, 1] di x che era denito su S come x (f ) = f (x): quindi per f Lp \ S non detto che si abbia
T (f ) = f (x), anzi in generale lultimo membro non ha senso per funzioni discontinue, perch, per ogni ssato x, dipende dalla scelta del rappresentante
nella classe di Lebesgue di f , e non c un rappresentante privilegiato per sui
il valore puntuale abbia senso.
Per dimostrare (iv), osserviamo anzitutto che se fn S converge debolmente in Lp ad una funzione f Lp [0, 1], allora, per (iii), per ogni x [0, 1]
abbiamo
Z 1
Z 1
fn (x) =
fn (t) gx (t) dt
f (t) gx (t) dt = x (f ) = f (x) .
0

Questo prova (iv).


Ora supponiamo che fn S converga a f S nella topologia debole di Lp .
Dalla parte (iv) sappiamo che fn converge a f puntualmente. Sia xn il punto
in cui |fn | raggiunge il proprio massimo. Dal momento che [0, 1] compatto,
esiste una sottosuccessione di xnk di xn che converge a un punto x0 [0, 1]:
ne ricaviamo da (iv) che kfnk k f (x0 ). Ma allora kfnk k una successione numerica limitata, ossia la sottosuccessione fnk (x) uniformemente

3.16. IL TEOREMA DEL GRAFICO CHIUSO

403

limitata al variare di x. Pertanto anche |fnk (x) f (x)| uniformemente limitata (dalla costante |f (x0 )| + kf k 6 2kf k ). Allora possiamo applicare al
compatto [0, 1] il Teorema di Convergenza Dominata 1.9.54 e concludere che
fnk converge a f in L1 ed in tutte le norme Lr su [0, 1], per ogni 1 6 r < .
Abbiamo provato (v).
Se p = 2, osserviamo che la sfera unitaria in S considerato come sottospazio
chiuso nella norma L2 , la quale compatta nella topologia debole stella di
L2 in base al Teorema 3.10.7, lo anche nella topologia debole indotta da L2 ,
perch L2 [0, 1] coincide isometricamente con il proprio duale (questo risultato un celebre teorema di RieszFischer, la cui dimostrazione, per comodit
espositiva, viene rimandata al Capitolo 4 (teorema 4.4.6). Pertanto la parte (v) nel caso p = 2 asserisce che nella sfera unitaria dello spazio S (nella
norma di L2 ) ogni successione ha una sottosuccessione convergente ad un elemento di S non soltanto debolmente, ma anche in norma. Questo signica
che le sfere di S sono compatte nella norma di L2 , ossia che S localmente
compatto. Questo fatto esattamente la parte (vi), e la parte (vii) ora segue
da un risultato che per convenienza espositiva posponiamo ad una prossima
Sezione: il Teorema 3.19.5, che asserisce che uno spazio vettoriale topologico
localmente compatto se e solo se a dimensione nita.

3.16

Il teorema del grafico chiuso

Rammentiamo che una funzione da un insieme X ad un insieme Y denita


come un sottoinsieme G X Y di coppie (x, y) che non hanno mai lo
stesso primo elemento: questo signica che ad ogni x X corrisponde al pi
un elemento y Y tale che (x, y) G. abituale indicare questo elemento
y con f (x). La proiezione di G sul fattore X il dominio di f , e quella su y
limmagine di f .
Nota 3.16.1. Se G un graco, allora ad ogni (x, y) G corrisponde un
unico y Y , e quindi la proiezione canonica 1 ((x, y)) = x invertibile se
ristretta a G: ossia, esiste 1 |1
G : X G.
In eetti, spesso questa denizione astratta del concetto di funzione viene
rimpiazzata dal simbolo x 7 f (x), e linsieme G viene chiamato il grafico di
f . La consuetudine a questa formulazione, ad esempio nel caso di f : R R,
ci fa presumere che, se X e Y sono spazi topologici e f : X Y continua,
il graco di f debba essere un insieme chiuso. Questo fatto quasi vero:

404CAPITOLO 3. SPAZI VETT. TOPOLOGICI, ANALISI FUNZIONALE


Proposizione 3.16.2. Siano X e Y spazi topologici e f : X Y continua.
Allora, se Y uno spazio di Hausdorff (Definizione 1.10.2), il grafico G
di f chiuso in X Y . Viceversa, se Y non uno spazio di Hausdorff,
esistono funzioni da Y a Y il cui grafico non chiuso (ad esempio, la funzione
identit).
Dimostrazione. Sia (x0 , y0 )
/ G: in altre parole, y0 6= f (x0 ). Se Y di
Hausdor, in Y esistono intorni V1 di y0 e V2 di f (x0 ) disgiunti. Ma poich
f continua, esiste un intorno U di x0 in X tale che f (U) V1 . Pertanto
lintorno U V1 di (x0 , y0 ) tutto contenuto nel complemento di G. Quindi
il complemento di G aperto, ossia G chiuso.
Se invece Y non di Hausdor, il gaco della funzione identit la diagonale
(y, y) : y Y . Se questo insieme fosse chiuso, allora il suo complemento
sarebbe aperto, il che, per largomento appena esposto, equivarrebbe a dire
che per ogni z 6= w in Y esisterebbero intorni aperti disgiunti di z e w: questo
contraddice il fatto che Y non sia di Hausdor.

Nota 3.16.3. Ogni punto di accumulazione in uno spazio metrizzabile Z


limite di successioni zn Z. Pertanto, se X e Y sono spazi metrizzabili, ogni
punto di accumulazione del graco G X Y limite di successioni (xn , yn ),
e quindi il graco G chiuso se e solo se per ogni successione xn x X
tale che f (xn ) y Y si ha y = f (x).

Ora mostriamo che, per funzioni lineari su spazi vettoriali topologici metrizzabili e completi, il fatto che il graco sia chiuso equivale alla continuit.
Questa una conseguenza quasi immediata del Teorema dellapplicazione
aperta 3.15.3.
Teorema 3.16.4. (Teorema del grafico chiuso.) Siano X e Y F -spazi
(Definizione 3.1.1), e T una applicazione lineare da X a Y . Allora T
continua se e solo se il suo grafico chiuso in X Y .
Dimostrazione. Grazie alla Proposizione 3.16.2 suciente dimostrare che
se il graco G di T chiuso allora T continua.
Consideriamo lo spazio vettoriale X Y , con somma e moltiplicazione per
scalari denita componente per componente. Poich X e Y sono F -spazi,
la loro topologia indotta da metriche invarianti dX e dY : allora banale
vericare che d((x1 , y1 ), (x2 , y2 )) := dX (x1 , x2 ) + dY (y1 , y2 ) una metrica
invariante su X Y compatibile con la sua topologia prodotto, e completa.

3.17.

SEMINORME E SPAZI LOCALMENTE CONVESSI

405

Quindi X Y , con questa topologia, un F -spazio, ed il sottoinsieme chiuso G


, essendo chiuso in uno spazio completo, completo (Proposizione 1.10.7).
Perci G un F -spazio. Consideriamo ora le seguenti due proiezioni ottenute
dalle canoniche sui fattori (la seconda proprio la proiezione canonica):
1 |G (x, T x) = x,

2 (x, y) = y .

Allora 1 |G e 2 sono continue, perch le sono le proiezioni canoniche nella


topologia prodotto (per denizione di topologia prodotto, Denizione 3.7.2).
Poich G e X sono F -spazi, segue dal Teorema dellapplicazione aperta 3.15.3
che 1 |1
G : X G (che esiste come visto nella Nota 3.16.1) continua.
Ma naturalmente anche la proiezione canonica 2 continua, e quindi lo
T = 2 pi1 |1

G .

3.17

Seminorme e spazi localmente convessi

Da qui in poi laccento si focalizza su aspetti pi astratti. Il lettore non


interessato invitato ad omettere il resto del Capitolo.

3.17.1

Spazi di Frchet e topologie indotte da famiglie


numerabili di seminorme

Definizione 3.17.1. (Famiglia separatrice di seminorme.) Sia V uno


spazio vettoriale munito di una famiglia numerabile di seminorme pn (introdotte nella Denizione 3.2.8), con la seguente propriet di separazione: per
ogni v 6= 0 in V , esiste n tale che pn (v) 6= 0. Una tale famiglia di seminorme
si dice separatrice.
I seguenti enunciato sono chiari, e si dimostrano come la parte (i) dellEsercizio 1.13.7: e
Nota 3.17.2. (Basi e sottobasi per topologie indotte da famiglie separatrici di seminorme.) Al variare di n N e r Q, r > 0, gli insiemi
V (pn , r) := {v : pn (v) < r} formano una sottobase di aperti convessi e
stellati (Denizione 3.1.7) per la topologia appena introdotta: i V (pn , r)
sono convessi grazie alla disuguaglianza triangolare delle seminorme, e stellati grazie alla propriet di dilatazione delle seminorme (rispettivamente le
propriet (i) e (ii) della Denizione 3.2.8). In altre parole, una base per

406CAPITOLO 3. SPAZI VETT. TOPOLOGICI, ANALISI FUNZIONALE


consiste delle intersezioni nite degli insiemi V (pn , r) al variare di n in N e
r > 0 in Q.
Si noti che gli insiemi V (pn , r) := {v : pn (v) < r} formano una sottobase ma
in generale non una base per la topologia: non detto che in ogni aperto sia
contenuto qualche V (pn , r). Ad esempio, la consueta topologia euclidea in
R2 (i cui aperti di base possono essete scelti come palle euclidee) indotta
dalle due seminorme p1 (x1 , x2 ) = |x1 | e p2 (x1 , x2 ) = |x2 |, i cui aperti V (pn , r)
(n = 1, 2) sono strisce nel piano: le loro intersezioni sono rettangoli, ed ogni
palla contiene un rettangolo, ma non una striscia.

Nota 3.17.3. (Topologia indotta da una famiglia separatrice di seminorme.) Una famiglia separatrice di seminorme rende V uno spazio
vettoriale topologico con la topologia data da tutte le unioni di traslati di
membri della base locale a 0. ovvio che questa topologia invariante per
traslazione; in verit, occorrerebbe dimostrare che i punti sono chiusi (la propriet T 1 che assunta nella Denizione 3.1.1 di spazio vettoriale topologico,
ma questo (per linvarianza per traslazione) equivale al fatto che {0} sia un
chiuso, e ci una ovvia conseguenza della propriet di separazione: ogni
v 6= 0 contenuto in qualche aperto di base v + V (pn , r) che non contiene
0, quindi il complemento di {0} aperto. La continuit della somma e della
moltiplicazione per scalari sono facili esercizi che lasciamo per il lettore (che
in caso di dicolt pu consultare la dimostrazione di [25, Theorem 1.37].
In questa topologia la nozione di convergenza diventa la seguente:
lim vj = v

se per ogni seminorma pn si ha


lim pn (vj v) = 0

cio se per ogni > 0 esiste j0 N, j0 = j0 (, n), tale che, se j > j0 , si ha


pn (vj v) < . La propriet di separazione necessaria perch la topologia
di uno spazio vettoriale topologico deve soddisfare lassioma di separazione

T 2 (Lemma 3.1.11), ed anche gi solo T 1 (Denizione 3.1.1).


Nota 3.17.4. (Continuit nelle topologie indotte da famiglie separatrici di seminorme.) Come conseguenza diretta della Nota 3.17.2, se la
topologia dello spazio vettoriale V indotta da una famiglia separatrice di

3.17.

SEMINORME E SPAZI LOCALMENTE CONVESSI

407

seminorme, una funzione F : V W (dove W un qualsiasi spazio topologico) continua se e solo se la controimmagine di un aperto O W
contiene un aperto di tale base (per denizione di continuit, Sezione 1.1, e
denizione di base locale della topologia, Denizione 1.10.1). Un caso particolare quello delle funzioni F che sono operatori lineari da V ad uno spazio
normato W : essi sono continui se e solo se sono continui allorigine (grazie
alla linearit ed alla invarianza per traslazione della topologia), e pertanto
se e solo se, per ogni sfera O intorno allorigine in W , esistono una famiglia
nita n1 , . . . , nk N e una costante C tali che, per ogni v O,
kF (v)k < Cn

k
X

pni (v) .

i=1

Analogo il caso di uno spazio W munito di una famiglia numerabile di


seminorme qn : in tal caso loperatore lineare F : V W continuo se e solo
se, per ogni n N, esistono una famiglia nita n1 , . . . , nk N e una costante
Cn tali che, per ogni v V ,
qn (F (v)) < Cn

k
X

pni (v) .

i=1

Nota 3.17.5. Sia V uno spazio vettoriale con topologia indotta da una famiglia numerabile di seminorme pn . Allora ogni pn una funzione continua su
V . Infatti, per linvarianza per traslazione basta mostrare che pn continua
a 0. Per ogni > 0, sia r Q, 0 < r < . Allora la controimmagine sotto pn
dellintervallo aperto di raggio e centro 0 in R contiene V (pn , r), ed infatti
consiste dellunione 0<r< V (pn , r), ossia di un aperto in V .

Teorema 3.17.6. (Seminorme e metrizzabilit.) La topologia indotta da


una famiglia separatrice di seminorme metrizzabile e localmente convessa.
Dimostrazione. La topologia indotta su V dalla famiglia numerabile di seminorme pn proviene da una metrica invariante, in base al Teorema 3.2.5,
dal momento che abbiamo appena visto che questa topologia ha basi locali
numerabili. facile costruire esplicitamente una tale metrica d nel modo
seguente: nel modo seguente:
d(x, y) :=

X
n=1

2n

p(x y)
.
1 + p(x y)

408CAPITOLO 3. SPAZI VETT. TOPOLOGICI, ANALISI FUNZIONALE


Ovviamente questa serie convergente perc la funzione h(t) = t/(1 + t) ha
valori fra 0 e 1 per t > 0, e quindi i termini della serie, 2n h(p(x y)), sono
maggiorati da 2n . Lunica propriet di d che non ovvia la disuguaglianza
triangolare, per dimostrare la quale occorre osservare che la funzione h
concava nella semiretta {t > 0}, e quindi sublineare: h(u + v) 6 h(u) + h(v)
(la disuguaglianza stretta se u, v > 0, ma non ci serve). Da questo segue
che d(x, y) 6 d(x, z) + d(z, y) per ogni x, y, z V .
Poich la topologia indotta dalla famiglia pn ammette basi locali consistenti
di insiemi convessi, essa una topologia localmente convessa.

Proposizione 3.17.7. Sia V uno spazio vettoriale con topologia indotta da


una famiglia numerabile di seminorme pn . Allora un sottoinsieme E V
limitato se e solo se ogni pn una funzione limitata su E.
Dimostrazione. Supponiamo E limitato: per ogni intorno U di 0 in V esiste
r > 0 tale che E U per tutte le dilatazioni con || > r (Denizione
3.1.1). Prendiamo, al posto di U, laperto di base V (pn , 1). Linclusione
E V (p, 1) equivale alla disuguaglianza pn (v) < per ogni v E: quindi
pn limitata su E.
Viceversa, supponiamo che tutte le seminorme siano limitate su E e scegliamo
un intorno U di 0 ed un aperto di base V (p1 , r1 ) V (pn , rn ) U. Poich
queste seminorme p1 . . . , pn sono limitate su E, esistono costanti Cj tali che
pj < Cj su tutto E per ogni 1 6 j 6 n. Ma allora, per tutti questi indici
j e per ogni > max{Cj /rj : 1 6 j 6 n}, abbiamo U V (pj , rj )
V (pj , Cj ) E, quindi E un insieme limitato.

Nota 3.17.8. Si badi bene, a scanso di funesti equivoci, che gli insiemi E
caratterizzati dal fatto che tutte le seminorme pn sono limitate su E di solito
non sono aperti! La palla Bn () = {f : pn (f ) < } limitata per ciascun
n e , come osservato allinizio della dimostrazione del Teorema 3.2.11, ed
aperta grazie alla Nota 3.17.5. Ma se la famiglia di seminorme numerabile
invece che nita, il tipico insieme E su sui tutte le seminorme sono limitate intersezione numerabile di traslati di palle Bn (n ), ed una intersezione
numerabile di aperti di solito non aperta. Questa la vera, profonda dierenza fra le topologie di spazio normato e di spazio munito di una famiglia
separatrice (innita) di seminorme.

3.18. ESEMPI DI SPAZI DI FRCHET

3.18
3.18.1

409

Esempi di spazi con famiglie numerabili di


seminorme; spazi di Frchet
Gli spazi C (), D() e DK

Dato un aperto non vuoto Rk , lo spazio C () consiste di tutte le


funzioni innitamente derivabili su . Per stabilire la notazione, indichiamo
con = (1 , . . . , k ) un multi-indice, ossia un vettore in Nk a coecienti
non negativi, e con D := D11 . . . Dkk la derivata di ordine (si intende
Pk
che D 0 f = f ). Lordine di derivazione indicato con || :=
i=1 |i |.
Tutte le idee e gli argomenti che stiamo per presentare sono completamente
intellegibili anche limitando lattenzione al caso k = 1, ed invitiamo il lettore
non interessato alla generalit a limitare lattenzione a questo caso.
Sia Bn la palla di centro lorigine e raggio n in Rk . Ecco un modo di denire
una famiglia numerabile di seminorme su C (): per ogni multi-indice ,
qn, (f ) = max{|D f (x)| : x Bn } .

(3.37)

Gli aperti la sottobase locale indotta da ciascuna di queste seminorme sono gli
insiemi W (n, , r) = {f : qn, (f ) < r} Poich per una base per la topologia
indotta da questa famiglia di seminorme consiste delle intersezioni nite di
questi insiemi, la stessa topologia viene indotta da questa nuova famiglia di
seminorme:
pn (f ) = max{|D f (x)| : x Bn , || 6 n} .
(3.38)
Le famiglie di seminorme {qn } e {pn } sono famiglie separatrici, perch se
f 6= 0 allora qo (f ) = p0 (f ) = kf k > 0.
La sottobase indotta dalla nuova famiglia {pn } consiste degli insiemi V (n, r) =
||6n W (n, , r). In eetti questa non solo una sottobase ma anche una
base, grazie alla seguente ovvia osservazione:
Nota 3.18.1. Se una famiglia di seminorme pn monotna, nel senso che,
per ogni vettore v, si ha pn (v) 6 pn+1 (v), allora gli insiemi V (pn , r) = {v :
pn (v) < r} sono inscatolati, nel senso che V (pn+1 , r) V (pn , r), e quindi la
intersezione di un numero nito di questi insiemi V (pn , r)
e ancora un insieme dello stesso tipo: se n1 < n2 < < nk , allora
ki=1 V (pni , r) = V (pnk , r). Quindi i V (pn , r) costituiscono non solo una
sottobase, ma anche una base locale a 0 per la topologia. Per semplicit,
preferiamo ricorrere ad una base indicizzata da un solo indice, e per questo

410CAPITOLO 3. SPAZI VETT. TOPOLOGICI, ANALISI FUNZIONALE


limitiamo lattenzione alla famiglia B di aperti di base
1
Vn := V (pn , ) .
n

(3.39)

Le intersezioni niti degli insiemi Vn B sono ancora insiemi in B, e poich


1/n 0 ogni V (pn , r) contiene V (pn , 1/n) = Vn se n abbastanza grande
(maggiore di 1/r). Quindi anche B una base locale a 0.

Corollario 3.18.2. La convergenza di una successione fn C () la


convergenza uniforme sui compatti delle fn e di tutte le loro derivate (di
qualsiasi ordine).
Dimostrazione. Segue dalle espressioni (3.37) o equivalentemente (3.38) delle
seminorme che inducono la topologia di C ().

Nota 3.18.3. interessante considerare questaltra possibilit:


sn (f ) = max{|D f (x)| : x Rk , || 6 n} .

(3.40)

Queste seminorme non sono nite su C () a meno che laperto non


sia limitato, perch C () contiene funzioni che divergono allinnito; esse
per costituiscono una famiglia di seminorme sul sottospazio di C () delle
funzioni con tutte le derivate limitate. Su questo sottospazio le seminorme
{sn } denite da (3.40) sono in realt norme, dal momento che, se sn (f ) = 0,
allora s0 (f ) = kf kL () = 0, e quindi f = 0. In particolare, queste norme
sono denite sul sottospazio C0 () delle funzioni innitamente derivabili
che tendono a zero allinnito, ed anche sul sottospazio D delle funzioni C
a supporto compatto, e sui suoi sottospazi DK delle funzioni C a supporto
in un compatto K .
Le due famiglie di seminorme {pn } e {sn } deniscono la stessa topologia su
D, ed anche su DK per ogni compatto K . Infatti, da un lato pn 6 sn
per ogni n, ma
sup max max |D f | = sup sup max |D f |
n

Bn ||6n

Rk ||6n

(perch i massimi di tutte le derivate di f sono assunti sullo stesso compatto


supp F .)

Teorema 3.18.4. C () uno spazio di Frchet (Definizione 3.1.1).

3.18. ESEMPI DI SPAZI DI FRCHET

411

Dimostrazione. C () localmente convesso in base al Teorema 3.17.6.


Dobbiamo solo dimostrare che C () completo.
Consideriamo una successione {fj } di Cauchy in C (). Allora fi fj
Vn = V (pn , 1/n (denito in (3.39) se i e j sono abbastanza grandi (quanto
grandi dipende da n, naturalmente). Questo signica che maxxBn |D fi (x)
D fj (x)| < 1/n per ogni || 6 n. Ma allora, per ogni , la successione
{D fj } di Cauchy nella norma uniforme per ogni compatto in . Poich
la norma uniforme completa, per ogni multi-indice esiste g = limj D fj
(limite uniforme sui compatti). Quindi g continuo, e, per il Teorema 1.3.19
di convergenza uniforme con le derivate, g = D g0 , e quindi g0 C () e
lo stesso vale per tutte le g . Ma allora pn (fj g) 0 per j , e quindi
fj g nella topologia di C ().

Nota 3.18.5. In seguito vedremo un argomento analogo per il sottospazio


S() di C () su cui sono nite tutte le seminorme
pk,n (f ) =

sup

(1 + |x|k ) |D f (x)| .

xRm ,||=n

Questo spazio si chiama la classe di Schwartz, ed studiato in dettaglio nel


Capitolo 9. Per, in realt, la dimostrazione della sua completezza, che sar
svolta in pieno dettaglio nel Teorema 9.4.3, la stessa del precedente Teorema
3.18.4: invitiamo il lettore a svolgerla ora per esercizio, insieme agli enunciati
paralleli a quelli della precedente Nota 3.18.3, ed a consultare il succitato
teorema in caso di dicolt con la stringatezza dellargomento precedente.
Qui ci limitiamo a riassumere il risultato appena citato (e lequivalente della
Nota 3.18.3) nel prossimo Corollario 3.18.6. Prima, per, osserviamo che
la topologia indotta dalla famiglia delle seminorme pk,n la stessa di quella
indotta dalle seminorme
r2k,n (f ) =

sup

(1 + x2k ) |D f (x)| .

xRm ,||=n

Infatti, le due famiglie di seminorme sono equivalenti, perch, ovviamente, p2k,n = r2k,n , mentre p2k1,n = r2k,n per ogni k > 1. Lultima asserzione vale perch |x|2k1 diverge allinnito pi lentamente di x2k , mentre,
se x varia su un qualsiasi compatto J, esiste una costante C(J) tale che
1 + |x|2k1 6 C(J)(1 + x2k ), dal momento che le due funzioni continue
1 + |x|2k1 e 1 + x2k sono limitate superiormente ed inferiormente sui compatti, ed il loro minimo maggiore o uguale a 1.

412CAPITOLO 3. SPAZI VETT. TOPOLOGICI, ANALISI FUNZIONALE


Nonostante le due famiglie di seminorme siano equivalenti, le seconde, {r2k,n },
hanno la propriet aggiuntiva di essere espresse in termini di funzioni innitamente derivabili.

Corollario 3.18.6. La topologia indotta su S() dalle seminorme pk,n (f ) =


supxRm ,||=n (1 + |x|)k |D f (x)| la stessa di quella indotta dalle seminorme qn (f ) = sup|x|6n,||6n(1 + |x|)k |D f (x)|, che per hanno il vantaggio di
essere crescenti, nel senso che qn (f ) 6 qn+1 (f ) per ogni f S. Con questa
topologia, S() uno spazio di Frchet (Definizione 3.1.1: si rammenta che
S() localmente convesso perch la sua topologia indotta da una famiglia
separatrice di seminorme: Teorema 3.17.6).
In maniera del tutto analoga:
Corollario 3.18.7. Per ogni compatto K , il sottospazio DK C ()
un sottospazio chiuso, e quindi completo; pertanto uno spazio di Frchet.
Dimostrazione. Le seminorme in DK sono la restrizione delle seminorme di
C (), e quindi le successioni di Cauchy fn DK convergono in C ()
perch questultimo spazio completo (Teorema 3.18.4): questo signica che
le fn convergono uniformemente sui compatti a qualche funzione f in C ()
(Corollario 3.18.2). Ma visto che tutte le funzioni fn hanno supporto in un
unico compatto K, lo stesso vale per il loro limite uniforme sui compatti f ,
che quindi appartiene a DK . Pertanto DK chiuso in C (), e le successioni
di Cauchy convergono in DK . Siccome la topologia di DK indotta da una
famiglia di seminorme, essa localmente convessa, grazie al Teorema 3.17.6:

quindi DK uno spazio di Frchet (Denizione 3.1.1).

3.18.2

La topologia di limite induttivo rende D() completo

Abbiamo gi denito in (3.38) le seminorme pn (f ) = max{|D f (x)| : x


Bn , || 6 n} su D(), ed abbiamo mostrato nella Nota 3.18.3 che esse
inducono la stessa topologia delle norme {sn } denite in (3.40): sn (f ) =
max{|D f (x)| : x Rk , || 6 n}. Ovviamente, per ciascun compatto
K , queste norme inducono sul sottospazio DK D la topologia relativa
ereditata da D(): abbiamo visto nel precedente Corollario 3.18.7 che in
questa topologia DK di Frchet. Purtroppo, per:

3.18. ESEMPI DI SPAZI DI FRCHET

413

Proposizione 3.18.8. Nella topologia indotta dalle seminorme di C ()


studiate nella Nota 3.18.3, il sottospazio D() delle funzioni a supporto
compatto non completo.
Dimostrazione. Costruiamo una successione di Cauchy rispetto alle seminorme pn denite in (3.38) che converge (ovviamente!) in C ma ad una
funzione a supporto non compatto, quindi non converge in D. Per semplicit
consideriamo solo il caso di D(R), ma la generalizzazione a funzioni denite
su un aperto illimitato Rk ovvia.
Sia una funzione C con supporto in [0, 1] e cn una successione
di numeri
PN
complessi che tende a zero. Allora la successione N = n=0 cn (x n)
di Cauchy nelle seminorme pn , perch, se n < M < N, allora N M =
P
N
n=M cn (x n) ha supporto fuori della palla di raggio M > n e quin
di
Ppn (N M ) = 0. chiaro che N converge in C alla funzione

n=0 cn (x n), che ha supporto non compatto.

Pertanto, non vogliamo usare su D la topologia delle seminorme pn , anche


se essa si restringe su DK alla consueta topologia di Frecht per ogni compatto K : al contrario, vogliamo utilizzare queste topologie di Frchet
di tutti i sottospazi DK per indurre una nuova topologia su D che verichi la propriet di completezza e si restringa su tutti i DK alla consueta
topologia delle seminorme pn . Vedremo che, in base al Teorema 3.17.6, questa topologia, che si chiama la topologia del limite induttivo, non indotta
da una famiglia separatrice di seminorme su D, perch non metrizzabile
(Teorema 3.18.21). Quando munito di tale topologia, lo spazio vettoriale topologico D() si chiama il limite induttivo dei sottospazi DK : dora in avanti
considereremo sempre D() con la topologia di limite induttivo.
Definizione 3.18.9. (Topologia del limite induttivo.) Sia K compatto con interno non vuoto e K la consueta topologia di Frchet di DK
(indotta dalla famiglia {sn } di norme introdotte in (3.40), che danno luogo
alla stessa topologia delle seminorme {pn }, come visto nella Nota 3.18.3). Sia
la famiglia di tutti gli insiemi convessi stellati W D compatibili con le
topologie K , ossia tali che W DK K per ogni compatto K come sopra,
e la famiglia di tutti i traslati in D di insiemi in .

Nota 3.18.10. Per ogni r > 0 e K compatto, le palle Bn,K (r) =


{f DK : sn (f ) < r} sono aperti convessi stellati in DK : sono aperti perch la topologia K su DK quella indotta dalle norme {sn }, e sono

414CAPITOLO 3. SPAZI VETT. TOPOLOGICI, ANALISI FUNZIONALE


convesse e stellate rispettivamente per la propriet subadditiva (disuguaglianza triangolare) e la propriet di omogeneit delle norme (o seminorme:
propriet (i) e (ii) della Denizione 3.2.8). Per lo stesso motivo, le palle
Bn (r) = {f D() : sn (f ) < r} sono insiemi convessi e stellati in D(),
ed ovviamente Bn,K (r) = Bn (r) DK . Segue quindi dalla denizione di
(Denizione 3.18.9) che le palle Bn (r) appartengono a .

Abbiamo bisogno di un facile lemma tecnico.


Lemma 3.18.11. Se W un convesso e 0 < < 1, allora W = W + (1
)W .
Dimostrazione. Per semplicit consideriamo il caso = 21 : il caso generale
ha la stessa dimostrazione, parola per parola.
Osserviamo anzitutto che ogni insieme W verica W 12 W + 21 W , dal momento che per ogni punto w si ha w = 12 w + 21 w. Per, se linsieme W
convesso, allora vero anche il viceversa: se u, v 12 W , allora 2u, 2v W
e ponendo w = 21 (2u + 2v) vediamo che la combinazione convessa w deve
appartenere a W , quindi 12 W + 12 W W . Abbiamo pertanto provato che
ogni convesso W verica W = 12 W + 12 W .

Teorema 3.18.12. La famiglia della precedente Definizione 3.18.9 una


topologia su D() con base locale a 0, e:
(i) in questa topologia D() uno spazio localmente convesso;
(ii) i sottoinsiemi convessi stellati di D() sono aperti se e solo se appartengono alla base locale ;
(iii) la restrizione di a DK coincide con K .
Dimostrazione. Proviamo per prima cosa che una base locale per :
questo equivale a mostrare che, per tutti gli aperti V1 , V2 e per ogni
funzione f V1 V2 , esiste un aperto W tale che
f + W V1 V2 .

(3.41)

Poich (per la sua denizione 3.18.9) consiste di traslati di insiemi in ,


per i = 1, 2 esistono fi D = D() e Wi convessi stellati in tali che
f fi + Wi Vi .

(3.42)

3.18. ESEMPI DI SPAZI DI FRCHET

415

Sia K un compatto che contiene i supporti di f , f1 e f2 , ovvero f , f1


e f2 DK . Rammentiamo la condizione di compatibilit nella Denizione
3.18.9: gli insiemi stellati Wi vericano Wi DK K , ossia queste intersezioni sono aperti in DK . Ma allora, a causa di (3.42), abbiamo f fi Wi DK .
Ma quando W un aperto e g W , il numero 0 := inf{ : g W non
un minimo, e poich g W deve essere 0 < 1. Quindi esistono i (0, 1)
tali che f fi (1 i )Wi , per i = 1, 2. Ora usiamo il fatto che i Wi sono
anche convessi: segue dal Lemma 3.18.11 che
f fi + i W (1 i )Wi + i Wi = Wi ,

e quindi linclusione (3.41) vale con la scelta W = 1 W1 2 W2 . Questo prova


che b una base per .
La tediosa ma elementare verica del fatto che sia una topologia di
spazio vettoriale topologico potrebbe essere lasciata al lettore per esercizio,
ma a titolo esemplicativo la svolgiamo qui.
Siano f1 , f2 D(), f1 6= f2 , e consideriamo la palla B0 (r) introdotta nella
Nota 3.18.10 con r := p0 (f1 f2 ) (r positivo perch f1 f2 6= 0 e le sn sono
norme). Proprio per quanto osservato in quella Nota, B0 (r) appartiene a ,
ed in base alla disuguaglianza triangolare f1
/ f2 + B0 (r): quindi ogni punto
f2 6= f1 appartiene ad un aperto della topologia disgiunto da f1 , ovvero il
complemento di f1 aperto in , e quindi i punti sono chiusi.
Per provare che la somma continua, usiamo il Lemma 3.18.11: dato W ,
abbiamo (f1 + 21 W ) + (f2 + 12 W ) = (f1 + f2 ) + W , e quindi la controimmagine
di un intorno aperto di f1 + f2 contiene la somma di intorni aperti di f1 e f2 .
Per provare che la moltiplicazione per scalari continua, prendiamo , 0 C
e f, f0 D(), e scriviamo
f 0 f0 = (f f0 ) + ( 0 )f0 .

(3.43)

Poich abbiamo gi mostrato che una base locale a 0 per , dato un


qualsiasi W esiste > 0 tale che f 21 W . Allora, da (3.43) e dal
fatto che W convesso e stellato, per ogni | 0 | < e f f0 W
abbiamo f 0 f0 ||cW + 21 W (c(|0 | + ) + 21 )W . Quindi, scegliendo
c abbastanza piccolo, vediamo che f 0 f0 W : questo signica che la
moltiplicazione per scalari continua. Abbiamo completato la dimostrazione
del fatto che una topologia di spazio vettoriale topologico.
Inne, poich la base locale consiste di insiemi convessi, la topologia
localmente convessa. Questo completa la dimostrazione della parte (i)
dellenunciato.

416CAPITOLO 3. SPAZI VETT. TOPOLOGICI, ANALISI FUNZIONALE

ha

Ora mostriamo la parte (ii), anzi pi in generale che per ogni V si


V DK K

(3.44)

(da questo segue la parte (ii) se si limita lattenzione ad aperti V convessi e


stellati; si noti che il solo se ovvio, perch gli elementi della base locale
sono automaticamente aperti in ).
Fissato V scegliamo f V DK . Come al solito, poich ormai sappiamo
che una base locale a 0 per , esiste W tale che f + W V , e
quindi f + (W DK ) V DK . Daltra parte, il fatto che W appartenga
a signica che W DK un aperto della topologia K di DK . Allora, per
ogni suo punto f , linsieme V DK contiene un intorno aperto (in K ) di f .
Quindi V DK un aperto di K : questo prova (3.44) e quindi la parte (ii).
Osserviamo anche che (3.44) implica che la topologia relativa ereditata
da DK per restrizione della topologia di D() contenuta in K . Quindi,
per provare la parte (iii), basta ora mostrare che ogni aperto in E K la
restrizione a DK di qualche aperto di V . La topologia K indotta dalle
norme sn , una cui base locale a 0 consiste delle palle
Bn,K (r) = {f DK : sn (f ) < r}

(3.45)

(Nota 3.17.2), e quindi, per ogni f E, esistono n intero e r > 0 tali che
f + Bn,K (r) = {g DK : sn (g f ) < r} E .

(3.46)

Ora consideriamo la palla analoga in D(), ossia Bn (r) = {h D() :


sn (h) < r}. Naturalmente,
Bn,K (r) = Bn (r) DK .

(3.47)

chiaro che (f + Bn (r)) DK = f + (Bn (r) DK ) = f + Bn,K (r) E.


Allora poniamo
V := f E (f + Bn (r)) ,
e concludiamo che V appartiene a , perch unione di traslati di aperti in
, visto che le palle Bn (r) appartengono a (Nota 3.18.10), ed inoltre, per
(3.47) e (3.46), V DK = f E (f + Bn,K (r)) = E. Questo conclude la
dimostrazione della parte (iii), e del teorema.

3.18. ESEMPI DI SPAZI DI FRCHET

417

Corollario 3.18.13. Se E un insieme limitato in D(), allora E DK


per qualche compatto K , e E limitato in DK : in particolare, tutte le
norme sn sono limitate su E, ossia esistono costanti mn tali che, per ogni
n N e f E, si ha sn (f ) 6 mn .
Nota 3.18.14. A scanso di equivoci, mettiamo in guardia il lettore sul fatto che
vedremo in seguito (Corollario 3.20.6) che DK e D() non sono localmente
limitati, e quindi non contengono aperti limitati! Questi spazi contengono
molti insiemi limitati, appunto quelli su cui tutte le seminorme sono limitate,
ma questi insiemi non sono aperti. Si riveda la Nota 3.17.8.

Dimostrazione del Corollario 3.18.13. Sia E un sottoinsieme di D() che


non contenuto DK per alcun compatto K . Questo vuol dire che esiste
una successione fn D() i cui supporti non sono contenuti in un unico
compatto, ossia tali che fn (xn ) 6= 0 per qualche successione xn E che
tende allinnito (ossia che ha solo un numero nito di elementi in ciascun
compatto K). Allora poniamo
V := {f D() : |f (xn )| <

1
|fn (xn )|
n

per ogni n N} .

Consideriamo V DK . Il compatto K contiene solo un numero nito di


punti x1 , . . . , xn(K) della successione {xn }: quindi, ponendo per semplicit
rj = 1j |fj (xj )| per j = 1, . . . , n(K), vediamo che f (xn ) = 0 per n > n(K),
e quindi la condizione |f (xn )| < n1 |fn (xn )| non impone alcuna restrizione
a f DK , ma che ogni f V DK verica sj (f ) < rj per j < n(K),
ossia V DK 16j6n(K) B0,K (rj ) (notazione come in (3.45). Poich le
palle B0,K (rj ) appartengono alla topologia K indotta dalle norme sn , questo
signica che V DK K , ossia (in base alla Denizione 3.18.9) che V ,
e precisamente V un intorno di 0 nella topologia . Ma per il modo in cui
abbiamo denito V , per nessun intero n si ha che fn nV : siccome le fn
appartengono a E, questo vuol dire che E illimitato (si riveda la denizione
di insieme limitato nella Denizione 3.1.1).
Pertanto, se E limitato in D(), esiste un compatto K tale che
E DK . Ma allora, per la parte (iii) del precedente Teorema 3.18.12, E
limitato in DK , ed allora, per la Proposizione 3.17.7, esistono costanti mn
tali che supf E sn (f ) = mn . (Si noti che questa Proposizione si applica a
DK ma non direttamente a D(), perch la topologia del limite induttivo
spazio non indotta da una famiglia separatrice di seminorme.)

418CAPITOLO 3. SPAZI VETT. TOPOLOGICI, ANALISI FUNZIONALE


Teorema 3.18.15. (i) Se {fj } una successione di Cauchy in D(), allora {fj } DK per qualche compatto K , e {fj } una successione
di Cauchy in DK (nella topologia K ). In altre parole, per ogni intero
n si ha sn (fi fj )to0 per i, j : ossia, tutte le fn hanno supporto
in un unico compatto, e tutte le derivate delle fj (di qualsiasi ordine
Nk ) convergono uniformemente a 0 per j .
(ii) Lo spazio D() (con la topologia di limite induttivo ) uno spazio
completo, e quindi di Frchet (Definizione 3.1.1).
Dimostrazione. In base al Lemma 3.1.14, ogni successione di Cauchy un
insieme limitato. Pertanto, per il precedente Corollario 3.18.13, lintera successione giace in un sottospazio DK . Per la parte (iii) del Teorema 3.18.12, la
restrizione di tau al sottospazio DK precisamente la topologia K : quindi la
successione di Cauchy nella topologia K . Questo prova la parte (i). Poich
DK completo (nella sua topologia K ), ogni successione di Cauchy per K
converge, e quindi, grazie alla parte (i), anche D() completo. Poich abbiamo visto che D() localmente convesso (parte (i) del Teorema 3.18.12),
ne segue che D() uno spazio di Frchet.

Teorema 3.18.16. Sia F un funzionale lineare su D(), o pi in generale


una applicazione lineare di D() su uno spazio X localmente convesso. Allora
le seguenti propriet sono equivalenti:
(i) F continuo.
(ii) F limitato (nel senso della Definizione 3.3.1, ossia manda insiemi
limitati in insiemi limitati).
(iii) La restrizione di F ad ogni sottospazio DK continua su DK (ossia
nella topologia K di DK ).
Dimostrazione. Dimostriamo anzitutto che (i) e (iii) sono equivalenti.
chiaro che (i) implica (iii), perch la topologia K di DK la topologia relativa indotta da D() (ottenuta da per restrizione a (ovvero intersezione
con) DK ). Viceversa, ora proviamo che, se la restrizione di F a tutti i DK
K -continua, allora F -continua. Sia U un intorno di 0 in X (che senza
perdita di generalit possiamo scegliere convesso e stellato grazie al Lemma
3.1.8) e V := F 1 (U): dobbiamo provare che V aperto in D() (ossia che

3.18. ESEMPI DI SPAZI DI FRCHET

419

appartiene a ). Ma chiaramente V = F 1 (U) anchesso convesso e stellato, ed in base alla parte (ii) del Teorema 3.18.12 un tale V in se e solo se
in , ossia V DK K (questa la Denizione 3.18.9 di ). Ma questo
vero se la restrizione di F a DK K -continua. Abbiamo provato che (i) e
(iii) sono equivalenti.
Abbiamo gi dimostrato nella prima parte della Proposizione 3.3.4 che (i)
implica (ii). Purtroppo, il viceversa non segue da quella Proposizione, perch
non abbiamo dimostrato che D() sia metrizzabile, ed in eetti vedremo che
non lo (Teorema 3.18.21). (invece, lequivalenza di (i) e (ii) sarebbe conseguenza di quella Proposizione se stessimo considerando applicazioni lineari
sui sottospazi DK , che sono metrizzabili in base al Teorema 3.17.6 perche la
loro topologia K indotta da una famiglia separatrice di seminorme).
Assumiamo (ii): F limitato. Evidentemente, allora, la restrizione di F ai
sottospazi DK per ogni compatto K anchessa limitata. Poich DK
metrizzabile, questa restrizione continua su DK (naturalmente rispetto a
K , che la topologia indotta da per restrizione), in base alla seconda parte
della prima parte della Proposizione 3.3.4. Questo mostra che (ii) implica
(iii) e completa la dimostrazione dellenunciato.

Corollario 3.18.17. Per ogni multi-indice , loperatore di derivata D


manda D() in D() ed continuo.
Dimostrazione. Che D mandi D() in s ovvio dalla denizione di D();
lo stesso vero per DK . Il fatto che sia continuo segue dallequivalenza fra
(i) e (iii) nel precedente Teorema 3.18.16, visto che le norme sn introdotte
in (3.40) vericano sn (D f ) 6 sn+ (f ), e pertanto la restrizione di D a DK
continua su DK (la cui topologia indotta dalle norme sn , come abbiamo
visto nella Nota 3.18.3).

Corollario 3.18.18. Un funzionale lineare F su D() continuo se e solo


se, per ogni compatto K , esistono un intero n = n(K) ed una costante
C = C(K) tali che, per ogni f D(), la norma sn definita in (3.40) verifica
la disuguaglianza |F (f )| 6 Csn (f ).
Dimostrazione. Questa esattamente lequivalenza fra le propriet (i) e (iii)
del Teorema 3.18.16.

Notazione 3.18.19. Un funzionale continuo su D() si chiama una distribuzione. Le distribuzioni verranno studiate succintamente, ma comunque in

420CAPITOLO 3. SPAZI VETT. TOPOLOGICI, ANALISI FUNZIONALE


maggior dettaglio, nella Sezione 11.17.
Rideniamo, per ogni compatto K, lindice n nel precedente Corollario 3.18.18
in modo che n(K) sia il pi piccolo indice per cui vale la disuguaglianza di
quellenunciato. Allora, se n(K) si pu scegliere indipendente dal compatto
K, ossia se n(K) limitato al variare del compatto K , allora il minimo
tale n si chiama lordine della distribuzione F .
Esempio 3.18.20. Per ogni x , deniamo x (f ) = f (x). ovvio che x
un funzionale lineare, ed continuo su D() in base al Corollario 3.18.18,
perch |x (f )| = |f (x)| 6 kf k = s0 (f ) (in eetti, da questo vediamo che
x una distribuzione di ordine 0). Questo funzionale continuo si chiama la
distribuzione delta di Dirac.

Abbiamo inizialmente introdotto su D() la famiglia di norme sn che


descrivono la topologia di DK per K compatto (equivalenti alle seminorme
pn con cui abbiamo topologizzato C (): si riveda la Nota 3.18.3). In quella
topologia D() metrizzabile (Teorema 3.17.6), ma abbiamo visto che non
completo (Proposizione 3.18.8). Per renderlo completo, abbiamo cambiato
topologia: lo abbiamo munito della topologia di limite induttivo indotta da
tutti i sottospazi (metrizzabili!) DK con K compatto in . Con questa
topologia D() completo (Teorema 3.18.15). Ora vedremo che purtroppo,
per, non metrizzabile. In particolare, non normabile, perch altrimenti
la norma denirebbe una metrica che indurrebbe una topologia equivalente.
Nella Sezione 3.20 dimostreremo, in modo indipendente e forse pi semplice,
che D() non normabile: qui utilizziamo un teorema di base dellAnalisi
Funzionale per mostrare il risultato pi generale che non metrizzabile.
Teorema 3.18.21. Lo spazio D(), con la topologia di limite induttivo ,
non metrizzabile.
Dimostrazione. Il nucleo della distribuzione x dellEsempio 3.18.20 consiste
delle funzioni in D() che si annullano al punto x. Abbiamo visto in quellEsempio che x un funzionale continuo, e quindi il supo nucleo chiuso
in base alla Proposizione 3.3.14. Allora il sottospazio DK , che consiste delle
funzioni nulle fuori di K, e quindi lintersezione di questi nuclei al variare
di x nel complemento di K, un sottospazio chiuso perch intersezione di
chiusi. Ma siccome DK un sottospazio proprio, esso non pu contenere un
intorno aperto dellorigine della topologia di D() (altrimenti, in base al
Lemma 3.1.13, coinciderebbe con tutto D()). Per linvarianza per traslazione della topologia di spazio vettoriale topologico (Denizione 3.1.1), DK

3.19.

PROPRIET DI HEINEBOREL

421

non contiene alcun aperto di , ovvero ha interno vuoto in D(). Invadiamo


con una famiglia numerabile di sottoinsiemi compatti Kn , ossia scegliamo

Kn in modo che =
n=1 Kn : allora D() = n=1 DKn unione numerabile
di sottoinsiemi con interno vuoto, e quindi di prima categoria in s stesso
(Denizione ??): allora, poich completo (Teorema 3.18.15), non pu essere
metrizzabile in base al Teorema di Categoria di Baire 3.13.1.

3.19

Spazi vettoriali localmente compatti e propriet di HeineBorel

Richiamiamo la nozione di sottoinsieme limitato A di uno spazio vettoriale


topologico V , introdotta nella Denizione 3.1.1: A limitato se per ogni
intorno U di 0 in V esiste r = rA,U > 0 tale che A U per tutte le
dilatazioni con || > r.
Proposizione 3.19.1. In uno spazio vettoriale topologico, un insieme compatto limitato e chiuso.

Dimostrazione. Sia X uno spazio vettoriale topologico e K X un compatto.


Poich la topologia di uno spazio vettoriale topologico di Hausdor, il fatto
che K sia chiuso segue dalla seconda met del Lemma 1.10.6.
Proviamo che K un insieme limitato. Sappiamo dal Lemma 3.1.13 che,
se U un intorno di 0, allora
X = nN nU .

(3.48)

Dunque anche vero che K nN nJ per ogni intorno stellato J di 0


contenuto in U (un tale intorno esiste in base al precedente Lemma 3.1.8).
Dal ricoprimento {nJ} del compatto K estraiamo un sottoricoprimento nito
{n1 J, n2 J, . . . , nm J}, e per comodit supponiamo di ordinare gli indici in
modo che nm sia lindice massimo. Poich J stellato abbiamo nm J nk J
per k = 1, . . . , m 1: quindi K nm J, ed allora, per ogni t > nm , si ha
K nm J tJ tU. Questo dimostra che K limitato.

Ora ci serve un lemma tecnico:

Lemma 3.19.2. Sia X uno spazio vettoriale topologico e Y un sottospazio


localmente compatto nella topologia relativa ereditata da X: quindi esiste un

422CAPITOLO 3. SPAZI VETT. TOPOLOGICI, ANALISI FUNZIONALE


intorno dellorigine in Y a chiusura compatta K Y , ovvero un intorno
dellorigine U in X tale che U Y K. Esiste un intorno V dellorigine in
X simmetrico (ossia tale che V = V ) e tale che V + V U. Allora, per
ogni x X, linsieme Y (x + V ) compatto in Y .
Dimostrazione. Un intorno V tale che V + V U esiste perch 0 + 0 = 0 e
la somma continua. Grazie al Corollario 3.1.12, possiamo anche supporre
che V + V U, e rimpiazzando V con V (V ) possiamo anche scegliere
V simmetrico. Quindi (V + V ) Y contenuto nel compatto K, pertanto
compatto per la prima parte del Lemma 1.10.6. Ma allora, per x X,
scriviamo Ex,V := Y (x + V ). Per ogni y, z Ex,V si ha, da un lato,
y z = y x + x z V + V U, e daltro lato y z Y perch Y uno
sottospazio. Quindi y z Y U K. Ma allora ogni y Ex,V appartiene
al compatto z + K, ossia Ex,V z + K compatto. Daltra parte Ex,V chiuso
in Y nella topologia relativa indotta su Y da X, perch lintersezione di Y
con un chiuso x + V di X. Allora Ex,V un chiuso in Y contenuto in un
compatto, e quindi compatto per la prima parte del Lemma 1.10.6.

Lemma 3.19.3. Sia X uno spazio vettoriale topologico e Y un sottospazio


localmente compatto (nella topologia relativa ereditata da X). Allora Y
chiuso in X.
Dimostrazione. Poich Y localmente compatto, esiste un compatto K Y
il cui interno contiene 0 (qui le propriet topologiche di compattezza ed interno si intendono nella topologia relativa di Y ereditata da X). Ci signica
che esiste un intorno dellorigine U X tale che U Y = K. In corrispondenza di questo aperto U scegliamo un intorno aperto V di 0 in X come nel
precedente Lemma 3.19.2, e consideriamo la famiglia F di tutti i suoi sottoinsiemi aperti che contengono 0. Fissiamo un punto qualsiasi nella chiusura
Y . Se W F consideriamo linsieme Ex,W := Y (x + W ): esso compatto per la prima parte del lemma 1.10.6, perch un sottoinsieme chiuso di
Y (x + V ) che compatto per il sopraccitato Lemma 3.19.2; inoltre non
vuoto, perch x Y e quindi x+W interseca Y per ogni intorno aperto W di
0. Evidentemente, le intersezioni nite di insiemi in F appartengono ancora
a F . Allora la famiglia {Ex,W : W F } una famiglia di compatti con la
propriet dellintersezione nita (Nota 1.9.7): pertanto esiste z W F Ex,W .
Poich tutti gli Ex,W sono sottoinsiemi di Y , anche z appartiene a Y . Daltra
parte z x + W per ogni W F , e quindi i punti x e z non sono separabili

3.19.

PROPRIET DI HEINEBOREL

423

con due intorni disgiunti: dal momento che la topologia di X di Hausdor


(Lemma 3.1.11), ne segue z = x. Pertanto Y = Y .

Proposizione 3.19.4. Sia X uno spazio vettoriale topologico e V un sottospazio di dimensione finita. Allora V chiuso in X.
Dimostrazione. In base al precedente Lemma 3.19.3, suciente dimostrare che Y localmente compatto (nella topologia relativa). Pi in generale,
costruiamo un isomorsmo fra Y e Cn che un omeomorsmo (ossia continuo con inversa continua), ed allora Y deve essere localmente compatto nella
topologia relativa perch Cn lo nella propria topologia. In eetti, ci che
stiamo per dimostrare che ogni isomorsmo un omeomorsmo.
n
Scegliamo una base {v1 , . . . , vP
n } in V , e consideriamo la mappa T : C V
denita da F (1 , . . . , n ) = nj=1 j vj : si osservi che limmagine di T V .
Poich in uno spazio vettoriale topologico la moltiplicazione per scalari e la
somma sono mappe continue, anche T continuo, ed inoltre iniettivo perch
{v1 , . . . , vn } una base. Basta provare che loperatore inverso T 1 : V Cn
anchesso continuo, perch in tal caso gli spazi topologici Cn e V (questultimo nella topologia relativa indotta da X) sono omeomor, e quindi V deve
essere chiuso perch lo Cn . Dimostriamo questo fatto per induzione su n.
Per n = 1, T 1 esiste perch T iniettivo, ed un funzionale lineare iniettivo
denito su V , quindi ha nucleo {0}. Il nucleo chiuso (nella topologia relativa di V ) e quindi T 1 continuo in base alla Proposizione 3.3.14. Pertanto,
in questo caso, T un omeomorsmo.
Fissiamo n > 1 e supponiamo, per induzione, che lenunciato valga per n 1,
ossia che la restrizione di T a sottospazi di dimensione n 1 sia un omeomorsmo. Poich {v1 , . . . , vn } P
una base di V , ogni vettore v V si esprime
n
in modo unico come v =
i=1 i vi , dove la coordinata i = i (v) un
funzionale lineare su V , non nullo: quindi il nucleo Ni di questo funzionale
lineare un sottospazio di V di dimensione n 1. Per lipotesi di induzione, per ogni i sappiamo che Ni chiuso nella topologia di V (la topologia
relativa indotta da X) e quindi il funzionale i continuo su Y . Ma allora
T (v) = (1 (v), . . . , n (v)) anchesso un operatore continuo.

Teorema 3.19.5. Ogni spazio vettoriale localmente compatto ha dimensione finita (e naturalmente, grazie alla dimostrazione del precedente Lemma
3.19.4, tutti gli spazi vettoriali a dimensione finita sono localmente compatti).

424CAPITOLO 3. SPAZI VETT. TOPOLOGICI, ANALISI FUNZIONALE


Dimostrazione. Sia X uno spazio vettoriale topologico localmente compatto: allora esiste un intorno V dellorigine a chiusura compatta (Denizione
3.1.1); sostituendo V con V (V ) possiamo assumere che V sia un intorno
simmetrico: V = V . Applichiamo allora due risultati precedenti: la Proposizione 3.19.1, in base alla quale sappiamo che V limitato, e la Proposizione
3.2.1, che asserisce che esiste una base numerabile allorigine fatta di dilatati
di V , ad esempio gli intorni Vn = 2n V . I traslati {x + 12 V : x X costituiscono una famiglia di aperti che copre X, e quindi anche V : questultimo
insieme compatto, e quindi per ricoprirlo basta una sottofamiglia nita
{xi + 21 V : i = 1, . . . , k}. Lo spazio vettoriale Y generato da x1 , . . . , xk ha
dimensione minore o uguale a k e quindi chiuso in X in base alla precedente
Proposizione 3.19.4. Visto che V V ki= (xi + 12 V ) Y + 12 V (perch
xi Y per il modo in cui abbiamo denito Y ), dividendo per due otteniamo
1
V Y + 14 V (rammentiamo che Y uno spazio vettoriale e quindi inva2
riante per moltiplicazione scalare: 12 Y = Y ; fra un attimo useremo anche che
invariante per somma, ossia Y + Y = Y ). Allora
1
1
1
V Y + V Y +Y + V =Y + V
2
4
4
ed iterando
n
V
V ) =
n=1 (Y + 2
n=1 (Y + Vn .

Se A X, la chiusura di A denita come linsieme degli x X tali che


x + U interseca A per ogni intorno U di 0, o equivalentemente per ogni
intorno in una base locale a 0 (indichiamola con F ). Se questi intorni di
base si scelgono simmetrici, questo equivale a dire che x A se e solo se
x {A + V : V F }. Gli intorni Vn formano appunto una tale base,
come visto sopra: quindi abbiamo provato che V Y . Ma allora V Y ,
perch Y un sottospazio chiuso. Dilatando ora vediamo che nV Y per
ogni n > 1. In base allidentit (3.48) nella dimostrazione della Proposizione
3.19.1, questo implica X = Y . Ma Y ha dimensione nita, e questo completa
la dimostrazione.

3.19.1

Propriet di HeineBorel

Definizione 3.19.6. (Propriet di HeineBorel.) Uno spazio topologico


verica la propriet di HeineBorel se ogni sottoinsieme limitato e chiuso
compatto

3.19.

PROPRIET DI HEINEBOREL

425

In particolare, se uno spazio vettoriale topologico verica la propriet di


HeineBorel, i suoi compatti sono tutti e soli gli insiemi limitati e chiusi, in
base alla Proposizione 3.19.1.
Teorema 3.19.7. Ogni spazio vettoriale localmente limitato che verifica la
propriet di HeineBorel di dimensione finita.
Dimostrazione. Sia X uno spazio vettoriale localmente limitato: X contiene
quindi un intorno limitato V dellorigine (Denizione 3.1.1). Asseriamo che
anche la sua chiusura V un insieme limitato. Infatti, sia U un intorno
limitato dellorigine: allora, grazie al Corollario 3.1.12, esiste un altro intorno
J dellorigine con J U. Poich V E limitato, per qualche r > 0 deve valere
V rJ, ma allora vale anche V rJ rU, e quindi anche V limitato:
questo prova lasserzione.
Poich si assume che X soddis la propriet di HeineBorel, V compatto:
ma questo signica che X uno spazio vettoriale localmente compatto, ed
allora X ha dimensione nita in base al precedente Teorema 3.19.5.

Corollario 3.19.8. Uno spazio normabile di dimensione infinita non soddisfa la propriet di HeineBorel.
Dimostrazione. Uno spazio normabile localmente limitato (Teorema 3.2.11),
e quindi, se ha dimensione innita, non pu vericare la propriet di Heine
Borel a causa del precedente Teorema 3.19.7).

Esempio 3.19.9. Consideriamo la palla unitaria B1 nello spazio normato


Lp (R). Naturalmente, la palla unitaria in uno spazio normato come Lp (R)
chiusa, perch la norma una funzione continua; inoltre limitata, per
lovvio argomento esposto nelle prime righe della dimostrazione del Teorema
3.2.11. Dal precedente Corollario 3.19.8 sappiamo che Lp (R) non soddisfa la
propriet di HeineBorel, e ad esempio di questo fatto osserviamo che la palla unitaria B1 limitata e chiusa, non compatta. Infatti, consideriamo una
successione di funzioni fn p di norma 1 ed a supporti disgiunti (ad esempio, potremmo scegliere fn come la funzione caratteristica n dellintervallo
[n, n + 1]). Allora il limite puntuale f (x) esiste per ogni x e vale identicamente zero, a causa della disgiunzione dei supporti (esercizio). Se esistesse
il limite nella norma di Lp , allora fn (x) dovrebbe convergere a f (x) = 0 per
quasi ogni x, e quindi, per la continuit della norma, limn kfn kp = kf kp = 0.
Ma ci non accade perch kfn kp 1.

426CAPITOLO 3. SPAZI VETT. TOPOLOGICI, ANALISI FUNZIONALE


In particolare questo fatto vale per L (R), e quindi per i suoi sottospazi
chiusi C L (R) e C0 (R), muniti della norma uniforme.
Un caso particolarmente interessante quello di L2 (R), dove la norma inR
d dx, nel senso che kf k2 =
dotta dal prodotto scalare (f, g)2 := R f (x) g(x)
2
(f, f )2 . Allora, consideriamo un sistema ortonormale numerabile {fn } (ossia
tale che (fn , fm )2= 0 se n 6= m e 1 se n = m. Allora per n 6= m la distanza
fra fn e fm vale 2 (per il teorema di Pitagora nello spazio bidimensionale
generato da fn e fm , od equivalentemente perch
p
p
dist(fn , fm ) = kfn fm k2 = (fn fm , fn fm ) = (fn , fn ) + (fm , fm )

= 2.
Quindi nessuna sottosuccessione di {fn } pu essere di Cauchy (la sua variazione non tende a zero), e pertanto non pu convergere.

3.20
3.20.1

Esempi esotici: spazi non localmente limitati


C () non localmente limitato

Abbiamo appena visto che lo spazio normato C0 () e tutti gli altri spazi
normati a dimensione innita non soddisfano la propriet di HeineBorel
(Esempio 3.19.9). Completamente diverso pu essere il caso di uno spazio
metrico la cui topologia indotta da una famiglia separatrice di seminorme:
Teorema 3.20.1. C () soddisfa la propriet di HeineBorel della Definizione 3.19.6.
Dimostrazione. Sia J C () un sottoinsieme limitato e chiuso: dobbiamo
mostrare che E compatto. Poich la topologia di C () indotta dalla
famiglia separatrice di seminorme pn introdotte in (3.38), C () uno spazio
metrico per il Teorema 3.17.6, ed completo per il Teorema 3.18.4. Pertanto,
in base al Teorema 1.11.1, J compatto se e solo se ogni successione in J ha
una sottosuccessione convergente.
Usiamo lipotesi che J sia un insieme limitato, il che, per la Proposizione
3.17.7, equivale a dire che tutte le seminorme pn sono limitate su J. Vista la
denizione delle seminorme pn , questo signica che, per opportune costanti

3.20.

ESEMPI ESOTICI: SPAZI NON LOCALMENTE LIMITATI

427

Cn , ogni elemento f J verica |D (f )(x)| 6 Cn per ogni || 6 n e per


ogni x nella palla Bn
mathRk di centro lorigine e raggio n. Ma se le derivate di ordine n sono
limitate, allora lo il gradiente delle derivate di ordine n 1, e pertanto,
per il teorema di Lagrange (Sezione 1.1), tutte le derivate di ordine n 1
(ed iterando largomento anche tutte quelle di ordine minore o uguale a
n 1) sono lipschitziane (nel senso di (1.28.2)) con la stessa costante di
Lipschitz Cn indipendente da f , e quindi equicontinue (Denizione 1.12.1)
su Bn . Poich ogni sottoinsieme compatto K contenuto in Bn
se n abbastanza grande, il Teorema di AscoliArzel 1.12.3 implica che
ogni successione di funzioni in J ha una sottosuccessione {fj }che converge
uniformemente sui compatti con tutte le sue derivate D fj per ogni multiindice . Perci {fj } converge nella topologia di C () ad una funzione f
tale che
pn (f ) := sup{|D f (x)| : x Bn , || 6 n} = lim pn (fj ) .
j

Questo implica che f appartiene a J, di nuove per la Proposizione 3.17.7.


Abbiamo dimostrato che J compatto.

Corollario 3.20.2. C () non localmente limitato, ed in particolare la


sua topologia non proviene da una norma.
Dimostrazione. La topologia di C () proviene da una famiglia separatrice
di seminorme, e quindi metrizzabile per il Teorema 3.17.6, e localmente
convessa per il Teorema 3.17.6. Allora il precedente Teorema 3.20.1, il fatto
che C () ha dimensione innita (contiene lo spazio di tutti i polinomi!) ed
il Teorema 3.19.7 implicano che C () non pu essere localmente limitato.
Inoltre, dalla condizione equivalente alla normabilit del Teorema 3.2.11, ora
segue che C () non pu essere normabile.

Corollario 3.20.3. Per ogni compatto K , lo spazio DK soddisfa la


propriet di HeineBorel.
Dimostrazione. Questo segue immediatamente dallo stesso argomento della
dimostrazione del precedente Corollario 3.20.2 e dal fatto che DK chiuso in C () (Corollario 3.18.7) e la sua topologia indotta dalle stesse
seminorme).

428CAPITOLO 3. SPAZI VETT. TOPOLOGICI, ANALISI FUNZIONALE


Largomento della dimostrazione del Corollario 3.20.2 non si applica direttamente allo spazio D(), perch la topologia di limite induttivo di
D() non indotta direttamente da una famiglia di seminorme (Denizione
3.18.13). Ma proprio qui che si apprezzano le conseguenze della propriet di compatibilit per restrizione della topologia ((3.44) e parte (iii) del
Teorema 3.18.12:
Corollario 3.20.4. Lo spazio D() soddisfa la propriet di HeineBorel.
Dimostrazione. Grazie al Corollario 3.18.13, ogni insieme J limitato in D()
contenuto in DK per qualche compatto K , ed allora, in base alla
parte (iii) del Teorema 3.18.12, J limitato nella topologia K di DK che ivi
coincide con la topologia di D(). Quindi J compatto (in questa topologia
K ) grazie alla dimostrazione del Corollario ??: ma allora compatto in ,
di nuovo perch e K coincidono sul sottospazio DK .

Proposizione 3.20.5. La classe di Schwartz S() soddisfa la propriet di


HeineBorel.
Dimostrazione. Vogliamo sapplicare lo stesso argomento che dimostra il Teorema 3.20.1. Lunica dicolt consiste nel provare che, se le seminorme pk,n
della Nota 3.18.5 sono equilimitate su un insieme J S, allora le funzioni
f J sono equicontinue. A questo ne conviene utilizzare le seminorme
equivalenti r2k,n (f ) = supxRm ,||=n (1 + x2k ) |D f (x)| introdotte in quella
Nota, che sono C . Meglio ancora, usiamo al posto di queste seminorme le
equivalenti monotne ad un solo indice denite da
hn (f ) =

sup

(1 + x2k ) |D f (x)|

xRm ,||6n k6n

(esattamente come abbiamo fatto nel passare da (3.37) a (3.38)).


Si tratta di dimostrare che le funzioni f S tali che hn (f ) < Cn sono equicontinue. Come nella dimostrazione del Teorema 3.20.1, basta dimostrare
che, se (1 + x2k )|D f | 6 Cn1 per ||, k 6 n 1, allora anche le derivate
di (1 + x2k )D f sono equilimitate. Si noti che qui che comodo utilizzare
seminorme in forma C .
Ma le derivate di (1 + x2k )D f sono somme del tipo (1 + x2k1 )D f +
(1 + x2k )D f con |beta| = n. Pertanto, se hn (f ) 6 Cn , queste somme si
maggiorano con 2Cn e quindi sono equilimitate.

3.21.

ESEMPI ESOTICI: SPAZI NON LOCALMENTE CONVESSI 429

Corollario 3.20.6. Gli spazi DK per K compatto, D() e S() non


sono localmente limitati, ed in particolare la loro topologia non proviene da
una norma.
Dimostrazione. la dimostrazione identica a quella del Corollario 3.20.2 pur
di dimostrare che questi spazi hanno dimensione innita. Daltra parte, possiamo sempre trovare, in ogni compatto K di misura positiva, una famiglia
di sottoinsiemi compatti Kn di misura positiva, perch la misura di Lebesgue regolare ( Denizione 1.9.11). Allora il lemma di partizione dellunit
(Corollario 1.10.16) assicura lesistenza di funzioni fn C con supporto in
Kn (e quindi in DK D() S()). Poich i supporti sono disgiunti, la
famiglia di funzioni fn linearmente indipendente.

3.21
3.21.1

Esempi esotici: spazi non localmente convessi


Spazi Lp [0, 1] e Lp(R) per 0 < p < 1

Gli elementi di Lp [0, 1] sono le (classi di equivalenza di Lebesgue delle)


funzioni misurabili secondo Lebesgue su [0, 1] tali che
Z 1
p
Np (f ) :=
|f |p < .
(3.49)
0

Per 0 < p < 1 sappiamo dal Lemma 1.7.5 che (a + b)p 6 ap + bp . Quindi,
ponendo
d(f, g) := Npp (f g) ,
(3.50)
otteniamo una funzione non negativa su Lp che verica la disuguaglianza
triangolare e tale che d(f h, g h) = d(f, g) per ogni f, g, h: ossia, una
metrica invariante per traslazione. Sappiamo che, per 0 < p < 1, Np non
da una norma (parte (ii) dellEsercizio 1.16.18), ma che nella metrica d lo
spazio Lp completo per tutti i p > 0 (Nota 1.16.27).

Nota 3.21.1. (Gli spazi Lp sono completi e localmente limitati.) Per


r > 0, consideriamo le palle aperte intorno allorigine, Br := {f Lp :
Npp (f ) < r}. chiaro che queste palle formano una base locale allorigine per
la topologia di Lp (le basi locali sono denite alla ne della Denizione 1.10.1).

430CAPITOLO 3. SPAZI VETT. TOPOLOGICI, ANALISI FUNZIONALE


anche immediato che questa base consiste di insiemi limitati (nel senso
della Denizione 3.1.1), perch queste palle sono dilatate luna dellaltra: ad
esempio, B1 = r 1/p Br per ogni r > 0, e quindi B1 limitato, ed analogamente
lo sono tutti i Br . Quindi, per tutti i p > 0, gli spazi Lp sono completi e
localmente limitati, nel senso della Denizione 3.1.1 (per p > 1 questo era
gi ovvio, perch gli spazi normati sono evidentemente localmente limitati).
Si noti che lo stesso argomento vale per Lp (R) ed anche per Lp () rispetto
ad una qualsiasi misura di Borel, ad esempio per gli spazi di successioni p
introdotti nella Denizione 1.7.1.

Il prossimo enunciato prova una conseguenza interessante, che equivale


ad asserire che Lp , per p < 1, non localmente convesso, come gi sappiamo
(le palle unitarie in questi Lp non sono convesse, perch hanno sezioni bidimensionali non convesse, illustrate nelle Figure della Nota 1.7.10; abbiamo
g alluso a questi fatti nella parte (ii) dellEsercizio 1.16.18 e nellEsercizio
1.7.8). Lequivalenza di queste formulazioni segue subito dal fatto che, se esistesse un aperto convesso intorno, grazie allinvarianza per traslazione della
topologia ne esisterebbe uno che contiene lorigine).
Proposizione 3.21.2. Per 0 < p < 1, gli unici sottoinsiemi aperti convessi
di Lp sono linsieme vuoto e Lp stesso.
Dimostrazione. Sia U un aperto convesso in Lp . Grazie allinvarianza per
traslazione della topologia, senza perdita di generalit possiamo assumere
0 U. Allora U contiene una palla Br per qualche r > 0 opportuno, perch
queste palle formano una base locale per la topologia (si riveda la Denizione
1.10.1). Scegliamo una qualsiasi funzione f Lp , f 6= 0: poich p < 1,
sappiamo che np1 0 per n , e quindi esiste n tale che np1 Npp (f ) < r.
Daltra parte, poich lintegrale indenito di |f | p continuo (Lemma 1.27.2),
esistono x0 = 0 < x1 < x2 < < xn = 1 tali che, per i = 1, . . . , n,
Z xn
1
(3.51)
|f (x)|p dx = Npp (f )
n
xn1
(si noti che la stessa propriet resta vera anche per Lp (R) anzich Lp [0, 1]
pur di prendere x0 = e xn = +). Poniamo gi = 0 fuori dellintervallo
[xi1 , xi ) e gi = nf in tale intervallo. Allora da un lato le funzioni gi sono in
U, dal momento che appartengono a Br U poich Npp (gi ) = np1 Npp (f ) < r;
daltro lato, f la combinazione convessa f = (g1 + +gn )/n. Allora f U
visto che U convesso. Questo prova che U = Lp .

3.21.

ESEMPI ESOTICI: SPAZI NON LOCALMENTE CONVESSI 431

Corollario 3.21.3. Lo stesso risultato della precedente Proposizione 3.21.2


vale per Lp (R), o pi in generale per qualsiasi spazio Lp () rispetto ad una
misura di Borel assolutamente continua rispetto alla misura di Lebesgue.
Dimostrazione. Il caso di Lp (R) chiarito nella osservazione subito dopo
(3.51). Il caso generale di misure senza componenti atomiche analogo (si
vedano in particolare i Teoremi 1.28.15 e 1.28.18).

Esercizio 3.21.4. Il precedente enunciato vale anche per misure senza componente atomica (denite come nellEsempio 3.9.19)? Si riveda la Sottosezione
1.28.2. QUI

Ecco una conseguenza a prima vista sorprendente:


Corollario 3.21.5. Per 0 < p < 1, lunico funzionale lineare continuo di
Lp [0, 1] o Lp (R) a valori in uno spazio localmente convesso V (ad esempio,
V = R o V = C) il funzionale nullo.
Dimostrazione. Sia F : Lp V un funzionale continuo e B una base locale
a 0 per la topologia di V consistente di insiemi convessi. Per ogni U B, la
controimmagine F 1 (U) un aperto di Lp non vuoto (perch F continuo) e
convesso (perch F lineare). Dalla Proposizione 3.21.2 segue F 1 (U) = Lp ,
ovvero F (Lp ) U per ogni intorno di base U. Ma se per qualche f 6= 0 in Lp
si avesse F (f ) 6= 0, allora esisterebbe un intorno U della base locale di V che
non contiene F (f ) (perch lo spazio vettoriale topologico V di Hausdor:
Lemma 3.1.11). Quindi F = 0.

3.21.2

Un compatto numerabile senza punti estremi in


Lp[0, 1] e Lp (R) per 0 < p < 1

Sia M R un intervallo oppure tutto R con la misura di Lebesgue, o pi


in generale uno spazio di misura con misura
. Scegliamo una f Lp ()
R
normalizzata da Npp (f ) = 1 (qui Npp (f ) := |f |p come in (3.49). Abbiamo
visto nella dimostrazione della Proposizione 3.21.2 che f si decompone come
combinazione convessa f = (g1 + + gn )/n, dove gi = n f [xi ,xi+1] , per
opportuni punti xi M scelti in modo tale che Npp (f [xi ,xi+1 ] ) = Npp (f )/n =
1/n , e quindi Npp (gi ) = np1 . Chiamiamo le funzioni gi i frammenti di prima

432CAPITOLO 3. SPAZI VETT. TOPOLOGICI, ANALISI FUNZIONALE


generazione di f , e denotiamoli con gi = f 1i: allora abbiamo Npp (f1i ) = np1 .
Iteriamo la procedura ponendo, per k = 1, . . . , n,
f1k = (f2,1 + + f2,n )/n
con nuovi frammenti (di seconda generazione) a supporti disgiunti e tali che
Npp (f2,m ) = np1 Npp (f1i ) = n2(p1) , e cos via iterativamente. Ogni frammento di una data generazione combinazione convessa di frammenti della
generazione successiva, ed i frammenti g di generazione k risultano normalizzati dalla regola Npp (g) = nk(p1) . Quindi, per 0 < p < 1, i frammenti
di generazione k tendono a zero nella metrica di Lp (denita come in (3.50
). Poich ci sono un numero nito di frammenti di ciascuna generazione,
da questo segue che linsieme Jf costituito da tutti i frammenti di tutte le
generazioni numerabile ed ha 0 come unico punto limite, quindi Jf {0}
compatto, ma nessun punto di Jf estremo (perch ogni frammento
una combinazione convesa di altri frammenti). Ripetendo la costruzione a
partire dalla funzione f si ottiene analogamente un insieme Jf tale che
K := Jf Jf {0} compatto ma non ha punti estremi (la funzione 0 non
pu essere un punto estremo perch combinazione convessa di f e f : ne
la media aritmetica!).
Questo esempio non contraddice il Corollario 3.9.14 perch gli spazi Lp (),
per 0 < p < 1, non sono localmente convessi.

3.21.3

Spazi p per 0 < p < 1

Consideriamo ora gli spazi p di successioni introdotti nella Denizione 1.7.1.


Questo il caso di Lp rispetto ad una misura puramente atomica (il caso
opposto a quello del Corollario 3.21.3). Analogamente a quanto fatto nella
precedente Sottosezione 3.21.1, per x = {xn : n = 0, 1, . . . } p poniamo
Npp (x)

:=

X
n=0

|xn |p .

Come nella Sottosezione 3.21.1, lespressione


d(x, y) := Npp (x y) ,
una metrica invariante per traslazione, ma, per 0 < p < 1, Np non una
norma perch non verica la disuguaglianza triangolare. In particolare, per

3.21.

ESEMPI ESOTICI: SPAZI NON LOCALMENTE CONVESSI 433

0 < p < 1, gli spazi p non sono spazi di Banach e non sono localmente
convessi. Essi sono per spazi metrici completi (Corollario 1.16.30) e spazi
vettoriali topologici localmente limitati (Nota 3.21.1). Per p > 1, invece, gli
spazi p sono spazi di Banach ed il duale di p isometricamente isomorfo a
q con 1/p + 1/q = 1, come si visto nella Sezione 3.12. La dualit data da
hx, yi :=

xn yn

(3.52)

n=0

Nota 3.21.6. Indichiamo con ei il funzionale su p dato da ei (x) = xi (si


osservi che, per p > 1, le successioni ei sono quelle che valgono 1 allindice i
e zero altrove, che chiamiamo successioni canoniche). Poich |xi | 6 Np (x) =
d(x, 0)1/p , i funzionali ei sono continui su p per ogni p > 0.

Proposizione 3.21.7. Per tutti i p (0 < p 6 ), il duale dello spazio


vettoriale topologico p separa i punti di p .
Dimostrazione. Basta osservare che, se x 6= y p , allora per qualche indice
i si deve avere xi 6= yi , e quindi il funzionale lineare ei separa x e y. Daltra
parte, abbiamo osservato nella Nota 3.21.6 che questo funzionale continuo
su p .

Nota 3.21.8. I sottoinsiemi di p dati da {x : xi > t}, per i N e t R


sono aperti convessi in p , ed in base alla dimostrazione della precedente
Proposizione 3.21.7 essi sono sucientemente numerosi da separare i punti
di p , ma (se p < 1) non abbastanza da dare origine ad una base o anche solo
ad una sottobase per la topologia di p (nel senso della Denizione 1.10.1),
visto che per questi p lo spazio p non localmente convesso.

Corollario 3.21.9. Per 0 < p < 1, il duale p di p contenuto nel duale


di e separa i punti di .
Dimostrazione. Abbiamo visto nella Proposizione 1.7.7 che, per x p con
p < 1, si ha kxk 6 kxkp , e quindi x . la propriet di separazione
discende quindi dalla precedente Proposizione 3.21.7.

Proposizione 3.21.10. (Per 0 < p 6 1, il duale di p ) Il duale p


di p coincide con (qui la dualit quella stabilita in (3.52).

434CAPITOLO 3. SPAZI VETT. TOPOLOGICI, ANALISI FUNZIONALE


Dimostrazione. Il caso p = 1 gi noto dalla Sezione 3.12. Assumiamo
p

quindi
P 0 < p < 1. chiaro che, per ogni x e y , la serie hx, yi =
n=0 xn yn converge (criterio del confronto, Sezione 1.1), e dal fatto che
kxkp 6 kxk1 per p < 1 (dimostrazione della Proposizione 1.7.7) abbiamo

X
n=0

|xn yn | 6 max |yn |


n

X
n=0

|xn | max |yn |


n

X
n=0

|xn |p

! p1

ossia |hx, yi| 6 kyk kxkp . Pertanto si immerge nel duale di p , ovvero

p , e limmersione continua.
p
Resta
P da dimostrare che ogni funzionale continuo y su del tipo y(x) =
n=0 xn yn per qualche successione limitata y. Consideriamo le successioni
canoniche ei della Nota 3.21.6, e poniamo yi := y(ei ). Poich y un funzionale continuo e kei kp = 1, i numeri
|yi | sono limitati uniformemente rispetto
P
p
a i, e per ogni x la serie x = i=0 xi ei converge in p , perch le sue code

P
P
p
p 1/p
. Inoltre
i>N xi ei sono maggiorate nella norma di da
i>N |xi |
y(x) =

X
i=0

xi y(ei ) =

xi yi .

i=0

Quindi il funzionale y implementato dalla successione limitata {yi } nel

senso della dualit (3.52).


Teorema 3.21.11. Sia p la topologia debole (Definizione 3.10.3) indotta
su dallo spazio p (0<p<1) visto come sottospazio del preduale di alla
luce della precedente Proposizione 3.21.10). Allora al variare di p le topologie
p sono inequivalenti. Ciononostante, la loro restrizione agli insiemi limitati
in norma in induce su questi insiemi limitati la stessa topologia.
Dimostrazione. Sia 0 < p < 1. In base alla Proposizione 3.21.9, i funzionali
continui su p separano i punti di . Pertanto si applica la Proposizione 3.8.3, e quindi sappiamo che il duale di visto come spazio vettoriale
topologico con la topologia p coincide con p . Poich gli spazi p sono strettamente inclusi uno nellaltro (diventano strettamente pi piccoli al decrescere
di p: Proposizione 1.7.7), ne segue che le topologie p sono inequivalenti (al
decrescere di p, diminuiscono i funzionali continui rispetto a p , e quindi p
strettamente pi debole di q se 0 < p < q < 1).
Daltra parte, se K un insieme limitato in norma in , K contenuto in

3.22. IL TEOREMA DI INTERPOLAZIONE DI RIESZTHORIN

435

un multiplo della sua sfera unitaria, che compatta nella topologia debole
p in base al Teorema di BanachAlaoglu 3.10.7. Rammentiamo che la topologia debole p separa i punti di (Corollario 3.21.9) ed di Hausdor,
come tutte le topologie deboli indotte da una famiglia di funzionali che separano i punti (Esercizio 1.13.7). Allora lultima parte dellenunciato segue
dalla unicit di una topologia compatta e di Hausdor (seconda parte della
Proposizione 1.10.8, o pi precisamente Esercizio 1.10.9).

3.22

Interpolazione di operatori e teorema di


RieszThorin

436CAPITOLO 3. SPAZI VETT. TOPOLOGICI, ANALISI FUNZIONALE

Parte II
Serie e trasformate di Fourier

437

Capitolo 4
Sistemi ortonormali e spazi di
Hilbert
4.1

La migliore approssimazione in spazi con


prodotto interno

Richiamiamo la seguente :
Definizione 4.1.1. Rammentiamo che un prodotto interno (o prodotto scalare) (, ) su uno spazio vettoriale V non degenere se v V verica (v, u) = 0
per ogni u V , allora si abbia necessariamente v = 0. Un caso particolare di
prodotti interni non degeneri dato dai prodotti interni definiti positivi, cio
tali che (v, v) > 0 per ogni v H e (v, v) =P0 se e solo se v = 0. Il prodotto
scalare euclideo in Cn , denito da (v, u) = ni=1 vi ui , non degenere.

Sia V uno spazio vettoriale munito di un prodotto interno denito positivo, e sia H un sottospazio a dimensione nita (quindi necessariamente chiuso)
di V . Aermiamo che per ogni vettore v V esiste un vettore w = PH (v) in
H tale che la distanza kv wk la minima possibile. Questo fatto si prova
nel modo seguente. Anzitutto la distanza una funzione continua (vedi Nota
4.1.2 in seguito). Inoltre i suoi valori pi piccoli si trovano entro una sfera
chiusa S; basta prendere un qualsiasi punto h in H e scegliere come raggio
della sfera la distanza r = kv hk: i punti di H fuori di questa sfera non
ci interessano perch distano da v pi di h. Quindi i valori pi piccoli della
distanza da H a v si ottengono per punti di H che si trovano nellinsieme
limitato e chiuso S H. Ora, in un insieme limitato e chiuso in uno spazio a
439

440

CAPITOLO 4. SPAZI DI HILBERT

dimensione nita, la distanza, essendo una funzione continua (come mopstrato nella prossima Nota 4.1.2), ha minimo (Teorema di Weierstrass, Sezione
1.1).
Nota 4.1.2. Perch la distanza kv wk continua rispetto a w (e a v)?
Perch, se w, w0 H e v V , allora
|kv wk kv w0 k| 6 kv w (v w0 )k = kw w0 k
grazie alla disuguaglianza triangolare delle norme, e quindi
kv wk kv w0 k
se w w0 (cio se kw w0 k 0).

Esercizio 4.1.3. Il prodotto scalare continuo rispetto a ciascuna variabile.

Fissiamo in H un sistema ortonormale {en , n = 1, 2, . . . }. Vogliamo trovare le coordinate di PH (v) rispetto a questo sistema ortonormale.
Teorema 4.1.4. (Teorema di migliore approssimazione).
Sia H un sottospazio chiuso di V , N N e 1 , . . . , N C. Definiamo


N


X


H
EN (v) = min v
j ej
1 ,...,N C

j=1

(la distanza minima da v a punti del sottospazio di H generato dai vettori


{e1 , . . . , eN }). Allora
2
H
EN
(v)

= kvk

N
X

(v, ej )2

j=1

Nota 4.1.5. Per spazi di dimensione nita questo il Teorema di Pitagora:


si veda la Figura 4.1
In generale, anche a dimensione innita, lespressione della distanza euclidea, come somma o serie di quadrati, porta ad un nome dierente per il
teorema di migliore approssimazione 4.1.4, che in quasi tutti i testi applicativi
si chiama teorema dei minimi quadrati.

4.1. TEOREMA DI MIGLIORE APPROSSIMAZIONE

441

Figura 4.1: Migliore approssimazione in spazi con prodotto scalare e teorema di Pitagora

Dimostrazione del Teorema. Rammentiamo che, se z, w sono numeri complessi, allora


|z w|2 = |z|2 + |w|2 zw zw = |z|2 + |w|2 2 Re zw.
Perci si ha :
2

N


X


=

e
v


j j


j=1

N
X
j=1

= (v, v)

Ma

j ej , v

N
X
k=1

N
X
k=1

k (v, ek )

(ej , ek ) = jk =

k ek

0
1

N
X

j (v, ej ) +

j=1

N
X

j k (ej , ek ).

j,k=1

k=
6 j
k=j

perch gli ej sono un sistema ortonormale. Quindi



2
N
N
N
N


X
X
X
X


2
j ej = kvk
k (v, ek )
j (v, ej ) +
|j |2 .
v


j=1

j=1

k=1

j=1

Ora, applicando (4.1), si ottiene

2

N
N
N


X
X
X


2
2
|(v, ej )|2 .
|

(v,
e
)|

=
kvk
+

e
v


j
j
j j


j=1

j=1

(4.1)

j=1

442

CAPITOLO 4. SPAZI DI HILBERT

Poich, per ogni 1 , . . . , N ,


N
X
j=1

|j (v, ej )|2 > 0

(i moduli non possono essere negativi), ne segue che



2
N
N


X
X


2
|(v, ej )|2 .
j ej > kvk
v


j=1

j=1

La disuguaglianza diventa uguaglianza quando


N
X
j=1

|j (v, ej )|2 = 0

cio se j = (v, ej ) j.
Quindi
v

N
N
u

X
X
u

2
H
t
|(v, ej )|2 .
EN (v) =
min v
j ej = kvk
1 ,...,N C

j=1

j=1

Corollario 4.1.6. Sia v V e H = span {e1 , . . . , eN } il sottospazio lineare


generato dai vettori ortonormali e1 , . . . , eN . Allora il vettore PH (v) H di
minima distanza da v dato da
PH (v) =

N
X

(v, ej )ej .

j=1

Inoltre lerrore v PH (v) commesso approssimando v con la migliore approssimazione PH (v) in H ortogonale a H:
v PH (v) w

w H.

Nota 4.1.7. Come si vede dalla gura 4.1, lortogonalit geometricamente


chiara se V a dimensione nita, per richiede una dimostrazione.

4.1. TEOREMA DI MIGLIORE APPROSSIMAZIONE

443

P
(v, ej ) ej
Dimostrazione del Corollario. Abbiamo gi visto che PH (v) = N
PNj=1
(Teorema di migliore approssimazione 4.1.4). Sia w H, w = j=1 j ej .Grazie
allortonormalit degli ej si ha:
!
!
N
N
N
X
X
X
(v, ek )ek
(w, v PH (v)) =
j ej , v
j ej ,
j=1

N
X
j=1

j=1

j (ej , v)

N
X

k=1

j (v, ej ) = 0.

j=1

Questa propriet di ortogonalit motiva la seguente terminologia:

Definizione 4.1.8. Il vettore PH (v) H di minima distanza da v si chiama


proiezione ortogonale sul sottospazio chiuso H.
Vedremo che PH (v) si denisce anche quando H di dimensione innita.
Come ulteriore corollario del teorema di migliore approssimazione abbiamo:
Corollario 4.1.9. (Disuguaglianza di Bessel). Per ogni v V e per ogni
sistema ortonormale {ei , i N} la serie

X
i=1

convergente, e

X
i=1

|(v, ei )|2

|(v, ei )|2 6 kvk2.

Dimostrazione. Dal Teorema di migliore approssimazione 4.1.4 segue che per


ogni N
N
X
2
H
kvk
|(v, ei )|2 = EN
(v)2 > 0,
i=1

dove H = span {e1 , . . . , eN }. Perci si ha


N
X
i=1

|(v, ei )|2 6 kvk2

N.

444

CAPITOLO 4. SPAZI DI HILBERT

Ma
N
X
i=1

|(v, ei )|2

una successione non decrescente al crescere di N. Una successione monotna e limitata ha limite nito [19, Cap. 16 (Appendice)]. Quindi esiste nito
il limite

X
|(v, ei )|2
i=1

e verica

X
i=1

|(v, ei )|2 6 kvk2 .

Definizione 4.1.10. (Coefficienti di Fourier di sviluppi ortonormali


ed ortogonali.) Fissato un sistema ortonormale {ej }jN V , per ogni
v V la serie

X
(v, ej )ej
j=1

si chiama sviluppo ortonormale (o serie di Fourier) di v rispetto al sistema


{ej }jN . I coecienti cj = (v, ej ) si chiamano coefficienti di Fourier di v
rispetto al dato sistema ortonormale.
Se invece il sistema {ej }jN ortogonale ma non ortonormale, allora,
n
o
e
normalizzandolo, si ottiene il sistema bj := kejj k . Lo sviluppo ortonormale
di v rispetto a questo nuovo sistema

X
X
(v, ej )
ej .
(v, bj )bj =
(e
,
e
)
j
j
j=1
j=1

I coecienti
cj =

(v, ej )
(ej , ej )

(4.2)

di questo sviluppo (rispetto ai vettori ortogonali non normalizzati ej ) si


chiamano ancora coecienti di Fourier di v rispetto agli ej .

4.2. COMPLETEZZA

445

Lespressione della disuguaglianza di Bessel nel caso di un sistema ortogonale non normalizzato segue immediatamente dallespressione dei coecienti di Fourier in questo caso, data nella Denizione 4.1.10 immediatamente
precedente:
Corollario 4.1.11. (Disuguaglianza di Bessel per sviluppi ortogonali.) Per ogni v V e per ogni sistema ortogonale {ei , i N}, la serie

X
|(v, ei )|2
i=1

convergente, e

(ei , ei )

X
|(v, ei )|2
i=1

(ei , ei )

6 kvk2 .

In particolare, se denotiamo con ci i coefficienti di Fourier


4.1.10), otteniamo

X
|ci )|2 kei k2 6 kvk2 .

|(v,ei )|
(ei ,ei )

(Definizione
(4.3)

i=1

4.2

Completezza in spazi con prodotto interno


e convergenza di serie

Sia V uno spazio vettoriale con prodotto interno (, ), e come al solito kvk2 =
(v, v). Data una successione di vettori {vj , j N} V , ricordiamo che si
dice che vj converge a v in norma per j se
lim kvj vk = 0.

Da questo segue la denizione di convergenza di una serie di vettori: la serie

vj

j=1

converge se le sue somme parziali


SN =

N
X
j=1

vj

446

CAPITOLO 4. SPAZI DI HILBERT

sono una successione convergente. In tal caso esse costituiscono una successione di Cauchy:
per ogni > 0 esiste K N tale che, per ogni N > M > K


N

X


vj = kSN SM k < .
(4.4)



j=M +1

Definizione 4.2.1. Lo spazio H completo se vero anche il viceversa:


ogni successione di Cauchy convergente a un vettore di H. In tal caso, la
condizione (4.4) equivalente alla convergenza della serie.

Lemma 4.2.2. Sia {ej }jN un sistema ortonormale, e 1 , 2 , C. Allora, per ogni M,
2
M
M

X
X


|j |2 .
j ej =



j=1

j=1

Dimostrazione. Sia

SM =

M
X

j ej .

j=1

Allora
2

kSM k

= (SM , SM ) =

M
X

(j ej , k ek )

j,k=1

M
X

j k (ej , ek ) =

M
X
j=1

j,k=1

per lortonormalit.

|j |2

Corollario 4.2.3. In uno spazio completo V, lo sviluppo ortonormale di ogni


vettore v V una serie convergente.
Dimostrazione. Chiamiamo, come sempre, {ej }jN un sistema ortonormale.
Sia j = (v, ej ). Consideriamo le somme parziali
SM =

M
X
j=1

j ej

4.2. COMPLETEZZA

447

dello sviluppo ortonormale. Per il Lemma 4.2.2, per ogni M > N


2

kSM SN k =

M
X

j=N +1

|j |2 .

(4.5)

Per la disuguaglianza di Bessel (Corollario 4.1.9) la serie


M
X
j=1

|j |2 6 kvk2

convergente. Quindi le sue somme parziali formano una successione di Cauchy. Allora, a causa di (4.5), le somme parziali SM formano una successione
di Cauchy. Poich V completo questa successione di Cauchy converge.

Nota 4.2.4. Nel Corollario 4.2.3 non detto che lo sviluppo ortonormale di
un vettore v converga proprio al vettore v. Questo non accade se il sistema ortonormale non sucientemente "ricco". Ad esempio, sia V = R3 e
prendiamo il sistema ortonormale {e1 = (1, 0, 0), e2 = (0, 1, 0)}. Lo sviluppo
ortonormale di un vettore v, ad esempio v = (1, 2, 3) non appartenente al
piano xy (generato da {e1 , e2 }) (v, e1 )e1 + (v, e2 )e2 che sta nel piano xy,
ed infatti esattamente la proiezione ortogonale P (v) di v su questo piano
(nellesempio si ha P (v) = e1 + 2e2 6= v).

Corollario 4.2.5. Se {ej }jN un sistema ortonormale, 1 , 2 , C e la


serie

X
j ej
j=1

converge ad un vettore v, allora j = (v, ej ) per ogni j, cio i coefficienti dello


sviluppo sono necessariamente i coefficienti di Fourier. La stessa asserzione
vale per uno sviluppo ortogonale non ortonormale.
Dimostrazione. Una volta dimostrato lenunciato per un sistema ortonormale, esso segue immediatamente per un sistema ortogonale in virt del fatto
che i coecienti di Fourier in questo contesto sono deniti come quelli del
corrispondente sviluppo rispetto al sistema normalizzato (Denizione 4.1.10).

448

CAPITOLO 4. SPAZI DI HILBERT

Assumiamo quindi il sistema ortonormale. Allora, per lortonormalit degli


{ej }jN e la continuit del prodotto scalare (Esercizio 4.1.3),
(v, ej ) =

k eh , ej

k=1

= j .

4.3

Sistemi ortonormali in spazi con prodotto


interno

Sia V uno spazio vettoriale con prodotto interno, e sia {ej , j N} un sistema
ortonormale in V . Sia HN = span {e1 , . . . , eN } V . Dal Teorema di migliore
approssimazione 4.1.4 abbiamo
v
u
N
X
u
t
2
|(v, ej )|2 .
EN (v) = EHN (v) = kvk
j=1

Sappiamo che

N
X
j=1

|(v, ej )|2

cresce con N, e quindi la distanza EN (v) fra v e HN decresce quando N


cresce (il che comunque ovvio perch HN HM se N < M).
Definizione 4.3.1. Si dice che il sistema ortonormale {ej , j N} completo
se
lim EN (v) = 0,
v.
N

Dal Teorema di migliore approssimazione 4.1.4 segue


Corollario 4.3.2. Sia V uno spazio con prodotto interno e {ej , j N} un
sistema ortonormale. Le propriet seguenti sono equivalenti:
(i) {ej , j N} un sistema ortonormale completo;
P
(ii) per ogni v V la serie
j=1 (v, ej )ej converge a v;

4.3. SISTEMI ORTONORMALI


(iii) per ogni v V , kvk2 =

449

j=1 |(v, ej )|

(iv) il sottospazio vettoriale chiuso generato dal sistema ortonormale {ej , j N}


coincide con V .
Nota 4.3.3. (Identit di Parseval, ovvero Teorema di Plancherel in
uno spazio con prodotto interno.) La propriet (iii) lestensione dellidentit del teorema di Pitagora a spazi di dimensione non necessariamente
nita: essa si chiama identit di Parseval (o Teorema di Plancherel).

Dimostrazione del Corollario 4.3.2. Per il Teorema di migliore approssimazione 4.1.4 (i) equivalente a (iii). Inoltre dalla dimostrazione di quel
teorema (vedi (4.1)) si ha
kv

N
X

kv

e quindi

j=1

j=1

(v, ej )ej k = kvk

(v, ej )ej k = kvk

N
X

|(v, ej )|2

|(v, ej )|2

j=1

j=1

(la serie numerica convergente grazie alla disuguaglianza di Bessel, Corollario 4.1.9). Quindi (ii) equivalente a (iii). Inne, sia H il sottospazio
chiuso di V generato dai vettori {ej , j N}. Se vale (ii) H = V , quindi
(ii) (iv). Viceversa, se vale (iv), allora per ogni v V 1 , 2 C tali
che
n
X
j ej v.
j=1

Ma allora, per il corollario 4.2.5 si ha


N
X
j=1

(v, ej )ej v

per N

e quindi (iv) (ii).

450

CAPITOLO 4. SPAZI DI HILBERT

Corollario 4.3.4. Sia H un sottospazio chiuso di V , non necessariamente


a dimensione finita. Definiamo la proiezione ortogonale PH (v) su H di un
vettore v analogamente a quanto fatto nel corollario 4.1.6 nel caso di H a
dimensione finita:

X
PH (v) =
(v, ej )ej ,
j=1

dove {ej , j N} un sistema ortonormale in H.


Se V uno spazio completo, allora la serie che definisce PH (v) convergente ad un vettore in H. Inoltre, se {ej , j N} un sistema ortonormale
completo in H, allora
PH (v) = v, v H
e viceversa, ed inoltre

v PH (v) H

v V.

Dimostrazione. Se {ej , j N} un sistema ortonormale in H V , allora


la serie

X
(v, ej )ej
j=1

converge grazie alla disuguaglianza di Bessel (Corollario 4.1.9). Infatti le sue


somme parziali
N
X
SN =
(v, ej )ej
j=1

vericano

kSN SM k 6

N
X

j=M +1

|(v, ej )|2

a causa della ortonormalit degli {ej }.


Ma

X
|(v, ej )|2 6 kvk2 ,

N > M,

j=1

per la disuguaglianza di Bessel (Corollario 4.1.9), e quindi, per la propriet


di Cauchy, si ha
N
X
|(v, ej )|2 < N > M
j=M +1

4.3. SISTEMI ORTONORMALI

451

se M abbastanza grande.
Quindi le somme parziali SN formano una successione di Cauchy nello
spazio completo V (e nel suo sottospazio chiuso, quindi completo, H).
Perci la successione {SN } convergente in H, quindi la serie

(v, ej )ej

j=1

converge a un vettore PH (v) H.


Se v H e il sistema ortonormale {ej } completo in H, allora per il
Corollario 4.3.2 (ii)

X
PH (v) =
(v, ej )ej = v.
j=1

Quindi le somme parziali SN formano una successione di Cauchy nello


spazio completo V . Perci la successione {SN } convergente in V . Ma
SN H e H chiuso in V , quindi
N
X

SN =

(v, ej )ej

j=1

converge a un vettore PH (v) H.


Se il sistema ortonormale {ej }jN completo in H, allora, per il Corollario
4.3.2 (iii), si ha

X
PH (v) =
(v, ej )ej = v.
j=1

Se
Pinvece non completo, allora esiste un vettore v0 H tale che v0 6=
j=1 (v0 , ej )ej , sempre per il Corollario 4.3.2. Ma la serie

(v0 , ej )ej

j=1

converge a PH (v0 ), quindi PH (v0 ) 6= v0 .


Supponiamo che {ej }jN sia completo in H. Per mostrare che v PH (v)
ortogonale a H, suciente mostrare che ortogonale a ogni ej . Infatti se
w H e w ej j allora (w, h) = 0 h H perch, per il corollario 4.3.2,
h=

X
j=1

(h, ej )ej

452

CAPITOLO 4. SPAZI DI HILBERT

e quindi
(w, h) =

(h, ej )(w, ej ) = 0

j=1

per la continuit del prodotto scalare (Nota 4.1.2).


Abbiamo quindi visto che basta provare che v PH (v) ej per ogni j.
Per dimostrare questa relazione di ortogonalit si procede come nel Corollario
4.1.6. Per ogni j si ha:
!

X
(v PH (v), ej ) =
v
(v, ek )ek , ej
k=1

= (v, ej )

(v, ek )(ek , ej )

k=1

= (v, ej ) (v, ej )(ej , ej ) = (v, ej ) (v, ej ) = 0.

Nota 4.3.5. Se {ej } non completo in H, allora, in generale, PH (v) 6= v per


v H.
Ad esempio, sia V = R3 (oppure C3 se si lavora sul campo complesso)
e H = R2 (oopure C2 ) il sottospazio dato da H = span {(1, 0, 0), (0, 1, 0)} e
v = (1, 2, 0).
Consideriamo il sistema consistente del solo vettore e1 = (1, 0, 0). Allora,
rispetto a questo sistema, PH (v) = (v, e1 )e1 = (1, 0, 0) 6= (1, 2, 0) = v.
Invece, se si sceglie in H il sistema completo {(1, 0, 0), (0, 1, 0)} allora
PH (v) = v.

ha

Riassumendo, se {ej }jN completo in H e V uno spazio completo si

(i) PH (v) H

v V

(ii) PH (h) = h h H
(iii) v PH (v) H.
facile vedere che queste tre propriet caratterizzano PH (v).

4.3. SISTEMI ORTONORMALI

453

Definizione 4.3.6. Si dice che un sistema ortonormale {ej , j N} massimale se


(v, ej ) = 0 j v = 0.
Teorema 4.3.7. In uno spazio completo il sistema di vettori {ej , j N}
massimale se e solo se un sistema completo.
Dimostrazione. Mostriamo prima che {ej } completo implica {ej } massimale.
Sia v V , e supponiamo che si abbia (v, ej ) = 0 per ogni j. Dobbiamo
mostrare che v = 0. Ma poich {ej } completo, dal Corollario 4.3.2 abbiamo
v=

(v, ej )ej = 0.

j=1

Ora mostriamo, per assurdo, che, se {ej } massimale e lo spazio V


completo, allora {ej } completo.
Se non lo fosse, per il punto (iv) del corollario 4.3.2 il sottospazio chiuso
H generato dai vettori {ej } sarebbe pi piccolo di V , cio esisterebbe un
vettore v V con v
/ H. Allora esisterebbe anche un vettore w V con
w 6= 0 e w H (basta prendere il vettore w = v PH (v) e usare il Corollario
4.3.4, che applicabile perch lo spazio H, essendo un sottospazio chiuso di
uno spazio completo, anchesso completo).
Ma in tal caso si avrebbe:
j

(w, ej ) = (v, ej ) (PH (v), ej ) = (v, ej ) (v, ej ) = 0

per il Corollario 4.1.6.


Quindi w 6= 0 e (w, ej ) = 0 j il che contraddice lipotesi che {ej } sia
massimale.

Esercizio 4.3.8. In C3 (oppure in R3 ) si consideri la base canonica e1 =


(1, 0, 0) , e2 = (0, 1, 0) , e3 = (0, 0, 1). Allora {e1 , e2 , e3 } massimale ed
completo, mentre {e1 , e2 } non n massimale n completo. La stessa cosa
vale per qualsiasi altra base.

Esercizio 4.3.9. Sia V uno spazio vettoriale con prodotto scalare (, ) e sia
{ej }jN un sistema ortonormale in V .
Dire se le seguenti aermazioni sono vere o false ( V vero, F falso)

454

CAPITOLO 4. SPAZI DI HILBERT

(a) {ej }jN completo per ogni v V la serie


+
X

(v, ej )ej

j=1

converge a v.

V F

(b) Se {ej }jN completo per ogni v V


2

kvk =

+
X
j=1

|(v, ej )|2 .
V F

(c) Il sottospazio vettoriale chiuso generato dal sistema ortonormale {ej }jN
coincide con V .
V F
(d) Se H V un sottospazio vettoriale chiuso, la proiezione ortogonale
su H di v data da
+
X
PH (v) =
(v, ej )ej .
j=1

V F
(e) Se {ej }jN un sistema ortonormale completo in H il vettore v
PH (v) parallelo a tutti i vettori di H.
V F

4.4

Spazi di Hilbert

Definizione 4.4.1. Sia H uno spazio vettoriale munito di un prodotto scalare (, ) denito positivo. Se H completo rispetto alla norma indotta dal
prodotto scalare (kvk2 = (v, v)) si dice che H uno spazio di Hilbert.
Nellesempio seguente e nel successivo esercizio dobbiamo considerare successioni di vettori i quali sono essi stessi costituiti da successioni (numeriche). Per evitare confusione, in queste pagine indichiamo tali successioni con
simboli in grassetto.

4.4. SPAZI DI HILBERT


Esempio 4.4.2.

455

(i) L2 (R) uno spazio di Hilbert con il prodotto scalare


Z
(f, g) =
f (t)g(t) dt.

Lintegrale in questa denizione lintegrale di Lebesgue (Sezione 1.9).


La completezza stata dimostrata in 1.16.26. Il lettore pu derivare
una dimostrazione alternativa (di fatto analoga) che usa solo tecniche
di spazi di Hilbert in analogia al successivo Esercizio 4.4.3 (vedi Nota
??).
(ii) Analogamente, e con la stessa dimostrazione, L2 ([a, b]) uno spazio di
Hilbert con il prodotto scalare
Z b
(f, g) =
f (t)g(t) dt .
a

Preferiamo, pero, rinormalizzare la misura di Lebesgue nellintegrale


che denisce il prodotto scalare, e quindi lo rideniamo cos:
Z b
1
f (t)g(t) dt .
(f, g) =
ba a
(iii) Se E uno spazio topologico munito della -algebra dei Boreliani (Denizione 1.9.9), e una misura di Borel su E (Denizione 1.9.11),
allora L2 (E, ) uno spazio di Hilbert (stessa dimostrazione che per
L2 (R)).
(iv) 2 = 2 (N) o 2 (Z) sono spazi di Hilbert.
Dimostrazione. La completezza un caso particolare del punto (iii):
basta prendere E = N o Z e la misura discreta (quella che conta i
punti di ogni insieme). In eetti, in questo ambiente puramente atomico, ossia discreto, dove gli integrali diventano somme, possiamo anche
dare una dimostrazione diretta della completezza, che viene posposta
al successivo Esercizio 4.4.3. Illustriamo invece qui alcuni aspetti che
legano 2 agli spazi a dimensione nita.
Indichiamo gli elementi di 2 con = (1 , 2 , . . . ). Il prodotto scalare
in 2 dato da

X
(, ) =
i i ,
i=1

456

CAPITOLO 4. SPAZI DI HILBERT


e quindi la norma
kk2 =

X
i=1

|i |2 .

Un sistema ortonormale completo dato dalla famiglia di successioni


ej = (0, 0, . . . ,
1, . . . , 0, 0 . . . ) dove il valore 1 al posto j-esimo, cio
0 se k 6= j
(ej )k = jk =
. ovvio che le successioni che sono
1 se k = j
nulle dopo il posto N-simo, cio del tipo = (1 , . . . , N , 0, 0, . . . ),
formano un sottospazio di 2N isomorfo a CN (come gi osservato nella
Nota 1.7.11). La norma CN di una tale successione coincide con la sua
norma in 2 :
kk22
N

N
X
i=1

|i | =

X
i=1

|i |2 = kk22 .

A questo sottospazio 2N appartengono i primi N vettori ej , che corrispondono agli N vettori canonici di base. Quindi 2 pu essere pensato
come una naturale estensione a dimensione innita dello spazio euclideo
CN , e gli ej come i "vettori canonici di base".
Il sistema {ej } completo. Per provare questo fatto basta provare che
massimale, per il Teorema 4.3.7. Mostriamo quindi la massimalit:
cio mostriamo che, se 2 e (, ej ) = 0 per ogni j allora = 0 =
(0, . . . , 0, . . . ). Ma questo segue immediatamente dal fatto che
(, ej ) =

k kj = j .

k=1

Esercizio 4.4.3. Diamo una dimostrazione diretta della completezza di p per


0 < p < .
Svolgimento. Per coerenza, visto che il presente Capitolo dedicato agli spazi
di Hilbert, limitiamo lattenzione al caso di 2 , ma, se sostituiamo 2 con p e la
disuguaglianza di Cauchy con la disuguaglianza di Hlder (Teorema 1.16.6),
la dimostrazione si ripete parola per parola.
Dobbiamo provare che ogni successione di Cauchy {n } di elementi di 2

4.4. SPAZI DI HILBERT

457

(cio di successioni a quadrato sommabile) converge a una successione limite


in 2 . Notiamo preliminarmente che per ogni 2 , per ogni j si ha
v
uX
u
|j |2 = kk2 .
|j | 6 t
j=1

Allora sia {n } una successione di Cauchy di elementi di 2 :


> 0 N : m, n > N, km n k < .

(4.6)

Allora per ogni j anche la successione numerica (n )j di Cauchy, grazie alla


precedente disuguaglianza




(m )j (n )j 6 km m k <
e a (4.6).
o C completo, deve esistere per ogni j il limite della successione
n Poich
(m )j
: chiamiamolo j . Mostriamo che = (1 , 2 , . . . ) un elemento
jN

di 2 e n , cio

kn k 0

per n .

Grazie a (4.6) si ha

2
X


> 0 M :
(m )j (k )j < 2
j=1

m, k > M.

Perci, per ogni n


n
2
2 X
X




(m )j (k )j < 2
(m )j (k )j 6
j=1

j=1

m > k > M.

Passando al limite per k si ottiene

n
2
X


2
(
)

m j
j <
j=1

m > k > M.

458

CAPITOLO 4. SPAZI DI HILBERT

Quindi le somme parziali Sn della serie



2
X


(m )j j
j=1

sono limitate. Poich questa serie a termini non negativi le sue somme
parziali convergono (esse sono una successione crescente e limitata in R [19,
Cap. 16 (Appendice)]). Quindi
km k2 =


2
X


2
(
)

m j
j < < ,

(4.7)

j=1

cio m 2 , m > M. Poich, per ipotesi, m 2 , anche 2 .


Inoltre, per (4.7) si ha che per ogni > 0 esiste M tale che per ogni m > M
km k < ,
e cio
m 0 per m .

Questo prova che la successione di Cauchy {m } 2 converge a 2 e


quindi che 2 completo. Si noti che la stessa dimostrazione si applica allo
spazio normato p introdotto nella Denizione 1.7.1.

Nota 4.4.4. I passaggi al limite sotto il segno di serie sono analoghi a quelli
sotto il segno di integrale che servirebbero, con identica dimostrazione, per
provare la completezza di L2 ; una variante di tale dimostrazione che si estende
a tutti gli spazi Lp (e p ) stata presentata nel Teorema di Riesz-Fischer
(Teorema 1.16.26). Tali passaggi al limite sotto il segno di integrale sono
validi per lintegrale di Lebesgue ma non per quello di Riemann (si veda la
Sezione 1.9). Si ha che lo spazio L2 costruito con lintegrale di Lebesgue
completo, ma costruito con lintegrale di Riemann non lo .

Esercizio 4.4.5. Costruire una successione di Cauchy in L2 ((0, 1)) (rispetto


allintegrale di Lebesgue) che converge in questo spazio, ma non converge
nello spazio L2 ((0, 1)) costruito con lintegrale di Riemann.
Svolgimento. . Si consideri una funzione positiva f L2 illimitata ed i suoi
approssimanti fn (x) := min{f (x), n}. Si osservi che fn tende a f puntualmente in maniera monotna ed anche nella norma di L2 , ma il limite puntuale

4.4. SPAZI DI HILBERT

459

f illimitato, e quindi non integrabile secondo Riemann (non ha approssimanti per eccesso a gradini). Naturalmente, la norma L2 di f nel senso di
Riemann denibile come limite delle norme di fn , ossia come approssimazione nel senso degli integrali impropri di Riemann, ed allora ovviamnete
coincide
la norma L2 di Lebesgue: per non denibile direttamente
R con
2
come |f | nel senso dellintegrale di Riemann.

Dora in avanti useremo sempre lintegrale di Lebesgue.

Teorema 4.4.6. (RieszFischer.) Uno spazio di Hilbert H si dice separabile se dotato di un sistema ortonormale completo numerabile (cio indicizzato da un indice intero). Ogni spazio di Hilbert separabile isometricamente
isomorfo a 2 : in altre parole, esiste un isomorfismo lineare surgettivo
: H 2
tale che
h H,

k (h)k2 = khkH .

Dimostrazione. Sia {en }nN un sistema ortonormale completo in H. Deniamo


(h) = {(h, en ), n = 1, 2, . . . } .
Per lidentit di Parseval (Corollario 4.3.2(iii)) si ha

X
n=1

|(h, en )|2 = khk2H ,

e quindi una isometria (perci necessariamente iniettiva: se h1 6= h2 H


allora k (h1 ) (h2 )k2 = kh1 h2 kH 6= 0). Dobbiamo solo dimostrare che
surgettivo.
Sia = (1 , 2 , . . . ) 2 . Basta costruire un vettore h H tale che
(h) = . Questo h esiste: esso dato da
h=

j ej .

j=1

La serie converge perch H completo (Corollario 4.3.2(ii)), e


(h) = {(h, en ),

n = 1, 2, . . . } = {n n = 1, 2, . . . } =

460

CAPITOLO 4. SPAZI DI HILBERT

perch

j ej , en

j=1

j jn = n ,

j=1

per lortogonalit e per la continuit del prodotto scalare (Esercizio 4.1.3).

Nota 4.4.7. Se nel Teorema 4.4.6 si assume che H sia munito di prodotto
scalare, ma non sia completo rispetto alla norma, allora, ovviamente, lenunciato non pu valere: H non pu, in questa ipotesi, essere isometricamente
isomorfo a 2 , perch 2 completo. La parte della dimostrazione che viene
meno la surgettivit di . Infatti, dato 2 , = (1 , 2 , . . . ), non si
trova sempre h H tale che = (h).
In eetti, sulla base della disuguaglianza di Bessel (Corollario 4.1.9), le
somme parziali Sn della serie

X
j ej
j=1

formano ancora una successione di Cauchy:


m > n

kSm Sn k =

m
X

j=n+1

|j |2 <

se n abbastanza grande. Infatti

X
j=1

|j |2 < khk2

(4.8)

per il Corollario 4.3.2, e quindi


n

n
X
j=1

|j |2

una successione (numerica) convergente, quindi di Cauchy. Quindi lo


anche la successione Sn . Per, se non si assume che H sia completo, la
successione di Cauchy Sn in H pu non essere convergente.
Peraltro, quando H non completo, un isomorsmo isometrico surgettivo su un sottospazio K denso in 2 , cio tale che K = 2 (chiusura in

4.4. SPAZI DI HILBERT

461

norma): si tratta del sottospazio delle successioni con solo un numero nito
di termini non nulli:
K = { : n = n() N taleche j = 0 perogni j > n} .
Infatti ovvio che ogni 2 si approssima, a meno di qualunque > 0,
con elementi di K (e quindi K = 2 ):

perch, per (4.8), la serie

n :

X
j=1

j=n+1

|j |2 <

|j |2

convergente. Perci = (1 , . . . , n , 0, 0, . . . , ) verica


k k2 =

j=n+1

|j |2 < .

anche ovvio che surgettivo su K, poich, per ogni K, =


(1 , . . . , n , 0, 0 . . . ), si ha
h=

n
X
j=1

j ej H

( una combinazione lineare nita, non ci sono problemi di convergenza di


serie!) e (h) = .

Esercizio 4.4.8. Sia H lo spazio di Hilbert L2 ([1, 1], dx) e K il sottospazio


delle funzioni lineari (quindi f K a, b R tali che f (x) = ax + b). Si
determini la proiezione ortogonale su K della funzione (x) = x2 .

Svolgimento Se a, b R, i vettori e1 = b e e2 = ax formano una base


ortogonale in K. Infatti
Z 1
(e1 , e2 ) =
bax dx
1
Z 1
= ba
x dx = 0.
1

462

CAPITOLO 4. SPAZI DI HILBERT

Scegliamo ora a e b in modo da avere che {e1 , e2 } una base ortonormale,


ossia in modo tale che
(e1 , e1 ) = 1

(e2 , e2 ) = 1.

i deve avere

1
2
(e1 , e1 ) =
b2 dx = 2b2 = 1 b2 = b =
,
2
2
1
Z

(scegliamo b =
(e2 , e2 ) =

2
)
2

1
2 2

a x dx = a

(scegliamo a =

x3
3

1

3
).
2

r
3
3
=a =1a = a=
,
3
2
2
22

2
,
2

3
x}.
Allora la base ortonormale {
2
Ricordiamo che la proiezione sul sottospazio K di un vettore v data da
(Corollario 4.3.4 ):
2
X
PK (v) =
(v, ei )ei .
i=1

Quindi

Ma

r
r

2
2
3
3
)
+ (x2 ,
x)
x.
PK (x2 ) = (x2 ,
2 2
2
2

2
(x2 ,
)=
2
e
(x2 ,
Quindi

1
1

 3 1
2 2
2 x
2
=
x dx =
2
2
3 1
3

3
x) =
2

r Z 1
3
x3 dx = 0.
2 1


2 2
1
PK (x ) =
= .
3 2
3
2

4.5. DISUGUAGLIANZA DI CAUCHYSCHWARZ

463

Nota 4.4.9. La proiezione del polinomio pari x2 sullo spazio dei polinomi
lineari, generato dal polinomio pari 1 e dal dispari x, ha componente nulla
lungo il polinomio dispari. Questa relazione fra proiezione e parit sempre
vera (esercizio!) ed analoga al fatto che gli sviluppi di Taylor di funzioni dispari (rispettivamente pari) sono composti di soli polinomi dispari
(rispettivamente pari). Si veda anche lEsercizio 5.2.8).

Esercizio 4.4.10. Consideriamo in 2 (N) i vettori della base canonica


e1 = (1, 0, 0, . . . )
e2 = (0, 1, 0, . . . )
..
.
P
e sia vj = ji=1 ei .
Fissato j, trovare la proiezione ortogonale di vj sui seguenti sottospazi:
(i) il sottospazio generato da e1 ;
(ii) il sottospazio generato da {e1 , e2 , . . . , ej };
(iii) il sottospazio generato da {e1 , e2 , . . . , e2j }.

4.5

La disuguaglianza di CauchySchwarz

Proposizione 4.5.1. Se V uno spazio con prodotto interno e v, w V ,


allora
|(v, w)| 6 kvk2 kwk2
Dimostrazione. Osserviamo dapprima che la disuguaglianza vera in ogni
spazio V di dimensione 2. Questo segue dal Teorema di Talete: (v, w) =
kvkkwk cos() dove langolo formato dai vettori v e w; oppure, in termini
di coordinate nella base canonica, dalle seguenti uguaglianze:
se v = v1 e1 + v2 e2 e w = w1 e1 + w2 e2 , allora
|(v, w)|2 = |v1 w1 + v2 w 2 |2
= |v1 w1 |2 + |v2 w2 |2 + 2 Re(v1 w 1 v 2 w2 )

464

CAPITOLO 4. SPAZI DI HILBERT

mentre
kvk2 kwk2 = (|v1 |2 + |v2 |2 )(|w1 |2 + |w2 |2 )
= |v1 w1 |2 + |v2 w2 |2 + |v1 |2 |w2 |2 + |w1 |2 |v2 |2 .
Infatti da qui segue che la disuguaglianza dellenunciato equivale al fatto che,
per ogni v1 , v2 , w1, w2 ,
2 Re(v1 w1 v 2 w2 ) 6 |v1 |2 |w2 |2 + |w1 |2 |v2 |2 ,
cio, per ogni a, b C,
2 Re(ab) 6 |a|2 + |b|2 .
Questo vero perch
|a|2 + |b|2 2 Re(ab) = |a b|2 > 0.
Questo dimostra la Proposizione se la dimensione di V uguale a 2. Ma se
V arbitrario, una volta scelti v, w applichiamo la disuguaglianza appena
provata allo spazio bidimensionale generato da v e w.

Nota 4.5.2. La disuguaglianza di Cauchy-Schwarz per lo spazio L2 un caso


particolare della disuguaglianza di Hlder (Teorema 1.16.6) per gli spazi Lp
e Lq , con p, q indici coniugati (Denizione 1.16.4).

4.6

Operatori lineari e funzionali lineari su spazi normati; dualit

In questa Sezione trattiamo i funzionali lineari continui su spazi di Hilbert.


La terminologia e le nozioni di base sono state esposte nella Sezione ??, ma
ripetiamo qui gli eninciati principali, senza ripetere le dimostrazioni. Alcuni
risultati simili per gli spazi normati completi Lp sono stati esposti in Sezione 1.19: in particolare, alcuni enunciati che ora presenteremo sono gi stati
introdotti l. Il risultato principale di questa Sezione, il Teorema di rappresentazione di Riesz (Teorema 4.6.4), quando specializzato al caso dello spazio
di Hilbert L2 coincide con il caso p = 2 del Teorema di Dualit 1.19.6 per gli
spazi Lp .
Richiamiamo la seguente denizione di operatore lineare tipica dellAlgebra Lineare:

4.6. OPERATORI E FUNZIONALI LINEARI, DUALIT

465

Definizione 4.6.1. Siano V e W spazi vettoriali. Una applicazione


T :V W
si dice un operatore lineare se per ogni v1 , v2 V e per ogni c1 , c2 C si ha
T (c1 v1 + c2 v2 ) = c1 T (v1 ) + c2 T (v2 ).
Definizione 4.6.2. (Operatori continui.) Se V uno spazio normato (o
pi in generale se su V data una nozione di convergenza) dire che T
continuo signica dire che
lim T (v) = T (v0 )

vv0

(spesso scriveremo T v invece che T (v)).


Il seguente enunciato un caso particolare della Proposizione 3.3.4, grazie
allultima osservazione della Denizione 3.3.5.
Proposizione 4.6.3. Se V, W sono spazi normati e T : V W un
operatore lineare, allora T continuo se e solo se esiste C > 0 tale che, per
ogni v V
kT vkW 6 CkvkV .
Dimostrazione. La disuguaglianza nellenunciato ovviamente implica la continuit di T . Viceversa, se T continuo, allora per ogni > 0 esiste > 0
tale che la sfera con centro 0 di raggio in V viene mandata da T nella sfera
con centro 0 di raggio in W : cio kT vkW < 0 se kvkV < 0 . Ma poich
T lineare e continuo, questo vuol dire che kT vkW 6 0 se kvkV 6 0 . In
particolare, scegliendo v tale che kvkV = 0 , per ogni > 0 si ha:
kT vkW 6 := 0
se
Cio

kvkV = := 0 .
kT vkW 6 0 =

0
kvkV = CkvkV .
0

466

CAPITOLO 4. SPAZI DI HILBERT

La norma di un operatore lineare T da uno spazio normato V ad uno spazio normato W stata introdotta nella Denizione 3.3.5: rammentiamo che
si tratta dellestremo inferiore delle costanti C > 0 tali che, per ogni v V , si
abbia kT vk 6 Ckvk. Rammentiamo anche che la norma submoltiplicativa
(Corollario 3.3.9): dati due operatori lineari A : V W e B : U V ,
loperatore composto AB : U W verica
kABk 6 kAkkBk .
Inoltre, in dimensione nita, la norma coincide con il massimo modulo degli
autovalori (Proposizione 3.3.11).
Ora studiamo i funzionali lineari su uno spazio di Hilbert H (ossia gli operatori lineari da H a C, Denizione 3.3.13) che sono continui. Un caso particolare
quello ben noto dei funzionali sugli spazi vettoriali a dimensione nita).
Teorema 4.6.4. (Teorema di rappresentazione di Riesz.) Se H
uno spazio di Hilbert, i funzionali lineari continui su H formano uno spazio
vettoriale isometricamente isomorfo a H. Per ogni u H il funzionale Fu
definito da
Fu (v) = (v, u)H v H
continuo e kFu k = kuku . Viceversa ogni funzionale continuo su H del
tipo Fu per qualche u H, e questo u unico.
Notazione 4.6.5. Lo spazio dei funzionali continui su uno spazio normato
V si chiama il duale di V e si indica con V .

Dimostrazione. ovvio che H uno spazio vettoriale. Sia u H e Fu (v) =


(v, u). Allora Fu un funzionale lineare e per la disuguaglianza di CauchySchwarz (Proposizione 4.5.1) si ha
|Fu (v)| = |(v, u)| 6 kvkkuk.
Quindi, per la Proposizione 4.6.3, Fu continuo, e kFu k 6 kuk. Ma Fu (u) =
(u, u) = kuk2, e perci
kFu k = inf {C > 0 : |Fu (v)| 6 Ckvk v H} > kuk.
Quindi kFu k = kuk.
Viceversa, mostriamo che per ogni F H esiste u H tale che F = Fu .
Se F = 0, allora questo vero per u = 0. Altrimenti sia
M = Ker F = {v H : F (v) = 0} .

4.6. OPERATORI E FUNZIONALI LINEARI, DUALIT

467

Osserviamo che M un sottospazio vettoriale di H (perch F lineare) ed


inoltre M chiuso: se vn M e limn vn = v H, allora v M, perch
F continuo, e quindi
F (v) = lim F (vn ) = 0.
n

Poich F 6= 0 si ha M 6= H. Perci possiamo trovare v0 H con v0


/
M. Ma allora esiste w H, w M: basta utilizzare il procedimento di
ortogonalizzazione di Gram-Schmidt, cio prendere w = v0 PM (v0 ), dove
PM la proiezione ortogonale su M denita nel Corollario 4.3.4 (PM (v0 )
esiste, grazie a questo Corollario, perch M chiuso). Riscalando, otteniamo
un vettore w0 tale che w0 M e F (w0) = 1.
Per ogni h H, ponendo = F (h), osserviamo che
F (h w0 ) = F (h) F (w0 ) = = 0.
Quindi h w0 M, e dal momento che w0 M si ha
0 = (h w0 , w0 ) = (h, w0 ) kw0k2 = (h, w0 ) F (h)kw0k2 .
Poniamo u = w0 /kw0 k2 : allora ne segue che, per ogni h H, F (h) = (h, u).
Quindi F = Fu .
Questo vettore u unico, perch se F = Fu = Fu , allora
(h, u) = (h, u) h H,
e quindi u u H. Ma allora u = u , perch il prodotto scalare denito
positivo, e quindi non degenere (Denizione 4.1.1).

Nota 4.6.6. Il Teorema di rappresentazione di Riesz 4.6.4 asserisce che, se


H uno spazio di Hilbert, allora H H e lisomorsmo una isometria.
In particolare questo vale per ogni spazio vettoriale di dimensione nita V ,
perch ogni tale spazio V di Hilbert (ssata una base {ei }ni=1 il prodotto
scalare dato da
n
X
(v, u) =
vi ui
Pn

Pn

i=1

se v = i=1 vi ei e u = i=1 ui ei ). Quindi ogni spazio di dimensione nita


isomorfo al suo duale. Si osservi che, se ei = (0, 0, . . . , 1, 0, . . . , 0) con 1 al

468

CAPITOLO 4. SPAZI DI HILBERT

posto i un vettore della base canonica, allora il funzionale lineare associato

Fei (v) = (v, ei ) = vi ,


cio il suo valore la i-esima coordinata del vettore a cui Fei si applica.
Quindi i funzionali che "leggono" le singole coordinate formano una base in
V che chiameremo base canonica di V (una volta ssata una base canonica
in V ).

Esercizio 4.6.7. Sia H uno spazio di Hilbert e sia F H un funzionale


lineare continuo su H. Dimostrare che se K = KerF {x : F (x) = 0},
allora dim K = 1.

Svolgimento. y K (y, x) = 0 se F (x) = 0. Se y1 , y2 sono due


vettori linearmente indipendenti in K , allora
(y1 y2 , x) = 0 perogni x K y1 y2 K .
Scegliamo y1 e y2 in modo tale che F (y1 ) = F (y2 ) = 1 (ci sempre possibile
dividendo yi per F (yi ), i = 1, 2).
Allora
F (y1 y2 ) = F (y1) F (y2 ) = 1 1 = 0 y1 y2 K .
Ma K K = {0} perch il prodotto scalare non degenere, e quindi y1
y2 = 0 cio y1 = y2 .

Nota 4.6.8. Lesercizio pu essere risolto anche utilizzando il Teorema di


rappresentazione di Riesz 4.6.4.

Esercizio 4.6.9. Sia


P {an }nN una successione in H spazio
P 2 di Hilbert tale che
an > 0 n P
N e an bn < + per ogni bn > 0 con bn < +. Dimostrare
che allora
a2n < +.

Svolgimento. Poniamo a = {an }nN e b = {bn }nN . Allora abbiamo che


|(a, b)| < b 2 . Da ci segue che la trasformazione lineare Fa tale che
Fa (b) = (a, b) denita su tutto 2 . Essa continua, perch, per ogni > 0
N N tale che
+
N
X
X
an bn + ,
Fa (b) =
an bn 6
n=1

n=1

4.6. OPERATORI E FUNZIONALI LINEARI, DUALIT


ma

N
X

an bn 6

n=1

N
X

a2n

n=1

N
X

b2n

n=1

469

per la disuguaglianza di CauchySchwartz (Proposizione 4.5.1). Perci per


ogni b 2 ,
! N
!
N
X
X
Fa (b) 6
a2n
b2n +
6

n=1
N
X
n=1

a2n

n=1

kbk22 + .

Prendiamo = kbk22 . Allora N N tale che


"
!#
+
X
Fa (b) 6 1 +
a2n
kbk22 .
n=1

Da ci segue che Fa continuo su 2 (Proposizione 4.6.3 ). Allora per il


Teorema di rappresentazione di Riesz 4.6.4, esiste c 2 tale che
Fa (b) = (c, b) b 2 .
Consideriamo i casi particolari b = ei = (0, 0, . . . , 1, 0, . . . , ) come nellEsercizio 4.4.3. Allora
Fa (b) = Fa (ei ) = ai
e
(c, b) = (c, ei ) = ci .
Perci ai = ci i e quindi a = c 2 .

Esercizio 4.6.10. Sia H uno spazio di Hilbert e siano f, g H linearmente


indipendenti e kf k = kgk = 1. Dimostrare che ktf + (1 t)gk < 1 per
0 < t < 1. In altre parole, mostrare che la sfera in uno spazio di Hilbert
strettamente convessa: la corda che congiunge due punti sulla supercie
della sfera sta tutta allinterno della sfera tranne che ai due punti estremi.

470

CAPITOLO 4. SPAZI DI HILBERT

Svolgimento. Questo esercizio gi stato svolto per spazi di Hilbert separabili: infatti, dal momento che ogni spazio di Hilbert separabile isometricamente isomorfo a L2 in base al Teorema di RieszFischer 4.4.6, abbiamo gi
dimostrato questo enunciato nellEsempio 3.9.18, pi in generale per tutti gli
spazi Lp con 1 < p < . Pertanto lenunciato vale anche per spazi di Hilbert
non separabili, dal momento che il sottospazio generato dai due vettori f e
g separabile. Pur tuttavia, diamo qui dimostrazioni alternative indirizzate
ai lettori che non abbiano avuto suciente interesse per approfondire questi
argomenti di Analisi Funzionale su spazi di Banach.
Osserviamo anzitutto che il fatto che ogni sfera di raggio positivo in uno
spazio di Hilbert sia strettamente convesse ovvio per il motivo seguente.
A meno di traslazioni e dilatazioni possiamo rstringere lattenzione alla sfera
unitaria con centro lorigine (come abbiamo fatto nellenunciato). Ogni due
vettori non multipli luno dellaltro f e g di norma 1 generano un sottospazio di Hilbert isometricamente isomorfo a C2 , e, se si limita lattenzione a
combinazioni lineari a coecienti reali, generano un sottospazio reale R isometricamente isomorfo a R2 . Questo appunto il caso delle combinazioni
convesse dei vettori f e g, visto che i loro coecienti sono reali: quindi esse
giacciono tutte in R R2 . Ora, che il cerchio di raggio 1 con centro lorigine
in R2 sia strettamente convesso geometricamente ovvio: il lettore che non
lo trova ovvio pu ruotare il cerchio intorno allorigine in maniera da portare
la corda sottesa da f e
g nel semipiano inferiore (aperto), dove il cerchio
il graco della funzione 1 x2 , che strettamente convessa perch ha derivata seconda strettamente positiva (limitata inferiormente da una costante
positiva).
Ma per il lettore che preferisce usare solo tecniche basate sullalgebra
lineare e sulle norme, ecco una dimostrazione diretta.
Consideriamo dapprima il caso particolare in cui f g. Si ha:
ktf + (1 t)gk2 = t2 (f, f ) + (1 t)2 (g, g) + t(1 t)[(f, g) + (g, f )].

Dato che f g e kf k = kgk = 1,

ktf + (1 t)gk2 = t2 + (1 t)2 = 2t2 2t + 1.

Osserviamo ora che max{2t2 2t + 1 : t (0, 1)} < 1, perch se consideriamo


la funzione (t) = 2t2 2t + 1, abbiamo che (t) = 4t 2 = 0 t = 12
e ( 21 ) = 12 , (0) = (1) = 1. Quindi la funzione (t) assume il massimo
assoluto (= 1) solo agli estremi dellintervallo [0, 1]. Da ci segue che (t) < 1
per ogni t (0, 1).

4.6. OPERATORI E FUNZIONALI LINEARI, DUALIT

471

Veniamo al caso generale: ora f, g sono solo linearmente indipendenti.


Consideriamo il sottospazio bidimensionale che essi generano e sia {e1 , e2 }
una base ortonormale in esso.
Allora f = c1 e1 + c2 e2 e g = d1 e1 + d2 e2 con c21 + c22 = 1 e d21 + d22 = 1.
Inoltre
tf + (1 t)g = tc1 e1 + (1 t)d1 e1 + tc2 e2 + (1 t)d2 e2
= [tc1 + (1 t)d1 ]e1 + [tc2 + (1 t)d2 ]e2
e quindi
ktf + (1 t)gk2 = [tc1 + (1 t)d1 ]2 + [tc2 + (1 t)d2 ]2
= t2 c21 + (1 t)2 d21 + t2 c22
+ (1 t)2 d22 + 2t(1 t)c1 d1 + 2t(1 t)c2 d2
= t2 (c21 + c22 ) + (1 t)2 (d21 + d22 ) + 2t(1 t)(f, g)
= t2 + (1 t)2 + 2t(1 t)(f, g)
< t2 + (1 t)2 + 2t(1 t)
perch |(f, g)| < 1, in quanto kf k = kgk = 1 e f, g non sono allineati (essendo
linearmente indipendenti).
Quindi
ktf + (1 t)gk2 < t2 + (1 t)2 + 2t(1 t) = [t + (1 t)]2 = 1.

Nota 4.6.11. LEsercizio 4.6.10 rivela che la sfera in uno spazio di Hilbert
strettamente convessa: la corda che congiunge due punti sulla supercie
della sfera sta tutta allinterno della sfera tranne che ai due punti estremi.
Facendo tendere uno dei due punti estremi f verso laltro, g, si osserva che
la retta in cui giace tale corda si sposta verso la retta tangente alla sfera in
g. Quindi tutte le rette tangenti toccano la sfera unicamente nel punto di
tangenza. Questa propriet di convessit stretta non vera in generale per
spazi normati non di Hilbert; ad esempio non vera per gli spazi 1 e (si

vedano le gure delle loro sfere unitarie nella Nota 1.7.10).

472

CAPITOLO 4. SPAZI DI HILBERT

Capitolo 5
Serie di Fourier
5.1

Funzioni periodiche e sistema trigonometrico

Sia f una funzione periodica su R di periodo T > 0: cio f (t + T ) = f (t)


per ogni t R.
Useremo spesso il seguente fatto:
Lemma 5.1.1. Se f una funzione periodica di periodo T e integrabile in
ogni intervallo finito, lintegrale di f su un qualunque intervallo di lunghezza
T lo stesso, cio
Z

a+T

f (t) dt =
a

f (t) dt

a R.

Dimostrazione. Si tratta di mostrare che, se si sposta lintervallo di integrazione da [0, T ] a [a, a + T ] (diciamo verso destra, cio per a > 0: il caso
opposto analogo) il contributo dellintegrale che si perde nel tratto [0, a] lo
si riacquista nel tratto [T, a + T ]:
In eetti questo equivale alla additivit dellintegrale: per la periodicit
si ha
Z a
Z a+T
f (t) dt =
f (t) dt
0

e quindi per ladditivit

473

474

CAPITOLO 5. SERIE DI FOURIER

Figura 5.1: Lintegrale su un periodo invariante per traslazione del periodo

a+T

f (t) dt =

a+T

f (t) dt

a+T

f (t) dt

f (t) dt

a+T

f (t) dt =

f (t) dt.

Nota 5.1.2. Se f periodica di periodo T allora la funzione dilatata




T
t
g(t) = f
2
periodica di periodo 2: infatti per ogni t



 

tT
tT
(t + 2)T
=f
= g(t)
+T =f
g(t + 2) = f
2
2
2
perch f periodica di periodo T .
Quindi, a meno di una dilatazione di scala, possiamo limitarci a considerare funzioni periodiche di periodo 2.

Definizione 5.1.3. Muniamo lo spazio L2 [0, 2] del prodotto scalare seguente:


Z 2
1
(f, g) =
f (t)g(t) dt ,
2 0

normalizzato come alla ne della parte (ii) dellEsempio 4.4.2. Pertanto la


norma in L2 [0, 2] data da
kf kL2

1
=
2

Z

 12
|f (t)| dt .
2

5.1. IL SISTEMA TRIGONOMETRICO

475

Analogamente, per 1 6 p < , rammentiamo la Denizione 1.16.1 di


Lp [0, 2] come lo spazio delle funzioni misurabili secondo Lebesgue (Denizione 1.9.39) tali che la seguente norma nita:
kf kLp

1
=
2

Z

 p1
|f (t)| dt .
p

In particolare, per p = 1, la norma L1 data da


Z 2
1
kf kL1 =
|f (t)| dt.
2 0
Inne, lo spazio L [0, 2] consiste delle funzioni misurabili e limitate su
[0, 2], ed munito della norma
kf kL = ess sup06t62 |f (t)|
(lestremo superiore essenziale stato introdotto nella Denizione 1.16.2 e
poi studiato nellEsercizio 1.16.3).
Notiamo anche che, con la normalizzazione scelta alla ne della parte (ii)
dellEsempio 4.4.2, il prodotto scalare in L2 [0, T ]
1
(f, g) =
T

f (t)g(t) dt ,

e quindi la norma in L2 [0, T ] data da


kf kL2

1
=
T

Z

 12
|f (t)| dt
,
2

ed analogamente per la norma in Lp [0, T ].


Definizione 5.1.4. Nello spazio L2 [0, 2] chiamiamo sistema trigonometrico
la famiglia di funzioni
{1, sin x, cos x, sin 2x, cos 2x, sin 3x, cos 3x, . . . , }
tutte di periodo 2.
Proposizione 5.1.5. Il sistema trigonometrico ortogonale in L2 [0, 2].

476

CAPITOLO 5. SERIE DI FOURIER

Dimostrazione. Come per molte altre propriet delle serie di Fourier, anche
questa si dimostra pi agevolmente passando dalle funzioni trigonometriche
ad esponenziali complessi. Rammentiamo (Sezione 1.1) che
eit = cos t + i sin t.
Da qui
eimt eimt
eikt + eikt
;
sin(mt) =
k, m Z.
2
2i

Ma il sistema eikt kZ ortogonale in L2 [0, 2]. Infatti:
cos kt =

ikt

imt

e ,e

1
=
2
(

ikt imt

e e

1
ei(km)t
2i(km)

i2

Z 2
1
dt =
ei(km)t dt
2 0
se k = m

(5.1)

(5.2)

se k 6= m.

Esercizio 5.1.6. Si verichi lultima uguaglianza (5.2) anche passando alle


parti reale e immaginaria ed applicando le formule di prostaferesi.

Da qui e da (5.1) segue che, se k 6= m e uk (t) = cos kt, vm (t) = sin(mt),


si ha:
(uk , vm ) = 0
e analogamente
(uk , um ) = 0 = (vk , vm ),
mentre, per k 6= 0,
1
(uk , uk ) =
2

1
1
cos kt dt = =
2
2
2

e, per k = 0,
1
(1, 1) =
2

sin2 kt dt = (vk , vk ) ,
0

1 dt = 1 .
0

5.1. IL SISTEMA TRIGONOMETRICO

477

Esercizio 5.1.7. Dimostriamo che


(uk , uk ) = (vk , vk ) =

1
2

direttamente con integrali di funzioni a valori reali, invece che passando per
integrali di esponenziali complessi.

Svolgimento. Si ha sin(t + 2 ) = cos t per ogni t, quindi


Z 2+
Z 2
Z 2
2

2
2
cos t dt =
sin (t + ) dt =
sin2 t dt.

2
0
0
2
Grazie al Lemma 5.1.1, lultimo integrale uguale a
Z 2
sin2 t dt.
0

Quindi si ha
1
2

2
2

sin t dt =

kv1 k2L2

ku1 k2L2

1
=
2

cos2 t dt.

Invece di calcolare questo integrale con il metodo di integrazione per sostituzione (Teorema 1.22.1), possiamo ottenere il risultato cos:
Z 2

Z 2
Z 2
1
2
2
sin t dt +
cos t dt
sin2 t dt =
2
0
0
0
Z
1 2
=
1 dt = .
(5.3)
2 0
Quindi
kv1 k2L2

1
=
2

1
sin t dt =
2
2

sin2 t dt = ku1 k2L2 = 1 .

Ora, per trattare il caso di kuk k2 e kvk k2 , osserviamo che vale il seguente
Lemma 5.1.8. Se f periodica di periodo T e g(t) = f (kt) per qualche
intero positivo k, allora
Z T
Z T
g(t) dt =
f (t) dt.
0

478

CAPITOLO 5. SERIE DI FOURIER

Dimostrazione.
Z

g(t) dt =

f (kt) dt =

Z
1 kT
f (t) dt
=
k 0
Z T
1
k
f (t) dt
=
k 0

dove lultima uguaglianza segue dalla periodicit di f .

Completiamo ora la dimostrazione dellEsercizio 5.1.7.


Osserviamo che uk (t) = cos kt = u1 (kt) e analogamente per vk . Dal
Lemma 5.1.8 segue che
kuk kL2 = ku1 kL2 = 1

kvk kL2 = kv1 kL2 = 1

per ogni k.

Nota 5.1.9. Consideriamo il dilatato g(t) = f (t) di una funzione f , periodica


di periodo T (qui R, 6= 0). Allora g una funzione periodica di periodo
T / e, come nella dimostrazione del Lemma 5.1.8, si ha
Z

g(t) dt =

1
f (t) dt =

f (x) dx.
0

Pertanto, con la normalizzazione scelta alla ne della Denizione 5.1.3, troviamo che, per ogni T ,
Z
Z
Z T
1 T
1
1 T
2
2
2
|g(t)| dt =
|f (t)| dt =
|f (x)|2 dx = kf k2L2 [0,T ] .
kgkL2 [0,T ] =
T 0
T 0
T 0
Ad esempio, le funzioni u
ek (t) = sin(2kt) e vek (t) = cos(2kt) vericano
1
ke
uk k2L2 [0,1] = kuk k2L2 [0,2] = ,
2

e analogamente per vk . Quindi il sistema trigonometrico


o
n

1, 2 sin(2t), 2 cos(2t), 2 sin(4t), 2 cos(4t), . . .

5.1. IL SISTEMA TRIGONOMETRICO

479

ortonormale in L2 [0, 1]. Analogamente il sistema

ortonormale in L2 [0, 1].

 2ikt
e
kZ

Ora riassumiamo:
Corollario 5.1.10. (i) Il sistema
o
n

1, 2 sin t, 2 cos t, 2 sin 2t, 2 cos 2t, . . .

ortonormale in L2 [0, 2], e pi in generale il sistema





2t
2t
4t
4t
1, 2 sin
, 2 cos
, 2 sin
, 2 cos
,...
T
T
T
T
ortonormale in L2 [0, T ] con la norma definita da kf k2L2 [0,T ] =

(ii) il sistema

1
2T

RT
0

|f |2 dt ;

{eikt }kZ
ortonormale in L2 [0, 2], e pi in generale il sistema
{e2ikt/T }kZ
ortonormale in L2 [0, T ]
Per passare dalluno allaltro di questi due sistemi ortogonali si usa un
semplice cambiamento di base, basato sulle identit (5.1): se uk (t) = cos kt,
vk (t) = sin kt e ek (t) = eikt si ha





1
1 1
ek
uk
per k 6= 0,
=
ek
vk
2 i i
e u0 = e0 .
quindi ovvio che uno di questi due sistemi ortonormali completo in
L2 [0, 2] se e solo se lo laltro.
Vedremo in seguito che questi due sistemi sono completi.

480

CAPITOLO 5. SERIE DI FOURIER

Nota 5.1.11. La normalizzazione dei sistemi ortogonali in un intervallo, ad


esempio [, ], naturalmente dipende dalla normalizzazione della misura
di Lebesgue sullintervallo. Ad esempio, se invece di normalizzare la misura
in maniera che la massa totale dellintervallo sia 1, ossia di considerare la
dx
misura d := 2
, si usa la misura non normalizzata dm := dx, come allinizio
dellEsempio 4.4.2, allora la massa
totale dellintervallo diventa 2 e la norma
2
L della funzione 1
diventa 2, quella delle funzioni sin
nx e cos nx per
ikx
n > 1 risulta essere , mentre la norma di e diventa 2.
Invece, i coecienti di Fourier rimangono invariati, perch sono dati dal
rapporto dei due prodotti scalari deniti in (4.2), dove numeratore e denominatore cambiano entrambi proporzionalemnte alla normalizzazione della
misura.

5.2

Sviluppi di Fourier di funzioni in L2 [0, T ]

Scriviamo lo sviluppo nel sistema trigonometrico: per ogni f L2 [0, 2] lo


sviluppo ortonormale
(f, 1) +
=

(f,

2cos kt) 2cos kt +


(f, 2sin kt) 2sin kt
k=1

k=1

1
f (t) dt +
2 0
Z 2



 Z 2
X
1
1
f (t) cos kt dt cos kx +
f (t) sin kt dt sin kx .

0
0
k=1

Per indicare che questo lo sviluppo ortonormale di f rispetto al sistema


trigonometrico scriveremo:
f (x)
dove
1
ak =

a0 X
(ak cos kx + bk sin kx)
+
2

(5.4)

k=1

f (t) cos kt dt,

1
bk =

f (t) sin kt dt.

(5.5)

Poich, a parte il caso banale di sin 0x 0, le funzioni en (x) = cos(nx)


oppure sin(nx) vericano ken k2 = 1/2 (identit (5.2) ed Esercizio 5.1.7),

5.2. SVILUPPI DI FOURIER IN L2

481

per k > 0 questi sono precisamente i coecienti di Fourier di f introdotti


nella Denizione 4.1.10, rispetto al sistema ortogonale dato dalle funzioni
1, cos(nx) e sin(nx) (n intero positivo) ed anche rispetto al corrispondente
sistema normalizzato del Corollario 5.1.10 (i); si noti per che, nel caso k = 0,
ossia per la funzione costantemente 1, si ha k1k2 = 1, e quindi il coeciente
1
di Fourier della Denizione 4.1.10 vale 2
(f, 1) = a0 /2: questo spiega perch
abbiamo scritto a0 /2 in (5.4).
Nota 5.2.1. Dobbiamo usare il simbolo , diverso da = , dato che non
sappiamo ancora se la serie converge a f , perch non abbiamo dimostrato che il sistema completo (lo dimostreremo in seguito nel Teorema 5.13.3).
Analogamente scriviamo
f (x)

ck eikx

(5.6)

f (t)eikt dt.

(5.7)

k=

dove
1
ck =
2

I coecienti ck si chiamano coefficienti di Fourier di f in forma complessa.


Le serie (5.4) e (5.6) si chiamano, rispettivamente, serie di Fourier di f in
forma reale e complessa.

Definizione 5.2.2. Nel seguito scriveremo fb(k) invece di ck in (5.7).

Esercizio 5.2.3. Per ogni k Z si ha fb(k) = fb(k).

Proposizione 5.2.4. I coefficienti di Fourier di f sono una successione che


tende a zero allinfinito:
lim ak = lim bk = lim fb(k) = 0.

Dimostrazione. Segue immediatamente dalla disuguaglianza di Bessel (Corollario 4.1.9)

482

CAPITOLO 5. SERIE DI FOURIER

Proposizione 5.2.5. Fra i coefficienti di Fourier di f in forma reale e


complessa intercorre la seguente relazione: per k > 0,
1
fb(k) = ck = (ak ibk )
2
1
fb(k) = ck = (ak + ibk ) ,
2

o equivalentemente, per k > 0,

ak = fb(k) + fb(k)


bk = i fb(k) fb(k) .

Inoltre, se f a valori reali, allora ak , bk R e ck = ck .

Dimostrazione. Segue dallidentit (5.1) della Proposizione 5.1.5.

Se si considerano funzioni L2 [0, T ], dove T > 0, allora si ottengono risultati analoghi dilatando lintervallo [0, 2] in [0, T ]: il sistema ortonormale in
forma complessa diventa
n 2ikt o
e T
kZ

ed in forma reale

2kt
2kt
1, 2 cos
, 2 sin
T
T

.
kN

Corollario 5.2.6. Per ogni f L2 [0, T ], sia k = 1, 2 . . . e scriviamo


Z
2kt
2 T
f (t) cos
dt
ak =
T 0
T
Z
2 T
2kt
bk =
f (t) sin
dt
T 0
T
Z
1 T
b
f (t)e2ikt/T dt
f (k) =
T 0

i coefficienti di Fourier in forma reale o complessa (cio rispetto ai sistemi trigonometrici in forma reale o complessa in L2 [0, T ] considerati nella
Proposizione 5.2.5). Allora la serie di Fourier in forma reale


x
x 
a0 X 
ak cos 2k
+ bk sin 2k
+
2
T
T
k=1

5.2. SVILUPPI DI FOURIER IN L2


ed in forma complessa

k=

483

fb(k)e2ikx/T

convergono entrambe (alla stessa funzione) in L2 [0, T ].


Dimostrazione. Questo niente altro che il Corollario 4.2.3 del Capitolo 1.
Il fatto che le due serie convergono alla stessa somma dovuto alla identit
ak cos kx + bk sin kx = fb(k)eikx + fb(k)eikx ,

che segue dalla Proposizione 5.2.5. Si osservi che lo stesso fatto sarebbe seguito subito, per il Corollario 4.1.9 (ii), dal fatto che le due serie sono due
sviluppi ortonormali della stessa funzione rispetto a due sistemi ortonormali
diversi, se si fosse dimostrato che questi sistemi sono completi. Per al momento non abbiamo ancora dimostrato la completezza: la dimostreremo nel

Teorema 5.13.3.
Nota 5.2.7. Per ogni f L2 , la disuguaglianza di Bessel (Corollario 4.1.9)
dice che


X
b 2
f (k) < kf k2L2 [0,2] .
k=

Dopo che avremo dimostrato la completezza del sistema trigonometrico, questa disuguaglianza diventer unuguaglianza, lidentit di Parseval (Nota
4.3.3):


X
b 2
f (k) = kf k2L2 [0,2] .
k=

Esercizio 5.2.8. (i) Se f pari, cio f (x) = f (x) per ogni x, allora bk = 0
per ogni k, e quindi la serie di Fourier di f diventa in soli coseni:


x
a0 X
;
+
ak cos 2k
2
T
k=1
(ii) Se f dispari, cio f (x) = f (x) per ogni x, allora ak = 0 per ogni
k, e quindi la serie di Fourier di f in soli seni:


X
x
bk sin 2k
T
k=1

484

CAPITOLO 5. SERIE DI FOURIER

Nota 5.2.9. (Sviluppo trigonometrico in soli seni od in soli coseni.)


Anticipando un argomento che verr analizzato in seguito nel Lemma 5.13.6,
notiamo dal precedente Esercizio 5.2.8 che le funzioni pari hanno serie di
Fourier i cui termini sono solo coseni, mentre per le funzioni dispari sono
solo seni. Ma ogni funzione f nellintervallo [0, ) pu essere prolungata
allintervallo [2, 2) (centrato nellorigine) sia in maniera pari sia in maniera dispari. Da questi due prolungamenti si ricavano due diversi sviluppi
di Fourier, il primo in soli seni ed il secondo in soli coseni, i quali, ristretti
allintervallo originale [0, , 2), sono sviluppi trigonometrici diversi associati
alla stessa funzione f in [0, , 2) (ma nessuno dei due in generale la serie
di Fourier di f in questo intervallo, perch lo sviluppo di Fourier in [0, , 2)
include sia i seni sia i coseni).
Vedremo nel Lemma 5.13.6 che questi due sviluppi convergono entrambi a f
in L2 [0, , 2) se f L2 , ed in condizioni ragionevolmente generali su f essi
convergono entrambi a f puntualmente.

Esercizio 5.2.10. Sia f una funzione in L1 , ossia periodica (di periodo,


R 2
diciamo, 2) e tale che 0 |f (x)| dx < . Scriviamo fb(n) = cn =
R 2
f (x) einx dx.
0

(i) Sia g(x) = t f (x) = f (x t) il traslato di passo t di f . Allora b


g (n) =
int b
e
f (n).

(ii) Mostrare che, per ogni t, i traslati cos n(x t) e sin n(x t) di cos nx e
sin nx appartengono allo spazio vettoriale bidimensionale generato da
cos nx e sin nx, calcolarne i coecienti dello sviluppo rispetto a questa
base e mettere il risultato in relazione con la parte (i) dellEsercizio.

(iii) Mostrare che, se h(x) = einx f (x), allora per ogni k Z si ha b


h(k) =
b
h(k n) .

5.3

Esempi di sviluppi di Fourier in L2

Esempio 5.3.1. Sia f (x) = x in 6 x < (periodicizzata al di fuori di


questo intervallo, se si preferisce considerare funzioni periodiche). La funzio-

5.3. ESEMPI DI SVILUPPI DI FOURIER IN L2

485

ne pari, e quindi i coecienti di Fourier {an } rispetto ai coseni sono tutti


nulli, perch sono lintegrale sullintervallo [, ] (che centrato nellorigine) della funzione dispari f (x) cos nx (questa funzione dispari perch il
prodotto della fuinzione dispari x con la funzione pari cos nx). I coecienti
di Fourier rispetto ai seni sono


Z
Z
cos nx i
1
1 h
1
x
+
x sin nx dx =
cos nx dx .
bn =

n
n

Si noti che x cos nx una funzione dispari: pertanto


h
h
cos nx i
cos nx i
cos n
2
x
= 2 x
= 2
= (1)n+1
.
n
n
n
n

Daltra parte,
Z

1
cos nx dx =
n

cos u du =
n

cos u du = 0 ,

perch la funzione coseno a media nulla sul periodo. Combinando questi


calcoli otteniamo, per n = 1, 2 . . . ,
bn = (1)n+1

2
n

La serie di Fourier di f quindi


f 2

X
n=1

(1)n+1

sin nx
.
n

Lo stesso calcolo si svolge, anche pi agevolmente, per i coecienti di


Fourier cn = fb(n) rispetto agli esponenziali complessi. In eetti,
 inx 

Z
Z
1
1 inx
e
1
inx
b
f (n) =
+
x
f (x) e
dx =
e
dx
2
2
in in



 
(1)n
(i)n (i)n ()
1 einx
1
=i
+

,
=
2
in
in
in in
n
h inx i
perch ein
= 0 dal momento che ein = (1)n = ein . Quindi fb(n) =
n

. In particolare, viene vericata la relazione che lega i coecienti di


i (1)
n

486

CAPITOLO 5. SERIE DI FOURIER

Fourier in forma esponenziale ed in forma trigonometrica: fb(n) = cn =


(an ibn ) /2 (Proposizione 5.2.5).
Si noti che la funzione f periodica e discontinua (ha un salto agli estermi
del periodo), ed i suoi coecienti di Fourier tendono a zero come O(1/n).

Esempio 5.3.2. Ora scegliamo f (x) = |x| per x [, ) (e periodicizziamo


questa funzione al di fuori di tale intervallo). Allora la funzione f pari, ed
i coecienti di Fourier rispetto alle funzioni seno sono nulli. Invece,
1
a0
=
2
2

1
|x| dx =

x dx =

,
2

e per k > 1
Z
2
|x| cos nx dx =
x cos nx dx
0




Z
1
sin nx
2

x
sin nx dx .
=

n
n 0
0

1
an =

Dei due termini allultimo membro, questa volta quello che si annulla il
primo, perch sin n = 0. Pertanto


2 1 cos nx
2
an =
=
((1)n 1) ,
2
n
n
n
0
ossia an = 0 se n pari e an = 4/(n2 ) se n dispari.
Si verichi che i coecienti di Fourier in forma esponenziale complessa
sono fb(n) = 0 se n pari e fb(n) = 2/(n2 ) se n dispari, di nuovo a
conferma della relazione nella Proposizione 5.2.5.
Si osservi anche che questa funzione periodicizzata continua ma la derivata ha punti di salto agli estremi dellintervallo, ed i coecienti di Fourier
tendono a zero come O(1/n2).

Esempio 5.3.3. Sia ora f (x) = 1 in 6 x < 0 e f (x) = 1 in 0 6 x <


(periodicizzata al di fuori dellintervallo [, ), se si preferisce considerare
funzioni periodiche). La funzione f dispari, e quindi tutti i coecienti di

5.3. ESEMPI DI SVILUPPI DI FOURIER IN L2

487

Fourier dei coseni sono nulli. Invece,


1
bn =

 Z

2 cos nx

sin nx dx +


0


Z
2
sin nx dx
sin nx dx =
0

2
(1 (1)n )
n

ovvero bn = 0 se n pari e bn = 4/(n) se n dispari. Lasciamo per esercizio


al lettore il calcolo dei coecienti di Fourier in forma esponenziale complessa.
Anche in questo esempio di funzione con discontinuit di tipo salto notiamo
che i coecienti di Fourier tendono zero come O(1/n).

Esercizio 5.3.4. ovvio che i coecienti di Fourier del polinomio trigonometrico g(x) 1 sono tutti nulli tranne a0 /2 che vale 1/2. Da questa osservazione e dal precedente Esempio 5.3.3 si ricavino, per linearit, i coecienti
di Fourier della funzione caratteristica dellintervallo [0, ) (che non n pari
n dispari).

Esempio 5.3.5. Ora scegliamo f (x) = x2 in 6 x < , periodicizzata al


di fuori di questo intervallo se si desidera considerare la funzione su tutto R.
La funzione pari e quindi i coecienti di Fourier rispetto ai seni sono nulli.
Si ha
Z
1
2
a0
=
x2 dx =
2
2
3
e, grazie alla parit,

 2


Z
x sin nx
2
2

x cos nx dx =
x sin nx dx

k
n 0
0
0


Z
4
4 h x cos nx i 1
+

cos nx dx = (1)n 2
=
n
n
n 0
n
0

2
an =

(abbiamo integrato due volte per parti ed usato le relazioni sin n = 0 e


cos n = (1)n ).
Ancora una volta, per questa funzione continua ma con derivata che ha un salto ai multipli di , troviamo coecienti di Fourier con velocit di decadimento
O(1/n2 ).

488

CAPITOLO 5. SERIE DI FOURIER

P 1
.) Dal precedente Esempio 5.3.5
Nota 5.3.6. (La somma della serie
n2
risulta che la serie di Fourier della funzione f (x) = x2 in [, ]

X
cos nx
2
+4
(1)n
.
2
3
n
n=1

Se sapessimo dimostrare che questa serie converge puntualmente alla funzione


f , ponendo x = ed usando la relazione cos n = (1)n otterremmo

X
1
2
=
n2
6
n=1

e per x = 0 otterremmo

(1)n+1

n=1

1
2
=
.
n2
12

In eetti vero che la serie di Fourier di f converge a f puntualmente ovunque, come dimostreremo in seguito nel Corollario 5.12.4, e quindi valgono le
due ultime identit.

Esempio 5.3.7. Ora consideriamo la funzione f (x) = 1 se /2 6 x 6 /2,


e f (x) = 0 per ogni x tale che /2 < |x| < . Anche questa funzione
pari, e quindi i suoi coecienti di Fourier bn rispetto ai seni sono nulli.
Per quanto riguarda i coecienti di Fourier an rispetto ai coseni, a0 /2 =
R
R /2
1/(2) f (x) dx = 1/(2) /2 dx = 1/2, e, per n > 0,
1
an =

/2

2
cos nx dx =

/2

/2

cos nx dx =
0

n
2
sin
,
n
2

ossia a2n = 0 e
a2n+1


2

1
2
= (1)n
sin n +
= (1)n
.
=
(2n + 1)
2
(2n + 1)
(n + 12 )

Ancora una volta, la funzione f ha discontinuit a salto, ed i coecienti di


Fourier decadono come O(1/n).

Esercizio 5.3.8. Si ricavi il risultato del precedente Esempio 5.3.7 da quello


dellEsercizio 5.3.4 e dalla propriet di traslazione (parte (i) dellEsercizio
5.2.10).

5.3. ESEMPI DI SVILUPPI DI FOURIER IN L2

489

Esercizio 5.3.9. Si estenda il risultato del precedente Esempio 5.3.7 al caso


in cui f sia la funzione caratteristica dellintervallo [A, A], con 0 < A < :
si dimostri che a0 /2 = A/, e, per n > 0, bn = 0 e
an =

2 sin An
.
n

Esempio 5.3.10. Sia f (x) = 0 se 6 x < 0 e f (x) = x se 0 6 x < .


Questa volta la funzione non n pari n dispari. I coecienti di Fourier
sono i seguenti. Abbiamo
Z
a0

1
x dx = .
=
2
2 0
4
Invece, per n > 0, usiamo ilidentit
Z

sin nx
cos nx dx =
n

=0

(5.8)

per ottenere



Z
1
1
x sin nx

x cos nx dx =
x sin nx dx

n
n 0
0
0


Z
1
1 h cos nx i
1 h x cos nx i

=
cos nx dx =
((1)n 1) ,
=
n
n
n
n
n
0
0
0

1
an =

1
bn =



Z
1 h x cos nx i 1
+

x sin nx dx =
x cos nx dx

n
n 0
0


h x cos nx i
1 x sin nx
+
n
n
n
0
0
h x cos nx i
1 cos n
1
=
= (1)n+1 ,
n

n
n
0

1
n

1
n

dove nel penultimo passaggio abbiamo usato lidentit (5.8).

490

CAPITOLO 5. SERIE DI FOURIER

Esempio 5.3.11. Si consideri la funzione f (x) = x se 0 6 x 6 e f (x) =


se < x < 2 (che, come al solito, si pu immaginare prolungata ad una
funzione periodica di periodo 2 su tutto R). Questa funzione non n pari
n dispari. I coecienti di Fourier sono
 2 

Z 2
a0
1
1
x
2
f (x) dx =
+
=
2
2 0
2
2 0
3 2
;
=
2
per n > 0, invece
Z
Z
Z
1
1 2
1
an =
x cos nx dx +
cos nx dx =
x cos nx dx ,
0

0
R 2
dal momento che cos nx dx = 0, perch una primitiva della funzione
coseno la funzione seno, che si annulla ai punti e 2. Daltra parte,


Z
Z
1
x sin nx

sin nx dx
x cos nx dx =
n
n 0
0
0
1 h cos nx i (1)n 1
=
=
n
n
n2
0
n

1
per n > 0.
perch sin n = 0. Dalle ultime due identit abbiamo an = (1)
n2
Inne,
Z
Z
1
1 2
bn =
x sin nx dx +
sin nx dx .
0

2
R 2

n)
,e
Ma sin nx dx = cosnnx = (1+(1)
n
Z
h x cos nx i 1 Z
x sin nx dx =
+
cos nx dx
n
n 0
0
0



1 sin nx
n+1
= (1)n+1
= (1)
+
n n
n
n
0

(questultimo calcolo si pu semplicare grazie allidentit (5.8)). Combinando le ultime tre identit si ottiene
1
1
1
1
bn = (1)n+1 + (1)n = .
n n
n
n

5.4. SVILUPPI DI FOURIER IN L1

491

Esercizio 5.3.12. Si sviluppi la funzione f del precedente Esempio 5.3.11 in


serie trigonometrica di soli coseni ed in serie di soli seni nel senso della Nota
5.2.9.

5.4

Sviluppi di Fourier di funzioni in L1 [0, T ]

I coecienti di Fourier sono deniti non solo per funzioni in L2 [0, T ] ma


anche, pi in generale, per funzioni in L1 [0, T ] (rammentiamo che L2 [0, T ]
L1 [0, T ], grazie alla Proposizione 1.17.1), perch


Z T
Z T
1

1


f (t) cos 2kt/T dt 6
|f (t)| |cos 2kt/T | dt
2T
2T 0
0
Z T
1
|f (t)| dt
6
2T 0
= kf kL1 [0,T ] ,
e analogamente



f (t) sin 2kt/T dt 6 kf kL1 ,

dove abbiamo abbreviato la notazione kf kL1 [0,T ] = kf kL1 (useremo la stessa


abbreviazione per tutte le norme Lp , 1 6 p 6 e talvolta scriveremo kf kp
invece di kf kLp ).
Quindi si pu studiare la serie di Fourier di ogni funzione in L1 [0, T ].
Abbiamo gi osservato (Proposizione 1.17.1) che, per p > 1, si ha linclusione
Lp [0, T ] L1 [0, T ]: pertanto ora possiamo studiare la serie di Fourier di
ogni funzione in Lp . Per p = 2, la serie di Fourier di f L2 converge in L2
(vedremo in seguito a quale somma) in base al Corollario 4.2.3.

5.5

Problematiche sulle serie di Fourier

Ora si pongono nuove domande interessanti. Ad esempio, per 1 6 p 6 ,


la serie di Fourier di f Lp [0, T ] converge nella norma di Lp ? In generale
questo falso per p = , perch una funzione L non necessariamente
continua, ma se una serie di Fourier (i cui termini sono chiaramente continui)
converge uniformemente, allora la sua somma deve essere continua (Teorema
1.3.33).

492

CAPITOLO 5. SERIE DI FOURIER

Per potremmo limitare lattenzione allo spazio delle funzioni continue in


[0, T ] con f (0) = f (T ) (chiameremo questo spazio C [0, T ]) munito della
norma uniforme, e chiederci se per ogni f C [0, T ] la serie di Fourier
converge uniformemente (la condizione f (0) = f (T ) necessaria perch
vericata da tutti gli addendi della serie di Fourier, ed il limite uniforme, se
esiste, anche limite puntuale).
Quello che sappiamo che C [0, T ] L2 [0, T ] (Proposizione 1.18.6) e Lp [0, T ]
L2 [0, T ] per 2 < p 6 (Proposizione 1.17.1), e quindi le serie di Fourier di
f C o f Lp , 2 < p < , convergono nel senso di L2 , ma non sappiamo
se convergono nelle norme L o Lp (per f L ma f
/ C sappiamo che
non si ha questa convergenza per quanto osservato sopra).
Inne, per 1 6 p < 2, Lp [0, T ] L2 [0, T ] e da quanto detto nora non
possiamo concludere nulla della convergenza nella norma in Lp . Sappiamo
per che, se f L2 [0, T ], allora, per 1 6 p < 2, f Lp [0, T ] ed esiste una
costante C > 0 che dipende solo da p e T tale che kf kp 6 C kf k2 (??),
ed inoltre la serie di Fourier di f converge nella norma L2 . Ma allora la
successione delle sue somme parziali di Cauchy anche nella norma Lp , per
la disuguaglianza sulle norme, e quindi converge anche nella norma Lp , per
la completezza di Lp (converge alla stessa somma a cui converge in L2 - la
dimostrazione di questo fatto elementare lasciata per esercizio -, quindi la
somma appartiene comunque a L2 , ma la convergenza vale anche rispetto
alla norma Lp ). Tutto questo, per, vale solo per le funzioni in L2 Lp , non
per tutto Lp . In realt, si pu dimostrare che le serie di Fourier di funzioni
Lp convergono nella norma di Lp per tutti i p con 1 < p < : questo un
risultato delicato, che proveremo in seguito (Corollario 7.6.38). Sappiamo che
questo non succede per p = , e fra qualche riga vedremo che non succede
per p = 1.
Inoltre ci potremmo chiedere se la serie di Fourier di una funzione Lp o
C converge puntualmente. Questa una domanda molto naturale, a cui
daremo una risposta positiva solo per C , ma con pesanti ipotesi aggiuntive.
Non si pu fare molto di pi, perch si possono costruire esempi di funzioni
in C la cui serie di Fourier diverge in ogni punto razionale in [0, T ].
stato per dimostrato da Lennart Carleson nel 1963 che la serie di Fourier
di una funzione in L2 [0, T ] converge puntualmente tranne che in un insieme
di misura di Lebesgue nulla (quindi questo fatto vale anche per C [0, T ]
L2 [0, T ]). Questo teorema stato esteso a Lp [0, T ], 1 < p < , da Richard
Hunt nel 1964. Esso non vale per L1 [0, T ]: fu costruita da Kolmogorov

5.5. PROBLEMATICHE SULLE SERIE DI FOURIER

493

una funzione in L1 [0, T ] la cui serie di Fourier diverge ovunque (quindi, in


particolare, le serie di Fourier di funzioni L1 in generale non convergono
neppure nella norma di L1 ). Anche questo risultato di Kolmogorov delicato:
lo proveremo nel Capitolo 7.
Persino per funzioni continue, la serie di Fourier pu divergere puntualmente quasi ovunque (ed anche questo lo proveremo nel Capitolo 7). Per
questa ragione, lipotesi di continuit non suciente per enunciare un buon
teorema di convergenza puntuale per serie di Fourier, e tanto meno un buon
teorema di convergenza uniforme. Vedremo che, per questo tipo di enunciati,
occorre assumere propriet di ulteriore regolarit, come ad esempio la derivabilit con derivata continua, o anche ipotesi meno forti, ma pur sempre
collegate in qualche senso debole alla derivabilit, come la regolarit di Lipschitz o di Hlder, come vedremo in questo Capitolo nella Sezione 5.12. Se
condizioni di regolarit di tipo C 1 sono vericate solo a tratti, con un numero
nito di salti, allora ovviamnete si perde la convergenza uniforme delle serie
di Fourier, ma vedremo che si mantiene quella puntuale. Per le condizioni di
regolarit che dovremo richiedere per la convergenza puntuale sono di poco
pi deboli che per la convergenza uniforme, ed infatti in questo Capitolo ne
daremo la dimisdtrazione classica, il cui nucleo centrale quasi unicato per
convergenza puntuale ed uniforme. In seguito, nel Capitolo 7, forniremo una
dimostrazione alternativa assai pi semplice per la convergenza puntuale e
per quella uniforme: il lettore non interessato allo sviluppo storico di questi
temi invitato a sostituire i teoremi di convergenza di questo Capitolo con
quelli del Capitolo 7.
Unaltra questione interessante il paragone fra serie di Fourier e serie
di Taylor. Sappiamo che la serie di Taylor (con centro, diciamo, 0) di una
funzione f C una serie di potenze. Essa converge alla funzione f ,
uniformemente allinterno dellintervallo di convergenza, che specicato dal
suo raggio di convergenza, non necessariamente nito. Laddove essa converge, le sue somme parziali si "adagiano" successivamente in modo via via
pi aderente al graco di f . Per basta cambiare il valore di f al centro di
sviluppo e la serie smette di esistere (perch f non pi continua).
Invece se si cambia il valore di f in un punto, o persino in un qualunque
insieme di misura zero, i coecienti di Fourier non cambiano perch sono dati
da integrali. Vedremo che per una vasta classe di funzioni continue la serie
di Fourier converge uniformemente. Ma le somme parziali non seguono via
via meglio la geometria del graco di f : esse si adagiano intorno al graco di

494

CAPITOLO 5. SERIE DI FOURIER

0.0

0.5

f10

1.0

1.5

f in media, oscillandovi attorno, e coincidono con esso di solito solo in una


successione di punti nodali equispaziati in numero uguale allordine della
somma parziale.

0.0

0.5

1.0

1.5

2.0

2.5

3.0

Figura 5.2: Tipo di convergenza degli approssimanti di Fourier: punti nodali

Vedremo in seguito un altro paragone interessante fra sviluppi di Taylor e


di Fourier. Se si modica una funzione f C lontano dal centro di sviluppo
(in questo caso 0), la serie di Taylor non cambia (dipende solo dalle derivate di
f in 0), ma naturalmente non converge alla nuova funzione nellintorno in cui
si apportata la modica se ci convergeva prima. Invece se si modica una
funzione in un insieme di misura di Lebesgue positiva, tutti i coecienti di
Fourier ovviamente cambiano, ma in ogni intervallo contenuto strettamente
nella zona dove la funzione non stata modicata la somma della nuova serie
di Fourier coincide con quella della serie originale (principio di localizzazione:
Nota 5.9.10).

5.6. SVILUPPI DI FOURIER CON PERIODO ARBITRARIO

5.6

495

Sviluppi di Fourier di funzioni periodiche


con periodo arbitrario

C una corrispondenza naturale fra le funzioni denite nellintervallo [0, T ]


che vericano f (0) = f (T ) e le funzioni periodiche su R di periodo T (cio
che vericano f (t+T ) = f (t) per ogni t R). Infatti, consideriamo la mappa
da
FT = {funzioni periodiche di periodo T }
a

F [0, T ] = {funzioni f definite in [0, T ] con f (0) = f (T )}

data dalla restrizione, cio dal considerare una funzione in FT come ristretta a
[0, T ]. Questa mappa lineare e invertibile: linversa data dal prolungamento periodico a tutto R (di periodo T ) di una funzione denita originariamente
solo in [0, T ].
Se f L2 [0, T ], allora possiamo introdurre una norma L2 anche sulla
funzione fe che estende f a tutto R in maniera periodica:
s
Z T

1
e
|f (t)|2 dt .
f =
2T 0
2

chiaro che in questo modo introduciamo una norma L2 sullo spazio delle
funzioni su R periodiche di periodo T e di quadrato integrabile sul periodo.
Chiameremo questo spazio L2 o, se necessario specicare il periodo, L2T .
anche chiaro che
: L2T L2 [0, T ]

denita pi sopra un isomorsmo isometrico. In generale, per comodit, preferiamo rappresentare le funzioni come periodiche di periodo T anzich come denite solo in [0, T ]. Grazie al Lemma 5.1.1 possiamo scrivere i
coecienti di Fourier come
2
ak =
T
2
bk =
T

Z
Z

T /2

f (t) cos

2kt
dt
T

f (t) sin

2kt
dt
T

T /2
T /2
T /2

(5.9)

496

CAPITOLO 5. SERIE DI FOURIER

ed in particolare, nel caso di T = 2,


Z
1
ak =
f (t) cos kt dt

Z
1
f (t) sin kt dt.
bk =

Osserviamo che la condizione di periodicit in
CT = {f continue su R periodiche di periodo T }
si riduce alla condizione f (0) = f (T ) in C [0, T ] (che abbiamo gi introdotto
in C [0, T ]) (vedella Sezione 2.4). Questa condizione necessaria per poter
estendere una funzione continua in [0, T ] a una funzione continua su R e
periodica di periodo T . Invece essa non necessaria per estendere funzioni
da L2 [0, T ] o Lp [0, T ] (1 6 p < ) a tutto R in maniera periodica, perch le
funzioni Lp in realt sono classi di equivalenza (Denizione 1.16.16), in cui il
valore puntuale pu essere modicato senza modicare la classe (cio senza
cambiare la funzione), in qualunque insieme di misura di Lebesgue zero (in
particolare sulla successione {kT }kZ ). Quindi tutto ci che abbiamo detto
per L2 [0, T ] (o Lp [0, T ]) si pu trasferire allo spazio
L2T = {f : R 7 C : f (t + T ) = f (t)

per quasi ogni t R



Z T
2
e
|f (t)| dt <
0

RT
(per Lp lintegrale 0 |f (t)|p dt).
Per semplicit, indichiamo L22 con L2 e Lp2 con Lp .

5.7

Scelta del periodo

Dedichiamo una brevissima Sezione a questo argomento solo per enfasi. Nel
resto di questo libro, quando prenderemo in esame la trasformata di Fourier,
faremo uso di esponenziali complessi e2it , dove la frequenza un numero
reale arbitrario. Poich in generale non intero, questi esponenziali sono
funzioni periodiche ma con periodo diverso dalluno allaltro. Nondimeno,
sarebbe naturale ora ssare lattenzione su sistemi ortogonali fabbricati con

5.8. SOMME DI DIRICHLET

497

gli esponenziali con frequenze intere e2int , che sono periodici di periodo 1.
Invece, per evitare di trascinarci da una riga allaltra il fattore moltiplicativo
2 allesponente, scegliamo, solo in questo Capitolo, esponenziali di periodo
2, ossia del tipo eint . Mettiamo in guardia il lettore che questa scelta non
viene mantenuta nelle parti successive del libro, ad esempio nel Capitolo 10:
si veda la Nota 10.3.4 riguardo alla motivazione di queste scelte. Invitiamo
il lettore a modicare per esercizio ogni enunciato e dimostrazione di questo
Capitolo onde riportarlo al caso di periodo 1.

5.8

Somme di Dirichlet

Vogliamo trovare condizioni sotto le quali le somme parziali (5.4)


n

Sn (x) Sn f (x) :=

a0 X
+
(ak cos kx + bk sin kx)
2
k=1

della serie di Fourier convergono a f in L2 , o nella norma uniforme, o almeno


puntualmente (per semplicit, in questa capitolo scriviamo Sn (x) invece di
Sn f (x), senza ambiguit perch consideriamo sempre una stessa funzione f ,
ma nel seguito ritorniamo alla notazione completa). Per questo scopo dobbiamo stimare Sn (x) f (x).
Anticipiamo subito che il risultato per la norma L2 seguir immediatamente
dalla identit di Parseval (Nota 4.3.3) dopo che avremo provato la completezza nello spazio di Hilbert L2 del sistema trigonometrico {cos nx, sin nx}:
questa completezza seguir dal risultato relativo alla convergenza uniforme.
Anticipiamo anche che le stime classiche che stiamo per presentare sono faticose e delicate: il lettore interessato ad una dimostrazione facile del risultato
sulla convergenza puntuale di serie di Fourier, ed a una facile di un risultato
pi debole sulla convergenza uniforme, pu rimpiazzare una parte di questo
Capitolo con la Sezione 7.2.
Cominciamo con lo studiare Sn (x). Segue dalle espressioni di ak e bk date
nelle formule (5.4) che

498

CAPITOLO 5. SERIE DI FOURIER

Z 2
n Z
1 X 2
1
f (t) dt +
f (t) (cos kt cos kx + sin kt sin kx) dt
Sn (x) =
2 0

0
k=1
#
Z 2 "
n
1
1 X
cos(k(t x)) f (t) dt
+
=
0
2
k=1
Z 2
1

Dn (t x)f (t) dt
0
dove

1 X
cos kx
Dn (x) = +
2 k=1

si chiama somma di Dirichlet di ordine n.


Proposizione 5.8.1.

(i) Per ogni n, Dn pari

(ii) Per ogni n


1

Dn (u) du = 1 .

Dimostrazione. ovvia. Ad esempio, per provare la parte (ii), si osservi che


1

1
Dn (u) du =

1
=
2

1X
1
du +
2
k=1

cos(ku) du

du = 1 .
0

Poich Dn pari, si ha
1
Sn (x) =

2
0

Dn (x t)f (t) dt

1
(Dn f ) (x) ,

dove il simbolo rappresenta loperazione di convoluzione, denita, per h, f


in L1 e periodiche di periodo 2, da
Z 2
h f (x) =
h(x t)f (t) dt .
0

5.8. SOMME DI DIRICHLET

499

Per maggiori dettagli si veda la Sezione Sezione 6.1 in seguito, in particolare


la Denizione 6.1.2.
Osserviamo anche che si ha
Z
Z
1 2
1 2
Dn (x t)f (t) dt =
Dn (u)f (u + x) du.
(5.10)
Sn (x) =
0
0
Ora troviamo una formula esplicita (non solo come sommatoria) per le somme
di Dirichlet Dn .

Proposizione 5.8.2. Per ogni n

sin((n+ 21 )x)
2 sin x2
Dn (x) =
n+ 1
2

se
se

x 6= 2m

x = 2m

mZ

m Z.

Dimostrazione. Se x = 2m con m Z, allora cos kx = 1 e Dn (x) = n + 12 .


Invece, se x 6= 2m m Z, si ha eix 6= 1, e quindi, per la formula di somma
geometrica (Sezione 1.1) si ha
n

1 X
Dn (x) =
cos kx
+
2 k=1

n
X
1
=
eikx
+ Re
2
k=1

Ma

(5.11)
!

!
n
X
1
= + Re
eikx
2
k=0


1
1 ei(n+1)x
= + Re
.
2
1 eix

ei(n+1)x 1
1 ei(n+1)x
=
1 eix
eix 1
1 ei(n+1)x 1
= ix ix
x
e 2 e 2 ei 2
1 ei(n+1)x 1
=
x
sin x2
2iei 2


x
iei 2 ei(n+1)x 1
=
.
2 sin x2

500

CAPITOLO 5. SERIE DI FOURIER

Poich, se z = x + iy C, si ha Re(iz) = Re(ix y) = Im(z), da questo


segue:

Re

1 ei(n+1)x
1 eix

Im ei 2 ei(n+1)x 1
=
2 sin x2


1
x
Im ei(n+ 2 )x ei 2
=
2 sin x2
sin(n + 12 )x + sin x2
=
2 sin x2
sin(n + 12 )x 1
=
+ .
2 sin x2
2



Nota 5.8.3. Lidentit



sin (n + 12 )x
Dn (x) =
2 sin x2

se x 6= 2k, k Z

si pu anche dimostrare per induzione.


Dimostrazione. Lidentit vera per n = 0: in tal caso D0 (x) = 12 .
Inoltre, se vera per n = n0 1, cio se

n0 1
sin (n0 12 )x
1 X
,
+
cos kx =
2 k=1
2 sin x2
allora rimane vera per n = n0 . Infatti,

5.9. STIME PUNTUALI ED UNIFORMI PER IL RESTO N-ESIMO 501

n0
n0 1
1 X
1 X
+
cos kx =
+
cos kx + cos n0 x
2
2
k=1
k=1

sin (n0 21 )x
=
+ cos n0 x
2 sin x2

sin (n0 21 )x + 2 cos n0 x sin x2
=
2 sin x2

sin n0 x cos x2 cos n0 x sin x2 + 2 cos n0 x sin x2


2 sin x2

sin n0 x cos x2 + cos n0 x sin x2


=
2 sin x2

sin (n0 + 21 )x
.
=
2 sin x2

5.9

Stime puntuali ed uniformi per il resto nesimo della serie di Fourier

Grazie al Lemma 5.1.1, equivalente calcolare gli integrali sullintervallo


[, ] invece di [0, 2]. Allora segue dalla identit (5.10) e dalla Proposizione
5.8.1 (ii) che per ogni n e per ogni x
Z
1
Dn (u) (f (x + u) f (x)) du
(5.12)
Sn f (x) f (x) =

Z
1
Dn (u) (u f ) (x) du
=

dove u f lincremento di f di passo u:
Definizione 5.9.1. u f (x) = f (x + u) f (x).

502

CAPITOLO 5. SERIE DI FOURIER

Ora dalla Proposizione 5.8.2 segue che, per < x < pi,

sin (n + 12 )x
Dn (x) =
2 sin x2
=

sin nx cos x2 + cos nx sin x2


2 sin x2

1
sin nx
cos n x.
x +
2 tan 2
2

(5.13)

Teorema 5.9.2. Per ogni f L1 (cio periodica di periodo, diciamo, 2


ed integrabile con integrale finito sul periodo), per ogni n, ogni x e ogni
(0, ), si ha
1
Sn f (x) f (x) =


1
sin nu
+ cos nu (u f ) (x) du
2 tan u2
2

sin nu
(u f ) (x) du + n (x, )
u

dove n (x, ) converge a zero quando n , puntualmente per ogni x ed


uniformemente rispetto a x in ogni intervallo chiuso a 6 x 6 b dove f
limitata.
Dimostrazione. Da (5.12) e (5.13) si ottiene
Z

1
Sn f (x) f (x) =

sin nu
(u f ) (x) du
2 tan u2

<|u|<

1
+
2

sin nu
(u f ) (x) du
2 tan u2

cos nu (u f ) (x) du.

Perci
1
Sn f (x) f (x) =

sin nu
(u f ) (x) du + n (x, )
u

5.9. STIME PUNTUALI ED UNIFORMI PER IL RESTO N-ESIMO 503


dove
1
n (x, ) =

1
+
2

sin nu
e(u) (u f ) (x) du

cos nu (u f ) (x) du

Ora poniamo

e(u) =

(u) =

1
2 tan
1
2 tan

e
(u) =

u
2

1
u

se

u
2

e(u)

se

1
2

<u<

6 |u| < .

< u <

(5.14)

altrimenti.

< u <

(5.15)

altrimenti

Quindi possiamo riscrivere n (x, ) come segue:


Z
n (x, ) =
sin nu (u) (u f ) (x) du

Z
+
cos nu (u) (u f ) (x) du .

(5.16)

Per completare la dimostrazione abbiamo bisogno di alcuni risultati preliminari.


Lemma 5.9.3. La funzione definita in (5.14) nella dimostrazione del
Teorema 5.9.2 limitata.
Dimostrazione. Per 0 < |u| < < ,
u 2 tan u2
1
O(u3)
1

=
=
= O(u)
2 tan u2
u
2u tan u2
O(u2)

per u 0,

504

CAPITOLO 5. SERIE DI FOURIER

in base allo sviluppo di Taylor di tan u con centro in 0.


Perci
1
1
u
2 tan 2
u
tende a zero per u 0, e ovviamente limitata in ogni intervallo chiuso
1
[, ] [, ] (si osservi che 2 tan
t 0 se t ). Quindi tale funzione
2
limitata in [, ] per ogni (da una costante che dipende da ).

Lemma 5.9.4. (La traslazione un operatore continuo su L1 .) Per


ogni f L1 (R)
Z
|f (x + ) f (x)| dx = 0
lim
0

Pi in generale, per ogni f Lp (R), con 1 6 p < si ha lim0 kf f kp =


0 e, se f uniformemente continua, anche lim0 kf f k = 0.

Dimostrazione. Sappiamo che lo spazio Cc (R) delle funzioni continue a supporto compatto denso in L1 (R) (Proposizione 1.18.6): per ogni > 0, per
ogni f L1 (R) esiste g Cc (R) tale che
Z

kf gk1 =
|f (x) g(x)| dx < .
3

Allora, grazie allinvarianza per traslazione della misira di Lebesgue su R,


Z
Z
|f (x + ) f (x)| dx 6
|f (x + ) g(x + ) f (x) + g(x)| dx

Z
+
|g(x + ) g(x)| dx

Z
6 2 kf gk1 +
|g(x + ) g(x)| dx

Z
2
6 +
|g(x + ) g(x)| dx.
(5.17)
3

Basta quindi dimostrare che


Z

|g(x + ) g(x)| dx <


3

se sucientemente piccolo, cio che lenunciato vero quando g continua a supporto compatto. Sia K il supporto di g e m(K) la sua misura

5.9. STIME PUNTUALI ED UNIFORMI PER IL RESTO N-ESIMO 505


R
(cio m(K) = K dx). Poich una funzione continua a supporto compatto
uniformemente continua per il Teorema di Heine (Teorema 1.8.6), allora per
ogni > 0 esiste tale che, se < ,
|g(x + ) g(x)| <

6m(K)

per tutti gli x. Osserviamo anche che la funzione h(x) = g(x + ) g(x)
ha supporto in K (K ), perch g(x) = 0 se x
/ K e g(x + ) = 0 se
x+
/ K, cio se x
/ K .
Perci, grazie allinvarianza per traslazione della misura di Lebesgue, ora si
ha
Z
Z
|g(x + ) g(x)| dx =
|g(x + ) g(x)| dx

K(K)

6
+

|g(x + ) g(x)| dx

|g(x + ) g(x)| dx

(m(K) + m(K )) = .
6m(K)
3

La dimostrazione per 1 < p < analoga (utilizza allo stesso modo il


fatto che le funzioni continue a supporto compatto sono dense in Lp ), mentre
per le funzioni continue basta osservare che la continuit della traslazione
equivalente alla uniforme continuit. Nel caso di funzioni periodiche, la
dimostrazione per Lp identica.

Lo stesso argomento vale per funzioni in L1 (in tal caso in (5.17) si usa il
Lemma 5.1.1 invece dellinvarianza per traslazione della misura di Lebesgue
su R). Nel caso di funzioni in C non occorre qui assumere luniforme continuit, perch essa automaticamente vericata per le funzioni continue sui
compatti grazie al Teorema di Heine. Enunciamo esplicitamente il risultato
per uso futuro:
Lemma 5.9.5. Per ogni f L1
Z
|f (x + ) f (x)| dx = 0.
lim
0

506

CAPITOLO 5. SERIE DI FOURIER

Se f Lp , si ha lim0 kf f kLp = 0 e, se f C , anche lim0 kf


f k = 0.
Lemma 5.9.6. (RiemannLebesgue). Per ogni f L1 (R),
Z
Z
lim
f (x) cos x dx = 0 = lim
f (x) sin x dx .

Nota 5.9.7. Per Z, questo fatto era gi stato osservato nel caso di
f L2 [0, 2], come conseguenza immediata della disuguaglianza di Bessel
(si veda la Proposizione 5.2.4). Abbiamo osservato nella dimostrazione del
Lemma 5.9.5 che, per ogni T > 0, le funzioni continue con supporto compatto in [T, T ] sono dense in L1 [T, T ]. Daltra parte, L2 [T, T ] ( L1 [T, T ]
(Proposizione 1.17.1), e siccome L2 [T, T ] contiene C[T, T ] anche esso
denso in L1 [T, T ].
Da qui segue facilmente che, per n N, il fatto (che sapevamo n da prima)
che
Z
Z
1 T
2kt
2kt
1 T
lim
f (t) cos
f (x) sin
dt = 0 = lim
dt
n T T
n T T
T
T
implica gi che lenunciato del Lemma di RiemannLebesgue vale per ogni
f L1 (R), purch sia intero: cio, che i coecienti di Fourier di funzioni
in L1 (R) tendono a zero allinnito. Infatti, per ogni > 0 scegliamo T e fT
come sopra: o meglio, T1 kf fT k1 < /2. Poi scegliamo N > 0 tale che, per
RT
ogni |k| > N, si abbia T1 T f (t) cos(2kt/T ) dt < /2, ed analogamente con
sin(2kt/T ). Allora i coecienti di Fourier di fT rispetto ai coseni vericano
Z

Z
1

1

> 1 kf fT k1 < .
f
(t)
cos(2kt/T
)
dt

f
(t)
cos(2kt/T
)
dt
T
T
T
T
2

Daltra parte, abbiamo gi osservato che i coecienti di Fourier


Z
Z
1
1 T
fT (t) cos(2kt/T ) dt =
fT (t) cos(2kt/T ) dt
ak =
T T
T

della funzione fT continua (e quindi in L2 ) tendono a zero allinnito grazie


alla disuguaglianza di Bessel. Pertanto, se k abbastanza grande, |ak | < /2,
e
Z

1


> 1 kf fT k1 + |ak | < + =
f
(t)
cos(2kt/T
)
dt
T
T
2 2

5.9. STIME PUNTUALI ED UNIFORMI PER IL RESTO N-ESIMO 507



R

1 T
e quindi T f (t) cos(2kt/T ) dt 0 quando |k| . Lo stesso vale
per i coecienti di Fourier rispetto ai seni.
Il Lemma di RiemannLebesgue estende questo risultato a frequenze di
oscillazione non intere.

Dimostrazione del Lemma 5.9.6. Basta mostrare che



Z
Z


1 



6
f
x
+

f
(x)
f
(x)
cos
x
dx
dx


2

ed analogamente
Z

Z


1 



6

f
(x)
f
x
+
f
(x)
sin
x
dx
dx .


2

(5.18)

(5.19)

Infatti queste disuguaglianze, una volta dimostrate, implicano lenunciato


grazie al Lemma 5.9.4 che ci d
Z 




f (x) dx = 0 .
lim
f x +

Dimostriamo la disuguaglianza (5.18):


Z
Z 
 


cos x +
dx
f (x) cos x dx =
f x+

Z 

=
f x+
cos x dx

dalla formula di addizione del coseno, o pi semplicemente perch


 

= cos(x + ) = cos x .
cos x +

Quindi
Z

1
f (x) cos x dx =
2




cos x dx (5.20)
f (x) cos x f x +

e, poich | cos(x)| 6 1,
Z

Z


1 




f (x) cos x dx 6
f (x) dx .
f x +

2

508

CAPITOLO 5. SERIE DI FOURIER

Analoga dimostrazione vale nel caso della funzione seno.

Continuazione della dimostrazione del Teorema 5.9.2.


In virt di (5.16) e del Lemma 5.9.3, per ottenere la parte dellenunciato del
Teorema 5.9.2 che concerne la convergenza puntuale basta mostrare che, per
ogni x R, per ogni f L1 (R), per ogni g limitata a supporto compatto
(diciamo in [, ]) e per ogni 0 < < ssato,
Z
+
n (x, ) =
sin nu g(u) (u f ) (x) du
(5.21)

Z
Z
=
sin nu g(u)f (x + u) du f (x)
sin nu g(u) du

n (x, )

=
=

(5.22)

cos nu g(u) (u f ) (x) du


cos nu g(u)f (x + u) du f (x)

cos nu g(u) du

convergono a 0 quando n .
Ma g limitata e a supporto in [, ], quindi g L1 [, ]. Inoltre
f L1 (R), quindi, per ogni x, la funzione k(u) = g(u)f (x + u) in L1 (R),
perch kkk1 6 kgkkf k1 . Perci i due integrali dellultimo membro di (5.21)
e (5.22) convergono a zero per il Lemma 5.9.4.
Resta da dimostrare luniformit della convergenza rispetto a x, negli
intervalli I = [a, b] in cui f limitata: diciamo supI |f (x)| = C < . Ma in
questi intervalli il secondo termine nellultimo membro di (5.21) converge a
zero uniformemente rispetto a x: se n sucientemente grande, allora
Z




sin nu g(u) du <

per il Lemma 5.9.6, e quindi



Z

f (x)



sin nu g(u) du < C.

Quindi per completare la dimostrazione del Teorema 5.9.2 basta provare il


seguente enunciato:

5.9. STIME PUNTUALI ED UNIFORMI PER IL RESTO N-ESIMO 509


Proposizione 5.9.8. (Convergenza uniforme nel Lemma di Riemann
Lebesgue.) Se f L1 (o pi precisamente, periodica ed integrabile su un
periodo con integrale finito) e g limitata e a supporto compatto, allora
Z

sin nu g(u) f (x + u) du e

cos nu g(u) f (x + u) du

convergono a zero quando n uniformemente rispetto a x in ogni intervallo [a, b].


La maggior parte della asserzione della Proposizione 5.9.8 contenuta
nel seguente lemma, che enunciamo per una frequenza reale invece che
una frequenza intera n perch la dimostrazione identica, visto che nel suo
enunciato non ci sono pi requisiti di periodicit di periodo 2.
Lemma 5.9.9. Siano f, g L1 (R) con g limitata. Allora
Z
lim
sin(u) g(u) f (x + u) du = 0

lim

cos(u)g(u)f (x + u) du = 0

uniformemente rispetto a x.

Dimostrazione. La dimostrazione segue dalle disuguaglianze (5.18) e (5.19)


del Lemma 5.9.6 e dal Lemma 5.9.4. Infatti, per la densit di Cc (R) in L1 (R)
(Proposizione 1.18.6), si ha che per ogni > 0 esiste h Cc (R) tale che
kf hk1 <

.
2 kgk

Quindi per (5.18)


Z



Ma



cos(u)g(u)f (u + x) du

Z



 
1 

f u + + x g(u)f (x + u) du .
6
g u +
2

510

CAPITOLO 5. SERIE DI FOURIER




 
f u + + x g(u)f (u + x)
g u+




 

=g u+
f u + + x f (u + x)

 


+ g u+
g(u) (f (u + x) h(u + x))

 


+ g u+
g(u) h(u + x) .

Poich





g(u) 6 2 kgk
per ogni u,
g u +

dalla disuguaglianza precedente segue


Z





cos
nu
g(u)f
(u
+
x)
du







f u + + x f (x + u) du

1


+ kgkkf hk1 + khk
g(u + ) g(u) du .
2

1
6 kgk
2

(5.23)

Si noti che il secondo membro non dipende pi da x (per vederlo, basta


cambiare la variabile da u a t = u+x nel primo integrale a secondo membro).
Quindi, se dimostriamo che minore di per || abbastanza grande, abbiamo
dimostrato la convergenza uniforme rispetto a x. A questo ne notiamo che,
grazie al Lemma 5.9.5, per ogni esiste > 0 tale che, se || > , allora
Z




f (u) du <
f u +

2kgk
Z






g(u) du <
.
g u +

2khk

Ricordiamo che h stato scelto in maniera che kf hk1 < /(2kgk). Per
questi segue quindi (5.23) che
Z


1 1


<
cos
nu
g(u)f
(u
+
x)
du

2 2 + 2 khk 2khk + kgk kf hk1


= + + = .
4 4 2

5.9. STIME PUNTUALI ED UNIFORMI PER IL RESTO N-ESIMO 511


La dimostrazione per lintegrale
Z




cos nu g(u)f (u + x) du

identica.

Fine della dimostrazione del Teorema 5.9.2: uniformit rispetto a x della


convergenza. Come abbiamo visto, basta ormai dedurre la Proposizione 5.9.8
dal Lemma 5.9.9.
Dimostrazione della Proposizione 5.9.8. Ora f L1 periodica di periodo,
diciamo, K (nel Teorema 5.9.2 il periodo 2). Perci f
/ L1 (R) e non possiamo applicare il Lemma 5.9.9 direttamente. Per g a supporto compatto.
Sia T > 0 tale che il supporto di g sia contenuto nellintervallo [T, T ] (nel
Teorema 5.9.2 si ha T = ). Dobbiamo limitare lattenzione allintervallo
a 6 x 6 b in cui f limitata. Allora, se u supp(g) [T, T ], si ha
x + u [a T, b + T ]. Quindi
Z

|cos nu g(u)f (u + x)| du =


=

T
Z T

dove
fe(t) =

f (t)
0

|cos nu g(u)f (u + x)| du




e + x) du
cos nu g(u)f(u

se t [a T, b + T ]
altrimenti.

Ora questa funzione fe a supporto compatto e, dove non nulla, coincide


con la funzione f , che periodica di periodo K ed integrabile su un intervallo
lungo un periodo:
Z
K

|f (x)| dx < .

Notiamo che, per la periodicit, |f | ha integrale nito su ogni intervallo di


lunghezza nita. Pertanto fe L1 (R). Ora, nalmente, il Lemma 5.9.9 si
applica, e lintegrale
Z
cos nu g(u)f (u + x) du

512

CAPITOLO 5. SERIE DI FOURIER

converge uniformemente a zero per n .


La dimostrazione per lintegrale
Z
sin nu g(u)f (u + x) du

identica.

Nota 5.9.10. (Principio di localizzazione.) Dal Teorema 5.9.2 segue che


la somma della serie di Fourier di una funzione f ad un punto x dipende
solo dai valori di f in un intorno arbitrariamente piccolo di x, e che il limite
uniforme della serie di Fourier in un intervallo I su cui f limitata dipende
solo dai valori di f in un intorno arbitrariamente piccolo dellintervallo I.
Questo fatto sorprendente, perch i coecienti di Fourier dipendono invece
dai valori di f su tutto il periodo. Di pi, vedremo nella Sezione 5.18 che,
se f continua e periodica e g si ottiene da f modicando f in un intervallo arbitrariamente piccolo, ma introducendo un salto, allora lordine di
innitesimo dei coecienti di Fourier di g cambia rispetto a quello di f : essi
tendono ancora a zero, ma pi lentamente di almeno un ordine di grandezza.
Eppure, nonostante questo, la somma della serie di Fourier di g coincide con
quella di f dove le due funzioni coincidono, e addirittura i limiti uniformi
degli approssimanti di Fourier coincidono negli intervalli in un intorno dei
quali le due funzioni coincidono.

5.10

Visualizzazione geometrica del Lemma di


RiemannLebesgue: modulazione di ampiezza e cancellazioni

Il Teorema 5.9.2 stato dimostrato grazie alle cancellazioni negli integrali di


funzioni oscillanti, come la funzione sinunu . Queste propriet di cancellazione
sono state sfruttate nel Lemma di RiemannLebesgue 5.9.6 e nella Proposizione 5.9.8 sulla convergenza uniforme di integrali oscillanti. Vediamo come
visualizzare il Lemma di RiemannLebesgue in termini di cancellazioni di
integrali.
Sia f una funzione (o segnale) in L1 (R).
Il graco di f (t) sin(t) si ottiene da quello di sin(t) mediante una modulazione di ampiezza f (t) come illustrato nei graci seguenti:

0.5
1.0

0.5

0.0

y1

1.0

1.5

2.0

5.10. VISUALIZZAZIONE DEL LEMMA DI RIEMANNLEBESGUE 513

Figura 5.3: Un segnale a variazione lenta con grafico a campana

Il segnale cos modulato ha un graco con oscillazioni positive e negative.


Se f continua e a supporto compatto, queste oscillazioni danno luogo a
contributi di segno opposto nellintegrale.
In tal caso, quando la frequenza aumenta, due oscillazioni consecutive
racchiudono quasi la stessa area, ma con segni opposti nelle zone in cui
f 6= 0. Se f si annulla in x0 , le oscillazioni intorno a x0 possono essere dello
stesso segno, ma sono comunque piccole. Il graco diventa:
intuitivo che lintegrale risultante presenti cancellazioni via via pi precise
quando || aumenta, e quindi tende a zero se . Se f non continua,
allora per grandi due oscillazioni consecutive potrebbero non cancellarsi
abbastanza bene, perch i valori di f possono cambiare di colpo. (Ma se f
integrabile secondo Riemann, il Teorema di Lebesgue 1.9.37 dice che essa
ha variazione che tende a zero in intorno appropriatamente piccoli di ciascun
punto eccetto che su un insieme di misura di Lebesgue zero).
In questo caso, abbiamo approssimato f con funzioni continue a supporto
compatto, ed usato per queste il principio delle cancellazioni. Questo lo

CAPITOLO 5. SERIE DI FOURIER

y2

1.0

0.5

0.0

0.5

1.0

1.5

2.0

514

Figura 5.4: Un segnale sinusoidale

spirito della dimostrazione del Lemma 5.9.6.

5.11

Le condizioni di Lipschitz e di Hlder: gli


spazi Lip()

Definizione 5.11.1. (i) Una funzione denita su un intervallo (a, b) o su


tutto R verica la condizione di Lipschitz se esiste M tale che per ogni
x1 , x2 nel dominio di denizione di f si abbia
|f (x1 ) f (x2 )| < M|x1 x2 |.
La pi piccola costante M che verica la disuguaglianza si chiama
costante di Lipschitz (ovviamente essa dipende dalla scelta di f ).
(ii) Una funzione f : (a, b) 7 C (ovvero f : R 7 C) verica la condizione di
Hlder di ordine > 0 se esiste M tale che per ogni x1 , x2 nel dominio

515

0.5
1.0

0.5

0.0

y3

1.0

1.5

2.0

5.11. GLI SPAZI LIP()

Figura 5.5: Un segnale sinusoidale rapidamente oscillante

di denizione di f si abbia
|f (x1 ) f (x2 )| < M|x1 x2 | .
La pi piccola costante M che verica tale disuguaglianza si chiama
costante di Hlder (dipende da f ).
In particolare, la condizione di Hlder di ordine = 1 coincide con la
condizione di Lipschitz.
(iii) Lo spazio
{f : (a, b) 7 C : f soddisfa la condizione di Hlder di ordine }
si indica con Lip() o anche Lip ([a, b]) (e analogamente per le funzioni
denite su tutto R).
(iv) Una funzione f : (a, b) 7 C (ovvero f : R 7 C) verica la condizione
di Hlder locale di ordine > 0 al punto x (a, b) se M = Mx tale

CAPITOLO 5. SERIE DI FOURIER

y4

1.0

0.5

0.0

0.5

1.0

1.5

2.0

516

Figura 5.6: Modulazione del segnale a campana con il segnale sinusoidale ad oscillazione
rapida

che per ogni x1 (a, b) si abbia


|f (x) f (x1 )| < Mx |x x1 | .
Esercizio 5.11.2. Si mostri che dalla Denizione 5.11.1 segue immediatamente
che sia le funzioni Lipschitziane sia quelle Hlderiane sono uniformemente
continue (Denizione 1.8.2).

Suggerimento: si applichi il teorema del confronto (Sezione 1.1).


Nota 5.11.3. Per > 1 lo spazio Lip() consiste solo delle costanti. Infatti,
se f Lip() con > 1, si ha: per ogni x nel dominio di f , per ogni h > 0
tale che x + h nel dominio di f ,
|f (x + h) f (x)| < M|h|
e quindi



f (x + h) f (x)

< M|h|1 0


h

5.11. GLI SPAZI LIP()

517

per h 0.
Perci la derivata f esiste ed nulla ovunque. Quindi f costante.
Ne segue che Lip() banale per > 1. Da qui in avanti considereremo solo
gli spazi Lip() con 6 1.

Nota 5.11.4. chiaro che Lip() uno spazio vettoriale. Infatti ovvio
che per ogni c C e per ogni f Lip() si ha cf Lip(). Inoltre se
f, g Lip() anche f + g Lip(), perch
|(f + g)(x1 ) (f + g)(x2 )| =
6
6
6

|f (x1 ) f (x2 ) + g(x1 ) g(x2 )|


|f (x1 ) f (x2 )| + |g(x1) g(x2 )|
M1 |x1 x2 | + M2 |x1 x2 |
M|x1 x2 | .

Nota 5.11.5. (i) Se f Lip(1) derivabile, allora |f (x)| limitata dalla


costante di Lipschitz.
(ii) f Lip(1) non implica che f sia derivabile.

Dimostrazione.

(i) Se f Lip(1) ed esiste f (x), allora |f (x + h) f (x)| < M|h| e quindi




f (x + h) f (x)
6 M.
|f (x)| = lim

h0
h

(ii) Il seguente un esempio di una funzione f denita ovunque che verica


la condizione di Lipschitz ma non derivabile in 0: f (x) = |x|.
Infatti, per la disuguaglianza triangolare [19, Cap. 16 (Appendice)],
|f (x1 ) f (x2 )| = kx1 | |x2 || 6 |x1 x2 | .
Quindi f soddisfa la condizione di Lipschitz con costante di Lipschitz
uguale a 1.

518

CAPITOLO 5. SERIE DI FOURIER

Lesempio precedente si generalizza alle funzioni hlderiane nel modo


seguente.
Esempio 5.11.6. Per 0 < < 1 la funzione f (x) = |x| soddisfa la condizione
di Hlder di ordine con costante di Hlder uguale a 1, ma non derivabile
in 0.
Dimostrazione. ovvio che f non derivabile in 0 per 0 < < 1. Si ha, per
x1 6= x2 ,
|f (x1 ) f (x2 )|
||x1 | |x2 | |
=
.
(5.24)
|x1 x2 |
|x1 x2 |


Supponiamo |x1 | > |x2 | e poniamo t = xx12 > 1. Poich |x1 x2 | > |x1 | |x2 |
(disuguaglianza triangolare) si ha




x1 x2 x1





x2 > x2 1 = (t 1) .
Quindi, dividendo per |x2 | il numeratore ed il denominatore del membro di
destra nella (5.24), si ottiene
|f (x1 ) f (x2 )|
t 1
6
:= (t).
|x1 x2 |
(t 1)
Il secondo membro una funzione crescente in (1, ) perch (t) > 0 per
ogni t > 1. chiaro che limt (t) = 1. Ponendo s = t1 e rammentando
lo sviluppo in serie di potenze della serie binomiale (1.17), si vede che
lim+ (t) = lim+

t1

s0

s
(1 + s) 1
=
lim
= 0.
s0+ s
s

Quindi
sup { (t), 1 < t < } = 1.
Perci f hlderiana con costante di Hlder uguale a 1.

Proposizione 5.11.7. Se f derivabile in (a, b) (o in R) con derivata limitata allora f verifica la condizione di Lipschitz con costante di Lipschitz
uguale a kf k .

5.11. GLI SPAZI LIP()

519

Dimostrazione. Per il Teorema del Valor Medio di Lagrange (Sezione 1.1)


per ogni x1 < x2 esiste (x1 , x2 ) tale che
f (x2 ) f (x1 ) = f ()(x2 x1 )
e quindi
|f (x2 ) f (x1 )| 6 kf k |x2 x1 |.

Definizione 5.11.8. Si dice che una funzione f denita in [a, b] (o in R)


continua a tratti se esiste eccetto che per un numero nito di punti {xi }
in ogni intervallo di lunghezza nita, e per ciascuno di tali punti xi esistono
niti i limiti
lim+ f (x) e lim f (x)
xxi

xxi

(in altre parole se f ha un numero nito di discontinuit in ogni intervallo di


lunghezza nita, tutte di prima specie, cio a salto nito).
Si dice che f C 1 a tratti se f e f sono continue a tratti, ossia se esiste
un numero nito di punti {xi } in ogni intervallo di lunghezza nita, tali che
f C 1 (xi , xi+1 ) per ogni i e per ciascuno di tali punti xi esistono niti i
limiti
lim+ f (x) e lim f (x)
xxi

xxi

lim+ f (x) e

lim f (x) .

e
xxi

xxi

Nota 5.11.9. Se f C 1 a tratti, allora continua a tratti con discontinuit


costituite da punti di salto di ampiezza nita. Infatti, siano come sopra {xi }
i punti di salto di f . Su ciascun intervallo [xi1 , xi ] la funzione f si estende
ad una funzione Fi continua, quindi limitata. Ovviamente f continua
allinterno di questi intervalli, essendo ivi derivabile. Inoltre, ssiamo un
punto nellintervallo (xi1 , xi ). Allora, per il Teorema
Fondamentale del
Rx
Calcolo (Teorema 1.27.1), limxxi f (x) = f () + i f (t) dt nito, e lo
stesso risultato vale per limxx+ f (x). Quindi tutte le discontinuit di f
i1
sono salti niti.

Proposizione 5.11.10. Una funzione continua e C 1 a tratti definita in un


intervallo [a, b] di lunghezza finita soddisfa la condizione di Lipschitz.

520

CAPITOLO 5. SERIE DI FOURIER

Dimostrazione. Siano x1 < x2 < < xn i punti di salto di f nellintervallo


(a, b). Per ogni i = 1, . . . , n 1 nellintervallo aperto (xi , xi+1 ) esiste f ed
inoltre esistono i limiti
lim f (x) e

xx+
i

lim f (x).

xx
i

Poniamo x0 = a e xn+1 = b. Abbiamo visto nella Nota 5.11.9 precedente


che f si estende a una funzione continua Fi nellintervallo chiuso [xi , xi+1 ]
(cautela: poich f ha un salto in xi non vero che Fi1 (xi ) = Fi (xi )).
Poich Fi continua nellintervallo limitato e chiuso [xi , xi+1 ] essa ammette
massimo Mi per il Teorema di Weierstrass (si veda [19, Cap. 16 (Appendice)]). Perci per ogni x nellintervallo aperto (xi , xi+1 ) si ha che |f (x)| 6 Mi ,
e quindi f lipschitziana in (xi , xi+1 ) con costante di Lipschitz Mi , grazie
alla Proposizione 5.11.7.
Ora sia M = max {M1 , . . . , Mn1 } e x < y (a, b). Se succede che x e y
appartengono allo stesso intervallo (xi , xi+1 ), allora sappiamo che
|f (y) f (x)| 6 Mi |y x| 6 M|y x|
e quindi la condizione di Lipschitz soddisfatta per questi x e y con costante
M. A titolo di illustrazione esaminiamo cosa succede quando x (xi1 , xi )
e y (xi , xi+1 ). In tal caso poich f continua in xi (e quindi in particolare
esiste il valore f (xi ), si ha
|f (y) f (x)| =
6
6
6
=

|f (y) f (xi ) + f (xi ) f (x)|


|f (y) f (xi )| + |f (xi ) f (x)|
Mi (y xi ) + Mi1 (xi x)
M(y xi ) + M(xi x)
M(y xi + xi x) = M(y x)

e quindi, di nuovo, f soddisfa la disuguaglianza di Lipschitz con costante M


per questi valori di x e y. In generale avremo xi1 < x < xi < xi+1 < <
xj < y < xj+1 . In tal caso
f (y) f (x) = f (y) + f (xi ) +

j1
X
k=i

(f (xk+1 ) f (xk )) f (xj ) f (x)

5.12. CONVERGENZA PUNTUALE E UNIFORME IN LIP()

521

da cui
|f (y) f (x)| = |f (y) f (xj ) +

j1
X

k=i
j1

6 Mj (y xj ) +

k=i
j1

6 M(y xj +

X
k=i

(f (xk+1 ) f (xk )) + f (xi ) f (x)|

Mk (xk+1 xk ) + Mi1 (xi x)

(xk+1 xk ) + xi x) = M(y x).

Perci la condizione di Lipschitz con costante M vericata per ogni x < y


in (a, b).

5.12

Convergenza puntuale e uniforme di serie


di Fourier di funzioni hlderiane

La condizione che f sia di Hlder suciente ad assicurare che la serie di


Fourier di f converga a f .
Teorema 5.12.1. (Dirichlet). Sia f L1 (cio periodica di periodo, diciamo 2 e integrabile sul periodo) e supponiamo che nellintervallo [a, b] f
soddisfi la condizione di Hlder di ordine > 0. Allora per ogni > 0 la serie
di Fourier di f converge a f uniformemente nellintervallo [a + , b ].
Dimostrazione. Poich f Hlderiana in [a, b] essa ivi continua e quindi
limitata, per il Teorema di Weierstrass sulla esistenza dei massimi e dei minimi delle funzioni continue su un intervallo limitato e chiuso (si veda [19,
Cap. 16 (Appendice)]). Perci si applica il Teorema 5.9.2, da cui segue che
per ogni n N, per ogni > 0,
Z
1 sin nu
Sn f (x) f (x) =
(f (x + u) f (x)) du + n (x, )
u
dove n (x, ) 0 per n uniformemente rispetto a x in [a, b].
Per ogni tale che 0 < < e per ogni x [a + , b ] il punto x + u
appartiene a [a, b] per ogni u tale che 0 6 |u| 6 . Perci dalla condizione di
Hlder segue
|f (x + u) f (x)| 6 M|u|
(5.25)

522

CAPITOLO 5. SERIE DI FOURIER

per tutti questi u e x.


Quindi, per x [a + , b ] e 0 6 6 ,


Z
(f (x + u) f (x)
1
du + |n (x, )|
| sin nu|
|Sn f (x) f (x)| 6


u
Z
u
1
du + |n (x, )|
6 M

u
Z
M 1
62
u
du + |n (x, )|
0
6

2M
+ |n (x, )| .

Nellultimo membro il secondo termine converge a zero uniformemente, e


quindi per ogni > 0 esiste N = N, > 0 tale che, per ogni n > N, si ha
|n (x, )| < 2 (indipendentemente da x).
Inoltre il primo termine 2M
converge a zero se 0 (perch > 0).

Quindi dato > 0 esiste > 0 tale che per ogni < si ha
2M
< .

(5.26)

Dato , ssiamo un valore di < . Allora per ogni n > N = N,


valgono entrambe queste disuguaglianze, e quindi per x [a + , b ] si ha
|Sn f (x) f (x)| <


+ =
2 2

n > N.

Questo equivale alla convergenza di Sn f a f uniformemente rispetto a x


nellintervallo [a + , b ].

Nota 5.12.2. (Convergenza puntuale o uniforme e condizioni di Hlder locali e globali.) Nella dimostrazione del Teorema di Dirichlet 5.12.1
abbiamo usato la condizione di Hlder globale (5.25): |f (x + u) f (x)| 6
M|u| per tutti gli x e per u abbastanza piccolo. Questo porta alla disuguaglianza (5.26) (uniforme rispetto a x, e tramite essa alla convergenza
uniforme della serie di Fourier.
Si noti che, se invece avessimo richiesto una disuguaglianza di Hlder locale
al punto x (parte (iv) della Denizione 5.11.1), ossia, per x ssato,
|f (x + u) f (x)| 6 Mx |u|

5.13. COMPLETEZZA DEL SISTEMA TRIGONOMETRICO

523

per u abbastanza piccolo, allora la stessa dimostrazione proverebbe solo la


convergenza puntuale della serie di Fourier al punto x. In particolare, la condizione aggiuntiva da imporre, per passare dalla convergenza puntuale su un
intervallo aperto dove f limitata alla convergenza uniforme in ogni sottointervallo chiuso, che le costanti di Hlder Mx siano limitate uniformemente
rispetto a x.

Riscriviamo quanto appena detto come enunciato separato:


Corollario 5.12.3. (Convergenza puntuale di serie di Fourier). Sia
f L1 e supponiamo che ad un punto x nellintervallo [a, b] f soddisfi la
condizione di Hlder locale di ordine > 0,
|f (x + u) f (x)| 6 Mx |u| ,
e quindi in particolare f continua in x ed ha senso parlare del suo valore
f (x). Allora le somme parziali Sn f (x) della serie di Fourier di f convergono
a f (x).
Corollario 5.12.4. Sia f C e supponiamo che f sia C 1 a tratti in [0, 2]
e con limiti
lim+ f (x)
e
lim f (x)
x0

x2

finiti (a causa della periodicit questo equivale a richiedere che f sia C 1 a


tratti in un qualche intervallo [, 2 + ] e quindi sempre per la periodicit,
C 1 a tratti in ogni intervallo di lunghezza finita).
Allora la serie di Fourier di f converge a f uniformemente ovunque.
Dimostrazione. Per la Proposizione 5.11.10, F soddisfa la condizione di Hlder in ogni intervallo di R (quindi ovunque in R per la periodicit). Grazie
al Teorema di Dirichlet 5.12.1, la serie di Fourier di f converge a f uniformemente in ogni intervallo. Poich f periodica, la convergenza uniforme vale
su tutto R.

5.13

Completezza del sistema trigonometrico


in C, L2 e Lp (1 6 p < )

Consideriamo dapprima due nuovi spazi:

524

CAPITOLO 5. SERIE DI FOURIER

Definizione 5.13.1. Indichiamo con C+ il sottospazio di C delle funzioni


pari, e con C il sottospazio di C delle funzioni dispari.
Corollario 5.13.2.

(i) C+ isometricamente isomorfo a C [0, ]

(ii) C isometricamente isomorfo al sottospazio C0 di C [0, ] di tutte le


funzioni f che verificano f (0) = f () = 0.
Dimostrazione.
(i) Ogni funzione h in C [0, ] si prolunga a una funzione e
h in C+ per
parit: in [, 0] deniamo e
h(x) = h(x) e osserviamo che quindi
e
e
h() = h(). Poi estendiamo e
h da [, ] a tutto R per periodicit.
e
Poich h ha lo stesso valore in e in lestensione continua. Viceversa se e
g C+ allora la restrizione di e
g a [0, ] appartiene a C [0, ].
Chiaramente questa corrispondenza lineare e isometrica.

(ii) Nel caso di funzioni dispari la corrispondenza da C a C [0, ] ancora


la restrizione allintervallo [0, ]. Per se e
g C allora, poich dispari,
si deve avere e
g (0) = 0 e e
g () = e
g (). Ma poich e
g anche periodica
di periodo 2 si ha ge() = ge() e quindi ge() = ge() = 0. Perci
la restrizione di e
g allintervallo [0, ] appartiene a C0 . Nellaltro senso,
ogni funzione in C0 si estende a una funzione in C per disparit: se
h C0 estendiamo dapprima h allintervallo [, 0] ponendo h(x) =
h(x) (si osservi che h(0) = h() = h() = 0 perch h C0 ). Poi
prolunghiamo h a una funzione su tutto R per periodicit. Poich h ha
lo stesso valore in e lestensione periodica continua. Anche in
questo caso lisometria ovvia.

Il Corollario 5.12.4 del Teorema di Dirichlet 5.12.1 implica il seguente


fondamentale teorema di completezza:

Teorema 5.13.3 (Weierstrass). (i) Il sistema trigonometrico (definito nel


Corollario 5.1.10) completo in C cio ogni funzione f C si
approssima uniformemente con combinazioni lineari del tipo
n
X
k=0

k cos kx + k sin kx

5.13. COMPLETEZZA DEL SISTEMA TRIGONOMETRICO

525

(in altre parole, lo spazio generato dal sistema trigonometrico denso


in C ).
(ii) Il sistema {1, cos x, cos 2x, . . . , } costituito dalle funzioni pari del sistema trigonometrico completo in C+ .
(iii) Il sistema {sin x, sin 2x, . . . , } costituito dalle funzioni dispari del sistema trigonometrico completo in C .
Dimostrazione. Il Corollario 5.12.4 mostra che il sistema trigonometrico
completo (nella norma uniforme) nel sottospazio di C delle funzioni C 1 a
tratti (in questo sottospazio, ogni funzione viene approssimata uniformemente dalle somme parziali della serie di Fourier). Procediamo per approssimazione. A questo scopo introduciamo il seguente lemma (parte del quale stata
sostanzialmente gi vista nella dimostrazione della Proposizione 1.14.5):
Lemma 5.13.4.
in C .

(i) Il sottospazio di C delle funzioni C 1 a tratti denso

(ii) Il sottospazio di C+ delle funzioni C 1 a tratti denso in C+ .


(iii) Il sottospazio di C delle funzioni C 1 a tratti denso in C .
In tutti e tre i casi, denso anche il sottospazio P delle funzioni C 1 a tratti
costituito dalle funzioni continue lineari a tratti (cio quelle il cui grafico
una poligonale).
Dimostrazione.
(i) Sia f C . Poich f continua nel compatto [, ], f uniformemente continua in [, ] (e per periodicit su tutto R) grazie al
Teorema di Heine sulla uniforme continuit delle funzioni continue sui
compatti (Teorema 1.8.6). Perci per ogni > 0 esiste > 0 tale che,
se |t1 t2 | < , allora |f (t1 ) f (t2 )| < .

Ora utilizziamo lo stesso argomento dellEsercizio 1.14.6. Sia x0 =


< x1 < x2 < < xn = una partizione di [, ] in intervalli di
ampiezza minore di . Costruiamo la funzione p P (lineare a tratti)
che coincide con f nei punti x0 , x1 , . . . , xn e negli intervalli [xi , xi+1 ]
lineare.
Allora si ha:

526

CAPITOLO 5. SERIE DI FOURIER

Figura 5.7: Approssimazione con funzioni lineari a tratti

(a) |f (x) f (y)| < se x, y [xi , xi+1 ] per costruzione degli xi ; in


particolare, |f (xi+1 ) f (xi )| < .

(b) |p(xi+1 ) p(xi )| = |f (xi+1 ) f (xi )| <

(c) se x, y [xi , xi+1 ] allora |p(x) p(y)| < per linearit.

Da (a) e (b) segue che per ogni i, per ogni t [xi , xi+1 ] si ha
|f (t) p(t)| 6 |f (t) f (xi )| + |f (xi ) p(x)| < 2.
Ma ogni t [, ] sta in un intervallo [xi , xi+1 ] e quindi kf pkC[,] <
2. Questo dimostra (i).
(ii) Per dimostrare la seconda parte dellenunciato basta osservare che la
funzione lineare a tratti p si pu scegliere pari se f pari: basta prendere i punti della partizione in modo simmetrico rispetto a zero (cio
x1 = xn1 , x2 = xn2 e cos via.)
(iii) Per dimostrare la terza parte basta osservare che se f dispari la scelta della partizione simmetrica produce una approssimazione lineare a
tratti p dispari.

Per inciso, la dimostrazione del precedente Lemma 5.13.4, adattata ad un


compatto qualsiasi, non necessariamente [, ], porta alla seguente conclusione che ci sar utile in seguito:

5.13. COMPLETEZZA DEL SISTEMA TRIGONOMETRICO

527

Corollario 5.13.5. Le funzioni C 1 su un compatto K sono uniformemente


dense nello spazio C(K) delle funzioni continue.
Fine della dimostrazione del Teorema 5.13.3.
Sia f C . Per ogni > 0 sappiamo che esiste una funzione p = p
lineare a tratti tale che kf pk < 2 . Poich p continua, periodica e C 1
a tratti, dal Corollario 5.12.4 sappiamo che esiste n tale che lapprossimante
n-simo di Fourier qn di p
n

a0 () X
+
(ak () cos kx + bk () sin kx)
qn (x) =
2
k=1
verica
kp qn k <

(abbiamo scritto tutti i coecienti di Fourier come funzioni di per enfatizzare che essi dipendono dalla scelta di perch da questa scelta dipende
p = p ). Perci per ogni > 0 esiste qn polinomio trigonometrico (cio
combinazione lineare nita degli elementi del sistema trigonometrico) tale
che
kf qn k 6 kf p k + kp qn k < .
Questo dimostra (i).
Per dimostrare (ii) si osserva che se f C+ allora per il Lemma 5.13.4
lapprossimante p pu essere scelto pari. Per dimostrare (iii) si osserva che,
in modo analogo, se f C , lapprossimante pu essere scelto dispari. Allora
la dimostrazione di (ii) e (iii) conseguenza immediata del seguente
Lemma 5.13.6.

(i) Se f L1 pari, allora


bk =

f (x) sin kx dx = 0

e quindi la serie di Fourier di f consiste solo di termini pari


f (x)

a0 X
+
ak cos kx.
2
k

528

CAPITOLO 5. SERIE DI FOURIER

(ii) Se f L1 dispari, allora


Z
ak =
f (x) cos kx dx = 0

e quindi la serie di Fourier di f consiste solo di termini dispari


f (x)

ak sin kx

Dimostrazione. Ovvia, dato il fatto che se f pari allora x f (x) sin kx


dispari, e se f dispari allora x f (x) cos kx dispari.

Nota 5.13.7. Il Teorema di Completezza di Weierstrass 5.13.3 prova che ogni


f C pu essere approssimata uniformemente con polinomi trigonometrici
qn di grado n. Allora, se scriviamo r0 = q0 e rk = qk qk1 per k = 1, 2, . . . ,
f viene approssimata uniformemente dalle somme parziali della serie
n
X
k=0

rk (x) = (qn (x) qn1 (x)) + + (q1 (x) q0 (x)) + q0 (x) = qn (x) .

Ma questo non vuol dire che ogni f C sia approssimata uniformemente


dalle somme parziali della sua serie di Fourier. Infatti si ha che per ogni
esiste n tale che


n


X


rk < ,
f


k=0

ma non solo n, bens anche tutti i termini rk dipendono dalla scelta di .


Invece nella serie di Fourier di f

a0 X
(ak cos kx + bk sin kx)
+
2
k=1

i termini dipendono solo da f , non da . Se si avesse approssimazione uniforme con le somme parziali della serie di Fourier, per ogni si potrebbe
approssimare f a meno di con una somma parziale Sn dove soltanto n,
cio il numero degli addendi, dipende da , ma i singoli addendi non sono
funzioni di . In altre parole, al decrescere di aumenterebbe lordine di
n, si aggiungerebbero quindi nuovi termini in cos kx e sin kx di frequenza k

5.13. COMPLETEZZA DEL SISTEMA TRIGONOMETRICO

529

elevata, ma i termini precedenti, di frequenza k 6 n, rimarrebbero gli stessi


di prima.
In eetti, come abbiamo accennato in Sezione 5.5, esistono funzioni in L1
la cui serie di Fourier non converge (anzi, diverge ovunque): per maggiori
dettagli si veda il successivo Capitolo 7.

Siamo nalmente in grado di dimostrare lasserzione fondamentale annunciata in 5.2.1: la completezza del sistema ortonormale


1
1
1
1
1
, sin x, cos x, sin 2x, cos 2x, . . . ,

2
nello spazio di Hilbert L2 .
Corollario 5.13.8. (Completezza in L2 e Lp ).
(i) Il sistema trigonometrico completo in L2
(ii) Il sistema trigonometrico completo in Lp per ogni p, 1 6 p < .
Dimostrazione. Ancora una volta si procede per approssimazione.
Per provare (i) basta ricordare che C denso in L2 (ovvia conseguenza del
Proposizione 1.18.6) e per ogni g C si ha kgk2 < Ckgk dove la costante
C non dipende da g (in eetti C = 2 : lo si dimostri per esercizio). Perci,
dati > 0 e f L2 , esiste h C tale che kf hk2 < 2 .
Sappiamo anche, dal Teorema 5.13.3 (i), che il sistema trigonometrico completo in C , cio che per ogni h C e per ogni > 0 esiste un polinomio

trigonometrico q tale che kh qk < 2C


.
Pertanto
kf qk2 6 kf hk2 + kh qk2
6 kf hk2 + Ckh qk

6
+C
= .
2
2C
Per provare (ii) si procede in maniera identica usando il fatto che C
denso in Lp per 1 6 p < (ma non in L
) e per ciascuno di questi p esiste
una costante Cp tale che per ogni f C si ha
kf kp 6 Cp kf k .
(Proposizione 1.18.6).

530

CAPITOLO 5. SERIE DI FOURIER

Esercizio 5.13.9. Cp = (2)1/p .

Nota 5.13.10. Per comodit del lettore, richiamiamo brevemente, in maniera


non esauriente ma sintetica, lidea della dimostrazione del fatto che C[0, ]
denso in L1 [0, ] (Proposizione 1.18.6). Rammentiamo anzitutto che questo
fatto segue immediatamente ed elegantemente dal Teorema di Lusin 1.14.10,
ma preferiamo riproporne una dimostrazione pi artigianale perch il Teorema di Lusin non del tutto elementare, dal momento che richiede alcuni
preliminari di teoria della misura e di topologia.
Per denizione di L1 , se f L1 [0, ], per ogni > 0 esiste una funzione
semplice
n
X
g=
ci i
i=1

(dove i la funzione che vale 1 su un aperto Oi e 0 altrove) tale che

kf gk1 6 .
2
Ora limitiamo lattenzione al caso in cui gli Oi sono intervalli aperti, ossia g
una funzione a gradini ( perci che questa dimostrazione non esauriente,
ma abbiamo dimostrato nella Proposizione 1.18.4 che questo caso particolare
approssima quello generale nella norma L1 ). Consideriamo gli n salti della
funzione (discontinua) g e modichiamo g rimpiazzandola con una funzione
lineare negli n intervalli con centro in uno di questi punti di salto e diametro

, esattamente come nella dimostrazione del Lemma 5.13.4(i). Come


2nkgk
in quella dimostrazione si ottiene cos una nuova funzione ge continua, che
verica

kg gek1 < .
2
Quindi

kf e
g k1 6 kf e
g k1 + kg e
g k1 < + = .
2 2

Corollario 5.13.11. (Teorema di unicit). Se f, g L2 e fb(n) = b


g (n)
per ogni n Z, allora f = g in L2 .

Dimostrazione. Poich il sistema trigonometrico completo in L2 (Corollario


5.13.8) questo enunciato non altro che il fatto che il sistema trigonometrico

massimale (Teorema 4.3.7).

5.14. LA FUNZIONE A DENTI DI SEGA

Figura 5.8: La funzione periodica a denti di sega

5.14

531

x
2

Esempio del tipo di convergenza della serie di Fourier di una funzione con discontinuit a salto: la funzione a denti di sega

Esempio 5.14.1. La funzione a denti di sega denita nellintervallo (, ]


in questo modo:
(

x2
0<x<
2
(x) =
< x < 0
2 x2
Inoltre poniamo () = (0) = () = 0. (Si noti che potremmo scegliere
altri valori per a questi tre punti senza che questo modichi i coecienti
di Fourier: ma la scelta che abbiamo fatto rende pi elegante il risultato
sulla convergenza degli approssimanti di Fourier che stiamo per presentare).

Come sempre, estendiamo per periodicit a tutto R. Il graco della


funzione periodica in Figura 5.8.
La funzione ha un salto di ampiezza nei punti {2k, k Z}. Poich
questa funzione non continua, ad essa non si applica il Teorema 5.12.1
di Dirichlet su tutto R, per si applica sullintervallo [, 2 ] e sui suoi
traslati di passo 2.
Calcoliamo i coecienti di Fourier di ed il limite delle somme parziali
della sua serie di Fourier per ogni x R.
Si noti che L2 e quindi i coecienti di Fourier esistono e tendono
a zero per n , in base alla Proposizione 5.2.4 (conseguenza della disuguaglianza di Bessel). Inoltre Sn per n nella norma di L2 , in

532

CAPITOLO 5. SERIE DI FOURIER

base al Corollario 5.13.8(i) (completezza del sistema trigonometrico) ed al


Corollario 4.3.2(ii).
Per il Teorema 5.12.1 di Dirichlet, Sn puntualmente nellintervallo aperto (0, 2) e pi in generale in (2k, 2(k + 1)), e uniformemente in
[, 2 ] (e pi in generale in [2k + , 2(k + 1) ]).
Osserviamo che la funzione dispari (come rivela la sua denizione ed
ovvio dal suo graco). Perci i coecienti di Fourier ak sono tutti nulli.
Calcoliamo bk . Si ha:
Z
1
bk =
(t) sin kt dt

Z
2 t
sin kt dt
=

2
Z 0
Z
1
=
sin kt dt
t sin kt dt.
0
0
La primitiva di sin kt cosk kt . Quindi
Z

cos kt
sin kt dt =
k

1 cos(k)
1 (1)k

=
.
k
k
k

Inoltre, integrando per parti,


 Z
Z
t cos kt
cos kt
+
t sin kt dt =
dt
k
k
0
0
0
(1)k+1
=
.
k
perch

Perci

k
0

1
cos t dt =
k

bk =
=

cos kt dt = 0 k.

1
sin kt dt

t sin kt dt

1 (1)k (1)k+1
1

= .
k
k
k
k

(5.27)

5.15. SERIE DI FOURIER DI FUNZIONI C 1 A TRATTI CON SALTI533


Quindi
Sn (x) =

n
X
sin kx
k=1

(5.28)

Si osservi che, per x = 2m, sin kx = 0 per ogni k, e quindi Sn (x) = (x).
Per tutti gli altri x sappiamo gi che Sn (x) (x) puntualmente. Perci
Sn (x) (x) puntualmente su tutto R.

Nota 5.14.2. Per memoria futura, ricordiamo che, da (5.27) i coecienti di


Fourier della funzione (che ha un salto) tendono a zero per k come k1 .
Inoltre, dalle formule della Proposizione 5.2.5, si ha che fb(k) = 2ki fb(0) = 0.

5.15

Convergenza puntuale di serie di Fourier


di funzioni periodiche C 1 a tratti e con un
numero finito di discontinuit nel periodo,
tutte di tipo salto

Utilizziamo il Teorema 5.12.1 di Dirichlet ( suciente il Corollario 5.12.4) e


lEsempio 5.14.1 per provare il seguente teorema di convergenza puntuale:
Teorema 5.15.1. Sia f L1 , C 1 a tratti su un intervallo [a, b] e con un
unico punto di discontinuit x0 in questo intervallo (interno allintervallo,
x0 (a, b)). Sappiamo che la discontinuit di f in x0 un salto finito (Nota
5.11.9), cio esistono finiti i limiti
lim+ f (x) = f (x+
0)

xx0

lim f (x) = f (x
0 ).

xx0

Allora
(i) al punto x0 la serie
 di Fourier di f converge alla media aritmetica

+
1
f (x0 ) + f (x0 )
2

(ii) per ogni > 0 negli intervalli [a + , x0 ] e [x0 + , b ] la serie di


Fourier di f converge a f uniformemente (e quindi puntualmente).

534

CAPITOLO 5. SERIE DI FOURIER

Dimostrazione. La parte (ii) segue direttamente dal Corollario 5.12.4.


Proviamo (i). Per ragioni di eleganza, assumiamo, senza perdita di ge+
neralit, che f (x0 ) = 21 (f (x
0 ) + f (x0 )): stiamo cambiando il valore di f nel
solo punto x0 , il che non cambia i coecienti di Fourier. Per la funzione f
cos denita lenunciato assume una forma pi elegante: equivale ad asserire
che Sn f (x) f (x) per ogni x.
Per provare questa asserzione, rimuoviamo il salto nel modo seguente:

denotiamo con A lampiezza del salto in x0 : A = f (x+


0 ) f (x0 ). Sia h(x) =
1
A(x x0 ), dove la funzione dellEsempio 5.14.1, che ha un salto di

ampiezza in 0.
Quindi h ha, in [a, b], soltanto un salto, al punto x0 , di ampiezza A, esattamente come f .
Poniamo g = f h. Allora g C 1 a tratti in [a, b], perch f e h lo sono.
Inoltre g continua in [a, b], perch f e h hanno un solo punto di discontinuit
in x0 , ma in quel punto il salto di g zero, e quindi g continua anche in x0 .
Per il Corollario 5.12.4 (o pi precisamente per il Teorema 5.12.1 e la
Proposizione 5.11.10) Sn g g per n uniformemente in ogni sottointervallo chiuso contenuto in (a, b) ed in particolare Sn g(x0 ) g(x0 ) per
n . Questo prova (i) (osserviamo che la stessa propriet di convergenza
vale per ogni x [a + , b ] con arbitrariamente piccolo).
Abbiamo gi dimostrato la parte (ii), ma ecco una dimostrazione pi
esplicita. Abbiamo visto nellEsempio 5.14.1 che Sn h(x) h(x) per ogni
x R, e la convergenza uniforme negli intervalli [a + , b ] con
arbitrariamente piccolo. Quindi
Sn f (x) = Sn g(x) + Sn h(x) g(x) + h(x) = f (x)
per ogni x [a + , b ], in particolare per x0 , e la convergenza uniforme
in [a + , x0 ] e [x0 + , b ].

Corollario 5.15.2. Lo stesso enunciato vale se f ha un numero finito di


salti nel suo periodo (e quindi in ogni intervallo di lunghezza finita).
Dimostrazione. Basta rimuovere ciascun salto iterando la procedura: al punto di salto xi con ampiezza del salto Ai si sottrae hi (x) = 1 Ai (x xi ) e si
somma su i.

5.16. DERIVAZIONE ED INTEGRAZIONE DI SERIE DI FOURIER 535

5.16

Derivazione ed integrazione di serie di Fourier

In questa Sezione lesposizione pi semplice se si scrive la serie di Fourier


in forma complessa:

X
f
fb(k)eikx ,
k=

dove

1
fb(k) =
2

f (t)eikt dt

Lemma 5.16.1. Se f C1 , allora, per ogni k Z,


c (k) = ik fb(k) .
Df

Lo stesso risultato vale se f continua e C 1 a tratti (ossia se una partizione


finita di [, ] in intervalli contigui in ciascuno dei quali f sia continua
con limiti destro e sinistro finiti agli estremi degli intervalli).
Dimostrazione. Sia f C1 . Integrando per parti abbiamo:
Z
1
c
f (t)eikt dt
Df (k) =
2
Z

1  ikt
ik
=
e f (t) +
f (t)eikt dt
2
2
= ik fb(k) .

(5.29)

perch eik f () = eik f () per la periodicit.


Ora assumiamo che f sia continua ma f sia continua a tratti. Denotiamo
con Ij , j = 1 . . . , N una partizione nita di [, ] in intervalli contigui in
ciascuno dei quali f sia continua. Scriviamo Ij = [xj , yj ]. La restrizione
di f a ciascun Ij una funzione continua nella parte interna (xj , yj ) ma
estendibile con continuit alla chiusura [xj , yj ], dal momento che il limite
destro allestremo xj e sinistro a yj esistono e sono niti. Quindi, in ciascun
Ij , possiamo integrare per parti come sopra, ed otteniamo
Z

yj

xj

ikt

f (t) e

ikyj

dt = f (yj )e

ikxj

f (xj )e

+ ik

yj

xj

f (t) eikt dt .

536

CAPITOLO 5. SERIE DI FOURIER

Pertanto, sommando su j e grazie alla periodicit, otteniamo


Z
1
c
f (t)eikt dt
Df (k) =
2
!
Z
N
1
X
ik

=
f (t)eikt dt +
(lim x x+
= ik fb(k) ,
j f (x) lim x xj f (x))
2

j=0
perch i termini della somma si annullano poich f continua.

Corollario 5.16.2. La derivata termine a termine della serie di Fourier di


una funzione f continua, periodica e C 1 a tratti la serie di Fourier della
sua derivata.
Nota 5.16.3. Lipotesi che la funzione periodica f sia C 1 a tratti assicura che
f sia continua a tratti con un numero nito di discontinuit in ciascun periodo (Nota 5.11.9). Quindi f limitata e continua a tratti, perci f L1 ed ha
senso parlare della sua serie di Fourier. Per, perch si annulli la dierenza
dei valori al bordo in (5.29), devono essere univocamente deniti i valori di
f ai punti e . Per una funzione in L1 i valori in un punto non sono ben
deniti: la funzione non cambia se la si modica in un insieme di punti di
misura di Lebesgue nulla (Denizione 1.16.16). Per questo assumiamo che f
sia continua.
c (0) = 0, come deve necessariamente
Si osservi anche che (5.29) implica Df
essere visto che
Z
1
1
c
Df (0) =
f (t) dt =
(f () f ()) = 0
2
2
per la periodicit di f .

Per dimostrare un risultato analogo per lintegrazione termine a termine


di serie di Fourier osserviamo prima quanto segue.
Lemma 5.16.4. Sia g L1 e
f (x) =

g(t) dt.

Allora f periodica (di periodo 2) se e solo se g a media nulla sul periodo,


cio
Z
2

g(t) dt = 0.

5.16. DERIVAZIONE ED INTEGRAZIONE DI SERIE DI FOURIER 537


Dimostrazione. Se

g(t) dt = 0

allora f periodica, perch


f (x + 2) =

x+2

g(t) dt
Z x
Z x+2
=
g(t) dt +
g(t) dt
0
x
Z x
Z 2
=
g(t) dt +
g(t) dt = f (x)
0

per il Lemma 5.1.1.


Viceversa, se f periodica di periodo 2, allora
Z

g(t) dt = f (2) = f (0) =

g(t) dt = 0.

Ora il comportamento della serie di Fourier sotto integrazione una facile


conseguenza del Lemma 5.16.1.
Proposizione 5.16.5. Sia g una funzione periodica (di periodo 2) e continua a tratti, cio con un numero finito di discontinuit in ciascun periodo,
tutte consistenti di salti di ampiezza finita. Supponiamo inoltre che g sia a
media nulla sul periodo:
Z 2
g(t) dt = 0.
0

Sia

f (x) =

g(t) dt.

Allora b
g (k) = ik fb(k) e le serie di Fourier di f e di g sono legate dalla
relazione
Z
x

Sn g(t) dt = Sn f (x) Sn f (0).

538

CAPITOLO 5. SERIE DI FOURIER

Inoltre f continua, periodica e C 1 a tratti, e Sn f converge uniformemente


af e
Z x
Z x
n
X
g (k)
b
eikt dt
Sn g(t) dt =
0

k=n

converge uniformemente a f .

Dimostrazione. Osserviamo che


Z

1
g (0) =
b

g(t) dt = 0.

Poich g continua a tratti il Teorema Fondamentale del Calcolo (Teorema


1.27.1) implica che il suo integrale f continuo e C 1 a tratti. Inoltre f
periodica per il Lemma 5.16.4. Lidentit b
g (k) = ik fb(k) il Lemma 5.16.1.
Dal momento che b
g (0) = 0 possiamo scrivere
g

k=

g (k)eikx =
b

kZ, k6=0

g (k)eikx .
b

Poich in questa somma manca il termine costante (cio k = 0) le somme di


Fourier
n
X
gb(k)eikx
Sn g(x) =
k=n

sono tutte a media nulla sul periodo. Inoltre


Z

Sn g(t) dt =

16|k|6n

g (k)eikt dt
b

X gb(k)
=
(eikx 1)
ik
16|k|6n
X
X
fb(k)
fb(k)eikx
=
=

16|k|6n
n
X

k=n

fb(k)eikx

16|k|6n

06|k|6n

= Sn f (x) Sn f (0).

fb(k)

5.17. VELOCIT DI CONVERGENZA DELLA SERIE DI FOURIER 539


In base al Corollario 5.12.4 del Teorema di Dirichlet 5.12.1, Sn f converge
uniformemente a f , ed inoltre f (0) = 0 in base alla denizione di f . Quindi
Z x
Sn g(t) dt
0

converge uniformemente a f .

Nota 5.16.6. In base al Lemma 5.16.1 e alla Proposizione 5.2.5 la relazione


fra i coecienti di Fourier ak , bk in forma reale di una funzione e quelli della
sua derivata (che indichiamo con ak , bk ) risulta, ora, essere la seguente:
ak =
e

c (k) + Df
c (k)
fb(k) ik fb(k)
Df
= ik
= kbk
2
2

c (k) Df
c (k)
Df
k fb(k) k fb(k)
=
= kak .
2
2
Si vede quindi che, se f una funzione pari e pertanto per il Lemma 5.13.6
ha una serie di Fourier in soli coseni, allora f ha una serie di Fourier in soli
seni, e viceversa.
Questo fatto era comunque chiaro a priori perch la derivata di una funzione
pari dispari e viceversa.

bk = i

5.17

Velocit di convergenza della serie di Fourier

Teorema 5.17.1. (Stima del resto n-simo della serie di Fourier).


Siano m > 1 e f periodica (di periodo 2) di classe Cm1 (cio con derivata
(m 1)-esima continua) e con derivata m-sima f (m) in L2 . Allora
v
u X
(m)
u
1
|Sn f (x) f (x)| 6 f L2 [,] t2
k 2m
k=n+1

1
m

1
2

(m)
f 2
L
m 12

Lo stesso risultato vale anche per m = 1, se si assume anche che f sia


continua a tratti.

540

CAPITOLO 5. SERIE DI FOURIER

Dimostrazione. Dal Corollario 5.12.4 del Teorema di Dirichlet segue che Sn f


converge a f uniformemente ( qui che si usa il fatto che f sia continua a
tratti: se m > 1 questo gi racchiuso nel fatto che f Cm1 ).
Allora il Lemma 5.16.1 implica



X
ikx
ikx
b
b
f (k)e + f (k)e
f (x) Sn f (x) =

k=n+1

X

k=n+1

(5.30)

1 d
1
(m) (k)eikx
f (m) (k)eikx +
fd
m
m
(ik)
(ik)

(5.31)
(5.32)

(m) (k), k Z, i coecienti di Fourier di f (m) .


dove abbiamo indicato con fd
Osserviamo che per ogni a, b > 0 si ha a2 + b2 2ab = (a b)2 > 0 e quindi
2ab 6 a2 + b2 . Perci (a + b)2 = a2 + b2 + 2ab 6 2(a2 + b2 ) (la stessa disuguaglianza si ottiene anche applicando la disuguaglianza di CauchySchwarz ai
vettori (a, b) e (1, 1)). Ponendo ora

s
2
X

d
(m)
a=
f (k)
k>n

e
b=

vediamo che
s

2
X

d
(m)
f
(k)

k<n

2 sX
2 s X
2
X



d

d
d
(m)
(m)
(m)
f (k) +
f (k) 6 2
f (k) .

k<n

k>n

|k|>n

Da questo e dal fatto che |eikx | = 1, concludiamo, in base alla identit (5.30)

5.17. VELOCIT DI CONVERGENZA DELLA SERIE DI FOURIER 541


ed alla disuguaglianza di CauchySchwarz in 2 (Proposizione 4.5.1) che
n1
X

1
|Sn f (x) f (x)| 6
|k|m
k=
v
u X
u
6 t2
k=n+1

v
u
u X
6
2t



X

d
(m)
f (k) +

1
km
k=n+1

k 2m

k=n+1

2
X
(m) (k)
fd

|k|>n


1
f (m)

k 2m




d
(m)
f (k)

L2

Da qui segue la prima disuguaglianza dellenunciato. Per la seconda ba1


, allora h decrescente per x > 0, quindi
sta osservare che se h(x) = x2m
1
1
nellintervallo k 1 6 x 6 k si ha k2m
= h(k) 6 h(x) = x2m
.
Perci
Z

X
1
1
1
1
<
dx =
.
2m
2m
2m1
k
x
2m 1 n
n
k=n+1

Questo prova la seconda disuguaglianza dellenunciato.

Figura 5.9: Lintegrale di 1/x2m domina la serie di 1/k2m


Si noti che lultima parte della dimostrazione del Teorema 5.17.1 nientaltro
che il criterio di confronto di una serie numerica con un integrale, che stato
enunciato nella Sezione 1.1:

542

CAPITOLO 5. SERIE DI FOURIER

Osserviamo che le somme parziali


Sn f (x) =

n
X

fb(k)eikx + fb(k)eikx

k=n

sono di ordine 2n + 1 (contengono 2n + 1 addendi). Quindi le dierenze


consecutive Sn+1 f Sn f contengono sempre due addendi. In realt, per,
la dimostrazione del teorema vale anche per somme parziali di ogni ordine.
Lenunciato pi preciso il seguente.
Teorema 5.17.2. Sia f Cm1 e f (m) L2 (se m = 1 supponiamo anche
che f sia continua a tratti). Siano
Se2n f (x) = Sn f (x) =

Allora

Se2n+1 f (x) =

n+1
X

k=n

k=n

u

u X

e
t
2
6
S
f
(x)

f
(x)

2n+1

k=n+1

n
X

fb(k)eikx + fb(k)eikx

fb(k)eikx + fb(k)eikx .

1
f (m)

k 2m

L2

<

1
m





e le stesse disuguaglianze valgono per Se2n f (x) f (x) .

1
2

(m)
f

L2

1
1

nm 2

I Teoremi 5.17.1 e 5.17.2 valgono con il seguente enunciato diverso, che


d luogo a una disuguaglianza pi forte: qui omettiamo la dimostrazione.

Teorema 5.17.3. (i) Sia f Cm1 , m > 1 e f (m) limitata (condizione


pi forte dellappartenenza a L2 ). Se m = 1 supponiamo anche che
f sia continua a tratti (questa ipotesi automaticamente verificata se
m > 1). Allora esiste C = C(m) > 0 tale che per ogni n > 0,



log n
e

Sn f (x) f (x) < C f (m) m .
n
In particolare per ogni > 0 C = C (m, ) > 0 tale che, per ogni k,




1

e
Sn f (x) f (x) < C f (m) m .
n

5.18. ORDINE DI INFINITESIMO DEI COEFFICIENTI

543

(ii) Pi in generale, si ha anche che se f (m) L2 (quindi anche nel caso


particolare della parte (i), quello di f continua e C 1 a tratti), esiste
C = C(f, m) tale che
|Sen f (x) f (x)| 6 C

1
.
nm

(iii) Se invece f (m) Lp con 1 < p 6 2, allora, esiste C = C(f, m, p) tale


che
log(log(log(n)))
|Sen f (x) f (x)| 6 C
.
nm
Nota 5.17.4. Per p > 2 si ha Lp L2 e quindi se f (m) Lp con p > 2
continua a valere (ii), che pi forte di (iii) per questi p, ma molto
pi dicile da dimostrare.

(iv) Se infine f (m) L1 , allora esiste C = C(f, m) tale che


|Sen f (x) f (x)| 6 C

log(log(n))
.
nm

Le stime pi precise, enunciate nelle parti (iii) e (iv) del Teorema 5.17.3,
sono ottenute nella dimostrazione del Teorema di convergenza puntuale di
Carleson, citato nella Sezione 5.5.

5.18

Ordine di infinitesimo dei coefficienti di


Fourier

Sappiamo dal Lemma di RiemannLebesgue 5.9.6 che i coecienti di Fourier


di funzioni in L1 tendono a zero allinnito. In generale non si pu dire
nulla sul loro ordine di innitesimo, come vedremo nella Sottosezione 7.6.5:
il Lemma di RiemannLebesgue non si pu migliorare, i coecienti possono
tendere a zero in maniera arbitrariamente lenta (Proposizione 7.6.31 e Nota
7.6.32). In quella stessa Sottosezione mostreremo un altro fatto interessante
a questo correlato: esistono serie trigonometriche convergenti, con coecienti
ck k1 che non sono serie di Fourier di funzioni L1 , ossia non ogni successione
convergente a zero la successione dei coecienti di Fourier di funzioni L1
(Proposizione 7.6.33).

544

CAPITOLO 5. SERIE DI FOURIER

Naturalmente, se si sa che ck = fb(k) per una funzione f L2 (f la


somma della serie) e ck k1 per qualche > 0, allora la disuguaglianza di
Bessel (Corollario 4.1.9; si veda anche la Nota 5.2.7) dice che


X
b 2
f (k) <

k=

e quindi > 21 .
Invece si hanno stime precise sullordine di innitesimo dei coecienti di
Fourier di funzioni derivabili m volte con continuit (f Cm ). Naturalmente
queste funzioni sono in L2 e quindi vale lasserzione precedente, ma vale un
1
per
risultato molto pi forte: fb(k) k1m o pi precisamente |fb(k)| < km
ogni > 0.
In eetti il risultato pi forte che proveremo, Teorema 5.18.5, segue immediatamente dal Teorema 5.17.1, ma questo Teorema non labbiamo dimostrato (e la dimostrazione complicata). Noi seguiremo un approccio
completamente elementare.
Siamo interessati a determinare lordine di innitesimo di fb(k) quando
f Cm1 con m > 1 e f (m) continua a tratti (oppure anche solo misurabile
e limitata, o anche soltanto integrabile con integrale nito). Cominciamo con
il caso m = 1, cio con funzioni periodiche con derivata continua a tratti.
Lemma 5.18.1. Sia f C e supponiamo che f esista quasi ovunque e
f L1 (questo vero, in particolare, se f continua a tratti, oppure se
misurabile e limitata: assai pi in generale, vero nellipotesi che f sia
assolutamente continua, in base alla forma generale del Teorema Fondamentale del Calcolo, Teorema 1.28.9). Allora fb(k) infinitesimo per |k| di
ordine superiore a k1 .

Dimostrazione. Il Lemma di RiemannLebesgue 5.9.6 implica che fb (k) 0


per |k| . Dal Lemma 5.16.1 si ha
e quindi

1
fb(k) = fb (k)
ik
fb(k)
1
k

per |k| .

5.18. ORDINE DI INFINITESIMO DEI COEFFICIENTI

545

Corollario 5.18.2. Se f Cm1 , m > 1 e f (m) in L1 , allora per ogni


0 6 j 6 m esiste Bj > 0 tale che


Bj
b
f (k) 6 j
|k|

e fb(k) infinitesimo di ordine superiore a

k,
1
|k|m

per |k| .

Dimostrazione. Sappiamo che

perch

|fb(k)| 6

1
kf kL1
2


Z

Z

1
b 1
ikt

f (t)e
dt 6
|f (t)| dt.
f (k) =
2
2

Ripetute applicazioni del Lemma 5.16.1 portano alla disuguaglianza





1 d
1 1
b

(j)
f (k) = j f (k) 6 j
|k|
|k| 2



d

(j)
f

L1

Lultima asserzione dellenunciato segue come nel Lemma 5.18.1.

Ora consideriamo il caso di funzioni continue a tratti con derivata continua a tratti. Questo caso non incluso nel Lemma 5.18.1 dove si assume
che f sia continua (questa ipotesi necessaria per poter applicare il Lemma
5.16.1).
Per abbiamo visto (Esempio 5.14.1) che per la funzione a denti di sega,
b
continua a tratti con derivata continua a tratti, si ha (k)
= 2ki . Estendiamo questa osservazione nel seguente risultato (una diversa estensione verr
ottenuta nel Teorema 5.18.5):

Proposizione 5.18.3. Se f continua a tratti (con salti non nulli) con


f anchessa continua a tratti, allora fb(k) infinitesimo di ordine k1 per
k .
Dimostrazione. Dimostriamo dapprima lenunciato quando c un solo punto
di salto x0 (, ). Senza perdita di generalit possiamo assumere x0 = 0
(infatti ci riconduciamo a questo caso con una traslazione che non altera il
modulo dei coecienti di Fourier per il seguente esercizio).

546

CAPITOLO 5. SERIE DI FOURIER

Esercizio 5.18.4. I coecienti di Fourier del traslato x0 h di una funzione


h L1 (qui x0 h(x) = h(x x0 ) sono dati da

e quindi

ix0 k b
d
h(k)
x0 h(k) = e



d

x0 h(k) = |h(k)| .

Continuazione della dimostrazione della Proposizione 5.18.3.


Ora possiamo rimuovere il salto come si fatto nella dimostrazione del Teo
rema 5.15.1, cio scriviamo f = g + 1 A dove A = f (x+
0 ) f (x0 ) . In tal
modo g continua perch il suo salto al punto 0 vale 0. Infatti il salto di
vale , come si osservato nellEsempio 5.14.1, e quindi il salto di A ora
ha la stessa ampiezza di quello di f .
Quindi possiamo applicare a g il Lemma 5.18.1. Ne segue che b
g (k) un
1
innitesimo di ordine superiore a |k|
.
b
innitesimo di ordine 1 , e quindi
Daltra parte, per la Nota 5.14.2, (k)
|k|

lo anche fb(k).
Supponiamo inne che f abbia un numero nito di salti x1 , . . . , xn (, ).
In tal caso li rimuoviamo tutti iterando la procedura precedente come nella
dimostrazione del Corollario 5.15.2. Cio
n
1X
Ai i
f =g+
i=1

dove i (xi ) il traslato di che ha punto di salto in xi ed Ai =

f (x+
i ) f (xi ) . Si ha nuovamente che g continua e naturalmente g
continua a tratti (perch lo sono gli addendi). Perci si applica a g il Lemma
5.18.1 e la dimostrazione procede come prima. Infatti per lEsercizio 5.18.4
i coecienti di Fourier del traslato j di sono dati da
ikxj b
b j (k) = [

(k)
xj (k) = e

e quindi, per ogni j = 1 . . . , n,

1
b j (k)| = |(k)|
b
.
|
=
|k|

5.18. ORDINE DI INFINITESIMO DEI COEFFICIENTI

547

Pertanto i coecienti di Fourier di


=
sono dati da

e quindi

b
(k)
=

n
X
j=1

n
1X
Aj j
j=1

b
Aj eikxj (k)
=

n
i X
Aj eikxj ,
2k j=1



n


X
1
ikxj
b
|(k)| =
Aj e
.


|k|
j=1

Ne segue che

1
b
(k)
,
k
a meno che, per un certo intero k0 in poi, per ogni |k| > |k0 | valga lidentit:
n
X

Aj eikxj = 0.

j=1

b sarebbe non
Ma se valesse questa identit per tutti i |k| > |k0|, allora (k)
nullo solo per un numero nito di interi k, e pertanto sarebbe un polinomio
trigonometrico, quindi una funzione continua: invece abbiamo fatto lipotesi
che questa funzione debba avere almeno un punto di salto (almeno uno degli
Aj diverso da zero).

Nel prossimo teorema miglioriamo il risultato enunciato nel Corollario


5.18.2 sotto lipotesi che la derivata m-sima sia continua a tratti: in tal caso
1
otteniamo che fb(k) innitesimo dello stesso ordine di km+1
. Questo ci fa
guadagnare un ordine di innitesimo rispetto a quanto altrimenti ottenuto
nel Lemma 5.18.1 e nel Corollario 5.18.2 e per la funzione a denti di sega ci
b
d lordine esatto di innitesimo, (k)
k1 , dimostrato con il calcolo diretto
nellEsempio 5.14.1 e poi riottenuta come conseguenza della Proposizione
5.18.3 ( il caso m = 0 nel prossimo teorema).
Teorema 5.18.5. (Ordine di infinitesimo dei coefficienti di Fourier.)
Sia f Cm1 e Cm a tratti. Allora esiste C > 0 tale che
|fd
(k)| 6

C
|k|m+1

k.

548

CAPITOLO 5. SERIE DI FOURIER

Dimostrazione. Dal Lemma 5.16.1 segue


1 c
fb(k) = Df
(k)
ik

Iterando m volte otteniamo


 m Z
1
b
f (m) (t)eikt dt .
f (k) =
ik

A questo punto lenunciato segue dalla Proposizione 5.18.3.

(5.33)

Esercizio 5.18.6. Calcolare i coecienti di Fourier di fc (x) = |x c|, x


[, ), dove c un parametro in (1, 1). Qual il loro ordine di innitesimo?
Svolgimento. Il valore assoluto corrisponde ad un cambiamento di segno
nel dominio in cui il suo argomento negativo: quindi possiamo sbarazzarcene scrivendo |x c| = x c se x > c e |x c| = c x se x < c.
Pertanto
Z
1
b
|x c| einx dx
(5.34)
f (n) =
2
Z c

Z
1
inx
inx
(c x) e
dx +
(x c) e
dx .
=
2

c
Per ogni a, b [, ], calcoliamo integrando per parti (si veda la Sezione 1.1) lintegrale
b
b
Z b
einx
x einx
b
inx

(5.35)
Ia
xe
dx =
in a
n2 a
a
e direttamente lintegrale

Jab

b
inx

e
a

b
einx
.
dx =
in a

Segue da (5.35) e (5.36) che


b
Z b
x einx
1
inx
b
b
b
(x c) e
dx = Ia cJa =
Ka
2 a
in a

b
b
x einx
einx
+c

n2 a
in a

b
b
einx
(c x) einx
=
n2 .
in
a
a

(5.36)

5.19. FENOMENO DI GIBBS

549

Daltra parte, einx = (1)n se x = , e quindi dalla precedente identit e


da (5.34) segue
c
einc (1)n
c+
c
+ (1)n
+2
fb(n) = K
+ Kc = (1)n
in
in
n2
inc
n
2c
e
(1)
= (1)n + 2
.
in
n2


Pertanto fb(n) = O n1 se c 6= 0, ma fb(n) = O n12 se c = 0.
Questo conferma il Teorema 5.18.5. Infatti, se c 6= 0, la funzione |x c| (traslato di |x| di passo c) non pari, e quindi, periodicizzandola sullintervallo
centrato [, ), otteniamo una funzione C 1 a tratti e continua a tratti con
un salto di ampiezza nita agli estremi dellintervallo. Invece, se c = 0, allora
la funzione pari: quindi, periodicizzandola sullo stesso intervallo centrato in
0, non introduciamo salti ed otteniamo una funzione continua e C 1 a tratti.

5.19

Il fenomeno di Gibbs

Abbiamo visto nella Sezione 5.15 che la serie di Fourier di una funzione f
periodica continua a tratti e C 1 a tratti converge puntualmente ovunque.
Nei punti di salto la serie di Fourier converge al valore intermedio dei limiti
destro e sinistro di f in tali punti.
Ora mostreremo che, intorno al punto di salto, le somme parziali Sn della
serie di Fourier compiono unoscillazione di escursione superiore alla ampiezza
del salto (se n sucientemente grande). Quando n la frequenza di
queste oscillazioni aumenta, e quindi la loro ampiezza si riduce in ascisse, ma
non in ordinate (fenomeno di Gibbs).
Vedremo prima questo fenomeno per lesempio tipico della funzione a
denti di sega

X
sin kx
(x) =
k
k=1
introdotta nellEsempio 5.14.1, e poi lo esporteremo ad ogni altra funzione
continua a tratti e C 1 a tratti con un salto in (, ). Varie parti del calcolo
sono presentate separatamente in una serie di lemmi.

CAPITOLO 5. SERIE DI FOURIER

0.0

0.5

f10

1.0

1.5

550

0.0

0.5

1.0

1.5

2.0

2.5

3.0

Figura 5.10: Ringing nella approssimazione di Fourier della funzione a denti di sega

5.19. FENOMENO DI GIBBS

551

Lemma 5.19.1. Sia


(x) =

sin t
dt
t

x > 0,

e poniamo xk = k (k = 1, 2, . . . ). Allora i punti di massimo e minimo locale


della funzione sono rispettivamente i punti x2k1 e x2k , e |(xk+1 | < |(xk )|
per ogni k. In particolare,
R r sin x assoluto di || x = .
R sinilx punto di massimo
Inoltre, esiste il limite 0 x dx = limr 0 x dx.

Dimostrazione. Per il Teorema Fondamentale del Calcolo (Teorema 1.27.1)


si ha: (x) = sinx x = 0 se x = k = xk . Inoltre
(xk ) =
=
=

k
0

sin t
dt =
t
Z 2
Z k
sin t
sin t
sin t
dt +
dt + +
dt
t
t
t

(k1)
Z
Z
sin t
sin t
sin t
k
dt
dt + + (1)
dt
t
0 t + (k 1)
0 t+

perch sin(x + ) = sin(x) per ogni x. Consideriamo questi integrali


Z
sin t
dt = |(xm ) (xm1 )| .
am :=
0 t + (m 1)
Nei loro integrandi, il numeratore sempre lo stesso, ma il denominatore aumenta allaumentare di m, e, visto che il numeratore limitato in modulo da
1, gli integrandi tendono a zero uniformemente nellintervallo [0, ]. Quindi
ciascuno dei termini a segno alterno nellultimo membro dellidentit , in
valore assoluto, minore del precedente, ed inoltre limm am = 0. Lenunciato
segue in maniera ovvia da questo fatto (si tratta dello stesso argomento che si
usa per la dimostrazione della monotonia delle somme parziali pari e dispari
in una serie numerica a segni alterni (Sezione 1.1)). In particolare, per ogni
m valgono le relazioni
0 < (x2m+1 ) < (x2m1 )
0 < (x2m ) < (x2m+2 )
0 < (x2m+1 ) (x2m ) 0+ .

552

CAPITOLO 5. SERIE DI FOURIER

R k
Da qui segue che esiste il limite limk+ (xk ) = limk+ 0 sint t dt. Poich
monotna in tutti gli intervalli [xk , xk+1 ], da questo a propria volta segue
che la variazione di nella Rsemiretta [xk , +) tende a zero con k, e quindi
x
che esiste il limite limk+ 0 sint t dt.

Corollario 5.19.2.

sin x
dx <
x

sin x
dx.
x

Dimostrazione. Per
Fondamentale del Calcolo (Sezione 1.1), la
R x ilsinTeorema
t
funzione (x) = 0 t dt ha massimi e minimi locali nei punti xk = k
dove si annulla il suo integrando, ed monotna (alternativamente crescente
e decrescente) negli intervalli fra questi punti. Quindi lim supx+ (x) =
limk (x2k e lim inf x+ (x) = limk (x2k1 . Allora segue immediatamente dal Lemma 5.19.1.

Lemma 5.19.3.

sin t
dt = .
t
2

Dimostrazione. Osserviamo anzitutto che, in base al Lemma 5.19.1,


Z n
Z
sin t
sin t
dt = lim
dt .
n
t
t
0
0

(5.37)

Quindi basta dimostrare che lultimo integrale tende a /2 per n .


Segue dalla Proposizione 5.8.2 e dalla Proposizione 5.8.1 che
Z

sin((n + 21 )t)

dt = .
t
2
2 sin 2

Abbiamo anche visto (5.12) che


sin((n + 12 )t)
sin nt
1
=
cos nt se t 6= 0
t
t +
2
2 sin 2
2 tan 2

(5.38)

5.19. FENOMENO DI GIBBS

Figura 5.11: Grafico di

553

sin x
x

e della sua primitiva

554

CAPITOLO 5. SERIE DI FOURIER

e quindi in (0, ) si ha
sin((n + 12 )t)
= sin nt
2 sin 2t

1
1
t
t
2 tan 2

sin nt 1
+ cos nt.
t
2

(5.39)

Quindi, per (5.38),

dove

sin nt
=
dt + n
2
t
0


Z
Z
1
1
1
dt +

cos nt dt.
n =
sin nt
t
2 0
2 tan 2t
0

(Per maggiore compatibilit con la notazione che stiamo per adottare, dovremmo scrivere n () invece che n ). Lultimo integrale vale 0: infatti,
Z
Z
1 n
sin n
cos nt dt =
= 0.
cos u du =
n 0
n
0

In base al Lemma 5.9.3 il primo integrando limitato, e lintegrale su un


intervallo di lunghezza nita. Estendiamo tale integrando a tutto R ponendolo zero al di fuori di (0, ). In tal Rmodo si ottiene una funzione g L1 ,

ed il primo integrale altro non che sin nt g(t) dt, che tende a zero con
n per il Lemma di RiemannLebesgue 5.9.6. Pertanto, n 0 per n .
Perci
Z

sin nt
lim
dt = .
n 0
t
2
Ma
Z
Z n
sin nt
sin t
dt =
dt,
t
t
0
0
quindi, grazie a (5.37),
Z n
Z

sin t
sin t
dt = lim
dt = .
n
t
t
2
0
0

Sia la funzione a denti di sega dellEsempio 5.14.1 (la periodicizzata


di periodo 2 della funzione (x) = 2 x2 per 0 < x < 2). Poniamo
(0) = 0. DallEsempio 5.14.1 sappiamo che la serie di Fourier di converge
a puntualmente, ed in particolare, per ogni x
(x) =

X
sin kx
k=1

5.19. FENOMENO DI GIBBS

555

Indichiamo con
Sn (x) =

n
X
sin kx

k=1

le somme parziali di questa serie di Fourier.


Lemma 5.19.4.
Sn (x) =

sin nt
x
dt + n (x)
t
2

con n (x) 0 per n uniformemente rispetto a x (0, ).


Dimostrazione. Largomento del tutto analogo a quello dellultima parte
della dimostrazione del Teorema 5.9.2; non applichiamo direttamente quel
teorema perch in esso lintegrando contiene un fattore aggiuntivo t (x) che
qui manca (nel caso presente, se t abbastanza piccolo che x + t 6= , questo
fattore vale 2t : lasciamo al lettore il facile esercizio di usare questo fatto
per trovare una dimostrazione alternativa che si riduce ad una applicazione
del Teorema 5.9.2).
Si ha
!
Z x
n
1 X
x
+ Sn (x) =
+
cos kt dt.
2
2 k=1
0
Ma abbiamo visto nella Proposizione 5.8.2 che vale
n

sin((n + 12 )t)
1 X
cos kt =
+
2
2 sin 2t
k=1
se t 6= 2m (e che il primo membro uguale a n + 21 se t = 2m).
Grazie a (5.39) nel Lemma 5.19.3 ora abbiamo che
Z x
x
sin nt
+ Sn (x) =
dt + n (x)
2
t
0
dove
n (x) =

sin nt

1
1
t
t
2 tan 2

1
dt +
2

cos nt dt.

Abbiamo gi osservato che, in base al Lemma 5.9.3, il primo integrando, che


per brevit indichiamo con g, limitato. Ovviamente lo anche il secondo. Perci procediamo come nella dimostrazione della Proposizione 5.9.8,

556

CAPITOLO 5. SERIE DI FOURIER

ponendo in quellenunciato al posto di f (x + u) la funzione caratteristica


dellintervallo [0, x]: lasciamo al lettore la banale verica del fatto che la dimostrazione del Lemma 5.9.9 vale riga per riga sotto questa diversa ipotesi.
La convergenza uniforme discende dal fatto che ora, negli integrali dellenunciato del Lemma, scriviamo
[0,x] (u) invece di f (x + u),
e quindi nella sua
R
dimostrazione, invece di f u + + x f (x + u) du, abbiamo
Z






u
+
+
x

(u)
[0,x]
du
[0,x]

Z
2
=
,
([0,/] (u) + [x,x+/] (u)) du =

che non dipende da x.


Allora otteniamo che n (x) converge uniformemente a zero quando n
per x (0, ).

Raccogliendo questi risultati preliminari ora proviamo il risultato annunciato.

Teorema 5.19.5. (Fenomeno di Gibbs per la funzione a denti di


sega). Sia
Z
sin t
dt.
=
t
0
Allora > 2 , e
 
lim Sn
= ,
n
n
mentre
 
lim
= .
n
n
2
Viceversa
 
 

= ,
lim
= .
lim Sn
n
n
n
n
2

Quindi il rapporto fra lescursione di Sn n e quella di tende a
Z

2 sin t
/ =
dt 1.089490 . . .
2
0
t
per n (questa oscillazione, illustrata nella Figura 5.10, si chiama
ringing).

5.19. FENOMENO DI GIBBS

557

Dimostrazione. Il fatto che limn ( n ) =


denizione di (Esempio 5.14.1).
Abbiamo visto nel Corollario 5.19.2 che
Z
= max > lim (x) =
x+

e nel Lemma 5.19.3 che

Dal Lemma 5.19.4 segue


Sn

 
n

segue direttamente dalla

sin t
dt
t

sin t
dt = .
t
2


sin nt

.
dt
+ n
t
2n
n

tende a zero per n . Inoltre, n ( n ) 0 per n :


Naturalmente 2n
infatti sappiamo che n (x) 0 uniformemente rispetto a x (0, ), ossia
per ogni > 0 esiste N = N (indipendente da x) tale che, se n > N, si
ha |n (x)| < per ogni x (0, ). Ma siccome questa disuguaglianza vale
simultaneamente per tutti gli x, scegliendo x = /n otteniamo |n (/n)| <
per n > N: in altre parole, limn n (/n) = 0.
Quindi
Z
 
n sin nt
lim Sn
= lim
dt .
n
n 0
n
t

Daltra parte,

sin nt
dt =
t

sin u
du =
u

(indipendente da n). Questo prova la parte dellenunciato che calcola il limite


di Sn lungo la successione n . Poich dispari i limiti dellenunciato
cambiano di segno quando vengono calcolati lungo la successione n .
Inne, lapprossimazione dellintegrale
Z
2 sin t
dt 1.089490
0
t
si ottiene per via numerica.

558

CAPITOLO 5. SERIE DI FOURIER

Nota 5.19.6. Lo scarto fra i valori massimo e minimo di Sn in un intorno


di zero quindi maggiore del salto di di una percentuale che, per n ,
converge a 8.949%. In particolare, la norma uniforme dellapprossimante non
converge a quella della funzione approssimata, ma si mantiene pi elevata.

Nota 5.19.7. Per n grande, il punto n approssimativamente ilRpunto dove


x
Sn raggiunge il valore massimo. Infatti, la funzione (x) = 0 sint t dt ha
Rx
massimo in x = (Lemma 5.19.1), Daltra parte, (x) = 0n sintnt dt: perci
il termine integrale nellespressione di Sn data nel Lemma 5.19.4 si pu
scrivere come (x) = (nx), ed massimo esattamente per x = n . Gli altri
due addendi nellespressione di Sn nel Lemma 5.19.4 tendono a zero quando
calcolati in x = n 0, perci, per grandi n, non perturbano apprezzabilmente il valore del termine principale (x) che invece tende a 6= 0.

Teorema 5.19.8. (Fenomeno di Gibbs per funzioni continue a tratti


e C 1 a tratti.) Sia x0 (, ) e f di classe C 1 in (, x0 ) e (x0 , ) con
limiti finiti
lim f (x)
e

xx0

lim f (x).

xx0

Allora il fenomeno di ringing illustrato nel Teorema 5.19.5 per gli approssimati di Fourier della funzione a denti di sega vale anche per la funzione
f.
Dimostrazione. Basta scrivere f = h + Ax0 dove

A = f (x+
0 ) f (x0 ) = lim+ f (x) lim f (x).
xx0

xx0

In altre parole, si "rimuove" il salto di f come gi facemmo nel Teorema


5.15.1: in tal modo si ottiene una funzione h continua e C 1 a tratti. Per il
Corollario 5.12.4 la serie di Fourier di h converge a h uniformemente, e non
presenta alcun ringing perch il suo salto in x0 vale zero. Laltro addendo
Ax0 (x) = A(x x0 ) un multiplo di un traslato di e quindi presenta
il ringing di escursione 1.089490 . . . determinato nel Teorema 5.19.5.

5.20. ESERCIZI

5.20

559

Esercizi sulle serie di Fourier

Esercizio 5.20.1. Dimostrare lortogonalit del sistema trigonometrico direttamente con le formule di prostaferesi, senza cio far uso degli esponenziali

complessi, come invece si fatto nella Proposizione 5.1.5.


Svolgimento. Rammentiamo la notazione. In L2 ([, ]) consideriamo le
funzioni
0 (x) = 1, 2n1 (x) = sin(nx), 2n (x) = cos(nx) n = 1, 2, . . . .
Osserviamo come prima cosa che la funzione 0 ortogonale alle 2n1 e alle
2n n = 1, 2, . . . .
Infatti
Z

1 cos(nx) dx = 0

1 sin(nx) dx = 0 n = 1, 2, . . .

Anche le funzioni 2n1 e 2n sono ortogonali tra loro. Infatti


Z

2m1 2n dx =

cos(nx) sin(nx) dx

Z
1
(sin((m + n)x) + sin((m n)x)) dx = 0
=
2
m, n = 1, 2, . . . .

Analogamente
Z
Z
2m1 2n1 dx =

cos(nx) cos(nx) dx

Z
1
=
(cos((m + n)x) + cos((m n)x)) dx = 0
2
m, n = 1, 2, . . . m 6= n.

2m 2n dx =

sin(nx) sin(nx) dx = 0

m, n = 1, 2, . . . m 6= n.

Le funzioni j , j = 0, 1, 2, . . . costituiscono un sistema ortogonale.

560

CAPITOLO 5. SERIE DI FOURIER

Esercizio 5.20.2. Sia 0 < a < . Calcolare i coecienti di Fourier della


funzione caratteristica [a,a] che vale 1 in [a, a] e 0 altrove, e mostrare che
bk = 0 per ogni k (come deve essere per motivi di parit) e
a

2 sin(ka)
ak =
k
a0 =

se k 6= 0 .

Cosa si troverebbe invece per a = ?

Esercizio 5.20.3. Assumendo che la serie di Fourier della funzione f di periodo


2 denita in [, ] da f (x) = x sia
2

+
X
(1)k1
k=1

sin kx,

si ottiene che la serie di Fourier della funzione g di periodo 2 denita in


[, ] da g(x) = x 2
1. 

2. 

3. 

4. 

5. 

+
X

(1)k1
+2
sin kx;
4
k
k=1

+
X
(1)k

+2
sin kx;
2
k
k=1

+
X
(1)k1

sin kx;
+2
2
k
k=1
+
X
(1)k1

+2
sin kx;
2
k
k=1
+
X
(1)k1

2
sin kx;
4
k
k=1

Esercizio 5.20.4. Sia f la funzione di periodo 2 con il seguente graco in


[, ]:

5.20. ESERCIZI

561

Allora la sua serie di Fourier


+
4 X cos(2k 1)x

;
1. 
2 k=1 (2k 1)2
+

2. 

3. 

4. 

4 X cos(2k 1)x
;

k=1 (2k 1)2


+
+

4 X cos(2k 1)x X (1)k

+
sin kx;
2 k=1 (2k 1)2
k
k=1
+

4 X cos(2k 1)x

;
2 k=1 (2k 1)2
+

5. 

4 X sin 2kx
;

k=1 (2k)2

Esercizio 5.20.5. Sia f la funzione di periodo 2 denita in [, ] da



1
x [0, ]
f (x) =
12
x [, 0)
Allora la sua serie di Fourier

562

CAPITOLO 5. SERIE DI FOURIER

1. 

converge uniformemente su tutto R

2. 

converge uniformemente nellintervallo chiuso [0, ]

3. 

non converge uniformemente in alcun intervallo

4. 

nulla si pu dire sulla convergenza uniforme

Motivare la risposta.

Esercizio 5.20.6. Sia f la funzione di periodo 2 con il seguente graco in


[, ):

La sua serie di Fourier una delle seguenti. Quale?




P (1)k cos( k4 )
sin( (k)
8
9
4
cos(kx) + k2 sin kx
1.  8 + 2 k=1
k2
2. 

9
8

3. 

8
2

4. 

8
2

8
2

k=1

k=1

k=1

)
(1)k cos( k
4
k2

cos(kx)

(1)k +sin( k
)
4
k2

sin kx

)
(1)k cos( k
4
k2

cos(kx)

Motivare la risposta.

Esercizio 5.20.7. Sia f la funzione di periodo 2 con il seguente graco in


[, ]:

5.20. ESERCIZI

563

Allora i suoi coecienti di Fourier sono innitesimi dello stesso ordine di


1. 

1
k3

2. 

1
k

3. 

1
k2

4. 

non si pu stabilire lordine di innitesimo

Motivare la risposta.

Esercizio 5.20.8. Assumendo che la serie di Fourier della funzione f di periodo


2 denita in [, ) da f (x) = x sia
2

+
X
(1)k1
k=1

sin kx,

si ottiene che la serie di Fourier della funzione g di periodo 2 denita in


[, ) da g(x) = x
1. 

2. 

+
X
(1)k1

+ 2
sin kx;
2
k
k=1

+
X
(1)k1
k=1

sin kx;

564

CAPITOLO 5. SERIE DI FOURIER


+

3. 

2 X (1)k1
sin kx;

k=1
k

4. 

+
X
(1)k1
k=1

sin kx;

5. 

X (1)k1

2
sin kx;
2
k
k=1

Esercizio 5.20.9. Sia f la funzione di periodo 2 che in [, ) ha il graco


seguente:

La sua serie di Fourier una delle seguenti. Quale?


1. 

2. 

3. 

+
)
8 X (1)k sin( k
4
sin kx;
2 k=1
k2
+
)
8 X (1)k cos( k
4
cos kx;
2
2
k=1
k
+
+
)
)
8 X (1)k cos( k
8 X (1)k sin( k
9
4
4
+ 2
cos kx + 2
sin kx;
2
2
8 k=1
k
k=1
k

5.20. ESERCIZI

565

+
)
8 X (1)k cos( k
9
4
+ 2
cos kx;
8 k=1
k2

4. 

Esercizio 5.20.10. Sia f la funzione di periodo 2 con il seguente graco in


[, ):

Allora i suoi coecienti di Fourier sono innitesimi dello stesso ordine di


1. 

1
k3

2. 

1
k

3. 

1
k2

4. 

non si pu stabilire lordine di innitesimo

Motivare la risposta.

Esercizio 5.20.11. Sia f la funzione di periodo 2 denita in [, ) da


 1
x [0, )
2
f (x) =
32
x [, 0)
Allora la sua serie di Fourier
1. 

converge uniformemente su tutto R

2. 

converge uniformemente nellintervallo chiuso [0, ]

3.  non converge uniformemente su tutto R, ma converge puntualmente per ogni x R


4. 

nulla si pu dire sulla convergenza uniforme

566

CAPITOLO 5. SERIE DI FOURIER

Motivare la risposta.

Esercizio 5.20.12. Sia f la funzione di periodo 2 con il seguente graco in


[, ):

Allora i suoi coecienti di Fourier sono innitesimi dello stesso ordine di


1. 

1
k

2. 

1
k2

3. 

1
k3

4. 

non si pu stabilire lordine di innitesimo

Motivare la risposta.

Esercizio 5.20.13. Assumendo che la serie di Fourier della funzione f di


periodo 2 denita in [, ) da f (x) = x sia
2

+
X
(1)k1
k=1

sin kx,

si ottiene che la serie di Fourier della funzione g di periodo 2 denita in


[, ) da g(x) = x + 2
+

1. 

X (1)k1

sin kx;
2
k
k=1

2. 

+
X
(1)k1

2
sin kx;
2
k
k=1
+

3. 

X (1)k1

sin kx;
4 k=1
k

5.20. ESERCIZI
4. 

5. 

567

+
X
(1)k1
k=1

sin kx;

+
X
(1)k1

2
sin kx;
4
k
k=1

Esercizio 5.20.14. Sia f la funzione di periodo 2 denita in [, ) da


f (x) = |x|. Allora la sua serie di Fourier
1. 

converge uniformemente su tutto R

2. 

converge uniformemente nellintervallo chiuso [0, ]

3.  non converge uniformemente su tutto R, ma converge puntualmente per ogni x R


4. 

nulla si pu dire sulla convergenza uniforme

Motivare la risposta.

Esercizio 5.20.15. Sia f la funzione di periodo 2 con il seguente graco in


[, ):

La sua serie di Fourier una delle seguenti. Quale?

568
1. 

2. 

3. 

4. 

CAPITOLO 5. SERIE DI FOURIER


+
+
4 X cos(6kx) X sin(4kx)
2
+
+
;
2 k=1 1 4k 2
1 4k 2
k=1
+
4 X sin(4kx)
;
2 k=1 1 4k 2
+
2
4 X cos(6kx)
+
;
2 k=1 1 4k 2
+
4 X cos(6kx)
;
2 k=1 1 4k 2

Esercizio 5.20.16. Sia f la funzione di periodo 2 con il seguente graco in


[, ):

La sua serie di Fourier una delle seguenti. Quale?


+

1. 

32 32 X (1)k
+ 2
sin((2k + 1)x);

k=1 (2k + 1)2

2. 

32 X (1)k
sin((2k + 1)x);
2 k=1 (2k + 1)2

3. 

+
+
X
(1)k
32 32 X (1)k
+ 2
sin((2k
+
1)x)
+
cos(2kx);

k=1 (2k + 1)2


(2k)2
k=1

5.20. ESERCIZI

569
+

4. 

32 32 X (1)k
+
+
cos(2kx);

(2k)2
k=1

Esercizio 5.20.17. Sia f la funzione di periodo 2 denita in [, ) da



2x
x [0, )
f (x) =
2
x [, 0)
Allora la sua serie di Fourier
1. 

converge uniformemente su tutto R

2. 

converge uniformemente nellintervallo chiuso [0, ]

3.  non converge uniformemente su tutto R, ma converge puntualmente per ogni x R


4. 

nulla si pu dire sulla convergenza uniforme

Motivare la risposta.

Esercizio 5.20.18. Assumendo che la serie di Fourier della funzione f di


periodo 2 denita in [, ) da f (x) = x sia
2

+
X
(1)k1
k=1

sin kx,

si ottiene che la serie di Fourier della funzione g di periodo 2 denita in


[, ) da g(x) = x + 2
+

1. 

2. 

X (1)k1
+
sin kx;
2 k=1
k

+
X
(1)k
k=1

3. 

sin kx;

X (1)k1

sin kx;
2 k=1
k

570

CAPITOLO 5. SERIE DI FOURIER


+
X
(1)k1

2
sin kx;
4
k
k=1

4. 

+
X
(1)k1

+2
sin kx;
2
k
k=1

5. 

Motivare la risposta.

Esercizio 5.20.19. Sia f la funzione di periodo 2 con il seguente graco in


[, ):

Allora i suoi coecienti di Fourier sono innitesimi dello stesso ordine di


1. 

1
k

2. 

1
k2

3. 

1
k3

4. 

non si pu stabilire lordine di innitesimo

Motivare la risposta.

Esercizio 5.20.20. Sia f la funzione di periodo 2 denita in [, ) da


f (x) = x2 . Allora la sua serie di Fourier
1. 

converge uniformemente su tutto R

5.20. ESERCIZI
2. 

571

converge uniformemente nellintervallo chiuso [0, ]

3.  non converge uniformemente su tutto R, ma converge puntualmente per ogni x R


4. 

nulla si pu dire sulla convergenza uniforme

Motivare la risposta.

Esercizio 5.20.21. Sia f la funzione di periodo 2 con il seguente graco in


[, ):

La sua serie di Fourier una delle seguenti. Quale?


+

1. 

2 X cos(2k 1)x
+
;
2
(2k 1)3
k=1
+

2. 

4 X sin(2k 1)x
+
;
2
(2k 1)3
k=1

3. 

4 X sin(2k 1)x
;
k=1 (2k 1)3

4. 

2 X cos(2k 1)x 4 X sin(2k 1)x


+
+
;
2 k=1 (2k 1)3
k=1 (2k 1)3

Motivare la risposta.

Esercizio 5.20.22. Sia f la funzione di periodo 2 con il seguente graco in


[, ):

572

CAPITOLO 5. SERIE DI FOURIER

Allora i suoi coecienti di Fourier sono innitesimi dello stesso ordine di


1. 

1
k2

2. 

1
k

3. 

1
k3

4. 

non si pu stabilire lordine di innitesimo

Motivare la risposta.

Esercizio 5.20.23. Assumendo che la serie di Fourier della funzione f di


periodo 2 denita in [, ) da f (x) = x sia
2

+
X
(1)k1
k=1

sin kx,

si ottiene che la serie di Fourier della funzione g di periodo 2 denita in


[, ) da g(x) = + x
+

1. 

2. 

X (1)k1
+
sin kx;
2 k=1
k
+2

+
X
(1)k1
k=1

3. 

sin kx;

+
2 X (1)k1
+
sin kx;
k=1
k

5.20. ESERCIZI

573

4. 

X (1)k1

sin kx;
2 k=1
k

5. 

X (1)k1
+
sin kx;
4
k

k=1

Motivare la risposta.

Esercizio 5.20.24. Assumendo che la serie di Fourier della funzione f di


periodo 2 denita in [, ) da f (x) = x sia
2

+
X
(1)k1
k=1

sin kx,

si ottiene che la serie di Fourier della funzione g di periodo 2 denita in


[, ) da g(x) = x 2
1. 

+
X

(1)k1
+2
sin kx;
4
k
k=1

2. 

+
X
(1)k

+2
sin kx;
2
k
k=1

3. 

+
X

(1)k1
+2
sin kx;
2
k
k=1

4. 

5. 

+
X
(1)k1

+2
sin kx;
2
k
k=1
+
X
(1)k1

2
sin kx;
4
k
k=1

Motivare la risposta.

Esercizio 5.20.25. Sia f la funzione di periodo 2 con il seguente graco in


[, ):

574

CAPITOLO 5. SERIE DI FOURIER

La sua serie di Fourier una delle seguenti. Quale?


+

1. 

4 X cos(2k 1)x

;
2
(2k 1)2
k=1

2. 

+
4 X cos(2k 1)x
;

(2k 1)2
k=1

3. 

4. 

k=1

k=1

4 X cos(2k 1)x X (1)k

+
sin kx;
2
(2k 1)2
k
+
4 X sin 2kx
;

(2k)2
k=1

Motivare la risposta.

Esercizio 5.20.26. Sia f la funzione di periodo 2 denita in [, ) da



1
x [0, )
f (x) =
x
2
x [, 0)
Allora la sua serie di Fourier

5.20. ESERCIZI
1. 

converge uniformemente su tutto R

2. 

converge uniformemente nellintervallo chiuso [0, ]

575

3.  non converge uniformemente su tutto R, ma converge puntualmente per ogni x R


4. 

nulla si pu dire sulla convergenza uniforme

Motivare la risposta.

Esercizio 5.20.27. Sia f la funzione di periodo 2 con il seguente graco in


[, ):

Allora i suoi coecienti di Fourier sono innitesimi dello stesso ordine di


1. 

1
k3

2. 

1
k

3. 

1
k2

4. 

non si pu stabilire lordine di innitesimo

Motivare la risposta.

Esercizio 5.20.28. Sia f la funzione di periodo 2 con il seguente graco in


[, ):

576

CAPITOLO 5. SERIE DI FOURIER

Allora i suoi coecienti di Fourier sono innitesimi dello stesso ordine di


1. 

1
k

2. 

1
k2

3. 

1
k3

4. 

non si pu stabilire lordine di innitesimo

Motivare la risposta.

Esercizio 5.20.29. Sia f la funzione di periodo 2 denita in [, ) da


f (x) = | cos x|. Allora la sua serie di Fourier
1. 

converge uniformemente su tutto R

2. 

converge uniformemente nellintervallo chiuso [0, ]

3.  non converge uniformemente su tutto R, ma converge puntualmente per ogni x R


4. 

nulla si pu dire sulla convergenza uniforme

Motivare la risposta.

Esercizio 5.20.30. Sia f la funzione di periodo 2 con il seguente graco in


[, ):

5.20. ESERCIZI

577

La sua serie di Fourier una delle seguenti. Quale?


+

1. 

4 X sin(2k 1)x
;
k=1 (2k 1)3

2. 

2
4 X sin(2k 1)x 4 X cos 2kx
+
+
;

(2k 1)3

(2k)3

k=1

k=1

3. 

4 X cos 2kx
2
+
;
k=1 (2k)3

4. 

2
4 X sin(2k 1)x
+
;
k=1 (2k 1)3

Motivare la risposta.

Esercizio 5.20.31. Assumendo che la serie di Fourier della funzione f di


periodo 2 denita in [, ) da f (x) = x sia
2

+
X
(1)k1
k=1

sin kx,

si ottiene che la serie di Fourier della funzione g di periodo 2 denita in


[, ) da g(x) = x
+

1. 

X (1)k1

2
sin kx;
2
k
k=1

2. 

3. 

4. 

X (1)k
sin kx;
2 k=1 k

+
8 X (1)k1

sin kx;
2 k=1
k
+

8 X (1)k1

sin kx;
4 k=1
k

578
5. 

CAPITOLO 5. SERIE DI FOURIER


2

+
X
(1)k1
k=1

sin kx;

Motivare la risposta.

Esercizio 5.20.32. Sia f una funzione periodica di periodo 2 e sia

a0 X
[ak cos kx + bk sin kx]
+
2
k=1

la sua serie di Fourier. Scrivere lespressione del coeciente a0 . Quanto vale


a0 se la funzione f pari? Quanto vale a0 se la funzione f dispari?

Esercizio 5.20.33. Sia f la funzione di periodo 2 denita in [, ) da



sin x
se
x [, 0)
f (x) =
x2
se
x [0, )

Allora la sua serie di Fourier


1. 

converge uniformemente su tutto R

2. 

converge uniformemente nellintervallo chiuso [0, ]

3.  non converge uniformemente su tutto R, ma converge puntualmente per ogni x R


4. 

nulla si pu dire sulla convergenza uniforme

Motivare la risposta.

Rx

Esercizio 5.20.34. Sia F (x) = 0 f (t)dt.


Che ipotesi deve soddisfare f anch F sia periodica?
Se la serie di Fourier di f (t)

cn eint

n=

e la serie di Fourier di F (t)

n=

allora

an eint

5.20. ESERCIZI
1.  an =

579

cn
n

2.  an = ncn
3.  an = cn
4.  non vi alcuna relazione tra i coecienti an e cn .
Motivare la risposta.

Esercizio 5.20.35. Sia f una funzione periodica di periodo 2 di classe C 1 .


Sia

X
an einx
n=

la serie di Fourier di f . Se

cn einx

n=

la serie di Fourier di f , quale relazione intercorre tra i coecienti an e cn ?


1.  cn =

an
in

2.  cn = inan
3.  cn = nan
4.  cn =

an
n

Motivare la risposta.

P
P
Esercizio 5.20.36. Se a20 +
k=1 ak cos(kx)+
k=1 bk sin kx la serie di Fourier
di una funzione f , qual la serie di Fourier di g(x) = f (x) + 1?
P
P
1.  a20 +
k=1 (bk + 1) sin kx
k=1 ak cos(kx) +
P
P
2.  a20 + 1 +
k=1 (bk + 1) sin kx
k=1 (ak + 1) cos(kx) +
P
P
3.  a20 + 1 +
k=1 bk sin kx
k=1 ak cos(kx) +
P
P
4.  a20 + (a1 + 1) cos x
k=1 bk sin kx
k=2 ak cos(kx) +

580
5. 

CAPITOLO 5. SERIE DI FOURIER


nessuna delle precedenti

Motivare la risposta.

P
Esercizio 5.20.37. Sia
k=1 ak sin kx la serie di Fourier di una funzione periodica e integrabile. Allora
1. 

la successione {ak } converge a zero per k

2. 

la successione {ak } diverge per k

3. 

la successione {ak } converge a 1 per k

4.  la successione {ak } non ammette limite per k


5.  non si hanno informazioni sulla successione {ak }
Motivare la risposta.

Esercizio 5.20.38. Assumendo che la serie di Fourier della funzione f di peP


(1)k1
riodo 2 denita in [, ) denita da f (x) = x sia 2
sin kx, si
k=1
k
ottiene che la serie di Fourier della funzione di periodo 2 denita in [, )
denita da g(x) = x 4
1. 

2.  2
3. 

5. 

+2

k=1

4.  2

k=1

k=1

(1)k1
k

+2

P
P

k=1

(1)k1
k

(1)k1
k

sin kx

sin kx
(1)k1
k

sin kx

sin k(x 4 )

nessuna delle precedenti

Motivare la risposta.

5.20. ESERCIZI

581

Esercizio 5.20.39. Sia f la funzione di periodo 2 denita in [, ) da



cos(x)
se
x [, 0)
f (x) =
1
se
x [0, )
Allora la sua serie di Fourier
1. 

converge uniformemente su tutto R

2. 

converge uniformemente nellintervallo chiuso [0, ]

3.  non converge uniformemente su tutto R, ma converge puntualmente per ogni x R


4. 

nulla si pu dire sulla convergenza uniforme

Motivare la risposta.

Esercizio 5.20.40. Sia f la funzione di periodo 2 denita da f (x) = x2 in


[, ). Quale delle seguenti la sua serie di Fourier?
1. 

2
3

2.  4
3. 

5. 

k=1

k=1

2
3

4.  4

+4

+4

(1)k+1
k2

k=1

(1)k
k2

cos kx + 4

cos kx

k=1

(1)k+1
k2

(1)k
k2

sin kx

k=1

(1)k+1
k

sin kx

cos kx

nessuna delle precedenti

Motivare la risposta.

Esercizio 5.20.41. Sia f la funzione di periodo 2 denita in [, ) da



0
se
x [, 0)
f (x) =
x
se
x [0, )
Allora la sua serie di Fourier
1. 

converge uniformemente su tutto R

582
2. 

CAPITOLO 5. SERIE DI FOURIER


converge uniformemente nellintervallo chiuso [0, ]

3.  non converge uniformemente su tutto R, ma converge puntualmente per ogni x R


4. 

nulla si pu dire sulla convergenza uniforme

Motivare la risposta.

Esercizio 5.20.42. Sia f la funzione di periodo 2 denita in [, ) da


f (x) = | sin x|. Allora la sua serie di Fourier
1. 

converge uniformemente su tutto R

2. 

converge uniformemente nellintervallo chiuso [0, ]

3.  non converge uniformemente su tutto R, ma converge puntualmente per ogni x R


4. 

nulla si pu dire sulla convergenza uniforme

Motivare la risposta.

Esercizio 5.20.43. Sia f la funzione di periodo 2 con il seguente graco in


[, ):

Allora la sua serie di Fourier una delle seguenti. Quale?


P
(1)k1
1.  2
sin kx
k=1
k

2. 

3.  2
4.  2

+2

k=1

k=1

k=1

(1)k1
k

sin kx

(1)k1
k2

sin kx

(1)k1
k

cos(kx)

5.20. ESERCIZI

583

Motivare la risposta.

Esercizio 5.20.44. Sia f la funzione di periodo 2 denita in [, ) da


P
2
(1)k
f (x) = x2 . Assumendo che la serie di Fourier di f sia 3 +4
k=1 k 2 cos kx,
scrivere lespressione della serie di Fourier della funzione g di periodo 2
denita in [, ) da g(x) = x.

Esercizio 5.20.45. Sia f la funzione di periodo 2 con il seguente graco in


[, ):

Allora i suoi coecienti di Fourier sono innitesimi dello stesso ordine di


1. 

1
k3

2. 

1
k

3. 

1
k2

4.  non si pu stabilire lordine di innitesimo.


Motivare la risposta.

Esercizio 5.20.46. Sia f la funzione di periodo 2 denita in [, ) da


f (x) = x2 . Allora i suoi coecienti di Fourier sono innitesimi dello stesso
ordine di
1. 

1
k3

2. 

1
k

3. 

1
k2

4.  non si pu stabilire lordine di innitesimo.

584

CAPITOLO 5. SERIE DI FOURIER

Motivare la risposta.

Esercizio 5.20.47. Sia f la funzione di periodo 2 con il seguente graco in


[, ):

Allora i suoi coecienti di Fourier sono innitesimi dello stesso ordine di


1. 

1
k3

2. 

1
k

3. 

1
k2

4.  non si pu stabilire lordine di innitesimo.


Motivare la risposta.

Esercizio 5.20.48. Sia f la funzione di periodo 2 con il seguente graco in


[, ):

5.20. ESERCIZI

585

La sua serie di Fourier una delle seguenti. Quale?


1. 

2. 

3. 

4. 

k=1

k=1

k=1

cos(2k1)x
(2k1)3
sin(2k1)x
(2k1)3

sin(2k1)x
(2k1)3

sin(2k1)x
k=1 (2k1)3

5.  nessuna delle precedenti

k=1

sin(2k1)x
(2k1)3

Motivare la risposta.

Esercizio 5.20.49. Sia f la funzione di periodo 2 con il seguente graco in


[, ]:

Allora i suoi coecienti di Fourier sono innitesimi dello stesso ordine di


1. 

1
k3

2. 

1
k

3. 

1
k2

4.  non si pu stabilire lordine di innitesimo.

586

CAPITOLO 5. SERIE DI FOURIER

Motivare la risposta.

Esercizio 5.20.50. Consideriamo la serie di Fourier della funzione f (x) =


arctan x in [, ), ossia la serie trigonometrica i cui coecienti sono i coecienti di Fourier di f (x) in [, ). Senza calcolare tali coecienti, rispondere
alle seguenti domande:
(i) La serie converge in L2 [, ]?
(ii) La serie converge puntualmente su R?
(iii) La serie converge uniformemmente su R?
(iv) Qual lordine di innitesimo dei coecienti?

Esercizio 5.20.51. Consideriamo la serie


+
X
n=2

n2

1
e2in .
n

(i) La serie converge uniformemente?


(ii) La serie converge puntualmente?
(iii) La serie la serie di Fourier di qualche funzione? Se s, quale? Se no,
perch?
(iv) Se invece consideriamo la serie
+
X
1 2in
e
.
n
n=1

mostrare che lo stesso argomento non serve a rispondere alla domanda (iii). Cautela: questo non vuol dire che questa serie non sia una
serie di Fourier. In eetti, grazie a (5.28), la sua parte immaginaria
riconducibile alla serie di Fourier della funzione a denti di sega dellEsempio 5.14.1; per la parte reale, pi delicata da studiare, si veda la
Proposizione 7.6.31 nel seguito.

5.20. ESERCIZI

587

Esercizio 5.20.52. Per x [0, 2], sia


f (x) =

2
1
x + x2 .
6
2
4

Si mostri che questa funzione pari rispetto alla riessione x 7 2 x. In


analogia allEsempio 5.3.5, si mostri che i coecienti di Fourier di f sono in
soli coseni, e valgono a0 = 0, e ak = 1/k 2 per k > 0. P
Si ricavi da questo fatto
2
un modo di calcolare la somma della serie numerica
k=1 1/k alternativo a
quello della Nota 5.3.6.

Esercizio 5.20.53. Per x [0, 2], sia


f (x) =

1
x (x ) (x 2) .
12

Si mostri che questa funzione dispari rispetto alla riessione x 7 2 x. Si


mostri che i coecienti di Fourier di f sono in soli seni, e valgono bk = 1/k 3 .
Si ricavi da questo lidentit

X
(1)k
3
=
(2k + 1)3
32
k=1

(si veda la Nota 5.3.6).

Esercizio 5.20.54. Per x [0, 2], sia


f (x) =

4 2 2
3
1

x +
x x4 .
90 12
12
48

Si mostri che questa funzione pari rispetto alla riessione x 7 2 x. Si


mostri che i coecienti di Fourier di f sono in soli coseni, e valgono a0 = 0,
e ak = 1/k 4 per k > 0. Si ricavi da questo lidentit

X
4
1
=
k4
90
k=1

(si vedano la Nota 5.3.6 ed il precedente Esercizio 5.20.53).

588

CAPITOLO 5. SERIE DI FOURIER

Capitolo 6
Identit approssimate ed
approssimazione con polinomi
trigonometrici ed algebrici
6.1

Approssimazione uniforme con polinomi trigonometrici e identit approssimate

Abbiamo visto che i polinomi trigonometrici sono densi nello spazio delle funzioni continue e periodiche nella norma uniforme (Teorema di Completezza
di Weierstrass 5.13.3).
Di questo fatto abbiamo dato una dimostrazione costruttiva: una funzione
f C viene approssimata a meno di 2 con funzioni lineari a tratti e ciascuna di queste viene approssimata a meno di 2 con qualche somma parziale
della sua serie di Fourier. Ma questo metodo numericamente insostenibile:
di ciascun approssimante qn lineare a tratti si devono calcolare un numero
suciente di coecienti di Fourier. Quanti siano si pu stimare grazie al
Teorema 5.17.1, ma comunque per ogni nuovo approssimante qn si devono
ricalcolare tutti i coecienti di Fourier. Quindi il metodo molto pi lento
persino del calcolo delle somme parziali della serie di Fourier, per le quali ad
ogni passo n di approssimazione si deve calcolare solo il nuovo coeciente di
Fourier cio il coeciente n-esimo, ma naturalmente queste somme parziali
non si possono usare per lapprossimazione, perch la serie di Fourier di una
funzione continua di solito non converge uniformemente (come accennato in
Sezione 5.5). In questa Sezione e nella prossima studieremo metodi nume589

590CAPITOLO 6. APPROSSIMAZIONE TRIGONOMETRICA E POLINOMIALE


ricamente ecienti per lapprossimazione uniforme di f C con polinomi
trigonometrici.
Nota 6.1.1. (Scelta di periodo unitario.) In questo e nei successivi capitoli avremo frequentemente bisogno di presentare enunciati che valgono in
maniera identica per funzioni in L1 (R) e per funzioni L1 . Di conseguenza
comodo normalizzare nello stesso modo gli integrali nei due casi. A questo scopo, in questa Sezione scegliamo il periodo delle funzioni periodiche in
modo adeguato a questo scopo: consideriamo solo funzioni di periodo 1. La
R1
norma di f in L1 diventa quindi 2 1 |f (t)| dt, ed analogamente per le norme
2

in Lp (rammentiamo che le norme in L1 [0, 1], e quindi in L1 , e pi in generale


in Lp per 1 < p < , sono state introdotte nella Denizione 5.1.3.
I coecienti di Fourier diventano
fb(n) =

1
2

f (t) e2int dt

(6.1)

12

(si noti la periodicit di periodo 1 degli esponenziali complessi nellintegrando).


Questa scelta del periodo sar mantenuta nel resto di questopera, tranne,
per motivi storici, nella Sezione 6.2 e nel Capitolo 7, ove il periodo ritorner
ad essere 2.

Per prima cosa, introduciamo loperazione di convoluzione di funzioni


periodiche:
Definizione 6.1.2. Siano f, g L2 , o, pi in generale, f Lp e g Lq con
p e q indici coniugati, ovvero 1/p + 1/q = 1 (Denizione 1.16.4). Deniamo
il prodotto di convoluzione f g come la funzione
f g(x) =

1
2

12

f (x t)g(t) dt .

Lintegrale converge in base alla disuguaglianza di Hlder (Teorema 1.16.6).


Pi in generale, deniamo allo stesso modo f g quando f , g L1 : in tal
caso la convoluzione pu non essere denita puntualmente ovunque, ma
una funzione in L1 .

6.1. CONVOLUZIONE ED IDENTIT APPROSSIMATE

591

Nota 6.1.3. Se f , g L1 , la loro convoluzione unoperazione commutativa:


f g(x) = g f (x). Infatti:
f g(x) =

1
2

12

f (x t)g(t) dt =

1
2

12

f (t)g(x t) dt = g f (x) .

Esercizio 6.1.4. La convoluzione associativa: (f g) h = f (g h) per


ogni f , g, h in L1 (o pi in generale, per ogni terna di funzioni per cui la
convoluzione abbia senso).
Suggerimento: lo scambio dellordine di integrazione permesso dal Teorema
di Fubini (parte (ii) del Teorema 1.20.4).
(Rivedremo questo stesso argomento nel caso della misura discreta (counting
measure), ossia per la commutativit della convoluzione di successioni, nella
Nota 19.3.1).

Proposizione 6.1.5. Siano f , g L1 .


(i) f g L1 e kf gkL1 6 kf kL1 kgkL1 (in particolare, lo spazio vettoriale L1 chiuso rispetto al prodotto di convoluzione, nel senso che la
convoluzione di due funzioni in L1 ancora in L1 : si dice che L1
un algebra per convoluzione).
(Analogamente, se f L1 e g Lp , allora f g Lp e kf gkLp 6
kf kL1 kgkLp .)
(ii) Se g limitata, allora f g continua e kf gk 6 kf kL1 kgk .
Piin generale, se f Lp e g Lq con p, q indici coniugati nel senso
della Definizione 1.16.4 (ossia 1 6 p, q 6 e 1/p + 1/q = 1), allora
f g C e kf gk 6 kf kLp kgkLq .
(iii) Se g derivabile allora f g derivabile, e (f g) = f g ; se f
derivabile, f g derivabile, e (f g) = f g. In generale, se f C k
e g L1 , allora f g C k e D k (f g) = D k f g.
Dimostrazione. La disuguaglianza nella parte (i) segue immediatamente dallo scambio dellordine di integrazione, grazie al Teorema di Fubini (Teorema

592CAPITOLO 6. APPROSSIMAZIONE TRIGONOMETRICA E POLINOMIALE


1.20.4) per integrandi positivi, nellultimo integrale doppio nella disuguaglianza

Z 1 Z 1
Z 1 Z 1

2
2
2
2


kf gk1 =
f (x t)g(t) dt dx 6
|f (x t)| |g(t)| dt dx .


1 1
1 1
2

La continuit della convoluzione segue dal fatto che la funzione integrale


continua (anzi di pi, assolutamente continua: Lemma 1.27.2).
Per quanto riguarda (ii), la disuguaglianza kf gk 6 kf kL1 kgk evidente. La continuit segue dal Lemma 5.9.4 e da questa disuguaglianza, che
conseguenza di (i):
|f g(x + h) f g(x)| 6 kh f f kL1 kgk
(dove abbiamo posto h f (x) = f (x h), come nellEsercizio 5.18.4).
Se f Lp e g Lq con p, q indici coniugati, allora per ogni x si ha |f g(x)| :=
|hx f , gi| 6 kf kLp kgkLq in base alla disuguaglianza di Hlder (Teorema
1.16.6).
Inne, (iii) segue dal teorema di derivazione sotto il segno di integrale su

domini illimitati (Corollario 1.23.7).


Proposizione 6.1.6. I coefficienti di Fourier sono moltiplicativi rispetto al
prodotto di convoluzione: per ogni intero n,
f[
g(n) = fb(n) b
g (n).

Dimostrazione. Ancora grazie al Teorema di Fubini 1.20.4,


Z 1
2
[
(f g)(t) e2int dt
f g(n) =
12

=
=
=

1
2

12
1
2

12
1
2

12

Z
Z

1
2

12
1
2
12

f (t u) g(u) du e2int dt
f (t u) e2in(tu) g(u) e2inu du dt
2iny

f (y)e

= fb(n) b
g (n).

dy

1
2

12

g(u) e2inu du

6.1. CONVOLUZIONE ED IDENTIT APPROSSIMATE

593

Sia ora g un polinomio trigonometrico. Allora g ha solo un numero nito


di coecienti di Fourier non nulli. Segue dalla Proposizione 6.1.6 che anche
g f un polinomio trigonometrico, per qualunque f L1 .
Se f C , come possiamo costruire una successione di polinomi trigonometrici gn tali che gn f f uniformemente per n ? Dalla Denizione
6.1.2 si vede che, se
Z 1
2
g(t) dt = 1,
12

allora g f (x) una media integrale dei valori di f intorno a x pesati con il
peso g(x t) = g (t x) (qui g (u) = g(u)), che il traslato di g di passo
x.
Normalmente, per parlare di media integrale, si preferisce fare lipotesi
che il peso sia positivo. Assumiamo quindi g > 0. chiaro che, se vogliamo
che le medie integrali gn f convergano al valore f (x), dovremo richiedere
che i pesi gn (t) diventino piccoli al crescere di n tranne che per valori di t
vicini a zero. Perci poniamo:
Definizione 6.1.7. Una successione di funzioni hn unidentit approssimata in L1 se verica le seguenti condizioni:
(i)

hn L1
continua)

(ii)

hn (x) > 0 ovunque (quasi ovunque se hn non

1
2

21

(iii) Per ogni ,

0<<

1
2

lim

per ogni n

hn (t) dt = 1
, si ha

12

hn (t) dt +

1
2

hn (t) dt

= 0.

Nel seguito assumeremo spesso che tutte le hn siano funzioni pari (in
tal caso i due integrali nella parte (iii) della Denizione (6.1.7) sono uguali.
Nella prossima Sezione studieremo alcuni esempi dove le hn sono polinomi
trigonometrici.

594CAPITOLO 6. APPROSSIMAZIONE TRIGONOMETRICA E POLINOMIALE


Le identit approssimate si chiamano cos proprio perch, per ogni f C ,
hn f f
uniformemente per n , come dimostriamo nel seguente teorema:
Teorema 6.1.8. (Convergenza di identit approssimate a funzioni
continue). Se hn unidentit approssimata, allora
lim khn f f k = 0

per ogni f C .

Per la dimostrazione abbiamo bisogno del seguente richiamo sulla uniforme continuit:
Nota 6.1.9. Una funzione f uniformemente continua se la quantit
() = f () = sup {|f (x) f (y)| : |x y| < }
(denita per > 0 e detta modulo di continuit di f ) verica la propriet
lim () = 0.

0+

Infatti dire che il limite nullo un altro modo di scrivere la denizione di


uniforme continuit: per ogni > 0 esiste > 0 tale che se |x y| < allora
|f (x) f (y)| < . Si noti che ovviamente () monotona non decrescente
al variare di > 0.

Dimostrazione del Teorema 6.1.8. Dalla propriet (ii) della Denizione 6.1.7
si ha
Z 1
2
hn (t)f (x t) dt f (x)
hn f (x) f (x) =
=
=
=

12
1
2

12
1
2

12
1
2

12

hn (t)f (x t) dt
hn (t)f (x t) du

1
2

21

1
2

12

hn (t) dt f (x)

hn (t)f (x) dt

hn (t)(f (x t) f (x)) dt.

6.1. CONVOLUZIONE ED IDENTIT APPROSSIMATE

595

Perci, con la terminologia della Nota 6.1.9, dalla propriet (i) della Denizione 6.1.7 segue
Z 1
2
hn (t)|f (x t) f (x)| dt
|hn f (x) f (x)| 6
21

1
2

21

(6.2)

hn (t) (|t|) dt.



Ma, poich f continua nellintervallo chiuso e limitato 12 , 21 , essa uniformemente continua per il Teorema di Heine sulla uniforme continuit (Teorema 1.8.6). Per ogni > 0 esiste quindi > 0 tale che () < 2 grazie alla
Nota 6.1.9.
Fissiamo ed il corrispondente . Allora, per la propriet (iii) della Denizione 6.1.7, esiste n0 (che dipende da e da ) tale che, se n sucientemente
grande, ossia maggiore di n0 , si ha
Z 1
Z
2

hn (t) dt <
hn (t) dt <
,
(6.3)
4M
4M

21
dove



1 1
6 2 kf k .
M = (1) = max |f (x) f (y)| : x, y ,
2 2


Da tutte queste disuguaglianze e da (6.2) segue che, se n maggiore di un


opportuno intero n0 che dipende da e ,
Z 1
2
|hn f (x) f (x)| 6
hn (t) (|t|) dt
12

21

6 ()

Z 1!
2

hn (t) (|t|) dt

hn (t) dt + 2M

4M

(per il primo addendo abbiamo usato il fatto che non decrescente, per il
secondo abbiamo usato anche (6.3)). Ora di nuovo dalla propriet (ii) della
Denizione 6.1.7, si ha

|hn f (x) f (x)| 6 () + < ,


2

596CAPITOLO 6. APPROSSIMAZIONE TRIGONOMETRICA E POLINOMIALE


purch, ssato > 0 si scelga in funzione di (ma non di n) come indicato sopra (cio cos piccolo che () < /2), e dato questo si scelga
n > n0 = n0 (, ). Abbiamo provato che hn f converge a f uniformemente
rispetto a x.
Se avessimo anche usato lipotesi aggiuntiva che hn fosse pari, allora la dimostrazione sarebbe risultata leggermente semplicata (ma sostanzialmente
la stessa). La dimostrazione identica se si assume f C(R).

Teorema 6.1.10. (Convergenza di identit approssimate nella norma di L1 o Lp ). Se hn unidentit approssimata in L1 , allora
lim khn f f kL1 = 0

per ogni f L1 .

Lo stesso risultato vale per f Lp , 1 6 p < (il limite si prende nella


norma in Lp ).
Dimostrazione. Da (6.2) si ha
khn f f kL1 6
=

1
2

12

1
2

12

Z
Z

1
2

21
1
2

21

hn (t)|f (x t) f (x)| dt dx

(6.4)

hn (t)|f (x t) f (x)| dx dt.

Abbiamo scambiato lordine di integrazione grazie al Teorema di Fubini


(Teorema 1.20.4), che si pu applicare perch lintegrando non negativo.
Sia
Z 1
F (t) =

12

|f (x t) f (x)| dx.

Osserviamo che F una funzione continua della variabile t R, anzi uniformemente continua, perch per ogni > 0 esiste > 0 tale che, se
|t1 t2 | < ,
Z 1

2
|f (x t1 ) f (x)| |f (x t2 ) f (x)| dx
|F (t1 ) F (t2 )| 6
6
=

12
1
2

12
1
2

12

|f (x t1 ) f (x t2 )| dx

|f (x (t1 t2 ) f (x)| dx <

6.1. CONVOLUZIONE ED IDENTIT APPROSSIMATE

597

grazie alla disuguaglianza triangolare ||a| |b|| 6 |a b|, al Lemma 5.1.1 ed


alla continuit della traslazione rispetto alla norma L1 (Lemma 5.9.4).
Quindi da (6.4) segue
Z 1
2
hn (t)F (t) dt = hn F (0)
khn f f kL1 6
12

(rammentiamo la notazione F (t) = F (t)). Poich F continua (e quindi


anche F ) si ha
lim hn F (0) = F (0) = 0
n

dal Teorema 6.1.8.


Quindi
lim khn f f kL1 = 0.

Il caso di f Lp si ottiene tramite approssimazione delle funzioni in Lp


con funzioni continue (Proposizione 1.18.6), come nelle disuguaglianze (5.17)
del Lemma 5.9.4 sulla continuit delloperatore di traslazione (che in eetti
un caso particolare, come vedremo in seguito nella Sezione 11.14, dove
esprimeremo loperatore di traslazione come un operatore di convoluzione).
In eetti, per ogni f Lp e > 0, scegliamo g C tale che kf gkLp < /3,
ed osserviamo che, in base alla parte (i) della Proposizione 6.1.5 ed alla
normalizzazione delle identit approssimate (propriet (ii) della Denizione
6.1.7),
khn f hn gkLp 6 khn kL1 kf gkLp = kf gkLp < /3 .

(6.5)

Ora, per il teorema di convergenza uniforme di identit approssimate (Teorema 6.1.8), esiste n0 tale che, per ogni n > n0 , si ha khn g gk < , e
quindi, per n > n0 ,
khn g hg kLp 6 khn g gk < /3, .

(6.6)

Combinando (6.5) e (6.6) con la condizione di approssimazione kf gkLp <


varepsilon/3, ed usando la disuguaglianza triangolare come in (5.17), si deduce che khn f f kLp < per n > n0 ossia la convergenza di hn f a f
nella norma di Lp .

Passiamo ora a considerare il caso di funzioni in C(R) o L1 (R) invece che


in C o L1 .

598CAPITOLO 6. APPROSSIMAZIONE TRIGONOMETRICA E POLINOMIALE


Definizione 6.1.11. Se f, g L1 (R) la convoluzione di f e g denita da:
Z
f g(x) =
f (x t) g(t) dt.

Nota 6.1.12. Se f L1 (R) a supporto compatto, allora f g(x) esiste nito


per ogni x non solo per ogni g L (R) ma anche per ogni g localmente
integrabile (ossia con intregrale nito su ogni compatto). Per, se f non a
supporto compatto, allora f g(x) diverge per ogni x see la crescita asintotica
di g troppo rapida, d esempio se f g(x) ha un andamento asintotico pi lento
di 1/x.

Esercizio 6.1.13. Come per la convoluzione periodica della Denizione 6.1.2,


anche qui, esattamente per lo stesso argomento della Nota 6.1.3, la convoluzione commutativa: f g = g f . Come nellEsercizio 6.1.4, la convoluzione
associativa: (f g) h = f (g h) quando le tre funzioni appartengono a L1 (R), o pi in generale sono tali che le convoluzioni abbiano senso.
Lintegrale nella Denizione 6.1.11 convergente e f g L1 (R). Di pi, si
ha
kf gk1 6 kf k1 kgk1 .
(6.7)
Come nella Proposizione 6.1.5 (i), f g C(R) se f Lp (R) e g Lq (R) con
1 6 p, q 6 e 1/p + 1/q = 1, e kf gk 6 kf kp kgkq . Inoltre se f L1 (R)
e g Lp (R), 1 6 p < , allora f g Lp (R), e kf gkp 6 kf k1 kgkp . Inne,
se f C k e g L1 , allora f g C k e D k (f g) = D k f g.

Nota 6.1.14. La denizione di convoluzione data nellenunciato del Teorema


6.1.8 nel caso in cui h in L1 e f in L1 (R) si riduce alla Denizione 6.1.11
se si rimpiazza la funzione h L1 con e
h L1 (R) denita da e
h(x) = h(x) se
1
1
e
2 6 x 6 2 e h(x) = 0 altrimenti.

Definizione 6.1.15. Una successione di funzioni hn unidentit approssimata in L1 (R) se verica:


(i)
(ii)

hn L1 (R) e hn (x) > 0 per tutti gli n e x


Z

hn (t) dt = 1

per ogni n

6.1. CONVOLUZIONE ED IDENTIT APPROSSIMATE

599

(iii) per ogni > 0 si ha


lim

Z

hn (t) dt +


hn (t) dt = 0.

Teorema 6.1.16. (Convergenza di identit approssimate su R). I


Teoremi 6.1.8 e 6.1.10 valgono se hn unidentit approssimata in L1 (R) e
se f uniformemente continua e limitata su R, oppure, rispettivamente, se
f L1 (R). Pi precisamente
lim khn f f k = 0

se f uniformemente continua e limitata su R (in particolare, si ha anche


convergenza puntuale di hn f (x) a f (x) per ogni x: nel successivo Teorema
6.1.17 vedremo che per la convergenza puntuale sufficiente assumere che f
sia limitata e continua, non anche uniformemente continua);
lim khn f f k1 = 0

se f L1 (R).
Inoltre, per ogni p con 1 6 p < , vale lo stesso risultato: hn f Lp (R) e
lim khn f f kp = 0

per ogni f Lp (R).


Dimostrazione. La dimostrazione identica a quella data per i Teoremi
6.1.8 e 6.1.10. Lipotesi aggiuntiva che f sia limitata serve a garantire che
lintegrale
Z
hn f (x) =

hn (x y) f (t) dy

sia convergente se hn L1 (R). La condizione di uniforme continuit, pesantemente usata nella dimostrazione del Teorema 6.1.8, era garantita in
quel Teorema dalla continuit di f sullintervallo compatto dato dal periodo
(grazie al Teorema di Heine 1.8.6), ma qui deve essere assunta come ipotesi
perch la funzione non pi considerata su un compatto bens su tutto R.
Il caso 1 < p < si dimostra tramita approssimazione con funzioni continue,
come nella dimostrazione per il caso periodico (Teorema 6.1.10). Ripetiamo

600CAPITOLO 6. APPROSSIMAZIONE TRIGONOMETRICA E POLINOMIALE


qui la dimostrazione. Data f Lp (R) e > 0, per denizione di integrale
esiste un compatto K = [a, b] tale che la coda di f al di fuori di K, ossia la
funzione f f K (dove K la funzione caratteristica di K) abbia norma Lp
arbitrariamente piccola, diciamo kf f K kp < /4. Utilizziamo la densit
in Lp (K) dello spazio delle funzioni continue a supporto in K (Proposizione 1.18.6) per scegliere g continua tale che kf K gkp < /4. Osserviamo che, in base alla disuguaglianze in norma per la convoluzione (Esercizio
6.1.13) ed alla normalizzazione delle identit approssimate (propriet (ii)
della Denizione 6.1.15),
khn f hn gkp 6 khn k1 kf gkp = kf gkp < /4 .
Osserviamo che
khn g gkp 6 Ckhn g gk < /4, ,
dove la costante C, calcolata dopo la disuguaglianza (1.46), indipendente
da n, ma dipende solo dalla misura del supporto K di g: poich K ormai
ssato, ssata anche C. Ora, per il teorema di convergenza uniforme di
identit approssimate (Teorema 6.1.8), esiste n0 tale che, per ogni n > n0 , si
ha khn g gk < , e quindi, per n > n0 ,
khn g gk <

,
4C

e quindi khn g gkp 6 /4. Da queste disuguaglianze segue


khn f f kp 6 khn f hn gkp +khn g gkp +kg f K kp +kf K f kp < .

Avremo bisogno del seguente teorema di convergenza puntuale:


Teorema 6.1.17. (Convergenza puntuale di identit approssimate).
Sia hn unidentit approssimata in L1 (R) (o analogamente, sia hn unidentit
approssimata in L1 ) e sia f L (R) (quindi hn f C(R) per lEsercizio
6.1.13). Sia x un punto di continuit di f . Allora
lim hn f (x) = f (x).

6.1. CONVOLUZIONE ED IDENTIT APPROSSIMATE

601

Dimostrazione. Si usa lo stesso argomento del Teorema 6.1.8. Analogamente


alla disuguaglianza (6.2) di quel Teorema, osservando che
Z
hn (t) dt = 1

(Denizione 6.1.15(ii)), si ottiene


Z

Z
hn f (x) f (x) =
hn (t)f (x t) dt f (x)
hn (t) dt

Z
=
hn (t)(f (x t) f (x)) dt

da cui
|hn f (x) f (x)| 6

hn (t) |f (x t) f (x)| dt.

(6.8)

Fissiamo > 0. Poich f continua in x, esiste > 0 tale che |f (x t) f (x)| <
/2 se |t| < .
In corrispondenza a questo esiste un valore n0 tale che, se n > n0 ,
Z

hn (t) dt <
8kf k

e
Z

hn (t) dt <
8kf k

(Denizione 6.1.15(iii)). Poich |f (x t) f (x)| 6 2kf k per ogni x, t R


segue da (6.8) e dalla Denizione 6.1.15(ii) che, per n > n0 ,
Z Z Z 
|hn f (x) f (x)| 6
+
+
hn (x)|f (x t) f (x)| dt


Z

hn (t) dt +
2kf k +
2kf k
6
8kf k
2
8kf k
Z

6
+
hn (t) dt +
4 2
4



+ + = .
4 2 4

602CAPITOLO 6. APPROSSIMAZIONE TRIGONOMETRICA E POLINOMIALE


Esercizio 6.1.18. Sia c R e cn c. Data una identit approssimata hn in
L1 , si consideri il traslato gn = cn hn , ovvero gn (x) = hn (x cn ). Si mostri
che
(i) per ogni f Lp con 1 6 p < , gn f converge a c f in Lp ;
(ii) per ogni f C , gn f converge a c f uniformemente.

Se invece si considera una identit approssimata {hn } in L1 (R), si mostri che


(iii) per ogni f Lp( R) con 1 6 p < , gn f converge a c f in Lp( R);

(iv) per ogni f uniformemente continua e limitata su R) , gn f converge a


c f uniformemente.
Suggerimento: si verichi che hn (cn f ) = cn (hn f ) = cn (hn ) f = gn f .
Quindi, grazie allinvarianza per traslazione delle norme, senza perdita di
generalit possiamo assumere c = 0. Inoltre gn f f = cn (hn f f )+cn f
f . Il termine cn f f tende a zero nella norma di Lp ed uniformemente, grazie
ai Lemmi 5.9.4 e 5.9.6. Quindi basta considerare il termine cn (hn f f ).
Di nuovo in base alla invarianza per traslazione delle norme, la convergenza
a zero di questo termine segue dai Teoremi di convergenza 6.1.8 e6.1.10 per
le parti (i) e (ii), e dal Teorema 6.1.16 per le parti (iii) e (iv).

6.2

Sommabilit secondo Fjr ed altri nuclei


di sommabilit: approssimazione trigonometrica

Nota 6.2.1. In questa Sezione le funzioni periodiche hanno periodo 2, e


lespressione dei coecienti di Fourier ritorna ad essere quella data in (5.7):
Z
1
b
f (t) eint dt
f (n) :=
2
(si veda la Nota 6.1.1), la convoluzione diventa
Z
1
f g(x) =
f (x t) g(t) dt
2

e f[
g(n) = fb(n) b
g (n), e f eint = fb(n) eint .

6.2. NUCLEO DI FJR ED ALTRI NUCLEI DI SOMMABILIT

603

Adottiamo ora un approccio diverso da quello della Sezione 6.1 al problema dellapprossimazione uniforme di funzioni continue mediante polinomi trigonometrici. Abbiamo visto che possiamo approssimare f C con
hn f dove {hn } unidentit approssimata. Ma per il calcolo numerico
importante decidere come scegliere lidentit approssimata. Il metodo che
proponiamo in questa Sezione quello di sceglierla specicando i coecienti
di Fourier. Dalla Proposizione 6.1.6 sappiamo che lazione di hn tramite convoluzione
manda
f nella funzione continua e periodica i cui coecienti sono
n
o
c
b
hn (k)f (k) . In altre parole, se consideriamo le funzioni come determinate dalla successione dei loro coecienti di Fourier, le identit approssimate
agiscono su questa successione come moltiplicatori: al variarendi n, esse moltio
cn (k), k Z .
plicano volta per volta questa successione per la successione h
Quale allora lidentit approssimata pi comoda per il calcolo numerico?
C una speranza ovvia: quella di prendere

1 se
|k| 6 n
c
hn (k) =
0 se
|k| > n

Questa scelta ha il vantaggio inestimabile che i coecienti di Fourier hd


n+1 (k)
c
coincidono con quelli di hn (k) per |k| 6 n: perci, quando si calcola il valore
del polinomio trigonometrico hn f , il calcolo progressivo allaumentare di n
richiede che se ne calcolino i coecienti di Fourier solo allultima frequenza
n: gli altri sono stati gi calcolati al passo precedente. Purtroppo, per,
con questa scelta di hn non si ottiene unidentit approssimata: infatti si ha
hn f = Sn [f ] la somma parziale di ordine n della serie di Fourier, e abbiamo
accennato in Sezione 5.5 che esistono funzioni continue e periodiche la cui
serie di Fourier non converge puntualmente (diverge in un punto, o anche su
una successione di punti in [, ], o persino su tutto un insieme di misura
zero). In eetti, si osservi anche che le funzioni hn cos costruite sono
hn (x) = 1 +

n
X
k=1


eikx + eikx = 2Dn (x)

dove Dn sono le somme di Dirichlet denite e studiate in Sezione 5.8, e Dn non


verica le tre propriet della Denizione 6.1.7. Soprattutto si pu dimostrare
che khn k1 per n .
cn sia una successione a
Dobbiamo quindi rinunciare alla speranza che h
d
supporto in [n, n] che coincide con hn+1 in [n 1, n + 1].

604CAPITOLO 6. APPROSSIMAZIONE TRIGONOMETRICA E POLINOMIALE

Figura 6.1: I coefficienti di Fourier del nucleo di Dirichlet

6.2.1

Nucleo di Fjr

Una scelta leggermente diversa data dai polinomi trigonometrici Kn (x) tali
cn (0) = 1, landamento di K
cn (m) sia lineare tra 0 e n e tra 0 e n e
che K
cn (m) = 0 per |m| > n. Ovvero,
K
Kn (x) =

n 
X

j=n

|j|
1
n+1

eijt .

(6.9)

Figura 6.2: I coefficienti di Fourier del nucleo di Fjr


Questo equivale ovviamente a scegliere
Definizione 6.2.2. (Nucleo di Fjr.) Poniamo
Kn f =

S0 + + Sn
n+1

dove Sn = Sn [f ] la somma parziale n-esima della serie di Fourier.


Quindi lazione del convolutore di passo n quella di calcolare la media
aritmetica delle prime n somme di Fourier. Il nucleo di convoluzione Kn si
chiama nucleo di Fjr. Scriviamo n [f ] = Kn f .

6.2. NUCLEO DI FJR ED ALTRI NUCLEI DI SOMMABILIT

605

Teorema 6.2.3. Il nucleo di Fjr unidentit approssimata.


Dimostrazione. Segue da (5.10) e dalla normalizzazione nella Denizione
6.1.2 di convoluzione che
!
Z
n
n
1 X
1 1 X
n [f ](x) =
Sk f (x) =
Dk (t x) f (t) dt .
n + 1 k=0
n + 1 k=0
(6.10)
Osserviamo che n pari perch Dn lo .
Ora dalla Proposizione 5.8.2 segue che, per ogni u 6= 2m, m Z,
 

n
1 X
1
u .
Dk (u) =
sin
k+
2 sin u2 k=0
2
k=0

n
X

(6.11)

Daltra parte, se u 6= 2m,



n
X
1
1
sin k +
u = Im
ei(k+ 2 )u
2
k=0
k=0

n
X

= Im
= Im

ei 2 ei(n+ 2 )u
1 eiu
1 ei(n+1)u
u
u
ei 2 ei 2

= Im

1 ei(n+1)u
2i sin u2

Re(1 ei(n+1)u )
2 sin u2

1 cos ((n + 1)u)


2 sin u2

(6.12)

perch Im(iz) = Re z per ogni z C (si confronti questo punto con la


dimostrazione della Proposizione 5.8.2). Se u = 2m allora


1
u = 0.
sin k +
2
k=0

n
X

606CAPITOLO 6. APPROSSIMAZIONE TRIGONOMETRICA E POLINOMIALE


Per ogni R vale lidentit trigonometrica 1 cos = 2 sin2 2 , che,
applicata allultimo membro di (6.12), ci d:


n
X
sin2 ( n+1
u)
1
2
,
u=
sin k +
u
2
sin 2
k=0
e quindi, da (6.11),

n
X

sin2 ( n+1
u)
2
Dk (u) =
.
2 u
2 sin 2
k=0

(6.13)

Perci segue da (6.11) e dalla normalizzazione nella Denizione 6.1.2 di


convoluzione che

con

(6.14)

n [f ](x) = Kn f (x)
1 1
Kn (x) =
n + 1 2

x)
sin( n+1
2
x
sin 2

2

(6.15)

Di conseguenza vale la propriet (i) della Denizione 6.1.7:


Kn (x) > 0

(6.16)

per ogni x.
Inoltre, da (6.10) e dalla normalizzazione nella Denizione 6.1.2,

n
1
1 X
Kn (x) =
Dm
(n + 1) 2 m=0

1
2

Dm (t) dt = 1

per m > 0. Quindi vale la propriet (ii) della Denizione 6.1.7 :


Z
1
Km (t) dt = 1.
2
Questa propriet segue anche da (6.9) visto che, per m = 1, . . . , n,
Z
cos mt dt = 0

(6.17)

6.2. NUCLEO DI FJR ED ALTRI NUCLEI DI SOMMABILIT

607

in virt dellortogonalit del sistema trigonometrico (cos mt 1).


Inne, mostriamo che vale la propriet (iii) della Denizione 6.1.7 : per
ogni che verica 0 < < segue da (6.15) che, per n ,
Z
Z
1
1

Kn (t) dt 6
dt =
0.
2

2(n + 1) sin 2
2(n + 1) sin2 2

Poich Kn pari,

Kn (t) dt =

Kn (t) dt

e la propriet (iii) provata. Quindi {Kn } unidentit approssimata.

Nota 6.2.4. Ora il Teorema 6.1.8 assicura la convergenza uniforme di n [f ] a


f per ogni f continua. Inoltre, se f L1 , si ha un interessante risultato anche
sulla convergenza puntuale, presentato nel prossimo teorema, che estende il
teorema di convergenza puntuale di identit approssimate (Teorema 6.1.17).
Queste propriet si chiamano sommabilit secondo Fjr.

Teorema 6.2.5. (Fjr.) Siano f L1 e t0 un punto tale che il limite


puntuale f(t0 ) := limh0 f (t0 + h) + f (t0 h) esista (finito oppure infinito).
Allora le somme di Fjr convergono puntualmente nel punto t0 alla media
aritmetica dei limiti destro e sinistro di f (anche quando le somme di Fourier
non convergono!). Pi precisamente, per ogni t0 per cui esiste il limite
lim (f (t0 + h) + f (t0 h))

h0

si ha
lim n [f ](t0 ) =

1
lim (f (t0 + h) + f (t0 h)) .
2 h0

Nota 6.2.6. facile vericare che f = f ad ogni punto di Lebesgue di f


(Denizione 1.9.34), quindi quasi ovunque, in base al Teorema 1.9.37. In
particolare, vale questa identit che useremo in seguito:
kfkL1 = kf kL1 .

(6.18)

608CAPITOLO 6. APPROSSIMAZIONE TRIGONOMETRICA E POLINOMIALE


Dimostrazione del Teorema 6.2.5. Facciamo uso delle seguenti due propriet
ovvie del nucleo di Fjr:
(i) Kn pari (segue direttamente dalla sua denizione (6.9);
(ii) per ogni , con 0 < < , Kn converge a zero uniformemente nellintervallo [, ] (ed ovviamente anche in [, ], per (i)).
Assumiamo che f sia nito: laltro caso si dimostra in maniera del tutto
analoga. Si ha
Z


1

n [f ](t0 ) f =
Kn (t) f (t0 t) f(t0 ) dt
(6.19)
2
Z Z Z 


1

+
+
Kn (t) f (t0 t) f (t0 ) dt
=
2

Z Z 


f (t0 + t) + f (t0 t)
1

+
Kn (t)
f (t0 ) dt ,
=

2
0

dove la prima identit segue dalla propriet (ii) della Denizione 6.1.7, e lultima dalla parit di Kn (propriet (i)
 che, nellultimo
 qui sopra). Osserviamo
f (t0 +t)+f (t0 t)

f (t0 ) , che appartiene a


integrale, compare la funzione t 7
2
L1 (la sua norma L1 si maggiora con kf kL1 + kf(t0 )kL1 = 2kf kL1 ).
Poich limh0 f (t0 + h + f (t0 ) h = f(t0 ) nito, per ogni > 0 possiamo
scegliere in modo tale che, per 0 6 t < , si abbia


f (t0 + t) + f (t0 t)


< .

f
(t
)
0


2

Fissato questo valore di , grazie alla propriet (ii) pi sopra (convergenza


uniforme a zero di Kn ), esiste n0 tale che, per n > n0 , si ha sup<t< Kn (t) <
. Applicando queste disuguaglianze in (6.19) otteniamo che, per n > n0 ,



n [f ](t0 ) f (t0 ) < 1 + kf f (t0 )kL1 .

Teorema 6.2.7. (Teorema di Lebesgue sulla convergenza puntuale


delle somme di Fjr.) Sia f L1 [0, 2].

6.2. NUCLEO DI FJR ED ALTRI NUCLEI DI SOMMABILIT

609

(i) La conclusione del Teorema di Fjr 6.2.5 vale per qualsiasi identit
approssimata Fn pari e tale che, per ogni , con 0 < < , Fn converge
a zero uniformemente nellintervallo [, ].
(ii) Pi in generale, nel caso del il nucleo di Fjr, la conclusione del Teorema 6.2.5 vale anche se lipotesi che esista il limite puntuale f(t0 ) :=
limh0 f (t0 + h) + f (t0) h) viene rimpiazzata da unipotesi pi debole,
data dalla seguente stima della media integrale della variazione di f :
supponiamo che esista un numero f(t0 ) tale che

Z

1 h f (t0 + t) + f (t0 t)

dt = 0 .
lim

f
(t
)
(6.20)
0

h0 h 0
2

(t0 t)
in
In particolare, le somme di Fjr convergono a limt0 f (t0 +t)+f
2
ogni punto t0 dove il limite esiste. (Questo conferma il Teorema di Fjr 6.2.5, ed anche il fatto che le somme di Fjr convergono a f (t0 ) ad
ogni punto di Lebesgue di f , - e quindi quasi ovunque - come sappiamo
dal Teorema 6.1.17.)

Dimostrazione. La parte (i) provata nella dimostrazione del precedente


Teorema di Fjr 6.2.5.
Per la parte (ii), rammentiamo lidentit (6.15),
1
Kn (x) =
(n + 1)

x)
sin( n+1
2
x
sin 2

2

dalla quale segue


Kn (t) 6 n + 1

(6.21)

e, per 0 < t < /2,


Kn (t) 6

2
(n + 1)t2

(6.22)

perch sin 2t > t nellintervallo (0, ), dal momento che la funzione seno in
questo intervallo concava e la retta y = t/ la corda sottesa dai punti
iniziale e nale del graco.
Ora ripartiamo dallidentit (6.19),
1
n [f ](t0 ) f(t0 ) =

Z

Z 

Kn (t)

f (t0 + t) + f (t0 t)
f(t0 )
2

dt ,

610CAPITOLO 6. APPROSSIMAZIONE TRIGONOMETRICA E POLINOMIALE


Ora, al secondo membro, lasciamo variare con n e scriviamo n invece di
. Dalla disuguaglianza (6.22) segue che il secondo integrale nel membro di
destra tende a zero se (n + 1)n2 , ossia se
1
= o(n ) ,
n
perch
Z
n

Kn (t)

f (t0 + t) + f (t0 t)
f(t0 )
2

(6.23)

dt 6

3
kf kL1 [,] .
(n + 1)n2

Dobbiamo quindi mostrare che




Z n
f (t0 + t) + f (t0 t)
Kn (t)
lim
f(t0 ) dt = 0 .
n 0
2
Introduciamo la primitiva

Z h

f (t0 + t) + f (t0 t)
(t0 ) dt .

f
G(h) =


2
0

(6.24)

(6.25)

Osservando che n denitivamente minore di 1/n a causa di (6.23), spezziamo il dominio di integrazione in (6.24)


Z n
f (t0 + t) + f (t0 t)
f(t0 ) dt =
Kn (t)
2
0


Z 1
n
f (t0 + t) + f (t0 t)

f (t0 ) dt
Kn (t)
2
0


Z n
f (t0 + t) + f (t0 t)

+
f (t0 ) dt .
Kn (t)
1
2
n
Stimando il primo integrale grazie a (6.21)
Z 1

 

n
f
(t
+
t)
+
f
(t

t)
1


0
0
Kn (t)
,
f(t0 ) dt 6 (n + 1) G

0

2
n

vediamo che esso tende a zero con n a causa dellipotesi (6.20).


Stimiamo il secondo integrale usando la disuguaglianza (6.22) ed integriamo

6.2. NUCLEO DI FJR ED ALTRI NUCLEI DI SOMMABILIT

611

per parti:
Z


n
f (t0 + t) + f (t0 t)


Kn (t)
f(t0 ) dt


1
2
n

2
6
n+1

1
n


Z n
2 G(t) n
2 2
G(t)
G(t)
dt =
dt . (6.26)
+

2
2
t
n+1 t
n + 1 n1
t3
1
n

Per mostrare che lultimo membro tende a zero, ssiamo arbitrariamente


> 0 e notiamo che per lipotesi (6.20) esiste un opportuno intero n tale
che, per n > n (e quindi al tendere di n a 0), si ha G(t)/t < per 0 < t < n .
Pertanto

G(t) n
< n ,
t2 1
n
e
Z n
n
G(t)
dt = 2 1 < n .
1
t3
t n
n

Pertanto lultimo membro della disuguaglianza (6.26) limitato da 3. Poich


arbitrario, il limite vale 0, come asserito nellenunciato.

Nelle approssimazioni numeriche si usano anche altri nuclei di sommabilit, oltre al nucleo di Fjr calcolato nella dimostrazione del Teorema 6.2.3.
Ne studiamo due nella prossima Sezione.

6.2.2

Nucleo di Poisson

Introduciamo un altro esempio importante di nucleo di sommmabilit per le


serie di Fourier:
Definizione 6.2.8. (Integrale di Poisson.) Per 0 < r < 1, il nucleo di
sommabilit {r |n| } si chiama il nucleo di Abel (o anche di Poisson).
In particolare, esso opera sulle funzioni f L1 (T) nel modo seguente. Per
T T indichiamo con Pr (nucleo di Poisson) la funzione con coecienti di
Fourier c
Pr (n) = r |n| : essa in L1 (T), perch la sua serie di Fourier converge
uniformemente, essendo maggiorata da una serie geometrica (esercizio!), e
lazione del nucleo la seguente trasformata di Poisson (o anche integrale di
Poisson):

X
X
int
b
f (n)e 7
r |n| fb(n)eint .
(6.27)
n=

n=

612CAPITOLO 6. APPROSSIMAZIONE TRIGONOMETRICA E POLINOMIALE


Pi esplicitamente, scriviamo
f (r, t) fr (t) f (reit ) := Pr f (t) .
Allora, grazie alla moltiplicativit per convoluzione dei coecienti di Fourier
(Proposizione 6.1.6), la precedente trasformata diventa
f (t) 7 f (reit ) = Pr f (t)

ovvero f 7 Pr f .

(6.28)

ed in base a (6.27) sappiamo che, per ogni n,


cr (n) = |r|n .
P

(6.29)

Nota 6.2.9. Ponendo f0 (eit ) := f (r0 eit ) si ha

Pr f0 (t) = f0 (reit ) = f (r0 reit ) = Pr0 r f (t) ,


ossia lintegrale di Poisson commuta con le dilatazioni.

Esercizio 6.2.10. Si mostri che il nucleo di Poisson P (r, t) P (reit) := Pr (t)


verica
1 r2
= Re C(z) .
(6.30)
P (r, t) =
1 2r cos t + r 2
dove
1 + reit
C(z) = C(reit ) :=
.
1 reit
Si verichi che C una funzione olomorfa se r < 1. In particolare, il nucleo
di Poisson la parte reale di una funzione olomorfa, e quindi una funzione

armonica (si veda la Denizione 2.2.2).


Nota 6.2.11. Dal precedente Esercizio 6.2.10 vediamo che il nucleo di Poisson
una identit approssimata. Infatti vediamo da (6.30) che Pr una funzione
pari, decrescente fra 0 e , e quindi che, per ogni 0 < < t 6 ,
Pr (t) < Pr () =

1 r2
0 .
1 2r cos + r 2 r1

Pertanto Pr converge uniformemente a zero nellintervallo [, ]. Inne, veR


1
cr (0) = 1 a causa
P (t) dt = P
diamo che Pr > 0, e, dal momento che 2
r
della denizione (6.27), abbiamo vericato tutte le propriet della Denizione
6.1.7 di identit approssimata in L1 .

6.2. NUCLEO DI FJR ED ALTRI NUCLEI DI SOMMABILIT

613

Come conseguenza immediata del fatto che il nucleo di Poisson una


identit approssimata e della parte (i) del Teorema 6.2.7, abbiamo immediatamente il fatto seguente:
Corollario 6.2.12. Lintegrale di Poisson Pr f (t0 ) converge a f(t0 ) in ogni
punto t0 in cui esiste il limite
f (t0 + t) + f (t0 t)
,
f(t0 ) = lim
t0
2
e quindi converge a f (t0 ) per ogni punto di Lebesgue di f , in particolare quasi
ovunque (in base al Teorema 1.9.37).
Per, a dierenza del caso del nucleo di Fjr considerato nella parte (ii)
del Teorema 6.2.7, ora sappiamo (dalla Nota 6.2.11) che il nucleo di Poisson
decrescente fra 0 e . Questo ci permette di provare, per lintegrale di Poisson,
un risultato equivalente alla parte (ii) di quel teorema sotto unipotesi meno
stringente sulle medie integrali della variazione locale di f :
Teorema 6.2.13. (Fatou.) Sia f L1 [0, 2]. Nel caso del nucleo di
Poisson, la convergenza puntuale di Pr f rispetta la conclusione del Teorema
6.2.5 anche sotto lipotesi (pi debole di (6.20)) che esista un numero f(t0 )
tale che

Z 
1 h f (t0 + t) + f (t0 t)

f (t0 ) dt = 0 .
(6.31)
lim
h0 h 0
2

In particolare,

f (t0 + t) + f (t0 t)
lim+ Pr f (t0 ) = f(t0 ) = lim
t0
r1
2
in ogni punto t0 dove il limite esiste. (Questo conferma la parte (i) del
Teorema di Lebesgue 6.2.7, ed in particolare il fatto che lintegrale di Poisson
converge a f (t0 ) ad ogni punto di Lebesgue di f - e quindi quasi ovunque come sappiamo dal Teorema 6.1.17.)
Dimostrazione. Anche per questa estensione del Teorema di convergenza
puntuale ripartiamo dallidentit (6.19), che adesso diventa
1
Pr f (t0 ) f(t0 ) =

Z

Z 

Pr (t)

f (t0 + t) + f (t0 t)
f(t0 )
2

dt .

614CAPITOLO 6. APPROSSIMAZIONE TRIGONOMETRICA E POLINOMIALE


Scriviamo

f (t0 + t) + f (t0 t)
f(t0 )
2
e notiamo, come nella dimostrazione del Teorema 6.2.7, che kukL1 6 2kf kL1 .
Lenunciato equivale ad asserire che
Z Z 
+
0.
(6.32)
Pr (t)u(t) dt

u(t) ut0 (t) :=

r1

Facciamo variare con r, scriviamo = r , e scegliamo


r = 1 r (1 r)2 = r r 2 .

(6.33)

Si noti che r < 1 r, e r /(1 r) = r


Osserviamo da (6.30) che Pr (0) = (1 + r)/(1 r), e per la decrescenza
(osservata nellEsercizio 6.2.10) abbiamo Pr (t) 6 Pr (0). Quindi, da (6.33),

Z r
1+r

6

P
(t)
u(t)
dt
0
r
1 r r

r1
0

Ora consideriamo lintegrale sullintervallo [1r, ]. Questa volta, rispetto alla dimostrazione del Teorema 6.2.7, consideriamo una primitiva diversa
da quella in (6.25), la primitiva della stessa funzione ma senza valore assoluto:

Z h
f (t0 + t) + f (t0 t)
H(h) =
f(t0 ) dt .
2
0
Integriamo quindi per parti:
Z
Z
Pr (t) u(t) dt = Pr () H() Pr (1 r)H(1 r)
1r

1r

Pr (t) u(t) dt .

(6.34)
Usiamo lidentit(6.30) per stimare Pr () e Pr (1 r). Nel primo caso si ha
Pr () =

1 r2
1r
=
= O(1 r) ,
2
1 + 2r + r
1+r

e quindi il termine Pr () H() tende a zero per r 1 . Invece, nel secondo


caso,


1 r2
1+r
1
Pr (1 r) 6 Pr (0)
,
=
=O
1 2r + r 2
1r
1r

6.2. NUCLEO DI FJR ED ALTRI NUCLEI DI SOMMABILIT

615

e quindi limr1 Pr (1 r) H(1 r) = 0 perch, in base allipotesi (6.31),


sappiamo che H(1 r) = o(1 r) per r 1 . Rimane quindi da stimare
lintegrale al secondo membro di (6.34), per il quale osserviamo che
Z


1r

Pr (t)


Z


u(t) dt 6 2kf kL1

1r

|Pr (t)| .

Usiamo di nuovo il fatto che Pr decrescente in [0, ], per cui |Pr (t)| = Pr (t)
per i valori di t in questo intervallo. Daltra parte,
Pr (t)

1 r2
=
2r sin t .
1 2r cos t + r 2

Quindi ci che resta da provare che


1 r2
lim
r1 (1 + r 2 )2

1r

2r sin t
dt = 0 .
2r
2
(1 1+r
2 cos t)

(6.35)

Applichiamo la trasformazione di coordinate u(t) := 2r cos t/(1 + r 2 ), ed


osserviamo che gli estremi di integrazione diventano:
u u (r) = u(1 r) =
u+ u+ (r) = u() =
anche chiaro che
C > 0,
1 r2
(1 + r 2 )2

1r

2r
2r
cos(1 r) =
+ O((1 r)2 ))
2
1+r
1 + r2

2r
.
1 + r2

1r 2
(1+r 2 )2

= O(1r). Da queste stime segue che, per qualche

1 r2
2r sin t
dt
=
2r
2
1 + r2
(1 1+r
2 cos t)

u+ (r)

du
2
u (r) (1 u)
u (r)
1 +
= O(1 r) .
6 C (1 r)
1 u u (r)

Questo prova (6.35), e quindi il teorema.

616CAPITOLO 6. APPROSSIMAZIONE TRIGONOMETRICA E POLINOMIALE

6.2.3

Nucleo di de la Valle-Poussin

Un nucleo usato frequentemente il nucleo di de la Valle-Poussin {vn }


denito da

se |k| 6 n
1
2n+1k
se n < |k| 6 2n
vc
2n (k) =
2n+1

0
se |k| > 2n

Figura 6.3: I coefficienti di Fourier del nucleo di de la Valle-Poussin

Questo nucleo ha un vantaggio rispetto al nucleo di Fjr: allaumentare


di n il coeciente di Fourier k-esimo di v2n vale 1 quando n diventa maggiore
di |k|: pertanto i coecienti nuovi da calcolare per determinare lazione di v2n
non sono 4n+1 ma solo 2n, poich i 2n+1 coecienti vc
2n (k) per n 6 k 6 n
valgono 1 e non devono quindi essere calcolati.
Per i dettagli che provano che {vn } unidentit approssimata si veda
[14, Cap.1, Sezione 2.13]
Nota 6.2.14. Il Teorema 6.2.3 mostra che i polinomi trigonometrici sono uniformemente densi in C . In tal modo abbiamo dimostrato il teorema di
Weierstrass sulla completezza del sistema trigonometrico (Teorema 5.13.3)
senza utilizzare il laborioso macchinario del teorema di Dirichlet (Teorema
5.12.1).

Nota 6.2.15. Il Teorema 6.2.3 d luogo a una dimostrazione alternativa, molto pi semplice, del lemma di RiemannLebesgue (Lemma 5.9.6).
In realt questa dimostrazione semplice segue dal Teorema di Completezza di
Weierstrass (Teorema 5.13.3), ma non labbiamo data prima perch il Lemma 5.9.6 stato usato per provare questo Teorema (infatti labbiamo usato
nella dimostrazione del Teorema 5.9.2 che un passo cruciale per provare il
Teorema 5.12.1 di Dirichlet, dal quale abbiamo dedotto il Teorema 5.13.3).
Ma ora la Nota 6.2.14 ci d una dimostrazione alternativa del teorema di

6.3.

APPROSSIMAZIONE CON POLINOMI

617

Weierstrass 5.13.3, e quindi non si commette pi un giro vizioso nellusare


questo Teorema per provare in maniera pi semplice il Lemma 5.9.6

Ecco la dimostrazione.
Dimostrazione alternativa del Lemma 5.9.6. Siano f L1 , > 0 e sia q
un polinomio trigonometrico tale che kf qk < . Un tale q esiste per il
Teorema di Completezza 5.13.3 e per il suo Corollario 5.1.10(ii). Sia n0 il
grado di q. Se |n| > n0 ,




b b


q(n) 6 kf qk1 < .
f (n) = f (n) qb(n) = f[
Quindi

lim fb(n) = 0.

|n|

6.3

Teorema di approssimazione polinomiale


di Weierstrass

In questa Sezione consideriamo lapprossimazione di funzioni con polinomi e


dimostriamo un risultato analogo al Teorema di Weierstrass sulla completezza
del sistema trigonometrico in C (Teorema 5.13.3 e Nota 6.2.14); anche questo
risultato di approssimazione polinomiale dovuto a Weierstrass.
Teorema 6.3.1. Siano a, b numeri reali e consideriamo gli spazi completi
C [a, b] (munito della norma uniforme) e Lp [a, b], 1 6 p < (munito della
norma Lp ). I polinomi sono densi in tutti questi spazi. In altre parole, se
> 0 e f C [a, b], esiste un polinomio p tale che kf pk < , e lo stesso
enunciato vale per la norma k kp se f Lp [a, b].
Lemma 6.3.2. Se il Teorema 6.3.1 vale per C [a, b] esso si estende automaticamente a Lp [a, b], 1 6 p < .
Dimostrazione. Se f C [a, b] si ha
kf kLp [a,b] =

Z

 1p
1
|f (x)| dx
6 (b a) p kf k .
p

618CAPITOLO 6. APPROSSIMAZIONE TRIGONOMETRICA E POLINOMIALE


Inoltre C [a, b] denso in Lp [a, b] (si veda la dimostrazione del Corollario
5.13.8) e quindi per ogni > 0, per ogni f Lp [a, b], esiste g C [a, b] tale
che

kf gkp < .
2
Ma se vale il Teorema 6.3.1 abbiamo che, per ogni g C [a, b], esiste un
polinomio q tale che

kg qk <
1
2(b a) p
Ne segue che
kf qkp 6 kf gkp + kg qkp
1

6 kf gkp + (b a) p kg qk

<
+ =
2 2

e quindi il teorema vale anche per Lp [a, b].

Lemma 6.3.3. Se il Teorema 6.3.1 vale per C [0, ], allora vale per C [a, b]
per ogni a < b.
Dimostrazione. Le dilatazioni, f (x) 7 f (x), sono mappe invettive e suggestive da C[0, ) a C[0, ) e sono isometrie nella norma uniforme. Perci,
se il Teorema 6.3.1 vale per C [0, ], esso vale anche per C [0, ], Prendendo = (b a)/ vediamo che il Teorema vale per C[0, b a). Ma anche
le traslazioni sono isometrie suggestive degli spazi delle funzioni continue
nei rispettivi intervalli, e quindi il Teorema vale anche per C[a, b). Questo
conclude la dimostrazione.

Esercizio 6.3.4. Si dia una variante diretta della precedente dimostrazione, che non usi le propriet astratte delle dilatazioni e delle traslazioni, ma
costruisca le dilatazioni e traslazioni eettivamente usate.
Svolgimento. Esiste una funzione lineare h (anzi, nel senso dellalgebra lineare, dovremmo dire affine; un polinomio di grado 1) che manda [0, ] su
[a, b] in maniera biunivoca: la si ottiene esplicitamente richiedendo che h sia
lineare (cio h(t) = mt + q per opportune costanti m, q) ed imponendo le
condizioni h(0) = a e h() = b. Il risultato
h(t) = a +

ba
t.

6.3.

APPROSSIMAZIONE CON POLINOMI

619

Linversa h1 = g che manda [a, b] su [0, ]


g(x) =

(x a).
ba

Sia f C [a, b] e consideriamo la funzione composta u = f h, cio




ba
t .
u(x) = f (h(x)) = f a +

Si osservi che u appartiene a C [0, ] perch f e h sono continue, h : [0, ]


[a, b] e f denita su [a, b].
Supponiamo che il Teorema 6.3.1 valga per C [0, ]. Allora per ogni > 0
esiste un polinomio s tale che per ogni t [0, ]
|u(t) s(t)| < .
Consideriamo la funzione composta p = s g. Poich s e g sono polinomi lo
anche s g. Inoltre per ogni x [a, b] si ha x = h(t) per qualche t [0, ]
e quindi
|f (x) p(x)| = |f (h(t)) p(h(t))|
= |u(t) s g h(t)|
= |u(t) s(t)| < .
Perci f approssimabile in [a, b] con il polinomio p a meno di .

Dimostrazione del Teorema 6.3.1. Grazie ai Lemmi 6.3.2 e 6.3.3 suciente


dimostrare il teorema per f C [0, ]. Prolunghiamo f a una funzione
continua pari su [, ]: f (x) = f (x). Ora prolunghiamo questa f da
[, ] a tutto R per periodicit di periodo 2: f (x + 2) = f (x), per ogni
x R. Quindi ora f C . Ma allora per il Teorema 5.13.3 esiste un
polinomio trigonometrico u tale che
kf uk <

.
2

Questa funzione u del tipo


u(x) =

N
X

k=N

ck eikx .

620CAPITOLO 6. APPROSSIMAZIONE TRIGONOMETRICA E POLINOMIALE


Perci le sue parti reale e immaginaria sono combinazioni lineari nite delle
funzioni cos kx e sin kx per 0 6 k 6 N. Ma queste funzioni sono tutte
approssimabili con polinomi uniformemente in [0, ] a meno di una precisione
arbitraria, in base al Teorema di Taylor (Sezione 1.1).
Perci esistono polinomi p1 e p2 tali che
|Re u(x) p1 (x)| <

|Im u(x) p2 (x)| <

x [0, ] .

Quindi per tutti questi valori di x


|u(x) (p1 (x) + ip2 (x))| <


+ = .
4 4
2

Ma allora
|f (x) (p1 (x) + ip2 (x))| 6 kf ukC[0,] + ku (p1 + ip2 kC[0,] <


+ = .
2 2

Ora la funzione p = p1 + ip2 la somma a coecienti complessi di due


polinomi a valori reali (i polinomi p1 e p2 sono rispettivamente la sua parte
reale e immaginaria) e quindi un polinomio (a valori complessi) e si ha
|f (x) p(x)| <

per ogni

x [0, ] .

Capitolo 7
Complementi sulla convergenza

di serie di Fourier
Le idee presentate in questo Capitolo, nonch molti dei suoi enunciati e dimostrazioni, sono tratte da [14, Chapters I, II, III]. Alcuni punti sono ispirati anche da He83 o StW71; una presentazione pi completa di vari passi
essenziali in [39, Chapter II, Sections 10, 11, 12].

7.1

Premessa notazionale

In conformit alla tradizione vigente nella letteratura specialistica, in questo


Capitolo ritorniamo a considerare funzioni periodiche di periodo 2, e lespressione dei coecienti di Fourier ritorna ad essere quella data in (5.7) (si
veda la Nota 6.2.1). In particolare,
Z
1
fb(n) :=
f (t) eint dt
2
(si veda la Nota 6.1.1), il prodotto scalare in L2 [, ]
Z
1
(f, g) =
f (t) g(t) dt ,
2

la convoluzione diventa
1
f g(x) =
2

621

f (x t) g(t) dt

622

CAPITOLO 7.

COMPLEMENTI SULLE SERIE DI FOURIER

e si ha f[
g(n) = fb(n) b
g (n), e f eint = fb(n) eint .
Avendo ssato il periodo a 2, indicheremo interscambiabilmente gli spazi
delle funzioni periodiche e Lp sul periodo con il simbolo Lp o Lp (T). In
alcune dimostrazioni che fanno uso dellanalisi complessa, T sar identicato
come la frontiera della palla unitaria nel piano complesso.

7.2

Dimostrazioni semplici della convergenza di


serie di Fourier

Nella Sezione 5.12 abbiamo provato il seguente teorema di convergenza uniforme per le serie di Fourier:
Teorema 1. (Dirichlet.) Sia f L1 (cio periodica di periodo, diciamo
2 e integrabile sul periodo) e supponiamo che nellintervallo [a, b] f soddisfi
la condizione di Hlder di ordine > 0. Allora per ogni > 0 la serie di
Fourier di f converge a f uniformemente nellintervallo [a + , b ].
Non abbiamo dimostrato un teorema separato per la convergenza puntuale, perch per questo scopo non bastano le ipotesi naturali. Lipotesi naturale
anch la serie di Fourier di una funzione f L1 (T) converga al punto x
al valore f (x) richiede che questo valore esista, tipicamente quindi che f sia
continua al punto x. Ma abbiamo gi annunciato nella Sezione 5.5 (e lo dimostreremo in questo Capitolo nella Sezione 7.9) che la serie di Fourier di
una funzione continua pu divergere in un punto (e persino quasi ovunque).
Le ipotesi meno restrittive per la convergenza della serie di Fourier di f in
un punto x hanno a che fare con la derivabilit di f in x, ed abbiamo concentrato lattenzione su una situazione un po pi generale, ossia che f sia
lipschitziana in un intorno di x, o ancora pi generale, che sia hlderiana
(Sezione 5.11). Ma sotto queste condizioni la convergenza anche uniforme,
e quindi abbiamo provato un teorema unico per convergenza puntuale ed uniforme, salvo poi estendere il risultato di convergenza puntuale al caso in cui
f non hlderiana perch ha un punto di salto, allavvicinarsi al quale, per,
la derivata ha limiti destro e sinistro niti (Teorema 5.15.1). Il teorema unico
quello appena enunciato, il quale richiede stime faticose sulla convergenza
dellintegrale di Dirichlet (per un sommario si veda la Sezione 7.5).
Nonostante ci, una dimostrazione assai pi semplice, nelle ipotesi di Hlder
del Teorema 5.12.1, permette di dimostrare almeno la convergenza puntuale:

7.2. SERIE DI FOURIER: UN APPROCCIO FACILE

623

anzi, in realt lipotesi di Hlder occorre solo in media integrale, e quindi


lenunciato che stiamo per provare pi generale del Teorema 5.12.1 limitatamente alla convergenza puntuale. Questo argomento prescinde completamente dalle stime per lintegrale di Dirichlet, e quindi non pu provare la
convergenza uniforme in un intervallo in cui la funzione f sia limitata (ossia
leetto del principio di localizzazione: Nota 5.9.10), ma solo globalmente
ovunque, sotto ipotesi assai pi forti (si veda il Teorema 7.2.3 pi sotto). Lo
esponiamo nel prossimo teorema, dovuto a Cherno [8] (la dimostrazione che
diamo qui una lieve generalizzazione di [8]).
Teorema 7.2.1. (Convergenza puntuale di serie di Fourier - dimostrazione di Chernoff.) Sia f L1 (cio periodica di periodo, diciamo 2
e integrabile sul periodo), fissiamo un punto x [0, 2) in cui f sia continua
e supponiamo che per y [0, 2], la funzione
g(y) = gx (y) :=

f (x) f (y)
xy

se

y 6= x

(7.1)

sia in L1 [0, 2]. Allora la serie di Fourier di f converge a f (x) al punto x.


Corollario 7.2.2. Sia x [0, 2) un punto fissato. Supponiamo che f
L1 (T) soddisfi la seguente condizione di tipo Hlder di ordine > 0 al punto
x: per ogni y [0, 2),
|f (x) f (y)| < M|x y| .

(7.2)

Allora la serie di Fourier di f converge al punto x al valore f (x). Notiamo


che, nel caso particolare = 1, la condizione 7.2 una condizione di tipo
Lipschitz (si confronti con la Definizione 5.11.1). Osserviamo che, se f
ovunque limitata e derivabile al punto x, allora questa condizione di tipo
Lipschitz soddisfatta al punto x, e quindi la serie di Fourier di f al punto
x converge a f (x).
Dimostrazione del Corollario. Come al solito, possiamo restringere lattenzione ai valori 0 < 6 1, perch per > 1 la condizione (7.2) obbliga f ad
essere costante, ed in questo caso il risultato ovvio. Anzitutto, notiamo,
grazie al teorema del confronto per i limiti di funzioni (Sezione 1.1), che (7.2)
implica che f continua al punto x. Inoltre, sempre per (7.2), la funzione
gx (y) del Teorema 7.2.1 maggiorata in modulo da |x y|1 , e, siccome
lesponente 1 maggiore di 1, per i ben noti risultati sugli integrali
impropri (Sezione 1.1) la funzione gx (y) in L1 [0, 2). Pertanto lenunciato
segue dal Teorema 7.2.1.

624

CAPITOLO 7.

COMPLEMENTI SULLE SERIE DI FOURIER

Dimostrazione del Teorema 7.2.1. suciente limitare lattenzione al caso


x = 0, perch il caso generale si ottiene immediatamente da questo tramite
una traslazione (Esercizio 5.2.10). Quindi f si assume continua in 0, e la
funzione
f (y) f (0)
se y 6= 0
(7.3)
g(y) =
y
in L1 [0, 2].
Poich eiy 1 iy in base allo sviluppo di Taylor dellesponenziale (Sezione 1.1), anche la funzione
h(y) :=

f (y) f (0)
eiy 1

se

y 6= 0

(7.4)

in L1 [0, 2]. Osserviamo che il legame fra f ed h


f (y) = f (0) + eiy h(y) h(y)
h(1) b
h(0),
e quindi, per la parte (iii) dellEsercizio 5.2.10, fb(0) = f (0) + b
mentre, per n 6= 0, si trova fb(n) = b
h(n 1) b
h(n). Segue da queste identit
che
SN f (0) =

N
X

n=N

fb(n) = f (0) +

N


X
b
h(n 1) b
h(n)

n=N

= f (0) + b
h(N 1) b
h(N) .

Poich h L1 [0, 2], sappiamo dal Lemma di RiemannLebesgue 5.9.6(applicato


alla funzione su R nulla fuori di T = [0, 2) e che coincide con h in T ) che
limN b
h(N) = 0. Pertanto limN + SN f (0) = f (0) .

Teorema 7.2.3. Sia f una funzione derivabile quasi ovunque in [0, 2) con
derivata Df L2 [0, 2). Allora la serie di Fourier di f converge assolutamente ed uniformemente, e converge al valore f (x) ad ogni punto x in cui f
derivabile.
Dimostrazione. Basta dimostrare che la serie di Fourier converge assolutamente, ossia che

n=

|fb(n) einx | =

n=

|fb(n)| < ,

7.2. SERIE DI FOURIER: UN APPROCCIO FACILE

625

perch in tal caso la convergenza uniforme conseguenza del test di Weierstrass (Teorema 1.3.29). Ma allora, basta provare che
X
|fb(n)| < .
n6=0

Questa disuguagianza segue dalla formula per i coecienti di Fourier della derivata (Lemma 5.16.1), dalla disuguaglianza di CauchySchwarz in 2
(Proposizione 4.5.1) e dalla disuguaglianza di Bessel (Nota 5.2.7):
X
n6=0

X 1
c (n)| =
|fb(n)| =
|Df
|n|
n6=0

X 1
n2
n6=0

! 21

X
1
2
n2
n=1

! 12

X
n6=0

c (n)|2
|Df

! 12

kDf k2 < .

Si osservi che in realt lultima disuguaglianza unuguaglianza, lidentit di


Parseval, perch il sistema trigonometrico completo (si veda la Nota 5.2.7),
ma qui non abbiamo usato luguaglianza perch la presente dimostrazione
rimpiazza quella del teorema di Dirichlet 5.12.1 sulla convergenza uniforme
per le serie di Fourier, che lo strumento grazie al quale abbiamo dimostrato
la completezza del sistema trigonometrico.
Corollario 7.2.4. Se f C(T) (continua e periodica di periodo 2) derivabile ovunque eccetto che in un numero finito di punti e la derivata limitata,
allora la serie di Fourier converge uniformemente a f ovunque.
Nel Teorema 5.15.1 abbiamo esteso il teorema di convergenza puntuale ed
uniforme di serie di Fourier, dimostrato originariamente per funzioni hlderiane (Teorema 5.12.1) a funzioni C 1 a tratti con un numero nito di salti nel
periodo (nei quali per esistono niti i limiti sinistro e destro della derivata).
Questo risultato stato ridotto al precedente tramite leliminazione dei salti
ottenuta sottraendo, per ogni salto, una funzione a dente di sega con la stessa ampiezza del salto. Questa idea elementare, combinata con il precedente
Teorema 7.2.1, porta ad un risultato pi forte di convergenza puntuale ai
punti di salto ottenuto con una dimostrazione pi semplice [?]: in eetti, si
potrebbe semplicare ulteriormente sottraendo, anzich una funzione a denti
di sega, una funzione a gradini (lasciamo la banale verica al lettore come
esercizio).

626

CAPITOLO 7.

COMPLEMENTI SULLE SERIE DI FOURIER

Teorema 7.2.5. (Convergenza puntuale di serie di Fourier ad un


pulto di salto di f e f - dimostrazione di Redheffer.) Sia f L1 (T).
Sia x0 un punto di salto, nel senso che esistono finiti i limiti
lim f (x) = f (x+
0)

xx+
0

lim f (x) = f (x
0 ).

xx
0

Supponiamo inoltre che x0 sia un punto di salto per la derivata f , nel senso
che esistano finiti i limiti dei rapporti incrementali destro e sinistro a x0 :
f+ (x0 ) := lim+
xx0

f (x) f (x+
0)
x x0

f (x0 ) := lim
xx0

f (x) f (x
0)
.
x x0

Allora al punto x0 la serie di Fourier di f converge (puntualmente) alla media


+
aritmetica 21 f (x
0 ) + f (x0 ) .

Dimostrazione. Come nella dimostrazione del Teorema 7.2.1, suciente


restringere lattenzione a x0 = 0: il caso generale si ottiene da questo tramite
traslazione. Quindi dobbiamo dimostrare che

(f (0 ) + f (0+ ))
b
f (n) =
.
2
n=

+
Poniamo M := 12 f (x
0 ) + f (x0 ) il valor medio dei limiti sinistro e destro di

A
f , A := f (x+
0 ) f (x0 ) lampiezza del salto e h = , dove la funzione a
denti di sega con salto di ampiezza nellorigine denita nellEsempio 5.14.1.
Per comodit del lettore, ripetiamo qui la denizione della funzione :
(

x2
0<x<
2
(x) =
< x < 0
2 x2

(Nota: come accennato prima dellenunciato, se invece che la funzione a


denti di sega utilizzassimo la funzione a gradini (x) = /2 per x
(, 0) e (x) = /2 per x (0, ), il resto della dimostrazione sarebbe
essenzialmente identico, parola per parola.)
Osserviamo che lampiezza del salto di h nellorigine A. Poniamo g = f h.
Allora
f (0+ ) f (0 )
A
+
=M
lim+ g(x) = f (0+ ) = f (0+ )
2
2
2
xx0
lim g(x) = f (0 ) +

xx0

A
f (0+ ) f (0 )
= f (0 ) +

=M.
2
2
2

7.2. SERIE DI FOURIER: UN APPROCCIO FACILE

627

Pertanto deniamo g(0) = M, ed in tal modo rendiamo g continua al punto


0. Inoltre
lim+

A
g(x) g(0)
= lim+ f (x) lim+ h(x) M = f (0+ ) M = 0
x0
x0
x
2

lim

g(x) g(0)
A
= lim f (x) lim h(x) M = f (0 ) + M = 0 .
x0
x0
x
2

x0

x0

Ne segue che la funzione


g(x) g(0)
x

k(x) =

limitata in un intorno di 0. Al di fuori di un intorno di 0, certamente


k L1 , poich sia f sia h lo sono. Ne segue che k appartiene a L1 (T), ossia
a L1 [, ]. Allora possiamo applicare il Teorema 7.2.1 e concludere che
P

g (n) = g(0) = M. Ma allora


n= b
M=

n=

g (n) =
b

n=

fb(n)

n=

b
h(n) .

(7.5)

Ma h una funzione reale dispari, e quindi i suoi coecienti di Fourier reali


an rispetto ai coseni cos nx sono tutti nulli; i coecienti di Fourier bn rispetto
ai seni sin nx non sono nulli, ma dalla Proposizione 5.2.5 sappiamo che
1
1
b
h(n)einx + b
h(n)einx = (an ibn )einx + (an + ibn )einx = bn sin nx ,
2
2

P
b
e quindi, per x = 0, b(n) + b( n) = 0. Ne segue che
n= h(n) = 0. Da qui
e (7.5) segue che

(f (0 ) + f (0+ ))
b
f (n) = M
,
2
n=

che quanto dovevamo dimostrare.

628

7.3

CAPITOLO 7.

COMPLEMENTI SULLE SERIE DI FOURIER

Ordine di infinitesimo dei coefficienti di Fourier di funzioni a variazione limitata e di


funzioni Hlderiane

Abbiamo gi ricavato nella Sezione 5.18 landamento asintotico dei coecienti di Fourier allaumentare dellordine di dierenziabilit. Qui estendiamo tali
stime al caso pi generale di funzioni a variazione limitata o Lipschitziane.
Proposizione 7.3.1. Se f di variazione limitata su T (Definizione 1.26.1),
allora
Var(f )
|fb(n)| 6
.
2|n|

Dimostrazione. Integrando per parti in base al Corollario 1.28.16 troviamo




Z 2
Z 2
1

1
int
int
b


f (t) e
dt =
,e
df (t)
|f (n)| =
2 0
2in 0
6

Var(f )
1
f (T) =
.
2|n|
2|n|

Definizione 7.3.2. (Modulo integrale di continuit.) Data una funzione continua f su T, il suo modulo integrale di continuit la funzione f su
T data da
f (h) = kf (t + h) f (t)kL1 (T,dt) .
Una denizione analoga vale per funzioni su R+ .
Nota 7.3.3. chiaro che f (h) 6 f (|h|), dove il modulo di continuit
f (h) = sup{|f (x) f (y)| : |x y| < h} .
introdotto nella Denizione 1.8.3.
Lemma 7.3.4. Per ogni f L1 (T),

1  
.
|fb(n)| 6 f
2
n

7.4. CONVERGENZA PUNTUALE DI SERIE DI FOURIER DI FUNZIONI BV 629


Dimostrazione. Con lo stesso approccio della dimostrazione delle disuguaglianze (5.18), (5.19) e (5.20) vediamo che
Z 2
Z 2

1
1
int
f (t) e
dt =
f (t) ein(t+ n ) dt ,
fb(n) =
2 0
2 0
e quindi

Z 2  

1

fb(n) =
f (t) eint dt .
f t+
4 0
n
La disuguaglianza dellenunciato segue direttamente da questa.

Corollario 7.3.5. Per ogni f Lip (T) (Definizione 5.11.1), fb(n) = O (n ).

Dimostrazione. In base alla parte (ii) della denizione di funzione hlderiana,


f nella classe Lip (T) se e solo se il suo modulo di continuit verica
f (|h|) < C|h| per qualche costante C > 0. Pertanto lenunciato segue dal
precedente Corollario 7.3.5 e dalla Nota 7.3.3.

7.4

Convergenza puntuale di serie di Fourier di


funzioni a variazione limitata

Teorema 7.4.1. (Somme di Fjr approssimano somme di Dirichlet


se i coefficienti di Fourier decadono come 1/n .) Sia f L1 (T) tale
che fb(n) = O(1/n). Allora le somme di Dirichlet Sn [f ](t) convergono se e
solo se convergono le somme di Fjr n [f ](t) (Definizione 6.2.2), e le due
somme convergono allo stesso limite. Inoltre Sn [f ] converge uniformemente
negli insiemi in cui converge uniformemente n [f ].
Dimostrazione. Poich dobbiamo paragonare n [f ] a Sn [f ], scriviamo cj
cj (t) := fb(j) eijt e cominciamo a confrontare, per n < |j| 6 k, i polinomi
trigonometrici

X
|j|
1 X
k [f ] :=
1
cj (t) =
,
(k + 1 j) cj
k+1
k+1
|j|6k

|j|6k

P
|j|
e Qn,k [f ] := n<|j|6k 1 k+1
cj (t). Evidentemente, la dierenza fra questi
polinomi trigonometrici ha componenti nulle rispetto a tutti gli esponenziali

630

CAPITOLO 7.

COMPLEMENTI SULLE SERIE DI FOURIER

cj (t) := fb(j) eijt con n < |j| 6 k, ed invece, per |j| 6 n, le componenti di
k [f ] Qn,k [f ] sono le stesse di = k [f ], ossia (k + 1 j) cj . Ne segue che il
polinomio trigonometrico (k + 1)(k [f ] Qn,k [f ]) (n + 1)n [f ] di grado
n (ossia i suoi termini di massima frequenza sono cn (t)), e
X
(k + 1)(k [f ] Qn,k [f ]) (n + 1)n [f ] =
((k + 1 j) (n + 1 j)) cj
|j|6n

(k n)cj = (k n)Sn [f ] .

|j|6n

Riassumendo, abbiamo dimostrato la seguente identit: per ogni k > n,




k+1
|j|
n+1
k+1 X
Sn [f ] =
1
cj . (7.6)
k [f ]
n [f ]
kn
kn
kn
k+1
n<|j|6k

Ora
che
j = 1m 1/j ln m, e quindi, per ogni > 1, si ha
P ricordiamo
P
j = 1n 1/j
j = 1n 1/j ln(n) ln n = ln , costante. Pertanto,
lipotesi |cj (t)| = |fb(j)| = O(1/j) assicura che, per ogni > 0, esiste > 1
tale che
X
|cj | ln < .
(7.7)
lim sup
n

n<|j|6n

Allora prendiamo k = [n] in (7.6). Poich, per n < |j| 6 [n] si ha


[n] + 1 |j|
< 1,
[n] n

vediamo da (7.7) che lultimo termine di (7.6) limitato da . Allora segue


ancora da (7.6) che se, per un f dato t, n [f ](t) converge ad un limite [f ](t),
si ha anche |Sn [f ](t) [f ](t)| < 2 per n sucientemente grande, e la stessa
disuguaglianza vale uniformemente rispetto a t nei dominii in cui n [f ](t)
converge uniformemente a [f ](t).

Corollario 7.4.2. (Convergenza di serie di Fourier di funzioni a variazione limitata.) Sia f di variazione limitata su T, e rammentiamo che
allora i limiti destro e sinistro di f , ossia f (t+ ) := limst e f (t ) := limst ,
esistono (non necessariamente uguali ma entrambi finiti) per ogni t T, in
base al Corollario 1.26.7. Allora, per ogni t T, la somma parziale Sn [f ](t)
della serie di Fourier di f converge alla media aritmetica 21 (f (t+ ) + f (t )).
La convergenza uniforme sui sottointervlli chiusi in cui f continua.

7.5. I TEST DI DINI E JORDAN

631

Dimostrazione. Se f a variazione limitata, in base alla Proposizione 7.3.1


vale la condizione espressa nel precedente Teorema 7.4.1. Allora lenunciato
segue dalla approssimazione puntuale ed uniforme di Sn [f ] con n [f ] stabilita
in tale Teorema, tenendo conto che esso vale per gli approssimanti di Fjr
n [f ] grazie al Teorema 6.2.5.

7.5

Criteri di convergenza di Dini e di Jordan

Ricapitoliamo i passi che ci hanno condotto alla dimostrazione classica della


convergenza puntuale ed uniforme di serie di Fourier nel Capitolo 5. Per il
momento limitiamo lattenzione alla convergenza puntuale. Abbiamo visto
nella Sezione 5.9a somma parziale n-sima Sn [f ] della serie di Fourier di una
funzione periodica integrabile f la convoluzione Sn [f ] = f Dn , dove il
nucleo di Dirichlet Dn (x), per x 6= 2k, dato da

sin (n + 21 )x
(7.8)
Dn (x) =
2 sin x2
(Proposizione 5.8.2). Riscrivendo lintegrale in (, ) in (5.12) come un
integrale fra 0 e , si simmetrizza lincremento u f , che nella denizione
originale (5.9.1) un incremento destro, e si ricava

Z
2 f (x + t) f (x t) sin (n + 12 )t
Sn [f ](x) f (x) =
dt .
0
2
2 sin 2t
Poich la funzione
F (t) =

1
1

t 2 sin 2t

(7.9)

per 0 < t 6 , e F (0) = 0, limitata (per lo stesso argomento che prova il


Lemma 5.9.3), il Lemma di RiemannLebesgue 5.9.6 assicura che


Z
1
1
2 f (x + t) f (x t) 1
sin((n + )t) dt = 0 ,

lim
t
n 0
2
t 2 sin 2
2
e quindi dimostrare che Sn [f ](x) f (x) tende a zero equivale a mostrare che

Z
2 f (x + t) f (x t) sin (n + 21 )t
lim
dt = 0 .
n 0
2
t

632

CAPITOLO 7.

COMPLEMENTI SULLE SERIE DI FOURIER

Lintegrando ha un denominatore t che si annulla solo per t = 0: pertanto,


per ogni > 0, lintegrale in (, ] tende a zero, di nuovo per il Lemma
di RiemannLebesgue 5.9.6, e quindi la convergenza puntuale della serie di
Fourier al punto x equivale al fatto che, per un > 0 arbitrario, lintegrale
di Dirichlet

Z
2 f (x + t) f (x t) sin (n + 12 )t
dt = 0
(7.10)
0
2
t
abbia limite per n , ed in tal caso Sn [f ](x) converge allo stesso limite
(il fatto che basti limitare lattenzione ad un intorno arbitrariamente piccolo
di 0 il principio di localizzazione (Nota 5.9.10)).
Per la convergenza uniforme in un intervallo, basta dimostrare che lintegrale di Dirichlet in (7.10) tende a zero uniformemente rispetto a x: per
questo scopo occorre usare la variante (un po pi dicile) del Lemma di
RiemannLebesgue adatta per la convergenza uniforme (Proposizione 5.9.8),
e richiedere che

Z
f (x + t) f (x t)

dt <


t
0

uniformemente rispetto a x: si veda largomento nella dimostrazione del


Teorema di Dirichlet 5.12.1 basato sulla disuguaglianza (5.26), e la Nota
5.12.2.
In denitiva, abbiamo provato il seguente enunciato di convergenza puntuale ed uniforme per le serie di Fourier, che incorpora il principio di localizzazione sopra citato:

Proposizione 7.5.1. Sia f L1 [x, x+]. Allora Sn [f ](x) converge a f (x) se


e solo se lintegrale di Dirichlet della funzione gx (t) = (f (x+t)+f (xt))/2
L1 [0, ] verifica
Z
2
sin t
lim
gx (t)
dt = lim gx (t) := gx (0+ ) .
0
t0
t
La convergenza di Sn [f ] a f uniforme in un intervallo [a, b] se f continua
in [a, b] e lintegrale di Dirichlet qui sopra converge a gx (0+ ) uniformemente.
Un criterio di convergenza per le serie di Fourier quindi una condizione
suciente per lesistenza del limite del nucleo di Dirichlet nel senso appena
visto. In questa Sezione dimostriamo due criteri classici per la convergenza
puntuale delle serie di Fourier.

7.5. I TEST DI DINI E JORDAN

633

Proviamo ora un criterio di convergenza che estende in maniera diretta il Teorema di convergenza puntuale 7.2.1. Dobbiamo prima chiarire la
terminologia.
Notazione 7.5.2. Nel resto di questa Sezione consideriamo criteri di convergenza delle serie di Fourier puntuale ad un punto x ed uniforme in un
intervallo [a, b]. Nel secondo caso, ovviamente, su [a, b] f deve essere continua e Sn [f ] f . Perci dobbiamo richiedere che la restrizione di f allintervallo [a, b] sia continua. Ci sono due modi di intendere lasserzione che
la restrizione di f ad [a, b] sia continua. Il senso debole quello letterale: i
punti di [a, b] sono punti di continuit di f |[a, b] . In tal caso, la funzione f ,
considerata come funzione su [, ], continua a destra al punto a ed a
sinistra al punto b, ma i punti a e b potrebbero non essere punti di continuit
(bilateri) di f . Invece, il senso forte di assumere che ogni punto di [a, b],
compresi i punti estermi, sian un punto di continuit di f . In questo secondo
caso f limitata in un intorno di [a, b], diciamo in [a , b + ] per qualche
> 0 (perch una funzione che ha limite per x a limitata in un intorno
di a, ed analogamente per b). Invece, nel primo caso non detto che f sia
limitata in un intorno di a e b: ad esempio, la funzione 1/x per 6 x < 0
e 0 per 0 6 x < ) ha restrizione continua a [0, 1] nel secondo senso ma non
nel primo, e non limitata in un intorno di 0 (lo in un intorno destro).
Nei prossimi teoremi le condizioni sono pi semplici da enunciare se la nozione di continuit in un intervallo intesa nel senso forte: ma naturalmente,
questa semplicazione solo un articio terminologico, ed in ogni enunciato
faremo un richiamo alla presente osservazione notazionale.
Teorema 7.5.3. (Criterio di Dini.) Fissato x, sia f L1 (T), gx (t) =
(f (x + t) + f (x t))/2, e supponiamo che esista il limite
f (x + t) + f (x t)
t0
2

gx (0+ ) = lim

e che, per qualche > 0, la funzione x (t) = (gx (t)gx (0+ ))/t sia integrabile:
Z
gx (t) gx (0+ )
dt < .
t
0
Allora vale la propriet della Proposizione 7.5.1:
Z
2
sin t
lim
dt = lim gx (t) := gx (0+ ) .
gx (t)
0
t0
t

634

CAPITOLO 7.

COMPLEMENTI SULLE SERIE DI FOURIER

Di conseguenza le somme parziali Sn [f ](x) della serie di Fourier convergono


a 12 (f (x+ ) + f (x )).
Inoltre, la convergenza in (7.5.3) uniforme rispetto a x [a, b] se le funzioni
x sono uniformemente limitate nella norma L1 ([0, ], ossia se kx k1 < C
indipendente da x in [a, b], e se f continua in [a, b] (ed anche limitata in
un intorno di [a, b] se la continuit della restrizione intesa nel senso debole
della Notazione 7.5.2), e di conseguenza, sotto tale ipotesi, la convergenza di
Sn [f ] a f uniforme in [a, b] in base alla Proposizione 7.5.1.
Dimostrazione. Nellidentit
Z
Z
Z
sin t
gx (t) gx (0+ )
sin t
+
dt =
sin t, dt + gx (0 )
dt
gx (t)
t
t
t
0
0
0
(7.11)
facciamo tendere a +. Il primo termine sulla destra tende a zero per il
Lemma di RiemannLebesgue 5.9.6, ed il secondo termine tende a 2 gx (0+ )
per il Lemma 5.19.3 ( il calcolo dellintegrale della funzione sinc svolto nella Sezione 5.19 sul fenomeno di Gibbs). Questo dimostra la convergenza
puntuale.
Per la convergenza uniforme occorre provare che la convergenza dellintegrale di Dirichlet al primo membro di (7.11) al limite 2 gx (0+ ) uniforme. Il primo termine del lato destro di (7.11) converge uniformemente
in base alla Proposizione 5.9.8 (cautela: la funzione che in quella Proposizione si chiama f qui si rimpiazzata da gx , mentre la funzione che l
indicata con g qui la funzione caratteristica dellintervallo [0, ]), purR
ch f sia continua (quindi gx (0+) = f (x)) e |(f (x + t) f (x))/t| dt =
R
1
|(f (x + t) + f (x t) 2f (x))/t| dt sia uniformemente limitato rispetto
2
a x [a, b] (di nuovo, si veda la parte della dimostrazione del Teorema di
Dirichlet ??theo:Dirichlet) relativa alla disuguaglianza (5.26)).
Il secondo termine del lato destro di (7.11) il prodotto della funzione gx (0+ )
della variabile x e di una funzione di che non dipende da x e tende a zero
per +: quindi la convergenza uniforme rispetto a x in ogni intervallo in cui la funzione x 7 gx (0+ ) uniformemente limitata. Rammentiamo
che gx (u) = f (x + u). Pertanto gx (0+ ) dipende solo dai valori di f in un
intorno arbitrariamente piccolo di x. Quindi, se f limitata in un intervallo
(a+, b) per un arbitrario > 0, allora la funzione gx (0+ ) dipende solo dai
valori di f in questo intervallo, ed limitata da due volte la norma uniforme
di f . Questo prova che la convergenza di questo secondo termine uniforme
negli intervalli [a, b] tali che f sia limitata in un loro intorno.

7.5. I TEST DI DINI E JORDAN

635

Corollario 7.5.4. Le ipotesi per la convergenza uniforme nel Teorema di


Dini 7.5.3 sono verificate se, per qualche > 0, la funzione f L1 (T)
limitata in [a , b + ], e
Z

gx (t) gx (0+ )
dt <
t

e la funzione modulo di continuit


f () =

sup
|xy|6, x,y[a,b]

verifica

|f (x) f (y)|

(s)
ds < .
s

Dimostrazione. Lintegrabilit di (s)/s implica che lims0+ (s) = 0 e


quindi che f sia continua. Inoltre, la stessa condizione implica che

Z
gx (t) gx (0+ )
dt



t
0

sia limitato uniformemente rispetto a x [a, b]. Per completare la dimostrazione della convergenza uniforme, quindi, basta assumere che f sia limitata
in un intorno di [a, b] (su [a, b] lo perch continua).

Nota 7.5.5. Le condizioni del criterio di Dini (Teorema 7.5.3 qui sopra) sono
vericate, come caso particolare, se la funzione gx (t) gx (0+ ) hlderiana in
(0, ] (parte (ii) della Denizione 5.11.1): quindi la parte sulla convergenza
puntuale dellenunciato del Teorema di Dini implica il Teorema 7.2.1. In
particolare, il Teorema di Dini vale se f lipschitziana in (0, ] (parte (i)
della stessa Denizione), ed ancora pi in particolare se f continua e C 1 a

tratti, il che ridimostra il Teorema di Dirichlet 5.12.1.


Teorema 7.5.6. (Criterio di Jordan.) Fissati 6 x 6 e > 0,
sia f L1 (T) di variazione limitata in [x , x + ] (Definizione 1.26.1) e
gx (t) = (f (x + t) + f (x t))/2.Supponiamo che esista il limite
f (x + t) + f (x t)
.
t0
2

gx (0+ ) = lim

636

CAPITOLO 7.

COMPLEMENTI SULLE SERIE DI FOURIER

Allora
2
lim
+

gx (t)

sin t
dt = gx (0+ ) .
t

(7.12)

Di conseguenza le somme parziali Sn [f ](x) della serie di Fourier convergono


a gx (0+ ).
Inoltre, assumiamo f di variazione limitata in [a, b] e continua in [a , b +
]. Allora la convergenza in (7.12) uniforme rispetto a x [a, b], e di
conseguenza, sotto tale ipotesi, Sn [f ] converge uniformemente a f in [a, b].
Dimostrazione. Per > 0 e per qualche 0 < < , decomponiamo il primo
membro di (7.12) in maniera simile a (7.11):
Z

sin t
gx (t)
dt =
t
+

gx (t) gx (0+ )
sin t dt + gx (0+ )
t

gx (t)

sin t
dt .
t

sin t
dt
t
(7.13)

Osserviamo che gx L1 [, ] e che gx (t)/t appartiene a L1 [, ]. Perci


R
lultimo termine del secondo membro di (7.13), gx (t) sintt dt, tende a zero
quando + per il Lemma di RiemannLebesgue 5.9.6. Inoltre, per
ogni x la norma di gx in L1 [, ] limitata da 2kf kL1 [,], e quindi anche
la norma di gx (t)/t in L1 [, ] uniformemente limitata (da 2kf kL1[,] /).
Pertanto, la convergenza uniforme rispetto a x in ogni intervallo [a, b] in
base alla versione uniforme dello stesso lemma (Proposizione 5.9.8.
Analogamente,R osserviamo che il termine centrale al secondo membro di

(7.13), gx (0+ ) 0 sint t dt, esattamente lo stesso del secondo termine del lato
destro di (7.11), e, come abbiamo visto nella dimostrazione del Teorema di
Dini qui sopra, quando + tale termine tende a zero per ogni x ssato,
ed uniformemente rispetto a x in ogni intervallo [a, b] su cui f sia continua
(ed in un intorno del quale la funzione f sia limitata, se la continuit della
restrizione.
Veniamo quindi a discutere il primo termine al lato destro di (7.13). Visto
il Teorema 1.26.6, suciente assumere che f sia monotna, diciamo non
decrescente, in [0, ]. Sappiamo dal Lemma 5.19.1 che
Z



Z
sin x
sin x
dx 6 M := 2
dx
x
x
0

(7.14)

7.5. I TEST DI DINI E JORDAN

637

per ogni 0 6 c 6 d. Inoltre, poich esiste il limite gx (0+ ), per ogni > 0
esiste = x tale che 0 < < e
|gx () gx (0+ )| <

.
3M

(7.15)

Se si assume anche che f sia continua in [a , b + ], allora


gx (t) gx (0+ ) =
=

f (x + t) + f (x t)
f (x))
2
f (x + t) f (x) f (x t) f (x)
+
2
2

continua in [a, b][0, ] e quindi uniformemente continua, per il teorema di


Heine sulla uniforme continuit delle funzioni continue sui compatti (Teorema
1.8.6): quindi il valore di x in (7.15) si pu ssare indipendentemente da x.
Fissiamo dunque una volta per tutte.
Visto che g non decrescente, possiamo applicare il teorema della media
pesata per gli integrali, Lemma ?? e ne ricaviamo lesistenza di un numero
= x tale che 0 < < e
Z
Z
gx (t) gx (0+ )
+
sin t dt = (g() g(0 ))
sin t dt .
t

0
Qui x dipende da x, ma per ogni x , in base alle disuguaglianze (7.15) e
(7.14), si ha
Z
gx (t) gx (0+ )

sin t dt 6
M= .
(7.16)
t
3M
3
0
Questa la maggiorazione di cui avevamo bisogno per il primo termine a
secondo membro di (7.13). Per il valore di che abbiamo ssato, scegliamo
K tale che, per > K, gli altri due termini in (7.13), che abbiamo gi
maggiorato precedentemente, soddisno le disuguaglianze

Z


sin t
+

dt <
|gx (0 )|
t
2
3
0
Z


sin t

gx (t)
dt < .

t
3

638

CAPITOLO 7.

COMPLEMENTI SULLE SERIE DI FOURIER

Abbiamo gi visto perch queste maggiorazioni valgano in [a, b] uniformemente rispetto a x se f continua in [a, b]. Combinando queste disuguaglianze
con (7.16)

Z

sin
t
+

dt gx (0 ) <
gx (t)

t
2
0

per > K (uniformemente rispetto a a 6 x 6 b se f continua in [a , b +


]).

Per alcuni lievi miglioramenti di questi enunciati e vari signicativi approfondimenti, si veda [39, Chapter II, Sections 10, 11, 12].

7.6

Convergenza in norma di serie di Fourier

Questa Sezione studia il problema della convergenza in norma delle serie


di Fourier su spazi normati di funzioni periodiche, diciamo di periodo 2.
Scriviamo T := R mod 2 = R/2Z (questo spazio T topologicamente
identico ad una circonferenza, e si chiama il toro unidimensionale). Nerl
resto di questo capitolo, scriviamo intercambiabilmente kf kL1 (T) o kf kL1 [0,2]
o kf kL1 (T) , e talvolta, per semplicare, perno kf k1 (in tal caso abusiamo
della notazione, perch questultima norma potrebbe essere fraintesa con
kf kL1 (R) , la quale per non ha senso per funzioni periodiche).
Come gi richiamato allinizio della Sezione 7.5, la somma parziale Sn [f ]
della serie di Fourier di una funzione f si scrive come
Sn [f ] = Dn f ,

dove Dn il nucleo di Dirichlet scritto esplicitamente ad esempio in (7.8).


Il fatto che il numeratore ed il denominatore del nucleo di Dirichlet siano
innitesimi dello stesso ordine ci dice che il nucleo di Dirichlet Dn limitato
in un intorno di 0. Altrove non ha singolarit, e quindi appartiene a L1 (T)
(ed a Lp (T) per tutti i p, ed anche a C(T), perch denito nellorigine in
maniera da risultare ivi continuo (altrove lo evidentemente).
Se vogliamo studiare la convergenza in norma di queste somme parziali, dovremmo chiederci preliminarmente se tali somme parziali siano almeno
limitate in norma. Per introdurre gli ingredienti necessari alla risposta, consideriamo dapprima il caso pi tipico, quello degli spazi di funzioni Lp (T) = L1
con 1 6 p 6 . In tal caso, in base alla parte (i) della Proposizione 6.1.5,
abbiamo
kSn [f ]kp 6 kDn k1 kf kp
(7.17)

7.6. CONVERGENZA IN NORMA DI SERIE DI FOURIER

639

Pertanto, se le norme kDn k1 dei nuclei di Dirichlet fossero limitate al variare


di n (ossia uniformemente rispetto a n), avremmo automaticamente la limitatezza delle somme parziali delle serie di Fourier per tutti gli spazi Lp (T).
Questo strumento risulter essere di tale importanza che si usa dare un nome
specico a tali norme:
Definizione 7.6.1. I numeri Ln := kDn kL1 [0,2] si chiamano le costanti di
Lebesgue.
Quindi la naturale condizione suciente per la limitatezza in norma delle
somme parziali della serie di Fourier che le costanti di Lebesgue siano
uniformemente limitate. Mostriamo adesso che purtroppo questa condizione
non vale (e come conseguenza vedremo che le somme parziali delle serie di
Fourier non convergono nella norma di L1 (Sezione 7.9); ma, per altri motivi,
si comportano meglio in Lp per 1 < p < (sottosezione 7.6.6).

7.6.1

Divergenza delle costanti di Lebesgue

Proposizione 7.6.2. Le costanti di Lebesgue Ln della Definizione 7.6.1


verificano
2
Ln = 2 ln n + O(1) ,

ossia Ln 22 ln n una successione limitata.


Dimostrazione. Sappiamo che la funzione
1
1
F (t) :=
t 2 sin 2t

limitata, come osservato dopo (7.9), quindi con norma nita in L1[0,2] .
Pertanto

Z
 Z
Z
sin n + 1  t
1
sin
n
+
t




2
2
dt

|F (t)| dt < .


dt 6




0 2 sin 2t
t
0
0
Quindi


Z
1 sin n + 21 t
|Dn (t)| dt =
dt


0 2 sin 2t


Z
1 sin n + 21 t
=

dt + O(1) .

0
t

1
Ln =
2

(7.18)

640

CAPITOLO 7.

COMPLEMENTI SULLE SERIE DI FOURIER


La funzione sin n + 12 t si annulla in [0, ] nei punti tj = j/(n + 21 ), con
j = 0, . . . , n, e quindi di segno costante in ciascun intervallo (tj , tj+1 ).
elementare il calcolo del suo integrale in questi intervalli, che risulta essere
Z
Z





tj+1
tj+1
2
1
1


t dt =
t| dt =
| sin n +
.
sin n +


tj
2
2
n + 21
tj

Osserviamo ora che, dal teorema


 della media integrale rispetto alla misura di
Borel nita d(t) = sin n + 12 t dt (Proposizione 1.9.32), per j = 1 . . . , n1
si ottiene


Z tj+1 
Z tj+1
1


|
sin
n
+
t|
1
1
2
dt 6
sin n +
t
dt

tj+1 tj
2
t
tj


Z
1
1 tj+1
6
sin n + 2 t dt .
tj tj
In base a (7.6.1) ed alla denizione tj = j/(n + 21 ), questa identit diventa

Z tj+1
| sin n + 21 t|
2
2
6
dt 6
(j + 1)
t
j
tj

per j = 1 . . . , n 1. Per il nostro scopo, pi opportuno riformulare questa


stima della media integrale come nellultima parte della Proposizione 1.9.32):

Z tj+1
| sin n + 21 t|
2 1
dt =
,
(7.19)
t
j
tj

dove j un opportuno punto nellintervallo (tj , tj+1).

Invece, nellintervallo con j = 0, ovvero per t vicino a 0, abbiamo


n + 21 , e quindi

Z 1
Z t1
| sin n + 21 t|
n+ 2
1
(n + ) dt = O(1) .
dt
t
2
0
t0

| sin(n+ 12 )t|
t

Pertanto, nalmente, da (7.18) e da queste stime si trova



Z
1 sin n + 21 t
Ln =

dt + O(1)

0
t


n1 Z
n1
1X 2
1 X tj+1 sin n + 12 t
+ O(1)
=
dt + O(1) =


j
tj
j=1

j=1

(7.20)

7.6. CONVERGENZA IN NORMA DI SERIE DI FOURIER

641

(rammentiamo che i punti j introdotti in (7.19) vericano (n+ 12 )/(j +1) 6


j 6 (n + 12 )/j.
Pn1 1
Daltra parte, una primitiva di 1/t in (0, ) ln t, e quindi le somme j=1
tj
n
).
Le
sono somme di Riemann per la funzione 1/t nellintervallo ( n+ 1 , n+
1
2
2
somme di Riemann convergono allintegrale denito,
che
su
questo
intervallo
Pn1 2
ln n+1 1 + O(1) = ln n + O(1). Quindi si ha 1 j=1
= 22 ln n + O(1).
j
2

Da questo fatto e da (7.20) segue lenunciato.

7.6.2

Spazi di Banach omogenei sul toro

Siamo interessati a studiare la convergenza in norma delle serie di Fourier su


spazi di Banach (ossia normati e completi rispetto alla norma) di funzioni
sul toro T = R/2Z del tipo di quelli visti nora. Per questo introduciamo
una classe assai generale di sottospazi di L1 (T):
Definizione 7.6.3. (Spazi di Banach omogenei di funzioni su T.) Uno
spazio di Banach (ossia normato e completo) B L1 (T) = L1 di funzioni
su T = R mod 2Z = [0, 2) si dice omogeneo se limmersione B L1
continua (ossia kf kB > Ckf k1 per qualche costante C e per ogni f B), e
se le traslazioni sono operazioni isometriche e continue: ossia, per ogni f B
e per ogni traslazione x ,
kx f kB = kf kB
kx f x0 f kB 0

se x x0 .

Esercizio 7.6.4. Gli spazi Lp sul toro, con 1 6 p < , sono spazi di Banach
omogenei. Lasciamo al lettore, per esercizio, vericare che la stessa cosa
vera per gli spazi di Hlder Lip(), per lo spazio delle funzioni continue sul
toro (ossia continue e periodiche su R), e pi in generale per gli spazi C k
delle funzioni
P periodiche derivabili k volte con derivate continue (con norma
kf kC k kj=0 kD j f k ) e tutti gli altri spazi considerati ad esempio nella
successiva Sezione 11.3. Per tutti questi spazi, si tratta di vericare che le
traslazioni sono continue nel senso della precedente denizione (nel caso di
L1 , la continuit della traslazione stata dimostrata nel Lemma 5.9.4). Per
agevolare il lettore interessato, dimostriamo subito dopo la ne del presente
Esercizio la continuit della traslazione per lo spazio delle funzioni continue
e periodiche, come enunciato separato.

642

CAPITOLO 7.

COMPLEMENTI SULLE SERIE DI FOURIER

Invece lo spazio L non uno spazio di Banach omogeneo, perch su di esso


le traslazioni non sono uniformemente continue: ad esempio, il traslato x ,
dove la funzione caratteristica di un insieme di misura positiva, non tende
uniformemente a quando x tende a zero.

Proposizione 7.6.5. Per ogni f C(T) si ha limt0 kt f f k = 0. Pi in


generale, per ogni f C(R) uniformemente continua, limt0 kt f f k = 0.

Dimostrazione. Sia f C(T). Poich f continua sul compatto T essa


uniformemente continua per il Teorema di Heine (Sezione 1.1). Questo
equivale a dire che, per ogni > 0, esiste > 0 tale che, per ogni x in in
[, ] e |h| < , si ha |f (x + h) f (x)| < (qui dipende solo da , non
anche da x). Questultima asserzione signica precisamente che la traslazione
continua nella norma uniforme. Per questo abbiamo solo usato la uniforme
continuit di f , da cui lultima asserzione dellenunciato.

Proposizione 7.6.6. (Convergenza di identit approssimate su spazi


di Banach omogenei.) Sia Se hn unidentit approssimata in L1 (T),
allora
lim khn f f kB = 0

per ogni f B .

Dimostrazione. La dimostrazione ricalca quella che abbiamo fornito nel caso


B = L1 (T) nel Teorema 6.1.10. Poich la norma verica la disuguaglianza

R

triangolare, per ogni g denita su T a valori in B si ha g(t) dt 6
R
kg(t)k dt. Allora poniamo g(t) = t f f , una funzione continua della

variabile t a valori in B grazie alla seconda propriet nella Denizione 7.6.3.

7.6. CONVERGENZA IN NORMA DI SERIE DI FOURIER

643

Otteniamo

Z


1


khn f f kB 6
h
(t)|f
(x

t)

f
(x)|
dt
n

2
B
Z
1
hn (t)kg(t)kB dt
=
2
Z

Z
1
hn (t)kg(t)kB dt +
hn (t)kg(t)kB dt
=
2

{6|t|6}
6 max kg(t)kB k khn kL1 (T)
|t|6

1
+
max kg(t)kB
2 6t6

{6|t|6}

|hn (t)| dt .

(7.21)

Per ogni > 0 esiste > 0 tale che il primo addendo allultimo membro
minore di , grazie alla propriet (i) della Denizione 6.1.7 di identit approssimata, ed al fatto che la funzione kgkB continua sul compatto [0, 2]
(per la Denizione 7.6.3 di spazio omogeneo) e quindi uniformemente continua per il teorema di Heine (Sezione ??). Ma allora, ssato questo , il
secondo addendo deve anchesso essere minore di se n grande, in base
alla propriet (iii) della Denizione 6.1.7. Quindi lultimo membro di (7.21)
minore di 2 per n grande.

Dato uno spazio di Banach omogeneo B L1 (T), consideriamo ora lo


spazio duale B , che consiste di tutti i funzionali lineari continui su B. Il
duale B anchesso uno spazio normato, come si visto nella Denizione
3.3.13.

Definizione 7.6.7. I coecienti di Fourier di un funzionale lineare F B


si deniscono nel modo seguente: per ogni n Z,
Fb(n) := hF, eint i .

Nota 7.6.8. Questa Denizione coerente con la nozione abituale di coeciente di Fourier quando il funzionale F si identica con una funzione. Ad
esempio, se B = Lp (T) e q lindice coniugato (Denizione 1.16.4), allora, in
base al Terema 1.19.6, B = Lq (T), nel senso che per ogni funzionale continuo
F su Lp (T) esiste una funzione f Lq (T) tale che, per ogni h Lp (T), si ha
Z
F (h) hF, hi = hF, hi = f (t) h(t) dt .

644

CAPITOLO 7.

COMPLEMENTI SULLE SERIE DI FOURIER

In questo caso la Denizione 7.6.7 diventa


Z
int
int
Fb(n) = hF, e
i = hf, e
i f (t) eint dt = fb(n) .

Corollario 7.6.9. (Formula di Plancherel per il duale di uno spazio


omogeneo.) Per ogni f in uno spazio omogeneo B (Definizione 7.6.3) e per
ogni F nel suo spazio duale B , vale lidentit

N
X
hf, F i = lim
1
N

n=N

|n|
N +1

fb(n) Fb(n) .

Pi in generale, per ogni identit approssimata hj in L1 [, ] consistente


di polinomi trigonometrici (pi precisamente tale che, per ogni j, esiste un
intero Nj tale che hbj (n) = 0 per |n| > Nj , si ha
hf, F i = lim

Nj
X

n=Nj

hbj (n) fb(n) Fb(n)

(7.22)

(la formula precedente coincide con questa nel caso in cui kj il nucleo di
Fjr, definito in (6.9)).
P
int
b
Dimostrazione. Se f un polinomio trigonometrico, f = N
n=N f (n) e ,
P
b
b
ovvio per linearit che hf, F i = N
n=N f (n) F (n). Quindi la propriet
(7.22) vale per i polinomi trigonometrici.
In generale, in base alla Proposizione 7.6.6 sulla convergenza in B delle identit approssimate, f = limj kj f nella norma di B, e quindi f limite in
norma dei polinomi trigonometrici kj f , i cui coecienti di Fourier verib
b
cano k\
j f (n) = kj (n) f (n). Quindi la propriet (7.22) si estende a tutto B.

7.6.3

Divergenza in norma in L1 e C

Su qualsiasi spazio di funzioni B su T, le somme parziali delle serie di Fourier


deniscono una famiglia di operatori nel modo ovvio seguente:

7.6. CONVERGENZA IN NORMA DI SERIE DI FOURIER

645

Definizione 7.6.10. Loperatore Sn : B B denito da


Sn : f 7 Sn [f ] .
Se B uno spazio normato, allora di interesse considerare la norma delloperatore Sn (che, per evitare ambiguit, qui indichiamo con il simbolo k kB ,
ma quando non c adito a dubbi omettiamo lindice B, tranne che nel caso
degli spazi Lp ).
k|Sn k|B = sup{kSn [f ]kB : kf kB 6 1} .
Si dice che uno spazio di Banach di funzioni sul toro ammette convergenza
in norma per le serie di Fourier se, per ogni f B, le somme parziali Sn [f ]
convergono a f nella norma di B.
Teorema 7.6.11. Uno spazio di Banach omogeneo ammette convergenza in
norma se e solo se le norme k|Sn k|B sono limitate rispetto a n: ossia, esiste
C > 0 tale che
kSn [f ]kB 6 C kf kB
(7.23)
per ogni f B e per ogni intero n.

Dimostrazione. chiaro che, se B ammette convergenza in norma, ossia se


per ogni f B le somme parziali Sn [f ] convergono a f in norma, allora
la successione Sn [f ] deve essere limitata in norma (da una costante C che
non dipende da n). Questo vale per ciascuna singola funzione f , e quindi
C dipende dalla scelta di f , ma in base al principio di uniforme limitatezza
(Teorema 3.14.3, e pi in particolare Corollario 3.14.7) le norme kSn [f ]kB si
maggiorano uniformemente rispetto a f , ossia si maggiorano con una costante
per la norma di f . Ci dimostra che (7.23) una condizione necessaria per
la convergenza in norma.
Mostriamo che la condizione anche suciente. Grazie ai teoremi sulle
identit approssimate della Sezione 6.1, sappiamo che i polinomi trigonometrici sono densi in B. Fissata f B, sia Q un polinomio trigonometrico
(diciamo, di grado k) tale che kQ f kB 6 /(C + 1), e osserviamo che, per
n > k, necessariamente si ha Sn [Q] = Q perch il polinomio trigonometrico
Q di grado k. Ora, per n > k,
kSn [f ] f kB = kSn [f ] Sn [Q] + Q f kB 6 kSn [f Q]kB + kQ f kB
6 CkQ f kB + kQ f kB = C

+
= .
C +1 C +1

646

CAPITOLO 7.

COMPLEMENTI SULLE SERIE DI FOURIER

Questo conclude la dimostrazione.

Proposizione 7.6.12. (Divergenza nelle norme L1 e uniforme delle somme parziali di Fourier.) Se B = L1 (T) o B = C(T) (funzioni
periodiche e continue), allora k|Sn k|B = Ln (le costanti di Lebesgue della
Definizione 7.6.1).
Dimostrazione. Dalla disuguaglianza (7.17), per tutte le norme di B = Lp (T)
(ed in particolare anche per lo spazio di Banach C(T) munito della norma
uniforme, ovvero quella di L ), sappiamo che
k|Sn k|B 6 kDn kL1 [0,2] = Ln .
Per provare la disuguaglianza inversa, consideriamo una qualche identit approssimata, ad esempio il nucleo di Fjr KN della Denizione 6.2.2, e come
in quella Denizione scriviamo N [f ] = KN f . Allora kKN k1 = 1, e
lim kN [f ] f kB = 0

(7.24)

per i Teoremi 6.2.3, 6.1.10 e 6.1.8. Trattiamo prima il caso B = L1 [0, 2], e
per semplicit scriviamo kf k1 inece di kf kL1 [0,2] .
In base alla espressione (6.9) del nucleo di Fjr, per ogni n e N si ha
Sn [KN ](x) =

min{n,N }

m=0

n+1m
cos mx = N [Dn ](x) .
n+1

Pertanto
k|Sn k|1 > kSn [KN ]k1 = kn [DN ]k1 .

(7.25)

Grazie a (7.24), per ogni > 0 e per ogni intero n, esiste un intero N tale
che kn [DN ]k1 > (1 )kDn kL1 [0,2] . Pertanto la precedente disuguaglianza
implica che k|Sn k|1 > kDn kL1 [0,2] = Ln .
Ora consideriamo invece lo spazio B = C(T). Sia gn = sgn (Dn ) la
funzione che vale 1 dove Dn > 0 e 1 dove Dn < 0 (nei punti dove Dn = 0 non
importa quale valore gli si d). Allora gn costante in ciascuno degli intervalli
consecutivi (tj , tj+1 ) gi considerati nella dimostrazione del Teorema 7.6.2,
e quindi discontinua ma continua a tratti, e kgn k = 1. Modichiamo gn
interpolandola linearmente fra i valori 1 e 1, in modo da ottenere una
funzione hn continua, che si annulla dove Dn = 0 e che verica khn k = 1.

7.6. CONVERGENZA IN NORMA DI SERIE DI FOURIER

647

Pertanto hn = gn eccetto che su intervalli del tipo Ij = (tj , tj + ).


Fissiamo > 0 e scegliamo tali raccordi lineari cos ripidi che la somma 2n
delle lunghezze di questi sottointervalli sia inferiore a /2n. Dal momento
che Dn gn = |Dn |, Dn hn > 0 e (da (7.8)) Dn 6 n + 12 < 2n, al posto di (7.25)
ora otteniamo
k|Sn k|C(T) > kSn [hn ]k
1
>
2

1
> Sn [hn ](0) = Dn hn (0) =
2

[0,2]\J Ij

Dn (x) hn (x) dx

Dn (x) gn (x) dx = kDn k1 = Ln .

Questo prova che k|Sn k|C(T) > Ln e conclude la dimostrazione.

Da questo risultato, dal Teorema 7.6.11 e dalla illimitatezza delle costanti


di Lebesgue (Teorema 7.6.2) segue immediatamente:
Corollario 7.6.13. Se B = L1 (T) o C(T), allora B non ammette convergenza in norma.
Dal fatto che le serie di Fourier di funzioni continue divergano nella norma
uniforme segue anche la loro divergenza puntuale:
Corollario 7.6.14. Esiste una funzione continua la cui serie di Fourier diverge in un punto (e quindi, formando serie uniformemente convergenti di
dilagtati dei suoi traslati, abbiamo anche funzioni continue le cui serie di
Fourier divergono in una famiglia numerabile di punti).
Dimostrazione. Fissiamo ad arbitrio un punto t T [0, 2), ad esempio t = 0. Alla ne della dimostrazione della Proposizione 7.6.12, abbiamo
costruito funzioni hn C = C(T) tali che Sn [hn ](0) diverge per n .
In altre parole, la famiglia di funzionali lineari continui su C(T) denita
da {f 7 Sn [f ](0) : n N} non equilimitata su C(T) (o equivalentemente
nnon equicontinua, nel senso della Denizione 3.14.1).
Allora, per il Teorema di Uniforme Limitatezza (nella versione del Corollario 3.14.7), questa famiglia non puntualmente limitata, ossia deve esistere
qualche f C(T) tale che supn |Sn [f ](0)| = .

648

CAPITOLO 7.

7.6.4

La funzione coniugata

COMPLEMENTI SULLE SERIE DI FOURIER

Il problema della convergenza in norma negli spazi Lp con 1 < p < ci


porta, in questa e nelle prossime Sottosezioni, ad un inciso relativo alla funzione coniugata, un concetto che si basa sul nucleo di sommabilit di Poisson
(Denizione 6.2.8).
Rivediamo la nozione di nucleo di sommmabilit per le serie di Fourier, introdotta in maniera alternativa nella Sezione 6.2: si tratta di successioni
(m)
(m) b
b
{an }
n= di moltiplicatori dei coecienti di Fourier, fn 7 an fn che sono
i coecienti di Fourier di una successione di funzioni Am che forma una iden(m)
tit approssimata non negativa. In particolare, a0 = 1 per ogni m, perch
(m)
kAm kL1 [0,2] = 1, e limm an = 1 per ogni n, perch Am converge nel senso
delle identit approssimate (con linguaggio pi appropriato, in seguito diremo che Am 0 nel senso delle distribuzioni (Denizione 11.5.2)). Lindice
m pu essere intero o reale: in questa Sezione consideriamo un indice reale
compreso fra 0 e 1, che indichiamo con r invece di m, e facciamo tendere a 1
invece che ad innito.
Rammentiamo la denizione di nucleo di Poisson (Denizione 6.2.8), ed il
risultato dellEsercizio 6.2.10: il nucleo di Poisson P (r, t) P (reit ) := Pr (t)
verica c
Pr (n) = |r|n per ogni n Z, ed ha lespressione esplicita


1 r2
1 + reit
P (r, t) =
= Re
.
1 2r cos t + r 2
1 reit
Definizione 7.6.15. (Nucleo di Poisson coniugato.) Rammentiamo che
nellEsercizio 6.2.10 abbiamo considerato la funzione a valori complessi
Cr (t) C(r, t) C(reit ) :=
ovvero
C(z) =

1+z
1z

1 + reit
1 reit

(7.26)

che si chiama il nucleo di Cauchy, ed abbiamo mostrato che essa una funzione olomorfa in D = {reit : 0 6 r < 1}; abbiamo anche osservato che
P (r, t) = Re C(r, t) una funzione armonica.
Introduciamo il nucleo di Poisson coniugato Q(r, t) := Im C(r, t). La funzione
f(r, t) fr (t) f(reit ) := Qr f (t)
(7.27)

7.6. CONVERGENZA IN NORMA DI SERIE DI FOURIER

649

la (o meglio, una, a meno di costanti additive) funzione armonica coniugata


di f , nel senso del Corollario 2.2.3. (Cautela: non si tratta della funzione
complessa coniugata: Pr a valori reali!)
Esercizio 7.6.16. Mostrare, a partire da (7.26), che il nucleo di Poisson
coniugato Qr (t) Q(r, t) = Im C(r, t) verica
Qr (t) =

2r sin t
,
1 2r cos t + r 2

e da questo dedurre, utilizzando la formula di somma geometrica (Sezione


1.1), che
X
sgn (n) r |n| eint .
(7.28)
Qr (t) = i
n6=0

In altre parole, per ogni n Z,

cr (n) = i sgn (n) r |n| ,


Q

(7.29)

dove si posto sgn (0) = 0.


Inne, utilizzare la propriet moltiplicativa dei coecienti di Fourier della
convoluzione (Proposizione 6.1.6) per concludere che, per ogni f L1 (T), la
trasformata di Poisson coniugata assume la forma
Qr f (t) = i

n=

sgn (n) r |n| fb(n)eint .

In particolare, si noti che, per r = 0, si ha Q0 (t) = 0 per ogni t.

(7.30)

ora necessario estendere il risultato di armonicit dellEsercizio 6.2.10:


Corollario 7.6.17. Per ogni f L1 [0, 2], lintegrale di Poisson f (reit ) :=
Pr f una funzione armonica sul disco unitario D, e f(reit ) := Qr f (t)
una sua funzione armonica coniugata, nel senso del Corollario 2.2.3. In
particolare, la funzione f + if olomorfa in D.
Dimostrazione. Abbiamo visto nellEsercizio 6.2.10 che P (r, t) Pr (t) =
R 2
Re C(r, t) armonica. Quindi lintegrale di Poisson Pr f (t) = 0 Pr (t
s) f (s) ds integrale di funzioni armoniche: asseriamo che esso ancora una
funzione armonica. Per provare questo bisogna mostrare che lintegrale viene
annullato quando gli si applica loperatore di Laplace (rispetto ai parametri

650

CAPITOLO 7.

COMPLEMENTI SULLE SERIE DI FOURIER

cartesiani x e y che corrispondono a quelli polari r e t secondo la regola


x + iy = z = reit ). Ma allora basta mostrare che il Laplaciano commuta con
il segno di integrale. Daltra parte questo vero perch le derivate parziali
x e y commutano con il segno di integrale rispetto ad una altra variabile
s sul compatto [0, 2] per il Teorema 1.23.1 di derivazione sotto il segno di
integrale.
Poich Qr (t) la parte immaginaria della funzione olomorfa C, la stessa
conclusione (basata sul ragionamento dellEsercizio 6.2.10) si applica anche
alla funzione f(reit ). Inoltre,
Z 2
it
it

f (re ) + if (re ) = (Pr + iQr ) f (t) = Cr f (t) =


C(r, t s) f (s) ds ,
0

dove la convoluzione fatta rispetto al parametro t della variabile z = reit .


Esattamente la stessa commutazione fra derivate parziali ed integrale mostra
che la funzione f + if soddisfa le equazioni di CauchyRiemann (2.4) (perch
le soddisfa la funzione olomorfa C: Denizione 2.2.1), e quindi che f + if
olomorfa in D.

Corollario 7.6.18. Per ogni f L1 (T) si ha f(0) f(reit )|r=0 = 0.

Dimostrazione. Questo segue dallultima osservazione dellEsercizio 7.6.16, o


equivalentemente dal fatto che Cr (t) = (1 + reit )/(1 reit ) (identit 7.26) e
quindi C0 1 a valori reali, per cui f + if(0) = C0 f = f (0).

Nota 7.6.19. spesso di grande interesse studiare il nucleo di Poisson coniugato e la funzione armonica coniugata. Ad esempio, signicativi approfondimenti dei criteri di convergenza per le serie di Fourier presentati nella
Sezione 7.5 si ottengono considerando separatamente la convergenza delle
somme parziali di Fourier di Pr f e Qr f : si veda [39, Chapter II, Sections
10,11, 12]. Con maggiore precisione, qui si dovrebbe parlare della funzione
coniugata di f nel senso della successiva Denizione 7.6.23.

Proposizione 7.6.20. (Rappresentazione di Poisson.) Sia D il disco


aperto in R2 C con centro lorigine e raggio 1, e f una funzione armonica
limitata in D. Allora f lintegrale di Poisson (introdotto in (6.2.8) di
qualche funzione limitata sul cerchio T = D dato dalla frontiera di D:
f (reit ) = Pr F (t)
per qualche F L (T).

7.6. CONVERGENZA IN NORMA DI SERIE DI FOURIER

651

Dimostrazione. Sia 0 < rn < 1 e rn 1. Consideriamo le restrizioni circolari


fn (eit ) = f (rn eit ). Poich f limitata sul disco, tutte le fn sono equilimitate
sul cerchio: kfn kL (T) 6 kf kL (D) < . Per il teorema di BanachAlaoglu
(Teorema ??) esiste una sottosuccessione fnj che converge nella topologia
debole di L (T) (ossia rispetto ai funzionali nel preduale L1 (T)) a qualche
funzione F L (T). Notiamo per che, per ogni r fra 0 e 1, il nucleo di
Poisson Pr appartiene a L1 (T), come osservato nella Denizione 6.2.8. Quindi
la convergenza debole implica che
Z 2
1
it
P (r, ei(ts) ) F (eis ) ds
Pr F (e ) =
2 0
Z 2
1
= lim
P (r, ei(ts) ) fnj (eis ) ds = lim f (rnj reit ) = f (reit )
j 2 0
j
(lultima identit segue dalla Nota 6.2.9).

Corollario 7.6.21. (Propriet della media per funzioni armoniche


limitate.) Sia D = {|z| < 1} il disco di raggio 1 e D = {|z| = 1} la sua
frontiera (quindi D = D D).

(i) (Propriet della media.) Se f una funzione a valori reali, armonica in D e limitata su D, allora, per ogni z D, si ha inf D f 6
f (z) 6 supD f . Una propriet analoga vale per ogni disco D di raggio
> 0 e centro w arbitrario, purch contenuto nel dominio in cui f
armonica limitata.

(ii) (Principio del massimo.) Se inoltre f continua su D, allora i


punti dove f assume i propri valori massimi e minimi giacciono sulla
frontiera D. In particolare, f non ha estremi locali interni a D.
Dimostrazione. La stima (i) sul disco D1 segue immediatamente dalla rappresentazione integraleRdi Poisson f (reit ) = Pr f (t) data nella Proposizione

7.6.20 e dal fatto che Pr (t) dt = 1 (il nucleo di Poisson una identit
approssimata, Nota 6.2.11). Dilatando la scala di un fattore si trasporta lo
stesso risulato al disco D (loperatore di laplace commuta con le dilatazioni
e con le traslazioni, e quindi la funzione z 7 f (w + z/) ancora armonica).
La parte (ii) segue a sua volta dalla (i): se f avesse un punto di massimo
locale z0 in D, ossia interno a D, allora, per ogni disco D di raggio sucientemente piccolo con centro in z0 e per ogni z D , si avrebbe f (z0 ) > f (z),
il che contraddice la propriet della media della parte (i).

652

CAPITOLO 7.

COMPLEMENTI SULLE SERIE DI FOURIER

Proposizione 7.6.22. (Esistenza di limiti radiali delle funzioni coniugate di funzioni armoniche con dati al bordo in L1 .) Sia f
L1 (T) e f(reit ) definita come in (7.27). Allora, per quasi ogni t, esiste il
limite radiale (puntuale) limr1 f(reit ).
Dimostrazione. Spezziamo f L1 come combinazione lineare di quattro
funzioni positive o nulle: se f a valori reali scriviamo f + = max{f, 0}
per la sua parte non negativa e f = min{f, 0} per la parte non positiva,
cosicch f + , f > 0 e f = f + f . Pi in generale, se f a valori complessi,
la spezziamo come f = (Re f )+ (Re f ) + i(Im f )+ i(Im f ) . Poich
la mappa f 7 f(reit ) lineare, senza perdita di generalit possiamo ora
assumere che f sia non negativa su T = D. Pertanto anche il suo integrale
di Poisson, che, con abuso di notazione, continuiamo a denotare con f (z),
non negativo su D. Notiamo anche che f reale, in quanto funzione armonica
coniugata di una funzione reale (in altre parole, perch il nucleo di Poisson
coniugato reale).
Sappiamo dal Corollario 7.6.17 che f + if una funzione olomorfa nel disco
D, e quindi ivi anche armonica. Allora (per il teorema di derivazione di
funzione composta, Sezione 1.1!) olomorfo anche il suo esponenziale

F (z) = ef (z)if (z) .

(7.31)

Daltra parte,

|F (z)| = eRe(f (z)if (z)) = ef (z) 6 1

(7.32)

perch abbiamo assunto f 6 0 e come conseguenza abbiamo visto che f a


valori reali. Ma allora F una funzione armonica (essendo olomorfa!) limitata in D, e quindi possiamo applicare la Proposizione 7.6.20 per concludere
che F (z) un integrale di Poisson, ed il Corollario 6.2.12 per dedurre che
F ha limiti radiali quasi ovunque per 0 6 t 6 2 quando facciamo tendere
it
r a 1. In base allidentit 7.32, il modulo |F (reit)| ha limite radiale ef (e )
quasi ovunque (ovvero, nella notazione precedente, possiamo scrivere questo
limite radiale come ef (t) , per quasi ogni 0 6 t 6 2). Daltra parte f L1
it
deve essere nita quasi ovunque, e quindi limr1 F (reit ) = ef (e ) 6= 0 quasi
ovunque. Ormai per provare lenunciato basta osservare che, a causa della
denizione (7.31), ad ogni punto in cui esiste questo limite radiale anche
f(reit ) deve avere limite radiale nito.

7.6. CONVERGENZA IN NORMA DI SERIE DI FOURIER

653

Definizione 7.6.23. (La funzione coniugata e spazi invarianti per


coniugazione.) La funzione coniugata di f L1 L1 [0, 2] la funzione
f(t) = lim f(reit ) := lim Qr f (t)
r1

r1

(il limite (puntuale) esiste per quasi ogni t grazie alla Proposizione 7.6.22).
Un sottospazio B L1 (T) invariante per coniugazione, o ammette coniugazione, se per ogni f B la funzione coniugata f appartiene anchessa a B
(in altre parole, loperatore coniugato f 7 f un endomorsmo di B (una
trasformazione lineare di B in s).
Corollario 7.6.24. Per ogni f L1 [, ], la funzione coniugata della serie
P
int
b

trigonometrica f (t) =
n= f (n) e
f(t) = i

dove abbiamo posto sgn (0) = 0.

n=

sgn (n)fb(n) eint ,

Dimostrazione. Abbiamo gi osservato, nella precedente Denizione 7.6.23,


che il limite puntuale che denisce la funzione coniugata f = limr1 Qr f (t)
esiste nito quasi ovunque. Passando r al limite in (7.30) si ottiene lidentit
nellenunciato. Il limite si scambia con il segno di serie in base al teorema
di Convergenza Monotna di Lebesgue (applicato allo spazio 1 , ossia alla
misura discreta naturale su Z (la misura che conta). Naturalmente, per
applicare questo teorema occorre prima spezzare fb(n) come combinazione
lineare (a coecienti complessi) di quattro termini positivi, esattamente come
facemmo con f (t) allinizio della dimostrazione della Proposizione 7.6.22.

b
Nota 7.6.25. Il precedente Corollario 7.6.24
mostra che f(0) = 0 per ogni
R
f L1 (T). Questo equivale allidentit T f(eit ) dt = 0, e quindi al Corollario
7.6.18.

Corollario 7.6.26. Loperatore f f una isometria di L2 (T)


Dimostrazione. Segue immediatamente dal precedente Corollario 7.6.24 e
dalla identit di Parseval (Nota 4.3.3).

654

CAPITOLO 7.

COMPLEMENTI SULLE SERIE DI FOURIER

Corollario 7.6.27. Un sottospazio B L1 (T) invariante per coniugazione


se e solo se una delle due seguenti due condizioni equivalenti soddisfatta:
(i) loperatore coniugato un operatore lineare limitato da B in B;
(ii) loperatore di troncamento (o proiezione ortogonale, nel caso dello spazio di Hilbert L2 ) alla parte positiva dello spettro di Fourier, definito
da

X
1b
1

f 7 f = f (0) + (f + if )
fb(n) eint
(7.33)
2
2
n=0
un operatore lineare limitato da B in B.

Dimostrazione. La linearit delloperatore coniugato e del proiettore della


parte (ii) sono ovvie. Se loperatore coniugato manda B in B, allora B
invariante per coniugazione direttamente in base alla Denizione 7.6.23.
Per il viceversa della parte (i) occorre provare che loperatore coniugato
limitato su B. A questo scopo, in base al teorema del graco chiuso (Teorema
??) basta provare che un operatore chiuso, ossia che, se limn fn = f e
limn fn = g nella norma di B, allora g = f. Per provare questa asserzione,
rammentiamo che f 7 fb(0) un funzionale lineare continuo su B, perch
|fb(0)| 6 kf k1 6 Ckf kB (si veda la Denizione 7.6.3 di spazio di Banach
omogeneo), ed osserviamo che, grazie alla convergenza in norma L1 ed al
Corollario 7.6.24, per ogni m si ha
b
b
g (m) = lim f(m) = i sgn (m) lim fbn (m) = i sgn (m) fb(m) = f(m) .
b
n

Per quanto riguarda la parte (ii), ovvio che loperatore f 7 f limitato se


lo loperatore coniugato f 7 f, ed vero anche il viceversa perch il secondo
operatore si esprime in termini del primo cos: f = i (2f f fb(0)).

Nota 7.6.28. Per futura memoria, si osservi che f 7 f eint una traslazione
di n passi in avanti nel dominio delle frequenze, ossia una traslazione di n
passi in avanti dei coecienti di Fourier, dal momento che
Z
1
f[
eint (j) =
f (t) ei(nj)t dt = fb(j n) .
2

Pertanto g := (f eint ) la funzione con coecienti di Fourier b


g (j) = 0 se
j < 0, e gb(j) = b
g (j + n) se j > 0. Quindi, commutando lazione di questa

7.6. CONVERGENZA IN NORMA DI SERIE DI FOURIER

655

traslazione e del troncamento, otteniamo la seguente relazione di commutazione: eint (f eint ) la funzione i cui coecienti di Fourier coincidono con
quelli di f a partire dallindice n + 1 e sono nulli per tutti gli indici minori o
uguali a n.
In particolare, il troncamento alla parte positiva dello spettro della somma
parziale n-sima della serie di Fourier di f esattamente
n
X
j=0

fb(j) eijt = f ei(n+1)t (f ei(n+1)t ) .

(7.34)

Per il prossimo Corollario, rammentiamo che loperatore aggiunto su B


di un operatore S su B stato introdotto nella Denizione 3.11.8.
Corollario 7.6.29. (Loperatore coniugato su Lp (T) laggiunto di
quello su Lq (T).) Poich Lp [, ] L1 [, ] per p > 1, la definizione
di funzione coniugata ha senso per Lp [, ], e d luogo ad un operatore su
Lp [, ] che chiamiamo loperatore coniugato.
Se p e q sono indici coniugati nel senso della Definizione 1.16.4), allora
loperatore coniugato su Lp [,
] laggiunto di quello su Lq [, ], riR

1
spetto alla dualit hf, gi = 2
f (x) g(x) dx utilizzata nellidentit (11.5)

dellEsempio 11.3.3 (dove si mostra che il duale di Lp Lq per 1 6 p < ).


Dimostrazione. Dal Corollario 7.6.24 e dalla formula di Plancherel per Lp e
Lq (Corollario 7.6.9) segue che

N
X
hf, gi = i lim
1
N

n=N

|n|
N +1

sgn (n)fb(n) b
g (n) = hf, gi .

Quindi loperatore aggiunto, rispetto alla succitata dualit, delloperatore


coniugato su Lp (T) loperatore coniugato su Lq (T).

Nota 7.6.30. Rammentiamo che, dato un operatore su uno spazio normato


B ed una dualit fra B ed il suo duale B , quale sia lopeatore coniugato dipende dalla scelta della dualit. Abbiamo dimostrato nel precedente Corollario 7.6.29 che laggiunto delloperatore coniugato su Lp (T) loperatore coniugato su Lq (T) se come dualit si sceglie la forma bilineare

656

CAPITOLO 7.

COMPLEMENTI SULLE SERIE DI FOURIER

R
hf, gi = f (x) g(x) dx e se sugli spazi dei loro coecienti di Fourier si sceglie la forma antilineare (con coniugazione sulla seconda variabile) che abbiamo usato nel teorema di Plancherel (Corollario 7.6.9). Potremmo invece
scegliere, come dualit
fra Lp (T) e Lq (T), la forma antilineare sulla seconda
R
variabile (f, g) = f (x) g(x) dx (che coincide con il prodotto scalare usuale
quando f , g L2 , ossia precisamente quella che abbiamo immpiegato nel
Teorema di rappresentazione di Riesz 11.2.1 per caratterizzare il duale di
L2 ). In tal caso, a causa del coeciente immaginario nella espressione dei
coecienti di Fourier della funzione coniugata (Corollario 7.6.24) laggiunto
delloperatore coniugato su Lp (T) risulterebbe essere loperatore coniugato su
Lq (T) cambiato di segno. Lo stesso operatore aggiunto si sarebbe trovato se
avessimo invece scelto una forma bilineare (senza coniugazione sulla seconda
variabile) nel teorema di Plancherel.

7.6.5

Serie trigonometriche di soli coseni che sono serie


di Fourier anche se i coefficienti tendono a zero in
maniera lenta; le loro serie coniugate, in soli seni,
non sono serie di Fourier

Abbiamo annunciato allinizio della Sezione 5.18 che non si pu dire nulla
sullordine di innitesimo dei coecienti di Fourier di funzioni in L1 [0 , 2]:
i coecienti possono tendere a zero in maniera arbitrariamente lenta, come
il prossimo risultato dimostra.
Proposizione 7.6.31. Siano {cn > 0} una successione bilatera pari, ossia
tale che cn = cn , che tende a zero allinfinito e che soddisfa la condizione
di convessit
cn1 2cn + cn+1 > 0 .
(7.35)
Osserviamo che la condizione di parit implica che la serie di Fourier di f
P

0 an cos nx, in soli coseni (con a0 = c0 e an = 2cn ).


Allora esiste una funzione f L1 (T) tale che fb(n) = cn per tutti gli n.
Quindi per una serie trigonometrica in soli coseni la condizione di convessit
dei coefficienti cn (positivi e che tendono a zero allinfinito) sufficiente ad
assicurare che essa sia una serie di Fourier, senza ipotesi sulla velocit di
decadimento.

7.6. CONVERGENZA IN NORMA DI SERIE DI FOURIER

657

Dimostrazione. Osserviamo anzitutto che la condizione (7.35) implica che,


per ogni n > 0, vale la propriet di monotonia
cn cn+1 6 cn1 cn .
Pertanto



n1

X


cm cm+1 > n|cn1 cn | .
|c0 cn | =


m=0

Poich limn cn = 0, segue dal Lemma 1.1.4 che

(7.36)

cn1 cn = o(1/n) .
Perci
k
X
n=1

n(cn+1 2cn + cn1 ) = c0 ck + k(ck ck+1 ) c0 .


k

(7.37)

Allora poniamo
f (x) =

X
n=1

n(cn+1 2cn + cn1 )Kn1 (x)

(7.38)

dove Kn il nucleo di Fjr (Denizione 6.2.2). Sappiamo che Kn > 0 (6.16)


e kKn kL1 (T) = 1 (6.17). Pertanto, grazie alla convergenza in (7.37), la serie
in (7.38) converge nella norma di L1 (T), e la sua somma f una funzione
non negativa perch tali sono i suoi termini. Per il Teorema di Convergenza
Monotna 1.9.53 possiamo allora integrare sotto il segno di serie, e quindi
fb(j) =

X
n=1

b n1 (j) .
n(cn+1 2cn + cn1 )K

Daltra parte, in base a (6.9),


b n1 (j) =
K

se

0
1

|j|
n

|j| > n

altrimenti.

(7.39)

658

CAPITOLO 7.

COMPLEMENTI SULLE SERIE DI FOURIER

Pertanto (7.39) diventa


fb(j) =
=

n=|j|+1

n=|j|+1



|j|
n(cn+1 2cn + cn1 ) 1
n
n(cn+1 2cn + cn1 ) |j|

N
X

= lim
N

n=|j|+1

(7.40)

(cn+1 2cn + cn1 )

n=|j|+1

n(cn+1 2cn + cn1 ) |j|

N
X

(cn+1 2cn + cn1 ) .

n=|j|+1

(7.41)

Per semplicit poniamo m := |j| e bn := n(cn+1 2cn + cn1 ). Calcoliamo


la prima delle due somme al membro di destra di (7.40) grazie allidentit
(7.37):
N
X

bn =

n=m+1

N
X
n=1

bn

m
X

bn

n=1

= c0 cN N(cN cN +1 ) (c0 cm m(cm cm+1 ))


= cm cN N(cN cN +1 ) + m(cm cm+1 )) .

Invece la seconda somma si calcola direttamente perch una somma


telescopica:
N
X

(cn1 2cn + cn+1 ) =

n=m+1

N
X

n=m+1

(cn+1 cn ) (cn cn1 )

= cN +1 cN (cm+1 cm ) .

Ritornando a scrivere |j| invece di m, dalle ultime tre identit, da (7.36) e


dal fatto che la successione {c|j|} innitesima ottieniamo:
fb(j) = lim

N +

c|j| cN N(cN cN +1 ) + |j|(c|j| c|j|+1) + |j|(c|j|+1 c|j| )



|j|(cN +1 cN ) = c|j| . (7.42)

Questo dimostra lenunciato.

7.6. CONVERGENZA IN NORMA DI SERIE DI FOURIER

659

Nota 7.6.32. La precedente Proposizione 7.6.31 rivela che le serie trigonometriche in soli coseni possono essere serie di Fourier anche se i loro coecienti
tendono a zero in maniera (quasi) arbitrariamente lenta. Infatti la condizione di convessit (7.35) non comporta alcuna conseguenza circa la velocit di
convergenza a zero dei coecienti. Per accorgersene basta osservare che la
condizione (7.35) soddisfatta se i coecienti cn sono i valori agli interi n
di una funzione h convessa. Prendiamo h derivabile: allora h convessa se
h crescente, ed in virt del Teorema del valor medio di Lagrange (Sezione
1.1) in questa ipotesi vale anche la condizione (7.35). Allora, consideriamo
la successione
1
1
:= (k)
cn =
ln ln ln n
g (n)
(k volte). Per k arbitrariamente elevato questa successione converge a zero
in maniera (quasi) arbitrariamente lenta, eppure verica la condizione di
convessit, almeno per n sucientemente grande. Infatti,
Dg(x) =

ln (g k1(x)) g k2 (x)

...

1 1
,
ln x x

e questa funzione, per grandi x, negativa ma crescente.


Viceversa, ora mostreremo (Proposizione 7.6.33) che la situazione completamente diversa per serie trigonometriche in soli seni, ossia del tipo

X
1

an sin nx =

cn einx

con cn = cn = 2ian , una successione bilatera dispari.


In eetti, nel risultato precedente abbiamo visto che una velocit elevata
di decadimento dei coecienti di Fourier non necessaria anch una serie
trigonometrica con coecienti pari sia la serie di Fourier di qualche funzione
f L1 (T). Naturalmente, in certi casi la velocit di convergenza suciente
perch le serie trigonometriche siano serie
an = O(1/n) con
Pdi Fourier: seP
> 1, allora le serie trigonometriche n=0 an cos nx e
n=0 an sin nx sono
entrambe uniformemente convergenti (per il test di Weierstrass, Teorema
1.3.29) e quindi sono le serie di Fourier delle loro funzioni somma (per il
Teorema 1.3.17 di passaggio al limite sotto il segno di integrale). Per, se an
tende a zero pi lentamente, allora le cose cambiano
P in maniera inaspettata:
il prossimo risultato mostra che, se an > 0 e n>0 an /n = , quando si
estende {an : n = 1, 2, . . . } ad una successione dispari su Z (ovviamente

660

CAPITOLO 7.

COMPLEMENTI SULLE SERIE DI FOURIER

ponendola zero per n = 0), la serie trigonometrica con questi coecienti non
la serie di Fourier di una funzione in L1 (T) (anche nel caso in cui la serie
trigonometrica converga puntualmente ad una somma f , non la serie di
Fourier di f : ma si pu dimostrare che in questa circostanza f
/ L1 (T) [14,
Chapter III, remark 1.4, Theorem 3.11, Corollary 3.11]).

Proposizione 7.6.33. Sia f L1 (T) una funzione i cui coefficienti di Fourier sono una successione dispari, ossia fb(n) = fb(n) per ogni n Z, ed
P
inoltre fb(n) > 0 per ogni n > 0. Allora n6=0 fb(n)/n < .
Dimostrazione. Senza perdita di generalit possiamo sommare a f una costante scelta in modo da assicurare che si abbia fb(0) = 0. Questo equivale a
scegliere f a media nulla sulR periodo (perch fb(0) la sua media sul periodo).
x
Sia F la primitiva F (x) = 0 f (t) dt. Allora F periodica (grazie al Lemma
5.16.4) e continua (per il Lemma 1.27.2), e
i Fb(n) = fb(n)/n

(7.43)

per n 6= 0 (Proposizione 5.16.5). Poich F continua, possiamo applicare al


punto t = 0 il Teorema 6.1.17 di convergenza puntuale della identit approssimate per funzioni continue (o pi direttamente, come caso particolare, il
Teorema di Fjr 6.2.5), per ottenere

X 
b

lim i F (0) +
1

16|n|6N

 b
n
f (n)
N +1
n

N 
X
= i Fb(0) + 2 lim
1
N

n=1

n
N +1

 b
f (n)
= iF (0) = 0 (7.44)
n

da (7.43) e dal fatto che fb(n) = fb(n) e F (0) = 0. Quindi il limite di


P b
queste somme nito. Ora, se per assurdo si avesse
n=1 f (n)/n = ,
allora il limite delle somme in (7.44) dovrebbe divergere, in base al Teorema
di Convergenza Monotna (che si applica alla misura discreta su N grazie
allipotesi fb(n) > 0, la quale assicura che i termini della somma sono positivi).

7.6. CONVERGENZA IN NORMA DI SERIE DI FOURIER

661

Corollario 7.6.34. La serie trigonometrica

X
cos nx
n=2

log n

una serie di Fourier (essa converge puntualmente ad una somma f L1 (T)


ed la serie di Fourier di f ). Invece la serie trigonometrica

X
sin nx
n=2

log n

converge puntualmente ovunque, ma non la serie di Fourier di nessuna


funzione in L1 (T).
Dimostrazione. La prima asserzione discende direttamente dalla Proposizione 7.6.31, dal momento che
!

X
1 X X
cos nx
eint
+
=
log n
2 n= n=2 log |n|
n=2
verica la condizione di convessit enunciata in quella Proposizione.
La seconda un caso particolare della Proposizione 7.6.33, dal momento che
!

X
X
X
i
sin nx
sgn (n) int
+
=
e
log n
2 n= n=2 log |n|
n=2
e la serie

n=2

1/(n log n) diverge.

Corollario 7.6.35. L1 = L1 (T) non invariante per coniugazione.

7.6.6

Lp(T) invariante per coniugazione per 1 < p <

Teorema 7.6.36 (Marcel Riesz). (Loperatore coniugato limitato su


Lp (T) per 1 < p < .) Per 1 < p < , loperatore coniugato limitato
nella norma di Lp (e quindi manda Lp (T) in Lp (T)).
Dimostrazione. Grazie al Corollario 7.6.26, loperatore coniugato una isometria nella norma L2 , e quindi il risultato ovvio per p = 2.
In base al Corollario 7.6.29, se p e q sono indici coniugati (Denizione 1.16.4)

662

CAPITOLO 7.

COMPLEMENTI SULLE SERIE DI FOURIER

allora gli operatori coniugati su Lp (T) e su Lq (T) sono aggiunti uno dellaltro,
e quindi hanno la stessa norma su questi due spazi (Teorema 3.11.7). Quindi
basta provare il risultato per 1 < p < 2, e nel resto della dimostrazione assumiamo f Lp (T) con 1 < p < 2. Inoltre, ogni funzione a valori complessi
la combinazione lineare di quattro funzioni non negative: le parti positiva e
negativa dele parti reale ed immaginaria, rispettivamente (come ad esempio
nella dimostrazione della Proposizione 7.6.22). Quindi, poich loperatore
coniugato lineare, senza perdita di generalit assumiamo f > 0.
La dimostrazione che presentiamo qui utilizza in maniera intelligente linterrelazione fra armonicit ed olomora. Come dabitudine, indichiamo con
f (z) = f (reit lintegrale di Poisson di f = f (eit ), e con f(reit ) := Qr f (t) la
sua funzione coniugata (Denizione 7.6.15). Poich la funzione f (eit ) non
negativa e chiaramente possiamo assumerla non identicamente nulla, si ha
che il suo integrale di Poisson f (z) = f (reit ) strettamente positivo ovunque. Allora, poich f una funzione armonica (Esercizio 6.2.10) e f la sua
armonica coniugata, la funzione H(z) = f (z) + if(z) olomorfa nel disco
unitario aperto D (Corollario 2.2.3). Poich la sua parte reale f (z) non si
annulla mai in D, nemmeno H si annulla:
{z D : H(z) 6= 0} = D .

(7.45)

Osserviamo che H(0) = f (0) + if(0) = f (0) > 0, perch f(0) = Q0 f = 0


per lultima asserzione dellEsercizio 7.6.16, o equivalentemente per il Corollario 7.6.18. Siamo interessati allelevazione alla potenza p, ossia G(reit ) =
H(reit )p . Avendo ora a che fare con funzioni a valori complessi dobbiamo denire la potenza p facendo riferimento ad una scelta di ramo oloit
morfo della funzione G(reit ) = ep ln H(re ) (si veda lEsempio 2.14.18). Poich H(0) > 0 naturale scegliere come ramo olomorfo quello che reale a z = 0, in modo che G(0) = H(0)p sia la consueta radice p-esima
reale (ed in particolare G(0) > 0). Questo signica che, per il logaritmo
G(z) = ep ln H(z) = ep(ln |H(z)|+i(arg H(z)+2k)) , stiamo scegliendo k = 0, e quindi
G(z) una funzione olomorfa nel dominio {H(z) 6= 0} = D (grazie a (7.45),
e
|G(z)| = |ep(ln |H(z)|+i(arg H(z)+2k)) | = ep ln |H(z)| = |H(z)|p
(7.46)
(nellultimo membro, ovviamente, la potenza p-esima nel senso delle potenze reali).
Ora scegliamo R tale che /2p < < /2, ossia, tenendo conto del fatto

7.6. CONVERGENZA IN NORMA DI SERIE DI FOURIER

663

che 1 < p < 2,

,
< p < .
(7.47)
2
2
Per 0 < r < 1, consideriamo langolo = arg H(reit ) = arctan f(z)/f (z).
Osserviamo che la condizione f (z) > 0 implica che H(z) giace sempre nel
semipiano destro (parte reale positiva), e quindi 6 /2. Allora i due
archi in T D deniti da A := {t : | arg H(reit )| < e B := {t : 6
| arg H(reit )| < /2} (che dipendono da r) sono complementari. Osserviamo
anche che, se si scrive w = u + iv, la condizione | arg w| < < /2 equivale
a
u
Re w
=
= cos arg w > cos
(7.48)
|w|
|w|
<

(qui non c bisogno di prendere il valore assoluto di Re w perch Re w > 0


in quanto | arg w| < /2). Pertanto, ponendo w = H(z) = H(reit ), abbiamo
che u = f (z) e |H(z)| < f (z)/ cos per ogni t A. Quindi, da (7.46), per
t A troviamo
|f (z)|p
.
(7.49)
|G(reit )| = |H(z)|p <
(cos )p
Per comodit di esposizione, scriviamo la costante in questa disuguaglianza
come Jp := (cos )p .
Viceversa, se t B, abbiamo 6 | arg H(reit )| e quindi p < p| arg H(reit )| =
| arg G(reit )|, dal momento che p < in base alle disuguaglianze (7.47). Ma
poich, per le stesse disuguaglianze, si ha anche p > /2, dobbiamo notare
che (7.48) ora diventa: per | arg w| > p
| Re w|
= | cos arg w| > | cos(p)| .
|w|
Daltra parte per t B risulta Re w := Re G(reit ) < 0 e cos(p) < 0: quindi
la precedente disuguaglianza diventa
|G(reit )| 6

Re G(reit )
cos(p)

(7.50)

per ogni t B. Per comodit di esposizione, scriviamo la costante in questa


stima come Kp := | cos(p)|1 .
Grazie a queste disuguaglianze possiamo ora stimare gli integrali
Z
Z
Z
1
1
1
it
it
|G(re )| dt +
|G(reit )| dt .
(7.51)
|G(re )| dt =
2
2 A
2 B

664

CAPITOLO 7.

COMPLEMENTI SULLE SERIE DI FOURIER

Invece che agli integrali del modulo di G nel lato destro di (7.51), siamo
adesso interessati agli integrali della sua parte reale. Per quanto riguarda il
primo integrale al lato destro di (7.51), segue da (7.49) che
Z
Z
1
1
it
| Re G(re )| dt <
|G(reit )| dt
(7.52)
2 A
2 A
Z
Jp
1
<
|f (reit )|p dt =
kf kpLp (T) .
2 A
(cos )p
Daltra parte,
su B si ha | arg
R
R G(z)| > > /2 e quindi Re G(z) < 0.
Pertanto B | Re G(z)| dt = B Re G(z) dt. Vediamo allora come in (7.51)
che
Z
Z
Z
it
it
Re G(re ) dt =
Re G(re ) dt
Re G(reit ) dt
B

e da qui e (7.52) si ottiene


Z
Z
Z

it
it
| Re G(re ))| dt =
Re G(re ) dt 6
B



Re G(re ) dt + Jp kf kpLp (T) .
it

(7.53)
Per
R fare usoitdi questultima disuguaglianza occorre prima stimare lintegrale
Re G(re ) dt. Qui usiamo di nuovo le propriet delle funzioni armoniche:

G olomorfa su tutto D e quindi Re G armonica in D, ed limitata nel


disco |w| < r < 1}. Pertanto Re G soddisfa la propriet della media (parte
(i) del Corollario 7.6.21), e quindi, rammentando che H(0) = f (0) > 0,
Z
1
Re G(reit ) dt = Re G(0) = Re(H(0)p ) = f (0)p > 0 .
2
Pertanto il valore assoluto intorno al primo integrale al lato destro di (7.53)
non necessario, e da (7.53 ) si ottiene
Z
1
| Re G(reit ))| dt 6 f (0)p + Jp kf kpLp (T) .
2 B
Ma allora da (7.50) segue
Z
Z
Kp
1
it
|G(re ))| dt 6
| Re G(reit ))| dt 6 Kp (f (0)p + Jp kf kpLp (T) ) .
2 B
2 B
(7.54)

7.6. CONVERGENZA IN NORMA DI SERIE DI FOURIER

665

Finalmente, combinando la seconda disuguaglianza in (7.52) con (7.54), da


(7.51) otteniamo
Z
Z
Kp
1
it
|G(re ))| dt 6
| Re G(reit ))| dt 6 Kp f (0)p +Kp (1+Jp ) kf kpLp (T) .
2 B
2 B
(7.55)
Ma non abbiamo ancora nito di sfruttare le propriet delle funzioni armoniche! Infatti, lintegrale di Poisson f (reit ) = Pr f (eit ) una funzione
armonica (labbiamo gi osservato allinizio di questa dimostrazione, ma ecco
di nuovo il riferimento: Esercizio 6.2.10), e quindi, di nuovo per la propriet
R
1
della media del Corollario 7.6.21, abbiamo f (0) = 2
f (eit ) dt = fb(0). Ma
T
allora
Z
1
b
|f (eit )| dt = kf kL1 (T) 6 kf kLp (T) ,
|f (0)| = |f (0)| 6
2 T
perch p > 1 (la disuguaglianza fra le norme L1 e Lp era stata provata in
(1.47).
Da questa disuguaglianza e da (7.55) segue
Z
1
|G(reit ))| dt 6 Kp (2 + Jp ) kf kpLp (T) = Cp kf kpLp (T) ,
(7.56)
2

dove Cp una costante che dipende solo da p (ma non da f e r).


Ora ricordiamo che H(z) = f (z) + if(z) e quindi |f(z)| 6 |H(z)|. Pertanto
|f(z)|p 6 |H(z)|p = |G(z)|. Allora la disuguaglianza (7.56) implica
1

kfkLp (T) 6 Cpp kf kLp (T) ,


e con questo abbiamo nalmente provato lenunciato: loperatore coniugato
limitato nella norma di Lp per 1 < p < .

7.6.7

Convergenza in norma in spazi omogenei che ammettono coniugazione

In questa Sottosezione, nalmente, colleghiamo la nozione di spazio invariante per coniugazione a quella di convergenza in norma delle serie di Fourier.

666

CAPITOLO 7.

COMPLEMENTI SULLE SERIE DI FOURIER

Teorema 7.6.37. Sia B uno spazio di Banach omogeneo (Definizione 7.6.3)


in cui i polinomi trigonometrici siano densi e la moltiplicazione per la funzione eint sia una isometria: ossia, per ogni f B,
keint f kB = kf kB

(7.57)

(in base alla parte (iii) dellEsercizio 5.2.10, (7.57) questo equivale ad assumere che la traslazione in frequenza, ossia la traslazione dei coefficienti di
Fourier, sia una isometria).
Allora B invariante per coniugazione se e solo se le serie di Fourier di
funzioni in B convergono nella norma di B.
Dimostrazione. In base al Teorema 7.6.11 ed al Corollario 7.6.27, ci che
dobbiamo provare che gli operatori Sn di somma parziale della serie di
Fourier (Denizione 7.6.10) sono uniformemente limitati rispetto a n se e
solo se il troncamento alla parte positiva dello spettro di Fourier f f
denito in (7.33) un operatore limitato (nel senso usuale della Denizione
3.3.5).
Assumiamo che S n siano operatori uniformemente limitati: per qualche
C > 0,
k|S n k| 6 C .
(7.58)
Intrallacciamo Sn con la moltiplicazione per la funzione eint per produrre
una traslazione di n passi verso destra dello spettro di Fourier ed in tal modo

traslare in frequenza Sn f ad un polinomio trigonometrico S2n


f con supporto
spettrale positivo: ossia, poniamo

S2n
f := (S2n f ) =

2n
X
k=0

fb(k)eikt = eint Sn (eint f )

(7.59)

(lultima identit conseguenza di (7.34). Grazie a (7.58) ed allipotesi (7.57)


dellenunciato, sappiamo che
k|S 2n k| 6 C .

(7.60)

Per f B e > 0, sia p un polinomio trigonometrico tale che k|f pk|B <
/2C ( qui che si usa la densit dei polinomi trigonometrici). Allora, in base
alla stima uniforme (7.60),

kS2n
f S2n
pkB 6 Ckf pkB 6

.
2

7.6. CONVERGENZA IN NORMA DI SERIE DI FOURIER

667

Sia k il grado del polinomio trigonometrico p. Per j > k i coecienti di

Fourier pb(j) sono nulli, e quindi, per tutti gli n, m > k/2 si ha S2n
p = S2m
p.
Pertanto

kS2n
f S2m
f kB 6 kS2n
f S2n
pkB + kS2m
p S2m
f kB 6 .

In altre parole, la successione {S2n


f } di Cauchy nella norma di B, e quindi converge ad una funzione g B. Grazie allortogonalit delle funzioni
eikt e lidentit (7.59), immediato vericare che la serie di Fourier di g
P b
ikt
k=0 f (k)e , e quindi

lim S2n
f := g = f .
n

Pertanto kf k = k limn S2n


f k < Ckf k, in base alla disuguaglianza (7.58), e
quindi loperatore f 7 f limitato nella norma di B. Questo completa la
prima parte della dimostrazione.
Viceversa, assumiamo ora che loperatore f 7 f sia limitato nella norma
di B. Segue dallidentit (7.34) che

S2n
f = f ei(2n+1)t (f ei(2n+1)t ) ,

e quindi, applicando due volte lipotesi (7.57),

kS2n
kB 6 kf kB + k(f ei(2n+1)t ) kB 6 2Kkf kB ,

dove K la norma delloperatore limitato f f (come sempre, nel senso della Denizione 3.3.5). In altre parole, abbiamo provato che le norme
k|S 2n k| sono uniformemente limitate al variare di n. Daltra parte, visto che

S2n
f = eint Sn (eint f ) in base a (7.59), esattamente per lo stesso argomento
k|S n k| = k|S 2n k|, e quindi gli operatori di somma parziale di Fourier sono
uniformemente limitati nella norma di B.

In base al Teorema 7.6.36, questo ci permette di generalizzare allo spazio


L un fatto che gi ben conosciamo nel caso p = 2 grazie alla completezza in L2 del sistema trigonometrico (Corollario 5.13.8) e naturalmente alle
propriet dei sistemi completi negli spazi di Hilbert (Corollario 4.3.2):
p

Corollario 7.6.38. Per 1 < p < la serie di Fourier di f Lp (T) converge


nella norma Lp .

668

CAPITOLO 7.

COMPLEMENTI SULLE SERIE DI FOURIER

7.7

Appendice: loperatore coniugato (o trasformata di Hilbert) di tipo debole 1-1

7.7.1

La funzione di distribuzione

Definizione 7.7.1. (Funzione di distribuzione.)


(i) Per ogni funzione misurabile f : T R+ {0}, la funzione di distribuzione di f la funzione su R+ denita da
mf () := m ({t : f (t) 6 }) ,
dove m la misura di Lebesgue su (0, 2] T.
(ii) Per semplicit di notazione, scriveremo
m+
f () := m ({t : f (t) > }) = 2 mf () ,
Nota 7.7.2. La funzione di distribuzione mf () ha limite 0 per 0 e 2 per
, monotna non decrescente, e quindi ha solodiscontinuit di tipo

salto nito, in quantit al pi numerabile. Inoltre, n t : f (t) 6 n1 =
{t : f (t) 6 }, e quindi, grazie alla numerabile additivit della misura di
Lebesgue, mf () continua a destra ad ogni R+ .

Lemma 7.7.3. Per ogni f : T R misurabile e per ogni : R+ R


continua,
Z 2
Z
(f (x)) dx =
() dmf () .
(7.61)
0

Dimostrazione. In base allEsercizio 1.14.6, la funzione misurabile f si approssima con funzioni a gradini a meno di un un > 0 arbitrariamente
piccolo tranne che su un insieme di misura inferiore a . Da questo segue
Esercizio che basta dimostrare lidentit (7.61) nel caso in cui f la funzione caratteristica di un intervallo (o pi precisamente, lEsercizio forrnisce
una successione di funzioni a gradini che approssimano f puntualmente quasi
ovunque, e quindi uniformemente a meno di un insieme arbitrariamente piccolo, per il teorema di Egoro (Corollario 1.14.9, quindi, passando al limite
sotto il segno di integrale, basta dimostrare (7.61) per tutte le funzioni a
gradini, e quindi basta dimostrarlo per tutte le funzioni caratteristiche degli

7.7.

LOPERATORE CONIUGATO DI TIPO DEBOLE 1-1

669

intervalli).
Ma se f = [, ] (con 6 < 6 2), il primo membro di (7.61) vale
( ) (1) + (2 ( )) (0). Daltra parte, in questo caso la funzione
di distribuzione vale mf () = 2 ( ) se 6 1 e 2 se > 1: pertanto
il secondo membro di (7.61) coincide col primo.

In particolare, per ogni p > 0, la funzione 7 p misurabile non


negativa, e quindi:
Corollario 7.7.4. Per ogni funzione f misurabile,
Z

7.7.2

2
p

|h(x)| dx =

p dmf () .

Lo spazio Lp debole

Definizione 7.7.5. Lo spazio Lp debole Sia 0 < p < e f una funzione


misurabile su [(0, 2]. Si dice che f di tipo Lp debole se esiste C > 0 tale
che, per ogni > 0,
C
m+
|f | () 6 p ,

ossia m|f | () > 2

C
,
p

ossia ancora
m {t : |f (t)| > } 6

C
.
p

Lo spazio vettoriale delle funzioni di tipo Lp debole si denota con Lpw .


Lemma 7.7.6. Per ogni 0 < r < p si ha Lp Lpw Lr .
Dimostrazione. Proviamo dapprima linclusioneRLp Lpw per ogni 0 < p <

. Sia f Lp . Allora m+
|f | () = 2 m|f | () = dm|f | (x) dx, perch m|f |
tende a 2 quando la variabile tende a innito. Pertanto, per il Corollario
7.7.4,

2 m|f | () 6

xp dm|f | (x)
6

x dm|f | (x) =

|f (x)|p dx < . (7.62)

670

CAPITOLO 7.

COMPLEMENTI SULLE SERIE DI FOURIER

Questo prova che f in Lp , ed anche che


p
2 m|f | () = m+
.
|f | () = O(

(7.63)

(questultimo risultato vale per 0 < p < , ma per p > 1 banale).


r
p
Ora sia 0 < r < p e f in Lpw . La Proposizione
R 2 1.17.1r assicura
R cher L L .
Lo stesso Corollario di prima implica che 0 |f (t)| dt = 0 x dm|f | (x).
Spezziamo lultimo integrale nei domini [0, 1] e (1, ). Il primo pezzo si
maggiora cos:
Z
1

xr dm|f | (x) 6 m|f | (1) 6 2 .

Integriamo laltro pezzo per parti (in base al Corollario 1.28.16) ed utilizziamo
la notazione m+
|f | = 2 m|f | introdotta nella parte (ii) della Denizione
7.7.1:
Z
Z
r
x dm|f | (x) =
xr dm+
|f | (x)
1
1
Z
 r

r
m+
= x 2 m|f | (x) 1 +
|f | (x) d(x ) .
1


Poich r < p, sappiamo da (7.63) che xr 2 m|f | (x) = xr m+
|f | (x) =

rp
r
O(x ), e quindi limx x 2 m|f | (x) = 0. Pertanto il termine di bordo
dellintegrazione per parti si maggiora cos:


0 6 xr 2 m|f | (x) 1 = 2 m|f | (1) 6 2 .
Allora,
sommando i due
troviamo
R 2
R pezzi in cuir abbiamo spezzato lintegrale,
r
p
|f
(t)|
dt
<
2
+
m
(x)
d(x
).
Ma
lipotesi
f

L
asserisce
che
|f |
w
0
1
m|f | (x) < Cxp .

Quindi
Z 2
Z
r
|f (t)| dt 6 2 + C
0

d(x ) = 2 + Cr

(7.64)

xrp1 dx < (7.65)

perch r p 1 < 1. Questo prova che Lpw contenuto in Lr per r < p, e


completa la dimostrazione.

7.7.

LOPERATORE CONIUGATO DI TIPO DEBOLE 1-1

671

Esercizio 7.7.7. Mostriamo che entrambe le inclusioni nel precedente Lemma


??p
sono strette. Ad esempio, per ogni p si consideri la funzione fp che vale
p
1/ |t| in [, pi], si calcoli la sua funzione di distribuzione, si esamini la
convergenza dellintegrale improprio e si verichi che questa funzione appartiene a Lpw ma non a Lp : questo mostra che la prima inclusione stretta. Si
verichi anche che questa funzione non appartiene a Lsw per nessun s > p.
Ne segue che, per ogni 0 < r < t < p si ha Lp
Lpw
Ltw
Lr , e quindi
anche la seconda inclusione stretta.

Esercizio 7.7.8. Si dia una dimostrazione diretta della disuguaglianza m+


|f | () =
p
p
O(1/ ) per 1 6 p < e f L (T).
Svolgimento. Scriviamo E := {t : |f (t)| > }, cosicch m+
|f | () = m(E ), e
spezziamo lintegrale come
Z 2
Z
Z
Z
p
|f (t)| dt =
+
>
|f (t)|p dt > p m(E ) ,
0

T\E

T\E

da cui lenunciato.

Riformuliamo il precedente Corollario 7.7.6 in termini di norme.


Definizione 7.7.9. (Norma Lp debole.) Deniamo la norma di f Lpw
come la pi piccola costante C > 0 tale che m ({f (t) > }) 6 Cp , ossia
kf k(w)
=
p

sup p m+
|f | ()
>0

 p1

Si noti che questa norma una funzione omogenea per moltiplicazione per
scalari positivi, ma verica la disuguaglianza triangolare (e quindi una vera
norma) solo per p > 1, esattamente come succede per la norma Lp .
Corollario 7.7.10. Esistono costanti K1 , K2 che dipendono solo da r e p
(w)
tali che, per ogni f Lp e per 0 < r < p, si ha kf kr 6 K1 kf kp 6 K2 kf kp .
Dimostrazione. La prima disuguaglianza segue direttamente dalla stima
(7.62), la quale asserisce che
Z
p
m|f | () 6
|f (x)|p dx = 2 kf kpp ,
0

672

CAPITOLO 7.

COMPLEMENTI SULLE SERIE DI FOURIER

(w)
da cui kf kp 6 p 2 kf kp .
Per quanto concerne la seconda disuguaglianza, osserviamo anzitutto che, se
(w)
f appartiene a Lpw , per denizione si ha m+
|f | (1) 6 kf kp . Inoltre, in base
(w)

a (7.64), lestremo inferiore delle costanti C in (7.65) esattamente kf kp .


Pertanto (7.65) diventa


Z 2
Z
r
r
+
(w)
rp1
kf k(w)
|f (t)| dt 6 m|f | (1) + kf kp r
x
dx = 1 +
p .
p

r
0
1
Quindi
kf krr

7.7.3

1
=
2


|f (t)| dt 6 1 +
r

r
pr

kf k(w)
p .

Loperatore coniugato di tipo debole 1-1

Definizione 7.7.11. Un operatore T denito su L1 (T) si dice di tipo debole


1-1 se manda L1 in L1w , ossia se, per ogni f L1 ,
m {t : |T f (t)| > } 6 C

kf k1
.

Teorema 7.7.12. Loperatore coniugato di tipo debole 1-1 (nel senso della
precedente Definizione 7.7.11). In altre parole, esiste una costante K > 0
(w)
tale che kfk1 6 K kf k1 , nel senso della norma L1 debole introdotta nella
Definizione 7.7.9.
Dimostrazione. Per ogni > 0, si consideri la seguente mappa conforme,
strettamente imparentata al nucleo di Cauchy della Denizione 7.6.15:
w(z) = 1 +

z
.
z+

Si osservi che la funzione z 7 z


manda ogni numero immaginario in un
z+
numero complesso di modulo 1 (esercizio), e manda in 0, quindi, essendo conforme (olomorfa con inversa olomorfa), manda il semipiano destro
H := {z : Re z > 0} nel disco U di raggio 1 con centro lorigine. Pertanto la funzione w manda il semipiano H nel disco U = 1 + D di raggio
1 con centro in w = 1. Inoltre, vale la seguente asserzione, che il lettore

7.7.

LOPERATORE CONIUGATO DI TIPO DEBOLE 1-1

673

pu facilmente vericare: la funzione w manda il settore circolare illimitato J := {|z| > , Re z > 0} nella met destra U+ del disco U, ovvero
U+ = {z U : Re z > 1}.
Supponiamo dapprima f > 0 e limitata, e normalizziamo, scegliendo kf k1 =
R 2
1
f (t) dt = 1.
2 0
Consideriamo la funzione G olomorfa sul disco unitario D i cui valori al
bordo sono g = f + if (lolomora fu provata nel Corollario 7.6.17) e nella Proposizione 7.6.22. Poich G olomorfa in D, segue dalla formula di
rappresentazione di Cauchy (Corollario 2.5.1), o anche dalla propriet della
media (Corollario 7.6.21), che
Z 2
Z 2
1
G(0) =
(f (eit ) + if(eit )) dt = 1 ,
g(t) dt =
2 0
0
perch, in base al Corollario 7.6.18 o anche 7.6.24, il valor medio di f, ossia
b
f(0), vale 0 (si noti che in questa dimostrazione il far ricorso a funzioni
olomorfe da integrare sul cerchio di raggio 1 ci obbliga a scrivere le variabili
di f e f in forma complessa).
Inoltre w g composizione di funzioni olomorfe, quindi olomorfa in U, ed
allora, sempre per la formula di rappresentazione di Cauchy o la propriet
della media,

Z 2 
1
1
g(ei t)
w(1)w(G(0)) = 1 +
dt .
(7.66)
=
1+
1+
2 0
g(ei t) +
Poniamo ora



o
it
f (e ) > .




Poich |g| > | Im g| = |f|, su E vale anche f(eit ) > . Allora, in base allasserzione allinizio di questa dimostrazione, su E lintegrando 1 +
(g(ei t) /g(ei t) + ) ha valori in U+ , ossia ha parte reale non inferiore a 1.
Daltra parte, al di fuori di E questo integrando ha parte reale non negativa,
perch i suoi valori sono del tipo w(g(eit )) con Re g(eit ) = f ((eit )) > 0, ed
abbiamo osservato allinizio della dimostrazione che g manda il semipiano destro nel disco con centro 1 e raggio 1 , che contenuto nel semipiano destro.
Ma allora




Z 2
Z
g(ei t)
g(ei t)
Re 1 +
dt >
Re 1 +
dt > m(E) .
g(ei t) +
g(ei t) +
0
E
n
E := t (0, 2] :

674

CAPITOLO 7.

COMPLEMENTI SULLE SERIE DI FOURIER

Pertanto, da (7.66),
1
1
2
=1+
>
m(E) .
1+
1+
2

(7.67)

Ora eliminiamo lipotesi che f abbia valor medio 1, sostituendola con


lipotesi che abbia valor medio minore o uguale a 1. In tal caso, lintegrale
in (7.66) vale
fb(0)
= w(fb(0))
1+
fb(0) +

che nel disco U H dal momento che abbiamo supposto fb(0) [0, 1] H.
Quindi lo stesso argomento prova la disuguaglianza (7.67) anche in questo
caso.
Ora eliminiamo lipotesi che f sia non negativa, ma supponiamo f a valori
reali. Allora f = f+ f , la dierenza fra le sue parti positiva e negativa,
che sono a supporto disgiunto, e f = f+ f : queste due ultime funzioni non
sono a supporto disgiunto, ma se |fn| > allora o |f+ | > /2 oo|f | > /2 (o


entrambe). Allora poniamo E := t (0, 2] : f (eit ) > 2 , ed abbiamo
E E+ E . Inoltre, kf+ k1 6 kf k1 6 1, ed analogamente per kf k1 .
Allora, in base alla disuguaglianza (7.67), si ha
m(E ) 6

4
1 + 2

16
4
e pertanto m(E) 6 2 1+
= 2+ .
2
Ora eliminiamo lipotesi che f sia a valori reali: scrivendo f = Re f + i Im f
32
e ripetendo il ragionamento troviamo ora m(E) 6 2+
.
Ora eliminiamo la normalizzazione kf k1 6 1: applichiamo lultima disuguaglianza a h = f /kf k1 ed otteniamo


)!
(

f
32


6
(eit ) >
m(E) = m
t (0, 2] :


kf k1
2+

ossia



o
32


kf k1
t (0, 2] : f(eit ) >
> 2
2+
Questo
il teorema per funzioni f L : esiste una costante C tale

dimostra


che f(eit ) 6 tranne che su un sottoinsieme di T di misura inferiore a
m

n

7.7.

LOPERATORE CONIUGATO DI TIPO DEBOLE 1-1

675

Ckf k1 /.
Ora eliminiamo lipotesi di limitatezza: poich L (0, 2] denso in L1 (0, 2]
(Lemma 1.18.3, o anche Proposizione 1.18.6), esiste una successione fn L
che converge a f nella norma L1 : in particolare converge puntualmente quasi
ovunque. Pertanto,




o
o
n
n
it
it
.
m t (0, 2] : f (e ) >
m t (0, 2] : fn (e ) >

Ma kfn k1 kf k1, e quindi la dimostrazione si estende a tutte le funzioni in


L1 .

Dal Corollario 7.7.10 ora segue:

Corollario 7.7.13. Per ogni f L1 (T) e per ogni r < 1 si ha kfkr 6


(w)
K1 kfk1 6 K kf k1.

7.7.4

Loperatore coniugato manda L log L in L1

La dimostrazione del teorema principale in questa Sottosezione tratta da


[13, Chapter 4, Section 3]. Per una dimostrazion3 che utilizza solo le funzioni
di distribuzione, e quindi lanalisi reale, si veda [14, Chapter III, Theorem
1.7].
Abbiamo visto che loperatore coniugato una isometria di L2 = L2 (T)
(Corollario 7.6.26) e manda Lp in Lp se 1 < p < (Corollario 7.6.38), ma
che solo di tipo debole 1-1, invece che limitato su L1 . Daltra parte, ora
mostriamo che f in L1 se f appartiene ad uno spazio non molto pi piccolo
di L1 .
Definizione 7.7.14. Poniamo log+ (x) := max{0, log x}, e deniamo lo spazio L log L come lo spazio vettoriale delle funzioni f su T tali che kf log+ |f |k1 <
. Evidentemente, se f limitata, f L1 se e solo se f L log L. Invece,
nelle zone in cui f illimitata, il termine
logaritmico diverge e rendeR pi
R
dicile la convergenza dellintegrale |f | log+ |f | rispetto allintegrale |f |.
Perci L log L contenuto in L1 .
R 2
Nota 7.7.15. La quantit 0 |f | log+ |f | dx non una norma, perch si annulla sulla funzione di valore costante 1. Per esprimere il concetto che un
operatore lineare manda L log L a L1 non possiamo quindi dimostrare una
disuguaglianza del tipo kT f k1 < Ckf log+ |f |k1: dobbiamo invece dimostrare la disuguglianza kT f k1 < A + Bkf log+ |f |k1 per opportune costanti
A, B > 0.

676

CAPITOLO 7.

COMPLEMENTI SULLE SERIE DI FOURIER

Teorema 7.7.16. Loperatore coniugato manda L log L in L1 : ovvero, esistono A, B > 0 tali che, per ogni f L log L,
Z
Z

|f | 6 A + B |f | log+ |f |, .
(7.68)
T

Viceversa, se f L1 per qualche f L1 , f > 0, allora

|f | log+ |f | < .

Dimostrazione. Osserviamo che, se f L log L, anche Re f e Im f appartengono a L log L, perch dominate in modulo da |f |. Inoltre, f =
Re f +itildeIm f per linearit. Quindi, se il risultato vale per tutte le funzioni
a valori reali, allora vale per qualsiasi f L log L. Quindi possiamo limitarci
a dimostrarlo per funzioni a valori reali. ovvio che, se il risultato vale per
f , allora vale anche per f : quindi, per lo stesso argomento, seprando ogni
funzione a valori reali come la somma a supporto disgiunto della sua parte
positive e negativa, possiamo limitarci a dimostrare il teorema per funzioni
non negative.
Inizialmente facciamo unulteriore ipotesi, che fra poco rinforzeremo ma alla
ne elimineremo: ossia f > 1. In tal modo la funzione log+ |f | diventa log f .
Come nella dimostrazione del Teorema 7.6.36, consideriamo la funzione olomorfa g = f + if nel disco unitario complesso D, e scriviamo la variabile
x T come x = eit , e z D come z = r eit . Rammentiamo anche che,
con questa notazione, f(0) := f(z)|z=0 = 0 (Corollario 7.6.18). Come allora,
anche qui g olomorfa in D e Re g = f > 0, quindi g ha valori nel semipiano
destro. Possiamo allora denire log g utilizzando il ramo principale del logaritmo complesso (quello che coincide con il logaritmo reale in (0, ) ed il cui
dominio di olomora C \ (, 0]). In particolare, log g olomorfa su D
perch composizione di funzioni olomorfe. Allora g log g anchessa olomorfa
in D, e segue dalla formula di rappresentazione di Cauchy (Corollario 2.5.1),
o anche dalla propriet della media (Corollario 7.6.21), che
Z 2
1
g log g(eit ) dt = g(0) log g(0) = 2f (0) log f (0)
2 0
perch g(0) = f (0) := f (z)|z=0 in quanto f(z)|z=0 = 0. Poich f > 1, ora
R 2
R 2
abbiamo f (0) log f (0) > 0, e 0 g log g(eit ) dt = 0 Re (g log g) . Scriviamo
g(z) = f (z) + if(z) = |g(z)|eiy(z) , ossia
y = arctan

f
.
f

(7.69)

7.7.

LOPERATORE CONIUGATO DI TIPO DEBOLE 1-1

677

Osserviamo che il fatto che g abbia


Allora Re (g log g) = f log |g| y f.
valori nel semipiano destro implica che /2 6 y 6 /2, ed inoltre, per
(7.69), y > 0 se e solo se f > 0, ossia y f > 0.
Riassumendo, y f > 0 e
Z 2 
Z 2

it

f log |g| y f (e ) =
g log g(eit ) dt = 2f (0) log f (0) > 0 ,
0

e quindi

(7.70)

Z
1 2
f log(f 2 + f2 t) .
(7.71)
f log |g| =
2
0
0
0
Scriviamo per semplicit f = a e |f| = b, ed osserviamo che lultimo integrando a log(a2 + b2 ). Per b = 0 questa espressione vale 2a log a, ed crescente
al crescere di b > 0, con derivata rispetto a b data da 2ab/(a2 + b2 ) 6 1.
Da questo segue che, per b > 0, lintegrando a log(a2 + b2 ) dominato
dallespressione lineare 2a log a+b. Pertanto la disuguaglianza (7.71) diventa
Z 2
Z 2
Z
1 2

yf 6
f log f +
|f | .
(7.72)
2 0
0
0
Z

y f 6

Ora rinforziamo lipotesi f > 1 richiedendo di pi: f > e.


Sappiamo
che largomento y di g varia in [/2, /2]. Spezziamo lintegrale
R 2

|f | nei due domini E+ :=!y| > /4 e E := |y| < /4. In base a (7.69),
0
ci signica E = {t : |f(eit )| < f (eit )} ed E + = {t : |f(eit )| > f (eit )}.
Allora
Z
Z
Z
Z

f 6 f 6 f log f
|f | 6
E

(lultima disuguaglianza vale perch log f > 1, dal momento che abbiamo
assunto f > e). Daltra parte, su E+ si ha y > /4 e quindi, rammentando
che y f sempre non negativo,

Z
Z
Z 
Z
4
4
1
4

yf 6
yf 6
f log f + |f |
|f | 6
E+
T
T
2
E+

(lultima disuguaglianza segue da (7.72). Sommando le due ultime disuguaglianza si ottiene a primo membro lintegrale di f, che per compare anche
a secondo membro: portando questo contributo a primo membro si trova
Z 2
Z 2

(1 f rac2)
f 6 (1 + f rac4)
f log f ,
0

678

CAPITOLO 7.

COMPLEMENTI SULLE SERIE DI FOURIER

ossia, scrivendo B = (1 + f rac4) /(1 f rac2) > 0,


Z 2
Z 2
f 6 B
f log f .
0

(7.73)

Inne, eliminiamo lipotesi f > e, ma mantenendo, senza perdita di generalit, lipotesi f > 0. Per le funzioni f che non soddisfano f > e, poniamo
f+ = max{f, e}, f = min{f, e}: pertanto |f | 6 e. Ssia K+ := {t :
f (eit ) = f+ (eit )} = {|f | > e} e K = {|f | 6 e}. Allora f = f+ + f per
linearit, e basta stimare gli integrali di questi due addendi. Ora, f+ verica
lipotesi f+ > e sotto la quale valida la disuguaglianza 7.73). Da questo e
dal fatto che, su K , si ha f+ e f+ log f+ , segue

Z
Z 2
Z 2

f+ 6 B
f log f + e m(K )
f+ log f+ 6 B
0

K+

6B

f log f dt + 2Be .

Daltra parte, loperatore coniugato una isometria su L2 (Corollario 7.6.26),


e la norma L2 sui compatti domina la norma L1 : quindi segue dalle disuguaglianze 0 6 f 6 e che
Z 2
1
f 6 kf kL2 [0,2) 6 e .
2 0

Da queste ultime due disuguaglianze segue la stima (7.68) dellenunciato.


Inne, proviamo lultima asserzione dellenunciato, ossia che, se f > 0

e f L1 , allora f L log L. Per questo suciente assumere che f > 1,


perch, se aggiungiamo a f una costante positiva c > 0, la funzione coniugata
f non cambia, in quanto il prolungamento olomorfo sul disco D della costante
c ancora la costante c, e quindi la parte immaginaria del prolungamento
nulla. Allora assumiamo f > 1, quindi 0 6 log f 6 |g|. Allora, in base alla
identit (7.70) (che fu provata proprio sotto lipotesi f > 1), si ha
Z 2
Z 2
f log f 6
f log |g|
0

= 2f (0) log f (0) +

y f

6 2f (0) log f (0) +


2

|f| ,

7.8.

APPENDICE: IL TEOREMA MASSIMALE DI HARDYLITTLEWOOD679

perch |y(eit )| 6 2 per ogni t. Quindi f log+ f L1 .

7.7.5

Loperatore coniugato come operatore integrale


singolare

Appendice: il teorema massimale di Hardy


Littlewood

7.8
7.8.1

Operatori massimali

Definizione 7.8.1. Funzioni massimali ed operatore massimale di


HardyLittlewood
(i) La funzione massimale di f L1 (T) la funzione
Z t+s

1

Mf (t) := sup
f (u) du ,
0<s6 2s ts

indicata talvolta anche con il simbolo f .


Loperatore M : f Mf si chiama loperatore massimale di Hardy
Littlewood.

(ii) Data f L1 (T), indichiamo ora la variabile t T in notazione complessa, t = eix , e denotiamo con f la funzione massimale radiale
Z 2



ix
ix
i(xs)
is
f (e ) := sup |Pr f (e )| sup
P (r, e
) f (e ) ds ,
0<r<1

0<r<1

dove P (r, eix ) Pr (eix ) il nucleo di Poisson (Denizione 6.2.8).

Nota 7.8.2. (i) A causa dellestremo superiore nella precedente Denizione


7.8.1, gli operatori massimali sono sublineari: se f = g + h allora
Mf 6 Mg + Mh , ed analogamente per f .
(ii) Evidentemente, gli operatori massimali sono monotni, nel senso che,
se 0 6 f 6 g, allora 0 < Mf 6 Mg , ed analogamente f 6 g .

680

CAPITOLO 7.

COMPLEMENTI SULLE SERIE DI FOURIER

Proposizione 7.8.3. Per ogni f L1 , f 6 f Mf (notazione della


precedente Definizione 7.8.1), e (ritornando alla notazione complessa per la
funzione coniugata sul disco unitario) f(r eit ) 6 Mf (t).
Dimostrazione. Ritornando momentaneamente alla notazione in cui i punti di
T sono rappresentati da angoli fra 0 e 2, osserviamo che f = sup0<r<1 |Pr f |
R 2
e Pr f () = 0 P (r, ei(s) ) f (eis ) ds. Ma Pr una funzione continua di
integrale 1, pari, non negativa e decrescente fra 0 e . Scindendo la sua
immagine (un sottoinsieme di R+ ) in intervalli di diametro arbitrariamente
piccolo, vediamo che Pr si approsima uniformemente con funzioni a gradini,
e quindi con combinazioni convesse di funzioni caratteristiche normalizzate
1
[s, s] . Ma allora lenunciato segue direttamente dalla Denizione
del tipo 2s
7.8.1.
Per la seconda asserzione, applichiamo lo stesso ragionamento osservando
che f(r eit ) = Pr f(eit ) (Proposizione 7.6.20 e Proposizione 7.6.22).

7.8.2

Limitatezza delloperatore massimale di Hardy


Littlewood

Teorema 7.8.4. (Teorema massimale di HardyLittlewood.) Loperatore massimale di HardyLittlewood f Mf di tipo debole 1-1 (Definizione
7.7.11).
Dimostrazione. Sia E := {t : |Mf (t) > }. Dobbiamo mostrare che, se
f in L1 , allora Mf in L1 debole, ovvero che, per ogni > 0, si ha
m(E ) 6 Ckf k1 / per qualche costante C > 0 che non dipende da f .
Poich 0 6 Mf 6 M|f | per la sua denizione (parte (i) della Denizione
7.8.1), senza perdita di generalit assumiamo f > 0. Sia t T tale che
Mf (t) > : allora, ancoraR per denizione, esiste un intervallo aperto Bt
1
f (s) ds > , ossia
centrato in t tale che m(B
t ) Bt
Z
1
f (s) ds .
m(Bt ) <
Bt

Questi intervalli Bt costituiscono quindi un ricoprimento di E . Allora, per il


Lemma di ricoprimento di Vitali (Lemma 1.24.3), esiste un sottoricoprimento
numerabile (che con abuso di notazione indichiamo ancora con {Bn }) tale che
Z
Z
4
4
f (s) ds 6
f (s) ds , (7.74)
m(E ) 6 m (t Bt ) 6 4m (n Bn ) 6
Bn
T

7.8.

APPENDICE: IL TEOREMA MASSIMALE DI HARDYLITTLEWOOD681

e questa la disuguaglianza voluta.


Lemma 7.8.5. Per ogni f L1 (T),
4
m ({t : Mf > 2}) 6

t dm|f | (t) .

(La notazione + al bordo inferiore di integrazione necessaria perch la


misura dm|f | associata alla funzione f potrebbe avere un atomo al punto :
si consideri ad esempio il caso in cui f abbia punti di salto).
Dimostrazione. Sia J := {t : f (t) > }, e scriviamo h := f |J , g := f |J ,
cosicch f = h + g e pertanto Mf 6 Mg + Mh come osservato nella parte
(i) della Nota 7.8.2. Ma g ha supporto in J ed ivi coincide con f , quindi
Mg 6 dappertutto, per la parte (ii) della stessa Nota. Quindi Mf 6 +Mh ,
ed allora Mh > se Mf > 2. Pertanto, in base alla disuguaglianza (7.74),
Z
Z
4 2
4
m ({t : Mf > 2}) 6 m ({t : Mh > }) 6
|h(s)| ds =
t dm|f | (t) .
0
+
(Al bordo inferiore di integrazione abbiamo + perch h coincide con f solo
laddove |f | maggiore di ).

Teorema 7.8.6. Per 1 < p < , loperatore massimale di HardyLittlewood


limitato su Lp . Se f in L log L, ossia f log+ |f | L1 , allora Mf in L1 .
Dimostrazione. Come in tutte le precedenti dimostrazioni, spezzando f come
somma di due funzioni reali non negative e due immaginarie non negative, ci
riduciamo, senza perdita di generalit, al caso f > 0.
Dimostriamo dapprima che Mf manda Lp in Lpw .
Indichiamo per semplicit con f la funzione massimale di HardyLittlewood
di f L1 (T). Dal Lemma 7.8.5,
Z
4
+
mf (2) 6
t dm|f | (t) .
(7.75)
+
Se t > , la funzione p 7 (t/)p crescente, Re quindi il lato destro della

precedente disuguaglianza si maggiora con 4( )p + tp dm|f | (t) per ogni p > 1,


e ne risulta
Z
4 p p
+
t dm|f | (t) .
(7.76)
2 mf (2) = mf (2) 6 )
(
+

682

CAPITOLO 7.

COMPLEMENTI SULLE SERIE DI FOURIER

Poich f Lp (T) L1 (T), questo integrale converge, e quindi tende a zero


per . Pertanto
lim p m+
f (2) = 0 .

(7.77)

Quindi f Lp , direttamente dalla Denizione 7.7.5.


Ora proviamo lasserzione pi forte che f in Lp . In base al Corollario 7.7.4,
kf kpp

1
=
2

1
|f (x)| dx =
2

2p
dmf () =
2
p

p dmf (2) .

(7.78)

Integriamo lultimo integrale per parti (Corollario 1.28.16):


Z

dmf (2) = [ ((2

mf (2))]
0

pp1 (2 mf (2)) d .

(7.79)
Il termine di bordo al lato destro si annulla grazie a (7.77), e quindi, da
(7.75):
Z

dmf (2) =

6 4p

pp1 (2 mf (2)) d

p2

t dm|f | (t) d .

Ora supponiamo p > 1, e scambiamo lordine di integrazione nellultimo


integrale (il cui integrando non negativo, e quindi si applica il Teorema di
Fubini 1.20.4 (ii). Per p > 1 si ottiene un integrale convergente:
Z

p2

t dm|f | (t) d =

1
p1

t
0

p2 d t dm|f | (t)
tp dm|f |(t) =

2
kf kpp
p1

(lultima disuguaglianza segue di nuovo dal Corollario 7.7.4). Questo dimostra la limitatezza delloperatore massimale su Lp per 1 < p < .
Veniamo al caso p = 1. Riscriviamo in questo caso le stime (7.78) e (7.79),
scambiando lordine di integrazione ed utilizzando come sempre il Corollario

7.8.

APPENDICE: IL TEOREMA MASSIMALE DI HARDYLITTLEWOOD683

7.7.4, e troviamo
Z
Z
2
1

dmf () =
dmf (2)
kf k1 =
2 0
2 0
Z 1 Z 
Z
1
1
=
(2 mf (2)) d 6
+
0

0
1
Z
Z Z
1
4
1
(2 mf (2)) d 6 2 +
t dm|f | (t) d
62+
1
1 +
Z
Z
Z t
4
4
d
t
t log t dm|f | (t)
=2+
dm|f | (t) = 2 +
1
1
1
Z
4
=2+
|f | log |f | dx .
T
Questo dimostra la seconda asserzione dellenunciato.

7.8.3

Limitatezza delloperatore coniugato massimale


radiale

Notazione 7.8.7. (Operatore coniugato massimale radiale.) Combinando la denizione di funzione coniugata e quella di funzione massimale radiale f (Denizione 7.8.1), otteniamo funzione coniugata massimale radiale
la funzione
f (eit ) := sup f(r eit )
0<r<1

Corollario 7.8.8. Per 1 < p < e f Lp (T), esiste una costante Cp che
non dipende da f tale che kf kp < Cp kf kp .
Dimostrazione. Rammentando che |f(r eit )| 6 Mf(t) e supr |h(r eit )| 6 Mh (t)
otteniamo |f (eit )| 6 Mf(t) (Proposizione 7.8.3). Pertanto, se f Lp , allora
kf kp < kMfkp < Akfkp < Bkf kp
per opportune costanti A e B, in base alla prima parte del Teorema 7.8.6 ed
al Teorema di marcel Riesz 7.6.36.

684

7.9

CAPITOLO 7.

COMPLEMENTI SULLE SERIE DI FOURIER

Insiemi di divergenza puntuale di serie di


Fourier

In questa Sezione, seguendo [4] e [13, Chapter 1, Section 9], diamo una dimostrazione elementare della disuguaglianza di HausdorYoung (Teorema
7.9.1), che verr poi riproposta nella Sezione ?? nel consueto ambito naturale, come conseguenza di un pi sosticato risultato di analisi complessa,
il teorema di interpolazione di Riesz-Thorin (Teorema ??): la presente dimostrazione utilizza esattamente le stesse idee, ma le formula in un contesto
semplicato meno generale e faticoso.
Cominciamo con il rammentare le seguenti due propriet ben note che valgono sia per la trasformata di Fourier, sia per la successione dei coecienti
di Fourier: kfbk2 = kf k2 (teorema di Parseval, Nota 4.3.3, e teorema di
Plancherel, Corollario 8.5.2), e kfbk 6 kf k1 (Proposizione 8.2.3). Vogliamo
interpolare queste disuguaglianze per tutti i q fra 2 e , per ottenere:

Teorema 7.9.1 (HausdorYoung). Per 2 6 q 6 , ponendo p = (1


1 1
) lindice coniugato di q (Definizione 1.16.4), che varia fra 1 e 2, vale la
q
disuguaglianza
kfbkq 6 kf k2 p ,
dove f Lp (T), e {fb} la successione dei coefficienti di Fourier e la norma
kfbkq quella di q (la stessa disuguaglianza vale anche per funzioni f p (R)
e fb la trasformata di Fourier, e la dimostreremo in seguito nel Capitolo
?? sugli approfondimenti sulla trasformata di Fourier e linterpolazione di
operatori).
Dimostrazione. Anzitutto, chiaro che basta provare la disuguaglianza per
tutti i polinomi trigonometrici F tali che kf kp = 1, perch essi sono densi in
Lp (T) (Corollario 5.13.8) e perch la disuguaglianza in oggetto invariante
per normalizzazione. Limitiamoci quindi a tali funzioni. Scriviamo, come
dabitudine cn = fb(n: allora, per la Denizione 3.3.5 di norma di funzionale
lineare e per il fatto che il duale di q isometricamente isomorfo a p (Teorema 1.19.6).
La disuguaglianza k{cn }kq 6 1 equivale alla seguente: per ogni successione
{dn } tale che k{dn }kp = 1,

X



|h{cn }, {dn }i|
cn d n 6 1 .
(7.80)
n=

7.9. INSIEMI DI DIVERGENZA PUNTUALE

685
1

Separando modulo e fase, scriviamo f = F p E, dn = Dnp en , con |En | = |en | =


1, F , Dn > 0 e
(7.81)
(7.82)

kF k1 = 1
k{Dn }k1 k = 1 .

Il primo membro di (7.80)




Z 2

X 1
1
1


F p (t) E(t) eint dt = .
Dnp en



2 0
n

La serie a secondo membro in realt una somma nita, perch il polinomio


trigonometrico f ha un numero nito di coecienti di Fouier non nulli, e
quindi ha una estensione olomorfa, che si ottiene sostituendo a 1/p la variabile
z C:
Z 2
X
1
z
H(z) =
Dn en
F z (t) E(t) eint dt .
2 0
n

Poich p > 2 si ha 1/2 6 1/p 6 1, e possiamo restringere lattenzione alla


striscia 1/2 6 Re z 6 1. Scriviamo z = x + iy. Portando il modulo dentro
somma ed integrale troviamo
Z
X
x 1
|F x )| dx ,
(7.83)
|H(x + iy)| 6
|Dn |
2
n

e da questo segue che |H(x + iy)| limitato uniformemente rispetto a y.


Infatti, ciascuno degli addendi di H(1+iy)| limtato da 1 perch |H(1+it)| 6
R 2
P
1
|D
|
|F (t)| dt 6 1 grazie a (7.81). Allora, per 1/2 6 x 6 1, ciascun
n
n
2 0
R 2
R 2
addendo ancora limitato perch 0 |F x (t)| dt 6 0 |F (t)| dt in base alla
Proposizione 1.17.1 sulle inclusioni fra spazi Lp sui compatti. Quindi tutti
gli addendi di |H| sono limitati nella striscia 21 6 z 6 1, e poich c solo un
numero nito di addendi anche H limitata in tale striscia.
Ora, per x = 1/2, miglioriamo (7.83) grazie alla disuguaglianza di Cauchy
1
(Proposizione 4.5.1), che, se poniamo g := F 2 +it E, conduce a
! 21


2 ! 21

X 1 Z 2 1
X



1
+it
ins

H
6

2
F
+
it
D
(s)
E(s)
e
ds
n




2
2
0
n
n
=

X
n

Dn

! 21

X
n

|b
g |2 (n)

! 21

= kF 2 +it k2 = kF 2 k2 = 1 ,

686

CAPITOLO 7.

COMPLEMENTI SULLE SERIE DI FOURIER

in base allidentit di Parseval (Nota 4.3.3) ed a (7.81).


Pertanto La funzione olomorfa H limitata nella striscia 21 6 z 6 1 e limitata
da 1 ai bordi della striscia. Pertanto limitata da 1 in tutta la striscia, per il
Teorema di PhragmnLindelf 2.15.2. In particolare, limitata per z = 1/p,
e questa asserzione lenunciato del presente teorema.

Capitolo 8
La trasformata di Fourier
8.1

La trasformazione da spettro discreto a spettro continuo: introduzione intuitiva alla trasformata di Fourier

Studiamo un segnale acustico emesso in una stanza. Per semplicit supponiamo che la stanza sia cubica di lato L. Il suono composto di onde
acustiche: onde di pressione nel mezzo che lo conduce, in questo caso onde
di compressione e rarefazione dellaria. Per non tutte queste onde si possono mantenere in maniera stazionaria in una stanza con muri rigidi i quali
quindi non possono essere spostati dalla pressione acustica. Le onde hanno andamento sinusoidale: si preservano solo quelle con punti nodali (cio
ssi, senza variazione al variare del tempo) esattamente in corrispondenza
dei muri. Indichiamo con x la posizione nella stanza, dal muro di sinistra
a quello di destra. Supponiamo
 che lampiezza massima al punto x della
pressione acustica sia sin 2
x
, dove R una costante che rappresenta

la lunghezza donda. Per ora un numero reale qualsiasi. Ora imporremo


che londa abbia punti nodali (cio stazionari) sulle due pareti: su quella
di

2
sinistra questa richiesta automaticamente vericata perch sin x si annulla per x = 0. Invece, imporre che si abbia un punto nodale per un x 6= 0
(ad esempio, x uguale alla distanza L fra le due pareti) signica imporre una
restrizione a : vediamo quale. Al variare del tempo la pressione
acustica al

2
punto x varia in modo oscillatorio
entro
i
valori

sin
x
:
landamento
nel


2
tempo sin(t) sin x , illustrato nella gura 8.1 che mostra un periodo
687

688

CAPITOLO 8. TRASFORMATA DI FOURIER

Figura 8.1:

completo di sin

2
x

Il primo punto nodale della sinusoide si trova non dopo un periodo, ma


dopo un semiperiodo. Quindi il valore di pi elevato che corrisponde a
onde acustiche che la stanza non smorza o elimina dato dalla condizione
nodale 2
L = ( il semiperiodo della funzione sin) cio = 2L. Se c la

velocit del suono, questa lunghezza donda massima si associa alla frequenza
c
minima 0 = c = 2L
(poich c 330 m/sec, se L = 3.3 m si ha 0 = 50 Hz,
se invece L = 6.6 m allora 0 = 25 Hz e cos via).
Perci i segnali acustici che si mantengono nella stanza e non vengono
da essa ltrati (cio smorzati ed eliminati) sono quelli con componenti di
c
frequenza multiple di 0 = 2L
: uno spettro discreto che porta allo sviluppo
di Fourier del segnale:

X
f (x) =
cn ein0 x .
n=

Se il segnale acustico fosse stato ascoltato allaperto non avremmo avuto


questa discretizzazione. Per avvicinarci gradualmente allanalisi in frequenza
in un ambiente aperto possiamo immaginare di considerare sale di ascolto
via via pi grandi, cio di far crescere L in maniera illimitata. In tal modo
le frequenze ammissibili si addensano sulla retta reale. Quando L , a
cosa tende lo sviluppo discreto di Fourier visto prima?
Mostriamo in maniera intuitiva, ma non rigorosa (per ora) che esso converge ad un integrale (lintegrale di Fourier). Per un approfondimento rigoroso sul legame fra coecienti di Fourier della periodicizzazione di una funzione
ed integrale di Fourier si veda Sezione 10.2 in seguito. I risultati di questa
sezione saranno tutti ridimostrati in maniera rigorosa in questo capitolo e
nel successivo.
Teorema 8.1.1. (Teorema dellintegrale di Fourier). Se f L1 (R),

8.1. DAL DISCRETO AL CONTINUO: APPROCCIO INTUITIVO


poniamo

Se anche fe L1 (R) si ha

fe() =

689

f (s) eis ds

1
f (t) =
2

fe()eit d

Dimostrazione intuitiva. Consideriamo dapprima lo sviluppo di funzioni f


periodiche di periodo 2T ; poi faremo tendere T allinnito, come preannunciato sopra. Si ha:

f (t) =

cn eint/T

(8.1)

n=

dove

1
cn =
2T

f (s)eins/T ds

(si vedano le Sezioni 5.2 e 5.4). La serie converge almeno nel senso di L2 .
Proviamo, in maniera intuitiva, a passare al limite per T . Pi
precisamente consideriamo una funzione non periodica f in L1 (R), tale cio
che per ogni > 0 esiste T tale che
Z
|f (t)| dt < .
R\[T,T ]

In altre parole, il valore dellintegrale di f tutto ottenuto, a meno di


una tolleranza arbitrariamente piccola, limitando lattenzione allintervallo
[T, T ]. Approssimiamo f con una funzione periodica che coincide con f
in [T, T ] e poi si ripete in maniera periodica. Abusando della notazione
indichiamo ancora con f questa funzione periodicizzata. Quando T otteniamo in questo modo ogni funzione in L1 (R) con supporto in un intervallo
limitato. Scriviamo lo sviluppo di Fourier (8.1) di f in [T, T ] e passiamo al
limite.

si ha da (8.1)
Ponendo =
T
Z /
X
f (s)ein s ds ein t .
f (t) =
2 n= /

(8.2)

690

CAPITOLO 8. TRASFORMATA DI FOURIER

) la sommatoria in (8.2) diventa una


Se poniamo n = n (e quindi = n
n
somma di valori della funzione
Z n/
F () =
f (s)eis ds eit
n/

al variare di sulla successione {n = n }, una successione equispaziata di


passo . Poich questa sommatoria moltiplicata per , si ottiene cos una
somma di Riemann di F : stiamo sommando le aree di rettangoli di base
ed altezza F (n ). Quando T + si ottiene = T 0+ : la successione
si inttisce ed il secondo membro di 8.2 dovrebbe convergere a
Z Z

f (s)eis ds eit d.
2

Nel seguito di questo capitolo daremo una dimostrazione rigorosa del teorema
precedente (Teorema 8.4.2).
Notazione 8.1.2. Per f L1 (R) e R, scriviamo
Z
fb() =
f (t)e2it dt .

Cambiando variabile da a 2 nel Teorema 8.1.1 si ottiene in modo


intuitivo la seguente formula di inversione di Fourier.
Corollario 8.1.3. (Teorema dellintegrale di Fourier, ovvero Formula
di inversione per la trasformata di Fourier.)
Se f L1 (R) e fb L1 (R) allora, per ogni t R,
f (t) =

fb()e2it d .

Nota 8.1.4. In molti libri e articoli scientici la trasformata di Fourier introdotta nella Notazione 8.1.2 viene denita senza il fattore 2 allesponente.
Talvolta essa viene denita come la funzione fe del Teorema 8.1.1. In tal caso
il Teorema 8.1.1 porta alla formula di inversione
Z
1
fe()eit d.
f (t) =
2

8.2. PROPRIET DELLA TRASFORMATA DI FOURIER

691

con una normalizzazione dellintegrale di un fattore 2. Se si preferisce rendere simmetriche le formule per la trasformata di Fourier e per la sua inversa,
senza per inserire il fattore 2 allesponente, allora si deve porre
Z
1
b
f () =
f (t)eit dt , R :
2

in tal caso, segue dal Teorema 8.1.1 che


Z
1
f (t) =
fe()eit d .
2

Questa forse la denizione pi diusa di trasformata di Fourier. Noi invece


utilizzeremo la notazione 8.1.2.

8.2

Propriet della trasformata di Fourier

Definizione 8.2.1. (Trasformata di Fourier.) Come anticipato nella


Notazione 8.1.2, per f L1 (R) e R poniamo
Z
b
f () =
f (t)e2it dt .

Lapplicazione f 7 fb si chiama trasformata di Fourier e si indica con F.

Definizione 8.2.2. C0 (R) = {f : R 7 C : f continua e limt f (t) = 0} .

Proposizione 8.2.3. F : L1 (R) 7 C0 (R).

Dimostrazione. Mostriamo che, per ogni f L1 (R), fb continua. Questo


fatto segue dal Teorema di Convergenza Dominata di Lebesgue (Teorema
1.9.54). Infatti
Z




b
b
|f (t)| e2it e2i0 t dt
f () f (0 ) 6

e per ogni , 0 R lintegrando a secondo membro maggiorato dalla


funzione 2|f | L1 (R). Perci
Z


lim
|f (t)| e2it e2i0 t dt
0
Z


=
lim |f (t)| e2it e2i0 t dt = 0
0

692

CAPITOLO 8. TRASFORMATA DI FOURIER

quindi

lim fb() = fb(0 ) R.

Osserviamo inne che la propriet

lim fb() = 0.

nientaltro che il Lemma di RiemannLebesgue 5.9.6.

Le propriet seguenti sono analoghe a quelle che valgono per i coecienti


di Fourier, alcune delle quali sono state dimostrate in quellambito (si vedano
lEsercizio 5.18.4, il Lemma 5.16.1 e la Proposizione 6.1.6).

Teorema 8.2.4. (Propriet della trasformata di Fourier.) Sia f


L1 (R).
(i) |fb()| 6 kf k1 per ogni R.

(ii) Se

g(t) = f (t) := f (t) ,


allora b
g () = fb() = (fb) () per ogni R

(8.3)

(iii) Se anche fb L1 (R), allora f(s) = f (s) per ogni s R


(iv) Se h(t) = f (at), con a R, a 6= 0 allora b
h() =

1 b
f( a )
|a|

per ogni R

(v) Se h(t) = f (t t0 ), con t0 R, allora b


h() = e2it0 fb() per ogni
R

(vi) Se g(t) = e2i0 t f (t), con 0 R, allora b


g () = fb( 0 ) per ogni
R

(vii) Se f , oltre ad appartenere a L1 (R), anche derivabile con continuit e


limt f (t) = 0, allora, denotando con D loperatore di derivazione,
c definita e Df
c () = 2i fb() (generalizzeremo questa
si ha che Df
propriet nel Corollario 8.2.8)

(viii) Se g(t) = tf (t) e g L1 allora

g () =
b

1
D fb()
2i

per ogni R (ovvero, D fb() = 2ib


g ().

8.2. PROPRIET DELLA TRASFORMATA DI FOURIER

(ix) f() = f() per ogni R.


Dimostrazione.
(i) Si ha

(ii)


Z
b
f () 6



|f (t)| e2it dt =

g () =
b
=

=
=

|f (t)| dt = kf k1 .

g(s)e2is ds
f (s)e2is ds
f (t)e2it dt
f (t)e2i()t dt

(iii)

= fb()

f(s) =
=

fb()e2is d

fb()e2i(s) d

= f (s)

grazie alla formula di inversione di Fourier (Corollario 8.1.3)


(iv)
b
h() =

f (at)e2it dt

693

694

CAPITOLO 8. TRASFORMATA DI FOURIER


. Lintegrale si scrive quindi
Poniamo s = at. Se a > 0 si ha dt = ds
a
come:
Z
ds

b
h() =
f (s)e2i a s
a

1
f (s)e2i a s ds
=
a
1b
=
f( )
a a

Per ottenere la stessa formula per a < 0 basta ormai provare la formula
per a = 1. In tal caso
Z
b
h() =
f (t)e2it dt

Z
=
f (s)e2is ds
Z
=
f (s)e2is ds

fb().

(v)

b
h() =

f (t t0 )e2it dt

Poniamo s = t t0 : allora ds = dt e lintegrale diventa


Z
b
h() =
f (s)e2i(s+t0 ) ds
Z

=
f (s)e2is e2it0 ds

Z
2it0
f (s)e2is ds
= e
2it0

= e

fb().

Si confronti questo risultato con lEsercizio 5.2.10.

8.2. PROPRIET DELLA TRASFORMATA DI FOURIER

695

(vi)
g () =
b
=

e2i0 t f (t)e2it dt
f (t)e2i(0 )t dt

= fb( 0 ).

(vii) Scriviamo

c () =
Df

f (t)e2it dt

e mostriamo che lintegrale converge (la cosa non automatica perch


non si fatta lipotesi che f L1 (R)). Integrando per parti:
Z


2it
c () = f (t)e
+
f (t)(2i)e2it dt
Df

= lim f (t)(cos 2t i sin 2t )


t

lim f (t)(cos 2t i sin 2t )


t
Z
+ 2i
f (t)e2it dt .

Per ipotesi,
lim f (t) = 0.

Inoltre le funzioni sin e cos sono limitate. Quindi


lim f (t)e2it = 0

e perci
c () = 2i
Df

f (t)e2it dt

= 2i fb().

Si confronti questo risultato con il Lemma 5.16.1.

696

CAPITOLO 8. TRASFORMATA DI FOURIER

(viii) Supponiamo che g(t) = tf (t) sia in L1 (R) e mostriamo che fb derivabile e
Z
D fb() = 2i
g(t)e2it dt.

In virt della formula

fb() =

f (t)e2it dt,

(che ha senso perch f L (R), questa propriet segue dal teorema


di derivazione sotto il segno di integrale, che nel caso dellintegrale di
Riemann vale per funzioni a supporto in un intervallo di lunghezza
nita (Teorema 1.23.1), ma in generale per lintegrale di Lebesgue vale
anche su tutto R (grazie al Corollario 1.23.7) purch lintegrale
Z
f (t)e2it dt
(8.4)
1

sia uniformemente convergente rispetto al parametro (Denizione


1.23.4), e lo sia anche lintegrale della derivata, cio
Z
Z
2it
D f (t)e
dt = 2i
tf (t)e2it dt .
(8.5)

Nel nostro caso lintegrale (8.4) uniformemente convergente grazie al


fatto che f L1 (R), perch il parametro scompare quando si stima
il modulo dellintegrale e si passa il modulo sotto il segno di integrale:
per ogni > 0 esiste n = n , indipendente da , tale che
Z
Z
Z n


2it
2it

6
f
(t)e
dt

|f (t)| dt <
f
(t)e
dt

R\[n,n]

perch f L1 (R). Poich anche tf (t) L1 (R) lo stesso argomento si


applica allintegrale in (8.5).
(ix)
f() =

f(t)e2it dt

f (t)e2it dt

f (t)e2it dt = f().

8.2. PROPRIET DELLA TRASFORMATA DI FOURIER

697

Riscriviamo le formule delle propriet (vii) e (viii) del precedente Teorema 8.2.4 come segue:
Corollario 8.2.5. (Regole di commutazione fra trasformata di Fourier e derivata.) Se indichiamo con F la trasformata di Fourier, con D
loperatore di derivata e con P la moltiplicazione per il polinomio 2ix,
otteniamo le seguenti regole di commutazione:
DF = FP ,
FD = P F ,
ed iterando,
P k D l F = P k FP l FD k P l .

(8.6)

Corollario 8.2.6. (Trasformata di Fourier di funzioni pari o dispari.)


Sia f L1 (R).
(i) Se f pari, allora fb pari e
fb() = 2

f (t) cos 2t dt .

(ii) Se f dispari, allora fb dispari e


Z
b
f () = 2i
f (t) sin 2t dt .
0

(iii) Se f a valori reali, allora Re fb pari e Im fb dispari.

(iv) Se f a valori reali e pari, allora fb reale e pari; se f reale e dispari,


allora fb immaginaria e dispari.

Dimostrazione. Il fatto che se f pari, rispettivamente dispari, allora fb


pari, rispettivamente dispari, segue immediatamente dalla parte (ii) del
Teorema 8.2.4. Inoltre
Z
Z
b
f () =
f (t) cos 2t dt i
f (t) sin 2t dt

698

CAPITOLO 8. TRASFORMATA DI FOURIER

Perci se f pari il secondo integrale si annulla in quanto lintegrando


dispari, perch lo la funzione seno ed il dominio di integrazione simmetrico
rispetto allorigine. Daltra parte, il primo integrando pari, e quindi si
ottiene
Z
b
f () = 2
f (t) cos 2t dt.
0

Questo prova (i). La dimostrazione di (ii) analoga: se f dispari allora


f (t) cos 2t una funzione dispari, quindi il primo integrale si annulla,
mentre per la parit dellintegrando il secondo integrale diventa :
Z
2i
f (t) sin 2t dt.
0

La parte (iii) segue dal Teorema 8.2.4 (ix), che, per f a valori reali e per
ogni R, d luogo allidentit
fb() = f() = fb(),

dalla quale segue Re fb() = Re fb() e Im fb() = Im fb().


La parte (iv) segue immediatamente dalla (iii).

Corollario 8.2.7. (Velocit di decadimento di f = regolarit di


fb.)

(i) Se f L1 (R) a supporto compatto (cio f 0 al di fuori di un


intervallo limitato), allora fb C (R) e
Z
nb
n
D f () = (2i)
tn f (t)e2it dt.

(ii) Se per ogni n = 0, 1, . . . , m la funzione t tn f (t) in L1 (R), allora


fb C n (R) e
Z
nb
n
D f () = (2i)
tn f (t)e2it dt.

Dimostrazione.

8.2. PROPRIET DELLA TRASFORMATA DI FOURIER

699

(i) Poich f a supporto compatto, esiste a > 0 tale che f (t) = 0 per ogni
t tale che |t| > a. Perci la funzione g(t) = tf (t) verica |g(t)| 6 a|f (t)|
per ogni t, e quindi g L1 (R). Segue dalla propriet di derivazione
della trasformata di Fourier (Teorema 8.2.4 (viii)) che fb derivabile e
che D fb = 2ib
g . Ma anche g a supporto compatto, e quindi anche
g derivabile (grazie al Teorema 1.23.1 di derivazione sotto il segno di
b
integrale su un compatto). Perci fb derivabile due volte e si ha
Z
2b
2
D f () = (2i)
t2 f (t)e2it dt.

Con lo stesso ragionamento si vede che D n fb anchessa derivabile, ed


in generale
Z
nb
n
D f () = (2i)
tn f (t)e2it dt.

(ii) La dimostrazione analoga:


R anche se ora f non a supporto compatto, lintegrale improprio tn f (t)e2it dt convergente per lipotesi
che tn f (t) sia in L1 (la convergenza uniforme rispetto a : si riveda la dimostrazione della parte (viii) del Teorema 8.2.4). Il resto
dellargomento identico.

La prima parte del seguente enunciato generalizza le condizioni della


propriet della trasformata di Fourier della derivata (Teorema 8.2.4).
Corollario 8.2.8. (Regolarit di f = velocit di decadimento di
fb.)

(i) Se f L1 (R) ha derivata ovunque e f in L1 (R), allora si ha che


Rx
c () = 2i fb().
f (x) = f (0) + 0 f (t) dt, limt f (t) = 0 e Df

(ii) Se f e tutte le sue derivate fino allordine m esistono ovunque ed


appartengono a L1 (R), allora fb() tende a zero per pi
rapidamente di m .

(iii) Se inoltre f a supporto compatto, derivabile dappertutto m volte tranne che per un numero finito di punti dove f (m1) continua e derivabile
a sinistra e a destra ma f (m) ha un salto , e f (m) appartiene a L1 (R)
ed monotna a tratti, allora fb() = O( (m+1) ).

700

CAPITOLO 8. TRASFORMATA DI FOURIER

(iv) Il primo enunciato precedente continua a valere pi in generale se f


L1 (R) continua e C 1 a tratti con punti di singolarit isolati e con
derivata anchessa in L1 (R); il secondo continua a valere per le funzioni
tali che la derivata m-sima sia continua a tratti con punti di singolarit
isolati e in L1 (R)) e le prime m 1 derivate appartengono a L1 (R).

(v) La generalizzazione dei primi due enunciati precedenti fatta nella parte
(iv) vale pi in generale nel caso in cui, rispettivamente:
(generalizzazione della parte (i)): f sia assolutamente continua
(Definizione 1.28.1) (e quindi derivabile quasi ovunque, per il Corollario 1.28.7), con derivata in L1 (R);
(generalizzazione della parte (ii)): f sia derivabile ovunque m 1
volte e D (m1) f sia assolutamente continua con derivata in L1 (R).

(vi) Infine, lenunciato al punto (iii) vale pi in generale per f derivabile


ovunque m 1 volte con ogni derivata in L1 (R) e con f (m1) L1 (R)
continua a tratti (o, ancora pi in generale, con f (m1) L1 (R) assolutamente continua, quindi con derivata f (m) definita quasi ovunque) e
f (m) monotna a tratti ed in L1 (R)).
Dimostrazione.
(i) Segue dal Teorema Fondamentale del Calcolo per funzioni derivabili
con derivata in L1 , Teorema 1.28.12, che
Z x
f (x) = f (0) +
f (t) dt .
(8.7)
0

Poich f L1 , lintegrale f (t) dt convergente. Questo prova


che esiste nito il limite limt f (t). Dal momento che f integrabile questi limiti debbono valere 0. Pertanto lultima identit di (i)
segue dalla parte (vii) del Teorema 8.2.4. Il lettore non interessato alla
profondit concettuale inerente alle versioni pi sosticate del Teorema
Fondamentale del Calcolo pu limitare lattenzione a funzioni f derivabili ovunque con derivata in L1 e continua ed applicare ad esse il
Teorema Fondamentale nella versione elementare (Teorema 1.27.1 ).
m f () = (2i)m fb().
[
(ii) Iterando il ragionamento precedente si ottiene D
La dimostrazione della parte (ii) segue ora dalla Proposizione 8.2.3.

8.2. PROPRIET DELLA TRASFORMATA DI FOURIER

701

(iii) La dimostrazione di questa parte ricalca riga per riga quella del risultato analogo per le serie di Fourier, Teorema 5.18.5, grazie al fatto che
f (m) a supporto compatto, e quindi lintegrale nella sua antitrasformata di Fourier si limita a questo compatto (in quel Teorema, lintegrale
dei coecienti di Fourier preso sul compatto [, ], ma per invarianza per dilatazione largomento rimane identico per qualunque altro
intervallo).
(iv) Gli argomenti in questo caso coincidono con quelli dei punti (i) e (ii)
una volta notato che, se f continua, C 1 a tratti ed in L1 (R), per il
Teorema 1.28.9 vale lidentit (8.7). Si osservi che, detti xi i punti di
\
(m) f () = 2i D
b (m1) f ()
salto di D (m) f , la validit dellidentit D
della parte (vii) del Teorema 8.2.4 ora si ottiene integrando per parti
come segue,
Z

(m1)

2it

f (t) e

dt =

D (m) f (t)

i 2it
e
dt

xi+1
X i

2it
(m1)
,
e
D
f (t)

x
i
i

ed i termini della somma telescopica al secondo membro si elidono


consecutivamente perch D (m1) f continua e tende a zero allinnito.
(v) La dimostrazione identica a quella della parte (iv), perch, se f
assolutamente continua, allora come gi osservato essa ha derivata quasi
ovunque, ed inoltre, per il Teorema 1.28.9, vale lidentit (8.7).
(vi) Dimostriamo questa parte direttamente nel caso di assoluta continuit
di f (m1) : infatti nel caso particolare in cui f (m1) sia continua a tratti
la dimostrazione identica, grazie al fatto che il Teorema Fondamentale
del Calcolo 8.7 vale in entrambi i casi.
Supponiamo dapprima che f sia a supporto compatto. Allora largomento si riduce a quello di (iii), sempre grazie al fatto che lidentit 8.7)
vale per le funzioni assolutamente continue. Si noti che lipotesi che le
singolarit siano isolate, unita a quella di supporto compatto, assicura
che le singolarit siano in numero nito, come richiesto nella dimostrazione del Teorema 5.18.5, che appunto tratta il caso dei coecienti di

702

CAPITOLO 8. TRASFORMATA DI FOURIER


Fourier, ottenuti integrando su intervalli niti, quindi compatti. Inoltre, la compattezza del supporto di f , e quindi di tutte le sue derivate,
assicura che le derivate appartengano a L1 , condizione necessaria per
calcolare la loro trasformata di Fourier, come si fa nella dimostrazione
del Teorema 5.18.5.
Consideriamo ora il caso generale in cui f non sia a supporto compatto.
In tal caso fra le ipotesi necessario aggiungere che le derivate appartengano a L1 (R). La dimostrazione si riduce a quella della parte (iv)
nel modo seguente. Per ogni R vogliamo stimare fb() come nel
Teorema 5.18.5, provando che


b
f () 6 C

1
||m+1

per qualche costante C > 0. Per iterazioni successive basate sullidentit (5.33) ( qui che si usa la condizione che tutte le derivate, e non
solo lultima, appartengano a L1 (R)) questo equivale a provare che


1

d
(m)
.
f
()
6C

||

Se f fosse a supporto compatto, questa disuguaglianza seguirebbe dalla


prima parte della dimostrazione (che essenzialmente ricalca il Corollario
??). Poich invece f non si assume a supporto compatto ma solo in
L1 (R), scegliamo un compatto (cio un intervallo limitato) I cos grande
che si abbia
Z
(m)
f (x) dx < 1 .
2
R\I
Allora

Z





d

(m)
2ix
(m)

dx
f () 6 f (x) e

ZI


(m)
2ix

f (x) e
dx
+
R\I

Z

\
f (m) (x) dx
6 (f I )() +
R\I



1

(m)
6 (f\
I )() + 2 ,

(8.8)

8.2. PROPRIET DELLA TRASFORMATA DI FOURIER

703

dove come sempre I la funzione caratteristica dellintervallo I.


Daltra parte, la funzione f (m) I ha supporto nel compatto I, ed
continua a tratti e monotna a tratti (la moltiplicazione per la funzione
caratteristica aggiunge solo al pi due punti di salto per la funzione
f (m) ). Quindi ad essa si applica la dimostrazione valida per funzioni
a supporto compatto. Combinando questo fatto con la disuguaglianza
(8.8) troviamo che esiste una costante C > 0 tale che, per ogni 6= 0,


1
1
1
d

(m)
+ 2 6C
f () 6 C
||
||
per qualche costante C > C . Questo completa la dimostrazione.

Esercizio 8.2.9. Sia 1 la funzione caratteristica dellintervallo [1, 1], e pi


in genetale, per > 0, sia la funzione caratteristica dellintervallo [, ].
Si osservi che 1 (x) = 1 (x/2), e si deduca dalla propriet di dilatazione
2
della trasformata di Fourier (parte (iv) del Teorema 8.2.4) e dallEsercizio
10.1.5 che
sin(2)
(8.9)

c1 () = 2c
1 (2) = 2 sinc(2x) =
2

e pi in generale

c () = 2
c1 (2) = 2 sinc(2) =
2

sin(2)
.

(8.10)

Ora sia h la funzione continua con supporto in [1 , 1 + ] che vale 1 in


[1, 1] ed lineare (ossia con graco rettilineo) negli intervalli [1 , 1] e
[1, 1 + ], e denotiamo con h questa funzione lineare nellintervallo [1, 1 + ]:
ovviamente, he ta(x) = 1 1 (x) in tale intervallo. Prolunghiamo he ta a
tutto R ponendola uguale a zero al di fuori di [1, 1 + ]. Allora
f = h + 1 + h .

(8.11)

Osserviamo che lim0 f (x) = 1 (x) per ogni x, ed anche in maniera monotna e nella norma di L1 .
(i) Si deduca da (8.9) e dalla parte (i) del Teorema 8.2.4 che lim0 fb () =
1 () = 2 sinc(2) uniformemente su R.
c

704

CAPITOLO 8. TRASFORMATA DI FOURIER

(ii) Si mostri che f L2 (R)L2 (R), e pi precisamente che f =


(iii) Se ne deduca che fb L1 (R).

(iv) Si ricavi da (8.10) e dalla parte (ii) che fb =

1
1 .
2

sin(2) sin(2
.
2 2 2

(v) Sappiamo dalla parte (iii) del Coro9llario 8.2.8 che fb = O(1/ 2) per
. Si ricavi questo risultato da (iv).

(vi) Ora si verichi esplicitamente che


b
h =

1
1
2 2 (1 e2i )
2 4

e si usi questa identit per ricavare da (8.11) il risultato di (v) (ed anche
quello di (i)).

8.3

Esempio: trasformata di Fourier della Gaussiana


2

La Gaussiana la funzione (x) = ex . Essa decresce allinnito a velocit


pi che polinomiale, e quindi in L1 (R). In seguito la useremo spesso per
moltiplicare altre funzioni in modo da renderle piccole allinnito.
Lemma 8.3.1.
kk1 =
Dimostrazione. Per parit
Z

t2

et dt = 1.

dt = 2

Se scriviamo
I=

et dt.

et dt

8.3. TRASFORMATA DI FOURIER DELLA GAUSSIANA

705

dobbiamo mostrare che I = 21 . Si ha


Z
 Z

2
t2
s2
I =
e
dt
e
ds
0
0
Z Z
2
2
=
et es dt ds
Z0 Z0
2
2
=
e(t +s ) dt ds.
0

Grazie alla formula di integrazione in coordinate polari (Esercizio 1.22.23)


questo integrale doppio diventa
Z

(t2 +s2 )

dt ds =

er r dr d

(abbiamo posto t = r cos , s = r sin : il quadrante t > 0, s > 0 corrisponde


a r > 0, 0 6 6 2 ). Osserviamo che
Z
Z
1
2
r 2
Deu du
e
r dr =
2 0
0


1
1 u2
=
= e
.
2
2
0
Perci
2

I =

Quindi I =

1
.
2

r 2

1
r dr d =
2

d =

1
.
4

Proposizione 8.3.2.
b = .
Dimostrazione. Chiaramente,

(t) = 2t(t).

(8.12)

Dal Teorema 8.2.4 (vii) si ha


d
D()
= 2i ().
b

Deriviamo rispetto a sotto il segno di integrale (grazie al Corollario 1.23.7)


come nella dimostrazione della propriet di derivazione della trasformata di

706

CAPITOLO 8. TRASFORMATA DI FOURIER

Fourier (Teorema 8.2.4 (viii)) e del Corollario 8.2.7, e poi applichiamo la


suddetta propriet di derivazione. Otteniamo:

d 2it 
(t)
e
dt
d

Z
= 2i
t(t)e2it dt

()
b () =

d
= iD()
= 2 ().
b

Quindi
b verica lequazione dierenziale

f (u) 2uf (u) = 0.

Ma in base a (8.12) verica la stessa equazione dierenziale. Si tratta di


unequazione dierenziale lineare del primo ordine: per queste equazioni si sa
che la soluzione, se esiste, unica a meno di una moltiplicazione per costanti.
Quindi esiste una costante C tale che (u)
b
= C(u) per ogni u R. Se non
si vuole ricorrere alla teoria delle equazioni dierenziali del primo ordine, si
pu raggiungere la stessa conclusione osservando che, per ogni y,
 

()
b (u)(u) (u)
b
(u)

b
(u) =
2

(u)
2iu(u)(u)
b
+ 2iu(u)(u)
b
=
= 0.
2 (u)
Quindi anche cos si trova che
calcolare il valore

(0)
b
.
(0)

costante. Per trovare la costante basta

Ma (0) = 1 e per il Lemma 8.3.1


(0)
b =

(t) dt = 1.

Quindi la costante vale 1, cio


b = .

Nota 8.3.3. La Proposizione 8.3.2 fornisce un esempio di funzione L1 (R)


non a supporto compatto ma tale che
b C (R); si veda a questo proposito
il Corollario 8.2.7 (ii).

8.4. TEOREMA DI INVERSIONE DI FOURIER

8.4

707

Il teorema di inversione di Fourier

In questa Sezione ricaviamo la formula di inversione di Fourier in maniera


rigorosa.
Questa deduzione si basa su quattro propriet. Le prime tre le abbiamo gi
provate.
2

(i) Se (x) = ex , allora ()


b
= () per ogni , e
(Proposizione 8.3.2 e Lemma 8.3.1).

(x)dx = 1

(ii) Se f L1 (R) e > 0 e f (x) = f (x/), allora fb () = fb() per ogni


(Teorema 8.2.4 (iv)).

(iii) Se (t f ) (s) = f (s t), allora d


t f () = e2it fb() per ogni f L1
(Teorema 8.2.4 (v)).

(iv) Se f, g L1 (R) e f g L1 (R) (in particolare, se f, g L1 (R) L2 (R))


R
R
allora fb(s)g(s)ds = f (s)b
g (s)ds.

Nota 8.4.1. La quarta propriet verr dimostrata in seguito per altra via nel
caso particolare di funzioni C a decrescenza rapida (Formula di Plancherel
9.7.8) e questo caso particolare sarebbe suciente anche qui, ma facile dimostrarla direttamente nel caso pi generale, e lo facciamo subito (di fatto
anticipando la dimostrazione del Teorema 9.7.8). La propriet vera semplicemente perch lipotesi di appartenenza a L1 di f e g assicura che fb e b
g

1
1
b
siano in L e quindi f g e f b
g siano in L , ed inoltre f (s)g(t) sia in L rispetto
alla misura prodotto ds dt. Quindi possiamo applicare il Teorema di Fubini
1.20.4) e scambiare lordine degli integrali:
Z
Z Z
b
f (s)g(s) ds =
f (t)e2ist dt g(s) ds

Z
Z
=
g(s)e2ist ds f (t) dt

=
f (s)b
g (s) ds
(8.13)

Ora possiamo dimostrare la formula di inversione.

708

CAPITOLO 8. TRASFORMATA DI FOURIER

Teorema 8.4.2. (Formula di inversione di Fourier.) Se f L1 (R),


poniamo
Z
g(t) :=
fb() e2it d .

Allora g(t) esiste per quasi ogni t, e f = g quasi ovunque.


Se fb L1 (R), allora g, e quindi f , appartengono a C0 (R) (ossia la classe
di equivalenza di Lebesgue contiene un rappresentante continuo che tende a
zero allinfinito), e (se si sceglie per f tale rappresentante continuo) per ogni
t si ha
Z
f (t) =
fb() e2it d .

Dimostrazione. Per le propriet (ii) e (iv), se f L1 e (t) = et la


Gaussiana della propriet (i), per ogni > 0 si ha
Z
Z
s
f (t) (t)
b
dt =
( ) fb(s) ds .

Per ogni x R, riscriviamo questa identit per la funzione traslata x f (t) =


f (t + x), e dalla propriet (iii) otteniamo
Z
Z
s
(8.14)
f (t + x) (t)
b
dt =
( ) fb(s) e2isx ds .

Daltra parte, per le propriet (i) e (iii) e per il Lemma 8.3.1 e la Propo2 2
sizione 8.3.2, per + la famiglia (t) := (t)
b
= e t soddisfa la Denizione 6.1.15 di identit approssimata in L1 (R). Inoltre, grazie
R alla parit di , il primo membro dellidentit (8.14) esattamente
f (x t) (t)
b
dt = f (x). Per il Teorema 6.1.16 di convergenza

delle identit approssimate, sappiamo che lim+ f = f nella norma


di L1 , e quindi esiste una sottosuccessione f n converge a f anche quasi
ovunque (Corollario 1.16.29).
2 2
2 2
Dallaltro lato, ( s ) = es / 6 1, e lim+ es / = 1. Se avessimo fatto lipotesi che anche fb L1 , il Teorema di Convergenza Dominata
1.9.54 implicherebbe che, per ogni t, il secondo membro di (8.14) converga
R
a g(t) := fb() e2it d. Pertanto f = g quasi ovunque. Invece, senza
lipotesi fb L1 , possiamo spezzare lintegrando come somma di quattro funzioni reali non negative (spezzando prima lintegrando come combinazione

8.5. CONVOLUZIONE E TEOREMA DI PLANCHEREL

709

lineare a coecienti 1 e i di parte reale ed immaginaria, e poi spezzando


queste ultime come dierenza delle loro parti positive e negative). Poich
2 2
es / converge a 1 in maniera monotna, si applica il Teorema di Convergenza Monotna 1.9.53 ed anche in questa generalit segue come prima che
f = g quasi ovunque.
Il fatto che, se fb L1 , g sia continua e tenda a zero allinnito stato provato
nella Proposizione 8.2.3.

8.5

Convoluzione e teorema di Plancherel

Rammentiamo la denizione di convoluzione (Denizione 6.1.11): se f, g


L1 (R),
Z
(f g)(x) =
f (x t)g(t) dt.

Adesso, parallelamente alla Proposizione 6.1.6, calcoliamo la trasformata


di Fourier di f g. Si ha
Z
[
f g() =
(f g)(t)e2it dt

Z
Z
=
f (t s)g(s) ds e2it dt.

Poich f, g L1 (R), per quasi ogni s R si ha che t f (t s)g(s)


integrabile con integrale nito. Pertanto la funzione F (s, t) := f (t s)g(s)
appartiene a L1 (R2 ), perch
ZZ

F (s, t) ds dt =


Z
Z
f (t s)g(s) dt ds = f (t) dt g(s) ds < .

Z Z

Ma allora possiamo applicare il Teorema di Fubini (parte (ii) del Teorema


1.20.4) e scambiare lordine di integrazione:

f[
g() =

Z

2it

f (t s)e


dt g(s) ds.

710

CAPITOLO 8. TRASFORMATA DI FOURIER

Poniamo u = t s. Allora du = dt e
Z

f[
g() =

g(s)

Z

f (u)e

2is

g(s)e

2i(u+s)

ds

du

ds

f (u)e2iu du

= fb()b
g ().
Abbiamo quindi dimostrato il

Teorema 8.5.1. Siano f, g L1 (R). Allora


f[
g() = fb()b
g ().
Corollario 8.5.2. (Teorema
di Plancherel.) Se f L1 (R) L2 (R) allora


fb L2 (R) e kf k2 = fb .
2

Dimostrazione.

kfbk22 =

b d
fb()f()

b
d
fb()f()

g ()
per il Teorema 8.2.4 (ix). Poniamo g(t) = f (t). Allora fb() = b

8.5. CONVOLUZIONE E TEOREMA DI PLANCHEREL


(Teorema 8.2.4 (ii)) e quindi
Z
Z
b
b
f ()f () d =

fb()b
g () d
f[
g() d

= f g(0)
Z
=
f (t)g(t) dt

711

(Teorema 8.5.1)
(Teorema 8.4.2)

f (t)g(t) dt

|f (t)|2 dt

= kf k22 .

Nota 8.5.3. (Trasformata di Fourier in L2 (R).) Il Teorema di Plancherel


(Corollario 8.5.2) ci permette di denire la trasformata di Fourier direttamente nello spazio L2 (R) anzich in L1 (R). Infatti, osserviamo per prima cosa
che L1 (R) L2 (R) un sottospazio denso di L2 (R). Questo fatto vero
perch le funzioni a continue a supporto compatto appartengono sia a L1 sia
a L2 : se il supporto di f L1 il compatto K (con misura m(K) ovviamente nita), allora per ogni p > 1 si ha kf kp2 6 m(K)kf kp , e quindi kf kp
nita. Daltra parte, le funzioni continue a supporto compatto sono dense in
L2 (R), come abbiamo dimostrato nella Proposizione 1.18.6 (ed ancor prima,
nel Lemma 1.18.3), e ne segue che L1 L2 denso in L2 .
Ma, per il lettore troppo pigro per rivedere questi risultati di densit, ridimostriamo qui il fatto che L1 (R) L2 (R) un sottospazio denso di L2 (R)
in maniera diretta. Se indichiamo con Kn una famiglia di compatti che
invadono R e con n = Kn le loro funzioni caratteristiche (denite nella
Sezione 1.1), otteniamo che le funzioni f n appartengono tutte a L1 perch
hanno supporto compatto, e convergono a f nella norma L2 per
di
R il Teorema
2
Convergenza Dominata di Lebesgue (Teorema 1.9.54): limn |f f n | = 0
perch lintegrando tende a zero puntualmente ed dominato dalla funzione
L1 |f |2 . Questo dimostra che L1 (R) L2 (R) denso in L2 (R).

712

CAPITOLO 8. TRASFORMATA DI FOURIER

Ora, presa una qualunque successione fn L1 L2 (R) che converge a f


L2 (R) nella norma di L2 , possiamo denire la trasformata di Fourier di f
come limite nella norma di L2 : fb = limn fbn . Osserviamo infatti che il limite
di fbn nella norma L2 esiste perch la successione fn di Cauchy in tale norma,
in quanto convergente, e quindi la stessa propriet vale per la successione fbn
grazie allisometria del teorema di Plancherel (Corollario 8.5.2); inoltre il
limite non dipende dalla scelta degli approssimanti, dal momento che, se fn
e gn sono due successioni di funzioni in L1 (R) L2 (R) che convergono alla
stessa funzione f L2 (R) (nel senso di L2 ), allora la successione fn gn
converge alla funzione 0, e quindi, sempre per lisometria, fbn gbn = f\
n gn
converge a zero in L2 .
In particolare, dal Teorema di Plancherel ora segue che la trasformata di
Fourier una isometria surgettiva (ed ovviamente anche iniettiva!) di L2 (R)
in s.

Estendiamo ora il teorema di Plancherel, nella forma data nella Nota


8.4.1, direttamente alla trasformata di Fourier su L2 (R), introdotta nella
precedente Nota 8.5.3, e non solo su L1 L2 ; in eetti il suo procedimento di
estensione ricalca quello svolto per la trasformata di Fourier in quella Nota,
ed illustra anche la via alternativa alla dimostrazione del Teorema 8.5.1,
basata su approssimazione di funzioni in L1 con funzioni nei sottospazi densi
L1 Lp e L1 Lq , che accennata in quella dimostrazione.
Corollario 8.5.4. (Forma polarizzata del teorema di Plancherel.)
R
R
Per ogni f, g L2 (R) si ha fb(s)g(s)ds = f (s)b
g (s)ds.

Dimostrazione. Lenunciato vero per f e g in L1 (R)L2 (R) per la propriet


(iv). Abbiamo gi osservato nella Nota 8.5.3 che L1 (R) L2 (R) denso in
L2 (R): scegliamo quindi due successioni {fn }, {gn } in L1 (R) L2 (R) che
convergonoR rispettivamente a f Re a g nella norma L2 .

Poich fbn (s) gn (s )ds = fn (s) b


gn (s) ds per ogni n, basta dimostraR
re che, per n , lintegrale a primo membro converge a fb(s) g(s) ds
R
e quello a secondo membro a f (s) b
g (s) ds. Queste due dimostrazioni sono identiche fra loro: svolgiamo la prima. Si tratta di provare che
kfbn gn fbgk1 0 quando n . Ed infatti, poich
fbn gn fbg = fbn (gn g) + (fbn fb)g ,

8.6. LOCALIZZAZIONE NEL TEMPO E NELLA FREQUENZA

713

segue dalla disuguaglianza di CauchySchwarz 4.5.1 (od anche dalla disuguaglianza di Hlder, Teorema 1.16.6: si veda la Nota 4.5.2) che
kfbn gn fbgk1 6 kfbn k2 kgn gk2 + kfbn fbk2 kgk2 .

Applicando al secondo membro il teorema di Plancherel (Corollario 8.5.2)


otteniamo
kfbn k2 kgn gk2 + kfbn fbk2 kgk2 = kfn k2 kgn gk2 + kfn f k2kgk2 ,

ed il secondo membro ora tende a zero con n perch kfn k2 kf k2 , gn g


e fn f nella norma L2 .

Nota 8.5.5. Se nellenunciato del Corollario 8.5.4 si sceglie g = f, dalla propriet di coniugazione della trasformata di Fourier, Teorema 8.2.4 (ix), si
vede che lenunciato si riduce al teorema di Plancherel (Corollario 8.5.2), ma
ora in generale per funzioni L2 , non solo per L1 L2 , gi anticipato per cenni
nella Nota 8.5.3.

La dimostrazione del prossimo corollario utilizza la tecnica di approssimazione di L2 con L1 L2 illustrata nella Nota 8.5.3, seguita, come in
quella Nota, da un passaggio al limite nella norma L2 giusticato dal Teorema di Convergenza Dominata di Lebesgue (Teorema 1.9.54). Dato questo suggerimento, lasciamo al lettore i dettagli della dimostrazione come
esercizio.
Corollario 8.5.6. La formula di inversione di Fourier vale anche per f
L2 (R) se si intende fb definita nel senso di L2 come nella Nota 8.5.3.

8.6

Non esistono funzioni a supporto limitato


nel tempo e nella frequenza

Includiamo questa breve sezione per chiarire al lettore che non possibile
che una funzione f L1 (R) sia a supporto compatto ed al tempo stesso lo
sia la sua trasformata di Fourier. Per approfondimenti e relativi riferimenti
bibliograci, si veda [11, Cap.2, Sez.9].
Teorema 8.6.1. Sia f L1 (R), non identicamente nulla. Se f a supporto
compatto, allora fb non identicamente nulla in nessun intervallo aperto.

714

CAPITOLO 8. TRASFORMATA DI FOURIER

Dimostrazione. Sia a > 0 tale che f abbia supporto nellintervallo [a, a].
Supponiamo, per assurdo, che fb si annulli su (c, d), e sia c < u < d. Poich
f L1 (R) a supporto compatto, anche tn f (t) L1 (R) per ogni n > 0, e
quindi possiamo applicare n volte al punto u la propriet di derivazione di
fb del Teorema 8.2.4 (viii), ossia derivare n volte sotto il segno di integrale
lidentit
Z a
fb(s) =
f (t) e2its dt .
a

In tal modo otteniamo, per ogni u [c, d],


Z a
nb
n
f (t) e2itu tn dt .
0 = D f (u) = (2i)
a

Ra
Ovvero, a f (t) e2iut tn dt = 0 per ogni n > 0 e per ogni u [c, d]. Fissiamo una volta per tutte un tale valore di u (senza perdita di generalit, se
questo semplica la lettura, traslando opportunamente f e grazie alla propriet di traslazione della trasformata di Fourier (propriet (v) del Teorema
8.2.4), possiamo ssare u = 0). Allora, utilizzando lo sviluppo di Taylor
dellesponenziale, uniformemente convergente sui compatti (Esempi 1.6.2 e
1.6.5), per ogni s R abbiamo
Z a
b
f (s) =
f (t) e2it(su) e2itu dt
=

X
n=0

1
(2i(s u)n )
n!

f (t) e2iut tn dt = 0 ,

perch, per il Teorema 1.3.17, la serie uniformemente convergente commuta


con lintegrale sul compatto [a, a]. Pertanto fb 0. Per il Teorema di inversione di Fourier 8.4.2, da questo segue f 0, una contraddizione. Quindi
si deve escludere che fb si annulli su un intervallo.
Lo stesso argomento prova che f non pu annullarsi su un intervallo se fb
ha supporto in un compatto [b, b]: basta derivare n volte sotto il segno di
integrale lidentit
Z b
f (t) =
fb(s) e2its ds ,
b

che vale grazie al Teorema di inversione di Fourier 8.4.2.

8.7. ESERCIZI

8.7

715

Esercizi sulla trasformata di Fourier

Esercizio 8.7.1. Sia f la funzione


f (t) = [0,1] (t) =

1
0

se
se

t [0, 1]
t
/ [0, 1]

Si calcoli fb() per ogni . Si verichi che fb() = O( 1 ) per che tende
ad innito. Si confronti questo risultato con lenunciato del Corollario 8.2.8.
Si paragoni questa situazione a quella dei coecienti di Fourier di funzioni
periodiche g derivabili con continuit un certo numero di volte. In vista di
tale analogia, sotto quali ipotesi su g si potrebbe cercare di dimostrare nel
Corollario 8.2.8 che fb() = O ( m1 )?

Esercizio 8.7.2. Si guardi il risultato dellEsercizio 10.1.5 nel seguito, ed in


base ad esso si risolva il precedente Esercizio 8.7.1 utilizzando la propriet
di traslazione della trasformata di Fourier (propriet (v) del Teorema 8.2.4).

Esercizio 8.7.3. Sia f la funzione

1+t
1t
f (t) =

t [1, 0]
t [0, 1]
t
/ [1, 1]

Si calcoli fb() per ogni . Si verichi che fb() = O 12 per che tende ad
innito. Si confronti questo risultato con lenunciato del Corollario 8.2.8 (iii).
Si paragoni questa situazione a quella dei coecienti di Fourier di funzioni
periodiche derivabili con continuit un certo numero di volte (Corollario ??).

Esercizio 8.7.4. Sia f la funzione



1 + cos t
f (t) =
0

se
se
se

t [, ]
t
/ [, ]

Si calcoli fb() per ogni . vero che fb() = O 13 per che tende ad innito. Si confronti il risultato con lenunciato del Corollario 8.2.8. Si paragoni
questa situazione a quella dei coecienti di Fourier di funzioni periodiche
derivabili un certo numero di volte (Corollario ??).

se
se

716

CAPITOLO 8. TRASFORMATA DI FOURIER

Esercizio 8.7.5. Sia f (t) = et [1,1] (t). Quanto vale


Z

b 2
f () d?
1.  2 e2
2. 

e2 +1
2

3. 

1
2

e2

4. 

1
2


1

e2

1
e

1
e2

5.  nessuna delle precedenti


Motivare la risposta.

Esercizio 8.7.6. Si mostri che, se f (t) = e|t| , allora fb() = 1+42 2 2 . Si


verichi che la trasformata cos ottenuta verichi le propriet della parte (iv)
del Corollario 8.2.6.

Esercizio 8.7.7. Si mostri che, se f (t) = 1/(1 + t2 ), allora fb() = e2 . Si


verichi che la trasformata cos ottenuta verichi le propriet della parte (iv)
del Corollario 8.2.6, e che sia compatibile con il precedente Esercizio 8.7.6.

Esercizio 8.7.8. Si mostri che, se f (t) = t/(1+t2 ), allora fb() = 2 2 i e2 .


Si verichi che la trasformata cos ottenuta verichi le propriet della parte

(iv) del Corollario 8.2.6.


Esercizio 8.7.9. Come visto nel precedente Esercizio 8.7.6, se f (t) = e|t|
|t|
allora fb() = 1+42 2 2 . Sia g(t) = e 2 . Quale tra le seguenti funzioni
g ()?
b
1. 

4
1+16 2 2

2. 

3. 

2
1+4 2 2

1
1+2 2 2

8.7. ESERCIZI
4. 

717

1
1+4 2 2

5.  nessuna delle precedenti


Motivare la risposta.

Esercizio 8.7.10. Sia f una funzione la cui trasformata di Fourier



1
se
[0, 1]
fb() = [0,1] () =
0
se

/ [0, 1]

( Nota: non esiste una tale funzione f in L1 (R), a causa della Proposizione
8.2.3, per esiste una tale f in L2 (R), a causa della surgettivit della trasformata di Fourier da L2 a L2 (Nota 8.5.3)).
Per quali valori di si ha che (f e2it f )b = 0
1.  = 0
2.  || 6 1
3.  || > 2
4.  || > 1
5.  || 6 2
6. 

nessuna delle precedenti

Motivare la risposta.

Esercizio 8.7.11. Sia g(t) = f (3t + 2). Esprimere b


g in termini di fb.

Esercizio 8.7.12. Assumendo che la trasformata di Fourier di f (t) = [1/2,1/2] (t)


sia fb() = sin e quella di g(t) = e2|t| sia b
g () = 1+12 2 la trasformata di
Fourier di f[
g() quale delle seguenti funzioni?
1. 

1
sin
(1+ 2 2 )

2. 

sin

3. 

sin
(1

4. 

1
2

1
1+ 2 2

+ 2 2)
R
sin +

d
1+ 2 2

718
5. 

CAPITOLO 8. TRASFORMATA DI FOURIER


sin (1/2)
1
2 (1/2)(1+ 2 2 )

Motivare la risposta.

1
Esercizio 8.7.13. Assumendo che la trasformata di Fourier di f (t) = 1 1+t
2
2||
b
sia f () = e
, quale delle seguenti funzioni la trasformata di Fourier
(n)
di g(t) = f (t)?

1.  (2i)n e2||

2.  (2)n e2||
3. 
4. 

e2||
(2i)n

nessuna delle precedenti

Motivare la risposta.

Esercizio 8.7.14. Sia f una funzione non necessariamente reale. Quale delle
seguenti propriet vera?
1.  fb() = fb()
2.  fb() = fb()

3.  fb() = fb()
4.  fb() = fb()

5.  nessuna delle precedenti


Motivare la risposta.

Esercizio 8.7.15. Sia f (t) = [1,1] (t). Quanto vale


Z

b 2
f
()

d?

1. 

1
2

2.  0

8.7. ESERCIZI

719

3.  1
4.  2
5.  nessuna delle precedenti
Motivare la risposta.

1
2||
b
Esercizio 8.7.16. Se la trasformata di Fourier di f (t) = 1 1+t
2 f () = e
allora la funzione b
g () = e2|2| la trasformata di Fourier della funzione

1.  g(t) =

1
1
1+(t2)2

2.  g(t) =

2
1
1+t2 /4

3.  g(t) =

e4it
(1+t2 )

4.  g(t) =

1
1
2 (1+t2 )2

5.  nessuna delle precedenti


Motivare la risposta.


Esercizio 8.7.17. Sia g(t) = [0,1] [0,1] (t). Calcolare g(t), mostrando che
il suo graco non nullo solo nellintervallo [0, 2], ed a forma di triangolo
isoscele, nullo in 0 e 2 e con terzo vertice nel punto (1, 1). Mostrare anche
2i
questo fatto calcolare la trasformata di
che
b[0,1] () = 1e2i , ed usando

Fourier di g(t) = [0,1] [0,1] (t)

Esercizio 8.7.18. Se f (x) = g(x) x R, allora


1.  fb() = b
g ()

2.  fb() = (b
g ())1

3.  fb() = b
g ( 1)
4.  fb() = b
g ()
5. 

nessuna delle precedenti

720

CAPITOLO 8. TRASFORMATA DI FOURIER

Motivare la risposta.

Esercizio 8.7.19. Sia f (t) = et [1,1] (t). Quanto vale


Z

b 2
f () d?
1.  2 e2
2. 

e2 +1
2

3. 

1
2

e2

4. 

1
2


1

e2

1
e

1
e2

5.  nessuna delle precedenti


Motivare la risposta.

Esercizio 8.7.20. Sia f (x) = e|x| .


(i) La funzione f appartiene a L1 (R)? Se s calcolarne la norma, se no
dimostrarlo.
(ii) Senza calcolare fb, stimare lordine di innitesimo di fb() per ;
spiegare i dettagli.

(ii) Calcolare fb e vericare la risposta precedente.


Esercizio 8.7.21. Sia f (t) = [0,1] (t). Lintegrale
Z

ha uno dei seguenti valori. Quale?


1. 

1
2

2.  1
3.  2



b 2
f () d

8.7. ESERCIZI

721

4.  0
5.  nessuno dei precedenti.
Motivare la risposta.



1 1
Esercizio 8.7.22. (i) Sia la funzione caratteristica dellintevallo ,
.
2 2
Calcolare espicitamente .
(ii) Sia, per ogni c > 0,
sin2 (cx)
.
c2 2 x2
Sulla base di quanto fatto nel punto precedente ed usando la forma
1
esplicita di
b, per quali valori di c risulta fbc (s) = 0 se |s| > ?
2
Per quali valori di c fc appartiene alla classe di Schwartz?
fc (x) =

iii) Enunciare il teorema di Plancherel (isometria della trasformata di Fourier) e, sulla base di quanto fatto nei punti precedenti, calcolare
Z + 4
sin x
dx.
x4

Svolgimento.

i) Sia h = , ovvero sia


h(x) =

(x t)(t) dt.

pari, quindi h pari. Infatti


Z +
Z
h(x) =
(x t)(t) dt =
=

(x t)(t) dt =

(x + t)(t) dt

(x t)(t) dt = h(x).

Studiamo allora solo ci che succede per x 0. Poich (t) nulla se


1
|t| > e vale 1 altrimenti, abbiamo
2
Z 1
2
(x t) dt.
h(x) =
12

722

CAPITOLO 8. TRASFORMATA DI FOURIER




1
1
(xt) (vista come funzione di t) ha come supporto lintervallo x , x + ,
2
2
sul quale vale 1. Vediamo quindi che, per calcolare h(x), dobbiamo di1
1
stinguere due casi: se x > , ovvero se x > 1, il supporto di (xt)
2
2
non ha punti in comune con linsieme di integrazione. Pertanto h(x)
zero se x > 1.
Sia allora 0 x 1. Abbiamo
h(x) =

1
2

x 21

(x t) dt =

1
2

dt =

x 21

1
1
x + = 1 x.
2
2

Usando il fatto che h pari otteniamo, inne

1 + x, 1 < x 0
h(x) = 1 x, 0 < x < 1

0, |x| 1

Si noti che h continua in ogni punto.

ii) Ricordiamo che la trasformata di Fourier di

Notiamo quindi che

b() =

sin()
.

sin2 (cx)
(cx))2 =
b(cx)b
(cx) = [
(cx).
fc (x) = 2 2 2 = (b
c

Notiamo che fc L1 . Quindi [


L1 . Possiamo allora combinare
le propriet
1 
[
g(c)()
= gb
c
c
e
b
g (x) = g(x),
b

8.7. ESERCIZI

723

valide se g, b
g L1 e se c > 0, per ottenere

1
s
s

, 1 < 0

c
c
c

 s

1
s
s
1
=
fbc (s) =
1+
, 0 < < 1,

c
c
c c
c



0, 1
c
1 

s

1+
, c < s < 0

c
c 

= 1 1 s , 0s<c

c
c

0, |s| c

Notiamo che fbc pari.


Abbiamo quindi fbc (s) = 0 se |s| c. Anch risulti fbc (s) = 0 se
1
1
|s| > deve essere c .
2
2
La funzione fc non nella classe di Schwartz per nessun c > 0. Infatti,
sebbene risulti fc C per ogni c > 0, fc non va a zero pi velocemente
di ogni polinomio. Infatti, ad esempio,
lim x2 fc (x)

|x|+

non esiste.
iii) Il teorema di Plancherel asserisce che, se f L1 L2 , allora fb L2 e
Lidea per calcolare

kf k2 = kfbk2 .

sin4 x
dx
x4

quindi riconoscere la funzione integranda come il quadrato di una


funzione di cui conosciamo la trasformata di Fourier e di cui sappiamo
calcolare la norma L2 .

724

CAPITOLO 8. TRASFORMATA DI FOURIER


Sulla base dellesercizio precedente, abbiamo
2


2
sin4 x sin2 x
= 2 = f1/ (x) .
4
x
x

Notiamo che fc L1 L2 per ogni c > 0. In particolare f1/


L1 L2 . Valgono quindi le ipotesi del teorema di Plancherel, e pertanto
otteniamo
Z + 4
Z +


sin x
f1/ (x) 2 dx = kf1/ k22 = kfbc k22
dx
=
x4

Z

b 2
fc (s) ds = 2

= 2

|fc (s)| ds = 2

(1 t)2 dt = 2

2 (1 s)2 ds


1 + t2 2t dt

1



1
2
t3
2
= 2 1 + 1 =
.
= 2 t + t
3
3
3
0

8.8

Varianti dei precedenti esercizi

1
b
Esercizio 8.8.1. Se la trasformata di Fourier di f (t) = (1+4t
2 ) f () =
1 ||
1
e
e se g(t) = (1+t
g ()?
2 ) quale tra le seguenti funzioni b
2

1. 

1 ||
e
2

2.  4e 2 ||
3.  e2||
4. 
5. 

1 2 ||
e
4

nessuna delle precedenti

Motivare la risposta.

8.8. VARIANTI DEI PRECEDENTI ESERCIZI

725

Esercizio 8.8.2. Sia f una funzione la cui trasformata di Fourier



1 se [0, 2]
fb() = [0,2] () =
0 se
/ [0, 2]
Per quali valori di si ha che

(f e2it f )b= 0?

1.  = 0
2.  <

1
2

3.  || > 2
4.  || < 1
5.  || >
6. 

1
2

nessuna delle precedenti.

Motivare la risposta.

1
Esercizio 8.8.3. Assumendo che la trasformata di Fourier di f (t) = 1 1+t
2 sia
fb() = e2|| , la funzione b
g () = 4 2 2 e2|| la trasformata di Fourier
della funzione:

1.  g(t) = 2f (t)

2.  g(t) = [f (t)]2
3.  g(t) = f (t)
p
4.  g(t) = f (t)
5. 

nessuna delle precedenti.

Motivare la risposta.

1
Esercizio 8.8.4. Assumendo che la trasformata di Fourier di f (t) = 1 1+t
2 sia
1
2||
b
g ()?
f () = e
, data g(t) = t2 , quale tra le seguenti funzioni b
1+

726

CAPITOLO 8. TRASFORMATA DI FOURIER


2

1.  3e 3 ||
2.  3e6||
3. 

1 3||
e
3
2

4.  9e 9 ||
5. 

nessuna delle precedenti.

Motivare la risposta.

1
Esercizio 8.8.5. Assumendo che la trasformata di Fourier di f (t) = 1 1+t
2 sia
fb() = e2|| , la funzione b
g () = e2|2| la trasformata di Fourier della
funzione:

1.  g(t) =

1
1
1+(t2)2

2.  g(t) =

2 1
1+ t2
4

3.  g(t) =

e4it
(1+t2 )

4.  g(t) =

1
1
2 (1+t2 )2

5. 

nessuna delle precedenti

Motivare la risposta.

Esercizio 8.8.6. Sia g(t) = f (4t + 1). Esprimere b


g in termini di fb.

Esercizio 8.8.7. Assumendo che la trasformata di Fourier di f (t) = [1,1] (t)


g =
sia fb() = 2 sin2 , e che la trasformata di Fourier di g(t) = e2|t| sia b
() 12 1+12 2 , la trasformata di Fourier di f[
g() quale delle seguenti
funzioni?

2
+ 1+12 2
1.  2 sin

R
2 +
d
2.  2 2 sin
1+ 2 2

sin 2(1)
3.  2 2 (1)(1+
2 2 )

8.8. VARIANTI DEI PRECEDENTI ESERCIZI

727

2 sin2 1+12 2

sin 2
5.  2 2 212 1+
2 2
4. 

6. 

nessuna delle precedenti.

Motivare la risposta.

Esercizio 8.8.8. Sia f una funzione la cui trasformata di Fourier



1 se [1/2, 1/2]
fb() = [1/2,1/2] () =
0 se
/ [1/2, 1/2]
Per quali valori di si ha che

1.  <

(f e2it f )b= 0?

1
2

2.  || > 1
3.  = 0
4.  || >

1
2

5.  || < 1
6. 

nessuna delle precedenti.

Motivare la risposta.

1
Esercizio 8.8.9. Assumendo che la trasformata di Fourier di f (t) = 1 1+t
2 sia
fb() = e2|| , quale tra le seguenti funzioni la trasformata di Fourier di
2t
g(t) = 1 (1+t
2 )2 ?

1. 

2e2||

2. 

2ie2||

3. 

e2||
2i

4. 

nessuna delle precedenti.

728

CAPITOLO 8. TRASFORMATA DI FOURIER

Motivare la risposta.

Esercizio 8.8.10. Sia f una funzione la cui trasformata di Fourier



1 se [0, 1]
fb() = [0,1] () =
0 se
/ [0, 1]
Per quali valori di si ha che

1.  || <

(f e2it f )b= 0?

1
2

2.  || > 1
3.  || < 1
4.  || > 2
5.  = 0
6. 

nessuna delle precedenti.

Motivare la risposta.

1
Esercizio 8.8.11. Assumendo che la trasformata di Fourier di f (t) = 1 1+t
2
2||
2|+1|
b
f () = e
la funzione b
g () = e
la trasformata di Fourier della
funzione

1.  g(t) =

1
1
1+(t+1)2

2.  g(t) =

e2it 1

1+t2

3.  g(t) =

1
1
2 (1+t2 )2

4.  g(t) =

e2it 1
1+t2

5. 

nessuna delle precedenti

Motivare la risposta.

Esercizio 8.8.12. Sia g(t) = f (3t + 1). Esprimere gb in termini di fb.

8.8. VARIANTI DEI PRECEDENTI ESERCIZI

729

Esercizio 8.8.13. Assumendo che la trasformata di Fourier di f (t) = [1/2,1/2]


g () =
sia fb() = sin e che la trasformata di Fourier di g(t) = e|t| sia b
2
[
, la trasformata di Fourier di f g() quale delle seguenti funzioni?
1+4 2 2
1.  2 sin
2. 

R +

d
1+4 2 2

2 sin
(1+4 2 2 )

3. 2 sin (1+41 2 2 )
4. 

5. 

sin (1/2)
1
2 (1/2)(1+4 2 2 )

6. 

sin

2
1+4 2 2

nessuna delle precedenti.

Motivare la risposta.

Esercizio 8.8.14. Assumendo che la trasformata di Fourier di f (t) = [1,1] sia


2
e che la trasformata di Fourier di g(t) = e|t| sia b
g () 1+42 2 2 ,
fb() = sin
la trasformata di Fourier di f[
g() quale delle seguenti funzioni?

1.  2 2

sin 2

1
1+4 2 2

R
2 +
2.  2 2 sin

sin 2
3.  2 2 (1+4
2 2 )
4. 

d
1+4 2 2

2 sin 2(1)
(1)(1+4 2 2 )

2
5.  2 2 sin
(1 + 4 2 2 )
6. 

nessuna delle precedenti

Motivare la risposta.

1
Esercizio 8.8.15. Assumendo che la trasformata di Fourier di f (t) = 1 1+t
2
2||
sia fb() = e
, quale tra le seguenti funzioni la trasformata di Fourier
1
di g(t) = 1+4t2 ?

730

CAPITOLO 8. TRASFORMATA DI FOURIER

1. 

1 ||
e
2

2. 

1 2||
e
4

3.  4e 2 ||
4.  2e4||
Motivare la risposta.

Esercizio 8.8.16. Sia g(t) = f (2t + 1). Esprimere gb in termini di fb.

Esercizio 8.8.17. Sia f una funzione la cui trasformata di Fourier



1 se [1, 1]
b
f () = [1,1] () =
0 se
/ [1, 1]
Per quali valori di si ha che

1.  || > 2
2.  <

(f e2it f )b= 0?

1
2

3.  = 0
4.  || > 1
5.  || >
6. 

1
2

nessuno dei precedenti.

Motivare la risposta.

1
Esercizio 8.8.18. Assumendo che la trasformata di Fourier di f (t) = 1 1+t
2
2||
3
3 2||
b
sia f () = e
, la funzione b
g () = 8 i e
la trasformata di
Fourier della funzione:

1.  g(t) = [f (t)]3

2.  g(t) = f (t)
p
3.  g(t) = 3 f (t)

8.8. VARIANTI DEI PRECEDENTI ESERCIZI

731

4.  g(t) = 3f (t)
5. 

nessuna delle precedenti

Motivare la risposta.

Esercizio 8.8.19. Sia f (t) = [1,2] (t). Quanto vale


Z

b 2
f () d?

1.  1
2.  0
3.  3
4.  2
5. 

nessuna delle precedenti

Motivare la risposta.

Esercizio 8.8.20. Sia f una funzione la cui trasformata di Fourier



1
se
[0, 1]
fb() = [0,1] () =
0
se

/ [0, 1]

Per quali valori di si ha che (f e2it f )b = 0?


1.  || > 1
2.  || >

1
2

3.  || <

1
2

4.  || < 1
5. 

nessuno dei precedenti.

Motivare la risposta.

732

CAPITOLO 8. TRASFORMATA DI FOURIER

Esercizio 8.8.21. Sia f (t) = [1/2,1] (t). Quanto vale


Z

b 2
f () d?

1. 

1
2

2. 

3
2

3.  1
4.  0
5. 

nessuna delle precedenti

Motivare la risposta.

1
2||)
b
Esercizio 8.8.22. Se la trasformata di Fourier di f (t) = 1 1+t
2 f () = e
e la trasformata di Fourier di g(t) = [1/2,1/2] (t) widehatg() = sin()
,

[
allora quale tra le seguenti funzioni f g()?

1.  e2|| sin()

2.  e2|| sin()

3.  e2||

sin ( 21 )
( 12 )

4.  e2|| +

sin()

5.  nessuna delle precedenti


Motivare la risposta.
Esercizio 8.8.23. Sia f una funzione la cui trasformata di Fourier

1
se
[1, 1]
fb() = [1,1] () =
0
se

/ [1, 1]

Per quali valori di si ha che (f e2it f )b = 0


1.  || 6 1

8.8. VARIANTI DEI PRECEDENTI ESERCIZI

733

2.  || > 2
3.  || > 1
4.  || 6 2
5. 

nessuna delle precedenti

Motivare la risposta.

1
2||
b
Esercizio 8.8.24. Se la trasformata di Fourier di f (t) = 1 1+t
2 f () = e
allora la funzione b
g () = 2 2 e2|| la trasformata di Fourier di quale delle
seguenti funzioni?

1. 

14 D 2 f

2.  D 2 f
3.  [f (t)]2
p
4.  2 f (t)
5. 

nessuna delle precedenti

Motivare la risposta.

Esercizio 8.8.25. Sia f (t) = 2[1,2] (t). Quanto vale


Z

b 2
f () d

1.  4
2.  1

3.  12
4.  0
5. 

nessuna delle precedenti

Motivare la risposta.

734

CAPITOLO 8. TRASFORMATA DI FOURIER

Esercizio 8.8.26. Sia f una funzione la cui trasformata di Fourier



1
se
[1, 2]
fb() = [1,2] () =
0
se

/ [1, 2]

Per quali valori di si ha che (f e2it f )b = 0


1.  = 0
2.  || < 1
3.  || < 3
4.  || > 3
5.  || > 2
6. 

nessuno dei precedenti.

Motivare la risposta.

Esercizio 8.8.27. Se fb nulla al di fuori dellintervallo [2, 2], per quali valori
di si ha che (f e2it f )b = 0?
1.  = 0
2.  || 6

1
2

3.  || 6 1
4.  || > 2
5.  || > 1
6.  || > 2
7. 

nessuna delle precedenti

Motivare la risposta.

1
2||
b
Esercizio 8.8.28. Se la trasformata di Fourier di f (t) = 1 1+t
,
2 f () = e
4 4 2||
allora la funzione b
g () = e
la trasformata di Fourier di quale delle
seguenti funzioni?

8.8. VARIANTI DEI PRECEDENTI ESERCIZI


1. 

735

1 (iv)
f (t)
16

2.  f (iv) (t)
3.  [f (t)]4
p
4.  4 f (t)
5. 

nessuna delle precedenti

Motivare la risposta.

Esercizio 8.8.29. Sia f una funzione la cui trasformata di Fourier



1
se
[0, 1]
fb() = [0,1] () =
0
se

/ [0, 1]

Per quali valori di si ha che (f e2it f )b = 0


1.  = 0
2.  || 6 1
3.  || > 2
4.  || > 1
5.  || > 2
6. 

nessuno dei precedenti.

Motivare la risposta.

Esercizio 8.8.30. Sia f (t) = [0, 1 ] (t). Lintegrale


2

ha uno dei seguenti valori. Quale?


1. 

1
2

2.  1



b 2
f () d

736

CAPITOLO 8. TRASFORMATA DI FOURIER

3.  2
4.  0
5.  nessuna delle precedenti
Motivare la risposta.

Esercizio 8.8.31. Sia f (t) = [ 1 , 1 ] (t). Lintegrale


2 2

ha uno dei seguenti valori. Quale?


1. 



b 2
f () d

1
2

2.  1
3.  2
4.  0
5.  nessuno dei precedenti
Motivare la risposta.

Esercizio 8.8.32. Sia f (t) = [1,1] (t). Lintegrale


Z +

b 2
f () d

ha uno dei seguenti valori. Quale?


1. 

1
2

2.  1
3.  2
4.  0
5.  nessuno dei precedenti
Motivare la risposta.

Capitolo 9
Classe di Schwartz e trasformata
di Fourier
In questo capitolo introduciamo e studiamo uno spazio assai ristretto di funzioni molto regolari su R, con propriet di convergenza estremamente forti.
Questo spazio, divenuto di impiego comune dopo che Laurent Schwartz nel
1951 lo utilizz per sviluppare la teoria delle distribuzioni (che vedremo in
seguito nella Parte III), si chiama la classe di Schwartz, ovvero anche la classe
di funzioni a decrescenza rapida.

9.1

Convergenza indotta da famiglie di seminorme

La seguente nozione stata gi introdotta in un contesto pi generale (Denizione 3.5.1):


Definizione 9.1.1. Dato uno spazio vettoriale V si dice che una funzione
p : V R una seminorma se
(i) p(v) > 0

v V

(ii) p(v1 + v2 ) 6 p(v1 ) + p(v2 )


(iii) p(v) = ||p(v)

v1 , v2 V

v V, R.

Una seminorma non in generale una norma, perch non richiediamo che si
abbia p(v) = 0 v = 0.
737

738

CAPITOLO 9. CLASSE DI SCHWARTZ

Nonostante il fatto che una seminorma non sia una norma, se V munito di una famiglia di seminorme possiamo introdurre su V una nozione di
convergenza simile a quella usata per gli spazi normati (veramente, piuttosto
pi simile a quella degli spazi metrici: si veda fra poche righe la Nota 9.1.3).
In eetti, abbiamo gi introdotto una nozione di convergenza nel caso di
famiglie di seminorme nella Nota 3.17.2, che riassumiamo qui di seguito:
Definizione 9.1.2. Sia {pn }nN una famiglia al pi numerabile di seminorme
sullo spazio vettoriale V e {vj }jN una successione di vettori in V . Su V viene
indotta dalle seminorme pn la seguente nozione di convergenza:
lim vj = v

se per ogni seminorma pn si ha


lim pn (vj v) = 0

cio se per ogni > 0 esiste j0 N, j0 = j0 (, n), tale che, se j > j0 , si ha


pn (vj v) < .
Nota 9.1.3. Questa topologia indotta sullo spazio vettoriale V dalla famiglia
numerabile di seminorme pn della precedente Denizione 9.1.2 rende V uno
spazio metrico invariante per traslazione, ossia uno spazio vettoriale topologico (Denizione 3.1.1) la cui topologia indotta da una metrica invariante
per traslazione. Infatti, si ottiene una distanza d su V nel modo seguente:
d(x, y) =

X
n=1

2n

p(x y)
.
1 + p(x y)

Ovviamente questa serie convergente perch la funzione h(t) = t/(1 + t) ha


valori fra 0 e 1 per t > 0, e quindi i termini della serie, 2n h(p(x y)), sono
maggiorati da 2n . Lunica propriet di d che non ovvia la disuguaglianza
triangolare, per dimostrare la quale occorre osservare che la funzione h
concava nella semiretta {t > 0}, e quindi sublineare: h(u + v) 6 h(u) + h(v)
(la disuguaglianza stretta se u, v > 0, ma non ci serve). Da questo segue
che d(x, y) 6 d(x, z) + d(z, y) per ogni x, y, z V .

Definizione 9.1.4. Assumeremo sempre che la famiglia di seminorme sia


separante, ossia che, per ogni x 6= y V , esista una seminferma pn tale che

9.1. CONVERGENZA RISPETTO A FAMIGLIE DI SEMINORME

739

pn (x y) 6= 0, ossia che per ogni v 6= 0 V si abbia pn (v) 6= 0 per qualche n.


Se cos non , la topologia indotta dalla famiglia di seminorme non separa v
da 0, ossia d(v, 0) = 0. In tal caso la topologia non soddisfa la propriet T0
(Nota 1.10.11), ossia i punti non sono chiusi. Questo pu avvenire anche in
uno spazio normato: ad esempio, lo spazio di tutte le funzioni la cui norma
Lp nita contiene funzioni non nulli la cui norma zero: tutte le funzioni
nella classe di equivalenza di Lebesgue della funzione identicamente nulla.
Per questo motivo abbiamo ridenito Lp come spazio di classi di equivalenza
di Lebesgue di funzioni e non come spazio di funzioni (Nota 1.16.12).
Nota 9.1.5. Nonostante la denizione di convergenza rispetto ad una famiglia
di seminorme sia simile a quella che vale per uno spazio normato, si tenga
presente che molti spazi la cui topologia indotta da una famigli numerabile
di seminorme, o persino di norme, non sono spazi normati, ovvero la loro
topologia non equivalente a quella indotta da ununica norma: si vedano
esempi nella Sezione 3.20.
Rammentiamo inoltre quanto gi visto in alcune osservazioni illustrate nella
Nota 3.17.2, che qui richiamiamo: gli aperti elementari che insieme ai loro
traslati descrivono la topologia (o meglio, da cui si generano tramite loperazione di unione tutti gli altri aperti aperti di base locale, come si dice in
Topologia: si veda la Denizione 1.10.1) sono generati in modo pi sottile: non basta considerare le palle On () {v : pn (v) < }, bisogna invece
prendere le intersezioni nite
On1 ,..., nk () := On1 () Onk ()
= {pn1 (vj v) < , pn2 (vj v) < , . . . , pnk (vj v) < } .
Infatti, si consideri il caso dello spazio bidimensionale R2 (o C2 ) munito
delle due seminorme pi (x1 , x2 ) = |xi | (qui i = 1, 2. Le palle rispetto a
ciascuna seminorma sono illimitate (sono strisce aperte centrate su uno dei
due assi coordinati). Invece lintersezione delle palle indotte da ciascuna delle
seminorme consiste di rettangoli aperti centrati nellorigine: questi rettangoli
sono inclusi in sfere euclidee e viceversa, quindi ogni aperto usuale una
opportuna unione di essi.
Si noti che occorre limitare lattenzione ad intersezioni finite di palle: in
generale le intersezioni innite non danno luogo ad aperti.

Esempio 9.1.6. Gli spazi C (K) e C (R). Sia K R un intervallo chiuso


e limitato. Lo spazio C (K) consiste delle funzioni derivabili innite volte

740

CAPITOLO 9. CLASSE DI SCHWARTZ

su K. Ovviamente ogni derivata, essendo a sua volta derivabile, continua


su K e quindi limitata per il Teorema di Weierstrass sulla esistenza dei
massimi e dei minimi delle funzioni continue sui compatti (si veda [19, Cap. 16
(Appendice)]). Introduciamo su C (K) le seguenti seminorme: per ogni
n N,
rn (f ) = kD n f k .
Allora, se fj , f C (K), si ha

lim fj = f

se e solo se per ogni > 0, per ogni n1 , n2 , . . . , nk esiste j0 N tale che, per
ogni j > j0 , si ha fj f On1 ,..., nk (), ossia
rn1 (fj f ) < , rn2 (fj f ) < , . . . , rnk (fj f ) < .
La stessa nozione di convergenza pu essere espressa mediante la famiglia
numerabile delle seguenti norme:
pn (f ) = max kD j f k .
06j6n

Queste pn sono norme perch, se pn (f ) = 0, allora in particolare kf k = 0 e


quindi f = 0.
Osserviamo che pm (f ) 6 pn (f ) se m < n. Allora, se fj , f C (K), si ha
lim fj = f

se e solo se per ogni > 0 e per ogni n1 < n2 < < nk , esiste j0 N tale
che, per ogni j > j0 ,
pn1 (fj f ) > pn2 (fj f ) < > pnk (fj f ) < .
Ma in questo caso lultima norma, pnk , maggiore delle altre, e quindi basta
richiedere pnk (fj f ) < .
Osserviamo che si pu scegliere in C (K) una seconda famiglia di norme che
produce la stessa nozione di convergenza, come segue:
qn (f ) =

n
X
i=0

kD i f k .

9.2. CONTINUIT RISPETTO A FAMIGLIE DI SEMINORME

741

Le norme qn sono quasi equivalenti alle pn , nel senso che, per n N,


pn 6 qn 6 npn
(la verica ovvia).
La convergenza in C (K), espressa in termini delle norme qn , diventa:
lim fj = f

se per ogni n N
lim

n
X
i=0

kD i (fj f )k = 0 .

Inne, la nozione di convergenza nello spazio C (R) data dalla famiglia


numerabile di seminorme
pN (f ) := max{|D m (f )|(x) : |x| 6 N, 0 6 m 6 N}
con N N. Con la topologia indotta da questa famiglia di seminorme,
C (R) uno spazio metrico completo localmente convesso (ogni suo elemento
ha un intorno aperto convesso), ovvero, come si suol dire, uno spazio di
Frchet (Denizione 3.1.1). Questo spazio contiene come sottospazi chiusi
(muniti delle loro rispettive topologie) tutti gli spazi delle funzioni C con
supporto in un dato compatto K, per ogni tale K.
Gli spazi C (K) e C (R) sono esempi di spazi vettoriali topologici la cui
topologia indotta da una famiglia numerabile di norme, ma non pu essere
indotta da ununica norma (si veda la dimostrazione nel Corollario 3.20.2).

9.2

Continuit di operatori e funzionali lineari


su spazi con famiglie numerabili di seminorme

Qui estendiamo la Proposizione 4.6.3 allambito degli spazi vettoriali nei quali
la convergenza data da una famiglia numerabile di seminorme. Il prossimo
risultato un caso particolare della Nota ??.

742

CAPITOLO 9. CLASSE DI SCHWARTZ

Proposizione 9.2.1. Sia V uno spazio vettoriale in cui la nozione di convergenza indotta da una famiglia di seminorme pn nel senso della Definizione
9.1.2. Un operatore lineare T : V 7 V continuo se e solo se vale la
condizione seguente:
per ogni n N esistono una famiglia nita n1 , . . . , nk N e una costante
Cn tali che, per ogni v V ,
pn (T v) < Cn

k
X

pni (v)

k
X

pni (v).

i=1

(o equivalentemente, con una nuova costante Cn = kCn , si ha pn (T v) <


Cn maxki=1 pni (v)). Ancor pi in generale, se W un altro spazio munito di
seminorme qn , loperatore lineare T : V 7 W continuo se e solo se vale la
condizione seguente:
per ogni n N esistono una famiglia nita n1 , . . . , nk N e una costante Cn
tali che, per ogni v V ,
qn (T v) < Cn

i=1

In particolare, se per qualche n, m si ha qn (T v) < Cpn (v), allora T : V 7 W


continuo.
Dimostrazione. ovvio che la condizione suciente: proviamolo considerando direttamente il caso generale T : V 7 W .
Se v v0 allora pm (v v0 ) 0 per ogni m, quindi
qn (T v T v0 ) < Cn

k
X
i=1

pni (v v0 ) 0

per ogni n.

Perci T v T v0 . Questo argomento (per la sola condizione suciente) vale


anche se si assume la disuguaglianza rispetto ad una sola seminorma.
Per vedere che la condizione necessaria, osserviamo che, dal momento che
loperatore lineare, a meno di traslazione basta dimostrare che continuo
allorigine (si veda lEsercizio 3.3.3). A questo scopo occorre far vedere che
essa mostra che la controimmagine di un aperto della base locale allorigine in
W deve contenere un intorno aperto di base allorigine in V . Per questo, basta
reinterpretare la disuguaglianza pn (T v) < Cn maxki=1 pni (v). Essa signica

9.3. CLASSE DI SCHWARTZ

743

che, per ogni > 0 esiste un intorno di base dellorigine On1 ,..., nk () V tale
che, per ogni v in questo intorno, pn (T v) < Cn , ossia pn (T v) appartiene ad
una preassegnata palla aperta in W di centro lorigine e raggio Cn , e quindi
proprio che la controimmagine sotto T di una palla aperta in W contiene un
aperto di base in V . Per una spiegazione lievemente pi dettagliata si veda
la Nota 3.17.2.

In particolare questo risultato si applica a funzionali lineari continui:

Corollario 9.2.2. Se la nozione di convergenza nello spazio V determinata


da una famiglia numerabile di seminorme pn , un funzionale lineare F su V
continuo se e solo se esistono n1 , . . . , nk N e una costante C tali che,
per ogni v V ,
k
X
|F (v)| < C
pni (v).
i=1

In particolare, se il funzionale verifica |F (v)| < Cpn (v) per una seminorma
pn e per qualche costante C > 0, allora continuo.

9.3

La classe di Schwartz

Definizione 9.3.1. La classe di Schwartz lo spazio vettoriale di tutte le


funzioni f : R 7 C derivabili innite volte e a decrescenza rapida, cio che
tendono a zero allinnito con tutte le loro derivate a velocit superiore a
1
, dove p un qualsiasi polinomio:
p(x)



k l
S = f : R 7 C : f C (R) e, per ogni k, l N, lim x D f (x) = 0
x

Nota 9.3.2. S contenuto in L1 (R). Questa una conseguenza ovvia della


decrescenza rapida. Infatti, ricordando che lintegrale
Z
1
dx
2
1 + x
convergente, notiamo che se f S, allora la funzione derivabile (1 +
x2 )|f (x)| tende a zero allinnito e quindi ha massimo nito. Perci
sup(1 + x2 )|f (x)| = C <
xR

744

CAPITOLO 9. CLASSE DI SCHWARTZ

e quindi
Z

|f (x)| dx =

 |f (x)|
dx 6 C
1+x
1 + x2
2

1
dx < .
1 + x2

Nota 9.3.3. Per ogni coppia k, l N la funzione


pkl : S 7 R+ {0}
denita da


pkl (f ) = sup 1 + |x|k |D l f (x)|
xR

una seminorma, nel senso della Denizione 9.1.1. Inoltre p00 una norma
(la norma uniforme) e cos anche pk0 per ogni k N.
(Vedremo nella successiva Nota 9.3.5 che, in S, tutte queste seminorme in
realt sono norme).

Proposizione 9.3.4.
S = {f : R 7 C : f C (R), e pkl (f ) <

per ogni k, l N} .

Dimostrazione. Sia pkl (f ) <


 e poniamol C = pkl (f ). Allora per ogni x R
l
k
si ha |D f (x)| < C/ 1 + |x| ; quindi D f tende a zero allinnito almeno
altrettanto rapidamente di Qk1(x) dove Qk un qualsiasi polinomio di grado k
1
e quindi pi rapidamente di Qk1
. Ne segue che, se pkl < per ogni k, l,
(x)
allora f S. Il viceversa evidente, perch se una funzione innitamente
derivabile f tale che xk D l f (x) tende a zero allinnito con tutte le derivate,
come succede a ogni f S, allora |xk D l f (x)| deve avere un punto di massimo
e quindi un valore massimo nito.

Nota 9.3.5. Quando ristrette a S tutte le seminorme pkl sono norme. Infatti,
siccome 1 + |x|k 6= 0 per ogni x R, se pkl (f ) = 0 si deve avere D l f (x) 0.
Per l = 0 questo signica che f 0 e quindi pk0 una norma come gi
osservato. Se pk1 (f ) = 0 allora Df 0 e quindi f ha per graco una retta.
Allora, poich f tende a zero allinnito, deve essere f 0. Quindi, su S, pk1
una norma. Nello stesso modo si vede che pkl (f ) := k(1 + |x|k )D l f k = 0
implica che D l f 0, perch 1 + |x|k 6= 0, pertanto f un polinomio: allora
f tende a zero allinnito se e solo se f 0, e quindi pkl |S una norma.

9.3. CLASSE DI SCHWARTZ

745

Qui abbiamo usato il fatto che 1 + |x|k non si annulla mai: proprio per
questo scopo che abbiamo denito le seminorme pkl con il fattore 1 + |x|k
anzich |x|k . (In realt la scelta di inserire laddendo 1 molto conveniente
anche per un altro motivo: ci permette di dividere dentro la seminorma per
il fattore mai nullo 1 + |x|k , ad esempio quando ci servono disuguaglianze del
tipo |D l f (x)| 6 pkl (f )/(1 + |x|k ). Avremo spesso bisogno di queste divisioni:
si veda ad esempio la dimostrazione del prossimo Teorema di completezza
9.4.3, e poi del Lemma 9.6.2 e del Corollario 9.7.4).
Se invece avessimo scelto le seminorme
qkl (f ) = sup |x|k |D l f (x)| ,
xR

che si annullano per ogni f solo per x = 0, lo stesso ragionamento avrebbe


provato che D l f (x) = 0 per ogni x 6= 0, e quindi, grazie alla continuit di
D l f , avremmo raggiunto la stessa conclusione, D l f 0. In eetti, avremmo
ottenuto la stessa classe di Schwartz partendo dalle seminorme qkl invece che
dalle pkl . Per provarlo, basta osservare che qkl < pkl 6 q0l + qkl , e quindi il
fatto che una di queste due famiglie di seminorme di f sia nita implica che
sia nita laltra.

Esempio 9.3.6. La Gaussiana (x) = ex introdotta in Sezione 8.3 appar2


tiene a S. Pi semplicemente, la funzione (x) = ex in S. Infatti
C (R), limx (x) = 0 e per ogni polinomio P si ha
2

lim P (x)ex = 0

perch lesponenziale tende a zero pi velocemente di


polinomio P (Sezione 1.1). Perci si ha
2

(x) = 2xex 0 per


2

1
P (x)

(x) = 2xex + 4x2 ex = (4x2 2x)ex 0 per

e pi in generale per ogni l esiste un polinomio Q tale che


D l (x) = Q(x)(x),
per induzione su l. Perci
lim D l (x) = 0

per qualunque

746

CAPITOLO 9. CLASSE DI SCHWARTZ

e, pi in generale,
lim R(x)D l (x) = 0

per ogni polinomio R.

9.4

Completezza della classe di Schwartz

Abbiamo munito la classe di Schwartz non di una norma, ma di una famiglia


numerabile di seminorme. Sappiamo che, se uno spazio vettoriale V normato, la norma induce una distanza (o metrica) invariante d nel modo seguente:
per ogni x, y V , d(x, y) kx yk ((1.4) e (1.5)). Per comodit del lettore,
ripetiamo la denizione di metrica invariante su uno spazio vettoriale.
Definizione 9.4.1. Sia V uno spazio vettoriale. Una funzione d : V V 7
R+ 0 si chiama una metrica invariante se verica le propriet di una metrica,
cio
d(x, y) = 0 se e solo se x = y
d(x, y) 6 d(x, z) + d(z, x) per ogni x, y, z (disuguaglianza triangolare)
e se inoltre invariante per traslazione: d(x z, y z) = d(x, y) per ogni x,
y, z.
Nonostante il fatto che lo spazio S non sia normato, esso munito di una
metrica invariante, come abbiamo visto nella Nota 9.1.3, che riprendiamo pi
in generale nella prossima osservazione.
Nota 9.4.2. In uno spazio vettoriale munito di una famiglia numerabile di
1
seminorme
P pi , i N, per ogni successione in di numeri positivi ci tali che
C := i=0 ci < la funzione

X
ci pi (x y)
d(x, y) =
1 + pi (x y)
i=0

una metrica invariante. Pi in generale, per ogni successione ci 0+ , la


funzione
ci pi (x y)
d(x, y) = max
i=N 1 + pi (x y)

9.4. COMPLETEZZA DI S

747

una metrica invariante. Linvarianza per traslazione ovvia perch il secondo membro dipende solo da x y; la disuguaglianza triangolare segue dal
fatto che il secondo membro coinvolge la quantit f (pi (x y)), dove f la
funzione sublineare
t
f (t) =
1+t
introdotta nella Nota 9.1.3.
facile vedere che le palle con centro lorigine di questa metrica formano
una base locale per la topologia indotta dalle seminorme, e viceversa, una
base locale di quella topologia forma una base locale della topologia indotta
dalla metrica [25, Chapter 1, Section 38]. Quindi la nozione di convergenza
data dalla famiglia di seminorme equivalente alla convergenza indotta da
questa metrica.
Si noti anche che, se {pi (xj )}jN di Cauchy per ogni i, ossia
P pi (xj xk ) <
per j, k abbastanza grandi, allora anche d(xj xk ) <
i=0 ci = C per
questi j, k, e viceversa se {d(xj )} di Cauchy, allora {pi (xj )}jN di Cauchy,
perch pi (xj xk ) < d(xj xk )/ci . Quindi una successione di Cauchy
rispetto alla metrica se e solo se lo rispetto a tutte le seminorme.

Ora dimostriamo una importante propriet della convergenza in S.


Teorema 9.4.3. (Completezza di S.) La classe di Schwartz uno spazio
completo: se una successione {fi } S di Cauchy, cio se per ogni seminorma pkl , k, l N, la successione numerica {pkl (fi )}iN di Cauchy, allora
fi converge nel senso di S ad una funzione f in S.
Dimostrazione. Lipotesi dice
 lche, per ogni k, l, la successione di funzioni
k
limitate {uk,l,i} 1 + |x| D fi (x) uniformemente convergente: chiamiamo hkl il suo limite uniforme, che ovviamente una funzione limitata, perch
la convergenza uniforme preserva la limitatezza (Teorema 1.3.13). Scriviamo

hkl = 1 + |x|k g0l (x) .


Allora tutte le hkl , ed a maggior ragione g0l , sono limitate, e, poich 1 + |x|k >
0, per ogni l le derivate D l fi convergono uniformemente a g0l : infatti,

l
D fi g0l = sup

xR

1
|uk,l,i(x) hkl | 6 kuk,l,i hkl k 0 .
i
1 + |x|k

748

CAPITOLO 9. CLASSE DI SCHWARTZ

Abbiamo visto che la funzione g00 = h00 il limite uniforme delle fi , e g0l
il limite uniforme delle corrispondenti derivate D l fi : allora, per il Teorema
di Derivazione delle successioni di funzioni uniformemente convergenti con le
derivate (Teorema
1.3.19) si ha g0l = D l g00 per ogni l. Ora, moltiplicando

per 1 + |x|k ed osservando che g00 = h00 otteniamo

hkl = 1 + |x|k g0l (x) = (1 + |x|)k D l g00 (x) = (1 + |x|)k D l h00 (x).

Poich hkl limitata,


le
 llultima identit prova che h00 appartiene a S.
 Inoltre
k
k
l
funzioni 1 + |x| D fi (x) convergono uniformemente a 1 + |x| D h00 (x)
per ogni k, l: questo equivale a dire che fi h00 nel senso di S.

9.5

Esempi di operatori lineari continui sulla


classe di Schwartz

Anzitutto, notiamo che c un esempio facile di operatore continuo sulla classe


di Schwartz:
Esercizio 9.5.1. Loperatore di traslazione sulla classe di Schwartz S denito
da
(x f )(t) = f (t x),

per ogni f S

continuo da S in S.
Svolgimento: premettiamo che, in base al Teorema del Binomio di Newton
(Sezione 1.1), per ogni t, x R, k N abbiamo
k  
X
k
|x|km |t|m .
|t + x| 6
m
m=0
k

Da questo, dal fatto che derivate e traslazioni commutano e dalla disuguaglianza banale 1 + c|t|k < c(1 + |t|k ) per ogni c > 1, per tutti gli interi k, l si

9.5. OPERATORI LINEARI CONTINUI SU S

749

ottiene
(1 + |t|k )|Dtl (x f )(t)| = (1 + |t|k )x |D l f (t)| = (1 + |t|k )|(D l f )(t x)|
!
k  
X
k
|x|km |t|m |D l f (t)|
= (1 + |t + x|k )|D l f (t)| 6 1 +
m
m=0
!
k  
X
k
|x|km|t|m |D l f (t)|
6 (1 + |x|)k +
m
m=0
k  
X
k
|x|km (1 + |t|m )|D l f (t)| .
6
m
m=0

Quindi
pkl (x f ) = sup{(1 + |t|
t

)|Dtl (x f )(t)|}

k  
X
k
|x|km pml (f ) .
6
m
m=0

Consideriamo ora i seguenti altri tre esempi meno banali: la derivata


l-esima; la moltiplicazione per una funzione data; la trasformata di Fourier.
Per il secondo esempio, per, occorre che la funzione usata per moltipli2
care non cresca troppo rapidamente: ad esempio (x) = ex S, ma 1
/S
1
(non tende a zero allinnito) e quindi se h(x) = (x)
si ha h(x)(x) = 1
/ S.
Definizione 9.5.2. Una funzione h su R a crescita polinomiale con tutte
le sue derivate se h C (R) e per ogni l esistono un intero k = k(l) e una
costante C = Cl tali che

|D l h(x)| 6 C 1 + |x|k(l)
x R .

Questo evidentemente equivale al fatto che che ciascuna derivata sia maggiorata asintoticamente da un polinomio sia per x sia per x ).
Ora possiamo presentare gli esempi.

Esempio 9.5.3. Per ogni intero l loperatore di derivata l-esima D l manda S


in S ed iniettivo e continuo.

750

CAPITOLO 9. CLASSE DI SCHWARTZ

Esempio 9.5.4. Sia h a crescita polinomiale con tutte le sue derivate. Allora
loperatore M denito da Mh f (x) = h(x)f (x) per ogni x R manda S in
S ed continuo. Viceversa, se h cresce a velocit esponenziale, allora esiste
f S tale che hf
/ S.

Esempio 9.5.5. Sia F loperatore di trasformazione di Fourier, denito su


L1 (R) da
Z
b
Ff (s) = f (s) =
f (t)e2ist dt.

Allora F manda S in S in maniera iniettiva e surgettiva ed continuo su S.

Di questi tre esempi il primo il pi facile da dimostrare e lo facciamo


qui. Agli altri due dedichiamo le prossime due sezioni.
Svolgimento dellEsempio 9.5.3. Per tutti gli interi j, k, l si ha


pkl D j f = sup 1 + |x|k |D l D j f (x)| = pk,l+j (f ).
x

Perci D j continuo su S in base alla Proposizione 9.2.1. Per dimostrare


che D j iniettivo e surgettivo su S, basta dimostrarlo nel caso j = 1 e poi
procedere con un ovvio argomento induttivo (che tralasciamo). Loperatore
D iniettivo perch se due funzioni f , g in S vericano f g , allora f g
costante: ma poich tendono entrambe a zero allinnito, la costante deve
essere zero e f = g.

9.6

Moltiplicazione per funzioni a crescita polinomiale con tutte le derivate

In questa Sezione sviluppiamo e dimostriamo lEsempio 9.5.4. A questo scopo


abbiamo bisogno di due premesse.
Lemma 9.6.1. Se f, h sono due funzioni derivabili l volte, allora
l  
X
l
D j hD lj f
D (hf ) =
j
j=0
l

dove

l
j

il simbolo combinatorio

l
j

l!
j!(lj)!

9.6. PRODOTTO CON FUNZIONI A CRESCITA POLINOMIALE

751

Dimostrazione. La dimostrazione la stessa del Teorema del binomio di


Newton,
l  
X
l j lj
l
ab
(a + b) =
j
j=0
e si fa per induzione su l (si veda [19, Cap. 1 (Appendice)])).

Lemma 9.6.2. Per tutti gli interi m, n esiste C = C(m, n) tale che

(1 + |x|m ) (1 + |x|n ) 6 C 1 + |x|m+n .
Ad esempio, la disuguaglianza vale per C = 4.

Dimostrazione. Largomento della dimostrazione una versione quantitativa


dellidea esposta alla ne della Nota 3.18.5, ma ora la rivediamo in dettaglio.
Dimostriamo prima la disuguaglianza per |x| > 1. Supponiamo che il pi
grande dei due interi sia n. Allora se |x| > 1 si ha |x|m 6 |x|n 6 |x|m+n e
quindi

(1 + |x|m ) (1 + |x|n ) = 1+|x|m +|x|n +|x|m+n 6 1+3|x|m+n < 3 1 + |x|m+n .
Quindi la disuguaglianza da dimostrare vale per C > 3. Ora consideriamo
il dominio 1 6 x 6 1. Limmagine della funzione 1 + |x|m in [1, 1]
lintervallo [1, 2] perch 0 6 |x|m 6 1 se |x| 6 1 (la funzione x xm
crescente per x > 0). Analogamente i valori di 1 + |x|n sono nellintervallo
[1, 2]. Quindi i valori di (1 + |x|m ) (1 + |x|n ) sono nellintervallo [1, 4]. Daltra
parte 1 + |x|m+n > 1. Quindi se |x| < 1 si ha

(1 + |x|m ) (1 + |x|n ) 6 4 6 4 1 + |x|m+n .
Perci in questo caso la disuguaglianza vale per C = 4.

Dimostrazione dellEsempio 9.5.4. Poich h a crescita polinomiale con tutte


le derivate, con la notazione della Denizione 9.5.2 per ogni intero j abbiamo
un intero k = k(j) e una costante Cj > 0 (che dipendono dalla scelta di h)
tali che



j
D h(x) 6 Cj 1 + |x|k(j)
per ogni x R .
(9.1)

752

CAPITOLO 9. CLASSE DI SCHWARTZ

In base alla Proposizione 9.2.1, per dimostrare lEsempio 9.5.4 basta provare
che, per tutti gli interi k, l, esiste A > 0 tale che, per ogni f S,
pkl (hf ) 6 A

l
X

pk+k(j), lj (f )

(9.2)

j=0

(qui la costante A, naturalmente, dipende da k e lnma non da f ).o



Proviamo la disuguaglianza (9.2). Sia B = max jl : 0 6 j 6 l . Allora,
per il Lemma 9.6.1 e per (9.1),
|D l (hf ) (x)| 6 B

l
X
j=0

|D j h(x)||D lj f (x)|

l
X


|D j h(x)|
1 + |x|k(j) D lj f (x)
= B
k(j)
1 + |x|
j=0

6 B

l
X
j=0



Cj 1 + |x|k(j) D lj f (x) .

Scriviamo K = max {Cj : 0 6 j 6 l}. Dalla disuguaglianza precedente e dal


Lemma 9.6.2 si ha, per ogni x R,
l
X





1 + |x|k 1 + |x|k(j) D lj (f )
1 + |x|k D l (hf )(x) 6 BK
j=0

6 4BK

l
X
j=0

e quindi
pkl (hf ) 6 C

l
X



1 + |x|k+k(j) D lj (f )

pk+k(j),lj (f )

j=0

con C = 4BK. Questo dimostra la disuguaglianza (9.2).


Viceversa, la moltiplicazione per una funzione a crescita esponenziale non
preserva la classe di Schwartz. Infatti, consideriamo il generico esponenziale
g(x) = e|x| . Esso tende a zero allinnito a velocit esponenziale, e la

9.7. TRASFORMATA DI FOURIER SU S

753

stessa cosa accade a tutte le derivate, perch per x 6= 0 la derivata g un


multiplo di g (con segno negativo se x < 0). Per g non una funzione di
Schwartz perch non derivabile in 0. Daltra parte, grazie alla Proposizione
6.1.5 (ii), se prendiamo una identit approssimata in L1 (R) data da una
funzione di classe C a supporto compatto, allora, ponendo come al solito
(x) = 1 ( x ), abbiamo che f = g di classe C e tende ancora a
zero a velocit esponenziale. Questultimo fatto segue dal fatto che non
negativa con integrale 1, e quindi h(x) una media integrale dei valori di h
nellintervallo dato dal supporto di ma traslato in modo che sia centrato in
x (pertanto il fatto che la decrescenza rimanga di velocit esponenziale vero
per ogni , quindi non ci sarebbe stato bisogno di introdurre la dilatazione
di passo , ma labbiamo introdotta perch il risultato pi evidente quando
piccolo).
Questo dimostra che, per ogni > 0, nella classe di Schwartz ci sono funzioni
f che tendono a zero allinnito (con tutte le derivate) come e|x| . Se ora h
cresce a velocit esponenziale per x , diciamo come ex , allora hf non
tende a zero allinnito, e quindi non appartiene a S. Lo stesso ragionamento
vale per x .

9.7

La trasformata di Fourier sulla classe di


Schwartz

Cominciamo questa Sezione con la dimostrazione dellEsempio 9.5.5.


Certi di rendere pi agevole seguire i prossimi calcoli, richiamiamo anzitutto
le propriet di commutazione fra derivazione e trasformata di Fourier viste
nel Teorema 8.2.4 (viii) e 8.2.4 (vii)):
c
D fb = 2ixf
c = 2i fb.
Df

In particolare, richiamiamo il Corollario 8.2.5:


Corollario 9.7.1. (Regole di commutazione.) Per ogni intero l > 0 e
per f S poniamo
P l f (x) = (2ix)l f (x).
Allora P l : S 7 S, P l continua su S e fra la trasformata di Fourier F,
loperatore P di moltiplicazione per 2ix, gli operatori P l = (1)l+1 P di

754

CAPITOLO 9. CLASSE DI SCHWARTZ

moltiplicazione per (2ix)l e loperatore di derivata D intercorrono le seguenti


relazioni di commutazione:
DF = FP ,
F D = P F.

Dalla prima regola di commutazione segue

D l F = FP l ;
dalla seconda,
F D l = (P )l F = (1)l P l F .
Pertanto,
P k D l F = (1)k FD k P l .

In particolare, se f S, allora, per ogni k, l N,


Z
l b
D (f )() =
P l f (t)e2it dt.

(2i) D fb() =
k

D k (P l f )(t)e2it dt.

(9.3)

Dimostrazione. Il fatto che P l f S per ogni f S e che P l sia continuo su


S sono stati mostrati nellEsempio 9.5.4. Tutto il resto il Corollario 8.2.5.

Nota 9.7.2. Le regole di commutazione del precedente Corollario 9.7.1 sono


molto familiari agli studiosi di meccanica quantistica, perch in quel contesto
loperatore di moltiplicazione per la posizione x rappresenta la misura della
posizione, mentre loperatore di derivata rappresenta (a meno di normalizzazione) la misura dellimpulso. Le suddette regole di commutazione permettono allora di dimostrare che posizione ed impulso in meccanica quantistica
non sono simulaneamente misurabili con accuratezza illimitata. Diamo un
accenno a questa applicazione della trasformata di Fourier nellAppendice
9.9.

Lemma 9.7.3. Per ogni f S e per ogni k, l N


pkl (fb) 6 p2,k (P l f ) + p2,0 (P l f ) .

In particolare fb S e loperatore lineare P l f 7 fb di moltiplicazione per il


monomio (2ix)l continuo su S per ogni l.

9.7. TRASFORMATA DI FOURIER SU S

755

Dimostrazione. Per provare la disuguaglianza dobbiamo stimare ||k D l fb().


In base a (9.3),
Z


1

k lb
|| D f () 6
|D k (P l f )(t)| dt.
(9.4)
(2)k
Osserviamo che la funzione
Z

1
1+t2

in L1 (R) e

1
dt = [arctan t]
( ) = .
=
2
1+t
2
2

Perci da (9.4) segue che


Z
|D k (P l f )(t)|
1
(1 + t2 ) dt
(2)k
1 + t2


 1 Z 1
2
k
l
6 sup (1 + t )|D (P f )(t)|
dt
(2)k 1 + t2
tR





|| D l fb() 6
k

p2,k (P l f ) 6 p2,k (P l f ) .
k
(2)

Ponendo k = 0 si trova

Quindi

|D l fb()| 6 p2,0 (P l f ).
pkl (fb)| 6 sup(1 + ||k )|D l (fb)()|
R

6 sup |D l (fb)()| + sup ||k |D l (fb)()|


R
R

l
6 p2,0 (P f ) + p2,k (P l f ) .

La continuit delloperatore lineare P l f 7 fb da S a S ora segue dalla


Proposizione 2.5.

Per inciso, la dimostrazione della disuguaglianza (9.4) prova anche questa


conseguenza interessante:
Corollario 9.7.4. Limmersione di S in L1 (R) continua.

756

CAPITOLO 9. CLASSE DI SCHWARTZ

Dimostrazione. Come nella dimostrazione della disuguaglianza (9.4), per


ogni f L1 (R),
Z
|f (t)|
(1 + t2 ) dt
kf k1 =
2
1
+
t



 Z 1
2
6 sup (1 + t )|f (t)|
dt 6 p2,0 (f ) .
2
tR
1 + t

Ora ritorniamo al nostro vero obiettivo: la continuit della trasformata


di Fourier su S.
Teorema 9.7.5. La trasformata di Fourier sullo spazio S un operatore
lineare F da S a S iniettivo, surgettivo e continuo.

Dimostrazione. Abbiamo visto nel Lemma 9.7.3 che fb appartiene a S se


f S, e inoltre che loperatore lineare P l f 7 fb continuo su S. Daltra
parte, loperatore lineare f 7 P l f continuo su S per il Corollario 9.7.1,
quindi loperatore composto
F : f 7 P l f 7 fb = F(f )

continuo su S per la continuit della funzione composta (Sezione 1.1).


Dalla formula di inversione di Fourier (Teorema 8.4.2) sappiamo che F2 () =

f() = f (), e quindi F4 f () = f () per ogni f . Perci ogni f S


verica f = F4 f = F(F3 f ), e quindi f = Fg con g = F3 f S. Pertanto F
surgettiva su S. Inne, se Ff = fb = 0, allora f = F4 f = F3 (Ff ) = F3 (0) = 0,
quindi F iniettiva.

Nota 9.7.6. Nella dimostrazione del Teorema 9.7.5 abbiamo mostrato che F4
lidentit. Quindi F1 = F3 e perci anche la trasformata inversa F1
continua su S.

Ora studiamo alcune propriet della trasformata di Fourier nella classe


di Schwartz. Prima stabiliamo la notazione seguente.
Notazione 9.7.7. Se f, g L2 , o anche se f L1 e g L , scriviamo
Z
hf, gi =
f (t)g(t) dt

9.7. TRASFORMATA DI FOURIER SU S


(f, g) =

757

f (t)g(t) dt

Il prossimo teorema stato gi dimostrato: la propriet (iv) della Sottosezione 8.4 (rammentiamo che lenunciato segue immediatamente dal Teorema
di Fubini (Teorema 1.20.4) sullo scambio dellordine di integrazione negli
integrali doppi di Lebesgue).
Teorema 9.7.8. (Teorema di Plancherel in S, ovvero formula di
dualit per la trasformata di Fourier). Per ogni f, g S,
D
E
fb, g = hf, gbi .

Analogamente, conosciamo gi (Corollario 8.5.2) la conseguenza qui di


seguito rienunciata:
Corollario 9.7.9. (Isometria della trasformata di Fourier in L2 (R)).
Per ogni f in S (e pi in generale per ogni f L1 (R) L2 (R)),


kf kL2 = f
2
L

Proposizione 9.7.10. Per ogni f , g in S, hf , gi = hf, g i e (f , g) =


(f, g ).
Dimostrazione. Dal teorema di integrazione per parti (Sezione 1.1)
Z

(f , g) =
f (x)g(x)dx

= [f g]
f (x)g (x)dx.

Daltra parte
lim f (x)g(x) = 0

perch f, g S. Quindi

(f , g) =

f (x)g (x)dx = (f, g )

Lasserzione analoga per (f , g) si dimostra allo stesso modo, o pi semplice

mente segue da questa se si osserva che (f , g) = hf , gi.

758

9.8

CAPITOLO 9. CLASSE DI SCHWARTZ

Operatori di convoluzione su S

Presentiamo inne una propriet che ci sar utile in seguito. Richiamiamo la


denizione di convoluzione (Denizione 6.1.11): per ogni k L1 (R), f S,
Z
k f (x) = k(x t)f (t) dt .
Proposizione 9.8.1. Per ogni k, f S,
kf S,

kf S

k[
f =b
k fb

Dimostrazione. La prima asserzione equivale alla inclusione S S S, che


segue immediatamente dallEsempio 9.5.4.
Luguaglianza k[
f =b
k fb gi stata dimostrata, pi in generale, per ogni k,
f L1 (R) (Teorema 8.5.1). Ora, se k, f S, anche b
k, fb S (Teorema di
k fb in base allEsempio 9.5.5. Perci k[
f S
surgettivit 9.7.5), e cos pure b
e quindi k f S in base al Teorema di surgettivit.

Dedichiamo il resto di questa sezione a ricavare qualche stima delle norme


di operatori di convoluzione su S e su altri spazi normati.

Esempio 9.8.2. Se h S, loperatore da S in S denito da T (f ) = h f


continuo, ossia per ogni seminorma pkl esistono una costante C > 0 ed un
numero nito di seminorme pk1 l1 , . . . , pkn ln tali che
pkl (h f ) 6 C

n
X

pki li (f ) .

i=1

Infatti, in base ai Teoremi 8.5.1 e 9.7.5, lapplicazione f 7 h f continua


su S se e solo se f 7 hf lo . La continuit di questultimo operatore segue
dallEsempio 9.5.4 e dallEsercizio 9.5.1, perch h f (x) = Mx h f .

Esempio 9.8.3. Consideriamo ora un caso analogo. Sia h L1 (R) tale che
b
h C (R) a crescita polinomiale con tutte le derivate, e sia T loperatore
denito da T (f ) = h f . Mostrare che T manda S in S ed continuo.
In eetti, grazie al Teorema 9.7.5, loperatore T manda S in S se e solo se
lo stesso accade per loperatore Tb : f 7 gf , dove g C (R) e g = b
h per

9.8. OPERATORI DI CONVOLUZIONE SU S

759

qualche h in L1 (R), ed continuo su S se e solo se lo Tb. Daltra parte,


poich h L1 , la sua trasformata di Fourier g automaticamente limitata
(Proposizione 8.2.3); dal momento che stiamo anche assumendo che g sia C
e a crescita polinomiale con tutte le derivate, entrambe le asserzioni seguono
dallEsempio 9.5.4.

Esempio 9.8.4. Sia h L (R) e T loperatore denito da T (f ) = h f .


Mostriamo che
(i) T manda S in L (R) ed continuo;
(ii) pi in generale, T manda L1 (R) in L (R) ed continuo.
Dimostriamo prima la parte (ii). Questa volta gli spazi di partenza e di
arrivo sono spazi normati. Dobbiamo quindi trovare una maggiorazione per
kT (f )k , ossia dimostrare che, per ogni h L e f S, esiste una costante
C > 0 tale che
kh f k 6 Ckf k1 .
In eetti,

|h f (x)| 6

|h(x t)| |f (t)| dt 6 khk kf k1

(9.5)

(osserviamo che questo fatto ci era gi noto: una applicazione immediata di


un caso particolare della disuguaglianza di Hlder (Teorema 1.16.6)). Questo
prova (ii). Per dimostrare la parte (i), ora basta maggiorare la norma L1 di
una funzione di Schwartz come faremo anche in seguito in (11.7):
Z
Z
(1 + t2 ) f (t)
dt
kf k1 6
dt
6
p
(f
)
2,0
2
1 + t2

1 + t

= p2,0 (f ) arctan t = p2,0 (f ) .
Infatti, da questo segue la parte (i), perch

kh f k > khk kf k1 > khk p2,0 (f ) .

Esempio 9.8.5. Sia h L1 (R) L (R) e T loperatore denito da T (f ) =


h f . Mostriamo che

760

CAPITOLO 9. CLASSE DI SCHWARTZ

(i) T manda S in L1 (R) L (R) ed continuo;


(ii) pi in generale, T manda L1 (R) in L1 (R) L (R) ed continuo.

Questa volta la norma nello spazio di arrivo k|f k| = kf k1 + kf k . Anche


in questo caso mostriamo prima la parte (ii). Se h L (R) e f L1 (R),
per ogni x R, grazie a (9.5), si ha
|h f (x)| 6 khk kf k1
Quindi kh f k 6 khk kf k1 . Inoltre, per segue dal Teorema di Fubini
1.20.4 che
Z Z
kh hk1 6
|h(x t)| |f (t)| dt dx
=

Z

|h(u) du |f (t)| dt = khk1 kf k1 .

Sommando le due disuguaglianze appena provate otteniamo


(9.6)

k|T (f )k| 6 k|hk| kf k1 .

Questo prova la parte (ii).


Anche qui, per provare (i), basta applicare di nuovo la disuguaglianza (??):
in tal modo, se h S, otteniamo k|hk| = khk1 + khk 6 p00 (h) + p20 (h).
Questa disuguaglianza, combinata con (9.6), prova (i).

9.9

Appendice: la disuguaglianza di Heisenberg

La disuguaglianza di Heisenberg emerse nel fondare la meccanica quantistica,


per le ragioni che spiegheremo dopo averla dimostrata. La dimostrazione che
presentiamo, puramente matematica, quella di Weyl [35]; si veda anche
[11].
Teorema 9.9.1. (Disuguaglianza di Heisenberg). Per ogni f in S,
Z
Z
1
2
2
x |f (x)| dx
2 |fb()|2 d >
kf k42 .
2
16

Si ha luguaglianza se e solo se f un multiplo di ex per qualche > 0.

9.9.

APPENDICE: LA DISUGUAGLIANZA DI HEISENBERG

761

Dimostrazione. Rammentiamo (Teorema 8.2.4 (vii)) che, se f L1 derivabile e tende a zero allinnito, quindi in particolare se appartiene a S, allora
fb denita e
fb () = 2i fb() ,
(9.7)
ossia f = (2i fb) .
In base a (9.7) ed al Teorema di Plancherel,
Z
Z
Z
Z
2
2
2
2 b
2
2
2
4
x |f (x)| dx
|f ()| d =
x |f (x)| dx
|f ()|2 d .

(9.8)
Per la disuguaglianza di CauchySchwarz (Proposizione 4.5.1) in L2 (R), il
lato di destra della precedente disuguaglianza non inferiore a
Z
2
Z
2
1

|x f(x) f (x)| dx =
x (f(x) f (x) + f (x) f (x)) dx .
4

(9.9)
2
2

Poich |f (x)| = f (x) f (x) vediamo che D(|f (x)| ) = f (x) f (x)+f (x) f (x),
e quindi
Z
x (f(x) f (x) + f (x) f(x)) dx

x |f (x)|

= kf k22 .


2

dx =

|f (x)|2 dx

Da questa uguaglianze e dalle precedenti disuguaglianze (9.8) e (9.9) segue la


disuguaglianza di Heisenberg dellenunciato. Abbiamo ottenuto una disuguaglianza invece di una identit perch abbiamo fatto uso della disuguaglianza
di CauchySchwarz per passare da (9.8) a (9.9). Daltra parte, sappiamo che
questa disuguaglianza diventa una uguaglianza se e solo se gli integrandi dei
due integrali al secondo membro di (9.8) sono multipli uno dellaltro: ossia
se esiste c C tale che f = cxf. Ma in tal caso la funzione f verica la
seguente equazione dierenziale lineare ordinaria del primo ordine:
 
1 f
1
= (cf) = |c|2 f .
x x
x
Questa equazione dierenziale lineare, essendo del primo ordine, ha uno spazio unidimensionale di soluzioni. Si verica direttamente che una soluzione

762

CAPITOLO 9. CLASSE DI SCHWARTZ


2

f (x) = e|c|x /2 , e quindi le altre sono i multipli complessi di questa. Tutte queste soluzioni appartengono, come richiesto, a L2 (R) pur di restringere
lattenzione a c 6= 0. Questo equivale allenunciato.

Nota 9.9.2. La disuguaglianza che abbiamo appena provato fu introdotta da


W. Heisenberg nella sua modellizzazione della meccanica quantistica, sulla
base di motivazioni siche ed in una forma diversa.
Nella modellizzazione di Heisenberg della meccanica quantistica, il comportamento delle particelle descritto da distribuzioni di probabilit, ossia funzioni = ||2 non negative con norma 1 in L1 : la funzione di questa
espressione, che si chiama uno stato della particella, di norma 1 in L2 .
Qui scriviamo invece che f come invece abbiamo fatto nel Teorema pi
sopra perch questa la notazione consueta della meccanica quantistica. Le
quantit sperimentalmente osservabili, o pi brevemente le osservabili, sono operatori autoaggiunti T su un opportuno sottospazio D(T ) dello spazio
L2 degli stati (detto dominio delloperatore), ed il loro valore medio E(T )
denito come
Z
(T )(x)|2 dx = (T , )L2 .
E(T ) :=
(x)

In realt, come gi detto, i vettori L2 che corrispondono alla realt


sica sono quelli di norma 1: pertanto consideriamo equivalenti due vettori
in D(T ) se sono multipli non nulli luno dellaltro, e sceglismo sempre nella
classe di equivalenza un rappresentante di norma 1. Il valore medio di T sullo
stato non propriamente il valore stazionario osservato, perch la misura
non sempre possibile, in quanto loperazione di misura perturba lo stato.
Infatti, nel modello matematico che stiamo sviluppando, quando cerchiamo
di eettuare la misura, ovvero applichiamo loperatore allo stato , questo
stato viene modicato (viene mandato in un nuovo stato T ), tranne che nel
caso in cui sia un autovettore di T , del quale quindi viene modicata la
norma ma non la classe di equivalenza. In tal caso si ha T = , e E(T ) =
(, ) = : quindi se corrisponde ad un autovettore dellosservabile, la
misura dellosservabile coincide con il corrispondente autovalore.
Ad esempio, nel caso di una particella che si muove su una retta (ossia in
una sola dimensione), losservabile che misura la posizione loperatore P di
moltiplicazione per x, ossia
P = x ,

9.9.

APPENDICE: LA DISUGUAGLIANZA DI HEISENBERG

763

denito sulle funzioni in L2 (R) tali cheRx sia ancora in L2 . Il valore medio

della posizione della particella quindi x |(x)|2 dx. Si noti che questo
valore medio esattamente lattesa rispetto alla corrispondente distribuzione
di probabilit, ossia
Z
E(P ) :=

x |(x)|2 dx .

Osserviamo che il valore atteso determinato da una dstribuzione di probabilit nello spazio, non nel tempo: si tratta di valori attesi in stati stazionari.
Chiaramente, loperatore che misura limpulso (ossia, a meno di multipli, la
velocit) della particella dovrebbe essere dato dalloperatore di derivata rispetto al tempo, ma in queste espressioni la variabile che compare lo spazio
e non il tempo: allora come operatore di impulso si sceglie
Q =

1
D ,
2i

dove D loperatore di derivata (in pi variabili spaziali, si usa il gradiente),


denito sul dominio D(Q) delle funzioni in L2 derivabili con derrivata in L2
(che esso stesso uno spazio di Hilbert: lo spazio di Sobolev W 1,2 (R) con
norma kk2 + k k2 ). Il valor medio dellimpulso quindi
1
E(Q) :=
2i

(x) dx =
(x)

|()|2 d

(lultima uguaglianza nientaltro che lidentit (9.7)).


evidente che gli operatori di posizione ed impulso non commutano fra loro,
e quindi non hanno una base di autovettori comuni: nel modello che stiamo presentando, questo signica che posizione e impulso non sono misurabili
simultaneamente, ossia che, quando si cerca di misurare una delle due osservabili con precisione sempre pi ne, laltra determinabile con precisione
sempre peggiore (principio di incertezza). La relazione di commutazione fra
le due osservabili facilmente vericata:
[P, Q] := P Q QP =

1
i
(xD Dx) =
I
2i
2

(qui I denota loperatore identit).


La disuguaglianza di Heisenberg che abbiamo provato nel Teorema 9.9.1 d

764

CAPITOLO 9. CLASSE DI SCHWARTZ

una valutazione quantitativa del principio di incertezza, come si capisce se la


riscriviamo nel modo seguente:
E[P E(P )]2 E[Q E(Q)]2 >
ossia
Z

(x E(P )) |(x)| dx

1
,
16 2

2
b
( E(Q))2 |()|
d >

1
16 2

(9.10)

dove una funzione di norma 1 in L2 (R). Per comprendere perch questa


disuguaglianza equivalente alla disuguaglianza del Teorema 9.9.1, poniamo
2
g(x) = (x + E(P )): allora g ha norma
R 21 in L 2 e traslando la variabile
il primo integrale in (9.10) diventa x |g(x)| dx. Allo stesso tempo,
in base alla propriet di traslazione della trasformata di Fourier (Teorema
b e pertanto |b
b Pertanto la
8.2.4 (v)), abbiamo b
g () = e2i E(P ) ,
g | ||.
disuguaglianza (9.10) diventa
Z
Z
1
2
2
.
x |g(x)| dx
( E(Q))2 |b
g()|2 d >
16 2

Ora deniamo f tramite lespressione fb() := b


g ( + E(Q)).
ragionamento mostra che il primo membro di (9.10) diventa
Z
Z
2
2
x |f (x)| dx
2 |fb()|2 d ,

Lo stesso

e quindi, visto che kf k2 = 1, (9.10) nientaltro che la disuguaglianza di


Heisenberg che abbiamo provato nel teorema 9.9.1.

9.10

Esercizi sulla classe di Schwartz

Esercizio 9.10.1. Quali delle seguenti funzioni appartengono alla classe di


Schwartz S?
1. 

cos x sin x

2. 

sin x
1+x2

3.  2x3 + 2x 3

9.10. ESERCIZI
4.  2ex

765

5.  ex
6. 

nessuna delle precedenti

Motivare la risposta.

Esercizio 9.10.2. Quali delle seguenti funzioni appartengono alla classe di


Schwartz S?
1.  x2 x 1
2.  ex

3.  ex + ex
4. 

|x|
x2 +1

5.  nessuna delle precedenti


Motivare la risposta.

Esercizio 9.10.3. Quali delle seguenti funzioni appartengono alla classe di


Schwartz S?
1.  ex

2.  ex + ex
2

3.  ex cos ex
4. 

cos x
1+x4

5.  x3 x2 x
6. 

nessuna delle precedenti

Motivare la risposta.

Esercizio 9.10.4. Quali delle seguenti funzioni appartengono alla classe di


Schwartz S?
4

1.  ex cos ex

766

CAPITOLO 9. CLASSE DI SCHWARTZ

2.  ex + ex
3.  x3 ex

4.  3x2 + 1
5.  nessuna delle precedenti
Motivare la risposta.

Esercizio 9.10.5. Quali delle seguenti funzioni appartengono alla classe di


Schwartz S?
1. 

cos x
1+x4
4

2.  ex sin ex

3.  x
4.  ex

5.  ex + ex
6. 

nessuna delle precedenti

Motivare la risposta.

Esercizio 9.10.6. Quali delle seguenti funzioni appartengono alla classe di


Schwartz S?
1. 

cos x sin x

2. 

sin x
1+x2

3.  2x3 + 2x 3
4.  2ex
5. 

nessuna delle precedenti

Motivare la risposta.

Esercizio 9.10.7. Quali delle seguenti funzioni appartengono alla classe di


Schwartz S?

9.10. ESERCIZI
1.  ex

767

2.  ex + ex
2

3.  ex cos ex
4. 

cos x
1+x4

5.  x3 x2 x
6. 

nessuna delle precedenti

Motivare la risposta.

Esercizio 9.10.8. Sia S la classe di Schwartz. Quali delle seguenti aermazioni


sono vere (eventualmente pi di una oppure nessuna)?
1.  f, g S f g S
2.  f, g S f + g S
3.  f S fb S

4. 

i polinomi appartengono a S
2

5.  f (x) = ex S
6.  nessuna delle precedenti
Motivare la risposta.

Esercizio 9.10.9. Sia S la classe di Schwartz. Quali delle seguenti aermazioni


sono vere (eventualmente pi di una oppure nessuna)?
1.  f (x) = ex + ex f S
2.  f, g S f + g S
3.  f S fb S



4.  f S kf k2 = fb

5.  f S pl,k (f ) = 1

768

CAPITOLO 9. CLASSE DI SCHWARTZ

6.  nessuna delle precedenti


Motivare la risposta.

Esercizio 9.10.10. Quali delle seguenti funzioni appartiene alla classe di Schwartz S
2

1.  f (x) = ex cos ex
2.  f (x) = ex

3.  f (x) = x3 ex

4.  f (x) = x3 x2 + 3
5.  f (x) = ex

6.  nessuna delle precedenti


Motivare la risposta.

Esercizio 9.10.11. Quali delle seguenti funzioni appartiene alla classe di Schwartz S?
1.  f (x) = ex

2.  f (x) = ex sin ex

3.  f (x) = x2 x + 1
4.  f (x) = ex
5.  f (x) = x2 ex

6.  nessuna delle precedenti


Motivare la risposta.

Esercizio 9.10.12. Quali delle seguenti funzioni appartengono alla classe di


Schwartz?
4

1.  ex cos ex

9.10. ESERCIZI

769

2.  ex + ex
3.  x3 ex

4.  3x2 + 1
5.  nessuna delle precedenti
Motivare la risposta.

Esercizio 9.10.13. Quali delle seguenti funzioni appartengono alla classe di


Schwartz S?
1. 

cos x
1+x4
4

2.  ex sin ex

3.  x
4.  ex

5.  ex + ex
6. 

nessuna delle precedenti

Motivare la risposta.

Esercizio 9.10.14. Sia S la classe di Schwartz. Quali delle seguenti aermazioni sono vere?
1.  f (x) = ex + ex f S
2.  f, g S f + g S
3.  f S fb S



4.  f S kf k2 = fb

5.  f S pl,k (f ) = 1

6.  nessuna delle precedenti


Motivare la risposta.

770

CAPITOLO 9. CLASSE DI SCHWARTZ

Esercizio 9.10.15. Quali delle seguenti funzioni appartengono alla classe di


Schwartz S?
1. 

cos x sin x

2. 

sin x
1+x2

3.  2x3 + 2x 3
4.  2ex
5. 

nessuna delle precedenti

Motivare la risposta.

Esercizio 9.10.16. Scrivere la denizione di spazio di Schwartz S. Quali delle


seguenti funzioni appartengono alla classe di Schwartz S?
1.  ex

2.  ex + ex
2

3.  ex cos ex
4. 

cos x
1+x4

5.  x3 x2 x
6. 

nessuna delle precedenti

Motivare la risposta.

Esercizio 9.10.17. Quali delle seguenti funzioni appartengono alla classe di


Schwartz S?
1. 

cos x sin x

2. 

sin x
1+x2

3.  2x3 + 2x 3
4.  2ex
5.  ex

9.10. ESERCIZI
6. 

771

nessuna delle precedenti

Motivare la risposta.

Esercizio 9.10.18. Quali delle seguenti funzioni appartengono alla classe di


Schwartz?
1.  x2 x 1
2.  ex

3.  ex + ex
4. 

|x|
x2 +1

5.  nessuna delle precedenti


Motivare la risposta.

Esercizio 9.10.19. Quali delle seguenti funzioni appartengono alla classe di


Schwartz S?
1.  ex

2.  ex + ex
2

3.  ex cos ex
4. 

cos x
1+x4

5.  x3 x2 x
6. 

nessuna delle precedenti

Motivare la risposta.

Esercizio 9.10.20. Sia S la classe di Schwartz. Quali delle seguenti aermazioni sono vere (eventualmente pi di una oppure nessuna)?
1.  f, g S f g S
2.  f, g S f + g S
3.  f S fb S

772
4. 

CAPITOLO 9. CLASSE DI SCHWARTZ


i polinomi appartengono a S
2

5.  f (x) = ex S
6.  nessuna delle precedenti
Motivare la risposta.

Esercizio 9.10.21. Quali delle seguenti funzioni appartiene alla classe di Schwartz S?
1.  f (x) = x2 + 3x 4
2.  f (x) = ex
3.  f (x) = ex

4.  f (x) = xex

5.  f (x) = ex sin ex

6.  nessuna delle precedenti


Motivare la risposta.

Esercizio 9.10.22. Quali delle seguenti funzioni appartiene alla classe di Schwartz S?
1.  f (x) = xex
2.  f (x) = ex

3.  f (x) = ex cos ex

4.  f (x) = x3 + x 1
5.  f (x) = ex

6.  nessuna delle precedenti


Motivare la risposta.

9.10. ESERCIZI

773

Esercizio 9.10.23. (i) Mostrare che, se f S e una costante positiva, anche g(x) = f (x) appartiene a S, e loperazione di dilatazione
f (x) 7 f (x) continua in S.

Suggerimento: mostrare che D l g(x) = l (D l f )(x); pertanto, per ogni


k, l N,

pkl (g) = l sup 1 + |x|k |D l f |(x) .
xR


Inoltre 1 + |x|k < 1 + |x|k se > 1, e 1 + |x|k = k k + |x|k 6
k 1 + |x|k se 6 1. Quindi

pkl (g) = sup 1 + |x|k |D l f |(x) 6 Cpkl (f ) ,
xR

dove C = max{l , lk }.

(ii) Consideriamo la Gaussiana (x) = ex . Utilizzando la parte precedente, determinare se il quadrato 2 (x) appartiene a S. Spiegare i
passaggi.

Suggerimento: osservare che 2 (x) = ( 2x).


(iii) Senza calcolare la convoluzione (x) , bens utilizzando la parte
precedente, determinare se S; spiegare tutti i dettagli.

Suggerimento: per il Teorema di surgettivit 9.7.5, basta dimostrare


che b appartiene a S. In base al Teorema 8.5.1, la trasformata di
Fourier di = b2 . Poich b2 = 2 per la Proposizione 8.3.2,
basta applicare la parte (ii).

Esercizio 9.10.24. (i) Se f S, f 2 S? Spiegare.


Rx
4
(ii) Se (x) = t3 et dt, vero che S? Spiegare.

774

CAPITOLO 9. CLASSE DI SCHWARTZ

Parte III
Distribuzioni temperate,
campionamento
e ricostruzione di segnali

775

Capitolo 10
Teoria del campionamento e
ricostruzione dei segnali
10.1

Campionamento di segnali

Per immagazzinare ed elaborare i valori di un segnale dobbiamo discretizzarli,


cio ridurli ad una successione numerabile.
Pi precisamente, consideriamo un segnale che varia nel tempo, diciamo
t f (t). Fissato un passo di campionamento > 0 siamo interessati alla
successione dei valori campionati
{f (n ) , n Z} .
Quando si digitalizza un segnale che varia nel tempo, lo si discretizza in
questo modo, e si salvano i valori campionati in un le. Ad esempio, questo
ci che succede quando si incide un brano musicale su un CD. Poi, per,
per riascoltare il brano, si deve ricostruire il segnale originario. chiaro
che, se il passo di campionamento piccolo, cio se i campioni sono tti, la
successione dei dati campionati d unidea abbastanza precisa del graco del
segnale originale, come in Figura 10.1.
Esempio 10.1.1. Questa idea precisa si ha solo se i campioni sono presi su
una griglia sucientemente tta. Supponiamo ad esempio di aver ssato e
di campionare il segnale f (t) = sin t
a passi di , a partire da t = 0. I valori

campionati sono
f (n ) = sin n = 0
777

per ogni n Z .

778

CAPITOLO 10. CAMPIONAMENTO

Figura 10.1: Valori campionati di un segnale

Il software che deve ricostruire il segnale originale non in grado di sapere


se questo segnale sin t
oppure identicamente zero. Quindi, se il segna
le consiste di una sinusoide pura a frequenza elevata (rispetto la passo di
campionamento), non possibile ricostruirlo.

Nota 10.1.2. Nellesempio 10.1.1, il segnale sinusoidale


f (t) = sin 2t
1
, il segnale sinucon = 21 . Quindi, se il passo di campionamento 2
soidale puro di frequenza , campionato sulla griglia {f (n ) , n Z}, non
viene ricostruito.

Vedremo che, se i segnali considerati hanno spettro di Fourier compreso


nellintervallo [0 , 0 ], essi possono essere ricostruiti senza perdite a partire dai loro valori campionati con qualsiasi campionamento sucientemente
tto: pi precisamente per ogni passo di campionamento 0 < 21 0 . Osserviamo che il segnale sinusoidale f (t) = sin 20 t considerato nella Nota 10.1.2
corrisponde ad una armonica a frequenza 0 . Per questo segnale, che non
una funzione in L1 (R), non abbiamo ancora introdotto la trasformata di
Fourier, ma idealmente possiamo immaginare che, quando saremo in grado
di farlo, lo spettro di Fourier risulti concentrato al punto 0 , quindi dentro
lintervallo [0 , 0 ]: la Nota 10.1.2 mostra che un passo di campionamento
uguale a 21 0 non adeguato per ricostruire tale segnale. Vedremo in seguito,
almeno in un caso particolare (Esercizio 13.5.1) il fatto seguente: neppure un
passo di campionamento maggiore di 21 0 adeguato per la ricostruzione. Il
lettore invitato a studiare il succitato Esercizio (arontabile n da adesso)
e dimostrare questo fatto sulla sua falsariga.
Nota 10.1.3. Prima di procedere dobbiamo chiarire un dubbio. Un segnale
di una variabile reale t porta certamente pi informazioni di una successione
numerabile {f (n )}+
n= dei suoi valori. Come possiamo sperare di ricostruirlo esattamente, per ogni t, a partire da questa successione numerabile
di valori?

10.1. CAMPIONAMENTO DI SEGNALI

779

In questa domanda c un malinteso. Per chiarirlo esaminiamo una situazione


analoga: quella delle serie di Fourier.
2
Ogni funzione
(, ) coincide (nel senso di L2 ) con la sua serie
P f L inx
di Fourier n= an e . Se poi f C 1 a tratti (inclusi i punti e ,
perch la si immagina estesa per periodicit a tutto R), allora essa coincide
punto per punto con la sua serie di Fourier per ogni t [, ]. Quindi f
univocamente determinata dalla successione numerabile dei suoi coecienti
di Fourier.
Per... non esattamente cos.
i valori f (t) sono ricostruiti dal
P Tutti
calcolo della somma della serie
an eint che si pu compiere con precisione
arbitraria purch conosciamo esattamente i valori di eint , cio i valori sin(nt)
e cos(nt) per ogni n. Poich cos(nt) un traslato di sin(nt), suciente
conoscere questultimo valore per ogni n. Dalle formule di addizione del seno
si vede che suciente conoscere tutti i valori di sin t. Ma questi valori
sono un continuo, non una successione numerabile. In altre parole, quando
ricostruiamo un segnale a partire dai suoi coecienti di Fourier, nessuno ci
regala informazioni: dobbiamo anche conoscere il continuo dei valori t 7 sin t
(con precisione arbitraria).

Anche nella ricostruzione esatta di un segnale a partire dai suoi valori


campionati, questi valori appaiono come coecienti di una serie di funzioni.
Ma, invece, che dilatati delle funzioni seno e coseno (come accadeva per le
serie di Fourier) qui le funzioni dello sviluppo sono traslati della seguente
funzione:
Definizione 10.1.4. (La funzione sinc.) La funzione seno cardinale
denita da sinc(0) = 1, e, per x 6= 0,
sinc(x) =

sin(x)
.
x

Si osservi la analogia del seguente esercizio con quello corrispondente per


le serie di Fourier (Esercizio 5.3.4):
Esercizio 10.1.5. Sia
[ 1 , 1 ] (x) =
2 2

se

se

1
2

|x| >

1
2
1
2

780

CAPITOLO 10. CAMPIONAMENTO

Figura 10.2: La funzione sinc

Allora la trasformata di Fourier

vale

b[ 1 , 1 ] () =
2 2

[ 1 , 1 ] (x) e2ix dx
2 2

b[ 1 , 1 ] () = sinc() .
2 2

10.2

Periodicizzazione, coefficienti e trasformata di Fourier

Approfondiamo in questa sezione il legame fra trasformata di Fourier di una


funzione e serie di Fourier della funzione che si ottiene periodicizzando la
precedente a partire dai suoi valori su un intervallo, esaminato in maniera
intuitiva in Sezione 8.1.
Definizione 10.2.1. (Periodicizzazione.) Sia f L1 . Fissato come
periodo lintervallo [0, 1], deniamo la periodicizzazione = Pf di passo 1
di f come

X
f (x + k) .
(10.1)
(x) Pf (x) =
k=

In maniera analoga si denisce la periodicizzazione PT di passo T > 0.


Il fatto che la serie converga provato nel prossimo Lemma 10.2.2.

Lemma 10.2.2. Se f L1 (R), la serie in (10.1), converge nella norma L1 ,


o equivalentemente nella norma L1 su ogni compatto (e quindi puntualmente
quasi ovunque).

10.2. PERIODICIZZAZIONE

781

P
Dimostrazione. Basta mostrare che la successione Sm,n := nk=m f (x + k)
di Cauchy nella norma di L1 , o nella norma L1 su un qualsiasi compatto
(qui prendiamo, come scelta naturale, il periodo [0, 1]). In eetti, questo
fatto segue dalla disuguaglianza

Z 1 X
Z 1 X
n1
n1



kSm,n1 kL1 [0,1] =
f (x + k) dx 6
|f (x + k)| dx


0 k=m
0 k=m
Z n
=
|f (x) dx .
m

R
Poich f L (R), lintegrale Rn |f (x)| dx tende a zero se n tende a innito.

Fissato > 0, sia n tale che n |f (x)| dx < . Allora la successione sn :=


R1
Rn
S0,n1 (x) dx = 0 f (x) dx verica la propriet di Cauchy: per ogni > 0
0
esiste n > 0 tale che, per n 6 k 6 j, si ha
Z j
Z
|sj sk | 6
|f (x)| dx 6
|f (x)| dx < .
1

R1

R0
Analogamente, anche la successione pm := 0 Sm,1 (x) dx = m f (x) dx
di Cauchy. Poich
Z 1
Z 1 X
Z n
n1
|Sm,n1 | dx 6
|f (x + k)| dx =
|f (x)| dx = pm + sn
0

0 k=m

la successione di funzioni

Pn

k=m

f (x+k) di Cauchy nella norma di L1 [0, 1].

Proposizione 10.2.3. Se = Pf denota il periodicizzato di passo 1 di


f L1 , allora fra i coefficienti di Fourier di e la trasformata di Fourier di
f intercorre la relazione seguente: per tutti gli n N,
b
(n)
= fb(n) .

Dimostrazione. Analogamente alla dimostrazione del Lemma 10.2.2, osserviamo che, per ogni n,

Z 1 X
Z 1


X



2inx
f (x + k)e2inx dx
f (x + k)e
dx 6


0 k=
k= 0
Z
Z k+1
X
=
|f (x)| dx =
|f (x)| dx < ,
k=

782

CAPITOLO 10. CAMPIONAMENTO

P
f (x + k)e2inx converge in L1 . Daltra parte,
e quindi anche la serie
R 1 k=
il funzionale T f = 0 f dx continuo su L1 (Proposizione 1.19.1), perch
R1
|T f | 6 0 |f | dx = kf kL1 . Quindi nella prossima identit la serie si scambia
con lintegrale:
Z 1 X

Z 1
X
2inx
f (x + k)e2inx dx
f (x + k)e
dx =
0 k=

=
=

k= 0
Z 1
X
k=
Z

poich e
= 1.
Allora da (10.1) segue
Z 1
b
(n) =
(x)e2inx dx =
2ink

f (x + k)e2in(x+k) dx

f (x)e2inx dx = fb(n)

Z
X

k=

= fb(n) .

f (x + k)e2inx dx
0

(10.2)

Corollario 10.2.4. Se nella Proposizione 10.2.3 si considera la periodicizzazione PT f di passo T > 0, si ottiene

1b
Pd
f (n/T ) .
T f (n) =
T
Dimostrazione. Questo risultato segue subito dalla propriet di dilatazione
per la trasformata e per i coecienti di Fourier, perch il periodicizzato di
passo T di f il dilatato di fattore di scala T del periodicizzato di passo 1
del compresso di scala 1/T di f . Ne accenniamo invece il calcolo diretto.
Il ragionamento identico a quello che dimostra la Proposizione 10.2.3:
Z
Z T
1 X
1 T
2inx/T
d
f (x + kT )e2inx/T dx
PT f (x)e
dx =
PT f (n) =
T 0
T k= 0
Z
1
1
=
f (x)e2inx/T dx = fb(n/T ).
T
T

10.3. FORMULA DI SOMMA DI POISSON

10.3

783

La formula di somma di Poisson

La relazione fra trasformata di Fourier di f L1 e coecienti di Fourier del


periodicizzato di f vista nella precedente Sezione 10.2 porta ad un risultato
fondamentale per il campionamento:
Proposizione 10.3.1. (Formula di somma di Poisson.) Sia f L1 (R)
tale che la periodicizzazione
(x) =

f (x + n)

(10.3)

n=

converga ad un valore ben definito e finito per x = 0 (questo vero, ad


esempio, se f continua, nel qual caso i suoi valori puntuali sono ben definiti,
e se la serie converge puntualmente a x = 0). Supponiamo inoltre che la serie
di Fourier di converga al punto 0 al valore (0). Allora

f (n) =

n=

n=

fb(n) .

(10.4)

Le ipotesi su sono verificate, ad esempio, se f S. Se in (10.4) la somP


b
ma della serie
n= f (n) si intende nel senso di Fjr (cio del Teorema
6.2.5), allora per la validit di (10.4) basta assumere che sia continua in
x = 0.
Dimostrazione. Consideriamo lo sviluppo in serie di Fourier della funzione
periodicizzata . In base alla Proposizione 10.2.3 si ha lo sviluppo
(x)

k=

fb(n) e2inx .

Dallipotesi che per x = 0 questo sviluppo converga a (0) si ha la formula


dellenunciato.
Se f nella classe di Schwartz allora la serie in (10.3) converge puntualmente
ovunque, perch in tal caso la successione n 7 f (x+ n) in 1 per ogni x. La
stessa cosa succede alla serie delle derivate. Perci di classe C 1 , e quindi
coincide ovunque con il limite della sua serie di Fourier (per il teorema di
convergenza delle serie di Fourier: si veda il Corollario 5.12.4). Pertanto le
ipotesi su sono soddisfatte se f S.

784

CAPITOLO 10. CAMPIONAMENTO

b
Anche se non serve per la dimostrazione, osserviamo che anche
classe
Pf nella
b
di Schwartz (Lemma 9.7.3), ed anche lo sviluppo di Fourier n= f (n)e2inx
converge uniformemente per il test di Weierstrass (Teorema 1.3.29), perch
la successione fb(n) a decrescenza rapida e quindi in 1 .
Per dimostrare
parte dellenunciato, osserviamo che, se la convergenPlultima

b
za della serie n= f (n) si intende nel senso di Fjr,cio come
 limite delle
PN
|n|
1
somme parziali pesate con il nucleo di Fjr,
fb(n) , allora
n=N

per il Teorema di Fjr 6.2.5 la serie converge a limh0 12 ((h) + (h)), che
coincide con (0) se assumiamo continua in 0.

Applicando alla formula (10.4) il teorema di dilatazione per la trasformata


di Fourier, Teorema 8.2.4 (iv), si ottiene la variante seguente:
Corollario 10.3.2. Nelle stesse ipotesi della Proposizione 10.3.1, per ogni
> 0 si ha

n
X
X
.

f ( n) =
fb

n=
n=

In termini degli operatori di periodicizzazione introdotti nella Definizione


10.2.1, la precedente identit si scrive cos:
P f (n) = P 1 fb(n) .

Esercizio 10.3.3. Si ricavi dal Corollario 10.3.2 e dalla Proposizione 8.3.2 la


seguente identit: per ogni s > 0,
r

X
X 2 n2 /s
n2 s
e
=
e
.
s
n=
n=

Nota 10.3.4. comodo avere periodica di periodo 1, onde ottenere (10.4)


invece che lidentit del Corollario 10.3.2 per qualche 6= 1. anche per
avere periodicit di periodo 1 che abbiamo usato la denizione di trasformata
di Fourier
Z
b
f () =
f (t)e2it dt .

10.3. FORMULA DI SOMMA DI POISSON

785

Nota 10.3.5. La formula di somma di Poisson,

k=

fb(k) =

f (k).

(10.5)

k=

si pu riscrivere nella seguente maniera equivalente, ottenuta applicando


(10.5) al traslato x f : per ogni x R al quale valgono le condizioni della formula di somma di Poisson (10.4) (ed in particolare entrambe le serie
convergono),

k=

fb(k)e2ikx =

f (k + x) .

(10.6)

k=

Inne, se f S, poich la trasformata di Fourier un isomorsmo surgettivo


di S in s (Teorema 9.7.5), applicando (10.6) con fb al posto di f ed usando
la formula di inversione di Fourier (Teorema 8.4.2)

f(k) =

si ha, equivalentemente,

fb(t)e2ikt dt = f (k) ,

2ikx

f (k)e

k=

k=

fb(k + x)

(10.7)

(abbiamo gi osservato nella dimostrazione della Proposizione 10.3.1 che,


se f S, entrambe queste serie convergono per ogni x). Pi in generale,
consideriamo la formula di somma di Poisson di passo > 0 invece che 1, introdotta nel Corollario 10.3.2. In termini degli operatori di periodicizzazione
della Denizione 10.2.1 la precedente identit (10.7) ed il Corollario 10.3.2 si
scrivono cos:

X
(10.8)

f (n )e2in x = P 1 fb(x) ,

n=

per ogni x R.

786

10.4

CAPITOLO 10. CAMPIONAMENTO

Funzioni a banda limitata e teorema del


campionamento

Definizione 10.4.1. (Classe di Paley-Wiener.) Dato c > 0 indichiamo


con Bc lo spazio delle funzioni limitate in banda (o spazio di Paley-Wiener )
con frequenza di taglio c,
Bc = {f L1 (R) : fb() = 0 || > c}

cio tali che fb abbia supporto in [c, c].

Corollario 10.4.2. Per ogni f Bc si ha f C (R) e limt f (t) = 0.

Dimostrazione. Grazie alla formula di inversione di Fourier, Teorema 8.4.2, il


fatto che f tenda a zero allinnito segue direttamente dal fatto che fb L1 , il
che deriva dal fatto che ora fb continua a supporto compatto (Proposizione
8.2.3; si veda anche il Corollario 8.2.7 (i) e (ii)). Pi precisamente, poich
fb appartiene a L1 (R), la sua trasformata di Fourier tende a zero allinnito,
ma per la formula di inversione di Fourier, Teorema 8.4.2, questa trasformata
di Fourier, a meno di una parit, coincide con la antitrasformata di Fourier
di fb, ossia con f .
Il fatto che f sia derivabile innite volte segue anchesso dalla formula di
inversione di Fourier e dal Corollario 8.2.7 (in altre parole, se 2ixfb in L1
allora f esiste ed in eetti f lantitrasformata di Fourier di 2ixfb).

Proposizione 10.4.3. Le funzioni f Bc soddisfano le condizioni della


formula di somma di Poisson (Proposizione 10.3.1).
Dimostrazione. Le funzioni f Bc sono in L1 e quindi hanno trasformata
di Fourier fb continua (ed a supporto in [c, c]). Osserviamo che, se si assume anche che fb sia di classe C , allora fb C a supporto compatto e
quindi appartiene alla classe di Schwartz (tutte le derivate sono a supporto
compatto!). Allora, per il teorema di surgettivit della trasformata di Fourier su S, Teorema 9.7.5, anche f appartiene alla classe di Schwartz e quindi
la formula di somma di Poisson si applica. Ora mostriamo come procedere
senza lipotesi fb C . Quello che sappiamo che una tale f C , grazie
1
al precedente Corollario 10.4.2, ed appartiene
PaL (R). Pertanto la serie che1
denisce la funzione periodicizzata, (x) = k= f (x + k) converge in L

10.4. TEOREMA DEL CAMPIONAMENTO

787

sui compatti per il Lemma 10.2.2, e quindi puntualmente quasi ovunque, ma


a priori non detto che questa serie debba convergere puntualmente ovunque. Per vedremo fra un momento che invece questa somma (x) esiste
nita ovunque, perch costituisce una funzione continua.
In eetti,
la serie a secondo membro della formula di somma di PoisP converge
b(k), perch solo un numero nito di termini (minore di 2c) sono
f
son,
k=
P
2ikx
b
non nulli. La stessa propriet vale per la serie
: entrambe
k= f (k)e
queste serie sono in realt somme nite. Sappiamo, dalla Proposizione
10.2.3,
P
b
che la serie di Fourier del periodicizzato di f proprio k= f (k)e2ikx ,
quindi una somma nita di funzioni continue: un polinomio trigonometrico.
Pertanto questa serie di Fourier converge uniformemente, e converge a (x)
per ogni x. Ma allora la funzione continua ed haPun valore ben denito
per ogni x, in particolare per x = 0. Quindi la serie
n= f (n) converge.
Abbiamo usato il fatto che per f Bc il periodicizzato un polinomio
quindi coincide ovunque con laP
propria serie di Fourier
P trigonometrico,

b
b(k)e2ikx : pertanto P
f
(n)
=
(0)
=
f
k= f (k), e quindi in
n=
k=
questo caso lasserzione della formula di somma di Poisson gi nota.

Ora dimostriamo il teorema del campionamento: se un segnale in L1 (R)


limitato in banda, esso ricostruibile senza perdite dai suoi campioni su una
griglia di campionamento sucientemente tta. Il teorema, che attribuiamo
a E. T. Whittaker per il suo articolo [36] del 1915 (si vedano anche il libro
[37] di suo glio J. M. Whittaker del 1935 e larticolo [16] di V.A. Kotelnikov
del 1933), era forse gi noto, in parte, a Cauchy.

Teorema 10.4.4. (Sviluppo in serie di Whittaker.) Se f B 1 , allora


2
per ogni x R

X
f (k) sinc(x k).
f (x) =
k=

Dimostrazione. La dimostrazione intreccia intelligentemente trasformate e


serie di Fourier, e loro troncamenti. Dalla Proposizione 8.2.3 sappiamo
che fb C(R); inoltre fb = 0 al di fuori dellintervallo [ 21 , 12 ], quindi fb
L2 (R). Sviluppiamo fb in serie di Fourier nellintervallo [ 12 , 21 ] (o equivalentemente sviluppiamo il periodicizzato a tutto R di periodo 1 di fb|[ 1 , 1 ] ,
2 2
P
b( + k)). Si noti che, dato che f B 1 , nella serie
cio () =
f
k=
2
P
() = k= fb( + k) per ogni c solo un termine non nullo, e quindi

788

CAPITOLO 10. CAMPIONAMENTO

fb in [ 12 , 12 ] (allesterno di questo intervallo luguaglianza non vale: il


primo membro periodico ed il secondo nullo). Con la notazione sviluppata
in Sezione 5.2, scriviamo
() = fb() =



1 1
per ogni ,
2 2

2ik

ck e

k=

b
(k)
= ck =

1
2

21

fb()e2ik d .

(10.9)
(10.10)

Poich L2 , i coecienti di Fourier ck sono una successione di quadrato


sommabile, cio appartengono allo spazio 2 denito nellEsempio 4.4.2 (iii),
in base allidentit di Parseval (Corollario 4.3.2 (iii)). La serie converge a
nel senso di L2 per il Corollario 4.3.4.
Pi precisamente, la funzione fb non periodica, ma stiamo sviluppando fb
in serie di Fourier in [ 21 , 12 ]. Per questo la somma della serie in (10.9),
laddove converge, la periodicizzazione di fb. In questa serie compaiono
i coecienti di Fourier calcolati integrando su un periodo. Per possiamo
invece scrivere, al loro posto, opportuni valori della trasformata di Fourier
di fb, come osservato nella Nota 10.4.3. Infatti in quella Nota abbiamo visto

b
che, per ogni k, si ha ck = (k)
= f(k) = f (k): quindi la successione
{f (k), k Z} appartiene allo spazio 2 e
fb() =

k=

2ik

f (k)e

k=

2ik

f (k)e



1 1
,
. (10.11)
2 2

Lidentit in (10.11) vale in [ 21 , 12 ] nel senso di L2 , ma non vale mai fuori


di [ 12 , 21 ] (rammentiamo ancora che allesterno di questo intervallo il primo
membro nullo mentre il secondo periodico). Ora, invece, procediamo
al contrario: estendiamo lo sviluppo (10.11) ad un altro sviluppo valido su
tutto R. A questo scopo, osservando ancora che fb ha supporto in [ 12 , 21 ],
notiamo che fb coincide la funzione ottenuta dalla propria periodicizzazione
(da [ 12 , 12 ] a tutto R) quando si tronca nuovamente il risultato a [ 12 , 12 ]. Il
modo di procedere un filtraggio: la moltiplicazione per il ltro passa basso
(
1
se
|| 6 12
(10.12)
[ 1 , 1 ] () =
2 2
0
se
|| > 1 .
2

10.4. TEOREMA DEL CAMPIONAMENTO

789

Si noti che questo ltro si dovrebbe naturalmente chiamare passa banda, perch lascia passare un intervallo di frequenze, ma questo intervallo di frequenze
centrato in zero; poich molti segnali sono a valori reali, la loro trasformata
di Fourier identicata univocamente dai valori a frequenze positive (la parte
reale pari e quella immaginaria dispari, Corollario 8.2.6 (iii)): pertanto
tradizione chiamare questo tipo di ltri passa basso.
In altre parole, per ogni R si ha
fb() = fb()[ 1 , 1 ] ().
2 2

Quindi ecco come lidentit (10.11) si estende a tutto R: nel senso della
convergenza in L2 (R) vale lidentit
fb() = fb()[ 1 , 1 ] () =
2 2

k=

f (k)e2ik [ 1 , 1 ] ()
2 2

R (10.13)

(ora entrambi i membri si annullano per || > 21 , mentre per || 6 12


luguaglianza (10.13) coincide con (10.11)).
Ora ci liberiamo del fattore [ 1 , 1 ] , cio del ltro.
2 2
Come in Sezione 8.2 ed in Sezione 9.7, indichiamo con F loperatore di trasformata di Fourier, con F1 la trasformata di Fourier inversa e con k loperatore
di traslazione di passo k, cio
(10.14)

k h(x) = h(x k).


Rammentiamo che, per ogni h L1 (R),
Fk h() = e2ik Fh()

(Teorema 8.2.4 (v)). Quindi, poich loperatore di trasformata di Fourier


inversa coincide con quello di trasformata di Fourier a meno del segno della
variabile (Teorema 8.4.2, o anche Teorema 8.2.4 (iii)), si ha
F1 k h() = e2ik F1 h() .
Inoltre abbiamo visto nellEsercizio 10.1.5 che [ 1 , 1 ] = F1 (sinc). Grazie al
2 2

fatto che la funzione caratteristica h = [ 1 , 1 ] pari, abbiamo F1 h = Fh =


2 2
sinc (parte (ii) del Teorema 8.2.4) e
F1 (k sinc)() = e2ik F1 sinc = e2ik h()

790

CAPITOLO 10. CAMPIONAMENTO

(parte (ii) dello stesso Teorema applicata a fb invece che a f ). In altre parole,
e2ik [ 1 , 1 ] () = F1 (k sinc)() .
2 2

Pertanto (10.13) diventa


fb() =

f (k)F1 (k sinc)()

k=

per ogni R .

La serie converge nel senso di L2 perch luguaglianza (10.13) vale nel senso
della convergenza in L2 .
Ora applichiamo la trasformata di Fourier ad entrambi i membri. Poich la
trasformata di Fourier un isomorsmo isometrico (quindi continuo) nella
norma di L2 (R) (Teorema di Plancherel: Corollario 8.5.2), e la serie a secondo
membro converge in L2 , loperatore di trasformata di Fourier commuta con
la serie e pertanto, grazie alla propriet di parit (Teorema 8.2.4 (ii)), si
ottiene la seguente uguaglianza che vale nel senso di L2 :
f (x) =

f (k)(k sinc)(x) =

k=

k=

f (k) sinc(x k) ,

cio, scrivendo x al posto di x,


f (x) =

k=

f (k) sinc(x k) .

(10.15)

Questa identit vale in L2 , quindi, in particolare, quasi ovunque, per la denizione delle funzioni in Lp come classi di equivalenza quasi ovunque (Denizione 1.16.16). Dobbiamo dimostrare che vale puntualmente ovunque.
b
Purtroppo, sebbene la successione {f (k) = (k)}
appartenga a 2 , non
detto che sia anche in 1 , se no potremmo applicare il test di Weierstrass
(Teorema 1.3.29) e dimostrare addirittura che (10.15) vale uniformemente.
Invece, occorre svolgere un calcolo pi faticoso.
Il primo membro di (10.15) una funzione continua, perch in B 1 . Quindi
2
basta dimostrare che lo anche il secondo membro. Se la serie a secondo
membro converge uniformemente allora abbiamo la continuit, perch i suoi
termini sono funzioni continue. Dimostriamo allora che la serie converge
uniformemente. Essa il prodotto scalare in 2 delle due successioni {f (k)} e

10.4. TEOREMA DEL CAMPIONAMENTO

791

{sinc(xk)}. Abbiamo gi osservato che la prima appartiene a 2 ; la seconda


vi appartiene perch la funzione sinc(x k) decresce allinnito come k1 , per
ogni ssato x (Denizione 10.1.4).
Per provare che la serie al secondo membro di (10.15) converge uniformemente
basta dimostrare che per ogni > 0 esiste n = n N (indipendente da x)
tale che
X
|f (k)| | sinc(x k)| < .
|k|>n

Per la disuguaglianza di CauchySchwarz in 2 (Proposizione 4.5.1),


sX
sX
X
2
|f (k)|
| sinc(x k)|2 .
(10.16)
|f (k)| | sinc(x k)| <
|k|>n

|k|>n

|k|>n

Osserviamo che | sinc(x k)| 6 1 per ogni x e k e | sinc(x k)| 6 1/|x k|


per ogni x, k tali che |x k| > 1, nella seconda serie al membro di destra
separiamo dagli altri i termini con |x k| < 1 (che sono al pi due e si
possono ciascuno maggiorare con il valore massimo della funzione sinc, ossia
1), ed otteniamo
s
sX

X
X
1
2
|f (k)| | sinc(x k)| <
.
|f (k)| 2 +
|x k|2
|k|>n

|k|>n

|k|>n,|xk|>1

Delle due serie al secondo membro, la prima tende a zero con n, per lappartenenza a 2 della successione degli addendi {f (k)}, e la seconda converge
uniformemente per il test di Weierstrass (Sezione 1.1); anzi, tende uniformemente a zero
n , perch dominata dalle code della serie
P quando
2
convergente
k 1/k (la maggiorazione uniforme su x perch in realt la
P
serie k 1/|x k|2 una funzione periodica di periodo 1, visto che sommiamo su tutti i k Z, e quindi basta dimostrare che la maggiorazione vale
per ogni x nellintervallo [ 21 , 12 ]: tralasciati gli interi k pi vicini a x, per
tutti gli altri k si ha |x k| > 1 e sinc2 (x k) < 1/(x k)2 . Poich la
distanza fra x e k cresce linearmente in k, quando 0 6 x < 1 questi termini
sono denitivamente maggiorati da (1 + k)2 (si veda lesercizio seguente).
Questo completa la dimostrazione.

Esercizio 10.4.5. Si ricavi la maggiorazione uniforme rispetto a x del secondo


membro dellidentit 10.16 nelle seguenti due maniere alternative:
P
(i) maggiorando uniformemente la serie k (sinc(x k))2 .

792

CAPITOLO 10. CAMPIONAMENTO


Suggerimento: anche questa serie una funzione periodica (di periodo
1), ed i suoi termini, per 0 6 x < 1, sono maggiorati uniformemente da
1/k 2 ;

(ii) osservando che sinc2 la trasformata di Fourier della funzione t =


[ 1 , 1 ] [ 1 , 1 ] , la quale una funzione (con graco triangolare) a
2 2
2 2
supporto compatto in [1, 1], ed applicando la formula di somma di
Poisson (Proposizione 10.3.1).

Ora cambiamo la scala, per passare dal campionamento a passo 1 al campionamento a passo arbitrario. Lenunciato che si ottiene stato associato
al nome dellingegnere Claude Shannon, per il suo articolo [27] sulla teoria
della comunicazione dellinformazione, pubblicato nel 1948 (si veda anche
larticolo [28] dellanno successivo).
Corollario 10.4.6. (Teorema del Campionamento di Shannon.) Per
ogni 0 > 0, f B0 e x R, vale la seguente
formula dio ricostruzione del
n
k
segnale f a partire dai valori campionati f ( 20 ) : k Z :
f (x) =

k=

k
20

sinc(20 x k)

Dimostrazione. Questo enunciato segue in maniera ovvia dal Teorema 10.4.4,


se applichiamo il teorema di dilatazione per la trasformata di Fourier (Teorema 8.2.4 (iv)). Infatti, ponendo g(x) = f ( 2x 0 ), si ha per il succitato
teorema
gb() = 20 fb(20 )
e quindi g B 1 perch si assume f B0 . Pertanto il Teorema 10.4.4
2
implica, per ogni t R:
g(t) =

k=

g(k) sinc(t k).

Ma g(t) = f ( 2t 0 ), e quindi

X
t
k
f(
)=
f(
) sinc(t k) t R.
20
20
k=

10.4. TEOREMA DEL CAMPIONAMENTO


Ora scrivendo x =

t
20

793

otteniamo la formula dellenunciato.

Nota 10.4.7. Lo sviluppo in serie di Whittaker ricostruisce una funzione f


B 1 come serie di traslati della funzione sinc. La funzione sinc ha valore
2
massimo 1. Nella serie, il termine k-esimo f (k) sinc(x k): esso consiste
della funzione sinc traslata di passo k (cos da avere massimo per x = k), e
dilatata verticalmente in modo che, per x = k, il suo valore sia f (k) invece
di 1. Quindi f viene ottenuta sovrapponendo e sommando queste funzioni
oscillanti ed appropriatamente dilatate.

Figura 10.3: Le funzioni che costituiscono i termini dello sviluppi in serie di Whittaker

Nota 10.4.8. Si osservi dal disegno che i traslati delle sinc si annullano su tutti
gli interi eccetto quello in cui raggiungono il valore massimo. Dimostreremo
tra poco che questo fatto vero, ma prima osserviamo che al punto x = m
si ha
f (m) sinc(x m)|x=m = f (m) sinc(0) = f (m).
Per il teorema di Whittaker dice che
f (m) =

k=

f (k) sinc(m k) = f (m) +

k6=m

Pertanto per ogni m deve valere


X
f (k) sinc(m k) = 0.
k6=m

f (k) sinc(m k)

794

CAPITOLO 10. CAMPIONAMENTO

Fissato m, possiamo pensare questa serie come un prodotto scalare in 2 ,


fra il vettore dato dalla successione {f (k), k Z, k 6= m} e quello dato da
{sinc(m k), k Z, k 6= m}
Esercizio 10.4.9. Mostrare che questultima successione in 2 .

Al variare di f B 1 la successione {f (k)} descrive una successione di dati:


2
si tratta di una generica successione in 2 . Dire che il prodotto scalare sia
sempre zero, per ogni tale successione, equivale a dire che il funzionale lineare
su 2 individuato (nel senso del Teorema di rappresentazione di Riesz 4.6.4)
dalla successione k 7 sinc(mk) sia nullo: ossia che si abbia sinc(mk) = 0
se k 6= m.
Ed infatti:
sin(j)
=0
sinc(j) =
j
se j intero e diverso da zero.
In altre parole, il traslato di passo k della funzione sinc vale uno per x = k,
ma vale zero per ogni x intero diverso da zero. Quindi

1
se
m=k
sinc(m k) = mk =
0
se
m 6= k
e

k=

f (k) sinc(m k) =

f (k)mk = f (m).

k=

Analogamente, il teorema di Shannon (Corollario 10.4.6) dice che


f (x) =

k=

k
20

sinc(20 x k)

m
Se x un punto della griglia di campionamento (cio x = 2
con m intero)
0
si ottiene una identit, perch sinc(20 x k) = sinc(m k) = mk .

Nota 10.4.10. La nota precedente si pu ripensare in termini di algebra lineare. Abbiamo un vettore di dati Ff = {f (k)} (con innite componenti) ed
una "matrice" a dimensione innita M = {sinc(m k)}
m,k= . Lo sviluppo
di Whittaker, letto per x = m Z, dice che Ff = MFf per ogni f B 1 .
2

10.4. TEOREMA DEL CAMPIONAMENTO

795

Al variare di f in B 1 , la successione Ff descrive il vettore generico di 2


2
(questo fatto intuitivo non lo dimostriamo). Perci per ogni vettore v si ha
Mv = v. Ma allora M lidentit, cio
Mmk = sinc(m k) = mk

Nota 10.4.11. Il teorema del campionamento di Shannon (Corollario 10.4.6)


dice che un segnale con frequenza limitata da 0 , quindi con ampiezza di
banda pari a 20 , pu essere ricostruito esattamente (senza perdite) a partire
dai suoi valori su una griglia di campionamento di passo = 21 0 . Se il
segnale ha ampiezza di banda superiore allora non ricostruibile esattamente
da questo campionamento. Ma cosa succede se al di fuori della banda di
frequenza [0 , 0 ] la trasformata di Fourier fb del segnale f non nulla ma
ha valori piccoli (rispetto ad una soglia opportunamente pressata) e tendenti
a zero rapidamente per ? Il teorema di Shannon non applicabile,
per ci aspettiamo che a partire dallo stesso campionamento il segnale sia
ricostruibile con perdite, ma perdite piccole, trascurabili. Questo vero, ma
per provarlo dobbiamo riformulare la dimostrazione del teorema di Shannon
in termini dellapprossimazione dei segnali a banda limitata con segnali a
decrescenza rapida (questa riformulazione presentata nel capitolo 13: si
vedano in particolare Sezione 13.1 e Sezione 13.5). Per questo introdurremo,
nel prossimo capitolo, le distribuzioni temperate.

796

CAPITOLO 10. CAMPIONAMENTO

Capitolo 11
Modellazione matematica del
processo di campionamento: le
distribuzioni temperate e le
distribuzioni
11.1

Il campionamento di segnali visto come


funzionale lineare

Consideriamo uno spazio vettoriale di funzioni di una variabile reale, che


rappresentano segnali (elettrici, acustici, e cos via). Useremo a questo scopo
la classe di Schwartz S.

Il campione del segnale f al tempo t il valore f (t). Quindi prendere il


campione al tempo t signica eettuare la lettura
t : f f (t).
t una applicazione da S a C, che si chiama delta di Dirac al tempo t;
una applicazione lineare, perch, date due funzioni test f1 e f2 e due costanti c1 , c2 C, il campione della combinazione lineare c1 f1 + c2 f2 la
combinazione lineari dei campioni:
797

798

CAPITOLO 11. DISTRIBUZIONI

t (c1 f1 + c2 f2 ) = (c1 f1 + c2 f2 ) (t)


= c1 f1 (t) + c2 f2 (t)
= t (c1 f1 ) + t (c2 f2 ) .
Inoltre t : S 7 C continuo in base al Corollario 9.2.2, perch
|t f | = |f (t)| 6 kf k = p00 (f ).
Quindi la lettura del campione al tempo t un funzionale lineare continuo
sullo spazio S.
Dal punto di vista sico, per, questa modellazione una estrapolazione.
Se vogliamo misurare il valore di un segnale al tempo t dobbiamo tener conto
dellinerzia degli strumenti di misura. Il valore che leggiamo una media dei
valori istantanei in un piccolo intervallo temporale. Un modello possibile il
seguente:
1
valore campionato di f a t0 =
2

t0 +

f (s) ds .

(11.1)

t0

Naturalmente lespressione (11.1) appropriata se lo strumento di misura


eettua la lettura nellintervallo (t, t+) trattando tutti i valori istantanei
in questo intervallo con lo stesso peso. In tal caso diciamo che la risposta
dello strumento allimpulso allistante t0
1
[,],
2
dove , come al solito, denota la funzione caratteristica dellintervallo [, ],
come in Figura 11.1
Lespressione (11.1) dice che il valore campionato al tempo t0 la convoluzione


1
[,] f (t).
2
(Denizione 6.1.11). Naturalmente, la risposta allimpulso, ossia la funzione usata per convolvere, potrebbe cambiare con il tempo, per esempio con
linvecchiamento dello strumento di misura.

11.1. CAMPIONAMENTO E FUNZIONALI

799

Figura 11.1: Il peso per la media integrale

Figura 11.2: Un peso per una media pesata

Altri strumenti potrebbero avere una risposta diversa, pi graduale. La


loro curva di risposta sar una pi generale funzione positiva di integrale 1,
come, ad esempio, la funzione dal graco illustrato nella Figura 11.2.
Assumeremo dora in avanti che la curva di risposta dello strumento di
misura non si modichi con il tempo, cio non vari con let dello strumento.
Sotto questa ipotesi di invarianza per traslazione temporale, la risposta dello
strumento centrata al tempo t il traslato della sua risposta centrata al
tempo 0, cio la funzione traslata t data da s (s t). Scrivendo
(s) = (s) abbiamo quindi che il valore campionato dato da
valore campionato a t =

f (s)t (s) ds ,

dove (t) (s) = (s t) = (t s) = t (s) = s (t)), e quindi dalla


convoluzione (Denizione 6.1.11)

f (t) =

(t s)f (s) ds =

(s t)f (s)ds .

Per comodit di notazione, in seguito chiameremo invece che la curva

800

CAPITOLO 11. DISTRIBUZIONI

di risposta, e quindi scriveremo il valore campionato al tempo t come


Z
f (t) =
(s t)f (s)ds.

In altre parole, il valore campionato per i diversi valori di t si ottiene facendo


una media integrale del segnale rispetto ad un peso , sempre della stessa
forma, ma traslato in maniera da centrarlo in t, come illustrato nelle Figure
11.3 e 11.4.

Figura 11.3: Collocazione del peso per il campionamento approssimato al tempo t,


nellipotesi di invarianza temporale dello strumento di misura

Il peso dipende dalla risposta dello strumento di misura. Ma naturalmente noi ci aspettiamo che il valore esatto del segnale sia indipendente
dallo strumento di misura. Questa una ipotesi che ha senso solo per misure
di fenomeni macroscopici, nei quali il procedimento di misura non altera il
valore da misurare: se ad esempio volessimo trovare la posizione di una particella elementare, diciamo "illuminandola con un ash", i fotoni del raggio
di luce che bombardano la particella potrebbero spostarla e quindi cambiarne
la posizione (o altrimenti ne cambierebbero la velocit). Ma per i segnali di

Figura 11.4:

Campionamento approssimato tramite medie pesate nellipotesi di


invarianza temporale dello strumento di misura

11.1. CAMPIONAMENTO E FUNZIONALI

801

Figura 11.5: Identit approssimate con funzioni semplici

Figura 11.6: Identit approssimate con funzioni a campana

interesse in multimedialit questa ipotesi generalmente ha senso. Perci possiamo immaginare di poter cambiare strumento di misura, ranandolo via
via di pi, no a precisione illimitata. Nei due esempi di curva di risposta di
uno strumento che abbiamo disegnato pi sopra, questo vuol dire prendere
curve sempre pi strette ed alte, ma tutte con integrale uno (altrimenti il
valore restituito dalla misura non sarebbe una media). Avremmo quindi una
successione di funzioni di risposta , > 0, dove
 
t
1
(t) =

una versione di compressa orizzontalmente e dilatata verticalmente in


modo da lasciare inalterato lintegrale, come nelle Figure 11.5 e 11.6.
Quindi il valore esatto
f (t) = lim f (t) .
0

Riformuliamo tutto ci in termini di convoluzioni. Richiedere che il valore


vero non dipenda dallo strumento di misura signica asserire che, se per ogni

802

CAPITOLO 11. DISTRIBUZIONI

non negativa e di integrale 1 si pone


1 s
( ),

allora per ogni f S esista e non dipenda dalla scelta di il limite


Z

t (s)f (s) ds
lim+ ht , f i = lim+
(s) = (s) =

(dove la notazione quella della Notazione 9.7.7, t il traslato di di


passo t come in (10.14), e quindi t (s) = (s t) = (t s)).
Abbiamo cos concluso che il valore esatto f (t) deve coincidere con il limite
lim ht , f i

0+

per ogni scelta di L1 (R), non negativa e di integrale uno.


In sintesi, il valore istantaneo f (t) = t (f ); invece il valore letto dallo
strumento di misura la seguente convoluzione (Denizione 6.1.11):
Z

Tt f ht , f i =
(s t)f (s) ds = f (t).
(11.2)

Nota 11.1.1. Osserviamo che, se il segnale f coincide con t0 , ovvero se si


tratta di un segnale puramente impulsivo (un singolo picco) al tempo t0 ,
allora, in base a (11.2), il valore letto dallo strumento di misura al tempo
t dovrebbe essere esattamente il traslato temporale (t0 t) = (t t0 )
di passo t0 della curva di risposta dello strumento di misura. Per questo
motivo la curva di risposta si chiama di solito la risposta impulsiva, o anche
risposta allimpulso dello strumento.
Un esempio di strumento di misura un po insolito, eppure frequentissimo,
un auditorium con riverbero (come tutti gli auditorium). In questo caso
lauditorium, insieme al microfono di registrazione, lo strumento di misura,
e quindi il valore del segnale acustico registrato al tempo t in risposta ad
un impulso ivi generato al tempo t0 la risposta dellauditorium allimpulso
(t t0 ). Questo vero se la curva di risposta invariante per traslazioni
temporali, ossia se il segnale udito in risposta ad un impulso generato al
tempo t0 il traslato temporale di passo t0 del segnale udito in risposta ad
un impulso al tempo 0. In eetti, questo smette di essere vero se la forma
dellauditorium si modica durante lascolto, ad esempio perch gli spettatori
si spostano.

11.1. CAMPIONAMENTO E FUNZIONALI

803

Proposizione 11.1.2. Per ogni L1 (R) con kk1 = 1, lapplicazione


T : S 7 C definita da
Z
T f = h, f i =
(s)f (s) ds

lineare e continua su S.
Dimostrazione. La linearit ovvia. Mostriamo la continuit:
|T f | 6 kf k

|(s)| ds

= kf k kk1 = kf k .
In altre parole
|T f | 6 p00 (f )

e quindi T continuo su S per la Proposizione 9.2.1.

Lemma 11.1.3. Sia L1 (R) , > 0, con


Z
(s) ds = 1.

Allora la famiglia { , > 0} (dove (s) = 1 ( s )) forma unidentit


approssimata in L1 (R) (nel senso della Definizione 6.1.15).
Dimostrazione. ovvio che > 0 per ogni > 0. Inoltre, per ogni > 0,
Z
Z
Z
1 s
ds =
(s) ds =

(u) du = 1.

Basta quindi mostrare che vale la propriet della Denizione 6.1.15: per ogni
, > 0 esiste 0 = 0 (, ) tale che, se 0 < < 0 ,
Z
(s) ds > 1 .

In eetti, ponendo u =
Z

si ha

1
(s) ds =

s

ds =

(u) du

804

CAPITOLO 11. DISTRIBUZIONI

ed analogamente

(s) ds =

(u) du = 1 .

R
Poich per ogni > 0 si ha / + se 0+ e (u) du nito,
concludiamo che, ssato > 0 e > 0, esiste 0 > 0 tale che, per 0 < < 0 ,
Z
Z
1 s
ds =

(u) du < ,

|u|>
|s|>
e quindi
Z

(s) ds =

1 s
ds = 1

|s|>

1 s
ds > 1 .

Il teorema alla base della modellazione matematica del campionamento non


altro che un corollario del Lemma 11.1.3.

1
Teorema
R 11.1.4. Per ogni f S, per ogni t R, per ogni L (R) con
> 0 e (t) dt = 1 si ha

lim Tt f = f (t) = t (f ) .

0+

Se si assume soltanto che f sia in L1 questa uguaglianza vale in L1 , e quindi


puntualmente quasi ovunque.
Dimostrazione. Per il Lemma 11.1.3 { , > 0} forma unidentit approssimata. Quindi lenunciato non altro che il Teorema 6.1.16 o in alternativa
il Teorema 6.1.17.

Riassumendo, il funzionale lineare continuo T su S serve ad approssimare 0 (f ), e Tt serve ad approssimare t (f ) per ogni t R. Vogliamo
riformulare questi concetti introducendo una nozione di convergenza per i
funzionali lineari continui su S in maniera tale da avere
lim T 0

0+

e
lim Tt t .

0+

11.2. FUNZIONALI CONTINUI E PRODOTTI SCALARI

11.2

805

Richiami su funzionali lineari continui e


prodotti scalari

Rammentiamo il seguente risultato (Teorema 4.6.4):


Teorema 11.2.1. (Rappresentazione di Riesz.) Se V uno spazio normato la cui norma indotta da un prodotto scalare (ad esempio uno spazio
di Hilbert), per ogni funzionale lineare continuo T su V esiste un vettore
vT V tale che
T w = (w, vT ) w V
e viceversa.

Ad esempio, se V = L2 (R), il Teorema 11.2.1 di rappresentazione di Riesz


asserisce che ogni funzionale continuo T del tipo
Z
Tf =
f (x) g(x) dx = (f, g)L2 (R)

per qualche g L2 . Nel seguito scriveremo Tg (f ) = hf, gi = (f, g)L2 e quindi


T = Tg .
Invece, la classe S di Schwartz non uno spazio normato. La nozione di
convergenza in S non proviene da una norma, bensi da una famiglia numerabile di seminorme {pkl }. In tal caso la nozione di continuit di un funzionale
T stata data nel Corollario 9.2.2 ed la seguente:
Un funzionale lineare T su S continuo se e solo se esiste una famiglia
finita di coppie di indici (k1 , l1 ) , . . . , (kn , ln ) e una costante C tali che
|T f | 6 C

n
X

pki li (f ).

i=1

Esempio 11.2.2. Consideriamo il caso del funzionale lineare del campionamento introdotto pi sopra su S, dato da T ( S):
Z
T (f ) =
f (x)(x)dx

(pi sopra era a valori reali e la coniugazione complessa non era necessaria).
Sappiamo gi che questo funzionale continuo su L2 (R) (Teorema 11.2.1 di
rappresentazione di Riesz). Esso anche continuo su S, per la Proposizione
11.1.2.

806

11.3

CAPITOLO 11. DISTRIBUZIONI

Cenni sulla dualit per spazi normati o


muniti di una famiglia numerabile di seminorme

Abbiamo visto in Sezione 11.1 che, dato un segnale f nella classe di Schwartz,
la lettura del suo valore campionato ad un istante t0 approssimata dal valore
di un funzionale lineare continuo T sulla classe di Schwartz, dove una funzione non negativa e di integrale 1. Per una approssimazione via via migliore
si deve usare una famiglia di funzioni { } sempre pi concentrata attorno a
t0 (cio una identit approssimata nel senso della Denizione 6.1.15). Invece
il valore esatto, non approssimato, del segnale allistante t0 dato da un altro
funzionale lineare su S, il funzionale denito da t0 (f ) = f (t0 ). Il funzionale
che fornisce il valore approssimato quindi rappresentato da una funzione ,
nel senso che il valore approssimato dato da
Z
T (f ) =
(t)f (t) dt.
(11.3)

Non invece possibile rappresentare nello stesso modo t0 con una funzione,
perch t0 (f ) non dipende dai valori di f in un intorno (sia pure piccolo)
del punto t0 , ma solo nel punto t0 stesso (vedremo questo fatto in maggior
dettaglio in Sezione 11.7).
Modelliamo le operazioni di campionamento di segnali in S con funzionali lineari continui su S. Prima di studiare lo spazio vettoriale dei funzionali
lineari continui su S, premettiamo qualche cenno sullimpostazione alla base
di questa modellazione. NellEsempio 11.2.2 abbiamo considerato il valore
medio del segnale f in un intorno del punto t0 , dato dal funzionale T di
(11.3), dove una opportuna funzione a valori non negativi e di integrale 1. Idealmente, vorremmo generalizzare la nozione di funzione in modo
cos ampio che si possano rappresentare in questa maniera tutti i funzionali continui che intervengono nel campionamento, incluso il funzionale t0
del campionamento istantaneo al punto t0 , che, come si accennato, non
rappresentabile a questo modo con una funzione usuale. Quindi abbiamo
bisogno di una ampia generalizzazione del concetto di funzione.
Gli elementi di questo spazio di funzioni generalizzate sono in corrispondenza
biunivoca con i funzionali continui su S.
Notazione 11.3.1. Per ogni f S e T S scriviamo hT, f i invece che
T (f ), in analogia alla notazione introdotta nellEsempio 11.2.2, in base alla

11.3. DUALIT

807

quale si ha
T (f ) =

(t)f (t) dt = h, f i = hf, i.

Lo spazio dei funzionali continui su S si indica con S e lapplicazione


bilineare
(T, f ) S S 7 hT, f i C
si chiama dualit. Lo spazio S talvolta viene chiamato il duale di S.
Qui ci limitiamo ad accennare che, prendendo il duale di S, si ottiene
uno spazio vettoriale amplissimo, proprio come vogliamo. Per capire questo
concetto, occorre ripensare agli esempi gi visti di dualit. Ci sono due
diverse situazioni in cui questo concetto gi emerso.
La prima la dualit per spazi vettoriali a dimensione nita, o pi in
generale per spazi di Hilbert, illustrata nel Teorema 11.2.1 di rappresentazione di Riesz. Grazie a questo teorema sappiamo che ogni elemento T del
duale (Cn ) di Cn rappresentato da un unico vettore u Cn mediante
lespressione
T (v) = (v, u) = hv, ui
(dove u il complesso coniugato di u, cio il vettore le cui componenti sono le
coniugate di quelle di u) e viceversa, ogni tale vettore d luogo ad un elemento
di (Cn ) . Quindi (Cn ) isomorfo a Cn come spazio vettoriale (e lisomorsmo
isometrico, sempre per lo stesso teorema). In particolare, il duale di Cn+1
pi grande del duale di Cn , nel senso che (Cn ) si immerge come sottospazio
in (Cn+1 ) . Infatti, ogni t (Cn ) si estende ad un funzionale T (Cn+1 )
in inniti modi possibili (una famiglia ad un parametro, come vedremo),
ad esempio nel modo seguente: se u il vettore in Cn che rappresenta T ,
possiamo scegliere il seguente vettore u Cn+1 per rappresentare T : u =
(u1 , u2 . . . , un , 0). Questa scelta analoga alla consueta immersione di Cn
in Cn+1 come linsieme delle (n + 1)-ple di numeri complessi in cui lultimo
numero zero: cio il piano orizzontale della Figura 11.7, che illustra il
caso di R2 R3 (o di C2 C3 ).
Da questo esempio ci si aspetta quindi che, se ingrandiamo lo spazio vettoriale
di partenza, si ingrandisca in maniera isometrica anche il duale. Per per
spazi normati a dimensione innita c un secondo modo di ingrandire, che
abbiamo gi considerato in unaltra situazione.

808

CAPITOLO 11. DISTRIBUZIONI

Figura 11.7: Immersione canonica di R2 in R3

Questa seconda eventualit non fa riferimento al passaggio da uno spazio


vettoriale ad un altro pi grande in cui il primo si immerge come sottospazio
chiuso, bens al passaggio da uno spazio normato ad un altro pi grande
in cui il primo denso. Per una analogia a dimensione nita si potrebbe
provare a pensare alla densit dei razionali Q nei reali R (ma attenzione,
questa analogia in realt non calza; infatti, perch essa abbia senso i due
spazi vettoriali devono essere deniti sullo stesso campo scalare, e quindi in
questo caso su Q; ora, Q ha dimensione 1 come spazio vettoriale su Q, ma,
come spazio vettoriale su Q, R ha dimensione innita, a causa del fatto che
Q numerabile (Sezione 1.1), e quindi lo anche linsieme delle combinazioni
lineari a coecienti in Q di un numero nito di elementi di R; invece R pi
che numerabile).
Per comprendere questa eventualit, si consideri un sottospazio vettoriale
W di uno spazio vettoriale normato V . Se W denso in V , allora le successioni di elementi di W che sono di Cauchy rispetto alla norma k kV convergono
a elementi di V , ma non necessariamente ad elementi di W . Supponiamo
ora che W abbia una sua norma k kW rispetto alla quale sia completo. Le
successioni di Cauchy in W rispetto a questa norma (Denizione 1.2.15) convergono a elementi di W (Nota 1.2.16) e quindi di V . Perci ci sono pi
successioni di Cauchy convergenti rispetto alla norma di V che non alla norma di W : questo suggerisce che la norma di W sia pi grande di quella di

11.3. DUALIT

809

V , nel senso che esiste C > 0 tale che, per ogni w W , si ha


kwkV 6 CkwkW .
In eetti questa disuguaglianza vera (essa per richiede, per una dimostrazione rigorosa, un risultato importante dellAnalisi Funzionale, il Teorema
del Graco Chiuso (Teorema 3.16.4).
Ma allora, se F un funzionale lineare continuo su V e wn una successione
in W convergente a w0 W , wn converge a w0 anche nella norma di V , e
quindi
lim F (wn ) = F (w).
n

Perci F continuo anche rispetto alla norma di W : quindi, se F V , allora


F W . Ne segue che il fatto che W V sia denso implica che V W .
Questo fatto si pu riscrivere in termini di norme di funzionali lineari continui,
nella notazione introdotta nella Denizione 3.3.13: se F V , allora per ogni
w W V si ha
|F (w)| 6 kF kkwkV 6 CkF kkwkW ,
quindi F W e la norma del funzionale F come elemento di W maggiorata
da CkF k dove kF k la norma di F come elemento di V .
Riassumamo gli esempi di dualit ed inclusioni fra spazi di Banach della Sezione 3.12, alla quale rinviamo il lettore per maggiori dettagli sulle
dimostrazioni qui omesse.
Cominciamo con gli spazi normati L2 [0, 1] e L1 [0, 1] (gi studiati nella
Sezione 1.16). Abbiamo visto che L2 [0, 1] L1 [0, 1]: pi precisamente, per
ogni f L2 [0, 1] si ha kf k1 6 kf k2 . Daltra parte, L2 [0, 1] denso in L1 [0, 1].

Esempio 11.3.2. ((L1 ) = L .) Il duale di L1 [0, 1] (isometricamente) isomorfo a L [0, 1]. Abbiamo a suo tempo dimostrato (nella dimostrazione del
Teorema 1.19.6) che ogni funzionale continuo su L1 rappresentabile come
integrale pesato con una funzione, nel senso dellEsempio 11.2.2. Quindi

(L1 [0, 1]) isometricamente isomorfo a L [0, 1]. Questo fatto un caso
particolare del Teorema 1.19.6.
Lo stesso argomento, svolto per funzioni su R invece che su un intervallo
compatto come [0, 1], grazie al teorema di convergenza di identit approssimate su R (Teorema 6.1.16), prova che il duale di L1 (R) isometricamente
isomorfo a L (R). Anche questo un caso particolare del Teorema 1.19.6.

810

CAPITOLO 11. DISTRIBUZIONI

Daltra parte, per il Teorema 11.2.1 di rappresentazione di Riesz si ha che


L [0, 1] (isometricamente) isomorfo a L2 [0, 1]. Ma abbiamo appena visto
che L2 [0, 1] L1 [0, 1] ed ovvio che L [0, 1] L2 [0, 1] (esercizio). Quindi
abbiamo la catena di inclusioni
2

L [0, 1] L2 [0, 1] L1 [0, 1]


e

L1 [0, 1]
= L2 [0, 1] .
= L [0, 1] L2 [0, 1]

Ecco quindi che, in questo caso nel quale i sottospazi non sono chiusi
(anzi sono densi, in base al Teorema di convergenza di identit approssimate,
Teorema 6.1.10), la dualit rovescia la relazione di inclusione.
Esempio 11.3.3. ((Lp ) = Lq se p1 + 1q = 1.) Pi in generale, prendiamo
indici coniugati 1 6 p < , 1 < q 6 con p1 + 1q = 1 (Denizione
1.16.4; conveniamo come sempre che, se p = 1 e q = , valga p1 + 1q = 1,
per qui consideriamo solo il caso p = 1, q = , non il viceversa). Dalla
disuguaglianza di Hlder per funzioni su R (Teorema 1.16.6) segue
|T (f )| = |h, f i| 6 kkq kf kp .

(11.4)

Di nuovo grazie al teorema di convergenza di identit approssimate, questa


volta nella norma di Lp , si ha come prima che la mappa 7 T descrive un
isomorsmo isometrico di Lq sul duale di Lp :
sup {|h, f i| : kf kLp = 1} = kkq .

(11.5)

Abbiamo accennato nellEsempio 3.12.3 che il duale di L non si ottiene


in questo modo: esso pi grande di L1 .

Esempio 11.3.4. (Dualit ed inclusioni per spazi Lp [0, 1].) Abbiamo


appena visto che, se p e q sono indici coniugati (nel senso del precedente
Esempio 11.3.3), allora
Lp [0, 1]
= Lq [0, 1]
(isomorsmo isometrico). Si noti che, se 1 < p < r < , la relazione degli
indici coniugati p1 + 1q = 1 rovescia la disuguaglianza quando si passa agli
indici coniugati, e pertanto per 1 < p < r < si ha
L [0, 1] ( Lr [0, 1] ( Lp [0, 1] ( L1 [0, 1]

11.3. DUALIT

811

ma
L1 [0, 1] ( Lp [0, 1] ( Lr [0, 1] ( L [0, 1] .

Esempio 11.3.5. (Dualit ed inclusioni per spazi p .) Simmetricamente,


per gli spazi p si ha (Proposizione 1.7.7):
l 1 ( p ( r (
se 1 < p < r < , e
l = (l1 ) ) q = (lp ) ) s = (lr )
dove s 6 q e 1p + 1q = 1 = 1s + 1r (indici coniugati, nel senso della Denizione
1.16.4). Ciascuno spazio p denso in ogni spazio r se 1 6 p < q < , e le
inclusioni si rovesciano passando agli spazi duali.
Anche questi risultati sugli spazi p seguono, come prima, dalla disuguaglianza di Hlder, ma questa volta formulata per successioni numeriche
invece che per funzioni. Per cenni sulla dimostrazione rinviamo il lettore

allEsempio 3.12.4.
Si noti invece che C[0, 1] contenuto in L [0, 1] come sottospazio chiuso, non denso: infatti la norma in questi due spazi la stessa (la norma
uniforme). In questo caso abbiamo gi accennato che la dualit preserva linclusione, ed infatti si ha che C[0, 1] lo spazio delle misure numerabilmente
additive su [0, 1], mentre, come gi osservato nellEsempio 3.12.3, L [0, 1]
lo spazio delle misure che sono solo nitamente additive: il primo un
sottospazio chiuso del secondo.
Tutti gli esempi precedenti riguardano la dualit per spazi normati. Per
il nostro vero interesse studiare il duale di S, che non uno spazio normato,
bens munito di una famiglia numerabile di seminorme. La convergenza in S
molto pi forte di quella data dalle norme viste negli esempi precedenti. Ad
esempio, se fn f in S, allora, in particolare, kfn f k = p00 (fn f ) 0
per n , quindi la convergenza anche uniforme. Allo stesso modo si
vede che, se fn f in S, allora per ogni k > 0 si ha
lim kfn f kC k = lim

k
X
j=0

kD j (fn f )k = 0,

812

CAPITOLO 11. DISTRIBUZIONI

dove abbiamo indicato con C k lo spazio delle funzioni continue su un compatto ed ivi derivabili k volte con continuit (oppure lo spazio delle funzioni
continue e limitate su R derivabili k volte con tutte le derivate continue e
limitate), munito della seguente norma:
Definizione 11.3.6. (Norma in C k .)
kf kC k

k
X
j=0

kD j f k .

(In alcuni testi, viene considerata una variante di questo spazio, nella quale
le derivate e le loro norme sono in L1 o Lp , che si indica con W k ). Rispetto a
questa norma, C k uno spazio completo: infatti le successioni di Cauchy in
questa norma convergono ad elementi di C k , grazie al Teorema 1.3.19 di convergenza uniforme con le derivate (si confronti questa denizione con quella
data per lo spazio C nellEsempio 9.1.6). Si vede facilmente che S denso
in C0 (R) (lo spazio delle funzioni continue che tendo a zero allinnito) ed
anche nel sottospazio chiuso C0k (R) di C k (R) delle funzioni che tendono a
zero allinnito con tutte le derivate no allordine k, per ogni k > 0, nelle
rispettive norme (un cenno di dimostrazione dato nella prossima Proposizione 11.4.1). A questo proposito, si noti anche che C0k (R) denso in C0 (R):
largomento simile a quello esposto nella dimostrazione del Lemma 5.13.4
per mostrare che C 1 (R) denso in C(R)). Daltra parte, C(R) L1 (R)
un sottospazio denso in L1 (R), e di Lp (R) se 1 6 p < , come conseguenza
del teorema di convergenza delle identit approssimate, Teorema 6.1.16: per
questo basta prendere una identit approssimata {hn } consistente di funzioni
in C(R) L1 (R) e ricordare che, per ogni hn C(R) L1 (R) e g L1 (R), si
ha hn g C(R) L1 (R) (Esercizio 6.1.13).
Questi fatti rivelano che il duale S di S estremamente grande: include
tutti gli spazi di funzioni visti no ad ora.

11.4

Densit di S e convergenza in S

Proposizione 11.4.1. (i) Sia C0k lo spazio delle funzioni derivabili k volte con derivate continue e che tendono a zero allinfinito con tutte le
derivate fino allordine k. Allora C0k un sottospazio denso di C0 (R)
(nella norma di C0 , ovviamente).

11.4. DENSIT DI S E CONVERGENZA IN S

813

(ii) S denso in C0 (R) nella norma uniforme ed in C0k nella norma di C k .


(iii) S denso in ciascuno spazio Lp (R) con 1 6 p < , nella norma di
Lp .
(iv) Sia h L1 (R) una funzione la cui trasformata di Fourier C a crescita polinomiale con tutte le derivate (ad esempio se h continua a
supporto compatto: in tal caso, infatti, segue dalla parte (i) del Corollario 8.2.7 che b
h C e che le derivate sono tutte trasformate di Fourier
1
di funzioni L (R) e quindi tendono tutte a zero allinfinito, in base alla
Proposizione 8.2.3, e quindi sono tutte limitate). Sia {f } una identit
approssimata consistente di funzioni in S. Allora f convolve h in una
funzione in S, e f h h uniformemente e nella norma di C k per
ogni k.
Dimostrazione. Nella parte (i), chiaro che basta limitarsi al caso di funzioni a supporto compatto, perch evidentemente ogni funzione continua che
tende a zero allinnito si approssima uniformemente con funzioni continue
a supporto compatto. Allora otteniamo la parte (i) iterando largomanto
che dimostra il Corollario 5.13.5. Una dimostrazione alternativa ma equivalente la seguente. Si consideri una identit approssimata C k (R),
ad esempio la famiglia di funzioni C del Lemma 11.1.3 ottenuta normalizzando i dilatati della Gaussiana. Dal Teorema 6.1.16 sulla convergenza
delle identit approssimate sappiamo che f converge uniformemente a
f per ogni funzione f continua a supporto compatto (lipotesi di uniforme
continuit di f , richiesta in quel teorema, automaticamente soddisfatta se
f continua a supporto compatto grazie al Teorema di Heine sulla uniforme
continuit (Sezione 1.1). Daltra parte, f una funzione derivabile k
volte con continuit perch lo (Esercizio 6.1.13): quindi f si approssima
uniformemente con funzioni f C k (R).
Per quanto riguarda la parte (ii), dato un compatto K R, sappiamo
che i polinomi sono uniformemente densi in C(K) (Teorema 6.3.1). Senza
perdita di generalit, supponiamo che K sia un intervallo [a, a] (perch un
compatto in R, essendo limitato per il Teorema di BolzanoWeierstrass 1.9.6,
2
contenuto in un intervallo). Si consideri la Gaussiana (x) = ex . Il suo
2
minimo in [a, a] ea > 0, quindi 1 una funzione continua. Poich le
funzioni continue rimangono tali se le si moltiplica per una funzione continua,
moltiplicando per 1 vediamo che lo spazio J {f : f C[a, a]} coincide
2
con C[a, a]. Ma J contiene le funzioni p(x)ex , per ogni polinomio p,

814

CAPITOLO 11. DISTRIBUZIONI

che sono dense in J per il Teorema 6.3.1. Queste funzioni appartengono


tutte a S, e quindi S denso in J = C[a, a], cio, essendo a arbitrario,
nelle funzioni continue a supporto compatto (nel senso che ogni funzione
continua a supporto compatto, pensata come funzione su tutto R, pu essere
approssimata uniformemente a meno di precisione arbitraria con funzioni
di Schwartz). Daltra parte, banale che le funzioni continue a supporto
compatto siano dense in C0 (R): pertanto lo anche S.
Poich C0 denso in tutti gli spazi Lp nella norma di Lp (Proposizione
1.18.6), la parte (iii) segue immediatamente dalla (ii).
bb
Nelle ipotesi della parte (iv), f\
h = f h una funzione di Schwartz
h in C per ipotesi, ed a crescita
in base allEsempio 9.5.4 (perch b
polinomiale con tutte le derivate. Quindi f h S perch la trasformata di
Fourier inversa manda S in S (Teorema 9.7.5).
Il fatto che f h h uniformemente segue dal teorema di convergenza di
identit approssimate applicate a funzioni continue (Teorema 6.1.16). Ma
anche h continua, perch la funzione h Bc di classe C 1 (anzi, C ).
Quindi, per lo stesso argomento, f h h uniformemente. Daltra parte,
D(f h) = f h (parte (iii) della proposizione 6.1.5), e quindi f h
h uniformemente con la derivata, ossia nella norma di C 1 , ed iterando il
ragionamento la convergenza si ha nella norma di C k per ogni k.

Proposizione 11.4.2. Per c > 0, consideriamo la classe delle funzioni


a bandalimitata Bc .
(i) Per ogni c > 0, Bc * S e S * Bc
(ii) Bc S non denso in S.
(iii) Sia h Bc e {f } una identit approssimata consistente di funzioni in
S. Allora f h h uniformemente.

Dimostrazione. ovvio che S * Bc (si pensi alla Gaussiana, che in S


ma non a supporto compatto e la cui trasformata di Fourier ancora la
Gaussiana (Proposizione 8.3.2), quindi a supporto non compatto).
Per provare che Bc * S basta costruire un esempio di f B1 , f
/ S:
il caso generale di Bc si ottiene applicando a questo esempio un opportuno
operatore di dilatazione. Consideriamo h(t) = sinc2 t. chiaro che h
/ S,
perch
sin2 (t)
h(t) = sinc2 t =
2 t2

11.4. DENSIT DI S E CONVERGENZA IN S

815

non a decrescenza rapida, e quindi il suo dilatato k non appartiene a S.


Mostriamo che h B1 . chiaro che h C ed al di fuori di un compatto
limitata da 1/( 2 x2 ), L1 (R) (ossia g := sinc L2 (R). Inoltre, dallEsercizio
10.1.5 sappiamo che sinc =
b[ 1 , 1 ] . Ma allora, calcolando la trasformata di
2 2
2
Fourier nel senso di L (Nota 8.5.3), abbiamo
bb 1 1 = 1 1 = 1 1
d =
sinc
[ , ]
[ , ]
[ , ]
2 2

2 2

2 2

per la propriet di parit per la trasformata di Fourier (Teorema 8.2.4 (ii) e


Proposizione 11.12.14 rispettivamente) e per il fatto che [ 1 , 1 ] una funzione
2 2
pari. Ma allora segue dal Corollario 11.13.3, e dalle stesse propriet della
trasformata di Fourier e della sua inversa, che
[2 = b
b
h = sinc
gb
g=
b[ 1 , 1 ]
b[ 1 , 1 ] = u
2 2

2 2

dove u a supporto compatto (in eetti il supporto di u lintervallo [1, 1],


come mostra lesercizio seguente). Questo prova (i).
Per provare (ii), supponiamo per assurdo che Bc S sia denso in S. Allora
per ogni f S esisterebbe una successione fn Bc S tale che fn f
in S. Ma allora, per la continuit della trasformata di Fourier (Teorema
9.7.5), si avrebbe fbn fb in S. Ma, poich fn Bc , fbn ha supporto in
[c, c]. Prendiamo f S tale che fb non abbia supporto contenuto in [c, c]
2
(ad esempio la Gaussiana f (t) = et , per la quale il supporto di fb = f
(Proposizione 8.3.2) tutto R). Allora fbn non converge a fb puntualmente
(perch il limite puntuale zero fuori di [c, c]), quindi
non

vi converge
b

uniformemente, quindi non vi converge in S (perch fn fb = p00 (fbn

fb)). Quindi si ha una contraddizione, e lipotesi di assurdo deve perci essere


falsa. Questo prova (ii).
Inne, la parte (iii) segue immediatamente dalla parte (i) della precedente

Proposizione 11.4.1, applicabile grazie al Corollario 10.4.2.


Esercizio 11.4.3.

(i) supp(f g) supp f + supp g.

(ii) Rammentiamo che abbiamo scritto per la funzione caratteristica dellintervallo [ 21 , 21 ], cio = [ 1 , 1 ] . Allora u = la funzione
2 2
lineare a tratti che vale 0 in R \ [1, 1], 1 in 0 ed lineare in [1, 0] ed
in [0, 1] (gura 11.8).

816

CAPITOLO 11. DISTRIBUZIONI

Figura 11.8: Il quadrato per convoluzione di una funzione caratteristica una funzione
triangolare

La dualit consente di introdurre senza sforzo unaltra propriet cruciale:


il trasporto della nozione di convergenza allo spazio duale. Ce lo consente
la prossima denizione, che era stata anticipata come Denizione 3.10.3 (e
studiata in molta maggiore profondit nella Sezione 3.10).
Definizione 11.4.4. (Topologia debole stella.) Sia {Fn } una successione
di elementi del duale V di uno spazio vettoriale normato, oppure munito di
una famiglia numerabile di seminorme. Diciamo che
lim Fn = F V

se, per ogni v V , si ha


lim hFn , vi = hF, vi.

In tal caso si dice che Fn tende a F nella topologia debole indotta da V .


Nota 11.4.5. Questa nozione di convergenza in generale pi debole della convergenza rispetto alla norma dei funzionali. Ad esempio, se V = L1 (R), sappiamo che V isometricamente isomorfo a L (R) (Esempio 11.3.2). Quindi,
data una successione di funzionali Fn V (rappresentati come prima da
funzioni in L , che - abusando della notazione - indichiamo ancora con Fn )
la convergenza nella norma di V la convergenza uniforme delle funzioni
Fn L (R). Invece Fn F in senso debole * se per ogni h L1 (R) si ha
Z
Z
lim
Fn (t)h(t) dt =
F (t)h(t) dt.
n

11.5. DISTRIBUZIONI TEMPERATE

817

Queste due nozioni di convergenza non sono equivalenti. Si vede facilmente


che la prima implica ovviamente la seconda, perch i limiti uniformi di successioni di funzioni passano sotto il segno di integrale sui compatti (Teorema
1.3.17), ed ancora pi facilmente grazie al Teorema di Convergenza Dominata 1.9.54, perch Fn converge uniformemente a F , ossia kFn F k 0, e
quindi , per ogni > 0, si ha |Fn | < (1 + )|F | per n abbastanza grande; per
il viceversa non vero. Ad esempio, lasciamo al lettore i passaggi di questo
importante esercizio: se

1
se t > n
Fn (t) =
0
se t < n
si ha Fn 0 debole * se n , per kFn k = 1 per ogni n e quindi kFn k
non tende a zero; perci, per la continuit della norma (Nota 4.1.2) Fn non
tende a zero nella norma uniforme.

Poich pi debole della convergenza in norma, la convergenza debole *


dei funzionali ha luogo pi facilmente, e quindi molto pi facile da ottenere,
agevole ed elastica. Ci accingiamo a studiarla per il duale S della classe di
Schwartz S.

Nota 11.4.6. La convergenza in S non data da una norma, ma da una famiglia di seminorme, e quindi la denizione di norma di un funzionale F S
non vale (la Denizione 3.3.13 si applica solo ai funzionali su spazi normati).
Invece la nozione di convergenza debole * si applica, ed quella che useremo
su S . Ne abbiamo bisogno per modellare il processo di approssimazione con
cui si passa da campioni espressi da valori medi a valori istantanei.

11.5

Distribuzioni temperate e loro propriet


di convergenza

Definizione 11.5.1. Lo spazio S dei funzionali continui sulla classe di


Schwartz S si chiama spazio delle distribuzioni temperate.
Poich non avremo bisogno di introdurre una nozione pi generale di
distribuzione, spesso nel seguito ci riferiremo a S come lo spazio delle distribuzioni: questa terminologia non per usuale, perch nella letteratura
matematica le distribuzioni (non temperate) denotano una classe pi ampia.

818

CAPITOLO 11. DISTRIBUZIONI

Per una trattazione pi completa accenniamo alla denizione e propriet


dello spazio delle distribuzioni nella successiva Sezione 11.17; per maggiori
dettagli, si veda [25, Cap. 6 e 7].
Definizione 11.5.2. (Convergenza nel senso delle distribuzioni.) Muniamo S della nozione di convergenza analoga a quella descritta nella Denizione 11.4.4: se Fn , F S diciamo che
lim Fn = F

se per ogni f S si ha

lim hFn , f i = hF, f i

Il prossimo enunciato non ovvio: esso si basa su un risultato profondo in Analisi Funzionale, che citiamo nella dimostrazione, ma non dimostriamo in questo Capitolo: si tratta del teorema di uniforme limitatezza
(BanachSteinhaus), che abbiamo dimostrato come Teorema 3.14.3. In eetti, la prossima Proposizione 11.5.3 un caso particolare del Corollario 3.14.5
del teorema di uniforme limitatezza. In ogni caso, il lettore non interessato a
quella dimostrazione non ha bisogno di consultarne lenunciato nel Capitolo
3, perch lo riassumeremo in questa Sezione.
Proposizione 11.5.3. (Limiti di successioni di distribuzioni temperate.) Sia Fn una successione in S tale che, per ogni f S, esiste il
limite limn hFn , f i. Chiamiamo questo limite F (f ). Allora F S e
limn Fn = F .
S

Idea della dimostrazione. Spieghiamo anzitutto perch il risultato plausibile ma non ovvio. Se gli Fn convergono ad un funzionale lineare continuo
F , allora, per denizione di convergenza in S (Denizione 11.5.2), il limite
limn hFn , f i = F (f ) esiste per ogni f S. Ma qui stiamo cercando di dimostrare il viceversa, e poniamo F (f ) = limn hFn , f i. chiaro che questo F un
funzionale lineare su S. Quindi occorre solo mostrare che questo funzionale
continuo rispetto alla convergenza in S. I suoi approssimanti Fn S sono
continui. Perci, in base al Corollario 9.2.2, per ogni n esistono una costante
Cn ed una collezione nita di jn seminorme pk1 (n) l1 (n) . . . , pkjn (n) ljn (n) tali che
|hFn , f i| < Cn

jn
X
i=1

pki (n) li (n) (f ) .

(11.6)

11.5. DISTRIBUZIONI TEMPERATE

819

Dobbiamo dimostrare che vale una disuguaglianza analoga per F . Purtroppo, per, non possiamo semplicemente passare al limite per n dentro
il secondo membro di (11.6), perch le costanti Cn e le seminorme non sono sempre le stesse: cambiano con n. Quindi, al crescere di n, potremmo
trovarci ad aggiungere sempre pi seminorme, in numero illimitato, ed a considerare costanti C sempre pi grandi, in maniera illimitata. In altre parole,
il problema che ciascuna Fn s continua, ma limitata da costanti e seminorme diverse al variare di n: invece a noi serve una continuit rispetto alle
stesse costanti e seminorme, o come si suol dire la equicontinuit, cio una
limitatezza uniforme rispetto a n.
Questa propriet conseguenza di un risultato basilare dellAnalisi Funzionale, noto come il Teorema di Banach-Steinhaus 3.14.3 (detto anche principio
di uniforme limitatezza), il cui enunciato, applicato allo spazio delle distribuzioni (che uno spazio di Frchet, nel senso della Denizione 3.1.1) diventa
quello del Corollario 3.14.4, che richiamiamo qui di seguito. Esso asserisce
che, se uno spazio vettoriale V uno spazio metrico completo (ovviamente
con una metrica invariante per traslazione), ed una successione di funzionali
lineari continui Fn su V converge puntualmente ad un funzionale lineare F ,
nel senso che, per ogni vettore v V , si ha Fn (v) F (v), come nel nostro
enunciato, allora gli Fn sono equicontinui, o, pi semplicemente, anche F un
funzionale continuo (Corollario 3.14.5). Da questo risultato profondo segue
la Proposizione, perch S uno spazio metrico completo (Teorema 9.4.3).

Esempio 11.5.4. (i) (Funzioni localmente integrabili a crescita polinomiale). Tutte le funzioni h localmente integrabili (cio integrabili
con integrale nito su ogni intervallo in R di lunghezza nita) e a crescita polinomiale (cio che vericano h(x) < B(1 + |x|k ) per ogni x e
per qualche B > 0 e k N) appartengono a S , nel senso che per ogni
tale h il funzionale lineare
Z
Th (f ) =
h(x)f (x) dx

denito per ogni f S e continuo su S. Se h S, la continuit


di Th stata dimostrata nellEsempio 11.2.2. In generale, se h a
crescita polinomiale, allora esiste un intero positivo k tale che B =
|h(x)|
supxR 1+|x|
k < , in base alla Proposizione 9.3.4 ed alla Nota 9.3.3.

820

CAPITOLO 11. DISTRIBUZIONI


Pertanto, in base al Lemma 9.6.2, esiste una costante A > 0 tale che
|h(x)|
AB
|h(x)|
6
A
6
.
1 + |x|k+2
(1 + |x|k ) (1 + x2 )
1 + x2
Siano quindi fn , f S e supponiamo che fn f . Dal fatto che
S

R
1
lintegrale improprio 1+|x|2 dx convergente (vale arctan = )
ora segue
Z
|Th (fn f )| 6
h(x) |fn (x) f (x)| dx
=


|h(x)|
k+2
1
+
|x|
|fn (x) f (x)| dx
1 + |x|k+2

6 ABpk+2,0 (fn f ) 0
n

per la denizione di convergenza in S (Denizione 9.1.2).


stabilisce che Th continuo, e quindi Th S .

(11.7)

Questo

(ii) (Funzioni L1 ). Ritorniamo ad un ambito gi incontrato nella Proposizione 11.1.2: a dierenza che nella parte (i) di questo Esempio, ora
assumiamo che la funzione h sia integrabile non solo localmente, ma
abbia anche integrale nito su tutto R. Allora h d origine ad una
distribuzione Th anche senza che si debba assumere che sia a crescita
polinomiale. (Nota: una funzione in L1 non tende necessariamente a zero allinnito! Essa pu assumere valori arbitrariamente grandi purch
questo accada in intervalli le cui lunghezze diventino appropriatamente
piccole. Il lettore costruisca un esempio per esercizio).
Infatti, per ogni f S, il funzionale lineare
Z
Th (f ) =
h(x)f (x) dx

verica
|Th (f )| 6 kf k

|h(t)| dt = khk1 p00 (f ),

e quindi continuo su S (Denizione 9.1.2).

11.5. DISTRIBUZIONI TEMPERATE

821

(iii) (La delta di Dirac). Per ogni x in R, il funzionale lineare x su S


gi denito nella Sezione 10.1 come
x (f ) = f (x)
(che dora in avanti chiameremo delta di Dirac al punto x) continuo
su S. Infatti, se fn , f S e fn f , allora in particolare (sempre per
la Denizione 9.1.2) si ha

kfn f k = p00 (fn f ) 0 .


n

Quindi fn converge a f uniformemente su R, ed in particolare puntualmente per ogni x (Denizione 1.2.10), e perci x (fn ) = fn (x)

f (x) = x (f ).

Esempio 11.5.5. La funzione x1 , denita per x 6= 0, non integrabile secondo


Lebesgue,
e non integrabile in senso improprio secondo Riemann, perch
R dx
=
. Inoltre, questa funzione ha integrale divergente in ogni inx
0
tervallo (0, a) o (a, 0), con a > 0. Pertanto, se f S, non esiste nito
R
lintegrale h x1 , f i = f (x)
dx. Si noti che la divergenza non conseguenza
x
1
del fatto che la funzione x decresca troppo lentamente allinnito (ossia del
R
R dx
fatto che a dx
=
= ), perch a questo compensa il fatto che la
x
x
a
funzione test f tende a zero allinnito a velocit pi che polinomiale: essa
invece dovuta allordine della singolarit di x1 nellorigine, almeno se f (0) 6= 0
(in tal caso f non pu compensare la singolarit di x1 ).
R
Esiste un modo di dare un senso allintegrale f (x)
dx nel senso delle
x
distribuzioni. Deniamo la distribuzione valore principale di Cauchy, v. p. x1 ,
come
Z Z 
f (x)
1
+
dx .
hv. p. , f i lim+
0
x
x

Mostriamo che v. p. x1 una distribuzione.


Z
Z
1
f (x) f (x)
f (x) f (x)
v. p. (f ) = lim+
dx =
dx
0
x
x
x

(lultimo integrale convergente perch f (x) f (x) = O(x) per il Teorema di Taylor, o equivalentemente il Teorema del valor medio di Lagrange

822

CAPITOLO 11. DISTRIBUZIONI

Rx
(Sezione 1.1)). Osserviamo che f (x) f (x) = x f (t) dt, per il Teorema
Fondamentale del Calcolo (Sezione 1.1). Allora la continuit del funzionale lineare v. p. x1 su S, espressa dalle disuguaglianze del Corollario 9.2.2, si
ottiene dalle stime seguenti:
Z
Z 1 Z 


f (x) f (x)
f (x) f (x)

+
dx =
dx

x
x
0
0
1
Z

Z 1 Z x



x(f
(x)

f
(x)
1


f (t) dt dx +
dx
=

x2
1
0 x x
Z 1
2x maxx6t6x |f (t)|
dx
6
x
0
Z
2 maxyR |y f (y)|
+
dx
x2
1
Z
1
dx 6 2(p01 (f ) + p10 (f )) ,
6 2p01 (f ) + 2p10 (f )
x2
1
 
R
perch 1 x12 dx = x1 1 = 1.
Analogamente si denisce il valore principale di un integrale improprio
dove lintegrando f integrabile sui compatti ma non integrabile allinnito:
v. p.

f = lim

b+

f (t) dt .

R
Se f una funzione dispari, allora v. p. f = 0. Lasciamo
al lettore il compito
R
di trovare ipotesi adeguate su f anch f 7 v. p. f sia una distribuzione.

Concludiamo questa Sezione con un interessante risultato di convergenza


nel senso delle distribuzioni di successioni di funzioni equilimitate. Questo risultato riecheggia i teoremi di convergenza monotna e di convergenza
limitata dellintegrale di Lebesgue.
Proposizione 11.5.6. (i) Siano {fn } e f funzioni a valori reali non negativi, localmente integrabili a crescita polinomiale, tali che fn (x) converge a f (x) in maniera monotna per quasi ogni x. Allora fn converge
a f anche nel senso delle distribuzioni.

11.5. DISTRIBUZIONI TEMPERATE

823

(ii) Sia {fn } una successione di funzioni localmente integrabili tali che |fn |
siano tutte simultaneamente limitate dalla stessa costante (o pi in
generale tutte limitate in modulo da una stessa funzione h a crescita
polinomiale). Allora, se fn converge a f uniformente sui compatti, fn
converge a f anche nel senso delle distribuzioni.
Dimostrazione. In base alla Proposizione 11.5.3, per dimostrare la convergenza di fn a f nel senso delle distribuzioni occorre mostrare che, per ogni
g S,
Z
Z
hfn , gi :=
fn g dx
f g dx := hf, gi .
(11.8)

La prima parte dellenunciato ovvia. Infatti, spezzando g S come combinazione lineare a coecienti complessi di quattro funzioni reali non negative
possiamo assumere, senza perdita di generalit, che g sia una funzione reale non negativa. Allora lipotesi della parte (i) implica che fn g converge a
f g puntualmente quasi ovunque ed in maniera monotna. Allora, se la successione fn , e quindi fn g, non decrescente, il passaggio al limite in (11.8)
segue dal Teorema di Convergenza Monotna 1.9.53; se invece la successione
fn g non crescente, allora, dal momento che g a decrescenza rapida, essa
uniformente maggiorata da una funzione L1 (R), ed il passaggio al limite
segue dal Teorema di Convergenza Dominata 1.9.54.
La seconda parte pi delicata, perch la convergenza uniforme sui compatti
non implica che si possa passare al limite sotto il segno di integrale su tutto
R (le funzioni costanti un (x) = 1/n convergono a zero uniformemente
su R, e
R
quindi in particolare su tutti i compatti, ma non vero che limn R un 0).
Ora, grazie alla linearit dellintegrale, considerando fn f al posto di fn
possiamo assumere f 0. Lipotesi della parte (ii) dellenunciato implica che
|fn g| < |h g|, e |h g| tende a zero a pi rapidamente del reciproco di qualsiasi
polinomio, perch h a crescita polinomiale
R mentre g RS. Quindi, per ogni


> 0, esiste un compatto K tale che R\K fn g dx 6 R\K |h g| dx < /2.
Daltra parte, fn g converge uniformemente a 0 sul compatto K, e quindi
su K si pu passare al limite sotto il segno di integrale R(Teorema 1.3.17).
Pertanto esiste N = N tale che, per ogni n > N, si ha K fn g dx < /2.
Combinando queste due disuguaglianze
si trova che, per ogni > 0, esiste N
R

tale che, per n > N, si ha R fn g dx < . Questo equivale al passaggio al
limite in (11.8).

824

11.6

CAPITOLO 11. DISTRIBUZIONI

Convergenza di serie di distribuzioni temperate; esempi

Una ovvia conseguenza della Proposizione 11.5.3 la seguente:


Corollario 11.6.1. (Convergenza di serie nel sensoPdelle distribuzioni.) Sia {Fn , n N} una successione in S . La serie
F converge
n=0
PNn

in S se e solo se, per ogni f S, esiste


il limite limNP

n=0 hFn , f i.
Pfinito

In tal caso, scriviamo il valore


P limite n=0 hFn , f i come h n=0 Fn , f i: allora la somma della serie,
n=0 Fn , anchessa una distribuzione temperata.
Analogo risultato vale
Pper le successioni bilatere {Fn , n Z}, che danno luogo a serie doppie n= Fn convergenti in S se e solo se esistono finiti i
P
due limiti limM,N N
n=M hFn , f i.
Per comodit di notazione, estendiamo alle distribuzioni la denizione di
operatore di traslazione gi introdotta per le funzioni (ad esempio in
(10.14):

Definizione 11.6.2. (Operatore di traslazione su S .) Per ogni g S,


hx T, gi = hT, x gi
Nota 11.6.3. (Compatibilit della Definizione 11.6.2 con la definizione di traslazione per funzioni) NellEsempio 11.5.4 (i) abbiamo visto
che le funzioni localmente integrabili h a crescita polinomiale danno luogo
a distribuzioni, che indichiamo con Th . Quindi ora per queste funzioni abbiamo due diverse denizioni di traslazione: quella per le funzioni (10.14)
e quella appena formulata per distribuzioni (Denizione 11.6.2). Per evitare ambiguit necessario provare che le due denizioni coincidono, cio che
x Th = Tx h . Ed infatti, per ogni f S si ha:
Z
hx Th , f i = hTh , x f i =
h(t)f (t + x) dt

Z
=
h(s x)f (s) ds = hTx h , f i .

11.6. SERIE DI DISTRIBUZIONI TEMPERATE

825

Esempio 11.6.4. (Il treno di impulsi.) Sia n = n 0 la distribuzione delta


di Dirac (introdotta in Sezione 10.1 e nellEsempio 11.5.4 (iii)) centrata
al
P
punto x = n, cio data da hn , f i = f (n). Allora la serie K = n= n
converge in S . Chiameremo questa serie il treno di impulsi. In vari libri ingegneristici questa distribuzione si indica con III, un simbolo che rammenta
listogramma di una successione equispaziate di delta, e viene chiamato Shah.
La convergenza
P dal Corollario 11.6.1, perch, per ogni f in
P della serie segue
S, la serie n= hn , f i = n= f (n) converge perch f a decrescenza
rapida e quindi f (n) tende a zero allinnito a velocit pi che polinomiale.

Abbiamo elegantemente dedotto il fatto che il treno di impulsi sia continuo su S dalla Proposizione 11.5.3, che fa uso del potente teorema di
Banach-Steinhaus. In realt questa potenza non necessaria:
Esercizio 11.6.5. Dimostrare che il treno di impulsi un funzionale continuo
direttamente in base alla denizione data nel Corollario 9.2.2. P


Svolgimento. Per ogni f S, si tratta di maggiorare la serie
f
(n)
n=
con una combinazione lineare nita di seminorme
di f . Per il Teorema della
R n+1
Media Integrale (Sezione 1.1) lintegrale n |f (x)| dx un numero compreso
fra il minimo ed il massimo di |f | nellintervallo [n, n + 1]. Daltra parte, per
il Teorema dei Valori Intermedi (Sezione 1.1), questo valore viene assunto da
f in qualche punto n [n, n + 1]. Quindi
Z
Z n+1

X
X
|f (x)| dx =
|f (x)| dx =
|f (n )| .
(11.9)

n=

n=

Daltra parte, per il Teorema Fondamentale del Calcolo (Teorema 1.27.1)),


si ha
Z n
f (x) dx
f (n) = f (n )
n

e quindi

|f (n)| 6 |f (n )| +

n
n

|f (x)| dx 6 |f (n )| +

n+1

|f (x)| dx .

Da qui e dallidentit (11.9) segue




Z

X

X
X


f (n) 6
|f (n)| 6
|f (n)| +
|f (x)| dx 6 kf kL1 + kf kL1 .

n=
n=

n=

826

CAPITOLO 11. DISTRIBUZIONI

Pertanto, da questa disuguaglianza e da (11.9), suciente maggiorare la


norma L1 di f e quella di f con seminorme. Questo si fa in maniera analoga
allEsempio 11.5.4 (i). Infatti,
Z
Z

|f (x)|
2
1
+
|x|
dx
|f (x)| dx =
2

1 + |x|
Z
1
6
dx p2,0 (f ) = p2,0 (f ) .
2
1 + |x|
R
Lo stesso argomento prova che |f (x|) dx 6 p2,0 (f ) = p2,1 (f ) .

Per convenienza, in vista del prossimo esempio, introduciamo una notazione ad hoc per il dilatato di una funzione:
Definizione 11.6.6. (Operatore di dilatazione su funzioni.) Se
R, 6= 0 indichiamo con loperatore di dilatazione denito sulle funzioni
su R da ( f ) (x) = f (x) (per comodit supporremo sempre 6= 0: in
particolare, ha senso il numero 1 e invertibile).
Esempio 11.6.7. (Il treno di onde quadre.) Con una notazione analoga a
quella della Sezione 10.1, sia la funzione caratteristica dellintervallo [0, 1],
e per > 1 consideriamo la funzione onda quadra = . Si tratta
di una funzione positiva di area 1, con supporto nellintervallo [0, 1/], che
assume solo i valori P
0 e 1. Chiamiamo treno di onde quadre di durata la
serie X dei traslati
n . Poich gli addendi hanno supporti disgiunti,
la serie converge puntualmente (per ogni x R c al pi un solo addendo
non nullo!), e la somma una funzione periodica localmente integrabile, ed
ovviamente limitata. La serie converge nel senso delle distribuzioni in base
al Corollario 11.6.1. Infatti, per ogni f S, segue dal Teorema della media
integrale (Sezione 1.1) che
hn , f i =

1
n+

1
n

f (x) dx = f (n )

per un opportuno n [n 1 , n + 1 ], e quindi il primo membro tende a zero


aP
velocit pi che polinomiale grazie alla decrescenza rapida di f , e la serie
h
n , f i converge.
Si noti che le funzioni denite dalle somme parziali della serie sono maggiorate

11.6. SERIE DI DISTRIBUZIONI TEMPERATE

827

dalla funzione somma, perch gli addendi sono non negativi: quindi la convergenza della serie nel senso delle distribuzioni segue anche, indirettamente,
dalla parte (ii) della Proposizione 11.5.6.
Nota: la somma della serie determina una distribuzione, come visto nellEsempio 11.5.4 (i). Invitiamo il lettore, per esercizio, a dimostrarne direttamente la continuit su S, con lo stesso argomento usato nellEsercizio 11.6.5.
Qui molto pi facile, perch
|hn , f i| 6 |h1, f i| 6 kf k1 .

Si osservi anche che le somme parziali della serie sono somme nite di funzioni
ciascuna con supporto in un intervallo nito, e quindi sono a supporto compatto: pertanto non possono convergere uniformemente alla funzione somma,
che una funzione periodica. Quindi la convergenza nel senso delle distribuzioni, ma non nel senso uniforme. Un argomento analogo mostra che la
convergenza non vale nella norma Lp per nessun p (infatti, il termine generico
della serie un traslato della stessa funzione onda quadra, e quindi la sua
norma Lp costante e non tende a zero, il che viola la propriet di Cauchy

per le serie convergenti (Sezione 1.1).


Definizione 11.6.8. (Il treno di onde quadre normalizzate.) Nel precedente Esempio 11.6.7, rimpiazziamo londa quadra = [0,1] di ampiezza
1 e durata 1/ con la sua dilatata di norma L1 uguale a 1, (cha ha
ampiezza e durata 1/). In questo modo si ottiene il treno di onde quadre
normalizzate,

X
=
n ,
n=

le cui propriet evidentemente sono identiche a quelle della serie dellEsempio


11.6.7.

Esempio 11.6.9. (Il treno di Gaussiane.) La convergenza della serie nel


precedente Esempio 11.6.7 si basa sul fatto che gli addendi sono a supporto disgiunto, perch traslati di funzioni a supporto compatto di diametro
pi piccolo del passo di traslazione. In realt suciente avere funzioni
a decrescenza rapida. Ad esempio, consideriamo traslati della Gaussiana
2
(x) = ex , studiata in Sezione 8.3, o del suo dilatato (x) = (x).
Allora, per ogni x, la serie di funzioni

X
n (x)
n=

828

CAPITOLO 11. DISTRIBUZIONI

converge, perch gli addendi tendono a zero a velocit pi che polinomiale.


Se scriviamo Fn = n (x), la funzione integrabile Fn una distribuzione
(Esempio 11.5.4 (i)), e per ogni f S la decrescenza rapida di f implica che
la serie numerica

X
hFn , f i
n=

convergente (per questo occorre dimostrare che la media integrale di f S


rispetto alla misura n (x) dx tende a zero con n a velocit elevata (pi che
polinomiale),
nel prossimo Esercizio 11.6.10). Perci la
P cosa che mostriamo
P

serie G =
F
=

n= n
n= n (x) converge in S in base al Corollario
11.6.1. Chiameremo G treno di Gaussiane di ampiezza .
Si noti che, per
Plo stesso motivo, grazie al test di Weierstrass (Teorema
1.3.29), la serie n Fn converge uniformemente su ogni compatto in R, cio su
ogni intervallo limitato e chiuso, come dimostriamo in dettaglio nel successivo
Esercizio 11.6.11. Poich la somma G una funzione periodica di periodo 1,
la convergenza non uniforme su tutto R, ma lo sui compatti. Pertanto la
somma una funzione continua su ogni compatto, quindi continua ovunque,
e limitata su tutto R: quindi essa localmente integrabile, il che dimostra
direttamente il fatto che essa denisca una distribuzione, in base allEsempio
11.5.4 (i). Inoltre, le somme parziali della serie sono maggiorate dalla somma
G , perch gli addendi sono positivi: quindi la convergenza della serie nel
senso delle distribuzioni segue anche, indirettamente, dalla parte (ii) della

Proposizione 11.5.6.
Esercizio 11.6.10.
La media integrale di f S rispetto alla misura n (x) dx,
R
ossia lintegrale f (x) (x n) dx, tende a zero per n a velocit
pi che polinomiale.
Svolgimento. Riscriviamo lintegrale come
Z
f (x + n) (x) dx .

Dobbiamo provare che, per ogni k > 0, si ha


Z
k
lim n
|f (x + n)| (x) dx = 0 .
n+

(11.10)

11.6. SERIE DI DISTRIBUZIONI TEMPERATE

829

, |n|
] e Bn := R \ An , e spezziamo lultimo
integrale
Poniamo An := [ |n|
2
2
R
come somma degli integrali su An e Bn . Osserviamo che Bn (x) dx <
C1 /(1 + |n|k+1) per qualche C1 > 0 perch tende a zero allinnito a
velocit pi che polinomiale. Pertanto
Z
|n|k
k
|f (x + n)| (x) dx < C1
|n|
kf k 0
1 + |n|k+1
Bn
] se n > 0,
se |n| . Daltra parte, se x An si ha x + n n + An = [ n2 , 3n
2
3n n
e x + n [ 2 , 2 ] se n 6 0: in entrambi i casi, |x + n| > |n|/2. Pertanto ora
segue dalla decrescenza rapida di f che, per qualche C2 > 0,
Z
Z
C2
k
k
|f (x + n)| (x) dx < |n|
|n|
(x) dx
k+1
An 1 + |x + n|
An
6 C2

|n|k
k+1 k k1 0
1 + n
2

per |n| . Sommando queste due stime dellintegrale su An e Bn si vede

che lintegrale in (11.10) tende a zero.


Esercizio 11.6.11. (Convergenza uniforme sui compatti della serie dei
traslati della Gaussiana.) La serie di funzioni G converge uniformemente sui compatti, ma non su tutto R.
Svolgimento. Sia I un intervallo limitato di R; senza perdita di generalit
scegliamo arbitrariamente un intero N e ssiamo
I = [N, N]. Dobbiamo
P
2 (xn)2
convergono
mostrare che, su I, le somme parziali m = m
n=m e
uniformemente. Per ottenere questo, basta dimostrare che il termine gene2
2
rale e (xn) limitato uniformemente
rispetto a x I da una costante
P
numerica an > 0 tale che la serie n= an < . Per questo scopo osservia2
2
mo che, se |n| > N, il punto di massimo del termine generale e (xn) ,
che si trova a x = n, viene raggiunto fuori dellintervallo I = [N, N]. In I
questa funzione decrescente (se n < N) o crescente (se n > N): il suo
valore massimo in I viene assunto ad un estremo dellintervallo (a destra per
2
2
n > 0, a sinistra per n < 0), ed in entrambi i casi vale e (N n)
P.Poich
questo numero tende a zero a velocit pi che polinomiale, la serie n= an
convergente.
Inne, il treno di Gaussiane G , essendo una serie convergente di traslati di
passo 1, una funzione periodica di passo 1, ma le sue somme parziali m

830

CAPITOLO 11. DISTRIBUZIONI

sono somme nite di traslati di Gaussiane e quindi tendono a zero allinnito.


Pertanto kg m k non tende a zero per m .

Esercizio 11.6.12. Sia h un cutoff, ossia una funzione non negativa, limitata
su R e che tende a zero allinnito (di solito la siP
assume anche continua,

2 (xn)2
ma qui non importa). Allora la serie hG (x) =
n= h(x) e
converge uniformemente.
Svolgimento. La serie converge uniformemente sui compatti per il precedente
Esercizio 11.6.11. Quindi basta mostrare che la convergenza uniforme nelle
semirette JK := {x : |x| > K}, per ogni K > 0. Questo signica dimostrare
che le code di questa serie, ossia
X
2
2
m (x) =
h(x) e (xn)
|n|>m

tendono a zero uniformemente in JK . Daltra parte, poich h > 0 tende a


zero allinnito, per ogni > 0 esiste K > 0 tale che, per ogni |x| > K, si ha
0 < h(x) < .
Rammentiamo
che abbiamo indicato con m le somme parziali m (x) =
P
2 (xn)2
, e quindi m = h (G m ). Ora, per ogni x le somme
|n|6m e
parziali m sono crescenti al crescere di m, perch gli addendi sono positivi, e
convergono ad una funzione periodica e continua G , che quindi limitata su
R: poniamo M := kG k . Allora 0 < m (x) < G (x) per ogni x. Pertanto,
per ogni |x| > K, abbiamo
0 < m (x) = h(x) (G (x) m (x)) < Mh(x) < M .
Inoltre, le somme parziali m tendono a G in maniera crescente nellintervallo [K, m0 ] per ogni ssato m0 > K, e quindi G m tende a zero in maniera
monotna decrescente, e quindi uniformemente (Teorema 1.3.22) in [K, m0 ].
Questo signica che m converge uniformemente a zero in [K, m0 ]. Si prenda m0 cos grande che la funzione innitesima h verichi la disuguaglianza
h(x) < /m0 per x > m0 . Allora, per m > m0 e x > K, abbiamo
0 < m (x) = h(x) (G (x) m (x)) < Mh(x) < M
Quindi m converge uniformemente a 0 in JK .

.
m0

11.7. LA NON UNA FUNZIONE

831

Definizione 11.6.13. (Il treno di Gaussiane normalizzate.) Nel precedente Esempio 11.6.9, rimpiazziamo la Gaussiana = di ampiezza
1 con la sua dilatata di norma L1 uguale a 1, (cha ha ampiezza ). In
questo modo si ottiene il treno di Gaussiane nonormalizzate,
G =

n ,

n=

le cui propriet evidentemente sono identiche a quelle della serie dellEsempio


11.6.9.

11.7

La delta di Dirac non rappresentabile


come funzione

Precisiamo ora unidea gi accennata allinizio della Sezione 11.3, mostrando che non esiste una funzione h localmente integrabile secondo Riemann
e a crescita polinomiale tale che si abbia x = Th (notazione a pagina 806,
ed anche Esempio
R 11.2.2): esplicitamente, mostriamo che non si pu avere
x (f ) = f (x) = h(x) f (x) dx per ogni f S.
In altre parole, il funzionale x , quale che sia x R, non rappresentabile come una funzione localmente integrabile secondo Riemann. A meno di
traslare h, possiamo, senza perdit di generalit, limitare lattenzione al caso
x = 0. A questo scopo enunciamo una propriet delle funzioni integrabili
secondo Riemann, per la cui dimostrazione rinviamo il lettore a [1]:
Teorema 11.7.1. Se una funzione integrabile secondo Riemann (su R o
su un intervallo), allora linsieme dei suoi punti di discontinuit ha misura
di Lebesgue nulla. Quindi questa propriet vale in particolare per le funzioni
localmente integrabili secondo Riemann.
Proposizione 11.7.2. Se 0 = Th , allora, per ogni punto x0 6= 0 in cui h
continua, si ha h(x0 ) = 0.
Dimostrazione. Supponiamo che x0 6= 0 sia un punto di continuit di h, e
che, per assurdo, si abbia h(x0 ) 6= 0. Poniamo u = Re(h), v = Im(h), e
< |x0 |. Allora lintervallo [x0 , x0 + ] non contiene 0. Sia ora f S una
funzione a valori reali non negativi, con supporto in [x0 , x0 + ] e tale che
f (x0 ) > 0. Poich h continua in x0 , lo sono anche la sua parte reale u e la

832

CAPITOLO 11. DISTRIBUZIONI

sua parte immaginaria v. Supponiamo che si abbia u(x0 ) > 0. Allora per il
Teorema di Permanenza del Segno (Sezione 1.1) esiste un intorno di x0 nel
quale u rimane positiva. Perci, scegliendo se necessario un valore di pi
piccolo, possiamo supporre che si abbia u(t) > > 0 se x0 6 t 6 x0 + .
Perci
Z
Z x0 +
Re(Th (f )) = TRe h (f ) =
u(t)f (t) dt =
u(t)f (t) dt

>

x0
Z x0 +

f (t) dt > 0.

x0

Ma 0 (f ) = f (0) = 0. Quindi, se fosse vero che 0 = Th , non si potrebbe avere


u(x0 ) = Re h(x0 ) > 0 in alcun punto x0 di continuit di h. Un ragionamento
identico prova che non si pu neanche avere u(x0 ) < 0: quindi u(x0 ) = 0. Allo
stesso modo, considerando la parte immaginaria v invece che la parte reale
u di h si vede che deve essere v(x0 ) = 0. Quindi h(x0 ) = u(x0 ) + iv(x0 ) = 0.

Nota 11.7.3. Se 0 = Th , allora, per la Proposizione 11.7.2 e il Teorema di


Lebesgue 11.7.1 si ha h(x) = 0 per quasi ogni x, e quindi
Z
Th (f ) =
h(x)f (x) dx = 0 f S.

Ora, poich esistono f S tali che 0 (f ) 6= 0 (quelle per cui f (0) 6= 0),
abbiamo che 0 6= Th per ogni h localmente integrabile secondo Riemann.

Nota 11.7.4. (Visualizzazione grafica dellapprossimazione della delta.) La delta di Dirac ad un punto non rappresentabile come una funzione,
per viene approssimata da funzioni: se {hn } unidentit approssimata in
(x )
L1 (R) e hn 0 = x0 hn il traslato di passo x0 di hn , allora si visto nel Teorema 11.1.4 che Th(x0 ) x0 in S . Questo d unidea intuitiva dellargomento
n
che abbiamo appena usato per mostrare che la delta non una funzione: se la
si approssima con una famiglia di funzioni al migliorare dellapprossimazione
queste funzioni approssimanti devono tendere a zero ovunque eccetto che in
x0 , e quindi, se in S tendessero a una funzione limite h, questa dovrebbe
essere nulla quasi ovunque. Si veda la Figura 11.1 a pagina 801.

11.7. LA NON UNA FUNZIONE

833

Nota 11.7.5. (Richiami su approssimazione della delta ed identit


approssimate.) Se {hn }nN (o pi in generale {h }R+ , se si preferisce un
1
parametro continuo) sono identit approssimate in
 L
(R), allora
 scrivendo

hn (x) = hn (x) (oppure h (x) = h (x)), anche hn nN e h R+ sono


identit approssimate in base alla Denizione 6.1.15. Allora sia il Teorema
6.1.16 sia il Teorema 6.1.17 implicano che
lim hn f (x) = f (x)

per ogni f S, x R

(e analogamente
lim h f (x) = f (x)

per ogni f S, x R).

Perci, cos abbiamo dimostrato il Teorema 11.1.4:


Z
Tt h (f ) =
h (u t)f (u) du
Z

=
h (t u)f (u) du

= h f (t) f (t) = t (f ).

Corollario 11.7.6. Per ogni t R si ha t 0 = t .


Dimostrazione. Per ogni f S,
ht 0 , f i = h0 , t f i = f (0 + t) = ht , f i .

Nota 11.7.7. (Convergenza di identit approssimate.) In base alla Nota


11.6.3 e al Corollario 11.7.6, il Teorema 11.1.4
lim Tt h (f ) = t (f )

equivale a
lim Th (f ) = 0 (f )

(basta traslare entrambi i membri con t ).

834

CAPITOLO 11. DISTRIBUZIONI

In altre parole,
lim h f (t) = f (t)

se e solo se

lim h f (0) = f (0)

per ogni f S. Ma questo equivale a scrivere


Z
lim
h (x)f (x) dx = f (0),

perch

f (0) =

h (x)f (x) dx

h (x)f (x) dx.

Quindi il Teorema 11.1.4 si pu riscrivere cos: per ogni identit approssimata


{h } in L1 (R), per ogni f S,
Z
lim Th (f ) =
h (x)f (x) dx = f (0).

Questo risultato quindi equivale ai Teoremi di convergenza di identit approssimate, Teoremi 6.1.16 e 6.1.17. Per chi non avesse dedicato suciente
attenzione alle identit approssimate presentate in Sezione 6.1, nellAppendice alla ne di questo Capitolo ridimostriamo con una dimostrazione diretta
il fatto che, per ogni f S,
Z
lim
h (x)f (x) dx = f (0).

Concludiamo questa Sezione con una notazione che non useremo in questo
libro, ma che viene spesso usata per sottolineare il fatto che, per quanto non
rappresentabile come una funzione, la delta approssimabile con funzionali
Th .

Notazione 11.7.8. Invece di hx , f i o x (f ), vari libri, con abuso di notazione, scrivono


Z
f (t)x (t) dt
o anche

f (t) dx (t),

come se la delta fosse una funzione.

11.8. OPERATORI SULLE DISTRIBUZIONI

11.8

835

Operatori lineari sullo spazio delle distribuzioni temperate

In questa Sezione studiamo alcuni operatori continui su S .

11.8.1

Moltiplicazione per una funzione

Definizione 11.8.1. (Moltiplicazione di distribuzioni per funzioni.)


Sia h : R 7 C una funzione C (R) a crescita polimoniale con tutte le sue derivate (Denizione 9.3.1). Deniamo su S loperatore Mh di moltiplicazione
per h come segue: per ogni F S , f S,
hMh F, f i = hF, Mh f i = hF, hf i .
Per f S, loperatore Mh di moltiplicazione per h stato denito nellEsempio 9.5.4. Abbiamo dimostrato in quellEsempio che Mh manda S in
S ed continuo su S (la dimostrazione in Sezione 9.6).
Corollario 11.8.2. Mh : S 7 S continuo.
Dimostrazione. Mh manda S in S perch, per ogni F S , Mh F un
funzionale lineare continuo su S. Infatti, per ogni f S, la Denizione
11.8.1 asserisce che Mh F (f ) = F (Mh f ) e quindi Mh F la composizione di
due applicazioni lineari e continue: Mh : S 7 S (Esempio 9.5.4) e F : S 7 C.
Inoltre Mh continuo su S : infatti, se Fn F in S , allora Mh Fn Mh F
in S , perch Fn (g) F (g) per ogni f S, e quindi Mh (Fn (f )) = Fn (hf )
F (hf ) = Mh (F (f )).

Notazione 11.8.3. Dora in avanti, nei casi in cui non si crei ambiguit,
scriveremo hF anzich Mh F , per F S .
Nota 11.8.4. (Compatibilit della notazione precedente 11.8.3 con la
notazione usuale per la moltiplicazione di funzioni.) Se F = Tg
la distribuzione associata alla moltiplicazione per una funzione g localmente
integrabile a crescita polinomiale (Esempio 11.5.4 (i)), allora Mh Tg = Thg ,
perch, per ogni f S,
Z
Mh Tg f = hTg , hf i =
g(x)h(x)f (x)dx = hThg , f i .

836

CAPITOLO 11. DISTRIBUZIONI

In altre parole, il funzionale su S di moltiplicazione per g, moltiplicato a sua


volta per h, coincide con il funzionale su S di moltiplicazione per hg.

Esercizio 11.8.5. Mh x0 = hx0 = h(x0 )x0 per ogni x0 R.


Svolgimento. Per ogni f S,
hx0 (f ) = x0 (hf ) = h(x0 )f (x0 ) = h(x0 )x0 (f ).

Nota 11.8.6. LEsercizio 11.8.5 mostra che, per ogni x0 , x0 autovettore di


Mh con autovalore h(x0 ).

Corollario 11.8.7. Se h diverge a velocit esponenziale, allora per qualche


distribuzione temperata F si ha che hF non una distribuzione temperata.
Dimostrazione. Abbiamo costruito nello svolgimento dellEsempio 9.5.4 una
funzione di Schwartz f tale che hf
/ S. Quindi hhF, f i = hF, hf i non
denita.

Nota 11.8.8. Per evitare il fatto che lo spazio delle distribuzioni non sia
preservato dalla moltiplicazione per funzioni a tasso di divergenza troppo
elevato, si considera uno spazio di distribuzioni pi grande delle distribuzioni
temperate, dato dal duale dello spazio E di tutte le funzioni C a supporto
compatto, che si chiama lo spazio delle distribuzioni. Evidentemente E un
sottoinsieme proprio di S, e quindi il suo duale contiene propriamente S . In
questo libro per non abbiamo bisogno dello spazio delle distribuzioni: per
completezza, ci limiteremo ad accennarne le propriet nella Sezione 11.17

11.8.2

Derivata

In analogia a come abbiamo denito la moltiplicazione per una funzione


(Denizione 11.8.1), deniamo ora la derivata di una distribuzione temperata.
Con questa denizione, tutte le distribuzioni sono derivabili!
Definizione 11.8.9. (Derivata di una distribuzione.) Per ogni F S
deniamo F S come
hF , f i = hF, f i

f S.

11.8. OPERATORI SULLE DISTRIBUZIONI

837

Corollario 11.8.10. Loperatore D : F 7 F manda S in S ed continuo.


Dimostrazione. Sappiamo che la D un operatore continuo su S (Esempio
9.5.3). Daltra parte gli elementi F S sono funzionali continui su S.
Ma, per ogni f S, hF , f i = hF, Df i, e quindi F = F D. Per la
continuit dellapplicazione composta F continuo su S, e quindi F S ,
Inoltre D : S S continua: infatti, se Fn F in S , allora, per ogni
f S,
hFn , f i = hFn , f i hF, f i = hF , f i

per n ,

quindi Fn F in S (Denizione 11.8.9)

Dalla continuit della derivata segue immediatamente:

P
Corollario 11.8.11. La derivata di una serie di distribuzioni
Fn convergente nel senso di S e si ottiene derivando
la
serie
termine
a
termine
(ossia
P
coincide con la serie delle derivate
Fn ).

Corollario 11.8.12. (Compatibilit della Definizione 11.8.9 con la


nozione usuale di derivata.) Se la distribuzione temperata F rappresentata da una funzione (a crescita polinomiale) derivabile f , cio se F = Tf
nel senso dellEsempio 11.5.4 (i), e f ancora locamente integrabile e a crescita polinomiale, allora la derivata di F nel senso delle distribuzioni coincide
con quella ordinaria nel senso delle funzioni: cio
(Tf ) = Tf .
Dimostrazione. Integrando per parti si ottiene, per ogni g S:


(Tf ) , g = hTf , g i
Z
=
f (x)g (x)dx

= [f (x)g(x)] +
f (x)g(x)dx.

(Lultimo integrale converge perch f localmente integrabile e a crescita


polinomiale). Poich f a crescita polinomiale e g S a decrescenza
rapida,
lim f (x)g(x) = 0
x

838

CAPITOLO 11. DISTRIBUZIONI

e quindi

h(Tf ) , gi =

f (x)g(x) dx = hTf , gi .

Nota 11.8.13. (Derivata di una funzione nel senso delle distribuzioni.) Il Corollario 11.8.12 mostra che, se una funzione f a crescita polinomiale
derivabile, allora la distribuzione a essa associata derivabile e DTf = TDf .
Per tutte le distribuzioni sono derivabili (Corollario 11.8.10), non solo quelle
associate a funzioni derivabili. In particolare, se f a crescita polinomiale non
derivabile, ci nonostante Tf una distribuzione derivabile, per in questo
caso non ha pi senso chiedersi se DTf = TDf : questa identit ora non pi
vera perch il secondo membro non denito. In questo caso si dice che f
derivabile nel senso delle distribuzioni e la sua derivata la distribuzione
DTf .
A titolo di esempio si veda il caso della derivata nel senso delle distribuzioni della funzione caratteristica di (0, ), nel successivo Esempio 11.9.1.

Corollario 11.8.14. Ogni F S C , e per ogni k N si ha, per ogni


f S,


D F, f = (1)k F, D k f .
Dimostrazione. Basta iterare la formula della Denizione 11.8.9

11.9

Esempi di derivate e primitive ed approssimazioni nel senso delle distribuzioni

Esempio 11.9.1. (Derivata della delta.) In base alla Denizione 11.8.9 si


ha, per ogni f S,
h0 , f i = h0 , f i = f (0)
e per ogni k > 0, indicando con lapice (k) la derivata di ordine k,


D 0 , f = (0 )(k) , f = (1)k 0 , f (k) = (1)k f (k) (0).

11.9. DERIVATE, PRIMITIVE ED APPROSSIMAZIONI IN S

839

Definizione 11.9.2. (Distribuzione


di Heaviside.) Chiamiamo funzione

1 se x > 0
di Heaviside la funzione h(x) =
.
0 se x 6 0

Figura 11.9: Funzione di Heaviside


chiaro che la funzione h localmente integrabile e a crescita polinomiale.
Perci essa denisce una distribuzione Th (Esempio 11.5.4 (i)) che si chiama
distribuzione di Heaviside. Per ogni f S si ha
Z
Z
hTh , f i =
h(x)f (x)dx =
f (x)dx.

Scriveremo talora la distribuzione di Heaviside come H invece di Th .


Esempio 11.9.3. (Primitiva della delta.) Denotiamo con H = Th la distribuzione di Heaviside e calcoliamo H (Denizione 11.9.2). Non possiamo
scrivere Th = Th come nella Nota 11.8.13, perch h non derivabile ovunque
(non lo in zero). Qui dobbiamo calcolare Dh nel senso delle distribuzioni,
come nella Nota 11.8.13. Si ha, per ogni f S,
Z

hTh , f i = hTh , f i =
f (x)dx = f (0) = 0 (f ),
0

in base alla formula presentata nella Denizione 11.9.2, al Teorema Fondamentale del Calcolo (Teorema 1.27.1) ed al fatto che limx f (x) = 0 perch
f S.
Quindi DTh = 0 , cio Th una primitiva di 0 .

Esercizio 11.9.4. Per ogni intero k > 0, trovare una F S tale che D k F = 0 .
Trovare una tale F del tipo Tg per qualche g localmente integrabile a crescita
polinomiale.

840

CAPITOLO 11. DISTRIBUZIONI

Figura 11.10: Approssimazione C della funzione di Heaviside

Esempio 11.9.5. (Approssimazione in S della distribuzione di Heaviside.) Approssimiamo la funzione h della Denizione 11.9.2 con le funzioni
hn C (R) (crescenti, con supporto in [1/n, 1/n] ed immagine [0, 1]) disegnate in Figura 11.10. Per costruire hn basta scegliere una qualsiasi identit
approssimata gn consistente di funzioni
C a supporto compatto contenuto
Rx
in [1/n, 1/n], e porre hn (x) = gn (t) dt (si veda la Figura 11.12).
Osserviamo che, per ogni x 6= 0,

lim hn (x) = h(x) =

(invece hn (0) =

1
2

1 se x > 0
0 se x < 0

per ogni n).

Ora, hn e h non appartengono a S, perch non tendono a zero allinnito,


per sono limitate, e quindi (Esempio 11.5.4) danno luogo a distribuzioni
temperate Thn e Th = H.
Proposizione 11.9.6.
lim Thn = H

in

S .

Dimostrazione. Per ogni f S si ha


Z
Thn (f ) =
hn (x)f (x) dx

e
|hn (x)f (x)| 6 |f (x)|

per ogni x,

11.9. DERIVATE, PRIMITIVE ED APPROSSIMAZIONI IN S

841

perch 0 6 hn 6 1.
Quindi, poich f L1 (R) per la Nota 9.3.2, possiamo applicare il Teorema
di Convergenza Dominata di Lebesgue (Teorema 1.9.54) e dedurne che, per
ogni f S,
Z
Z
Thn (f ) =
hn (x)f (x) dx
h(x)f (x) dx = Th (f ) = H(f ) per n .

Questo prova che Thn H per n in S .

Se si preferisce non far ricorso ad uno strumento potente come il Teorema


di Convergenza Dominata, si pu svolgere il seguente
Esercizio 11.9.7. Dare una dimostrazione diretta del fatto che
Z
Z
Z
lim
hn (x)f (x) dx =
f (x) dx =
h(x)f (x) dx, f S.
n

Svolgimento. Le funzioni hn convergono puntualmente alla funzione h, eccetto che in x = 0, dove esse valgono 21 mentre h(0) = 0. Si ha
Z

hn (x)f (x) dx =

1
n

0
1
n

(11.11)

hn (x)f (x) dx
hn (x)f (x) dx +

1
n

hn (x)f (x) dx +

f (x) dx

1
n

1

(nellultimo integrale non c bisogno
di
scrivere
h
perch
h

1
in
,

).
n
n
n

1
Ora, osserviamo che, in n , 0 , hn (x) si maggiora
 con
la funzione lineare
1
1
il cui graco la retta che passa per i punti n , 0 e 0, 2 (si veda la Figura
11.11).
Perci

1
n

hn (x) dx

minore dellarea del triangolo rettangolo avente per base il segmento in


ascisse da n1 a 0, e per altezza il segmento in ordinate da 0 a 12 . Larea di
questo triangolo, ovviamente, tende a zero se n . Perci
Z 0
hn (x) dx = 0.
lim
n

1
n

842

CAPITOLO 11. DISTRIBUZIONI

Figura 11.11: Maggiorazione degli approssimanti della funzione di Heaviside

Ma allora
Z

Z 0
0



hn (x)f (x) dx 6 kf k
hn (x) dx 0 se n .

1

1
n

Avremmo potuto dimostrare che il limite zero pi semplicemente (ma forse


 meno
 elegantemente) maggiorando le hn con la funzione 1 nellintervallo
1
n , 0 . Applichiamo questa idea ora allintegrale
Z

1
n

hn (x)f (x) dx.



Osserviamo che, in 0, n1 , hn (x) 6 1 e quindi
Z

Perci

1
n

hn (x) dx 6

1
0
n

per n .

Z 1

Z 1
n

n


hn (x)f (x) dx 6 kf k
hn (x) dx 0 se n .

0

0

Grazie a queste stime si ottiene da (11.11) che


Z
Z
Z
lim
hn (x)f (x) dx = lim
f (x) dx =
n

1
n

f (x) dx.

In altre parole,
hThn , f i hH, f i

f S.

11.9. DERIVATE, PRIMITIVE ED APPROSSIMAZIONI IN S

843

Figura 11.12: approssimanti della distribuzione di Heaviside e loro derivate (che formano
una identit approssimata a supporto compatto)

Corollario 11.9.8. Th n = Thn 0

in S .

Dimostrazione. Luguaglianza segue dalla Nota 11.8.13 e il limite segue dalla


continuit su S delloperatore di derivata (Corollario 11.8.10).

Nota 11.9.9. Le funzioni hn formano unidentit approssimata in L1 (R), come


sappiamo dalla loro costruzione e come evidenziato dai loro graci disegnati
nelle Figure 11.12.
Pertanto il fatto che
lim Thn = 0
n

segue anche dal Teorema 11.1.4.

844

11.10

CAPITOLO 11. DISTRIBUZIONI

Supporto di distribuzioni temperate e distribuzioni con supporto in un punto

Definizione 11.10.1. (Supporto di una distribuzione.) Se F S


indichiamo con supp F il complementare del pi grande aperto O R tale
the hF, gi = 0 per ogni g S con supporto contenuto in O.
Esercizio 11.10.2. (i) supp F un chiuso in R, cio se {xn } supp F
una successione convergente a x R, allora x supp F ;
(ii) se F = Tf una funzione (localmente integrabile a crescita polinomiale,
come nellEsempio 11.5.4 (i)), allora il supporto di F come distribuzione
coincide con il supporto di f come funzione;
(iii) supp x0 = {x0 }, e, per ogni intero k > 0, supp D k x0 = {x0 }.

Enunciamo la seguente Proposizione senza dimostrazione (per la dimostrazione si veda [25, Teorema 6.25].
Proposizione 11.10.3. Le distribuzioni con supporto in un unico punto x0
sono le serie

X
ck D k x0
(ck C)
k=0

convergenti nel senso delle distribuzioni. Pi precisamente, se F ha supporto


in {x0 } e
N
X
|hF, f i| < C
p0,l (f ),
l=0

allora

F =

ck D k x0

k=0

per opportuni ck C (qui naturalmente p0l la consueta seminorma su S


definita nella Nota 9.3.3).
Esercizio 11.10.4. Se supp F = K e h C a crescita polinomiale con tutte
le derivate, allora supp hF supp(Mh F ) K (Mh loperatore di moltiplicazione per h introdotto nella Denizione 11.8.1).

11.11. TRASFORMATA DI FOURIER SU S

845

Nota 11.10.5. In vista dellEsercizio 11.10.4, verrebbe naturale presumere


che, se h 0 sul supporto di F , allora hF = Mh F = 0 in S . Invece non
cos. Sia h C a crescita polinomiale e consideriamo le distribuzioni h0
e h0 . DallEsercizio 11.8.5 sappiamo che h0 = 0. Invece, data f S, si ha
hh0 , f i =
=
=
=
=

h0 , hf i
h0 , D(hf )i
h0 , h f i h0 , hf i
h (0)f (0) h(0)f (0)
h (0)0

(abbiamo usato le Denizioni 11.8.1 e 11.8.9 ed il fatto che h(0) = 0).


Quindi h0 = h (0)0 6= 0 se h (0) 6= 0.

11.11

Trasformata di Fourier di distribuzioni


temperate

Come gi fatto per gli operatori di traslazione (Denizione 11.6.2), di moltiplicazione per una funzione (Denizione 11.8.1) e di derivazione (Denizione
11.8.9), anche la trasformata di Fourier F viene ora estesa a S per dualit
a partire da S. Data una distribuzione temperata F , adotteremo spesso una
notazione pi compatta, scrivendo Fb invece che F F e F invece che F 1 F ,
e, se g S, g invece che F 1 g.
Definizione 11.11.1. (i) (trasformata di Fourier su S .) Per ogni
g S e F S , deniamo F F = Fb S cos:
D
E
Fb, g = hF, b
gi .
(ii) (antitrasformata di Fourier.) Per ogni g S e F S , deniamo
F 1 F = F cos:
hF , gi = hF, g i .

Corollario 11.11.2. Per ogni F S , Fb e F appartengono a S .

846

CAPITOLO 11. DISTRIBUZIONI

Dimostrazione. ovvio che Fb e F sono funzionali lineari su S; dobbiamo


dimostrare che sono continui su S.
La Denizione 11.11.1 (i) dice che, per ogni g S,
Fb : g 7 F (F (g)).

Poich la trasformata di Fourier F continua su S per il Teorema 9.7.5,


e F un funzionale continuo su S, anche Fb continuo, per la continuit
dellapplicazione composta (Sezione 1.1). Lo stesso ragionamento, grazie alla
Nota 9.7.6, prova che F continuo su S.

La Denizione 11.11.1 (i) estende la trasformata di Fourier, originariamente denita per funzioni in L1 (R), allambito molto pi vasto delle distribuzioni temperate: ora di ogni F S si pu eettuare la trasformata
di Fourier, che ancora in S . Ma supponiamo che F sia una funzione L1 ,
cio F = Tf con f L1 (R), come nellEsempio 11.5.4 (ii). In tal caso, la
trasformata di Fourier di f nel senso delle distribuzioni coincide con quella usuale per funzioni L1 ? Il prossimo enunciato d risposta aermativa a
questa domanda.
Corollario 11.11.3. (Compatibilit della Definizione 11.11.1 (i) con
la nozione di trasformata di Fourier in L1 (R).) Per ogni f L1 (R)
si ha
cf = T b.
T
f

Dimostrazione. In base al Teorema di Plancherel per L1 (R) (Teorema 9.7.8)


ed alla Denizione 11.11.1 (i) si ha, per ogni g S,
D
E
c
Tf , g = hTf , b
gi
Z
=
f (x)b
g (x)dx

Z
D
E
=
fb(x)g(x)dx = Tfb , g .

Proposizione 11.11.4. (La trasformata di Fourier un isomorfismo


surgettivo di S .) La trasformata di Fourier F : F 7 Fb un operatore

lineare di S in s iniettivo, surgettivo e continuo. Inoltre hF,


gi = hF, g i
(ossia F 2 loperatore di riflessione di parit), e quindi F 4 = 1.

11.11. TRASFORMATA DI FOURIER SU S

847

Dimostrazione. ovvio che F lineare. Quindi, per provare che iniettivo,


basta mostrare che, per ogni F S , se Fb = 0 allora F = 0. Questo vero
perch, per ogni g S, se Fb = 0 la Denizione 11.11.1 (i) d
D
E
0 = Fb, g = hF, b
gi

D
E


(qui abbiamo scritto Fb, g invece che TFb , g per semplicit di notazione: lo
faremo spesso in seguito). Daltra parte, per il Teorema 9.7.5, lapplicazione
g 7 gb surgettiva su S. Quindi la precedente identit asserisce che
hF, hi = 0

h S.

Quindi F il funzionale nullo su S, cio F = 0 in S .


Per provare la surgettivit suciente mostrare che ogni F S la trasformata di Fourier della sua antitrasformata (o trasformata inversa, Denizione
11.11.1 (ii)). In eetti, grazie alla formula di inversione di Fourier in S
(Teorema 8.4.2) e alla Denizione 11.11.1 si ha, per ogni g S
D
E

c
F , g = hF , b
g i = hF, b
g i = hF, gi .
(11.12)
Dimostriamo inne che F continua su S . Per questo occorre provare che,
se Fn F in S allora Fbn Fb in S. Richiedere che Fn F in S signica
assumere che, per ogni g S,
lim hFn , gi = hF, gi

(Denizione 11.5.2). Daltra parte, in base alla surgettivit di F su S (di


h per qualche h S, e
nuovo il Teorema 9.7.5) ogni g S del tipo g = b
b
viceversa per ogni h S la funzione g = h in S. Quindi, per ogni h S,
dalla Denizione 11.11.1(i) si ha:
D
E
D
E
cn , h = hFn , gi hF, gi = Fb, h
F
per n .

cn Fb in S .
Perci F
Lultima asserzione segue immediatamente dalla propriet di parit della
trasformata di Fourier (Teorema 8.2.4 (iii)).

848

CAPITOLO 11. DISTRIBUZIONI

Nota 11.11.5. Nella dimostrazione della Proposizione 11.11.4 liniettivit e la


surgettivit di F su S sono state dimostrate utilizzando la surgettivit di F
su S. Lo stesso strumento si potrebbe utilizzare per dare una dimostrazione
alternativa della surgettivit di F su S . Infatti, vogliamo dimostrare che
b Come possiamo costruire G?
per ogni F S esiste G S tale che F = G.
Per ogni f S, deve valere
D
E D
E
b f = hF, f i .
G, fb = G,

Ma in questo modo deniamo G solo sullimmagine della trasformata di Fourier in S. Per, poich la trasformata di Fourier manda S surgettivamente
su S, questa immagine tutto S, e cos G denita su ogni f S, quindi
una distribuzione temperata. Osserviamo che questa idea in realt stata
usata gi in (11.12), dove abbiamo usato la formula di inversione g = gb ,
che vale in S perch la trasformata di Fourier biunivoca.

11.12

Propriet della trasformata di Fourier in


S

Le propriet della trasformata di Fourier su L1 (R), discusse in Sezione 8.2,


si estendono alla trasformata di Fourier su S . Eettuiamo questa estensione
trasportando a S , mediante la dualit, le denizioni valide su S.
Qui consideriamo le propriet di derivazione, di dilatazione, di traslazione,
di coniugazione e di parit. Inne, nelle prossime sezioni esamineremo la
propriet di convoluzione ed il legame che intercorre tra essa e la traslazione.
Esempio 11.12.1. (Propriet di derivazione per la trasformata di Fourier su S .) Indichiamo con 2ixF la distribuzione M2ix F (notazione della
Denizione 11.8.1). Allora:
d = 2ixFb (ed analogamente (DF ) =
(i) Per ogni F S si ha DF

2ixF ) .

c.
(ii) Per ogni F S si ha D Fb = 2iF

Svolgimento. Dalle Denizioni 11.8.9 e 11.11.1 (i) e dal Teorema 8.2.4 (viii),
per ogni f S si ha:
d , f i = hDF , fbi = hF, D(fb)i = hF, (2ixf )i
hDF
= hFb, 2ixf i = hM2ix Fb, f i

11.12. PROPRIET DELLA TRASFORMATA DI FOURIER

849

(anche qui abbiamo denotato con 2ixf la funzione x 2ixf (x) S).
Questo prova (i). La parte (ii) si dimostra in maniera analoga grazie alla
formula di inversione di Fourier (Teorema 8.4.2): infatti, possiamo porre
b (per la surgettivit della trasformata di Fourier su S), e quindi, per
F =G
b = 2ixG, ossia DF = D G
b = 2ixG
c = 2ixF
d , da
la parte (i), (D G)
cui (ii).

Esercizio 11.12.2. (i) b0 = 1 (cio b0 = T1 , la distribuzione che corrisponde


alla funzione identicamente 1). Pi in generale (ma equivalentemente),
per ogni y R si ha by = e2iyx (cio by = Te2iy ).

(ii) b0 = 2ix (cio b0 = T2ix ). Pi in generale (ma equivalentemente),


per ogni y R by = 2ixe2iyx (cio by = T2i e2iy = M2i Te2iy ).

(iii) Sia H il sottospazio vettoriale di S di tutte le combinazioni lineari nite


{

n
X

ck D k 0 ,

k=1

n N}.

Allora la trasformata di Fourier un isomorsmo lineare da H allo


spazio P di tutti i polinomi su R; lisomorsmo dato da
F:

n
X
k=1

ck D 0 7

n
X

(2i)k ck xk .

k=1

b = 2ixG,
c
Nota 11.12.3. Abbiamo visto nell Esempio 11.12.1 (ii) che D G

per ogni G S . Ecco una dimostrazione alternativa (ma in realt equivalente), che fa uso del fatto che, per ogni g S, si ha gb = 2ic
xg (Teorema
8.2.4):
c = hF, 2ic
hD Fb, gi = hFb, Dgi = hF, Dgi
xgi.
Abbiamo usato le Denizioni 11.8.1 e 11.8.9.

Ora introduciamo in S la dilatazione di passo 6= 0.


Ricordiamo la notazione per loperatore di dilatazione di funzioni, introdotta
nella Denizione 11.6.6: f (x) = f (x), ( 6= 0). Con questa notazione il
Teorema di dilatazione per la trasformata di Fourier, Teorema 8.2.4 (iv), si
scrive nel modo seguente:

850

CAPITOLO 11. DISTRIBUZIONI

Corollario 11.12.4.

 
1
d
1 fb .
f =
||

Dimostrazione.

 

1 
1 b
d
b
=
1 f ()
f
f () =

||
||
||
Estendiamo il teorema a S . Cominciamo con il seguente fatto

Lemma 11.12.5. Per ogni f, g S si ha


E
1 D
f, 1 g .
h f, gi =

||
Dimostrazione.

h f, gi =

f (x) g(x) dx
Z
u
1
f (u) g( ) du
=
||

E
1 D
=
f, 1 g .

||

(u = x)

Il valore assoluto nellultimo integrale necessario, quando < 0, per


mantenere il senso di integrazione da a .

In analogia a questo enunciato, deniamo T per T S come


Definizione 11.12.6. (Operatore di dilatazione su S ).
h T, gi =

E
1 D
T, 1 g .

||

Nota 11.12.7. (Compatibilit della definizione di dilatazione per distribuzioni con quella per funzioni.) Segue dalla Denizione 11.12.6 e
dal Lemma 11.12.5 che, per ogni f S, si ha Tf = T f : quindi la denizione per le distribuzioni coincide con quella per le funzioni quando una
distribuzione una funzione.

11.12. PROPRIET DELLA TRASFORMATA DI FOURIER


Esempio 11.12.8. Quale il dilatato della delta? Il seguente: x =
Infatti
E
E
1
1 D
1 D
x , 1 g =
x , g( ) =
g(x/) .
h x , gi =

||
||

||

851
1
||

x .

Analogamente,
per il treno di impulsi K dellEsempio 11.6.4, si ha K =
P
1
n

n= .
||

Per la trasformata di Fourier, la propriet di dilatazione diventa

Teorema 11.12.9. (Propriet di dilatazione per la trasformata di


Fourier su S .) Per ogni 6= 0 e T S ,
1
1 Tb .
d
T =
||

Dimostrazione.
E
D
E
1 D
1
T,

g
b
d
T
,
g
=
h
T
,
g
b
i
=

||
D
E
d
= T,
g
D
E
1 D b E
1 T, g
= Tb, g =

||

(Corollario 11.12.4)
(Denizione 11.12.6).

b
[
1 K = K.
Esercizio 11.12.10. Si verichi che

Analogamente, consideriamo il caso delle traslazioni. Con la notazione della Denizione 11.6.2, il teorema di traslazione per la trasformata di
Fourier, Teorema 8.2.4 (v), si estende a S nel modo seguente:
Teorema 11.12.11. (Propriet di traslazione per la trasformata di
2it0 x
Fourier su S .) Per ogni t0 R, T S , si ha d
T.
t0 T = e

Dimostrazione. In base alla propriet di modulazione per la trasformata di


Fourier, Teorema 8.2.4 (vi), si ha:
D
E


d
g i = hT, t0 b
g i = T, e2it0 g b
t0 T , g = ht0 T, b
D
E D
E
= Tb, e2it0 g = e2it0 Tb, g .
Ora veniamo alla parit.

852

CAPITOLO 11. DISTRIBUZIONI

Definizione 11.12.12. (Parit in S ). Per g S, scriviamo, come sempre,


g (x) = g(x). Per F S , deniamo F per dualit: per ogni g S


F , g = F, g .

Corollario 11.12.13. (Compatibilit della Definizione 11.12.12 con


la nozione di parit di una funzione.) Se F una funzione (localmente
L1 e a crescita polinomiale, ovvero L1 , Esempi 11.5.4 (i) e (ii)), cio F = Tf ,
allora
F = Tf
Dimostrazione. Per ogni g S dalla Denizione 11.12.12 segue


F , g = Tf , g
Z
=
f (x)g(x) dx

Z
=
f (x)g(x) dx


= Tf , g
Il prossimo enunciato estende alle distribuzioni i Teoremi 8.2.4 (i) e (ii).

Proposizione 11.12.14. (Trasformata di Fourier in S e parit.)


c = Fb
(i) Per ogni F S , F

b
(ii) Per ogni F S , Fb = F

(iii) se h C (R) a crescita polinomiale, allora per ogni F S si ha


(hF ) = h F
Dimostrazione. La propriet (i) lestensione per dualit, a partire da S,
della propriet del Teorema 8.2.4 (i), grazie alla quale, per ogni g S, si ha
gb = b
g . Infatti:
D
E
E

D
c , g =
F , b
F
g = F, b
g = F, gb
D
E D
E

b
b
= F, g = F , g

11.12. PROPRIET DELLA TRASFORMATA DI FOURIER

853

(abbiamo usato le Denizioni 11.11.1 e 11.12.12). Questo prova (i). Analogamente, (ii) segue dal Teorema 8.2.4 (ii), grazie al quale, per ogni g S, si
ha g = g . Infatti
D
E D
E D
E

b
F, g = F , b
g = F, g = F, g = F , g .
La propriet (iii) ovvia:


(hF ) , g = hF, g = F, hg = F, (h g)


= F , h g = h F , g .

C unultima fra le propriet della trasformata di Fourier su L1 (R) (elencate nel Teorema 8.2.4) che resta da estendere a S : per f L1 (R), si ha

fb = fb . Rinviamo questa estensione al prossimo esercizio.

Definizione 11.12.15. Per F S , deniamo il suo complesso coniugato


F S come segue: per ogni g S

F , g = hF, gi.

Esercizio 11.12.16. (i) Mostrare che questa denizione compatibile con


la nozione di coniugazione di funzioni: cio, se F = Tf come nellEsempio 11.2.2, allora Tf = Tf .
(ii) Provare che

    
b
Fb
F = Fb =

F S .

Definizione 11.12.17. F S si dice reale (o a valori reali, se F una


funzione) se F = F .
Esercizio 11.12.18. Mostrare che, se F una funzione localmente integrabile
a crescita polinomiale, Tf reale se e solo se f a valori reali.

Proposizione 11.12.19. Per F S le seguenti propriet sono equivalenti:


(i) F = F (cio F reale)

854

CAPITOLO 11. DISTRIBUZIONI

(ii) Per ogni g S a valori reali, hF, gi R.

Dimostrazione. (i) (ii): se F = F e g a valori reali, segue dalla


Denizione 11.12.15 che


hF, gi = F , g
= hF, gi
= hF, gi

e quindi hF, gi R.
(ii) (i): sia h S e scriviamo g1 = Re h, g2 = Im h. Allora per (ii),
hF, g1 i e hF, g2 i sono reali. Quindi per la Denizione 11.12.15


F , h = F , g1 + ig2

= F , g1 + i F , g2
=
=
=
=

hF, g1i + ihF, g2 i


hF, g1i + i hF, g2 i
hF, g1 + ig2 i
hF, hi .

Perci F = F .
Inne, estendiamo il Corollario 8.2.6 alle distribuzioni.

Definizione 11.12.20. F S si dice pari se F = F , dispari se F = F


(notazione come in Denizione 11.12.12).
Definizione 11.12.21. Deniamo la parte reale e la parte immaginaria di
una distribuzione. Per ogni F S basta denire Re F e Im F per ogni g S
a valori reali, grazie alla linearit. La denizione che ne diamo questa:
hRe F, gi = Re hF, gi
hIm F, gi = Im hF, gi .
Esercizio 11.12.22. Si verichi la compabilit fra la denizione di parte reale
ed immaginaria per funzioni localmente integrabili a crescita polinomiale f
e per distribuzioni Tf , ossia Re Tf = TRe f e Im Tf = TIm f .

11.12. PROPRIET DELLA TRASFORMATA DI FOURIER

855

Corollario 11.12.23. (La trasformata di Fourier preserva la parit.)

(i) Se F S pari, allora Fb e F sono pari; se F dispari, allora Fb e


F sono dispari.
(ii) Se F S reale, allora Re Fb pari e Im Fb dispari.
Dimostrazione. F pari se e solo se Fb pari a causa della Proposizione
11.12.14 (i). Analogamente, F dispari se solo se Fb dispari, per la stessa
ragione. Questo prova (i).

Per dimostrare (ii), supponiamo F reale, cio F = F . Vogliamo mostrare


che, per ogni g S, si ha
D

E D
E

b
b
(Re F ) , g = Re F , g .

Per la linearit basta assumere che g sia a valori reali. In tal caso si ha
D
E
Re(Fb) , g

E
D
= Re Fb, g
D
E
= Re Fb, g
E
D
= Re Fb, g
D
E

b
= Re F , g
 
b , g
= Re F
D
E
= Re Fb, g
D
E
b
= Re F , g .

Definizione 11.12.12
Definizione 11.12.21

Esercizio11.12.16 (ii)e (g ) = (g)


Definizione 11.12.12 e F = F , g = g
Definizione 11.12.15

856

CAPITOLO 11. DISTRIBUZIONI

La stessa argomentazione prova che (Im Fb) = Im Fb:


D
E
D
E
(Im Fb) , g = (Im Fb), g
Definizione 11.12.12
E
D
Definizione 11.12.21
= Im Fb, g
D
E
= Im Fb, g
D
E
= Im Fb, g



= Im F , g
Esercizio11.12.16 (ii)e (g ) = (g)
D
E
= Im Fb, g
Definizione 11.12.12 e F = F , g = g
D
E
= Im Fb, g .
Definizione 11.12.15

11.13

Convoluzione di funzioni con distribuzioni temperate

Abbiamo visto che la trasformata di Fourier manda la convoluzione di due


funzioni f, g L1 (R) nel prodotto puntuale fbb
g (Teorema 8.5.1). Assumiamo che f e g siano in S, dove la trasformata di Fourier un isomorsmo
surgettivo (Teorema 9.7.5) e quindi la antitrasformata di Fourier anchessa
un isomorsmo surgettivo. Pertanto abbiamo:
f g = (fbb
g)

f, g S.

(11.13)

Daltra parte F e F 1 sono isomorsmi surgettivi anche su S (Proposizione


11.11.4). Quindi potremmo usare (11.13) per denire la convoluzione di due
distribuzioni temperate F e G se fossimo in grado di denire la moltiplicaziob Questo sappiamo farlo quando Fb una funzione, o pi precisamente
ne FbG.
b
se F = Th , con h C (R) a crescita polinomiale (Denizione 11.8.1). Ad
esempio, supponiamo f S. Allora Tbf = Tfb (Corollario 11.11.3), e possiamo
b scrivendolo come M b(G)
b (notazione della
dare un senso al prodotto Tbf G
f
Denizione 11.8.1). Perci la seguente denizione ha senso:

11.13. CONVOLUZIONE CON FUNZIONI

857

Definizione 11.13.1. La convoluzione di f S con G S data da:


b
f G = Tf G := (Mfb G)

Notazione 11.13.2. Come gi accennato, quando non ci sono rischi di ambiguit, scriviamo f invece di Tf . Scriveremo sempre f G invece di Tf G,
b invece di M b G.
b
e fbG
f

Corollario 11.13.3. Se f S e G S si ha:


b
(i) f[
G = fbG

(ii) (f G) = f G
b
(iii) fc
G = fb G.

Dimostrazione. Poich la trasformata di Fourier e la antitrasformata di Fourier sono surgettive su S (Proposizione 11.11.4), (i) equivale alla Denizione
11.13.1.
Sempre per la surgettivit, nella Denizione 11.13.1 possiamo scrivere

f al posto di f e G al posto di G: allora la suddetta denizione diventa


f G = (f G), che (ii).

In particolare, (f G ) = f G . Pertanto, rammentando che f =


f (Teorema 8.2.4 (ii)), che la stessa propriet vale per S (Proposizione 11.12.14 (ii)) ed inne che f G = (f G) (Proposizione 11.12.14 (iii)),
otteniamo
   

 


bb
b = fbb G
fb G
= f G = f G = (f G) = fc
G,
che (iii).

Esempio 11.13.4. Se f S e T S , allora per ogni g S si ha (f T )(g) =


T (f g), dove, come al solito, scriviamo f (x) = f (x).
Infatti, si ha
hf T, gi = h(fbTb) , gi = hfbTb, g i
d
= hTb, fbg i = hT, fbg i

= hT, f gi = hT, f gi

858

CAPITOLO 11. DISTRIBUZIONI

grazie al Teorema 8.2.4 (iv).


Lasciamo al lettore, come esercizio, la verica del fatto che questa propriet compatibile con la analoga propriet che si ha quando la distribuzione
T del tipo Th , cio data da una funzione h integrabile. Pi precisamente,
si verichi direttamente che si ha
hf h, gi = hh, f gi .
Questo calcolo si basa su uno scambio dellordine di integrazione negli integrali che deniscono la trasformata di Fourier e la convoluzioni. Poich le
funzioni sono di Schwartz, e quindi in L1 , questo scambio autorizzato dal
Teorema di Fubini 1.20.4.

11.14

Convoluzione con la delta e traslazione

Per prima cosa calcoliamo la trasformata di Fourier della delta.


Esempio 11.14.1. (i) b0 = T1 (dove 1 indica la funzione costante di valore
1).
(ii) bx = Te2ix (dove e2ix indica la funzione 7 e2ix ).
Infatti, (i) vale perch, per ogni f S,
Z
D
E D
E
b
b
b
0 , f = 0 , f = f (0) =
f (x)e2ix0 dx
=

f (x) dx = hT1 , f i

per la formula di inversione di Fourier, Teorema 8.4.2.


Esattamente nello stesso modo si prova (ii).

Notazione 11.14.2. Come gi accennato nella Notazione a pagina 857,


scriviamo b0 = 1 e bx () = e2ix .
Proposizione 11.14.3. (La convoluzione con una delta una traslazione.) Per ogni f S e per ogni x R si ha
Tf x = Tx f
ovvero, con la terminologia della Notazione a pagina 857, f x = x f (cio
f x (x0 ) = f (x0 x) per ogni x0 ).

11.14. CONVOLUZIONE CON LA DELTA E TRASLAZIONE

859

Dimostrazione. Dalla Denizione 11.13.1 e dallEsempio 11.14.1 (ii) si ha


f x = (fbbx ) = (fbe2ix )

dove e2ix denota la funzione 7 e2ix . Ma, per il Teorema 8.2.4 (iv) si
ha fb()e2ix = d
x f (). Perci


d
f x = x f = x f.
Nota 11.14.4. Rammentiamo la notazione a pagina 834,
Z
hx , f i =
f (t)x (t) dt,

che confonde il modo di scrivere la delta con quello che si usa per le funzioni.
Nel caso dellenunciato della Proposizione 11.14.3, questa notazione particolarmente suggestiva ed intuitiva, perch ispira in maniera naturale la
formula
x f = f x .

Infatti:

x f (y) = f (y x)
Z
=
f (t)0 (t (y x)) dt

Z
=
f (t)0 (y x t)) dt

(per la Denizione 11.12.12).


Ma 0 = 0 , perch, per ogni g S,
E

0 , g = 0 , g = g (0) = g(0)

= g(0) = h0 , gi .

Quindi:
x f (y) =
=

f (t)0 (y x t) dt
f (t)x (y t) dt,

860

CAPITOLO 11. DISTRIBUZIONI

e lultimo integrale, se la delta fosse una funzione, sarebbe proprio f x (y).

Nota 11.14.5. Ponendo x = 0 nella Proposizione 11.14.3 otteniamo f 0 = f


per ogni f S. In altre parole, la convoluzione con 0 loperatore identit.
Questo da un lato spiega perch abbiamo chiamato identit approssimate gli
approssimanti di 0 nella convergenza in S (Nota 11.7.4) e dallaltro, grazie
alla parte (i) del Corollario 11.13.3, rende naturale il fatto che risulti b0 = 1:
infatti, per ogni f S,
fb = f\
0 = fbb0 .
Si noti per che questa osservazione non serve a dimostrare che b0 = 1, perch
questa uguaglianza gi stata usata nel dimostrare che f 0 = f (si usa

nella dimostrazione della Proposizione 11.14.3).

11.15

Appendice: Il teorema di convergenza


puntuale di identit approssimate: una
dimostrazione diretta

La seguente denizione equivalente a quella di identit approssimata in


L1 (R) (Denizione 6.1.15).
Definizione 11.15.1. Una famiglia {h , > 0} di funzioni in L1 (R) si dice
unidentit approssimata in L1 (R) se:
i) h (x) > 0, x R;
R
ii) h (x) dx = 1, ;

iii) per ogni > 0 per ogni > 0 0 = 0 (, ) tale che


Z
h (x) dx > 1 > 0 .

Abbiamo visto nel Teorema 10.4.4 (che fa uso dei risultati sulle identit
approssimate dimostrati in Sezione 6.1) che, se identichiamo la funzione h
con la distribuzione Th , si ha
lim t h = t

11.15. APPENDICE: IDENTIT APPROSSIMATE

861

nel senso di S per ogni t R. Grazie alla Nota 11.7.5 questo equivale a
lim t h = t

per ogni identit approssimata {h }. In base al Corollario 11.7.6 quanto


appena asserito equivale al seguente enunciato:
Teorema 11.15.2. lim h = 0 in S per ogni identit approssimata
{h , > 0}.
Ridimostriamo ora questo teorema di convergenza puntuale (che un caso
particolare dei Teoremi 6.1.16 e 6.1.17) in maniera diretta, cio senza fare
uso dei risultati della Sezione 6.1.
Dimostrazione. Dobbiamo dimostrare che, per ogni f S,
Z
lim+
h (x)f (x) dx = f (0),
0

cio che per ogni > 0 esiste K = K() tale che, per ogni > K,
Z




h (x)f (x) dx f (0) < .

chiaro che suciente provare questa propriet per sucientemente


piccolo (perch allora vale anche per gli pi grandi).
Osserviamo che, per ogni > 0, si ha
Z
lim
h (s)f (s) ds = 0

R\[,]

per il Teorema di Convergenza Monotona di Lebesgue (Teorema 1.9.53), e


quindi, per ogni > 0,
Z
Z
h (s)f (s) ds
(11.14)
h (s)f (s) ds = lim+
lim+
0

Dora in poi, per ogni > 0 sceglieremo = > 0 cos piccolo che si abbia
(grazie alle propriet (i), (ii) e (iii) della Denizione 11.15.1,
Z

1
h (s)f (s) ds >
2

h (s) ds =

1
.
2

(11.15)

862

CAPITOLO 11. DISTRIBUZIONI

Supponiamo per il momento che f sia valori reali. Allora, poich f


continua in 0, possiamo scegliere = > 0 ancora pi piccolo in modo che
in [, ] f sia di segno costante (diciamo positiva, per ora), e per ogni > 0,
per ogni s [, ] si abbia
(11.16)

(1 )f (0) 6 f (s) 6 (1 + )f (0).


Perci da (11.14) e da (11.15) per questi valori di otteniamo
Z

h (s)f (s) ds > (1 )f (0)

h (s) ds > (1 )2 f (0).

Da qui e da (11.14) segue che, per ogni > 0,


lim+

h (s)f (s) ds > (1 )2 f (0),

e quindi, poich il primo membro non dipende da ,


lim+

(11.17)

h (s)f (s) ds > f (0).

Daltra parte, ancora da (11.16) e dalla Denizione 11.15.1 (i),


Z

h (s)f (s) ds 6 (1 + )f (0)

< (1 + )f (0)

h (s) ds

= (1 + )f (0).

h (s) ds

Poich il primo membro non dipende da si ottiene


Z

h (s)f (s) ds 6 f (0)

e quindi, da (11.14),
lim

0+

h (s)f (s) ds 6 f (0).

(11.18)

11.16. ESERCIZI

863

Ora segue da (11.17) e da (11.18) che


lim+

h (s)f (s) ds = f (0)

per ogni f a valori reali, non negativa e continua in 0.


Se f a valori reali non positivi lo stesso risultato si ottiene applicando
il ragionamento precedente a f . Quindi il teorema vale per ogni f a valori
reali e continua in 0. Inne, se f una funzione continua in 0, ma a valori
complessi, il teorema vale separatamente per la parte reale e immaginaria di
f , quindi vale per f .

Nota 11.15.3. Largomento della dimostrazione rende rigorosa lidea intuitiva


presentata in Sezione 11.1: lintegrale
Z
h (x)f (x) dx

una media integrale dei valori di f , poich h > 0 e


Z
h (x) dx = 1.

Poich le funzioni h , in base alla propriet (iii) della Denizione 11.15.1),


hanno integrale concentrato in intervalli arbitrariamente piccoli intorno a
zero se sucientemente grande, queste medie integrali sono prese solo sui
valori di f su intervalli intorno a 0 che diventano piccoli quando cresce.
Perci queste medie integrali devono convergere a f (0).

11.16

Esercizi sulle distribuzioni temperate

Esercizio 11.16.1. Sia


h(x) =

x
0

se
se

x>0
x<0

Calcolare la derivata di h nel senso delle distribuzioni. Includere i dettagli


del calcolo.

864

CAPITOLO 11. DISTRIBUZIONI

Esercizio 11.16.2. Sia f C 1 (R) a crescita polinomiale e sia



1
se
x>1
h(x) =
0
se
x<1
Quanto vale (f h) nel senso delle distribuzioni?
1.  f 1 + hf
2.  f Th
3.  f 1
4.  1
5.  nessuna delle precedenti
Motivare la risposta.

Esercizio 11.16.3. Sia f C 1 (R) a crescita polinomiale e sia



1
se
x>0
h(x) =
0
se
x<0
Quale delle seguenti la derivata nel senso delle distribuzioni di f h?
1.  f 0 + f h
2.  f h
3.  0
4.  f 0
5. 

nessuna delle precedenti

Motivare la risposta.

Esercizio 11.16.4. Calcolare la derivata nel senso delle distribuzioni di



0
se
|x| > 2
f (x) =
1
se
|x| 6 2
utilizzando la denizione.

11.16. ESERCIZI

865

Esercizio 11.16.5. Sia R+ e sia


( 1
(x) =

se

se

x [, ]

x
/ [, ]

Quali delle seguenti propriet sono vere (eventualmente anche pi di una,


oppure nessuna)?
c (0) = 1
1. 

2.  dispari
3.  converge a 0 nel senso delle distribuzioni per 0

4.  converge a 0 nel senso delle distribuzioni per +


5.  nessuna delle precedenti
Motivare la risposta.

Esercizio 11.16.6. Calcolare la derivata nel senso delle distribuzioni di



0
se
|x| > 12
f (x) =
1
se
|x| 6 12
utilizzando la denizione.

Esercizio 11.16.7. Scrivere la denizione di derivata nel senso delle distribuzioni.


Se f C 1 (R) a crescita polinomiale e

1
se
x>1
h(x) =
0
se
x<1
quanto vale (f h) nel senso delle distribuzioni?
1.  f h
2.  f h
3.  f 1 + f h
4.  1

866

CAPITOLO 11. DISTRIBUZIONI

5.  nessuna delle precedenti


Motivare la risposta.

Esercizio 11.16.8. Calcolare la derivata nel senso delle distribuzioni di



x
se
x>0
f (x) =
0
se
x<0

Esercizio 11.16.9. Calcolare la derivata nel senso delle distribuzioni di



2
se
|x| 6 1
f (x) =
0
se
|x| > 1

Esercizio 11.16.10. Sia f C 1 (R) a crescita polinomiale e sia



1
se
x61
h(x) =
0
se
x>1
Quanto vale (f h) nel senso delle distribuzioni?
1.  f h
2.  f h
3.  f 1
4. 

f 1 + f h

5.  nessuna delle precedenti


Motivare la risposta.
Esercizio 11.16.11. Sia f C 1 (R) a crescita polinomiale e sia

1
se
x<1
h(x) =
0
se
x>1
Quanto vale (f h) nel senso delle distribuzioni?

11.16. ESERCIZI
1. 

867

f 1 + hf

2.  f Th
3.  f 1
4.  1
5.  nessuna delle precedenti
Motivare la risposta.

Esercizio 11.16.12. Calcolare la derivata nel senso delle distribuzioni di



2
se
|x| 6 1
f (x) =
0
se
|x| > 1

Esercizio 11.16.13. Calcolare la derivata nel senso delle distribuzioni di



2
se
|x| 6 1
f (x) =
0
se
|x| > 1

Esercizio 11.16.14. Sia (x) = sin x+x3 . Quanto vale la distribuzione (0 ) ?


1.  0
2.  (x)
3.  (cos x + 3x2 )0
4.  (cos x + 3x2 )1
5.  nessuna delle precedenti
Motivare la risposta.

868

CAPITOLO 11. DISTRIBUZIONI

Esercizio 11.16.15. Calcolare la derivata nel senso delle distribuzioni di


(
0
se
|t| > 12
f (t) =
1
se
|t| < 21

Esercizio 11.16.16. Sia R+ e sia


1
(x) = [/2,/2] (x)

Quali delle seguenti asserzioni sono vere?


1. 

converge a 0 nel senso delle distribuzioni per 0

2. 

converge a 0 nel senso delle distribuzioni per +

3. 

pari

4. 

dispari

5.  nessuna delle precedenti


Motivare la risposta.

Esercizio 11.16.17. Sia R+ e sia




se
(x) =
0
se

x [ 1 , 1 ]
x
/ [ 1 , 1 ]

1. 

pari

2. 

converge a 0 nel senso delle distribuzioni per 0

3. 

dispari

4. 

converge a 0 nel senso delle distribuzioni per +

5.  nessuna delle precedenti


Motivare la risposta.

11.16. ESERCIZI

869

Esercizio 11.16.18. Calcolare la derivata nel senso delle distribuzioni di



1
se
|t| > 14
f (t) =
0
se
|t| < 41

Esercizio 11.16.19. Sia R+ e sia

1
[,](x)
2
Quali delle seguenti asserzioni sono vere?
(x) =

1. 

converge a 0 nel senso delle distribuzioni per +

2. 

pari

3. 

converge a 0 nel senso delle distribuzioni per 0

4. 

dispari

5.  nessuna delle precedenti


Motivare la risposta.

Esercizio 11.16.20. Calcolare la derivata nel senso delle distribuzioni di



0
se
|t| > 1
f (t) =
2
se
|t| < 1
Esercizio 11.16.21. Calcolare la derivata nel senso delle distribuzioni di

2
se
|t| > 2
f (t) =
0
se
|t| < 2
Esercizio 11.16.22. Sia R+ e sia
(

se
(x) =
0
se
Quali delle seguenti asserzioni sono vere?

1
1
x [ 2
, 2
]

1
1
, 2
]
x
/ [ 2

870

CAPITOLO 11. DISTRIBUZIONI

1. 

converge a 0 nel senso delle distribuzioni per 0

2. 

pari

3. 

dispari

4. 

converge a 0 nel senso delle distribuzioni per +

5.  nessuna delle precedenti


Motivare la risposta.

Esercizio 11.16.23. Sia (x) = sin2 x. Quanto vale la distribuzione ( ) ?


1. 

sin2 x

2.  (x)
3.  0
4.  (x )
5.  nessuna delle precedenti
Motivare la risposta.

Esercizio 11.16.24. Sia f una funzione innitesima di ordine due per x 0


(ossia in O(x2 )). Quanto vale la distribuzione (f 0 ) ?
1.  0
2.  f (x) 0
3.  f (0)0
4.  f (0)0
5.

nessuna delle precedenti

Motivare la risposta.
Esercizio 11.16.25. Sia (x) = x3 + x. Quanto vale la distribuzione 0 ?
1.  (x)

11.16. ESERCIZI

871

2.  (3x2 + 1)0
3.  0
4. 

5.  nessuna delle precedenti


Motivare la risposta.


Esercizio 11.16.26. Sia (x) = cos x. Quanto vale la distribuzione /2 ?
1.  0
2. 

sin x/2

3.  (x 2 )/2
4.  (x)
5.  nessuna delle precedenti
Motivare la risposta.
Esercizio 11.16.27. Sia (x) = x

2 ?

+ cos x. Quanto vale la distribuzione

1.  (1 sin x) 2

2.  (x)
3.  0
4.  (x 2 )
5. 

nessuna delle precedenti

Motivare la risposta.

872

CAPITOLO 11. DISTRIBUZIONI

Esercizio 11.16.28. Consideriamo il funzionale sulla classe di Schwartz denito da


Z
f (t)
dt .
f
4
1 + t
Questo funzionale continuo su S? Rispondere utilizzando solo la denizione
di continuit in termini di seminorme.
Svolgimento. Il funzionale continuo, come sappiamo gi dallEsempio
11.5.4 (i). In termini di seminorme, ecco la dimostrazione:
Z
Z
f (t)
1
dt
6
kf
k
dt < Cp00 (f ) .

4
4
1 + t
1 + t

Esercizio 11.16.29. Siano f e g due dilatati della Gaussiana, diciamo f (x) =


2
2
ex e g(x) = ex con , > 0. Calcolare il valore di hf K, gi, dove K
il treno di impulsi dellEsempio 11.6.4.
Svolgimento. Grazie allEsempio 11.13.4 si ha
hf K, gi = hK, f gi .

(11.19)

Ora calcoliamo f g. chiaro che la convoluzione di due Gaussiane ha per


trasformata di Fourier il prodotto delle trasformate, ossia il prodotto puntuale di due altre Gaussiane, perch la trasformata di Fourier di (un dilatato di)
una Gaussiana (un dilatato di) una Gaussiana (Proposizione 8.3.2). Ma il
prodotto puntuale di queste due Gaussiane ancora una Gaussiana, perch
il prodotto di due esponenziali lesponenziale della somma degli esponenti.
Antitrasformando secondo Fourier, si trova che la convoluzione di due Gaussiane ancora una Gaussiana. Potremmo facilmente svolgere il calcolo in
questo modo, ma per amore di variet oddriamo questo calcolo alternativo:
Z
Z
2
2

f g(x) =
f (t x) g(t) dt =
e(tx) et dt (11.20)
Z
Z

2
2
=
e(tx) t dt =
eq(t,x) dt ,

dove q(x, t) = (+)t2 2tx+x2 unespressione quadratica nella variabile


t, e quindi del tipo q(x, t) = A(t )2 + B dove A e B sono due costanti che
dipendono da x. Sviluppando di trovano A e B:
q(x, t) = ( + )t2 2tx + x2 = A(t )2 + B = At2 2At + A 2 + B ,

11.16. ESERCIZI

873
2

x
e B = x
.
da cui A = + , 2x = 2A e x2 = A 2 + B, ossia = +
+
Ora,
Z
Z
Z
2
q(t,x)
B
A(t)2
B
e
dt = e
e
dt = e
eAt dt

r Z
r

2
= eB
eu du = eB
A
A
p
grazie al Lemma 8.3.1. Pertanto da (11.20) si ottiene f g(x) = A eB =
q
2
x

+ , e quindi segue da (11.19) che


e
+

hf K, gi =

X
n2

e + .
+ n=

P
Esercizio 11.16.30. Sia f S e sia K =
n= n il treno di impulsi.
Calcolare la distribuzione f K: come opera su una generica funzione g S?
rappresentabile come una funzione localmente integrabile o no? Se s, quale
funzione? Se no perch?
Svolgimento. Osserviamo per prima cosaPche, in base allEsempio 11.13.4,
si ha hf K, gi = hK, f gi. Poich K =
n= n , e la serie converge nel
senso delle distribuzioni, ora abbiamo
hf K, gi = h

n=

n , f gi .

Daltra parte,

hn , f gi = f g(n) =
Quindi
hf K, gi =
P

n=

f (t n) g(t) dt .

f (t n)

g(t) dt .

La serie di funzioni n= f (t n) converge puntualmente ad una funzione


h(t) per ogni t: infatti f S e quindi la successione {f (t n)}nZ tende

874

CAPITOLO 11. DISTRIBUZIONI

a zero a velocit pi che polinomiale. Per la stessa ragione, in base al test


di Weierstrass (Sezione 1.1), la serie converge uniformemente sui compatti.
Daltra parte tutti i suoi termini sono traslati della stessa funzione di Schwartz f , quindi sono tutti equilimitati da kf k . Pertanto, in base alla seconda
parte della Proposizione 11.5.6, la serie converge nel senso delle distribuzioni
alla distribuzione data dalla funzione somma della serie.
Osserviamo chePla somma h della serie nientaltro che la periodicizzzione di
f , ovvero h =
n= n f (la serie dei traslati di f di passo intero): questa
funzione periodica ovviamnete localmente integrabile ed a crescita polinomiale (in eetti, limitata). Quindi la distribuzione f K coincide con la
distribuzione Th dellEsempio 11.5.4 (i), ed in particolare rappresentata da
una funzione.

Esercizio 11.16.31. Sia


hT, f i = f (0) +

f (t) dt .

Esiste una distribuzione temperata g tale che la sua derivata verichi G = T ?


Se s, trovarla, e se G data da una funzione tracciarne il graco. Se no,
spiegare perch. Motivare tutti i passaggi.
Svolgimento. T la somma di due distribuzioni ben note: T = 0 + 1 H,
dove H la distribuzione di Heaviside (Denizione 11.9.2 e 1 H il suo traslato
destro di passo 1. Perci la distribuzione G che verica G = T deve essere la
somma della primitiva della delta e della primitiva del traslato della funzione
di Heaviside. Una primitiva della delta la distribuzione di Heaviside stessa
(Esempio 11.9.3): le altre ovviamente dieriscono da questa per laggiunta
di una costante. Daltra parte, la distribuzione di Heaviside una funzione
localmente integrabile, e quindi si vede facilmente che la sua primitiva la
primitiva di quella funzione (cio la funzione u(x) = 0 per x < 0, e u(x) = x
per x > 0, pi una costante a piacere). Infatti, per ogni g S, abbiamo
Z

hu , gi = hu, g i =
x g (x) dx
0
Z
=
g(x) dx x g(x)|
0 = hH, gi .
0

Il traslato 1 H ha per primitiva il traslato di u, cio, a meno di costanti, la


funzione 1 v(x) = 0 per x < 1, e 1 v(x) = x per x > 1. Sommando i risultati

11.16. ESERCIZI

875

si ottiene la primitiva G di T data dalla funzione localmente integrabile

se x < 0
0
1
se 0 6 x < 1
g(x) =

x
se 1 6 x

Esercizio 11.16.32. Sia n la funzione che vale 1 nellintervallo [2n, 2n + 1] e


0 altrove. Sia > 0. Consideriamo la serie

n n .

n=1

1. (a) La serie converge puntualmente?


(b) La serie converge uniformemente?
(c) Per quali p la serie converge in Lp (R)?
(d) La serie converge nel senso delle distribuzioni?
Suggerimento: si tracci il grafico delle somme parziali delle serie.
2. Come cambiano le risposte precedenti se = 0 ?
3. Come cambiano le risposte precedenti se =< 0 ?
Se la serie converge trovare la somma, altrimenti spiegare perch.
Svolgimento.
1. (a) La serie converge puntualmente alla funzione S(x) che vale n negli intervalli di estremo iniziale pari [2n, 2n + 1], e 0 nellintervallo
di estremo iniziale dispari [2n + 1, 2n + 2]. Infatti, per ogni x,
n (x) = 0 per tutti gli interi n tranne che se 2n = [x] (cio se
2n 6 x 6 2n + 1). Quindi, se la parte intera di x dispari, tutti
i termini della serie sono nulli e la serie converge a zero, mentre
se la parte intera pari, diciamo [x] = 2m, allora solo il termine
per n = m non nullo, vale n , e quindi questo il valore della
somma della serie in quellintervallo.

876

CAPITOLO 11. DISTRIBUZIONI


(b) La serie non converge uniformemente. Se la convergenza fosse
uniforme, le somme parziali convergerebbero uniformemente alla
somma puntuale S(x) calcolata nella parte precedente,
quindi, se
PN

si indica con SN la somma parziale SN =


n , il resto
n=0
N-simo S SN vericherebbe
lim kS SN k = 0.

Invece,
S(x) SN (x) =

n n

n=N +1

vale n sugli intervalli [2n, 2n+1] con n = N +1, N +2, . . . , e zero


altrove. Poich > 0, il resto N-simo assume valori n crescenti
in maniera illimitata (su una successione di intervalli), e quindi
illimitato:
kS SN k = sup |S(x) SN (x)| = +.
(c) Lo stesso ragionamento prova che la serie non converge per nessun
p. Infatti kn n kp = n per n , e quindi S SN ha
norma Lp divergente per ogni N.
Si pu anche dimostrare che la serie non converge uniformemente e
in Lp senza usare la conoscenza esplicita della sua somma puntuale (bens facendo ricorso alla propriet di Cauchy (come sempre
quando si vuole stabilire una propriet di un passaggio al limite
senza fare esplicito riferimento al valore del limite).
Infatti, basta osservare che il termine n-simo n n non tende a
zero uniformemente (la sua norma uniforme n , quindi diverge
al crescere di n, perch > 0. Rammentiamo che se il termine
generale non tende a zero puntualmente, allora non si ha convergenza puntuale (Sezione 1.1) e quindi tanto meno uniforme. Qui
invece ilk termine generale tende a zero puntualmente (per ogni x,
n n (x) `|e| denitivamente zero), ma non uniformemente. Siamo
quindi in un caso particolare della situazione studiata pi in generale nella Nota ??), che fornisce una condizione necessaria per la
convergenza in norma di una serie in base alla propriet di tendere
a zero in norma del suo termine generico:

11.16. ESERCIZI

877

Nota 11.16.33. I termini di una serie uniformemente convergente (rispettivamente, convergente in norma Lp ) tendono a 0 uniformemente
(rispettivamente, in Lp .) Se una
P
serie di funzioni n=0 fn converge in Lp (nel caso p = , uniformente), allora limn kfn k = 0.

(d) La serie converge nel senso delle distribuzioni, come accennato


nellEsempio 11.6.7. In realt un ragionamento analogo era stato
svolto nellEsercizio 11.6.5, ed era basato sul Corollario 11.6.1. Lo
ripetiamo qui in dettaglio per maggiore chiarezza.
basta mostrare che, per ogni h in S,
In base al Corollario
PN11.6.1,

le somme parziali n=0 n hn , hi sono una successione numerica


convergente. Questo vero perch, quando N tende ad innito, i
termini non nulli della somma (cio quelli per 0 6 n 6 N) sono
del tipo
Z N
Z 2n+1
hn , hi =
n (t) h(t) dt =
h(t) dt
0

2n

e quindi tendono a zero a velocit pi che polinomiale, per il Teorema della Media Integrale (Sezione 1.1) e perch h a decrescenza
rapida.
2. Se = 0, le risposte non cambiano. La dimostrazione della convergenza
puntuale e della convergenza nel senso delle distribuzioni rimane la stessa; analogamente per la mancanza della convergenza uniforme od in Lp ,
dove ora lunica dierenza che lestremo superiore del resto N-simo,
kS SN k , invece di tendere a + con N, rimane costantemente
uguale a N 0 = 1, ma comunque non tende a zero.
3. Se < 0, la convergenza puntuale e la convergenza nel senso delle distribuzioni rimangono vere come prima. In questo caso per si ha anche
convergenza uniforme, perch le P
funzioni n sono a supporto disgiunto,

e quindi il massimo della somma


n=N +1 n n (x) il massimo fra tutti
gli addendi (per ogni x, infatti, c al pi un solo addendo non nullo).
Pertanto
kS SN k = sup

n=N +1

n n (x) = (N + 1)

878

CAPITOLO 11. DISTRIBUZIONI


tende a zero per N poich < 0. Analogamente, kn n kp =
n 0 per n , e da questo fatto otteniamo che laddendo n-simo
converge in Lp alla funzione zero: questa una condizione necessaria,
ma non suciente, per la convergenza della serie. Daltra parte, le
funzioni n sono a supporto disgiunto. Pertanto
Z X
Z

p
|n n | =
|n n |p
n=N +1

n=N +1

e naturalmente |n n |p = np n , dal momento che pn = n . Pertanto


Z

X
X
p

p
kS SN kp =
|
n n | =
np ,
R n=N +1

n=N +1

ePla serie allultimo membro la coda N-sima della serie numerica


p
n n , che converge se e solo se p < 1, ossia < 1/p. Questi
sono quindi i valori di pr cui la serie converge nella norma Lp .

Esercizio 11.16.34. Rispondere alle domande del precedente Esercizio 11.16.32


denendo n := [n,n+ 1 ] .
n

Suggerimento: La dimostrazione precedente si applica parola per parola per


provare che si ha convergenza puntuale e nel senso delle distribuzioni: ma
adesso
1
kn n kp = n p

e quindi si ha convergenza uniforme (della successione n n e della loro serie)


se e solo se < 0, e convergenza in Lp della successione se e solo se < 1/p,
e della serie se e solo se 1/p < 1, ossia < 1/p 1.

Esercizio 11.16.35. Sia V uno spazio normato di funzioni su R e, per f V ,


indichiamo la norma di f con kf k.
P
(i) Enunciare il principio di Cauchy per la convergenza di una serie n fn ,
con fn V .
P
(ii)) Ricavare, dal punto precedente, la seguente propriet: se n fn converge nella norma di V , allora kfn k 0 (Nota: questo generalizza
quanto mostrato nella precedente Nota 11.16.33).

11.16. ESERCIZI

879

(iii) Sia V = Lp (R) (1 6 p < ), sia {Jn } una famiglia di intervalli in


R, sia n la funzione caratteristica di Jn e sia dn la lunghezza di Jn .
Ricavare, dal punto precedente,
una condizione su dn necessaria per la
P
convergenza in norma di n n . Questa condizione anche suciente?
(iv) Che cosa si pu dire sulla convergenza della stessa serie nel caso p = ?

(v)) Supponiamo che ora i supporti degli intervalli Jn siano tutti disgiunti. Sappiamo
fornire una condizione equivalente alla convergenza della
P
serie n n per 1 6 p < ? Che cosa si pu dire per p = ?

(vi) Sia ora c(n, ) = 1/n per ogni PR. Come cambia la risposta
alla domanda precedente per la serie n c(n, )n , ossia per quali
e dn essa converge in norma nellipotesi che gli intervalli siano tutti
disgiunti? Rispondere sia per 1 6 p < sia per p = .

(vii) Che condizione suciente per la convergenza si ottiene se non si assume


che gli intervalli siano disgiunti? Rispondere sia per 1 6 p < che
per p = .
P
(viii) Nellipotesi di intervalli disgiunti, per quali e dn la serie n c(n, )n
converge nel senso delle distribuzioni, se Jn [0, 1]?
(ix) Come si risponde alla domanda precedente se Jn = [n, n + dn ]?
Svolgimento.
P
(i) La serie n fn a valori in V convergente solo se per ogni > 0 esiste
N > 0 tale che

n
m

X
X


fk
fk < , se n, m > N .



k=1

k=1

Se V uno spazio completo, allora questa condizione necessaria per la


convergenza anche suciente.

(ii) La dimostrazione identica


a quella della Nota 11.16.33. Infatti, supP
poniamo che la serie n fn converga in norma. Nel punto precedente
prendiamo m = n 1. Allora abbiamo che, per ogni > 0 esiste N > 0
tale che


n
n1
X

X


fk
fk < , se n > N,



k=1

k=1

880

CAPITOLO 11. DISTRIBUZIONI


ovvero
Dunque, se la serie
converge a zero.

kfn k < ,
n

se n > N.

fn converge in norma, la successione kfn k

(iii) Poich Lp (R) uno spazio normato completo,


una condizione necessaria
P
alla convergenza in norma della serie n n che la norma kn kp del
termine generale tenda a zero per n +.
Questo accade se e solo se tende a zero la successione numerica
Z
Z
p
p
1 = dn .
n =
kn kp =
R

Jn

La condizione non suciente. Infatti, sia JnP


una successione di intervalli disgiuntidi lunghezza dn 0 tale che n dn = . Allora la
P
p
successione delle somme parziali N
n=1 n diverge in L , per N +,
perch
p

p Z
N
N Z
N
N
X

X

X
X




n =
n =
1 dx =
dn



n=1
R n=1
n=1 Jn
n=1
p

(come nellultima parte del precedente Esercizio 11.16.32, la somma


commuta con lelavazione alla potenza p perch gli intervalli sono disgiunti).
(iv) Nel caso p = necessario che sia innitesima
kn k = sup |n (x)| .
xR

Daltra parte, questultima quantit vale 1 per ogniPn, e quindi non pu


convergere a zero se n . Pertanto la serie n n non converge
nella norma uniforme per nessuna scelta di dn > 0.
P
(v) Una condizione equivalente alla convergenza in norma della serie n n
Pdata dal criterio di Cauchy, che riformuliamo come segue: la serie
p
n n converge nella norma di L se e solo se la successione numerica
p Z

!p
+k
N
+k

N
X
X


n =
n



R
n=N

n=N

11.16. ESERCIZI

881

converge a zero, per N +, per ogni k intero positivo. Non abbiamo


scritto in questa propriet i valori assoluti perch le n sono funzioni
non negative.
Di nuovo, nellipotesi in cui i supporti delle n siano disgiunti, loperazione di sommatoria commuta con loperazione di elevazione alla p.
Deve quindi convergere a zero la successione
Z NX
+k
R n=N

pn =

N
+k
X

dn ,

n=N

che converge se e solo se converge la serie


+
X

dn .

n=1

Nel caso p = il criterio di Cauchy equivale alla convergenza della


successione


!


+k
N
+k

N
X
X


n = sup
sup n (x)
n (x) = max

N 6n6N +k xR


xR
n=N

n=N

Lultimo passaggio dovuto ancora una volta al fatto che le n hanno


supporti disgiunti. Ma lestremo superiore di n 1 per ogni n, e quindi
1 anche il massimo tra gli estremi
superiori. Dunque anche nel caso
P
di supporti disgiunti, la serie n n non converge uniformemente su R
per nessuna scelta di dn > 0.
(vi) Applichiamo alla serie n c(n, ) a supporti disgiunti i ragionamenti del
punto precedente.
Per = 0 la serie si riduce alla serie precedentemente
P
studiata n n . Supponiamo quindi 6= 0.
Per 1 6 p < abbiamo
p Z

+k

N
X


c(n, )n =



R
n=N

N
+k
X

n=N

c(n, )n

!p

N
+k
X

n=N

c(n, )p pn

Si ha quindi convergenza se e solo se la serie numerica

N
+k
X

n=N

dn
n np

dn
.
np

converge.

882

CAPITOLO 11. DISTRIBUZIONI


Per p = , invece, ancora per il fatto che i supporti delle funzioni n
sono disgiunti, abbiamo


!


+k
N
+k

N
X
X
1
1


sup n (x)
n (x) = max
c(n, )n = sup

N 6n6N +k xR n


n
xR
n=N

n=N

1
.
N 6n6N +k n
max

Se < 0, lultimo termine diventa (N +k)|| , che diverge per N +.


Per > 0, invece, otteniamo 1/N , che converge a 0 quando N +
per ogni k intero.
P n
<
Riassumendo, per 1 6 p < si ha convergenza se e solo se n ndp
, mentre per p = si ha convergenza se e solo se > 0, indipendentemente da dn .
(vii) Se gli intervalli non sono disgiunti, nel caso 1 6 p < non possiamo
commutare la sommatoria con lelevazione alla potenza p. Analogamente, nel caso p = , non possiamo pi aermare che lestremo superiore
della somma il massimo tra gli estremi superiori.
P
Una condizione suciente alla convergenza della serie n c(n, )n
data dal test di Weierstrass per gli spazi normati Lp e, rispettivamente,
L . La serie converge in norma purch converga la serie delle norme
+
X
n=1

kc(n, )n kp =

Per 1 6 p < questa serie

+
X
n=1

c(n, ) kn kp .

1
 1p X
Z
+

X
1
dnp
1
.
=
n
n
Jn
n=1
n=1

Per p = la serie di cui dobbiamo valutare la convergenza


+
+
X
X
1
1
sup n (x) =
.

n xR
n
n=1
n=1

In tal caso la condizione suciente per la convergenza > 1, indipendentemente dalla scelta di dn > 0.

11.16. ESERCIZI

883
P

dnp
n=1 n

Riassumendo, per 1 6 p < si ha convergenza se


< ,
mentre per p = si ha convergenza se > 1.
P
(viii) La serie n c(n, )n converge nel senso delle distribuzioni se, per ogni
funzione f di Schwartz, converge la serie numerica
+
X
n=1

hc(n, )n , f i.

Valutiamo la convergenza assoluta della serie, ovvero stimiamo


X
Z
Z
+ 1

n f 6


n

+
+
X
X
1
1
|hn , f i| =
|hc(n, )n , f i| =

n
n
n=1
n=1
n=1

+
X

n=1

Jn

|f | .

Per stimare lultimo integrale usiamo il teorema della media integrale,


applicabile per il fatto che f di Schwartz, e che quindi |f | continua.
Esistono pertanto n Jn tali che
Z
+
+
+
X
X
X
1
1
1
|f | =
dn |f (n )| 6 kf k
dn .

n Jn
n
n
n=1
n=1
n=1

Quindi P
la serie converge nel senso delle distribuzioni solo se la serie nudn
merica +
n=1 n convergente: ma questa condizione anche suciente
per la convergenza, come si vede applicando lo stesso ragionamento ad
una funzione f S che valga identicamente 1 nellintervallo [0, 1].
Dal momento che gli intervalli
Jn sono disgiunti e Jn [0, 1], abbiamo
P
n Jn [0, 1] e quindi n dn 6 1. Pertanto lultima serie convergente per ogni > 0 qualunque siano le lunghezze dn degli intervalli
disgiunti.
(ix) Studiamo la convergenza assoluta della serie. Ovvero, per ogni f di
Schwartz, valutiamo
+
+
X
X
1
1
|h
,
f
i|
=
n

n
n
n=1
n=1

n+dn
n

+
Z
X 1
f 6
n
n=1

n+dn

Z +
+
X
1
|f | 6
|f |.

n
n
n=1

Sia k > 1 intero positivo. Nellultimo integrale moltiplichiamo e dividiamo per xk . Utilizziamo poi il fatto che f sia di Schwartz per

884

CAPITOLO 11. DISTRIBUZIONI




maggiorare xk f (x) con la seminorma pk0 (f ). Otteniamo dunque


Z + k
Z +
+
+
+
X
X
x f (x)
pk0 (f ) X 1 1
1
1
1
dx
6
p
(f
)
dx
=
.
0k

k
nk1
n
x
n
x
k

1
n
n
n
n=1
n=1
n=1

Scegliamo ora k > 2 . In questo modo risulta k 1 + > 1 e quindi


lultima serie a membro di destra converge.
P
In conclusione la serie
n c(n, )n converge nel senso delle distribuzioni per ogni e per ogni dn . Si noti che la lunghezza dellintervallo Jn non gioca alcun ruolo: ad esempio, non importa che tali lunghezze tendano a zero, divergano polinomialmente o divergano
esponenzialmente.

Esercizio 11.16.36.
1. Sia H la funzione di Heaviside (cio la funzione
localmente integrabile che determina la distribuzione di Heaviside). In
altre parole, H(x) = 1 se x > 0 e H(x) = 0 altrimenti. La serie

n H

n=0

converge puntualmente? Converge uniformemente? Converge in S


(ossia nel senso delle distribuzioni)?
2. Rispondere alle medesime domande per la serie

3n n H .

n=0

Svolgimento. La serie

X
n=0

n H(x) =

X
n=0

H(x n)

converge puntualmente, perch per ogni x solo i termini con n 6 x sono


non nulli. Ciascuno di questi termini non nulli vale 1, e quindi la somma

11.16. ESERCIZI

885

s(x) della serie vale n nellintervallo [n 1, n). Ossia, in termini di funzioni


caratteristiche (Denizione 1.1.3),
s=

n [n1,n) .

n=1

La funzione somma s ilimitata, mentre le somme parziali sono funzioni a


supporto compatto e limitate. Pertanto la convergenza non pu essere uniforme, ma vale invece nel senso delle distribuzioni (si riveda il precedente
Esercizio 11.16.32). Questo completa la parte (1). Nella parte (2), sempre in
base allEsercizio 11.16.32), si ha convergenza uniforme (e quindi in particolare anche puntuale ed in S ).

Esercizio 11.16.37. Abbiamo provato i seguenti risultati nellEsercizio 1.3.32.


(i) Se n la funzione caratteristica dellintervallo [n, n+1) (quella denita
nella
PSezione 1.1 che vale 1 se n 6 x < n + 1 e 0 altrove), la serie bilatera
n= n converge puntualmente alla costante 1 ma non converge
uniformemente. Si mostri che la convergenza vale anche nel senso delle
distribuzioni.
Se invece della serie bilatera si considera la serie monolaP
tera n=0 n , si mostri che questa serie converge alla distribuzione di
heaviside e puntualmente alla funzione di Heaviside, ma non converge
uniformemente.
(ii) Se
Pn indica la funzione caratteristica dellintervallo [0, n), la serie
n=0 n non converge puntualmente: pi precisamente, essa diverge per ogni x. Si mostri che essa non converge neppure nel senso delle
distribuzioni.
(Suggerimento: si consideri una Gaussiana (o una qualsiasi
R 1 funzione
di Schwartz strettamente
positiva in [0, 1]), e si scriva K 0 (x) dx.
P

,
Allora K > 0 e h m
n=0 n i > (m + 1)K + se m +.)

(iii) Se
Pn indica la funzione caratteristica dellintervallo [0, 1/n), la serie
n=1 n diverge in x = 0 ma converge puntualmente per ogni x 6= 0, e
converge uniformemente in ogni intervallo chiuso che non contiene 0. Si
mostri che la successione
n converge a zero nel senso delle distribuzioni,
P
mentre la serie n=0 n diverge nel senso delle distribuzioni.

886

CAPITOLO 11. DISTRIBUZIONI


(Suggerimento: si consideri la stessa funzione del suggerimento della
parte precedente di questo Esercizio. Grazie alla continuit ed alla alla
positivit di , il numero K := min{(x) : 0 6 x 6 1} P
positivo.
Allora hn , i > Kn . A questo punto ovvio che la serie h n n , i
diverge.)

Si mostri che n non converge a zero in L1 n in L , e quindi la serie


P

n=1 n non pu convergere in L o L , in base al principio di Cauchy


(come nella parte (c) dellEsercizio 11.16.32). Per n converge a zero
in
Lp (R) per 1 < p < : infatti, immediato vericare che kn kp =
p
p
1/n.
P
p
Si dimostri con un calcolo diretto che la serie
n=0 n diverge in L (R)
per ogni 1 6 p 6 .

(Suggerimento: abbiamo gi dimostrato


P i casi p = 1 e p = . Per
1 < p < , la somma parziale GN := N
n=1 n la somma di termini
non negativi, positiva nellintervallo [0, ] ed uguale a N in [0, 1/N].
Quindi GN > NN . Daltra parte, kNN kpp = N p /N = N p1 , e dal
momento che p 1 > 0 vediamo che kGN kp > kNN kp diverge per
N .
P
Si mostri che invece la serie n n2 converge nel senso delle distribuzioni; per la convergenza puntuale ed uniforme il suo comportamento
identico a quello della serie precedente.

Esercizio 11.16.38. Sia n la funzione che vale 1 nellintervallo [2n, 2n + 1] e


0 altrove. Consideriamo la serie

xn (x) .

n=0

1. (a) La serie converge uniformemente?


(b) La serie converge puntualmente?
(c) La serie converge nel senso delle distribuzioni?
2. Come cambierebbero le risposte precedenti se la serie fosse
(a) con > 0?

n=0

x n (x)

11.16. ESERCIZI

887

(b) con < 0?


(Suggerimento: si tracci il grafico delle somme parziali delle serie.)

Esercizio 11.16.39.
1. Sia f (x) = |x|. Trovare esplicitamente la derivata
di f nel senso delle distribuzioni.
2. Sia g = f per x < 0, e g = f + 1 per x > 0. Trovare esplicitamente la
derivata di g nel senso delle distribuzioni.

Esercizio 11.16.40. Sia f una funzione a crescita polinomiale, derivabile ovunque con derivata continua eccetto che in x = 0, dove per i limiti destro e
sinistro di f esistono niti. (Osserviamo che, sotto queste ipotesi, la derivata localmente integrabile, grazie al Teorema Fondamentale del Calcolo
(Teorema 1.27.1). Trovare esplicitamente la derivata di f nel senso delle
distribuzioni, in termini della funzione f , nei due casi seguenti:
1. f continua in x = 0.
2. Nel punto x = 0 la funzione f ha un salto di ampiezza c > 0, cio
limx0+ f (x) limx0 f (x) = c.
(Suggerimento: si veda il precedente Esercizio 11.16.39.)

Esercizio 11.16.41.
1. Sia T0 = (sin x)(0 + ). vero o falso che T0
la distribuzione zero? Perch?
2. Sia T1 = (sin x)( 0 + ). vero o falso che T1 la distribuzione
zero? Perch?
Se una delle due distribuzioni non nulla, calcolarla esplicitamente.

Esercizio 11.16.42. Sia (t) =


destro di di passo n.
Consideriamo la serie

1 se 0 6 t < 1
0 altrimenti

G=

+
X

il traslato

n .

(i) La serie converge in S ? Se no spiegare perch, se s calcolare la somma


della serie nel senso delle distribuzioni.

888

CAPITOLO 11. DISTRIBUZIONI

(ii) Calcolare G nel senso delle distribuzioni.

Esercizio 11.16.43. Sia f (t) =


di f di passo n.
Consideriamo la serie

et se 0 t 1
e n f il traslato destro
0 altrimenti

G=

+
X

n f.

(i) La serie converge uniformemente sui compatti?


(ii) La serie converge uniformemente su R?
(iii) La serie converge puntualmente?
(iv) La serie converge in S ? Se no spiegare perch, se s calcolare G nel
senso delle distribuzioni.

Esercizio 11.16.44. Sia


n (x) = [2n ,2n+1 ) (x)
la successione di funzioni caratteristiche degli intervalli [2n , 2n+1 ).
(i) La successione converge nel senso delle distribuzioni?
(ii) La successione converge puntualmente?
(iii) La successione converge in L1 (R)?
(iv) A quale distribuzione converge (nel senso delle distribuzioni) la serie
+
X

[2n ,2n+1 ) (x)

n=0

Esercizio 11.16.45.

11.16. ESERCIZI

889

Per k > 1 intero, sia k (t) =


verso destra di passo n.
Consideriamo la serie

1 se k1 6 t 6 1
0 altrimenti

Gk =

+
X

1
k

e n la traslazione

n k .

(i)) Per ogni k ssato, la serie Gk converge uniformemente? Perch?


(ii)) La serie Gk converge puntualmente? Se no, spiegare perch, se si
calcolare il limite puntuale.
(iii)) Mostrare che, per ogni k, la serie Gk converge in S .
(iv)) Qual il limite limk Gk nel senso delle distribuzioni?
(v)) Calcolare la derivata Gk nel senso delle distribuzioni.
(vi)) Esiste il limite limk Gk nel senso delle distribuzioni? Se s calcolarlo,
se no spiegare perch.
(Suggerimento: Per ogni k ssato, la serie Gk non converge uniformemente
perch le sua somme parziali non sono una successione di Cauchy nella norma
uniforme, in quanto


m

X


n k = 1



n

per ogni n, m (si spieghi in dettaglio perch questo vero). La serie converge
invece puntualmente,
perch per ogni punto x R il valore delle somme
Pm
parziali n n k (x) rimane costante quando |j| e m sono cos grandi che
m < x < n (in tal caso, questo valore 1 se k1 6 [x] 6 1 k1 e 0 altrimenti).
Per ogni f S, si ha
* m
+
m Z n+1 1
X
X
k
n k , f =
f (x) dx
n=j

n=j

n+ k1

1
(perch?),
a zero per j, m + perch f in L e
e questa
R somma tende
quindi limN + x>N f (x) dx < (si forniscano i dettagli che conducono da

890

CAPITOLO 11. DISTRIBUZIONI

questa stima al calcolo del limite della somma), quindi la serie Gk converge
nel senso delle distribuzioni per il Corollario 11.6.1. Si osservi che
hGk , f i =

lim

j, m

m Z
X

n+1 k1

n+ k1

n=j

f (x) dx

e quindi

2 X
1
1
max{|f (x)| : n 6 x 6 n + } = 0
k k
k
k
n=

lim |hGk , f i| = lim

a causa della decrescenza rapida di f .


In altre parole, limk Gk = 0 nel senso delle distribuzioni. In tal modo
abbiamo risposto alle domande da (i) a (iv). A questo punto la risposta
alla domanda (v) ovvia: poich la distribuzione Gk una serie convergente
di distribuzioni, per il Corollario 11.8.11 essa derivabile (nel senso delle
distribuzioni) termine a termine, e quindi
Gk =

+
X

n k =

n=

+
X

n=

+ 
X



n 1 1 1
k

n+ 1 n 1
k

La domanda (vi) ha una risposta facile, perch, in base al Corollario 11.8.10,


la derivata unoperazione continua su S , e quindi limk Gk = D(limk Gk ) =
D0 = 0. Per evidenziare come le propriet formali delle derivate che abbiamo dimostrato in questo capitolo incapsulino dentro di s argomenti a volte
complicati, diamo una dimostrazione diretta di questultimo risultato.
Per ogni f S e per ogni k, n, in base alTeorema del valor medio di Lagrange
(Sezione 1.1) esiste n,k n k1 , n + k1 tale che
hGk ,





+
1
2X
1
f n
=
f (n,k ) .
fi =
f
n+
k
k
k
n=
+
X

(11.21)

Poich f S, anche la sua derivata f a decrescenza


rapida. Quindi lultimo
P
1
membro si pu maggiorare con k2 p20 (f ) +
.
Ma n,k > n k1 se
1+ 2
n,k

n > 0 e n,k > n + k1 se n < 0. Da questo segue facilmente che lultima serie

11.16. ESERCIZI

891

limitata uniformemente rispetto a k, cio che supk

P+

1
2
1+n,k

< . Allora,

a causa del fattore 2/k, il lato destro di (11.21) tende a zero quando k ,
e quindi limk Gk = 0 in S .


1
1 se k+1
< t 6 k1
Esercizio 11.16.46. Per k > 1 intero, sia k (t) =
0 altrimenti
Consideriamo la serie
+
X
kk .
k=

a) La serie converge uniformemente?


b) La serie converge in L1 (0, 1]?
c) La serie converge puntualmemente? Se no, spiegare perch, se s calcolare il limite puntuale.
d) La serie converge in S ?

1
1
Svolgimento. Il segmento da k+1
a k1 ha lunghezza k(k+1)
, quindi la funzione fk := kk non negativa, ha valore massimo k e norma L1 uguale a
1
. Poich le fk sono a supporto disgiunto, si ha
k+1


n

X


fk = max kfk k = n ,

k=1,..., n


k=1

P
eP
quindi la serieP nk=1 fk diverge nella norma P
di L . Per la stessa ragione,
n
n
n
k k=1 fk k1 =
k=1 fk diverge nella norma
k=1 kfk k1 , e quindi la serie
1
di L . Ogni punto x dellasse reale appartiene al pi ad un solo intervallo
1
, k1 ], e quindi un solo addendo della serie pu essere non nullo in x:
( k+1
pertanto la serie converge puntualmente.
Per studiare la convergenza nel senso delle distribuzioni, sia g nella classe di
1
Schwartz e consideriamo hfk , gi. Poich lintervallo di integrazione ( k+1
, k1 ]
1
ha lunghezza k(k+1)
,
Z
g(x) dx
(k + 1)hfk , gi = k(k + 1)
1
, k1 ]
[ k+1

892

CAPITOLO 11. DISTRIBUZIONI

la media integrale di g in tale intervallo, e quindi tende a g(0) quando


k , grazie alla continuit di g. Quindi, se g(0) 6= 0, abbiamo la stima
1
hfk , gi k+1
P = O(1/k). Se in aggiunta g anche non negativa, ne segue
che la serie
k=1 hfk , gi a termini non negativi, ma il suo termine generico
tende a zero troppo lntamente perch si possa avere convergenza: la serie
non converge nel senso delle distribuzioni.

Esercizio 11.16.47. Nellesercizio precedente, la successione kk converge in


L1 ? Converge puntualmente? Converge uniformemente? Converge nel senso
delle distribuzioni?

Svolgimento. Abbiamo visto nellesercizio precedente che la successione


{fk := kk } diverge in L , converge a zero in L1 (con velocit 1/k), tende a
zero puntualmente (per ogni x al pi un solo termine non nullo), e hfk , gi
1
= O(1/k), quindi la successione tende a zero nel senso delle distribuzioni.
k+1

Esercizio 11.16.48. Sia g(x) = 1/(1 + x2 ) e {xn } una successione innitesima


per n +. Poniamo gn (x) = n f (nx) (queste funzioni sono positive, di
norma L1 uguale a 1, con massimo in zero che vale n, e tendono uniformamete
a zero al di fuori di ogni intervallo (, ), quindi formano una identit
approssimata)
Cconsideriamo i traslati hn = xn hn . La funzione hn ha massimo in xn :
al crescere di n, le funzioni hn hanno punti di massimo che si avvicinano
a 0, e quindi i loro graci si avvicinano a quelli delle funzioni dellidentit
approssimata {gn }: ci aspettiamo quindi che la successione {hn } converga a
0 nel senso delle distribuzioni. Dimostriamolo.

Svolgimento. Per ogni f S dobbiamo dimostrare che hhn , f i f (0)


per n .

11.16. ESERCIZI
Poich

893

hn (x) dx = 1, abbiamo


Z


|hhn , f )i f (0)| = xn gn (x) f (x) dx f (0)

Z



= gn (x) (xn f (x) f (0)) dx

Z

Z



= gn (x) (xn f (x) f (x)) dx + gn (x) (f (x) f (0)) dx

Z



6 kgn k1 kxn f f k + gn (x) (f (x) f (0)) dx .

Ora facile vedere che lultimo membro tende a zero. Infatti, il secondo
integrale allultimo membro tende a zero per n perch {gn } una
identit approssimata e f in S, quindi uniformemente continua (Teorema
6.1.16); il primo integrale invece tende a zero perch kgn k1 = 1 e kxn f f k
innitesimo per xn 0 per la continuit della traslazione sullo spazio delle
funzioni uniformemente continue (Proposizione 7.6.5).
Si noti che utilizzare il teorema del valor medio integrale in questo esercizio
sarebbe stato meno facile che nei precedenti, perch le funzioni gn non sono a
supporto compatto, e quindi occorrerebbe dimostrare anche che i punti in cui
gli integrandi gn xn f assumono il proprio valore medio integrale tendono a
zero, cosa non ovvia.

Esercizio 11.16.49. (i) Sia f una funzione su R. Sia +


N la funzione caratteristica della semiretta [N, +). Mostrare che
(a) f +
n converge a zero uniformemente se e solo se limx+ f (x) = 0;
1
(b) se f L1 (R), allora f +
n converge a zero nella norma di L ;

(c) se f localmente integrabile a crescita polinomiale, allora f +


n
converge a zero nel senso delle distribuzioni.
(ii) Sia n la funzione caratteristica dellintervallo [2n, 2n + 1] e cn > 0,
con lim cn = 0. Mostrare che la successione {cn n } converge a zero
uniformemente, in L1 e nel senso delle distribuzioni.

894

CAPITOLO 11. DISTRIBUZIONI


1 1
1
1
, +
.
(iii) Per n > 1 sia Kn =
n n3 n n3
caratteristica di Kn . Mostrare che la serie


Sia ora n la funzione

+
X
1
n
n
n=1

converge uniformemente. Spiegare perch da questo segue che il test di


Weierstrass (Sezione 1.1) una condizione suciente per la convergenza
uniforme di una serie di funzioni, ma non necessaria.
(iv) Sia V uno spazio normato completo. Mostrare la seguente
P versione del
test di Weierstrass:
P se vn V sono vettori tali che n=1 kvn kV < ,
allora la serie n=1 vn converge nella norma di V .
(v) Applicare la versione del test di Weierstrass dimostrata alal precedente
parte (iv) per mostrare che la serie allla parte (iii) converge in L1 .

(vi) la serie alla parte (iii) converge nel senso delle distribuzioni?



1
1 1
1
(vii) Per n > 1 sia Jn =
. Sia ora n la funzione caratte ,
+
n n2 n n2
ristica di Jn . La serie
+
X
1
n
n
n=1
converge uniformemente? Converge in L1 ? Converge nel senso delle
distribuzioni?

Svolgimento del primo quesito della parte (vii). La serie


+
X
1
n
n
n=1

non converge totalmente, poich lestremo superiore di R del termine n-esimo


1
della serie , la cui serie diverge.
n

11.16. ESERCIZI

895

Dunque alla serie non si pu applicare il Test di Weierstrass. Questo non


ci d informazioni sulla convergenza uniforme della serie. Dobbiamo percorrere unaltra strada. Si pu sospettare che i supporti del termine generale
della serie


1
1 1
1
Jn =
, +
n n2 n n2
diventino denitivamente disgiunti. Se cos fosse, la serie convergerebbe uniformemente, essendo ogni addendo pesato con la successione innitesima
1
. Perch ci accada lintervallo Jn dovrebbe essere disgiunto dallintervallo
n
Jn+1 , per n sucientemente grande. La condizione che esprime ci che
lestremo destro di Jn+1 si trovi a sinistra dellestremo sinistro di Jn , ovvero
si deve avere
1
1
1
1
+
<

.
n + 1 (n + 1)2
n n2
1
Questa disequazione sembra vera, almeno denitivamente, poich 2 un
n
1
1
pi piccolo
innitesimo di ordine superiore a per n + e poich
n
n+1
1
di . Tuttavia una manipolazione immediata della disequazione porta a
n
n2 + n + 1 < 0,
condizione che non vericata per nessun intero! Il motivo di questa appa1
e n1 dellordine di n12 , che
rente contraddizione che la distanza tra n+1
precisamente dello stesso ordine del raggio dellintervallo Jn .
Sebbene gli intervalli Jn non siano disgiunti, sicuramente vero che, ssato un n, esiste un m > n tale che gli intervalli Jn e Jm . Questo vero
poich lestremo destro di Jm tende a zero per m +, e quindi, a patto di
scegliere m sucientemente grande, questo diventa piccolo quanto vogliamo,
quindi anche pi piccolo dellestremo sinistro di Jn .
Ci domandiamo dunque se esiste un k intero tale che, da un certo n
in poi, gli intervalli Jn e Jn+k siano disgiunti. Se ci accadesse la serie di
partenza potrebbe scriversi come somma di k serie di funzioni innitesime
a supporto disgiunto, e quindi uniformemente convergenti. A questo punto
sarebbe uniformemente convergente la serie di partenza.

896

CAPITOLO 11. DISTRIBUZIONI

Sia allora k intero positivo. La condizione che dice che Jn e Jn+k siano
disgiunti
1
1
1
1
+
< 2,
2
n + k (n + k)
n n
ovvero
n+k+1
n1
<
.
2
(n + k)
n2
Eliminando i denominatori (sempre positivi per n e k interi positivi) otteniamo
n3 + n2 k + n2 = n2 (n + k + 1) < (n 1)(n + k)2
= (n 1)(n2 + k 2 + 2nk) = n3 + nk 2 + 2n2 k n2 k 2 2nk.

Consideriamo la disuguaglianza fra il primo e lultimo membro: semplicando


otteniamo
(k 2)n2 + k(k 2)n k 2 > 0 .

Per k = 1 troviamo la disequazione gi ottenuta qualche riga fa. Per k = 2


otteniamo 4 > 0, che falso per ogni n. Per k > 2 otteniamo

k2
> 0.
k2
Il polinomio in n a primo membro di secondo grado, ha il coeciente di
grado massimo pari a 1 e il termine noto negativo. Pertanto esistono due
radici reali e, poich il prodotto delle radici (il termine noto) negativo,
una delle due radici negativa e laltra positiva. Pertanto la disequazione
vericata a destra della radice positiva (e a sinistra di quella negativa, ma
questo fatto non ci serve, visto che lintero n positivo).
Questo signica che, ssato k > 2, da un certo n in poi la disequazione
vericata, e quindi gli intervalli Jn sono disgiunti. Il pi piccolo k intero per
cui ci accade k = 3. Ponendo k = 3 nella disequazione si ottiene che essa
vericata per tutti gli interi maggiori o uguali a 2.
Abbiamo quindi tre famiglie di intervalli disgiunti. Una famiglia composta da J2 , J5 , J8 , . . . , (ossia dagli intervalli J3n1 ), unaltra da J3 , J6 , J9 , . . .
(ossia dagli intervalli J3n ), e lultima da J4 , J7 , J10 , . . . (ossia dagli intervalli
J3n+1 ).
La serie di partenza pertanto si decompone come segue:
n2 + kn

+
+
+
+
X
X
X
X
1
1
1
1
n = 1 +
2+3m +
3+3m +
4+3m .
n
2 + 3m
3 + 3m
4 + 3m
n=1
m=0
m=0
m=0

11.17. DISTRIBUZIONI NON TEMPERATE

897

Ciascuna delle tre serie composta da funzioni a supporti disgiunti i cui


valori massimi tendono a zero. Quindi in ognuna delle serie le code n-sime
hanno valore massimo che tende a zero al crescere di n, come nelle precedenti
parti (ii) e (iii) di questo Esercizio. Pertanto, in base al principio di Cauchy,
ciascuna di queste tre serie converge uniformemente, e quindi la serie di
partenza converge uniformemente alla somma delle tre serie.

11.17

Cenni sulle distribuzioni non temperate

In questa Sezione accenniamo alla costruzione di distribuzioni generali, che


- quando coincidono con funzioni - non richiedono ipotesi di crescenza polinomiale. Introduciamo questo spazio pi grande di distribuzioni come il
duale dello spazio D delle funzioni C a supporto compatto, invece che a
decrescenza rapida come facemmo per le distribuzioni temperate. Le distribuzioni studiate prima, ossia il duale S della classe di Schwartz S, si
chiamano temperate, mentre le distribuzioni nello spazio pi grande D si
chiamano semplicemente distribuzioni. Invitiamo il lettore alla necessaria
attenzione, visto che in questo libro, ove utilizziamo quasi sempre solo distribuzioni temperate, le abbiamo chiamato spesso semplicemente distribuzioni
e cos continueremo a fare, con abuso di notazione, nel resto di questa Parte
e nella prossima.
Ci limitiamo qui solo a cenni senza dimostrazioni. Varie dimostrazioni sono state esposte, talvolta in maniera assai approfondita, nelle Sezioni
3.18 e 3.20 del Capitolo 3 sugli spazi vettoriali topologici. Oltre che i fatti
preliminari esposti in quel Capitolo, il lettore interessato pu studiare una
esposizione estesa e dettagliata in [25] e [38].

11.17.1

Lo spazio D

Definizione 11.17.1. Lo spazio D delle funzioni C a supporto compatto


si chiama lo spazio delle funzioni test. Muniamo questo spazio della seguente
famiglia numerabile di norme: per ogni K intero positivo,
kf kK := max{|D f (x)| : x R, 0 6 6 K} .
Pi in generale, si denota con D() lo spazio delle funzioni C a supporto
compatto denite su un dominio . Se si vuole estendere questa denizione

898

CAPITOLO 11. DISTRIBUZIONI

a funzioni in pi variabili su un dominio Rn , basta prendere il massimo


su e sostituire
lindice di derivazione con un multiindice 1 n il
Pn
cui grado i=1 |i | sia non superiore a n.

Si noti che, ora che le funzioni sono a supporto compatto, non occorre pi
moltiplicare per polinomi e prendere lestremo superiore invece che il massimo
(come invece facemmo per le distribuzioni temperate, si veda la Nota 9.3.3),
perch lestremo superiore di una funzione continua su un compatto il massimo (si veda la Sezione 1.1 e la dimostrazione del Teorema di Weierstrass
sulla esistenza dei massimi e dei minimi delle funzioni continue sui compatti
([19, Cap. 16 (Appendice)]).
Lo spazio D lunione degli spazi di Frchet DK = C (K) delle funzioni

C a supporto nel compatto K, introdotto nellEsempio 9.1.6. Il legame fra


questi sottospazi e lintero spazio delle funzioni test illustrato nel prossimo
enunciato.

Corollario 11.17.2. Se fi una successione di Cauchy in D, allora tutte


le funzioni fi appartengono a DK per qualche compatto K, e limi,j kfi
fj kN = 0 per ogni intero positivo N. Se fi 0 in D, allora esiste un
compatto K che contiene il supporto di tutte le funzioni fi e le derivate D n fi
di qualsiasi ordine n convergono a zero uniformemente per ogni n quando
i . Pertanto ogni successione di Cauchy in D converge, ovvero lo spazio
delle funzioni test completo.
Definizione 11.17.3. Un funzionale lineare continuo su D (nel senso della
topologia di D indotta dalla sua famiglia numerabile di norme) si chiama
una distribuzione. Lo spazio delle distribuzioni quindi il duale D , nel senso
della Sezione 11.3.
Il prossimo risultato illustra un altro legame fra D ed i sottospazi DK , in
linea con il Corollario precedente.
Teorema 11.17.4. Un funzionale T su D continuo, ossia T D , se e
solo se per ogni compatto K esistono un intero N ed una costante C > 0 tali
che |T f | 6 Ckf kN .
Definizione 11.17.5. Se una distribuzione T ammette costanti N che rendono vera la disuguaglianza del precedente Teorema 11.17.4 simultaneamente
per ogni compatto K, allora la pi piccola tale costante si chiama lordine di
T.

11.17. DISTRIBUZIONI NON TEMPERATE

899

Esempio 11.17.6. Dal precedente Teorema 11.17.4 segue che le delta di Dirac
sono distribuzioni.
La derivata di una distribuzione viene denita esattamente come nel caso
di distribuzioni temperate (Esempio 11.5.4), ed in base al Teorema 11.17.4
ancora una distribuzione.
La distribuzione indotta da una funzione localmente integrabile viene
denita come nel caso di distribuzioni temperate (Esempio 11.5.4), ed ora
una distribuzione anche se non si assume che sia a crescita polinomiale.
La moltiplicazione di una funzione f C per una distribuzione viene
denita come nel caso di distribuzioni temperate (Esempio 11.5.4), ed ora
una distribuzione anche senza assumere che f sia a crescita polinomiale.
La verica di queste ovvie propriet viene lasciata al lettore per esercizio.

11.17.2

Convergenza nel senso delle distribuzioni

Le propriet di convergenza di successioni di distribuzioni sono analoghe,


con gli ovvi cambiamenti, a quelle per le distribuzioni tempetrate, come si
vede nei prossimi risultati, che sono conseguenze del Teorema 11.17.4 e del
Corollario 11.17.2 , nonch del principio di uniforme limitatezza (Corollario
3.14.4), esattamente come nella analoga dimostrazione per le distribuzioni
temperate (Proposizione 11.5.3).
Parallelamente a quanto visto per le distribuzioni temperate (Denizione
11.5.2), la nozione di convergenza nel senso di D la convergenza debole *
indotta da D, nel senso introdotto nella Denizione 11.4.4:

Definizione 11.17.7. Siano T , Ti D , i = 1, 2, . . . . Diciamo che Ti T


in D se Ti f T f per ogni f D.

Teorema 11.17.8. Sia Ti D una successione di distribuzioni che converge


puntualmente (o meglio nel senso debole stella): per ogni f D, esiste il
limite si ha limi Ti f . Chiamiamo questo limite T f . Allora T D , e per
ogni intero n N si ha D n Ti D n T nella topologia di D .
Il prossimo risultato illustra la bicontinuit della moltiplicazione per funzioni su D .

Teorema 11.17.9. Se Ti T in D e hi h in C (nel senso della


topologia dello spazio di Frchet C (R) introdotta nellEsempio 9.1.6), allora
hi Ti hT in D .

900

CAPITOLO 11. DISTRIBUZIONI

11.17.3

Supporto e convoluzione di distribuzioni

Il supporto di una distribuzione si denisce come per una distribuzione


temperata (Denizione 11.10.1).
Notazione 11.17.10. In seguito, nel Capitolo 18, considereremo distribuzioni con supporto in una semiretta illimitata a destra o a sinistra, che
chiameremo distribuzioni con supporto a destra (rispettivamente, a sinistra).
La nozione di convoluzione di distribuzioni pi delicata rispetto al caso
delle distribuzioni temperate. La denizione di convoluzione u T di una
funzione u D ed una distribuzione T D identica al caso di distribuzioni
temperate, in cui u S e T S , ed ha le stesse propriet, che lasciamo
vericare al lettore. Ad esempio:
Esercizio 11.17.11. Se {hn } una identit approssimata di funzioni in D,
allora per ogni g D si ha hn g g nella topologia di D, e per ogni T D
si ha hn T T in D .

Ora veniamo alla convoluzione con funzioni in C invece che in D. Omettiamo le dimostrazioni (si veda, ad esempio, [25, Chapter 6]).
Teorema 11.17.12. (i) Se T D una distribuzione a supporto compatto e f C , allora la definizione di convoluzione ha senso anche per f T , commuta con le traslazioni e verifica D k (f T ) =
(D k f ) T = f (D k T ) per ogni k N. Se in aggiunta g D allora
gT D e valgono le seguenti regole di associativit e di commutativit:
(g f ) T = g (f T ) = f (g T ).
(ii) Se T , U D ed almeno una delle due distribuzioni ha supporto compatto, allora loperatore Lf = (f T ) U ben definito. Possiamo
quindi definire la convoluzione T U come hT U, f i = Lf .
(iii) Siano T , U, V D . Se almeno una fra T e V ha supporto compatto,
vale la regola di commutativit T V = V T , e la regola di derivazione
D k (T V ) = (D k T ) V = T (D k V ) per ogni k N: in particolare,
D k T = (D k ) T , e quindi anche T = T .
Se almeno due dei supporti di T , U, V sono compatti, vale la regola di
associativit (T U) V = T (U V ).

11.17. DISTRIBUZIONI NON TEMPERATE

11.17.4

901

Distribuzioni e distribuzioni temperate

chiaro da quanto visto nella denizione di topologia in D e S che D si immerge come sottospazio di S e limmersione continua. Pertanto, per quanto
visto nella Sezione 11.3, lo spazio delle distribuzioni temperate S si immerge
con continuit nello spazio delle distribuzioni D . Viste come funzionali, le
distribuzioni temperate sono quelle distribuzioni che si estendono a funzionali continui sulla classe di Schwartz e non solo sulle funzioni C a supporto
compatto. quindi chiaro che vale il risultato seguente:
Corollario 11.17.13. Ogni distribuzione a supporto compatto temperata.

902

CAPITOLO 11. DISTRIBUZIONI

Capitolo 12
Approssimazione in S del treno
di impulsi con funzioni di
Schwartz
12.1

Il treno di impulsi e la sua trasformata di


Fourier su B 1
2

Questo capitolo dedicato alla approssimazione (nel senso delle distribuzioni)


della distribuzione treno di impulsi con funzioni di Schwartz. Una parte del
Capitolo (Esempio 12.3.7 e Teorema 12.4.3) consiste in un elaborato e dicile
esercizio sullapprossimazione uniforme ed in S, che solo accennato e quindi
incompleto, ma non necessario nel resto del libro. Richiamiamo la nozione
di treno di impulsi, presentata nella Denizione 11.6.4:
Definizione 12.1.1. (Il treno di impulsi.) (Definizione tratta dallEsempio 11.6.4.) Chiamiamo treno di impulsi la distribuzione K S denita
da

X
K=
n
n=

dove n la delta di Dirac centrata al punto n, ossia


hn , f i = f (n)

per ogni f S ,

e la serie converge nel senso delle distribuzioni (come osservato nellEsempio


11.6.4).
903

904 CAPITOLO 12. APPROSSIMANTI IN S DEL TRENO DI IMPULSI


b a partire dalla denizione di trasformata di Fourier di
Calcoliamo ora K
una distribuzione (Denizione 11.11.1 (i)):

D
E D
E
X
b
b
K, f = K, f =
fb(n)
n=

b convergente nel senso delle distribuzioni. Infatti


La serie che denisce K
b
f S implica f S (Teorema 9.7.5), e quindi fb(n) tende a zero allinnito a
velocit pi che polinomiale, in particolare pi rapidamente di n12 . Pertanto
P
b
la serie numerica
n= f (n) convergente per ogni f S per il Corollario
11.6.1).
Ora, la formula di somma di Poisson (Proposizione 10.3.1) asserisce che,
per ogni f nella classe di Schwartz, o anche nella classe di Paley-Wiener B 1
2
(Denizione 10.4.1), si ha

n=

f (n) =

n=

fb(n).

purch la serie di Fourier del periodicizzato di periodo 1 di fb converga


puntualmente nellorigine. Questo equivale a dire che
D
E D
E
b f K, fb = hK, f i
K,
(12.1)

per ogni f B 1 che soddisfa la succitata condizione. Ridimostreremo questo


2
risultato per ogni f S, grazie a una dimostrazione alternativa basata sulla
convergenza negli spazi S e S .
Dalla propriet di dilatazione per la trasformata di Fourier di distribuzioni, Teorema 11.12.9, ora segue:
P
Corollario 12.1.2. Poniamo K :=
n= n (K il treno di impulsi di
passo ) Per ogni > 0, osserviamo che il dilatato 1 K, in base allEsempio

P
11.12.8 ed allEsercizio 11.12.10,
n= n = K . Allora
b = K = K 1 .
[
1 K = K

Equivalentemente,

c = 1 K 1 .
K

12.2. TRASFORMATA DI FOURIER DEL TRENO DI IMPULSI

12.2

905

La trasformata di Fourier del treno di impulsi

Poich

K=

n=

e la serie converge in S , la Proposizione 11.11.4 asserisce che


b=
K

n=

bn ,

e che questultima serie converge nel senso di S . (Il fatto che questa serie
converga ovvio anche P
per via diretta, in base al Corollario 11.6.1, perch
b
b
b
n (f ) = f (n) e la serie
n= f (n) converge perch il termine generale a
decrescenza rapida visto che fb S per la Proposizione 11.11.4 dal momento
che f S.) Ora, dallEsempio 11.14.1 (ii), sappiamo che

n=

bn =

Te2in =

n=

e2in .

n=

In base a (12.1) sappiamo invece di dover trovare al secondo membro

n .

n=

C una contraddizione? Per chiarire che non c contraddizione mostriamo


che la serie

X
e2in
(12.2)
P

n=

converge in S a n= n .
La serie degli esponenziali (12.2) una serie di funzioni, ma non converge nel senso delle funzioni, ossia puntualmente, perch il termine generale
e2in non tende a 0 per n 7 per nessun (ha modulo 1, e quindi la
serie non converge per alcun : Sezione 1.1). Per interessante studiare il
comportamento puntuale delle sue somme parziali

SN () =

N
X

n=N

e2in .

906 CAPITOLO 12. APPROSSIMANTI IN S DEL TRENO DI IMPULSI


Sappiamo che non convergono, ma come si comportano?
immediato osservare che, se intero, e2in = 1 e quindi
SN () = 2N + 1.
Perci, se intero,
lim SN () = .

Invece, se non intero, si pu mostrare che SN () limitato al variare di


N: pi precisamente,
1
;
|SN ()| 6
| sin |

si veda lAppendice alla ne del presente capitolo, a pagina 921).


Perci landamento delle somme parziali si mantiene limitato per tutti gli
non interi, ma esse divergono sugli interi: questo precisamente ci che ci
aspetteremmo se il limite fosse

n .

n=

Cos per abbiamo solo un indizio circa il limite della serie (12.2). Al ne di
stabilire in maniera rigorosa a cosa essa converge nel senso delle distribuzioni
dobbiamo calcolare
*
+
X
e2in , f ,
n=

per f S. Ma sappiamo gi la risposta, riformulata qui come teorema:

Teorema 12.2.1. (Formula di Somma di Poisson espressa nel senso delle distribuzioni.) Nel senso delle distribuzioni vale la seguente
uguaglianza:

X
X
bn =
n .
n=

n=

Dimostrazione. Dobbiamo provare che, per ogni f S, le serie


*
+

X
X
b
n , f =
fb(n)
n=

n=

12.2. TRASFORMATA DI FOURIER DEL TRENO DI IMPULSI


e

n , f

n=

907

f (n)

n=

convergono entrambe e coincidono. Ma questo la Proposizione 10.3.1.

Prima di procedere, enunciamo una interessante conseguenza della convergenza della serie (12.2), che prova la prima met di un fatto generale: lequivalenza fra periodicit di una distribuzione e discretezza della sua trasformata
di Fourier (per laltra met si veda il Corollario 13.1.5).
Corollario 12.2.2. (La trasformata di Fourier di una distribuzione
periodica discreta.) Sia f una funzione localmente integrabile con supporto in [ /2, /2], e sia h la funzione localmente integrabile
e periodica
P
ottenuta periodicizzando f con periodo : cio h =
n= n f . Allora
c
la corrispondente distribuzione Th (notazione dellEsempio 11.5.4 (i)) discreta: piPprecisamente, la distribuzione impulsiva equispaziata di passo
1
bn n
bn
data da
n= f ( ) . Si noti che il fattore f ( ) nellultima espressione

precisamente il coefficiente di Fourier n-simo della funzione periodica h, e


quindi in questo senso la trasformata di Fourier della funzione periodica h
si identifica con la distribuzione discreta di passo 1/ il cui istogramma (nel
senso della Notazione 13.1.3) la successione dei coefficienti di Fourier.
Dimostrazione. In base alla propriet di dilatazione per la trasformata di
Fourier (Teorema 11.12.9), suciente dimostrare il Corollario nel caso =
1. In tale caso, per la Proposizione 11.14.3, si ha
h=

n f =

n=

n=

n f

e la serie converge nel senso delle distribuzioni, in base allargomento ripetutamente usato in Sezione 11.6. Allora, in base allEsempio 11.14.1 (ii),
ch =
T

n=

bn fb

(12.3)

dove la serie converge nel senso delle distribuzioni, grazie alla continuit della
trasformata di Fourier su S (Teorema 9.7.5). Ora applichiamo il Teorema

908 CAPITOLO 12. APPROSSIMANTI IN S DEL TRENO DI IMPULSI


12.2.1:

b = P
n= n , e quindi (12.3) diventa

n= n

ch =
T

n=

n fb =

n=

fb(n)n ,

(12.4)

grazie allEsercizio 11.8.5.


Lultima asserzione la Proposizione 10.2.3 (o pi precisamente, il suo Corollario 10.2.4).

b data nel Teorema 12.2.1


La dimostrazione elementare sul calcolo di K
piuttosto formale: vogliamo darne una versione molto pi costruttiva.
Ad esempio, rivediamo in questa luce quanto osservato in Sezione 12.1 a
proposito della formula di Poisson. Se invece di prendere f S prendessimo
f nella classe di Paley-Wiener B 1 (Denizione 10.4.1) avremmo
2
*
+
N
X
X

2in
e
,f
bn , f
= lim
N

n=

=
=
=

n=N

lim

N
X

n=N

n=

fb(n)

fb(n)

f (n)

n=

n , f

n=

P
b
(la serie
n= f (n) converge perch f B 21 ed abbiamo fatto uso della
formula di somma di Poisson (Proposizione 10.3.1).
Perci, se B 1 fosse contenuto in S e fosse denso in S, questo ci permet2
terebbe di ridimostrare per S lidentit
K=

n=

n =

n=

b
bn = K

a partire dalla classe di PaleyWiener. Invece ci non vero, come abbiamo


mostrato nella Proposizione 11.4.2.

12.3. APPROSSIMANTI DI K

909

Riassumendo, il Toerema 12.2.1, che non altro che la formula di somma


b ) = K(f ) per ogni funziodi Poisson (Proposizione 10.3.1), ci dice che K(f
ne in S: ma se vogliamo provare questo risultato in modo costruttivo, cio
approssimando le distribuzioni ad entrambi i membri con funzioni, non possiamo usare un procedimento di approssimazione a partire da B 1 , e quindi
2
invocare la formula di somma di Poisson per la classe di PaleyWiener. Invece dovremmo partire da S , approssimare K con funzioni un S, e poi usare
la dualit.

12.3

Approssimanti del treno di impulsi

Esempio 12.3.1. (Convergenza dei treni di onde quadre normalizzate


al treno di impulsi.) Che cosa succede se consideriamo il treno di onde
quadre rinormalizzate di durata , , introdotto nella Denizione 11.6.8,
e facciamo tendere ad innito? La risposta che queste distribuzioni
convergono in S al treno di impulsi K dellEsempio 11.6.4. La ragione la
seguente.
Consideriamo la funzione = ottenuta comprimendo orizzontalmente
di un fattore 1 e poi rinormalizzandola di un fattore per mantenerne
costante la norma L1 , come in Sezione 11.1. La distribuzione T = T data

dalla funzione localmente integrabile agisce sulle funzioni


 1 1 f S cos:
T f la media integrale dei valori di f nellintervallo 2 , 2 di centro 0
e diametro 1 . Evidentemente, quindi, T f compreso fra il minimo ed il
massimo valore che f assume in questo intervallo. Poich f continua, per
il Teorema dei Valori Intermedi (Sezione
questo
valore viene assunto da
 1.1)

1
1
1
f in qualche punto () dellintervallo 2 , 2 . Quindi si ha: |()| 6 2
.
La stessa cosa capita ai traslati: per ogni n N, n T f = f (n ()), con
1
|n () n| 6 2
.
Il resto del calcolo si puo svolgere come nellEsercizio 11.6.5: per comodit
del lettore lo riassumiamo al termine dellEsempio, ma esiste una variante
rapida e semplice dellargomentazione, che esponiamo per prima cosa. Osserviamo che lim n () = n. Pertanto basta provare che si pu scambiare
il limite con la serie:
lim

n=

f (n ()) =

n=

f (n) .

910 CAPITOLO 12. APPROSSIMANTI IN S DEL TRENO DI IMPULSI


Per dimostrare questo passaggio al limite, applichiamo il Teorema di Convergenza Monotna di Lebesgue (Teorema 1.9.53), invece che ad integrali
su R, alle serie, cio ad integrali rispetto alla misura discreta naturale su Z
dellEsempio (1.9.22). Qui i termini della serie dipendono dal parametro .
Per poter applicare questo Teorema occorre che la successione dei termini,
{f (n ())}nZ (che cambia con ), sia limitata da ununica successione in 1
indipendente da . Una tale successione an := max{|f (x)| : n 12 6 x 6
n + 21 }. Infatti, evidentemente vale la disuguaglianza
P |f (n ())| 6 an ; inoltre, grazie alla decrescenza rapida di f , si ha che
N = an < . Questo
completa il calcolo.

Esercizio 12.3.2. Si sviluppi il calcolo del precedente Esempio 12.3.1 senza


usare il Teorema di Convergenza Dominata di Lebesgue (Teorema 1.9.54).
Svolgimento. Il calcolo si pu svolgere come nellEsercizio 11.6.5, come segue.
Per il Teorema di Lagrange (Sezione 1.1) esiste un numero n () compreso fra
n e n () tale che f (n ())f (n) = (n ()n)f (n ()). Quindi |f (n ())
1
f (n)| 6 2
|f (n ())|, e poich f a decrescenza rapida, da qui segue
1
che, per ogni intero positivo M, si ha f (n ()) f (n) = 2
o(nM ). Pi
1
precisamente, |f (n ())f (n)| si maggiora con la lunghezza 2
dellintervallo
1
1
[n, n + 2 ] (se n () > n: oppure [n 2 ], n] se n () < n), moltiplicata per
il massimo valore di |f | in tale intervallo. Poich lintervallo si stringe al
crescere di , il suddetto massimo valore non crescente al crescere di , e
quindi la sua maggiorazione con una quantit o(nM ) decrescente a velocit
pi che polinomiale non dipende da .
Pertanto la serie
*
+

X
X
h , f i =
n T , f =
f (n ())
n=

n=

X
1 X
f (n) +
+
f (n ())
f (n) = hK, f i ,

2 n=
n=
n=

e quindi converge a K (Denizione 11.5.2).

Esempio 12.3.3. (Convergenza dei treni di Gaussiane normalizzate


al treno di impulsi.) Consideriamo il caso della serie G di traslati di
passo 1 della Gaussiana della Denizione 11.6.13. Possiamo ripetere
largomento del precedente Esempio 12.3.1. Tranne al pi per un numero

12.3. APPROSSIMANTI DI K

911

nito di interi n, il fatto che f e siano a decrescenza rapida assicura che


la media pesata dei valori di f intorno al punto n con peso ((x n))
1
. Il resto
un valore assunto da n in un punto () che verica |()| 6 2
dellargomento rimane identico a quello dellEsempio succitato, e mostra che
lim G = K nel senso di S .
In particolare, per ogni f S e > 0, esiste > 0 tale che, per ogni > ,
|hG , f i hK, f i| < .

(12.5)

Corollario 12.3.4.
P m Per ogni intero m esiste un intero Nm tale che le funzioni
di Schwartz m N
n=Nm n Nm approssimano il treno di impulsi K nel senso
delle distribuzioni.
P
Dimostrazione. Le somme parziali della serie G =
n= n convergono a G nel senso delle distribuzioni, come mostrato nellEsempio 11.6.9.
In particolare, per ogni f S e , > 0, esiste N tale che, per ogni N > N ,


N


X


(12.6)
n , f i hG , f i < .
h


n=N

Allora, consideriamo gli per cui vale la disuguaglianza (12.5) e limitiamo


lattenzione ad interi: sappiamo che la disuguaglianza vale per tutti gli
interi m := maggiori di un opportuno (un numero che dipende solo da
e dalla scelta di f S). Per ogni tale intero m scriviamo Nm invece che
N nella disuguaglianza (12.6). Allora dalla disuguaglianza trangolare e da
(12.6) e (12.5) segue che, per ogni f S e per ogni m > ,


Nm


X


n m , f i hK, f i < 2 .
hm


n=Nm

Nota 12.3.5. Si noti che, se non ci fossimo proposti di approssimare il treno


di impulsi con funzioni in S, lapprossimazione del treno di impulsi K con
le funzioni C periodiche G (quindi non in S), stabilita nel precedente
Esempio 12.3.3, sarebbe suciente a dimostrare costruttivamente lidentit
b = K del Corollario 12.2.2. Infatti basterebbe ricalcare largomento della
K

912 CAPITOLO 12. APPROSSIMANTI IN S DEL TRENO DI IMPULSI


dimostrazione di quel corollario, e precisamente applicare a G lidentit
(12.4), per ottenere
c =
G

(n) n =

en

2 /2

n=

n=

grazie alla Proposizione 10.2.3 (si vedano spiegazioni pi dettagliate nel Corollario 12.4.7 in seguito). A questo punto, per +, i coecienti delle
delta nei termini di questa serie tendono tutti a 1, e quindi, per ogni f > 0
in S, si ha
*
+

X
X
X
n2 /2
n2 /2
e
n , f =
e
f (n)
f (n)
n=

n=

n=

di nuovo per il Teorema di Convergenza Monotna di Lebesgue (Teorema


1.9.53), applicato alle serie, ossia rispetto alla misura discreta naturale su Z.
Questo fatto, insieme ad un ovvio argomento di densit di S in L1 , stabilisce
c (f ) K(f ) per ogni funzione non negativa in L1 (R), ed allora, per
che G
linearit, la stessa cosa vale per ogni funzione di Schwartz (basta spezzarla
come somma delle sue parti positiva e negativa).

Nota 12.3.6. I due Esempi 12.3.1 e 12.3.3 di questa Sezione sono casi parti1
colari di un risultato
P pi generale: se una identit approssimata in L ,
allora la serie n= n converge in S al treno di impulsi quando .
Lasciamo al lettore il compito di estendere le dimostrazioni precedenti a questo risultato, e di osservare che il caso del treno di onde quadre normalizzate
un caso particolare di scelta di identit approssimata a supporto compatto.

Abbiamo visto nellEsempio 11.6.9 e nellEsercizio 11.6.11 che la serie


G converge puntualmente su tutto R ed uniformemente sui compatti per
ogni > 0, ma non uniformemente su R perch la somma una funzione
periodica, che non tende a zero allinnito, mentre le sue somme parziali
tendono tutte a zero allinnito (a velocit pi che polinomiale). Inoltre,
dallEsempio 12.3.3, sappiamo che G tende al treno di impulsi K in S
quando tende a innito. Per lo stesso argomento G non appartiene alla
classe di Schwartz, perch, essendo una funzione periodica, non tende a zero
allinnito. Ci proponiamo invece di approssimare K con funzioni in S,

12.4.

APPENDICE: APPROSSIMAZIONE DI K CON FUNZIONI IN S913

come abbiamo fatto nel Corollario 12.3.4 ma in maniera pi elegante: a


questo scopo introduciamo un cut-off in S per far tendere a zero G (x) per
x , come segue.

Esempio 12.3.7. (Il treno di Gaussiane smorzate una funzione in S


che approssima K in S .) Moltiplichiamo G (x) per una funzione cut-o,
cio una funzione con valori fra 0 e 1 che tende a zero allinnito con x, ma
per ogni x tende a 1 quando . Pertanto, leetto del cut-o scompare
gradualmente quando tende ad innito.
Ad esempio, scriviamo
K (x) = ex

2 /2

G (x)

X
2
2
x2 /2
= e
e (xn) .

Allora valgono i seguenti risultati:


(i) K appartiene a S;
(ii) lim+ K = K nel senso delle distribuzioni.
La dimostrazione molto laboriosa. Per il lettore interessato, la proponiamo come esercizio quasi totalmente svolto nellAppendice 12.4. Il lettore
non vivamente interessato dovrebbe ignorarla.

12.4

Appendice: un esercizio difficile, lapprossimazione del treno di impulsi con serie di


Gaussiane con cut-off

Dimostriamo in questa Appendice, molto laboriosa ma assolutamente non necessaria per la lettura del resto di questopera, la conclusione esposta alla ne
dellEsempio 12.3.7: nel senso delle distribuzioni si pu approssimare il treno
di impulsi K con funzioni di Schwartz K ottenute addolcendo con un cut-o
Gaussiano il treno di Gaussiane normalizzate. Il vero vantaggio di questi approssimanti che le loro trasformate di Fourier sono esattamente dello stesso
tipo (come mostriamo nella Proposizione 12.4.9 alla ne dellAppendice), e
b = K.
quindi rendono naturale il fatto che K

914 CAPITOLO 12. APPROSSIMANTI IN S DEL TRENO DI IMPULSI


Teorema 12.4.1. Con K come nellEsempio 12.3.7, K appartiene a S.

Dimostrazione. Poich gli addendi di K sono minori di quelli di G ovvio


che il test di Weierstrass (Teorema 1.3.29) si applica a K esattamente come
lo abbiamo applicato prima a G nellEsercizio 11.6.11, e ne segue la convergenza uniforme della serie di K in ogni compatto; grazie al fatto che il
cut-o tende a zero allinnito mentre G limitata si vede immediatamente
che la serie di di K converge uniformemente su
 tutto R. Se moltiplichiak
mo K per un polinomio, diciamo per 1 + |x| , il risultato lo stesso che

x2
moltiplicare G per 1 + |x|k e 2 : questa nuova funzione moltiplicatrice
continua a tendere a zero allinnito quando x , nonostante il fattore
2
2
polinomiale, perch ex / S. Quindi, per lo stesso ragionamento di prima, anche dopo tale moltiplicazione 1 + |x|k K (x) si mantiene limitata su
tutto R: abbiamo provato che p00 (K ) nito. Per completare la dimostrazione del fatto che K appartiene a S basta ora mostrare che pkl (K ) nito
per ogni k, l. Mostriamo che nito p0l K : da qui il caso generale segue
moltiplicando per un polinomio come abbiamo appena fatto.
Procediamo per induzione su l. Dobbiamo anzitutto mostrare che K (x)
derivabile. Per il Teorema di derivazione per serie uniformemente convergenti con le derivate (Teorema 1.3.35) basta mostrare che la serie delle deriva2
2
te uniformemente convergente. La derivata di e (xn) 22 (x
2
2
n)e (xn) . Vogliamo applicare il ragionamento dellEsercizio 11.6.11.
Questa volta gli addendi non sono positivi, ma dobbiamo prenderli in valore
assoluto per applicare il test di Weierstrass sopra citato. Allora il termine
generale diventa un multiplo di
2 (xn)2

u,n = 2 |(x n)|e

Per ora in x = n questo termine generale non ha pi il proprio punto di


massimo, anzi l si annulla. Dobbiamo dimostrare che comunque, per n > 0
e grande, il punto di massimo vicino a x = n. In eetti, consideriamo la
2 2
funzione dispari h(x) = xe x , ed osserviamo che si ha u = u,0 = |h|. La
derivata h ha due punti estremi, che corrispondono ai punti di minimo e di
massimo di h, ed ai due punti di massimo della funzione pari u. Calcolando
h si ottiene, a parte una costante, una funzione data da un esponenziale
moltiplicato per il fattore polinomiale 1 22x2 . Perci gli zeri di h , e
1
quindi di u , sono nei punti x = 2
. Questi sono quindi i punti di
massimo di u = u,0 . Ovviamente il traslato n u = u,n ha punti di massimo
1
in x = n + 2
. Per grande questi punti di massimo sono vicini a n.

12.4.

APPENDICE: APPROSSIMAZIONE DI K CON FUNZIONI IN S915

Allesterno dellintervallo delimitato dai due punti di massimo la funzione


u,n decrescente a destra e crescente a sinistra ( una funzione simmetrica
pari rispetto allasse x = n). Essa decresce allinnito a velocit pi che
polinomiale. Perci ora si pu applicare lo stesso ragionamento dellEsercizio
11.6.11, e concludere che la serie delle derivate dei termini di K converge
ancora uniformemente sui compatti, e quindi, come gi osservato, converge
ovunque ad una funzione limitata. Questo dimostra che p01 (K ) nito.
Come gi visto, la moltiplicazione per polinomi non cambia questultimo
risultato, perch una Gaussiana moltiplicata per qualsiasi polinomio continua
a tendere a zero allinnito: perci pk1 < per ogni k.
Dobbiamo svolgere lo stesso calcolo per tutte le derivate di ordine superiore, ma ci limitiamo a darne unidea. Per induzione su l si vede che la
derivata di ordine l di una Gaussiana la stessa Gaussiana moltiplicata per
un polinomio di grado l (questo ragionamento induttivo lasciato al lettore).
Una analisi simile a quella appena svolta, che omettiamo, porta a vedere che
2
2
gli zeri delle derivate successive della Gaussiana e (xn) si collocano in
prossimit di x = n se grande, ed allesterno dellintervallo che contiene gli zeri la derivata monotna. Largomento sopra illustrato si riapplica
quindi a tutte le derivate, e porta a concludere che pkl < per ogni k, l. In
realt largomento pi delicato, perch non esistono formule per trovare gli
zeri di polinomi di grado elevato, ma qui lo omettiamo.

Inne, completiamo questa esposizione mostrando un modo assai elegante


di approssimare nel senso delle distribuzioni il treno di impulsi con funzioni
di Schwartz.
Usando la notazione della Denizione 11.6.6, per ogni f > 0 S poniamo:

Definizione 12.4.2.
K (x) = ex

2 /2

x2

= e 2

G (x)

2 (xn)2

n=

e
hK , f i
=

ex

n=

2 /2

G (x)f (x) dx
2

x 2

n , f

916 CAPITOLO 12. APPROSSIMANTI IN S DEL TRENO DI IMPULSI


Teorema 12.4.3. (Approssimazione del treno di impulsi con treni
di Gaussiane smorzate.) lim+ K = K nel senso delle distribuzioni.
Dimostrazione. Basta provare che hK , f i

hK, f i per ogni f S

con f > 0. Infatti, ogni funzione f a valori complessi la combinazione


lineare delle sue parti reale ed immaginaria, e queste sono due funzioni reali ciascuna delle quali la somma delle proprie parti positiva e negativa.
Quindi f combinazione lineare di quattro funzioni non negative: per linearit suciente provare lenunciato per queste funzioni. Quindi in questa
dimostrazione assumiamo dora in poi che f > 0.
Sappiamo dallEsempio 12.3.3 che G K in S se , e daltra
2
2
parte il cut-o ex / tende a 1 per ogni x quando .
Indichiamo con la funzione caratteristica dellintervallo [ 12 , 12 ] (cio la funzione che vale 1 in questo intervallo e 0 altrove). Useremo la moltiplicazione
per per troncare le Gaussiane in modo da restringerle ad un intervallo nito
(quando la si usa per questo scopo, si chiama talvolta una funzione finestra). Allora i termini della serie allultimo membro nella Denizione 12.4.2
si possono scrivere come
D
E
x2 /2
e
n ( ) , f + n,
dove il resto n, verica le disuguaglianze del seguente enunciato.

Lemma 12.4.4. Se f S, f > 0, la funzione


D
E
2
2
n, ex / n ((1 ) ) , f

verifica lim0 n, = 0 uniformemente rispetto a n a velocit pi che poli2


nomiale: pi precisamente, n, < e /4 kf kL (R\[n 1 ,n+ 1 ]) .
2

Dimostrazione del Lemma. Si ha


D
E
x2 /2
e
n ((1 ) ) , f 6 k(1 ) k1 kf kL (R\[n 1 ,n+ 1 ]) .
2
2
(12.7)
Daltra parte,
Z
Z
(t) dt = 2
(t) dt.
k(1 ) k1 = 2
1
2

12.4.

APPENDICE: APPROSSIMAZIONE DI K CON FUNZIONI IN S917

2
Se t > 2 , allora (t) = et 6 2 e(t 2 ) , perch decresce pi veloceR

mente di et . Daltra parte, il calcolo diretto mostra che e(t 2 ) < 1.


2
Pertanto
Z

(t) dt <

Quindi da (12.7) si ottiene


2 /4

n, < e

2 /4

= e

kf kL (R\[n 1 ,n+ 1 ]) ,
2

e la norma a secondo membro tende a zero per n a velocit pi che


polinomiale perch f a decrescenza rapida.

Continuazione della dimostrazione del Teorema 12.4.3.


Dal Lemma 12.4.4 segue che, se scriviamo
k = hK , f i
e

x2 /2

j = e

n ( ) , f

n=

allora |k j | < kf k1 e( 2 ) . Quindi, per completare la dimostrazione,


basta studiare landamento asintotico di j .
Grazie alla moltiplicazione per la funzione finestra = [ 1 , 1 ] ed a causa
2 2
della traslazione di passo n si ha
*
+
X
1 2
2
e(n+ 2 ) / n ( ) , f 6 j
(12.8)
n=

1 2
/2

e(n 2 )

n ( ) , f

n=

(12.9)

Ora per completare la dimostrazione del Teorema basta provare la validit


del seguente passaggio al limite:
Lemma 12.4.5. lim+

n=

1 2
/2

e(n 2 )

n ( ) = K

918 CAPITOLO 12. APPROSSIMANTI IN S DEL TRENO DI IMPULSI


1 2

Dimostrazione. Osserviamo che, per ogni > 0, la successione e(n 2 ) /


a somma nita, cio appartiene a 1 (Denizione 1.7.1), e la somma tende
ad innito quando . Per ogni n,
1 2
/2

lim e(n 2 )

(12.10)

=1

Il limite non uniforme rispetto a n, ma per ogni n i valori sono monotni


crescenti al crescere di .
Daltra parte, la funzione n ( ) un peso positivo, che nellintervallo
[n 12 , n + 12 ] ha integrale kk1 tendente a 1 in maniera monotna
crescente quando . Consideriamo la funzione peso normalizzata
=


.
k k1

Dal Teorema della Media Integrale (Sezione 1.1) applicata alla media pesata
h, f i e dal il Teorema dei Valori Intermedi (Sezione 1.1) applicato alla funzione (continua!) f S segue che esistono punti n, R tali che la media
pesata h, f i coincide col valore assunto da f in n,. Pertanto
(12.11)

hn ( ) , f i = k k1 f (n,) .

Si noti che, come osservato nellEsempio 12.3.3, n, appartiene allintervallo


1
1
, n + 2
], e quindi
[n 2
lim n, = n.
(12.12)

Ora nalmente possiamo calcolare il limite del primo e dellultimo membro


della disuguaglianza (12.8) per . Osserviamo che in questi membri si
calcola la somma di serie i cui addendi sono due successioni entrambe maggiorate dalla successione hn ( ) , f i, e questa successione appartiene a
1 . Infatti si ha

n=

hn ( ) , f i =
6

n=

n=

perch f a decrescenza rapida.

(12.13)

h , n (f )i
kf kL (R\[n 1 ,n+ 1 ]) <
2

(12.14)

12.4.

APPENDICE: APPROSSIMAZIONE DI K CON FUNZIONI IN S919

Daltra parte, in Dconseguenza di (12.10), (12.11)


E e (12.12), il limite puntuale
1 2
2
per + di e(n 2 ) / n ( ) , f vale f (n). Quindi rimane solo
da provare che si pu passare al limite per + sotto il segno di serie.
Grazie alla dominazione 1 provata in (12.13), questo lecito per il Teorema
di convergenza dominata di Lebesgue (Teorema 1.9.54), che si applica non
solo ad integrali rispetto alla misura di Lebesgue, ma ad integrali rispetto
a misure di Borel qualsiasi, in particolare alla misura discreta sugli interi
(in tal caso le funzioni sono successioni e gli integrali diventano serie). Per
maggiori dettagli sulla teoria della misura si veda [22].

Abbiamo provato che K K in S per (Teorema 12.4.3). Dalla


continuit della trasformata di Fourier in S (Proposizione 11.11.4) segue che
c K
b in S . Nel resto di questa Appendice calcoliamo K
c e mostriamo
K

che converge a K in S : questo d una nuova dimostrazione dellidentit


b = K, apparentemente indipendente ma di fatto equivalente alla
(12.1), K
Formula di Somma di Poisson (Proposizione 10.3.1), la cui dimostrazione
viene in eetti in parte ricalcata in quelle dei prossimi enunciati.
Nota 12.4.6. Come nellEsempio 11.6.9 ed in tutta la Sezione 12.3, scriviamo
G (x) =

2 (xn)2

La serie uniformemente convergente, e di conseguenza G (x) una funzione


continua. Inoltre, come osservato nellEsempio 12.3.7, derivando termine a
termine questa serie un numero arbitrario di volte si ottiene ancora una serie
uniformemente convergente, e quindi G (x) una funzione C (Teorema
1.3.19 sulla derivazione di successioni di funzioni uniformemente convergenti
con le derivate). Ovviamente, G (x) periodica di periodo 1 e pari.

Corollario 12.4.7. Per ogni intero m, il coefficiente di Fourier m-simo della


funzione periodica G
c (m) = em2 /2 .
G
c (m) la trasformata di
Dimostrazione. Grazie alla Proposizione 10.2.3, G
2 x2
Fourier a = m della funzione = e
. Rammentiamo che denota
x2
la Gaussiana, (x) = e
(Sezione 8.3). Per la propriet di dilatazione della
c (m) = (
b m ) = em2 /2 .
trasformata di Fourier, Teorema 8.2.4 (iv), si ha

920 CAPITOLO 12. APPROSSIMANTI IN S DEL TRENO DI IMPULSI


Corollario 12.4.8.
G (x) =

2 /2

em

e2imx .

(12.15)

La serie converge uniformemente con tutte le sue derivate termine a termine.


Dimostrazione. In base al Corollario 12.4.7, la serie nellenunciato la serie di
Fourier di G , la quale converge uniformemente a G per il Corollario 5.12.4
del Teorema di Dirichlet, e per lo stesso motivo convergono uniformemente
tutte le serie delle derivate.

Pertanto ora abbiamo

K (x) ex

2 /2

G (x) = ex

2 /2

2 /2

em

e2imx .

Proposizione 12.4.9.
c () =
K

2 /2

em

2 (m)2

Dimostrazione. Poniamo ,m (x) ( x )( m


)e2imx = ex / em / e2imx .
P
Con questa notazione abbiamo K (x) = ,m (x), e quindi, scambiando
la serie uniformemente convergente con lintegrale di Fourier,

Daltra parte,

c () =
K

d
,m () .

(12.16)

m
m 2imx
)e
= (x)( )e2imx ,

dove, come al solito, indichiamo con la Gaussiana. In base alle propriet


di traslazione e di dilatazione della trasformata di Fourier, Teorema 8.2.4 (v)
e 8.2.4 (iv),
m d
m
d
) ( m) = b (( m)) ( ) .
(12.17)
,m () = (

Allora dalla Proposizione 8.3.2 segue


m 2 (m)2
2
2
2
2
d
)e
= em / e (m) .
(12.18)
,m () = (

Lenunciato si ottiene sostituendo (12.18) in (12.16).

,m (x) = ,0 (x)(

12.5. APPENDICE: RADICI DELLUNIT

12.5

921

Appendice. Progressioni equispaziate sul


cerchio unitario

Vogliamo presentare un lemma di natura geometrica sulle radici dellunit


nel piano complesso, che porta alla disuguaglianza


N

X
1


,
e2in 6

| sin |

n N
=

enunciata in Sezione 12.2.


Per R consideriamo il numero complesso di modulo uno w = e2i .
La successione w n si distribuisce in maniera equispaziata sul P
cerchio di ragn
gio1 nel piano complesso. Cosa possiamo dire delle somme N
n=0 w ? Se
P
N
= m1 per qualche intero m, allora w m = 1, e la somma n=0 w n vale 0 per
simmetria ( la somma delle radici dellunit di grado m). Per n > m la

Figura 12.1: Radici dellunit


successione w m si ripete per periodicit e quindi, per ogni k N,
mk
X

w n = 0.

n=0

Osserviamo anche che, al variare di n, |w n | limitato, perch la successione


periodica (di periodo m) w m assume solo un numero nito di valori (in eetti,
il valore massimo di |w n | si ha dopo un semiperiodo, cio per n = m2 ,sem
m
pari,
 m e altrimenti in prossimit di questo semiperiodo, cio per n = 2 e
n = 2 + 1: si veda la gura 12.2
chiaro che il massimo modulo delle somme parziali
k
X
n=0

wn

922 CAPITOLO 12. APPROSSIMANTI IN S DEL TRENO DI IMPULSI

Figura 12.2: Somme parziali della successione delle radici dellunit

Figura 12.3: Sottosuccessioni di una progressione sul cerchio unitario che si avvicinano
ad 1

tanto pi grande quanto pi piccolo langolo w (modulo 2).


k
Se ora si prende w = m
Q, di nuovo w n periodica, perch w m =
2im
2ik
e
=e
= 1 anche se in questo caso w n gira k volte intorno a 0 prima
di assumere di nuovo il valore 1. Ma a parte lordine con cui i punti w n si
equidistribuiscono sul cerchio, le conclusioni rimangono le stesse di prima.
Consideriamo il caso non periodico, cio quello in cui
/ Q. In questo
n
n
caso w 6= 1, per ogni n 6= 0, e la successione w si addensa sul cerchio in
maniera via via pi equidistribuita. Per ogni > 0 esiste un intero m tale
che |m | < mod 2, e quindi
|w m 1| = (cos m 1)2 + sin2 m < 1
(si veda la gura 12.3).

12.5. APPENDICE: RADICI DELLUNIT

923

La successione w n contiene tutti i punti che sono di angolo multiplo di m


mod 2, e si addensa quindi sul cerchio. Anche in questo caso si intuisce che
le somme parziali
N
X
wn = 0
n=0

devono essere limitate, da una costante che diventa pi grande quando w


mod 2 piccolo. Per questa intuizione deve essere dimostrata. pi
facile dimostrarla in maniera analitica, facendo uso della formula di somma
geometrica (Sezione 1.1) : se q C, q 6= 1,
N
X

qn =

n=0

1 q N +1
.
1q

(12.19)

Lemma 12.5.1. Sia w = e2i . Se non intero, per ogni N intero si ha


N
X
n=0

w n = eiN

sin(N + 1)
= eiN sinc((N + 1))
sin

e quindi

Invece, se intero , si ha



N

X
1


wn 6
.

| sin |

n=0
N
X

wn = N + 1 .

n=0

Dimostrazione. Da (12.19) segue


N
X
n=0

wn =

1 e2i(N +1)
.
1 e2i

Moltiplichiamo numeratore e denominatore pre ei ed il secondo membro


diventa
1 e2i(N +1)
1 i 1 e2i(N +1)
ei i
=

e
.
e
ei
2i
sin

924 CAPITOLO 12. APPROSSIMANTI IN S DEL TRENO DI IMPULSI


Ora moltiplichiamo e dividiamo per ei(N +1) , per ottenere
N
X
n=0

wn =

1 i i(N +1) ei(N +1) ei(N +1)


e
e
2i
sin

= eiN

sin (N + 1)
= eiN sinc((N + 1)) .
sin

Lultima asserzione dellenunciato ovvia.

Nota 12.5.2. Prendendo la parte reale di entrambi i lati dellidentit del


Lemma 12.5.1 otteniamo lespressione esplicita della somma di Dirichlet
N
X

cos(2n)

n=0

calcolata in Sezione 5.8. In eetti, la dimostrazione del Lemma 12.5.1


pressoch la stessa del calcolo svolto per la somma di Dirichlet nella Proposizione 5.8.2 (ed infatti il risultato si sarebbe potuto dedurre da quel calcolo:
i dettagli sono lasciati per esercizio).

Capitolo 13
Ricostruzione dei segnali dai loro
valori campionati ed aliasing
13.1

Il teorema del campionamento alla luce


della teoria delle distribuzioni

Abbiamo visto che possibile ricostruire esattamente una funzione a banda


limitata a partire dai suoi campioni su una griglia di campionamento sucientemente tta. Pi precisamente vale il Teorema del Campionamento, che
abbiamo dimostrato nel Corollario 10.4.6 e richiamiamo qui:
Teorema 2. (Teorema del Campionamento) Se fb() = 0 per ogni tale che
|| > c > 0, allora, scegliendo 6 21 c , vale lidentit, per ogni x R,
f (x) =

f (k ) sinc

k=

x


k .

Ora riscriviamo la dimostrazione di questo teorema visualizzandola alla luce


della teoria delle distribuzioni. Il vantaggio di questa nuova dimostrazione
che mostra quale tipo di distorsione si ottiene ricostruendo un segnale a partire dai suoi campioni su una griglia non sucientemente tta rispetto alla
banda di frequenza del segnale: questa distorsione, che si chiama aliasing,
viene illustrata in Sezione 13.5 pi sotto. In questo Capitolo analizziamo la
natura qualitativa di tale errore, visualizzando i segnali in maniera geometrica, tramite istogrammi (ossia come distribuzioni discrete): nel successivo
Capitolo 16 dedurremo stime quantitative.
925

926

CAPITOLO 13. RICOSTRUZIONE ED ALIASING

In realt quella che stiamo per dare non veramente una nuova dimostrazione, bens una visualizzazione geometrica della precedente: il lettore calorosamente invitato a vericare che lidea racchiusa nella visualizzazione geometrica segue passo passo largomento del Teorema dello sviluppo in serie di
Whittaker, Teorema 10.4.4.
Dimostrazione (nuova dimostrazione del Teorema del Campionamento).
campioniamo f su una griglia di passo . Faremo corrispondere a questo
campionamento la distribuzione ottenuta moltiplicando per f un treno di
impulsi K di passo . A questo scopo, rammentiamo la notazione stabilita
nel Corollario 12.1.2:
P
Notazione 13.1.1. K = nZ n = 1 1 K.

Esercizio 13.1.2. Ricaviamo la formula della precedente Notazione operando


dilatazioni sulle funzioni che approssimano la distribuzione treno di impulsi.
Svolgimento
Esplicitamente, scriviamo

X
K=
n

ed invece di introdurre un approssimante di K fabbricato traslando una identit approssimata, operiamo formalmente come se la delta (e quindi K) fosse
una funzione, utilizzando per 0 la notazione impropria introdotta a pagina
834. Pertanto riscriviamo
K(t)

0 (t n).

Allora la distribuzione associata alla funzione 1 K


t
n




X
t n
=
0

X
t
n ( ) =
0

n (t)

(13.1)

13.1. CAMPIONAMENTO E DISTRIBUZIONI

927

(la distribuzione
0 ha per supporto il valore 0 della sua variabile, e quindi

tn
ha per supporto listante t per cui tn
= 0, cio t = n ). In
0

questo modo abbiamo dilatato la funzione che rappresenta la distribuzione,


ma osserviamo che, vista come peso integrale, la funzione t 7 n (t/ ) ha
massa (a causa della contrazione di passo del suo graco, e quindi della
sua norma come misura), e quindi il risultato
K 1 := 1 K =

n ,

esattamente come calcolato rigorosamente nellEsempio 11.12.8.

Utilizziamo il Corollario 12.1.2



b
b
1 K = K

c = 1 K 1 ), e lEsercizio 11.8.5
(ossia K

f n = f (n )n

f S.

Consideriamo una funzione f Bc e la sua trasformata di Fourier fb. Nel


tracciare i graci di questo capitolo assumiamo che f sia a valori reali: se f
a valori complessi, si devono tracciare i graci separatamente per le parti
reale ed immaginaria di f . Assumiamo quindi f a valori reali. In tal caso
Re fb una funzione pari, e Im fb dispari (parte (iii) del Corollario 8.2.6).
I graci in Figura 13.1 rappresentano una tale funzione f Bc e la parte
reale della sua trasformata di Fourier:

Figura 13.1: Segnale a valori reali e parte reale delle sua trasformata di Fourier
Ora,
f K =

f (n )n

928

CAPITOLO 13. RICOSTRUZIONE ED ALIASING

perch, per lEsercizio 11.8.5,


f n (t) = f (n )n (t).
Quindi la distribuzione f K corrisponde alla successione dei valori campionati di passo : se disegniamo convenzionalmente le distribuzioni n come
segmenti verticali di altezza 1 a partire dal punto di ascissa n , il graco della distribuzione f K 1 consiste dei segmenti verticali sulla griglia di

campionamento alti no a toccare il graco di f (Figura 13.2).

f
fK 1

Figura 13.2: Campionamento: f K 1

Notazione 13.1.3. Chiamiamo questo graco listogramma della distribuzione discreta f K .


(Si noti che, ovviamente, listogramma di K ha altezza costantemente 1,
e quindi listogramma del dilatato K ha altezza 1; pertanto quello della sua
trasformata di Fourier 1 K 1 ha altezza 1 ).

Qual la trasformata di Fourier di questa distribuzione dei valori campionati? Sappiamo che
c = 1 K 1
K

per il Corollario 12.1.2.
Ora, se di nuovo rappresentiamo le delta con segmenti verticali sul graco,
otteniamo la Figura 13.3.
Abbiamo illustrato la trasformata di Fourier di K (e quindi di K1/ ). Da qui
ricaviamo la trasformata di Fourier della distribuzione dei valori campionati:
Lemma 13.1.4.
fd
K =

n=

n fb

13.1. CAMPIONAMENTO E DISTRIBUZIONI

929

K1

c = 1 K 1
Figura 13.3: K

Dimostrazione.
c = fb 1 K 1
fd
K = fb K

1 X b
1 X
n
=
n fb
f =
n=
n=

La prima uguaglianza segue dal Corollario 11.13.3 (ii); la seconda dallultima identit del Corollario 12.1.2 (applicata scambiando con 1 ); la terza
dalla identit (13.1) per K (di nuovo applicata scambiando con 1 ); la
quarta uguaglianza, inne, lespressione delloperatore di traslazione su S

in termini di convoluzione con la delta (Nota 11.14.4).


In altri termini,

1 X b
n
d
f K () =
.
f
n=

Rammentiamo che f appartiene a Bc , e quindi suppfb [c , c ]. Pertanto



h
ni
n
n
= supp( n fb) c + , c +
.
supp fb

Ora, se prendiamo =

1
,
2c

abbiamo

n
= 2nc

930

CAPITOLO 13. RICOSTRUZIONE ED ALIASING

h
ni
n
= [(2n 1)c , (2n + 1)c ] .
c + , c +

Al variare di n gli intervalli [(2n 1)c , (2n + 1)c ] sono contigui ma non si
sovrappongono: infatti, se Jn := [(2n 1)c , (2n + 1)c ], il punto nale di
Jn (2n+ 1)c ed il punto iniziale di Jn+1 lo stesso punto (2(n+ 1) 1)c =
(2n + 1)c .
Supponiamo ora < 21 c . Poich il supporto di fb un intervallo di
lunghezza 2c , in questo caso i traslati di fb di passo 1 > 2c hanno ancora
supporti disgiunti.
f^ * K

f K1

f^

Figura 13.4: Campionamento adeguato, <

Se invece >

1
,
2c

1
2c :

le repliche di fb sono separate

non pi cos. Si vedano i graci in Figura 13.5.


1

fK 1

Figura 13.5: Campionamento inadeguato, >

f^
c

1
2c :

le repliche di fb si sovrappongono

Per dimostrare il teorema del campionamento dobbiamo considerare, in


virt della sua ipotesi, solo il caso del campionamento adeguato: 6 21 c .
In questo caso, la trasformata di Fourier della distribuzione f K 1 dei dati

campionati una distribuzione di repliche di fb traslate di 1 e dilatate di un


fattore . Queste repliche hanno supporti disgiunti. Moltiplichiamo questa
trasformata di Fourier per la funzione caratteristica [ 1 , 1 ] dellintervallo
centrato in 0 di lunghezza

1
,

2 2

cio della finestra 21 6 6

1
,
2

che un

13.1. CAMPIONAMENTO E DISTRIBUZIONI

931

ltro passa basso (o passa banda: si veda losservazione dopo la denizione


del ltro in (10.12)) di frequenza di taglio 21 : cos, a parte una dilatazione di
ampiezza , ritroviamo esattamente fb (Figura 13.6). Dopo aver applicato
f^ * K

f
c

Figura 13.6: Campionamento adeguato: il filtraggio restituisce fb


il ltro applichiamo lantitrasformata di Fourier. Questo signica calcolare
lantitrasformata di Fourier di fb, e quindi ricostruire esattamente il segnale
originale f . Vediamo come si ottiene la ricostruzione. La moltiplicazione di
fd
K con [ 1 , 1 ] eettuata nel dominio delle frequenze, equivale, come gi
2 2
visto prima (Corollario 11.13.3 (ii)), a convolvere la distribuzione dei valori
campionati f K con lantitrasformata di Fourier di [ 1 , 1 ] : che sinc( x)
2 2
(Esercizio 10.1.5). Ma questo precisamente lenunciato del teorema: la
dimostrazione completata.

Per illustrare gracamente lultima fase della dimostrazione, tracciamo i


graci nel caso limite = 21 c (Figura 13.7).
Osserviamo che la funzione sinc(2c x) ottenuta antitrasformando il ltro
passa basso (o passa banda) [c ,c ] esattamente quel dilatato
n della sinc che
o
vale 1 in 0 e 0 sugli altri punti della griglia di campionamento
come illustrato nella Nota 10.4.8.
f K1

[-

f^ * K

n
2c

:nZ ,

, 21]

f
c

sinc(2ct)

=2

Figura 13.7: Ricostruzione al passo di campionamento corrispondente alla frequenza di


taglio

932

CAPITOLO 13. RICOSTRUZIONE ED ALIASING

Per uso futuro, enucleiamo in un corollario separato il fatto che lenunciato


del Lemma 13.1.4 il reciproco della relazione fra discretezza di distribuzioni
e periodicit delle loro trasformate di Fourier presentata nel Corollario 12.2.2.
Corollario 13.1.5. (Distribuzioni impulsive equispaziate hanno trasformata di Fourier periodica.) La trasformata di Fourier di una distribuzione impulsiva T equispaziata di passo periodica di periodo 1 . Pi
precisamente, sia c = 1 , e sia cn C una successione tale che, per qualche
f Bc , si abbia cn =Pf (n ). Allora la trasformata di Fourier della distribu1
n
zione impulsiva T =
n= cn periodica di periodo (ed esattamente
la distribuzione data dalla funzione somma della serie trigonometrica con
coefficienti di Fourier cn ).
Osserviamo che, a prima vista, la derivazione del Corollario a partire dal
Lemma 13.1.4 non sembra ben posta. Occorre infatti scegliere una funzione
f tale che cn = f (n ), e si ottiene che Tb la periodicizzazione di passo
c = 1 di fb. Ma la scelta di f tale che cn = f (n ) non sembra unica,
ed il risultato dipende da tale scelta! Invece, sotto la condizione f Bc ,
la scelta unica, per il Teorema del Campionamento che abbiamo appena
ridimostrato, e quindi il risultato ben posto. Notiamo
Panche che lultima
n
asserzione del Corollario ovvia: dal momento che T =
n= cn , in base
allEsercizio 11.12.2 (i) abbiamo
Tb =

n=

cn cn =

cn e2int/ .

n=

Nota 13.1.6. (Sviluppi in serie di Fourier visti come caso particolare


di trasformate di Fourier di distribuzioni.) In base al Corollario 12.2.2,
la trasformata di Fourier di una funzione in f L1 , considerata come distribuzione, la distribuzione discreta equispaziata data dalla successione dei
coecienti di Fourier di f ; viceversa, grazie al Corollario 13.1.5, la trasformata di Fourier di questa successione dei coecienti di Fourier la funzione
periodica che li ha generati. In altre parole, questi Corollari immergono la
teoria degli sviluppi in serie di Fourier nel quadro generale della trasformata
di Fourier di distribuzioni e della sua inversione.

13.2. RICOSTRUZIONE NUMERICA INGENUA

13.2

933

Ricostruzione numerica del segnale: modo


ingenuo

La dimostrazione del teorema del campionamento illustrata nei disegni precedenti pu portare ad un malinteso. Lidea si basa sulla visualizzazione
del procedimento di campionamento tramite la moltiplicazione con il treno
di impulsi K 1 , dove = 21 c (adeguatamente piccolo), seguita dal ltraggio

della trasformata di Fourier con un ltro passa basso (di banda 2c , cio di
frequenza di taglio c ) e poi dalla antitrasformata di Fourier. Ma se davvero volessimo utilizzare numericamente questa strategia passo per passo, la
complessit del calcolo ce lo impedirebbe. Infatti, per calcolare la antitrasformata di Fourier anche per un solo valore di t, dobbiamo calcolare (e cio
approssimare numericamente con precisione adeguata) un integrale da
a ! In ogni caso, il procedimento non fattibile per una ragione teorica:
normalmente noi conosciamo, grazie ai dati provenienti dagli strumenti di
misura, i campioni del segnale, ma non il segnale stesso per tutti gli altri
valori di t ( proprio quello che vogliamo conoscere). Quindi, anche se fossimo disposti ad aspettare un tempo smisurato per il calcolo di fb, in loinea
di principio non potremmo farlo con precisione, perch non conosciamo f , e
quindi non sappiamo calcolare fb. In realt questa ragione teorica si aggira
nellapprossimazione numerica, perch, come gi visto nella dimostrazione
euristica della Formula di Inversione di Fourier (Teorema 8.1.1 e Corollario
8.1.3), la trasformata di Fourier fb si approssima numericamente a partire dai
valori di f su una griglia equispaziata e possiamo usare proprio la griglia di
campionamento dove conosciamo i valori di f (sono i dati campionati). Per,
il fatto che il passo di campionamento 6 21 c per ricostruire esattamente
il segnale di solito assai pi lungo di quanto invece non serva per una buona
approssimazione numerica di fb.

Nota 13.2.1. (Adeguatezza dei dati del teorema di campionamento di


fb.) Per capire la ragione dellultima asserzione, si pensi che, se il segnale f

coincide con [1,1] (t) = sinc(2t), il campionamento suciente per la ricostruzione a passi = 21 c = 12 . Sulla griglia di campionamento t = n , quindi, i
)
valori della sinc sono i numeri 1 per n = 0 (ossia t = 0) e sin(2n
= sin(n)
=0
2n
n
per n 6= 0: certo questa successione appare del tutto inadeguata per il calcolo tramite somme di Riemann dellintegrale di f (t) = sinc(2t), cio di fb(0),
perch lapprossimazione con la corrispondente funzione semplice, illustrata

934

CAPITOLO 13. RICOSTRUZIONE ED ALIASING

Figura 13.8: Approssimazione della sinc con una funzione semplice dello stesso passo

nel graco in Figura 13.8, visibilmente imprecisa. Eppure, ci nonostante, questi valori campionati sono sucienti a ricostruire il segnale tramite il
procedimento svolto nel Teorema del Campionamento.

Perci, anche se volessimo utilizzare i valori campionati per approssimare


numericamente fb, dovremmo scegliere un passo di campionamento cos pi
tto di quanto non sia necessario per il Teorema del Campionamento che il
tempo si esecuzione aumenterebbe in maniera ancora pi pesante.
Nota 13.2.2. Se vogliamo approssimare numericamente una trasformata di
Fourier su N punti, dobbiamo usare N dati. Per ciascun punto la trasformata
di Fourier richiede allora N moltiplicazioni (e N 1 somme) e quindi il solo
calcolo di fb ha complessit N 2 . Poi, per antitrasformare, ci vogliano altre
N 2 operazioni. Accorciare il passo di campionamento signica aumentare
N (proporzionalmente a 1 e quindi far crescere i tempi come 2N 2 , un ordine
di crescita numericamente non controllabile, perch troppo elevato.

13.3

Ricostruzione del segnale: modo corretto

Per fortuna, non necessario approssimare numericamente ogni passaggio


dellidea che porta alla dimostrazione del Teorema di Campionamento. Non
occorre calcolare fb e poi ltrare e antitrasformare: basta ricordare che, alla
ne, tutto questo equivalente a convolvere i dati campionati con i traslati
di una opportuna funzione sinc (quella che si annulla su tutta la griglia di
campionamento eccetto che per t = 0). Perci basta prendere la successione
f (n ) dei dati campionati e calcolare numericamente, per ogni valore di t che

13.3. RICOSTRUZIONE NUMERICA CORRETTA

935

ci interessa, la serie
f (t) =

n=

f (n ) sinc(2c t n) =

n=

f (n ) sinc

t n

(13.2)

Stiamo supponendo che f sia a valori reali (altrimenti applichiamo separatamente questo sviluppo alla parte reale ed alla parte immaginaria). Possiamo
separare f nella dierenza delle sue parti positiva e negativa, f = u v, con
u e v > 0, ed applicare (13.2) separatamente a u e v; od equivalentemente,
senza perdita di generalit,
supporre
che f sia non negativa. Invece
 possiamo

tn
t
la successione sinc
= sinc n a segni alterni (tranne che vicino
allorigine), perch la funzione sinc si annulla in {n Z, n 6= 0} e cambia di
segno da un intervallo [n 1, n] al successivo (tranne, appunto, per n = 0).
Spezzando la serie doppia in (13.2) nelle serie semplici con indici positivi e
negativi, troviamo quindi due serie a segni alterni. Per ciascuna di esse, per
ogni M > 0, il resto M-simo di questa serie si maggiora con il primo termine
non sommato, grazie al Teorema di Leibnitz sulle serie numeriche a segni
alterni (Sezione 1.1). Pertanto si ottiene:





M


X

t M



f (n ) sinc(2c t n) 6 2 f (M ) sinc
f (t)
.

n=M
1
|x|

per |x| > 1. Perci il resto M-simo tende a zero almeno


come M1 |f (M )|: la velocit di decrescenza aumenta con la regolarit di fb,
grazie al Corollario 8.2.8, ma comunque almeno dellordine di O( M1 ). Perci
la serie fornisce una buona approssimazione numerica del segnale originale
anche se si sommano non molti dei suoi termini: ad esempio, per una precisione dellordine di 103 nel ricostruire un segnale di ampiezza non superiore
a 1 , occorre sommare al massimo 103 termini, e cos via.
Ora vediamo come ricostruire in maniera rapida il segnale in un punto t
generico ottimizzando la strategia di calcolo della somma della serie.
In realt si tratta di eseguire una convoluzione di due successioni. Infatti



X
t n
f (t) =
f (n ) sinc
= u vt

n=
Ma | sinc(x)| 6



dove u = {f (n )}nZ la successione dei valori campionati, e vt = t+n

nZ
la successione del ltro sinc. Per quanto appena osservato, basta sommare

936

CAPITOLO 13. RICOSTRUZIONE ED ALIASING

solo i primi termini, e quindi il procedimento numerico veloce. Si osservi che


non necessario calcolare f (t) per t = n , perch nei punti di campionamento
il valore di f , f (n ) ci viene gi fornito come dato di partenza (ed in eetti
il calcolo porterebbe ad unidentit), perch la sinc che usiamo vale 0 per
t = n , n 6= 0, e vale 1 per t = 0. Dobbiamo calcolare f (t) per gli altri valori
di t.
Una strategia numerica tipica quella della bisezione, cio dellinterpolazione al punto medio. Cominciamo a calcolare
 f (t) per i punti medi della
griglia di campionamento, cio per tn = n + 12 . Per questo basta tabulare
una volta per tutte i valori di sinc t per t = n + 21 , n Z (osserviamo di
nuovo che, per t = n 6= 0, si ha sinc t = 0 e per t = 0 si ha sinc t = 1).
Allora il calcolo della convoluzione di cui sopra ci fornisce il valore ricostruito del segnale a tutti i punti di mezzo della griglia di campionamento. Ora,
usando questi numeri come nuovi dati e ripetendo loperazione a "frequenza
doppia" cio a passo di incremento temporale pari a met, troviamo i valori ricostruiti ai multipli di 14 , e cos via. Ovviamente in queste iterazioni
gli errori numerici si cumulano, ma questo naturale, perch pi iteriamo e
pi troviamo valori ricostruiti in nuovi punti, ma i valori iniziali non sono
aumentati, sono rimasti sempre gli stessi, e quindi la precisione del risultato
cala perch il numero di dati da cui si interpola diventa progressivamente
pi piccolo del numero dei risultati che si vogliono ottenere.
 Tabuliamo qui,
per comodit del lettore, i primi 70 valori di sinc n + 21 (basta elencare i
1
valori per 0 < n < 35, perch sinc una funzione pari). Poich 70
< 0.005,
essi sono sucienti per ricostruire segnali di ampiezza non superiore ad uno
a meno di due cifre decimali esatte.

13.4

Il teorema del campionamento per funzioni localmente integrabili a crescita limitata, o per distribuzioni

Supponiamo che il segnale f sia una funzione localmente integrabile a crescita polinomiale. Allora f S e quindi ha senso la sua trasformata di Fourier
fb S . Per dare alla nozione di campionamento della funzione f il signicato sico di media dei valori del segnale presentato in Sezione 11.1, possiamo
assumere inoltre che f sia continua. In ogni caso, questo segue dallultima
ipotesi necessaria, e cio che f sia a banda limitata: supp fb [c , c ] cio

13.4. CAMPIONAMENTO DI DISTRIBUZIONI


|x|
0.5
1.5
2.5
3.5
4.5
5.5
6.5
7.5
8.5

sinc x
0.6366
-0.2122
0.1273
-0.0909
0.0707
-0.0579
0.0490
-0.0424
0.0374

|x|
9.5
10.5
11.5
12.5
13.5
14.5
15.5
16.5
17.5

sinc x
-0.3335
0.0303
-0.0277
0.0255
-0.0236
0.0220
-0.0205
0.0193
-0.0182

|x|
18.5
19.5
20.5
21.5
22.5
23.5
24.5
25.5
26.5

sinc x
0.0172
-0.0163
0.0155
-0.0148
0.0141
-0.0135
0.0130
-0.0125
0.0120

937
|x|
27.5
28.5
29.5
30.5
31.5
32.5
33.5
34.5
35.5

sinc x
-0.0116
0.0112
-0.0108
0.0104
-0.0101
0.0098
-0.0095
0.0092
-0.0090

Tabella 13.1: Tabella dei valori della sinc ai punti semi-interi, per la ricostruzione
interpolata ai punti medi della griglia di campionamento

E
fb, g = 0 per ogni g S con supp g O dove O un aperto disgiunto da
[c , c ]. Come visto nel Corollario 10.4.2, da questo segue che f C (R).
In particolare, fb continua a supporto compatto, e quindi in L1 (R), il che
fa s che la sua periodicizzazione converga in L1 (Lemma 10.2.2) e quindi
puntualmente quasi ovunque, e ci permette di ripetere la dimostrazione del
teorema del campionamento. Anzi di pi: possiamo anche assumere che fb
sia non una funzione L1 bens una distribuzione approssimabile con funzioni
L1 a supporto compatto che siano la trasformata di Fourier di funzioni f localmente integrabili a crescita polinomiale. Infatti se cos il procedimento
di ricostruzione ci restituisce questi approssimanti f , e quindi il teorema si
applica nel senso della approssimazione in S . Pi in particolare, se il segnale
la somma di una funzione f B 1 pi un ronzio, ossia un esponenziale
2
0 (t) := e2i0 t , la trasformata di Fourier di questo segnale la distribuzione fb+ 0 . Ora, se la delta viene approssimata (nel dominio della frequenza,
nel senso delle distribuzioni) con approssimanti di Schwartz h , ossia con
le distribuzioni F (f ) = h f , allora viene approssimato, nel dominio

del tempo, con i cuto h , e h tende a 1 uniformemente sui compatti.


Riassumendo, la trasformata di Fourier del segnale viene approssimata da
fb + h , e quindi il segnale viene approssimato uniformemente sui compatti,
e quindi puntualmente (nel dominio del tempo), dalle antitrasformate degli

approssimanti, f + h .
Si noti invece che non possiamo aggiungere a f una delta di Dirac, perch

938

CAPITOLO 13. RICOSTRUZIONE ED ALIASING

se lo facessimo
P non avrebbe pi senso campionare il segnale: listogramma f K := nZ f (n) n (Notazione 13.1.3) ha senso solo quando f una
funzione.
Problema: Per tutti questi segnali f vale ancora il Teorema del Campionamento?
Ecco la risposta. Se il passo di campionamento minore del passo
critico c = 21 c , allora il Teorema vale: la dimostrazione si ripete parola per
parola.
Per, se = c = 21 c allora c una dicolt. Poich fb una distribuzione, fb
potrebbe contenere, come componente, una distribuzione impulsiva al punto
c : cio, ad esempio, fb potrebbe spezzarsi come la somma fb = q + c , dove
C e q una funzione localmente integrabile a crescita polinomiale con
supporto in (c , c ). Qual la conseguenza di queste componenti?
Questo dipende dalla parit di fb. Scriviamo f = u + iv con u = Re f e
v = Im f nel senso della Denizione 9.13 del Capitolo 2. Allora sappiamo
che u
b pari e b
v dispari (Corollario 8.2.6 (iii)).
Perci, se poniamo h = Re q, g = Im q, = Re , = Im , nel nostro
esempio si ha
u
b = h + c + c
vb = g + c c

con R h, pari, supp h (c , c )


con R g, dispari, supp g (c , c )

Qui pensiamo a h e g come funzioni, ma largomento vale, in generale, per


distribuzioni. Ora ltriamo u
b, b
v con il ltro passa-basso [c ,c ] . Il problema
a questo punto : come scegliamo il valore di [c ,c ] per = c ? In
accordo con la teoria di Fourier per funzioni periodiche sarebbe naturale
scegliere questo valore cos:
[c ,c ] =

1
2

perch lo sviluppo in serie di Fourier (che noi implicitamente utilizziamo per


\1 ) converge al
calcolare la trasformata inversa della funzione periodica (uK

valore 12 ai punti di salto. In ogni caso siamo liberi di fare questa scelta,
perch alla ne questo ltraggio serve solo come passo preliminare prima di
eettuare la trasformata inversa di Fourier, dove il valore nei singoli punti
c non inuenza il risutato dellintegrale di Fourier. Allora facciamo questa

13.4. CAMPIONAMENTO DI DISTRIBUZIONI

939

scelta. Pertanto scriviamo di nuovo c = 21 c e studiamo separatamente la


parte reale e la parte immaginaria del segnale.
Parte reale del segnale.
caso si ha

( = c )
2 c + 2 c = c
[
h
(c < < c ) (13.3)
[c ,c ] uK 1 =

( = c )
+
=

c
2 c
2 c

[1 = (uK2c ) la somma di due contributi


perch ai punti c il valore di uK

non nulli, uno proveniente da u


b (pari a c ) e laltro proveniente dalla sua
b( 2c ) (pari a c ( 2c ) = c ). Questi due
replica u
b( 1 ) = u
valori vengono divisi per due dal ltro [c ,c ] , che nel punto c vale 21 e poi
sommati. Il risultato che al punto c la funzione
\
[c ,c ] uK
2c
ha una componente impulsiva pari a c . Lo stesso accade, per parit, al
punto = c . Pertanto, come si vede da (13.3)
\
[c ,c ] uK
2c =

u
bh + c + c
0

|| 6 c
|| > c

e le componenti impulsive ai punti critici non si perdono e vengono ricostruite correttamente: esse vengono dimezzate dal ltro ma si raddoppiano
sommandosi.
Nota 13.4.1. Queste componenti impulsive corrispondono ad una componente
del segnale che non tende a zero per t , pari a (c + c ) =
cos(2c t). Si tratta di una componente monocromatica costante, cio
un ronzio. Di solito non si vogliono ricosturire i ronzii! Ma il teorema del
campionamento tratta questo ronzio come una componente del segnale, e la
ricostruisce.

Illustriamo questa parte dellargomento con un graco (Figura 13.9).


Parte immaginaria del segnale.
Qui le cose vanno diversamente, perch la trasformata di Fourier della
parte immaginaria di f una distribuzione dispari (Corollario 9.14 (ii)).

940

CAPITOLO 13. RICOSTRUZIONE ED ALIASING

Perci le componenti impulsive alle frequenza c non si sommano, ma si


sottraggono, cancellandosi a vicenda: b
v() = h() + c () c (), e
v () + b
b
v ( 2c ) =
+
=
+

h() + c () c ()
h( 2c ) + c ( 2c ) c ( 2c )
h() + h( 2c ) c () + c () c ()
3c ()

perch c ( 2c ) = c () e c ( 2c ) = 3c ().
Quindi la somma di due repliche di b
v traslate in maniera da essere a supporti consecutivi produce una cancellazione della componente impulsiva alla
frequenza di separazione dei corrispondenti supporti. La divisione per due
che il ltro produce ai punti c ora inessenziale: le componenti impulsive
ai bordi sono ormai nulle, e non vengono ricostruite. Quindi una parte del segnale si perde, e precisamente la componente (c + c ) = 2 sin(2c t).
Si perde cio la parte dispari della componente di ronzio alla frequenza di
taglio. (Si veda la Figura 13.10.)

Figura 13.9: La ricostruzione di Re f preserva le componenti impulsive alla frequenza


di taglio

Figura 13.10: La ricostruzione di Im f annulla componenti impulsive alla frequenza di


taglio

13.4. CAMPIONAMENTO DI DISTRIBUZIONI

941

Lenunciato del Teorema del Campionamento per questa classe di distribuzioni diventa quindi il seguente:
Teorema 13.4.2. (Teorema del campionamento per segnali a banda
limitata a crescita polinomiale (funzioni o distribuzioni). Sia f un
segnale di questo tipo, con supp fb [c , c ], ed indichiamo con c = 21 c la
frequenza di taglio (cio la frequenza massima, quindi la met della larghezza
di banda). Allora f ricostruibile esattamente mediante la convoluzione



X
t nc
f (t) =
f (nc ) sinc
c
n=

a partire dai valori campionati {f (nc )}


, eccetto che per la parte dispari
2ic t
delle componenti oscillatorie e
alla frequenza di taglio c (ossia delle
componenti che sono multipli di sin(2ic t).
Nota 13.4.3. La parte dispari delle componenti oscillatorie in questo enunciato consiste esattamente delle componenti oscillatorie a frequenza c che
si annullano ai punti di campionamento. Infatti, questo segue dal prossimo
esercizio.

Esercizio 13.4.4. Consideriamo la componente oscillatoria a frequenza c . In


forma reale essa si scrive u(t) = cos(2c t ), dove un ritardo di fase.
Mostrare che, se si scrive u come somma di una parte pari ed una parte
dispari, u = up + ud allora ai punti di campionamento tn = nc = 2nc si ha
u(t) = up (tn ) e ud (tn ) = 0 per ogni n.

Svolgimento. Le parti pari e dispari di u e v sono date da


up (t) =

u(t) + u(t)
2

ud (t) =

u(t) u(t)
.
2

Ma
u(tn ) =
=
=
=

cos(2c tn )
cos(n )
(1)n cos()
(1)n cos .

942

CAPITOLO 13. RICOSTRUZIONE ED ALIASING

per periodicit (il traslato del coseno di passo uguale al semiperiodo lopposto del coseno, perch cos( ) = cos()). Quindi u(tn ) = (1)n cos().
Daltra parte
u(tn ) =
=
=
=
=
=

Perci
up (tn ) =

cos(2c tn )
cos(n )
cos(2n n )
cos(n )
(1)n cos()
(1)n cos = u(tn ) .

per periodicit`a

u(tn ) + u(tn )
2u(tn )
=
= u(tn ) .
2
2

Invece
ud (tn ) =

0
u(tn ) u(tn )
= = 0.
2
2

13.5

Ricostruzione del segnale a partire da un


campionamento inadeguato: aliasing

Ritorniamo ora a considerare il caso del sottocampionamento, cio del campionamento con passo troppo lungo. Supponiamo che fb sia supportata in
[c , c ], ma scegliamo un passo di campionamento > 21 c . Allora il ltraggio del ltro passa-basso [ 1 , 1 ] non riesce a isolare una unica replica
2 2
b
della trasformata di Fourier f perch i traslati di passo 1 < 2c di fb hanno
supporti che si sovrappongono come nella Figura 13.5 (e nella parte alta della Figura 13.13 ). Perci lazione del ltro seleziona una replica del graco
di fb sommata alle code delle repliche adiacenti. Se ad esempio c = 1.2 e
1
= 0.5 > 12 1.2
il supporto di [ 1 , 1 ] lintervallo [1, 1] e lazione del ltro
2 2
illustrata in Figura 13.13.

13.5. ALIASING

943

f^
c

filtraggio con =

[- 21 , 21]

Figura 13.11: Campionamento inadeguato: filtraggio con aliasing

Le aree tratteggiate indicano le zone (gli intervalli [ 21 , 21 + 21 (c


1
)] = [ 21 , c 41 ] dove le copie traslate consecutive del graco di fb si
2
sovrappongono. In quelle zone il risultato, dopo il ltraggio, dierisce da fb.
Quindi linversione di Fourier non ricostruisce il segnale originale.
Si noti che, nel dominio della frequenza, lerrore dovuto a valori di
b
f K a frequenza in valore assoluto maggiore di c che si riversano su
frequenze minori di c . Per questo motivo questo errore si chiama aliasing
(in italiano si potrebbe dire mascheramento): frequenze elevate si mascherano
come frequenze pi basse.
Nelle applicazioni, evidente come laliasing si manifesti nella ricostruzione di segnali acustici. Ad esempio, il nostro orecchio non percepisce frequenze
maggiori di 16 KHz e la maggior parte degli strumenti musicali (eccetto i sintetizzatori elettronici) non ha una emissione apprezzabile oltre i 5 o 6 KHz
(neanche i sintetizzatori normalmente sono utilizzati per generare frequenze
cos elevate). Ovviamente lorecchio ode anche frequenze ottenute dallinterferenza tra due diverse sorgenti. Poich e2i1 t e2i2 t = e2i(1 2 )t , si
ha
sin 2(1 2 )t = sin(21 t) cos(22t) + cos(21 t) sin(22 t)
= combinazione lineare di e2i1 t , e2i2 t
Quindi, se il segnale dellorchestra contenesse una frequenza, diciamo, di 20

944

CAPITOLO 13. RICOSTRUZIONE ED ALIASING

KHz e simultaneamente un violino o un pianoforte emettessero un suono con


componenti in frequenza di ampiezza apprezzabile intorno ai 4KHz, lorecchio potrebbe percepire una traccia di quella componente in frequenza a 20
KHz attraverso la sua interferenza a 20-4=16 KHz con larmonica emessa dal
violino o dal pianoforte.
Per non perdere nulla del segnale originale, quindi, non ci si limita a ricostruirlo esattamente nella banda di frequenza fono a 16 KHz , si va oltre: si
deciso di riprodurre senza perdita i segnali musicali con spettro di frequenza
nullo oltre i 22 KHz, per sicurezza. Quindi la frequenza di campionamento
di 44 KHz (= 2c ). Questa la soglia di campionamento per la registrazione
digitale (su compact disc).
Ma laliasing si presenta anche in molti altri contesti, ad esempio nella
graca al computer. Supponiamo di voler tracciare una retta su un monitor.
Il monitor pu accendere i fosfori che sono pi prossimi alla retta, ma poich i
suoi fosfori sono disposti su una griglia regolare, il disegno appare scalettato.
La scalettatura tanto maggiore quanto meno tta la griglia dei fosfori (cio
quanto meno elevata la risoluzione del monitor. A questo proposito si veda
lalgoritmo di Bressenham di tracciamento delle linee in Computer Graphics,
che cerca di ridurre questo fenomeno di aliasing. Il reticolo dei fosfori si pu
pensare come una porzione del reticolo quadrato di passo , cio Z Z.
La retta a pendenza m = 1 viene riprodotta correttamente: si accendono
i fosfori sulla diagonale. La retta a pendenza m = 12 passa per i punti
del reticolo multipli del vettore (2, 1), che quindi si accendono; per questi
fosfori sono distanziati di due passi in ascissa e quindi si accendono anche
fosfori intermedi, quelli con ascisse dispari la cui posizione pi prossima
alla retta: ad esempio quelli nelle posizioni (1, 0) e (1, 1). Per convenzione,
in un monitor il verso dellasse delle ordinate crescente verso il basso per
rispettare lordine di scansione da sinistra a destra e dallalto al basso, come
in un libro: quindi il disegno andrebbe ribaltato rispetto allasse delle ascisse.
La scalettatura un fenomeno di aliasing. La frequenza elevata qui
legata alla pendenza della retta, ed il campionamento inadeguato al fatto
che il reticolo dei fosfori non sucientemente tto.
Unaltra applicazione dellaliasing leffetto Moir, che si presenta quando un reticolo viene sovrapposto ad un altro reticolo ruotato, o a un altro
pattern regolare (magari curvilineo). Le zone dove i due reticoli si sorano ed incontrano (dal nostro punto di vista di visuale) danno luogo ad una
maggiore densit di copertura della luce e ci appaiono pi scure. A secon-

13.5. ALIASING

945

Figura 13.12: Scalettatura di segmenti obliqui in un reticolo

da dellangolo di rotazione fra i due reticoli, o comunque alla geometria dal


loro pattern, questa fatto genera bande scure di forme geometriche non facilmente calcolabili, ma comunque di solito di ampiezza assai pi grande del
passo dei reticoli: anche in questo caso laliasing produce riversamento di
alte frequenze su basse frequenze, e quindi bande spurie ampie (cio di bassa
frequenza). Qui il campionamento dato dal passo dei due reticoli, che non
suciente a risolvere nitidamente (senza scalettature, quindi senza aumento
dello spessore apparente) la zona di sovrapposizione fra i due.

Figura 13.13: Esempi di effetto Moir (immagini prelevate da Internet)


Una manifestazione evidente delleetto Moir si ha nelle riprese video
digitali. Una videocamera capta la luce grazie ad una griglia molto tta di
sensori. Per, se la videocamera inquadra un attore con una giacca a quadretti ad una certa distanza, il reticolo dei quadretti della giacca, visto da
quella distanza, pu essere di passo simile a quello dei sensori. In tal caso
il passo di campionamento (la distanza tra i sensori) diventa non sucien-

946

CAPITOLO 13. RICOSTRUZIONE ED ALIASING

temente piccolo rispetto al passo del reticolo campionato (i quadretti della


giacca). Perci si ha leetto Moir: bande scure apparenti. Se la videocamera sta facendo una ripresa a colori, le bande possono non coincidere per i
diversi canali di colore (rosso, verde e blu) e questo crea bande con dispersione cromatica (cio di colore cangiante). Inoltre le bande sono di forma
non regolare, perch la giacca non planare bensi curva, e si spostano con i
movimenti dellattore che la indossa, un eetto molto fastidioso.
Un esempio molto interessante di aliasing, che mostra come un segnale
oscillatorio ad alta frequenza, campionato a passo inadeguato, possa "mascherarsi" da segnale a bassa frequenza (da cui il nome aliasing) dato dal
seguente eserczio.
Esercizio 13.5.1. Sia fN +1 (t) = ei(N +1)t e f1 (t) = eit . Allora sulla griglia di
campionamento
t0 = 0, t1 =

2
4
N 1
, t2 =
, . . . , tN = 2
,
N
N
N

si ha
fN +1 (tk ) = f1 (tk )

k = 0, 1, . . . , N 1.

In particolare,
la funzione sin((N + 1)t) coincide con la funzione sin t sui

punti tk = 2k
,
k = 0, 1, . . . , N 1 , e la funzione cos((N + 1)t)) coincide,
N
e
su questi punti, con cos t. Si osservi che il passo di campionamento = 2
N
la funzione fN +1 la trasformata di Fourier nel senso delle distribuzioni di N ,

quindi la soppressione della componente sinusoidale conferma esattamente il

Teorema 13.4.2.
Svolgimento. ovvio, perch ei(N +1)t = eit eiN t , e eiN tk = e2ik = 1 per
ogni k. Il resto dellesercizio si ottiene prendendo parte reale e parte immaginaria di questa identit. Osserviamo che il risultato si potrebbe ottenere, in
maniera equivalente, anche dalle formule di addizione del seno e del coseno.
Ad esempio:
sin((N + 1)tk ) = sin(Ntk ) cos tk + cos(Ntk ) sin tk ,
ma Ntk = 2k, quindi sin(Ntk ) = 0 e cos(Ntk ) = 1 per ogni k.

13.6. RICOSTRUZIONE DI SEGNALI NELLA PRATICA QUOTIDIANA: PREFILTRAGGIO E STA

13.5.1

Campionamento multidimensionale e risoluzione


di immagini

I precedenti esempi di aliasing riguardano segnali unidimensionali, ma laliasing si incontra pi di frequente per le immagini, che sono segnali bidimensionali, ossia con i dati campionati su un reticolo bidimensionale.
La trasformata di Fourier bidimensionale si denisce come
Z Z
b
f (s, r) =
f (x, y) e2i(sx+ry) dx dy

Z

2isx

f (x, y) e


dx e2iry dy ,

e quindi literazione di due trasformate di Fourier unidimensionali; analogamente per trasformate di Fourier multidimensionali. Ne segue che largomento appena presentato, e quindi il teorema del campionamento, continuano a valere per segnali a dimensione m > 1 campionati su una griglia
mdimensionale equispaziata: basta sostituire la convoluzione del Teorema
del Campionamento (Corollario 10.4.6) con una analoga serie multipla con
m indici. Questo utile per la ricostruzione di segnali bidimensionali come le
immagini, quando vogliamo aumentarne articialmente la risoluzione (ossia
inttirne i pixel).

13.6
13.6.1

Ricostruzione di segnali nella pratica quotidiana: prefiltraggio e stabilit


Segnali a durata finita

Nella vita reale, il metodo di ricostruzione che abbiamo esposto nel teorema
del campionamento (Corollario ??) non si applica bene, perch le sue condizioni non sono mai soddisfatte nella pratica. Infatti, un segnale reale ha un
inizio ed una ne, quindi ha durata nita, e pertanto a supporto compatto:
ma, per il Teorema 8.6.1, non allora possibile che la sua trasformata di
Fourier sia anchessa a supporto compatto.
In linea di principio, questo problema non impedisce lapplicabilit del
teorema del campionamento. Infatti, se siamo interessati a campionare un
segnale f solo in un compatto K, possiamo comunque applicare il teorema

948

CAPITOLO 13. RICOSTRUZIONE ED ALIASING

del campionamento purch f (di cui noi vediamo solo valori sul compatto K)
si estenda a tutto R ad una funzione nella classe a banda limitata Bc , che
denotiamo ancora con f : campioniamo f a passo = 2c1 solo nellintervallo
temporale K (per semplicit, in questa Sottosezione denotiamo la frequenza
di taglio con c invece che c ). Se immaginiamo di estendere i campioni
allesterno di K, ponendoli zero al di fuori, stiamo in realt campionando su
tutti gli interi una funzione diversa: la funzione f0 = f |K (meglio sarebbe
immaginare di campionare una funzione C che coincide con f0 sui multipli
di , visto che vogliamo allontanarci il meno possibile dalla classe di Paley
Wiener, che consiste di funzioni C , ma largomento rimane identico).
Allora, stiamo sostituendo la vera funzione f di PaleyWiener con il suo
troncamento f0 su K, la cui trasformata di Fourier g := fb0 non a supporto
compatto. In quale misura g approssima fb? La risposta dipende da quanto
grande K. Fissiamo una tolleranza > 0 e poniamo f = f0 + f , dove
ovviamente f = f |K . Supponiamo di aver scelto il compatto K cos
grande che la funzione f Bc L1 verichi kf k1 < . Allora kg fbk =
kfc
k 6 kf k1 < . Quindi la trasformata di Fourier che siamo in grado di
calcolare, ovvero la funzione g, approssima la trasformata di Fourier fb a meno
di per ogni valore della frequenza, e pertanto, a partire dai dati campionati
sullintervallo K, siamo in grado di calcolare una buona approssimazione
di fb (a meno di una tolleranza arbitraria pressata ), ed in particolare di
vericare a posteriori se ragionevole assumere che i dati disponibili siano
campioni di una funzione a banda limitata. Occorre per tener presente
che tutto questo dipende dalla condizione che K sia sucientemente grande
rispetto al segnale, nel senso che la sua coda f verica kf k1 < : poich
non sappiamo come sia fatta f fuori di K, questa ipotesi solo una speranza.
Questo un punto debole nel rigore del procedimento, e ci ritorneremo tra
poco.
Ma veniamo allaltro lato della questione: quale funzione viene ricostruita
se partiamo dai dati campionati {f0 (n )} ? Come visto nel teorema del
campionamento, viene ricostruita esattamente la funzione




X
X
t
t
f0 (n ) sinc
h(t) =
n =
f (n ) sinc
n .

n K
nZ
Se avessimo avuto i campioni di f su tutti i multipli diP , in base al teorema
del campionamentoPavremmo invece ricostruito
f (t) = n f0 (n ) sinc t n .

t
La discrepanza n K
/ f (n ) sinc n . Per stimare questa dierenza

13.6. RICOSTRUZIONE DI SEGNALI NELLA PRATICA QUOTIDIANA: PREFILTRAGGIO E STA


dobbiamo fare ipotesi ulteriori. Osserviamo che le funzioni f Bc appartengono a L1 , per denizione, ed a L , perch sono trasformate di Fourier di
funzioni a supporto compatto. Quindi ragionevole assumere che f decresca
allinnito a velocit abbastanza elevata. Anche i dati campionabili {f (n )}
sono una successione limitata; supponiamo allora che P
siano anche in uno spap
zio p per qualche p < (ossia che k{f (n )}kpp :=
n= |f (n )| < ).
Normalmente, si assume che tutti i segnali siano successioni 2 , perch questa
condizione equivale al fatto che lenergia sia nita.
dunque che
P Assumiamo
2
|f
(n
)|
<
(ma il
la successione f = {f (n )} sia in 2 , ossia che
n=
p
ragionamento resta valido anche se f per un qualsiasi p < ). Poniamo fK = {f (n )}, ossia fK (n) = f (n ) se n
/ K e 0 altrimenti. Allora
fK 2 , e per ogni > 0,
si
ha
kf
k
<

se
K

abbastanza grande.
K 2


t
Poniamo ora s(t) = sinc n n= . Osserviamo che la successione
sinc2 (x n) si maggiora con 1/n2 in [n, n + 1] ed in [n 1, n] se |n| > 0
(e con 1 in [1, 1]), quindi appartiene a 2 per ogni x, con norma 2 limitata
rispetto a t (diciamo, da una costante positiva C). Allora lo stesso vale per s,
che si ottiene da questa successione tramite la dilatazione di passo . Quindi,
dalla disuguaglianza di Cauchy,



X
t


n = |hfK , s(t)i|
f (n ) sinc


n K
/

6 kfK k2

n K
/

| sinc

 ! 21
t
< C .
n |2

Quindi lerrore di ricostruzione del segnale si maggiora con C, ed a meno


di questa tolleranza possiamo applicare il metodo di ricostruzione basato sul
teorema del campionamento.
Per futuro riferimento, si noti che abbiamo dimostrato la seguente disuguaglianza:
Corollario 13.6.1. Esiste una costante C > 0 tale che, perPogni successione
{an } 2 e per ogni t R, la funzione u definita da u(t) :=
n= a(n) sinc
verifica
|u(t)| 6 C k{an }k2 .
Ci sono per due punti deboli in questo ragionamento.
Il primo che C una costante numerica ssa (in eetti, si pu dimostrare


n

950

CAPITOLO 13. RICOSTRUZIONE ED ALIASING

che minore di 2 /3), ma arbitrario, ed al ne di raggiungere la precisione


C possiamo essere costretti a scegliere K grande: ma non sempre questo
possibile, perch a volte il periodo in cui si eettua la misura non prolungabile a piacere. Si pensi ad esempio alle misure del moto apparente dei
pianeti nellanno, o, nel caso in cui la variabile rappresenti uno spazio invece
che un tempo, alle misure della deformazione in unautomobile nel corso di
un crash test, o ai valori di luminosit dei pixel in una riga di unimmagine
di risoluzione pressata.
Il secondo punto debole ancora pi imbarazzante, e lo abbiamo gi preso
in esame, ma ora ci ritorniamo in maniera pi approfondita. Dato un segnale
f (t) per t R di cui conosciamo solo i valori campionati {f (n)} nellintervallo nito K, non possiamo calcolare, neppure in maniera approssimata, la
trasformata di Fourier fb: sappiamo solo approssimare fb0 a meno di , non
fb, ed anche questo sappiamo farlo solo sotto lipotesi non vericabile K sia
abbastanza grande che si abbia kf k1 < . In particolare, non siamo in grado di capire in maniera ovvia se il segnale f nella classe a banda limitata
(o meglio, se esiste una funzione f Bc che coincide con i dati campionati al
variare di n in K). Per, come visto nella discussione sullaliasing, anche se
f non fosse a banda limitata una versione approssimata della ricostruzione si
otterrebbe comunque quando sia f sia fb decrescono in maniera abbastanza
rapida (ad esempio se sono entrambe in L1 , caso nel quale applicabile la
Formula di Somma di Poisson). Noi abbiamo qualche informazione sullandamento di f nel compatto K, grazie ai dati campionati, e certamente siamo
in grado di prolungarla fuori di K in maniera che sia in L1 , ma meno facile
trovare una tale estensione che faccia s che anche fb L1 . Se assumiamo che
il segnale f sia nullo fuori di K, allora non solo fb non pu essere a supporto
compatto, ma in generale non neppure in L1 , come dimostra lesempio in
cui f sia una funzione caratteristica di un intervallo, la cui trasformata di
Fourier coincide in modulo con un dilatato della sinc, che non in L1 .
Pertanto la nostra analisi euristica alquanto teorica. In eetti, nella
pratica si procede diversamente, ed esattamente come accennato alla ne
della Sezione 13.5 sullaliasing. Si parte con un segnale f limitato ed a supporto compatto (e quindi anche in L2 ) e lo si preltra convolvendolo con una
funzione Bc : in tal modo, in base alla moltiplicativit della trasformata
di Fourier sotto convoluzione, si ottiene un nuovo segnale h = f ancora
in Bc (ma non pi a supporto compatto). Il segnale ltrato h ha un aspetto
pi liscio e regolare di f , perch ha perso le componenti di alta frequenza;

13.6. RICOSTRUZIONE DI SEGNALI NELLA PRATICA QUOTIDIANA: PREFILTRAGGIO E STA


per, in alcune condizioni che spesso si vericano in pratica, h approssima
f , almeno nel senso della norma L2 (e quindi puntualmente quasi ovunque).
Pi precisamente, supponiamo di poter scegliere c abbastanza grande rispetto allestensione dellintervallo in cui fb grande; inoltre esiste certamente
b
tale che |()|
6 1 per ogni , ed uguale a 1 su un sottointervallo grande
[d, d] [c, c]. Allora kh f k2 piccolo. Infatti kh f k2 = kb
h fbk2 , e la
funzione b
h fb vale 0 in [d, d], verica |(b
h fb)()| 6 |fb()| per c 6 || 6 d
(un intervallo piccolo) e |b
h fb|() = |fb|() se || > c. Ma questultima
disuguaglianza
ci d una buona stima L2 , perch se c abbastanza grande
R
allora ||>c |fb|2 d piccolo, dal momento che fb L2 .
Pertanto si adotta il seguente compromesso. Scegliamo la larghezza di
1
costituisca un passo di campionamento accetbanda 2c in modo che = 2c
tabile per la velocit di misura dei nostri strumenti di campionamento (ad
esempio proporzionata alla larghezza del nostro canale uditivo, il che porta
ai 44 KHz del campionamento dei CD come visto nellIntroduzione, o pari
alla distanza fra due pixel adiacenti del nostro sensore di immagini). Poi
preltriamo il segnale f tagliandone le frequenze al di fuori di questa banda,
come spiegato sopra. In tal modo si ottiene un nuovo segnale h modicato
(ed allisciato), che in vari casi pratici non dierisce troppo da f , come visto
prima. A questo punto il procedimento di riscostruzione basato sul teorema
del campionamento funziona, per non ricostruisce il segnale originale, bens
il segnale ltrato f . Questo d luogo, nei casi tipici, ad una ricostruzione
non esatta bens approssimata, per entro una tolleranza pressata

13.6.2

Stabilit della ricostruzione sotto perturbazioni


dei dati

Una volta attuato il procedimento di ricostruzione, almeno nel senso approssimato illustrato alla ne della Sottosezione precedente, occorre domandarci
quanto esso sia stabile sotto piccole perturbazioni dei dati. Infatti i dati sono
catturati da apparecchiature di misura che sono aette da errore, spesso in
maniera casuale, e vogliamo essere sicuri che il procedimento ricostruisca un
segnale perturbato non troppo diverso dalloriginale. In particolare, vogliamo assicurarci che la discrepanza fra i valori del segnale ricostruito a partire
dai valori perturbati e di quello originale non diverga sotto perturbazione dei
dati, ma anzi tenda a zero in qualche senso appropriato se le perturbazioni
diventano piccole.

952

CAPITOLO 13. RICOSTRUZIONE ED ALIASING

Per fortuna, questo vero e non occorre nessuna fatica per dimostrarlo. Infatti, supponiamo che ogni dato campionato f (n) sia aetto da un
errore a(n). Sappiamo che il segnale f Bc appartiene a L1 L , per
ipotesi (pi precisamente, nella ricostruzione approssimata con preltraggio,
spiegata nella precedente Sottosezione, non si assume f Bc , ma si assume comunque f L1 L , e tipicamente f L2 ). Abbiamo allora fatto
lipotesi ragionevole che la successione {f (n)} sia in 2 . anche ovvio assumere che la percentuale di errore sperimentale sia limitata da una costante
piccola , e quindi |a(n)| 6 |f (n)| per ogni n. Allora anche {a(n)} 2 ,
con k{a(n)}k2 6 k{f (n)}k2 , e quindi la stabilit segue direttamente dal
Corollario 13.6.1.

13.6.3

Ricostruzione esatta e ricostruzioni approssimate

In questo articolo abbiamo esposto i principi teorici della ricostruzione esatta


di segnali tramite lanalisi di Fourier a partire da una successione innita di
dati campionati, ma poi ci siamo resi conto che, nella pratica, ogni successione
apparentemente innita di dati di fatto nita, essendo nulla prima dellinizio
dellesperimento e dopo la ne. Abbiamo anche capito che il fatto che la
successione dei dati sia nita impedisce la validit delle ipotesi necessarie alla
ricostruzione esatta e permette solo una ricostruzione approssimata, peraltro
entro una tolleranza pressata (pur di accettare alcune ipotesi naturali di
decadimento del segnale che generalmente non sono vericabili). A questo
punto, abbiamo deciso di preltrare il segnale, che allora ricostruibile solo
entro una tolleranza pressata: per in tal modo stiamo ricostruendo non il
segnale originale, ma una sua approssimazione.
Per, per ricostruire i segnali in maniera approssimata anzich esatta,
ci sono anche altri modi. I due modi tipici sono linterpolazione dei dati
tramite polinomi algebrici (splines) o tramite polinomi trigonometrici (combinazioni lineari delle funzioni sin nt e cos nt al variare di n). Ci limitiamo
ad accennarne.
Il modo pi semplice di interpolazione polinomiale dei dati linterpolazione lineare a tratti, nella quale il graco dellapprossimante si ottiene
congiungendo con un segmento i punti del piano corrispondenti a due dati
consecutivi. In tal modo, in tutti gli istanti intermedi fra due tempi di campionamento consecutivi, lapprossimante lineare a tratti ha valori intermedi

13.6. RICOSTRUZIONE DI SEGNALI NELLA PRATICA QUOTIDIANA: PREFILTRAGGIO E STA


fra quelli dei due dati campionati, ma rispetto alla ricostruzione ispirata dal
teorema del campionamento abbiamo perso qualcosa. Infatti, ora ovviamente
non possiamo pi sapere quanto lapprossimante dierisca dal segnale vero
ad ogni tempo intermedio: non possibile stimare la discrepanza se non
imponendo limiti sul valore della derivata del segnale, o, equivalentemente,
sulle frequenze massime e minime per le quali la trasformata di Fourier
non nulla. Peggio: questa interpolazione inutilizzabile nella pratica, perch la derivata non e continua (lapprossimante ha punti angolosi ai punti
di campionamento). Ad esempio, nel caso di ricostruzione di suoni questo
procedimento produce distorsioni ad alta frequenza od altri disturbi, e nel
caso di immagini produce eetti di bande in prossimit dei punti angolosi.
per facile ottenere una approssimazione polinomiale non solo continua ma
anche di classe C 1 : basta approssimare con splines di grado pi elevato. Ad
esempio, se invece che segmenti utilizziamo archi polinomiali di terzo grado
(quindi determinati da due parametri aggiuntivi), allora abbiamo abbastanza
gradi di libert per interpolare ogni tripletto di dati consecutivi ed in pi
ssare a nostro piacere la pendenza al punto iniziale. Incollando insieme
uno dopo laltro questi archi di grado tre possiamo fabbricare una curva
interpolante di classe C 1 . Ma anche in tal caso, non sapremo stimare lerrore
di approssimazione.
Lapprossimazione trigonometrica analoga: se disponiamo di 2n + 1 campioni, li possiamo interpolare con un unico polinomio trigonometrico di grado
n + 1: una combinazione lineare delle 2n + 1 funzioni cos kt per k = 0, . . . , n
e sin kt per k = 1, . . . , n. Il polinomio trigonometrico approssimante, ovviamente, di classe C (derivabile innite volte). Anche in questo caso,
per, non possiamo dire nulla sulla precisione dellapprossimazione tranne
che sui punti di campionamento, dove ovviamente lerrore nullo. Anche se
volessimo assumere che il segnale vero fosse periodico, non per questo esso
coinciderebbe con il polinomio trigonometrico approssimante, a meno che i
suoi coecienti di Fourier non nulli fossero esattamente quelli del polinomio
trigonometrico. Si noti che, in tal caso, staremmo assumendo lannullarsi
dei coecienti di Fourier a frequenze elevate: ossia una condizione analoga
a quella del teorema del campionamento, che ci dava la ricostruzione esatta
o almeno una buona stima sullerrore. In eetti, questa analogia legata ad
una connessione pi profonda: la costruzione del polinomio trigonometrico
viene semplicata, e diventa pi naturale, se la eettuiamo utilizzando una
discretizzazione della trasformata di Fourier e della sua formula di inversione,
la Trasformata di Fourier Discreta [3, 10, ?].

954

13.7

CAPITOLO 13. RICOSTRUZIONE ED ALIASING

Cenni sul campionamento non uniforme

Abbiamo test osservato che la ricostruzione mediante il Teorema del Campionamento (Corollario 10.4.6) si applica in particolare a segnali bidimensionali, le immagini. Nel caso di immagini catturate da un sensore tipicamente i
punti di campionamento formano una griglia euclidea. Ma ci sono immagini
importanti per le applicazioni dove non cos: ad esempio, la griglia pu
essere distribuita in maniera radiale in certe immagini tomograche e nelle
immagini ecograche. Pertanto diventa importante studiare la ricostruzione
a partire da campioni non equidistribuiti. Un altro caso tipico di campioni
irregolari quello nel quale gli strumenti campionatori non possono essere
ssati rigidamente su una griglia, o quello, frequentissimo, nel quale qualche dato campionato non viene trasmesso e si perde. A causa della perdita
della periodicit, la ricostruzione a partire da campioni non uniformemente
distribuiti un problema al conne fra lanalisi numerica e lanalisi reale ma
non pi una applicazione dellanalisi di Fourier, e qui ci limitiamo a qualche
facile esempio (unidimensionale) ed a citare il risultato pi importante.
Esempio 13.7.1. Il primo esempio quello nel quale vengono combinate due
serie di campioni, ciascuna equispaziata dello stesso passo (diciamo 1, per
semplicit), ma sfasate nel tempo di una distanza . Ovviamente, suciente
limitare lattenzione a 0 < 6 1/2. Se = 1/2, allora le due serie si
combinano per formare ununica serie equispaziata di passo 1/2, e quindi in
grado di ricostruire senza perdite segnali la cui trasformata di Fourier ha
supporto di diametro 2, in base al Teorema del Campionamento (Corollario
10.4.6). Se invece 0 < < 1/2, i dati campionati permettono comunque di
ricostruire il segnale originale?
La risposta aermativa, pur di seguire un adeguato processo di ricostruzione
tramite medie, come ora illustriamo. Consideriamo un segnale f tale che fb =
0 al di fuori dellintervallo [1, 1] e due successioni di punti di campionamento
{n Z} e + n : n Z}. Stiamo quindi considerando listogramma dei
dati campionati fornito dalla distribuzione f (K + K) (qui, al solito,
loperatore di traslazione di passo ). Ciascuna delle due distribuzioni
f K e f K insuciente a ricostruire esattamente il segnale, a causa delle
sovrapposizioni illustrate, ad esempio per la prima delle due, nel graco di
fd
K in Figura 13.14 (la trasformata di Fourier fd
K la somma di tutte le
campane traslate).
Ora esaminiamo la trasformata di Fourier dellaltro istogramma, f K.

13.7. CENNI SUL CAMPIONAMENTO NON UNIFORME

955

f^
-1

Figura 13.14: A sinistra il grafico di fb, con supporto di diametro 2; a destra le sue

repliche traslate, che formano gli addendi della trasformata di Fourier dellistogramma
fd
K ottenuto da una sola sequenza di dati a passo uniforme 1, che inadeguato
0
-1

Figura 13.15:

Addendi della trasformata di Fourier dellistogramma ottenuto


campionando con la stessa sequenza uniforme ma traslata di passo 1/2 (ancora inadeguata)

b = K. Quindi dalla parte (ii) dellEDalla identit (12.1) sappiamo che K


2i
K().
sempio 11.14.1 e dalla Proposizione 11.14.3 segue che d
K() = e
Inne, dalla parte (i) del Corollario 11.13.3 sappiamo che la trasformata di
2in
b P
Fourier di f K il prodotto delle trasformate fbd
n ,
K = f
n= e
e quindi, per la propriet (vi), la somma delle repliche traslate e pesate
P
2in
n (fb).
n= e
Rivediamo in questa chiave il caso = 1/2, in cui sappiamo gi che si ha la
ricostruibilit. Nella Figura 13.15 sono disegnate le campane traslate che costituiscono gli addendi della trasformata di Fourier dellistogramma in questo
caso particolare = 1/2, nel quale e2in = ein = (1)n : i termini pari
sono gli stessi del precedente istogramma, i termini dispari sono gli opposti.
Quando sommiamo le trasformate di Fourier delle due successioni di campioni, le campane pari si raddoppiano e quelle dispari si cancellano, e rimane
una successione di campane a supporto contiguo ma disgiunto, ciascuna una
copia di fb: sapevamo che questo doveva succedere, dal momento che, per
= 1/2, la combinazione delle due sequenze di punti di campionamento
forma una nuova sequenza equispaziata di passo esattamente corrispondente alla massima frequenza di taglio necessaria per riprodurre esattamente il
segnale. A questo punto, largomento teorico per ricostruire il segnale a partire dalla combinazione dei dati il solito ltraggio passa basso seguito dalla

956

CAPITOLO 13. RICOSTRUZIONE ED ALIASING

antitrasformata di Fourier, ma ora bisogna anche dividere per due per eliminare il raddoppio ddelle campane pari. Osserviamo che questo signica che fb
viene ricostruita a partire dalle due successioni di campioni e la trasformata
di Fourier dei loro istogrammi tramite una operazione di media.
Cosa sarebbe successo per 0 < < 1/2? La trasformata di Fourier del
primo istogramma f K la stessa di prima. Per la seconda, invece di segni
alterni abbiamo la moltiplicazione per una fase progressiva e2in . Il lettore non abituato alla moltiplicazione di numeri complessi pu restringere
lattenzione alla parte reale cos(in) ed alla parte immaginaria sin(in).
Si tratta di numeri oscillanti intorno a zero in maniera periodica, e le campane costituite dalla repliche traslate di fb vengono moltiplicate per un peso
oscillante (come illustrato nella Figura 13.16, nella quale, come sempre, limitiamo lattenzione alla parte reale). Se concentriamo lattenzione al segmento [1, 1] (quello del ltraggio), entrambi i contributi, quello derivante
dalla successione di dati originali e quello dalla successione traslata f\
K
b
sono sovrapposizioni di due repliche traslate di f , il primo con pesi uguali
( la somma delle due repliche traslate) ed il secondo con pesi 1 e e2i . In
altre parole, ltrando ed antitrasformando il primo istogramma otteniamo il
valore a() := fb() + fb( + 1), mentre dal secondo istogramma otteniamo
b() := fb() + e2i fb( + 1). Osserviamo che la matrice


1 1
M :=
1 e2i
ha determinante e2i 1 6= 0, e quindi invertibile, e pertanto ricaviamo
!


b
a()
f ()
1
.
=M
b()
fb( + 1)

In questo modo abbiamo portato a termine la ricostruzione: si noti per che,


se 0, lalgortitmo numericamente poco stabile, perch il determinante
di M vicino a zero, e quindi la matrice inversa M 1 ha termini ed autovalori grandi e tende ad amplicare piccole perturbazioni dei dati, sempre
di pi man mano che viene scelto pi vicino a zero. Daltra parte questo comportamento intrinseco al problema numerico proposto, perch per
piccole traslazioni i punti di campionamento della prima successione sono
molto vicini a quelli della seconda, e quindi dierenze dei due corrispondenti
valori di f implicano pendenze ripidissime, che comportano amplicazioni
delle perturbazioni.

13.7. CENNI SUL CAMPIONAMENTO NON UNIFORME

957

f^
-1

Figura 13.16: Le repliche traslate di fb, pesate con un peso oscillante, che formano f\
K
Ricapitolando, in questi esempi abbiamo considerato un segnale con banda di frequenza di diametro 2, che quindi richiede, per la ricostruzione, una
successione uniforme di campioni di passo 1/2. Invece, abbiamo usato punti
di campionamento costituiti da due sequenze equidistribuite di passo 1, ciascuna delle quali quindi inadeguata per la ricostruzione, ed abbiamo visto
che, prese insieme, diventano adeguate. Quindi in questi casi, per ladeguatezza del processo di ricostruzione, basta che la distribuzione dei campioni
sia in media di passo 1/2.

Esempio 13.7.2. Consideriamo un secondo esempio di campionamento non


uniforme la cui capacit di ricostruire i segnali pu essere stabilita a partire dal Teorema del Campionamento (Corollario 10.4.6): quello nel quale
si mescolano due successioni equispaziate, la prima di passo, diciamo, 1, e
la seconda di passo con > 0 (ed ovviamente 6= 1). Come prima,
il supporto di fb ha diametro 2. Quindi, in base al Teorema del Campionamento (Corollario 10.4.6), la prima successione di campioni inadeguata
per la ricostruzione, e la seconda adeguata
se 6 1/2 ed inadeguata se

P
> 1/2. Listogramma dei dati f K + 1 K 1 , perch 1 K 1 =
n

(parte (i) del Corollario ??). In base alla parte (ii) dello stesso Corollario,
P
1 c
n
K 1 = K = 1
, e quindi la trasformata di Fourier dellistogramma

la distribuzione
fb K + fb K =

1
n fb + n fb.

n=

Queste due distribuzioni, come ormai abbiamo visto pi volte, sono due
serie di repliche di traslati di fb. La seconda seria ha altezza diversa, perch
stata riscalata con il fattore 1 . Poich conosciamo lintera successione dei
dati campionati, possiamo scindere le due sottosuccessioni, e quindi separare
i due treni di repliche. Per semplicit, riscaliamo il secondo moltiplicandolo
per , in maniera che le repliche del secondo treno abbiqano la stessa altezza

958

CAPITOLO 13. RICOSTRUZIONE ED ALIASING

1 di quelle del primo. Consideriamo dapprima il caso 1/2 < < 1, e poniamo
1
= 1 + con 0 < < 1. La prima delle due successioni di traslati di fb ha

passo 1, e quindi il traslato nsimo adiacente al traslato (n + 2)simo, e


ciascuno dei due si sovrappone a met del traslato (n + 1)simo, come gi
visto in Figura 13.14. Invece la seconda formata da repliche pi separate:
il traslato (n + 2)simo comincia a distanza 2 + 2 dallinizio del traslato
nsimo, e quindi a distanza 2 a destra della ne dellaltra. Pertanto, ogni
replica si sovrappone solo alla precedente ed alla successiva. In maggiore dettaglio: la funzione fb ha supporto in [1, 1], la replica precedente comincia a
sinistra dellintervallo e nisce al punto , ed il primo traslato destro 1 fb
comincia al punto e nisce oltre lintervallo (al punto 2 + ): si veda la
Figura 13.17. Quindi, in questa catena di repliche, solo la replica originale fb
non nulla nellintervallo [, ], e quindi ne possiamo ivi leggere il valore.
Ora cominciamo un processo di bootstrap fra i due campionamenti. Consideriamo i traslati di passo 1: nel sottointervallo [, 0] si sovrappongono
solo le repliche date da fb e dal suo traslato sinistro 1 fb, e, visto che l ormai la prima di queste funzioni nota grazie alla fase precedente basata sul
secondo campionamento, ne ricaviamo la seconda funzione. Ma in quellintervallo questa seconda funzione assume gli stessi valori che la prima assume
in [1, 1]; analogamente, nellintervallo [0, ] la funzione fb di questa catena
di repliche si sovrappone solo con il suo traslato destro 1 fb, ed allo stesso
modo questo ce ne rivela i valori in [1, 1 + ]. A questo punto abbiamo
ampliato il dominio di ricostruzione a [1, 1 + ] [, ] [1 , 1], e
proseguiamo il bootstrap paragonando i risultati su questi tre intervalli con
quelli del secondo treno di repliche (quelle di passo 1 + ). Infatti, nellintervallo di sinistra, [1, 1 + ], questo treno di repliche fa sovrapporre fb (ivi
gi nota) solo con il suo traslato di passo 1 , che quindi viene ricostruito,
ed i valori che esso assume sono quelli di fb fra 2 e (si veda la Figura
13.17). Utilizzando in maniera analoga gli altri due intervalli vediamo che
questa fase del bootstrap raddoppia il dominio di ricostruzione, estendendolo
a [1, 1 + 2] [2, 2] [1 2, 1]. A questo punto chiaro come proseguire il botstrap per raddoppiare il dominio di ricostruzione: in un numero
nito di passi si recupera fb interamente, ossia su tutto lintervallo [1, 1].
Si noti che, in questo caso, la densit media dei punti di campionamento
maggiore di 1/2 e riusciamo ad operare la ricostruzione di ogni f tale che
fb ha supporto di lunghezza 2, come avveniva per campioni equidistribuiti.

13.7. CENNI SUL CAMPIONAMENTO NON UNIFORME

959

f^

passo 1

-1

1 1

-1

passo 1+

1+2

Figura 13.17: Due successioni equispaziate di repliche di passo differente (quelle in


alto a passo 1, quelle in basso a passo maggiore) danno luogo ciascuna a campionamento
inadeguato, ma di densit complessiva adeguata. La ricostruzione si basa sullinterplay fra
le sequenze di repliche con i due passi di traslazione (bootstrap). La figura evidenzia alcuni
intervalli di ricostruzione ottenuti nelle prime due fasi del bootstrap: il secondo passo di
traslazione restituisce i valori di fb in [, ] (evidenziati con spessore medio). Da questi
dati, il primo passo di traslazione restituisce fb in [1, 1 + ] e [1 , 1] (evidenziati con
spessore grande); a sua volta, questa informazione permette al secondo passo di traslazione
di ricostruire fb in [2, ] (spessore molto grande), e cos via.

960

CAPITOLO 13. RICOSTRUZIONE ED ALIASING

Veniamo ora allaltro caso, > 1, e poniamo 1 = 1 + con 1 < < 0.


In questo caso, da un lato la densit media dei campioni minore di 1/2;
dallaltro lato, il metodo di ricostruzione illustrato pi sopra fallisce: il bootstrap non pu cominciare perch non ci sono intervalli in cui la trasformata
di Fourier di uno dei due istogrammi consiste di una sola replica di fb (anzi,
in molti intervalli il secondo istogramma fa sovrapporre tre repliche invece
che due sole). Quindi in questo caso non riusciamo a ricostruire il segnale.

I precedenti Esempi 13.7.1 e 13.7.2 suggerisceono una caratterizzazione


degli insiemi di campionamento in termini della densit minima dei punti di
campionamento. Premettiamo due denizioni.
Definizione 13.7.3. Una successione {xj } di numeri reali si chiama un insieme di unicit per la classe di PaleyWiener Bc se la sola funzione f Bc
tale che f (xj ) = 0 per ogni j la funzione nulla. In altre parole, se si conoscono i valori di f su un insieme di unicit, esiste una unica ricostruzione
dellintera f a partire dai suoi campioni: per ricostruire f naturalmente occorre trovare un appropriato algoritmo di ricostruzione (come abbiamo fatto
nel precedente Esempio 13.7.1).
Per non detto che esista un tale algoritmo con la propriet di essere stabile
sotto piccole perturbazioni dei dati campionati (ad esempio arrotondamenti
numerici). Una successione {xj } R si dice un insieme di campionamento
stabile in uno spazio normato di funzioni, ad esempio Lp , se f ricostruibile
dai suoi valori {f (xj )} in maniera da cambiare di poco se i campioni sono
perturbati di poco, nel senso che per ogni p > 1 esiste C > 0 tale che ogni
f Bc Lp verica
kf kp 6 Ck{f (xj )}kp :=

j=

|f (xj )|p

! p1

Evidentemente gli insiemi stabili sono i soli insiemi di campionamento di


interesse nelle applicazioni.
Definizione 13.7.4. Dato un insieme numerabile X R, si chiama densit
di Beurling di X il numero
|X [y, y + r]|
.
r yR
r

D(X) := lim inf

13.7. CENNI SUL CAMPIONAMENTO NON UNIFORME

961

Nota 13.7.5. Osserviamo che inf yR |X [y, y + r]| il minimo (o meglio, la


migliore approssimazione per difetto) del numero di punti di X in intervalli
di lunghezza r, pertanto inf yR |X[y,y+r]|
il minimo della densit dei punti
r
di X in tali intervalli, e quindi D(X) rappresenta il minimo della densit di
X in intervalli via via pi lunghi, ossia la densit asintotica minima di X.

Vale la seguente caratterizzazione degli insiemi di campionamento stabili


[?], che non dimostriamo:
Teorema 13.7.6. (Beurling, Landau.) Se un insieme numerabile X R
ha densit di Beurling D(X) > 1 (Definizione 13.7.4), allora un insieme
di campionamento stabile per B 1 Lp per tutti i p > 1 (Definizione 13.7.3).
2
Viceversa, ogni insieme di campionamento stabile per per B 1 Lp verifica
2
D(X) > 1.
(Se si vuole considerare Bc invece di B 1 , il risultato continua a valere pur di
2
riscalare appropriatamente il valore della densit nel senso del Teorema del
Campionamento).

962

CAPITOLO 13. RICOSTRUZIONE ED ALIASING

Parte IV
Trasformata di Fourier discreta,
trasformata discreta dei coseni,
trasformata rapida di Fourier,
deconvoluzione

963

Capitolo 14
La trasformata di Fourier discreta
(DFT)
14.1

La relazione fra la periodicit del segnale e discretezza della sua trasformata di


Fourier

Nel teorema di campionamento abbiamo discretizzato un segnale (a banda limitata) prendendone campioni equispaziati, ed abbiamo dimostrato che lo si
pu ricostruire utilizzando opportunamente la trasformata di Fourier. A questo scopo abbiamo applicato la trasformata di Fourier a segnali discreti, cio
a distribuzioni impulsive equispaziate. Per nellelaborare il corrispondente
procedimento numerico (Sezione 13.4) ci siamo accorti che le operazione aritmetiche da eettuare non hanno mai a che fare con il calcolo di trasformate
di Fourier: non si abbandona mai, in realt, il dominio di partenza. Non si
passa al dominio della frequenza, e ci si limita a calcolare operazioni aritmetiche discrete: convoluzioni fra le successioni dei campioni ed opportuni
pesi di interpolazione (valori della funzione sinc). Sarebbe auspicabile trovare una formulazione della trasformata di Fourier che si applichi direttamente
ad una successione, invece che ad una funzione di una variabile reale, ed il
cui risultato consista ancora di una successione, alla quale applicare le procedure di ltraggio e di ricostruzione sotto forma di operazioni lineari (cio
di operazioni matriciali, facili da codicare su un computer).
Questo possibile, ma impone una restrizione.
965

966

CAPITOLO 14. DFT

Dai Corollari 13.1.5 e 12.2.2 sappiamo che la trasformata di Fourier di una


successione discreta equispaziata di impulsi (agli istanti 0, , 2, . . . )
una funzione periodica, e viceversa. Perci, se vogliamo successioni (cio funzioni discretizzate a passo costante) la cui trasformata di Fourier sia ancora
discreta, allora per la stessa ragione bisogna che le successioni considerate
(automaticamente discrete) siano anche periodiche.
Quindi deniremo una trasformata di Fourier discreta (DFT, per Discrete
Fourier Transform) sulle successioni periodiche. Se consideriamo le successioni di passo N, questa costruzione si chiama DFT di passo N. Proprio
perch questa discretizzazione della trasformata di Fourier un caso particolare della trasformata di Fourier nel senso delle distribuzioni, in realt
non occorrerebbe introdurre una nuova denizione, perch potremmo dedurre tutte le propriet a cui siamo interessati da ci che gi sappiamo sulla
trasformata di Fourier di distribuzioni impulsive: ma facendolo abbiamo uno
sviluppo espositivo assai semplice e conveniente, che esponiamo in questo
Capitolo.

14.2

La DFT ottenuta tramite un procedimento di discretizzazione dei coefficienti di Fourier

Procediamo in maniera simile alla spiegazione euristica dellintegrale di Fourier e della formula di inversione, fornita in Sezione 8.1 sulla base di un
procedimento di discretizzazione a partire dalle serie di Fourier.
Invece che una successione periodica, dapprima consideriamo una funzione periodica f , di periodo T > 0, e sviluppabile in serie di Fourier: diciamo,
ad esempio, f C 1 , cos la serie di Fourier converge uniformemente a f per
il Teorema di Dirichlet (in particolare il suo Corollario 5.12.4). Allora

f (t) =

cn e2int/T

n=

dove
1
cn =
T

f (t)e2int/T dt ,

(14.1)

14.2. DISCRETIZZAZIONE E DFT

967

come nella Nota 5.2.1, in particolare nelle identit (5.6) e (5.7). Ora, per discretizzare la trasformata di Fourier, cominciamo col discretizzare lintegrale
che denisce il coeciente di Fourier cn .
T
Ripartiamo lintervallo [0, T ] in N parti della stessa lunghezza = N
, ed
approssimiamo in ciascuna di queste parti i valori di f con il valore iniziale
f (n ), per n = 0, . . . , N 1.
Allora cn si approssima con
!
N 1
N 1
T
1 X
1 X
f (k )e2ink /T
f (k )e2ink/N
n =
=
T
N
N
k=0

k=0

T
. Si osservi che la successione {n } periodica di periodo N,
poich = N
perch, per ogni k,

e2i(n+N )k/N = e2ink/N e2ik


e e2ik = 1.
Notazione 14.2.1. I numeri complessi di modulo 1
e2ik/N
per k = 0, 1, . . . , N 1, si chiamano le radici n-sime dellunit
La successione {n }n=0,...,N 1 introdotta sopra viene chiamata la trasformata
discreta di Fourier (DFT) della successione {f (k )}k=0,...,N 1 .
A questo punto, la serie di Fourier (??) si approssima con
f (k ) =

N
1
X
n=0

n e2ink /T =

N
1
X

n e2ink/N .

n=0

N 1
Scriviamo xk = f (k ), k = 0, . . . , N 1, e {yk }k=0,...,N 1 = DFT {xk }k=0
.
Riassumendo:

Definizione 14.2.2. (Trasformata di Fourier discreta e sua inversa.)


N 1
Per ogni {xk }k=0
poniamo
N 1
1 X
yn =
xk e2ink/N
N k=0

(DFT)

968

CAPITOLO 14. DFT

N 1
e per ogni {yn }n=0
poniamo

xk =

N
1
X

yn e2ink/N .

(IDFT)

n=0

Vedremo nel prossimo Teorema 14.2.4 che eettivamente la IDFT la trasformazione inversa della DFT.
Nota 14.2.3. In molti libri la DFT viene normalizzata diversamente, nel modo
seguente:
N
1
X
yn =
xk e2ink/N
(DFT)
k=0

ed in tal modo diventa N volte pi grande che qui. Evidentemente, quindi,


la trasformazione inversa, per compensare, deve essere N volte pi piccola:
N 1
1 X
yn e2ink/N .
xk =
N n=0

(IDFT)

Nel Capitolo 15, per motivi di convenienza, adotteremo anche noi questa
rinormalizzazione, e quindi cambieremo la Denizione 14.2.2.

Teorema 14.2.4. (Inversione della DFT.)


La seconda formula una identit: in altre parole, loperatore
)
(N 1
X
IDFT {yn } =
yn e2ink/N
n=0

che manda la successione {yn } nella successione {xn }n=0,...,N 1 loperatore


inverso della DFT (e si chiama trasformata di Fourier discreta inversa. In
particolare la DFT una applicazione iniettiva e surgettiva dello spazio CN
(delle successioni di N numeri complessi) in s.
Dimostrazione. Scriviamo
uk =

N
1
X

yn e2ink/N

n=0

dove

N 1
1 X
xk e2ink/N
yn =
N k=0

14.2. DISCRETIZZAZIONE E DFT

969

Vogliamo mostrare che uk = xk , per ogni k = 0, . . . , N 1.


Sostituendo e scambiando lordine delle somme si ha:

uk

N 1 N 1
1 XX
=
xm e2ink/N e2inm/N
N n=0 m=0
N
1
N 1
X
1 X
=
e2in(km)/N
xm
N m=0
n=0

Ora abbiamo bisogno di una propriet di somma delle radici dellunit, simile
al Lemma 12.5.1 (di fatto la propriet che ci interessa un caso particolare
di quel Lemma, ma per semplicit la ridimostriamo direttamente).
Lemma 14.2.5. Siano 0 6 k, m 6 N interi. Allora
N 1
1 X 2in(km)/N
e
= km
N n=0

0 se k 6= m
1 se k = m
Se k, m sono interi arbitrari (non necessariamente fra 0 e N), lo stesso
enunciato vale se si pone

0 se k 6= m mod N
km =
1 se k = m mod N

dove

km =

2i

Dimostrazione. Poniamo dora in poi w = wN := e N : questo w il


coniugato della prima radice N-esima di 1 nel piano complesso. Allora, per
la formula di somma geometrica (Sezione 1.1),
N
km
N
1
N
1
X
X

1 w
km
1 w N
n
2i N
(km)
km n
e
=
w
=
=
1 w km
1 w km
n=0
n=0
se w km 6= 1.
Invece, se w
km = 1,

N
1
X
n=0


km n

N
1
X

(1) =

n=0

N
1
X
n=0

1=N.

970

CAPITOLO 14. DFT

Se k = m, allora w km = 1 e la somma vale N. Invece, se k 6= m, allora


w km unaltra radice N-esima di 1, ma non vale 1. Per w N = e2i = 1.
Perci si ha
km
N
1
X

1 w N
11
km n
w
=
=
= 0.
km
1 w
1 w km
n=0

Nota 14.2.6. Il precedente


Lemma
n ha anche una naturale dimostrazione geoP km
w
metrica. La somma
la somma di radici dellidentit. Se k = m
stiamo sommando N volte il numero 1 ed otteniamo N. Se k 6= m, allora w km una radice di 1, ma non uguale a 1. La sua potenza N-esima
vale 1, e le sue potenze successive sono disposte in modo simmetrico sulla
circonferenza di raggio 1 nel piano complesso, come nella Figura 12.2, che
riproduciamo qui:

Figura 14.1: Radici dellunit

Se km un divisore di N allora i numeri w km , w 2(km) , . . . , w (N 1)(km)


N
si ripetono (dopo km
passi) e quindi non sono tutte le radici N-esime di 1, ma
sono pur sempre disposti in maniera simmetrica, cio ad angoli equispaziati.
Allora la somma deve essere zero per simmetria.

Fine della dimostrazione del Teorema 14.2.4.


Ormai basta osservare che dal Lemma 14.2.5 si ha
uk =

N
1
X

xm km = xk .

m=0

14.2. DISCRETIZZAZIONE E DFT

971

Nota 14.2.7. In base al Teorema 14.2.4 la DFT un operatore lineare su


successioni di N valori, cio su CN . La sua matrice nella base canonica
data da

1
1
1 ...
1
1
w w 2 . . . w N 1

1
...
D = N 1 w2 w4 . . .

1 w3 w6 . . .
...
... ... ... ...
...

perch la condizione {yn } = DF T N {xn } equivale a


N 1
1 X nk
w xk .
yn =
N k=0

Abbiamo dimostrato la formula di inversione


xk =

N
1
X

w nk yn

n=0

1
1
1 ...
1
1 w 1 w 2 . . . w N +1

2
4
...
La matrice della IDFT quindi U =

1 w 3 w 6 . . .
1 w
w
...
...
... ... ... ...
...
Pertanto questa deve essere linversa della precedente. Il Lemma 14.2.5 dimostra precisamente questo fatto, DU = I, con un calcolo diretto. In eetti
la formula nel suo enunciato esattamente lespressione dellelemento di ordine (k, m) di DU calcolato svolgendo il prodotto righe per colonne.

Concludiamo questa Sezione con un ovvio corollario della denizione di


DFT:
Corollario 14.2.8. Se x
b la DFT di x = {xk : k = 0, . . . , N 1}, allora
(i)

kb
xk

N 1
1 X
1
= sup |xbk | 6
|xk | = kxk1 [0,N 1] ;
N k=0
N
k

972
(ii)

CAPITOLO 14. DFT


PN 1
k=0

|b
xk | 6

PN 1
k=0

|xk |, ossia

kb
xk1 [0,N 1] =

14.3

N
1
X
k=0

|b
xk | 6

N
1
X
k=0

|xk | = kxk1 [0,N 1] .

Un inciso: la trasformata di Fourier sul


gruppo ciclico ZN con N elementi

Questa Sezione serve a dare una veste pi algebrico-geometrica alla trasformata di Fourier di successioni periodiche di periodo N, e non necessaria per
il seguito. Le successioni periodiche di periodo N si possono pensare come
funzioni periodiche denite sugli interi. Gli interi, Z, formano un gruppo
rispetto alloperazione di somma: la somma associativa, esiste un elemento
neutro che sommato a qualunque m intero restituisce m (questo elemento
lintero 0), ed inne, per ogni m Z esiste un elemento inverso (che in questo caso si chiama opposto), il quale sommato con m, restituisce 0 ( lintero
m). Inoltre la somma commutativa (Z si chiama un gruppo commutativo).
Per le successioni periodiche di periodo N si possono anche pensare come
funzioni su un insieme di N elementi. C un particolare insieme di questo
tipo che d una bella interpretazione geometrica della periodicit. Si tratta
del gruppo ciclico ZN di N elementi, o se si preferisce del gruppo delle radici
di ordine N dellunit nel piano complesso.
Se w = e2i/N , questo gruppo il sottoinsieme di C dato da


1, w, w 2, . . . , w N 1 .

Si osservi che questi sono N elementi consecutivi della successione {w n }nZ


(la periodicit dovuta al fatto che w N = w 2i = 1).
In altre parole, c una applicazione naturale da Z a ZN : la mappa
: Z ZN
n 7 w n .

ZN un insieme del cerchio T dei numeri complessi di modulo 1, che sono i


numeri del tipo {e2i : R}. T un gruppo per loperazione di moltiplicazione. Si osservi che e2i e2i = e2i(+ ). Perci la mappa manda la
somma su Z nel prodotto su ZN . In altre parole, : Z 7 ZN moltiplicativa

14.3.

TRASFORMATA DI FOURIER SU ZN

973

in rapporto alle rispettive operazioni di gruppo: si dice che un omomorfismo di Z su ZN (esso cos basilare che si chiama lomomorfismo canonico
di Z su ZN ).
Il concetto di omomorsmo di un gruppo qualsiasi su T ci richiama alla
memoria il fatto che abbiamo gi visto allopera una famiglia estremamente
interessante di tali omomorsmi. Infatti si ha:
Proposizione 14.3.1. Gli omomorfismi continui di R si T sono tutti e soli
gli esponenziali
: x 7 e2ix
( R) .
Qui non dimostriamo che tutti gli omomorsmi siano di questo tipo, ma
osserviamo che questi sono omomorsmi (continui) perch, come gi visto,
per ogni x, y R,
(x + y) = e2i(x+y) = e2ix e2iy = (x) (y),
quindi moltiplicativo. Che sia continuo ovvio, perch lo la
funzione esponenziale.
La famiglia { : R} una famiglia di omomorsmi di grande importanza in Analisi Armonica: essa forma un sistema ortonormale completo
in L2 , e i prodotti scalari
Z
Z
(f, ) =
f (t) (t) dt =
f (t)e2it dt = fb()

sono i valori della trasformata di Fourier di f L1 (R).


Per via di questo ruolo cruciale, gli omomorsmi continui di un gruppo
commutativo su T hanno un nome speciale: si chiamano i caratteri del gruppo. I caratteri sono i blocchi costituenti dellanalisi di Fourier per funzioni su
R. Esattamente allo stesso modo si pu costruire una trasformata di Fourier
su un arbitrario gruppo commutativo G su cui sia denita una struttura di
integrale, come ora indichiamo. Sia f : G G una funzione su G, con
integrale nito, e siano {s } i caratteri di G (qui s varia in un opportuno
b in analogia all caso di R, dove i
insieme di indici, che indicheremo con G
b = R). Allora la trasformata di
caratteri erano parametrizzati da R
Fourier di funzioni su G si denisce cos:
Z
b
f (s) =
f (g)s(g) dg.
G

974

CAPITOLO 14. DFT

Ci limitiamo a esaminare in concreto il caso del gruppo ZN . Quali sono i


caratteri di ZN ? Osserviamo che, se : ZN 7 T un carattere, cio una
funzione moltiplicativa (automaticamente continua, perch ZN un insieme
nito, quindi discreto), allora, componendo con lomomorsmo canonico
: Z 7 ZN , si ottiene un carattere = di Z. Infatti ovvio che la
composizione di due applicazioni moltiplicative moltiplicativa:
(n + m) = (n + m) = ((n)(m))
= ((n)) ((m))
= (n)(m).

Ma Z R. Quindi una vasta classe di caratteri di Z si ottiene per restrizione


da R: sono esattamente le funzioni dove (n) = e2in . Poich (n) =
e2in , ora abbiamo (n) = (n) . Ma allora, quali di questi caratteri di Z
provengono da caratteri di ZN tramite la corrispondenza vista prima, =
? Richiedere che un carattere sia di questo tipo signica richiedere che
= = , e quindi che (w) = w per ogni w ZN . Indichiamo
questultima funzione con . Per non per tutti gli R la funzione
un carattere di ZN , perch non sempre rispetta la propriet di periodicit.
Se w = e2i/N ZN , allora w N = 1 e si deve avere (w n ) = (1) = 1.
Ma (w n ) = w n .In generale w n = e2in 6= 1: il valore 1 si ottiene solo
se Z. Quindi le funzioni su Z danno luogo a caratteri di ZN se e
solo se m Z. Osserviamo per che questi caratteri m si ripetono in modo
periodico al variare di m: infatti, se w ZN , allora w = e2ik/N per qualche
k intero, e m (w) = e2imk/N . Perci
m+N (w) = e2i(m+N )k/N = e2imk/N e2ik
= e2imk/N
= m (w).

Quindi sullinsieme dei caratteri c la stessa struttura di periodicit di periodo N. Pi precisamente:


b di un gruppo commutativo
Proposizione 14.3.2. Linsieme dei caratteri G
G anchesso un gruppo commutativo.

14.3.

TRASFORMATA DI FOURIER SU ZN

975

b ha una operazione di prodotto, perch dati due caratteri


Dimostrazione. G
1 e 2 essi si possono moltiplicare fra loro, e si ottiene un altro carattere
(1 2 )(x) 1 (x)2 (x) che verica:
1 2 (x + y) = 1 (x + y)2 (x + y) = 1 (x)1 (y)2(x)2 (y)
= 1 2 (x)1 2 (y).
Inoltre esiste un elemento neutro (il carattere dato dalla funzione costante
1) ed ogni carattere ha un inverso (il carattere x 7 (x)1 ). Inne,
b commutativa, perch ( x) e 2 (x)
chiaro che loperazione di prodotto in G
appartengono a T, sono numeri complessi, e quindi il loro prodotto commuta:
1 (x)2 (x) = 2 (x)1 (x), cio 1 2 = 2 1 .

Ora sappiamo che il gruppo dei caratteri di ZN contiene gli N caratteri


{n }n=0,1,...,N 1 (o se si preferisce {n n Z}, ma a causa della periodicit
questi caratteri sono gli stessi N di prima). Perci, grazie alla periodicit,
abbiamo ottenuto il risultato seguente:
Proposizione 14.3.3. Il gruppo dei caratteri di ZN ZN (cio tutti i caratteri sono del tipo n per qualche n = 0, 1, . . . , N 1).

Come si scrive la trasformata di Fourier rispetto ai caratteri di ZN (cio


la trasformata di Fourier in ZN )?
Consideriamo una funzione su ZN . Questa funzione non altro che una
successione periodica di periodo N o, se si preferisce, una successione nita
{x0 , . . . , xN 1 } di numeri complessi. Indichiamo con X questa successione
nita. Allora, per denizione, calcolare la trasformata di Fourier signica
eseguire il prodotto scalare con i caratteri. Il prodotto scalare sul cerchio T
si scriverebbe in modo ovvio in termini della naturale struttura di integrale,
quella rispetto a d. Daltra parte il suo sottoinsieme ZN delle radici Nesime dellunit un sottoinsieme nito: qui invece dellintegrale avremo
una somma. Di solito su T si considera lintegrale normalizzato: se f una
funzione su T, si pone
Z
Z
1
f=
f () d.
2
T
Analogamente, se X una funzione su ZN , scriviamo
Z
N 1
1 X
xk .
f=
N k=0
ZN

976

CAPITOLO 14. DFT

b data dal prodotto scalare con i caratteri,


Allora la trasformata di Fourier X,
:
b
X(n)
= (X, n ) =

N 1
1 X
xk n (w k )
N

1
N

k=0
N
1
X

xk e2ink/N .

k=0

Ebbene, questa esattamente la DFT della successione X = {x0 , . . . , xN 1 }


(Denizione 14.2.2). Abbiamo provato:
Proposizione 14.3.4. La trasformata di Fourier sul gruppo ciclico ZN con
N elementi la DFT di ordine N.

14.4

Convoluzione ciclica normalizzata e DFT

Vogliamo introdurre una convoluzione per successioni periodiche di periodo


N, ma diversamente da quanto abbiamo fatto per funzioni periodiche nella
Denizione 6.1.2. In quel caso ponemmo
Z
f g(x) =
f (x t)g(t) dt

Senza normalizzare lintegrale (in vari libri questo integrale viene normalizzato dividendo per 2). Ora, invece:
Definizione 14.4.1. (Convoluzione di successioni periodiche.) Se

{xn }
n= e {yn }n= sono successioni periodiche di periodo N, poniamo
N 1
1 X
(x y)n =
xnk yk .
N k=0

Nota 14.4.2. (Convoluzione ciclica normalizzata.) Abbiamo gi notato


che, poich le successione di periodo N hanno solo N valori diversi, di solito
non le si considera alla stregua di successioni innite periodiche, bens di

14.4. CONVOLUZIONE CICLICA E DFT

977

successioni nite di N valori {x0 , . . . , xN 1 }. In tal caso, la denizione di


convoluzione diventa la seguente: per n = 0, . . . , N 1,
N 1
1 X
(x y)n =
xnk (mod N ) yk
N k=0

dove (n k mod N vale n k se 0 6 n k < N e vale n k + N se


N 6 n k < 0. Quindi x y(n) = x y(n) dove x e y sono le successioni
innite ottenute periodicizzando x e y a passo n (cio denendo xn+jN = xn
per 0 6 n < N 1 e j Z).

Nota 14.4.3. (Convoluzione sul gruppo ciclico ZN ) In Sezione 14.2 abbiamo considerato un altro modo di visualizzare le successioni periodiche di
periodo N, come funzioni (cio successioni) sul gruppo ciclico ZN = {1 =
w 0 , w, w 2, . . . , w N 1 } dove w = e2i/N . Scrivendo = 2i
possiamo identiN
care ZN con la successione di angoli {0, , 2, . . . , (N 1)}, dove, naturalmente, N = 2 = 0 mod 2. Allora le successioni x su ZN sono funzioni del
parametro discreto n, ed identicando gli angoli modulo 2 otteniamo
N 1
1 X
x(n k)y(k).
x y(n) =
N k=0

Quindi la convoluzione delle successioni x e y la convoluzione rispetto alla


operazione di somma di ZN .

Avendo introdotto la nozione di convoluzione, ora studiamo la DFT della


convoluzione di due successioni, cio lanalogo delle propriet di moltiplicativit dimostrata per i coecienti di Fourier di funzioni in L1 (R) nel Teorema
8.5.1.
Nota 14.4.4. Si riveda la dimostrazione del Teorema 8.5.1 e si noti che la
propriet dimostrata in quel teorema, cio
f[
g = fbgb

conseguenza solo del fatto che la misura di Lebesgue su R invariante per


traslazione e che gli esponenziali sono moltiplicativi da R a C: cio del fatto
che per ogni R, per ogni t, s R si ha
e2i(t+s) = e2it e2is .

978

CAPITOLO 14. DFT

Se si scrive (t) = e2it questultima identit equivale alla moltiplicativit


(t + s) = (t) (s)
cio al fatto che un carattere di R (si veda la denizione di carattere
data in Sezione 14.3 e la Proposizione 14.3.1). Ma in Sezione 14.3 abbiamo
osservato che, dato un gruppo commutativo G con una struttura di integrale
(cio una misura, nella terminologia di [22]) invariante per traslazione, allora
si pu denire sulle funzioni in L1 (G) una trasformata di Fourier usando, al
posto degli esponenziali complessi, i caratteri di G. (Per inciso, interessante
sapere che, se sul gruppo si ha una denizione di convergenza rispetto alla
quale le operazioni di prodotto e di inverso sono continue, esiste sempre una
misura invariante: per la dimostrazione, non elementare, si veda, ad esempio
[24] e la sua bibliograa).

Poich i caratteri sono moltiplicativi, per la loro denizione, allora ci


aspettiamo che la moltiplicativit della trasformata di Fourier rispetto alla
convoluzione, f[
g = fbb
g, valga, in generale, per lanalisi armonica sui gruppi
commutativi. Questo fatto vero, ma molto pi in generale di quanto non sia
opportuno presentare qui. Noi ci limitiamo al caso particolare G = ZN , dove
conosciamo esplicitamente la trasformata di Fourier: la DFT (Proposizione
14.3.4). Per semplicit dora in avanti, quando non c ambiguit, indichiamo
la DFT con la stessa notazione che si usa per la trasformata di Fourier su R:
Notazione 14.4.5. Se x = {x0 , . . . , xN 1 } ZN , scriviamo x
b = DFT(x) .

Teorema 14.4.6. Se x e y sono vettori in CN (successioni di N elementi,


o , se si preferisce, successioni periodiche di periodo N, o equivalentemente
funzioni su ZN ), allora
x[
y =x
byb .

Dimostrazione. Bisogna provare che, se

zn =

N 1
1 X
xnj yj = (x y)n
N j=0

14.4. CONVOLUZIONE CICLICA E DFT

979

allora
(DFT(z))n =

N 1
1 X
zk w kn
N k=0

1
N

N
1
X
k=0

xk w kn

1
N

N
1
X

yk w kn

k=0

dove w = e2i/N .
Come anticipato, questo segue dalla moltiplicativit degli esponenziali:
k
w = w km w m per ogni k, m. Infatti:
!
N 1
N
1
N
1
X
X
1 X
1
1
zk w kn =
xkm ym w kn
N k=0
N k=0 N m=0
N 1
N 1
1 X 1 X
xkm w (km)n ym w mn
N k=0 N m=0
!
!
N
1
N
1
X
X
1
1
=
ym w mn
xj w jn
N m=0
N j=0

dove abbiamo posto j = k m e scambiato lordine delle somme. Nellultima


somma, dove gli indici variavano da k a kN 1, abbiamo usato la periodicit
per riportarci a j = 0, . . . , N 1, in piena analogia al Lemma 5.1.1.

Esercizio 14.4.7.
PN 1 Se non si normalizzasse la convoluzione, ossia se si ponesse
(xy)n =
j=0 xnj yj = (x y)n , allora per ottenere la stessa propriet
dy = x
di moltiplicativit,
byb, occorrerebbe non normalizzare la DFT, ossia
PN 1xnk
denire x
bn = k=0 w xk .

Definizione 14.4.8. (Parit.) Se x una successione periodica di periodo


N, poniamo x = xn = xN n . In particolare, se si considera x come una
successione nita di N elementi, abbiamo
xn = xN n

(n = 0, . . . , N 1).

Lemma 14.4.9. Per tutte le successioni finite x e y si ha


(x y) = x y .

980

CAPITOLO 14. DFT

Dimostrazione. Per ogni n = 0, . . . , N 1,


(x y )n =

N 1
1 X
xnj yj
N j=0

N 1
1 X
=
xjn yj
N j=0

N 1
1 X
=
xN jn yN +j
N j=0

N 1
1 X
xjn yj
=
N j=0

(sostituendo j N j)
(per la periodicit)

= (x y)n = (x y)n .

Il prossimo risultato estende alla DFT la propriet di parit della trasformata di Fourier (Teorema 8.2.4 (ii)).
Lemma 14.4.10. Per ogni successione finita x CN (ovvero periodica di
periodo N),
x
b = xb .
Dimostrazione. Poich w N = 1, per ogni n = 0, . . . , N 1 si ha
x
bn

=x
bN n

N 1
1 X
=
xj w (N n)j
N j=0
N 1
1 X
=
xj w nj
N j=0

N 1
1 X
=
xN j w n(N j) = (xb )n .
N j=0

Estendiamo ora alla DFT la propriet di coniugazione della trasformata


di Fourier (Teorema 8.2.4 (ix)).

14.4. CONVOLUZIONE CICLICA E DFT

981

Lemma 14.4.11. Per ogni successione finita x CN (ovvero periodica di


periodo N),
b
x = (b
x ) .
Dimostrazione. Per n = 0, . . . , N 1 si ha
(b
x)n =

N 1
N 1
1 X
1X
xk w kn =
xk w nk
N
N
k=0

k=0

= (b
x)n = (b
x)n .

Il prossimo risultato lanalogo per la DFT della propriet della trasformata di Fourier iterata (Teorema 8.2.4 (iii)).
Teorema 14.4.12. Per ogni successione finita x CN ,

In altre parole, x
b=

1
(x )
N

1
b
x
b = x .
N

1
(x ) ,
N

e quindi

x = N xb = N x
b .

Dimostrazione. Consideriamo x come successione periodica di periodo N.


c = x, cio
Per ogni n = 0, . . . , N 1, dal Teorema 14.2.4 si ha x
!
N 1 N 1
1 X X
xn =
xk w km w nm
N m=0 k=0
N 1 N 1
1 XX
=
xk w km w nm .
N m=0
k=0

Quindi
N 1
N 1
1 X 1 X
1
xk w kmw nm = (b
x
b)n .
xn =
N
N m=0 N k=0

982

CAPITOLO 14. DFT

Corollario 14.4.13. Se x, y sono successioni finite di N elementi (ovvero


periodiche di periodo N) si ha
(i) (xy) = x y
(ii) x
cy = N x
b yb

Dimostrazione. Dal Teorema 14.4.6 sappiamo che, per tutte le successioni


nite di N elementi , CN si ha d
= bb
. Daltra parte, dal Teorema
14.2.4 si ha che la DFT surgettiva sullo spazio delle successioni nite, quindi
esistono successioni nite , tali che x = b e y = b. Perci
  

(xy) = bb
= d
= = x y.

Questo prova (i). Da (i) segue xy = x[


y, e quindi

[
y
x
cy = x[
1
(
x y)
(Teorema 14.4.12)
=
N
1
=
(
x) (
y ) (Lemma 14.4.9)
N
= Nx
b yb
(Teorema 14.4.12 applicato due volte).

Questo prova (ii).

Corollario 14.4.14. Per tutte le successioni finite x, y CN ,


(x y) =

1
xy
N

Dimostrazione. Dallultima identit del Teorema 14.4.12 sappiamo che


x
b =

1
x
N

(abbiamo gi usato questo fatto nella dimostrazione del Corollario 14.4.13 (ii)).
Da questo fatto e dalla propriet di convoluzione (Teorema 14.4.6) si ha
(x y) = N([
x y) = N(b
xyb) = N x
b yb =

1
xy .
N

14.5. CONVOLUZIONE NON NORMALIZZATA

14.5

983

Convoluzione ciclica non normalizzata e


moltiplicativit della sua DFT

La Denizione 14.4.1 di convoluzione ciclica, con la normalizzazione per il


fattore N1 , consente di dimostrare la moltiplicativit nella forma elegante del
Teorema 14.4.6, ma ha uno svantaggio concettuale. Le successioni nite con
N valori si immergono nello spazio 1 di tutte le successioni di somma nita
in maniera naturale: alla successione x = {x0 , . . . , xN 1 } ZN si fa corrispondere x 1 = 1 (N) data da x = {x0 , . . . , xN 1 , 0, 0, . . . , }. Vorremmo
che la denizione di convoluzione ciclica per le successioni nite di N termini
fosse un caso particolare della denizione per 1 , dove si ha:
(x y)n =

xnk yk .

k=

In questa espressione per la convoluzione su 1 non ci sono fattori di normalizzazione N1 (non possono esserci: qui N = ). Per ottenere la desiderata conformit con il caso di successioni innite occorre quindi cambiare la
denizione di convoluzione su ZN :
Definizione 14.5.1. (Convoluzione ciclica non normalizzata.) Se x, y
CN (successioni nite di N elementi, ovvero periodiche di periodo N), la loro
convoluzione ciclica non normalizzata :
(xy)n =

N
1
X

xnk yk .

k=0

Teorema 14.5.2. Come accennato nella Notazione a pagina 978, scriviamo


dora in poi x
b = DFT(x), yb = DFT(y) CN . Allora si ha
d
x
y = N x
byb.

Dimostrazione. Segue dalle Denizioni 14.4.1 e 14.5.1 che


xy = N x y.
Perci dal Teorema 14.4.6 otteniamo
d
x
y = N x[
y =Nx
byb .

984

CAPITOLO 14. DFT

Nota 14.5.3. Ricordiamo che, al ne di ottenere la moltiplicativit (senza il


fattore N) della DFT di una convoluzione non normalizzata, occorre usare
una DFT non normalizzata (Esercizio 14.4.7).
Lesistenza di due diverse normalizzazioni per la convoluzione ciclica, con due
conseguenti teoremi per la trasformata di Fourier, non una particolarit del
caso nito: si ha anche nel caso continuo. In eetti, per f, g L1 (R) abbiamo
denito la convoluzione senza normalizzazione
Z
f g(x) =
f (x y)g(y) dy

(Denizione 6.1.11), ma daltra parte, per f, g L1 (funzioni periodiche di


periodo 2), abbiamo normalizzato:
Z
1
f g(x) =
f (x y)g(y) dy
2
(Denizione 6.1.2). Se invece per f, g L1 avessimo denito la convoluzione
non normalizzata,
Z
f g(x) =
f (x y)g(y) dy,

avremmo avuto la stessa normalizzazione per L1 e per L1 , per invece che

sarebbe risultato

f[
g(n) = fb(n)b
g (n)

f[
g(n) = 2 fb(n)b
g (n)

(la verica lasciata come esercizio).


In questo libro abbiamo cercato di mascherare il pi possibile questa
ambiguit scegliendo
R 1 il periodo uguale a 1, ossia denendo i coecienti di
Fourier fb(n) come 0 f (t) e2int dt (solo nei Capitoli 5 e 6 abbiamo rinunciato al fattore 2 allesponente per alleggerire la notazione e non dover sempre
scrivere cos(2nt) o sin(2nt), e quindi solo in quei capitoli abbiamo costantemente utilizzato funzioni periodiche di periodo 2, ma dopo aver avvertito
il lettore che questa era una scelta locale). Questa scelta del periodo, e quindi dei coecienti di Fourier, ci ha poi portato a denire la trasformata di
Fourier tramite un integrale con peso e2it invece che eit : in tal modo,

14.6. TRASLAZIONE E DFT

985

per la trasformata di Fourier inversa, il fattore di normalizzazione diventa 1.


Purtroppo non si pu scegliere altrettanto oculatamente il periodo nel caso
della DFT, perch se N = 1 la DFT , banalmente, loperatore identit su
successioni di un solo elemento.

Corollario 14.5.4. Per tutte le successioni x, y CN (successioni finite di


N elementi, ovvero periodiche di periodo N), si ha
(i) xy = (xy)
(ii) (xy)b= x
byb

(iii) (x y) =

1
N

xy

Dimostrazione. Dalle Denizioni 14.4.1 e 14.5.1 abbiamo che xy = Nx y.


Perci:
(i) in base al Corollario 14.4.14, (xy) = N(x y) = x y;
(ii) in base al Corollario 14.4.13 (ii), (x y)b= N x
b yb = x
b yb;

(iii) in base al Corollario 14.4.13 (i), (x y) = x y =

1
N

xy.

14.6

Propriet di traslazione della DFT e identit di Parseval

Definizione 14.6.1. (Base canonica di CN : la delta discreta.) Per


k = 0, . . . , N 1 poniamo
k = {0, 0, . . . , 0, 1, 0, . . . , 0}
con 1 al posto k-esimo. Osserviamo che k corrisponde al k-esimo vettore
canonico della base di CN (abbiamo gi osservato pi volte che lo spazio
delle successioni di N elementi isomorfo a CN ).

986

CAPITOLO 14. DFT



Esercizio 14.6.2. bk = N1 1, w k , w 2k , . . . , w (N 1)k .
Svolgimento. Per ogni n = 0, . . . , N 1, (bk )n =

1
N

PN 1
j=0

kj w jn =

1 kn
w .
N

Proposizione 14.6.3. (La traslazione come convoluzione con la delta.) Sia k loperatore di traslazione ciclica sullo spazio CN delle successioni
di N elementi (ovvero di periodo N):
(k x)n = xnk
(qui n k inteso modulo N). Allora, nella notazione del Lemma 14.2.5,
k x = Nk x = x.
Dimostrazione. Per ogni n = 0, . . . , N 1 si ha:
(k x)n =

N 1
1 X
(k )nj xj
N j=0

N 1
1 X
k,nj xj
=
N j=0

N 1
1 X
=
j,nk xj
N j=0

1
xnk
N
1
(k x)n
=
N

perch k,nj = 1 se e solo se k = n j, cio se e solo se j = n k, e zero


altrimenti.

Da questi fatti segue lanalogo per la DFT della propriet di traslazione


della trasformata di Fourier (Teorema 8.2.4 (v)):

Corollario 14.6.4. (Propriet di traslazione.) Per ogni k = 0, . . . , N 1


e per ogni x CN (successione finita di N elementi, ovvero periodica di
periodo N),
kn
d

bn .
k xn = w x

14.6. TRASLAZIONE E DFT

987

Dimostrazione. una conseguenza immediata del Corollario 14.6.3, e del


Teorema di convoluzione 14.4.6 e dellEsercizio 14.6.2.

Esercizio 14.6.5. Ridimostrare il Corollario 14.6.4 calcolando la DFT di entrambi i lati e mostrando che sono uguali.

Per il prossimo risultato abbiamo bisogno del seguente fatto preliminare:


Esercizio 14.6.6. Per ogni successione di N elementi x CN , ovvero periodica
di periodo N, si ha:
(i) x
b0 =

(ii) x0 =

1
N

PN 1
n=0

PN 1

Svolgimento.

n=0

xn

x
bn .

(i) Segue direttamente dalla Denizione 14.2.2 di DFT.


(ii) Segue dalla Denizione 14.2.2 di IDFT.

Proposizione 14.6.7. (Identit di Parseval per la DFT.) Per ogni


x CN (ovvero successione periodica di periodo N),
N
1
X
k=0

|b
xk | = N

N
1
X
k=0

|xk |2 .

988

CAPITOLO 14. DFT

Dimostrazione.
N
1
X
k=0

|xk | =

N
1
X
k=0

xk xk

= N(x x )0
=N
=N
=N
=N
=N
=

N
1
X
k=0
N
1
X
k=0
N
1
X
k=0
N
1
X
k=0
N
1
X

k=0
N
1
X
k=0

(x x )kb
x
bk xb k

xk
x
bk b

x
bk x
bk

(Definizione 14.4.1)
(Esercizio 14.6.6)
(Teorema 14.4.6)
(Lemma 14.4.10)
(Lemma 14.4.11)

x
bk x
bk

|b
xk |2 .

14.7

Propriet di parit della DFT

Definizione 14.7.1. Si dice che la successione nita x CN (ovvero periodica di periodo N) pari se x = x, dispari se x = x.
Esempio 14.7.2. Considerando le successioni x CN come funzioni su ZN
(come in Sezione 14.3), si ottiene che x pari se i suoi valori sono invarianti
per la riessione dei punti di ZN (considerati come punti sul cerchio complesso
di raggio 1) rispetto allasse orizzontale, e dispari se sotto questa riessione
i valori cambiano di segno.
Da qui segue che, per x dispari, allora x0 = 0, e se N pari anche x N = 0.
2

14.7. PARIT E DFT DI SUCCESSIONI REALI

989

Esercizio 14.7.3. N = 6

In questo caso, x pari x1 = x5 = xN 1 = x1 e x2 = x4 = x2 ; x


dispari x0 = x0 = x0 = 0, x3 = x3 = x3 = 0, x1 = x5 = x1
e x2 = x4 = x2 .

Esercizio 14.7.4. N = 5

In questo caso, x pari x1 = x4 = xN 1 = x1 e x2 = x3 ; x dispari


x0 = x0 = x0 = 0, x1 = x4 = x1 e x2 = x3 = x2 .

Esercizio 14.7.5. (i) N = 4: mostrare che in questo caso, le successioni


pari sono quelle del tipo {a, b, c, b} con a, b, c C e quelle dispari sono
del tipo {0, b, 0, b} con b C.
(ii) N = 5: mostrare che in questo caso, le successioni pari sono quelle del tipo {a, b, c, c, b} con a, b, c C e quelle dispari sono del tipo
{0, b, c, c, b} con b, c C.

990

CAPITOLO 14. DFT

(iii) Caratterizzare in maniera simile le successioni pari e dispari per N = 3


e per N = 6.

Proposizione 14.7.6. (i) Se x CN pari (nel senso della Definizione


14.7.1) allora x
b pari, e viceversa.
(ii) Se x CN dispari allora x
b dispari, e viceversa.

Dimostrazione. Consideriamo x CN come successione periodica di periodo


N. Dire che x pari signica che x = x . Poich xb = (b
x) (Lemma 14.4.9)
si ha (b
x) = xb = x
b. Questo prova (i). La dimostrazione di (ii) analoga.

Proposizione 14.7.7. (i) Se x CN una successione di N valori reali,


allora Re x
b una successione pari e Im x
b dispari, e viceversa;

(ii) se x CN a valori immaginari, allora Re x


b una successione dispari
e Im x
b pari, e viceversa.

Dimostrazione. La parte (i) segue direttamente dal Lemma 14.4.11, che, per
una successione x a valori reali, asserisce che x
b = (b
x) . Di conseguenza, visto

che ovviamente x = x , se x reale abbiamo x


b = (b
x) , e quindi
(Re x
b) = Re(b
x ) = Re x
b = Re x
b,

ed analogamente (Im x
b) = Im x
b.
Viceversa, se Re x
b pari e Im x
b dispari, allora

b.
(b
x) = (Re x
b + i Im x
b) = (Re x
b) + i(Im x
b) = Re x
b i Im x
b=x

(14.2)

Quindi x
b = (b
x) . Daltra parte, per il Lemma 14.4.11, (b
x) = b
x. Da queste
b
due identit segue che x
b = x, e quindi, per linvertibilit della DFT (Teorema
14.2.4), x reale.
La dimostrazione di (ii) analoga.

Corollario 14.7.8. (i) Se la successione finita (o periodica) x a valori


reali e pari, allora x
b reale e pari;
(ii) se x immaginaria e pari, allora x
b immaginaria e pari;

14.8. DFT E DILATAZIONI

991

(iii) se x reale e dispari, allora x


b immaginaria e dispari;
(iv) se x immaginaria e dispari, allora x
b reale e dispari.

Dimostrazione. Per provare (i) basta ricordare che, per la Proposizione


14.7.6, se x pari anche x
b pari, quindi tali sono la sua parte reale ed
immaginaria. Per, se x anche reale, Im x
b deve essere dispari in base alla
Proposizione 14.7.7 (i). Quindi Im x
b simultaneamente pari e dispari, e perci nullo: quindi x
b reale. Le altre parti dellenunciato si dimostrano in
maniera analoga.

14.8

Propriet di dilatazione della DFT

Cosa vuol dire dilatare una successione? Supponiamo di avere x CN e


che gli N valori x0 , . . . , xN 1 siano considerati alla stregua di dati in un istogramma, al variare del tempo i = 0, . . . , N 1. Dilatare questo istogramma
con passo 2 signica lasciar variare il tempo su un intervallo doppio, da 0
a 2N 1, ed equidistribuire gli N valori su questo intervallo raddoppiato.
In tal modo, per, riempiamo solo met degli indici da 0 a 2N 1: per gli
altri indici laltezza dellistogramma rimane 0. Quindi stiamo raddoppiando
la lunghezza della successione di dati, ma non linformazione: usiamo i dati
originali e li inframmezziamo con zeri.
Definizione 14.8.1. Per ogni intero positivo K e per ogni x CN , in
analogia con la notazione introdotta per le distribuzioni (Denizione 11.12.6;
si veda anche lEsempio 11.12.8), la dilatazione di passo K, 1 x CKN ,
K
la successione nita (ovvero periodica di periodo KN)

1
xj
se m = Kj, j = 0, . . . , N 1
( 1 x)m =
K
0
altrimenti.
K

992

CAPITOLO 14. DFT

Esempio 14.8.2. 1 x = {x0 , 0, x1 , 0, x2 . . . , xN 1 , 0}.


2
Se il disegno in gura 14.8 riguardasse distribuzioni invece che successioni
periodiche, avremmo niente altro che loperatore di dilatazione 21 1 denito
2
nella Denizione 11.12.6: la distribuzione ora
F =

N
1
X

xi i ,

i=1

e quindi
N
1
X
1
1
xi 2i .
F =
2 2
i=1

La trasformata di Fourier, in base al Teorema 11.12.9, verica


1[
1 F = 2 Fb.
2 2

(14.3)

Ma nel nostro caso, pensata come successione, x CN diventa una successione periodica di periodo N. Quindi 21 1 F periodica di periodo 2N (i
2
suoi elementi sono {x0 , 0, x1 , 0, . . . , xN 1 , 0} C2N e poi ripetuti per perio[
1 F anche essa periodica di periodo 2N. Daltra parte, lidentit
dicit) e
2
b determinata da soli N valori (perch Fb
[
1 F = 2 F
(14.3) rivela che 1
2

una successione periodica di impulsi, di periodo N). Quindi 2 Fb, al variare dellindice da 0 a 2N 1 deve ripetere due volte i suoi valori, con due
repliche consecutive, la prima sui primi N indici e la seconda sui successivi
N indici. Si noti che, considerata come distribuzione, 2 Fb una successione periodica di impulsi centrati non pi agli istanti interi, ma ai semi-interi
1
Z = {0, 21 , 1, 32 , . . . }. Nondimeno, se la si considera nellambito degli
2
indici puramente discreti della DFT, quello che conta non dove sono centrati questi impulsi, ma quanti sono i dati che bastano per determinare la
successione periodica, quindi quanto il periodo. In questo modo abbiamo
dimostrato un risultato sulla DFT con lapproccio indiretto di passare attraverso la trasformata di Fourier di distribuzioni (si vedano la Nota 13.1.6 e
Sezione 14.1). Ora enunciamo il risultato e lo dimostriamo in maniera intrinseca. Per maggior generalit, invece della dilatazione di passo 2, consideriamo
la dilatazione per un qualsiasi passo K intero positivo.

14.8. DFT E DILATAZIONI

993

Teorema 14.8.3. (Propriet di dilatazione per la DFT.) Se K un


intero positivo, x CN ed il suo dilatato K1 1 x di passo K definito come
K
in Definizione 14.8.1, allora si ha:

1
1\
1 x)n = (DFTKN ( 1 x))n
K K
K K

1
x
b

K n

x
b

K nN
1
=
x
b
K n2N

...

1
x
b
K n(K1)N

per
per
per
per

n = 0, . . . , N 1

n = N, . . . , 2N 1

n = 2N, . . . , 3N 1
n = (K 1)N, . . . , KN 1

In altre parole

1
1
1 x)=
x
bn mod N
n
K
K
K

per n = 0, . . . , KN 1, od anche
(DFTKN (

1
1
1 x))n =
DFTN (x)n mod N .
K K
K

In particolare, se identifichiamo K1 1 x con la sua estensione periodica di


K
periodo N, lultima identit diventa
(DFTKN (

1
1
1 x))n =
DFTN (x)n
K K
K

(n Z).

Dimostrazione. Scriviamo w = e2i/KN . Osserviamo che w una radice


dellunit di ordine KN, e w K = e2i/N una radice dellunit di ordine N.
Rammentiamo che
(K x)j =

0
xm

se j 6= mK
se j = mK, m = 0, . . . , N 1

994

CAPITOLO 14. DFT

Quindi, per ogni n,


KN 1
1 X 1
1
( 1 x)j w jn
(DFTKN ( 1 x))n =
K K
KN j=0 K K

(14.4)

N 1
1 X
=
xm w mKn
KN m=0

N 1
1 1 X
xm (w K )mn
=
K N m=0

1
(DFTN (x))n ,
K

dove abbiamo considerato DFTN (x) CN come successione periodica di


periodo N. Questo prova il Teorema nella forma dellultima identit dellenunciato. Se invece consideriamo DFTN (x) come successione nita di N
passi, allora se n = n0 mod N, cio se n = n0 + kN, (k = 0, . . . , N 1) si ha
N 1
N 1
1 X
1 X
K mn
xm (w )
=
xm (w K )mn0 (w K )kN
N m=0
N m=0

N 1
1 X
xm (w K )mn0
N m=0

perch w kN = 1 e quindi (w K )kN = 1. Perci (14.4) diventa


(DFTKN (

1
1
1 x))n = (DFTN (x))n0 .
K K
K

Questo prova il Teorema nella forma delle altre identit dellenunciato.

14.9

La DFT di successioni a valori reali

Nel resto di questo capitolo usiamo intensamente le propriet di parit e


disparit di successioni e delle loro DFT. Per evidenziare queste propriet
riscriviamo la DFT di una successione periodica come facemmo in Sezione 5.6
per i coecienti di Fourier, scrivendoli come integrale da 2 a 2 invece che
da 0 a .

14.9. RDFT

995

Nota 14.9.1. Se x CN considerata come una successione periodica di


periodo N, a causa della periodicit della successione w n dalla Denizione
14.2.2 segue che, per k = 0, . . . , N 1 :
N

1
DFT(x)k = x
bk =
N

2
X

xn w nk .

]+1
n=[ N
2

(Se N dispari, allora il primo termine della sommatoria ha per indice il pi


piccolo intero k > [ N2 ] + 1, cio k = ( N2 12 ) + 1 = N2 + 21 , e lultimo ha
per indice il pi grande intero k < N2 , cio k = [ N2 ] = N 21 ).

Nota 14.9.2. Supponiamo che x CN sia a valori reali. Allora, dalla Proposizione 14.4.11, sappiamo che x
b=x
b . Perci x
b0 R, e se N2 intero (cio
se N pari) anche x
b N R (nel seguito ci baster il caso N pari, ma non
2
abbiamo bisogno di restringere lattenzione a questo caso particolare). Osserviamo quindi che, se x una successione di N numeri reali e N pari, x
b
N
determinata dagli 2 1 numeri complessi {b
x1 , . . . , x
b N 1 } pi i due numeri
2

bm = x
bm ); invece, se N dispari, x
b determinata
reali x0 e x N (perch x
2
da N 21 (ossia [ N2 ]) numeri complessi {b
x1 , . . . , x
b N1 } e dal numero reale x0 .
2
Poich un numero complesso consiste di una coppia di numeri reali, in entrambi i casi x
b determinata da N numeri reali, tanti quanti i dati (cio la
successione x).

Nota 14.9.3. (DFT reale.) Dalla espressione della DFT data nella Nota
14.9.1 e dalle considerazioni sulla simmetria della Nota 14.9.2 segue che, se
x CN a valori reali, allora x
b determinata dai suoi valori x
bk , k = 0, . . . , N2 ,
dati da
N

1
x
bk =
N

2
X

+1
n= N
2



2nk
2nk
cos
xn
i sin
N
N

(RDFT).

996

CAPITOLO 14. DFT

In altre parole,

Re x
bk
Im x
bk

1
=
N

2
X

xn cos

2nk
,
N

xn sin

2nk
.
N

n= N
+1
2
N

1
=
N

2
X

+1
n= N
2

Definizione 14.9.4. (RDFT.) Le formule della Nota 14.9.3 deniscono una


N
N
nuova trasformata da RN a C 2 1 R R se N pari, o a C[ 2 ] R se N
= 0 per k = 0 e k = N2 :
dispari (perch Im x
b0 = 0 = Im x
b N in quanto sin 2nk
N
2
questo fatto era stato anticipato nella Nota 14.9.2). La nuova trasformata si
chiama DFT reale (RDFT).

Dora in avanti, per semplicit, limitiamo lattenzione a N pari.

Proposizione 14.9.5. (Formula di inversione per la RDFT.) Per ogni


N pari, x RN e n = N2 + 1, . . . , N2 ,
1 

X
2kn
2kn
+b
x N cos(k) (IRDFT).
Re(b
xk ) cos
Im(b
xk ) sin
xn = x
b0 +2
2
N
N
k=1
N
2

14.10. DCT

997

Dimostrazione.
N

2
X

xn =

n= N
2

+1

N
2

x
bk w kn

(Definizione 14.2.2, Nota 14.9.1))

1
X
(b
xk w kn + x
bk w kn ) + x
b N cos(k)
= x
b0 +
2

k=1

(perch cos(k) = (1)k = w kN/2)


N

= x
b0 + 2

1
2
X
k=1

Re(b
xk w kn ) + x
b N cos(k)
2

bk )
(dal momento che x
bk = x

1 

2
X
2kn
2kn
= x
b0 + 2
+x
b N cos(k) .
Re(b
xk ) cos
Im(b
xk ) sin
2
N
N
k=1
N

14.10

La DFT di successioni reali pari: Trasformata Discreta dei Coseni (DCT)

Dal Corollario 14.7.8 (i) sappiamo che la DFT di una successione reale e pari
reale e pari. Per comodit di notazione, consideriamo la DFT a 2N punti
di una successione reale pari x R2N . Poich x reale, sappiamo dalla Nota
14.9.3 che x
b determinata dagli N valori x
bk , k = 0, . . . , N 1: gli altri si
ottengono dalla simmetria di parit, x
bk = x
bk . Ma poich x anche pari, la
formula della RDFT presentata nella Nota 14.9.3 ora diventa:
Nota 14.10.1. (RDFT di successioni pari.) Se x R2N pari e w =
w2N = e2i/2N = ei/N , allora x
b determinato dagli N + 1 valori reali xk

998

CAPITOLO 14. DFT

(k = 0, . . . , N) dati da
x
bk =

1
2N

N
X

xn w nk

n=N +1

#
"
N
1
X
1
=
x0 +
(xn w nk + xn w nk ) + xN w N k
2N
n=1
"
#
N
1
1 x0 X w nk + w nk xN
=
+
xn
+
(1)k
N 2
2
2
n=1
"
#
N
1
nk xN
1 x0 X
+
xn cos
+
cos(k) .
=
N 2
N
2
n=1

Le uguaglianze della Nota 14.10.1 deniscono la seguente nuova trasformata


da RN +1 a RN +1 :
Definizione 14.10.2. (Trasformata Discreta dei Coseni : DCT). Per
x RN +1 si denisce x
b = DCT(x) nel modo seguente: per k = 0, . . . , N,
"
#
N 1
nk xn
1 x0 X
+
xn cos
+
cos(k)
x
bk =
N 2
N
2
n=1

In paragone alla formula di inversione per la DFT, la DCT ha una propriet ancora pi simmetrica: a parte un fattore di normalizzazione, uguale
alla sua trasformata inversa, come mostra il risultato seguente:

Proposizione 14.10.3. (Formula di inversione per la DCT.) Se x


RN +1 e x
b = DCT(x), allora x = 2N DCT(b
x).

Dimostrazione. Poich x reale e pari, lo anche x


b, come gi osservato pi
sopra (Corollario 14.7.8 (i)). Ponendo Im x
bk = 0 nella formula di inversione
della RDFT (Proposizione 14.9.5, dove bisogna sostituire 2N al posto di N)
si ottiene, per n = 0, . . . , N:
xn = x
b0 + 2

N
1
X
n=1

x
bk cos

nk
+x
bN cos(k) = 2N b
x
bn = 2N DCT(b
x)n .
N

14.11. DFT, PERIODICIZZAZIONE E FORMULA DI SOMMA DI POISSON999


Nota 14.10.4. La DCT, cio la DFT di una successione reale pari, analoga
allo sviluppo in serie di Fourier di soli coseni di funzione periodiche pari
(Esercizio 5.2.8 (i)) ed alla trasformata di Fourier in coseni di funzioni reali
pari (Corollario 8.2.6 (i)).
Si osservi che la formula di inversione (Proposizione 14.10.3) pu essere estesa
ai valori di n interi al di fuori dellintervallo 0, . . . , N e produce una estensione
x periodica di periodo 2N e pari.

Nota 14.10.5. (DCT di successioni reali dispari: Discrete Sine Transform.) Se si parte da un x R2N dispari invece che pari, si ottengono
risultati analoghi con seni al posto dei coseni. In questo caso, per disparit,
si ha x0 = 0 = xN , e si trova

x
bk

N 1
nk
1 X
xn sin
=
N n=1
N

xn = 2

N
1
X
n=1

x
bn sin

(k = 0, . . . , N)

nk
= 2N b
x
bn
N

(DST),

(n = 1, . . . , N 1)

(IDST).

(la seconda uguaglianza vale anche per n = 0 e n = N, ma banale in questi


due casi perch x0 = 0 = xN e i seni si annullano).

14.11

DFT, periodicizzazione e formula di somma di Poisson

In questa breve Sezione nale riformuliamo mediante la DFT, in maniera


pi compatta ed elegante ma pi formale, la formula di somma di Poisson
che abbiamo presentato in maniera naturale in termini di periodicizzazioni
(Corollario 10.3.2 e Nota 10.3.5). Una versione pi esplicita e meno formale
del prossimo enunciato verr formulata e dimostrata nel Lemma 16.1.1.
Proposizione 14.11.1. (Formula di somma di Poisson espressa mediante la DFT.) Sia f una funzione che soddisfa le ipotesi della formula di
somma di Poisson di passo (Corollario 10.3.2 e Nota 10.3.5), e per n Z
poniamo xn = n , n = Nn . Scriviamo fn = f (xn ), fbn = fb(n ). Per N > 0
rammentiamo la definizione di operatore di periodicizzazione PN di passo N,

1000

CAPITOLO 14. DFT

introdotto nella Definizione 10.2.1 per funzioni di variabile reale anzich per
successioni:

X
fn+jN .
PN {fn } =
j=

Nelle ipotesi fatte sulla funzione f , questa serie converge: supponiamo per
semplicit una condizione leggermente pi forte, ossia che i dati {fn } siano
una successione in 1 .
Allora la formula di somma di Poisson diventa:
N{DF TN PN {fn }}k = PN {fbn }k .
In altre parole, il seguente diagramma commutativo:
{fn }

PN y

{fbn }

P
y N

PN {fn } N{DF TN PN {fbn }}


N DF TN

Nel caso = 1, la formula di somma di Poisson discreta diventa

X
DFT(f )k =
fb(k + mN)
m=

(si veda anche il Lemma 16.1.1 nel seguito).

Dimostrazione. Sappiamo dalla Nota 10.3.5 che, per ogni , si ha

X
fn e2ixn = P 1 fb() .

(14.5)

k=

Riscriviamo il primo membro di questa identit in termini di DFT e periodicizzazione di passo N e calcoliamolo alla frequenza k = k/N . Poich
xn = n si ottiene

fn e2ixn k =

n=

2
X

fn+jN e2i(n+jN )k/N

j= n= N +1
2

N
2

n= N
+1
2

PN {fm }n e2i(n+jN )k/N

== N DF TN {PN {fm } }k ,

14.12. ESERCIZI

1001

perch le serie hanno termini in 1 , quindi sono assolutamente convergenti,


e pertanto riordinabili, grazie al teorema del riordinamento di Riemann (Sezione 1.1).
Consideriamo ora il lato di destra dellidentit (14.5), P 1 fb(), e calcoliamolo

alla frequenza k . Poich gli k sono spaziati di passo N1 , in un intervallo di


lunghezza 1/ cadono esattamente N degli k . Pertanto la periodicizzazione
di passo 1/ della funzione fb, calcolata sulla successione {k }, equivale alla
periodicizzazione di passo N della successione fbk : ovvero,
P 1 fb(k ) = PN {fbk } .

Questo conclude la dimostrazione.

14.12

Esercizi sulla DFT

Esercizio 14.12.1. Sia x = {0, 2i, 0, 2i} una successione estesa per periodicit a tutti gli interi. Quale delle seguenti pu essere la sua trasformata di
Fourier?


1.  x
b = 0, 4i , 0, 4i
2.  x
b = {0, 1, 0, 1}

3.  x
b = {0, 2i, 0, 2i}

4.  x
b = {0, 1, 0, 1}

5.  nessuna delle precedenti

Esercizio 14.12.2. Sia x = {x0 , . . . , xN 1 } una successione estesa per periodicit a tutti gli interi. Se (m x)(n) = x(n m), come si esprime d
m x(k) in
termini di x
b(k)?

Esercizio 14.12.3. Sia x = {x0 , . . . , xN 1 } una successione estesa per periodicit a tutti gli interi. Se
N
1
X
xn = 0
n=0

quale delle seguenti successioni pu essere la sua DFT?

1002

CAPITOLO 14. DFT

1. 

{0, 1, 2, 3, . . . , N 1}

2. 

{1, 2, 3, . . . , N 1}

3. 

{1, 2, 3, . . . , N 1}

4. 

{1, 0, 0, . . . , N 1}

Esercizio 14.12.4. Sia x = {x0 , . . . , xN 1 } una successione estesa per periodicit a tutti gli interi. Quali delle seguenti aermazioni sono vere?
1. 

Se {x0 , x1 , x2 , x3 } dispari allora x0 = x2 = 0

2. 

2imk
Se (m x)(n) = x(n m) allora d
x
b(k)
m x(k) = e N

3. 
4. 
5. 

Se x reale e pari allora x


b immaginaria e pari
b
Se x reale allora x
b(k) = x(k)
nessuna delle precedenti

Esercizio 14.12.5. Siano x = {1, 1, 0, 2} e y = {1, 2, 2, 1} estese per periodicit a tutti gli interi. Allora
1.  x[
y(1) = 4i
2.  x[
y(1) = 14 (2 i)(1 + i)
3.  x[
y(1) = 41 (1 + 3i)(1 + i)
4.  x[
y(1) = 14
5. 

nessuna delle precedenti

Esercizio 14.12.6. Siano x = {1, 1, 2, 2} e y = {1, 0, 1, 1} due successioni


estese per periodicit a tutti gli interi. Quali delle seguenti asserzioni sono
vere?

14.12. ESERCIZI

1003

1.  x[
y(1) = 4i (2 + i)
2.  x[
y(1) = 41 (2 + i)(1 + i)
3.  x[
y(1) =

i
4

4.  x[
y(1) =

1
4

5. 

nessuna delle precedenti

Esercizio 14.12.7. Sia x = {x0 , . . . , xN 1 } una successione estesa per periodicit a tutti gli interi. Sia y = {y0 , . . . , yN 1} con yn = xn xn1 per
n = 1, . . . , N 1 e y0 = x0 . Esprimere yb(k) in termini di x
b(k)

Esercizio 14.12.8. Siano x = {1, 1, 1, 1} e y = {1, 0, 2, 2} estese per


periodicit a tutti gli interi. Allora
1.  x[
y(1) = 21 (3 + 2i)
2.  x[
y(1) = 41 i(3 + 2i)
3.  x[
y(1) = 41 i
4.  x[
y(1) = 4i
5. 

nessuna delle precedenti

Esercizio 14.12.9. Consideriamo successioni di 6 elementi {x0 , . . . , x5 } estese


per periodicit a tutti gli interi. Quali delle seguenti successioni sono dispari
(eventualmente pi di una oppure nessuna)?
1. 

{1, 2, 3, 4, 5, 6}

2. 

{1, 2, 3, 3, 2, 1}

3. 

{0, 1, 0, 0, 0, 1}

4. 

{0, 2, 3, 0, 3, 2}

1004

CAPITOLO 14. DFT

5.  nessuna delle precedenti

Esercizio 14.12.10. Quali delle seguenti aermazioni sono vere?


1. 

Se x pari allora x(k) = x(N k) k

2. 

Se x pari allora x0 = 0

3. 

Se x reale e pari allora x


b(k) = x
b(k) k

4. 

Se (m x)(n) = x(n m) allora (m x)b(k) = x


b(k m)

Esercizio 14.12.11. Consideriamo la successione di 5 elementi {1, i, 1, 2, i}


estesa per periodicit a tutti gli interi. Allora
1.  x
b(0) = 1

2.  x
b(0) =

2
5

3.  x
b(0) = 0

4.  x
b(0) = 25 i

5.  nessuna delle precedenti

Esercizio 14.12.12. Siano x = {1, 2, 1, 1} e y = {1, 1, 2, 2} estese per


periodicit a tutti gli interi. Allora
1.  x[
y(1) = 14

14.12. ESERCIZI

1005

2.  x[
y(1) = 14 (2 + 3i)(3 + i)
3.  x[
y(1) =

i
4

4.  x[
y(1) = 0
5.  nessuna delle precedenti

Esercizio 14.12.13. Consideriamo successioni di N elementi {x0 , . . . , xN 1 }


estese per periodicit a tutti gli interi. Scrivere la denizione della trasformata di Fourier discreta e la relativa formula di inversione

Siano x = {1, 2, 2, 1} e y = {1, 2, 1, 1} estese per periodicit a tutti gli


interi. Allora
1.  x[
y(1) =

3
4

2.  x[
y(1) = 0
3.  x[
y(1) = 43 i(3 i)
4.  x[
y(1) = 43 i
5.  nessuna delle precedenti

Esercizio 14.12.14. Consideriamo la successione di 5 elementi {i, i, 0, 2 + i, 1}


estesa per periodicit a tutti gli interi. Allora

1006

CAPITOLO 14. DFT

1.  x
b(0) =

3+3i
5

2.  x
b(0) =

i
5

4.  x
b(0) =

2
5

3.  x
b(0) = 0
5.  nessuna delle precedenti

Esercizio 14.12.15. Consideriamo successioni di 6 elementi {x0 , . . . , x5 } estese


per periodicit a tutti gli interi. Quali delle seguenti successioni sono pari
(eventualmente pi di una oppure nessuna)?
1. 

{0, 1, 2, 3, 2, 1}

2. 

{1, 1, 1, 1, 1, 1}

3. 

{0, 1, 2, 3, 4, 5}

4. 

{1, 2, 1, 0, 1, 1}

5.  nessuna delle precedenti

Esercizio 14.12.16. Siano x = {x0 , . . . , xN 1 } ed y = {y0 , . . . , yN 1 } due


successioni di N elementi estese per periodicit a tutti gli interi. Scrivere la
denizione di (x y)(n) ed enunciare il teorema sulla trasformata di Fourier
di (x y).

Esercizio 14.12.17. Quali delle seguenti aermazioni sono vere?


1. 

Se x dispari allora x0 = 0

2. 

Se x pari e y dispari allora x + y dispari

3. 

b
x
b(k) =

1
x(k)
N

14.12. ESERCIZI
4. 

1007

Se x
b(k) la trasformata di Fourier di x(n) allora
x(n) =

N
1
X
k=0

x
b(k)e2ink

Esercizio 14.12.18. Quali delle seguenti aermazioni sono vere?


1. 

Se x dispari allora x(k) = x(N k) k

2. 

(x1 x2 )b(k) = N xb1 (k)xb2 (k)

3. 

4. 

Se x reale e pari allora


x
b(k) =

N 1
1 X
2nk
x(n) cos
N n=0
N

La trasformata di Fourier di x(n)


N 1
1 X
x(n)e2ink
x
b(k) =
N n=0

Esercizio 14.12.19. Consideriamo la successione di 5 elementi {i, 0, 3, 2i, 1}


estesa per periodicit a tutti gli interi. Allora
1.  x
b(0) = 0
2.  x
b(0) =

i
5

4.  x
b(0) =

3i
5

3.  x
b(0) =

2+i
5

5.  nessuna delle precedenti

1008

CAPITOLO 14. DFT

Esercizio 14.12.20. Consideriamo una successione di N elementi {x0 , . . . , xN 1 }


b
estesa per periodicit a tutti gli interi. Quanto vale x
b(k)? Se x una sucb
cessione pari, quanto vale x
b(k) in questo caso?

Esercizio 14.12.21. Siano x = {2, 2, 1, 1} e y = {1, 1, 2, 2} estese per


periodicit a tutti gli interi. Allora
1.  x[
y(1) = 0
2.  x[
y(1) = 6
3.  x[
y(1) = 6i
4.  x[
y(1) = 14 (3 + i)(1 + i)
5.  nessuna delle precedenti

Esercizio 14.12.22.
Consideriamo successioni di 6 elementi {x0 , . . . , x5 } estese per periodicit a
tutti gli interi. Quali delle seguenti successioni sono dispari (eventualmente
pi di una oppure nessuna)?
1. 

{0, 2, 1, 0, 1, 2}

2. 

{1, 2, 3, 4, 5, 6}

3. 

{0, 1, 1, 0, 1, 1}

4. 

{1, 2, 3, 0, 3, 2}

5.  nessuna delle precedenti

Esercizio 14.12.23. Sia x = {1, 2 + i, 0, 2 + i} una successione estesa per periodicit a tutti gli interi. Quale delle seguenti pu essere la sua trasformata
di Fourier?
1.  x
b = 41 {i, i, 3i, i}

14.12. ESERCIZI

1009

2.  x
b = 14 {5i, i, 3i, i}

3.  x
b = 14 {5i, 2, 3i, 2}
4.  x
b = 41 {5i, i, 3i, i}

5.  nessuna delle precedenti

Esercizio 14.12.24. Sia x = {0, 2i, 0, 2i} una successione estesa per periodicit a tutti gli interi. Quale delle seguenti pu essere la sua trasformata di
Fourier?
1. 

{0, i, 0, i}

2. 

{0, 1, 0, 1}

3. 

{1, 0, 0, 1}

4. 

{0, 1, 0, 1}

5.  nessuna delle precedenti

Esercizio 14.12.25. Sia x = {0, 2i, 0, 2i} una successione estesa per periodicit a tutti gli interi. Quale delle seguenti pu essere la sua trasformata di
Fourier?


1.  x = 0, 4i , 0, 4i
2.  x = {0, 1, 0, 1}

3.  x = {0, 2i, 0, 2i}


4.  x = {0, 1, 0, 1}
5.  nessuna delle precedenti

Esercizio 14.12.26. Quali delle seguenti aermazioni sono vere?

1010

CAPITOLO 14. DFT

1. 

Se {x0 , x1 , x2 , x3 , x4 , x5 } dispari allora x2 = 0

2. 

2imk
x
b(k)
Se (m x)(n) = x(n m) allora d
m x(k) = e N

3. 
4. 
5. 

Se x dispari allora x0 = 0

b(k) = x
Se x reale allora x
b(k)

nessuna delle precedenti

Esercizio 14.12.27. Un segnale f campionato a frequenza = 44Khz. Qual


il massimo passo di campionamento di f perch il segnale sia ricostruibile
seenza perdite dai suoi campioni?
1.  = 88
2.  =

1
88

3.  =

1
44

4.  =

1
22

5.  nessuna delle precedenti

Esercizio 14.12.28. Sia K un sottomultiplo di N. Si calcoli la DFT su N


N
N
punti della funzione caratteristica dellintervallo [ 2K
, 2K
]. Si calcoli poi la
N N
N
, 2 2K
].
DFT della funzione caratteristica dellintervallo traslato [ N2 2K
Suggerimento: per la seconda domanda, si faccia uso della propriet di
traslazione della DFT, Proposizione 14.6.4.

Esercizio 14.12.29. La riga centrale di unimmagine consiste di dati numerici


{xn , n = 1, . . . N = 1024}. Sia K un sottomultiplo di N. Vogliamo ltrare
limmagine in modo che, nel dominio delle frequenze, i dati siano moltiplicati
N
per il ltro triangolare m che vale 0 per frequenze da 1 a N K
, vale 1
N
alla frequenza N/2, vale di nuovo zero dalla frequenza N K in poi, e
N
N
varia linearmente nellintervallo di frequenze da N K
a N + K
: ossia,
moltiplichiamo la DFT del segnale per questo ltro passa banda triangolare

14.12. ESERCIZI

1011

m di raggio N/K centrato alla frequenza N/2 (la frequenza centrale). Si usi
la convoluzione normalizzata.
Suggerimento: Moltiplicare la DFT del segnale per un ltro equivale a convolvere il segnale per la DFT inversa del ltro. Ora, se il moltiplicatore fosse
una funzione caratteristica centrata alla frequenza 0, allora lantitrasformata
sarebbe una funzione sinc, del tipo sinAxAx . Invece una funzione triangolare,
che la convoluzione di una funzione caratteristica di ampiezza met per se
2 Ax
stessa: quindi lantitrasformata il quadrato puntuale, ossia del tipo sin
.
(Ax)2
Ora lasciamo al lettore, con un po di pazienza, trovare le unit di scala:
lampiezza A e la costante di normalizzazione. Un indizio: la successione ha
N
punti, quindi il
lunghezza N = 1024 punti, e lampiezza del triangolo 2 K
2
sin 2k/N
convolutore dovrebbe essere del tipo (2k/N )2 . Il valore massimo di questa
funzione 1: esso deve essere normalizzato anch diventi uguale allintegrale del moltiplicatore diviso per N (si vedano il Corollario 14.2.8 (i) ed il
precedente Esercizio 14.12.28). Il moltiplicatore la convoluzione di una funzione caratteristica di ampiezza N/K per s stessa, quindi (subesercizio!) il
suo integrale uguale allintegrale della funzione caratteristica, ovvero N/K.
Pertanto dobbiamo moltiplicare per N/K il convolutore, ma dovevamo gi
dividerlo per N: quindi dobbiamo, in totale, normalizzarlo dividendo per
K. Inne, poich il ltro centrato a met periodo, esso stato traslato di
un semiperiodo: pertanto (si veda il precedente Esercizio 14.12.28) il convolutore deve essere moltiplicato per lesponenziale complesso di modulo 1
associato alla traslazione di un semiperiodo, che la funzione a segni alterni
(1)k . Quindi, in totale, il ltraggio dovrebbe consistere nel convolvere la
2 2k/N
successione di partenza per K1 (1)k sin
.
(2k/N )2
Tutte le veriche e le correzioni sono lasciate al lettore: sono importanti, perch facile dimenticarsi che, rispetto alla trasformata di Fourier, le
identit e le disuguaglianze per la DFT di ordine N comportano spesso un
fattore di normalizzazione 1/N. Il lettore deve vericare questi fattori di normalizzazione passaggio per passaggio ( per questo che abbiamo consigliato
di usare la convoluzione normalizzata, ma quel che conta che il lettore utilizzi sempre o la convoluzione normalizzata o quella non normalizzata, senza
alternare fra le due). Al termine del calcolo, consigliamo di vericare il risultato nel caso il segnale {xn } sia una generica delta di Dirac.

b la sua DFT.
Esercizio 14.12.30. Sia x = (x0 , . . . , xN 1 ) e x

1012

CAPITOLO 14. DFT

(i) Supponiamo che |b


xi | < 1 per ogni i = 1, . . . , N 1. Consideriamo il
prodotto di convoluzione x(n) := x x (n fattori). Si dimostri che
NP
1
(n)
xj 0 quando n .
j=1

(ii) Si dia una dimostrazione alternativa del fatto che x(n) )0 0 utilizzando
la propriet del valore iniziale della DFT.
Svolgimento.
(i) Dalla denizione di (IDFT) si ha
x(n) k :=

N
1
X
j=1

e quindi

d
(n) e2ijk/N ,
x
j

1

X
(n) N
d

x k 6
x(n) j .
j=1

Daltra parte, per la moltiplicativit della DFT rispetto alla convoluzione,


d
(n) = (b
x
xn )j ,
j

e il membro di destra tende a zero quando n perch |b


xj | < 1 per
(n)
ogni j. Pertanto anche x k tende a zero al crescere di n.
(ii) Dalla denizione di DFT,
N 1
1 X (n) 2ijk/N
(n) :=
x je
,
xd
k
N j=1

otteniamo, ponendo k = 0,

N
1
X
j=1

(n)

xj

(n) .
= N xd
0

Utilizzando di nuovo la moltiplicativit per convoluzione,


x[
yk = x
bk ybk ,

14.12. ESERCIZI

1013

facciamo vedere che tende a zero


(n) = DFT (x x) = x
xd
b0 x
b0 = (b
x0 )n .
0
0

In eetti, la successione (b
x0 )n converge a zero se n +, poich, per
ipotesi, |b
xk | < 1 per ogni k.
(ii) Dalla formula di inversione per la DFT
(n)

N
1
X
j=1

ponendo k = 0 otteniamo
x(n) 0 =

N
1
X
j=1

(n) e2jk/N ,
xd
j

(n) =
xd
j

N
1
X

(b
xj )n .

j=1

Poich il limite su n commuta con la somma nita, da questa identit


(n) = (b
e dalla propriet moltiplicativa xd
xj )n otteniamo
j
lim x(n) 0 = lim

n+

n+

N
1
X

(b
xj )n =

j=1

N
1
X
j=1

lim (b
xj )n = 0,

n+

di nuovo perch |b
xj | < 1 per ogni j.

1014

CAPITOLO 14. DFT

Capitolo 15
La trasformata rapida di Fourier
Questo capitolo dedicato a sviluppare algoritmi veloci per il calcolo della
DFT. Parte della presentazione tratta da [2].

15.1

Dalla DFT alla FFT

Abbiamo gi annunciato nella Nota 14.2.3 che in questo capitolo intendiamo


usare una diversa normalizzazione della DFT rispetto a quella introdotta
nella denizione originale della trasformata di Fourier discreta (Denizione
14.2.2). In eetti, per semplicare i numerosi passaggi, scriviamo lindice k
come variabile fra parentesi, e poniamo
x
b(k) =

N
1
X

x(n) e2ikn/N

n=0

k = 0, . . . , N 1

(15.1)

dove, a dierenza che in quella Denizione, abbiamo scritto n invece di nT


e k invece di k/NT . Il precedente fattyore di normalizazione, dato dalla
divisione per N, pu essere applicato comunque alla ne dei passaggi, se lo
si desidera.
Ponendo w = e2i/N la (15.1) diventa

x
b(k) =

N
1
X

x(n) w kn

n=0

1015

k = 0, . . . , N 1.

(15.2)

1016

CAPITOLO 15. FFT

In generale, per x(n) complesso e k = 0, . . . , N 1, la (15.2) si pu scrivere


x
b(k) =

N
1
X
n=0

Re x(n) Re w kn Im x(n) Im w kn

+ i(Re x(n) Im w kn + Im x(n) Re w kn ) .

(15.3)

Dallespressione precedente risulta chiaro che il calcolo diretto di x


b(k) richiede
4N moltiplicazioni reali e 4N 2 addizioni reali per ogni valore di k.
Poich bisogna valutare x
b(k) per N diversi valori di k, il calcolo diretto della
DFT di una sequenza x(n) richiede 4N 2 moltiplicazioni reali e N(4N 1)
addizioni reali, ovvero, in altri termini N 2 moltiplicazioni complesse.
Poich la quantit dei calcoli O(N 2 ), evidente che il numero delle operazioni aritmetiche richiesto per il calcolo diventa enorme per valori grandi di
N.
Per questo motivo sono molto interessanti procedure di calcolo che riducano
il numero di moltiplicazioni e addizioni.
La maggior parte delle tecniche usate per migliorare lecienza del calcolo
della DFT sfrutta le seguenti propriet particolari di w kn :
Simmetria:
w k(N n) = w kn = w kn
Questa propriet vale perch
w kN ) = e

2ikN
N

= e2ik = 1 .

Periodicit:
w kn = w k(N +n) = w n(N +k)
Questa propriet vale per la stessa ragione, dal momento che
w k(N +n) = e2ik(N +n)/N = e2ik w kn .
Algoritmi di calcolo che sfruttano sia la simmetria sia la periodicit della
sequenza w kn erano noti gi da molto tempo prima dellavvento degli elaboratori elettronici. Essi erano stati studiati perch a quei tempi qualunque
accorgimento che riducesse i calcoli fatti a mano, anche solo di un fattore 2,
era visto con interesse.

15.2. ALGORITMI FFT BASATI SULLA DECIMAZIONE NEL TEMPO1017


Runge, e pi tardi Danielson e Lanczos, svilupparono algoritmi la cui complessit era O(N log N) invece che O(N 2 ). A quei tempi questa dierenza,
che adesso cruciale, era di grande importanza per non vitale, perch prima che esistessero i calcolatori elettronici bisognava fare i calcoli a mano, e
questo possibile solo per piccoli valori di N, per i quali N 2 e N log N non
sono molto diversi. La possibilit di ridurre notevolmente i tempi di calcolo
per grandi N (da N 2 a N log N), quindi usando necessariamente calcolatori
elettronici, non fu riscoperta no al 1965, quando J. Cooley e J. Tukey [7]
pubblicarono un algoritmo per il calcolo della trasformata di Fourier discreta
che vale quando N un numero non primo, cio prodotto di due o pi interi.
Algoritmi di questo tipo divennero noti come algoritmi per la trasformata
rapida di Fourier o semplicemente FFT (acronimo per Fast Fourier Transform).
Il principio fondamentale su cui si basano tutti questi algoritmi la scomposizione del calcolo della DFT di una successione di lunghezza N in DFT di
dimensioni via via pi piccole.
In questo capitolo ci occuperemo di due classi fondamentali di algoritmi
di FFT. La prima, detta a decimazione nel tempo, prende il nome dal fatto
che nello scomporre il calcolo in trasformate di ordine pi piccolo, la successione x(n) viene suddivisa in successioni sempre pi corte (per un segnale
nel dominio del tempo, lindice associato al tempo, da cui il nome). Nella
seconda classe di algoritmi, la successione che viene scomposta in sottosuccessioni sempre pi corte quella dei coecienti della DFT, da cui il nome
di decimazione di frequenza.

15.2

Algoritmi FFT basati sulla decimazione


nel tempo

Il modo pi semplice per mostrare il principio della decimazione nel tempo


quello di considerare il caso particolare di N potenza di 2, cio
N = 2 .
Poich N un intero pari, possiamo provare a calcolare x
b(k) dividendo x(n)
N
in due successioni di 2 punti ciascuna, costituite una dai punti che hanno
indice pari in x(n), laltra da quelli che hanno indice dispari. Mostreremo
che in tal modo la DFT su N punti si spezza in due DFT su N2 punti:

1018

CAPITOLO 15. FFT

questo procedimento si chiama decimazione (poich qui avviene sugli indici


del segnale originale, che modellano istanti successivi in cui il segnale dato,
si parla di decimazione nel tempo: nella prossima Sezione 15.3 illustreremo un
procedimento analogo che scinde indici pari e dispari nel segnale trasformato,
quindi che decima le frequenze).
La (15.2) diventa:
X
X
x
b(k) =
x(n)w kn +
x(n)w kn ,
(15.4)
n pari

n dispari

ovvero, ponendo n = 2r per n pari e n = 2r + 1 per n dispari,


N
2

1
X

x
b(k) =

N
2

x(2r)w

2rk

r=0

1
X

x(2r + 1)w (2r+1)k

r=0

N
2

1
X

N
2

2 rk

x(2r)(w ) + w

r=0

1
X

x(2r + 1)(w 2 )rk .

(15.5)

r=0

Osserviamo che ciascuna di queste due ultime sommatorie una DFT su


2i
N/2

punti: infatti w 2 = e
N
punti.
2
Poniamo

N
2

e le successioni dei dati in ingresso consistono di

N
2

g (k) =
b

La (15.5) diventa

b
h(k) =

1
X

x(2r)(w 2 )rk ,

(15.6)

x(2r + 1)(w 2)rk ,

(15.7)

r=0

N
1
2

X
r=0

x
b(k) = b
g (k) + w k b
h(k).

(15.8)

Anche se lindice k pu assumere N valori, k = 0, . . . , N 1, occorre calcolare


geb
b
h solo per k tra 0 e N2 1 perch sia b
g (k) che b
h(k) sono periodiche in k
N
con periodo 2 .
Dopo aver calcolato le due DFT corrispondenti alle due sommatorie in (15.5),
dobbiamo combinarle per ottenere la DFT su N punti, x
b(k). La Figura 15.1

15.2. ALGORITMI FFT BASATI SULLA DECIMAZIONE NEL TEMPO1019


mostra il tipo di calcoli necessario per ottenere x
b(k) in base alla (15.5) per
una successione di N = 8 dati.
Ci che la Figura 15.1 mostra il fatto che vengono calcolate due DFT di 4
punti: b
g (k) indica la DFT sui quattro punti x(2r) di indice pari, b
h(k) indica
la DFT sui quattro punti di indice dispari.
Il valore di x
b(0) si ottiene moltiplicando b
h(0) per w 0 e sommando il risultato
a b
g (0) e cos via. Per ottenere x
b(4) dovremmo moltiplicare b
h(4) per w 4 e
sommare il risultato a gb(4). Dato che, come gi visto, b
g (k) e b
h(k) sono
b
b
entrambe periodiche con periodo 4, si ha gb(4) = b
g (0) e h(4) = h(0).
4
b
Perci x
b(4) si ottiene moltiplicando h(0) per w e sommando il risultato a
g (0).
b
Le due scatole rettangolari in Figura 15.1 rappresentano due DFT a 4 punti,
eseguite rispettivamente sui dati di ingresso di indice pari x(2r), r = 0, 1, 2, 3,
e di indice dispari x(2r + 1), r = 0, 1, 2, 3. Le linee illustrano il percorso dei
dati nelle varie fasi del calcolo. Dopo aver eseguito ciascuna DFT a 4 punti,
i quattro risultati in uscita dalla prima e dalla seconda vengono sommati con
pesi. Il congiungersi di due linee rappresenta una somma. Se un addendo
viene moltiplicato per un peso, nella gura il peso viene scritto a anco alla
linea che rappresenta laddendo. A causa di (15.8) i pesi sono le potenze w k ,
k = 0, 1, . . . , 7, e gli addendi pesati sono solo quelli in uscita dalla seconda
DFT a 4 punti (quelli che provengono dai dati in ingresso con gli indici
dispari).
Confrontiamo ora il numero di moltiplicazioni e di addizioni richieste per
il calcolo della DFT nel caso in cui si usi la denizione (15.8) e si svolga il
calcolo diretto.
Abbiamo gi visto che in questo caso sono necessarie N 2 moltiplicazioni ed
addizioni complesse (le addizioni in realt sono N(N 1), ma assumeremo
dora in poi N grande, in modo che N 1 N).
2
La (15.3) richiede il calcolo di due DFT su N2 punti, e quindi 2 N2 molti2
plicazioni complesse e circa 2 N2 addizioni complesse. Le due DFT su N2
punti devono poi essere combinate come mostrato in (15.8), il che richiede
altre N moltiplicazioni complesse, corrispondenti al prodotto della seconda
sommatoria per w k , ed altre N addizioni complesse, corrispondenti alla somma di questo prodotto con la prima sommatoria. In totale abbiamo
quindi
2
che il calcolo di (15.8) per tutti i valori di k richiede N + 2 N2 moltiplicazioni e addizioni complesse.

1020

CAPITOLO 15. FFT

Figura 15.1: la DFT a N punti scissa in due DFT a N/2 punti (qui e nelle figure seguenti
N = 8)

Si noti che per il ricombinamento il numero di operazioni un polinomio di


grado 1 in N, quindi crece linearmente con N, mentre per il calcolo della
DFT su N elementi il numero di operazioni cresce quadraticamente.
Abbiamo visto che lespressione (15.8) corrisponde a spezzare il calcolo originario su N punti in due calcoli su N/2 punti.
Ora iteriamo la decimazione, o meglio la scissione in due DFT di ordine
met. Dato che N una potenza di 2, anche N2 pari. Quindi il calcolo di
ciascuna DFT su N2 punti della (15.8) si pu eettuare tramite il calcolo e
la successiva combinazione di due DFT su N4 punti. Quindi b
g (k) e b
h(k) si
possono calcolare cos:

15.2. ALGORITMI FFT BASATI SULLA DECIMAZIONE NEL TEMPO1021

g (k) =
b
=

1
2
X

g(2r)(w 2)rk

r=0

N
4

1
X

g(2s)(w 4sk ) +

s=0

N
4

(15.9)

1
4
X

g(2s + 1)w 2(2s+1)k

s=0

g(2s)(w 4)sk + w 2k

s=0

1
4
X

g(2s + 1)(w 4 )sk .

s=0

Analogamente
b
h(k) =

N
1
4

X
s=0

h(2s)(w 4 )sk + w 2k

1
4
X

h(2s + 1)(w 4 )sk .

(15.10)

s=0

Per il caso particolare della Figura 15.1, gli schemi di calcolo ottenuti
applicando la (15.9) e la (15.10) sono mostrati nella Figura 15.2

Figura 15.2: la DFT a N/2 punti spezzata in due DFT a N/4 punti (il blocco in alto
della Figura 15.1)

Introducendo questi schemi nel grafo della Figura 15.1 otteniamo il grafo
completo (Figura 15.3)
Esercizio 15.2.1. Ricavare in maniera alternativa lalgoritmo di decimazione nel tempo della FFT, appena illustrato nelle equazioni (15.9) e (15.10),

1022

CAPITOLO 15. FFT

Figura 15.3: il grafico degli ultimi due stadi della DFT a 8 punti

utilizzando le propriet di dilatazione (Teorema 14.8.3) e di traslazione (Proposizione 14.6.4) della DFT.
Suggerimento. A titolo di esempio, illustriamo il caso N = 8. Nel segnale
x C8 separiamo come prima gli indici pari da quelli dispari per ottenere
due nuovi segnali x+ e x , ma ora, invece di considerare questi due nuovi
segnali come due vettori con quattro componenti
X + = {x0 , x2 , x4 , x6 }
X = {x1 , x3 , x5 , x7 }

continuiamo a considerarli come vettori ad otto componenti inframmezzando


i quattro dati che li compongono con zeri:
x+ = {x0 , 0, x2 , 0, x3 , 0, x4 , 0}
x = {0, x1 , 0, x3 , 0, x5 , 0, x7 } .

Chiaramente si ha x = x+ + x . Daltra parte, il nostro scopo di ridurre il


+, X
. Dal Teorema
d
d
calcolo di x
b a quello delle due DFT di ordine quattro X

15.2. ALGORITMI FFT BASATI SULLA DECIMAZIONE NEL TEMPO1023


di dilatazione 14.8.3 sappiamo che
+ = {X
+ ,X
+ ,X
+ ,X
+ ,X
+ ,X
+ ,X
+ ,X
+ }
d
d
d
d
d
d
d
d
xc
0
1
2
3
0
1
2
3

(abbiamo omesso il fattore di normalizzazione 21 dellenunciato del Teorema


14.8.3 perch ora stiamo utilizzando una DFT non normalizzata).
Lo stesso risultato si avrebbe per la successione {x1 , 0, x3 , 0, x5 , 0, x7 , 0}, ma
noi siamo invece interessati alla successione x = {0, x1 , 0, x3 , 0, x5 , 0, x7 }, che
si ottiene dalla precedente per una traslazione di passo uno. Dalla propriet
di traslazione (Proposizione 14.6.4) segue quindi che
= {X
, wX
, w2X
, w3X
, w4X
, w5X
, w6X
, w7X
}.
d
d
d
d
d
d
d
d
xc
0
1
2
3
0
1
2
3

Poich x = x+ + x e w 4 = 1 (quindi w k+4 = w k ), da qui segue


++x
=
c
x
b = xc

,X
+ + w3X
,
+ +X
,X
+ + wX
,X
+ + w2X
d
d
d
d
d
d
d
d
{X
2
3
3
0
0
1
1
2
2d
3d
+

d
d
d
d
d
d
X 0 X 0, X 1 wX 1 , X 2 w X 2 , X 3 w X 3} .

Questo esattamente lo spezzamento della DFT a 8 punti nelle due DFT a


4 punti ottenuto in (15.5), ed illustrato gracamente nella Figura 15.1.

Riassumendo, per la DFT su 8 punti che abbiamo usato come esempio,


dapprima abbiamo ridotto il calcolo si ridotto a quello di due DFT su 4
punti, poi abbiamo scisso queste DFT a 4 punti in due DFT su 2 punti. Ora
consideriamo la DFT su 2 punti, ad esempio x(0), x(4), che schematizzata
in Figura 15.4.

Figura 15.4: il blocco in alto nella Figura 15.3


Di nuovo, inserendo questo schema nel grafo di Figura 15.3 si ottiene il grafo
completo (Figura 15.5) per il calcolo della DFT su 8 punti.

1024

CAPITOLO 15. FFT

Figura 15.5: il grafo a farfalle completo della DFT a 8 punti

15.2. ALGORITMI FFT BASATI SULLA DECIMAZIONE NEL TEMPO1025


Il caso pi generale, in cui N una potenza di 2 con esponente maggiore
di 3, si tratta iterativamente in modo analogo, scomponendo la trasformata
su N punti delle (15.9) e (15.10) in trasformate su N2 punti, poi queste ultime
in trasformate su N4 punti e cos di seguito nch non si arriva a trasformate
su 2 punti. Ci richiede stadi di calcolo, dove = log2 (N).
Abbiamo visto in precedenza che, quando una trasformata su N punti viene
scomposta in due trasformate su N2 punti, il numero di moltiplicazioni e
2
addizioni complesse N + 2 N2 .

Quando le trasformate su N2 punti vengono scomposte in trasformate su N4


punti,
 si devono calcolare quattro trasformate, ciascuna delle quali richiede
N 2
moltiplicazioni e addizioni. Bisogna poi ricombinarle come si vede in
4
(15.9) e (15.10). Il calcolo complessivo per questi due stadi richiede, allora,

2
N + 2 N2 + 4 N4 moltiplicazioni e addizioni complesse.
Se N = 2 , questo procedimento si ripete = log2 (N) volte, ed alla ne occorrono solo DFT su due punti (le quali, come vedremo in Figura 15.6), richiedono solo somme e dierenze, ma non moltiplicazioni). Il numero complessivo
di operazioni per lintero processo diventa quindi O(N log2 (N)).

Questo numero di operazioni coincide con quanto si osserva nella Figura


15.5,che fornisce una versione graca della dimostrazione.
Pi precisamente, ogni stadio comporta N moltiplicazioni e addizioni complesse per la fase di ricombinamento; lintero processo si traduce in log2 (N)
tali stadi, e se ne ricava, come prima, un totale di N log2 (N) moltiplicazioni
e addizioni complesse.
Ora mostriamo come sia possibile ridurre ulteriormente il totale delle
operazioni aritmetiche.
Come abbiamo visto, e come mostrato in Figura 15.5,ogni stadio di calcolo
ha come ingresso una successione di N numeri complessi e la trasforma in
unaltra successione di N numeri complessi. Questo succede per = log2 (N)
ed alla ne porta alla DFT desiderata.
Indichiamo con Xm (s), s = 0, . . . , N 1, m = 1, . . . , , la successione di
numeri complessi che risultano dal m-simo stadio di calcolo. Per comodit
riscriviamo linsieme dei campioni di ingresso con la notazione X0 (s). Le
successioni Xm (s) e Xm+1 (s) sono quindi le successioni rispettivamente di
ingresso e di uscita del (m + 1)-simo stadio di calcolo. Ogni stadio induce
una separazione fra indici pari e dispari. Ad esempio, nel caso N = 8, le

1026

CAPITOLO 15. FFT

separazioni nei tre stadi iterativi sono le seguenti:


{0, . . . , 7} {0, 2, 4, 6} {1, 3, 5, 7}
{0, 2, 4, 6} {0, 4} {2, 6}
{1, 3, 5, 7} {1, 5} {3, 7}
Pertanto, in questo caso N = 8, illustrato in Figura 15.5,risulta:
X0 (0) = x(0) X0 (1) = x(4) X0 (2) = x(2) X0 (3) = x(6)
X0 (4) = x(1) X0 (5) = x(5) X0 (6) = x(3) X0 (7) = x(7) .

(15.11)

Usando queste notazioni si verica facilmente che il calcolo base del grafo
quello mostrato in Figura 15.6.

Figura 15.6: il blocco di base della FFT: somme e differenze


Le equazioni rappresentate da questo grafo sono della forma
Xm+1 (p) = Xm (p) + w r Xm (q)
Xm+1 (q) = Xm (p) + w

r+ N
2

(15.12)

Xm (q) ,

dove consideriamo gli N dati spezzati in due blocchi contigui di cardinalit


N/2 e gli indici p e q sono indici corrispondenti nei due blocchi, ossia distando
di N/2; lesponente r varia al variare di p e q allinterno dei rispettivi blocchi,
da 0 a N2 1.
A causa della sagoma in Figura 15.6,questo grafo viene comunemente chiamato a farfalla.
Le espressioni (15.12) suggeriscono un modo per ridurre di un fattore due
il numero delle moltiplicazioni complesse. Infatti, si noti che
N

w2 =e

2i
N

( N2 ) = ei = 1,

15.2. ALGORITMI FFT BASATI SULLA DECIMAZIONE NEL TEMPO1027


per cui le (15.12) diventano:
Xm+1 (p) = Xm (p) + w r Xm (q)
Xm+1 (q) = Xm (p) w r Xm (q) .

(15.13)

Le (15.13) sono rappresentate dalla Figura 15.7.

Figura 15.7: la farfalla di base con pesi ottimizzati

Poich ogni stadio ha N2 farfalle della forma in Figura 15.7 e gli stadi
sono log2 (N), il numero totale di moltiplicazioni ora diventato N2 log2 (N).
La Figura 15.8 il grafo della Figura 15.5 con i pesi ottimizzati grazie alla
sostituzione (15.13).
Dalla Figura 15.8 si nota che, per il calcolo degli elementi in posizione p e q
della (m+1)-sima successione (cio delluscita del m-simo stadio di bisezione)
sono necessari solo gli elementi p e q della m-sima successione (cio del suo
ingresso). Pertanto, se Xm+1 (p) e Xm+1 (q) vengono memorizzati negli stessi
registri di memoria usati per Xm (p) e Xm (q), sono necessari in totale solo N
registri per svolgere lintero calcolo.
Questo procedimento viene comunemente chiamato calcolo sul posto: ogni
nuova successione calcolata in uscita da un qualsiasi stadio viene memorizzata
nelle stesse celle di memoria della successione di ingresso originaria.
Notiamo dalla Figura 15.5 che, anch il calcolo possa essere fatto sul posto,
i dati di ingresso devono essere memorizzati in ordine non sequenziale. In
eetti lordine con il quale i dati di ingresso sono memorizzati a disposizione invertita di bit (bit reversal ). Vediamo cosa si intende con questa
terminologia.

1028

CAPITOLO 15. FFT

Figura 15.8: il grafico della FFT per N = 8 con pesi ottimizzati

15.2. ALGORITMI FFT BASATI SULLA DECIMAZIONE NEL TEMPO1029

15.2.1

Bit reversal

Osserviamo innanzitutto che per il grafo di 8 punti dellesempio sono necessarie 3 cifre binarie per dare un indice a ciascun dato. Se scriviamo gli indici
delle identit (15.11) in forma binaria otteniamo linsieme di relazioni:
X0 (000) = x(000)
X0 (010) = x(010)
X0 (100) = x(001)
X0 (110) = x(011)

X0 (001) = x(100)
X0 (011) = x(110)
X0 (101) = x(101)
X0 (111) = x(111) .

(15.14)

Asseriamo che, se (n2 n1 n0 ) la rappresentazione binaria dellindice della


successione x(n), il campione x(n2 n1 n0 ) risulta memorizzato nella posizione
X0 (n0 n1 n2 ). In altre parole, per determinare la posizione di x(n2 n1 n0 ) nella
successione di ingresso dobbiamo invertire lordine dei bit dellindice n.
Per vedere perch ai ni del calcolo sul posto sia necessario lordine a disposizione invertita dei bit riprendiamo in esame il procedimento che ha dato
luogo alla Figura 15.5.La successione x(n) prima stata divisa nei campioni
di indice pari e in quelli di indice dispari, con i primi collocati nella met
superiore della Figura 15.1 e i secondi nella met inferiore. (Per inciso:
chiaro che i dati della seconda met vengono usati dopo quelli della prima,
quindi i registri che li contengono possono essere riscritti dopo aver ultimato
il lavoro con quelli che contengono i dati della prima met. In altre parole
questi ultimi vanno scritti prima.)
Formalmente questa separazione dei dati pu essere fatta esaminando
il bit meno signicativo (n0 ) nellindice n. Se il bit meno signicativo
zero il valore della successione corrisponde ad un campione di posto pari e
compare pertanto nella met superiore della successione X0 (s); viceversa, se
il bit meno signicatico uno, il valore della successione corrisponde a un
campione di posto dispari, e compare di conseguenza nella met inferiore
di X0 (s). Riassumendo, lultimo bit uguale a zero signica che il numero
considerato (indice della successione) pari, mentre lultimo bit uguale a 1
signica che dispari. Invece primo bit uguale a 0 signica essere nella prima
met piccola (numeri piccoli: nel nostro esempio con tre cifre binarie, questi
sono i numeri da 0 a 3), mentre primo bit uguale a 1 signica essere nella
seconda met (numeri grandi, da 4 a 7). In seguito alla trasformazione, gli
indici con ultimo bit uguale a 0 niscono quindi nella prima met di queste

1030

CAPITOLO 15. FFT

due successioni, ossia nei posti con primo bit uguale a 0, mentre quelli con
ultimo bit uguale a 1 niscono nella seconda met, ovvero nei posti con primo
bit uguale a 1.
Successivamente le due sottosuccessioni pari e dispari vengono separate a
loro volta nelle loro proprie parti pari e dispari, e ci si basa sul secondo bit
meno signicativo nellindice dei dati. Infatti, asseriamo che, se consideriamo dapprima la successione costituita dai campioni di posto pari, quando il
secondo bit meno signicativo 0 il valore della successione un campione
di posto pari allinterno di questa sottosuccessione; se viceversa il secondo
bit meno signicativo 1, allora il valore della successione ha posto dispari.
Per capire perch, consideriamo un numero binario j = nk nk1 . . . n0 . Se
n0 = 0, allora j pari e 2j intero. Daltra parte, 2j = nk nk1 . . . n1 , perch
dividere per 2 un numero pari corrisponde a traslarne di un passo a desta
le cifre binarie scartandone lultima, cio a sopprimere la cifra zero alla ne
(esattamente come dividere per 10 un multiplo di 10 , cio un numero la cui
espressione decimale nisce con la cifra zero, signica cancellare lo zero nale). Pertanto i termini di posto pari della sottosuccessione degli indici pari
sono quelli con n1 = 0 (analogamente a prima), e viceversa quelli di posto
dispari si ottengono da n1 = 1.
Se invece j dispari, allora j = nk nk1 . . . n0 con n0 = 1, e si ha j = m + 1
dove m pari con espressione binaria m = nk nk1 . . . n1 . Quindi, anche in
questo caso, i termini di posto pari della sottosuccessione degli indici dispari
sono quelli con n1 = 0 e quelli di posto dispari sono quelli con n1 = 1. Ne
segue quindi che, dopo la trasformazione, la prima met degli indici (quelli
di valore piccolo) viene scomposta a sua volta in due met, la prima delle
quali corrisponde al penultimo bit n1 = 0, e la seconda a n1 = 1.
Il procedimento viene ripetuto nch non si ottengono N sottosuccessioni
di lunghezza uno. Questa separazione in sottosuccessioni con indici pari e
dispari rappresentata nel diagramma ad albero della Figura 15.9.15.9. Gli
indici vengono quindi riordinati rovesciando lordine dei loro bit binari.
Ora chiaro che la necessit dellordinamento iniziale a disposizione invertita dei bit conseguenza del modo in cui la DFT si scompone in DFT
iterate di ordine met.

15.2. ALGORITMI FFT BASATI SULLA DECIMAZIONE NEL TEMPO1031

Figura 15.9: parit dei bit binari e bit reversal

1032

15.3

CAPITOLO 15. FFT

Algoritmi FFT basati sulla decimazione in


frequenza

In Sezione 15.2 abbiamo visto algoritmi di FFT basati sulla decimazione nel
tempo, sviluppati scomponendo il calcolo della DFT attraverso la scelta di
sottosuccessioni di lunghezza met della successione di ingresso x(n).
Un altro modo di procedere quello di dividere in analoghe sottosuccessioni la successione di uscita x
b(k).
Gli algoritmi FFT originati con questo procedimento si dicono basati sulla
decimazione in frequenza.
Per ricavarli, sempre nel caso in cui N sia una potenza di 2, possiamo innanzitutto dividere la successione di ingresso x(n) nella prima met e nella
seconda met dei suoi punti: cio
N
1
2

x
b(k) =

x(n)w nk +

n=0

1
2
X

x(n +

N
)w (n+N/2)k
2

n=0

oppure, grazie ad un cambiamento di variabili nella seconda sommatoria:


N
2

x
b(k) =
=

1
X

x(n)w nk +

n=0

(15.15)

1
2
X

x(n +

N
)w nk
2

n=0

N
)w (n+N/2)k
2

x(n)w nk + w kN/2

n=0

N
2

x(n +

n=0

1
2
X

1
2
X

x(n) + x(n +

N
)w kN/2
2

n=0

w nk .

Questa espressione si semplica ulteriormente se si osserva che la successione


w kN/2 assume solo due valori. Infatti:
2i kN
2

w kN/2 = e N

= eik = (1)k .

La (15.15) si scrive quindi


N

x
b(k) =

1
2
X
n=0

x(n) + (1)k x(n +

N
)
2

w nk .

15.3. ALGORITMI FFT BASATI SULLA DECIMAZIONE IN FREQUENZA1033


Considerando ora separatamente gli indici k pari e k dispari, ed indicando
con x
b(2r) e x
b(2r + 1) rispettivamente i valori di indice pari e quelli di indice
dispari, abbiamo:
N

x
b(2r) =

1
2
X

N
)
2

x(n) + x(n +

n=0

N
2

x
b(2r + 1) =

1
X
n=0

x(n) x(n +

N
)
2

w 2rn

w n w 2rn

(15.16)

(15.17)

per r = 0, 1, . . . , N2 1.
Le due sommatorie in (15.16) e (15.17) sono nientaltro che due DFT su
punti. Questo si vede in modo pi chiaro se si pone
g(n) = x(n) + x(n +

N
2

N
)
2

e
h(n) = x(n) x(n +

N
).
2

In tal modo le uguaglianze (15.16) e (15.17) diventano:


N
2

x
b(2r) =

1
X

g(n)(w 2)rn

(15.18)

n=0

N
2

1
X
x
b(2r + 1) =
(h(n)w n )(w 2 )rn .

(15.19)

n=0

Pertanto possiamo calcolare la DFT su N punti formando innanzitutto le


successioni g(n) e h(n), poi calcolando h(n)w n ed inne calcolando la DFT
a N2 punti di ciascuna di queste due successioni: queste due DFT ci danno i
valori di uscita x
b(k) rispettivamente per k pari e dispari.
Il procedimento illustrato nella Figura 15.10,nel caso di una DFT su 8
punti.

1034

CAPITOLO 15. FFT

Figura 15.10: decimazione in frequenza: la DFT a N punti scomposta in due DFT a


N/2 punti (N = 8)

Procedendo il modo simile a quello usato per ricavare gli algoritmi basati
sulla decimazione del tempo, notiamo di nuovo che N2 ancora pari poich
N una potenza di 2: quindi il procedimento in (15.18) e (15.19) si pu
ripetere sulle due DFT su N2 punti. Le successioni dei loro dati in uscita
si scindono quindi in due sottosuccessioni che devono poi essere combinate
come nel passo precedente per calcolare le DFT su N4 punti. Lo schema dei
primi due stadi mostrato nella Figura 15.11.
Nel caso di N = 8 il calcolo si cos ridotto a quello di DFT su 2 punti, le
quali, come abbiamo visto in precedenza, si calcolano sommando e sottraendo
i dati di ingresso. Il grafo completo in Figura 15.12.
interessante osservare che ora questo grafo ha i dati in ingresso in ordine
normale, ma fornisce i valori in uscita a disposizione invertita di bit.
Notiamo anche che lo schema base di calcolo , come nel caso della
decimazione nel tempo, del tipo a farfalla: possiamo quindi sviluppare un
procedimento di calcolo sul posto.
Come in precedenza, indichiamo la successione dei numeri complessi che risultano dal m-simo stadio di calcolo con Xm (s), dove s = 0, . . . , N 1 e

15.3. ALGORITMI FFT BASATI SULLA DECIMAZIONE IN FREQUENZA1035

Figura 15.11: decimazione in frequenza: i primi due stadi

Figura 15.12: decimazione in frequenza: il grafo completo per N = 8

1036

CAPITOLO 15. FFT

m = 0, . . . , . La Figura 15.13 mostra la forma del calcolo base della farfalla;


le equazioni corrispondenti sono
Xm+1 (p) = Xm (p) + Xm (q)
Xm+1 (q) = [Xm (p) Xm (q)] w r

(15.20)

al variare dellesponente intero r, come indicato nelle gure.

Figura 15.13: la farfalla del blocco elementare per la decimazione in frequenza


Applichiamo ora questi algoritmi a ritroso per calcolare la DFT inversa.
Consideriamo una farfalla di un algoritmo basato sulla decimazione nel tempo, come quella rappresentata in Figura 15.7 le cui corrispondenti equazioni
sono
Xm+1 (p) = Xm (p) + w r Xm (q)
Xm+1 (q) = Xm (p) w r Xm (q) .

(15.21)

Se supponiamo di cominciare con le uscite x


b(k) in ordine normale come in
Figura 15.8 possiamo invertire le relazioni (15.21) e ricavare Xm in funzione
di Xm+1 , ossia
1
[Xm+1 (p) + Xm+1 (q)]
2
1
Xm (q) =
[Xm+1 (p) Xm+1 (q)] w r .
2

Xm (p) =

(15.22)

Poich X (k) = x
b(k) e X0 (k) coincide con x(k) a parte lordine, che a disposizione invertita di bit, possiamo calcolare x(n) applicando ripetutamente
lequazione (15.22). Il grafo risultante per N = 8 quello mostrato in Figura 15.14,che quindi descrive un algoritmo di trasformata rapida di Fourier
inversa (IFFT).

15.3. ALGORITMI FFT BASATI SULLA DECIMAZIONE IN FREQUENZA1037

Figura 15.14: il grafo a farfalla della FFT inversa

Daltra parte, c un ovvio legame fra gli algoritmi di DFT e DFT inversa.
Osserviamo infatti che la IDFT (Denizione 14.2.2)

x(n) =

N 1
1 X
x
b(k)w kn,
N k=0

per cui si pu calcolare la IDFT tramite un algoritmo FFT se si divide il


risultato per N e se si usano potenze di w 1 invece di w. Analogamente
un algoritmo IFFT pu essere usato per calcolare la DFT, semplicemente
moltiplicando la sua uscita per N e usando le potenze di w invece di w 1 .
Ne segue che il grafo in Figura 15.14,che rappresenta un algoritmo IFFT,
diventa un algoritmo FFT sostituendo semplicemente 12 w r con w r , in quanto
eliminare il fattore 12 ad ogni stadio equivale a moltiplicare luscita per N = 2
al termine delle iterazioni. In eetti, se nella Figura 15.14 si eettua questo
cambiamento e si pone allingresso la successione x in ordine a disposizione
invertita di bit, si ottiene la Figura 15.12.
Si vede perci che ad ogni algoritmo basato sulla decimazione nel tempo
corrisponde un algoritmo di trasformazione inversa basato sulla decimazione

1038

CAPITOLO 15. FFT

in frequenza. Analogamente si pu aermare, che per ogni algoritmo FFT


a decimazione nel tempo esiste un algoritmo a decimazione in frequenza il
quale corrisponde a scambiare ingressi e uscite e a invertire la direzione di
tutte le frecce nel grafo di usso.

15.4

Algoritmi FFT a radice 2

Vediamo una formulazione degli algoritmi discussi nei paragra precedenti


pi adatta allimplementazione numerica.
Richiamiamo di nuovo lespressione che usiamo in questo Capitolo per la
DFT:
x
b(k) =

N
1
X

x(n)w kn

n=0

k = 0, . . . , N 1.

(15.23)

Nel caso generale in cui N = 2 , N, la DFT, in base alla sua Denizione


14.2.2, ha una naturale espressione in forma binaria. Per renderla esplicita,
scriviamo gli sviluppi binari degli interi k, n 6 N che compaiono in (15.23):
k = 21 k1 + 22 k2 + + k0
n = 21 n1 + 22 n2 + + n0

(15.24)

Identichiamo lintero k con la n-upla delle sue cifre binarie (k0 , . . . , k1 ).


Quindi x
b diventa una funzione di (k0 , . . . , k1 ). Analogamente, x si pu
pensare come funzione di (n0 , . . . , n1 ). Se sostituiamo queste espressioni
nelluguaglianza (15.23), essa diventa:

dove

x
b(k0 , . . . , k1 ) =

XX
n0

n1

x(n0 , . . . , n1 )w p

(15.25)

n1

p = (21 k1 + 22 k2 + + k0 )(21 n1 + 22 n2 + + n0 ) .
La sommatoria in (15.23) stata sostituita dalle sommatorie in (15.25)
perch n varia in maniera biunivoca al variare di ciascuna delle sue cifre
binarie.

15.4. ALGORITMI FFT A RADICE 2

1039

Ora fattorizziamo w p in due modi diversi. A seconda della fattorizzazione di w p otteniamo due tipi di algoritmo, a decimazione nel tempo o a
decimazione in frequenza. Esaminiamo i due casi in dettaglio.
Il primo algoritmo che esaminiamo quello di decimazione nel tempo,
cio quello di Cooley-Tukey [7], gi introdotto nella Sezione 15.2. Possiamo
riscrivere w p come
1 k

w p = w (2

1 n
1 ++k0 )(2
1 )

1 k

w (2

2 n
1 ++k0 )(2
2 )

1 k

w (2

1 ++k0 )(n0 )

(15.26)

Consideriamo il primo fattore in (15.26):


1 k

w (2

1 n
1 ++k0 )(2
1 )

= w 2 2 k1 n1 w 2
1
= w 2 k0 n1

1 n1

1 k

w2

0 n1

perch

w 2 = w N = (e2i/N )N = 1.
Allo stesso modo il secondo fattore si pu scrivere:
1 k

w (2

2 n
1 ++k0 )(2
2 )

1 k

= w 2 2 k1 n2 w 2
2
= w 2 (2k1 +k0 )n2

1 n2

2 k

w2

0 n2

di nuovo perch tutti i fattori che allesponente hanno un multiplo intero di


2 valgono 1. Lo stesso argomento si applica agli altri termini in (15.26).
Grazie a queste relazioni, (15.25) si pu riscrivere come
x
b(k1 , k2 , . . . , k0 )
XX
X
=

x(n1 , n2 . . . , n0 )
=

1 k

w2

0 n1

2 (2k

w2

1 +k0 )n2

1 k

. . . w (2

(15.27)
1 ++k0 )n0

Se si pone x(n1 , n2 . . . , n0 ) = x0 (n1 , n2 . . . , n0 ) e si eettuano le


somme iterativamente una dopo laltra, le uguaglianze 15.27 si trasformano
nel seguente sistema lineare:

1040

CAPITOLO 15. FFT

x1 (k0 , n2 , . . . , n0 )

1 (k

x0 (n1 , . . . , n0 )w 2

0 n1 )

(15.28)

n1

x2 (k0 , k1 , n3 , . . . , n0 )

x1 (k0 , n2 , . . . , n0 )w 2

x1 (k0 , k1 . . . , n0 )w (2

2 (2k

1 +k0 )n2

n2

..
.
x (k0 , k1, . . . , k1 )

1 k

1 ++k0 )n0

n0

x
b(k1 , k2 , . . . , k0 )

= x (k0 , k1 , . . . , k1) ..

I primi membri delle identit (15.28) sono le successioni intermedie risultanti


dai vari stadi di calcolo illustrati nella Sezione 15.2: in eetti, le identit
(15.28) sono precisamente la formulazione originale dellalgoritmo FFT di
Cooley-Tukey per N = 2 . Come osservato in Sezione 15.2, la successione di
uscita x
b(k) in ordine invertito di bit.
Vediamo un esempio con n = 4, cio = 2.
In questo caso
k = 2k1 + k0
n = 2n1 + n0

dove k1 , n1 = 0, 1

La (15.25) diventa
x
b(k1 , k0 ) =

XX

x0 (n1 , n0 )w (2k1 +k0 )(2n1 +n0 )

Usando la fattorizzazione descritta sopra, si ha



X X
x
b(k1 , k0 ) =
x0 (n1 , n0 )w 2k0 n1 w (2k1 +k0 )(n0 )

(15.29)

(15.30)

Poniamo

x1 (k0 , n0 ) =

x0 (n1 , n0 )w 2k0 n1

(15.31)

Facendo assumere a k0 .n0 i diversi valori possibili possiamo scrivere la (15.31)


in forma matriciale:

15.4. ALGORITMI FFT A RADICE 2


x0 (0, 0)
1 0 w0 0
x1 (0, 0)
x1 (0, 1) 0 1 0 w 0 x0 (0, 1)

x1 (1, 0) = 1 0 w 2 0 x0 (1, 0)
x0 (1, 1)
0 1 0 w2
x1 (1, 1)

La sommatoria in (15.30) si pu riscrivere ponendo


X
x2 (k0 , n0 ) =
x1 (k1 , n0 )w 2(k1 +k0 )n0

oppure, equivalentemente

x2 (0, 0)
x2 (0, 1)

x2 (1, 0) =
x2 (1, 1)

1 w0
0 w2
0 0
0 0

Da (15.30) e da (15.32) si ricava

x1 (0, 0)
0 0

0 0 x1 (0, 1)
1 w 1 x1 (1, 0)
x1 (1, 1)
1 w3

1041

(15.32)

x
b(k1 , k0 ) = x2 (k0 , k1 )

(15.33)

cio il risultato nale x2 (k0 , k1 ) si ottiene dalla sommatoria pi esterna in


ordine invertito di bit.
Una seconda maniera di fattorizzare w p si ottiene scomponendo k invece
di n: questo algoritmo detto di Sande-Tukey, o anche, come abbiamo gi
visto, a decimazione in frequenza. Vediamolo nel caso particolare di N = 4:
la formulazione pi generale analoga.
Riscriviamo in modo equivalente luguaglianza (15.29):

Da qui

x
b(k1 , k0 ) =

XX

x0 (n1 , n0 )w (2k1 +k0 )(2n1 +n0 )

w (2k1 +k0 )(2n1 +n0 ) = w (2k1 )(2n1 +n0 ) w (k0 )(2n1 +n0 ) = w (2k1 n0 ) w (k0 )(2n1 +n0 )
La (15.34) si pu riscrivere

X X
(k0 )(2n1 +n0 )
x
b(k1 , k0 ) =
x0 (n1 , n0 )w
w (2k1 n0 )

(15.34)

1042

CAPITOLO 15. FFT

Introducendo opportuni passi intermedi analoghi a quelli in (15.28) scriviamo


x1 (k0 , n0 ) =
x2 (k0 , k1 ) =

x0 (n1 , n0 )w k0 (2n1 +n0 )

(15.35)

x1 (k0 , n0 )w 2k1 n0

x
b(k1 , k0 ) = x2 (k0 , k1 )
dove abbiamo posto x0 (n1 , n0 ) = x(n1 , n0 ) per comodit di notazione. Il
grafo corrispondente alle uguaglianze (15.35) in Figura 15.15.

Figura 15.15: FFT a radice 2 per N = 4

15.5

Algoritmi di FFT a radice arbitraria

Nella Sezione 15.4 abbiamo studiato la DFT su N punti con N = 2 , ed


i corrispondenti algoritmi di FFT, detti a radice 2, i quali portano ad una
considerevole riduzione sul numero di moltiplicazioni ed addizioni complesse
da eettuare.
Per lipotesi N = 2 restrittiva. In questa Sezione esaminiamo algoritmi
FFT per un intero N arbitrario, quindi fattorizzato non come una potenza
di 2 bens come prodotto di m numeri interi qualsiasi: N = r1 rm , rk .
Esaminiamo prima il caso di due soli fattori: N = r1 r2 . Per derivare
algoritmi FFT in questo caso particolare, esprimiamo gli indici k, n come in
(15.24):

15.5. ALGORITMI DI FFT A RADICE ARBITRARIA

1043

k = k1 r1 + k0 con k0 = 0, 1, . . . , r1 1, k1 = 0, 1, . . . , r2 1
n = n1 r2 + n0 con n0 = 0, 1, . . . , r2 1 n1 = 0, 1, . . . , r1 1 .
Osserviamo che questa scomposizione unica.
In questa notazione, (15.23) diventa

x(k1 , k0 ) =

rX
2 1

n0 =0

" r 1
1
X

x(n1 , n0 )w kn1r2 w kn0

n1 =0

(15.36)

perch w r1 r2 = w r = 1.
Lesponenziale w kn1 r2 si pu fattorizzare nel modo seguente:
w kn1 r2 = w (k1 r1 +k0 )n1 r2 = w r1 r2 k1 n1 w k0 n1 r2
= [w r1 r2 ]k1 n1 w k0 n1 r2 = w k0 n1 r2
perch w r1 r2 = 1.
Inoltre si ha:
w kn0 = w (k1 r1 +k0 )n0 .
La 15.36 diventa:

x(k1 , k0 ) =

rX
2 1

n0 =0

" r 1
1
X

x(n1 , n0 )w

n1 =0

k 0 n1 r2

w (k1 r1 +k0 )n0

(15.37)

oppure, ponendo x(n1 , n0 ) = x0 (n1 , n0 ) ed introducendo passi intermedi


analogamente a quanto fatto in (15.35),

x1 (k0 , n0 ) =

rX
1 1

x0 (n1 , n0 )w k0 n1 r2

n0 =0

x2 (k0 , k1 ) =

rX
2 1

n0 =0

x1 (k0 , n0 )w (k1 r1 +k0 )n0 .

(15.38)

1044

CAPITOLO 15. FFT

Il risultato nale :
(15.39)

x(k1 , k0 ) = x2 (k1 , k0 ).

Notiamo che, come negli algoritmi a radice 2 (Sezione 15.4, il risultato in


ordine dei bit invertito.
Le uguaglianze (15.38) e (15.39) costituiscono lagoritmo FFT nel caso N =
r1 r2 .
Vediamo un esempio nel caso r1 = r2 = 4; in tal caso abbiamo N =
r1 r2 = 16. Usando le uguaglianze (??), esprimiamo gli indici k e n in radice
4:
k = 4k1 + k0
n = 4n1 + n0

con k1 , k0 = 0, 1, 2, 3
con n1 , n0 = 0, 1, 2, 3.

(15.40)

Nel prodotto kn spezziamo n come nella seconda uguaglianza (15.40). In


questo modo sviluppiamo (15.37) con lapproccio della decimazione nel tempo (si vedano le uguaglianze da (15.26) a (15.28)). Luguaglianza (15.37)
diventa:

x(k1 , k0 ) =

" 3
3
X
X

n0 =0

x(n1 , n0 )w 4k0 n1 w (4k1 +k0 )n0 .

n1 =0

Usando i passi intermedi introdotti in (15.38) otteniamo:

x1 (k0 , n0 ) =

3
X

x0 (n1 , n0 )w 4k0 n1

(15.41)

n0 =0

x2 (k0 , k1 ) =

3
X

x1 (k0 , n0 )w (4k1 +k0 )n0 .

n0 =0

Ora si ricava dalla (15.39) la struttura dellalgoritmo in radice 4:

x(k1 , k0 ) = x2 (k1 , k0 ).

(15.42)

15.5. ALGORITMI DI FFT A RADICE ARBITRARIA

1045

Figura 15.16: FFT a radice 4

Le ultime tre uguaglianze costituiscono lalgoritmo FFT in radice 4, nel caso


N = 16.

1046

CAPITOLO 15. FFT

Il grafo risultante mostrato in Figura 15.16.


Vediamo come si ottiene questo grafo: dalla (15.41) si vede che bisogna
calcolare due vettori intermedi e che ogni nodo ha quattro spigoli in ingresso
ed in uscita. Per esempio, per ogni k1 = 0, 1, 2, 3, gli spigoli in ingresso al
nodo x(k1 , k0 ) sono quelli provenienti da
x0 (0, k0), x0 (1, k0 ), x0 (2, k0 ), x0 (3, k0).
Il grafo in Figura 15.16 non riporta tutti gli spigoli presenti, e neppure i
fattori w p , che si possono calcolare direttamente dalle (15.41).
Lultima parte a destra illustra la permutazione nale per ottenere il vettore x(n) con indici ordinati. Come vedreme pi avanti, lalgoritmo a radice 4 riduce di circa il 30% il numero di moltiplicazioni necessarie rispetto
allalgoritmo a radice 2 per lo stesso valore di N.
Esaminiamo ora lalgoritmo generale di Cooley-Tukey per N = r1 rk
N.
Come prima, esprimiamo gli indici k, n nella forma
k = km1 (r1 , . . . , rm1 ) + km2 (r1 , . . . , rm2 ) + + k1 r1 + k0
n = nm1 (r2 , . . . , rm ) + nm2 (r3 , . . . , rm ) + + n1 rm + n0
dove
ki1 = 0, 1, 2, . . . , ri 1
ni1 = 0, 1, 2, . . . , rm1 1

1im
0 i m 1.

Ora lespressione (15.23) della DFT diventa


x(km1 , . . . , k0 ) =

X
n0

x0 (nm1 , . . . , n0 )w kn ,

(15.43)

nm1

dove le sommatorie sono estese a tutti gli indici {ni : ni = 0, 1, . . . , rm1 1}


con 0 i m 1.
Sostituendo il valore di n, otteniamo dalla (15.42):
w kn = w k[nm1 (r2 ...rm )++n0 ] .

(15.44)

15.5. ALGORITMI DI FFT A RADICE ARBITRARIA

1047

Il primo fattore si pu scrivere:


w knm1 (r2 rm ) = w [km1(r1 ...rm1 )++k0 ][nm1 (r2 ...rm )]
= [w r1rm ]

[km1 (r1 ...rm1 )++k1 ]nm1

(15.45)

w k0nm1 (r2 rm ) .

Poich w r1 rm = w N = 1, la (15.45) diventa


w knm1 (r2 rm ) = w k0 nm1 (r2 rm )
per cui la (15.44) diventa
w nk = w nm1 k(r2 rm ) w k[nm1 (r3 rm )++n0 ] .
Sostituendo in (15.43) abbiamo
x(km1 , . . . , k0 )
(15.46)
#
"
X
X
...
x0 (nm1 , . . . , n0 )w k0 nm1 (r2 rm ) w k[nm2 (r3 rm )++n0 ] .
=
n0

nm1

Ponendo, di nuovo, x(nm1 , . . . , n0 ) = x0 (nm1 , . . . , n0 ), deniamo un vettore intermedio x1


X
x0 (nm1 , . . . , n0 )w k0 nm1 (r2 rm ) .
x1 (k0 , nm2 , . . . n0 ) =
nm1

Ora la (15.46) diventa


x(km1 , . . . , k0 )
=

...

n0

"

nm1

(15.47)

x1 (k0 , nm2 , . . . n0 ) w k[nm2 (r3 ...rm )++n0 ] .

Con una decomposizione analoga alla precedenti, si ottiene


w knm2 (r3 rm ) = w (k1 r1 +k)nm2 (r3 rm ) .
Allora, ponendo
x2 (k0 , k1 , nm3 , . . . n0 )
=

nm2

x1 (k0 , nm2 , . . . n0 )(k1 r1 +k)nm2 (r3 rm ) ,

1048

CAPITOLO 15. FFT

trasformiamo la (15.47) in
x(km1 , . . . , k0 )
=

X
n0

...

X
nm3

x2 (k0 , nm3 , . . . n0 ) w k[nm3(r4 rm )++n0 ] .

Riducendo iterativamente la (??) allo stesso modo, otteniamo un sistema


lineare espresso come successione ricorsiva di uguaglianze della forma
x1 (k0 , . . . , ki1 , nmi1 , . . . , n0 )
X
=
xi1 xi1 (k0 , . . . , ki2 , nmi , . . . , n0 )w [ki1(r1 ri1 )++k0 ]ni1 (ri+1 rm )
kmi

per i = 1, 2, . . . , m.
Questa espressione valida se si assume che
(ri+1 rm ) = 1

per i > m 1 e k = 0.

Il risultato nale dato da:


x(km1 , . . . , k0 ) = xm (k0 , . . . , km1 ).
Un algoritmo alternativo si pu ottenere espandendo, nel prodotto kn, il
terminek invece del termine n (cio con decimazione in frequenza invece che
nel tempo). Omettiamo i dettagli.
Inne, calcoliamo il numero di oiperazione necessarie per eseguire lalgoritmo FFT discusso sopra per N = r1 rm .
Il vettore x1 in (??) ha N elementi: per calcolare ciascun elemento occorrono
r1 operazioni (una moltiplicazione complessa e una addizione complessa), per
un totale di Nr1 operazioni per ottenere x1 .
Analogamente occorrono Nr2 operazioni per calcolare x2 da x1 ; continuando
cos si trova che il calcolo di xm richiede N(r1 + + rm ) operazioni.
Questa stima non tiene conto della simmetria dellesponenziale complesso,
che pu invece essere sfruttata per ridurre il numero totale di operazioni;
vediamo come.

15.5. ALGORITMI DI FFT A RADICE ARBITRARIA

1049

Consideriamo per esempio un algoritmo a radice 4, con N = 16. In questo


caso le uguaglianze sono
3
X

x1 (k0 , n0 ) =

x0 (n1 , n0 )w 4k0 n1

(15.48a)

x0 (k0 , n0 )w (4k1 +k0 )n0

(15.48b)

n1 =0
3
X

x2 (k0 , k1 ) =

n0 =0

(15.48c)

x(k1 , k0 ) = x2 (k0 , k1 ).
La (15.48c )si pu riscrivere
#
" 3
3
X
X
x(k1 , k0 ) =
x0 (n1 , n0 )w 4k0 n1 w 4k1 n0 w k0 n0 .
n0 =0

n1 =0

Il fattore w k0 n0 pu essere spostato nella sommatoria pi interna, in modo


da avere
)
#
(" 3
3
X
X
x(k1 , k0 ) =
x0 (n1 , n0 )w 4k0 n1 w k0 n0 w 4k1 n0 ,
n0 =0

n1 =0

oppure, in forma ricorsiva,


x1 (k0 , n0 ) =

"

3
X

x0 (n1 , n0 )w 4k0 n1 w k0 n0

n1 =0

x2 (k0 , k1 ) =

3
X

x0 (k0 , n0 )w 4k1 n0

(15.49a)
(15.49b)

n0 =0

x(k1 , k0 ) = x2 (k0 , k1 ).

(15.49c)

Consideriamo il fattore w 4k0 n1 nelluguaglianza ((15.49a)). Poich N = 16 si


ha:
 k0 n1
 k0 n1
w 4k0 n1 = (w 4 )k0 n1 = e4i(2/16)
= ei/2
.

Quindi w 4k0 n1 assume solo i valori 1, i, a seconda del valore dellintero


k0 n1 . Le moltiplicazioni per 1 in (15.49a) non sono altro che addizioni o
sottrazioni. Quelle per i si riducono a sottrazioni o addizioni precedute dallo

1050

CAPITOLO 15. FFT

scambio delle parti reali e immaginarie del secondo addendo. Questo equivale
a dire che la somma in parentesi quadra nella (15.49a) si pu calcolare senza
eettuare moltiplicazioni.
Il risultato della somma deve poi essere moltiplicato per w k0 n1 .
Un argomento analogo si applica alluguaglianza (15.49b): anchessa pu
essere valutata senza alcuna moltiplicazione.

15.6

Velocizzazione del calcolo della FFT per


dati reali: pre-elaborazione (preprocessing)
e post-elaborazione (post-processing)

In questa Sezione come ottimizzare il calcolo della DFT quando i dati in


input sono reali. Una parte della presentazione tratta da [3]. Qui la normalizzazione della DFT indierente per quanto concerne la semplicit di
scrittura, quindi ritorniamo alla denizione originale (Denizione 14.2.2):
x
bn =

N 1
1 X
xk w nk
N k=0

(15.50)

Spesso si interessati a calcolare la DFT di una successione reale per x


RN . In tal caso si pu usare la formula per la RDFT ottenuta nella Nota
14.9.3. Per la RDFT porta a una complessit di calcolo dellordine di N 2 .
certamente preferibile usare lalgoritmo della FFT, che ha una complessit di
calcolo molto minore, dellordine di N log2 N. Per la FFT un algoritmo di
calcolo della DFT di successioni a valori complessi: qui abbiamo tutte le parti
immaginarie nulle, e quindi sprechiamo met dellallocazione in memoria dei
dati. Per econimizzare le risorse possiamo ricombinare opportunamente i dati
di input (pre-processing) e di output (post-processing) in modo da ottenere:
1. due DFT di N dati reali eseguendo una DFT di N dati complessi;
2. una DFT di 2N dati reali eseguendo una DFT di N dati complessi.
Ecco gli algoritmi:

15.6. PREPROCESSING E POSTPROCESSING

1051

Proposizione 15.6.1. Siano x, y RN . Poniamo z = x+iy (pre-processing).


Allora le DFT soddisfano le relazioni
1

z + zb )
x
b = (b
2
i

z zb ) .
yb = (b
2

(post-processing)

Dimostrazione. Come sempre, scriviamo w = e2i/N . Osserviamo che


2nk
2nk
+ yn sin
N
N
2nk
2nk
Im(zn w nk ) = yn cos
xn sin
.
N
N
Re(zn w nk ) = xn cos

Da questo segue
N

zbk

1
=
N

2
X

zn w nk

+1
n= N
2
N

1
N

2
X

(xn cos

n= N
+1
2

2nk
2nk
+ yn sin
)
N
N

2
X

(xn sin

+1
n= N
2

2nk
2nk
yn cos
)
N
N

e quindi
x
bk

ybk

zbk + zbk
=
2

zbk zbk
=
2i

Nota 15.6.2. Il tempo di calcolo delle fasi di pre-processing, (xk , yk )

xk + iyk per k = N2 , . . . , N2 e di post-processing (b


zk , zbk ) zbk zbk per

1052

CAPITOLO 15. FFT

k = N2 , . . . , N2 , dellordine di N, quindi trascurabile rispetto al tempo


di calcolo N log2 N della FFT per grandi valori di N. Perci lalgoritmo
della Proposizione 15.6.1 dimezza lallocazione di memoria senza allungare
apprezzabilmente il tempo di calcolo.

Lemma 15.6.3. Sia N pari; poniamo wN = e2i/N e w2N = ei/N . Per


u R2N , come abbiamo fatto per la F F T separiamo le sottosuccessioni
xn = u2n dei termini pari e yn = u2n1 dei termini dispari (pre-processing).
Allora x, y RN , e per k = N2 , . . . , N2 , si ha
1
k
(b
xk + w2N
ybk ),
2
1
k
(b
xk w2N
ybk ).
=
2

u
bk =

(relazioni a farfalla).

u
bk+N

2
Dimostrazione. Osserviamo che w2N
= wN . Perci abbiamo

u
bk =

1
2N

N
X

zn w nk

n=N +1
N

1
=
2N

2
X

2nk
(z2n w2N
+ z2n1 w (2n1)k )

n= N
+1
2
N

1
=
2N
=

2
X

+1
n= N
2

1 k
nk
w
xn wN
+
2N 2N

1
k
(b
xk + w2N
ybk ).
2

2
X

nk
y n wN

+1
n= N
2

Abbiamo cos provato la prima uguaglianza dellenunciato. La seconda ora


k+N
k
segue dal fatto che x e y sono periodiche di periodo N, mentre w2N
= w2N
N
perch w2N
= 1.

A partire da questo Lemma, un calcolo elementare prova il seguente


risultato:

15.6. PREPROCESSING E POSTPROCESSING

1053

Proposizione 15.6.4. Sia u R2N e x, y come nel Lemma 15.6.3. Poniamo


zn = xn + iyn = u2n + iu2n1 per n = N2 , . . . , N2 (pre-processing). Allora
z CN e
N
1
1
k
k
ybk ) ,
k = 0, . . . ,
u
bk =
zbk (1 iw2N
ybk ) + zbk (1 + iw2N
4
4
2
1
N
1
k
k
zbk (1 + iw2N ybk ) + zbk (1 iw2N ybk ) ,
k = + 1, . . . , 0
u
bk+N =
4
4
2

Per la DFT, abbiamo sviluppato lalgoritmo FFT di calcolo rapido. Vorremmo elaborare un analogo algoritmo per la DCT e la DST. Limitiamo
lattenzione alla DCT (il caso della DST analogo).
Poich la DCT la DFT di successioni reali pari, si ha:
Esercizio 15.6.5. La DCT di una successione reale x RN consiste degli
N + 1 coecienti {b
u0 , . . . , u
bN } della DFT complessa a dimensione 2N dellestensione pari u di x (data da un = un = xn , n > 0).

Nota 15.6.6. Poich u reale e pari, i coecienti u


b0 , . . . , u
bN sono reali e pari,
per le Proposizioni 14.7.6 e 14.7.7.

Grazie allesercizio 15.6.5, possiamo ridurre il problema del calcolo rapido


della DCT allalgoritmo della FFT tramite pre-processing e post-processing.
I calcoli sono faticosi: ci limitiamo allenunciato.

Proposizione 15.6.7. (DCT veloce tramite pre-processing e postprocessing.) Sia x RN , u R2N la sua estensione pari, e zn = u2n +
i(u2n+1 u2n1 ), per n = N2 , . . . , N2 (pre-processing). Allora:
1
(b
zk + zbk
4
1
(b
zk + zbk +
=
4

x
bk =

x
bk+N

x
b0

x
bN

1
1
=
zb0 +
2
2N

1
1
zb0
=
2
2N

N
zbk zbk
) k = 1, . . . , ;
k
2
2 sin N
zbk zbk
N
) k = + 1, . . . , 1;
k
2
2 sin N

2
X

u2n1 ;

+1
n= N
2
N

2
X

+1
n= N
2

u2n1 .

1054

CAPITOLO 15. FFT

, che vicino a zero per k picNota 15.6.8. A causa del denominatore sin k
N
colo e N grande, la trascrizione numerica diretta della Proposizione 15.6.7
numericamente instabile: occorre invece riscrivere le uguaglianze eliminando
il denominatore.

15.7

Esercizi sulla FFT

Esercizio 15.7.1. Supponiamo che un computer richieda un tempo per il


calcolo della FFT di una successione di 215 valori. Quanto tempo necessario
per la FFT di una successione di 216 valori?
1. 

15
216

16
2.  2 15

3.  15 16
4.  16 log2 16
5.  nessuna delle precedenti

Esercizio 15.7.2. Supponiamo che un computer richieda un tempo per il


calcolo della FFT di una successione di 215 valori. Quanto tempo necessario
per la FFT di una successione di 216 valori?
1. 

15
216

16
2.  2 15

3.  15 16
4.  16 log2 16
5.  nessuna delle precedenti

Esercizio 15.7.3. Supponiamo che un computer richieda un tempo T per


il calcolo della FFT di una successione 27 = 128 valori. Quanto tempo
necessario per la FFT di una successione di 213 = 8192 valori?

15.7. ESERCIZI
1. 

78192
T
13128

2. 

138192
T
7128

1055

3.  13 8192 T
4. 
5. 

13128
T
78192

nessuna delle precedenti

Esercizio 15.7.4. Supponiamo che un computer richieda un tempo T per il


calcolo della FFT di una successione di 26 valori. Quanto tempo necessario
per la FFT di una successione di 212 valori?
1.  12 212 T
2.  27 T
3. 

T
12212

4. 

T
27

5.  nessuna delle precedenti

Esercizio 15.7.5. Supponiamo che un computer richieda un tempo per il


calcolo della FFT di una successione di 215 valori. Quanto tempo necessario
per la FFT di una successione di 216 valori?
1. 

15
216

16
2.  2 15

3.  15 16
4.  16 log2 16
5.  nessuna delle precedenti

1056

CAPITOLO 15. FFT

Esercizio 15.7.6. Supponiamo che un computer richieda un tempo per il


calcolo della FFT di una successione di 215 valori. Quanto tempo necessario
per la FFT di una successione di 216 valori?
1. 

15
216

16
2.  2 15

3.  15 16
4.  16 log2 16
5.  nessuna delle precedenti

Capitolo 16
Lerrore di approssimazione della
trasformata di Fourier con la
DFT: stime numeriche
dellaliasing
Abbiamo osservato nella Sezione 14.3 che la DFT di ordine N la nozione
naturale di trasformata di Fourier sul gruppo ciclico di N elementi. Per
nella pratica siamo sempre interessati a trasformate di Fourier di funzioni sui
reali, oppure di funzioni periodicizzate: nel secondo caso si sta usando una
trasformata di Fourier i cui valori sono una funzione sul gruppo Z degli interi, ossia una successione (la successione dei coecienti di Fourier). Daltra
parte, la DFT, che si applica solo a successioni periodiche, insostituibile nei
problemi di calcolo, perch le sue numerose propriet di simmetria permettono di realizzare algoritmi di calcolo veloce (i vari algoritmi di FFT presentati
nel Capitolo 15). quindi necessario approssimare trasformate e coecienti
di Fourier con la DFT, e quindi valutare lerrore numerico che si commette
in questa approssimazione.
In questa chiave, richiamiamo il fatto che dalla Proposizione 10.2.3 e dal
suo Corollario 10.2.4 segue che, se si periodicizza una funzione f L1 (R),
i coecienti di Fourier della funzione periodicizzata coincidono con la trasformata di Fourier di f alle frequenze corrispondenti. In altre parole, i
campioni di fb possono essere ottenuti come coecienti di Fourier di una
funzione associata.
Ora, la DFT una trasformata di Fourier discreta di successioni (ovvero di1057

1058CAPITOLO 16. LERRORE DI APPROSSIMAZIONE DI F CON LA DFT


stribuzioni discrete) periodiche. Vogliamo investigare analoghe relazioni fra
i valori della DFT della discretizzazione di f ed i coecienti di Fourier o i
campioni della trasformata di Fourier nel senso appena visto. Pi precisamente, indicando in questo Capitolo con fek , per evitare ambiguit, i valori
della DFT, ci chiediamo:
qual la relazione fra i valori fek della DFT ed i coecienti di Fourier
fb(k)? Se si approssimano i secondi con i primi, qual lerrore numerico?

se si usa la DFT per approssimare la trasformata di Fourier di f , come


si valuta lerrore numerico commesso? In particolare, come si stima
la dierenza fra fek ed il valore fb(k) della trasformata di Fourier alla
frequenza k?

In entrambi i casi, vedremo che gli errori di approssimazione sono manifestazioni del fenomeno di aliasing (Sezione 13.5), dovuti al fatto che la
discretizzazione nel tempo produce una periodicizzazione nel dominio della
frequenza: quindi il valore dellapprossimazione ad una data frequenza risente di contributi anche su frequenze diverse, e precisamente su una successione
equispaziata nel dominio della frequenza indotta per reciprocit dalla griglia
di campionamento nel dominio del tempo (Denizione 16.2.2). Pertanto il
presente Capitolo una analisi degli errori numerici indotti dallaliasing.
Le prossime sezioni sone dedicate a risolvere questi due problemi in condizioni di generalit via via maggiori. La presentazione tratta dalleccellente
monograa [3], alla quale rinviamo il lettore interessato ad approfondimenti
ed esempi.

16.1
16.1.1

Approssimazione dei coefficienti di Fourier di funzioni periodiche con la DFT


La formula di somma di Poisson discreta

Consideriamo lapprossimazione con la DFT dei coecenti di Fourier di funzioni periodiche di periodo T . Pi precisamente, consideriamo funzioni f
denite sullintervallo [T /2, T /2], che per il calcolo della DFT discretizziamo ad un numero N di campioni f (xn ) con xn = nT /N al variare di n da
N2 + 1 a N2 . Nonostante il fatto di dover discretizzare f , nondimeno facciamo ipotesi sulla sua regolarit come funzione di una variabile continua:

16.1. DFT E COEFFICIENTI DI FOURIER

1059

assumiamo che valgano le condizioni sucienti per la convergenza della sua


serie di Fourier illustrate nel Teorema 5.15.1 (continuit a tratti con la derivata, con un numero nito di salti nel periodo). Consideriamo la serie di
R
P
2ikx/T
b
Fourier di f :
con fb(k) = T1 T /2 T /2f (x) e2ikx/T dx.
k= f (k)e
Nellintervallo [T /2, T /2] essa converge a f (x) per ogni x che non sia un
punto di salto ed alla media aritmetica dei limiti destro e sinistro ai punti
di salto; altrove, essa converge nello stesso senso al prolungamento periodico
di f . Per comodit, supponiamo che i punti xn non siano punti di salto,
o pi semplicemente che non ci siano punti di salto, neanche agli estremi
del periodo (questa ipotesi non costa niente, perch in ogni caso siamo solo
interessati agli N valori ai punti di campionamento, e possiamo interpolarli
con una f arbitrariamente liscia). Allora, per n = N2 + 1, . . . , N2 ,
f (xn ) =

k=

fb(k)e2ikxn /T =

k=

fb(k)e2ikn/N .

(16.1)

Sotto queste ipotesi, possiamo facilmente dimostrare il seguente analogo


discreto della formula di somma di Poisson (Proposizione 10.3.1):
Lemma 16.1.1. (Variante discreta della formula di somma di Poisson.) Se la funzione f , periodica di periodo T , tale che la sua serie
di Fourier converge a f (x) ai punti di campionamento xn = nT /N (n =
[ N2 ] + 1, . . . , N2 ), allora la DFT della successione {f (xn )}, che indichiamo
con DFT(f ) oppure con fe, verifica

o equivalentemente

DFT(f )k fek =

fek =

m=

m=

fb(k + mN) ,

fb(k + mN) = (P fb)k .

Dimostrazione. Sostituiamo lespressione 16.1 nel calcolo della DFT della


successione {f (xn )}: per k = N2 + 1, . . . , N2 (assuendo per semplicit, qui

1060CAPITOLO 16. LERRORE DI APPROSSIMAZIONE DI F CON LA DFT


ed in seguito, N pari), si ottiene
N

1
DFT(f )k fek =
N
1
=
N

2
X

f (xn )e2ink/N

]+1
n=[ N
2
N

2
X

]+1
n=[ N
2

m=

1 X b
=
f (m)
N m=

fb(m)e2imn/N

2
X

2i(m+k)n/N

]+1
n=[ N
2

perch, in base al Lemma 14.2.5,


mod N e 0 altrimenti.

1
N

P N2

n= N
+1
2

e2ink/N

m=

fb(k + mN)

e2i(m+k)n/N = 1 se m = k

Nota 16.1.2. Se f una funzione periodica di periodo T che verica lipotesi


del precedente Lemma 16.1.1, allora la funzione f = f [0,T ] verica lipotesi
della Proposizione 14.11.1, ed inoltre P1 f = f . Allora lidentit del Lemma
16.1.1 per f coincide con lidentit della Proposizione 14.11.1 per f .

16.1.2

Funzioni periodiche con banda spettrale limitata:


ricostruzione esatta

Introduciamo la seguente denizione, analoga a quella data per funzioni su


R quando introducemmo la classe a banda limitata, ovvero di PaleyWiener
(10.4.1):
Definizione 16.1.3. Supponiamo che, per qualche M > 0, la funzione periodica f di periodo T abbia coecienti di Fourier fb(k) nulli per |k| > M.
Allora f un polinomio trigonometrico: in analogia con il caso non periodico, in questo Capitolo diciamo che f ha banda spettrale limitata, ovvero che
limitata in banda.
Rammentiamo (Corollario 5.2.6) che le frequenze nello sviluppo di Fourier
di una funzione f periodica di periodo T sono date da k = 0, 2
, 4
,....
T
T
Quindi lindice M a cui i coecienti di Fourier cominciano ad annullarsi nella
Denizione 16.1.3 corrisponde alla frequenza 2M/T .

16.1. DFT E COEFFICIENTI DI FOURIER

1061

Dalla formula di somma di Poisson discreta (Lemma 16.1.1) segue questo


analogo discreto del teorema del campionamento (Corollario 10.4.6):
Proposizione 16.1.4. (Il teorema del campionamento discreto: ricostruzione con la DFT dei coefficienti di Fourier di funzioni a banda
limitata.) Sia f una funzione periodica con serie di Fourier convergente a
f ai punti di campionamento [ N2 ] + 1, . . . , N2 (assuendo come sempre, per
semplicit, N pari).
(i) Se f a banda limitata con coefficienti di Fourier fb(k) = 0 per |k| >
N/2, allora la DFT di ordine N di f riproduce esattamente gli N
coefficienti di Fourier non nulli, nel senso che fek = fb(k) per [ N2 ]+1 6
k 6 N2 .

(ii) Se fb(k) = 0 per |k| > N/2 e N pari, allora


(
fb(k)
per |k| 6
fek =
N
N
per |k| =
fb( 2 ) + fb( 2 )

N
2
N
2

1,
.



Se f a valori reali, allora feN = 2 Re fb( N2 ) .
2

(iii) Se f ha periodo T , allora la condizione fb(k) = 0 per |k| > N/2 della
parte (i) equivale a dire che, se /2 lestremo inferiore delle frequenze tali che i coefficienti di Fourier si annullano, allora N > T ,
ovvero il passo di campionamento = T /N verifica la condizione di
Nyquist 6 1/.
(iv) La identit degli N coefficienti di Fourier di f da [ N2 ] + 1 a N2 con
i valori della DFT di ordine N, nel senso della parte (i), possibile
se e solo i coefficienti di Fourier soddisfano lidentit fb(k) = 0 per
|k| > N/2, ossia verificano la condizione di Nyquist della parte (iii). Se
f non a banda limitata oppure e a banda limitata in un intervallo di
indici non contenuto in [ N2 ] + 1, N2 , allora approssimare fb(k) con fek
per [ N2 ]+1 6 k 6 N2 in generale produce un errore di approssimazione
( aliasing, con la terminologia del Capitolo 13).
Dimostrazione. Le parti (i) e (iv) seguono immediatamente dal Lemma
16.1.1. Per la parte (ii), osserviamo che i coecienti di Fourier agli indici N2 e N2 non sono uguali, ma i valori della DFT invece lo sono, a cause

1062CAPITOLO 16. LERRORE DI APPROSSIMAZIONE DI F CON LA DFT


della paeriodicit di passo N. Quindi la DFT mescola (sommandoli) i due
modi di oscillazione N2 . Se 
f ha valori
reali, allora fb( N2 ) = fb( N2 ), e la

somma d come risultato 2 Re fb( N2 ) . Inne, per provare (iii), basta notare
che, se f ha periodo T , i modi di oscillazione di indici N2 corrispondono alla
frequenza massima di oscillazione N2 2
: allora la condizione che i coecienti
T
di Fourier si annullino per indici di valore assoluto maggiore o uguale a N2
equivale a richiedere N/T > .

16.1.3

Caso generale di funzioni periodiche con banda


spettrale illimitata: lerrore di approssimazione

Consideriamo il caso in cui la funzione f non sia a banda limitata, oppure


lo sia ma abbia coecienti di Fourier fb(k) 6= 0 per qualche |k| > N2 . In tal
caso sostituire fb(k) con il corrispondente valore fek della DFT di ordine N
causa un errore di approssimazione (aliasing), come notato nella Proposizione
16.1.4 (iv). Diamo ora una stima di questo errore numerico.
Teorema 16.1.5. (Lerrore di approssimazione dei coefficienti di
Fourier con la DFT.) Sia f una funzione periodica di periodo T e m
un intero non negativo.
(i) Se m > 1 e f e le sue prime m1 derivate sono continue in [T /2, T, 2]
e la derivata f (m) limitata con un numero finito di discontinuit nel
periodo, tutte di tipo salto, allora, per N2 + 1 6 k 6 N2 , vale la stima


1
e
b
fk f (k) = o
.
Nm

(ii) Se m > 0 ed inoltre la derivata f (m) , oltre ad essere limitata, monotna a tratti, allora vale la stima


1
fek fb(k) = O
.
N m+1

(iii) Per m > 1 la costante C = Ck dellinfinitesimo a secondo mewmbro


della stima (ii) dipende da k proporzionalmente a (1 1k )m . In particolaN
re, il rapporto massimo fra queste costanti al variare di k dellordine

16.1. DFT E COEFFICIENTI DI FOURIER

1063

di 3m1 , e le stime dellerrore per k grande sono maggiori che per k piccolo. Per funzioni f a valori reali (o a valori puramente immaginari),
1
si ha C|k|
|k| m1 : queste costanti crescono quando k si allontata
(1

da 0 (sono maggiori per k dellordine di N/2 che per k = 0, di un


fattore 2m1 ).

Stessa conclusione vale per la stima (i), dove la dipendenza da k dellinfinitesimo, per m > 1, proporzionale a (1 k1)m1 .
N

Dimostrazione. Dalla formula di somma di Poisson discreta (Lemma 16.1.1)


segue, per N2 + 1 6 k 6 N2 ,
fek fb(k) =

X
j=1

fb(k + jN) + fb(k jN) .

(16.2)

Grazie al Corollario 5.18.2, se vale lipotesi della parte (i), esiste una successione {aj > 0} con limj aj = 0 ed una costante C > 0 (indipendente da k)
tali che
aj
fb(k + jN) < C
|k + jN|m

per ogni N2 + 1 6 k 6

N
.
2

Osserviamo che

1
1
1
= m
m
|k jN|
N |j Nk |m
e | Nk | 6 21 . Pertanto il secondo membro di (16.2) si maggiora, uniformemente
rispetto a k, con

1
2Caj X
,
m
N j=1 |j 21 |m

mentre, per ciascun k, la maggiorazione pu essere resa pi forte cos:

1
2Caj X
.
N m j=1 |j Nk |m

P
1
Poich la serie
j=1 |j 1 |m convergente per m > 2, da qui segue la stima in
2
(i). Inoltre, dal teorema di confronto di una serie con un integrale (Lemma

1064CAPITOLO 16. LERRORE DI APPROSSIMAZIONE DI F CON LA DFT


??), otteniamo che, se m > 1,

X
j=1

Z
1
1
dx
dx =
k m
k tm
(x N )
1
1 N

1
1
1
1
=
=
.

m1
1m t
m 1 (1 Nk )m1
1 k

|j Nk |m

ed il primo membro dierisce dallultimo membro per non pi di


Quindi la stima diventa
!
1
1
aj

fb(k + jN) < C


+
k m1
k m
|k + jN|m
(1 N )
|1 N |
< C

(1

k m1
)
N

aj
.
|k + jN|m

1
k m.
|
|1 N

(16.3)

con C indipendente da k. Se f a valori reali, allora fb(k) = fb(k) (Corollario 5.2.5), e quindi il modulo di fb una successione pari, ossia simmetrica,
per cui landamento dellerrore dipende solo da |k|; analoga conclusione vale
per f a valori immaginari.
Analogamente, per provare (ii), facciamo ricorso al Teorema 5.18.5 per
ottenere
1
fb(k + jN) < C
|k + jN|m+1

per ogni N2 + 1 6 k 6 N2 e per qualche costante C > 0. Da qui largomento


della parte (i) porta direttamente alla stima (ii). La costante C = Ck della
stima (ii), grazie alla disuguaglianza (16.3), dipende da k proporzionalmente
a (1 k1)m1 . In particolare, Ck minima per k = N2 + 1 ed massima
N

per k = N2 , ed il rapporto fra queste due costanti massima e minima di


controllo dellerrore quindi dellordine di ( 23 )m1 /( 12 )m1 = 3m1 . Lultima
osservazione prova (iii).

Nota 16.1.6. La seconda parte del Teorema 16.1.5, dimostrata per m > 0, vale
anche, con una dimostrazione pi elaborata, per m = 0, ossia per funzioni
limitate e monotne a tratti (si veda un riferimento bibliograco in [3, pg.
189].

16.2. DFT E TRASFORMATA DI FOURIER

16.2

1065

Approssimazione della trasformata di Fourier con la DFT

In questa Sezione valutiamo lerrore di approssimazione della trasformata


di Fourier con la DFT. Studiamo dapprima funzioni a supporto compatto,
diciamo - senza perdita di generalit- un intervallo, campionate con una
griglia di N punti in tale intervallo; poi funzioni con trasformata di Fourier
a supporto compatto; inne, il caso generale.

16.2.1

Funzioni a supporto compatto

Sia f una funzione a supporto nel compatto [T /2, T /2]. Come prima, siamo interessati solamente a N valori campionati di f , ai punti equispaziati
xn = n/T , dove N2 + 1 6 n 6 N2. Pertanto possiamo supporre che f sia
arbitrariamente regolare in [T /2, T /2] (possiamo raccordare gli N valori
campionati con una curva arbitrariamente liscia, che ci d il graco di f ).
Quindi assumiamo che la serie di Fourier converga a f , che la trasformata di Fourier sia denita e che valga la formula di somma di Poisson. Per
comodit e concretezza, in questa Sezione supponiamo che f sia di classe
C (m1) ed ammetta (5.18.3) derivata di ordine m limitata e monotna a tratti (equivalentemente, la derivata di ordine m continua a tratti e monotna
a tratti).
Nota 16.2.1. Stiamo implicitamente assumendo che f (T /2) = f (T /2) = 0.
Se i due valori estremi fossero dierenti, la funzione f avrebbe un salto al
bordo: in tal caso ai punti T /2 la serie di Fourier convergerebbe alla media
aritmetica di questi valori estremi, ed il decadimento asintotico della trasformata di Fourier e dei coecienti di Fourier sarebbe pi lento, dellordine di
1/ e 1/n rispettivamente (Corollario 8.2.8 e Proposizione 5.18.3; si vedano
anche il Lemma 5.18.1 ed il Teorema 5.18.5).

Osserviamo che gli N campioni di f sono presi ai punti xn = nT /N equispaziati nellintervallo di supporto, [T /2, T /2] (naturalmente, come sempre,
N2 + 1 6 n 6 N2 ): il passo di campionamento quindi = T /N. Pertanto
linput della DFT non cambia se sostituiamo f con la sua periodicizzazione
di passo T . In altre parole, possiamo utilizzare i risultati della precedente Sezione 16.1 (o meglio della Sottosezione 16.1.3, perch il fatto che la funzione
originale sia a supporto compatto esclude che anche il suo spettro di Fourier
lo sia (Sezione 9.9)). In particolare, per questa scelta di f abbiamo aliasing.

1066CAPITOLO 16. LERRORE DI APPROSSIMAZIONE DI F CON LA DFT


Possiamo quindi far uso dellespressione tramite la DFT della formula di
somma di Poisson per i dati campionati fn = f (xn ) e fbk = fb(k ), con k =
k
= k/T (Proposizione 14.11.1); si dice che queste frequenze sono ottenute
N
per reciprocit a partire dalla successione xn dei punti di campionamento nel
dominio del tempo. Per uso futuro, deniamo formalmente questa nozione:
Definizione 16.2.2. Dato T , reali positivi ed N intero positivo, le due
successioni equispaziata di N punti xn = nT nel dominio del tempo e n =
n nel dominio della frequenza ( N2 + 1 6 n 6 N2 ) si dicono connesse per
reciprocit se vale la relazione di reciprocit T = 1.
In tal modo, ricordando che N = T , otteniamo:
T {DFTN PN {fn }}k = PN {fbk } .

Daltra parte, ora la successione degli N campioni fn non cambia sotto lazione di PN , perch questa periodicizzazione consiste nel sommare a ciascun
campione valori del tipo f (xn+jN = f (xn + jT /2), ovvero valori di f su punti
che giacciono fuori dellintervallo di supporto [T /2, T /2], e su questi punti
f si annulla. In altre parole, PN {fn } = {fn }. Quindi abbiamo trovato il
risultato seguente:
Proposizione 16.2.3. Nella notazione appena sviluppata, si ha
T {DFTN {fn }}k = PN {fbk } .

In seguito alla normalizzazione per il fattore T che emerge in questa


variante della formula di somma di Poisson, vogliamo ora valutare lerrore di
approssimazione cos denito:
Definizione 16.2.4. (Errore di aliasing.) Lerrore commesso nellapprossimare alle frequenze k (con N2 + 1 6 k 6 N2 ) la trasformata di Fourier di
f con la sua DFT, nella notazione appena sviluppata,
T DFTN {fn }k fb(k ) .

Analogamente alla notazione utilizzata nella Sottosezione 16.1.1, scriviamo


DF TN {fn }k fek . Pertanto lerrore di approssimazione, detto anche errore
di aliasing,
T fek fbk .

16.2. DFT E TRASFORMATA DI FOURIER

1067

Ora dalla Proposizione 16.2.3 abbiamo:


Corollario 16.2.5. Per funzioni a supporto compatto campionate su N punti equispaziati nellintervallo di supporto, lerrore di aliasing alle frequenze equispaziate k ottenuta per reciprocit (Definizione 16.2.2) dai punti di
campionamento,
|PN {fbk } fbk | .
In altre parole, lerrore di aliasing la dierenza fra la trasformata di Fourier
dellinput alle frequenze k e la sua periodicizzazione di passo N, ovvero,
in termini di frequenze, di passo 1/T (due frequenze k = NkT distano NkT ,
quindi la periodicizzazione di passo N sui loro indici equivale alla periodicizzazione di passo 1/T nei valori della frequenza, esattamente come si
gi osservato nell dimostrazione della Proposizione 14.11.1 ). Il lettore
vivamente consigliato di rivedere la situazione identica che abbiamo incontrato nella dimostrazione del teorema del campionamento di Shannon, sia
nel Capitolo 10, sia nel Capitolo 13.
Il prossimo teorema d una stima di questo errore.

Teorema 16.2.6. (Lerrore di approssimazione della trasformata di


Fourier con la DFT, per funzioni a supporto compatto.) Sia f una
funzione con supporto in [T /2, T /2], campionata negli N punti xn = nT /N,
dove N2 + 1 6 n 6 N2 , e per N2 + 1 6 k 6 N2 siano k = k/T le
frequenze ottenute dai punti xn per reciprocit (Definizione 16.2.2). Poniamo
fn = f (xn ) e fbk = f (k ), e scriviamo fek = DFT{fn }k .

(i) Sia m > 1 e supponiamo che f e le sue derivate f (j) per j = 1, 2, . . . , m


1 siano continue in [T /2, T, 2], con f (j) (T /2) = f (j) (T /2) (quindi
stiamo assumendo la continuit delle derivate del periodicizzato di f di
passo T ). Supponiamo inoltre che la derivata f (m) sia limitata con un
numero finito di discontinuit nel periodo, tutte di tipo salto. Allora,
per N2 + 1 6 k 6 N2 , lerrore di aliasing soddisfa la stima


1
T fek fb(k) = o
.
Nm

(ii) Se m > 0 ed in aggiunta alle ipotesi della parte (i) si assume che la
derivata f (m) , oltre ad essere limitata, sia monotna a tratti, allora vale
la stima


1
e
b
T fk f (k) = O
.
N m+1

1068CAPITOLO 16. LERRORE DI APPROSSIMAZIONE DI F CON LA DFT


(iii) Se la condizione f (k) (T /2) = f (k) (T /2) vale solo per k = 1, . . . , p <
m 1, allora le stime precedenti dellerrore di aliasing diventano


1
e
b
.
T fk f (k) = o
N p+1

(iv) Per la dipendenza da k delle costanti di questi infinitesimi valgono le


stesse stime del Teorema 16.1.5 (iii).

Dimostrazione. Largomento procede in maniera analoga a quella del teorema


corrispondente per i coecienti di Fourier (Teorema 16.1.5). Ci limitiamo a
dare la dimostrazione del risultato pi forte (la parte (ii)), ed un cenno di
(iii): il lettore pu ricavarne quella della parte (i) per esercizio seguendo la
traccia del teorema citato.
Come sempre, partiamo calcolando alle frequenze k la formula di somma di Poisson, ma questa volta non quella discreta bens quella per variabile
continua, nel caso di periodicizzazione di passo (10.8). Scegliamo il passo
= T /N (lincremento fra due punti di campionamento consecutivi). Poich f (xn ) = 0 se |xn | > T2 , ossia se |n| > N2 (qui stiamo assumendo che
f (T /2) = f (T /2) = 0), si ottiene:
N

T
N

2
X

2ixn k

f (xn )e

+1
n= N
2

= PN/T fb(k ) =
=

j=



jN
b
f k +
T
j=

(16.4)

fb(k+jN )

(ael primo membro c una somma nita anzich una serie perch il supporto
di f compatto). In questa identit il primo membro si riscrive come
N

T
N

2
X

+1
n= N
2

f (xn )e2ixn k

T
=
N

2
X

+1
n= N
2

f (xn )e2ink/N = T fek .

Quindi per lerrore di aliasing si ottiene:


X
fb(k+jN .
T fek fb(k) =
j6=0

(16.5)

16.2. DFT E TRASFORMATA DI FOURIER

1069

Daltra parte, consideriamo PT f , il periodicizzato di f di passo T : per la Proposizione 10.2.4, i suoi coecienti di Fourier sono connessi alla trasformata
di Fourier di f nel modo seguente:

In altre parole,

d
fb(n/T ) = T P
T f (n) .



k + jN
b
b
d
f (k+jN ) = f
= TP
T f (n) .
T

(16.6)

Questo riduce il secondo membro di (16.5) ad una serie di coecienti di


Fourier, che si stimano esattamente come nella dimostrazione del Teorema
16.1.5: in tal modo si ottengono (ii) (ed analogamente (i)), e (iv).
Se la condizione di annullamento ai bordi delle derivate successive, o
almeno di uguaglianza ai bordi, viene meno prima di raggiungere la derivata
di ordine m 1, allora lordine di decadimento dei coecienti di Fourier
pi blando, come osservato nella Nota 16.2.1. Applicando i risultati citati in
quella Nota otteniamo la stima (iii).

Nota 16.2.7. La seconda parte del Teorema 16.1.5, dimostrata per m > 0, vale
anche, con una dimostrazione pi elaborata, per m = 0, ossia per funzioni
limitate e monotne a tratti (si veda un riferimento bibliograco in [3, pg.
189].

16.2.2

Funzioni a banda spettrale limitata

Consideriamo ora lerrore di approssimazione con la DFT di funzioni f con


banda spettrale limitata. In realt questa Sezione potrebbe essere uncata
con la successiva che tratta il caso generale di funzioni non necessariamente a
supporto compatto ne nel dominio deel tempo ne in quello della frequenza,
perch le stime dellerrore sono analoghe, ma preferimao trattare a parte il
caso di banda spettrale limitata per evidenziare in seguito come lerrore nel
caso generale sia la somma di contributi di addendi limitati nel tempo o nella
frequenza. Inoltre, il caso con spettro di Fourier a supporto compatto ricalca
largomento che dimostra il teorema del campionamento (Teorema ??: si
veda anche il Capitolo 13), ed opportuno evidenziarne qui lanalogia.
Sia quindi f una funzione in L1 (R) tale che fb ha supporto nel compatto
[/2, /2]. Il primo problema da arontare : come si scelgono gli N

1070CAPITOLO 16. LERRORE DI APPROSSIMAZIONE DI F CON LA DFT


punti di campionamento nel dominio del tempo? Dobbiamo scegliere N
punti equispaziati in un intervallo [A/2, A/2], ma poich nel dominio del
tempo f non pu avere supporto compatto (Sezione ??), ora non c un
modo naturale di scegliere A. Allora cominciamo invece con lo scegliere una
partizione equispaziata per il campionamento nel dominio delle frequenze: N
punti equispaziati n = n/, con N2 +1 6 n 6 N2. Nel dominio del tempo,
consideriamo una successione equispaziata di N punti xn = n con N2 +
1 6 n 6 N2. Anch non ci sia aliasing, sappiamo dallapproccio generale
del teorema del campionamento, ed in particolare dalle Sottosezioni 16.1.2 e
16.1.3 che si deve scegliere
6 1/ .
(16.7)
Allora gli N punti nel dominio del tempo si equidistribuiscono nellintervallo
[A/2, A/2] [N, N ] [, ]. In altre parole, scegliamo
A = N .

(16.8)

Poich la funzione f non a supporto compatto, troncarla su questo


intervallo ci fa perdere parte dei suoi valori, e dobbiamo quindi aspettarci
un errore di approssimazione, questa volta dovuto al troncamento nel tempo
invece che nella frequenza.
Stimiamo qualitativamente questo errore applicando, come sempre, la formula di somma di Poisson (10.6), che, nella notazione di (16.4), ora diventa:

2ixn k

f (xn )e

n=




X
j
b
=
f k +
=
fb(k+jN )

j=
j=

(16.9)

(stime quantitative saranno ricavate in generale, nella prossima Sezione 16.2.3).


Ora, al secondo membro sopravvive solo il termine fb(k ), perch per j 6= 0 la
frequenza k+jN = k + j fuori del supporto [/2, /2] di fb, dal momento
che abbiamo
1/ (16.7). In realt, nel solo caso k = N2 , se i
 scelto 6 
limiti fb N o fb + N sono non nulli, allora sopravvivono due termini
2

e non uno solo, ma in tal caso sceglieremo leggermente pi grande per


evitare questo inconveniente banale.
Invece al primo membro i termini da N2 + 1 a N2 sono, a meno della costante
N, la DFT di ordine N calcolata a k .

16.2. DFT E TRASFORMATA DI FOURIER

1071

Pertanto nel caso presente, ponendo come al solito fef = DFT{f (xn )}k , la
formula di somma di Poisson diventa:

X
N
fb(k ) = N fek + f N e2i 2 k/N +
fn e2ink/N
2

|n|> N
2

= N fek + f N (1)k +
2

|n|> N
2

fn e2ink/N .

La DFT non completamente simmetrica rispetto agli indici. Nel nostro


caso abbiamo scelto di far variare gli indici da N2 + 1 a N2 . Invece avremmo potuto scegliere il range da N2 a N2 1. Poich la DFT si applica a
successioni periodiche non fa dierenza; ma qui la successione fn = f (xn )
non periodica, ed ora che f non pi a supporto compatto non pi
neanche ipotizzabile che valga f (x N = 0. Pertanto occorre periodicizzare
2
la successione fn , o equivalentemente
alterare lultimo addendo della DFT in


1
modo che divenga 2 f N + f N (1)k invece che f N (1)k . In tal modo, la
2
2
2
formula di somma di Poisson diventa



X
1
N fek +
fn e2ink/N = fb(k ) ,
f N + f N (1)k +
2
2 2
N
|n|>

e pertanto, rammentando la scelta fatta per A (16.8), per lerrore di approssimazione (Denizione 16.2.4) troviamo



X


1
fn e2ink/N . (16.10)
|Afek fb(k )| 6 |f N | + |f N | +
2
2
2
N
|n|>

Da questa disuguaglianza possiamo ricavare stime per lerrore trovando maggiorazioni per la serie a secondo membro, in analogia a quanto si fatto nel
Teorema 16.2.6. Pewr in quel teorema si doveva maggiorare una serie costruita con gli addendi fbk , per i quali valgono stime di decadimento in base
alla regolarit di f . Qui invece gli addendi sono costruiti a partire dai valori
campionati fn = f (xn ) di f , e quindi ora dobbiamo imporre condizioni non
sulla regolarit di f ma sul suo decadimento allinnito. Rinviamo questa
analisi al caso generale nella prossima Sottosezione 16.2.3. Osserviamo solo

1072CAPITOLO 16. LERRORE DI APPROSSIMAZIONE DI F CON LA DFT


che (16.10) prova il fatto seguente, che non altro che quanto il buon senso
suggerisce. Se allarghiamo lintervallo [ A2 , A2 ] in cui viene campionata la
funzione f , allora, per (16.8), deve aumentare N (perch il passo di campionamento non pu essere aumentato a causa della condizione di Nyquist
(16.7). In altre parole, se aumentiamo A il range di somma nella serie a
secondo membro decresce e quindi lerrore si riduce; esso tende a zero con
N se assumiamo che la serie converga (il che sostanzialmente analogo ad
una delle ipotesi di applicabilit della formula di somma di Poisson, si veda
la Proposizione 10.3.1).

16.2.3

Il caso generale: funzioni a supporto non compatto ed a banda spettrale illimitata

Il ragionamento svolto nella Sottosezione precedente apre la strada a stime


dellerrore nel caso generale. Infatti, se fb non ha supporto compatto, al
secondo membro della formula di Poisson (16.9) rimangono tutti i termini
invece che il solo fb(k ), e quindi ora invece di (16.10) si ottiene:



X


1
fn e2ink/N
|Afek fb(k )| 6 |f N | + |f N | +
2
2
2
|n|> N
2
X


+
fb(k + j) .
(16.11)
|j61|

In questa somma, gli addendi a secondo membro rapprersentano i contributi


allerrore esaminati nelle due Sottosezioni precedenti: il primo lerrore di
troncamento dovuto al fatto che f non ha supporto compatto, lultimo
lerrore di troncamento dovuto al fatto che fb non ha supporto compatto.

Teorema 16.2.8. (Lerrore di approssimazione della trasformata di


Fourier con la DFT.) Sia f una funzione campionata negli N punti xn =
nT /N, dove N2 + 1 6 n 6 N2 , e per N2 + 1 6 k 6 N2 siano k = k/T le
frequenze ottenute dai punti xn per reciprocit (Definizione 16.2.2). Poniamo
fn = f (xn ) e fbk = f (k ), e scriviamo fek = DFT{fn }k . Sia m > 0 e
supponiamo che f e le sue derivate f (j) per j = 1, 2, . . . , m1 siano continue
in [T /2, T, 2], con f (j) (T /2) = f (j) (T /2) (quindi stiamo assumendo la
continuit delle derivate del periodicizzato di f di passo T ). Supponiamo
inoltre che la derivata f (m) sia limitata con un numero finito di discontinuit

16.2. DFT E TRASFORMATA DI FOURIER

1073

nel periodo, e monotna a tratti. A seconda dellordine di infinitesimo di f


per x
pm si hanno varie stime dellerrore di aliasing alle frequenza k . Studiamo
qui due casi tipici.
(i) Se f (x) < Me|x| per qualche M, > 0 e per tutti gli |x| > T /2, allora
esistono costanti Ck > 0, indipendenti da N, e C > Ck indipendente
da k e N, tali che, per N2 + 1 6 k 6 N2 , lerrore di aliasing soddisfa la
stima
1
( 12 N
)
2Me
Ck
e
b
|T fk f (k)| 6
+ m+1
(16.12)

N
dove Ck < C (1 1k )m e C una costante indipendente da k e N.
N

(ii) Se valgono le ipotesi della parte (i) tranne che per la stima asintotica
su f , che ora assumiamo essere f (x) < M/|x|r per qualche M, r > 1
e per tutti gli |x| > T /2, allora la stima diventa
|T fek fb(k)| 6

2M
r1

T
2

r1


T

Ck
N m+1

(16.13)

dove Ck < C (1 1k )m e C una costante indipendente da k e N.


N

(iii) Se la condizione f (k) (T /2) = f (k) (T /2) vale solo per k = 1, . . . , p <
m1, allora le stime precedenti dellerrore di aliasing diventano rispettivamente


1
1
1
2Me( 2 N )
e
b
+o
|T fk f (k)| 6

N p+1
e


r1
2M
1
1

+o
|T fek fb(k)| 6
.
T
r 1 T2 N
N p+1
Per la dipendenza da k delle costanti di questi infinitesimi valgono le
stesse stime delle parti (i) e (ii).
Dimostrazione. Per provare (i), stimiamo il primo termine al secondo membro di (16.11), trascurando il fattore moltiplicativo :



X


X
X
1 |f N | + |f N | +
fn e2ink/N 6
fn e2ink/N 6
|f (xn )| .
2
2
2
N
N
N
|n|>

|n|>

|n|>

(16.14)

1074CAPITOLO 16. LERRORE DI APPROSSIMAZIONE DI F CON LA DFT


Poich la funzione ex decrescente per x > 0 possiamo applicare il criterio
di confronto di una serie con un integrale (Lemma ??) ed otteniamo
Z
X
M ( T2 )
ex dx =
.
(16.15)
e
|f (xn )| 6 M
T

N
2
n>

Combinando (16.14) e (16.15) si trova



X


2M ( T )
1 |f N | + |f N | +
2
fn e2ink/N 6
e
2
2
2

N
|n|>

2M T T
e 2 N

(16.16)

perch = T /N da (16.8).
Ora consideriamo laltro termine al secondo membro di (16.11). A prima
vista sembra di poter applicare la stima del Teorema 16.2.6 (ii), ed in eetti
ora proviamo che tale stima vale, ma occore modicare leggermente largomento di quel teorema perch ora non vale pi lipotesi che f sia a supporto
compatto. Infatti, ricordando la prima identit in (16.2.1), ora abbiamo:
Z T Z T Z !
2
2
fb(k + j) = fb( k+jN ) =
+
+
f (x) e2i(k+jN )x/T dx .

T2

T
2

Il termine centrale al lato destro di questa disuguaglianza nientaltro che il


coeciente di Fourier di indice k + jN della funzione f (periodicizzata a partire dallintervallo [T /2, T /2]), denito nel Corollario 5.2.6, il quale si stima
come nel Teorema 16.1.5: innitesimo come O (1/N m+1 ). Consideriamo gli
altri due termini, ed integriamo per parti. In tal modo troviamo:
Z
f (x) e2i(k+jN )x/T dx
T
2



T
2i(k+jN )x/T
f (x)e
=
T
2i(k + jN)
2
Z
T
f (x) e2(k+jN )x/T dx

2(k + jN) T2
!
Z
T
=
f (T /2)ei(k+jN )
f (x) e2i(k+jN )x/T dx .
T
2(k + jN)
2
(16.17)

16.2. DFT E TRASFORMATA DI FOURIER

1075

R T
2
f (x) e2(k+jN )x/T dx, per in queUn calcolo analogo vale per lintegrale
sto caso il termine di bordo nellintegrale per parti vale f (T /2)ei(k+jN ) .
Poich lesponenziale periodico con periodo T e per la funzione f (e le sue
derivate) si assunta lidentit f (T /2) = f (T /2), i termini di bordo dei
due integrali si elidono a vicenda, e lintegrazione per parti ci riporta alla
stessa somma di due integrali, ma con f al posto di f e con un multiplo
di k + jN al denominatore. Ripetendo m volte lintegrazione per parti, e
tenendo conto del fatto che D m f limitata, otteniamo che anche la somma
dei due integrali si maggiora con un termine del tipo C/N m+1 per qualche
C > 0 che possiamo prendere indipendente da k. Quindi il primo membro
di (16.14) si maggiora con C/N m+1 , ed il resto dellargomento procede come
nella dimostrazione del Teorema 16.2.6 (ii) per arrivare alla stima al secondo
membro di (16.12). Questo prova (i).
La dimostrazione diR(ii) identica, tranne per il fatto che lintegrale in

1
M
(16.15) ora diventa M T xr dx = r1
p1 , il che porta, passo dopo
2
( T2 )
passo, alla disuguaglianza in (ii).

1076CAPITOLO 16. LERRORE DI APPROSSIMAZIONE DI F CON LA DFT

Capitolo 17
Metodi numerici per
deconvoluzione e trasformata di
Fourier a finestre
17.1

Deconvoluzione non partizionata

Abbiamo osservato nella Nota 11.1.1 che, per un auditorium la cui risposta
allimpulso non si modica per traslazione temporale dellimpulso, il segnale
h(t t0 ) ascoltato al tempo t dopo che stato prodotto un segnale impulsivo al tempo t0 la convoluzione h (t0 ) = h(t t0 ). Daltra parte le
combinazioni lineari delle delta sono dense, nel senso delle distribuzioni, nelle funzioni continue f a crescita al pi polinomiale: questo equivale a dire
che le somme di Riemann approssimano lintegrale di f . Pertanto, il segnale
acustico ascoltato nellauditorium quando i musicisti suonano un segnale f
la convoluzione h f .
Poich ora siamo interessati unicamente a segnali campionati, quindi
discreti, non indispensabile utilizzare distribuzioni, e vorremmo derivare
questo risultato in modo pi elementare.

17.1.1

Operatori lineari invarianti per traslazione

Definizione 17.1.1. (Filtri.) Un filtro T , anche detto sistema nel linguaggio ingegneristico, una trasformazione lineare, non necessariamente
invertibile, che mappa una sequenza in ingresso f (n) in una in uscita g(n),
1077

1078

CAPITOLO 17. DECONVOLUZIONE E DFT A FINESTRE

oppure un segnale in ingresso f (t) di variabile continua t in uno in uscita


g(t).
Ad esempio, loperatore che restituisce al tempo t > 0 la media da 0 a 1+t dei
valori del segnale in ingresso un ltro non invertibile (segnali diversi possono
avere la stessa media, e comunque i valori dellingresso per tempi negativi non
fanno dierenza, e pertanto si perde liniettivit. Invece, data una funzione
(o successione) h in L1 (rispettivamente 1 ) tale che la trasformata di Fourier
(o DFT) b
h non si annulla mai, il ltro T (f ) = h f invertibile, come
conseguenza della propriet di convoluzione della trasformata di Fourier (per
maggiori dettagli si veda la Sottosezione 17.1.2 pi sotto).
Definizione 17.1.2. (Risposta di un filtro allimpulso.) Si chiama
risposta allimpulso del ltro T la funzione h = T 0 , dove 0 il segnale
puramente impulsivo (delta di Dirac, nel senso dellEsempio 11.5.4 (iii)) al
tempo t = 0. Si osservi che, se il ltro agisce su segnali discreti, la delta di
Dirac il segnale che vale 1 al tempo 0 e 0 altrove; se agisce su segnali di
variabile continua, la delta di Dirac e la convoluzione vanno intese nel senso
delle distribuzioni (Sezione 11.13).
Definizione 17.1.3. Si dice che un ltro T invariante per traslazione
temporale se loperatore T commuta con le traslazioni: per ogni segnale f in
ingresso e per ogni k, n,
T (k x)(n) = k (T x)n .
In altre parole, detta g la risposta allinput f , allora g(n k) la risposta
allinput f (n k) ritardato (o anticipato, se k < 0) di un numero k di campioni. Analoga denizione si pone per ltri su segnali di variabile continua
(che vengono applicati alla delta di Dirac nel senso delle distribuzioni, in
analogia a quanto visto nella Sezione 11.8).
Questo signica che il ltro modella unapparecchiatura di elaborazione il cui operato non cambia col tempo, analogamente al funzionale del
campionamento della Sezione 11.1.
Proposizione 17.1.4. Ogni operatore lineare continuo invariante per traslazione un convolutore (e precisamente il convolutore per la propria funzione
di risposta allimpulso).

17.1. DECONVOLUZIONE NON PARTIZIONATA

1079

Dimostrazione. Per semplicit presentiamo la dimostrazione per segnali discreti a supporto nito. Il caso di supporto innito, poco interessante per
le applicazioni, segue immediatamente dalla continuit delloperatore e viene
lasciato per esercizio; il caso di segnali di variabile continua analogo, ma lo
scambio delloperatore con loperazione di convoluzione va inteso nel senso
degli operatori lineari sulle distribuzioni (Sezione 11.8).
Sia f il segnale discreto in ingresso, e rammentiamo che, come nella Proposizione 11.14.3 nel caso di variabile continua, si ha 0 f = f , perch
0 f (n)f 0 (n) =

k=

f (k)0 (n k)

e 0 (n k) = 1 se n = k e 0 altrimenti. Inoltre, sia h la risposta impulsiva


delloperatore, e rammentiamo che, per linvarianza per traslazione, si ha
T ((n k)) = T (( k))(n) = T k 0 (n) = k T 0 (n) = k h(n) = h(n k) .
Ora segue dalla linearit che
(T f )(n) = T [
=

k=

k=

f (k)(n k)]

f (k)T [(n k)] =

k=

f (k)h(n k) = f h(n) = h f (n) .

Includiamo qui alcune altre denizioni utili.

Definizione 17.1.5. Si dice che un ltro T stabile se per qualche costante


C > 0 e per tutti i segnali f si ha
kT f k 6 Ckf k ,
ossia se loperatore T continuo in L (o ), nel senso della Denizione
4.6.2. La pi piccola di tali costanti C , in base alla suddetta Denizione,
la norma kT k delloperatore, considerato come operatore su L o .
Proposizione 17.1.6. Il filtro T stabile se e solo se la sua risposta allimpulso, h = T 0 , appartiene a L1 (R) (rispettivamente, 1 (Z), e kT k =
khk1 .

1080

CAPITOLO 17. DECONVOLUZIONE E DFT A FINESTRE

Dimostrazione. La stabilit di T equivale alla disuguaglianza kT f k 6


Ckf k . Daltra parte, come prima, T f = T (0 f ) = h f . Quindi T
stabile se e solo se kh f k 6 Ckf k . Osserviamo che
kh f k = sup |h f (t)| = sup |ht h, f i| 6 kt hk1 kf k = khk1 kf k
t

in base alle disuguaglianze (11.4) e (??), rispettivamente. Quindi kT f k 6


khk1 kf k . Inoltre, in base alle disuguaglianze (11.5) e (??) rispettivamente,
la norma khk1 la pi piccola costante che verica questa disuguaglianza per
ogni f in Lp (R) e in p , rispettivamente.

Definizione 17.1.7. Si dice che un ltro T causale se la risposta del ltro


per ogni tempo t0 dipende soltanto dallingresso per t 6 t0 , ossia se la sua
risposta allimpulso zero per t < 0.

17.1.2

Deconvoluzione non partizionata: soppressione a


posteriori di equalizzazioni ambientali

Un problema frequente nel trattamento dei segnali acustici linversione di


un operatore di convoluzione precedentemente applicato, o deconvoluzione.
Un esempio tipico la soppressione dellequalizzazione causata dalla sala
dascolto su un segnale musicale.
Riassumiamo la natura di questa equalizzazione in termini di risposta allimpulso dellauditorium. Per essere precisi, ci che qui chiamiamo riverbero
in realt solo la distorsione di equalizzazione indotta dallambiente sullo
spettro di Fourier del segnale, che forse dovremmo pi appropriatamente
chiamare rimbombo: il vero riverbero pi complesso, perch ha un fronte
donda dingresso che si traduce in un ritardo iniziale, oltre che uno smorzamento che si pu considerare nisca con un fronte donda duscita, ovvero
un ritardo nale. Notiamo un altro aspetto che introduce una dicolt: il
riverbero cambia da punto a punto nella sala dascolto, come daltra parte
anche il rimbombo. Come conseguenza, leliminazione dei riverberi (e dei
rimbombi) un problema molto pi complesso di quella dellequalizzazione,
e non viene arontata qui. Ci limitiamo ad arontare il problema della eliminazione di unequalizzazione ssa imposta al segnale acustico, unica per
tutta la stanza dascolto: stiamo modellando il caso semplicato in cui il
suono sia stato registrato e dopo equalizzato.

17.1. DECONVOLUZIONE NON PARTIZIONATA

1081

Chiamiamo f il segnale musicale suonato dai musicisti. In fase di ascolto udiamo un segnale g = h f distorto dallequalizzazione indotta. La
funzione h (la risposta allimpulso dellauditorium) pu essere misurata facilmente: basta misurare la risposta allimpulso dellambiente. Vogliamo
ricostruire il segnale musicale originale eliminando lequalizzazione. Questo
si chiama deconvolvere il segnale distorto dallequalizzazione indotta, ovvero de-equalizzare. Dora in avanti, il segnale originale h inteso come una
successione di dati {hn } equispaziati nel tempo ad un appropriato passo di
campionamento, e cos pure il segnale distorto {gn }. Questi segnali hanno
lunghezza nita nel tempo, quindi lindice n varia in un insieme nito, ma
allo scopo di calcolarne la DFT li consideriamo implicitamente estesi a successioni jnnite ponendoli uguale a 0 al di fuori del loro dominio temporale
originale. Questo fatto ora particolarmente importante, perch ci accingiamo a considerare la DFT dei segnali, e quindi dovremmo avere segnali
periodici. Invece i segnali in questo ambito non sono periodici, e pertanto
devono essere approssimati in modo periodico, il che per modica i dati veri. Il modo di procedere di considerare segnali di N campioni nel tempo, e
periodicizzarli allesterno del loro supporto temporale: in tal modo i dati originali non vengono modicati. Pero dovremo convolvere segnali di lunghezza
temporale diversa, e per poter applicare la DFT alla convoluzione abbiamo
bisogno di un periodo unico per tutti. Questo si ottiene estendendo con zeri
il segnale pi corto in maniera che entrambi siano della stessa lunghezza. Per
sicurezza, onde evitare eetti di aliasing legati alla periodicizzazione, spesso
prendiamo i segnali originali di N campioni e li estendiamo comunque con
zeri ad un range pi ampio, ad esempio 2N.
Un modo rapido di eettuare la deconvoluzione il seguente: si calcola
una volta per tutte la DFT della risposta impulsiva dellambiente, b
h, e la
si memorizza; poi si esegue la DFT del segnale equalizzato, che, grazie alla
propriet di convoluzione per la DFT, Teorema 14.4.6, la successione prodotto b
g (k) = b
h(k)fb(k); inne, per ciascun k si divide il k-simo valore per il
corrispondente b
h(k) per ottenere fb(k) come risultato, ed inne si eettua la
IDFT.
Il problema da risolvere il fatto che la DFT della risposta impulsiva
pu avere qualche valore nullo (di solito le sue parti reali ed immaginaria,
separatamente, ne hanno parecchi, perch oscillano molto; pi raro che
questi zeri separati capitino simultaneamente alla stessa frequenza, ovvero
siano zeri dellintera DFT, per accade). Possiamo escludere che ci siano zeri

1082

CAPITOLO 17. DECONVOLUZIONE E DFT A FINESTRE

non isolati per b


h, o pi precisamente intervalli di frequenze I dove b
h sia identicamente nullo: se cos fosse, i segnali musicali con spettro di Fourier con
supporto in I verrebbero annullati, in altre parole lauditorium li inghiottirebbe, il che ovviamente non succede. Me se succedesse, allora, senza perdite
ulteriori per il segnale (gi in talo modo tagliato dallauditorium) potremmo
troncare fb a zero su tutto I ed evitare il problema della divisione per zero in
I alla stregua di quanto stiamo per illustrare in maggior dettaglio.
Supponiamo quindi che i punti di zero di b
h siano una successione, nita
od innita.
Alle frequenze k (ossia indici per la DFT) per le quali b
h(k) = 0, non
possiamo dividere per b
h(k): vero che a queste frequenze, di nuovo per
la propriet di convoluzione, si annulla anche il numeratore b
g (k), ma non
sappiamo calcolare il quoziente quando numeratore e denominatore si annullano entrambi. Per poter procedere si opera un troncamento (cut-off ):
si sceglie un intervallo intorno al tempo k ed in questo intervallo si pone
articialmente uguale a zero la trasformata di Fourier discreta del segnale
equalizzato, ossia il numeratore della frazione. Ora il numeratore zero in
un intorno della frequenza k, mentre il denominatore si annulla solo in k (di
solito con andamento lineare). Pertanto il numeratore si annulla pi velocemente del denominatore, e quindi sensato porre articialmente uguale
a zero il quoziente al punto k: ma naturalmente si in tal modo introdotto un troncamento locale della trasformata di Fourier segnale equalizzato,
e quindi si ottiene una distorsione del segnale originale. Leetto tanto
meno avvertibile quanto pi corto lintervallo intorno alla frequenza k dove
operiamo il troncamento. Vogliamo stimare quanto stretto si debba prendere
lintervallo di troncamento per mantenere al di sotto di una soglia pressata
lerrore globale nella ricostruzione del segnale originale dopo leliminazione
dellequalizzazione. Preferiamo svolgere questo calcolo per la trasformata di
Fourier del segnale, invece che per la DFT, perch nel caso discretizzato lintervallo non pu diventare arbitrariamente piccolo (deve contenere almeno
tre campioni consecutivi con k al centro).
Supponiamo che il segnale originale f sia la risposta allimpulso h siano
funzioni in L1 (R).
Di solito si assume anche che b
h sia a supporto compatto, come anche f e
b
f , ma questa ipotesi, per quanto sicamente ovvia ed assai comoda, non
strettamente necessaria. Quanto a condizioni pi o meno restrittive, di
solito, trattando con segnali acustici, supponiamo che essi siano a valori

17.1. DECONVOLUZIONE NON PARTIZIONATA

1083

reali, nel qual caso le trasformate di Fourier hanno parte reale pari e parte
immaginaria dispari per il Corollario 8.2.6 (quindi se ne considerano i graci
solo per frequenze positive), ma questa ipotesi non necessaria.
Vogliamo stimare lerrore che si commette quando si impone il cut-o.
Supponiamo per semplicit di notazione che b
h abbia un numero nito di zeri
1 , . . . , n , che dal punto di vista sico sono le frequenze di risonanza dellauditorium. Questa ipotesi necessariamente vera se gli zeri non si addensano
eb
h a supporto compatto, ma in ogni caso, quando gli zeri sono inniti,
la trattazione che segue si adatta parola per parola se si prendono unioni
innite anzich nite). Centrato ad ogni zero j prendiamo un intervallo di
cut-o Ij , la cui lunghezza m(Ij ) dobbiamo scegliere sucientemente piccola per non introdurre errori eccessivi quando applichiamo la trasformata di
Foiurier inversa per ricostruire il segnale originale. Osserviamo
eetti che
 in
Pn
b
la trasformata di Fourier troncata dopo il cut-o F = 1 j=1 j fb,
dove j denota la funzione caratteristica dellintervallo Ij . Pertanto, quando
il segnale
R originale f viene rimpiazzato con la trasformata di Fourier inversa
F (t) = Fb() e2i d, lerrore commesso esattamente
Z
(f F )() =
fb() e2i d ,
j Ij

che si maggiora con

kf F k 6

X
j

m(Ij )kfbk 6

X
j

m(Ij )kf k1 .

In particolare, F converge uniformemente a f quando la somme delle misure


degli intervalli tende a zero. Pertanto, se si vuol mantenere lerrore di troncamento inferiore ad una soglia > 0 pressata, basta prendere gli intervalli
Ij cos piccoli che
X
m(Ij ) 6 /kf k1 .
(17.1)
j

Naturalmente non sappiamo a priori quale sia la norma L1 del segnale originale f , ma sappiamo che essa dierisce di poco da quella del segnale troncato
F se gli intervalli Ij sono piccoli (grazie alla convergenza uniforme di F a
f ). Quindi prendiamo intervalli ragionevolmente piccoli, applichiamo la trasformata di Fourier inversa per calcolare F , ne stimiamo la norma L1 con
unintegrazione numerica ed usiamo questo risultato in (17.1) per restringere
ulteriormente gli intervalli se necessario.

1084

CAPITOLO 17. DECONVOLUZIONE E DFT A FINESTRE

In questo modo abbiamo trovato un algoritmo numerico che tiene sotto


controllo lerrore di troncamento. Per si crea un altro problema, legato alla
sensibilit del nostro apparato uditivo. Il segnale ricostruito F si ottiene
applicando la trasformata di Fourier inversa ad una funzione Fb che stata
troncata su certi intervalli. La trasformata di Fourier di una funzione troncata presenta un fenomeno di ringing, in analogia a quanto visto per le serie
di Fourier nello studio del fenomeno di Gibbs nella Sezione 5.19, ed in eetti
per lo stesso motivo: le oscillazioni della trasformata di Fourier di una funzione caratteristica, ossia la funzione sinc (Esercizio 10.1.5). Sappiamo, dalla
trattazione del fenomeno di Gibbs di cui sopra, che lampiezza del ringing
proporzionale al salto della funzione troncata, nel nostro caso fb. Quindi la
soppressione dellequalizzazione produce eetti di ringing in prossimit delle
frequenze di risonanza dellauditorium, forse udibili almeno per quei segnali
per i quali lampiezza della trasformata di Fourier (ovvero il contenuto in
frequenza) elevata in prossimit di tali frequenze. Per i segnali acustici
abituali (non monocromatici) leetto non normalmente molto fastidioso;
lo sarebbe molto di pi per immagini, nelle quali le modulazioni del ringing
danno luogo a segmenti alternati chiari e scuri, a cui il nostro sistema visivo
molto sensibile. In ogni caso, anche per segnali audio, la variazione dellampiezza massima data dal fenomeno di Gibbs dellordine dellotto per cento
(Nota 5.19.6, ed una distorsione dellotto per cento, anche se solo in certi
istanti discreti e per certe frequenze pressate, non accettabile. Quindi si
evita il problema utilizzando un modo diverso di dividere per b
h troncando
via gli intervalli centrati agli zeri di questo denominatore: si eettua una inversione regolarizzata, eventualmente seguita da una inversione regolarizzata
di Wiener. Questi due ltri sono deniti qui di seguito.
Nota 17.1.8. (Filtro di inversione regolarizzata.) Sia h la risposta allimpulso dellambiente, f il segnale da ricostruire e g = f h il segnale
registrato, aetto da rimbombo ambientale. La ricostruzione esatta dovrebbe avvenire mediante divisione di b
g per b
h seguita da trasformata inversa di
Fourier, ma questo metodo non attuabile a causa degli zeri di b
h. Daltra
parte, osserviamo che la divisione per un numero complesso z equivale alla
moltiplicazione per z/|z|2 . Allora, ssata una soglia di tolleranza > 0, approssimiamo la divisione per b
h() con la moltiplicazione per il moltiplicatore
di inversione regolarizzata
b
h()
.
|b
h()|2 +

17.1. DECONVOLUZIONE NON PARTIZIONATA

1085

Quando 0+ questo moltiplicatore tende alla divisione per b


h alle frequenze
b
dove h() 6= 0, ma in ogni caso, ssato > 0, esso non introduce salti di
alcun tipo (il denominatore non si annulla ed continuo), ed quindi, una
volta antitrasformato il risultato secondo Fourier, non si ha ringing.
Si osservi un altro aspetto numericamente essenziale delloperazione di
inversione regolarizzata. Il segnale registrato g, ed anche la risposta allimpulso h, sono aetti da rumore. Quindi lo sono anche le loro trasformate
di Fourier. Il rumore pu dar luogo a zeri inesistenti nel segnale vero, ed
in ogni caso d luogo a disturbi indesiderati allascolto (tipicamente fruscio)
o, nel caso di immagini, alla vista (variazioni granulari dellintensit e del
colore). Una opportuna ricostruzione numerica deve pertanto sopprimerlo.
Purtroppo, invece, la divisione per b
h ingigantisce il segnale registrato laddove
b
h piccolo, e quindi esalta il rumore in queste zone. Se si sceglie la soglia
pi alta del livello massimo di rumore, il denominatore del moltiplicatore di
inversione regolarizzata non si avvicina pi a zero in prossimit degli zeri di
b
h neppure in seguito alladdizione del rumore, ed il problema dellesaltazione
del rumore resta numericamente sotto controllo.

Nota 17.1.9. (Filtro di inversione regolarizzata di Wiener.) Nelloperazione di inversione tramite divisione per b
h, si dovrebbe osservare che
lesaltazione del rumore e la singolarit che si presentano in prossimit delle
frequenze dove b
h() = 0 sono meno sensibili se anche fb piccolo: ad
esempio, se fb identicamente nullo in un intervallo intorno a , la divisione
non ha alcun eetto e non esalta il rumore. Naturalmente, proprio a causa del rumore, i segnali non sono mai identicamente nulli in un intervallo
tranne che al di fuori del range dei rivelatori, ma in ogni caso chiaro che
si dovrebbe pesare il moltiplicatore di inversione regolarizzata in modo c he
sia pi piccolo laddove fb piccolo. La scelta consueta il moltiplicatore di
inversione regolarizzata di Wiener
b
h()|fb()|2
.
|b
h()|2|fb()|2 +

Sfortunatamente, linversione regolarizzata di Wiener non pu essere applicata direttamente al problema delleliminazione dellequalizzazione (e del rumore), perch si tratta di un problema di deconvoluzione dove la funzione
f lincognita, e quindi fb non noto a priori. Per applicare il metodo di
Wiener, prima si applica il procedimento di inversione regolarizzata della Nota 17.1.8 per ottenere un valore approssimato di fb, che dipende anche dalla

1086

CAPITOLO 17. DECONVOLUZIONE E DFT A FINESTRE

tolleranza scelta, e poi si usa questo valore approssimato nel moltiplicatore


di Wiener. Questo procedimento combinato riduce ulteriormente, a parit
di scelta della soglia, sia il rumore sia linsorgere di valori elevati legati alle
singolarit.

Un problema ancora pi grave del ringing e dellesaltazione del rumore


la notevole complessit di calcolo che si deve arontare per deconvolvere segnali di lunghezza tipica (delordine almeno di un minuto), come spiegheremo
allinizio della Sezione 17.3.

17.2

Trasformata di Fourier a finestre e convoluzione a finestre; equalizzazione in tempo


reale

Normalmente, leliminazione a posteriori dellequalizzazione non lobiettivo pi interessante: vorremmo invece deequalizzare in tempo reale, mentre
ascoltiamo il segnale mucicale e non solo alla ne. Questo perch in tal modo potrebbe essere possibile eettuare correzioni interattive in tempo reale,
ma soprattutto perch non c modo di sapere a priori quanto sar lungo il
segnale: per segnali di lunghezza tipica il metodo globale ha una complessit
di calcolo eccessiva (si veda linizio della Sezione 17.3).
A questo scopo ora descriviamo un algoritmo che ci permette di partizionare il segnale in nestre temporali di un numero ssato L di campioni e di
eettuare la trasformata di Fourier per ogni nestra temporale, ricostruendo
alla ne da questi ritagli il segnale originale.
Mettiamo in guardia il lettore sul meccanismo di suddivisione a nestre.
Anche se stiamo trattando con dati campionati, i valori che dobbiamo elaborare per ogni nestra sono i valori campionati del segnale moltiplicato per una
appropriata funzione che rappresenta leetto del troncamento sulla nestra
data. Ad esempio, il moltiplicatore naturale la funzione caratteristica della nestra (nel dominio del tempo). Ma questo moltiplicatore introduce un
salto nel risultato che si intende campionare, e quindi, una volta trasformato
secondo Fourier e poi ricostruito, pu dar luogo al ringing del fenomeno di
Gibbs (Sezione 5.19). Si evita il problema utilizzando nestre dierenti dai
troncamenti netti, ovvero date da moltiplicatori g dierenti dalle funzioni
caratteristiche, che simulino un gradino in maniera liscia, senza salti. In effetti, questo equivale ad eseguire una partizione dellunit unidimensionale,

17.2. CONVOLUZIONE A FINESTRE; EQUALIZZAZIONE IN TEMPO REALE1087


nel senso del Corollario 1.10.16. A questo scopo potremmo usare lapprossimazione C del gradino, introdotta nellEsempio 1.6.10, ma lutilizzo dei
moltiplicatori esponenziali porta ad una complessit numerica di solito non
necessaria. suciente considerare approssimazioni di ordine C 1 : ad esempio, per approssimare una nestra netta, ossia la funzione caratteristica di
un intervallo, diciamo [0, 1], si usa spesso la finestra di Hanning, data dal
moltiplicatore g(x) = 12 (1 cos(2x)) per 0 6 x 6 1, e 0 altrove.
Il segnale acquisito gi in forma digitalizzata, quindi in termini dei suoi
campioni, e pertanto, ovviamente, ne calcoliamo la DFT invece che la trasformata di Fourier continua (ed implementiamo il calcolo tramite un algoritmo
di FFT nresentato del Capitolo 15, ma qui non siamo interessati ai dettagli
dellimplementazione della DFT come FFT). Ripetiamo per quanto abbiamo gi osservato allinizio della Sottosezione 17.1.2: la DFT di un segmento
di L dati campionati periodica, mentre il segnale e la sua trasformata di
Fourier, nel senso continuo, non lo sono. Per correggere questo problema
dobbiamo scartare un sottosegmento di M < L campioni, e quindi limitare
lattenzione a L M dei dati iniziali nella nestra. Siccome per tutti i dati
devono concorrere allelaborazione, questo vuol dire che la nestra successiva deve recuperare gli M campioni scartati, ossia deve iniziare non dopo
L campioni bens dopo L M campioni. Pertanto due nestre consecutive
si sovrappongono su M dati. Questo crea una ridondanza nellelaborazione
a vantaggio delleliminazione degli artefatti di periodicizzazione. Pi M
piccolo, minore la sovrapposizione, e quindi la ridondanza; pi M grande,
migliore leliminazione degli artefatti. Il miglior compromesso si trova a
met strada (ma non lo dimostriamo): M = L/2.
Analizziamo in dettaglio lalgoritmo nel caso di nostro interesse, ossia
quando dobbiamo convolvere un segnale f di lunghezza sconosciuta e potenzialmente illimitata (il suono originale) con un segnale h (la risposta allimpulso) di lunghezza N ssata ma abbastanza elevata, tipicamente almeno
216 campioni per una risposta allimpulso lunga vari secondi campionata alla
frequanza di campionamento di 48 Kilohertz. Per convolvere i due segnali
dobbiamo usare lo stesso numero di dati per ciascuno (la stessa finestra).
Lidea di base di segmentare il segnale f in nestre di N dati. Il calcolo
diretto della convoluzione richiede quindi N 2 = 232 operazioni, un numero
gigantesco di calcoli. Riduciamo per la complessit di calcolo impiegando
la FFT invece del calcolo diretto: si sceglie M > N, e come si detto
preferibile prendere M = 2N, si partiziona f in segmenti consecutivi di M
campioni, si aggiungono zeri a h anch passi da lunghezza N a lunghezza

1088

CAPITOLO 17. DECONVOLUZIONE E DFT A FINESTRE

M, ed a questo punto si calcolano le FFT a M punti di h e di un segmento


di f e le si moltiplicano fra loro. Il risultato un segmento di M dati della
DFT di f h, grazie alla propriet di convoluzione per la DFT, Teorema
14.4.6. Applichiamo a questo segmento di dati la FFT inversa su M punti
per ricavare una versione M-periodicizzata di f h, ma ne memorizziamo solo
gli ultimi M N valori, aggiungendoli a quanto memorizzato no a questo
momento nellelaborazione delle nestre precedenti. Dopo di che, cambiamo
nestra, passando alla successiva: ma per questo trasliamo gli indici solo di
M N punti, perch dobbiamo riutilizzare gli ultimi N come spiegato prima.
Questo algoritmo si chiama Sovrapposizione e Memorizzazione. Richiede il
calcolo di FFT su M punti, il che, come si detto, di solito signica 2N,
ossia almeno 217 , valori.
Un algoritmo pi eciente, introdotto in [31] e poi migliorato in [29]
ai ni dellimplementazione in tempo reale, quello di Sovrapposizione e
Memorizzazione Segmentata che ora presentiamo.
Il suono f , di lunghezza arbitraria, viene segmentato in nestre di lunghezza
L. Segmentiamo invece la risposta allimpulso h, che lunga N campioni, in
nestre di lunghezza K = L/2 e poi le allunghiamo con zeri per portarle a
lunghezza L, per le ragioni appena spiegate (scarto di L/2 risultati per ogni
nestra al ne della eliminazione della periodicit). Sia P = 2N/L il numero
di nestre in cui si partizionata h. Vogliamo calcolare la convoluzione
g = f h. Sia n la funzione caratteristica della n-sima nestra temporale,
dal campione n(L/2) al campione L + n(L/2) (n = 0, 1, . . . ), ossia

1
per nL
< t < L + nL
2
2
n (t) =
0
altrove
Come gi osservato, la traslazione da una nestra alla successiva di K =
L/2.
Il segmento del segnale f relativo a questa nestra fn = f n . Invece il

segmento prelevato da h per la stessa nestra hn = hn , dove K = L/2 e




1
per nK < t < (n + 1)K, ossia nL
< t < (n+1)L
2
2
n (t) =
0
altrove
Allora, considerando f composto da un numero indeterminato di nestre, ma
h da P nestre, abbiamo

X
f=
fn
n=0

17.2. CONVOLUZIONE A FINESTRE; EQUALIZZAZIONE IN TEMPO REALE1089


e

P
X

h=

hj .

j=0

Grazie alla linearit della DFT, le trasformate sono


fb =
b
h=

X
n=0

P
X
j=0

fbn
b
hj

dove fb e b
h sono rispettivamente le DFT di f e h. Denotiamo con gb la DFT
di g = f h. Ora abbiamo
gb = fb b
h=

X
P
X
(b
hj fbn ) .
n=0 j=0

Consideriamo il contributo b
g0 : esso dato dalla trasformata di Fourier fb0
del primo segmento temporale del segnale originale f moltiplicata per la
trasformata di Fourier di tutta la risposta allimpulso:
g0 =
b

P
X
j=0

fb0b
hj = fb0

P
X
j=0

b
hj .

(17.2)

Analogamente, i contributi dei segmenti successivi fbm , m = 0, 1, . . . , sono


la trasformata di Fourier del segmento temporale m-simo di f (quello che
comincia al tempo mK = mL/2) moltiplicata per tutta b
h:
gm =
b

P
X
j=0

fbmb
hj .

Ora applichiamo a ciascuno di essi la IDFT (trasformata DFT inversa), che


denotiamo con . Per m = 0, 1, . . . otteniamo i seguenti contributi parziali
al calcolo della convoluzione g:
gm =

P
X
j=0

hj ) .
(fbmb

1090

CAPITOLO 17. DECONVOLUZIONE E DFT A FINESTRE

Daltra parte, per linearit si ha


g=
b

m=0

gm .
b

Quindi, applicando di nuovo la IDFT e la propriet di convoluzione per la


DFT, Teorema 14.4.6, otteniamo
g=

(b
gm ) =

m=0

m=0

gm =

X
P
X

m=0 j=0

(fbmb
hj ) =

m=0

fm h .

(17.3)

Pertanto g viene ricostruito sommando i contributi parziali ottenuti dalla


trasformata DFT inversa dei segmenti b
gm , ossia i gm , dei quali per, come
gi fatto nel precedente algoritmo di Sovrapposizione e Memorizzazione non
segmentata, al ne di eliminare gli artefatti di periodicizzazione della IDFT,
si prendono solo gli ultimi LK = L/2 valori prima di aggiungerli ai segmenti
di g precedentemente memorizzati.
Il contributo parziale gm al calcolo della convoluzione g quindi nientaltro
che fm h, ossia la convoluzione con la risposta allimpulso h della sola
m-sima finestra di f . Allora, quando in (17.3) si ricostruisce g a partire da
questi contributi gm , i dati del contributo m-simo devono essere sommati agli
altri sullasse dei tempi a partire dallinizio di tale nestra temporale, ossia
dallistante mK, come nella Figura 17.1, nella quale, per rendere il disegno
pi leggibile, abbiamo indicato le DFT b
hi fbj con lettere maiuscole Hi Fj , ed
abbiamo scritto esplicitamente, con lettere e non con simboli, loperatore di
trasformata inversa IDFT.
Pertanto le varie fasi dellalgoritmo nel suo complesso si schematizzano
come in Figura 17.2.
Il vantaggio di questo algoritmo di Sovrapposizione e Memorizzazione
Segmentata rispetto allanalogo in cui la risposta in frequenza h, di lunghezza N, non viene segmentata, che il metodo funziona con ritardo K = L/2
che possiamo scegliere piccolo, ovvero in tempo reale, mentre la lunghezza
N della risposta allimpulso determinata dallauditorium, non si pu accorciare, lunga diversi secondi e quindi, come gi osservato, ad un tasso di
campionamento standard richiede molte decine di migliaia di campioni.
Ad esempio, se si considera una risposta impulsiva di 9 secondi, campionata
a 44100Hz, partizionata a segmenti di K = 4096 campioni, loutput del-

17.2. CONVOLUZIONE A FINESTRE; EQUALIZZAZIONE IN TEMPO REALE1091


f0*h0

f0*h1

secondo segmento di dati

primo segmento di dati di f

f0*h2

terzo segmento di dati


2K

f1*h0

+g

primo segmento di dati

...
3K

f1*h1

f1*h2

secondo segmento di dati

terzo segmento di dati

...

2K

3K

f2*h1

f2*h0

+g

primo segmento di dati

2K

4K

f2*h2

...

terzo segmento di dati

secondo segmento di dati


3K

4K

Figura 17.1: Convoluzione a finestre: sfalsamento temporale dei contributi delle singole
finestre

lalgoritmo segmentato fruibile dopo un tempo di latenza pari a 92 msec,


invece dei 9 secondi dellalgoritmo non segmentato.
Un altro vantaggio, forse ancora pi importante, il notevole risparmio di
memoria per il calcolo della F F T : lordine della F F T ora K (quanti sono i dati per ogni nestra) invece che N (quanti sono i dati della risposta
allimpulso).
Nel caso dellalgoritmo di Sovrapposizione e Memorizzazione non segmentato, a prima vista sembrerebbe che i contributi gk da sommare siano tutti
lunghi N (ossia quanto la risposta allimpulso), e quindi i diversi segmenti non
si sovrappongono: per ogni intervallo [jN, (j+1)N] dovrebbe esserci un unico
contributo. In realt, per, leliminazione degli artefatti di periodicizzazione
obbliga a scartare un segmento dei dati di ogni contributo, tipicamemnte N/2
di essi, e quindi a sovrapporre ogni due contributi consecutivi di lunghezza
N per met della loro lunghezza.
Una applicazione tipica dellalgoritmo di Sovrapposizione e Memorizzazione Segmentata lequalizzazione in tempo reale di un segnale acustico,
che consiste nellapplicazione di una funzione ltro preassegnata allo spettro
di Fourier del segnale, nestra dopo nestra. Nel dominio del tempo questo
equivale alleseguire la convoluzione con lantitrasformata di Fourier del ltro. Luso dellalgoritmo in tempo reale permette di modicare il ltro dopo
che una nestra stata processata completamente, e quindi di modicare

4K

1092

CAPITOLO 17. DECONVOLUZIONE E DFT A FINESTRE

...

streaming di dati in ingresso x(n)


(L campioni)

(L campioni)

f0

...

f1

Fi-1

FFT

FFT

1 segmento dello spettro di f

h0

i-esimo segmento dello spettro di f

h1

h2

h0

IFFT

IFFT

IFFT

IFFT

selezione degli ultimi


L-K
campioni

selezione degli ultimi


L-K
campioni

selezione degli ultimi


L-K
campioni

selezione degli ultimi


L-K
campioni

1 segmento, f0 * h0

2 segmento, f0 * h1

...

3 segmento, f0 * h2

1 segmento, f1 * h0

+
+
+

...

3 segmento, f1 * h2

2 segmento, f1 * h1

.
.
.
+

1 segmento, fi * h0

...

Figura 17.2: Convoluzione a finestre: algoritmo di Sovrapposizione e Memorizzazione


Segmentata

lequalizzazione del segnale, in tempo reale, solo da quella nestra temporale


in poi.

17.3

Deconvoluzione a finestre: de-equalizzazione


in tempo reale

Allinizio della Sezione 17.1.2 abbiamo studiato come deconvolvere a posteriori gli eetti di equalizzazione indotti dallambiente su un segnale, ossia
globalmente al termine dellascolto. Ricapitoliamo il metodo seguito, che si
basa sui quattro passi seguenti:

17.3. DE-EQUALIZZAZIONE IN TEMPO REALE

1093

si misura una volta per tutte la risposta allimpulso dellambiente, h, e


se ne calcola numericamente la trasformata di Fourier (o pi precisamente la sua DFT, che si calcola in maniera rapida tramite lalgoritmo
di FFT): questo passo si esegue una volta sola per ciascun ambiente,
preliminarmente allanalisi del segnale;
si calcola numericamente la trasformata di Fourier dellintero segnale
equalizzato g ( per questo che bisogna attendere di aver ascoltato tutto
il segnale);
si divide b
g per b
h, per ottenere la trasformata di Fourier (o meglio,
b
la DFT f del segnale originale (bisogna prima troncare b
g a zero in
b
prossimit degli zeri di h, ed in queste zone evitare di eettuare la
divisione);

si recupera il segnale originale f calcolando la FFT inversa di fb.

Per poter procedere alla divisione al terzo punto bisogna che le DFT di g
e di h siano dello stesso ordine. Dei due segnali normalmente pi lungo il
segnale musicale originale (la risposta allimpulso dellambiente dura qualche
secondo). Bisogna allora allungare b
h con zeri anch diventi lungo quanto
il segnale originale. Se la lunghezza del segnale originale di J campioni,
la complessit di calcolo di questo metodo basato sulla FFT seguita dalla
FFT inversa dellordine di 2J log2 J (come mostrato nella Sezione 15.2).
Tipicamente, il segnale pu essere lungo da vari secondi a pi di unora.
Tranne che per i segnali pi brevi, J quindi un numero gigantesco, e la
deconvoluzione globale non realizzabile a causa della eccessiva complessit
di calcolo.
Per evitare questo problema abbiamo introdotto, nella Sezione 17.2, algoritmi di convoluzione segmentata: lalgoritmo di Sovrapposizione e Memorizzazione, che calcola DFT dellordine N dato dalla lunghezza della risposta
allimpulso, ed il pi eciente algoritmo di Sovrapposizione e Memorizzazione Segmentata, che calcola DFT di una lunghezza K pari ad una frazione
pressata di tale lunghezza.
Lidea dellalgoritmo di Sovrapposizione e Memorizzazione ancora valida quando si vuol ricorrere alla divisione di b
g per la DFT della risposta
allimpulso, b
h, perch b
h non viene mai segmentato, e quindi ha senso dividere per i suoi valori. In tal caso si procedere a dividere per b
h i segmenti

1094

CAPITOLO 17. DECONVOLUZIONE E DFT A FINESTRE

consecutivi di lunghezza N di gb. In tal modo la deconvoluzione richiede il


tempo di calcolo della FFT a N valori, dellordine di N log2 N.
Purtroppo, per, leciente algoritmo di Sovrapposizione e Memorizzazione Segmentata non permette di procedere tramite divisione per b
h . Infatti
esso esegue somme di contributi sovrapposti nel tempo e ricostruisce il segnale a partire da una somma doppia di trasformate di Fourier a nestre sfalsate
come nellidentit (17.3). Nelleseguire la convoluzione, ai singoli contributi
da sommare concorrono segmenti diversi di b
h, e quindi si deve tenere traccia
dei denominatori dierenti da usare per ciascuno di essi. Questo possibile,
seppure faticoso; per, se si deve eseguire una deconvoluzione, i dati di cui
disponiamo sono gi convoluti in questo modo intrecciato, e non sappiamo
pi tenere traccia dei denominatori. Il modo di procedere invece di eseguire
la deconvoluzione convolvendo per loperatore di convoluzione inverso.
Come sempre dalla propriet di convoluzione per la DFT, Teorema 14.4.6,
sappiamo che loperatore di convoluzione T : f 7 f h ha per inverso Q : f 7
f k, dove k la funzione denita da b
k=b
h1 (ben denita grazie al Teorema
h non si annulla, o anche se si annulla, in
di inversione di Fourier 8.4.2 se b
base allanaloga propriet per le distribuzioni (Proposizione 11.11.4) purch
b
h1 sia una distribuzione (basta che sia una funzione localmente integrabile
a crescita non pi che polinomiale: se b
h ha solo zeri del primo ordine nel suo
supporto il suo reciproco non localmente integrabile ma una distribuzione,
in base allEsempio 11.5.5).
Infatti h[
k =b
hb
k = 1, e quindi h k = 0 in base allEsercizio 11.12.2 (i) ed
alla succitata propriet di inversione di Fourier per le distribuzioni. Pertanto,
per lassociativit della convoluzione (Esercizio 6.1.13), per ogni f si ha
QT f = (f h) k = f (h k) = f 0 = f ,
e quindi Q = T 1 . Ripetiamo che, a causa dellesistenza di possibili zeri di b
h,
lultima identit ha signicato, nelle ipotesi di comodo di cui sopra, solo nel
senso delle distribuzioni. Per evitare limpiego di tecniche sosticate basate
sulle distribuzioni, la cosa pi semplice di scegliere una soglia inferiore
alla tolleranza dellapprossimazione numerica che si intende accettare e di
rimpiazzare b
h1 in piccoli intorni Ij degli zerii j (ossia dei punti dove b
h(j =
0) con la costante 1/: in tal modo, in questi intervalli critici Ij la funzione
b
h1 dellordine di 1/ anzich essere divergente, ed il prodotto b
hb
h1 , che
non pi denito ad j , viene rimpiazzato con una funzione di modulo non

17.3. DE-EQUALIZZAZIONE IN TEMPO REALE

1095

superiore a 1. Quanto piccoli si debbano prendere gli intervalli Ij si calcola


come nella Sottosezione 17.1.2 , in funzione della tolleranza pressata.
Allora, per deconvolvere (ossia invertire) la convoluzione per h, basta
convolvere con loperatore inverso Q appena determinato. Per calcolare Q
si deve calcolare prima b
h, unoperazione che richiede tempo dellordine di
N log2 N, ma si fa una volta sola per ciascun ambiente dascolto. Per Q
il convolutore per b
h1 , una funzione di N campioni, ed il calcolo diretto
del convolutore lapplicazione di una matrice di dimensione N, che richiede
tempo N 2 . A confronto, il metodo di divisione per b
h applicabile mediante
lalgoritmo di Sovrapposizione e Memorizzazione molto pi veloce (abbiamo
visto che richiede tempo N log2 N). Per il calcolo del convolutore inverso,
come tutte le convoluzioni, eettuabile nestra per nestra tramite leciente metodo di Sovrapposizione e Memorizzazione Segmentata, che richiede
tempo K 2 dove K la semilunghezza di una nestra (si veda la precedente Sezione 17.2). Allora, questo metodo pi veloce del metodo basato su
divisione e trasformazione inversa esattamente quando K 2 < N log2 N. I
due proce3dimenti sono dello stesso ordine di complessit di calcolo quando
K 2 = N. Ora, N la durata dellequalizzazione (ossia della risposta allimpulso dcellambiente, tipicamente dellordine di uno o pi secondi per ampie
sale da concerto, mentre K met della lunghezza della nestra temporale,
tipicamente dellordine dei millisecondi. Quindi il metodo di dceconvoluzione basato sulla convoluzione inversa segmentata il pi veloce. Chiamiamo
questo procedimento deconvoluzione a finestre.
La deconvoluzione a nestre ha varie applicazioni interessanti. Una di
esse, come visto, leliminazione in tempo reale dellequalizzazione indotta
dalla sala dascolto. Unaltra la de-equalizzazione di un segnale equalizzato. Supponiamo che un segnale sia stato equalizzato, ossia ne sia stata
modicata la trasformata di Fourier tramite un moltiplicatore, ad esempio
utilizzando un equalizzatore graco o parametrico. Questo di solito si fa per
adattare il segnale allacustica dellambiente in cui verr ascoltato, e rinforzarne lampiezza in vicinanza delle frequanze che lambiente smorza di pi (le
sue frequenza di risonanza). Ad esempio, se il segnale destinato ad essere
ascoltato in una stanza di assorbimento normale e di dimensioni tipiche di sei
metri di lato per unaltezza di tre metri, dal valore della velocit del suono
ricaviamo, come nella Sezione 8.1, lesistenza di due frequenza di risonanza a
27 ed a 54 Hertz circa. In pratica, nessuna frequanza sotto i 54 Hertz viene
riprodotta in maniera non distorta, e quelle a 54 Hertz o poco superiori ven-

1096

CAPITOLO 17. DECONVOLUZIONE E DFT A FINESTRE

gono fortemente smorzate. In prossimit di queste frequenze gli ingegneri del


suono, in fase di registrazione, amplicano il segnale tramite equalizzatori,
per compensare lassorbimento previsto. ma se invece il brano musicale viene
poi ascoltato in unautomobile, molto pi piccola di una stanza, le frequenza
smorzate sono molto superiori, ed occorre cambiare equalizzazione. Il metodo corretto non consiste nellaggiungere una successiva equalizzazione alla
mprecedente, moltiplicando gli errori, ma nelleliminare la precedente equalizzazione ed applicarne una nuova pi adatta. Questo si fa in tempo reale
tramite lalgoritmo di cui sopra.

17.3.1

Esempi numerici di de-equalizzazione

Concludiamo questa Sezione presentando alcuni esempi numerici elaborati


dal Dr. Raaele Presciutti nella sua tesi di Laurea in Scienza dei Media e
della Comunicazione presso lUniversit di Roma Tor Vergata nel luglio
2006. Tutte le gure sono tratte da questa tesi. Il codice di trattamento
numerico stato elaborato dal Dr. Presciutti nel corso di uno stage di laurea
presso la ditta i3 s.r.l e sviluppato nellambiente di sviluppo Matlab.
Il primo esempio la de-equalizzazione di uno sweep, ossia un segnal ad
ampiezza variabile e a frequenza monocromatica che aumenta linearmente
col tempo. stato usato lo sweep costituito da una sinusoide di frequenza
da circa 20Hz a 20Khz a cui si applicata una equalizzazione che vogliamo
ora sopprimere tramite deconvoluzione.
In Figura 17.3 vediamo la forma donda dello sweep (le oscillazioni sono
troppo tte per poterai distinguere, e quindi il graco appare come una area
a tinta piatta):

Facendo uso dellapplicativo Spectrogram v. 5.0, prodotto da Richard Horne,


analizziamo il sonorogramma del segnale, cio un graco a tre dimensioni in
cui sullasse x il tempo, sullasse y la frequenza e sullasse z lampiezza del
modulo della FFT espresso in decibel. Per evitare graci tridimensionali, i
valori sullasse z sono rappresentati con colori secondo la scala in Figura 17.4

Per lo sweep otteniamo il sonorogramma in Figura 17.5. Landamento della frequenza in funzione del tempo un incremento lineare, e quindi il
sonorogramma disposto lungo una retta.

17.3. DE-EQUALIZZAZIONE IN TEMPO REALE

1097

Segnale sweep
0.8
0.6

Ampiezza normalizzata

0.4
0.2
0
0.2
0.4
0.6
0.8

0.5

1.5
Tempo (sec)

2.5

Figura 17.3: Il grafico dello sweep nel tempo

Figura 17.4: Scala cromatica delle ampiezze nei prossimi sonorogrammi

Nelle Figure 17.6 e 17.7 presentiamo rispettivamente la risposta impulsiva

1098

CAPITOLO 17. DECONVOLUZIONE E DFT A FINESTRE

Figura 17.5: Il sonorogramma dello sweep


dellequalizzatore e la sua funzione di trasferimento (il modulo della trasformata di Fourier). In ascisse, F la frequenza e F c la frequenza di
campionamento.

Ora usiamo algoritmo di convoluzione mediante Sovrapposizione e Memorizzazione Segmentata per convolvere i due segnali. Il sonorogramma del
risultato in Figura 17.8.

Come previsto, il risultato della convoluzione uno sweep, con alcune frequenze enfatizzate e altre smorzate in ampiezza.
Ora calcoliamo il reciproco la risposta impulsiva. La risposta allimpulso ed
il suo reciproco sono illustrate nella Figura 17.9.

17.3. DE-EQUALIZZAZIONE IN TEMPO REALE

1099

Risposta impulsiva
1

Ampiezza normalizzata

0.8

0.6

0.4

0.2

0.2

0.4

3
4
Tempo (sec)

7
3

x 10

Figura 17.6: Risposta allimpulso dellequalizzatore

Convolvendo numericamente il reciproco della risposta impulsiva con lo sweep


equalizzato riotteniamo nuovamente il segnale originale, come si vede nella
Figura 17.10.

Un secondo esempio pi tipico nellambito delle registrazioni musicali.


Consiste di un brano musicale su cui stata eettuata unequalizzazione
e poi, con il procedimento di deconvoluzione a nestre, la corrispondente
de-equalizzazione.
In questo caso, nel sonorogramma abbiamo usato unaltra scala per il modulo
della F F T , come in Figura 17.11.

La Figura 17.12 mostra la forma donda del brano musicale.

1100

CAPITOLO 17. DECONVOLUZIONE E DFT A FINESTRE

5
x 10 Trasformata della risposta impulsiva (funzione di trasferimento)

Ampiezza normalizzata

7
6
5
4
3
2
1
0

0.1

0.2

0.3

0.4

0.5

F/Fc

Figura 17.7: Funzione di trasferimento dellequalizzatore

Il sonorogramma presentato in Figura 17.13.

Lequalizzazione stata eseguita mediante il procedimento di convoluzione a


nestre. Il sonorogramma del brano equalizzato in Figura 17.14.

La deconvoluzione a nestre basata sullalgoritmo di Sovrapposizione e Memorizzazione Segmentata porta alla de-equalizzazione illustrata nel sonorogramma della Figura 17.15.

17.3. DE-EQUALIZZAZIONE IN TEMPO REALE

1101

Figura 17.8: Sonorogramma dello sweep dopo lequalizzazione


Lesecuzione numerica del convolutore inverso ci ha restituito esattamente il
segnale iniziale. Il brano musicale originale e le sue versioni equalizzata e
de-equalizzata si possono ascoltare dal seguente le:
http://scienzamedia.uniroma2.it/didattica/materiali_did/Anal.Armon./deconvoluzione_esempio.wav .

1102

CAPITOLO 17. DECONVOLUZIONE E DFT A FINESTRE

Ampiezza normalizzata

Funzione di trasferimento

x 10

0.8
0.6
0.4
0.2
0

0.1

Ampiezza normalizzata

x 10

0.2

0.3
F/Fc
Funzione di trasferimento inversa

0.4

0.5

0.4

0.5

0.1

0.2

0.3
F/Fc

Figura 17.9: Risposta allimpulso dellequalizzatore e suo reciproco

17.3. DE-EQUALIZZAZIONE IN TEMPO REALE

1103

Segnale deconvoluto
0.8
0.6

Ampiezza normalizzata

0.4
0.2
0
0.2
0.4
0.6
0.8

3
4
Tempo (sec)

Figura 17.10: Sonorogramma dello sweep dopo la deconvoluzione

Figura 17.11: Scala cromatica delle ampiezze nei possimi sonorogrammi

1104

CAPITOLO 17. DECONVOLUZIONE E DFT A FINESTRE

Segnale musicale
1
0.8

Ampiezza normalizzata

0.6
0.4
0.2
0
0.2
0.4
0.6
0.8
1

10

15

20
25
Tempo (sec)

30

35

40

Figura 17.12: Andamento nel tempo di un brano musicale

17.3. DE-EQUALIZZAZIONE IN TEMPO REALE

Figura 17.13: Sonorogramma del brano musicale della figura precedente

1105

1106

CAPITOLO 17. DECONVOLUZIONE E DFT A FINESTRE

Figura 17.14: Sonorogramma del brano musicale dopo lequalizzazione

17.3. DE-EQUALIZZAZIONE IN TEMPO REALE

Figura 17.15: Sonorogramma del brano musicale dopo la de-equalizzazione

1107

1108

CAPITOLO 17. DECONVOLUZIONE E DFT A FINESTRE

Parte V
Trasformata di Laplace,
trasformata zeta e filtri lineari

1109

Capitolo 18
La trasformata di Laplace
Abbiamo precedentemente studiato gli sviluppi di Fourier di funzioni di variabile reale e la trasformata di Fourier per frequenze reali. In questa parte
dellopera vogliamo estendere questi concetti a funzioni di variabile complessa. In questo e nel prossimo capitolo introduciamo due estensioni complesse
rispettivamente della trasformata di Fourier (trasformata di Laplace) e della
serie di Fourier (trasformata zeta). Nel presente capitolo focalizziamo lattenzione alla trasformata di Laplace, che non verr usata in questo libro
per il trattamento di segnali, ma viene presentata per limportanza delle sue
applicazioni alla matematica e allingegneria (ad esempio, risoluzione delle
equazioni dierenziali ordinarie e applicazioni allanalisi di circuiti elettrici,
calcolo di integrali), e della rimeditazione che essa consente a proposito della
trasformata di Fourier.

18.1

Trasformata di Laplace e formula di inversione

Definizione 18.1.1. (Ascissa di convergenza.) Lascissa di convergenza


di una funzione f localmente L1 (ossia L1 sui compatti) rispetto alla misura
di Lebesgue il numero dato da


Z
ut
:= inf u R :
e |f (t)| dt < .
0

In altre parole, := inf{Re z} tali che t 7 ezt f (t) L1 (0, ).


1111

1112

CAPITOLO 18. TRASFORMATA DI LAPLACE

Se la precedente funzione non ha integrale nito per nessun valore di Re z,


si pone = .
R
Corollario 18.1.2. Per ogni z C con Re z > lintegrale 0 ezt |f (t)| dt
finito.

Dimostrazione. Segue immediatamente dal fatto che, per Re z > , si ha


|ezt | |f (t)| = et Re z |f (t)| < |et | |f (t)|.

Esempio 18.1.3. Un esempio tipico di funzioni denite in (0, ), localmente


L1 con ascissa di convergenza nita sono le funzioni misurabili a crescita non
pi che esponenziale: |f (t)| 6 Cet per ogni t > 0, per qualche costante
C > 0 e R. In tal caso ovvio che lascissa di convergenza non
superiore a .

Poich le funzioni dellEsempio 18.1.3, estese in maniera banale a tutto


R, sono di uso frequente in questo Capitolo, gli diamo un nome apposito:

Definizione 18.1.4. Le funzioni f misurabili su R, nulle in (, 0) e tali


che |f (t)| 6 Cet per ogni t > 0, per qualche costante C > 0 e R si dicono
funzioni con supporto a destra (o pi brevemente, funzioni a destra) a crescita
esponenziale su R+ . Si osservi che tali funzioni sono integrabili sui compatti.
Con generalit lievemente maggiore, possiamo estendere questa denizione
e dire che le funzioni a destra a crescita esponenziale sono le funzioni f a
supporto in R+ per cui esiste R tale che t 7 f (t) et appartiene a
L1 (R). Ancora pi in generale possiamo assumere che queste funzioni siano
supportate non nella semiretta {t > 0} bens in qualche semiretta {t > T }
con T R arbitrario, che dipende da f . I risultati di questo capitolo non
cambierebbero in queste ipotesi lievemente pi generali, ma per semplicit
non le adottiamo, tranne che nella Sezione 18.5 sulla trasformata di Laplace
di distribuzioni.
Lestremo inferiore delle costanti come sopra si chiama lesponente di crescita, o talvolta anche, in vista dellEsempio 18.1.3, lascissa di convergenza
di f .
Definizione 18.1.5. (Trasformata di Laplace.) Sia f una funzione a
destra a crescita esponenziale nel senso della Denizione 18.1.4, con esponente
di crescita . La trasformata di Laplace di f la funzione L f denita nel
semipiano Re z > da
Z
L f (z) =
f (t) ezt dt .
0

18.1. TRASFORMATA DI LAPLACE, INVERSIONE

1113

Corollario 18.1.6. Se f una funzione a destra a crescita esponenziale con


esponente di crescita (ascissa di convergenza) (nel senso della Definizione
18.1.4), allora L f olomorfa nel semipiano {Re z > }.
Dimostrazione. Consideriamo la misura (reale o complessa) con derivata
di RadonNykodym f rispetto alla misura di Lebesgue su R (Denizione
1.9.28), ossia tale che d(t) = f (t) dt. Questa misura nita sui compatti
perch F localmente L1 . Inoltre, in ogni quadrante {Re z > > , t > 0}
Re zt
la funzione h(z, t) = ezt verica |h(z, t) =
> et = h(, t). Poich
R e
maggiore dellascissa di convergenza, 0 |h(, t) |f (t)| dt < , e quindi
supRe z> ezt localmente L1 (||). Allora L f olomorfa in tutti i semipiani
{Re z > } per la parte (ii) del Lemma 2.5.8, e quindi anche in {Re z > }.

Nota 18.1.7. (Relazione fra le trasformate di Fourier e di Laplace.)


Chiaramente, la relazione fra le trasformate di Laplace e di Fourier la
seguente: se f (t) = 0 per t < 0, scrivendo hx (t) = f (t)ext , abbiamo
L f (z) = L f (x + iy) = F[hx ](y/2) ,
dove, come nella Denizione 8.2.1, F denota la trasformata di Fourier.

Nota 18.1.8. Se f una funzione a destra a crescita esponenziale con esponente di crescita , allora
Z
M
| L f (z)| 6 M
e(Re z)t dt 6
,
(18.1)
Re z
0
e quindi L f tende a zero quando Re z +, uniformemente rispetto a
Im z.
Lo stesso calcolo mostra che la funzione f nulla per t < 0 e data da
f (t) = et per t > 0 ha per trasformata di Laplace la funzione
L f (z) =

1
.
z

(18.2)

In particolare, la funzione di Heaviside H introdotta nella Denizione 11.9.2


(la funzione caratteristica di (0, ), che a crescita esponenziale con esponente 0, si ha L H(z) = Re1 z . Si noti che L H converge a zero per Re z +,
ma non per |z| + ( costante sulle rette verticali Re z = costante).

1114

CAPITOLO 18. TRASFORMATA DI LAPLACE

Daltra parte, la disuguaglianza (18.1) mostra che L f (z) tende a zero


uniformemente rispetto a arg z in tutti i domini nel semipiano {Re z > } nei
quali |z| implica Re z +, ad esempio i coni propri | arg (z )| 6
< 2 .

Nota 18.1.9. La condizione di crescita esponenziale della funzione f stata


usata per mostrare che la trasformata di Laplace ha senso nel semipiano destro ed ivi olomorfa. La condizione di appartenenza locale a L1 non assicura
che la crescita sia al pi esponenziale (f potrebbe avere picchi periodici fatti
come campane via via pi strette ed alte, con massimi locali che crescono a
velocit arbitraria).
Per vedremo in seguito, alla ne della dimostrazione del Teorema 18.6.1,
che se f una funzione in L2 (0, ), allora la trasformata di Laplace denita ed olomorfa nel semipiano destro. Questo fatto estende la denizione di
trasformata di Laplace a tali funzioni.

Per uso futuro presentiamo la seguente osservazione.


Lemma 18.1.10.
R b Se f a crescita esponenziale con ascissa di
R convergenza
, lintegrale 0 f (t) ezt dt uniformemente convergente a 0 f (t) ezt dt
nel semipiano D := {Re z > } per ogni > .

Dimostrazione. Per ogni z in D ,


Z
Z
Z b


zt
zt

>
f
(t)
e
dt

f
(t)
e
dt


0

zt

|f (t) e

| dt >

e()t dt

e poich > lultimo integrale nito, ossia lintegrando appartiene a


L1 [b, +), ed il risultato segue dal test di Weierstrass (Corollario 1.23.8).

Teorema 18.1.11. (Formula di inversione per la trasformata di Laplace.) Sia f una funzione a crescita esponenziale con esponente di crescita
. Allora, per ogni a > e per ogni punto di continuit t R di f , vale la
formula di inversione
Z a+ib
Z a+i
1
1
1
zt
f (t) = L F (t) :=
L f (z) ezt dz
v. p.
lim
L f (z) e dz
b+
2i
2i
aib
ai
(18.3)
R
dove la notazione v. p. quella introdotta alla fine dellEsempio 11.5.5
(valore principale).

18.1. TRASFORMATA DI LAPLACE, INVERSIONE

1115

Dimostrazione. Sfruttiamo la relazione fra le trasformate di Laplace e di


Fourier (Nota 18.1.7):
Z
Z
(a+is)t
L f (a + is) =
f (t) e
dt = F [f ()ea ](s)
0

(osserviamo che f (t)e = 0 per t < 0 e appartiene a L1 (R) perch a > ).


Ora dal teorema di inversione di Fourier (Teorema 8.4.2) otteniamo
Z b
Z a+ib
1
ist
at 1
lim
L f (a + is) e ds =
lim
L f (z) ezt dz ,
f (t) = e
2 b+ b
2i b+ a+ib
at

ossia la formula di inversione dellenunciato.

Teorema 18.1.12. (Formula di inversione per la trasformata di Laplace sotto ipotesi pi generali.) Sia R e F una funzione olomorfa
nel semipiano Re z > . Supponiamo che F converga a 0 per z uniformemente rispetto ad arg z in ogni semipiano Re z > a > , e che la
restrizione di F allasse {Re z = a} sia in L1 (R) (ossia che esista il limite
R a+ib
limb+ aib |F (z)| dz).
Allora, in base al Corollario 18.1.14, la formula di inversione (18.3) fornisce
una funzione f continua ovunque a crescita al pi esponenziale e tale che
Lf = F.
Dimostrazione. Fissiamo z0 nel semipiano {Re z > a}. Allora
Z
Z
Z a+i
1
z0 t
z0 t
f (t) e
dt =
e
v. p.
F (z) ezt dz dt .
2i
0
0
ai

Poich, per ipotesi, per ogni t > 0 la funzione F (z) ezt ristretta alla retta
{Re z = a} in L1 , possiamo scambiare lordine di integrazione in base al
Teorema di Fubini 1.20.4 (ii), ed otteniamo
Z
Z
Z
1
z0 t
f (t) e
dt =
v. p.
F (z)
e(zz0 )t dt dz
(18.4)
2i
0
{Re z=a}
0
Z
F (z)
1
v. p.
dz .
=
2i
{Re z=a} z z0
Sia CR = |z| = {R , Re z > a}, e MR = supzCR |F (z)|. Per ipotesi,
limR+ MR = 0, e quindi, dato che |z0 | < R, si ha
Z
F (z)
R
dz 6 MR
,
R |z0 |
CR z z0

1116

CAPITOLO 18. TRASFORMATA DI LAPLACE

perch |z z0 | > | |z| |z0 | | = R |z0 |. Poich il secondo membro tende a


zero quando R +, da qui segue
Z
Z
F (z)
1
F (z)
1

v. p.
dz =
v. p.
dz
2i
2i
{Re z=a} z z0
KR z z0
dove KR la curva chiusa KR = CR {Re z = a, |z| 6 R}, percorsa in senso
antiorario. Daltra parte, poich F olomorfa dentro il contorno KR e z0
allinterno di KR , sappiamo dal teorema di Cauchy (Corollario 2.4.10) che
lintegrale a secondo membro vale F (z0 ). Quindi la formula di inversione dellenunciato segue ora da (18.4), a patto di dimostrare che f trasformabile
secondo Laplace. Per questo scopo basta mostrare che f a crescita esponenziale. Infatti, dalla denizione di f e dal fatto cheR|F | ha integrale nito sulla
1
v. p. {Re z=a} |F (z)| dz < M eat .
retta {Re z = a}, segue che |f (t)| 6 eat 2

R
Nota 18.1.13. Poich L f (z) = 0 f (t) ezt dt, non ci interessa sapere se la
formula di inversione (18.3) fornisce una funzione f tale che f (t) = 0 per
t < 0. comunque interessante osservare che questa propriet di f vera se
|F (z)| < C/|z|p

(18.5)

per qualche p > 1, come ora proviamo. Siano CR il semicerchio e KR il percorso chiuso introdotti nella dimostrazione del Teorema 18.1.12. Osserviamo
che
Z
Z
Z


zt
t Re z
at

F (z) e dt 6
|F (z)| e
|dz| 6 e
|F (z)| |dz| .
(18.6)

CR

CR

CR

Lultimo integrale limitato rispetto a R in conseguenza di (18.5). Pertanto,


se t < 0, allora lultimo membro della precedente disuguaglianza tende a zero
se R . Allora, dalla formula di inversione (18.3), abbiamo
1
v. p.
f (t) =
2i

a+i

ai

1
F (z) e dz = lim
R 2i
zt

F (z) ezt dz = 0

KR

grazie al teorema di Cauchy (Corollario 2.4.10), perch lintegrando olomorfo.

18.2. PROPRIET DELLA TRASFORMATA DI LAPLACE

1117

Corollario 18.1.14. (Una condizione sufficiente per linvertibilit.)


Se F una funzione olomorfa nel semipiano {Re z > a} per qualche a > 0
e soddisfa la condizione di decadimento |F (z)| < C/|z|p per qualche p > 1,
C > 0 e per ogni z in tale semipiano, allora lintegrale nella formula di
inversione (18.3) convergente, e fornisce una funzione f continua ovunque,
nulla a sinistra di 0, a crescita al pi esponenziale e tale che L f = F .
Dimostrazione. ovvio che la condizione di decadimento implica la convergenza dellintegrale improprio (Sezione 1.1). La dimostrazione del fatto che
f abbia crescita al pi esponenziale identica allargomento alla ne della
dimostrazione
R del Teorema 18.1.12: la ripetiamo qui per chiarezza. Poich f (t) = F (a + iy) ea+iy dy, lintegrale nella formula di inversione
assolutamente convergente:
Z
Z
at
iy
e |f (t)| 6
|F (a + iy)| |e | dy =
|F (a + iy)| dy <

(lultimo integrale nito ancora per la condizione di decadimento). Quindi


|f (t)| < Aeat per qualche costante A > 0.
Il fatto che f (t) = 0 per t < 0 stato mostrato nella Nota 18.1.13. Inne,
il fatto che L f = F si dimostra grazie alla relazione fra la trasformata di
Laplace e di Fourier (Nota 18.1.7), esattamente come nella dimostrazione del
Teorema 18.1.11.

18.2

Propriet della trasformata di Laplace

Le propriet elementari della trasformata di Laplace si deducono allo stesso


modo che per la trasformata di Fourier (Teorema 8.2.4). Per completezza,
accenniamo le dimostrazioni nel prossimo teorema.
Teorema 18.2.1. (Propriet della trasformata di Laplace.) Sia f
(rispettivamente, g) una funzione a destra a crescita esponenziale nel senso
della Definizione 18.1.4, con esponente di crescita f , (rispettivamente g ).
La trasformata di Laplace L f ha le propriet seguenti.
(i) (linearit.) La trasformata di Laplace lineare: per ogni coppia di
numeri complessi c, d, si ha L(cf + dg) = c L f + d L g, nel semipiano
{Re z > max{f , g }}.

1118

CAPITOLO 18. TRASFORMATA DI LAPLACE

(ii) (dilatazione.) Se h(t) = f (ct), con c > 0 allora L h(z) =


ogni z con Re z > cf .

1
c

L f ( zc ) per

(iii) (traslazione nel tempo.) Sia h = f il traslato h(t) = f (t ), con


R. Allora L h(z) = e z L f (z) per ogni Re z > f .
(iv) (traslazione in frequenza.) Se g(t) = e t f (t), con R, allora
L g(z) = L f (z ) per ogni Re z > f + .
(v) (derivazione nel tempo.) Se f derivabile ed anche f una funzione
a destra a crescita esponenziale, allora, denotando con D loperatore di
derivazione, si ha L Df = z L f (z) f (0). Pi in generale, se le prime
n derivate di f sono funzioni a destra a crescita esponenziale, allora
per ogni Re z > max06j6n Dj f si ha
L(D n f )(z) = z n L f (z) z n1 f (0) z n2 (Df )(0) (D n1 f )(0)
X
= 0n1 z j D nj1f (0) .
= z n L f (z)
j

j
Pi in generale lo stesso enunciato vale se la derivata destra D+
f
una funzione a destra a crescita esponenziale per 1 6 j 6 n, pur di
rimpiazzare tutte le derivate con le corrispondenti derivate destre.

(vi) (derivazione in frequenza.) Per ogni n > 0, la funzione t 7 tn f (t)


una funzione a destra a crescita esponenziale con la stessa ascissa di
convergenza di f , e se g(t) = (1)n tn f (t) si ha D n L f (z) = L g(z) in
tutto il semipiano di convergenza.
Rt
(vii) (integrazione nel tempo.) La primitiva g(t) = 0 f (s) ds ha ancora
ascissa di convergenza f e L g(z) = L f (z)/z per ogni z nel semipiano
di convergenza.
(viii) (integrazione in frequenza.) La funzione g(t) = f (t)/t ancora una
funzione a destra a crescita esponenziale (necessariamente con la stessa
R ascissa di convergenza f di f purch f > 0), allora L g(z) =
L f (u) du, dove lintegrale calcolato su un qualunque percorso dal
z
punto z a infinito in cui Re z +. Questo accade per i percorsi nel
semipiano {Re z > f } che tendono ad infinito senza restare in una
banda verticale, ossia sono tali che |z| implica Re z +: ad

18.2. PROPRIET DELLA TRASFORMATA DI LAPLACE

1119

esempio, i percorsi contenuti nei coni propri | arg (z )| 6 < 2 . In


particolare,
Z
L g(z) =
L f (u) du .
{Im u=Im z, Re u>Re z}

Dimostrazione. La parte (i) ovvia, e (ii), (iii) e (iv) si dimostrano allo


stesso modo delle propriet corrispondenti della trasformata di Fourier (rispettivamente le parti (iv), (v) e (vi) del Teorema 8.2.4). Bastano solo le
seguenti ovvie osservazioni sulle ascisse di convergenza, che lasciamo al lettore per esercizio: per la parte (i), f +g = max{f , g }; per la parte (ii),
cf = cf ; per la parte (iii), f = f ; per la parte (iv), g = f + .
Dimostriamo la parte (v). Siano = max{f , f } e Re z > . Integrando per parti otteniamo
Z
Z



zt
zt
+z
L f (z) =
f (t) ezt dt = f (0)+z L f (z) ,
f (t) e dt = f (t) e
0
0

dove nellultimo passaggio si usato il fatto che limt+ f (t)ezt = 0, che


vale poich Re z > f . Si osservi che nellintegrazione per parti il termine
costante al bordo sinistro di integrazione in realt il limite limt0+ f (t), ma
questo vale f (0) perch abbiamo assunto f derivabile, quindi continua.
Per il caso generale della derivata n-sima, procediamo per induzione su n.
Supponiamo che la formula dellenunciato valga per n 1 per qualche n > 0:
allora lenunciato che abbiamo appena provato nel caso n = 1 pu essere applicato alla derivata D n1 f invece che a f per ottenere L D n f (z) =
n1
z L D n1 f (z) D+
f (0): come prima, nellintegrazione per parti si deve
utilizzare la derivata destra se la funzione f derivabile a destra in 0 ma non
a sinistra. A questo punto lenunciato segue immediatamente dallipotesi di
induzione.
(vi), basta osservare che la trasformata di Laplace L f (z) =
R Per dimostrare
zt
f (t) e dt olomorfa nel semipiano di convergenza e si pu portare la
0
derivata sotto il segno di integrale perch lintegrando di classe C 1 sui compatti e lintegrale improprio uniformemente convergente. Grazie al Lemma
18.1.10, possiamo applicare il Corollario 1.23.7 per derivare sotto il segno di
integrale: in tal modo si ottiene (vi).
Rt
Dimostriamo (vii). Se |f (t)| < ef t , allora la primitiva g(t) = 0 f (s) ds
verica |g(t)| < tef t , e quindi g a crescita esponenziale con lo stesso esponente di crescita, ossia g = f , perch lesponenziale cresce pi rapidamente

1120

CAPITOLO 18. TRASFORMATA DI LAPLACE

del polinomio (Sezione 1.1). Osserviamo che, per il Teorema fondamentale


del Calcolo 1.27.1), si ha g = f e g(0) = 0. Allora, per la propriet di
derivazione nel tempo (parte (v) qui sopra) abbiamo
L f (z) = L(g )(z) = z L g(z) g(0) = z L g(z)
per ogni z > f .
Inne, dimostriamo (viii). Supponiamo f > 0. la funzione g(t) = f (t)/t
ha la stessa ascissa di convergenza f per quanto osservato nella precedente
parte (vii), e per ogni Re z > f segue dalla parte (vi) (propriet di derivazione in frequenza) che D L g(z) = L f (z). Quindi, per ogni z0 con
Re z0 > f , abbiamo
L g(z) = L g(z0 ) +

z0

L f (s) ds

dove lintegrale calcolato su qualsiasi percorso da z0 a z contenuto nel


semipiano di olomora {s : Re s0 > f }. Daltra parte, abbiamo visto
nella Nota 18.1.8 che L g(z) tende a zero se z tende ad innito in modo
che Re z tenda anchesso ad innito (ossia senza restare in una banda verticale). Pertanto
R su ogni tale percorso la precedente identit assicura che
L g(z0 ) = lim z0 L f (s) ds, e quindi, nellipotesi dellenunciato,
L g(z) =

L f (s) ds .

Corollario 18.2.2. (Trasformata di Laplace di funzioni a destra periodiche.) Sia f una funzione a destra a crescita esponenziale, periodica di
periodo T > 0 nel senso che f (t + T ) = f (t) per ogni t > 0. Allora, per ogni
z nel semipiano di convergenza,
L f (z) =

RT
0

f (t) eztdt
.
1 ezt

Dimostrazione. Tronchiamo la funzione f sul periodo [0, T ) per ottenere


RT
f0 = [0,T ) f . Allora L f0 (z) = 0 f (t) ezt dt. Inoltre per ogni t si ha f (t) =

18.3. ESEMPI DI TRASFORMATE DI LAPLACE

1121

f (t + nT ), e dalla propriet di traslazione nel tempo (parte (iii) del


Teorema 18.2.1) segue
!
X
L f (z) =
enzT L f0 (z) ,
n>0

n>0

da cui la tesi.

18.3

Esempi di trasformate di Laplace

Nei prossimi esempi applichiamo la formula (18.2) per la trasformata di


Laplace della funzione esponenziale.
Esempio 18.3.1. Dalle espressioni sin t = (eit eit )/2i e cos t = (eit +
eit )/2 e da (18.2) segue


1

1
1
= 2

L[sin t](z) =
2i z i z + i
z + 2


1
z
1
1
L[cos t](z) =
= 2
+
.
2 z i z + i
z + 2
Analogamente, dalle espressioni sinh t = (et et )/2 e cosh t = (et +
et )/2 si ha


1

1
1
= 2

L[sinh t](z) =
2 z z+
z 2


1
z
1
1
L[cosh t](z) =
= 2
+
.
2 z z+
z 2

Esempio 18.3.2. Da (18.2) sappiamo che L 1 = 1/z, dove, come sempre, con
1 intendiamo la funzione che vale 1 per t > 0 e 0 altrove. Allora segue dalla propriet di derivazione in frequenza (parte (vi) del Teorema 18.2.1) che
L[tn ](z) = n!/z n+1 . Ora dalla propriet di traslazione nel tempo (parte (iii)
del Teorema 18.2.1) segue L[tn ez0 t ](z) = n!/(z z 0 )n+1 . Grazie al precedente Esempio 18.3.1 allo stesso modo si ha L[t sin t](z) = 2z/(z 2 + 2)2 e
L[t cos t](z) = (z 2 + 2 )/(z 2 + 2 )2 . Continuando a derivare rispetto a z si

1122

CAPITOLO 18. TRASFORMATA DI LAPLACE

ottengono le trasformate di Laplace di tn sin t e tn cos t, che lasciamo per


esercizio.
Veniamo ora al caso di potenze generalizzate, ossia con esponente positivo
ma non intero. Tramite il cambiamento di variabili u = t/x nella denizione
di funzione Gamma (Sottosezione 1.23.4) si ha che, per x > 0 e > 1,
Z
Z
t
+1
( + 1) =
t e dt = x
u exu du .
0

Questo equivale a dire


( + 1)
.
x+1
Per prolungamento analitico (Sezione 2.14, ed in particolare Sottosezioni
2.14.1, ?? e 2.14.5), la stessa formula vale se si sostituisce x > 0 con z C,
Re z > 0: qui abbiamo denito la funzione z +1 tramite il suo ramo olomorfo determinato dalla funzione logaritmo nel modo seguente: z +1 =
e(+1)(ln |z|+i arg z) con | arg z| < /2.

L[u ](x) =

Esempio 18.3.3. Applicando la propriet di traslazione in frequenza ai risultati visti nei precedenti Esempi 18.3.1 e 18.3.2 si ottiene, per ogni z0
C,

(z + z0 )2 + 2
z
L[ez0 t cos t](z) =
z + z0 )2 + 2

L[ez0 t sinh t](z) =


(z + z0 )2 2
z
L[ez0 t cosh t](z) =
(z + z0 )2 2
n z0 t
L[t e
](z) = n!/(z + z0 )n+1 .
L[ez0 t sin t](z) =

Esempio 18.3.4. Sappiamo dallEsempio 18.3.1 che L[sin](z) = 1/(1 + z 2 )


nel semipiano di convergenza Re z > 0. Quindi segue dalla propriet di
integrazione in frequenza (parte (viii) del Teorema 18.2.1) che
Z
1
L[sinc](z) =
du
1 + u2
z

18.4. TRASFORMATA DI LAPLACE DELLA CONVOLUZIONE

1123

dove lintegrale calcolato su un qualunque percorso in cui Re z tende a +.


Scegliendo ad esempio il percorso {z + is : s > 0} otteniamo, per z = x reale,

L[sinc](x) = [arctan s]
arctan x .
x =
2
Poich la trasformata di Laplace olomorfa nel semipiano di convergenza,
L[sinc](z) il prolungamento analitico di 2 arctan x dal semiasse reale
positivo al semipiano {Re z > 0}. Pertanto

L[sinc](z) = arctan z .
2
R
In particolare, per b > 0 si trova L[sinc](b) = b sint t ebt dt = 2 arctan b, e
passando al limite per b 0 abbiamo
Z

sin t
dt = ,
t
2
0
perch

Z b
sin t bt
e dt 6
dt 6 b
t
0
0
dal momento che lintegrando non superiore a 1. Questo risultato era gi
stato dimostrato per altra via nel Corollario 5.19.2, come conseguenza dei
risultati sulla convergenza delle serie di Fourier.

Esempio R18.3.5. Le propriet della funzione seno integrale, denita come


x
si(x) = 0 sin t/t dt, sono state studiate nella Sezione 5.19. Applicando
la propriet di traslazione in frequenza (parte (vi) del Teorema 18.2.1) al
precedente Esempio 18.3.4 abbiamo
L[si](z) =

arctan z
.
z

18.4

Trasformata di Laplace della convoluzione

Teorema 18.4.1. Siano f e g due funzioni a destra a crescita esponenziale


nel senso della Definizione 18.1.4. Allora la loro convoluzione f*g anchessa
una funzione a destra a crescita esponenziale e L[f g](z) = L f (z) L g(z)
per ogni z nel suo semipiano di convergenza.

1124

CAPITOLO 18. TRASFORMATA DI LAPLACE

Dimostrazione. R chiaro che la convoluzione


localmente integrabile, ed
Rx

inoltre f g(x) = f (t) g(xt) dt = 0 f (t) g(xt) dt, perch nel dominio
di integrazione t non negativo in base al dominio di f e x t deve anchesso
essere non negativo in base al dominio di g. Quindi f g(x) = 0 per x < 0.
Abbiamo supposto che f e g siano a crescita esponenziale, quindi esistono
costanti positive C, tali che |f (x)| < Cex e la stessa stima vale per g.
Allora
Z x
Z x
2
|f g(x)| 6
|f (t)| |g(x t)| dt 6 M
ex dt = M 2 xex < M 2 e(+)x
0

per ogni > 0 se x abbastanza grande. Quindi f g a crescita esponenziale.


La moltiplicativit della trasformata di Laplace della convoluzione segue
dalla moltiplicativit dellesponenziale come nel caso della trasformata di
Fourier visto nella Sezione 8.5, ma qui dobbiamo eettuare un cambiamento
di variabili facile ma non banale nellintegrale doppio. Infatti
Z Z x
Z
Z
zx
L[f g](z) =
f (t) g(x t) dt e dx =
f (t)
g(x t)ezx dx dt
0

(gli integrali si possono scambiare per il Teorema di Fubini 1.20.4 perch se


Re z maggiore dellascissa di convergenza di f e di g allora lintegrando
una funzione L1 (dx dt) nel cono {(x, t) : x 6 t < , 0 6 x < },
a causa del decadimento esponenziale allaumentare di x). Ora, grazie alla
moltiplicativit dellesponenziale, lultimo membro diventa
Z
Z
Z
Z
zx
zt
f (t)
g(x t)e
dx dt =
f (t)e dt
g(x)ezx dx
0

= L f (z) L g(z) .

Ora, dalla formula di inversione del Teorema 18.1.11, abbiamo il reciproco


del teorema di convoluzione:

Teorema 18.4.2. Siano f , g funzioni a destra a crescita esponenziale con


ascisse di convergenza f , g . Allora il prodotto puntuale f g una funzione
a destra a crescita esponenziale nel semipiano D := {Re z > f + g }, e per
ogni z D e a > f si ha
Z
1
L[f g](z) =
v. p.
L f (w) L g(z w) dw .
2i
{Re w=a}

18.5. TRASFORMATA DI LAPLACE DI DISTRIBUZIONI

1125

Dimostrazione. ovvio che il prodotto f g ancora una funzione a destra


localmente integrabile a crescita esponenziale con ascissa di convergenza f +
g . Inoltre, grazie al Teorema di inversione 18.1.11, per ogni a > f si ha


Z
Z
1
wt
zt
v. p.
L f (w) e dw g(t) dt
e
L[f g](z) =
2i 0
{Re w=a}


Z
Z
1
(zw)t
=
v. p.
L f (w)
g(t) e
dt dw ,
2i
{Re w=a}
0
dove lordine di integrazione stato scambiato in base alla stessa applicazione
del Teorema di Fubini 1.20.4 gi vista nel Teorema 18.4.1 qui sopra. Poich
assumiamo Re z > f + g ed a > f arbitrario, possiamo assumere Re z >
a + g , ovvero
R Re(z w) > g , e quindi lultimo membro della precedente
identit vale 0 g(t) e(zw)t dt = L g(z w). Quindi, riassumendo,
Z
1
L[f g](z) ==
v. p.
L f (w) L g(z w) dw .
2i
{Re w=a}

18.5

Trasformata di Laplace di distribuzioni

Per una presentazione pi esauriente dei concetti accennati in questa Sezione


rinviamo il lettore a [38].

18.5.1

Trasformata di Laplace di distribuzioni a supporto in R+

Nella notazione dellintegrale tramite il simbolo di dualit che abbiamo introdotto nel Capitolo 11, Notazione 11.3.1, per una funzione f a destra a
crescita esponenziale, con esponente di crescita f , possiamo scrivere
Z
L f (z) =
f (t) ezt dt = hf, ez i .
0

Analogamente, se la denizione di funzione a destra a crescita esponenziale


si intende nel senso pi generale dove la funzione f ha supporto a destra
che comincia al punto T R e verica t 7 f (t) et appartiene a L1 (R) per

1126

CAPITOLO 18. TRASFORMATA DI LAPLACE

ogni > f (Denizione 18.1.4), allora lintegrale diventa


resta valida la formula
L f (z) = hf, ez i .

R
T

f (t) ezt dt, ma


(18.7)

Questa notazione ideale per estendere la denizione di trasformata di Laplace a distribuzioni con supporto a destra (Notazione 11.17.10), nel modo
seguente.
Lidentit (18.7) non pu essere applicata direttamente quando invece che f
abbiamo una distribuzione F con supporto a destra, diciamo nella semiretta
PT := [T, ), perch la funzione t 7 ezt C ma lintersezione del suo
supporto con PT non compatta: tutta la semiretta PT . Supponiamo
allora che esista c R tale che ec F sia una distribuzione temperata. Allora
possiamo riscrivere (18.7) come
L F (z) = hec F, e(zc) i .
La funzione g(t) = e(zc)t a secondo membro a decrescenza rapida quando
la variabile tende a + ma chiaramente non quando tende a . Per, in
base alla denizione di supporto di una distribuzione (Sottosezione 11.17.3
e Denizione 11.10.1), nulla cambia nel risultato dellespressione al secondo
membro se la funzione g viene moltiplicata per una funzione cut-off h di
classe C con supporto in una semiretta destra e che vale 1 in un intorno del
supporto della distribuzione f . In tal modo la precedente identit diventa
L F (z) = hec F, h()e(zc) i ,

(18.8)

ed ora il secondo membro C a decrescenza rapida, quindi nella classe


di Schwartz (Denizione 9.3.1). Poich abbiamo fatto lipotesi che ec F
sia una distribuzione temperata, lidentit (18.8) ora ha senso, e denisce la
trasformata di Laplace di F D :
Definizione 18.5.1. Sia F D una distribuzione tale che, per qualche
c R, si abbia ec F S . Allora la trasformata di Laplace L F denita
da (18.8). Spesso scriveremo, nel senso chiarito sopra,
L F (z) = hF, ez i .
Lestremo inferiore di tutte le costanti c con questa propriet si chiama
lascissa di convergenza F ; la trasformata di Laplace L F denita nel
semipiano Re z > F .

18.5. TRASFORMATA DI LAPLACE DI DISTRIBUZIONI

1127

Questa Denizione 18.5.1 ha senso perch non dipende n dalla scelta del
cut-o h (ovvio per la Denizione 11.10.1 di supporto di una distribuzione),
n dalla scelta della costante c purch c > F . Mostriamo lultima asserzione.
Scegliamo c > F e prendiamo unaltra costante a > c. Allora, se Re z >
a > c,
hec F, h()e(zc) i = he(ca) ec F, e(ac) h()e(zc) i
= hea F, h()e(za) i .

Nota 18.5.2. Se f una funzione a destra a crescita esponenziale con ascissa


di convergenza f , quando la si considera come una distribuzione la sua
ascissa di convergenza F della precedente Denizione 18.5.1 non pu essere
pi grande di f , ma potrebbe essere pi piccola. Per esercizio, si provi che
questo vero per la funzione f (t) = cos t et se t > 0 e f (t) = 0 altrimenti.

Nota 18.5.3. Non per tutte le distribuzioni con supporto a destra si pu


denire la trasformata di Laplace, perch non tutte hanno la propriet della
Denizione 18.5.1. Ad esempio, chiaro che questa propriet non vericata
2
dalla distribuzione data dalla funzione F (t) = et per t > 0 e 0 per t 6 0.

Esercizio 18.5.4. Il lettore verichi che la relazione


L F (z) = F[ez F ] .
stabilita per funzioni nella Nota 18.1.7, continua a valere per distribuzioni
con la propriet della Denizione 18.5.1. In caso di dicolt, il lettore pu
trovare la semplice dimostrazione in [38, Chapter 8, Section 3].

Lasciamo al lettore la verica dellenunciato seguente. Solo lultima parte, la derivazione sotto il segno di integrale, richiede qualche cautela (perch ora non ce pi lintegrale, rimpiazzato dal simbolo di dualit!). Una
dimostrazione si trova in [38, Theorem 8-3.2].
Teorema 18.5.5. Se due distribuzioni hanno trasformata di Laplace che
coincide in una retta nel semipiano di olomorfia, o pi in generale in un insieme con un punto di accumulazione, allora le due distribuzioni coincidono.
Le propriet e gli esempi stabiliti per la trasformata di Laplace di funzioni nelle Sezioni 18.2 e 18.3 rimangono validi per distribuzioni a destra

1128

CAPITOLO 18. TRASFORMATA DI LAPLACE

trasformabili secondo Laplace. In particolare, la trasformata di Laplace di


una distribuzione F olomorfa nel semipiano Re z > F , e si ha
z
e i = htF, etz i .
z
Il seguente Esercizio ovvio, ed in base ad esso la seconda parte del
Teorema 18.5.5 implica il successivo Corollario.
Esercizio 18.5.6. L 0 1.

D L F (z) = hF,

Corollario 18.5.7. Se denotiamo ancora con y loperatore di traslazione a


sinistra per y, per ogni z si ha
L y 0 = eyz

L D k 0 = z k

L y D k 0 = z k eyz .

18.5.2

Limmagine di L sullo spazio delle distribuzioni


con supporto a destra

Lemma 18.5.8. Se F una funzione olomorfa nel semipiano Re z > c ed


a crescita polinomiale, nel senso che in questo semipiano |F (z)| < P (|z|)
per qualche polinomio P , allora F = L G per qualche G D con supporto a
destra di 0.
Dimostrazione. A causa della disuguaglianza dellenunciato, esiste una costante C > 0 ed un intero m tali che
|F (z)| < C|z|m

(18.9)

per ogni z nel semipiano D := Re z > a > c, per ogni a > c. Osserviamo che,
per ogni funzione olomorfa G nel semipiano D che soddisfa |G(z)| < C/|z|2
per qualche costante C > 0, il Teorema di inversione ?? e la Nota 18.1.13
assicurano che esiste la trasformata di Laplace inversa di G, ovvero che G =
L g per qualche funzione g con supporto in [0, +) a crescita esponenziale.
Allora scegliamo G tale che si abbia F (z) = z m+2 G(z): chiaro da 18.9)
che allora |G(z)| < C/|z|2 e quindi esiste la sua antitrasformata di Laplace
g, nulla a sinistra di 0. Per la propriet di derivazione nel tempo (Teorema
18.5.5) abbiamo F = L D m+2 g (derivata nel senso delle distribuzioni), e la
distribuzione D m+2 g ha supporto in [0, +).

18.5. TRASFORMATA DI LAPLACE DI DISTRIBUZIONI

1129

Teorema 18.5.9. Se F una funzione olomorfa nel semipiano Re z > c che


per ogni z in questo semipiano verifica
|F (z)| < eT Re z P (|z|)

(18.10)

per qualche polinomio P , allora F = L G per qualche G D con supporto


in [T, ).
Viceversa, se G D ha supporto in [T, ) ed trasformabile secondo Laplace, allora L G analitica in un semipiano Re z > c e verifica la disuguaglianza
(18.10).
Dimostrazione. Se rimpiazziamo F con etz F nel Lemma 18.5.8, segue dalla
propriet di traslazione nel tempo (lanalogo per le distribuzioni della parte
(iii) del Teorema 18.2.1) che L[T G](z) = ezT L G(z) = ezT F , e quindi la
prima parte dellenunciato.
Viceversa, supponiamo che esista L G. La condizione perch questo accada
(Denizione 18.5.1) che, per qualche c R, H := ec G sia in S . Allora H
un funzionale continuo su S, e quindi, per il Corollario 9.2.2),
|hG, ez i| < C

k
X

pni (ez )

i=1

per qualche costante C > 0 e qualche famiglia nita di seminorme su S, nel


senso della Denizione 18.5.1. Pi precisamente, questo signica che
ct

| L G(z)| = |he

(cz)t

G, h(t)e

i| < C

k
X
i=1

sup(1 + |t|ki ) |Dtli (h(t)e(cz)t )| .


t

(18.11)
Per prima cosa sbarazziamoci della funzione cut-o h. Per semplicit poniamo u(t) = e(cz)t . La funzione test h e tutte le sue derivate, essendo C
a supporto compatto, hanno massimo. Perci, applicando il Teorema della
derivata del prodotto (Sezione 1.1), per ogni l abbiamo
l  
X
l
|D k h(t)| |D lk u(t)|
|D (h)u(t)| =
k
k=0
l  
X
l
|D k h(t)| |z c|lk |e(cRe z)t | 6 P (|z|) |e(cRe z)t
=
k
k=0
l

1130

CAPITOLO 18. TRASFORMATA DI LAPLACE

per qualche polinomio P .


Ora che ci siamo sbarazzati di h, lestremo superiore rispetto a t nella disuguaglianza (18.11) il valore al bordo sinistro del supporto di G, ossia per
t = T , perch lesponente c z ha parte reale negativa. Inoltre lesponenziale
un multiplo della propria derivata, ed in paerticolare Du = (cz)u. Quindi
la disuguaglianza diventa |G(z)| < |eT z ||P (z)| 6 eT Re z P (|z)|, dove P un
polinomio. Questo prova (18.10).

18.5.3

Continuit della trasformata di Laplace sulle distribuzioni con supporto a destra

Il seguente risultato illustra la propriet di continuit della trasformata di Laplace sulle distribuzioni in D con supporto a destra, ovvero limn L Fn L F
se Fn F in D . In base al modo in cui stata introdotta la trasformata di Laplace di distribuzioni nella Denizione 18.5.1, per poter parlare di
continuit occorre che, per qualche c > 0, ect Fn appartengano tutte a S e
ect Fn ect F nel senso di S .
Teorema 18.5.10. Siano Fn D tali che
tutte le Fn hanno supporto nella stessa semiretta [T, +) ;
per qualche c > 0, tutte le distribuzioni ect Fn appartengano a S e
ect Fn ect F in S .
Allora L Fn (z) converge puntualmente a L F (z) per ogni z tale che Re z > c.
Dimostrazione. Poich S completo, anche ect F in S . ovvio dalla
Denizione 11.10.1 di supporto che anche F ha supporto in [T, +). Quindi
L F esiste in {Re z > c}. Sia h una funzione C a supporto in una semiretta
[T , ) che vale 1 in [T, ). Allora h() e(zc) F in S e chiaramente si
ha
L Fn (z) = hec Fn , h() e(zc) i hec F, h() e(zc) i = L F (z) .

18.5. TRASFORMATA DI LAPLACE DI DISTRIBUZIONI

18.5.4

1131

Trasformata di Laplace di distribuzioni con supporto bilateralmente illimitato

Abbiamo denito la trasformata di Laplace di funzioni con supporto a destra, ossia limitato a sinistra, e di distribuzioni a destra. Ovviamente, una
denizione analoga vale per distribuzioni con supporto limitato a destra, se si
utilizzano funzioni cut-o con supporto limitato a destra. Questa trasformata di Laplace di distribuzioni a sinistra gode di propriet analoghe di quella
a destra, ad esempio olomorfa nel semipiano sinistro {Re z < }, dove
lascissa di convergenza denita in modo analogo alla Denizione 18.1.1, ed
ivi derivabile sotto il segno di integrale, o meglio di dualit (in analogia
al Teorema 18.5.5, univocamente determinata dai valori su un segmento,
sempre in analogia allo stesso teorema, e vale lanalogo della relazione fra le
trasformate di Laplace e di Fourier (Nota 18.1.7), dei teoremi di inversione
(Teoremi 18.1.11, 18.1.12, 18.5.9) e di continuit, Teorema 18.5.10.
Ora veniamo al caso generale di una distribuzione F con supporto illimitato bilateralmente. Fissiamo T > 0 ed una funzione C g tale che g 1
in [T, +) e g 0 in (, T ], scomponiamo F come F = F + F+ , dove
F+ = gF e F = (1 g)F . Allora F+ e F sono distribuzioni a supporto in
semirette. Supponiamo che siano entrambe trasformabili secondo Laplace, e
consideriamo le loro ascisse di convergenza + e . Se e solo se + < le
trasformate di Laplace L F+ e L F sono denite in una striscia aperta comune, D := {z : + < Re z < }. In tal caso diciamo che F trasformabile
secondo Laplace, con trasformata di Laplace L F = L F+ + L F . Si noti che
+ e non dipendono dalla scelta di T n del cut-o g (per la denizione di
supporto di una distribuzione). Esse rimangono invariate anche se si sceglie
una qualunque altra decomposizione F = F1 + F2 in due distribuzioni una
a destra e laltra a sinistra, perch, in base alla loro Denizione 18.1.1, le
ascisse di convergenza dipendono solo dallandamento asintotico di F (allinnito nel caso di una distribuzione con supporto a destra e a nel caso di
supporto a sinistra). Quindi la trasformata di Laplace di una distribuzione
a supporto bilateralmente illimitato converge in una striscia D che dipende
solo da F e non dalla decomposizione scelta.
chiaro che anche in questo contesto pi generale continuano a valere lanalogo della relazione fra le trasformate di Laplace e di Fourier (Nota 18.1.7), del Teorema 18.5.5, dei teoremi di inversione (Teoremi 18.1.11,
18.1.12, 18.5.9) e di continuit (Sottosezione 18.5.3). A titolo di esempio, ci
limitiamo ad enunciare gli ultii due teoremi nel presente contesto.

1132

CAPITOLO 18. TRASFORMATA DI LAPLACE

Teorema 18.5.11. Siano Fn D con Fn = Fn+ + Fn tali che


tutte le Fn+ hanno supporto nella stessa semiretta [T+ , +) ;
tutte le Fn hanno supporto nella stessa semiretta (, T ] ;
per qualche c+ < c 0, tutte le distribuzioni ec t Fn appartengano a S
e ec t Fn ec t F in S , e le distribuzioni ec+ t Fn+ appartengano
a S e ec+ t Fn+ ec+ t F+ in S .
Allora L Fn (z) converge puntualmente a L F (z) = L F (z)+L F+ (z) per ogni
z nella striscia {c+ < Re z < c .
La dimostrazione del Teorema di inversione 18.5.9 porta ora al seguente
risultato:
Corollario 18.5.12. Sia F una funzione olomorfa nella striscia {+ <
Re z < decomponibile come F = F + F+ , dove F olomorfa nel semipiano {Re z < }, F+ olomorfa nel semipiano {Re z > + }, tali che per
qualche + < c+ < c < valgano le disuguaglianze
|F+ (z)| < eT+ Re z P+ (|z|)
per qualche polinomio P+ , per qualche T+ R e per ogni z nel semipiano
{Re z > c+ e
|F (z)| < eT Re z P (|z|)
per qualche polinomio P , per qualche T R e per ogni z nel semipiano
{Re z < c , allora F = L G per qualche G D del tipo G = G+ + G , dove
L F+ = G+ e L F = G , G+ una distribuzione con supporto in [T+ , ) e
G una distribuzione con supporto in (, T ].
Questo risultato dipende per dalla decomposizione scelta. In realt vale
un risultato pi forte che non ne dipende [26, Proposition 6]:
Teorema 18.5.13. Se F una funzione olomorfa in una striscia {+ <
Re z < } e per ogni sottostriscia {+ < c+ 6 Re z 6< c < } |F |
limitato da un polinomio (che pu dipendere dalla sottostriscia), allora F
la trasformata di Laplace bilatera di una distribuzione G D , e viceversa.

18.6. L SU D E TEOREMI DI PALEYWIENER

18.6

1133

Trasformata di Laplace di funzioni in D:


teoremi di PaleyWiener

In questa sezione presentiamo due teoremi di J.A.C. Paley e N. Wiener che


provano che, sotto appropriate stime per funzioni olomorfe in un semipiano (rispettivamente, intere), queste funzioni sono trasformate di Laplace di
funzioni L2 su una semiretta o su un compatto, rispettivamente. Questi risultati si possono pensare come estensioni a frequenze complesse del teorema di
Plancherel per la trasformata di Fourier (Corollario 8.5.2), che infatti viene
utilizzato nella dimostrazione. Presentiamo poi alcune estensioni di questi
risultati classici. Tutte le dimostrazioni sono adattate da [23, Capitolo 19] e
[25, Chapter 7].
Teorema 18.6.1. (Teorema di PaleyWiener per funzioni olomorfe
con sezioni limitate in L2 .) Sia F olomorfa nel semipiano destro tale che
Z a+i
1
sup
|F (z)|2 dz = C < .
(18.12)
a>0 2 ai
Allora F (z) = L f (2z) per una funzione a destra f L2 (R) (ossia una
funzione f L2 (0, )) e kf k22 = C.
R
Viceversa, se f L2 (0, ), allora F (z) = L f (2iz) := 0 f (t) e2zt dt
una funzione olomorfa nel semipiano destro che verifica la stima (18.12)
con C = kf k22.
Si noti che limpiego del simbolo di trasformata di Laplace nellultima formula un abuso di linguaggio, perche la funzione f s una funzione a destra
localmente L1 (visto che in L2 , e sui compatti L2 contenuto in L1 , ma
potrebbe non essere a crescita esponenziale, e neppure una distribuzione a
crescita esponenziale.
Vedremo che il fattore 2 nellenunciato conseguenza della scelta dellee quindi
sponente 2itx nella Denizione 8.2.1 di trasformata
R di Fourier,
2itx
b
dellesponente 2itx nella antitrasformata: h(x) = h(t)e
dt. Senza
questo fattore 2 allesponente, nellenunciato del teorema ora avremmo pi
semplicemente F (z) = L f (z).
Enucleiamo la parte pi laboriosa della dimostrazione come lemma separato.
Lemma 18.6.2. Per x > 0 poniamo J = [1, x] (ovviamente, intendendo di
scambiare di posto fra loro 1 e x nel caso in cui sia x < 1). Sia D := {z :

1134

CAPITOLO 18. TRASFORMATA DI LAPLACE

Re z J}. Supponiamo che valga lipotesi del Teorema 18.6.1 e che inoltre
si abbia
Z
|F (x + iy)|2 dx dy < .
(18.13)
D

Poniamo Fx (y) = F (x + iy) e f (t) = e2tx Fx (t) (qui come dabitudine Fx


denota la antitrasformata di Fourier di Fx ). Allora la funzione f non dipende
dalla scelta di x R, f (t) = 0 se t < 0 e f L1 .

Dimostrazione. Per x > 0 poniamo J = [1, x] (dove ovviamente si intende


che 1 e y si scambiano di posto nel caso in cui sia x < 1). Grazie allipotesi
{aj } e {bj } con aj + e bj tali
(18.13)
R esistono due successioni
R
che J |F (x + iaj )|2 dxR e J |F (x + ibj )|2 dx tendono a 0 quando j :
infatti, se lim inf y J |F (x + iy)|2 dx > 0, la disuguaglianza (18.13) non
sarebbe soddisfatta.
Per ogni t, y R poniamo
Z
G(y, t) = F (x + iy) e2(x+iy)t dx .
J

In base alla disuguaglianza di CauchySchwarz per L2 (J) (Proposizione 4.5.1),


abbiamo
Z
Z
Z
2
2
4tx
|G(y, t)| 6 |F (x + iy)| dx
e
dx < A |F (x + iy)|2 dx
J

(la costante A dipende da x e t). Quindi, per ogni t,


lim G(aj , t) = lim G(bj , t) = 0 .

(18.14)

Per x > 0 poniamo allora


gj (x, t) =

aj

F (x + iy) e2ity dy

bj

(si osservi che gj una approssimazione per troncamento della antitrasformata di Fourier di Fx (y) = F (x + iy)).
segue che sul bordo Cj del rettanDal teorema di Cauchy (Corollario 2.4.10)
R
golo {x J, bj 6 y 6 aj } si ha limj Cj F (z) e2tz dz = 0 per ogni t. Daltra
parte, da (18.14) sappiamo che sul bordo superiore di Cj si ha che
Z
Z
2zt
F (z) e
dz = F (x + iaj ) e2tx e2itaj dx = G(aj , t)
Cj {y=aj }

18.6. L SU D E TEOREMI DI PALEYWIENER

1135

tende a zero quando j , e lo stesso capita sul bordo inferiore {x J, y =


bj }. Pertanto per ogni t, y e per ogni x > 0 abbiamo limj (e2tx gj (y, t)
e2t gj (1, t)) = 0.
Ora osserviamo che la funzione Fx (y) = F (x + iy) in L2 (R) per lipotesi del
Teorema 18.6.1. Perci dal teorema di Plancherel (Corollario 8.5.2) segue che
limj kFx gj (y, )kL2 (R) = 0. Pertanto, per il Corollario 1.16.29, esiste una
sottosuccessione {gkj (y, t)} che converge puntualmente a Fx (t) per quasi
ogni t. Questa sottosuccessione pu ora dipendere dalla scelta di x, ma una
volta ssato x esiste una stessa sottosuccessione che verica gkj (y, t) Fx (t)
e gkj (1, t) F1 (t) per quasi ogni t. Ne segue che
f (t) := e2tx Fx (t) = e2t F1 (t)

(18.15)

per quasi ogni t e per ogni x > 0: ossia, f non dipende dalla scelta di x > 0.
Inne, dallipotesi di limitatezza L2 del Teorema 18.6.1, da (18.15) e di nuovo
dal teorema di Plancherel,
Z
Z
Z
1
2tx
2

2
e
|f (t)| dt =
|Fx (y)|2 dy < C , (18.16)
|Fx (t)| dt =
2

e da qui, facendo tendere x a +, segue che f (t) = 0 per t < 0.


h(t) = e4tx |f (t)|2
Quindi la disuguaglianza (18.16) asserisce che le funzioni
R

(t > 0) hanno norma equilimitata in L2 per x > 0: 0 e4tx |f (t)|2 dt <


C. Se ora facciamo tendere x a zero e rammentiamo che ormai t > 0,
possiamo applicare il Teorema di Convergenza Monotna 1.9.53
R per portare
il limite rispetto a x sotto il segno di integrale. Ne segue che 0 |f (t)|2 dt <
C. Poich da (18.15) abbiamo Fx (t) = f (t) e2tx , dalla disuguaglianza di
CauchySchwarz per L2 (R) (Proposizione 4.5.1) segue che, per ogni x > 0,
Z

|Fx (t)| dt 6

Z

 21 Z
|f (t)| dt
2

4tx

 21
dt
< .

Quindi Fx una funzione L1 per ogni x > 0.

Dimostrazione del Teorema 18.6.1. Per x > 0 scriviamo J = [1, x] nel senso
chiarito nella dimostrazione del Lemma 18.6.2. Sia m(J) = |x 1| la lunghezza dellintervallo J. Poich lintegrando non negativo, dal Teorema di

1136

CAPITOLO 18. TRASFORMATA DI LAPLACE

Fubini 1.20.4 (i) e dallipotesi di limitatezza L2 fatta su F segue


Z Z
1
|F (x + iy)|2 dx dy 6 Cm(J) ,
2 J
R
ossia soddisfatta lipotesi del Lemma 18.6.2: D |F |2 dx dy < . Pertanto,
essendo x > 0, in base a tale Lemma sappiamo che la funzione f (t) =
e2tx Fx (t) non dipende da x, appartiene a L1 ed ha supporto in {t > 0}.
In base al Teorema di inversione di Fourier 8.4.2 possiamo scrivere
Z
Z

2ity
F (z) = Fx (y) =
Fx (t)e
dt =
Fx (t)e2ity dt .

Grazie a (18.15) questa identit diventa


Z
F (z) =
f (t) e2tx e2ity dt = L f (2z) .
0

La seconda parte dellenunciato elementare. Dimostriamo per prima


cosa che che la trasformata di Laplace di una funzione f L2 (0, )
esiste ed olomorfa nel semipiano destro (come avevamo preannunciato
nella Nota 18.1.9). Osserviamo anzitutto che, in base alla disuguaglianza di Cauchy-Schwarz
(Proposizione 4.5.1) in L2 , la trasformata di LaR
place L(z) = 0 f (t) etz dt esiste nel semipiano H := Re z > 0, perch
R

R
R 2t Re z
zt 2
2

6
f
(t)
e
dt
|f
(t)|
dt
e
dt. Inoltre, z e w appartengono
0
0
0
al semipiano destro H, sia > 0 tale che Re z e Re w sono maggiori di . In
tal caso, per ogni t > 0 la funzione A(z, w) := |etz etw |2 verica
A(z, w) = etz etz + etw etw etz etw + etw etz

= e2t Re z + e2t Re w et(z+w)


et(z +w) 6 4e2t ,

e quindi, se Re zn > e zn z, segue dal Teorema di Convergenza Dominata


(Teorema 1.9.54) che
Z
lim A(zn , z) = lim
|etzn etz |2 dt = 0 .
n

Quindi, di nuovo per la disuguaglianza di Cauchy-Schwarz,


Z
2


n
2
tz
tz
|L(zn ) L(z)| =
f (t) (e n e ) dt 6 kf k22 A(zn , z) 0 .
0

18.6. L SU D E TEOREMI DI PALEYWIENER

1137

Pertanto L continua in H. Integriamo i valori di L lungo una curva chiusa


di classe C 1 contenuta in H. Abbiamo dimostrato che, nellintegrale doppio
Z
Z Z
L(z) dz =
f (t) etz dtdz

lintegrando continuo: pertanto, per il Teorema di Fubini (parte (ii) del


Teorema 1.20.4), possiamo scambiare lordine di integrazione. Poich etz
una funzione intera
per ogni t, in base al Teorema di Cauchy (Corollario
R tz
2.4.10) abbiamo e dz = 0 e quindi
Z
Z
Z
L(z) dz =
f (t) etz dzdt = 0 .
(18.17)

Allora L olomorfa nel semipiano H per il Teorema di Morera (Corollario


2.5.6).
Inne,
per provare la disuguaglianza (18.12), basta porre F (z) = L f (2z) :=
R
f
(t)
e2tz dt ed osservare che
0
Z
F (x + iy) =
f (t) e2xt e2iyt dt .
0

Infatti a questo punto, in base al Teorema di Plancherel (Corollario 8.5.2),


Z
Z
Z
2
2 2tx
|F (x + iy)| dy =
|f (t)| e
dt 6
|f (t)|2 dt = C 2 .

Teorema 18.6.3. (Teorema di PaleyWiener per funzioni intere a


crescita esponenziale con una sezione in L2 .) Sia F una funzione
intera a crescita esponenziale, ossia tale che, per qualche A, C > 0,
|F (z)| < CeA|z| .

(18.18)

Se la restrizione di F allasse immaginario, F |iR appartiene a L2 , allora


F (z) = L f (2z)

(18.19)

per una funzione f L2 [A/2, A/2].


Viceversa, se f L2 [A, A], allora la sua trasformata di Laplace L f (2z)
intera a crescita esponenziale, e la sua restrizione allasse immaginario
in L2 (R).

1138

CAPITOLO 18. TRASFORMATA DI LAPLACE

Di nuovo, enucleiamo la parte pi laboriosa della dimostrazione come


lemma separato.
Lemma 18.6.4. Sia F come nel Teorema 18.6.3, e per > 0 poniamo
F (y) = F (iy)e|y| .
c verifica
Allora la trasformata di Fourier F

lim c
F (t) = 0

0+

per ogni |t| > A/2.


Dimostrazione. Poniamo

+ (w) =

F (iy) eiwy dy

(w) =

F (iy) eiwy dy

rispettivamente nei semipiani {Im w > 0} e {Im w < 0}. Osserviamo che
gli integrali che deniscono le funzioni + e sono convergenti, perch per
lipotesi del teorema la funzione y 7 F (iy) in L2 , e = (F (i), eiw )L2 ,
e la funzione y 7 eiwy in L2 (R+ ) se Im w > 0 e in L2 (R ) se Im w <
0. Dallo stesso argomento basato sui teoremi di Fubini, Cauchy e Morera
che abbiamo usato prima della uguaglianza (18.17) ora segue di nuovo che
le funzioni + e sono olomorfe nei rispettivi semipiani di denizione,
{Im w > 0} e {Im w < 0}. (Si osservi che dalla disuguaglianza (18.18)
seguirebbe invece una condizione di convergenza pi debole, perch in base
ad essa gli integrandi si maggiorerebbero con CeAy ey| Im w| e gli integrali
risulterebbero convergenti rispettivamente in {Im w > A} e {Im w < A}).
immediato che
Z
Z
ity
c
F (t) =
F (y) e
dy =
F (iy)e|y| eity dy = + (t+i) (ti) .

(18.20)
Per dimostrare lenunciato dobbiamo mostrare che, se |t| > A, lultimo membro tende a zero quando 0+ . Per questo, mostriamo per prima cosa che
le funzioni sono le restrizioni ai rispettivi semipiani di denizione della
stessa funzione olomorfa. A questo scopo basta costruire una famiglia di

18.6. L SU D E TEOREMI DI PALEYWIENER

1139

funzioni , ciascuna olomorfa nel semipiano = {Re (wei ) > A}, tali che
/2 , e con la propriet che le funzioni e coincidono nellintersezione dei loro due rispettivi semipiani (questo un esempio di prolungamento
analitico: si veda [23, Ch. 16]). La costruzione di queste funzioni si fa nel
modo seguente.
Consideriamo le semirette (s) = sei , s > 0, e deniamo una famiglia di
funzioni
Z
Z
i
wz
i
F (z) e
dz = e
F (sei ) ewse ds .
(18.21)
(z) =

Come gi notato pi sopra per le funzioni , la stima (18.18) implica che


i
lintegrando di in (18.21) maggiorato da Ce(Re (we )A)s , e quindi, ancora una volta, lo stesso ragionamento basato sui teoremi di Fubini, Cauchy
e Morera che abbiamo usato prima della uguaglianza (18.17) implica che
olomorfa nel semipiano = {w : Re (wei ) > A}. Al variare di questi semipiani si intersecano: ora asseriamo la seguente Asserzione: in in le
funzioni e coincidono. Una volta provata questa asserzione, tutte queste funzioni sono restrizioni ai corrispondenti semipiani della stessa funzione
olomorfa, in base al Corollario 2.6.2. Ora osserviamo che le funzioni + e
sono denite rispettivamente nei semipiani superiore ed inferiore, ed in particolare la prima denita sulla retta {z = t+i, t R} e la seconda sulla retta
{z = tii, t R}. Invece la funzione 0 denita in un traslato del semipiano destro, e precisamente in 0 = {z = (t, y) : t > A}, mentre denita
nel semipiano sinistro traslato di A, ossia = {z = (t, y) : t < A}.
Allora, in (18.20) possiamo rimpiazzare per t > A la funzione + con 0 , e
per t < A rimpiazziamo la funzione con . evidente che, per t > A,
lim 0 (t + i) 0 (t i) = 0

0+

semplicemente perch la funzione olomorfa 0 continua in questo semipiano.


Analogo risultato vale per la funzione nel semipiano {(t, y) : t < A}, e
quindi anche il tal caso il limite zero. Ne segue che il secondo membro di
(18.20) tende a zero con , ossia lenunciato.
Resta dunque da provare lasserzione, e lo facciamo ora. Il vettore normale
del semipiano il vettore nel piano complesso dato da ei : perch i
semipiani e si intersechino, bisogna e basta che gli angoli e non
siano opposti, ossia, senza perdita di generalit, 0 < < . Sia langolo

1140

CAPITOLO 18. TRASFORMATA DI LAPLACE

dato dalla bisettrice dei due vettori normali, ovvero


=

+
.
2

Consideriamo la semiretta uscente dallorigine in direzione , ossia =


{w = |w|ei }. chiaro che i punti alla stessa distanza dallorigine nelle
semirette normali e b eta hanno la stessa proiezione sulla loro bisettrice ,
o equivalentemente, ruotando il piano di , in maniera che le semirette
e b eta abbiano per bisettrice il semiasse x positivo, per ogni w sul semiasse
opposto ai semipiani,
= {w = |w|ei } ,
(18.22)
si ha
i

i()

Re (we ) = |w| Re e

= |w| cos
2

= Re (wei )

Questo signica che, per tutti i w sul semiasse in (18.22), w se (e


solo se)



.
(18.23)
|w| > A/ cos
2
In altre parole, il secondo membro in questa disuguaglianza la distanza
dallorigine del punto di intersezione delle rette di bordo dei due semipiani.
Ora consideriamo, per r > 0 grande, il settore circolare con lati B :=
{sei : 0 6 s 6 r}, B := {sei : 0 6 s 6 r}, e larco di cerchio
C := {reit : < t < }; chiamiamo T la curva di bordo di questo settore circolare. Fissiamo lattenzione ai w nel semiasse introdotto in (18.22)
ed appartenenti allintersezione , ossia che vericano la disuguaglianza
(18.23)). Osserviamo che, se z C, allora


Re (wz) = |w|r cos(t ) 6 |w|r cos


2

(18.24)

(dopotutto, ( )/2 lampiezza angolare del settore circolare, e la direzione della sua bisettrice!).
Ora riportiamo lattenzione ad un integrale del
ma sul
R tipo dellenunciato,
wz
bordo T del settore circolare: esplicitamente, T F (z) e
dz. Lintegrando
olomorfo perch w appartiene ai semipiani di olomora, e quindi il Teorema
di Cauchy assicura che lintegrale valga zero. Consideriamo allora lintegrale

18.6. L SU D E TEOREMI DI PALEYWIENER

1141

R
sulla porzione di T data dallarco di cerchio C, ossia C F (z) ewz dz. In base
alle disuguaglianze (18.24) e (18.18), lintegrando maggiorato da

Ce(A|w| cos( 2 ))r .

Pertanto, a causa di (18.23), lesponente negativo e lintegrale tende a zero


quando r . Pertanto
Z
Z
wz
F (z) e
dz =
(w) =
F (z) ewz dz = (w)
B

per ogni w nel semiasse centrale dei due semipiani e introdotto in


(18.22) e che appartiene ai due semipiani (ossia che verica (18.23). Allora,
in base al Corollario 2.6.2, le due funzioni olomorfe e coincidono nellintersezione dei rispettivi semipiani di denizione: questo prova lasserzione, e
quindi il Lemma.

Dimostrazione del Teorema 18.6.3. Consideriamo la restrizione di F allasse


immaginario, ed indichiamola con H: ossia, H(y) = F (iy). Osserviamo che
H L2 (R) per lipotesi del teorema, e (F H)(y) = H(y)(e|y| 1): quindi
lim0+ kF Hk2 = 0 per il Teorema di Convergenza Dominata (Teorema
1.9.54). Per il Teorema di Plancherel (Corollario 8.5.2), c
F converge alla fun2
b
zione f := H nella norma di L , e quindi puntualmente quasi ovunque. Ora,
per il Lemma 18.6.4, la funzione f ha supporto in [A/2, A/2]. Quindi,
dalla formula di inversione di Fourier (Teorema 8.4.2),
Z A
2
F (iy) = H(y) =
f (t)e2iyt dt
A
2

per quasi ogni y R. Questo dimostra lidentit 18.19 per z = iy puramente


immaginario: ma poich entrambi i membri sono funzioni intere, lidentit
vale per ogni z complesso (di nuovo per il Corollario 2.6.2).
Per dimostrare il viceversa, si noti che la funzione f , essendo a supporto
compatto, a crescita esponenziale con esponente di crescita (Denizione 18.1.4): pertanto la sua trasformata di Laplace una funzione intera in
base al Corollario 18.1.6. Inoltre,
Z
Z
A/2

A/2


|Lapf (2z)| =
f (t) e2tz dt 6
|f (t)| e2t Re z dt
A/2

A/2
6 CeA| Re z| 6 CeA|z|

1142
dove C =

CAPITOLO 18. TRASFORMATA DI LAPLACE


R A/2

|f (t)| dt < perch L2 [A/2, A/2] L2 [A/2, A/2].


R A/2
Inne, la restrizione A/2 f (t) e2it Im z dt di L f (2z) allasse immaginario in L2 perch lo f , in base al Teorema di Plancherel (Corollario 8.5.2).

A/2

Capitolo 19
La trasformata zeta
Lo sviluppo di questo capitolo si ispira a [10], [33].
Abbiamo visto nei Corollari 13.1.5 e 12.2.2 che la trasformata di Fourier
di una successione discreta equispaziata di impulsi (ossia di delta di Dirac)
una funzione periodica, e viceversa. Pertanto, la trasformata di Fourier di
un segnale che consiste in una successione equispaziata di impulsi una serie
di Fourier.
Rendiamo pi precisa questa asserzione. Consideriamo un segnale puramente impulsivo a impulsi equispaziati, ossia una distribuzione del tipo f =
P

n= cn n . In base alla parte (i) dellEsercizio 11.12.2, la sua trasformata


di Fourier (nel senso delle distribuzioni) la serie trigonometrica
() := fb() =

cn e2in

(19.1)

n=

(e quindi, per la invertibilit della trasformata di Fourier sullo spazio S


b = f nel senso delle distribuzioni, ed i coecienti di
(Proposizione 11.11.4),
Fourier {cn } della funzione periodica coincidono con fb(n), a conferma della
Proposizione 10.2.3). In questo senso la trasformata di Fourier del segnale
impulsivo f una serie di Fourier (con coecienti di Fourier dati dai valori
del segnale).
Nel Capitolo 18 abbiamo introdotto e studiato una complessicazione della
trasformata di Fourier, nel quale viene complessicata la frequenza , originariamente reale. Ora, nel caso di segnali impulsivi, complessichiamo la
serie di Fourier allultimo membro di (19.1) sostituendo al numero complesso
di modulo 1 e2i un numero complesso generico z.
1143

1144

19.1

CAPITOLO 19. TRASFORMATA ZETA

Trasformata zeta e sue propriet

Pi precisamente, lestensione complessa appena annunciata data dalla


seguente denizione.
Definizione 19.1.1. (Trasformata zeta.) Per ogni successione {cn , n
N}, poniamo
1
r = lim sup |cn | n .
n+

Se r < , diciamo che {cn } zeta-ammissibile a destra ed in tal caso deniamo la trasformata zeta (unilatera) della successione {cn } come la serie di
Laurent

X
cn z n
n=0

che converge ad una funzione olomorfa nella corona circolare {|z| > r}, in
base ad un ovvio adattamento (che rimpiazza z con 1/z) dei Teoremi 1.4.2
e 1.4.9 sul dominio di convergenza e la derivabilit termine a termine delle
serie di potenze.
Pi in generale, per ogni successione bilatera {cn , n Z}, poniamo
R=

1
1

lim inf n |cn | n

Se r < R, diciamo che la successione {cn } zeta-ammissibile ed in tal caso


deniamoPla trasformata zeta bilatera della successione {cn } come la serie di
n
. Osserviamo che, per una applicazione immediata dei
Laurent
n=0 cn z
teoremi citati prima, questa serie converge ad una funzione olomorfa nella
corona {r < |z| < R}, che chiamiamo la corona di convergenza. Il fatto che
le serie di Laurent convergano in corone circolari era stato gi mostrato nel
Corollario 2.9.2.
Notazione 19.1.2. Per evitare confusione nei casi in cui si trattano successioni di segnali impulsivi, ossia successione di successioni, in questo capitolo
scriviamo i segnali impulsivi come funzioni c : n 7 cn . Pertanto, nei casi in
cui ci sia ambiguit, scriviamo c(n) invece che cn . Ad esempio, la successione
che vale 1 allindice n e zero altrove, ovvero listogramma della delta di Dirac
n ((nel senso della Notazione 13.1.3)), viene indicato con n : quindi n (m)
il consueto simbolo di Kronecker nm = 1 se n = m e nm = 0 altrimenti.

19.1. TRASFORMATA ZETA E SUE PROPRIET

1145

La trasformata zeta di c viene indicata con Z(c). Laddove si voglia distinguere fra la trasformata zeta bilatera ed il suo caso particolare unilatero, la
trasformata unilatera viene indicata con Z + . Talvolta i segnali {an } nulli per
n < 0 si chiamano causali (in analogia alla Denizione 17.1.7 di ltro causale) e Z + si chiama la trasformata zeta causale. Pi in generale, chiamiamo
segnali causali i segnali che sono non nulli solo per indici maggiori o uguali
ad un primo indice m0 , anche se m0 < 0 (in tal caso, la trasformata zeta
dierisce solo per un addendo polinomiale di grado m0 da una trasformata
causale nel senso precedente pi restrittivo).
Analogamente, a volte usiamo notazioni dierenti per distinguere fra una
successione bilatera ed il suo troncamento unilatero. Ad esempio, denotiamo
con 1 il segnale che vale costantemente 1 per n Z, e con 1+ il segnale che
vale sempre 1 per n N. A volte, questultimo segnale si intende esteso a
n Z nella maniera naturale, ossia ponendolo uguale a 0 per gli indici n
negativi. Data una successione a = {an }, indicheremo con a1+ , o talora
anche con an 1+ , il suo troncamento agli indici positivi {an }n>0.
Nota 19.1.3. Si osservi che una trasformata zeta la trasformata zeta di un
segnale causale se e solo se essa converge in una corona illimitata {|z| > R}.

Nota 19.1.4. La seguente relazione fra le trasformate zeta bilatere ed unilatere


immediata: Z + (c) = Z(c+ ).

Esempio 19.1.5. (Esempi elementari di trasformata zeta.)


terminologia della Notazione 19.1.2,

Con la

(i)
Z(n ) = z n

nella corona consistente del piano complesso bucato C \ {0} (e se n < 0


in tutto C;
(ii)
+

Z(1+ ) = Z (1) =

+
X

z n =

n=0

1
1

1
z

z
z1

nella corona {|1/z| < 1}, ossia {|z| > 1}.


(iii) Il segnale bilatero 1 non zeta-ammissibile, sebbene, come visto al
punto (ii), sia zeta-ammissibile a destra.

1146

CAPITOLO 19. TRASFORMATA ZETA

Quasi tutte le propriet elencate nel seguente teorema discendono da


applicazioni immediate della Denizione 19.1.1 di trasformata zeta, e vengono
lasciate per esercizio al lettore (la propriet di derivazione (v) richiede il
Teorema 1.4.9 di derivazione per serie, nonch lovvia osservazione che la
funzione z 7 1/z derivabile per ogni z 6= 0).
Teorema 19.1.6. (Propriet elementari della trasformata zeta.) Le
trasformate zeta Z e Z + sono lineari sullo spazio delle successioni rispettivamente zeta-ammissibili e zeta-ammissibili a destra. La trasformata zeta
bilatera verifica le seguenti propriet:
(i) Traslazione: per ogni segnale z-ammissibile c ed ogni k Z, il traslato
c(k) := k c (ossia, c(k) (n) = cnk ) zeta-ammissibile con la stessa
corona di convergenza, ed in tale corona si ha
Z(c(k) )(z) = z k Z(c)(z) .
Nel caso della trasformata zeta unilatera Z + invece, per ogni segnale
z-ammissibile a destra c : Z C e per ogni k N, il traslato c(k) :=
k c (ossia, c(k) (n) = cn+k ) zeta-ammissibile a destra con la stessa
corona di convergenza, e per ogni k > 0 in tale corona si ha:
(i.a)
Z + (c(k) )(z) :=

+
X
n=0

cn+k z n = z k Z(c)(z)

k1
X

cm z km ;

m=0

(i.b)
+

(k)

Z (c

)(z) :=

+
X
n=0

cnk z

=z

Z(c)(z) +

k
X

m=1

cm z mk ;

(i.c) invece i segnali z-ammissibili a destra causali c+ , ossia i segnali


c : N C si possono identificare con segnali su Z con valori

19.1. TRASFORMATA ZETA E SUE PROPRIET

1147

nulli per gli indici negativi, ed allora lidentit (a) rimane valida,
mentre nellidentit (b) si ha
+

(k)

Z (c

)(z) :=

+
X
n=k

cnk z n = z k Z(c)(z)

perch i termini aggiuntivi in (b) sono nulli.


(ii) Dilatazione: per ogni segnale zeta-ammissibile c con corona di convergenza {r < |z| < R} ed ogni a 6= 0, il dilatato an c[a] := {an cn }
zeta-ammissibile, la sua corona di convergenza la corona dilatata
{r < |z/a| < R} ed ivi la sua trasformata zeta vale
Z(c[a] )(z) = Z(c)(z/a) .
(iii) Parit: per ogni segnale z-ammissibile c con corona di convergenza {r <
|z| < R}, il segnale speculare c dato da cn := cn zeta-ammissibile
con corona di convergenza {1/R < |z| < 1/r}, ed ivi la sua trasformata
zeta vale
Z(c )(z) = Z(c)(1/z) .
(iv) Coniugazione: per ogni segnale z-ammissibile c con corona di convergenza {r < |z| < R}, il segnale complesso coniugato c definito da
c(n) = c(n) zeta-ammissibile con la stessa corona di convergenza, ed
in tale corona si ha
Z(c)(z) = Z(c)(z) .
(v) Derivazione nella variabile zeta: per ogni segnale z-ammissibile c con
corona di convergenza {r < |z| < R}, il segnale d(n) = n c(n) zetaammissibile con la stessa corona di convergenza, ed in tale corona la
sua trasformata zeta vale
Z(d)(z) = z Dz Z(c)(z) .
(vi) Parte reale ed immaginaria: per ogni segnale zeta-ammissibile c con
corona di convergenza {r < |z| < R}, i segnali Re c e Im c sono zetaammissibili, le loro trasformate zeta convergono nella stessa corona di

1148

CAPITOLO 19. TRASFORMATA ZETA


convergenza, e si ha
Z(Re c) =

Z(c)(z) + Z(c)(z)
2

Z(Im c) =

Z(c)(z) Z(c)(z)
.
2i

(vii) Valore nale: sia f = Z(c) una trasformata zeta convergente nella
corona C = {z : r < |z| < R}. Se r < 1, allora limn+ cn = 0.
(viii) Valore iniziale: sia f la trasformata zeta di un segnale causale c (non
solo strettamente causale: un segnale con solo un numero finito di termini non nulli con indici negativi), quindi convergente nella corona C
data dallesterno di un disco, C = {|z| > r}. Allora esiste un solo
m Z tale che a := limz z m f (z) esiste finito e non nullo: questo
m il primo (ossia pi piccolo) indice tale che cn 6= 0, e si ha cm = a.
Tutte le precedenti propriet valgono anche per la trasformata zeta unilatera Z + (con le modifiche (i.a), (i.b) e (i.c) sopra elencate per la propriet
di traslazione). Si osservi per che, per la trqaslazione, le formule nel caso
unilatero (e nel caso unilatero e causale) coinvolgono un certo numero di dati
iniziali.

Dimostrazione. Le uniche due propriet non ovvie sono la (vii) (valore finale)
e la (viii) (valore iniziale). Per dimostrare la (vii), basta rammentare che
r = lim supn+ |cn |1/n . Per ipotesi, r < 1. Scegliamo > 0 cos piccolo che
si abbia r + < 1. Per le propriet del massimo limite (Sezione 1.1) abbiamo
allora |cn |1/n < r + denitivamente, ossia |cn | < (r + )1/n 0.
P
Per la (viii), basta osservare che f una serie di Laurent f (z) = n>N cn z n
convergente in C: pertanto limz z N f (z) = cN , mentre limz z k f (z) = 0
per ogni k < n.

Definizione 19.1.7. Data una successione c = {cn } (qui n Z oppure


anche solo n N), introduciamo loperatore di dierenza (pi precisamente
loperatore di dierenza in avanti, lanalogo discreto della derivata destra):
D (1) (c) = {cn+1 cn }
Iterando, introduciamo per ricorrenza loperatore di dierenza di ordine n:
D (n) c = {D (n1) D (1) (c) = D (n1) {cn+1 }D (n1) {cn } = D (n1) 1 cD (n1) c .

19.1. TRASFORMATA ZETA E SUE PROPRIET

1149

Ad esempio, D (2) {cn } = {(cn+2 cn+1 ) (cn+1 cn )} = {cn+2 2cn+1 cn }


la discretizzazione della derivata seconda.
Lazione della trasformata zeta sulloperatore di dierenza del primo ordine segue immediatamente dalla propriet di traslazione (parte (i) del precedente Teorema 19.1.6). Il caso delle dierenze di ordine n si ricava da
questo per induzione. Formule simili, ma dipendenti dai dati iniziali, valgono per la trasformata unilatera ed i segnali causali (grazie alla Nota 19.1.4, il
fatto di aver limitato lattenzione a dierenze in avanti implica Z + D (1) c =
Z D (1) c+ , dove, come sempre, c+ il troncamento di c agli indici non negativi). I dettagli, enunciati nel prossimo corollario, sono lasciati al lettore per
esercizio.
Corollario 19.1.8.
Z(D (1) c) = (z 1) Z(D (1) c)(z)

Z(D (n) c) = (z 1)n Z(D (1) c)(z)

Z + (D (1) c) = Z D (1) c+ = (z 1) Z(D (1) c)(z) zc0


+

Z (D

(n)

c) = Z D

(n)

(1)

c+ = (z 1) Z(D c)(z) z

n1
X

m=0

(z 1)nm1 D (m) c(0) ,

dove D (m) c(0) il valore iniziale (ossia allindice 0) della differenza di ordine
m della successione c, e D (0) c(0) = c0 .
Esempio 19.1.9. Scriviamo nuovamente 1+ la successione che vale 1 per ogni
n > 0 e zero altrimenti. Allora il riesso speculare 1+ la successione
che vale 1 per ogni n 6 0 e zero altrove, e poniamo 1 = 1 1+ , ossia
1 (n) = 1+ (n 1), la successione che vale 1 se n < 0 e 0 altrimenti.
Allora, in base alle parti (iii) e (i) del Teorema 19.1.6 ed alla parte (iii) e
(iii) dellEsempio 19.1.5,
Z(1+ )(z) = Z(1+ )(1/z) =
z
Z(1 )(z) =
1z

1
z
1
z

1
1z

in {|z| > 1}

(19.2)
(19.3)

in {|z| < 1} .

z
Pertanto Z(1 )(z) = z1
= Z(1+ ): le trasformate zeta di queste due
successioni hanno s la stessa espressione meromorfa, ma in due corone diverse

1150

CAPITOLO 19. TRASFORMATA ZETA

(e complementari), la prima in {|z| < 1} e la seconda in {|z| < 1}.


Naturalmente, il calcolo di Z(1 ) poteva essere fatto direttamente:
Z(1 )(z) =

1
X

n=

zn =

n=1

e la serie converge in {|z| < 1}.

z
,
1z

Nota 19.1.10. (Linversa di Z dipende anche dalla scelta della corona


di convergenza.) Questo esempio mostra che qualunque enunciato che miri
a formulare linversione della trasformata zeta deve considerare la trasformata
non solo come una espressione meromorfa, bens come la coppia costituita da
tale espressione e dalla sua corona di convergenza, anche quando lespressione
z
di questo
ha senso in un dominio pi ampio (la funzione meromorfa z1
esempio denibile in C \ {1}). Risulta ora chiaro che la trasformata zeta
ha ununica inversa solo una volta ssata la regione di convergenza: lunicit
verr dimostrata nel Teorema 19.2.2.

Esempio 19.1.11. (Trasformata zeta di esponenziale.) Pi in generaogni a R, la trasformata zeta della successione
le rispetto a (19.2), per
P
n
{a , n = 0, 1, 2, . . . } n=0 an z n = z/(z a) = 1/(1 az 1 ), convergente
in {|z| > a}, in coerenza con la parte (ii) del Teorema 19.1.6 (con la notazione ivi stabilita, si tratta della trasformata della successione an 1+ ). Lo stesso
risultato vale per ogni a C nella corona {|z| > |a|}.

Esempio 19.1.12. (Derivata di trasformata zeta di esponenziale.) Derivando m volte lespressione nel precedente Esempio 19.1.11, ed applicando la propriet di derivazione (parte (v) del Teorema
 nm +19.1.6), ricaviamo la
n
trasformata zeta della successione hn : n 7 m a
1 (n), che vale
h(z) =

z
(z a)m+1

(19.4)

nella corona |z| > |a|. Ad esempio, la trasformata zeta della successione
cn = 0 per n 6 0, cn = nan1 per n > 1 la funzione z/(z a)2 nella corona
|z| > a.
In eetti, questo risultato si pu vericare con un calcolo diretto, anche senza
ricorrere alla propriet di derivazione. Ad esempio, per m = 1, consideriamo

19.1. TRASFORMATA ZETA E SUE PROPRIET

1151

le successioni
cn = an
dn = nan
hn = nan1

(n > 0)
(n > 0)
(n > 0) .

P
n
Allora, P
nella corona {|z| > |a|},
tra
le
trasformate
zeta
f
(z)
=
,
n>0 cn z
P
g(z) = n>0 dn z n e h(z) = n>0 hn z n valgono le relazioni
z
f (z) =
za
X
X
X
g(z) =
nan z n = a
nan1 z n = aDa
an z n
n>0

= aDa

n>0

n>0

z
az
=
= azf (z)
za
(z a)2

1
z
h(z) = g(z) =
= zf (z)
a
(z a)2

e quindi sono vericate sia la propriet di derivazione g(z) = zf (z) della


parte (v) del Teorema 19.1.6, sia la relazione h(z) = z/(z a)2 annunciata
in (19.4).
Nella linea dellEsempio 19.1.11, da questo calcolo si ricava anche la trasforn
mata zeta di n 7 m
anm 1+ (n 1), che vale ancora z/(z a)m+1 , ma
adesso nel disco {|z| < |a|}.

Osserviamo anche il seguente fatto ovvio:


P
Corollario 19.1.13. La serie numerica
n=0 cn converge se e solo se tutti i
poli della sua trasformata zeta (unilatera) hanno modulo strettamente minore
di 1.

Dimostrazione. Scriviamo, come sempre, c := {cn}. La trasformata zeta


Z(c) una serie di potenze nella variabili 1/z, e quindi converge in un disco
con centro lorigine in questa variabile, il cui raggio esattamente il valore
1/ del modulo del polo pi vicino allorigine. Passando ai reciproci, ossia alla
variabile z, vediamo che Z(c) converge per tutti gli z tali che |z| maggiore
del modulo del polo pi lontano dallorigine.
Pertanto, se la trasformata
P
zeta converge a z = 1 (ossia se la serie
c
converge)
deve essere < 1.
n=0 n
Viceversa, se < 1, allora la trasformata zeta converge al punto z = 1, e
quindi la serie nellenunciato converge.

1152

19.2

CAPITOLO 19. TRASFORMATA ZETA

Inversione della trasformata zeta

Poich la trasformata zeta di una successione c = {cn } lo sviluppo di


Laurent i cui coecienti sono i cn , per varie funzioni olomorfe in una corona
conosciamo la antitraformata zeta senza bisogno di una formula di inversione,
ma semplicemente grazie alla conoscenza di sviluppi di Laurent tipici.
Esempio 19.2.1. Sia f (z) = e1/z , olomorfa nel dominio {|z| > 0}. La trasformata zeta inversa di f la successione {cn = 1/n!, n N}, dal momento che
lo sviluppo di Taylor della funzione esponenziale assicura che
Z(c)(z) =

X
1
1 1
z .
=
e
n! z n
n=0

Lunicit dello sviluppo di Laurent di una funzione olomorfa in una corona


(Teorema 2.9.3), ed in particolare lespressione (2.27) dei coecienti di Laurent, portano immediatamente ad una formula di inversione della trasformata
zeta bilatera, enunciata nel prossimo teorema.
Teorema 19.2.2. (Formula di inversione per la trasformata zeta.)
Sia f una funzione olomorfa in una corona circolare C C con centro
lorigine, e r una curva semplice chiusa con immagine in C, percorsa in
senso antiorario, con indice di avvolgimento 1 intorno allorigine. Allora
f = Z(c), dove, per ogni n Z,
Z
1
cn =
f (z) z n1 dz .
(19.5)
2i r

In particolare, se f ha solo singolarit polari {zi }, dal Teorema dei Residui


2.10.5 segue
X
cn =
Resz=zi f (z) z n1 .
(19.6)
zi interni a r

Quindi, nella suddetta corona circolare, la trasformata zeta ha ununica inversa (cambiando regione di convergenza per cambia linversa, come visto
nella Nota 19.1.10).
Esempio 19.2.3. Siano a, b, c tre numeri complessi diversi fra loro e diversi
da 0, e
z(z a)
.
f (z) =
(z b)(z c)

19.2. INVERSIONE DELLA TRASFORMATA ZETA

1153

La funzione f una funzione razionale (rapporto fra due polinomi, f = p/q),


ed olomorfa nella corona C = {|z| > max{|b|, |c|}}; ha poli semplici nei
punti z1 = b e z2 = c. Il residuo in questi due punti di f , e pi in generale di
f (z) z n1 per n > 0, si ottiene quindi dalla formula nella Nota 2.10.2:
Resz=zi f (z) z n1 = lim (z zi ) f (z) z n1 =
zzi

p(zi ) n1
z
.
q (zi ) i

(19.7)

Da questa identit e da (19.6) si ottiene, per n > 0,


cn = Resz=b
=

(z a)z n
(z a)z n
+ Resz=c
(z b)(z c)
(z b)(z c)

ba n ca n
b +
c .
bc
cb

Visto che n > 0, o, equivalentemente, che la corona di convergenza lesterno di un disco, da questo calcolo si ottiene precisamente linversione della
trasformata zeta unilatera Z + , ossia linversione causale.
(za)z n
ha un ulteriore polo al
Invece, per n < 0, la funzione f (z) z n1 = (zb)(zc)
punto z0 = 0, di ordine |n| (quindi semplice solo per n = 1). In questo
caso i residui si calcolano mediante la formula della Proposizione 2.10.4, che
riportiamo qui per comodit del lettore: per un polo di molteplicit k al
punto z0 si ha
Resz=z0 f (z) z n1 =


1
lim D (k1) (z z0 )k f (z) z n1 .
(k 1)! zz0

Visto che qui z0 = 0 e k = |n| otteniamo


Resz=0 f (z) z n1 =

1
lim D (|n|1) (f (z)/z) .
(|n| 1)! z0

Qui f (z)/z = (z a)/((z c)(z d)): il calcolo pu essere svolto tramite


valutazioni successive della derivata, e viene lasciato al lettore per esercizio.

Esercizio 19.2.4. Applicando il metodo illustrato nellEsempio 19.2.3, si mostri che linversione della trasformata zeta causale della funzione
(i)
g(z) =

z1
(z + 1)(z 1/2)

1154

CAPITOLO 19. TRASFORMATA ZETA


nella corona {|z| > 1} data dalla successione c0 = 0 e, per n > 1,
cn =

1
4
(1)n1 (1/2)n1 ,
3
3

mentre quello della funzione


(ii)
h(z) =

(z 1)3
z(z + 1)(z 1/2)

nella stessa corona dato da c0 = 1, c1 = 7/2 e, per n > 2,


cn =

1
16
(1)n2
(1/2)n2 .
3
12

Esempio 19.2.5. (Inversione della trasformata zeta tramite sviluppo


in serie di Laurent.) In questo esempio mostriamo come trovare la trasformata zeta inversa di una funzione f sviluppando f in serie di Laurent.
Linverso, naturalmente, dipende dalla corona in cui si viene sviluppata f in
serie convergente.
Siano m Z e a C, e
zm
f (z) =
.
za
La funzione f ha una singolarit polare a z = a: sviluppiamola in serie di
Laurent nelle due regioni anulari C := {|z| < |a|} e C+ := {|z| > |a|}.
Grazie alla formula di somma geometrica, nella regione C+ si ha
1
1 1
=
za
z 1

a
z

e quindi, in C+ vale lo sviluppo in serie

1 X an
z n=0 z n

X
an
zm
m1
=z
.
za
zn
n=0

Invece, in C possiamo utilizzare lanalogo sviluppo convergente


1
1 1
=
za
a 1

z
a

1 X zn
=
a n=0 an

(19.8)

19.2. INVERSIONE DELLA TRASFORMATA ZETA


da cui, in C ,

1155

zm
zm X zn
=
.
za
a n=0 an

Esaminando questi due sviluppi di Laurent (nelle rispettive corone), si vede


che, in C , abbiamo f |C = Z(c) con cn = an+m1 per n > m + 1 e cn = 0
nm
=
per n < m + 1. Invece, in C+ si trova f |C+ = Z(c) con cn = a1 a1
n+m1
a
per n 6 m e cn = 0 per n > m. Si osservi che, a parte il segno,
lespressione dei coecienti di Laurent non nulli la stessa per le due regioni,
ma viene scambiata nei due casi la semiretta di indici con coecienti nulli.

Nota 19.2.6. Il risultato del precedente Esempio 19.2.5 si pu ricavare anche


applicando direttamente la formula di inversione come nellEsercizio 19.2.4 e
negli esempi che lo precedono (Esempio 19.2.3). Inoltre, lo si pu ottenere in
modo ancora pi facile senza impiegare la formula di somma geometrica per
sviluppare la funzione f in serie di Laurent: infatti la trasformata zeta inversa si ricava, in ciascuna regione, dal risultato dellEsempio 19.1.11 e dalla
propriet di traslazione della parte (i) del Teorema 19.1.6.
Questa osservazione illustra il metodo di calcolo pi abituale della trasformata zeta inversa: si decompone la funzione f come somma di termini la cui
trasformata zeta gi conosciuta. Vediamo qui di seguito qualche esempio
tipico.

Esempio 19.2.7. (Inversione della trasformata zeta con frazioni parziali, caso di poli semplici.) Consideriamo la funzione
f (z) =

z(z 1)
,
(z + 1)(z 1/2)

olomorfa nella corona {|z| > 1}, e scriviamola come zg(z), dove g la funzione la cui antitrasformata zeta stata studiata nellEsercizio 19.2.4. Procediamo a spezzare g come somma di due funzioni razionali pi semplici la
cui antitrasformata zeta gi nota, procedendo come nella consueta tecnica
di integrazione per frazioni parziali. Scriviamo
a
b
z1
=
+
(z + 1)(z 1/2)
z + 1 z 1/2

1156

CAPITOLO 19. TRASFORMATA ZETA

e da questa identit ricaviamo a + b = 1, b a/2 = 1, da cui a = 4/3,


b = 1/3. Pertanto
f (z) =

1
z
4 z

.
3 z + 1 3 z 1/2

z
z
Consideriamo i termini 34 z+1
, olomorfo nella corona {|z| > 1}, e 31 z1/2
,
1
olomorfo nella corona {|z| > 2 }. Dal calcolo dellEsempio 19.1.11 sappiamo
z
1
che Z 1 ( z+1
) = {(1)n per n > 0 e 0 per n < 0, e Z 1 ( z1/2
) = {( 21 )n
per n > 0 e 0 per n < 0. Quindi, nellintersezione delle due corone, ossia in
({|z| > 1}), la antitrasformata zeta della funzione f cn = 43 (1)n 13 (1/2)n .
(Per n = 0, il valore di c0 si ricava anche dalla propriet del valore nale
(parte (viii) del Teorema 19.1.6), che implica c0 = 1).

Nota 19.2.8. Si osservi che, al ne di poter utilizzare lEsempio 19.1.11,


abbiamo sviluppato tramite frazioni parziali la funzione f (z)/z invece che
f (z). Questo approccio tipico per le funzioni razionali. Lo applichiamo al
prossimo esercizio.

Esercizio 19.2.9. Sia


f (z) =

a
b
z
=
+
(z z1 )(z z2 )
z + 1 z 1/2

con 0 < |z1 | < |z2 |. Si calcoli la trasfromata zeta inversa di f nelle corone
C = {|z| < |z1 |}, C0 = {|z1 | < |z| < |z2 |} e C+ = {|z| > |z2 |}.
Svolgimento. Come suggerito dalla Nota 19.2.8, decomponiamo in frazioni
parziali il quoziente f (z)/z ,
f (z)
b
1
a
+
,
=
=
z
(z z1 )(z z2 )
z z1 z z2
e ricaviamo
a=
e quindi

1
= b
z1 z2

1
f (z) =
z1 z2

z
z

z z1 z z2

(19.9)

19.2. INVERSIONE DELLA TRASFORMATA ZETA

1157

DallEsempio 19.1.11 (o anche dallEsempio 19.2.5) ora segue che la antitrasformata zeta causale di f , nella corona C+ = {|z| > |z2 |}, 0 per n < 0
e
1
(z n z2n )
fn =
z1 z2 1
per n > 0.
Consideriamo invece la corona circolare C0 . Per trovare i coecienti fn qui
riscriviamo (19.9) come somma di due serie geometriche convergenti in questa
corona:
z

(z1 z2 ) f (z) =
=

z
z
1
z2

=
z1 +
z z1 z z2
1 z
1 zz2

X
z1 n
n=0

n

X
z
n=1

z2

X
zn
n=0

1
zn

X
z2n
+
.
zn
n=1

Pertanto i coecienti della trasformata zeta inversa (ora necessariamente


bilatera!) relativa a C0 sono
fn =
fn =

z1n
z1 z2
z2n
z1 z2

se

n>0

se

n < 0.

Inne, nel disco C dobbiamo di nuovo decomporre f come somma di serie


geometriche qui convergenti nel modo seguente:
z

z
z
(z1 z2 ) f (z) =

= z1 z + z2 z
z z1 z z2
1 z1
1 z2



X
X
1
1
1
n
n z
(z2n z1n ) n .
=
n
z2
z1
z
n=1
n=1

Quindi, in C , la trasformata zeta inversa 0 per n > 0 e


fn =
per n < 0.

z2n z1n
z1 z2

1158

CAPITOLO 19. TRASFORMATA ZETA

Esercizio 19.2.10. NellEsercizio 19.2.9 precedente, avremmo potuto invertire


la trasformata zeta tramite la formula di inversione del Teorema 19.2.2 con
integrazione su curve semplici chiuse intorno allorigine in verso antiorario.
Lasciamo al lettore svolgere il calcolo, osservando solo che ogni curva semplice chiusa con indice di avvolgimento 1 nella regione C+ contiene al suo
interno entrambi i poli z1 e z2 , mentre nella corona C0 le curve di questo tipo
contengono al loro interno solo il polo z1 , ed allinterno delle curve in C
non c nessuno di questi due poli. Ma non dimentichiamo che, per n 6 0 la
funzione f (z) z n1 che compare nella formula di inversione (19.6) ha un altro
polo (di ordine 1 n) al punto z = 0, che interno a tutte queste curve.

Esempio 19.2.11. (Inversione della trasformata zeta con frazioni parziali, caso di poli multipli.) In questo esempio applichiamo il metodo di
decomposizioni in frazioni parziali, introdotto nel precedente Esempio 19.2.7,
allinversione della trasformata zeta (limitando lattenzione al caso causale)
di una funzione razionale in cui il polinomio al denominatore ha zeri ripetuti.
Utilizziamo quasi la stessa funzione dellEsempio precedente, ma aumentando
la molteplicit della radice 1 al denominatore, ad esempio cos:
h(z) =

z(z 1)
.
(z + 1)2 (z 1/2)

In analogia a quanto abbiamo fatto alla ne del precedente Esempio 19.2.7,


poniamo u(z) = h(z)/z e decomponiamo u nel modo seguente:
u(z) =

z1
a
b
c
=
+
+
2
(z + 1) (z 1/2)
z 1/2 z + 1 (z + 1)2
= 2a

1
1
1
+b
+c
.
1 2z
1+z
(1 + z)2

Quando trasformiamo lultimo membro ad una unica frazione, il suo numeratore diventa a(z + 1)2 + b(z 1/2)(z + 1) + c(z 1/2), mentre il numeratore
di u z 1. Uguagliando questi due numeratori otteniamo a + b = 0,
2a + c + b/2 = 1, a (b + c)/2 = 1. Da qui si ricava a = 2/11, b = 2/11,
c = 16/11. Pertanto
h(z) =

2 z
16
z
2 2z
+
+
.
11 2z 1 11 1 + z 11 (1 + z)2

19.2. INVERSIONE DELLA TRASFORMATA ZETA

1159

Consultando lelenco delle trasformate zeta calcolate negli Esempi 19.1.11


e 19.1.12, ed applicando la propriet di dilatazione (parte (ii) del Teorema
19.1.6), vediamo adesso che nella corona {|z| > 1} la trasformata inversa
Z 1 (h) = (Z + )1 (h) cn = 0 per n < 0 e
cn =

2
16
2 1
n
+
(1)
+
n(1)n1
11 2n 11
11

per n > 0.

19.2.1

Metodo iterativo di inversione per funzioni razionali

Consideriamo, pi in generale rispetto agli ultimi esempi, una funzione razionale data dal rapporto fra due polinomi di grado m. Senza perdita di
generalit possiamo supporre di normalizzare il denominatore in maniera
che il suo termine di grado massimo valga 1:
p(z)
a0 z m + a1 z m1 + + am
f (z) =
= m
.
q(z)
z + b1 z m1 + + bm
Raccogliendo un fattore z m dal denominatore ed applicando la formula di
somma geometrica 1/(1t) = 1t+t2 . . . con t = b1 /zb2 /z 2 bm /z m
troviamo
1
1
1
= m
q(z)
z 1 + b1 /z + + bm /z m
1
= m (1 (b1 /z b2 /z 2 bm /z m )
z
+ (b1 /z b2 /z 2 bm /z m )2 + . . . ) .
Ora trasferiamo il fattore 1/z m al numeratore, che diventa p(z)/z m = a0 +
a1 /z + + am /z m e sviluppiamo il prodotto di p(z)/z m e 1/q(z):
f (z) =

p(z)
= a0 + (a1 b1 a0 )/z + . . . .
q(z)

1160

CAPITOLO 19. TRASFORMATA ZETA

In questo modo otteniamo per ricorrenza i successivi coecenti di Laurent


di f :
c0 = a0
c1 = a1 b1 c0
c2 = a2 b1 c1 b2 c0
...
In altre parole,
Pnla successione cn costruita dalla regola iterativa c0 = a0 ,
e cn = an i=1 bi cni per n > 1, che lasciamo dimostrare al lettore per
ricorrenza.

Esercizio 19.2.12. Si applichi il metodo ricorsivo appena illustrato alla verica


z1
gi
del calcolo della antitrasformata zeta della funzione g(z) = (z+1)(z1/2)
considerata nellEsercizio 19.2.4 e nellEsempio 19.2.7.

Si noti che lo stesso metodo numerico ricorsivo si applica anche quando


il numeratore ed il denominatore, anzich essere polinomi, sono sviluppi di
Laurent inniti: in tal caso, il fatto che la successione {cn } dia luogo ad una
serie di Laurent convergente nella corona data dallintersezione delle corone
di convergenza degli sviluppi di Laurent del numeratore e del denominatore
segue dallunicit dello sviluppo di Laurent, ed lasciato come esercizio al
lettore (un argomento del tutto analogo verr comunque presentato pi sotto,
alla ne della dimostrazione del Teorema 19.3.2).

19.3

Trasformata zeta e convoluzione

Nota 19.3.1. (Commutativit della convoluzione di successioni.) Consideriamo due successioni c = {cn , n Z} e d = {dn , n Z}. Rammentiamo
che, in analogia alla Denizione 6.1.2, la convoluzione c d la successione
(a valori niti od inniti)
c d(n) =

ck dnk .

k=

Si osservi che la successione cos ottenuta potrebbe non essere in 1 , ed anche se loP non Pdetto che si possa scambiare lordine di somma nella serie

doppia
k= ck dnk . Abbiamo visto nellEsercizio 6.1.13 (basato
n=

19.3. TRASFORMATA ZETA E CONVOLUZIONE

1161

sulla Nota 6.1.3) che una condizione suciente anch si abbia c d 1


che c 1 e d 1 (si veda lidentit (6.7); qui stiamo applicando questi
riferimenti al caso di una misura discreta, la counting measure, e quindi gli
integrali ora sono serie).
Lo stesso riferimento ci dice anche che in tale ipotesi la convoluzione commutativa. Per comodit del lettore, ricapitoliamo questo argomento. Sotto
lipotesi di appartenenza a 1 delle due successioni, segue
PdisuguaglianP dalla
za di Hlder (Teorema 1.16.6 che la serie doppia n= k= ck dnk
assolutamente convergente, nel senso che

X
X

n= k=

|ck | |dnk | < .

Pertanto, in base alla propriet di riordinamento delle serie numeriche (Sezione 1.1), lordine con cui sommiamo i termini irrilevante, e quindi si pu
scambiare lordine delle due somme:

X
X
X
X
ck dnk =
ck dnk .
n= k=

k= n=

Questultima identit equivale a dire che vale la propriet commutativa cd =


c d.

Teorema 19.3.2. (Trasformata zeta della convoluzione di due segnali.) Se c = {cn , n Z} e d = {dn , n Z} sono due successioni in 1 ,
e le loro trasformate zeta convergono rispettivamente nelle corone Cc e Cd ,
allora
Z(c d) = Z(c) Z(d)
e questa trasformata zeta converge nellintersezione Cc Cd .

Dimostrazione. Nel calcolare la trasformata zeta della convoluzione, scambiamo lordine di somma come giusticato nella precedente Nota 19.3.1:
!

X
X
ck dnk z n
Z(c d)(z) =
n=

k=

k=

ck

dnk z

n=

= Z(c)(z) Z(d)(z) .

k=

ck z

n=

dnk z (nk)

1162

CAPITOLO 19. TRASFORMATA ZETA

Lultimo membro di questa identit uno sviluppo di Laurent con centro


0, olomorfo in una corona circolare. Il primo membro il prodotto di due
sviluppi di Laurent con centro 0, ciascuno olomorfo nella propria corona
circolare, rispettivamente Cc e Cd : il prodotto olomorfo nellintersezione
Cc Cd . Poich il prodotto puntuale di due sviluppi di Laurent ancora uno
sviluppo di Laurent, per lunicit di tale sviluppo (assicurata dallidentit
(2.27), il membro di destra deve essere anchesso olomorfo in Cc Cd .

Ora che abbiamo mostrato che la trasformata zeta manda convoluzioni in prodotti puntuali, vorremmo mostrare il viceversa, in analogia con la
trasformata di Fourier. Per questo, per, dobbiamo considerare opportune
convoluzioni per funzioni olomorfe, rispetto ad una misura diversa dalla misura di Lebesgue sulla retta: ci serve una misura invariante per dilatazione
invece che per traslazione. La introduciamo nella seguente Nota.

Lemma 19.3.3. Sia m la misura di Lebesgue su R o su una circonferenza


C C con centro lorigine, e consideriamo la misura definita da
Z
Z
dm(t)
f (t) d(t) = f (t)
,
t
dove f una generica funzione integrabile su R o su C. Osserviamo che le
costanti R, 6= 0 agiscono su R e su C, mandandoli in s, tramite la
moltiplicazione x 7 x nel caso di R e rei 7 rei nel caso di C. Questa
azione si chiama dilatazione (se = 1 la dilatazione lazione banale, se <
0 la dilatazione rovescia il verso di percorrenza). La misura invariante
per questa azione di dilatazione: per ogni costante > 0
Z
Z
f (t) d(t) = f (t) d(t) ,
e pi in generale, per ogni R, 6= 0 (inclusi gli negativi), si ha
Z
Z
f (t) d(t) = sgn () f (t) d(t) ,
Dimostrazione. pi comodo spezzare il calcolo per > 0 e < 0. Basta
considerare separatamente il caso di > 0 e quello di = 1: il caso
generale segue applicando questi due in successione. Svolgiamo il calcolo per

19.3. TRASFORMATA ZETA E CONVOLUZIONE

1163

R: i dettagli per il cerchio C sono identici.


Sia > 0. Allora, con la trasformazione di variabili x = t, otteniamo
Z
Z
Z
Z
dx
dt
=
=
f (x)
f (x) d(x) .
f (t) d(t) =
f (t)
t
x

Invece, nel caso = 1,


Z
Z
Z
Z
dt
dx
f (t) d(t) =
f (t)
=
=
f (x)
f (x) d(x) .
t
x

Definizione 19.3.4. In questo capitolo chiamiamo convoluzione moltiplicativa la convoluzione rispetto alla misura moltiplicativa , e la indichiamo con
. Ossia, se f e g sono due funzioni olomorfe in un aperto connesso A C,
Z
x
dw
1
f
g(w)
,
f g(x) =
2i C
w
w

dove C limmagine di una curva semplice chiusa orientata positivamente


in A (come al solito, il risultato dipende solo dalla classe di omotopia della
curva e dal suo verso di percorrenza, grazie al per il Teorema di invarianza
omotopica 2.4.7).

Nota 19.3.5. La disuguaglianza di Hlder (Teorema 1.16.6 vale per qualsiasi


misura di Borel, non solo per la misura di Lebesgue, con dimostrazione identica. Applicandolo alla misura moltiplicativa otteniamo che, in maniera
del tutto identica a quanto osservato per la convoluzione ordinaria (diciamo, additiva), se f , g L1 () allora f g L1 (), e pi in generale se
f Lp (), g Lq () con p e q indici coniugati, allora f g L1 (). In
tal caso, esattamente come nella Nota 6.1.3, vale la propriet commutativa
f g = g f , ossia
Z
Z
 x  dw
x
g(w) dw =
f (w) g
.
f
w
w w
C
C
Lasciamo al lettore la verica, che richiede solo un ovvio cambiamento di
variabili.
Osserviamo inne che, nel caso di un cerchio C = {rei , 0 6 < 2},
la convoluzione moltiplicativa, considerata nella variabile angolare invece

1164

CAPITOLO 19. TRASFORMATA ZETA

che nella variabile complessa ei , diventa la convoluzione additiva ordinaria


(rispetto alla misura darco): se z = rei , scrivendo f() := f (rei ) ed
analogamente per g, abbiamo
Z
Z 2
z
dw
1
irei d
1
f
g(w)
=
f (rei() ) g(rei )
f g(re ) =
2i C
w
w
2i 0
rei
Z 2
1
=
f (rei() ) g(rei ) d = f g() .
(19.10)
2 0
i

Teorema 19.3.6. (Trasformata zeta del prodotto puntuale di due


segnali.) Siano c e d due successioni zeta-ammissibili, ed indichiamo le
loro corone di convergenza rispettivamente con Cc = {rc < |z| < Rc } e
Cd = {rd < |z| < Rd }. La trasformata zeta manda il prodotto puntuale di
c e d nella convoluzione moltiplicativa delle trasformate individuali, Z(c)
Z(d). Ovvero, ponendo {bn = cn dn }, f = Z(c), g = Z(d) e h = Z(b),
per qualunque percorso semplice chiuso orientato positivamente r = r(t) con
immagine contenuta in Cc Cd si ha
Z  
Z  
dw
dw
z
z
1
1
f
g(w)
g
f (w)
=
.
h(z) =
2i r
w
w
2i r
w
w
La corona di convergenza di Z(b) contiene la corona {rc rd < |z| < Rc Rd }.
Dimostrazione. Sia r un percorso semplice chiuso orientato positivamente
contenuto in Cd . Dalla formula di inversione (19.5) segue
Z
1
g(w) w n1 dw .
dn =
2i r
Daltra parte, per la Denizione 19.1.1 di trasformata zeta,
h(z) =

cn dn z n .

n=

Nella corona in cui h olomorfa, questa serie di Laurent (quindi di potenze


nella variabile z 1 ) converge uniformemente. Pertanto, dopo aver combinato

19.3. TRASFORMATA ZETA E CONVOLUZIONE

1165

le due identit precedenti, possiamo scambiare la serie con lintegrale ed


otteniamo
Z

X
1
h(z) =
cn
g(w) w n1 dw z n
(19.11)
2i
r
n=
!
Z
Z  

 w n
X
1
dw
z
1
1
=
cn
f
g(w)
g(w) w dw =
.
2i r n=
z
2i r
w
w
Anch si possa passare dal secondo al terzo membro, per, occorre che su
tutti i punti dellimmagine della curva r la trasformata zeta f (z/w) converga:
quindi lidentit vale per i numeri complessi z tali che, per ogni w nellimmagine di r (contenuta in Cd ), il numero complesso z/w appartenga alla corona
di convergenza Cd . Ossia, deve essere rd < |w| < Rd e rc < |z/w| < Rc .
Queste disuguaglianze implicano rc rd < |z| < Rc Rd : questa quindi una
corona contenuta nella corona di convergenza di f = Z(b).
Le restrizioni allimmagine della curva r delle trasformate zeta f e g sono
1
continue (restrizioni diRfunzioni
: pertanto sappiamo
 olomorfe!)
Re quindi
 in L dw
dw
x
x

dalla Nota 19.3.5 che r f w g(w) w = r g w f (w) w .

Corollario 19.3.7. (Identit di Parseval per la trasformata zeta.)


Siano c e d due successioni zeta-trasformabili, ed indichiamo le loro corone
di convergenza rispettivamente con Cc = {rc < |z| < Rc } e Cd = {rd < |z| <
Rd }, e con f , g le loro trasformate zeta in queste corone. Poniamo anche
D = {1/R < |z| < 1/r}.
Sia r una qualsiasi curva semplice chiusa orientata positivamente la cui immagine giace in Cc D, ossia nella intersezione delle corone di f (z) e g(1/z).
Supponiamo che questa corona contenga il punto 1. Allora

1
cn d n =
2i
n=

 
1 dw
f (w) g
.
w
w
r

Dimostrazione. Per ogni n Z, poniamo bn = cn dn , e sia h la trasformata


zeta della successione {bn }. Come nellidentit (19.11), ma ora utilizzando
anche la propriet di coniugazione (parte (iv) del Teorema 19.1.6), abbiamo
 
Z
1
z dw
h(z) =
f (w) g
.
2i r
w
w

1166

CAPITOLO 19. TRASFORMATA ZETA

Ponendo z = 1 otteniamo la formula di Plancherel dellenunciato; la serie


converge grazie allipotesi 1 Cc D, e lintegrale converge perch la curva di
integrazione giace in Cc D (e quindi lintegrando ha senso ed la restrizione
di una funzione olomorfa, quindi continuo).

Nota 19.3.8. Si noti che, se si esprime la variabile complessa w in coordinate


polari, w = rei e si ssa r, la convoluzione, nella variabile , diventa la
convoluzione ordinaria, come mostrato in (19.10), ed allora il Corollario 19.3.7
diventa lidentit di Parseval ordinaria della Nota 4.3.3:
Z 2

X
cn d n =
f (rei ) g(rei ) d .
0

n=

Ad esempio, se cn dn ,

n=

|cn | =

2
0

|f (rei )|2 d .

(19.12)

Capitolo 20
Applicazioni della trasformata
zeta ai sistemi a tempo discreto
(filtri digitali lineari di ordine
finito)
Lo sviluppo di questo capitolo si ispira a [33], [17, Ch. 2]; la Sezione 20.1 si
ispira anche a [10, Cap.17,Sez.5].

20.1

Equazioni alle differenze

Consideriamo gli operatori alle dierenze sulle successioni introdotte nella


Denizione 19.1.7. Una equazione lineare alle differenze di ordine m una
famiglia di relazioni lineari (una per ogni n Z) del tipo
m D (m) gn +m1 D (m1) gn + +0 gn = m D (m) fn +m1 D (m1) fn + +0 fn ,
dove i numeri 0 , . . . , m , 0 , . . . , m sono costanti complesse, m 6= 0, {fn , n
Z} una successione nota (dati in input), e {gn } una successione incognita
(output). Qui per praticit nella relazione lineare abbiamo scritto gn , fn anzich {gn }, {fn }. Non detto che il numero di termini ai due membri debba
essere uguale: ad esempio, se a destra ci sono r < m termini, poniamo uguali
a zero i restanti m r coecienti.
Dalla succitata denizione ricorsiva degli operatori D (m) segue lesistenza di
1167

1168CAPITOLO 20. SISTEMI A TEMPO DISCRETO: FILTRI DIGITALI


costanti complesse a0 , . . . , am , b1 , . . . , bm tali che la precedente formulazione
si riscrive cos:
b0 gn + b1 gn1 + + bm gnm = a0 fn + a1 fn1 + + am fnm .
Per b0 6= 0 perch stiamo considerando equazioni alle dierenze di ordine m,
e quindi, senza perdita di generalit, dividiamo per il coeciente b0 , normalizzando quindi a 1 il coeciente del termine di ordine massimo nellincognita
(di nuovo, il numero di termini non nulli a sinistra e a destra potrebbe essere
diverso). Quindi scriviamo
gn + b1 gn1 + + bm gnm = a0 fn + a1 fn1 + + am fnm .

(20.1)

Il problema consiste nel ricavare la successione incognita in termini della successione dei dati.
In questo libro trattiamo le equazioni alle dierenze in questa seconda formulazione.
Un problema di questo tipo in generale non ha ununica soluzione. Vediamo alcuni esempi.
Esempio 20.1.1. Sia
gn gn1 = 1 .

Fissiamo arbitrariamente un valore delloutput, ad esempio g0 = t. Allora,


per ricorrenza, g1 = 1 + g0 = 1 + t, g2 = 1 + g1 = 2 + t, gn = n + 1 + t
per n > 0, e g1 = t 1, g2 = t 2, gn = t n. In questo caso
le soluzioni dipendono solo dal parametro t. Esse quindi costituiscono uno
spazio vettoriale (lequazione lineare!) di dimensione 1. Si tratta delle
successioni aritmetiche (ossia lineari), che risolvono il problema D (1) g = 0.
Osserviamo che, come per tutti i problemi lineari, la soluzione generale di
gn gn1 = 1 data dalla somma di una soluzione particolare (una qualsiasi di
quelle che abbiamo trovato) pi la soluzione generale del problema omogeneo
associato, gn gn1 = 0: questultima soluzione generale, evidentemente,
consiste delle successioni costanti, gn+1 = gn per ogni n.
Se avessimo scelto
gn 2gn1 + gn2 = 1 ,

ossia D (2) g = 0, ssati g0 = t0 e g1 = t1 ora avremmo g2 = 1 + 2t1 t0 ,


g3 = 1 + 2g2 g1 = 3 + 3t1 2t0 , g4 = 1 + 2g3 g2 = 6 + 4t1 3t0 , e
cos via. In maniera analoga si determinano i coecienti con n negativo a
partire dai parametri t0 e t1 . Pertanto la soluzione uno spazio vettoriale di

20.1. EQUAZIONI ALLE DIFFERENZE

1169

dimensione due. Analogamente, per una equazione alla dierenze di ordine


m la soluzione uno spazio vettoriale di dimensione m. Questo resta vero
qualunque sia la successione di input.

Nota 20.1.2. Esattamente lo stesso metodo ricorsivo mostra che, in tutti i


probemi lineari alle dierenze il cui input causale (ovvero dove non c
perturbazione del sistema per tempi negativi, o in generale minori di qualche
istante n0 ), ed anche loutput causale, ovvero il sistema a riposo per
tempi negativi (o in generale minori di qualche indice n1 ), allora la soluzione
unica. In tale caso, la soluzione non richiede la specicazione di dati iniziali.
Il metodo di calcolo ricorsivo che abbiamo appena illustrato porta sempre alla
soluzione, ma non fornisce una formula chiusa: per ricavare in questo modo
loutput al tempo n non abbiamo una formula, dobbiamo iterativamente
ricavarlo un dato alla volta da n1 a n.

Limpiego della trasformata zeta porta invece a ricavare la soluzione come


unespressione diretta, non ricorsiva, dei dati in input (almeno nei casi in cui
la formula di inversione (19.5) della trasformata zeta risulti esplicitamente
calcolabile). Vediamo come.
Sia f = Z(f ) la trasformata zeta della successione dei dati in input, e
g = Z(g) quella dellincognita. Stiamo supponendo che f e g siano segnali
causali, pertanto le loro trasformate zeta convergono in due corone illimitate,
le quali quindi hanno intersezione non vuota. Limitiamo lattenzione ai valori
della variabile z in questa intersezione. Applicando alla denizione (20.1) la
linearit e la propriet di traslazione della trasformata zeta (parte (i) del
Teorema 19.1.6), otteniamo (1 + b1 z 1 + + bm z m )g(z) = (a0 + a1 z 1 +
+ am z m )f (z), ossia g(z) = h(z)f (z) con
a0 + a1 z 1 + + am z m
a0 z m + a1 z m1 + + am
h(z) =
= m
.
1 + b1 z 1 + + bm z m
z + b1 z m1 + + bm

(20.2)

La funzione h quindi una funzione nota esplicitamente; per le ragioni che


illustreremo in seguito, essa si chiama la funzione di trasferimento. Nel nostro
caso, h una funzione razionale di grado m. Questo conduce al seguente
procedimento risolutivo.
Nota 20.1.3. (Procedimento risolutivo per le equazioni lineari alle
differenze di ordine finito.) Segue da quanto abbiamo appena visto che il
procedimento risolutivo, nellipotesi di input ed output causali, consiste nel

1170CAPITOLO 20. SISTEMI A TEMPO DISCRETO: FILTRI DIGITALI


calcolare esplicitamente f = Z(f ) a partire dalla successione nota f dei dati
in input, e ricavare
g = (Z + )1 (hf )
(20.3)
dalla formula di inversione (19.6). Il calcolo dellinversa dipende quindi solo
dai residui ai poli di hf , ovvero dai poli di f = Z(f ) e dagli zeri del denominatore 1 + b1 z 1 + + bm z m di h.
Notiamo anche che dal Teorema 19.3.2 sulla trasformata zeta di convoluzioni
segue
(Z + )1 (hf ) = (Z + )1 (h) (Z + )1 (f ) = (Z + )1 (h) f ,

(20.4)

e quindi possiamo ricavare direttamente la successione incognita convolvendo


la successione in input con la successione dei coecienti di Laurent della
funzione di trasferimento.
Se input ed output non sono causali, occorre invece invertire la trasformata bilatera, ossia calcolare Z 1 (hf )), e ci sono pi soluzioni, una per ogni
corona di convergenza.

Esempio 20.1.4. Riconsideriamo il problema


gn gn1 = fn .

(20.5)

un cui caso particolare stato studiato nella prima parte dellEsempio 20.1.1.
Qui la funzione di trasferimento in (20.2)
h(z) =

1
z
=
,
1
1z
z1

e dalla parte (ii) dellEsempio 19.1.5 vediamo che h = Z + (1) la trasformata zeta unilatera della successione identicamente 1, o, se si preferisce, la
trasformata zeta bilatera della successione hn = 1 per n > 0 e 0 per n < 0.
Risolviamo quindi il problema (20.5) in qualche caso concreto. Sia fn = hn .
Allora g(z) = h(z)f (z) = z 2 /(z 1)2 . Procediamo dapprima seguendo lapproccio di (20.3). Come nellEsempio 19.2.11, riduciamo ad una somma di
frazioni parziali la funzione razionale u(z) = g(z)/z. Poniamo
u(z) =

g(z)
z
a
b
=
=
+
2
z
(z 1)
z 1 (z 1)2

da cui ricaviamo a = b = 1. Pertanto


z
z
+
,
g(z) =
z 1 (z 1)2

20.2. SISTEMI A TEMPO DISCRETO: FILTRI DIGITALI LINEARI DI ORDINE FINITO1171


e pertanto, in base agli Esempi 19.1.9 (parte (ii)) e 19.1.12, troviamo che la
antitrasformata zeta di g nella corona {|z| > 1} gn = 1 + n per n > 0 e
gn = 0 per n < 0.
Alternativamente, avremmo potuto ricavare questo risultato con il metodo
di (20.4), come convoluzione delle antitrasformate di h e f , ossia come la
convoluzione h h =
n } {hn }. In questo modo ci si riduce alla ovvia
P{h
n

identit h h(n) := m=0 1 1 = n + 1.


Esercizio 20.1.5. Seguendo i due metodi illustrati nel precedente Esempio
20.1.4, si consideri il problema
gn + 2gn1 = fn
e si mostri che:
se fn = 1 per n > 0 e 0 altrimenti, allora la soluzione causale (corrispondente alla corona {|z| > 2} gn = 13 + 32 (2)n ;
se f = 0 + 1 + 2 , ossia fn = n0 + n1 + n2 (terminologia della
Notazione 19.1.2), allora la soluzione causale g0 = 1, g1 = 1 e
gn = 43 (2)n per n > 2. (Si riverichi anche il valore di g0 mediante la
propriet del valore iniziale, parte (viii) del Teorema 19.1.6.)

20.2

Sistemi a tempo discreto: filtri digitali lineari di ordine finito

Una parte rilevante del contenuto di questa Sezione stata gi esaminata


nella Sezione 17.1.1, nel contesto pi generale di segnali anche a tempo continuo: incoraggiamo il lettore a rivedere quella presentazione, che utilizza
esplicitamente lipotesi di invarianza per traslazione temporale, che qui
implicitamente vericata (si veda oltre, dopo la denizione (20.6)).
Definizione 20.2.1. (Filtri digitali lineari di ordine finito.) Un sistema a tempo discreto invariante per traslazione temporale, detto anche filtro
digitale lineare, una relazione lineare che lega una successione generica in
input con una successione incognita in output, e quindi una equazione alle dierenze di ordine nito che trasforma un segnale in input discreto nel

1172CAPITOLO 20. SISTEMI A TEMPO DISCRETO: FILTRI DIGITALI


tempo in un segnale discreto in output. Riscriviamo questa equazione alle
dierenze in forma pi esplicita rispetto a (20.1), in maniera da evidenziare
leventualit che il numero di termini in input ed in output sia diverso: per
un ssato m > 0 e per ogni n Z,
gn + b1 gn1 + + bm gnm = a0 fn + a1 fn1 + + ar fnr ,

(20.6)

ossia
bg =af,

dove b = {1, b1 , . . . , bm , 0, 0, . . . } e a = {a0 , a1 , . . . , ar , 0, 0, . . . }. Il massimo


fra i gradi m e n si chiama lordine del tro. Si osservi che un ltro digitale
lineare di ordine n se la sua funzione di trasferimento la funzione razionale data dal quoziente di due polinomi di grado n e m (e quindi il ltro
ha n zeri e m poli complessi: i poli sono gli zeri del denominatore). Pi
precisamente, ci sono n zeri e m poli tranne che nel caso in cui uno zero al
numeratore sia cancellato dallo stesso zero al denominatore (nel qual caso la
funzione di trasferimento una funzione razionale in cui il fattore comune si
semplica, dando cos luogo a numeratore e denominatore di grado inferiore
a n e m). Per questo motivo, un ltro zeta-ammissibile di ordine nito si
chiama talvolta filtro (con funzione di trasferimento) razionale.
Questa formulazione chiarisce che il sistema invariante per traslazione
temporale: i coecienti a e b non dipendono da n.
Assumiamo dora in poi di limitare lattenzione ad input di ordine nito, zetaammissibili: allora, in base al Teorema di convoluzione 19.3.2, le trasformate
zeta g, f delle successioni {gn } e {fn } soddisfano
(20.7)

q(z)g(z) = p(z)f (z)


dove
p(z) =

m
X

ai z

q(z) = 1 +

r
X

bi z i .

(20.8)

i=1

i=0

A questo punto, da (20.2) otteniamo


g(z) = h(z)f (z) ,

dove h la funzione di trasferimento


Pm
Pm
ai z i
ai z mi
p(z)
rm
i=0
i=0
P
P
=z
=
h(z) =
q(z)
1 + ri=1 bi z i
z r + ri=1 bi z ri

(20.9)

(20.10)

20.2. SISTEMI A TEMPO DISCRETO: FILTRI DIGITALI LINEARI DI ORDINE FINITO1173


(si vedano anche la denizione dopo lidentit (20.2) e la Denizione 17.1.2).
Lidentit (20.9) nalmente spiega il nome funzione di trasferimento. Infatti,
consideriamo il caso dellinput dato da un impulso iniziale, ovvero un segnale
dato da un unico impulso al tempo zero: 0 nella Notazione 19.1.2. In tal
caso, segue da (20.9) che g(z) h(z), ossia che la risposta allimpulso {gn }
esattamente la successione {hn } la cui trasformata zeta la funzione di
trasferimento h. Quindi, in termini di trasformate zeta, la funzione di trasferimento del sistema a tempo discreto descrive la sua risposta allimpulso,
ossia a quale output il sistema discreto trasferisce linput dato dallimpulso
iniziale.
Nota 20.2.2. Nel caso di un input generico zeta-ammissibile f , segue dallidentit (20.9) e dal Teorema di convoluzione 19.3.2 che loutput g del sistema
discreto la convoluzione dellinput con la risposta impulsiva:
(20.11)

g = hf ,
ossia
gn =

fj hnj =

(20.12)

fnj hj

j=

j=

(si veda la Proposizione 17.1.4).

Da (20.7) e (20.8) (o equivalentemente, da (20.9) e (20.10)) segue


r

z g(z) = f (z)z

rm

m
X

ai z

mi

i=0

g(z)

r
X

bi z ri

i=1

ossia
g(z) = f (z)z

m
X
i=0

ai z

mi

g(z)

r
X

bi z

= f (z)

i=1

m
X
i=0

ai z

g(z)

r
X

bi z i

i=1

(20.13)
Ora, applicando la trasformata zeta inversa ed il Teorema di convoluzione
19.3.2, da (20.13) otteniamo:
Proposizione 20.2.3. (Espressione iterativa delloutput di un sistema discreto.)
m
r
X
X
gn =
ai fni
bi gni .
(20.14)
i=0

i=1

1174CAPITOLO 20. SISTEMI A TEMPO DISCRETO: FILTRI DIGITALI


Fattorizzando i polinomi p e q al numeratore ed al denominatore dellultimo membro di (20.10) rispetto alle loro rispettive radici {z } e {z },
possiamo riscrivere lespressione razionale allultimo membro di (20.10) come
Qm
Qm
z
(z

z
)

=1 (1 z )
=1
rm
Qr
(20.15)
= a0 Qr
h(z) = a0 z
z .
=1 (z z )
=1 (1 z )
Nota 20.2.4. Ogni fattore 1 zz nellultimo membro di (20.15) produce (se
z 6= 0) uno zero a z = z ed un polo a z = 0; se il fattore si trova al
denominatore, questo porta rispettivamente ad un polo ed ad uno zero della
funzione di trasferimento h(z). Quindi il numero complessivo di poli e zeri
identico. Osserviamo invece che, nel caso in cui la radice z sia nellorigine
(ossia z = 0), il fattore 1 zz vale identicamente 1, e quindi il contributo
inessenziale. In generale, per evitare banalit, restringiamo lattenzione a
poli e zeri non ubicati a 0 o innito: allora i poli posono non essere tanti
quanti gli zeri, ed ha senso la seguente notazione 20.2.5.

Notazione 20.2.5. (Filtri AP e filtri AZ.) Un ltro con soli zeri (nel
senso della precedente Nota 20.2.4, ossia con fattori polinomiali solo al numeratore dellultima frazione dellidentit 20.15) si denota come filtro AZ.
Un ltro con soli poli si denota come filtro AP. Un ltro la cui funzione di
trasferimento ha sia poli sia zeri non banali (ossia al nito e non nulli) si
indica con filtro PZ.

20.2.1

Filtri digitali causali e stabili

In analogia ai ltri causali a tempo continuo precedentemente introdotti nella


Denizione 17.1.7, ora consideriamo ltri (discreti) causali, ossia ltri che
mandano segnali (discreti) causali in segnali (discreti) causali:
Definizione 20.2.6. Un ltro si dice causale se per ogni istante n0 loutput
{gn } dipende solo dai valori dellinput {fn } per tempi passati, n 6 n0 . Un
ltro si dice anticausale, o puramente predittivo, se {gn } dipende solo dai
valori dellinput {fn } per tempi futuri, n > n0 .
Nota 20.2.7. Un ltro non causale non ha signicato sico se il ltro deve
modellare la risposta di un sistema sico interattivo in tempo reale, ma ce
lha se il ltro deve agire dopo che lintero segnale in input stato ricevuto ed immagazzinato: ad esempio, sono di questo tipo i ltri che agiscono

20.2. SISTEMI A TEMPO DISCRETO: FILTRI DIGITALI LINEARI DI ORDINE FINITO1175


sul contrasto di unimmagine (unsharp mask, compressione JPEG, sfocatura
Gaussiana e tutti i ltri per le immagini nel linguaggio Java che impiegano
la classe BufferedImage.

Corollario 20.2.8. Un filtro causale se e solo se la sua risposta allimpulso


{hn } un segnale causale: hn = 0 per n < 0.

Dimostrazione. Questo fatto segue direttamente dallidentit (20.12).

Nota 20.2.9. Segue da (20.12) e dal precedente Corollario 20.2.8 che un ltro
digitale (ovvero sistema a tempo discreto invariante per traslazione) causale
se e solo se la sua risposta {gn } allinput generico {fn }
gn =

n
X

j=

fj hnj =

n
X

fnj hj .

j=

Se anche linput causale, ossia fn = 0 per n < 0 (ovvero, se il sistema


discreto imperturbato ed a riposo per tempi n < 0, allora la risposta si pu
riscrivere cos:
n
n
X
X
fnj hj .
gn =
fj hnj =
j=0

j=0

Questultimo caso quello abituale nelle applicazioni ai ltri interattivi in


tempo reale, ossia quelli che non agiscono solo dopo che tutti i dati in input
sono stati memorizzati, bens agiscono direttamente man mano che arrivano
i dati (si veda la Nota 20.2.7).

Corollario 20.2.10. Un filtro rzionale (ossia di ordeine finito) causale se


e soltanto se come regione di convergenza della sua funzione di trasferimento
h si sceglie una corona {|z| > d} (dove h non ha singolarit, e quindi tutti i
poli di h hanno modulo inferiore a d), e
Pm
p(z)
ai z i
h(z) =
= Pi=0
r
i
q(z)
i=0 bi z
tale che i gradi m e r di numeratore e denominatore verificano la disuguaglianza m 6 r (o equivalentemente, se e soltanto se, nella formulazione di
(20.15),
Qm
z
m
X
1
=1 (1 z )
rm
mi
h(z) = h(z) = z
ai z
= a0 Qr
z ,
z r i=0
=1 (1 z )

1176CAPITOLO 20. SISTEMI A TEMPO DISCRETO: FILTRI DIGITALI


si ha m 6 r).
Dimostrazione. La funzione di trasferimento la trasformata zeta della risposta allimpulso {hn }. Dal precedente Corollario 20.2.8 segue che il ltro
causale se e solo se la risposta allimpulso un segnale causale. Allora,
dalla Nota 19.1.3, questo equivale a dire che la funzione di trasferimento h
converge allesterno di un disco di raggio nito, e quindi non ha singolarit
allinnito. A sua volta, questo equivale alla condizione che il grado del numeratore sia non superiore a quello del denominatore, altrimenti h divergerebbe
allinnito.

Definizione 20.2.11. Se un ltro non causale, sappiamo dal precedente


Corollario 20.2.8 che la sua risposta allimpulso {hn } non causale, ossia
hn 6= 0 per qualche n < 0. In tal caso poniamo
h+
n = hn

se

n > 0,

h+
n = 0

se

n<0

hn = hn

se

n 6 0,

hn = 0

se

n > 0,

e h+ = Z(h+ ), h = Z(h). In tal modo, per la linearit della trasformata


zeta (Teorema 19.1.6), la funzione di trasferimento h si spezza come h =
h+ + h . Il termine h+ si chiama la parte causale, ed il termine h si chiama
la parte anticausale, o predittiva: la prima d luogo ad un ltro la cui risposta
dipende solo dallinput nel passato, la seconda invece implica una risposta
che dipende dai dati nel futuro (si veda la Nota 20.2.7).
Definizione 20.2.12. La nozione di sistema stabile gi stata introdotta
nella Denizione 17.1.5: il sistema a tempo discreto (ossia ltro) si dice
stabile se manda input limitati in output limitati.
Abbiamo visto nella Proposizione 17.1.6 che questa denizione equivale
a richiedere che la risposta allimpulso del ltro sia una successione 1 (lo
spazio 1 stato introdotto e studiato nella Sezione 1.7; rammentiamo che la
dimostrazione della Proposizione 17.1.6 si basa sulla dualit (Sezione 11.3)
e la disuguaglianza di Hlder (Teorema 1.16.6). Per comodit del lettore,
ridimostriamo qui questo fatto:
Lemma 20.2.13. Sia g = h f . Allora g per ogni f se e solo
se h 1 .

20.2. SISTEMI A TEMPO DISCRETO: FILTRI DIGITALI LINEARI DI ORDINE FINITO1177


Dimostrazione. Rammentiamo per prima cosa la ragione per cui khk1 <
implica khf k < . Si tratta della disuguaglianza di Hlder appena citata,
che si enuncia cos: kh f k 6 khk1 kf k . Per il lettore non si rammenta
lenunciato preciso della disuguaglianza di Hlder, nel caso presente stiamo
solo dicendo che, per ogni n,


X
X
X


|hm | |fnm| 6 (max |fj |)
|hm |
hm fnm 6
|gn | =
j


m=

m=

m=

= kf k khk1 .

P
Viceversa, supponiamo che si abbia
m= |hm | = , e mostriamo che in
questo caso in generale h f non limitato, anzi addirittura pu non essere
denito (pu assumere valori inniti). Basta scegliere fn tale che |fn | = 1
e hn fn = |hn | (in P
altre parole, se hn P
= rei , poniamo fn = ei ). Allora

kf k = 1 ma g0 = m= hm fm =

m= |hm | = .

Corollario 20.2.14. Un filtro lineare digitale causale (quindi con funzione


di trasferimento convergente in una corona illimitata, Corollario 20.2.10)
stabile se e solo se tutti i poli z della funzione di trasferimento verificano |z | < 1 (e si sceglie come regione di convergenza il complemento di un
disco con centro lorigine e raggio minore di 1: si pu scegliere come raggio il massimo degli |z |). Un filtro anticausale (ossia puramente predittivo:
con funzione di trasferimento convergente in un disco con centro lorigine)
stabile se e solo se tutti i poli z della funzione di trasferimento verificano
|z | > 1 (e la regione di convergenza viene scelta come un disco con centro
lorigine che non contiene questi poli).

Dimostrazione. Abbiamo visto che un sistemaP stabile esattamente se la sua

risposta allimpulso h = {hn } sommabile:


n= |hn | < . Supponiamo
che un ltro stabile sia causale. Allora
funzione di trasferimento, osPla sua n
sia la trasformata zeta h = Z(h) = n=0 hn z , convergente nel dominio
|z| > 1, e quindi tutti i suoi poli hanno modulo minore di 1. Viceversa,
supP
poniamo che il ltro stabile sia anticausale: allora h = Z(h) = n=1 hn z n ,
convergente nel dominio |z| > 1, e quindi tutti i suoi poli hanno modulo
maggiore di 1.

Esempio 20.2.15. Abbiamo gi visto che la causalit di un ltro non dipende


solo dalla sua funzione di trasferimento e dalla ubicazione dei suoi poli, ma

1178CAPITOLO 20. SISTEMI A TEMPO DISCRETO: FILTRI DIGITALI


anche dalla scelta della corona di convergenza di tale funzione. Questo lo
abbiamo accennato nella Nota 19.1.10 e nellesempio a cui essa si riferisce,
Esempio 19.1.9, ma soprattutto nellEsempio 20.2.15 e nellEsercizio 19.2.9,
in cui abbiamo considerato la funzione
h(z) =

z
a
b
=
+
(z z1 )(z z2 )
z z1 z z2

come funzione di trasferimento di un sistema a tempo discreto. Tale sistema

un ltro causale nella corona circolare C+ = {|z| > |z2 |}; in questa regione la risposta allimpulso {hn } combinazione lineare dei due esponenziali {z1n } e {z2n } con n > 0: quindi il ltro stabile se e solo se
entrambi i poli z1 e z2 sono dentro il disco aperto di raggio 1 (infatti
questo equivale al fatto che entrambi gli esponenziali siano in 1 );
un ltro non causale nella corona circolare C0 = {|z1 | < |z| < |z2 |}; in
questa regione la risposta allimpulso {hn } combinazione lineare dei
due esponenziali {z1n , n > 0} e {z2n , n 6 0}, quindi il ltro stabile se
e solo se |z1 | < 1 < |z2 |;
un ltro non causale nel disco C = {|z| < |z1 |}; in questa regione la
risposta allimpulso {hn } combinazione lineare dei due esponenziali
{z1n , n 6 0} e {z2n , n 6 0}, quindi il ltro stabile se e solo se z1 e z2
hanno modulo maggiore di 1.
Il lettore verichi laccordo fra questi risultati e la caratterizzazione della
stabilit data nel Corollario 20.2.14.

Esercizio 20.2.16. Consideriamo una funzione di trasferimento razionale il


cui numeratore ha grado m maggiore del grado del numeratore r. Sappiamo
dal Corollario 20.2.10 che questo ltro non mai causale. Ad esempio, si
verichino causalit e stabilit della funzione di trasferimento
h(z) =

z3
(z z1 )(z z2 )

con |z1 | < |z2 | < 1, nella corona {|z| > |z2 |}.

20.2. SISTEMI A TEMPO DISCRETO: FILTRI DIGITALI LINEARI DI ORDINE FINITO1179


Svolgimento. La divisione fra polinomi porta alla seguente espressione per h:
h(z) = z +

z((z1 + z2 )z z1 z2 )
,
(z z1 )(z z2 )

e da qui, decomponendo lultimo termine in frazioni parziali ed utilizzando


come prima lEsempio 19.1.11, otteniamo hn = 0 per n < 1, h1 = 1 e
hn = (z1n+2 z2n+2 )/(z1 z2 ) per n > 0. Ne segue che il ltro stabile ma
non causale.
Si completi lesercizio trattando i casi |z1 | < 1 < |z2 | e 1 < |z1 | < |z2 |,
ciascuno nelle corone {|z1 | < |z| < |z2 |} e {|z| < |z1 |}.

20.2.2

SubS:Filtri stabili del primo e secondo ordine

ovvio dal Corollario 20.2.14 che un ltro del primo ordine con funzione di
trasferimento h(z) = 1/(1 az 1 stabile se e solo se il suo polo z = a
interno al disco unitario, ossia |a| < 1, ed analogamente per il generico ltro
del primo ordine
1 zb
h(z) =
,
1 az
a meno che, naturalmente, non si abbia a = b, nel qual caso il ltro banale
( loperatore identit).
Esaminiamo allora il caso dei ltri del secondo ordine, a cui dedichiamo il
seguente Esempio.

Esempio 20.2.17. (Triangolo di stabilit.) Consideriamo il ltro del secondo ordine con funzione di trasferimento
h(z) =

b
1+

a1
z

a2
z2

con a1 , a2 R. I suoi poli sono gli zeri del denominatore, ubicati nei punti


q
a1
1
2

a1 4a2 ,
z = =
2

ed ovviamente (+ e sono complessi coniugati, per cui + + reale e


+ reale positivo. Si verica immediatamente che
a1 = (+ + )
a2 = + .

1180CAPITOLO 20. SISTEMI A TEMPO DISCRETO: FILTRI DIGITALI


La condizione di stabilit, ossia che i poli siano allinterno del disco unitario
(Corollario 20.2.14) diventa | | < 1. Ma allora
|a2 | = |+ | < 1 .

(20.16)

Inoltre p(x) := (x + )(x ) = x2 + a1 x + a2 ha i suoi due zeri dentro il


disco unitario, e quindi positivo al di fuori dellintervallo (1, 1). Leggendo
i valori di p ai punti 1 si vede che 1 a1 + a2 > 0, ovvero
1 + |a1 | + a2 > 0 .

(20.17)

Viceversa, svolgendo lo stesso calcolo a ritroso, si vede che le due condizioni


(20.16) e (20.17) implicano che a1 e a2 abbiano valore assoluto minore di 1,
e quindi equvalgono alla stabilit del ltro con funzione di trasferimento h
come sopra. Queste condizioni equivalgono a richiedere che la coppia (a1 , a2 )
appartenga al triangolo con vertici in (2, 1) e (0, 1): si veriica subito
che la parte di questo triangolo che appartiene al paraboloide a21 a2 > 0
corrisponde a poli 1 e 2 complessi coniugati ma non reali, e la parte al di
sotto del paraboloide corrispinde a poli reali.

20.2.3

Risposta allimpulso di filtri causali razionali

Esempio 20.2.18. (Risposta allimpulso di un filtro con un solo polo


o con un polo ed uno zero.)
(i) Rammentiamo che la funzione
h(z) =

1
1

a
z

la trasformata zeta della successione esponenziale an 1+ {an }n>0


(Esempio 19.1.11), ossia la trasformata zeta causale (Notazione 19.1.2)
della successione esponenziale {an }nZ . Sia allora h = {n }nZ il ltro che ha come funzione di trasferimento h: ovviamente la sua risposta
allimpulso al tempo zero 0 = h , e quindi la sua funzione di trasferimento deve essere h = Z(h ). Ne segue che, se si sceglie come regione
di convergenza la corona esterna a tutti i poli (ossia se si sceglie il ltro
come causale, in base al Corollario 20.2.10), allora questo determina
una unica trasformata zeta inversa (come visto nella Nota 19.1.10), ed
in questo caso la risposta allimpulso Z 1 h = an 1+ = {an }n>0 .

20.2. SISTEMI A TEMPO DISCRETO: FILTRI DIGITALI LINEARI DI ORDINE FINITO1181


(ii) Osservando che la funzione g(z) = 1 zb la trasformata zeta della
successione g = {1, b} = 0 b 1 , vediamo dalla parte (i) e dal teorema di moltiplicazione e convoluzione per la trasformata vzeta (Teorema 19.3.6) che la risposta allimpulso del ltro f con funzione di
trasferimento
1 zb
f (z) =
1 az

f = (an 1+ ) g = (an 1+ ) (0 b 1 ) = an 1+ b(an 1+ 1 .


Poich, data una successione a = {aP
0 , a1 , . . . } (che possiamo supporre
nulla per n < 0), si ha a 1 (n) =
n=0 ank 1 (k) = an1 , da questo
segue f n = an 1+ (n) ban 1+ (n 1), ossia

se
n > 0,
an ban1
1
se
n = 0,
f (n) =

0
se
n < 0.

La parte (i) del precedente Esempio 20.2.18 si generalizza immediatamente come segue:
Proposizione 20.2.19. (Risposta allimpulso di un filtro digitale causale razionale (ossia di ordine finito.) Consideriamo il filtro h di ordine
n = max{m, r} (Definizione 20.2.1) con funzione di trasferimento
Qm
Qm
z
=1 (z z )
=1 (1 z )
h(z) = a0 Qr
= a0 Qr
z
=1 (z z )
=1 (1 z )

e supponiamo che i poli siano semplici (ossia che non coincidano: nel caso
di poli multipli, si generalizzi quanto segue alla luce dellEsempio 19.2.11).
Come nellEsempio 19.2.7, sviluppiamo la frazione in frazioni parziali.
(i) Se m < r, lo sviluppo in frazioni parziali del tipo
r
X
A
h(z) =
,
1 zz
=1

1182CAPITOLO 20. SISTEMI A TEMPO DISCRETO: FILTRI DIGITALI


e, se il filtro causale (ossia se si sceglie come regione di convergenza
della sua funzione di trasferimento la corona esterna a tutti i poli: Corollario 20.2.10), la risposta allimpulso, data dallunica inversa della
funzione di trasferimento (come nel precedente Esempio 20.2.18),
n =

r
X
=1

{A zn }n>0 =

r
X

A zn 1+

=1

(qui 1+ la funzione caratteristica degli interi positivi della Notazione


19.1.2).
(ii) Se m > r, lo sviluppo in frazioni parziali del tipo
h(z) =

mr
X
=0

X A
B
+
,
z =1 1 zz

e, scegliendo di nuovo come regione di convergenza la regione esterna a


tutti i poli (cos da avere ununica inversa della trasformata zeta Z 1 h),
in base alla parte (i) dellEsempio 19.1.5 la risposta allimpulso ora
n =

mr
X
=0

B 0 (n ) +

r
X

A zn 1+ .

=1

Si noti che, a causa dei termini anticausali 0 (n ), il filtro ora non


causale, come del resto sappiamo gi dal Corollario 20.2.10.
(iii) Segue in particolare dalla parte (ii) che, se r = 0 (ossia P
la funzione di
B
trasferimento ha solo zeri ma nessun polo), allora h(z) = m
=0 z e la
Pm
risposta allimpulso n = =0 B 0 (n): ossia, la risposta allimpulso di lunghezza temporale finita ( nite impulse response, o FIR).
Questi filtri sono ovviamnete di grande importanza per le applicazioni,
e li riconsideriamo pi in dettaglio nella prossima Nota.
Nota 20.2.20. (Filtri IIR e FIR.) In vista della sua importanza applicativa,
riassumiamo in questa Sottosezione quanto visto nella precedente Proposizione 20.2.19.
In base alle identit (20.12), (20.9), (20.7) ed alla formula di inversione (19.6),
la risposta del ltro allinput f dipende solo dai residui ai poli di hf : pertanto, al variare di f , la risposta tipica del ltro dipende solo dai residui ai
poli di h, e questi poli sono esattamente gli zeri del denominatore q.

20.3. ANALISI SPETTRALE DI FILTRI DIGITALI LINEARI

1183

Possiamo dire di pi. Decomponendo la trasformata zeta con il metodo


delle frazioni parziali (Esempi 19.2.7 e 19.2.11), arriviamo a termini del tipo
1/(z z ) oppure z k /(z z ). Se almeno uno dei poli della funzione di trasferimento (ossia uno degli zeri z ) non nullo, allora vediamo dagli Esempi
19.1.11 e 19.1.12 che la risposta allimpulso del sistema discreto ha termini
esponenziali, quindi a supporto innito (la risposta continua indenitamente
nel futuro). Un tale sistema a tempo discreto si chiama IIR (acronimo di
Infinite Impulse Response).
Invece, se tutti gli zeri z del denominatore sono allorigine, ossia z = 0 per
ogni = 0, . . . , r, allora in (20.10) si ha b1 = b2 = = br = 0, e
h(z) = z

m
m
m
1 X mi
1 X mi X i
ai z
= m
ai z
=
ai z .
z r i=0
z i=0
i=0

rm

Pertanto la risposta allimpulso {hn } la trasformata zeta inversa


Z 1 h =

m
X

ai i ,

i=0

in base alla parte (i) dellEsempio 19.1.5. In questo caso, quindi, la risposta
allimpulso vale zero dopo m istanti nel futuro, ed il sistema ritorna a riposo.
Un tale sistema a tempo discreto si chiama FIR (acronimo di Finite Impulse
Response).
signicativo osservare che, in base alla denizione (20.6) di sistema a tempo
discreto, i sistemi FIR sono precisamente quelli in cui loutput gn una
combinazione lineare degli input ai tempi n, n 1, . . . , n r, senza feedback
dei termini gn1 , gn2 , . . . . Per questa ragione, a volte i ltri FIR vengono
chiamati non ricorsivi.

20.3

Analisi spettrale di filtri digitali lineari

Consideriamo un ltro con risposta allimpulso {hn , n Z}. Sappiamo da


(20.12) che la sua risposta allinput oscillatorio {fn = ein }
gn =

j=

i(nj)

hj e

in

=e

j=

hj eij = ein Z(h)(ei ) .

1184CAPITOLO 20. SISTEMI A TEMPO DISCRETO: FILTRI DIGITALI


P
ij
coincide
Nota 20.3.1. Si osservi che il fattore Z(h)(ei ) =
j= hj e
con la serie di Fourier della risposta allimpulso, ed al tempo stesso con la
trasformata di Fourier della distribuzione discreta data dallistogramma della
risposta allimpulso (si riveda linizio del Capitolo 19). Questo fattore, una
serie di Fourier, la restrizione ai numeri complessi di modulo 1 della funzione
di trasferimento

X
h(z) := Z(h)(z) =
hj z j .
(20.18)
j=

In particolare, in risposta allinput puramente oscillatorio considerato qui,


il ltro si diagonalizza, ossia agisce cos:
gn = h(ei ) fn .
Definizione 20.3.2. (Spettro in frequenza di un filtro; sua ampiezza
e fase; ritardo di gruppo.) La funzione h(ei ) si chiama la risposta in
frequenza complessa, o spettro del ltro: scriviamola in coordinate polari,
h(ei ) = Re h(ei ) + Im h(ei ) = A() ei() ,
ed introduciamo una funzione positiva della frequenza A() che si chiama la
ampiezza della risposta in frequenza, ed una funzione () a valori nellintervallo [, ) che si chiama fase della risposta in frequenza.
La funzione () = D () si chiama il ritardo di gruppo del sistema discreto, e misura il ritardo medio del sistema al variare della frequenza; facile
esprimere in termini di h:



d
() = Re z ln h
.
dz
z=ei
Esercizio 20.3.3. Si consideri il ltro con funzione di trasferimento
h(z) =

1
z

a
1 az

dove a C tale che |a| < 1: in altre parole, lunico polo, z = a, interno
al disco unitario, e lunico zero, z = 1/a, il reciproco del suo complesso
coniugato e quindi esterno al disco. Pertanto questo ltro causale (e

20.3. ANALISI SPETTRALE DI FILTRI DIGITALI LINEARI

1185

stabile se si prende per regione di convergenza lesterno del disco unitario:


Corollario 20.2.14).
Si calcoli il ritardo di gruppo di questo ltro e si mostri che vale
() =

1 |a|2
.
|1 aei |2

In particolare, per questa classe di ltri lineari digitali, il ritardo di gruppo


sempre positivo, e quindi la fase della risposta sempre decrescente.
Questa classe di ltri verr analizzata nella Sezione 20.4.3, e questa propriet
di decrescenza si tradurr nella parte (ii) della Proposizione 20.4.10.

Ora consideriamo la risposta in frequenza h = {hn } del ltro, e la sua

autocorrelazione, ossia la convoluzione = h h (il simbolo , introdotto


in (8.3), rappresenta la parit hn = hn :
n =

hj hjn .

j=

Lautocorrelazione una successione importante nella teoria dei segnali,


perch la sua velocit di decadimento tanto pi elevata quanto pi il segnale
concentrato in un piccolo intervallo temporale (lasciamo vericare questa
asserzione al lettore).
Dal Teorema 19.3.2 segue che la funzione = Z() verica
 
1
(z) = h(z) h
z
(qui h di nuovo, come in (20.18), la trasformata zeta della risposta allimpulso h ). Pertanto lo spettro in frequenza dellautocorrelazione
!
!

X
X
i
ij
ij
= h(ei )h(ei ) .
(e ) =
hj e
hj e
j=

j=

ovvio da (20.18) che h(z) = h(z). Quindi:


(ei ) = |h(ei )|2 .
Questa funzione si chiama lo spettro di energia del ltro.

1186CAPITOLO 20. SISTEMI A TEMPO DISCRETO: FILTRI DIGITALI


Nota 20.3.4. Osserviamo, come nella Nota 20.3.1, che i numeri n sono i coefcienti di Fourier della funzione periodica 7 (ei ): questa osservazione
talvolta, nella teoria dei circuiti, si chiama il teorema di WienerKintchin.
Come conseguenza, segue dallidentit di Parseval per le serie di Fourier
(Nota 4.3.3) che

1
|hn | =
0 =
2
n=
2

|h(ei )|2 d .

Nella nostra modellizzazione, questo numero rappresenta lenergia della risposta allimpulso del ltro.

20.3.1

Risposta in frequenza di filtri causali

Rammentiamo (Corollario 20.2.14) che un ltro lineare causale stabile se


e solo se tutti i poli z della funzione di trasferimento vericano |z | < 1
(e se, per rispettare la causalit, si sceglie come regione di convergenza il
complemento di un disco con centro lorigine e raggio minore di 1). Il fatto
che tutti i poli di h siano strettamente contenuti nel disco unitario porta
ad un approccio geometrico al calcolo della risposta in frequenza del ltro.
Consideriamo ad esempio il caso particolare di un solo polo e nessuno zero
(rammentiamo, dal Corollario 20.2.10, che un ltro causale deve avere pi
poli che zeri). Allora
z
1
.
(20.19)
h(z) =
z0 =
1 z
z z0
Se facciamo variare z = ei sul cerchio unitario otteniamo la risposta in
frequenza
ei
h(ei ) = i
,
(20.20)
e |z0 | ei0
dove abbiamo scritto z0 = |z0 | ei0 .

Nota 20.3.5. (Visualizzazione geometrica del modulo della risposta


in frequenza: caso di un unico polo.) Nella precedente espressione
(20.19), il numeratore ha ovviamente modulo 1. Quindi il modulo |h(ei )|
massimo dove il modulo del denominatore minimo, ossia allangolo 0 dato
dalla fase 0 del polo z0 , come si vede anche nella Figura 20.1, nella quale il
modulo della risposta in frequenza il rapporto delle lunghezze dei segmenti

20.3. ANALISI SPETTRALE DI FILTRI DIGITALI LINEARI

1187

che congiungono rispettivamente lorigine ed il polo z0 al punto z = ei che


varia sul cerchio unitario: chiaramente questo rapporto massimo quando
i due segmenti sono allineati. Il valore minimo esattamente 1/(1 |z0 |).
Si noti che il minimo modulo si ottiene per langolo opposto allangolo di

ei

Figura 20.1: Il modulo della risposta in frequenza al punto ei di un filtro con un solo
polo z0 (senza perdita di generalit disegnato sul semiasse reale positivo, al punto r = |z0 |)
il rapporto fra la lunghezza dei due segmenti che congiungono ei con lorigine e con
z0 , la fase la somma (algebrica) delle fasi dei numeri complessi rappresentati da questi
segmenti. Ovviamente, il primo dei due segmenti ha lunghezza 1, quindi il modulo della
risposta in frequenza allangolo semplicemente la lunghezza del segmento dal polo a
ei

fase 0 , ossia quando i due segmenti di cui sopra sono di nuovo allineati
ma il punto ei sulla circonferenza opposto al polo z0 (il segmento che li
congiunge passa per lorigine). Il valore del minimo 1/(1 + |z0 |): qui si
ottiene un avvallamento del graco invece che un picco. Per, man mano che
il polo si avvicina alla circonferenza unitaria, il corrispondente avvallamento
meno stretto del picco opposto, come illustrato nella prossima Nota.

Nota 20.3.6. (Larghezza di picchi frontali e valli opposte nel modulo


della risposta in frequenza.) Il picco generato da un polo z0 della funzione

1188CAPITOLO 20. SISTEMI A TEMPO DISCRETO: FILTRI DIGITALI


di trasferimento h in corrispondenza dellangolo di fase 0 = arg(z0 ) pi
stretto dellavvallamento in corrispondenza dellangolo opposto.
In eetti, esaminiamo la percentuale di caduta di h(ei ) rispetto ai valori
estremi agli angoli 0 e 0 , in un identico intervallo angolare centrato a
tali angoli. Indichiamo questi due settori angolari con (0 + , 0 + + ) e
(0 + , 0 + + ), rispettivamente. La percentuale di diminuzione dei
valori di h(ei ) dal punto di massimo 0 allestremo del settore 0 + +
+ := |h(ei(0 ++ )/h(ei0 )| ,

(20.21)

e la percentuale di aumento dal punto di minimo 0 a 0


:= |h(ei(0 ++ )/h(ei0 )| .

Vogliamo dimostrare che la caduta dei valori per deviazioni angolari in prossimit del picco pi marcata dellaumemento alla stessa deviazione angolare
in prossimit della valle, ossia che + /(1/ ) = + inferiore a 1.
Per semplicit, limitiamo lattenzione ad una deviazione angolare che,
vista da z0 in direzione 0 , pari a /2: questa scelta semplica i calcoli,
perch, se senza perdita di generalit trasportiamo z0 sul semiasse reale positivo ruotando il disco, allora il segmento da z0 a ei+ diventa verticale (ossia
parallelo allasse y: si veda la Figura 20.2). Dora in avanti, senza perdita di
generalit, assumiamo 0 = 0 e 0 = .
i
Scriviamo r = |z0 | e chiamiamo d() la lunghezza
del segmento da z0 a e :
dal teorema di Pitagora d(+ ) esattamente
1 r 2 , e quindi, in base a

i+
2
(20.19), + = |h(e )| = 1/d(+ ) = 1/ 1 r .
Invece, se consideriamo un settore angolare di identica ampiezza intorno a
e chiamiamo = + il suo angolo terminale, lalteezza del
punto
i
e
rispetto alla sua proiezione r sullasse x rimane uguale, ossia 1 r 2 .
Questa altezza il cateto verticale di un triangolo rettangolo che ha come terzo vertice z0 = r, e, di nuovo per il teorema di Pitagora, abbiamo
d( )2 =1 r 2 + (2r)2 = 1 + 3r 2 . Quindi = h(ei ) = (1 + r)/d( ) =
(1 + r)/ 1 + 3r 2 .
Pertanto,

+ =

1r
1+r

1 + 3r 2
=
1+r

1 r2
< 1.
1 + 3r 2

(20.22)

Il fatto che i picchi indotti da ciascun polo siano pi stretti delle valli ad
essi opposte ci induce a limitare lattenzione solo ai primi, perch quando si

20.3. ANALISI SPETTRALE DI FILTRI DIGITALI LINEARI

1189

(1-r 2 )1/2

1-r

(1+3r 2)1/2

Figura 20.2: La caduta dei valori rispetto ai valori estremi della risposta in frequenza
di un filtro dovuti ad un unico polo si calcola in termini delle lunghezze dei segmenti in
questa figura: si veda (20.22)

sommano i contributi di parecchi poli, i picchi stretti rimangono abbastanza


netti, mentre le valli larghe tendono a sommarsi e diventare meno percettibili.
Come stiamo per vedere, la stessa cosa capita con gli zeri invece dei poli, i
quali generano valli strette di fronte a s e picchi larghi, poco interessanti,
in direzione opposta: ma in questo caso, dal momento che i contributi degli
zeri sono
z0
z z0
h(z) = 1
=
,
z
z
il fattore che diventa piccolo per |z0 | 1 al numeratore e non al denominatore, e quindi i picchi sono comunque meno stretti di quelli prodotti dai
poli, ed a maggior ragione le valli. Pertanto, landamento del modulo della
risposta di fase di un ltro causale stabile caratterizzato tipicamente dai
picchi indotti dai poli della sua funzione di trasferimento, almeno se questi
poli sono vicini alla circonferenza unitaria. Si noti infatti che, se i poli o gli
zeri z non sono vicini alla frontiera del disco unitario, ossia se il loro modulo
r = |z| non vicino a 1, i picchi e le valli si addolciscono (perch il massi-

1190CAPITOLO 20. SISTEMI A TEMPO DISCRETO: FILTRI DIGITALI


mo 1/(1 r) diminuisce per r via via pi piccolo: landamento esatto della
larghezza del picco o della valle data dallidentit (20.21)).

Nota 20.3.7. (Visualizzazione geometrica del modulo della risposta


in frequenza: caso di pi poli o zeri.) Pi in generale, se al denominatore c pi di un polo z0 , . . . , zr , allora il modulo della risposta in frequenza
il prodotto dei rapporti di cui sopra che ciascun fattore contribuisce, e
quindi ha un picco in prossimit di ciascuno degli angoli di fase 0 . . . , r dei
rispettivi poli z0 , . . . , zr (in prossimit e non esattamente a questi angoli, a
causa dellinterferenza data dalla somma degli altri fattori). Si noti che quindi i massimi di |h(ei )| sono ubicati in vicinanza dei punti della circonferenza
unitaria a distanza minima dai poli.
Ora veniamo al caso opposto in cui, invece di un fattore al denominatore
di (20.19), abbiamo un fattore al numeratore, ossia uno zero z0 ,. In tal caso
il rapporto si rovescia e diventa
h(z) = 1

z z0
z0
=
,
z
z

(20.23)

ed otteniamo un minimo di |h(ei )| in prossimit dellangolo di fase di ciascuno zero. Quindi in tutti i casi la risposta in frequenza ha modulo con
andamento ondulatorio, ma con picchi in prossimit delle fasi dei poli e valli
vicino alle fasi degli zeri, o equivalentemente con picchi approssimativamente
ai punti della circonferenza pi vicini ai poli e valli nei punti pi vicini agli
zeri.
Si noti per che il contributo al modulo prodotto da uno zero ha contributo
massimo molto minore di quello prodotto da un polo, almeno quando entrambi sono situati vicino alla circonferenza unitaria. Infatti, in questi due
casi, vediamo da (20.20) e (20.23) che il massimo ed il minimo del modulo
della risposta in frequenza valgono rispettivamente 1/(1 r) e 1/(1 + r) per
un polo, e 1 + r e 1 r per uno zero: quindi lescursione totale del modulo
vale (1 + r)/(1 r) in entrambi i casi, ma per r 1 il massimo modulo
molto maggiore per un polo che non per uno zero.
Si osservi che i poli devono essere contenuti nel disco unitario perch stiamo
limitando lattenzione a ltri stabili, ma gli zeri no: per il ragionamento
geometrico appena sviluppato per determinare lubicazione delle valli rimane
valido: il punto estremo comunque dato dallallineamento dei due segmenti
nella Figura 20.1, anche quando i due segmenti allineati sono da parti opposte
rispetto alla circonferenza unitaria.

20.3. ANALISI SPETTRALE DI FILTRI DIGITALI LINEARI

1191

Nota 20.3.8. (Visualizzazione geometrica della fase della risposta in


frequenza.) Invece, la fase della risposta in frequenza di h(ei ) dovuta ad un
solo polo la dierenza delle fasi fra numeratore e denominatore in (20.20),
ossia degli angoli formati riapetto al semiasse x positivo dai due segmenti
disegnati nella Figura 20.1. Nel caso di un solo zero si ha la stessa visualizzazione geometrica, ma cambia il segno del risultato a causa dello scambo fra
numeratore e denominatore. Si noti quindi che, in valore assoluto, ciascun
polo e zero d luogo a fase nulla alla frequenza data dal punto ei0 antistante
sulla circonferenza unitaria, ed a fase massima (ossia ) nel punto antipodale
ei0 . Se vogliamo considerare anche ltri non stabili, con un polo od uno
zero al di fuori del disco unitario, vale la stessa regola, come si pu arguire da
un disegno analogo a quello della Figura 20.1, ma il segno della fase diventa
quello opposto: quindi al punto pi vicino sulla circonferenza unitaria il polo
d luogo ad una fase di , ed al punto antipodale fase 0.
Analogamente a quanto visto nella Nota 20.3.6, anche in questo caso la variazione di fase dovuta ad un polo o ad uno zero interno alla circonferenza
unitaria ed ad essa vicino molto pi rapida della variazione di fase prodotta
al punto antipodale (perch archi di uguale lunghezza al punto antistante ed
al punto antipodale sottendono settori angolari diversi quando visti dal polo
o zero, dal momento che il primo vicino ed il secondo lontano). Pertanto,
come in quella Nota, le variazioni di fase ai punti antipodali sono pi blande e
trascurabili, e tendono maggiormente a compensarsi quando ci sono parecchi
poloi o zeri: noi le trascureremo sistematicamente.
Naturalmente, nel caso di pi poli e zeri, la fase di h(ei ) sempre la somma
delle fasi di tutti questi contributi (dei poli e degli zeri). Poich ciascun polo
o zero produce un contributo nullo alla fase nel punto antistante, frequente
che, con molti poli o zeri equidistribuiti interni al disco unitario, la fase abbia
variazioni piccole. Questo fenomeno in eetti evidenziato nella Figura ??
pi sotto.
Viceversa, abbiamo visto che poli e zeri esterni al disco unitario producono
una fase grande () al punto pi vicino della circonferenza, ed una piccola
(0) al punto antipodale, che come prima a variazione lenta e trascurabile.
Quindi, nel caso di molti poli o zeri equidistribuiti esterni al disco unitario,
ci aspettiamo che la fase abbia variazioni grandi, da a per ogni polo e
zero. Questo fenomeno in eetti evidenziato nella Figura 20.14 pi sotto.

Le seguenti gure illustrano vari esempi di modulo e fase della risposta

1192CAPITOLO 20. SISTEMI A TEMPO DISCRETO: FILTRI DIGITALI


in frequenza di ltri stabili.
Esempio 20.3.9. Consideriamo il ltro con funzione di trasferimento con un
solo polo, al punto reale r, con 0 < r < 1. Il diagramma di zeri e poli
illustrato in Figura 20.3.

Zero

Polo

Figura 20.3: Diagramma di zeri e poli del filtro dellEsempio 20.3.9: c un solo zero
allorigine ed un solo polo al punto reale r, con 0 < r < 1. In questi diagrammi gli zeri
sono indicati con un pallino nero, i poli con un pallino vuoto; il contributo di zeri o poli
allorigine inessenziale (consiste del fattore 1)

La funzione di trasferimento di questo ltro, calcolata in (20.19),


h(z) =

1
.
1 rz 1

Come visto nella parte (i) della Proposizione 20.2.19, ed anche nella Nota
20.2.20, la risposta allimpulso a durata innita: essa vale r n per ogni n > 0
(Esempi 19.1.11 e 20.2.18). Si tratta quindi di un ltro IIR. Il modulo e la
fase della risposta in frequenza si calcolano banalmente, e sono illustrati nelle
Figure 20.4 e 20.5, rispettivamente.
Esaminiamo cosa succede se, invece che un solo polo al punto r, abbiamo
un ltro la cui funzione di trasferimento ha un solo zero allo stesso punto.
I graci della risposta in frequenza sono presentati nelle Figure 20.6 e 20.7,
rispettivamente.

20.3. ANALISI SPETTRALE DI FILTRI DIGITALI LINEARI

1193

Modulo della risposta in frequenza, con solo un polo


9
8

Modulo: |h(z)|

7
6
5
4
3
2
1
0

z
0

Figura 20.4: Modulo della funzione di trasferimento del filtro dellEsempio 20.3.9, con
un solo polo al punto r

Notiamo che, come visto allinizio di questa Sezione, la presenza di uno


zero invece di un polo produce una valle antistante allo zero invece che un
picco, ed anche che, come previsto nella Nota 20.3.6, nel caso di un polo il
picco pi stretto della valle, nel caso di uno zero la valle pi stretta del
picco ma ambedue sono meno strette che per il caso del polo, ed inoltre il
massimo del modulo della risposta in frequenza prodotta dal polo molto
maggiore di quella prodotta dallo zero (circa 20 volte, che appunto il valore
di (1 + r)/(1 r) nel nostro caso, r = 0.9: il rapporto dei massimi dei
contributi in (20.19) e (20.23), calcolati subito dopo questultima identit.

Esempio 20.3.10. Consideriamo il ltro causale (quindi con risposta nulla


per n < 0, e di tipo FIR, con risposta allimpulso nita data da r n per
0 6 n 6 m (per un qualche 0 < r < 1) e zero per n > m. La sua funzione di
trasferimento
m1
X
1 r m z m
h(z) =
r n z n =
.
1 rz 1
n=0

1194CAPITOLO 20. SISTEMI A TEMPO DISCRETO: FILTRI DIGITALI


Fase della risposta in frequenza, con un solo polo

Angolo di fase, Arg (h(z)) (radianti)

3
2
1
0
1
2
z

3
0

Figura 20.5: Fase della risposta in frequenza del filtro dellEsempio 20.3.9, con un solo
polo al punto r

Il numeratore di questa funzione di trasferimento ha m poli nel disco unitario,


dello stesso modulo r < 1 ed angolarmente equispaziati (quindi le loro fasi
sono le radici m-sime dellunit), ed ha m 1 zeri inessenziali allorigine ed
uno zero al punto reale r. Il diagramma di zeri e poli illustrato in Figura
20.3 nel caso m = 8.
Per lo zero al denominatore al punto reale r bilancia il polo allo stesso
punto, e ne cancella quindi il contributo alla risposta in frequenza (si tratta
del contributo che era stato introdotto in (20.20). Possiamo supporre che la
funzione di trasferimento abbia altri m 1 zeri nellorigine, il cui contributo
ininuente ( la costante 1). La funzione di trasferimento si riscrive cos:
h(z) =

1 r m z m
zm rm
=
.
1 rz 1
z m1 (z r)

I graci del modulo e della fase di questa funzione di trasferimento sono


presentati nelle Figure 20.9 e 20.10, rispettivamente, dove si scelto M = 8
e r = 0.9 (per valori di r via via minori, lampiezza dei picchi si allarga e
quindi i picchi interferiscono sommandosi fra loro e non si notano pi). Si

20.3. ANALISI SPETTRALE DI FILTRI DIGITALI LINEARI

1195

Modulo della risposta in frequenza, con solo uno zero


1.8
1.6

Modulo: |h(z)|

1.4
1.2
1
0.8
0.6
0.4
0.2
0

z
0

Figura 20.6: Modulo della funzione di trasferimento del filtro dellEsempio 20.3.9, con
un solo zero al punto r

pu vericare che le valli sono pi larghe dei picchi, a conferma di quanto


osservato nella Nota 20.3.6.
Si noti che la cancellazione del polo al punto reale r grazie ad uno zero
ubicato allo stesso punto squilibra landamento della funzione di trasferimento: si perde il contributo del polo pi vicino al punto 1, ossia alla fase 0, e
quindi il graco del modulo della funzione di trasferimento ha un minimo in

zero (Figura 20.10).


Esempio 20.3.11. Modichiamo il precedente Esempio 20.3.10 spostando allorigine il polo che prima era al punto reale r. La funzione di trasferimento
allora diventa
zm rm
.
h(z) =
zm
Landamento della funzione di trsferimento ora simmetrico da un polo al
successivo (ovvero periodica con periodo 2/8), come confermano i graci
nelle Figure 20.11 e 20.12.

1196CAPITOLO 20. SISTEMI A TEMPO DISCRETO: FILTRI DIGITALI


Fase della risposta in frequenza, solo uno zero
3

Fase, Arg(h(z)) (radianti)

2
1
0
1
2
3

z
0

Figura 20.7: Fase della risposta in frequenza del filtro dellEsempio 20.3.9, con un solo
zero al punto r

Se rinominiamo h1 la funzione di trasferimento del precedente Esempio


20.3.10, la funzione di trasferimento del presente Esempio si ottiene eliminando lo zero al denominatore di h1 , e quindi h(z) = h1 (z) (1 rz 1 ). La
risposta allimpulso quindi data dalla convoluzione della risposta allimpulso del ltro FIR dellEsempio precedente e quella del ltro ad un solo
polo dellEsempio 20.3.9. Questultima risposta allimpulso innita: r n per
n > 0. Quindi la convoluzione non a supporto nito, ed il presente ltro
di tipo IIR.
Si noti anche che, rispetto alla nuova funzione di trasferimento h1 dellEsempio precedente, la nuova funzione di trasferimento h simmetrica (ossia periodica di periodo /4) introdotta in questo Esempio, h(z) = h1 (z) (1 rz 1 ) =
h1 (z) (z r)/z moltiplicata per il fattore (z r)/z, che sul cerchio unitario
ha modulo |z r|: quindi diminuisce fortemente vicino a questo zero, ossia
alla fase 0, ma aumenta alla fase opposta (questo un esempio del fenomeno di valle frontale e picco opposto indotto da uno zero, accennato nella
Nota 20.3.6).

20.3. ANALISI SPETTRALE DI FILTRI DIGITALI LINEARI

Z (7 zeri)

P,Z

1197

Figura 20.8: Diagramma di zeri e poli del filtro dellEsempio 20.3.10: ci sono otto poli a
distanza r dallorigine ed un solo zero al punto reale r, con 0 < r < 1; possiamo introdurre
7 zeri inessenziali allorigine.
Modulo della funzione di trasferimento, 8 poli equidistribuiti, uno zero non banale
6

Modulo: |h(z)|

5
4
3
2
1
0

Figura 20.9: Modulo della funzione di trasferimento del filtro dellEsempio 20.3.10

1198CAPITOLO 20. SISTEMI A TEMPO DISCRETO: FILTRI DIGITALI


Fase della funzione di trasferimento, 8 poli equidistribuiti, uno zero non banale

Angolo di fase, Arg (h(z)) (radianti)

3
2
1
0
1
2
3
0

Figura 20.10: Fase della risposta in frequenza del filtro dellEsempio 20.3.10
Modulo della funzione di trasferimento, 8 poli equidistribuiti, senza zeri non banali

Modulo: |h(z)|

1.5

0,5

z
0

Figura 20.11: Modulo della funzione di trasferimento del filtro dellEsempio 20.3.11

20.4. FATTORIZZAZIONE FASE MINIMA + PASSA-TUTTO

1199

Fase della funzione di trasferimento, 8 poli equidistribuiti, senza zeri non banali

Angolo di fase, Arg(h(z))

(radianti)

3
2
1
0
1
2
z

3
0

Figura 20.12: Fase della risposta in frequenza del filtro dellEsempio 20.3.11

20.4

Sistemi invertibili, filtri a fase minima e


passa-tutto, fattorizzazione

20.4.1

Invertibilit e fitri a fase minima; filtri a fase


massima o mista

Un sistema si dice invertibile se la corrispondenza fra i segnali in input e in


output biunivoca. ovvio che ogni ltro digitale lineare invertibile h ha
per inverso un altro ltro lineare hinv , e la composizione dei due lidentit.
Poich questa composizione data dalla convoluzione h hinv , segue dal
Teorema di convoluzione 19.3.2 per la trasformata zeta che la funzione di
trasferimento hinv del ltro hinv il reciproco della funzione di trasferimento h
di h, naturalmente subordinatamente al fatto che siano state scelte per queste
due funzioni di trasferimento regioni di convergenza con intersezione non
vuota. La condizione di invertibilit, espressa in termini delle due funzioni
di trasferimento, diventa quindi h hinv 1, ed valida solo nellintersezione
delle rispettive regioni di convergenza (che lintersezione di due corone
circolari, e quindi una corona circolare essa stessa).

1200CAPITOLO 20. SISTEMI A TEMPO DISCRETO: FILTRI DIGITALI


Riassumendo:
Corollario 20.4.1. Se il fitro inverso di un filtro lineare esiste, esso si ottiene
scambiando gli zeri delloriginale con i poli (ossia scambiando numeratore
e denominatore della funzione di trasferimento h(z)), ed definito su una
regione di convergenza che interseca quella del filtro originale.
Esempio 20.4.2. (Linverso di un filtro non unico.) Si consideri il ltro
causale e FIR la cui risposta allimpulso al tempo zero, 0 , hn = 0 r1 ,
dove 0 < r < 1. La sua funzione di trasferimento la trasformata zeta di
questa risposta, ossia h(z) = 1 r/z), e quindi il ltro inverso ha la funzione
di trasferimento
1
hinv (z) =
,
1 zr

con un polo al punto z = r: si tratta quindi di un ltro causale se si assume


come regione di convergenza la corona {|z| > r}, ed in tal caso anche stabile
(Corollari 20.2.10 e 20.2.14). Con questa scelta, la risposta allimpulso data
da
hinv (n) = rn
per n > 0, e 0 per n < 0, come visto nellEsempio 19.1.11, e poi di nuovo
nellEsempio 20.2.18 e nella Proposizione 20.2.19. Per, se si sceglie come
regione di convergenza {|z| < r}, allora, con lo stesso argomento dellEsempio
20.2.15, si vede che la risposta allimpulso
hinv (n) = rn
per n 6 0, e 0 per n > 0: quindi con questa scelta il ltro inverso anticausale. In tal modo abbiamo costruito due inversi dierenti per lo stesso
ltro, caratterizzati da dierenti regioni di convergenza per la funzione di
trasferimento.

Esercizio 20.4.3. Sia h la funzione di trasferimento


h(z) =

1
1

1
4z
1
2z

z
z

1
4
1
2

considerata nella regione di convergenza D = {|z| > 1/2}. Allora la funzione


di trasferimento del ltro inverso hinv il reciproco,
hinv (z) =

z
z

1
2
1
4

20.4. FATTORIZZAZIONE FASE MINIMA + PASSA-TUTTO

1201

il quale ammette due regioni di convergenza: D = {|z| < 1/4} e D+ =


{|z| > 1/4}. Solo la seconda interseca D, e quindi il rltro inverso deve
essere considerato nella regione D+ D = D+ . In questa regione, come visto
nella parte (ii) dellEsempio 20.2.18, la risposta in frequenza del ltro inverso
hinv
1
1 1
hinv (n) = n 1+ (n)
1+ (n 1) ,
4
2 4n
ossia hinv (n) = 1/22n+1 per n > 1, hinv (1) = 1/4 e hinv (n) = 0 se n 6 0.

20.4.2

Filtri a fase minima

Definizione 20.4.4. (Filtri a fase minima.) Un ltro lineare si dice a


fase minima se causale, stabile ed invertibile con inverso causale e stabile.
Corollario 20.4.5. Un filtro a fase minima se e solo se le regioni di convergenza del filtro e del suo inverso sono scelte in modo da contenere strettamente lesterno del disco unitarioe tutti gli zeri ed i poli sono contenuti nel
disco unitario, o equivalentemente, se le risposte allimpulso {hn } e {hinvn }
sono entrambi in 1 .
Dimostrazione. Un ltro a fase minima stabile, quindi tutti i suoi poli
sono contenuti nel disco unitario aperto, ed anche il suo inverso stabile,
quindi la stessa asserzione vale per i poli dellinverso, che sono gli zeri del
ltro originale in base al Corollario 20.4.1. La causalit del ltro e del suo
inverso si traducono nellasserzione circa le loro corone di convergenza e circa
il
di zeri ePpoli grazie al Corollario 20.2.10. Inne, le condizioni
Pnumero

|h
|
n < e
n=0 |(hinv )n | < equivalgono alla stabilit in base al
n=0
Corollario 19.1.13 ed al fatto che i poli del ltro e del suo inverso devono
essere di modulo minore di 1.

Esempio 20.4.6. (Riduzione della variazione di fase allinfittirsi di


poli e zeri nel disco unitario.) Questo Esempio lascia capire la ragione
del nome filtri a fase massima per i ltri con zeri e poli angolarmente ben
distribuiti interni al disco unitario. In eetti, come pregurato nella Nota
20.3.8, ci aspettiamo che, con zeri e poli equidistribuiti nel disco unitario
e vicini alla sua circonferenza, la fase abbia variazioni via via pi piccole
allaumentare del numero di zeri e poli. La Figura 20.13 illustra il caso del

1202CAPITOLO 20. SISTEMI A TEMPO DISCRETO: FILTRI DIGITALI


ltro stabile con 22 poli e 2n zeri inframmezzati, tutti di modulo r = 0.9,
angolarmente equispaziati, per n = 3, 4, 5: lescursione della fase diminuisce
al crescere di n, come previsto.

Filtro con 8 poli e 8 zeri equispaziati angolarmente, a raggio 0.9

Fase della risposta in frequenza (radianti)

3
0

16 poli e 16 zeri inframmezzati ed equispaziati, r=0.9


3

3
0

32 poli e 32 zeri inframmezzati ed equispaziati, r=0.9


3
2
1
0
1
2

3
0

Figura 20.13: Fase della risposta in frequenza del filtro con 8, 16 e 32 poli angolarmente
equispaziati ed altrettanti zeri inframmezzati, tutti interni al disco unitario, di modulo
0.9: la variazione di fase decresce al crescere del numero di poli

20.4. FATTORIZZAZIONE FASE MINIMA + PASSA-TUTTO

1203

Esempio 20.4.7. (Filtri a fase massima.) Sempre in base alla Nota 20.3.8,
ci aspettiamo che, nel caso di k zeri e poli equidistribuiti esterni al disco, la
fase abbia variazioni che si mantengono sempre massime (ossia con escursione fra e ) e via via pi ripide allaumentare del loro numero k. In
eetti, le Figure ??, ?? e ?? illustrano landamento della fase dei ltri (stabili
anticausali, come vedremo nelle prossime righe) con gli stessi poli e zeri angolarmente equidistribuiti ed inframmezzati del precedente Esempio 20.4.6,
ma ora spostati radialmente fuori del disco (abbiamo aumentato il valore di
r a 1.1). Nelle tre gure abbiamo considerato i casi k = 2n per n = 2, 3, 4: si
vede che, per ogni tale k, lescursione della fase supera lintero giro da a
. Un ltro con tutti gli zeri ed i poli al di fuori del disco unitario causale se
la sua funzione di trasferimento considerata in una corona illimitata, ma in
tal caso ovviamente instabile (Corollario 20.2.14), e se invertibile neppure
il suo inverso stabile (in base al Corollario 20.4.1). Invece, se la funzione
di trasferimento considerata in un disco con centro lorigine, ogni ltro on
tutti gli zeri ed i poli al di fuori del disco unitario anticausale ma stabile,
sempre per il medesimo Corollario, ed in tal caso, se invertibile, anche il
ltro inverso, se scelto anticausale, stabile. Un ltro anticausale e stabile
con inverso anticausale e stabile si dice a fase massima.

Esempio 20.4.8. (Filtri a fase mista.) Se alcuni zeri e poli sono interni
al disco unitario ed altri sono esterni, il ltro si dice a fase mista. Nel caso
che i poli siano in parte interni ed in parte esterni al disco unitario, un tale
ltro non stabile qualunque sia la regione di convergenza scelta (Corollario
20.2.14), e se invertibile neppure il suo inverso stabile (in base al Corollario 20.4.1). Questi ltri quindi sono meno frequenti nella applicazioni
numeriche, ma sono interessanti per lanalisi.
Modichiamo i ltri dei due precedenti Esempi 20.4.6 e 20.4.7 in maniera
che alcuni zeri e poli cadano fuori dal disco. Facciamo questo in maniera
aleatoria, in modo da eliminare anche gli eetti di simmetrizzazione dovuti
alla equidistribuzione angolare di poli e zeri. A questo scopo, perturbiamo
la distanza dallorigine r di ciascuno zero e polo in tre modi, sempre aggiungendogli una variabile aleatoria di modulo inferiore a 0.05: il primo

1204CAPITOLO 20. SISTEMI A TEMPO DISCRETO: FILTRI DIGITALI


Fase della risposta in frequenza, filtro con 8 poli e 8 zeri inframmezzati
ed equispaziati, a distanza 1.1 dallorigine

Fase, Arg (h(z)) (radianti)

3
0

Fase della risposta in frequenza, filtro con 16 poli e 16 zeri inframmezzati


ed equispaziati, a distanza 1.1 dallorigine
3

3
0

Fase della risposta in frequenza, filtro con 32 poli e 32 zeri inframmezzati


ed equispaziati, a distanza 1.1 dallorigine
3

3
0

Figura 20.14: Fase della risposta in frequenza del filtro con 2n poli angolarmente equispaziati ed altrettanti zeri inframmezzati, tutti esterni al disco unitario, di modulo r = 1.1
(qui n = 3, 4, 5): lescursione della fase si mantiene sempre elevata

20.4. FATTORIZZAZIONE FASE MINIMA + PASSA-TUTTO

1205

mantenendo r = 0.9; il secondo prendendo r = 1; il terzo prendendo


r = 1.1. Nel primo caso tutti gli zeri e poli cadono internamente al disco;
nel secondo caso cadono statisticamente a met fra dentro e fuori il disco,
e potrebbe succedere che qualcuno cada sulla frontiera (nel qual caso si otterrebbe una singolarit del modulo della risposta in frequenza e la fase non
sarebbe ivi denita, ma per fortuna questo accade con probabilit zero); nel
terzo caso zeri e poli sono tutti fuori. Perturbiamo anche la distribuzione
angolare: invece che equispaziati ed inframmezzati, ossia al centro di 2n archi contigui sulla circonferenza di uguale lunghezza, ora zeri e poli hanno la
ubicazione angolare libera di variare in questi intervalli, e quindi uno zero
ed un polo consecutivo potrebbero essere angolarmente coincidenti, o quasi:
questo dissimmetrizza i graci di modulo e fase della risposta in frequenza,
che riportiamo entrambi nelle Figure 20.15, 20.16, 20.17, nel caso di 8 zeri e
8 poli. I picchi pi elevati del modulo della risposta in frequenza sono dati da
poli in prossimit della circonferenza unitaria. Si nota come zeri e poli tutti
interni al disco unitario mantengano piccole le variazioni di fase, che invece
si mantengono uniformemente grandi se zeri e poli sono tutti esterni. Il caso
misto porta ad ampie uttuazioni di fase e di modulo, con punti molto ripidi
laddove uno zero o un polo cadono vicino alla circonferenza unitaria. Filtri a
fase mista o massima di questo tipo sono quindi dicili da usare nella pratica, a causa delle distorsioni di fase che producono. Queste gure confermano
che le elevate variazioni di fase non dipende dalla equidistribuzione di zeri
e poli o dal loro numero, ma dalla loro localizzazione dentro o fuori il disco
unitario: solo nel caso di zeri e poli tutti interni (fase minima), la variazione
di fase viene ridotta dallinttirsi di zeri e poli in maniera equidistribuita.

20.4.3

Filtri passa-tutto

Nella precedente Sottosezione 20.4.1 abbiamo studiato ltri a fase minima,


nei quali le variazioni di fase sono contenute, ma naturalmente il modulo
della risposta in frequenza uttua, particolarmente nel caso di poli vicino alla
circonferenza unitaria: quindi questi ltri amplicano e smorzano il segnale
a seconda della frequenza delle sue armoniche: esempi particolari sono i ltri
passa-basso, passa-alto e passa-banda. Il caso antitetico quello dei ltri che
lasciano invariata lampiezza dei segnali e ne modicano solo la fase: questi

1206CAPITOLO 20. SISTEMI A TEMPO DISCRETO: FILTRI DIGITALI


Filtro con 8 poli e 8 zeri approssimativamente equispaziati,
di modulo fra 0.85 e 0.95:
modulo della risposta in frequenza
12

10

Modulo, |h(z)|

z
0

Filtro con 8 poli e 8 zeri approssimativamente equispaziati,


di modulo fra 0.85 e 0.95:
fase della risposta in frequenza

Fase, Arg ( h(z) ) (radianti,


con escursione di due giri)

z
0

Figura 20.15: Modulo e fase della risposta in frequenza del filtro con 8 poli angolarmente quasi equispaziati ed altrettanti zeri inframmezzati, tutti interni al disco unitario,
a distanze dal centro scelte a caso fra 0.85 e 0.95: il modulo non elevato, la fase varia
poco

ltri si chiamano passa-tutto (la loro funzione di trasferimento spesso si indica


con hpa , dallinglese pass-all ).
Un caso particolare il ltro con risposta allimpulso k , che vale 1 se
n = k e zero altrimenti: in base a (20.11), loutput di questo ltro il ritardo
di k campioni sul segnale originale, se k > 0, e lanticipo di |k| campioni se

20.4. FATTORIZZAZIONE FASE MINIMA + PASSA-TUTTO

1207

Filtro con 8 poli e 8 zeri approssimativamente equispaziati,


di modulo fra 0.95 e 1.05:
modulo della risposta in frequenz a

Modulo, |h(z)|

400

200

z
0

Filtro con 8 poli e 8 zeri approssimativamente equispaziati,


di modulo fra 0.95 e 1.05:
fase della risposta in frequenz a
5

Fase, Arg ( h(z) ) (radianti,


con variazione di parecchi giri)

4
3
2

z
0

Figura 20.16: Modulo e fase della risposta in frequenza del filtro con 8 poli angolarmente
quasi equispaziati ed altrettanti zeri inframmezzati, circa met ei quali interni al disco
unitario e laltra met esterni, a distanze dal centro scelte a caso fra 0.95 e 1.05: il modulo
elevato, la fase varia molto

k < 0 (in questo caso il ltro predittivo, non causale). La sua funzione di
trasferimento la trasformata zeta di k , ossia h(z) = z k .
Esempio 20.4.9. (Filtri PA.) Un caso assai pi generale il seguente (ltriPA), a cui limiteremo la nostra analisi dei ltri passa-tutto:
Pm
k
am + am1 z 1 + + z m
k=0 amk z
P
=
hpa (z) =
m
k
1 + a1 z 1 + + am z m
k=0 ak z

1208CAPITOLO 20. SISTEMI A TEMPO DISCRETO: FILTRI DIGITALI

Filtro con 8 poli e 8 zeri inframmezzati approssimativamente equispaziati,


di modulo fra 1.05 e 1.15:
modulo della risposta in frequenza

Modulo, |h(z)|

15

10

z
0

Fase, Arg ( h(z) ) (radianti,


con escursione di vari giri)

Filtro con 8 poli e 8 zeri approssimativamente equispaziati,


di modulo fra 1.05 e 1.15:
fase della risposta in frequenza

15

10

0
z
0

Figura 20.17: Modulo e fase della risposta in frequenza del filtro con 8 poli angolarmente quasi equispaziati ed altrettanti zeri inframmezzati, tutti esterni al disco unitario,
a distanze dal centro scelte a caso fra 1.05 e 1.15: il modulo non elevato, ma la fase varia
molto

(si noti che, dividendo numeratore e denominatore per a0 , possiamo supporre


a0 = 1, e cos abbiamo fatto nel termine centrale).
In eetti, mostriamo che questa funzione di trasferimento
ha sempre
Pm
k
modulo 1. Scriviamo il suo numeratore N(z) =
ed il suo
k=0 amk z

20.4. FATTORIZZAZIONE FASE MINIMA + PASSA-TUTTO


denominatore D(z) =

Pm

k=0

1209

amk z k . Allora
D(1/z) =

m
X

ak z k ,

k=0

e quindi, se |z| = 1, ossia z = z ,


1

N(z) = z m D(1/z) .

Poich 1/z = z, da qui segue N(z) = z m e pertanto |hpa (z)| = 1.


Si osservi che, se z uno zero di D, allora 1/z uno zero di z 7 D(1/z).
Quindi, dalle precedenti identit segue che, se se z uno zero (rispettivamente, un polo) di hpa , allora 1/z un polo (rispettivamente, uno zero). In
altre parole, gli zeri si ottengono dai poli prendendo i reciproci e coniugando, ossia prendendo il reciproco del modulo e lasciando invariato langolo di
fase: si tratta di una riessione intorno alla circonferenza unitaria. Quindi
linsieme di zeri e poli invariante sotto tale riessione, come illustrato in
Figura 20.18.

Polo

Zero

Figura 20.18: Diagramma di zeri e poli di un filtro passa-tutto: i poli sono interni al
disco unitario, gli zeri sono i loro riflessi sferici rispetto alla circonferenza unitaria (ovvero,
i reciproci dei loro coniugati)
Naturalmente, se tutti i coecienti ak del sistema sono reali, allora gli
zeri sono o reali o a coppie di numeri complessi coniugati, e quindi lo stesso
succede ai poli, come illustrato in Figura 20.19.

1210CAPITOLO 20. SISTEMI A TEMPO DISCRETO: FILTRI DIGITALI

Polo

Zero

Figura 20.19: Nel caso di un filtro passa-tutto a coefficienti reali, gli zeri ed i poli
formano anche un insieme invariante per coniugazione

Rammentiamo (Corollario 20.2.14) che un ltro PA causale se e solo se


tutti i poli sono interni al disco unitario (e si sceglie come regione di convergenza una corona innita esterna a tutti i poli, ad esempio il complemento
del disco unitario).

Proposizione 20.4.10. (Propriet dei filtri PA.)


(i) Se h (la risposta allimpulso di) un filtro passa-tutto, allora questo
filtro preserva lenergia del segnale in input, nel senso che, applicato ad
un segnale
di input
un segnale di output y = h x tale
P
P x, restituisce
2
2
che nZ |y| = nZ |x| .

(ii) La fase della risposta in frequenza di un filtro PA causale e stabile


sempre decrescente, ossia il ritardo di gruppo (Definizione 20.3.2)
sempre positivo.
(iii) Il filtro PA con un solo polo z = a ed un solo zero z = 1/a con |a| < 1,
ossia con funzione di trasferimento
hpa (z) =

1
z

a
,
1 az

(20.24)

verifica |hpa (z)| = 1 se |z| = 1 (come gi sappiamo), ma anche |hpa (z)| >
1 se |z| < 1 e |hpa (z)| < 1 se |z| > 1.

20.4. FATTORIZZAZIONE FASE MINIMA + PASSA-TUTTO

1211

Dimostrazione. La parte (i) segue direttamente dallidentit di Parseval 19.12


e dal teorema di convoluzione 19.3.2, dal momento che la funzione di trasferimento hpa = Z({h} verica |hpa (ei ) = 1 per denizione di ltro passa-tutto,
e quindi | Z(y)(ei )| = | Z(h x)(ei )| = | Z(x)(ei )|.
La parte (ii) segue dal fatto che i ltri PA causali e stabili hanno tutti i
poli allinterno del disco unitario (Corollario 20.2.14) e tutti gli zeri al suo
esterno, dati dai reciproci dei complessi coniugati dei poli. Quindi la funzione di trasferimento di questi ltri data dal prodotto di fattori come quelli
considerati nellEsercizio 20.3.3, ed in tale Esercizio vedemmo che la fase di
questi fattori decrescente.
La parte (iii) ovvia per |z| = 1, per denizione di ltro PA, ed una immediata conseguenza del principio del massimo (Corollario 2.8.3) per |z| > 1.
Infatti, osserviamo da (20.24) che hpa h limite allinnito; allora, poich il
solo polo di hpa z = a con |a| < 1, ossia interno al disco unitario, la funzione g(z) = hpa (1/z) olomorfa nel disco unitario, e quindi, per il principio
del massimo modulo, il suo modulo assume il proprio massimo sulla circonferenza di frontiera, dove tale modulo vale costantemente 1 perch il ltro
PA verica hpa (eit ) 1 (il massimo viene assunto in senso stretto, perch
hpa non costante) nel disco: si veda di nuovo il Corollario 2.8.3). Pertanto
|hpa | < 1 per |z| > 1.
Naturalmente, per, questo ragionamento non dice nulla circa il massimo
modulo di hpa dentro il disco unitario. Ma possiamo risolvere lintera questione in un colpo solo dentro e fuori il disco con il seguente ragionamento.
Dobbiamo determinare per quali z |hpa (z)|, o equivalentemente |hpa (z)|2 ,
maggiore o minore di 1. Scriviamo z = reit . Da (20.24)
|hpa (z)|2 =
=

| 1 az|2

|z

a2
|

(1 areit )(1 areit )


(reit a)(reit a)

1 + r 2 |a|2 2r Re(aeit )
.
r 2 + |a|2 2r Re(aeit )

Pertanto |hpa (z)| > 1 se e solo se 1 + r 2 |a|2 2r Re(aeit ) > r 2 + |a|2


2r Re(aeit ), ovvero se e solo se 1 + r 2 |a|2 > r 2 + |a|2. Questa disuguaglianza
equivale a r 2 (1 |a|2 ) < 1 |a|2 , ovvero r < 1.

20.4.4

Fattorizzazione fase minima + passa-tutto

Questa Sottosezione dedicata a provare la seguente fattorizzazione:

1212CAPITOLO 20. SISTEMI A TEMPO DISCRETO: FILTRI DIGITALI


Proposizione 20.4.11. Sia h la funzione di trasferimento di un filtro digitale linare senza poli o zeri sulla circonferenza unitaria. Allora h si fattorizza
come prodotto
h = hmin hpa
(20.25)
di un filtro a fase minima ed un filtro PA. In particolare, la risposta di fase
del fattore a fase minima ha lo stesso modulo, ovvero la stessa risposta in
ampiezza (ma non in fase!), del filtro originale (perch ovviamente il fattore
PA ha modulo 1. Se il filtro ha ordine n, nel senso della precedente Definizione 20.2.1, allora ci sono esattamente 22n filtri con lo stesso modulo della
risposta in frequenza; se inoltre il filtro stabile, allora ci sono esattamente 2n filtri stabili la cui risposta in frequenza ha lo stesso modulo del filtro
originale.
Dimostrazione. In base al Corollario 20.4.5, un ltro a fase minima ha tutti
i suoi zeri e poli allinterno del disco unitario. Procediamo per iterazione a
spostare gli zeri ed i poli di h allinterno di tale disco, come segue. Se h ha
uno zero esterno al disco unitario, diciamo in z = 1/a con |a| < 1, e tutti
i poli e gli altri zeri allinterno, allora fattorizziamo h(z) = h1 (z) (a z 1 )
ed osserviamo che h1 a fase minima, perch ha tutti i poli e gli zeri dentro
il disco (naturalmente, scegliendo come regione di convergenza lesterno del
disco). Ora osserviamo che
a z 1
h(z) = h1 (z) (1 az )
,
1 az 1
1

ed il fattore h(z) = h1 (z) (1 az 1 ) ha gli zeri ed i poli di h1 pi uno zero in


z = a (il riesso sferico del punto a), che anchesso dentro il disco unitario:
quindi tale fattore a fase minima, ed esattamente quanto si ottiene riettendo allinterno del disco unitario quello zero che prima era fuori (in z = a).
Invece laltro fattore, (a z 1 )(1 az 1 ), la funzione di trasferimento di un
ltro PA, in base alla forma della funzione di trasferimento come in (20.24):
su tratta del ltro con un unico zero in z = 1/a ed un unico polo in z = a.
Osserviamo che la componente di tipo PA ha modulo della risposta in frequenza costantemente uguale a 1, e quindi la componente a fase minima ha lo
stesso modulo della risposta in frequenza del ltro originale. Iterando questo
procedimento possiamo riettere sfericamente ciascuno zero e ciascun polo di
h dentro il disco, generando ogni volta un fattore compensativo come visto
sopra: questi fattori producono un ltro di tipo PA, che non altera il modulo

20.4. FATTORIZZAZIONE FASE MINIMA + PASSA-TUTTO

1213

della risposta in frequenza complessiva. Poich un ltro di ordine n ha n


zeri e n poli, ci sono esattamente 2n tali riessioni sferiche che li scambiano
dallesterno allinterno del disco o viceversa; se il ltro stabile, in base al
Corollario 20.2.14 i suoi n poli sono gi tutti dentro il disco, e quindi ci sono
esattamente n riessioni sferiche (reciproco della coniugazione) che riettono
gli zeri fra interno ed esterno del disco.

La Figura 20.20 mostra la fase della risposta in frequenza ed il ritardo


di gruppo di un ltro PA ottenuto scegliendo a caso 16 poli dentro il disco unitario (ed i corrispondenti zeri reciproci coniugati, ossia riessi sferici
(flip) fuori del disco). Si noti che la fase decrescente. Questi ltri sono
talvolta utilizzati in cascata a ltri che producono incremento di fase, per
compensarne lincremento.
Esercizio 20.4.12. Si trovi la decomposizione in ltro a fase minima e ltro
passa-tutto del ltro con funzione di trasferimento
1
h(z) =
1

a
z
b
z

con |b| < 1 < |a|.

Svolgimento. Fattorizziamo
h(z) =

a 1 az
.
1 zb 1z a
1
z

Segue dalla parte (iii) della Proposizione 20.4.10 che la componente


hpa (z) =

1 az
1
a
z

di tipo PA; daltra parte, la componente


hmin (z) =

1
z

a
1 zb

ha lo stesso polo di prima, in z = b, interno al disco, ma ora il suo unico zero


in z = 1/a, anchesso interno al disco, e quindi la funzione di trasferimento
di un ltro a fase minima (Corollario 20.4.5).

1214CAPITOLO 20. SISTEMI A TEMPO DISCRETO: FILTRI DIGITALI


Funzione di trasferimento: fase

Poli () e zeri (o)

0.5

0.5

1
1

Ritardo di gruppo

Modulo della risposta impulsiva

49.4414

60
50
40
30
20
10

2.402

10

20

30

40

50

Figura 20.20: Diagramma zeripoli, fase della risposta in frequenza, ritardo di gruppo
e modulo della risposta allimpulso di un filtro passa-tutto con 16 poli scelti a caso dentro
il disco unitario in prossimit della sua frontiera, ed ovviamente altrettanti zeri (riflessi
sferici dei poli) fuori del disco

Corollario 20.4.13. Fra tutti i filtri che hanno la stessa ampiezza della
risposta in frequenza, il filtro a fase minima ha il minimo ritardo di gruppo.
Dimostrazione. Questo segue immediatamente dalla
 fattorizzazione (20.25),
d
perch il ritardo di gruppo () = Re z dz ln h z=ei (Denizione 20.3.2)
espresso da un logaritmo, e quindi si spezza in maniera additiva: () =
min () + ap (). Poich il ritardo di gruppo della componente PA positivo
(in base alla parte (ii) della Proposizione 20.4.10), da questo segue che il
ritardo di gruppo minimo si ottiene per il ltro a fase minima.

Nota 20.4.14. Se una coppia costituita da un polo z0 ed uno zero p0 di una


funzione di trasferimento h viene scambiata, ossia se scambiamo z0 con p0 , il
fattore di h dato da
1 zz0
q(z) :=
1 pz0

20.4. FATTORIZZAZIONE FASE MINIMA + PASSA-TUTTO

1215

diventa il reciproco:
qswap (z) :=

1
1

p0
z
z0
z

1
,
q(z)

e quindi la fase della risposta in frequenza diventa lopposto. Se invece la


coppia costituita da due poli o da due zeri, la funzione di trasferimento non
cambia in seguito al loro scambio, e quindi neppure la sua fase.
Se invece si esegue il flip, ossia la riessione sferica, di entrambi il polo e
lo zero, questo corrisponde a scambiarli e poi a rietterli attraverso la retta
uscente dallorigine nella direzione della media aritmetica delle fasi z di z0
e p di p0 , ossia nella direzione di m := (z + p )/2. Se m = 0 o , questa riessione semplicemente la coniugazione complessa; in generale, essa
ottenuta prima ruotando il piano complesso di un angolo m in modo da
risportare la suddetta retta alasse reale, poi applicando la coniugazione complessa e poi ruotando allindietro di m . Pertanto, sotto questa operazione
di swap di polo e zero, la risposta in frequenza cambia nel modo seguente:

= m + ( m ) m ( m ) = 2m
z = ei ei(2m ) = e2im ei
h(z) = h(ei )

1
h(e2im ei )

:= hswap

Fase[h]() Fase[h](2m ) = Fase[hswap ]() .


Se invece si scambiano due zeri, o due poli, il corrispondente fattore della funzione di trasferimento non viene trasformato nel proprio reciproco, e
quindi le ultime due trasformazioni diventano

h(z) = h(ei ) h(e2im ei ) := hswap


Fase[h]() Fase[h](2m ) = Fase[hswap ]()
.

1216CAPITOLO 20. SISTEMI A TEMPO DISCRETO: FILTRI DIGITALI


Poli () e zeri (o)

Poli () e zeri (o)

Poli () e zeri (o)

Poli () e zeri (o)

Ampiezza risp.in freq.

5
4
3
2
1

8
6
4
2

6
4
2

Ampiezza risp.in freq. Ampiezza risp.in freq. Ampiezza risp.in freq.


6
4
2

2
Fase della risposta
2

4.0045

2
Fase della risposta
Fase della risposta
Fase della risposta

0
0
0

2
2
2

2
Ritardo di gruppo
Ritardo di gruppo
Ritardo di gruppo
Ritardo di gruppo
4.1757
0.1751
3.6163
0

0
3.6163

0.1751

4.1757

4.0045

Figura 20.21: Modulo e fase della risposta in frequenza e ritardo di gruppo dei quattro
filtri di ordine 2 con uno zero ed un polo, ottenuti dalla riflessione sferica dallinterno
allesterno della circonferenza unitaria dello zero o del polo o di entrambi: il modulo della
risposta in frequenza lo stesso nei quattro casi. Nella prima colonna in cui sia lo zero sia
il polo sono interni al disco unitario: si tratta quindi del filtro a fase minima. Si verifica
immediatamente quanto dimostrato nel Corollario 20.4.13: per ogni frequenza, in valore
assoluto il ritardo di gruppo Re(z ln h(z)) del filtro a fase minima il pi piccolo di tutti
(in questo caso identico, ma con il segno opposto, a quello del filtro instabile ottenuto
dal flip simultaneo sia del polo sia dello zero.

20.4.5

Filtri a retroazione (feedback )

Una retroazione, o feedback, per un ltro H il ltro F ottenuto dalla disposizione a cascata (detto anche a circuto chiuso) del ltro H seguito da un
ltro G che rinvia allingresso da H il negativo dellazione di G sul segnale

20.4. FATTORIZZAZIONE FASE MINIMA + PASSA-TUTTO

1217

in uscita. Pertanto, indicando con in il segnale in ingresso al ltro H e con


out il segnale in uscita da questo ltro, il segnale in uscita verica
out = H [in G out]
e quindi la funzione di trasferimento del ltro a circuito chiuso risultante
f (z) =

h(z)
Z(out)
=
=
Z(in)
1 + g(z)h(z)

1
h(z)

1
.
+ g(z)

(20.26)

Quando H e G sono ltri causali razionali (ossia di ordine nito), ossia h(z) =
nh (z)/dh (z) e g(z) = ng (z)/dg (z), con nh , dh , ng , dg polinomi nella variabile
1/z, da questo si ottiene
f (z) =

nh (z) dg (z)
.
dh (z) dg (z) + nh (z) ng (z)

(20.27)

Quindi i poli del ltro a retroazione sono gli zeri dellequazione polinomiale
(nella variabile 1/z)
dh (z) dg (z) + nh (z) ng (z) = 0 .

(20.28)

Scegliendo fattori polinomiali di grado sucientemente elevato si hanno sufcienti gradi di libert per ubicare i poli ovunque nel piano complesso, e
quindi, ad esempio, allinterno del disco unitario: quando quasto succede, il
feedback rende stabile il tro risultante (Corollario 20.2.14).
Esempio 20.4.15. Consideriamo un ltro AP (ossia con soli poli, Notazione
20.2.5) con un solo polo al punto z = a esterno al disco unitario, e senza zeri
(naturalmente, questo vuol dire senza zeri al nito, come spiegato nella Nota
20.2.4). Ovvero, la funzione di trasferimento
h(z) =

1
1

a
z

con |a| > 1. Questo ltro instabile (Corollario 20.2.14). Proviamo a renderlo stabile con un feedback di ordine pi basso possibile: proviamo con
ordine 0, ossia con un ltro di feedback con funzione di trasferimento costante, g(z) = k, ossia un controllo sul guadagno del sistema. In base allidentit
(20.26), dopo il feedback si ottiene una nuova funzione di trasferimento
f (z) =

1
1

a
z

+k

1
1+k
a 1
1+k
z

1218CAPITOLO 20. SISTEMI A TEMPO DISCRETO: FILTRI DIGITALI


con un unico polo in z = a/(1 + k). Se k > a il polo ha modulo minore di 1,
e quindi il ltro diventa stabile.

Esempio 20.4.16. Proviamo lo stesso procedimento per stabilizzare un ltro


del secondo ordine, con funzione di trasferimento
h(z) =

1
1

a
z

b
z2

scegliamo b R, ed assumiamo il ltro causale (ossia scegliamo per h una


corona di convergenza esterna ai due poli, Corollario 20.2.10). Sappiamo
dallEsempio 20.2.17 che questo ltro stabile se e solo se |b| < 1 e |a| < 1+b.
Assumiamo che questo ltro sia instabile, considerando separatamente i due
casi possibili:
(1) |b| > 1;
(2) |b| < 1 e |a| > 1 + b.

Ora procediamo a stabilizzare questo ltro instabile con ltri di feedback


di vari ordini.
(i) Proviamo di nuovo ad usare un feedback di ordine 0, con funzione di
trasferimento g(z) = k. La costante k misura il guadagno del feedback:
per semplicit, scegliamo k reale positivo. Da (20.26) otteniamo la
funzione di trasferimento modicata
1
f (z) =
1 + k az +

b
z2

1
1+k
a 1
b
1
+ 1+k
1+k z
z2

Questo nuovo ltro stabile se e solo se |b|/(1+k) < 1 (ossia k > |b|1)
e |a|/(1 + k) < 1 + (b/(1 + k)), ossia |a| < 1 + k + b.
Nel primo caso, ossia |b| > 1, il ltro risulta stabile se e solo se k > |b|1
e k > |a| b 1. Nel secondo caso, ossia |b| < 1 e |a| > 1 + b, la
condizione k > |b| 1 sempre vericata perch k > 0, e quindi il ltro
risulta stabile se e solo se |a| < 1+k +b, ossia k > |a|b1: la seconda
condizione impone una limitazione su k perch ora |a| b 1 > 0.
(ii) Proviamo ad usare un ltro di feedback del primo ordine, con funzione
di trasferimento g(z) = k/z. Da (20.26) otteniamo ora la seguente
funzione di trasferimento modicata:
1
1
=
.
f (z) =
b
k
a
ka
(1 z + z 2 ) + z
1 + z + zb2

20.4. FATTORIZZAZIONE FASE MINIMA + PASSA-TUTTO

1219

In base allEsempio 20.2.17 questo nuovo ltro stabile se e solo se


|b| < 1 e |k a| < 1 + b; la seconda condizione equivale a a b 1 <
k < a + b + 1.
Allora, partiamo con un ltro h instabile e cerchiamo di stabilizzarlo con un feedback del primo ordine. Nel caso in cui h sia instabile
a causa della condizione (1) ci non possibile ed il ltro rimane instabile per qualunque scelta del guadagno di feedback k; nel caso (2)
(ossia |a| > 1 + b) si ha a b 1 > 0, e la condizione di stabilit
a b 1 < k < a + b + 1 impone quindi una restrizione non solo
superiore ma anche inferiore ai valori del guadagno k.
(iii) Proviamo inne ad usare un feedback del secondo ordine, con funzione
di trasferimento g(z) = k/z 2 . Da (20.26) ora si ottiene
f (z) =

(1

a
z

1
+ zb2 ) +

k
z2

1
1 +
a
z

b+k
z2

Sempre per lEsempio 20.2.17 questo ltro f stabile se e solo se |b +


k| < 1 e |a| < 1 + b + k. La prima condizione equivale a 1 b < k <
1 b, e la seconda a k > a b 1, ossia k > |a| b 1. Questultima
condizione pi forte di una delle disuguaglianze ottenute dalla prima
condizione, e precisamente k > b 1: quindi lintervallo di stabilit
|a| b 1 < k < 1 b .

Se si parte con un ltro instabile h, nel caso (2) di instabilit di h questo


intervallo di stabilit di f non ulteriormente ristretto dalla condizione
|a| > 1 + b perch essa equivale a |a| b 1 > 0, ed abbiamo assunto
k > 0. Invece nel caso (1) (ossia |b| > 1), se b > 0 si ottiene 1 b < 0
e quindi non ci sono guadagni k positivi che stabilizzano il ltro h: ma
ce ne sono negativi, e lasciamo al lettore il compito di ripetere i calcoli
per k < 0.

Esercizio 20.4.17. Si deduca dal precedente Esempio che non ci sono valori del
guadagno di feedback k che permettono di stabilizzare il ltro con funzione
di trasferimento
1
1
1 2z + z32

1220CAPITOLO 20. SISTEMI A TEMPO DISCRETO: FILTRI DIGITALI


tramite un feedback del primo ordine g(z) = k/z o del secondo ordine
g(z) = k/z 2 , ma, se si usa un feedback di ordine zero g(z) = k, allora i
valori che rendono stabile il ltro sono k > 2.
Nelle prossime Figure 20.22, 20.23, 20.24, 20.25, 20.26 illustriamo la risposta
in frequenza di questo ltro instabile del secondo ordine e delle sue tre stabilizzazioni di ordine 0, 1 e 2, con guadagno, rispettivamente, k = 3, 2.5, 2.1, 2
e 1.9. Con feedback di ordine 1 e 2 non si ottiene mai stabilizzazione. Il feedback di ordine zero stabilizza il ltro per i primi tre valori del guadagno, ma
via via pi lentamente allavvicinarsi alla soglia k = 2: per il valore di soglia
k = 2, la risposta allimpulso del ltro con feedback si mantiene limitata ma
oscilla, invece di tendere a zero. Il feedback di ordine 0 ma guadagno k = 1.9
non d luogo a stabilizzazione.

Esercizio 20.4.18. Consideriamo il ltro con funzione di trasferimento


h(z) =

1+
1+

a
z
b
z

Applichiamo in cascata a questo ltro un feedback del primo ordine, con


funzione di trasferimento
1 + zc
.
g(z) =
1 + zd
Si trovino i valori di c e d per cui il tro risultante ha funzione di trasferimento
f con un polo doppio (ossia del secondo ordine) a z = 1.
Svolgimento. Da (20.27) si ottiene
f (z) =
=

(1 + az )(1 + dz )
h(z)
=
1 + g(z)h(z)
(1 + zb )(1 + dz ) + (1 + az )(1 + zc )
(1 + az )(1 + dz )
.
ac+bd
+
2 + a+b+c+d
2
z
z

Richiedere che f abbia un polo del secondo ordine equivale a richiedere che
il suo denominatore abbia uno zero del secondo ordine non bilanciato da zeri
al numeratore. Gli zeri el denominatore sono ai punti a e d: quindi ssiamo
a 6= 1 e limitiamo lattenzione a d 6= 1. Osserviamo che il denominatore un

20.4. FATTORIZZAZIONE FASE MINIMA + PASSA-TUTTO

11

x 10

Filtro senza feedback:


risposta ad impulso

Feedback di ordine 0:
guadagno = 3

0.03

0.02

1
0

1221

0.01

10

11

x 10

20

30

40

50

Feedback di ordine 1:
guadagno = 3

10

18

x 10

20

30

40

50

Feedback di ordine 2:
guadagno = 3

10

4
3

2
1
0

10

20

30

40

50

10

20

30

40

50

Figura 20.22: Modulo della risposta allimpulso del filtro instabile 1 11+ 3 dellEsercizio
2z

z2

20.4.17, corretto con feedback di guadagno 3 e di ordine 0 oppure 1 oppure 2: solo il


feedback di ordine 0 stabilizza il filtro

polinomio quadratico nella variabile 1/z, del tipo p(1/z) = 2 + z + z2 con


:= a + b + c + d e := ac + bd. Vogliamo trovare per quali valori di c e d
(in funzione dei parametri a e b) si ha

2


 
1
2
1
1
=C 1
=C 1 + 2
p
z
z
z z
per qualche costante C 6= 0. Uguagliando i limiti allinnito si vede subito che
deve essere C = 2. Da questo segue = 4 e = 2, ossia c + d = 4 a b
e ad + bc = 2. Si hanno soluzioni solo se a 6= b (caso in cui il determinante di
questo sistema lineare zero) oppure se a = b ma 4 + a + b = 2/a, nel qual

1222CAPITOLO 20. SISTEMI A TEMPO DISCRETO: FILTRI DIGITALI

11

x 10

Filtro senza feedback:


risposta ad impulso

Feedback di ordine 0:
guadagno = 2.5
0.05

0.04
0.03

0.02
1
0.01
0

10

11

x 10

20

30

40

50

Feedback di ordine 1:
guadagno = 2.5

10

17

x 10

20

30

40

50

Feedback di ordine 2:
guadagno = 2.5

2
2

1
0

10

20

30

40

50

10

20

30

40

50

Figura 20.23: Modulo della risposta allimpulso del filtro instabile della Figura 20.22
corretto con feedback di guadagno 2.5 : la stabilizzazione si ha per lo stessio ordine zero
come prima

caso il sistema ridondante e d luogo ad una famiglia nadnun parametro di


soluzioni, c = d 2/a. Nel caso generale di determinante non nullo (a 6= b),
lunica soluzione
d=

2 + (5 + a)b
ab

c=

2 + (5 + a)b
2 + 4a + b + a2 b2 + ab
4ab=
.
ab
ab

20.5. FILTRI AZ E FILTRI AP

11

x 10

1223

Filtro senza feedback:


risposta ad impulso

Feedback di ordine 0:
guadagno = 2.1

0.06

0.04

0.02

10

11

x 10

20

30

40

50

Feedback di ordine 1:
guadagno = 2.1

10

16

x 10

20

30

40

50

Feedback di ordine 2:
guadagno = 2.1

15

3
10
2
5

1
0

10

20

30

40

50

10

20

30

40

50

Figura 20.24: Modulo della risposta allimpulso del filtro instabile della Figura 20.22
corretto con feedback di guadagno 2.1 : la stabilizzazione si ha ancora per ordine zero, ma
pi lenta

20.5

Filtri AZ e filtri AP

20.6

Diagrammi di flusso di filtri digitali lineari

Abbiamo visto che, per un ltro digitale lineare, vale lidentit (20.15). Il
ltro stabile se e solo se tutti i suoi poli z vericano |z | < 1 (Corollario
20.2.14).
Esercizio 20.6.1. (Funzione di trasferimento di un filtro FIR.) Vericare, a partire dalla Nota 20.2.20, che il ltro con risposta allimpulso nita
(ossia di tipo FIR) se al denominatore della sua funzione di trasferimento nel

1224CAPITOLO 20. SISTEMI A TEMPO DISCRETO: FILTRI DIGITALI

11

x 10

Filtro senza feedback:


risposta ad impulso

Feedback di ordine 0:
guadagno = 2

0.06

0.04

0.02

10

11

x 10

20

30

40

50

Feedback di ordine 1:
guadagno = 2

x 10

10

10

20

30

40

10

16

50

10

20

30

40

50

Feedback di ordine 2:
guadagno = 2

20

30

40

50

Figura 20.25: Modulo della risposta allimpulso del filtro instabile della Figura 20.22
corretto con feedback con guadagno alla soglia critica 2 : non si ha pi stabilizzazione
neppurea per ordine zero, al quale la risposta allimpulso oscillante ma rimane limitata

terzo termine di (20.15),


h(z) =

m
m
1 X mi X i
a
z
=
ai z ,
i
z m i=0
i=0

non nullo solo il coeciente del monomio di grado massimo, che, rammentiamo, vale 1 per costruzione (si vedano le identit (20.2) e (20.15)).

Segue dal precedente Esercizio 20.6.1 che, in un ltro FIR con la notazione
di (20.15), la funzione di trasferimento un polinomio di grado m in z 1 ,

20.6. DIAGRAMMI DI FLUSSO DI FILTRI DIGITALI LINEARI

11

x 10

Filtro senza feedback:


risposta ad impulso

Feedback di ordine 0:
guadagno = 1.9

0.15

0.1

0.05

10

11

x 10

20

30

40

50

Feedback di ordine 1:
guadagno = 1.9

10

16

x 10

20

30

40

50

Feedback di ordine 2:
guadagno = 1.9

4
3

1225

10

20

30

40

50

10

20

30

40

50

Figura 20.26: Modulo della risposta allimpulso del filtro instabile della Figura 20.22
corretto con feedback con guadagno sotto la soglia critica 2 : non si ha pi stabilizzazione
neppurea per ordine zero, al quale la risposta allimpulso diverge

e quindi ha m zeri (ovvero radici) z 6= 0 ed un polo banale di ordine m a


z = 0 (banale perch inevitabile che il polinomio in z 1 non sia denito
in z = 0). Per questo motivo un ltro FIR si chiama anche un sistema
discreto a soli zeri. In Figura 20.27 presentiamo il suo diagramma di usso
(i quadrati rappresentano moltiplicazioni ed i cerchi somme). Il diagramma
di usso una rappresentazione graca del procedimento iterativo illustrato
nella Proposizione 20.2.3.
Se invece la funzione di trasferimento non ha solo i poli banali a z = 0,
sappiamo, sempre dalla Nota 20.2.20, che il ltro ha risposta allimpulso

1226CAPITOLO 20. SISTEMI A TEMPO DISCRETO: FILTRI DIGITALI


fn

z -1

z -1

a0

a1

z -1

z -1

a2

a3

a4

gn

Figura 20.27: Diagramma di flusso di un filtro FIR (funzione di trasferimento con soli
zeri)

innita (IIR). Il caso estremo di soli poli si ha quando tutti i coecienti


an del numeratore sono nulli tranne a0 . Il corrispondente diagramma di
usso ricavato da (20.14) in Figura 20.28 (si noti il segno meno davanti ai
coecienti b1 , . . . , br ottenuto in (20.14).

fn

gn

z -1
+

-b1

z -1
+

-b2

z -1
+

-b3

z -1
-b4

Figura 20.28: Diagramma di flusso di un filtro IIR con funzione di trasferimento con
soli poli)

Inne, nel caso di una funzione di trasferimento che ha sia poli sia zeri,

20.6. DIAGRAMMI DI FLUSSO DI FILTRI DIGITALI LINEARI

1227

il ltro IIR ha il diagramma di usso come in Figura 20.29.


a0

fn

gn

z -1

z -1
a1

-b1

z -1

z -1
a2

-b2

z -1

z -1
a3

-b3

z -1

z -1
a4

-b4

Figura 20.29: Diagramma di flusso di un filtro IIR con funzione di trasferimento con
zeri e poli)

1228CAPITOLO 20. SISTEMI A TEMPO DISCRETO: FILTRI DIGITALI

Parte VI
Wavelets e compressione dei
segnali
(redazione di Sandra Saliani)

1229

Capitolo 21
Il sistema di Haar
Cominciamo adesso una parte dellopera dedicata allo studio delle wavelts,
che traduciamo in italiano come ondicelle, redatta in collaborazione con Sandra Saliani. Le ondicelle costituiscono famiglie di basi in L2 particolarmente
opportune per la decomposizione di segnali. La presentazione in questo e nei
successivi Capitoli 22, 23 e 24 tratta da [34].
In questo capitolo presentiamo il sistema di Haar come prototipo di base di ondicelle. Indrodurremo in questo caso particolare vari concetti che
verranno poi riesaminati nella costruzione di basi di ondicelle in generale e
nellanalisi in multirisoluzione (MRA).

21.1

Intervalli diadici

Definizione 21.1.1. Deniamo gli intervalli diadici. In R gli intervalli del


tipo
k k+1
Ij,k = [ j , j )
2
2
con k, j Z, si chiamano intervalli diadici.
Proposizione 21.1.2. Siano j0 , j1 , k0 , k1 Z dove o j0 6= j1 , oppure k0 6= k1 .
Si ha
1) Ij0 ,k0 Ij1 ,k1 = , oppure
2) Ij0 ,k0 Ij1 ,k1 , oppure
1231

1232

CAPITOLO 21. IL SISTEMA DI HAAR

0
2

I0,1

0.25

I2,0

1.5

I1,2

Figura 21.1: Esempi di intervalli diadici. Da sinistra (j, k) = (0, 1), (2, 0), (1, 2).
3) Ij1 ,k1 Ij0 ,k0 .
Negli ultimi due casi lintervallo pi piccolo contenuto o nella met destra
o nella met sinistra del pi grande.
Dimostrazione. Se j0 = j1 allora, per ipotesi, k0 6= k1 , supponiamo che sia
2kj10 e gli intervalli sono disgiunti.
k0 < k1 . Allora k20j+1
0
Supponiamo che j0 6= j1 e che si abbia:
k0
k1
k0 + 1
k1 + 1
<
<
<
.
j
j
j
20
21
20
2j 1

(21.1)

Moltiplicando per 2j0


k0 < k1 2j0j1 < k0 + 1 < (k1 + 1)2j0 j1 ,
quindi si deve avere 2j0 j1 < 1 ossia j0 < j1 .
Analogamente, moltiplicando per 2j1
2j1 j0 k0 < k1 < 2j1 j0 (k0 + 1) < k1 + 1,
quindi si deve avere 2j1 j0 < 1 ossia j1 < j0 , ed otteniamo una contraddizione.
Allora in (21.1) c almeno un segno di uguaglianza.
k0
k1
k0 + 1
k1 + 1
Se j0 = j1 non pu essere
=
altrimenti j0 = j1 contro
j
2
2
20
2j 1
lipotesi. Allora l intervallo pi piccolo (di lunghezza minore o uguale alla
met dellaltro) contenuto nella met sinistra dellaltro.
k0 + 1
k1
gli intervalli sono disgiunti.
Se j1 =
2
2j 0

21.2. FUNZIONI SEMPLICI DIADICHE


2.5

2.5

1.5

1.5

0.5

0.5

0.5

0.5

1.5
2

1.5
4

0.25 0.25

11.25

1233

Figura 21.2: Esempi di funzioni semplici diadiche. Scala j = 2 a sinistra, j = 2 a

destra.

k0 + 1
k1 + 1
k0
k1
Inne se
=
non
pu
essere
=
altrimenti j0 = j1
2j 0
2j 1
2j 0
2j 1
contro lipotesi. Allora l intervallo pi piccolo contenuto nella met destra
dellaltro.

s
Notazione 21.1.3. Dato un intervallo diadico Ij,k denoteremo con Ij,k
la
d
met sinistra dellintervallo, e con Ij,k la met destra dellintervallo. Si noti
s
d
che Ij,k
= Ij+1,2k mentre Ij,k
= Ij+1,2k+1.

21.2

Funzioni semplici diadiche

Definizione 21.2.1. Una funzione semplice diadica una funzione semplice


costante su tutti gli intervalli diadici Ij,k per j Z ssato, al variare di k Z.
In tal caso la funzione si dice funzione semplice diadica a scala j.
Se I R un intervallo, una funzione semplice diadica con supporto contenuto in I si dice funzione semplice diadica su I. Il supporto di f denito
da suppf = {x R | f (x) 6= 0}.
Nota 21.2.2.
1. Se j Z ssato, linsieme delle funzioni semplici diadiche a scala j uno spazio vettoriale reale.
2. Se j Z ed I R sono ssati, linsieme delle funzioni semplici diadiche
a scala j su I uno spazio vettoriale reale.

1234

CAPITOLO 21. IL SISTEMA DI HAAR

1.4

0
0

0
0

0
0

0.5

Figura 21.3: Da sinistra: (x), 0,1 (x), 1,0 (x)


3. Se f una funzione semplice diadica a scala j su I, e se j1 j, allora
f una funzione semplice diadica a scala j1 .

21.3

Il sistema di Haar su R

Definizione 21.3.1. Poniamo


(x) = [0,1) (x) =
e, per ogni j, k Z,

1 se 0 x < 1,
0
altrimenti,

(21.2)

j,k (x) = 2j/2(2j x k) = D2j (Tk )(x)

(dilatazione seguita da traslazione).


La collezione (j,k )j,kZ si chiama sistema delle funzioni di scala di Haar su
R.
Si osservi che j,k (x) = 2j/2 Ij,k (x) e j,k (x) 6= 0 su Ij,k . Inoltre
Z
Z
1
2j/2
j/2
j,k (x) dx = 2
dx = 2j/2 |Ij,k | = j = j/2 .
2
2
Ij,k
R
Z
Z
2
j
|j,k (x)| dx = 2
dx = 2j |Ij,k | = 1.
R

Ij,k

21.4. ORTOGONALIT DEL SISTEMA DI HAAR

1235

1.4
1

0.5

1.5

1.4
0 0.5 2

Figura 21.4: Da sinistra: (x), 0,1 (x), 1,0 (x)


Definizione 21.3.2. Poniamo
(x) = [0,1/2) (x) [1/2,1) (x),

e, per ogni j, k Z,

(21.3)

j,k (x) = 2j/2 (2j x k) = D2j (Tk )(x).

La collezione (j,k )j,kZ si chiama sistema di Haar su R.

Si osservi che
i
h
i
h
j,k (x) = 2j/2 I s (x) I d (x) = 2j/2 Ij+1,2k (x) Ij+1,2k+1 (x) ,
j,k

j,k

in particolare j,k (x) 6= 0 su Ij,k . Inoltre


Z
Z
Z
j/2
j,k (x) dx = 2
dx
R

Ij+1,2k

21.4

|j,k (x)| dx = 2

dx

Ij+1,2k+1

dx +

Ij+1,2k

Ij+1,2k+1

2j/2
2j/2

= 0.
2j+1 2j+1
!
dx

= 1.

Ortogonalit del sistema di Haar

Dimostreremo che il sistema di Haar su R un sistema ortogonale in L2 (R) .


Ricordiamo che, nel caso di funzioni di
Z
2
L (R) = {f : R C |
|f (x)|2 dx < +},
R

1236

CAPITOLO 21. IL SISTEMA DI HAAR


1
sin(x)
sin(2x)

Figura 21.5: Il sistema (sin (nx))nN


si denisce il prodotto scalare come
< f, g >=

f (x)g(x) dx.

Si noti che, per la disuguaglianza di Cauchy-Schwarz, si ha


1/2
1/2 Z
Z
2
2
|g(x)| dx
< +.
|f (x)| dx
|< f, g >|
R

Una collezione di funzioni in L2 (R) , (fi )iI , si dice sistema ortogonale se



Z
0
j 6= i
< fi , fj >=
fi (x)fj (x) dx = R
2
|f (x)| dx j = i.
R
R i
R
Se poi R |fi (x)|2 dx = 1, il sistema ortogonale si dice ortonormale. Si pu
introdurre un analoga denizione per funzioni denite in un intervallo.

Esempio 21.4.1. Se I = [, ], i sistemi (sin (nx))nN e (cos (nx))nN , sono


ortogonali in L2 (I) .

Ritorniamo ora al sistema di Haar. Osserviamo che dalle propriet che


seguono la Denizione 21.3, si ha j,k L2 (R) .

Teorema 21.4.2. Il sistema di Haar su R, (j,k )j,kZ, un sistema ortonormale per L2 (R) .
Dimostrazione. Si deve provare che per ogni coppia (j0 , k0 ) e (j1 , k1 ) si ha

Z
1 j0 = j1 , k0 = k1 ,
j0 ,k0 (x)j1 ,k1 (x) dx = j0 ,j1 k0 ,k1 =
0
altrimenti.
R

21.4. ORTOGONALIT DEL SISTEMA DI HAAR

1237

Fissiamo dapprima una scala j Z.


Siano k0 , k1 Z, allora

Ij,k0 k0 = k1 ,
Ij,k0 Ij,k1 =
altrimenti.
Nel caso in cui k0 = k1 :
Z
Z
|j,k0 (x)|2 dx = 1.
j,k0 (x)j,k1 (x) dx =
R

Nel caso in cuihk0 6= k1 :


i
j,k0 (x) = 2j/2 Ij+1,2k (x) Ij+1,2k +1 (x) ha supporto Ij,k0 , disgiunto dal
0
0
i
h
j/2
Ij+1,2k (x) Ij+1,2k +1 (x) . Quindi si ha
supporto Ij,k1 di j,k1 (x) = 2
1

sempre j,k0 (x)j,k1 (x) = 0, e lasserto dimostrato.


Prendiamo scale diverse. Siano j0 , j1 Z, j0 > j1 , k0 , k1 Z. Ci sono tre
possibilit:
1) Ij0 ,k0 Ij1 ,k1 = . Come sopra j0 ,k0 (x)j1 ,k1 (x) = 0 in ogni punto e
lintegrale si annulla.
2) Ij0 ,k0 Ijs1 ,k1 . Allora in ogni punto j0 ,k0 (x)j1 ,k1 (x) = 2j1 /2 j0 ,k0 (x),
da cui
Z
Z
j1 /2
j0 ,k0 (x)j1 ,k1 (x) dx = 2
j,k0 (x) dx = 0.
R

3) Ij0 ,k0 Ijd1 ,k1 . Allora, come nel caso precedente, j0 ,k0 (x)j1 ,k1 (x) =
2j1 /2 j0 ,k0 (x), da cui
Z
Z
j1 /2
j,k0 (x) dx = 0.
j0 ,k0 (x)j1 ,k1 (x) dx = 2
R

Nota 21.4.3. Dalla dimostrazione del teorema precedente si evince che, ssata
una scala J Z, si ha un sistema ortonormale (J,k )kZ .
Per quanto riguarda il sistema (j,k )j,kZ, esso non assolutamente un sistema
ortonormale ma, se ssiamo una scala, lo .

1238

CAPITOLO 21. IL SISTEMA DI HAAR

Teorema 21.4.4. Se si fissa una scala J Z, il sistema delle funzioni a


scala di Haar su R, (J,k )kZ , un sistema ortonormale per L2 (R) .
Dimostrazione. (Esercizio).
Teorema 21.4.5. Se si fissa una scala J Z, il sistema
{J,k , k Z} {j,k , j J, k Z},
un sistema ortonormale in L2 (R) .

21.5

Il Lemma di divisione

Lemma 21.5.1. Sia j Z. Sia gj (x) una funzione semplice diadica a scala
j. Allora esistono due funzioni rj1 (x) e gj1(x) tali che
gj (x) = rj1(x) + gj1(x),
dove
1) rj1(x) =

aj1,k j1,k (x),

aj1,k R;

2) gj1(x) una funzione semplice diadica a scala j 1.


Dimostrazione. Lidea della dimostrazione la seguente. Assumiamo che la
funzione semplice diadica gj assuma valori cj,k nellintervallo Ij,k .
Si considera la media dei due valori sulla parte destra e sinistra, ossia si
denisce
1
s
d
gj1(x) = (cj,2k + cj,2k+1) se x Ij1,k = Ij1,k
Ij1,k
= Ij,2k Ij,2k+1.
2
Si chiama rj1 (x) la dierenza gj (x) gj1(x) e si osserva che una funzione
semplice diadica a scala j. Essa verica la 1). Infatti, da un calcolo diretto, si
deduce che il valore di rj1 sulla parte sinistra di Ij1,k pari allopposto del
valore sulla sua parte destra, ossia rj1 (x) multiplo di j1,k (x) su Ij1,k .

21.6. SISTEMI ORTONORMALI COMPLETI

21.6

1239

Sistemi ortonormali completi

Sia I R un intervallo e sia (fn )nN una successione di funzioni in L2 (I).


Definizione 21.6.1. Linsieme generato dalle fn , denotato con < fn , n
N >, linsieme di tutte le combinazioni lineari nite di elementi di {fn , n
N}, ossia
g < fn , n N > g =

N
X
i=1

ci fi , per N N, c1 , . . . , cN C.

< fn , n N >, uno spazio vettoriale complesso, la sua chiusura per la


norma L2 denotata con < fn , n N >. Si ha
g < fn , n N > Per ogni > 0, esiste f < fn , n N > tale che
1/2
Z
2
| g(x) f (x) | dx
= kg f k2 < .
I

Teorema 21.6.2. Sia {fn , n N} un sistema ortonormale sullintervallo I



R
f (x)fm (x) dx = n,m . Sia g L2 (I) , allora
I n
g < fn , n N > g =

< g, fn > fn

nN

lim kg
n

Pn

h=0

nella norma L2 (21.4)

< g, fh > fh k2 = 0.

Se ogni funzione in L2 (I) si pu rappresentare come in (21.4), allora


diremo che il sistema ortonormale {fn , n N}, completo.
Definizione 21.6.3. Sia {fn , n N} un sistema ortonormale per L2 (I) .
Esso si dice completo se < fn , n N > = L2 (I) . In tal caso (fn )nN si dice
base ortonormale di L2 (I) .
Di seguito elenchiamo dei criteri equivalenti anch un sistema ortonormale sia completo.
Teorema 21.6.4. Sia (fn )nN un sistema ortonormale per L2 (I) . Le seguenti proposizioni sono equivalenti:
a) (fn )nN completo;

1240

CAPITOLO 21. IL SISTEMA DI HAAR

b) Per ogni g L2 (I) , g =

nN

< g, fn > fn , nella norma L2 ;

c) Per ogni g continua a supporto compatto su I, g < fn , n N >;


d) Per ogni g continua a supporto compatto su I,
Z
X
2
kgk2 = | g(x) |2 dx =
|< g, fn >|2 ,
I

nN

(uguaglianza di Parseval).

21.7

Completezza del sistema di Haar su R

Consideriamo le funzioni e denite,rispettivamente, da (21.2) e (21.3).


Consideriamo le funzioni j,k e j,k ottenute per dilatazione e traslazione da
queste. Proveremo che il sistema (ortonormale) di Haar (j,k )j,kZ completo in L2 (R). A tal ne deniremo dei sottospazi di L2 (R) , (alcuni generati
dalle j,k , al variare di k Z, altri generati dalle j,k , al variare di k Z)
e le proiezioni ortogonali su essi. Il procedimento che seguiremo servir ad
introdurre il metodo di multirisoluzione in questo esempio particolare, esso
verr sviluppato in generale nel Capitolo 2.
Definizione 21.7.1. Sia j Z. Deniamo Vj come lo spazio generato dallinsieme {j,k , k Z}, ossia come il pi piccolo sottospazio chiuso di L2 (R)
che contenga linsieme assegnato. Si denota con
Vj = < j,k , k Z >.
Deniamo Pj la proiezione ortogonale su Vj , ossia Pj : L2 (R) L2 (R)
associa ad ogni f L2 (R)
X
Pj f =
< f, j,k > j,k .
(21.5)
kZ

In base alla denizione, ogni elemento di Vj pu essere approssimato, nella


norma kk2 con combinazioni lineari nite delle funzioni j,k , k Z.
Si ricordi che j,k = 2j/2 Ij,k quindi, per f L2 (R) ,
!
Z
< f, j,k > j,k (x) = 2j

f (y) dy

Ij,k

j,k

(x).

21.7. COMPLETEZZA DEL SISTEMA DI HAAR SU R


Se x Ij,k ,
Pj f (x) = 2

1241

f (y) dy

Ij,k

rappresenta il valore medio di f su Ij,k . Per tale motivo Pj f fornisce una


versione grossolana di f alla risoluzione 21j . I dettagli di f pi piccoli di 21j
sono oscurati mentre, se maggiori di 21j , rimangono visibili.
Pj ben denita, ossia la somma in (21.5) converge in L2 (R) . Infatti se
N <M
X
X
k
< f, j,k > j,k
< f, j,k > j,k k22
|k|N
|k|M
X
= k
< f, j,k > j,k k22
N <|k|M
Z
X
X
=
< f, j,k > j,k (x)
< f, j,h > j,kh(x) dx
R
N <|k|M
N <|h|M
Z
X
=
< f, j,k >< f, j,h >
2j k,h dx
Ij,k Ij,h
N <|k|,|h|M
X
=
|< f, j,k >|2
(21.6)
N <|k|M
per lortonormalit del sistema {j,k , k Z}. Ora la disuguaglianza di Bessel
(valida per ogni sistema ortonormale (gn )nZ ), aerma che, per ogni f Z
X
|< f, gn >|2 kf k22.
nZ

Quindi (21.6) la coda di una serie convergente e, per N, M + si ha


X
|< f, j,k >|2 0,
N <|k|M
P
quindi la successione delle combinazioni lineari, |k|N < f, j,k > j,k ,
N N, di Cauchy e converge, nella norma di L2 (R) , ad un elemento di
< j,k , k Z > = Vj .

1242

21.8

CAPITOLO 21. IL SISTEMA DI HAAR

Il sistema di Haar su [0, 1]

Consideriamo quelle funzioni del sistema di Haar su R il cui supporto


contenuto nellintervallo [0, 1]. Faremo vedere che tale sistema contribuisce
alla costruzione di un sistema ortonormale completo per lo spazio L2 [0, 1].
Siano e denite, rispettivamente, da (21.2) e (21.3). Se ci limitiamo
allintervallo [0, 1], osserviamo che solo per le scale j 0 e solo per alcune
traslazioni k le funzioni j,k e j,k hanno supporto contenuto allinterno di
[0, 1].
Consideriamo, per J 0, linsieme
{J,k | 0 k 2J 1} {j,k | j J, 0 k 2j 1},

che chiameremo il sistema di Haar su [0, 1] a scala J. Proveremo che esso


forma un sistema ortonormale completo per L2 [0, 1].

21.9

Ortonormalit del sistema di Haar su [0, 1]

Lemma 21.9.1. Sia f : [0, 1] R una funzione continua. Per ogni > 0
esistono J > 0 e g, funzione diadica a scala J con supporto contenuto in
[0, 1], tale che, per ogni x [0, 1),
|f (x) g(x)| < .
Dimostrazione. Fissato > 0, per luniforme continuit della f si pu trovare
> 0 tale che |f (x) f (y)| < ogni volta che x, y [0, 1] e |x y| < .
1
Si prenda J > 0 grande in modo che J < e si considerino gli intervalli
2


k k+1
diadici IJ,k =
,
, k = 0, . . . , 2J 1, che partizionano lintervallo
2J 2J
[0, 1). Si denisca
 
k
, x IJ,k .
g(x) = f
2J


Se x [0, 1) esiste una ed una sola
k per cui x IJ,k , da cui x 2kJ 21J <

e |f (x) g(x)| = f (x) f ( 2kJ ) < .

Teorema 21.9.2. Per ogni N > 0 fissato, il sistema di Haar su [0, 1]



N,k | 0 k 2N 1 j,k | j N, 0 k 2j 1
(21.7)
un sistema ortonormale completo su [0, 1].

21.9. ORTONORMALIT DEL SISTEMA DI HAAR SU [0, 1]

1243

Dimostrazione. Sia N > 0. Lortonormalit del sistema (21.7) discende


dal Teorema 21.4.5. Dimostreremo la sua completezza utilizzando la (c) del
Teorema 21.6.4.
Sia f una funzione continua in [0, 1] e sia > 0. Siano J > 0 e g come previsti
dal Lemma 21.9.1. Ne segue che
kf gk2 =

Z

1/2
|f (x) g(x)| dx
< .
2

Ora g una funzione a scala J, quindi a scala Je per ogni Je > J, ne consegue
che possiamo supporre J > N.
La dimostrazione sar completata se faremo vedere che g si pu scrivere
come combinazione lineare nita del sistema di Haar a scala N.
Per il Lemma di divisione applicato a g e J, vedi Lemma 21.5.1, si trovano
due funzioni rJ1 e gJ1 tali che
1) g = gJ = rJ1 + gJ1,
X
2) rJ1 =
aJ1,k J1,k con aJ1,k R,
k

3) gJ1 una funzione semplice diadica a scala J 1.


Entrambe le funzioni rJ1 e gJ1 hanno supporto contenuto in [0, 1].
Ripetendo questa divisione per gJ1 , e le altre cos trovate, dopo un numero
nito di passi otteniamo
g = rJ1 + rJ2 + + rJ(JN ) + gJ(JN )
= rJ1 + rJ2 + + rN + gN
dove
rJi =

i 1
2JX

J iN

aJi,k Ji,k ,

k=0

e gN una funzione semplice a scala N con supporto in [0, 1], ossia gN =


P2N 1
k=0 bN,k N,k . Per lortonormalit del sistema allora
g=

N 1
2X

k=0

< g, N,k > N,k +

J1 2X
1
X
i=N k=0

< g, i,k > i,k .

1244

CAPITOLO 21. IL SISTEMA DI HAAR

Inne si dimostra facilmente che, per lapprossimazione di f con g si ha


lapprossimazione di f , nella norma kk2 , con
N 1
2X

< f, N,k > N,k +

J1 2X
1
X

< f, i,k > i,k .

i=N k=0

k=0

Infatti, posto fN la somma di cui sopra, per la disuguaglianza triangolare,


lortonormalit del sistema e la disuguaglianza di Bessel
kf fN k2 kf gk2 + kg fN k2
+k

N 1
2X

k=0

< g f, N,k

N 1
2X

= +

k=0

J1 2X
1
X
< g f, i,k > i,k k2
> N,k +
i=N k=0
i

|< g f, N,k >|2 +

+ kf gk2

J1 2X
1
X
i=N k=0

1/2

|< g f, i,k >|2

2
e il teorema dimostrato.

Nota 21.9.3. Si osservi che pi la scala j grande, pi piccolo il supporto


delle j,k e j,k . Ci si esprime dicendo che le j,k e j,k sono ben localizzate
nel tempo.
Come conseguenza, una funzione f, nulla al di fuori di un piccolo intervallo,
avr molti coecienti di Haar < f, j,k > e < f, j,k > uguali a zero.

21.10

Localizzazione delle discontinuit

La particolarit del sistema di Haar quella di dare unindicazione sulla posizione delle discontinuit (non eliminabili) di una funzione dallesame dei
suoi coecienti di Haar.

21.10. LOCALIZZAZIONE DELLE DISCONTINUIT

1245

x0

Figura 21.6: Il salto in x0

Per semplicit assumiamo che f abbia un salto in x0 . Supponiamo che


esistano i limiti
lim f (x) = f (x
0 ),

xx
0

lim f (x) = f (x+


0 ),

xx+
0

e che f C 2 [0, x0 ] C 2 [x0 , 1] quando denita a destra e sinistra di x0 come


sopra. Fissiamo una scala j e consideriamo i due casi x0 Ij,k e x0
/ Ij,k .
o
1 caso) x0
/ Ij,k .
Scriviamo la formula di Taylor di f al primo ordine, nel punto medio xj,k =
1
(k + 12 ) di Ij,k , con il resto in forma di Lagrange
2j
f (x) = f (xj,k ) + f (xj,k )(x xj,k ) +

f (j,k )
(x xj,k )2 ,
2

dove j,k Ij,k . Si ha


Z
< f, j,k > =
f (x)j,k (x) dx
Ij,k

= f (xj,k )
Z

Ij,k

j,k (x) dx + f (xj,k )

Ij,k

(x xj,k )j,k (x) dx

f (j,k )
+
(x xj,k )2 j,k (x) dx
2
Ij,k
Z
Z
f (j,k )

= f (xj,k )
(x xj,k )2 j,k (x) dx,
xj,k (x) dx +
2
Ij,k
Ij,k

1246

CAPITOLO 21. IL SISTEMA DI HAAR

R
dove si utilizzata la propriet Ij,k j,k (x) dx = 0. Ora, il primo integrale
vale
Z
Z


j
j
j/2
[0, 1 )(2 x k) [ 1 ,1)(2 x k) dx
x j,k (x) dx =
x2
2

Ij,k

2j/2
23/2j
=

,
22j+2
4

mentre

Z
Z

f
(
)
1


j,k
j/2
2

(x xj,k ) j,k (x) dx


max |f (x)|2
(x xj,k )2 dx


Ij,k
2
2 xIj,k
Ij,k
=

1
max |f (x)|25/2j .
24 xIj,k

Se j grande, il termine 25/2j trascurabile rispetto a 23/2j e otteniamo


lapprossimazione
1
|< f, j,k >| |f (xj,k )|23/2j .
4
o
2 caso) x0 Ij,k .
Con un ragionamento simile al precedente, fatto sia dalla parte destra che
dalla parte sinistra dellintervallo, si ottiene


+ j/2
)
.
|< f, j,k >| |x0 2j k| f (x
)

f
(x
0
0 2
Se j grande, possiamo assumere che x0 sia allincirca nel punto medio di
j
Ij,k , ossia |x0 2j k| 2 4 . In denitiva


f (x ) f (x+ )
0
0
|< f, j,k >|
2j/2 ,
4

ed il decadimento dei coecienti, per j +, pi lento del 1o caso.

Capitolo 22
LAnalisi in Multirisoluzione
In questo capitolo introdurremo una struttura su L2 (R) , lanalisi in multirisoluzione, a partire dalla quale si otterr una funzione in L2 (R) le cui dilatate e traslate costituiscono una base ortonormale per L2 (R) . Premettiamo
alcuni richiami di analisi di Fourier.

22.1
22.1.1

Richiami di analisi di Fourier


Serie di Fourier

Consideriamo le funzioni e2ikx = cos (2kx) + i sin (2kx), periodiche di


periodo 1. Il sistema {e2ikx , k Z} un sistema ortonormale per L2 (T).
Definizione 22.1.1. Sia f L1 (T) . Si denisce k-esimo coeciente di
Fourier di f il numero
Z 1

f (k) =
f (x)e2ikx dx.
0

La serie

f(k)e2ikx

(22.1)

kZ

prende il nome di serie di Fourier di f ed, in generale, non detto che f


coincida con la sua serie di Fourier.
Vale la propriet di unicit dei coecienti di Fourier ossia, se f L1 (T) e
per ogni k Z si ha f(k) = 0, allora f 0.
1247

1248

CAPITOLO 22. LANALISI IN MULTIRISOLUZIONE

Se f L2 (T) L1 (T) , si ha f(k) =< f, e2ikx >; la successione (f(k))kZ


2 (Z) e la serie (22.1) converge in L2 (T) per la disuguaglianza di Bessel
Z 1
X
2ikx
2
|< f, e
>|
| f (x) |2 dx = kf k22 .
0

kZ

Inoltre,
in L2 (T) del sistema {e2ikx , k Z}, luguaglianza
P perla completezza
2ikx
f = kZ f (k)e
vale nel senso di L2 (T).
Inne, richiamiamo il teorema di Riesz-Fischer.
Teorema 22.1.2. Se (ak )kZ 2 (Z) , allora esiste una funzione misurabile
m : [0, 1] C tale che
X
1. m(x) =
ak e2ikx in L2 (T);
kZ

2.

22.1.2

| m(x) |2 dx =

X
kZ

| ak |2 .

Trasformata di Fourier

Definizione 22.1.3. Se f L1 (R) si denisce trasformata di Fourier di f


la funzione f
Z
f() =
f (x)e2ix dx, R,
(22.2)
R

La denizione ben posta in quanto f L1 (R) . Loperazione che associa ad


ogni funzione in L1 (R) la sua trasformata di Fourier unoperazione lineare.
Esempio 22.1.4.

sin ()
1. Per f (x) = [ 1 , 1 ] (x), f() =
;
2 2

sin2 ()
;
2. Per f (x) = (1 | x |)[1,1] (x), f() =
()2
3. Per f (x) = e2|x| , f() =

1
;
(1 + 2 )

2
2
4. Per f (x) = ex , f() = e .
(Si veda la g.22.1).

22.1. RICHIAMI DI ANALISI DI FOURIER

2
4

2
4

2
4

2
4

2
4

2
4

2
4

2
4

1249

Figura 22.1: Alcune funzioni (a sinistra) e le loro trasformate di Fourier (a destra).


Dallalto in basso:

1 1
2,2]

[1,1](x), e2|x|, ex .

(x), (1 | x |)

1250

CAPITOLO 22. LANALISI IN MULTIRISOLUZIONE

Propriet 22.1.5. Sia f L1 (R) .


1. f una funzione uniformemente continua;
2. Se anche xf (x) L1 (R) allora f ammette derivata continua e
c () = 1 (f) ();
xf
2i

3. Se anche xN f (x) L1 (R) allora f C N e


j

1
d
j
(f)(j) (), per
x f () =
2i
4. (Riemann-Lebesgue)

j = 0, . . . , N;

lim f() = 0;

||+

2ia
d
5. Posto Ta f (x) = f (x a) per a R, si ha T
f ();
a f () = e

d
6. Posto Da f (x) = a1/2 f (ax) per a > 0, si ha D
a f () = Da1/2 f ().

In generale non detto che f appartenga ad L1 (R) ma, sotto alcune


condizioni, la trasformata di Fourier si pu invertire.
Teorema 22.1.6. Se f L1 (R) C(R) e f L1 (R) . Allora per ogni x R,
Z
f (x) =
f() e2ix d.
R

Di seguito enunciamo alcune importanti propriet.


Teorema 22.1.7. (Formula di Plancherel)
Se f L1 (R) L2 (R) allora f L2 (R) e
Z
Z
2
2

kf k2 =
| f () | d =
| f (x) |2 dx = kf k22 .
R

Teorema 22.1.8. (Formula di Parseval)


Se f, g L1 (R) L2 (R) allora
Z
Z
g () d =
f (x)g(x) dx =< f, g > .
< f, g >=
f()
R

22.2. SISTEMI ORTONORMALI DI TRASLATE

1251

Se f L2 (R) si pu denire unoperazione lineare, chiamata ancora


trasformata di Fourier e denotata ancora con f che coincida con (22.2) per
f L1 (R) L2 (R) e per cui valgano tutte le propriet gi enunciate.
Definizione 22.1.9. Sia f L2 (R) e si denisca la successione

f (x) |x| < n
fn (x) =
0
|x| n.

Si ha fn L1 (R) L2 (R) e kfn f k2


n 0. Si pu dimostrare che fn converge
in L2 (R) e si pu denire
f() = lim fn ()
n+

nel senso di L2 (R) .


Nota 22.1.10. Se f L2 (R) allora f L2 (R) . Si pu anche dimostrare che,
nel senso di L2 (R) ,
Z
2 2

f () = lim+ f (x)er x e2ix dx,


r0

e vale la formula di inversione


f (x) = lim+
r0

2 2
f()er e2ix d.

22.2

Sistemi ortonormali di traslate

Analizziamo il comportamento di funzioni ottenute per traslazioni intere di


una sola funzione g L2 (R) ,
{g(x k), k Z}.

(22.3)

Abbiamo gi visto che per g(x) = [0,1) (x), il sistema (22.3) ortonormale.
Vediamo di seguito alcune propriet comuni per tali sistemi.

1252

CAPITOLO 22. LANALISI IN MULTIRISOLUZIONE

Nota 22.2.1. Se il sistema (22.3) ortonormale, esso risulta essere una base
ortonormale per lo spazio da esse generato
V = < g(x k), k Z >.
(Si veda il paragrafo 21.6).

Notazione 22.2.2. La funzione traslazione per a R si denota con Ta g(x) =


g(x a).

Lemma 22.2.3. Sia g L2 (R) . Sono equivalenti

a) {g(x k), k Z} un sistema ortonormale di traslate per L2 (R) ;


X
b)
| g( + k) |2 1, q.o. R.
kZ

Dimostrazione. Per la formula di Parseval


Z
Z
Z
g(x)g(x k) dx =
g()e2ik g() d =
| g() |2 e2ik d
R
R
R
X Z h+1
XZ 1
=
| g() |2 e2ik d =
| g( + h) |2 e2ik d.
(22.4)
hZ

hZ

Ora g L2 (R) implica che la serie

X
hZ

| g( + h) |2 converge ad una funzione,

diciamo F , 1-periodica e in L1 (T) . Infatti, posto


X
Fn () =
| g( + h) |2 ,
|h|n

si ha che la successione (Fn )nZ di Cauchy,


kFn Fm k1 = k
=

( + h) | k1 =
n<|h|m | g

| g() |2 d +

m
n

X Z

n<|h|m

| g( + h) |2 d

| g() |2 d,

e, per n, m +, gli ultimi due integrali convergono a zero.


Allora in (22.4) si pu invertire la somma con lintegrale e si ottiene
Z
Z 1X
g(x)g(x k) dx =
| g( + h) |2 e2ik d = F (k).
R

hZ

22.2. SISTEMI ORTONORMALI DI TRASLATE

1253

Quindi lortonormalit delle traslate equivale al fatto che tutti i coecienti


di Fourier di F sono nulli tranne quello per k = 0, e F (0) = 1. Per lunicit
dei coecienti di Fourier segue lasserto.

Lemma 22.2.4. Sia g L2 (R) e Sia {g(x k), k Z} un sistema ortonormale per L2 (R) . Allora f < g(x k), k Z > se e solo se
! esiste una
X
ck e2ik .
successione (ck )kZ 2 (Z) tale che f() = g()
kZ

Dimostrazione. )
fP < g(x k), k Z > implica che possiamo scrivere, in L2 (R) , f (x) =
f, g( k) > g(x k) e, passando alla trasformata di Fourier,
kZ <P

f () = kZ < f, g( k) > e2ik g(). Presa


f, g(
P la successione ck =<
2
k) >, per la disuguaglianza di Bessel, si ha kZ |< f, g( k) >| kf k22 ,
e lasserto.
)
X
ck g(x k) < g(x k), k Z >, da cui
Poniamo fN (x) =
|k|N

fN () = g()

|k|N

ck e2ik .

Ora, per lipotesi su f, applicando la periodizzazione, i cambi di variabile =


n ed utilizzando lipotesi che {g(x k), k Z} un sistema ortonormale
per L2 (R) ,
Z
X
2
2

kf fN k2 = kf fN k2 =
|
ck e2ik |2 | g() |2 d
R

XZ

nZ

n+1

|k|>N

X
kZ

|k|>N

|k|>N

ck e2ik |2 | g() |2 d

ck e2ik |2

ck e2ik

X
nZ

|k|N

| g( + n) |2 d
ck e2ik |2 d.

1254

CAPITOLO 22. LANALISI IN MULTIRISOLUZIONE

Passando al limite per N +, applicando il teorema di Riesz-Fischer e la


completezza del sistema (e2ikx )kZ in L2 (T), si ottiene
lim kf fN k22 = 0

N +

e quindi f < g(x k), k Z >.

22.3

Analisi di Multirisoluzione

Definizione 22.3.1. Unanalisi in multirisoluzione (MRA) una successione


di sottospazi chiusi Vj L2 (R) , j Z, vericanti le seguenti propriet
1. Per ogni j Z Vj Vj+1 ;
2. f (x) V0 f (2x) V1 ;
\
Vj = {0};
3.
jZ

4.

jZ

Vj = L2 (R) , ossia per ogni f L2 (R) e per ogni > 0, esistono

j Z, g Vj tale che kf gk2 < ;


5. Esiste V0 tale che il sistema {(x k), k Z} una base ortonormale per V0 .
Nota 22.3.2. La funzione prevista nella condizione 5. si chiama funzione
di scala.
La condizione 3. discende dalle altre condizioni.
Spesso, per costruire una MRA, si parte da un sistema ortonormale di traslate
e si denisce lo spazio V0 tramite V0 = < (x k), k Z >. Gli altri spazi
Vj si deniscono tramite la condizioneX
2.
< f, Tk > Tk e
Ogni elemento f V0 del tipo f =
kZ

kf k2 =

X
kZ

|< f, Tk >|

!1/2

22.3. ANALISI DI MULTIRISOLUZIONE

1255

Da questo momento, in questo paragrafo, supporremo che (Vj )kZ sia una
MRA. Poniamo jk (x) = 2j/2 (2j x k), dove la funzione prevista dalla
condizione 5.
Proposizione 22.3.3. Fissata una scala j Z, (jk )kZ una base ortonormale per Vj .
Dimostrazione. Ortonormalit
Dalla 2. della Denizione 22.3.1 si ha jk Vj . Inoltre, per le propriet del
prodotto scalare
< jk , jh >=< 0k , 0h >= kh ,
e quindi lortonormalit provata.
Completezza
Se f (x) Vj , per la 2. della Denizione di 22.3.1 si ha f (2j x) V0 . Quindi,
nella norma L2 (R)
X
X
< f, Tk (2j ) > Tk (x).
< f (2j ), Tk > Tk (x) = 2j
f (2j x) =
kZ

kZ

Ossia, nella norma L2 (R) ,


f (x) =

< f, jk > jk (x),

kZ

e ci prova la completezza.

In analogia con quanto fatto nel Capitolo 1, deniamo degli operatori di


approssimazione e dettaglio.

Definizione 22.3.4. Deniamo loperatore di approssimazione, per f


L2 (R) e per ogni j Z
X
Pj f =
< f, jk > jk .
(22.5)
kZ

Deniamo loperatore di dettaglio, per f L2 (R) e per ogni j Z


Qj f = Pj+1 Pj .

(22.6)

Si osservi che Pj f ben denita in quanto (jk )kZ una base ortonormale
per Vj , (la dimostrazione analoga a quella del paragrafo 21.7) e di conseguenza Pj f Vj . Inoltre, per la disuguaglianza di Bessel kPj f k2 kf k2 .
Dimostriamo ora un risultato che sar utilizzato in seguito.

1256

CAPITOLO 22. LANALISI IN MULTIRISOLUZIONE

Lemma 22.3.5. Per ogni f L2 (R) ,


1. lim kPj f f k2 = 0;
j+

2. lim kPj f k2 = 0;
j

Dim 1.
[
Sia > 0. f L2 (R) =
Vj , e quindi esistono j0 Z e una funzione
jZ

h Vj0 tali che kf hk2 < /2. Ora, per ogni j j0 , h Vj0 Vj , quindi
Pj h = h e
kf Pj f k2 kf hk2 + kh Pj f k2 = kf hk2 + kPj h Pj f k2
2kf hk2 < ,

da cui lasserto.
Dim 2.
Sia > 0, e si consideri g, funzione continua a supporto compatto che approssima f nella norma L2 (R) , ossia tale che kf gk2 . Si supponga che
supp g [A, A], allora
kPj gk22

X
kZ

|< g, jk

XZ
kZ

A
A

X Z
>| =
|

| g(x) |2 dx

kZ
Z A

g(x)jk (x) dx |2

2j | (2j x k) |2 dx,

per la disuguaglianza di Cauchy-Schwarz. Dopo il cambio di variabile 2j x


k = y, si ottiene
kPj gk22

kgk22

XZ
kZ

2j Ak

2j Ak

| (y) |2 dy.

(22.7)

Dimostriamo che per M grande


lim

X Z

|k|M

2j Ak

2j Ak

| (y) |2 dy = 0.

(22.8)

22.3. ANALISI DI MULTIRISOLUZIONE

1257

Partiamo da lim 2j = 0, quindi per j piccoli, 2j A < 1/2. Allora, per ogni
k (e j piccoli),
Z

2j Ak
2

2j Ak

| (y) | dy

1/2k
1/2k

| (y) |2 dy,

da cui
X Z

|k|M

2j Ak
2

2j Ak

| (y) | dy

1/2M

| (y) |2 dy +

X Z

|k|M

1/2+M

1/2k

1/2k

| (y) |2 dy

| (y) |2 dy,

e gli ultimi due integrali tendono a zero, per M + in quanto L2 (R) .


Allora lintegrale in (22.8) pu essere reso piccolo a piacere prendendo M
abbastanza grande per j piccoli ed il limite dimostrato. Inoltre, ssato
questo M si ha anche
Z 2j Ak
X Z 2j Ak
X
2
lim
| (y) | dy =
lim
| (y) |2 dy = 0.
j

|k|M

2j Ak

|k|M

2j Ak

In denitiva, da (22.7), (22.8) e da questultimo limite, si ha per j

X
X
X Z 2j Ak
0,
| (y) |2 dy = kgk22
+
kPj gk22 kgk22
kZ

2j Ak

|k|M

|k|M

e dalla disuguaglianza

kPj f k2 kPj f Pj gk2 + kPj gk2 = kf hk2 + kPj gk2


+ kPj gk2 ,
segue lasserto.

Nota 22.3.6. Deduciamo ora unequazione fondamentale che lega la funzione


e le sue dilatate per 2. Dalla relazione V0 V1 e dal fatto che (1k )kZ
una base ortonormale per V1 , otteniamo, in L2 (R)
X
(x) = 2
< , 1k > (2x k).
(22.9)
kZ

1258

CAPITOLO 22. LANALISI IN MULTIRISOLUZIONE

Posto hk =< , 1k > si ottiene (hk )kZ 2 (Z) e lequazione (22.9) si


riscrive
X
(x) = 2
hk (2x k);
(22.10)
kZ

essa prende il nome di equazione di scala (o di ranamento). Passando alla


trasformata di Fourier si ottiene

1 X
hk e2ik/2 (
).
()

=
2
2 kZ
P
La funzione 1-periodica m0 () = 12 kZ hk e2ik appartiene allo spazio
L2 (T); essa e, per abuso di linguaggio, la successione (hk )kZ , prende il nome
di filtro associato a . Lequazione (22.10) si riscrive

()

= m0 ( )(
).
2
2

(22.11)

Esempio 22.3.7. In questo esempio vedremo come il sistema di Haar su R


si inserisca nella denizione di MRA. Si prenda = [0,1) e si deniscano
V0 = < (x k), k Z > e gli altri spazi Vj tramite la condizione 2. della
Denizione 22.3.1. Per quanto gi visto nel Capitolo 1, valgono le propriet
1., 2. e 5. della Denizione 22.3.1. Al ne di dimostrare la 3. si osservi
2
che ogni Vj consiste di funzioni
\ di L (R) costanti sugli intervalli diadici Ijk .
Quindi una funzione f
Vj risulter costante su tutti gli Ijk , e lunica
jZ

possibilit che sia nulla.


Inne, ogni funzione in L2 (R) pu essere approssimata, in norma, da una
funzione continua a supporto compatto e questa, a sua volta, pu essere
approssimata da una funzione diadica a scala J, sempre in norma L2 (R) ,
(Lemma 21.9.1). Ci prova la 4.
Troviamo lequazione di scala per
(x) =

[0,1)(x) = [0,1/2) (x) + [1/2,1) (x)

1
1
= 10 (x) + 11 (x).
2
2
Allora i coecienti dellequazione di scala sono dati da
 1

k = 0, 1
2
hk =
0 altrimenti

22.3. ANALISI DI MULTIRISOLUZIONE

1259

A partire da una MRA si pu costruire una funzione , detta Ondicella,


tale che il sistema
jk (x) = 2j/2 (2j x k),

j, k Z,

sia una base ortonormale di L2 (R) .


Teorema 22.3.8. Sia (Vj )jZ una MRA con funzione di scala e filtro
(hk )kZ . Si definiscano
gk = (1)k h1k ,
e
(x) =

X
2
gk (2x k).

(22.12)

(22.13)

kZ

Allora L2 (R) ed il sistema jk (x) = 2j/2 (2j x k), j, k Z, una base


ortonormale di L2 (R) ( si chiama ondicella).
Dimostrazione. Dalla denizione (22.13) segue che V1 . Inoltre, passando
alla trasformata di Fourier si ha
X

= 1
()
gk e2ik/2 (
) = m1 ( )(
),
2
2
2
2 kZ
P
dove si posto m1 () = 12 kZ gk e2ik . Si osservi che, dalla denizione
dei coecienti gk , si ottiene la seguente relazione tra m0 e m1
1 X
1 X
m1 () =
(1)k h1k e2ik =
(1)1k hk e2i(1k)
2 kZ
2 kZ
1 X
=
hk e2i(1k)(+1/2) = e2i(+1/2) m0 ( + 1/2) (22.14)
2 kZ

1260

CAPITOLO 22. LANALISI IN MULTIRISOLUZIONE

Dimostriamo che il sistema {(x k), k Z}, ortonormale facendo vedere


che soddisfa la b) del Lemma 22.2.3. Intanto, per q.o. R,

X
X
+k 2
+k 2
+
) | | (

)| =
2
2
k dispari
kZ
k pari
kZ
X
X

+k 2
+k 2
+1 2
= | m0 ( ) |2
| (

| (

) | + | m0 (
)|
)|
2
2
2
2
k pari
k dispari
X
X

+1 2
+1
= | m0 ( ) |2
| (
+ k) |2 + | m0 (
)|
| (

+ k) |2
2
2
2
2
kZ
kZ

1 =

| (
+ k) |2 =

| m0 (

+1 2
= | m0 ( ) |2 + | m0 (
)| .
2
2

(22.15)

Quindi

X
kZ

+k 2
+k 2
) | | (

)|
2
2
kZ
X
X

+1 2
=| m1 ( ) |2 + | m1 (
+
=
)|
2
2
k dispari
k pari

+ k) |2 =
| (

| m1 (

= | m0 (

+1 2

) | + | m0 ( ) |2 = 1.
2
2

In denitiva {(x k), k Z}, costituisce una base ortonormale per


< (x k), k Z > = W0 V1 .
Facciamo ora vedere che W0 V1 , cio che per ogni n, k Z

< (x k), (x k) >= 0.

22.3. ANALISI DI MULTIRISOLUZIONE

1261

Infatti, periodizzando,
< (x k), (x k) >=
=
=

2i(nk)
()e

d =
()
R

XZ
pZ

p+1

(x k)(x k) dx

| (
) |2 m0 ( )m1 ( )e2i(kn) d
2
2
2
R

| (
) |2 m0 ( )m1 ( )e2i(kn) d
2
2
2

+p
+p 2
+ p 2i(kn)
) | m0 (
)m1 (
)e
d
2
2
2
0 pZ
!
Z 1 X
X
e2i(kn) d
=
+
=

| (

p pari

p dispari


1

+1

+1
m0 ( )m1 ( ) + m0 (
)m1 (
) e2i(kn) d
=
2
2
2
2
0

Z 1

+1
+1
+1
=
) + m0 (
)m0 (
) e2i/2 e2i(kn) d
m0 ( )m0 (
2
2
2
2
0
Z

= 0.
Dimostriamo ora lortonormalit del sistema {jk }.
Se la scala j ssata
< jk , jh >=< 0k , 0h >= kh .
Se le scale j 6= j , assumiamo j < j e siano k, k Z.
Si osservi che V1 implica che
j k Vj +1 Vj ,
in quanto j +1 j. Se facciamo vedere che ogni elemento di Vj ortogonale a
jk otteniamo lasserto. Intanto da < 0k , 0h >= 0 si ottiene
< jk , jh >=
P
2
0. Poi, ogni elemento di Vj , si scrive, in L (R) , f = hZ < f, jh > jh ,
quindi
X
< f, jh > < jk , jh > = 0.
< jk , f >=
hZ

1262

CAPITOLO 22. LANALISI IN MULTIRISOLUZIONE

Rimane da provare la completezza del sistema {jk } e, quindi, baster provare che
PN 1 P
lim kf j=N
(22.16)
kZ < f, jk > jk k2 = 0.
N +

Come prima cosa proviamo che

Q0 f < 0n , n Z > = W0 .

(22.17)

Infatti si ha, per denizione Q0 f = P1 f P0 f, dove


X
X
P0 f (x) =
< f, 0k > 0k , P1 f (x) =
< f, 1k > 1k .
kZ

kZ

Passando alla trasformata di Fourier, per lequazione di scala


X

),
< f, 0k > e2ik ()

= b()m0 ( )(
2
2
kZ
X

),
P1 f () =
< f, 1k > e2ik/2 (
) = a( )(
2
2
2
kZ
P0 f () =

dove le funzioni a() e b() sono in L2 (T), essendo


X
|< f, 1k >|2 kf k22 , i = 0, 1.
kZ

Quindi

).
Q0 f () = P1 f () P0 f () = [a( ) b()m0 ( )](
2
2
2
Ora, (22.16) vera se Q0 f () = c()(), per una certa funzione 1-periodica

c() L2 (T). Tenuto conto di ()


= m1 ( 2 ) (
2 ), ci si traduce nel trovare
c() in modo che sia

c()m1 ( )(
) = [a( ) b()m0 ( )] (
).
2
2
2
2
2
Questultima uguaglianza vera se si trova c() in modo che

c()m1 ( ) + b()m0 ( ) = a( ),
2
2
2

22.3. ANALISI DI MULTIRISOLUZIONE

1263

ovvero

+1
+1
+1
) + b()m0 (
) = a(
),
2
2
2
ovvero, in forma matriciale

m1 ( 2 )
b()
m0 ( 2 )
b()
a( 2 )
=

=
.
M()
+1
+1
+1
c()
c()
m0 ( 2 ) m1 ( 2 )
a( 2 )
c()m1 (

Dalle uguaglianze (22.14) e (22.15) si ottiene che la matrice M() unitaria


per quasi ogni , quindi


1 0

M ()M() = I =
,
0 1
e si ottiene

b()
c()

= M ()

a( 2 )
)
a( +1
2

portando alla scelta per q.o. R,

m0 ( 2 ) m0 ( +1
)
2
m1 ( 2 ) m1 ( +1
)
2

+1 +1
)a(
).
c() = m1 ( )a( ) + m1 (
2 2
2
2
La 1-periodicit di c() immediata. Inne da | m1 () | 1 e a() L2 (T)
segue che c() L2 (T) e (22.17) dimostrata.
Proviamo ora che per ogni j Z
(22.18)

Qj f < jn , n Z > = Wj .

Infatti si ha, per denizione di Qj , (22.17) e le propriet della dilatazione


D2j f (x) = 2j/2 f (2j x),
X
X
Qj f = Pj+1 f Pj f =
< f, j+1k > j+1k
< f, jk > jk
=

X
kZ

kZ

< D2j f, 1k > D2j 1k

kZ

< D2j f, 0k > D2j 0k

kZ

= D2j [P1 (D2j f ) P0 (D2j f )] = D2j [Q0 (D2j f )]


!
X
X
< f, jk > jk , (22.19)
< D2j f, 0k > 0k =
= D2j
kZ

kZ

1264

CAPITOLO 22. LANALISI IN MULTIRISOLUZIONE

e (22.18) dimostrata.
Inne, per N Z
kf

PN 1 P

j=N
PN 1
j=N

kZ

< f, jk > jk k2 = kf

PN 1

j=N

Qj f k2

(Pj+1 f Pj f )k2 = kf (PN f PN f )k2


= kf
kf PN f k2 + kPN f k2 ,
e, per il Lemma 22.3.5 il teorema completamente dimostrato.

Esempio 22.3.9. Riprendiamo lEsempio 22.3.7. Calcoliamo i coecienti gk .


Si ha
1
k = 0,
2
k
1

k = 1,
2
gk = (1) h1k =

0
altrimenti
Quindi londicella

(x) = g0 10 (x) + g1 11 (x) = [0,1/2) (x) [1/2,1) (x),


e la base ottenuta il sistema di Haar.

Nota 22.3.10. Nella dimostrazione del Teorema 22.3.8 abbiamo introdotto gli
spazi
< jn , n Z > = Wj .
Questi vericano le seguenti propriet
1. Wj Wn ,

j 6= n;

2. Wj Vj ,

forall j;

3. Vj+1 = Vj Wj ;
M
4. L2 (R) =
Wj .
jZ

Dimostriamo la 3. La somma Vj Wj ortogonale in quanto W0 V0 e da


< jk , jk >=< 0k , 0k >= 0 segue anche che Wj Vj .
Da Vj Vj+1 e W0 V1 Vj+1 si ottiene Vj Wj Vj+1 .
Viceversa, se f Vj+1 allora f = Pj+1 f = Qj f + Pj f Vj Wj .

22.4. FUNZIONE DI SCALA E ONDICELLA ASSOCIATA AD UNA MRA1265


Nota 22.3.11. Si osservi che, se londicella prevista nel
Teorema 22.3.8 e se () una funzione 1-periodica e misurabile tale che
|()| = 1 quasi ovunque in [0, 1), allora la nuova funzione denita tramite

= ()m1 (/2)(/2)

risulta essere ancora unondicella associata alla stessa MRA di .

22.4

Propriet della funzione di scala e della


ondicella associate ad una MRA

Enunciamo delle propriet necessarie per una funzione di scala e unondicella


associate ad una MRA. Assumeremo, quindi, che (Vj )jZ sia una MRA,
sia una funzione di scala e che sia londicella prevista nel Teorema 22.3.8.
Assumiamo ancora che L1 (R) . Ci sicuramente vero quando ha
supporto compatto e, in tal caso anche la a supporto compatto.
Teorema 22.4.1.
| (0)

|=|

(x) dx |= 1.

Dimostrazione. Consideriamo una funzione ausiliaria f con le seguenti propriet: f L2 (R) , f continua e a supporto contenuto in [R, R], normalizzata in modo che kf k2 = 1. Se j Z
X
X
|< f, jk >|2
|< f, jk >|2 =
kPj f k22 =
kZ

kZ

X Z
=
|

kZ

2j/2 f()(

2ik/2j
)e
d |2
2j

(22.20)

Ora il sistema {2j/2 e2ik/2 , k Z} una base ortonormale per lo spazio


L2 ([2j1 , 2j1]). Se j abbastanza grande, allora, R < 2j1 e [R, R]
[2j1 , 2j1] e (22.20) non altro che la norma ottenuta per molteplicit da
f(
2j ). Quindi
Z R

2
kPj f k2 =
| f()(
j ) |2 d,
2
R
e passando al limite per j + si ottiene
Z R

2
2
kf k2 = lim kPj f k2 = lim
| f()(
j ) |2 d.
(22.21)
j+
j+ R
2

1266

CAPITOLO 22. LANALISI IN MULTIRISOLUZIONE

Ora si pu passare il limite sotto il segno di integrale in (22.21). Infatti


lipotesi L1 (R) implica che uniformemente continua e quindi il
limite

lim f()(
j ) = f()(0),
j+
2
uniforme in . Allora
Z R
Z R
2

lim
| f ()(
j ) | d, =
| f()(0)

|2 d = kf k22 | (0)

|2 ,
j+ R
2
R
da cui
|

(x) dx |=| (0)

|= 1.

Corollario 22.4.2.

(0)
=

(x) dx = 0.
R

Dimostrazione. Lequazione di scala, valida per ogni in quanto continua,


ed il teorema precedente implicano che m0 (0) = 1. Dallequazione (22.15) si
ottiene m0 ( 21 ) = 0 e dallequazione di scala per e dalla sua continuit si
ottiene
 
1
2i1/2

= 0.
m0
(0) = m1 (0)(0)

=e
2

Corollario 22.4.3.
(n)

= 0 per ogni n Z n 6= 0.

P
Dimostrazione. Per la continuit della ,
luguaglianza kZ | (
+ k) |2 =
1 vale per ogni . In particolare, per = 0 ed il Teorema 22.4.1 si ha
P

|2 = 0, e lasserto.

k6=0 | (k)
Corollario 22.4.4.
X
kZ

(x + k) = 1

per quasi ogni x R.

22.5. ESEMPI DI MRA

1267

P
Dimostrazione. La funzione 1-periodica kZ (x + k) nello spazio L1 (T) .
Calcolando i suoi coecienti di Fourier, per periodizzazione, si ha
Z 1X
XZ 1
2ikx
(x + k) e2ikx dx
(x + k) e
dx =
0

ZkZ
=
(y) e2iky dy = (k)

= k0

kZ

Il seguente teorema, che viene proposto senza dimostrazione, fornisce delle


condizioni sucienti al ne di ottenere una MRA.
Teorema 22.4.5. Sia (Vj )jZ una successione di sottospazi chiusi di L2 (R)
verificanti le seguenti propriet
1. Per ogni j Z,

Vj Vj+1;

2. f (x) V0 f (2x) V1 ;
3. Esiste V0 tale che il sistema {(x k), k Z} una base ortonormale per V0 .
Supponiamo, inoltre, che | | sia continua in zero. Allora sono equivalenti
[
a)
Vj = L2 (R) ,
jZ

b) (0)

6= 0.
Inoltre, vera a), e quindi b), si ha | (0)

|= 1.

22.5
22.5.1

Esempi di MRA
Spline lineari

Forniamo unesempio di analisi in multirisoluzione. Deniamo gli spazi:


V0 = {f L2 (R) C | f lineare negli intervalli I0k = [k, k + 1), k Z},
Vj = {f L2 (R) C | f lineare negli intervalli Ijk = [

k k+1
,
), k Z},
2j 2j

1268

CAPITOLO 22. LANALISI IN MULTIRISOLUZIONE

quindi f (x) Vj se e solo se f (2j x) V0 . Facciamo vedere che (Vj )jZ


una MRA.
Ogni f Vj , lineare in Ijk = Ij+1,2k Ij+1,k2+1 quindi lineare su ognuna
delle sue met, allora f Vj+1 , e Vj Vj+1 .
[
Dimostriamo che
Vj = L2 (R) .
jZ

A tal ne suciente dimostrare che ogni funzione continua a supporto


compatto approssimabile con funzioni di Vj per qualche j Z.
Sia > 0, f continua a supporto compatto contenuto in [A, A], quindi
uniformemente continua. Allora esiste > 0 tale che per ogni x, y R,
| x y |< ,

| f (x) f (y) |< ,


2A
e quindi la stessa vale per ogni x, y Ijk , con j grande tale che 2j < .
Deniamo ora g Vj che approssimer f nella norma L2 (R) . In ogni intervallo Ijk , g sar il segmento che unisce f ( 2kj ) e f ( k+1
). Quindi per ogni
2j
x Ijk ,
g(x) = 2




k
k+1
k
k+1
j
x f ( j ) + 2 x j f ( j ).
j
2
2
2
2

Si ha





j k+1

k
j

|f (x) g(x)| = 2
x

f
(x)

g(x)

x
f
(x)
+
2

2j
2j








k+1
f (x) f ( kj ) + 2j x k f (x) f ( k+1

2j

x
)
j
2
2
2j
2j

,
2A
e quindi
kf
Dimostriamo che

gk22

jZ

A
A

| f (x) g(x) |2 dx

Vj = {0}.

2
2A = 2 .
2A

T
Ogni f jZ Vj continua, in L2 (R) e lineare negli intervalli [0, +) e
(, 0), quindi necessariamente nulla.

22.5. ESEMPI DI MRA

1269

Inne bisogna trovare la funzione di scala V0 . La costruzione non sar


immediata e la sar ottenuta a partire dalla funzione ausiliaria
(x) = (1 |x|)[1,1] (x).
Lemma 22.5.1. Se f C(R) lineare sugli intervalli del tipo [k, k + 1),
k Z, allora
X
f (x)(x n),
(22.22)
f (x) =
nZ

dove la somma converge puntualmente.

Dimostrazione. Per ogni x R, esiste uno ed un solo k Z tale x [k, k +1).


Allora la quantit
(x n) = (1 |x n|)[1,1] (x n) = (1 |x n|)[n1,n+1] (x),
non si annulla solo per n = k, k + 1. Quindi la somma in (22.22) uguale a
f (k)(x k) + f (k + 1)(x (k + 1)).

(22.23)

Dimostriamo che coincide con f (x). Si noti che (22.23) lineare in [k, k + 1),
Agli estremi k e k + 1 dellintervallo vale, rispettivamente,
f (k)(0) + f (k + 1)(1) = f (k),

f (k)(1) + f (k + 1)(0) = f (k + 1).

Ma anche f lineare e continua in [k, k + 1), ed otteniamo lasserto.

Al ne di dimostrare che (22.22) vale anche nella norma L2 (R) , premettiamo

Lemma 22.5.2. Se f lineare in [n, n + 1), allora


Z n+1


1
1
2
2
| f (n) | + | f (n + 1) |
| f (n) |2 + | f (n + 1) |2
| f (x) |2 dx
6
2
n
(22.24)
Dimostrazione. In [n, n + 1) abbiamo,per la linearit di f
f (x) = f (n) + (f (n + 1) f (n))(x n),
quindi
Z

n+1
2

| f (x) | dx =

n+1

| f (n) + (f (n + 1) f (n))(x n) |2 dx.

1270

CAPITOLO 22. LANALISI IN MULTIRISOLUZIONE

Sviluppando il quadrato e calcolando lintegrale, si ottiene


Z n+1
1
| f (x) |2 dx = (| f (n + 1) |2 + | f (n) |2 +f (n)f (n + 1))
3
n
1
1
(| f (n + 1) |2 + | f (n) |2 ) + (| f (n + 1) |2 + | f (n) |2 )

3
6
1
=
(| f (n + 1) |2 + | f (n) |2 )
2
2

, vera per ogni a, b R. Se si


dove si usata la disuguaglianza ab a +b
2
a2 +b2
utilizza laltra disuguaglianza ab 2 , si ottiene
Z

n+1

1
| f (x) |2 dx = (| f (n + 1) |2 + | f (n) |2 +f (n)f (n + 1))
3
n
1
1
(| f (n + 1) |2 + | f (n) |2 ) (| f (n + 1) |2 + | f (n) |2 )

3
6
1
(| f (n + 1) |2 + | f (n) |2 ),
=
6
ed il Lemma dimostrato.

Lemma 22.5.3. Se f V0 allora


X
f (x) =
f (x)(x n),

in L2 (R) .

nZ

Dimostrazione. Intanto osserviamo che dal lemma precedente deduciamo


il seguento fatto: se f V0 , la serie di termine generale 16 (| f (n + 1) |2
R n+1
+ | f (n) |2 ) maggiorata dalla serie di termine generale n | f (x) |2 dx, e
questultima convergente in quanto
X Z n+1
| f (x) |2 dx = kf k22 .
nZ

Allora

X
nZ

e quindi

(| f (n + 1) |2 + | f (n) |2 ) < +,
lim | f (n) |2 = 0.
|n|+

22.5. ESEMPI DI MRA

1271

Siano, ora, N, M N e consideriamo


N
X

n=M

f (n)(x n).

Si ha, per il Lemma 22.5.1

f (M)(1 + x + M),
N

X
f (x),
f (n)(x n) =
f (N)(1 x + N),

n=M

0,

se x [M 1, M),
se x [M, N),
se x [N, N + 1),
altrimenti.

Allora

kf
Z

N
X

n=M
M

f (n)(x

n)k22

M 1

| f (x) |2 dx

| f (x) f (M)(1 + x + M) |2 dx
M 1
Z N +1
Z
2
+
| f (x) f (N)(1 x + N) | dx +
+

+
N +1

| f (x) |2 dx.

Per la linearit di f negli intervalli [M 1, M) e [N, N + 1), tutto ci


uguale a
Z +
Z M 1
| f (M 1) |2 | f (N + 1) |2
2
+
+
| f (x) |2 dx,
| f (x) | dx +
3
3
N +1

e, per N, M + tutto tende a zero ed il lemma dimostrato.

Facciamo ora vedere che V0 generato dalle traslate di .


Lemma 22.5.4.
V0 = < (x k), k Z >.
Dimostrazione. Dal Lemma 22.5.3 otteniamo inclusione V0 < (x k), k Z >.
Viceversa, sia f < (x k), k Z >, e (fn )nZ la successione in
< (x k), k Z > che approssima f nella norma L2 (R) .
Fissato un intervallo del tipo [k, k + 1), dalla linearit delle fn segue quella di
f ed anche la convergenza uniforme. Infatti se fn (x) = an x + bn , si dimostra

1272

CAPITOLO 22. LANALISI IN MULTIRISOLUZIONE

che le successioni (an )nZ e (bn )nZ convergono e, dette a e b il loro limite,
rispettivamente, si ha f (x) = ax + b. Inoltre
|fn (x) f (x)| |an a||x| + |bn b| |an a||k + 1| + |bn b|,
che converge, uniformemente in x, a zero. Allora f continua in [k, k + 1),
per ogni k Z e quindi in R.

Si osservi che le traslate di non sono ortonormali. Infatti


2
, n = m,

1
, |n m| = 1,
6
< ( n), ( m) >=

0, altrimenti,

quindi
X
nZ

| ( + n) |2 =
=

Si osservi, per, che

X
nZ

< , ( n) > e2in

2 1 2i 1 2i 1
+ e
+ e
= (1 + 2 cos2 ()) 6= 1.
3 6
6
3

1 X

| ( + n) |2 1.
3 nZ

In tale situazione si pu sempre trovare una V0 che faccia il suo dovere


(ma si pu perdere la compattezza del supporto).
Teorema 22.5.5. Supponiamo che L2 (R) sia a supporto compatto e
tale che esistano A, B > 0 per cui
X
A
| ( + n) |2 B per ogni R.
nZ

Allora esiste L2 (R) tale che


1. Il sistema {(x k), k Z} sia ortonormale;
2. < (x k), k Z > = < (x k), k Z >.

22.5. ESEMPI DI MRA

1273

P
Dimostrazione. Accenniamo alla dimostrazione.
( + n) |2 un ponZ |
linomio trigonometrico che, per ipotesi, non si annulla mai. Allora viene
denita tramite la sua trasformata di Fourier da
()
.
( + n) |2
nZ |

()

= pP

Si verica immediatamente che

nZ

| (
+ n) |2 = 1.

Nel nostro caso la funzione denita da


()

=p

3
()

1 + 2 cos2 ()

Si osservi che verica lequazione di scala


1
1
(2x + 1) + (2x) + (2x 1)
2
2
1
1
1
= 1 1 (x) + 10 (x) + 11 (x),
2 2
2
2 2

(x) =

Quindi
() = cos2 (

) ( ).
2
2

Si ottiene, allora, lequazione di scala per


()

= cos2 (

)
2

1 + 2 cos2 (
)
2
(
),
2
1 + 2 cos () 2

e londicella

)
()
= e2i(+1/2) m0 ( + 1/2)(
2
s
i 2
)
1 + 2 sin2 (
2
sin ( )
.
= 3e
2
(1 + 2 cos2 (
))(1 + 2 cos2 ())
2

1274

22.5.2

CAPITOLO 22. LANALISI IN MULTIRISOLUZIONE

Londicella di Shannon

sin (x)
la cui trasforSi consideri lintervallo [ 21 , 12 ) e la funzione (x) =
x
mata di Fourier vale = [ 1 , 1 ] .
2 2
P
Si noti che kZ | (
+ k) |2 = 1, tranne che per = 1/2, quindi il sistema
{(x k), k Z} ortonormale in L2 (R) .
Si deniscano gli spazi V0 = < (x k), k Z > e Vj = < jk , k Z >.
E chiaro che la 2. del Teorema 22.4.5 vericata. Inoltre | | continua in
= 0 e (0)

= 1 6= 0. Quindi, per ottenere una MRA in virt del gi citato


teorema, baster dimostrare che V0 V1 (da cui Vj Vj+1 , per ogni j Z).
Linclusione cercata vericata se si prova che verica unequazione di
scala, cio se esiste una funzione m0 in L2 (T) tale che, quasi ovunque,

)
()

= m0 ( )(
2
2

1 1
, ]
2 2

() = m0 ( )[1,1] ()
2

1 1
, ]
2 2

(2) = m0 ()[1,1] (2)

1 1
, ]
4 4

() = m0 ()[ 1 , 1 ] ().

Ci porta a denire in

[ 21 , 12 ]
m0 () =

2 2

1, || < 41 ,
0, || 14 ,

con estensione periodica in R. Londicella , allora, denita come

+1

()
= m1 ( )(
) = ei ( 1 , 1 ) (
)[ 1 , 1 ] ( )
4 4
2 2
2
2
2
2
i
= e
[1, 1 )( 1 ,1]().
2

si chiama ondicella di Shannon. Si osservi che


/ L1 (R) e nemmeno

/ L1 (R) , in quanto non continua. Invertendo si ha


(x) = (1 2 sin (x))

sin (x 1/2)
.
(x 1/2)

Si osservi che, in virt dellOsservazione 22.3.11, prendendo () = 1 anche


la funzione
= ei
()
[1, 1 )( 1 ,1] ()
2

unondicella.

22.5. ESEMPI DI MRA

22.5.3

1275

Ondicelle che non provengono da MRA

Le funzioni L2 (R) per cui il sistema {jk , j, k Z} forma una base


ortonormale di L2 (R) si chiamano ondicelle. Journ ha fornito un esempio
di ondicella che non proviene da una MRA. Essa denita tramite la sua
trasformata di Fourier.
| |= K
dove

1 2
2 1
32
32
, 2) [ , ) ( , ] (2, ].
14
2 7
7 2
14
Esistono delle equazioni fondamentali per determinare se una unondicella. In generale, se ha una certa regolarit ed un decadimento dolce allinnito, allora, necessariamente, proviene da una MRA.
K = [

1276

CAPITOLO 22. LANALISI IN MULTIRISOLUZIONE

Capitolo 23
La Trasformata Discreta di
Ondicelle
A partire da una MRA ed assegnata una funzione f L2 (R) , svilupperemo
un metodo ricorsivo per calcolare i coecienti di f nella base di ondicelle: la
trasformata discreta di ondicelle (DWT).

23.1

Lalgoritmo

Sia la funzione di scala della MRA (Vj ), vericante lequazione di scala


X
h(n)(2x n),
(x) = 2
nZ

e sia londicella,

(x) =

X
2
g(n)(2x n),
nZ

dove g(n) = (1)n h(1 n).


In molte applicazioni, volendo usare la trasformata discreta di ondicelle, bisogna determinare i coecienti c0 (k), k Z, di una funzione f nella base
ortonormale di V0 , ossia tali che
X
c0 (k)0k ,
P0 f =
k

conoscendo solo i valori di campionamento f (k), k Z. Una pratica molto


usata quella di usare i valori di campionamento direttamente come coefcienti. Strang e Nguyen, [32], chiamano ci un crimine, sebbene spesso
1277

1278 CAPITOLO 23. LA TRASFORMATA DISCRETA DI ONDICELLE


funzioni. In realt sarebbe meglio eettuare prima il preprocessamento dei
dati, cio denire
X
t(x) =
f (k)(x k).
k

In questo modo si ha t V0 , f (k) =< t, 0k >, ossia i coecienti di t nella


base ortonormale di V0 , che quanto di pi corretto si possa fare.
Quindi assumiamo che f L2 (R) e poniamo, per ogni j Z
cj (k) =< f, j,k >,

dj (k) =< f, j,k > .

(23.1)

Ci proponiamo di calcolare i coecienti in (23.1). A tal ne utile il seguente


calcolo.
X
jk (x) = 2j/2 (2j x k) =
h(n)2j+1/2 (2j+1x (2k + n))
=

X
m

Analogamente

h(m 2k)j+1,m(x).

jk (x) =

X
m

g(m 2k)j+1,m (x).

Si possono cos calcolare le successioni dei coecienti c1 e d1 a partire dalla


successione precedente c0 , infatti
X
X
c1 (k) =< f, 1,k >=
h(m 2k) < f, 0,m > =
h(m 2k)c0 (m),
m

e, allo stesso modo,

d1 (k) =

X
m

g(m 2k)c0 (m).

Proseguendo si ottengono
X
cj+1 (k) =
h(m 2k)cj (m),

dj+1 (k) =

X
m

g(m 2k)cj (m).

Viceversa, se sono note le successioni di coecienti d1 , d2 , . . . , dj+1, cj+1, si


pu ottenere la successione c0 . Infatti, ricordiamo che, per (22.5), (22.6) e
(22.19),
X
X
Pj f =
< f, j,n > j,n =
cj (n)j,n ,
n

23.2. PROPRIET DEI FILTRI PROVENIENTI DA MRA


e
Qj f =

X
n

< f, j,n > j,n =

X
n

1279

dj (n)j,n ,

con Pj f = Pj1 f + Qj1 f. Quindi,


X
X
X
cj (n)j,n =
cj+1 (n)j+1,n +
dj+1(n)j+1,n
n

cj+1 (n)

"
X X

X
m

h(m 2n)j,m +

dj+1 (n)

X
m

g(m 2n)j,m

cj+1(n)h(m 2n) + dj+1(n)g(m 2n) j,m .

Eguagliando i coecienti otteniamo


X
cj+1 (n)h(m 2n) + dj+1(n)g(m 2n),
cj (m) =

(23.2)

ed a ritroso possiamo riottenere la successione c0 .

23.2

Propriet dei filtri provenienti da MRA

Come si visto, in tutta la procedura dellalgoritmo ci che si usato sono


i ltri (h(n))nZ e (g(n))nZ , ovvero
1 X
h(n)e2in ,
m0 () =
2 n

1 X
m1 () =
g(n)e2in .
2 n

Analizziamo, ora, delle propriet importanti di questi ltri assumendo che


, L1 (R) L2 (R) .
X

Proposizione 23.2.1.
1.
h(n) = 2,
n

(condizione di normalizzazione);
X
2.
g(n) = 0;
n

3.

X
n

h(2n + 1) =

X
n

h(2n);

1280 CAPITOLO 23. LA TRASFORMATA DISCRETA DI ONDICELLE


4.

X
k

h(k)h(k 2n) =

X
k

g(k)g(k 2n) = n,0 ,

X
k

g(k)h(k 2n) = 0,

(condizioni di ortogonalit);
X
5.
h(m 2k)h(n 2k) + g(m 2k)g(n 2k) = m,n ,
k

(condizione di ricostruzione perfetta).

Dimostrazione. Per la 1. si osservi che (0)

6= 0 e (0)

= m0 (0)(0)

implicano m0 (0) = 1, ossia lasserto.

Analogamente,
per la 2., da m1 (0)(0)

= (0)
= 0 si ha m1 (0) = 0, e cio
P
n
n (1) h(1 n) = 0, da cui, passando alle somme su indici pari o dispari,
si ottiene lasserto.
La prima delle 3. si ottiene dallequazione di scala
X
n,0 = < 0,0 , 0,n >=
h(k)h(m) < 1,k , 1,2n+m >
=

k,m

h(k)h(m)k,2n+m =

k,m

X
k

h(k)h(k 2n).

Lo stesso argomento applicato a 0,n prova la seconda. Inne , per la terza


si parte da 0 =< 0,n , 0,m >, per ogni n, m Z.
La 4. si dimostra osservando che, per ogni successione c0 , e per come sono
denite c1 e d1 si ha
X
c0 (n) =
c1 (k)h(n 2k) + d1 (k)g(n 2k)
k

XX
m

c0 (m)[

da cui lasserto.

23.3

c0 (m)h(m 2k)h(n 2k)+


X
k

X
m

c0 (m)g(m 2k)g(n 2k)

h(m 2k)h(n 2k) + g(m 2k)g(n 2k)],

Filtri

Tutte le condizioni elencate nel paragrafo precedente si possono riformulare


in modo diverso, in termini di operatori di approssimazione e di dettaglio.

23.3. FILTRI

1281

Definizione 23.3.1. Sia c = (c(n))nZ 2 (Z) un segnale.


Loperatore di traslazione (shift), tm , denito, per m Z ssato, come
(tm c)(n) = c(n m).

Loperatore di sottocampionamento (downsampling), , denito come


( c)(n) = c(2n).
Loperatore di sovracampionamento (upsampling), , denito come

c(n/2), n pari ,
( c)(n) =
0,
n dispari .
P
Definizione 23.3.2. Sia (h(n))nZ un ltro, cio
n |h(n)| < +, non
necessariamente proveniente da una MRA.
Si denisca g(n) = (1)n h(1 n). Loperatore di approssimazione H denito, per ogni segnale c = (c(n))nZ 2 (Z) ,
X
(Hc)(k) =
c(n)h(n 2k).
n

Loperatore di dettaglio G denito, per ogni segnale,


X
(Gc)(k) =
c(n)g(n 2k).
n

Gli operatori aggiunti sono


X
(H c)(k) =
c(n)h(k 2n),

(G c)(k) =

X
n

c(n)g(k 2n).

Nota 23.3.3. Si osservi che, per ogni coppia di segnali c e d,


< Hc, d >=< c, H d >,

< Gc, d >=< c, G d > .

Ricordando che la convoluzione tra due successioni in 2 (Z) denita come


X
c(n)d(k n),
c d(k) =
n

e posto

h(n)
= h(n),

g(n) = g(n),

otteniamo le seguenti espressioni per gli operatori appena deniti

Hc = (c h),
H c = ( c) h, Gc = (c g), G c = ( c) g.

1282 CAPITOLO 23. LA TRASFORMATA DISCRETA DI ONDICELLE


Alla luce delle denizioni precedenti, si ha
P
Teorema 23.3.4. Sia (h(n))nZ un filtro, cio n |h(n)| < +, non necessariamente proveniente da una MRA. Si definisca g(n) = (1)n h(1 n).
Allora,
X
X
h(k)h(k 2n) =
1)
g(k)g(k 2n) = n,0 HH = GG = I;
k

2)

X
k

3)

X
k

g(k)h(k 2n) = 0 HG = GH = 0;
h(m 2k)h(n 2k) + g(m 2k)g(n 2k) = m,n

H H + G G = I.

Dimostrazione. Dimostriamo solo la 1). Le altre si provano analogamente.

HH c(k) = (H c h)(k)
= (( c) h h)(k)
X

= (( c) h h)(2k)
=
( c)(n)(h h)(2k
n)
=

X
n

c(n)(h h)(2k
2n) =

c(n)k,n = c(k),

dove si usata luguaglianza

h h(2p)
=

X
k

h(k)h(k 2p) = p,0.

Possiamo anche esprimere gli operatori H e G in termini delle funzioni


1-periodiche costruite a partire dai ltri. In eetti, ad ogni successione c =
(c(n))nZ 2 (Z) , si pu associare una funzione 1-periodica c(x) L2 (T)
denita tramite la sua trasformata di Fourier
X
c() =
c(k)e2ik .
kZ

Cos , se deniamo
1 X
m0 () =
h(n)e2in ,
2 n

1 X
m1 () =
g(n)e2in ,
2 n

23.3. FILTRI

1283

dallOsservazione 23.3.3 facile dimostrare che, per quasi ogni ,

1
1
1
[
c( ) m0 ( ) + c( + ) m0 ( + )],
(Hc)()
= [
2
2 2
2 2
2 2
(23.3)

1
1
1
d
c( ) m1 ( ) + c( + ) m1 ( + )],
(Gc)()
= [
2
2 2
2 2
2 2

\
c)() =
(H

2
c(2) m0 (),

\
c)() =
(G

2
c(2) m1().

Allo stesso modo si prova


Corollario 23.3.5. Nelle ipotesi del Teorema 23.3.4, definiamo
1 X
m0 () =
h(n)e2in ,
2 n

1 X
m1 () =
g(n)e2in .
2 n

Allora valgono le seguenti propriet


1) m0 () m0( + 12 ) + m1 () m1 ( + 12 ) = 0;
2) HG = GH = 0.
Teorema 23.3.6. Nelle ipotesi del Corollario 23.3.5,sono equivalenti
a) | m0 () |2 + | m0 ( + 21 ) |2 = 1 per quasi ogni R;
b)

X
k

h(k)h(k 2n) = 0,n ;

c) H H + G G = I;
d) HH = GG = I.

(23.4)

1284 CAPITOLO 23. LA TRASFORMATA DISCRETA DI ONDICELLE


Dimostrazione. Dimostriamo a) b). Con opportuni cambi di variabile si
ha luguaglianza
Z 1X
X
X
h(m 2n)e2im d
h(k)e2ik
h(k)h(k 2n) =
0

= 2

m0 () m0()e4ik d

= 2

1/2
2

4ik

| m0 () | e

d + 2

1/2

| m0 () |2 e4ik d



1 2 4ik
2
d
= 2
| m0 () | + | m0 ( + ) | e
2
0

Z 1
2
1 2 2ik
=
d,
| m0 ( ) | + | m0 ( + ) | e
2
2 2
0
Z

1/2

da cui lequivalenza.
Dimostriamo a) c).
Per c = (c(n))nZ 2 (Z) , e per il Corollario 23.3.5,
\
Hc)() + (G
\
Gc)()
[(H H + G G)c]b() = (H

d
[
m0 () + 2 (Gc)(2)
m1 ()
=
2 (Hc)(2)
1
1
= c() | m0 () |2 +
c( + )m0 ( + )m0 ()
2
2
1
1
+
c() | m1 () |2 +
c( + )m1 ( + )m1 ()
2
2
= c()[| m0 () |2 + | m1 () |2 ],
da cui lequivalenza.
Analogamente si prova a) d).

23.4

QMF

P
Definizione 23.4.1.
Sia (h(n))nZ un ltro, cio n |h(n)| < +.
P
Sia m0 () = 12 n h(n)e2in . Diremo che (h(n))nZ (oppure m0 ) un
quadratic mirror lter (QMF) se
1) m0 (0) = 1;

23.4. QMF

1285

2) | m0 () |2 + | m0 ( + 12 ) |2 = 1, per quasi ogni R.


In caso di ltro QMF valgono le propriet elencate nella Proposizione
23.2.1.
Teorema 23.4.2. Sia (h(n))nZ un filtro QMF, sia g(n) = (1)n h(1 n).
Allora valgono tutte le propriet della Proposizione 23.2.1.
Dimostrazione. La dimostrazione segue dalla denizione di QMF e dal Teorema 23.3.6.

Nota 23.4.3. Ogni ltro m0 associato ad una funzione di scala in L1 (R)


un QMF in virt della (22.15) e della prima parte della dimostrazione del

Teorema 23.2.1.
Nota 23.4.4. Dalla condizione di ortogonalit della Proposizione 23.2.1 discende che, se h(n) = 0 per n > N e n < M con h(N) 6= 0 e h(M) 6= 0,
allora il numero N M + 1 pari, ovvero h(n) ha supporto uguale ad un
numero pari di punti. Infatti, per ogni n Z,
n =

X
k

h(k)h(k 2n)

= h(M)h(M 2n) + h(M + 1)h(M + 1 2n) + + h(N)h(N 2n).


Ora, se N M + 1 fosse dispari, scegliendo 2n = N M avremmo
0 =

X
k

h(k)h(k 2n)

= h(M)h(2M N) + h(M + 1)h(2M + 1 N) + + h(N)h(M),


ed essendo 2M N < 2M + 1 N < . . . , M 1 < M otterremmo lassurdo
0=

X
k

h(k)h(k 2n) = h(N)h(M) 6= 0.

1286 CAPITOLO 23. LA TRASFORMATA DISCRETA DI ONDICELLE

23.5

La trasformata discreta di ondicelle

Alla luce di quanto fatto nei paragra precedenti, possiamo dare la denizione
formale della trasformata discreta di Ondicelle.
Definizione 23.5.1. Sia h(n) un ltro QMF. Siano g(n), m0, m1 , H e G
deniti come nella Denizione 23.3.2. Sia c0 = (c0 (n))nZ 2 (Z) . La
trasformata discreta di ondicelle di c0 al livello J N data dalle successioni
(d1 (n))nZ , (d2(n))nZ , . . . , (dJ (n))nZ , (cJ (n))nZ ,
dove, per ogni p = 1, . . . , J 1,
cp (n) = (Hcp )(n),
d1
G
c0

d2

dp (n) = (Gcp )(n).

dJ

c1
cJ1
c2
cJ
La trasformata
inversa denita tramite
la formula
H
H
cp1 (n) = (H cp )(n) + (G dp )(n).

dJ

dJ1

cJ

cJ1

d1

cJ2

c1

c0

Nelle applicazioni si in presenza di un segnale c0 di lunghezza nita. In


questo caso si pu procedere in due modi.
Primo caso. Si riempe di zeri il segnale e si procede con la trasformata
discreta. La rappresentazione, per, non la pi eciente: partendo da un
segnale c0 di lunghezza L = 2N , (ovvero c0 (n0 )c0 (n0 + L 1) 6= 0 e c0 (n) = 0
per |n| > n0 ), si verica facilmente che, al passo j, entrambe le successioni
cj e dj hanno lunghezza pari a 2N j + (1 2j )(L 2).

23.5. LA TRASFORMATA DISCRETA DI ONDICELLE

1287

Complessivamente, allora, se ci fermiano al passo J, la trasformata discreta


richiede la memorizzazione di valori in numero pari a
2N j + (1 2j )(L 2) +

J
X
p=1

= 2N j + (1 2j )(L 2) + 2N
N

= 2 + J(L 2),

(2N p + (1 2p )(L 2))

J
X
p=1

2p + (L 2)J (L 2)

J
X

2p

p=1

e questo numero cresce con J.


Secondo caso. Unalternativa quella di rendere il segnale periodico, ovvero
ripetere allinnito i valori non nulli. Si pu dimostrare che la trasformata
discreta di un segnale di periodo 2N crea, al passo successivo, successioni di
periodo pari a 2N 1 . In questo modo, dopo J N passi, la trasformata
memorizza esattamente 2N valori.
Ci sono situazioni per, si pensi, ad esempio, allandamento del prezzo di
unazione, in cui il segnale non pu dirsi periodico. In tal caso si usano altre
tecniche che fanno riferimento a costruzioni pi ranate, quali le ondicelle
biortogonali o i frames, che vedremo in un capitolo successivo.
La DWT pu essere vista come trasformazione ortogonale. Partiamo da un
segnale reale c0 di lunghezza, e quindi periodo, L = 2N , La matrice che
rappresenta H sar una matrice 2N 1 2N , costruita traslando, ad ogni riga,
i valori del ltro di due posizioni.
Per esempio, per N = 3 ed un ltro reale di lunghezza 6, in cui h(0)h(5) 6= 0,
si avr

h(0) h(1) h(2) h(3) h(4) h(5) 0


0
0
0 h(0) h(1) h(2) h(3) h(4) h(5)
.
H8 =
h(4) h(5) 0
0 h(0) h(1) h(2) h(3)
h(2) h(3) h(4) h(5) 0
0 h(0) h(1)
Allo stesso modo, tenendo presente che g(n) = (1)n h(1 n), si avr

g(4) g(3) g(2) g(1) g(0)


g(1)
0
0
0
0
g(0)
g(4)
g(3)
g(2)
g(1)
g(0)
G8 =
g(0)
g(1)
0
0
g(4) g(3) g(2) g(1)
g(2) g(1) g(0)
g(1)
0
0
g(4) g(3)

1288 CAPITOLO 23. LA TRASFORMATA DISCRETA DI ONDICELLE


Si osservi che, per quanto detto precedentemente, Hc0 e Gc0 producono ciascuno un vettore di periodo 2N 1 . Denita la matrice L L = 2N 2N


HL
,
WL =
GL
si ottiene luguaglianza WL WL = HL HL + GL GL = IL , dove IL la matrice
identica. Pertanto WL una matrice ortogonale e la trasformata discreta si
ricava dal seguente procedimento:
Primo passo


d1
;
WL c0 =
c1

secondo passo

IL/2
0
0 WL/2



d1
c1

ed in generale, al passo J

I(12J )L
0
0
WL/2J

d1


dJ1
cJ1

d1
= d2 ;
c2

d1

dJ1
dJ
cJ

La trasformata discreta, W , ottenuta come prodotto di tutte queste matrici


ortogonali, ancora ortogonale

d1


 


IL/2
0
I(12J )L
0
.

WL c0 =
...
W c0 =

d
0 WL/2
0
WL/2J
J1

dJ
cJ

23.6

QMF che generano MRA

Abbiamo visto che un ltro associato ad una funzione di scala proveniente da


una MRA un ltro QMF. E naturale chiedersi se, viceversa, partendo da

23.6. QMF CHE GENERANO MRA

1289

un ltro QMF si pu ottenere una MRA ed una funzione di scala associata


ad esso. Cominciamo con losservare che se m0 un ltro associato ad una
funzione di scala , si ha necessariamente, per lequazione di scala
n

) = m0 ( )m0 ( )(
)=
m0 ( j )(
n ).
()

= m0 ( )(
2
2
2
4
4
2
2
j=1
Se possiamo dare un senso al limite
lim
n

indicato con

+
Y
j=1

m0 (

n
Y

m0 (

j=1

),
2j

), dalla relazione
2j
n
Y

m0 (

j=1

()

)=
j
2
(
2n )

e nella ipotesi che sia continua, otteniamo unindicazione di come debba


essere scelta , ossia
+
Y

()

=
m0 ( j )(0).

2
j=1
Quindi richiamiamo i concetti che portano a denire il prodotto innito.

23.6.1

Prodotti infiniti

Definizione 23.6.1. Sia (zn )nN una successione di numeri complessi. Se


esiste nito
N
Y
lim
zn = lim (z1 zn ),
N

n=1

esso prende il nome di prodotto innito della successione (zn )nN , e si indica
con
+
Y
zn .
n=1

In tal caso si dice anche che

+
Y

n=1

zn converge.

1290 CAPITOLO 23. LA TRASFORMATA DISCRETA DI ONDICELLE


Nota 23.6.2. 1) Se esiste un n N per cui zn = 0 allora esiste il prodotto
innito e vale 0.
2) Se zn 6= 0 per ogni n, ed esiste il prodotto innito, allora, posto pN =
N
Y
zn , si ha
n=1

lim zN = lim
N

pN
= 1.
pN 1

Ricordiamo che, se z C viene scritto nella forma z = |z|ei con 0 <


2, il numero complesso log z = ln |z| + i si chiama logaritmo principale di
z.
Teorema 23.6.3. Sia (zn )nN una successione di numeri complessi. Se la
+
+
Y
X
zn .
serie
log zn converge, allora converge il prodotto infinito
n=1

n=1

Dimostrazione. Sia sN =

N
Y

n=1

log zn C. Per ipotesi, esiate limN sN = s,

quindi esiste limN esN = es . Ora zn = |zn | ein , quindi


sN

N
Y

log zn

n=1

N
Y

n=1

in

|zn | e

N
Y

zn ,

n=1

e si ottiene lasserto.

Definizione 23.6.4. Diremo che il prodotto innito

+
Y

zn converge assolu-

n=1

tamente, se la serie

+
X

log zn converge assolutamente, cio se si verica la

n=1
+
X

convergenza della serie

n=1

|log zn |.

23.6. QMF CHE GENERANO MRA

1291

Teorema 23.6.5. Sia (zn )nN una successione di numeri complessi. Se la


+
+
Y
X
zn
(zn 1) converge assolutamente, allora il prodotto infinito
serie
n=1

n=1

converge assolutamente.

Dimostrazione. Dallipotesi di assoluta convergenza, segue che limn |zn 1| =


0. Quindi, per n grandi si ha |zn 1| < 1/2. Partendo dallosservazione ovvia
che |log zn | = |log (1 + (zn 1))|, andiamo a stimare |log (1 + y)|, per y C,
|y| < 1/2, per mezzo della formula di Taylor
log (1 + y) =

+
X

(1)n1

n=1

yn
.
n

Si ha
+
+
+
X
X
X
|log (1 + y)|
|y|n1
|y|n1
|y|n

=1+
=1+
|y|
n
n
n+1
n=1
n=2
n=1
+  n
X
1
= 2.
1+
2
n=1

Quindi, per n grandi si ha


|log zn | 2|zn 1|,
e lasserto.

23.6.2

QMF e funzione di scala

Ritorniamo ai QMF per dare una risposta positiva al nostro problema almeno
nel caso di ltri niti.
Teorema 23.6.6. Sia (h(n))nZ un filtro QMF finito, ovvero h(n) = 0 tranne, al pi, per un numeroPfinito di termini. Consideriamo il polinomio
trigonometrico m0 () = 12 n h(n)e2in . Allora il prodotto infinito
+
Y
j=1

m0 (

)
2j

1292 CAPITOLO 23. LA TRASFORMATA DISCRETA DI ONDICELLE


converge assolutamente ed in L ([R, R]) per ogni R R.
+
Y

m0 ( j ), R, si ha che p L2 (R) e quindi esiste


Inoltre, posto p() =
2
j=1

una L2 (R) tale che = p. La funzione verifica lequazione di scala


2 ).
()

= m0 ( 2 )(
Se, inoltre, si ha m0 () 6= 0 in [1/4, 1/4], allora il sistema {(xk), k Z}
ortonormale e definisce una MRA se si pone:
1) V0 = < (x k), k Z >;
2) f (x) Vj f (2j ) V0 .

Dimostrazione. Dimostriamo solo la prima parte del Teorema. Proveremo


lassoluta convergenza con lausilio del Teorema 23.6.5. Si osservi che, per
denizione di QMF,
1 X
1 X
m0 () =
h(n)e2in m0 (0) + 1 =
h(n)(e2in 1) + 1.
2 n
2 n
Allora



1 X
|m0 () 1|
|h(n)| e2in 1
2 n


1 X
1 X
|h(n)| ein ein =
|h(n)| |2 sin (n)|
=
2 n
2 n

X
2
|h(n)| |n| || = 2C||

Se R > 0 e || R, allora il termine generale della serie



+
X

m0 ( ) 1 ,


2j
j=1

maggiorato dal termine generale della serie convergente

ed otteniamo lasserto.

+
X
1
,
2C
j
2
j=1

23.7. LALGORITMO A CASCATA

23.7

1293

Lalgoritmo a cascata

Un altro modo per ottenere la funzione di scala partendo dal ltro si ottiene
con un procedimento iterativo noto come algoritmo a cascata. Losservazione iniziale che la funzione di scala un punto sso per loperatore
X
h(n)f (2 n).
f 7 2
n

Un modo per ottenere il punto sso il seguente. Si ssa una funzione iniziale
f0 (x) e si denisce
fm (x) =

X
2
h(n)fm1 (2x n).

(23.5)

Se la successione (fm )mN converge, passando al limite nella (23.5), si ottiene


il punto sso.
Teorema 23.7.1. Nelle ipotesi del Teorema 23.6.6, si supponga che m0 ()
c > 0 in [1/4, 1/4]. Sia f0 = [1/2,1/2] e si definisca la successione fm
tramite la (23.5). Sia L2 (R) quella prevista dal Teorema 23.6.6. Allora
fm (x) (x)

in

L2 (R) .

Dimostrazione. Premettiamo il seguente risultato sul passaggio al limite sotto


il segno di integrale.
Teorema 23.7.2. Supponiamo che, per ogni R R si abbia fn f nello
spazio L2 ([R, R]) o L ([R, R]).
Se per ogni > 0 esistono R > 0, N N tali che, per ogni n N risulti
Z
|fn (x)| dx < ,
|x|>R
allora
lim
n

fn (x) dx =

f (x) dx.

La dimostrazione del Teorema 23.7.1 verr fatta in tre passi.


Primo passo.

1294 CAPITOLO 23. LA TRASFORMATA DISCRETA DI ONDICELLE


Dimostriamo che per ogni R R fm in L ([R, R]).
Da (23.5), passando alla trasformata di Fourier, si ha

fm () = m0 ( )fm1 ( ) = m0 ( )m0 ( )fm2 ( )


2
2
2
4
4
m
Y

sin ( m )
=
m0 ( j )f0 ( j ) =
m0 ( j ) 2 .
2
2
2
2m
j=1
j=1

Poich in L ([R, R]),


1 = lim

sin ( 2m )

2m

e, per il Teorema 23.6.6,


()

= lim
m

m
Y
j=1

m0 (

),
2j

si ha lasserto.
Secondo passo.
Dimostriamo, per induzione su m, che il sistema {fm (x k), k Z} ortonormale.
Per m = 0 lasserto vero per la denizione di f0 .
Per un generico m, si ha, con opportuni cambi di variabile,
X
h(n)h(l) < fm1 (2x 2k n), fm1 (2x l) >
< fm (x k), fm (x) > = 2
n,l

X
n,l

h(n)h(l)

fm1 (x)fm1 (x (l 2k n)) dx

h(n)h(l)l2kn,0 = k,0,

n,l

per lipotesi di induzione e le propriet del QMF.


Si ha, in particolare, che kfm k2 = 1.
Terzo passo.
Dimostriamo che, per ogni > 0, esistono R > 0, N N tali che, per ogni
m N risulti
Z




fm () d < .
|x|>R

23.7. LALGORITMO A CASCATA

1295

Per il Teorema 23.6.6, il sistema {(x k), k Z} ortonormale, in particolare, kk


2 = 1. Allora, si trova, per un > 0 ssato, un R > 0 tale
che
Z R

2
|()|

d 1 .
2
R
Dal primo passo della dimostrazione ricaviamo, per m grandi,
Z R
Z R
2


2
lim
|()|

d,
fm () d =
m

da cui la disuglianza
Z
Z R
2


fm () d
R

2
|()|

1 ,
2

e, tenendo presente che kfm k2 = 1, si ottiene lasserto.


Applichiamo, inne, il teorema di passaggio al limite alle funzioni

2


.
fm () ()

Dal primo e terzo passo otteniamo che, per ogni > 0, esistono R > 0,
N N, tali che, per ogni m N risulti
Z
Z
2



2
|()|

d < /4,
fm () d < /4 e
|x|>R
|x|>R
ed utilizzando la disuguaglianza
2

2





2

),
2( fm () + |()|
fm () ()
si ottiene la stima fuori dallintervallo
Z
2



d < .
fm () ()
|x|>R

La stima allinterno dellintervallo


Z

2


d < ,
fm () ()
|x|R

segue dal primo passo ed il teorema completamente dimostrato.

1296 CAPITOLO 23. LA TRASFORMATA DISCRETA DI ONDICELLE

Capitolo 24
Ondicelle a Supporto Compatto
Faremo vedere come la lunghezza di un ltro sia legata alla grandezza del
supporto della funzione di scala. Successivamente esamineremo il rapporto
tra regolarit di un ondicella e bont dellapprossimazione. Inne costruiremo
le ondicelle a supporto compatto delle Daubechies.

24.1

Rapporto tra lunghezza del filtro e supporto della funzione di scala

Ricordiamo che il supporto di


supp = {x R | (x) 6= 0},
quindi, se limitato, esiste un intervallo [a, a] che lo contiene. Inoltre esso si
dice compatto se chiuso (e lo per denizione) e limitato; in tal caso con
lunghezza del supporto di si intende la lunghezza dellintervallo minimo che
lo contiene.
Lemma 24.1.1. Sia (Vj ) una MRA con funzione di scala e filtro (h(n)).
Se a supporto compatto, allora il filtro contiene un numero finito di
elementi non nulli.
Dimostrazione. Dallequazione di scala (22.9) e ricordando che le traslate
((2x k))kZ formano un sistema ortonormale, otteniamo
Z
Z a

2h(k) = (x)(2x k) dx =
(x)(2x k) dx,
(24.1)
a

1297

1298

CAPITOLO 24. ONDICELLE A SUPPORTO COMPATTO

se supp [a, a]. E facile osservare che 2x k [a, a] se e solo se


, a+k
], quindi per |k| grandi gli intervalli [a, a] e [ a+k
, a+k
], non si
x [ a+k
2
2
2
2
intersecano e si ha h(k) = 0 tranne, al pi, un numero nito di termini.

Vediamo ora come lalgoritmo a cascata permetta di determinare la lunghezza del supporto di a partire dalla lunghezza del ltro QMF.

Teorema 24.1.2. Supponiamo che (h(n))nZ sia un filtro QMF di lunghezza 2N, (si veda lOsservazione 23.4.4). Siano n0 e N0 rispettivamente il
pi piccolo ed il pi grande intero n Z per cui h(n) 6= 0, in modo che
N0 n0 + 1 = 2N.
Supponiamo, inoltre, che siano verificate le ipotesi del Teorema 23.7.1. Allora la funzione di scala prevista dal Teorema 23.7.1 a supporto compatto
contenuto in un intervallo di lunghezza 2N 1.

Dimostrazione. Sia f0 = [1/2,1/2] la funzione con la quale iniziamo lalgoritmo a cascata. Indichiamo con L0 la lunghezza del suo supporto, ovviamente L0 = 1, e con Lm la lunghezza del supporto delle funzioni denite
ricorsivamente tramite la (23.5)
N0
X
fm (x) = 2
h(n)fm1 (2x n).
n=n0

Si ha

Lm1 2N 1
+
.
2
2
Difatti basta esaminare il supporto di fm (x/2). Lestremo destro dellintervallo minimo che contiene il supporto di fm1 viene traslato di N0 e quello
sinistro di n0 , di conseguenza
Lm =

Lm =
=
=
=
=

Lm1 2N 1
(N0 n0 + Lm1 )
=
+
2
2

 2
1 Lm2 2N 1
2N 1
+
+
2
2
2
2
...
m
X
1
L0
+ (2N 1)
m
2
2j
j=1


1
1
+ (2N 1) 1 m ,
2m
2

24.1. LUNGHEZZA DEL FILTRO E SUPPORTO DELLA FUNZIONE DI SCALA1299


e, per m + si ha Lm 2N 1. Ora, per lalgoritmo a cascata, fm
nella norma L2 (R) , di conseguenza, la lunghezza del supporto di deve
essere pari a limm Lm = 2N 1, (basta ragionare per assurdo).

Nel prossimo Teorema si vede come la lunghezza del supporto di determina la lunghezza del ltro.

Teorema 24.1.3. Sia una funzione di scala di una MRA con filtro (h(n))nZ .
Supponiamo che il supporto di sia compatto e di lunghezza 2N 1 (N il
pi piccolo intero per cui si ha ci.) Allora il filtro ha lunghezza 2N.
Dimostrazione. Senza ledere la generalit possiamo supporre che supp
[0, 2N 1]. Siano a0 , a1 0 tali che sia supportata in [a0 , 2N 1 a1 ]
e non in uno pi piccolo. Proviamo che a0 < 2 e a1 < 2. Infatti, se cos
non fosse, ovvero se almeno uno di essi fosse maggiore o uguale a 2, diciamo
a1 = 2p + con 0 < < 2, e N > p > 0, la lunghezza di [a0 , 2N 1 a1 ]
sarebbe 2N 1 a1 a0 = 2(N p) 1 a0 < 2(N p) 1, contro
lipotesi che N sia minimo.
1 +n
Ora, per ogni n Z, (2x n) ha supporto contenuto in [ a02+n , 2N 1a
]
2
e non in uno pi piccolo. Daltra parte il supporto compatto implica, per il
Lemma 24.1.1, che il ltro sia nito. Siano n0 e N0 rispettivamente il pi
piccolo ed il pi grande intero n Z per cui h(n) 6= 0. Dallequazione di
scala
N0
X
(x) = 2
h(n)(2x n),
n=n0

si ottiene

[a0 , 2N 1 a1 ] = [

a0 + n0 2N 1 a1 + N0
,
],
2
2

(24.2)

ed uguagliando gli estremi dei due intervalli, si deduce che a0 , a1 N per cui
le uniche possibilit sono a0 = 0, oppure 1 e a1 = 0, oppure 1.
Se, per assurdo, a0 = 1, necessariamente a1 = 0, altrimenti la lunghezza
dellintervallo [a0 , 2N 1 a1 ] sarebbe 2(N 1) 1 contro la minimalit
di N. Ma a1 = 0 implica, per (24.2), che il ltro ha lunghezza dispari
N0 n0 + 1 = 2N 1 1 + 1, e ci assurdo. Allora a0 = 0 e di nuovo le
propriet del ltro e la (24.2) impongono a1 = 0 e lasserto completamente
dimostrato.

1300

24.2

CAPITOLO 24. ONDICELLE A SUPPORTO COMPATTO

Ondicelle ed approssimazione

Uno degli obiettivi di questo capitolo quello di costruire ondicelle a supporto compatto tali che i coecienti delle funzioni regolari (calcolati con la
trasformata di ondicelle) abbiano un buon decadimento. Iniziamo a vedere
come si misura la regolarit di unondicella e come questo strumento serva
per una buona approssimazione.
Definizione 24.2.1. Sia unondicella che proviene da una MRA. La
quantit
Z
xk (x) dx,
(24.3)
prende il nome di momento k-simo di . Se (24.3) vale zero, diremo che
ha momento k-simo nullo.

Abbiamo visto che il momento zero di L1 (R) proveniente da una


MRA sempre nullo. La stessa conclusione vera sotto ipotesi pi generali
(, L1 (R) , (jk )j,kZ sistema ortogonale per L2 (R) ), ma nel caso di
una MRA abbiamo un risultato che mette in rapporto regolarit e numero
dei momenti nulli.
Teorema 24.2.2. Sia una ondicella per una MRA. Supponiamo che, per
L1 (R) . Allora
N N, si abbia xN (x), N +1 ()
Z
xk (x) dx = 0, per ogni k = 0, . . . , N.
Dimostrazione. Uno dei principi della trasformata di Fourier il seguente:
pi una funzione regolare (dove la regolarit si misura con il numero delle
derivate continue), pi la sua trasformata di Fourier decadr velocemente
allinnito. Viceversa, la maggiore velocit di decadimento allinnito di una
funzione comporta una maggiore regolarit della sua trasformata di Fourier.
L1 (R) si pu vedere
Per la terza delle Propriet 22.1.5, lipotesi N +1()
come unipotesi di regolarit di , in particolare ci dice che londicella ha
N + 1 derivate continue.
Accenniamo alla dimostrazione. Dallipotesi xN L1 (R) discende che
abbia derivate no allordine N. Si prova, per induzione, che
(j) (0) = 0,

j = 0, . . . , N.

24.2. ONDICELLE ED APPROSSIMAZIONE

1301

Da cui, per la terza delle Propriet 22.1.5,


Z
j (0) =
0 = xd
xj (x) dx.

Il teorema seguente mostra come unondicella con molti momenti nulli approssimi
una funzione regolare f molto bene, ovvero, nelluguaglianza
P
f = j,k < f, jk > jk , i coecienti < f, jk > vanno a zero molto velocemente per j +. Di conseguenza, saranno necessari pochi coecienti
signicativi per ottenere una buona approssimazione per f .

Teorema 24.2.3. Siano N N e f C N (R), f (N ) L (R). Supponiamo


che sia unondicella a supporto compatto per una MRA, con momenti nulli
fino allordine N 1. Allora esiste una costante C = C(N, f ) tale che
|< f, jk >| C2j(N +1/2) ,

per ogni

j, k Z.

Dimostrazione. La dimostrazione si sviluppa in tre passi.


Primo passo Supponiamo che il supporto di sia contenuto in [0, a], a > 0.
Allora jk ha supporto in Ajk = [ 2kj , k+a
], di lunghezza |Ajk | = 2aj e di centro
2j
2k+a
xjk = 2j+1 . Lipotesi sui momenti nulli implica che ogni polinomio p(x) di
grado minore o uguale ad N 1 verica
Z
p(x)jk (x) dx = 0, per ogni j, k Z.
Secondo passo Per via dellipotesi f C N (R), possiamo sviluppare f nella
formula di Taylor, con resto in forma di Lagrange, di centro xjk ,
f (x) =

N
1
X
n=0

f (N ) ()
f (n) (xjk )
(x xjk )n +
(x xjk )N ,
(n)!
N!

dove un punto tra x e xjk .


Se denotiamo il resto con RN (x) =
sulla derivata N-sima di f ,
|RN (x)|

f (N) ()
(x
N!

xjk )N , e x Ajk , per lipotesi

aN
1
kf (N ) k .
N
(j+1)
N! 2

1302

CAPITOLO 24. ONDICELLE A SUPPORTO COMPATTO

Terzo passo Calcoliamo il coeciente, tenendo presente lipotesi sui momenti.

< f, jk > = f (xjk )

jk dx + f (xjk )

(x xjk )jk dx

+ ...
Z
f (N 1) (xjk )
(x xjk )N 1 jk dx
+
(N 1)!
Z
+
RN (x)jk dx
Z
=
RN (x)jk dx.
Inne passiamo alla sua stima. Per il Secondo passo e la disuguaglianza di
Cauchy-Schwarz,

|< f, jk >|

Ajk

|RN (x)| |jk | dx

aN
1
kf (N ) k

N! 2N (j+1)

Ajk

|jk | dx

1
aN
kf (N ) k |Ajk |kjk k2
N! 2N (j+1)
 N +1/2

a
(N )
=
kf k aj(N +1/2) .
N!2N

Dalla precedente dimostrazione otteniamo ulteriori conclusioni qualitative


sul signicato dei coecienti < f, jk > . Partiamo dal resto RN (x). Dalla
continuit di f (N ) e dal fatto che la lunghezza dellintervallo Ajk tende a zero
per j +, otteniamo che, al crescere di j, possiamo identicare il valore
f (N ) () con il valore nel punto medio f (N ) (xjk ). Quindi, con opportuni cambi

24.2. ONDICELLE ED APPROSSIMAZIONE

1303

di variabile,
< f, jk > =

RN (x)jk dx
Z (k+a)/2j
1 (N )
f (xjk )
(x xjk )N 2j/2 (2j x k) dx

N!
k/2j
Z a/2j+1
1 (N )
a
2j/2 xN (2j x + ) dx
f (xjk )
=
N!
2
a/2j+1
Z
a/2
a
2j/2 (N )
f (xjk )
2jN xN (x + ) dx,
=
N!
2
a/2

e si ricava la stima
|< f, jk >| 2j(N +1/2)

"

1 (N )
f (xjk )
N!

#
a
xN (x + ) dx .
2
a/2

a/2

Linterpretazione della stima precedente la seguente: il decadimento del


coeciente < f, jk > di una funzione regolare un fenomeno locale. Ci che
necessario conoscere il comportamento della derivata f (N ) in un intervallo
contenente il supporto di jk , ed in realt non necessario che f sia di classe
C N in tutto R.
Esempio 24.2.4. Consideriamo la spline lineare

f = (1 |x|)[1,1] (x) C (R\{1, 0, 1}).


Sia unondicella con i primi due momenti nulli e supporto compatto contenuto in [0, 3], (tale ondicella esiste).
E facile vericare i valori dei seguenti coecienti
< f, jk
< f, 0k
< f, 1k
< f, 2k

>= 0,
>= 0,
>= 0,
>= 0,

k
k
k
k

1,
1,
2,
4,

k
k
k
k

4, j < 0,
4,
5,
7.

In generale < f, jk >= 0 quando il supporto di jk contenuto interamente


in [0, 1] oppure [1, 0], dove f lineare, mentre i coeceinti non nulli si
ottengono quando il supporto di jk contiene punti in cui la derivata di f
possiede delle discontinuit.

1304

CAPITOLO 24. ONDICELLE A SUPPORTO COMPATTO

24.3

Riproducibilit dei polinomi

Faremo vedere che, se londicella ha momenti nulli no allordine N, allora


ogni monomio xk , 0 k N, si pu scrivere come combinazione lineare
delle traslate della funzione di scala. Tale propriet prende il nome di riproducibilit dei polinomi. Si deduce che ogni funzione regolare, in quanto
approssimabile con funzioni polinomiali a tratti, avr, nella trasformata di
ondicelle, molti coecienti nulli.
Si premette il seguente risultato di cui non presentiamo la dimostrazione.
Teorema 24.3.1. Sia una funzione di scala a supporto compatto associata
ad una MRA. Sia (h(n))nZ il filtro (finito) e la wavelet corrispondente.
Allora sono equivalenti
a)

xk (x) dx = 0,

(k)

b) m0 ( 21 ) = 0,

per ogni 0 k N 1;

per ogni 0 k N 1;

c) m0 si fattorizza come
m0 () =

1 + e2i
2

N

L(),

dove L() un polinomio trigonometrico (1-periodico);

d)

h(n)(1)n nk = 0,

per ogni 0 k N 1.

Lemma 24.3.2. Sia una funzione di scala a supporto compatto associata


ad una MRA. Sia la wavelet corrispondente. Se ha momenti nulli fino
allordine N 1, allora (k) (n) = 0, per ogni n 6= 0 e 0 k N 1.
(k)

Dimostrazione. Per il teorema precedente, m0 ( 12 ) = 0, per ogni 0 k


N 1. Sia n 6= 0.
Se n dispari, allora n = 2m + 1. Dallequazione di scala e dalla formula di
Leibniz per il calcolo della derivata di un prodotto di funzioni, si ha

k 

1 X k
(l)
m0 ( )(kl) ( ).
() = k
l
2 l=0
2
2
(k)

24.3. RIPRODUCIBILIT DEI POLINOMI

1305

Quindi, per la periodicit di m0 ,



k 

1 X k
(l) 1
m0 ( )(kl) (m + ) = 0.
(n) = k
l
2 l=0
2
2
(k)

Se n pari, allora n = 2p m, dove m dispari.


lequazione di scala si ha
()

p
Y
j=1

e quindi
(n)

p
Y

m0 (

Applicando pi volte

)
(

),
2j
2p

m0 (2pj m)(m)

= 0.

j=1

Lemma 24.3.3. Nelle ipotesi del Lemma precedente, per ogni 0 k N 1,


X
(x + n)k (x + n) = (2i)k (k) (0).
n

Dimostrazione. Si osservi, innanzitutto, che, poiche ha supporto compatto, (2ix)k L1 (R) , e quindi
((2ix)k )() = (k) ().
Ora, operando un cambio di variabile,
Z 1
X
(2i)k
(x + n)k (x + n)e2imx dx
0

= (2i)k

XZ
n

= (2i)k

(x + n)k (x + n)e2imx dx

xk (x)e2im(xn) dx
R

= e2imn ((2ix)k )(m)


= (k) (m) = (k) (0)0,m ,

1306

CAPITOLO 24. ONDICELLE A SUPPORTO COMPATTO

ma lunica funzione 1-periodica che ha questi coecienti di Fourier la


funzione costante di valore (k) (0) in [0, 1). Cos si ottiene lasserto.

In particolare, dal lemma precedente, per k = 0, si ha


X
(x + n) = (0)

= 1.
n

Lemma 24.3.4. Nelle ipotesi del Lemma precedente, per ogni 1 k N 1,


esiste un polinomio pk1 (x) di grado k 1 tale che
X
nk (x + n) = (1)k xk pk1 (x).
n

Dimostrazione. Per induzione su k. Poniamo ak = (2i)k (k) (0).


Se k = 1, per il Lemma 24.3.3 si ha
X
X
X
a1 =
(x + n)(x + n) = x
(x + n) + n
(x + n).
n

Di conseguenza n n (x + n) = a1 x, polinomio di primo grado.


Supponiamo che lasserto sia vero per l k 1 e consideriamo k
ak =
=
=
=


k 
XX
k
xkl nl (x + n)
(x + n) (x + n) =
l
n
n l=0

k
X
X
X k 
k
xkl
nl (x + n)
x
(x + n) +
l
n
n
l=1


k1
X
X k
xkl [(1)l xl + pl1 (x)] +
nk (x + n)
xk +
l
n
l=1




k1
k1
X
X k
X k
xkl pl1 (x) +
nk (x + n),
(1)l xk +
xk +
l
l

l=1

l=1

dove si utulizzata lipotesi di induzione. Allora


!


k1 
k1 
X
X
X
k
k
k
l
k
xkl pl1 (x),
(1) x + ak
n (x + n) = 1 +
l
l
n

l=1

l=1

24.4. LE ONDICELLE DI DAUBECHIES


ed essendo

1307



k1 
X
2, k pari;
k
l
(1) =
0, k dispari;
l
l=1

tutto completamente dimostrato.

Teorema 24.3.5. Nelle ipotesi del lemma precedente, per ogni 0 k N 1,


esistono dei coefficienti qk,n Z tale che
X
qk,n (x + n) = xk .
n

Dimostrazione. Per induzione su


Pk.
Se k = 0 sappiamo gi che 1 = n (x + n).
Supponiamo che lasserto sia vero per l k 1 e consideriamo k. Dal Lemma
24.3.4
X
(1)k xk =
nk (x + n) pk1(x)
n

da cui
xk =

X
n

e lasserto.

24.4

n (x + n)
nk (x + n)

(1)k

nk

k1
X
l=0

k1
X

bl xl

l=0

k1
X
l=0

bl

ql,n (x + n),

bl ql,n (x + n),

Le ondicelle di Daubechies

Abbiamo visto che il numero dei momenti nulli di unondicella cresce al crescere della sua regolarit. Ingrid Daubechies, [9], ha costruito delle ondicelle
a supporto compatto con il pi grande numero di momenti nulli compatibilmente con la grandezza del supporto. Esse hanno supporto nellintervallo
[0, 2N 1] ed hanno momenti nulli no allordine N 1. Inoltre, al crescere

1308

CAPITOLO 24. ONDICELLE A SUPPORTO COMPATTO

del supporto aumenta anche la regolarit dellondicella.


La costruzione parte dallosservazione che, se si vuole costruire unondicella
con supporto in [0, 2N 1], si deve partire da un QMF (h(n))nZ di lunghezza
2N, (si veda lOsservazione 23.4.4 e il Teorema 24.1.3).
In principio si assumer che il ltro sia reale. Inoltre, se si vuole che londicella abbia N momenti nulli, per il Teorema 24.3.1, deve essere valida la
fattorizzazione

N
1 + e2i
m0 () =
L(),
2
dove L() un polinomio trigonometrico (1-periodico). Allora, necessariamente,


1 + e2i 2N
2
|L()|2 = cos2N () L(),

|m0 ()| =

2

dove si posto L() = |L()|2 ,Ppolinomio trigonometrico a valori reali e


coecienti reali. Quindi L() = n c(n)e2in con c(n) = c(n).
Si cerca, ora, di trasformare L() in modo da determinarlo facilmente.
L() = c(0) +

+
X

[c(n)e2in + c(n)e+2in ]

n=1
+
X

= c(0) + 2

c(n) cos (2n).

n=1

Ora cos (2n) si pu scrivere come un polinomio di grado n in cos (2), a


coecienti reali e quindi anche L() un polinomio in cos (2) a coecienti
reali. Ancora una trasformazione: da cos (2) = 1 sin2 () segue che si
pu vedere L() come polinomio in sin2 () a coecienti reali. Si ponga
L() = P (sin2 ()).
Imponendo che m0 sia un QMF si ha
1
1 = | m0 () |2 + | m0 ( + ) |2
2

1
= cos2N ()L() + cos2N ( + )L( + )
2
2
2
N
2
2N
= (1 sin ()) P (sin ()) + sin ()P (1 sin2 ()).

In denitiva, posto sin2 () = y, si deve trovare un polinomio P (y), a


coecienti reali e valori positivi, tale che, per ogni y [0, 1],
1 = (1 y)N P (y) + y N P (1 y).

(24.4)

24.4. LE ONDICELLE DI DAUBECHIES

1309

Uno dei modi per trovare tale polinomio il seguente. Si parte dallosservazione che 1 = ((1 y) + y)2N 1 . Quindi, sviluppando il binomio con la
formula di Newton,

2N
1 
X
2N 1
2N 1
(1 y)k y 2N 1k
1 = ((1 y) + y)
=
k
k=0



2N
1 
N
1
X
X 2N 1
2N 1
k 2N 1k
(1 y)k y 2N 1k
(1 y) y
+
=
k
k
k=N
k=0



N
1 
N
1
X
X 2N 1
2N 1
k 2N 1k
(1 y)2N 1k y k ,
(1 y) y
+
=
k
k
k=0

k=0

2N 1
k

dopo la sostituzione k = 2N 1 k e losservazione che


=


2N 1
, nella seconda delle due somme. Quindi baster prendere
2N 1 k
P (y) = PN 1 (y) =

N
1 
X
k=0

2N 1
k


(1 y)N 1k y k ,

(24.5)

per ottenere il polinomio cercato che verica (24.4).


Esempio 24.4.1. Di seguito si elencano i polinomi, deniti tramite la (24.5),
per diversi valori di N.
N
1
2
3
4

PN 1 (y)
1
1 + 2y
1 + 3y + 6y 2
1 + 4y + 10y 2 + 20y 3

Il ltro m0 determinato una volta che si riesca ad ottenere L() dalluguaglianza L() = P (sin2 ()) = |L()|2 .
Per alcuni valori di N la ricerca di L() elementare. Nel paragrafo seguente
verr proposto un metodo valido in generale.

1310

CAPITOLO 24. ONDICELLE A SUPPORTO COMPATTO

Esempio 24.4.2. N=1. Poich P0 (y) = 1, basta prendere L() = 1. Ne


consegue che


1
1 + e2i
1 2i
1
+ e
=
m0 () =
,
2
2
2
2
e si ritrova londicella di Haar.N=2. Poich P1 (y) = 1 + 2y, si ottiene
|L()|2 = P1 (sin2 ()) = 1 + 2 sin2 () = 2 cos (2).
Imponendo che L() sia un polinomio trigonometrico, quindi della forma
a + be2i , con a, b R, si ha
2 cos (2) = |L()|2 = (a + be2i )(a + be2i ) = a2 + b2 + 2ab cos (2),
a cui bisogna aggiungere la condizione 1 = m0 (0) = L(0) = a+b. Uguagliando
i coecienti si trova facilmente che la soluzione data dalle seguenti coppie

1 3 1 3
,
).
(a, b) = (
2
2
Ad esempio, scegliendo la seconda coppia, si trova il ltro
m0 () =

1 + e2i
2

2

1 3 1 + 3 2i
,
+
e
2
2

(24.6)

e si ricavano facilmente gli unici elementi non nulli del ltro,

1 3
3 3
3+ 3
1+ 3
h(0) = , h(1) = , h(2) = , h(3) = .
4 2
4 2
4 2
4 2

Nota 24.4.3. Si noti che i ltri ottenuti nella costruzione precedente sono
tutti associati ad una MRA. A tal ne basta osservare che essi vericano le
ipotesi del Teorema 23.6.6. Infatti, se || 1/4, da una parte


1 + e2i 2

= cos2 () 1 .


2
2

24.5. FATTORIZZAZIONE SPETTRALE

1311

Daltra parte, essendo sin2 () [0, 1/2],


2

|L()| = PN 1 (sin ()) =

N
1 
X
k=0


1
2N 1
(cos2 ())N 1k sin2k () > .
k
2

In denitiva , si trova una costante C > 0 per cui


|m0 ()|2 c > 0,

per || 1/4,

ed quanto volevamo dimostrare.

24.5

Fattorizzazione spettrale

In questo paragrafo viene presentato un metodo per trovare il polinomio L a


partire dal polinomio PN 1 dato dalla (24.5). Esso consiste, essenzialmente,
nellestendere PN 1 ad un polinomio di variabile complessa e nel cercare gli
zeri di questo nuovo polinomio. L verr costruito a partire da questi zeri. Si
ricordi che vale lequazione
1 = (1 sin2 ())N P (sin2 ()) + sin2N ()P (1 sin2 ()).
Si denisca il polinomio di grado 2N 1
P2N 1 (x) = (1 x)N PN 1 (x),
da cui
1 = P2N 1 (sin2 ()) + P2N 1 (1 sin2 ()).
2i

2i

(24.7)

Trasformando sin2 () = 21 e +e
, si riscrive il polinomio appena
4
denito ottenendo il polinomio trigonometrico


1 e2i + e2i
2
P2N 1 (sin ()) = P2N 1
,

2
4
che si estende ad una funzione di variabile complessa


1 z + z 1
F2N 1 (z) = P2N 1
, z C.

2
4

1312

CAPITOLO 24. ONDICELLE A SUPPORTO COMPATTO

Esempio 24.5.1. Per N = 1, P1 (x) = (1 x)P0 (x) = 1 x. Allora




1 z + z 1
1 z z 1
F1 (z) = P1
= + +

.
2
4
2 4
4
Per N = 2, P3 (x) = (1 x)2 P1 (x) = (1 x)2 (1 + 2x). Allora


1
1 z + z 1
= [16 + 9z + 9z 1 z 3 z 3 ].

F3 (z) = P3
2
4
32

Teorema 24.5.2. Valgono le seguenti propriet


1) F2N 1 (z) =

2N
1
X

m=2N +1

am z m , dove am R;

2) F2N 1 (z) + F2N 1 (z) = 1, per ogni z C, z 6= 0;


3) F2N 1 (z) 0 per |z| = 1;
4) F2N 1 (z) = F2N 1 (z 1 ), per ogni z C, z 6= 0;
5) am = am ;
6) am = 0 se m pari, m 6= 0, a0 = 1/2.
Dimostrazione. Per la 1), basta osservare che F2N 1 (z) un polinomio di
grado 2N 1 in z + z 1 , a coecienti reali. Quindi
F2N 1 (z) =
=

2N
1
X
m=0

1 m

cm (z + z ) =

2N
1
X
m=0


m 
X
m
z k z m+k
cm
k
k=0


2N
1
m
X
X
m
bm,h z h
z m+2k =
cm
cm
k
m=0
m=0
h=m
k=0

2N
1
2N
1
X
X

cm bm,h z h .

2N
1
X

m 
X

h=2N +1

m=|h|

E suciente dimostrare la 2) per |z| = 1, in quanto la funzione F analitica


per z 6= 0. In tal caso, per, vera per la (24.7).

24.5. FATTORIZZAZIONE SPETTRALE

1313

La 3) segue dal fatto che, se |z| = 1, allora, per un certo , z = e2i , e quindi
F2N 1 (z) = P2N 1 (sin2 ()) 0.
La 4) discende dalla denizione di F2N 1 (z), mentre la 5) si ricava dalla 1) e
la 4).
Inne, per la 6). Dalla 1) e 2) si ha
1=

2N
1
X

am (z m + (1)m z m ).

m=2N +1

Dal confronto dei coecienti segue lasserto.


Introduciamo la seguente notazione

F4N 2 (z) = z 2N 1 F2N 1 (z),


al ne di ottenere un polinomio in z di grado 4N 2. Il Corollario seguente
ci permette di localizzare gli zeri di F4N 2 .
Corollario 24.5.3.

1) F4N 2 ha in z = 1 uno zero di ordine 2N, cio


F4N 2 (z) = (z + 1)2N Q2N 2 (z),

dove Q2N 2 un polinomio di grado 2N 2;


2) F4N 2 (1) = 1;
3) Se z0 uno zero di F4N 2 (z) di molteplicit m, allora z01 , z0 , z0 1 ,
sono ancora zeri di molteplicit m.
Dimostrazione. Accenniamo alla dimostrazione.


1 z + z 1
F2N 1 (z) = P2N 1

2
4




N
1 z + z 1
1 z + z 1
PN 1
+

=
2
4
2
4


1 z + z 1
1 N
2 N

= N z (2z + 1 + z ) PN 1
4
2
4


1
1
1 z+z
= N z N (1 + z)2N PN 1
.

4
2
4

1314
Allora

CAPITOLO 24. ONDICELLE A SUPPORTO COMPATTO

1
F4N 2 (z) = N (1 + z)2N z N 1 PN 1
4

1 z + z 1

2
4

E la 1) dimostrata.
La 2) discende dalla denizione di F , dalla 1) e dalla 2) del Teorema 24.5.2.
Inne, ancora dalla denizione di F e dal Teorema 24.5.2 segue che, se z
un suo zero, allora anche z 1 un suo zero, mentre, dal fatto che sia un
polinomio a coecienti reali, segue che anche z un suo zero.

Il seguente teorema illustra il fatto che , se |z| = 1, F2N 1 (z) sempre il


modulo del quadrato di un polinomio.
Teorema 24.5.4. Esiste un polinomio CN 1 di grado N 1, a coefficienti
reali, tale che, se |z| = 1,
F2N 1 (z) =| (z + 1)N CN 1 (z) |2 .

(24.8)

Dimostrazione. Ricordiamo che, per |z| = 1, F2N 1 (z) 0. Separiamo gli zeri
reali di F4N 2 , diversi da 1, da quelli complessi non reali, e indichiamo con
ZR e ZC rispettivamente, linsieme degli zeri reali interni al cerchio unitario
e linsieme degli zeri complessi, interni al cerchio unitario, che giacciono nel
semipiano superiore. Per la fattorizzazione del polinomio otteniamo
F2N 1 (z) =| F2N 1 (z) |=| z 2N +1 F4N 2 (z) |=| F4N 2 (z) |


Y
(z z0 )(z z 1 )
= c(z + 1)2N
0
z0 ZR

Y

(z w0 )(z w 1 )(z w0 )(z w0 1 )

0
w0 ZC

Y

Y
|w0 |1 |z w0 |2 |w0 |1 |z w0 |2 ,
|z0 |1 |z z0 |2
= c(z + 1)2N
z0 ZR

w0 ZC



dove si utilizzata luguaglianza, valida per |z| = 1, (z r0 )(z r01 ) =
|r0 |1 |z r0 |2 . Quindi basta prendere
Y
Y
|w0 |1 (z w0 )(z w0 ).
|z0 |1/2 (z z0 )
CN 1 (z) = |c|1/2
z0 ZR

w0 ZC

24.5. FATTORIZZAZIONE SPETTRALE

1315

Esempio 24.5.5. In questo esempio vediamo come possibile ricavare L alla


luce delle informazioni su F2N 1 . Supponiamo che N = 2. Ricapitolando
m0 () =

1 + e2i
2

N

L(),

dove, per il teorema precedente,


|L()|2 = PN 1 (sin2 ()) = (1 sin2 ())N P2N 1 (sin2 ())
= (1 sin2 ())N F2N 1 (e2i )
N
2i
2
1 e2i + e2i
(e
+ 1)N CN 1 (e2i )
+
=
2
4

N
2

2 + e2i + e2i
=
[(e2i + 1)(e2i + 1)]N CN 1 (e2i )
4

2
= 4N CN 1 (e2i ) .


Quindi basta prendere

L() = 2N CN 1 (e2i ),

oppure L() = 2N CN 1 (e2i ) = 2N CN 1 (e2i ).

Per calcolare CN 1 abbiamo bisogno di trovare gli zeri di F4N 2 (z). Utilizzando lEsempio 24.5.1 e sapendo che F4N 2 (z) ha in z = 1 uno zero di
ordine 2N = 4, si ha
F4N 2 (z) = F6 (z) = z 3 F3 (z)
1
= z 3 [16 + 9z + 9z 1 z 3 z 3 ]
32
1
=
[16z 3 + 9z 4 + 9z 2 z 6 1]
32
1
(z + 1)4 (z 2 + 4z 1)
=
32

1
= (z + 1)4 (z (2 3))(z (2 + 3)),
32

1316

CAPITOLO 24. ONDICELLE A SUPPORTO COMPATTO

3, giace allinterno del cerchio unitario. allora


1/2

3)
(2

(e2i (2 3))
C1 (e2i ) =
4 2

3 + 1 2i
=
(e
(2 3)),
8
1/2

perch 2(2 3) = 3 1. Finalmente, si ricava il ltro



2

1 + e2i
3 + 1 2i
m0 () = 4
(e
(2 3))
2
8



2
1 + e2i
3 + 1 2i 1 3
=
(
e
+
),
2
2
2
dove solo 2

che corrisponde alla scelta fatta in (24.6).

Bibliografia
[1] T.M. Apostol, Mathematical Analysis, 2nd ed., Addison-Wesley, Reading, Mass., 1974.
(document), 1.6.1, 1.22, 1.22.4, 2, 2.12,
11.7
[2] E. O. Brigham The Fast Fourier Transform, Prentice-Hall, Englewood
Clis, 1974. 15
[3] W. L. Briggs, V. E. Henson, The DFT: An Owners manual for the
Discrete Fourier Transform, SIAM, Philadelphia, 1995. 13.6.3, 15.6, 16,
16.1.6, 16.2.7
[4] A. P. Caldern, A. Zygmund, Contributions to Fourier Analysis, Annals
of Mathematics Studies 25, Princeton Univ. Press, Princeton, N.J., 1950
7.9
[5] S. Campanato, Lezioni di Analisi Matematica, vol. 2, Giordano
Pellegrini editore, Pisa, 1966. (document), 1.1, 1.22, 1.22.1, 1.22.3
[6] L. Carleson, On convergence and growth of partial sums of Fourier
series, Acta Math. 116 (1966), 135157.
[7] J.W. Cooley, J.W. Tukey, An algorithm for the machine calculation of
complex Fourier series, Math. Comput. 19 (1965), 297301. 15.1, 15.4
[8] P. Cherno, Pointwise convergence of Fourier series, Amer. Math. Monthly 80 (1980), 399400. 7.2
[9] I. Daubechies, Orthonormal bases of compactly supported wavelets,
Comm. Pure and Applied Math., XLI (1988), 909996. 24.4
[10] P. De Mottoni, Complementi di Matematica, voll. 1 e 2, Aracne, Roma,
1992. (document), 2.12, 2.12.6, 2.14, 2.14.3, 2.14.21, 13.6.3, 19, 20
1317

1318

BIBLIOGRAFIA

[11] H. Dym, H.P. McKean, Fourier Series and Integrals, Academic Press,
New York, 1972. 8.6, 9.9
[12] A. Fig-Talamanca, E. Rogora, Serie di Fourier e di FourierWalsh,
Universit di Roma La Sapienza, 2005. (document)
[13] H. Helson, Harmonic Analysis, Addison-Wesley, Boston, 1983 (reprinted
by Wadsworth & Brooks/Cole, 1991) 7.7.4, 7.9
[14] Y. Katznelson, An Introduction to Harmonic Analysis, Wiley, New
YorkLondra, 1968. (document), 6.2.3, 7, 7.6.32, 7.7.4
[15] J.L. Kelley, General Topology, University Series in Higher Mathematics, Van Nostrand, New York, 1955 ristampato in Graduate Texts in
Mathematics 23, Springer-Verlag, BerlinNew York, 1975 3.4
[16] V.A. Kotelnikov, On the carrying capacity of the ether and wire in telecommunications, Material for the First All-Union Conference on Questions of Communication, Izd. Red. Upr. Svyazi RKKA, Moscow, 1933
(tradotto in inglese e commentato da C.C. Bissel e V.E. Katsnelson).
10.4
[17] D.G. Manolakis, V.K. Ingle, S.M. Kogon, Statistic and Adaptive Signal
Processing Artech House, Boston/London, 2005. 20
[18] S.M. Nikolsky, Corso di Analisi Matematica, vol.2, MIR, Mosca, 1975
(traduzione italiana 1981). (document), 1
[19] M. A. Picardello, L. Zsdo, Appunti di Algebra Lineare, Universit di
Roma Tor Vergata, 2006. (document), 1.1, 1.1, 1.2.5, 1.2, 1.9, 1.9.5,
4.1, 4.4.3, 5.11.5, 5.11, 5.12, 9.1.6, 9.6, 11.17.1
[20] R. Redheer, Convergence of Fourier series at a discontinuity, Siam J.
Math. Anal. 15 (1984), 10071009.
[21] M. Reed, B. Simon, Functional Analysis, vol. I, Academic Press, New
York, 1980. 1
[22] H.L. Royden, Real Analysis, 3rd ed., Macmillan, New York, 1988.
(document), 1, 1.9.1, 1.9.1, 1.9.10, 1.9.1, 1.9.1, 1.16, 1.24, 1.25.3, 1.30,
1.31, 3, 3.12.3, 3.12.4, 12.4, 14.4.4

BIBLIOGRAFIA

1319

[23] W. Rudin, Real and Complex Analysis, McGrawHill, New York, 1966.
(document), 1.9.1, 1.20, 1.28.1, 2, 2.2, 2.14, 2.14.3, 3.4, 18.6, 18.6
[24] W. Rudin, Fourier Analysis on Groups, Interscience, New York, 1967.
14.4.4
[25] W. Rudin, Functional Analysis, 2nd ed., McGrawHill, New York, 1991.
1.19.9, 3, 3.2.2, 3.2.9, 3.11.6, 3.17.3, 9.4.2, 11.5, 11.10, 11.17, 11.17.3,
18.6
[26] L. Schwartz, Transformation de Laplace de distributions, Sem. Math.
Univ. Lund, volume supplementare dedicato a M. Riesz (1952), 196206.
18.5.4
[27] C.E Shannon, A Mathematical Theory of Communication, Bell System
Techn. Journ. 1, (1948), 379423 e 623656. 10.4
[28] C.E Shannon, Communication in the presence of noise, Proc. Institute of Radio Engineers, 37, no.1, 10-21 (1949) (ristampato in
Proc.IEEE 86, n.2 (1998)). 10.4
[29] J.S. Soo, K.K. Pang, Multidelay block frequency adaptive filter, IEEE
Trans. Acoust. Speech Signal Process (ASSP) 38, (1990). 17.2
[30] E.M. Stein, G. Weiss, Introduction to Fourier Analysis on Euclidean
Spaces, Princeton Mathematica Series 32, Princeton University Press,
Princeton, 1971
[31] T.G. Stockham Jr., High-speed convolution and correlation, AFIPS
Proc., 1966 Spring Joint Computer Conference, 28, 229233, Spartan
Books, 1966. 17.2
[32] G. Strang, T. Nguyen, Wavelets and Filter Banks, Wellesley/Cambridge
Press, Wellesley, 1996. 23.1
[33] R. Vch, Z Transform, Theory and Applications, Mathematics and Its
Applications Reidel Publishing Company/Kluwer, Dordrecht, 1987. 19,
20
[34] D. Walnut, An Introduction to Wavelet Analysis, Birkhauser, Basel,
2001. 21

1320

BIBLIOGRAFIA

[35] H. Weyl, The Theory of Groups and Quantum Mechanics, Dutton, New
York, 1931, ristampato da Dover, New York, 1950. 9.9
[36] E.T. Whittaker, On the Functions Which are Represented by the Expansions of the Interpolation Theory, Proc. Royal Soc. Edinburgh, Sec. A,
35 (1915), 181194. 10.4
[37] J.M. Whittaker, Interpolatory Function Theory, Cambridge Tracts in
Mathematics and Math. Physics 33, Cambridge University Press, Cambridge, England, and Macmillan, New York, 1935 (recensione: E. Hille,
Bull. Amer. Math. Soc. 42, n.5 (1936), 305306). 10.4
[38] A.H. Zemanian, Distribution Theory and Transform Analysis, International Series in Pure and Applied Math., McGrawHill, New York, 1965.
11.17, 18.5, 18.5.4, 18.5.1
[39] A. Zygmund, Trigonometric Series, 2nd ed., Cambridge University
Press, Cambridge, 1959 (revisione 1968). 7, 7.5, 7.6.19

Potrebbero piacerti anche