Sei sulla pagina 1di 448

Appunti di

Analisi Matematica Uno

Emanuele Paolini

27 maggio 2021

manu-fatto
This work is licensed under a Creative Commons “Attribution-NonCommercial-
ShareAlike 4.0 International” license.
Introduzione

Queste note sono nate come appunti per il corso di Analisi Matematica del
corso di studi in Fisica dell’Università di Pisa negli anni accademici 2017/18,
2018/19, 2019/20 e 2020/21.

Le note (come il corso a cui fanno riferimento) riguardano l’analisi delle


funzioni di una variabile reale. Gli argomenti trattati sono serie e successioni
numeriche, il calcolo differenziale e il calcolo integrale. Viene anche introdotta
la convergenza uniforme allo scopo di considerare, come ultimo argomento, lo
studio delle equazioni differenziali ordinarie. Da subito vengono introdotti i
numeri complessi che vengono utilizzati laddove possono aiutare a dare una
visione più unitaria e concettualmente più semplice degli argomenti trattati (in
particolare nello studio delle serie di potenze, nella definizione delle funzioni
trigonometriche, nella risoluzione delle equazioni differenziali lineari).

Le note sono estensive, non c’è alcun tentativo di concisione. L’obiettivo è quello
di raccogliere tutti quei risultati che non sempre è possibile esporre in maniera
dettagliata e rigorosa a lezione. Troveremo, ad esempio, definizioni equivalenti
della funzione esponenziale e una definizione analitica (tramite serie di potenze)
delle funzioni trigonometriche (e di 𝜋). Proponiamo la dimostrazione del
teorema fondamentale dell’algebra, della formula di Stirling e di Wallis, e
dell’irrazionalità di 𝑒 e di 𝜋. Viene proposta una definizione formale dei
simboli di Landau 𝑜 -piccolo e 𝑂 -grande con i relativi teoremi per trattare queste
espressioni. Lo stesso viene fatto per il simbolo di integrale indefinito. Vengono
trattati quei risultati algebrici che permettono di giustificare gli algoritmi per
il calcolo delle primitive delle funzioni razionali e per risolvere le equazioni
differenziali lineari con il metodo di similarità.

I risultati più importanti sono marcati con degli asterischi sul margine della
pagina: *** molto importante, ** importante, * rilevante. Il lettore è invitato
a non perdere tempo sui risultati più marginali se i risultati importanti non
sono del tutto chiari. Le figure non sono frequenti ma a margine di molte
di esse è presente un QR-code (un quadrato formato da una nuvola di pixel)
che permette di accedere alla figura online e modicarne i parametri. Nella
versione PDF il QR-code è cliccabile. Nella versione cartacea si può usare la
fotocamera del proprio smartphone per scansionare il codice e visitare la pagina
corrispondente. In alternativa si può visitare la pagina https://paolini.
github.io/AnalisiUno/ dove sono inseriti tutti i collegamenti alle figure
interattive. Queste note sono rese disponibili liberamente sia in formato PDF
che in forma di sorgente LATEX. Un modo per sostenere questo progetto e
mantenerlo disponibile liberamente per tutti, è quello di acquistarne una copia
cartacea.

Il materiale è costantemente in evoluzione e certamente contiene errori e


incoerenze. Ogni suggerimento o commento è benvenuto!
contributi

Ringrazio: Valerio Amico, Rico Bellani, Fabio Bensch, Jacopo Bernardini, Elia
Bonistalli, Antonino Calderone, Davide Campanella Galanti, Alessandro Can-
zonieri, Giulio Carlo, Luca Casagrande, Alessandro Casini, Giulio Cianti, Luca
Ciceri, Tommaso Ceccotti, Giorgio Ciocca, Luca Ciucci, Francesco Debortoli,
Martino Dimartino, Igor Di Tota, Irene Iorio, Marco Labella, Davide Labroscia-
no, Viviana Lippolis, Luigina Mazzone, Roberto Menta, Michele Monti, Elena
Morano, Aurora Mugnai, Marco Nuti, Ruben Pariente, Daniele Pavarini, Gu-
glielmo Pellitteri, Paolo Pennoni, Davide Perrone, Lorenzo Pierfederici, Mattia
Ripepe, Francesco Rodriguez, Gabriele Scarci, Maria Antonella Secondo, Irene
Silvestro, Alessio Squilloni, Antonio Tagliente, Francesco Enrico Teofilo, Laura
Toni, Giacomo Trupiano, Bianca Turini, Francesco Vaselli, Antoine Venturini,
Matteo Vilucchio, Piero Viscone che hanno segnalato errori e correzioni.
Ringrazio i colleghi Vincenzo Tortorelli e Pietro Majer che mi hanno dato molti
suggerimenti preziosi.

pronuncia delle lettere straniere

inglesi:

𝐽 𝑗 gei (i lunga)
𝐾 𝑘 cappa (key)
𝑊 𝑤 vu doppia
𝑋 𝑥 ics
𝑌 𝑦 ipsilon (i greca)

greche:

𝐴 𝛼 alfa 𝐼 𝜄 iota 𝑃 𝜌 ro
𝐵 𝛽 beta 𝐾 𝜅 kappa† Σ 𝜎 sigma
Γ 𝛾 gamma Λ 𝜆 lambda 𝑇 𝜏 tau
Δ 𝛿 delta 𝑀 𝜇 mi (mu) 𝑌 𝜐 ipsilon§
𝐸 𝜀 epsilon 𝑁 𝜈 ni (nu) Φ 𝜑 fi
𝑍 𝜁 zeta∗ Ξ 𝜉 csi 𝑋 𝜒 chi
𝐻 𝜂 eta 𝑂 𝑜 omicron Ψ 𝜓 psi
Θ 𝜃 teta Π 𝜋 pi‡ Ω 𝜔 omega

ebraiche:

ℵ alef

∗ pronunciato usualmente con la 𝑧 dolce per distinguerlo dalla 𝑧 .


† in inglese si distingue la pronuncia tra 𝑘 key e 𝜅 kappa.
‡ in italiano pi greco in inglese pai, per distinguere da 𝑝 .
§ si pronuncia upsilon per distinguerla da 𝑦 .
Indice

Indice v

1 fondamenti 1
1.1 proposizioni e predicati . . . . . . . . . . . . . . . . . . . . . . . 1
1.2 teoria degli insiemi . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.3 relazioni . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
1.4 funzioni . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
1.5 cardinalità . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
1.6 i numeri naturali . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
1.7 insiemi prodotto . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
1.8 la retta dei numeri reali . . . . . . . . . . . . . . . . . . . . . . . 20
1.9 i numeri naturali e interi . . . . . . . . . . . . . . . . . . . . . . 22
1.10 polinomi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
1.11 coefficienti binomiali . . . . . . . . . . . . . . . . . . . . . . . . 31
1.12 cardinalità finite . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
1.13 estremo superiore . . . . . . . . . . . . . . . . . . . . . . . . . . 35
1.14 l’insieme dei numeri razionali . . . . . . . . . . . . . . . . . . . 37
1.15 valore assoluto . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
1.16 numeri decimali . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
1.17 isomorfismi di gruppi ordinati . . . . . . . . . . . . . . . . . . . 41
1.18 funzione esponenziale e potenza . . . . . . . . . . . . . . . . . . 46
1.19 radice 𝑛 -esima . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48
1.20 logaritmo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50
1.21 cardinalità infinite . . . . . . . . . . . . . . . . . . . . . . . . . . 50
1.22 punti all’infinito . . . . . . . . . . . . . . . . . . . . . . . . . . . 52
1.23 intervalli . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53
1.24 andamento del grafico di una funzione . . . . . . . . . . . . . . 53
1.25 funzioni lineari . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
1.26 funzioni quadratiche . . . . . . . . . . . . . . . . . . . . . . . . 56
1.27 equazioni e disequazioni . . . . . . . . . . . . . . . . . . . . . . 58
1.28 i numeri complessi . . . . . . . . . . . . . . . . . . . . . . . . . . 60

2 funzioni continue, limiti e successioni 67


2.1 funzioni continue . . . . . . . . . . . . . . . . . . . . . . . . . . 67
2.2 limite di funzione . . . . . . . . . . . . . . . . . . . . . . . . . . 72
2.3 proprietà frequenti e definitive . . . . . . . . . . . . . . . . . . . 82
2.4 criteri di confronto . . . . . . . . . . . . . . . . . . . . . . . . . . 83
2.5 successioni . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85
2.6 limite di successione . . . . . . . . . . . . . . . . . . . . . . . . . 85
2.7 successioni limitate . . . . . . . . . . . . . . . . . . . . . . . . . 86
2.8 successioni monotòne . . . . . . . . . . . . . . . . . . . . . . . . 88
2.9 la costante di Nepero . . . . . . . . . . . . . . . . . . . . . . . . 89
2.10 criteri del rapporto e della radice . . . . . . . . . . . . . . . . . . 95
2.11 ordini di infinito, equivalenza asintotica . . . . . . . . . . . . . . 96
2.12 successioni estratte . . . . . . . . . . . . . . . . . . . . . . . . . . 99
2.13 punti limite . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101
2.14 il teorema degli zeri . . . . . . . . . . . . . . . . . . . . . . . . . 107
2.15 il teorema di Weierstrass . . . . . . . . . . . . . . . . . . . . . . 109
2.16 successioni ricorsive . . . . . . . . . . . . . . . . . . . . . . . . . 110

3 serie 111
3.1 serie telescopiche . . . . . . . . . . . . . . . . . . . . . . . . . . 115
3.2 serie a termini positivi . . . . . . . . . . . . . . . . . . . . . . . . 116
associatività della somma di una serie . . . . . . . . . . . . . . . 119
la serie armonica . . . . . . . . . . . . . . . . . . . . . . . . . . . 120
3.3 rappresentazione posizionale dei numeri reali . . . . . . . . . . 122
3.4 convergenza assoluta . . . . . . . . . . . . . . . . . . . . . . . . 124
3.5 serie a segno variabile . . . . . . . . . . . . . . . . . . . . . . . . 126
3.6 somme multiple . . . . . . . . . . . . . . . . . . . . . . . . . . . 128
3.7 somma per parti . . . . . . . . . . . . . . . . . . . . . . . . . . . 130
3.8 prodotti infiniti . . . . . . . . . . . . . . . . . . . . . . . . . . . . 132
3.9 le serie di potenze . . . . . . . . . . . . . . . . . . . . . . . . . . 133
3.10 la serie esponenziale . . . . . . . . . . . . . . . . . . . . . . . . . 139
3.11 le funzioni trigonometriche . . . . . . . . . . . . . . . . . . . . . 145
3.12 funzioni trigonometriche inverse . . . . . . . . . . . . . . . . . . 150
3.13 funzioni iperboliche . . . . . . . . . . . . . . . . . . . . . . . . . 152
3.14 esercizi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 154

4 i numeri complessi 155


4.1 rappresentazione polare dei numeri complessi . . . . . . . . . . 155
4.2 interpretazione geometrica . . . . . . . . . . . . . . . . . . . . . 156
4.3 radici complesse 𝑛 -esime . . . . . . . . . . . . . . . . . . . . . . 160
4.4 ancora polinomi . . . . . . . . . . . . . . . . . . . . . . . . . . . 161
4.5 il teorema fondamentale dell’algebra . . . . . . . . . . . . . . . 164
4.6 fattorizzazione dei polinomi . . . . . . . . . . . . . . . . . . . . 168

5 calcolo differenziale 173


5.1 derivata . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 173
5.2 derivate parziali . . . . . . . . . . . . . . . . . . . . . . . . . . . 181
5.3 punti notevoli . . . . . . . . . . . . . . . . . . . . . . . . . . . . 181
5.4 criteri di monotonia . . . . . . . . . . . . . . . . . . . . . . . . . 183
5.5 convessità . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 191
5.6 teoremi di Cauchy e de l’Hospital . . . . . . . . . . . . . . . . . 199
5.7 classi di regolarità . . . . . . . . . . . . . . . . . . . . . . . . . . 202
5.8 formula di Taylor . . . . . . . . . . . . . . . . . . . . . . . . . . 206
5.9 operazioni con i simboli di Landau . . . . . . . . . . . . . . . . 214
5.10 funzioni analitiche . . . . . . . . . . . . . . . . . . . . . . . . . . 219
5.11 derivata complessa . . . . . . . . . . . . . . . . . . . . . . . . . 229

6 calcolo integrale 231


6.1 misura di Peano-Jordan . . . . . . . . . . . . . . . . . . . . . . . 231
6.2 integrale di Riemann . . . . . . . . . . . . . . . . . . . . . . . . 237
6.3 teorema fondamentale del calcolo integrale . . . . . . . . . . . . 250
6.4 calcolo delle primitive . . . . . . . . . . . . . . . . . . . . . . . . 254
6.5 integrale di una funzione razionale . . . . . . . . . . . . . . . . 260
6.6 integrali che si riconducono a funzioni razionali . . . . . . . . . 267
6.7 funzioni speciali . . . . . . . . . . . . . . . . . . . . . . . . . . . 271
6.8 integrali impropri . . . . . . . . . . . . . . . . . . . . . . . . . . 271
6.9 studio di funzioni integrali . . . . . . . . . . . . . . . . . . . . . 284
6.10 alcune applicazioni del calcolo integrale . . . . . . . . . . . . . 288

7 spazi di funzioni 295


7.1 spazi metrici e topologia . . . . . . . . . . . . . . . . . . . . . . 300
7.2 completezza . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 304
7.3 convergenza uniforme . . . . . . . . . . . . . . . . . . . . . . . . 309
7.4 passaggio al limite sotto il segno di integrale . . . . . . . . . . . 312
7.5 scambio della derivata con il limite . . . . . . . . . . . . . . . . 321
serie di funzioni . . . . . . . . . . . . . . . . . . . . . . . . . . . 323
7.6 convergenza integrale . . . . . . . . . . . . . . . . . . . . . . . . 327
serie di Fourier . . . . . . . . . . . . . . . . . . . . . . . . . . . . 329
7.7 divagazione sui frattali autosimili . . . . . . . . . . . . . . . . . 340

8 successioni ricorsive 345


8.1 equazioni ricorsive autonome del primo ordine . . . . . . . . . 346
8.2 approfondimenti . . . . . . . . . . . . . . . . . . . . . . . . . . . 362
8.3 equazioni ricorsive lineari . . . . . . . . . . . . . . . . . . . . . . 363
8.4 dinamica complessa . . . . . . . . . . . . . . . . . . . . . . . . . 368

9 equazioni differenziali 371


9.1 classificazione . . . . . . . . . . . . . . . . . . . . . . . . . . . . 371
equazioni lineari . . . . . . . . . . . . . . . . . . . . . . . . . . . 374
problema di Cauchy . . . . . . . . . . . . . . . . . . . . . . . . . 375
9.2 metodi risolutivi . . . . . . . . . . . . . . . . . . . . . . . . . . . 376
equazioni lineari del primo ordine . . . . . . . . . . . . . . . . . 376
equazioni a variabili separabili . . . . . . . . . . . . . . . . . . . 380
altri metodi risolutivi . . . . . . . . . . . . . . . . . . . . . . . . 384
9.3 funzioni vettoriali e di più variabili . . . . . . . . . . . . . . . . 389
9.4 il problema di Cauchy . . . . . . . . . . . . . . . . . . . . . . . . 391
9.5 il problema di Cauchy per equazioni di ordine 𝑛 . . . . . . . . . 398
9.6 equazioni lineari di ordine 𝑛 . . . . . . . . . . . . . . . . . . . . 400
9.7 equazioni lineari di ordine 𝑛 a coefficienti costanti . . . . . . . . 402
9.8 sistemi lineari . . . . . . . . . . . . . . . . . . . . . . . . . . . . 412
sistemi 2 × 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 413
matrice esponenziale . . . . . . . . . . . . . . . . . . . . . . . . 417
9.9 studio qualitativo delle soluzioni . . . . . . . . . . . . . . . . . . 420
monotonia e punti critici delle soluzioni . . . . . . . . . . . . . . 422
teoremi di confronto . . . . . . . . . . . . . . . . . . . . . . . . . 424

A Listati 425
A.1 bisection.py . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 425
A.2 series.py . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 426
A.3 compute_e.py . . . . . . . . . . . . . . . . . . . . . . . . . . . . 426
A.4 compute_pi.py . . . . . . . . . . . . . . . . . . . . . . . . . . . . 426
A.5 Mandelbrot.py . . . . . . . . . . . . . . . . . . . . . . . . . . . . 427
A.6 Koch.py . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 428
A.7 Fourier.py . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 429

Indice analitico 433


fondamenti 1
1.1 proposizioni e predicati

Se, come diceva Galileo, la matematica è il linguaggio della scienza, è importante


che la matematica sia essa stessa espressa in un linguaggio che risulti essere
il più possibile oggettivo e non ambiguo. La logica è la disciplina matematica
che si occupa dello studio e della formalizzazione del linguaggio matematico.
In questo capitolo riassumiamo in maniera breve ed intuitiva alcuni concetti
che probabilmente sono noti e contemporaneamente fissiamo le notazioni che
verranno utilizzate nel seguito.

Una proposizione è una frase (formalmente diremmo formula) che assume un proposizione
valore di verità ben definito: vero oppure falso. Un esempio di proposizione
(falsa) è “2+2=5”.

E’ possibile combinare più proposizioni mediante gli operatori logici. Se 𝑃 e 𝑄


sono proposizioni si può costruire la proposizione 𝑃 ∧ 𝑄 chiamata congiunzione
logica. Tale proposizione si può leggere “𝑃 e 𝑄 ” ed è una proposizione che congiunzione
risulta essere vera solamente nel caso in cui sia 𝑃 che 𝑄 siano vere. Spesso la
congiunzione logica è sottointesa: se si fa un elenco di proposizioni 𝑃, 𝑄, 𝑅 si
intende usualmente la loro congiunzione 𝑃 ∧ 𝑄 ∧ 𝑅 cioè si intende che devono
essere tutte vere. La disgiunzione logica denotata con 𝑃 ∨ 𝑄 si può leggere “𝑃 disgiunzione
o 𝑄 ” ed è una proposizione che è vera se almeno una tra 𝑃 e 𝑄 è vera. La
negazione logica denotata con ¬𝑃 è una proposizione che si può leggere “non 𝑃 ” negazione
che è vera quando 𝑃 è falsa ed è falsa quando 𝑃 è vera.

Operatori logici molto utilizzati sono le implicazioni. La proposizione 𝑃 ⇒ 𝑄 si implicazioni


può leggere “𝑃 implica 𝑄 ” e significa che 𝑄 è vera se 𝑃 è vera. Non si confonda
il valore di verità di 𝑃 ⇒ 𝑄 con il valore di verità di 𝑄 . Se 𝑃 è vera allora
𝑃 ⇒ 𝑄 è vera o falsa a seconda che 𝑄 sia vera o falsa. Ma se 𝑃 è falsa allora
l’implicazione 𝑃 ⇒ 𝑄 è vera indipendentemente dal valore di 𝑄 . In effetti
𝑃 ⇒ 𝑄 è equivalente a 𝑄 ∨ ¬𝑃 perché per la verità di 𝑃 ⇒ 𝑄 basta che 𝑄 sia
vera (quando 𝑃 è vera) oppure che 𝑃 sia falsa.

La freccia inversa 𝑃 ⇐ 𝑄 si può utilizzare per invertire l’implicazione: è


equivalente a 𝑄 ⇒ 𝑃 . Se valgono entrambe le implicazioni (𝑃 ⇐ 𝑄) ∧ (𝑃 ⇒ 𝑄)
è facile convincersi che 𝑃 e 𝑄 devono avere lo stesso valore di verità: diremo
quindi che sono equivalenti e scriveremo 𝑃 ⇔ 𝑄 .

Nella tabella 1.1 sono riportati tutti i valori di verità che si possono ottenere
combinando tra loro due proposizioni. Nella tabella 1.2 sono riportate alcune
proprietà di tali operatori: queste proprietà possono essere capite interpretando
il loro significato ma possono anche essere dedotte meccanicamente tramite la
tabella di verità delle operazioni.
predicato
Un predicato è una proposizione che contiene una o più variabili, il cui valore di
verità, quindi, può dipendere dal valore assegnato alle variabili. Un esempio di
predicato è 𝑥 + 2 = 5 che risulta essere vero se 𝑥 = 3 e falso altrimenti.
2 1 fondamenti

Tabella 1.1: La tabella di verità degli 𝑃 𝑄 ¬𝑃 𝑃∧𝑄 𝑃∨𝑄 𝑃⇒𝑄 𝑃⇐𝑄 𝑃⇔𝑄
operatori logici.
V V F V V V V V
V F F F V F V F
F V V F V V F F
F F V F F V V V

Tabella 1.2: Alcune proprietà degli ope- ¬¬𝑃 ⇐⇒ 𝑃 doppia negazione


ratori logici.
𝑃∧𝑄 ⇐⇒ 𝑄∧𝑃 simmetria
𝑃∨𝑄 ⇐⇒ 𝑄∨𝑃
¬(𝑃 ∧ 𝑄) ⇐⇒ (¬𝑃) ∨ (¬𝑄) formule di De Morgan
¬(𝑃 ∨ 𝑄) ⇐⇒ (¬𝑃) ∧ (¬𝑄)
(𝑃 ∧ 𝑄) ∨ 𝑅 ⇐⇒ (𝑃 ∨ 𝑅) ∧ (𝑄 ∨ 𝑅) proprietà distributiva
(𝑃 ∨ 𝑄) ∧ 𝑅 ⇐⇒ (𝑃 ∧ 𝑅) ∨ (𝑄 ∧ 𝑅)
(𝑃 ⇒ 𝑄) ⇐⇒ (𝑄 ⇐ 𝑃) antisimmetria
¬(𝑃 ⇒ 𝑄) ⇐⇒ 𝑃 ∧ (¬𝑄) controesempio
(𝑃 ⇒ 𝑄) ⇐⇒ ¬(𝑃 ∧ (¬𝑄)) dimostrazione per assurdo
(𝑃 ⇒ 𝑄) ⇐⇒ (¬𝑄 ⇒ ¬𝑃) implicazione contropositiva

Se un predicato dipende da una o più variabili queste si chiamano variabili


variabili libere
libere. E’ possibile chiudere una variabile libera mediante un quantificatore. Il
quantificatore universale denotato col simbolo ∀ serve ad affermare che il predicato
quantificatore universale è vero per ogni possibile valore della variabile quantificata. Ad esempio la
proposizione ∀𝑥 : 𝑥 + 2 = 5 significa: “per ogni 𝑥 si ha 𝑥 + 2 = 5” ed è una
proposizione falsa. Il quantificatore ∀𝑥 rende muta la variabile 𝑥 del predicato
𝑥 + 2 = 5 nel senso che la proposizione non dipende più dal valore di quella
variabile, che non è più una variabile libera.

quantificatore esistenziale Il quantificatore esistenziale denotato col simbolo ∃ serve ad affermare che il
predicato è vero per almeno un valore della variabile quantificata. Ad esempio
la proposizione ∃𝑥 : 𝑥 + 2 = 5 significa: “esiste almeno un 𝑥 per cui risulta
𝑥 + 2 = 5”. Quello che si ottiene è una proposizione in cui la variabile 𝑥 è muta.
In questo caso la proposizione è vera in quanto per 𝑥 = 3 il predicato è vero.

Un predicato può dipendere da più variabili ed è quindi possibile inserire più


quantificatori. In tal caso l’ordine dei quantificatori può essere rilevante. Delle
seguenti proposizioni la prima è vera, la seconda invece è falsa:

∀𝑥 : ∃𝑦 : 𝑥 + 2 = 𝑦
∃𝑦 : ∀𝑥 : 𝑥 + 2 = 𝑦.

Alcune proprietà dei quantificatori logici sono riportate nella tabella 1.3.

Tabella 1.3: Alcune proprietà dei quanti- ¬∀𝑥 : 𝑃(𝑥) ⇐⇒ ∃𝑥 : ¬𝑃(𝑥)


ficatori logici ( 𝑐 è una qualunque costan-
te)
¬∃𝑥 : 𝑃(𝑥) ⇐⇒ ∀𝑥 : ¬𝑃(𝑥)
∀𝑥 : 𝑃(𝑥) =⇒ 𝑃(𝑐)
∃𝑥 : 𝑃(𝑥) ⇐= 𝑃(𝑐)
𝑃 ∧ ∀𝑥 : 𝑄(𝑥) ⇐⇒ ∀𝑥 : 𝑃 ∧ 𝑄(𝑥)
𝑃 ∧ ∃𝑥 : 𝑄(𝑥) ⇐⇒ ∃𝑥 : 𝑃 ∧ 𝑄(𝑥)
1.2 teoria degli insiemi 3

Spesso il quantificatore universale viene sottointeso ad esempio con 𝑥 + 𝑦 = 𝑥 + 𝑦


se non indicato diversamente si intende che tutte le variabili libere sono
quantificate tramite quantificatore universale: ∀𝑥 : ∀𝑦 : 𝑥 + 𝑦 = 𝑦 + 𝑥 . Inoltre
il segno di interpunzione : può essere omesso ∀𝑥∀𝑦 𝑥 + 𝑦 = 𝑦 + 𝑥 oppure
una quantificazione può essere fatta contemporaneamente su più variabili
∀𝑥, 𝑦 : 𝑥 + 𝑦 = 𝑦 + 𝑥 . A volte, se non crea ambiguità, si potranno scrivere i
quantificatori anche a fine frase 𝑥 + 𝑦 = 𝑦 + 𝑥, ∀𝑥∀𝑦 .

1.2 teoria degli insiemi

Nei paragrafi precedenti abbiamo visto che i predicati possono essere combinati
tra loro e quantificati. Ma quali sono i predicati elementari che possiamo
considerare? La teoria degli insiemi ci fornisce la formalizzazione del concetto
di appartenenza: il predicato di base (l’unico che ci servirà) è un predicato della
forma 𝑥 ∈ 𝐴 che significa “l’oggetto 𝑥 è un elemento dell’insieme 𝐴”. La
teoria degli insiemi non spiega (né tantomento definisce) cosa siano gli oggetti
e cosa siano gli insiemi perché questi sono concetti primitivi (come lo sono i
punti e le rette per la geometria euclidea). La teoria degli insiemi ci fornisce,
semplicemente, le regole formali che possono essere utilizzate per trattare i
predicati della forma 𝑥 ∈ 𝐴. Ad esempio un assioma della teoria degli insiemi è
il seguente:
∃𝐴 : ¬∃𝑥 : 𝑥 ∈ 𝐴
che significa: “esiste un insieme 𝐴 che non contiene alcun elemento 𝑥 ” ovvero insieme vuoto
stiamo dicendo che esiste l’insieme vuoto che normalmente viene denotato con
il simbolo ∅. Altri opportuni assiomi della teoria degli insiemi garantiscono
l’esistenza dell’unione 𝐴 ∪ 𝐵, intersezione 𝐴 ∩ 𝐵 e differenza 𝐴 \ 𝐵 di due
insiemi qualunque 𝐴 e 𝐵. Tali operazioni tra insiemi possono essere ricondotte
alla relazione di appartenenza e possono quindi essere definite come segue:

𝑥 ∈ 𝐴 ∪ 𝐵 ⇐⇒ (𝑥 ∈ 𝐴) ∨ (𝑥 ∈ 𝐵)
𝑥 ∈ 𝐴 ∩ 𝐵 ⇐⇒ (𝑥 ∈ 𝐴) ∧ (𝑥 ∈ 𝐵)
𝑥 ∈ 𝐴 \ 𝐵 ⇐⇒ (𝑥 ∈ 𝐴) ∧ ¬(𝑥 ∈ 𝐵).

La negazione dell’appartenenza ¬(𝑥 ∈ 𝐴) viene usualmente abbreviata con


𝑥 ∉ 𝐴.

Sempre utilizzando la semplice relazione di appartenenza possiamo definire


le relazioni di inclusione e uguaglianza tra insiemi: 𝐴 ⊆ 𝐵 si legge “𝐴 è un
sottoinsieme di 𝐵” e 𝐴 = 𝐵 si legge “𝐴 è uguale a 𝐵”. Queste relazioni sono
definite dalle seguenti proprietà:

𝐴 ⊆ 𝐵 ⇐⇒ ∀𝑥 : (𝑥 ∈ 𝐴 =⇒ 𝑥 ∈ 𝐵)
𝐴 = 𝐵 ⇐⇒ ∀𝑥 : (𝑥 ∈ 𝐴 ⇐⇒ 𝑥 ∈ 𝐵).

Ovviamente la relazione 𝐴 ⊆ 𝐵 può essere invertita: scriveremo 𝐴 ⊇ 𝐵 (che si


può leggere: “𝐴 è un soprainsieme di 𝐵”) per indicare 𝐵 ⊆ 𝐴. Scriveremo anche
𝐴 ≠ 𝐵 per indicare la relazione opposta dell’uguaglianza ovvero: ¬(𝐴 = 𝐵).
4 1 fondamenti

Risulta molto utile la possibilità di costruire insiemi di insiemi. Per questo


motivo la teoria degli insiemi usualmente non fa distinzione tra oggetti e insiemi
di oggetti. Nella relazione primitiva 𝑥 ∈ 𝐴 anche 𝑥 può essere un insieme.
Possiamo allora immaginare che ogni oggetto del nostro universo sia un insieme.
In questo modo la relazione di uguaglianza 𝐴 = 𝐵 che abbiamo definito sopra
risulta ben definita per ogni coppia di oggetti (o insiemi, che è lo stesso) 𝐴 e
𝐵.

Visto che gli elementi di un insieme A sono a loro volta insiemi, è possibile
L’intersezione di una famiglia vuota di considerare l’unione A e, se A ≠ ∅, l’intersezione A di tutti gli elementi
S T
insiemi darebbe l’insieme universo, che
vedremo non può essere definito.
di A. Questo estende il concetto di unione e intersezione anche a famiglie
eventualmente infinite:
[
𝑥∈ A ⇐⇒ ∃𝐴 ∈ A : 𝑥 ∈ 𝐴,
\
𝑥∈ A ⇐⇒ ∀𝐴 ∈ A : 𝑥 ∈ 𝐴.

Un altro assioma della teoria degli insiemi garantisce che per ogni 𝑥 esiste un
insieme il cui unico elemento è 𝑥 . Tale insieme si chiama singoletto e si denota
con {𝑥}. La proprietà che definisce il singoletto è la seguente:

𝑦 ∈ {𝑥} ⇐⇒ 𝑦 = 𝑥.

Facendo l’unione di singoletti possiamo definire (per elencazione) insiemi che


contengono un numero finito di oggetti:

{𝑎, 𝑏} = {𝑎} ∪ {𝑏}


{𝑎, 𝑏, 𝑐} = {𝑎, 𝑏} ∪ {𝑐}
{𝑎, 𝑏, 𝑐, 𝑑} = {𝑎, 𝑏, 𝑐} ∪ {𝑑}
..
.

Si faccia però attenzione: l’insieme {𝑎, 𝑏} contiene due elementi solamente se


𝑎 ≠ 𝑏 , infatti se 𝑎 = 𝑏 si potrà facilmente verificare che

{𝑎, 𝑎} = {𝑎}. (1.1)

Esercizio 1.1. Verificare (1.1) utilizzando le definizioni formali date in precedenza.

Svolgimento. Utilizzando le definizioni di unione, di singoletto e di disgiunzione


logica si ha l’equivalenza dei seguenti predicati:

𝑥 ∈ {𝑎, 𝑎}
𝑥 ∈ {𝑎} ∪ {𝑎}
(𝑥 ∈ {𝑎}) ∨ (𝑥 ∈ {𝑎})
(𝑥 = 𝑎) ∨ (𝑥 = 𝑎)
𝑥=𝑎
𝑥 ∈ {𝑎}
1.3 relazioni 5

e dunque {𝑎, 𝑎} = {𝑎} per la definizione di uguaglianza tra insiemi.

Se 𝑃(𝑥) è un predicato in una sola variabile 𝑥 vorremmo poter definire l’insieme,


denotato con {𝑥 : 𝑃(𝑥)} di tutti gli oggetti 𝑥 che rendono vero il predicato
𝑃(𝑥):
𝑎 ∈ {𝑥 : 𝑃(𝑥)} ⇐⇒ 𝑃(𝑎).
Sorprendentemente se inseriamo questo assioma nella teoria degli insiemi si
giunge ad un paradosso (paradosso di Russell, si veda [5]) e si ottiene quindi
una teoria incoerente (cioè una teoria in cui tutte le proposizioni sono vere).
Per evitare l’incoerenza è necessario limitare l’assioma (chiamato assioma di
specificazione) alla costruzione di sottoinsiemi di insiemi già costruiti. Se 𝐵 è un
insieme e 𝑃(𝑥) è un predicato possiamo considerare l’insieme {𝑥 ∈ 𝐵 : 𝑃(𝑥)}
che è il sottoinsieme di 𝐵 formato da tutti gli elementi di 𝐵 che soddisfano il
predicato:
𝑎 ∈ {𝑥 ∈ 𝐵 : 𝑃(𝑥)} ⇐⇒ (𝑎 ∈ 𝐵 ∧ 𝑃(𝑎)).

Per completare la teoria degli insiemi introduciamo anche il concetto di insieme


delle parti. Un apposito assioma garantisce che dato un qualunque insieme 𝐴 insieme delle parti
esiste l’insieme P(𝐴) delle parti di 𝐴 che è l’insieme di tutti i sottoinsiemi di 𝐴:

𝑥 ∈ P(𝐴) ⇐⇒ 𝑥 ⊆ 𝐴. (1.2)

1.3 relazioni

Grazie agli assiomi precedenti è possibile definire il prodotto cartesiano di due


insiemi: sarà questo un concetto molto importante nel seguito. Innanzitutto
coppia
dobbiamo definire il concetto di coppia: dati 𝑎, 𝑏 definiamo la coppia (𝑎, 𝑏)
con primo elemento 𝑎 e secondo elemento 𝑏 come un oggetto che ha questa Un modo formale per definire la coppia
proprietà tramite l’utilizzo di insiemi è dovuto a
(𝑎, 𝑏) = (𝑎 0 , 𝑏 0) ⇐⇒ (𝑎 = 𝑎 0) ∧ (𝑏 = 𝑏 0). (1.3) Kuratowski:

(𝑎, 𝑏) = {𝑎, {𝑎, 𝑏}}.


Stiamo cioè richiedendo che una coppia venga identificata dai due elementi che
la compongono in cui, però, è importante anche l’ordine in cui vengono elencati Non è difficile verificare che questa
definizione soddisfa la proprietà (1.3)
(a differenza dell’insieme {𝑎, 𝑏}, in cui l’ordine degli elementi è irrilevante).
Se definiamo (𝑎, 𝑏) = {𝑎, {𝑎, 𝑏}} (si veda
Il prodotto cartesiano 𝐴 × 𝐵 di due insiemi 𝐴 e 𝐵 è l’insieme di tutte le coppieil nota precedente) possiamo formalmente
definire
cui primo elemento sta in 𝐴 e il secondo elemento sta in 𝐵:
𝐴 × 𝐵 = 𝐶 ∈ P(𝐴 ∪ 𝐵) :


(𝑎, 𝑏) ∈ 𝐴 × 𝐵 ⇐⇒ (𝑎 ∈ 𝐴 ∧ 𝑏 ∈ 𝐵). ∃𝑎 : ∃𝑏 : 𝑎 ∈ 𝐴, 𝑏 ∈ 𝐵,
𝐶 = {𝑎, {𝑎, 𝑏}}

Se rappresentiamo gli elementi di 𝐴 come dei punti su una retta orizzontale


(asse delle 𝑥 ) e gli elementi di 𝐵 come dei punti su una retta verticale (asse delle
𝑦 ) gli elementi di 𝐴 × 𝐵 possono essere rappresentati come i punti del piano che
proiettati sull’asse delle 𝑥 vanno in 𝐴 e proiettati sull’asse delle 𝑦 vanno in 𝐵.
relazione
Una relazione 𝑅 tra gli elementi di un insieme 𝐴 e gli elementi di un insieme
𝐵 non è altro che un sottoinsieme di 𝐴 × 𝐵. Per una relazione 𝑅 ⊆ 𝐴 × 𝐵 si
userà la notazione infissa 𝑎𝑅𝑏 per indicare (𝑎, 𝑏) ∈ 𝑅 . Ad esempio se prendo
6 1 fondamenti

𝐴
𝐵
𝐵 𝑓
(𝑎2 ,𝑏 3 ) (𝑎4 ,𝑏 3 ) 𝑎1
𝑏3 𝑏1
(𝑎 3 ,𝑏 2 ) 𝑎2
𝑏2 𝑏2
(𝑎1 ,𝑏 1 ) 𝑎3
Figura 1.1: La funzione 𝑓 : 𝐴 → 𝐵, 𝑓 = 𝑏1 𝑏3
{𝑎1 ↦→ 𝑏1 , 𝑎2 ↦→ 𝑏 3 , 𝑎3 ↦→ 𝑏2 , 𝑎4 ↦→ 𝑏3 } 𝑎4
rappresentata tramite grafico e tramite 𝐴
diagrammi di Venn. 𝑎1 𝑎2 𝑎3 𝑎4

𝐴 = 𝐵 = {1 , 2 , 3} e considero la relazione 𝑅 = {(1, 2), (1 , 3), (2 , 3)} il predicato


𝑎𝑅𝑏 rappresenta l’usuale relazione d’ordine 𝑎 < 𝑏 sui tre numeri considerati.

Definizione 1.2 (relazione di equivalenza). Se 𝑅 ⊆ 𝐴 × 𝐴 è una relazione


relazione di equivalenza sull’insieme 𝐴, diremo che 𝑅 è una relazione di equivalenza se valgono le seguenti
proprietà (tipiche dell’uguaglianza)

1. riflessiva: 𝑥𝑅𝑥 ;
2. simmetrica: se 𝑥𝑅𝑦 allora 𝑦𝑅𝑥 ;
3. transitiva: 𝑥𝑅𝑦 e 𝑦𝑅𝑧 allora 𝑥𝑅𝑧 .

Se 𝑅 è una relazione di equivalenza diremo che 𝑥 è equivalente a 𝑦 (tramite 𝑅 ) se 𝑥𝑅𝑦 .


Dato 𝑥 ∈ 𝐴 l’insieme di tutti gli elementi di 𝐴 che sono equivalenti a 𝑦 tramite 𝑅 si
classe di equivalenza
chiama classe di equivalenza di 𝑥 . Si definisce in questo modo:

[𝑥]𝑅 = {𝑦 ∈ 𝐴 : 𝑥𝑅𝑦}.
insieme quoziente
Se 𝑅 è una relazione di equivalenza su 𝐴 definiamo l’insieme quoziente come l’insieme
di tutte le classi di equivalenza:

𝐴/𝑅 = {[𝑥]𝑅 : 𝑥 ∈ 𝐴} = {𝐵 ∈ P(𝐴) : ∃𝑥 ∈ 𝐴 𝐵 = [𝑥]}.

Se 𝑅 è una relazione 𝐴 l’insieme quoziente 𝐴/𝑅 rappresenta l’insieme degli


oggetti di 𝐴 in cui vengono identificati tra loro gli oggetti equivalenti. Spesso
diremo che 𝐴/𝑅 rappresenta 𝐴 a meno della equivalenza 𝑅 .

Ad esempio se 𝐴 = {1 , 2 , 3 , 4 , 5} e prendiamo 𝐷 = {1 , 3 , 5} (i numeri dispari)


e 𝑃 = {2 , 4} = 𝐴 \ 𝐵 (i numeri pari) possiamo definire una relazione 𝑅 su 𝐴
mediante la proprietà:

𝑥𝑅𝑦 ⇐⇒ (𝑥 ∈ 𝑃 ∧ 𝑦 ∈ 𝑃) ∨ (𝑥 ∈ 𝐷 ∧ 𝑦 ∈ 𝐷).

La relazione 𝑅 rappresenta la proprietà degli elementi di 𝐴 di avere la stessa


“parità”. Si avrà [1]𝑅 = [3]𝑅 = [5]𝑅 = 𝐷 e [2]𝑅 = [4]𝑅 = 𝑃 . Dunque

𝐴/𝑅 = {𝑃, 𝐷}

e, in effetti, questo insieme ha due elementi 𝑃 e 𝐷 che è quello che si ottiene


identificando i numeri di 𝐴 in base alla proprietà di essere pari o dispari.
1.4 funzioni 7

1.4 funzioni

Per introdurre il concetto di funzione è utile utilizzare una notazione alternativa


per la coppia: invece di denotarla con (𝑎, 𝑏) useremo la notazione 𝑎 ↦→ 𝑏 e
penseremo intuitivamente alla coppia come ad una freccia che collega l’oggetto
𝑎 all’oggetto 𝑏 . Dunque il prodotto cartesiano 𝐴 × 𝐵 risulta essere l’insieme di
tutte le frecce che partono dagli elementi di 𝐴 e arrivano agli elementi di 𝐵.

Una funzione 𝑓 : 𝐴 → 𝐵 è un insieme di frecce che mandano ogni punto di 𝐴


in modo univoco in un punto di 𝐵. Formalmente 𝑓 è quindi un sottoinsieme di
𝐴 × 𝐵 (ed è quindi una relazione) con la proprietà che per ogni 𝑎 ∈ 𝐴 c’è una
ed una sola freccia uscente da 𝑎 : esiste cioè un unico 𝑏 ∈ 𝐵 tale che (𝑎, 𝑏) ∈ 𝑓 .
𝑓
Invece di scrivere (𝑎, 𝑏) ∈ 𝑓 potremo scrivere in modo più espressivo 𝑎 ↦→ 𝑏 .
𝑓
Dato 𝑎 ∈ 𝐴 esiste dunque un unico 𝑏 ∈ 𝐵 tale che 𝑎 ↦→ 𝑏 : chiameremo 𝑓 (𝑎) tale
oggetto 𝑏 . Si avrà dunque

𝑓
𝑏 = 𝑓 (𝑎) ⇐⇒ 𝑎 ↦→ 𝑏.

L’insieme di tutte le funzioni 𝑓 : 𝐴 → 𝐵 viene usualmente denotato con 𝐵 𝐴 . 𝐵𝐴

L’insieme 𝐴 viene chiamato dominio della funzione 𝑓 , l’insieme 𝐵 viene chiamato dominio
codominio. La funzione 𝑓 rappresenta quindi un modo di assegnare in maniera
codominio
univoca ad ogni elemento del dominio un elemento del codominio. Da un
punto di vista informatico potremmo dire che 𝐴 è l’insieme dei possibili input e
𝐵 è l’insieme dei possibili output della funzione 𝑓 .

Sebbene abbiamo costruito il concetto di funzione utilizzando la teoria degli


insiemi, nel seguito non assumeremo mai che le funzioni siano state definite in
questo modo, ma useremo solamente le loro proprietà senza andare ad indagare
quale sia esattamente la loro costruzione interna. Quindi invece di scrivere
(𝑎, 𝑏) ∈ 𝑓 scriveremo sempre 𝑓 (𝑎) = 𝑏 . Sarà comunque molto importante
considerare l’insieme che rappresenta 𝑓 ma questo verrà chiamato grafico di 𝑓 , grafico
𝐺 𝑓 e potrà essere definito in questo modo:

𝐺 𝑓 = {(𝑥, 𝑦) ∈ 𝐴 × 𝐵 : 𝑓 (𝑥) = 𝑦}.

Nella nostra costruzione risulta effettivamente 𝐺 𝑓 = 𝑓 . Anticipiamo fin da


subito che lo studio dei grafici delle funzioni reali è uno degli argomenti
principali di questo corso.

Capita molto spesso che un fenomeno possa essere modellizzato matematica-


mente tramite una funzione: si sa che ad un certo input 𝑎 corrisponde un output
𝑏 = 𝑓 (𝑎). Molto spesso il problema da risolvere è quello di determinare l’input
giusto 𝑎 per ottenere l’output voluto 𝑏 . Questo problema corrisponde ad invertire
la funzione 𝑓 : dato 𝑏 ∈ 𝐵 determinare 𝑥 ∈ 𝐴 tale che 𝑓 (𝑥) = 𝑏 .
surgettiva
Una funzione 𝑓 : 𝐴 → 𝐵 si dice essere surgettiva (o suriettiva) se per ogni 𝑏 ∈ 𝐵
esiste almeno un 𝑥 ∈ 𝐴 per cui 𝑓 (𝑥) = 𝑏 . Questo significa che il problema
dell’inversione ha almeno una soluzione, qualunque sia 𝑏 ∈ 𝐵. Una funzione
iniettiva
𝑓 : 𝐴 → 𝐵 si dice essere iniettiva se non esistono due punti distinti 𝑎, 𝑎 0 ∈ 𝐴,
𝑎 ≠ 𝑎 0 tali che 𝑓 (𝑎) = 𝑓 (𝑎 0). Questo significa che il problema dell’inversione
8 1 fondamenti

𝑓 (𝑥) = 𝑏 ha al più una soluzione (la soluzione, se esiste, è unica). Una funzione
bigettiva
𝑓 : 𝐴 → 𝐵 si dice essere bigettiva (o biettiva) o invertibile se è sia iniettiva che
surgettiva. Questo significa che il problema dell’inversione 𝑓 (𝑥) = 𝑏 ha una
invertibile unica soluzione 𝑥 ∈ 𝐴 qualunque sia 𝑏 ∈ 𝐵. In particolare, se 𝑓 è invertibile,
Attenzione: in alcuni testi (tra cui [2]) per ogni 𝑏 ∈ 𝐵 esiste un unico 𝑎 ∈ 𝐴 per cui 𝑓 (𝑎) = 𝑏 . Chiamato 𝑎 = 𝑔(𝑏)
si considerano invertibili le funzioni l’unico 𝑎 ∈ 𝐴 per cui 𝑓 (𝑎) = 𝑏 si ottiene dunque una funzione 𝑔 : 𝐵 → 𝐴 con le
iniettive, anche se non surgettive.
proprietà:
∀𝑎 ∈ 𝐴 : 𝑔( 𝑓 (𝑎)) = 𝑎, ∀𝑏 ∈ 𝐵 : 𝑓 (𝑔(𝑏)) = 𝑏.

funzione inversa
Una funzione 𝑔 con queste proprietà viene chiamata funzione inversa di 𝑓 e viene
usualmente denotata con il simbolo 𝑓 −1 .

Se 𝑓 : 𝐴 → 𝐵 e 𝑔 : 𝐵 → 𝐶 sono due funzioni in cui il codominio della prima


funzione composta coincide con il dominio della seconda, allora definiamo la funzione composta
𝑔 ◦ 𝑓 : 𝐴 → 𝐶 che si ottiene applicando prima 𝑓 e poi 𝑔 :

(𝑔 ◦ 𝑓 )(𝑥) = 𝑔( 𝑓 (𝑥)).

Se il codominio di 𝑓 non coincide col dominio di 𝑔 è possibile dare comunque


senso alla funzione 𝑔 ◦ 𝑓 che risulta però definita solamente nei punti del
dominio di 𝑓 che vengono mandati, tramite 𝑓 nel dominio di 𝑔 .

Introduciamo ora delle notazioni che sarà comodo utilizzare nel seguito. Se
𝑓 : 𝐴 → 𝐵 è una funzione e se 𝐶 ⊆ 𝐴 definiamo

𝑓 (𝐶) = { 𝑓 (𝑎) : 𝑎 ∈ 𝐶} = {𝑏 ∈ 𝐵 : ∃𝑎 ∈ 𝐶 : 𝑏 = 𝑓 (𝑎)}.


insieme immagine
L’insieme 𝑓 (𝐶) ⊆ 𝐵 si chiama immagine di 𝐶 (tramite 𝑓 ) ed è formato da tutti
i punti che si ottengono applicando 𝑓 agli elementi di 𝐶 . L’immagine 𝑓 (𝐴)
dell’intero dominio 𝐴 si chiama immagine di 𝑓 . Si noti che 𝑓 è surgettiva se
e solo se 𝑓 (𝐴) = 𝐵 (cioè se l’immagine coincide col codominio). Anche se
𝑓 : 𝐴 → 𝐵 non fosse iniettiva, per ogni 𝐶 ⊆ 𝐵 possiamo definire

𝑓 −1 (𝐶) = {𝑎 ∈ 𝐴 : 𝑓 (𝑎) ∈ 𝐶}.


preimmagine
L’insieme 𝑓 −1 (𝐶) ⊆ 𝐴 si chiama preimmagine o controimmagine di 𝐶 (tramite 𝑓 )
ed è formato da tutti i punti di 𝐴 che applicando 𝑓 vanno in 𝐶 . Si noti che se
𝑏 ∈ 𝐵 l’insieme 𝑓 −1 ({𝑏}) non è altro che l’insieme delle soluzioni dell’equazione
𝑓 (𝑥) = 𝑏 . Come abbiamo già visto tale insieme contiene almeno un elemento se
𝑓 è suriettiva, contiene al più un elemento se 𝑓 è iniettiva e contiene esattamente
un elemento 𝑓 −1 ({𝑏}) = 𝑓 −1 (𝑏) se 𝑓 è bigettiva.

La notazione 𝑓 (𝐶) appena introdotta è formalmente ambigua in quanto potrebbe


non essere chiaro se 𝐶 è un elemento oppure un sottoinsieme del dominio di 𝑓 .
In pratica il contesto dovrebbe rendere chiaro cosa si intende.

Più in generale ci capiterà di estendere questo abuso di notazione non solo alle
funzioni, ma anche alle relazioni e alle operazioni. Ad esempio se 𝐴 e 𝐵 sono
insiemi di numeri ci capiterà di scrivere 𝐴 ≤ 𝐵 per indendere che ogni elemento
di 𝐴 è minore o uguale ad ogni elemento di 𝐵 oppure 𝐴 + 𝐵 per intendere
l’insieme di tutti i numeri che si ottengono sommando un numero di 𝐴 ad un
numero di 𝐵.
1.5 cardinalità 9

𝐴
𝐴\𝐵
𝐵

Figura 1.2: Nella dimostrazione del teo-


rema di Cantor-Bernstein 𝐴 è rappresen-
tato da un quadrato e 𝐵 da un cerchio
contenuto in 𝐴. L’immagine di 𝐴 in 𝐵 è
rappresentata da un quadrato contenuto
in 𝐵 e così via. La parte ombreggiata è
l’insieme 𝐷 .

1.5 cardinalità

Definizione 1.3 (cardinalità). Diremo che due insiemi 𝐴 e 𝐵 hanno la stessa


cardinalità (oppure sono equipotenti) se esiste una funzione bigettiva 𝑓 : 𝐴 → 𝐵. cardinalità
Scriveremo in tal caso:
#𝐴 = #𝐵.
Se esiste una funzione iniettiva 𝑓 : 𝐴 → 𝐵 significa che 𝐴 ha la stessa cardinalità di un
sottoinsieme di 𝐵 (in quanto 𝑓 : 𝐴 → 𝑓 (𝐴) risulta essere bigettiva). Scriveremo in tal
caso:
#𝐴 ≤ #𝐵.

Intuitivamente se due insiemi hanno la stessa cardinalità significa che hanno lo


stesso numero di elementi. Ma la precedente definizione riesce a catturare tale
concetto senza dover ricorrere al concetto di numero. Questo ha il vantaggio
che questa definizione si applica a qualunque insieme, anche con un numero
“infinito” di elementi.

Si osservi che non abbiamo dato una definizione di #𝐴 e quindi non stiamo
definendo la cardinalità di un insieme ma stiamo soltanto definendo una
relazione tra insiemi che denotiamo, impropriamente, come una uguaglianza:
#𝐴 = #𝐵. E’ ovvio che #𝐴 = #𝐴 in quanto l’identità 𝑓 : 𝐴 → 𝐴, 𝑓 (𝑥) = 𝑥 è
bigettiva. E’ anche chiaro che se #𝐴 = #𝐵 e #𝐵 = #𝐶 allora #𝐴 = #𝐶 in quanto
componendo tra loro due funzioni bigettive si ottiene ancora una funzione
bigettiva.

Il seguente teorema giustifica l’utilizzo del simbolo ≤ nella definizione prece-


dente.

Teorema 1.4 (Cantor-Bernstein). Se #𝐴 ≤ #𝐵 e #𝐵 ≤ #𝐴 allora #𝐴 = #𝐵.

Dimostrazione. Per prima cosa al posto dell’ipotesi #𝐵 ≤ #𝐴 prendiamo l’ipotesi


apparentemente più forte 𝐵 ⊆ 𝐴. Vedremo alla fine che questa ipotesi non ci fa
perdere di generalità.

Essendo per ipotesi #𝐴 ≤ #𝐵 esiste 𝑓 : 𝐴 → 𝐵 iniettiva. Intuitivamente l’idea è


quella di definire l’insieme

𝐷 = (𝐴 \ 𝐵) ∪ 𝑓 (𝐴 \ 𝐵) ∪ 𝑓 2 (𝐴 \ 𝐵) ∪ . . .
10 1 fondamenti

e di definire la biezione 𝜑 : 𝐴 → 𝐵 mandando ogni "buccia" 𝑓 𝑛 (𝐴 \ 𝐵) in


𝑓 𝑛+1 (𝐴 \ 𝐵) e lasciando fisso il resto di 𝐵.
Per farlo in maniera rigorosa consideriamo allora la famiglia di insiemi F =
{𝑋 ⊆ 𝐴 : 𝑋 ⊇ 𝐴 \ 𝐵, 𝑓 (𝑋) ⊆ 𝑋} e definiamo 𝐷 = F. Osserviamo che 𝐴 ∈ F
T
quindi F ≠ ∅.

E’ facile verificare che 𝑓 (𝐷) ⊆ 𝐷 infatti dato 𝑥 ∈ 𝐷 per ogni 𝑋 ∈ F deve essere
𝑥 ∈ 𝑋 ma allora 𝑓 (𝑥) ∈ 𝑋 (per come è definito F), dunque 𝑓 (𝑥) ∈ 𝐷 . In modo
analogo si dimostra che 𝐷 ⊇ 𝐴 \ 𝐵 e dunque concludiamo che 𝐷 ∈ F.

Verifichiamo ora che 𝑓 (𝐷) = 𝐷 ∩ 𝐵. Da un lato se 𝑥 ∈ 𝐷 allora 𝑓 (𝑥) ∈ 𝑓 (𝐷) ⊆ 𝐷


e 𝑓 (𝑥) ⊆ 𝑓 (𝐴) ⊆ 𝐵 da cui 𝑓 (𝑥) ∈ 𝐷 ∩ 𝐵. Dall’altro lato se 𝑦 ∈ 𝐷 ∩ 𝐵 e non fosse
𝑦 ∈ 𝑓 (𝐷) allora potremmo considerare l’insieme 𝑋 = 𝐷 \ {𝑦} e osservare che
𝑋 ∈ F. Infatti in primo luogo 𝑋 ⊇ 𝐴 \ 𝐵 in quanto 𝐷 ha questa proprietà e
𝑦 ∈ 𝐵. Inoltre dato qualunque 𝑥 ∈ 𝑋 visto che 𝑋 ⊆ 𝐷 allora 𝑓 (𝑥) ∈ 𝑓 (𝐷) e, per
ipotesi, 𝑦 ∉ 𝑓 (𝐷) dunque 𝑓 (𝑥) ≠ 𝑦 da cui 𝑓 (𝑥) ∈ 𝑋 . Dunque 𝑋 ∈ F ma allora
dovrebbe essere 𝐷 ⊆ 𝑋 mentre per costruzione abbiamo 𝑦 ∈ 𝐷 ma non in 𝑋 .

Possiamo allora definire 𝜑 : 𝐴 → 𝐵


(
𝑓 (𝑥) se 𝑥 ∈ 𝐷,
𝜑(𝑥) =
𝑥 altrimenti.

Chiaramente 𝜑 è iniettiva in quanto 𝑓 è iniettiva e manda 𝐷 in 𝐷 e l’identità è


iniettiva e manda 𝐴 \ 𝐷 in 𝐴 \ 𝐷 .

Per dimostrare che 𝜑 è suriettiva consideriamo qualunque 𝑦 ∈ 𝐵. Se 𝑦 ∉ 𝐷


allora 𝜑(𝑦) = 𝑦 . Se invece 𝑦 ∈ 𝐷 essendo 𝑦 ∈ 𝐷 ∩ 𝐵 = 𝑓 (𝐷) esisterà 𝑥 ∈ 𝐷 tale
che 𝜑(𝑥) = 𝑓 (𝑥) = 𝑦 .

Abbiamo dimostrato il teorema nel caso 𝐵 ⊆ 𝐴. Nel caso generale sappiamo


che esiste 𝑓 : 𝐴 → 𝐵 iniettiva ed esiste 𝑔 : 𝐵 → 𝐴 iniettiva. Definiamo 𝐵˜ = 𝑔(𝐵)
e definiamo 𝑓˜ : 𝐴 → 𝐵˜ tramite 𝑓˜(𝑥) = 𝑔( 𝑓 (𝑥)). Chiaramente 𝐵˜ ⊆ 𝐴 e 𝑓˜ è
iniettiva. Dunque ci siamo ricondotti alle ipotesi particolari e sappiamo che
esiste 𝜑˜ : 𝐴 → 𝐵˜ bigettiva. Ma allora possiamo definire 𝜑 : 𝐴 → 𝐵 come
𝜑(𝑥) = 𝑔 −1 ( 𝜑(𝑥))
˜ . Essendo 𝜑(𝐴)
˜ = 𝐵˜ ed essendo 𝑔 : 𝐵 → 𝐵˜ bigettiva, risulta
che anche 𝜑 sia bigettiva.

Se #𝐴 ≤ #𝐵 esiste 𝑓 : 𝐴 → 𝐵 iniettiva e possiamo considerare l’insieme


immagine 𝐶 = 𝑓 (𝐴) e osservare che 𝑓 : 𝐴 → 𝐶 risulta essere bigettiva. Dunque
#𝐴 ≤ #𝐵 è equivalente a richiedere che esista 𝐶 ⊆ 𝐵 tale che #𝐴 = #𝐶 . In tal
caso, se 𝐴 non è vuoto, è anche possibile dimostrare che esiste una funzione
𝑔 : 𝐵 → 𝐴 surgettiva, in quanto si può prendere l’inversa di 𝑓 : 𝐴 → 𝐶 ed
estenderla ad un valore fissato qualunque 𝑎 0 ∈ 𝐴 sui punti di 𝐵 \ 𝐶 . Significa
che se #𝐴 ≤ #𝐵 esiste una funzione surgettiva 𝑔 : 𝐵 → 𝐴. Tale funzione 𝑔 ha la
inversa sinistra proprietà che 𝑔( 𝑓 (𝑎)) = 𝑎 per ogni 𝑎 ∈ 𝐴 e si chiama dunque inversa sinistra di
𝑓.
Viceversa se esiste 𝑓 : 𝐴 → 𝐵 surgettiva per ogni 𝑏 ∈ 𝐵 l’insieme 𝑓 −1 ({𝑏}) non è
mai vuoto e quindi è chiaro che debba esistere una funzione 𝑔 : 𝐵 → 𝐴 tale che
𝑔(𝑏) è un elemento di tale insieme e dunque 𝑓 (𝑔(𝑏)) = 𝑏 . In tal caso 𝑔 è una
inversa destra funzione iniettiva che si chiama inversa destra di 𝑓 . Abbiamo quindi dimostrato
1.6 i numeri naturali 11

che se esiste 𝑓 : 𝐴 → 𝐵 surgettiva allora #𝐵 ≤ #𝐴.

Per quanto questo possa sembrare strano il procedimento che ci garantisce di


poter definire la funzione 𝑔 necessita di un apposito assioma.

Assioma 1.5 (della scelta). Siq 𝐹 : 𝐴 → P(𝐵) una funzione tale che 𝑓 (𝑎) ≠ ∅ per
ogni 𝑎 ∈ 𝐴. Allora esiste una funzione 𝑓 : 𝐴 → 𝐵 tale che 𝑓 (𝑎) ∈ 𝐹(𝑎) per ogni
𝑎 ∈ 𝐴.

L’assioma della scelta (denotato spesso con 𝐴𝐶 , axiom of choice) è un assioma 𝐴𝐶


per certi versi controverso e alcuni matematici preferiscono non utilizzarlo nelle
loro dimostrazioni. La teoria degli insiemi senza l’assioma della scelta si chiama
𝑍𝐹 (Zermelo-Fraenkel) mentre se si aggiunge l’assioma della scelta (choice) la 𝑍𝐹
teoria si chiama 𝑍𝐹𝐶 .
𝑍𝐹𝐶

1.6 i numeri naturali


Giuseppe Peano (1858–1932), matemati-
co torinese, contribuì a porre i fondamen-
Definizione 1.6 (assiomi di Peano). Un insieme ℕ dotato di una funzione 𝜎 : ℕ → ℕ
ti della logica matematica. La notazione
e di un elemento 0 ∈ ℕ che soddisfano le seguenti proprietà si dice essere un insieme di ∃ per il quantificatore universale si deve
numeri naturali se valgono le seguenti proprietà: a lui.

1. 𝜎 è iniettiva: se 𝜎(𝑚) = 𝜎(𝑛) allora 𝑚 = 𝑛 ; numeri naturali

2. per ogni 𝑛 ∈ ℕ si ha 𝜎(𝑛) ≠ 0;


3. induttività: se 𝐴 ⊆ ℕ è un sottoinsieme tale che
i) 0 ∈ 𝐴;
ii) 𝑛 ∈ 𝐴 =⇒ 𝜎(𝑛) ∈ 𝐴
allora 𝐴 = ℕ .
La definizione originale di Peano pren-
deva 1 come primo numero naturale ma
Dato 𝑛 ∈ ℕ il numero 𝜎(𝑛) si chiama il successore di 𝑛 . Il numero 0 ∈ ℕ che
nella matematica moderna risulta più
per assioma non è il successore di nessun’altro numero naturale si chiama zero. comodo includere anche 0 tra i numeri
Possiamo anche dare un nome ai primi nove numeri naturali: naturali, così come si considera il vuoto
come un insieme valido.
1 = 𝜎(0), 2 = 𝜎(1), 3 = 𝜎(2), 4 = 𝜎(3), 5 = 𝜎(4), successore
6 = 𝜎(5), 7 = 𝜎(6), 8 = 𝜎(7), 9 = 𝜎(8) zero

cosicché intuiamo come la funzione 𝜎 rappresenti l’usuale operazione del


contare:
𝜎 𝜎 𝜎 𝜎 𝜎 𝜎 𝜎
0 ↦→ 1 ↦→ 2 ↦→ 3 ↦→ 4 ↦→ 5 ↦→ 6 ↦→ . . .
Il primi due assiomi servono a garantire che in questo processo del contare contare
troviamo sempre numeri diversi (non si torna mai indietro) in quanto nessun
numero può avere come successore 0 o un numero già incontrato in precedenza
(che se non è zero è il successore di un altro numero).

L’ultimo assioma serve a garantire che questo processo del contare esaurisce
tutti i numeri naturali, e che quindi non ci sono dei naturali irraggiungibili
partendo da zero.

Normalmente la proprietà induttiva dei numeri naturali viene utilizzata tramite Il principio di induzione non è un teore-
ma della teoria degli insiemi in quanto
il seguente meta-teorema. si riferisce il concetto di predicato che è
esterno al sistema stesso.
12 1 fondamenti

Teorema 1.7 (principio di induzione). Sia 𝑃(𝑛) un predicato. Se

1. vale 𝑃(0) e
2. ∀𝑛 ∈ ℕ : 𝑃(𝑛) =⇒ 𝑃(𝑛 + 1)

allora 𝑃(𝑛) è vero per ogni 𝑛 ∈ ℕ .

Dimostrazione. Consideriamo l’insieme 𝐴 = {𝑛 ∈ ℕ : 𝑃(𝑛)}. Grazie alle ipotesi


del teorema possiamo applicare la proprietà induttiva dei numeri naturali per
dedurre che 𝐴 = ℕ . Dunque 𝑃(𝑛) è soddisfatta per ogni 𝑛 ∈ ℕ .

Il fatto che 𝜎 : ℕ → ℕ sia iniettiva ma non suriettiva significa che ℕ può essere
messo in corrispondenza biunivoca con 𝜎(ℕ ) che è un sottoinsieme proprio di ℕ .
In particolare #ℕ = #(ℕ \ {0}). Questa proprietà è per certi versi paradossale
ed identifica gli insiemi infiniti, nel senso di Dedekind:
insieme finito

Definizione 1.8 (Dedekind infinito). Diremo che un insieme 𝑋 è finito (più


insieme infinito precisamente: Dedekind-finito) se ogni funzione iniettiva 𝑓 : 𝑋 → 𝑋 è bigettiva.

Diremo che un insieme 𝑋 è infinito (più precisamente Dedekind-infinito) se non è finito


ovvero se se esiste 𝑓 : 𝑋 → 𝑋 iniettiva ma non suriettiva.
Un sottoinsieme 𝐴 di un insieme di 𝑋 si
chiama anche parte. Se 𝐴 ⊆ 𝑋 , 𝐴 ≠ 𝑋 si
dice che 𝐴 è una parte propria di 𝑋 . In particolare un insieme infinito può essere messo in corrispondenza biunivoca
L’insieme ℕ dei numeri naturali è il più con una sua parte propria in quanto 𝑓 : 𝑋 → 𝑓 (𝑋) è bigettiva e 𝑋 \ 𝑓 (𝑋) ≠ ∅.
piccolo insieme infinito

induttivo
Se 𝑋 è un qualunque insieme infinito, dentro 𝑋 possiamo costruire un insieme
che soddisfa gli assiomi di Peano. Infatti fissata 𝑓 : 𝑋 → 𝑋 iniettiva ma non
suriettiva basta scegliere 0 ∈ 𝑋 \ 𝑓 (𝑋). Dopodiché diciamo che un sottoinsieme
𝐼 ⊆ 𝑋 è induttivo se 0 ∈ 𝐼 e se 𝑛 ∈ 𝐼 =⇒ 𝑓 (𝑛) ∈ 𝐼 . Possiamo quindi definire:
\
ℕ= 𝐼
𝐼 ⊆ 𝑋 induttivo

e osservare che ovviamente ℕ stesso è un sottoinsieme induttivo di 𝑋 . Dunque


se 𝑛 ∈ ℕ si ha 𝑓 (𝑛) ∈ ℕ e quindi la restrizione di 𝑓 a ℕ è una funzione 𝜎 : ℕ → ℕ
che è certamente iniettiva (in quanto restrizione di una funzione iniettiva) non è
suriettiva (in quanto 0 non è nell’immagine di 𝑓 e tantomeno nell’immagine di
𝜎) e soddisfa la proprietà induttiva perche se prendiamo 𝐴 ⊆ ℕ tale che 0 ∈ 𝐴
e 𝑛 ∈ 𝐴 =⇒ 𝜎(𝑛) ∈ 𝐴 allora significa che 𝐴 è induttivo e quindi, per come è
definito ℕ , deve essere ℕ ⊆ 𝐴. Dunque 𝐴 = ℕ .

Per garantire l’esistenza dell’insieme dei numeri naturali basta quindi supporre
che esista almeno un insieme infinito. Sarà opportuno prendere questo come
assioma perché se esaminiamo gli assiomi che abbiamo introdotto finora ci
accorgiamo che l’insieme vuoto e tutti gli insiemi che possono essere costruiti a
partire da esso sono tutti finiti.

Assioma 1.9 (infinito). Esiste un insieme infinito. E non è restrittivo supporre che
tale insieme sia un insieme ℕ che soddisfa gli assiomi di Peano.
1.6 i numeri naturali 13

Teorema 1.10 (definizione per induzione). Sia 𝑋 un insieme, sia 𝛼 ∈ 𝑋 e sia


𝑔 : 𝑋 → 𝑋 una funzione. Allora esiste una unica funzione 𝑓 : ℕ → 𝑋 tale che
(
𝑓 (0) = 𝛼,
(1.4)
𝑓 (𝜎(𝑛)) = 𝑔( 𝑓 (𝑛)).

Si avrà dunque

𝑓 (0) = 𝛼, 𝑓 (1) = 𝑔(𝛼), 𝑓 (2) = 𝑔(𝑔(𝛼)), 𝑓 (3) = 𝑔(𝑔(𝑔(𝛼))) . . .

Più in generale se abbiamo 𝛼 ∈ 𝑋 e una funzione 𝑔 : ℕ × 𝑋 → 𝑋 esisterà una unica


funzione 𝑓 : ℕ → 𝑋 tale che
(
𝑓 (0) = 𝛼,
(1.5)
𝑓 (𝜎(𝑛)) = 𝑔(𝑛, 𝑓 (𝑛)).

Dimostrazione. Dobbiamo ricordarci che le funzioni 𝑓 : ℕ → 𝑋 non sono altro


che relazioni e cioè sottoinsiemi del prodotto ℕ × 𝑋 . L’idea è quindi di prendere
il più piccolo sottoinsieme di ℕ × 𝑋 che possa rappresentare una funzione con
le proprietà richieste. Consideriamo dunque la famiglia di insiemi:

F = {𝐹 ∈ P(ℕ × 𝑋) : (0, 𝛼) ∈ 𝐹, (𝑛, 𝑥) ∈ 𝐹 ⇒ (𝜎(𝑛), 𝑔(𝑥)) ∈ 𝐹}.

Chiaramente F non è vuota in quanto ℕ × 𝑋 ∈ F. Possiamo dunque farne


l’intersezione e definire un insieme 𝑓 :
\
𝑓 = 𝐹.
𝐹∈F

L’insieme 𝑓 che abbiamo definito rappresenta una relazione tra ℕ e 𝑋 . Visto


che (0 , 𝛼) ∈ 𝐹 per ogni 𝐹 ∈ F dovrà essere (0 , 𝛼) ∈ 𝑓 . Inoltre se (𝑛, 𝑥) ∈ 𝑓
allora (𝑛, 𝑥) ∈ 𝐹 per ogni 𝐹 ∈ F e quindi (𝜎(𝑛), 𝑔(𝑥)) ∈ 𝐹 per ogni 𝐹 ∈ F da cui
(𝜎(𝑛), 𝑔(𝑥)) ∈ 𝑓 . Significa che 𝑓 ∈ F.

Vogliamo ora dimostrare che 𝑓 è una funzione, cioè che è univocamente definita
su tutto ℕ . Per prima cosa consideriamo l’insieme su cui 𝑓 è definita e cioè
𝐴 = {𝑛 ∈ ℕ : ∃𝑥 ∈ 𝑋 : (𝑛, 𝑥) ∈ 𝑓 } e dimostriamo, per induzione, che 𝐴 = ℕ . In
effetti (0 , 𝛼) ∈ 𝑓 quindi 0 ∈ 𝐴. E se 𝑛 ∈ 𝐴 sappiamo che esiste 𝑥 ∈ 𝑋 tale che
(𝑛, 𝑥) ∈ 𝑓 e dunque, essendo 𝑓 ∈ F, anche (𝜎(𝑛), 𝑔(𝑥)) ∈ 𝑓 da cui 𝜎(𝑛) ∈ 𝐴.
Abbiamo dimostrato che 𝑓 è definita su tutto ℕ .

Dimostriamo ora che 𝑓 è univoca. Consideriamo l’insieme su cui 𝑓 è uni-


vocamente definita: 𝐵 = {𝑛 ∈ ℕ : ∃! 𝑥 ∈ 𝑋 : (𝑛, 𝑥) ∈ 𝑓 }. Di nuovo vogliamo
dimostrare per induzione che 𝐵 = ℕ . Per dimostrare che 0 ∈ 𝐵, visto che già
sappiamo che (0 , 𝛼) ∈ 𝑓 , dobbiamo dimostrare che se 𝑥 ≠ 𝛼 si ha (0 , 𝑥) ∉ 𝑓 . Sia
dunque 𝑥 ≠ 𝛼 e consideriamo l’insieme 𝐹 = 𝑓 \ {(0 , 𝑥)}. Chiaramente 𝐹 ∈ F
in quanto (0 , 𝛼) ∈ 𝐹 visto che (0 , 𝛼) ∈ 𝑓 e (0 , 𝛼) ≠ (0 , 𝑥) inoltre se (𝑛, 𝑦) ∈ 𝐹
allora (𝑛, 𝑦) ∈ 𝑓 e quindi (𝜎(𝑛), 𝑔(𝑦)) ∈ 𝑓 . Ma certamente (𝜎(𝑛), 𝑔(𝑦)) ≠ (0 , 𝑥)
in quanto 𝜎(𝑛) ≠ 0 dunque (𝜎(𝑛), 𝑔(𝑦)) ∈ 𝐹 . Visto che 𝐹 ∈ F si deve avere
𝑓 ⊆ 𝐹 e dunque (0 , 𝑥) ∉ 𝑓 . Dunque 𝑓 è univocamente definita in 0.
14 1 fondamenti

Dobbiamo ora mostrare che se 𝑛 ∈ 𝐵 anche 𝜎(𝑛) ∈ 𝐵. Se 𝑛 ∈ 𝐵 significa che c’è


un unico 𝑥 ∈ 𝑋 tale che (𝑛, 𝑥) ∈ 𝑓 e certamente anche (𝜎(𝑛), 𝑔(𝑥)) ∈ 𝑓 . Pren-
diamo allora 𝑦 ≠ 𝑔(𝑥), vorremo dimostrare che (𝜎(𝑛), 𝑦) ∉ 𝑓 . Consideriamo,
similmente a prima, l’insieme 𝐹 = 𝑓 \ {(𝜎(𝑛), 𝑦)} e cerchiamo di dimostra-
re che 𝐹 ∈ F. Chiaramente (0 , 𝛼) ∈ 𝐹 perché (0 , 𝛼) ∈ 𝑓 e non può essere
(0 , 𝛼) = (𝜎(𝑛), 𝑦) in quanto 𝜎(𝑛) ≠ 0. Se ora supponiamo che sia (𝑚, 𝑧) ∈ 𝐹
certamente sarà (𝑚, 𝑧) ∈ 𝑓 e dunque (𝜎(𝑚), 𝑔(𝑧)) ∈ 𝑓 : dobbiamo mostrare
che (𝜎(𝑚), 𝑔(𝑧)) ∈ 𝐹 . D’altra parte se fosse (𝜎(𝑚), 𝑔(𝑧)) = (𝜎(𝑛), 𝑦) dovrebbe
essere 𝑚 = 𝑛 in quanto 𝜎 è iniettiva. Ma visto che 𝑓 è univocamente definita su
𝑛 dovrà allora essere anche (𝑛, 𝑧) = (𝑛, 𝑥) e quindi 𝑔(𝑧) = 𝑔(𝑥) ≠ 𝑦 . Dunque
(𝜎(𝑚), 𝑔(𝑧)) ∈ 𝐹 e 𝐹 ∈ F. Ma allora 𝑓 ⊆ 𝐹 e quindi (𝜎(𝑛), 𝑦) ∉ 𝑓 . Significa
che 𝑓 è univocamente definita anche in 𝜎(𝑛). Per induzione 𝐵 = ℕ ed 𝑓 è una
funzione 𝑓 : ℕ → 𝑋 .

Ovviamente visto che 𝑓 ∈ F sappiamo che 𝑓 soddisfa le proprietà richieste dal


teorema.

Nella seconda parte del teorema, dove 𝑔 : ℕ ×𝑋 → 𝑋 , possiamo considerare l’in-


sieme 𝑌 = ℕ × 𝑋 e la funzione 𝐺 : 𝑌 → 𝑌 definita da 𝐺(𝑛, 𝑥) = (𝜎(𝑛), 𝑔(𝑛, 𝑥)).
Allora applicando la prima parte possiamo trovare 𝐹 : ℕ → 𝑌 tale che 𝐹(0) =
(0 , 𝛼) e 𝐹(𝜎(𝑛)) = 𝐺(𝐹(𝑛)). Basterà prendere come 𝑓 (𝑛) la seconda componente
di 𝐺(𝑛).

Per induzione possiamo definire la somma tra numeri naturali:


(
𝑛 + 0 = 𝑛,
𝑛 + 𝜎(𝑚) = 𝜎(𝑛 + 𝑚).

Osservando che 𝑛 + 1 = 𝑛 + 𝜎(0) = 𝜎(𝑛 + 0) = 𝜎(𝑛) potremo d’ora in poi scrivere


𝑛 + 1 al posto di 𝜎(𝑛) ed abbandonare la funzione 𝜎. Abbiamo quindi definito
l’addizione in modo che valga 𝑛 + 0 = 𝑛 e 𝑛 + (𝑚 + 1) = (𝑛 + 𝑚) + 1. Possiamo
da questo dedurre le altre proprietà della somma.

Teorema 1.11. L’addizione su ℕ soddisfa le seguenti

1. proprietà associativa: (𝑛 + 𝑚) + 𝑘 = 𝑛 + (𝑚 + 𝑘),


2. elemento neutro: 𝑛 + 0 = 0 + 𝑛 = 𝑛 ,
3. proprietà commutativa: 𝑛 + 𝑚 = 𝑚 + 𝑛 ,
4. proprietà invariantiva: se 𝑚 + 𝑘 = 𝑛 + 𝑘 allora 𝑚 = 𝑛 .

Dimostrazione. Per la proprietà associativa facciamo la dimostrazione per indu-


zione su 𝑘 . Se 𝑘 = 0 è chiaro che (𝑛 + 𝑚) + 0 = 𝑛 + 𝑚 = 𝑛 + (𝑚 + 0). Supponendo
ora di sapere che vale (𝑛 + 𝑚) + 𝑘 = 𝑛 + (𝑚 + 𝑘) cerchiamo di dimostrare che
(𝑛 + 𝑚) + (𝑘 + 1) = 𝑛 + (𝑚 + (𝑘 + 1)). Ricordando la definizione induttiva di
addizione e usando l’ipotesi induttiva si ha

(𝑛 + 𝑚) + (𝑘 + 1) = ((𝑛 + 𝑚) + 𝑘) + 1 = (𝑛 + (𝑚 + 𝑘)) + 1
= 𝑛 + ((𝑚 + 𝑘) + 1) = 𝑛 + (𝑚 + (𝑘 + 1))

come volevamo dimostrare.


1.6 i numeri naturali 15

Per quanto riguarda l’elemento neutro sappiamo per definizione che 𝑛 + 0 = 𝑛 .


Dimostriamo per induzione che vale anche 0 + 𝑛 = 𝑛 . Per 𝑛 = 0 si riconduce al
primo caso. Supponendo per induzione che valga 0 + 𝑛 = 𝑛 possiamo osservare
che per la definizione di addizione si ha:

0 + (𝑛 + 1) = (0 + 𝑛) + 1 = 𝑛 + 1

come volevamo dimostrare.


Consideriamo la proprietà commutativa. Dobbiamo innanzitutto dimostrare
che 𝑛 + 1 = 1 + 𝑛 . Lo facciamo per induzione: se 𝑛 = 0 si applica la proprietà
dell’elemento neutro. Se, per induzione, supponiamo che valga 𝑛 + 1 = 1 + 𝑛
allora si ha
(𝑛 + 1) + 1 = (1 + 𝑛) + 1 = 1 + (𝑛 + 1)
che è quanto dovevamo dimostrare. Possiamo ora dimostrare per induzione su
𝑚 che per ogni 𝑛 vale 𝑛 + 𝑚 = 𝑚 + 𝑛 . Il caso 𝑚 = 0 si riconduce alla proprietà
dell’elemento neutro: 𝑛 + 0 = 𝑛 = 0 + 𝑛 . Se ora per induzione supponiamo
che valga 𝑛 + 𝑚 = 𝑚 + 𝑛 possiamo utilizzare il caso precedente e la proprietà
associativa per ottenere:

𝑛+𝑚+1= 𝑚+𝑛+1= 𝑚+1+𝑛

che è quanto dovevamo dimostrare.


Dimostriamo la proprietà invariantiva per induzione su 𝑘 . Se 𝑘 = 0 è ovvio
che da 𝑚 + 𝑘 = 𝑛 + 𝑘 si possa dedurre 𝑚 = 𝑛 visto che 𝑚 + 0 = 𝑚 e 𝑛 + 0 = 𝑛 .
Supponiamo allora che la proprietà sia valida per un certo 𝑘 e dimostriamola
per 𝑘 + 1. Dunque se vale 𝑚 + 𝑘 + 1 = 𝑛 + 𝑘 + 1 si ha (𝑚 + 1) + 𝑘 = (𝑛 + 1) + 𝑘 e
quindi, per ipotesi induttiva, 𝑚 + 1 = 𝑛 + 1. Scritto in altri termini 𝜎(𝑚) = 𝜎(𝑛)
da cui, grazie al fatto che 𝜎 è iniettiva, si deduce 𝑚 = 𝑛 .

Possiamo ora definire una relazione ≤ su ℕ ponendo

𝑚 ≤ 𝑛 ⇐⇒ ∃𝑘 ∈ ℕ : 𝑛 = 𝑚 + 𝑘.

Se 𝑚 ≤ 𝑛 cioè se esiste 𝑘 ∈ ℕ tale che 𝑛 = 𝑚 + 𝑘 tale numero 𝑘 è unico in quanto


se fosse 𝑚 + 𝑗 = 𝑛 = 𝑚 + 𝑘 potremmo dedurre 𝑘 = 𝑗 dalla proprietà invariantiva
della addizione. Possiamo dunque definire la differenza: 𝑘 = 𝑛 − 𝑚 . differenza
Vogliamo dimostrare che la relazione ≤ appena introdotta soddisfa le seguenti
proprietà.

Definizione 1.12 (relazione d’ordine). Una relazione ≤ su un insieme 𝑋 viene detta


relazione d’ordine se soddisfa le seguenti proprietà (per ogni 𝑥, 𝑦, 𝑧 ∈ 𝑋 ): relazione d’ordine
1. riflessiva: 𝑥 ≤ 𝑥 ;
2. antisimmetrica: 𝑥 ≤ 𝑦 ∧ 𝑦 ≤ 𝑥 =⇒ 𝑥 = 𝑦 ;
3. transitiva: 𝑥 ≤ 𝑦 ∧ 𝑦 ≤ 𝑧 =⇒ 𝑥 ≤ 𝑧 .
Si dice inoltre che la relazione d’ordine ≤ è una relazione d’ordine totale (o lineare) relazione d’ordine totale
se vale
4. dicotomia: 𝑥 ≤ 𝑦 ∨ 𝑦 ≤ 𝑥 .
16 1 fondamenti

Se ≤ è una relazione d’ordine su 𝑋 si definisce la relazione inversa ≥ ponendo


𝑥 ≥ 𝑦 quando 𝑦 ≤ 𝑥 . La proprietà riflessiva identifica gli ordinamenti larghi.
Si definisce il corrispondente ordinamento stretto < ponendo 𝑥 < 𝑦 quando
𝑥 ≤ 𝑦 ∧ 𝑥 ≠ 𝑦 e la relazione inversa > ponendo 𝑥 > 𝑦 quando 𝑦 < 𝑥 .

Teorema 1.13. La relazione ≤ è una relazione d’ordine totale su ℕ .

Dimostrazione. Il fatto che 𝑥 + 0 = 𝑥 dimostra la proprietà riflessiva.

Per la proprietà transitiva è sufficiente osservare che se 𝑦 = 𝑥 + 𝑘 e 𝑧 = 𝑦 + 𝑗


allora 𝑧 = 𝑥 + 𝑘 + 𝑗 .

Per la proprietà antisimmetrica supponiamo di avere 𝑥 = 𝑦 + 𝑘 e 𝑦 = 𝑥 + 𝑗 .


Deduciamo che 𝑥 + 𝑘 + 𝑗 = 𝑦 + 𝑘 + 𝑗 da cui 𝑥 = 𝑦 per la proprietà invariantiva
dell’addizione.

Per mostrare che l’ordinamento è totale dobbiamo invece procedere con una
dimostrazione per induzione. Per induzione su 𝑥 ∈ ℕ vogliamo mostrare che
per ogni 𝑦 ∈ ℕ si ha 𝑥 ≤ 𝑦 oppure 𝑦 ≤ 𝑥 . Se 𝑥 = 0 il fatto è ovvio in quanto
𝑦 = 𝑦 + 0 e quindi 𝑦 ≥ 0 per ogni 𝑦 ∈ ℕ . Supponiamo ora di sapere che 𝑥 ≤ 𝑦
oppure 𝑦 ≤ 𝑥 . Se 𝑦 ≤ 𝑥 significa che 𝑥 = 𝑦 + 𝑘 per un qualche 𝑘 ∈ ℕ . Ma
allora 𝑥 + 1 = 𝑦 + 𝑘 + 1 e quindi vale anche 𝑦 ≤ 𝑥 + 1. Se invece 𝑥 ≤ 𝑦 significa
che esiste 𝑘 ∈ ℕ per cui 𝑦 = 𝑥 + 𝑘 . Se 𝑘 ≠ 0 allora 𝑘 = 1 + 𝑗 con 𝑗 ∈ ℕ da
cui 𝑦 = 𝑥 + 1 + 𝑗 e dunque anche 𝑥 + 1 ≤ 𝑦 . Se 𝑘 = 0 allora 𝑥 = 𝑦 e dunque
𝑥 + 1 = 𝑦 + 1 che ci porta alla disuguaglianza inversa 𝑥 + 1 ≥ 𝑦 . In ogni caso il
passo induttivo è dimostrato.

Definizione 1.14 (maggiorante, minorante, massimo, minimo). Sia ≤ una


relazione d’ordine su un insieme 𝑋 e siano 𝑎 ∈ 𝑋 e 𝐴 ⊆ 𝑋 .
minorante
Diremo che 𝑎 è un minorante di 𝐴 e scriveremo:

𝑎≤𝐴

minimo se per ogni 𝑥 ∈ 𝐴 risulta 𝑎 ≤ 𝑥 . Se 𝑎 è un minorante e inoltre 𝑎 ∈ 𝐴 diremo che 𝑎 è il


minimo di 𝐴 e scriveremo:
𝑎 = min 𝐴.
maggiorante
Analogamente diremo che 𝑎 è un maggiorante di 𝐴 e scriveremo 𝑎 ≥ 𝐴 se 𝑎 ≤ 𝑥 per
massimo ogni 𝑥 ∈ 𝐴 e diremo che 𝑎 è il massimo di 𝐴 e scriveremo 𝑎 = max 𝐴 se 𝑎 ≥ 𝐴 e
𝑎 ∈ 𝐴.

Massimo e minimo di un insieme 𝐴, se esistono, sono unici. Infatti se 𝑥


e 𝑦 fossero due minimi di 𝐴 si avrebbe 𝑥 ≤ 𝑦 in quanto 𝑥 ≤ 𝐴 e 𝑦 ∈ 𝐴.
Analogamente si avrebbe 𝑦 ≤ 𝑥 e quindi 𝑥 = 𝑦 . Ragionamento analogo se 𝑥 e 𝑦
fossero due massimi.

Se 𝐴 è un insieme finito il massimo e il minimo esistono sempre.

Teorema 1.15 (principio del buon ordinamento). Sia 𝐴 ⊆ ℕ , 𝐴 ≠ ∅. Allora 𝐴 ha


minimo.
1.6 i numeri naturali 17

Dimostrazione. Osserviamo che se 𝑛 ∈ ℕ è un minorante di 𝐴 ⊆ ℕ allora o


𝑛 ∈ 𝐴 e quindi 𝑛 è il minimo di 𝐴 oppure anche 𝑛 + 1 è un minorante di 𝐴 in
quanto non ci sono numeri interi compresi tra 𝑛 e 𝑛 + 1.

Dunque se 𝐴 non avesse minimo, per il principio di induzione ogni 𝑛 ∈ ℕ


sarebbe un minorante di 𝐴. In tal caso 𝐴 dovrebbe essere vuoto perché se 𝑎 ∈ 𝐴
certamente 𝑎 + 1 non è un minorante di 𝐴.

Vogliamo ora dimostrare che l’insieme dei numeri naturali è sostanzialmente


unico nel senso che se ci sono due insiemi che soddisfano gli assiomi di Peano
allora è possibile mettere in corrispondenza gli elementi dei due insiemi in
modo che lo zero vada in zero e numeri corrispondenti abbiano successori
corrispondenti.

Teorema 1.16 (unicità dei numeri naturali). Se ℕ e ℕ0 sono due insiemi che
soddisfano gli assiomi di Peano con zero 0 ∈ ℕ e 00 ∈ ℕ0 e funzioni successore 𝜎 su
ℕ e 𝜎0 su ℕ0 allora esiste una funzione bigettiva 𝑓 : ℕ → ℕ0 tale che 𝑓 (0) = 00 e
𝑓 (𝜎(𝑛)) = 𝜎0( 𝑓 (𝑛)).

Dimostrazione. Possiamo definire 𝑓 per induzione:


(
𝑓 (0) = 00
𝑓 (𝜎(𝑛)) = 𝜎0( 𝑓 (𝑛))

così rimane solo da dimostrare che 𝑓 è una bigezione.

Per dimostrare che 𝑓 è iniettiva consideriamo l’insieme

𝐴 = {𝑎 ∈ ℕ : ∃𝑏 ∈ ℕ , 𝑏 ≠ 𝑎, 𝑓 (𝑎) = 𝑓 (𝑏)}.

Se tale insieme è vuoto allora 𝑓 è effettivamente iniettiva. Supponiamo allora


per assurdo che 𝐴 sia vuoto. In tal caso possiamo considerare il minimo
𝑎 = min 𝐴 (grazie al teorema 1.15). Dovrà quindi esistere 𝑏 ∈ ℕ tale che 𝑏 ≠ 𝑎 e
𝑓 (𝑏) = 𝑓 (𝑎). Ovviamente anche 𝑏 ∈ 𝐴 e quindi dovrà essere 𝑏 > 𝑎 in quanto
𝑎 è il minimo. Dunque 𝑏 > 0 e 𝑓 (𝑏) = 𝑓 (𝜎(𝑏 − 1)) = 𝜎0( 𝑓 (𝑏 − 1)). Se 𝑎 = 0
abbiamo 𝑓 (𝑎) = 00 e quindi da 𝑓 (𝑎) = 𝑓 (𝑏) otteniamo che 00 è nell’immagine
di 𝜎0 che è contrario agli assiomi di Peano. Se invece 𝑎 > 0 si avrà, come per 𝑏 ,
𝑓 (𝑎) = 𝜎0( 𝑓 (𝑎 − 1)) e dunque 𝜎0( 𝑓 (𝑎 − 1)) = 𝜎0( 𝑓 (𝑏 − 1)). Per l’iniettività di 𝜎0
si deduce 𝑓 (𝑎 − 1) = 𝑓 (𝑏 − 1) da cui 𝑎 − 1 ∈ 𝐴. Ma questo è assurdo in quanto 𝑎
era il minimo di 𝐴.

Per dimostrare che 𝑓 è surgettiva consideriamo l’immagine 𝐵0 = 𝑓 (ℕ ) e usiamo


il principio di induzione su ℕ0 per dimostrare che 𝐵0 = ℕ0. Per prima cosa
00 ∈ 𝐵0 in quanto 00 = 𝑓 (0). Se poi 𝑛 0 ∈ 𝐵0 allora esiste 𝑛 ∈ ℕ tale che 𝑓 (𝑛) = 𝑛 0.
Ma allora 𝑓 (𝜎(𝑛)) = 𝜎0( 𝑓 (𝑛)) = 𝜎0(𝑛 0) e dunque anche 𝜎0(𝑛 0) ∈ 𝐵.

Vogliamo ora dimostrare che i numeri naturali possono essere utilizzati per
contare gli elementi degli insiemi finiti.
18 1 fondamenti

Definizione 1.17 (numero di elementi). Se 𝑛 ∈ ℕ denotiamo con

[𝑛] = {0 , 1 , . . . , 𝑛 − 1}

l’insieme dei primi 𝑛 numeri naturali. Questo è il prototipo di insieme con 𝑛 elementi.
Allora formalmente andremo a identificare #[𝑛] con 𝑛 e dunque scriveremo

#𝐴 = 𝑛, #𝐴 ≥ 𝑛, #𝐴 ≤ 𝑛

per significare rispettivamente

#𝐴 = #[𝑛], #𝐴 ≥ #[𝑛], #𝐴 ≤ #[𝑛].

Il simbolo ℵ è la prima lettera dell’alfa- La cardinalità di ℕ viene a volte indicata con il simbolo ℵ0 dunque potremo scrivere
beto ebraico e si legge aleph.
Nel seguente teorema dimostriamo che
ℵ0 è la più piccola cardinalità infinita. #𝐴 = ℵ0 , #𝐴 ≤ ℵ0 , #𝐴 ≥ ℵ0
Si potrebbe anche dimostrare che deve
esistere una cardinalità ℵ1 > ℵ0 che è per significare rispettivamente
la più piccola cardinalità maggiore di
ℵ0 . Sappiamo che #P(ℕ ) > #ℕ ma pur- # 𝐴 = #ℕ , # 𝐴 ≤ #ℕ , # 𝐴 ≥ #ℕ .
troppo non è possibile dimostrare che
#ℵ1 = #P(ℕ ) (questa si chiama ipotesi del
continuo in quanto vedremo nel teore-
ma 3.24 che #P(ℕ ) = #ℝ e l’insieme ℝ Lemma 1.18. Per ogni 𝑛 ∈ ℕ l’insieme [𝑛] = {0 , 1 , 2 , . . . , 𝑛 − 1} è finito.
viene chiamato continuo là dove ℕ viene
chiamato discreto). Dunque l’ipotesi del
continuo è un ulteriore assioma che po- Dimostrazione. Lo possiamo dimostrare per induzione su 𝑛 ∈ ℕ . Per 𝑛 = 0 si
trebbe essere aggiunto agli assiomi della ha [𝑛] = ∅ ed è ovvio che ogni funzione 𝑓 : ∅ → ∅ è bigettiva. Dunque [0] = ∅ è
teoria degli insiemi: non esistono insiemi
con cardinalità strettamente compresa
finito.
tra le cardinalità di ℕ e di P(ℕ ).
Supponiamo allora che [𝑛] sia finito e supponiamo per assurdo che [𝑛 + 1]
sia infinito. Allora esiste 𝑓 : [𝑛 + 1] → [𝑛 + 1] iniettiva ma non surgettiva.
Se componiamo 𝑓 con la funzione 𝑠 che scambia 𝑛 con 𝑓 (𝑛) otteniamo una
funzione 𝑔 = 𝑠 ◦ 𝑓 tale che 𝑔(𝑛) = 𝑛 . Se 𝑓 era iniettiva ma non surgettiva anche
𝑔 mantiene le due proprietà. Inoltre 𝑔 può essere ristretta a [𝑛] (in quanto
𝑔(𝑘) = 𝑛 solo per 𝑘 = 𝑛 visto che 𝑔 è iniettiva): 𝑔 : [𝑛] → [𝑛] e anche la funzione
ristretta risulterebbe essere iniettiva e suriettiva. Ma questo è assurdo perché
per ipotesi induttiva [𝑛] è finito.

Teorema 1.19 (caratterizzazione insiemi finiti). Un insieme 𝐴 è infinito (nel senso


di Dedekind, definizione 1.8) se e solo se #𝐴 ≥ ℵ0 . Viceversa 𝐴 è finito se e solo se
esiste 𝑛 ∈ ℕ tale che #𝐴 = 𝑛 .

Dimostrazione. Se #𝐴 ≥ ℵ0 significa che esiste una funzione iniettiva 𝑓 : ℕ → 𝐴.


Dunque se definiamo 𝜎 : 𝐴 → 𝐴 come
(
𝑎 se 𝑎 ∉ 𝑓 (ℕ )
𝜎(𝑎) =
𝑓 (𝑛 + 1) se 𝑎 = 𝑓 (𝑛)

otteniamo una funzione iniettiva ma non suriettiva (in quanto 𝜎(𝐴) = 𝐴\{ 𝑓 (0)}).
Dunque se #𝐴 ≥ ℵ0 deduciamo che 𝐴 è infinito.
1.7 insiemi prodotto 19

Viceversa se 𝐴 è infinito significa che esiste 𝜎 : 𝐴 → 𝐴 iniettiva ma non suriettiva.


Preso 𝛼 ∈ 𝐴 \ 𝜎(𝐴) possiamo definire induttivamente 𝑓 : ℕ → 𝐴 come segue:
(
𝑓 (0) = 𝛼
𝑓 (𝑛 + 1) = 𝜎( 𝑓 (𝑛))

e possiamo verificare che 𝑓 è iniettiva. Infatti supponiamo che sia 𝑓 (𝑛) = 𝑓 (𝑚).
Se 𝑓 (𝑛) = 𝑓 (𝑚) = 𝛼 allora necessariamente 𝑛 = 𝑚 = 0 perché 𝑓 (𝑛) = 𝛼 è
equivalente a 𝑛 = 0 visto che 𝜎 non assume mai il valore 𝛼 . Se 𝑓 (𝑛) = 𝑓 (𝑚) ≠ 𝛼
significa dunque che 𝑛 > 0 e 𝑚 > 0 ma allora 𝑓 (𝑛) = 𝜎( 𝑓 (𝑛 − 1)) e 𝑓 (𝑚) =
𝜎( 𝑓 (𝑚 − 1)) e dunque, essendo 𝜎 iniettiva, 𝑛 − 1 = 𝑚 − 1 da cui 𝑛 = 𝑚 . Dunque
se 𝐴 è infinito si ha #ℕ ≤ #𝐴 (significa in un certo senso che ℕ è il più piccolo
insieme infinito).

Dobbiamo ora caratterizzare gli insiemi finiti. Abbiamo già verificato che se
#𝐴 ≥ ℵ0 allora #𝐴 è infinito, dunque se #𝐴 è finito non può essere #𝐴 ≥ ℵ0 . Ma
Per dimostrare che ogni cardinalità può
da questo non siamo in grado di dedurre che #𝐴 < ℵ0 (vedi nota a margine).
essere confrontata con ogni altra bisogna
dimostrare che ogni insieme ammette un
Se #𝐴 = 𝑛 significa che #𝐴 = #[𝑛] e grazie al lemma 1.18 sappiamo che [𝑛] è buon ordinamento ovvero che ogni insie-
finito e dunque anche 𝐴 è finito. me può essere messo in corrispondenza
con un ordinale di Von Neumann cioè con
Supponiamo ora che 𝐴 sia un insieme per il quale per ogni 𝑛 ∈ ℕ si ha un insieme totalmente ordinato dalla re-
lazione di appartenenza ∈ e tale che ogni
#𝐴 ≠ 𝑛 . Dobbiamo dimostrare che 𝐴 è infinito. Per ogni 𝑛 ∈ ℕ scegliamo una elemento è anche un sottoinsieme. Gli
funzione iniettiva 𝑓𝑛 : [𝑛] → 𝐴. Dalle 𝑓𝑛 possiamo definire le funzioni iniettive ordinali di Von Neumann sono natural-
𝑔𝑛 : [𝑛] → 𝐴 in modo che 𝑔𝑛+1 sia una estensione di 𝑔𝑛 . Basterà infatti porre: mente uno contenuto nell’altro per cui
certamente hanno cardinalità confron-
tabili. Gli ordinali finiti non sono altro
( (
𝑔𝑛 (𝑘) se 𝑘 < 𝑛
𝑔0 = 𝑓0 , 𝑔𝑛+1 (𝑘) = che gli elementi di ℕ definiti mediante
min 𝑓𝑛+1 ([𝑛 + 1]) \ 𝑔𝑛 ([𝑛]) la proprietà 𝑛 + 1 = 𝑛 ∪ {𝑛}. E l’insie-
me ℕ stesso è il primo ordinale infinito
(che si denota con 𝜔 nel linguaggio degli
l’insieme 𝑓𝑛+1 ([𝑛 + 1]) \ 𝑔𝑛 ([𝑛]) essendo non vuoto in quanto # 𝑔𝑛 ([𝑛]) = 𝑛 < ordinali).
𝑛 + 1 = # 𝑓𝑛+1 ([𝑛 + 1]). Ma allora possiamo definire la funzione iniettiva qui si usa l’assioma della scelta 𝐴𝐶 .
𝑔 : ℕ → 𝐴 come 𝑔(𝑛) = 𝑔𝑛+1 (𝑛) ottenendo #𝐴 ≥ #ℕ e dunque 𝐴 è Dedekind
infinito.

1.7 insiemi prodotto

Abbiamo già visto che se 𝐴 è un insieme possiamo definire l’insieme delle


coppie di elementi di 𝐴 con il prodotto tra insiemi: 𝐴 × 𝐴. Cosa rappresenta
un prodotto ripetuto? Gli insiemi (𝐴 × 𝐴) × 𝐴 e 𝐴 × (𝐴 × 𝐴) non sono uguali,
in quanto il primo è un insieme di coppie il cui primo elemento è a sua volta
una coppia, il secondo insieme invece è un insieme di coppie il cui secondo
elemento è una coppia:

(𝐴 × 𝐴) × 𝐴 = {((𝑎0 , 𝑎1 ), 𝑎2 ) : 𝑎 0 , 𝑎1 , 𝑎2 ∈ 𝐴},
𝐴 × (𝐴 × 𝐴) = {(𝑎0 , (𝑎1 , 𝑎2 )) : 𝑎0 , 𝑎1 , 𝑎2 ∈ 𝐴}.

Questi insiemi sono molto simili tra loro e potrebbero essere identificati. Un’al-
tro insieme molto simile è l’insieme 𝐴3 . Se pensiamo al numero 3 come
20 1 fondamenti

all’insieme 3 = {0 , 1 , 2} l’insieme 𝐴3 rappresenta l’insieme di tutte le fun-


zioni 𝒂 : 0 , 1 , 2 → 𝐴. La funzione 𝒂 è univocamente determinata dal suo
valore nei tre punti del dominio: 𝑎 0 = 𝒂(0), 𝑎 1 = 𝒂(1), 𝑎 2 = 𝒂(2) in quanto
𝒂 = {0 ↦→ 𝑎0 , 1 ↦→ 𝑎 1 , 2 ↦→ 𝑎2 }. Possiamo quindi identificare 𝒂 con la tripla (o
vettore) di valori:
𝒂 = (𝑎 0 , 𝑎1 , 𝑎2 ), 𝑎0 , 𝑎1 , 𝑎2 ∈ 𝐴.
I valori 𝑎 0 , 𝑎 1 e 𝑎 2 vengono anche chiamate coordinate o componenti del vettore
coordinate, componenti, vettore
𝒂 . In effetti l’insieme 𝐴2 può essere identificato con 𝐴 × 𝐴, l’insieme 𝐴3 sarà
l’insieme delle triple di elementi di 𝐴 e in generale se 𝑛 ∈ ℕ identifichiamo con
𝐴𝑛 l’insieme delle 𝑛 -uple (leggi: ennuple) di elementi di 𝐴:

𝒂 ∈ 𝐴𝑛 ⇐⇒ 𝒂 = (𝑎 0 , 𝑎1 , . . . , 𝑎 𝑛−1 ).

1.8 la retta dei numeri reali

L’insieme ℝ dei numeri reali è un modello della retta geometrica che, a sua volta,
viene utilizzata per modellizzare tutte le quantità che si ottengono da misure
fisiche. In effetti l’esistenza di un insieme ℝ con le proprietà che andremo
ad elencare nella sezione seguente può essere intuitivamente giustificata dal
processo con cui si costruisce (fisicamente!) un righello. Presa una retta si inizia
col segnare su di essa un punto di riferimento che chiamiamo 0. Dopodiché
osserviamo che il punto 0 (come ogni altro punto) divide la retta in due parti.
In modo arbitrario chiamiamo positivi i punti che si trovano da una parte
e negativi i punti che si trovano dall’altra parte. Sulla semiretta dei numeri
positivi scegliamo, arbitrariamente, un punto 1. Il segmento compreso tra i
punti 0 e 1 sarà la nostra unità di misura.

L’addizione viene definita utilizzando i movimenti rigidi. Traslando il punto 1


di una unità alla volta si ottengono tutti i numeri naturali. Traslando all’indietro
si ottengono i numeri interi. Assumendo che tra due punti qualunque esistano
sempre punti intermedi (divisibilità) e assumendo che suddividendo la retta in
due parti esista sempre un punto di suddivisione (continuità) mostreremo come
si può suddividere ogni segmento in 𝑛 parti uguali per ogni numero naturale
𝑛 . In tal modo potremo definire i numeri razionali e la moltiplicazione per un
numero razionale. Con una estensione continua riusciremo quindi a definire la
moltiplicazione tra numeri reali. Osserveremo poi che la struttura moltiplicativa
dei numeri reali positivi soddisfa gli stessi assiomi della struttura additiva dei
reali e che quindi la costruzione fatta per costruire la moltiplicazione si può
ripetere identica per costruire l’elevamento a potenza.

Se volessimo postulare le proprietà delle traslazioni (cioè i movimenti rigidi


della retta in sé) potremmo farlo come segue. L’insieme 𝑇 di tutte le traslazioni
di ℝ è un sottoinsieme di ℝℝ (cioè 𝑇 è un insieme di funzioni 𝑡 : ℝ → ℝ) che
soddisfa le seguenti proprietà:

1. l’identità 𝑡(𝑥) = 𝑥 è in 𝑇 ;
2. dati 𝑥, 𝑦 ∈ ℝ esiste una unica 𝑡 ∈ 𝑇 tale che 𝑡(𝑥) = 𝑦 ;
3. se 𝑡1 , 𝑡2 ∈ 𝑇 allora 𝑡1 ◦ 𝑡2 ∈ 𝑇 .
1.8 la retta dei numeri reali 21

Si potrà allora fissare un punto 0 ∈ ℝ e definire 𝑥 + 𝑦 = 𝑡0 𝑦 (𝑥) dove 𝑡0 𝑦 è l’unica


traslazione che manda 0 in 𝑦 . E’ un esercizio molto interessante dedurre le
proprietà di gruppo dell’addizione dalle proprietà delle traslazioni.

Definizione 1.20 (gruppo). Un insieme 𝑋 su cui è definita una operazione ∗ si dice una operazione ∗ su 𝑋 è una funzione
∗ : 𝑋 × 𝑋 → 𝑋 per la quale si usa la
essere un gruppo se l’operazione ha le seguenti proprietà: notazione infissa: 𝑥 ∗ 𝑦 = ∗(𝑥, 𝑦).

1. associativa: ∀𝑥, 𝑦, 𝑧 ∈ 𝑋 : (𝑥 ∗ 𝑦) ∗ 𝑧 = 𝑥 ∗ (𝑦 ∗ 𝑧); gruppo


2. esistenza elemento neutro: ∃𝑒 ∈ 𝑋 : ∀𝑥 ∈ 𝑋 : 𝑒 ∗ 𝑥 = 𝑥 ∗ 𝑒 = 𝑥 ;
3. esistenza inverso: ∀𝑥 ∈ 𝑋 : ∃𝑦 ∈ 𝑋 : 𝑥 ∗ 𝑦 = 𝑦 ∗ 𝑥 = 𝑒 .
gruppo abeliano
Inoltre il gruppo si dice essere abeliano o commutativo se vale la proprietà:

4. commutativa: ∀𝑥, 𝑦 ∈ 𝑋 : 𝑥 ∗ 𝑦 = 𝑦 ∗ 𝑥 .

Quando l’operazione viene denotata con il simbolo + (addizione) diremo che il gruppo è
additivo, denoteremo con 0 (zero) l’elemento neutro e l’inverso verrà chiamato opposto.
Se invece si usa il simbolo · (moltiplicazione) diremo che il gruppo è moltiplicativo,
l’elemento neutro potrà essere denotato con il simbolo 1 (uno o unità) e l’inverso potrà
essere chiamato reciproco.

L’elemento neutro di un gruppo è unico. Se infatti 𝑥 e 𝑦 fossero due elementi


neutri si avrebbe 𝑥 = 𝑥 ∗ 𝑦 = 𝑦 . Anche l’inverso è unico: infatti se 𝑦 e 𝑧 fossero
due inversi di 𝑥 si avrebbe 𝑦 = 𝑦 ∗ 𝑥 ∗ 𝑧 = 𝑧 .
gruppo ordinato

Definizione 1.21 (gruppo ordinato). Diremo che 𝑋 è un gruppo ordinato se 𝑋 è


un gruppo (con operazione ∗ ed elemento neutro 𝑒 ) se è anche un insieme ordinato (con
relazione ≤ ) e se vale la proprietà:

1. monotonia: se 𝑥 ≤ 𝑦 allora per ogni 𝑧 si ha:

𝑥∗𝑧 ≤ 𝑦∗𝑧 e 𝑧 ∗ 𝑥 ≤ 𝑧 ∗ 𝑦.
ordinamento denso

Definizione 1.22 (ordinamento denso). Un ordinamento ≤ si dice essere densa o


ordinamento continuo
divisibile se esistono sempre punti intermedi: se 𝑥 < 𝑦 esiste 𝑧 tale che 𝑥 < 𝑧 < 𝑦 .
Gli assiomi della teoria degli insiemi che
abbiamo introdotto finora non possono
Definizione 1.23 (ordinamento continuo). Un ordinamento ≤ si dice essere conti- garantire l’esistenza di insiemi infiniti
in quanto un universo fatto solo da in-
nuo (o Dedekind-completo) se dati comunque 𝐴, 𝐵 sottoinsiemi non vuoti di 𝑋 tali
siemi finiti soddisfa tutti gli assiomi. E’
che per ogni 𝑎 ∈ 𝐴 e per ogni 𝑏 ∈ 𝐵 risulta 𝑎 ≤ 𝑏 (concisamente potremmo scrivere quindi necessario un assioma di infinito
𝐴 ≤ 𝐵) allora esiste 𝑐 ∈ 𝑋 tale che per ogni 𝑎 ∈ 𝐴 e ogni 𝑏 ∈ 𝐵 si ha 𝑎 ≤ 𝑐 ≤ 𝑏 che garantisca l’esistenza di almeno un
(concisamente 𝐴 ≤ 𝑐 ≤ 𝐵). insieme infinito. Usualmente tale insie-
me è l’insieme ℕ dei numeri naturali da
cui, con una costruzione non semplice,
Possiamo allora introdurre come assioma l’esistenza dei numeri reali. si può costruire l’insieme ℝ dei numeri
reali. Tuttavia visto che l’insieme ℝ è il
fondamento dell’analisi matematica re-
Assioma 1.24 (numeri reali). Esiste un insieme ℝ con una operazione di gruppo + putiamo sia piuttosto naturale assumere
l’esistenza di ℝ come assioma e ritrova-
(addizione) ed una relazione d’ordinamento totale ≤ che rendono ℝ un gruppo ordinato,
re (come faremo tra poco) l’insieme ℕ
denso e continuo (vedremo che la proprietà commutativa è valida di conseguenza). all’interno di ℝ.
Chiamiamo 0 l’elemento neutro dell’addizione e supponiamo inoltre che esista almeno opposto
un altro punto 1 ∈ 𝑋 tale che 1 > 0 che chiameremo unità.
sottrazione
22 1 fondamenti

L’inverso additivo di un elemento 𝑥 sarà chiamato opposto e verrà denotato


con −𝑥 , si avrà quindi 𝑥 + (−𝑥) = 0. Potremo quindi definire l’operazione di
sottrazione:
𝑥 − 𝑦 = 𝑥 + (−𝑦).

positivo Diremo che un numero 𝑥 ∈ ℝ è positivo se 𝑥 > 0 e negativo se 𝑥 < 0.


Se 𝑥 ≤ 𝑦 sommando −𝑥 da ambo i lati si ottiene 0 ≤ 𝑦 − 𝑥 e sommando ancora
−𝑦 si ottiene −𝑦 ≤ −𝑥 . Lo stesso vale con le disuguaglianze strette e con le
disuguaglianze inverse.

1.9 i numeri naturali e interi

Vediamo adesso come identificare, all’interno dei numeri reali ℝ, l’insieme dei
numeri naturali ℕ .
numeri naturali
Definizione 1.25 (numeri naturali). Un sottoinsieme 𝐴 ⊆ ℝ si dice essere induttivo
se valgono le due proprietà:

0 ∈ 𝐴,
𝑛 ∈ 𝐴 =⇒ 𝑛 + 1 ∈ 𝐴.

La famiglia di tutti i sottoinsiemi induttivi di ℝ non è vuota in quanto ℝ stesso è


induttivo. Definiamo ℕ come l’intersezione di tutti i sottoinsiemi induttivi di ℝ:
\ \
ℕ= 𝐴= {𝐴 ⊆ P(ℝ) : 𝐴 induttivo}.
𝐴 induttivo

Ovviamente ℕ deve essere a sua volta induttivo (lo si verifichi) e quindi è il “più piccolo”
ℕ sottoinsieme induttivo di ℝ.

Oltre ai numeri 0 e 1 che abbiamo già definito, si definiscono le altre cifre


decimali 2 , 3 , 4 , 5 , 6 , 7 , 8 , 9 direttamente come segue:

2 = 1 + 1, 3 = 2 + 1, 4 = 3 + 1, 5 = 4 + 1,
6 = 5 + 1, 7 = 6 + 1, 8 = 7 + 1, 9 = 8 + 1.

E’ facile dimostrare che l’insieme ℕ appena definito soddisfa gli assiomi di


Giuseppe Peano (1858–1932), matemati- Peano in particolare vale il seguente.
co torinese, contribuì a porre i fondamen-
ti della logica matematica. La notazione Teorema 1.26 (principio di induzione). Se 𝑃(𝑛) è un predicato nella variabile 𝑛 ∈ ℕ
∃ per il quantificatore universale si de-
tale che:
ve a lui. E sua l’assiomatizzazione che
caratterizza i numeri naturali: 1. 𝑃(0) è vero;
1. 0 ∈ ℕ ; 2. per ogni 𝑛 ∈ ℕ se 𝑃(𝑛) è vero allora anche 𝑃(𝑛 + 1) è vero.
2. se 𝑛 ∈ ℕ allora 𝑛 + 1 ∈ ℕ ;
3. se 𝑛, 𝑚 ∈ ℕ e 𝑛 + 1 = 𝑚 + 1 allora Allora 𝑃(𝑛) è vero per ogni 𝑛 ∈ ℕ .
𝑛 = 𝑚;
4. se 𝑛 ∈ ℕ allora 𝑛 + 1 ≠ 0;
Dimostrazione. Si consideri l’insieme 𝐴 = {𝑛 ∈ ℕ : 𝑃(𝑛) è vera}. Le ipotesi del
5. se 𝐴 ⊆ ℕ è induttivo allora 𝐴 =
ℕ. principio di induzione garantiscono che 𝐴 sia induttivo (definizione 1.25) e
quindi che ℕ ⊆ 𝐴. Dunque 𝑃(𝑛) è vera per ogni 𝑛 ∈ ℕ .
1.9 i numeri naturali e interi 23

Utilizzando il principio di induzione si possono dimostare le seguenti ben note


proprietà dei numeri naturali.

Teorema 1.27 (proprietà dei numeri naturali). Se 𝑛, 𝑚 ∈ ℕ si ha:

1. 𝑛 ≥ 0;
2. 𝑛 + 𝑚 ∈ ℕ;
3. 𝑛 + 𝑚 = 𝑚 + 𝑛;
4. se 𝑛 ≥ 𝑚 allora 𝑛 − 𝑚 ∈ ℕ ;
5. se 𝑛 > 𝑚 allora 𝑛 ≥ 𝑚 + 1.

Dimostrazione. Per il primo punto: ovviamente 0 ≥ 0. D’altra parte se 𝑛 ≥ 0


allora 𝑛 + 1 > 𝑛 + 0 ≥ 0. Dunque per induzione 𝑛 ≥ 0 per ogni 𝑛 ∈ ℕ .

Per il secondo punto consideriamo il predicato

𝑃(𝑛) : ∀𝑚 ∈ ℕ : 𝑚 + 𝑛 ∈ ℕ .

Chiaramente 𝑃(0) è vero in quanto 𝑚 + 0 = 𝑚 ∈ ℕ se 𝑚 ∈ ℕ . Ma se 𝑃(𝑛)


è verificata allora 𝑚 + 𝑛 ∈ ℕ e visto che ℕ è induttivo anche 𝑚 + (𝑛 + 1) =
(𝑚 + 𝑛) + 1 ∈ ℕ . Dunque vale 𝑃(𝑛 + 1) e dunque per ogni 𝑛 vale 𝑃(𝑛).
Per dimostrare la proprietà commutativa possiamo innanzitutto dimostrare
per induzione che 𝑛 + 1 = 1 + 𝑛 per ogni 𝑛 ∈ ℕ (lo si faccia per esercizio).
Dopodiché si considera la proposizione

𝑃(𝑛) : ∀𝑚 ∈ ℕ : 𝑛 + 𝑚 = 𝑚 + 𝑛.

𝑃(0) è vera per le proprietà dell’elemento neutro e se 𝑃(𝑛) è vera allora 𝑛+ 1 +𝑚 =


1 + 𝑛 + 𝑚 = 1 + 𝑚 + 𝑛 = 𝑚 + 1 + 𝑛 = 𝑚 + 𝑛 + 1 e quindi anche 𝑃(𝑛 + 1) è vera.
Il risultato segue per induzione.

Per il quarto punto si verifica innanzitutto che se 𝑛 ≥ 1 allora 𝑛 − 1 ∈ ℕ (lo si


dimostra per induzione osservando che (𝑛 + 1) − 1 = 𝑛 ∈ ℕ ). Dopodiché si
considera il predicato

𝑃(𝑛) : ∀𝑚 ∈ ℕ : 𝑚 ≥ 𝑛 =⇒ 𝑚 − 𝑛 ∈ ℕ .

E’ facile verificare che 𝑃(0) è vero. Supponiamo allora che 𝑃(𝑛) sia vero e
consideriamo 𝑃(𝑛 + 1) : 𝑚 ≥ 𝑛 + 1 =⇒ 𝑚 − (𝑛 + 1) ∈ ℕ . Se 𝑚 ≥ 𝑛 + 1 allora
certamente 𝑚 − 1 ≥ 𝑛 e 𝑚 ≠ 0. Abbiamo già dimostrato che 𝑚 − 1 ∈ ℕ e quindi,
applicando 𝑃(𝑛), possiamo dedurre che 𝑚 − 1 −𝑛 ∈ ℕ . Ma 𝑚 − 1 −𝑛 = 𝑚 −(𝑛 + 1)
e quindi abbiamo verificato 𝑃(𝑛 + 1).

L’ultima affermazione è equivalente a dire che se 𝑚 ∈ ℕ non ci sono numeri


naturali strettamente compresi tra 𝑚 e 𝑚 + 1. Sottraendo 𝑚 ci si riconduce a
osservare che non ci sono naturali tra 0 e 1. Ma se 0 < 𝑥 < 1 allora 𝑥 − 1 < 0
non può essere un naturale ed essendo diverso da 0 deduciamo che 𝑥 ∉ ℕ .

Esercizio 1.28. Dimostrare, utilizzando il principio di induzione, la seguente


proposizione:

∀𝑛 ∈ ℕ : ((∃𝑚 ∈ ℕ : 𝑛 = 𝑚 + 𝑚) ∨ (∃𝑚 : 𝑛 = 𝑚 + 𝑚 + 1)).


24 1 fondamenti

prodotto
Se 𝑛 ∈ ℕ e 𝑥 ∈ ℝ si può definire induttivamente il prodotto 𝑛𝑥 (a volte scriveremo
𝑛 · 𝑥 per motivi tipografici) mediante le seguenti proprietà ricorsive:
(
0𝑥 = 0,
(𝑛 + 1)𝑥 = 𝑛𝑥 + 𝑥

cosicché si avrà: 1 𝑥 = 𝑥 , 2 𝑥 = 𝑥 + 𝑥 , 3 𝑥 = 𝑥 + 𝑥 + 𝑥 , . . . Per induzione è facile


dimostrare 𝑛(𝑥 + 𝑦) = 𝑛𝑥 + 𝑛 𝑦 e che (𝑛 + 𝑚)𝑥 = 𝑛𝑥 + 𝑚𝑥 . Di conseguenza
𝑛(−𝑥) = −(𝑛𝑥). Dalle proprietà dell’iterata si ha la proprietà associativa del
prodotto
(𝑛𝑚)𝑥 = 𝑛(𝑚𝑥).
Inoltre se 0 ≤ 𝑥 ≤ 𝑦 e 𝑛 ≤ 𝑚 si ha la proprietà di monotonia:

𝑛𝑥 ≤ 𝑚 𝑦

(e se 𝑥 < 𝑦 oppure 𝑛 < 𝑚 la disuguaglianza è stretta). In particolare se 𝑛𝑥 = 0


se e solo se 𝑛 = 0 oppure 𝑥 = 0.

Per rappresentare in modo efficiente tutti i numeri naturali utilizziamo la


notazione posizionale decimale notazione posizionale decimale. Il numero rappresentato da una sequenza finita
di cifre decimali può essere definito ricorsivamente: una sequenza di una sola
cifra rappresenta il numero corrispondente alla cifra stessa, una sequenza di
𝑛 + 1 cifre rappresenta il numero rappresentato dalle prime 𝑛 cifre, moltiplicato
per (9 + 1) (dieci) e sommato alla ultima cifra. Ad esempio la sequenza di cifre
4701 (leggi: quattromilasettecentouno) significa

4701 = ((4 · (9 + 1) + 7) · (9 + 1) + 0) · (9 + 1) + 1.

Osservando che 10 = 9 + 1 si scriverà

4701 = ((4 · 10 + 7) · 10 + 0) · 10 + 1.

Se 𝑚, 𝑛 ∈ ℕ con 𝑚 < 𝑛 si ha 𝑚 − 𝑛 = −(𝑛 − 𝑚) che è l’opposto di un numero


numeri interi naturale. L’insieme dei naturali e dei loro opposti si chiama insieme dei numeri
ℤ da zahlen che significa “numeri” in interi e si denota con ℤ:
tedesco.
ℤ = ℕ − ℕ = ℕ ∪ (−ℕ ).

Possiamo facilmente estendere la moltiplicazione dai naturali agli interi con la


seguente regola:
(−𝑛) · 𝑚 = −(𝑛 · 𝑚).
Se 𝑚, 𝑛 sono numeri interi anche 𝑚 + 𝑛 , 𝑚 − 𝑛 e 𝑚 · 𝑛 sono numeri interi.
I numeri interi sono dunque un gruppo additivo e totalmente ordinato. Si
potrebbe anche verificare che ℤ è continuo ma, a differenza di ℝ, non soddisfa
la proprietà di densità: se 𝑛 è intero, tra 𝑛 e 𝑛 + 1 non ci sono altri numeri
interi.
anello

Diremo anche che ℤ è un anello abeliano con unità, in base alla seguente.
1.9 i numeri naturali e interi 25

Definizione 1.29 (anello). Sia 𝐴 un insieme su cui sono definite due operazioni: +
(addizione) e · (moltiplicazione). Diremo che 𝐴 è un anello se 𝐴 è un gruppo abeliano
rispetto alla addizione, se la moltiplicazione è associativa (𝑥 · 𝑦) · 𝑧 = 𝑥 · (𝑦 · 𝑥) e se vale
la proprietà distributiva 𝑥 · (𝑦 + 𝑧) = 𝑥 · 𝑦 + 𝑥 · 𝑧 , (𝑥 + 𝑦) · 𝑧 = 𝑥 · 𝑧 + 𝑦 · 𝑧 . Se inoltre
la moltiplicazione è commutativa diremo che 𝐴 è un anello abeliano. Se inoltre esiste
un elemento 1 ∈ 𝐴 neutro per la moltiplicazione diremo che 𝐴 è un anello con unità.

Se 𝐴 è un anello allora si può dimostrare che valgono anche le usuali proprietà:

0 · 𝑥 = 𝑥 · 0 = 0, (−1) · 𝑥 = 𝑥 · (−1) = −𝑥.

Per la prima abbiamo:

0 · 𝑥 = 0 · 𝑥 + 𝑥 + (−𝑥) = (0 + 1) · 𝑥 + (−𝑥) = 𝑥 + (−𝑥) = 0

e scrivendo gli addendi in ordine opposto si ottiene anche 𝑥 · 0 = 0. Allora


possiamo dimostrare anche la seconda proprietà:

(−1) · 𝑥 = (−1) · 𝑥 + 𝑥 + (−𝑥) = (−1 + 1) · 𝑥 + (−𝑥) = 0 + (−𝑥) = −𝑥

e anche in questo caso scrivendo gli addendi in ordine opposto si ottiene


𝑥 · (−1) = −𝑥 .

Se 𝑛, 𝑚 ∈ ℤ con 𝑚 ≠ 0 e se esiste 𝑘 ∈ ℤ tale che 𝑛 = 𝑘𝑚 diremo che 𝑛 è un multiplo


multiplo di 𝑚 oppure che 𝑚 è un divisore di 𝑛 e scriveremo:
divisore
𝑛
= 𝑘.
𝑚

I multipli di 2 si chiamano numeri pari, gli interi non pari si chiamano dispari. pari

Iterando la moltiplicazione si ottiene l’elevamento a potenza; fissato 𝑚 ∈ ℕ dispari


definiamo, per ogni 𝑛 ∈ ℕ la potenza 𝑚 𝑛 ricorsivamente come segue:
elevamento a potenza
(
𝑚0 = 1
𝑚 𝑛+1 = 𝑚 · 𝑚 𝑛 .

Si avrà quindi: 𝑚 0 = 1, 𝑚 1 = 𝑚 , 𝑚 2 = 𝑚 · 𝑚 , 𝑚 3 = 𝑚 · 𝑚 · 𝑚 , . . .

Possiamo utilizzare le potenze di 10 per rappresentare in maniera alternativa le


sequenze decimali:

4701 = 4 · 103 + 7 · 102 + 0 · 10 + 1.

Definiamo il fattoriale denotato con 𝑛 ! (leggi: 𝑛 fattoriale) tramite la seguente fattoriale

(
0! = 1
(𝑛 + 1)! = (𝑛 + 1)𝑛 !

in tal modo risulta che 𝑛 ! sia il prodotto dei primi 𝑛 numeri naturali positivi:

𝑛 ! = 1 · 2 · 3 · · · 𝑛.
26 1 fondamenti

Tabella 1.4: I primi valori (e nomi) di 𝑛 0 1 2 3 4


alcune delle sequenze che abbiamo defi-
𝑛+5 5 6 7 8 9
nito.
2𝑛 1 2 4 8 16
25+𝑛 32 64 128 256 512
210+𝑛 1024 2048 4096 8192 16384
215+𝑛 32768 65536 131072 262144 524288
220+𝑛 1048576 2097152 4194304 8388608 16777216
3𝑛 1 3 9 27 81
35+𝑛 243 729 2187 6561 19683
𝑛! 1 1 2 6 24
(5 + 𝑛)! 120 720 5040 40320 362880
(10 + 𝑛)! 3628800 39916800 479001600 6227020800 87178291200
103𝑛 K (chilo) M (mega) G (giga) T (tera)
103(𝑛+5) P (peta) E (exa) Z (zetta) Y (yotta)
210𝑛 1 Ki (chibi) Mi (mebi) Gi (gibi) Ti (tebi)
210(𝑛+5) Pi (pebi) Ei (exbi) Zi (zebi) Yi (yobi)

Esercizio 1.30. Utilizzando il principio di induzione si dimostri che per ogni 𝑛 ∈ ℕ :

2𝑛 > 𝑛, (𝑛 + 1)! ≥ 2𝑛 , 𝑛𝑛 ≥ 𝑛!

A volte sarà utile considerare anche i prodotti di solamente i numeri pari o i


semi fattoriale numeri dispari fino ad un certo numero 𝑛 . Questo si chiama semi fattoriale e
si indica con 𝑛 !!. Lo possiamo definire separatamente sui numeri pari (cioè i
numeri che si possono scrivere nella forma 2𝑛 con 𝑛 ∈ ℕ ) e i numeri dispari
(che scriviamo nella forma 2𝑛 + 1):

(2𝑛)!! = 2 · 4 · 6 · · · (2𝑛)
(2𝑛 + 1)!! = 1 · 3 · 5 · · · (2𝑛 + 1).

Osservazione 1.31. Si osservi che risulta

(2𝑛)!! = (2 · 1) · (2 · 2) · (2 · 3) · · · (2 · 𝑛) = 2𝑛 · 𝑛 !

mentre
2𝑛 · 𝑛 ! · (2𝑛 + 1)!! = (2𝑛)!! · (2𝑛 + 1)!! = (2𝑛 + 1)!
Queste formule permettono di esprimere il semi fattoriale utilizzando il fattoriale intero
e le potenze.

Esercizio 1.32. Si dia una definizione per induzione del semi fattoriale (separatamente
per i pari e per i dispari) e si dimostrino, per induzione, le formule nell’osservazione
precedente.

Se 𝑓 è una funzione definita sull’insieme [𝑛] = {0 , . . . , 𝑛 − 1} a valori in un


qualunque gruppo additivo (o moltiplicativo) sarà possibile introdurre una
notazione per ripetere le operazioni di somma (e prodotto) un numero arbitrario
1.9 i numeri naturali e interi 27

di volte:
𝑛−1
X
𝑓 (𝑘) = 𝑓 (0) + 𝑓 (1) + · · · + 𝑓 (𝑛 − 1) (1.6)
𝑘=0
𝑛−1
Y
𝑓 (𝑘) = 𝑓 (0) · 𝑓 (1) · · · 𝑓 (𝑛 − 1). (1.7)
𝑘=0

Formalmente questo può essere fatto tramite una definizione per induzione:

 −1
X  −1
Y
𝑓 (𝑘) = 0 , 𝑓 (𝑘) = 1 ,

 


 

𝑘=0 𝑘=0

 

! !
X𝑛 𝑛−1
X Y𝑛 𝑛−1
Y
𝑓 (𝑘) = 𝑓 (𝑘) + 𝑓 (𝑛); 𝑓 (𝑘) = 𝑓 (𝑘) · 𝑓 (𝑛).

 


 

 𝑘=0 𝑘=0  𝑘=0 𝑘=0
 

La variabile 𝑘 che si trova nelle formule (1.6) è muta: al suo posto si può utilizzare
qualunque altra variabile che non compaia altrove.

E’ naturalmente possibile anche fare una somma a partire da un indice diverso


da 0. Se 𝑎, 𝑏 ∈ ℤ porremo:

𝑏
X 𝑏−𝑎
X
𝑓 (𝑘) = 𝑓 (𝑎 + 𝑗).
𝑘=𝑎 𝑗=0

Dal punto di vista mnemonico abbiamo fatto un cambio di variabile 𝑗 = 𝑘 − 𝑎 :


per 𝑘 = 𝑎 si trova 𝑗 = 0 e per 𝑘 = 𝑏 si trova 𝑗 = 𝑏 − 𝑎 .

Esercizio 1.33. Convincersi che la somma è lineare:

𝑏
X 𝑏
X X 𝑏
X 𝑏
X
[ 𝑓 (𝑘) + 𝑔(𝑘)] = 𝑓 (𝑘) + 𝑔(𝑘), 𝑐 · 𝑓 (𝑘) = 𝑐 · 𝑓 (𝑘)
𝑘=𝑎 𝑘=𝑎 𝑘=𝑎 𝑘=𝑎 𝑘=𝑎

e additiva:
𝑐
X 𝑏
X 𝑐
X
𝑓 (𝑘) = 𝑓 (𝑘) + 𝑓 (𝑘).
𝑘=𝑎+1 𝑘=𝑎+1 𝑘=𝑏+1

Esercizio 1.34. Dimostrare che


𝑛 𝑛
X 𝑛 · (𝑛 + 1) X 𝑛 · (𝑛 + 1) · (2𝑛 + 1)
𝑘= , 𝑘2 =
𝑘=1
2 𝑘=1
6

Svolgimento. Il risultato della prima somma può essere interpretato nel modo
seguente: la media di una progressione aritmetica 1+2+···+𝑛
𝑛 è uguale alla media
tra il primo e l’ultimo termine della progressione: 1+𝑛
2 .

Una volta identificata la formula la possiamo dimostrare per induzione. Per


𝑛 = 0 la somma è pari a 0 per definizione. Se la formula è vera per un certo 𝑛 ,
si ha
!
𝑛+1 𝑛
X X 𝑛 · (𝑛 + 1) (𝑛 + 2)(𝑛 + 1)
𝑘= 𝑘 + (𝑛 + 1) = + (𝑛 + 1) =
𝑘=1 𝑘=1
2 2
28 1 fondamenti

che è quanto volevamo dimostrare.

La formula per la somma dei quadrati si può dimostrare facilmente per induzione
(lo si faccia per esercizio) se già conosciamo la formula da dimostrare.

Un metodo per trovare la formula è quello di osservare che la differenza di due


termini cubici consecutivi risulta essere quadratico:

𝑘 3 − (𝑘 − 1)3 = 3 𝑘 2 − 3 𝑘 + 1.

Sommando ambo i lati della precedente equazione si ottiene:


𝑛
X 𝑛
X 𝑛
X 𝑛
X 𝑛
X
𝑘3 − (𝑘 − 1)3 = 3 𝑘2 − 3 𝑘+ 1. (1.8)
𝑘=1 𝑘=1 𝑘=1 𝑘=1 𝑘=1

Al lato destro compare la somma di cui vogliamo calcolare il valore insieme


ad altre due somme di cui sappiamo già il valore. Basterà allora determinare
si chiama somma telescopica in quanto i il valore del lato sinistro dove osserviamo che i termini delle due somme si
termini delle due sommatorie si chiu- cancellano a vicenda, tranne l’ultimo della prima somma e il primo della seconda:
dono uno nell’altro come i tubi di un
dunque si ottiene 𝑛 3 − 03 = 𝑛 3 . Moltiplichiamo per 2 l’equazione (1.8), mettiamo
cannocchiale.
in evidenza la somma dei quadrati e utilizzando la formula 2 𝑛𝑘=1 𝑘 = 𝑛(𝑛 + 1)
P
per ottenere:
𝑛
X
𝑘 2 = 2𝑛 3 + 3𝑛(𝑛 + 1) − 2𝑛 = 𝑛 · 2(𝑛 2 − 1) + 3(𝑛 + 1)
 
6
𝑘=1
= 𝑛 · (𝑛 + 1)(2𝑛 + 1)

che è quanto volevamo dimostrare.


P𝑛
Con lo stesso metodo si può trovare una formula per il calcolo di 𝑘=1
𝑘 3 e così
via. . .

permutazione
Se 𝑔 : {1 , . . . , 𝑛} → {1 , . . . , 𝑛} è bigettiva (una tale funzione si chiama permuta-
zione) allora si può fare il cambio di variabile 𝑘 = 𝑔(𝑗):

𝑛−1
X 𝑛−1
X
𝑓 (𝑘) = 𝑓 (𝑔(𝑗)).
𝑘=0 𝑗=0

Questa uguaglianza può essere dimostrata facilmente nel caso in cui 𝑔 scambi
due soli indici lasciando fissi tutti gli altri (trasposizione) e poi può essere estesa
a tutte le permutazioni osservando che ogni permutazione si scrivere come
composizione di trasposizioni.

Questa proprietà è sostanzialmente la proprietà commutativa della somma


estesa ad un numero qualunque di addendi. Grazie a questa proprietà possiamo
definire la somma di una funzione definita su qualunque insieme finito. Se
𝑓 : 𝐴 → ℝ e 𝑔 : 𝐼𝑛 → 𝐴 è una bigezione (dunque #𝐴 = 𝑛 ) allora si può
definire
X 𝑛−1
X
𝑓 (𝑘) = 𝑓 (𝑔(𝑗))
𝑘∈𝐴 𝑗=0
1.10 polinomi 29

in quanto la somma sul lato destro non dipende dalla bigezione 𝑔 che abbiamo
scelto.

1.10 polinomi

Il concetto di “polinomio” è una astrazione che non risulta facile esplicitare


formalmente. Nel capitolo 9 ci sarà molto utile applicare un polinomio ad un
operatore differenziale e dunque ci teniamo ora a rendere molto chiaro cosa
intendiamo per polinomio. In particolare distingueremo tre concetti che spesso
vengono sovrapposti: espressione polinomiale, polinomio e funzione polinomiale.

Se 𝐴 è un anello abeliano con unità (per ora noi abbiamo un unico esempio
𝐴 = ℤ ma più avanti potremo scegliere 𝐴 = ℚ, 𝐴 = ℝ o 𝐴 = ℂ) possiamo
considerare tutte le espressioni (formalmente: alberi di valutazione) che possono
essere costruite utilizzando le operazioni di addizione e moltiplicazione che
coinvolgono coefficienti presi da 𝐴 e una variabile che possiamo chiamare 𝑥
(e più in generale è possibile considerare polinomi in più variabili). Queste espressioni polinomiali
espressioni verranno chiamate espressioni polinomiali su 𝐴 (o a coefficienti in
𝐴) nella variabile 𝑥 . Un esempio di espressione polinomiale è riportato in
Figura 1.3. Le espressioni polinomiali possono essere sommate e moltiplicate
tra loro per ottenere nuove espressioni. Come comoda notazione si utilizzano
le potenze intere per denotare un prodotto ripetuto 𝑛 volte: 𝑥 𝑛 = 𝑥 · · · 𝑥 .

Diremo che due espressioni sono equivalenti se è possibile trasformare una nel-
l’altra utilizzando le proprietà valide negli anelli abeliani: proprietà associativa
e commutativa per somma e prodotto, proprietà distributiva, elementi neutri
1 · 𝑥 = 𝑥 , 0 + 𝑥 = 𝑥 . Inoltre se un ramo dell’espressione non contiene la variabile
𝑥 è possibile valutare (nell’anello 𝐴) le operazioni e sostituire l’intero ramo con
il risultato di tali operazioni (e viceversa).

In particolare se abbiamo una qualunque espressione possiamo sviluppare tutti


i prodotti mediante la proprietà distributiva e poi riassociare i termini con le
stesse potenze di 𝑥 , ad esempio:

𝑃 = ((−7) · 𝑥 + 42) · (𝑥 · (2 + 𝑥) + 3 · (−1 + 𝑥))


= ((−7) · 𝑥 + 42) · (2 𝑥 + 𝑥 2 − 3 + 3 𝑥)
= 126 + 231 𝑥 + 7 𝑥 2 − 7 𝑥 3

In generale si otterrà una espressione polinomiale che diremo essere in forma


canonica:
𝑛
𝑃 = 𝑎0 + 𝑎1 𝑥 + 𝑎2 𝑥 2 + · · · + 𝑎 𝑛 𝑥 𝑛 = 𝑎𝑘 𝑥 𝑘 .
X
𝑘=0

Dunque ogni espressione polinomiale è equivalente ad una espressione polino-


miale in forma canonica.
polinomio
Se due espressioni polinomiali sono equivalenti diremo che rappresentano lo
stesso polinomio. Se 𝐴 è un anello denoteremo con 𝐴[𝑥] l’insieme di tutti i
polinomi con coefficienti in 𝐴 e variabile 𝑥 . Formalmente 𝐴[𝑥] è il quoziente
30 1 fondamenti

+ +

· 42 · ·

−7 𝑥 𝑥 + 3 +

Figura 1.3: Il polinomio


𝑃 = ((−7) · 𝑥 + 42)·(𝑥·(2+𝑥)+3 ·(−1+𝑥))
rappresentato come albero di valutazio- 2 𝑥 −1 𝑥
ne.

dell’insieme di tutte le espressioni polinomiali rispetto alla relazione di equiva-


lenza che abbiamo appena definito. Possiamo fare la somma e il prodotto di
polinomi e queste operazioni rendono 𝐴[𝑥] anch’esso un anello.

Più esplicitamente se 𝑃 e 𝑄 sono polinomi in forma canonica


𝑛 𝑚
𝑎𝑘 𝑥 𝑘 , 𝑏𝑘 𝑥 𝑘
X X
𝑃= 𝑄=
𝑘=0 𝑘=0

si avrà:
𝑁
(𝑎 𝑘 + 𝑏 𝑘 ) · 𝑥 𝑘
X
𝑃+𝑄 =
𝑘=0

dove 𝑁 è il più grande tra 𝑛 e 𝑚 e si intende che 𝑎 𝑘 = 0 per 𝑘 > 𝑛 e 𝑏 𝑘 = 0 per


𝑘 > 𝑚 . Se 𝑡 ∈ 𝐴 avremo:
𝑛
(𝑡 𝑎 𝑘 ) · 𝑥 𝑘 .
X
𝑡𝑃 =
𝑘=0

Per quanto riguarda il prodotto si avrà invece:


! ! ! !
𝑛 𝑛 𝑛 𝑚
𝑘 𝑗 𝑗 𝑘
X X X X
𝑃·𝑄 = 𝑎𝑘 𝑥 · 𝑏𝑗 𝑥 = 𝑎𝑘 𝑏𝑗 𝑥 𝑥
𝑘=0 𝑗=0 𝑘=0 𝑗=0
! !
𝑛 X
𝑚 𝑚+𝑛 𝑠
𝑗+𝑘
𝑎 𝑗 𝑏 𝑠−𝑗 𝑥 𝑠 .
X X X
= 𝑎𝑘 𝑏𝑗 𝑥 =
𝑘=0 𝑗=0 𝑠=0 𝑗=0

Le formule per la somma e il prodotto dei polinomi in forma canonica possono


essere applicate ad ognuna delle proprietà di anello per dimostrare che poli-
nomi equivalenti hanno la stessa forma canonica e che quindi due espressioni
polinomiali sono equivalenti se e solo se i coefficienti della loro forma canonica
coincidono. In pratica i polinomi a coefficienti in 𝐴 sono rappresentati dai
1.11 coefficienti binomiali 31

coefficienti delle loro forme canoniche che non sono altro che sequenze finite:
𝑛
𝑎 𝑘 𝑥 𝑘 : 𝑎 𝑘 ∈ 𝐴, 𝑛 ∈ ℕ }
X
𝐴[𝑥] = {
𝑘=0
≈ 𝐴ℕ
𝑐 = 𝒂 ∈ 𝐴 : {𝑘 ∈ ℕ : 𝒂(𝑘) ≠ 0 } è finito .



Se il polinomio 𝑃 si scrive in forma canonica


𝑛
𝑎𝑘 𝑥 𝑘
X
𝑃=
𝑘=0

se 𝑛 > 0 possiamo supporre che il coefficiente 𝑎 𝑛 sia diverso da 0 perché


altrimenti potremmo rimuovere il termine corrispondente e ridurci ad una
somma di 𝑛 − 1 termini. In tal caso diremo che il polinomio 𝑃 ha grado 𝑛 . Se grado
𝑛 = 0 diremo anche che il polinomio è costante. Se 𝑛 = 0 e 𝑎 𝑛 = 0 diremo
che 𝑃 è il polinomio nullo. I polinomi costanti non nulli hanno grado pari a 0,
mentre il polinomio nullo, per convenzione, diremo avere grado −∞ (questa
definizione ha senso se si pensa al grado di un polinomio come al più piccolo
numero per cui tutti i coefficienti di indice maggiore a lui sono nulli).

Finora abbiamo definito il polinomio come una classe di equivalenza di espres-


sioni polinomiali. Se prendiamo una espressione 𝑃 e al posto della variabile
𝑥 mettiamo un elemento 𝑎 dell’anello 𝐴 (o di qualunque anello che estende
𝐴) allora possiamo valutare tutte le operazioni (somme e prodotti) ed ottenere
un risultato nell’anello scelto: il risultato ottenuto si indica con 𝑃(𝑎) (stessa
notazione utilizzata per le funzioni). Se 𝑃 è un polinomio nella variabile 𝑥
la funzione 𝑥 ↦→ 𝑃(𝑥) può essere chiamata funzione polinomiale e si indica funzione polinomiale
usualmente con con lo stesso nome 𝑃 dato al polinomio. Sarà il contesto a dirci
se con 𝑃 si intende il polinomio (l’espressione) o la funzione.

Come già anticipato è utile tenere separato il concetto di polinomio da quello


di funzione polinomiale in quanto lo stesso polinomio può essere valutato su
diversi anelli (ad esempio nel corso di geometria si potrà sostituire la variabile
𝑥 di un polinomio con una matrice, e nell’ultimo capitolo di questi appunti
sostituiremo la 𝑥 con un operatore differenziale).

Proseguiremo con la trattazione dei polinomi nel capitolo 4.4.

1.11 coefficienti binomiali

Capiterà spesso di imbattersi in alcuni polinomi particolari, che vengono a volte prodotti notevoli
chiamati prodotti notevoli. Di fondamentale iportanza quelli di grado 2:

(𝑥 + 1) · (𝑥 − 1) = 𝑥 2 − 1 , (𝑥 + 1)2 = 𝑥 2 + 2 𝑥 + 1.

Ma anche quelli di grado 𝑛 :

𝑛−1 𝑛−1 𝑛
𝑥𝑘 = 𝑥 𝑘+1 − 𝑥 𝑘 = 𝑥𝑛 − 1
X X X
(𝑥 − 1) ·
𝑘=0 𝑘=0 𝑘=0
32 1 fondamenti

e, mettendo −𝑥 al posto di 𝑥 e cambiando di segno:

𝑛−1
(−1) 𝑘 𝑥 𝑘 = 1 + (−1)𝑛 𝑥 𝑛 .
X
(𝑥 + 1) ·
𝑘=0

Le potenze del binomio 𝑥 + 1 sono decisamente rilevanti. Se scriviamo il


polinomio (𝑥 + 1)𝑛 in forma canonica:
𝑛
(𝑥 + 1)𝑛 = 𝑎𝑘 𝑥 𝑘
X
𝑘=0

saremmo interessati a calcolare il valore dei coefficienti 𝑎 𝑘 . Innanzitutto gli


coefficienti binomiali diamo un nome: questi coefficienti vengono chiamati coefficienti binomiali e si
I coefficienti binomiali nell’ambito del denotano nel modo seguente:
calcolo combinatorio vengono anche
𝑛
 
chiamati combinazioni
 e denotati con il 𝑎𝑘 = .
simbolo 𝐶 𝑛,𝑘 = 𝑛𝑘 . La coincidenza tra 𝑘
le combinazioni e i coefficienti binomiali
è espressa nel teorema 1.40.
Non è difficile convincersi che se sviluppiamo il binomio (𝑥 + 𝑦)𝑛 si ottengono
potenza del binomio gli stessi coefficienti dunque in generale vale la seguente formula per la potenza
del binomio:
𝑛  
𝑛 𝑘 𝑛−𝑘
(𝑥 + 𝑦)𝑛 =
X
𝑥 𝑦 .
𝑘=0
𝑘

Per determinare il valore effettivo dei coefficienti binomiali si utilizza usualmente


il seguente.

Teorema 1.35 (triangolo di Tartaglia). Per ogni 𝑛 ∈ ℕ e 𝑘 ∈ ℕ con 1 ≤ 𝑘 ≤ 𝑛 si ha

𝑛+1 𝑛 𝑛
     
= +
𝑘 𝑘−1 𝑘

mentre
𝑛+1 𝑛+1
   
=1=
0 𝑛+1

Dimostrazione. Infatti si ha
𝑛+1  𝑛  
𝑛+1 𝑛

𝑘 𝑛+1
𝑥𝑘
X X
𝑥 = (1 + 𝑥) = (1 + 𝑥) ·
𝑘=0
𝑘 𝑘=0
𝑘
𝑛   𝑛  
𝑛 𝑛
𝑥𝑘 + 𝑥 𝑘+1
X X
=
𝑘=0
𝑘 𝑘=0
𝑘
𝑛   𝑛+1
𝑛 𝑛
 
𝑥𝑘 + 𝑥𝑘
X X
=
𝑘=0
𝑘 𝑘=1
𝑘−1
𝑛
𝑛 0 X 𝑛 𝑛 𝑛 𝑛+1
       
𝑘
= 𝑥 + + 𝑥 + 𝑥 .
0 𝑘=1
𝑘 𝑘−1 𝑛
1.11 coefficienti binomiali 33

𝑛
  Tabella 1.5: Il triangolo di Tartaglia (o
0 1 2 3 4 5 6 𝑘 di Pascal): ogni numero è la somma dei
𝑘 due numeri che si trovano nella riga
0 1 precedente sopra e immediatamente a
1 1 1 sinistra.
2 1 2 1
3 1 3 3 1
4 1 4 6 4 1
5 1 5 10 10 5 1
6 1 6 15 20 15 6 1
.. ..
𝑛 . .

Per l’unicità della forma canonica dei polinomi i coefficienti corrispondenti


devono essere uguali e quindi troviamo

𝑛+1 𝑛 𝑛+1 𝑛 𝑛 𝑛+1 𝑛


             
= , = + , = .
0 0 𝑘 𝑘 𝑘−1 𝑛+1 𝑛

0
Si può facilmente verificare che 0 = 1 e questo conclude la dimostrazione.

In base al teorema precedente i coefficienti binomiali si possono elencare come


nella tabella 1.5: ogni riga inizia e finisce con il numero 1 e ogni termine
intermedio coincide con la somma dei due termini nella riga precedente sopra
e a sinistra del numero considerato.

Teorema 1.36 (formula per i coefficienti binomiali). Se 𝑛 ∈ ℕ e 𝑘 ∈ ℕ , 𝑘 ≤ 𝑛 si


ha
𝑛 𝑛!
 
= .
𝑘 𝑘 !(𝑛 − 𝑘)!

Dimostrazione. Lo dimostriamo per induzione su 𝑛 . Per 𝑛 = 0 sappiamo che


0
0 = 1 che è ugule a 0!0! . Utilizziamo il teorema 1.35. Se 𝑘 = 0 o 𝑘 = 𝑛 sappiamo
0!
𝑛
che 𝑘 = 1 che coincide con la formula enunciata. Per gli altri casi, supponendo
per induzione che la formula sia vera per un certo 𝑛 ∈ ℕ si ha:

𝑛+1 𝑛 𝑛 𝑛! 𝑛!
     
= + = +
𝑘 𝑘 𝑘−1 𝑘 !(𝑛 − 𝑘)! (𝑘 − 1)!(𝑛 − 𝑘 + 1)!
𝑛 !(𝑛 − 𝑘 + 1) + 𝑛 ! 𝑘 𝑛 !(𝑛 + 1)
= =
𝑘 !(𝑛 − 𝑘 + 1)! 𝑘 !(𝑛 + 1 − 𝑘)!
(𝑛 + 1)!
=
𝑘 !(𝑛 + 1 − 𝑘)!

che è quanto dovevamo dimostrare.

Si osservi che risulta, per ogni 𝑛 ∈ ℕ :

𝑛 𝑛
   
= = 𝑛.
1 𝑛−1
34 1 fondamenti

Esercizio 1.37. Provare che


𝑛  
𝑛
= 2𝑛 .
X
𝑘=0
𝑘

1.12 cardinalità finite

Definizione 1.38 (cardinalità finite). Definiamo 𝐼𝑛 = {𝑘 ∈ ℕ : 𝑘 < 𝑛} = {0 , 1 , 2 , . . . , 𝑛−


1}. L’insieme 𝐼𝑛 è il prototipo di insieme finito con 𝑛 elementi. Se 𝐴 è un insieme
insieme finito qualunque diremo che 𝐴 è finito se #𝐴 = #𝐼𝑛 per qualche 𝑛 ∈ ℕ ovvero se esiste un
funzione bigettiva 𝑓 : 𝐼𝑛 → 𝐴. In tal caso diremo che 𝐴 ha 𝑛 elementi e scriveremo:

#𝐴 = 𝑛 (leggi: la cardinalità di 𝐴 è 𝑛 )

insieme infinito
In caso contrario diremo che 𝐴 è infinito

Affinché la notazione #𝐴 = 𝑛 abbia senso bisogna osservare che un insieme


𝐴 può essere messo in corrispondenza biunivoca con un unico 𝐼𝑛 . Se fosse
#𝐴 = 𝑛 e #𝐴 = 𝑚 esisterebbe una funzione bigettiva tra 𝐼𝑛 e 𝐼𝑚 . Allora basterà
dimostrare il seguente.

Lemma 1.39. Se esiste una funzione iniettiva 𝑓 : 𝐼𝑛 → 𝐼𝑚 allora 𝑛 ≤ 𝑚 .

Dimostrazione. Lo si dimostra per induzione su 𝑛 . Per 𝑛 = 0 certamente


𝑚 ≥ 𝑛 in quanto 𝑚 è un numero naturale. Supponiamo di avere una funzione
iniettiva 𝑓 : 𝐼𝑛+1 → 𝐼𝑚 . Scegliamo 𝛼 = 𝑓 (𝑛) ∈ 𝐼𝑚 e consideriamo la funzione
𝑔 : 𝐼𝑚 → 𝐼𝑚 che scambia 𝛼 con 𝑚 − 1. Chiaramente 𝑔 è una bigezione e quindi
𝑓 ◦ 𝑔 : 𝐼𝑛+1 → 𝐼𝑚 e ancora iniettiva. Ma ora 𝑓 ◦ 𝑔(𝑛) = 𝑚 − 1 e quindi la
restrizione di 𝑓 ◦ 𝑔 a 𝐼𝑛 è una funzione iniettiva 𝐼𝑛 → 𝐼𝑚−1 . Per ipotesi induttiva
𝑚 − 1 ≥ 𝑛 e quindi 𝑚 ≥ 𝑛 + 1.

Il precedente lemma ci dice in particolare che ℕ è un esempio di insieme infinito.


Se infatti fosse #ℕ ≤ 𝐼𝑛 per qualche 𝑛 ∈ ℕ si avrebbe #𝐼𝑛+1 ≤ #ℕ ≤ #𝐼𝑛 che,
utilizzando il teorema 1.4, è in contraddizione con il lemma.

Lasciamo al lettore il piacere di dimostrare (utilizzando il principio di induzione)


le seguenti proprietà.

Teorema 1.40 (operazioni con le cardinalità finite). Se 𝐴 e 𝐵 sono insiemi disgiunti


e finiti allora
#(𝐴 ∪ 𝐵) = #𝐴 + #𝐵.
Se 𝐴 e 𝐵 sono insiemi finiti allora (ricordiamo che 𝐵 𝐴 è l’insieme delle funzioni 𝐴 → 𝐵)

#(𝐴 × 𝐵) = #𝐴 · #𝐵, #(𝐵 𝐴 ) = #𝐵#𝐴 , #P(𝐴) = 2#𝐴 ,


# 𝑓 ∈ 𝐴𝐴 : 𝑓 bigettiva = (#𝐴)! ,


#𝐴
 
#{𝑋 ∈ P(𝐴) : #𝑋 = 𝑘}. = .
𝑘
1.13 estremo superiore 35

1.13 estremo superiore

Riprendiamo ora la trattazione dell’insieme ℝ dei numeri reali. Vediamo ora


quali sono le conseguenze della continuità dell’ordinamento di ℝ, proprietà che
finora non abbiamo mai utilizzato.

Definizione 1.41. Sia 𝐴 ⊆ ℝ. Se 𝐴 ha un maggiorante (cioè esiste 𝑥 ∈ ℝ tale che


𝑥 ≥ 𝐴, definizione 1.14) diremo che 𝐴 è superiormente limitato, se 𝐴 ammette un
minorante diremo che 𝐴 è inferiormente limitato, se 𝐴 ammette sia maggiorante che
minorante diremo che 𝐴 è limitato. limitato

Se 𝑥 è minimo dei maggioranti di 𝐴 diremo che 𝑥 è estremo superiore di 𝐴 se invece estremo superiore
𝑥 è massimo dei minoranti diremo che 𝑥 è estremo inferiore di 𝐴:
estremo inferiore
sup 𝐴 = min {𝑥 ∈ ℝ : 𝑥 ≥ 𝐴},
inf 𝐴 = max {𝑥 ∈ ℝ : 𝑥 ≤ 𝐴}.

Osserviamo che se l’insieme 𝐴 è finito e non vuoto, il massimo e il minimo


esistono sempre. Se, ad esempio, non esistesse il massimo di 𝐴 significa che
scelto 𝑥 𝑘 ∈ 𝐴 esisterebbe sempre 𝑥 𝑘+1 ∈ 𝐴 con 𝑥 𝑘+1 > 𝑥 𝑘 e quindi l’insieme
𝐴 dovrebbe contenere infiniti punti 𝑥 0 , 𝑥1 , . . . , 𝑥 𝑘 , . . . Insiemi infiniti, invece,
potrebbero non avere massimo/minimo. Un esempio di insieme che non ha né
massimo né minimo è l’insieme 𝐴 = {𝑥 ∈ ℝ : 0 < 𝑥 < 1} infatti per ogni 𝑥 ∈ 𝐴
si ha 𝑥2 < 𝑥 , 1+𝑥 𝑥
2 > 𝑥 con 2 ∈ 𝐴 e 2 ∈ 𝐴, dunque nessun 𝑥 ∈ 𝐴 può essere
1+𝑥

massimo o minimo. L’insieme 𝐵 = {𝑥 ∈ ℝ : 0 ≤ 𝑥 ≤ 1} ha invece massimo


max 𝐵 = 1 e minimo min 𝐵 = 0.

Teorema 1.42 (esistenza del sup). Se 𝐴 è un insieme non vuoto, superiormente


limitato, allora esiste l’estremo superiore di 𝐴. Tale numero 𝑥 = sup 𝐴 è caratterizzato
dalle seguenti proprietà

1. ∀𝑎 ∈ 𝐴 : 𝑥 ≥ 𝑎 ;
2. ∀𝜀 > 0 : ∃𝑎 ∈ 𝐴 : 𝑥 < 𝑎 + 𝜀.

Risultato analogo vale per l’estremo inferiore.

Dimostrazione. Consideriamo l’insieme dei maggioranti

𝐵 = {𝑏 ∈ ℝ : 𝑏 ≥ 𝐴}.

Per ipotesi 𝐵 è non vuoto e per come è definito risulta 𝐴 ≤ 𝐵. Dunque


dall’assioma di continuità deduciamo l’esistenza di un numero 𝑥 ∈ ℝ tale che
𝐴 ≤ 𝑥 ≤ 𝐵. La prima disuguaglianza 𝐴 ≤ 𝑥 ci dice che 𝑥 è un maggiorante
e quindi 𝑥 ∈ 𝐵, la seconda 𝑥 ≤ 𝐵 ci dice che 𝑥 è il minimo di 𝐵 e quindi
concludiamo che 𝑥 è l’estremo superiore di 𝐴.

La prima delle due proprietà caratterizzanti il sup traduce la condizione che 𝑥


sia un maggiorante di 𝐴. La seconda delle due proprietà esprime il fatto che 𝑥
sia il minimo dei maggioranti, infatti se 𝑥 è il minimo dei maggioranti significa
36 1 fondamenti

che nessun numero minore di 𝑥 è un maggiorante, ovvero che ogni 𝑥 − 𝜀 con


𝜀 > 0 non è un maggiorante, ovvero che esiste 𝑎 ∈ 𝐴 tale che 𝑎 > 𝑥 − 𝜀.

La precedente dimostrazione è l’unica in cui utilizzeremo l’assioma di continuità


dei numeri reali. D’ora in poi non utilizzeremo più tale assioma ma useremo
invece gli operatori: sup e inf. In effetti è molto semplice verificare che l’esistenza
del sup è una condizione equivalente all’assioma di continuità (basta osservare
che se 𝐴 ≤ 𝐵 allora sup 𝐴 è un elemento di separazione).

Il seguente risultato ci dice, informalmente, che non esistono quantità infinite


(ma neanche infinitesime) in ℝ.
proprietà archimedea

Teorema 1.43 (proprietà archimedea dei numeri reali). Dati 𝑥, 𝑦 ∈ ℝ con


𝑥, 𝑦 > 0 esiste 𝑛 ∈ ℕ tale che 𝑛 𝑦 > 𝑥 .

A parole: per quanto piccolo possa essere 𝑦 > 0, sommandolo a se stesso molte volte si
arriva, dopo un numero finito di passi, a superare qualunque numero 𝑥 anche molto
grande.

Dimostrazione. Fissati 𝑥, 𝑦 ∈ ℝ, 𝑥 > 0, 𝑦 > 0 consideriamo l’insieme

𝐴 = ℕ 𝑦 = {𝑛 𝑦 : 𝑛 ∈ ℕ }.

Basta dimostrare che 𝐴 non è superiormente limitato perché in tal caso dato
𝑥 ∈ ℝ esisterebbe 𝑛 ∈ ℕ per cui 𝑛 𝑦 > 𝑥 ed entrambe le affermazioni del teorema
sarebbero vere (la prima prendendo 𝑦 = 1 e la seconda prendendo 𝑥 = 1).

Chiaramente 𝐴 non è vuoto in quanto 0 ∈ 𝐴 dunque se 𝐴 per assurdo fosse


superiormente limitato esisterebbe 𝑚 = sup 𝐴, 𝑚 ∈ ℝ. Siccome 𝑚 è il minimo
dei maggioranti di 𝐴 e 𝑚 − 𝑦 è più piccolo di 𝑚 , allora 𝑚 − 𝑦 non è un
maggiorante. Dunque deve esistere 𝑛 ∈ ℕ tale che 𝑛 𝑦 > 𝑚 − 𝑦 . Ma allora
(𝑛 + 1)𝑦 = 𝑛 𝑦 + 𝑦 > 𝑚 ed essendo 𝑛 + 1 ∈ ℕ troviamo che 𝑚 non poteva essere
un maggiorante di 𝐴: assurdo.

Teorema 1.44 (principio del buon ordinamento). Sia 𝐴 ⊆ ℕ , 𝐴 ≠ ∅. Allora 𝐴 ha


minimo.

Dimostrazione. Osserviamo che se 𝑛 ∈ ℕ è un minorante di 𝐴 ⊆ ℕ allora o


𝑛 ∈ 𝐴 e quindi 𝑛 è il minimo di 𝐴 oppure anche 𝑛 + 1 è un minorante di 𝐴 in
quanto non ci sono numeri interi compresi tra 𝑛 e 𝑛 + 1.

Dunque se 𝐴 non avesse minimo, per il principio di induzione ogni 𝑛 ∈ ℕ


sarebbe un minorante di 𝐴. In tal caso 𝐴 dovrebbe essere vuoto perché se 𝑎 ∈ 𝐴
certamente 𝑎 + 1 non è un minorante di 𝐴.

Teorema 1.45 (parte intera). Dato 𝑥 ∈ ℝ esiste un unico 𝑚 ∈ ℤ tale che 𝑚 − 1 <
𝑥 ≤ 𝑚.
1.14 l’insieme dei numeri razionali 37

Dimostrazione. Supponiamo per un attimo che sia 𝑥 > 0 e consideriamo l’insie-


me 𝐴 = {𝑛 ∈ ℕ : 𝑛 ≥ 𝑥}. Tale insieme non è vuoto per la proprietà archimedea e
dunque ammette minimo per il principio del buon ordinamento. Se 𝑚 = min 𝐴
risulta quindi 𝑚 ∈ ℕ e 𝑚 − 1 < 𝑥 ≤ 𝑚 .

Se 𝑥 ≤ 0 per la proprietà archimedea esiste 𝑘 ∈ ℕ tale che 𝑘 > −𝑥 . Allora


applichiamo il risultato precedente a 𝑥 + 𝑘 e consideriamo 𝑚 − 𝑘 al posto di
𝑚.
parte intera
Definizione 1.46 (parte intera). Dato 𝑥 ∈ ℝ denotiamo con b𝑥c l’unico intero che
soddisfa b·c
𝑥 − 1 < b𝑥c ≤ 𝑥
e denotiamo con d𝑥e = −b−𝑥c l’unico intero che soddisfa (verificare!) d·e

𝑥 ≤ d𝑥e < 𝑥 + 1.

Si ha dunque
b𝑥c ≤ 𝑥 ≤ d𝑥e
con entrambe le uguaglianze che si realizzano quando 𝑥 ∈ ℤ. I due interi b𝑥c e d𝑥e
sono la migliore approssimazione intera di 𝑥 rispettivamente per difetto e per eccesso.
L’intero più vicino ad 𝑥 (approssimazione per arrotondamento) è arrotondamento

    Il numero 12 verrà definito nella pros-


1 1 sima sezione sui numeri razionali, lo
𝑥+ ossia 𝑥− anticipiamo per comodità.
2 2

(le due espressioni differiscono solamente quando 𝑥 si trova nel punto medio tra due
interi consecutivi, nel qual caso la prima approssima per eccesso e la seconda per difetto).

In alcuni testi si usa la notazione [𝑥] per denotare la parte intera b𝑥c e si definisce
anche la parte frazionaria
{𝑥} = 𝑥 − [𝑥].
Per evitare ambiguità con il normale utilizzo delle parentesi non useremo queste
notazioni.

1.14 l’insieme dei numeri razionali

Teorema 1.47 (divisibilità dei numeri reali). Dato 𝑥 ∈ ℝ e dato 𝑛 ∈ ℕ , 𝑛 ≠ 0


esiste un unico 𝑦 ∈ ℝ tale che 𝑛 𝑦 = 𝑥 . Scriveremo in tal caso 𝑦 = 𝑛𝑥 o 𝑦 = 𝑥/𝑛 .

Dimostrazione. Preliminarmente vogliamo dimostrare che preso qualunque


𝑛 ∈ ℕ con 𝑛 > 0 vale la proprietà di esistenza di numeri piccoli:

∀𝜀 > 0 ∃𝛿 > 0 : 𝑛𝛿 < 𝜀. (1.9)

E’ facile dimostrare che

∀𝜀 > 0 ∃𝛼 > 0 : 2 𝛼 ≤ 𝜀
38 1 fondamenti

infatti dato 𝜀 > 0 sappiamo, per la proprietà di densità dei numeri reali, che
esiste 𝑥 ∈ ℝ tale che 0 < 𝑥 < 𝜀. Ma allora se 2 𝑥 ≤ 𝜀 basta scegliere 𝛼 = 𝑥 se
invece 2 𝑥 > 𝜀 si sceglie 𝛼 = 𝜀 − 𝑥 così da avere comunque

2 𝛼 = 2 𝜀 − 2 𝑥 < 2 𝜀 − 𝜀 = 𝜀.

Ma allora (1.9) può essere dimostrata per induzione. Per 𝑛 = 1 non è altro che
la proprietà di densità (se 0 < 𝜀 esiste 𝛿 tale che 0 < 𝛿 < 𝜀). Supponendo la
proprietà vera per un certo 𝑛 ≥ 1 sappiamo esistere 𝛿 > 0 tale che 𝑛𝛿 < 𝜀 ma
anche 𝛼 > 0 tale che 2 𝛼 ≤ 𝛿 . Allora

(𝑛 + 1)𝛼 ≤ (𝑛 + 𝑛)𝛼 = 2𝑛𝛼 ≤ 𝑛𝛿 < 𝜀

e dunque la proprietà (1.9) è verificata per ogni 𝑛 ∈ ℕ .

Passiamo ora alla dimostrazione del teorema. Senza perdita di generalità


possiamo supporre che sia 𝑥 > 0 in quanto 𝑥 = 0 è banale e se 𝑥 < 0 basta
considerare −𝑥 al posto di 𝑥 . Dato 𝑛 ∈ ℕ , 𝑛 ≠ 0, dobbiamo risolvere l’equazione
𝑛 𝑦 = 𝑥 per trovare 𝑦 . Consideriamo l’insieme

𝐴 = {𝑎 ∈ ℝ : 𝑎 ≥ 0, 𝑛𝑎 ≤ 𝑥}.

Chiaramente 𝐴 non è vuoto in quanto 0 ∈ 𝐴. Inoltre se 𝑎 > 𝑥 si ha 𝑛𝑎 > 𝑛𝑥 ≥ 𝑥 e


dunque 𝑎 ∉ 𝐴. Significa che 𝑥 è un maggiorante di 𝐴 e quindi 𝐴 è superiormente
limitato. Scegliamo allora
𝑦 = sup 𝐴.
Dobbiamo mostrare che 𝑛 𝑦 = 𝑥 . Se fosse 𝑛 𝑦 < 𝑥 posto 𝜀 = 𝑥 − 𝑛 𝑦 avremmo
𝜀 > 0 e per (1.9) sappiamo che dovrà esistere 𝛿 > 0 per cui 𝑛𝛿 < 𝜀 da cui:

𝑛(𝑦 + 𝛿) = 𝑛 𝑦 + 𝑛𝛿 < 𝑛 𝑦 + 𝜀 = 𝑥.

Dunque si avrebbe 𝑦 + 𝛿 ∈ 𝐴 da cui si conclude che 𝑦 non può essere un


maggiorante di 𝐴. Se invece fosse 𝑛 𝑦 > 𝑥 posto 𝜀 = 𝑛 𝑦 − 𝑥 prendiamo anche
in questo caso un 𝛿 > 0 con 𝑛𝛿 < 𝜀. Allora 𝑦 − 𝛿 sarebbe un maggiorante di 𝐴
perché preso qualunque 𝑎 > 𝑦 − 𝛿 si avrebbe

𝑛𝑎 > 𝑛 𝑦 − 𝑛𝛿 > 𝑛 𝑦 − 𝜀 = 𝑥

e dunque non ci può essere 𝑎 ∈ 𝐴 con 𝑎 > 𝑦 − 𝛿 . Ma se 𝑦 − 𝛿 è un maggiorante


𝑦 non può essere il minimo dei maggioranti: assurdo.

Significa quindi che 𝑛 𝑦 = 𝜀, come volevamo dimostrare.

Rimane da verificare che c’è un unico 𝑦 con tale proprietà. Ma se avessimo due
soluzioni: 𝑛 𝑦1 = 𝜀 e 𝑛 𝑦2 = 𝜀 facendo la differenza si ottiene 𝑛(𝑦1 − 𝑦2 ) = 0 da
cui (essendo 𝑛 > 1) si ottiene 𝑦1 − 𝑦2 = 0 cioè 𝑦1 = 𝑦2 .
numeri razionali

Grazie al teorema precedente possiamo definire i numeri razionali:

𝑝
 

ℚ= = : 𝑝 ∈ ℤ, 𝑞 ∈ ℕ , 𝑞 ≠ 0 .
ℕ \ {0} 𝑞
1.15 valore assoluto 39

Le seguenti proprietà discendono immediatamente dalle proprietà già dimo-


strare per i numeri interi:

𝑝 0 𝑝 𝑠 𝑝+𝑠 𝑝 𝑛𝑝
= 𝑝, = 0, + = , 𝑛 = .
1 𝑞 𝑞 𝑞 𝑞 𝑞 𝑞

densità di ℚ
Teorema 1.48 (densità di ℚ in ℝ). Dati 𝑥, 𝑦 ∈ ℝ con 𝑥 < 𝑦 esiste 𝑞 ∈ ℚ tale che
𝑥 < 𝑞 < 𝑦.

Dimostrazione. Per la proprietà archimedea dei numeri reali essendo 𝑦 − 𝑥 > 0


deve esistere 𝑛 ∈ ℕ tale che 𝑦 − 𝑥 > 1/𝑛 così si avrà

𝑛𝑥 + 1 < 𝑛 𝑦.

Prendiamo allora 𝑚 = b𝑛𝑥 + 1c cosicché si abbia

𝑛𝑥 < 𝑚 ≤ 𝑛𝑥 + 1.

Mettendo insieme le due disuguaglianze e dividendo per n si ottiene, come


volevamo dimostrare,
𝑚
𝑥< < 𝑦.
𝑛

1.15 valore assoluto


valore assoluto
Definizione 1.49 (valore assoluto). Definiamo il valore assoluto |𝑥| di un numero
𝑥 ∈ ℝ nel seguente modo (
𝑥 se 𝑥 ≥ 0 ,
|𝑥| =
−𝑥 se 𝑥 < 0.

Proposizione 1.50 (proprietà del valore assoluto). Si ha

1. |𝑥| ≥ 0 (positività)
2. |𝑥| = |𝑥| (idempotenza)
3. |−𝑥| = |𝑥| (simmetria)
4. |𝑥 + 𝑦| ≤ |𝑥| + |𝑦| (convessità)
5. − 𝑦| ≤ |𝑥 − 𝑧| + |𝑧 − 𝑦| (disuguaglianza triangolare)
|𝑥
6. |𝑥| − |𝑦| ≤ |𝑥 − 𝑦| (disuguaglianza triangolare inversa)

Useremo inoltre spesso la seguente equivalenza (valida anche con < al posto di ≤ ). Se
𝑟 ≥ 0 allora
|𝑥 − 𝑦| ≤ 𝑟 ⇐⇒ 𝑦 − 𝑟 ≤ 𝑥 ≤ 𝑦 + 𝑟.

Dimostrazione. Le prime quattro proprietà sono immediate conseguenze della


definizione.

Dimostriamo innanzitutto l’ultima osservazione. Se 𝑥 ≥ 𝑦 allora 𝑥 − 𝑦 ≥ 0 e


quindi |𝑥 − 𝑦| ≤ 𝑟 è equivalente a 𝑥 − 𝑦 ≤ 𝑟 cioè 𝑥 ≤ 𝑦 + 𝑟 . Se 𝑥 < 𝑦 allora
40 1 fondamenti

𝑥 − 𝑦 < 0 e quindi |𝑥 − 𝑦| ≤ 𝑟 è equivalente a 𝑦 − 𝑥 ≤ 𝑟 cioè 𝑥 ≥ 𝑦 − 𝑟 . Viceversa


se 𝑦 − 𝑟 ≤ 𝑥 ≤ 𝑦 + 𝑟 allora vale sia 𝑥 − 𝑦 ≤ 𝑟 che 𝑦 − 𝑥 ≤ 𝑟 e dunque |𝑥 − 𝑦| ≤ 𝑟 .

Osserviamo allora che per la precedente osservazione applicata a |𝑥 − 0 | ≤ |𝑥|


si ottiene
−|𝑥| ≤ 𝑥 ≤ |𝑥|
e sommando la stessa disuguaglianza con 𝑦 al posto di 𝑥 si ottiene

−(|𝑥| + |𝑦|) ≤ 𝑥 + 𝑦 ≤ |𝑥| + |𝑦|

che è equivalente alla proprietà di convessità:

|𝑥 + 𝑦| ≤ |𝑥| + |𝑦| = |𝑥| + |𝑦|.


Ponendo 𝑦 = 𝑧 − 𝑥 nella disuguaglianza precedente, si ottiene

|𝑧| ≤ |𝑥| + |𝑧 − 𝑥|

da cui
|𝑧| − |𝑥| ≤ |𝑧 − 𝑥|.
Scambiando 𝑧 con 𝑥 si ottiene la disuguaglianza opposta e mettendole assieme
si ottiene la disuguaglianza triangolare inversa:

|𝑧| − |𝑥| ≤ |𝑧 − 𝑥|.


La disuguaglianza triangolare segue dalla convessità:

|𝑥 − 𝑦| = |𝑥 − 𝑧 + 𝑧 − 𝑦| ≤ |𝑥 − 𝑧| + |𝑧 − 𝑦|.

Osserviamo che dal punto di vista geometrico |𝑥 − 𝑦| rappresenta la distanza


tra i punti 𝑥 e 𝑦 sulla retta reale.

1.16 numeri decimali

Le frazioni il cui denominatore è una potenza di 10 si chiamano frazioni


decimali:
𝑝
𝑥 = 𝑑, 𝑝 ∈ ℤ, 𝑑 ∈ ℕ .
10
in Italia si preferisce utilizzare la virgola,
Tali frazioni si possono rappresentare scrivendo il numero intero 𝑝 e segnando
ma ci rassegnamo alla notazione anglo- un puntodi separazione prima della 𝑑 -esima cifra a partire da destra. Ad
sassone che ormai è ubiqua in tutta la esempio scriveremo:
strumentazione elettronica. 14142
1.4142 = .
104
𝑝
In generale una frazione 𝑞 ∈ ℚ può essere scritta in forma decimale solamente
se, quando ridotta ai minimi termini, risulta che 𝑞 non ha fattori primi diversi
da 2 e 5 (in quanto le potenze di dieci hanno solo questi fattori). In ogni caso le
1.17 isomorfismi di gruppi ordinati 41

frazioni decimali sono dense in ℝ in quanto dato 𝑥 ∈ ℝ per ogni 𝜀 > 0 esiste
𝑑 ∈ ℕ tale che 10−𝑑 ≤ 𝜀 e quindi posto 𝑝 = b10𝑑 · 𝑥 + 12 c si avrà
𝑝
1

𝑑 − 𝑥 ≤ < 𝜀.

10 2 · 10𝑑
In tal caso scriveremo ≈
𝑝
𝑥≈ .
10𝑑
Ad esempio scriveremo
2 6667
≈ 0.6667 =
3 104
per intendere Si osservi che in base alla definizio-
2 6667 ne data sarebbe anche corretto scrivere
− < 1 . (1.10) 3 ≈ 0.6666 che però sarebbe una appros-
2
3 104 104 simazione peggiore. Questa ambiguità è
Nel calcolo scientifico ogni uguaglianza numerica è intesa nel senso precedente, necessaria se vogliamo evitare i casi limi-
te in cui bisogna conoscere molte più ci-
se non specificato diversamente. fre decimali di quelle richieste per capire
qual è la migliore approssimazione.
Le frazioni non decimali si possono scrivere con uno sviluppo decimale periodico.
Non useremo mai questa notazione che ricordiamo solamente con un esempio.
Il numero
𝑥 = 12.34567 = 12.34567567
è la frazione che risolve l’equazione

100 𝑥 − 1234 0.567


 
= 100 𝑥 − 1234.567 = 0.000567
1000 1000

ovvero
1234567 − 1234
1234567 − 1234 = 99900 · 𝑥, 𝑥= .
99900

Esercizio 1.51. Dimostrare che vale (1.10).

1.17 isomorfismi di gruppi ordinati


funzioni monotòne

Definizione 1.52 (funzioni monotòne). Una funzione 𝑓 : 𝐴 → 𝐵 con 𝐴, 𝐵 insiemi


ordinati, si dice essere
crescente
1. crescente se 𝑥 ≤ 𝑦 =⇒ 𝑓 (𝑥) ≤ 𝑓 (𝑦);
decrescente
2. decrescente se 𝑥 ≤ 𝑦 =⇒ 𝑓 (𝑥) ≥ 𝑓 (𝑦);
3. monotòna se crescente o decrescente; monotòna
4. costante se crescente e decrescente; costante
5. strettamente crescente se 𝑥 < 𝑦 =⇒ 𝑓 (𝑥) < 𝑓 (𝑦);
strettamente crescente
6. strettamente decrescente se 𝑥 < 𝑦 =⇒ 𝑓 (𝑥) > 𝑓 (𝑦);
7. strettamente monotòna se strettamente crescente o strettamente decrescente. strettamente decrescente

strettamente monotòna
Si osservi che se 𝑓 : 𝐴 → ℝ è costante allora esiste 𝑐 tale che 𝑓 (𝑥) = 𝑐 per
ogni 𝑥 ∈ 𝐴. Si osservi anche che ogni funzione strettamente monotona è
anche iniettiva. Si osservi infine (fare un esempio!) che esistono funzioni che
42 1 fondamenti

non rientrano in nessuna delle categorie sopra elencate (cioè che non sono né
crescenti né decrescenti).
Si faccia attenzione alla terminologia. In alcuni testi (in particolare nei testi
anglosassoni) si utilizza il termine crescente con il significato di strettamente
crescente e si usa la dizione non decrescente o debolmente crescente per indicare il
concetto che noi abbiamo definito con crescente. In effetti con le nostre definizioni
una funzione crescente può essere costante e quindi non crescere affatto!

funzione additiva
Definizione 1.53 (funzione additiva). Sia 𝐺 un gruppo rispetto ad una operazione
𝐺 𝐻
∗ e sia 𝐻 un gruppo rispetto alla operazione ∗ . Una funzione 𝑓 : 𝐺 → 𝐻 si dice essere
un omomorfismo se per ogni 𝑥, 𝑦 ∈ 𝐺 si ha
omomorfismo
𝐺 𝐻
𝑓 (𝑥 ∗ 𝑦) = 𝑓 (𝑥) ∗ 𝑓 (𝑦).

𝐺 𝐻
Nel caso in cui le operazioni ∗ e ∗ siano denotate entrambe con il simbolo + diremo
equivalentemente che 𝑓 è additiva in quanto soddisfa la proprietà:

𝑓 (𝑥 + 𝑦) = 𝑓 (𝑥) + 𝑓 (𝑦).

Ricordiamo che abbiamo definito ℝ come un gruppo additivo, totalmente


ordinato, denso e continuo. Dato 𝑥 ∈ ℝ e 𝑛 ∈ ℕ abbiamo definito 𝑛𝑥 (somma
ripetuta) e se 𝑛 ≠ 0 abbiamo definito 𝑛𝑥 in modo che 𝑛 𝑛𝑥 = 𝑥 . Lo stesso si può
fare quindi su qualunque altro gruppo additivo, totalmente ordinato, denso e
continuo, visto che non abbiamo assunto nessuna altra ipotesi su ℝ. Il teorema
seguente ci dice che queste proprietà identificano univocamente l’insieme ℝ in
quanto dati due gruppi 𝑅 e 𝑆 con queste proprietà c’è tra di essi un isomorfismo
cioè una bigezione che mantiene sia l’operazione di gruppo, sia l’ordinamento.

Teorema 1.54 (isomorfismi di gruppi ordinati). Siano 𝑅 e 𝑆 due gruppi totalmente


ordinati, densi e continui. Scelto 𝑢 ∈ 𝑅 , 𝑢 > 0 e 𝑚 ∈ 𝑆 esiste una unica funzione
𝑓 : 𝑅 → 𝑆 che sia un omomorfismo monotono tale che 𝑓 (𝑢) = 𝑚 .
Inoltre se 𝑚 > 0 la funzione 𝑓 è strettamente crescente, se 𝑚 = 0 la funzione è costante
nulla, se 𝑚 < 0 la funzione è strettamente decrescente. Se 𝑚 ≠ 0 la funzione è anche
suriettiva ed è quindi bigettiva.
Infine 𝑓 è anche l’unica funzione monotona tale che se 𝑝 ∈ ℤ, 𝑞 ∈ ℕ \ {0} si ha

𝑝𝑢 𝑝𝑚
 
𝑓 = .
𝑞 𝑞

Dimostrazione. Supponiamo che l’operazione di entrambi i gruppi 𝑅 e 𝑆 sia


denotata con il simbolo +. Dunque la condizione di omomorfismo non è altro
che l’additività 𝑓 (𝑥 + 𝑦) = 𝑓 (𝑥) + 𝑓 (𝑦). Inoltre 𝑅 e 𝑆 hanno tutte le proprietà
che abbiamo già dimostrato per l’insieme ℝ dei numeri reali. In particolare
abbiamo definita la moltiplicazione 𝑛 · 𝑥 con 𝑛 ∈ ℤ e la divisione 𝑥/𝑛 con 𝑛 ∈ ℕ ,
𝑛 ≠ 0.
Sia 𝑓 : 𝑅 → 𝑆 un omomorfismo monotono tale che 𝑓 (𝑢) = 𝑚 . Allora neces-
sariamente 𝑓 (0) = 𝑓 (0 + 0) = 𝑓 (0) + 𝑓 (0) da cui 𝑓 (0) = 0. Inoltre se 𝑛 ∈ ℕ e
1.17 isomorfismi di gruppi ordinati 43

𝑥 ∈ 𝑅 si avrà 𝑓 (𝑛𝑥) = 𝑛 𝑓 (𝑥) (lo si dimostra per induzione: se 𝑓 (𝑛𝑥) = 𝑛 𝑓 (𝑥)


sommando 𝑓 (𝑥) ad ambo i membri ed utilizzando l’additività si ottiene
𝑓 ((𝑛 + 1)𝑥) = (𝑛 + 1) 𝑓 (𝑥)). Ma allora 𝑛 𝑓 (𝑥/𝑛) = 𝑓 (𝑥) da cui 𝑓 (𝑥/𝑛) = 𝑓 (𝑥)/𝑛 .
Osserviamo che 𝑓 (−𝑥) = − 𝑓 (𝑥) in quanto 𝑓 (𝑥) + 𝑓 (−𝑥) = 𝑓 (𝑥 − 𝑥) = 0 e dunque
la condizione 𝑓 (𝑛𝑥) = 𝑛 𝑓 (𝑥) vale per ogni 𝑛 ∈ ℤ. E dunque per ogni 𝑝 ∈ ℤ e
ogni 𝑞 ∈ ℕ \ {0} si deve avere 𝑓 (𝑝 · 𝑥/𝑞) = 𝑝 · 𝑓 (𝑥)/𝑞 . In particolare per 𝑥 = 𝑢
dobbiamo avere 𝑓 (𝑥) = 𝑚 e quindi

𝑢 𝑚
 
𝑓 𝑝· =𝑝· . (1.11)
𝑞 𝑞

Per fissare le idee supponiamo ora che sia 𝑚 > 0, in tal caso 𝑓 dovrà essere
monotona crescente in quanto 𝑢 > 0 e 𝑓 (𝑢) = 𝑚 > 0. Per ogni 𝑥 ∈ 𝑅
consideriamo l’insieme

𝑚 𝑢
 
𝐴 𝑥 = 𝑝 · : 𝑝 ≤ 𝑥, 𝑝 ∈ ℤ , 𝑞 ∈ ℕ \ {0} .
𝑞 𝑞

Dato 𝑥 ∈ 𝑅 e dato 𝑞 ∈ ℕ \ {0} scegliamo 𝑝 ∈ ℤ tale che 𝑝𝑢/𝑞 ≤ 𝑥 ≤ (𝑝 + 1)𝑢/𝑞 .


Per la monotonia di 𝑓 e grazie alla (1.11) si dovrà avere 𝑝𝑚/𝑞 ≤ 𝑓 (𝑥) ≤ (𝑝+1)𝑚/𝑞 .
Ma vale anche
𝑚 𝑚
𝑝 ≤ sup 𝐴 𝑥 ≤ (𝑝 + 1) (1.12)
𝑞 𝑞
in quanto da un lato 𝑝𝑚/𝑞 ∈ 𝐴 𝑥 e dall’altro (𝑝+1)𝑚/𝑞 è un maggiorante di 𝐴 𝑥 (in
quanto se 𝑝 0 𝑢/𝑞 0 ≤ 𝑥 allora 𝑝 0 𝑢/𝑞 0 ≤ (𝑝 + 1)𝑢/𝑞 e quindi 𝑝 0 𝑚/𝑞 ≤ (𝑝 + 1)𝑚/𝑞 ).
Dunque si ha
𝑚
| 𝑓 (𝑥) − sup 𝐴 𝑥 | ≤ .
𝑞
Posto 𝜀 = | 𝑓 (𝑥) − sup 𝐴 𝑥 | se fosse 𝜀 > 0, per la proprietà archimedea valida
in 𝑆 , potremmo trovare 𝑞 tale che 𝑞𝜀 > 𝑚 e avremmo quindi un assurdo.
Concludiamo quindi che deve necessariamente essere 𝑓 (𝑥) = sup 𝐴 𝑥 e dunque
𝑓 , se esiste, è unica.

Rimane da verificare che la funzione 𝑓 (𝑥) = sup 𝐴 𝑥 è effettivamente additiva


e monotona. Innanzitutto è facile verificare che se 𝑥 = 𝑝𝑢/𝑞 con 𝑝 ∈ ℤ e
𝑞 ∈ ℕ \ {0} si ha 𝑓 (𝑥) = 𝑝𝑚/𝑞 . Infatti ovviamente 𝑝𝑚/𝑞 ∈ 𝐴 𝑥 ed è facile
verificare che 𝑝𝑚/𝑞 è anche un maggiorante di 𝐴 𝑥 dunque in questo caso
𝑝𝑚/𝑞 = max 𝐴 𝑥 = 𝑓 (𝑥). Mostriamo ora che 𝑓 è additiva e strettamente
crescente. Dati 𝑥, 𝑦 ∈ 𝑅 e dato 𝑞 ∈ ℕ \ {0} prendiamo 𝑝, 𝑟 ∈ ℤ tali che
𝑝𝑢/𝑞 ≤ 𝑥 ≤ (𝑝 + 1)𝑢/𝑞 e 𝑟𝑢/𝑞 ≤ 𝑦 ≤ (𝑟 + 1)𝑢/𝑞 . Sommando le disuguaglianze
si avrà inoltre (𝑝 + 𝑟)𝑢/𝑞 ≤ 𝑥 + 𝑦 ≤ (𝑝 + 𝑟 + 2)𝑢/𝑞 . La proprietà (1.12) ci dice
che valgono le seguenti disuguaglianze
𝑚 𝑚 𝑚 𝑚
𝑝· ≤ 𝑓 (𝑥) ≤ (𝑝 + 1) · , 𝑟· ≤ 𝑓 (𝑦) ≤ (𝑟 + 1) ·
𝑞 𝑞 𝑞 𝑞
𝑚 𝑚
(𝑝 + 𝑟) · ≤ 𝑓 (𝑥 + 𝑦) ≤ (𝑝 + 𝑟 + 2) ·
𝑞 𝑞

da cui
𝑚
| 𝑓 (𝑥) + 𝑓 (𝑦) − 𝑓 (𝑥 + 𝑦)| ≤ 2 .
𝑞
44 1 fondamenti

Siccome 𝑞 è arbitrario deduciamo (sempre per la proprietà archimedea di 𝑆 )


che la quantità a primo membro è nulla e dunque 𝑓 è effettivamente additiva.
Similmente se 𝑥 < 𝑦 possiamo scegliere 𝑞 in modo che sia 2/𝑞 < 𝑦 − 𝑥 e,
scegliendo 𝑝, 𝑟 come prima, si ottiene
𝑚 𝑚
𝑓 (𝑥) ≤ (𝑝 + 1) < 𝑟 ≤ 𝑓 (𝑦)
𝑞 𝑞

da cui 𝑓 è strettamente crescente. La dimostrazione, quando 𝑚 > 0, è conclusa.

Se 𝑚 < 0 basta cambiare segno ad 𝑚 e alla funzione 𝑓 .

Se 𝑚 = 0 è facile mostrare che 𝑓 (𝑝𝑢) = 0 per ogni 𝑝 ∈ ℤ e quindi se 𝑝 ≤ 𝑥 ≤ 𝑝 + 1


si trova che 𝑓 (𝑥), per monotonia, non può che essere 0. Dunque la funzione
identicamente nulla è l’unica possibile soluzione.

Infine dobbiamo mostrare che se 𝑚 ≠ 0 la funzione 𝑓 : 𝑅 → 𝑆 è bigettiva.


Sappiamo già che 𝑓 è iniettiva in quanto strettamente monotona se 𝑚 ≠ 0.
Applicando quanto dimostrato finora con 𝑅 ed 𝑆 scambiati sappiamo che esiste
𝑔 : 𝑆 → 𝑅 anch’essa iniettiva. Ora se consideriamo 𝑇 = 𝑓 (𝑅) ⊆ 𝑆 osserviamo
che 𝑓 : 𝑅 → 𝑇 è bigettiva e preserva la struttura di gruppo e l’ordinamento.
Anche la sua inversa 𝑓 −1 : 𝑇 → 𝑅 ha le stesse proprietà così come ce le ha la
restrizione di 𝑔 a 𝑇 . Ma per l’unicità che abbiamo appena dimostrato l’inversa
di 𝑓 e la restrizione di 𝑔 dovranno coincidere. Significa allora che 𝑔(𝑇) = 𝑅 ed
essendo 𝑔 iniettiva dobbiamo quindi concludere che 𝑇 = 𝑆 .

Come conseguenza immediata otteniamo il seguente corollario il quale garanti-


sce che gli assiomi con cui abbiamo definito ℝ lo identificano univocamente a
meno di isomorfismi.

Corollario 1.55 (unicità di ℝ). Sia 𝑆 un gruppo additivo totalmente ordinato, denso
e continuo (come ℝ) con unità 𝑢 > 0. Allora 𝑆 è isomorfo ad ℝ nel senso che esiste
una funzione (unica) 𝑓 : ℝ → 𝑆 bigettiva, additiva, crescente con 𝑓 (1) = 𝑢 .

Possiamo inoltre finalmente dimostrare che l’addizione è commutativa.

Teorema 1.56. Se 𝑥, 𝑦 ∈ ℝ si ha 𝑥 + 𝑦 = 𝑦 + 𝑥 .

Dimostrazione. Se consideriamo il gruppo additivo ℝ ma definiamo l’addizione


con gli addendi scambiati, il teorema 1.54 ci garantisce l’esistenza di una
funzione 𝑓 : ℝ → ℝ crescente, con 𝑓 (1) = 1, tale che

𝑓 (𝑥 + 𝑦) = 𝑓 (𝑦) + 𝑓 (𝑥). (1.13)

Inoltre 𝑓 è l’unica funzione crescente tale che per ogni 𝑥 ∈ ℚ soddisfa 𝑓 (𝑥) = 𝑥 .
Visto che la funzione identica ha queste proprietà 𝑓 dovrà in effetti essere la
funzione identica 𝑓 (𝑥) = 𝑥 per ogni 𝑥 ∈ ℝ e l’equazione (1.13) si riduce a
𝑥 + 𝑦 = 𝑦 + 𝑥.

Possiamo finalmente definire su ℝ l’operazione di moltiplicazione.


moltiplicazione
1.17 isomorfismi di gruppi ordinati 45

Teorema 1.57 (moltiplicazione). Su ℝ esiste una unica unica operazione · che


chiameremo moltiplicazione che soddisfa le seguenti proprietà:

1. distributiva: 𝑥 · (𝑦 + 𝑧) = 𝑥 · 𝑦 + 𝑥 · 𝑧 ;
2. elemento neutro: 𝑥 · 1 = 𝑥 ;
3. monotonia: fissato 𝑥 la funzione 𝑥 · 𝑦 è monotona in 𝑦 .

Inoltre tale operazione, che chiamiamo moltiplicazione, ha anche le seguenti proprietà: moltiplicazione

1. commutativa: 𝑥 · 𝑦 = 𝑦 · 𝑥 ;
2. stretta monotonia: se 𝑥 > 0 e 𝑦 > 𝑧 allora 𝑥 · 𝑦 > 𝑥 · 𝑧 ;
3. associativa: (𝑥 · 𝑦) · 𝑧 = 𝑥 · (𝑦 · 𝑧);
4. esistenza del reciproco: se 𝑥 ≠ 0 esiste 𝑦 tale che 𝑥 𝑦 = 1;
5. elemento assorbente: 0 · 𝑥 = 0;
6. annullamento del prodotto: se 𝑥 · 𝑦 = 0 allora 𝑥 = 0 oppure 𝑦 = 0;
7. regola del segno: (−𝑥) · 𝑦 = −(𝑥 · 𝑦).

Dimostrazione. Il teorema 1.54 garantisce che per ogni 𝑥 ∈ ℝ esiste una unica
funzione 𝑚 𝑥 : ℝ → ℝ che sia additiva, monotona e tale che 𝑚 𝑥 (1) = 𝑥 . Se
definiamo
𝑥 · 𝑦 = 𝑚 𝑥 (𝑦)
otteniamo che valgono la proprietà distributiva, l’elemento neutro e la monoto-
nia. E questo è l’unico modo per garantire queste proprietà.

Dobbiamo ora verificare che tale definizione soddisfa anche le altre proprietà
enunciate. Per fare ciò ci servirà innanzitutto dimostrare che fissati 𝑎, 𝑏 ∈ ℝ si
ha
𝑚 𝑎 (𝑥) + 𝑚𝑏 (𝑥) = 𝑚 𝑎+𝑏 (𝑥) (1.14)
Consideriamo la funzione 𝑓 (𝑥) = 𝑚 𝑎 (𝑥) + 𝑚𝑏 (𝑥). E’ immediato verificare che 𝑓
è una funzione additiva in quanto 𝑚 𝑎 e 𝑚𝑏 lo sono e l’addizione è commutativa.
Se 𝑎, 𝑏 ≥ 0 è anche immediato verificare che 𝑓 è crescente in quanto 𝑚 𝑎 e 𝑚𝑏
lo sono. Siccome 𝑓 (1) = 𝑚 𝑎 (1) + 𝑚𝑏 (1) = 𝑎 + 𝑏 per il teorema 1.54 la funzione
𝑓 deve coincidere con 𝑚 𝑎+𝑏 e quindi (1.14) è verificata. Osserviamo ora che
−𝑚 𝑦 (𝑥) = 𝑚−𝑦 (𝑥) sempre grazie all’unicità nel teorema 1.54 visto che −𝑚 𝑦 è
additiva, monotona e −𝑚 𝑦 (1) = −𝑦 . Dunque se 𝑎 < 0 e 𝑏 < 0 ci possiamo
ricondurre al caso precedente cambiando tutto di segno:

𝑚 𝑎 + 𝑚𝑏 = −(𝑚−𝑎 + 𝑚−𝑏 ) = −𝑚−𝑎−𝑏 = 𝑚 𝑎+𝑏 .

Se 𝑎 ≥ 0, 𝑏 ≤ 0 e 𝑎 + 𝑏 ≥ 0 sfruttiamo (𝑎 + 𝑏) + (−𝑏) = 𝑎 per ottenere


𝑚 𝑎+𝑏 +𝑚−𝑏 = 𝑚 𝑎 che, riordinando i termini, è l’uguaglianza desiderata. Se 𝑎 ≥ 0,
𝑏 ≤ 0 e 𝑎 + 𝑏 ≤ 0 sfruttiamo −(𝑎 + 𝑏) + 𝑎 = −𝑏 per ottenere 𝑚−(𝑎+𝑏) + 𝑚 𝑎 = 𝑚−𝑏
che di nuovo ci porta a (1.14). Se 𝑏 < 0 scambiamo 𝑎 e 𝑏 per ricondurci ai casi
precedenti. Abbiamo così dimostrato (1.14).

Possiamo ora dimostrare la proprietà commutativa. Fissato 𝑦 ∈ ℝ consideriamo


la funzione 𝑓 (𝑥) = 𝑚 𝑥 (𝑦). Abbiamo appena dimostrato che 𝑓 è additiva.
Osserviamo che se 𝑦 ≥ 0 e 𝑥 ≥ 0 si ha 𝑓 (𝑥) ≥ 0 in quanto 𝑚 𝑥 è crescente e
quindi 𝑓 (𝑥) = 𝑚 𝑥 (𝑦) ≥ 𝑚 𝑥 (0) = 0. Dunque se 𝑥 1 ≤ 𝑥 2 si ha 𝑥 2 − 𝑥 1 ≥ 0 e
𝑓 (𝑥2 ) − 𝑓 (𝑥1 ) = 𝑓 (𝑥2 − 𝑥1 ) ≥ 0: significa che 𝑓 (𝑥) è crescente. Se 𝑦 < 0 si otterrà
invece che 𝑓 (𝑥) è decrescente, ma in ogni caso è monotona. Inoltre 𝑚1 (𝑦) = 𝑦
46 1 fondamenti

in quanto l’identità è additiva e monotona e quindi per unicità coincide con


𝑚1 in quanto 𝑚1 (1) = 1 come l’identità. Dunque 𝑓 (1) = 𝑚1 (𝑦) = 𝑦 . Dunque
scopriamo che 𝑓 (𝑥) = 𝑚 𝑥 (𝑦) = 𝑚 𝑦 (𝑥) ovvero 𝑥 · 𝑦 = 𝑦 · 𝑥 .

Per dimostrare la proprietà associativa fissiamo 𝑦, 𝑧 ∈ ℝ e consideriamo la


funzione 𝑓 (𝑥) = 𝑚 𝑧 (𝑚 𝑦 (𝑥)). Questa funzione è additiva in quanto 𝑚 𝑧 (𝑚 𝑦 (𝑎 +
𝑏)) = 𝑚 𝑧 (𝑚 𝑦 (𝑎) + 𝑚 𝑦 (𝑏)) = 𝑚 𝑧 (𝑚 𝑦 (𝑎)) + 𝑚 𝑧 (𝑚 𝑦 (𝑏)). Inoltre è monotona in
quanto composizione di funzioni monotone. Infine 𝑓 (1) = 𝑚 𝑧 (𝑚 𝑦 (1)) = 𝑚 𝑧 (𝑦).
Dunque per unicità si deve avere 𝑚 𝑧 (𝑚 𝑦 (𝑥)) = 𝑚𝑚𝑧 (𝑦) (𝑥). Esplicitando questa
uguaglianza si trova proprio: 𝑧 · (𝑦 · 𝑥) = (𝑧 · 𝑦) · 𝑥 .

Per dimostrare l’esistenza del reciproco basta ricordare che se 𝑦 ≠ 0 la funzione


𝑚 𝑦 è bigettiva e quindi esiste un unico 𝑥 tale che 𝑚 𝑦 (𝑥) = 𝑦 · 𝑥 = 1.
Lo zero è elemento assorbente in quanto 0 · 𝑥 = 𝑥 · 0 = 𝑚 𝑥 (0) = 0 qualunque
sia 𝑥 . D’altra parte se 𝑚 𝑥 (𝑦) = 0 se non è 𝑥 = 0 la funzione 𝑚 𝑥 è iniettiva e
quindi 𝑦 = 0 è l’unico punto in cui 𝑚 𝑥 (𝑦) = 0. Dunque vale anche la proprietà
di annullamento del prodotto.

La regola del segno deriva dall’additività in quanto 0 = 𝑥 · 0 = 𝑥 · (𝑦 − 𝑦) =


𝑥 · 𝑦 + 𝑥 · (−𝑦) da cui 𝑥 · (−𝑦) = −(𝑥 · 𝑦).

L’operazione di moltiplicazione che abbiamo appena definito su ℝ rende ℝ un


campo ordinato continuo in base alla seguente.

Definizione 1.58 (campo). Diremo che 𝕂 è un campo se 𝕂 è un anello commutativo


con unità e se ogni 𝑥 ∈ 𝕂 , 𝑥 ≠ 0 ha un inverso moltiplicativo cioè esiste 𝑦 ∈ 𝕂 tale che
reciproco 𝑥 · 𝑦 = 1. L’inverso moltiplicativo si chiama anche reciproco. Se 𝑦 ≠ 0 denotiamo con
𝑥/𝑦 o 𝑥𝑦 il prodotto di 𝑥 con il reciproco di 𝑦 . Questa operazione si chiama divisione.
divisione
Se 𝐾 è anche totalmente ordinato da una relazione ≤ e se valgono anche le seguenti
proprietà:

𝑎 ≤ 𝑏 =⇒ 𝑎 + 𝑐 ≤ 𝑏 + 𝑐, 𝑎, 𝑏 ≥ 0 =⇒ 𝑎 · 𝑏 ≥ 0

campo ordinato diremo che 𝐾 è un campo ordinato.

campo ordinato continuo Infine se l’ordinamento è continuo diremo che 𝐾 è un campo ordinato continuo.

Si può osservare che in un campo ordinato l’ordinamento è necessariamente


denso in quanto dati 𝑎, 𝑏 elementi del campo possiamo definire 𝑎+𝑏2 che è
certamente strettamente compreso tra 𝑎 e 𝑏 .

1.18 funzione esponenziale e potenza

Osserviamo che l’insieme ℝ+ = {𝑥 ∈ ℝ : 𝑥 > 0} dei reali positivi rispetto alla


operazione di moltiplicazione risulta essere un gruppo moltiplicativo totalmente
ordinato, denso e continuo. Abbiamo già dimostrato tutte queste proprietà della
moltiplicazione. La densità e continuità non vanno verificate in quanto sono
proprietà dell’ordinamento e non dell’operazione, e l’ordinamento considerato
su ℝ+ è quello ereditato da ℝ.
1.18 funzione esponenziale e potenza 47

Dunque fissato 𝑎 > 0 per il teorema 1.54 esiste una unica funzione exp 𝑎 : ℝ →
ℝ+ (chiamata funzione esponenziale di base 𝑎 ) che sia un omomorfismo monotono funzione esponenziale
del gruppo additivo ℝ con il gruppo moltiplicativo ℝ+ e tale che exp 𝑎 (1) = 𝑎 .
La proprietà di omomorfismo in questo caso si esprime nella forma seguente:

exp 𝑎 (𝑥 + 𝑦) = exp 𝑎 (𝑥) · exp 𝑎 (𝑦). (1.15)


Il teorema 1.54 ci dice anche che se 𝑛 ∈ ℕ il valore exp 𝑎 (𝑛) non è altro che il
prodotto di 𝑎 con sé stesso 𝑛 volte: exp 𝑎 (𝑛) = 𝑎 𝑛 . Ha dunque senso definire
𝑎 𝑥 = exp𝑎 (𝑥) per ogni 𝑥 ∈ ℝ. Avremo dunque la proprietà fondamentale della
funzione esponenziale:
𝑎 𝑥+𝑦 = 𝑎 𝑥 · 𝑎 𝑦 .

Per ogni 𝑎 > 0 e 𝑏 ∈ ℝ è dunque definita l’espressione 𝑎 𝑏 (si legga: 𝑎 elevato alla
potenza 𝑏 ) che si chiama potenza di base 𝑎 ed esponente 𝑏 . potenza

Quando l’esponente è negativo si ha

1
𝑎 −𝑥 =
𝑎𝑥

in quanto 𝑎 𝑥 · 𝑎 −𝑥 = 𝑎 𝑥−𝑥 = 𝑎 0 = 1. In particolare 𝑎 −1 = 1


𝑎 è un modo per
denotare l’inverso moltiplicativo.

Se 𝑎 > 1 la funzione 𝑎 𝑥 risulta essere strettamente crescente, se 𝑎 < 1 la funzione


è strettamente decrescente e se 𝑎 = 1 la funzione 1𝑥 = 1 è costante.

Se 𝑎 > 0 e 𝑏 > 0 vogliamo dimostrare che vale la proprietà:

(𝑎 · 𝑏)𝑥 = 𝑎 𝑥 · 𝑏 𝑥 .

Sarà sufficiente dimostrarlo per 𝑎 > 1 e 𝑏 > 1 in quanto gli altri casi si ottengono
di conseguenza passando al reciproco. Osservare che la funzione 𝑓 (𝑥) = 𝑎 𝑥 · 𝑏 𝑥
è un omomorfismo

𝑓 (𝑥 + 𝑦) = 𝑎 𝑥+𝑦 𝑏 𝑥+𝑦 = 𝑎 𝑥 𝑎 𝑦 𝑏 𝑥 𝑏 𝑦 = 𝑓 (𝑥) · 𝑓 (𝑦)

è crescente (in quanto prodotto di funzioni positive e crescenti) e vale 𝑓 (1) = 𝑎 · 𝑏 .


Dunque per l’unicità data dal teorema 1.54 possiamo affermare che 𝑓 (𝑥) =
(𝑎 · 𝑏)𝑥 .
Infine possiamo dimostrare la proprietà delle potenze ripetute:
 𝑐
𝑎𝑏 = 𝑎 𝑏·𝑐 .

Fissati 𝑎 > 0 e 𝑏 ∈ ℝ consideriamo la funzione 𝑓 (𝑥) = 𝑎 𝑏·𝑥 . osserviamo che


𝑓 (𝑥 + 𝑦) = 𝑎 𝑏𝑥+𝑏 𝑦 = 𝑎 𝑏𝑥 · 𝑎 𝑏 𝑦 dunque la funzione 𝑓 soddisfa la proprietà di
additività. Inoltre è una funzione monotona perché composizione di funzioni
monotone. Infine 𝑓 (1) = 𝑎 𝑏 e dunque, per l’unicità data dal teorema 1.54 dovrà
𝑥
essere 𝑓 (𝑥) = 𝑎 𝑏 , come volevamo dimostrare.

Osserviamo che la funzione potenza 𝑥 𝛼 (dove si tiene fisso l’esponente e si fa


variare la base) è definita tramite la funzione esponenziale per ogni 𝑥 > 0 e per
ogni 𝛼 ∈ ℝ. Se 𝛼 > 0 è naturale definire 0𝛼 = 0 e quindi se 𝛼 > 0 possiamo
48 1 fondamenti

𝑦 = 𝑎𝑥
1 𝑥
𝑦=

𝑎 𝑎

1 𝑦 = log𝑎 𝑥

1 𝑎

𝑦 = log 1 𝑥
𝑎
Figura 1.4: Il grafico della funzione espo-
nenziale e logaritmo in base 𝑎 > 1 e
𝑎 < 1 ( 𝑎 = 2 in figura).
1


𝑦= 𝑥
𝑦 = 𝑥2

1
𝑦= 1
𝑥2

𝑦 = 𝑥1 1

𝑦 = 3𝑥

Figura 1.5: Grafici tipici di potenze e 𝑦 = 𝑥3


radici.

considerare definito 𝑥 𝛼 per ogni 𝑥 ≥ 0. Verifichiamo che la funzione 𝑓 (𝑥) = 𝑥 𝛼


è strettamente crescente se 𝛼 > 0. Infatti se 𝑥 2 > 𝑥 1 > 0 e se 𝛼 > 0 si ha
𝛼 0
𝑥2 𝑥2
 
𝑥2𝛼 = · 𝑥1 𝛼
> · 𝑥1 𝛼 = 𝑥1𝛼 .
𝑥1 𝑥1

1.19 radice 𝑛 -esima

Dalle proprietà delle potenze ripetute deduciamo che se 𝑥 > 0 e 𝑛 ∈ ℕ , 𝑛 ≥ 1,


si ha (𝑥 𝑛 ) 𝑛 = 𝑥 . Significa che 𝑥 𝑛 è la funzione inversa di 𝑥 𝑛 per 𝑥 > 0. Ma la
1 1

funzione 𝑥 𝑛 è definita anche per 𝑥 ≤ 0 e si distinguono due casi qualitativamente


diversi in base alla parità di 𝑛 .

Se 𝑛 è pari la funzione 𝑥 ↦→ 𝑥 𝑛 non è invertibile in quanto (−𝑥)𝑛 = 𝑥 𝑛 . Se però


restringiamo la funzione 𝑥 𝑛 ai numeri reali non negativi la funzione risulta

invertibile e la funzione inversa che si denota con 𝑥 ↦→ 𝑛 𝑥 può essere definita
mediante le potenze come segue:
( 1

𝑛 𝑥𝑛 se 𝑥 > 0
𝑥= se 𝑛 è pari.
0 se 𝑥 = 0

Se 𝑛 è dispari la funzione 𝑥 ↦→ 𝑥 𝑛 è invertibile su tutto ℝ. Infatti (−𝑥)𝑛 = −𝑥 𝑛


dunque tale funzione mantiene il segno del suo argomento. In tal caso la
1.20 logaritmo 49


funzione inversa denotata con 𝑥 ↦→ 𝑛
𝑥 è anch’essa definita su tutto ℝ e può
essere definita nel modo seguente
1

 𝑥𝑛 se 𝑥 > 0

𝑛



𝑥= 0 se 𝑥 = 0 se 𝑛 è dispari
 −(−𝑥) 𝑛1

se 𝑥 < 0

Quando l’argomento è positivo la radice 𝑛 -esima potrebbe anche essere definita


utilizzando il teorema 1.47 di divisibilità nell’ambito del gruppo moltiplicativo
ℝ+ .
radice quadrata

La radice seconda 2 𝑥 viene usualmente chiamata radice quadrata e viene denotata
√ √
con il simbolo 𝑥 . Analogamente la radice terza 3 𝑥 viene usualmente chiamata radice cubica
radice cubica.

Per come è definita la radice 𝑛 -esima si ha


(

𝑛 |𝑥| se 𝑛 è pari,
𝑥𝑛 =
𝑥 se 𝑛 è dispari.

√ √ √ 𝑛 √
p √
E’ facile verificare che le proprietà 𝑛 𝑥 · 𝑦 = 𝑛 𝑥 · 𝑛 𝑦 e 𝑚 𝑥 = 𝑛𝑚 𝑥 sono valide
in tutti i casi in cui ambo i membri sono ben definiti.

Il seguente teorema ci dice che 2 è irrazionale (non è razionale, ovvero non è
elemento di ℚ) in quanto risolve l’equazione 𝑥 2 = 2 che non può avere soluzioni
in ℚ.


Teorema 1.59 (irrazionalità di 2, Pitagora). L’equazione 𝑥 2 = 2 non ha soluzioni
𝑥 ∈ ℚ.

Dimostrazione. Supponiamo 𝑥 ∈ ℚ sia una soluzione di 𝑥 2 = 2. Allora si potrà


scrivere 𝑥 = 𝑝/𝑞 con 𝑝 ∈ ℤ e 𝑞 ∈ ℕ , 𝑞 ≠ 0. Possiamo anche supporre che la
frazione 𝑝/𝑞 sia ridotta ai minimi termini cioè che 𝑝 e 𝑞 non abbiano fattori
in comune. Moltiplicando l’equazione (𝑝/𝑞)2 = 2 per 𝑞 2 si ottiene 𝑝 2 = 2 𝑞 2 .
Risulta quindi che 𝑝 2 è pari. Ma allora anche 𝑝 è pari (perché il quadrato di
un dispari è dispari). Ma se 𝑝 è pari allora 𝑝 2 è multiplo di quattro. Ma allora
anche 2 𝑞 2 è multiplo di quattro e quindi 𝑞 2 è pari. Dunque anche 𝑞 è pari. Ma
avevamo supposto che 𝑝 e 𝑞 non avessero fattori in comune quindi questo non
può accadere.

Possiamo quindi osservare che ℚ, come ℝ, è un campo totalmente ordinato.


Evidentemente ℚ non può essere continuo, perché se lo fosse dovrebbe essere
uguale ad ℝ per il teorema di unicità degli isomorfismi
√ dei gruppi continui
ordinati e dovrebbe quindi contenere il numero 2.
logaritmo
50 1 fondamenti

1.20 logaritmo

Se 𝑎 > 0, 𝑎 ≠ 1 la funzione esponenziale exp 𝑎 : ℝ → ℝ+ è bigettiva. La funzione


inversa log 𝑎 : ℝ+ → ℝ si chiama logaritmo in base 𝑎 e si caratterizza con la
seguente proprietà:
log 𝑎 𝑥 = 𝑦 ⇐⇒ 𝑎 𝑦 = 𝑥.
La proprietà di omomorfismo diventa:

log 𝑎 (𝑥 · 𝑦) = log 𝑎 𝑥 + log 𝑎 𝑦.

Ovviamente vale log 𝑎 𝑎 = 1 e log 𝑎 1 = 0. Se 𝑎 > 1 la funzione logaritmo


è strettamente crescente, se 𝑎 < 1 è strettamente decrescente. La proprietà
dell’esponenziale ripetuto si traduce nella seguente:

log 𝑎 (𝑥 𝑦 ) = 𝑦 log 𝑎 𝑥.

E’ anche piuttosto utile ricordare la formula per il cambiamento di base:

log𝑏 𝑥
log 𝑎 𝑥 =
log 𝑎 𝑏

(valida, come tutte le formule enunciate, se l’argomento del logaritmo è positivo


e se le basi sono positive diverse da 1 e diverse tra loro). Quest’ultima formula
si dimostra moltiplicando ambo i membri per log 𝑎 𝑏 e prendendo quindi
l’esponenziale con base 𝑏 di ambo i membri.

1.21 cardinalità infinite

Abbiamo già osservato che ℕ è un insieme infinito e dunque (per il teorema 1.4)
anche ℤ, ℚ e ℝ sono infiniti. Per gli insiemi finiti se 𝐴 ⊆ 𝐵 ma 𝐴 ≠ 𝐵 risulta
#𝐴 < #𝐵 in quanto #𝐴 − #𝐵 = #(𝐵 \ 𝐴) > 0. Dobbiamo però osservare che
lo stesso non vale per gli insiemi infiniti. In effetti la funzione 𝑠 : ℕ → ℕ
definita da 𝑠(𝑥) = 𝑥 + 1 risulta essere una bigezione tra ℕ e ℕ \ {0}. Dunque
#ℕ = #(ℕ \ {0}) nonostante la differenza tra i due insiemi {0} abbia cardinalità
1. Anche l’insieme dei numeri pari o l’insieme dei quadrati perfetti (come aveva
notato già Galileo) hanno la stessa cardinalità di ℕ in quanto le funzioni 𝑛 ↦→ 2𝑛
e la funzione 𝑛 ↦→ 𝑛 2 sono iniettive.

Non è difficile trovare una funzione iniettiva da ℤ in ℕ (lo lasciamo per esercizio):
questo dimostra che anche #ℤ = #ℕ

Cantor dimostra addirittura che #ℚ = ℕ : per farlo utilizza il seguente.

Teorema 1.60 (primo metodo diagonale di Cantor). L’insieme ℕ × ℕ ha la stessa


cardinalità di ℕ . Di conseguenza

#ℕ = #ℤ = #ℚ.
1.22 punti all’infinito 51

..
𝑚 .
.. .. ..
. . .
..
3 9 - .
.. Figura 1.6: La numerazione diagonale
2 5 8 12 .
delle caselle di una scacchiera infinita.
.. Si potrebbe verificare che il numero pre-
1 2 4 7 11 .
sente nella casella di coordinate (𝑛, 𝑚) si
.. scrive come 𝑓 (𝑛, 𝑚) =
(𝑛+𝑚+1)(𝑛+𝑚)
+𝑚
0 0 1 3 6 10 . 2
ed è una funzione bigettiva 𝑓 : ℕ × ℕ →
0 1 2 3 4 ... 𝑛 ℕ.

Idea di dimostrazione. Numerare le caselle di una scacchiera infinita come in


Figura 1.6.

Visto che è piuttosto facile trovare una funzione iniettiva da ℚ in ℕ × ℤ si


deduce facilmente che #ℚ = #ℕ .

A questo punto si potrebbe pensare che tutti gli insiemi infiniti siano numerabili.
Invece preso un qualunque insieme (anche infinito) esiste un insieme con
cardinalità strettamente maggiore come dimostrato nel seguente teorema che
è un piccolo gioiello della logica. In effetti il metodo utilizzato è assimilabile
al paradosso del mentitore ed è la stessa idea ripresa da Russell nel paradosso
che ha demolito la teoria ingenua degli insiemi. L’insieme delle parti P(𝐴) è
definito a pag. 5.

Teorema 1.61 (Cantor). Se 𝐴 è un qualunque insieme allora #P(𝐴) > #𝐴.

Dimostrazione. E’ chiaro che #𝐴 ≤ #P(𝐴) in quanto la funzione 𝑓 : 𝐴 → P(𝐴)


definita da 𝑓 (𝑥) = {𝑥} è ovviamente iniettiva.

Supponiamo allora per assurdo che esista 𝑓 : 𝐴 → P(𝐴) bigettiva e consideriamo


l’insieme
𝐶 = {𝑥 ∈ 𝐴 : 𝑥 ∉ 𝑓 (𝑥)}.
Se 𝑓 fosse surgettiva dovrebbe esistere 𝑐 ∈ 𝐴 tale che 𝑓 (𝑐) = 𝐶 . Possiamo allora
chiederci se 𝑐 ∈ 𝐶 e scoprire che, per definizione di 𝐶 la proposizione 𝑐 ∈ 𝐶 è
equivalente a 𝑐 ∉ 𝑓 (𝑐) = 𝐶 . Dunque 𝑐 ∈ 𝐶 ⇐⇒ 𝑐 ∉ 𝐶 , che è assurdo.

Corollario 1.62 (non esiste l’insieme di tutti gli insiemi). Se esistesse un insieme
U (universo) tale che ∀𝑥 : 𝑥 ∈ 𝑈 , allora si avrebbe P(U) ⊆ U contraddicendo il teorema
precedente.

Per quanto riguarda l’insieme ℝ si scopre in effetti che #ℝ > #ℕ (sempre


grazie a Cantor, teorema 3.24) e si potrebbe dimostrare che effettivamente
ℝ̄
#ℝ = #P(ℕ ).
+∞, −∞
52 1 fondamenti

1.22 punti all’infinito

Definizione 1.63 (reali estesi). Denotiamo con ℝ̄ = ℝ ∪ {+∞, −∞} l’insieme dei
numeri reali a cui vengono aggiunti due ulteriori quantità che chiameremo infinite e
che denotiamo con +∞ e −∞. Diremo che 𝑥 ∈ ℝ̄ è finito se 𝑥 ∈ ℝ.

Estendiamo la relazione d’ordine imponendo che valga

−∞ ≤ 𝑥 ≤ +∞, ∀𝑥 ∈ ℝ̄.

Estendiamo anche la addizione e moltiplicazione tra reali estesi imponendo che


valga per ogni 𝑥 ∈ ℝ̄

𝑥 + (+∞) = +∞, se 𝑥 ≠ −∞
𝑥 + (−∞) = −∞, se 𝑥 ≠ +∞
𝑥 · (+∞) = +∞, 𝑥 · (−∞) = −∞, se 𝑥 > 0
𝑥 · (+∞) = −∞, 𝑥 · (−∞) = +∞, se 𝑥 < 0.

Si definiscono anche:
1 1
−(+∞) = −∞, −(−∞) = +∞, = =0
+∞ −∞
facendo però attenzione che questi formalmente non sono opposto e reciproco
in quanto su ℝ̄ non sono più garantite le regole: 𝑥 + (−𝑥) = 0 e 𝑥 · (1/𝑥) = 1.
Infatti le operazioni (+∞) + (−∞) e +∞ · 0 vengono lasciate indefinite.
Definiamo anche il valore assoluto: |+∞| = |−∞| = +∞.
Possiamo infine definire la sottrazione e la divisione tramite addizione e
moltiplicazione:
𝑥 1
𝑥 − 𝑦 = 𝑥 + (−𝑦), =𝑥· .
𝑦 𝑦

Possiamo definire gli operatori sup e inf anche sugli insiemi illimitati ponendo:

sup 𝐴 = +∞ se 𝐴 non è superiormente limitato


inf 𝐴 = −∞ se 𝐴 non è inferiormente limitato.

Osserviamo infatti che su ℝ̄ la quantità +∞ è maggiorante di qualunque insieme


e −∞ è minorante, dunque queste definizioni mantengono su ℝ̄ le proprietà
caratterizzanti: l’estremo superiore è il minimo dei maggioranti e l’estremo
inferiore è il massimo dei minoranti. Definiamo infine

sup ∅ = −∞
inf ∅ = +∞.

Queste ultime definizioni possono essere comprese da un punto di vista


strettamente logico: ogni numero reale è sia maggiorante che minorante
dell’insieme vuoto, dunque il minimo dei maggioranti non esiste in ℝ ma in ℝ̄
è −∞ e il massimo dei minoranti è +∞.
1.23 intervalli 53

1.23 intervalli
intervallo
Definizione 1.64 (intervallo). Un insieme 𝐼 ⊆ ℝ̄ si dice essere un intervallo se
contiene tutti i punti intermedi:

se 𝑥, 𝑦 ∈ 𝐼 e 𝑥 < 𝑧 < 𝑦 allora 𝑧 ∈ 𝐼 .

Teorema 1.65 (caratterizzazione intervalli di ℝ). Sia 𝐼 ⊆ ℝ un intervallo e siano


𝑎 = inf 𝐼 , 𝑏 = sup 𝐼 i suoi estremi. Allora 𝑧 ∈ 𝐼 se 𝑎 < 𝑧 < 𝑏 .

Dimostrazione. Se 𝐼 = ∅ si ha 𝑎 > 𝑏 e quindi nessuno 𝑧 verifica 𝑎 < 𝑧 < 𝑏 .


Supponiamo 𝐼 ≠ ∅ e sia 𝑎 < 𝑧 < 𝑏 . Visto che 𝑎 è il massimo dei minoranti di
𝐼 il numero 𝑧 non è un minorante dunque deve esistere 𝑥 ∈ 𝐼 tale che 𝑥 < 𝑧 .
Analogamente dovrebbe esistere 𝑦 ∈ 𝐼 con 𝑧 < 𝑦 . Ma allora, per definizione di
intervallo, anche 𝑧 ∈ 𝐼 .

Il teorema precedente ci dice che una volta identificati i due estremi di un


intervallo, tutti i punti intermedi devono stare nell’intervallo. Gli estremi,
invece, possono essere o non essere inclusi nell’intervallo. Punti esterni agli
estremi non possono invece essere elementi dell’intervallo. Possiamo quindi
caratterizzare tutti gli intervalli di ℝ introducendo le seguenti notazioni. Dati
𝑎, 𝑏 ∈ ℝ̄ con 𝑎 ≤ 𝑏 tutti i possibili intervalli con estremi 𝑎 e 𝑏 sono i seguenti:

[𝑎, 𝑏] = 𝑥 ∈ ℝ̄ : 𝑎 ≤ 𝑥 ≤ 𝑏


[𝑎, 𝑏) = 𝑥 ∈ ℝ̄ : 𝑎 ≤ 𝑥 < 𝑏

(1.16)
(𝑎, 𝑏] = 𝑥 ∈ ℝ̄ : 𝑎 < 𝑥 ≤ 𝑏


(𝑎, 𝑏) = 𝑥 ∈ ℝ̄ : 𝑎 < 𝑥 < 𝑏 .




Abbiamo utilizzato le parentesi quadre per indicare che gli estremi sono inclusi
e le parentesi tonde per indicare che gli estremi sono esclusi. Osserviamo che
in alcuni testi si usano le parentesi quadre rovesciate al posto delle parentesi
tonde.

Noi considereremo per lo più intervalli di ℝ (non di ℝ̄): in tal caso gli estremi
infiniti non potranno mai essere inclusi nell’intervallo.

1.24 andamento del grafico di una funzione

Se 𝑓 : 𝐴 ⊆ ℝ → ℝ è una funzione, un modo molto utile di rappresentarla


graficamente è quello di disegnarne il grafico, ovvero la curva del piano
cartesiano:
𝐺 𝑓 = {(𝑥, 𝑦) ∈ 𝐴 × ℝ : 𝑦 = 𝑓 (𝑥)}.
Molte proprietà della funzione potranno essere riconosciute geometricamente
guardandone il grafico.

Definizione 1.66 (simmetrie). Sia 𝑓 : 𝐴 ⊆ ℝ → ℝ una funzione. Diremo che 𝑓 è:


pari
54 1 fondamenti

1. pari se 𝐴 = −𝐴 (significa che se 𝑥 ∈ 𝐴 allora anche −𝑥 ∈ 𝐴) e

𝑓 (−𝑥) = 𝑓 (𝑥);

dispari
2. dispari se 𝐴 = −𝐴 e
𝑓 (−𝑥) = − 𝑓 (𝑥);

periodica
3. periodica di periodo 𝑇 se 𝐴 + 𝑇 = 𝐴 (significa che 𝑥 ∈ 𝐴 ⇐⇒ 𝑥 + 𝑇 ∈ 𝐴)
se per ogni 𝑥 ∈ 𝐴 si ha
𝑓 (𝑥 + 𝑇) = 𝑓 (𝑥)

Ad esempio se 𝑛 ∈ ℤ la funzione 𝑓 (𝑥) = 𝑥 𝑛 è pari se 𝑛 è pari ed è dispari se 𝑛 è


dispari. Il grafico di una funzione dispari ha una simmetria centrale, in quanto
se (𝑥, 𝑓 (𝑥)) ∈ 𝐺 𝑓 allora anche (−𝑥, − 𝑓 (𝑥)) = (−𝑥, 𝑓 (−𝑥)) ∈ 𝐺 𝑓 . Il grafico di
una funzione pari ha invece una simmetria rispetto all’asse delle ordinate 𝑥 = 0
infatti se (𝑥, 𝑓 (𝑥)) ∈ 𝐺 𝑓 allora (−𝑥, 𝑓 (𝑥)) = (−𝑥, 𝑓 (−𝑥)) ∈ 𝐺 𝑓 .

La funzione 𝑓 (𝑥) = 𝑥 − b𝑥c (la parte frazionaria di 𝑥 ) è un esempio di funzione


periodica di periodo 𝑇 = 1. Infatti è chiaro che b𝑥 + 1c = b𝑥c + 1 e quindi
𝑓 (𝑥 + 1) = 𝑓 (𝑥).

Si osservi che dispari per le funzioni non è la negazione di pari. La funzione


𝑓 (𝑥) = 𝑥 + 1 non è né pari, né dispari, né periodica (verificare).

Definizione 1.67 (zeri). Se 𝑓 : 𝐴 ⊆ ℝ → ℝ è una funzione diremo che 𝑥 ∈ 𝐴 è uno


insieme degli zeri zero di 𝑓 se 𝑓 (𝑥) = 0. L’insieme degli zeri è quindi dato da

𝑓 −1 ({0}) = {𝑥 ∈ ℝ : 𝑓 (𝑥) = 0}.

Abbiamo già accennato al fatto che uno dei problemi più comuni in matematica
è quello di invertire una funzione. In particolare dato 𝑦 ∈ ℝ ci si chiede quali
siano gli 𝑥 ∈ ℝ tali che 𝑓 (𝑥) = 𝑦 . Questo problema si riconduce a trovare gli
zeri della funzione 𝑓 (𝑥) − 𝑦 e per questo motivo siamo interessati allo studio
degli zeri.

Riprendiamo ora la definizione 1.52 (monotonia) che da ora in avanti potrà


essere applicata alle funzioni 𝑓 : 𝐴 → ℝ definite su un insieme 𝐴 ⊆ ℝ.

Dal punto di vista grafico una funzione 𝑓 è crescente se preso qualunque punto
(𝑥, 𝑓 (𝑥)) sul grafico della funzione e tracciati gli assi paralleli agli assi cartesiani,
passanti per il punto fissato, si osserva che il grafico della funzione è tutto
contenuto nel primo e terzo quadrante determinati dagli assi traslati.

E’ facile verificare che la funzione 𝑓 : [0 , +∞) → ℝ definita da 𝑓 (𝑥) = 𝑥 𝑛


è strettamente crescente se 𝑛 è un intero positivo. Se però consideriamo la
funzione definita su tutto ℝ: 𝑓 : ℝ → ℝ, 𝑓 (𝑥) = 𝑥 𝑛 allora solo se 𝑛 è dispari la
funzione rimane strettamente crescente (le funzioni pari non possono mai essere
strettamente crescenti se il loro dominio contiene almeno tre punti distinti).

Se una funzione non è monotona è piuttosto comune studiare la monotonia


della funzione ristretta a particolari intervalli: su alcuni intervalli la funzione
(ristretta) potrà essere crescente e su altri intervalli potrà essere decrescente.
1.25 funzioni lineari 55

Esercizio 1.68. Verificare che la composizione di funzioni monotone è una funzione


monotona e la composizione di funzioni strettamente monotone è strettamente monotona.
Quando è che la funzione composta risulta crescente? Quando decrescente?

Esercizio 1.69. Si dimostri che applicando una funzione strettamente crescente ai due
membri di una equazione o disequazione (stretta o larga che sia) si ottiene una equazione
o disequazione equivalente. Ovviamente è necessario che la funzione sia definita dove
viene applicata.

Lo stesso vale per le funzioni strettamente decrescenti se però si cambia il verso della
disequazione.

Definizione 1.70 (funzioni limitate, massimo/minimo). Se 𝑓 : 𝐴 → ℝ è una


funzione allora definiamo l’estremo superiore di 𝑓 come l’estremo superiore dell’immagine
di 𝑓 :
sup 𝑓 = sup 𝑓 (𝑥) = sup 𝑓 (𝐴).
𝑥∈𝐴

In maniera analoga si definiscono l’estremo inferiore inf 𝑓 , il massimo max 𝑓 e il


minimo min 𝑓 .

Dunque il massimo di una funzione è (se esiste) il valore massimo che la funzione può
assumere. I punti 𝑥 in cui la funzione assume il valore massimo 𝑓 (𝑥) vengono chiamati
punti di massimo. Analogamente i punti in cui la funzione assume il valore minimo punto di massimo/minimo
(sempre che esistano) vengono chiamati punti di minimo.

Diremo che la funzione 𝑓 è superiormente limitata se sup 𝑓 < +∞ ovvero se esiste funzione superiormente limitata
𝑀 ∈ ℝ tale che
∀𝑥 ∈ 𝐴 : 𝑓 (𝑥) ≤ 𝑀.
Diremo che la funzione 𝑓 è inferiormente limitato se inf 𝑓 > −∞ ovvero se esiste funzione inferiormente limitata
𝑀 ∈ ℝ tale che
∀𝑥 ∈ 𝐴 : 𝑓 (𝑥) ≥ 𝑀.
Diremo che la funzione 𝑓 è limitata se è sia superiormente che inferiormente limitata funzione limitata
ovvero se sup | 𝑓 | < +∞ cioè se esiste 𝑀 ∈ ℝ tale che funzione lineare
Attenzione: nell’ambito dell’algebra li-
∀𝑥 ∈ 𝐴 : | 𝑓 (𝑥)| ≤ 𝑀. neare queste funzioni verrebbero chia-
mate lineari affini, mentre le funzioni li-
neari dovrebbero sempre avere 𝑞 = 0.
Nel seguente esercizio abbiamo un esempio di funzione limitata.
Noi invece (come spesso accade nell’am-
bito dell’analisi) chiameremo lineari que-
Esercizio 1.71. Si consideri la funzione 𝑓 : ℝ → ℝ ste funzioni e chiameremo lineari omoge-
nee quelle con 𝑞 = 0. Il termine lineare
1 pervade tutta la matematica e si applica
𝑓 (𝑥) = . in particolare alle equazioni che si otten-
1 + 𝑥2 gono tramite le funzioni lineari. Purtrop-
po il nome scelto è fuorviante: la parola
Verificare che max 𝑓 = sup 𝑓 = 1, che 0 è l’unico punto di massimo, che inf 𝑓 = 0 e linea viene usata a volte come abbrevia-
che min 𝑓 non esiste. zione di linea retta, quando invece sareb-
be più giusto utilizzare l’abbreviazione
retta in quanto una linea può benissimo
essere curva. In altri contesti (come ad
1.25 funzioni lineari esempio nell’ambito degli ordinamenti)
il termine lineare rappresenta un ogget-
to unidimensionale senza ramificazioni
Le funzioni lineari 𝑓 : ℝ → ℝ sono le funzioni per le quali esistono 𝑚, 𝑞 ∈ ℝ tali ed è quindi maggiormente aderente al
significato originale della parola.
56 1 fondamenti

𝑦 = 𝑚𝑥 + 𝑞

𝑓 (𝑥2 )
Δ 𝑓 (𝑥)
𝑓 (𝑥1 )
Δ𝑥

𝑥1 𝑥2

Figura 1.7: Il grafico di una funzione


lineare.

che
𝑓 (𝑥) = 𝑚𝑥 + 𝑞.

Se prendiamo due punti (𝑥 1 , 𝑓 (𝑥 1 )) e (𝑥 2 , 𝑓 (𝑥 2 )) sul grafico di una funzione


lineare possiamo osservare che si ha

𝑓 (𝑥2 ) − 𝑓 (𝑥1 )
= 𝑚.
𝑥2 − 𝑥1

Il coefficiente 𝑚 , dunque, rappresenta la pendenza del grafico di 𝑓 , ovvero il


rapporto tra la variazione dei valori della funzione Δ 𝑓 = 𝑓 (𝑥 2 ) − 𝑓 (𝑥 1 ) e la
variazione della variabile in ingresso Δ𝑥 = 𝑥 2 − 𝑥 1 . Geometricamente questo è
il rapporto tra i due cateti (base e altezza) che formano un triangolo rettangolo
la cui ipotenusa è il segmento che congiunge i due punti sul grafico. Il fatto che
questo rapporto sia costante significa, in base al teorema di Talete, che i punti
del grafico sono allineati ovvero che il grafico di una funzione lineare è, dal
punto di vista geometrico, una retta.

Definizione 1.72 (retta). Una linea retta (più semplicemente: retta) in è un


sottospazio affine di dimensione 1 ovvero la traslazione di un sottospazio vettoriale di
dimensione 1 (si rimanda al corso di geometria).

Tutte le rette del piano, tranne quelle parallele all’asse delle ordinate, sono
grafico di una funzione lineare.
Si osservi che per 𝑚 > 0 la funzione è strettamente crescente, per 𝑚 = 0 la
funzione è costante e per 𝑚 < 0 la funzione è strettamente decrescente.

1.26 funzioni quadratiche

polinomio di secondo grado


Le funzioni espresse mediante un polinomio di secondo grado

𝑓 (𝑥) = 𝑎𝑥 2 + 𝑏𝑥 + 𝑐 (1.17)

funzioni quadratiche
con 𝑎, 𝑏, 𝑐 ∈ ℝ, 𝑎 ≠ 0, si possono chiamare funzioni quadratiche.
Il modello di funzione quadratica è la funzione 𝑓 (𝑥) = 𝑥 2 che (come tutte
le potenze di esponente positivo e pari) risulta essere una funzione pari,
strettamente crescente sull’intervallo [0 , +∞) e strettamente decrescente su
1.26 funzioni quadratiche 57

𝑥 = − 2𝑏𝑎

𝑦 = 𝑎𝑥 2 + 𝑏𝑥 + 𝑐

𝑥1 𝑥2
Figura 1.8: Il grafico di una funzione
quadratica.

(−∞, 0]. La funzione assume solamente valori non negativi e si annulla solo
per 𝑥 = 0. Dunque l’equazione
𝑥2 = 𝑏
non ha soluzione se 𝑏 < 0 ed ha come unica soluzione 𝑥 = 0 se 𝑏 = 0.√Se 𝑏 > 0
sappiamo che questa equazione ha una unica soluzione √ positiva 𝑥1 = 𝑏 e, per
simmetria, ha anche
√ una soluzione negativa 𝑥 2 = − 𝑏 . Sintetizzando si usa
scrivere 𝑥 1,2 = ± 𝑏 per unire in una unica riga le due definizioni.

La generica funzione quadratica (1.17) può essere ricondotta al caso modello


tramite un cambio di variabile lineare. In pratica si cerca di comporre il quadrato
di un binomio con un procedimento chiamato completamento del quadrato: completamento del quadrato

𝑏 𝑐
 
𝑓 (𝑥) = 𝑎𝑥 + 𝑏𝑥 + 𝑐 = 𝑎 𝑥 + 𝑥 +
2 2
𝑎 𝑎
𝑏 𝑏2 𝑏2 𝑐
 
= 𝑎 𝑥 +2 𝑥+ 2 − 2 +
2
2𝑎 4𝑎 4𝑎 𝑎
" 2 # (1.18)
𝑏 𝑏 2 − 4 𝑎𝑐
=𝑎 𝑥+ −
2𝑎 4𝑎2
2
𝑏 𝑏 2 − 4 𝑎𝑐

=𝑎 𝑥+ − .
2𝑎 4𝑎

Ponendo 𝑋 = 𝑥 + 2𝑏𝑎 e 𝑌 = 𝑦 + 𝑏 −4 𝑎4 𝑎𝑐 l’equazione 𝑦 = 𝑎𝑥 2 + 𝑏𝑥 + 𝑐 diventa


2

quindi 𝑌 = 𝑎𝑋 2 . Significa che il grafico della funzione quadratica (1.17) si


ottiene traslando la curva 𝑦 = 𝑎𝑥 2 che, dal punto di vista geometrico, si può
facilmente dimostrare essere una parabola con fuoco nel punto di coordinate
0 , 41𝑎 e asse la retta di equazione 𝑥 = 0. Dunque il grafico di ogni funzione

quadratica è una parabola, e più precisamente: ogni parabola con direttrice
parallela all’asse delle ascisse è il grafico di una funzione quadratica.

Definizione 1.73 (parabola). Una parabola con fuoco nel punto 𝑭 = (𝐹1 , 𝐹2 ) ∈ ℝ × ℝ
e retta direttrice la retta 𝑟 ⊆ ℝ × ℝ è l’insieme dei punti 𝒙 = (𝑥 1 , 𝑥 2 ) ∈ ℝ × ℝ
equidistanti da 𝑭 e da 𝑟 :
 p q 
𝒙 ∈ ℝ × ℝ: (𝑥1 − 𝐹1 )2 + (𝑥2 − 𝐹2 )2 = inf (𝑥1 − 𝑃1 )2 + (𝑦1 − 𝑃1 )2 .
𝑷∈𝑟
58 1 fondamenti

Esercizio 1.74. Si dimostri che per ogni 𝑎 ≠ 0 esiste 𝑠 ≠ 0 per cui il riscalamento
𝑋 = 𝑠𝑥 , 𝑌 = 𝑠 𝑦 porta il grafico della parabola 𝑦 = 𝑎𝑥 2 nel grafico della parabola
𝑌 = 𝑋 2 . Significa che a meno di isometrie e riscalamenti c’è una unica parabola.

Ricordando le proprietà di monotonia della funzione 𝑋 ↦→ 𝑋 2 possiamo dedurre


 se 𝑎 > 0 la funzione 𝑓 (𝑥) è strettamente decrescente se ristretta all’intervallo
che 
−∞, − 2𝑏𝑎 ed è invece strettamente crescente sull’intervallo − 2𝑏𝑎 , +∞ . Ha
 

dunque un punto di minimo in 𝑥 = − 2𝑏𝑎 . Inoltre (sempre se 𝑎 > 0) la funzione


è superiormente illimitata. Viceversa se 𝑎 < 0 la funzione è inferiormente
illimitata ed ha un massimo nel punto 𝑥 = − 2𝑏𝑎 .
E’ molto importante saper risolvere equazioni e disequazioni quadratiche.
Grazie a (1.18) l’equazione

𝑎𝑥 2 + 𝑏𝑥 + 𝑐 = 0

risulta equivalente a
2
𝑏 𝑏 2 − 4 𝑎𝑐

𝑥+ = .
2𝑎 4𝑎2
Dunque se 𝑏 2 − 4 𝑎𝑐 < 0 l’equazione 𝑎𝑥 2 + 𝑏𝑥 + 𝑐 = 0 non ha soluzioni. Se
𝑏 2 − 4 𝑎𝑐 = 0 l’equazione ha una unica soluzione 𝑥 = − 2𝑏𝑎 . Infine se 𝑏 2 − 4 𝑎𝑐 > 0
si ottiene √
𝑏 𝑏 2 − 4 𝑎𝑐
𝑥+ =±
2𝑎 2𝑎
da cui la famosa formula risolutiva

−𝑏 ± 𝑏 2 − 4 𝑎𝑐
𝑥 1 ,2 = . (1.19)
2𝑎

Risolvendo le disequazioni allo stesso modo, si trova che la funzione 𝑎𝑥 2 + 𝑏𝑥 + 𝑐


quando 𝑎 > 0 è positiva nei punti esterni alle soluzioni dell’equazione (in tutti
i punti se le soluzioni non esistono) ed è negativa nei punti interni alle due
soluzioni. Viceversa se 𝑎 < 0 la funzione è positiva all’interno delle due
soluzioni e negativa all’esterno.

1.27 equazioni e disequazioni

Un problema matematico molto comune è quello di dover risolvere equazioni e


disequazioni del tipo:

𝑓 (𝑥) = 𝑏, 𝑓 (𝑥) ≥ 𝑏, 𝑓 (𝑥) > 𝑏, 𝑓 (𝑥) ≤ 𝑏, 𝑓 (𝑥) < 𝑏 (1.20)

dove 𝑓 : 𝐴 ⊆ ℝ → ℝ è una funzione data e 𝑏 ∈ ℝ è fissato.


Quando 𝑓 è strettamente crescente e 𝑏 ∈ 𝑓 (𝐴) la soluzione può essere scritta
banalmente: ovviamente deve essere 𝑥 ∈ 𝐴 e ogni equazione o disequazione
in (1.20) avrà la corrispondente soluzione:

𝑥 = 𝑓 −1 (𝑏), 𝑥 ≥ 𝑓 −1 (𝑏), 𝑥 > 𝑓 −1 (𝑏), 𝑥 ≤ 𝑓 −1 (𝑏), 𝑥 < 𝑓 −1 (𝑏).


1.27 equazioni e disequazioni 59

Se la funzione fosse strettamente decrescente si può procedere allo stesso modo,


ma le disuguaglianze si invertono. Se la funzione fosse strettamente crescente su
alcuni intervalli e strettamente decrescente su altri si potranno separare i diversi
casi e si otterranno più soluzioni espresse da uguaglianze o disuguaglianze.

Esempio 1.75. Si risolva la disequazione


hp i
(𝑥 + 1)4 − 3 − 2 ≤ 3.
3
log2

Svolgimento. La funzione logaritmo è strettamente crescente ed è definita quan-


do l’argomento è positivo. Dunque la disequazione data è equivalente al sistema
di disequazioni:
p3
0< (𝑥 + 1)4 − 3 − 2 ≤ 8.
Possiamo sommare 2 per ottenere
p3
2< (𝑥 + 1)4 − 3 ≤ 10.

La funzione radice cubica è strettamente crescente su tutto ℝ quindi possiamo


invertirla elevando tutto al cubo:

8 < (𝑥 + 1)4 − 3 ≤ 1000.

Sommiamo 3:
11 < (𝑥 + 1)4 ≤ 1003.
L’elevamento alla quarta potenza è strettamente crescente solo quando l’argo-
mento è positivo, ed è una funzione pari. Possiamo quindi affermare che le
nostre disequazioni sono equivalenti all’unione delle soluzioni di due sistemi:
√4 √4 √4 √4
11 < 𝑥 + 1 ≤ 1003 o − 1003 ≤ 𝑥 + 1 < 11.

Sottraendo 1 otteniamo infine


√4 √4 √4 √4
11 − 1 < 𝑥 ≤ 1003 − 1 o − 1003 − 1 ≤ 𝑥 < 11 − 1.

In definitiva l’insieme delle soluzioni è


h √
4
√4  √
4
√4 i
− 1003 − 1 , 11 − 1 ∪ 11 − 1 , 1003 − 1 .

hp i
Nell’esempio precedente la funzione 𝑓 (𝑥) = log2 3
(𝑥 + 1)4 − 3 − 2 è ottenuta
mediante composizione di funzioni elementari:
√3
𝑓 = (𝑥 ↦→ log2 𝑥) ◦ (𝑥 ↦→ 𝑥 − 2) ◦ (𝑥 ↦→ 𝑥)
◦ (𝑥 ↦→ 𝑥 − 3) ◦ (𝑥 ↦→ 𝑥 ) ◦ (𝑥 ↦→ 𝑥 + 1).
4
60 1 fondamenti

Negli intervalli in cui tutte queste funzioni sono invertibili la funzione inversa
si ottiene componendo, in ordine opposto, tutte le inverse:
√4
𝑓 −1 = (𝑥 ↦→ 𝑥 − 1) ◦ (𝑥 ↦→ 𝑥) ◦ (𝑥 ↦→ 𝑥 + 3)
◦ (𝑥 ↦→ 𝑥 3 ) ◦ (𝑥 ↦→ 𝑥 + 2) ◦ (𝑥 ↦→ 2𝑥 ).
√4
In effetti il caposaldo 1003 − 1 è proprio tale funzione valutata in 𝑏 = 3.

Il metodo precedente è puramente algebrico e si applica alle equazioni come


la (1.20) dove la variabile 𝑥 compare una sola volta e dove la funzione 𝑓 si
esprime come composizione di funzioni elementari di cui sappiamo scrivere la
funzione inversa.

Ben diverso è il caso in cui nell’equazione la variabile 𝑥 compare più di una


volta. In alcuni casi, come ad esempio,

𝑥 2 > 2𝑥 − 1

queste equazioni possono essere ricondotte al caso precedente tramite opportune


manipolazioni algebriche. Il caso delle equazioni quadratiche lo abbiamo fatto
nel paragrafo precedente utilizzato il completamento del quadrato: 𝑥 2 − 2 𝑥 =
(𝑥 − 1)2 − 1. In altri casi, come ad esempio l’equazione

2𝑥 = 𝑥 2

le manipolazioni algebriche non sono utili. Nel capitolo sul calcolo differenziale
svilupperemo degli strumenti che ci permetteranno di determinare l’andamento
di molte di queste di funzioni. Nel capitolo sulle successioni svilupperemo
invece gli strumenti che ci permetteranno di determinare le soluzioni mediante
algoritmi di approssimazione. Questi strumenti presuppongono il concetto di
limite e continuità: è sostanzialmente questo che identifica la materia chiamata
analisi matematica.

1.28 i numeri complessi


numeri complessi
Dal punto di vista geometrico l’insieme ℂ dei numeri complessi può essere visto
come un modello del piano euclideo. Sul piano euclideo fissiamo arbitrarimente
un punto 0 in modo da ottenere uno spazio vettoriale e fissiamo, arbitrariamente,
una base 𝑒1 , 𝑒2 . Identifichiamo ogni punto del piano con i corrispondenti vettori
applicati in 0. La retta generata dal vettore 𝑒1 la identifichiamo con la retta ℝ
dei numeri reali e quindi poniamo 1 = 𝑒1 . La retta ortogonale generata dal
vettore 𝑒2 verrà chiamata retta dei numeri immaginari e definiamo 𝑖 = 𝑒2 .

Un generico punto 𝑧 del piano ℂ potrà essere scritto in maniera univoca nella
base scelta: 𝑧 = 𝑥𝑒1 + 𝑦𝑒2 ovvero, per come abbiamo chiamato 𝑒1 ed 𝑒2 :

𝑧 = 𝑥 + 𝑖 𝑦.

Tale 𝑧 viene chiamato numero complesso con parte reale 𝑥 e parte immaginaria
𝑦 . Questa rappresentazione del numero complesso 𝑧 viene chiamata rappre-
1.28 i numeri complessi 61

sentazione cartesiana in quanto definisce il punto 𝑧 del piano complesso tramite rappresentazione cartesiana
le sue coordinate cartesiane 𝑥 e 𝑦 . I numeri reali sono immersi nei complessi,
nel senso che se 𝑥 ∈ ℝ allora 𝑧 = 𝑥 + 𝑖 · 0 = 𝑥 è anche un numero complesso.
Il numero complesso 𝑖 = 0 + 𝑖 · 1 viene chiamata unità immaginaria e i numeri unità immaginaria
complessi della forma 𝑖 𝑦 sono chiamati immaginari. Un numero complesso
𝑧 = 𝑥 + 𝑖 𝑦 è quindi una somma tra un numero reale ed un numero immaginario.
Il numero reale 𝑥 viene chiamato parte reale di 𝑧 e si denota con 𝑥 = Re 𝑧 . Il Re 𝑧
numero reale 𝑦 viene chiamato parte immaginaria di 𝑧 e si denota con 𝑦 = Im 𝑧
(osserviamo che la parte immaginaria di un numero complesso è un numero Im 𝑧

reale, non immaginario). Dunque 𝑧 = Re 𝑧 + 𝑖 Im 𝑧 .

L’insieme ℂ, per come è stato costruito, è uno spazio vettoriale reale di di-
mensione 2. Abbiamo quindi già definite la addizione tra elementi di ℂ e la addizione
moltiplicazione tra elementi di ℂ ed elementi di ℝ, se 𝑎, 𝑏, 𝑐, 𝑑, 𝑡 ∈ ℝ si ha:

(𝑎 + 𝑖𝑏) + (𝑐 + 𝑖𝑑) = (𝑎 + 𝑐) + 𝑖(𝑏 + 𝑑),


𝑡(𝑎 + 𝑖𝑏) = 𝑡 𝑎 + 𝑖𝑡𝑏.

Vogliamo estendere la moltiplicazione a tutte le coppie di numeri complessi. moltiplicazione


Imponendo (arbitrariamente) che valga 𝑖 · 𝑖 = −1 e che rimanga valida la
proprietà distributiva, si ottiene questa definizione:

(𝑎 + 𝑖𝑏) · (𝑐 + 𝑖𝑑) = (𝑎𝑐 − 𝑏𝑑) + 𝑖(𝑎𝑑 + 𝑏𝑐).

Si può verificare che questa moltiplicazione estende quella “scalare” definita in


precedenza. E’ anche facile verificare che addizione e moltiplicazione soddisfano
le proprietà commutativa associativa e distributiva, che 0 è elemento neutro per
la addizione, che 1 è elemento neutro della moltiplicazione. Si osservi che se
𝑧 = 𝑥 + 𝑖 𝑦 non è nullo, allora

𝑥 − 𝑖𝑦
(𝑥 + 𝑖 𝑦) · = 1.
𝑥2 + 𝑦2

Significa che ogni 𝑧 ≠ 0 ammette inverso moltiplicativo e quindi ℂ risulta essere


un campo.

Osserviamo che su ℂ non si definisce una relazione d’ordine perché in effetti


non è possibile definire un ordine “compatibile” con le operazioni appena Se ℂ fosse un campo ordinato per assur-
definite. do si dovrebbe avere, che 𝑧 2 ≥ 0 per ogni
𝑧 ∈ ℂ (questo è vero in tutti i campi or-
Su ℂ definiamo delle ulteriori operazioni. Il coniugato di un numero complesso dinati). Ma allora −1 = 𝑖 2 ≥ 0 cioè 1 ≤ 0
che è in contraddizione con la proprietà
𝑧 = 𝑥 + 𝑖 𝑦 è il numero 𝑧¯ = 𝑥 − 𝑖 𝑦 . Geometricamente l’operazione di coniugio
0 < 1 valida in ogni campo ordinato.
è una simmetria rispetto alla retta reale. I numeri reali sono in effetti punti
fissi del coniugio (il coniugato di un numero reale è il numero stesso). E’ un coniugato
semplice esercizio verificare che il coniugio “attraversa” somma e prodotto:

𝑧 + 𝑤 = 𝑧¯ + 𝑤,
¯ 𝑧 · 𝑤 = 𝑧¯ · 𝑤.
¯

Ovviamente risulta 𝑧¯ = 𝑧 . E’ anche utile osservare che si ha:


𝑧 + 𝑧¯ 𝑧 − 𝑧¯
Re 𝑧 = , Im 𝑧 = (1.21)
2 2𝑖
62 1 fondamenti

e
𝑧 · 𝑧¯ = (𝑥 + 𝑖 𝑦)(𝑥 − 𝑖 𝑦) = 𝑥 2 − 𝑖 2 𝑦 2 = 𝑥 2 + 𝑦 2 .

modulo Possiamo allora definire il modulo di un numero complesso 𝑧 = 𝑥 + 𝑖 𝑦 come il


numero reale
√ q
|𝑧| = 𝑧 · 𝑧¯ = 𝑥 2 + 𝑦 2 .

Geometricamente tale quantità rappresenta la distanza del punto 𝑧 dal punto 0


e quindi la distanza tra due numeri complessi 𝑧 e 𝑤 si potrà rappresentare con
|𝑧 − 𝑤| .

Osserviamo
√ che se 𝑧 = 𝑥 ∈ ℝ ⊆ ℂ il modulo di 𝑧 coincide con il valore assoluto:
|𝑧| = 𝑥 2 = |𝑥| e per questo motivo non distinguiamo, nelle notazioni, il
modulo dal valore assoluto. Più in generale risulta per ogni 𝑧 ∈ ℂ (la verifica è
immediata):
| Re 𝑧| ≤ |𝑧|, | Im 𝑧| ≤ |𝑧|.

Possiamo a questo punto trovare una utile formula per calcolare il reciproco di
un numero complesso. Essendo infatti 𝑧 · 𝑧¯ = |𝑧| 2 si osserva che

1 𝑧¯ 𝑧¯
= = .
𝑧 𝑧¯ · 𝑧 |𝑧| 2

Teorema 1.76. Il modulo di un numero complesso soddisfa (come il valore assoluto) le


seguenti proprietà

1. |𝑧| = |𝑧| ,
2. |−𝑧| = |𝑧| = | 𝑧¯ | ,
3. |𝑧 · 𝑤| = |𝑧| · |𝑤| .
4. |𝑧 + 𝑤| ≤ |𝑧| + |𝑤| (convessità),
5. |𝑧 − 𝑤| ≤ |𝑧 − 𝑣| + |𝑣 − 𝑤| (disuguaglianza triangolare),

Dimostrazione. La prima proprietà è ovvia in quanto il valore assoluto di un


numero reale non negativo è il numero stesso.

La seconda proprietà viene immediatamente dalla definizione.

Per la terza proprietà sia 𝑧 = 𝑥 + 𝑖 𝑦 , 𝑤 = 𝑎 + 𝑖𝑏 . Allora:

|𝑧 · 𝑤| = |(𝑥 + 𝑖 𝑦) · (𝑎 + 𝑖𝑏)| = |𝑥𝑎 − 𝑦𝑏 + 𝑖(𝑥𝑏 + 𝑎 𝑦)|


q
= (𝑥𝑎 − 𝑦𝑏)2 + (𝑥𝑏 + 𝑎 𝑦)2
q
= 𝑥 2 𝑎 2 + 𝑦 2 𝑏 2 − 2 𝑥𝑎 𝑦𝑏 + 𝑥 2 𝑏 2 + 𝑎 2 𝑦 2 + 2 𝑥𝑏𝑎 𝑦
q
= 𝑥2 𝑎2 + 𝑦2𝑏2 + 𝑥2𝑏2 + 𝑎2 𝑦2
q
= 𝑥 2 (𝑎 2 + 𝑏 2 ) + 𝑦 2 (𝑎 2 + 𝑏 2 )
q
= (𝑥 2 + 𝑦 2 )(𝑎 2 + 𝑏 2 ) = |𝑥 + 𝑖 𝑦| · |𝑎 + 𝑖𝑏|
= |𝑧| · |𝑤|.
1.28 i numeri complessi 63

Figura 1.9: Consideriamo i numeri com-


plessi 𝑧 = 𝑎 + 𝑖𝑏 e 𝑤 = 𝛼 + 𝑖𝛽 e suppo-
𝑦 niamo che sia 𝛼 2 = 𝑎 2 + 𝑏 2 . Si consideri
𝑢 il punto 𝑢 che si ottiene ruotando il pun-
to 𝑤 dell’angolo individuato dal punto
𝑧 . Si avrà allora 𝑢 = 𝑎 − 𝑠 + 𝑖(𝑏 + 𝑡)
𝛽 dove 𝑠 e 𝑡 sono i cateti del triangolo
𝑡 𝑤 rettangolo con ipotenusa 𝛽 . Grazie alle
proprietà di similitudine dei triangoli
𝑠
𝑧 si ha 𝛽𝑠 = 𝛼𝑏 e 𝛽𝑡 = 𝛼𝑎 da cui si ottiene
𝑏𝛽 𝑎𝛽
𝛼 quindi 𝑢 = 𝑎 − 𝛼 + 𝑖(𝑏 + 𝛼 ) ovvero
𝑏 𝛼𝑢 = (𝑎𝛼 − 𝑏𝛽) + 𝑖(𝑏𝛼 + 𝑎𝛽) = 𝑧 · 𝑤 .
𝑥 Significa che il numero complesso 𝑧 · 𝑤
si trova sulla semiretta che individua un
0 𝑎 angolo che è la somma degli angoli indi-
viduati dai numeri complessi 𝑧 e 𝑤 .

Per la quarta disuguaglianza osserviamo che si ha

|𝑧 + 𝑤| 2 = (𝑧 + 𝑤) · (¯𝑧 + 𝑤)
¯ = |𝑧| 2 + |𝑤| 2 + 𝑧 · 𝑤¯ + 𝑧¯ · 𝑤

e visto che

𝑧 · 𝑤¯ + 𝑧¯ · 𝑤 = 𝑧 · 𝑤¯ + 𝑧 · 𝑤¯ = 2 Re(𝑧 𝑤)
¯ ≤ 2 |𝑧 𝑤|
¯ = 2 |𝑧| · | 𝑤|
¯ = 2 |𝑧| · |𝑤|

otteniamo
|𝑧 + 𝑤| 2 ≤ |𝑧| 2 + |𝑤| 2 + 2 |𝑧| · |𝑤| = (|𝑧| + |𝑤|)2
che è equivalente alla disuguaglianza di convessità.

La disuguaglianza triangolare è conseguenza immediata della convessità, infatti

|𝑧 − 𝑤| = |(𝑧 − 𝑣) + (𝑣 − 𝑤)| ≤ |𝑧 − 𝑣| + |𝑣 − 𝑤|.

Possiamo ora dare una interpretazione geometrica del prodotto 𝑧 · 𝑤 tra due
numeri complessi. In primo luogo sappiamo che |𝑧 · 𝑤| = |𝑧| · |𝑤| e dunque
il punto del piano che rappresenta il prodotto 𝑧 · 𝑤 si trova ad una distanza
dall’origine che è pari al prodotto delle distanze dei punti 𝑧 e 𝑤 . Inoltre l’angolo infinito
individuato da 𝑧 · 𝑤 rispetto all’asse delle 𝑥 positive risulta uguale alla somma
degli angoli individuati dai punti 𝑧 e 𝑤 come mostrato in figura 1.9. ∞

Anche il piano dei numeri complessi può essere esteso aggiungendoci un punto
all’infinito. A differenza dei reali, su cui era presente un ordinamento che era
utile conservare, nel caso dei numeri complessi è più usuale utilizzare un unico
punto infinito che si denota con ∞. Definiamo il piano dei complessi estesi ℂ̄
come
ℂ̄ = ℂ ∪ {∞}.
64 1 fondamenti

Definiamo

𝑧+∞=∞ ∀𝑧 ∈ ℂ
𝑧−∞=∞ ∀𝑧 ∈ ℂ
𝑧·∞=∞ ∀𝑧 ∈ ℂ̄ \ {0}
𝑧/∞ = 0 ∀𝑧 ∈ ℂ
𝑧/0 = ∞ ∀𝑧 ∈ ℂ̄ \ {0}
¯ =∞

|∞| = +∞ ∈ ℝ̄.

Si noti che abbiamo definito la divisione per zero di numeri complessi (e quindi
anche reali) diversi da zero. Il risultato è ∞ e quindi rimane confermato che la
divisione per zero non è una operazione valida se vogliamo un risultato finito.
Una quantità 𝑧 ∈ ℂ̄ sarà detta finita se 𝑧 ∈ ℂ.

Esempio 1.77. La funzione 𝑓 : ℂ̄ → ℂ̄ definita da

1
𝑓 (𝑧) =
𝑧

è una funzione bigettiva di ℂ̄ in sé. Dal punto di vista geometrico il coniugato di tale
funzione ovvero la funzione 𝑧 ↦→ 1𝑧¯ è l’inversione circolare rispetto al cerchio unitario di
ℂ: i punti sulla circonferenza unitaria vengono lasciati fissi, i punti all’interno vengono
mandati all’esterno rimanendo sullo stesso raggio uscente dall’origine e invertendo il
proprio modulo. I punti 0 e ∞ si scambiano.

Esercizio 1.78 (vertici di un triangolo equilatero). Si risolva l’equazione

𝑧3 − 1 = 0

nel campo complesso.

Svolgimento. Ricordiamo il prodotto notevole:

𝑧 3 − 1 = (𝑧 − 1)(𝑧 2 + 𝑧 + 1).

Dunque 𝑧 = 1 è una soluzione e le altre soluzioni devono risolvere l’equazione


𝑧 2 + 𝑧 + 1 = 0. Certamente 𝑧 = 0 non è soluzione e dunque possiamo dividere
per 𝑧 e ottenere:
1
𝑧 + 1 + = 0.
𝑧
Osserviamo ora che se 𝑧 è soluzione si ha 1 = 𝑧 3 e quindi: 1 = 𝑧 3 = |𝑧| 3 da cui

|𝑧| = 1. Ma allora 𝑧 · 𝑧¯ = |𝑧| 2 = 1 ovvero 1𝑧 = 𝑧¯ . Dunque si ha

𝑧 + 1 + 𝑧¯ = 0.

Osserviamo ora che se 𝑧 = 𝑥 + 𝑖 𝑦 con 𝑥, 𝑦 ∈ ℝ allora 𝑧 + 𝑧¯ = 2 𝑥 e quindi

2𝑥 + 1 = 0
1.28 i numeri complessi 65

da cui 𝑥 = − 12 . Essendo inoltre 𝑥 2 + 𝑦 2 = |𝑧| 2 = 1 si ottiene 𝑦 2 = 1 − 𝑥 2 = 3


4 da

cui 𝑦 = ± 23 .
L’equazione data ha quindi 3 soluzioni:

1 3
𝑧0 = 1, 𝑧 1 ,2 =− ±𝑖 .
2 2

Questi tre punti, se disegnati sul piano di Gauss, si trovano ai vertici di un


triangolo equilatero iscritto nella circonferenza unitaria. Infatti l’interpretazione
geometrica del prodotto di numeri complessi ci dice che il punto 𝑧 1 individua
sul piano di Gauss un angolo pari ad un terzo dell’angolo giro. Inoltre si ha
𝑧2 = 𝑧12 e dunque 𝑧2 corrisponde a 23 di angolo giro e 𝑧0 = 𝑧 13 = 1 rappresenta
l’angolo giro (o l’angolo nullo).
funzioni continue, limiti e
successioni 2
2.1 funzioni continue

Intuitivamente una funzione continua ha la proprietà che se in un punto 𝑥 0


assume un valore 𝑦0 = 𝑓 (𝑥 0 ) allora in punti abbastanza vicini ad 𝑥 0 i valori
assunti non saranno molto diversi dal valore 𝑦0 . Nella definizione seguente
questo viene formalizzato: fissato il punto 𝑥 0 e scelto un errore 𝜀 > 0 che siamo
disposti a commettere sui valori della funzione possiamo trovare un errore
𝛿 > 0 per cui nei punti che differiscono da 𝑥0 per meno di 𝛿 il valore della
funzione differisce da 𝑦0 per meno di 𝜀.

Definizione 2.1 (continuità su ℝ). Sia 𝑓 : 𝐴 ⊆ ℝ → ℝ una funzione. Diremo che


𝑓 è continua nel punto 𝑥0 ∈ 𝐴 se continua nel punto

∀𝜀 > 0 : ∃𝛿 > 0 : ∀𝑥 ∈ 𝐴 : |𝑥 − 𝑥0 | < 𝛿 =⇒ | 𝑓 (𝑥) − 𝑓 (𝑥0 )| < 𝜀. (2.1)

Diremo che 𝑓 : 𝐴 → ℝ è continua se è continua in ogni punto 𝑥 0 ∈ 𝐴. continua

Attenzione: la funzione 𝑓 (𝑥) = 𝑥1 assume vicino a 𝑥 = 0 valori molto diversi tra


loro (ad esempio 𝑓 (0.01) − 𝑓 (−0.01) = 200) ma ciò non toglie che la funzione
possa essere continua in quanto il punto 𝑥 = 0 non appartiene al dominio e
quindi, in base alla definizione precedente, non ha senso e non ha importanza
verificare se la funzione è continua in tale punto.

Teorema 2.2 (continuità del reciproco). La funzione 𝑓 : ℝ \ {0} → ℝ definita da


𝑓 (𝑥) = 𝑥1 è una funzione continua.

|𝑥 0 |
Dimostrazione. Siano 𝑥, 𝑥 0 ≠ 0. Se prendiamo 𝛿 < 2 e se |𝑥 − 𝑥 0 | < 𝛿 si avrà,
|𝑥0 |
per disuguaglianza triangolare inversa, |𝑥| > 2 . Dunque

− 1 = |𝑥 − 𝑥0 | ≤ 2𝛿 .

1
𝑥 𝑥0 |𝑥 · 𝑥0 | |𝑥0 | 2

Si ottiene quindi la condizione | 𝑓 (𝑥) − 𝑓 (𝑥 0 )| < 𝜀 se si sceglie 𝛿 in modo che


|𝑥 0 | 2 ·𝜀
risulti anche 𝛿 < 2 .
funzione segno
Esempio 2.3. La funzione segno sgn : ℝ → ℝ definita da



 1 se 𝑥 > 0


sgn(𝑥) = 0 se 𝑥 = 0

 −1 se 𝑥 < 0


è un esempio di funzione non continua.
68 2 funzioni continue, limiti e successioni

Dimostrazione. Verifichiamo che la funzione non è continua nel punto 𝑥 0 = 0.


Infatti se 𝑥 ≠ 0 si ha

| sgn(𝑥) − sgn(𝑥0 )| = | sgn(𝑥)| = 1

e quindi se scegliamo 𝜀 < 1 non è possibile trovare 𝛿 > 0 per cui valga la
condizione di continuità (2.1) nel punto 𝑥 0 = 0.

Esercizio 2.4. Dimostrare che le funzioni 𝑓 (𝑥) = 𝑥 e 𝑔(𝑥) = |𝑥| sono continue.
Dimostrare che le funzioni ℎ(𝑥) = b𝑥c e 𝑘(𝑥) = d𝑥e non sono continue (ma sono
continue in ogni punto 𝑥 0 ∈ ℝ \ ℤ).

Definizione 2.5 (operazioni sulle funzioni). Sia 𝐴 ⊆ ℝ e siano 𝑓 , 𝑔 funzioni


𝐴 → ℝ. Possiamo allora definire 𝑓 + 𝑔 , − 𝑓 , 𝑓 − 𝑔 , 𝑓 · 𝑔 , | 𝑓 | , 𝑓 𝑛 (con 𝑛 ∈ ℕ ) e (se
𝑔(𝑥) ≠ 0 per ogni 𝑥 ∈ 𝐴) anche 𝑓 /𝑔 come funzioni 𝐴 → ℝ mediante le seguenti
ovvie definizioni

( 𝑓 + 𝑔)(𝑥) = 𝑓 (𝑥) + 𝑔(𝑥), ( 𝑓 − 𝑔)(𝑥) = 𝑓 (𝑥) − 𝑔(𝑥),


( 𝑓 · 𝑔)(𝑥) = 𝑓 (𝑥) · 𝑔(𝑥), ( 𝑓 /𝑔)(𝑥) = 𝑓 (𝑥)/𝑔(𝑥),
(− 𝑓 )(𝑥) = −( 𝑓 (𝑥)), | 𝑓 |(𝑥) = | 𝑓 (𝑥)|, 𝑓 𝑛 (𝑥) = ( 𝑓 (𝑥))𝑛 .

Se 𝑓 : 𝐴 → 𝐵 e 𝑔 : 𝐵 → 𝐶 ricordiamo che abbiamo definito la funzione composta


𝑔 ◦ 𝑓 : 𝐴 → 𝐶:
(𝑔 ◦ 𝑓 )(𝑥) = 𝑔( 𝑓 (𝑥)).

Se 𝑐 ∈ ℝ è un numero considereremo a volte 𝑐 : 𝐴 → ℝ come una funzione costante.


Risulta quindi inteso che se 𝑐 ∈ ℝ e 𝑓 : 𝐴 → ℝ allora 𝑐 · 𝑓 è la funzione definita da
(𝑐 · 𝑓 )(𝑥) = 𝑐 · ( 𝑓 (𝑥)). La somma e il prodotto per costante rendono l’insieme ℝ𝐴 delle
funzioni 𝐴 → ℝ uno spazio vettoriale sul campo ℝ.

Teorema 2.6 (composizione di funzioni continue). Se 𝑓 e 𝑔 sono funzioni definite


e continue in uno stesso punto 𝑥 0 allora anche

𝑓 + 𝑔, 𝑓 · 𝑔, 𝑓 − 𝑔, | 𝑓 |, 𝑓 𝑛 (con 𝑛 ∈ ℕ )

sono funzioni definite e continue nel punto 𝑥 0 . Se inoltre 𝑔(𝑥 0 ) ≠ 0 anche la funzione
𝑓 /𝑔 è definita e continua nel punto 𝑥 0 .

Se 𝑓 : 𝐴 ⊆ ℝ → ℝ è una funzione continua nel punto 𝑥 0 ∈ 𝐴 e 𝑔 : 𝐵 ⊆ ℝ → ℝ è


una funzione continua nel punto 𝑦0 = 𝑓 (𝑥 0 ) ∈ 𝐵 allora la funzione 𝑔 ◦ 𝑓 definita in
𝑓 −1 (𝐵) è continua nel punto 𝑥 0 .

Dimostrazione. Mostriamo prima di tutto la continuità della composizione 𝑔 ◦ 𝑓 .


Per la continuità di 𝑓 in 𝑥 0 e di 𝑔 in 𝑦0 = 𝑓 (𝑥 0 ) si ha che per ogni 𝜀 > 0 esiste un
𝛾 > 0 e per ogni 𝛾 > 0 esiste un 𝛿 > 0 per cui

|𝑥 − 𝑥0 | < 𝛿 =⇒ | 𝑓 (𝑥) − 𝑓 (𝑥 0 )| < 𝛾,


|𝑦 − 𝑦0 | < 𝛾 =⇒ | 𝑔(𝑦) − 𝑔(𝑦0 )| < 𝜀
2.1 funzioni continue 69

da cui

|𝑥 − 𝑥0 | < 𝛿 =⇒ | 𝑓 (𝑥) − 𝑓 (𝑥 0 )| < 𝛾 =⇒ | 𝑔( 𝑓 (𝑥)) − 𝑔( 𝑓 (𝑥0 ))| < 𝜀

che non è altro che la condizione di continuità (2.1) per 𝑔 ◦ 𝑓 .

Se 𝑓 e 𝑔 sono continue nel punto 𝑥 0 allora per ogni 𝜀0 > 0 esistono 𝛿 1 e 𝛿 2 tali
che

|𝑥 − 𝑥0 | < 𝛿1 =⇒ | 𝑓 (𝑥) − 𝑓 (𝑥0 )| < 𝜀0 ,


|𝑥 − 𝑥0 | < 𝛿2 =⇒ | 𝑔(𝑥) − 𝑔(𝑥 0 )| < 𝜀0 .

In particolare scegliendo 𝛿 = min {𝛿 1 , 𝛿 2 } se |𝑥 − 𝑥 0 | < 𝛿 valgono contempora-


neamente entrambe le stime:

| 𝑓 (𝑥) − 𝑓 (𝑥0 )| < 𝜀0 , | 𝑔(𝑥) − 𝑔(𝑥0 )| < 𝜀0 .

Dunque per la somma osserviamo che se |𝑥 − 𝑥 0 | < 𝛿 si ha

|( 𝑓 + 𝑔)(𝑥) − ( 𝑓 + 𝑔)(𝑥0 )| = | 𝑓 (𝑥) + 𝑔(𝑥) − 𝑓 (𝑥0 ) − 𝑔(𝑥0 )|


≤ | 𝑓 (𝑥) − 𝑓 (𝑥 0 )| + | 𝑔(𝑥) − 𝑔(𝑥0 )| ≤ 2 𝜀0 .

Dato 𝜀 > 0 basterà quindi scegliere 𝜀0 = 𝜀/2 e 𝛿 come sopra per ottenere la
condizione di continuità.

Per il prodotto si ha

| 𝑓 (𝑥)𝑔(𝑥) − 𝑓 (𝑥0 )𝑔(𝑥0 )|


= | 𝑓 (𝑥)𝑔(𝑥) − 𝑓 (𝑥0 )𝑔(𝑥) + 𝑓 (𝑥0 )𝑔(𝑥) − 𝑓 (𝑥0 )𝑔(𝑥0 )|
≤ | 𝑓 (𝑥) − 𝑓 (𝑥0 )| · | 𝑔(𝑥)| + | 𝑓 (𝑥0 )| · | 𝑔(𝑥) − 𝑔(𝑥0 )|
≤ 𝜀0 | 𝑔(𝑥)| + | 𝑓 (𝑥 0 )|𝜀0 .

Osserviamo ora che | 𝑔(𝑥)| ≤ | 𝑔(𝑥) − 𝑔(𝑥 0 )|+| 𝑔(𝑥 0 )| e quindi | 𝑔(𝑥)| ≤ | 𝑔(𝑥 0 )|+𝜀0
da cui:

| 𝑓 (𝑥)𝑔(𝑥) − 𝑓 (𝑥0 )𝑔(𝑥 0 )| ≤ 𝜀0(| 𝑔(𝑥0 )| + 𝜀0) + | 𝑓 (𝑥0 )|𝜀0


= 𝜀0 · (| 𝑓 (𝑥0 )| + | 𝑔(𝑥0 )| + 𝜀0).

Possiamo facilmente rendere questa quantità inferiore a qualunque 𝜀 > 0:


basterà prendere 𝜀0 < 1 e
𝜀
𝜀0 < .
| 𝑓 (𝑥0 )| + | 𝑔(𝑥0 )| + 1

La funzione 𝑓 𝑛 è continua per induzione su 𝑛 in quanto prodotto di funzioni


continue: 𝑓 𝑛+1 = 𝑓 𝑛 · 𝑓 .

Abbiamo già visto che la funzione ℎ(𝑥) = 𝑥1 è continua, dunque se 𝑔 è continua


1
anche la funzione 𝑔(𝑥) = ℎ ◦ 𝑔 è continua essendo composizione di funzioni
𝑓
continue. Di conseguenza anche la funzione 𝑔 = 𝑓 · 1
𝑔 è continua, essendo il
prodotto di funzioni continue.
70 2 funzioni continue, limiti e successioni

Analogamente la funzione 𝑓 − 𝑔 è la somma di 𝑓 con −𝑔 e la funzione −𝑔 è


la composizione di 𝑔 con ℎ(𝑥) = −𝑥 . E’ immediato verificare che la funzione
ℎ(𝑥) = −𝑥 è continua e dunque anche la differenza 𝑓 − 𝑔 è continua. Lo stesso
vale per la funzione | 𝑓 | che è la composizione di 𝑓 con la funzione ℎ(𝑥) = |𝑥| .

Il precedente teorema è molto importante ed utile in quanto garantisce che ogni


funzione definita tramite una espressione che coinvolge solamente le funzioni e
le operazioni elencate nell’enunciato del teorema, risulta certamente essere una
funzione continua. Come nel seguente.

Esempio 2.7. La funzione

(𝑥 − 3) · 𝑥 − 1
𝑥+𝑥
2
𝑓 (𝑥) =
1−𝑥 3
𝑥 −

𝑥

è continua.
Si intende che tale funzione è definita sull’insieme degli 𝑥 ∈ ℝ per cui tutte le operazioni
coinvolte sono definite ovvero 𝑓 : 𝐷 ⊆ ℝ → ℝ con

1 − 𝑥 3
 
𝐷 = 𝑥 ∈ ℝ : 𝑥 + 𝑥 ≠ 0, 𝑥 ≠ 0, 𝑥 − ≠0 .
2


𝑥

Per convincersi che questa funzione 𝑓 è continua si nota che le funzioni 𝑥 e le costanti
3 e 1 sono funzioni continue. Ma allora, per il teorema 2.6, anche le funzioni 𝑥 − 3
e 𝑥 2 = 𝑥 · 𝑥 sono continue. Dunque anche (𝑥 − 3) · 𝑥 , 𝑥 + 𝑥 2 e 𝑥 3 e 1 − 𝑥 3 sono
1 1−𝑥 3
continue. Di conseguenza sono continue pure 1+𝑥 2 e 𝑥 . E poi saranno continue

1−𝑥 3 1−𝑥 3 1−𝑥 3
anche (𝑥 − 3) · 𝑥 − 1
e𝑥− e quindi 𝑥 − e pure 𝑥 − 𝑥 . Infine sarà

1+𝑥 2 𝑥 𝑥
dunque continua 𝑓 (𝑥).

In particolare è chiaro che le funzioni lineare e quadratiche che abbiamo


introdotto nelle sezioni precedenti sono funzioni continue in quanto sono
ottenute sommando e moltiplicando tra loro funzioni continue.

Teorema 2.8 (continuità delle funzioni monotone). Sia 𝐼 ⊆ ℝ un intervallo e sia


𝑓 : 𝐼 → ℝ una funzione monotòna. Allora 𝑓 è continua se e solo se 𝑓 (𝐼) è un intervallo.

Dimostrazione. Senza perdita di generalità possiamo supporre che 𝑓 sia crescente.


Dimostriamo innanzitutto che se 𝑓 (𝐼) è intervallo allora 𝑓 è continua.
Prendiamo un punto 𝑥 0 ∈ 𝐼 e sia 𝜀 > 0. Vogliamo trovare 𝑥 1 < 𝑥 0 tale che per
ogni 𝑥 ∈ [𝑥 1 , 𝑥 0 ] ∩ 𝐼 si abbia 𝑓 (𝑥) > 𝑓 (𝑥 0 ) − 𝜀. Siccome 𝑓 (𝐼) è un intervallo
che contiene il punto 𝑓 (𝑥 0 ) ci sono due possibilità: o 𝑓 (𝑥) > 𝑓 (𝑥 0 ) − 𝜀 per ogni
𝑥 ∈ 𝐼 e quindi possiamo scegliere 𝑥1 < 𝑥0 a piacere oppure esiste 𝑥1 ∈ 𝐼 tale
che 𝑓 (𝑥 1 ) = 𝑓 (𝑥 0 ) − 2𝜀 . In questo secondo caso dovrà essere 𝑥 1 < 𝑥 0 (in quanto
𝑓 è crescente) e per monotonia si avrà, come voluto 𝑓 (𝑥) ≥ 𝑓 (𝑥1 ) > 𝑓 (𝑥0 ) − 𝜀
per ogni 𝑥 ∈ [𝑥 1 , 𝑥 0 ].
In modo analogo possiamo trovare 𝑥 2 > 𝑥 0 tale che per ogni 𝑥 ∈ [𝑥 0 , 𝑥 2 ] ∩ 𝐼
si abbia 𝑓 (𝑥) < 𝑓 (𝑥 0 ) + 𝜀. Essendo 𝑓 crescente se 𝑥 ≥ 𝑥 0 si avrà anche
2.1 funzioni continue 71

𝑓 (𝑥) ≥ 𝑓 (𝑥0 ) e se 𝑥 ≤ 𝑥0 si avrà 𝑓 (𝑥) ≤ 𝑓 (𝑥0 ). Dunque per ogni 𝑥 ∈ [𝑥 1 , 𝑥2 ]


si avrà | 𝑓 (𝑥) − 𝑓 (𝑥 0 )| < 𝜀. Basterà scegliere 𝛿 = min {𝑥 0 − 𝑥 1 , 𝑥 2 − 𝑥 0 } per
ottenere la continuità di 𝑓 in 𝑥 0 .

Supponiamo ora che 𝑓 sia una funzione continua e crescente. Vogliamo


dimostrare che 𝑓 (𝐼) è un intervallo.

Siano 𝑦1 , 𝑦2 ∈ 𝑓 (𝐼) e sia 𝑦0 ∈ ℝ con 𝑦1 < 𝑦0 < 𝑦2 . Vogliamo dimostrare che


𝑦0 ∈ 𝑓 (𝐼) cioè che esiste 𝑥 0 ∈ 𝐼 tale che 𝑓 (𝑥0 ) = 𝑦0 . Sappiamo che esistono 𝑥 1 , 𝑥2
in 𝐼 tali che 𝑓 (𝑥 1 ) = 𝑦1 e 𝑓 (𝑥 2 ) = 𝑦2 . Dovrà essere 𝑥 1 < 𝑥 2 perché 𝑓 (𝑥 1 ) < 𝑓 (𝑥 2 )
e 𝑓 è strettamente crescente. Definiamo:

𝑥0 = sup 𝐴 con 𝐴 = {𝑥 ∈ 𝐼 : 𝑓 (𝑥) < 𝑦0 },

e dimostriamo che 𝑓 (𝑥 0 ) = 𝑦0 . Chiaramente 𝑥 0 ∈ [𝑥 1 , 𝑥 2 ] in quanto 𝑥 1 ∈ 𝐴 e 𝑥 2


è un maggiorante di 𝐴 e dunque 𝑓 è definita e continua in 𝑥 0 .

Se fosse 𝑓 (𝑥 0 ) < 𝑦0 scelto 𝜀 = 𝑦0 − 𝑓 (𝑥 0 ) per la definizione di continuità dovrebbe


esistere 𝛿 > 0 tale che per ogni 𝑥 ∈ 𝐼 con |𝑥 − 𝑥 0 | < 𝛿 si abbia | 𝑓 (𝑥) − 𝑓 (𝑥 0 )| < 𝜀.
In particolare scelto 𝑥 = 𝑥 0 + 𝛿2 si avrebbe 𝑓 (𝑥) < 𝑓 (𝑥 0 ) + 𝜀 = 𝑦0 . Ma allora
avremmo 𝑥 ∈ 𝐴 che è assurdo in quanto sup 𝐴 = 𝑥 0 < 𝑥 .

Se fosse invece 𝑓 (𝑥 0 ) > 𝑦0 posto 𝜀 = 𝑓 (𝑥 0 ) − 𝑦0 , grazie alla continuità di 𝑓 in


𝑥0 , possiamo trovare 𝛿 > 0 tale che per ogni 𝑥 ∈ 𝐼 con |𝑥 − 𝑥0 | < 𝛿 si abbia
| 𝑓 (𝑥) − 𝑓 (𝑥0 )| < 𝜀. In particolare scelto 𝑡 = 𝑥 0 − 𝛿2 si ha 𝑓 (𝑡) > 𝑓 (𝑥 0 ) − 𝜀 = 𝑦0 .
Ma essendo 𝑡 < 𝑥 0 = sup 𝐴 sappiamo che 𝑡 non può essere un maggiorante di 𝐴
dunque deve esistere 𝑥 ∈ 𝐴 tale che 𝑡 < 𝑥 . Ma se 𝑥 ∈ 𝐴 allora 𝑓 (𝑥) < 𝑦0 < 𝑓 (𝑡)
che è assurdo in quanto 𝑓 è crescente.

Abbiamo quindi mostrato che 𝑓 (𝑥 0 ) = 𝑦0 e dunque che 𝑓 (𝐼) è un intervallo.

Il teorema 2.8 precedente ci permette di affermare che per 𝑎 > 0, 𝑎 ≠ 1 le funzioni


exp 𝑎 e log 𝑎 sono continue. Infatti tali funzioni sono bigezioni monotone tra gli
intervalli ℝ e ℝ+ .

Grazie al teorema 2.6 sappiamo che se 𝑛 ∈ ℕ la funzione 𝑥 𝑛 è continua su tutto



il suo dominio ℝ. La funzione inversa 𝑛 𝑥 è anch’essa crescente e bigettiva
come funzione [0 , +∞) → [0 , +∞) e dunque anch’essa risulta essere continua.

Per simmetria (si veda l’esercizio 2.9) possiamo concludere che le radici 𝑛 𝑥
sono funzioni continue su tutto il loro dominio. Anche la funzione 𝑓 (𝑥) = 𝑥 𝛼 ,
1
𝑓 : [0 , +∞) → [0 , +∞] con 𝛼 > 0 è crescente ed è invertibile (l’inversa è 𝑥 𝛼 )
e dunque è surgettiva e continua. Se 𝛼 < 0 la funzione 𝑓 (𝑥) = 𝑥 𝛼 è definita
sull’intervallo (0 , +∞) ed è anch’essa continua in quanto composizione di
funzioni continue: 𝑥 𝛼 = 𝑥 −𝛼
1
.

Esercizio 2.9. Sia 𝑓 : ℝ → ℝ una funzione pari oppure dispari. Se la restrizione di 𝑓


all’intervallo [0 , +∞) è continua allora 𝑓 è continua su tutto ℝ.
72 2 funzioni continue, limiti e successioni

2.2 limite di funzione

Se una funzione 𝑓 non è definita in un punto 𝑥 0 non ha senso chiedersi se in tale


punto è continua. Possiamo però chiederci se è possibile definire la funzione
anche nel punto 𝑥 0 dando un valore opportuno ℓ in modo da rendere 𝑓 continua
in quel punto. Se ciò è possibile diremo che la funzione 𝑓 (𝑥) ha limite ℓ per 𝑥
che tende a 𝑥 0 e scriveremo:

𝑓 (𝑥) → ℓ per 𝑥 → 𝑥 0

(daremo tra poco una definizione con maggiore precisione e generalità).

Ad esempio la funzione 𝑓 (𝑥) = 𝑥𝑥−−11 è una funzione definita per 𝑥 ≠ 1 e coincide,


2

se 𝑥 ≠ 1 con la funzione lineare 𝑓˜(𝑥) = 𝑥 + 1 definita su tutto ℝ. Visto che 𝑓˜ è


continua e 𝑓˜(1) = 2 scriveremo:

𝑥2 − 1
→2 per 𝑥 → 1.
𝑥−1

Se estendiamo 𝑓 con un valore ℓ nel punto 𝑥 0 otteniamo in generale la funzione


(
𝑓 (𝑥) se 𝑥 ≠ 𝑥0
𝑓˜(𝑥) =
ℓ se 𝑥 = 𝑥 0

e la continuità di 𝑓˜ nel punto 𝑥 0 si scrive così:



∀𝜀 > 0 : ∃𝛿 > 0 : |𝑥 − 𝑥0 | < 𝛿 =⇒ 𝑓˜(𝑥) − 𝑓˜(𝑥0 ) < 𝜀.


Osserviamo che se 𝑥 = 𝑥 0 allora ovviamente 𝑓˜(𝑥) − 𝑓˜(𝑥 0 ) = 0 < 𝜀 dunque

possiamo supporre, nella condizione precedente, che sia 𝑥 ≠ 𝑥 0 e dunque
𝑓˜(𝑥) = 𝑓 (𝑥). Inoltre visto che 𝑓˜(𝑥0 ) = ℓ si ottiene la seguente condizione:

∀𝜀 > 0 : ∃𝛿 > 0 : ∀𝑥 ≠ 𝑥0 : |𝑥 − 𝑥0 | < 𝛿 =⇒ 𝑓˜(𝑥) − ℓ < 𝜀. (2.2)

La (2.2) potrebbe dunque essere utilizzata per definire il concetto di limite


𝑓 (𝑥) → ℓ per 𝑥 → 𝑥0 . Sarà però molto utile estendere il concetto di limite
𝑓 (𝑥) → ℓ per 𝑥 → 𝑥0 anche nei casi in cui ℓ e/o 𝑥0 possano essere infiniti (cioè
elementi dei reali estesi ℝ̄).

Per fare ciò osserviamo che se definiamo 𝐵𝜌 (𝑥 0 ) = {𝑥 ∈ ℝ : |𝑥 − 𝑥 0 | < 𝜌} la


condizione (2.2) può essere scritta anche nella forma

∀𝜀 > 0 : ∃𝛿 > 0 : 𝑥 ∈ 𝐵 𝛿 (𝑥0 ) \ {𝑥0 } =⇒ 𝑓˜(𝑥) ∈ 𝐵 𝜀 (ℓ )


la lettera 𝐵 sta per ball in quanto più in
generale (se fossimo in ℝ3 invece che in che a sua volta si può scrivere nella forma:
ℝ) l’insieme dei punti che distano meno
di 𝜌 da un punto fissato è l’interno di
una sfera piena. In geometria una sfera
∀𝜀 > 0 : ∃𝛿 > 0 : 𝑓 (𝐵 𝛿 (𝑥0 ) \ {𝑥 0 }) ⊆ 𝐵 𝜀 (ℓ ).
piena si chiama palla se contiene solo i
punti interni (e non la superficie sferica)
e si chiama disco o palla chiusa se contiene L’idea è che gli insiemi del tipo𝐵𝜌 (𝑥 0 ) rappresentano i punti vicini al punto
anche i punti della superficie.
2.2 limite di funzione 73

𝑥0 . In analogia potremmo pensare che i punti vicini a +∞ siano i punti di una


qualunque semiretta del tipo (𝑀, +∞]. Si dà quindi la seguente.

Definizione 2.10 (intorno). Per 𝑥 ∈ ℝ definiamo la famiglia degli intorni (basilari) intorni
di 𝑥 come l’insieme di tutti gli intervallini aperti, simmetrici, centrati in 𝑥 :

B𝑥 = {(𝑥 − 𝜀, 𝑥 + 𝜀) : 𝜀 > 0}.

Definiamo poi le famiglie degli intorni destri e intorni sinistri di 𝑥 come intorni destri/sinistri

B𝑥 + = {[𝑥, 𝑥 + 𝜀) : 𝜀 > 0}, B𝑥 − = {(𝑥 − 𝜀, 𝑥] : 𝜀 > 0}

e le famiglie degli intorni di +∞ e −∞ come segue

B+∞ = {(𝛼, +∞], : 𝛼 ∈ ℝ}, B−∞ = {[−∞, −𝛽), : 𝛽 ∈ ℝ}.

Per ogni 𝑥 ∈ ℝ̄ = [−∞, +∞] risultano quindi definiti gli intorni B𝑥 e per ogni 𝑥 ∈ ℝ
sono definiti gli intorni B𝑥 + e B𝑥 − .

Osservazione 2.11. Sarebbe possibile definire in maniera analoga gli intorni dei punti
in ℝ𝑛 (per l’analisi di funzioni di più variabili) o in ℂ (per l’analisi complessa). Ma in
questo corso e in questo capitolo in particolare siamo interessati allo studio delle funzioni
di una singola variabile.

Su ℝ c’è una struttura di ordine totale che è utile preservare aggiungendo due punti
all’infinito: +∞ e −∞. Su ℝ𝑛 (e su ℂ, che in questo contesto possiamo identificare con
ℝ2 ) non c’è una struttura d’ordine naturale e quindi usualmente si considera un unico
punto all’infinito ∞ i cui intorni saranno

B∞ = {{𝑥 ∈ ℝ𝑛 : |𝑥| > 𝑅} : 𝑅 > 0}.

Su ℝ𝑛 (e su ℂ) non esiste il concetto di intorno destro e sinistro proprio perché questi


concetti presuppongono un ordinamento.

In certi casi può tornare utile considerare un unico punto all’infinito, denotato con
∞, anche in ℝ (in molti testi tale punto verrebbe denotato con il simbolo ±∞) e si
potrebbero usare le notazioni +∞ = ∞− e −∞ = ∞+ visto che gli intorni di +∞ e −∞
sono in effetti intorni unilaterali del punto all’infinito.

Definizione 2.12 (limite di funzione). Sia 𝐴 ⊆ ℝ e 𝑓 : 𝐴 → ℝ. Sia 𝑥 0 ∈


[−∞, +∞] e sia ℓ ∈ [−∞, +∞]. Allora diremo che la funzione 𝑓 ha limite ℓ per 𝑥 che
tende a 𝑥 0 e scriveremo limite di funzione
𝑓 (𝑥) → ℓ per 𝑥 → 𝑥 0
se per ogni intorno di ℓ esiste un intorno di 𝑥 0 tale che la funzione valutata nell’intorno
di 𝑥 0 , tolto eventualmente 𝑥 0 , assume valori nell’intorno di ℓ :

∀𝑉 ∈ Bℓ : ∃𝑈 ∈ B𝑥0 : 𝑓 (𝑈 \ {𝑥0 }) ⊆ 𝑉. (2.3)

La stessa definizione può essere data restringendosi agli intorni destri/sinistri del
punto 𝑥 0 (nel caso 𝑥 0 ∈ ℝ). Si otterranno quindi le definizioni di limite destro e
limite destro/sinistro
74 2 funzioni continue, limiti e successioni

limite sinistro semplicemente sostituendo B𝑥0+ o B𝑥0− al posto di B𝑥0 nella definizione
precedente. In tal caso scriveremo 𝑓 (𝑥) → ℓ per 𝑥 → 𝑥 0+ per il limite destro e 𝑓 (𝑥) → ℓ
per 𝑥 → 𝑥 0− per il limite sinistro.
Infine anche il risultato del limite può essere ℓ + o ℓ − , in tal caso useremo Bℓ + o Bℓ − al
posto di Bℓ .

Esempio 2.13. Si consideri la funzione segno:



 1 se 𝑥 > 0 ,


sgn(𝑥) = 0 se 𝑥 = 0 ,

 −1 se 𝑥 < 0.


Si può verificare che
sgn(𝑥) → 1 per 𝑥 → 0+
e
sgn(𝑥) → −1 per 𝑥 → 0−

Abbiamo già visto che nel caso in cui 𝑥 0 ∈ ℝ e ℓ ∈ ℝ siano entrambi finiti la
definizione di limite 𝑓 (𝑥) → ℓ per 𝑥 → 𝑥 0 si traduce nella condizione (2.2).
Anche negli altri casi esplicitando le definizioni di intorno si possono ottenere
delle condizioni più esplicite. Ad esempio la condizione 𝑓 (𝑥) → −∞ per
𝑥 → 𝑥0+ si traduce nel modo seguente:

∀𝛽 ∈ ℝ∃𝛿 > 0 : 𝑥0 < 𝑥 < 𝑥0 + 𝛿 =⇒ 𝑓 (𝑥) < −𝛽.

Visto che ci sono cinque diversi casi per il punto 𝑥 0 : 𝑥 0 ∈ ℝ, 𝑥 0+ , 𝑥 0− , +∞, −∞ e


altrettanti casi per ℓ (in effetti anche il risultato del limite può essere destro o
sinistro), si ottengono in tutto 25 diverse definizioni di limite.
In tutte queste definizioni di limite è sottointeso che i punti 𝑥 che vengono presi
in considerazione sono punti del dominio di 𝑓 : 𝐴 ⊆ ℝ → ℝ. Accade allora che
se esiste un intorno 𝑉 ∈ B𝑥0 per cui 𝐴 ∩ 𝑉 \ {𝑥 0 } è vuoto allora la condizione
di limite è vuota ed è quindi sempre verificata qualunque sia il valore di ℓ . E’
quindi inutile fare il limite per 𝑥 → 𝑥 0 se 𝑥 0 non soddisfa la seguente.

Definizione 2.14 (punto di accumulazione). Siano 𝐴 ⊆ ℝ un insieme e 𝑥 0 ∈


[−∞, +∞]. Diremo che 𝑥0 è un punto di accumulazione di 𝐴 se ogni intorno di 𝑥0
punto di accumulazione
contiene punti di 𝐴 diversi da 𝑥 0 , ovvero:

∀𝑈 ∈ B𝑥0 : (𝐴 \ {𝑥}) ∩ 𝑈 ≠ ∅.

Stessa definizione si può dare per 𝑥 0+ e 𝑥 0− utilizzando gli intorni destri/sinistri di 𝑥 0 .

Teorema 2.15 (unicità del limite). Sia 𝐴 ⊆ ℝ, 𝑓 : 𝐴 → ℝ, 𝑥 0 punto di accumula-


zione per 𝐴 e ℓ 1 , ℓ 2 ∈ [−∞, +∞]. Se per 𝑥 → 𝑥 0 si ha

𝑓 (𝑥) → ℓ1 e 𝑓 (𝑥) → ℓ 2

allora ℓ 1 = ℓ 2 .
2.2 limite di funzione 75

Risultato analogo si ha per i limiti destro e sinistro: 𝑥 → 𝑥 0+ , 𝑥 → 𝑥 0− .

Dimostrazione. Supponiamo per assurdo che ℓ 1 ≠ ℓ 2 . Allora esiste un intorno


𝑉1 di ℓ1 ed un intorno 𝑉2 di ℓ2 tali che 𝑉1 ∩ 𝑉2 = ∅ (basta prendere degli intorni
abbastanza piccoli). Ma per le definizioni di limite 𝑓 (𝑥) → ℓ 1 e 𝑓 (𝑥) → ℓ 2
dovranno esistere 𝑈1 e 𝑈2 intorni di 𝑥 0 su cui si ha 𝑓 (𝑈1 ) ⊆ 𝑉1 e 𝑓 (𝑈2 ) ⊆ 𝑉2 .
Ma allora 𝑓 ((𝐴 \ {𝑥 0 }) ∩ 𝑈1 ) ∩ 𝑓 ((𝐴 \ {𝑥 0 }) ∩ 𝑈2 ) ⊆ 𝑉1 ∩ 𝑉2 = ∅... e questo è
assurdo perché certamente 𝑈1 ∩ 𝑈2 contiene punti di 𝐴 diversi da 𝑥 0 in quanto
𝑈1 e 𝑈2 sono uno contenuto nell’altro e 𝑥0 è un punto di accumulazione per
𝐴.

Il teorema precedente garantisce che se 𝑥 0 è un punto di accumulazione del


dominio di 𝑓 allora il limite per 𝑥 → 𝑥 0 se esiste è unico. In tal caso possiamo
dunque dare la seguente.

Definizione 2.16 (operatore di limite). Sia 𝑓 : 𝐴 ⊆ ℝ → ℝ una funzione e 𝑥 0


un punto di accumulazione per 𝐴. Se esiste ℓ ∈ [−∞, +∞] tale che 𝑓 (𝑥) → ℓ per
𝑥 → 𝑥 0 allora poniamo
lim 𝑓 (𝑥) = ℓ .
𝑥→𝑥 0

Lo stesso si può fare per il limite destro 𝑥 → 𝑥 0+ e sinistro 𝑥 → 𝑥 0− .

Abbiamo visto che in un punto di accumulazione se il limite esiste allora è unico.


Sarà però utile osservare che in effetti il limite può non esistere, come si può
verificare con un esempio.

Esempio 2.17 (in generale il limite non esiste). Il limite


𝑥
lim
𝑥→0 |𝑥|
𝑥
non esiste. Osserviamo infatti che la funzione 𝑓 (𝑥) = |𝑥|
vale 1 se 𝑥 > 0 e −1 se 𝑥 < 0.
Dunque se il limite esistesse e fosse ℓ ∈ ℝ̄ scelto 𝜀 = 1 dovrebbe esistere un intervallo
intorno di 0 della forma (−𝛿, 𝛿) tale che | 𝑓 (𝑥) − ℓ | < 1 per ogni 𝑥 in tale intervallo.
In particolare siccome in tale intervallo ci sono sicuramente sia numeri positivi che
negativi si dovrà avere contemporaneamente

| 1 − ℓ | < 1, |−1 − ℓ | < 1

che è impossibile in quanto per disuguaglianza triangolare

2 = | 1 − (−1)| ≤ | 1 − ℓ | + |−1 − ℓ | < 1 + 1 = 2

che è assurdo.

Si noti che nell’esempio precedente il limite per 𝑥 → 0 non esiste ma in realtà


esistono sia il limite per 𝑥 → 0+ (vale 1) che i limite per 𝑥 → 0− (vale 0).
76 2 funzioni continue, limiti e successioni

Possiamo esibire un esempio “patologico” di funzione che non ammette limite


(né da destra né da sinistra) in nessun punto:
(
1 se 𝑥 ∈ ℚ
𝑓 (𝑥) =
0 se 𝑥 ∈ ℝ \ ℚ.

In ogni intervallo (𝑎, 𝑏) con 𝑎 < 𝑏 questa funzione assume sia il valore 0 che
il valore 1 in quanto sia ℚ che ℝ \ ℚ intersecano l’intervallo (sono insiemi
densi). Ma se 𝑓 avesse limite ℓ dovrebbe esistere un intervallo in cui i valori
distano meno di 𝜀 da ℓ e quindi dovrebbe essere | 1 − ℓ | < 𝜀 e | 0 − ℓ | < 𝜀 che è
impossibile se scegliamo 𝜀 < 12 .

Teorema 2.18 (collegamento tra limiti e continuità). Sia 𝐴 ⊆ ℝ, 𝑓 : 𝐴 → ℝ. Se


𝑥0 ∈ 𝐴 è un punto di accumulazione di 𝐴 allora 𝑓 è continua in 𝑥0 se e solo se

lim 𝑓 (𝑥) = 𝑓 (𝑥 0 ).
𝑥→𝑥 0

punto isolato Se 𝑥 0 ∈ 𝐴 non è punto di accumulazione diremo che 𝑥 0 è un punto isolato di 𝐴. In


tal caso la funzione 𝑓 è sempre continua nel punto 𝑥 0 .

Dimostrazione. In base alla definizione 2.1 la funzione 𝑓 è continua nel punto 𝑥 0


se
∀𝜀 > 0 : ∃𝛿 > 0 : ∀𝑥 ∈ 𝐴 : |𝑥 − 𝑥0 | < 𝛿 =⇒ | 𝑓 (𝑥) − 𝑓 (𝑥0 )| < 𝜀
mentre la definizione di limite 𝑓 (𝑥) → 𝑓 (𝑥 0 ) per 𝑥 → 𝑥 0 si espande in

∀𝜀 > 0 : ∃𝛿 > 0 : ∀𝑥 ∈ 𝐴, 𝑥 ≠ 𝑥0 : |𝑥 − 𝑥0 | < 𝛿 =⇒ | 𝑓 (𝑥) − 𝑓 (𝑥0 )| < 𝜀.

L’unica differenza è che nella definizione di limite c’è la condizione 𝑥 ≠ 𝑥 0 . Ma


visto che per 𝑥 = 𝑥 0 si ha | 𝑓 (𝑥) − 𝑓 (𝑥 0 )| = 0 tale condizione è in questo caso
inutile e quindi le due definizioni sono equivalenti.

Se il punto 𝑥 0 è isolato la definizione di continuità è sempre verificata in quanto


esiste un 𝛿 > 0 tale che il punto 𝑥 = 𝑥 0 è l’unico punto di 𝐴 nell’intorno
(𝑥0 − 𝛿, 𝑥0 + 𝛿).

Esempio 2.19. Non è difficile convincersi che gli unici punti di accumulazione per
l’insieme ℤ sono +∞ e −∞. Dunque qualunque funzione 𝑓 : ℤ → ℝ è continua in
quanto tutti i punti del suo dominio sono punti isolati.

Teorema 2.20 (località del limite). Il limite di una funzione per 𝑥 → 𝑥 0 dipende
solamente dai valori di 𝑓 in un intorno di 𝑥 0 e non dipende dal valore di 𝑓 in 𝑥 0 .

Più precisamente: se 𝐴, 𝐵 ⊆ ℝ, 𝑥 0 ∈ ℝ sono tali che esiste un intorno 𝑉 di 𝑥 0 per cui


(𝐴 \ {𝑥0 }) ∩ 𝑉 = (𝐵 \ {𝑥0 }) ∩ 𝑉 e 𝑓 (𝑥) = 𝑔(𝑥) per ogni 𝑥 ∈ (𝐴 \ {𝑥 0 }) ∩ 𝑉 allora
se 𝑓 (𝑥) → ℓ per 𝑥 → 𝑥 0 anche 𝑔(𝑥) → ℓ per 𝑥 → 𝑥 0 .

Dimostrazione. Basta osservare che nella definizione di limite non è restrittivo


supporre che l’intorno del punto 𝑥 0 sia sempre preso all’interno dell’intorno 𝑉
su cui le due funzioni coincidono.
2.2 limite di funzione 77

Teorema 2.21 (restrizione del limite). Se una funzione ha limite ℓ per 𝑥 → 𝑥 0 e se


restringiamo l’insieme di definizione della funzione allora il limite della funzione non
cambia. Più precisamente se 𝑓 : 𝐴 → ℝ è una funzione tale che 𝑓 (𝑥) → ℓ per 𝑥 → 𝑥 0
e se 𝐵 ⊆ 𝐴 e 𝑔 : 𝐵 → ℝ è la restrizione di 𝑓 a 𝐵 allora anche 𝑔(𝑥) → ℓ per 𝑥 → 𝑥 0 .

Dimostrazione. Il teorema segue immediatamente dalla definizione di limite se


si osserva che restringendo il dominio la condizione di validità del limite si
indebolisce in quanto gli intorni di 𝑥 0 vengono intersecati con il dominio della
funzione.

Si osservi che a differenza del teorema sulla località del limite è possibile che
la funzione ristretta 𝑔 abbia limite quando la funzione 𝑓 non aveva limite. Si
osservi anche che in entrambi questi teoremi sarà opportuno che 𝑥 0 sia un punto
di accumulazione, altrimenti la condizione 𝑓 (𝑥) → ℓ risulta essere vuota.

Teorema 2.22 (legame tra limite, limite destro e limite sinistro). Sia 𝐴 ⊆ ℝ,
𝑓 : 𝐴 → ℝ una funzione e 𝑥0 un punto di accumulazione di 𝐴. Sia 𝐴+ = 𝐴∩[𝑥 0 , +∞)
e 𝐴− = 𝐴 ∩ (−∞, 𝑥 0 ].

Se 𝑥 0 è punto di accumulazione sia di 𝐴+ che di 𝐴− allora si ha

lim 𝑓 (𝑥) = ℓ
𝑥→𝑥0

se e solo se
lim 𝑓 (𝑥) = lim− 𝑓 (𝑥) = ℓ .
𝑥→𝑥 0+ 𝑥→𝑥0

Se 𝑥 0 è punto di accumulazione di 𝐴+ ma non di 𝐴− allora i limiti

lim 𝑓 (𝑥) e lim 𝑓 (𝑥)


𝑥→𝑥 0 𝑥→𝑥 0+

sono equivalenti. Analogamente se 𝑥 0 è punto di accumulazione di 𝐴− ma non di 𝐴+


risultano equivalenti
lim 𝑓 (𝑥) e lim− 𝑓 (𝑥).
𝑥→𝑥0 𝑥→𝑥0

Dimostrazione. Si tratta semplicemente di verificare le definizioni di limite


sfruttando il fatto che intorni di un punto 𝑥 0 sono formati dall’unione di intorno
destro e intorno sinistro.

Teorema 2.23 (limite della funzione composta/cambio di variabile). Siano


𝐴 ⊆ ℝ, 𝐵 ⊆ ℝ, 𝑥 0 un punto di accumulazione di 𝐴, 𝑦0 un punto di accumulazione
di 𝐵, ℓ ∈ [−∞, +∞]. Siano 𝑓 : 𝐴 → 𝐵, 𝑔 : 𝐵 → ℝ funzioni tali che 𝑓 (𝑥) ≠ 𝑦0 se
𝑥 ≠ 𝑥0 e
lim 𝑓 (𝑥) = 𝑦0 , lim 𝑔(𝑦) = ℓ .
𝑥→𝑥0 𝑦→𝑦0

Allora nel secondo limite si può porre 𝑦 = 𝑓 (𝑥) e al posto di 𝑦 → 𝑦0 si può mettere
𝑥 → 𝑥 0 (in quanto il primo limite ci dice che se 𝑥 → 𝑥0 allora 𝑦 → 𝑦0 ) e dunque vale:

lim 𝑔( 𝑓 (𝑥)) = ℓ .
𝑥→𝑥0
78 2 funzioni continue, limiti e successioni

Dimostrazione. Visto che 𝑔(𝑦) → ℓ per ogni 𝑈 intorno di ℓ deve esistere un 𝑉


intorno di 𝑦0 tale che 𝑔((𝐵 \ {𝑦0 }) ∩ 𝑉) ⊆ 𝑈 e visto che 𝑓 (𝑥) → 𝑦0 deve esistere
un intorno 𝑊 di 𝑥 0 tale che 𝑓 ((𝐴 \ {𝑥 0 }) ∩ 𝑊) ⊆ 𝑉 . Ma visto che per ipotesi
𝑓 assume valori in 𝐵 \ {𝑦0 } si ha anche 𝑓 ((𝐴 \ {𝑥0 }) ∩ 𝑊) ⊆ (𝐵 \ {𝑦0 }) ∩ 𝑉 e
quindi
𝑔( 𝑓 ((𝐴 \ {𝑥0 }) ∩ 𝑊)) ⊆ 𝑔((𝐵 \ {𝑦0 }) ∩ 𝑉) ⊆ 𝑈
che significa che 𝑔( 𝑓 (𝑥)) → ℓ .

Esercizio 2.24. Si faccia un esempio di una funzione 𝑓 : ℝ → ℝ e una funzione


𝑔 : ℝ → ℝ tali che
lim 𝑓 (𝑥) = 0 , lim 𝑔(𝑥) = 0
𝑥→0 𝑥→0
ma
lim 𝑔( 𝑓 (𝑥)) = 1.
𝑥→0

Quale ipotesi nel teorema precedente viene a mancare?

Teorema 2.25 (limite di funzioni monotòne). Sia 𝑓 : 𝐴 ⊆ ℝ → ℝ una funzione


crescente. Se 𝑥 0 è un punto di accumulazione sinistro per 𝐴 il seguente limite esiste e
vale
lim− 𝑓 (𝑥) = sup 𝑓 ({𝑥 ∈ 𝐴 : 𝑥 < 𝑥 0 })
𝑥→𝑥0

e se 𝑥 0 è un punto di accumulazione destro per 𝐴 il seguente limite esiste e vale

lim 𝑓 (𝑥) = inf 𝑓 ({𝑥 ∈ 𝐴 : 𝑥 > 𝑥 0 }).


𝑥→𝑥 0+

In particolare se +∞ è punto di accumulazione per 𝐴 si ha

lim 𝑓 (𝑥) = sup 𝑓 (𝐴)


𝑥→+∞

e se −∞ è punto di accumulazione per 𝐴 si ha

lim 𝑓 (𝑥) = inf 𝑓 (𝐴).


𝑥→−∞

Gli stessi risultati valgono per le funzioni decrescenti, scambiando sup e inf.

Dimostrazione. Supponiamo che 𝑓 sia crescente e consideriamo il limite sinistro


𝑥 → 𝑥 0− . Può anche essere 𝑥0 = +∞, in tal caso il limite sinistro 𝑥 → 𝑥0−
equivale a 𝑥 → +∞. Poniamo 𝐵 = {𝑥 ∈ 𝐴 : 𝑥 < 𝑥 0 } ℓ = sup 𝐵 e ricordiamo le
proprietà che caratterizzano l’estremo superiore (sappiamo che 𝐵 non è vuoto
in quanto 𝑥 0− per ipotesi è un punto di accumulazione per 𝐴):

∀𝑥 ∈ 𝐵 : 𝑓 (𝑥) ≤ ℓ
∀𝑦 < ℓ : ∃𝛼 ∈ 𝐵 : 𝑓 (𝛼) > 𝑦.

Siccome 𝑓 è crescente, dalla seconda condizione si ottiene che per ogni 𝑥 > 𝛼
si ha 𝑓 (𝑥) ≥ 𝑓 (𝛼) > 𝑦 e mettendo insieme le due condizioni si ottiene che per
ogni 𝑦 < ℓ esiste 𝛼 ∈ ℝ tale che per ogni 𝑥 > 𝛼 si ha 𝑦 < 𝑓 (𝑥) ≤ ℓ . Certamente
2.2 limite di funzione 79

si ha 𝛼 < 𝑥 0 perché 𝛼 ∈ 𝐵. Dunque la condizione 𝑥 > 𝛼 identifica un intorno


sinistro del punto 𝑥 0 e si ha dunque 𝑓 (𝑥) → ℓ per 𝑥 → 𝑥 0− .
Ragionamento analogo si può fare per il limite destro e per le funzioni decrescenti.

Esercizio 2.26. Utilizzando il teorema precedente si studino le discontinuità delle


funzioni monotone. Si dimostri quindi che l’insieme dei punti in cui una funzione
monotona non è continua può essere messo in corrispondenza biunivoca con un
sottoinsieme di ℚ e dunque tale insieme è numerabile.

Il teorema precedente si applica in particolare alle funzioni esponenziali, potenze,


radici e logaritmi negli estremi dei loro domini. Ad esempio è chiaro che se
𝑥0 ∈ (0 , +∞) si ha
lim log 𝑎 𝑥 = log 𝑎 𝑥 0
𝑥→𝑥 0

in quanto il logaritmo è una funzione continua. Se 𝑎 > 1 il logaritmo è crescente


e la sua immagine è tutto ℝ dunque si ha

lim log 𝑎 𝑥 = inf ℝ = −∞ lim log 𝑎 𝑥 = sup ℝ = +∞.


𝑥→0+ 𝑥→+∞

Per l’esponenziale avremo


lim 𝑎 𝑥 = 𝑎 𝑥0
𝑥→𝑥0

se 𝑥 0 ∈ ℝ per continuità. Se 𝑎 > 1 l’esponenziale è crescente ed ha immagine


(0 , +∞) dunque
lim 𝑎 𝑥 = 0 , lim 𝑎 𝑥 = +∞.
𝑥→−∞ 𝑥→+∞

Se 0 < 𝑎 < 1 i limiti all’infinito si scambiano in quanto 𝑎 𝑥 = 1


𝑎 −𝑥 . Per le potenze
avremo, se 𝑥 0 ∈ [0 , +∞) e 𝛼 > 0

lim 𝑥 𝛼 = 𝑥 0𝛼
𝑥→𝑥 0

per continuità. Invece essendo 𝑥 𝛼 crescente e bigettiva su [0 , +∞) si avrà

lim 𝑥 𝛼 = +∞.
𝑥→+∞

Se 𝛼 < 0 la funzione 𝑥 𝛼 è continua, decrescente e bigettiva su (0 , +∞) e dunque


in tal caso:
lim 𝑥 𝛼 = 0.
𝑥→+∞

Tutti questi limiti notevoli possono essere facilmente ricordati se teniamo in


mente i grafici delle funzioni elementari Figura 1.4 e 1.5.
Anche la funzione valore assoluto 𝑓 (𝑥)|𝑥| è separatamente monotona sugli
intervalli [0 , +∞) e (−∞, 0]. Dunque sappiamo che

lim |𝑥| = |+∞| = +∞, lim |𝑥| = |−∞| = +∞.


𝑥→+∞ 𝑥→−∞

Se 𝑥 0 ∈ ℝ ovviamente si ha pure

lim |𝑥 0 | = |𝑥 0 |
𝑥→𝑥 0
80 2 funzioni continue, limiti e successioni

in quanto è banale verificare che la funzione |𝑥| è continua.

Ci sarà anche utile osservare che vale anche questa proprietà

lim | 𝑓 (𝑥)| = 0 ⇐⇒ lim 𝑓 (𝑥) = 0


𝑥→𝑥 0 𝑥→𝑥 0

in quanto le definizioni di limite 𝑓 (𝑥) → 0 e | 𝑓 (𝑥)| → 0 coincidono in quanto


| 𝑓 (𝑥) − 0 | = | 𝑓 (𝑥)| − 0 .
permanenza del segno
Teorema 2.27 (permanenza del segno). Se

lim 𝑓 (𝑥) > 0


𝑥→𝑥0

allora esiste un intorno 𝑈 di 𝑥 0 tale che per ogni 𝑥 ∈ 𝑈 si ha 𝑓 (𝑥) > 0.

Dimostrazione. Sia ℓ ∈ [−∞, +∞] il valore del limite. Se ℓ > 0 esiste certamente
un intorno 𝑈 di ℓ tale che 𝑈 ⊆ (0 , +∞] (se ℓ ∈ ℝ basta prendere (ℓ /2 , 3ℓ /2), se
ℓ = +∞ basta prendere (1, +∞]). Per la definizione di limite esiste 𝑈 intorno di
𝑥0 tale che 𝑓 (𝑈) ⊆ 𝑉 e il risultato segue.

Teorema 2.28 (operazioni con i limiti di funzione). Se

lim 𝑓 (𝑥) = ℓ 1 , lim 𝑔(𝑥) = ℓ 2


𝑥→𝑥0 𝑥→𝑥0

allora si ha

lim ( 𝑓 (𝑥) + 𝑔(𝑥)) = ℓ 1 + ℓ 2 , lim ( 𝑓 (𝑥) − 𝑔(𝑥)) = ℓ 1 − ℓ 2 ,


𝑥→𝑥0 𝑥→𝑥 0
𝑓 (𝑥) ℓ1
lim 𝑓 (𝑥) · 𝑔(𝑥) = ℓ 1 · ℓ 2 , lim =
Si veda la sezione 1.22. I casi in cui le
𝑥→𝑥 0 𝑥→𝑥0 𝑔(𝑥) ℓ2
operazioni non sono definite si chiamano
usualmente forme indeterminate e sono: sempre che le operazioni utilizzate sul lato destro delle uguaglianze siano state definite.
+∞ − (+∞), −∞ − (−∞), +∞ + (−∞), Inoltre se 𝑔(𝑥) → 0+ si ha
−∞ + (+∞), 0 · (+∞), +∞ · 0 0 · (−∞), 1
−∞ · 0, 00 , +∞ −∞ +∞ −∞ lim = +∞
+∞ , −∞ , −∞ , +∞ . 𝑥→𝑥0 𝑔(𝑥)

1
(moralmente 0+ = +∞).

Dimostrazione. Consideriamo la somma dei limiti e innanzitutto il caso in cui ℓ 1


ed ℓ 2 siano entrambi finiti. In tal caso dato un qualunque intorno 𝑈 = (ℓ −𝜀, ℓ +𝜀)
se prendiamo gli intorni 𝑈1 = (ℓ 1 − 𝜀/2 , ℓ 1 + 𝜀/2) e 𝑈2 = (ℓ 2 − 𝜀/2 , ℓ 2 + 𝜀/2) si
possono trovare degli intorni 𝑉1 e 𝑉2 di 𝑥 0 per cui si ha 𝑓 (𝑉1 \ {𝑥 0 }) ⊆ 𝑈1 e
𝑓 (𝑉2 \ {𝑥0 }) ⊆ 𝑈2 e a maggior ragione questo risulta se prendiamo 𝑉 = 𝑉1 ∩ 𝑉2
al posto di 𝑉1 e 𝑉2 . Visto che 𝑈1 + 𝑈2 = 𝑈 si avrà allora ( 𝑓 + 𝑔)(𝑉 \ {𝑥 0 }) ⊆ 𝑈 .

Sempre nel caso della somma se ℓ 1 = +∞ e ℓ 2 ≠ −∞ allora ℓ 1 + ℓ 2 = +∞ e


dato un intorno di +∞ della forma 𝑈 = (𝛼, +∞] con 𝛼 > 0 possiamo prendere
𝑈1 = (2 𝛼, +∞) e 𝑈2 = (ℓ2 − 𝛼, ℓ2 + 𝛼) se ℓ2 ∈ ℝ oppure 𝑈2 = (𝛼, +∞) se ℓ2 = +∞.
In ogni caso si ha 𝑈1 + 𝑈2 = 𝑈 e si procede quindi come nel caso precedente. Il
caso ℓ 1 = −∞ si dimostra in maniera del tutto analoga.
2.2 limite di funzione 81

Per la differenza basta osservare che 𝑓 (𝑥) − 𝑔(𝑥) = 𝑓 (𝑥) + (−𝑔(𝑥)). Se ℓ 2 è finito
la continuità della funzione ℎ(𝑦) = −𝑦 ci garantisce che −𝑔(𝑥) → −ℓ 2 . Lo stesso
si verifica facilmente quando ℓ 2 è infinito (basta osservare che se 𝑈 = (𝛼, +∞+]
è un intorno di +∞ allora −𝑈 = [−∞, −𝛼) è un intorno di −∞). Dunque il
limite della differenza si riconduce al limite della somma.

Per quanto riguarda il prodotto ci ricordiamo che grazie al teorema 1.54 il


gruppo additivo totalmente ordinato ℝ = (−∞, +∞) è isomorfo al gruppo
moltiplicativo ℝ+ = (0 , +∞) e di conseguenza ℝ̄ = [−∞, +∞] corrisponde a
[0+ , +∞] (l’isomorfismo ℝ+ → ℝ è dato dalla funzione log𝑎 𝑥 con 𝑎 > 1 fissato,
tale funzione preserva gli intorni dei punti corrispondenti salvo il fatto che gli
intorni di −∞ si trasformano in intorni destri di 0).

Dunque se 𝑓 > 0 e 𝑔 > 0 i risultati per il limite del prodotto sono conseguenza
dei risultati analoghi per il limite della somma. Cambiando segno ad una
delle due funzioni o ad entrambe ci si può ricondurre al caso 𝑓 > 0 e 𝑔 > 0
quando le due funzioni assumono un segno costante in almeno un intorno del
punto 𝑥 0 . Per il teorema della permanenza del segno questo è vero se ℓ 1 ≠ 0 e
ℓ2 ≠ 0: il limite del prodotto in questo caso è dunque ℓ 1 · ℓ2 . Se invece ℓ1 = 0
e ℓ 2 ∈ ℝ sappiamo che 𝑓 (𝑥) → 0 è equivalente a | 𝑓 (𝑥)| → 0 dunque in tal
caso si può rimpiazzare 𝑓 (𝑥) con | 𝑓 (𝑥)| ≥ 0 (gli eventuali punti in cui 𝑓 (𝑥) = 0
sono irrilevanti e possono essere tolti dal dominio di 𝑓 per garantire | 𝑓 | > 0) e
ottenere che il limite del prodotto è 0. Lo stesso accade se ℓ 2 = 0 con la funzione
𝑔(𝑥).

Per quanto riguarda il rapporto il teorema 1.54 ci dice che le proprietà additive
dell’opposto diventano (tramite logaritmo) proprietà moltiplicative del reciproco,
almeno se siamo nell’ambito di numeri positivi. Dunque se 𝑓 (𝑥) → ℓ con ℓ > 0
1
allora 𝑓 (𝑥) → ℓ1 . Se ℓ = 0 non possiamo concludere niente in quanto le proprietà
additive a −∞ si rispecchiano nelle proprietà moltiplicative in 0+ , non in 0.
Dunque i risultati sul limite del rapporto discendono dai risultati sul limite del
prodotto con il reciproco.

Se dobbiamo calcolare un limite in cui compare un elevamento a potenza


𝑓 (𝑥) 𝑔(𝑥) con base ed esponente variabile converrà scrivere

𝑓 (𝑥) 𝑔(𝑥) = 𝑎 𝑔(𝑥)·log𝑎 𝑓 (𝑥)

per poter applicare il teorema precedente al prodotto 𝑔(𝑥) · log 𝑎 𝑓 (𝑥).

Esempio 2.29. Si calcoli


2 + 𝑥2 − 𝑥3
lim .
𝑥→+∞ (𝑥 2 − 𝑥 + 2)2

Svolgimento. Per 𝑥 → +∞ per il teorema sul limite del prodotto sappiamo che
𝑥 2 → +∞ e 𝑥 3 → +∞. Per il teorema sulla somma dei limiti sappiamo che
2 + 𝑥 2 → +∞ ma a priori non possiamo applicare tale teorema al limite di
(2 + 𝑥 2 ) − 𝑥 3 in quanto (+∞) − (+∞) è una forma indeterminata (non rientra
nelle ipotesi di quel teorema). Bisogna allora intuire che le potenze di 𝑥 con
esponente maggiore sono preponderanti e vanno quindi messe in evidenza
82 2 funzioni continue, limiti e successioni

tramite manipolazioni algebriche. L’espressione di cui vogliamo calcolare il


limite si può quindi riscrivere in questo modo:
 
2 + 𝑥2 − 𝑥3 𝑥3 2
𝑥3
+ 1
𝑥 −1 1
2
+ 1
−1
𝑥3 𝑥
(𝑥 2 − 𝑥 + 2)2
=  2 = 𝑥 ·  2 .
𝑥4 1 − 1
𝑥 + 2
𝑥2
1− 1
𝑥 + 2
𝑥2

A questo punto l’espressione non presenta più forme indeterminate. Applicando


i teoremi precedenti possiamo allora affermare che si ha

2 1 2 1
1 + 𝑥 −1 1 (+∞)3
+ +∞ −1
𝑥3
lim ·  2 = +∞ · 
𝑥→+∞ 𝑥  1 2 1 2
2
1− 𝑥 + 𝑥2
1− +∞ + (+∞)2
0+0−1
=0· = 0 · (−1) = 0.
(1 − 0 + 0)2

L’aver definito le operazioni sulle quantità infinite risulta in effetti comodo nello
svolgimento dei limiti. Bisogna però essere consapevoli che ℝ̄ non è un campo
e quindi le operazioni con i simboli +∞ e −∞ non rispettano molte delle regole
che siamo abituati ad avere sui numeri finiti. Sarà quindi opportuno ricondursi
immediatamente ad una espressione che abbia senso in ℝ, sulla quale potremo
applicare le manipolazioni algebriche con più tranquillità. Per questo motivo in
molti testi l’espressione intermedia in cui compaiono le operazioni eseguite sulle
quantità +∞ e −∞ non è ritenuta valida e si preferisce scrivere direttamente il
risultato.

Esempio 2.30. Si calcoli il seguente limite nel campo complesso:


 
1 1
lim − 2 .
𝑧→0 𝑧 𝑧 −𝑧

Dimostrazione. Anche in questo caso non possiamo applicare direttamente le


regole di calcolo del limite in quanto otterremmo la forma indeterminata ∞ − ∞.
Possiamo però operare una semplice manipolazione algebrica per eliminare
l’indeterminazione:
1 1 𝑧−1−1 𝑧−2 0−2 −2
− 2 = 2 = 2 → 2 = =∞ per 𝑧 → 0.
𝑧 𝑧 −𝑧 𝑧 −𝑧 𝑧 −𝑧 0 −0 0

2.3 proprietà frequenti e definitive

Definizione 2.31 (proprietà frequenti e definitive). Diremo che un predicato 𝑃(𝑥)


definito su un insieme 𝐴 ⊆ ℝ di cui 𝑥 0 è punto di accumulazione vale definitivamente
definitivamente
per 𝑥 → 𝑥 0 se vale in un intorno di 𝑥 0 ovvero:

∃𝑈 ∈ B𝑥0 : ∀𝑥 ∈ 𝐴 ∩ 𝑈 \ {𝑥0 } : 𝑃(𝑥).


2.4 criteri di confronto 83

Diremo che 𝑃(𝑥) vale frequentemente per 𝑥 → 𝑥 0 se in ogni intorno di 𝑥 0 c’è almeno frequentemente
un punto 𝑥 ≠ 𝑥 0 in cui vale:

∀𝑈 ∈ B𝑥0 : ∃𝑥 ∈ 𝐴 ∩ 𝑈 \ {𝑥0 } : 𝑃(𝑥).

Chiaramente se una proprietà vale definitivamente vale anche frequentemente


infatti se c’è un intorno 𝑈 su cui vale la proprietà per ogni altro intorno 𝑉 la
proprietà risulta valida su 𝑈 ∩ 𝑉 che non è mai vuoto. Se una proprietà vale
frequentemente significa in particolare che vale per infiniti valori diversi in
quanto se vale in punto 𝑥 ≠ 𝑥 0 posso sempre trovare un intorno 𝑉 di 𝑥 0 che
non contiene 𝑥 e in tale intorno trovo un ulteriore punto in cui vale la proprietà.
Iterando il procedimento posso trovare infiniti punti diversi su cui la proprietà
è valida.

Le due proprietà sono complementari nel senso che vale in base alle proprietà
dei quantificatori universali vale la seguente relazione:

non frequentemente 𝑃(𝑥) ⇐⇒ definitivamente non 𝑃(𝑥)

Se due proprietà 𝑃(𝑥) e 𝑄(𝑥) valgono definitivamente allora anche 𝑃(𝑥) ∧ 𝑄(𝑥)
vale definitivamente. Se invece valgono entrambe frequentemente allora anche
𝑃(𝑥) ∨ 𝑄(𝑥) vale frequentemente.

Esempio 2.32. La proprietà 𝑥 3 − 𝑥 > 1000 𝑥 2 + 1 vale definitivamente per 𝑥 → +∞.


La proprietà 𝑥 > 0 vale frequentemente per 𝑥 → 0.

La definizione di limite 𝑓 (𝑥) → ℓ per 𝑥 → 𝑥 0 potrebbe quindi enunciarsi così:


per ogni intorno 𝑈 di ℓ si ha 𝑓 (𝑥) ∈ 𝑈 definitivamente. E la sua negazione è:
esiste un intorno 𝑈 di ℓ per cui frequentemente 𝑓 (𝑥) ∉ 𝑈 .

Non è possibile fare confronti tra va-


2.4 criteri di confronto lori complessi, visto che sui numeri
complessi non abbiamo un ordinamento

Teorema 2.33 (criteri di confronto). Siano 𝑓 , 𝑔 , ℎ tre funzioni reali definite su uno confronto tra limiti
stesso dominio 𝐴 ⊆ ℝ con punto di accumulazione 𝑥 0

1. Se per ogni 𝑥 ∈ 𝐴 si ha
𝑓 (𝑥) ≤ 𝑔(𝑥)
e se entrambe le funzioni ammettono limite: 𝑓 (𝑥) → ℓ 1 e 𝑔(𝑥) → ℓ 2 per 𝑥 → 𝑥 0
allora
ℓ1 ≤ ℓ2 .
2. Se per ogni 𝑥 ∈ 𝐴 si ha:
𝑓 (𝑥) ≤ 𝑔(𝑥) teorema dei carabinieri
e se 𝑓 (𝑥) → +∞ allora anche 𝑔(𝑥) → +∞ per 𝑥 → 𝑥 0 . Viceversa se
𝑓 (𝑥) ≤ 𝑔(𝑥) e 𝑔(𝑥) → −∞ allora anche 𝑓 (𝑥) → −∞.
84 2 funzioni continue, limiti e successioni

3. (teorema dei carabinieri) Se per ogni 𝑥 ∈ 𝐴 vale

𝑓 (𝑥) ≤ ℎ(𝑥) ≤ 𝑔(𝑥)

e se le due funzioni 𝑓 e 𝑔 hanno lo stesso limite: 𝑓 (𝑥) → ℓ e 𝑔(𝑥) → ℓ per


𝑥 → 𝑥0 allora anche ℎ(𝑥) → ℓ .

Dimostrazione. 1. Se per assurdo fosse ℓ 1 > ℓ 2 la funzione 𝑓 (𝑥)− 𝑔(𝑥) avrebbe


limite positivo e per il teorema della permanenza del segno dovrebbe
essere definitivamente positiva. Ma questo contraddice l’ipotesi 𝑓 (𝑥) −
𝑔(𝑥) ≤ 0.
2. Se non fosse 𝑔(𝑥) → +∞ significa che esiste 𝛼 ∈ ℝ tale che 𝑔(𝑥) < 𝛼
frequentemente. Ma visto che definitivamente 𝑓 (𝑥) > 𝛼 troviamo che
frequentemente si ha 𝑓 (𝑥) > 𝑔(𝑥) in contrasto con l’ipotesi 𝑓 (𝑥) ≤ 𝑔(𝑥).
3. Se 𝑓 e 𝑔 hanno lo stesso limite ℓ significa che per ogni 𝑈 intorno di ℓ si ha
definitivamente 𝑓 (𝑥) ∈ 𝑈 e 𝑔(𝑥) ∈ 𝑈 . Visto che 𝑈 è un intervallo anche
ℎ(𝑥) è definitivamente in 𝑈 e quindi ℎ(𝑥) → ℓ .

Esempio 2.34. Dimostrare che

lim (2 𝑥 − b𝑥c) = +∞.


𝑥→+∞

Sappiamo che b𝑥 b≤ 𝑥 dunque

2 𝑥 − b𝑥c ≥ 2 𝑥 − 𝑥 = 𝑥 → +∞.

Dunque per confronto si ottiene il risultato richiesto.

Corollario 2.35 (limitata per infinitesima). Se 𝑓 (𝑥) è una funzione limitata e


𝑔(𝑥) → 0 per 𝑥 → 𝑥0 allora anche

𝑓 (𝑥) · 𝑔(𝑥) → 0 per 𝑥 → 𝑥 − 0.

Dimostrazione. Se 𝑓 è limitata significa che esiste 𝑅 > 0 tale che | 𝑓 (𝑥)| ≤ 𝑅 per
ogni 𝑥 nel dominio di 𝑓 . Ma allora

0 ≤ | 𝑓 (𝑥) · 𝑔(𝑥)| = | 𝑓 (𝑥)| · | 𝑔(𝑥)| ≤ 𝑅| 𝑔(𝑥)| → 𝑅 · 0 = 0.


successione
Utilizziamo il grassetto per evidenziare Per confronto deduciamo che | 𝑓 (𝑥) · 𝑔(𝑥)| → 0 che è equivalente alla tesi.
il fatto che 𝒂 non è un numero ma una
lista (o vettore) di numeri. Nella scrittura
a mano non è possibile usare il grassetto,
ma potremmo sottolineare il nome della Esercizio 2.36. Mostrare che
variabile scrivendo 𝑎 invece che 𝒂 . In

alternativa si potrebbe scrivere 𝑎 oppure 𝑥 − b𝑥c
lim = 0.
evitare qualunque distinzione e scrivere 𝑥→+∞ 𝑥
più semplicemente 𝑎 .
2.5 successioni 85

2.5 successioni

Una successione in un insieme 𝑋 è una funzione 𝒂 : ℕ → 𝑋 . L’insieme delle


funzioni ℕ → 𝑋 viene usualmente indicato con 𝑋 ℕ e potremmo dunque
scrivere 𝒂 ∈ 𝑋 ℕ . In effetti una successione 𝒂 può essere interpretata come una
sequenza infinita di elementi di 𝑋 :

𝒂 = (𝑎 0 , 𝑎1 , 𝑎2 , . . . , 𝑎 𝑛 , . . . )

dove si intende
𝑎 𝑛 = 𝒂(𝑛).
Le componenti 𝑎 𝑛 si chiamano termini della successione. I numeri 𝑛 si chiamano,
invece, indici. L’intera successione 𝒂 può essere indicata con (𝑎 𝑛 )∞
𝑛=0 oppure
(𝑎 𝑛 )𝑛 oppure, più semplicemente, con 𝑎 𝑛 quando sia chiaro che si intende
In alcuni testi le successioni vengono
l’intera successione 𝒂 e non un singolo termine della stessa.
indicate con la notazione {𝑎 𝑛 } che però
è fuorviante in quanto una successione in
Per noi il caso più interessante sarà quello delle successioni reali 𝑎 𝑛 ∈ ℝ cioè il 𝑋 non è semplicemente un sottoinsieme
caso 𝑋 = ℝ. Considereremo però anche il caso di successioni complesse 𝑎 𝑛 ∈ ℂ di 𝑋 : l’ordine in cui vengono presi gli
(dunque 𝑋 = ℂ) perché questo potrà essere utile in alcune situazioni. elementi è rilevante.

2.6 limite di successione

Visto che 𝒂 : ℕ → ℝ (o in ℂ) è una funzione con dominio ℕ ⊆ ℝ e visto che +∞


è l’unico punto di accumulazione di ℕ sarà possibile considerare il limite

ℓ = lim 𝒂(𝑛)
𝑛→+∞

che potremmo anche scrivere con una delle seguenti notazioni:

ℓ = lim 𝒂 = lim 𝑎 𝑛 = lim 𝑎 𝑛


𝑛 𝑛→+∞

o più concisamente:
𝑎𝑛 → ℓ .

Esplicitando la definizione astratta di limite osserviamo che se (𝛼, +∞] è un


intorno di +∞ con 𝛼 > 0 la sua intersezione con ℕ (il dominio della funzione)
è l’insieme {𝑛 ∈ ℕ : 𝑛 > 𝑁 } dove 𝑁 = d𝛼e è un numero naturale. Dunque se
ℓ ∈ ℝ la condizione 𝑎 𝑛 → ℓ si esplicita nel modo seguente:

∀𝜀 > 0 : ∃𝑁 ∈ ℕ : 𝑛 > 𝑁 =⇒ |𝑎 𝑛 − ℓ | < 𝜀. (2.4)

La condizione 𝑎 𝑛 → +∞ si scrive

∀𝛼 ∈ ℝ : ∃𝑁 ∈ ℕ : 𝑛 > 𝑁 =⇒ 𝑎 𝑛 > 𝛼

e infine 𝑎 𝑛 → −∞ diventa

∀𝛼 ∈ ℝ : ∃𝑁 ∈ ℕ : 𝑛 > 𝑁 =⇒ 𝑎 𝑛 < −𝛼.


86 2 funzioni continue, limiti e successioni

Definizione 2.37 (carattere di una successione). Sia 𝑎 𝑛 una successione a valori


reali o complessi e si consideri il limite

lim 𝑎 𝑛 .
𝑛

regolare
Se tale limite esiste diremo che la successione 𝑎 𝑛 è regolare, se il limite esiste ed è finito
diremo che la successione è convergente se il limite è infinito diremo che la successione
convergente è divergente se il limite non esiste diremo infine che la successione è indeterminata.
divergente Abbiamo dunque le seguenti alternative
indeterminata 1. la successione è convergente (ha limite finito);
2. la successione è divergente (ha limite infinito);
3. la successione è indeterminata (non ha limite).

carattere di una successione Determinare il carattere di una successione significa specificare a quale delle tre categorie
appartiene.

Esercizio 2.38. Una successione complessa 𝑧 𝑛 ∈ ℂ potrà essere scritta nella forma
𝑧 𝑛 = 𝑥 𝑛 + 𝑖 𝑦𝑛 dove 𝑥 𝑛 e 𝑦𝑛 sono successioni reali. Si può allora verificare che 𝑧 𝑛 → 𝑧
per 𝑧 ∈ ℂ se e solo se 𝑥 𝑛 → 𝑥 e 𝑦𝑛 → 𝑦 dove 𝑧 = 𝑥 + 𝑖 𝑦 con 𝑥, 𝑦 ∈ ℝ.

Si faccia attenzione al fatto che una successione 𝑎 𝑛 ∈ ℝ ⊆ ℂ può essere


interpretata sia come successione reale che come successione complessa. Le
condizioni di convergenza in ℝ o ℂ sono allora equivalenti. Ma se 𝑎 𝑛 → ∞
(in ℂ̄) significa che |𝑎 𝑛 | → +∞ e può capitare che 𝑎 𝑛 non abbia limite né +∞
né −∞ in quanto potrebbe frequentemente cambiare di segno (un esempio è
𝑎 𝑛 = (−𝑛)𝑛 ).

In generale potremmo avere delle successioni definite solamente su un sottoin-


sieme ℕ dei numeri naturali. Finché la successione è definita in un intorno di
+∞ (cioè da un certo 𝑛0 in poi) questo non ha nessuna conseguenza sul limite
per 𝑛 → +∞ (grazie alla località del limite, teorema 2.20).

Esempio 2.39. La successione 𝑎 𝑛 = 1/𝑛 è definita per 𝑛 ∈ ℕ ma 𝑛 ≠ 0. Ciò non


toglie che possiamo studiarne il limite come qualunque altra successione. Per evidenziare
il fatto che il primo indice è 𝑛 = 1 si potrà usare la notazione (𝑎 𝑛 )∞
𝑛=1 .

2.7 successioni limitate

Se abbiamo una successione 𝑎 𝑛 reale possiamo anche considerare gli operatori:

sup 𝑎 𝑛 , inf 𝑎 𝑛 , max 𝑎 𝑛 , min 𝑎 𝑛


𝑛 𝑛 𝑛 𝑛

che sono definiti come per qualunque altra funzione. Sappiamo che sup e inf
esistono sempre (in ℝ̄) mentre max e min potrebbero non esistere.

Anche il concetto di limitatezza per una successione è ereditato dallo stesso


concetto valido per le funzioni. Una successione 𝑎 𝑛 (a valori reali o complessi)
limitata
si dice essere limitata se l’insieme {|𝑎 𝑛 | : 𝑛 ∈ ℕ } è limitato. Cioè se
2.7 successioni limitate 87

sup |𝑎 𝑛 | < +∞.


𝑛

In caso contrario la successione si dice essere illimitata. Queste definizioni si illimitata


applicano tali e quali alle successioni di numeri complessi (rimpiazzando il
valore assoluto con il modulo).

Se la successione ha valori reali potremo anche parlare di limitatezza superiore


quando sup 𝑎 𝑛 < +∞ e limitatezza inferiore quando inf 𝑎 𝑛 > −∞.

Esempio 2.40. Si consideri 𝑎 𝑛 = 1


𝑛+1 definita per 𝑛 ∈ ℕ . Allora

sup 𝑎 𝑛 = max 𝑎 𝑛 = 1 , inf 𝑎 𝑛 = 0 , non esiste min 𝑎 𝑛 .

Dimostrazione. Per ogni 𝑛 ∈ ℕ si ha 𝑛 + 1 ≥ 1 e quindi 𝑎 𝑛 = 1/(𝑛 + 1) ≤ 1. Visto


poi che 𝑎 0 = 1 si ottiene immediatamente che max 𝑎 𝑛 = 1 e di conseguenza
sup 𝑎 𝑛 = 1.

Per verificare che inf 𝑎 𝑛 = 0 dobbiamo verificare innanzitutto che 0 è minorante,


e questo è vero in quanto 𝑎 𝑛 = 1/(𝑛 + 1) > 0 essendo 𝑛 + 1 ≥ 1 ≥ 0. Inoltre
dobbiamo verificare che per ogni 𝜀 > 0 esiste 𝑛 ∈ ℕ tale che 𝑎 𝑛 < 0 + 𝜀 = 𝜀.
Questo succede se 1/(𝑛 + 1) < 𝜀 ovvero se 𝑛 > 1/𝜀 − 1 ad esempio per 𝑛 = d1/𝜀e .
Abbiamo dunque verificato che inf 𝑎 𝑛 = 0. Il minimo di 𝑎 𝑛 non esiste perché se
esistesse dovrebbe essere uguale all’estremo inferiore cioè dovrebbe essere 0.
Ma questo è impossibile perché per ogni 𝑛 ∈ ℕ si ha 𝑎 𝑛 = 1/(𝑛 + 1) ≠ 0.

Visto che l’insieme ℕ su cui sono definite le successioni ha un unico punto di


accumulazione +∞ se la successione è convergente non potrà essere illimitata,
come viene espresso nel seguente.

Teorema 2.41 (limitatezza delle successioni convergenti). Se una successione


(reale o complessa) è convergente allora è anche limitata. Se una successione reale diverge
a +∞ allora è inferiormente limitata, se diverge a −∞ è superiormente limitata.

Dimostrazione. Per la definizione di limite (2.4) se 𝑎 𝑛 → ℓ con ℓ finito sappiamo


che scelto 𝜀 = 1 dovrà esistere 𝑁 ∈ ℕ tale che

∀𝑛 > 𝑁 : |𝑎 𝑛 − ℓ | < 1.

Osserviamo ora che gli indici 𝑛 per cui 𝑛 ≤ 𝑁 sono in numero finito (in effetti
sono 𝑁 + 1) e quindi esiste

𝑀 = max |𝑎 𝑛 | = max {|𝑎0 |, |𝑎1 |, . . . , |𝑎 𝑁 |}.


𝑛≤𝑁

Dunque scelto 𝑅 = max {|ℓ | + 1 , 𝑀} se 𝑛 ≤ 𝑁 si ha certamente |𝑎 𝑛 | ≤ 𝑀 ≤ 𝑅


e se 𝑛 > 𝑁 si ha comunque, per disuguaglianza triangolare,

|𝑎 𝑛 | ≤ |𝑎 𝑛 − ℓ | + |ℓ | = 1 + ℓ ≤ 𝑅.

Dunque nel complesso risulta sup𝑛 |𝑎 𝑛 | ≤ 𝑅 e la successione è limitata.


88 2 funzioni continue, limiti e successioni

Se 𝑎 𝑛 → +∞ per la definizione di limite scelto (0 , +∞] come intorno di +∞


deve esistere in indice 𝑁 ∈ ℕ tale che se 𝑛 > 𝑁 si ha 𝑎 𝑛 > 0. Ma allora posto
𝑅 = min {0 , 𝑎0 , . . . , 𝑎 𝑁 } si avrà 𝑎 𝑛 ≥ 𝑅 per ogni 𝑛 ∈ ℕ e dunque la successione
risulta essere inferiormente limitata.

Dimostrazione analoga si fa nel caso 𝑎 𝑛 → −∞.

prodotto limitata per infinitesima


Teorema 2.42 (prodotto di limitata per infinitesima). Se 𝑎 𝑛 è una successione
limitata e 𝑏 𝑛 → 0 allora 𝑎 𝑛 · 𝑏 𝑛 → 0 (il risultato vale sia per successioni reali che per
successioni complesse).

Dimostrazione. Se 𝑎 𝑛 è limitata significa che esiste 𝑅 > 0 tale che |𝑎 𝑛 | ≤ 𝑅 per


ogni 𝑛 ∈ ℕ . Se 𝑏 𝑛 → 0 sappiamo che anche |𝑏 𝑛 | → 0, dunque

0 ≤ |𝑎 𝑛 · 𝑏 𝑛 | = |𝑎 𝑛 | · |𝑏 𝑛 | ≤ 𝑅 · |𝑏 𝑛 | → 𝑅 · 0 = 0.

Per il teorema dei due carabinieri deduciamo che |𝑎 𝑛 · 𝑏 𝑛 | → 0 e quindi


𝑎 𝑛 · 𝑏 𝑛 → 0.

2.8 successioni monotòne

Le successioni sono funzioni ℕ → ℝ si applicano le definizioni 1.52 per


classificare le successioni in base alla monotonia. Per le successioni, tuttavia, si
possono dare delle definizioni equivalenti utilizzando il principio di induzione,
come viene esplicitato nel seguente teorema.

Teorema 2.43 (successioni monotòne). Una successione 𝑎 𝑛 è

1. crescente: se per ogni 𝑛 ∈ ℕ si ha 𝑎 𝑛+1 ≥ 𝑎 𝑛 ;


2. decrescente: se per ogni 𝑛 ∈ ℕ si ha 𝑎 𝑛+1 ≤ 𝑎 𝑛 ;
3. strettamente crescente: se per ogni 𝑛 ∈ ℕ si ha 𝑎 𝑛+1 > 𝑎 𝑛 ;
4. strettamente decrescente: se per ogni 𝑛 ∈ ℕ si ha 𝑎 𝑛+1 < 𝑎 𝑛 ;

Dimostrazione. Consideriamo ad esempio la prima condizione (funzione cre-


scente). Ovviamente se 𝑎 𝑛 è crescente si ha 𝑎 𝑛+1 ≥ 𝑎 𝑛 in quanto 𝑛 + 1 > 𝑛 .
Viceversa supponiamo che per ogni 𝑛 ∈ ℕ si abbia 𝑎 𝑛+1 ≥ 𝑎 𝑛 . Allora chiara-
mente 𝑎 1 ≥ 𝑎 0 , 𝑎 2 ≥ 𝑎 1 ≥ 𝑎 0 , 𝑎 3 ≥ 𝑎 2 ≥ 𝑎 1 ≥ 𝑎 0 ... Per induzione si può quindi
dimostrare che 𝑎 𝑛 ≥ 𝑎 𝑛−1 ≥ · · · ≥ 𝑎 2 ≥ 𝑎 1 .

Gli altri casi si svolgono in maniera analoga.

Esempio 2.44. La successione 𝑎 𝑛 = 𝑛 ! è crescente in quanto per ogni 𝑛 si ha


(𝑛 + 1)! = (𝑛 + 1) · 𝑛 ! ≥ 𝑛 !.

Il teorema 2.25 ci assicura che una successione monotona ha sempre limite.


Infatti il limite per 𝑛 → +∞ è un limite sinistro. In particolare se 𝑎 𝑛 è crescente
si ha
lim 𝑎 𝑛 = sup 𝑎 𝑛
𝑛 𝑛
2.9 la costante di Nepero 89

mentre se 𝑎 𝑛 è decrescente si ha

lim 𝑎 𝑛 = inf 𝑎 𝑛 .
𝑛 𝑛

2.9 la costante di Nepero

La funzione esponenziale è legata ad un modello di crescita che si trova spesso


in natura: la crescita esponenziale. Prendiamo come esempio una popolazione crescita esponenziale
di batteri che cresce senza limitazioni di spazio e di nutrimento oppure alla
crescita di un capitale dovuto ad una rendita finanziaria.

Supponiamo che una popolazione che al tempo 𝑡0 = 0 ammonta ad un certo


numero 𝑐 di batteri, al tempo 𝑡 > 0 raggiunga una numerosità 𝑞(𝑡, 𝑐). Se lascio
crescere la popolazione per un ulteriore tempo 𝑠 > 0 troverò al tempo 𝑡 + 𝑠 la
stessa popolazione che avrei al tempo 𝑠 se al tempo zero fossi partito con la
popolazione 𝑞(𝑡):
𝑞(𝑡 + 𝑠, 𝑐) = 𝑞(𝑠, 𝑞(𝑡, 𝑐)).
L’equazione precedente si chiama proprietà di semigruppo continuo. Ma fissato
𝑡 la popolazione 𝑞(𝑡, 𝑐) deve essere proporzionale a 𝑐 perché ogni batterio ha la
sua discendenza indipendentemente dalla numerosità totale della popolazione.
In pratica si deve avere 𝑞(𝑡, 𝑐) = 𝑘(𝑡) · 𝑐 per una opportuna funzione 𝑘(𝑡) che
non dipende da 𝑐 . Dunque

𝑞(𝑡 + 𝑠, 𝑐) = 𝑞(𝑠, 𝑞(𝑡, 𝑐)) = 𝑘(𝑠) · 𝑞(𝑡, 𝑐) = 𝑘(𝑠) · 𝑘(𝑡) · 𝑐

da cui
𝑘(𝑡 + 𝑠) = 𝑘(𝑠) · 𝑘(𝑡).
In base al teorema 1.54 possiamo affermare che 𝑘(𝑡) è una funzione esponenziale
𝑘(𝑡) = 𝑎 𝑡 per una qualche costante 𝑎 . La costante 𝑎 può essere determinata
mediante la formula:
𝑞(1 , 𝑐)
𝑎 = 𝑘(1) =
𝑐

𝑒𝑞
𝑞 𝑛
1+ 𝑛
..
.
𝑞 3
1+ 𝑛
𝑞 2 Figura 2.1: L’interesse composto. Se di-
1+ 𝑛 vidiamo l’intervallo [0 , 1] in 𝑛 parti (in
𝑞
1+ 𝑛 figura 𝑛 = 5), al passo zero partiamo
1 con un capitale pari ad 1 e ad ogni passo
di ampiezza 𝑛1 moltiplichiamo il nostro
𝑞
capitale per 1 + 𝑛 (supponendo di avere
un interesse pari a 𝑞 che nel tempo 𝑛1 ci
𝑞
paga quindi 𝑛 volte il nostro capitale).
Dopo 𝑛 passi, cioè al tempo 1, avremo
1 2 3 ... 1

𝑞 𝑛

𝑛 𝑛 𝑛 un capitale pari a 1 + 𝑛 . Se 𝑛 → +∞
questa quantità tende 𝑞
ad 𝑒 .
90 2 funzioni continue, limiti e successioni

ma questa espressione non ha un preciso significato fisico in quanto dipende


dall’unità di tempo scelta.

La costante a cui possiamo dare significato è invece l’aumento relativo istantaneo


della popolazione. Possiamo infatti supporre che se lasciamo la popolazione
crescere per un tempo Δ𝑡 molto piccolo, si otterrà un aumento di popolazione
proporzionale al tempo Δ𝑡 (stiamo qui anticipando il concetto di derivata) e alla
popolazione:
𝑞(Δ𝑡, 𝑐) = 𝑐 + 𝑟𝑐Δ𝑡 = (1 + 𝑟Δ𝑡)𝑐. (2.5)
La costante 𝑟 rappresenta quindi l’aumento relativo istantaneo della popolazione
(nel caso dell’investimento 𝑟 sarebbe il tasso di interesse istantaneo). Questa
definizione ha senso quando Δ𝑡 è piccolo in quanto non tiene conto del fatto
che nell’intervallo di tempo [𝑡, 𝑡 + Δ𝑡] la popolazione che si è aggiunta genera
anch’essa nuova popolazione (ovvero l’interesse accumulato genera anch’esso
In effetti la scoperta della costante 𝑒 è do-
vuta a Jacob Bernoulli nel 1683. Bernoulli interesse).
si chiedeva qual è l’interesse annuo effet-
tivo che si ottiene da un capitale che dia Per calcolare l’aumento della popolazione su tempi “grandi” possiamo suddi-
una rendita giornaliera (interesse com- videre gli intervalli temporali in 𝑛 intervallini di ampiezza Δ𝑡 e applicare in
posto). Se un capitale è investito ad un
tasso di interesse 𝑟 , si intende che ogni ognuno di essi la relazione (2.5). Si trova:
giorno il capitale viene aumentato di un
fattore 1 + 𝑟/365 e quindi dopo un anno 𝑞(Δ𝑡, 𝑐) = 𝑐(1 + 𝑟Δ𝑡)
il fattore moltiplicativo è (1 + 𝑟/365)365 .
𝑞(2Δ𝑡, 𝑐) = 𝑞(Δ𝑡, 𝑐)(1 + 𝑟Δ𝑡) = 𝑐(1 + 𝑟Δ𝑡)2
..
.
𝑞(𝑛Δ𝑡) = 𝑐(1 + 𝑟Δ𝑡)𝑛 .

Dunque, ponendo Δ𝑡 = 𝑡/𝑛 si ha


𝑛
𝑡

𝑞(𝑡, 𝑐) = 𝑐 1 + 𝑟
𝑛

in particolare per 𝑡 = 1/𝑟 si ottiene:


 𝑛
1
𝑞(1/𝑟, 𝑐) = 𝑐 1 +
𝑛

e ricordando che 𝑞(𝑡, 𝑐) = 𝑐𝑎 𝑡 otteniamo:


 𝑛
1 1
𝑎𝑟 = 1+ .
𝑛

Se per 𝑛 → +∞ (che corrisponde a Δ𝑡 → 0) la quantità sul lato destro tende ad


un numero 𝑒 (che chiameremo costante di Nepero) avremo allora

𝑎 = 𝑒𝑟 , 𝑞(𝑡, 𝑐) = 𝑐𝑒 𝑟𝑡

che è la relazione che lega le due costanti 𝑎 e 𝑟 che definiscono la crescita


esponenziale.

Risulta in effetti valido il seguente.


2.9 la costante di Nepero 91

Teorema 2.45 (costante di Nepero). La successione


 𝑛
1
𝑎𝑛 = 1 +
𝑛

è crescente e limitata, dunque è convergente.

Per dimostrare il teorema precedente ci serve preliminarmente il seguente


risultato.

disuguaglianza di Bernoulli
Teorema 2.46 (disuguaglianza di Bernoulli). Se 𝑥 > −1 e 𝑛 ∈ ℕ si ha

(1 + 𝑥)𝑛 ≥ 1 + 𝑛𝑥. (2.6)

Dimostrazione. Dimostriamo che vale (2.6) per induzione su 𝑛 . Per 𝑛 = 0 la


disequazione (2.6) diventa 1 ≥ 1 ed è quindi verificata. Se (2.6) è verificata per
un certo 𝑛 moltiplicando ambo i membri per 1 + 𝑥 > 0 si ottiene

(1 + 𝑥)𝑛+1 ≥ (1 + 𝑥)(1 + 𝑛𝑥) = 1 + (𝑛 + 1)𝑥 + 𝑛𝑥 2 ≥ 1 + (𝑛 + 1)𝑥

che è proprio la disuguaglianza (2.6) con 𝑛 + 1 al posto di 𝑛 .

Dimostrazione del teorema 2.45. Dimostriamo innanzitutto che 𝑎 𝑛 è crescente,


cioè che per ogni 𝑛 ≥ 2 si ha 𝑎 𝑛 ≥ 𝑎 𝑛−1 . E’ chiaro che 𝑎 𝑛 > 0 per ogni 𝑛 , quindi
ci riconduciamo a verificare che 𝑎𝑎𝑛−𝑛 1 ≥ 1.
Si ha
𝑛 𝑛+1 𝑛
1 + 𝑛1

𝑎𝑛 𝑛
=  𝑛−1 =
𝑎 𝑛−1 1 + 𝑛−1 1 𝑛 𝑛−1

𝑛−1
𝑛 𝑛
𝑛+1 𝑛−1 𝑛 𝑛2 − 1 𝑛
 
= · · = ·
𝑛 𝑛 𝑛−1 𝑛2 𝑛−1

Osserviamo ora che la disuguaglianza di Bernoulli, teorema 2.46, garantisce


𝑛 𝑛
𝑛2 − 1 𝑛 𝑛−1
 
1 1
= 1− 2 ≥ 1− =1− =
𝑛2 𝑛 𝑛 2 𝑛 𝑛

da cui si ottiene, come volevamo, 𝑎 𝑛 /𝑎 𝑛−1 ≥ 1 cioè 𝑎 𝑛 è crescente.


Se ora consideriamo la successione
  𝑛+1
1
𝑏𝑛 = 1 +
𝑛

osserviamo che si ha
 𝑛    
1 1 1
𝑏𝑛 = 1 + · 1+ = 𝑎𝑛 · 1 + > 𝑎𝑛 .
𝑛 𝑛 𝑛

Per dimostrare che 𝑎 𝑛 è limitata sarà quindi sufficiente dimostrare che 𝑏 𝑛 è


superiormente limitata. Vedremo ora che 𝑏 𝑛 è decrescente (e quindi 𝑎 𝑛 ≤ 𝑏 𝑛 ≤ 𝑏 1
è superiormente limitata).
92 2 funzioni continue, limiti e successioni

Procediamo in maniera analoga a quanto fatto per 𝑎 𝑛 :


𝑛 𝑛 𝑛
1 + 𝑛−1 1

𝑏 𝑛−1 𝑛−1
 𝑛 𝑛  𝑛+1 𝑛 − 1
=  𝑛+1 = = · ·
𝑏𝑛 1 + 𝑛1 𝑛+1 𝑛+1
 𝑛−1 𝑛+1 𝑛
𝑛
 𝑛+1  𝑛+1
𝑛2 𝑛−1 𝑛−1
 
1
= · = 1+ 2 · .
𝑛 −1
2 𝑛 𝑛 −1 𝑛

In base alla disuguaglianza di Bernoulli otteniamo


 𝑛+1
𝑛

1 1 1
1+ ≥ 1 + (𝑛 + 1) · ≥ 1+ = .
𝑛2 − 1 𝑛2 − 1 𝑛−1 𝑛−1

Mettendo insieme le due stime si ottiene dunque 𝑏 𝑛−1 /𝑏 𝑛 ≥ 1 che è quanto ci


rimaneva da dimostrare.

E’ quindi giustificata la seguente.

costante di Nepero Definizione 2.47 (costante di Nepero). Definiamo la costante di Nepero


Nepero è l’italianizzazione del nome del  𝑛
matematico scozzese John Napier (1550- 1
1617). Il nome 𝑒 è stato introdotto da 𝑒 = lim 1+ , 𝑛 ∈ ℕ.
𝑛→+∞ 𝑛
Eulero (Leonhard Euler 1707-1783)

Sapendo che
 𝑛   𝑛+1
1 1
1+ ≤ 𝑒 ≤ 1+
𝑛 𝑛
e ponendo 𝑛 = 1 otteniamo 2 ≤ 𝑒 ≤ 4.

𝑛𝑛 𝑎 𝑛+1
Esercizio 2.48. Posto 𝑎 𝑛 = 𝑛! mostrare che 𝑎𝑛 → 𝑒.
limiti che si riconducono al numero 𝑒

Teorema 2.49 (limiti che si riconducono al numero 𝑒 ). Si ha


1
lim (1 + 𝑥) 𝑥 = 𝑒.
𝑥→0

Dimostrazione. Iniziamo col dimostrare che


 𝑥
1
lim 1+ = 𝑒. (2.7)
𝑥→+∞ 𝑥

Ogni numero reale 𝑥 è compreso tra due interi consecutivi:

b𝑥c ≤ 𝑥 ≤ b𝑥c + 1

e dunque
1 1 1
1+ ≤ 1+ ≤ 1+
b𝑥c + 1 𝑥 b𝑥c
da cui   b𝑥c  𝑥   b𝑥c+1
1 1 1
1+ ≤ 1+ ≤ 1+ . (2.8)
b𝑥c + 1 𝑥 b𝑥c
2.9 la costante di Nepero 93

Per calcolare il limite della espressione a sinistra operiamo il cambio di variabile


𝑛 = b𝑥c + 1 per ottenere:
  b𝑥c   𝑛−1
1 1
lim 1+ = lim 1+
𝑥→+∞ b𝑥c + 1 𝑛→+∞ 𝑛
1 𝑛

1+ 𝑛 𝑒
= lim = = 𝑒.
𝑛→+∞ 1 + 𝑛1 1

Similmente per quanto riguarda il limite della espressione a destra si può


operare il cambio di variabile 𝑛 = b𝑥c :
  b𝑥c+1   𝑛+1
1 1
1+ = lim 1+
b𝑥c 𝑛→+∞ 𝑛
 𝑛  
1 1
= lim 1+ · 1+ = 𝑒 · 1 = 𝑒.
𝑛→+∞ 𝑛 𝑛

Dunque per il teorema dei due carabinieri otteniamo che anche l’espressione al
centro in (2.8) tende ad 𝑒 . Come conseguenza, tramite il cambio di variabile
𝑥 ↦→ 𝑥1 si ottiene
1
lim (1 + 𝑥) 𝑥 = 𝑒.
𝑥→0+

Consideriamo ora il limite per 𝑥 → −∞ della solita espressione. Tramite il


cambio di variabile 𝑦 = −𝑥 si ha
𝑥  −𝑦  −𝑦
𝑦−1
  
1 1
lim 1+ = lim 1− = lim
𝑥→−∞ 𝑥 𝑦→+∞ 𝑦 𝑦→+∞ 𝑦
𝑦 𝑦
𝑦
 
1
= lim = lim 1+
𝑦→+∞ 𝑦−1 𝑦→+∞ 𝑦−1
  𝑦−1  
1 1
= lim 1+ · 1+ = 𝑒 · 1 = 𝑒.
𝑦→+∞ 𝑦−1 𝑦−1

Di conseguenza, facendo il cambio di variabile 𝑥 ↦→ 1


𝑥 si ottiene
1
lim (1 + 𝑥) 𝑥 = 𝑒.
𝑥→0−

Mettendo insieme limite destro e limite sinistro si ottiene infine il limite completo
per 𝑥 → 0.

Corollario 2.50. Per ogni 𝑥 ∈ ℝ si ha


 𝑥 𝑛
lim 1+ = 𝑒𝑥.
𝑛→+∞ 𝑛

Dimostrazione. Infatti, per il teorema precedente, posto 𝑎 𝑛 = 𝑥/𝑛 si ha


𝑛
 𝑥𝑥
lim 1+ = 𝑒.
𝑛→+∞ 𝑛
94 2 funzioni continue, limiti e successioni

Ma allora
𝑛 𝑥
𝑥 𝑛 𝑥𝑥
 
1+ = 1+ → 𝑒𝑥
𝑛 𝑛

Definizione 2.51 (logaritmi naturali). Vedremo che il numero 𝑒 risulta essere una
base naturale per la funzione esponenziale e di conseguenza per il logaritmo. Il logaritmo
logaritmo naturale
in base 𝑒 viene chiamato logaritmo naturale e viene indicato con ln = log𝑒 .

In alcuni testi si utilizza l’operatore log, indicato senza una base esplicita, ma la
definizione non è completamente condivisa. In certi testi (per lo più in ambito
matematico) si definisce log = ln = log𝑒 , in altri testi si considera log = log10 .

Corollario 2.52 (limiti notevoli). Si ha

ln (1 + 𝑥)
lim = 1; (2.9)
𝑥→0 𝑥
𝑒𝑥 − 1
lim = 1. (2.10)
𝑥→0 𝑥

Dimostrazione. Per quanto riguarda il logaritmo ci si riconduce al teorema


precedente osservando che:

ln(1 + 𝑥)  1

= ln (1 + 𝑥) 𝑥 → ln 𝑒 = 1.
𝑥
Per l’esponenziale ci si riconduce al logaritmo osservando che posto

𝑦 = 𝑒𝑥 − 1

se 𝑥 → 0 anche 𝑦 → 0 e quindi si ha:

𝑒𝑥 − 1 𝑦
= → 1.
𝑥 ln(1 + 𝑦)

Esercizio 2.53. Mostrare che


𝑛
𝑛+1

𝑛
lim 𝑛 · = 𝑒;
𝑛→+∞ 𝑛2 + 1
 
1
lim 𝑛 · ln 1 + = 1;
𝑛→+∞ 𝑛
 (𝑛−1)!
𝑛+1

1
lim 1 − = ;
𝑛→+∞ 𝑛! 𝑒
√ 
𝑛
lim 𝑛 · 2 − 1 = ln 2.
𝑛→+∞
2.10 criteri del rapporto e della radice 95

2.10 criteri del rapporto e della radice

Succede spesso di dover determinare il limite del rapporto di due successioni


che tendono entrambe a infinito oppure entrambe a zero. In queste situazioni il
teorema del limite del rapporto non si applica in quanto siamo di fronte ad una
forma indeterminata. Dovremo quindi capire quale delle due successioni tende
a infinito o a zero “più velocemente”.
I teoremi che seguono si basano (in maniera più o meno implicita) sull’anda-
mento della successione geometrica:

𝑎𝑛 = 𝑞 𝑛

dove 𝑞 > 0 è una costante fissata. Dalle proprietà della funzione esponenziale
sappiamo che se 𝑞 > 1 si ha 𝑞 𝑛 → ∞. Se 𝑞 = 1 chiaramente 𝑞 𝑛 = 1 → 1 e se
𝑞 < 1 si ha 𝑞 −1 > 1 e quindi 𝑞 −𝑛 → +∞ da cui 𝑞 𝑛 → 0.

Teorema 2.54 (criterio del rapporto). Sia 𝑎 𝑛 una successione reale a termini non
negativi 𝑎 𝑛 ≥ 0 tale che esista il limite del rapporto di due termini consecutivi:
𝑎 𝑛+1
→ ℓ ∈ [0 , +∞].
𝑎𝑛

Se ℓ < 1 allora 𝑎 𝑛 → 0, se ℓ > 1 allora 𝑎 𝑛 → +∞.

Dimostrazione. Supponiamo sia ℓ < 1. Posto 𝑞 = (1 + ℓ )/2 si ha ℓ < 𝑞 < 1 e


posto 𝜀 = 𝑞 − ℓ > 0 per la definizione di limite 𝑎𝑎𝑛+𝑛 1 → ℓ dovrà esistere un
𝑁 ∈ ℕ tale che per ogni 𝑛 ≥ 𝑁 si abbia:
𝑎 𝑛+1
<ℓ +𝜀=𝑞
𝑎𝑛

ovvero 𝑎 𝑛+1 < 𝑞 · 𝑎 𝑛 . In particolare si avrà:

𝑎 𝑁+1 < 𝑞 · 𝑎 𝑁
𝑎 𝑁+2 < 𝑞 · 𝑎 𝑁+1 < 𝑞 2 · 𝑎 𝑁
𝑎 𝑁+3 < 𝑞 · 𝑎 𝑁+2 < 𝑞 3 · 𝑎 𝑁
..
.

ed è chiaro che per induzione potremo dimostrare che per ogni 𝑘 ∈ ℕ si ha

𝑎 𝑁+𝑘 < 𝑞 𝑘 · 𝑎 𝑁 .

Osserviamo però che 𝑞 𝑘 · 𝑎 𝑁 → 0 per 𝑘 → +∞ in quanto 𝑞 < 1 e quindi 𝑞 𝑘 → 0.


Dunque, tolti i primi 𝑁 termini, la successione 𝑎 𝑛 tende a zero. Ma i primi 𝑁
termini non influenzano né il carattere né il limite della successione e quindi
l’intera successione 𝑎 𝑛 tende a zero.
Il caso ℓ > 1 si fa in maniera analoga. Si sceglie 𝑞 tale che 1 < 𝑞 < ℓ e si trova,
in maniera analoga al caso precedente, che per un certo 𝑁 ∈ ℕ e per ogni 𝑘 ∈ ℕ
si ha
𝑎 𝑁+𝑘 > 𝑞 𝑘 · 𝑎 𝑁 → +∞.
96 2 funzioni continue, limiti e successioni

Osserviamo che, nel teorema precedente (ma anche nel criterio della radice
teorema 2.56), non si può concludere alcunché nel caso in cui sia ℓ = 1. Ad
esempio le due successioni 𝑎 𝑛 = 1/𝑛 e 𝑏 𝑛 = 𝑛 hanno limiti diversi ( 𝑎 𝑛 → 0,
𝑏 𝑛 → +∞) ma per entrambe il limite del rapporto di termini consecutivi tende
ad ℓ = 1.

Esercizio 2.55. Mostrare che

𝑛!
lim =0
𝑛𝑛
(2𝑛)!
lim = +∞
(2𝑛)𝑛
criterio della radice
Teorema 2.56 (criterio della radice). Sia 𝑎 𝑛 una successione a termini positivi tale
che
√𝑛
𝑎𝑛 → ℓ
con ℓ ∈ ℝ̄. Allora se ℓ < 1 si ha 𝑎 𝑛 → 0 se invece ℓ > 1 si ha 𝑎 𝑛 → +∞.

Dimostrazione. Si può osservare che


√ 𝑛 √
𝑛
𝑎𝑛 = 𝑛
𝑎𝑛 = 𝑒 𝑛·ln 𝑎𝑛
.

Se ℓ < 1 allora il logaritmo tende ad un numero negativo, l’argomento


dell’esponenziale tende a −∞ e quindi l’esponenziale tende a zero.

Se invece ℓ > 1 il logaritmo tende ad un numero positivo e quindi l’esponenziale


tende a +∞.

ordine di infinito/infinitesimo 2.11 ordini di infinito, equivalenza asintotica

Definizione 2.57 (ordine di infinito/infinitesimo). Sia 𝐴 ⊆ ℝ, 𝑓 , 𝑔 : 𝐴 →


(0 , +∞). Sia 𝑥 0 ∈ ℝ̄ un punto di accumulazione di 𝐴.

1. Diremo che per 𝑥 → 𝑥 0 la funzione 𝑓 è molto più piccola della funzione 𝑔 e
scriveremo 𝑓 (𝑥)  𝑔(𝑥) se vale

𝑓 (𝑥)
→ 0, per 𝑥 → 𝑥 0
 𝑔(𝑥)

diremo invece che 𝑓 è molto più grande di 𝑔 e scriveremo 𝑓 (𝑥)  𝑔(𝑥) se

𝑓 (𝑥)
→ +∞, per 𝑥 → 𝑥 0 .
equivalenza asintotica 𝑔(𝑥)
equivalenza asintotica 2. Diremo infine che 𝑓 e 𝑔 sono asintoticamente equivalenti per 𝑥 → 𝑥 0 e
∼ scriveremo 𝑓 (𝑥) ∼ 𝑔(𝑥) se
2.11 ordini di infinito, equivalenza asintotica 97

𝑓 (𝑥)
→ 1, per 𝑥 → 𝑥 0 .
𝑔(𝑥)

Ad esempio è facile verificare che se 𝛼 > 𝛽 > 0 allora 𝑥 𝛼  𝑥 𝛽 per 𝑥 → +∞


mentre 𝑥 𝛼  𝑥 𝛽 per 𝑥 → 0+ . Analogamente se 𝑎 > 𝑏 > 1 allora 𝑎 𝑥  𝑏 𝑥 per
𝑥 → +∞ mentre 𝑎 𝑥  𝑏 𝑥 per 𝑥 → −∞.

E’ molto facile verificare che le relazioni  e  sono una l’inversa dell’altra e


soddisfano la proprietà transitiva mentre la relazione ∼ soddisfa la proprietà
simmetrica e la proprietà transitiva.
ordini di infinito

Teorema 2.58 (ordini di infinito). Siano 𝑎 > 1 e 𝛼 > 0. Per 𝑛 → +∞, 𝑛 ∈ ℕ si ha

𝑛 𝛼  𝑎𝑛  𝑛!  𝑛𝑛

e per 𝑥 → +∞, 𝑥 ∈ ℝ si ha

log 𝑎 𝑥  𝑥 𝛼  𝑎 𝑥 .

Dimostrazione. Cominciamo col mostrare che 𝑎 𝑛  𝑛 ! applicando il criterio del


𝑛
rapporto alla successione 𝑎𝑛 ! :

𝑎 𝑛+1
(𝑛 + 1)! 𝑎 𝑛+1 𝑛! 1
𝑛 = 𝑛
· =𝑎· → 0 < 1.
𝑎 𝑎 (𝑛 + 1)! 𝑛+1
𝑛!
Dunque si ha, come richiesto, 𝑎 𝑛 /𝑛 ! → 0. Si procede in modo analogo per
mostrare che 𝑛 !  𝑛 𝑛 :

(𝑛 + 1)! 𝑛𝑛  𝑛 𝑛 1
· = (𝑛 + 1 ) ·
𝑛! (𝑛 + 1)𝑛+1 𝑛+1 𝑛+1
1 1
=  → < 1.
1 𝑛
1+ 𝑛 𝑒

Per dimostrare che 𝑛 𝛼  𝑎 𝑛 si può procedere con il criterio del rapporto, come
nei casi precedenti:
𝛼
(𝑛 + 1)𝛼 𝑎 𝑛 𝑛+1

1 1 𝛼 1
· 𝑛+1 = · → ·1 = <1
𝑛𝛼 𝑎 𝑎 𝑛 𝑎 𝑎

da cui 𝑛 𝛼 /𝑎 𝑛 → 0.

Per 𝑥 ∈ ℝ, cerchiamo di ricondurci ad una successione a valori interi. Osservia-


mo che si ha
b𝑥c ≤ 𝑥 ≤ b𝑥c + 1
da cui, per monotonia,
 𝛼
𝛼 𝛼 𝛼 𝛼 1
b𝑥c ≤ 𝑥 ≤ (b𝑥c + 1) = b𝑥c 1+
b𝑥c
98 2 funzioni continue, limiti e successioni

e
𝑎 b𝑥c ≤ 𝑎 𝑥 ≤ 𝑎 b𝑥c+1 = 𝑎 · 𝑎 b𝑥c .
Dunque
 𝛼
b𝑥c 𝛼 𝑥𝛼 b𝑥c 𝛼 1 + 1
b𝑥c
≤ ≤ .
𝑎 · 𝑎 b𝑥c 𝑎𝑥 𝑎 b𝑥c
Ma ora, se 𝑥 → +∞ sapendo che 𝑛 = b𝑥c → +∞ possiamo effettuare un cambio
di variabile nel limite

b𝑥c 𝛼 𝑛𝛼 b𝑥c 𝛼 𝑛𝛼
lim = lim 𝑛 = 0 e lim = lim 𝑛 = 0
𝑥→+∞ 𝑎 b𝑥c 𝑛→+∞ 𝑎 𝑥→+∞ 𝑎 b𝑥c 𝑛→+∞ 𝑎

𝑥𝛼
da cui segue che 𝑎𝑥 → 0.

Per dimostrare l’ultima relazione, log 𝑎 𝑥  𝑥 𝛼 , operiamo il cambio di variabile


𝑦 = 𝛼 · log𝑎 𝑥 cosicché 𝑎 𝑦 = 𝑥 𝛼 . Notiamo che se 𝑥 → +∞ anche 𝑦 → +∞.
Dunque, per le proprietà precedenti, sappiamo che 𝑦  𝑎 𝑦 e dunque

log 𝑎 𝑥 1 𝑦
= · → 0.
𝑥𝛼 𝛼 𝑎𝑦

Le notazioni e gli ordini di infinito individuati nel teorema precedente sono


strumenti molto utili nel calcolo dei limiti.

L’equivalenza asintotica si mantiene per prodotto e rapporto: se 𝑓 ∼ 𝐹 e 𝑔 ∼ 𝐺


allora
𝑓 𝐹
𝑓 · 𝑔 ∼ 𝐹 · 𝐺, ∼ .
𝑔 𝐺
Osserviamo inoltre che se 𝑓 ∼ 𝑔 e se 𝑓 → ℓ allora anche 𝑔 → ℓ . Se poi
ℓ ∈ (0, +∞) la relazione 𝑓 ∼ ℓ è equivalente ad 𝑓 → ℓ .

Per quanto riguarda la somma è facile verificare che se 𝑓  𝑔 allora ( 𝑓 + 𝑔) ∼ 𝑓


in quanto
𝑓 +𝑔 𝑓
= + 1 → 1.
𝑔 𝑔

In un limite in cui compaiono somme di termini di ordini diversi potremo allora


raccogliere i termini di ordine massimo per individuare il limite, come facciamo
nel seguente.

Esempio 2.59. Calcolare il limite

2𝑛 4 + 3𝑛 − 3 ln 𝑛
lim √ .
𝑛→+∞ 𝑛! − 3 𝑛

Svolgimento. Si ha
 
3𝑛 · 2 3𝑛𝑛 + 1 − 3 ln3𝑛𝑛
4

2𝑛 +
4
3𝑛 − 3 ln 𝑛
√ = √
𝑛! − 3 𝑛
 
𝑛
𝑛! · 1 − 3 𝑛!
2.12 successioni estratte 99

e ricordando che risulta (teorema 2.58)



𝑛 4  3𝑛 , ln 𝑛  3𝑛 , 𝑛  𝑛 !, 3𝑛  𝑛 !

avremo
2𝑛 4 + 3𝑛 − 3 ln 𝑛 3𝑛
√ ∼ → 0.
𝑛! − 3 𝑛 𝑛!

Esercizio 2.60. Calcolare i seguenti limiti


√ √
ln 𝑛 2 + 𝑛 𝑛 𝑛 ! + 2𝑛
lim √ , lim ,
𝑛→+∞ 𝑒 1+ln 𝑛
· ln(𝑛 − 𝑛 𝑛)
2 𝑛→+∞ 3𝑛
p
(2𝑛)! √
q
𝑛
lim , lim 𝑒 𝑛 + 10𝑛 .
𝑛→+∞ 𝑛𝑛 𝑛→+∞


Esercizio 2.61. Dimostrare che 𝑛
𝑛 → 1 per 𝑛 → +∞.

2.12 successioni estratte

Definizione 2.62 (sottosuccessione). Se 𝑎 𝑛 è una successione e 𝑛 𝑘 è una successione


strettamente crescente i cui valori sono numeri naturali, allora la successione 𝑏 𝑘 = 𝑎 𝑛 𝑘
sottosuccessione
si dice essere una sottosuccessione di 𝑎 𝑛 (o anche successione estratta da 𝑎 𝑛 ).

Ricordando che una successione 𝑎 𝑛 non è altro che una funzione 𝒂 : ℕ → ℝ, la


successione 𝑛 𝑘 corrisponde ad una funzione 𝒏 : ℕ → ℕ e la sottosuccessione
𝑎 𝑛 𝑘 corrisponde alla funzione composta 𝒂 ◦ 𝒏 .

Si osservi che nella definizione precedente la variabile 𝑛 rappresenta una


variabile muta quando scriviamo la successione 𝑎 𝑛 , ma rappresenta anche il
nome della successione fissata 𝑛 𝑘 . Questo sovraccarico di significato è voluto e
se usato correttamente rende più semplice le notazioni, in quanto la successione
𝑛 𝑘 viene sostituita alla variabile 𝑛 , con lo stesso nome, nella successione 𝑎 𝑛 . La
sottosuccessione 𝑎 𝑛 𝑘 risulta essere una successione nella variabile 𝑘 , non nella
variabile 𝑛 .

Esempio 2.63. Sia 𝑎 𝑛 = 𝑛 2 la successione dei quadrati perfetti:

𝑛 0 1 2 3 4 5 6 ...
𝑎𝑛 0 1 4 9 16 25 36 ...

Consideriamo la successione dei numeri pari 𝑛 𝑘 = 2 𝑘 . la corrispondente sottosuccessione


dei quadrati perfetti 𝑏 𝑘 = 𝑎 𝑛 𝑘 rappresenta la successione dei quadrati dei numeri pari:

𝑘 0 1 2 3 4 5 6 ...
𝑛𝑘 0 2 4 6 8 10 12 ...
𝑎𝑛𝑘 0 4 16 36 64 100 144 ...
100 2 funzioni continue, limiti e successioni

Si ha in pratica 𝑏 𝑘 = 𝑎 𝑛 𝑘 = 𝑎 2 𝑘 = (2 𝑘)2 .

Abbiamo in effetti estratto alcuni dei termini della successione originaria.

Esempio 2.64. Se 𝑎 𝑛 = (−1)𝑛 e 𝑛 𝑘 = 2 𝑘 allora 𝑎 𝑛 𝑘 = 1. Vediamo quindi che una


successione irregolare può contenere una sottosuccessione regolare.

Osserviamo che se 𝒏 : ℕ → ℕ è una funzione strettamente crescente (cioè


𝑛 𝑘 = 𝒏(𝑘) è una successione strettamente crescente di indici) allora posto
𝐴 = 𝒏(ℕ ) = {𝑛 𝑘 : 𝑘 ∈ ℕ } si ha che 𝒏 : ℕ → 𝐴 è una bigezione. Quindi 𝐴 è un
insieme infinito. Viceversa dato un qualunque insieme infinito 𝐴 ⊆ ℕ esiste
una unica successione 𝒏 : ℕ → 𝐴 bigettiva e strettamente crescente: basterà
porre, per induzione, 𝑛0 = min 𝐴, 𝑛1 = min {𝑛 ∈ 𝐴 : 𝑛 > 𝑛0 } e, in generale,
𝑛 𝑘+1 = min {𝑛 ∈ 𝐴 : 𝑛 > 𝑛 𝑘 }.

Dunque possiamo identificare le sottosuccessioni di una successione 𝒂 : ℕ → ℝ


con le restrizioni ai sottoinsiemi infiniti di ℕ . Nell’esempio precedente, si è
considerata la sottosuccessione di tutti i termini con indice pari 𝑛 𝑘 = 2 𝑘 per
ottenere la sottosuccessione 𝑎 𝑛 𝑘 = 𝑎 2 𝑘 . Si può equivalentemente pensare di
prendere l’insieme di tutti i numeri pari 𝐴 = 2ℕ e considerare la successione
ristretta ai soli indici pari:
𝑎0 , 𝑎2 , 𝑎4 , . . .
Se rinumeriamo gli indici pari usando tutti i numeri naturali otteniamo la
sottosuccessione 𝑏 𝑘 = 𝑎 𝑛 𝑘 :

𝑏0 = 𝑎0 , 𝑏1 = 𝑎2 , 𝑏2 = 𝑎4 , . . . , 𝑏 𝑘 = 𝑎 𝑛 𝑘 , . . .

Lemma 2.65 (estratte monotone). Ogni successione 𝑎 𝑛 ∈ ℝ ha una estratta 𝑎 𝑛 𝑘


monotona. Inoltre se sup 𝑎 𝑛 = +∞ c’è una estratta 𝑎 𝑛 𝑘 strettamente crescente che
tende a +∞.

Dimostrazione. Consideriamo l’insieme 𝑃 dei punti di “picco”, ovvero degli


indici di quei termini della successione che sono maggiori o uguali a tutti i
termini seguenti:

𝑃 = {𝑛 ∈ ℕ : 𝑚 ≥ 𝑛 =⇒ 𝑎 𝑛 ≥ 𝑎 𝑚 }.

Se 𝑃 è finito significa che esiste un indice 𝑛1 ∈ ℕ tale che non ci sono picchi
da 𝑛1 in poi. In particolare 𝑛1 non è un punto di picco quindi deve esistere
𝑛2 > 𝑛1 tale che 𝑎 𝑛2 > 𝑎 𝑛1 . Ma neanche 𝑛2 è un punto di picco quindi deve
esistere 𝑛3 > 𝑛2 tale che 𝑎 𝑛3 > 𝑎 𝑛2 ... procedendo induttivamente si riesce quindi
a definire una successione 𝑛 𝑘 di indici tali che 𝑎 𝑛 𝑘 risulta essere strettamente
crescente.

In particolare se sup 𝑎 𝑛 = +∞ siamo nella situazione precedente perché chiara-


mente in tal caso 𝑃 è vuoto visto che per ogni 𝑛 ∈ ℕ deve esistere 𝑚 ∈ ℕ tale
che 𝑎 𝑚 > max {𝑎 0 , 𝑎 1 , . . . 𝑎 𝑛 } e certamente 𝑚 > 𝑛 .

Se, viceversa, 𝑃 è infinito allora elencando in ordine i suoi elementi otterremo


una successione 𝑛1 < 𝑛2 < 𝑛3 , . . . di indici ognuno dei quali corrisponde ad un
2.13 punti limite 101

valore di picco. Se 𝑗 > 𝑘 si ha dunque 𝑛 𝑗 > 𝑛 𝑘 ed essendo 𝑛 𝑘 ∈ 𝑃 significa che


𝑎 𝑛 𝑗 ≤ 𝑎 𝑛 𝑘 . Dunque la successione 𝑎 𝑛 𝑘 risulta essere decrescente.

Bolzano-Weierstrass
Teorema 2.66 (Bolzano-Weierstrass). Ogni successione 𝑎 𝑛 ha una estratta regolare.
Più precisamente se 𝑎 𝑛 è una successione limitata allora esiste una sottosuccessione 𝑎 𝑛 𝑘
convergente.
Se 𝑎 𝑛 è una successione non limitata allora esiste una estratta 𝑎 𝑛 𝑘 divergente.

Dimostrazione. Cominciamo con il caso reale 𝑎 𝑛 ∈ ℝ. Il lemma 2.65 garantisce


che esiste una estratta 𝑎 𝑛 𝑘 monotona. Ma per il teorema 2.25 concludiamo
immediatamente che 𝑎 𝑛 𝑘 ha limite. Se 𝑎 𝑛 è limitata anche 𝑎 𝑛 𝑘 è limitata e quindi
in tal caso il limite è finito e dunque la successione estratta è convergente.
Se 𝑎 𝑛 non è superiormente limitata il lemma ci garantisce che l’estratta tende a
+∞ e dunque è divergente. Per simmetria se 𝑎 𝑛 non è inferiormente limitata
esiste una estratta che tende a −∞ e quindi anche in questo caso l’estratta è
divergente.
Se 𝑎 𝑛 è una successione di numeri complessi, si potrà scrivere 𝑎 𝑛 = 𝑥 𝑛 + 𝑖 𝑦𝑛
con 𝑥 𝑛 e 𝑦𝑛 successioni reali. Se 𝑎 𝑛 è limitata significa che |𝑎 𝑛 | è superiormente
limitata. Ma risulta |𝑥 𝑛 | ≤ |𝑎 𝑛 | e |𝑦𝑛 | ≤ |𝑎 𝑛 | quindi se 𝑎 𝑛 è limitata anche la parte
reale 𝑥 𝑛 e la parte immaginaria 𝑦𝑛 sono successioni limitate. Allora 𝑥 𝑛 ammette
una sotto-successione convergente 𝑥 𝑛 𝑘 . Ma 𝑦𝑛 𝑘 è anch’essa limitata e quindi
anch’essa ammette una sotto-sotto-successione 𝑦𝑛 𝑘 𝑗 convergente. Dunque la
sotto-sotto-successione 𝑎 𝑛 𝑘 𝑗 è convergente.

Se 𝑎 𝑛 ∈ ℂ non è limitata, applicando


il teorema al suo modulo |𝑎 𝑛 | troviamo
che c’è una estratta 𝑎 𝑛 𝑘 tale che 𝑎 𝑛 𝑘 → +∞. Ma questo significa che 𝑎 𝑛 → ∞ ∈
ℂ̄.

2.13 punti limite

Teorema 2.67 (ponte di collegamento tra limiti di funzione e limiti di successione).


Sia 𝐴 ⊆ ℝ, 𝑓 : 𝐴 → ℝ, sia 𝑥 0 un punto di accumulazione di 𝐴 e sia ℓ ∈ [−∞, +∞].
Le due seguenti condizioni sono equivalenti:
1. lim 𝑓 (𝑥) = ℓ ;
𝑥→𝑥0
2. per ogni successione 𝑎 𝑛 → 𝑥 0 con 𝑎 𝑛 ∈ 𝐴 \ {𝑥 0 } risulta

lim 𝑓 (𝑎 𝑛 ) = ℓ .
𝑛→+∞

Dimostrazione. Se per 𝑥 → 𝑥 0 si ha 𝑓 (𝑥) → ℓ e se 𝑎 𝑛 → 𝑥 0 con 𝑎 𝑛 ∈ 𝐴 \ {𝑥 0 }


la successione 𝑓 (𝑎 𝑛 ) non è altro che la composizione della funzione 𝑓 con la
funzione 𝑛 ↦→ 𝑎 𝑛 . Si può quindi applicare il teorema sul limite della funzione
composta per ottenere che 𝑓 (𝑎 𝑛 ) → ℓ .
Supponiamo viceversa di sapere che per ogni successione 𝑎 𝑛 → 𝑥 0 si ha
𝑓 (𝑎 𝑛 ) → ℓ . Vogliamo mostrare allora che 𝑓 (𝑥) → ℓ . Lo facciamo per assurdo:
supponiamo che esista un intorno 𝑈 di ℓ tale che preso un qualunque intorno
102 2 funzioni continue, limiti e successioni

𝑉 di 𝑥 0 non si abbia 𝑓 ((𝐴 \ {𝑥0 }) ∩ 𝑉) ⊆ 𝑈 . Possiamo considerare per ogni


𝑛 ∈ ℕ degli intorni 𝑉𝑛 sempre più piccoli. Ad esempio nel caso 𝑥 0 ∈ ℝ
potremo scegliere 𝑉𝑛 = (𝑥 0 − 1/𝑛, 𝑥 0 + 1/𝑛), nel caso 𝑥 0 = +∞ si potrà scegliere
𝑉𝑛 = (𝑛, +∞] e nel caso 𝑥0 = −∞ si sceglierà 𝑉𝑛 = [−∞, −𝑛). Se per assurdo
𝑓 ((𝐴 \ {𝑥0 } ∩ 𝑉𝑛 )) non fosse contenuto in 𝑈 significherebbe che per ogni 𝑛 ∈ ℕ
esisterebbe 𝑎 𝑛 ∈ (𝐴 \ {𝑥 0 }) ∩ 𝑉𝑛 tale che 𝑓 (𝑎 𝑛 ) ∉ 𝑈 . Ma allora 𝑎 𝑛 risulterebbe
essere una successione in 𝐴 \ {𝑥 0 } con limite 𝑥 0 (in quanto per ogni intorno di
𝑥0 esiste un 𝑁 tale che 𝑉𝑁 sia contenuto in tale intorno e per ogni 𝑛 > 𝑁 si ha
𝑉𝑛 ⊆ 𝑉𝑁 ) ma 𝑓 (𝑎 𝑛 ) non potrebbe avere limite ℓ (essendo fuori dall’intorno 𝑈 ).
Ma questo nega l’ipotesi e conclude quindi la dimostrazione del teorema.

Proposizione 2.68 (proprietà caratteristica della convergenza). Sia 𝑓 : 𝐴 ⊆ ℝ →


ℝ e 𝑥0 punto di accumulazione di 𝐴. Sia ℓ ∈ ℝ̄. Se per ogni 𝑎 𝑛 → 𝑥0 , 𝑎 𝑛 ∈ 𝐴 \ {𝑥0 }
esiste una estratta 𝑎 𝑛 𝑘 tale che 𝑓 (𝑎 𝑛 𝑘 ) → ℓ allora 𝑓 (𝑥) → ℓ per 𝑥 → 𝑥 0 .

Dimostrazione. Se per assurdo non fosse 𝑓 (𝑥) → ℓ esisterebbe un intorno


𝑈 ∈ Bℓ per cui frequentemente 𝑓 (𝑥) ∉ 𝑈 . Questo significa che esiste una
successione 𝑎 𝑛 → 𝑥 0 con 𝑎 𝑛 ≠ 𝑥 0 tale che 𝑓 (𝑎 𝑛 ) ∉ 𝑈 . Ma allora da 𝑓 (𝑎 𝑛 ) non è
possibile estrarre una sottosuccessione che abbia limite ℓ , e questo è contrario
alle ipotesi.

Definizione 2.69 (punti limite, limite superiore, limite inferiore). Sia 𝑓 : 𝐴 ⊆


punto limite ℝ → ℝ una funzione e 𝑥0 ∈ ℝ̄ un punto di accumulazione per 𝐴. Una quantità
ℓ ∈ ℝ̄ si dice essere un punto limite di 𝑓 (𝑥) per 𝑥 → 𝑥0 se per ogni 𝑈 intorno di ℓ si
ha 𝑓 (𝑥) ∈ 𝑈 frequentemente per 𝑥 → 𝑥 0 .
limite superiore/inferiore Se denotiamo con 𝐿 ⊆ ℝ̄ l’insieme dei punti limite possiamo definire il limite superiore
e il limite inferiore rispettivamente come

lim sup 𝑎 𝑛 = sup 𝐿, lim inf 𝑎 𝑛 = inf 𝐿.


𝑥→𝑥 0 𝑥→𝑥0

Proposizione 2.70 (base numerabile di intorni). Per ogni ℓ ∈ ℝ̄ esiste una


successione 𝑈𝑛 di intorni di ℓ con queste proprietà:

1. 𝑈𝑛+1 ⊆ 𝑈𝑛 ;
2. per ogni 𝑈 intorno di ℓ esiste 𝑛 ∈ ℕ tale che 𝑈𝑛 ⊆ 𝑈 ;
3. se 𝑎 𝑛 ∈ 𝑈𝑛 allora 𝑎 𝑛 → ℓ .

Dimostrazione. Possiamo esplicitamente definire gli intorni 𝑈𝑛 come segue:

ℓ − 𝑛1 , ℓ + 𝑛1 se ℓ ∈ ℝ
 




𝑈𝑛 = (𝑛, +∞] se ℓ = +∞

 [−∞, −𝑛) se ℓ = −∞.


La prima proprietà è ovviamente verificata. La proprietà archimedea dei numeri
reali garantisce la validità della seconda proprietà, da cui segue immediatamente
la terza.
2.13 punti limite 103

Proposizione 2.71 (caratterizzazione dei punti limite). Sia 𝑓 : 𝐴 ⊆ ℝ → ℝ,


𝑥0 ∈ ℝ̄ punto di accumulazione per 𝐴. Sono equivalenti:
1. ℓ è un punto limite di 𝑓 (𝑥) per 𝑥 → 𝑥 0 .
2. esiste una successione 𝑎 𝑛 ∈ 𝐴, 𝑎 𝑛 ≠ 𝑥 0 , 𝑎 𝑛 → 𝑥 0 tale che 𝑓 (𝑎 𝑛 ) → ℓ .

Dimostrazione. Siano 𝑈𝑛 intorni di ℓ e 𝑉𝑛 intorni di 𝑥 0 definiti come nella


proposizione 2.70. Se ℓ è un punto limite di 𝑓 (𝑥) per 𝑥 → 𝑥 0 significa che per
ogni 𝑈 intorno di ℓ e per ogni 𝑉 intorno di 𝑥 0 esiste 𝑥 ∈ 𝐴 ∩ 𝑉 \ {𝑥 0 } tale
che 𝑓 (𝑥) ∈ 𝑈 . Dunque per ogni 𝑛 esiste 𝑎 𝑛 ∈ 𝐴 ∩ 𝑉 \ {𝑥 0 } tale che 𝑎 𝑛 ∈ 𝑉𝑛
e 𝑓 (𝑎 𝑛 ) ∈ 𝑈𝑛 . Significa che 𝑎 𝑛 → 𝑥 0 , 𝑎 𝑛 ≠ 𝑥 0 , 𝑓 (𝑎 𝑛 ) → ℓ come volevasi
dimostrare.

Viceversa se esiste una tale successione 𝑎 𝑛 → 𝑥 0 allora per ogni 𝑉 intorno di


𝑥0 si ha definitivamente 𝑎 𝑛 ∈ 𝑉 . E se 𝑓 (𝑎 𝑛 ) → ℓ per ogni 𝑈 intorno di ℓ si ha
anche 𝑓 (𝑎 𝑛 ) ∈ 𝑈 definitivamente. Dunque esiste 𝑛 tale che 𝑎 𝑛 ∈ 𝑉 e 𝑓 (𝑎 𝑛 ) ∈ 𝑈
confermando quindi che 𝑓 (𝑥) ∈ 𝑈 frequentemente.

Molto spesso considereremo i punti limite di una successione 𝑎 𝑛 per 𝑛 → +∞.


In tal caso la caratterizzazione precedente ci dice che ℓ è un punto limite di
𝑎 𝑛 per 𝑛 → +∞ se esiste una successione di indici 𝑛 𝑘 → +∞ tale che 𝑎 𝑛 𝑘 → ℓ .
Potremmo anche supporre 𝑛 𝑘 strettamente crescente in quanto se 𝑛 𝑘 → ∞
possiamo estrarre da 𝑛 𝑘 una sottosuccessione strettamente crescente. Dunque
l’insieme dei punti limite di una successione 𝑎 𝑛 corrisponde all’insieme dei
limiti di tutte le possibili sottosuccessioni di 𝑎 𝑛 .

Esempio 2.72. La successione 𝑎 𝑛 = (−1)𝑛 ha due punti limite:

lim sup(−1)𝑛 = 1 , lim inf(−1)𝑛 = −1.


𝑛→+∞ 𝑛→+∞

Infatti la sottosuccessione dei termini con indice pari è costante 1 mentre quella dei
termini di indice dispari è costante −1. Non ci possono essere altri punti limite perché
se ci fosse 𝑎 𝑛 𝑘 → ℓ allora certamente 𝑎 𝑛 𝑘 = 1 frequentemente oppure 𝑎 𝑛 𝑘 = −1
frequentemente da cui o ℓ = 1 oppure ℓ = −1.

Esempio 2.73. Visto che #ℚ = #ℕ esiste una funzione 𝒂 : ℕ → ℚ surgettiva.


Utilizzando la proprietà di densità dei numeri razionali si può dimostrare che l’insieme
dei punti limite della corrispondente successione 𝑎 𝑛 = 𝒂(𝑛) è tutto ℝ̄.

√ √
Esercizio 2.74. Si consideri la successione 𝑎 𝑛 = 𝑛 − b 𝑛c . Calcolare

lim inf 𝑎 𝑛 , lim sup 𝑎 𝑛 .


𝑛→+∞ 𝑛→+∞

Qual è l’insieme dei punti limite di 𝑎 𝑛 per 𝑛 → +∞?

Teorema 2.75 (proprietà del limite superiore/inferiore). Sia 𝑓 : 𝐴 ⊆ ℝ → ℝ e


sia 𝑥 0 un punto di accumulazione per 𝐴. Sia 𝐿 l’insieme dei punti limite di 𝑓 (𝑥) per
𝑥 → 𝑥0 .
1. 𝐿 ≠ ∅
104 2 funzioni continue, limiti e successioni

2. lim sup 𝑓 (𝑥) ≥ lim inf 𝑓 (𝑥);


𝑥→𝑥0 𝑥→𝑥 0
3. se lim sup 𝑓 (𝑥) = lim inf 𝑓 (𝑥) = ℓ allora lim 𝑓 (𝑥) = ℓ ;
𝑥→𝑥 0 𝑥→𝑥0 𝑥→𝑥 0
4. l’insieme dei punti limite è chiuso per passaggio al limite: se ℓ 𝑘 ∈ 𝐿 e ℓ 𝑘 → ℓ per
qualche ℓ ∈ ℝ̄ allora ℓ ∈ 𝐿;
5. lim sup 𝑓 (𝑥) e lim inf 𝑥→𝑥0 𝑓 (𝑥) sono punti limite;
𝑥→𝑥0
6. la condizione lim sup 𝑓 (𝑥) = ℓ è equivalente a
𝑥→𝑥 0
(
∀𝑞 > ℓ : 𝑓 (𝑥) < 𝑞 definitivamente,
∀𝑞 < ℓ : 𝑓 (𝑥) > 𝑞 frequentemente,

e la condizione lim inf 𝑓 (𝑥) = ℓ è equivalente a


𝑥→𝑥 0
(
∀𝑞 > ℓ : 𝑓 (𝑥) < 𝑞 frequentemente,
∀𝑞 < ℓ : 𝑓 (𝑥) > 𝑞 definitivamente.

7. se 𝑎 𝑛 è una successione
   
lim sup 𝑎 𝑛 = lim sup 𝑎 𝑘 , lim inf 𝑎 𝑛 = lim inf 𝑎 𝑘 .
𝑛→+∞ 𝑛→+∞ 𝑘≥𝑛 𝑛→+∞ 𝑛→+∞ 𝑘≥𝑛

Dimostrazione. Per quanto riguarda il punto 1. il teorema 2.66 di Bolzano-


Weierstrass garantisce che sia 𝐿 ≠ ∅ e quindi sup 𝐿 ≥ inf 𝐿 da cui discende il
punto 2.

Per il punto 3. se lim sup = lim inf = ℓ significa che 𝐿 = {ℓ } ha un solo elemento.
Ma per il corollario al teorema di Bolzano Weierstrass sappiamo che da ogni
successione 𝑓 (𝑎 𝑛 ) con 𝑎 𝑛 → 𝑥 0 è possibile estrarre una sottosuccessione 𝑓 (𝑎 𝑛 𝑘 )
regolare. Il limite di tale sottosuccessione deve essere un elemento di 𝐿 e quindi
non può che essere ℓ . Allora per la proposizione 2.68 deduciamo che l’intera
successione ha limite ℓ .

Per il punto 4. sia ℓ 𝑘 ∈ 𝐿 una successione di punti limite e sia ℓ ∈ ℝ̄ tale che
ℓ 𝑘 → ℓ per 𝑘 → +∞. Ora consideriamo la successione 𝑈𝑛 di intorni di ℓ data
dalla proposizione 2.70. Visto che ℓ 𝑘 → ℓ per ogni 𝑛 deve esistere 𝑘 𝑛 tale
che ℓ 𝑘 𝑛 ∈ 𝑈𝑛 . Senza perdita di generalità possiamo supporre direttamente
che sia ℓ 𝑛 ∈ 𝑈𝑛 . Consideriamo anche gli intorni 𝑉𝑛 di 𝑥 0 dati sempre dalla
proposizione 2.70. Per ogni ℓ 𝑛 ∈ 𝐿 deve esistere una successione 𝑎 𝑘 → 𝑥 0
con 𝑎 𝑘 ≠ 𝑥 0 tale che 𝑓 (𝑎 𝑘 ) → ℓ 𝑛 . Ma allora certamente esiste 𝑘 = 𝑘 𝑛 tale che
𝑎 𝑘 𝑛 ∈ 𝑉𝑛 e 𝑓 (𝑎 𝑘 𝑛 ) ∈ 𝑈𝑛 . Posto 𝑏 𝑛 = 𝑎 𝑘 𝑛 abbiamo trovato una successione 𝑏 𝑛 tale
che 𝑏 𝑛 → 𝑥 0 (in quanto 𝑏 𝑛 ∈ 𝑉𝑛 ) e 𝑓 (𝑏 𝑛 ) → ℓ in quanto 𝑓 (𝑏 𝑛 ) ∈ 𝑈𝑛 . Dunque ℓ
è anch’esso un punto limite.

Per il punto 5 visto che 𝐿 ≠ ∅ la caratterizzazione del sup garantisce che esista
una successione ℓ 𝑛 ∈ 𝐿 tale che ℓ 𝑛 → sup 𝐿. Ma allora per il punto precedente
si deve avere sup 𝐿 ∈ 𝐿. Lo stesso per l’inf.

Per il punto 6. facciamo la dimostrazione per il lim sup (per il lim inf sarà
analogo). Se lim sup 𝑓 (𝑥) = ℓ e se fosse frequentemente 𝑓 (𝑥) ≥ 𝑞 > ℓ allora
esisterebbe una successione 𝑎 𝑛 → 𝑥 0 , 𝑎 𝑛 ≠ 𝑥 0 tale che 𝑓 (𝑎 𝑛 ) ≥ 𝑞 . Tale
2.13 punti limite 105

successione avrebbe una estratta regolare che ha limite ≥ 𝑞 > ℓ , il che è assurdo.
Dunque definitivamente deve essere 𝑓 (𝑥) < 𝑞 per ogni 𝑞 > ℓ . Se invece fosse
definitivamente 𝑓 (𝑥) ≤ 𝑞 < ℓ per ogni successione 𝑎 𝑛 → 𝑥 0 con 𝑎 𝑛 ≠ 𝑥 0 si
dovrebbe avere 𝑓 (𝑎 𝑛 ) ≤ 𝑞 e questo contraddice il fatto che ℓ > 𝑞 è un punto
limite.

Viceversa se per ogni 𝑞 > ℓ si ha 𝑓 (𝑥) < 𝑞 definitivamente, significa che per ogni
successione 𝑎 𝑛 → 𝑥 0 si ha 𝑓 (𝑎 𝑛 ) < 𝑞 definitivamente e quindi se 𝑓 (𝑎 𝑛 ) → ℓ
dovrà essere ℓ ≤ 𝑞 . Dunque ogni 𝑞 > ℓ è un maggiorante di 𝐿 e sup 𝐿 ≤ ℓ .
Se poi per ogni 𝑞 < ℓ si ha 𝑓 (𝑥) ≥ 𝑞 frequentemente significa che esiste una
successione 𝑎 𝑛 → 𝑥 0 , 𝑎 𝑛 ≠ 𝑥 0 tale che 𝑓 (𝑎 𝑛 ) ≥ 𝑞 . Per il teorema di Bolzano-
Weierstrass si potrà trovare una estratta convergente 𝑓 (𝑎 𝑛 𝑘 ) → ℓ 0 ≥ 𝑞 . Dunque
per ogni 𝑞 < ℓ risulta sup 𝐿 ≥ 𝑞 da cui in definitiva sup 𝐿 = ℓ .

Per il punto 7. facciamo la dimostrazione per il lim sup (per il lim inf sarà
analogo). Posto 𝐴𝑛 = sup 𝑘≥𝑛 𝑎 𝑘 osserviamo che 𝐴𝑛 è decrescente in quanto
all’aumentare di 𝑛 l’insieme {𝑘 : 𝑘 ≥ 𝑛} decresce (nel senso dell’inclusione
insiemistica) e quindi il sup non aumenta. Dunque ℓ = lim 𝐴𝑛 esiste certamente
in ℝ̄. Inoltre per definizione di limite per ogni ℓ 0 > ℓ si dovrà avere 𝐴𝑛 < ℓ 0
definitivamente e quindi (essendo ovviamente 𝑎 𝑛 ≤ 𝐴𝑛 ) si avrà anche 𝑎 𝑛 < ℓ 0
definitivamente. Viceversa preso ℓ 0 < ℓ si avrà definitivamente 𝐴𝑛 > ℓ 0.
Ma questo significa che esiste 𝑘 > 𝑛 per cui si ha 𝑎 𝑘 > ℓ 0 e quindi risulta
𝑎 𝑛 > ℓ 0 frequentemente. Per il punto precedente si può quindi concludere che
ℓ = lim sup 𝑎 𝑛 .

Teorema 2.76 (operazioni con lim sup e lim inf). Siano 𝑓 , 𝑔 : 𝐴 ⊆ ℝ → ℝ e sia
𝑥0 un punto di accumulazione di 𝐴.

1. Per 𝑥 → 𝑥 0 si ha

lim sup(− 𝑓 (𝑥)) = − lim inf 𝑓 (𝑥)


𝑥→𝑥 0 𝑥→𝑥 0

lim inf(− 𝑓 (𝑥)) = − lim sup 𝑓 (𝑥);


𝑥→𝑥0 𝑥→𝑥0

2. se 𝜆 ≥ 0 allora

lim sup(𝜆 · 𝑓 (𝑥)) = 𝜆 · lim sup 𝑓 (𝑥),


𝑥→𝑥0 𝑥→𝑥 0

lim inf(𝜆 · 𝑓 (𝑥)) = 𝜆 · lim inf 𝑓 (𝑥);


𝑥→𝑥 0 𝑥→𝑥 0

3. inoltre

lim sup( 𝑓 (𝑥) + 𝑔(𝑥)) ≤ lim sup 𝑓 (𝑥) + lim sup 𝑔(𝑥),
𝑥→𝑥0 𝑥→𝑥 0 𝑥→𝑥 0

lim inf( 𝑓 (𝑥) + 𝑔(𝑥)) ≥ lim inf 𝑓 (𝑥) + lim inf 𝑔(𝑥);
𝑥→𝑥 0 𝑥→𝑥0 𝑥→𝑥 0

4. e infine se 𝑓 (𝑥) ≥ 𝑔(𝑥) allora

lim sup 𝑓 (𝑥) ≥ lim sup 𝑔(𝑥), lim inf 𝑓 (𝑥) ≥ lim inf 𝑔(𝑥).
𝑥→𝑥 0 𝑥→𝑥 0 𝑥→𝑥0 𝑥→𝑥0
106 2 funzioni continue, limiti e successioni

Dimostrazione. Per il punto 1. basti osservare che se la funzione 𝑓 (𝑥) ha 𝐿 come


insieme dei punti limite allora la funzione − 𝑓 (𝑥) ha −𝐿 come punti limite.
Quindi sup(−𝐿) = − inf 𝐿 e inf(−𝐿) = − sup 𝐿.

Per il punto 2. si osservi che se 𝐿 è l’insieme dei punti limite di 𝑓 (𝑥) allora
l’insieme dei punti limite di 𝜆 𝑓 (𝑥) è 𝜆𝐿. Se 𝜆 ≥ 0 si ha dunque sup 𝜆𝐿 = 𝜆 sup 𝐿
e inf 𝜆𝐿 = 𝜆 inf 𝐿 (se 𝜆 < 0 invece inf e sup si scambiano, come nel punto 1).

Per il punto 3. consideriamo il caso del lim sup (per il lim inf sarà analogo).
Se ℓ = lim sup( 𝑓 (𝑥) + 𝑔(𝑥)) significa che esiste una successione di 𝑎 𝑛 → 𝑥 0
tale che 𝑓 (𝑎 𝑛 ) + 𝑔(𝑎 𝑛 ) → ℓ . Ma posso estrarre una sottosuccessione tale che
anche il primo addendo 𝑓 (𝑎 𝑛 𝑘 ) abbia limite. E poi posso estrarre una sotto-
sottosuccesione in modo che anche il secondo addendo 𝑔(𝑎 𝑛 𝑘 𝑗 ) abbia limite.
Dunque avremo 𝑓 (𝑎 𝑛 𝑘 𝑗 ) → ℓ 1 , 𝑔(𝑎 𝑛 𝑘 𝑗 → ℓ 2 con ℓ 1 + ℓ 2 = ℓ . Ma allora per
definizione di lim sup si avrà lim sup 𝑓 (𝑥) ≥ ℓ 1 e lim sup 𝑔(𝑥) ≥ ℓ 2 da cui
lim sup 𝑓 (𝑥) + lim sup 𝑔(𝑥) ≥ ℓ 1 + ℓ 2 = ℓ .

Per il punto 4. si osserva che se ℓ = lim sup 𝑓 (𝑥) allora per ogni 𝑞 > ℓ si ha
definitivamente 𝑓 (𝑥) < 𝑞 e di conseguenza anche 𝑔(𝑥) < 𝑞 definitivamente.
Dunque lim sup 𝑔(𝑥) ≤ ℓ . Se invece poniamo ℓ = lim inf ℎ(𝑥) allora per ogni
𝑞 < 𝑙 si ha definitivamente 𝑔(𝑥) ≥ 𝑞 ma allora anche 𝑓 (𝑥) ≥ 𝑞 defitiviamente e
quindi lim inf 𝑓 (𝑥) ≥ ℓ .
Cesàro
Teorema 2.77 (convergenza alla Cesàro). Sia 𝑎 𝑛 una successione a termini positivi.

1. Se 𝑎 𝑛 → ℓ ∈ ℝ̄ allora
𝑛
1 X
· 𝑎𝑘 → ℓ .
𝑛 𝑘=1
𝑎 𝑛+1 √
2. Se 𝑎 𝑛 > 0, → ℓ ∈ [0, +∞] allora 𝑛 𝑎 𝑛 → ℓ .
𝑎𝑛

Dimostrazione. Dimostriamo il primo punto. Per ogni 𝑞 < ℓ visto che 𝑎 𝑛 → ℓ


deve esistere 𝑁 tale che 𝑎 𝑛 ≥ 𝑞 se 𝑛 > 𝑁 . Dunque
P𝑁
1X 𝑛
1X 𝑁
1 X 𝑛
𝑘=1
𝑎𝑘 𝑛−𝑁
𝑏𝑛 = 𝑎𝑘 ≥ 𝑎𝑘 + 𝑞= + · 𝑞 → 𝑞.
𝑛 𝑘=1 𝑛 𝑘=1 𝑛 𝑘=𝑁+1 𝑛 𝑛

Significa che per ogni 𝑞 < ℓ si ha lim inf 𝑏 𝑛 ≥ 𝑞 e dunque lim inf 𝑏 𝑛 ≥ ℓ .
Viceversa per ogni 𝑞 > ℓ ragionando in maniera analoga si ottiene che 𝑏 𝑛 non
supera una successione che tende a 𝑞 . Dunque lim sup 𝑏 𝑛 ≤ 𝑞 . Mettendo
insieme le cose si deduce che lim 𝑏 𝑛 = 𝑞 .

Il punto 2 si può ricondurre all’1. Infatti


𝑎1 𝑎𝑛
𝑎1 𝑎𝑛 ln 𝑎 0 + ln + · · · + ln
r
√ 𝑎0 𝑎 𝑛−1
ln 𝑛
𝑎 𝑛 = ln 𝑛
𝑎0 · ··· = .
𝑎0 𝑎 𝑛−1 𝑛

Posto 𝑥 𝑛 = ln 𝑎𝑎𝑛−𝑛 1 se 𝑎𝑎𝑛−𝑛 1 → ℓ si ha 𝑥 𝑛 → ln ℓ (intendendo ln 0 = −∞ e


ln(+∞) = +∞) e dunque

√ ln 𝑎 0 𝑥 1 + · · · + 𝑥 𝑛
ln 𝑛
𝑎𝑛 = + → ln ℓ .
𝑛 𝑛
2.14 il teorema degli zeri 107

Facendo l’esponenziale di ambo i membri si trova il risultato desiderato.

Esercizio 2.78. Si applichi il risultato precedente per verificare che



𝑛
lim 𝑛=1

e
𝑛
lim √
𝑛
= 𝑒.
𝑛!

Esercizio 2.79. Si consideri la successione


(
2𝑛 se 𝑛 pari ,
𝑎𝑛 =
𝑛 · 2𝑛 se 𝑛 dispari.

Verificare che alla successione 𝑎 𝑛 si può applicare il criterio della radice ma non il
criterio del rapporto. Usare questo esempio per mostrare che le implicazioni enunciate
nel teorema 2.77 non possono essere invertite.

2.14 il teorema degli zeri


teorema degli zeri
Teorema 2.80 (degli zeri). Sia 𝐼 ⊆ ℝ un intervallo, 𝑓 : 𝐼 → ℝ una funzione
continua, 𝑎, 𝑏 ∈ 𝐼 tali che 𝑓 (𝑎) ≤ 0 e 𝑓 (𝑏) ≥ 0. Allora esiste 𝑐 ∈ 𝐼 tale che 𝑓 (𝑐) = 0.

Dimostrazione. La dimostrazione che adottiamo è di particolare rilevanza in


quanto non solo permette di dimostrare l’esistenza del punto 𝑐 che risolve
metodo di bisezione
𝑓 (𝑥) = 0 ma ci presenta un algoritmo, il metodo di bisezione, che può essere
effettivamente utilizzato per approssimare tale soluzione.

Possiamo supporre senza perdere di generalità che sia 𝑎 < 𝑏 . Poniamo 𝐴0 = 𝑎 ,


𝐵0 = 𝑏 e consideriamo il punto medio 𝐶0 = (𝐴0 + 𝐵0 )/2. Scegliamo tra
i due intervalli [𝐴0 , 𝐶0 ] e [𝐶0 , 𝐵0 ] quello per cui il segno ai due estremi è
discorde (o, caso fortunato, nullo). Più precisamente se 𝑓 (𝐶0 ) ≥ 0 poniamo
[𝐴1 , 𝐵1 ] = [𝐴0 , 𝐶0 ] altrimenti scegliamo [𝐴1 , 𝐵1 ] = [𝐶0 , 𝐵0 ] così si ha, in ogni
caso, 𝑓 (𝐴1 ) ≤ 0, 𝑓 (𝐵1 ) ≥ 0.

Consideriamo il punto medio 𝐶1 del nuovo intervallo [𝐴1 , 𝐵1 ] e ripetiamo il


procedimento indefinitamente. Quello che otteniamo sono due successioni 𝐴𝑛 ,
𝐵𝑛 con queste proprietà (che potrebbero essere dimostrate per induzione):

1. 𝐴𝑛 < 𝐵𝑛 , 𝐵𝑛 − 𝐴𝑛 = (𝑏 − 𝑎)/2𝑛 ;
2. 𝐴𝑛 è crescente, 𝐵𝑛 è decrescente;
3. 𝑓 (𝐴𝑛 ) ≤ 0, 𝑓 (𝐵𝑛 ) ≥ 0.

Essendo 𝐴𝑛 monotòna sappiamo che 𝐴𝑛 converge 𝐴𝑛 → 𝑐 . Inoltre visto che


𝐴𝑛 ∈ [𝑎, 𝑏] anche 𝑐 ∈ [𝑎, 𝑏] (per la permanenza del segno delle successione
𝐴𝑛 − 𝑎 e 𝑏 − 𝐴𝑛 ). Passando al limite nell’uguaglianza 𝐵𝑛 = 𝐴𝑛 + (𝑏 − 𝑎)/2𝑛 si
ottiene che anche 𝐵𝑛 → 𝑐 . Essendo 𝑓 continua avremo

𝑓 (𝐴𝑛 ) → 𝑓 (𝑐), 𝑓 (𝐵𝑛 ) → 𝑓 (𝑐).


108 2 funzioni continue, limiti e successioni

Tabella 2.1: Le prime 100 cifre decimali



2 ≈ 1.4142135623 7309504880 1688724209 6980785696 7187537694
di alcune costanti calcolate con il metodo
di bisezione usato nella dimostrazione 8073176679 7379907324 7846210703 8850387534 3276415727
del teorema 2.80. Si veda il codice a pa-

gina 425. 3 ≈ 1.7320508075 6887729352 7446341505 8723669428 0525381038
0628055806 9794519330 1690880003 7081146186 7572485757


5+1
𝜑= 2 ≈ 1.6180339887 4989484820 4586834365 6381177203 0917980576
2862135448 6227052604 6281890244 9707207204 1893911375

Ma 𝑓 (𝐴𝑛 ) ≤ 0 e quindi per la permanenza del segno anche 𝑓 (𝑐) ≤ 0. D’altra


parte 𝑓 (𝐵𝑛 ) ≥ 0 e quindi 𝑓 (𝑐) ≥ 0. Si ottiene dunque 𝑓 (𝑐) = 0, come volevamo
dimostrare.

Esempio 2.81. Si voglia risolvere l’equazione

𝑥 5 − 𝑥 − 1 = 0.

Svolgimento. Posto 𝑓 (𝑥) = 𝑥 5 − 𝑥 − 1 è chiaro che la funzione 𝑓 : ℝ → ℝ è


continua (in quanto composizione di funzioni continue). Osserviamo che
𝑓 (0) = −1 e 𝑓 (2) = 29, dunque la funzione soddisfa le ipotesi del teorema degli
zeri sull’intervallo [0 , 2]. Sappiamo quindi che l’equazione in questione ha
almeno una soluzione in tale intervallo.
Utilizzando il metodo di bisezione possiamo determinare una soluzione con
precisione arbitraria. Posto 𝐴0 = 0, 𝐵0 = 2 abbiamo verificato che 𝑓 (𝐴0 ) < 0 e
𝑓 (𝐵0 ) > 0. Prendiamo il punto medio 𝐶0 = 1 e calcoliamo la funzione: 𝑓 (𝐶0 ) =
−1 < 0. Sappiamo allora che una soluzione deve essere compresa nell’intevallo
[𝐴1 , 𝐵1 ] = [𝐶0 , 𝐵0 ] = [1 , 2] perché anche in tale intervallo valgono le ipotesi del
teorema degli zeri. Il punto medio di tale intervallo è 𝐶1 = 3/2 = 1.5 e risulta
𝑓 (3/2) = 163/32 > 0 dunque l’intervallo successivo che andremo a considerare
è [𝐴2 , 𝐵2 ] = [1 , 3/2]. Per non dover lavorare con troppe cifre decimali invece di
suddividere esattamente a metà quest’ultimo intervallo consideriamo un punto
intermedio 𝐶2 = 6/5 = 1.2 dove si ha 𝑓 (𝐶2 ) = 901/3125 > 0. Sappiamo allora
che una soluzione è compresa nell’intervallo [𝐴3 , 𝐵3 ] = [1 , 1.2]. Prendiamo il
punto medio 𝐶3 = 11/10 = 1.1 e troviamo 𝑓 (𝐶3 ) = −48949/105 < 0. Abbiamo
quindi ottenuto che esiste 𝑥 ∈ (1.1 , 1.2) tale che 𝑓 (𝑥) = 0. Sappiamo quindi che
|𝑥 − 1.15 | < 0.05 cioè abbiamo trovato 𝑥 con un errore inferiore a 0.05.
Con molta pazienza si può procedere con il metodo di bisezione fino ad
arrivare a verificare che 𝑓 (116/102 ) = −596583424/1010 < 0 e 𝑓 (117/102 ) =
224480357/1010 > 0 da cui si ottiene che una soluzione è compresa tra 1.16
e 1.17 con un errore inferiore a 0.005. Con il calcolatore (si veda ad esem-
pio il codice a pagina 425) si possono ottenere più cifre significative: 𝑥 =
1.1673039782614187 . . .

proprietà dei valori intermedi


Corollario 2.82 (proprietà dei valori intermedi). Sia 𝐼 ⊆ ℝ un intervallo e
𝑓 : 𝐼 → ℝ una funzione continua. Allora se 𝑓 assume due valori 𝑦1 e 𝑦2 allora 𝑓
assume anche tutti i valori intermedi tra 𝑦1 e 𝑦2 . Detto altrimenti: una funzione
continua manda intervalli in intervalli.
2.15 il teorema di Weierstrass 109

Dimostrazione. Se 𝑦1 e 𝑦2 sono valori assunti da 𝑓 significa che esistono 𝑥 1 , 𝑥 2 ∈ 𝐼


tali che 𝑓 (𝑥 1 ) = 𝑦1 e 𝑓 (𝑥 2 ) = 𝑦2 . Allora scelto 𝑦 si consideri la funzione
𝑔(𝑥) = 𝑓 (𝑥) − 𝑦 . Se 𝑦 è intermedio tra 𝑦1 e 𝑦2 la funzione 𝑔 assumerà segni
opposti in 𝑥 1 e 𝑥 2 e dunque, per il teorema degli zeri, dovrà esserci un punto
𝑥 in cui 𝑔 si annulla. In tale punto si avrà dunque 𝑓 (𝑥) = 𝑦 , come volevamo
dimostrare.

Lemma 2.83. Se 𝐼 è un intervallo di ℝ ogni funzione 𝑓 : 𝐼 → ℝ iniettiva e continua è


strettamente monotona.

Dimostrazione. Si può osservare che una funzione è strettamente monotona se


mantiene i valori intermedi cioè se dati tre punti 𝑥 < 𝑦 < 𝑧 risulta sempre che
𝑓 (𝑦) è un valore intermedio tra 𝑓 (𝑥) e 𝑓 (𝑧):

𝑓 (𝑥) < 𝑓 (𝑦) < 𝑓 (𝑧) oppure 𝑓 (𝑥) > 𝑓 (𝑦) > 𝑓 (𝑧).

Se ciò non accadesse, ad esempio se fosse 𝑓 (𝑦) > 𝑓 (𝑧) > 𝑓 (𝑥) con 𝑥 < 𝑦 < 𝑧
allora per la continuità di 𝑓 dovrebbe esistere un valore intermedio tra 𝑥 e 𝑦
in cui la funzione assume il valore 𝑓 (𝑧). Ma allora la funzione non sarebbe
iniettiva.

2.15 il teorema di Weierstrass

Ricordiamo che nella definizione 1.70 abbiamo definito i concetti di massimo,


minimo, estremo superiore e inferiore di una funzione a valori reali.

successioni minimizzanti/massimizzanti
Lemma 2.84 (successioni minimizzanti/massimizzanti). Sia 𝐴 un insieme non
vuoto e sia 𝑓 : 𝐴 → ℝ una funzione. Allora esistono due successioni 𝑎 𝑛 e 𝑏 𝑛 di punti
di 𝐴 tali che

lim 𝑓 (𝑎 𝑛 ) = inf 𝑓 (𝐴), lim 𝑓 (𝑏 𝑛 ) = sup 𝑓 (𝐴).


𝑛→+∞ 𝑛→+∞

Dimostrazione. Ricordiamo che 𝑓 (𝐴) = { 𝑓 (𝑥) : 𝑥 ∈ 𝐴} è l’immagine della fun-


zione 𝑓 . Facciamo la dimostrazione per l’estremo inferiore, risultato analogo si
potrà ottenere per l’estremo superiore.
Sia 𝑚 = inf 𝑓 (𝐴). Se 𝑚 = −∞ significa che 𝑓 (𝐴) non è inferiormente limitato,
in particolare per ogni 𝑛 ∈ ℝ esiste 𝑎 𝑛 tale che 𝑓 (𝑎 𝑛 ) < −𝑛 . Dunque (per
confronto) 𝑓 (𝑎 𝑛 ) → −∞ come volevamo dimostrare.
Se 𝑚 ∈ ℝ per le proprietà caratterizzanti l’estremo inferiore sappiamo che per
ogni 𝜀 > 0 esiste 𝑎 ∈ 𝐴 tale che 𝑓 (𝑎) < 𝑚 + 𝜀. Per ogni 𝑛 ∈ ℕ possiamo scegliere
𝜀 = 1/𝑛 e ottenere quindi una successione 𝑎 𝑛 tale che 𝑓 (𝑎 𝑛 ) < 𝑚 + 1/𝑛 . D’altra
parte essendo 𝑚 un minorante di 𝑓 (𝐴) sappiamo che 𝑚 ≤ 𝑓 (𝑎 𝑛 ). Abbiamo
dunque 𝑚 ≤ 𝑓 (𝑎 𝑛 ) < 𝑚 + 1/𝑛 e per il teorema dei carabinieri possiamo quindi
concludere che 𝑓 (𝑎 𝑛 ) → 𝑚 per 𝑛 → +∞.

teorema di Weierstrass
Teorema 2.85 (Weierstrass). Siano 𝑎, 𝑏 ∈ ℝ con 𝑎 ≤ 𝑏 e sia 𝑓 : [𝑎, 𝑏] → ℝ una
funzione continua. Allora esistono punti di massimo e di minimo per 𝑓 su [𝑎, 𝑏].
110 2 funzioni continue, limiti e successioni

Probabilmente già dal IX secolo a.C. era Dimostrazione. Dimostriamo solamente che 𝑓 ha minimo, per il massimo la
noto ai greci che la circonferenza, tra tut- dimostrazione procede infatti in maniera del tutto analoga.
te le figure piane che racchiudono una
area prefissata, è quella di lunghezza Sia 𝑚 = inf 𝑓 ([𝑎, 𝑏]). Per il lemma precedente sappiamo che esiste una
minima (proprietà isoperimetrica). Nel-
successione 𝑎 𝑛 minimizzante ovvero tale che 𝑎 𝑛 ∈ 𝐴 e 𝑓 (𝑎 𝑛 ) → 𝑚 per 𝑛 → +∞.
l’Eneide Virgilio racconta che Didone si
trovò ad affrontare un problema simile Per il teorema di Bolzano-Weierstrass dalla successione 𝑎 𝑛 possiamo estrarre
nella fondazione di Cartagine. Una for-
malizzazione completa della proprietà
una sottosuccessione 𝑎 𝑛 𝑘 convergente: 𝑎 𝑛 𝑘 → 𝑥 0 . Visto che 𝑎 𝑛 𝑘 ∈ [𝑎, 𝑏] si avrà,
isoperimetrica del cerchio ha dovuto at- per il teorema della permanenza del segno, anche 𝑥 0 ∈ [𝑎, 𝑏] (si applichi la
tendere fino al 1800. Eulero (Leonhard permanenza del segno alle successioni 𝑎 𝑛 𝑘 − 𝑎 e 𝑏 − 𝑎 𝑛 𝑘 ).
Euler 1707–1783) pensò di aver trovato
una dimostrazione che si fondava su que- Dunque abbiamo una successione 𝑎 𝑛 𝑘 → 𝑥 0 con 𝑎 𝑛 𝑘 ∈ [𝑎, 𝑏] e 𝑥 0 ∈ [𝑎, 𝑏].
sto risultato: presa una qualunque super- Essendo 𝑓 continua si avrà dunque 𝑓 (𝑎 𝑛 𝑘 ) → 𝑓 (𝑥 0 ). Ma noi sapevamo che
ficie chiusa nello spazio, se questa non
è una sfera è possibile farne una piccola
𝑓 (𝑎 𝑛 ) → 𝑚 e dunque anche 𝑓 (𝑎 𝑛 𝑘 ) → 𝑚 . Concludiamo quindi che 𝑓 (𝑥 0 ) = 𝑚
modifica in modo da ottenere una nuova cioè 𝑚 , l’estremo inferiore, è un valore assunto dalla funzione ed è quindi un
superficie che racchiude lo stesso volu- minimo. Dal canto suo 𝑥 0 è un punto di minimo assoluto.
me ma che ha area strettamente inferiore.
Fu proprio Karl Weiestrass (1815–1897)
ad accorgersi che quanto dimostrato da Corollario 2.86 (limitatezza delle funzioni continue). Sia 𝑓 : [𝑎, 𝑏] → ℝ una
Eulero (e poi successivamente da Steiner) funzione continua. Allora 𝑓 è limitata.
non è sufficiente a garantire la minimali-
tà della sfera. Infatti Eulero dimostra che
non ci può essere un minimo che non sia Dimostrazione. Visto che 𝑓 ha massimo 𝑀 e minimo 𝑚 si ha 𝑓 (𝑥) ∈ [𝑚, 𝑀] per
la sfera, ma non dimostra che il minimo ogni 𝑥 ∈ [𝑎, 𝑏]. Ovviamente 𝑚 > −∞ e 𝑀 < +∞ in quanto 𝑚 e 𝑀 sono valori
esiste e quindi non è detto che la sfera della funzione 𝑓 .
sia il minimo: potrebbero esserci infini-
te superfici 𝑆1 , 𝑆2 , . . . , 𝑆𝑛 , . . . ognuna
con area minore di quella della sfera e
ognuna con area maggiore della succes- 2.16 successioni ricorsive
siva: 𝐴(𝑆𝑛+1 ) < 𝐴(𝑆𝑛 ). Per concludere il
ragionamento di Eulero era necessario
dimostrare che in una situazione del ge- Le successioni ricorsive sono le successioni definite per induzione (tramite il
nere le superifici 𝑆𝑛 debbano, in qualche teorema 1.10):
senso, tendere alla superficie sferica e (
che le loro aree debbano tendere all’area 𝑎0 = 𝛼
della sfera. In astratto questo è quanto 𝑎 𝑛+1 = 𝑓 (𝑎 𝑛 ).
viene enunciato nel teorema che porta il
suo nome. Dunque Weiestrass completò Si rimanda al capitolo 8 per uno studio approfondito di questo tipo di successioni.
la dimostrazione della proprietà isoperi-
La prima parte di quel capitolo è infatti accessibile con le nozioni che sono
metrica in dimensione 𝑛 = 2 (in realtà il
risultato è comunque attribuito a Steiner state sviluppate finora. La seconda parte richiederà invece degli strumenti più
che, pur non avendo colto il problema avanzati.
obiettato da Weierstrass, aveva in effetti
dimostrato tutte le proprietà necessarie
per giungere alla conclusione). Salendo
alla dimensione 𝑛 = 3 è naturale imma-
ginare che la superficie che racchiude
il volume maggiore con area fissata sia
la sfera. Questo spiega il motivo per cui
una goccia d’acqua, in assenza di gravità,
dovrebbe assumere una forma sferica: a
causa della tensione superficiale, infat-
ti, la superficie della goccia tenderà ad
avere l’area minima. Formalizzare e di-
mostrare questo risultato risulta molto
più complicato. Per superifici qualun-
que la prima dimostrazione formale per
𝑛 ≥ 3 è dovuta al matematico italiano
Ennio De Giorgi (1928–1996) che forma-
lizzò il concetto di perimetro introdotto
da Renato Caccioppoli (1904–1959).
serie 3
Data una successione 𝑎 𝑛 di numeri reali o complessi possiamo considerare la
successione delle cosiddette somme parziali somme parziali

𝑛
X
𝑆𝑛 = 𝑎𝑘 .
𝑘=0

Potremo scrivere più concisamente 𝑆𝑛 = 𝑎 𝑛 . Intuitivamente si intende


P
sommare i termini della successione 𝑎 𝑘 per 𝑘 che parte da 0 fino a 𝑘 = 𝑛 :
𝑛
X
𝑎 𝑘 = 𝑎0 + 𝑎1 + 𝑎2 + · · · + 𝑎 𝑛 .
𝑘=0

𝑛
X
Formalmente la somma 𝑆𝑛 = 𝑎 𝑘 è definita ricorsivamente dalle seguenti
𝑘=0
relazioni: (
𝑆0 = 𝑎 0 ,
𝑆𝑛+1 = 𝑆𝑛 + 𝑎 𝑛+1 .

I numeri 𝑎 𝑛 si chiamano termini della serie. Se la successione delle somme termini


parziali ammette limite il limite viene chiamato somma della serie e si indica somma
con
+∞
X 𝑛
X
𝑎 𝑘 = lim 𝑆𝑛 = lim 𝑎𝑘 .
𝑛→+∞ 𝑛→+∞
𝑘=0 𝑘=0

La terminologia già introdotta per le successioni si applica anche alle serie che
sono in effetti anch’esse delle successioni. In particolare una serie può essere
convergente, divergente o indeterminata. Questo è il carattere della serie. carattere

Più in generale si potrà considerare la somma che parte da un certo indice


𝑚 ∈ ℤ. Fissato 𝑚 si potrà ad esempio considerare la serie:
𝑛
X
𝑆𝑛 = 𝑎𝑘
𝑘=𝑚

che risulta definita per ogni 𝑛 ∈ ℕ , 𝑛 ≥ 𝑚 come

𝑆𝑛 = 𝑎 𝑚 + 𝑎 𝑚+1 + · · · + 𝑎 𝑛 .

Esempio 3.1. Consideriamo la serie 𝑆𝑛 definita come la somma dei numeri naturali da
1 a 𝑛:
𝑛
X
𝑆𝑛 = 𝑘 = 1 + 2 + · · · + 𝑛.
𝑘=1

Si può dimostrare facilmente per induzione che si ha

𝑛(𝑛 + 1)
𝑆𝑛 = .
2
112 3 serie

E mediante la definizione di limite si può verificare che risulta 𝑆𝑛 → +∞.

𝑛 è divergente:
P
Questo si esprime dicendo che la serie
+∞
X
𝑘 = +∞.
𝑘=1

Esempio 3.2 (la serie geometrica). Fissato 𝑞 ∈ ℝ o 𝑞 ∈ ℂ alla successione 𝑎 𝑛 = 𝑞 𝑛


di termini
𝑎0 = 1, 𝑎1 = 𝑞, 𝑎2 = 𝑞 2 , 𝑎3 = 𝑞 3 , . . .
𝑞 𝑛 le cui somme parziali sono
P
serie geometrica è associata la serie geometrica

𝑆0 = 1 , 𝑆1 = 1 + 𝑞, 𝑆2 = 1 + 𝑞 + 𝑞 2 , ...

Il seguente teorema ci mostra come per diversi valori di 𝑞 la serie geometrica


assume tutti i possibili caratteri: convergente, divergente, indeterminato.
somma della serie geometrica
Teorema 3.3 (somma della serie geometrica). Sia 𝑞 ∈ ℂ. Se 𝑞 ≠ 1 si ha
𝑛
1 − 𝑞 𝑛+1
𝑞𝑘 =
X
.
𝑘=0
1−𝑞

Se |𝑞| < 1 la serie geometrica converge:


+∞
1
𝑞𝑘 =
X
.
𝑘=0
1−𝑞

Se |𝑞| ≥ 1 la serie non converge ma dobbiamo distinguere se la serie si considera a valori


reali o complessi per determinarne il carattere.

Se consideriamo la serie a valori reali (quindi 𝑞 ∈ ℝ) se 𝑞 ≥ 1 la serie diverge a +∞, se


𝑞 ≤ −1 la serie è indeterminata.

Se consideriamo la serie a valori complessi 𝑞 ∈ ℂ, se |𝑞| > 1 la serie diverge a ∞, lo


stesso succede se 𝑞 = 1. Se |𝑞| = 1 ma 𝑞 ≠ 1 la serie è indeterminata.

Dimostrazione. Il primo risultato riguarda una somma finita. Si ha

𝑛 𝑛 𝑛 𝑛 𝑛+1
𝑞𝑘 = 𝑞𝑘 − 𝑞 · 𝑞𝑘 = 𝑞𝑘 − 𝑞 𝑘 = 1 − 𝑞 𝑛+1
X X X X X
(1 − 𝑞) ·
𝑘=0 𝑘=0 𝑘=0 𝑘=0 𝑘=1

da cui si ottiene, se 𝑞 ≠ 1, il risultato voluto.

Passando al limite per 𝑛 → +∞, se |𝑞| < 1 si nota che 𝑞 𝑛+1 = |𝑞| 𝑛+1 → 0 e la

1
serie converge a 1−𝑞 .

Consideriamo ora la serie a valori reali. Se 𝑞 > 1 osserviamo che 𝑞 𝑛 → +∞ e


quindi la serie diverge a +∞ (infatti in questo caso 1 − 𝑞 è negativo). Se 𝑞 = 1 si
𝑛
ha 𝑞 𝑘 = 1 e quindi 𝑞 𝑘 = 𝑛 + 1 → +∞.
X
𝑘=0
113

Per gli altri casi osserviamo che si ha

𝑛
1 − 𝑞 𝑘+1 1 𝑞
𝑞𝑘 = · 𝑞𝑘
X
= −
𝑘=0
1−𝑞 1−𝑞 1−𝑞

e dunque il carattere della serie coincide con il carattere della successione 𝑞 𝑘 . Se


consideriamo la 𝑘successione a valori complessi e se |𝑞| > 1 la serie è divergente
𝑘
a ∞ in quanto 𝑞 = |𝑞| → +∞. Se invece consideriamo la serie a valori reali e


𝑞 < 1 (il caso 𝑞 ≥ 1 l’abbiamo già considerato) la serie risulta indeterminata in
quanto in valore assoluto tende a +∞ ma il segno dei termini pari è opposto al
segno dei termini dispari.

Ci rimane da considerare il caso |𝑞| = 1, 𝑞 ≠ 1. Se 𝑞 è reale c’è solo il caso


𝑞 = −1 e sappiamo che (−1) 𝑘 è indeterminata. Anche se 𝑞 è complesso vogliamo
𝑘
dimostrare che la successione
𝑘
𝑘𝑞 è indeterminata: se non lo fosse si avrebbe
𝑞 → ℓ con |ℓ | = 1 in quanto 𝑞 = 1. e passando al limite nell’uguaglianza

𝑞 𝑘+2 = 𝑞 · 𝑞 𝑘+1

si avrebbe ℓ = 𝑞 · ℓ da cui (dividendo per ℓ ) otteniamo 𝑞 = 1. Dunque se 𝑞 ≠ 1


la successione 𝑞 𝑘 è indeterminata e così è la serie geometrica.
linearità della somma infinita
Teorema 3.4 (linearità della somma). Se 𝑎 𝑛 e 𝑏 𝑛 sono convergenti allora per
P P
ogni 𝜆, 𝜇 ∈ ℂ anche (𝜆𝑎 𝑛 + 𝜇𝑏 𝑛 ) è convergente e si h
P

+∞
X +∞
X +∞
X
(𝜆𝑎 𝑛 + 𝜇𝑏 𝑛 ) = 𝜆 𝑎𝑛 + 𝜇 𝑏𝑛 .
𝑘=0 𝑘=0 𝑘=0

Dimostrazione. Se 𝑆𝑛 e 𝑅 𝑛 sono le somme parziali delle serie 𝑎 𝑛 e 𝑏 𝑛 allora


P P
le somme parziali della serie (𝜆𝑎 𝑛 + 𝜇𝑏 𝑛 ) sono 𝜆𝑆𝑛 + 𝜇𝑅 𝑛 (in quanto sulle
P
somme finite vale la proprietà distributiva e commutativa). Ma se 𝑆𝑛 → 𝑆 e
𝑅 𝑛 → 𝑅 allora 𝜆𝑆𝑛 + 𝜇𝑅 𝑛 → 𝜆𝑆 + 𝜇𝑅 .

Osserviamo che le serie (così come le successioni) formano uno spazio vettoriale
in cui le operazioni di somma e prodotto per scalare vengono eseguite termine a
termine: 𝑎 𝑛 + 𝑏 𝑛 = (𝑎 𝑛 + 𝑏 𝑛 ), 𝜆 𝑎 𝑛 = (𝜆𝑎 𝑛 ). Il teorema precedente ci
P P P P P
dice allora che le serie (così come le successioni) convergenti sono un sottospazio
vettoriale e che la somma della serie (così come il limite della successione) è
un’operatore lineare definito su tale sottospazio.
condizione necessaria per la convergenza

𝑎 𝑛 converge
P
Teorema 3.5 (condizione necessaria per la convergenza). Se la serie
allora 𝑎 𝑛 → 0.

Dimostrazione. Se la serie 𝑎 𝑛 converge significa che le somme parziali 𝑆𝑛 =


P
P𝑛
𝑎 convergono: 𝑆𝑛 → 𝑆. Ma allora
𝑘=0 𝑘

𝑎 𝑛 = 𝑆𝑛 − 𝑆𝑛−1 → 𝑆 − 𝑆 = 0.
114 3 serie

Teorema 3.6 (stabilità del carattere). Se le due successioni 𝑎 𝑛 e 𝑏 𝑛 differiscono solo


su un numero finito di termini, allora le serie corrispondenti 𝑎 𝑛 e 𝑏 𝑛 hanno lo
P P
stabilità del carattere
stesso carattere.

Dimostrazione. Se le successioni differiscono su un numero finito di termini


significa che esiste un 𝑁 ∈ ℕ tale che per ogni 𝑘 > 𝑁 si ha 𝑎 𝑘 = 𝑏 𝑘 . Dunque
se indichiamo con 𝑆𝑛 = 𝑛𝑘=0 𝑎 𝑘 e 𝑅 𝑛 = 𝑛𝑘=0 𝑏 𝑘 le corrispondenti successioni
P P
delle somme parziali, si avrà per ogni 𝑛 > 𝑁

𝑛
X 𝑛
X 𝑁
X
𝑆𝑛 − 𝑅 𝑛 = 𝑎𝑘 − 𝑏𝑘 = (𝑎 𝑘 − 𝑏 𝑘 ) = 𝐶
𝑘=0 𝑘=0 𝑘=0

dove 𝐶 è una costante indipendente da 𝑛 . Dunque

𝑆𝑛 = 𝑅 𝑛 + 𝐶.

Se il limite di 𝑅 𝑛 non esiste allora non esiste neanche il limite di 𝑆𝑛 (altrimenti


essendo 𝑅 𝑛 = 𝑆𝑛 − 𝐶 anche il limite di 𝑅 𝑛 dovrebbe esistere). Se il limite di 𝑅 𝑛
è infinito allora il limite di 𝑆𝑛 è uguale al limite di 𝑅 𝑛 . E se il limite di 𝑅 𝑛 è
finito anche il limite di 𝑆𝑛 è finito.

Dunque il carattere della successione 𝑆𝑛 è lo stesso della successione 𝑅 𝑛 cioè le


due serie hanno lo stesso carattere.

Se una serie ha primo termine con un indice diverso da 0 ci si potrà sempre


ricondurre (con un cambio di variabile) ad una serie il cui indice parte da zero.
Ad esempio (facendo il cambio di variabile 𝑗 = 𝑘 − 1 da cui 𝑗 = 0 quando 𝑘 = 1
e ricordando che l’indice utilizzato nelle somme delle serie è una variabile
muta):
+∞ +∞ +∞
X 1 X 1 X 1
𝑘
= 𝑗+ 1
= 𝑘+1
.
𝑘=1 2 𝑗=0 2 𝑘=0 2

Si osservi inoltre che in base al teorema precedente quale sia il primo indice da
cui si comincia a sommare non è rilevante per quanto riguarda il carattere della
serie. Se però la serie è convergente la sua somma può variare, ad esempio:
!
+∞ +∞
X 1 X 1
= − 20 .
𝑘=1 2𝑘 𝑘=0 2𝑘

Nota bene: in molti libri si scrive ∞ al posto di +∞. Risulta quindi molto
comune omettere il segno + davanti a ∞ nella terminologia delle serie (e anche
delle successioni) visto che gli indici si intendono numeri naturali e quindi −∞
non avrebbe senso.

Ci sono però casi in cui può essere utile usare anche gli indici negativi, ad
esempio se 𝑎 𝑘 è definita per ogni 𝑘 ∈ ℤ si potrebbe definire (ma non lo faremo):
+∞
X +∞
X +∞
X
𝑎𝑘 = 𝑎𝑘 + 𝑎(−𝑘)
𝑘=−∞ 𝑘=0 𝑘=1
3.1 serie telescopiche 115

richiedendo che entrambe le serie al lato destro dell’uguaglianza esistano e non


abbiano somme infinite di segno opposto.

𝑎 𝑛 una serie convergente.


P
Teorema 3.7 (coda di una serie convergente). Sia
Allora
+∞
X
lim 𝑎 𝑘 = 0.
𝑛→+∞
𝑘=𝑛+1

Dimostrazione. Posto
𝑛
X
𝑆𝑛 = 𝑎𝑘 ,
𝑘=0

per definizione di serie convergente sappiamo che esiste 𝑆 finito tale che 𝑆𝑛 → 𝑆 .
Osserviamo allora che
+∞
X 𝑁
X
𝑎 𝑘 = lim 𝑎 𝑘 = lim 𝑆 𝑁 − 𝑆𝑛 = 𝑆 − 𝑆𝑛
𝑁→+∞ 𝑁→+∞
𝑘=𝑛+1 𝑘=𝑛+1

e, per 𝑛 → +∞ si ha ovviamente 𝑆 − 𝑆𝑛 → 𝑆 − 𝑆 = 0.

3.1 serie telescopiche

Una serie scritta nella forma


X
(𝑎 𝑘 − 𝑎 𝑘+1 )

viene detta telescopica in quanto i singoli termini della somma (come i tubi di serie telescopica
un cannocchiale), si semplificano uno con l’altro (permettendo al cannocchiale
di chiudersi):

𝑛
X 𝑛
X 𝑛+1
X
𝑆𝑛 = (𝑎 𝑘 − 𝑎 𝑘+1 ) = 𝑎𝑘 − 𝑎 𝑘 = 𝑎0 − 𝑎 𝑛+1 .
𝑘=0 𝑘=0 𝑘=1

In linea teorica ogni serie può essere scritta in forma telescopica, basta infatti
scegliere 𝑎 0 = 0, 𝑎 𝑛 = −𝑆𝑛−1 , affinché valga la relazione precedente. Scrivere
una serie in forma telescopica è quindi equivalente a determinare la successione
delle somme parziali.

Esempio 3.8 (serie di Mengoli). Si ha


+∞
X 1
= 1.
𝑛=1 𝑛(𝑛 + 1)

Dimostrazione. Infatti
𝑛 𝑛  𝑛 𝑛+1 
X 1 X 1 1 X 1 X 1 1
= − = − =1− → 1.
𝑘=1
𝑘(𝑘 + 1) 𝑘=1 𝑘 𝑘 + 1 𝑘=1
𝑘 𝑘=2
𝑘 𝑛 + 1
116 3 serie

3.2 serie a termini positivi

Nel seguito considereremo serie i cui termini sono numeri reali positivi (o
almeno non negativi). Quando scriveremo 𝑎 𝑛 > 0 (o 𝑎 𝑛 ≥ 0) sarà sempre
sottointeso che 𝑎 𝑛 ∈ ℝ visto che per i numeri complessi non reali non abbiamo
definito la relazione d’ordine.
carattere delle serie a termini positivi
Teorema 3.9 (carattere delle serie a termini positivi). Se 𝑎 𝑛 ≥ 0 la serie 𝑎𝑛 è
P
regolare: o converge oppure diverge a +∞.

Dimostrazione. Se 𝑎 𝑛 ≥ 0 essendo 𝑎 𝑛 = 𝑆𝑛 − 𝑆𝑛−1 significa che la successione


𝑆𝑛 delle somme parziali è crescente. Dunque il limite delle 𝑆𝑛 esiste e non può
essere negativo.
criterio del confronto

𝑎𝑛 e 𝑏 𝑛 serie a termini positivi


P P
Teorema 3.10 (criterio del confronto). Siano
che si confrontano: 0 ≤ 𝑎 𝑛 ≤ 𝑏 𝑛 . Allora
+∞
X +∞
X
𝑎𝑛 ≤ 𝑏𝑛 .
𝑘=0 𝑘=0

𝑏 𝑛 converge anche 𝑎 𝑛 converge e se 𝑎 𝑛 diverge anche 𝑏𝑛


P P P P
In particolare se
diverge.

Quest’ultimo risultato vale anche se 0 ≤ 𝑎 𝑛  𝑏 𝑛 .

Dimostrazione. Se 𝑆𝑛 sono le somme parziali di 𝑎 𝑛 e 𝑅 𝑛 sono le somme parziali


P
di 𝑏 𝑛 si ha 𝑆𝑛 ≤ 𝑅 𝑛 e il risultato si riconduce al confronto tra successioni.
P

Nel caso in cui 𝑎 𝑛  𝑏 𝑛 per definizione sappiamo che 𝑏𝑎𝑛𝑛 → 0 e quindi dalla
definizione di limite sappiamo che esiste 𝑁 tale che per ogni 𝑛 > 𝑁 si ha
(avendo scelto 𝜀 = 1)
𝑎𝑛
< 1.
𝑏𝑛
Dunque si ottiene 𝑎 𝑛 ≤ 𝑏 𝑛 per tutti gli 𝑛 tranne al più un numero finito. Sapendo
che il carattere della serie non cambia se si modifica la serie su un numero finito
di termini ci si riconduce al caso precedente.

Esempio 3.11. La serie


+∞
X 1
(3.1)
𝑘=1 𝑘2
è convergente. Infatti osservando che si ha per ogni 𝑛 > 0

1 1

(𝑛 + 1)2 𝑛(𝑛 + 1)

possiamo affermare che


+∞ +∞ +∞
X 1 X 1 X 1
=1+ ≤ 1 + =2
𝑘=1 𝑘2 𝑘=1 (𝑘 + 1)2
𝑘=1
𝑘(𝑘 + 1)
3.2 serie a termini positivi 117

in quanto ci siamo ricondotti alla serie telescopica di Mengoli che ha somma pari a 1.

Sappiamo quindi che la serie (3.1) è convergente senza sapere esattamente quale sia la
sua somma. Possiamo però trovare numericamente delle approssimazioni della somma,
facendo la somma dei primi termini e stimando l’errore tramite la serie di Mengoli, di
cui sappiamo calcolare la somma. Infatti se 𝑆 𝑁 è la somma parziale dei primi 𝑁 termini
e 𝑆 = lim 𝑆 𝑁 è la somma della serie, essendo 1/(𝑘 + 1)2 ≤ 1/(𝑘 2 + 𝑘) si ha
+∞
X 1 1
𝑆𝑁 ≤ 𝑆 ≤ 𝑆𝑁 + ≤ 𝑆𝑁 + .
𝑘=𝑁
𝑘(𝑘 + 1) 𝑁

Per calcolare le prime 6 cifre decimali esatte basterà quindi sommare il primo milione
di termini della serie. Lo si può fare, ad esempio, con il codice riportato a pagina 426,
ottenendo 𝑆 = 1.644934 . . .

Utilizzando strumenti molto più avanzati Eulero (Leonard Euler, 1707–1783) è riuscito
ad esprimere la somma di questa serie mediante costanti matematiche fondamentali (noi
lo faremo con un metodo diverso nell’esercizio 7.78).
criterio del confronto asintotico
Corollario 3.12 (criterio del confronto asintotico). Se 𝑎 𝑛 e 𝑏 𝑛 sono successio-
ni a termini positivi, asintoticamente equivalenti (definizione 2.57), allora le serie
corrispondenti 𝑎 𝑛 e 𝑏 𝑛 hanno lo stesso carattere.
P P

Dimostrazione. Le serie a termini positivi non possono essere indeterminate


quindi è sufficiente verificare che se una serie converge, converge anche l’altra.
Essendo 𝑎 𝑛 /𝑏 𝑛 convergente tale rapporto deve anche essere limitato, quindi
esiste 𝐶 ∈ ℝ tale che
𝑎𝑛 ≤ 𝐶 · 𝑏𝑛 .
Se la serie 𝑏 𝑛 converge anche 𝐶 · 𝑏 𝑛 converge e, per confronto, converge
P P
anche 𝑎 𝑛 .
P

Viceversa, scambiando il ruolo di 𝑎 𝑛 e 𝑏 𝑛 si verifica che se 𝑎 𝑛 converge, converge


anche 𝑏 𝑛 .

Esempio 3.13. La serie


X 𝑛 2 + 2𝑛 + 3
𝑛 2𝑛 4 − 𝑛 3 + 𝑛 + 1
è convergente. Infatti si può facilmente verificare che

𝑛 2 + 2𝑛 + 3 1
∼ .
2𝑛 − 𝑛 + 𝑛 + 1
4 3 2𝑛 2

Ma sappiamo che la serie 1/𝑛 2 è convergente, di conseguenza anche la serie 1/(2𝑛 2 )


P P
lo è (per linearità della somma) e quindi, per confronto asintotico, anche la serie data è
convergente. criterio della radice

Teorema 3.14 (criterio della radice). Sia 𝑎 𝑛 una serie a termini non negativi (cioè
P

𝑎 𝑛 ≥ 0) tale che 𝑛 𝑎 𝑛 → ℓ ∈ [0, +∞]. Se ℓ < 1 allora la serie converge. Se ℓ > 1
allora la serie diverge.
118 3 serie

Più in generale il risultato è valido con



ℓ = lim sup 𝑛
𝑎𝑛

anche nel caso in cui il limite di 𝑛
𝑎 𝑛 non dovesse esistere.

Dimostrazione. Nel caso ℓ < 1 prendiamo 𝑞 con ℓ < 𝑞 < 1 e poniamo 𝜀 = 𝑞 − ℓ .


√ √
Per la definizione di limite 𝑛 𝑎 𝑛 → ℓ (ma basta che sia lim sup 𝑛 𝑎 𝑛 = ℓ )
sappiamo esistere 𝑁 tale che per ogni 𝑛 > 𝑁 si abbia

𝑛
𝑎𝑛 < ℓ + 𝜀 = 𝑞

cioè
𝑎𝑛 < 𝑞 𝑛 .
Sapendo che 𝑞 𝑛 converge, sapendo anche che il carattere della serie non
P
cambia modificando un numero finito di termini, per confronto possiamo
concludere che anche la serie 𝑎 𝑛 converge.
P

Se ℓ > 1 si ha che 𝑛 𝑎 𝑛 > 1 e quindi 𝑎 𝑛 > 1 per infiniti valori di 𝑛 . La successione
𝑎 𝑛 non è infinitesima e quindi la serie non può convergere.

Esempio 3.15. La serie


2(ln 𝑘)−𝑘
X
𝑘

è convergente. Infatti si ha
p𝑘 ln 𝑘−𝑘 ln 𝑘 1
2ln 𝑘−𝑘 = 2 𝑘 =2 𝑘 −1 → 2− 1 = < 1.
2
criterio del rapporto
Teorema 3.16 (criterio del rapporto). Sia 𝑎 𝑛 una serie a termini non negativi
P
( 𝑎 𝑛 ≥ 0) tale che 𝑎 𝑛+1 /𝑎 𝑛 → ℓ ∈ [0 , +∞]. Se ℓ < 1 allora la serie converge. Se ℓ > 1
la serie diverge.

Dimostrazione. Non sarebbe difficile fare una dimostrazione diretta, simile alla
dimostrazione fatta per il criterio della radice. Possiamo però osservare che per

il criterio di convergenza alla Cesàro (teorema 2.77) si ha 𝑛 𝑎 𝑛 → ℓ quindi ci
riconduciamo al criterio della radice senza dover fare ulteriori dimostrazioni.

Esempio 3.17. Per ogni 𝑥 ≥ 0 la serie


X 𝑥𝑛
𝑛!
converge.

Dimostrazione. Applichiamo il criterio del rapporto. Posto 𝑎 𝑛 = 𝑥 𝑛 /𝑛 ! si ha

𝑎 𝑛+1 𝑥 𝑛+1 𝑛! 𝑥
= · 𝑛 = → 0 < 1.
𝑎𝑛 (𝑛 + 1)! 𝑥 𝑛+1

Dunque la serie converge.


3.2 serie a termini positivi 119

associatività della somma di una serie

Esempio 3.18. Posto 𝑎 𝑘 = (−1) 𝑘 sappiamo che la serie corrispondente:

1−1+1−1+1...

è indeterminata perché le somme parziali sono


(
𝑛
1 se 𝑛 pari
(−1) 𝑘 =
X
𝑆𝑛 =
𝑘=0 0 se 𝑛 è dispari.

Se però associamo i termini a due a due otteniamo la serie

(1 − 1) + (1 − 1) + (1 − 1) · · · = 0 + 0 + 0 + · · · = 0

che è convergente. Il motivo è che la successione delle somme parziali di questa nuova
serie è una particolare estratta (quella con gli indici pari) della successione delle somme
parziali della serie originale. Quindi non ci dovrebbe sorprendere il fatto che nonostante
la serie originale fosse indeterminata è possibile associare i termini della serie in modo
da ottenere una serie regolare (in questo caso convergente). In effetti per il teorema 2.66
di Bolzano-Weierstrass sappiamo che è sempre possibile estrarre una sottosuccessione
regolare (convergente o divergente) da qualunque successione. Anche quando da una
serie indeterminata si estrae una serie convergente la somma della serie può dipendere
da come i termini vengono associati. Se ad esempio nella serie precedente prendessimo
solamente le somme di indice dispari otterremmo:

1 + (−1 + 1) + (−1 + 1) + · · · = 1.

L’esempio precedente ci mostra che associando i termini di una serie indeter-


minata è possibile ottenere serie con carattere e somma diversi. Il seguente
teorema ci dice che questo fenomeno cattivo può solo avvenire quando si parte
da una serie indeterminata. Se la serie è regolare allora possiamo associarne i
termini senza modificarne né il carattere né la somma. In particolare questo è
vero per le serie a termini positivi.

𝑎 𝑘 è una serie, scelta


P
Teorema 3.19 (associatività delle serie regolari). Se
comunque una successione crescente 𝑘 𝑛 con 𝑘 0 = 0 possiamo considerare la serie 𝑏 𝑛
P
i cui termini
𝑘 𝑛+
X 1 −1
𝑏𝑛 = 𝑎𝑗
𝑗=𝑘 𝑛

si ottengono associando i termini di 𝑎 𝑘 a gruppi consecutivi delimitati dalla successione


di indici 𝑘 𝑛 .

𝑎 𝑘 è regolare (convergente o divergente) allora anche la serie 𝑏 𝑛 è regolare


P P
Se la serie
e si ha
+∞
X +∞
X
𝑏𝑛 = 𝑎𝑘 .
𝑛=0 𝑘=0

𝑎 𝑘 è a termini positivi.
P
In particolare questo vale se la serie
120 3 serie

Dimostrazione. Siano 𝑆 𝑘 = 𝑘𝑗=0 𝑎 𝑗 le somme parziali della serie 𝑎 𝑗 . Allora


P P
le somme parziali della serie 𝑏 𝑛 non sono altro che la sottosuccessione 𝑆 𝑘 𝑛 .
P
Dunque se 𝑆 𝑘 converge anche ogni sua sottosuccessione converge allo stesso
limite.

Il teorema 3.9 ci dice che le serie a termini positivi sono regolari e quindi
soddisfano le ipotesi del teorema.

serie armonica

la serie armonica

Osserviamo che il criterio del rapporto non si applica alla serie armonica
X1
𝑘
𝑘

in quanto
1
𝑘+1 𝑘
= → 1.
1 𝑘+1
𝑘

Per capire se la serie armonica converge o diverge presentiamo il metodo di


condensazione che verrà enunciato in generale nel prossimo teorema ma che può
essere meglio compreso se applicato al caso particolare della serie armonica.

Mostreremo che la serie armonica diverge. L’idea è semplicemente quella di


associare gli addendi della serie armonica in gruppi di lunghezza potenze di
criterio di condensazione di Cauchy due e stimare la somma di ogni gruppo dal basso con il termine più piccolo
(cioè l’ultimo) di ogni gruppo:
+∞    
X 1 1 1 1 1 1 1 1
=1+ + + + + + + +...
𝑘=1
𝑘 2 3 4 5 6 7 8
1 1 1
> 1+ +2· +4· +...
2 4 8
1 1 1
= 1 + + + + · · · = +∞.
2 2 2

Teorema 3.20 (criterio di condensazione di Cauchy). Sia 𝑎 𝑛 una successione


decrescente di numeri reali non negativi: 𝑎 𝑛 ≥ 0. Allora la serie 𝑎 𝑘 converge se e
P
solo se converge la serie X 𝑘
2 𝑎2𝑘 .
3.2 serie a termini positivi 121

Dimostrazione. Supponiamo per comodità che le somme partano da 𝑘 = 1. Si


tratta di raggruppare i termini 𝑎 𝑘 in gruppi di potenze di due:

𝑏0 = 𝑎1 ,
𝑏1 = 𝑎2 + 𝑎3 ,
𝑏2 = 𝑎4 + 𝑎5 + 𝑎6 + 𝑎7 ,
𝑏 3 = 𝑎 8 + 𝑎 9 + 𝑎10 + · · · + 𝑎15 ,
..
.
𝑏 𝑛 = 𝑎 2𝑛 + 𝑎 2𝑛 +1 + · · · + 𝑎2𝑛+1 −1 ,
..
.

Grazie al teorema 3.19 sulla associatività delle serie a termini positivi sappiamo
che
+∞
X +∞
X
𝑎𝑘 = 𝑏𝑛 .
𝑘=1 𝑛=0

Ogni termine 𝑏 𝑛 è la somma di 2𝑛 termini della successione 𝑎 𝑘 che, essendo


la successione decrescente, possono essere stimati dall’alto e dal basso con il
primo e l’ultimo termine di ogni somma, dunque:

2𝑛 𝑎 2𝑛+1 −1 ≤ 𝑏 𝑛 ≤ 2𝑛 𝑎 2𝑛 .

Per ipotesi la serie 2𝑛 𝑎 2𝑛 è convergente dunque per confronto anche la serie


P
𝑏 𝑛 è convergente.
P

Viceversa se la serie 2𝑛 𝑎 2𝑛 è divergente anche la serie 2𝑛+1 𝑎 2𝑛+1 è divergente


P P
e sapendo che 𝑏 𝑛 ≥ 2𝑛 𝑎 2𝑛+1 −1 ≥ 12 2𝑛+1 𝑎 2𝑛+1 otteniamo, per confronto, che anche
la serie 𝑏 𝑛 è divergente.
P

serie armonica generalizzata


Corollario 3.21 (serie armonica generalizzata). La serie
X 1
𝑛 𝑛𝛼

converge se 𝛼 > 1, diverge se 0 ≤ 𝛼 ≤ 1.

Dimostrazione. Applichiamo il criterio di condensazione. Posto 𝑎 𝑛 = 1


𝑛𝛼 Si ha

1 X 𝑛(1−𝛼) X  (1−𝛼)  𝑛
2 𝑛 𝑎 2𝑛 = 2𝑛
X X
= 2 = 2
𝑛 𝑛 (2𝑛 )𝛼 𝑛 𝑛

che è una serie geometrica di ragione 𝑞 = 21−𝛼 . Se 𝛼 > 1 allora 𝑞 < 1 e la


serie armonica è convergente se invece 𝛼 ≤ 1 allora 𝑞 ≥ 1 e la serie armonica è
divergente.

Esercizio 3.22. Utilizzare il criterio di condensazione per dimostrare che la serie


X 1
𝑛 · ln 𝑛
122 3 serie

diverge.

Esercizio 3.23. Per quali valori dei parametri 𝛼 ∈ ℝ e 𝛽 ∈ ℝ la serie

𝑛 𝛼 (ln 𝑛)𝛽
X

converge?

3.3 rappresentazione posizionale dei numeri reali

Quando scriviamo 3
8 = 0.375 intendiamo che vale

3 3 7 5
= + + .
8 10 102 103

Più in generale data una base 𝑑 ∈ ℕ , 𝑑 ≥ 2, ( 𝑑 = 10 nel caso della rappresen-


tazione decimale) consideriamo l’insieme [𝑑] = {0 , 1 , 2 , . . . , 𝑑 − 1} delle cifre
in base 𝑑 . Una sequenza infinita di cifre sarà quindi un elemento 𝒂 ∈ [𝑑]ℕ ,
𝒂 = (𝑎0 , 𝑎1 , . . . , 𝑎 𝑛 , . . . ) con 𝑎 𝑘 ∈ [𝑑]. Potremo quindi considerare il numero
“0.𝑎 0 𝑎 1 𝑎 2 . . .” rappresentato dalla sequenza di cifre 𝒂 :
+∞
X 𝑎𝑘
𝑟(𝒂) = .
𝑘=0 𝑑 𝑘+1

Chiaramente 𝑟(𝒂) ∈ [0 , 1] in quanto essendo 0 ≤ 𝑎 𝑘 ≤ 𝑑 − 1 risulta


+∞ +∞
X 𝑑−1 𝑑−1X 1 𝑑−1 1
0 ≤ 𝑟(𝒂) ≤ = = · = 1. (3.2)
𝑘=0 𝑑 𝑘+1 𝑑 𝑘=0 𝑑 𝑘 𝑑 1− 1
𝑑

Ogni numero 𝑥 ∈ [0 , 1) ammette una rappresentazione in cifre 𝑥 = 𝑟(𝒂) con


𝒂 ∈ [𝑑]ℕ . Infatti per ogni 𝑁 ∈ ℕ possiamo scrivere

𝑁−
X1
b𝑥 · 10𝑁 c = 𝑎 𝑘 10𝑁−1−𝑘
𝑘=0

e al crescere di 𝑁 otteniamo una sequenza di cifre 𝑎 𝑘 ∈ [𝑑] tali che



𝑁−
X1
𝑁 𝑁−1−𝑘
𝑥 · 𝑑 − 𝑎 · 𝑑 ≤1

𝑘
𝑘=0

da cui
𝑁−
X1 𝑎 𝑘 1

𝑥 − ≤ 𝑁

𝑑 𝑘+1 𝑑
𝑘=0

che, facendo tendere 𝑁 → +∞, significa 𝑟(𝒂) = 𝑥 . Il numero 𝑥 = 1 può essere


anch’esso rappresentato, basta prendere 𝑎 𝑘 = 𝑑 − 1 per ogni 𝑘 ∈ ℕ cosicché si
ottiene l’uguaglianza nel lato destro di (3.2). In base 𝑑 = 10 questo si esprime
dicendo che
0.999 . . . = 1.
3.3 rappresentazione posizionale dei numeri reali 123

Ci possiamo chiedere se è possibile che lo stesso numero abbia due rappresen-


tazioni in cifre distinte. Supponiamo quindi che esistano 𝒂, 𝒃 ∈ [𝑑]ℕ con 𝒂 ≠ 𝒃
tali che 𝑟(𝒂) = 𝑟(𝒃). Sia 𝑚 = min {𝑛 ∈ ℕ : 𝑎 𝑛 ≠ 𝑏 𝑛 } la posizione della prima
cifra diversa tra 𝒂 e 𝒃 . Si ha allora
+∞ +∞
X 𝑏𝑘 − 𝑎𝑘 𝑏𝑚 − 𝑎𝑚 X 𝑏𝑘 − 𝑎𝑘
𝑟(𝑏) − 𝑟(𝑎) = = 𝑚+
+ =𝐴+𝐵
𝑘=0 𝑑 𝑘+1 𝑑 1
𝑘=𝑚+1 𝑑
𝑘+1

con
𝑏𝑚 − 𝑎𝑚

1
|𝐴| = 𝑚+1 ≥ 𝑚+1

𝑑 𝑑
e

+∞ +∞
𝑏𝑘 − 𝑎𝑘 𝑑−1
X X
|𝐵| = ≤

𝑘=𝑚+1 𝑑 𝑘+1 𝑘=𝑚+1 𝑑 𝑘+1

+∞
𝑑−1X 1 𝑑−1 1 1
= 𝑚+
= 𝑚+2 · = .
𝑑 2
𝑘=0 𝑑 𝑘 𝑑 1 − 1
𝑑
𝑑 𝑚+1

Dunque, per disuguaglianza triangolare inversa,

0 = |𝑟(𝑏) − 𝑟(𝑎)| ≥ |𝐴| − |𝐵| ≥ 0.

Significa che tutte le disuguaglianze sono in realtà uguaglianze e quindi deve


essere |𝑏 𝑚 − 𝑎 𝑚 | = 1 e per ogni 𝑘 > 𝑚 deve essere |𝑏 𝑘 − 𝑎 𝑘 | = 𝑑− 1. Supponendo
che sia 𝑏 𝑚 = 𝑎 𝑚 + 1 (l’altro caso è analogo) per 𝑘 > 𝑚 dovrà necessariamente
essere 𝑏 𝑘 = 0 e 𝑎 𝑘 = 𝑑 − 1.

Ad esempio se 𝑑 = 10, 𝒂 = (1 , 2 , 3 , 9 , 9 , 9 , 9 , . . . ) e 𝒃 = (1 , 2 , 4 , 0 , 0 , 0 , 0 , . . . ) si
avrà 𝑟(𝒂) = 𝑟(𝒃) = 0.124.

Teorema 3.24 (Cantor). Fissata una base 𝑑 > 2 l’insieme

𝐶 = {𝑟(𝒂) : 𝒂 ∈ {0 , 2}ℕ }

ha cardinalità
#𝐶 = #P(ℕ ).
In particolare #ℝ > #ℕ .

Dimostrazione. Vogliamo verificare che 𝑟 : {0 , 2}ℕ → [0 , 1] è iniettiva. Abbiamo


già visto in generale che 𝑟(𝒂) = 𝑟(𝒃) solamente se la prima cifra diversa in
𝒂 e 𝒃 differisce di una unità. Ma siccome tutte le cifre di 𝒂 e 𝒃 per ipotesi
sono 0 oppure 2, non differiscono di una unità e quindi 𝑟 è iniettiva. Dunque
#𝐶 = #{0 , 2}ℕ . D’altra parte #{0 , 2}ℕ = #P(ℕ ) in quanto ogni 𝒂 ∈ {0 , 2}ℕ può
essere messo in corrispondenza biunivoca con l’insieme 𝒂 −1 ({0}) degli indici
𝑘 ∈ ℕ per cui 𝑎 𝑘 = 0.

Dal teorema 1.61 deduciamo che #𝐶 #P(ℕ ) > #ℕ e visto che 𝐶 ⊆ ℝ a maggior
ragione #ℝ ≥ #𝐶 > #ℕ .
124 3 serie

D’altra parte possiamo mostrare che #ℝ ≤ #P(ℕ ) in quanto possiamo costruire


una funzione 𝑓 : ℝ → P(ℚ) in questo modo:

𝑓 (𝑥) = {𝑞 ∈ ℚ : 𝑞 < 𝑥}.

Per la densità di ℚ in ℝ sappiamo che se 𝑥 < 𝑦 esiste 𝑞 ∈ ℚ con 𝑥 < 𝑞 < 𝑦


e dunque 𝑞 ∈ 𝑓 (𝑦) \ 𝑓 (𝑥) da cui 𝑓 (𝑥) ≠ 𝑓 (𝑦). Dunque 𝑓 è iniettiva, che
significa #ℝ ≤ #P(ℚ) Ma #ℕ = #ℚ dunque #P(ℚ) = #P(ℕ ) e la dimostrazione
è conclusa.

L’insieme 𝐶 definito nella precedente dimostrazione con 𝑑 = 3 è lo stesso insieme


insieme di Cantor di Cantor considerato nell’esempio 7.83. Infatti si potrebbe mostrare facilmente
che 𝐶 = 13 𝐶 ∪ ( 32 + 13 𝐶).

3.4 convergenza assoluta

Per le serie a termini positivi abbiamo molti criteri di convergenza che invece, in
generale, non si applicano alle serie di segno qualunque o alle serie di numeri
complessi. La convergenza di queste ultime, però, può a volte ricondursi
facilmente alla convergenza delle serie a termini positivi, passando al modulo
ogni termine.

Definizione 3.25 (convergenza assoluta). Diremo che una serie (a termini reali o
complessi) 𝑎 𝑛 è assolutamente convergente se la serie |𝑎 𝑛 | è convergente.
P P
assolutamente convergente

𝑎 𝑛 (reale o complessa) è
P
Teorema 3.26 (convergenza assoluta). Se una serie
assolutamente convergente allora è convergente e vale

X+∞ X +∞
𝑎𝑘 ≤ |𝑎 𝑘 |.


𝑘=0 𝑘=0

Dimostrazione. Supponiamo inizialmente che gli 𝑎 𝑛 siano numeri reali. Defi-


niamo 𝑎 𝑛+ = max {0 , 𝑎 𝑛 } e 𝑎 𝑛− = − min {0 , 𝑎 𝑛 }. Cioè se 𝑎 𝑛 ≥ 0 si ha 𝑎 𝑛+ = 𝑎 𝑛 e
𝑎 𝑛− = 0 se invece 𝑎 𝑛 ≤ 0 si ha 𝑎 𝑛+ = 0 e 𝑎 𝑛− = −𝑎 𝑛 . Dunque 𝑎 𝑛+ ≥ 0, 𝑎 𝑛− ≥ 0,

𝑎 𝑛 = 𝑎 𝑛+ − 𝑎 𝑛− e |𝑎 𝑛 | = 𝑎 𝑛+ + 𝑎 𝑛− .

Allora se |𝑎 𝑛 | converge, per confronto anche 𝑎 𝑛+ e 𝑎 𝑛− convergono. Dunque,


P P P
per il teorema sulla somma dei limiti, 𝑎 𝑛 = 𝑎 𝑛+ − 𝑎 𝑛− e quindi anche 𝑎 𝑛
P P P P
converge.

Se abbiamo una successione di complessi 𝑎 𝑛 = 𝑥 𝑛 + 𝑖 𝑦𝑛 e se |𝑎 𝑛 | converge


P
allora, per confronto, anche |𝑥 𝑛 | e |𝑦𝑛 | convergono (si osservi infatti che
P P
|𝑥| ≤ |𝑥 + 𝑖 𝑦| e |𝑦| ≤ |𝑥 + 𝑖 𝑦| ). Dunque 𝑥 𝑛 e 𝑦𝑛 convergono per quanto già
P P
dimostrato sulle serie a termini reali. Ma allora anche 𝑖 𝑦𝑛 e 𝑎 𝑛 = (𝑥 + 𝑖 𝑦𝑛 )
P P P
convergono.

Poniamo ora
𝑛
X
𝑆𝑛 = 𝑎𝑘 .
𝑘=0
3.4 convergenza assoluta 125

Per la subadditività del modulo sappiamo che per le somme finite si ha



X 𝑛 X 𝑛 +∞
X
|𝑆𝑛 | = 𝑎𝑘 ≤ |𝑎 𝑘 | ≤ |𝑎 𝑘 |.

𝑘=0 𝑘=0 𝑘=0

E per continuità del modulo, posto 𝑆 = lim 𝑆𝑛 si ha



X+∞ +∞
X
𝑎 𝑘 = |𝑆| = lim |𝑆𝑛 | ≤ |𝑎 𝑘 |.

𝑛→+∞

𝑘=0 𝑘=0

Teorema 3.27 (convergenza incondizionata). Se 𝑎 𝑛 è una serie assolutamente


P
convergente e 𝜎 : ℕ → ℕ è una qualunque funzione biettiva (permutazione dei numeri
naturali) si ha
+∞
X +∞
X
𝑎𝑛 = 𝑎 𝜎(𝑛) .
𝑛=0 𝑛=0

Dimostrazione. Basta mostrare che


" #
𝑛
X 𝑛
X
lim 𝑎𝑘 − 𝑎 𝜎(𝑗) = 0. (3.3)
𝑛→+∞
𝑘=0 𝑗=0

Visto che la serie 𝑎 𝑘 è assolutamente convergente per il teorema 3.7 sappiamo


P
che per ogni 𝜀 > 0 esiste 𝑁𝜀 ∈ ℕ tale che
+∞
X
|𝑎 𝑘 | < 𝜀.
𝑘=𝑁𝜀

Inoltre visto che 𝜎 : ℕ → ℕ è suriettiva deve esistere 𝑀 𝜀 ∈ ℕ per cui risulti

{𝜎(0), 𝜎(1), . . . , 𝜎(𝑀 𝜀 − 1)} ⊇ {0 , 1 , . . . , 𝑁𝜀 − 1}

ovvero per ogni 𝑘 < 𝑁𝜀 esiste 𝑗 < 𝑀 𝜀 tale che 𝜎(𝑗) = 𝑘 . Necessariamente deve
essere 𝑀 𝜀 ≥ 𝑁𝜀 . Per ogni 𝑛 > 𝑀 𝜀 consideriamo la differenza tra le somme
parziali:
𝑛
X 𝑛
X
𝑎𝑘 − 𝑎 𝜎(𝑗)
𝑘=0 𝑗=0

e osserviamo che se 𝑗 ≤ 𝑛 e 𝑘 = 𝜎(𝑗) ≤ 𝑛 allora i termini 𝑎 𝑘 e 𝑎 𝜎(𝑗) si elidono. I


termini che non si elidono sono gli 𝑎 𝑘 della prima somma in cui 𝜎 −1 (𝑘) > 𝑛 e
gli 𝑎 𝜎(𝑗) della seconda somma in cui 𝜎(𝑗) > 𝑛 . In ogni caso tali termini hanno
indice maggiore o uguale a 𝑁𝜀 e quindi la loro somma può essere stimata con
la somma dei loro moduli che a sua volta può essere stimata con la somma dei
moduli di tutti i termini con indice non inferiore a 𝑁𝜀 :

X 𝑛 X𝑛 X+∞
𝑎𝑘 − 𝑎 𝜎(𝑗) ≤ 2 |𝑎 𝑘 | ≤ 2𝜀.


𝑗=0
𝑘=0 𝑘=𝑁𝜀
126 3 serie

Questo garantisce la validità dell’equazione (3.3) in base alla definizione di


limite.

3.5 serie a segno variabile


P (−1)𝑘
La serie 𝑘+1 la cui somma si può scrivere come
serie armonica a segni alterni

1 1 1 1
1− + − + ...
2 3 4 5

non è assolutamente convergente (in quanto la serie 𝑘+1 1 è divergente) ma ha


P
il termine generico infinitesimo. Non abbiamo quindi nessun criterio che ci
permetta di determinarne il carattere. Possiamo però sfruttare il fatto che i segni
sono alterni cioè che i termini di indice pari hanno segno opposto ai termini di
indice dispari. Si nota infatti che posto
𝑛
X (−1) 𝑘
𝑆𝑛 =
𝑘=0
𝑘+1

si ha
1 1 1
𝑆2𝑛+2 = 𝑆2𝑛+1 + = 𝑆2 𝑛 − + < 𝑆2 𝑛
2𝑛 + 3 2𝑛 + 2 2𝑛 + 3
1 1 1
𝑆2𝑛+3 = 𝑆2𝑛+2 − = 𝑆2𝑛+1 + − > 𝑆2𝑛+1
2𝑛 + 4 2𝑛 + 3 2𝑛 + 4

Dunque la successione delle somme parziali di indice pari è decrescente mentre


sui termini di indice dispari è crescente. Avremo quindi che entrambe le
sottosuccessioni hanno limite: 𝑆2𝑛 → 𝑆 , 𝑆2𝑛+1 → 𝑅 .
Ma
1
𝑆 − 𝑅 = lim (𝑆2𝑛 − 𝑆2𝑛+1 ) = lim = 0.
𝑛→+∞ 𝑛→+∞ 2𝑛 + 2
Dunque 𝑆 = 𝑅 e l’intera successione ha limite 𝑆 . D’altra parte 𝑆 ≤ 𝑆0 in quanto
𝑆2𝑛 è decrescente e 𝑆 ≥ 𝑆1 in quanto 𝑆2𝑛+1 è crescente. Concludiamo che 𝑆 è
Per determinare il valore della somma di finito e dunque la serie è convergente.
questa serie ci serviranno degli strumenti
più avanzati. Si veda l’equazione 5.16. Questa dimostrazione può essere resa più in generale nel seguente.

criterio di Leibniz Teorema 3.28 (serie a segni alterni: criterio di Leibniz). Sia 𝑏 𝑛 una successione
monotòna e infinitesima. Allora la serie

(−1)𝑛 𝑏 𝑛
X

è convergente.
𝑛
(−1) 𝑘 𝑏 𝑘 sono le somme parziali, si osserva che la somma
X
Più precisamente se 𝑆𝑛 =
𝑘=0
della serie 𝑆 = lim 𝑆𝑛 è sempre compresa tra due termini consecutivi della successione
𝑆𝑛 :
𝑆 ∈ [min{𝑆𝑛 , 𝑆𝑛+1 }, max{𝑆𝑛 , 𝑆𝑛+1 }].
3.5 serie a segno variabile 127

Dimostrazione. Senza perdere di generalità possiamo supporre che la successione


𝑏 𝑛 sia decrescente e quindi 𝑏 𝑛 ≥ 0 (visto che il limite è zero). Posto
𝑛
(−1) 𝑘 𝑏 𝑘
X
𝑆𝑛 =
𝑘=0

si ha

𝑆2𝑛+2 = 𝑆2𝑛 − 𝑏 2𝑛+1 + 𝑏2𝑛+2


𝑆2𝑛+3 = 𝑆2𝑛+1 + 𝑏2𝑛+2 − 𝑏 2𝑛+3 .

Essendo 𝑏 𝑛 decrescente si ha 𝑏 2𝑛+2 < 𝑏 2𝑛+1 e 𝑏 2𝑛+3 < 𝑏 2𝑛+2 da cui

𝑆2𝑛+2 < 𝑆2𝑛 , 𝑆2𝑛+3 > 𝑆2𝑛+1 .

Dunque le successioni 𝑆2𝑛 e 𝑆2𝑛+1 sono monotone e di conseguenza hanno


limite:
𝑆2𝑛 → 𝑆, 𝑆2𝑛+1 → 𝑅
con 𝑆, 𝑅 ∈ [−∞, +∞]. D’altronde, essendo 𝑏 𝑛 infinitesima

𝑆 − 𝑅 = lim 𝑆2𝑛 − 𝑆2𝑛+1 = lim 𝑏2𝑛+1 = 0.


𝑛→+∞ 𝑛→+∞

Dunque 𝑆 = 𝑅 . Inoltre essendo 𝑆2𝑛 decrescente si ha 𝑆 ≤ 𝑆0 ed essendo 𝑆2𝑛+1


crescente si ha 𝑆 ≥ 𝑆1 . Dunque 𝑆 è finito e la serie converge.

Abbiamo anche ottenuto che 𝑆2𝑛−1 ≤ 𝑆 ≤ 𝑆2𝑛 e 𝑆2𝑛+1 ≤ 𝑆 ≤ 𝑆2𝑛 dunque è


verificata anche la seconda parte dell’enunciato.

Abbiamo dunque un esempio, la serie (−1) 𝑘 /𝑘 di una serie convergente ma


P
non assolutamente convergente. Il seguente teorema ci dice che per le serie di
questo tipo non è mai garantito che riordinando i termini la somma si conservi.
convergenza condizionata

Teorema 3.29 (convergenza condizionata). Sia 𝑎 𝑘 una serie convergente ma non


P
assolutamente convergente a termini reali. Allora fissato qualunque 𝑥 ∈ [−∞, +∞]
esiste un riordinamento 𝜎 : ℕ → ℕ biettivo tale che
+∞
X
𝑎 𝜎(𝑘) = 𝑥.
𝑘=0

Dimostrazione. Dividiamo i termini della successione 𝑎 𝑘 in termini maggiori o


uguali a zero e in termini negativi. Sia 𝑎 +𝑘 la sottosuccessione dei termini non
negativi e −𝑎 −𝑘 la sottosuccessione degli opposti dei termini negativi (quindi
𝑎 +𝑘 ≥ 0 e 𝑎 −𝑘 > 0). Si avrà

𝑛
X 𝑛+
X 𝑛−
X
𝑎𝑘 = 𝑎 +𝑘 − 𝑎 −𝑘
𝑘=0 𝑘=0 𝑘=0
𝑛
X 𝑛+
X 𝑛−
X
|𝑎 𝑘 | = 𝑎 +𝑘 + 𝑎 −𝑘
𝑘=0 𝑘=0 𝑘=0
128 3 serie

dove 𝑛 + + 1 e 𝑛 − + 1 sono rispettivamente il numero di termini non-negativi e


negativi tra i primi 𝑛 + 1 termini della successione 𝑎 𝑘 .

Osserviamo ora che dovrà essere


+∞
X +∞
X
𝑎 +𝑘 = +∞ e 𝑎 −𝑘 = +∞.
𝑘=0 𝑘=0

Innanzitutto le somme esistono perché le serie sono a termini non negativi. Se


entrambe queste somme fossero finite allora la serie |𝑎 𝑘 | sarebbe convergente,
P
ma per ipotesi abbiamo assunto che 𝑎 𝑘 non fosse assolutamente convergente.
P
Quindi almeno una delle due somme è infinita. Se la somma dei termini positivi
fosse infinita e quella dei termini negativi fosse finita potremmo però concludere
che anche la somma della serie 𝑎 𝑘 sarebbe infinita. Viceversa se la somma
P
dei termini positivi fosse finita e quella dei termini negativi fosse infinita la
somma 𝑎 𝑘 sarebbe −∞. Ma per ipotesi abbiamo richiesto che la serie 𝑎 𝑘
P P
fosse convergente.

Fissato 𝑥 ∈ ℝ possiamo quindi cominciare a sommare i termini positivi 𝑎 +𝑘 finché


non si raggiunge o si supera il valore 𝑥 . A quel punto cominciamo a sommare
i termini negativi finché non torniamo sotto al valore 𝑥 . Poi continuiamo a
sommare i termini positivi finché non si torna a superare 𝑥 e di nuovo poi
continuiamo con i termini negativi finché non si torna a scendere sotto 𝑥 .
Intermezzando opportunamente termini positivi e termini negativi riusciamo
quindi ad ottenere delle somme parziali che oscillano intorno al valore di 𝑥 e si
avvicinano sempre di più a 𝑥 in quanto ad ogni cambio di “rotta” la distanza
da 𝑥 è inferiore al valore assoluto dell’ultimo termine sommato e la successione
dei termini 𝑎 𝑘 è infinitesima in quanto la serie 𝑎 𝑘 è convergente.
P

Stessa cosa si può fare per ottenere una somma 𝑥 = +∞. Fissata una qualunque
successione 𝑥 𝑛 → +∞ comincio a sommare i termini positivi finché non supero
il valore 𝑥 1 + 𝑎 1− . Poi sommo un solo termine negativo, −𝑎 1− e ottengo una
somma maggiore di 𝑥 1 . Poi sommo tanti positivi finché non supero 𝑥 2 + 𝑎 2− .
Poi sommo un altro unico termine negativo e così via. Chiaramente le somme
tenderanno a +∞.

Il caso 𝑥 = −∞ si tratta in maniera analoga.

3.6 somme multiple

Teorema 3.30 (somme alla Cauchy). Sia 𝑎 𝑘,𝑗 ∈ ℂ una successione a due indici
𝑘 ∈ ℕ , 𝑗 ∈ ℕ . Se
+∞ X
X +∞
𝑎 𝑘,𝑗 < +∞

𝑘=0 𝑗=0

allora
+∞ X
X +∞ 𝑛
+∞ X
X
𝑎 𝑘,𝑗 = 𝑎 𝑘,𝑛−𝑘 .
𝑘=0 𝑗=0 𝑛=0 𝑘=0
3.6 somme multiple 129

Dimostrazione. Poniamo
+∞
X 𝑛
X
𝑏𝑘 = 𝑎 𝑘,𝑗 , 𝑐𝑛 = 𝑎 𝑘,𝑛−𝑘 .
𝑗=0 𝑘=0

Se immaginiamo i termini 𝑎 𝑘,𝑗 come i termini di una matrice infinita dove 𝑘 è


l’indice di riga e 𝑗 è l’indice di colonna, osserviamo che 𝑏 𝑘 rappresenta la somma
dei termini sulla riga 𝑘 -esima e la successione 𝑐 𝑛 rappresenta la somma (finita)
dei termini sulla diagonale 𝑘 + 𝑗 = 𝑛 . L’idea è che sommare i termini lungo
le righe oppure lungo le diagonali ci deve dare lo stesso risultato. L’ipotesi è
infatti una sorta di assoluta convergenza della serie di tutti i termini 𝑎 𝑘,𝑗 .

La tesi del teorema è


+∞
X 𝑁
X
𝑏 𝑘 = lim 𝑐𝑛
𝑁→+∞ 𝑛=0
𝑘=0

cioè per ogni 𝜀 > 0 dobbiamo trovare 𝛼 ∈ ℕ tale che per ogni 𝑁 > 𝛼 si abbia

X 𝑁 +∞
X
𝑐𝑛 − 𝑏 𝑘 < 4 𝜀.


𝑛=0 𝑘=0

Fissato 𝜀 > 0 applicando la proprietà della coda (teorema 3.7) alla serie
convergente data per ipotesi, si ottiene che esiste 𝐾 tale che:
+∞ X
+∞
𝑎 𝑘,𝑗 < 𝜀 .
X
𝑘=𝐾+1 𝑗=0
2

Sempre grazie alla proprietà della coda applicata ai singoli termini della serie
convergente per ipotesi possiamo affermare che per ogni 𝑘 ∈ {0 , 1 , . . . , 𝐾} esiste
un indice 𝐽𝑘 tale che
+∞
𝑎 𝑘,𝑗 ≤ 𝜀 .
X
𝑗=𝐽𝑘 +1 2 𝑘+2

Poniamo 𝐽 = max {𝐽0 , 𝐽1 , . . . , 𝐽𝐾 } e 𝛼 = 𝐽 + 𝐾 . Se 𝑁 ≥ 𝛼 si ha allora



X 𝑁 +∞
X X 𝑁 X𝐾
𝑐𝑛 − 𝑏𝑘 ≤ 𝑐𝑛 − 𝑏𝑘 + 𝜀


𝑛=0 𝑘=0
𝑛=0 𝑘=0

𝑁
0 𝑐 𝑛 sono
P
Osserviamo ora che i termini che vengono sommati nella serie 𝑛=
tutti i termini 𝑎 𝑘,𝑗 tali che 𝑘 + 𝑗 ≤ 𝑁 , mentre i termini che vengono sommati
in 𝐾𝑘=0 𝑏 𝑘 sono tutti i termini 𝑎 𝑘,𝑗 con 𝑘 ≤ 𝐾 . Quindi i termini in comune
P
alle due somme si cancellano e rimangono solamente i termini della prima
somma che non compaiono nella seconda e i termini della seconda somma che
non compaiono nella prima. Non ci interessa il segno di questi termini quindi
possiamo stimare la somma di tutti questi termini residui facendone la somma
130 3 serie

dei valori assoluti:



X 𝑁 X𝐾 𝑁 𝑁−𝑘
X X X 𝐾 X+∞
𝑐𝑛 − 𝑏𝑘 ≤ 𝑎 𝑘,𝑗 + 𝑎 𝑘,𝑗


𝑛=0 𝑘=0
𝑘=𝐾+1 𝑗=0 𝑘=0 𝑗=𝑁−𝐾
+∞ X
X +∞ X 𝐾 X
+∞
𝑎 𝑘,𝑗 + 𝑎 𝑘,𝑗


𝑘=𝐾+1 𝑗=0 𝑘=0 𝑗=𝐽𝑘 +1
+∞
𝜀 X 𝜀
≤ + = 𝜀.
2 𝑘=0 2 𝑘+2

3.7 somma per parti

Teorema 3.31 (somma per parti). Siano 𝑎 𝑘 e 𝐵 𝑘 successioni (reali o complesse).


Posto
𝑛−1
X
𝐴𝑛 = 𝑎𝑘 , 𝑏 𝑛 = 𝐵𝑛+1 − 𝐵𝑛
somma per parti 𝑘=0

si ha
𝑛−1
X 𝑛−1
X
𝑎 𝑘 𝐵 𝑘 = 𝐴𝑛 𝐵𝑛 − 𝐴𝑚 𝐵𝑚 − 𝐴 𝑘+1 𝑏 𝑘 . (3.4)
𝑘=𝑚 𝑘=𝑚

Dimostrazione. Osserviamo che 𝑎 𝑛 = 𝐴𝑛+1 − 𝐴𝑛 dunque

𝑛−1
X
𝐴𝑛 𝐵𝑛 − 𝐴𝑚 𝐵𝑚 = (𝐴 𝑘+1 𝐵 𝑘+1 − 𝐴 𝑘 𝐵 𝑘 )
𝑘=𝑚
𝑛−1
X
= (𝐴 𝑘+1 𝐵 𝑘+1 − 𝐴 𝑘+1 𝐵 𝑘 + 𝐴 𝑘+1 𝐵 𝑘 − 𝐴 𝑘 𝐵 𝑘 )
𝑘=𝑚
𝑛−1
X 𝑛−1
X
= 𝐴 𝑘+1 𝑏 𝑘 + 𝑎 𝑘 𝐵𝑘 .
𝑘=𝑚 𝑘=𝑚

Se prendiamo 𝑎 𝑘 = (−1) 𝑘 si può osservare che 𝐴𝑛 = 𝑛− 1


(−1) 𝑘 è una successione
P
𝑘=0
limitata in quanto 𝐴𝑛 = 1 se 𝑛 è dispari mentre 𝐴𝑛 = 0 se 𝑛 è pari. Se invece
scegliamo una successione 𝐵𝑛 è positiva, decrescente e infinitesima e poniamo
𝑏 𝑛 = 𝐵𝑛+1 − 𝐵𝑛 si ha
+∞
X 𝑛−1
X
|𝑏 𝑘 | = lim (𝐵 𝑘 − 𝐵 𝑘+1 ) = lim (𝐵0 − 𝐵𝑛 ) = 𝐵0 < +∞.
𝑛→+∞ 𝑛→+∞
𝑘=0 𝑘=0

Dunque il seguente teorema è una estensione del criterio di Leibniz per le serie
a segni alterni.
3.7 somma per parti 131

Teorema 3.32 (criterio di Dirichlet). Siano 𝑎 𝑛 e 𝐵𝑛 successioni (reali o complesse) e


𝑛−1
X
poniamo 𝐴𝑛 = 𝑎 𝑘 , 𝑏 𝑛 = 𝐵𝑛+1 − 𝐵𝑛 . Se 𝐴𝑛 è limitata, 𝐵𝑛 → 0 e |𝑏 𝑛 | < +∞
P
P 𝑘=0
allora la serie 𝑎 𝑘 𝐵 𝑘 è convergente.

Dimostrazione. Per la formula di somma per parti (3.4) si ha

𝑛−1
X 𝑛−1
X
𝑎 𝑘 𝐵 𝑘 = 𝐴 𝑛 𝐵 𝑛 − 𝐴0 𝐵0 − 𝐴 𝑘+1 𝑏 𝑘 . (3.5)
𝑘=0 𝑘=0

Il primo addendo 𝐴𝑛 𝐵𝑛 tende a zero per 𝑛 → +∞ in quanto prodotto di una


successione limitata per una infinitesima. Il secondo addendo è costante. La
serie 𝐴 𝑘+1 𝑏 𝑘 è assolutamente convergente in quanto essendo |𝐴𝑛 | ≤ 𝐿 limitata
P
e 𝑏 𝑛 assolutamente convergente si ha
P

X X
|𝐴 𝑘+1 | · |𝑏 𝑘 | ≤ 𝐿 · |𝑏 𝑘 | < +∞.

Dunque il limite della somma sul lato destro converge e quindi la somma sul
lato sinistro dell’equazione (3.5) è convergente per 𝑛 → +∞.

Esercizio 3.33. Fissato 𝑧 ∈ ℂ, |𝑧| ≤ 1, 𝑧 ≠ 1 la serie


+∞ 𝑘
X 𝑧
𝑘=1
𝑘

è convergente.

Dimostrazione. Si noti che per |𝑧| < 1 si può facilmente applicare il criterio del
rapporto o della radice. Ma per |𝑧| = 1 quei criteri non si applicano e bisogna
invece utilizzare il teorema 3.32.

Posto 𝑎 𝑘 = 𝑧 𝑘 si osserva che 𝑎 𝑘 è una serie geometrica e (essendo 𝑧 ≠ 1) si ha


P

𝑛−1
1 − 𝑧𝑛
𝑧𝑘 =
X
𝐴𝑛 =
𝑘=0
1−𝑧

che è limitata, infatti:

|1 − 𝑧 𝑛 | 1 + |𝑧 𝑛 | 2
|𝐴𝑛 | = ≤ = .
| 1 − 𝑧| | 1 − 𝑧| | 1 − 𝑧|

Mentre posto 𝐵𝑛 = 1/𝑛 è chiaro che, essendo 𝐵𝑛 reale, decrescente si ha

+∞
X 𝑛−1
X
|𝐵 𝑘+1 − 𝐵 𝑘 | = lim (𝐵 𝑘 − 𝐵 𝑘+1 ) = lim (𝐵1 − 𝐵𝑛 )
𝑛→+∞ 𝑛→+∞
𝑘=1 𝑘=1
 
1
= lim 1− = 1 < +∞.
𝑛→+∞ 𝑛

Si applica quindi il teorema 3.32 per ottenere la convergenza della serie data.
132 3 serie

Si osservi che se |𝑧| > 1 la serie in questione non converge perché il termine
generico 𝑧 𝑘 /𝑘 non è infinitesimo. Per 𝑧 = 1 si ottiene la serie armonica, che
pure non converge.

3.8 prodotti infiniti

Così come abbiamo fatto la teoria per le somme infinite si potrebbe fare la teoria
dei prodotti infiniti ponendo
+∞
Y 𝑛
Y
𝑎 𝑘 = lim 𝑎 𝑘 = lim 𝑎0 · 𝑎1 · · · 𝑎 𝑛 .
𝑛→+∞ 𝑛→+∞
𝑘=0 𝑘=0

Supporremo sempre 𝑎 𝑘 > 0 altrimenti il segno del prodotto difficilmente sarebbe


definito. Allora, utilizzando il logaritmo (che trasforma prodotti in somme)
possiamo ricondurre i prodotti infiniti alle serie:
+∞ P𝑛
ln 𝑎 𝑘
Y
𝑎 𝑘 = lim 𝑒 𝑘=0 .
𝑛→+∞
𝑘=0

Osserviamo che se la serie dei logaritmi diverge a −∞ il prodotto infinito ha


limite 0. Avendo richiesto che i termini 𝑎 𝑘 siano tutti positivi il prodotto non
potrà mai essere minore di zero. Per mantenere l’analogia con le serie diremo
che il prodotto infinito converge se il limite dei prodotti parziali è finito e
positivo. Diremo che diverge se il limite è +∞ oppure 0.

Dunque potremo dire che il prodotto infinito converge se e solo se la serie dei
logaritmi converge.

Osserviamo quindi che condizione necessaria affinché un prodotto infinito 𝑎 𝑘


Q
sia convergente dovrà essere ln 𝑎 𝑘 → 0 ovvero 𝑎 𝑘 → 1. In tal caso visto che

ln 𝑎 𝑘 = ln(1 + (𝑎 𝑘 − 1)) ∼ 𝑎 𝑘 − 1

si osserva che se 𝑎 𝑘 → 1 il prodotto infinito 𝑎 𝑘 converge se e solo se converge


Q
la serie (𝑎 𝑘 − 1).
P

Esempio 3.34 (somma dei reciproci dei primi). Possiamo utilizzare i prodotti
infiniti per dimostrare che la somma dei reciproci dei numeri primi è divergente. Sia 𝑝 𝑘
la successione dei numeri primi ( 𝑝 1 = 2, 𝑝 2 = 3, 𝑝 3 = 5, . . . stiamo dando per scontato
che i numeri primi sono infiniti). Allora vogliamo dimostrare che
+∞ +∞
X 1 X 1
= = +∞. (3.6)
𝑘=1
𝑝𝑘 𝑛=1 𝑛

Questo risultato ha una certa rilevanza nell’ambito della teoria dei numeri in quanto ci
dice che 𝑝 𝑘 non può andare all’infinito come una potenza 𝑘 𝛼 con 𝛼 > 1 in quanto la
serie 1/𝑘 𝛼 è convergente.
P
3.9 le serie di potenze 133

Mostriamo quindi che vale (3.6). Si noti che per ogni 𝑛 ∈ ℕ il termine 𝑛1 può essere
decomposto come il prodotto di potenze dei reciproci dei numeri primi. Dunque:
+∞
X 1 1 1 1 1
= (1 + + 2 + . . . ) · (1 + + 2 + . . . )
𝑛=1 𝑛 2 2 3 3
1 1
· (1 + + + ...)··· (3.7)
5 52
+∞ X
+∞  𝑗 +∞
Y 1 Y 1
= = .
𝑘=1 𝑗=0
𝑝𝑘 𝑘=1 1− 1
𝑝𝑘

Nei passaggi precedenti abbiamo sfruttato il fatto che nelle serie a termini positivi
possiamo riordinare e associare i termini in qualunque modo. Una serie a termini positivi
è convergente oppure divergente e la convergenza assoluta coincide con la convergenza
semplice. Visto che riordinando i termini di una serie assolutamente convergente non
si può ottenere una serie divergente, significa che riordinando i termini di una serie
divergente (a termini positivi) si ottiene sempre una serie divergente.

Ora possiamo utilizzare il fatto che il prodotto infinito ottenuto in (3.7) ha lo stesso
carattere della seguente serie
1
!
+∞ +∞
X 1 X 𝑝𝑘
1
−1 = 1
𝑘=1 1− 𝑝𝑘 𝑘=1 1− 𝑝𝑘

ma visto che 1/𝑝 𝑘 → 0 si ha


1
𝑝𝑘 1

1− 1
𝑝𝑘
𝑝𝑘

e dunque, per il criterio del confronto asintotico, la serie precedente ha lo stesso carattere
della serie
+∞
X 1
𝑝
𝑘=1 𝑘

che quindi è divergente.

3.9 le serie di potenze

Se 𝑎 𝑘 è una successione di numeri complessi, la serie serie di potenze

𝑎𝑘 𝑧 𝑘
X

dipendente dal parametro 𝑧 ∈ ℂ si chiama serie di potenze di coefficienti 𝑎 𝑘 .


Se chiamiamo 𝐴 ⊆ ℂ l’insieme dei numeri complessi 𝑧 per i quali la serie di
potenze converge

𝑎 𝑘 𝑧 𝑘 è convergente
X
𝐴 = 𝑧 ∈ ℂ:

134 3 serie

la somma della serie risulta essere una funzione 𝑓 : 𝐴 → ℂ definita da


+∞
𝑎𝑘 𝑧 𝑘 .
X
𝑓 (𝑧) =
𝑘=0

insieme di convergenza
L’insieme 𝐴 si chiama insieme di convergenza (o dominio di convergenza) della serie
di potenze 𝑎 𝑘 𝑧 𝑘 .
P

Come al solito ci potrà capitare di considerare serie di potenze con l’indice 𝑘 che
parte da 1 invece che da 0 (o da qualunque altro numero naturale). Ciò non è
rilevante, potremo sempre considerare 𝑎 𝑘 = 0 per i termini che non partecipano
alla sommatoria.

Osserviamo anche che per 𝑘 = 0 il termine corrispondente della serie è 𝑎 0 · 00 = 𝑎 0


in quanto abbiamo definito 00 = 1. Dunque potremo anche scrivere:
+∞
𝑎 𝑘 𝑧 𝑘 = 𝑎0 + 𝑎1 𝑧 + 𝑎2 𝑧 2 + · · · + 𝑎 𝑛 𝑧 𝑛 + . . . .
X
𝑘=0

Le serie di potenze assomigliano quindi a dei polinomi, ma con infiniti termini.

Esempio 3.35 (la serie geometrica). La serie di potenze di coefficienti 𝑎 𝑘 = 1 è la


serie geometrica 𝑧 𝑘 . L’insieme di convergenza è il cerchio 𝐴 = {𝑧 ∈ ℂ : |𝑧| < 1}.
P
Per 𝑧 ∈ 𝐴 si ha
+∞
1
𝑧𝑘 =
X
𝑓 (𝑧) = .
𝑘=0
1−𝑧
𝑘
𝑘 |𝑧| ≥ 𝑘 1 la serie non può convergere perché il termine 𝑧 non è infinitesimo:
Se
𝑧 = |𝑧| ≥ 1.

𝑧 𝑛
𝑛
𝑛 𝑛 (ottenuta ponendo 𝑎 𝑛 = 1/𝑛 ) ha come
P
Esempio 3.36. La serie di potenze
insieme di convergenza 𝐴 = ℂ in quanto
s
𝑛 |𝑧|
𝑛 𝑧
𝑛𝑛 = 𝑛 → 0 < 1

e quindi per il criterio della radice la serie in questione converge assolutamente qualunque
sia 𝑧 ∈ ℂ.

Teorema 3.37 (convergenza delle serie di potenze). Se la serie di potenze 𝑎 𝑘 𝑧 𝑘


P
converge in un punto 𝑧 ∈ ℂ (anzi, basta che la successione 𝑎 𝑘 𝑧 𝑘 sia limitata) allora la
serie converge assolutamente per ogni 𝑤 ∈ ℂ tale che |𝑤| < |𝑧| . Viceversa, se la serie
non converge in un punto 𝑧 ∈ ℂ allora non converge in nessun 𝑤 tale che |𝑤| > |𝑤|
(anzi la successione 𝑎 𝑛 𝑤 𝑛 non è nemmeno limitata e tantomento infinitesima).

Dimostrazione. Se la serie 𝑎 𝑘 𝑧 𝑘 converge significa che la successione 𝑎 𝑘 𝑧 𝑘 è


P
infinitesima e in particolare è limitata. Esiste dunque 𝑀 tale che per ogni 𝑘 ∈ ℕ
𝑘
𝑎 𝑘 𝑧 ≤ 𝑀.
3.9 le serie di potenze 135

Se 𝑧 = 0 non c’è niente da dimostrare. Se 𝑧 ≠ 0 si ha


𝑀
|𝑎 𝑘 | ≤ .
|𝑧| 𝑘

Scelto ora qualunque 𝑤 ∈ ℂ con |𝑤| < |𝑧| si ha

𝑘
𝑎 𝑘 𝑤 𝑘 = |𝑎 𝑘 | · |𝑤| 𝑘 ≤ 𝑀 |𝑤| ≤ 𝑀 𝑞 𝑘

𝑘
|𝑧|
|𝑤| P 𝑘
avendo posto 𝑞 = |𝑧|
. 𝑞 converge e, per
Essendo 𝑞 < 1 la serie geometrica
𝑎 𝑘 𝑤 converge. Dunque la serie 𝑎 𝑘 𝑤 𝑘 converge
𝑘

P P
confronto, anche la serie
assolutamente.

Viceversa supponiamo che 𝑎 𝑘 𝑧 𝑘 non converga e prendiamo 𝑤 con |𝑤| > |𝑧| .
P
Allora 𝑎 𝑘 𝑤 𝑘 non può convergere, ansi 𝑎 𝑘 𝑤 𝑘 non può neanche essere limitata
P
perché se lo fosse allora, scambiando i ruoli di 𝑧 e 𝑤 , per il punto precedente la
serie 𝑎 𝑘 𝑧 𝑘 dovrebbe convergere.
P

Corollario 3.38 (l’insieme di convergenza è circolare). Sia 𝑎 𝑘 𝑧 𝑘 una serie di


P
potenze e sia 𝐴 il suo insieme di convergenza. Allora 𝐴 non è vuoto e posto

𝑅 = sup {|𝑧| : 𝑧 ∈ 𝐴}.

risulta che 𝑅 ∈ [0 , +∞] e 𝐴 coincide con il cerchio centrato in 0 e di raggio 𝑅 a meno


dei punti di bordo, nel senso che:

{𝑧 ∈ ℂ : |𝑧| < 𝑅} ⊆ 𝐴 ⊆ {𝑧 ∈ ℂ : |𝑧| ≤ 𝑅}. (3.8)

Inoltre la serie converge assolutamente in ogni 𝑧 ∈ ℂ con |𝑧| < 𝑅 mentre il termine
generico 𝑎 𝑘 𝑧 𝑘 non è nemmeno limitato (e quindi la serie non converge) quando |𝑧| > 𝑅 .

Dimostrazione. Se |𝑧| < 𝑅 significa che esiste 𝑧 0 ∈ 𝐴 tale che |𝑧 0 | > |𝑧| . Ma visto
che la serie converge in 𝑧 0 (per definizione di 𝐴) grazie al teorema precedente
possiamo affermare che la serie converge, anzi, converge assolutamente in 𝑧 .
Dunque si ottiene la prima inclusione in (3.8).

Se invece prendiamo 𝑧 ∈ ℂ con |𝑧| > 𝑅 allora certamente la serie non converge
in 𝑧 altrimenti (per come è definito 𝑅 ) avremmo 𝑅 ≥ |𝑧| . Inoltre possiamo
certamente considerare un punto 𝑧 1 ∈ ℂ tale che 𝑅 < |𝑧 1 | ≤ |𝑧| e la serie di
potenze non può convergere neanche in 𝑧 1 . Ma allora, per il teorema precedente,
deduciamo che 𝑎 𝑘 𝑧 𝑘 non è nemmeno limitata.

Abbiamo quindi mostrato l’esistenza di 𝑅 ∈ ℝ̄ che soddisfa (3.8). Chiaramente


risulta 𝑅 ≥ 0 perché 𝐴 è un insieme non vuoto (per ogni serie di potenze si ha
0 ∈ 𝐴).
raggio di convergenza
Definizione 3.39 (raggio di convergenza). Il raggio di convergenza di una serie
di potenze 𝑎 𝑘 𝑧 𝑘 è il valore 𝑅 ∈ [0 , +∞] dato dal corollario 3.38:
P

𝑎 𝑘 𝑧 𝑘 è convergente .
X
𝑅 = sup |𝑧| : 𝑧 ∈ ℂ,

136 3 serie

𝑎 𝑛 𝑧 𝑛 una serie di potenze.


P
Teorema 3.40 (calcolo del raggio di convergenza). Sia
Se esiste il limite p
lim 𝑛 |𝑎 𝑛 | = ℓ (3.9)
𝑛→+∞

allora 𝑅 = 1/ℓ è il raggio di convergenza della serie (dove si intende 𝑅 = +∞ se ℓ = 0


e 𝑅 = 0 se ℓ = +∞).

Lo stesso accade se esiste il limite


|𝑎 𝑛+1 |
lim = ℓ.
𝑛→+∞ |𝑎 𝑛 |

Più in generale risulta 𝑅 = 1/ℓ se poniamo



ℓ = lim sup 𝑛
𝑎𝑛 .
𝑛→+∞

anche nel caso in cui il limite in (3.9) non dovesse esistere.

Dimostrazione. Prendiamo 𝑟 ≥ 0. Applicando il criterio della radice alla serie


|𝑎 𝑛 |𝑟 𝑛 si ha
P
p
𝑛
p
𝑛
|𝑎 𝑛 |𝑟 𝑛 = 𝑟 |𝑎 𝑛 | → 𝑟ℓ .
Dunque se scegliamo un 𝑟 < 1/ℓ si ha 𝑟ℓ < 1 e la serie 𝑎 𝑛 𝑧 𝑛 converge
P
assolutamente per 𝑧 = 𝑟 . Dunque per ogni 𝑟 < 1/ℓ troviamo che 𝑟 ∈ 𝐴: ne
consegue che 𝑅 ≥ 1/ℓ . Se invece scegliamo 𝑟 > 1/ℓ si ha 𝑟ℓ > 1 e dunque
|𝑎 𝑛 |𝑟 𝑛 → +∞ e la serie non può essere convergente in 𝑧 = 𝑟 . Significa che
𝑅 ≤ 1/ℓ .

Il criterio della radice si applica anche nel caso in cui ℓ è definito tramite lim sup.

Nel caso esista il limite del rapporto |𝑎 𝑛+1 |/|𝑎 𝑛 | sappiamo (grazie al criterio di
convergenza alla Cesàro teorema 2.77) che il limite della radice coincide con il
limite del rapporto e quindi ci si riconduce al caso precedente (oppure si può
ripetere la dimostrazione utilizzando il criterio del rapporto invece del criterio
della radice).

Esempio 3.41. Nell’esempio 3.36 abbiamo visto che l’insieme di convergenza della
serie di potenze
+∞ 𝑘
X 𝑧
𝑘=1
𝑘
è
𝐴 = {𝑧 ∈ ℂ : |𝑧| ≤ 1 , 𝑧 ≠ 1}.
Il raggio di convergenza dovrà quindi essere 𝑅 = 1 e questo può essere facilmente
verificato con uno dei criteri precedenti. Ad esempio:
1
𝑛+1 𝑛
lim = lim =1
𝑛→+∞ 1
𝑛
𝑛→+∞ 𝑛+1

da cui 𝑅 = 1/1 = 1. Si osservi dunque che nessuna delle due inclusioni in (3.8) è, in
questo caso, una uguaglianza.
3.9 le serie di potenze 137

𝑎𝑘 𝑧 𝑘 e
P
Teorema 3.42 (stabilità del raggio di convergenza). Le serie di potenze
𝑘𝑎 𝑘 𝑧 𝑘 hanno lo stesso raggio di convergenza.
P

Dimostrazione. Sia 𝑅 il raggio di convergenza della serie 𝑎 𝑘 𝑧 𝑘 e 𝑟 il raggio di


P
convergenza della serie 𝑘𝑎 𝑘 𝑧 𝑘 .
P

Visto che per 𝑘 > 0 si ha 𝑎 𝑘 𝑧 𝑘 ≤ 𝑘𝑎 𝑘 𝑧 𝑘 la serie 𝑎 𝑘 𝑧 𝑘 converge assolutamente


P
nei punti in cui converge assolutamente la serie 𝑘𝑎 𝑘 𝑧 𝑘 . Questo significa che
P
𝑅 ≥ 𝑟.

Preso ora un punto 𝑤 con |𝑤| < 𝑅 consideriamo un qualunque punto 𝑧 con
|𝑤| < |𝑧| < 𝑅 . La serie 𝑎 𝑘 𝑧 𝑘 converge assolutamente 𝑘
𝑘 in 𝑧 quindi 𝑎 𝑘 𝑧
P
è infinitesima e limitata. Esiste quindi 𝑀 per cui 𝑎 𝑘 𝑧 ≤ 𝑀 che significa

|𝑎 𝑘 | ≤ 𝑀
/
|𝑧| 𝑘 . Ma allora

𝑘 𝑘
𝑘𝑎 𝑘 𝑤 𝑘 ≤ 𝑘|𝑎 𝑘 | |𝑤| 𝑘𝑀 |𝑤|

𝑘 ≤ |𝑧|

si ottiene 𝑘𝑎 𝑘 𝑤 𝑘 ≤ 𝑘𝑀 𝑞 𝑘 . Visto che 𝑞 < 1 sappiamo che


|𝑤|
da cui, posto 𝑞 =

|𝑧|
,
la serie 𝑘𝑀 𝑞 𝑘 è convergente e dunque, per confronto, anche la serie 𝑘𝑎 𝑘 𝑤 𝑘
P P
è assolutamente convergente. Siccome questo è vero per ogni 𝑤 con |𝑤| < 𝑅
significa che 𝑟 ≥ 𝑅 e questo conclude la dimostrazione.

√𝑘
Dimostrazione alternativa. Visto che 𝑘 → 1 si ha
p𝑘 √
lim sup 𝑘𝑎 𝑘 = lim sup 𝑘 𝑎 𝑘 .

Per il teorema 3.40 si ottiene che le due corrispondenti serie di potenze hanno
lo stesso raggio di convergenza.
continuità delle serie di potenze

Teorema 3.43. (continuità delle serie di potenze) Sia 𝑎 𝑘 𝑧 𝑘 una serie di potenze con
P
raggio di convergenza 𝑅 . Allora posto 𝐵 = {𝑧 ∈ ℂ : |𝑧| < 𝑅} la funzione 𝑓 : 𝐵 → ℂ
definita da
+∞
𝑎𝑘 𝑧 𝑘
X
𝑓 (𝑧) =
𝑘=0

è continua (su 𝐵).

Dimostrazione. Supponiamo 𝑅 > 0 altrimenti non c’è niente da dimostrare.


Fissiamo 𝑟 < 𝑅 e consideriamo due punti 𝑧, 𝑤 ∈ ℂ con |𝑧| < 𝑟 e |𝑤| < 𝑟 .
Ricordiamo che si ha

𝑧 𝑛 − 𝑤 𝑛 = (𝑧 − 𝑤) · (𝑧 𝑛−1 + 𝑤𝑧 𝑛−2 + · · · + 𝑤 𝑛−2 𝑧 + 𝑤 𝑛−1 ).

Osservando che per ogni addendo sul lato destro si ha 𝑤 𝑘 𝑧 𝑛−𝑘−1 ≤ 𝑟 𝑛−1 ,

essendoci 𝑛 addendi si ottiene

|𝑧 𝑛 − 𝑤 𝑛 | ≤ |𝑧 − 𝑤| · 𝑛 · 𝑟 𝑛−1 .
138 3 serie

Dunque

X+∞ +∞ X +∞
𝑎𝑛 𝑧 𝑛 − 𝑎𝑛 𝑤 𝑛 = 𝑎 𝑛 (𝑧 𝑛 − 𝑤 𝑛 )
X
| 𝑓 (𝑧) − 𝑓 (𝑤)| =

𝑛=0 𝑛=0 𝑛=0
+∞ +∞
|𝑎 𝑛 | · |𝑧 𝑛 − 𝑤 𝑛 | ≤ |𝑧 − 𝑤| |𝑎 𝑛 |𝑛𝑟 𝑛−1 .
X X

𝑛=0 𝑛=0

Ma noi sappiamo che la serie 𝑛𝑎 𝑛 𝑧 𝑛 ha lo stesso raggio di convergenza 𝑅 della


P
serie originaria (per il teorema 3.42) dunque la serie 𝑛𝑎 𝑛 𝑟 𝑛 è assolutamente
P
convergente e, dividendo per 𝑟 , scopriamo che anche la serie 𝑛𝑎 𝑛 𝑟 𝑛−1 è
P
convergente. Posto 𝐿 = 𝑛=0 𝑛|𝑎 𝑛 |𝑟 𝑛−1 per quanto scritto sopra possiamo
P+∞
concludere che
| 𝑓 (𝑧) − 𝑓 (𝑤)| ≤ 𝐿 · |𝑧 − 𝑤|.
Dunque per ogni 𝜀 > 0 scelto 𝛿 = 𝐿𝜀 se |𝑧 − 𝑤| < 𝛿 risulta | 𝑓 (𝑧) − 𝑓 (𝑤)| ≤ 𝜀.
Significa che la funzione 𝑓 è continua nel punto 𝑧 e questo è vero per ogni 𝑧 con
|𝑧| < 𝑅 .

Il teorema precedente ci garantisce che la somma di una serie di potenze è


una funzione continua all’interno del raggio di convergenza. Nei punti che
si trovano esattamente sulla frontiera del raggio di convergenza la funzione 𝑓
potrebbe non essere continua. Ma se la serie converge in un punto di frontiera,
la somma della serie è continua se mi avvicino al punto di convergenza lungo il
raggio del disco di convergenza, come enunciato nel seguente teorema.

Teorema 3.44 (lemma di Abel). Sia


+∞
𝑎𝑘 𝑧 𝑘
X
𝑓 (𝑧) =
𝑘=0

la somma di una serie di potenze. Se la serie converge in un punto 𝑧 0 ∈ ℂ, 𝑧 0 ≠ 0,


allora la serie converge per ogni 𝑧 = 𝑡𝑧 0 con 𝑡 ∈ [0 , 1] inoltre la funzione

𝑡 ↦→ 𝑓 (𝑡𝑧)

è continua nel punto 𝑡 = 1.

Dimostrazione. Senza perdita di generalità possiamo supporre che sia 𝑓 (𝑧 0 ) = 0


infatti basterà sostituire il primo termine della serie, 𝑎 0 , con 𝑎 00 = 𝑎 0 − 𝑓 (𝑧 0 ) e
dimostrare il teorema per la serie modificata. Dunque posto

𝑛−1
𝑎 𝑘 𝑧0𝑘
X
𝐴𝑛 =
𝑘=0

si ha che 𝐴𝑛 → 𝑓 (𝑧 0 ) = 0 e, per definizione, 𝐴0 = 0. Utilizzando la formula


(3.4) di somma per parti, preso 𝑡 ∈ [0 , 1) si avrà
𝑛 𝑛 𝑛
𝑎 𝑘 · (𝑡𝑧 0 ) 𝑘 = 𝑎 𝑘 𝑧 0𝑘 · 𝑡 𝑘 = 𝐴𝑛+1 · 𝑡 𝑛+1 + 𝐴 𝑘+1 · (𝑡 𝑘 − 𝑡 𝑘+1 )
X X X
𝑘=0 𝑘=0 𝑘=0
3.10 la serie esponenziale 139

e per 𝑛 → +∞ si ottiene
+∞ +∞
𝐴 𝑘+1 (𝑡 𝑘 − 𝑡 𝑘+1 ) = (1 − 𝑡) 𝐴 𝑘+1 𝑡 𝑘 .
X X
𝑓 (𝑡 · 𝑧 0 ) = 𝑓 (𝑧0 ) · 0 +
𝑘=0 𝑘=0

Visto che 𝐴𝑛 → 0 per ogni 𝜀 > 0 esiste 𝑚 tale che per ogni 𝑘 > 𝑚 si ha |𝐴 𝑘 | ≤ 𝜀.
Dunque, per ogni 𝑡 ∈ [0 , 1), si ha

𝑚−
X1 +∞
|𝐴 𝑘+1 |𝑡 𝑘 + (1 − 𝑡) |𝐴 𝑘+1 |𝑡 𝑘
X
| 𝑓 (𝑡 · 𝑧 0 )| ≤ (1 − 𝑡)
𝑘=0 𝑘=𝑚
𝑚−
X1 𝑡𝑚
≤ (1 − 𝑡) · |𝐴 𝑘+1 | + (1 − 𝑡) · 𝜀 ·
𝑘=0
1−𝑡
𝑚−
X1
≤ (1 − 𝑡) |𝐴 𝑘+1 | + 𝜀.
𝑘=0

Scelto 𝛿 ≤ P𝑚−1 𝜀 se | 1 − 𝑡 | < 𝛿 si avrà dunque


𝑘=0
|𝐴 𝑘+1 |

| 𝑓 (𝑡 · 𝑧0 ) − 𝑓 (𝑧 0 )| = | 𝑓 (𝑡 · 𝑧0 )| < 2𝜀

che significa che 𝑡 ↦→ 𝑓 (𝑡 · 𝑧 0 ) è continua nel punto 𝑡 = 1.

3.10 la serie esponenziale


exp 𝑧
Definiamo la funzione exp : ℂ → ℂ tramite la serie di potenze
+∞ 𝑘
X 𝑧
exp(𝑧) = . (3.10)
𝑘=0
𝑘!

La funzione è definita su tutto ℂ in quanto (grazie al criterio del rapporto) è


facile verificare che il raggio di convergenza di questa serie è 𝑅 = +∞ e dunque
l’insieme di convergenza è tutto ℂ.

I teoremi seguenti ci permetteranno di affermare che la funzione exp(𝑧), definita


per ogni 𝑧 ∈ ℂ è una estensione della funzione 𝑒 𝑥 già definita per 𝑥 ∈ ℝ.

Teorema 3.45 (proprietà dell’esponenziale complesso). Si ha:

1. exp(0) = 1;
2. exp(¯𝑧 ) = exp(𝑧);
3. per ogni 𝑧, 𝑤 ∈ ℂ
exp(𝑧 + 𝑤) = exp(𝑧) · exp(𝑤);
4. per ogni 𝑧 ∈ ℂ si ha exp(𝑧) ≠ 0 e

1
exp(−𝑧) = ;
exp(𝑧)

5. la funzione exp : ℂ → ℂ è continua.


140 3 serie

6. Se 𝑧 𝑛 → 0 allora
exp(𝑧 𝑛 ) − 1
lim = 1. (3.11)
𝑛→+∞ 𝑧𝑛

Dimostrazione. 1. La proprietà exp(0) = 1 si ottiene per verifica diretta


(ricordiamo che 00 = 1 e 0! = 1).
2. La proprietà exp(¯𝑧 ) = exp 𝑧 si ottiene passando al limite la seguente
uguaglianza tra le somme parziali che sfrutta le proprietà del coniugio di
somma e prodotto:
𝑛 𝑛
X 𝑧¯ 𝑘 X 𝑧𝑘
= .
𝑘=0
𝑘! 𝑘=0
𝑘!
3. Consideriamo la matrice infinita

𝑧𝑘 𝑤𝑗
𝑚 𝑘,𝑗 = · .
𝑘! 𝑗!

Allora da un lato
+∞
X (𝑧 + 𝑤)𝑛
exp(𝑧 + 𝑤) =
𝑛=0 𝑛!
+∞ 𝑛
1 X 𝑛!
𝑧 𝑘 · 𝑤 𝑛−𝑘
X
=
𝑛=0 𝑛 ! 𝑘=0 𝑘 !(𝑛 − 𝑘)!
𝑛
+∞ X
X
= 𝑚 𝑘,𝑛−𝑘
𝑛=0 𝑘=0

e dall’altro
+∞ 𝑘 X
X 𝑧 +∞ 𝑤 𝑗 +∞ 𝑘
+∞ X
X 𝑧 𝑤𝑗
exp(𝑧) · exp(𝑤) = =
𝑘=0
𝑘! 𝑗=0
𝑗! 𝑘=0 𝑗=0
𝑘! 𝑗!
+∞ X
X +∞
= 𝑚 𝑘,𝑗 .
𝑘=0 𝑗=0

Il risultato segue dunque dal teorema 3.30.


4. Visto che
1 = exp(0) = exp(𝑧 − 𝑧) = exp(𝑧) · exp(−𝑧)
ricaviamo che exp(𝑧) ≠ 0 e exp(−𝑧) = 1/exp(𝑧).
5. La continuità discende dal risultato generale sulla continuità della somma
di una serie di potenze: teorema 3.43.
6. Direttamente dalla definizione (3.10) si ottiene
+∞ 𝑘
X 𝑧 +∞
X 𝑧𝑘
exp(𝑧) − 1 = =𝑧· .
𝑘=1
𝑘! 𝑘=0
(𝑘 + 1)!

𝑧 P 𝑘
Osserviamo ora che la serie (𝑘+ 1)!
ha raggio di convergenza infinito e
quindi è assolutamente convergente per ogni 𝑧 ∈ ℂ. In particolare la
3.10 la serie esponenziale 141

somma di tale serie è continua e quindi se 𝑧 𝑛 → 0 si ha

exp(𝑧 𝑛 ) − 1 +∞
X 𝑧 𝑛𝑘 +∞
X 0𝑘
lim = lim = = 1.
𝑛→+∞ 𝑧𝑛 𝑛→+∞
𝑘=0
(𝑘 + 1)! 𝑘=0 (𝑘 + 1)!

Teorema 3.46 (collegamento tra le due definizioni di esponenziale). Per ogni


𝑥 ∈ ℝ si ha
exp(𝑥) = 𝑒 𝑥 .

Dimostrazione. Vogliamo applicare il teorema 1.54. Posto 𝑓 (𝑥) = exp(𝑥),


𝑓 : ℝ → ℝ sappiamo, per il teorema precedente, che 𝑓 (𝑥 + 𝑦) = 𝑓 (𝑥) · 𝑓 (𝑦).
Dobbiamo verificare che 𝑓 è crescente. Innanzitutto notiamo che se 𝑥 > 0 la
serie che definisce exp(𝑥) è a termini positivi e il primo termine è 1. Dunque per
ogni 𝑥 > 0 si ha exp(𝑥) > 1. In particolare posto 𝑎 = 𝑓 (1) si ha 𝑎 > 1. Inoltre se
𝑦 > 𝑥 si ha 𝑓 (𝑦 − 𝑥) > 1 e dunque

𝑓 (𝑦) = 𝑓 (𝑥 + 𝑦 − 𝑥) = 𝑓 (𝑥) · 𝑓 (𝑦 − 𝑥) > 𝑓 (𝑥).

La funzione è quindi strettamente crescente. Dunque è un omomorfismo


monotono dal gruppo additivo ℝ al gruppo moltiplicativo (0 , +∞). Fissato
𝑎 = 𝑓 (1) sappiamo, per quanto visto nella sezione 1.18, che c’è una unica
funzione con queste proprietà e dunque deve essere:

𝑓 (𝑥) = 𝑎 𝑥 .

Non ci rimane che dimostrare che 𝑎 = 𝑒 . Ma grazie al teorema 3.45 appena


dimostrato sappiamo che per 𝑥 → 0 si ha

𝑓 (𝑥) − 1
→ 1.
𝑥
D’altra parte sappiamo che 𝑓 (𝑥) = 𝑎 𝑥 e quindi per il limite notevole (corolla-
rio 2.52)
𝑓 (𝑥) − 1 𝑎 𝑥 − 1 𝑒 𝑥 ln 𝑎 − 1
= = · ln 𝑎 → ln 𝑎.
𝑥 𝑥 𝑥 ln 𝑎
Deduciamo quindi che ln 𝑎 = 1 ovvero che 𝑎 = 𝑒 .

Aver distinto le due definizioni di 𝑒 𝑥 (tramite funzione potenza) e di exp(𝑥)


(tramite somma della serie esponenziale) è puramente strumentale. C’è una
unica funzione esponenziale che può essere definita in un modo o nell’altro.
Non ci si fissi quindi con l’identificare le due diverse notazioni 𝑒 𝑥 ed exp(𝑥)
con le due diverse definizioni. Ogni testo avrà una sua definizione di funzione
esponenziale che può essere per certi versi arbitraria salvo poi ritrovare le
proprietà caratterizzanti di tale funzione.

Come già detto d’ora in poi scriveremo, per ogni 𝑧 ∈ ℂ

𝑒 𝑧 = exp 𝑧
142 3 serie

considerando quindi exp 𝑧 l’estensione a tutto il piano complesso della funzione


esponenziale già definita sulla retta reale.

In analogia con il corollario 2.50 si ha il seguente risultato che fornisce anche un


modo alternativo per dimostrare il teorema 3.46.

Teorema 3.47 (limite notevole esponenziale complesso). Per ogni 𝑧 ∈ ℂ risulta


+∞ 𝑘
 𝑧 𝑛 X 𝑧
lim 1+ = .
𝑛→+∞ 𝑛 𝑘=0
𝑘!

Dimostrazione. Utilizzando lo sviluppo del binomio osserviamo che si ha


𝑛 𝑛
𝑧 𝑛 X 𝑛 𝑧𝑘 X 𝑧𝑘 𝑛!
  
1+ = = · 𝑘 .
𝑛 𝑘=0
𝑘 𝑛 𝑘
𝑘=0
𝑘 ! 𝑛 · (𝑛 − 𝑘)!

Posto per ogni 𝑘 ≤ 𝑛

𝑛! 𝑛 · (𝑛 − 1) · . . . · (𝑛 − 𝑘 + 1)
𝑐(𝑛, 𝑘) = =
𝑛𝑘· (𝑛 − 𝑘)! 𝑛𝑘
𝑛 𝑛−1 𝑛−2 𝑛−𝑘+1
= · · ·...·
𝑛 𝑛 𝑛 𝑛
osserviamo che 0 ≤ 𝑐(𝑛, 𝑘) ≤ 1 in quanto prodotto di numeri non negativi
minori o uguali ad 1. Inoltre, fissato 𝑘 , si ha 𝑐(𝑛, 𝑘) → 1 per 𝑛 → +∞ in quanto
𝑛−𝑗
ogni fattore 𝑛 tende a 1 per 𝑛 → +∞ (si noti che a 𝑘 fissato il numero di fattori
𝑘 è fissato).

Sia 𝑧 ∈ ℂ fissato e sia


+∞
X |𝑧| 𝑘
𝑆= .
𝑘=0
𝑘!
Sappiamo che la serie esponenziale è assolutamente convergente per ogni 𝑧 ∈ ℂ
(in quanto il raggio di convergenza è +∞) quindi 𝑆 è un numero reale (finito).
Dunque per il teorema 3.7 (della coda) sappiamo che per ogni 𝜀 > 0 esiste 𝑀
tale che
X+∞
|𝑧| 𝑘
< 𝜀.
𝑘=𝑀+1
𝑘!

Fissato 𝑘 ≤ 𝑀 visto che 𝑐(𝑛, 𝑘) → 1 esiste 𝑁 𝑘 > 𝑀 tale che per ogni 𝑛 > 𝑁 𝑘 si
abbia 1 − 𝑐(𝑛, 𝑘) < 𝜀 (ricordiamo che 𝑐(𝑛, 𝑘) ≤ 1). Prendiamo allora

𝑁 = max {𝑁 𝑘 : 𝑘 ≤ 𝑁 }

cosicchè per ogni 𝑛 > 𝑁 e per ogni 𝑘 ≤ 𝑀 si avrà 0 ≤ 1 − 𝑐(𝑛, 𝑘) < 𝜀. Allora,
per ogni 𝑛 > 𝑁 , possiamo spezzare la somma da 0 a 𝑛 nelle due somme da 0 a
3.10 la serie esponenziale 143

𝑀 e da 𝑀 + 1 a 𝑛 :
 𝑛
𝑛 𝑘 𝑛  𝑘 𝑘 𝑘
𝑧 𝑧  𝑛 X 𝑧 𝑧 𝑧
X  X
− 1+ = − 𝑐(𝑛, 𝑘) = (1 − 𝑐(𝑛, 𝑘))

𝑘=0 𝑘 ! 𝑛 𝑘=0 𝑘 ! 𝑘 ! 𝑘=0 𝑘!

𝑛
X |𝑧| 𝑘
≤ (1 − 𝑐(𝑛, 𝑘))
𝑘=0
𝑘!
𝑀
X |𝑧| 𝑘 X𝑛
|𝑧| 𝑘
= (1 − 𝑐(𝑛, 𝑘)) + (1 − 𝑐(𝑛, 𝑘))
𝑘=0
𝑘! 𝑘=𝑀+1
𝑘!
𝑀
X |𝑧| 𝑘 𝑛
X |𝑧| 𝑘
≤ 𝜀 +
𝑘=0
𝑘! 𝑘=𝑀+1
𝑘!
+∞ 𝑘
X |𝑧|
≤𝜀 +𝜀
𝑘=0
𝑘!
≤ 𝜀𝑆 + 𝜀 = 𝜀(𝑆 + 1).

Visto che 𝜀 > 0 era arbitrario abbiamo verificato tramite la definizione che
𝑛
X 𝑧𝑘  𝑧 𝑛
− 1+ →0
𝑘=0
𝑘! 𝑛

cioè
+∞ 𝑘
 𝑧 𝑛 X 𝑧
lim 1+ = .
𝑛→+∞ 𝑛 𝑘=0
𝑘!

Se 𝑥 ∈ ℝ abbiamo già visto che


 𝑥 𝑛
lim 1+ = 𝑒𝑥
𝑛→+∞ 𝑛
e quindi il teorema precedente ci assicura che

exp(𝑥) = 𝑒 𝑥 .

Teorema 3.48 (approssimazione dell’esponenziale). Se |𝑧| ≤ 1 si ha



𝑛
𝑧 𝑘 |𝑧| 𝑛+1
X
exp(𝑧) − ≤ . (3.12)

𝑘=0
𝑘! 𝑛 · 𝑛!

In particolare ponendo 𝑧 = 1 si trova


𝑛
X 1 1
0<𝑒− ≤ . (3.13)
𝑘=0
𝑘! 𝑛 · 𝑛!

e per 𝑛 = 5 si ottiene
2.716 < 𝑒 < 2.719 (3.14)
144 3 serie

Tabella 3.1: Le prime 1000 cifre decimali 2.7182818284 5904523536 0287471352 6624977572 4709369995
del numero 𝑒 calcolate con il metodo
9574966967 6277240766 3035354759 4571382178 5251664274
utilizzato nella dimostrazione del teore-
ma 3.48. Si veda il codice a pagina 426. 2746639193 2003059921 8174135966 2904357290 0334295260
5956307381 3232862794 3490763233 8298807531 9525101901
1573834187 9307021540 8914993488 4167509244 7614606680
8226480016 8477411853 7423454424 3710753907 7744992069
5517027618 3860626133 1384583000 7520449338 2656029760
6737113200 7093287091 2744374704 7230696977 2093101416
9283681902 5515108657 4637721112 5238978442 5056953696
7707854499 6996794686 4454905987 9316368892 3009879312
7736178215 4249992295 7635148220 8269895193 6680331825
2886939849 6465105820 9392398294 8879332036 2509443117
3012381970 6841614039 7019837679 3206832823 7646480429
5311802328 7825098194 5581530175 6717361332 0698112509
9618188159 3041690351 5988885193 4580727386 6738589422
8792284998 9208680582 5749279610 4841984443 6346324496
8487560233 6248270419 7862320900 2160990235 3043699418
4914631409 3431738143 6405462531 5209618369 0888707016
7683964243 7814059271 4563549061 3031072085 1038375051
0115747704 1718986106 8739696552 1267154688 9570350354

Dimostrazione. La coda della serie esponenziale può essere stimata tramite la


somma di una serie geometrica:

𝑛
1 +∞
|𝑧| 𝑘 X+∞
|𝑧| 𝑛+𝑘+1
X X
exp 𝑧 − ≤ =

𝑘=0
𝑘 ! 𝑘=𝑛+1 𝑘 ! 𝑘=0
(𝑛 + 𝑘 + 1)!
𝑘
+∞
|𝑧| 𝑛+1+𝑘 |𝑧| 𝑛+1 X
+∞

X |𝑧|
≤ =
𝑘=0 (𝑛 + 1) 𝑘+1 · 𝑛 ! 𝑛 ! 𝑘=0 (𝑛 + 1)
|𝑧| 𝑛+1 1 |𝑧| 𝑛+1
= · = .
(𝑛 + 1) · 𝑛 ! 1 − |𝑧| (𝑛 + 1 − |𝑧|) · 𝑛 !
(𝑛+1)

Se |𝑧| ≤ 1 si ottiene quindi la stima (3.12). Se 𝑧 = 1 la serie esponenziale è a


termini positivi e dunque approssima 𝑒 per difetto: si ottiene dunque (3.13).
Per 𝑛 = 5 si ha
5
X 1 1 1 1 1 326
=1+1+ + + + =
𝑘=0
𝑘! 2 6 24 120 120

Dunque da un lato
326
𝑒≥ ≥ 2.716
120
e dall’altro
326 1
𝑒≤ + ≤ 2.717 + 0.002 = 2.719
120 5 · 5!

𝑒∉ℚ

Teorema 3.49 (irrazionalità di 𝑒 ). Il numero 𝑒 è irrazionale.


3.11 le funzioni trigonometriche 145

Dimostrazione. Supponiamo per assurdo che sia 𝑒 = 𝑝/𝑞 con 𝑝 ∈ ℤ e 𝑞 ∈ ℕ .


Possiamo supporre 𝑞 > 1 (non importa che la frazione sia ridotta ai minimi
termini).

Per ogni 𝑛 ∈ ℕ si ha
+∞ 𝑛 +∞
X 𝑛! X 𝑛! X 1
𝑛 !𝑒 = = + 𝑛! .
𝑘=0
𝑘! 𝑘=0
𝑘! 𝑘=𝑛+1
𝑘!

Il primo addendo nella somma precedente è intero in quanto se 𝑘 ≤ 𝑛 il rapporto


𝑛 !/𝑘 ! è intero. Grazie al teorema 3.48 per il secondo addendo se 𝑛 > 1 si ha:
+∞
X 1 1
0 < 𝑛! ≤ < 1.
𝑘=𝑛+1
𝑘! 𝑛

Risulta dunque che per ogni 𝑛 ≥ 2 il numero 𝑛 ! 𝑒 è strettamente compreso tra


due interi consecutivi e quindi non è mai intero. Dunque 𝑒 non può essere
𝑝
razionale perché se fosse 𝑒 = 𝑞 si avrebbe 𝑛 ! 𝑒 ∈ ℤ per ogni 𝑛 > 𝑞 .

3.11 le funzioni trigonometriche

Se 𝑡 ∈ ℝ il numero complesso 𝑒 𝑖𝑡 è unitario (ha modulo uno) in quanto, per le


proprietà dell’esponenziale complesso, si ha
𝑖𝑡 2
𝑒 = 𝑒 𝑖𝑡 · 𝑒 𝑖𝑡 = 𝑒 𝑖𝑡 · 𝑒 −𝑖𝑡 = 𝑒 𝑖𝑡−𝑖𝑡 = 𝑒 0 = 1.

Ci ricordiamo che il prodotto di due numeri unitari 𝑒 𝑖𝑡 , 𝑒 𝑖𝑠 è un numero


unitario che geometricamente identifica un angolo che è la somma degli angoli
identificati dai due fattori. Visto che si ha 𝑒 𝑖𝑡 · 𝑒 𝑖𝑠 = 𝑒 𝑖(𝑡+𝑠) significa che l’angolo
identificato dal numero complesso 𝑒 𝑖(𝑡+𝑠) è la somma degli angoli geometrici
identificati da 𝑒 𝑖𝑡 e da 𝑒 𝑖𝑠 . Essendo inoltre 𝑒 𝑖𝑡 una funzione continua dobbiamo
dedurre che dal punto di vista geometrico il parametro 𝑡 misura l’ampiezza
dell’angolo identificato da 𝑒 𝑖𝑡 sulla circonferenza unitaria. Più precisamente
possiamo osservare che se Δ𝑡 → 0 grazie al limite notevole dell’esponenziale
complesso otteniamo

𝑒 𝑖(𝑡+Δ𝑡) − 𝑒 𝑖𝑡 𝑒 𝑖Δ𝑡 − 1
lim = 𝑖𝑒 𝑖𝑡 lim = 𝑖𝑒 𝑖𝑡 .
Δ𝑡→0 Δ𝑡 𝑡→0 𝑖Δ𝑡

Significa che se interpretiamo 𝑡 ↦→ 𝑒 𝑖𝑡 come la legge oraria di un punto che


si muove sulla circonferenza unitaria, la velocità del punto, al tempo 𝑡 , è
rappresentata dal vettore (numero complesso) 𝑣 = 𝑖𝑒 𝑖𝑡 che non è altro che
il ruotato di 𝑒 𝑖𝑡 di un angolo retto in senso antiorario. Dunque il punto 𝑒 𝑖𝑡
si muove di moto circolare uniforme in senso antiorario sulla circonferenza
unitaria con velocità di modulo unitario. Scopriamo quindi che il punto 𝑒 𝑖𝑡 ha
percorso dal tempo 𝑡 = 0 un arco di lunghezza pari a 𝑡 .

La definizione seguente dunque può essere interpretata geometricamente


dicendo che le funzioni cos 𝑡 e sin 𝑡 sono le coordinate 𝑥 e 𝑦 del punto sulla
circonferenza unitaria 𝑥 2 + 𝑦 2 = 1 che identifica un arco di lunghezza 𝑡 misurato
146 3 serie

in senso antiorario a partire dal punto di coordinate (1 , 0). La lunghezza di un


radiante
arco unitario sulla circonferenza unitaria si chiama radiante e diremo quindi
che 𝑡 è la misura in radianti dell’angolo identificato dal punto 𝑒 𝑖𝑡 di coordinate
(cos 𝑡, sin 𝑡) sul piano complesso.

Definizione 3.50 (funzioni trigonometriche). Per ogni 𝑥 ∈ ℝ si potrà definire


   
cos 𝑥 = Re 𝑒 𝑖𝑥 , sin 𝑥 = Im 𝑒 𝑖𝑥

formula di Eulero cosicché valga la formula di Eulero

𝑒 𝑖𝑥 = cos 𝑥 + 𝑖 sin 𝑥.

Teorema 3.51 (proprietà delle funzioni seno e coseno). Le funzioni sin e cos
soddisfano le seguenti proprietà.

𝑒 𝑖𝑥 + 𝑒 −𝑖𝑥 𝑒 𝑖𝑥 − 𝑒 −𝑖𝑥
1. cos(𝑥) = , sin(𝑥) = ;
2 2𝑖
2. sin(−𝑥) = − sin 𝑥 (la funzione sin è dispari), cos(−𝑥) = cos 𝑥 (la funzione cos
è pari);
3. identità fondamentale della trigonometria:

cos2 𝑥 + sin2 𝑥 = 1;

4. formule di addizione:

cos(𝛼 + 𝛽) = cos 𝛼 cos 𝛽 − sin 𝛼 sin 𝛽,


sin(𝛼 + 𝛽) = sin 𝛼 cos 𝛽 + cos 𝛼 sin 𝛽 ;

5. le funzioni cos : ℝ → ℝ e sin : ℝ → ℝ sono continue;


6. si ha
+∞
𝑥 2𝑘 𝑥2 𝑥4 𝑥6
(−1) 𝑘
X
cos 𝑥 = =1− + − +... (3.15)
𝑘=0
(2 𝑘)! 2 4! 6!
+∞
𝑥 2 𝑘+1 𝑥3 𝑥5 𝑥7
(−1) 𝑘
X
sin 𝑥 = =𝑥− + − +... (3.16)
𝑘=0
(2 𝑘 + 1)! 6 5! 7!

7. vale il seguente limite notevole

sin 𝑥 1 − cos 𝑥 1
lim =1 e lim = .
𝑥→0 𝑥 𝑥→0 𝑥2 2

Dimostrazione. 1. Essendo 𝑒 𝑖𝑥 = 𝑒 𝑖𝑥 = 𝑒 −𝑖𝑥 discende dalla formula (1.21) per


il calcolo di parte reale ed immaginaria.
2. Si verifica direttamente con le formule precedenti.
3. Per 𝑥 ∈ ℝ si ha da un lato

| exp(𝑖𝑥)| 2 = exp(𝑖𝑥) · exp(𝑖𝑥) = exp(𝑖𝑥) · exp(−𝑖𝑥) = exp(0) = 1


3.11 le funzioni trigonometriche 147

𝑦
𝑦 = tg 𝑥

1 𝑦 = sin 𝑥

𝑥 Figura 3.1: I grafici delle funzioni sin,


− 32 𝜋 −𝜋 − 𝜋2 𝜋 𝜋 cos e tg.
2𝜋
3
2
-1
𝑦 = cos 𝑥

(interagisci)

e dall’altro

| exp(𝑖𝑥)| 2 = | cos 𝑥 + 𝑖 sin 𝑥| 2 = cos2 𝑥 + sin2 𝑥.

4. Grazie alla formula che esprime l’esponenziale della somma:

cos(𝛼 + 𝛽) + 𝑖 sin(𝛼 + 𝛽) = exp(𝑖(𝛼 + 𝛽)) = exp(𝑖𝛼) · exp(𝑖𝛽)


= (cos 𝛼 + 𝑖 sin 𝛼) · (cos 𝛽 + 𝑖 sin 𝛽)
= cos 𝛼 cos 𝛽 − sin 𝛼 sin 𝛽
+ 𝑖(sin 𝛼 cos 𝛽 + cos 𝛼 sin 𝛽)

e uguagliando parte reale e parte immaginaria si ottengono le formule di


addizione.
5. Visto che la funzione exp : ℂ → ℂ è continua anche la sua restrizione
all’asse immaginario lo è. E dunque anche parte reale (coseno) e parte
immaginaria (seno) lo sono.
6. Sia 𝑥 ∈ ℝ. Osservando che 𝑖 2 𝑘 = (𝑖 2 ) 𝑘 = (−1) 𝑘 e 𝑖 2 𝑘+1 = 𝑖 · 𝑖 2 𝑘 =
𝑖 · (−1) 𝑘 suddividendo i termini pari e dispari della serie che definisce
l’esponenziale si ha:
+∞ 𝑘 𝑘 +∞ 2 𝑘 2 𝑘 +∞ 2 𝑘+1 2 𝑘+1
X 𝑖 𝑥 X 𝑖 𝑥 X 𝑖 𝑥
exp(𝑖𝑥) = = +
𝑘=0
𝑘! 𝑘=0
(2 𝑘)! 𝑘=0
(2 𝑘 + 1)!
+∞
X 𝑘
(−1) 𝑥 2𝑘 +∞
X (−1) 𝑘 𝑥 2 𝑘+1
= +𝑖 .
𝑘=0
(2 𝑘)! 𝑘=0
(2 𝑘 + 1)!

Osserviamo ora che le due serie che compaiono a destra dell’uguaglianza


sono a termini reali e quindi la loro somma è reale. Dunque queste due
serie coincidono con la parte reale e la parte immaginaria di exp(𝑖𝑥) =
cos 𝑥 + 𝑖 sin 𝑥 .
7. Per la corrispondente proprietà dell’esponenziale sappiamo che per 𝑥 → 0
si ha
𝑒 𝑖𝑥 − 1
→ 1.
𝑖𝑥
Ma
𝑒 𝑖𝑥 − 1 cos 𝑥 − 1 + 𝑖 sin 𝑥 sin 𝑥 1 − cos 𝑥
= = +𝑖 .
𝑖𝑥 𝑖𝑥 𝑥 𝑥
148 3 serie

Scopriamo dunque che

1 − cos 𝑥 sin 𝑥
→0 e → 1.
𝑥 𝑥
D’altra parte si ha

1 − cos 𝑥 (1 − cos 𝑥) · (1 + cos 𝑥) 1 − cos2 𝑥 1


= = ·
𝑥 2 𝑥 (1 + cos 𝑥)
2 𝑥 2 1 + cos 𝑥
2
sin 𝑥

1 1 1
= · →1· = .
𝑥 1 + cos 𝑥 1 + cos 0 2

Definiamo 𝜋 come la misura in radianti dell’angolo piatto, cioè dell’angolo


𝜋 identificato dal numero 𝑒 𝑖𝜋 = −1 sul piano complesso.

𝜏 Teorema 3.52 (definizione di 𝜋). Definiamo 𝜋 come il più piccolo numero reale
positivo in cui si annulla la funzione sin 𝑥 . Si ha 𝜋 ∈ [2.8 , 4]. Le funzioni 𝑒 𝑖𝑥 , sin 𝑥 e
cos 𝑥 sono periodiche di periodo 𝜏 = 2𝜋:

𝑒 𝑖𝑥+2𝜋 = 𝑒 𝑖𝑥 , cos(𝑥 + 2𝜋) = cos 𝑥, sin(𝑥 + 2𝜋) = sin 𝑥.

La funzione sin 𝑥 è strettamente crescente nell’intervallo − 𝜋2 , 𝜋2 e strettamente mentre


 

la funzione cos 𝑥 è strettamente decrescente nell’intervallo [0 , 𝜋]. Si ha infine:

sin(𝜋 + 𝑥) =− sin 𝑥, cos(𝜋 + 𝑥) = − cos 𝑥.

Vale inoltre la celeberrima formula di Eulero:

𝑒 𝑖𝜋 + 1 = 0.

Dimostrazione. Il teorema 3.48 ci permette di approssimare la funzione espo-


nenziale 𝑒 𝑖𝑥 per 𝑥 ∈ [0 , 1]. Ci proponiamo quindi di determinare l’andamento
delle funzioni sin 𝑥 e cos 𝑥 in tale intervallo e definire in tale intervallo il valore
di 𝛼 = 𝜋4 . Tramite tale valore 𝛼 e tramite le formule di addizione riusciremo a
determinare l’andamento delle funzioni sin e cos su tutta la retta reale.

Se 𝑥 ∈ [0 , 1] grazie al teorema 3.48 applicato con 𝑛 = 3 sappiamo che


4
 2 3

𝑒 − 1 + 𝑖𝑥 + (𝑖𝑥) + (𝑖𝑥) ≤ |𝑖𝑥|
𝑖𝑥
2 6 18

sviluppando

cos 𝑥 + 𝑖 sin 𝑥 − 1 − 𝑖𝑥 + 𝑥 + 𝑖 𝑥 ≤ 𝑥 .
2

3 4

2 6 18
3.11 le funzioni trigonometriche 149

Il valore assoluto delle parti reale e immaginaria di un numero complesso sono


minori del modulo del numero complesso. Dunque si ottiene:

cos 𝑥 − 1 + 𝑥 ≤ 𝑥 sin 𝑥 − 𝑥 + 𝑥 ≤ 𝑥 .

2 4

3 4

e (3.17)
2 18 6 18

Per la funzione sin 𝑥 si ha dunque

𝑥3 𝑥4 𝑥3 𝑥4
𝑥− − ≤ sin 𝑥 ≤ 𝑥 − +
6 18 6 18
e sapendo che 0 < 𝑥 < 1 possiamo affermare che

𝑥3 𝑥4 𝑥 𝑥 7
𝑥− − ≥𝑥− − = 𝑥
6 18 6 18 9
e
𝑥3 𝑥4 𝑥3 𝑥3
𝑥− + ≤𝑥− + ≤ 𝑥.
6 18 6 18
Dunque se 𝑥 ∈ [0 , 1] si ha
7
𝑥 ≤ sin 𝑥 ≤ 𝑥. (3.18)
9
Per il coseno da un lato osserviamo che da (3.17) si ottiene, se 𝑥 ∈ [0 , 1]:

𝑥2 𝑥4 1 1 4
cos 𝑥 ≥ 1 − − ≥ 1− − = > 0.
2 18 2 18 9
Dall’altro lato si ha

𝑥2 𝑥4 𝑥2 𝑥2 4
cos 𝑥 ≤ 1 − + =1− + ≤ 1 − 𝑥2 .
2 18 2 18 9

Vogliamo ora dimostrare che la funzione cos 𝑥 è strettamente decrescente


sull’intervallo [0 , 1]. Infatti se 𝑥 ∈ [0 , 1] e 𝑡 ∈ (0 , 1] si ha

cos(𝑥 + 𝑡) = cos 𝑥 cos 𝑡 − sin 𝑥 sin 𝑡 ≤ cos 𝑥 cos 𝑡 < cos 𝑥

in quanto sin 𝑥 ≥ 0, sin 𝑡 ≥ 0 e cos 𝑡 < 1 − 59 𝑡 2 < 1 se 𝑡 > 0. Dunque la


funzione cos 𝑥 è strettamente decrescente su [0 , 1]. Visto che cos2 𝑥 + sin2 𝑥 = 1
deduciamo che la funzione sin2 𝑥 è strettamente crescente in [0 , 1]. Inoltre sin 𝑥
è positiva su tale intervallo e dunque anche sin 𝑥 è strettamente crescente in
[0 , 1].


Vogliamo ora dimostrare che esiste 𝛼 ∈ [0 , 1] tale per cui sin 𝛼 = 22 . Visto che
sin 𝑥 è una funzione continua, e sin 0 = 0, per √
utilizzare il teorema 2.80 dei
2
valori intermedi basterà verificare che sin 1 > 2 . E infatti si ha:

7 2
sin 1 ≥ > .
9 2
√ √
2 2
Dunque esiste un unico 𝛼 ∈ [0 , 1] tale che sin 𝛼 = 2 . Allora anche cos 𝛼 = 2
150 3 serie

(in quanto sin2 + cos2 = 1) e quindi


√ 2
2 𝑖𝛼 2 1
𝑒 = (1 + 𝑖) = (1 + 2 𝑖 − 1) = 𝑖.
2 2

Dunque 𝛼 è la misura in radianti di metà angolo retto.

Se poniamo 𝜋 = 4 𝛼 scopriamo dunque che


 2
𝑒 𝑖𝜋 = 𝑒 2𝑖𝛼 = 𝑖 2 = −1

da cui sin 𝜋 = 0 e cos 𝜋 = −1. Analogamente da 𝑒 2𝑖𝛼 = 𝑖 troviamo che sin 𝜋2 = 1


cos 𝜋2 = 0.

Dalla stima (3.18) si ottiene √


7 2
𝛼≤ ≤𝛼
9 2
da cui 𝜋 = 4 𝛼 ∈ [2.8 , 4].

Abbiamo verificato che sull’intervallo 0 , 𝜋4 la funzione sin 𝑥 è strettamente


 

crescente mentre cos 𝑥 è strettamente decrescente. Dalle formule di addizione


sin 𝜋2 − 𝑥 = cos 𝑥 e cos 𝜋2 − 𝑥 = sin 𝑥 . Dunque
 
possiamo quindi dedurre 𝜋 che
anche sull’intervallo 4 , 𝜋2 la funzione sin 𝑥 è crescente e cos 𝑥 è decrescente.


Ancora, tramite le formula di addizione troviamo che sin(𝜋 − 𝑥) = sin 𝑥 e


cos(𝜋 − 𝑥) = − cos 𝑥 da cui possiamo dedurre che sia la funzione
 𝜋 sin 𝑥 che la
funzione cos 𝑥 sono strettamente decrescenti sull’intervallo 2 , 𝜋 . Possiamo
dunque affermare che sin 𝑥 > 0 se 0 < 𝑥 < 𝜋 e dunque 𝜋 è il più piccolo reale
positivo in cui la funzione sin si annulla.

Visto che sin(𝜋 + 𝑥) = − sin 𝑥 e cos(𝜋 + 𝑥) = − cos 𝑥 possiamo stabilire l’an-


damento delle funzioni sin e cos anche sull’intervallo [𝜋, 2𝜋]. Infine essendo
𝑒 2𝑖𝜋 = 1 si osserva che la funzione 𝑒 2𝑖𝑥 e di conseguenza le funzioni sin 𝑥 e cos 𝑥
sono periodiche di periodo 2𝜋.

Esercizio 3.53. Utilizzando il teorema 3.48 dimostrare che

lim 𝑛 sin(2𝜋𝑒 𝑛 !) = 2𝜋.


𝑛→+∞

3.12 funzioni trigonometriche inverse

La funzione sin : [−𝜋/2 , 𝜋/2] → [−1 , 1] risulta essere strettamente crescente.


Inoltre essendo una funzione continua e visto che sin(−𝜋/2) = −1 e sin(𝜋/2) = 1
per il teorema dei valori intermedi la funzione assume tutti i valori in [−1 , 1].
Dunque restringendo il dominio all’intervallo [−𝜋/2 , 𝜋/2] e il codominio
all’intervallo [−1 , 1] la funzione risulta invertibile. La funzione inversa

arcsin : [−1 , 1] → [−𝜋/2 , 𝜋/2]


3.12 funzioni trigonometriche inverse 151

si chiama arco seno. Per definizione di funzione inversa si ha

arcsin(sin 𝑥) = 𝑥, ∀𝑥 ∈ [−𝜋/2 , 𝜋/2]

e
sin(arcsin 𝑥) = 𝑥, ∀𝑥 ∈ [−1 , 1].

La funzione cos : [0 , 𝜋] → [−1 , 1] risulta essere strettamente decrescente e,


analogamente a quanto visto per la funzione sin possiamo verificare che ristretta
a tali intervalli è una funzione invertibile. La funzione inversa

arccos : [−1 , 1] → [0 , 𝜋]

si chiama arco coseno. Per definizione si ha

arccos(cos 𝑥) = 𝑥, ∀𝑥 ∈ [0 , 𝜋]

e
cos(arccos 𝑥) = 𝑥, ∀𝑥 ∈ [−1, 1].

tg 𝑥
La funzione
sin 𝑥
tg 𝑥 =
cos 𝑥
è definita quando cos 𝑥 ≠ 0 ovvero:
n𝜋 o
tg : ℝ \ + 𝑘𝜋 : 𝑘 ∈ ℤ → ℝ.
2
Se restringiamo la funzione all’intervallo (−𝜋/2 , 𝜋/2) possiamo facilmente
osservare che la funzione tg : (−𝜋/2 , 𝜋/2) → ℝ è strettamente crescente. Inoltre
se 𝑎 𝑛 → 𝜋/2, 𝑎 𝑛 < 𝜋/2 si ha cos(𝑎 𝑛 ) → 0 (per continuità del coseno) e
sin(𝑎 𝑛 ) → 1 dunque tg 𝑎 𝑛 → +∞. Analogamente per 𝑎 𝑛 → −𝜋/2 si trova
tg 𝑎 𝑛 → −∞. Dunque per il teorema dei valori intermedi possiamo affermare
che la funzione tg : (−𝜋/2 , 𝜋/2) → ℝ è suriettiva. E’ quindi invertibile e la
funzione inversa
arctg : ℝ → (−𝜋/2 , 𝜋/2)
si chiama arco tangente. Per definizione si ha

arctg tg 𝑥 = 𝑥, ∀𝑥 ∈ (−𝜋/2 , 𝜋/2)

e
tg arctg 𝑥 = 𝑥, ∀𝑥 ∈ ℝ.

Grazie al teorema 2.8visto che quest funzioni sono monotone e bigettive possia-
mo affermare che le funzioni arcsin, arccos e arctg sono funzioni continue.

Esercizio 3.54. Dimostrare che per ogni 𝑥 > 0 si ha

1 𝜋
arctg = − arctg 𝑥.
𝑥 2
152 3 serie

Esercizio 3.55. La serie


+∞
X sin 𝑘
𝑘=1
𝑘
è convergente.

Dimostrazione. Applichiamo il teorema 3.32. Posto 𝑎 𝑘 = sin 𝑘 e 𝐵 𝑘 = 1/𝑘 si ha

𝑛−1 𝑛−1
𝑒 𝑖𝑘 .
X X
𝐴𝑛 = sin 𝑘 = Im
𝑘=0 𝑘=0

Osserviamo allora che 𝑒 𝑖𝑘 = (𝑒 𝑖 ) 𝑘 e dunque 𝐴𝑛 è la parte immaginaria della


somma di una serie geometrica. Si può quindi calcolare esplicitamente

1 − (𝑒 𝑖 )𝑛
𝐴𝑛 = Im
1 − 𝑒𝑖
da cui
1 − 𝑒 𝑖𝑛 1 + 𝑒 𝑖𝑛

2
|𝐴𝑛 | ≤

𝑖
≤ =
1−𝑒 𝑖
1 − 𝑒 1 − 𝑒 𝑖

e dunque 𝐴𝑛 è limitata.

D’altro canto posto 𝐵 𝑘 = 1/𝑘 è chiaro che 𝐵 𝑘 è decrescente e infinitesima.

Esercizio 3.56. Determinare il carattere delle seguenti serie


   
X 1 1 X 1
− sin , sin 𝜋𝑛 +
𝑛 𝑛 𝑛 𝑛 𝑛

3.13 funzioni iperboliche


sinh, cosh

Definizione 3.57 (funzioni iperboliche). Le funzioni coseno iperbolico e seno


iperbolico sono definite, per ogni 𝑥 ∈ ℝ, come segue:

𝑒 𝑥 + 𝑒 −𝑥 𝑒 𝑥 − 𝑒 −𝑥
cosh 𝑥 = , sinh 𝑥 = . (3.19)
2 2

Teorema 3.58 (proprietà delle funzioni iperboliche). Valgono le seguenti proprietà.

1. la funzione sinh è dispari, cosh è pari:

sinh(−𝑥) = − sinh(𝑥), cosh(−𝑥) = cosh(𝑥);

2. i punti del piano con coordinate (cosh 𝑥, sinh 𝑥) per 𝑥 ∈ ℝ sono disposti su un
ramo di iperbole in quanto vale:

cosh2 𝑥 − sinh2 𝑥 = 1;
3.13 funzioni iperboliche 153

𝑦 = sinh 𝑥
𝑦 = cosh 𝑥 𝑦 = tgh 𝑥
1

𝑥 Figura 3.2: I grafici delle funzioni sinh,


cosh e tgh.

−1

(interagisci)

3. formule di addizione:

cosh(𝛼 + 𝛽) = cosh 𝛼 cosh 𝛽 + sinh 𝛼 sinh 𝛽,


sinh(𝛼 + 𝛽) = sinh 𝛼 cosh 𝛽 + cosh 𝛼 sinh 𝛽 ;

4. si ha
+∞
X 𝑥 2𝑘 𝑥2 𝑥4 𝑥6
cosh 𝑥 = =1+ + + +...
𝑘=0
(2 𝑘)! 2 4! 6!
+∞
X 𝑥 2 𝑘+1 𝑥3 𝑥5 𝑥7
sinh 𝑥 = =𝑥+ + + +...
𝑘=0
(2 𝑘 + 1)! 6 5! 7!

5. la funzione sinh è strettamente crescente su tutto ℝ, la funzione cosh è stretta-


mente crescente sull’intervallo [0 , +∞) e strettamente decrescente nell’intervallo
(−∞, 0];
6. per 𝑥 → +∞ si ha sinh 𝑥 → +∞, cosh 𝑥 → +∞, per 𝑥 → −∞ si ha
sinh 𝑥 → −∞, cosh 𝑥 → +∞.

Dimostrazione. I primi tre punti si dimostrano facilmente per verifica diretta,


utilizzando la definizione (3.19).
Gli sviluppi in serie si ottengono anch’essi sostituendo gli sviluppi dell’espo-
nenziale nella definizione. Nel cosh i termini di grado dispari si cancellano, nel
sinh si cancellano i termini di grado pari.
Per quanto riguarda la monotonia si osserva che se 𝑥 ≥ 0 ogni addendo delle
due serie esposte nel punto 4 è strettamente crescente (in quanto i coefficienti
sono tutti positivi) e dunque le somme delle serie, cioè la funzione cosh e la
funzione sinh sono strettamente crescenti sull’intervallo [0 , +∞). La funzione
sinh, essendo dispari, risulta inoltre crescente anche sull’intervallo (−∞, 0] e
quindi è crescente su tutto ℝ.
Per l’ultima proprietà basterà usare la definizione (3.19) e ricordare che (teore-
ma 2.58) se 𝑥 → +∞ allora 𝑒 𝑥 → +∞ ed 𝑒 −𝑥 = 𝑒1𝑥 → 0.

Osserviamo che cosh 0 = 1 e, per le proprietà di monotonia viste nel teorema


precedente si ha cosh 𝑥 ≥ cosh 0 = 1 > 0. Dunque cosh 𝑥 non si annulla mai e
si può definire per ogni 𝑥 ∈ ℝ la tangente iperbolica
tgh
154 3 serie

sinh 𝑥
tgh 𝑥 = .
cosh 𝑥

La funzione sinh : ℝ → ℝ è iniettiva in quanto strettamente crescente ed è


surgettiva in quanto è continua e quindi assume tutti i valori compresi tra
lim𝑥→+∞ sinh(𝑥) = +∞ e lim𝑥→−∞ sinh(𝑥) = −∞. Dunque sinh : ℝ → ℝ è
invertibile e la funzione inversa si chiama settore di seno iperbolico e si denota con
settsinh
settsinh : ℝ → ℝ.
Analogamente la funzione ristretta cosh : [0 , +∞) → [1 , +∞) è iniettiva in
quanto strettamente crescente ed è surgettiva in quanto è continua e assume su
[0 , +∞) tutti i valori compresi tra cosh(0) = 1 e lim𝑥→+∞ cosh 𝑥 = +∞. Dunque
la funzione cosh 𝑥 ristretta a [0 , +∞) → [1 , +∞) è invertibile e la funzione
settcosh
inversa si chiama settore di coseno iperbolico

settcosh : [1 , +∞) → [0 , +∞).

La funzione tgh 𝑥 è strettamente crescente su tutto ℝ e assume tutti i valori


strettamente compresi tra −1 e 1. La funzione inversa si chiama setttgh.

Esercizio 3.59. Fissato 𝑦 ∈ ℝ si risolva l’equazione

𝑒 𝑥 − 𝑒 −𝑥
=𝑦
2
riconducendola ad una equazione di secondo grado nella variabile 𝑡 = 𝑒 𝑥 . Si dimostri
quindi che vale  √ 
settsinh 𝑥 = ln 𝑥 + 𝑥 2 + 1 .

In modo analogo si dimostri che vale


 √ 
settcosh 𝑥 = ln 𝑥 + 𝑥2 − 1

e r
1+𝑥
setttgh 𝑥 = ln .
1−𝑥

3.14 esercizi

Esercizio 3.60. Determinare il carattere delle seguenti serie

X 𝑛2 − 𝑛3 X (𝑛 !)2
,
𝑛 3𝑛 𝑛 (2𝑛)!

X (−1)𝑛 X 𝑛 − 10
,
𝑛 ln |𝑛 7 − 10𝑛 5 + 3 | 𝑛 𝑛 2 + 10
i numeri complessi 4
Nel capitolo precedente abbiamo introdotto l’esponenziale complesso ed abbia-
mo osservato che la funzione 𝑓 : ℝ → ℂ definita da 𝑓 (𝑡) = 𝑒 𝑖𝑡 ha valori sulla
circonferenza unitaria in quanto 𝑒 𝑖𝑡 = 1. Tramite la definizione 3.50 abbiamo
introdotto le funzioni seno e coseno in modo che risulti 𝑓 (𝑡) = cos 𝑡 + 𝑖 sin 𝑡 .
Sappiamo che 𝑓 (0) = 𝑒 0 = 1 e, per come abbiamo definito 𝜋, sappiamo che
𝑓 (𝜋/2) = 𝑖 .

4.1 rappresentazione polare dei numeri complessi

I numeri complessi di modulo uno vengono chiamati unitari. Geometricamente complessi unitari
i numeri complessi unitari sono i punti della circonferenza unitaria centrata
nell’origine del piano complesso. Se 𝑧 = 𝑥 + 𝑖 𝑦 è unitario si ha 𝑥 2 + 𝑦 2 = 1. I
prodotti e i reciproci dei numeri complessi unitari sono anch’essi unitari, risulta
quindi che tali numeri formano un sottogruppo moltiplicativo del gruppo dei Un gruppo è un insieme su cui è definita
una operazione (spesso denotata con il
numeri complessi. simbolo della moltiplicazione) che sia
associativa, che abbia elemento neutro e
Ogni numero complesso 𝑧 potrà essere scritto nella forma tale che ogni elemento abbia un inverso.

𝑧 =𝜌·𝑢

con 𝜌 ∈ ℝ, 𝜌 > 0 e 𝑢 ∈ ℂ unitario. Basta infatti definire 𝜌 = |𝑧| e 𝑢 = 𝑧/|𝑧| (se


𝑧 ≠ 0, altrimenti si potrà scegliere arbitrariamente 𝑢 = 1).

Teorema 4.1 (argomento). Sia 𝑧 ∈ ℂ un numero complesso non nullo. Allora esiste
un unico 𝜃 ∈ [0 , 2𝜋) tale che
𝑧 = |𝑧|𝑒 𝑖𝜃 .
Denoteremo tale valore di 𝜃 come l’argomento (o fase) di 𝑧 e scriveremo argomento

𝜃 = arg 𝑧.

Se 𝑧 = 0 porremo per convenzione arg 𝑧 = 0.

Dimostrazione. Sia 𝑧 ∈ ℂ, 𝑧 ≠ 0 e poniamo 𝑢 = 𝑧/|𝑧| . Posto 𝑢 = 𝑥 + 𝑖 𝑦 con


𝑥, 𝑦 ∈ ℝ si ha |𝑢| 2 = 𝑥 2 + 𝑦 2 = 1.

Se 𝑦 ≥ 0 se vogliamo che 𝑦 = sin 𝜃 con 𝜃 ∈ [0 , 2𝜋) dovrà necessariamente essere


𝜃 ∈ [0 , 𝜋] (altrimenti si avrebbe sin 𝜃 < 0). E se vogliamo che sia 𝑥 = cos 𝜃
basterà (e si dovrà) scegliere 𝜃 = arccos 𝑥 . Visto che sin2 𝜃 + cos2 𝜃 = 1 = 𝑥 2 + 𝑦 2
sapendo che cos 𝜃 = 𝑥 si avrà sin2 𝜃 = 𝑦 2 cioè | sin 𝜃| = |𝑦| . Ma visto che 𝑦 ≥ 0 e
sin 𝜃 ≥ 0 avremo, come voluto, sin 𝜃 = 𝑦 . Se 𝑦 < 0 poniamo 𝜃 = 2𝜋 − arccos 𝑥
cosicché si avrà 𝜃 ∈ (𝜋, 2𝜋) e, come prima (verificare!), 𝑥 = cos 𝜃 , 𝑦 = sin 𝜃 .

In ogni caso per ogni 𝑧 ≠ 0 abbiamo quindi trovato l’unico 𝜃 ∈ [0 , 2𝜋) tale che

𝑢 = 𝑥 + 𝑖 𝑦 = cos 𝜃 + 𝑖 sin 𝜃 = 𝑒 𝑖𝜃 .
156 4 i numeri complessi

da cui
𝑧 = |𝑧| · 𝑒 𝑖𝜃 .

Per ogni 𝑧 ∈ ℂ posto


𝜌 = |𝑧|, 𝜃 = arg 𝑧
si avrà quindi la rappresentazione esponenziale o polare

𝑧 = 𝜌𝑒 𝑖𝜃 = 𝜌 · (cos 𝜃 + 𝑖 sin 𝜃).

Se 𝑧 = 𝑥 + 𝑖 𝑦 è la rappresentazione cartesiana, si avranno le seguenti formule di


conversione: ( (
𝑥 = 𝜌 cos 𝜃 𝜌 = 𝑥2 + 𝑦2
p

𝑦 = 𝜌 sin 𝜃 𝜃 = arg 𝑧
con
𝜋 𝑥



 2 − arctg 𝑦 se 𝑦 > 0,
 3 𝜋 − arctg 𝑥 se 𝑦 < 0,


𝑦

arg 𝑧 = 2


 𝜋 se 𝑦 = 0 e 𝑥 < 0,
se 𝑦 = 0 e 𝑥 ≥ 0.

0

4.2 interpretazione geometrica

Vogliamo ora interpretare geometricamente 𝜃 = arg 𝑧 come la misura di un


angolo. Per fare ciò dobbiamo però capire cosa si intende per angolo e come si
misura un angolo. In questa sezione ragioneremo in maniera intuitiva in quanto
le proprietà formali analitiche delle operazioni sui numeri complessi sono
già state determinate e quello che vogliamo fare è darne una interpretazione
geometrica. Daremo quindi per scontate le proprietà geometriche del piano
euclideo.

Un angolo, geometricamente, è la regione piana delimitata da due semirette


uscenti da uno stesso punto. Le due semirette si chiamano lati dell’angolo e il
punto in comune si chiama vertice.

Due angoli 𝛼, 𝛽 si dicono congruenti se è possibile traslare e ruotare uno dei


due angoli (diciamo 𝛼 ) in modo che si sovrapponga all’altro. In particolare sarà
sempre possibile trovare una traslazione che manda il vertice dell’angolo 𝛼 sul
vertice dell’angolo 𝛽 e sarà possibile trovare una rotazione che fa coincidere uno
dei due lati in modo che uno dei due angoli copra interamente l’altro. Sia 𝛼0 la
roto-traslazione di 𝛼 così individuata. Se 𝛼0 = 𝛽 diremo che i due angoli sono
congruenti, altrimenti se 𝛼0 ⊇ 𝛽 diremo che 𝛼 è maggiore di 𝛽 e se invece 𝛼0 ⊆ 𝛽
diremo che 𝛼 è minore di 𝛽 . Con un procedimento simile è in genere possibile
sommare due angoli: si sposta uno dei due tramite una roto-traslazione in modo
da far coincidere il vertice e un lato dei due angoli e in modo che i due angoli
non si sovrappongano (questo non è sempre possibile perché se gli angoli sono
troppo grandi si sovrapporranno sempre). La loro unione sarà un angolo che
chiamiamo somma degli angoli dati.
4.2 interpretazione geometrica 157

Misurare un angolo significa associare ad ogni angolo un numero (reale positivo)


in modo che si abbiano le seguenti proprietà: angoli congruenti hanno la stessa
misura, angoli maggiori hanno misure maggiori (proprietà di monotonia) e
la misura della somma di due angoli è la somma delle misure (additività). Si
può intuire che una volta scelto quale angolo ha misura 1 (l’unità di misura) la
misura di ogni altro angolo sarà univocamente determinata da queste proprietà.
Infatti la misura dei multipli e dei sottomultipli dell’unità è determinata dalla
additività della misura e la misura degli angoli incommensurabili si potrà
ottenere per approssimazione sfruttando la monotonia.

Se ora identifichiamo il piano euclideo con il piano complesso ogni angolo potrà
essere traslato e ruotato in modo che uno dei due lati vada a coincidere con la
semiretta dei reali positivi e in modo che l’angolo si estenda al di sopra di tale
semiretta e sia delimitato da una seconda semiretta passante per un punto 𝑢
a distanza 1 dall’origine ovvero con |𝑢| = 1. Vogliamo giustificare il fatto che
𝜃 = arg 𝑢 può essere scelto come misura dell’angolo. Studiando la monotonia
delle funzioni cos e sin si può verificare facilmente che 𝜃 è crescente con l’angolo.
Più rilevante è chiedersi se 𝜃 è additivo. Siano 𝑢, 𝑣 ∈ ℂ due numeri complessi
unitari che rappresentino due diversi angoli. Sia 𝜃 = arg 𝑢 e 𝜑 = arg 𝑣 da cui
𝑢 = 𝑒 𝑖𝜃 e 𝑣 = 𝑒 𝑖𝜑 . Consideriamo la trasformazione 𝑅 𝜃 (𝑧) = 𝑒 𝑖𝜃 · 𝑧 . Si nota
che 𝑅 𝜃 è una trasformazione rigida del piano ovvero una trasformazione che
mantiene la distanza tra i punti (una isometria) in quanto essendo 𝑒 𝑖𝜃 = 1 si
ha
|𝑅 𝜃 (𝑧) − 𝑅 𝜃 (𝑤)| = 𝑒 𝑖𝜃 𝑧 − 𝑒 𝑖𝜃 𝑤 = 𝑒 𝑖𝜃 · |𝑧 − 𝑤| = |𝑧 − 𝑤|.

Inoltre 𝑅 𝜃 (0) = 0 e 𝑅 𝜃 (1) = 𝑢 significa che 𝑅 𝜃 non è altro che una rotazione
che tiene fissa l’origine e manda la semiretta dei reali positivi nella semiretta
uscente da 0 e passante per 𝑢 = 𝑒 𝑖𝜃 . Dunque 𝑅 𝜃 è la trasformazione che rende
l’angolo identificato dal numero complesso unitario 𝑣 in un angolo adiacente
a quello identificato da 𝑢 . Quindi la somma (geometrica) degli angoli 𝑢 e 𝑣 è
identificata dal numero complesso unitario 𝑅 𝜃 (𝑣) = 𝑢 · 𝑣 . Ma, per la proprietà
additiva dell’esponenziale complesso,

𝑢 · 𝑣 = 𝑒 𝑖𝜃 · 𝑒 𝑖𝜑 = 𝑒 𝑖(𝜃+𝜑)

e dunque se 𝜃 + 𝜑 < 2𝜋 si ha

arg(𝑢 · 𝑣) = 𝜃 + 𝜑 = arg(𝑢) + arg(𝑣)

che corrisponde alla proprietà additiva della misura degli angoli.


radiante
L’angolo unitario identificato dal numero complesso 𝑒 𝑖 si chiama radiante ed
è l’unità di misura che abbiamo scelto per gli angoli. L’angolo retto sarà
𝜋
identificato dal numero complesso 𝑖 = 𝑒 𝑖 2 e avrà una misura pari a 𝜋2 radianti.
L’angolo piatto sarà identificato dal numero complesso −1 = 𝑒 𝑖𝜋 e avrà una
misura di 𝜋 radianti. Geometricamente la misura degli angoli può essere data
dalla lunghezza dell’arco di raggio unitario identificato dall’angolo. Dunque
la definizione geometrica di 𝜋 (rapporto tra lunghezza della circonferenza e
diametro) corrisponde a richiedere che la semicirconferenza unitaria abbia
misura 𝜋 radianti. Questo significa che la definizione analitica di 𝜋 che abbiamo
dato (teorema 3.52) si riconcilia con la definizione geometrica.
158 4 i numeri complessi

Possiamo riconciliare definizione analitica e geometrica di 𝜋 anche con delle


osservazioni dirette.

Osservazione 4.2 (lunghezza della circonferenza tramite moto circolare unifor-


me). Si considera la curva 𝑡 ↦→ 𝑒 𝑖𝑡 come l’equazione oraria del moto di un punto che
si muove nel piano complesso. Visto che 𝑒 𝑖𝑡 = 1 tale punto si muove sulla circonfe-

renza unitaria. Possiamo determinare la velocità istantanea del punto considerando la


variazione della posizione:

𝑒 𝑖(𝑡+Δ𝑡) − 𝑒 𝑖𝑡 𝑒 𝑖Δ𝑡 − 1
= 𝑒 𝑖𝑡 · .
Δ𝑡 Δ𝑡
Prendendo un incremento temporale Δ𝑡 = 𝜀/𝑛 con 𝑛 → +∞ si osserva che il modulo
della velocità è dato da
𝑖𝑡 𝑒 𝑖 𝑛𝜀 − 1

𝑣 = lim 𝑒 · 𝜀

𝑛→+∞
𝑛

e visto che 𝑒 𝑖𝑡 = 1 ricordando il limite notevole (3.11) (teorema 3.45) si ottiene che la

velocità è pari ad 1. Significa che il punto 𝑒 𝑖𝑡 si muove sulla circonferenza unitaria


con velocità unitaria e quindi la lunghezza della curva percorsa risulta numericamente
uguale al tempo trascorso. Visto che per 𝑡 che varia da 0 a 2𝜋 il punto compie un giro
completo attorno alla circonferenza unitaria significa che la lunghezza della circonferenza
unitaria è 2𝜋.

Osservazione 4.3 (lunghezza della circonferenza tramite approssimazione con


poligonali). Possiamo calcolare la lunghezza della circonferenza unitaria come il limite
dei perimetri dei poligoni di 𝑁 lati iscritti nella circonferenza. Fissato 𝑁 consideriamo
per 𝑘 = 0 , . . . , 𝑁 i punti
2𝜋𝑘
𝑢𝑘 = 𝑒 𝑖 𝑁 .
Osserviamo che
2𝜋(𝑘+1)
2𝜋𝑘
2𝜋𝑘 2𝜋 2𝜋
|𝑢 𝑘+1 − 𝑢 𝑘 | = 𝑒 𝑖 − 𝑒𝑖
𝑖 𝑁 𝑖𝑁
𝑁 𝑁 = 𝑒 · 𝑒 − 1 = 𝑒 𝑖 𝑁 − 1

cioè i punti 𝑢 𝑘 sono equidistanti tra loro. Si noti che 𝑢0 = 𝑢𝑁 = 1 e quindi i


punti 𝑢1 , . . . , 𝑢𝑁 sono gli 𝑁 vertici di un poligono regolare di 𝑁 lati iscritto nella
circonferenza unitaria. Il perimetro del poligono è quindi dato da
2𝜋

𝑃 𝑁 = 𝑁 · 𝑒 𝑖 𝑁 − 1

e per 𝑁 → +∞ si ha, sempre utilizzando il limite notevole (3.11)


2𝜋
𝑖𝑁
𝑒 − 1

𝑃𝑁 = 2𝜋 · 2𝜋 → 2𝜋.

𝑁

Osservazione 4.4 (matrici di rotazione). Fissato 𝜃 ∈ ℝ consideriamo, come prima,


la funzione 𝑅 𝜃 : ℂ → ℂ, 𝑅 𝜃 (𝑧) = 𝑒 𝑖𝜃 · 𝑧 . Un altro modo per convincerci che 𝑅 𝜃
rappresenta una rotazione di 𝜃 radianti è quello di guardare la matrice associata. Se
identifichiamo il piano complesso ℂ con ℝ2 la trasformazione 𝑅 𝜃 può essere rappresentata
da una matrice 𝑀 𝛼 che ha come colonne le coordinate di 𝑅 𝜃 (1) = 𝑒 𝑖𝜃 = cos 𝜃 + 𝑖 sin 𝜃
4.2 interpretazione geometrica 159

e le coordinate di 𝑅 𝜃 (𝑖) = 𝑒 𝑖𝜃 · 𝑖 = − sin 𝜃 + 𝑖 cos 𝜃 :

cos 𝛼 − sin 𝛼
 
𝑀𝛼 = .
sin 𝛼 cos 𝛼

Osservazione 4.5 (interpretazione geometrica del prodotto di numeri complessi).


Possiamo ora dare una interpretazione geometrica del prodotto tra due numeri complessi
𝑧, 𝑤 ∈ ℂ. Se 𝑧 ≠ 0 possiamo scrivere 𝑧 = |𝑧| · 𝑒 𝑖𝜃 con 𝜃 = arg 𝑧 , cosicché:

𝑧 · 𝑤 = |𝑧| · 𝑅 𝜃 (𝑤).

Si capisce quindi che il numero complesso 𝑧 · 𝑤 si ottiene ruotando 𝑤 dell’angolo


identificato da 𝑧 con l’asse dei reali positivi, e quindi riscalando il punto ottenuto di un
fattore |𝑧| . Se poniamo 𝜓 = arg 𝑤 possiamo interpretare la moltiplicazione complessa
in coordinate polari:

𝑧 · 𝑤 = |𝑧|𝑒 𝑖𝜃 · |𝑤|𝑒 𝑖𝜓 = |𝑧| · |𝑤| · 𝑒 𝑖(𝜃+𝜓) .

Dunque il prodotto di due numeri complessi è quel numero complesso che ha come
modulo il prodotto dei moduli e come argomento la somma (a meno di multipli di 2𝜋)
degli argomenti.

Osservazione 4.6 (interpretazione geometrica dell’esponenziale complesso).


Ricordiamo che (teorema 3.47)
𝑛
𝑖𝑦

𝑖𝑦
𝑒 = lim 1+ .
𝑛→+∞ 𝑛

Possiamo osservare che se 𝑦 ∈ ℝ i punti (1 + 𝑖 𝑦/𝑛) 𝑘 per 𝑘 = 1 . . . 𝑛 sono i vertici di


una spezzata formata da 𝑛 segmenti di lunghezza
  𝑘+1   𝑘  𝑘  
𝑖 𝑦 𝑖 𝑦 𝑖 𝑦 𝑖 𝑦
1+ − 1+ = 1+ · 1+ −1

𝑛 𝑛 𝑛 𝑛
r !𝑘  𝑛2
2 𝑦 𝑦2

|𝑦| |𝑦|
= 1+ 2 · ≤ 1+ 2 · .
𝑛 𝑛 𝑛 𝑛

In particolare la lunghezza totale della spezzata ℓ 𝑛 può essere stimata come segue
 𝑛2
𝑦2

|𝑦| ≤ ℓ 𝑛 ≤ 1 + 2 · |𝑦|
𝑛

da cui osservando che


 𝑛2
𝑦2

1+ 2 →1
𝑛
e utilizzando il criterio del confronto si ottiene ℓ 𝑛 → |𝑦| .
160 4 i numeri complessi

Si osserva anche che i punti di tale spezzata si avvicinano sempre di più alla circonferenza
unitaria, infatti:
  𝑘 𝑛  𝑛
𝑖 𝑖 1 2

1 ≤ 1+ ≤ 1 + = 1 + 2 → 1.

𝑛 𝑛 𝑛

E’ dunque sensato pensare che il punto 𝑒 𝑖𝑦 sia il punto della circonferenza unitaria che
identifica un arco di lunghezza |𝑦| a partire dal punto 1 sull’asse reale. Se 𝑦 > 0 l’arco è
misurato in senso antiorario, altrimenti in senso orario. Avremo dunque arg 𝑒 𝑖𝑦 = 𝑦

essendo 𝑦 la lunghezza dell’arco ovvero la misura in radianti dell’angolo corrispondente.

4.3 radici complesse 𝑛 -esime

Sia 𝑐 ∈ ℂ un numero complesso 𝑐 ≠ 0. Ci poniamo il problema di determinare


le soluzioni complesse dell’equazione

radici 𝑛 -esime 𝑧 𝑛 = 𝑐.

Tali soluzioni saranno chiamate radici 𝑛 -esime di 𝑐 .

Scriviamo 𝑐 e 𝑧 in forma esponenziale:

𝑐 = 𝑟𝑒 𝑖𝛼 , 𝑧 = 𝜌𝑒 𝑖𝜃 .

Si avrà allora
𝑧 𝑛 = 𝜌𝑛 (𝑒 𝑖𝜃 )𝑛 = 𝜌𝑛 𝑒 𝑖𝑛𝜃 .
Affinche sia 𝑧 𝑛 = 𝑐 si dovrà avere l’uguaglianza dei moduli, cioè 𝜌𝑛 = 𝑟 e
l’uguaglianza a meno di multipli interi di 2𝜋 degli argomenti: 𝑛𝜃 = 𝛼 + 2 𝑘𝜋
con 𝑘 ∈ ℤ. Dunque si trova

𝛼 2𝜋
𝜃= +𝑘 𝑘 ∈ ℤ.
𝑛 𝑛
Osserviamo ora che per 𝑘 = 0 , . . . , 𝑛 − 1 il secondo addendo 𝑘 2𝜋/𝑛 assume
𝑛 valori distinti compresi in [0, 2𝜋). Per gli altri valori di 𝑘 si ottengono degli
angoli che differiscono da questi di un multiplo di 2𝜋 e quindi non si trovano
altre soluzioni.

Dunque l’equazione 𝑧 𝑛 = 𝑐 per 𝑐 ≠ 0 ha 𝑛 soluzioni distinte date da



𝑧𝑘 = 𝑛
𝑟 · 𝑒 𝑖𝛼/𝑛+2 𝑘𝜋𝑖/𝑛 , 𝑘 = 0, 1, . . . , 𝑛 − 1

dove 𝛼 = arg(𝑐) e 𝑟 = |𝑐| . Dal punto di vista geometrico si osserva che 𝑧 0


è il numero complesso con modulo la radice 𝑛 -esima del numero dato 𝑐 e
argomento pari ad un 𝑛 -esimo dell’argomento di 𝑐 . Tutte le altre soluzioni si
trovano sulla circonferenza centrata in 0 e passante per 𝑧 0 e risultano essere,
insieme ad 𝑧 0 , i vertici di un 𝑛 -agono regolare.
4.4 ancora polinomi 161

In particolare nel caso 𝑐 = 1 si osserva che le radici 𝑛 -esime dell’unità si


rappresentano geometricamente come i vertici dell’𝑛 -agono regolare iscritto
nella circonferenza unitaria e con un vertice in 𝑧 0 = 1.

Esercizio 4.7. Si trovino le soluzioni 𝑧 ∈ ℂ delle seguenti equazioni. Scrivere le


soluzioni in forma polare e cartesiana.

𝑧 4 = −4
𝑧6 = 𝑖
𝑧 3 = −8 𝑖
𝑧4 = 𝑧

𝑧2 + 1 = 𝑖 3
(𝑧 − 𝑖)4 = 1
1 + 𝑧 + 𝑧2 + 𝑧3 = 0
𝑧 14 − 𝑧 6 − 𝑧 8 + 1 = 0

4.4 ancora polinomi

Proseguiamo la trattazione dei polinomi che abbiamo iniziato nel capitolo 1.10.

Teorema 4.8 (divisione di Euclide). Se 𝕂 è un campo, dati due polinomi 𝑃 e 𝑆 in


𝕂 [𝑥] con 𝑆 ≠ 0 è possibile trovare, in modo unico, due polinomi 𝑄 (quoziente) e 𝑅
(resto) in 𝕂 [𝑥] con deg 𝑅 < deg 𝑆 tali che:

𝑃 = 𝑄 · 𝑆 + 𝑅.

Dimostrazione. Passo 1: supponiamo che sia deg 𝑃 < deg 𝑆 . In questo caso basta
prendere 𝑄 = 0 e 𝑅 = 𝑃 .

Passo 2: supponiamo che sia deg 𝑃 ≥ deg 𝑆 . Poniamo 𝑁 = deg 𝑃 e 𝑀 = deg 𝑆 .


Sia 𝑎 𝑁 ≠ 0 il coefficiente del termine di grado massimo di 𝑃 e 𝑏 𝑀 ≠ 0 il
coefficiente di grado massimo del polinomio 𝑆 . E’ allora facile verificare che il
polinomio
𝑎𝑁
· 𝑥 𝑁−𝑀 · 𝑆
𝑏𝑀
ha lo stesso grado di 𝑃 e il suo coefficiente di grado massimo è uguale ad 𝑎 𝑁 in
quanto è il prodotto di 𝑎 𝑁 /𝑏 𝑀 per 𝑏 𝑀 . Dunque il polinomio
𝑎𝑁
𝑃1 = 𝑃 − · 𝑥 𝑁−𝑀 · 𝑆
𝑏𝑀

ha grado strettamente inferiore a 𝑃 . Possiamo ora supporre, mediante un


ragionamento induttivo su deg 𝑃 − deg 𝑆 che per il polinomio 𝑃1 il risultato del
teorema sia valido cioè che esistano, dei polinomio 𝑄 1 e 𝑅 con deg 𝑅 < deg 𝑆
tali che
𝑃1 = 𝑄 1 · 𝑆 + 𝑅.
162 4 i numeri complessi

Il caso base del ragionamento induttivo, deg 𝑃 = deg 𝑆 , è garantito dal passo 1.
Avremo allora:
𝑎 𝑁 𝑁−𝑀
𝑃 = 𝑃1 + 𝑥 ·𝑆
𝑏𝑀
𝑎 𝑁 𝑁−𝑀
= 𝑄1 · 𝑆 + 𝑅1 + 𝑥 ·𝑆
𝑏𝑀
𝑎 𝑁 𝑁−𝑀
=( 𝑥 + 𝑄1 ) · 𝑆 + 𝑅1 .
𝑏𝑀

Posto quindi
𝑎 𝑁 𝑁−𝑀
𝑄= 𝑥 + 𝑄1
𝑏𝑁
il risultato è dimostrato.

Passo 3: dimostriamo che 𝑄 e 𝑅 sono unici. Se infatti avvessimo

𝑃 = 𝑄1 𝑆 + 𝑅1 = 𝑄2 𝑆 + 𝑅2

con deg 𝑅 1 < deg 𝑆 e deg 𝑅 2 < deg 𝑆 si avrebbe

(𝑄 2 − 𝑄 1 )𝑆 = 𝑅 1 − 𝑅 2 .

Se fosse 𝑄 2 ≠ 𝑄 1 il polinomio al lato sinistro avrebbe grado non inferiore al


grado di 𝑆 mentre il lato destro ha certamente grado minore di 𝑆 . Dunque
𝑄 2 = 𝑄 1 ma allora il lato sinistro è nullo e quindi anche il lato destro deve
esserlo: 𝑅 2 = 𝑅 1 .

La dimostrazione del teorema precedente fornisce anche un algoritmo, chiamato


algoritmo di Euclide, per eseguire la divisione (con resto) tra polinomi. Lo
sperimentiamo nel seguente esercizio.

Esercizio 4.9. Sia 𝑃 = 𝑥 4 − 3 𝑥 2 + 2 𝑥 + 1 e 𝑆 = 𝑥 2 − 1. Eseguire la divisione con


resto cioè: trovare 𝑄 ed 𝑅 con deg 𝑅 < deg 𝑆 tali che

𝑃 = 𝑄 · 𝑆 + 𝑅.

Svolgimento. Il rapporto tra i termini di grado massimo di 𝑃 e 𝑆 è 𝑥 4 /𝑥 2 = 𝑥 2 .


Dunque consideriamo come primo monomio 𝑥 2 . Si ha

𝑃1 = 𝑃 − 𝑥 2 · 𝑆 = 𝑥 4 − 3 𝑥 2 + 2 𝑥 + 1 − 𝑥 4 + 𝑥 2
= −2 𝑥 2 + 2 𝑥 + 1 .

Ripetiamo il procedimento con 𝑃1 al posto di 𝑃 . Il rapporto tra i termini di


grado massimo di 𝑃1 e 𝑆 è il monomio −2. Si ha

𝑃2 = 𝑃1 − (−2)𝑆 = −2𝑥 2 + 2 𝑥 + 1 + 2𝑥 2 − 2 = 2 𝑥 − 1.

Visto che deg 𝑃2 < deg 𝑆 la divisione termina e si pone 𝑅 = 2 𝑥 − 1. Si ha quindi


𝑄 = 𝑥 2 − 2 (la somma dei monomi trovati) e risulta:

𝑃 = (𝑥 2 − 2) · 𝑆 + 2𝑥 − 1.
4.4 ancora polinomi 163

Teorema 4.10 (Ruffini). Sia 𝑃 ∈ 𝕂 [𝑥] un polinomio non nullo. Se 𝑥 0 ∈ 𝕂 è tale che
𝑃(𝑥0 ) = 0 allora esiste un polinomio 𝑄 con deg 𝑄 = (deg 𝑃) − 1 tale che

𝑃 = (𝑥 − 𝑥0 ) · 𝑄.

Dimostrazione. In base al teorema precedente si può fare la divisione tra 𝑃 e


𝑆 = 𝑥 − 𝑥0 per ottenere un polinomio 𝑄 e un resto 𝑅 con deg 𝑅 < 1 tali che

𝑃 = (𝑥 − 𝑥0 ) · 𝑄 + 𝑅.

Siccome deg 𝑅 < 1 si ha in effetti che 𝑅 = 𝑐 ∈ 𝕂 è un polinomio costante e


dunque
𝑃 = (𝑥 − 𝑥0 ) · 𝑄 + 𝑐
ma valutando 𝑃 in 𝑥 = 𝑥 0 si scopre che

𝑃(𝑥0 ) = 0 · 𝑄(𝑥0 ) + 𝑐 = 𝑐

dunque 𝑐 = 𝑃(𝑥 0 ) = 0.

Possiamo ora chiederci se polinomi diversi corrispondono a funzioni polinomiali


diverse. In generale questo non è vero, se ad esempio prendessimo come campo
𝕂 = ℤ2 = {0, 1}, un campo finito in cui poniamo 1 + 1 = 0 scopriremmo
che la funzione polinomiale 𝑃(𝑥) = 𝑥 2 + 𝑥 è identicamente nulla in quanto
02 + 0 = 0 e 12 + 1 = 1 + 1 = 0 in questo campo. Ma nei casi che interessano a noi
𝕂 = ℝ o 𝕂 = ℂ questo problema non si presenta e si potrà quindi identificare
ogni polinomio con la corrispondente funzione polinomiale. Per avere questa
garanzia ci servono i seguenti risultati.

Teorema 4.11 (principio di annullamento dei polinomi). Sia 𝑃 ∈ 𝕂 [𝑥] un


polinomio non nullo di grado 𝑛 . Allora la funzione polinomiale associata a 𝑃 si annulla
in al più 𝑛 punti distinti di 𝕂 .

In particolare se un polinomio si annulla in infiniti punti distinti allora tale polinomio è


certamente nullo.

Dimostrazione. Dimostriamo per induzione su 𝑛 che se un polinomio 𝑃 di grado


non superiore a 𝑛 si annulla in 𝑛 + 1 punti distinti 𝑥 1 , . . . , 𝑥 𝑛+1 ∈ 𝕂 allora 𝑃 = 0.

Se 𝑛 = 0 il polinomio 𝑃 è costante ma si annulla in un punto e quindi è il


polinomio nullo. Se 𝑛 > 0 per il teorema di Ruffini applicato al punto 𝑥 𝑛+1
sappiamo che esise un polinomio 𝑄 di grado inferiore ad 𝑛 per cui si ha

𝑃 = (𝑥 − 𝑥 𝑛+1 ) · 𝑄

sostituendo 𝑥 = 𝑥 𝑘 con 𝑘 ≤ 𝑛 si ha 𝑥 𝑘 − 𝑥 𝑛+1 ≠ 0 e quindi

𝑃(𝑥 𝑘 )
𝑄(𝑥 𝑘 ) = = 0.
𝑥 𝑘 − 𝑥 𝑛+1
164 4 i numeri complessi

Dunque 𝑄 si annulla nei punti 𝑥 1 , . . . , 𝑥 𝑛 e, per ipotesi induttiva, scopriamo


che 𝑄 deve essere nullo. Di conseguenza anche 𝑃 è nullo.

Se 𝕂 è un insieme infinito (come nei casi 𝕂 = ℝ o 𝕂 = ℂ) si trova che se a due


polinomi 𝑃 , 𝑄 corrisponde la stessa funzione polinomiale:

𝑃(𝑥) = 𝑄(𝑥) per ogni 𝑥 ∈ 𝕂

allora 𝑃 e 𝑄 sono lo stesso polinomio 𝑃 = 𝑄 in quanto la differenza 𝑃 − 𝑄 si


annulla in tutti i punti di 𝕂 e qualunque sia il suo grado, se 𝕂 è infinito, questo
ci dice che 𝑃 − 𝑄 = 0.

Questo corollario viene spesso enunciato come segue.

Teorema 4.12 (principio di identità dei polinomi). Siano 𝑎 𝑘 e 𝑏 𝑘 coefficienti nel


campo 𝕂 = ℝ o 𝕂 = ℂ. Se per ogni 𝑥 ∈ 𝕂 si ha
𝑛 𝑚
𝑎𝑘 𝑥 𝑘 = 𝑏𝑘 𝑥 𝑘
X X
𝑘=1 𝑘=1

allora 𝑚 = 𝑛 e 𝑎 𝑘 = 𝑏 𝑘 per ogni 𝑘 = 0 , . . . , 𝑛 .

Dimostrazione. Facendo la differenza dei due lati dell’uguaglianza si ottiene


che una espressione polinomiale si annulla identicamente. Allora per il teore-
ma 4.11 tale espressione rappresenta il polinomio nullo e di conseguenza tutti i
coefficienti, che sono dati dalla differenza 𝑎 𝑘 − 𝑏 𝑘 , devono essere nulli.

4.5 il teorema fondamentale dell’algebra

Il teorema fondamentale dell’algebra afferma che ogni polinomio non costante


si annulla in almeno un punto del piano complesso.

La formula risolutiva per determinare le radici di un polinomio di secondo


grado era già nota ai Babilonesi e sebbene i numeri complessi non erano noti
(e neanche i numeri negativi) la stessa formula si applica nel caso generale e
fornisce le radici complesse.

Lo studio delle equazioni di grado superiore al secondo si sviluppa invece nel


1500 ad opera dei matematici italiani Scipione del Ferro, Gerolamo Cardano,
Niccolò Tartaglia e Lodovico Ferrari. Essi determinano le formule risolutive per
determinare le radici dei polinomi di terzo e quarto grado. Nell’applicare la
formula risolutiva per l’equazione di terzo grado può capitare di dover calcolare
la radice quadrata di un numero negativo anche in situazioni in cui tutte le
soluzioni alla fine risultano reali. Ed è proprio in questo contesto che nascono
i numeri complessi, come mero artificio matematico utilizzato per portare a
termine il conto.

Successivamente Paolo Ruffini (1765-1822) e Niels Abel (1802-1829) dimostrarono


che le equazioni di grado maggiore del quarto non ammettono una formula
risolutiva esprimibile mediante radicali. Il criterio per determinare se un
4.5 il teorema fondamentale dell’algebra 165

polinomio ammette o meno formule risolutive è dovuto al matematico francese


Évariste Galois (1811-1832) che è considerato il fondatore della teoria dei
gruppi.
Il teorema fondamentale dell’algebra, e cioè l’esistenza di radici complesse per
polinomi di grado qualunque, viene dimostrato dal matematico tedesco Carl
Friedrich Gauss (1777–1855). Questo teorema opera una svolta nel pensiero
matematico in quanto per la prima volta si dà rilevanza ad un risultato astratto di
esistenza slegato da una formula risolutiva. Il teorema non era affatto scontato,
basti pensare che sia Leibniz che Nikolas Bernoulli erano convinti di aver trovato
dei polinomi di quarto grado che non possono essere fattorizzati in contrasto
con il teorema 4.21.
Per dimostrare il teorema fondamentale dell’algebra dobbiamo estendere il
teorema di Weierstrass alle funzioni di una variabile complessa. Nel teorema
di Weierstrass reale la funzione per ipotesi è definita su un intervallo chiuso e
limitato. Nel piano complesso non esiste il concetto di intervallo in quanto non
abbiamo un ordinamento ma vedremo che comunque il teorema di Weierstrass
rimane valido per le funzioni continue definite su insiemi chiusi e limitati
secondo le seguenti definizioni.

Definizione 4.13 (chiusura sequenziale). Un insieme 𝐴 ⊆ ℂ si dice essere sequen-


zialmente chiuso se presa una qualunque successione di punti 𝑎 𝑛 ∈ 𝐴 se 𝑎 𝑛 → 𝑎 per
sequenzialmente chiuso
qualche 𝑎 ∈ ℂ allora 𝑎 ∈ 𝐴.

Definizione 4.14 (limitatezza). Un insieme 𝐴 ⊆ ℂ si dice essere limitato se


limitato
sup {|𝑧| : 𝑧 ∈ 𝐴} < +∞.

Una successione 𝑧 𝑛 ∈ ℂ si dice essere limitata se l’insieme {𝑧 𝑛 : 𝑛 ∈ ℕ } è limitato


ovvero se
sup |𝑧 𝑛 | < +∞.
𝑛∈ℕ

Teorema 4.15 (Bolzano-Weierstrass complesso). Se 𝑧 𝑛 ∈ ℂ è una successione


limitata allora è possibile estrarre una sottosuccessione 𝑧 𝑛 𝑘 convergente: 𝑧 𝑛 𝑘 → 𝑧 con
𝑧 ∈ ℂ.

Dimostrazione. Siano 𝑥 𝑛 e 𝑦𝑛 la parte reale ed immaginaria di 𝑧 𝑛 : 𝑧 𝑛 = 𝑥 𝑛 + 𝑖 𝑦𝑛 .


p q
Visto che |𝑥 𝑛 | = 𝑥 𝑛2 ≤ 𝑥 𝑛2 + 𝑦𝑛2 = |𝑧 𝑛 | e, allo stesso modo |𝑦𝑛 | ≤ |𝑧 𝑛 | ,
possiamo affermare che entrambe le successioni 𝑥 𝑛 e 𝑦𝑛 sono limitate (ma
stavolta in ℝ). Dunque possiamo applicare il teorema di Bolzano-Weierstrass
(reale) alla successione 𝑥 𝑛 per trovare una sottosuccessione 𝑥 𝑛 𝑗 → 𝑥 conver-
gente. E possiamo applicare di nuovo il teorema di Bolzano-Weierstrass alla
sottosuccessione 𝑦𝑛 𝑗 per trovare una sotto-sottosuccessione 𝑦𝑛 𝑗𝑘 → 𝑦 anch’essa
convergente. Posto 𝑛 𝑘 = 𝑛 𝑗𝑘 avremo dunque trovato una sottosuccessione
𝑧 𝑛 𝑘 = 𝑥 𝑛 𝑘 + 𝑖 𝑦𝑛 𝑘 → 𝑥 + 𝑖 𝑦 convergente.

Teorema 4.16 (Weierstrass complesso). Sia 𝐴 ⊆ ℂ un insieme non vuoto, sequen-


zialmente chiuso e limitato e sia 𝑓 : 𝐴 → ℝ una funzione continua. Allora 𝑓 ha
massimo e minimo su 𝐴.
166 4 i numeri complessi

Dimostrazione. Dimostriamo l’esistenza del minimo: per il massimo la dimo-


strazione è perfettamente analoga. Sia 𝑚 = inf 𝑓 (𝐴). Essendo 𝐴 non vuoto, per
il lemma sull’esistenza delle successioni minimizzanti sappiamo esistere una
successione 𝑧 𝑛 ∈ 𝐴 tale che 𝑓 (𝑧 𝑛 ) → 𝑚 . Essendo 𝐴 limitato possiamo applicare
il teorema di Bolzano-Weierstrass per trovare 𝑧 ∈ ℂ e una sottosuccessione
𝑧 𝑛 𝑘 → 𝑧 . Essendo 𝐴 sequenzialmente chiuso possiamo quindi affermare che
𝑧 ∈ 𝐴. Essendo 𝑓 continua concludiamo che

𝑓 (𝑧) = lim 𝑓 (𝑧 𝑛 𝑘 ) = 𝑚
𝑘→+∞

e dunque 𝑧 è un punto di minimo per 𝑓 .

Teorema 4.17 (esistenza del minimo per funzioni coercive). Sia 𝑓 : ℂ → ℝ una
funzione continua tale che per ogni successione 𝑧 𝑛 → ∞ (ovvero |𝑧 𝑛 | → +∞) si abbia
𝑓 (𝑧 𝑛 ) → +∞. Allora 𝑓 ha minimo.

Dimostrazione. Consideriamo l’insieme

𝐴 = {𝑧 ∈ ℂ : 𝑓 (𝑧) ≤ 𝑓 (0)}.

Chiaramente 0 ∈ 𝐴 e quindi 𝐴 non è vuoto. L’insieme 𝐴 è anche sequenzialmente


chiuso in quanto se 𝑧 𝑘 ∈ 𝐴 allora 𝑓 (0) − 𝑓 (𝑧 𝑘 ) ≥ 0, per continuità 𝑓 (0) − 𝑓 (𝑧 𝑘 ) →
𝑓 (0) − 𝑓 (𝑧) e per il teorema della permanenza del segno si ottiene 𝑓 (0) − 𝑓 (𝑧) ≥ 0
cioè 𝑧 ∈ 𝐴. Dimostriamo ora che 𝐴 è anche limitato. Se non lo fosse esisterebbe,
per assurdo, una successione 𝑧 𝑛 ∈ 𝐴 tale che |𝑧 𝑛 | → +∞ cioè 𝑧 𝑛 → ∞. Ma
allora, per ipotesi su 𝑓 , si avrebbe 𝑓 (𝑧 𝑛 ) → +∞ che contraddice la condizione
𝑓 (𝑧 𝑛 ) ≤ 𝑓 (0). Essendo 𝐴 non vuoto, sequenzialmente chiuso e limitato ed
essendo 𝑓 : 𝐴 → ℝ continua, possiamo applicare il teorema di Weierstrass
complesso per dedurre che 𝑓 ha minimo su 𝐴 in un punto 𝑤 ∈ 𝐴. Ma essendo
0 ∈ 𝐴 si avrà sicuramente 𝑓 (𝑤) ≤ 𝑓 (0) e per ogni 𝑧 ∈ ℂ \ 𝐴 si ha invece
𝑓 (𝑧) > 𝑓 (0) per come è stato definito 𝐴. Dunque 𝑤 è minimo di 𝑓 su tutto ℂ,
non solo su 𝐴.
teorema fondamentale dell’algebra
Teorema 4.18 (teorema fondamentale dell’algebra). Sia 𝑓 (𝑧) un polinomio di
grado 𝑁 ≥ 1 a coefficienti complessi:

𝑁
𝑎𝑗 · 𝑧𝑗
X
𝑓 (𝑧) =
𝑗=0

con 𝑎 𝑗 ∈ ℂ per 𝑗 = 0 , . . . , 𝑁 e 𝑎 𝑁 ≠ 0. Allora esiste 𝑤 ∈ ℂ tale che 𝑓 (𝑤) = 0.

Dimostrazione. Osserviamo innanzitutto che | 𝑓 (𝑧)| è coerciva cioè che se 𝑧 𝑛 → ∞


allora | 𝑓 (𝑧 𝑛 )| → +∞. Infatti si ha

𝑁 𝑁− 1
𝑗 𝑗
X
𝑎 𝑗 𝑧 𝑛 = 𝑎 𝑁 𝑧 𝑛𝑁 +
X
| 𝑓 (𝑧 𝑛 )| = 𝑎 𝑗 𝑧𝑛

𝑗=0 𝑗=0


𝑁−
X1 𝑎 𝑗
= |𝑧 𝑛 | 𝑁 · 𝑎 𝑁 + → +∞

𝑁−𝑗
𝑗=0 𝑧 𝑛

4.5 il teorema fondamentale dell’algebra 167

se 𝑧 𝑛 → ∞.

Sappiamo che tutti i polinomi sono funzioni continue in quanto somme di


prodotti di funzioni continue e il modulo è anch’esso una funzione continua
dunque | 𝑓 (𝑧)| è certamente una funzione continua.

Dunque possiamo applicare il teorema di esistenza del minimo per le funzioni


coercive: esiste 𝑤 ∈ ℂ tale che | 𝑓 (𝑤)| è minimo.

Per concludere il teorema basterà dimostrare che 𝑓 (𝑤) = 0. L’idea che vogliamo
sviluppare è che i polinomi complessi se assumono un valore 𝑓 (𝑤) in un punto
𝑤 ∈ ℂ allora assumono anche tutti i valori vicini ad esso in quanto localmente
il polinomio assomiglia ad una potenza 𝑧 𝑛 e l’equazione 𝑧 𝑛 = 𝑐 ha sempre
soluzione, come abbiamo già visto. Dunque vicino a 𝑤 ci saranno dei punti
in cui 𝑓 assume valori che in modulo sono minori a 𝑓 (𝑤): a meno che non sia
proprio 𝑓 (𝑤) = 0, nel qual caso ovviamente non è possibile avere numeri con
modulo inferiore a 0.

Possiamo scrivere il polinomio 𝑓 (𝑧) nella forma

𝑁
𝑏 𝑗 (𝑧 − 𝑤) 𝑗
X
𝑓 (𝑧) =
𝑗=0

in quanto la traslazione di un polinomio è ancora un polinomio dello stesso


grado. Dimostrare che 𝑓 (𝑤) = 0 è quindi equivalente a dimostrare che 𝑏 0 = 0.
Supponiamo allora per assurdo che sia 𝑏 0 ≠ 0. L’andamento del polinomio
vicino al punto 𝑤 è dominato dai termini di grado più basso: alcuni di questi
potrebbero essere nulli, ma possiamo considerare il primo indice 𝑘 > 0 per cui
si ha 𝑏 𝑘 ≠ 0. Allora potremo scrivere:

𝑁
𝑓 (𝑧) = 𝑏0 + 𝑏 𝑘 (𝑧 − 𝑤) 𝑘 + 𝑏 𝑗 (𝑧 − 𝑤) 𝑗 .
X
𝑗=𝑘+1

Ora scriviamo 𝑧 − 𝑤 e 𝑏 0 in forma esponenziale: 𝑧 − 𝑤 = 𝜌𝑒 𝑖𝜃 , 𝑏 0 = 𝑟𝑒 𝑖𝛼 e


applichiamo la disuguaglianza triangolare

𝑁
| 𝑓 (𝑧)| = 𝑟𝑒 𝑖𝛼 + 𝜌 𝑘 𝑒 𝑖𝜃𝑘 + 𝑏 𝑗 𝜌 𝑗 𝑒 𝑖𝜃 𝑗
X
𝑗=𝑘+1

𝑁
≤ 𝑟𝑒 𝑖𝛼 + 𝜌 𝑘 𝑒 𝑖𝜃𝑘 + 𝑏 𝑗 𝜌 𝑗 .
X
𝑗=𝑘+1

Per raggiungere un assurdo vogliamo dimostrare che esiste 𝑧 (cioè esistono 𝜌 e


𝜃 ) per cui il valore della funzione risulti in modulo minore di 𝑟 = |𝑏0 | = | 𝑓 (𝑤)| .
Innanzitutto se 𝜌 è sufficientemente piccolo possiamo rendere arbitrariamente
piccole le potenze 𝜌 𝑗 con 𝜌 > 𝑘 : basta scegliere 𝜌 ≤ 1 e 𝜌 ≤ 1/(2 𝑏 𝑗 ) cosicché
P
si avrà
𝑁 𝑁 𝑘
𝑏 𝑗 𝜌 𝑗 ≤ 𝜌 𝑘+1 𝑏 𝑗 ≤ 𝜌 .
X X
𝑗=𝑘+1 𝑗=𝑘+1
2

Per quanto riguarda il termine 𝑟𝑒 𝑖𝛼 + 𝜌 𝑘 𝑒 𝑖𝜃𝑘 sarà sufficiente scegliere 𝜃 =


(𝜋 − 𝛼)/𝑘 in modo che i due addendi abbiano fase opposta e la somma sia
168 4 i numeri complessi

distruttiva: 𝑖𝛼
𝑟𝑒 + 𝜌 𝑘 𝑒 𝑖𝜃𝑘 = 𝑒 𝑖𝛼 (𝑟 + 𝜌 𝑘 𝑟 𝑖𝜋 ) = 𝑟 − 𝜌 𝑘 .

In definitiva abbiamo

𝜌𝑘
| 𝑓 (𝑧)| = 𝑓 (𝑤 + 𝜌𝑒 𝑖𝜃 ≤ 𝑟 − 𝜌 𝑘 + < 𝑟 = | 𝑓 (𝑤)|

2
che è assurdo in quanto | 𝑓 (𝑤)| doveva essere il valore minimo.

4.6 fattorizzazione dei polinomi

Teorema 4.19 (fattorizzazione dei polinomi complessi). Sia 𝑝(𝑧) un polinomio


non nullo. Allora posto 𝑛 = deg 𝑝 esistono dei numeri complessi 𝑧 1 , 𝑧 2 , . . . , 𝑧 𝑛 ed un
numero complesso 𝑐 ≠ 0 tali che
𝑛
Y
𝑝(𝑧) = 𝑐 (𝑧 − 𝑧 𝑘 ). (4.1)
𝑘=1

Gli 𝑧 𝑘 sono unici a meno dell’ordine e 𝑐 pure è univocamente determinato.

Dimostrazione. Dimostriamo il teorema per induzione su 𝑛 = deg 𝑝 . Se 𝑛 = 0 il


polinomio 𝑝 è costante: 𝑝(𝑧) = 𝑐 . Ricordando che un prodotto di 𝑛 = 0 fattori è
uguale a 1 si ottiene quindi il risultato voluto.

Sia ora 𝑝(𝑧) un qualunque polinomio di grado 𝑛 > 0. Per il teorema fonda-
mentale dell’algebra sappiamo che esiste un numero complesso 𝑧 𝑛 tale che
𝑝(𝑧 𝑛 ) = 0. Per il teorema di Ruffini si ha allora

𝑝(𝑧) = (𝑧 − 𝑧 𝑛 )𝑞(𝑧)

con 𝑞 un qualche polinomio di grado 𝑛 − 1. Per ipotesi induttiva possiamo


dunque supporre che esistano 𝑧 1 , . . . , 𝑧 𝑛−1 e 𝑐 numeri complessi tali che

𝑛−1
Y
𝑞(𝑧) = 𝑐 (𝑧 − 𝑧 𝑘 )
𝑘=1

e la tesi segue.

Nella fattorizzazione (4.1) le radici 𝑧 𝑘 possono anche ripetersi. Se mettiamo


insieme i fattori corrispondenti alla stessa radice si ottiene una decomposizione
della forma
𝑚
(𝑧 − 𝑧 𝑘 )𝑝 𝑘
Y
𝑃(𝑧) = 𝑐 (4.2)
molteplicità 𝑘=1

con 𝑧 1 , . . . , 𝑧 𝑚 numeri complessi distinti (le radici del polinomio 𝑃 ) e 𝑝 𝑘 interi


positivi. L’esponente 𝑝 𝑘 si chiama molteplicità della radice 𝑧 𝑘 e risulta

𝑝1 + · · · + 𝑝 𝑚 = 𝑛.
4.6 fattorizzazione dei polinomi 169

Questa uguaglianza si esprime dicendo che un polinomio 𝑃 ∈ ℂ[𝑧] di grado


𝑛 ha sempre 𝑛 radici contate con la loro molteplicità. Le radici distinte sono
invece 𝑚 ≤ 𝑛 .

Se invece 𝑃 ∈ ℝ[𝑥] è un polinomio a coefficienti reali non è detto che 𝑃 abbia


radici: ad esempio il polinomio 𝑥 2 + 1 non ha radici reali in quanto 𝑥 2 + 1 > 0
come succede in ogni campo ordinato. Potrà allora essere utile pensare a 𝑃
come ad un polinomio in ℂ[𝑥] con coefficienti reali.

Se 𝑃 ∈ ℝ[𝑥] è un polinomio a coefficienti reali


𝑛
𝑎𝑘 𝑥 𝑘 ,
X
𝑃= 𝑎𝑘 ∈ ℝ
𝑘=0

possiamo pensare a 𝑃 anche come un polinomio in ℂ[𝑥], visto che 𝑎 𝑘 ∈ ℝ ⊆ ℂ.


Il seguente teorema ci dà un criterio per distinguere i polinomi a coefficienti
reali dentro a ℂ[𝑥].

Teorema 4.20. Se 𝑃 ∈ ℂ[𝑥] è un polinomio a coefficienti complessi


𝑛
𝑎𝑘 𝑥 𝑘 ,
X
𝑃= 𝑎𝑘 ∈ ℂ
𝑘=0

e se esiste un insieme infinito 𝐴 ⊆ ℝ tale che per ogni 𝑥 ∈ 𝐴 si abbia 𝑃(𝑥) ∈ ℝ allora
𝑎 𝑘 ∈ ℝ per ogni 𝑘 = 0, . . . , 𝑛 e dunque 𝑃 ∈ ℝ[𝑥].

In particolare se la funzione polinomiale associata a 𝑃 ∈ ℂ[𝑥] manda ℝ in ℝ allora 𝑃 è


un polinomio a coefficienti reali.

Dimostrazione. Consideriamo il polinomio:


𝑛
(𝑎 𝑘 − 𝑎¯ 𝑘 )𝑥 𝑘 .
X
𝑄=
𝑘=0

Allora per ogni 𝑥 ∈ 𝐴 si ha


𝑛 𝑛
𝑎𝑘 𝑥 𝑘 − 𝑎¯ 𝑘 𝑥 𝑘 = 𝑃(𝑥) − 𝑃(𝑥) = 𝑃(𝑥) − 𝑃(𝑥) = 0
X X
𝑄(𝑥) =
𝑘=0 𝑘=0

in quanto se 𝑥 ∈ ℝ risulta 𝑥 𝑘 = 𝑥¯ 𝑘 = 𝑥 𝑘 . Visto che 𝐴 è infinito, per il principio


di annullamento dei polinomi (teorema 4.11) deduciamo che 𝑄 = 0. Ma allora
tutti i coefficienti di 𝑄 devono essere nulli e cioè 𝑎¯ 𝑘 = 𝑎 𝑘 . Ne consegue che
𝑎 𝑘 ∈ ℝ per ogni 𝑘 = 0 , . . . , 𝑛 .

Rifacendoci alla fattorizzazione dei polinomi a coefficienti complessi possiamo


fattorizzare anche i polinomi a coefficienti reali se ci accontentiamo di avere
fattori quadratici invece che lineari.
170 4 i numeri complessi

Teorema 4.21 (fattorizzazione dei polinomi reali). Se 𝑃 ∈ ℝ[𝑥] è un polinomio a


coefficienti reali potremo scrivere
𝑛 𝑚
(𝑥 − 𝑥 𝑘 )𝑝 𝑘 · (𝑥 2 + 𝛼 𝑗 𝑥 + 𝛽 𝑗 )𝑞 𝑗
Y Y
𝑃=𝑎· (4.3)
𝑘=1 𝑗=1

dove 𝑎 ∈ ℝ, 𝑥 𝑘 ∈ ℝ, 𝑝 𝑘 ∈ ℕ \ {0}, 𝛼 𝑗 , 𝛽 𝑗 ∈ ℝ, 𝑞 𝑗 ∈ ℕ \ {0} con 𝛼 2𝑗 − 4𝛽 𝑗 < 0 e

𝑛
X 𝑚
X
𝑝𝑘 + 2 𝑞 𝑗 = deg 𝑃.
𝑘=1 𝑗=1

La fattorizzazione (4.3) è unica a meno dell’ordine dei fattori.

I numeri 𝑥 1 , . . . , 𝑥 𝑛 sono tutte le radici reali distinte del polinomio 𝑃 con rispettive
molteplicità 𝑝 1 , . . . , 𝑝 𝑛 mentre tutte le radici complesse (non reali) distinte saranno
𝜇1 , . . . , 𝜇𝑚 e 𝜇¯ 1 , . . . , 𝜇¯ 𝑚 con

𝑥 2 + 𝛼 𝑗 𝑥 + 𝛽 𝑗 = (𝑥 − 𝜇) · (𝑥 − 𝜇)
¯

da cui 2
𝛼 𝑗 = −2 Re 𝜇 𝑗 , 𝛽 𝑗 = 𝜇 𝑗
e 𝑞 𝑗 saranno le molteplicità delle radici 𝜇 𝑗 e 𝜇¯ 𝑗 .

Dimostrazione. Osserviamo innanzitutto che se 𝑃 è a coefficienti reali si ha

𝑃(𝑧) = 𝑃(¯𝑧 ), ∀𝑧 ∈ ℂ

dunque se 𝜇 è una radice di 𝑃 anche 𝜇¯ è una radice di 𝑃 . Ora se 𝜇 è una radice


non reale di 𝑃 sappiamo che in campo complesso 𝑃 risulta divisibile per 𝑥 − 𝜇
(teorema 4.10 di Ruffini):
𝑃 = (𝑥 − 𝜇) · 𝑃1 .
Ma anche 𝜇¯ è radice di 𝑃 ed essendo 𝜇¯ ≠ 𝜇 si dovrà avere

𝑃(𝜇)
¯
𝑄(𝜇)
¯ = =0
𝜇¯ − 𝜇

e dunque applicando nuovamente il teorema di Ruffini

𝑃 = (𝑥 − 𝜇) · (𝑥 − 𝜇)
¯ · 𝑃2 .

Ora osserviamo che

(𝑥 − 𝜇) · (𝑥 − 𝜇) ¯ + 𝜇𝜇¯ = 𝑥 2 − 2(Re 𝜇) · 𝑥 + |𝜇| 2


¯ = 𝑥 2 − (𝜇 + 𝜇)𝑥

è un polinomio a coefficienti reali e visto che 𝑃2 si ottiene dividendo 𝑃 per tale


polinomio, anche 𝑃2 è un polinomio a coefficienti reali.

Ripetendo lo stesso procedimento sul polinomio 𝑃2 potremo fattorizzare 𝑃


diminuendo il grado a passi di 2 finché non si esauriscono tutte le radici
complesse non reali accoppiandole a due a due. Dunque se 𝜇 è una radice
4.6 fattorizzazione dei polinomi 171

complessa del polinomio reale 𝑃 la molteplicità di 𝜇 è uguale alla molteplicità


di 𝜇¯ .
Dopodiché si potrà completare la fattorizzazione dividendo per i fattori lineari
𝑥 − 𝑥 𝑘 corrispondenti alle radici reali del polinomio 𝑃 . Si otterrà quindi la
fattorizzazione desiderata.
calcolo differenziale 5
5.1 derivata

Il potenziale gravitazionale generato dalla terra nello spazio, in un punto a


distanza 𝑟 dal suo centro è dato da:
𝐺𝑀
𝑈(𝑟) = −
𝑟
dove 𝑀 è la massa della terra e 𝐺 è la costante di gravitazione universale. La
funzione 𝑈(𝑟) non è affatto lineare. Se però consideriamo il campo gravita-
zionale per i punti in prossimità della superficie terrestre, ci aspettiamo un
comportamento approssimativamente lineare. Proviamo a esplicitare questa
idea.

Supponiamo di trovarci ad altezza ℎ dalla superficie terrestre. Ci troveremo


allora a distanza 𝑅 + ℎ dal centro della terra. Si avrà allora:
1
𝑈(𝑅 + ℎ) = −𝐺𝑀 .
𝑅+ℎ
Osserviamo ora che si ha

1 1 1 1 1 𝑅 − (𝑅 + ℎ)
= + − = +
𝑅+ℎ 𝑅 𝑅+ℎ 𝑅 𝑅 𝑅(𝑅 + ℎ)
1 ℎ
= −
𝑅 𝑅(𝑅 + ℎ)
1 ℎ ℎ ℎ
= − 2− +
𝑅 𝑅 𝑅(𝑅 + ℎ) 𝑅2
1 ℎ ℎ𝑅 − ℎ(𝑅 + ℎ)
= − 2−
𝑅 𝑅 𝑅 2 (𝑅 + ℎ)
ℎ 1 ℎ2
=− + + .
𝑅 2 𝑅 𝑅 2 (𝑅 + ℎ)

Dunque si avrà

𝐺𝑀 𝐺𝑀
𝑈(𝑅 + ℎ) = ℎ− + 𝜔(ℎ)
𝑅2 𝑅
= 𝑔 ℎ + 𝐶 + 𝜔(ℎ)

dove 𝑔 = 𝐺𝑀/𝑅 2 , 𝐶 è una costante (irrilevante perché il potenziale può


essere definito a meno di una costante) e 𝜔(ℎ) è una funzione con la proprietà
𝜔(ℎ)/ℎ → 0 per ℎ → 0. Dunque se ℎ è molto piccolo rispetto a 𝑅 , il termine
𝜔(ℎ) è trascurabile rispetto al termine 𝑔 ℎ (anche se entrambi tendono a zero
per ℎ → 0). Questo giustifica l’utilizzo della formula semplificata:

𝑈0 (ℎ) = 𝑔 ℎ
174 5 calcolo differenziale

Figura 5.1: Il grafico del potenziale gra-


vitazionale terrestre. Sull’asse delle 𝑥 la
distanza dal centro della terra in raggi
terrestri. Sull’asse delle 𝑦 il potenziale
gravitazionale con unità 𝐶 = 𝐺𝑀/𝑅 . La
pendenza della retta tangente al grafico
della curva per 𝑥 = 𝑅 è 𝑔 = 𝐺𝑀/𝑅 2 .
Nella figura di destra un ingrandimento
in un intorno del raggio terrestre: si nota
come il grafico del potenziale risulta qua-
si indistinguibile dal grafico della retta
tangente.

da cui l’energia potenziale 𝐸 = 𝑚 𝑔 ℎ se abbiamo una massa 𝑚 ad una altezza ℎ


sulla superficie terrestre.

linearizzazione Quello che abbiamo fatto è un procedimento di linearizzazione. Il campo


gravitazionale è descritto da una funzione non lineare: −𝐺𝑀/𝑟 . Ma quando
ci restringiamo a un piccolo intervallo di valori di 𝑟 (i valori di 𝑟 vicini ad 𝑅 ,
il raggio della terra) tale funzione risulta quasi indistinguibile, a meno di una
costante, dalla funzione lineare 𝑔 ℎ se 𝑟 = 𝑅 + ℎ . Le funzioni lineari sono molto
più semplici da trattare ed è quindi conveniente, se rimaniamo sulla superficie
terrestre, utilizzare quest’ultima formula per il potenziale gravitazionale. Il
grafico della funzione lineare che meglio approssima il grafico di una funzione
retta tangente si chiama retta tangente. Il suo coefficiente angolare, 𝑔 nel nostro esempio, si
chiama derivata.
derivata
Una volta introdotte le derivate vedremo che quello che abbiamo determinato è
la formula:
𝑈(𝑅 + ℎ) = 𝑈(𝑅) + 𝑈 0(𝑅)ℎ + 𝜔(ℎ).

Definizione 5.1 (derivata). Sia 𝐴 ⊆ ℝ, 𝑓 : 𝐴 → ℝ, 𝑥 0 un punto di accumulazione


di 𝐴. Diremo che la funzione 𝑓 è derivabile nel punto 𝑥 0 se esiste ed è finito il limite:

𝑓 (𝑥0 + ℎ) − 𝑓 (𝑥0 )
lim .
ℎ→0 ℎ
derivata In tal caso denoteremo con 𝑓 0(𝑥 0 ) il valore di tale limite che chiameremo derivata della
funzione 𝑓 nel punto 𝑥 0 .

Se 𝐵 è l’insieme dei punti di accumulazione di 𝐴 in cui 𝑓 risulta essere derivabile,


risulta quindi definita la funzione derivata 𝑓 0 : 𝐵 → ℝ.

Una funzione 𝑓 si dice essere derivabile se è derivabile in ogni punto del suo dominio.
Se 𝐶 ⊆ 𝐴 la funzione 𝑓 si dice essere derivabile su 𝐶 se è derivabile in ogni punto
dell’insieme 𝐶 (cioè se 𝐶 ⊆ 𝐵).

Notazioni alternative per denotare la derivata di una funzione:

𝑑 𝑑𝑓
𝑓0 = 𝐷𝑓 = 𝑓 = .
𝑑𝑥 𝑑𝑥

Il rapporto
𝑓 (𝑥0 + ℎ) − 𝑓 (𝑥 0 )
rapporto incrementale ℎ
5.1 derivata 175

si chiama rapporto incrementale. In effetti cambiando variabile e ponendo


𝑥 = 𝑥0 + ℎ si può scrivere

𝑓 (𝑥 0 + ℎ) − 𝑓 (𝑥0 ) 𝑓 (𝑥) − 𝑓 (𝑥 0 ) Δ 𝑓
= =
ℎ 𝑥 − 𝑥0 Δ𝑥

che risulta essere il rapporto dell’incremento della funzione 𝑓 (a volte denotato


con Δ 𝑓 ) rispetto all’incremento corrispondente della variabile 𝑥 (a volte denotato
con Δ𝑥 ). Cambiando variabile nel limite, per ℎ → 0 si avrà 𝑥 → 𝑥 0 e quindi

𝑓 (𝑥) − 𝑓 (𝑥 0 )
𝑓 0(𝑥0 ) = lim .
𝑥→𝑥 0 𝑥 − 𝑥0

Esempio 5.2. Si consideri la funzione 𝑓 (𝑥) = 1/𝑥 definita sull’insieme 𝐴 = ℝ \ {0}.


Si ha allora per ogni 𝑥 ≠ 0:
1 1
𝑥+ℎ − 𝑥 𝑥 − (𝑥 + ℎ) −1 1
𝑓 0(𝑥) = lim = lim = lim = − 2.
ℎ→0 ℎ ℎ→0 ℎ(𝑥 + ℎ)𝑥 ℎ→0 (𝑥 + ℎ)𝑥 𝑥

Risulta quindi che la funzione 1/𝑥 sia derivabile e la sua derivata è la funzione −1/𝑥 2 .

Teorema 5.3 (continuità delle funzioni derivabili). Se 𝑓 è derivabile nel punto 𝑥


allora 𝑓 è anche continua nel punto 𝑥 .

Dimostrazione. Si ha

𝑓 (𝑥 + ℎ) − 𝑓 (𝑥)
lim 𝑓 (𝑥 + ℎ) − 𝑓 (𝑥) = lim · ℎ = 𝑓 0(𝑥) · 0 = 0.
ℎ→0 ℎ→0 ℎ

Dunque 𝑓 (𝑥 + ℎ) → 𝑓 (𝑥) per ℎ → 0 e quindi 𝑓 è continua nel punto 𝑥 .

Esempio 5.4 (funzione continua ma non derivabile). La funzione 𝑓 (𝑥) = |𝑥| è un


esempio di funzione continua ma non derivabile. E’ infatti facile verificare che nel punto
𝑥0 = 0 il limite destro del rapporto incrementale è 1 mentre il limite sinistro è −1.

Un altro esempio è la funzione 𝑓 (𝑥) = 𝑥 che è continua ma non è derivabile nel punto
𝑥0 = 0 perché il limite del rapporto incrementale esiste ma è +∞.

Teorema 5.5 (derivata della funzione composta). Sia 𝑓 una funzione derivabile nel
punto 𝑥 0 e sia 𝑔 una funzione derivabile nel punto 𝑓 (𝑥 0 ). Allora la funzione composta
𝑔 ◦ 𝑓 è derivabile nel punto 𝑥0 e si ha:

(𝑔 ◦ 𝑓 )0(𝑥 0 ) = 𝑔 0( 𝑓 (𝑥0 )) · 𝑓 0(𝑥0 ).

Dimostrazione. Consideriamo la funzione


( 𝑔(𝑦)−𝑔( 𝑓 (𝑥
0 ))
𝑦− 𝑓 (𝑥0 )
se 𝑦 ≠ 𝑓 (𝑥 0 ),
𝐺(𝑦) =
𝑔 0( 𝑓 (𝑥 0 )) se 𝑦 = 𝑓 (𝑥 0 ).

Si avrà allora

𝑔( 𝑓 (𝑥0 + ℎ)) − 𝑔( 𝑓 (𝑥 0 )) 𝑓 (𝑥 0 + ℎ) − 𝑓 (𝑥0 )


= 𝐺( 𝑓 (𝑥0 + ℎ)) · (5.1)
ℎ ℎ
176 5 calcolo differenziale

infatti se 𝑓 (𝑥 0 + ℎ) ≠ 𝑓 (𝑥 0 ) abbiamo moltiplicato e diviso per 𝑓 (𝑥 0 + ℎ) − 𝑓 (𝑥 0 )


se invece 𝑓 (𝑥 0 + ℎ) = 𝑓 (𝑥 0 ) allora anche 𝑔( 𝑓 (𝑥 0 + ℎ)) = 𝑔( 𝑓 (𝑥 0 )) e l’uguaglianza
è ancora valida perché sia il lato sinistro che il lato destro si annullano (e il
valore assegnato a 𝐺 risulta in tal caso irrilevante).

Chiaramente quando ℎ → 0 il secondo fattore sul lato destro dell’uguaglianza


(5.1) tende, per definizione, a 𝑓 0(𝑥 0 ). Per quanto riguarda il primo fattore
osserviamo che 𝐺(𝑦), per come è stata definita, risulta essere una funzione
continua nel punto 𝑦 = 𝑓 (𝑥 0 ) in quanto

𝑔(𝑦) − 𝑔( 𝑓 (𝑥 0 ))
→ 𝑔 0( 𝑓 (𝑥0 ))
𝑦 − 𝑓 (𝑥0 )

per 𝑦 → 𝑓 (𝑥 0 ). Ma anche la funzione 𝑓 è continua nel punto 𝑥 0 (in quanto


derivabile). Dunque la funzione composta 𝐺( 𝑓 (𝑥 0 + ℎ)) è continua nel punto
ℎ = 0. Risulta quindi che 𝐺( 𝑓 (𝑥0 + ℎ)) → 𝐺( 𝑓 (𝑥0 )) = 𝑔 0( 𝑓 (𝑥0 )) per ℎ → 0.
Dunque il lato destro di (5.1) ha limite 𝑔 0( 𝑓 (𝑥 0 )) · 𝑓 0(𝑥 0 ) per ℎ → 0, come
volevamo dimostrare.

Teorema 5.6 (derivata della funzione inversa). Sia 𝑓 una funzione invertibile
derivabile in un punto 𝑥 0 e supponiamo che la funzione inversa 𝑓 −1 sia continua in
𝑓 (𝑥 0 ). Se 𝑓 0(𝑥0 ) ≠ 0 allora 𝑓 −1 è derivabile in 𝑓 (𝑥0 ) e vale:

1
( 𝑓 −1 )0( 𝑓 (𝑥0 )) = .
𝑓 0(𝑥 0)

Chiamato 𝑦0 = 𝑓 (𝑥 0 ) la formula può essere anche scritta nella forma:

1
( 𝑓 −1 )0(𝑦0 ) = .
𝑓 0( 𝑓 −1 (𝑦 0 ))

Se invece 𝑓 0(𝑥 0 ) = 0 la funzione 𝑓 −1 non è derivabile in 𝑓 (𝑥 0 ).

Osserviamo che se 𝑓 è definita in un intervallo e se è invertibile e continua in


tutto l’intervallo allora certamente l’inversa è continua (Esercizio 2.83).

Dimostrazione. Posto 𝑦0 = 𝑓 (𝑥 0 ) consideriamo il rapporto incrementale di 𝑓 −1


nel punto 𝑦0 :
𝑓 −1 (𝑦) − 𝑓 −1 (𝑦0 )
.
𝑦 − 𝑦0
Per 𝑦 → 𝑦0 possiamo fare il cambio di variabile 𝑥 = 𝑓 −1 (𝑦) in quanto avendo
assunto che 𝑓 −1 sia continua in 𝑓 (𝑥 0 ) sappiamo che se 𝑦 → 𝑦0 allora 𝑥 =
𝑓 −1 (𝑦) → 𝑓 −1 (𝑦0 ) = 𝑥 0 . Si ha allora per 𝑦 → 𝑦0 che 𝑥 → 𝑥0 e, se 𝑓 0(𝑥0 ) ≠ 0:

𝑓 −1 (𝑦) − 𝑓 −1 (𝑦0 ) 𝑥 − 𝑥0 1 1
= = → .
𝑦 − 𝑦0 𝑓 (𝑥) − 𝑓 (𝑥0 ) 𝑓 (𝑥)− 𝑓 (𝑥0 ) 𝑓 0(𝑥 0)
𝑥−𝑥 0

Se invece 𝑓 0(𝑥 0 ) = 0 il rapporto incrementale della funzione inversa ha limite


infinito e quindi la funzione inversa non è derivabile in 𝑓 (𝑥 0 ).
5.1 derivata 177

Teorema 5.7 (operazioni con le derivate). Siano 𝑓 e 𝑔 due funzioni derivabili in


uno stesso punto 𝑥 0 . Allora le funzioni 𝑓 + 𝑔 , 𝑓 − 𝑔 , 𝑓 · 𝑔 e, se 𝑔(𝑥 0 ) ≠ 0 anche 𝑓 /𝑔
sono funzioni derivabili in 𝑥 0 . Nei punti in cui entrambe le funzioni sono derivabili si
ha

( 𝑓 + 𝑔)0 = 𝑓 0 + 𝑔 0 , ( 𝑓 − 𝑔)0 = 𝑓 0 − 𝑔 0 ,
 0
0 0 0 𝑓 𝑓 0 𝑔 − 𝑓 𝑔0
( 𝑓 · 𝑔) = 𝑓 · 𝑔 + 𝑓 𝑔 , = .
𝑔 𝑔2

Dimostrazione. Per quanto riguarda la derivata della somma (o della differenza)


è sufficiente osservare che il rapporto incrementale della somma (o della
differenza) è la somma (o la differenza) dei rapporti incrementali e che il limite
della somma (o della differenza) è uguale alla somma (o la differenza) dei limiti.

Calcoliamo la derivata del prodotto 𝑓 · 𝑔 nel punto 𝑥 0 . Si ha

𝑓 (𝑥)𝑔(𝑥) − 𝑓 (𝑥0 )𝑔(𝑥 0 ) 𝑓 (𝑥)(𝑔(𝑥) − 𝑔(𝑥0 )) + ( 𝑓 (𝑥) − 𝑓 (𝑥0 ))𝑔(𝑥 0 )


=
𝑥 − 𝑥0 𝑥 − 𝑥0
𝑔(𝑥) − 𝑔(𝑥0 ) 𝑓 (𝑥) − 𝑓 (𝑥0 )
= 𝑓 (𝑥) + 𝑔(𝑥0 ).
𝑥 − 𝑥0 𝑥 − 𝑥0

Passando al limite per 𝑥 → 𝑥 0 ci ricordiamo che 𝑓 (𝑥) → 𝑓 (𝑥 0 ) in quanto 𝑓 è


continua in 𝑥 0 (essendo per ipotesi derivabile). I rapporti incrementali tendono
alle derivate e si ottiene quindi il risultato voluto 𝑓 (𝑥 0 )𝑔 0(𝑥 0 ) + 𝑓 0(𝑥 0 )𝑔(𝑥 0 ).

Per quanto riguarda la derivata del rapporto osserviamo che posto ℎ(𝑦) = 1/𝑦
si ha
𝑓 (𝑥)
= 𝑓 (𝑥) · ℎ(𝑔(𝑥)).
𝑔(𝑥)
Dall’esercizio già svolto sappiamo che ℎ 0(𝑦) = −1/𝑦 2 e dunque possiamo
utilizzare le formule per la derivata del prodotto e la derivata della funzione
composta per ottenere:
 0
𝑓
(𝑥0 ) = ( 𝑓 · (𝑔 ◦ ℎ))0(𝑥 0 )
𝑔
= 𝑓 0(𝑥 0 ) · ℎ(𝑔(𝑥0 )) + 𝑓 (𝑥0 ) · ℎ 0(𝑔(𝑥0 )) · 𝑔 0(𝑥0 )
𝑓 0(𝑥0 ) −1 0
= + 𝑓 (𝑥0 ) · 2 𝑔 (𝑥0 )
𝑔(𝑥0 ) 𝑔 (𝑥0 )
𝑓 0(𝑥0 )𝑔(𝑥0 ) − 𝑓 (𝑥0 )𝑔 0(𝑥0 )
= .
𝑔 2 (𝑥0 )

Teorema 5.8 (derivate delle funzioni elementari). Per 𝑚, 𝑞, 𝛼 ∈ ℝ, 𝛼 ≠ 0, 𝑛 ∈ ℕ ,


𝑛 ≠ 0 valgono le regole di derivazione riassunte nella tabella 5.1: le funzioni nella
colonna 𝑓 (𝑥) hanno la derivata riportata nella colonna 𝑓 0(𝑥). Le funzioni 𝑓 (𝑥) sono
derivabili nei punti in cui la corrispondente espressione 𝑓 0(𝑥) è ben definita. In

particolare: la funzione 𝑛 𝑥 non è derivabile in 𝑥 = 0, le funzioni arcsin 𝑥 e arccos 𝑥
non sono derivabili nei punti −1 e 1, la funzione |𝑥| non è derivabile in 0, la funzione
178 5 calcolo differenziale

Tabella 5.1: Derivate delle funzioni ele- 𝑓 (𝑥) 𝑓 0(𝑥) 𝑓 (𝑥) 𝑓 0(𝑥) 𝑓 (𝑥) 𝑓 0(𝑥)
mentari
𝑚𝑥 + 𝑞 𝑚 𝑒𝑥 𝑒𝑥 sin 𝑥 cos 𝑥
𝑥
|𝑥| |𝑥|
ln 𝑥 1
𝑥 cos 𝑥 − sin 𝑥
𝑥𝑛 𝑛𝑥 𝑛−1 sinh 𝑥 cosh 𝑥 arcsin 𝑥 √ 1
1−𝑥 2
𝑥𝛼 𝛼𝑥 𝛼−1 cosh 𝑥 sinh 𝑥 arccos 𝑥 −√ 1 2
√ 1−𝑥
𝑛
𝑥 √
𝑛
1
settsinh 𝑥 √ 1 tg 𝑥 1 + tg2 𝑥
√ 𝑛 𝑥 𝑛−1 𝑥 2 +1
𝑥 1

2 𝑥
settcosh 𝑥 √ 1 arctg 𝑥 1
1+𝑥 2
𝑥 2 −1

settcosh 𝑥 non è derivabile in 1. Le funzioni lineari, potenze con base positiva, potenze
con esponente intero, esponenziale, logaritmo, seno, coseno, tangente, arcotangente sono
invece derivabili in tutti i punti in cui sono definite.

Dimostrazione. Per quanto riguarda le funzioni lineari si ha:

𝑚(𝑥 + ℎ) + 𝑞 − (𝑚𝑥 + 𝑞)
(𝑚𝑥 + 𝑞)0 = lim = lim 𝑚 = 𝑚.
ℎ→0 ℎ ℎ→0

Ricordando che la derivata è un limite e che il limite in un punto dipende solo


dai valori della funzione in un intorno del punto, possiamo affermare che la
derivata del valore assoluto |𝑥| coincide con la derivata di 𝑥 cioè 1 sugli 𝑥 > 0
e coincide con la derivata di −𝑥 sugli 𝑥 < 0. Dunque 𝐷|𝑥| = 𝑥/|𝑥| se 𝑥 ≠ 0.
Se 𝑥 = 0 i limiti destro e sinistro del rapporto incrementale di |𝑥| tendono
rispettivamente a 1 e −1 e quindi la derivata non esiste.

Dimostriamo che 𝐷𝑥 𝑛 = 𝑛𝐷𝑥 𝑛−1 per 𝑛 ∈ ℕ , 𝑛 > 0, per induzione su 𝑛 .


Per 𝑛 = 1 abbiamo 𝑥 𝑛 = 𝑥 1 è lineare e quindi dalla formula precedente
𝐷𝑥 1 = 1 = 1 · 𝑥 0 . Supponendo di sapere che 𝐷𝑥 𝑛 = 𝑛𝑥 𝑛−1 si ha, applicando la
regola di derivazione del prodotto:

𝐷𝑥 𝑛+1 = 𝐷𝑥 · 𝑥 𝑛 = 1 · 𝑥 𝑛 + 𝑥 · 𝑛𝑥 𝑛−1 = 𝑥 𝑛 + 𝑛𝑥 𝑛 = (𝑛 + 1)𝑥 𝑛

dimostrando dunque il passo induttivo. Ricordando la formula di derivazione


del rapporto possiamo trovare la formula per le potenze con esponente intero
negativo:
1 −𝑛𝑥 𝑛−1
𝐷𝑥 −𝑛 = 𝐷 𝑛 = = −𝑛𝑥 𝑛−1−2𝑛 = −𝑛𝑥 −𝑛−1 .
𝑥 𝑥 2𝑛

La derivata della radice 𝑛 -esima si trova con la formula di derivazione della


funzione inversa 𝑥 𝑛 , che può essere applicata se 𝑥 ≠ 0:

√ 1 1
𝐷 𝑛𝑥 = √ = √ .
𝑛( 𝑛 𝑥)𝑛−1 𝑛
𝑛 𝑥 𝑛−1
Osserviamo che se 𝑛 è dispari la formula è valida anche per 𝑥 < 0. La derivata
della radice quadrata si ottiene ponendo 𝑛 = 2.

Per quanto riguarda la derivata dell’esponenziale ci riconduciamo ad un limite


notevole:

𝑒 𝑥+ℎ − 𝑒 𝑥 𝑒𝑥𝑒ℎ − 𝑒𝑥 𝑒ℎ − 1
𝐷𝑒 𝑥 = lim = lim = lim 𝑒 𝑥 = 𝑒𝑥.
ℎ→0 ℎ ℎ→0 ℎ ℎ→0 ℎ
5.1 derivata 179

La derivata del logaritmo si ottiene come derivata della funzione inversa


dell’esponenziale:
1 1
𝐷 ln 𝑥 = ln 𝑥 = .
𝑒 𝑥
Possiamo quindi calcolare la derivata delle potenze con base positiva e esponente
reale qualunque:

1
𝐷𝑥 𝛼 = 𝐷𝑒 𝛼 ln 𝑥 = 𝑒 𝛼 ln 𝑥 𝐷(𝛼 ln 𝑥) = 𝑥 𝛼 𝛼 = 𝛼𝑥 𝛼−1 .
𝑥

Per quanto riguarda le funzioni trigonometriche sin e cos ci ricordiamo dei


limiti notevoli:
sin ℎ 1 − cos ℎ 1 − cos ℎ 1
lim = 1, lim = lim ℎ · = 0 · = 0.
ℎ→0 ℎ ℎ→0 ℎ ℎ→0 ℎ2 2

Applicando le formule di addizione si ha

sin(𝑥 + ℎ) − sin(𝑥)
𝐷 sin 𝑥 = lim
ℎ→0 ℎ
sin(𝑥) cos(ℎ) + cos(𝑥) sin(ℎ) − sin(𝑥)
= lim
ℎ→0 ℎ
cos ℎ − 1 sin ℎ
= lim sin(𝑥) + cos(𝑥) = cos(𝑥).
ℎ→0 ℎ ℎ

e similmente

cos(𝑥 + ℎ) − cos(𝑥)
𝐷 cos 𝑥 = lim
ℎ→0 ℎ
cos(𝑥) cos(ℎ) − sin(𝑥) sin(ℎ) − cos(𝑥)
= lim
ℎ→0 ℎ
cos ℎ − 1 sin ℎ
= lim cos(𝑥) − sin(𝑥) = − sin(𝑥)
ℎ→0 ℎ ℎ

La funzioni arcsin è definita come l’inversa della restrizione della funzione sin
all’intervallo [−𝜋/2 , 𝜋/2]. Nell’intervallo aperto (−𝜋/2 , 𝜋/2) la funzione sin ha
derivata positiva e dunque risulta che la funzione inversa (che sappiamo essere
continua) è derivabile in (−1 , 1) e la sua derivata è

1 1 1
𝐷 arcsin 𝑥 = =√ =√ .
cos(arcsin 𝑥) 1 − sin arcsin 𝑥
2 1 − 𝑥2
q
Si ha infatti cos 𝑦 = 1 − sin2 𝑦 se 𝑦 ∈ [−𝜋/2 , 𝜋/2].

Analogamente la funzione arccos è definita come l’inversa della restrizione di


cos all’intervallo [0 , 𝜋] e si ha quindi, per 𝑥 ∈ (−1 , 1)

1 1 1
𝐷 arccos 𝑥 = = √ = −√ .
− sin(arccos 𝑥) − 1 − cos2 arccos 𝑥 1 − 𝑥2

Si ha infatti sin 𝑦 =
p
1 − cos2 𝑦 se 𝑦 ∈ [0 , 𝜋].

Nei punti 𝑥 = 1 e 𝑥 = −1 le funzioni arcsin e arccos non sono invece derivabili.


180 5 calcolo differenziale

Per la funzione tangente possiamo utilizzare la formula di derivazione del


rapporto:

sin 𝑥 cos 𝑥 · cos 𝑥 − sin 𝑥 · (− sin 𝑥)


𝐷 tg 𝑥 = 𝐷 =
cos 𝑥 cos2 𝑥
cos 𝑥 + sin 𝑥
2 2
1
= = 1 + tg2 𝑥 = .
cos2 𝑥 cos2 𝑥
Usando la formula della derivata della funzione inversa si ha
1 1
𝐷 arctg 𝑥 = = .
1 + tg2 (arctg 𝑥) 1 + 𝑥2

Per quanto riguarda le funzioni iperboliche le derivate di sinh e cosh si ri-


conducono immediatamente alla derivata dell’esponenziale, utilizzando la
definizione (3.19). Le derivate delle funzioni inverse settsinh e settcosh si ot-
tengono dalla formula per la derivata della funzione inversa e utilizzando le
p p
relazioni cosh 𝑥 = sinh2 𝑥 + 1 e, per 𝑥 > 0, sinh 𝑥 = cosh2 𝑥 − 1:

1 1 1
𝐷 settsinh 𝑥 = =p =√
cosh(settsinh 𝑥) sinh2 (settsinh 𝑥) + 1 𝑥2 + 1
1 1 1
𝐷 settcosh 𝑥 = =p =√
sinh(settcosh 𝑥) cosh (settcosh 𝑥) − 1
2 𝑥 −1
2

Proposizione 5.9 (trucco di Feynman per le derivate). Siano 𝑓1 , . . . , 𝑓𝑛 funzioni


derivabili e siano 𝛼 1 , . . . , 𝛼 𝑛 esponenti reali. Allora:
!0
𝑛
Y 𝛼
𝑛
Y 𝑛
X 𝑓 𝑘0
𝑓𝑘 𝑘 = 𝑓𝑘 · 𝛼𝑘 .
𝑘=1 𝑘=1 𝑘=1
𝑓𝑘

Dimostrazione. Basta osservare che


!
𝑛
Y 𝛼
𝑛
X 𝛼 𝑘 −1
Y 𝛼𝑗
𝑛
X 𝑓 𝑘0 Y
𝑛
𝛼𝑗
𝑓𝑘 𝑘 = 𝛼 𝑘 𝑓 𝑘0 𝑓 𝑘 𝑓𝑗 = 𝛼𝑘 𝑓𝑗 .
𝑘=1 𝑘=1 𝑗≠𝑘 𝑘=1
𝑓𝑘 𝑗=1

Se ad esempio vogliamo calcolare la derivata della funzione



1 − 𝑥 2 · ln 𝑥 1
= (1 − 𝑥 2 ) 2 · ln 𝑥 · 𝑥 −1 · (cos 𝑥)−2
𝑥 · cos 𝑥
2

otteniamo

1 − 𝑥 2 · ln 𝑥 1 −2 𝑥 − sin 𝑥
 
1 1
· · + − −2 .
𝑥 · sin2 𝑥 2 1 − 𝑥 2 𝑥 ln 𝑥 𝑥 cos 𝑥
5.2 derivate parziali 181

5.2 derivate parziali

Capita a volte di avere funzioni che dipendono da più variabili o da parametri.


Ad esempio la funzione 𝑓 (𝑥, 𝑦) = 𝑥 2 𝑦 + 𝑦 2 è una funzione definita sulle coppie
di numeri reali: 𝑓 : ℝ2 → ℝ. Se considero una delle due variabili, ad esempio
la prima variabile 𝑥 , come un parametro fissato, posso identificare la funzione 𝑓
come una funzione 𝑔 : ℝ → (ℝℝ ) che ad ogni valore del parametro 𝑥 restituisce
una funzione della variabile 𝑦 :

𝑔(𝑥)(𝑦) = 𝑓 (𝑥, 𝑦).

Dunque per ogni 𝑥 fissato, posso considerare la funzione ℎ = 𝑔(𝑥) che è una
funzione della sola variabile 𝑦 : ℎ(𝑦) = 𝑔(𝑥)(𝑦) = 𝑓 (𝑥, 𝑦). E posso quindi farne
la derivata ℎ 0(𝑦) in qualunque punto 𝑦 . Il valore che ottengo si chiama derivata
parziale della funzione 𝑓 rispetto alla variabile 𝑦 calcolata nel punto (𝑥, 𝑦). Per derivata parziale
fare il calcolo della derivata possiamo applicare le usuali regole di derivazione
facendo attenzione che se stiamo facendo la derivata rispetto a 𝑦 la variabile 𝑥
va trattata come se fosse costante, perché stiamo in effetti fissando 𝑥 prima di
fare la derivata. Se 𝑓 (𝑥, 𝑦) = 𝑥 2 𝑦 + 𝑦 2 si ottiene dunque: ℎ 0(𝑦) = 𝑥 2 + 2 𝑦 . Se ora Se non siamo abituati a pensare che 𝑥
possa essere un valore fissato si provi a
consideriamo anche 𝑥 variabile otteniamo una nuova funzione di due variabili sostituire la variabile 𝑥 con una lettera
(𝑥, 𝑦) ↦→ 𝑔(𝑥)0(𝑦) = ℎ 0(𝑦) che può essere scritta cone le seguenti notazioni: diversa come 𝑐 o 𝜋 che ci dà l’idea di
una quantità costante.
𝜕 𝑓 (𝑥, 𝑦) 𝜕 𝑓 Si osservi che per le funzioni di più va-
= (𝑥, 𝑦) = 𝐷 𝑦 𝑓 (𝑥, 𝑦) = 𝑓 𝑦 (𝑥, 𝑦)
𝜕𝑦 𝜕𝑦 riabili c’è una ambiguità di fondo nelle
notazioni. Infatti se ho una espressione
= 𝐷2 𝑓 (𝑥, 𝑦) = 𝑓,2 (𝑥, 𝑦) in due variabili come 𝑥 2 𝑦 + 𝑦 2 è chiaro
= ℎ 0(𝑦) che questa rappresenta una funzione di
due variabili ma non è del tutto ovvio di-
re quale è la prima variabile e quale è la
seconda. Normalmente le variabili ven-
Analogamente potremmo fare la derivata parziale di 𝑓 rispetto alla prima
gono indicate in ordine alfabetico a par-
variabile 𝑥 . Se 𝑓 (𝑥, 𝑦) = 𝑥 2 𝑦 + 𝑦 2 si ottiene tire dalla 𝑥 ... ma è solo una convenzione.
In principio l’espressione 𝑥 2 𝑦 + 𝑦 2 po-
𝜕 𝑓 (𝑥, 𝑦) trebbe anche rappresentare una funzio-
= 2 𝑥 𝑦. ne di tre variabili 𝑥, 𝑦, 𝑧 . Dunque se ho
𝜕𝑥
una espressione che utilizza certi nomi
per le variabili è naturale usare gli stessi
Stiamo qui trattando le funzioni di più variabili come se fossero funzioni di nomi nel simbolo utilizzato per la deri-
una sola variabile dipendenti da altri parametri. Questo perché stiamo facendo vata parziale come nella notazione 𝐷 𝑦 .
Se invece le variabili non hanno un nome
un corso di analisi sulle funzioni di una variabile (reale). Per trattare tutte sarebbe più sensato indicare la variabile
le variabili come una unica variabile multidimensionale bisogna fare diverse dandone la posizione numerica come
considerazioni aggiuntive che vengono trattate nei corsi di analisi sulle funzioni nella notazione 𝐷2 . Ci sono casi in cui
di più variabili (reali). Verranno in tal caso introdotti i concetti di gradiente ∇ 𝑓 , la notazione può essere molto ambigua,
𝜕 𝑓 (𝑦,𝑥)
derivata 𝐷 𝑓 e differenziale 𝑑 𝑓 che noi non affronteremo qui. come ad esempio se scrivessi 𝜕𝑦
: sto
derivando 𝑓 rispetto alla prima varia-
bile oppure derivo 𝑓 (𝑥, 𝑦) rispetto alla
seconda variabile e poi scambio le due
variabili?
5.3 punti notevoli

In questa sezione introdurremo una terminologia che è largamente utilizzata


nello studio di funzione. Cercheremo di dare delle definizioni anche per alcuni
termini su cui potrebbe non esserci un consenso univoco. Ricordiamoci di non
usare queste definizioni in modo troppo formale: sarà sempre meglio verificare
182 5 calcolo differenziale

che il nostro interlocutore ci comprenda perché spesso alcuni termini potrebbero


essere utilizzati in maniera impropria o con significati leggermente diversi.

Nel dubbio potremo sempre evitare di utilizzare questa terminologia ricondu-


cendoci ai concetti sottostanti.

Definizione 5.10 (punti notevoli). Sia 𝑓 : 𝐴 ⊆ ℝ → ℝ una funzione. Se 𝑓 è


punto critico
derivabile in un punto 𝑥 0 ∈ 𝐴 e 𝑓 0(𝑥 0 ) = 0 diremo che 𝑥 0 è un punto critico o punto
stazionario di 𝑓 .

Se 𝑥 0 ∈ 𝐴 ed esiste un intorno 𝑈 di 𝑥 0 per cui 𝑥 0 risulta essere un punto di minimo


(rispettivamente di massimo) per 𝑓 ristretta ad 𝑈 diremo che 𝑥 0 è un punto di minimo
minimo relativo
relativo o minimo locale (rispettivamente massimo relativo o massimo locale). Per
contrapposizione i punti di massimo e minimo su tutto il dominio 𝐴 vengono anche
chiamati massimo/minimo assoluto di 𝑓 .
punto di flesso
Diremo che 𝑥 0 ∈ 𝐴 è un punto di flesso per 𝑓 se 𝑓 è derivabile in un intorno di 𝑥 0
e 𝑥 0 è un punto di massimo o minimo relativo per 𝑓 0. Nel punto 𝑥 0 la retta tangente
ha equazione 𝑦 = 𝑟(𝑥) = 𝑓 0(𝑥 0 )(𝑥 − 𝑥 0 ) + 𝑓 (𝑥 0 ). Se 𝑥 0 è minimo per 𝑓 0 risulta che
𝑓 (𝑥) − 𝑟(𝑥) è crescente quindi 𝑓 (𝑥) ≥ 𝑟(𝑥) per 𝑥 ≥ 𝑥0 e 𝑓 (𝑥) ≤ 𝑟(𝑥) per 𝑥 ≤ 𝑥 0
(il grafico della funzione attraversa la retta tangente da sotto a sopra) mentre se 𝑥 0 è
massimo per 𝑓 0 risulta che 𝑓 (𝑥) ≤ 𝑟(𝑥) per 𝑥 ≥ 𝑥 0 e 𝑓 (𝑥) ≥ 𝑟(𝑥) per 𝑥 ≤ 𝑥 0 (il
grafico della funzione attraversa la tangente da sopra a sotto). Se la funzione 𝑓 non è
flesso verticale derivabile in 𝑥 0 ma il limite del rapporto incrementale esiste ed è infinito, diremo che
𝑥0 è un flesso verticale. In tale punto la retta tangente è verticale e il grafico della
funzione attraversa tale retta.

Sia 𝑥 0 ∈ 𝐴 un punto in cui la funzione 𝑓 è continua ed esistono i limiti destro e sinistro


del rapporto incrementale (che si chiamano derivata destra e derivata sinistra)

𝑓 (𝑥 + ℎ) − 𝑓 (𝑥)
𝑚 ± = lim± .
ℎ→0 ℎ
punto angoloso Se 𝑚 + ≠ 𝑚 − chiaramente 𝑓 non è derivabile in 𝑥 0 . Se entrambi 𝑚 + ed 𝑚 − sono finiti
diremo che 𝑥 0 è un punto angoloso in quanto le due semirette tangenti in 𝑥 0 (da
punto di cuspide destra e da sinistra) formano un angolo non piatto. Se 𝑚 + = −𝑚 − = +∞ oppure se
𝑚 + = −𝑚 − = −∞ diremo che il punto 𝑥0 è un punto di cuspide (c’è una semiretta
tangente verticale).

Definizione 5.11 (asintoti). Diremo che la retta 𝑦 = 𝑚𝑥 + 𝑞 è un asintoto per il


grafico di 𝑓 per 𝑥 → +∞ se risulta

lim 𝑓 (𝑥) − (𝑚𝑥 + 𝑞) = 0.


asintoto orizzontale e obliquo 𝑥→+∞

Se 𝑚 = 0 diremo che il grafico di 𝑓 ha un asintoto orizzontale 𝑦 = 𝑞 altrimenti


diremo che 𝑦 = 𝑚𝑥 + 𝑞 è un asintoto obliquo. Stessa cosa si può dire per 𝑥 → −∞.

Se 𝑥 0 ∈ ℝ e si ha
asintoto verticale lim | 𝑓 (𝑥)| = +∞
𝑥→𝑥0

diremo che la retta 𝑥 = 𝑥 0 è un asintoto verticale per il grafico della funzione 𝑓 .


5.4 criteri di monotonia 183

Definizione 5.12 (punti di discontinuità). Se per 𝑥 0 ∈ ℝ si ha

lim 𝑓 (𝑥) = ℓ 1 , lim 𝑓 (𝑥) = ℓ 2


𝑥→𝑥 0− 𝑥→𝑥 0+

e se ℓ 1 ≠ ℓ 2 diremo che nel punto 𝑥 0 la funzione 𝑓 ha una discontinuità a salto. Se discontinuità a salto
ℓ1 = ℓ2 e se 𝑓 non è definita nel punto 𝑥 0 oppure se 𝑓 (𝑥0 ) ≠ ℓ1 diremo che nel punto 𝑥0
la funzione 𝑓 ha una discontinuità eliminabile. discontinuità eliminabile

Si osservi che, nonostante la terminologia utilizzata, una funzione continua può


𝑥
avere una discontinuità a salto (ad esempio: 𝑓 (𝑥) = |𝑥| ) e può anche avere una
discontinuità eliminabile (ad esempio: 𝑓 (𝑥) = 𝑥𝑥 ).

5.4 criteri di monotonia

Teorema 5.13 (Fermat). Sia 𝑓 : (𝑎, 𝑏) → ℝ una funzione derivabile. Se 𝑥 0 ∈ (𝑎, 𝑏)


è un punto di massimo o minimo per 𝑓 allora 𝑓 0(𝑥 0 ) = 0.

Dimostrazione. Senza perdere di generalità possiamo suppore che 𝑥 0 sia un


punto di massimo per 𝑓 . Sappiamo che

𝑓 (𝑥) − 𝑓 (𝑥 0 )
𝑓 0(𝑥0 ) = lim .
𝑥→𝑥 0 𝑥 − 𝑥0

Visto che 𝑥 0 è un punto dell’intervallo aperto (𝑎, 𝑏) la funzione 𝑓 è definita in


un intorno destro di 𝑥 0 e quindi possiamo restingere il limite ai valori 𝑥 > 𝑥 0
ottenendo:
𝑓 (𝑥) − 𝑓 (𝑥0 )
𝑓 0(𝑥0 ) = lim+ .
𝑥→𝑥 0 𝑥 − 𝑥0
Visto che 𝑥 0 è un punto di massimo per 𝑓 sappiamo che 𝑓 (𝑥) − 𝑓 (𝑥 0 ) ≤ 0.
Essendo 𝑥 − 𝑥 0 > 0 l’intero rapporto incrementale risulta essere non positivo.
Dunque, per il teorema della permanenza del segno, possiamo concludere che
𝑓 0(𝑥0 ) ≤ 0.
Ma possiamo anche restringere la funzione ad un intorno sinistro di 𝑥 0 e
osservare che
𝑓 (𝑥) − 𝑓 (𝑥0 )
𝑓 0(𝑥0 ) = lim− .
𝑥→𝑥 0 𝑥 − 𝑥0
Ma ora il numeratore è, come prima, non positivo mentre il denominatore 𝑥 − 𝑥 0
è negativo. Dunque il rapporto incrementale stavolta è non negativo e quindi,
per la permanenza del segno, 𝑓 0(𝑥 0 ) ≥ 0.
Abbiamo scoperto quindi che 𝑓 0(𝑥 0 ) ≤ 0 e 𝑓 0(𝑥 0 ) ≥ 0 da cui deduciamo
𝑓 0(𝑥0 ) = 0.

Il teorema di Fermat si può enunciare dicendo che ogni punto di massimo


o minimo relativo interno al dominio di una funzione in cui la funzione è
derivabile è necessariamente un punto critico. In particolare per determinare
massimi e minimi assoluti e relativi di una funzione sarà sufficiente esaminare i
punti di frontiera, i punti di non derivabilità e i punti critici.
184 5 calcolo differenziale

Rolle Teorema 5.14 (Rolle). Sia 𝑓 : [𝑎, 𝑏] → ℝ una funzione continua su tutto [𝑎, 𝑏] e
derivabile su (𝑎, 𝑏). Se 𝑓 (𝑎) = 𝑓 (𝑏) allora esiste 𝑥 0 ∈ (𝑎, 𝑏) tale che 𝑓 0(𝑥 0 ) = 0.

Dimostrazione. Essendo 𝑓 una funzione continua possiamo applicare il teorema


di Weiestrass per dedurre che 𝑓 ha massimo e minimo sull’intervallo chiuso e
limitato [𝑎, 𝑏]. Se il punto di massimo o il punto di minimo sta nell’intervallo
aperto (𝑎, 𝑏) possiamo applicare il teorema di Fermat per ottenere che la derivata
di 𝑓 si annulla in tale punto.

In caso contrario sia il punto di massimo che il punto di minimo sono estremi
dell’intervallo, cioè sono uguali ad 𝑎 o a 𝑏 . Ma visto che 𝑓 (𝑎) = 𝑓 (𝑏) i valori
massimo e minimo coincidono e quindi la funzione è costante. Ma in tal caso
𝑓 0(𝑥) = 0 per ogni 𝑥 ∈ [𝑎, 𝑏].
Lagrange

Teorema 5.15 (Lagrange). Sia 𝑓 : [𝑎, 𝑏] → ℝ una funzione continua su [𝑎, 𝑏] e


derivabile su (𝑎, 𝑏). Allora esiste un punto 𝑥 0 ∈ (𝑎, 𝑏) tale che

𝑓 (𝑏) − 𝑓 (𝑎)
𝑓 0(𝑥0 ) =
𝑏−𝑎

Dimostrazione. Consideriamo la funzione ausiliaria:

𝑓 (𝑏) − 𝑓 (𝑎)
𝑔(𝑥) = 𝑓 (𝑥) − 𝑥.
𝑏−𝑎
Per verifica diretta si osserva che

𝑏 𝑓 (𝑎) − 𝑎 𝑓 (𝑏)
𝑔(𝑏) = 𝑔(𝑎) = .
𝑏−𝑎
La funzione 𝑔 soddisfa quindi le ipotesi del teorema di Rolle e dunque esisterà
𝑥0 ∈ (𝑎, 𝑏) tale che 𝑔 0(𝑥0 ) = 0. Ma si osserva che

𝑓 (𝑏) − 𝑓 (𝑎)
𝑔 0(𝑥) = 𝑓 0(𝑥) −
𝑏−𝑎
criteri di monotonia
e dunque se 𝑔 0(𝑥 0 ) = 0 si ottiene il risultato desiderato.

Teorema 5.16 (criteri di monotonia). Sia 𝑓 : 𝐼 → ℝ una funzione definita su un


intervallo 𝐼 ⊆ ℝ. Sia 𝐽 = (inf 𝐼, sup 𝐼) l’intervallo aperto con gli stessi estremi di 𝐼 .
Supponiamo che 𝑓 sia continua su 𝐼 e derivabile su 𝐽 . Allora valgono i seguenti criteri:

1. (∀𝑥 ∈ 𝐽: 𝑓 0(𝑥) ≥ 0) ⇐⇒ 𝑓 è crescente (su tutto 𝐼 );


2. (∀𝑥 ∈ 𝐽: 𝑓 0(𝑥) ≤ 0) ⇐⇒ 𝑓 è decrescente (su tutto 𝐼 );
3. (∀𝑥 ∈ 𝐽: 𝑓 0(𝑥) = 0) ⇐⇒ 𝑓 è costante (su tutto 𝐼 );
4. (∀𝑥 ∈ 𝐽: 𝑓 0(𝑥) > 0) =⇒ 𝑓 è strettamente crescente (su tutto 𝐼 );
5. (∀𝑥 ∈ 𝐽: 𝑓 0(𝑥) < 0) =⇒ 𝑓 è strettamente decrescente (su tutto 𝐼 ).

Dimostrazione. Dimostriamo innanzitutto le implicazioni da sinistra verso


destra.
5.4 criteri di monotonia 185

Per la prima, se 𝑓 non fosse crescente ci dovrebbero essere due punti 𝑎, 𝑏 ∈ 𝐼


tali che 𝑎 < 𝑏 ma 𝑓 (𝑎) > 𝑓 (𝑏). Dunque si avrebbe

𝑓 (𝑏) − 𝑓 (𝑎)
< 0.
𝑏−𝑎
Applicando il teorema di Lagrange all’intervallo [𝑎, 𝑏] si troverebbe un punto
𝑥 ∈ (𝑎, 𝑏) tale che 𝑓 0(𝑥) < 0. Chiaramente (𝑎, 𝑏) ⊆ 𝐽 e quindi questo contraddice
l’ipotesi 𝑓 0(𝑥) ≥ 0.

La seconda implicazione (per le funzioni decrescenti) si dimostra in maniera


analoga cambiando verso alle disuguaglianze.

Anche la terza implicazione si dimostra tramite il teorema di Lagrange in modo


analogo alle precedenti. Oppure basta osservare che se 𝑓 0(𝑥) = 0 allora valgono
contemporaneamente 𝑓 0(𝑥) ≥ 0 e 𝑓 0(𝑥) ≤ 0 quindi mettendo insieme le prime
due implicazioni si ottiene che 𝑓 è contemporaneamente crescente e decrescente
dunque è costante.

Per la quarta implicazione si procede come per la prima. Per assurdo si avrebbero
𝑎 < 𝑏 con 𝑓 (𝑏) ≤ 𝑓 (𝑎). Ma allora

𝑓 (𝑏) − 𝑓 (𝑎)
≤0
𝑏−𝑎
e applicando il teorema di Lagrange si troverebbe un punto 𝑥 ∈ (𝑎, 𝑏) con
𝑓 0(𝑥) ≤ 0, contro l’ipotesi 𝑓 0(𝑥) > 0.

La quinta implicazione si dimostra in maniera analoga cambiando verso alle


disuguaglianze.

Vediamo ora le implicazioni da destra verso sinistra. Per la prima, supponiamo


che 𝑓 sia crescente e prendiamo 𝑥 ∈ 𝐽 . Allora è chiaro che per ogni ℎ > 0 si avrà
𝑓 (𝑥 + ℎ) ≥ 𝑓 (𝑥) e dunque

𝑓 (𝑥 + ℎ) − 𝑓 (𝑥)
≥ 0.

Facendo il limite per ℎ → 0+ si ottiene 𝑓 0(𝑥) e, per la permanenza del segno,
dovra essere 𝑓 0(𝑥) ≥ 0.

In maniera analoga (invertendo le disuguaglianze) si dimostra la seconda


implicazione.

La terza discende dalle prime due oppure, più semplicemente, dalle regole di
derivazione, in quanto la derivata di una costante è zero.

Esempio 5.17. La funzione 𝑓 (𝑥) = 1/𝑥 è definita su ℝ \ {0}, è derivabile e la derivata


𝑓 0(𝑥) = −1/𝑥 2 è ovunque negativa. La funzione 𝑓 è quindi strettamente decrescente
separatamente sui due intervalli (0 , +∞) e (−∞, 0) sui quali possiamo applicare il
criterio di monotonia. Ma non è decrescente su tutto il suo dominio in quanto, ad
esempio, 𝑓 (−1) = −1 < 1 = 𝑓 (1). Questo esempio mostra che nei criteri di monotonia
l’ipotesi che il dominio sia un intervallo è fondamentale.
186 5 calcolo differenziale

Esercizio 5.18. Determinare base e altezza di una lattina cilindrica di volume 33 𝑐𝑙


che a parità di volume ha la minima superficie totale.

Svolgimento. Sia 𝑉 il volume, 𝑆 l’area della superficie totale, ℎ l’altezza e 𝑟 il


raggio di base del cilindro. Sappiamo che

𝑉 = 𝜋ℎ𝑟 2 𝑆 = 2𝜋𝑟 ℎ + 2𝜋𝑟 2 .

Ricavando ℎ dalla prima equazione e sostituendo nella seconda otteniamo

𝑉 2𝑉
𝑆 = 2𝜋𝑟 + 2𝜋𝑟 2 = + 2𝜋𝑟 2 .
𝜋𝑟 2 𝑟
La funzione 𝑆(𝑟) è definita e continua su (0 , +∞) e si ha 𝑆(𝑟) → +∞ per 𝑟 → 0+
e anche per 𝑟 → +∞. Dunque 𝑆 ammette minimo per il teorema di Weierstrass
generalizzato. Per trovare il minimo basterà calcolare la derivata

𝑑𝑆 2𝑉 4𝜋𝑟 3 − 2𝑉
= − 2 + 4𝜋𝑟 =
𝑑𝑟 𝑟 𝑟2
e trovare i punti critici
4𝜋𝑟 3 = 2𝑉
da cui
r
𝑉3
𝑟= ≈ 3.74 𝑐𝑚
2𝜋
𝑉
ℎ= ≈ 7.49 𝑐𝑚.
𝜋𝑟 2

Esercizio 5.19. Risolvere l’equazione

𝑒 𝑥 = 𝑥3 . (5.2)

Svolgimento. Il lato sinistro dell’equazione è un numero positivo e quindi


certamente possiamo supporre che sia 𝑥 > 0 altrimenti il lato destro non
sarebbe anch’esso positivo. Possiamo quindi prendere il logaritmo di ambo i
membri e ottenere l’equazione

𝑥 = 3 ln 𝑥

che è equivalente all’equazione data.

Consideriamo allora la funzione

𝑓 (𝑥) = 𝑥 − 3 ln 𝑥

cosicché le soluzioni cercate risultano essere gli zeri di 𝑓 . Si ha

3
𝑓 0(𝑥) = 1 −
𝑥
5.4 criteri di monotonia 187

e possiamo quindi affermare che 𝑓 0(𝑥) ≷ 0 se e solo se Il simbolo ≷ serve per indicare che que-
sta diseguazione e le seguenti possono
3 essere scritte sia con il segno > che con
1≷ il segno < pur di prendere in tutte lo
𝑥
stesso segno.
ovvero (ricordiamo che stiamo supponendo 𝑥 > 0)

𝑥 ≷ 3.

Cioè: se 𝑥 > 3 si ha 𝑓 0(𝑥) > 0 e di conseguenza (teorema 5.16) 𝑓 è strettamente


crescente se ristretta all’intervallo [3 , +∞), se invece 𝑥 < 3 si ha 𝑓 0(𝑥) < 0 e di
conseguenza 𝑓 è strettamente decrescente se ristretta all’intervallo (0 , 3]. Per
capire se la funzione 𝑓 si annulla in qualche punto dobbiamo ora valutare 𝑓
negli estremi degli intervalli su cui risulta monotona. Si ha

lim 𝑓 (𝑥) = +∞, 𝑓 (3) = 3(1 − ln 3) < 0, lim 𝑓 (𝑥) = +∞.


𝑥→0+ 𝑥→+∞

Osserviamo quindi che agli estremi degli intervalli (0 , 3] e [3 , +∞) la funzione


assume segni opposti e quindi, per il teorema degli zeri (teorema 2.80), deve
annullarsi almeno una volta in ognuno dei due intervalli. D’altra parte su
ognuno dei due intervalli la funzione è strettamente monotona e quindi iniettiva,
dunque non può annullarsi più di una volta. Deduciamo quindi che la funzione
𝑓 si annulla in esattamente due punti 𝑥1 , 𝑥2 con

0 < 𝑥1 < 3 < 𝑥2 .

I punti 𝑥 1 e 𝑥 2 sono quindi univocamente determinati e possono essere calcolati,


con un errore piccolo a piacere, utilizzando il metodo di bisezione, come
abbiamo visto nella dimostrazione del teorema degli zeri.

Esempio 5.20. Si consideri la funzione

1
𝑓 (𝑥) = arctg 𝑥 + arctg .
𝑥
Si ha
1 1 −1 1 1
𝑓 0(𝑥) = + = − 2 = 0.
1+𝑥 2
1 + 𝑥2 𝑥
1 2 1+𝑥 2 𝑥 +1

Osserviamo che la funzione 𝑓 è definita su ℝ \ {0} che non è un intervallo ma è unione


di due intervalli disgiunti: (−∞, 0) ∪ (0 , +∞). Possiamo allora applicare i criteri di
monotonia separatamente ai due intervalli ottenendo che 𝑓 (𝑥) è costante su ognuno dei
due intervalli. Dunque esisteranno 𝑐 1 e 𝑐 2 tali che
(
𝑐1 se 𝑥 > 0,
𝑓 (𝑥) =
𝑐2 se 𝑥 < 0.

Possiamo determinare facilmente 𝑐 1 e 𝑐 2 osservando che


𝜋
𝑐 1 = 𝑓 (1) = arctg 1 + arctg 1 =
2
𝜋
𝑐 2 = 𝑓 (−1) = arctg(−1) + arctg(−1) = − .
2
188 5 calcolo differenziale

In effetti la funzione 𝑓 pur avendo derivata nulla non è costante ma solo


localmente costante.

Esempio 5.21. Consideriamo la funzione 𝑓 (𝑥) = 𝑥 3 la cui derivata è 𝑓 0(𝑥) = 3 𝑥 2 . Per


ogni 𝑥 ∈ ℝ si ha 𝑓 0(𝑥) ≥ 0 dunque possiamo dedurre che 𝑓 è crescente. Scelto invece
𝐼 = [0 , +∞) l’intervallo aperto corrispondente è 𝐽 = (0 , +∞). Osserviamo che su 𝐽 si
ha 𝑓 0(𝑥) > 0 quindi possiamo concludere che 𝑓 è strettamente crescente su tutto 𝐼 . Lo
stesso vale per l’intervallo (−∞, 0]. Mettendo insieme le due cose possiamo concludere
che 𝑓 (𝑥) = 𝑥 3 è strettamente crescente su tutto ℝ nonostante che sia 𝑓 0(0) = 0. Questo
mostra che una funzione strettamente monotona può avere derivata nulla in un punto.

Più in generale è facile osservare che se 𝑓 è monotona ma non strettamente


monotona significa che ci sono due punti 𝑎 e 𝑏 per cui 𝑓 (𝑎) = 𝑓 (𝑏). Ma se
𝑓 è monotona allora per ogni 𝑥 ∈ [𝑎, 𝑏] si deve avere 𝑓 (𝑥) = 𝑓 (𝑎) = 𝑓 (𝑏)
(ad esempio: se 𝑓 è crescente si dovrebbe avere 𝑓 (𝑎) ≤ 𝑓 (𝑥) ≤ 𝑓 (𝑏) ma se
𝑓 (𝑎) = 𝑓 (𝑏) necessariamente 𝑓 (𝑥) = 𝑓 (𝑎) = 𝑓 (𝑏)). Dunque 𝑓 risulterebbe essere
costante su [𝑎, 𝑏] e in particolare avremmo una infinità più che numerabile
di punti in cui la derivata si annulla. Questo significa che se 𝑓 0(𝑥) ≥ 0 su un
intervallo e se 𝑓 0(𝑥) = 0 su un numero finito o anche numerabile di punti o,
ancora, su un insieme di punti con parte interna vuota, allora comunque 𝑓 è
strettamente crescente. Ragionamento analogo vale naturalmente anche per le
funzioni decrescenti.

Esercizio 5.22. Dimostrare che

𝑥2
cos 𝑥 ≥ 1 − ∀𝑥 ∈ ℝ.
2

Esercizio 5.23. Si consideri la funzione 𝑓 : ℝ → ℝ definita da

𝑓 (𝑥) = 2𝑒 𝑥−1 − 𝑥 2 .

Si mostri che 𝑓 è bigettiva e che la funzione inversa 𝑓 −1 : ℝ → ℝ è derivabile in tutti i


punti tranne il punto 1 dove ha un flesso verticale. Si calcoli ( 𝑓 −1 )0(2/𝑒).

Svolgimento. Risulta

𝑓 0(𝑥) = 2 𝑒 𝑥−1 − 2𝑥, 𝑓 00(𝑥) = 2𝑒 𝑥−1 − 2.

Dunque 𝑓 00(𝑥) > 0 per 𝑥 > 1 e 𝑓 00(𝑥) < 0 per 𝑥 < 1. Dunque per i criteri di
monotonia 𝑓 0 è strettamente crescente su [1 , +∞) e strettamente decrescente
su (−∞, 1]. Visto che 𝑓 0(1) = 0 risulta quindi che 𝑓 0(𝑥) ≥ 0 per ogni 𝑥 ∈ ℝ e
𝑓 0(𝑥) = 0 solo per 𝑥 = 1. Dunque 𝑓 è crescente per il criterio di monotonia ma
anche strettamente crescente perché se fosse crescente ma non strettamente ci
dovrebbe essere un intero intervallo in cui 𝑓 0 si annulla. Dunque 𝑓 è iniettiva.
Visto che 𝑓 (𝑥) → ±∞ per 𝑥 → ±∞ si ha sup 𝑓 (ℝ) = +∞, inf 𝑓 (ℝ) = −∞ e per
il teorema dei valori intermedi otteniamo che 𝑓 (ℝ) = ℝ. Dunque 𝑓 è anche
suriettiva ed è quindi invertibile.
La funzione inversa di 𝑓 è anch’essa monotona, è quindi continua per il
Teorema 2.8 ed è derivabile nei punti corrispondenti ai punti in cui 𝑓 ha derivata
5.4 criteri di monotonia 189

Figura 5.2: Il grafico di una funzione


derivabile ma con derivata non continua
0.2
(vedi esempio 5.25). L’ingrandimento
nel disegno in basso rende evidente il
0.1 fatto che la derivata oscilla tra i valori
−1 e 1 in ogni intorno di 0. La proprietà
di Darboux (teorema 5.24) rimane
-0.6 -0.5 -0.4 -0.3 -0.2 -0.1 0.1 0.2 0.3 0.4 0.5 0.6 0.7
comunque soddisfatta: la derivata
assume tutti i valori compresi tra 1 e
-0.1
−1 in ogni intorno di 𝑥 = 0 ma non ha
limite per 𝑥 → 0.
-0.2

0.0031 0.0032 0.0033 0.0034 0.0035 0.0036 0.0037 0.0038 0.0039 0.004 0.0041 0.0042 0.0043 0.0044 0.0045 0.0046 0.0047 0.0048 0.0049 0.005 0.0051 0.0052 0.0053 0.0054 0.0055

(interagisci)

non nulla. L’unico punto in cui 𝑓 ha derivata nulla è 𝑥 = 1 e visto che 𝑓 (1) = 1
risulta che 𝑓 −1 (𝑦) è derivabile per ogni 𝑦 ≠ 1 e vale

1 1
( 𝑓 −1 )0( 𝑓 (𝑥)) = = .
𝑓 0(𝑥) 2 𝑒 𝑥−1 − 2 𝑥

Osservando che 𝑓 (0) = 2/𝑒 si trova quindi

1 𝑒
( 𝑓 −1 )0(1/𝑒) = = .
2/𝑒 2

Teorema 5.24 (proprietà di Darboux). Sia 𝑓 : 𝐼 → ℝ una funzione derivabile su


un intervallo 𝐼 ⊆ ℝ. Allora la derivata soddisfa la proprietà dei valori intermedi: se
𝑎, 𝑏 ∈ 𝐼 , 𝑎 < 𝑏 e se 𝑚 è un valore intermedio tra 𝑓 0(𝑎) e 𝑓 0(𝑏) (cioè 𝑓 0(𝑎) < 𝑚 < 𝑓 0(𝑏)
o 𝑓 0(𝑏) < 𝑚 < 𝑓 0(𝑎)) allora esiste 𝑥 ∈ (𝑎, 𝑏) tale che 𝑓 0(𝑥) = 𝑚 .

Dimostrazione. Dati 𝑥, 𝑦 ∈ [𝑎, 𝑏], 𝑥 ≠ 𝑦 , possiamo considerare il rapporto


incrementale:
𝑓 (𝑦) − 𝑓 (𝑥)
𝑅(𝑥, 𝑦) = .
𝑦−𝑥
Fissato 𝑥 = 𝑎 la funzione 𝑦 ↦→ 𝑅(𝑎, 𝑦) è continua e tende a 𝑓 0(𝑎) quando 𝑦
tende ad 𝑎 . Dunque, per il teorema 2.80 dei valori intermedi, tale funzione
assume tutti i valori compresi tra 𝑓 0(𝑎) e 𝑅(𝑎, 𝑏). Analogamente fissato 𝑦 = 𝑏 la
funzione 𝑥 ↦→ 𝑅(𝑥, 𝑏) è continua e tende a 𝑓 0(𝑏) quando 𝑥 tende a 𝑏 . Dunque
tale funzione assume tutti i valori intermedi tra 𝑅(𝑎, 𝑏) e 𝑓 0(𝑏). Dunque esistono
𝑥, 𝑦 tali che 𝑅(𝑥, 𝑦) = 𝑚 e, per il teorema 5.15 di Lagrange esisterà un punto
intermedio 𝑡 ∈ (𝑥, 𝑦) in cui 𝑓 0(𝑡) = 𝑅(𝑥, 𝑦) = 𝑚 .

Esempio 5.25 (funzione derivabile con derivata non continua). La funzione


𝑓 : ℝ → ℝ definita da
(
𝑥 2 sin(1/𝑥) se 𝑥 ≠ 0
𝑓 (𝑥) =
0 se 𝑥 = 0.
190 5 calcolo differenziale

è derivabile su tutto ℝ, 𝑓 0(0) = 0 ma il limite

lim 𝑓 0(𝑥)
𝑥→0

non esiste (e dunque 𝑓 0 : ℝ → ℝ non è continua in 𝑥 = 0).

Dimostrazione. La funzione 𝑥 2 sin(1/𝑥) è derivabile infinite volte su tutto il suo


dominio ℝ \ {0} in quanto composizione di funzioni elementari derivabili
infinite volte. Dunque, per la località della derivata, anche la funzione 𝑓 è
derivabile infinite volte su ℝ \ {0}. Per 𝑥 ≠ 0 possiamo quindi calcolare 𝑓 0(𝑥)
utilizzando le regole di derivazione
   
0 1 1 1 −1 1 1
𝑓 (𝑥) = 𝐷 𝑥 sin2
= 2 𝑥 sin + 𝑥 2 cos · 2 = 2 𝑥 sin − cos .
𝑥 𝑥 𝑥 𝑥 𝑥 𝑥

Verifichiamo ora che 𝑓 è continua e derivabile anche in 0. Si ha infatti

𝑓 (0 + ℎ) − 𝑓 (0) 1
lim = lim ℎ sin = 0
ℎ→0 ℎ ℎ→0 ℎ

e dunque 𝑓 0(0) = 0. Osserviamo però che 𝑓 0(𝑥) non ammette limite per 𝑥 → 0
in quanto per 𝑥 → 0 si ha 2 𝑥 sin(1/𝑥) → 0 ma il limite di cos(1/𝑥) invece non
esiste. Dunque 𝑓 0(𝑥) è la somma di una funzione che ha limite zero e di una
funzione il cui limite non esiste per 𝑥 → 0. Dunque 𝑓 0(𝑥) non ammette limite
per 𝑥 → 0.

Proposizione 5.26 (criterio di derivabilità). Sia 𝐼 ⊆ ℝ un intervallo, 𝑥 0 ∈ 𝐼


𝑓 : 𝐼 → ℝ una funzione continua su tutto 𝐼 e derivabile in 𝐼 \ {𝑥 0 }. Se il limite della
derivata
lim 𝑓 0(𝑥) = 𝑚
𝑥→𝑥 0

esiste ed è finito la funzione 𝑓 è derivabile anche in 𝑥 0 e vale 𝑓 0(𝑥 0 ) = 𝑚 .

Dimostrazione. Prendiamo un generico punto 𝑥 > 𝑥 0 (il caso 𝑥 < 𝑥 0 è del tutto
analogo). Per il teorema di Lagrange sappiamo esistere un punto 𝑦 ∈ (𝑥 0 , 𝑥)
tale che
𝑓 (𝑥) − 𝑓 (𝑥0 )
= 𝑓 0(𝑦).
𝑥 − 𝑥0
Per 𝑥 → 𝑥 0 si ha certamente anche 𝑦 → 𝑥 0 e dunque esiste il limite del rapporto
incrementale:

𝑓 (𝑥) − 𝑓 (𝑥0 )
𝑓 0(𝑥0 ) = lim = lim 𝑓 0(𝑦) = 𝑚.
𝑥→𝑥 0 𝑥 − 𝑥0 𝑦→𝑥0

La proposizione precedente dice che la derivata di una funzione in un punto


non può avere un valore diverso dal suo limite, se tale limite esiste. Esistono
però funzioni derivabili la cui derivata non è continua, come abbiamo visto
nell’esempio 5.25 in quanto il limite della derivata potrebbe non esistere.
5.5 convessità 191

5.5 convessità

Definizione 5.27 (funzione convessa). Sia 𝐼 ⊆ ℝ un intervallo. Una funzione


𝑓 : 𝐼 → ℝ si dice essere convessa se per ogni 𝑥, 𝑦 ∈ 𝐼 e per ogni 𝑡 ∈ [0 , 1] si ha funzione convessa

𝑓 ((1 − 𝑡)𝑥 + 𝑡 𝑦) ≤ (1 − 𝑡) 𝑓 (𝑥) + 𝑡 𝑓 (𝑦).

Analogamente diremo che 𝑓 è concava se vale la disuguaglianza inversa: funzione concava

𝑓 ((1 − 𝑡)𝑥 + 𝑡 𝑦) ≥ (1 − 𝑡) 𝑓 (𝑥) + 𝑡 𝑓 (𝑦)

(o, equivalentemente, se − 𝑓 è convessa).

Osserviamo che la retta del piano passante per i punti (𝑥, 𝑓 (𝑥)) e (𝑦, 𝑓 (𝑦)) può
essere parametrizzata in maniera uniforme per 𝑡 ∈ ℝ da

(1 − 𝑡)(𝑥, 𝑓 (𝑥)) + 𝑡(𝑦, 𝑓 (𝑦)) = ((1 − 𝑡)𝑥 + 𝑡 𝑦, (1 − 𝑡) 𝑓 (𝑥) + 𝑡 𝑓 (𝑦)).

Chiaramente per 𝑡 = 0 si ottiene il punto (𝑥, 𝑓 (𝑥)) per 𝑡 = 1 il punto (𝑦, 𝑓 (𝑦)) e
per 𝑡 ∈ [0 , 1] il segmento congiungente tali punti. La condizione di convessità
della funzione 𝑓 corrisponde quindi a richiedere che ogni corda (segmento) che
unisce due punti del grafico si trovi "al di sopra" del grafico della funzione.

Definizione 5.28 (insieme convesso). Un insieme 𝐸 ⊆ ℝ𝑛 si dice essere convesso se convesso


dati due punti qualunque 𝑎, 𝑏 ∈ 𝐸 l’intero segmento [𝑎, 𝑏] = {(1 − 𝑡)𝑎 + 𝑡𝑏 : 𝑡 ∈ [0 , 1]}
è contenuto in 𝐸 .

Teorema 5.29 (epigrafico delle funzioni convesse). Sia 𝐼 ⊆ ℝ e 𝑓 : 𝐼 ⊆ ℝ → ℝ


una funzione. Allora sono equivalenti:
1. 𝐼 è un intervallo e 𝑓 è convessa;
2. l’epigrafico di 𝑓 (o sopragrafico) ovvero l’insieme
epigrafico di 𝑓

𝐸 = (𝑥, 𝑦) ∈ ℝ : 𝑥 ∈ 𝐼, 𝑦 ≥ 𝑓 (𝑥)
2


è convesso.
Per le funzioni concave sarà il sottografico {(𝑥, 𝑦) : 𝑦 ≤ 𝑓 (𝑥)} ad essere convesso.

Dimostrazione. Supponiamo che 𝐼 sia un intervallo e 𝑓 sia convessa. Per di-


mostrare che l’epigrafico 𝐸 è convesso consideriamo due punti 𝑎, 𝑏 ∈ 𝐸 e un
qualunque punto 𝑝 sul segmento [𝑎, 𝑏]. Se 𝑎 = (𝑥 𝑎 , 𝑦 𝑎 ), 𝑏 = (𝑥 𝑏 , 𝑦𝑏 ), 𝑝 = (𝑥 𝑝 , 𝑦 𝑝 )
allora esiste un 𝑡 ∈ [0 , 1] tale che 𝑥 𝑝 = (1 − 𝑡)𝑥 𝑎 + 𝑡𝑥 𝑏 e 𝑦 𝑝 = (1 − 𝑡)𝑦 𝑎 + 𝑡 𝑦𝑏 . Visto
che 𝑎, 𝑏 ∈ 𝐸 sappiamo che 𝑦 𝑎 ≥ 𝑓 (𝑥 𝑎 ) e 𝑦𝑏 ≥ 𝑓 (𝑥 𝑏 ). Dunque necessariamente
si ha
𝑦 𝑝 ≥ (1 − 𝑡) 𝑓 (𝑥 𝑎 ) + 𝑡 𝑓 (𝑦𝑏 ).
Ma essendo 𝑓 convessa si ha:

(1 − 𝑡) 𝑓 (𝑥 𝑎 ) + 𝑡 𝑓 (𝑦𝑏 ) ≥ 𝑓 ((1 − 𝑡)𝑥 𝑎 + 𝑡𝑥 𝑏 ) = 𝑓 (𝑥 𝑝 ).

Dunque 𝑦 𝑝 ≥ 𝑓 (𝑥 𝑝 ) che significa 𝑝 ∈ 𝐸 .


192 5 calcolo differenziale

Viceversa supponiamo di sapere che 𝐸 è convesso. Siano 𝑥, 𝑦 ∈ 𝐼 punti


qualunque. Allora i punti 𝑎 = (𝑥, 𝑓 (𝑥)) e 𝑏 = (𝑦, 𝑓 (𝑦)) sono certamente punti
di 𝐸 e quindi l’intero segmento [𝑎, 𝑏] deve essere contenuto in 𝐸 . Dunque per
ogni 𝑡 ∈ [0 , 1] il punto 𝑝 = ((1 − 𝑡)𝑥 + 𝑡 𝑦, (1 − 𝑡) 𝑓 (𝑥) + 𝑡 𝑓 (𝑦)) deve stare in 𝐸 .
In primo luogo deve quindi essere (1 − 𝑡)𝑥 + 𝑡 𝑦 ∈ 𝐼 e se questo è vero per ogni
𝑡 ∈ [0 , 1] significa che 𝐼 è un intervallo. In secondo luogo se 𝑝 ∈ 𝐸 significa che

(1 − 𝑡) 𝑓 (𝑥) + 𝑡 𝑓 (𝑦) ≥ 𝑓 ((1 − 𝑡)𝑥 + 𝑡 𝑦)

che corrisponde alla definizione di funzione convessa.

Lemma 5.30 (rapporto incrementale di una funzione convessa). Sia 𝐼 un intervallo


di ℝ e sia 𝑓 : 𝐼 → ℝ. Dati 𝑥, 𝑦 ∈ 𝐼 con 𝑥 ≠ 𝑦 definiamo il rapporto!incrementale di
𝑓 come:
𝑓 (𝑦) − 𝑓 (𝑥)
𝑅(𝑥, 𝑦) = .
𝑦−𝑥
Allora sono condizioni equivalenti:

1. 𝑓 è convessa;
2. per ogni 𝑥, 𝑦, 𝑧 ∈ 𝐼 se 𝑥 < 𝑦 < 𝑧 si ha 𝑅(𝑥, 𝑦) ≤ 𝑅(𝑦, 𝑧);
3. per ogni 𝑥, 𝑦, 𝑧 ∈ 𝐼 se 𝑥 < 𝑦 < 𝑧 si ha 𝑅(𝑥, 𝑦) ≤ 𝑅(𝑥, 𝑧);
4. per ogni 𝑥, 𝑦, 𝑧 ∈ 𝐼 se 𝑥 < 𝑦 < 𝑧 si ha 𝑅(𝑥, 𝑧) ≤ 𝑅(𝑦, 𝑧);
5. la funzione 𝑅(𝑥, 𝑦) è crescente in ognuna delle due variabili.

Dimostrazione. Attenzione: il lemma risulta ovvio se si utilizza la giusta in-


terpretazione geometrica (il rapporto incrementale è la pendenza della corda
corrispondente). Quella che segue è la traduzione algebrica di quanto è geo-
metricamente ovvio ma risulta inevitabilmente pesante e più difficilmente
comprensibile.

Siano 𝑥, 𝑦, 𝑧 ∈ 𝐼 con 𝑥 < 𝑦 < 𝑧 . Posto 𝑡 = (𝑦 − 𝑥)/(𝑧 − 𝑥) si ha 𝑦 = (1 − 𝑡)𝑥 + 𝑡𝑧 ,


𝑦 − 𝑥 = 𝑡(𝑧 − 𝑥), 𝑧 − 𝑦 = (1 − 𝑡)(𝑧 − 𝑥). Si ha allora

𝑓 (𝑧) − 𝑓 (𝑥) 𝑓 (𝑦) − 𝑓 (𝑥)


𝑅(𝑥, 𝑧) − 𝑅(𝑥, 𝑦) = −
𝑧−𝑥 𝑦−𝑥
𝑓 (𝑧) − 𝑓 (𝑥) 𝑓 (𝑦) − 𝑓 (𝑥)
=𝑡 −
𝑦−𝑥 𝑦−𝑥
𝑡 𝑓 (𝑧) + (1 − 𝑡) 𝑓 (𝑥) − 𝑓 (𝑦)
=
𝑦−𝑥

La condizione di convessità di 𝑓 è

𝑓 (𝑦) ≤ (1 − 𝑡) 𝑓 (𝑥) + 𝑡 𝑓 (𝑧)

ed è quindi equivalente alla condizione 𝑅(𝑥, 𝑦) ≤ 𝑅(𝑥, 𝑧). Dunque le condizioni


1 e 3 sono equivalenti.

Ma con una verifica diretta si osserva che

𝑅(𝑥, 𝑧) = 𝑡𝑅(𝑥, 𝑦) + (1 − 𝑡)𝑅(𝑦, 𝑧)


5.5 convessità 193

da cui si ottiene

𝑅(𝑦, 𝑧) − 𝑅(𝑥, 𝑧) = 𝑡[𝑅(𝑦, 𝑧) − 𝑅(𝑥, 𝑦)]

oppure anche

𝑅(𝑥, 𝑧) − 𝑅(𝑥, 𝑦) = (1 − 𝑡)[𝑅(𝑦, 𝑧) − 𝑅(𝑥, 𝑦)].

Risulta quindi che le quantità

𝑅(𝑦, 𝑧) − 𝑅(𝑥, 𝑦), 𝑅(𝑥, 𝑧) − 𝑅(𝑥, 𝑦), 𝑅(𝑦, 𝑧) − 𝑅(𝑥, 𝑧)

hanno tutte lo stesso segno. E quindi le condizioni 2, 3 e 4 sono tra loro


equivalenti (se vale una delle tre valgono tutte e tre).

Se valgono le tre condizioni 2, 3 e 4 è facile verificare che la funzione 𝑅(𝑥, 𝑦)


è crescente in entrambe le variabili. Innanzitutto per simmetria, visto che
𝑅(𝑥, 𝑦) = 𝑅(𝑦, 𝑥), è sufficiente verificare che 𝑅(𝑥, 𝑦) è crescente nella seconda
variabile 𝑦 per ogni 𝑥 fissato. Quindi dato 𝑧 > 𝑦 bisogna mostrare che
𝑅(𝑥, 𝑧) ≥ 𝑅(𝑥, 𝑦). Abbiamo allora tre possibilità a seconda che sia 𝑥 < 𝑦
oppure 𝑦 < 𝑥 < 𝑧 oppure 𝑧 < 𝑥 . Nel primo caso si ha 𝑥 < 𝑦 < 𝑧 e dunque la
disuguaglianza 𝑅(𝑥, 𝑦) ≤ 𝑅(𝑥, 𝑧) corrisponde alla condizione 3. Nel secondo
caso si ha 𝑦 < 𝑥 < 𝑧 e la condizione 𝑅(𝑥, 𝑦) ≤ 𝑅(𝑥, 𝑧) si può scrivere come
𝑅(𝑦, 𝑥) ≤ 𝑅(𝑥, 𝑧) che è, riordinando opportunamente le variabili, la condizione
2. Se, infine, 𝑦 < 𝑧 < 𝑥 la condizione 𝑅(𝑥, 𝑦) ≤ 𝑅(𝑥, 𝑧) si può scrivere
𝑅(𝑦, 𝑥) ≤ 𝑅(𝑧, 𝑥) che, riordinando le variabili, è la condizione 4.

Viceversa (e infine) se la funzione 𝑅(𝑥, 𝑦) è crescente in entrambe le variabili


in particolare è crescente nella seconda variabile e quindi se 𝑥 < 𝑦 < 𝑧 si ha
𝑅(𝑥, 𝑦) ≤ 𝑅(𝑥, 𝑧). Risulta quindi che la condizione 5 implica la 3 e quindi tutte
le altre condizioni.

Teorema 5.31. Sia 𝐼 ⊆ ℝ un intervallo e 𝑓 : 𝐼 → ℝ una funzione derivabile su tutto


𝐼 . Allora sono equivalenti:

1. 𝑓 è convessa;
2. per ogni 𝑥 0 ∈ 𝐼 e per ogni 𝑥 ∈ 𝐼 si ha

𝑓 (𝑥) ≥ 𝑓 0(𝑥0 )(𝑥 − 𝑥0 ) + 𝑓 (𝑥0 )

(geometricamente: il grafico della funzione sta sopra la retta tangente);


3. 𝑓 0 è crescente.

Analogamente per le funzioni concave si avrà che il grafico “sta sotto” la retta tangente
e che la derivata è decrescente.

Dimostrazione. Osserviamo che

𝑓 0(𝑥 0 ) = lim 𝑅(𝑥0 , 𝑥).


𝑥→𝑥0

Se 𝑓 è convessa allora, per il lemma, il rapporto incrementale 𝑅(𝑥 0 , 𝑥) è crescente


e quindi 𝑓 0(𝑥 0 ) = inf 𝑥>𝑥0 𝑅(𝑥 0 , 𝑥). In particolare 𝑓 0(𝑥 0 ) ≤ 𝑅(𝑥 0 , 𝑥) per ogni
194 5 calcolo differenziale

𝑥 > 𝑥0 . In maniera analoga si trova 𝑓 0(𝑥 0 ) ≥ 𝑅(𝑥0 , 𝑥) se 𝑥 < 𝑥0 . In ogni caso


risulta quindi che per ogni 𝑥 si ha

(𝑅(𝑥0 , 𝑥) − 𝑓 0(𝑥0 ))(𝑥 − 𝑥0 ) ≥ 0

ovvero
𝑓 (𝑥) − 𝑓 (𝑥0 ) − 𝑓 0(𝑥0 )(𝑥 − 𝑥0 ) ≥ 0.
Dunque la condizione 1 implica la 2.

Se vale la condizione 2, dati 𝑥, 𝑦 ∈ 𝐼 si ha

𝑓 (𝑥) − 𝑓 (𝑦) ≥ 𝑓 0(𝑦)(𝑥 − 𝑦)

se scambiamo 𝑥 e 𝑦 e cambiamo di segno ambo i membri si ottiene invece

𝑓 (𝑥) − 𝑓 (𝑦) ≤ 𝑓 0(𝑥)(𝑥 − 𝑦)

mettendo insieme le due disuguaglianze, se ora supponiamo che sia 𝑥 > 𝑦


otteniamo proprio 𝑓 0(𝑥) ≥ 𝑓 0(𝑦) cioè 𝑓 0 è crescente (condizione 3).

Supponiamo ora di sapere che 𝑓 0 è crescente e supponiamo per assurdo che


la funzione 𝑓 non sia convessa. In base al lemma precedente dovrebbero
allora esistere tre punti 𝑥 < 𝑦 < 𝑧 tali che 𝑅(𝑥, 𝑦) > 𝑅(𝑦, 𝑧). Per il teorema di
Lagrange dovrebbe allora esistere un punto 𝑐 ∈ (𝑥, 𝑦) tale che 𝑓 0(𝑐) = 𝑅(𝑥, 𝑦) e
un punto 𝑑 ∈ (𝑦, 𝑧) tale che 𝑓 0(𝑑) = 𝑅(𝑦, 𝑧) ma allora 𝑓 0(𝑐) > 𝑓 0(𝑑) nonostante
sia 𝑐 < 𝑑 e dunque 𝑓 0 non poteva essere crescente.

Corollario 5.32 (criterio di convessità tramite derivata seconda). Sia 𝐼 ⊆ ℝ


un intervallo e sia 𝑓 : 𝐼 → ℝ una funzione derivabile due volte (cioè 𝑓 è derivabile
e anche 𝑓 0 è derivabile). Allora 𝑓 è convessa se e solo se 𝑓 00(𝑥) ≥ 0 per ogni 𝑥 ∈ 𝐼 .
Analogamente 𝑓 è concava se e solo se 𝑓 00 ≤ 0.

Dimostrazione. Per il criterio precedente 𝑓 è convessa se e solo se 𝑓 0 è crescente.


Per il criterio di monotonia 𝑓 0 è crescente se e solo se 𝑓 00 ≥ 0. Considerazioni
analoghe valgono per la concavità.

Teorema 5.33. Siano 𝑎 ∈ ℝ, 𝑏 ∈ ℝ̄, 𝑎 < 𝑏 . Sia 𝑓 : [𝑎, 𝑏) → ℝ una funzione


convessa in (𝑎, 𝑏) e continua in 𝑎 . Allora 𝑓 è convessa su tutto [𝑎, 𝑏). Risultato analogo
vale per funzioni definite su intervalli aperti a sinistra (𝑎, 𝑏] e aperti da ambo i lati
(𝑎, 𝑏).

Dimostrazione. Dati 𝑥, 𝑦 ∈ [𝑎, 𝑏) dobbiamo mostrare che per ogni 𝑡 ∈ [0 , 1] vale

𝑓 ((1 − 𝑡)𝑥 + 𝑡 𝑦) ≤ (1 − 𝑡) 𝑓 (𝑥) + 𝑡 𝑓 (𝑦).

Per ipotesi sappiamo che la disuguaglianza è valida se 𝑥, 𝑦 ∈ (𝑎, 𝑏). Dobbiamo


quindi dimostrare la disuguaglianza solamente nel caso 𝑥 = 𝑎 e 𝑦 ∈ (𝑎, 𝑏). Dato
5.5 convessità 195

qualunque 𝑡 ∈ (0 , 1) e presa una successione 𝑥 𝑘 → 𝑎 con 𝑥 𝑘 ∈ (𝑎, 𝑏) definiamo


𝑡 𝑘 in modo che sia 𝑧 = (1 − 𝑡)𝑥 + 𝑡 𝑦 = (1 − 𝑡 𝑘 )𝑥 𝑘 + 𝑡 𝑘 𝑦 cioè:

𝑥 − 𝑥 𝑘 + 𝑡(𝑦 − 𝑥)
𝑡𝑘 = .
𝑦 − 𝑥𝑘

Siccome 𝑡 𝑘 → 𝑡 per 𝑘 → +∞ se 𝑡 ∈ (0 , 1) per 𝑘 abbastanza grande anche


𝑡 𝑘 ∈ (0 , 1). Inoltre per la convessità in (𝑎, 𝑏) sappiamo che vale

𝑓 ((1 − 𝑡 𝑘 )𝑥 𝑘 + 𝑡 𝑘 𝑦) ≤ (1 − 𝑡 𝑘 ) 𝑓 (𝑥 𝑘 ) + 𝑡 𝑘 𝑓 (𝑦)

e passando a limite per 𝑘 → +∞, dalla continuità di 𝑓 in 𝑥 si ottiene

𝑓 ((1 − 𝑡)𝑥 + 𝑡 𝑦) ≤ (1 − 𝑡) 𝑓 (𝑥) + 𝑡 𝑓 (𝑦)

come volevamo dimostrare. Per 𝑡 = 0 e 𝑡 = 1 la disuguaglianza è sempre


banalmente verificata.


Esempio 5.34. La funzione 𝑓 (𝑥) = 𝑥 è definita su [0 , +∞) ma è derivabile
1
solamente in (0 , +∞). La sua derivata è 𝑓 0(𝑥) = 𝑥 − 2 /2 e la derivata seconda è
3
𝑓 00(𝑥) = −𝑥 − 2 /4 < 0. Dunque la funzione è concava sull’intervallo aperto (0 , +∞).
Ma essendo continua possiamo concludere che 𝑓 è concava su tutto il dominio [0 , +∞).

Teorema 5.35 (derivabilità delle funzioni convesse). Sia 𝐼 ⊆ ℝ un intervallo e


sia 𝑓 : 𝐼 → ℝ una funzione convessa. Se 𝑥 0 ∈ (inf 𝐼, sup 𝐼) esistono e sono finite la
derivata destra e sinistra di 𝑓 in 𝑥 0 :

𝑓 (𝑥) − 𝑓 (𝑥0 )
𝑓+0 (𝑥0 ) = lim+
𝑥→𝑥0 𝑥 − 𝑥0
𝑓 (𝑥) − 𝑓 (𝑥0 )
𝑓−0 (𝑥0 ) = lim−
𝑥→𝑥0 𝑥 − 𝑥0

e risulta
𝑓−0 (𝑥0 ) ≤ 𝑓+0 (𝑥0 ).
Inoltre se inf 𝐼 < 𝑥 1 < 𝑥 2 < sup 𝐼 si ha

𝑓+0 (𝑥1 ) ≤ 𝑓(0 𝑥2 ).

Se ne deduce che 𝑓 è continua in tutti i punti interni di 𝐼 e che l’insieme dei punti in
cui 𝑓 non è derivabile è al più numerabile.

Dimostrazione. Nel lemma 5.30 abbiamo osservato che il rapporto incrementale

𝑓 (𝑥) − 𝑓 (𝑥0 )
𝑅(𝑥0 , 𝑥) =
𝑥 − 𝑥0

di una funzione convessa è crescente rispetto alla variabile 𝑥 . Dunque per il


teorema 2.25 si ha

𝑓−0 (𝑥0 ) = sup 𝑅(𝑥0 , 𝑥) > −∞, 𝑓+0 (𝑥0 ) = inf 𝑅(𝑥 0 , 𝑥) < +∞
𝑥<𝑥 0 𝑥>𝑥0
196 5 calcolo differenziale

e visto che se 𝑥 < 𝑥 0 e 𝑦 > 𝑥 0 si ha 𝑅(𝑥 0 , 𝑥) ≤ 𝑅(𝑥 0 , 𝑦) deduciamo che


𝑓−0 (𝑥0 ) ≤ 𝑓+0 (𝑥0 ) ed entrambi i limiti sono dunque finiti. Se 𝑥1 < 𝑥2 allora preso
un qualunque punto 𝑥 con 𝑥 1 < 𝑥 < 𝑥 2 si ha (sempre per il lemma 5.30)

𝑅(𝑥 1 , 𝑥) ≤ 𝑅(𝑥, 𝑥2 )

e dunque passando al limite si trova 𝑓+0 (𝑥 1 ) ≤ 𝑓−0 (𝑥 2 ). Le derivate destra e


sinistra esistono dunque in tutti i punti interni all’intervallo 𝐼 . In particolare 𝑓 è
continua in tali punti in quanto è continua sia da destra che da sinistra. I punti di
non derivabilità di 𝑓 sono i punti in cui le derivate destra e sinistra differiscono.
Ma ad ogni punto 𝑥 di non differenziabilità posso associare l’intervallo aperto
non vuoto 𝐼 𝑥 = ( 𝑓−0 (𝑥), 𝑓+0 (𝑥)) e per le proprietà appena viste è chiaro che questi
intervalli sono a due a due disgiunti in quanto se 𝑥 1 < 𝑥 2 l’estremo destro di
𝐼 𝑥1 è minore o uguale all’estremo sinistro di 𝐼 𝑥2 . Siccome ognuno di questi
intervalli contiene almeno un numero razionale concludiamo che il numero di
punti di discontinuità non può essere maggiore della cardinalità dei numeri
razionali.

Teorema 5.36 (retta di supporto). Sia 𝐼 ⊆ ℝ un intervallo, 𝑓 : 𝐼 → ℝ una funzione


convessa e 𝑥 0 un punto interno ad 𝐼 . Allora esiste una funzione lineare affine

𝐿(𝑥) = 𝑚𝑥 + 𝑞

tale che 𝑓 (𝑥 0 ) = 𝐿(𝑥 0 ) e per ogni 𝑥 ∈ 𝐼 si abbia 𝑓 (𝑥) ≥ 𝐿(𝑥).

Dimostrazione. Basta scegliere qualunque 𝑚 ∈ [ 𝑓−0 (𝑥 0 ), 𝑓+0 (𝑥 0 )] e considerare la


funzione lineare affine 𝐿(𝑥) = 𝑚(𝑥 − 𝑥 0 ). Se 𝑥 > 𝑥 0 allora si ha 𝑅(𝑥 0 , 𝑥) ≥ 𝑚 e
dunque 𝑓 (𝑥) − 𝑓 (𝑥 0 ) ≥ 𝑚(𝑥 − 𝑥 0 ) = 𝐿(𝑥). Viceversa se 𝑥 < 𝑥 0 si ha 𝑅(𝑥 0 , 𝑥) ≤ 𝑚
da cui, di nuovo, 𝑓 (𝑥) − 𝑓 (𝑥 0 ) ≥ 𝑚(𝑥 − 𝑥 0 ) = 𝐿(𝑥).

Il seguente teorema può essere enunciato anche per gli integrali come vedremo
nel teorema 6.21. La dimostrazione è sostanzialmente identica ed è valida anche
per funzioni convesse di più variabili.

Teorema 5.37 (combinazioni baricentriche/disuguaglianza di Jensen). Se 𝑓 è


una funzione convessa definita su un intervallo 𝐼 , dati 𝑥 1 , . . . , 𝑥 𝑛 ∈ 𝐼 e 𝜆1 , . . . , 𝜆𝑛 ∈ ℝ
tali che 𝑛𝑘=1 𝜆 𝑘 = 1 e 𝜆 𝑘 ≥ 0 per ogni 𝑘 = 1 , . . . , 𝑛 allora
P

!
𝑛
X 𝑛
X
𝑓 𝜆𝑘 𝑥 𝑘 ≤ 𝜆 𝑘 𝑓 (𝑥 𝑘 ).
𝑘=1 𝑘=1

Per le funzioni concave vale la disuguaglianza inversa.

Dimostrazione. Poniamo
𝑛
X
𝑥¯ = 𝜆𝑘 𝑥 𝑘 .
𝑘=1
5.5 convessità 197

Per il teorema 5.36 precedente sappiamo che esiste una retta 𝐿(𝑥) = 𝑚𝑥 + 𝑞 tale
che 𝐿( 𝑥)
¯ = 𝑓 ( 𝑥)
¯ e 𝐿(𝑥) ≤ 𝑓 (𝑥) per ogni 𝑥 ∈ 𝐼 . Allora si ha
!
𝑛
X 𝑛
X 𝑛
X 𝑛
X
𝐿 𝜆𝑘 𝑥 𝑘 = 𝑚𝜆 𝑘 𝑥 𝑘 + 𝑞 𝜆𝑘 = 𝜆 𝑘 𝐿(𝑥 𝑘 ).
𝑘=1 𝑘=1 𝑘=1 𝑘=1

Dunque
𝑛
X 𝑛
X
𝑓 ( 𝑥)
¯ = 𝐿( 𝑥)
¯ = 𝜆 𝑘 𝐿(𝑥 𝑘 ) ≤ 𝜆 𝑘 𝑓 (𝑥 𝑘 ).
𝑘=1 𝑘=1

Esempio 5.38 (disuguaglianza tra media aritmetica e media geometrica). Os-


serviamo che la funzione 𝑓 (𝑥) = ln 𝑥 è concava, infatti si ha 𝑓 00(𝑥) = −1/𝑥 2 < 0.
Dunque, per il teorema precedente, se 𝜆1 + · · · + 𝜆𝑛 = 1, 𝜆 𝑘 ≥ 0 si ha
!
𝑛
X 𝑛
X
ln 𝜆𝑘 𝑥 𝑘 ≥ 𝜆 𝑘 ln 𝑥 𝑘 .
𝑘=1 𝑘=1

Facendo l’esponenziale di ambo i membri si ottiene


𝑛 𝑛
𝜆
X Y
𝜆𝑘 𝑥 𝑘 ≥ 𝑥𝑘 𝑘 .
𝑘=1 𝑘=1

Nel caso particolare 𝜆 𝑘 = 1/𝑛 si ottiene la disuguaglianza tra media aritmetica (AM media aritmetica geometrica
per gli anglofoni) e media geometrica (GM):

𝑥1 + · · · + 𝑥 𝑛 √
≥ 𝑛 𝑥1 · · · 𝑥 𝑛 .
𝑛

Esercizio 5.39 (subadditività delle funzioni concave). Sia 𝑓 : [0 , +∞) → ℝ una


funzione concava con 𝑓 (0) ≥ 0. Allora 𝑓 è subadditiva cioè:

𝑓 (𝑥 + 𝑦) ≤ 𝑓 (𝑥) + 𝑓 (𝑦), ∀𝑥, 𝑦 ≥ 0.

Dimostrazione. Se 𝑥 = 𝑦 = 0 la disuguaglianza è ovvia. Altrimenti 𝑥 + 𝑦 > 0 e


si ha

𝑦 𝑥
 
𝑓 (𝑥) = 𝑓 ·0+ · (𝑥 + 𝑦)
𝑥+𝑦 𝑥+𝑦
𝑦 𝑥 𝑥
≥ 𝑓 (0) + 𝑓 (𝑥 + 𝑦) ≥ 𝑓 (𝑥 + 𝑦).
𝑥+𝑦 𝑥+𝑦 𝑥+𝑦

Scambiando 𝑥 con 𝑦 e sommando si ottiene:

𝑥 𝑦
𝑓 (𝑥) + 𝑓 (𝑦) ≥ 𝑓 (𝑥 + 𝑦) + 𝑓 (𝑥 + 𝑦) = 𝑓 (𝑥 + 𝑦).
𝑥+𝑦 𝑥+𝑦
198 5 calcolo differenziale

Si osservi che sviluppando la disuguaglianza (𝑥 − 𝑦)2 ≥ 0 si ottiene:

𝑥2 + 𝑦2
𝑥𝑦 ≤ .
2
Questa disuguaglianza può essere generalizzata ad esponenti diversi come si
vede nel seguente.

Teorema 5.40 (disuguaglianza di Young). Se 𝑝 > 1, 𝑞 > 1, 1


𝑝 + 1
𝑞 = 1, 𝑥, 𝑦 ≥ 0:

𝑥𝑝 𝑦𝑞
𝑥𝑦 ≤ + . (5.3)
𝑝 𝑞

Dimostrazione. Si utilizza la disuguaglianza di convessità per la funzione


exp(𝑥) = 𝑒 𝑥 . Visto che la derivata seconda dell’esponenziale è positiva, la
funzione exp è convessa e dunque, se 𝑥 > 0 e 𝑦 > 0 si ha:
 
1 1
𝑥 · 𝑦 = exp(ln 𝑥 + ln 𝑦) = exp ln(𝑥 𝑝 ) + ln(𝑦 𝑞 )
𝑝 𝑞
1 1 𝑥 𝑝 𝑦𝑞
≤ · exp ln(𝑥 𝑝 ) + exp ln(𝑦 𝑞 ) = + .
𝑝 𝑞 𝑝 𝑞

Se 𝑥 = 0 o 𝑦 = 0 la disuguaglianza è ovvia in quanto il lato sinistro di (5.3) è


nullo.

Teorema 5.41 (disuguaglianza di Hölder). Se 𝑎 𝑘 ≥ 0 e 𝑏 𝑘 ≥ 0 per 𝑘 ∈ ℕ e siano


𝑝 > 1 e 𝑞 > 1 tali che 𝑝1 + 1𝑞 = 1. Allora

! 𝑝1 ! 1𝑞
X X 𝑝 X 𝑞
𝑎𝑘 𝑏𝑘 ≤ 𝑎𝑘 · 𝑏𝑘 .
𝑘 𝑘 𝑘

Dimostrazione. Poniamo
! 𝑝1 ! 1𝑞
X 𝑝 X 𝑞
𝐴= 𝑎𝑘 , 𝐵= 𝑏𝑘 .
𝑘 𝑘

Se 𝐴 > 0 e 𝐵 > 0 possiamo dividere il lato sinistro della disuguaglianza per il


lato destro e applicare la disuguaglianza (5.3) di Young:
𝑝 𝑞
𝑎𝑘 𝑏𝑘 X 𝑎𝑘 𝑏𝑘 X 1 𝑎𝑘 1 𝑏𝑘
P
𝑘
= · ≤ 𝑝
+
𝐴·𝐵 𝑘
𝐴 𝐵 𝑘
𝑝𝐴 𝑞 𝐵𝑞
𝑝 𝑞
1 𝑘 𝑎𝑘 1 𝑘 𝑏𝑘
P P
1 1
= 𝑝
+ = + = 1.
𝑝 𝐴 𝑞 𝐵𝑞 𝑝 𝑞

E il teorema e dimostrato.

Se fosse 𝐴 = 0 tutti i termini 𝑎 𝑘 sarebbero nulli e la disuguaglianza si riduce


banalmente a 0 ≤ 0. Lo stesso se fosse 𝐵 = 0.
disuguaglianza di Cauchy-Schwarz
5.6 teoremi di Cauchy e de l’Hospital 199

Nel caso 𝑝 = 𝑞 = 2 si ottiene la disuguaglianza di Cauchy-Schwarz


X rX rX
|𝑎 𝑘 𝑏 𝑘 | ≤ 𝑎 2𝑘 · 𝑏 2𝑘
𝑘 𝑘 𝑘

che potrebbe però essere più facilmente dimostrata per un generico prodotto
scalare, come faremo nel teorema 7.6.

5.6 teoremi di Cauchy e de l’Hospital


Cauchy

Teorema 5.42 (Cauchy). Siano 𝑓 : [𝑎, 𝑏] → ℝ e 𝑔 : [𝑎, 𝑏] → ℝ funzioni continue


su tutto [𝑎, 𝑏] e derivabili su (𝑎, 𝑏). Supponiamo inoltre che 𝑔 0(𝑥) ≠ 0 per ogni
𝑥 ∈ (𝑎, 𝑏). Allora 𝑔(𝑏) ≠ 𝑔(𝑎) ed esiste 𝑥0 ∈ (𝑎, 𝑏) tale che

𝑓 0(𝑥0 ) 𝑓 (𝑏) − 𝑓 (𝑎)


= .
𝑔 0(𝑥0 ) 𝑔(𝑏) − 𝑔(𝑎)

Dimostrazione. Si consideri la funzione ausiliaria

ℎ(𝑥) = (𝑔(𝑏) − 𝑔(𝑎)) 𝑓 (𝑥) − ( 𝑓 (𝑏) − 𝑓 (𝑎))𝑔(𝑥).

Per verifica diretta si osserva che

ℎ(𝑏) = 𝑔(𝑏) 𝑓 (𝑎) − 𝑓 (𝑏)𝑔(𝑎) = ℎ(𝑎).

Dunque ℎ verifica le ipotesi del teorema di Rolle ed esiste dunque un punto


𝑥0 ∈ (𝑎, 𝑏) per cui ℎ 0(𝑥 0 ) = 0. Essendo però

ℎ 0(𝑥) = (𝑔(𝑏) − 𝑔(𝑎)) 𝑓 0(𝑥) − ( 𝑓 (𝑏) − 𝑓 (𝑎))𝑔 0(𝑥)

si ottiene
(𝑔(𝑏) − 𝑔(𝑎)) 𝑓 0(𝑥 0 ) = ( 𝑓 (𝑏) − 𝑓 (𝑎))𝑔 0(𝑥 0 ).
Per ipotesi sappiamo che 𝑔 0(𝑥 0 ) ≠ 0. Ma necessariamente anche 𝑔(𝑏) − 𝑔(𝑎) ≠ 0
perché altrimenti potremmo applicare il teorema di Rolle alla funzione 𝑔 e
ottenere che 𝑔 0 si annulla in un punto di (𝑎, 𝑏), cosa che abbiamo escluso per
ipotesi. Dunque possiamo dividere ambo i membri per (𝑔(𝑏) − 𝑔(𝑎)) e per
𝑔 0(𝑥0 ) per ottenere l’uguaglianza enunciata nel teorema.

Teorema 5.43 (de l’Hospital 0/0). Sia 𝐼 ⊆ ℝ un intervallo, 𝑥 0 ∈ [−∞, +∞]


un punto di accumulazione di 𝐼 e siano 𝑓 , 𝑔 : 𝐼 \ {𝑥 0 } → ℝ funzioni derivabili.
Supponiamo che sia 𝑔 0(𝑥) ≠ 0 per ogni 𝑥 ∈ 𝐼 \ {𝑥 0 }. Se

lim 𝑓 (𝑥) = 0 e lim 𝑔(𝑥) = 0


𝑥→𝑥0 𝑥→𝑥 0

e se esiste (finito o infinito) il limite

𝑓 0(𝑥)
ℓ = lim
𝑥→𝑥0 𝑔 0(𝑥)
200 5 calcolo differenziale

allora si ha
𝑓 (𝑥)
lim = ℓ.
𝑥→𝑥 0 𝑔(𝑥)

Dimostrazione. Bisognerà distinguere diversi casi a seconda che 𝑥 0 sia finito


o infinito e che sia un punto interno o un estremo dell’intervallo 𝐼 . Fatta la
dimostrazione nel primo caso tutti gli altri si riconducono ad esso.

Caso 1: supponiamo che sia 𝐼 = [𝑥 0 , 𝑏]. In questo caso possiamo estendere le


funzioni 𝑓 e 𝑔 anche nel punto 𝑥 0 ponendo:
( (
𝑓 (𝑥) se 𝑥 ∈ (𝑥0 , 𝑏] 𝑔(𝑥) se 𝑥 ∈ (𝑥0 , 𝑏]
𝑓˜(𝑥) = 𝑔˜ (𝑥) =
0 se 𝑥 = 𝑥 0 , 0 se 𝑥 = 𝑥 0 .

Visto che per ipotesi 𝑓 (𝑥) → 0 e 𝑔(𝑥) → 0 per 𝑥 → 𝑥 0 risulta che 𝑓˜ e 𝑔˜ siano
funzioni continue su tutto l’intervallo [𝑥 0 , 𝑏] inoltre, sempre per ipotesi, sono
derivabili nell’intervallo (𝑥 0 , 𝑏] visto che l’estensione per 𝑥 = 𝑥 0 non modifica
le derivate negli altri punti. In particolare le funzioni estese soddisfano le
ipotesi del teorema di Cauchy in ogni intervallo [𝑥 0 , 𝑥] con 𝑥 ∈ (𝑥 0 , 𝑏], dunque
possiamo affermare che per ogni 𝑥 esiste 𝑐(𝑥) ∈ (𝑥 0 , 𝑥) tale che

𝑓 (𝑥) 𝑓˜(𝑥) − 𝑓˜(𝑥0 ) 𝑓˜0(𝑐(𝑥)) 𝑓 0(𝑐(𝑥))


= = 0 = 0 .
𝑔(𝑥) 𝑔˜ (𝑥) − 𝑔˜ (𝑥0 ) 𝑔˜ (𝑐(𝑥)) 𝑔 (𝑐(𝑥))

Ma essendo 𝑥 0 < 𝑐(𝑥) < 𝑥 per 𝑥 → 𝑥 0 si ha 𝑐(𝑥) → 𝑥 0 e quindi, tramite un


cambio di variabile (Teorema 2.23) possiamo affermare che

𝑓 (𝑥) 𝑓 0(𝑐(𝑥)) 𝑓 0(𝑥)


lim = lim 0 = lim 0 = ℓ.
𝑥→𝑥0 𝑔(𝑥) 𝑥→𝑥0 𝑔 (𝑐(𝑥)) 𝑥→𝑥0 𝑔 (𝑥)

Caso 2: supponiamo sia 𝐼 qualunque e 𝑥 0 finito. Visto che le funzioni sono


definite su 𝐼 \ {𝑥 0 } possiamo sempre supporre 𝑥 0 ∈ 𝐼 . Inoltre visto che i limiti
dipendono solo dai valori in un intorno del punto 𝑥 0 possiamo sempre supporre
che 𝐼 sia un intervallo chiuso e limitato. Nel passo precedente abbiamo fatto
il caso in cui 𝑥 0 era l’estremo inferiore di 𝐼 , ma allo stesso modo si può fare il
caso in cui 𝑥 0 è l’estremo superiore. Se invece 𝑥 0 fosse un punto interno di 𝐼
possiamo considerare separatamente il limite destro e sinistro e ricondurci ai
casi in cui 𝑥 0 era un estremo.

Caso 3: supponiamo sia 𝑥 0 = +∞. In tal caso l’intervallo 𝐼 contiene un intevallo


[𝑎, +∞) con 𝑎 ∈ ℝ. Anche in questo caso vogliamo ricondurci al primo caso
tramite il cambio di variabile 𝑡 = 1/𝑥 . Posto 𝐹(𝑡) = 𝑓 (1/𝑡) e 𝐺(𝑡) = 𝑔(1/𝑡)
si osserva che 𝐹 e 𝐺 sono definite sull’intervallo (0 , 1/𝑎], tendono a zero per
𝑡 → 0+ sono derivabili,

𝑓 0(1/𝑡) 𝑔 0(1/𝑡))
𝐹0(𝑡) = − , 𝐺0(𝑡) = −
𝑡2 𝑡2
e risulta quindi

𝐹0(𝑡) 𝑓 0(1/𝑡) 𝑓 0(𝑥)


lim+ = lim = lim = ℓ.
𝑡→0 𝐺0(𝑡) 𝑡→0+ 𝑔 0(1/𝑡) 𝑥→+∞ 𝑔 0(𝑥)
5.6 teoremi di Cauchy e de l’Hospital 201

Quindi applicano il teorema nel caso già dimostrato possiamo affermare che

𝑓 (𝑥) 𝐹(𝑡)
lim = lim+ = ℓ.
𝑥→+∞ 𝑔(𝑥) 𝑡→ 0 𝐺(𝑡)

Caso 4: il caso 𝑥 0 = −∞ si svolge in maniera analoga al caso precedente.


de l’Hospital

Teorema 5.44 (de l’Hospital ·/∞). Siano 𝑎, 𝑏 ∈ [−∞, +∞] con 𝑎 < 𝑏 . Siano
𝑓 , 𝑔 : (𝑎, 𝑏) → ℝ funzioni derivabili. Se

lim | 𝑔(𝑥)| = +∞,


𝑥→𝑎 +

se 𝑔 0(𝑥) ≠ 0 per ogni 𝑥 ∈ (𝑎, 𝑏) e se esiste il limite (finito o infinito)

𝑓 0(𝑥)
ℓ = lim+
𝑥→𝑎 𝑔 0(𝑥)

allora si ha
𝑓 (𝑥)
lim+ = ℓ.
𝑥→𝑎 𝑔(𝑥)

Risultato analogo si ha facendo i limiti per 𝑥 → 𝑏 − invece che per 𝑥 → 𝑎 + e di


conseguenza anche nel caso in cui la funzione sia definita su un intervallo “bucato”
𝑓 : (𝑎, 𝑏) \ {𝑥0 } → ℝ e si considerino i limiti “pieni” per 𝑥 → 𝑥0 .

Dimostrazione. Supponiamo per assurdo che non si abbia

𝑓 (𝑥)
lim+ = ℓ.
𝑥→𝑎 𝑔(𝑥)

Allora, per il teorema di collegamento tra limiti di funzione e limiti di successione,


deve esistere una successione 𝑎 𝑘 ∈ (𝑎, 𝑏), 𝑎 𝑘 → 𝑎 tale che non si abbia

𝑓 (𝑎 𝑘 )
lim = ℓ.
𝑘→+∞ 𝑔(𝑎 𝑘 )

Se la successione 𝑓 (𝑎 𝑘 )/𝑔(𝑎 𝑘 ) è limitata allora applicando il teorema di Bolzano


Weierstrass sappiamo esistere una sottosuccessione di 𝑎 𝑘 convergente ad un
valore 𝑚 ≠ ℓ (se tutte le sottosuccessioni convergessero ad ℓ l’intera successione
convergerebbe ad ℓ ). Se invece 𝑓 (𝑎 𝑘 )/𝑔(𝑎 𝑘 ) non è limitata possiamo estrarre
una sottosuccessione che converge a +∞ oppure a −∞. In ogni caso esiste una
successione, che chiameremo ancora 𝑎 𝑘 , ed esiste 𝑚 ∈ ℝ̄ tale che

𝑓 (𝑎 𝑘 )
lim = 𝑚 ≠ ℓ.
𝑘→+∞ 𝑔(𝑎 𝑘 )

Consideriamo ora un intorno 𝑈 di 𝑚 e un intorno 𝑉 di ℓ tali che 𝑈 ∩ 𝑉 = ∅.


Siccome 𝑓 0(𝑥)/𝑔 0(𝑥) → ℓ per 𝑥 → 𝑎 esiste un 𝑐 ∈ (𝑎, 𝑏) tale che per ogni
𝑥 ∈ (𝑎, 𝑐) si ha
𝑓 0(𝑥)
∈ 𝑉.
𝑔 0(𝑥)
202 5 calcolo differenziale

Consideriamo allora il seguente rapporto incrementale

𝑓 (𝑎 𝑘 ) 𝑓 (𝑥)
𝑓 (𝑎 𝑘 ) − 𝑓 (𝑥) 𝑔(𝑎 𝑘 )
− 𝑔(𝑎 𝑘 )
=
𝑔(𝑎 𝑘 ) − 𝑔(𝑥) 1−
𝑔(𝑥)
𝑔(𝑎 𝑘 )

e osserviamo che il lato destro tende a 𝑚 per 𝑘 → +∞ in quanto 𝑓 (𝑎 𝑘 )/𝑔(𝑎 𝑘 ) →


𝑚 e visto che | 𝑔(𝑎 𝑘 )| → +∞ si ha 𝑓 (𝑥)/𝑔(𝑎 𝑘 ) → 0 e 𝑔(𝑥)/𝑔(𝑎 𝑘 ) → 0. Dunque
esisterà un 𝑘 per cui il lato destro sta nell’intorno 𝑈 di 𝑚 . Al lato sinistro
possiamo invece applicare il teorema di Cauchy e trovare quindi un punto
𝑦 ∈ (𝑎 𝑘 , 𝑐) per cui tale lato risulti uguale a 𝑓 0(𝑦)/𝑔 0(𝑦). Ma visto che 𝑦 ∈ (𝑎, 𝑐)
si dovrà avere 𝑓 0(𝑦)/𝑔 0(𝑦) ∈ 𝑉 . Questo è assurdo in quanto 𝑈 ∩ 𝑉 = ∅.

5.7 classi di regolarità

Definizione 5.45 (funzioni di classe 𝐶 𝑘 ). Dato 𝐴 ⊆ ℝ denotiamo con ℝ𝐴 l’insieme


𝐶𝑘
di tutte le funzioni 𝑓 : 𝐴 → ℝ. Per ogni 𝑘 ∈ ℕ definiamo 𝐶 𝑘 (𝐴) ⊆ ℝ𝐴 nel modo
seguente:

1. se 𝑘 = 0 poniamo

𝐶 0 (𝐴) = 𝑓 ∈ ℝ𝐴 : 𝑓 continua .


2. se 𝑘 > 0 definiamo induttivamente

𝐶 𝑘 (𝐴) = 𝑓 ∈ ℝ𝐴 : 𝑓 derivabile e 𝑓 0 ∈ 𝐶 𝑘−1 (𝐴) .




𝐶∞ Chiaramente se 𝑗 ≥ 𝑘 si ha 𝐶 𝑗 (𝐴) ⊆ 𝐶 𝑘 (𝐴) dunque 𝐶 𝑘 (𝐴) è una famiglia decrescente


(rispetto all’inclusione insiemistica) ed ha senso definire:

𝐶 ∞ (𝐴) = 𝑓 ∈ ℝ𝐴 : ∀𝑘 ∈ ℕ : 𝑓 ∈ 𝐶 𝑘 (𝐴) = 𝐶 𝑘 (𝐴).


 \
𝑘∈ℕ

𝑓 (𝑗)

Le funzioni 𝑓 ∈ 𝐶 𝑘 (𝐴) sono derivabili 𝑘 volte. Utilizziamo la notazione 𝑓 (𝑗) per


denotare la 𝑗 -esima derivata di una funzione 𝑓 . Dunque avremo

𝑓 (0) = 𝑓 , 𝑓 (1) = 𝑓 0 , 𝑓 (2) = 𝑓 00 , . . .

Abbiamo già osservato che ℝ𝐴 è uno spazio vettoriale reale. Gli spazi 𝐶 𝑘 (𝐴)
per 𝑘 = 0 , . . . , ∞ sono una famiglia decrescente di sottospazi vettoriali di ℝ𝐴 .
Infatti sappiamo che la combinazione lineare di funzioni continue è continua e
che la combinazione lineare di funzioni derivabili è derivabile.

E’ importante osservare che 𝐶 1 (𝐴) non coincide con l’insieme delle funzioni
derivabili su 𝐴. Infatti abbiamo già visto nell’esempio 5.25 che esistono funzioni
funzione lipschitziana derivabili la cui derivata non è continua e quindi tali funzioni, pur essendo
derivabili, non sono di classe 𝐶 1 .
5.7 classi di regolarità 203

Definizione 5.46 (funzioni lipschitziane). Una funzione 𝑓 : 𝐴 ⊆ ℝ → ℝ si


dice essere lipschitziana (o anche 𝐿-lipschitziana se vogliamo mettere in evidenza la
dipendenza da 𝐿) se esiste 𝐿 > 0 tale che

| 𝑓 (𝑥) − 𝑓 (𝑦)| ≤ 𝐿|𝑥 − 𝑦| ∀𝑥, 𝑦 ∈ 𝐴.

La più piccola costante 𝐿 per la quale è soddisfatta la precedente relazione si chiama


costante di Lipschitz di 𝑓 . costante di Lipschitz

Teorema 5.47 (criterio di Lipschitz). Sia 𝑓 : 𝐴 ⊆ ℝ una funzione lipschitziana


con costante di Lipschitz 𝐿. Se 𝑓 è derivabile in un punto 𝑥 ∈ 𝐴 allora | 𝑓 0(𝑥)| ≤ 𝐿.
Viceversa se 𝑓 : 𝐼 ⊆ ℝ → ℝ una funzione derivabile definita su un intervallo 𝐼 e se
esiste 𝐿 tale che per ogni 𝑥 ∈ 𝐼 si ha | 𝑓 0(𝑥)| ≤ 𝐿 allora 𝑓 è lipschitziana.

Dimostrazione. Se 𝑓 è Lipschitziana significa che il rapporto incrementale è


limitato. Cioè esiste 𝐿 > 0 tale che
𝑓 (𝑥) − 𝑓 (𝑦)

𝑥−𝑦 ≤𝐿 ∀𝑥, 𝑦 ∈ 𝐴.

Dunque la derivata, che è il limite del rapporto incrementale, se esiste è anch’essa


limitata dalla stessa costante: | 𝑓 0(𝑥)| ≤ 𝐿 per ogni 𝑥 ∈ 𝐴.

Viceversa se la derivata è limitata | 𝑓 0(𝑧)| ≤ 𝐿 per ogni 𝑧 ∈ 𝐼 e se 𝑥, 𝑦 ∈ 𝐼 sono


punti qualunque, allora, per il teorema di Lagrange, il rapporto incrementale di
𝑓 è uguale alla derivata in un punto 𝑧 ∈ (𝑥, 𝑦):

𝑓 (𝑥) − 𝑓 (𝑦)

0
𝑥 − 𝑦 = | 𝑓 (𝑧)| ≤ 𝐿.

e dunque la funzione è 𝐿 lipschitziana:

| 𝑓 (𝑥) − 𝑓 (𝑦)| ≤ 𝐿|𝑥 − 𝑦|.

funzione hoelderiana

Definizione 5.48 (funzioni Hoelderiane). Sia 𝛼 > 0. Una funzione 𝑓 : 𝐴 ⊆ ℝ →


ℝ si dice essere 𝛼-Hoelderiana se esiste una costante 𝐶 > 0 tale che

| 𝑓 (𝑥) − 𝑓 (𝑦)| ≤ 𝐶 |𝑥 − 𝑦| 𝛼 . (5.4)

uniforme continuità
Definizione 5.49 (uniforme continuità). Una funzione 𝑓 : 𝐴 ⊆ ℝ → ℝ si dice
essere uniformemente continua se

∀𝜀 > 0 : ∃𝛿 > 0 : ∀𝑥, 𝑦 ∈ 𝐴 : |𝑥 − 𝑦| < 𝛿 =⇒ | 𝑓 (𝑥) − 𝑓 (𝑦)| < 𝜀.

Teorema 5.50. Ogni funzione lipschitziana è 1-Hoelderiana (e viceversa). Ogni


funzione 𝛼 -Hoelderiana è uniformemente continua. Ogni funzione uniformemente
continua è continua. Ogni funzione 𝛼 -Hoelderiana con 𝛼 > 1 ha derivata nulla.
204 5 calcolo differenziale

Dimostrazione. Le prime tre affermazioni seguono direttamente dalle definizioni.


Per l’ultima osservazione si noti che se 𝛼 > 1 nella disuguaglianza (5.4) si può
dividere per |𝑥 − 𝑦| e ottenere quindi che il rapporto incrementale tende a zero
se 𝑦 → 𝑥 .

Definizione 5.51 (modulo di continuità). Sia 𝑓 : 𝐴 ⊆ ℝ → ℝ una funzione.


modulo di continuità Definiamo il modulo di continuità di 𝑓 come la funzione 𝑀 : [0 , +∞) → [0 , +∞]
definita da
𝑀(𝑟) = sup {| 𝑓 (𝑥) − 𝑓 (𝑦)| : 𝑥, 𝑦 ∈ 𝐴, |𝑥 − 𝑦| ≤ 𝑟}.

Teorema 5.52 (proprietà del modulo di continuità). Sia 𝑓 : 𝐴 → ℝ e sia


𝑀 : [0 , +∞) → [0 , +∞) il suo modulo di contintuità. La funzione 𝑀(𝑟) è crescente;

La funzione 𝑓 è uniformemente continua se e solo se

lim 𝑀(𝑟) = 0.
𝑟→0

La funzione 𝑓 è lipschitziana se e solo se esiste 𝐿 tale che

𝑀(𝑟) ≤ 𝐿𝑟.

La funzione 𝑓 è 𝛼 -Hoelderiana se e solo se esiste 𝐶 tale che

𝑀(𝑟) ≤ 𝐶𝑟 𝛼 .

Dimostrazione. Osserviamo che la condizione

𝑀(𝑟) ≤ 𝑐

è equivalente a

∀𝑥, 𝑦 ∈ 𝐴 : |𝑥 − 𝑦| ≤ 𝑟 =⇒ | 𝑓 (𝑥) − 𝑓 (𝑦)| ≤ 𝑐.

La condizione 𝑀(𝑟) → 0 per 𝑟 → 0 significa

∀𝜀 > 0 : ∃𝛿 > 0 : ∀𝑟 > 0 : 𝑟 < 𝛿 =⇒ 𝑀(𝑟) < 𝜀

e diventa quindi la condizione di uniforme continuità.

Le condizioni di lipschitzianità e di 𝛼 -hoelderianità risultano pure immediata-


mente.

Teorema 5.53 (restrizione / incollamento di funzioni uniformemente continue).


Sia 𝑓 : 𝐴 ⊆ ℝ → ℝ una funzione uniformemente continua. Se 𝐵 ⊆ 𝐴 la restrizione
𝑓|𝐵 di 𝑓 a 𝐵 è anch’essa uniformemente continua.

Siano 𝐼, 𝐽 ⊆ ℝ intervalli tali che 𝐼 ∩ 𝐽 ≠ ∅. Sia 𝑓 : 𝐼 ∪ 𝐽 → ℝ una funzione. Se 𝑓 |𝐼 e


𝑓|𝐽 sono uniformemente continue allora 𝑓 è uniformemente continua.
5.7 classi di regolarità 205

Dimostrazione. La prima parte, sulla restrizione di una funzione uniformemente


continua, deriva direttamente dalla definizione: se una qualunque proprietà
vale per ogni 𝑥, 𝑦 ∈ 𝐴 allora a maggior ragione vale per ogni 𝑥, 𝑦 ∈ 𝐵 quando
𝐵 ⊆ 𝐴.

Vediamo la seconda parte dell’enunciato: supponiamo 𝑓 sia uniformemente


continua su 𝐼 e su 𝐽 . Sia dato 𝜀 > 0 e siano 𝛿 1 e 𝛿 2 i valori di 𝛿 dati dalle
condizioni di uniforme continuità di 𝑓 rispettivamente su 𝐼 e su 𝐽 . Consideriamo
𝛿 = min {𝛿 1 , 𝛿2 }. Siano ora 𝑥, 𝑦 punti qualunque di 𝐼 ∪ 𝐽 con |𝑥 − 𝑦| < 𝛿.

Si possono allora avere due casi possibili: 𝑥 e 𝑦 stanno nello stesso intervallo
(𝐼 o 𝐽 ) oppure stanno uno in 𝐼 e l’altro in 𝐽 . Nel primo caso essendo 𝛿 < 𝛿 1 e
𝛿 < 𝛿2 l’uniforme continuità di 𝑓 su 𝐼 e su 𝐽 garantisce che valga in ogni caso
| 𝑓 (𝑥) − 𝑓 (𝑦)| < 𝜀. Nel secondo caso deve esistere un punto 𝑧 ∈ 𝐼 ∩ 𝐽 che sia un
punto intermedio tra 𝑥 e 𝑦 . Allora usando la disuguaglianza triangolare:

| 𝑓 (𝑥) − 𝑓 (𝑦)| ≤ | 𝑓 (𝑥) − 𝑓 (𝑧)| + | 𝑓 (𝑧) − 𝑓 (𝑦)| ≤ 𝜀 + 𝜀.

si ottiene dunque (salvo rimpiazzare 𝜀 con 𝜀/2) anche in questo caso la stima
voluta.
Heine-Cantor

Teorema 5.54 (Heine-Cantor). Siano 𝑎, 𝑏 ∈ ℝ, 𝑎 < 𝑏 . Sia 𝑓 : [𝑎, 𝑏] → ℝ una


funzione continua. Allora 𝑓 è uniformemente continua.

Dimostrazione. Supponiamo per assurdo che 𝑓 non sia uniformemente continua.


Allora 𝑓 soddisfa la negazione della proprietà

∀𝜀 > 0 : ∃𝛿 > 0 : ∀𝑥, 𝑦 ∈ 𝐴 : |𝑥 − 𝑦| < 𝛿 =⇒ | 𝑓 (𝑥) − 𝑓 (𝑦)| < 𝜀

che è

∃𝜀 > 0 : ∀𝛿 > 0 : ∃𝑥, 𝑦 ∈ 𝐴 : |𝑥 − 𝑦| < 𝛿 ∧ | 𝑓 (𝑥) − 𝑓 (𝑦)| ≥ 𝜀.

Dunque dato 𝜀 > 0 che soddisfa la precedente proprietà possiamo prendere


𝛿 = 1/𝑘 per ogni 𝑘 ∈ ℕ , ottenendo quindi due successioni 𝑥 𝑘 , 𝑦 𝑘 tali che

1
|𝑥 𝑘 − 𝑦 𝑘 | < e | 𝑓 (𝑥 𝑘 ) − 𝑓 (𝑦 𝑘 )| ≥ 𝜀.
𝑘
Per il teorema di Bolzano-Weierstrass esisterà una sottosuccessione convergente
𝑥 𝑘 𝑗 → 𝑐 . Visto che |𝑥 𝑘 − 𝑦 𝑘 | → 0 si dovrà avere anche 𝑦 𝑘 𝑗 → 𝑐 . Ma allora, per
la continuità di 𝑓 :

𝑓 (𝑥 𝑘 ) − 𝑓 (𝑦 𝑘 ) → | 𝑓 (𝑐) − 𝑓 (𝑐)| = 0

𝑗 𝑗

in contraddizione con la condizione | 𝑓 (𝑥 𝑘 ) − 𝑓 (𝑦 𝑘 )| ≥ 𝜀. teorema dell’asintoto

Teorema 5.55 (dell’asintoto). Sia 𝑓 : [𝑎, +∞) → ℝ una funzione continua e sia
𝑔 : [𝑎, +∞) → ℝ una funzione uniformemente continua tale che

lim 𝑓 (𝑥) − 𝑔(𝑥) = 0.


𝑥→+∞
206 5 calcolo differenziale

Allora anche 𝑓 è uniformemente continua.

asintoto obliquo In particolare se 𝑓 ha un asintoto obliquo ovvero se esistono 𝑚 ∈ ℝ e 𝑞 ∈ ℝ tali che

lim 𝑓 (𝑥) − (𝑚𝑥 + 𝑞) = 0


𝑥→+∞

allora 𝑓 , se è continua, è uniformemente continua.

Risultato analogo vale per le funzioni definite su intervalli del tipo (−∞, 𝑎] (facendo i
limiti a −∞) e quindi per funzioni definite su tutto ℝ (facendo i limiti sia a +∞ che a
−∞).

Dimostrazione. Per ogni 𝜀 > 0 esiste 𝑀 > 𝑎 tale che | 𝑓 (𝑥) − 𝑔(𝑥)| < 𝜀/3 per
ogni 𝑥 ≥ 𝑀 . D’altra parte la funzione 𝑓 , per il teorema di Heine-Cantor,
è uniformemente continua su [𝑎, 𝑀 + 1] e dunque esiste 𝛿 1 > 0 tale che
presi 𝑥, 𝑦 ∈ [𝑎, 𝑀 + 1] con |𝑥 − 𝑦| < 𝛿 1 si ha | 𝑓 (𝑥) − 𝑓 (𝑦)| < 𝜀. D’altra
parte 𝑔 è uniformemente continua su [𝑀, +∞) e quindi esiste 𝛿 2 tale che dati
𝑥, 𝑦 ∈ [𝑀, +∞) con |𝑥 − 𝑦| < 𝛿 2 si ha | 𝑔(𝑥) − 𝑔(𝑦)| < 𝜀/3. Ma in quest’ultimo
caso si ha:

| 𝑓 (𝑥) − 𝑓 (𝑦)| ≤ | 𝑓 (𝑥) − 𝑔(𝑥)| + | 𝑔(𝑥) − 𝑔(𝑦)| + | 𝑔(𝑦) − 𝑓 (𝑦)|


𝜀 𝜀 𝜀
≤ + + = 𝜀.
3 3 3

Posto dunque 𝛿 = min {1 , 𝛿 1 , 𝛿 2 } scelti comunque 𝑥, 𝑦 ∈ [𝑎, +∞) con |𝑥 − 𝑦| <


𝛿 siamo certamente in uno dei due casi precedenti e quindi, in ogni caso, si
ottiene | 𝑓 (𝑥) − 𝑓 (𝑦)| < 𝜀, come dovevamo dimostrare.

Nel caso particolare 𝑔(𝑥) = 𝑚𝑥 + 𝑞 si osserva semplicemente che 𝑔 è uniforme-


mente continua in quanto è 𝐿-lipschitziana con 𝐿 = |𝑚| .

5.8 formula di Taylor

Definizione 5.56 (polinomio di Taylor). Sia 𝐴 ⊆ ℝ, 𝑓 : 𝐴 → ℝ una funzione e sia


𝑥0 ∈ 𝐴 un punto in cui la derivata 𝑛 -esima (e quindi anche le derivate precedenti) sia
definita.

Allora il polinomio:
𝑛
𝑓 (𝑘) (𝑥0 )
(𝑥 − 𝑥0 ) 𝑘
X
𝑃(𝑥) =
𝑘=0
𝑘!
polinomio di Taylor
viene detto polinomio di Taylor di ordine 𝑛 della funzione 𝑓 , centrato in 𝑥 0 .

polinomio di MacLaurin Nel caso particolare in cui sia 𝑥 0 = 0 il polinomio di Taylor viene anche chiamato
polinomio di MacLaurin.

Teorema 5.57 (caratterizzazione polinomio di Taylor). Il polinomio di Taylor di


una funzione 𝑓 , di ordine 𝑛 , centrato in 𝑥 0 è l’unico polinomio 𝑃 di grado non superiore
ad 𝑛 tale che
𝑃 (𝑘) (𝑥 0 ) = 𝑓 (𝑘) (𝑥0 ), ∀𝑘 ∈ {0, . . . , 𝑛}.
5.8 formula di Taylor 207

Dimostrazione. Ogni polinomio di grado non superiore ad 𝑛 può essere scritto


nella forma:
𝑛
𝑎 𝑘 (𝑥 − 𝑥0 ) 𝑘
X
𝑃(𝑥) =
𝑘=0

(basti notare che se 𝑃(𝑥) è un polinomio anche 𝑄(𝑡) = 𝑃(𝑥 0 + 𝑡) è un polinomio)


e le sue derivate sono:
𝑛
𝑘!
· (𝑥 − 𝑥0 ) 𝑘−𝑗 .
X
𝑃 (𝑗) (𝑥) = 𝑎𝑘 ·
𝑘=𝑗
(𝑘 − 𝑗)!

Per 𝑥 = 𝑥 0 l’unico addendo non nullo è quello con 𝑘 = 𝑗 , dunque

𝑃 (𝑘) (𝑥 0 ) = 𝑘 ! · 𝑎 𝑘 .

Dunque si ha 𝑃 (𝑘) (𝑥 0 ) = 𝑓 (𝑘) (𝑥 0 ) se e solo se 𝑎 𝑘 = 𝑓 (𝑘) (𝑥 0 )/𝑘 ! cioè se 𝑃 è il


polinomio di Taylor di 𝑓 .

Osservazione 5.58 (polinomio di Taylor della derivata). Se 𝑃𝑛 è il polinomio di


Taylor centrato in 𝑥 0 di ordine 𝑛 per 𝑓 , allora si ha

𝑛
𝑓 (𝑘) (𝑥)
· 𝑘(𝑥 − 𝑥0 ) 𝑘−1
X
𝑃𝑛0 (𝑥) =
𝑘=1
𝑘!
𝑛
𝑓 (𝑘)
(𝑥 − 𝑥 0 ) 𝑘−1
X
=
𝑘=1
(𝑘 − 1)!
𝑛−1
𝑓 (𝑗+1)
(𝑥 − 𝑥0 ) 𝑗 .
X
=
𝑗=0
𝑗!

Dunque si verifica che 𝑃𝑛0 è il polinomio di Taylor di ordine 𝑛 − 1 per 𝑓 0. In breve: il


polinomio di Taylor di ordine 𝑛 − 1 della derivata è la derivata del polinomio di Taylor
di ordine 𝑛 della funzione.

Viceversa se
𝑛
𝑎 𝑘 (𝑥 − 𝑥 0 ) 𝑘
X
𝑘=0 Vedremo che questa è una primiti-
va del polinomio dato (si veda la
è il polinomio di Taylor di ordine 𝑛 della derivata 𝑓 0(𝑥), allora il polinomio di Taylor di definizione 6.24).
ordine 𝑛 + 1 di 𝑓 sarà
𝑛
𝑎𝑘
· (𝑥 − 𝑥0 ) 𝑘+1
X
𝑃𝑛+1 (𝑥) = 𝑓 (𝑥0 ) + (5.5)
𝑘=0
𝑘+1

in quanto
𝑓 (𝑘+1) (𝑥0 ) ( 𝑓 0)(𝑘) (𝑥0 ) 𝑎𝑘 · 𝑘! 𝑎𝑘
= = = . Taylor con resto di Lagrange
(𝑘 + 1)! (𝑘 + 1)! (𝑘 + 1)! 𝑘+1

Teorema 5.59 (formula di Taylor con resto di Lagrange). Sia 𝐼 ⊆ ℝ un intervallo,


𝑥0 ∈ 𝐼 , 𝑓 ∈ 𝐶 𝑛+1 (𝐼). Sia 𝑃 il polinomio di Taylor di 𝑓 di ordine 𝑛 centrato in 𝑥 0 . Per
208 5 calcolo differenziale

ogni 𝑥 ∈ 𝐼 esiste 𝑦 ∈ [𝑥 0 , 𝑥) (se 𝑥 > 𝑥 0 altrimenti si intende 𝑦 ∈ (𝑥, 𝑥 0 ]) tale che

𝑓 (𝑛+1) (𝑦)
𝑓 (𝑥) = 𝑃(𝑥) + (𝑥 − 𝑥0 )𝑛+1 .
(𝑛 + 1)!

Dimostrazione. Se 𝑥 = 𝑥 0 basta prendere 𝑦 = 𝑥 0 . Supponiamo allora che sia


𝑥 > 𝑥0 (il caso 𝑥 < 𝑥0 è del tutto analogo).

Posto 𝑅(𝑥) = 𝑓 (𝑥) − 𝑃(𝑥) osserviamo che essendo 𝑃 (𝑘) (𝑥 0 ) = 𝑓 (𝑘) (𝑥 0 ) (teo-
rema 5.57) si ha 𝑅 (𝑘) (𝑥 0 ) = 0 per 𝑘 = 0 , 1 , . . . , 𝑛 . In particolare 𝑅 (𝑘) (𝑥) =
𝑅 (𝑘) (𝑥) − 𝑅 (𝑘) (𝑥0 ) è l’incremento di 𝑅 (𝑘) sull’intervallo [𝑥0 , 𝑥]. Analogamente
osserviamo che (𝑥 − 𝑥 0 )𝑛+1 è anch’essa una funzione che si annulla in 𝑥 0 con
tutte le sue derivate e dunque (𝑥 − 𝑥 0 )𝑛+1 è l’incremento della funzione sullo
stesso intervallo.

Dunque possiamo applicare il teorema di Cauchy alle funzioni 𝑓 (𝑥) − 𝑃(𝑥) e


(𝑥 − 𝑥0 )𝑛+1 sull’intervallo [𝑥0 , 𝑥] per ottenere l’esistenza di un punto 𝑥 1 ∈ (𝑥0 , 𝑥)
tale che
𝑓 (𝑥) − 𝑃(𝑥) 𝑓 0(𝑥1 ) − 𝑃 0(𝑥1 )
= .
(𝑥 − 𝑥0 )𝑛+1 (𝑛 + 1)(𝑥1 − 𝑥0 )𝑛
Di nuovo applichiamo il teorema di Cauchy alle funzioni 𝑅0(𝑥) e (𝑛 + 1)(𝑥 − 𝑥 0 )𝑛
sull’intervallo [𝑥 0 , 𝑥 1 ] per ottenere l’esistenza di un punto 𝑥 2 ∈ (𝑥 0 , 𝑥 1 ) ⊆ (𝑥 0 , 𝑥)
tale che
𝑓 0(𝑥1 ) − 𝑃 0(𝑥1 ) 𝑓 00(𝑥2 ) − 𝑃 00(𝑥2 )
= .
(𝑛 + 1)(𝑥1 − 𝑥0 )𝑛 (𝑛 + 1)𝑛(𝑥2 − 𝑥0 )𝑛−1
Possiamo iterare il procedimento per 𝑛 + 1 volte ottenendo quindi l’esistenza di
un punto 𝑥 𝑛+1 ∈ (𝑥 0 , 𝑥) tale che

𝑓 (𝑥) − 𝑃(𝑥) 𝑓 (𝑛+1) (𝑥 𝑛+1 ) − 𝑃 (𝑛+1) (𝑥 𝑛+1 )


= .
(𝑥 − 𝑥0 )𝑛+1 (𝑛 + 1)!

Ma 𝑃 è un polinomio di grado al più 𝑛 e quindi la sua derivata (𝑛 + 1)-esima è


nulla perciò otteniamo, ponendo 𝑦 = 𝑥 𝑛+1 :

𝑓 (𝑛+1) (𝑦)
𝑓 (𝑥) − 𝑃(𝑥) = (𝑥 − 𝑥 0 )𝑛+1
(𝑛 + 1)!

che è quanto volevamo dimostrare.

Esempio 5.60 (somma della serie armonica a segni alterni). Consideriamo la


funzione 𝑓 (𝑥) = ln 𝑥 . Si osservi che

𝑓 0(𝑥) = 𝑥 −1 , 𝑓 00(𝑥) = −𝑥 −2 , 𝑓 000(𝑥) = 2 𝑥 −3 ,


(−1) 𝑘−1 (𝑘 − 1)!
𝑓 (4) (𝑥) = −3 · 2 𝑥 −4 , ... 𝑓 (𝑘) (𝑥) =
𝑥𝑘
e si ha quindi, per ogni 𝑘 ≥ 1

𝑓 (𝑘) (1) (−1) 𝑘−1


=
𝑘! 𝑘
5.8 formula di Taylor 209

da cui si deduce che il polinomio di Taylor di ordine 𝑛 centrato in 𝑥 0 = 1 è


𝑛
(𝑥 − 1) 𝑘
(−1) 𝑘−1
X
𝑃(𝑥) = .
𝑘=1
𝑘

La formula di Taylor con resto di Lagrange ci dice allora che per ogni 𝑥 > 1 esiste
𝑦 ∈ (1, 𝑥) tale che
𝑛
(𝑥 − 1) 𝑘 (−1)𝑛 (𝑥 − 1)𝑛+1
(−1) 𝑘−1
X
ln(𝑥) − = .
𝑘=1
𝑘 (𝑛 + 1)𝑦 𝑛+1

Se 𝑥 = 2 si ha 𝑦 > 1 e (𝑥 − 1)𝑛+1 = 1 dunque il lato destro tende a zero per 𝑛 → +∞


(attenzione che 𝑦 dipende anch’esso da 𝑛 ). Abbiamo quindi trovato la somma della serie
armonica a segni alterni:
+∞
X (−1) 𝑘−1
= ln 2.
𝑘=1
𝑘

Nel teorema seguente utilizzeremo una nuova notazione. Scriveremo

𝑓 (𝑥) = 𝑃(𝑥) + 𝑜(𝑔(𝑥)), per 𝑥 → 𝑥 0

(si legga: “ 𝑓 (𝑥) è uguale a 𝑃(𝑥) più un 𝑜 -piccolo di 𝑔(𝑥)”) se risulta

𝑓 (𝑥) − 𝑃(𝑥)
𝑓 (𝑥) − 𝑃(𝑥)  𝑔(𝑥) ovvero lim = 0.
𝑥→𝑥 0 𝑔(𝑥)

cioè la quantità 𝑜(𝑔(𝑥)) rappresenta una funzione incognita che però sappiamo
essere trascurabile (nel senso appena descritto) della funzione 𝑔(𝑥). Questa
notazione è molto comoda ma va utilizzata con cautela: ci dedicheremo il
capitolo 5.9 a cui rimandiamo per maggiori dettagli.

Teorema 5.61 (formula di Taylor con resto di Peano). Sia 𝐼 ⊆ ℝ un intervallo,


𝑥0 ∈ 𝐼 , 𝑓 ∈ 𝐶 𝑛−1 (𝐼) con 𝑓 (𝑛−1) derivabile in 𝑥0 (in particolare è sufficiente che sia
𝑓 ∈ 𝐶 𝑛 (𝐼)). Sia 𝑃 il polinomio di Taylor di 𝑓 di ordine 𝑛 centrato in 𝑥 0 . Allora si ha

𝑓 (𝑥) − 𝑃(𝑥)
lim =0 (5.6)
𝑥→𝑥0 (𝑥 − 𝑥0 )𝑛

ovvero, scritto in maniera più espressiva:

𝑓 (𝑥) = 𝑃(𝑥) + 𝑜((𝑥 − 𝑥0 )𝑛 ). (5.7)

Viceversa se 𝑃(𝑥) è un polinomio di grado che non supera 𝑛 e vale la formula (5.7)
allora 𝑃 è il polinomio di Taylor di 𝑓 .

Dimostrazione. Iniziamo come per la dimostrazione del teorema 5.59. dobbiamo


mostrare che
𝑓 (𝑥) − 𝑃(𝑥)
lim = 0.
𝑥→𝑥 0 (𝑥 − 𝑥 0 )𝑛

Posto 𝑅(𝑥) = 𝑓 (𝑥) − 𝑃(𝑥) osserviamo che si ha 𝑅 (𝑘) (𝑥 0 ) = 0 per 𝑘 = 0 , 1 , . . . , 𝑛


e lo stesso vale per la funzione 𝑆(𝑥) = (𝑥 − 𝑥 0 )𝑛 . Dunque possiamo applicare il
210 5 calcolo differenziale

teorema 5.42 di Cauchy ottenendo che esiste un punto 𝑥 1 ∈ [𝑥 0 , 𝑥] tale che

𝑓 (𝑥) − 𝑃(𝑥) 𝑓 0(𝑥1 ) − 𝑃 0(𝑥1 )


= .
(𝑥 − 𝑥0 )𝑛 𝑛(𝑥1 − 𝑥 0 )𝑛−1

Se sapessimo che 𝑓 ∈ 𝐶 𝑛 (𝐼) potrem- Possiamo iterare questo procedimento 𝑛 − 1 volte ottenendo
mo iterare 𝑛 volte e arrivare immediata-
mente al risultato in quanto 𝑓 (𝑛) (𝑥 𝑛 ) → 𝑓 (𝑥) − 𝑃(𝑥) 𝑓 0(𝑥1 ) − 𝑃 0(𝑥 1 ) 𝑓 00(𝑥 2 ) − 𝑃 00(𝑥2 )
𝑓 (𝑛) (𝑥0 ) = 0 per 𝑥 𝑛 → 𝑥0 . Ma noi ab- = = = ...
biamo supposto che la derivata 𝑛 -esima
(𝑥 − 𝑥0 )𝑛 𝑛(𝑥1 − 𝑥0 )𝑛−1 𝑛(𝑛 − 1)(𝑥2 − 𝑥0 )𝑛−2
esiste solamente nel punto 𝑥 0 e quindi 𝑓 (𝑛−1) (𝑥 𝑛−1 ) − 𝑃 (𝑛−1) (𝑥 𝑛−1 )
nell’ultimo passaggio dovremo utilizza- =
re la definizione di derivata invece che il
𝑛 !(𝑥 𝑛−1 − 𝑥 0 )
teorema di Cauchy.
con 𝑥 1 ∈ [𝑥 0 , 𝑥], 𝑥 2 ∈ [𝑥 0 , 𝑥 1 ], . . . , 𝑥 𝑛−1 ∈ [𝑥 0 , 𝑥 𝑛−2 ] ⊆ [𝑥 0 , 𝑥]. In particolare si
avrà 𝑥 𝑛−1 → 𝑥 0 per 𝑥 → 𝑥 0 e basterà quindi dimostrare che

𝑅 (𝑛−1) (𝑥)
→ 0, per 𝑥 → 𝑥 0 .
𝑥 − 𝑥0

Ma visto che la derivata del polinomio di Taylor coincide con il polinomio di


Taylor della derivata si ha che 𝑃 (𝑛−1) (𝑥) è il polinomio di Taylor di ordine 1 della
funzione 𝑓 (𝑛−1) (𝑥) si avrà

𝑃 (𝑛−1) (𝑥) = 𝑓 (𝑛−1) (𝑥 0 ) + 𝑓 (𝑛) (𝑥 0 )(𝑥 − 𝑥0 )

da cui

𝑅 (𝑛−1) (𝑥) 𝑓 (𝑛−1) (𝑥) − 𝑃 (𝑛−1) (𝑥) 𝑓 (𝑛−1) (𝑥) − 𝑓 (𝑛−1) (𝑥 0 )


= = − 𝑓 (𝑛) (𝑥0 )
𝑥 − 𝑥0 𝑥 − 𝑥0 𝑥 − 𝑥0
→ 𝑓 (𝑛) (𝑥0 ) − 𝑓 (𝑛) (𝑥0 ) = 0

per definizione di derivata 𝑛 -esima:

𝑓 (𝑛−1) (𝑥) − 𝑓 (𝑛−1) (𝑥0 )


𝑓 (𝑛) (𝑥0 ) = lim .
𝑥→𝑥 0 𝑥 − 𝑥0

Per completare la dimostrazione dobbiamo dimostrare che il polinomio di


Taylor 𝑃 è l’unico polinomio di grado non superiore ad 𝑛 che soddisfa la
condizione (5.6). Se ci fosse un altro polinomio 𝑄 con la stessa proprietà la
differenza 𝑅 = ( 𝑓 − 𝑃) − ( 𝑓 − 𝑄) = 𝑄 − 𝑃 dovrebbe essere un polinomio di
grado non superiore ad 𝑛 che soddisfa la condizione

𝑅(𝑥)
lim = 0. (5.8)
𝑥→𝑥 0 (𝑥 − 𝑥 0 )𝑛

Posto
𝑛
𝑎 𝑘 (𝑥 − 𝑥0 ) 𝑘
X
𝑅(𝑥) =
𝑘=0

osserviamo che 𝑅(𝑥) → 𝑅(𝑥 0 ) = 𝑎 0 per 𝑥 → 𝑥 0 . Affinché valga (5.8) deve


necessariamente essere 𝑎 0 = 0. Ma in tal caso possiamo raccogliere 𝑥 − 𝑥 0 a
5.8 formula di Taylor 211

numeratore e denominatore e da (5.8) ottenere


P𝑛
𝑘=1
𝑎 𝑘 (𝑥 − 𝑥 0 ) 𝑘−1
lim = 0.
𝑥→𝑥 0 (𝑥 − 𝑥 0 )𝑛−1

Iterando il procedimento scopriamo che tutti i coefficienti 𝑎 𝑘 devono essere


nulli e dunque 𝑄 = 𝑃 .

Definizione 5.62 (coefficiente binomiale reale). Dato 𝛼 ∈ ℝ, 𝑘 ∈ ℕ definiamo

𝛼 𝛼 · (𝛼 − 1) · · · (𝛼 − 𝑘 + 1)
 
= .
𝑘 𝑘!

Osserviamo che se 𝛼 ∈ ℕ questa definizione coincide con la definizione data nel


capitolo 1.11.

Teorema 5.63 (sviluppi di Taylor di alcune funzioni elementari). Per ogni 𝑛 ∈ ℕ


si hanno, per 𝑥 → 0 le relazioni riportate nella tabella 5.2.

Dimostrazione. Per definizione, il coefficiente del termine 𝑥 𝑘 nel polinomio di


Taylor di 𝑓 (𝑥) non è altro che 𝑎 𝑘 = 𝑓 (𝑘) (0)/𝑘 ! Se 𝑓 (𝑥) = 𝑒 𝑥 allora 𝑓 (𝑘) (𝑥) = 𝑒 𝑥 e
dunque 𝑓 (𝑘) (0) = 1. Si trovano quindi i coefficienti 𝑎 𝑘 = 1/𝑘 !.

Se 𝑓 (𝑥) = sin 𝑥 si ha 𝑓 0(𝑥) = cos 𝑥 , 𝑓 00(𝑥) = − sin 𝑥 , 𝑓 000(𝑥) = − cos 𝑥 e 𝑓 (4) (𝑥) =
sin 𝑥 ... e poi le derivate si ripetono ogni quattro iterazioni. Valutando le
derivate in 𝑥 = 0 si ottiene dunque la sequenza 0 , 1 , 0 , −1 , . . . che si ripete
indefinitamente. Si ottiene dunque lo sviluppo indicato. Discorso analogo si
può fare per 𝑓 (𝑥) = cos 𝑥 .

Se 𝑓 (𝑥) = (1 + 𝑥)𝛼 si ottiene 𝑓 0(𝑥) = 𝛼(1 + 𝑥)𝛼−1 , 𝑓 00(𝑥) = 𝛼(𝛼 − 1)(1 + 𝑥)𝛼−2 e
così via... Valutando le derivate in 𝑥 = 0 si ottiene la sequenza: 1, 𝛼 , 𝛼(𝛼 − 1),
𝛼(𝛼 − 1)(𝛼 − 2). . . da cui, dividendo per 𝑘 !, si ottiene che i coefficienti del
polinomio di Taylor risultano essere i coefficienti binomiali 𝛼𝑘 .

Se 𝑓 (𝑥) = ln(1 + 𝑥) osserviamo che 𝑓 (0) = 0 poi si ha 𝑓 0(𝑥) = (1 + 𝑥)−1 e le


derivate successive coincidono dunque con le derivate di (1 + 𝑥)𝛼 con 𝛼 = −1:
i coefficienti (a parte il primo che è nullo) concidono quindi con i coefficienti
binomiali
(−1)(−2)(−3) . . . (−𝑘)
 
−1
= = (−1) 𝑘 .
𝑘 𝑘!

Similmente se 𝑓 (𝑥) = arctg 𝑥 osserviamo che 𝑓 (0) = 0 e 𝑓 0(𝑥) = (1 + 𝑥 2 )−1 . Per


quanto già visto sappiamo che si ha
𝑛
(−1) 𝑘 𝑦 𝑘 + 𝑜(𝑦 𝑛 )
X
(1 + 𝑦)−1 =
𝑘=0

da cui sostituendo 𝑦 = 𝑥 2 si ha
𝑛
(−1) 𝑘 𝑥 2 𝑘 + 𝑜(𝑥 2𝑛 ).
X
𝑓 0(𝑥) = (1 + 𝑥 2 )−1 =
𝑘=0
212 5 calcolo differenziale

Utilizzando la seconda parte del Teorema 5.61 (formula di Taylor con resto di
Peano), abbiamo verificato che vale l’equazione (5.7) per il polinomio 𝑃(𝑥) =
P𝑛
𝑘=0
(−1) 𝑘 𝑥 2 𝑘 . Dunque 𝑃(𝑥) è il polinomio di Taylor di grado 2𝑛 di 𝑓 0(𝑥). Ma il
polinomio di Taylor della derivata è la derivata del polinomio di Taylor, quindi
possiamo utilizzare (5.5) per ottenere il polinomio di Taylor riportato in tabella.
Metodo analogo si usa per 𝑓 (𝑥) = arcsin 𝑥 , osservando che

1 1
𝑓 0(𝑥) = √ = (1 − 𝑥 2 )− 2
1 − 𝑥2
𝑛  1
−2
(−𝑥 2 ) 𝑘 + 𝑜(𝑥 2𝑛 )
X
=
𝑘=0 𝑘
𝑛 − 21 · − 12 − 1 · · · − 12 − 𝑘 + 1
  
(−1) 𝑘 𝑥 2 𝑘 + 𝑜(𝑥 2𝑛 )
X
=
𝑘=0
𝑘!
𝑛 −1
· −3
· · · −(22𝑘−1)
2 2
(−1) 𝑘 𝑥 2 𝑘 + 𝑜(𝑥 2𝑛 )
X
=
𝑘=0
𝑘!
𝑛
(2 𝑘 − 1)!!
𝑥 2 𝑘 + 𝑜(𝑥 2𝑛 )
X
=
𝑘=0 2𝑘 · 𝑘 !
𝑛
(2 𝑘 − 1)!!
𝑥 2 𝑘 + 𝑜(𝑥 2𝑛 )
X
=
𝑘=0
(2 𝑘)!!

abbiamo trovato il polinomio di Taylor di 𝑓 0(𝑥) e utilizzando (5.5) si ottiene la


formula riportata in tabella.
Per quanto riguarda la funzione 𝑓 (𝑥) = tg 𝑥 ci limitiamo a calcolare esplicita-
mente i primi termini:

𝑓 (𝑥) = tg 𝑥 𝑓 (0) = 0
𝑓 (1) = 1 + 𝑓 2 𝑓 (1) (0) = 1
𝑓 (2) = 2 𝑓 𝑓 0 𝑓 (2) (0) = 0
𝑓 (3) = 2( 𝑓 0)2 + 2 𝑓 𝑓 00 𝑓 (3) (0) = 2
𝑓 (4) = 4 𝑓 0 𝑓 00 + 2 𝑓 0 𝑓 00 + 2 𝑓 𝑓 000 = 6 𝑓 0 𝑓 00 + 2 𝑓 𝑓 000 𝑓 (4) (0) = 0
𝑓 (5) = 6( 𝑓 00)2 + 6 𝑓 0 𝑓 000 + 2 𝑓 0 𝑓 000 + 2 𝑓 𝑓 (4)
= 6( 𝑓 00)2 + 8 𝑓 0 𝑓 000 + 2 𝑓 𝑓 (4) 𝑓 (5) (0) = 16.

Si ottengono quindi i coefficienti: 𝑎 0 = 0, 𝑎 1 = 1, 𝑎 2 = 0, 𝑎 3 = 2/3! = 1/3, 𝑎 4 = 0,


𝑎5 = 16/5! = 2/15.
5.8 formula di Taylor 213

Tabella 5.2: sviluppi di Taylor, per 𝑥 →


𝑛
𝑥𝑘 0, di alcune funzioni elementari. Si veda
𝑒𝑥 = + 𝑜(𝑥 𝑛 )
X
il teorema 5.63
𝑘=0
𝑘!
𝑥2 𝑥3 𝑥𝑛
=1+𝑥+ + +···+ + 𝑜(𝑥 𝑛 )
2 6 𝑛!
𝑛
𝑥 2 𝑘+1
(−1) 𝑘 + 𝑜(𝑥 2𝑛+2 )
X
sin 𝑥 =
𝑘=0
( 2 𝑘 + 1 )!
𝑥3 𝑥 2𝑛+1
=𝑥− + · · · + (−1)𝑛 + 𝑜(𝑥 2𝑛+2 )
6 (2𝑛 + 1)!
𝑛
𝑥 2𝑘
(−1) 𝑘 + 𝑜(𝑥 2𝑛+1 )
X
cos 𝑥 =
𝑘=0
(2 𝑘)!
𝑥2 𝑥4 𝑥 2𝑛
=1− + − · · · + (−1)𝑛 + 𝑜(𝑥 2𝑛+1 )
2 24 (2𝑛)!
𝑛  
𝛼 𝛼
𝑥 𝑘 + 𝑜(𝑥 𝑛 )
X
(1 + 𝑥) =
𝑘=0
𝑘
𝛼(𝛼 − 1) 2 𝛼 𝑛
 
= 1 + 𝛼𝑥 + 𝑥 +···+ 𝑥 + 𝑜(𝑥 𝑛 )
2 𝑛
𝑛
𝑥𝑘
(−1) 𝑘−1 + 𝑜(𝑥 𝑛 )
X
ln(1 + 𝑥) =
𝑘=1
𝑘
𝑥2 𝑥3 𝑥𝑛
=𝑥− + − · · · + (−1)𝑛−1 + 𝑜(𝑥 𝑛 )
2 3 𝑛
𝑛
𝑥 2 𝑘+1
(−1) 𝑘 + 𝑜(𝑥 2𝑛+1 )
X
arctg 𝑥 =
𝑘=0
2𝑘 + 1
𝑥3 𝑥5 𝑥 2𝑛+1
=𝑥− + − · · · + (−1)𝑛 + 𝑜(𝑥 2𝑛+1 )
3 5 2𝑛 + 1
𝑥3 3 (2𝑛 − 1)!! 𝑥 2𝑛+1
arcsin 𝑥 = 𝑥 + + 𝑥5 + · · · + + 𝑜(𝑥 2𝑛+1 )
6 40 (2𝑛)!! 2𝑛 + 1
𝜋
arccos 𝑥 = − arcsin 𝑥
2
𝑥3 2
tg 𝑥 = 𝑥 + + 𝑥 5 + 𝑜(𝑥 5 ).
3 15
.
214 5 calcolo differenziale

5.9 operazioni con i simboli di Landau

Le notazioni di Landau 𝑜 -piccolo e 𝑂 -grande sono comodissime per l’ela-


borazione di stime asintotiche. Bisogna però fare molta attenzione a come
queste notazioni vengono usate, perché altrimenti si rischia di fare degli errori
grossolani. Alcuni risultati controintuitivi sono ad esempio:
1. 𝑜(𝑥) − 𝑜(𝑥) = 𝑜(𝑥) (e non 0),
2. 𝑜(𝑥 2 ) = 𝑜(𝑥) ma non 𝑜(𝑥) = 𝑜(𝑥 2 ).
Il secondo esempio, in particolare, ci dice che il simbolo di uguaglianza in
realtà non è utilizzato in modo appropriato in questo contesto, perché non gode
della proprietà simmetrica. In questa sezione proponiamo una definizione
formalmente precisa dell’oggetto 𝑜 -piccolo (e 𝑂 -grande) e un modo rigoroso
per manipolarlo e confrontarlo.

Definizione 5.64 ( 𝑜 -piccolo, 𝑂 -grande). Sia 𝐴 ⊆ ℝ, 𝑥 0 punto di accumulazione


di 𝐴 e sia 𝑔 : 𝐴 → ℝ una funzione positiva su 𝐴. Definiamo allora gli insiemi di
ricordiamo che 𝐴𝐵 denota l’insieme delle funzioni:
funzioni 𝑓 : 𝐵 → 𝐴
𝑓 (𝑥)
 
𝐴
𝑜(𝑔) = 𝑓 ∈ ℝ : lim =0 ;
𝑥→𝑥0 𝑔(𝑥)
𝑓 (𝑥)
 
𝑂(𝑔) = 𝑓 ∈ ℝ𝐴 : lim sup < +∞
𝑥→𝑥 0 𝑔(𝑥)
𝑓 (𝑥)
 
𝐴
= 𝑓 ∈ ℝ : ∃𝑈 ∈ U𝑥0 , 𝐶 > 0 : ∀𝑥 ∈ 𝑈 :
≤𝐶 .
𝑔(𝑥)

Espressioni come ad esempio:

sin 𝑥 − 𝑥 = 𝑜(𝑥 2 ), per 𝑥 → 0

vanno quindi interpretate come

𝑓 ∈ 𝑜(𝑔)

dove 𝑓 (𝑥) = sin 𝑥 − 𝑥 e 𝑔(𝑥) = 𝑥 2 . In questa sezione scriveremo:

sin 𝑥 − 𝑥 ∈ 𝑜(𝑥 2 ) (5.9)

per dare risalto a questa interpretazione (e mettere in evidenza il fatto che la


relazione non è affatto simmetrica).
Possiamo ora procedere ad interpretare le operazioni tra insiemi. In generale se
𝐴 e 𝐵 sono insiemi di oggetti su cui è definita una operazione ∗ (che potrebbe
essere la somma, il prodotto, il rapporto...) definiamo:

𝐴 ∗ 𝐵 = {𝑎 ∗ 𝑏 : 𝑎 ∈ 𝐴, 𝑏 ∈ 𝐵}.

Analogamente se 𝐴 è un insieme sui cui elementi è definita una operazione ∗


con un oggetto 𝑏 , definiremo:

𝐴 ∗ 𝑏 = {𝑎 ∗ 𝑏 : 𝑎 ∈ 𝐴}, 𝑏 ∗ 𝐴 = {𝑏 ∗ 𝑎 : 𝑎 ∈ 𝐴}.
5.9 operazioni con i simboli di Landau 215

Ad esempio l’espressione
sin 𝑥 = 𝑥 + 𝑜(𝑥 2 )
andrebbe formalmente intesa come

sin 𝑥 ∈ 𝑥 + 𝑜(𝑥 2 )

dove l’insieme 𝑥+𝑜(𝑥 2 ) è l’insieme di tutte le funzioni 𝑓 che possono essere scritte
nella forma 𝑓 (𝑥) = 𝑥 + ℎ(𝑥) con ℎ ∈ 𝑜(𝑥 2 ) cioè ℎ tale che ℎ(𝑥)/𝑥 2 → 0. Risulta
quindi che tale espressione è equivalente alla (5.9) in quanto se sin 𝑥 = 𝑥 + ℎ(𝑥)
con ℎ ∈ 𝑜(𝑥 2 ) significa che sin 𝑥 − 𝑥 ∈ 𝑜(𝑥 2 ).

Possiamo allora enunciare le regole algebriche di manipolazione dei simboli di


Landau.

Teorema 5.65 (operazioni con i simboli di Landau). Sia 𝐴 ⊆ ℝ, 𝑥 0 ∈ [−∞, +∞]


punto di accumulazione per 𝐴. Siano 𝑓 , 𝑔 : 𝐴 → ℝ funzioni positive, 𝑐 ∈ ℝ, 𝑐 ≠ 0,
𝑛 ∈ ℕ , 𝑛 ≠ 0. Allora, per 𝑥 → 𝑥0 si ha:

0 ∈ 𝑜( 𝑓 ) ⊆ 𝑂( 𝑓 ) 𝑓 ∈ 𝑂( 𝑓 )
𝑐 · 𝑜( 𝑓 ) = 𝑜( 𝑓 ) 𝑐 · 𝑂( 𝑓 ) = 𝑂( 𝑓 )
𝑜( 𝑓 ) + 𝑜( 𝑓 ) = 𝑜( 𝑓 ) 𝑂( 𝑓 ) + 𝑂( 𝑓 ) = 𝑂( 𝑓 )
𝑜( 𝑓 ) − 𝑜( 𝑓 ) = 𝑜( 𝑓 ) 𝑂( 𝑓 ) − 𝑂( 𝑓 ) = 𝑂( 𝑓 )
𝑜( 𝑓 · 𝑔) = 𝑓 · 𝑜(𝑔) 𝑂( 𝑓 · 𝑔) = 𝑓 · 𝑂(𝑔)
𝑜(𝑔/ 𝑓 ) = 𝑜(𝑔)/ 𝑓 𝑂(𝑔/ 𝑓 ) = 𝑂(𝑔)/ 𝑓
𝑜( 𝑓 ) · 𝑜(𝑔) ⊆ 𝑜( 𝑓 · 𝑔) 𝑂( 𝑓 ) · 𝑂(𝑔) ⊆ 𝑂( 𝑓 · 𝑔)
𝑜( 𝑓 ) · 𝑂(𝑔) ⊆ 𝑜( 𝑓 · 𝑔)
(𝑜( 𝑓 ))𝑛 ⊆ 𝑜( 𝑓 𝑛 ) (𝑂( 𝑓 ))𝑛 ⊆ 𝑂( 𝑓 𝑛 )
𝑜(𝑜( 𝑓 )) ⊆ 𝑜( 𝑓 ) 𝑂(𝑂( 𝑓 )) ⊆ 𝑂( 𝑓 )
𝑜(𝑂( 𝑓 )) ⊆ 𝑜( 𝑓 ) 𝑂(𝑜( 𝑓 )) ⊆ 𝑜( 𝑓 ).

Si osserva, in particolare, che 𝑜( 𝑓 ) e 𝑂( 𝑓 ) sono sottospazi vettoriali di ℝ𝐴 .

E’ anche possibile applicare i cambi di variabile. Se 𝑓 ∈ 𝑜(𝑔) per 𝑥 → 𝑥 0 e ℎ(𝑡) → 𝑥 0


per 𝑡 → 𝑡0 allora
ℎ ◦ 𝑓 ∈ 𝑜(ℎ ◦ 𝑔) per 𝑡 → 𝑡0 .

Dimostrazione. Visto che 0/ 𝑓 = 0 è ovvio che 0 ∈ 𝑜( 𝑓 ). L’inclusione 𝑜( 𝑓 ) ⊆ 𝑂( 𝑓 )


discende dal fatto che se ℎ ∈ 𝑜( 𝑓 ) significa che ℎ/ 𝑓 → 0 per 𝑥 → 𝑥 0 . Ma
allora esiste un intorno di 𝑥 0 in cui |ℎ/ 𝑓 | < 1 e dunque ℎ ∈ 𝑂( 𝑓 ). Ovviamente
𝑓 ∈ 𝑂( 𝑓 ) in quanto 𝑓 / 𝑓 = 1 è una funzione limitata.

Se ℎ ∈ 𝑐 · 𝑜( 𝑓 ) significa che ℎ = 𝑐 · (ℎ/𝑐) e ℎ/𝑐 ∈ 𝑜( 𝑓 ) ovvero (ℎ/𝑐)/ 𝑓 → 0. Ma


questo è equivalente a ℎ/ 𝑓 → 0 visto che 𝑐 è una costante non nulla. Il caso
degli 𝑂 grande si svolge in modo simile.

L’insieme 𝑜( 𝑓 ) + 𝑜( 𝑓 ) è formato da funzione della forma ℎ + 𝑘 con ℎ, 𝑘 ∈ 𝑜( 𝑓 ).


Ma si ha
ℎ+𝑘 ℎ 𝑘
= + → 0 + 0 = 0.
𝑓 𝑓 𝑓
216 5 calcolo differenziale

Dunque 𝑜( 𝑓 ) + 𝑜( 𝑓 ) ⊆ 𝑜( 𝑓 ). Viceversa osserviamo che se ℎ ∈ 𝑜( 𝑓 ) si può


scrivere ℎ = ℎ/2 + ℎ/2 e per quanto visto prima sappiamo che ℎ/2 ∈ 𝑜( 𝑓 ).
Dunque 𝑜( 𝑓 ) ⊆ 𝑜( 𝑓 ) + 𝑜( 𝑓 ). Ragionamento simile si può fare per 𝑂( 𝑓 ): la
somma di due funzioni localmente limitate è anch’essa localmente limitata.

Osserviamo che 𝑜( 𝑓 ) − 𝑜( 𝑓 ) = 𝑜( 𝑓 ) + (−1) · 𝑜( 𝑓 ) = 𝑜( 𝑓 ) + 𝑜( 𝑓 ) = 𝑜( 𝑓 ) per quanto


già visto. Lo stesso vale per 𝑂( 𝑓 ) − 𝑂( 𝑓 ).

Se ℎ ∈ 𝑜( 𝑓 𝑔) significa che ℎ/( 𝑓 𝑔) → 0. Ma allora ℎ = 𝑓 · (ℎ/ 𝑓 ) con ℎ/ 𝑓 ∈ 𝑜(𝑔)


in quanto (ℎ/ 𝑓 )/𝑔 = ℎ/( 𝑓 𝑔) → 0. Dunque ℎ ∈ 𝑓 𝑜(𝑔) e di conseguenza
𝑜( 𝑓 𝑔) ⊆ 𝑓 · 𝑜(𝑔). Viceversa se ℎ ∈ 𝑓 · 𝑜(𝑔) significa che ℎ = 𝑓 · (ℎ/ 𝑓 ) con
ℎ/ 𝑓 ∈ 𝑜(𝑔) ovvero (ℎ/ 𝑓 )/𝑔 → 0. Dunque ℎ/( 𝑓 𝑔) → 0 che significa ℎ ∈ 𝑜( 𝑓 𝑔).
Ragionamento analogo si può fare con gli 𝑂 grande.

I risultati per la divisione si riconducono a quelli della moltiplicazione osser-


vando che la divisione per 𝑓 è uguale alla moltiplicazione per 1/ 𝑓 .

Se ℎ ∈ 𝑜( 𝑓 ) e 𝑘 ∈ 𝑜(𝑔) vogliamo mostrare che ℎ 𝑘 ∈ 𝑜( 𝑓 𝑔). Ma questo è


ovvio essendo (ℎ 𝑘)/( 𝑓 𝑔) = (ℎ/ 𝑓 ) · (𝑘/𝑔) → 0 · 0 = 0. Abbiamo mostrato che
𝑜( 𝑓 )𝑜(𝑔) ⊆ 𝑜( 𝑓 𝑔). Risultato analogo si ha negli altri due casi 𝑂( 𝑓 )𝑂(𝑔) ⊆
𝑂( 𝑓 𝑔) e 𝑜( 𝑓 )𝑂(𝑔) ⊆ 𝑜( 𝑓 𝑔), osservando che il prodotto di due funzioni limitate
è limitata e il prodotto di una limitata per una infinitesima è infinitesima.

Per quanto riguarda la potenza (𝑜( 𝑓 ))𝑛 osserviamo che si ha:

(𝑜( 𝑓 ))𝑛 = {ℎ 𝑛 : ℎ ∈ 𝑜( 𝑓 )} ⊆ {ℎ1 · · · ℎ 𝑛 : ℎ1 , . . . , ℎ 𝑛 ∈ 𝑜( 𝑓 )}


= 𝑜( 𝑓 ) · · · 𝑜( 𝑓 ) ⊆ 𝑜( 𝑓 𝑛 ).

Se ℎ ∈ 𝑜(𝑜( 𝑓 )) significa che esiste 𝑘 ∈ 𝑜( 𝑓 ) e ℎ ∈ 𝑜(𝑘). Dunque 𝑘/ 𝑓 → 0 e


ℎ/𝑘 → 0. Ma allora ℎ/ 𝑓 = (ℎ/𝑘) · (𝑘/ 𝑓 ) → 0 · 0 = 0 dunque ℎ ∈ 𝑜( 𝑓 ). Abbiamo
quindi mostrato che 𝑜(𝑜( 𝑓 )) ⊆ 𝑜( 𝑓 ). Dimostrazione analoga si può fare per gli
𝑂 grande. Anche le inclusioni 𝑜(𝑂( 𝑓 )) ⊆ 𝑜( 𝑓 ) e 𝑂(𝑜( 𝑓 )) ⊆ 𝑜( 𝑓 ) si dimostrano
in modo analogo osservando che il prodotto di una funzione limitata per una
infinitesima è infinitesima.

Per quanto riguarda il cambio di variabile, dobbiamo verificare che

𝑓 (ℎ(𝑡))
→0 per 𝑡 → 𝑡0
𝑔(ℎ(𝑡))

se 𝑓 ∈ 𝑜(𝑔) e se ℎ(𝑡) → 𝑥 0 per 𝑡 → 𝑡0 . Ma questo non è altro che il cambio di


variabile 𝑥 = ℎ(𝑡) nel limite 𝑓 (𝑥)/𝑔(𝑥) → 0 per 𝑥 → 𝑥 0 .

Esempio 5.66. Sapendo che per 𝑥 → 0 si ha

𝑥2
sin 𝑥 ∈ 𝑥 + 𝑜(𝑥 2 ), cos 𝑥 ∈ 1 − + 𝑜(𝑥 3 )
2
5.9 operazioni con i simboli di Landau 217

e ricordando che 𝑥 3 ∈ 𝑜(𝑥 2 ) possiamo dedurre, utilizzando le proprietà del teorema


precedente:

2 cos 𝑥 − sin 𝑥 ∈ 2 − 𝑥 2 + 2 𝑜(𝑥 3 ) − 𝑥 − 𝑜(𝑥 2 )


= 2 − 𝑥 − 𝑥 2 + 𝑜(𝑥 3 ) + 𝑜(𝑥 2 )
= 2 − 𝑥 − 𝑥 2 + 𝑜(𝑜(𝑥 2 )) + 𝑜(𝑥 2 )
⊆ 2 − 𝑥 − 𝑥 2 + 𝑜(𝑥 2 ) + 𝑜(𝑥 2 )
= 2 − 𝑥 − 𝑥 2 + 𝑜(𝑥 2 ).

Usualmente tutti questi passaggi vengono sottointesi, si utilizza il simbolo = al posto di


∈ e ⊆ e spesso si preferisce scrivere sempre un solo 𝑜(·) alla fine di ogni espressione.

Esempio 5.67. Con gli stessi presupposti dell’esempio precedente potremo scrivere:

(sin2 𝑥) · (2 − 2 cos 𝑥)3 ∈ (𝑥 + 𝑜(𝑥 2 ))2 · (2 − (2 − 𝑥 2 − 2 𝑜(𝑥 3 ))3


= (𝑥 + 𝑜(𝑥 2 ))2 · (𝑥 2 + 𝑜(𝑥 3 ))3
= (𝑥 2 + 2𝑥𝑜(𝑥 2 ) + (𝑜(𝑥 2 ))2 )
· (𝑥 6 + 3 𝑥 4 𝑜(𝑥 3 ) + 3 𝑥 2 (𝑜(𝑥 3 ))2 + (𝑜(𝑥 3 ))3 )
⊆ (𝑥 2 + 𝑜(𝑥 3 ) + 𝑜(𝑥 4 )) · (𝑥 6 + 𝑜(𝑥 7 ) + 𝑜(𝑥 8 ) + 𝑜(𝑥 9 ))
= (𝑥 2 + 𝑜(𝑥 3 )) · (𝑥 6 + 𝑜(𝑥 7 ))
= 𝑥 8 + 𝑥 2 𝑜(𝑥 7 ) + 𝑜(𝑥 3 )𝑥 6 + 𝑜(𝑥 3 )𝑜(𝑥 7 )
= 𝑥 8 + 𝑜(𝑥 9 ) + 𝑜(𝑥 9 ) + 𝑜(𝑥 10 ) = 𝑥 8 + 𝑜(𝑥 9 ).

Esempio 5.68. Possiamo anche fare un esercizio con il cambio di variabile. Osservando
che 𝑦 = 1 − cos 𝑥 → 0 per 𝑥 → 0 sapendo che sin 𝑦 = 𝑦 + 𝑜(𝑦 2 ) per 𝑦 → 0 e che
2 − 2 cos 𝑥 = 𝑥 2 + 𝑜(𝑥 2 ) per 𝑥 → 0 possiamo scrivere che per 𝑥 → 0 si ha:

sin(2 − 2 cos 𝑥) ∈ (2 − 2 cos 𝑥) + 𝑜((2 − 2 cos 𝑥)2 )


⊆ 𝑥 2 + 𝑜(𝑥 2 ) + 𝑜((𝑥 2 + 𝑜(𝑥 2 ))2 )
⊆ 𝑥 2 + 𝑜(𝑥 2 ) + 𝑜(𝑂(𝑥 4 ))
⊆ 𝑥 2 + 𝑜(𝑥 2 ) + 𝑜(𝑥 4 )
= 𝑥 2 + 𝑜(𝑥 2 ).

Esercizio 5.69. Dimostrare (per semplice curiosità) che valgono anche le inclusioni
inverse a quelle enunciate nel teorema:

𝑜( 𝑓 · 𝑔) ⊆ 𝑜( 𝑓 ) · 𝑜(𝑔), 𝑂( 𝑓 · 𝑔) ⊆ 𝑂( 𝑓 ) · 𝑜(𝑔),
𝑜( 𝑓 · 𝑔) ⊆ 𝑜( 𝑓 ) · 𝑂(𝑔),
𝑜( 𝑓 ) ⊆ 𝑜(𝑜( 𝑓 )), 𝑂( 𝑓 ) ⊆ 𝑂(𝑂( 𝑓 )).

Osservare invece che (𝑜( 𝑓 ))2 ≠ 𝑜( 𝑓 ) · 𝑜( 𝑓 ).

La formula di Taylor può risultare molto utile per determinare il carattere di


una serie, come nel seguente.
218 5 calcolo differenziale

Esercizio 5.70. Determinare i valori di 𝛼 ∈ ℝ per i quali la serie


+∞  𝛼
X 𝑘 1 1
(−1) − sin
𝑘=1
𝑘 𝑘

converge assolutamente e quelli per cui converge.

Soluzione. Posto 𝑓 (𝑥) = 𝑥 − sin 𝑥 , tramite sviluppo di Taylor sappiamo che si


ha, per 𝑥 → 0:
𝛼
𝑥3 𝑥 3𝛼

𝛼
𝑓 (𝑥) = (𝑥 − sin 𝑥) = 𝛼
+ 𝑜(𝑥 3 ) = (1 + 𝑜(1))𝛼
6 6𝛼
𝑥 3𝛼 𝑥 3𝛼
= (1 + 𝛼 · 𝑜(1 ) + 𝑜(𝑜(1 ))) = (1 + 𝑜(1)).
6𝛼 6𝛼

Visto che per 𝑘 → +∞ si ha 𝑥 = 1/𝑘 → 0, possiamo scrivere:


 𝛼
𝛼1 1 1 1
𝑎 𝑘 = ( 𝑓 (1/𝑘)) = − sin = (1 + 𝑜(1)) ∼ 𝛼 3𝛼 .
𝑘 𝑘 6𝛼 ·𝑘 3 𝛼 6 ·𝑘

Osserviamo che la serie data è (−1) 𝑘 𝑎 𝑘 e che 𝑎 𝑘 > 0. Dunque per il criterio
P
di confronto asintotico se 3 𝛼 > 1, cioè se 𝛼 > 1/3, la serie data converge
assolutamente, se invece 𝛼 ≤ 1/3 la serie non converge assolutamente (ma
potrebbe convergere). Osserviamo inoltre che se 𝛼 ≤ 0 il termine 𝑎 𝑘 non è
neanche infinitesimo e quindi la serie non può convergere.

Per 𝛼 ∈ (0 , 1/3] possiamo provare ad utilizzare il criterio di Leibniz: la suc-


cessione 𝑎 𝑘 è infinitesima, dobbiamo verificare che sia anche definitivamente
decrescente. Avendo posto 𝑎 𝑘 = ( 𝑓 (1/𝑘))𝛼 sarà sufficiente dimostrare che la
funzione 𝑓 (𝑥) è crescente in un intorno destro di 0. Per le proprietà del polino-
mio di Taylor sappiamo che il polinomio di Taylor di ordine 2 di 𝑓 0(𝑥) è uguale
alla derivata del polinomio di Taylor di 𝑓 (𝑥) di ordine 3. Dunque possiamo
affermare immediatamente (ma sarebbe stato ugualmente veloce calcolare la
derivata e poi svilupparla) che
0
𝑥3 𝑥2
  
1
𝑓 0(𝑥) = + 𝑜(𝑥 2 ) = + 𝑜(𝑥 2 ) = 𝑥 2 + 𝑜(1)
6 2 2

dunque, per la permanenza del segno, deve esistere un intorno di 0 in cui


1/2 + 𝑜(1) è positivo e quindi in tale intorno risulta che 𝑓 0(𝑥) ≥ 0 cioè 𝑓 è
crescente. Dunque anche 𝑓 𝛼 è crescente e, per 𝑘 abbastanza grande, 𝑎 𝑘 è
decrescente. Si può quindi applicare il criterio di Leibniz e concludere che la
serie è convergente per ogni 𝛼 > 0.

Esercizio 5.71. Dimostrare che la seguente serie è convergente:

X√
 
1 1
𝑘 𝑘 tg − cos .
𝑘
𝑘 𝑘

Soluzione. In questo esercizio utilizziamo la nozione di 𝑂 -grande (ma l’esercizio


potrebbe essere risolto anche utilizzando gli 𝑜 -piccolo, come al solito). Per
5.10 funzioni analitiche 219

𝑥 → 0 si ha: qui sfruttiamo il fatto che lo sviluppo di


Taylor del terzo ordine esiste e usando
tg 𝑥 = 𝑥 + 𝑐𝑥 + 𝑜(𝑥 ) = 𝑥 + 𝑂(𝑥 )
3 3 3
la notazione degli 𝑂 -grande evitiamo di
doverci ricordare qual è il coefficiente
e analogamente
𝑐 = 13 che compare nella formula
cos 𝑥 = 1 + 𝑂(𝑥 2 )
da cui
tg 𝑥
− cos 𝑥 = 𝑂(𝑥 2 ).
𝑥
Dunque per 𝑘 → +∞ si ha

√ √
     
1 1 1 1
𝑎𝑘 = 𝑘 𝑘 tan − cos = 𝑘·𝑂 2 =𝑂 3 .
𝑘 𝑘 𝑘 𝑘2
Significa che per 𝑘 sufficientemente grande esiste una costante 𝐶 per cui

𝐶
𝑎𝑘 ≤ 3
.
𝑘2

Siccome sappiamo che la serie 𝑘1𝑝 è convergente se 𝑝 > 1 per il criterio del
P
confronto 𝑎 𝑘 (che è una serie a termini positivi) è anch’essa convergente.
P

5.10 funzioni analitiche

Nel capitolo sulle serie di potenze abbiamo studiato le serie di potenze della
forma
+∞
𝑎𝑘 𝑧 𝑘 .
X
𝑔(𝑧) = (5.10)
𝑘=0

E’ chiaro che se fissiamo un punto 𝑧 0 possiamo fare un cambio di variabile e


osservare che la serie
+∞
𝑎 𝑘 (𝑧 − 𝑧0 ) 𝑘 = 𝑔(𝑧 − 𝑧0 )
X
𝑓 (𝑧) = (5.11)
𝑘=0

converge nel cerchio 𝐵𝑅 (𝑧 0 ) = {𝑧 ∈ ℤ : |𝑧 − 𝑧 0 | < 𝑅} dove 𝑅 è il raggio della


serie di potenze (5.10). Diremo che la serie nell’equazione (5.11) è una serie di
potenze centrata in 𝑧 0 e chiameremo 𝑅 il suo raggio di convergenza.

Risulta allora naturale chiedersi se una serie di potenza centrata in un punto 𝑧 0


può essere traslata in un punto 𝑧 1 ≠ 𝑧 0 almeno quando 𝑧 1 ∈ 𝐵𝑅 (𝑧 0 ). La risposta,
affermativa, è data dal seguente.

Teorema 5.72 (traslazione di una serie di potenze). Si consideri la serie di


potenze (5.11) centrata in 𝑧 0 con raggio di convergenza 𝑅 ∈ (0 , +∞], si prenda un
punto 𝑧 1 ∈ 𝐵𝑅 (𝑧 0 ) e si ponga 𝑟 = 𝑅 − |𝑧 1 − 𝑧 0 | cosicché 𝐵𝑟 (𝑧 1 ) ⊆ 𝐵𝑅 (𝑧 0 ). Allora per
ogni 𝑧 ∈ 𝐵𝑟 (𝑧 1 ) si ha
+∞
𝑏 𝑘 (𝑧 − 𝑧 1 ) 𝑘
X
𝑓 (𝑧) = (5.12)
𝑘=0

per opportuni coefficienti 𝑏 𝑘 . In particolare la serie di potenze in (5.12), centrata in 𝑧 1 ,


ha raggio di convergenza non inferiore a 𝑟 .
220 5 calcolo differenziale

Dimostrazione. Per semplificare le notazioni possiamo supporre, senza perdere


di generalità, che sia 𝑧 0 = 0. Informalmente vorremmo svolgere i seguenti
passaggi:
+∞ +∞
𝑎𝑘 𝑧 𝑘 = 𝑎 𝑘 (𝑧 − 𝑧 1 + 𝑧1 ) 𝑘
X X
𝑓 (𝑧) =
𝑘=0 𝑘=0
+∞ 𝑘  
𝑘 𝑘−𝑗
𝑧 1 (𝑧 − 𝑧1 ) 𝑗
X X
= 𝑎𝑘
𝑘=0 𝑗=0
𝑗
!
+∞ X
+∞
𝑘 𝑘−𝑗
 
(𝑧 − 𝑧1 ) 𝑗
X
= 𝑎𝑘 𝑧
𝑗=0 𝑘=𝑗
𝑗 1

ottenendo quindi il risultato voluto con


+∞
𝑘 𝑘−𝑗
 
X
𝑏𝑗 = 𝑎𝑘 𝑧 .
𝑘=𝑗
𝑗 1

Affinché questi passaggi siano validi bisogna garantire che i termini

𝑘 𝑘−𝑗
 
𝑐 𝑘,𝑗 = 𝑎 𝑘 𝑧
𝑗 1

siano assolutamente sommabili, cosicché i passaggi fatti sopra risultano validi


in quanto stiamo associando e commutando i termini di una serie assolutamente
convergente. Ma ripetendo gli stessi passaggi con gli opportuni moduli si
osserva che
+∞
|𝑎 𝑘 |(|𝑧 − 𝑧 1 | + |𝑧1 |) 𝑘 .
X X
𝑐 𝑘,𝑗 =
𝑘,𝑗 𝑘=0

Visto che la serie di potenze originale è assolutamente convergente all’interno


del raggio di convergenza, possiamo affermare che essendo |𝑧 − 𝑧 1 | + |𝑧 1 | <
𝑟 + |𝑧1 | = 𝑅 la serie 𝑐 𝑘,𝑗 è assolutamente convergente, i passaggi informali
P
sono giustificati e la dimostrazione è conclusa.

La teoria delle funzioni analitiche potrebbe essere svolta, senza cambiare


sostanzialmente nulla, per le funzioni di variabile complessa. Si dovrebbe
però introdurre il concetto di derivata in senso complesso un argomento che
richiederebbe molto spazio e che esula dagli scopi di questo corso. Ci limitiamo
quindi alle funzioni reali, che sono il nostro argomento di studio.
funzione analitica
Definizione 5.73 (funzione analitica). Sia 𝐴 ⊆ ℝ un insieme aperto e sia 𝑓 : 𝐴 ⊆
ℝ → ℝ una funzione. Diremo che 𝑓 è analitica se per ogni 𝑥0 ∈ 𝐴 esiste una
successione di numeri reali 𝑎 𝑘 ed esiste 𝑅 > 0 tali che per ogni 𝑥 ∈ (𝑥 0 −𝑅, 𝑥 0 +𝑅) ⊆ 𝐴
si ha:
+∞
𝑎 𝑘 (𝑥 − 𝑥0 ) 𝑘 .
X
𝑓 (𝑥) =
𝑘=0

Il teorema 5.72 ci dice in particolare che la somma di una serie di potenze è una
funzione analitica, almeno all’interno del raggio di convergenza. Ad esempio
le funzioni 𝑒 𝑥 , sin 𝑥 e cos 𝑥 sono state definite come somma di una serie di
5.10 funzioni analitiche 221

potenze (centrata in 𝑥 = 0) di raggio infinito e dunque risultano essere funzioni


analitiche su tutto ℝ.

Teorema 5.74 (Sviluppabilità in serie di Taylor). Se 𝑓 : 𝐴 ⊆ ℝ → ℝ è una


funzione analitica allora 𝑓 ∈ 𝐶 ∞ (𝐴) e per ogni 𝑥 0 ∈ 𝐴 esiste 𝑅 > 0, tale che per ogni
𝑥 ∈ (𝑥0 − 𝑅, 𝑥0 + 𝑅) ⊆ 𝐴 risulta

𝑓 (𝑥 0 )
+∞ (𝑘)
(𝑥 − 𝑥0 ) 𝑘 .
X
𝑓 (𝑥) = (5.13)
𝑘=0
𝑘!

Anche la derivata di 𝑓 è una funzione analitica e la serie di Taylor della derivata si


ottiene derivando termine a termine la serie di Taylor di 𝑓 .

Dimostrazione. Senza perdere di generalità supponiamo che sia 𝑥 0 = 0. Essendo


𝑓 una funzione analitica, per definizione sappiamo che esiste 𝑅 > 0 tale che per
|𝑥| < 𝑅 si ha
+∞
𝑎𝑘 𝑥 𝑘
X
𝑓 (𝑥) =
𝑘=0

con opportuni coefficienti 𝑎 𝑘 . Vogliamo mostrare che 𝑓 (𝑥) è derivabile.


Informalmente vorremmo svolgere i seguenti passaggi:
P𝑘 𝑘  𝑗 𝑘−𝑗
𝑓 (𝑥 + ℎ) − 𝑓 (𝑥) X (𝑥 + ℎ) 𝑘 − 𝑥 𝑘 X 𝑗 ℎ 𝑥
+∞ +∞
𝑗=1
= 𝑎𝑘 = 𝑎𝑘
ℎ 𝑘=1
ℎ 𝑘=1

+∞ 𝑘
𝑘
 
ℎ 𝑗−1 𝑥 𝑘−𝑗
X X
= 𝑎𝑘
𝑘=1 𝑗=1
𝑗
+∞ 𝑘−1
𝑘
 
ℎ 𝑗 𝑥 𝑘−𝑗−1
X X
= 𝑎𝑘
𝑘=1 𝑗=0
𝑗+1
!
+∞ +∞
𝑘
 
𝑥 𝑘−𝑗−1 ℎ 𝑗 .
X X
= 𝑎𝑘
𝑗=0 𝑘=𝑗+1
𝑗+1

Se poniamo
𝑘
 
𝑐 𝑘,𝑗 = 𝑎 𝑘 𝑥 𝑘−𝑗−1
𝑗+1
i passaggi risultano giustificati se la serie 𝑘,𝑗 𝑐 𝑘,𝑗 è assolutamente convergente.
P
Ma, mettendo opportunamente i valori assoluti nei passaggi già fatti, si ha

+∞ X
X +∞ X
𝑐 𝑘,𝑗 =
+∞
|𝑥 + ℎ| 𝑘 − |𝑥| 𝑘
|𝑎 𝑘 |
𝑗=0 𝑘=𝑗+1 𝑘=1
| ℎ|

e dunque possiamo affermare che c’è convergenza assoluta se |𝑥| < 𝑅 e


|𝑥 + ℎ| < 𝑅 cioè se | ℎ| < 𝑅−|𝑥| . In tal caso i passaggi fatti prima sono giustificati
e quindi il risultato è una serie di potenze convergente per |ℎ| < 𝑅 − |𝑥| . In
particolare fissato 𝑥 la somma della serie di potenze ottenuta alla fine è una
funzione continua e per ℎ → 0 tende al termine noto della serie (quello con
222 5 calcolo differenziale

𝑗 = 0), dunque si ha

𝑓 (𝑥 + ℎ) − 𝑓 (𝑥) X+∞
𝑘 𝑘−1 X+∞  
lim = 𝑎𝑘 𝑥 = 𝑘𝑎 𝑘 𝑥 𝑘−1 .
ℎ→0 ℎ 𝑘=1
1 𝑘=1

Abbiamo trovato che la derivata della serie di potenze è uguale alla serie di
potenze delle derivate.

Visto che la serie delle derivate ha lo stesso raggio di convergenza 𝑅 della serie
originaria (teorema 3.42) il procedimento può essere iterato trovando che ogni
derivata è derivabile e per ogni 𝑥 ∈ (−𝑅, 𝑅) si avrà dunque:
+∞
𝑘(𝑘 − 1) · · · (𝑘 − 𝑛 + 1)𝑎 𝑘 𝑥 𝑘−𝑛 .
X
𝑓 (𝑛) (𝑥) =
𝑘=𝑛

In particolare
𝑓 (𝑛) (0) = 𝑛 ! · 𝑎 𝑛
e quindi
𝑓 (0)
+∞ (𝑘)
𝑥𝑘
X
𝑓 (𝑥) =
𝑘=0
𝑘!
come dovevamo dimostrare.

Abbiamo visto che le funzioni analitiche sono di classe 𝐶 ∞ . Il seguente esempio


ci mostra che il viceversa non è vero e dunque la classe delle funzioni analitiche
è strettamente contenuta nella classe delle funzioni 𝐶 ∞ .

Esempio 5.75 (funzione 𝐶 ∞ non analitica). La funzione


1
(

𝑒 𝑥2 se 𝑥 ≠ 0
𝑓 (𝑥) =
0 se 𝑥 = 0

è di classe 𝐶 ∞ in quanto per 𝑥 ≠ 0 possiamo calcolare tutte le derivate e osservare che si


possono scrivere nella forma

𝑃𝑛 (𝑥) − 12
𝑓 (𝑛) (𝑥) = 𝑒 𝑥
𝑥 3𝑛
per un opportuno polinomio 𝑃𝑛 (lo si dimostri per induzione). Dunque per 𝑥 → 0 si
ha, per ogni 𝑛 ∈ ℕ
𝑓 (𝑛) (𝑥) → 0
e quindi la funzione 𝑓 è derivabile infinite volte anche nel punto 𝑥 = 0 (grazie alla
proposizione 5.26) e risulta 𝑓 (𝑛) (0) = 0 per ogni 𝑛 ∈ ℕ . Se la funzione 𝑓 fosse analitica
in un intorno di 0 dovremmo avere, per il teorema 5.74:
+∞
0 · 𝑥𝑘 = 0
X
𝑓 (𝑥) =
𝑘=0

che è assurdo in quanto 𝑓 (𝑥) > 0 per ogni 𝑥 ≠ 0.


serie binomiale
5.10 funzioni analitiche 223

Teorema 5.76 (serie binomiale). Per ogni 𝛼 ∈ ℝ per ogni 𝑥 ∈ (−1 , 1) si ha


+∞  
𝛼 𝛼
𝑥𝑘.
X
(1 + 𝑥) =
𝑘=0
𝑘

Dimostrazione. Innanzitutto osserviamo che la serie di potenze di coefficiente


𝑎 𝑘 = 𝛼𝑘 ha raggio di convergenza 𝑅 = 1. Infatti, tramite il criterio del rapporto,

si trova:

|𝑎 𝑛+1 | |𝛼(𝛼 − 1) · · · (𝛼 − 𝑛)| 𝑛! |𝛼 − 𝑛|


= · = → 1.
|𝑎 𝑛 | (𝑛 + 1)! |𝛼(𝛼 − 1) · · · (𝛼 − 𝑛 + 1)| 𝑛+1

Dunque la funzione
+∞  
𝛼
𝑥𝑘
X
𝑓 (𝑥) =
𝑘=0
𝑘

è definita per ogni 𝑥 ∈ (−1 , 1). Grazie al teorema 5.72 la funzione 𝑓 è sviluppabile
in serie di potenze nell’intorno di ogni punto dell’intervallo (−1 , 1) e dunque
è una funzione analitica su tale intervallo. Inoltre la sua derivata ha come
sviluppo la serie delle derivate:
+∞
𝛼 𝑘−1
 
0
X
𝑓 (𝑥) = 𝑘 𝑥 .
𝑘=1
𝑘

Per dimostrare che 𝑓 (𝑥) = (1 + 𝑥)𝛼 basta mostrare che il rapporto:

𝑓 (𝑥)
𝑢(𝑥) =
(1 + 𝑥)𝛼

è costantemente uguale ad 1. Per verifica diretta si vede che 𝑓 (0) = 1 dunque


abbiamo almeno 𝑢(0) = 1. Basta allora mostrare che 𝑢 è costante ovvero che
𝑢 0 = 0. Ma si ha

𝑓 0(𝑥)(1 + 𝑥)𝛼 − 𝑓 (𝑥)𝛼(1 + 𝑥)𝛼−1


𝑢 0(𝑥) =
(1 + 𝑥)2𝛼
(1 + 𝑥) 𝑓 (𝑥) − 𝛼 𝑓 (𝑥)
0
= .
(1 + 𝑥)𝛼+1
224 5 calcolo differenziale

Osserviamo allora che


+∞ +∞
𝛼 𝑘−1 X 𝛼 𝑘
   
X
(1 + 𝑥) 𝑓 0(𝑥) = 𝑘 𝑥 + 𝑘 𝑥
𝑘=1
𝑘 𝑘=1
𝑘
+∞ +∞
𝛼 𝛼 𝑘
   
𝑥𝑘 +
X X
= (𝑘 + 1) 𝑘 𝑥
𝑘=0
𝑘+1 𝑘=0
𝑘
+∞ 
𝛼(𝛼 − 1) · · · (𝛼 − 𝑘) 𝛼(𝛼 − 1) · · · (𝛼 − 𝑘 + 1) 𝑘

X
= +𝑘 𝑥
𝑘=0
𝑘! 𝑘!
+∞
𝛼(𝛼 − 1) · · · (𝛼 − 𝑘 + 1)
[(𝛼 − 𝑘) + 𝑘]𝑥 𝑘
X
=
𝑘=0
𝑘!
+∞
𝛼 𝑘
 
X
=𝛼 𝑥 = 𝛼 · 𝑓 (𝑥).
𝑘=0
𝑘

Dunque 𝑢 0(𝑥) = 0 e 𝑓 (𝑥) = (1 + 𝑥)𝛼 per ogni 𝑥 ∈ (−1 , 1), come volevamo
dimostrare.

Non basta che una funzione sia di classe 𝐶 ∞ per garantire che sia anche analitica
e quindi può essere utile il seguente.

Teorema 5.77 (criterio di analiticità). Sia 𝑓 ∈ 𝐶 ∞ (𝐴) una funzione reale definita su
un insieme aperto 𝐴 ⊆ ℝ. Supponiamo che per ogni 𝑥 0 ∈ 𝐴 esistano 𝑟 > 0, 𝑀 > 0 e
𝐿 > 0 tali che [𝑥0 − 𝑟, 𝑥0 + 𝑟] ⊆ 𝐴 e per ogni 𝑥 ∈ [𝑥0 − 𝑟, 𝑥0 + 𝑟] e per ogni 𝑛 ∈ ℕ si
abbia
𝑓 (𝑥)
(𝑛)
≤ 𝑀 · 𝐿𝑛 .
𝑛!
Allora 𝑓 è analitica in 𝐴.

Dimostrazione. Fissiamo 𝑥 0 ∈ 𝐴. Dobbiamo dimostrare che in un intorno di


𝑥0 è possibile scrivere 𝑓 come somma di una serie di potenze 𝑎 𝑘 (𝑥 − 𝑥0 ) 𝑘 .
P
Necessariamente, per il teorema 5.74, la serie di potenze dovrà essere la serie di
Taylor, cioè vogliamo dimostrare che esiste 𝜌 > 0 tale che se |𝑥 − 𝑥 0 | < 𝜌 si ha

𝑓 (𝑥0 )
+∞ (𝑘)
(𝑥 − 𝑥0 ) 𝑘 .
X
𝑓 (𝑥) =
𝑘=0
𝑘!

Grazie alla formula di Taylor con resto di Lagrange (teorema 5.59), noi sappiamo
che
𝑛
𝑓 (𝑘) (𝑥0 ) 𝑓 (𝑛+1)(𝑦)
(𝑥 − 𝑥0 ) 𝑘 + (𝑥 − 𝑥0 )𝑛+1 .
X
𝑓 (𝑥) =
𝑘=0
𝑘 ! (𝑛 + 1 )!

Dunque sarà sufficiente mostrare che fissato 𝑥 per 𝑛 → +∞ il resto tende a zero.
Ma infatti se |𝑥 − 𝑥 0 | ≤ 𝜌 si ha

𝑓 (𝑛+1) (𝑦)
(𝑥 − 𝑥0 )𝑛+1 ≤ 𝑀 · 𝐿𝑛+1 |𝑥 − 𝑥0 | 𝑛+1 = 𝑀(𝐿𝜌)𝑛+1 → 0

(𝑛 + 1)!

se scegliamo 𝜌 in modo che sia 𝜌 < 1/𝐿.


5.10 funzioni analitiche 225

Tabella 5.3: sviluppi in serie di Taylor,


+∞ 𝑘 di alcune funzioni elementari. Si veda il
𝑥
𝑒𝑥 =
X
teorema 5.78
𝑘=0
𝑘!
+∞
𝑥 2 𝑘+1
(−1) 𝑘
X
sin 𝑥 =
𝑘=0
(2 𝑘 + 1)!
+∞
𝑥 2𝑘
(−1) 𝑘
X
cos 𝑥 =
𝑘=0
(2 𝑘)!
+∞  
𝛼
(1 + 𝑥)𝛼 = 𝑥𝑘 ,
X
se |𝑥| < 1
𝑘=0
𝑘
+∞
𝑥𝑘
(−1) 𝑘−1
X
ln(1 + 𝑥) = , se 𝑥 ∈ (−1 , 1]
𝑘=1
𝑘
+∞
𝑥 2 𝑘+1
(−1) 𝑘
X
arctg 𝑥 = , se 𝑥 ∈ [−1 , 1]
𝑘=0
2𝑘 + 1
+∞
X (2 𝑘 − 1)!! 𝑥 2 𝑘+1
arcsin 𝑥 = , se 𝑥 ∈ [−1 , 1]
𝑘=0
(2 𝑘)!! 2 𝑘 + 1
𝜋
arccos 𝑥 = − arcsin 𝑥
2
.

Teorema 5.78 (analiticità di alcune funzioni elementari). Le funzioni 𝑒 𝑥 , sin 𝑥 ,


cos 𝑥 , ln 𝑥 sono funzioni analitiche. Le funzioni arcsin e arccos sono analitiche
sull’intervallo aperto (−1 , 1). Per ogni 𝛼 ∈ ℝ la funzione 𝑥 𝛼 è analitica sull’intervallo
(0 , +∞). Valgono inoltre le formule riportate in tabella 5.3.

Dimostrazione. Che 𝑒 𝑥 , sin 𝑥 e cos 𝑥 siano funzioni analitiche discende diretta-


mente dal fatto che tali funzioni sono state definite come somma di una serie di
potenze. Dunque, grazie al teorema 5.72 sono funzioni analitiche. In alternativa
si può applicare il teorema 5.77. Le funzioni sin e cos hanno derivata limitata,
quindi le ipotesi del teorema sono facilmente verificate. Ma anche la funzione
𝑒 𝑥 ha derivata limitata se ci restringiamo ad un qualunque intervallo limitato e
dunque anche in quel caso il teorema 5.77 si applica.

Per quanto riguarda la funzione 𝑓 (𝑥) = 𝑥 𝛼 scelto un punto qualunque 𝑥 0 > 0


possiamo utilizzare il teorema 5.76:
𝛼
𝑥 − 𝑥0

𝑥 𝛼 = (𝑥0 + 𝑥 − 𝑥0 )𝛼 = 𝑥0𝛼 1 +
𝑥0
+∞    𝑘 +∞
𝛼 𝑥 − 𝑥0 𝛼
 
= 𝑥0𝛼 𝑥0𝛼−𝑘 (𝑥 − 𝑥0 ) 𝑘
X X
=
𝑘=0
𝑘 𝑥0 𝑘=0
𝑘

e dunque anche 𝑥 𝛼 è sviluppabile in serie di potenze nell’intorno di un


qualunque punto 𝑥 0 > 0 ed è quindi una funzione analitica.
226 5 calcolo differenziale

Osserviamo ora che se 𝑓 è derivabile ed 𝑓 0 è analitica allora anche 𝑓 è analitica.


Infatti se
+∞
𝑎 𝑘 (𝑥 − 𝑥0 ) 𝑘
X
𝑓 0(𝑥) =
𝑘=0

su un certo intervallo 𝐼 allora la funzione


+∞
𝑎𝑘
𝑥 𝑘+1
X
𝑔(𝑥) = 𝑓 (𝑥0 ) + (5.14)
𝑘=0
𝑘+1

è anch’essa analitica su 𝐼 (in quanto definita da una serie di potenze) ma


chiaramente 𝑔(𝑥 0 ) = 𝑓 (𝑥 0 ) e 𝑔 0(𝑥) = 𝑓 0(𝑥) per ogni 𝑥 ∈ 𝐼 , dunque 𝑔 − 𝑓 è
costantemente uguale a 0 cioè 𝑓 (𝑥) = 𝑔(𝑥).

La precedente osservazione si applica alle funzioni ln 𝑥 , arctg 𝑥 , arcsin 𝑥 e


arccos 𝑥 in quanto la loro derivata è una funzione potenza e quindi è analitica
per quanto già visto:
 −1
𝐷 ln(1 + 𝑥) = (1 + 𝑥)−1 , 𝐷 arctg 𝑥 = 1 + 𝑥 2 ,
 1
2 −2
 1
2 −2
𝐷 arcsin 𝑥 = 1 + 𝑥 , 𝐷 arccos 𝑥 = − 1 + 𝑥 .

Si trovano quindi gli sviluppi in serie riportati nella tabella 5.3 validi all’interno
del raggio di convergenza di queste serie ovvero per 𝑥 ∈ (−1 , 1).

Ci ricordiamo però il teorema 3.44 (lemma di Abel) il quale garantisce che se


abbiamo una serie di potenze il cui raggio di convergenza è 𝑅 e se la serie è
convergente nel punto 𝑥 con 𝑥 = ±𝑅 allora la somma della serie risulta essere
una funzione continua fino al punto 𝑥 . Ad esempio la somma della serie di
Taylor della funzione ln(1 + 𝑥) è continua nel punto 𝑥 = 1 in quanto in tale punto
è convergente (si tratta infatti della serie armonica a segni alterni, convergente
per il criterio di Leibniz). Dunque si ha
+∞
(−1) 𝑘−1 +∞
𝑥𝑘
(−1) 𝑘−1
X X
= lim− = lim− ln(1 + 𝑥) = ln 2 (5.15)
𝑘=1
𝑘 𝑥→1
𝑘=1
𝑘 𝑥→1

e lo sviluppo in serie del logaritmo ln(1 + 𝑥) è valido su tutto l’intervallo


semiaperto (−1 , 1].

Lo stesso vale per le funzioni arctg 𝑥 , arcsin 𝑥 e arccos 𝑥 le cui serie sono
convergenti su tutto l’intervallo chiuso [−1 , 1].

Naturalmente i coefficienti delle serie di Taylor che abbiamo trovato ora coin-
cidono con i coefficienti dei polinomi di Taylor che avevamo già trovato nella
tabella 5.2 a pagina 213 in quanto troncando la serie di Taylor otteniamo un
polinomio che soddisfa la formula di Taylor (5.7) e quindi è proprio il polinomio
di Taylor.

Newton-Mercator Il teorema precedente ci permette di scrivere delle identità notevoli. Ponendo


𝑥 = 1 nella serie che definisce il logaritmo abbiamo già osservato che si ottiene
la somma della serie armonica a segni alterni di Newton-Mercator:
5.10 funzioni analitiche 227

1 1 1 1 1
ln 2 = 1 − + − + − +... (5.16)
2 3 4 5 6
Ponendo 𝑥 = 1 nella serie di Taylor dell’arcotangente otteniamo la formula di
Gregory-Leibniz Gregory-Leibniz
𝜋 1 1 1 1 1
=1− + − + − +...
4 3 5 7 9 10

Anche lo sviluppo in serie dell’arcoseno determina una formula utile per


calcolare le cifre decimali di 𝜋. Per avere una convergenza più rapida conviene
prendere 𝑥 più possibile vicino a zero, nel seguente esercizio prendiamo 𝑥 = 21
per trovare la ben nota approssimazione 𝜋 ≈ 3.14.

Esercizio 5.79 (calcolo cifre di 𝜋). Grazie allo sviluppo di Taylor della funzione
arcsin sappiamo che
+∞
𝜋 1 X (2 𝑘 − 1)!! 1
= arcsin =
6 2 𝑘=0
(2 𝑘)!! (2 𝑘 + 1) · 22 𝑘+1

dunque
𝑛
X (2 𝑘 − 1)!! 1
𝜋=3 + 𝜀𝑛+1
𝑘=0
(2 𝑘)!! (2 𝑘 + 1) · 4 𝑘
dove
+∞ +∞
X (2 𝑘 − 1)!! 1 X 1
𝜀𝑛 = 3 ≤ 3
𝑘=𝑛
(2 𝑘)!! ( 2 𝑘 + 1) · 4 𝑘
𝑘=𝑛 (2 𝑘 + 1) · 4
𝑘

+∞
3 X 1 3 1 4
≤ 𝑛
= 𝑛
· = .
(2𝑛 + 1) · 4 𝑘=0 4 𝑘 (2𝑛 + 1) · 4 1 − 1
4
(2𝑛 + 1) · 4𝑛

Per 𝑛 = 3 si ottiene dunque

3 3·3 3·5·3
𝜋=3+ + + + 𝜀4
2 · 3 · 4 4 · 2 · 5 · 42 6 · 4 · 2 · 7 · 43
1 9 45
=3+ + + + 𝜀4
8 640 21504
con
1
0 < 𝜀4 < < 0.0018
9 · 43
da cui
3.141 < 𝜋 < 3.143

Usando questo metodo con un calcolatore possiamo trovare rapidamente molte cifre
esatte, come riportato nella tabella 5.4.

Teorema 5.80 (principio di identità delle funzioni analitiche). Se 𝑓 e 𝑔 sono due


funzioni analitiche definite su uno stesso intervallo aperto 𝐼 ⊆ ℝ allora risultano fatti
equivalenti:

1. 𝑓 (𝑥) = 𝑔(𝑥) per ogni 𝑥 ∈ 𝐼 ,


2. esiste 𝑥 0 ∈ 𝐼 tale che per ogni 𝑘 ∈ ℕ si ha 𝑓 (𝑘) (𝑥 0 ) = 𝑔 (𝑘) (𝑥 0 ),
228 5 calcolo differenziale

Tabella 5.4: Le prime 1000 cifre decimali 3.1415926535 8979323846 2643383279 5028841971 6939937510
del numero 𝜋 calcolate con il metodo
5820974944 5923078164 0628620899 8628034825 3421170679
utilizzato nell’esercizio 5.79. Si veda il
codice a pagina 426. 8214808651 3282306647 0938446095 5058223172 5359408128
4811174502 8410270193 8521105559 6446229489 5493038196
4428810975 6659334461 2847564823 3786783165 2712019091
4564856692 3460348610 4543266482 1339360726 0249141273
7245870066 0631558817 4881520920 9628292540 9171536436
7892590360 0113305305 4882046652 1384146951 9415116094
3305727036 5759591953 0921861173 8193261179 3105118548
0744623799 6274956735 1885752724 8912279381 8301194912
9833673362 4406566430 8602139494 6395224737 1907021798
6094370277 0539217176 2931767523 8467481846 7669405132
0005681271 4526356082 7785771342 7577896091 7363717872
1468440901 2249534301 4654958537 1050792279 6892589235
4201995611 2129021960 8640344181 5981362977 4771309960
5187072113 4999999837 2978049951 0597317328 1609631859
5024459455 3469083026 4252230825 3344685035 2619311881
7101000313 7838752886 5875332083 8142061717 7669147303
5982534904 2875546873 1159562863 8823537875 9375195778
1857780532 1712268066 1300192787 6611195909 2164201989

3. esiste 𝑥 0 ∈ 𝐼 e 𝜌 > 0 tale che per ogni 𝑥 ∈ 𝐼 con |𝑥 − 𝑥 0 | < 𝜌 si ha 𝑓 (𝑥) = 𝑔(𝑥).

Dimostrazione. Se 𝑓 = 𝑔 allora chiaramente le derivate di 𝑓 e 𝑔 coincidono in


tutti i punti, quindi 1 =⇒ 2.

Se 𝑓 e 𝑔 sono analitiche e 𝑥 0 ∈ 𝐼 esiste un intorno del punto 𝑥 0 in cui entrambe


le funzioni possono essere scritte come somma della serie di Taylor. Ma se 𝑓 e 𝑔
hanno le stesse derivate nel punto 𝑥 0 le loro serie di Taylor coincidono e dunque
le funzioni coincidono all’interno del raggio di convergenza. Dunque 2 =⇒ 3.

Ci rimane da dimostrare che 3 =⇒ 1. Per ipotesi sappiamo che esiste 𝑥 0 ∈ 𝐼


tale che 𝑓 (𝑥) = 𝑔(𝑥) in un intorno di 𝑥 0 . Supponiamo per assurdo che esista
almeno un punto 𝑥 ∈ 𝐼 in cui 𝑓 (𝑥) ≠ 𝑔(𝑥). Senza perdita di generalità possiamo
supporre che sia 𝑥 > 𝑥 0 e possiamo prendere l’estremo inferiore di tali punti:

𝑥1 = inf {𝑥 ∈ 𝐼 : 𝑥 > 𝑥0 , 𝑓 (𝑥) ≠ 𝑔(𝑥)}.

Sappiamo che 𝑥 1 > 𝑥 0 perché in un intorno di 𝑥 0 le due funzioni coincidono


per ipotesi. Per definizione di 𝑥 1 sappiamo anche che 𝑓 (𝑥) = 𝑔(𝑥) per ogni
𝑥 ∈ [𝑥0 , 𝑥1 ) e quindi, facendo le derivate, possiamo affermare che 𝑓 (𝑘) (𝑥) =
𝑔 (𝑘) (𝑥) per ogni 𝑘 ∈ ℕ e per ogni 𝑥 ∈ [𝑥0 , 𝑥1 ). Visto che 𝑓 e 𝑔 sono di classe
𝐶 ∞ possiamo concludere, per continuità, che anche 𝑓 (𝑘) (𝑥1 ) = 𝑔 (𝑘) (𝑥 1 ) per ogni
𝑘 ∈ ℕ . Dunque le due funzioni hanno le stesse derivate nel punto 𝑥1 . Essendo 𝑓
e 𝑔 funzioni analitiche sappiamo che c’è un intorno del punto 𝑥 1 in cui entrambe
le funzioni coincidono con la somma della propria serie di Taylor. Ma avendo
le stesse derivate in 𝑥 1 le due funzioni hanno anche la stessa serie di Taylor
e quindi coincidono in un intorno di 𝑥 1 . Questo è assurdo perché per come
abbiamo definito 𝑥 1 ci devono essere dei punti arbitrariamente vicini a 𝑥 1 in cui
𝑓 (𝑥) ≠ 𝑔(𝑥).
5.11 derivata complessa 229

5.11 derivata complessa

Se abbiamo una funzione 𝑓 : 𝐴 ⊆ ℂ → ℂ possiamo definire la derivata


(complessa) esattamente come abbiamo fatto per la derivata reale:

𝑓 (𝑥 + ℎ) − 𝑓 (𝑥)
𝑓 0(𝑥) = lim
ℎ→0 ℎ

(se il limite esiste finito). Si osservi che in questo caso ℎ ∈ ℂ, il rapporto


incrementale è una divisione complessa e il limite è un limite complesso.

Ad esempio la funzione 𝑓 (𝑧) = 𝑧 è derivabile in senso complesso e la sua


derivata è 𝑓 0(𝑧) = 1 in quanto

𝑧+ℎ−𝑧 ℎ
lim = lim = 1.
ℎ→0 ℎ ℎ→0 ℎ

Le dimostrazioni che riguardano la derivata della somma e la derivata del


prodotto si ripetono formalmente identiche a come le abbiamo fatte per la
derivata reale. Potremo quindi affermare che se 𝑓 e 𝑔 sono derivabili in senso
complesso in un punto 𝑧 0 ∈ ℂ risulta

( 𝑓 + 𝑔)0(𝑧 0 ) = 𝑓 0(𝑧0 ) + 𝑔 0(𝑧0 ),


( 𝑓 · 𝑔)0(𝑧 0 ) = 𝑓 0(𝑧0 ) · 𝑔(𝑧0 ) + 𝑓 (𝑧 0 ) · 𝑔 0(𝑧0 ).

Dunque si avrà, se 𝑛 ∈ ℕ \ {0},

(𝑧 𝑛 )0 = 𝑛𝑧 𝑛−1 .

Ovviamente la derivata di una costante è nulla. La formula per la derivata della


funzione composta è anch’essa valida e si dimostra ripetendo formalmente la
stessa dimostrazione che abbiamo già visto:

( 𝑓 (𝑔(𝑧)))0 = 𝑓 0(𝑔(𝑧)) · 𝑔 0(𝑧).

Anche la formula per la derivata del reciproco si ottiene con la stessa dimostra-
zione che abbiamo già visto nel caso reale:
 0
1 1
=−
𝑧 𝑧2

e di conseguenza vale la formula per la derivata del rapporto

𝑓 (𝑧) 𝑓 0(𝑧)𝑔(𝑧) − 𝑓 (𝑧)𝑔 0(𝑧)


 
= .
𝑔(𝑧) 𝑔 2 (𝑧)

Abbiamo quindi che ogni funzione polinomiale a coefficienti in ℂ è derivabile


in senso complesso. E lo stesso vale per le funzioni razionali ovvero i rapporti
di polinomi.
230 5 calcolo differenziale

La funzione esponenziale è un’altro esempio importantissimo di funzione


complessa derivabile in quanto risulta

𝑒 𝑧+ℎ − 𝑒 𝑧 𝑒ℎ − 1
lim = lim 𝑒 𝑧 = 𝑒𝑧
ℎ→0 ℎ ℎ→0 ℎ

in virtù del noto limite notevole di cui gode la funzione esponenziale (teore-
ma 3.45). Più in generale è facile verificare che tutte le funzioni analitiche sono
derivabili in senso complesso.
Un risultato sorprendente dell’analisi complessa ci dice che è vero anche il
viceversa: ogni funzione derivabile in senso complesso in tutti i punti del suo
dominio risulta essere analitica (e in particolare di classe 𝐶 ∞ ).
In effetti la derivabilità in senso complesso è una proprietà molto forte. Ad
esempio la funzione 𝑓 (𝑧) = 𝑧¯ non risulta essere derivabile in senso complesso
in quanto
𝑧+ℎ−𝑧 ℎ̄
=
ℎ ℎ
e per ℎ → 0 il limite non esiste in quanto se ℎ è reale tale rapporto vale sempre
1 ma se ℎ è immaginario puro tale rapporto vale sempre −1.
calcolo integrale 6
6.1 misura di Peano-Jordan

In questo capitolo vogliamo dare una definizione di misura di un sottoinsieme


𝐸 ⊆ ℝ𝑛 formalizzando le stesse nozioni che sostanzialmente venivano già usate
dagli antichi greci. Lo faremo nel caso per noi più rilevante ovvero il caso planare
𝑛 = 2 in cui la misura di un insieme si chiama area. Ma l’intera costruzione
potrebbe essere fatta senza nessuna difficoltà (se non per le notazioni che si
complicano) nel caso generale della dimensione 𝑛 .
Dato un insieme 𝐸 ⊆ ℝ2 vorremmo definire la sua area 𝑚(𝐸) ∈ ℝ in modo che
valgano le seguenti proprietà:
1. se 𝐸 ∩ 𝐹 = ∅ allora 𝑚(𝐸 ∪ 𝐹) = 𝑚(𝐸) + 𝑚(𝐹) (additività);
2. se 𝐸 ⊆ 𝐹 allora 𝑚(𝐸) ≤ 𝑚(𝐹) (monotonia);
3. se 𝐸 = [𝑥 1 , 𝑥 2 ] × [𝑦1 , 𝑦2 ] allora 𝑚(𝐸) = |𝑥 2 − 𝑥 1 | · |𝑦2 − 𝑦1 | (normalizza-
zione).
Andremo a definire la misura 𝑚 su una famiglia di sottoinsiemi di ℝ2 che
chiameremo misurabili secondo Peano-Jordan. Si potrebbe dimostrare che non
è possibile definire 𝑚 su tutti i sottoinsiemi di ℝ2 in modo che valgano le
proprietà enunciate qui sopra. Sarebbe però possibile definire la misura su una
classe molto più amplia di insiemi di quelli che andremo a considerare noi,
imponendo l’additività non solo su unioni finite ma anche su unioni numerabili
( 𝜎 additività). Quello che si otterrebbe è la cosiddetta misura di Lebesgue che è
ormai una costruzione standard dell’analisi matematica ma richiederebbe una
teoria molto più complessa da sviluppare. Ci accontenteremo qui di introdurre
la misura 𝑚 finitamente additiva di Peano-Jordan che poi ci permetterà di dare
significato geometrico all’integrale di Riemann.
Diremo che un insieme 𝑅 ⊆ ℝ2 è un rettangolo se 𝑅 è il prodotto cartesiano di rettangolo
due intervalli limitati cioè
𝑅=𝐼×𝐽
con 𝑥 1 = inf 𝐼 > −∞, 𝑥 2 = sup 𝐼 < +∞, 𝑦1 = inf 𝐽 > −∞, 𝑦2 = sup 𝐽 < +∞.
Se 𝐼 = [𝑥 1 , 𝑥 2 ] e 𝐽 = [𝑦1 , 𝑦2 ] allora, affinché valga la proprietà di normalizzazione,
dovremo porre:

𝑚([𝑥1 , 𝑥2 ] × [𝑦1 , 𝑦2 ]) = |𝑥2 − 𝑥1 | · |𝑦2 − 𝑦1 |.

Se 𝐼 = (𝑥 1 , 𝑥 2 ) e 𝐽 = (𝑦1 , 𝑦2 ) sono intervalli aperti (e limitati) allora per ogni


𝜀 > 0 con 𝜀 < (𝑥2 − 𝑥 1 )/2 e 𝜀 < (𝑦2 − 𝑦1 )/2 si ha

[𝑥1 + 𝜀, 𝑥2 − 𝜀] × [𝑦1 + 𝜀, 𝑦2 − 𝜀] ⊆ (𝑥1 , 𝑥2 ) × (𝑦1 , 𝑦2 ) ⊆ [𝑥1 , 𝑥2 ] × [𝑦1 , 𝑦2 ]

da cui, affinché valga la proprietà di monotonia, si dovrà avere:

(𝑥2 − 𝑥1 − 2 𝜀) · (𝑦2 − 𝑦1 − 2 𝜀) ≤ 𝑚((𝑥1 , 𝑥2 ) × (𝑦1 , 𝑦2 )) ≤ |𝑥2 − 𝑥1 | · |𝑦2 − 𝑦1 |.


232 6 calcolo integrale

Figura 6.1: Lo stesso polirettangolo si


può ottenere come due diverse unioni di
rettangoli: (a), (b). Prendendo in consi-
derazione tutte le rette che contengono i
lati di tutti i rettangoli coinvolti si ottiene
una suddivisione (c) per cui ogni rettan-
golo in (a) o in (b) è unione di rettangoli
(a) (b) (c)
in (c).

Ma affinché questo sia vero per ogni 𝜀 > 0 si dovrà necessariamente porre:

𝑚((𝑥1 , 𝑥2 ) × (𝑦1 , 𝑦2 )) = |𝑥 2 − 𝑥1 | · |𝑦2 − 𝑦1 |.

Lo stesso vale se gli intervalli sono semiaperti o comunque se consideriamo


qualunque insieme 𝐸 tale che (𝑥 1 , 𝑥 2 )×(𝑦1 , 𝑦2 ) ⊆ 𝐸 ⊆ [𝑥 1 , 𝑥 2 ]×[𝑦1 , 𝑦2 ]. Dunque
l’area di un rettangolo non cambia se aggiungiamo o togliamo punti dai suoi
lati.

Se un insieme 𝐸 ⊆ ℝ2 può essere scritto come unione finita di rettangoli


disgiunti:
𝐸 = 𝑅1 ∪ 𝑅2 ∪ · · · ∪ 𝑅 𝑁 𝑅 𝑖 ∩ 𝑅 𝑗 = ∅ se 𝑖 ≠ 𝑗

polirettangolo cartesiano diremo che 𝐸 è un polirettangolo cartesiano. In tal caso per garantire l’additività
dell’area porremo:
𝑚(𝐸) = 𝑚(𝑅 1 ) + · · · + 𝑚(𝑅 𝑁 ).
Affinché questa sia una buona definizione dobbiamo verificare che se 𝐴 può
essere scritto come unione di rettangoli disgiunti in due modi diversi, allora
la somma delle misure dei rettangoli dà lo stesso risultato con entrambe le
decomposizioni. Questo è intuitivamente ovvio, e dipende dal fatto che date
due diverse decomposizioni in rettangoli è possibile considerare una griglia
formata da tutte le rette che contengono i lati di ogni rettangolo. Questa griglia
identifica una decomposizione in rettangolini che possono essere utilizzati
per ricostruire sia l’una che l’altra decomposizione. Ogni rettangolo delle due
decomposizioni sarà unione di rettangolini e la sua area sarà la somma delle aree
dei rettangolini. Ma visto che le due decomposizioni si suddividono negli stessi
rettangolini, le aree definite dalle due decomposizioni devono coincidere.

Per lo stesso motivo risulta chiaro che se 𝐸 e 𝐹 sono due polirettangoli anche
𝐸 ∪ 𝐹 , 𝐸 ∩ 𝐹 , 𝐸 \ 𝐹 e 𝐹 \ 𝐸 sono polirettangoli e risulta

𝑚(𝐸 ∪ 𝐹) = 𝑚(𝐸 \ 𝐹) + 𝑚(𝐸 ∩ 𝐹) + 𝑚(𝐹 \ 𝐸). (6.1)

Infatti è possibile trovare una famiglia di rettangolini (quelli identificati dalla


griglia di tutte le rette contenenti i lati dei rettangoli di 𝐸 e dei rettangoli di 𝐹 )
che sono tra loro disgiunti e tali che 𝐸 ∩ 𝐹 , 𝐸 \ 𝐹 e 𝐹 \ 𝐸 possono essere scritti
come unione di questi rettangolini. Questi insiemi sono tra loro disgiunti e
quindi, scrivendo l’area di ognuno come la somma delle aree dei rettangoli, si
trova (6.1).

Se ora prendiamo un insieme 𝐸 ⊆ ℝ2 qualunque e imponiamo che valga la


proprietà di monotonia, dovremo avere che 𝑚(𝐸), se è definibile, deve essere
l’elemento di separazione tra le misure dei polirettangoli contenuti in 𝐸 e di
quelli contenenti 𝐸 . Si giustifica quindi la seguente.
Peano-Jordan
6.1 misura di Peano-Jordan 233

𝐸 𝐹
Figura 6.2: Gli insiemi 𝐸 ed 𝐹 e i poli-
rettangoli approssimanti dall’interno e
dall’esterno. Le approssimanti possono
essere scelte in modo che la cornice tra
i polirettangoli esterni ed interni abbia
area minore di un qualunque 𝜀 > 0.

Definizione 6.1 (misura di Peano-Jordan). Sia 𝐸 ⊆ ℝ2 un insieme limitato.


Definiamo:

𝑚 ∗ (𝐸) = inf {𝑚(𝐹) : 𝐹 ⊇ 𝐸, 𝐹 polirettangolo},


𝑚∗ (𝐸) = sup {𝑚(𝐹) : 𝐹 ⊆ 𝐸, 𝐹 polirettangolo}.

Visto che 𝐸 è limitato (dunque è contenuto in un rettangolo limitato) si ha 𝑚 ∗ (𝐸) < +∞


e visto che ∅ ⊆ 𝐸 e 𝑚(∅) = 0 (l’insieme vuoto ∅ = (𝑎, 𝑎) × (𝑐, 𝑐) è un polirettangolo
di area nulla) si ha 𝑚∗ (𝐸) ≥ 0. Inoltre 𝑚∗ (𝐸) ≤ 𝑚 ∗ (𝐸) in quanto ogni polirettangolo
contenuto in 𝐸 è contenuto, e quindi ha area non superiore, ad ogni polirettangolo
contenente 𝐸 .

Se 𝑚 ∗ (𝐸) = 𝑚∗ (𝐸) diciamo che 𝐸 è misurabile secondo Peano-Jordan e poniamo misurabile

𝑚(𝐸) = 𝑚 ∗ (𝐸) = 𝑚∗ (𝐸) la sua misura di Peano-Jordan.

Teorema 6.2 (proprietà della misura di Peano-Jordan). Se 𝐸 e 𝐹 sono Peano-Jordan


misurabili allora anche 𝐸 ∪ 𝐹 , 𝐸 \ 𝐹 , 𝐹 \ 𝐸 , 𝐸 ∩ 𝐹 sono Peano-Jordan misurabili e
risulta

𝑚(𝐸 ∪ 𝐹) = 𝑚(𝐸 \ 𝐹) + 𝑚(𝐸 ∩ 𝐹) + 𝑚(𝐹 \ 𝐸)


= 𝑚(𝐸) + 𝑚(𝐹) − 𝑚(𝐸 ∩ 𝐹).

Dimostrazione. Osserviamo che un insieme 𝐸 è misurabile se e solo se per ogni


𝜀 > 0 esistono dei polirettangoli 𝐸∗ , 𝐸∗ con 𝐸∗ ⊆ 𝐸 ⊆ 𝐸∗ tali che 𝑚(𝐸∗ ) − 𝑚(𝐸∗ ) <
𝜀 (basta utilizzare la caratterizzazione di estremo superiore e inferiore).

Dunque nelle nostre ipotesi per ogni 𝜀 > 0 esistono dei polirettangoli 𝐸 ∗ , 𝐸∗ , 𝐹 ∗ ,
𝐹∗ tali che
𝐸∗ ⊆ 𝐸 ⊆ 𝐸 ∗ , 𝐹∗ ⊆ 𝐹 ⊆ 𝐹 ∗
con
𝑚(𝐸∗ ) − 𝑚(𝐸∗ ) < 𝜀, 𝑚(𝐹 ∗ ) − 𝑚(𝐹∗ ) < 𝜀.
Possiamo allora approssimare gli insiemi 𝐸 ∩ 𝐹 , 𝐸 ∪ 𝐹 e 𝐸 \ 𝐹 dall’interno e
dall’esterno con polirettangoli:

𝐸∗ ∩ 𝐹∗ ⊆ 𝐸 ∩ 𝐹 ⊆ 𝐸∗ ∩ 𝐹 ∗ ,
𝐸∗ ∪ 𝐹∗ ⊆ 𝐸 ∪ 𝐹 ⊆ 𝐸∗ ∪ 𝐹 ∗ ,
𝐸∗ \ 𝐹 ∗ ⊆ 𝐸 \ 𝐹 ⊆ 𝐸∗ \ 𝐹∗ .
234 6 calcolo integrale

Le differenze tra gli approssimanti esterni e gli approssimanti interni è sempre


contenuta nell’unione delle cornici Δ = (𝐸 ∗ \ 𝐸∗ ) ∪ (𝐹 ∗ \ 𝐹∗ ) (si faccia riferimento
alla figura 6.2):

(𝐸∗ ∩ 𝐹 ∗ ) \ (𝐸∗ ∩ 𝐹∗ ) ⊆ Δ
(𝐸∗ ∪ 𝐹 ∗ ) \ (𝐸∗ ∪ 𝐹∗ ) ⊆ Δ
(𝐸∗ \ 𝐹∗ ) \ (𝐸∗ \ 𝐹 ∗ ) ⊆ Δ

e dunque essendo 𝑚(Δ) < 2 𝜀 ed essendo 𝜀 > 0 arbitrario possiamo concludere


che gli insiemi 𝐸 ∩ 𝐹 , 𝐸 ∪ 𝐹 ed 𝐸 \ 𝐹 sono misurabili. Con le stesse considerazioni
si può facilmente verificare che l’unione dei polirettangoli disgiunti 𝐸∗ \ 𝐹 ∗ e
𝐸∗ ∩ 𝐹∗ differisce dal polirettangolo 𝐸∗ per un insieme di misura minore di 𝜀 e
dunque, passando al limite per 𝜀 → 0 si ottiene:

𝑚(𝐸 \ 𝐹) + 𝑚(𝐸 ∩ 𝐹) = 𝑚(𝐸).

Invertendo i ruoli di 𝐸 ed 𝐹 si ottiene che anche 𝐹 \ 𝐸 è misurabile e vale la


relazione analoga. Con considerazioni del tutto simili si ottiene

𝑚(𝐸 ∪ 𝐹) = 𝑚(𝐸) + 𝑚(𝐹 \ 𝐸).

Di conseguenza si ottengono le uguaglianze enunciate nel teorema.

Teorema 6.3 (elemento d’area di una trasformazione lineare). Sia 𝐸 ⊆ ℝ2 e sia


𝐿 : ℝ2 → ℝ2 una trasformazione lineare affine:

𝑥 𝑥
   
𝐿(𝑥, 𝑦) = 𝑀 · + 0
𝑦 𝑦0

con 𝑀 matrice 2 × 2 e (𝑥 0 , 𝑦0 ) ∈ ℝ2 . Allora se 𝐸 è misurabile secondo Peano-Jordan


anche 𝐿(𝐸) lo è. E in tal caso si ha

𝑚(𝐿(𝐸)) = | det 𝑀 | · 𝑚(𝐸). (6.2)

Dimostrazione. Osserviamo innanzitutto che è sufficiente verificare quello che


succede nel caso in cui 𝐸 sia un rettangolo. Infatti un generico insieme misurabile
𝐸 può essere approssimato, per ogni 𝜀 > 0 con polirettangoli 𝐸± con 𝐸− ⊆ 𝐸 ⊆
𝐸+ e 𝑚(𝐸+ ) − 𝑚(𝐸− ) < 𝜀. Supponiamo che 𝑅 +𝑘 , 𝑘 = 1, . . . , 𝑁 siano i rettangoli
che compongono 𝐸 + e 𝑅 −𝑘 , 𝑘 = 1 , . . . , 𝑀 siano i rettangoli che compongono 𝐸 − .
Se sappiamo che la trasformazione 𝐿 manda rettangoli in insiemi misurabili
e se sappiamo che sui rettangoli vale 𝑚(𝐿(𝑅 ±𝑘 )) = 𝑐 · 𝑚(𝑅 ±𝑘 ) (per una qualche
costante 𝑐 ≥ 0) allora si deduce che 𝐿(𝑅 +𝑘 ) può essere approssimato dall’esterno
con un polirettangolo 𝐹 𝑘+ in modo che risulti 𝑚(𝐹 𝑘+ ) − 𝑚(𝐿(𝑅 +𝑘 )) < 𝜀/𝑁 mentre
𝐿(𝑅 −𝑘 ) può essere approssimato dall’interno con un polirettangolo 𝐹 𝑘− in modo
che si abbia 𝑚(𝐿(𝑅 −𝑘 )) − 𝑚(𝐹 𝑘− ) < 𝜀/𝑀 . Facendo l’unione 𝐹 + = 𝐹1+ ∪ · · · ∪ 𝐹𝑁
+
e
𝐹 = 𝐹1 ∪ · · · ∪ 𝐹𝑀 si ottengono dei polirettangoli tali che 𝐹 ⊆ 𝐿(𝐸) ⊆ 𝐹 e
− − − − +

𝑚(𝐹 + ) − 𝑚(𝐹 − ) < (𝑐 · 𝑚(𝐸+ ) + 𝜀) − (𝑐 · 𝑚(𝐸− ) − 𝜀) < (𝑐 + 1)𝜀. Essendo 𝜀 > 0


arbitrario si deduce che 𝐹 = 𝐿(𝐸) è misurabile e 𝑚(𝐿(𝐸)) = 𝑐 · 𝑚(𝐸).

Passo 1. Supponiamo che sia 𝐿(𝑥, 𝑦) = (𝜆𝑥, 𝜇𝑦) (una trasformazione lineare
diagonale). Se 𝐸 è un rettangolo 𝐸 = [𝑥 1 , 𝑥 2 ] × [𝑦1 , 𝑦2 ] allora se 𝜆 ≥ 0, 𝜇 ≥ 0
6.1 misura di Peano-Jordan 235

allora 𝐿(𝐸) = [𝜆𝑥 1 , 𝜆𝑥 2 ] × [𝜇𝑦1 , 𝜇𝑦2 ] e chiaramente 𝑚(𝐿(𝐸)) = 𝜆(𝑥 2 − 𝑥 1 )𝜇(𝑦2 −


𝑦1 ) = 𝜆𝜇𝑚(𝐸). Visto che det 𝐿 = 𝜆𝜇 abbiamo ottenuto il risultato voluto. Se 𝜆
o 𝜇 hanno segno negativo gli estremi degli intervalli si possono scambiare e in
tal caso si ottiene 𝑚(𝐿(𝐸)) = |𝜆||𝑥 2 − 𝑥 1 | · |𝜇| · |𝑦2 − 𝑦1 | e quindi, come voluto,
𝑚(𝐿(𝐸)) = | det 𝐿| · 𝑚(𝐸).

Una eventuale componente di traslazione (𝑥 0 , 𝑦0 ) non ha nessuna rilevanza e


non la considereremo mai nel seguito in quanto i rettangoli traslati mantengono
la stessa misura.

Passo 2. Supponiamo che sia 𝐿(𝑥, 𝑦) = (𝑦, 𝑥) (la riflessione rispetto


 alla
 retta
0 1
𝑦 = 𝑥 ). Questa trasformazione ha matrice associata 𝑀 = che ha
1 0
determinante −1. Analiticamente scambia tra loro le coordinate 𝑥 ed 𝑦 . E’
quindi immediato verificare che i rettangoli vengono mandati in rettangoli con
base e altezza scambiata e dunque la misura di Peano-Jordan (e la misurabilità)
rimangono invariate. Dunque il teorema è banalmente valido in questo caso.

Passo 3. Supponiamo che sia 𝐸 = [𝑎, 𝑏] × [𝑐, 𝑑] e 𝐿(𝑥, 𝑞) = (𝑥, 𝑚𝑥 + 𝑞) con


𝑚 ∈ ℝ fissato (stiamo utilizzando le coordinate (𝑥, 𝑞) nel dominio di 𝐿 e le
coordianate (𝑥, 𝑦) nel codominio). Allora

𝐿(𝐸) = {(𝑥, 𝑦) ∈ ℝ2 : 𝑥 ∈ [𝑎, 𝑏], 𝑚𝑥 + 𝑐 ≤ 𝑦 ≤ 𝑚𝑥 + 𝑑}

è un parallelogramma. Supponiamo per fissare le idee che sia 𝑚 ≥ 0. Per ogni


𝑛 ∈ ℕ posso affettare l’insieme 𝐿(𝐸) con le rette verticali 𝑥 𝑘 = 𝑎 + 𝑛𝑘 (𝑏 − 𝑎) e
posso identificare i rettangoli, per 𝑘 = 1 , . . . , 𝑛 :

𝑅 −𝑘,𝑛 = {(𝑥, 𝑦) ∈ ℝ2 : 𝑥 ∈ [𝑥 𝑘−1 , 𝑥 𝑘 ), 𝑦 ∈ [𝑚𝑥 𝑘 + 𝑐, 𝑚𝑥 𝑘−1 + 𝑑]},


𝑅 +𝑘,𝑛 = {(𝑥, 𝑦) ∈ ℝ2 : 𝑥 ∈ [𝑥 𝑘−1 , 𝑥 𝑘 ), 𝑦 ∈ [𝑚𝑥 𝑘−1 + 𝑐, 𝑚𝑥 𝑘 + 𝑑]}.

e i polirettangoli ottenuti mettendo insieme questi rettangoli:

𝑃𝑛− = 𝑅 −1,𝑛 ∪ 𝑅 −2,𝑛 ∪ · · · ∪ 𝑅 −𝑛,𝑛 ,


𝑃𝑛+ = 𝑅 +1,𝑛 ∪ 𝑅 +2,𝑛 ∪ · · · ∪ 𝑅 +𝑛,𝑛 .

Per come li abbiamo costruiti si osserva che

𝑃𝑛− ⊆ 𝐿(𝐴) ⊆ 𝑃𝑛+ .

Ma è facile calcolare le misure di questi polirettangoli:


𝑛
X 𝑛
X
𝑚(𝑃𝑛− ) = 𝑚(𝑅 −𝑘,𝑛 ) = (𝑥 𝑘 − 𝑥 𝑘−1 ) · (𝑑 − 𝑐 − 𝑚(𝑥 𝑘 − 𝑥 𝑘−1 ))
𝑘=1 𝑘=1
𝑛
X 𝑏−𝑎  𝑚  𝑚
= · 𝑑−𝑐− = (𝑏 − 𝑎) · 𝑑 − 𝑐 −
𝑘=1
𝑛 𝑛 𝑛
𝑛
X  𝑚
𝑚(𝑃 + ) = 𝑚(𝑅 +𝑘,𝑛 ) = · · · = (𝑏 − 𝑎) · 𝑑 − 𝑐 +
𝑘=1
𝑛
236 6 calcolo integrale

ma visto che per 𝑛 → +∞ si ha 𝑚(𝑃𝑛− ) → (𝑏 −𝑎)·(𝑑−𝑐) e 𝑚(𝑃𝑛+ ) → (𝑏 −𝑎)·(𝑑−𝑐)


e visto che si ha

𝑚(𝑃𝑛− ) ≤ 𝑚∗ (𝐿(𝐴)) ≤ 𝑚 ∗ (𝐿(𝐸)) ≤ 𝑚(𝑃𝑛+ )

otteniamo che 𝐿(𝐸) è misurabile


  e 𝑚(𝐿(𝐸)) = (𝑏 − 𝑎) · (𝑑 − 𝑐) = 𝑚(𝐸). La matrice
1 0
associata ad 𝐿 è 𝑀 = e dunque det 𝑀 = 1. Abbiamo quindi trovato il
𝑚 1
risultato voluto.

Passo 4. Sia 𝐿 una qualunque applicazione lineare che si ottiene come composi-
zione delle applicazioni considerate in precedenza: 𝐿 = 𝐿𝑛 ◦ · · · ◦ 𝐿2 ◦ 𝐿1 . Allora
per quanto già visto sappiamo che se 𝐸 è un qualunque insieme Peano-Jordan
misurabile risulta

𝐿(𝐸) = 𝐿𝑛 (. . . (𝐿2 (𝐿1 (𝐸))) . . . ) = | det 𝐿𝑛 | · · · | det 𝐿2 | · | det 𝐿1 | · 𝑚(𝐸)

e dunque anche 𝐿(𝐸) è Peano-Jordan misurabile e visto che

| det 𝐿| = | det 𝐿𝑛 | · · · | det 𝐿1 |

la formula (6.2) è verificata.

Passo 5. Per concludere la dimostrazione è dunque sufficiente verificare che ogni


trasformazione lineare si può scrivere come composizione delle trasformazioni
già considerate. In generale il teorema può essere formulato in dimensione
qualunque (in ℝ𝑛 invece che ℝ2 ) e la dimostrazione procede esattamente nello
stesso modo considerando solo trasformazioni che coinvolgono due coordinate.
La trasformazione che scambia due coordinate (passo 2) è rappresentata da una
matrice che se moltiplicata a sinistra di una matrice generica 𝑀 ne scambia le
righe, se moltiplicata a destra ne scambia le colonne. La trasformazione del
passo 3 se applicata a sinistra somma ad una riga il multiplo di un’altra riga, se
applicata a destra somma ad una colonna il multiplo di un’altra colonna. Tramite
il metodo di riduzione di Gauss (riduzione completa) è possibile trasformare
ogni matrice utilizzando solamente queste trasfromazioni in modo da mantenere
invariato il modulo del determinante e rendere la matrice diagonale. A quel
punto ci siamo ricondotti al passo 1.

Nel caso planare 𝑛 = 2 che stiamo considerando possiamo fare esplicitamente


la riduzione di Gauss. Supponiamo che la trasformazione lineare 𝐿 sia associata
ad una matrice generica:
𝑎 𝑏
 
𝑀= .
𝑐 𝑑
A meno di scambiare righe e colonne possiamo supporre che sia 𝑎 ≠ 0 (se tutti
gli elementi fossero nulli avremmo 𝑀 = 0 che è già in forma diagonale). Allora
moltiplichiamo la seconda riga per un multiplo 𝑚 della prima in modo da
annullare il termine 𝑏 :

𝑎 𝑏 𝑎 𝑏
     
1 0
· =
𝑚 1 𝑐 𝑑 𝑐 + 𝑚𝑎 𝑑 + 𝑚𝑏
6.2 integrale di Riemann 237

scegliendo 𝑚 = − 𝑎𝑐 e ponendo 𝑑0 = 𝑑 + 𝑚𝑏 abbiamo ottenuto la matrice:

𝑎 𝑏
 
.
0 𝑑0

Ora osserviamo che

𝑘
       
0 1 1 0 0 1 1
· · = ·
1 0 𝑘 1 1 0 0 1

Dunque possiamo utilizzare anche quest’ultima matrice moltiplicandola a


destra:
𝑎 𝑏 𝑘 𝑎 𝑎𝑘 + 𝑏
     
1
· =
0 𝑑0 0 1 0 𝑑0

dunque scegliendo 𝑘 = − 𝑏𝑎 si ottiene finalmente una matrice diagonale.

L’integrale di Riemann, che andremo a definire nella prossima sezione, ci


permetterà di osservare che ogni figura geometrica delimitata dal grafico di una
curva sufficientemente regolare risulta essere misurabile secondo Peano-Jordan.
Inoltre il calcolo integrale ci permetterà di determinare l’area di tali figure in
modo piuttosto semplice.

6.2 integrale di Riemann

Definizione 6.4 (integrale di Riemann). Siano 𝑎, 𝑏 ∈ ℝ, 𝑎 ≤ 𝑏 . Un insieme suddivisione di Riemann


𝑃 ⊆ [𝑎, 𝑏] si dice essere una suddivisione di Riemann dell’intervallo [𝑎, 𝑏] se 𝑃 è
un insieme finito tale che 𝑎, 𝑏 ∈ 𝑃 . In particolare 𝑃 si potrà scrivere come

𝑃 = {𝑥 0 , 𝑥1 , . . . , 𝑥 𝑁 }

con
𝑎 = 𝑥 0 < 𝑥1 < · · · < 𝑥 𝑁−1 < 𝑥 𝑁 = 𝑏.

Sia 𝑓 : [𝑎, 𝑏] → ℝ una funzione limitata. Data una qualunque suddivisione 𝑃 di somme superiori/inferiori
[𝑎, 𝑏] definiamo rispettivamente le somme superiori e le somme inferiori come

𝑁
X
𝑆∗ ( 𝑓 , 𝑃) = (𝑥 𝑘 − 𝑥 𝑘−1 ) · sup 𝑓 ([𝑥 𝑘−1 , 𝑥 𝑘 ])
𝑘=1
𝑁
X
𝑆∗ ( 𝑓 , 𝑃) = (𝑥 𝑘 − 𝑥 𝑘−1 ) · inf 𝑓 ([𝑥 𝑘−1 , 𝑥 𝑘 ]).
𝑘=1

Definiamo infine

𝐼 ∗ ( 𝑓 ) = inf {𝑆∗ ( 𝑓 , 𝑃) : 𝑃 suddivisione di [𝑎, 𝑏]}


𝐼∗ ( 𝑓 ) = sup {𝑆∗ ( 𝑓 , 𝑃) : 𝑃 suddivisione di [𝑎, 𝑏]}.
integrale di Riemann
Se 𝐼∗( 𝑓 ) = 𝐼∗ ( 𝑓 ) diremo che 𝑓 è Riemann-integrabile e diremo che l’integrale di 𝑓 su
238 6 calcolo integrale

[𝑎, 𝑏] è il valore comune 𝐼 ∗ ( 𝑓 ) = 𝐼∗ ( 𝑓 ) che verrà denotato con


∫ 𝑏 ∫ 𝑏
𝑓 oppure con 𝑓 (𝑥) 𝑑𝑥.
𝑎 𝑎

Se 𝑏 < 𝑎 e se 𝑓 è Riemann integrabile su [𝑏, 𝑎] definiamo per convenzione:


∫ 𝑏 ∫ 𝑎
𝑓 =− 𝑓.
𝑎 𝑏

Lemma 6.5. Sia 𝑓 : [𝑎, 𝑏] → ℝ una funzione limitata. Se 𝑃 e 𝑄 sono due suddivisioni
qualunque dell’intervallo [𝑎, 𝑏] si ha

𝑆∗ ( 𝑓 , 𝑃) ≤ 𝑆∗ ( 𝑓 , 𝑃 ∪ 𝑄) ≤ 𝑆∗ ( 𝑓 , 𝑃 ∪ 𝑄) ≤ 𝑆∗ ( 𝑓 , 𝑄). (6.3)

Di conseguenza 𝐼∗ ( 𝑓 ) ≤ 𝐼 ∗ ( 𝑓 ).

Dimostrazione. Sia 𝑃 una qualunque suddivisione di [𝑎, 𝑏] e sia 𝑦 ∈ [𝑎, 𝑏] un


punto qualunque. Posto 𝑃 0 = 𝑃 ∪ {𝑦} vogliamo mostrare che si ha

𝑆∗ ( 𝑓 , 𝑃) ≤ 𝑆∗ ( 𝑓 , 𝑃 0) ≤ 𝑆∗ ( 𝑓 , 𝑃 0) ≤ 𝑆∗ ( 𝑓 , 𝑃). (6.4)

Se 𝑦 ∈ 𝑃 non c’è niente da dimostrare in quanto risulterebbe 𝑃 0 = 𝑃 e la


disuguaglianza 𝑆∗ ( 𝑓 , 𝑃 0) ≤ 𝑆 ∗ ( 𝑓 , 𝑃 0) è sempre verificata in quanto ogni estremo
superiore che compare nella definizione di 𝑆 ∗ è maggiore o uguale al corrispon-
dente estremo inferiore che compare nella definizione di 𝑆∗ . Supponiamo allora
che 𝑦 ∉ 𝑃 e dunque che 𝑦 sia compreso tra due punti consecutivi 𝑥 𝑘−1 , 𝑥 𝑘 della
suddivisione 𝑃 :

𝑎 = 𝑥 0 < 𝑥1 < · · · < 𝑥 𝑘−1 < 𝑦 < 𝑥 𝑘 < · · · < 𝑥 𝑁 = 𝑏.

Allora le somme che definiscono 𝑆∗ ( 𝑓 , 𝑃) e 𝑆∗ ( 𝑓 , 𝑃 0) differiscono solo sull’inter-


vallo [𝑥 𝑘−1 , 𝑥 𝑘 ]. Ma osservando che

inf 𝑓 ≤ inf 𝑓 e inf 𝑓 ≤ inf 𝑓


[𝑥 𝑘−1 ,𝑥 𝑘 ] [𝑥 𝑘−1 ,𝑦] [𝑥 𝑘−1 ,𝑥 𝑘 ] [𝑦,𝑥 𝑘 ]

si ottiene 𝑆∗ ( 𝑓 , 𝑃) ≤ 𝑆∗ ( 𝑓 , 𝑃 0). In maniera analoga si ottiene 𝑆 ∗ ( 𝑓 , 𝑃) ≥ 𝑆 ∗ ( 𝑓 , 𝑃 0).


Dunque (6.4) è dimostrata. Ma allora se 𝑃 e 𝑄 sono suddivisioni qualunque
osserviamo che 𝑃 ∪ 𝑄 si può ottenere da 𝑃 aggiungendo uno alla volta i punti
di 𝑄 . Iterando la (6.4) si ottiene (6.3). Facendo l’estremo inferiore al variare
di 𝑄 si ottiene 𝑆∗ ( 𝑓 , 𝑃) ≤ 𝐼 ∗ ( 𝑓 ) e facendo l’estremo superiore al variare di 𝑃 si
ottiene 𝐼∗ ( 𝑓 ) ≤ 𝐼 ∗ ( 𝑓 ).
criteri di integrabilità

Teorema 6.6 (criteri di integrabilità). Sia 𝑓 : [𝑎, 𝑏] → ℝ una funzione limitata.

1. La funzione 𝑓 è Riemann-integrabile se e solo se per ogni 𝜀 > 0 esiste una


suddivisione 𝑃 tale che

𝑆 ∗ ( 𝑓 , 𝑃) − 𝑆∗ ( 𝑓 , 𝑃) < 𝜀.
6.2 integrale di Riemann 239

2. Se 𝑓 è Riemann-integrabile su [𝑎, 𝑏] allora esiste una successione 𝑃𝑛 di


suddivisioni tali che
∫ 𝑏

lim 𝑆 ( 𝑓 , 𝑃𝑛 ) = lim 𝑆∗ ( 𝑓 , 𝑃𝑛 ) = 𝑓. (6.5)
𝑛→+∞ 𝑛→+∞ 𝑎

Viceversa se 𝑓 è limitata ed esiste una successione 𝑃𝑛 di suddivisioni di [𝑎, 𝑏]


per cui si ha
lim (𝑆 ∗ ( 𝑓 , 𝑃𝑛 ) − 𝑆∗ ( 𝑓 , 𝑃𝑛 )) = 0
𝑛→+∞

allora la funzione 𝑓 è Riemann-integrabile e vale (6.5).

Dimostrazione. Se esiste una suddivisione 𝑃 tale che 𝑆 ∗ ( 𝑓 , 𝑃) − 𝑆∗ ( 𝑓 , 𝑃) < 𝜀


possiamo immediatamente concludere che

𝐼 ∗ ( 𝑓 ) − 𝐼∗ ( 𝑓 ) ≤ 𝑆∗ ( 𝑓 , 𝑃) − 𝑆∗ ( 𝑓 , 𝑃) < 𝜀.

Se questo è vero per ogni 𝜀 > 0 deduciamo che 𝐼 ∗ ( 𝑓 ) − 𝐼∗ ( 𝑓 ) = 0 e dunque che 𝑓


è Riemann-integrabile.

Viceversa qualunque sia 𝑓 , per le proprietà di sup e inf esistono 𝑄 e 𝑅


suddivisioni tali che
𝜀 𝜀
𝐼 ∗ ( 𝑓 ) ≥ 𝑆∗ ( 𝑓 , 𝑄) − e 𝐼∗ ( 𝑓 ) ≤ 𝑆∗ ( 𝑓 , 𝑅) +
2 2
da cui, per il lemma precedente, ponendo 𝑃 = 𝑄 ∪ 𝑅 se 𝑓 è Riemann integrabile
si ottiene

𝑆∗ ( 𝑓 , 𝑃) − 𝑆∗ ( 𝑓 , 𝑃) ≤ 𝑆 ∗ ( 𝑓 , 𝑄) − 𝑆∗ ( 𝑓 , 𝑅)
𝜀  𝜀
≤ 𝐼 ∗ ( 𝑓 ) + − 𝐼∗ ( 𝑓 ) − = 𝜀.
2 2

Dimostriamo ora il secondo punto. Supponiamo dapprima che 𝑓 sia Riemann-


integrabile su [𝑎, 𝑏]. Allora per il punto precedente per ogni 𝑛 ∈ ℕ ponendo
𝜀 = 1/𝑛 possiamo trovare una suddivisione 𝑃𝑛 tale che

1
𝑆 ∗ ( 𝑓 , 𝑃𝑛 ) − 𝑆 ∗ ( 𝑓 , 𝑃𝑛 ) <
𝑛
da cui
1 1
𝐼 ∗ ( 𝑓 ) ≤ 𝑆 ∗ ( 𝑓 , 𝑃𝑛 ) ≤ 𝑆 ∗ ( 𝑓 , 𝑃𝑛 ) + ≤ 𝐼∗ ( 𝑓 ) +
𝑛 𝑛
∫𝑏
perciò passando al limite per 𝑛 → +∞, essendo 𝐼 ∗ ( 𝑓 ) = 𝐼∗ ( 𝑓 ) = 𝑎
𝑓 deve
valere ∫ 𝑏

lim 𝑆 ( 𝑓 , 𝑃𝑛 ) = lim 𝑆∗ ( 𝑓 , 𝑃𝑛 ) = 𝑓.
𝑎

Viceversa se
lim 𝑆 ∗ ( 𝑓 , 𝑃𝑛 ) − 𝑆∗ ( 𝑓 , 𝑃𝑛 ) = 0
𝑛→+∞

per ogni 𝜀 > 0 esiste 𝑛 tale che

𝑆∗ ( 𝑓 , 𝑃𝑛 ) − 𝑆∗ ( 𝑓 , 𝑃𝑛 ) < 𝜀.
240 6 calcolo integrale

Per il punto precedente concludiamo che 𝑓 è Riemann-integrabile. D’altra parte


sappiamo che
∫ 𝑏
𝑆 ∗ ( 𝑓 , 𝑃𝑛 ) ≤ 𝐼 ∗ ( 𝑓 ) = 𝑓 = 𝐼 ∗ ( 𝑓 ) ≤ 𝑆 ∗ ( 𝑓 , 𝑃𝑛 )
𝑎

dunque se 𝑆 ∗ ( 𝑓 , 𝑃𝑛 ) − 𝑆∗ ( 𝑓 , 𝑃𝑛 ) → 0 necessariamente l’integrale coincide con i


limiti di 𝑆 ∗ ( 𝑓 , 𝑃𝑛 ) e di 𝑆∗ ( 𝑓 , 𝑃𝑛 ).

Esempio 6.7 (calcolo dell’integrale tramite le suddivisioni). Mostriamo che per


ogni 𝑏 > 0 la funzione 𝑓 (𝑥) = 𝑥 2 è Riemann-integrabile sull’intervallo [0 , 𝑏] e si ha

𝑏
𝑏3

𝑥 2 𝑑𝑥 = .
0 3

Dimostrazione. Consideriamo le suddivisioni equispaziate dell’intervallo [0 , 𝑏],


cioè dividiamo [0 , 𝑏] in 𝑁 intervalli ognuno di ampiezza 𝑏/𝑁 :

𝑘𝑏
 
𝑃𝑁 = : 𝑘 ∈ 0, 1, . . . , 𝑁 .
𝑁

Si ha
𝑁 𝑁 𝑁
X 𝑏 𝑏 X 𝑘2𝑏2 𝑏3 X
𝑆 ∗ ( 𝑓 , 𝑃𝑁 ) = sup 𝑓 · = = 3 𝑘2.
𝑘=1 [(𝑘−1)𝑏/𝑁 ,𝑘𝑏/𝑁]
𝑁 𝑁 𝑘=1 𝑁 2 𝑁 𝑘=1

Ricordiamo ora che vale


𝑛
X 𝑛(𝑛 + 1)(2𝑛 + 1) 2𝑛 3 + 3𝑛 2 + 𝑛
𝑘2 = =
𝑘=1
6 6

(tale formula può essere facilmente verificata per induzione). Dunque si ha

𝑏 3 2𝑁 3 + 3𝑁 2 + 𝑁 𝑏3 12 𝑏3
 
3
𝑆 ∗ ( 𝑓 , 𝑃𝑁 ) = = 2+ + →
𝑁 3 6 6 𝑁 𝑁 3

per 𝑁 → +∞. Analogamente si trova

𝑁 𝑁
X 𝑏 𝑏 X (𝑘 − 1)2 𝑏 2 𝑏 3 𝑁−
X1 2
𝑆∗ ( 𝑓 , 𝑃𝑁 ) = inf 𝑓 · = = 3 𝑘
𝑘=1 [(𝑘−1)𝑏/𝑁 ,𝑘𝑏/𝑁]
𝑁 𝑁 𝑘=1 𝑁 2 𝑁 𝑘=0

e osservando che si ha
𝑁−
X1 𝑁−
X1 2(𝑁 − 1)3 + 3(𝑁 − 2)2 + (𝑁 − 1)
𝑘2 = 𝑘2 =
𝑘=0 𝑘=1
6

otteniamo

𝑏3 𝑏3
𝑆∗ ≥ sup 𝑆∗ ( 𝑓 , 𝑃𝑁 ) ≥ lim 𝑆∗ ( 𝑓 , 𝑃𝑁 ) = → .
𝑁 𝑁→+∞ 3 3

La dimostrazione si conclude quindi applicando il criterio (6.5) del teorema


precedente.
6.2 integrale di Riemann 241

Teorema 6.8 (integrale della costante). Se 𝑓 : [𝑎, 𝑏] → ℝ è costante: 𝑓 (𝑥) = 𝑐


allora 𝑓 è Riemann-integrabile e si ha
∫ 𝑏
𝑓 = 𝑐 · (𝑏 − 𝑎).
𝑎

Dimostrazione. Visto che su ogni 𝐴 ⊆ [𝑎, 𝑏] si ha

sup 𝑓 = inf 𝑓 = 𝑐
𝐴 𝐴

è facile verificare che si ha

𝑆∗ ( 𝑓 , 𝑃) = 𝑆∗ ( 𝑓 , 𝑃) = 𝑐 · (𝑏 − 𝑎)

qualunque sia la suddivisione 𝑃 di [𝑎, 𝑏]. Il risultato segue immediatamente.

Non tutte le funzioni sono Riemann-integrabili come ci mostra il seguente


esempio.
funzione di Dirichlet

Esempio 6.9 (funzione di Dirichlet). Sia 𝑎 < 𝑏 e sia 𝑓 : [𝑎, 𝑏] → ℝ la funzione


definita da (
1 se 𝑥 ∈ ℚ
𝑓 (𝑥) =
0 se 𝑥 ∉ ℚ.

Allora 𝑓 non è Riemann-integrabile.

Dimostrazione. Sia 𝑃 = {𝑥 0 , 𝑥 1 , . . . , 𝑥 𝑁 } con 𝑎 = 𝑥 0 < 𝑥 1 < · · · < 𝑥 𝑁 = 𝑏 una


qualunque suddivisione di [𝑎, 𝑏]. Allora basta osservare che, per la densità dei
razionali, in qualunque intervallino 𝐼 = [𝑥 𝑘−1 , 𝑥 𝑘 ] sono presenti infiniti punti
razionali e infiniti punti irrazionali. Dunque sup 𝑓 (𝐼) = 1 e inf 𝑓 (𝐼) = 0 e di
conseguenza

𝑁
X
𝑆∗ ( 𝑓 , 𝑃) = (𝑥 𝑘 − 𝑥 𝑘−1 ) · 1 = 𝑏 − 𝑎
𝑘=1
𝑁
X
𝑆∗ ( 𝑓 , 𝑃) = (𝑥 𝑘 − 𝑥 𝑘−1 ) · 0 = 0
𝑘=1

da cui 𝐼 ∗ ( 𝑓 ) = 𝑏 − 𝑎 ≠ 0 = 𝐼∗ ( 𝑓 ).

Teorema 6.10 (monotonia dell’integrale). Sia 𝑎 ≤ 𝑏 e siano 𝑓 , 𝑔 : [𝑎, 𝑏] → ℝ due


funzioni Riemann-integrabili. Se per ogni 𝑥 ∈ [𝑎, 𝑏] si ha 𝑓 (𝑥) ≤ 𝑔(𝑥) allora
∫ 𝑏 ∫ 𝑏
𝑓 (𝑥) ≤ 𝑔(𝑥).
𝑎 𝑎

∫𝑏
In particolare se 𝑓 ≥ 0 allora 𝑎
𝑓 ≥ 0.
242 6 calcolo integrale

Dimostrazione. Chiaramente se 𝑓 ≤ 𝑔 si avrà che il sup di 𝑓 su qualunque


intervallo sarà minore o uguale al sup di 𝑔 sullo stesso intervallo. Dunque su
ogni suddivisione 𝑃 di [𝑎, 𝑏] si avrà:

𝑆∗ ( 𝑓 , 𝑃) ≤ 𝑆∗ (𝑔, 𝑃)

da cui si ottiene immediatamente 𝐼 ∗ ( 𝑓 ) ≤ 𝐼 ∗ (𝑔) e il risultato segue.

Teorema 6.11 (linearità dell’integrale). Siano 𝑓 , 𝑔 : [𝑎, 𝑏] → ℝ due funzioni


Riemann-integrabili e siano 𝜆, 𝜇 ∈ ℝ. Allora 𝜆 𝑓 + 𝜇𝑔 è Riemann integrabile e si ha
∫ 𝑏 ∫ 𝑏 ∫ 𝑏
(𝜆 𝑓 + 𝜇𝑔) = 𝜆 𝑓 +𝜇 𝑔.
𝑎 𝑎 𝑎

In particolare l’insieme delle funzioni Riemann-integrabili su [𝑎, 𝑏] risulta essere uno


spazio vettoriale reale e l’integrale è una applicazione lineare su tale spazio, a valori in
ℝ.

Dimostrazione. Mostriamo innanzitutto che


∫ 𝑏 ∫ 𝑏
(− 𝑓 ) = − 𝑓. (6.6)
𝑎 𝑎

Questo deriva dal fatto che su qualunque insieme 𝐴 si ha sup𝐴 (− 𝑓 ) = − inf𝐴 𝑓


e dunque per una qualunque suddivisione 𝑃 si ha

𝑆∗ (− 𝑓 , 𝑃) = −𝑆∗ ( 𝑓 , 𝑃).

Se ne deduce che 𝐼 ∗ (− 𝑓 ) = −𝐼∗ ( 𝑓 ) e, analogamente, 𝐼∗ (− 𝑓 ) = −𝐼 ∗ ( 𝑓 ). Dunque se


𝑓 è Riemann-integrabile anche − 𝑓 lo è e vale la proprietà (6.6).

Ora se 𝜆 ≥ 0 vogliamo mostrare che vale


∫ 𝑏 ∫ 𝑏
𝜆𝑓 = 𝜆 𝑓. (6.7)
𝑎 𝑎

Semplicemente si osserva che sup𝐼 𝜆 𝑓 = 𝜆 sup𝐼 𝑓 e dunque 𝑆 ∗ (𝜆 𝑓 , 𝑃) =


𝜆𝑆∗ ( 𝑓 , 𝑃) per ogni suddivisione 𝑃 . Ne consegue che 𝐼 ∗ (𝜆 𝑓 ) = 𝜆𝐼 ∗ ( 𝑓 ). In maniera
analoga si può mostrare che 𝐼∗ (𝜆 𝑓 ) = 𝜆𝐼∗ ( 𝑓 ). Dunque se 𝑓 è Riemann-integrabile
anche 𝜆 𝑓 (con 𝜆 ≥ 0) lo è e vale (6.7).

Mettendo assieme (6.6) e (6.7) si ottiene che (6.7) vale per ogni 𝜆 ∈ ℝ. Lo
stesso sarà vero se mettiamo 𝑔 al posto di 𝑓 e 𝜇 al posto di 𝜆. Per concludere la
dimostrazione sarà dunque sufficiente mostrare che vale anche
∫ 𝑏 ∫ 𝑏 ∫ 𝑏
( 𝑓 + 𝑔) = 𝑓 + 𝑔.
𝑎 𝑎 𝑎

Osserviamo che su qualunque insieme 𝐴 si ha

sup( 𝑓 + 𝑔) ≤ sup 𝑓 + sup 𝑔.


𝐴 𝐴 𝐴
6.2 integrale di Riemann 243

Infatti per le proprietà dell’estremo superiore per ogni 𝜀 > 0 esiste 𝑥 ∈ 𝐴 tale
che
sup( 𝑓 + 𝑔) ≤ 𝑓 (𝑥) + 𝑔(𝑥) + 𝜀.
𝐴

Ma chiaramente 𝑓 (𝑥) ≤ sup𝐴 𝑓 e 𝑔(𝑥) ≤ sup𝐴 𝑔 dunque si ottiene

sup( 𝑓 + 𝑔) ≤ sup 𝑓 + sup 𝑔 + 𝜀.


𝐴 𝐴 𝐴

Passando al limite per 𝜀 → 0+ si ottiene la disuguaglianza voluta. Questo


significa che
𝑆∗ ( 𝑓 + 𝑔) ≤ 𝑆∗ ( 𝑓 ) + 𝑆∗ (𝑔).
analogamente si potrà dimostrare che

𝑆∗ ( 𝑓 + 𝑔) ≥ 𝑆∗ ( 𝑓 ) + 𝑆∗ (𝑔).

Si ottiene dunque

𝐼 ∗ ( 𝑓 + 𝑔) ≤ 𝐼 ∗ ( 𝑓 ) + 𝐼 ∗ (𝑔) e 𝐼∗ ( 𝑓 + 𝑔) ≥ 𝐼∗ ( 𝑓 ) + 𝐼∗ (𝑔)

e dunque se 𝑓 e 𝑔 sono integrabili anche 𝑓 + 𝑔 risulta integrabile e vale la (6.2).

Per concludere che l’insieme delle funzioni integrali sia uno spazio vettoriale è
sufficiente osservare che, grazie al teorema 6.8, la funzione 0 risulta integrabile.

Teorema 6.12 (proprietà di reticolo). Se 𝑓 e 𝑔 sono funzioni a valori reali definiamo


le funzioni 𝑓 ∧ 𝑔 (minimo), 𝑓 ∨ 𝑔 (massimo), 𝑓 + (parte positiva) e 𝑓 − (parte negativa)
come segue:

( 𝑓 ∧ 𝑔)(𝑥) = min { 𝑓 (𝑥), 𝑔(𝑥)} ( 𝑓 ∨ 𝑔)(𝑥) = max { 𝑓 (𝑥), 𝑔(𝑥)}


( (
𝑓 (𝑥) se 𝑓 (𝑥) > 0 − 𝑓 (𝑥) se 𝑓 (𝑥) < 0
𝑓 + (𝑥) = 𝑓 − (𝑥) =
0 altrimenti 0 altrimenti.

Risulta 𝑓 = 𝑓 + − 𝑓 − , | 𝑓 | = 𝑓 + + 𝑓 − .

Se 𝑓 è una funzione Riemann-integrabile sull’intervallo [𝑎, 𝑏] allora anche | 𝑓 | , 𝑓 + e


𝑓 − sono integrabili e, se anche 𝑔 è Riemann-integrabile su [𝑎, 𝑏], allora anche 𝑓 ∨ 𝑔 e
𝑓 ∧ 𝑔 sono integrabili sullo stesso intervallo. Inoltre si ha

∫ 𝑏 𝑏
|𝑓| ≥ 𝑓 . (6.8)

𝑎 𝑎

Dimostrazione. Dimostriamo innanzitutto che se 𝑓 è integrabile anche | 𝑓 | lo è.


Basta osservare che in generale se 𝑥, 𝑦 ∈ [𝑎, 𝑏] si ha

| 𝑓 (𝑥)| − | 𝑓 (𝑦)| ≤ | 𝑓 (𝑥) − 𝑓 (𝑦)|

da cui per ogni 𝐴 ⊆ [𝑎, 𝑏]

sup | 𝑓 (𝑥)| − inf | 𝑓 (𝑦)| ≤ sup 𝑓 (𝑥) − inf 𝑓 (𝑦)


𝑥∈𝐴 𝑦∈𝐴 𝑥∈𝐴 𝑦∈𝐴
244 6 calcolo integrale

e quindi per ogni suddivisione 𝑃 si avrà

𝑆∗ (| 𝑓 |, 𝑃) − 𝑆∗ (| 𝑓 |, 𝑃) ≤ 𝑆∗ ( 𝑓 , 𝑃) − 𝑆∗ ( 𝑓 , 𝑃).

Ma se 𝑓 è integrabile allora il lato destro può essere reso arbitrariamente piccolo


(teorema 6.6) e di conseguenza anche il lato sinistro. Dunque la funzione | 𝑓 | è
integrabile (se 𝑓 lo è).

Ma allora basta osservare che

|𝑓| + 𝑓 |𝑓| − 𝑓
𝑓+ = , 𝑓− = ,
2 2
𝑓 + 𝑔 − | 𝑓 − 𝑔| 𝑓 + 𝑔 + | 𝑓 − 𝑔|
𝑓 ∧𝑔= , 𝑓 ∨𝑔=
2 2
per dedurre che anche 𝑓 + , 𝑓 − , 𝑓 ∧ 𝑔 e 𝑓 ∨ 𝑔 sono integrabili, grazie alla linearità
dell’integrale (teorema 6.11).

Per dimostrare (6.8) basta osservare che


∫ ∫ ∫ 𝑛 ∫ 𝑏
𝑏 𝑏 ∫ 𝑏 ∫ 𝑏
+ − + −
𝑓 = 𝑓 − 𝑓 ≤ 𝑓 − 𝑓 = | 𝑓 |.


𝑎 𝑎 𝑎 𝑎 𝑎 𝑎

additività dell’integrale
Teorema 6.13 (additività dell’integrale). Sia 𝑓 : [𝑎, 𝑏] → ℝ una funzione limitata
e sia 𝑐 ∈ [𝑎, 𝑏]. Allora 𝑓 è Riemann-integrabile su [𝑎, 𝑏] se e solo se 𝑓 è Riemann-
integrabile su [𝑎, 𝑐] e su [𝑐, 𝑏]. E in tal caso risulta
∫ 𝑏 ∫ 𝑐 ∫ 𝑏
𝑓 = 𝑓 + 𝑓. (6.9)
𝑎 𝑎 𝑐

In base alla convenzione ∫ 𝑎 ∫ 𝑏


𝑓 =− 𝑓
𝑏 𝑎

la formula (6.9) è valida non solo se 𝑎 ≤ 𝑐 ≤ 𝑏 ma anche se 𝑎, 𝑏, 𝑐 sono in qualunque


ordine, purché la funzione 𝑓 sia integrabile sull’intervallo che contiene tutti e tre i punti
𝑎, 𝑏, 𝑐 .

Dimostrazione. Supponiamo che 𝑓 sia integrabile su [𝑎, 𝑐] e su [𝑐, 𝑏]. Allora, in


base ai criteri di integrabilità, per ogni 𝜀 > 0 esisteranno una suddivisione 𝑃 di
[𝑎, 𝑐] e una suddivisione 𝑄 di [𝑐, 𝑏] tali che
𝜀 𝜀
𝑆∗ ( 𝑓 , 𝑃) − 𝑆∗ ( 𝑓 , 𝑃) < , 𝑆∗ ( 𝑓 , 𝑄) − 𝑆∗ ( 𝑓 , 𝑄) < .
2 2
L’insieme 𝑅 = 𝑃 ∪ 𝑄 risulta essere una suddivisione di [𝑎, 𝑏] su cui si avrà

𝑆∗ ( 𝑓 , 𝑅) = 𝑆∗ ( 𝑓 , 𝑃) + 𝑆∗ ( 𝑓 , 𝑄), 𝑆∗ ( 𝑓 , 𝑅) = 𝑆∗ ( 𝑓 , 𝑃) + 𝑆∗ ( 𝑓 , 𝑄) (6.10)

e dunque
𝜀 𝜀
𝑆∗ ( 𝑓 , 𝑅) − 𝑆∗ ( 𝑓 , 𝑅) ≤ + = 𝜀.
2 2
6.2 integrale di Riemann 245

Applicando nuovamente il criterio di integrabilità in senso invertito otteniamo


dunque l’integrabilità di 𝑓 su [𝑎, 𝑏] e le equazioni (6.10) garantiscono l’additività
dell’integrale rispetto al dominio.
Viceversa se 𝑓 è integrabile su [𝑎, 𝑏] il criterio di integrabilità ci garantisce che
per ogni 𝜀 > 0 esiste una suddivisione 𝑅 di [𝑎, 𝑏] tale che

𝑆∗ ( 𝑓 , 𝑅) − 𝑆∗ ( 𝑓 , 𝑅) < 𝜀.

Se ora consideriamo 𝑅0 = 𝑅 ∪ {𝑐} sappiamo che 𝑆 ∗ ( 𝑓 , 𝑅0) ≤ 𝑆 ∗ ( 𝑓 , 𝑅) e


𝑆∗ ( 𝑓 , 𝑅0) ≥ 𝑆∗ ( 𝑓 , 𝑅) dunque anche 𝑅0 soddisfa la proprietà

𝑆∗ ( 𝑓 , 𝑅0) − 𝑆∗ ( 𝑓 , 𝑅0) < 𝜀.

Ma ora è chiaro che posto 𝑃 = 𝑅0 ∩ [𝑎, 𝑐] e 𝑄 = 𝑅0 ∩ [𝑐, 𝑏] risulta che 𝑃 e 𝑄


siano suddivisioni di [𝑎, 𝑐] e [𝑐, 𝑏] rispettivamente e che

𝑆∗ ( 𝑓 , 𝑅0) = 𝑆∗ ( 𝑓 , 𝑃) + 𝑆∗ ( 𝑓 , 𝑄),
𝑆∗ ( 𝑓 , 𝑅0) = 𝑆∗ ( 𝑓 , 𝑃) + 𝑆∗ ( 𝑓 , 𝑄).

Dunque si ha

(𝑆 ∗ ( 𝑓 , 𝑃) − 𝑆∗ ( 𝑓 , 𝑃)) + (𝑆∗ ( 𝑓 , 𝑄) − 𝑆∗ ( 𝑓 , 𝑄)) = 𝑆∗ ( 𝑓 , 𝑅0) − 𝑆∗ ( 𝑓 , 𝑅0)


< 𝜀.

Visto che entrambi gli addendi 𝑆 ∗ − 𝑆∗ sono non negativi risulta che valgono
separatamente le disuguaglianze

𝑆∗ ( 𝑓 , 𝑃) − 𝑆∗ ( 𝑓 , 𝑃) < 𝜀, 𝑆∗ ( 𝑓 , 𝑄) − 𝑆∗ ( 𝑓 , 𝑄) < 𝜀.

Dunque 𝑓 è integrabile sia su [𝑎, 𝑐] che su [𝑐, 𝑏]. E nuovamente possiamo


osservare che l’integrale è additivo sul dominio.

Il seguente risultato mette in corrispondenza l’integrale di Riemann con la


misura di Peano-Jordan ed è un modo formale per dare all’integrale di Riemann
il significato di area (con segno) del sottografico della funzione integranda. Nel
seguito non faremo mai uso di questo risultato che serve solo a soddisfare la
nostra intuizione.

Teorema 6.14 (interpretazione geometrica dell’integrale). Sia 𝑓 : [𝑎, 𝑏] → ℝ,


una funzione limitata, 𝑎 ≤ 𝑏 . Posto

𝐸+ = {(𝑥, 𝑦) ∈ [𝑎, 𝑏] × ℝ : 0 ≤ 𝑦 ≤ 𝑓 (𝑥)},


𝐸− = {(𝑥, 𝑦) ∈ [𝑎, 𝑏] × ℝ : 𝑓 (𝑥) ≤ 𝑦 ≤ 0}

si ha che 𝑓 è Riemann-integrabile su [𝑎, 𝑏] se e solo se gli insiemi 𝐸 + ed 𝐸 − sono


misurabili secondo Peano-Jordan. E in tal caso risulta:
∫ 𝑏
𝑓 = 𝑚(𝐸+ ) − 𝑚(𝐸− )
𝑎

dove 𝑚 è la misura di Peano-Jordan.


246 6 calcolo integrale

Dimostrazione. Passo 1: supponiamo che sia 𝑓 (𝑥) ≥ 0 per ogni 𝑥 ∈ [𝑎, 𝑏].
Se 𝑃 = {𝑥 0 , 𝑥 1 , . . . , 𝑥 𝑁 } è una suddivione di [𝑎, 𝑏] è chiaro che posto 𝐼 𝑘 =
[𝑥 𝑘 , 𝑥 𝑘+1 ] l’unione dei rettangoli 𝑅 𝑘 = 𝐼 𝑘 × [0 , inf𝐼 𝑘 𝑓 ] ci dà un polirettangolo
contenuto in 𝐸 + . E 𝑆∗ ( 𝑓 , 𝑃) rappresenta proprio la misura di tale polirettangolo.
Dunque 𝑚∗ (𝐸 + ) ≥ 𝑆∗ ( 𝑓 , 𝑃) per ogni suddivisione 𝑃 e quindi 𝑚∗ (𝐸 + ) ≥ 𝐼∗ ( 𝑓 , 𝑃).
Ragionando in maniera analoga con i rettangoli la cui altezza è il sup di 𝑓 , si
osserva che 𝑆 ∗ ( 𝑓 , 𝑃) rappresenta la misura di un polirettangolo contenente 𝐸 +
e dunque 𝑚 ∗ (𝐸 + ) ≤ 𝐼 ∗ ( 𝑓 , 𝑃).

D’altra parte preso un qualunque polirettangolo che contenuto in 𝐸 + possiamo


considerare la suddivisione 𝑃 formata da 𝑎 , 𝑏 e da tutte le coordinate 𝑥 dei
lati dei rettangoli che compongono il polirettangolo. E’ chiaro il polirettangolo
sarà allora contenuto nell’unione dei rettangoli determinati da 𝑃 con altezza
l’estremo inferiore di 𝑓 . Dunque 𝑚∗ (𝐸 + ) ≤ 𝐼∗ ( 𝑓 ). Analogamente se prendiamo
un polirettangolo che contiene 𝐸 + possiamo innanzitutto tagliare tutti i rettangoli
con le rette 𝑥 = 𝑎 e 𝑥 = 𝑏 e rimuovere eventuali rettangoli che si trovino a
sinistra di 𝑥 = 𝑎 o a destra di 𝑥 = 𝑏 . Questo diminuisce la misura del
polirettangolo e mantiene l’inclusione di 𝐸 + . A questo punto consideriamo la
suddivisione 𝑃 ottenuta prendendo i punti 𝑎 , 𝑏 e tutte le coordinate 𝑥 dei lati
verticali dei rettangoli che formano il polirettangolo. E’ chiaro allora che la
misura del polirettangolo originario è maggiore o uguale a 𝑆 ∗ ( 𝑓 , 𝑃) e dunque
𝑚 ∗ (𝐸+ ) ≥ 𝐼 ∗ ( 𝑓 ).

Essendo dunque 𝑚∗ (𝐸 + ) = 𝐼∗ ( 𝑓 ) e 𝑚 ∗ (𝐸 + ) = 𝐼∗ ( 𝑓 ) risulta che se 𝑓 ≥ 0 allora 𝑓 è


Riemann-integrabile se e solo se 𝐸 + è Peano-Jordan misurabile e in tal caso si
∫𝑏
ha 𝑎
𝑓 = 𝑚(𝐸+ ).

Passo 2: sia 𝑓 : [𝑎, 𝑏] → ℝ qualunque. Allora si avrà 𝑓 = 𝑓 + − 𝑓 − . A 𝑓 + e 𝑓 −


potremo applicare il passo precedente. Osserviamo che l’insieme 𝐸 + di 𝑓 −
non è altro che la riflessione (rispetto all’asse delle ascisse) dell’insieme 𝐸 − di
𝑓 e questi insiemi hanno la stessa misura di Peano-Jordan. Dunque, se 𝑓 è
Riemann-integrabile anche 𝑓 + e 𝑓 − lo sono (Teorema 6.12) dunque 𝐸 + ed 𝐸 −
sono Peano-Jordan misurabili per il passo precedente e si ha
∫ 𝑏 ∫ 𝑏 ∫ 𝑏
+
𝑓 = 𝑓 − 𝑓 − = 𝑚(𝐸+ ) − 𝑚(𝐸− ). (6.11)
𝑎 𝑎 𝑎

Viceversa se 𝐸 + ed 𝐸 − sono Peano-Jordan misurabili allora 𝑓 + ed 𝑓 − sono


Riemann-integrabili (per il passo precedente) e anche 𝑓 = 𝑓 + − 𝑓 − è Riemann-
integrabile (Teorema 6.11) e di nuovo deve valere (6.11).
integrabilità delle funzioni continue

Teorema 6.15 (integrabilità delle funzioni continue). Sia 𝑓 : [𝑎, 𝑏] → ℝ una


funzione continua. Allora 𝑓 è limitata e Riemann-integrabile.

Dimostrazione. Per il teorema di Weierstrass sappiamo che 𝑓 è limitata. Per il


teorema di Heine-Cantor sappiamo che 𝑓 è uniformemente continua, dunque
per ogni 𝜀 > 0 esiste un 𝛿 > 0 tale che

|𝑥 − 𝑦| < 𝛿 =⇒ | 𝑓 (𝑥) − 𝑓 (𝑦)| < 𝜀.


6.2 integrale di Riemann 247

Possiamo allora considerare una suddivisione 𝑃𝛿 con la proprietà che gli


intervalli individuati dalla suddivisione abbiano tutti ampiezza minore di 𝛿 (ad
esempio potremmo prendere la suddivisione formata da (𝑏 − 𝑎)/𝛿 + 2 punti
equispaziati in [𝑎, 𝑏]). Su ogni intervallo 𝐼 di tale suddivisione si avrà che
se 𝑥, 𝑦 ∈ 𝐼 allora | 𝑓 (𝑥) − 𝑓 (𝑦)| < 𝜀 da cui si deduce sup𝐼 𝑓 − inf𝐼 𝑓 ≤ 𝜀. In
particolare, sommando su tutti gli intervalli, si avrà
!
𝑁
X
𝑆 ∗ ( 𝑓 , 𝑃𝛿 ) − 𝑆∗ ( 𝑓 , 𝑃𝛿 ) = (𝑥 𝑘 − 𝑥 𝑘−1 ) sup 𝑓 − inf 𝑓
𝑘=1 [𝑥 𝑘−1 ,𝑥 𝑘 ] [𝑥 𝑘−1 ,𝑥 𝑘 ]

𝑁
X
≤𝜀 (𝑥 𝑘 − 𝑥 𝑘−1 ) = 𝜀(𝑏 − 𝑎).
𝑘=1

Visto che questa quantità può essere resa arbitrariamente piccola per 𝜀 → 0,
in base ai criteri di integrabilità possiamo concludere che la funzione 𝑓 è
integrabile.

integrabilità delle funzioni monotone


Teorema 6.16 (integrabilità delle funzioni monotone). Sia 𝑓 : [𝑎, 𝑏] → ℝ una
funzione monotona. Allora 𝑓 è limitata e Riemann-integrabile.

Dimostrazione. Supponiamo, per fissare le idee, che 𝑓 sia crescente.

Chiaramente 𝑓 è limitata in quanto 𝑓 (𝑎) ≤ 𝑓 (𝑥) ≤ 𝑓 (𝑏) per ogni 𝑥 ∈ [𝑎, 𝑏].

Per avere l’integrabilità e sufficiente mostrare che esiste una successione di sud-
divisioni 𝑃𝑛 tale che 𝑆 ∗ ( 𝑓 , 𝑃𝑛 ) − 𝑆∗ ( 𝑓 , 𝑃𝑛 ) → 0. Consideriamo la suddivisione
equispaziata 𝑃𝑛 = {𝑥 𝑘 : 𝑘 = 0 , 1 , . . . , 𝑛} con 𝑥 𝑘 = 𝑎 + 𝑘(𝑏 − 𝑎)/𝑁 . In tal caso su
ogni intervallino [𝑥 𝑘−1 , 𝑥 𝑘 ] si ha

sup 𝑓 ([𝑥 𝑘−1 , 𝑥 𝑘 ]) = 𝑓 (𝑥 𝑘 ), inf 𝑓 ([𝑥 𝑘−1 , 𝑥 𝑘 ]) = 𝑓 (𝑥 𝑘−1 ).

Dunque la differenza tra le somme superiori e le somme inferiori è telescopica e


si ha, per 𝑛 → +∞
𝑛 𝑛
X 𝑏−𝑎 X 𝑏−𝑎
𝑆∗ ( 𝑓 , 𝑃) − 𝑆∗ ( 𝑓 , 𝑃) = 𝑓 (𝑥 𝑘 ) − 𝑓 (𝑥 𝑘−1 )
𝑘=1
𝑛 𝑘=1
𝑛
𝑏−𝑎
= ( 𝑓 (𝑏) − 𝑓 (𝑎)) → 0.
𝑛
E’ quanto volevamo dimostrare.
funzione di Heaviside

Esempio 6.17 (funzione di Heaviside). Sia 𝑎 < 0 < 𝑏 . La funzione 𝐻 : [𝑎, 𝑏] → ℝ


definita da (
1 se 𝑥 ≥ 0
𝐻(𝑥) =
0 se 𝑥 < 0

è crescente quindi integrabile.

Teorema 6.18 (continuità dell’integrale). Sia 𝑓 : [𝑎, 𝑏] → ℝ una funzione limitata


e tale che per ogni 𝑐 ∈ (𝑎, 𝑏] risulta che 𝑓 sia Riemann-integrabile su [𝑐, 𝑏]. Allora 𝑓 è
248 6 calcolo integrale

Riemann-integrabile su [𝑎, 𝑐] e risulta


∫ 𝑏 ∫ 𝑏
𝑓 = lim+ 𝑓.
𝑎 𝑐→𝑎 𝑐

Analogamente se 𝑓 è integrabile su ogni intervallo [𝑎, 𝑐] con 𝑐 ∈ [𝑎, 𝑏) allora 𝑓 è


integrabile su [𝑎, 𝑏] e vale
∫ 𝑏 ∫ 𝑐
𝑓 = lim− 𝑓.
𝑎 𝑐→𝑏 𝑎

Dimostrazione. Dimostriamo solamente la prima parte, visto che la seconda si


tratta in maniera del tutto analoga. Supponiamo quindi che 𝑓 sia integrabile su
ogni intervallo [𝑐, 𝑏] con 𝑐 ∈ (𝑎, 𝑏]. Sappiamo inoltre che 𝑓 è limitata su tutto
[𝑎, 𝑏] e quindi esiste 𝑀 > 0 tale che | 𝑓 (𝑥)| ≤ 𝑀 per ogni 𝑥 ∈ [𝑎, 𝑏]. Fissato
𝜀 > 0 qualunque, scegliamo 𝑐 = 𝑎 + 𝜀/(4 𝑀) e, sapendo che 𝑓 è integrabile su
[𝑐, 𝑏], consideriamo una suddivisione 𝑄 𝜀 di [𝑐, 𝑏] tale che
𝜀
𝑆 ∗ ( 𝑓 , 𝑄 𝜀 ) − 𝑆∗ ( 𝑓 , 𝑄 𝜀 ) < .
2
Ma allora posto 𝑃𝜀 = {𝑎} ∪ 𝑄 𝜀 otteniamo:

𝑆∗ ( 𝑓 , 𝑃𝜀 ) = 𝑆∗ ( 𝑓 , 𝑄 𝜀 ) + (𝑐 − 𝑎) sup 𝑓 ≤ 𝑆∗ ( 𝑓 , 𝑄 𝜀 ) + 𝑀 · (𝑐 − 𝑎)
[𝑎,𝑐]

𝑆∗ ( 𝑓 , 𝑃𝜀 ) = 𝑆∗ ( 𝑓 , 𝑄 𝜀 ) + (𝑐 − 𝑎) inf 𝑓 ≥ 𝑆∗ ( 𝑓 , 𝑄 𝜀 ) − 𝑀 · (𝑐 − 𝑎)
[𝑎,𝑐]

da cui

𝑆 ∗ ( 𝑓 , 𝑃𝜀 ) − 𝑆∗ ( 𝑓 , 𝑃𝜀 ) ≤ 𝑆∗ ( 𝑓 , 𝑄 𝜀 ) − 𝑆∗ ( 𝑓 , 𝑄𝜀) + 2 𝑀 · (𝑐 − 𝑎)
𝜀 𝜀
< + 2𝑀 = 𝜀.
2 4𝑀
Dunque, la funzione 𝑓 è integrabile. Ma si ha

𝑏 𝑏
𝜀
∫ ∫
3 3
𝑓 ≤ 𝑆 ∗ ( 𝑓 , 𝑃𝜀 ) ≤ 𝑆 ∗ ( 𝑓 , 𝑄 𝜀 ) + ≤ 𝑆∗ ( 𝑓 , 𝑄 𝜀 ) + 𝜀 ≤ 𝑓 + 𝜀
𝑎 2 2 𝜀
𝑎+ 4 𝑀 2
𝑏 𝑏
𝜀
∫ ∫
3 3
𝑓 ≥ 𝑆∗ ( 𝑓 , 𝑃𝜀 ) ≥ 𝑆∗ ( 𝑓 , 𝑃𝜀 ) − ≥ 𝑆 ∗ ( 𝑓 , 𝑃𝜀 ) − 𝜀 ≥ 𝑓 − 𝜀
𝑎 2 2 𝜀
𝑎+ 4 𝑀 2

da cui, passando al limite per 𝜀 → 0+ , si ottiene


∫ 𝑏 ∫ 𝑏 ∫ 𝑏
lim+ 𝑓 ≤ 𝑓 ≤ lim+ 𝑓
𝑐→𝑎 𝑐 𝑎 𝑐→𝑎 𝑐

e quindi l’uguaglianza.

Esempio 6.19. La funzione


(
sin 1
𝑥 se 𝑥 ≠ 0,
𝑓 (𝑥) =
0 se 𝑥 = 0
6.2 integrale di Riemann 249

è integrabile su ogni intervallo chiuso e limitato [𝑎, 𝑏].

Dimostrazione. Su ogni intervallo [𝜀, 𝑏] con 𝜀 > 0 e 𝑏 > 𝜀 la funzione è integrabile


in quanto su tali intervalli è continua (la funzione è continua su tutto ℝ \ {0}).
Inoltre la funzione è limitata, quindi per il teorema precedente possiamo
concludere che è integrabile su [0 , 𝑏] per ogni 𝑏 > 0.

In maniera analoga (per simmetria) la funzione è integrabile su [𝑎, 0] per ogni


𝑎 < 0. Dunque, per additività, la funzione è integrabile su ogni [𝑎, 𝑏] con 𝑎 < 0
e 𝑏 > 0 e di conseguenza (sempre grazie al teorema 6.13) è integrabile su ogni
intervallo [𝑎, 𝑏].

Teorema 6.20 (del valor medio). Siano 𝑎, 𝑏 ∈ ℝ, 𝑎 < 𝑏 e sia 𝑓 : [𝑎, 𝑏] → ℝ una
funzione continua. Allora esiste un punto 𝑦 ∈ [𝑎, 𝑏] tale che
∫𝑏
𝑎
𝑓
= 𝑓 (𝑦).
𝑏−𝑎

La quantità
∫𝑏
𝑎
𝑓
𝑏−𝑎
si chiama valor medio integrale di 𝑓 su [𝑎, 𝑏] e spesso si indica con il simbolo
∫ 𝑏
− 𝑓.
𝑎

Dimostrazione. Per il teorema di Weierstrass la funzione 𝑓 ha massimo 𝑀 e


minimo 𝑚 sull’intervallo [𝑎, 𝑏] cosicché per ogni 𝑥 ∈ [𝑎, 𝑏] si avrà:

𝑚 ≤ 𝑓 (𝑥) ≤ 𝑀.

Risulta quindi, per la monotonia dell’integrale:


∫ 𝑏 ∫ 𝑏 ∫ 𝑏
(𝑏 − 𝑎)𝑚 = 𝑚≤ 𝑓 ≤ 𝑀 = (𝑏 − 𝑎)𝑀
𝑎 𝑎 𝑎

ovvero ∫𝑏
𝑎
𝑓
𝑚≤≤ 𝑀.
𝑏−𝑎
Dunque la media integrale è un valore intermedio tra il minimo e il massimo
della funzione e quindi, per il teorema dei valori intermedi, dovrà esistere un
punto 𝑦 ∈ [𝑎, 𝑏] dove la funzione assume tale valore.

Il seguente risultato è una versione continua della disuguaglianza di convessità


per le combinazioni baricentriche.
250 6 calcolo integrale

Teorema 6.21 (disuguaglianza di Jensen). Sia 𝑓 : [𝑎, 𝑏] → 𝐼 ⊆ ℝ una funzione


continua a valori in un intervallo 𝐼 e sia 𝜑 : 𝐼 → ℝ una funzione convessa e continua.
Sia inoltre 𝑔 : [𝑎, 𝑏] → ℝ una funzione continua tale che
∫ 𝑏
𝑔(𝑥) 𝑑𝑥 = 1
𝑎

Allora si ha ∫ 𝑏  ∫ 𝑏
𝜑 𝑓 (𝑥)𝑔(𝑥) 𝑑𝑥 ≤ 𝜑( 𝑓 (𝑥))𝑔(𝑥) 𝑑𝑥.
𝑎 𝑎

Nel caso particolare in cui si scelga 𝑔 la funzione costante 𝑔(𝑥) = 1/(𝑏 − 𝑎) si ottiene
la formulazione più espressiva:
∫ 𝑏  ∫ 𝑏
𝜑 − 𝑓 (𝑥) 𝑑𝑥 ≤ − 𝜑( 𝑓 (𝑥)) 𝑑𝑥.
𝑎 𝑎

Dimostrazione. Le ipotesi di continuità di 𝑓 , 𝑔 e 𝜑 sono sovrabbondanti, ma ci


servono per avere una garanzia immediata che entrambe le funzioni integrande
siano effettivamente Riemann-integrabili. Posto
∫ 𝑏
𝑦0 = 𝑓 (𝑥)𝑔(𝑥) 𝑑𝑥
𝑎

scegliamo una funzione affine 𝐿(𝑦) = 𝑚 𝑦 + 𝑞 tale che 𝐿(𝑦0 ) = 𝜑(𝑦0 ) e 𝐿(𝑦) ≤
𝜑(𝑦) per ogni 𝑦 ∈ 𝐼 (grazie al teorema 5.36). Per la linearità dell’integrale si ha:
∫ 𝑏 ∫ 𝑏 ∫ 𝑏
𝐿(𝑦0 ) = 𝑚 𝑓 (𝑥)𝑔(𝑥) 𝑑𝑥 + 𝑞 𝑔(𝑥) 𝑑𝑥 = 𝐿( 𝑓 (𝑥))𝑔(𝑥) 𝑑𝑥.
𝑎 𝑎 𝑎

Allora per la monotonia dell’integrale risulta


∫ 𝑏 ∫ 𝑏
𝜑(𝑦0 ) = 𝐿(𝑦0 ) = 𝐿( 𝑓 (𝑥))𝑔(𝑥) 𝑑𝑥 ≤ 𝜑( 𝑓 (𝑥))𝑔(𝑥) 𝑑𝑥.
𝑎 𝑎

6.3 teorema fondamentale del calcolo integrale


teor. fondamentale
Teorema 6.22 (Torricelli-Barrow: teorema fondamentale del calcolo integrale).
Sia 𝐼 ⊆ ℝ un intervallo, sia 𝑥 0 ∈ 𝐼 e sia 𝑓 : 𝐼 → ℝ una funzione continua. Allora la
funzione integrale funzione integrale 𝐹 : 𝐼 → ℝ
∫ 𝑥
𝐹(𝑥) = 𝑓
𝑥0

è ben definita, è derivabile e si ha per ogni 𝑥 ∈ 𝐼

𝐹0(𝑥) = 𝑓 (𝑥).

In particolare essendo 𝑓 ∈ 𝐶 0 (𝐼) si ha 𝐹 ∈ 𝐶 1 (𝐼).


6.3 teorema fondamentale del calcolo integrale 251

Inoltre se 𝐺 : 𝐼 → ℝ è una qualunque funzione tale che 𝐺0(𝑥) = 𝑓 (𝑥) per ogni 𝑥 ∈ 𝐼 ,
allora per ogni 𝑎, 𝑏 ∈ 𝐼 si ha formula fondamentale del calcolo integrale
∫ 𝑏
𝑓 = 𝐺(𝑏) − 𝐺(𝑎).
𝑎

Dimostrazione. Osserviamo innanzitutto che la funzione 𝑓 , essendo continua, è


integrabile
∫𝑥 su ogni intervallo chiuso e limitato contenuto in 𝐼 . Dunque l’integrale
𝑥
𝑓 è ben definito.
0

Per ogni ℎ ≠ 0, se 𝑥 + ℎ ∈ 𝐼 per l’additività dell’integrale si ha


∫ 𝑥+ℎ ∫𝑥 𝑥+ℎ
𝑓 − 𝑓

𝐹(𝑥 + ℎ) − 𝐹(𝑥) 𝑥0 𝑥0 𝑥
𝑓
= = .
ℎ ℎ ℎ
Applicando ora il teorema del valor medio possiamo affermare che esiste un
punto 𝜉(ℎ) nell’intervallo di estremi 𝑥 e 𝑥 + ℎ tale che
∫𝑥+ℎ
𝑥
𝑓
= 𝑓 (𝜉(ℎ)).

Per ℎ → 0, si ha 𝜉(ℎ) → 𝑥 e, per continuità di 𝑓 , 𝑓 (𝜉(ℎ)) → 𝑓 (𝑥). Dunque
abbiamo mostrato che 𝐹 è derivabile in 𝑥 :

𝐹(𝑥 + ℎ) − 𝐹(𝑥)
lim = 𝑓 (𝑥)
ℎ→0 ℎ

e 𝐹0(𝑥) = 𝑓 (𝑥).

Dunque se 𝑎, 𝑏 ∈ 𝐼 sono punti qualunque si ha:


∫ 𝑏 ∫ 𝑏 ∫ 𝑎
𝑓 = 𝑓 − 𝑓 = 𝐹(𝑏) − 𝐹(𝑎).
𝑎 𝑥0 𝑥0

E se 𝐺 : 𝐼 → ℝ è una qualunque funzione tale che 𝐺0(𝑥) = 𝑓 (𝑥) si avrà


𝐺0(𝑥) = 𝐹0(𝑥) per ogni 𝑥 ∈ 𝐼 e dunque (𝐺 − 𝐹)0 = 0 su 𝐼 . Per i criteri di
monotonia possiamo concludere che 𝐺 − 𝐹 è costante su 𝐼 : 𝐺 − 𝐹 = 𝑐 . Dunque
si ha
∫ 𝑏
𝑓 = 𝐹(𝑏) − 𝐹(𝑎) = (𝐺(𝑏) − 𝑐) − (𝐺(𝑎) − 𝑐) = 𝐺(𝑏) − 𝐺(𝑎).
𝑎

Esempio 6.23. Si voglia calcolare


∫ 𝑏
𝑥 2 𝑑𝑥.
0
252 6 calcolo integrale

Basterà osservare che posto 𝐺(𝑥) = 𝑥3 si ha 𝐺0(𝑥) = 𝑥 2 e quindi, grazie alla formula
3

fondamentale del calcolo integrale si ha

𝑏
𝑏3

𝑥 2 𝑑𝑥 = 𝐺(𝑏) − 𝐺(0) = .
0 3

E’ evidente quanto questo metodo risolutivo sia molto più semplice e potente di quello
utilizzato nell’esempio 6.7.

Definizione 6.24 (primitiva). Sia 𝐴 ⊆ ℝ e sia 𝑓 : 𝐴 → ℝ una funzione qualunque.


primitiva Una funzione 𝐹 : 𝐴 → ℝ si dice essere una primitiva (o antiderivata) di 𝑓 se 𝐹 è
derivabile e 𝐹0(𝑥) = 𝑓 (𝑥) per ogni 𝑥 ∈ 𝐴.

Il teorema fondamentale del calcolo integrale può dunque essere espresso nel
modo seguente: ogni funzione 𝑓 continua, definita su un intervallo, ammette
almeno una primitiva e se 𝐹 è una qualunque primitiva di 𝑓 si ha
∫ 𝑏
𝑓 = 𝐹(𝑏) − 𝐹(𝑎).
𝑎

Per indicare la differenza 𝐹(𝑏) − 𝐹(𝑎) si usano talvolta le seguenti notazioni:

[𝐹(𝑥)]𝑏𝑥=𝑎 = [𝐹]𝑏𝑎 = 𝐹(𝑥)| 𝑏𝑥=𝑎 = 𝐹| 𝑏𝑎 = 𝐹(𝑏) − 𝐹(𝑎).

Il calcolo degli integrali si riduce quindi alla determinazione delle primitive


ovvero ad invertire l’operatore di derivata. Risulterà quindi importante avere
degli strumenti per determinare le primitive di una funzione.

Definizione 6.25 (integrale indefinito). L’insieme di tutte le primitive di una


funzione 𝑓 : 𝐴 → ℝ si indica con il simbolo
∫ ∫
𝑓 oppure 𝑓 (𝑥) 𝑑𝑥

e si chiama integrale indefinito. Il motivo di questa notazione (e del nome) deriva


dal teorema fondamentale del calcolo integrale, in base al quale se 𝑓 : [𝑎, 𝑏] → ℝ è
continua si ha ∫ ∫  𝑏 𝑏
𝑓 = 𝑓 .
𝑎 𝑎

Osservazione 6.26. Si faccia attenzione però che nel caso di funzioni non continue è
possibile che le funzioni integrali non siano primitive. Ad esempio se si∫ prende la funzione
𝑥
di Heaviside 𝐻(𝑥) definita nell’esempio 6.17 si può osservare che 0 𝐻(𝑡) 𝑑𝑡 = |𝑥| è
una funzione integrale ma non è una primitiva (e l’insieme delle primitive, in questo
caso, è vuoto).

Se pensiamo all’operatore∫lineare 𝐷 definito sull’insieme delle funzioni derivabili


𝐷 𝑓 = 𝑓 0 si può pensare a 𝑓 come all’insieme delle controimmagini di 𝑓 tramite
𝐷 ovvero: ∫
𝑓 = 𝐷 −1 ({ 𝑓 }) = {𝐹 : 𝐷𝐹 = 𝑓 }.
6.3 teorema fondamentale del calcolo integrale 253


Dunque 𝑓 è l’insieme delle soluzioni 𝐹 dell’equazione lineare non omogenea
𝐷𝐹 = 𝑓 . L’equazione omogenea associata è 𝐷𝐹 = 0. Se le funzioni sono
definite su un intervallo allora le soluzioni dell’equazione omogenea sono le
costanti
∫ (come enunciato nel seguente teorema). Dunque in tal caso lo spazio
𝑓 è uno spazio affine di dimensione 1 parallelo allo spazio vettoriale delle
funzioni costanti. Ma se scegliamo un dominio che non è un intervallo (come
nell’esempio 6.28) si avrà uno spazio la cui dimensione è pari al numero di
intervalli che compongono il dominio.

Teorema 6.27 (proprietà delle primitive). Sia 𝑓 : 𝐼 → ℝ una funzione continua


definita su un intervallo non vuoto 𝐼 ⊆ ℝ. Allora

1. esiste almeno una primitiva 𝐹 di 𝑓 ;


2. data una primitiva 𝐹 di 𝑓 ogni altra primitiva 𝐺 differisce da 𝐹 per una costante:
∃𝑐 ∈ ℝ : 𝐺 = 𝐹 + 𝑐 .

Detto in altri termini se 𝑓 è continua 𝑓 non è vuoto e se inoltre il dominio di 𝑓 è un

intervallo e 𝐹 ∈ 𝑓 è una qualunque primitiva, allora

𝑓 = {𝐹 + 𝑐 : 𝑐 ∈ ℝ}.

Osserviamo che l’insieme delle funzioni costanti su un intervallo non è altro che
ker 𝐷 ovvero lo spazio di annullamento dell’operatore derivata. Stiamo dunque
semplicemente osservando che le controimmagini di un operatore lineare sono
spazi affini paralleli al nucleo dell’operatore.

Dimostrazione. Scelto un punto 𝑥 0 ∈ 𝐼 possiamo considerare la funzione


integrale ∫ 𝑥
𝐹(𝑥) = 𝑓 (𝑡) 𝑑𝑡.
𝑥0

Il teorema fondamentale del calcolo integrale ci assicura che 𝐹 è una primitiva


di 𝑓 .

Viceversa se 𝐹 e 𝐺 sono due primitive di 𝑓 allora si ha:

𝐹 0 = 𝐺0 = 𝑓 .

Posto 𝐻 = 𝐺−𝐹 avremo quindi 𝐻 0 = 0 sull’intervallo 𝐼 . Per i criteri di monotonia


sappiamo quindi che 𝐻 è costante, ovvero esiste 𝑐 ∈ ℝ tale che 𝐻(𝑥) = 𝑐 per
ogni 𝑥 ∈ 𝐼 . Dunque si ottiene, come voluto: 𝐺 = 𝐹 + 𝐻 = 𝐹 + 𝑐 .

Se la funzione 𝑓 non è definita su un intervallo l’insieme delle primitive avrà


dimensione maggiore di 1, come si vede nel seguente.

Esempio 6.28 (primitive sugli insiemi non connessi). Consideriamo la funzione


𝑓 (𝑥) = 1/𝑥 . Osserviamo che 𝑓 : (−∞, 0) ∪ (0, +∞) → ℝ è definita sull’unione di due
intervalli. Per verifica diretta possiamo osservare che la funzione 𝐹(𝑥) = ln |𝑥| è una
primitiva di 𝑓 . Per ottenere l’insieme di tutte le primitive possiamo aggiungere ad 𝐹
una qualunque funzione con derivata nulla sul dominio di 𝑓 . Le funzioni con derivata
254 6 calcolo integrale

nulla sono costanti su ogni intervallo e quindi troviamo che per ogni 𝑐 1 , 𝑐 2 ∈ ℝ la
funzione (
ln(𝑥) + 𝑐 1 se 𝑥 > 0 ,
𝐺(𝑥) =
ln(−𝑥) + 𝑐 2 se 𝑥 < 0

è una primitiva di 𝑓 e non ci sono altre primitive.


In questo caso lo spazio delle primitive ha dimensione 2 in quanto il nucleo dell’operatore
derivata sullo spazio delle funzioni definite sull’unione di due intervalli ha dimensione 2.
Questo è l’esempio più semplice di un fenomeno piuttosto generale per cui gli operatori
differenziali su un certo spazio risultano strettamente legati alla topologia dello spazio
stesso. In questo caso la dimensione del nucleo dell’operatore derivata 𝐷 è uguale al
numero di componenti connesse del dominio delle funzioni nel dominio di 𝐷 .

6.4 calcolo delle primitive



Come già detto utilizzeremo la notazione 𝑓 per indicare le primitive della

funzione 𝑓 . Ma invece di scrivere 𝐹 ∈ 𝑓 per indicare che 𝐹 è una primitiva

di 𝑓 potremo scrivere più semplicemente ma con abuso di notazione 𝑓 = 𝐹
ricordando (come facevamo con la notazione degli 𝑜 -piccolo) che tale relazione
non è affatto simmetrica. Tradizionalmente si scrive

cos 𝑥 𝑑𝑥 = sin 𝑥 + 𝑐 (6.12)

ma potremmo anche scrivere più semplicemente:



cos 𝑥 𝑑𝑥 = sin 𝑥. (6.13)

Il modo di scrivere (6.12) è solo apparen-


temente migliore di (6.13) in quanto in
alcuni casi non tutte le primitive posso
essere determinate a meno di una costan- Teorema 6.29 (primitive di alcune funzioni elementari). Si ha per ogni 𝛼 ∈ ℝ,
te (si veda l’esempio 6.28). Vale quindi 𝛼 ≠ −1
la regola (valida in generale per tutte le
notazioni che richiedono una interpreta- 𝑥 𝛼+1
∫ ∫
𝛼 1
zione) di usare con cautela e cognizione 𝑥 𝑑𝑥 3 , 𝑑𝑥 3 ln |𝑥|
di causa la notazione degli integrali in-
𝛼+1 𝑥
∫ ∫ ∫
definiti: bisogna essere consapevoli del 𝑥 𝑥
significato di quello che scriviamo e dob-
𝑒 𝑑𝑥 3 𝑒 , cos 𝑥 𝑑𝑥 3 sin 𝑥, sin 𝑥 𝑑𝑥 3 − cos 𝑥
biamo utilizzare una notazione che sia ∫ ∫
comprensibile a chi ci ascolta. cosh 𝑥 𝑑𝑥 3 sinh 𝑥, sinh 𝑥 𝑑𝑥 3 cosh 𝑥,
∫ ∫
1 1
𝑑𝑥 3 arctg 𝑥, √ 𝑑𝑥 3 arcsin 𝑥,
1 + 𝑥2 1 − 𝑥2

1  √ 
√ 𝑑𝑥 3 settsinh 𝑥 = ln 𝑥 + 𝑥 2 + 1
𝑥2 + 1

1  √ 
√ 𝑑𝑥 3 settcosh 𝑥 = ln 𝑥 + 𝑥 2 − 1 .
𝑥2 − 1

Dimostrazione. E’ sufficiente fare riferimento alla corrispondente tabella delle


derivate delle funzioni elementari (teorema 5.8).
6.4 calcolo delle primitive 255

Teorema 6.30 (linearità dell’integrale indefinito). Per ogni 𝜆, 𝜇 ∈ ℝ e se 𝑓 , 𝑔 sono


funzioni qualunque si ha:
∫ ∫ ∫
(𝜆 𝑓 + 𝜇𝑔) ⊇ 𝜆 𝑓 +𝜇 𝑔

Dimostrazione. Ogni elemento∫dell’insieme


∫ che si trova sul lato destro si scrive
nella forma 𝜆𝐹 + 𝜇𝐺 con 𝐹 ∈ 𝑓 e 𝐺 ∈ 𝑔 . Dunque si ha 𝐹0 = 𝑓 e 𝐺0 = 𝑔 da
cui
(𝜆𝐹 + 𝜇𝐺)0 = 𝜆 𝑓 + 𝜇𝑔
e quindi ∫
𝜆𝐹 + 𝜇𝐺 ∈ (𝜆 𝑓 + 𝜇𝑔)

come dovevamo dimostrare.

Teorema 6.31 (cambio di variabile negli integrali). Valgono le seguenti proprietà:


sostituzione diretta
1. se 𝑔 : 𝐴 → ℝ è derivabile e 𝑓 : 𝑔(𝐴) → ℝ allora
∫ ∫ 
0
𝑓 (𝑔(𝑥))𝑔 (𝑥) 𝑑𝑥 ⊇ 𝑓 (𝑦) 𝑑𝑦
𝑦=𝑔(𝑥)

dove si intende
[𝐹(𝑦)] 𝑦=𝑔(𝑥) = 𝐹(𝑔(𝑥));
cambio di variabile
2. se 𝑔 ∈ 𝐶 1 ([𝑎, 𝑏]) e 𝑓 ∈ 𝐶 0 (𝑔([𝑎, 𝑏])) allora
∫ 𝑔(𝑏) ∫ 𝑏
𝑓 (𝑥) 𝑑𝑥 = 𝑓 (𝑔(𝑡)) 𝑔 0(𝑡) 𝑑𝑡 ;
𝑔(𝑎) 𝑎

3. se 𝑔 ∈ 𝐶 1 ([𝑎, 𝑏]) è iniettiva, 𝑓 ∈ 𝐶 0 (𝑔([𝑎, 𝑏])) allora 𝑔 −1 è definita su 𝑔([𝑎, 𝑏]) sostituzione inversa
e si ha ∫ ∫ 
𝑓 (𝑥) 𝑑𝑥 ⊇ 𝑓 (𝑔(𝑡))𝑔 0(𝑡) 𝑑𝑡 (6.14)
𝑡=𝑔 −1 (𝑥)

Dimostrazione. Per la prima parte basta osservare che se 𝐹(𝑦) è una qualunque
primitiva di 𝑓 (𝑦) allora 𝐹(𝑔(𝑥)) è una primitiva di 𝑓 (𝑔(𝑥)) · 𝑔 0(𝑥) (basta applicare
la formula di derivazione della funzione composta). Dunque ogni elemento
dell’insieme di destra in (6.14) è elemento dell’insieme di sinistra.

Per la seconda parte sappiamo che 𝑓 , essendo continua, ammette almeno una
primitiva 𝐹(𝑥). Per il punto precedente sappiamo che 𝐹(𝑔(𝑡)) è una primitiva
di 𝑓 (𝑔(𝑡))𝑔 0(𝑡) (basta farne la derivata per verificarlo). Dunque, utilizzando la
formula fondamentale del calcolo, si ottiene:
∫ 𝑔(𝑏)
𝑔(𝑏)
𝑓 (𝑥) 𝑑𝑥 = [𝐹(𝑥)] 𝑔(𝑎) = 𝐹(𝑔(𝑏)) − 𝐹(𝑔(𝑎))
𝑔(𝑎)

e ∫ 𝑏
𝑓 (𝑔(𝑡))𝑔 0(𝑡) 𝑑𝑡 = [𝐹(𝑔(𝑡))]𝑏𝑎 = 𝐹(𝑔(𝑏)) − 𝐹(𝑔(𝑎)).
𝑎
256 6 calcolo integrale

Le due espressioni sono uguali, come volevamo dimostrare.

Per la terza parte sia 𝐹 una qualunque funzione elemento dell’insieme sul lato
destro della relazione che vogliamo dimostrare. Si avrà 𝐹(𝑥) = 𝐻(𝑔 −1 (𝑥)) con
𝐻(𝑡) primitiva di 𝑓 (𝑔(𝑡))𝑔 0(𝑡). Ma allora, per la formula fondamentale del
calcolo integrale, si ha
∫ 𝑡
𝐻(𝑡) − 𝐻(𝑎) = 𝑓 (𝑔(𝑠))𝑔 0(𝑠) 𝑑𝑠
𝑎

da cui
∫ 𝑔 −1 (𝑥)
𝐹(𝑥) − 𝐹(𝑔(𝑎)) = 𝐻(𝑔 −1 (𝑥)) − 𝐻(𝑎) = 𝑓 (𝑔(𝑡))𝑔 0(𝑡) 𝑑𝑡
𝑎

utilizzando il punto precedente sappiamo però che vale


∫ 𝑔 −1 (𝑥) ∫ 𝑥
𝐹(𝑥) − 𝐹(𝑔(𝑎)) = 𝑓 (𝑔(𝑡))𝑔 0(𝑡) 𝑑𝑡 = 𝑓 (𝑠) 𝑑𝑠.
𝑎 𝑔(𝑎)

Dunque derivando ambo i membri, grazie ancora al teorema fondamentale


otteniamo:
𝐹0(𝑥) = 𝑓 (𝑥)

cioè 𝐹 ∈ 𝑓 , come dovevamo dimostrare.

Le formule del teorema precedente si scrivono usualmente nella forma


∫ ∫
0
𝑓 (𝑔(𝑥))𝑔 (𝑥) 𝑑𝑥 = 𝑓 (𝑦) 𝑑𝑦

dove si intende che le variabili 𝑥 e 𝑦 devono soddisfare la relazione 𝑦 = 𝑔(𝑥)


(o, viceversa, 𝑥 = 𝑔 −1 (𝑦)). Per memorizzare tale formula si usa normalmente
definire il differenziale di una funzione 𝑔 come 𝑑𝑔(𝑥) = 𝑔 0(𝑥) 𝑑𝑥 (coerentemente
con la notazione 𝑔 0 = 𝑑𝑔/𝑑𝑥 ) cosicché se 𝑦 = 𝑔(𝑥) si ha 𝑑𝑦 = 𝑔 0(𝑥) 𝑑𝑥 . Non
daremo qui una definizione formale di cosa sia un differenziale ma senz’altro
utilizzeremo questa comoda notazione, pensandola semplicemente come una
facilitazione tipografica.

Esercizio 6.32. Vogliamo calcolare



cos2 (𝑥) 𝑑𝑥.

Ricordando che cos(2𝑡) = cos2 𝑡 − sin2 𝑡 = 2 cos2 𝑡 − 1 si ha cos2 𝑡 = (1 + cos(2𝑡))/2


(formula di bisezione). Dunque

1 + cos(2𝑡) cos(2𝑡)
∫ ∫ ∫ ∫
1
cos2 (𝑡) 𝑑𝑡 = 𝑑𝑡 = 𝑑𝑡 + 𝑑𝑡.
2 2 2
6.4 calcolo delle primitive 257


Chiaramente 12 𝑑𝑡 = 𝑡/2. Nel secondo integrale possiamo fare un cambio di variabile,
ponendo 2𝑡 = 𝑠 da cui 2 𝑑𝑡 = 𝑑𝑠 :

cos(2𝑡)
∫ ∫ ∫ 
1 1 1
𝑑𝑡 = cos(2𝑡) 2 𝑑𝑡 = cos 𝑠 𝑑𝑠 = [sin 𝑠]𝑠=2𝑡
2 4 4 𝑠=2𝑡
4
1 1
= sin(2𝑡) = sin 𝑡 cos 𝑡.
4 2
In definitiva otteniamo

𝑡 + sin 𝑡 cos 𝑡

cos2 (𝑥) 𝑑𝑥 = .
2

Esempio 6.33. Vogliamo calcolare


∫ √
1 − 𝑥 2 𝑑𝑥.

La funzione integranda è definita per 𝑥 ∈ [−1 , 1]. Ci viene in mente di operare la


sostituzione 𝑥 = sin 𝑡 con 𝑡 ∈ [−𝜋/2 , 𝜋/2]. Osserviamo che su [−𝜋/2 , 𝜋/2] la
funzione sin 𝑡 è derivabile, invertibile e la sua inversa è 𝑡 = arcsin 𝑥 . Informalmente si
ha
𝑥 = sin 𝑡, 𝑑𝑥 = cos 𝑡 𝑑𝑡
da cui si ottiene la formula
∫ √ ∫ q 
1− 𝑥2 𝑑𝑥 = 1 − sin (𝑡) cos 𝑡 𝑑𝑡
2
.
𝑡=arcsin 𝑥
p
Osserviamo ora che per 𝑡 ∈ [−𝜋/2 , 𝜋/2] risulta 1 − sin2 (𝑡) = cos 𝑡 e dunque
l’integrale diventa
∫ q ∫
1 − sin (𝑡) cos 𝑡 𝑑𝑡 =
2
cos2 (𝑡) 𝑑𝑡.

Quest’ultimo integrale lo abbiamo calcolato nell’esercizio precedente. Dunque otteniamo:


∫ √
𝑡 + sin 𝑡 cos 𝑡

(𝑥=sin 𝑡)
1− 𝑥2 𝑑𝑥 = cos2 (𝑡) 𝑑𝑡 =
2

𝑡 + (sin 𝑡) 1 − sin 𝑡 2
=
2

(𝑡=arcsin 𝑥) arcsin 𝑥 + 𝑥 1 − 𝑥 2
= .
2


Si osservi che il grafico 𝑦 = 1 − 𝑥 2 dell’esempio precedente è una semicircon-
ferenza e dunque l’integrale
" √ #1
∫ 1 √ arcsin 𝑥 + 𝑥 1 − 𝑥 2 𝜋
1 − 𝑥 𝑑𝑥 =
2 = .
−1 2 2
−1

rappresenta l’area di un semicerchio unitario.


integrale per parti
258 6 calcolo integrale

Teorema 6.34 (integrazione per parti). Sia 𝑓 : 𝐴∫ ⊆ ℝ → ℝ una funzione qualunque,


sia 𝑔 : 𝐴 → ℝ una funzione derivabile e sia 𝐹 ∈ 𝑓 . Allora
∫ ∫
𝑓 ·𝑔 ⊇𝐹·𝑔− 𝐹 · 𝑔0.


In particolare se 𝑓 ∈ 𝐶 0 ([𝑎, 𝑏]) e 𝑔 ∈ 𝐶 1 ([𝑎, 𝑏]) e 𝐹 ∈ 𝑓 , si ha
∫ 𝑏 ∫ 𝑏
𝑓 · 𝑔 = [𝐹 · 𝑔]𝑏𝑎 − 𝐹 · 𝑔0.
𝑎 𝑎

Dimostrazione.
∫ Ogni funzione dell’insieme di destra si scrive nella forma 𝐹 · 𝑔 −𝐻
con 𝐻 ∈ 𝐹 · 𝑔 0. Dunque 𝐻 0 = 𝐹 · 𝑔 0 e, per ipotesi, 𝐹0 = 𝑓 da cui

(𝐹 · 𝑔 − 𝐻)0 = 𝐹0 · 𝑔 + 𝐹 · 𝑔 0 − 𝐻 0 = 𝐹0 · 𝑔 = 𝑓 · 𝑔

che è quanto dovevamo dimostrare.

La seconda parte del teorema deriva direttamente dalla formula fondamentale


del calcolo integrale (valida in quanto sia 𝑓 · 𝑔 che 𝐹 · 𝑔 0 sono funzioni continue),
osservando che
 ∫ 𝑏 ∫ 𝑏
𝐹·𝑔− 𝐹 · 𝑔0 = [𝐹 · 𝑔]𝑏𝑎 − 𝐹 · 𝑔0.
𝑎 𝑎

Esempio 6.35. Si voglia calcolare



𝑥 cos 𝑥 𝑑𝑥.

Il metodo di integrazione per parti ci permette di ricondurre l’integrale di un prodotto


ad un integrale di un prodotto in cui uno dei fattori viene integrato e l’altro derivato. In
questo caso sarà conveniente derivare il fattore 𝑥 e integrare il fattore cos 𝑥 in modo da
ricondursi all’integrale di 1 · sin 𝑥 , che sappiamo svolgere. Precisamente si ha
∫ ∫
𝑥 cos 𝑥 𝑑𝑥 = 𝑥 sin 𝑥 − 1 · sin 𝑥 𝑑𝑥 = 𝑥 sin 𝑥 + cos 𝑥.

Esempio 6.36. Si voglia calcolare



𝑒 𝑥 cos 𝑥 𝑑𝑥.

In questo caso
∫ se utilizziamo l’integrazione per parti possiamo ricondurre questo
integrale a 𝑒 𝑥 sin 𝑥 . Integrando ancora per parti ci si ricondurrà nuovamente ad
𝑒 𝑥 cos 𝑥 . Se però in questi passaggi si riottiene la quantità originale con un segno

cambiato, si potrà risolvere l’equazione ottenuta per trovare il risultato cercato.


6.4 calcolo delle primitive 259

Precisamente:
∫ ∫
𝑥 𝑥
𝑒 cos 𝑥 𝑑𝑥 = 𝑒 sin 𝑥 − 𝑒 𝑥 sin 𝑥 𝑑𝑥
 ∫ 
𝑥 𝑥 𝑥
= 𝑒 sin 𝑥 − 𝑒 (− cos 𝑥) − 𝑒 (− cos 𝑥) 𝑑𝑥

= 𝑒 𝑥 sin 𝑥 + 𝑒 𝑥 cos 𝑥 − 𝑒 𝑥 cos 𝑥 𝑑𝑥

da cui: ∫
2· 𝑒 𝑥 cos 𝑥 𝑑𝑥 = 𝑒 𝑥 sin 𝑥 + 𝑒 𝑥 cos 𝑥

ovvero
𝑒 𝑥 (sin 𝑥 + cos 𝑥)

𝑒 𝑥 cos 𝑥 𝑑𝑥 = .
2

Teorema 6.37 (ancora primitive di funzioni elementari). Si ha



ln 𝑥 𝑑𝑥 = 𝑥 ln 𝑥 − 𝑥,
∫ √
arctg 𝑥 𝑑𝑥 = 𝑥 arctg 𝑥 − ln 1 + 𝑥 2 ,
∫ √
arcsin 𝑥 𝑑𝑥 = 𝑥 arcsin 𝑥 + 1 − 𝑥 2 ,
∫ √
arccos 𝑥 𝑑𝑥 = 𝑥 arccos 𝑥 − 1 − 𝑥 2 .

Dimostrazione. L’idea, in tutti i casi, è che la derivata della funzione integranda


è molto più semplice della funzione stessa (nei primi due casi è una funzione
razionale negli altri due una funzione irrazionale ma non trascendente). Può
quindi risultare utile applicare l’integrazione per parti nella forma:
∫ ∫ ∫
𝑓 (𝑥) 𝑑𝑥 = 1 · 𝑓 (𝑥) 𝑑𝑥 = 𝑥 𝑓 (𝑥) − 𝑥 𝑓 0(𝑥) 𝑑𝑥.

Nel primo caso si ha:


∫ ∫ ∫
1
ln 𝑥 𝑑𝑥 = 𝑥 ln 𝑥 − 𝑥 𝑑𝑥 = 𝑥 ln 𝑥 − 1 𝑑𝑥 = 𝑥 ln 𝑥 − 𝑥.
𝑥

Nel secondo caso:


𝑥
∫ ∫
arctg 𝑥 𝑑𝑥 = 𝑥 arctg 𝑥 − 𝑑𝑥.
1 + 𝑥2

Operiamo quindi un cambio di variabile 𝑦 = 1 + 𝑥 2 :

𝑥
∫ ∫ ∫
1 1 𝑦=1+𝑥 2 1 1
𝑑𝑥 = 2 𝑥 𝑑𝑥 = 𝑑𝑦
1+𝑥 2 2 1+𝑥 2 2 𝑦
ln 𝑦 1
= ln 1 + 𝑥 2

=
2 2
260 6 calcolo integrale

da cui, in conclusione:

1
arctg 𝑥 𝑑𝑥 = 𝑥 arctg 𝑥 − ln 1 + 𝑥 2 .

2

Nel terzo caso:


𝑥
∫ ∫
1 · arcsin 𝑥 𝑑𝑥 = 𝑥 · arcsin 𝑥 − √ 𝑑𝑥
1 − 𝑥2

e operando la sostituzione 𝑦 = 1 − 𝑥 2 si arriva a


∫ √
arcsin 𝑥 𝑑𝑥 = 𝑥 · arcsin 𝑥 + 1 − 𝑥 2 .

L’ultimo integrale si svolge in maniera analoga.

Osservazione 6.38. Se si applica il metodo di integrazione per parti nella ricerca


1 1 1
della primitiva della funzione 𝑥 ln 𝑥 , integrando il fattore 𝑥 e derivando il fattore ln 𝑥 si
ottiene un fenomeno a prima vista sconcertante:
∫ ∫ 1
1 1 𝑥
𝑑𝑥 = ln 𝑥 · − ln 𝑥 · 𝑑𝑥
𝑥 ln 𝑥 ln 𝑥 − ln 2
𝑥

1
=1+ 𝑑𝑥.
𝑥 ln 𝑥

Si potrebbe infatti pensare di poter semplificare gli integrali ai due lati dell’uguaglianza
per ottenere 0 = 1. Questo non si può fare perché, ricordiamolo, l’integrale indefinito
1
è un insieme di funzioni (le primitive della funzione 𝑥 ln 𝑥 in questo caso) e sappiamo
che sommando una costante ad una primitiva si ottiene un’altra primitiva. Quindi
non ci deve stupire il fatto che sommando 1 all’insieme delle primitive questo rimanga
invariato.

Per la cronaca: l’integrale in questione può essere calcolato per sostituzione, ponendo
𝑦 = ln 𝑥 trovando 𝐹(𝑥) = ln | ln 𝑥| come una delle primitive.

6.5 integrale di una funzione razionale

In questa sezione presenteremo un metodo per calcolare esplicitamente l’inte-


grale di una qualunque funzione razionale.
funzione razionale
Definizione 6.39 (funzione razionale). Una funzione 𝑓 : 𝐴 ⊆ ℝ → ℝ si dice essere
razionale se si può scrivere nella forma

𝑃(𝑥)
𝑓 (𝑥) =
𝑄(𝑥)

con 𝑃 e 𝑄 funzioni polinomiali a coefficienti reali.

Il metodo che andremo a presentare può essere utilizzato “alla cieca” in quanto
una volta trovata la decomposizione non c’è bisogno di sapere come mai il
6.5 integrale di una funzione razionale 261

metodo utilizzato funziona (e perché funziona sempre). La dimostrazione del


perché questo metodo funzioni è un esercizio non banale di algebra lineare a
cui dedicheremo il resto di questo capitolo perché, tutto sommato, pensiamo
che sia sempre utile avere la consapevolezza degli strumenti che si utilizzano.

Prima ancora di enunciare il teorema e di farne la dimostrazione, vogliamo


presentare il metodo tramite un esempio. Probabilmente questo è il modo più
semplice per capire come bisogna operare.

Esempio 6.40. Calcolare

𝑥 10 − 3 𝑥 5 + 1

𝑑𝑥
𝑥 8 − 𝑥 7 + 2𝑥 6 − 2𝑥 5 + 𝑥 4 − 𝑥 3

Svolgimento. Per prima cosa vogliamo ricondurci ad una funzione razionale in


cui il grado del polinomio al numeratore sia inferiore al grado del polinomio al
denominatore. Per fare questo svolgiamo la divisione tra polinomi (teorema 4.8):
:

𝑥 10 − 3 𝑥 5 + 1 𝑥4 + 1
= 𝑥2 + 𝑥 + 8 .
𝑥8 − 𝑥7 + 2𝑥 − 2𝑥 + 𝑥 − 𝑥
6 5 4 3 𝑥 − 𝑥 + 2𝑥 6 − 2𝑥 5 + 𝑥 4 − 𝑥 3
7

L’integrale di 𝑥 2 + 𝑥 è immediato e quindi ci possiamo concentrare sulla funzione


razionale con numeratore 𝑥 4 + 1. Per procedere è ora necessario determinare
tutte le radici, reali e complesse, del polinomio a denominatore in modo da
poterlo fattorizzare come prodotto di fattori lineari e quadratici (teorema 4.21).
Non c’è un metodo generale per trovare le radici di un polinomio. In questo
caso particolare si osserva che il polinomio è divisibile per 𝑥 3 . Poi si osserva
che il polinomio di quinto grado risultante si annulla per 𝑥 = 1 (caso fortunato!)
ed è quindi divisibile per 𝑥 − 1 (teorema 4.10 di Ruffini). Il polinomio di quarto
grado risulta infine un quadrato perfetto e si ottiene quindi la fattorizzazione
cercata:
𝑥 8 − 𝑥 7 + 2 𝑥 6 − 2 𝑥 5 + 𝑥 4 − 𝑥 3 = 𝑥 3 (𝑥 − 1)(𝑥 2 + 1)2 .
Ora il teorema di decomposizione di Hermite (teorema 6.43 che andremo poi a
dimostrare) ci garantisce che ogni funzione razionale della forma

𝑃(𝑥)
𝑥 3 (𝑥 − 1)(𝑥 2 + 1)2

con deg 𝑃 < 8 (il grado del denominatore) può essere scritto nel modo seguente,
con opportune costanti 𝐴, 𝐵, 𝐶, . . . , 𝐻 :
0
𝐴 𝐵 𝐶𝑥 + 𝐷 𝐸𝑥 3 + 𝐹𝑥 2 + 𝐺𝑥 + 𝐻

+ + 2 + . (6.15)
𝑥 𝑥−1 𝑥 +1 𝑥 2 (𝑥 2 + 1)

I primi addendi hanno a denominatore i fattori in cui abbiamo decomposto il


denominatore della funzione originale. A numeratore c’è sempre un polinomio
di grado inferiore al grado del denominatore e quindi c’è una costante sopra i
fattori lineari e una funzione lineare sopra i termini quadratici. Dopodiché si
aggiunge la derivata di una funzione razionale in cui il denominatore ha gli
stessi fattori ma elevati ad una potenza di uno inferiore a quella che c’era nel
262 6 calcolo integrale

polinomio originale. A numeratore, di nuovo, un generico polinomio di grado


inferiore al denominatore. Per trovare i coefficienti 𝐴, 𝐵, 𝐶, . . . , 𝐻 (il numero
dei coefficienti è pari al grado del polinomio a denominatore) è sufficiente
svolgere la derivata in (6.15) mettere a denominatore comune tutti gli addendi
Nello svolgere la derivata della funzione e uguagliare con la funzione razionali originale:
razionale è conveniente considerare la
funzione razionale come il prodotto del 𝐴 𝐵 𝐶𝑥 + 𝐷 3𝐸𝑥 2 + 2𝐹𝑥 + 𝐺
numeratore per i reciproci dei fattori a + + 2 +
denominatore ed utilizzare la formula 𝑥 𝑥−1 𝑥 +1 𝑥 2 (𝑥 2 + 1)
−2 𝑥
 
per la derivata di un prodotto (invece che −2 1 1
la formula per la derivata del rapporto) + (𝐸𝑥 + 𝐹𝑥 + 𝐺𝑥 + 𝐻) ·
3 2
· + ·
𝑥 3 𝑥 2 + 1 𝑥 2 (1 + 𝑥 2 )2

moltiplicando tutto per 𝑥 3 (𝑥 − 1)(𝑥 2 + 1)2 si ottiene

𝐴𝑥 2 (𝑥 − 1)(𝑥 2 + 1)2 + 𝐵𝑥 3 (𝑥 2 + 1)2


+ (𝐶𝑥 + 𝐷)𝑥 3 (𝑥 − 1)(𝑥 2 + 1) + (3𝐸𝑥 2 + 2𝐹𝑥 + 𝐺)𝑥(𝑥 − 1)(𝑥 2 + 1)
+ (𝐸𝑥 3 + 𝐹𝑥 2 + 𝐺𝑥 + 𝐻)(−2(𝑥 − 1)(𝑥 2 + 1) − 2 𝑥 · 𝑥(𝑥 − 1))

ovvero

(𝐴 + 𝐵 + 𝐶)𝑥 7 + (−𝐴 − 𝐶 + 𝐷 − 𝐸)𝑥 6 + (2𝐴 + 2𝐵 + 𝐶 − 𝐷 + 𝐸 − 2𝐹)𝑥 5


+ (−2𝐴 − 𝐶 + 𝐷 + 𝐸 + 2𝐹 − 3𝐺)𝑥 4 + (𝐴 + 𝐵 − 𝐷 − 𝐸 + 3𝐺 − 4𝐻)𝑥 3
+ (−𝐴 − 𝐺 + 4𝐻)𝑥 2 + (𝐺 − 2𝐻)𝑥 + 2𝐻.

Ora imponiamo che quest’ultimo polinomio sia identicamente uguale al


polinomio originario 𝑥 4 + 1 ottenendo il seguente sistema lineare


 𝐴+𝐵+𝐶=0

 −𝐴−𝐶+𝐷−𝐸=0


2𝐴+2𝐵+𝐶−𝐷+𝐸−2𝐹=0




 −2𝐴−𝐶+𝐷+𝐸+2𝐹−3𝐺=1

 𝐴+𝐵−𝐷−𝐸+3𝐺−4𝐻=0

−𝐴−𝐺+4𝐻=0



 𝐺−2𝐻=0



 2𝐻=1

che risolto ci dà: 𝐴 = 1, 𝐵 = 12 , 𝐶 = − 32 , 𝐷 = 1, 𝐸 = 32 , 𝐹 = 1, 𝐺 = 1, 𝐻 = 12 .


Abbiamo ottenuto, in definitiva:
!0
𝑥4 + 1 1
1
2 1 − 23 𝑥 2𝑥
3 3
+ 𝑥2 + 𝑥 + 1
2
= + + +
𝑥 3 (𝑥 − 1)(𝑥 2 + 1)2 𝑥 𝑥 − 1 𝑥2 + 1 𝑥 2 (𝑥 2 + 1)

e osservando che

1 − 32 𝑥 2𝑥
∫ ∫ ∫
1 3 3
𝑑𝑥 = 𝑑𝑥 − 𝑑𝑥 = arctg 𝑥 − ln(𝑥 2 + 1)
𝑥2 +1 𝑥 +1
2 4 𝑥2+1 4
6.5 integrale di una funzione razionale 263

si ottiene infine

𝑥4 + 1

1 3
𝑑𝑥 = ln |𝑥| + ln |𝑥 − 1 | + arctg 𝑥 − ln(𝑥 2 + 1)
𝑥 3 (𝑥 2
− 1)(𝑥 + 1)2 2 4
𝑥 +𝑥 +𝑥+ 2
3 3 2 1
+ 2
𝑥 2 (𝑥 2 + 1)

Il metodo esposto nell’esempio precedente è un algoritmo valido in generale:

1. si effettua la divisione con resto per ricondursi al caso in cui il numeratore


della funzione razionale ha grado inferiore al denominatore
2. si decompone il denominatore come prodotto di polinomi lineari e
quadratici
3. si utilizza la scomposizione di Hermite (teorema 6.43) per scrivere la
funzione razionale come somma di fratti semplici più la derivata di un’altra
funzione razionale. I coefficienti della scomposizione vanno trovati
risolvendo un sistema lineare.
4. si integrano i fratti semplici.

Per concludere l’algoritmo precedente è necessario saper integrare i fratti


semplici. Se il denominatore è lineare l’integrale è immediato (si ottiene un
logaritmo).

Se il denominatore è invece quadratico l’integrale può essere leggermente più


complicato ed è opportuno sapere come procedere. I termini quadratici saranno
della forma:
𝐴𝑥 + 𝐵
(6.16)
𝑥 2 + 𝛼𝑥 + 𝛽
con 𝛼 2 − 4𝛽 < 0 (in caso contrario il polinomio quadratico a denominatore può
essere scomposto in due fattori lineari, utilizzando la formula risolutiva per
le equazioni di secondo grado (1.19)). L’idea è quella di effettuare un cambio
di variabile lineare in modo da ricondursi ad un denominatore della forma
𝑦 2 + 1. Per fare questo si utilizza il metodo del completamento del quadrato
come abbiamo già fatto in (1.18):
 𝛼 2 𝛼2
𝑥 2 + 𝛼𝑥 + 𝛽 = 𝑥 + +𝛽− = ...
2 4
𝛼2
a questo punto si raccoglie 𝛽 − 4 (che per ipotesi è positivo) e lo si porta dentro
il quadrato:
2
  𝛼 ª

𝛼 2 𝑥 +
 
2 ®
©
··· = 𝛽 − · ­ q + 1
­ 
4

𝛼 2
®
 𝛽− 4
 

« ¬ 
𝑥+ 𝛼2
e dunque tramite la sostituzione 𝑦 = q
2
abbiamo ricondotto la nostra
𝛽− 𝛼4
funzione razionale (6.16) alla forma

𝑎𝑦 + 𝑏 𝑎 2𝑦 1
= +𝑏 2
𝑦 +1
2 2 𝑦 +1
2 𝑦 +1
264 6 calcolo integrale

che può essere integrata immediatamente.

Nel seguito proponiamo gli enunciati e le dimostrazioni che garantiscono


il funzionamento dell’algoritmo per l’integrazione delle funzioni razionali.
Difficilmente queste dimostrazioni possono essere portate a termine senza
utilizzare un minimo di proprietà delle funzioni complesse. In particolare è
necessario sapere che le derivate delle funzioni elementari complesse (somme,
prodotti, rapporti, composizione) si svolgono esattamente con le stesse regole
che si applicano alle funzioni reali (si veda a riguardo il capitolo 5.11).

Lemma 6.41 (indipendenza dei fratti semplici). Siano 𝜆1 , . . . , 𝜆𝑛 ∈ ℂ numeri


complessi distinti e siano 𝑝 1 , . . . , 𝑝 𝑛 ∈ ℕ \ {0}. Sia Ω = ℂ \ {𝜆1 , . . . , 𝜆𝑛 }. Allora le
𝑗
funzioni 𝑢𝜆 : Ω ⊆ ℂ → ℂ
𝑘

𝑗 1
𝑢𝜆 (𝑧) = 𝑘 = 1 , . . . , 𝑛, 𝑗 = 1, . . . , 𝑝 𝑛 (6.17)
𝑘
(𝑧 − 𝜆 𝑘 ) 𝑗

sono elementi linearmente indipendenti dello spazio vettoriale complesso ℂΩ .

Dimostrazione. Procediamo per induzione sul numero di funzioni 𝑁 = 𝑝 1 + · · · +


𝑝 𝑛 . Se 𝑁 = 1 abbiamo una unica funzione che non è identicamente nulla (anzi:
non si annulla mai) e quindi costituisce un insieme linearmente indipendente.

Supponiamo allora di avere un insieme formato da più funzioni nella for-


ma (6.17). Supponiamo allora di avere una combinazione lineare complessa
identicamente nulla:
𝑝𝑘
𝑛 X
X 𝑗
𝛼 𝑘,𝑗 𝑢𝜆 = 0.
𝑘
𝑘=1 𝑗=1

e consideriamo la funzione 𝑓 : Ω → ℂ definita da


𝑝𝑘
𝑛 X 𝑝𝑘
𝑛 X
𝛼 𝑘,𝑗 (𝑧 − 𝜆𝑛 )𝑝 𝑛
𝑓 (𝑧) = (𝑧 − 𝜆𝑛 )𝑝 𝑛
X X
= 𝛼 𝑘,𝑗 . (6.18)
𝑘=1 𝑗=1
(𝑧 − 𝜆 𝑘 )𝑝 𝑘 𝑘=1 𝑗=1
(𝑧 − 𝜆 𝑘 )𝑝 𝑘

Questa funzione è identicamente nulla in Ω in quanto ottenuta moltiplicando


la combinazione lineare identicamente nulla per il fattore (𝑧 − 𝜆𝑛 )𝑝 𝑛 . Ma si
osserva che si ha
lim 𝑓 (𝑧) = 𝛼 𝑛,𝑝 𝑛
𝑧→𝜆𝑛

in quanto se 𝑘 ≠ 𝑛 si ha
(𝑧 − 𝜆𝑛 )𝑝 𝑛
lim =0
𝑧→𝜆𝑛 (𝑧 − 𝜆 𝑘 )𝑝 𝑘
in quanto 𝜆 𝑘 ≠ 𝜆𝑛 e il numeratore tende a zero, se invece 𝑘 = 𝑛 e 𝑗 < 𝑝 𝑛 si ha
comunque
(𝑧 − 𝜆𝑛 )𝑝 𝑛
lim = lim (𝑧 − 𝜆𝑛 )𝑝 𝑛 −𝑗 = 0.
𝑧→𝜆𝑛 (𝑧 − 𝜆 𝑘 ) 𝑗 𝑧→𝜆𝑛

Dunque 𝛼 𝑛,𝑝 𝑛 = 0. Ma allora abbiamo una combinazione lineare nulla di 𝑁 − 1


funzioni e per ipotesi induttiva possiamo quindi concludere che anche tutti gli
altri coefficienti sono nulli.
6.5 integrale di una funzione razionale 265

Teorema 6.42 (scomposizione complessa in fratti semplici). Se 𝜆1 , . . . , 𝜆𝑛 sono


le radici complesse distinte del polinomio 𝑄 a coefficienti complessi, e 𝑝 1 , . . . , 𝑝 𝑛
sono le rispettive molteplicità con 𝑝 1 + · · · + 𝑝 𝑛 = deg 𝑄 e se 𝑃 è un qualunque
polinomio a coefficienti complessi con deg 𝑃 < deg 𝑄 , allora esistono, unici, dei
polinomi 𝑅 1 , . . . , 𝑅 𝑛 a coefficienti complessi con deg 𝑅 𝑘 < 𝑝 𝑘 tali che si abbia
𝑛
𝑃(𝑧) X 𝑅 𝑘 (𝑧)
= ∀𝑧 ∈ ℂ \ {𝜆1 , . . . , 𝜆𝑛 }. (6.19)
𝑄(𝑧) 𝑘=1 (𝑧 − 𝜆 𝑘 )𝑝 𝑘

Dimostrazione. Sia 𝑁 = deg 𝑄 e consideriamo l’insieme dei polinomi a coeffi-


cienti complessi di grado inferiore a 𝑁 :

𝑉𝑁 = {𝑃 ∈ ℂ[𝑧] : deg 𝑃 < 𝑁 }.

Questo è un sottospazio vettoriale di 𝑉 = ℂΩ ed ha dimensione 𝑁 (una base


è data dai monomi 1 , 𝑧, 𝑧 2 , . . . , 𝑧 𝑁−1 ). Di conseguenza è facile verificare che
anche lo spazio vettoriale

𝑃
 
1
𝑊𝑄 = 𝑉𝑁 · = : deg 𝑃 < 𝑁
𝑄 𝑄

i cui elementi sono le funzioni razionali che stanno al lato sinistro di (6.19),
ha la stessa dimensione dim 𝑊𝑄 = dim 𝑉𝑁 = 𝑁 . D’altra parte il lato destro
𝑗
di (6.19) è una combinazione lineare di funzioni 𝑢𝜆 = 1/(𝑧 − 𝜆 𝑘 ) 𝑗 che sono
𝑘
anch’esse elementi di 𝑊𝑄 in quanto (𝑧 − 𝜆 𝑘 ) 𝑗 divide 𝑄(𝑥) se 𝑗 ≤ 𝑝 𝑘 . Ma per il
𝑗
lemma 6.41 i vettori 𝑢𝜆 sono 𝑁 vettori indipendenti e quindi sono una base
𝑘
di 𝑊 . Significa allora che ogni elemento di 𝑊 può essere scritto in modo
𝑗
unico come combinazione lineare degli 𝑢𝜆 cioè, per ogni polinomio 𝑃 con
𝑘
deg 𝑃 < deg 𝑄 si ha
𝑝𝑛
𝐴 𝑘,𝑗 · (𝑧 − 𝜆 𝑘 )𝑝 𝑛 −𝑗
X
𝑝𝑘
𝑛 X 𝑛 𝑗=1
𝑃(𝑧) X 𝐴 𝑘,𝑗 X
= = (6.20)
𝑄(𝑧) 𝑘=1 𝑗=1 (𝑧 − 𝜆 𝑘 ) 𝑗 𝑘=1
(𝑧 − 𝜆 𝑘 )𝑝 𝑛

e posto
𝑝𝑛
𝐴 𝑘,𝑗 · (𝑧 − 𝜆 𝑘 )𝑝 𝑛 −𝑗
X
𝑅 𝑘 (𝑧) =
𝑗=1

è chiaro che 𝑅 𝑘 è un polinomio di grado inferiore a 𝑝 𝑛 univocamente determinato


dai coefficienti 𝐴 𝑘,𝑗 .

Teorema 6.43 (scomposizione di Hermite). Sia 𝑄(𝑥) un polinomio monico a


coefficienti reali con radici reali 𝜆1 , . . . , 𝜆𝑛 di molteplicità 𝑝 1 , . . . , 𝑝 𝑛 e radici complesse
coniugate non reali 𝜇1 , 𝜇¯ 1 , . . . , 𝜇𝑚 , 𝜇¯ 𝑚 di molteplicità 𝑞 1 , . . . , 𝑞 𝑚 . Posto 𝛼 𝑘 = 2 Re 𝜇 𝑘
e 𝛽 𝑘 = |𝜇 𝑘 | 2 potremo scrivere (grazie al teorema 4.21)
𝑛 𝑚
(𝑥 − 𝜆 𝑘 )𝑝 𝑘 · (𝑥 2 + 𝛼 𝑘 𝑥 + 𝛽 𝑘 )𝑞 𝑘 .
Y Y
𝑄(𝑥) = (6.21)
𝑘=1 𝑘=1

Sia 𝑃(𝑥) un qualunque polinomio a coefficienti reali con deg 𝑃 < deg 𝑄 .
266 6 calcolo integrale

Allora posto
𝑛 𝑚
˜ (𝑥 − 𝜆 𝑘 )𝑝 𝑘 −1 · (𝑥 2 + 𝛼 𝑘 𝑥 + 𝛽 𝑘 )𝑞 𝑘 −1
Y Y
𝑄(𝑥) =
𝑘=1 𝑘=1

esistono (unici) dei coefficienti reali 𝐴1 , . . . , 𝐴𝑛 , 𝐵1 , . . . , 𝐵𝑚 , 𝐶1 , . . . , 𝐶 𝑚 e un


polinomio a coefficienti reali 𝑅(𝑥) con deg 𝑅 < deg 𝑄 ˜ per cui risulta:

𝑛 𝑚 0
𝑃(𝑥) X 𝐴𝑘 𝐵𝑘 𝑥 + 𝐶𝑘 𝑅(𝑥)

X
= + + . (6.22)
𝑄(𝑥) 𝑘=1 𝑥 − 𝜆 𝑘 𝑘=1 𝑥 2 + 𝛼 𝑘 𝑥 + 𝛽 𝑘 ˜
𝑄(𝑥)

Svolgendo la derivata si potrà riscrivere il lato destro con denominatore comune 𝑄(𝑥) e
uguagliando i numeratori di lato destro e lato sinistro si otterrà un sistema lineare in
deg 𝑄 incognite che avrà una unica soluzione.

Dimostrazione. Consideriamo le funzioni

𝑗 1
𝑢𝜆 (𝑧) =
(𝑧 − 𝜆) 𝑗
1
𝑣 𝜇 (𝑧) = ,
𝑧 2 − 2 Re 𝜇 · 𝑧 + |𝜇| 2
𝑧
𝑤 𝜇 (𝑧) = ,
𝑧 2 − 2 Re 𝜇 · 𝑧 + |𝜇| 2
𝑧𝑗
𝑡 𝑗 (𝑧) = .
˜
𝑄(𝑧)

Siano 𝜆1 , . . . , 𝜆 𝑁 tutte le radici complesse del polinomio 𝑄(𝑧) con 𝑝 1 , . . . , 𝑝 𝑁 le


rispettive molteplicità. Grazie al lemma 6.41 possiamo affermare, come abbiamo
fatto nella dimostrazione del teorema 6.42 che lo spazio vettoriale 𝑉𝑄 di tutte le
𝑃(𝑧)
funzioni razionali della forma 𝑄(𝑧) con 𝑄 fissato e deg 𝑃 < deg 𝑄 è generato
dalle combinazioni lineari a coefficienti complessi delle funzioni

𝑗
𝑢𝜆 , 𝑘 = 1, . . . , 𝑁 , 𝑗 = 1, . . . , 𝑝 𝑘 .
𝑘

Analogamente lo spazio vettoriale 𝑉𝑄˜ è generato dalle funzioni

𝑗
𝑢𝜆 , 𝑘 = 1, . . . , 𝑁 , 𝑗 = 1 , . . . , 𝑝 𝑘 − 1.
𝑘

Osserviamo ora che per 𝑗 > 1 si ha

𝑑 𝑗−1 𝑑 1 1− 𝑗 𝑗
𝑢 = = = (1 − 𝑗)𝑢𝜆
𝑑𝑧 𝜆 𝑑𝑧 (𝑧 − 𝜆) 𝑗−1 (𝑧 − 𝜆) 𝑗

𝑑
significa quindi che l’operatore lineare 𝑑𝑧 manda 𝑉𝑄˜ in 𝑉𝑄 , più precisamente
𝑑 𝑗
l’immagine di 𝑑𝑧 𝑉𝑄˜
è il sottospazio di 𝑉𝑄 generato dalle funzioni 𝑢𝜆 con 𝑗 > 1.
𝑘
Tale operatore è inoltre iniettivo in quanto manda vettori della base di 𝑉𝑄˜ in
vettori della base di 𝑉𝑄 che sono certamente indipendenti. Abbiamo quindi
una decomposizione in somma diretta:

𝑑
𝑉𝑄 = 𝑉1 ⊕ 𝑉˜
𝑑𝑧 𝑄
6.6 integrali che si riconducono a funzioni razionali 267

dove 𝑉1 è lo spazio generato dalle funzioni 𝑢𝜆1 , . . . , 𝑢𝜆1 .


1 𝑁

˜ sono una base di 𝑉 ˜ dunque


Ma anche le funzioni 𝑡0 , . . . , 𝑡 𝑀−1 con 𝑀 = deg 𝑄 𝑄
una base di 𝑉𝑄 è data da

𝑢𝜆1 , . . . , 𝑢𝜆𝑁 , 𝑡00 , . . . , 𝑡 0𝑀−1

dove 𝑡 𝑚
0 è la derivata di 𝑡 . Quindi, visto che ogni combinazione lineare di
𝑚
𝑢𝜇 e 𝑢𝜇¯ può essere scritta come combinazione lineare di 𝑣𝜇 e 𝑤 𝜇 si ottiene che
un’altra base di 𝑉𝑄 è

𝑢𝜆1 , . . . , 𝑢𝜆𝑛 , 𝑣𝜇1 , . . . , 𝑣 𝜇𝑚 , 𝑤𝜇1 , . . . , 𝑤 𝜇𝑚 , 𝑡00 , . . . , 𝑡 0𝑀−1 . (6.23)

Per brevità chiamiamo 𝑒1 , . . . , 𝑒 𝑁 la base di 𝑉𝑄 elencata in (6.23). Ognuna di


queste funzioni si scrive come rapporto di polinomi a coefficienti reali il cui
denominatore è un divisore del polinomio 𝑄 che è anch’esso un polinomio
a coefficienti reali. Dunque le funzioni 𝑄 · 𝑒1 , . . . , 𝑄 · 𝑒 𝑁 sono in realtà dei
polinomi a coefficienti reali e devono necessariamente essere una base dello
spazio vettoriale complesso 𝑄 · 𝑉𝑄 che non è altro che l’insieme di tutti i
polinomi a coefficienti complessi di grado inferiore ad 𝑁 . In particolare questi
polinomi sono indipendenti. Ma allora, visti come polinomi a coefficienti reali
sono pure indipendenti e sono quindi una base dello spazio di tutti i polinomi a
coefficienti reali di grado inferiore a 𝑁 . Dunque devono esistere dei coefficienti
reali 𝛼 1 , . . . , 𝛼 𝑁 per cui si ha

𝑁
X
𝑃(𝑥) = 𝛼 𝑘 · 𝑄(𝑥) · 𝑒 𝑘 (𝑥)
𝑘=1

da cui
𝑁
𝑃(𝑥) X
= 𝛼 𝑘 · 𝑒 𝑘 (𝑥).
𝑄(𝑥) 𝑘=1
Ricordando che le funzioni 𝑒 𝑘 non sono altro che le funzioni elencate in (6.23) si
ottiene finalmente la decomposizione cercata.

6.6 integrali che si riconducono a funzioni razionali

E’ importante sapere che di qualunque funzione razionale è possibile scriverne


la primitiva utilizzando i metodi della sezione precedente. Allo stesso modo è
utile sapere che ci sono altre casistiche che si riconducono all’integrazione di
una funzione razionale.

Funzioni razionali in 𝑒 𝑥 . Se la funzione integranda 𝑓 (𝑥) si scrive nella forma

𝑓 (𝑥) = 𝑅(𝑒 𝜆𝑥 )
268 6 calcolo integrale

con 𝑅 funzione razionale e 𝜆 ≠ 0, allora si può risolvere l’integrale tramite la


sostituzione 𝑡 = 𝑒 𝜆𝑥 . Infatti si ha


 𝑒 𝜆𝑥 = 𝑡
ln 𝑡


𝑥= 𝜆

 𝑑𝑥 = 1

 𝜆𝑡

e la funzione integranda diventa una funzione razionale:

𝑅(𝑡)
∫ ∫ 
𝜆𝑥
𝑅(𝑒 ) 𝑑𝑥 = 𝑑𝑡
𝜆𝑡 𝑡=𝑒 𝜆𝑥

Esempio 6.44. Si voglia risolvere l’integrale



2 𝑒 𝑥 + 𝑒 2𝑥

𝑑𝑥.
𝑒𝑥 − 4

𝑥
Soluzione. Scriviamo la funzione integranda in funzione di 𝑒 2 :
√ 𝑥 𝑥
2 𝑒 𝑥 + 𝑒 2𝑥 2𝑒 2 + 𝑒 4 2
= 𝑥 .
𝑒𝑥 − 4 𝑒2 2 − 4
𝑥
Facendo il cambio di variabile 𝑡 = 𝑒 2 , 𝑥 = 2 ln 𝑡 , 𝑑𝑥 = 2𝑡 𝑑𝑡 si ottiene una
funzione razionale in 𝑡 :
∫ √ 𝑥
2 𝑒 + 𝑒 2𝑥 2𝑡 + 𝑡 4 2 2 + 𝑡3
∫ ∫
𝑑𝑥 = · 𝑑𝑡 = 2 𝑑𝑡.
𝑒𝑥 − 4 𝑡2 − 4 𝑡 𝑡2 − 4

Facendo la divisione tra i polinomi e la riduzione ai fratti semplici si ottiene


∫ ∫ ∫
5 3
2𝑡 𝑑𝑡 + 𝑑𝑡 + 𝑑𝑡 = 𝑡 2 + 5 ln |𝑡 − 2 | + 3 ln |𝑡 + 2 |
𝑡−2 𝑡+2
𝑥
e quindi sostituendo 𝑡 = 𝑒 2 si ottiene il risultato
√ √ 
𝑒 𝑥 + 5 ln 𝑒 𝑥 − 2 + 3 ln 𝑒 𝑥 + 2 .

Funzioni razionali in sin2 𝑥 , cos2 𝑥 , sin 𝑥 · cos 𝑥 . Se la funzione integranda 𝑓 (𝑥) si


scrive nella forma

𝑓 (𝑥) = 𝑅(sin2 𝑥, cos2 𝑥, sin 𝑥 · cos 𝑥)

con 𝑅 funzione razionale (cioè rapporto di polinomi nelle tre variabili indicate)
allora si può risolvere l’integrale tramite la sostituzione 𝑡 = tg 𝑥 . Infatti
osservando che risulta

sin2 𝑥 1
1 + tg2 𝑥 = 1 + =
cos 𝑥
2 cos2 𝑥
6.6 integrali che si riconducono a funzioni razionali 269

da cui
1
cos2 𝑥 =
1 + tg2 𝑥
sin2 𝑥 = tg2 𝑥 · cos2 𝑥
sin 𝑥 · cos 𝑥 = tg 𝑥 · cos2 𝑥

ponendo 𝑡 = tg 𝑥 si ha:



 cos2 𝑥 = 1
1+𝑡 2
 sin2 𝑥 = 𝑡2



1+𝑡 2 (6.24)
𝑡

 sin 𝑥 · cos 𝑥 = 1+𝑡 2

 𝑑𝑥 = 1 𝑑𝑡

 1+𝑡 2

e la funzione integranda diventa una funzione razionale.

Esempio 6.45. Si voglia calcolare



1
𝑑𝑥.
cos 𝑥 · (sin 𝑥 + cos 𝑥)

Soluzione. La funzione integranda si può scrivere nella forma

1
.
sin 𝑥 · cos 𝑥 + cos2 𝑥
Effettuando la sostituzione (6.24) si ottiene
∫ ∫
1 1 1
· 𝑑𝑡 = 𝑑𝑡 = ln |𝑡 + 1 | = ln | tg 𝑥 + 1 |.
𝑡
+ 1 1 + 𝑡2 𝑡+1
1+𝑡 2 1+𝑡 2

Più in generale funzioni razionali di sin 𝑥 e cos 𝑥 . Se la funzione integranda 𝑓 (𝑥) si


scrive nella forma
𝑓 (𝑥) = 𝑅(sin 𝑥, cos 𝑥)
con 𝑅 funzione razionale, allora si può risolvere l’integrale tramite la sostituzione
𝑡 = tg 𝑥2 . Infatti con tale sostituzione si ha (usando le formule di bisezione e
riconducendosi al caso precedente)

𝑥 𝑥 1−𝑡 2


 cos 𝑥 = cos2 2 − sin2 2 = 1+𝑡 2
𝑥 𝑥 2𝑡


sin 𝑥 = 2 sin 2 cos 2 = 1+𝑡 2
(6.25)

 𝑑𝑥 =
 2
𝑑𝑡.
 1+𝑡 2

Di nuovo con questa sostituzione la funzione integranda diventa razionale.

Osservazione 6.46. Si osservi che la sostituzione (6.25) potrebbe essere sempre


utilizzata al posto della (6.24) in quanto più generale. Ma, usualmente, se è possibile
usare la sostituzione (6.24) l’integrale risulta poi più semplice da calcolare. Si faccia la
prova con l’integrale dell’esempio 6.45!
270 6 calcolo integrale

Esempio 6.47. Si voglia calcolare



1
𝑑𝑥.
sin 𝑥

Soluzione. Utilizzando la sostituzione (6.25) si ottiene


∫ ∫
1 1 2
𝑑𝑥 = 𝑑𝑡
sin 𝑥 2𝑡 1 + 𝑡2
1+𝑡 2
𝑥

1

= 𝑑𝑡 = ln |𝑡| = ln tg .
𝑡 2

Funzioni razionali con radicali. Se la funzione 𝑓 (𝑥) si scrive nella forma:



𝑓 (𝑥) = 𝑅( 𝑛 𝑥)

con 𝑅 funzione razionale, allora si può risolvere l’integrale tramite la sostituzione


𝑥 = 𝑡 𝑛 . Infatti con tale sostituzione si ha
(√
𝑛
𝑥=𝑡
(6.26)
𝑑𝑥 = 𝑛𝑡 𝑛−1 𝑑𝑡.

Esempio 6.48. Si voglia calcolare


√4
𝑥

√2 √ 𝑑𝑥.
𝑥+ 3𝑥

Soluzione. Si osservi che la funzione integranda può essere scritta come funzione

razionale di 𝑡 = 12 𝑥 (abbiamo scelto il minimo comune multiplo tra i radicandi
in gioco: 12 = 𝑚𝑐𝑚(4 , 2 , 3))
√4 √
𝑥
12
𝑥3
√ √3 = √ √ .
𝑥+ 𝑥 12
𝑥6 + 𝑥4
12

Dunque utilizzando la sostituzione (6.26) con 𝑛 = 12 si ha

𝑡3 𝑡 14 𝑡 10
∫ ∫ ∫
· 12𝑡 11 𝑑𝑡 = 12 𝑑𝑡 = 12 𝑑𝑡.
𝑡 + 𝑡4
6 𝑡 + 𝑡4
6 𝑡2 +1

Procedendo con la divisione tra polinomi si ottiene


∫  
1
12 𝑡 −𝑡 +𝑡 −𝑡 +1− 2
8 6 4
𝑑𝑡
2
𝑡 +1
𝑡9 𝑡7 𝑡5 𝑡3
 
= 12 − + − + 𝑡 − arctg 𝑡
9 7 𝑡 3
4 √4 3 12 √
12 12 √
12 √ √ √
= 𝑥 − 𝑥7 + 𝑥 5 − 4 4 𝑥 + 12 12 𝑥 − 12 arctg 12 𝑥.
3 7 5
6.7 funzioni speciali 271

6.7 funzioni speciali

E’ certamente molto utile conoscere i metodi di integrazione per poter scrivere


esplicitamente la primitiva di una generica funzione. Ma è anche molto utile
sapere che esistono alcune funzioni elementari la cui primitiva non è una
2
funzione elementare. Un esempio su tutti è la campana di Gauss 𝑓 (𝑥) = 𝑒 −𝑥 la campana di Gauss
cui funzione integrale ∫ 𝑥
2
𝐹(𝑥) = 𝑒 −𝑡 𝑑𝑡
0

non può essere espressa mediante composizione di funzioni elementari. Questo


fatto non ci deve scoraggiare più di tanto, daremo un nome alla funzione 𝐹
e ne studieremo le proprietà utilizzando la teoria che abbiamo sviluppato.
Ovviamente è probabile che prima di noi qualcun’altro si sia imbattutto in tali
funzioni e gli abbia già dato un nome e ne abbia studiato le proprietà. Queste
funzioni si chiamano usualmente funzioni speciali per distinguerle dalle funzioni
elementari. Nell’esempio specifico è stato definita la funzione di errore funzione di errore
∫ 𝑥
2 2
erf 𝑥 = √ 𝑒 −𝑡 𝑑𝑡.
𝜋 0

Altri esempi di funzioni la cui primitiva non si esprime mediante funzioni


elementari sono i seguenti:

1 𝑒𝑥 sin 𝑥 𝜋𝑥 2
, , , sin
ln 𝑥 𝑥 𝑥 2
per le quali si definiscono le rispettive primitive: logaritmo integrale, integrale
esponenziale, seno integrale, integrale di Fresnel:

li 𝑥, ei 𝑥, Si 𝑥, 𝑆𝑥.

Il teorema tramite il quale si dimostra che queste funzioni non ammettono


una primitiva esprimibile come composizione di funzioni elementari (funzioni
razionali, esponenziali, trigonometriche e loro inverse) si chiama Teorema di Il teorema di Liouville è un teorema di
Liouville. tipo algebrico e quindi va ben lontano
dagli scopi di questo corso. Per chi fosse
interessato a vederne la dimostrazione
una lettura piacevole può essere l’arti-
6.8 integrali impropri colo di Camillo De Lellis: Il teorema di
Liouville ovvero perché “non esiste” la pri-
mitiva di exp(𝑥 2 ).
La definizione di integrale di Riemann è stata data solamente per funzioni
limitate definite su un intervallo limitato. Vogliamo ora estendere la defini-
zione di integrale alle funzioni illimitate e agli intervalli illimitati. Lo faremo
riconducendoci, tramite un limite, al caso già studiato.

Definizione 6.49 (integrabilità locale). Sia 𝑓 : 𝐴 → ℝ una funzione definita su


un insieme 𝐴 ⊆ ℝ. Diremo che 𝑓 è localmente Riemann-integrabile se per ogni
intervallo chiuso e limitato [𝛼, 𝛽] ⊆ 𝐴 risulta che 𝑓 sia limitata e Riemann-integrabile
su [𝛼, 𝛽].
272 6 calcolo integrale

Osservazione 6.50. Se 𝑓 : 𝐴 → ℝ è una funzione continua, allora su ogni intervallo


[𝛼, 𝛽] ⊆ 𝐴 la funzione 𝑓 risulta essere continua e quindi limitata e Riemann-integrabile
per il teorema 6.15. Lo stesso vale per le funzioni monotone: grazie al teorema 6.16
sappiamo che una funzione monotona è limitata e Riemann-integrabile su ogni intervallo
[𝛼, 𝛽] dunque anch’essa è localmente Riemann-integrabile. Sarà molto raro avere a che
fare con funzioni localmente Riemann-integrabili che non si riconducono a questi due
casi.

Definizione 6.51 (integrale improprio). Se 𝑓 è una funzione localmente Riemann-


integrabile sull’intervallo [𝑎, 𝑏) con 𝑎 ∈ ℝ, 𝑏 ∈ (𝑎, +∞] definiamo l’integrale improprio
di 𝑓 su [𝑎, 𝑏) come:
∫ 𝑏 ∫ 𝛽
𝑓 (𝑥) 𝑑𝑥 = lim− 𝑓 (𝑥) 𝑑𝑥
𝑎 𝛽→𝑏 𝑎

se il limite a lato destro esiste (finito o infinito).

Se 𝑓 è una funzione localmente Riemann-integrabile sull’intervallo (𝑎, 𝑏] con 𝑏 ∈ ℝ,


𝑎 ∈ [−∞, 𝑏) definiamo l’integrale improprio di 𝑓 su (𝑎, 𝑏] come:
∫ 𝑏 ∫ 𝑏
𝑓 (𝑥) 𝑑𝑥 = lim+ 𝑓 (𝑥) 𝑑𝑥
𝑎 𝛼→𝑎 𝛼

se il limite esiste (finito o infinito).

Se 𝑓 è una funzione localmente Riemann-integrabile sull’intervallo (𝑎, 𝑏) con 𝑎 ∈


[−∞, +∞), 𝑏 ∈ (𝑎, +∞] preso un qualunque punto 𝑐 ∈ (𝑎, 𝑏) definiamo l’integrale
improprio di 𝑓 su (𝑎, 𝑏) come:
∫ 𝑏 ∫ 𝑐 ∫ 𝑏
𝑓 (𝑥) 𝑑𝑥 = 𝑓 (𝑥) 𝑑𝑥 + 𝑓 (𝑥) 𝑑𝑥
𝑎 𝑎 𝑐
∫ 𝑐 ∫ 𝛽
= lim+ 𝑓 (𝑥) 𝑑𝑥 + lim− 𝑓 (𝑥) 𝑑𝑥
𝛼→𝑎 𝛼 𝛽→𝑏 𝑐

sempre che entrambi i limiti esitano (finiti o infiniti) e non siano infiniti di segno opposto
(cosicché la loro somma è ben definita). In base all’osservazione 6.52 l’integrale non
dipende dal punto 𝑐 scelto.

Se 𝐼 è un intervallo di estremi 𝑎, 𝑏 ∈ [−∞, +∞], 𝑎 < 𝑏 ed esistono un numero finito


di punti 𝑥 0 , . . . , 𝑥 𝑛 ∈ 𝐼 tali che 𝑎 = 𝑥 0 < 𝑥 1 < · · · < 𝑥 𝑛 = 𝑏 e se 𝑓 risulta essere
localmente Riemann-integrabile sull’insieme 𝐴 = 𝐼 \ {𝑥 0 , . . . , 𝑥 𝑛 } allora definiamo
l’integrale improprio di 𝑓 su 𝐴 come:
∫ 𝑏 𝑛 ∫
X 𝑥𝑘
𝑓 (𝑥) 𝑑𝑥 = 𝑓 (𝑥) 𝑑𝑥
𝑎 𝑘=1 𝑥 𝑘−1

∫ 𝑥𝑘
se ogni integrale improprio 𝑥 𝑓 (𝑥) 𝑑𝑥 esiste (finito o infinito) e se la somma è ben
𝑘−1
definita in quanto tutti gli integrali infiniti hanno lo stesso segno.
∫𝑏
Se l’integrale improprio 𝑎 𝑓 (𝑥) 𝑑𝑥 esiste ed è finito (in base ad una delle definizioni
integrabile
precedenti), diremo che la funzione 𝑓 è integrabile in senso improprio (o integrabile
convergente in senso generalizzato) e diremo che l’integrale converge. Se invece l’integrale esiste
ma non è finito, diremo che l’integrale diverge. Negli altri casi diremo che l’integrale è
divergente
6.8 integrali impropri 273

indeterminato. indeterminato

∫𝑏
Determinare il carattere dell’integrale 𝑎
𝑓 (𝑥) 𝑑𝑥 significa dire se tale integrale è carattere
convergente, divergente o indeterminato.

Se gli estremi di integrazione sono scambiati, 𝑎 > 𝑏 , risulta utile utilizzare anche per
gli integrali impropri la convenzione già introdotta per gli integrali di Riemann:
∫ 𝑏 ∫ 𝑎
𝑓 (𝑥) 𝑑𝑥 = − 𝑓 (𝑥) 𝑑𝑥.
𝑎 𝑏

Osservazione 6.52. Nella definizione di integrale improprio sull’intervallo aperto


(𝑎, 𝑏) la scelta del punto 𝑐 ∈ (𝑎, 𝑏) non influenza la definizione. Se infatti scegliamo
due diversi punti 𝑐, 𝑐 0 ∈ (𝑎, 𝑏) per ogni 𝛼, 𝛽 ∈ (𝑎, 𝑏) si ha, grazie alla additività
dell’integrale di Riemann:
∫ 𝑐 ∫ 𝛽 ∫ 𝑐0 ∫ 𝛽
𝑓 (𝑥) 𝑑𝑥 + 𝑓 (𝑥) 𝑑𝑥 = 𝑓 (𝑥) 𝑑𝑥 + 𝑓 (𝑥) 𝑑𝑥.
𝛼 𝑐 𝛼 𝑐0

E quindi i limiti, se esistono, sono uguali.

Esempio 6.53. La funzione 𝑓 (𝑥) = ln 𝑥 può essere integrata in senso improprio


sull’intervallo [1 , +∞) e si ha:
∫ +∞ ∫ 𝛽
𝛽
𝑓 (𝑥) 𝑑𝑥 = lim ln(𝑥) 𝑑𝑥 = lim [𝑥 ln 𝑥 − 𝑥]1
1 𝛽→+∞ 1 𝛽→+∞

= lim (𝛽 ln 𝛽 − 𝛽 + 1) = +∞.
𝛽→+∞

Anche sull’intervallo (0 , 1] la funzione ln 𝑥 ha integrale improprio


∫ 1
ln 𝑥 𝑑𝑥 = lim+ [𝑥 ln 𝑥 − 𝑥]1𝛼 = lim+ (−1 − 𝛼 ln 𝛼 + 𝛼) = −1.
0 𝛼→0 𝛼→0

Dunque sull’intervallo (0 , +∞) la funzione ln 𝑥 ha integrale improprio


∫ +∞ ∫ 1 ∫ +∞
ln 𝑥 𝑑𝑥 = ln 𝑥 𝑑𝑥 + ln 𝑥 𝑑𝑥 = −1 + (+∞) = +∞.
0 0 1

Diremo quindi che la funzione 𝑓 (𝑥) = ln 𝑥 non è integrabile in senso improprio


sull’intervallo (0 , +∞) ma l’integrale esiste ed è divergente.

Per abbreviare le notazioni intenderemo:

[𝐹(𝑥)]𝑏𝑎 = lim− 𝐹(𝑥) − lim+ 𝐹(𝑥)


𝑥→𝑏 𝑥→𝑎

osservando che se 𝐹 è definita e continua agli estremi 𝑎 e 𝑏 questa notazione


coincide con l’usuale
[𝐹(𝑥)]𝑏𝑎 = 𝐹(𝑏) − 𝐹(𝑎).
274 6 calcolo integrale

Potremo quindi scrivere:


∫ 1
ln 𝑥 𝑑𝑥 = [𝑥 ln 𝑥 − 𝑥]10 = 1 · ln 1 − 1 − lim+ (𝑥 ln 𝑥 − 𝑥)
0 𝑥→0

= −1 − 0 = −1 .

Osserviamo che se 𝑓 : (𝑎, 𝑏) → ℝ è continua e 𝐹 : (𝑎, 𝑏) → ℝ è una sua primitiva


allora si avrà
∫ 𝑏 ∫ 𝑐 ∫ 𝛽
𝑓 (𝑥) 𝑑𝑥 = lim+ 𝑓 (𝑥) 𝑑𝑥 + lim− 𝑑𝑥
𝑎 𝛼→𝑎 𝛼 𝛽→𝑏 𝑐
= lim (𝐹(𝑐) − 𝐹(𝑥)) + lim (𝐹(𝑥) − 𝐹(𝑐))
𝑥→𝑎 𝑥→𝑏

= lim 𝐹(𝑥) − lim 𝐹(𝑥) = [𝐹(𝑥)]𝑏𝑎 .


𝑥→𝑏 𝑥→𝑎

Dunque la formula fondamentale del calcolo integrale rimane formalmente


identica per gli integrali impropri.

Esempio 6.54. Per calcolare l’integrale


∫ +∞
1
𝑑𝑥
−∞ 1 + 𝑥2

possiamo scegliere un qualunque punto 𝑐 ∈ ℝ e calcolare


∫ +∞ ∫ 𝑐 ∫ 𝛽
1 1 1
𝑑𝑥 = lim 𝑑𝑥 + lim 𝑑𝑥
−∞ 1 + 𝑥2 𝛼→−∞ 𝛼 1 + 𝑥2 𝛽→+∞ 𝑐 1 + 𝑥2
𝑐
= [arctg 𝑥]−∞ + [arctg 𝑥]+∞
𝑐
𝜋 𝜋
= arctg 𝑐 − (− ) + − arctg 𝑐 = 𝜋.
2 2

Ma più semplicemente possiamo scrivere:


+∞
𝜋  𝜋

1 +∞
𝑑𝑥 = [ arctg 𝑥] −∞ = − − = 𝜋.
−∞ 1 + 𝑥2 2 2

Osservazione 6.55. Se 𝑓 : [𝑎, 𝑏] → ℝ è limitata e Riemann-integrabile su [𝑎, 𝑏]


allora, in base al teorema 6.18 si ha:
∫ 𝑏 ∫ 𝑏 ∫ 𝛽
𝑓 (𝑥) 𝑑𝑥 = lim+ 𝑓 (𝑥) 𝑑𝑥 = lim− 𝑓 (𝑥) 𝑑𝑥.
𝑎 𝛼→𝑎 𝛼 𝛽→𝑏 𝑎

Dunque in questo caso gli integrali impropri su [𝑎, 𝑏) e su (𝑎, 𝑏] coincidono con
l’usuale integrale di Riemann (e sono quindi convergenti). Allo stesso modo se 𝑓 è
localmente integrabile su [𝑎, 𝑏) l’integrale improprio su [𝑎, 𝑏) e l’integrale improprio
su (𝑎, 𝑏) coincidono. Lo stesso succede se la funzione è localmente integrabile su (𝑎, 𝑏)
e consideriamo l’insieme 𝐴 = (𝑎, 𝑏) \ {𝑥 0 , . . . , 𝑥 𝑛 }. L’integrale su (𝑎, 𝑏) coincide con
l’integrale su 𝐴 grazie all’additività dell’integrale rispetto al dominio.
6.8 integrali impropri 275

∫𝑏
Questo giustifica l’aver utilizzato la stessa notazione 𝑎 sia per l’integrale di Riemann su
[𝑎, 𝑏] sia per i diversi integrali impropri su [𝑎, 𝑏), (𝑎, 𝑏], (𝑎, 𝑏) o (𝑎, 𝑏) \ {𝑥0 , . . . , 𝑥 𝑛 }.

Esempio 6.56. La funzione sin 𝑥 pur essendo integrabile su ogni intervallo chiuso e
limitato (in quanto funzione continua) non ammette integrale improprio sull’intervallo
[0 , +∞) in quanto l’integrale:
∫ 𝛽
𝛽
sin(𝑥) 𝑑𝑥 = [− cos(𝑥)]0 = − cos(𝛽) + cos(0) = 1 − cos(𝛽)
0

non ammette limite per 𝛽 → +∞.

Esempio 6.57. La funzione ln 𝑥 ammette integrale improprio sull’intervallo (0 , +∞)


in quanto si ha:
∫ +∞
ln 𝑥 𝑑𝑥 = [𝑥 ln 𝑥 − 𝑥]+∞
0 = +∞.
0

Ma visto che l’integrale diverge diremo che la funzione non è integrabile su tale intervallo.

Esempio 6.58. La funzione 2 𝑥/(𝑥 2 + 1) non è integrabile in senso improprio su ℝ in


quanto si ha
+∞
2𝑥

 +∞
𝑑𝑥 = ln(1 + 𝑥 2 ) 0 = +∞

0 1+𝑥 2
0
2𝑥

0
𝑑𝑥 = ln(1 + 𝑥 2 ) −∞ = −∞

−∞ 1+𝑥 2

e (+∞) + (−∞) è indefinito.

Esempio 6.59. Si ha
∫ 2 ∫ 0 ∫2
1 1 1
√3 𝑑𝑥 = √3 𝑑𝑥 + √3 𝑑𝑥
−1 𝑥 −1 𝑥 0 𝑥
 √ 0  √ 2
3 3 2 3 3 2 3 3 √3
= 𝑥 + 𝑥 =0− + 4−0
2 −1
2 0
2 2
3 √3
= (1 + 4).
2

Esempio 6.60. Si ha
∫ +∞
1
𝑑𝑥 = [ln 𝑥]+∞ = +∞ − (−∞) = +∞
0 𝑥 0

e ∫ 0
1
𝑑𝑥 = [ln(−𝑥)]0−∞ = −∞ − (+∞) = −∞.
−∞ 𝑥
Allora l’integrale ∫ +∞
1
𝑑𝑥
−∞ 𝑥
non è definito in quanto somma di infiniti di segno opposto.
276 6 calcolo integrale

Osservazione 6.61. Attenzione a non dimenticare i punti “cattivi” all’interno


dell’intervallo di integrazione. Se vogliamo valutare:
∫ 1
1
𝑑𝑥
−1 𝑥

Potremmo essere portati a pensare che questo integrale sia uguale a:

[ln |𝑥|]1−1 = ln | 1 | − ln |−1 | = 0.

Invece questo integrale non è definito in quanto bisogna considerare che la funzione
integranda non è definita e comunque non è limita in un intorno di 𝑥 = 0 e quindi
l’intervallo [−1 , 1] va spezzato nell’unione dei due intervalli [−1 , 0) e (0 , 1] da cui:
∫ 1
1
𝑑𝑥 = [ln |𝑥|]0−1 + [ln |𝑥|]10 = −∞ + (+∞)
−1 𝑥

ed essendoci una somma di infiniti con segno opposto la somma non ha senso e l’integrale
improprio non è definito.

monotonia Teorema 6.62 (proprietà dell’integrale improprio). Se 𝑓 ≤ 𝑔 e se entrambi gli


integrali sono definiti, risulta:
∫ 𝑏 ∫ 𝑏
𝑓 (𝑥) 𝑑𝑥 ≤ 𝑔(𝑥) 𝑑𝑥.
𝑎 𝑎

additività

Siano 𝑎, 𝑏, 𝑐 ∈ ℝ̄ con 𝑎 ≤ 𝑐 ≤ 𝑏 . Allora nella seguente uguaglianza


∫ 𝑏 ∫ 𝑐 ∫ 𝑏
𝑓 (𝑥) 𝑑𝑥 = 𝑓 (𝑥) 𝑑𝑥 + 𝑓 (𝑥) 𝑑𝑥
𝑎 𝑎 𝑐

linearità se almeno uno dei due lati è definito allora anche l’altro lato lo è e l’uguaglianza è valida.

Siano 𝜆, 𝜇 ∈ ℝ.
∫ 𝑏 ∫ 𝑏 ∫ 𝑏
(𝜆 𝑓 (𝑥) + 𝜇𝑔(𝑥)) 𝑑𝑥 = 𝜆 𝑓 (𝑥) + 𝜇 𝑔(𝑥)
𝑎 𝑎 𝑎

se il lato destro è ben definito (esistono gli integrali impropi di 𝑓 e 𝑔 e le operazioni


hanno senso).

Sia 𝑔 : (𝑎, 𝑏) → (𝑐, 𝑑) una funzione 𝐶 1 e 𝑓 : (𝑐, 𝑑) → ℝ una funzione continua e


integrabile in senso improprio su (𝑐, 𝑑). Siano −∞ ≤ 𝑎 < 𝑏 ≤ +∞ e −∞ ≤ 𝑐 < 𝑑 ≤
cambio di variabile +∞ tali che
𝑐 = lim+ 𝑔(𝑥), 𝑑 = lim 𝑔(𝑥).
𝑥→𝑎 𝑥→𝑏 −

Se 𝑓 è integrabile in senso improprio su (𝑐, 𝑑) allora 𝑓 ◦ 𝑔 è integrabile su (𝑎, 𝑏) e si ha


∫ 𝑏 ∫ 𝑑
𝑓 (𝑔(𝑥))𝑔 0(𝑥) 𝑑𝑥 = 𝑓 (𝑦) 𝑑𝑦.
𝑎 𝑐
6.8 integrali impropri 277

Se invece gli estremi sono scambiati:

𝑑 = lim+ 𝑔(𝑥), 𝑐 = lim− 𝑔(𝑥)


𝑥→𝑎 𝑥→𝑏

si avrà, nelle stesse ipotesi:


∫ 𝑏 ∫ 𝑐
𝑓 (𝑔(𝑥)) 𝑑𝑥 = 𝑓 (𝑦) 𝑑𝑦.
𝑎 𝑑

Se 𝐹 è derivabile su (𝑎, 𝑏), 𝑔 è continua e 𝐺 è una primitiva di 𝑔 allora vale la formula: integrazione per parti
∫ 𝑏 ∫ 𝑏
𝐹(𝑥)𝑔(𝑥) 𝑑𝑥 = [𝐹(𝑥)𝐺(𝑥)]𝑏𝑎 − 𝐹0(𝑥)𝐺(𝑥) 𝑑𝑥
𝑎 𝑎

se le quantità sul lato destro esistono (finite o infinite) e la loro differenza non è una
forma indeterminata.

Dimostrazione. Tutte queste proprietà sono già state dimostrate per l’integrale
delle funzioni limitate su intervalli limitati. Si possono facilmente estendere
all’integrale improprio laterale osservando che il limite mantiene le proprietà
richieste. Di conseguenza le proprietà valgono per additività anche per l’inte-
grale improprio bilaterale, facendo attenzione che non si produca una somma
indeterminata +∞ + (−∞). Infine, sempre per additività, le formule sono valide
per gli integrali impropri multilaterali.

Esercizio 6.63. Si calcoli il seguente integrale doppio:


∫ +∞ ∫ +∞ 
−𝑡𝑥
sin 𝑡 · 𝑒 𝑑𝑡 𝑑𝑥.
0 0

Dimostrazione. L’integrale più interno può essere calcolato per parti:


∫ +∞
𝐼(𝑥) = sin 𝑡 · 𝑒 −𝑡𝑥 𝑑𝑡
0
 +∞
∫ +∞
= − cos 𝑡 · 𝑒 −𝑡𝑥 −𝑥 cos 𝑡 · 𝑒 −𝑡𝑥 𝑑𝑡

0
0
 ∫ +∞ 
−𝑡𝑥 +∞ −𝑡𝑥
=0+1−𝑥 sin 𝑡 · 𝑒 +𝑥 sin 𝑡 · 𝑒 𝑑𝑡
 
0
0

da cui
1
𝐼(𝑥) = 1 − 𝑥 2 𝐼(𝑥), 𝐼(𝑥) =
1 + 𝑥2
e
+∞
𝜋

1
𝑑𝑥 = [arctg 𝑥]+∞ = .
0 1 + 𝑥2 0
2

Teorema 6.64 (integrabilità delle funzioni positive). Sia 𝑓 : (𝑎, 𝑏) → ℝ una


funzione localmente Riemann-integrabile non negativa: 𝑓 ≥ 0. Allora l’integrale di 𝑓
278 6 calcolo integrale

esiste (finito o infinito) ed è non negativo:


∫ 𝑏
𝑓 (𝑥) 𝑑𝑥 ≥ 0.
𝑎

Dimostrazione. Sia 𝑐 ∈ (𝑎, 𝑏) un punto fissato e sia


∫ 𝑥
𝐹(𝑥) = 𝑓 (𝑡) 𝑑𝑡.
𝑐

Essendo 𝑓 localmente Riemann-integrabile la funzione 𝐹 è ben definita ed


essendo 𝑓 ≥ 0 risulta che 𝐹 è crescente in quanto se 𝑥 2 > 𝑥 1 essendo 𝑓 ≥ 0 si ha
∫ 𝑥2 ∫ 𝑥2
𝐹(𝑥2 ) − 𝐹(𝑥 1 ) = 𝑓 (𝑡) 𝑑𝑡 ≥ 0 𝑑𝑡 = 0.
𝑥1 𝑥1

Dunque esistono i limiti:


∫ 𝑏
𝑓 (𝑥) 𝑑𝑥 = lim− 𝐹(𝛽)
𝑐 𝛽→𝑏
∫ 𝑐
𝑓 (𝑥) 𝑑𝑥 = lim+ −𝐹(𝛼)
𝑎 𝛼→𝑎

ed essendo 𝐹 crescente entrambi i limiti sono non negativi e quindi la somma


dei due limiti è ben definita.

Anche se non sappiamo calcolare esplicitamente un integrale, è spesso possibile


determinarne la convergenza confrontandolo, tramite il teorema seguente, con
un integrale noto.

Teorema 6.65 (criterio di confronto e confronto asintotico). Siano 𝑓 , 𝑔 : [𝑎, 𝑏) →


ℝ (con 𝑎 ≤ 𝑏 ≤ +∞) funzioni localmente Riemann-integrabili. Supponiamo inoltre
che per ogni 𝑥 ∈ [𝑎, 𝑏) si abbia 𝑓 (𝑥) ≥ 0 e 𝑔(𝑥) ≥ 0. In queste ipotesi sappiamo che i
due integrali:
∫ 𝑏 ∫ 𝑏
𝑓 (𝑥) 𝑑𝑥, 𝑔(𝑥) 𝑑𝑥 (6.27)
𝑎 𝑎
esistono entrambi (finiti o infiniti) e sono non negativi. Inoltre abbiamo i seguenti
criteri di confronto.

1. Confronto puntuale “ ≤ ”. Supponiamo che per ogni 𝑥 ∈ [𝑎, 𝑏) si abbia


𝑓 (𝑥) ≤ 𝑔(𝑥). Allora si ha:
∫ 𝑏 ∫ 𝑏
𝑓 (𝑥) 𝑑𝑥 ≤ 𝑔(𝑥) 𝑑𝑥. (6.28)
𝑎 𝑎

In particolare se l’integrale di 𝑔 è convergente anche l’integrale di 𝑓 è convergente


mentre se l’integrale di 𝑓 è divergente anche l’integrale di 𝑔 è divergente.
2. Confronto asintotico “”. Supponiamo che per 𝑥 → 𝑏 − si abbia 𝑓  𝑔
(cioè 𝑓 /𝑔 → 0). Allora risulta che se l’integrale di 𝑔 è convergente allora
anche l’integrale di 𝑓 è convergente mentre se l’integrale di 𝑓 è divergente anche
l’integrale di 𝑔 è divergente.
6.8 integrali impropri 279

3. Confronto asintotico “∼”. Suponiamo che per 𝑥 → 𝑏 − si abbia 𝑓 ∼ 𝑔 (cioè


𝑓 /𝑔 → 1). Allora i due integrali (6.27) hanno lo stesso carattere (entrambi
convergenti oppure entrambi divergenti).

Risultati analoghi valgono per funzioni definite su un intervallo aperto a sinistra: (𝑎, 𝑏]
con −∞ ≤ 𝑎 ≤ 𝑏 , in tal caso nei criteri asontotici si faranno i limiti per 𝑥 → 𝑎 + .

Dimostrazione. Gli integrali di 𝑓 e 𝑔 esistono grazie al teorema 6.64.

Se 𝑓 ≤ 𝑔 la disuguaglianza (6.28) è garantità dalla proprietà di monotonia


(teorema 6.62).

Se 𝑓 (𝑥)/𝑔(𝑥) → 0 per 𝑥 → 𝑏 − significa che esiste un punto 𝑐 ∈ [𝑎, 𝑏) tale


che per ogni 𝑥 ∈ [𝑐, 𝑏) si ha 𝑓 (𝑥)/𝑔(𝑥) ≤ 1 cioè 𝑓 (𝑥) ≤ 𝑔(𝑥). Dunque, per
l’additività e la monotonia dell’integrale, possiamo affermare che
∫ 𝑏 ∫ 𝑐 ∫ 𝑏 ∫ 𝑐 ∫ 𝑏 ∫ 𝑐 ∫ 𝑏 ∫ 𝑐
𝑓 = 𝑓 + 𝑓 ≤ 𝑓 + 𝑔= 𝑓 + 𝑔− 𝑔.
𝑎 𝑎 𝑐 𝑎 𝑐 𝑎 𝑎 𝑎

Sappiamo che gli integrali di 𝑓 e 𝑔 sull’intervallo [𝑎, 𝑐] sono convergenti in


quanto 𝑓 e 𝑔 sono limitate e Riemann-integrabili su [𝑎, 𝑐]. Dunque se l’integrale
∫𝑏 ∫𝑏 ∫𝑏
𝑎
𝑔 è convergente anche l’integrale 𝑎
𝑓 è convergente. Viceversa se 𝑎
𝑓 è
∫𝑏
divergente allora anche 𝑎
𝑔 è divergente.

Nel caso in cui 𝑓 (𝑥)/𝑔(𝑥) → 1 per 𝑥 → 𝑏 − possiamo trovare un punto 𝑐 ∈ [𝑎, 𝑏)


tale per cui 12 ≤ 𝑓 (𝑥)/𝑔(𝑥) ≤ 2 per ogni 𝑥 ∈ [𝑐, 𝑏). Si avrà allora per ogni
𝑥 ∈ [𝑐, 𝑏)
𝑓 (𝑥) ≤ 2 𝑔(𝑥), 𝑔(𝑥) ≤ 2 𝑓 (𝑥)
e si potrà quindi procedere come nel caso precedente.

Nei casi più frequenti il teorema precedente si applica confrontando la funzione


con una potenza:
(𝑥 − 𝑥0 )𝛼 , 𝛼 ∈ ℝ.

Sarà quindi utile sapere, come termine di paragone, per quali 𝛼 queste funzioni
hanno integrale convergente come nel seguente esempio.

Esempio 6.66. Sia 𝑎 > 0 e 𝑝 ∈ ℝ. Gli integrali


∫ +∞ ∫ −𝑎
1 1
𝑑𝑥, 𝑑𝑥
𝑎 𝑥𝑝 −∞ (−𝑥)𝑝

sono convergenti se e solo se 𝑝 > 1.

Sia 𝑥 0 ∈ [𝑎, 𝑏] e 𝑝 ∈ ℝ. Gli integrali


∫ 𝑥0 ∫ 𝑏
1 1
𝑑𝑥, 𝑑𝑥
𝑎 (𝑥 − 𝑥 0 )𝑝 𝑥0 (𝑥 − 𝑥0 )𝑝

sono convergenti se e solo se 𝑝 < 1.


280 6 calcolo integrale

La verifica si fa facilmente valutando il limite della primitiva 𝐹(𝑥) = 𝑥 1−𝑝 /(1 − 𝑝) negli
estremi dell’intervallo.

Esempio 6.67. L’integrale ∫ +∞


2
𝑒 −𝑥 𝑑𝑥
−∞
2
è convergente in quanto per 𝑥 → +∞ risulta 𝑒 −𝑥  1/𝑥 2 e l’integrale di 1/𝑥 2 è
convergente (esempio 6.66) in un intorno di +∞ e di −∞. Nell’esercizio ?? dimostreremo

che questo integrale è pari a 𝜋.

Esempio 6.68 (la funzione Γ Eulero). Si definisce Γ : (0 , +∞) → ℝ come


∫ +∞
Γ(𝑥) = 𝑒 −𝑡 𝑡 𝑥−1 𝑑𝑡.
0

L’integrale converge per ogni 𝑥 > 0 in quanto posto 𝑓 (𝑡) = 𝑒 −𝑡 𝑡 𝑥−1 per 𝑡 → 0+ si ha
𝑓 (𝑡) ∼ 𝑡 𝑥−1 che ha integrale convergente in un intorno di 0 mentre per 𝑡 → +∞ si ha
𝑓 (𝑡)  𝑒 −𝑡/2 che ha integrale convergente in un intorno di +∞.

Integrando per parti si ottiene una interessante proprietà della funzione Γ:


∫ +∞  +∞
∫ +∞
𝑒 −𝑡 𝑡 𝑥 𝑑𝑡 = −𝑒 −𝑡 𝑡 𝑥 𝑒 −𝑡 𝑥𝑡 𝑥−1 𝑑𝑡

0
+
0 0
∫ +∞
=𝑥 𝑒 −𝑡 𝑡 𝑥−1 𝑑𝑡
0

cioè Γ(𝑥 + 1) = 𝑥Γ(𝑥). Osservando che Γ(1) = 1 = 0! si può quindi dimostrare, per
induzione, che Γ(𝑛 + 1) = 𝑛 ! per ogni 𝑛 ∈ ℕ . Abbiamo quindi trovato una funzione
che estende il fattoriale da ℕ a tutto l’intervallo di numeri reali (−1 , +∞).

Nell’esercizio ?? dimostreremo che la funzione Γ è derivabile.

Non siamo ora in grado di calcolare il valore di Γ(𝑥) se 𝑥 non è intero, ma possiamo
ricondurre il valore di Γ(1/2) all’integrale della gaussiana, facendo il cambio di variabile
𝑡 = 𝑠 2 , 𝑑𝑡 = 2 𝑠𝑑𝑠 :
+∞ +∞ 2 +∞
𝑒 −𝑡 𝑒 −𝑠
∫ ∫ ∫
2
Γ(1/2) = √ 𝑑𝑡 = · 2𝑠 𝑑𝑠 = 𝑒 −𝑠 𝑑𝑠.
0 𝑡 0 𝑠 −∞

Nell’esercizio ?? troveremo il valore dell’integrale della gaussiana e potremo quindi



concludere che Γ(1/2) = 𝜋. Questo ci permette di calcolare il valore di Γ su tutti i
semi-interi:
√ √
1 𝜋 3 3 𝜋
Γ(3/2) = Γ(1/2) = , Γ(5/2) = Γ(3/2) = ,...
2 2 2 4

Esempio 6.69. L’integrale ∫ +∞


1
𝑑𝑥
−∞ 1 + 𝑥2
è convergente in quanto per 𝑥 → +∞ risulta 1/(1 + 𝑥 2 ) ∼ 1/𝑥 2 .
6.8 integrali impropri 281

L’integrale ∫ +∞
1
𝑑𝑥
1 ln 𝑥
è divergente perché per 𝑥 → +∞ si ha 1/ln 𝑥  1/𝑥 e per 𝑥 → 1+ si ha 1/ln 𝑥 ∼
1/(𝑥 − 1). Per 𝑝 = 1 gli integrali di 1/𝑥 a +∞ e di 1/(𝑥 − 1) in 1 sono entrambi
divergenti.

Se 𝑓 : [𝑎, +∞) è una funzione localmente Riemann-integrabile e se 𝑓 (𝑥) → ℓ ≠ 0 per


𝑥 → +∞ allora l’integrale di 𝑓 è divergente. Se ℓ > 0 esisterà 𝑐 > 𝑎 tale che per 𝑥 > 𝑐
si abbia 𝑓 (𝑥) ≥ 0 (permanenza
∫ +∞ del segno). Visto che 𝑓 (𝑥) ∼ ℓ per 𝑥 → +∞ possiamo
∫ +∞
quindi concludere che 𝑐 𝑓 (𝑥) = +∞ e quindi anche 𝑎 𝑓 (𝑥) = +∞. Se ℓ < 0 si
può cambiare segno ad 𝑓 e ripetere l’argomento precedente si scopre quindi che in questo
caso l’integrale di 𝑓 è −∞.

Esercizio 6.70. Si mostri con un esempio che se una funzione 𝑓 ha integrale convergente
sull’intervallo [0 , +∞) non è detto che 𝑓 (𝑥) → 0 per 𝑥 → +∞.

Teorema 6.71 (criterio di convergenza assoluta). Sia 𝑓 : (𝑎, 𝑏) → ℝ una funzione


localmente Riemann-integrabile. Allora anche | 𝑓 | è localmente Riemann-integrabile e
se ∫ 𝑏
| 𝑓 (𝑥)| 𝑑𝑥 < +∞
𝑎

(cioè | 𝑓 | è integrabile in senso improprio) allora anche 𝑓 è integrabile in senso improprio


e
∫ 𝑏 ∫ 𝑏
𝑓 (𝑥) 𝑑𝑥 ≤ | 𝑓 (𝑥)| 𝑑𝑥 < +∞.


𝑎 𝑎

Dimostrazione. Poniamo 𝑓 = 𝑓 + − 𝑓 − con 𝑓 + ≥ 0 e 𝑓 − ≥ 0. Se 𝑓 è localmente


Riemann-integrabile 𝑓 + e 𝑓 − sono localmente Riemann-integrabili (grazie al
teorema 6.12). Osserviamo che si ha 𝑓 = 𝑓 + − 𝑓 − e | 𝑓 | = 𝑓 + + 𝑓 − . Visto che
0 ≤ 𝑓 + ≤ | 𝑓 | possiamo applicare i criteri di confronto e affermare che 𝑓 + ha
integrale convergente. Lo stesso vale per 𝑓 − e dunque per 𝑓 = 𝑓 + − 𝑓 − . Inoltre
∫ ∫ ∫ 𝑏 ∫ 𝑏
𝑏 𝑏 ∫ 𝑏 ∫ 𝑏
+
𝑓 = 𝑓 − 𝑓 − ≤ 𝑓+ + 𝑓− = | 𝑓 |.


𝑎 𝑎 𝑎 𝑎 𝑎 𝑎

Definizione 6.72 (convergenza assoluta). Quando


∫ 𝑏
| 𝑓 (𝑥)| 𝑑𝑥 < +∞
𝑎

diremo che l’integrale di 𝑓 è assolutamente convergente o che 𝑓 è assolutamente


integrabile (in senso improprio). Il teorema precedente ci garantisce che una funzione
assolutamente integrabile è integrabile.
282 6 calcolo integrale

Esempio 6.73. L’integrale


∫ +∞
sin(𝑥 2 ) · 𝑒 −𝑥 𝑑𝑥
0

è assolutamente convergente (e quindi convergente) in quanto la funzione integranda è


continua, e si ha
sin(𝑥 2 ) · 𝑒 −𝑥 ≤ 𝑒 −𝑥

da cui, per confronto,


∫ ∫ +∞
sin(𝑥 2 ) · 𝑒 −𝑥 𝑑𝑥 ≤ 𝑒 −𝑥 𝑑𝑥 < +∞.

0

Esempio 6.74 (funzione integrabile ma non assolutamente). Si consideri la


funzione 𝑓 : (0 , +∞) → ℝ definita da

sin 𝑥
𝑓 (𝑥) = .
𝑥
Visto che 𝑓 (𝑥) → 1 per 𝑥 → 0+ la funzione 𝑓 può essere estesa per continuità ad
una funzione continua sull’intervallo [0 , +∞) ponendo 𝑓 (0) = 1. Dunque l’integrale
converge sull’intervallo (0 , 1] e ci si riduce a considerare l’intervallo [1 , +∞).

Integrando per parti,


+∞ h − cos 𝑥 i +∞ ∫ +∞ cos 𝑥
sin 𝑥

𝑑𝑥 = − 𝑑𝑥
1 𝑥 𝑥 1 1 𝑥2
+∞
cos 𝑥

= cos 1 − 𝑑𝑥.
1 𝑥2
cos 𝑥
Osserviamo ora che la funzione 𝑥2
è integrabile per il criterio della convergenza
assoluta, in quanto:
cos 𝑥 1

2 ≤ 2
𝑥 𝑥
che è integrabile su [1 , +∞). Dunque la nostra funzione ha integrale convergente anche
in [1 , +∞) e∫dunque ha integrale convergente su tutto (0 , +∞). Nell’esercizio 7.56
+∞ sin 𝑥 𝜋
vedremo che 0 𝑥 = 2.

Tale funzione non è però integrabile assolutamente. Infatti si ha, per ogni 𝑘 ∈ ℕ

(𝑘+1)𝜋 ∫ (𝑘+1)𝜋
sin 𝑥 | sin 𝑥|

𝑑𝑥 ≥ 𝑑𝑥
𝑥 (𝑘 + 1)𝜋
𝑘𝜋 𝑘𝜋
∫𝜋
0
sin 𝑥 𝑑𝑥 2
= =
(𝑘 + 1)𝜋 (𝑘 + 1)𝜋
6.8 integrali impropri 283

da cui

+∞ 𝑏 b 𝜋𝑏 c−1 ∫ (𝑘+1)𝜋
sin 𝑥 𝑑𝑥 = lim
sin 𝑥 sin 𝑥
∫ ∫
X
𝑑𝑥 ≥ lim
𝑥 𝑑𝑥


𝑥 𝑏→+∞ 𝑥 𝑏→+∞
0 0 𝑘=0 𝑘𝜋
+∞
X 2
= = +∞.
𝑘=0
(𝑘 + 1)𝜋

Esercizio 6.75. Si provi ad applicare


∫ +∞ il metodo utilizzato nell’esempio 6.74 ad un
generico integrale della forma 1 𝑓 · 𝑔 identificando le ipotesi su 𝑓 e su 𝑔 che
garantiscono la convergenza dell’integrale. Si dovrebbe ottenere un criterio analogo al
teorema 3.32 di Dirichlet per la convergenza delle serie.

I criteri che abbiamo visto fin’ora mettono in evidenza una notevole analogia
tra serie e integrali. Determinare la convergenza di un integrale è però, in
generale, più semplice che determinare la convergenza della corrispondente
serie. Nell’esercizio seguente, ad esempio, è sufficiente trovare una primitiva
delle funzioni integrande, per determinare il carattere dell’integrale.

Esercizio 6.76. Si determini per quali 𝛼, 𝛽 ∈ ℝ risultano convergenti gli integrali:


1
∫ ∫ +∞
2 1 1
𝑑𝑥, 𝑑𝑥.
0 𝑥 𝛼 | ln 𝑥| 𝛽 2 𝑥 𝛼 ln𝛽 𝑥

Teorema 6.77 (collegamento tra serie ed integrali impropri). Sia 𝑓 : [1 , +∞) → ℝ


una funzione decrescente non negativa e sia 𝑎 𝑘 = 𝑓 (𝑘). Allora la serie
+∞
X
𝑎𝑘
𝑘=1

è convergente se e solo se è convergente l’integrale


∫ +∞
𝑓 (𝑥) 𝑑𝑥.
1

E, più precisamente, per ogni 𝑛 ∈ ℕ ∪ {+∞} si ha


𝑛
X ∫ 𝑛
0≤ 𝑎𝑘 − 𝑓 (𝑥) 𝑑𝑥 ≤ 𝑎1 . (6.29)
𝑘=1 1

Dimostrazione. Visto che la funzione 𝑓 , è non negativa e monotona, l’integrale


improprio di 𝑓 su [1 , +∞) esiste (finito o infinito) per il teorema 6.64. Anche la
serie 𝑓 (𝑘) essendo a termini non negativi risulta essere determinata.
P

Essendo 𝑓 decrescente, per ogni 𝑥 ∈ [𝑘, 𝑘 + 1] si ha

𝑓 (𝑘 + 1) ≤ 𝑓 (𝑥) ≤ 𝑓 (𝑘)
284 6 calcolo integrale

integrando su [𝑘, 𝑘 + 1] si ottiene


∫ 𝑘+1
𝑓 (𝑘 + 1) ≤ 𝑓 (𝑥) 𝑑𝑥 ≤ 𝑓 (𝑘)
𝑘

e sommando per 𝑘 = 1 , . . . , 𝑛 − 1 si ottiene:

𝑛
X ∫ 𝑛 𝑛−1
X
𝑓 (𝑘) ≤ 𝑓 (𝑥) 𝑑𝑥 ≤ 𝑓 (𝑘)
𝑘=2 1 𝑘=1

che implica la (6.29) se 𝑛 ∈ ℕ . Facendo tendere 𝑛 → +∞ la (6.29) rimane


comunque verificata. La prima disequazione ci permette di stimare l’integrale
con la serie e la seconda ci permette viceversa di stimare la serie con l’integrale.
Dunque se uno dei due converge anche l’altro converge, come volevamo
dimostrare.
stima asintotica 𝑛 !
Esempio 6.78 (stima asintotica di ln 𝑛 !). Osserviamo che
𝑛
Y 𝑛
X
ln(𝑛 !) = ln 𝑘= ln 𝑘.
𝑘=1 𝑘=1

Applichiamo lo stesso procedimento utilizzato nel teorema precedente alla funzione


𝑓 (𝑥) = ln 𝑥 . Visto che il logaritmo è crescente (invece che decrescente) otterremo delle
stime rovesciate, ma analoghe. Ripetendo con attenzione i conti, si ottiene:
∫ 𝑛 𝑛
X ∫ 𝑛+1
ln(𝑥) 𝑑𝑥 ≤ ln 𝑘 ≤ ln(𝑥) 𝑑𝑥
1 𝑘=2 2


e ricordando che ln 𝑥 = 𝑥 ln 𝑥 − 𝑥 si ottiene

𝑛 ln 𝑛 − 𝑛 + 1 ≤ ln(𝑛 !) ≤ (𝑛 + 1) ln(𝑛 + 1) − 𝑛 − 2 ln 2 + 1

da cui, dividendo ambo i membri per 𝑛 ln 𝑛 e facendo tendere 𝑛 → +∞ si trova

ln 𝑛 !
→1
𝑛 ln 𝑛
ovvero
ln(𝑛 !) ∼ 𝑛 ln 𝑛 per 𝑛 → +∞.

Si faccia attenzione che in generale non possiamo fare l’esponenziale di ambo i membri
di una equivalenza asintotica e sperare che l’equivalenza asintotica rimanga valida. In
effetti trovare una stima asintotica per 𝑛 ! è molto più complicato (rispetto alla stima che
abbiamo trovato per il suo logaritmo). Lo faremo nel teorema 6.88 trovando la formula
di Stirling.

6.9 studio di funzioni integrali

Teorema 6.79 (derivata di una funzione integrale). Sia 𝐼 ⊆ ℝ un intervallo e


𝑓 : 𝐼 → ℝ una funzione localmente Riemann-integrabile. Siano 𝑎, 𝑏 : 𝐴 → 𝐼 funzioni
6.9 studio di funzioni integrali 285

definite su un insieme 𝐴 ⊆ ℝ. Allora è ben definita la funzione 𝐹 : 𝐴 → ℝ


∫ 𝑏(𝑥)
𝐹(𝑥) = 𝑓 (𝑡) 𝑑𝑡.
𝑎(𝑥)

Se inoltre 𝑓 è continua e se 𝑎, 𝑏 sono derivabili allora anche 𝐹 è derivabile e si ha

𝐹0(𝑥) = 𝑓 (𝑏(𝑥)) · 𝑏 0(𝑥) − 𝑓 (𝑎(𝑥)) · 𝑎 0(𝑥).

Dimostrazione. Per le ipotesi enunciate per ogni 𝑥 ∈ 𝐴 risulta che 𝑓 è integrabile


sull’intervallo [𝑎(𝑥), 𝑏(𝑥)] e dunque la funzione 𝐹 è ben definita. Fissato 𝑥 0 ∈ 𝐼
possiamo considerare la funzione integrale
∫ 𝑥
𝐺(𝑥) = 𝑓 (𝑡) 𝑑𝑡
𝑥0

e scrivere
𝑏(𝑥)
𝐹(𝑥) = [𝐺(𝑥)]𝑎(𝑥) = 𝐺(𝑏(𝑥)) − 𝐺(𝑎(𝑥)).

Se 𝑓 è continua possiamo applicare il teorema fondamentale del calcolo integrale


che garantisce che 𝐺 è derivabile e 𝐺0(𝑥) = 𝑓 (𝑥) per ogni 𝑥 ∈ 𝐼 . Dunque se
anche 𝑎 e 𝑏 sono derivabili si ha, per la formula di derivazione della funzione
composta:

𝐹0(𝑥) = 𝐺0(𝑏(𝑥)) · 𝑏 0(𝑥) − 𝐺0(𝑎(𝑥)) · 𝑎 0(𝑥) = 𝑓 (𝑏(𝑥)) · 𝑏 0(𝑥) − 𝑓 (𝑎(𝑥)) · 𝑎 0(𝑥).

Esempio 6.80. La funzione


∫ 𝑥4
1
𝐹(𝑥) = 𝑑𝑡
𝑥2 ln 𝑡

è definita per ogni 𝑥 ∈ ℝ \ {0 , 1 , −1} in quanto in tal caso l’intervallo [𝑥 2 , 𝑥 4 ] è


contenuto nell’insieme di definizione della funzione integranda. Si ha inoltre

4𝑥 3 2𝑥 𝑥3 − 𝑥2
𝐹0(𝑥) = − = .
ln(𝑥 4 ) ln(𝑥 2 ) ln |𝑥|

Teorema 6.81 (integrale dell’ 𝑜 -piccolo). Sia 𝑓 (𝑥) una funzione continua definita su
un intervallo [0 , 𝑏] e tale che per 𝑥 → 0+ si ha 𝑓 (𝑥) = 𝑜(𝑥 𝛼 ) per un qualche 𝛼 ≥ 0.
Allora posto ∫ 𝑥
𝐹(𝑥) = 𝑓 (𝑡) 𝑑𝑡
0

risulta 𝐹(𝑥) = 𝑜(𝑥 𝛼+1 ). In modo più conciso si può dunque scrivere
∫ 𝑥
𝑜(𝑡 𝛼 ) 𝑑𝑡 = 𝑜(𝑥 𝛼+1 ), per 𝑥 → 0+
0

se la funzione integranda è continua.


286 6 calcolo integrale

Dimostrazione. Per il teorema della media integrale (teorema 6.20) per ogni
𝑥 ∈ [0, 𝑏] deve esistere 𝑐(𝑥) ∈ [0 , 𝑥] tale che
∫ 𝑥
𝐹(𝑥) = 𝑓 (𝑡) 𝑑𝑡 = 𝑥 · 𝑓 (𝑐(𝑥)).
0

Dunque, essendo 0 ≤ 𝑐(𝑥) ≤ 𝑥 si ha

𝐹(𝑥) 𝑓 (𝑐(𝑥)) 𝑓 (𝑐(𝑥)) 𝑐(𝑥) 𝛼 𝑓 (𝑐(𝑥))



· ≤
𝑐 𝛼 (𝑥) → 0
= =
𝑥 𝛼+1 𝑥 𝛼 𝑐 𝛼 (𝑥) 𝑥

visto che 𝑓 (𝑥) = 𝑜(𝑥 𝛼 ) e che per 𝑥 → 0 anche 𝑐(𝑥) → 0 si ha infatti

𝑓 (𝑐(𝑥))
lim = 0.
𝑥→0 𝑐 𝛼 (𝑥)

Esempio 6.82. Si voglia calcolare


sin 𝑥
2 − 𝑡 sin 𝑡 − 2 cos 𝑡

1
lim+ 𝑑𝑡.
𝑥→0 𝑥4 sin2 𝑥 𝑒𝑡 − 1

Chiamata 𝑓 (𝑥) la funzione integranda non è difficile verificare, tramite le formule di


Taylor, che risulta
𝑥4
12 − 𝑜(𝑥 )
4
𝑥3
𝑓 (𝑥) = = + 𝑜(𝑥 3 ).
𝑥 + 𝑜(𝑥) 12
In particolare la funzione 𝑓 può essere estesa per continuità ponendo 𝑓 (0) = 0. Si ha
dunque, per il teorema precedente,
𝑥 𝑥
𝑡3 𝑥4
∫ ∫  
𝐹(𝑥) = 𝑓 (𝑡) 𝑑𝑡 = + 𝑜(𝑡 3 ) 𝑑𝑡 = + 𝑜(𝑥 4 )
0 0 12 48

da cui
sin 𝑥
𝐹(sin 𝑥) − 𝐹(sin2 𝑥)

1
𝑓 (𝑡) 𝑑𝑡 =
𝑥4 sin2 𝑥 𝑥4
(sin 𝑥)4 (sin2 𝑥)4
48 + 𝑜(sin4 𝑥) − 48 + 𝑜(sin8 𝑥)
=
𝑥4
𝑥4
48 + 𝑜(𝑥 4 ) 1
= → .
𝑥4 48

Esempio 6.83. Si voglia calcolare


∫ 2𝑥
1
lim+ 𝑑𝑡.
𝑥→0 𝑥 𝑡 + sin 𝑡

Posto
1
𝑓 (𝑥) =
𝑥 + sin 𝑥
6.9 studio di funzioni integrali 287

si ha
1 1 1 + 𝑜(𝑥) 1
𝑓 (𝑥) = = = = + 𝑜(1).
2 𝑥 + 𝑜(𝑥 2 ) 2 𝑥(1 + 𝑜(𝑥)) 2𝑥 2𝑥
La funzione 𝑓 (𝑥) − 21𝑥 = 𝑜(1) può essere estesa per continuità anche in 𝑥 = 0 e dunque
possiamo applicare il teorema precedente per ottenere
∫ 2𝑥 ∫ 2𝑥  
1
𝑓 (𝑡) 𝑑𝑡 = + 𝑜(1) 𝑑𝑡
𝑥 𝑥 2𝑡
1
= [ln 𝑡]2𝑥𝑥 + [𝑜(𝑡)]2𝑥𝑥
2
ln 2 𝑥 − ln 𝑥 ln 2 ln 2
= + 𝑜(2𝑥) − 𝑜(𝑥) = + 𝑜(𝑥) → .
2 2 2

Teorema 6.84. Siano 𝑎, 𝑏 : 𝐽 → ℝ due funzioni definite su un intervallo 𝐽 a valori in


un intervallo 𝐼 . Sia 𝑥 0 un punto di accumulazione di 𝐽 e sia 𝑎 un punto di accumulazione
di 𝐼 . Supponiamo inoltre che per 𝑥 → 𝑥 0 si abbia 𝑎(𝑥) → 𝑎 , 𝑏(𝑥) → 𝑎 . Siano
𝑓 , 𝑔 : 𝐼 → ℝ funzioni continue. Se 𝑓 (𝑥) ∼ 𝑔(𝑥) per 𝑥 → 𝑎 allora si ha
∫ 𝑏(𝑥) ∫ 𝑏(𝑥)
𝑓 (𝑡) 𝑑𝑡 ∼ 𝑔(𝑡) 𝑑𝑡 per 𝑥 → 𝑥 0 .
𝑎(𝑥) 𝑎(𝑥)

Dimostrazione. Sia 𝐹 una primitiva di 𝑓 e 𝐺 una primitiva di 𝑔 . Allora


∫ 𝑏(𝑥)
𝑓 (𝑡) 𝑑𝑡
𝑎(𝑥) 𝐹(𝑏(𝑥)) − 𝐹(𝑎(𝑥))
= .
∫ 𝑏(𝑥) 𝐺(𝑏(𝑥)) − 𝐺(𝑎(𝑥))
𝑔(𝑡) 𝑑𝑡
𝑎(𝑥)

Applicando il teorema 5.42 di Cauchy si ha

𝐹(𝑏(𝑥)) − 𝐹(𝑎(𝑥)) 𝐹0(𝑐(𝑥)) 𝑓 (𝑐(𝑥))


= 0 =
𝐺(𝑏(𝑥)) − 𝐺(𝑎(𝑥)) 𝐺 (𝑐(𝑥)) 𝑔(𝑐(𝑥))

per un certo 𝑐(𝑥) compreso tra 𝑎(𝑥) e 𝑏(𝑥). Visto che 𝑎(𝑥) → 𝑎 e 𝑏(𝑥) → 𝑎
si avrà anche 𝑐(𝑥) → 𝑎 per 𝑥 → 𝑥 0 . Essendo inoltre 𝑓 (𝑥) ∼ 𝑔(𝑥) per 𝑥 → 𝑎
facendo un cambio di variabile nel limite possiamo dedurre che

𝑓 (𝑐(𝑥))
→1 per 𝑥 → 𝑥 0 .
𝑔(𝑐(𝑥))

Esempio 6.85. Si voglia calcolare

3𝑥 2
tg 𝑡

lim 𝑑𝑥.
𝑥→0 𝑥2 𝑡2

Visto che per 𝑥 → 0 si ha


tg 𝑥 1

𝑥2 𝑥
288 6 calcolo integrale

e visto che ∫ 3𝑥 2
1
𝑑𝑡 = ln(3𝑥 2 ) − ln(𝑥 2 ) = ln 3
𝑥2 𝑡
grazie al teorema precedente possiamo dedurre che il limite cercato è proprio ln 3.

6.10 alcune applicazioni del calcolo integrale


𝜋 è irrazionale
Teorema 6.86 (irrazionalità di 𝜋). Il numero 𝜋 è irrazionale.

Dimostrazione. Il nostro primo obiettivo è quello di trovare delle formule


ricorsive per il calcolo del seguente integrale:
∫ 𝜋
𝐼𝑛 = 𝑥 𝑛 (𝜋 − 𝑥)𝑛 sin 𝑥 𝑑𝑥.
0

Innanzitutto osserviamo che si ha


∫ 𝜋
𝐼0 = sin 𝑥 𝑑𝑥 = [− cos 𝑥]𝜋0 = 2
0

e, utilizzando l’integrazione per parti:


∫ 𝜋
𝐼1 = 𝑥(𝜋 − 𝑥) sin 𝑥 𝑑𝑥
0
∫ 𝜋
= [𝑥(𝜋 − 𝑥)(− cos 𝑥)]𝜋0 − (𝜋 − 2 𝑥)(− cos 𝑥) 𝑑𝑥
0
∫ 𝜋 ∫ 𝜋 ∫ 𝜋
= (𝜋 − 2 𝑥) cos 𝑥 𝑑𝑥 = 𝜋 cos 𝑥 𝑑𝑥 − 2 𝑥 cos 𝑥 𝑑𝑥
0 0 0
 ∫ 𝜋 
= −2 [𝑥 sin 𝑥]𝜋0 − sin 𝑥 𝑑𝑥 = 2[cos 𝑥]𝜋0 = 4.
0

Per 𝑛 ≥ 2 si procede in maniera simile, la funzione 𝑥 𝑛 (𝜋 − 𝑥)𝑛 si annulla agli


estremi di integrazione quindi integrando per parti si ottiene:
∫ 𝜋
𝐼𝑛 = 𝑛𝑥 𝑛−1 (𝜋 − 𝑥)𝑛 − 𝑛𝑥 𝑛 (𝜋 − 𝑥)𝑛−1 cos 𝑥 𝑑𝑥
 
0

anche la funzione tra parentesi quadre si annulla agli estremi dell’intervallo di


integrazione e quindi integrando nuovamente per parti si ottiene:
∫ 𝜋
𝐼𝑛 = − 𝑛(𝑛 − 1)𝑥 𝑛−2 (𝜋 − 𝑥)𝑛 − 2𝑛 2 𝑥 𝑛−1 (𝜋 − 𝑥)𝑛−1

0
+ 𝑛(𝑛 − 1)𝑥 𝑛 (𝜋 − 𝑥)𝑛−2 sin(𝑥) 𝑑𝑥

∫ 𝜋
= 2𝑛 2 𝐼𝑛−1 − (𝑛 2 − 𝑛) (𝜋 − 𝑥)2 + 𝑥 2 𝑥 𝑛−2 (𝜋 − 𝑥)𝑛−2 sin 𝑥 𝑑𝑥
 

∫0 𝜋
= 2𝑛 𝐼𝑛−1 − (𝑛 − 𝑛)
2 2
𝜋2 − 2 𝑥(𝜋 − 𝑥) 𝑥 𝑛−2 (𝜋 − 𝑥)𝑛−2 sin 𝑥 𝑑𝑥
 
0
= 2𝑛 2 𝐼𝑛−1 − (𝑛 2 − 𝑛)𝜋2 𝐼𝑛−2 + 2(𝑛 2 − 𝑛)𝐼𝑛−1
6.10 alcune applicazioni del calcolo integrale 289

da cui

𝐼𝑛 = (4𝑛 2 − 2𝑛)𝐼𝑛−1 − (𝑛 2 − 𝑛)𝜋2 𝐼𝑛−2 . (6.30)

𝑝
Supponiamo ora per assurdo che sia 𝜋 = 𝑞 con 𝑝, 𝑞 ∈ ℕ e consideriamo la
successione
𝑞 2𝑛
𝑎𝑛 = 𝐼𝑛 .
𝑛!
Dalla relazione (6.30) deduciamo un relazione ricorsiva per 𝑎 𝑛 :

𝑞 2𝑛 𝑝 2 (𝑛 − 2)!
 
(𝑛 − 1)!
𝑎𝑛 = −(𝑛 2 − 𝑛) 2 2𝑛−4 𝑎 𝑛−2 + (4𝑛 2 − 2𝑛) 2𝑛−2 𝑎 𝑛−1
𝑛! 𝑞 𝑞 𝑞
= −𝑞 2 𝑝 2 𝑎 𝑛−2 + (4𝑛 − 2)𝑞 2 𝑎 𝑛−1

che ci dice, in particolare, che se 𝑎 𝑛−2 e 𝑎 𝑛−1 sono interi allora anche 𝑎 𝑛 è intero
(in quanto somma di prodotti di numeri interi). Visto che anche i primi due
termini:
𝑎 0 = 𝐼0 = 2 , 𝑎 1 = 𝑞 2 𝐼1 = 4 𝑞 2
sono interi possiamo dedurre, per induzione, che tutti i termini della successione
𝑎 𝑛 sono interi.

D’altra parte osservando che 𝑦 = 𝑥(𝜋 − 𝑥) è il grafico di una parabola con asse
𝑥 = 𝜋2 sappiamo che per ogni 𝑥 si ha 𝑥(𝜋 − 𝑥) ≤ 𝜋4 e quindi
2

𝜋2 𝑛
0 ≤ 𝑥 𝑛 (𝜋 − 𝑥)𝑛 sin 𝑥 ≤ 𝑥 𝑛 (𝜋 − 𝑥)𝑛 ≤ .
4𝑛
Dunque
𝜋2𝑛+1
0 ≤ 𝐼𝑛 ≤
4𝑛
cioè
𝑞 2𝑛 𝜋2𝑛+1
0 ≤ 𝑎𝑛 ≤ .
𝑛 ! 4𝑛
Visto che 𝑛 !  𝐶 𝑛 , possiamo dunque affermare che 𝑎 𝑛 → 0. D’altra parte
abbiamo visto che 𝑎 𝑛 ∈ ℤ e certamente 𝑎 𝑛 > 0 in quanto 𝐼𝑛 ≠ 0 visto che 𝑓𝑛
è una funzione continua, non negativa e non identicamente nulla. Ma non è
possibile che una successione di numeri interi positivi converga a zero: abbiamo
quindi ottenuto l’assurdo. prodotto di Wallis

Teorema 6.87 (prodotto di Wallis). Si ha


+∞
𝜋 Y (2 𝑘)2 2 2 4 4 6 6 8 8
= = · · · · · · · ...
2 𝑘=1
(2 𝑘 − 1 )(2 𝑘 + 1 ) 1 3 3 5 5 7 7 9 binomiale centrale

E si ottiene di conseguenza la seguente stima asintotica per il coefficiente binomiale


centrale
2𝑛 4𝑛
 
∼√ per 𝑛 → +∞.
𝑛 𝜋𝑛
290 6 calcolo integrale

Dimostrazione. Consideriamo la successione di integrali:


∫ 𝜋
𝐼𝑛 = sin𝑛 (𝑥) 𝑑𝑥.
0

Essendo 0 ≤ sin𝑛 (𝑥) ≤ 1 per ogni 𝑥 ∈ [0 , 𝜋] ed essendo sin𝑛+1 (𝑥) ≤ sin𝑛 (𝑥) per
ogni 𝑥 ∈ [0 , 𝜋] è chiaro che 𝐼𝑛 è una successione decrescente di numeri positivi.

Da un calcolo diretto troviamo che


∫ 𝜋 ∫ 𝜋
𝐼0 = 1 𝑑𝑥 = 𝜋, 𝐼1 = sin(𝑥) 𝑑𝑥 = [− cos 𝑥]𝜋0 = 2.
0 0

Se 𝑛 ≥ 2, integrando per parti troviamo invece una relazione ricorsiva


∫ 𝜋
𝐼𝑛 = sin𝑛−1 (𝑥) sin(𝑥) 𝑑𝑥
0
𝜋
∫ 𝜋
𝑛−1
sin𝑛−2 cos2 (𝑥) 𝑑𝑥

= − sin (𝑥) cos(𝑥) 0
+ (𝑛 − 1)
0
∫ 𝜋
= 0 + (𝑛 − 1) sin𝑛−2 (1 − sin2 (𝑥)) 𝑑𝑥
0
= (𝑛 − 1)𝐼𝑛−2 − (𝑛 − 1)𝐼𝑛

da cui
𝑛−1
𝐼𝑛−2 . 𝐼𝑛 = (6.31)
𝑛
Questa formula ricorsiva ci permette di calcolare separatamente i termini pari
e dispari della successione utilizzando la notazione del semi fattoriale (si veda
l’osservazione 1.31):

2𝑛 − 1 2𝑛 − 3 3 1 (2𝑛 − 1)!!
𝐼2 𝑛 = · ··· · · 𝐼0 = ·𝜋
2𝑛 2𝑛 − 2 4 2 (2𝑛)!!
2𝑛 2𝑛 − 2 4 2 (2𝑛)!!
𝐼2𝑛+1 = · ··· · · 𝐼1 = · 2.
2𝑛 + 1 2𝑛 − 1 5 3 (2𝑛 + 1)!!

Ricordando che 𝐼𝑛 è decrescente si osserva che vale

𝐼2𝑛+2 𝐼2𝑛+1 2𝑛
≤ ≤ =1
𝐼2 𝑛 𝐼2 𝑛 2𝑛

e grazie a (6.31)
𝐼2𝑛+2 2𝑛 + 1
= →1
𝐼2 𝑛 2𝑛
𝐼2𝑛+1
da cui ottieniamo che 𝐼2 𝑛 → 1.

In conclusione, visto che 𝜋 compare nella formula dei termini pari, ma non
in quella dei termini dispari, e visto che le due espressioni sono asintotiche
6.10 alcune applicazioni del calcolo integrale 291

possiamo ottenere la formula per il calcolo di 𝜋2 :

(2𝑛)!!
𝜋 𝜋 𝐼2𝑛+1 (2𝑛+1)!! ((2𝑛)!!)2
= lim = lim = lim
2 2 𝑛→+∞ 𝐼2𝑛 𝑛→+∞ (2𝑛−1)!! 𝑛→+∞ (2𝑛 + 1)!!(2𝑛 − 1)!!
(2𝑛)!!
(2𝑛)(2𝑛)(2𝑛 − 2)(2𝑛 − 2) · · · 4 · 4 · 2 · 2
= lim .
𝑛→+∞ (2𝑛 + 1)(2𝑛 − 1)(2𝑛 − 1)(2𝑛 − 3)(2𝑛 − 3) · · · 3 · 3 · 1

Per ottenere una stima asintotica del coefficiente binomiale centrale ricordiamo
che si ha (osservazione 1.31)

(2𝑛)!! = 2𝑛 𝑛 !
(2𝑛 + 1)!
(2𝑛 + 1)!! =
2𝑛 𝑛 !
dunque la stima asintotica di Wallis si può scrivere come

𝜋 (2𝑛)!!
r
∼√
2 2𝑛 + 1(2𝑛 − 1)!!
2𝑛 𝑛 !
=√
(2𝑛−1)!
2𝑛 + 1 2𝑛−1 (𝑛−1)!
2𝑛 (𝑛 !)2 2𝑛−1
=√
2𝑛 + 1(2𝑛)!
𝑛
4 (𝑛 !)2
∼√
𝑛(2𝑛)!

da cui
2𝑛 (2𝑛)! 4𝑛 √
 
= ∼ √ 𝜋𝑛.
𝑛 (𝑛 !)2 𝑛

formula di Stirling

Teorema 6.88 (formula di Stirling). Si ha


√ 𝑛𝑛
𝑛! ∼ 2𝜋𝑛 · 𝑛 per 𝑛 → +∞.
𝑒

Dimostrazione. Si osservi che la tesi:



𝑛 · 𝑛𝑛 1
lim =√
𝑛→+∞ 𝑛! · 𝑒 𝑛 2𝜋

è equivalente, passando ai logaritmi, a dimostrare che


 
1 1
lim ln 𝑛 + 𝑛 ln 𝑛 − ln(𝑛 !) − 𝑛 = − ln(2𝜋).
𝑛→+∞ 2 2

La prima parte della dimostrazione sarà volta a dimostrare che il limite pre-
cedente esiste ed è finito. Alla fine, per trovare il valore esatto, si utilizzerà la
formula di Wallis. La quantità 𝑛 ln 𝑛 − 𝑛 è, a meno di una costante additiva,
292 6 calcolo integrale

l’integrale del logaritmo sull’intervallo [1 , 𝑛]. Abbiamo già visto nell’esem-


pio 6.78 che ln(𝑛 !) si ottiene approssimando tale integrale con dei rettangoli. Se
procediamo invece con una approssimazione tramite trapezi, otteniamo una
stima più precisa che ci darà il termine aggiuntivo 12 ln 𝑛 , necessario per far
convergere il limite.

Osserviamo in generale che se 𝑓 : [𝑎, 𝑏] → ℝ è una funzione concava allora il


grafico di 𝑓 è compreso tra la retta passante per gli estremi (𝑎, 𝑓 (𝑎)), (𝑏, 𝑓 (𝑏))
(retta secante) e una qualunque retta tangente, ad esempio la retta tangente in
∫𝑏
((𝑎 + 𝑏)/2 , 𝑓 ((𝑎 + 𝑏)/2)). Di conseguenza l’area sotto il grafico, cioè 𝑎 𝑓 (𝑥) 𝑑𝑥
è compreso tra le aree dei due corrispondenti trapezi rettangoli. L’altezza di
entrambi i trapezi è pari a (𝑏 − 𝑎) e l’area si calcola moltiplicando l’altezza per la
media delle basi. Nel caso del trapezio con lato obliquo sulla secante, la media
delle basi è ( 𝑓 (𝑎) + 𝑓 (𝑏))/2, nel caso del trapezio con lato obliquo sulla retta
tangente nel punto medio, la media delle basi è uguale alla sezione nel punto
medio: 𝑓 ((𝑎 + 𝑏)/2). Si ottiene dunque, per ogni 𝑓 concava:

𝑏
𝑓 (𝑎) + 𝑓 (𝑏) 𝑎+𝑏
∫  
(𝑏 − 𝑎) · ≤ 𝑓 (𝑥) 𝑑𝑥 ≤ (𝑏 − 𝑎) · 𝑓 .
2 𝑎 2

Applicando queste stime alla funzione 𝑓 (𝑥) = ln 𝑥 nell’intervallo [𝑘, 𝑘 + 1] si


ottiene: ∫ 𝑘+1  
ln(𝑘) + ln(𝑘 + 1) 1
≤ ln 𝑥 𝑑𝑥 ≤ ln 𝑘 + .
2 𝑘 2

Chiamiamo 𝑎 𝑘 la differenza tra le prime due quantità. Chiaramente 𝑎 𝑘 ≥ 0 e


risulta
∫ 𝑘+1
ln(𝑘) + ln(𝑘 + 1)
𝑎𝑘 = ln 𝑥 𝑑𝑥 −
𝑘 2
 
1 ln(𝑘) + ln(𝑘 + 1)
≤ ln 𝑘 + −
2 2
2
𝑘 + 21
 
1 1 1
= ln = ln 1 +
2 𝑘(𝑘 + 1) 2 4(𝑘 + 𝑘)
2
 
1 1
= +𝑜 2 per 𝑘 → +∞.
8𝑘2 𝑘

𝑎 𝑘 è dunque convergente ovvero la successione


P
La serie
𝑛
X
𝐴𝑛 = 𝑎𝑘
𝑘=1
6.10 alcune applicazioni del calcolo integrale 293

è convergente. Chiamiamo ℓ il limite di 𝐴𝑛 . Si ha:

𝑛−1 ∫ 𝑘+1 𝑛−1


X X ln 𝑘 + ln(𝑘 + 1)
𝐴𝑛 = ln 𝑥 𝑑𝑥 −
𝑘=1 𝑘 𝑘=1
2
𝑛 𝑛−1
ln 1 ln 𝑛
∫ X
= ln 𝑥 𝑑𝑥 − ln 𝑘 − −
1 𝑘=2
2 2
𝑛
ln 𝑛
= [𝑥 ln 𝑥 − 𝑥]1𝑛 −
X
ln 𝑘 +
𝑘=1
2
ln 𝑛
= 𝑛 ln 𝑛 − 𝑛 + 1 − ln(𝑛 !) + →ℓ
2
da cui √
𝑛𝑛 · 𝑒 · 𝑛
𝑒 𝐴𝑛 = → 𝑒ℓ
𝑒 𝑛 · 𝑛!
ovvero, posto 𝑐 = 𝑒/𝑒 ℓ ,

𝑛𝑛 𝑛
𝑛! ∼ 𝑐 · .
𝑒𝑛
Per determinare la costante incognita 𝑐 possiamo sfruttare la formula di Wallis
sul coefficiente binomiale centrale:

(2𝑛)2𝑛 2𝑛
𝑐
4𝑛 2𝑛 (2𝑛)!
 
∼ = ∼ 𝑒 2𝑛
√  𝑛√ 2
𝜋𝑛 𝑛 (𝑛 !) 2
𝑛 𝑛
𝑐 𝑛
𝑒
√ √
2𝑛 𝑛
2 2 4 2
= √ = √
𝑐 𝑛 𝑐 𝑛

da cui si ottiene √
1 2
√ ∼
𝜋 𝑐

e quindi 𝑐 = 2𝜋.
spazi di funzioni 7
L’astrazione è una attività tipica della matematica. I risultati che abbiamo
visto fin’ora riguardano per lo più lo spazio ℝ dei numeri reali e in parte lo
spazio ℂ dei numeri complessi. E’ però evidente che molti di questi risultati si
estendono ad altre situazioni più generali. Identificare le proprietà fondamentali
che stanno alla base di un teorema è forse l’attività più importante svolta
dalla matematica. Tipicamente l’identificazione di queste proprietà oltre
a generalizzare un risultato ne rende anche più semplice la dimostrazione.
Infatti una volta identificate le ipotesi minime del teorema gli strumenti a
nostra disposizione pure si riducono e sarà più facile capire quali andranno
utilizzati. D’altra parte non potremo portare all’estremo questo tentativo di
generalizzazione in quanto ci si accorge presto che la fauna composta dagli spazi
che vanno via via a coprire tutte le possibili tipologie diventa subito enorme e
avere in mente tutte le definizioni diventa troppo oneroso.

Si veda la figura 7.1 per avere un quadro relazionale degli spazi che andremo
ora ad introdurre. Gli insiemi sono dati per noti (si vedano gli appunti di
logica [5]). Anche gli spazi vettoriali (algebra lineare) li diamo per noti, in
quanto sono usualmente oggetto del corso di geometria. Gli spazi topologici
verranno solamente accennati in quanto non saranno direttamente utili ai nostri
scopi e una trattazione completa richiederebbe molto tempo. Per lo stesso
motivo mancano completamente da questa classificazione anche altri spazi
molto rilevanti (ad esempio i gruppi e le varietà differenziali).

Definizione 7.1 (spazio metrico). Diremo che 𝑑 : 𝑋 × 𝑋 → ℝ è una distanza su distanza


𝑋 se per ogni 𝑥, 𝑦, 𝑧 ∈ 𝑋 valgono le seguenti proprietà
1. 𝑑(𝑥, 𝑦) ≥ 0 (positività);
2. 𝑑(𝑥, 𝑦) ≤ 𝑑(𝑥, 𝑧) + 𝑑(𝑧, 𝑦) (disuguaglianza triangolare);
3. 𝑑(𝑥, 𝑦) = 0 se e solo se 𝑥 = 𝑦 (separazione);
4. 𝑑(𝑥, 𝑦) = 𝑑(𝑦, 𝑥) (simmetria).
Se 𝑑 è una distanza diremo che 𝑋 è uno spazio metrico (metrizzato da 𝑑 ). spazio metrico

Osserviamo che dalle disuguaglianze triangolari:

𝑑(𝑥, 𝑧) ≤ 𝑑(𝑥, 𝑦) + 𝑑(𝑦, 𝑧), 𝑑(𝑦, 𝑧) ≤ 𝑑(𝑥, 𝑦) + 𝑑(𝑥, 𝑧)

si ottiene la disuguaglianza triangolare inversa: disuguaglianza triangolare inversa

𝑑(𝑥, 𝑦) ≥ |𝑑(𝑥, 𝑧) − 𝑑(𝑦, 𝑧)|.

Definizione 7.2 (convergenza). Se 𝑥 𝑛 ∈ 𝑋 è una successione di punti di uno spazio


metrico 𝑋 e 𝑥 ∈ 𝑋 diremo che 𝑥 𝑛 converge a 𝑥 e scriveremo

𝑥𝑛 → 𝑥

se 𝑑(𝑥 𝑛 , 𝑥) → 0 per 𝑛 → +∞.


296 7 spazi di funzioni


∈, ⊆, ∪ insieme lim , 𝐴 , 𝐴¯

+, · sp. vettoriale sp. topologico ℝ̄


𝑑(𝑥, 𝑦), Lip
sp. metrico

|𝑣| sp. normato
sp. completo
𝕊𝑛
Banach
h𝑣, 𝑤i sp. euclideo ℂ𝑛 , 𝐿 𝑝 , ℓ 𝑝
Figura 7.1: Strutture matematiche che
astraggono lo spazio ℝ𝑛 . La freccia nera Hilbert
significa: “è un”, la freccia scura: “è un 𝐿2 , ℓ 2
esempio di”, la linea chiara: “è una ope-
razione tipica di”. ℝ𝑛

Si noti che l’usuale convergenza in ℝ non è altro che la convergenza di ℝ visto


come spazio metrico con la distanza euclidea 𝑑(𝑥, 𝑦) = |𝑥 − 𝑦| .

Con l’artificio 𝑑(𝑥 𝑛 , 𝑦𝑛 ) − 𝑑(𝑥, 𝑦) = 𝑑(𝑥 𝑛 , 𝑦𝑛 ) − 𝑑(𝑥 𝑛 , 𝑦) + 𝑑(𝑥 𝑛 , 𝑦) − 𝑑(𝑥, 𝑦) e


utilizzando la disuguaglianza triangolare inversa si può facilmente risolvere il
seguente.

Esercizio 7.3 (continuità della distanza). Dimostrare che se 𝑥 𝑛 → 𝑥 e 𝑦𝑛 → 𝑦


allora 𝑑(𝑥 𝑛 , 𝑦𝑛 ) → 𝑑(𝑥, 𝑦).

norma Definizione 7.4 (spazio normato). Sia 𝑉 uno spazio vettoriale sul campo ℝ. Una
funzione 𝜑 : 𝑉 → ℝ si dice essere una norma su 𝑉 se per ogni 𝑣, 𝑤 ∈ 𝑉 e per ogni
𝜆 ∈ ℝ valgono le seguenti proprietà:

1. 𝜑(𝑣) ≥ 0 (positività);
2. 𝜑(𝜆𝑣) = |𝜆| · 𝜑(𝑣) (omogeneità e simmetria);
3. 𝜑(𝑣 + 𝑤) ≤ 𝜑(𝑣) + 𝜑(𝑤) (disuguaglianza triangolare);
4. 𝜑(𝑣) = 0 se e solo se 𝑣 = 0 (separazione).
normato

Se 𝜑 è una norma su 𝑉 diremo che 𝑉 è uno spazio vettoriale normato da 𝜑 .


distanza indotta
Se 𝜑 è una norma la funzione 𝑑(𝑣, 𝑤) = 𝜑(𝑣 − 𝑤) è chiaramente una distanza che si
chiama distanza indotta da 𝜑 . In particolare ogni spazio normato è anche uno spazio
metrico rispetto alla distanza indotta dalla norma.

Usualmente si utilizzano le notazioni |𝑣| o k𝑣 k per indicare una norma 𝜑(𝑣).

Visto che uno spazio normato è anche uno spazio metrico, negli spazi normati è
definita una convergenza. E’ facile verificare che la norma risulta essere continua
rispetto a tale convergenza, nel senso che se 𝑣 𝑘 → 𝑣 (ovvero 𝜑(𝑣 𝑘 − 𝑣) → 0)
allora 𝜑(𝑣 𝑘 ) → 𝜑(𝑣).
prodotto scalare definito positivo
297

Definizione 7.5 (spazio euclideo). Sia 𝑉 uno spazio vettoriale sul campo ℝ. Una
funzione 𝑏 : 𝑉 × 𝑉 → ℝ si dice essere un prodotto scalare definito positivo su 𝑉 se
𝑏 è una forma bilineare, simmetrica e definita positiva, ovvero se per ogni 𝑢, 𝑣, 𝑤 ∈ 𝑉
e per ogni 𝜆, 𝜇 ∈ ℝ valgono le seguenti proprietà:
1. 𝑏(𝑣, 𝑣) ≥ 0 (positività);
2. 𝑏(𝜆𝑢 +𝜇𝑣, 𝑤) = 𝜆𝑏(𝑢, 𝑤)+𝜇𝑏(𝑣, 𝑤) e 𝑏(𝑢, 𝜆𝑣 +𝜇𝑤) = 𝜆𝑏(𝑢, 𝑣)+𝜇𝑏(𝑢, 𝑤)
(bilinearità);
3. 𝑏(𝑣, 𝑤) = 𝑏(𝑤, 𝑣) (simmetria);
4. 𝑏(𝑣, 𝑣) = 0 se e solo se 𝑣 = 0 (non degenerazione).
Se 𝑏 è un prodotto scalare definito positivo su 𝑉 diremo che 𝑉 è uno spazio euclideo
(con prodotto scalare 𝑏 ).
Usualmente si utilizzano le notazioni 𝑣 · 𝑤 , (𝑣, 𝑤), h𝑣, 𝑤i o h𝑣|𝑤i per denotare un
prodotto scalare 𝑏(𝑣, 𝑤).

Se 𝑏 è un prodotto scalare definito positivo su 𝑉 il teorema seguente ci garantisce


p
che che la funzione 𝜑(𝑣) = h𝑣, 𝑣i è una norma su 𝑉 .
Dunque uno spazio euclideo ha, in modo naturale, una struttura di spazio
normato e di spazio metrico.

Teorema 7.6 (proprietà del prodotto scalare). Sia 𝑉 uno spazio euclideo con
p
prodotto scalare (definito positivo) h𝑣, 𝑤i . Si definisca |𝑣| = h𝑣, 𝑣i . Allora |𝑣| è una
norma su 𝑉 e per ogni 𝑣, 𝑤 ∈ 𝑉 valgono le seguenti proprietà:
1. sviluppo del binomio sviluppo del binomio

|𝑣 + 𝑤| 2 = |𝑣| 2 + 2 h𝑣, 𝑤i + |𝑤| 2 ;

2. teorema di Pitagora teorema di Pitagora

h𝑣, 𝑤i = 0 =⇒ |𝑣 + 𝑤| 2 = |𝑣| 2 + |𝑤| 2 ; (7.1)

3. disuguaglianza di Young disuguaglianza di Young

|𝑣| 2 + |𝑤| 2
h𝑣, 𝑤i ≤ ; (7.2)
2
4. disuguaglianza di Cauchy-Schwarz disuguaglianza di Cauchy-Schwarz

h𝑣, 𝑤i ≤ |𝑣| · |𝑤| ; (7.3)

5. proprietà del parallelogramma proprietà del parallelogramma

|𝑣 + 𝑤| 2 + |𝑣 − 𝑤| 2 = 2 |𝑣| 2 + 2 |𝑤| 2 ; (7.4)

6. continuità

se 𝑣 𝑘 → 𝑣 e 𝑤 𝑘 → 𝑤 allora h𝑣 𝑘 , 𝑤 𝑘 i → h𝑣, 𝑤i.

Dimostrazione. Osserviamo innanzitutto che |𝑣| è ben definita per ogni 𝑣 ∈ 𝑉


in quanto il prodotto scalare h𝑣, 𝑣i per definizione non è mai negativo. Allora
298 7 spazi di funzioni

in generale si ha, sfruttando la bilinearità, l’usuale sviluppo del quadrato del


binomio:

|𝑣 + 𝑤| 2 = h𝑣 + 𝑤, 𝑣 + 𝑤i = h𝑣 + 𝑤, 𝑣i + h𝑣 + 𝑤, 𝑤i
= h𝑣, 𝑣i + 2 h𝑣, 𝑤i + h𝑤, 𝑤i = |𝑣| 2 + 2 h𝑣, 𝑤i + |𝑤| 2 .

Il teorema di Pitagora segue immediatamente. Ma allora si ottiene facilmente la


disuguaglianza di Young:

0 ≤ |𝑣 − 𝑤| 2 = |𝑣| 2 + |𝑤| 2 − 2 h𝑣, 𝑤i

e la proprietà del parallelogramma:

|𝑣 + 𝑤| 2 + |𝑣 − 𝑤| 2 = |𝑣| 2 + 2 h𝑣, 𝑤i + |𝑤| 2 + |𝑣| 2 − 2 h𝑣, 𝑤i + |𝑤| 2 .

Ora se |𝑣| = |𝑤| = 1 la disuguaglianza di Young ci dice che

h𝑣, 𝑤i ≤ 1.

Ma allora per ogni 𝑣 ≠ 0 e 𝑤 ≠ 0 si ottiene la disuguaglianza di Cauchy-Schwarz:

h𝑣, 𝑤i 𝑣 𝑤
=h , i ≤ 1.
|𝑣| · |𝑤| |𝑣| |𝑤|

Se invece 𝑣 = 0 o 𝑤 = 0 la disuguaglianza di Cauchy-Schwarz è ovvia in quanto


per ogni 𝑢 ∈ 𝑉 si ha h0 , 𝑢i = h𝑢, 0i = 0 per bilinearità.

Per quanto riguarda la continuità ricordiamoci che 𝑣 𝑘 → 𝑣 significa k𝑣 𝑘 − 𝑣 k →


0. Possiamo allora scrivere

h𝑣 𝑘 , 𝑤 𝑘 i − h𝑣, 𝑤i = h𝑣 𝑘 , 𝑤 𝑘 i − h𝑣, 𝑤 𝑘 i + h𝑣, 𝑤 𝑘 i − h𝑣, 𝑤i


= h𝑣 𝑘 − 𝑣, 𝑤 𝑘 i + h𝑣, 𝑤 𝑘 − 𝑤i

e, utilizzando Cauchy-Schwarz se 𝑣 𝑘 → 𝑣 e 𝑤 𝑘 → 𝑤 otteniamo

|h𝑣 𝑘 , 𝑤 𝑘 i − h𝑣, 𝑤i| ≤ |𝑣 𝑘 − 𝑣| · |𝑤 𝑘 | + |𝑣| · |𝑤 𝑘 − 𝑤|


→ 0 · |𝑤| + |𝑣| · 0 = 0.

Lo spazio vettoriale ℝ𝑛 ha una struttura euclidea canonica, come nella seguen-


te.

Definizione 7.7 (struttura euclidea di ℝ𝑛 ). Un vettore 𝒙 ∈ ℝ𝑛 è definito come una


𝑛 -upla di numeri reali:
𝒙 = (𝑥1 , . . . , 𝑥 𝑛 ).
Su ℝ𝑛 possiamo allora definire il prodotto scalare:
𝑛
X
𝒙·𝒚= 𝑥 𝑘 𝑦 𝑘 = 𝑥 1 𝑦1 + · · · + 𝑥 𝑛 𝑦 𝑛
𝑘=1
299

Questo prodotto scalare induce la norma euclidea:

√ q
|𝒙| = 𝒙·𝒙= 𝑥12 + 𝑥 22 + · · · + 𝑥 𝑛2 .

La distanza indotta da tale norma si chiama distanza euclidea: distanza euclidea


q
𝑑(𝒙, 𝒚) = |𝒙 − 𝒚| = (𝑥1 − 𝑦1 )2 + · · · + (𝑥 𝑛 − 𝑦𝑛 )2 .

Nel caso 𝑛 = 1 la norma coincide con il valore assoluto e questo giustifica l’aver
utilizzato la stessa notazione.

Se identifichiamo ℂ con ℝ2 associando al numero complesso 𝑧 = 𝑥 + 𝑖 𝑦 il punto


(𝑥, 𝑦) ∈ ℝ2 possiamo osservare che la norma euclidea coincide con il modulo del
numero complesso:
q
|𝑧| = 𝑥 2 + 𝑦 2 = |(𝑥, 𝑦)|.

Dunque ℝ, ℂ, ℝ𝑛 , sono spazi euclidei, spazi normati e spazi metrici rispetto alla
struttura euclidea canonica.

norma Manhattan
Esempio 7.8 (distanza Manhattan). Su ℝ2 possiamo definire una norma, chiamata
norma Manhattan, come segue:

𝜑(𝒙) = |𝑥1 | + |𝑥2 |.

La distanza indotta 𝑑(𝑝, 𝑞) rappresenta la lunghezza del percorso più breve per andare
da 𝑝 a 𝑞 muovendosi solamente in orizzontale o verticale (come se fossimo sulle strade
di Manhattan).

La norma Manhattan non è euclidea nel senso che non è possibile definire un prodotto
scalare che induca tale norma. Infatti se esistesse un tale prodotto scalare dovrebbe essere
valida la proprietà del parallelogramma (7.4) e invece osserviamo che scelto 𝑣 = (1 , 0) e
𝑤 = (0 , 1) si ha

𝜑(𝑣 + 𝑤)2 + 𝜑(𝑣 − 𝑤)2 = 8 ≠ 4 = 2 𝜑(𝑣)2 + 2𝜑(𝑤)2 .

L’insieme 𝐵𝑅 (𝒙 0 ) = 𝒙 ∈ ℝ2 : 𝜑(𝒙 − 𝒙 0 ) < 𝑅 dei punti di ℝ2 che distano meno di




𝑅 dal punto 𝒙 0 (si veda la definizione 7.12) è un quadrato con le diagonali, di lunghezza
2𝑅 , parallele agli assi coordinati. Se come norma 𝜑 avessimo scelto la norma euclidea
canonica di ℝ2 l’insieme 𝐵𝑅 (𝒙 0 ) sarebbe risultato essere un cerchio di raggio 𝑅 centrato
in 𝒙 0 . In generale le norme indotte da un prodotto scalare si riconoscono dalla forma di
questi insiemi: solo quando si ottengono ellissi (o ellissoidi se siamo in dimensione più
alta) la norma è euclidea. Per le altre norme si potranno ottenere dei generici insiemi
convessi simmetrici rispetto al centro 𝒙 0 .

Esempio 7.9 (norma 𝑝 ). Per ogni 𝑝 ≥ 1 si può definire su ℝ𝑛 la norma

|𝑥1 | 𝑝 + |𝑥 2 | 𝑝 + · · · + |𝑥 𝑛 | 𝑝 .
p𝑝
|𝒙| 𝑝 =
300 7 spazi di funzioni

Si può inoltre definire

|𝒙| ∞ = lim |𝒙| 𝑝 = max {|𝑥1 |, |𝑥2 |, . . . , |𝑥 𝑛 |}.


𝑝→+∞

Per 𝑝 = 2 si ottiene la norma euclidea della definizione 7.7 |𝑣| 2 = |𝑣| . Per 𝑝 = 1 su ℝ2
si ottiene la norma Manhattan. Per 𝑝 = +∞ si ottiene di nuovo la√norma Manhattan a
meno di una rotazione di 45 gradi e di un riscalamento di fattore 2:

𝑥1 − 𝑥2 𝑥1 + 𝑥2
 
|(𝑥1 , 𝑥2 )| ∞ = ,
2 2

1

Si potrebbe dimostrare che solo per 𝑝 = 2 la norma |𝒙| 𝑝 è indotta da un prodotto scalare
in quanto solo per 𝑝 = 2 è valida la proprietà del parallelogramma (7.4).

7.1 spazi metrici e topologia

Definizione 7.10 (distanza indotta). Se 𝑑 : 𝑋 × 𝑋 → ℝ è una distanza su 𝑋 e


𝐴 ⊆ 𝑋 allora restringendo 𝑑 a 𝐴 × 𝐴 si ottiene ancora (ovviamente) una distanza. Tale
distanza indotta
restrizione si chiama distanza indotta da 𝑋 su 𝐴. Dunque se 𝐴 è un sottoinsieme di
uno spazio metrico (𝑋 , 𝑑) anche 𝐴 ha una struttura di spazio metrico.

Esempio 7.11 (sfera). Se 𝑋 ⊆ ℝ𝑛 la distanza euclidea di ℝ𝑛 induce su 𝑋 una


struttura di spazio metrico. Se 𝑋 non è un sottospazio vettoriale di ℝ𝑛 abbiamo
sfera 𝑛 -dimensionale quindi esempi di spazi metrici che non sono spazi normati. Ad esempio la sfera
𝑛 -dimensionale
𝕊𝑛 = 𝒙 ∈ ℝ𝑛+1 : |𝒙| = 1


è uno spazio metrico con la distanza indotta da ℝ𝑛 .

Per 𝑛 = 1 si osserva che 𝕊1 è la circonferenza unitaria nel piano, per 𝑛 = 2 si ottiene


l’usuale sfera unitaria immersa nello spazio tridimensionale.

palla Definizione 7.12 (palla). Sia (𝑋 , 𝑑) uno spazio metrico. Per ogni 𝑟 > 0 e per ogni
𝑥0 ∈ 𝑋 definiamo la palla di raggio 𝑟 centrata in 𝑥0 come l’insieme

𝐵𝑟 (𝑥0 ) = {𝑥 ∈ 𝑋 : 𝑑(𝑥, 𝑥0 ) < 𝑟}.

aperto
Definizione 7.13 (relazioni e proprietà topologiche). Sia (𝑋 , 𝑑) uno spazio metrico.
chiuso Un insieme 𝐴 ⊆ 𝑋 si dirà essere un insieme aperto in 𝑋 se per ogni 𝑥 ∈ 𝐴 esiste
𝑟 > 0 tale che 𝐵𝑟 (𝑥) ⊆ 𝐴. Un insieme 𝐴 ⊆ 𝑋 si dirà essere un insieme chiuso in 𝑋 se
topologia il suo complementare 𝑋 \ 𝐴 è aperto.

La famiglia di tutti gli insiemi aperti si chiama topologia dello spazio metrico 𝑋 . Tutte
le definizioni che seguono non dipendono dalla distanza 𝑑 ma solamente dalla topologia:
basterà usare aperti qualunque al posto delle palle 𝐵𝑟 (𝑥).
punto interno
Se 𝐴 ⊆ 𝑋 è un insieme qualunque 𝑥 ∈ 𝑋 è un punto qualunque diremo che:
parte interna
7.1 spazi metrici e topologia 301

parte esterna di 𝐴


𝐴 𝐴

𝜕𝐴 𝐴¯ 𝐴0
Figura 7.2: Un insieme 𝐴 e la sua parte

interna 𝐴, parte esterna, frontiera 𝜕𝐴,
chiusura 𝐴¯ e punti di accumulazione 𝐴0 .

1. 𝑥 è punto interno ad 𝐴 se esiste 𝑟 > 0 tale che 𝐵𝑟 (𝑥) ⊆ 𝐴; chiameremo parte



interna di 𝐴 l’insieme dei punti interni di 𝐴 e la denoteremo con 𝐴;
2. 𝐴 è un intorno di 𝑥 se 𝑥 è punto interno ad 𝐴 ovvero esiste 𝑟 > 0 tale che intorno
𝐵𝑟 (𝑥) ⊆ 𝐴;
3. 𝑥 è punto esterno ad 𝐴 se è interno al complementare di 𝐴 ovvero esiste 𝑟 > 0 punto esterno
tale che 𝐵𝑟 (𝑥) ∩ 𝐴 = ∅; chiameremo parte esterna di 𝐴 l’insieme dei punti
esterni ad 𝐴; parte esterna

4. 𝑥 è punto di frontiera per 𝐴 se non è né interno né esterno ad 𝐴 ovvero per ogni punto di frontiera
𝑟 > 0 l’insieme 𝐵𝑟 (𝑥) contiene punti di 𝐴 e di 𝑋 \ 𝐴; chiameremo frontiera (o
bordo) di 𝐴 l’insieme dei punti di frontiera che denoteremo con 𝜕𝐴. frontiera
5. 𝑥 è punto di aderenza di 𝐴 se è interno o di frontiera ovvero se per ogni 𝑟 > 0 punto di aderenza
si ha 𝐵𝑟 (𝑥) ∩ 𝐴 ≠ ∅; chiameremo chiusura di 𝐴 l’insieme dei punti di aderenza,
che denoteremo con 𝐴¯ ; chiusura
6. 𝑥 è punto di accumulazione di 𝐴 se è punto di aderenza per 𝐴 \ {𝑥} ovvero
punto di accumulazione
se per ogni 𝑟 > 0 l’insieme 𝐴 ∩ 𝐵𝑟 (𝑥) contiene punti diversi da 𝑥 , chiameremo
derivato di 𝐴 l’insieme dei punti di accumulazione (che si potrebbe denotare con derivato
𝐴0);
7. 𝑥 è punto isolato di 𝐴 se è un punto di 𝐴 ma non di accumulazione per 𝐴 cioè punto isolato
se esiste 𝑟 > 0 per cui 𝐵𝑟 (𝑥) ∩ 𝐴 = {𝑥}.

Teorema 7.14 (le palle sono aperte). Sia (𝑋 , 𝑑) uno spazio metrico, sia 𝑥 ∈ 𝑋 e
𝑟 > 0. Allora la palla 𝐵𝑟 (𝑥) è un insieme aperto in 𝑋 .

Dimostrazione. Sia 𝑦 ∈ 𝐵𝑟 (𝑥): è sufficiente trovare 𝜌 > 0 tale che 𝐵𝜌 (𝑦) ⊆ 𝐵𝑟 (𝑥).
Prendendo 𝜌 = 𝑟 − 𝑑(𝑦, 𝑥) si osserva che 𝜌 > 0 e, per la disuguaglianza
triangolare, dato 𝑧 ∈ 𝐵𝜌 (𝑦) si ha

𝑑(𝑧, 𝑥) ≤ 𝑑(𝑧, 𝑦) + 𝑑(𝑦, 𝑥) < 𝜌 + 𝑑(𝑦, 𝑥) = 𝑟

da cui 𝐵𝜌 (𝑦) ⊆ 𝐵𝑟 (𝑥) come volevamo dimostrare.

Teorema 7.15 (chiusura sequenziale). Sia (𝑋 , 𝑑) uno spazio metrico. Un insieme


𝐴 ⊆ 𝑋 è chiuso se e solo se per ogni successione 𝑎 𝑛 ∈ 𝐴 se 𝑎 𝑛 → 𝑎 ∈ 𝑋 allora 𝑎 ∈ 𝐴
(il limite di punti di 𝐴, se esiste, è un punto di 𝐴).
302 7 spazi di funzioni

Dimostrazione. Supponiamo che 𝐴 sia chiuso e sia 𝑎 𝑘 ∈ 𝐴 una successione


convergente ad un punto di 𝑋 : 𝑎 𝑘 → 𝑎 . Dobbiamo mostrare che 𝑎 ∈ 𝐴. Per
definizione di convergenza sappiamo che per ogni 𝜀 > 0 esiste 𝐾 ∈ ℕ tale per
ogni 𝑘 > 𝐾 si ha 𝑑(𝑎 𝑘 , 𝑎) < 𝜀 e quindi 𝑎 𝑘 ∈ 𝐵 𝜀 (𝑎). In particolare 𝐴 ∩ 𝐵 𝜀 (𝑎) ≠ ∅.
Risulta quindi che 𝑎 non è esterno ad 𝐴 e quindi, essendo 𝐴 chiuso, 𝑎 ∈ 𝐴.
Supponiamo che 𝐴 non sia chiuso e verifichiamo che in tal caso si può trovare
una successione 𝑎 𝑘 di punti di 𝐴 che converge 𝑎 𝑘 → 𝑎 ad un punto 𝑎 ∉ 𝐴. Se 𝐴
non è chiuso significa che c’è un punto 𝑎 ∈ 𝑋 \ 𝐴 che non è esterno ad 𝐴. Ciò
vuol dire che per ogni 𝑟 > 0 l’insieme 𝐵𝑟 (𝑦) ∩ 𝐴 è non vuoto. Per ogni 𝑘 ∈ ℕ
posso allora scegliere 𝑟 = 1/𝑘 e quindi so che esiste un punto 𝑎 𝑘 ∈ 𝐵𝑟 (𝑎) ∩ 𝐴
ovvero 𝑎 𝑘 ∈ 𝐴 e 𝑑(𝑎 𝑘 , 𝑎) < 1/𝑘 . Dunque 𝑎 𝑘 → 𝑎 con 𝑎 𝑘 ∈ 𝐴 ma 𝑎 ∉ 𝐴, come
volevamo dimostrare.

Definizione 7.16 (continuità). Una funzione 𝑓 : 𝑋 → 𝑌 definita tra due spazi metrici
sequenzialmente continua
si dice essere sequenzialmente continua nel punto 𝑥 ∈ 𝑋 se per ogni successione
convergente 𝑥 𝑛 → 𝑥 in risulta che 𝑓 (𝑥 𝑛 ) → 𝑓 (𝑥). Diremo che 𝑓 è sequenzialmente
continua se è sequenzialmente continua in ogni punto 𝑥 del suo dominio 𝑋 .

continua
Una funzione 𝑓 : 𝑋 → 𝑌 definita tra due spazi metrici si dice essere continua in un
punto 𝑥 ∈ 𝑋 se

∀𝜀 > 0 : ∃𝛿 > 0 : ∀𝑦 ∈ 𝑋 : 𝑑(𝑥, 𝑦) < 𝛿 =⇒ 𝑑( 𝑓 (𝑥), 𝑓 (𝑦)) < 𝜀. (7.5)

Diremo che 𝑓 è continua se è continua in ogni punto 𝑥 del suo dominio.

Anche in questo caso abbiamo considerato due diverse nozioni di continuità che
in generale (in spazi topologici) potrebbero non coincidere ma nel caso degli
spazi metrici sono equivalenti, come dimostriamo nel seguente teorema.

Teorema 7.17 (definizioni equivalenti di continuità). Sia 𝑓 : 𝑋 → 𝑌 una funzione


definita tra due spazi metrici 𝑋 e 𝑌 . Allora 𝑓 è sequenzialmente continua in un punto
𝑥 ∈ 𝑋 se e solo se è continua nel punto 𝑥 .
Inoltre 𝑓 è continua se e solo se per ogni 𝐴 aperto in 𝑌 risulta che 𝑓 −1 (𝐴) è aperto in
𝑋 (la controimmagine di un aperto è aperta).

Dimostrazione. Supponiamo che 𝑓 sia sequenzialmente continua in 𝑥 e, per


assurdo, supponiamo che 𝑓 non sia continua nello stesso punto 𝑥 . Allora
negando (7.5) otteniamo che esiste 𝜀 > 0 tale che per ogni 𝛿 > 0 in particolare
per ogni 𝛿 = 1𝑘 con 𝑘 ∈ ℕ esiste un punto 𝑦 𝑘 tale che 𝑑(𝑦 𝑘 , 𝑥) < 1𝑘 ma
𝑑( 𝑓 (𝑦 𝑘 ), 𝑓 (𝑥)) ≥ 𝜀. Significa che 𝑦 𝑘 → 𝑥 e quindi, se 𝑓 è sequenzialmente
continua, dovrebbe essere 𝑓 (𝑦 𝑘 ) → 𝑓 (𝑥). Ma questo è in contraddizione con la
condizione 𝑑( 𝑓 (𝑦 𝑘 ), 𝑓 (𝑥)) ≥ 𝜀.
Viceversa supponiamo che 𝑓 sia continua in 𝑥 e consideriamo una qualunque
successione 𝑥 𝑘 → 𝑥 . Per dimostrare che 𝑓 (𝑥 𝑘 ) → 𝑓 (𝑥) dobbiamo verificare che
per ogni 𝜀 > 0 esiste 𝐾 ∈ ℕ tale che per ogni 𝑘 > 𝐾 si ha 𝑑( 𝑓 (𝑥 𝑘 ), 𝑓 (𝑥)) < 𝜀. Ma
dalla continuità di 𝑓 , dato 𝜀 > 0 sappiamo esistere 𝛿 > 0 per cui se 𝑑(𝑦, 𝑥) < 𝛿
allora 𝑑( 𝑓 (𝑦), 𝑓 (𝑥)) < 𝜀. Visto che 𝑥 𝑘 → 𝑥 certamente esiste 𝐾 ∈ ℕ tale che
per ogni 𝑘 > 𝐾 si ha |𝑥 𝑘 − 𝑥| < 𝛿 e quindi | 𝑓 (𝑥 𝑘 ) − 𝑓 (𝑥)| < 𝜀 come volevamo
dimostrare.
7.1 spazi metrici e topologia 303

Mostriamo ora che se 𝑓 è continua e 𝐴 è aperto in 𝑌 allora 𝑓 −1 (𝐴) è aperto in


𝑋 . Dato un punto qualunque 𝑥0 ∈ 𝑓 −1 (𝐴) sappiamo che 𝑓 (𝑥0 ) ∈ 𝐴 dunque,
essendo 𝐴 aperto, esiste 𝜀 > 0 tale che 𝐵 𝜀 ( 𝑓 (𝑥 0 )) ⊆ 𝐴. Per la continuità di 𝑓
esiste allora 𝛿 > 0 tale che se |𝑥 − 𝑥 0 | < 𝛿 allora | 𝑓 (𝑥) − 𝑓 (𝑥 0 )| < 𝜀 e quindi
𝑓 (𝑥) ∈ 𝐴. Significa che 𝐵 𝛿 (𝑥0 ) ⊆ 𝑓 −1 (𝐴). Questo è vero per ogni 𝑥0 ∈ 𝑓 −1 (𝐴)
quindi tale insieme è aperto.
Viceversa supponiamo che la controimmagine di ogni aperto sia un aperto e
dimostriamo che la funzione è continua in ogni punto. Preso un punto 𝑥 0 ∈ 𝑋
e un 𝜀 > 0 consideriamo l’aperto 𝐵 𝜀 ( 𝑓 (𝑥 0 )). La sua controimmagine è l’insieme
{𝑥 : | 𝑓 (𝑥) − 𝑓 (𝑥0 )| < 𝜀} e per ipotesi sappiamo che è aperto. Significa allora che
esiste 𝛿 > 0 tale 𝐵 𝛿 (𝑥 0 ) è contenuto in tale insieme, ovvero per ogni 𝑥 ∈ 𝐵 𝛿 (𝑥 0 )
cioè |𝑥 − 𝑥 0 | < 𝛿 risulta 𝑓 (𝑥) ∈ 𝐵 𝜀 ( 𝑓 (𝑥 0 )) cioè | 𝑓 (𝑥) − 𝑓 (𝑥 0 )| < 𝜀. Abbiamo
quindi verificato la definizione di continuità nel punto 𝑥 0 .

Definizione 7.18 (spazi limitati). Sia 𝑋 uno spazio metrico o un sottoinsieme di


uno sottospazio metrico. Si dirà che 𝑋 è limitato se è contenuto in una palla ovvero se limitato
esiste 𝑥 0 ∈ 𝑋 e 𝑅 > 0 tale che 𝑋 ⊆ 𝐵𝑅 (𝑥 0 ).

Definizione 7.19 (compattezza sequenziale). Sia 𝑋 uno spazio metrico o un


sottoinsieme di uno spazio metrico. Si dirà che 𝑋 è sequenzialmente compatto se da
sequenzialmente compatto
ogni successione 𝑥 𝑘 ∈ 𝑋 è possibile estrarre una sottosuccessione 𝑥 𝑘 𝑗 → 𝑥 convergente
ad un punto 𝑥 ∈ 𝑋 .

La definizione più generale di compattezza viene data negli spazi topologici.


Nel contesto generale compattezza e compattezza sequenziale sono concetti
diversi ma nell’ambito degli spazi metrici i due concetti coincidono. Per questo
potremo scrivere più brevemente compatto al posto di sequenzialmente compatto
compatto
quando lavoriamo negli spazi metrici.
Il teorema di Bolzano-Weierstrass afferma che gli intervalli [𝑎, 𝑏] con 𝑎, 𝑏 ∈ ℝ
sono compatti. Più in generale si può dimostrare che tutti gli insiemi chiusi
e limitati di ℝ𝑛 sono compatti. In generale questo risultato non è vero in
qualunque spazio metrico (un esempio negativo è dato dalla convergenza
uniforme, come vedremo più avanti) ma l’implicazione inversa è sempre vera,
come enunciato nel seguente teorema.

Teorema 7.20. Se 𝐴 è un sottoinsieme sequenzialmente compatto di uno spazio metrico


𝑋 allora 𝐴 è chiuso e limitato.

Dimostrazione. Chiaramente 𝐴 è chiuso in quanto presa una successione 𝑥 𝑘 ∈ 𝐴


convergente a punto 𝑥 ∈ 𝑋 sappiamo che esiste una sottosuccessione conver-
gente ad un punto di 𝐴. Ma necessariamente ogni sottosuccessione converge ad
𝑥 quindi 𝑥 ∈ 𝐴. Se 𝐴 non fosse limitato fissato 𝑎 ∈ 𝐴 per ogni 𝑘 ∈ ℕ dovrebbe
esistere un punto 𝑥 𝑘 ∈ 𝐴 tale che 𝑥 𝑘 ∉ 𝐵 𝑘 (𝑎) cioè 𝑑(𝑥 𝑘 , 𝑎) > 𝑘 . Supponiamo
allora che esista una sottosuccessione convergente 𝑥 𝑘 𝑗 → 𝑥 ∈ 𝐴. Allora per la
disuguaglianza triangolare inversa si avrebbe

𝑑(𝑥, 𝑎) ≥ 𝑑(𝑥 𝑘 𝑗 , 𝑎) − 𝑑(𝑥 𝑘 𝑗 , 𝑥) ≥ 𝑘 𝑗 − 𝑑(𝑥 𝑘 𝑗 , 𝑥) → +∞ − 0 = +∞.

Ma questo è assurdo in quanto 𝑑(𝑥, 𝑎) ∈ ℝ.


304 7 spazi di funzioni

Teorema 7.21 (Weierstrass: le funzioni continue mandano compatti in compatti).


Sia 𝑓 : 𝑋 → 𝑌 una funzione continua tra due spazi metrici 𝑋 e 𝑌 . Se 𝐾 ⊆ 𝑋 è
sequenzialmente compatto allora anche 𝑓 (𝐾) è sequenzialmente compatto.

Dimostrazione. Sia 𝑦 𝑘 ∈ 𝑓 (𝐾) una qualunque successione. Allora esiste 𝑥 𝑘 ∈ 𝐾


tale che 𝑓 (𝑥 𝑘 ) = 𝑦 𝑘 . Essendo 𝐾 compatto possiamo estrarre una sottosuccessione
convergente: 𝑥 𝑘 𝑗 → 𝑥 . Essendo 𝑓 continua si ha

𝑦 𝑘 𝑗 = 𝑓 (𝑥 𝑘 𝑗 ) → 𝑓 (𝑥) ∈ 𝑓 (𝐾).

Nel caso 𝑋 = 𝑌 = ℝ recuperiamo l’usuale teorema di Weierstrass, in quanto


se 𝑓 : [𝑎, 𝑏] → ℝ è continua essendo [𝑎, 𝑏] compatto risulta che 𝑓 ([𝑎, 𝑏]) è
compatto. Ma i compatti di ℝ sono chiusi e limitati quindi hanno massimo e
minimo in quanto l’estremo superiore e l’estremo inferiore sono finiti e sono
punti di aderenza dell’insieme.

uniformemente continua
Definizione 7.22 (uniforme continuità). Sia 𝑓 : 𝑋 → 𝑌 una funzione definita tra
due spazi metrici 𝑋 e 𝑌 . Diremo che 𝑓 è uniformemente continua se

Heine-Cantor ∀𝜀 > 0 : ∃𝛿 > 0 : 𝑑(𝑥, 𝑥 0) < 𝛿 =⇒ 𝑑( 𝑓 (𝑥), 𝑓 (𝑥 0)) < 𝜀.

Teorema 7.23 (Heine-Cantor). Sia 𝑋 uno spazio metrico sequenzialmente compatto e


𝑌 uno spazio metrico. Sia 𝑓 : 𝑋 → 𝑌 una funzione continua. Allora 𝑓 è uniformemente
continua.

Dimostrazione. La dimostrazione è identica a quella già fatta nel corrispondente


teorema 5.54 per le funzioni di variabile reale.

successione di Cauchy
7.2 completezza

Definizione 7.24 (successioni di Cauchy). Sia (𝑋 , 𝑑) uno spazio metrico e 𝑥 𝑘 una


successione di punti di 𝑋 . Diremo che 𝑥 𝑘 è una successione di Cauchy se

∀𝜀 > 0 : ∃𝑛 ∈ ℕ : ∀𝑗 > 𝑛 : ∀𝑘 > 𝑛 : 𝑑(𝑥 𝑗 , 𝑥 𝑘 ) < 𝜀.

La proprietà che definisce le successioni di Cauchy si potrebbe anche scrivere


così:
lim sup 𝑑(𝑥 𝑗 , 𝑥 𝑘 ) = 0.
𝑘→+∞ 𝑗≥𝑘

Teorema 7.25 (le successioni convergenti sono di Cauchy). Sia 𝑥 𝑘 → 𝑥 una


successione convergente in uno spazio metrico (𝑋 , 𝑑). Allora 𝑥 𝑘 è di Cauchy.
7.2 completezza 305

Dimostrazione. Per definizione se 𝑥 𝑘 → 𝑥 si ha

∀𝜀 > 0 : ∃𝑛 ∈ ℕ : ∀𝑘 > 𝑛 : 𝑑(𝑥 𝑘 , 𝑥) < 𝜀.

Applicando la disuguaglianza triangolare, per ogni 𝑗, 𝑘 > 𝑛 si ottiene il risultato


desiderato:
𝑑(𝑥 𝑗 , 𝑥 𝑘 ) ≤ 𝑑(𝑥 𝑘 , 𝑥) + 𝑑(𝑥, 𝑥 𝑗 ) ≤ 2 𝜀.

completezza
Definizione 7.26 (completezza). Uno spazio metrico (𝑋 , 𝑑) si dice essere completo
completo
se ogni successione di Cauchy è convergente.

Il prototipo di spazio metrico completo è ℝ, come vedremo nel teorema 7.30.


Un esempio di spazio metrico√non completo è ℚ. Infatti se prendiamo una
successione 𝑞 𝑛 ∈ ℚ con 𝑞 𝑛 → 2 la successione 𝑞 𝑛 è convergente in ℝ e quindi
è di Cauchy in ℝ. Ma visto che 𝑞 𝑛 ∈ ℚ risulta che 𝑞 𝑛 è di Cauchy anche in ℚ (la
√ di Cauchy è la stessa). Ma in ℚ tale successione non converge in
condizione
quanto 2 ∉ ℚ.

Definizione 7.27 (spazio di Banach). Uno spazio vettoriale normato si dice essere spazio di Banach
uno spazio di Banach se, come spazio metrico, risulta essere completo. Se la norma è
euclidea, cioè deriva da un prodotto scalare, lo spazio si dirà spazio di Hilbert. spazio di Hilbert

Lemma 7.28. Ogni successione di Cauchy è limitata (più precisamente: se 𝑥 𝑛 è una


successione di Cauchy in uno spazio metrico 𝑋 allora l’insieme {𝑥 𝑛 : 𝑛 ∈ ℕ } è un
insieme limitato).

Dimostrazione. Sia 𝑥 𝑘 ∈ ℝ una successione di Cauchy. Fissato 𝜀 = 1 sappiamo


che esiste 𝑁 ∈ ℕ per cui per ogni 𝑘, 𝑗 > 𝑁 si ha 𝑑(𝑥 𝑘 , 𝑥 𝑗 ) < 1. In particolare per
ogni 𝑘 > 𝑁 si ha
𝑑(𝑥 𝑘 , 𝑥 𝑁+1 ) < 1.
Dunque posto

𝑅 = max {𝑑(𝑥0 , 𝑥1 ), 𝑑(𝑥0 , 𝑥2 ), . . . , 𝑑(𝑥0 , 𝑥 𝑁 ), 𝑑(𝑥0 , 𝑥 𝑁+1 ) + 1}

si osserva che per ogni 𝑘 ∈ ℕ si ha 𝑑(𝑥 0 , 𝑥 𝑘 ) ≤ 𝑅 < 𝑅 + 1 in quanto se 𝑘 ≤ 𝑁


abbiamo scelto appositamente 𝑅 in modo che sia più grande di 𝑑(𝑥 0 , 𝑥 𝑘 ) e se
𝑘 > 𝑁 allora

𝑑(𝑥0 , 𝑥 𝑘 ) ≤ 𝑑(𝑥0 , 𝑥 𝑁+1 ) + 𝑑(𝑥 𝑁+1 , 𝑥 𝑘 ) ≤ 𝑑(𝑥0 , 𝑥 𝑁+1 ) + 1 ≤ 𝑅.

Significa quindi che per ogni 𝑥 ∈ ℕ si ha 𝑥 𝑘 ∈ 𝐵𝑅+1 (𝑥 0 ) che è la definizione di


limitatezza in uno spazio metrico.

Lemma 7.29. Se una successione di Cauchy ha una sottosuccessione convergente,


allora l’intera successione è convergente.
306 7 spazi di funzioni

Dimostrazione. Sia 𝑥 𝑘 la successione di Cauchy e sia 𝑥 𝑘 𝑗 → 𝑥 una sottosucces-


sione convergente. Allora per ogni 𝜀 > 0 esiste 𝑚 tale che se 𝑘, 𝑗 > 𝑚 allora
𝑑(𝑥 𝑘 , 𝑥 𝑗 ) < 𝜀. Visto che 𝑥 𝑘 𝑗 → 𝑥 possiamo trovare 𝑗 tale che 𝑘 𝑗 > 𝑚 e tale che
𝑑(𝑥 𝑘 𝑗 , 𝑥) < 𝜀. Ma allora

𝑑(𝑥 𝑘 , 𝑥) ≤ 𝑑(𝑥 𝑘 , 𝑥 𝑘 𝑗 ) + 𝑑(𝑥 𝑘 𝑗 , 𝑥) ≤ 2 𝜀.

E questo è vero per ogni 𝑘 > 𝑚 da cui risulta verificata la definizione di limite
𝑥 𝑘 → 𝑥.

ℝ è completo
Teorema 7.30 (completezza di ℝ). ℝ è completo.

Dimostrazione. Dobbiamo dimostrare che se 𝑥 𝑘 è una successione di Cauchy in


ℝ allora 𝑥 𝑘 converge. Per il lemma 7.28 sappiamo che 𝑥 𝑘 è limitata. Ma allora per
il teorema di Bolzano-Weierstrass sappiamo che 𝑥 𝑘 ha una estratta convergente.
Grazie al lemma 7.29 possiamo quindi concludere che la successione 𝑥 𝑘 è essa
stessa convergente.

Corollario 7.31 (completezza di ℝ𝑛 e ℂ). Gli spazi ℝ𝑛 e ℂ (con la usuale distanza


euclidea) sono completi.

Dimostrazione. Basta osservare che la convergenza (o la condizione di Cauchy)


di una successione in ℝ𝑛 si ha se e solo se ogni componente è convergente (o
di Cauchy) in ℝ. Dunque essendo ℝ completo anche ℝ𝑛 lo è. Come spazio
metrico ℂ è isomorfo ad ℝ2 dunque anch’esso è completo.

Teorema 7.32 (completezza dei compatti). Ogni spazio metrico compatto è completo.

Dimostrazione. Visto che lo spazio è compatto ogni successione di Cauchy


ammette una sottosuccessione convergente. Ma allora, grazie al lemma 7.29,
l’intera successione converge e dunque lo spazio è completo.

Teorema 7.33 (chiusi in spazi compatti e in spazi completi). Sia (𝑋 , 𝑑) uno spazio
metrico e sia 𝐴 ⊆ 𝑋 un sottoinsieme chiuso in 𝑋 . Se 𝑋 è compatto allora anche 𝐴 è
compatto, se 𝑋 è completo allora anche 𝐴 è completo.

Dimostrazione. Se 𝑋 è compatto da ogni successione in 𝐴 si può estrarre una


sottosuccessione convergente ad un punto di 𝑋 . Ma siccome 𝐴 è chiuso il punto
sta in 𝐴 e dunque la sottosuccessione è convergente in 𝐴.

Una successione di Cauchy in 𝐴 è di Cauchy anche in 𝑋 . Se 𝑋 è completo


tale successione converge ad un punto di 𝑋 . Se 𝐴 è chiuso tale punto è in 𝐴 e
dunque la successione converge in 𝐴.

Teorema 7.34 (estendibilità delle funzioni uniformemente continue). Sia 𝑓 : 𝐴 ⊆


𝑋 → 𝑌 una funzione definita su un sottoinsieme 𝐴 di uno spazio metrico 𝑋 a valori
in uno spazio metrico completo 𝑌 (ad esempio 𝑋 = ℝ e 𝑌 = ℝ). Se 𝑓 è uniformemente
continua allora esiste una unica funzione continua 𝑓˜ : 𝐴¯ → 𝑌 tale che per ogni 𝑥 ∈ 𝐴
si ha 𝑓˜(𝑥) = 𝑓 (𝑥). Inoltre 𝑓˜ è anch’essa uniformemente continua.
7.2 completezza 307

Dimostrazione. La prima osservazione è che se una funzione 𝑓 è uniformemente


continua allora 𝑓 manda successioni di Cauchy in successioni di Cauchy. Infatti
se 𝑓 è uniformemente continua si ha

∀𝜀 > 0 : ∃𝛿 > 0 : 𝑑(𝑥, 𝑦) < 𝛿 =⇒ 𝑑( 𝑓 (𝑥), 𝑓 (𝑦)) < 𝜀

e se 𝑎 𝑛 è di Cauchy si ha

∃𝑁 ∈ ℕ : 𝑘, 𝑗 > 𝑁 =⇒ 𝑑(𝑎 𝑘 , 𝑎 𝑗 ) < 𝛿

dunque mettendo insieme le due proprietà si ottiene la condizione di Cauchy


per 𝑓 (𝑎 𝑘 ):

∀𝜀 > 0 : ∃𝑁 ∈ ℕ : 𝑘, 𝑗 > 𝑁 =⇒ 𝑑( 𝑓 (𝑎 𝑘 ), 𝑓 (𝑎 𝑗 )) < 𝜀.

Preso un punto 𝑥 ∈ 𝐴¯ esiste certamente 𝑎 𝑛 ∈ 𝐴 con 𝑎 𝑛 → 𝑥 . Vogliamo


dimostrare che 𝑓 (𝑎 𝑛 ) ha limite in 𝑌 e che tale limite non dipende dalla successione
𝑎 𝑛 scelta. Se 𝑎 𝑛 → 𝑎 allora 𝑎 𝑛 è di Cauchy in 𝑋 (teorema 7.25). Per quanto
detto prima possiamo affermare che anche 𝑓 (𝑎 𝑛 ) è di Cauchy e quindi converge
in 𝑌 , in quanto 𝑌 è completo per ipotesi. Inoltre il lim 𝑓 (𝑎 𝑛 ) non dipende
dalla successione scelta perché se 𝑏 𝑛 → 𝑥 fosse un’altra successione potremmo
costruire una successione 𝑐 𝑛 che alterna i punti di 𝑎 𝑛 e 𝑏 𝑛 (ponendo, ad esempio,
𝑐2𝑛 = 𝑎 𝑛 e 𝑐 2𝑛+1 = 𝑏 𝑛 ). Anche 𝑐 𝑛 → 𝑥 ed è di Cauchy, dunque 𝑓 (𝑐 𝑛 ) converge.
Ma 𝑓 (𝑎 𝑛 ) e 𝑓 (𝑏 𝑛 ) sono sotto-successioni di 𝑓 (𝑐 𝑛 ) e dunque convergono allo
stesso limite. Abbiamo quindi dimostrato che per ogni 𝑥 ∈ 𝐴¯ esiste ℓ ∈ 𝑌 tale
che se 𝑎 𝑛 → 𝑥 , 𝑎 𝑛 ∈ 𝐴 allora 𝑓 (𝑎 𝑛 ) → ℓ . Possiamo quindi definire 𝑓˜(𝑥) = ℓ . Se
esiste una estensione continua di 𝑓 non può che essere definita in questo modo,
in quanto le funzioni continue mandano successioni convergenti in successioni
convergenti.

D’altra parte possiamo dimostrare che 𝑓˜ è una funzione uniformemente continua.


Infatti per ogni 𝜀 > 0 possiamo scegliere 𝛿 > 0 dato dall’uniforme continuità
di 𝑓 : dati 𝑥, 𝑦 ∈ 𝐴¯ con 𝑑(𝑥, 𝑦) < 𝛿/3 esisteranno 𝑥 𝑛 , 𝑦𝑛 ∈ 𝐴 con 𝑥 𝑛 → 𝑥 ,
𝑦𝑛 → 𝑦 . Si potrà quindi trovare 𝑛 sufficientemente grande in modo che
𝑑(𝑥 𝑛 , 𝑥) < 𝛿/3, 𝑑(𝑦𝑛 , 𝑦) < 𝛿/3, 𝑑( 𝑓 (𝑥 𝑛 ), 𝑓˜(𝑥)) < 𝜀, 𝑑( 𝑓 (𝑦𝑛 ), 𝑓˜(𝑦)) < 𝜀. Si avrà
allora 𝑑(𝑥 𝑛 , 𝑦𝑛 ) < 𝑑(𝑥 𝑛 , 𝑥) + 𝑑(𝑥, 𝑦) + 𝑑(𝑦, 𝑦𝑛 ) < 𝛿 , dunque 𝑑( 𝑓 (𝑥 𝑛 ), 𝑓 (𝑦𝑛 )) < 𝜀
e in conclusione

𝑑( 𝑓 (𝑥), 𝑓 (𝑦)) ≤ 𝑑( 𝑓 (𝑥), 𝑓 (𝑥 𝑛 )) + 𝑑( 𝑓 (𝑥 𝑛 ), 𝑓 (𝑦𝑛 )) + 𝑑( 𝑓 (𝑦𝑛 ), 𝑓 (𝑦)) ≤ 3𝜀.

Abbiamo quindi dimostrato l’uniforme continuità di 𝑓˜ con 3 𝜀 al posto di 𝜀 e


𝛿/3 al posto di 𝛿.

Definizione 7.35 (lipschitz). Sia 𝑓 : 𝑋 → 𝑌 una funzione definita tra due spazi
metrici e sia 𝐿 ≥ 0. Dato 𝐿 ≥ 0 diremo che 𝑓 è 𝐿-lipschitziana se per ogni 𝑥, 𝑦 ∈ 𝑋 si
ha
𝑑( 𝑓 (𝑥), 𝑓 (𝑦)) ≤ 𝐿 · 𝑑(𝑥, 𝑦).
Diremo che 𝑓 è lipschitziana se esiste 𝐿 ≥ 0 tale che 𝑓 sia 𝐿-lipschitziana.
308 7 spazi di funzioni

Teorema 7.36. Se 𝑓 : 𝑋 → 𝑌 è lipschitziana allora 𝑓 è sequenzialmente continua, cioè

𝑥 𝑘 → 𝑥 =⇒ 𝑓 (𝑥 𝑘 ) → 𝑓 (𝑥).

Dimostrazione. Se 𝑥 𝑘 → 𝑥 significa che 𝑑(𝑥 𝑘 , 𝑥) → 0, quindi

𝑑( 𝑓 (𝑥 𝑘 ), 𝑓 (𝑥)) ≤ 𝐿 · 𝑑(𝑥 𝑘 , 𝑥) → 0.

Osserviamo che la distanza 𝑑(𝑥, 𝑦) di uno spazio metrico 𝑋 risulta sempre


essere una funzione 1-lipschitziana rispetto ad ognuna delle due variabili 𝑥 e 𝑦 .
Infatti per la disuguaglianza triangolare inversa si ha

|𝑑(𝑥 1 , 𝑦) − 𝑑(𝑥2 , 𝑦)| ≤ 𝑑(𝑥1 , 𝑥2 ).

Di conseguenza la norma di uno spazio normato è anch’essa 1-lipschitziana. In


particolare la distanza e la norma risultano essere funzioni continue.
teor. contrazioni
Teorema 7.37 (delle contrazioni o punto fisso di Banach-Caccioppoli). Sia 𝑋
uno spazio metrico completo non vuoto e sia 𝑓 : 𝑋 → 𝑋 una funzione 𝐿-lipschitziana
con 𝐿 < 1 (diremo che 𝑓 è una contrazione). Allora esiste ed è unico un punto 𝑥 ∈ 𝑋
tale che 𝑓 (𝑥) = 𝑥 .

Dimostrazione. Si consideri un qualunque punto 𝑝 ∈ 𝑋 e si definisca la


successione 𝑥 𝑘 ∈ 𝑋 tramite la definizione ricorsiva
(
𝑥0 = 𝑝
𝑥 𝑘+1 = 𝑓 (𝑥 𝑘 ).

Visto che 𝑓 è 𝐿-lipschitziana si avrà

𝑑(𝑥2 , 𝑥1 ) = 𝑑( 𝑓 (𝑥1 ), 𝑓 (𝑥0 )) ≤ 𝐿 · 𝑑(𝑥1 , 𝑥0 )


𝑑(𝑥3 , 𝑥2 ) = 𝑑( 𝑓 (𝑥2 ), 𝑓 (𝑥1 )) ≤ 𝐿 · 𝑑(𝑥2 , 𝑥1 ) ≤ 𝐿2 · 𝑑(𝑥1 , 𝑥0 )
𝑑(𝑥4 , 𝑥3 ) = 𝑑( 𝑓 (𝑥3 ), 𝑓 (𝑥2 )) ≤ 𝐿 · 𝑑(𝑥3 , 𝑥2 ) ≤ 𝐿3 · 𝑑(𝑥1 , 𝑥0 )
..
.

possiamo quindi dimostrare induttivamente che per ogni 𝑚 ∈ ℕ si ha

𝑑(𝑥 𝑚+1 , 𝑥 𝑚 ) ≤ 𝐿𝑚 · 𝑑(𝑥 1 , 𝑥0 ).

Ma allora per ogni 𝑘 ∈ ℕ e per ogni 𝑗 > 𝑘 utilizzando la disuguaglianza


triangolare e facendo la somma della progressione geometrica si ha

𝑗−1 𝑗−1
𝐿𝑘 − 𝐿 𝑗
𝐿𝑚 · 𝑑(𝑥1 , 𝑥0 ) =
X X
𝑑(𝑥 𝑘 , 𝑥 𝑗 ) ≤ 𝑑(𝑥 𝑚 , 𝑥 𝑚+1 ) ≤ 𝑑(𝑥1 , 𝑥0 ).
𝑚=𝑘 𝑚=𝑘
1−𝐿

Visto che 𝐿 < 1 se 𝑘 → +∞ e 𝑗 > 𝑘 questa quantità tende a zero e quindi risulta
che 𝑥 𝑘 è una successione di Cauchy. Essendo per ipotesi 𝑋 completo sappiamo
7.3 convergenza uniforme 309

che la successione converge 𝑥 𝑘 → 𝑥 ad un punto 𝑥 ∈ 𝑋 . Per la continuità di 𝑓 ,


passando al limite nell’equazione 𝑥 𝑘+1 = 𝑓 (𝑥 𝑘 ) si ottiene 𝑥 = 𝑓 (𝑥). Abbiamo
quindi trovato un punto fisso. Se 𝑦 ∈ 𝑋 fosse un altro punto fisso si avrebbe:

𝑑(𝑥, 𝑦) = 𝑑( 𝑓 (𝑥), 𝑓 (𝑦)) ≤ 𝐿 · 𝑑(𝑥, 𝑦)

che è assurdo se 𝐿 < 1 e 𝑥 ≠ 𝑦 .

7.3 convergenza uniforme

Definizione 7.38 (convergenza uniforme). Sia 𝐴 un insieme non vuoto e 𝑓 : 𝐴 → ℝ.


Definiamo la norma uniforme (o norma del sup) di 𝑓 come
norma uniforme

k 𝑓 k ∞ = sup | 𝑓 (𝑥)|
𝑥∈𝐴

Se anche 𝑔 : 𝐴 → ℝ definiamo la distanza uniforme tra 𝑓 e 𝑔 come


distanza uniforme

𝑑∞ ( 𝑓 , 𝑔) = sup | 𝑓 (𝑥) − 𝑔(𝑥)|.


𝑥∈𝐴

Se 𝑓 𝑘 è una successione di funzioni e 𝑓 è una funzione, diremo che 𝑓 𝑘 converge


uniformemente a 𝑓 e scriveremo
convergenza uniforme

𝑓𝑘 ⇒ 𝑓

se 𝑑∞ ( 𝑓 𝑘 , 𝑓 ) → 0.

Esempio 7.39. La successione


r
1
𝑓 𝑘 (𝑥) = 𝑥2 +
𝑘

converge uniformemente (su tutto ℝ) alla funzione 𝑓 (𝑥) = |𝑥| . Infatti posto 𝑔 𝑘 (𝑥) =
𝑓 𝑘 (𝑥) − 𝑓 (𝑥), la funzione 𝑔 𝑘 risulta essere derivabile per 𝑥 ≠ 0 e per 𝑥 > 0 si ha
𝑥
𝑔 0𝑘 (𝑥) = q − 1 < 0.
𝑥2 + 1
𝑘

Dunque la funzione 𝑔 𝑘 è decrescente su [0 , +∞). Per simmetria (è una funzione pari) è


crescente su (−∞, 0]. Risulta quindi che il massimo di 𝑔 𝑘 è in 𝑥 = 0. Chiaramente
𝑔 𝑘 ≥ 0 quindi si ha:

1
k 𝑓 𝑘 − 𝑓 k ∞ = sup 𝑔 𝑘 (𝑥) = 𝑔 𝑘 (0) = √ → 0.
𝑥∈ℝ 𝑘

Dunque 𝑓 𝑘 ⇒ 𝑓 .

Osserviamo che in generale k 𝑓 k ∞ e 𝑑∞ ( 𝑓 , 𝑔) possono assumere il valore +∞


(ad esempio se 𝐴 = ℝ, 𝑓 (𝑥) = 𝑥 e 𝑔(𝑥) = 0) e quindi non è detto che siano
effettivamente una norma e una distanza.
310 7 spazi di funzioni

Teorema 7.40 (proprietà della norma uniforme). La norma uniforme soddisfa tutte
le proprietà di una norma (Definizione 7.4), salvo il fatto che può assumere valori in
[0 , +∞] invece che in [0 , +∞).

Dimostrazione. Chiaramente la norma uniforme non assume valori negativi


in quanto estremo superiore di un insieme (non vuoto) di numeri reali non
negativi. Inoltre se k 𝑓 k ∞ = 0 significa che | 𝑓 (𝑥)| = 0 per ogni 𝑥 e dunque 𝑓 = 0
(proprietà di separazione).

L’omogenità segue dall’omogeneità del valore assoluto, in quanto si ha

sup |(𝜆 · 𝑓 )(𝑥)| = sup |𝜆 · 𝑓 (𝑥)| = sup |𝜆| · | 𝑓 (𝑥)| = |𝜆| · sup | 𝑓 (𝑥)|.
𝑥∈𝐴 𝑥∈𝐴 𝑥∈𝐴 𝑥∈𝐴

La disuguaglianza triangolare segue dalla disuguaglianza triangolare del valore


assoluto, che viene preservata facendone l’estremo superiore:

sup | 𝑓 (𝑥) + 𝑔(𝑥)| ≤ sup [| 𝑓 (𝑥)| + | 𝑔(𝑥)|] ≤ sup | 𝑓 (𝑥)| + sup | 𝑔(𝑥)|.
𝑥∈𝐴 𝑥∈𝐴 𝑥∈𝐴 𝑥∈𝐴

Teorema 7.41. Sia 𝐴 un insieme. Lo spazio vettoriale delle funzioni limitate 𝑓 : 𝐴 → ℝ


(cioè delle funzioni con norma uniforme finita)

B(𝐴) = 𝑓 ∈ ℝ𝐴 : k 𝑓 k ∞ < +∞


dotato della norma uniforme k·k ∞ risulta essere uno spazio di Banach (ovvero uno
spazio vettoriale normato e completo). Su tale spazio di Banach la distanza indotta
dalla norma è la distanza uniforme 𝑑∞ e la convergenza indotta dalla distanza è la
convergenza uniforme.

Dimostrazione. Per definizione risulta verificato che la norma uniforme k·k ∞


assume valori finiti su B(𝐴). Dunque, in base al teorema precedente, k·k ∞
è effettivamente una norma e B(𝐴) risulta quindi essere uno spazio norma-
to. Dimostriamo ora che esso è completo, cioè che le successioni di Cauchy
convergono.

Sia 𝑓 𝑘 una successione di Cauchy in B(𝐴). Allora per ogni 𝑥 ∈ 𝐴 risulta che
𝑓 𝑘 (𝑥) è una successione di Cauchy in ℝ in quanto si ha (per definizione di sup)

𝑓 𝑘 (𝑥) − 𝑓 𝑗 (𝑥) ≤ 𝑓 𝑘 − 𝑓 𝑗

e quindi se 𝑓 𝑘 − 𝑓 𝑗 < 𝜀 a maggior ragione per 𝑥 ∈ 𝐴 fissato si ha 𝑓 𝑘 (𝑥) − 𝑓 𝑗 (𝑥) <


𝜀.
Dunque per ogni 𝑥 ∈ 𝐴 la successione numerica 𝑓 𝑘 (𝑥) converge in quanto
ℝ è completo. Posto 𝑓 (𝑥) = lim 𝑓 𝑘 (𝑥) abbiamo dunque trovato un candidato
limite della successione. Dovremo ora mostrare che 𝑓 ∈ B(𝐴) e che 𝑓 𝑘 converge
uniformemente a 𝑓 . Per ogni 𝜀 > 0 per la condizione di Cauchy dovrà esistere
𝑁 ∈ ℕ tale che se 𝑘, 𝑗 > 𝑁 allora

𝑑∞ ( 𝑓 𝑘 , 𝑓 𝑗 ) < 𝜀.
7.3 convergenza uniforme 311

Ma allora per ogni 𝑥 ∈ 𝐴, per ogni 𝑘 > 𝑁 e per ogni 𝑗 > 𝑁 si avrà:

| 𝑓 𝑘 (𝑥) − 𝑓 (𝑥)| ≤ 𝑓 𝑘 (𝑥) − 𝑓 𝑗 (𝑥) + 𝑓 𝑗 (𝑥) − 𝑓 (𝑥) < 𝜀 + 𝑓 𝑗 (𝑥) − 𝑓 (𝑥) .


Visto che per ogni 𝑥 si ha 𝑓 𝑗 (𝑥) → 𝑓 (𝑥), per ogni 𝑥 esiste un 𝑗 tale che
𝑓 𝑗 (𝑥) − 𝑓 (𝑥) < 𝜀 e quindi possiamo concludere che

| 𝑓 𝑘 (𝑥) − 𝑓 (𝑥)| < 2 𝜀.

Facendo il sup per 𝑥 ∈ 𝐴 si ottiene dunque

k 𝑓 𝑘 − 𝑓 k ∞ ≤ 2 𝜀.

Abbiamo quindi verificato la definizione di limite k 𝑓 𝑘 − 𝑓 k ∞ → 0. In particolare


k 𝑓 k ∞ < +∞ in quanto vale la disuguaglianza triangolare

k 𝑓 k ∞ ≤ k 𝑓 − 𝑓 𝑘 k ∞ + k 𝑓 𝑘 k ∞ < +∞

essendo k 𝑓 − 𝑓 𝑘 k ∞ → 0 e k 𝑓 𝑘 k ∞ < +∞.

Definizione 7.42 (convergenza puntuale). Sia 𝑓 𝑘 : 𝐴 → ℝ una successione di


funzioni e sia 𝑓 : 𝐴 → ℝ una funzione. Se per ogni 𝑥 ∈ 𝐴 si ha 𝑓 𝑘 (𝑥) → 𝑓 (𝑥) diremo
che la successione 𝑓 𝑘 converge puntualmente ad 𝑓 . convergenza puntuale

Teorema 7.43 (convergenza uniforme implica convergenza puntuale). Sia


𝑓 𝑘 : 𝐴 → ℝ una successione di funzioni. Se 𝑓 𝑘 converge uniformemente ad una
funzione 𝑓 allora 𝑓 𝑘 converge puntualmente ad 𝑓 .

Dimostrazione. E’ sufficiente osservare che per ogni 𝑥 ∈ 𝐴 si ha

| 𝑓 𝑘 (𝑥) − 𝑓 (𝑥)| ≤ sup | 𝑓 𝑘 (𝑦) − 𝑓 (𝑦)| = k 𝑓 𝑘 − 𝑓 k ∞ → 0.


𝑦∈𝐴

Esempio 7.44 (successione che converge puntualmente ma non uniformemente).


Sia 𝑓 𝑘 : [0 , 1] → ℝ la successione di funzioni definita da 𝑓 𝑘 (𝑥) = 𝑥 𝑘 . Se 𝑥 ∈ [0 , 1)
si ha 𝑥 𝑘 → 0 mentre se 𝑥 = 1 si ha 𝑥 𝑘 → 1. Dunque la successione 𝑓 𝑘 converge
puntualmente alla funzione
(
0 se 𝑥 ∈ [0 , 1)
𝑓 (𝑥) =
1 se 𝑥 = 1.

Osserviamo però che

𝑑∞ ( 𝑓 𝑘 , 𝑓 ) = sup | 𝑓 𝑘 (𝑥) − 𝑓 (𝑥)| ≥ lim− | 𝑓 𝑘 (𝑥) − 𝑓 (𝑥)| = 1.


𝑥∈[0 ,1] 𝑥→1

dunque non ci può essere convergenza uniforme di 𝑓 𝑘 verso 𝑓 .

E’ facile convincersi che la successione 𝑓 𝑘 dell’esempio precedente, oltre a


non convergere uniformemente non ammette nessuna estratta convergente
312 7 spazi di funzioni

uniformemente. Perciò tale successione non può essere contenuta in nessun


compatto di 𝐶 0 ([0 , 1]). In particolare il disco unitario

𝐷 = 𝑓 ∈ 𝐶 0 ([0 , 1]) : k 𝑓 k ∞ ≤ 1


risulta essere un insieme chiuso e limitato che però non è compatto.

Teorema 7.45 (continuità del limite uniforme). Sia 𝑋 uno spazio metrico e siano
𝑓 𝑘 : 𝑋 → ℝ funzioni continue che convergono uniformemente ad una funzione
𝑓 : 𝑋 → ℝ. Allora anche 𝑓 è continua.

Dimostrazione. Fissato 𝑥 0 ∈ 𝑋 basta dimostrare che per ogni 𝜀 > 0 esiste


𝛿 > 0 tale che se 𝑑(𝑥, 𝑥0 ) < 𝛿 allora | 𝑓 (𝑥) − 𝑓 (𝑥0 )| < 3𝜀. Per definizione di
convergenza uniforme dato 𝜀 > 0 esiste un 𝑁 ∈ ℕ (in realtà ne esistono infiniti)
per cui 𝑑∞ ( 𝑓𝑁 , 𝑓 ) < 𝜀. Per la continuità di 𝑓𝑁 in corrispondenza dello stesso
𝜀 esiste 𝛿 > 0 tale che se 𝑑(𝑥, 𝑥0 ) < 𝛿 allora | 𝑓𝑁 (𝑥) − 𝑓𝑁 (𝑥0 )| < 𝜀. Ma allora se
𝑑(𝑥, 𝑥0 ) < 𝛿 si ha

| 𝑓 (𝑥) − 𝑓 (𝑥0 )| ≤ | 𝑓 (𝑥) − 𝑓𝑁 (𝑥)| + | 𝑓𝑁 (𝑥) − 𝑓𝑁 (𝑥0 )| + | 𝑓𝑁 (𝑥0 ) − 𝑓 (𝑥0 )|


≤ k 𝑓 − 𝑓𝑁 k ∞ + 𝜀 + k 𝑓 − 𝑓𝑁 k ∞ ≤ 3 𝜀.

𝐶 0 ([𝑎, 𝑏]) è completo

Teorema 7.46 (completezza di 𝐶 0 ([𝑎, 𝑏])). Lo spazio 𝐶 0 ([𝑎, 𝑏]) delle funzioni
continue definite su un intervallo chiuso e limitato, dotato della norma uniforme k·k ∞
risulta essere uno spazio di Banach (ovvero uno spazio vettoriale normato e completo).

Dimostrazione. Per il teorema di Weierstrass ogni funzione continua definita


sul compatto [𝑎, 𝑏] è limitata. Dunque 𝐶 0 ([𝑎, 𝑏]) è un sottospazio vettoriale
di B([𝑎, 𝑏]). Inoltre il teorema precedente (continuità del limite) ci dice che
𝐶 0 ([𝑎, 𝑏]) è un sottospazio chiuso di B([𝑎, 𝑏]). Ma B([𝑎, 𝑏]) è completo e quindi
anche 𝐶 0 ([𝑎, 𝑏]) essendo chiuso in B([𝑎, 𝑏]) è completo.

La norma uniforme è la norma naturale su 𝐶 0 ([𝑎, 𝑏]) in quanto lo rende uno


spazio completo. Per questo motivo la norma uniforme sulle funzioni continue
viene anche chiamata norma 𝐶 0 e si può denotare nel modo seguente:

k 𝑓 k 𝐶 0 = k 𝑓 k 𝐶 0 ([𝑎,𝑏]) = k 𝑓 k ∞ per 𝑓 ∈ 𝐶 0 ([𝑎, 𝑏]).

7.4 passaggio al limite sotto il segno di integrale

Nell’esempio 6.68 abbiamo definito una funzione Γ(𝑥) tramite l’integrale in 𝑑𝑡


di una funzione che dipende dal parametro 𝑥 :
∫ 𝑏
Γ(𝑥) = 𝑓 (𝑥, 𝑡) 𝑑𝑡, 𝑓 (𝑥, 𝑡) = 𝑒 −𝑡 𝑡 𝑥−1 .
𝑎
7.4 passaggio al limite sotto il segno di integrale 313

Se la funzione 𝑓 (𝑥, 𝑡) è continua e derivabile è naturale chiedersi se anche la


funzione integrale Γ risulta essere continua e derivabile. E se è derivabile è
naturale chiedersi come si può calcolare la derivata.

In generale si può rispondere facilmente a queste domande se siamo in grado


di scambiare tra loro gli operatori di limite e di integrale. Infatti osserviamo che
si ha
∫ 𝑏 ∫ 𝑏
?
lim Γ(𝑥) = lim 𝑓 (𝑥, 𝑡) 𝑑𝑡 = lim 𝑓 (𝑥, 𝑡) 𝑑𝑡
𝑥→𝑥0 𝑥→𝑥0 𝑎 𝑎 𝑥→𝑥0
∫ 𝑏
= 𝑓 (𝑥0 , 𝑡) 𝑑𝑡 = Γ(𝑥0 )
𝑎

e
𝑏
Γ(𝑥 + ℎ) − Γ(𝑥) 𝑓 (𝑥 + ℎ, 𝑡) − 𝑓 (𝑥, 𝑡)

Γ0(𝑥) = lim = lim 𝑑𝑡
ℎ→0 ℎ ℎ→0 𝑎 ℎ
𝑏
𝑓 (𝑥 + ℎ, 𝑡) − 𝑓 (𝑥, 𝑡)

?
= lim 𝑑𝑡
𝑎 ℎ→0 ℎ
𝑏
𝜕𝑓

= (𝑥, 𝑡) 𝑑𝑡.
𝑎 𝜕𝑥

In entrambi i casi l’unico passaggio non formalmente giustificato è quello


marcato con il punto interrogativo. Lo scopo di questo capitolo è quello di
determinare alcune condizioni che permettono di effettuare lo scambio del
limite con l’integrale e lo scambio della derivata con l’integrale.

Esempio 7.47. La successione 𝑓𝑛 (𝑥) = 𝑥 𝑛 dell’esempio 7.44 converge puntualmente


alla funzione che vale 0 sull’intervallo [0 , 1).

In questo caso il limite può essere scambiato con l’integrale:


1
1
𝑥 𝑛+1
∫ 
1
lim 𝑓𝑛 (𝑥) 𝑑𝑥 = lim = lim =0
𝑛→+∞ −1 𝑛→+∞ 𝑛+1 −1
𝑛→+∞ 𝑛+1
∫ 1 ∫ 1
lim 𝑓𝑛 (𝑥) 𝑑𝑥 = 𝑓 (𝑥) 𝑑𝑥 = 0.
−1 𝑛→+∞ −1

L’esempio precedente ci dice che lo scambio tra il limite e l’integrale in certi


casi può essere fatto. Purtroppo la convergenza puntuale non è una ipotesi
sufficiente come si vede nel seguente esempio.

Esempio 7.48. Si consideri la successione di funzione 𝑓𝑛 : [0 , 1] → ℝ definita da


𝑛𝑥
𝑓𝑛 (𝑥) = .
1 + 𝑛2 𝑥4
Chiaramente si ha per ogni 𝑥 ∈ ℝ:
𝑛𝑥
lim = 0.
𝑛→+∞ 1 + 𝑛 2 𝑥 4
314 7 spazi di funzioni

Dunque la successione 𝑓𝑛 converge puntualmente alla funzione 𝑓 = 0 identicamente


nulla. Ma lo scambio del limite con l’integrale in questo caso non è possibile in quanto
risulta
1 1 1
𝑛𝑥 𝑛𝑥
∫ ∫ ∫
lim 𝑓𝑛 (𝑥) 𝑑𝑥 = lim 𝑑𝑥 = lim 𝑑𝑥
𝑛→+∞ 0 𝑛→+∞ 0 1 + 𝑛 2 𝑥 4 𝑛→+∞ 0 1 + 𝑛 2 𝑥 4
1 1 1 𝜋
= lim arctg(𝑛𝑥 2 ) 0 = lim arctg 𝑛 =
𝑛→+∞ 2 2 𝑛→+∞ 4
mentre ovviamente
∫ 1 ∫ 1
lim 𝑓𝑛 (𝑥) 𝑑𝑥 = 0 𝑑𝑥 = 0.
0 𝑛→+∞ 0

Il motivo per cui nell’esempio precedente non si può passare al limite sotto
il segno di integrale è dovuto al fatto che la funzione 𝑓𝑛 (𝑥) pur tendendo a
zero in ogni punto 𝑥 ∈ ℝ nei punti vicini ad 𝑥 = 0 diventa, al crescere di 𝑛 ,
molto grande. In effetti il grafico della funzione 𝑓𝑛 (𝑥) si ottiene dal grafico della
𝑥
funzione 𝑓 (𝑥) = 1+𝑥 4 schiacciando la variabile 𝑥 di un fattore 𝑛 e dilatando la

variabile 𝑦 dello stesso fattore 𝑛 . Questo fa sì che l’area sotto il grafico rimanga
invariata. La funzione 𝑓𝑛 ha un punto di massimo per 𝑥 = √4 1√ (lo si verifichi
3 𝑥
studiando il segno della derivata) e in tale punto assume un valore che tende
ad infinito quando 𝑛 → +∞.

Se però c’è convergenza uniforme e l’integrale non è improprio, vale il seguen-


te.

Teorema 7.49 (passaggio al limite sotto il segno di integrale). Siano 𝑓𝑛 , 𝑓 : [𝑎, 𝑏]


funzioni limitate e Riemann integrabili sull’intervallo chiuso e limitato [𝑎, 𝑏]. Suppo-
niamo inolte che ci sia convergenza uniforme: 𝑓𝑛 ⇒ 𝑓 . Allora
∫ 𝑏 ∫ 𝑏
lim 𝑓𝑛 (𝑥) 𝑑𝑥 = 𝑓 (𝑥) 𝑑𝑥.
𝑛→+∞ 𝑎 𝑎

Inoltre scelto qualunque 𝑐 ∈ [𝑎, 𝑏] e posto


∫ 𝑥 ∫ 𝑥
𝐹 𝑘 (𝑥) = 𝑓 𝑘 (𝑡) 𝑑𝑡, 𝐹(𝑥) = 𝑓 (𝑡) 𝑑𝑡
𝑐 𝑐

si ha convergenza uniforme 𝐹 𝑘 ⇒ 𝐹 .

Dimostrazione. Se 𝑓𝑛 e 𝑓 sono Riemann-integrabili anche 𝑓𝑛 − 𝑓 e | 𝑓𝑛 − 𝑓 | lo


7.4 passaggio al limite sotto il segno di integrale 315

sono (teorema 6.12) e si ha:


∫ ∫
𝑏 ∫ 𝑏 𝑏
𝑓 (𝑥) 𝑑𝑥 − 𝑓 (𝑥) 𝑑𝑥 ≤ | 𝑓𝑛 (𝑥) − 𝑓 (𝑥)| 𝑑𝑥

𝑛
𝑎 𝑎 𝑎
∫ 𝑏
≤ sup | 𝑓𝑛 (𝑡) − 𝑓 (𝑡)| 𝑑𝑥
𝑎 𝑡∈[𝑎,𝑏]
∫ 𝑏
= sup | 𝑓𝑛 (𝑡) − 𝑓 (𝑡)| · 1 𝑑𝑥 → 0.
𝑡∈[𝑎,𝑏] 𝑎

Se poi definiamo 𝐹 e 𝐹 𝑘 come nell’enunciato, si ha


𝑥

k𝐹 𝑘 − 𝐹k ∞ = sup 𝑓 𝑘 (𝑡) − 𝑓 (𝑡) 𝑑𝑡

𝑥∈[𝑎,𝑏] 𝑐

≤ sup |𝑥 − 𝑐| · k 𝑓 𝑘 − 𝑓 k ∞
𝑥∈[𝑎,𝑏]

≤ (𝑏 − 𝑎) · k 𝑓 𝑘 − 𝑓 k ∞ → 0.

Ci ricordiamo che le funzioni continue sono localmente Riemann integrabili.


Dunque il teorema precedente ci permette di affermare che l’operatore integrale
𝑆 : 𝐶 0 ([𝑎, 𝑏]) → 𝐶 0 ([𝑎, 𝑏])
∫ 𝑥
𝑆( 𝑓 )(𝑥) = 𝑓 (𝑡) 𝑑𝑡
𝑐

(che fissato 𝑐 ∈ [𝑎, 𝑏] associa ad una funzione 𝑓 ∈ 𝐶 0 ([𝑎, 𝑏]) la sua funzione
integrale) è un operatore continuo rispetto alla norma uniforme.

Purtroppo il teorema precedente non può essere valido in generale per gli
integrali impropri, abbiamo infatti il seguente esempio negativo.

Esempio 7.50. Consideriamo la successione di funzioni 𝑓𝑛 : ℝ → ℝ

1 1
𝑓𝑛 (𝑥) = · .
𝑛 1 + 𝑥−𝑛  2
𝑛

Si può osservare che sup𝑥∈ℝ | 𝑓𝑛 (𝑥)| = 𝑓𝑛 (𝑛) = 1


𝑛 e quindi 𝑓𝑛 ⇒ 0 su tutto ℝ.
Nonostante questo si ha
∫ +∞ ∫ +∞
1
𝑓𝑛 (𝑥) 𝑑𝑥 = 𝑑𝑡 = 𝜋
−∞ −∞ 1 + 𝑡2

e quindi gli integrali non tendono a zero.

Per poter effettuare il passaggio al limite all’interno di un integrale improprio ci convergenza dominata uniforme
serve una ipotesi in più, come vediamo nel seguente.
316 7 spazi di funzioni

Teorema 7.51 (convergenza dominata localmente uniforme). Siano 𝑓 𝑘 : (𝑎, 𝑏) →


ℝ e 𝑓 : (𝑎, 𝑏) → ℝ funzioni localmente Riemann integrabili sull’intervallo (𝑎, 𝑏) con
−∞ ≤ 𝑎 < 𝑏 ≤ +∞ tali che per ogni [𝛼, 𝛽] ⊆ (𝑎, 𝑏) si abbia convergenza uniforme:
𝑓 𝑘 ⇒ 𝑓 sull’intervallo [𝑎, 𝛽].
Supponiamo inoltre che esista 𝑔 : (𝑎, 𝑏) → ℝ integrabile in senso improprio su (𝑎, 𝑏)
con integrale convergente e tale che

| 𝑓 𝑘 (𝑥)| ≤ 𝑔(𝑥)

per ogni 𝑘 ∈ ℕ e ogni 𝑥 ∈ [𝑎, 𝑏).

Allora 𝑓 𝑘 ed 𝑓 hanno integrale improprio convergente su (𝑎, 𝑏) e si ha


∫ 𝑏 ∫ 𝑏
lim 𝑓 𝑘 (𝑥) 𝑑𝑥 = 𝑓 (𝑥) 𝑑𝑥.
𝑘→+∞ 𝑎 𝑎

Dimostrazione. Ogni 𝑓 𝑘 è assolutamente integrabile in senso improprio in quanto


| 𝑓 𝑘 | ≤ 𝑔 dove 𝑔 ha integrale finito per ipotesi. Visto che 𝑓 𝑘 (𝑥) → 𝑓 (𝑥) per
ogni 𝑥 ∈ (𝑎, 𝑏) si ha anche | 𝑓 (𝑥)| ≤ 𝑔(𝑥) per ogni 𝑥 ∈ (𝑎, 𝑏) e dunque anche
l’integrale di 𝑓 è assolutamente convergente su (𝑎, 𝑏).

Visto che l’integrale improprio è convergente sappiamo che per ogni 𝜀 > 0
esistono 𝛼 > 𝑎 e 𝛽 < 𝑏 per cui risulta
∫ 𝑏 ∫ 𝛼
𝑔(𝑥) 𝑑𝑥 < 𝜀, 𝑔(𝑥) 𝑑𝑥 < 𝜀.
𝛽 𝑎

Ma su [𝛼, 𝛽] abbiamo la convergenza degli integrali per il teorema precedente


dunque esiste 𝑁 tale che per ogni 𝑘 > 𝑁 si ha
𝛽 𝛽
∫ ∫
𝑓 𝑘 (𝑥) 𝑑𝑥 − 𝑓 (𝑥) 𝑑𝑥 ≤ 𝜀.


𝛼 𝛼

Mettendo insieme le due cose si ottiene, per ogni 𝑘 > 𝑁


∫ ∫
𝑏 ∫ 𝑏 𝛽 ∫ 𝛽
𝑓 𝑘 (𝑥) 𝑑𝑥 − 𝑓 (𝑥) 𝑑𝑥 ≤ 𝑓 𝑘 (𝑥) 𝑑𝑥 − 𝑓 (𝑥) 𝑑𝑥


𝑎 𝑎 𝛼 𝛼
∫ 𝛼 ∫ 𝑏

( 𝑓 𝑘 (𝑥) − 𝑓 (𝑥)) 𝑑𝑥 + ( 𝑓 𝑘 (𝑥) − 𝑓 (𝑥)) 𝑑𝑥

+

𝑎 𝛽
∫ 𝛼 ∫ 𝛼 ∫ 𝑏 ∫ 𝑏
≤ 𝜀+ | 𝑓 𝑘 (𝑥)| 𝑑𝑥 + | 𝑓 (𝑥)| 𝑑𝑥 + | 𝑓 𝑘 (𝑥)| 𝑑𝑥 + | 𝑓 (𝑥)| 𝑑𝑥
𝑎 𝑎 𝛽 𝛽
∫ 𝛼 ∫ 𝑏
≤ 𝜀+2 𝑔(𝑥) 𝑑𝑥 + 2 𝑔(𝑥) 𝑑𝑥 ≤ 5𝜀.
𝑎 𝛽

Abbiamo quindi verficato la tesi tramite la definizione di limite.

Esempio 7.52. La successione 𝑓 𝑘 (𝑥) = sin(𝑥 𝑘 ) converge puntualmente a 𝑓 (𝑥) = 0


sull’intervallo 0 , 𝜋2 e la convergenza è uniforme su ogni intervallo [0 , 𝛽] con 𝛽 < 𝜋2

𝜋
𝜋 𝜋
(verificare!). Inoltre | 𝑓 𝑘 (𝑥)| = sin(𝑥 𝑘 ) ≤ 1 per ogni 𝑥 ∈ 0 ,
 ∫
1 𝑑𝑥 = < +∞.
 2
2 e 0 2
7.4 passaggio al limite sotto il segno di integrale 317

Dunque possiamo applicare il teorema di convergenza dominata e, scambiando il limite


con l’integrale possiamo dedurre che
∫ 𝜋
2
sin(𝑥 𝑘 ) 𝑑𝑥 → 0 , per 𝑘 → +∞.
0

Nel teorema 7.53 l’ipotesi che esista una funzione 𝑔 che “domina” l’intera
successione è essenziale, come abbiamo visto nell’esempio 7.50. Invece l’ipotesi
che la successione converga uniformemente non è veramente necessaria: la
convergenza puntuale (a patto che la successione sia dominata) è sufficiente
per poter effettuare il passaggio al limite sotto il segno di integrale. Nella sua
generalità questo risultato (teorema di convergenza dominata di Lebesgue)
viene dimostrato per l’integrale di Lebesgue. Siamo però in grado di enunciarne
una versione un poco più debole valida per gli integrali impropri di Riemann
che potrà essere molto utile in tanti casi concreti.

convergenza dominata
Teorema 7.53 (convergenza dominata). Siano 𝐼 ⊆ ℝ un intervallo e siano −∞ ≤
𝑎 < 𝑏 ≤ +∞ reali estesi. Sia 𝑓 : 𝐼 × (𝑎, 𝑏) → ℝ una funzione continua e sia
𝑔 : (𝑎, 𝑏) → ℝ una funzione continua con integrale convergente
∫ 𝑏
𝑔(𝑡) < +∞
𝑎

tale per ogni 𝑥 ∈ 𝐼 e per ogni 𝑡 ∈ (𝑎, 𝑏) si abbia | 𝑓 (𝑥, 𝑡)| ≤ 𝑔(𝑡).
∫𝑏
Allora per ogni 𝑥 ∈ 𝐼 l’integrale 𝑎
𝑓 (𝑥, 𝑡) 𝑑𝑡 è convergente ed è continuo nella variabile
𝑥 , cioè: ∫ 𝑏 ∫ 𝑏
lim 𝑓 (𝑦, 𝑡) 𝑑𝑡 = 𝑓 (𝑥, 𝑡) 𝑑𝑡.
𝑦→𝑥 𝑎 𝑎

Dimostrazione. Si noti che l’indice 𝑘 → +∞, 𝑘 ∈ ℕ nel teorema 7.51 può essere
tranquillamente sostituito con un parametro continuo 𝑦 → 𝑥 , 𝑦 ∈ ℝ. Vogliamo
quindi ricondurci al teorema 7.51 e per fare questo andremo quindi a dimostrare
che fissato [𝛼, 𝛽] ⊆ (𝑎, 𝑏) e fissato 𝑥 ∈ 𝐼 si ha convergenza uniforme delle
funzioni 𝑡 ↦→ 𝑓 (𝑦, 𝑡) alla funzione 𝑡 ↦→ 𝑓 (𝑥, 𝑡) quando 𝑦 → 𝑥 .

Senza perdere di generalità possiamo supporre che 𝐼 sia un intervallo chiuso


e limitato che contiene il punto fissato 𝑥 . La funzione 𝑓 è dunque continua
sull’insieme sequenzialmente compatto 𝐼 × [𝛼, 𝛽] e quindi è uniformemente
continua per il teorema di Cantor (in due variabili). Significa che per ogni 𝜀 > 0
esiste 𝛿 > 0 tale che per ogni 𝑥 1 , 𝑥 2 ∈ 𝐼 e per ogni 𝑡, 𝑠 ∈ [𝛼, 𝛽] si ha:
p
(𝑥1 − 𝑥2 )2 + (𝑡1 − 𝑡2 )2 < 𝛿 =⇒ | 𝑓 (𝑥1 , 𝑡1 ) − 𝑓 (𝑥2 , 𝑡2 )| < 𝜀.

Ma allora per ogni 𝜀 > 0 se 𝑦 ∈ 𝐼 e |𝑥 − 𝑦| < 𝛿 si ha

sup | 𝑓 (𝑦, 𝑡) − 𝑓 (𝑥, 𝑡)| ≤ 𝜀


𝑡∈[𝛼,𝛽]

e quindi
lim 𝑑∞ (𝑡 ↦→ 𝑓 (𝑦, 𝑡), 𝑡 ↦→ 𝑓 (𝑥, 𝑡)) = 0.
𝑦→𝑥
318 7 spazi di funzioni

come volevamo dimostrare.

Il teorema di convergenza dominata viene spesso utilizzato per scambiare la


derivata con l’integrale come enunciato nel seguente.
scambio della derivata con l’integrale
Teorema 7.54 (passaggio della derivata sotto il segno di integrale). Sia 𝑓 : 𝐼 ×
(𝑎, 𝑏) → ℝ una funzione, 𝐼 ⊆ ℝ un intervallo e 𝑎, 𝑏 ∈ ℝ̄ con −∞ ≤ 𝑎 < 𝑏 ≤ +∞.
Supponiamo che per ogni 𝑡 ∈ (𝑎, 𝑏) la funzione sia derivabile rispetto a 𝑥 per ogni
𝜕𝑓
𝑥 ∈ 𝐼 e che la derivata 𝜕𝑥 sia continua su tutto il rettangolo 𝐼 × (𝑎, 𝑏). Supponiamo
infine che esista una funzione 𝐺 : (𝑎, 𝑏) → ℝ localmente Riemann integrabile e con
∫𝑏
integrale 𝑎
𝐺(𝑡) 𝑑𝑡 convergente tale che per ogni 𝑥 ∈ 𝐼 e per ogni 𝑡 ∈ (𝑎, 𝑏) si abbia

𝜕𝑓

𝑥(𝑥, 𝑡) ≤ 𝐺(𝑡).

𝜕𝑥

Allora per ogni 𝑥 ∈ 𝐼 si ha

𝑏 𝑏
𝑑 𝜕𝑓
∫ ∫
𝑓 (𝑥, 𝑡) 𝑑𝑡 = (𝑥, 𝑡) 𝑑𝑡.
𝑑𝑥 𝑎 𝑎 𝜕𝑥

Dimostrazione. Fissiamo 𝑥 0 ∈ 𝐼 e definiamo


( 𝑓 (𝑥,𝑡)− 𝑓 (𝑥
0 ,𝑡)
𝑥−𝑥 0 se 𝑥 ≠ 𝑥 0
𝑔(𝑥, 𝑡) = 𝜕𝑓
𝜕𝑥
(𝑥, 𝑡) se 𝑥 = 𝑥 0 .

Osserviamo allora che la derivata dell’integrale nel punto 𝑥 0 è:


∫𝑏 ∫𝑏
𝑑 𝑏 𝑓 (𝑥, 𝑡) 𝑑𝑡 − 𝑓 (𝑥0 , 𝑡) 𝑑𝑡
 ∫ 
𝑎 𝑎
𝑓 (𝑥, 𝑡) 𝑑𝑡 = lim
𝑑𝑥 𝑎 𝑥=𝑥0
𝑥→𝑥0 𝑥 − 𝑥0
∫ 𝑏
= lim 𝑔(𝑥, 𝑡) 𝑑𝑡
𝑥→𝑥0 𝑎
∫𝑏
mentre l’integrale della derivata è 𝑎 𝑔(𝑥 0 , 𝑡) 𝑑𝑡. Basterà quindi dimostrare che
è possibile applicare il teorema 7.53 alla funzione 𝑔(𝑥, 𝑡).

E’ facile verificare che 𝐺 domina 𝑔 in quanto per il teorema di Lagrange


sappiamo che per ogni 𝑥 e per ogni 𝑡 esiste 𝑥 0 con |𝑥 0 − 𝑥 0 | < |𝑥 − 𝑥 0 | tale che

𝜕𝑓 0

| 𝑔(𝑥, 𝑡)| = (𝑥 , 𝑡) ≤ 𝐺(𝑡).

𝜕𝑥

Ci rimane quindi solo da dimostrare che la funzione 𝑔 : 𝐼 ×(𝑎, 𝑏) → ℝ è continua.


Chiaramente se 𝑥 ≠ 𝑥 0 la funzione è continua, bisogna verificare che lo sia anche
nei punti (𝑥 0 , 𝑡0 ) per ogni 𝑡0 ∈ (𝑎, 𝑏). Visto che per ipotesi 𝜕 𝑓 /𝜕𝑥 è continua,
sappiamo che

𝜕𝑓 𝜕𝑓


∀𝜀 > 0 : ∃𝛿 > 0 : =⇒ (𝑥, 𝑡) − (𝑥0 , 𝑡0 ) < 𝜀.

(𝑥−𝑥 0 )2 +(𝑡−𝑡0 )2 <𝛿
𝜕𝑥 𝜕𝑥
7.4 passaggio al limite sotto il segno di integrale 319

Applicando, come prima, il teorema di Lagrange sappiamo che se (𝑥, 𝑡) dista


da (𝑥 0 , 𝑡0 ) per meno di 𝛿 si ha

𝜕𝑓 0 𝜕𝑓

| 𝑔(𝑥, 𝑡) − 𝑔(𝑥0 , 𝑡0 )| = (𝑥 , 𝑡) − (𝑥 0 , 𝑡0 ) < 𝜀.


𝜕𝑥 𝜕𝑥

Questo conclude la dimostrazione della continuità di 𝑔(𝑥, 𝑡).

Esercizio 7.55 (derivata della funzione Γ). Mostrare che la funzione Γ definita da
(si veda esempio 6.68) ∫ +∞
Γ(𝑥) = 𝑒 −𝑡 · 𝑡 𝑥−1 𝑑𝑡
0

è derivabile e la sua derivata vale


∫ ∞
0
Γ (𝑥) = 𝑒 −𝑡 · ln 𝑡 · 𝑡 𝑥−1 𝑑𝑡.
0

Svolgimento. Basta verificare che si può applicare il teorema 7.54 alla funzione

𝑓 (𝑥, 𝑡) = 𝑒 −𝑡 𝑡 𝑥−1

la cui derivata parziale rispetto a 𝑥 è

𝜕𝑓
(𝑥, 𝑡) = 𝑒 −𝑡 · ln 𝑡 · 𝑡 𝑥−1 .
𝜕𝑥
Chiaramente questa funzione è continua, dobbiamo solo trovare una funzione
che la domina. Fissato 𝑥 0 > 0 possiamo restringere il dominio della variabile 𝑥
all’intervallo 𝑥20 , 2 𝑥 0 e considerare la funzione
𝑥0
n o
𝑔(𝑡) = 𝑒 −𝑡 · | ln 𝑡 | · max 𝑡 2 −1
, 𝑡 2 𝑥 0 −1 .

Si tratta di una funzione continua (in quanto composizione di funzioni continue,


osservando che anche il massimo tra due funzioni continue è una funzione
continua). Inoltre per 𝑡 → 0+ si ha
𝑥0
−1
𝑔(𝑡) ∼ | ln 𝑡| · 𝑡 2  𝑡 −1+𝜀

pur di prendere 𝜀 < 𝑥20 . Dunque l’integrale 0 𝑔(𝑡) 𝑑𝑡 è convergente per il


∫1

criterio di confronto asintotico. Se invece 𝑡 → +∞ si ha


1
𝑔(𝑡) ∼ 𝑒 −𝑡 · ln 𝑡 · 𝑡 2𝑥0 −1 
𝑡2
in quanto l’esponenziale tende a zero molto più velocemente di quanto non
tendano ad infinito logaritmo e potenza. Dunque, per il criterio di confronto
∫ +∞
asintotico, anche l’integrale 1 𝑔(𝑡) 𝑑𝑡 è convergente.

Il metodo utilizzato nei prossimi esempi viene a volte chiamato trucco di Feynman: trucco di Feynman
si tratta di moltiplicare la funzione integranda per una funzione che dipende
da un parametro in modo che derivando rispetto al parametro la funzione
integranda si semplifichi.
320 7 spazi di funzioni

Esercizio 7.56 (integrale notevole). Mostriamo che


+∞
sin 𝑡 𝜋

𝑑𝑡 = .
0 𝑡 2

Dimostrazione. Consideriamo la funzione


+∞
sin 𝑡 −𝑡𝑥

𝐹(𝑥) = 𝑒 𝑑𝑡.
0 𝑡

Possiamo derivare la funzione utilizzando il teorema 7.54 in quanto la derivata


della funzione integranda

𝜕 sin 𝑡 −𝑡𝑥
 
𝑒 = − sin 𝑡 · 𝑒 −𝑡𝑥
𝜕𝑥 𝑡

è dominata dalla funzione 𝑒 −𝑡 che ha integrale convergente. Dunque si ha


∫ +∞
0
𝐹 (𝑥) = − sin 𝑡 · 𝑒 −𝑡𝑥 𝑑𝑡.
0

Questo integrale si può calcolare integrando due volte per parti (si veda
esercizio 6.63) e si trova 𝐹0(𝑥) = − 1+𝑥
1
2 da cui

+∞
𝜋

𝐹0(𝑥) 𝑑𝑥 = −[arctg 𝑥]+∞
0 =− .
0 2

D’altra parte per la formula fondamentale del calcolo sappiamo che il precedente
integrale non è altro che [𝐹(𝑥)]+∞0 ed è facile verificare che 𝐹(0) è proprio
l’integrale richiesto.

Basterà quindi calcolare lim𝑥→+∞ 𝐹(𝑥). Ma anche in questo caso è possibile


passare al limite dentro al segno di integrale in quanto la funzione integranda è
dominata da una funzione con integrale convergente:
(
sin 𝑡 −𝑡𝑥 se 𝑡 ≤ 1

1
𝑡 𝑒 ≤ 𝑒 −𝑡

𝑡 se 𝑡 > 1.

Allora 𝐹(𝑥) → 0 per 𝑥 → +∞ e si ottiene il risultato voluto.

Esercizio 7.57 (integrale della gaussiana). Dimostriamo che


∫ +∞ √
2
𝑒 −𝑠 𝑑𝑠 = 𝜋.
−∞

Svolgimento. Poniamo ∫ +∞
2
𝐼= 𝑒 −𝑠 𝑑𝑠.
−∞
e consideriamo la seguente funzione

+∞ 2 2
𝑒 −𝑥 (1+𝑡 )

𝐹(𝑥) = 𝑑𝑡.
0 1 + 𝑡2
7.5 scambio della derivata con il limite 321

Possiamo facilmente calcolare


+∞
𝜋

1
𝐹(0) = 𝑑𝑡 = [arctg 𝑡]+∞ = .
0 1+𝑡 2 0
2

Mentre se 𝑥 > 1 si ha

𝑒 −𝑥 𝑡
2 2) 2 2
𝑒 −𝑥 (1+𝑡 2 2 2
0≤ = 𝑒 −𝑥 · ≤ 𝑒 −𝑥 · 𝑒 −𝑡
1 + 𝑡2 1 + 𝑡2
e quindi per 𝑥 → +∞:
∫ 𝑥
2 2 2
0 ≤ 𝐹(𝑥) ≤ 𝑒 −𝑥 𝑒 −𝑡 𝑑𝑡 ≤ 𝑒 −𝑥 · 𝐼 → 0.
0

Calcoliamo ora la derivata di 𝐹 applicando il teorema 7.54. La funzione


integranda ha derivata

2 2)
!
𝜕 𝑒 −𝑥 (1+𝑡 2 (1+𝑡 2 )
= −2 𝑥𝑒 −𝑥 .
𝜕𝑥 1 + 𝑡 2

Se restringiamo la variabile 𝑥 ad un intervallo [𝑥 1 , 𝑥 2 ] abbiamo

1
2
2 2 2
−2𝑥𝑒 −𝑥 (1+𝑡 ) ≤ 2𝑥2 𝑒 −𝑥1 (1+𝑡 )  2

𝑡
e dunque la funzione dominante ha integrale finito sull’intervallo (0 , +∞).
Possiamo quindi scambiare la derivata con l’integrale per ottenere
∫ +∞ ∫ +∞
0 −𝑥 2 (1+𝑡 2 ) −𝑥 2 2 𝑡2
𝐹 (𝑥) = −2𝑥 𝑒 𝑑𝑡 = −2 𝑥𝑒 𝑒 −𝑥 𝑑𝑡.
0 0

Con il cambio di variabile 𝑠 = 𝑥𝑡 , 𝑑𝑠 = 𝑥𝑑𝑡 si ottiene


∫ +∞
0 −𝑥 2 2 2
𝐹 (𝑥) = −2 𝑒 𝑒 −𝑠 𝑑𝑠 = −𝑒 −𝑥 · 𝐼.
0

Ma allora da un lato abbiamo


+∞
𝜋

𝐹0(𝑥) 𝑑𝑥 = [𝐹0(𝑥)]+∞
0 =0− .
0 2

Dall’altro
+∞ +∞
𝐼2
∫ ∫
0 2
𝐹 (𝑥) 𝑑𝑥 = −𝐼 · 𝑒 −𝑥 𝑑𝑥 = − .
0 0 2
Concludiamo quindi che 𝐼 = 𝜋, come volevamo dimostrare.
2

7.5 scambio della derivata con il limite

Teorema 7.58 (scambio del limite con la derivata). Sia 𝐼 ⊆ ℝ un intervallo e


siano 𝑓 𝑘 ∈ 𝐶 1 (𝐼) funzioni tali che 𝑓 𝑘 (𝑥 0 ) converge per almeno un punto 𝑥 0 ∈ 𝐼 e la
successione delle derivate 𝑓 𝑘0 converge ad una funzione 𝑔 : 𝐼 → ℝ uniformemente su
322 7 spazi di funzioni

ogni intervallo chiuso e limitato [𝑎, 𝑏] ⊆ 𝐼 . Allora esiste 𝑓 ∈ 𝐶 1 (𝐼) tale che 𝑓 0 = 𝑔 e 𝑓 𝑘
converge a 𝑓 uniformemente su ogni intervallo chiuso e limitato [𝑎, 𝑏] ⊆ 𝐼 . In queste
ipotesi si può quindi scambiare la derivata con il limite:

𝑑 𝑑
   
lim 𝑓 𝑘 (𝑥) = 𝑓 0(𝑥) = lim 𝑓 𝑘 (𝑥) , ∀𝑥 ∈ 𝐼.
𝑘→+∞ 𝑑𝑥 𝑑𝑥 𝑘→+∞

Dimostrazione. Per ipotesi esiste 𝑦0 ∈ ℝ tale che 𝑓 𝑘 (𝑥 0 ) → 𝑦0 . Definiamo


∫ 𝑥
𝑓 (𝑥) = 𝑦0 + 𝑔(𝑡) 𝑑𝑡.
𝑥0

Per la continuità del limite uniforme sappiamo che 𝑔 è continua, dunque


possiamo applicare il teorema fondamentale del calcolo per dedurre che 𝑓 0 = 𝑔 .
Mostriamo ora che su ogni intervallo [𝑎, 𝑏] ⊆ 𝐼 si ha 𝑓 𝑘 ⇒ 𝑓 . Per la formula
fondamentale del calcolo integrale si ha:
∫ 𝑥
𝑓 𝑘0(𝑡)𝑑𝑡 = 𝑓 𝑘 (𝑥) − 𝑓 𝑘 (𝑥 0 )
𝑥0

dunque
𝑥 𝑥
∫ ∫
sup | 𝑓 𝑘 (𝑥) − 𝑓 (𝑥)| = sup 𝑓 𝑘 (𝑥 0 ) + 𝑓 𝑘0(𝑡)
− 𝑦0 − 𝑔(𝑡) 𝑑𝑡


𝑥∈[𝑎,𝑏] 𝑥∈[𝑎,𝑏] 𝑥0 𝑥0
∫ 𝑥
0
≤ | 𝑓 𝑘 (𝑥0 ) − 𝑦0 | + sup 𝑓 (𝑡) − 𝑔(𝑡) 𝑑𝑡

𝑘
𝑥∈[𝑎,𝑏] 𝑥0

≤ | 𝑓 𝑘 (𝑥0 ) − 𝑦0 | + (𝑏 − 𝑎) 𝑓 0 − 𝑔 → 0.

𝑘

Lo spazio 𝐶 1 ([𝑎, 𝑏]) è un sottospazio vettoriale di 𝐶 0 ([𝑎, 𝑏]) ma non è chiuso,


come si deduce dall’esempio 7.39 (si potrebbe anzi dimostrare che 𝐶 1 è denso
in 𝐶 0 ) dunque 𝐶 1 non è completo rispetto alla norma uniforme. Per trasformare
lo spazio 𝐶 1 ([𝑎, 𝑏]) in uno spazio di Banach possiamo definire una norma più
forte, come ad esempio questa:

k 𝑓 k 𝐶1 = k 𝑓 k∞ + k 𝑓 0 k∞ .

Teorema 7.59 (𝐶 1 spazio di Banach). Lo spazio vettoriale 𝐶 1 ([𝑎, 𝑏]) dotato della
norma k·k 𝐶 1 risulta essere uno spazio di Banach.

Dimostrazione. E’ facile verificare che k·k 𝐶 1 è una norma su 𝐶 1 ([𝑎, 𝑏]), dobbiamo
solo verificare che lo spazio risulta completo. Sia dunque 𝑓 𝑘 una successione
di Cauchy rispetto alla norma 𝐶 1 . Allora 𝑓 𝑘0 e 𝑓 𝑘 sono entrambe successioni
di Cauchy in 𝐶 0 in quanto k 𝑓 𝑘 k ∞ ≤ k 𝑓 𝑘 k 𝐶 1 e 𝑓 𝑘0 ∞ ≤ k 𝑓 𝑘 k 𝐶 1 . Dunque, per

la completezza di 𝐶 0 , sappiamo che esistono 𝑓 , 𝑔 ∈ 𝐶 0 ([𝑎, 𝑏]) tali che 𝑓 𝑘 ⇒ 𝑓


7.5 scambio della derivata con il limite 323

e 𝑓 𝑘0 ⇒ 𝑔 . In base al teorema di scambio del limite con la derivata possiamo


affermare che 𝑓 ∈ 𝐶 1 e 𝑓 0 = 𝑔 , dunque

k 𝑓 𝑘 − 𝑓 k 𝐶 1 = k 𝑓 𝑘 − 𝑓 k ∞ + 𝑓 𝑘0 − 𝑔 ∞ → 0.

Il teorema di scambio del limite con l’integrale ci dice che l’operatore integrale
𝑆 : 𝐶 0 → 𝐶 1 è continuo tra i due spazi di Banach. Anche l’operatore differenziale
𝐷 : 𝐶 1 → 𝐶 0 𝑓 ↦→ 𝐷 𝑓 = 𝑓 0 è ovviamente continuo.

serie di funzioni

Se 𝑓 𝑘 : 𝐴 → ℝ è una successione di funzioni definite su uno stesso insieme 𝐴,


possiamo considerare (come abbiamo già fatto per le successioni numeriche) la
successione delle somme parziali:
𝑛
X
𝑆𝑛 (𝑥) = 𝑓 𝑘 (𝑥), 𝑥 ∈ 𝐴.
𝑘=0

Tale successione si chiama serie corrispondente alla successione di funzioni 𝑓 𝑘


𝑓𝑛 . Per ogni 𝑥 in cui la serie è convergente si può
P
e si indica a volte come
somma
quindi definire la somma della serie
+∞
X
𝑆(𝑥) = 𝑓 𝑘 (𝑥) = lim 𝑆𝑛 (𝑥).
𝑛→+∞
𝑘=0

La somma 𝑆 è dunque il limite puntuale della successione delle somme parziali


𝑆𝑛 .

I teoremi che abbiamo dimostrato per le successioni di funzioni sono quindi


validi anche per le serie di funzioni. Basterà ricordare che la convergenza
convergenza uniforme di una serie
uniforme della serie è la convergenza uniforme delle somme parziali. Dunque
𝑓 𝑘 converge uniformemente a 𝑆 se 𝑆𝑛 ⇒ 𝑆 ovvero se
P


X +∞
k𝑆 − 𝑆𝑛 k ∞ = 𝑓𝑘 → 0 per 𝑛 → +∞.

𝑘=𝑛+1

integrala di una serie

Teorema 7.60 (integrale di una serie di funzioni). Sia 𝑓 𝑘 : [𝑎, 𝑏] → ℝ una


successione di funzioni continue definite sull’intervallo [𝑎, 𝑏] ⊆ ℝ. Se la serie 𝑓 𝑘
P
converge uniformemente allora si può scambiare l’integrale con la somma della serie:
!
∫ 𝑏 +∞
X +∞ ∫
X 𝑏 
𝑓 𝑘 (𝑡) 𝑑𝑡 = 𝑓 𝑘 (𝑡) 𝑑𝑡 ∀𝑥 ∈ 𝐼.
𝑎 𝑘=0 𝑘=0 𝑎

Dimostrazione. La dimostrazione è una semplice conseguenza del fatto che lo


scambio può essere fatto sulle somme finite e il passaggio al limite può essere
fatto grazie al teorema di scambio del limite con l’integrale.
324 7 spazi di funzioni

Sia 𝑆𝑛 = 𝑓𝑛 la successione delle somme parziali e sia 𝑆 il limite delle somme


P
parziali. Per ipotesi 𝑆𝑛 ⇒ 𝑆 . Applicando il teorema di scambio dell’integrale
con il limite si ha ∫ ∫ 𝑏 𝑏
lim 𝑆𝑛 (𝑡) 𝑑𝑡 = 𝑆(𝑡) 𝑑𝑡.
𝑛→+∞ 𝑎 𝑎
Ma da un lato, sfruttando l’additività dell’integrale sulle somme finite:
!
∫ 𝑏 ∫ 𝑏 𝑛
X
lim 𝑆𝑛 (𝑡) 𝑑𝑡 = lim 𝑓 𝑘 (𝑡) 𝑑𝑡
𝑛→+∞ 𝑎 𝑛→+∞ 𝑎 𝑘=0
𝑛 ∫
X 𝑏 
= lim 𝑓 𝑘 (𝑡) 𝑑𝑡
𝑛→+∞ 𝑎
𝑘=0
∞ ∫ 𝑏
X

= 𝑓 𝑘 (𝑡) 𝑑𝑡
𝑘=0 𝑎

e dall’altro lato: !
∫ 𝑏 ∫ 𝑏 +∞
X
𝑆(𝑡) 𝑑𝑡 = 𝑓 𝑘 (𝑡) 𝑑𝑡.
𝑎 𝑎 𝑘=0

derivazione di una serie


Teorema 7.61 (derivata di una serie di funzioni). Sia 𝑓 𝑘 : 𝐼 → ℝ una successione
di funzioni continue definite sull’intervallo 𝐼 . Se le funzioni 𝑓 𝑘 sono di classe 𝐶 1 e la
serie delle derivate 𝑓 𝑘0 converge uniformemente su ogni intervallo chiuso e limitato
P
[𝑎, 𝑏] ⊆ 𝐼 e se c’è almeno un punto 𝑥0 ∈ 𝐼 tale che la serie 𝑓 𝑘 (𝑥0 ) converge, allora
P

+∞ +∞
𝑑 X X 𝑑
𝑓 𝑘 (𝑥) = 𝑓 𝑘 (𝑥) ∀𝑥 ∈ 𝐼.
𝑑𝑥 𝑘=0 𝑘=0
𝑑𝑥

Dimostrazione. Sia 𝑆𝑛 la successione delle somme parziali. Per ipotesi sappiamo


che esiste una funzione 𝑇 : 𝐼 → ℝ tale che 𝑆0𝑛 ⇒ 𝑇 in ogni intervallo [𝑎, 𝑏] ⊆ 𝐼 .
Sappiamo inoltre che 𝑆𝑛 (𝑥 0 ) converge. Dunque possiamo applicare il teorema
di scambio del limite con la derivata per ottenere che esiste 𝑆 ∈ 𝐶 1 (𝐼) tale che
𝑆𝑛 (𝑥) → 𝑆(𝑥) per ogni 𝑥 ∈ 𝐼 e

𝑆0(𝑥) = 𝑇(𝑥) ∀𝑥 ∈ 𝐼.

Ma da un lato
𝑑
𝑆0(𝑥) = lim 𝑆𝑛 (𝑥)
𝑑𝑥 𝑛→+∞
+∞
𝑑 X
= 𝑓 𝑘 (𝑥)
𝑑𝑥 𝑘=0

e dall’altro lato
𝑛
𝑑 X
𝑇(𝑥) = lim 𝑆0𝑛 (𝑥) = lim 𝑓 𝑘 (𝑥)
𝑛→+∞ 𝑛→+∞ 𝑑𝑥 𝑘=0
𝑛
X +∞
X
= lim 𝑓 𝑘0(𝑥) = 𝑓 𝑘0(𝑥).
𝑛→+∞
𝑘=0 𝑘=0
7.5 scambio della derivata con il limite 325

La convergenza uniforme di una serie non è molto semplice da verificare. Più


semplice è la seguente condizione, che vedremo essere più forte.

Definizione 7.62 (convergenza totale di una serie di funzioni). Siano 𝑓 𝑘 : 𝐴 → ℝ


funzioni definite su un insieme 𝐴 ⊆ ℝ. Diremo che la serie di funzioni 𝑓 𝑘 converge
P
totalmente se la serie numerica k 𝑓 𝑘 k ∞ è convergente.
P
convergenza totale

𝑓𝑛 converge totalmente allora


P
Teorema 7.63 (convergenza totale). Se la serie
converge uniformemente.

Dimostrazione. A 𝑥 fissato la serie 𝑓𝑛 (𝑥) converge assolutamente in quanto


P


X ∞
X
| 𝑓𝑛 (𝑥)| ≤ k 𝑓𝑛 k ∞ < +∞.
𝑘=0 𝑘=0

Dunque la serie converge e posto


𝑛
X +∞
X
𝑆𝑛 (𝑥) = 𝑓 𝑘 (𝑥), 𝑆(𝑥) = 𝑓 𝑘 (𝑥)
𝑘=0 𝑘=0

si ha che 𝑆𝑛 → 𝑆 puntualmente. Per mostrare che 𝑆𝑛 ⇒ 𝑆 basta osservare che


per 𝑛 → +∞ si ha:

X +∞ +∞
X +∞
X
|𝑆(𝑥) − 𝑆𝑛 (𝑥)| = 𝑓 𝑘 (𝑥) ≤ | 𝑓 𝑘 (𝑥)| ≤ k 𝑓 𝑘 k ∞ → 0.

𝑘=𝑛+1 𝑘=𝑛+1 𝑘=𝑛+1

Teorema 7.64 (convergenza totale delle serie di potenze). Sia 𝑎 𝑛 𝑧 𝑛 una serie
P
di potenze e sia 𝑅 ∈ [0 , +∞] il suo raggio di convergenza. Allora la serie converge
totalmente su ogni disco 𝐷𝑟 con 𝑟 < 𝑅 .

Dimostrazione. Ora osserviamo che sul disco di raggio 𝑟 si ha 𝑎 𝑘 𝑧 𝑘 ∞ = |𝑎 𝑘 |𝑟 𝑘


e dunque
+∞ +∞
|𝑎 𝑘 |𝑟 𝑘 < +∞
X X
k𝑎 𝑘 𝑧 𝑘 k ∞ =
𝑘=0 𝑘=0

𝑎𝑘 𝑧𝑘 converge assolutamente per 𝑧 = 𝑟 essendo 𝑟 < 𝑅 .


P
in quanto la serie

Corollario 7.65. La serie di potenze


+∞
𝑎𝑘 𝑥 𝑘
X
𝑓 (𝑥) =
𝑘=0

ha lo stesso raggio di convergenza 𝑅 della serie delle derivate


+∞
𝑘𝑎 𝑘 𝑥 𝑘−1
X
𝑔(𝑥) =
𝑘=1
326 7 spazi di funzioni

e per 𝑥 ∈ (−𝑅, 𝑅) si ha
𝑓 0(𝑥) = 𝑔(𝑥).

Dimostrazione. Che le due serie abbiano lo stesso raggio di convergenza l’ab-


biamo già dimostrato nel Teorema 3.42. Nel teorema precedente abbiamo
mostrato che su ogni intervallo [−𝑟, 𝑟] con 𝑟 < 𝑅 la serie di potenze con somma
𝑓 converge totalmente. Dunque converge uniformemente e possiamo scambiare
la derivata con la somma per ottenere 𝑓 0(𝑥) = 𝑔(𝑥).

Esempio 7.66. Sappiamo che la serie di potenze


+∞ 𝑘
X 𝑥
𝑓 (𝑥) =
𝑘=1
𝑘

ha raggio di convergenza 𝑅 = 1 (si usi ad esempio il criterio del rapporto). La serie delle
derivate è
+∞ +∞
1
𝑥 𝑘−1 = 𝑥𝑘 =
X X
𝑔(𝑥) = .
𝑘=1 𝑘=0
1−𝑥

Dunque per |𝑥| < 1 si ha


1
𝑓 0(𝑥) = 𝑔(𝑥) =
1−𝑥
da cui
∫ 𝑥 ∫ 𝑥
1
𝑓 (𝑥) = 𝑓 (0) + 0
𝑓 (𝑡) 𝑑𝑡 = 𝑑𝑡 = [− ln(1 − 𝑡)]0𝑥 = − ln(1 − 𝑥).
0 0 1−𝑡

Abbiamo quindi scoperto che vale


+∞ 𝑘
X 𝑥
= − ln(1 − 𝑥) per ogni 𝑥 ∈ (−1 , 1).
𝑘=1
𝑘

Osserviamo ora che la serie con somma 𝑓 (𝑥) non converge per 𝑥 = 1 (serie armonica) ma
converge per 𝑥 = −1 (criterio di Leibniz). Per il Teorema 3.44 (lemma di Abel) sappiamo
che la funzione 𝑓 (𝑥) è continua nel punto 𝑥 = −1 e dunque possiamo concludere che
+∞ 𝑘
X 𝑥
= − ln(1 − 𝑥) ∀𝑥 ∈ [−1 , 1).
𝑘=1
𝑘

In particolare abbiamo trovato la somma della serie armonica a serie alterni:


+∞
X (−1) 𝑘+1
= − 𝑓 (𝑥) = ln 2.
𝑘=1
𝑘

Osserviamo che queste informazioni sono coerenti con lo sviluppo di Taylor di ln(1 + 𝑥)
che avevamo già determinato. Ma non sono conseguenza di esso, in quanto lo sviluppo
di Taylor ci dà informazioni solamente per 𝑥 → 0 mentre ora abbiamo ottenuto
informazioni per ogni 𝑥 in [−1 , 1).
7.6 convergenza integrale 327

Esempio 7.67. Applichiamo l’idea precedente alla funzione arctg. Si ha

1 +∞
X 2 𝑘
+∞
X 𝑘 2𝑘
+∞
X (−1) 𝑘 2 𝑘+1 0
arctg0(𝑥) = = (−𝑥 ) = (−1) 𝑥 = (𝑥 ).
1 + 𝑥2 𝑘=0 𝑘=0 𝑘=0
2𝑘 + 1

La serie
+∞
(−1) 𝑘
𝑥 2 𝑘+1
X
𝑓 (𝑥) =
𝑘=0
2𝑘 + 1

ha raggio di convergenza 𝑅 = 1 e dunque per ogni 𝑥 ∈ (−1 , 1) sappiamo che la serie


delle derivate converge alla derivata della serie da cui

𝑓 0(𝑥) = arctg0 𝑥.

Visto che 𝑓 (0) = 0 = arctg 0 possiamo concludere che 𝑓 (𝑥) = arctg 𝑥 per ogni
𝑥 ∈ (−1 , 1). La serie è convergente anche per 𝑥 = 1, per il criterio di Leibniz. Per
continuità (Lemma di Abel) si ottiene che 𝑓 (1) = arctg 1. Dunque
+∞
(−1) 𝑘
𝑥 2 𝑘+1
X
arctg 𝑥 = ∀𝑥 ∈ (−1 , 1].
𝑘=0
2𝑘 + 1

In particolare per 𝑥 = 1 si ottiene la formula di Gregory-Leibniz Gregory-Leibniz

𝜋 X +∞
(−1) 𝑘 1 1 1
= = 1− + − +...
4 𝑘=0
2𝑘 + 1 3 5 7

7.6 convergenza integrale

Motivati da come viene definita la norma di un vettore in ℝ𝑛 risulta naturale


dare la seguente definizione di norma euclidea per una funzione 𝑓 : (𝑎, 𝑏) → ℝ:
s
∫ 𝑏
k 𝑓 k2 = | 𝑓 (𝑥)| 2 𝑑𝑥.
𝑎

Questa definizione ha senso, come integrale improprio, se la funzione 𝑓 è


localmente Riemann-integrabile sull’intervallo (𝑎, 𝑏) (definizione 6.49). In tal
caso l’integrale esiste, ma potrebbe assumere il valore +∞. Definiamo allora

H(𝑎, 𝑏) = 𝑓 localmente R.-integrabile su (𝑎, 𝑏) : k 𝑓 k 2 < +∞ .




Cercheremo ora di dimostrare che la norma che abbiamo introdotto è effettiva-


mente un norma (nel senso della definizione 7.4) che rende H(𝑎, 𝑏) uno spazio
vettoriale euclideo di dimensione infinita.

Innanzitutto è chiaro che qualunque sia 𝑓 si ha k 𝑓 k 2 ≥ 0. Inoltre è banale


osservare che la norma è omogenea: se 𝑡 ∈ ℝ si ha:

k𝑡 · 𝑓 k 2 = |𝑡 | · k 𝑓 k 2 .
328 7 spazi di funzioni

Dunque se 𝑓 ∈ H(𝑎, 𝑏) anche 𝑡 𝑓 ∈ H(𝑎, 𝑏) per ogni 𝑡 ∈ ℝ. Se 𝑓 , 𝑔 ∈ H(𝑎, 𝑏)


per la proprietà del parallelogramma (7.4) valida in ℝ si ha

( 𝑓 (𝑥) + 𝑔(𝑥))2 ≤ 2 𝑓 2 (𝑥) + 2 𝑔 2 (𝑥)

e dunque se 𝑓 , 𝑔 ∈ H(𝑎, 𝑏) anche 𝑓 + 𝑔 ∈ H(𝑎, 𝑏). Dunque H(𝑎, 𝑏) è uno spazio


vettoriale.

Per 𝑓 , 𝑔 ∈ H(𝑎, 𝑏) possiamo ora definire il prodotto scalare:


∫ 𝑏
h 𝑓 , 𝑔i = 𝑓 (𝑥) · 𝑔(𝑥) 𝑑𝑥. (7.6)
𝑎

La disuguaglianza di Young (7.2) valida in ℝ ci dice che

𝑓 2 (𝑥) + 𝑔 2 (𝑥)
| 𝑓 (𝑥) · 𝑔(𝑥)| ≤
2
e dunque garantisce che l’integrale (7.6) sia assolutamente convergente. Dunque
se 𝑓 , 𝑔 ∈ H(𝑎, 𝑏) il prodotto scalare h 𝑓 , 𝑔i è ben definito ed è un numero finito.
A questo punto è facile verificare che h 𝑓 , 𝑔i è una forma bilineare simmetrica non
negativa. Dunque soddisfa tutte le proprietà formali date nella definizione 7.5
di prodotto scalare salvo il fatto che non è garantito che h 𝑓 , 𝑓 i = 0 implichi
𝑓 = 0. In effetti questa proprietà è falsa perché se la funzione 𝑓 2 (𝑥) ha integrale
nullo non è detto che sia identicamente nulla: l’integrale, infatti, non cambia se
la funzione viene modificata in un singolo punto.

Per ovviare a questo problema bisogna che identifichiamo due funzioni 𝑓 , 𝑔 ∈


H(𝑎, 𝑏) se k 𝑓 − 𝑔k 2 = 0:

𝑓 ∼ 𝑔 ⇐⇒ k 𝑓 − 𝑔k 2 = 0.

Chiamiamo 𝐻(𝑎, 𝑏) il quoziente:

𝐻(𝑎, 𝑏) = H(𝑎, 𝑏)/∼

cioè lo spazio vettoriale delle funzioni in H(𝑎, 𝑏) dove due funzioni vengono
identificate se la norma della differenza è nulla.

Lo spazio quoziente 𝐻(𝑎, 𝑏) risulta finalmente essere uno spazio euclideo.


Mantiene infatti la struttura vettoriale (in quanto l’insieme delle 𝑓 ∈ H(𝑎, 𝑏) con
k 𝑓 k 2 = 0 è uno spazio vettoriale) e il prodotto scalare h 𝑓 , 𝑔i (e di conseguenza
la norma k 𝑓 k 2 ) è ben definito su 𝐻(𝑎, 𝑏) e oltre alle proprietà che già abbiamo
dimostrato possiamo ora affermare che h 𝑓 , 𝑓 i = k 𝑓 k 2 = 0 se e solo se 𝑓 = 0.

Osservazione 7.68. La notazione 𝐻(𝑎, 𝑏) che scegliamo di utilizzare per definire


questo spazio non è standard. La lettera 𝐻 rimanda ad Hilbert in quanto lo studio di
questo spazio in particolare ha spinto verso l’astrazione del concetto di spazio di Hilbert.
Quello che vedremo nel seguito è che questo spazio non risulta essere completo e dunque
in realtà non è uno spazio di Hilbert. In effetti l’utilizzo degli integrali impropri è un
tentativo, di estendere l’integrale di Riemann in modo da rendere completo questo spazio.
Solo con la definizione di integrale di Lebesgue (1875–1941) si è riusciti ad estendere
l’integrale di Riemann ad una classe più amplia di funzioni fino a completare lo spazio.
7.6 convergenza integrale 329

L’analogo dello spazio 𝐻(𝑎, 𝑏) definito tramite integrale di Lebesgue viene usualmente
chiamato 𝐿2 . L’esponente 2 è dovuto al fatto che sarebbe possibile definire gli spazi 𝐿 𝑝 in
maniera analoga a quanto fatto nell’esempio 7.9. Si avrebbe ancora che solo per 𝑝 = 2
questi spazi normati sono euclidei, cioè solo per 𝑝 = 2 la norma è indotta da un prodotto
scalare. Tutti gli spazi 𝐿 𝑝 sono completi e dunque sono spazi di Banach. Ma 𝐿2 è anche
uno spazio di Hilbert, in quanto è dotato di prodotto scalare. Anzi potremmo dire che
𝐿2 è lo spazio di Hilbert per antonomasia e viene denotato anche con il nome 𝐻 0 (in
questo caso l’esponente denota la derivabilità delle funzioni, come in 𝐶 0 ).

Gli elementi di 𝐻(𝑎, 𝑏) non sono funzioni, ma classi di equivalenza di funzioni.


Nel seguito, però, tratteremo 𝑓 ∈ 𝐻(𝑎, 𝑏) come se fosse 𝑓 ∈ H(𝑎, 𝑏) facendo
attenzione che le nostre affermazioni rimangano valide se al posto di una
funzione 𝑓 si prende una funzione a lei equivalente. In particolare avrà senso
considerare gli integrali di queste funzioni, perché il valore dell’integrale non
dipende dal rappresentante scelto, ma non avrà senso considerare il valore
che le funzioni assumono in un singolo punto, perché questo dipende dal
rappresentante.

serie di Fourier

Lo spazio 𝐻(𝑎, 𝑏) è uno spazio vettoriale reale su cui siamo riusciti a definire un
prodotto scalare e quindi una norma. Vorremmo trovare su 𝐻(𝑎, 𝑏) una base
ortonormale rispetto alla quale sia possibile scrivere le coordinate dei vettori
(cioè delle funzioni) di 𝐻(𝑎, 𝑏). Visto che 𝐻(𝑎, 𝑏) non ha dimensione finita
non potremo sperare di trovare una base con un numero finito di elementi.
Introduciamo quindi la seguente.

Definizione 7.69 (base hilbertiana). Sia 𝑉 uno spazio euclideo. Siano 𝑒 𝑘 ∈ 𝐻(𝑎, 𝑏) sistema ortonormale
con 𝑘 ∈ ℕ . Diremo che 𝑒 𝑘 è un sistema ortonormale se h𝑒 𝑘 , 𝑒 𝑗 i = 0 quando 𝑘 ≠ 𝑗 e
base hilbertiana
h𝑒 𝑘 , 𝑒 𝑘 i = 1 per ogni 𝑘 ∈ ℕ . Diremo che 𝑒 𝑘 è una base hilbertiana se è un sistema
ortonormale e inoltre per ogni 𝑣 ∈ 𝑉 esistono 𝑐 𝑘 ∈ ℝ con 𝑘 ∈ ℕ per cui si abbia
+∞
X
𝑣= 𝑐𝑘 𝑒𝑘 . (7.7)
𝑘=0

Teorema 7.70 (disuguaglianza di Bessel). Sia 𝑒0 , 𝑒1 , 𝑒2 , . . . un sistema ortonormale


in uno spazio euclideo 𝑉 . Per ogni 𝑣 ∈ 𝑉 e per ogni 𝑘 ∈ ℕ si ponga 𝑐 𝑘 = h𝑣, 𝑒 𝑘 i . disuguaglianza di Bessel

Allora vale la disuguaglianza di Bessel:


+∞
𝑐 2𝑘 ≤ |𝑣| 2 .
X
(7.8)
𝑘=0

Vale inoltre l’uguaglianza


+∞
𝑐 2𝑘 = |𝑣| 2
X
(7.9)
𝑘=0

se e solo se vale la (7.7).


330 7 spazi di funzioni

Possiamo quindi affermare che il sistema ortonormale 𝑒0 , 𝑒1 , 𝑒2 , . . . è una base hilbertiana


se e solo se per ogni 𝑣 ∈ 𝑉 vale l’uguaglianza (7.9).

Dimostrazione. Dato 𝑣 ∈ 𝑉 poniamo 𝑐 𝑘 = h𝑣, 𝑒 𝑘 i e

𝑁
X
𝑣𝑁 = 𝑐𝑘 𝑒𝑘 , 𝑤𝑁 = 𝑣 − 𝑣𝑁 .
𝑘=0

Osserviamo che per ogni 𝑛 ∈ ℕ si ha h𝑣 𝑁 , 𝑤 𝑁 i = 0 (𝑤 𝑁 è ortogonale a 𝑣 𝑁 ) in


quanto se 𝑛 ≤ 𝑁 :

𝑁
X
h𝑤 𝑁 , 𝑒 𝑛 i = h𝑣, 𝑒 𝑛 i − 𝑐 𝑘 h𝑒 𝑘 , 𝑒 𝑛 i = h𝑣, 𝑒 𝑛 i − 𝑐 𝑛 = 0
𝑘=0

e quindi
𝑁
X
h𝑤 𝑁 , 𝑣 𝑁 i = 𝑐 𝑘 h𝑤 𝑁 , 𝑒 𝑘 i = 0.
𝑘=0

dunque possiamo concludere, grazie al teorema di Pitagora (7.1)

|𝑣| 2 = |𝑣 𝑁 + 𝑤 𝑁 | 2 = |𝑣 𝑁 | 2 + |𝑤 𝑁 | 2
2
X 𝑁 𝑁
2
X
≥ |𝑣 𝑁 | = 𝑐𝑘 𝑒𝑘 = 𝑐 2𝑘 .

𝑘=0 𝑘=0

Passando al limite per 𝑁 → +∞ si ottiene la disuguaglianza di Bessel.

Abbiamo visto che |𝑤 𝑁 | 2 = |𝑣| 2 − |𝑣 𝑁 | 2 dunque la condizione |𝑤 𝑁 | 2 → 0 è


equivalente all’uguaglianza di Bessel: |𝑣 𝑁 | 2 → |𝑣| 2 . Il sistema è hilbertiano,
per definizione, se e solo se 𝑣 𝑁 → 𝑣 ovvero se 𝑤 𝑁 → 0.

Il nostro obiettivo è ora quello di produrre una base hilbertiana di 𝐻(0 , 2𝜋).
Una base di 𝐻(𝑎, 𝑏) si potrà ottenere di conseguenza traslando e riscalando
Dal punto di vista algebrico sarebbe mol-
opportunamente le funzioni della base di 𝐻(0 , 2𝜋). Consideriamo le seguenti
to più semplice considerare le funzioni
a valori complessi: funzioni trigonometriche:

𝑒 𝑖 𝑘𝑥 1
𝑒 𝑘 (𝑥) = √ 𝑒0 (𝑥) = √
2𝜋
2𝜋
al variare di 𝑘 ∈ ℤ. Preferiamo però sin(𝑘𝑥)
rimanere nell’ambito delle funzioni rea- 𝑒2 𝑘+1 (𝑥) = √ 𝑘 = 0, 1, . . . (7.10)
li per non dover introdurre la strut- 𝜋
tura hermitiana degli spazi vettoriali cos(𝑘𝑥)
complessi. 𝑒2 𝑘 (𝑥) = √ 𝑘 = 1, 2, . . .
𝜋

Ovviamente s∫
2𝜋  
1
k𝑒0 k 2 = √ 𝑑𝑥 = 1
0 2𝜋
ma è anche facile verificare che
∫ 2𝜋 ∫ 2 𝑘𝜋 ∫ 2𝜋
1
cos2 (𝑘𝑥) 𝑑𝑥 = cos2 𝑦 𝑑𝑦 = cos2 𝑦 𝑑𝑦 = 𝜋
0 𝑘 0 0
7.6 convergenza integrale 331

da cui si ottiene k𝑒2 𝑘 k 2 = 1. Visto che la funzione sin è la traslata di cos si


ottiene analogamente che k𝑒2 𝑘+1 k 2 = 1. Dunque i vettori 𝑒0 , 𝑒1 , . . . sono tutti di
modulo unitario. Utilizzando la formula di Eulero si può trovare la formula di
Werner:

𝑒 𝑖𝑛𝑥 − 𝑒 −𝑖𝑛𝑥 𝑒 𝑖𝑚𝑥 − 𝑒 −𝑖𝑚𝑛


sin(𝑚𝑥) cos(𝑛𝑥) = ·
2 2𝑖
𝑒 𝑖(𝑚+𝑛)𝑥 𝑒 −𝑖(𝑚+𝑛)𝑥 𝑒 𝑖(𝑚−𝑛)𝑥 𝑒 −𝑖(𝑚−𝑛)𝑥
= + + −
4𝑖 4𝑖 4𝑖 4𝑖
sin ((𝑚 + 𝑛)𝑥) sin ((𝑚 − 𝑛)𝑥)
= +
2 2
da cui se 𝑚 ≠ 𝑛 :
∫ 2𝜋
1
sin(𝑚𝑥) cos(𝑛𝑥) 𝑑𝑥 = − [cos ((𝑚 + 𝑛)𝑥)]20𝜋
0 2(𝑚 + 𝑛)
1
− [cos ((𝑚 − 𝑛)𝑥)]20𝜋 = 0
2(𝑚 − 𝑛)

e se 𝑚 = 𝑛 si arriva comunque allo stesso risultato. Questo significa che


h𝑒2𝑛 , 𝑒2𝑚+1 i = 1. Discorso analogo si può fare per le funzioni sin(𝑚𝑥) sin(𝑛𝑥) e
cos(𝑚𝑥) cos(𝑛𝑥) trovando, anche in quei casi, che tali prodotti hanno integrale
nullo nell’intervallo [0 , 2𝜋]. Per nostra memoria le formule di Werner che si
trovano in questi ultimi casi sono:

cos((𝑚 + 𝑛)𝑥) cos((𝑚 − 𝑛)𝑥)


cos(𝑚𝑥) cos(𝑛𝑥) = +
2 2
cos((𝑚 − 𝑛)𝑥) cos((𝑚 + 𝑛)𝑥)
sin(𝑚𝑥) sin(𝑛𝑥) = − .
2 2

Risulta dunque che le funzioni 𝑒0 , 𝑒1 , 𝑒2 , . . . definite da (7.10) formano un


sistema ortonormale in 𝐻(0 , 2𝜋) in quanto si ha:
(
1 se 𝑚 = 𝑛
h𝑒 𝑛 , 𝑒 𝑚 i =
0 altrimenti.

Di conseguenza le funzioni 𝑒0 , 𝑒1 , 𝑒2 , . . . sono tra loro indipendenti in 𝐻(0 , 2𝜋)


in quanto se una loro combinazione lineare è nulla:
𝑛
X
𝜆𝑘 𝑒𝑘 = 0
𝑘=0

allora, facendone il prodotto scalare con 𝑒 𝑗 si ottiene:

𝑛
X 𝑛
X
0=h 𝜆𝑘 𝑒𝑘 , 𝑒 𝑗 i = 𝜆 𝑘 h𝑒 𝑘 , 𝑒 𝑗 i = 𝜆 𝑗
𝑘=0 𝑘=0

e dunque tutti i coefficienti 𝜆 𝑗 sono nulli. Possiamo in particolare dedurre che


𝐻(0 , 2𝜋) ha dimensione infinita.

Definizione 7.71 (polinomi trigonometrici). Una funzione 𝑓 si dice essere un


polinomio trigonometrico se esiste un polinomio in due variabili 𝑃(𝑋 , 𝑌) tale che
polinomio trigonometrico
332 7 spazi di funzioni

𝑓 (𝑥) = 𝑃(cos 𝑥, sin 𝑥).

Possiamo verificare che 𝑓 è un polinomio trigonometrico se e solo se è possibile


scrivere 𝑓 come combinazione lineare finita delle funzioni 𝑒 𝑘 appena introdotte,
cioè se esistono 𝑐 0 , 𝑐 1 , . . . , 𝑐 𝑛 ∈ ℝ tali che
X
𝑓 = 𝑐𝑘 𝑒𝑘 .
𝑘=0

Basta infatti ricondurre le funzioni trigonometriche all’esponenziale complesso,


tramite la formula di Eulero:

cos(𝑛𝑥) + 𝑖 sin(𝑛𝑥) = 𝑒 𝑖𝑛𝑥 = (𝑒 𝑖𝑛 ) 𝑘 = (cos 𝑥 + 𝑖 sin 𝑥)𝑛


𝑛  
𝑛
𝑖 𝑘 (sin 𝑥) 𝑘 (cos 𝑥)𝑛−𝑘
X
=
𝑘=0
𝑘

da cui, prendendo parte reale, e parte immaginaria si riesce ad esprimere


cos(𝑛𝑥) e sin(𝑛𝑥) come polinomio in sin 𝑥 e cos 𝑥 . Più precisamente per il
coseno si ottengono solo i termini con 𝑘 pari:
𝑛
bX
2c
𝑛
 
cos(𝑛𝑥) = (−1) 𝑘 (sin 𝑥)2 𝑘 (cos 𝑥)𝑛−2 𝑘
𝑘=0
2𝑘
𝑛
bX
2c
𝑛
 
𝑘
= cos2 𝑥 − 1 (cos 𝑥)𝑛−2 𝑘
𝑘=0
2𝑘

ovvero
cos(𝑛𝑥) = 𝑇𝑛 (cos 𝑥)
dove
𝑛
bX
2c
𝑛
 
𝑘
𝑇𝑛 (𝑥) = 𝑥 2 − 1 𝑥 𝑛−2 𝑘
𝑘=0
2𝑘

si chiama polinomio di Chebyshev di prima specie. Questo significa che ognuna delle
funzioni 𝑒 𝑘 che abbiamo introdotto in (7.10) è un polinomio trigonometrico
e quindi ogni combinazione finita di tali funzioni è ancora un polinomio
trigonometrico.

Viceversa per verificare che ogni polinomio trigonometrico può essere rappre-
sentato come combinazione lineare finita degli elementi 𝑒 𝑘 possiamo osservare
che se 𝑓 (𝑥) = 𝑃(cos 𝑥, sin 𝑥) è un polinomio trigonometrico allora usando le
formule di Eulero si può scrivere 𝑓 (𝑥) = 𝑄(𝑒 𝑖𝑥 , 𝑒 −𝑖𝑥 ) dove 𝑄 è un polinomio a
coefficienti complessi. Ma osservando che
 𝑛
𝑒 𝑖𝑥 = 𝑒 𝑖𝑛𝑥

si ottiene che 𝑓 (𝑥) può essere scritta come combinazione lineare complessa delle
funzioni 𝑒 𝑖 𝑘𝑥 e 𝑒 −𝑖𝑘𝑥 . Utilizzando nuovamente le fomule di Eulero si deduce
che 𝑓 (𝑥) può essere scritta come combinazione lineare complessa delle funzioni
7.6 convergenza integrale 333

cos(𝑖 𝑘𝑥) e sin(𝑖 𝑘𝑥):


𝑛
X
𝑓 (𝑥) = (𝑧 𝑘 cos(𝑖 𝑘𝑥) + 𝑤 𝑘 sin(𝑖 𝑘𝑥)).
𝑘=0

Ma visto che sappiamo che 𝑓 (𝑥) è una funzione reale, la somma delle parti
immaginarie di questa combinazione lineare è nulla e dunque abbiamo ottenuto
che 𝑓 (𝑥) è combinazione lineare a coefficienti reali delle funzioni 𝑒 𝑛 .

Definizione 7.72 (serie di Fourier). Se 𝑓 ∈ H(0 , 2𝜋) i coefficienti 𝑐 𝑘 = h 𝑓 , 𝑒 𝑘 i si


coefficienti di Fourier
chiamano coefficienti di Fourier di 𝑓 e la serie
+∞
X
𝑐𝑘 𝑒𝑘
𝑘=0
serie di Fourier
si chiama serie di Fourier di 𝑓 . Il polinomio trigonometrico

𝑁
X
𝑓𝑁 = 𝑐𝑘 𝑒𝑘
𝑘=0
sviluppo di Fourier
si chiama sviluppo di Fourier di ordine 𝑁 per 𝑓 .

Esempio 7.73. Calcoliamo lo sviluppo di Fourier della funzione:


(
1 se 𝑥 ∈ [0 , 𝜋]
𝑓 (𝑥) =
−1 se 𝑥 ∈ [𝜋, 2𝜋].

Per quanto riguarda 𝑐 0 = h 𝑓 , 𝑒0 i si ha banalmente:


∫ 2𝜋 ∫ 𝜋 ∫ 𝜋 
1 1
𝑐0 = 𝑓 (𝑥) · √ 𝑑𝑥 = √ 1 𝑑𝑥 + (−1) 𝑑𝑥 = 0.
0 2𝜋 2𝜋 0 0

Per 𝑐 2 𝑘 = h 𝑓 , 𝑒2 𝑘 i si ha
∫ 2𝜋
cos(𝑘𝑥)
𝑐2𝑘 = 𝑓 (𝑥) √ 𝑑𝑥
0 𝜋
∫ 𝜋 ∫ 2𝜋 
1
=√ cos(𝑘𝑥) 𝑑𝑥 − cos(𝑘𝑥) 𝑑𝑥 = 0
𝜋 0 𝜋

per motivi di simmetria. Per calcolare 𝑐 2 𝑘+1 = h 𝑓 , 𝑒2 𝑘+1 i si trova


∫ 𝜋 ∫ 2𝜋
sin(𝑘𝑥) sin(𝑘𝑥)
𝑐 2 𝑘+1 = √ 𝑑𝑥 − √ 𝑑𝑥
0 𝜋 𝜋 𝜋
∫ 𝜋 ∫ 𝑘𝜋
2 2
=√ sin(𝑘𝑥) 𝑑𝑥 = √ sin 𝑡 𝑑𝑡
𝜋 0 𝑘 𝜋 0
(
0 se 𝑘 pari,
=
𝑘 𝜋
4
√ se 𝑘 dispari.
334 7 spazi di funzioni

Figura 7.3: Lo sviluppo di Fourier del-


la funzione che vale 1 su [0 , 𝜋] e −1
4 sin(𝑥) 4 sin(3 𝑥)
su [𝜋, 2𝜋]: 𝑓61 (𝑥) = 𝜋 + 3𝜋 +
4 sin(5 𝑥) 4 sin(7 𝑥) 4 sin(9 𝑥) 4 sin(11 𝑥)
5𝜋 + 7𝜋 + 9𝜋 + 11𝜋 +
4 sin(13 𝑥) 4 sin(15 𝑥) 4 sin(17 𝑥) 4 sin(19 𝑥)
13𝜋 + 15𝜋 + 17𝜋 + 19𝜋 +
4 sin(21 𝑥) 4 sin(23 𝑥) 4 sin(25 𝑥) 4 sin(27 𝑥)
21𝜋 + 23𝜋 + 25𝜋 + 27𝜋 +
4 sin(29 𝑥) 4 sin(31 𝑥)
29𝜋 + 31𝜋 . Il codice per calco-
lare i coefficienti e generare il grafico si
trova a pagina 429.

Si trova quindi che


𝑛
X 4
𝑓2𝑛+1 (𝑥) = √ sin((2 𝑘 + 1)𝑥).
𝑘=0 (2 𝑘 + 1) 𝜋

Si veda la figura 7.3.

Risulta naturale chiedersi se quella che abbiamo introdotto è una base hilbertiana
perché solo in tal caso gli sviluppi di Fourier approssimano la funzione. Per
ottenere questo risultato dobbiamo assumere la validità del seguente teorema,
che sarebbe ora troppo lungo dimostrare.

Teorema 7.74 (densità dei polinomi trigonometrici). Per ogni funzione continua
𝑓 ∈ 𝐶 0 ([𝑎, 𝑏]) esiste una successione 𝑔 𝑘 ∈ H(𝑎, 𝑏) di polinomi trigonometrici (cioè
combinazioni lineari finite del sistema {𝑒 𝑘 }) tale che 𝑔 𝑘 converge uniformemente a 𝑓 .

Detto in altri termini: l’insieme dei polinomi trigonometrici è denso nello spazio
𝐶 0 ([𝑎, 𝑏]) rispetto alla norma uniforme.

Osserviamo che la convergenza uniforme è più forte della convergenza in


𝐻(𝑎, 𝑏) in quanto si ha, banalmente:
∫ 𝑏 ∫ 𝑏
k𝑓 k 22 = 𝑓 (𝑥) 𝑑𝑥 ≤
2
k 𝑓 k 2∞ 𝑑𝑥 = (𝑏 − 𝑎) · k 𝑓 k 2∞ .
𝑎 𝑎

Dunque il teorema precedente garantisce che ogni funzione continua in H(𝑎, 𝑏)


può essere approssimata, rispetto alla norma k·k 2 , tramite polinomi trigonome-
trici. Il teorema seguente ci permette di estendere questa proprietà a tutte le
funzioni di H(𝑎, 𝑏).

Teorema 7.75 (densità delle funzioni continue). Data una qualunque 𝑓 ∈ 𝐻(𝑎, 𝑏)
per ogni 𝜀 > 0 esiste una funzione continua 𝑔 : [𝑎, 𝑏] → ℝ tale che k 𝑓 − 𝑔 k 2 < 𝜀.

Detto in altri termini: 𝐶 0 ([𝑎, 𝑏]) è un sottospazio denso in 𝐻(𝑎, 𝑏) cioè un insieme la
cui chiusura (nella topologia di 𝐻(𝑎, 𝑏)) è tutto 𝐻(𝑎, 𝑏).
7.6 convergenza integrale 335

Dimostrazione. Se 𝑓 ∈ 𝐻(𝑎, 𝑏) si ha, per la disuguaglianza di Cauchy-Schwarz:


∫ 𝑏 √
| 𝑓 (𝑥)| 𝑑𝑥 ≤ k 1 k 2 · k 𝑓 k 2 = 𝑏 − 𝑎 · k 𝑓 k 2 < +∞.
𝑎

Dunque la funzione 𝑓 è assolutamente integrabile su (𝑎, 𝑏). Se 𝑓 è limita-


ta su (𝑎, 𝑏) possiamo pensare che 𝑓 sia definita su [𝑎, 𝑏] e l’integrale è un
usuale integrale di Riemann (non improprio). Per le condizioni di integra-
bilità sappiamo che per ogni 𝜀 > 0 è possibile trovare una suddivisione
𝑎 = 𝑥0 < 𝑥 1 < · · · < 𝑥 𝑛 = 𝑏 su cui l’integrale di 𝑓 differisce dagli integrali
superiore e inferiore per meno di 𝜀. Possiamo prendere come funzione 𝑔 una
interpolazione lineare cioè una funzione tale che si abbia 𝑔(𝑥 𝑘 ) = 𝑓 (𝑥 𝑘 ) sui
punti della suddivisione e che risulti lineare su ogni intervallino [𝑥 𝑘 , 𝑥 𝑘+1 ]. La
funzione 𝑔 così definita è compresa, su ogni intervallino, tra l’inf e il sup di 𝑓 e
dunque si avrà:
∫ 𝑏
| 𝑓 (𝑥) − 𝑔(𝑥)| 𝑑𝑥 < 𝜀.
𝑎

Visto però che 𝑓 è limitata sappiamo esistere 𝑀 > 0 per cui k 𝑓 k ∞ ≤ 𝑀 e di


conseguenza k 𝑔k ∞ ≤ 𝑀 e quindi k 𝑓 − 𝑔k 2 ≤ 2 𝑀 . Ma allora
∫ 𝑏 ∫ 𝑏
k 𝑓 − 𝑔 k 22 = | 𝑓 (𝑥) − 𝑔(𝑥)| 2 𝑑𝑥 ≤ k 𝑓 − 𝑔k ∞ · | 𝑓 (𝑥) − 𝑔(𝑥)| 𝑑𝑥 ≤ 2 𝑀𝜀.
𝑎 𝑎

Abbiamo quindi mostrato che una funzione limitata e integrabile può essere
approssimata con funzioni continue.

Se la funzione è integrabile in senso improprio su (𝑎, 𝑏) ma non è limitata,


per definizione di integrale improprio per ogni 𝜀 > 0 possiamo trovare un
intervallo [𝛼, 𝛽] ⊆ (𝑎, 𝑏) per 𝑓 risulta limitata su [𝛼, 𝛽 ] e l’integrale di 𝑓 su
(𝑎, 𝑏) differisce dall’integrale di 𝑓 su [𝛼, 𝛽] per meno di 𝜀. Ci possiamo quindi
ricondurre al passo precedente per trovare una funzione 𝑔 che approssima
bene 𝑓 sull’intervallo [𝛼, 𝛽]. Estendendo 𝑔 in modo costante su (𝑎, 𝑏) \ [𝛼, 𝛽] si
troverà una funzione che approssima bene 𝑓 su tutto (𝑎, 𝑏).

Grazie ai due teoremi precedenti sappiamo che ogni 𝑓 ∈ H(𝑎, 𝑏) può essere
approssimata da polinomi trigonometrici 𝑔𝑁 → 𝑓 cioè da funzioni della
forma:
𝑁
X
𝑔𝑁 = 𝑎 𝑘,𝑁 𝑒 𝑘 .
𝑘=0

Stiamo qui assumendo che il polinomio trigonometrico 𝑔𝑁 abbia ordine non


superiore ad 𝑁 , ma questo si può sempre assumere, scartando o ripetendo i
termini della successione.

Se ora consideriamo gli sviluppi di Fourier:

𝑁
X
𝑓𝑁 = 𝑐𝑘 𝑒𝑘 , 𝑐𝑘 = h 𝑓 , 𝑒𝑘 i (7.11)
𝑘=0
336 7 spazi di funzioni

ci ricordiamo che per ogni 𝑘 ≤ 𝑁 risulta

𝑘 = 0𝑁 (h 𝑓 , 𝑒 𝑘 i − 𝑐 𝑘 ) = 0
X
h 𝑓 − 𝑓𝑁 , 𝑒 𝑘 i =

e quindi
𝑁
X
h 𝑓 − 𝑓𝑁 , 𝑔𝑁 − 𝑓𝑁 i = h 𝑓 − 𝑓𝑁 , (𝑎 𝑘,𝑁 − 𝑐 𝑘 )𝑒 𝑘 i = 0.
𝑘=0

Dunque, applicando il teorema di Pitagora,

k 𝑓 − 𝑓𝑁 k 22 = k 𝑓 − 𝑔𝑁 k 22 − k 𝑓𝑁 − 𝑔𝑁 k 22 ≤ k 𝑓 − 𝑔𝑁 k 22 → 0.

Abbiamo quindi dimostrato il seguente.

Teorema 7.76 (serie di Fourier). Se 𝑓 ∈ H(0 , 2𝜋) e 𝑐 𝑘 , 𝑓𝑁 sono definiti da (7.11)


allora 𝑓 𝑘 → 𝑓 in norma k·k 2 . In particolare vale l’uguaglianza di Bessel
+∞
𝑐 𝑘 = k 𝑓 k 22 .
X
(7.12)
𝑘=0

Questo significa, dunque, che il sistema ortonormale che abbiamo introdotto


è una base hilbertiana e quindi che ogni funzione 𝑓 ∈ H(0 , 2𝜋) si approssima
rispetto alla norma k·k 2 con gli sviluppi di Fourier.

Ricordiamo che se k 𝑓𝑁 − 𝑓 k 2 → 0 non è detto che si abbia la convergenza


puntuale 𝑓𝑁 (𝑥) → 𝑓 (𝑥) per ogni 𝑥 ∈ (0 , 2𝜋) in quanto il limite è unico in
𝐻(𝑎, 𝑏) ma non in H(𝑎, 𝑏) e dunque è possibile (e in effetti può succedere) che
il limite puntuale degli sviluppi di Fourier differisca, in alcuni punti, dalla
funzione che si sta approssimando.

Purtroppo lo spazio 𝐻(𝑎, 𝑏) non risulta essere completo, come si può vedere
nel seguente esempio.

Esempio 7.77 (razionali ingrassati). Dimostrare che lo spazio 𝐻(0 , 1) non è completo.

Sappiamo che l’insieme [0 , 1] ∩ ℚ è numerabile, quindi esiste una successione 𝑞 𝑘


che elenca tutti i numeri razionali nell’intervallo [0 , 1]. Poniamo inoltre 𝑟 𝑘 = 4·12𝑘
e consideriamo gli intervalli 𝐼 𝑘 = [𝑞 𝑘 − 𝑟 𝑘 , 𝑞 𝑘 + 𝑟 𝑘 ]. Prendiamo la successione di
funzioni 𝑓𝑛 : [0 , 1] → ℝ definita da

 [𝑛
 1 se 𝑥 ∈ 𝐼𝑘



𝑓𝑛 (𝑥) = 𝑘=1

 0 altrimenti


A differenza di quanto uno potrebbe pensare, queste funzioni 𝑓𝑛 non diventano mai
identicamente uguali ad 1. Anzi, si può osservare che
∫ 1 𝑛 ∫ 𝑞 𝑘 +𝑟 𝑘 𝑛 +∞
X X 1 1X 1 1
𝑓𝑛 (𝑥) 𝑑𝑥 ≤ 1 𝑑𝑥 = 𝑘
≤ 𝑘
= .
0 𝑘=1 𝑞 𝑘 −𝑟 𝑘 𝑘=1 2·2 2 𝑘=1 2 2
7.6 convergenza integrale 337

Si può mostrare che 𝑓 𝑘 è una successione di Cauchy in 𝐻(0 , 1) e che però non converge
in 𝐻(0 , 1).

Dimostrazione. Per verificare che 𝑓𝑛 è una successione di Cauchy possiamo


semplicemente osservare che se 𝑛 ≥ 𝑚 risulta che 𝑓𝑛 e 𝑓𝑚 differiscono solamente
sugli intervalli 𝐼 𝑘 con 𝑘 compreso tra 𝑚 ed 𝑛 . Dunque:
∫ 1 +∞ ∫ 𝑞 𝑘 +𝑟 𝑘 +∞
X X 1 1
| 𝑓𝑛 − 𝑓𝑚 | ≤ 1 𝑑𝑥 = 𝑘
= 𝑚.
0 𝑘=𝑚 𝑞 𝑘 −𝑟 𝑘 𝑘=𝑚 2·2 2

Visto che 𝑓𝑛 e 𝑓𝑚 assumono solamente i valori 0 e 1 anche | 𝑓𝑛 − 𝑓𝑚 | assume


solamente i valori 0 e 1 quindi | 𝑓𝑛 − 𝑓𝑚 | 2 = | 𝑓𝑛 − 𝑓𝑚 | . Abbiamo quindi verificato
che per 𝑛 ≥ 𝑚 si ha:
r
1
k 𝑓𝑛 − 𝑓𝑚 k 2 ≤ .
2𝑚
E’ dunque chiaro che comunque sia scelto 𝜀 > 0 possiamo scegliere 𝑁 tale che
1/2𝑁 ≤ 𝜀2 da cui si ottiene che se 𝑛, 𝑚 ≥ 𝑁 allora k 𝑓𝑛 − 𝑓𝑚 k 2 ≤ 𝜀. Cioè: 𝑓𝑛 è
una successione di Cauchy.

Supponiamo ora, per assurdo, che esista 𝑓 ∈ 𝐻(0 , 1) tale che k 𝑓𝑛 − 𝑓 k 2 → 0.


Innanzitutto visto che ogni 𝑓 𝑘 ≤ 1 possiamo supporre che sia anche 𝑓 ≤ 1 perché
altrimenti potremmo prendere 𝑔(𝑥) = min { 𝑓 (𝑥), 1} e avremmo chiaramente
k 𝑓𝑛 − 𝑔 k 2 ≤ k 𝑓𝑛 − 𝑓 k 2 → 0. In pratica stiamo dicendo che modificando la
funzione 𝑓 senza cambiarne l’integrale possiamo suppore che 𝑓 (𝑥) ≤ 1 per ogni
𝑥 ∈ [0 , 1].

Fissato un intervallo 𝐼𝑛 , per 𝑘 → +∞ si ha:


∫ 𝑞 𝑛 +𝑟𝑛 ∫ 1
2
0≤ | 𝑓 𝑘 (𝑥) − 𝑓 (𝑥)| 𝑑𝑥 ≤ | 𝑓 𝑘 (𝑥) − 𝑓 (𝑥)| 2 𝑑𝑥 = k 𝑓 𝑘 − 𝑓 k 22 → 0.
𝑞 𝑛 −𝑟𝑛 0

Ma ora se 𝑘 ≥ 𝑛 risulta che 𝑓 𝑘 = 1 su 𝐼𝑛 e quindi il valore dell’integrale


precedente non dipende da 𝑘 e dovrà quindi essere identicamente nullo:
∫ 𝑞 𝑛 +𝑟𝑛
(1 − 𝑓 (𝑥)) 𝑑𝑥 = 0
𝑞 𝑛 −𝑟𝑛

e quindi possiamo affermare che sup 𝑓 (𝐼𝑛 ) = 1 in quanto se fosse sup 𝑓 (𝐼𝑛 ) =
𝜆 < 1 l’integrale di 𝑓 (𝑥) − 1 sarebbe positivo sull’intervallo 𝐼𝑛 .

Vogliamo ora dimostrare che su ogni intervallo [𝑎, 𝑏] ⊆ [0 , 1] si ha sup 𝑓 ([𝑎, 𝑏]) =
1. Prendiamo 𝑁 abbastanza grande in modo che 𝑟 𝑁 < (𝑏 − 𝑎)/3. Allora l’in-
tervallo [𝑎 + 𝑟𝑛 , 𝑏 − 𝑟𝑛 ] ha ampiezza 2𝑟𝑛 e contiene infiniti numeri razionali.
Esistono quindi infiniti indici 𝑛 per cui 𝑞 𝑛 sta in tale intervallo. Tra questi
infiniti certamente ce n’è uno con indice 𝑛 ≥ 𝑁 (perché i 𝑞 𝑛 con 𝑛 < 𝑁 sono
in numero finito). Ma se 𝑞 𝑛 ∈ [𝑎 + 𝑟𝑛 , 𝑏 − 𝑟𝑛 ] allora 𝐼𝑛 ⊆ [𝑎, 𝑏] e quindi
sup 𝑓 ([𝑎, 𝑏]) ≥ sup 𝑓 (𝐼𝑛 ) = 1.

Questo significa che per ogni suddivisione di Riemann dell’intervallo [0 , 1]


risulta che il sup di 𝑓 sugli intervallini della suddivisione è 1 e quindi l’integrale
338 7 spazi di funzioni

superiore di 𝑓 è anch’esso 1. Dunque, essendo 𝑓 integrabile,


∫ 𝑏
𝑓 (𝑥) = 1.
𝑎

Vogliamo ora concludere che questo è in contraddizione con la disuguaglianza


∫ 𝑏
1
𝑓𝑛 (𝑥) ≤
𝑎 2

che abbiamo osservato all’inizio. Si ha infatti per la disuguaglianza di Cauchy-


Schwarz
∫ 1
| 𝑓 (𝑥) − 𝑓𝑛 (𝑥)| 𝑑𝑥 ≤ k 𝑓 − 𝑓𝑛 k 2 · k 1 k 2 → 0
0

e quindi, per il criterio di convergenza assoluta,


∫ 1
( 𝑓 (𝑥) − 𝑓𝑛 (𝑥)) 𝑑𝑥 → 0.
0

Ma abbiamo visto che


∫ 1 ∫ 1 ∫ 1
1 1
( 𝑓 (𝑥) − 𝑓𝑛 (𝑥)) 𝑑𝑥 = 𝑓 (𝑥) 𝑑𝑥 − 𝑓𝑛 (𝑥) 𝑑𝑥 ≥ 1 − =
0 0 0 2 2

ottenendo quindi un assurdo.

Il fatto di avere trovato una base hilbertiana di 𝐻(0 , 2𝜋) (e quindi in ogni 𝐻(𝑎, 𝑏))
ci permette di dire che ogni funzione in 𝐻(0 , 2𝜋) può essere rappresentata dalle
sue coordinate 𝑐 𝑘 in modo che valga l’uguaglianza di Bessel:
s
+∞
X
k 𝑓 k2 = 𝑐 2𝑘 .
𝑘=0

Abbiamo in effetti definito una corrispondenza:


( )
+∞
X
𝜑 : 𝐻(0 , 2𝜋) → ℓ , 2
ℓ = 𝑐∈ℕ :
2 ℝ
𝑐 2𝑘 < +∞
𝑘=0

definita da
𝑐 𝑘 = 𝜑( 𝑓 ) = h 𝑓 , 𝑒 𝑘 i.
Chiaramente tale 𝜑 è lineare. Visto che 𝑒 𝑘 è una base hilbertiana è facile
verificare che 𝜑 è anche iniettivo. Se su ℓ 2 definiamo il prodotto scalare e la
norma corrispondente:
s
+∞
X +∞
X
h𝑥, 𝑦i = 𝑥 𝑘 𝑦𝑘 , |𝑥| 2 = 𝑥 2𝑘
𝑘=0 𝑘=0

l’uguaglianza di Bessel ci dice che 𝜑 mantiene la norma e quindi la struttura di


spazio euclideo. Si potrebbe dimostrare che ℓ 2 è completo e questo significa che
7.6 convergenza integrale 339

𝜑 non è suriettiva in quanto la successione 𝑓𝑛 considerata nell’esempio 7.77 è


di Cauchy in 𝐻(0 , 2𝜋), dunque 𝜑( 𝑓𝑛 ) è di Cauchy in ℓ 2 e dunque converge in ℓ 2 .
Il limite 𝑐 della successione 𝜑( 𝑓𝑛 ) rappresenta una successione di coefficienti di
Fourier che non possono essere ottenuti da nessuna funzione 𝑓 ∈ 𝐻(0 , 2𝜋).
Il problema di Basilea è un problema
Possiamo utilizzare le serie di Fourier per risolvere il seguente. posto da Mengoli nel 1650 e risolto da
Eulero nel 1734 dopo che i maggiori ma-
tematici del tempo (tra cui i famosi mem-
Esercizio 7.78 (problema di Basilea). Dimostriamo che bri della famiglia Bernoulli che vivevano
appunto a Basilea) avevano tentato inva-
+∞ no di risolverlo. Si tratta di determinare
X 1 𝜋2
= . (7.13) la somma della serie (7.13). La soluzio-
𝑘=1 𝑘2 6 ne di Eulero (completamente diversa da
quella che stiamo proponendo qui) è sta-
ta poi ripresa da Riemann che ha definito
la celebre funzione zeta
Svolgimento. Calcoliamo i coefficienti di Fourier della funzione 𝑓 (𝑥) = 𝑥 in +∞
1
𝐻(0 , 2𝜋). Si ha
X
𝜁(𝑠) =
𝑘=1
𝑘𝑠
2𝜋 2𝜋  2𝜋 √
𝑥 𝑥2
∫ ∫ 
1 di grandissima rilevanza nella teoria dei
𝑐0 = 𝑓 (𝑥) · 𝑒0 (𝑥) 𝑑𝑥 = √ 𝑑𝑥 = √ = 2𝜋3 numeri.
0 0 2𝜋 2𝜋 2 0

poi
∫ 2𝜋
sin(𝑘𝑥)
𝑐 2 𝑘+1 = 𝑥· √ 𝑑𝑥
0 𝜋
 2𝜋 2𝜋
𝑥(− cos(𝑘𝑥))
 ∫
− cos(𝑘𝑥)
= √ − √ 𝑑𝑥
𝑘 𝜋 0 0 𝑘 𝜋

−2 𝜋 2 𝜋
= √ −0=−
𝑘 𝜋 𝑘

e infine
∫ 2𝜋
cos(𝑘𝑥)
𝑐2𝑘 = 𝑥· √ 𝑑𝑥
0 𝜋
 2𝜋 2𝜋
𝑥 sin(𝑘𝑥)
 ∫
sin(𝑘𝑥)
= √ − √ 𝑑𝑥 = 0.
𝜋𝑘 0 0 𝜋𝑘

Allora l’equazione di Bessel (7.12) ci dice che vale


+∞ +∞ +∞
4𝜋
k𝑥k 22 =
X X X
𝑐 2𝑘 = 𝑐 0 + 𝑐 22𝑘+1 = 2𝜋3 + .
𝑘=0 𝑘=0 𝑘=1 𝑘2

Ma è facile calcolare
2𝜋  2𝜋
𝑥3 8𝜋 3
∫ 
k𝑥k 22 = 𝑥 2 𝑑𝑥 = =
0 3 0
3

e quindi
+∞
8𝜋 3 X 1
= 2𝜋 3 + 4𝜋
3 𝑘=1 𝑘 2

da cui segue il risultato voluto.


340 7 spazi di funzioni

7.7 divagazione sui frattali autosimili

In questo capitolo mostriamo una applicazione geometrica del teorema delle


contrazioni. Considereremo uno spazio metrico i cui punti sono le figure
geometriche e vedremo che i frattali autosimili non sono altro che punti fissi di
opportune mappe contrattive.

Definizione 7.79. Siano 𝐴 e 𝐵 sottoinsiemi non vuoti di ℝ𝑛 . Definiamo la distanza


distanza di Hausdorff di Hausdorff tra 𝐴 e 𝐵 come:
 
𝑑H (𝐴, 𝐵) = max sup inf |𝑎 − 𝑏|, sup inf |𝑎 − 𝑏| .
𝑎∈𝐴 𝑏∈𝐵 𝑏∈𝐵 𝑎∈𝐴

Definiamo
K(ℝ𝑛 ) = {𝐴 ⊆ ℝ𝑛 : 𝐴 chiuso, limitato, non vuoto}.

Teorema 7.80 (caratterizzazione della distanza di Hausdorff). Se 𝐴 e 𝐵 sono


compatti di ℝ𝑛 (cioè chiusi e limitati) allora per ogni 𝑟 ∈ ℝ si ha

𝑑H (𝐴, 𝐵) ≤ 𝑟

se e solo se valgono entrambe le seguenti proprietà:

1. per ogni 𝑎 ∈ 𝐴 esiste 𝑏 ∈ 𝐵 tale che |𝑎 − 𝑏| ≤ 𝑟 ;


2. per ogni 𝑏 ∈ 𝐵 esiste 𝑎 ∈ 𝐴 tale che |𝑎 − 𝑏| ≤ 𝑟 .

Dimostrazione. Per ogni compatto non vuoto 𝐴 e per ogni 𝑥 ∈ ℝ𝑛 definiamo la


distanza tra il punto 𝑥 e l’insieme 𝐴 come:

𝑑(𝑥, 𝐴) = min |𝑥 − 𝑎|.


𝑎∈𝐴

Il minimo esiste in quanto 𝐴 è compatto e 𝑎 ↦→ 𝑑(𝑥, 𝑎) è una funzione continua.


Fissato 𝐴 la funzione 𝑥 ↦→ 𝑑(𝑥, 𝐴) è anch’essa continua, anzi è 1-lipschitziana.
Infatti se 𝑥 0 ∈ ℝ𝑛 esiste 𝑎 0 ∈ 𝐴 tale che 𝑑(𝑥 0 , 𝐴) = 𝑑(𝑥 0 , 𝑎 0) e dunque

𝑑(𝑥, 𝐴) = min |𝑥 − 𝑎| ≤ |𝑥 − 𝑎 0 | ≤ |𝑥 − 𝑥 0 | + |𝑥 0 − 𝑎 0 | = |𝑥 − 𝑥 0 | + 𝑑(𝑥 0 , 𝐴)


𝑥∈𝐴

da cui 𝑑(𝑥, 𝐴) − 𝑑(𝑥 0 , 𝐴) ≤ |𝑥 − 𝑥 0 | . Scambiando 𝑥 e 𝑥 0 si ottiene anche la


disuguaglianza inversa da cui la 1-lipschitzianità di 𝑑(𝑥, 𝐴). Dunque sui
compatti la funzione 𝑑(𝑥, 𝐴) assume sempre massimo e si ha:
 
𝑑H (𝐴, 𝐵) = max max 𝑑(𝑎, 𝐵), max 𝑑(𝑏, 𝐴) .
𝑎∈ 𝐴 𝑏∈𝐵

In particolare se 𝑑H (𝐴, 𝐵) ≤ 𝑟 per ogni 𝑎 ∈ 𝐴 si deve avere 𝑑(𝑎, 𝐵) ≤ 𝑟 e per


ogni 𝑏 ∈ 𝐵 si deve avere 𝑑(𝑏, 𝐴) ≤ 𝑟 . Ma allora valgono le due proprietà
dell’enunciato.

Viceversa se vale la proprietà 1. allora 𝑑(𝑎, 𝐵) ≤ 𝑟 e se vale la 2. 𝑑(𝑏, 𝐴) ≤ 𝑟 e di


conseguenza 𝐷H (𝐴, 𝐵) ≤ 𝑟 .
7.7 divagazione sui frattali autosimili 341

Teorema 7.81 (distanza di Hausdorff). La distanza di Hausdorff 𝑑H è una distanza


su K(ℝ𝑛 ) e lo spazio metrico K(ℝ𝑛 ) è completo.

Dimostrazione. Chiaramente se 𝐴, 𝐵 sono non vuoti si ha 𝑑H (𝐴, 𝐵) ≥ 0. Inoltre,


in base alla caratterizzazione del teorema precedente è facile osservare che
𝑑H (𝐴, 𝐵) < +∞.

Se 𝑑H (𝐴, 𝐵) = 0 significa che per ogni 𝑎 ∈ 𝐴 esiste 𝑏 ∈ 𝐵 tale che |𝑎 − 𝑏| = 0.


Cioè 𝑏 = 𝑎 . Dunque 𝐴 ⊆ 𝐵. Scambiando i ruoli di 𝐴 e 𝐵 si ottiene anche 𝐵 ⊆ 𝐴
da cui 𝐴 = 𝐵.

Che sia 𝑑H (𝐴, 𝐵) = 𝑑H (𝐵, 𝐴) è ovvio in quanto la definizione è simmetrica in


𝐴 e 𝐵.

Verifichiamo ora la disuguaglianza triangolare. Siano 𝐴, 𝐵, 𝐶 tre compatti non


vuoti. Per ogni 𝑎 ∈ 𝐴 esiste 𝑏 ∈ 𝐵 tale che |𝑎 − 𝑏| ≤ 𝑑H (𝐴, 𝐵) e per tale 𝑏 ∈ 𝐵
esiste un 𝑐 ∈ 𝐶 tale che |𝑏 − 𝑐| ≤ 𝑑H (𝐵, 𝐶). Dunque per ogni 𝑎 ∈ 𝐴 esiste un
𝑐 ∈ 𝐶 tale che

|𝑎 − 𝑐| ≤ |𝑎 − 𝑏| + |𝑏 − 𝑐| ≤ 𝑑H (𝐴, 𝐵) + 𝑑H (𝐵, 𝐶).

Scambiando i ruoli di 𝐴 e 𝐶 si ottiene anche la condizione simmetrica e dunque,


per la caratterizzazione della distanza di Hausdorff si ottiene la disuguaglianza
triangolare:
𝑑H (𝐴, 𝐶) ≤ 𝑑H (𝐴, 𝐵) + 𝑑H (𝐵, 𝐶).

Abbiamo quindi verificato che 𝑑H è una distanza su K(ℝ𝑛 ). Verifichiamo ora


che K(ℝ𝑛 ) è completo.

Sia 𝐴 𝑘 ∈ K(ℝ𝑛 ) una successione di Cauchy. Senza perdita di generalità


possiamo supporre che
1
𝑑H (𝐴 𝑘 , 𝐴 𝑘+1 ) ≤ 𝑘 .
2
Infatti essendo 𝐴 𝑘 di Cauchy è possibile trovarne una sottosuccessione con tale
proprietà, e se poi dimostriamo che la sottosuccessione converge allora l’intera
successione, essendo di Cauchy, deve convergere.

Consideriamo come candidato limite l’insieme di tutti i possibili limiti di punti


degli insiemi 𝐴 𝑘 :
𝐴 = {𝑥 ∈ ℝ𝑛 : ∃𝑥 𝑘 ∈ 𝐴 𝑘 : 𝑥 𝑘 → 𝑥}.

Per prima cosa vogliamo verificare che 𝐴 non è vuoto. Scelto un punto qualunque
𝑎 0 ∈ 𝐴0 esiste 𝑎1 ∈ 𝐴1 tale che |𝑎0 − 𝑎1 | = 𝑑H (𝐴0 , 𝐴1 ). Iterando otteniamo
una successione di punti 𝑎 𝑘 ∈ 𝐴 𝑘 tale che |𝑎 𝑘 − 𝑎 𝑘+1 | ≤ 𝑑H (𝐴 𝑘 , 𝐴 𝑘+1 ) ≤ 1/2 𝑘 .
Dunque 𝑎 𝑘 è una successione di Cauchy in ℝ𝑛 ed essendo ℝ𝑛 completo dovrà
convergere ad un punto 𝑎 che quindi è un punto di 𝐴.

Avendo assunto 𝑑H (𝐴 𝑘 , 𝐴 𝑘+1 ) < 1/2 𝑘 si ottiene (sommando la serie geometrica):

𝑛−1
X 2
𝑑H (𝐴 𝑘 , 𝐴𝑛 ) ≤ 𝑑H (𝐴 𝑗 , 𝐴 𝑗+1 ) ≤ se 𝑛 > 𝑘.
𝑗=𝑘 2𝑘
342 7 spazi di funzioni

Questo ci permette di dimostrare che per ogni 𝑎 ∈ 𝐴 e per ogni 𝑘 ∈ ℕ esiste


𝑎 𝑘 ∈ 𝐴 𝑘 tale che |𝑎 − 𝑎 𝑘 | ≤ 4/2 𝑘 . Infatti se a distanza 4/2 𝑘 non ci fossero punti
di 𝐴 𝑘 allora a distanza 2/2 𝑘 non ci potrebbero essere punti di 𝐴𝑛 per nessun
𝑛 > 𝑘 in quanto visto che 𝑑H (𝐴 𝑘 , 𝐴𝑛 ) ≤ 2/2 𝑘 se ci fosse un punto di 𝐴𝑛 a
distanza inferiore a 2/2 𝑘 ci dovrebbe anche essere un punto di 𝐴 𝑘 a distanza
inferiore a 4/2 𝑘 . Ma questo è impossibile perché per come è definito 𝐴 deve
esistere 𝑥 𝑛 ∈ 𝐴𝑛 tale che 𝑥 𝑛 → 𝑎 . Abbiamo quindi mostrato che

sup inf |𝑎 − 𝑏| ≤ 4/2 𝑘 → 0.


𝑎∈𝐴 𝑏∈𝐴 𝑘

Viceversa ci proponiamo di mostrare che per ogni 𝑝 ∈ 𝐴 𝑘 esiste 𝑎 ∈ 𝐴 tale


che |𝑝 − 𝑎| < 2/2 𝑘 . Visto che 𝑑H (𝐴 𝑗+1 , 𝐴 𝑗 ) ≤ 1/2 𝑗 possiamo infatti costruire a
partire da 𝑎 𝑘 = 𝑝 ∈ 𝐴 𝑘 una successione 𝑎 𝑗 ∈ 𝐴 𝑗 con 𝑗 > 𝑘 , tale che 𝑑(𝑎 𝑗+1 , 𝑎 𝑗 ) ≤
1/2 𝑗 . Tale successione è di Cauchy quindi converge: 𝑎 𝑗 → 𝑎 e il suo limite 𝑎 è
quindi un punto di 𝐴 e si ha
∞ ∞
X X 1 2
|𝑎 − 𝑝| ≤ 𝑎 𝑗 − 𝑎 𝑗+1 ≤
𝑗
≤ 𝑘.
𝑗=𝑘 𝑗=𝑘 2 2

Abbiamo quindi dimostrato che

sup inf |𝑎 − 𝑏| ≤ 2/2 𝑘 → 0


𝑏∈𝑎 𝑘 𝑎∈𝐴

e quindi 𝑑H (𝐴 𝑘 , 𝐴) → 0.

Ci rimane solo da mostrare che 𝐴 è un insieme chiuso. Presa una successione


di punti 𝑥 𝑘 ∈ 𝐴 convergente 𝑥 𝑘 → 𝑥 , dobbiamo mostrare che 𝑥 ∈ 𝐴. Per ogni
𝑥 𝑘 ∈ 𝐴 per quanto già detto sappiamo esistere 𝑎 𝑘 ∈ 𝐴 𝑘 tale che |𝑎 𝑘 − 𝑥 𝑘 | ≤ 4/2 𝑘 .
Ma allora |𝑎 𝑘 − 𝑎| ≤ 4/2 𝑘 + |𝑥 𝑘 − 𝑎| → 0 e quindi 𝑎 𝑘 → 𝑎 da cui 𝑎 ∈ 𝐴.

Teorema 7.82 (frattali autosimilari). Siano 𝜑1 , . . . , 𝜑 𝑁 : ℝ𝑛 → ℝ𝑛 contrazioni


(cioè funzioni lipschitziane con costante di lipschitz inferiore ad 1). Allora esiste un
unico insieme 𝐶 ⊆ ℝ𝑛 chiuso e limitato tale che
𝑁
[
𝐶= 𝜑 𝑘 (𝐶).
𝑘=1

Dimostrazione. Basterà dimostrare che la funzione 𝑇 : K(ℝ𝑛 ) → K(ℝ𝑛 ) definita


da
𝑁
[
𝑇(𝐴) = 𝜑 𝑘 (𝐶)
𝑘=1

è una contrazione: dopodiché sapendo che K(ℝ𝑛 ) è completo il risultato è


conseguenza diretta del teorema di punto fisso di Banach-Caccioppoli.

Ogni 𝜑 𝑘 per ipotesi è una contrazione, cioè per ogni 𝑎, 𝑏 ∈ 𝑋

|𝜑 𝑘 (𝑎) − 𝜑 𝑘 (𝑏)| ≤ 𝐿 𝑘 |𝑎 − 𝑏|
7.7 divagazione sui frattali autosimili 343

Figura 7.4: Chiamato 𝐾 0 ∈ ℝ2 il segmen-


to [0 , 1] × {0}, in figura è rappresentata
la quarta iterata 𝐾 4 = 𝑇 4 (𝐾 0 ) della con-
trazione che definisce la curva di Köch.
A pagina 428 il codice per generare la
figura in copertina.

con 𝐿 𝑘 < 1. Posto 𝐿 = max {𝐿1 , . . . , 𝐿 𝑁 } < 1 vogliamo dimostrare che 𝑇


è 𝐿-lipschitziana (e dunque una contrazione). Siano 𝐴, 𝐵 ∈ K(ℝ𝑛 ) e sia
𝑑 = 𝑑H (𝐴, 𝐵). Preso 𝑎 0 ∈ 𝑇(𝐴) dovrà esistere 𝑘 tale che 𝑎 0 ∈ 𝜑 𝑘 (𝐴). Cioè
𝑎 0 = 𝜑 𝑘 (𝑎) con 𝑎 ∈ 𝐴. Ma allora esiste 𝑏 ∈ 𝐵 con |𝑎 − 𝑏| ≤ 𝑑H (𝐴, 𝐵) = 𝑑
e quindi 𝑏 0 = 𝜑 𝑘 (𝑏) ∈ 𝑇(𝐵) e |𝑎 0 − 𝑏 0 | = |𝜑 𝑘 (𝑎) − 𝜑 𝑘 (𝑏)| ≤ 𝐿|𝑎 − 𝑏| ≤ 𝐿 · 𝑑 .
Dunque abbiamo mostrato che

sup inf |𝑎 0 − 𝑏 0 | ≤ 𝐿𝑑H (𝐴, 𝐵).


𝑎 0 ∈𝑇(𝐴) 𝑏 ∈𝑇(𝐵)
0

La stessa disuguaglianza rimane valida con 𝐴 e 𝐵 scambiati, ottenendo quindi:

𝑑H (𝑇(𝐴), 𝑇(𝐵)) ≤ 𝐿 · 𝑑H (𝐴, 𝐵).

Esempio 7.83 (insieme di Cantor). Si prendano 𝜑, 𝜓 : ℝ → ℝ definite da

𝑥 2+𝑥
𝜑(𝑥) = , 𝜓(𝑥) = .
3 3

Chiaramente 𝜑 e 𝜓 sono 1/3-lipschitziane e dunque, per il teorema precedente, esiste


un unico insieme 𝐶 chiuso e limitato in ℝ tale che
𝐶 𝐶+2
𝐶= ∪ .
3 3
Tale insieme si chiama insieme di Cantor. insieme di Cantor

L’insieme di Cantor è un frattale autosimile in quanto si ottiene come l’unione di due


copie riscalate di sé stesso.

E’ facile mostrare che 𝐶 ⊆ [0 , 1] in quanto 𝑇 manda sottoinsiemi di [0 , 1] in sottoinsiemi


di [0 , 1]. Ogni 𝑥 ∈ [0 , 1] può essere rappresentato in base 3 con una sequenza di
cifre ternarie: 0 , 1 , 2. La funzione 𝜑(𝑥) aggiunge uno 0 in cima alla sequenza di cifre,
mentre la funzione 𝜓(𝑥) aggiunge un 2 in cima alla sequenza. Vogliamo mostrare che
𝐶 è l’insieme di tutti i numeri in [0 , 1] che possono essere scritti in base 3 utilizzando
solamente le cifre 0 e 2. Osserviamo innanzitutto che 𝐶 è chiuso: il suo complementare
in [0 , 1] è formato da tutti i numeri che in base 3 si devono scrivere utilizzando almeno
una cifra 1. Ma se c’è una cifra 1 posso modificare tutte le cifre successive rimanendo
nel complementare di 𝐶 : dunque il complementare di 𝐶 è aperto. Si osservi che gli unici
numeri che hanno una doppia rappresentazione in base 3 sono quelli che terminano con
una sequenza infinita di 2,
344 7 spazi di funzioni

Esempio 7.84 (curva di Köch). Sia 𝑅 𝜃 : ℝ2 → ℝ2 la rotazione con centro l’origine di


𝜃 radianti in senso antiorario. Sia 𝛼 = 𝜋/3, 𝑝 = (1 , 0) e siano 𝜑1 , 𝜑2 , 𝜑3 , 𝜑4 : ℝ2 →
ℝ2 le funzioni definite da:
𝑣 𝑣
𝜑1 (𝑣) = , 𝜑2 (𝑣) = 𝑅 𝛼 + 𝜑1 (𝑝),
3 3
𝑣 𝑣
𝜑3 (𝑣) = 𝑅 −𝛼 + 𝜑2 (𝑝), 𝜑4 (𝑣) = + 𝜑3 (𝑝).
3 3

Allora esiste un unico insieme chiuso 𝐾 ⊆ ℝ2 tale che

𝐾 = 𝜑1 (𝐾) ∪ 𝜑2 (𝐾) ∪ 𝜑3 (𝐾) ∪ 𝜑4 (𝐾).

curva di Köch
L’insieme 𝐾 si chiama curva di Köch. E’ un frattale autosimile in quanto è composto
da quattro copie riscalate di se stesso.
successioni ricorsive 8
Nella maggior parte di questo capitolo prenderemo in considerazione le
successioni 𝑎 𝑛 definite per ricorrenza o ricorsivamente dalle condizioni:
(
𝑎0 = 𝛼,
(8.1)
𝑎 𝑛+1 = 𝑓 (𝑎 𝑛 )

Fissato il termine iniziale 𝛼 e la legge di ricorrenza 𝑓 , c’è una unica successione


che soddisfa (8.1) e i suoi termini sono:

𝑎0 = 𝛼,
𝑎1 = 𝑓 (𝑎1 ) = 𝑓 (𝛼),
𝑎2 = 𝑓 (𝑎2 ) = 𝑓 ( 𝑓 (𝛼)),
𝑎3 = 𝑓 (𝑎3 ) = 𝑓 ( 𝑓 ( 𝑓 (𝛼))),
..
.
𝑎 𝑛 = 𝑓 (𝑎 𝑛−1 ) = 𝑓 𝑛 (𝛼),
..
.

Il valore di 𝑎 𝑛 potrebbe rappresentare lo stato di un sistema che si evolve a


partire da uno stato iniziale 𝑎 0 = 𝛼 tramite la funzione 𝑓 che rappresenta il
cambiamento di stato. Il numero naturale 𝑛 potrebbe quindi rappresentare un sistema dinamico discreto
passo temporale. In tal senso (8.1) si chiama anche sistema dinamico discreto.

L’equazione 𝑎 𝑛+1 = 𝑓 (𝑎 𝑛 ) viene chiamata una equazione ricorsiva autonoma del


primo ordine. Ci sono altre tipologie di equazioni che considereremo solo
marginalmente nei capitoli successivi. Ad esempio quando abbiamo definito il
fattoriale: 𝑎 𝑛 = 𝑛 ! abbiamo dato le condizioni:
(
𝑎0 = 1
𝑎 𝑛+1 = (𝑛 + 1) · 𝑎 𝑛

ma l’equazione 𝑎 𝑛+1 = (𝑛 + 1) · 𝑎 𝑛 è della forma 𝑎 𝑛+1 = 𝑓 (𝑛, 𝑎 𝑛 ) e si dice essere


non autonoma perché la funzione di ricorrenza 𝑓 dipende esplicitamente da 𝑛
oltre che dal termine precedente 𝑎 𝑛 .

Si potrebbero anche considerare equazioni di ordine maggiore del primo. Ad Fibonacci


esempio la successione 𝐹𝑛 di Fibonacci (Leonardo Pisano, 1170–1242) i cui primi
termini sono riportati nella tabella 8.1 soddisfa l’equazione ricorsiva:

0, 1, 1, 2, 3, 5, 8, 13, 21, 34, 55, 89, 144, 233, 377, 610, 987. . . Tabella 8.1: I primi termini della suc-
cession di Fibonacci. Ogni termine è la
somma dei due precedenti.
346 8 successioni ricorsive

 𝐹 =0
 0



1𝐹 =1 (8.2)

 𝐹𝑛+2 = 𝐹𝑛+1 + 𝐹𝑛


che è una relazione del secondo ordine in quanto ogni termine può essere
definito utilizzando i valori dei due termini precedenti. Se l’equazione è lineare,
come in questo caso, si possono trovare delle formule esplicite per scrivere
l’𝑛 -esimo termine della successione. Lo faremo nella sezione 8.3

Si potrebbero anche considerare i sistemi di equazioni ricorsive. Ad esempio


se 𝑓 fosse una funzione complessa 𝑓 : ℂ → ℂ, 𝑓 (𝑥 + 𝑖 𝑦) = 𝑓1 (𝑥, 𝑦) + 𝑖 𝑓2 (𝑥, 𝑦)
con 𝑓1 , 𝑓2 : ℝ × ℝ → ℝ si potrebbe scrivere 𝑎 𝑛 = 𝑥 𝑛 + 𝑖 𝑦𝑛 con 𝑥 𝑛 , 𝑦𝑛 ∈ ℝ e
l’equazione ricorsiva 𝑎 𝑛+1 = 𝑓 (𝑎 𝑛 ) diventerebbe un sistema di due equazioni:
(
𝑥 𝑛+1 = 𝑓1 (𝑥 𝑛 , 𝑦𝑛 )
𝑦𝑛+1 = 𝑓2 (𝑥 𝑛 , 𝑦𝑛 ).

Lo studio dei sistemi va oltre gli scopi di questo capitolo, ma accenneremo


solamente ad un esempio nella sezione 8.4.

8.1 equazioni ricorsive autonome del primo ordine

Esempio 8.1 (algoritmo di Erone). Fissato un numero reale 𝑝 > 1 consideriamo la


successione definita per ricorrenza da
(
𝑎0 = 𝑝
𝑎 𝑛 +𝑝/𝑎 𝑛
𝑎 𝑛+1 = 2 .

Si dimostri che 𝑎 𝑛 → 𝑝.

Osserviamo, ad esempio, che per 𝑝 = 2 i primi termini della successione sono:

𝑎0 = 2,
2 + 2/2
𝑎1 = = 3/2 = 1 . 5 ,
2
3/2 + 2/(3/2)
𝑎2 = = 17/12 ≈ 1.4166666,
2
17/12 + 2/(17/12)
𝑎3 = = 577/408 ≈ 1.4142157,
2
..
.

che effettivamente sembrano avvicinarsi molto al numero



2 ≈ 1.4142135.

Dimostrazione. Passo 1. Dimostriamo per induzione che 𝑎 𝑛 > 0 per ogni 𝑛 ∈ ℕ .


Infatti per 𝑛 = 1 osserviamo che 𝑎 0 = 𝑝 > 0 mentre se supponiamo che 𝑎 𝑛 > 0
8.1 equazioni ricorsive autonome del primo ordine 347

𝑝
𝑎𝑛 +
otteniamo che 𝑎 𝑛+1 = 2 𝑎𝑛 è positivo in quanto è la metà della somma di
due quantità positive. Quindi, applicando il principio di induzione, possiamo
concludere che 𝑎 𝑛 > 0 per ogni 𝑛 .

Abbiamo in effetti identificato un insieme 𝐴 = {𝑥 : 𝑥 > 0} = (0 , +∞) tale che


𝑝
𝑥+
la funzione 𝑓 (𝑥) = 2 𝑥 è definita su 𝐴 e, contemporaneamente, ha valori in
𝐴. Quindi questo passaggio è fondamentale anche solo per garantire che la
successione 𝑎 𝑛 sia ben definita.

Passo 2. Dimostriamo che la successione 𝑎 𝑛 è decrescente. Per fare questo


osserviamo che essere decrescente significa: 𝑎 𝑛+1 ≤ 𝑎 𝑛 e cioé
𝑝
𝑎𝑛 + 𝑎𝑛
≤ 𝑎𝑛
2
ovvero (moltiplicando ambo i lati per 𝑎 𝑛 > 0)

𝑎 𝑛2 + 𝑝 ≤ 2 𝑎 𝑛2

che è equivalente a 𝑎 𝑛2 − 𝑝 ≥ 0. E, in effetti, questa disuguaglianza è sempre


vera in quanto per 𝑛 = 1 si riduce a 𝑎 12 − 𝑝 = 𝑝 2 − 𝑝 ≥ 0 che è soddisfatta nel
caso 𝑝 > 1. Mentre

𝑝 !2
𝑎𝑛 + 𝑎𝑛 𝑎 𝑛4 + 2𝑝𝑎 𝑛2 + 𝑝 2 − 4𝑝𝑎 𝑛2
𝑎 𝑛+
2
1 −𝑝= −𝑝=
2 4 𝑎 𝑛2
2
𝑎 𝑛4 − 2 𝑝𝑎 𝑛2 + 𝑝 2 𝑎 𝑛2 − 𝑝
= = ≥ 0.
4 𝑎 𝑛2 4 𝑎 𝑛2

Dunque 𝑎 𝑛+
2
1 ≥ 𝑝 per ogni 𝑛 ∈ ℕ e di conseguenza 𝑎 𝑛 è decrescente e inoltre

𝑎𝑛 > 𝑝.

Passo 3. Visto che 𝑎 𝑛 è una successione decrescente, per il teorema sulle


successioni monotòne possiamo affermare che 𝑎 𝑛 ammette limite, e cioé: 𝑎 𝑛 → ℓ
con ℓ ∈ [−∞, +∞]. Possiamo immediatamente escludere ℓ = +∞ in quanto

la successione è decrescente, e possiamo anche escludere ℓ < 𝑝 in quanto

sappiamo che 𝑎 𝑛 > 𝑝 e quindi (per il teorema della permanenza del segno)

ℓ ≥ 𝑝 . Inoltre
𝑝 𝑝
𝑎 𝑛 + 𝑎𝑛 ℓ+ℓ
𝑎 𝑛+1 = → .
2 2
Ma sappiamo che se 𝑎 𝑛 → ℓ anche 𝑎 𝑛+1 → ℓ (visto che 𝑎 𝑛+1 è una sottosucces-
sione di 𝑎 𝑛 ) e quindi (per l’unicità del limite)
𝑝
ℓ+ ℓ
ℓ= (8.3)
2

da cui si ricava ℓ 2 = 𝑝 ovvero (essendo ℓ ≥ 0) concludiamo 𝑎 𝑛 → ℓ = 𝑝.

Cominciamo ora a definire una terminologia e a fissare alcuni risultati gene-


rali che ci serviranno per trovare alcune proprietà delle successioni definite
da (8.1).
348 8 successioni ricorsive

punto fisso
Definizione 8.2 (punto fisso). Diremo che 𝑥 è un punto fisso per la funzione 𝑓 se
vale
𝑓 (𝑥) = 𝑥.

Osserviamo che se 𝛼 è un punto fisso per 𝑓 la successione costante 𝑎 𝑛 = 𝛼


soddisfa l’equazione 𝑎 𝑛+1 = 𝑓 (𝑎 𝑛 ). Inoltre se 𝑎 𝑛+1 = 𝑓 (𝑎 𝑛 ), se 𝑎 𝑛 converge ad
un limite ℓ e se 𝑓 è continua in ℓ allora

𝑎 𝑛+1 = 𝑓 (𝑎 𝑛 ) → 𝑓 (ℓ )

ma visto che 𝑎 𝑛+1 ha lo stesso limite di 𝑎 𝑛 si trova che 𝑓 (ℓ ) = ℓ ovvero il limite


della successione è un punto fisso.
𝑝
𝑥+ √ √
Nell’esempio precedente la funzione 𝑓 (𝑥) = 2 𝑥 ha come punti fissi 𝑝 e − 𝑝
e l’equazione (8.3) non è altro che 𝑓 (𝑥) = 𝑥 . E in effetti abbiamo mostrato che la
successione 𝑎 𝑛 converge proprio ad un punto fisso.

insieme invariante Definizione 8.3 (insieme invariante). Un insieme 𝐴 si dice essere invariante per 𝑓
se 𝑓 (𝐴) ⊆ 𝐴 (ovvero: per ogni 𝑥 ∈ 𝐴 si ha 𝑓 (𝑥) ∈ 𝐴).

Osserviamo che se 𝐴 è un insieme invariante e 𝑎 0 ∈ 𝐴 allora la successione


definita da 𝑎 𝑛+1 = 𝑓 (𝑎 𝑛 ) assume sempre valori in 𝐴.

Nell’esercizio 8.1 abbiamo dimostrato che gli intervalli (0 , +∞) e ( 𝑝, +∞) sono
invarianti.

Teorema 8.4. Sia 𝐴 ⊆ ℝ un insieme invariante per 𝑓 e sia 𝑎 𝑛 una successione con
𝑎1 ∈ 𝐴 e 𝑎 𝑛+1 = 𝑓 (𝑎 𝑛 ).

𝑓 (𝑥) ≥ 𝑥 Se per ogni 𝑥 ∈ 𝐴 vale 𝑓 (𝑥) ≥ 𝑥 allora la successione 𝑎 𝑛 è crescente.

𝑓 (𝑥) ≤ 𝑥 Se per ogni 𝑥 ∈ 𝐴 vale 𝑓 (𝑥) ≤ 𝑥 allora la successione 𝑎 𝑛 è decrescente.

Dimostrazione. In effetti se 𝑓 (𝑥) ≥ 𝑥 si ha per ogni 𝑛 ∈ ℕ

𝑎 𝑛+1 = 𝑓 (𝑎 𝑛 ) ≥ 𝑎 𝑛

e quindi la successione 𝑎 𝑛 è crescente. Mentre se 𝑓 (𝑥) ≤ 𝑥 si ha

𝑎 𝑛+1 = 𝑓 (𝑎 𝑛 ) ≤ 𝑎 𝑛

e la successione è decrescente.

Esercizio 8.5. Al variare di 𝛼 ∈ ℝ determinare il limite della successione 𝑎 𝑛 definita


per ricorrenza dalle equazioni:
(
𝑎1 = 𝛼
𝑎 𝑛+1 = 𝑎 𝑛 − 𝑎 𝑛2 .

Teorema 8.6. Sia 𝐴 ⊆ ℝ un insieme invariante per 𝑓 e sia 𝑎 𝑛 una successione con
𝑓 crescente 𝑎0 ∈ 𝐴 e 𝑎 𝑛+1 = 𝑓 (𝑎 𝑛 ). Se 𝑓 è crescente su 𝐴 allora 𝑎 𝑛 è monotòna.
8.1 equazioni ricorsive autonome del primo ordine 349

Dimostrazione. Osserviamo che se 𝑓 è crescente allora

𝑎 𝑛+1 ≥ 𝑎 𝑛 ⇒ 𝑓 (𝑎 𝑛+1 ) ≥ 𝑓 (𝑎 𝑛 ) ⇒ 𝑎 𝑛+2 ≥ 𝑎 𝑛+1


𝑎 𝑛+1 ≤ 𝑎 𝑛 ⇒ 𝑓 (𝑎 𝑛+1 ) ≤ 𝑓 (𝑎 𝑛 ) ⇒ 𝑎 𝑛+2 ≤ 𝑎 𝑛+1 .

Dunque se per i primi due termini si ha 𝑎 1 ≥ 𝑎 0 allora, per induzione, si ha


𝑎 𝑛+1 ≥ 𝑎 𝑛 per ogni 𝑛 e quindi la successione è crescente. Se invece 𝑎 2 ≤ 𝑎1
si dimostra per induzione che 𝑎 𝑛+1 ≤ 𝑎 𝑛 per ogni 𝑛 e quindi la successione è
decrescente.

Teorema 8.7. Sia 𝐴 ⊆ ℝ un insieme invariante per 𝑓 e sia 𝑎 𝑛 una successione con
𝑎 1 ∈ 𝐴 e 𝑎 𝑛+1 = 𝑓 (𝑎 𝑛 ). Se 𝑓 è decrescente su 𝐴 allora le due successioni 𝑎 2𝑛 (termini 𝑓 decrescente
di indice pari) e 𝑎 2𝑛+1 (termini di indice dispari) sono monotòne.

Dimostrazione. Osserviamo che

𝑎 2𝑛+2 = 𝑓 (𝑎2𝑛+1 ) = 𝑓 ( 𝑓 (𝑎 2𝑛 )) = ( 𝑓 ◦ 𝑓 )(𝑎2𝑛 )


𝑎 2𝑛+3 = 𝑓 (𝑎2𝑛+2 ) = 𝑓 ( 𝑓 (𝑎 2𝑛+1 )) = ( 𝑓 ◦ 𝑓 )(𝑎 2𝑛+1 )

cioé le sottosuccessioni dei termini di indice pari e di indice dispari soddisfano


una relazione di ricorrenza tramite la funzione 𝑓 ◦ 𝑓 (invece che 𝑓 ).
Osserviamo anche che se 𝑓 è decrescente allora 𝑓 ◦ 𝑓 è crescente. Infatti:

𝑥 ≤ 𝑦 ⇒ 𝑓 (𝑥) ≥ 𝑓 (𝑦) ⇒ 𝑓 ( 𝑓 (𝑥)) ≤ 𝑓 ( 𝑓 (𝑦)).

Dunque possiamo applicare il teorema precedente e ottenere che le due


sottosuccessioni sono entrambe monotòne.

Utilizziamo la terminologia e i risultati precedenti nei seguenti esercizi.

Esercizio 8.8 (Fibonacci). Si consideri il rapporto 𝑎 𝑛 = 𝐹𝐹𝑛+𝑛 1 di due termini successivi


della successione di Fibonacci: 𝐹0 = 1, 𝐹1 = 1, 𝐹𝑛+2 = 𝐹𝑛+1 + 𝐹𝑛 . Determinare il
limite di 𝑎 𝑛 .

Soluzione. La successione 𝑎 𝑛 soddisfa la relazione:

𝐹𝑛+2 𝐹𝑛+1 + 𝐹𝑛 𝐹𝑛 1
𝑎 𝑛+1 = = =1+ =1+ .
𝐹𝑛+1 𝐹𝑛+1 𝐹𝑛+1 𝑎𝑛

Inoltre 𝑎 0 = 𝐹2 /𝐹1 = 1. Dunque la successione 𝑎 𝑛 soddisfa le seguenti proprietà:


(
𝑎0 = 1
𝑎 𝑛+1 = 1 + 𝑎𝑛 .
1

Osserviamo che l’intervallo 𝐴 = (0 , +∞) è invariante per la funzione 𝑓 (𝑥) =


1 + 1/𝑥 . Infatti se 𝑥 ∈ 𝐴 allora 𝑥 > 0 ma anche 𝑓 (𝑥) = 1 + 1/𝑥 lo è. Su tale
intervallo, inoltre, la funzione 𝑓 è decrescente. Infatti

1 1 1 1
0<𝑥≤𝑦⇒ ≥ ⇒ 1 + ≥ 1 + ⇒ 𝑓 (𝑥) ≥ 𝑓 (𝑦).
𝑥 𝑦 𝑥 𝑦
350 8 successioni ricorsive

Visto che 𝑎 0 = 1 ∈ 𝐴, 𝐴 invariante, 𝑓 decrescente su 𝐴, il Teorema 8.7 ci dice


che le due successioni 𝑎 2𝑛 e 𝑎 2𝑛+1 sono monotone e quindi ammettono limite:
𝑎2𝑛 → ℓ , 𝑎 2𝑛+1 → ℓ 0 con ℓ , ℓ 0 ∈ [0 , +∞].

Se ℓ è finito si ha:
1 1
𝑎2𝑛+1 = 𝑓 (𝑎 2𝑛 ) = 1 + →1+
𝑎 2𝑛 ℓ
e quindi dato che 𝑎 2𝑛+1 → ℓ 0 si ha ℓ 0 = 1 + 1/ℓ . Inoltre

1 1 1
𝑎2𝑛+2 = 𝑓 (𝑎 2𝑛+1 ) = 1 + →1+ 0 =1+
𝑎2𝑛+1 ℓ 1+ 1

ℓ 2ℓ + 1
=1+ =
ℓ +1 ℓ +1
da cui, visto che 𝑎 2𝑛+2 → ℓ ,
2ℓ + 1
ℓ= .
ℓ +1
Moltiplicando ambo i membri per ℓ + 1 si ottiene

ℓ 2 + ℓ = 2ℓ + 1

ovvero ℓ 2 − ℓ − 1 = 0 da cui, utilizzando la formula risolutiva delle equazioni di


secondo grado, e ricordando che ℓ ≥ 0, si trova:

1+ 5
ℓ= .
2
Ma anche
√ √ √
0 1 ℓ +1 3+ 5 (3 + 5)(1 − 5)
ℓ =1+ = = √ =
ℓ ℓ 1+ 5 1−5
√ √ √
3−2 5−5 2+2 5 1+ 5
= = = = ℓ.
−4 4 2
Dunque entrambe le sottosuccessioni dei termini di indice pari e di indice
dispari convergono
√ allo stesso valore ℓ e quindi l’intera successione ci converge:
𝑎 𝑛 → (1 + 5)/2.

Il caso ℓ = +∞ si può escludere in quanto ripetendo il ragionamento fatto sopra


si otterrebbe ℓ 0 = 1 da cui: ℓ = 1 + 1/ℓ 0 = 2 che è una contraddizione.

Un metodo grafico per visualizzare l’andamento dei termini della successione


definita da (8.1) è il diagramma a ragnatela. Si disegna la curva 𝑦 = 𝑓 (𝑥) su
un piano cartesiano. Partendo dal punto di coordinate (𝛼, 0) = (𝑎 0 , 0) si
procede lungo una retta verticale fino a raggiungere il grafico della funzione
nel punto (𝑎 0 , 𝑓 (𝑎 0 )) = (𝑎 0 , 𝑎 1 ). Dopodiché si procede in orizzontale fino ad
incontrare la retta 𝑦 = 𝑥 nel punto (𝑎 1 , 𝑎 1 ) e si ripete il procedimento in modo
che le coordinate 𝑥 (ma anche le 𝑦 ) dei vertici della spezzata mi danno la
successione 𝑎 0 , 𝑎 1 , 𝑎 2 , . . . . Ad esempio il diagramma a ragnatela corrispondente
all’esercizio 8.8 è rappresentato in Figura 8.1.
8.1 equazioni ricorsive autonome del primo ordine 351

Figura 8.1: Diagramma a ragnatela


relativo all’esercizio 8.8: sul rapporto
dei termini successivi della successione
di Fibonacci.

(interagisci)

Esercizio 8.9. Si consideri la successione definita per ricorrenza


(
𝑎0 = 0
𝑎 𝑛+1 = 1 + 𝑎 𝑛2 .

Determinare il limite della successione.

Soluzione. L’equazione ricorsiva è 𝑎 𝑛+1 = 𝑓 (𝑎 𝑛 ) se poniamo 𝑓 (𝑥) = 1 + 𝑥 2 . E’


facile verificare che per ogni 𝑥 si ha 𝑓 (𝑥) > 𝑥 e quindi, per il Teorema 8.4
otteniamo che la successione 𝑎 𝑛 è crescente. Dunque ammette limite: 𝑎 𝑛 → ℓ .
Se il limite fosse finito si avrebbe

𝑎 𝑛+1 = 1 + 𝑎 𝑛2 → 1 + ℓ 2

e quindi, visto che 𝑎 𝑛+1 → ℓ , si avrebbe ℓ = 1 + ℓ 2 (cioè ℓ dovrebbe essere un


punto fisso di 𝑓 ). Questa equazione abbiamo già osservato che non ha soluzioni
( 𝑥 2 + 1 > 𝑥 ) e quindi ℓ non è finito. Visto che la successione 𝑎 𝑛 è crescente
possiamo escludere che sia ℓ = −∞ e quindi l’unica possibilità che rimane è che
𝑎 𝑛 → +∞.

Esercizio 8.10. Si consideri la successione definita per ricorrenza


(
𝑎0 = 1
𝑎 𝑛+1 = 4 − 𝑎𝑛 .
1

Determinare il limite della successione.

√ √
Soluzione. Si mostra che sull’intervallo 𝐴 = (2 − 3 , 2 + 3) vale 𝑓 (𝑥) > 𝑥 , che
gli estremi di 𝐴 sono punti fissi e inoltre che la funzione 𝑓 è crescente (lo è su
352 8 successioni ricorsive

Figura 8.2: Diagramma a ragnatela


relativo all’esercizio 8.9.

(interagisci)

tutto (0 , +∞)). Di conseguenza è facile verificare che 𝐴 è invariante, in quanto


si ha
√ √ √ √
2 − 3 < 𝑥 < 2 + 3 ⇒ 𝑓 (2 − 3) < 𝑓 (𝑥) < 𝑓 (2 + 3)
√ √
⇒ 2 − 3 < 𝑓 (𝑥) < 2 + 3.

Inoltre se 𝑎 0 ∈ 𝐴 allora per ogni 𝑛 ∈ ℕ si ha 𝑎 𝑛 ∈ 𝐴 ed essendo √


𝑓 (𝑥) > √
𝑥 la
successione sarà crescente. Dunque ammette limite: 𝑎 𝑛 → ℓ ∈ [2 − 3 , 2 + 3],
ℓ ≥ 𝑎 0 . Ma allora
1 1
𝑎 𝑛+1 = 4 − → 4 − = 𝑓 (ℓ )
𝑎𝑛 ℓ

√ 𝑎 𝑛+1 ha lo√stesso limite di 𝑎 𝑛 si ha ℓ = 𝑓 (ℓ ) le cui


e visto che √ uniche soluzioni
sono 2 ± 3. Ma √ 2 − 3 va scartata in quanto ℓ ≥ 𝑎 0 > 2 − 3 e quindi rimane
𝑎 𝑛 → ℓ = 2 + 3.

Esercizio 8.11. Si consideri la successione definita per ricorrenza


(
𝑎0 = 1
2
𝑎 𝑛+1 = 1 − 1
𝑎𝑛

Determinare, se esiste, il limite della successione.


8.1 equazioni ricorsive autonome del primo ordine 353

Figura 8.3: Diagramma a ragnatela


relativo all’esercizio 8.10.

(interagisci)

Soluzione. Osserviamo che:


1
𝑎0 =
2
1
𝑎1 = 1 − = −1
1/2
1
𝑎2 = 1 − =2
−1
1 1
𝑎3 = 1 − = = 𝑎0
2 2
Essendo 𝑎 3 = 𝑎 0 la successione si ripete e, (per induzione) si dimostra che
𝑎 3𝑛+𝑘 = 𝑎 𝑘 . Dunque si ha

1
𝑎 3𝑛 = 𝑎 0 =
2
𝑎 3𝑛+1 = 𝑎 1 = −1
𝑎 3𝑛+2 = 𝑎2 = 2

e la successione 𝑎 𝑛 non ammette limite.

Esercizio 8.12. Si consideri la successione definita per ricorrenza


(
𝑎0 = 0
5−𝑎 𝑛2
𝑎 𝑛+1 = 4 .

Determinare il limite della successione.

Soluzione. Si ha 𝑎 𝑛+1 = 𝑓 (𝑎 𝑛 ) se scegliamo 𝑓 (𝑥) = (5 − 𝑥 2 )/4. Osserviamo che


la funzione 𝑓 è decrescente per 𝑥 ≥ 0 (infatti 0 ≤ 𝑥 1 < 𝑥 2 implica 𝑥 12 < 𝑥 22 da
354 8 successioni ricorsive

Figura 8.4: Diagramma a ragnatela


relativo all’esercizio 8.11.

(interagisci)

Figura 8.5: Diagramma a ragnatela


relativo all’esercizio 8.12.

(interagisci)

cui −𝑥 12 > −𝑥 22 e quindi 𝑓 (𝑥 1 ) > 𝑓 (𝑥 2 )). Osserviamo inoltre che

𝑎0 = 0
5
𝑎1 = 𝑓 (𝑎1 ) =.
  4
5 5 − 25/16 55
𝑎2 = 𝑓 = =
4 4 64

Vogliamo dimostrare che l’intervallo 𝐴 = [0 , 5/4] è invariante. Visto che 𝑓 è


decrescente su tale intervallo, si ha:

5
0≤𝑥≤ ⇒ 𝑓 (0) ≥ 𝑓 (𝑥) ≥ 𝑓 (5/4)
4
5 55
⇒ ≥ 𝑓 (𝑥) ≥ ≥0
4 64
5
⇒ 0 ≤ 𝑓 (𝑥) ≤
4
cioè 𝑥 ∈ 𝐴 ⇒ 𝑓 (𝑥) ∈ 𝐴, che è quanto volevamo dimostrare.
8.1 equazioni ricorsive autonome del primo ordine 355

Per il Teorema 8.7 sappiamo dunque che 𝑎 2𝑛 → ℓ e 𝑎 2𝑛+1 → ℓ 0. Entrambi i limiti


sono finiti in quanto essendo 𝑎 𝑛 ∈ 𝐴 per ogni 𝑛 , si ha ℓ , ℓ 0 ∈ 𝐴¯ = 𝐴. Dunque,
come al solito, osserviamo che si ha:

𝑎2𝑛+1 = 𝑓 (𝑎 𝑛 ) → 𝑓 (ℓ )
𝑎2𝑛+2 = 𝑓 (𝑎 𝑛+1 ) → 𝑓 (ℓ 0)

ma sapendo che 𝑎 2𝑛+1 → ℓ 0 e 𝑎 2𝑛+2 → ℓ otteniamo il seguente sistema:


(
ℓ 0 = 𝑓 (ℓ )
ℓ = 𝑓 (ℓ 0)

da cui si ottiene 𝑓 ( 𝑓 (ℓ )) = ℓ e 𝑓 ( 𝑓 (ℓ 0)) = ℓ 0. Dunque vogliamo scrivere e


risolvere l’equazione 𝑓 ( 𝑓 (𝑥)) = 𝑥 :
 2
5−𝑥 2
5− 4
=𝑥
4
cioè
25 − 10 𝑥 2 + 𝑥 4
5− = 4𝑥
16
ovvero
𝑥 4 − 10 𝑥 2 + 64 𝑥 − 55 = 0.

Come facciamo a risolvere una equazione di quarto grado? In questo frangente


dobbiamo fare una osservazione di carattere generale che ci sarà di grande aiuto.
Osserviamo che se 𝑥 è una soluzione di 𝑓 (𝑥) = 𝑥 allora 𝑥 è anche soluzione
di 𝑓 ( 𝑓 (𝑥)) = 𝑥 in quanto in tal caso si ha 𝑓 ( 𝑓 (𝑥)) = 𝑓 (𝑥) = 𝑥 . Ma l’equazione
𝑓 (𝑥) = 𝑥 è una equazione di secondo grado, che quindi possiamo facilmente
risolvere:

5 − 𝑥2
=𝑥
4
𝑥 2 + 4𝑥 − 5 = 0

𝑥 12 = −2 ± 4 + 5 = −2 ± 3 .

Dunque abbiamo trovato due zeri del polinomio di quarto grado e tale polinomio
deve essere quindi divisibile per

𝑥 2 + 4 𝑥 − 5 = (𝑥 − 1)(𝑥 + 5).
356 8 successioni ricorsive

Eseguiamo la divisione tra polinomi:

𝑥 4 − 10𝑥 2 + 64 𝑥 − 55 𝑥 4 − 10 𝑥 2 + 64 𝑥 − 55 − 𝑥 2 (𝑥 2 + 4 𝑥 − 5)
= 𝑥 2
+
𝑥 2 + 4𝑥 − 5 𝑥 2 + 4𝑥 − 5
−4𝑥 − 5 𝑥 + 64 𝑥 − 55
3 2
= 𝑥2 +
𝑥 2 + 4𝑥 − 5
− 4 𝑥 3 − 5 𝑥 2 − 64 𝑥 − 55 + 4 𝑥(𝑥 2 + 4 𝑥 − 5)
= 𝑥 2 − 4𝑥 +
𝑥 2 + 4𝑥 − 5
11 𝑥 + 44 𝑥 − 55
2
= 𝑥 2 − 4𝑥 +
𝑥 2 + 4𝑥 − 5
= 𝑥 − 4 𝑥 + 11.
2

Come previsto la divisione non ha resto. Possiamo quindi completare la


scomposizione cercando gli zeri del polinomio 𝑥 2 − 4 𝑥 + 11 che però, da un
rapido controllo, non ha soluzioni reali.

Dunque in questo caso i punti fissi di 𝑓 coincidono con i punti fissi di 𝑓 ◦ 𝑓


e dunque i due limiti ℓ , ℓ 0 devono essere elementi dell’insieme dei punti fissi:
{1 , −5}. D’altra parte −5 deve essere escluso in quanto i limiti stanno entrambi
nella chiusura dell’insieme invariante, che non comprende numeri negativi.

Concludiamo quindi che ℓ = ℓ 0 = 1 e dunque l’intera successione ha limite:


𝑎 𝑛 → 1.

Esercizio 8.13. Si consideri la successione definita per ricorrenza


(
𝑎0 = 𝛼
𝑎 𝑛+1 = 2 − 𝑎 𝑛2 .

Determinare il limite della successione nei casi: 𝛼 = −7, 𝛼 = 4 e 𝛼 = 1/42.

Soluzione. Abbiamo 𝑎 𝑛+1 = 𝑓 (𝑎 𝑛 ) con 𝑓 (𝑥) = 2 − 𝑥 2 . Determiniamo i punti fissi


di 𝑓 :
2 − 𝑥 2 = 𝑥, 𝑥2 + 𝑥 − 2 = 0

che ha come soluzioni 𝑥 1,2 = −1±2 1+8 cioé 𝑥 1 = −2, 𝑥 2 = 1. Tenendo conto anche
dei segni si può osservare che all’interno delle due soluzioni si ha 𝑓 (𝑥) > 𝑥
mentre all’esterno si ha 𝑓 (𝑥) < 𝑥 .

Osserviamo inoltre che 𝑓 (𝑥) è crescente per 𝑥 ≤ 0 e decrescente per 𝑥 ≥ 0.

Caso 𝛼 = −7. In questo caso consideriamo l’intervallo 𝐴 = (−∞, −2). Visto che
𝑓 è crescente su questo intervallo, e visto che −2 è un punto fisso si ha:

𝑥 < −2 ⇒ 𝑓 (𝑥) < 𝑓 (−2) ⇒ 𝑓 (𝑥) < −2

che significa che 𝐴 è un intervallo invariante.

Su questo intervallo si ha 𝑓 (𝑥) < 𝑥 e quindi 𝑎 𝑛 è decrescente e di conseguenza


ammette limite 𝑎 𝑛 → ℓ . Il limite può essere finito oppure −∞. Ma se fosse
finito allora avremmo
𝑎 𝑛+1 = 2 − 𝑎 𝑛2 → 2 − ℓ 2
8.1 equazioni ricorsive autonome del primo ordine 357

Figura 8.6: Diagramma a ragnatela


relativo all’esercizio 8.13.

(interagisci)

e siccome 𝑎 𝑛+1 → ℓ avremmo ℓ = 2 − ℓ 2 cioè ℓ è un punto fisso di 𝑓 . Ma visto


che ℓ ≤ 𝑎 1 = 𝛼 < 𝑥 1 < 𝑥 2 otteniamo un assurdo.

Dunque l’unica possibilità è che 𝑎 𝑛 → −∞. Questo stesso ragionamento vale


per ogni 𝛼 < −2.

Caso 𝛼 = 4. In questo caso si ha:

𝑎0 = 𝛼 = 4
𝑎1 = 𝑓 (𝑎0 ) = 2 − 42 = −14.

quindi 𝑎 1 ∈ 𝐴 (l’intervallo invariante del punto precedente) e dall’indice 2 in


poi ci si riconduce quindi ai risultati precedenti. Dunque anche in questo caso
𝑎 𝑛 → −∞.

Caso 𝛼 = 42 1
. Questo caso è decisamente più complesso dei precedenti. Pren-
diamo l’insieme 𝐴2 = [−2 , 2]: vogliamo dimostrare che è un insieme invariante.
Nell’intervallo [−2 , 0] la funzione è crescente e quindi ha minimo in −2 dove
vale 𝑓 (−2) = −2 ed ha massimo in 0 dove assume il valore 𝑓 (0) = 2. Nell’in-
tervallo [0 , 2] la funzione è decrescente e, di nuovo, ha massimo 𝑓 (0) = 2 e
minimo 𝑓 (2) = −2. Dunque per ogni 𝑥 ∈ [−2 , 2] si ha 𝑓 (𝑥) ∈ [−2 , 2] cioè, come
volevamo dimostrare, 𝐴2 è invariante.

Dunque visto che 𝑎 0 = 𝛼 ∈ 𝐴2 scopriamo che per ogni 𝑛 si ha 𝑎 𝑛 ∈ [−2 , 2].


Supponiamo ora che la successione abbia limite: 𝑎 𝑛 → ℓ . In tal caso, passando
al limite nell’equazione 𝑎 𝑛+1 = 𝑓 (𝑎 𝑛 ) otteniamo, come al solito, che il limite
dovrebbe essere un punto fisso di 𝑓 : o ℓ = −2 oppure ℓ = 1. Cercheremo ora
di dimostrare che questo è assurdo. Ci sono due possibilità che dobbiamo
escludere. La prima è che la successione tenda al punto fisso ℓ senza mai
358 8 successioni ricorsive

uguagliarlo. La seconda è che per un certo 𝑛0 si abbia 𝑎 𝑛 = ℓ per 𝑛 = 𝑛0 e


quindi per ogni 𝑛 ≥ 𝑛0 .

Supponiamo di essere nel primo caso e supponiamo che ℓ = −2. In tal caso, per
il teorema della permanenza del segno la successione deve, da un certo indice in
poi, stare nell’intervallo [−2 , 0]. Ma in tale intervallo si ha 𝑓 (𝑥) > 𝑥 e quindi la
successione sarebbe, da un certo indice in poi, crescente. Ma visto che 𝑎 𝑛 ≥ −2
per ogni 𝑛 , non è possibile che la successione converga, crescendo, a −2.

Supponiamo allora di essere nel primo caso (la successione è sempre diversa
dai due punti fissi) e supponiamo che ℓ = 1. In questo caso da un certo indice
in poi la successione deve stare nell’intervallo [0 , 2] (altrimenti non potrebbe
convergere a 1. In tale intervallo la funzione 𝑓 è decrescente e quindi le
sottosuccessioni dei termini pari e dei termini dispari sono entrambe monotone.
Si potrebbe cercare di studiare le successioni dei termini pari 𝑎 2𝑛 e dispari 𝑎 2𝑛+1
che soddisfano una relazione di ricorrenza con la funzione 𝑓 ◦ 𝑓 al posto di 𝑓
e osservare che la successione che si trova a sinistra del punto fisso dovrebbe
decrescere e quella che si trova a destra dovrebbe crescere (e questo sarebbe
assurdo). Un metodo forse più rapido che non richiede lo studio della funzione
composta è invece il seguente. L’idea è di osservare che 𝑓 tende ad aumentare
le distanze quando ci si trova nei paraggi del punto 1. Se per assurdo 𝑎 𝑛 → 1
allora definitivamente si dovrà avere |𝑎 𝑛 − 1 | < 1/2. Ma allora si osserva che:

3
|𝑎 𝑛+1 − 1 | = 2 − 𝑎 𝑛2 − 1 = 1 − 𝑎 𝑛1 = | 1 + 𝑎 𝑛 | · | 1 − 𝑎 𝑛 | ≥

|𝑎 𝑛 − 1 |
2
in quanto se |𝑎 𝑛 − 1 | < 1/2 allora (per la disuguaglianza triangolare inversa)
| 1 + 𝑎 𝑛 | ≥ 32 . Questo è assurdo perché significa che |𝑎 𝑛 − 1 | → +∞ (per il
criterio del rapporto) quando invece dovrebbe essere |𝑎 𝑛 − 1 | → 0.

Nota. Vedremo nei prossimi teoremi che se la derivata di 𝑓 è in valore assoluto


minore di 1 allora il punto fisso sarà stabile (o attrattivo) cioè partendo da un
punto sufficientemente vicino si convergerà necessariamente al punto fisso. Se
invece la derivata è in valore assoluto maggiore di 1 il punto fisso sarà instabile
(o repulsivo). Cioè, a parte la successione costante che assume il valore esatto
del punto fisso, non è possibile che una successione converga al punto fisso.

Rimane da considerare la possibilità che la successione assuma da un certo


punto in poi il valore esatto di un punto fisso. Supponiamo ad esempio che per
un certo 𝑛 si abbia 𝑎 𝑛 = 1. Allora si deve avere

1 = 𝑎 𝑛 = 2 − (𝑎 𝑛−1 )2

da cui
𝑎 𝑛−1 = ±1.
Se 𝑎 𝑛 era il primo termine con valore 1 dovrà necessariamente essere 𝑎 𝑛−1 = −1.
Ma allora
−1 = 𝑎 𝑛−1 = 2 − (𝑎 𝑛−2 )2

da cui 𝑎 𝑛−2 = ± 3. Ma ora osserviamo che essendo 𝑎 0 = 𝛼 = 42 1
un numero
razionale, e osservando che ℚ è un insieme invariante per 𝑓 (perché? verificare

per induzione...) sappiamo che ogni 𝑎 𝑘 ∈ ℚ e quindi avremmo 𝑎 𝑛2 = 3 ∈ ℚ:
assurdo.
8.1 equazioni ricorsive autonome del primo ordine 359

Figura 8.7: Diagramma a ragnatela


relativo all’esercizio 8.14.

(interagisci)

Stesso discorso si può fare√se si avesse 𝑎 𝑛 = −2, in quanto si avrebbe 𝑎 𝑛−1 = 2,


𝑎 𝑛−2 = 0 e quindi 𝑎 𝑛−3 = ± 2.

Dunque la successione 𝑎 𝑛 non ammette limite.

Esercizio 8.14. Si consideri la successione definita per ricorrenza


(
𝑎0 = 𝛼
𝑎 𝑛+1 = 1
2−𝑎 𝑛 .

Trovare il limite della successione nel caso 𝛼 = −2021. Determinare l’insieme dei valori
di 𝛼 per i quali la successione 𝑎 𝑛 non è ben definita (in quanto per un qualche 𝑛 il
denominatore 2 − 𝑎 𝑛 si annulla). Trovare il limite nel caso 𝛼 = 2021
1000 .

Soluzione. Posto 𝑓 (𝑥) = 1/(2 − 𝑥) si osserva che la disequazione 𝑓 (𝑥) ≥ 𝑥


è verificata per ogni 𝑥 < 2. L’equazione di punto fisso 𝑓 (𝑥) = 𝑥 ha come
unica soluzione 𝑥 = 1. Sull’intervallo 𝐴 = (−∞, 1) la funzione 𝑓 è crescente e
l’intervallo risulta essere invariante. Dunque per 𝛼 = −2021 ∈ 𝐴 la successione
risulta essere crescente e superiormente limitata. Dunque converge 𝑎 𝑛 → ℓ .
Passando al limite in 𝑎 𝑛+1 = 𝑓 (𝑎 𝑛 ) si trova che ℓ deve essere un punto fisso di 𝑓
e quindi ℓ = 1.

La successione non è ben definita se per qualche 𝑛 si trovasse 𝑎 𝑛 = 2 in quanto


la funzione 𝑓 non è definita per 𝑥 = 2. Altri valori si ottengono risalendo
all’indietro la successione 𝑎 𝑛 . Dalla equazione

1
𝑎𝑛 =
2 − 𝑎 𝑛−1
360 8 successioni ricorsive

si ricava
1
𝑎 𝑛−1 = 2 − .
𝑎𝑛
L’insieme dei punti partendo da quali si arriva prima o poi in 𝑥 = 2 è dato
dunque dai valori della successione
(
𝑏1 = 2
𝑏 𝑛+1 = 2 − 𝑏𝑛 .
1

Osserviamo che in questo caso specifico è possibile ricavare una formula esplicita
per il termine 𝑏 𝑛 . Osserviamo infatti che:

3 4
𝑏0 = 2, 𝑏1 = , 𝑏2 =
2 3

e proviamo a congetturare che sia 𝑏 𝑛 = 𝑛+1


𝑛 . In effetti questo si può dimostrare
per induzione. Per 𝑛 = 1 si ha (𝑛 + 1)/𝑛 = 2 = 𝑏 1 . E se supponiamo che valga
𝑏 𝑛 = (𝑛 + 1)/𝑛 si ha

𝑛 2𝑛 + 2 − 𝑛 𝑛+2
𝑏 𝑛+1 = 2 − = = .
𝑛+1 𝑛+1 𝑛+1
Dunque l’insieme dei punti partendo dai quali la successione 𝑎 𝑛 non è ben
definita è dato da:
𝑛+1
 
𝑋= :𝑛∈ℕ .
𝑛

Per il caso 𝛼 = 1000


2021
osserviamo che sull’intervallo 𝐴2 = (1 , 2) si ha sempre
𝑓 (𝑥) > 𝑥 (ma si potrebbe osservare che 𝐴2 non è invariante). Finché 𝑎 𝑛 rimane
in tale intervallo la successione risulta quindi crescente. Però non è possibile
che la successione rimanga sempre in 𝐴2 perché in tal caso il limite dovrebbe
essere un punto fisso. Ma l’unico punto fisso è 1 che è minore di 𝛼 e quindi la
successione, crescente, non può convergere. Necessariamente la successione
esce dall’intervallo 𝐴2 (in effetti notiamo che 𝛼 ∉ 𝑋 ) e, per un certo 𝑛 si avrà
𝑎 𝑛 > 2. Osserviamo ora che sull’intervallo 𝐴3 = (2 , +∞) si ha 𝑓 (𝑥) < 0 e
dunque se 𝑎 𝑛 ∈ 𝐴2 necessarimante 𝑎 𝑛+1 ∈ 𝐴. Dunque questo caso si riconduce
al primo studiato, e la successione tende a 1.

Esercizio 8.15. Si consideri la successione definita per ricorrenza


(
𝑎0 = 𝛼
𝑎 𝑛2 −𝑎 𝑛
𝑎 𝑛+1 = 2 .

Determinare al variare di 𝛼 il limite della successione.

Esercizio 8.16. Si consideri la successione definita per ricorrenza


(
𝑎0 = 𝛼
𝑎 𝑛+1 = 1 − 𝑎 𝑛2 .

Determinare al variare di 𝛼 il limite della successione.


8.1 equazioni ricorsive autonome del primo ordine 361

Esercizio 8.17. Calcolare


1
1+ 1
1+ 1
1+ 1
1+ ...

Esercizio 8.18. Calcolare


s r

q
lim+ 𝑥− 𝑥− 𝑥 − 𝑥 −...
𝑥→1

Esercizio 8.19 (Mandelbrot reale). Si consideri, fissato il parametro 𝑐 , la successione


definita per ricorrenza: (
𝑎0 = 0
𝑎 𝑛+1 = 𝑎 𝑛2 + 𝑐.

Determinare i valori di 𝑐 ∈ ℝ per i quali la successione 𝑎 𝑛 risulta essere limitata.

Svolgimento. Caso 1: 𝑐 > 14 . In tal caso non ci sono punti fissi, in quanto
l’equazione 𝑥 = 𝑥 2 + 𝑐 ha discriminante negativo. Significa che 𝑥 2 + 𝑐 > 𝑥 per
ogni 𝑥 ∈ ℝ. Dunque la successione 𝑎 𝑛 è strettamente crescente e tende a +∞.
Non è limitata.

Caso 2: 0 ≤ 𝑐 ≤ 14 . In questo caso l’equazione 𝑥 = 𝑥 2 + 𝑐 ha due soluzioni


entrambe positive (le soluzioni hanno somma 1 e prodotto 𝑐 ≥ 0). Se chiamiamo
𝑥1 la più piccola delle due soluzioni possiamo dimostrare che l’intervallo [0 , 𝑥1 )
è invariante. Infatti su tali intervallo la funzione 𝑓 (𝑥) = 𝑥 2 + 𝑐 è crescente,
dunque se 0 ≤ 𝑥 < 𝑥 1 si ha 𝑓 (0) ≤ 𝑓 (𝑥) < 𝑓 (𝑥 1 ) cioè 𝑐 ≤ 𝑓 (𝑥) < 𝑥 1 . Visto
che 𝑐 ≥ 0 abbiamo mostrato che l’intervallo è invariante e la successione è
dunque limitata. Se 𝑐 = 0 la successione 𝑎 𝑛 rimane costante 𝑎 𝑛 = 0. Se 𝑐 > 0 la
successione converge al punto fisso 𝑥 1 . In ogni caso è limitata.

Caso 3: −1 ≤ 𝑐 < 0. In questo caso vogliamo mostrare che l’intervallo [𝑐, 0] è


invariante. La funzione 𝑓 (𝑥) = 𝑥 2 + 𝑐 è decrescente su tale intervallo, dunque
se 𝑐 ≤ 𝑥 ≤ 0 risulta 𝑓 (0) ≤ 𝑥 ≤ 𝑓 (𝑐). Ma 𝑓 (0) = 𝑐 e 𝑓 (𝑐) = 𝑐 2 + 𝑐 = 𝑐(𝑐 + 1) ≤ 0
se 𝑐 ≥ −1. Dunque [𝑐, 0] è invariante e 𝑎 𝑛 rimane limitata in tale intervallo.

Caso 4: −2 ≤ 𝑐 < −1. In questo caso l’equazione 𝑥 = 𝑥 2 + 𝑐 ha una soluzione


negativa ed una soluzione positiva. Chiamiamo 𝑥 2 la soluzione positiva.
Vogliamo mostrare che l’intervallo [𝑐, 𝑥 2 ] è invariante. La funzione 𝑓 (𝑥) = 𝑥 2 + 𝑐
è decrescente in [𝑐, 0] e crescente in [0 , 𝑥 2 ]. Se 0 ≤ 𝑥 ≤ 𝑥 2 si ha dunque
𝑓 (0) ≤ 𝑓 (𝑥) ≤ 𝑓 (𝑥2 ) cioè 𝑐 ≤ 𝑓 (𝑥) ≤ 𝑥2 . Dunque i punti in [0, 𝑥2 ] rimangono
nell’intervallo [𝑐, 𝑥 2 ]. Se invece 𝑐 ≤ 𝑥 ≤ 0 si ha 𝑓 (0) ≤ 𝑓 (𝑥) ≤ 𝑓 (𝑐) cioè
𝑐 ≤ 𝑓 (𝑥) ≤ 𝑐 2 + 𝑐 . Affinché sia 𝑐 2 + 𝑐 ≤ 𝑥2 basta verificare che 𝑓 (𝑐 2 + 𝑐) ≤ 𝑐 2 + 𝑐
cioè:
(𝑐 2 + 𝑐)2 + 𝑐 ≤ 𝑐 2 + 𝑐
che, sviluppando il quadrato, si riduce a 𝑐 3 (𝑐 + 2) ≤ 0 che è verificata se
−2 ≤ 𝑐 ≤ 0. Dunque l’intervallo [𝑐, 𝑥2 ] è invariante. La successione rimane
dunque limitata in tale intervallo.
362 8 successioni ricorsive

Caso 5: 𝑐 < −2. In questo caso 𝑎 0 = 0, 𝑎 1 = 𝑐 , 𝑎 2 = 𝑐 2 + 𝑐 e possiamo verificare


che 𝑐 2 + 𝑐 > 𝑥 2 in quanto, come nel caso precedente, questo accade se

(𝑐 2 + 𝑐)2 + 𝑐 > 𝑐 2 + 𝑐

che si riduce a 𝑐 3 (𝑐 + 2) > 0 che è verificata se 𝑐 < −2. Ma l’intervallo (𝑥 2 , +∞)


è invariante e su tale intervallo si ha 𝑓 (𝑥) > 𝑥 dunque la successione 𝑎 𝑛 è
strettamente crescente per 𝑛 ≥ 2 e diverge a +∞. Non è dunque limitata.

Conclusione. La successione è limitata se 𝑐 ∈ [−2 , 1/4]. Altrimenti 𝑎 𝑛 → +∞.

8.2 approfondimenti

I risultati esposti finora non richiedevano alcuna nozione del calcolo differenziale
e potevano essere compresi utilizzando solamente le nozioni del capitolo 2.5.
In questo capitolo useremo invece alcuni concetti che riguardano il calcolo
differenziale.

Teorema 8.20 (criterio per la stabilità di un punto fisso). Sia 𝑥 0 ∈ ℝ, 𝑅 > 0,


𝐼 = (𝑥0 − 𝑅, 𝑥0 + 𝑅) e 𝑓 : 𝐼 → ℝ una funzione che ha 𝑥0 come punto fisso. Se 𝑓
è 𝐿-lipschitziana su 𝐼 con 𝐿 < 1 allora 𝐼 è un intervallo invariante per 𝑓 e se 𝑎 𝑛 è
una successione che soddisfa la relazione di ricorrenza 𝑎 𝑛+1 = 𝑓 (𝑎 𝑛 ) con 𝑎 0 ∈ 𝐼 allora
𝑎 𝑛 → 𝑥0 per 𝑛 → +∞.

In particolare se 𝑓 ∈ 𝐶 1 (𝐼) con punto fisso 𝑥 0 ∈ 𝐼 e sup {| 𝑓 0(𝑥)| : 𝑥 ∈ 𝐼} < 1 allora 𝐼


è invariante ed ogni successione 𝑎 𝑛 definita per ricorrenza da 𝑎 𝑛+1 = 𝑓 (𝑎 𝑛 ) con 𝑎 0 ∈ 𝐼
converge ad 𝑥 0 .

Ancora più in particolare, se 𝑓 è di classe 𝐶 1 in un intorno di un punto 𝑥 0 , se 𝑥 0 è


punto fisso di 𝑓 e | 𝑓 0(𝑥 0 )| < 1 allora esiste un intorno 𝐼 di 𝑥 0 che è invariante per 𝑓 e
ogni successione 𝑎 𝑛 definita per ricorrenza tramite 𝑎 𝑛+1 = 𝑓 (𝑎 𝑛 ) con 𝑎 0 ∈ 𝐼 converge
ad 𝑥 0 .

Dimostrazione. Osserviamo che se 𝑓 è di classe 𝐶 1 in un intorno di 𝑥 0 e | 𝑓 0(𝑥 0 )| <


1 allora, per continuità, esiste 𝐿 < 1 tale | 𝑓 0(𝑥)| < 𝐿 per ogni 𝑥 in un intorno 𝐼 di
𝑥0 . Dunque sup {| 𝑓 0(𝑥)| : 𝑥 ∈ 𝐼} ≤ 𝐿 < 1 e la funzione 𝑓 risulta dunque essere
𝐿-lipschitziana. E’ chiaro quindi che la seconda e la terza parte del teorema si
riconducono alla prima, che è quella che andremo ora a dimostrare.

Se 𝑓 è 𝐿-lipschitziana e 𝑥 0 è punto fisso di 𝑓 osserviamo che si ha

| 𝑓 (𝑥) − 𝑥 0 | = | 𝑓 (𝑥) − 𝑓 (𝑥0 )| ≤ 𝐿|𝑥 − 𝑥0 |

da cui se |𝑥 − 𝑥 0 | < 𝑅 anche | 𝑓 (𝑥) − 𝑥 0 | < 𝑅 . Dunque 𝐼 = (𝑥 0 − 𝑅, 𝑥 0 + 𝑅) è


invariante. Possiamo poi dimostrare per induzione che risulta

|𝑎 𝑛 − 𝑥0 | ≤ 𝐿𝑛 · |𝑎0 − 𝑥0 |.
8.3 equazioni ricorsive lineari 363

Infatti per 𝑛 = 0 la relazione è una uguaglianza. Il passo induttivo si ottiene


osservando che

|𝑎 𝑛+1 − 𝑥0 | = | 𝑓 (𝑎 𝑛 ) − 𝑓 (𝑥0 )| ≤ 𝐿|𝑎 𝑛 − 𝑥0 |


≤ 𝐿 · 𝐿𝑛 |𝑎 0 − 𝑥0 | = 𝐿𝑛+1 |𝑎 0 − 𝑥0 |.

Ma ora se 𝐿 < 1 si ha 𝐿𝑛 → 0 e dunque |𝑎 𝑛 − 𝑥 0 | → 0 come volevamo


dimostrare.

Teorema 8.21 (instabilità del punto fisso). Sia 𝑓 di classe 𝐶 1 in un intorno di un


suo punto fisso 𝑥 0 . Se | 𝑓 0(𝑥 0 )| > 1 allora non esiste una successione 𝑎 𝑛 che soddisfa la
relazione ricorsiva 𝑎 𝑛+1 = 𝑓 (𝑎 𝑛 ) e tale che 𝑎 𝑛 → 𝑥 0 a meno che non si abbia 𝑎 𝑛 = 𝑥 0
da un certo indice 𝑛 in poi.

Dimostrazione. Per continuità della derivata esisterà 𝐿 > 1 e un intervallo 𝐼


intorno di 𝑥 0 tale che per ogni 𝑥 ∈ 𝐼 si abbia | 𝑓 0(𝑥)| > 1. Se 𝑎 𝑛 → 𝑥 0 allora
da un certo indice 𝑛 in poi si avrà 𝑎 𝑛 ∈ 𝐼 . Se 𝑎 𝑛 verifica la relazione ricorsiva
𝑎 𝑛+1 = 𝑓 (𝑎 𝑛 ) possiamo allora applicare il teorema di Lagrange per ottenere che
per ogni 𝑛 esiste 𝑏 𝑛 compreso tra 𝑥 0 e 𝑎 𝑛 tale che:

|𝑎 𝑛+1 − 𝑥0 | = | 𝑓 (𝑎 𝑛 ) − 𝑓 (𝑥0 )| = | 𝑓 0(𝑏 𝑛 )(𝑎 𝑛 − 𝑥0 )|


≥ 𝐿 · |𝑎 𝑛 − 𝑥0 | ≥ |𝑎 𝑛 − 𝑥 0 |.

Risulta quindi che la distanza |𝑎 𝑛 − 𝑥 0 | deve essere crescente e quindi l’unica


possibilità perché 𝑎 𝑛 → 𝑥 0 è che sia 𝑎 𝑛 = 𝑥 0 .

8.3 equazioni ricorsive lineari

Fissate le costanti 𝑐 0 , 𝑐 1 , . . . , 𝑐 𝑛 , con 𝑐 𝑛 ≠ 0, diremo che l’equazione ricorsiva:


equazione ricorsiva lineare
𝑐 𝑛 · 𝑎 𝑘+𝑛 + 𝑐 𝑛−1 · 𝑎 𝑘+𝑛−1 + · · · + 𝑐1 · 𝑎 𝑘+1 + 𝑐 0 · 𝑎 𝑘 = 0 (8.4)
è una equazione ricorsiva lineare (omogenea) di ordine 𝑛 . Il polinomio 𝑃 con gli
stessi coefficienti:

𝑃(𝜆) = 𝑐 𝑛 · 𝜆𝑛 + 𝑐 𝑛−1 · 𝜆𝑛−1 + · · · + 𝑐1 · 𝜆 + 𝑐0 polinomio caratteristico

si chiama polinomio caratteristico associato all’equazione lineare (8.4).

Ad esempio la successione di Fibonacci 𝐹 𝑘 definita da (8.2) è una soluzione


dell’equazione ricorsiva lineare del secondo ordine:

𝑎 𝑘+2 − 𝑎 𝑘+1 − 𝑎 𝑘 = 0

il cui polinomio caratteristico è

𝑃(𝜆) = 𝜆2 − 𝜆 − 1.
364 8 successioni ricorsive

Teorema 8.22 (indipendenza delle successioni esponenziali). Siano 𝜆1 , . . . , 𝜆𝑛


numeri complessi distinti. Allora le successioni 𝒂 𝑗 definite da

𝒂 𝑗 (𝑘) = 𝜆 𝑘𝑗

sono vettori indipendenti nello spazio vettoriale complesso ℂℕ di tutte le successioni a


valori complessi.

Dimostrazione. Dobbiamo mostrare che se una combinazione lineare delle


successioni 𝒂 𝑗 è nulla allora tutti i coefficienti sono nulli. Supponiamo quindi
di avere 𝑐 1 , . . . , 𝑐 𝑛 ∈ ℂ tali che
𝑛
X
𝑐 𝑗 𝒂 𝑗 = 0 ∈ ℂℕ .
𝑗=1

Significa che per ogni 𝑘 ∈ ℕ si ha


𝑛
𝑐 𝑗 𝜆 𝑘𝑗 = 0
X
(8.5)
𝑗=1

Dunque per ogni 𝑘 ∈ ℕ e per ogni 𝑧 ∈ ℂ si ha


𝑛
𝑐 𝑗 𝜆 𝑘𝑗 𝑧 𝑘 = 0.
X
(8.6)
𝑗=1

Sia ora 𝑅 = 1/max {|𝜆1 |, . . . , |𝜆𝑛 |} (almeno uno dei 𝜆 𝑗 è non nullo perché i
𝜆 𝑗 sono distinti e possiamo assumere 𝑛 > 1 altrimenti il teorema è banale).
Se |𝑧| < 𝑅 si ha 𝜆 𝑗 𝑧 < 1 per ogni 𝑗 , e la serie geometrica 𝜆 𝑘𝑗 𝑧 𝑘 risulta
P
quindi essere assolutamente convergente. Possiamo quindi fare la somma su 𝑘
dell’uguaglianza (8.6), scambiare le somme e ottenere, per ogni 𝑧 :
𝑛 X
X +∞ 𝑘
𝑐 𝑗 𝜆𝑗 𝑧 = 0.
𝑗=1 𝑘=0

Calcolando la somma della serie geometrica si ottiene, per ogni 𝑧 con |𝑧| < 𝑅 :
𝑛
X 𝑐𝑗
= 0.
𝑗=1
1 − 𝜆𝑗 𝑧

Scegliamo ora un indice 𝑚 cui 𝑅 = 1/|𝜆𝑚 | e posto 𝑧 = 𝑡/𝜆𝑚 osserviamo che per
𝑡 ∈ [0 , 1) si ha |𝑧| < 𝑅 , dunque possiamo fare il limite per 𝑡 → 1− ed ottenere :
𝑛
X 𝑐𝑗
lim− = 0.
𝑡→1
𝑗=1 1 − 𝜆 𝑗 𝜆𝑡𝑚

Ma se 𝑗 ≠ 𝑚 si ottiene un limite finito:


𝑐𝑗 𝑐𝑗
lim− = = ℓ𝑗 ∈ ℂ
𝑡→1 1 − 𝜆 𝑗 𝜆𝑡𝑚 1−
𝜆𝑗
𝜆𝑚
8.3 equazioni ricorsive lineari 365

e dunque, visto che la somma dei limite è nulla, anche per 𝑗 = 𝑚 si deve ottenere
un limite finito. Ma per 𝑗 = 𝑚 si ottiene invece
𝑐𝑚
lim−
𝑡→1 1−𝑡

che è finito solo se 𝑐 𝑚 = 0.

Ma se 𝑐 𝑚 = 0 ci siamo ricondotti ad avere una combinazione lineare nulla di


𝑘 ) e dunque, per induzione, si
𝑛 − 1 successioni esponenziali (si può togliere 𝜆𝑚
può ripetere il procedimento e scoprire che anche tutti gli altri coefficienti sono
nulli.

dimostrazione alternativa. Valutando l’equazione (8.5) per 𝑘 = 0 , . . . , 𝑛 − 1 si


ottiene

𝑐1 + 𝑐 2 𝜆1 + · · · + 𝑐 𝑛 𝜆1𝑛 = 0
𝑐1 + 𝑐 2 𝜆2 + · · · + 𝑐 𝑛 𝜆2𝑛 = 0
..
.
𝑐 1 + 𝑐2 𝜆𝑛 + · · · + 𝑐 𝑛 𝜆𝑛𝑛 = 0
Vandermonde
che è un sistema lineare la cui matrice associata è la matrice di Vandermonde

1 𝜆1 𝜆21 ... 𝜆1𝑛


­1 𝜆 2 𝜆22 ... 𝜆2𝑛 ®
© ª
𝑉 = ­­ . . .. .. .. ®®
­ .. .. . . . ®
«1 𝜆 𝑛 𝜆2𝑛 ... 𝜆𝑛𝑛 ¬

che notoriamente (lo si può dimostrare per induzione) ha determinante

𝑗−1
𝑛 Y
Y
det 𝑉 = (𝜆 𝑗 − 𝜆 𝑘 )
𝑗=2 𝑘=1

e dunque è invertibile se e solo se i 𝜆 𝑗 sono tra loro distinti.

Dunque 𝑐 1 = 𝑐 2 = · · · = 𝑐 𝑛 = 0 è l’unica soluzione del sistema lineare.

Teorema 8.23 (dimensione delle soluzioni). L’insieme 𝑊 di tutte le successioni


soluzioni dell’equazione (8.4) di ordine 𝑛 è un sottospazio vettoriale di dimensione 𝑛
dello spazio ℂℕ di tutte le sottosuccessioni.

Dimostrazione. Denotiamo con 𝒂 ∈ ℂℕ la successione 𝑎 𝑘 = 𝒂(𝑘). L’insieme 𝑊


delle soluzioni dell’equazione (8.4) è un sottospazio vettoriale di ℂℕ in quanto
se 𝒂 e 𝒃 sono soluzioni anche 𝒂 + 𝒃 è soluzione e se 𝒂 è soluzione anche 𝑡 𝒂 è
soluzione per ogni 𝑡 ∈ ℂ (si faccia la verifica). jet

Consideriamo allora l’operatore (chiamato jet) 𝐽 : 𝑊 → ℂ𝑛 definito da

𝐽(𝒂) = (𝒂(0), 𝒂(1), . . . , 𝒂(𝑛 − 1)).


366 8 successioni ricorsive

E’ facile verificare che 𝐽 è un operatore lineare in quanto la valutazione di una


funzione in un punto è una operazione lineare.

Vogliamo ora determinare

ker 𝐽 = {𝒂 ∈ 𝑊 : 𝐽(𝒂) = 0}.

Se 𝒂 ∈ ker 𝐽 significa che i primi 𝑛 termini della successione 𝑎 0 , 𝑎 1 , . . . , 𝑎 𝑛−1


sono tutti nulli. Ma se 𝒂 ∈ 𝑊 sappiamo che vale (8.4) e dunque anche 𝑎 𝑛 è
nullo. Applicando (8.4) ricorsivamente otteniamo che 𝑎 𝑛+𝑘 = 0 per ogni 𝑘 ∈ ℕ e
dunque 𝒂 = 0. Dunque ker 𝐽 = {0} e per le note proprietà degli operatori lineari
possiamo affermare che 𝐽 : 𝑊 → ℂ𝑛 è iniettivo. Dunque dim 𝑊 ≤ dim ℂ𝑛 = 𝑛 .

Ma possiamo anche osservare che 𝐽 è suriettivo in quanto fissati i valori di


𝑎0 , 𝑎1 , . . . , 𝑎 𝑛−1 l’equazione (8.4) ci permette di determinare, induttivamente,
tutti i termini successivi. Dunque fissato 𝒚 = (𝑦0 , . . . , 𝑦𝑛−1 ) ∈ ℂ𝑛 è possibile
trovare 𝒂 ∈ 𝑊 tale che 𝐽(𝒂) = 𝒚 .

Visto che 𝐽 : 𝑊 → ℂ𝑛 è iniettivo e suriettivo concludiamo che dim 𝑊 =


dim ℂ𝑛 = 𝑛 .

Teorema 8.24 (caratterizzazione delle soluzioni). Se il polinomio caratteristico


dell’equazione (8.4) ha 𝑛 zeri distinti 𝜆1 , . . . , 𝜆𝑛 allora ogni soluzione dell’equazione
si scrive nella forma
𝑎 𝑘 = 𝑐 1 𝜆1𝑘 + 𝑐2 𝜆2𝑘 + · · · + 𝑐 𝑛 𝜆𝑛𝑘
dove 𝑐 1 , . . . , 𝑐 𝑛 sono costanti arbitrarie.

Dimostrazione. Sia 𝑉 = ℂℕ lo spazio vettoriale di tutte le successioni. Possiamo


definire l’operatore di shift 𝜎 : 𝑉 → 𝑉

(𝜎𝒂)(𝑘) = 𝒂(𝑘 + 1).

Risulta quindi che 𝑎 𝑘+𝑛 = (𝜎 𝑛 𝒂)(𝑘) dove 𝜎 𝑛 = 𝜎 ◦ 𝜎 ◦ · · · ◦ 𝜎 è la composizione


di 𝜎 con se stesso per 𝑛 volte. Possiamo quindi riscrivere l’equazione (8.4) nella
forma
𝑐 𝑛 𝜎 𝑛 𝒂 + · · · + 𝑐0 𝜎0 𝒂 = 0
ovvero
𝑃(𝜎)𝒂 = 0
dove con 𝑃(𝜎) si intende l’operatore 𝑃(𝜎) : 𝑉 → 𝑉 ottenuto applicando il
polinomio caratteristico 𝑃 all’operatore 𝜎 .

Se 𝜆1 , . . . , 𝜆𝑛 sono le 𝑛 radici del polinomio 𝑃 si può decomporre il polinomio


𝑃 tramite il teorema 4.10 di Ruffini

𝑃(𝜆) = 𝑎 𝑛 (𝜆 − 𝜆1 )(𝜆 − 𝜆2 ) · · · (𝜆 − 𝜆𝑛 ). (8.7)

la stessa decomposizione può essere fatta per 𝑃(𝜎) e quindi l’equazione (8.4)
può essere scritta nella forma:

(𝜎 − 𝜆1 𝐼) ◦ (𝜎 − 𝜆2 𝐼) ◦ · · · ◦ (𝜎 − 𝜆𝑛 𝐼)𝒂 = 0 (8.8)
8.3 equazioni ricorsive lineari 367

dove 𝐼 : 𝑉 → 𝑉 è l’operatore identità 𝐼 𝒂 = 𝒂 . Visto che nella decompo-


sizione (8.7) l’ordine in cui vengono moltiplicati i fattori non conta, anche
nell’equazione (8.8) possiamo applicare gli operatori (𝜎 − 𝜆 𝑗 𝐼) in qualunque
ordine (gli operatori commutano). Dunque è immediato accorgersi che se 𝒂
risolve
(𝜎 − 𝜆 𝑗 𝐼)𝒂 = 0
per un qualunque 𝑗 = 1 , . . . , 𝑛 allora 𝒂 ∈ 𝑊 . Ma quest’ultima equazione è
facile da risolvere in quanto ponendo 𝑎 𝑘 = 𝒂(𝑘) si esplicita nella forma:

𝑎 𝑘+1 − 𝜆 𝑗 𝑎 𝑘 = 0

che è soddisfatta se se si sceglie 𝑎 𝑘 = 𝜆 𝑘𝑗 .

Dunque la successione 𝒂 𝑗 definita da

𝒂 𝑗 (𝑘) = 𝜆 𝑘𝑗

è un elemento di 𝑊 . Per 𝑗 = 1 , . . . , 𝑛 abbiamo trovato 𝑛 soluzioni distinte


𝒂 1 , . . . , 𝒂 𝑛 . Queste soluzioni sono indipendenti grazie al teorema 8.22 e quindi
essendo dim 𝑊 = 𝑛 per il teorema 8.23 possiamo affermare che queste soluzioni
formano una base di 𝑊 che è esattamente quanto volevamo dimostrare.

Esempio 8.25 (formula esplicita per la successione di Fibonacci). La successione


di Fibonacci 𝐹 𝑘 definita da (8.2) soddisfa una equazione ricorsiva lineare del secondo
ordine con polinomio associato 𝑃(𝜆) = 𝜆2 − 𝜆 − 1. Risolvendo l’equazione 𝑃(𝜆) = 0 si rapporto aureo
trovano le due radici distinte: √
1± 5
𝜆1 , 2 = .
2
La radice più grande, 𝜆2 , corrisponde al rapporto aureo che usualmente viene chiamato
𝜑. Visto che 𝜆1 𝜆2 = −1 si trova 𝜆1 = −1/𝜑. Dunque, per il teorema precedente,
sappiamo che esistono due costanti 𝑐 1 e 𝑐 2 tali che

(−1) 𝑘
𝐹𝑘 = 𝑐1 + 𝑐2 𝜑 𝑘 .
𝜑𝑘

Imponendo le condizioni 𝐹0 = 0, 𝐹1 = 1 (imporre 𝐹2 = 1 è equivalente a 𝐹0 = 0) si


ottiene
𝑐1
𝑐1 + 𝑐2 = 0, − + 𝑐2 𝜑 = 1
𝜑

da cui è possibile trovare 𝑐 1 = −𝑐 2 = 1/ 5 e ottenere così una formula esplicita per il
𝑘 -esimo numero di Fibonacci:

𝜑 𝑘 (−1) 𝑘+1
𝐹𝑘 = √ + √ .
5 5𝜑 𝑘

Risulta piuttosto sorprendente osservare che i valori 𝐹 𝑘 ottenuti con questa espressione
siano tutti numeri interi.
368 8 successioni ricorsive

Figura 8.8: L’insieme di Mandelbrot ge-


nerato al computer. Si veda il codice a
pagina 427.

8.4 dinamica complessa

Più in generale potremmo considerare successioni 𝑧 𝑛 a valori complessi e quindi


equazioni ricorsive della forma
(
𝑧0 = 𝛼,
𝑧 𝑛+1 = 𝑓 (𝑧 𝑛 )

con 𝑓 : ℂ → ℂ. Se 𝑓 fosse lineare si potrebbe scrivere esplicitamente la soluzione


seguendo le idee presentate nella sezione 8.3.

Possiamo provare a considerare la più semplice funzione non lineare che ci


possa venire in mente cioè 𝑓 (𝑧) = 𝑧 2 + 𝑐 e il più semplice dato iniziale 𝛼 = 0 e il
problema diventa quello di studiare il comportamento delle successioni:
(
𝑧0 = 0,
(8.9)
𝑧 𝑛+1 = 𝑧 𝑛2 + 𝑐

con 𝑐 ∈ ℂ.

L’insieme dei numeri reali è invariante, dunque se 𝑐 ∈ ℝ la successione 𝑧 𝑛 rimane


reale e coincide con la successione che abbiamo studiato nell’esercizio 8.19.

insieme di Mandelbrot E’ molto complicato determinare il carattere delle successioni definite dal
sistema (8.9). Solo con l’utilizzo dei primi calcolatori Mandelbrot (1924-2010)
riuscì a rappresentare graficamente l’insieme 𝑀 dei punti 𝑐 ∈ ℂ per i quali la
successione 𝑧 𝑛 non diverge: si veda la figura 8.8.
8.4 dinamica complessa 369

Con l’esercizio 8.19 abbiamo trovato l’intersezione 𝑀 ∩ ℝ = [−2 , 1/4]. Nel


seguente esercizio ci proponiamo ora di dimostrare un’altra semplice proprietà
che può essere molto utile negli algoritmi numerici utilizzati per disegnare tale
insieme.

Esercizio 8.26 (raggio di fuga). Dimostrare che se 𝑧 𝑛 è soluzione di (8.9) se per


un qualche 𝑁 ∈ ℕ si ha |𝑧 𝑁 | > 2 allora |𝑧 𝑛 | → +∞ per 𝑛 → +∞. In particolare
l’insieme 𝑀 di Mandelbrot è contenuto nel disco {𝑧 ∈ ℂ : |𝑧| ≤ 2}.

Soluzione. Sia 𝑐 ∈ ℂ fissato e si 𝑧 𝑛 la successione definita da (8.9). Per ogni


𝜀 > 0 consideriamo l’insieme:

𝐴 𝜀 = {𝑧 ∈ ℂ : |𝑧| ≥ 𝑐 e |𝑧| ≥ 2 + 𝜀}.

Possiamo mostrare che l’insieme 𝐴 𝜀 è invariante in quanto se 𝑧 𝑛 ∈ 𝐴 𝜀 si ha

|𝑧 𝑛+1 | = 𝑧 𝑛2 + 𝑐 ≥ |𝑧 𝑛 | 2 − |𝑐| ≥ |𝑧 𝑛 | 2 − |𝑧 𝑛 | = (|𝑧 𝑛 | − 1)|𝑧 𝑛 |



(8.10)
≥ (1 + 𝜀)|𝑧 𝑛 | ≥ (1 + 𝜀)(2 + 𝜀) ≥ 2 + 𝜀.

Dunque 𝐴 𝜀 è invariante ma non solo, se 𝑧 𝑛 ∈ 𝐴 𝜀 abbiamo trovato che risulta


|𝑧 𝑛+1 | ≥ (1 + 𝜀)|𝑧 𝑛 | e dunque |𝑧 𝑛+𝑘 | ≥ (1 + 𝜀) 𝑘 |𝑧 𝑛 | e dunque |𝑧 𝑛 | → +∞ per
𝑛 → +∞.
Se |𝑐| ≤ 2 e se |𝑧 𝑁 | > 2 allora 𝑧 𝑁 ∈ 𝐴 𝜀 per un qualche 𝜀 > 0 e dunque possiamo
concludere che 𝑧 𝑛 → ∞ ∈ ℂ̄. Se invece |𝑐| > 2 è facile osservare che 𝑧 0 = 0,
𝑧1 = 𝑐 , 𝑧2 = 𝑐 2 + 𝑐 e quindi

|𝑧2 | = 𝑐 2 + 𝑐 ≥ |𝑐| 2 − |𝑐| = |𝑐|(|𝑐| − 1) ≥ |𝑐| > 2


dunque 𝑧 2 ∈ 𝐴 𝜀 e quindi, comunque, 𝑧 𝑛 → ∞.


equazioni differenziali 9
9.1 classificazione

Le equazioni differenziali sono una classe di equazioni funzionali ovvero equazio- equazioni funzionali

ni in cui l’incognita non è un numero (come accade nelle equazioni algebriche)


ma è una funzione. La funzione incognita 𝑢 , sarà quindi funzione di una
variabile indipendente 𝑢 = 𝑢(𝑥). Ad esempio 𝑢 potrebbe essere la traiettoria di
un proiettile che descrive la posizione nello spazio in funzione del tempo 𝑥 . Se
nelle equazioni algebriche il nome di gran lunga più utilizzato per l’incognita
è 𝑥 , nelle equazioni funzionali a seconda dei contesti le convenzioni possono
cambiare in maniera drastica. Si dovrà utilizzare un nome per la funzione
e un nome per la sua variabile indipendente: 𝑥 = 𝑥(𝑡), 𝑦 = 𝑦(𝑥), 𝑦 = 𝑦(𝑡),
𝑢 = 𝑢(𝑥) sono alcune delle scelte più utilizzate. Se l’incognita è una funzione
𝑢 = 𝑢(𝑥) le operazioni che possono comparire nell’equazioni sono, oltre le
usuali operazioni algebriche che agiscono sui singoli valori 𝑢(𝑥) della funzione,
anche operatori che agiscono sulla funzione 𝑢 in sé. Se l’equazione funzionale
oltre alle operazioni algebriche comprende anche l’operatore derivata, si dirà che
è una equazione differenziale. Di contro ci potranno ad esempio essere equazioni equazione differenziale

che coinvolgono l’operatore integrale e si chiameranno equazioni integrali.

Ci sono quindi diversi concetti che possono aiutare a classificare le equazioni


differenziali. Innanzitutto supporremo sempre che le nostre equazioni siano
senza ritardo
senza ritardo (o senza memoria) cioè che la funzione 𝑢 e le sue derivate 𝑢 0, 𝑢 00. . . ,
vengano tutte calcolate nello stesso punto 𝑥 . In caso contrario si parla di
equazioni differenziali funzionali (in particolare equazioni con ritardo perché le
derivate dipendono tipicamente dai valori assunti nel passato), argomento che
non toccheremo.

Se la funzione incognita è funzione di una singola variabile si dirà che l’equazione ODE
è una equazione differenziale ordinaria (abbreviato EDO in italiano, ODE per gli
anglosassoni). Di contro se la funzione incognita è funzione di più variabili PDE
l’equazione si chiamerà equazione differenziale alle derivate parziali (abbreviato EDP
in italiano e PDE in lingua inglese). In questo corso, centrato sulle funzioni di
una variabile, tratteremo quindi solamente le equazioni differenziali ordinarie. ordine
L’ordine dell’equazione differenziale è il numero massimo di derivate successive
che vengono applicate alla funzione incognita. La funzione 𝑢 sarà definita su
un intervallo 𝐼 della retta reale: 𝑢 : 𝐼 → ℝ e la funzione e le derivate vengono
tutte valutate nello stesso punto. In tal caso la forma più generale di equazione
differenziale ordinaria di ordine 𝑛 si potrà dunque scrivere come:

𝐹(𝑥, 𝑢(𝑥), 𝑢 0(𝑥), 𝑢 00(𝑥), . . . , 𝑢 (𝑛) (𝑥)) = 0 (9.1)

con 𝐹 : Ω → ℝ una funzione data, definita su un insieme Ω ⊆ 𝐼 × ℝ𝑛+1 . Una


funzione 𝑢 : 𝐼 → ℝ si dice essere una soluzione dell’equazione differenziale (9.1) se
𝑢 è derivabile almeno 𝑛 volte in ogni punto 𝑥 ∈ 𝐼 e se (9.1) è soddisfatta per
ogni 𝑥 ∈ 𝐼 .
372 9 equazioni differenziali

Usualmente si tende a semplificare la notazione evitando di scrivere sempre


esplicitamente il punto 𝑥 in cui viene calcolata la funzione. Sarà quindi usuale
scrivere l’equazione (9.1) nella forma abbreviata:

𝐹(𝑥, 𝑢, 𝑢 0 , 𝑢 00 , . . . , 𝑢 (𝑛) ) = 0

rendendo anche più evidente il fatto che l’incognita è 𝑢 , l’intera funzione, e non
un singolo valore 𝑢(𝑥).

Se ad esempio scegliamo 𝑛 = 2 e 𝐹(𝑥, 𝑢, 𝑣, 𝑧) = 𝑧 + sin 𝑢 + 𝑣 otteniamo


l’equazione differenziale:

𝑢 00(𝑥) + sin 𝑢(𝑥) + 𝑢 0(𝑥) = 0 (9.2)

che, in opportune unità di misura, è l’equazione del moto di un pendolo


smorzato, dove 𝑥 rappresenta il tempo e 𝑢 la misura dell’angolo di inclinazione
equazioni autonome del pendolo rispetto alla verticale. Osserviamo che nell’esempio precedente la
funzione 𝐹 non dipende direttamente dalla variabile 𝑥 . Equazioni con questa
proprietà si dicono equazioni autonome ed è immediato osservare che se 𝑢(𝑥)
è soluzione anche una sua traslazione temporale 𝑣(𝑥) = 𝑢(𝑥 − 𝑥 0 ) è soluzione
equazione in forma implicita dell’equazione (il moto del pendolo non dipende dall’ora in cui si svolge).

Una equazione scritta nella forma (9.1) si dice equazione in forma implicita e per
equazioni in forma normale analogia con le equazioni algebriche (si pensi all’equazione 𝑢 2 (𝑥) + 𝑥 2 = 1)
ci si aspetta che le soluzioni di tale equazioni siano meglio rappresentate da
curve piuttosto che da grafici di funzione. Risulta in effetti che la teoria delle
equazioni differenziali si applica con molta maggiore efficacia alle equazioni in
forma normale che sono le equazioni differenziali di ordine 𝑛 che possono essere
scritte esplicitando la dipendenza dalla derivata di ordine massimo:

𝑢 (𝑛) (𝑥) = 𝑓 (𝑥, 𝑢(𝑥), 𝑢 0(𝑥), . . . , 𝑢 𝑛−1 (𝑥)) (9.3)


sistemi

dove 𝑓 : Ω → ℝ è una funzione definita su Ω ⊆ 𝐼 × ℝ𝑛 . L’equazione del pendolo


si può scrivere in questa forma, scegliendo 𝑓 (𝑥, 𝑢, 𝑣) = − sin 𝑢 − 𝑣 .

Più in generale potremmo considerare sistemi di equazioni differenziali in più


incognite. Possiamo rappresentare un sistema di 𝑘 equazioni ordinarie in 𝑚
incognite nella forma:

𝑭(𝑥, 𝒖(𝑥), 𝒖 0(𝑥), . . . , 𝒖 𝑛 (𝑥)) = 0 (9.4)

dove 𝒖 è una funzione vettoriale 𝒖 : 𝐼 → ℝ𝑚 le cui componenti sono le 𝑚


funzioni incognite:
𝒖(𝑥) = (𝑢1 (𝑥), . . . , 𝑢𝑚 (𝑥))
mentre la funzione 𝑭 : 𝐼 × (ℝ𝑚 )𝑛+1 → ℝ 𝑘 è stavolta una funzione a valori
vettoriali 𝑭 = (𝐹1 , . . . , 𝐹 𝑘 ) cosicché l’equazione vettoriale (9.4) è effettivamente
9.1 classificazione 373

equivalente ad un sistema di 𝑘 equazioni:



 𝐹1 (𝑥, 𝒖(𝑥), 𝒖 0(𝑥) . . . , 𝒖 (𝑛) (𝑥)) = 0

 𝐹2 (𝑥, 𝒖(𝑥), 𝒖 0(𝑥) . . . , 𝒖 (𝑛) (𝑥)) = 0



..


 .

 𝐹 𝑘 (𝑥, 𝒖(𝑥), 𝒖 0(𝑥) . . . , 𝒖 (𝑛) (𝑥)) = 0


Vedremo che per le equazioni ordinarie del primo ordine è naturale, come
accade per le equazioni algebriche, avere lo stesso numero di equazioni e di
incognite dunque è tipico avere singole equazioni scalari del primo ordine (cioè
in cui l’incognita è una funzione a valori nel campo degli scalari ℝ) o sistemi
di 𝑘 = 𝑚 equazioni del primo ordine con incognita una funzione vettoriale 𝒖
(cioè una funzione a valori nello spazio vettoriale ℝ𝑚 ) ovvero con 𝑚 incognite
𝑢1 , . . . , 𝑢𝑚 funzioni scalari.

Una importante osservazione è il fatto generale che una equazione differenziale


di ordine 𝑛 può essere ricondotta ad un sistema di 𝑛 equazioni differenziali
del primo ordine. Basta infatti considerare come incognita il vettore (chiamato
jet)
𝒖 = (𝑢, 𝑢 0 , 𝑢 00 , . . . , 𝑢 (𝑛−1) )
comprendente tutte le derivate della funzione scalare 𝑢 fino all’ordine 𝑛 − 1.
L’equazione (9.1), di ordine 𝑛 , risulta infatti equivalente al sistema di 𝑛 equazioni
del primo ordine nella variabile 𝒖 = (𝑢1 , . . . , 𝑢𝑛 )

𝑢2 (𝑥) = 𝑢10 (𝑥)






𝑢3 (𝑥) = 𝑢20 (𝑥)




..



 .
𝑢𝑛 (𝑥) = 𝑢𝑛−
0

1 (𝑥)




 𝐹(𝑥, 𝑢1 (𝑥), 𝑢2 (𝑥), . . . , 𝑢𝑛 (𝑥), 𝑢𝑛0 (𝑥)) = 0



Nel caso, più interessante, delle equazioni in forma normale l’equazione (9.3)
di ordine 𝑛 diventa un sistema di 𝑛 equazioni normali del primo ordine in 𝑛
incognite
𝑢10 (𝑥) = 𝑢2 (𝑥)




 𝑢 0 (𝑥) = 𝑢 (𝑥)

 3
 2

..


 .
𝑢𝑛−1 (𝑥) = 𝑢𝑛 (𝑥)
0





 𝑢𝑛0 (𝑥) = 𝑓 (𝑥, 𝑢1 (𝑥), 𝑢2 (𝑥), . . . , 𝑢𝑛 (𝑥))



ovvero una equazione differenziale vettoriale del primo ordine

𝒖 0(𝑥) = 𝒇 (𝑥, 𝒖(𝑥)).

Nell’esempio del pendolo (9.2) si avrà come incognita una funzione vettoriale
𝒖(𝑥) = (𝑢(𝑥), 𝑢 0(𝑥)) le cui componenti sono posizione e velocità angolare. Il
codominio di tale funzione si chiama spazio delle fasi. L’equazione (essendo
374 9 equazioni differenziali

autonoma tralasciamo la dipendenza da 𝑥 ) si scriverà nella forma 𝒖 0 = 𝒇 (𝒖) con


𝒇 (𝑦1 , 𝑦2 ) = (𝑦2 , − sin(𝑦1 ) − 𝑦2 ).

equazioni lineari

Un caso molto particolare ma decisamente importante è quello in cui la funzione


𝐹 (per le equazioni in forma implicita) o la funzione 𝑓 (per le equazioni in forma
normale) sono funzioni lineari per ogni 𝑡 rispetto alla variabile 𝑢 . In tal caso
equazioni lineari omogenee diremo che l’equazione è lineare omogenea. Più precisamente si avrà
Per evidenziare il fatto che una funzione
𝐿 è lineare tenderemo ad utilizzare le pa- 𝐹(𝑥, 𝑢(𝑥), 𝑢 0(𝑥), . . . , 𝑢 (𝑛) (𝑥)) = 𝐴 𝑥 [𝑢(𝑥), 𝑢 0(𝑥), . . . , 𝑢 (𝑛) (𝑥)]
rentesi quadre (invece che le tonde) per
racchiudere l’argomento della funzione: con 𝐴 𝑥 : ℝ𝑛+1 → ℝ operatore lineare per ogni 𝑥 ovvero 𝐴 𝑥 si rappresenta
𝐿[𝑣] = 𝐿(𝑣). tramite un vettore i cui coefficienti sono funzioni della variabile 𝑥 :
𝑛
X
𝐴 𝑥 [𝒚] = 𝑎 𝑘 (𝑥)𝑦 𝑘
𝑘=0

e l’equazione differenziale si scrive nella forma

𝑎0 (𝑥)𝑢(𝑥) + 𝑎 1 (𝑥)𝑢 0(𝑥) + · · · + 𝑎 𝑛 (𝑥)𝑢 (𝑛) (𝑥) = 0.

Nel caso in cui i coefficienti 𝑎 𝑘 (𝑡) non dipendano da 𝑥 (cioè siano funzioni
coefficienti costanti costanti) diremo che l’equazione è lineare a coefficienti costanti.

E’ facile osservare che l’insieme delle soluzioni di una equazione lineare


omogenea è uno spazio vettoriale: 𝑢 = 0 è sempre soluzione, se 𝑢 è una
soluzione e 𝜆 ∈ ℝ anche 𝜆𝑢 è soluzione e se 𝑢 e 𝑣 sono due soluzioni anche
principio di sovrapposizione 𝑢 + 𝑣 è soluzione (principio di sovrapposizione).

In effetti se le funzioni 𝑢 sono definite su un intervallo 𝐼 possiamo identificare


𝐹 con un funzionale 𝐿 : ℝ𝐼 → ℝ𝐼 definito da

𝐿[𝑢](𝑥) = 𝐹(𝑥, 𝑢(𝑥), 𝑢 0(𝑥), . . . , 𝑢 (𝑛) (𝑥))

Se l’equazione differenziale è lineare allora 𝐿 è un operatore lineare sullo spazio


vettoriale ℝ𝐼 e lo spazio delle soluzioni dell’equazione differenziale non è altro
che ker 𝐿, il nucleo dell’operatore, ed è noto che ker 𝐿 è un sottospazio vettoriale.
Nonostante ℝ𝐼 sia uno spazio vettoriale di dimensione infinita scopriremo che
(sotto opportune ipotesi) lo spazio vettoriale delle soluzioni ha dimensione
finita 𝑛 , uguale al grado dell’equazione.
Una funzione 𝑓 : 𝑉 → 𝑊 definita tra
due spazi vettoriali si dice essere af- Nel caso in cui la funzione 𝐹 (o la corrispondente 𝑓 ) sia affine si dirà che
fine se può essere scritta nella forma l’equazione differenziale è una equazione lineare (non omogenea). L’equazione
𝑓 (𝑣) = 𝐿[𝑣] + 𝑞 con 𝐿 : 𝑉 → 𝑊 operato- non omogenea avrà la forma:
re lineare e 𝑞 ∈ 𝑊 fissato. Una equazione
lineare 𝐿[𝑣] = 𝑤 può quindi sempre es-
sere scritta nella forma 𝑓 (𝑣) = 0 con 𝑓 𝑎0 (𝑥)𝑢(𝑥) + 𝑎1 (𝑥)𝑢 0(𝑥) + · · · + 𝑎 𝑛 (𝑥)𝑢 (𝑛) (𝑥) = 𝑔(𝑥).
affine.
Se 𝑣 0 e 𝑣 1 sono due soluzioni di questa equazione è chiaro che la differenza
equazione lineari
𝑢 = 𝑣1 − 𝑣0 è soluzione dell’equazione omogenea

𝑎0 (𝑥)𝑢(𝑥) + 𝑎1 (𝑥)𝑢 0(𝑥) + · · · + 𝑎 𝑛 (𝑥)𝑢 (𝑛) (𝑥) = 0.


9.1 classificazione 375

Dunque quest’ultima si chiama equazione omogenea associata alla non omoge-


nea e se 𝑣 0 è una soluzione particolare (qualunque) dell’equazione non omogenea
ogni soluzione 𝑣 dell’equazione non omogenea si scrive nella forma

𝑣 = 𝑣0 + 𝑢

con 𝑢 soluzione dell’omogenea associata. Per trovare tutte le soluzioni di una


equazione non omogenea è dunque sufficiente trovare una soluzione particolare
della non omogenea e tutte le soluzioni della equazione omogenea associata.

L’equazione del pendolo (9.2) non è lineare ma quando l’angolo 𝑢 è piccolo


(cioè per piccole oscillazioni) si ha sin 𝑢 ∼ 𝑢 . Facendo questa linearizzazione si
ottiene l’equazione
𝑢 00(𝑥) + 𝑢(𝑥) + 𝑢 0(𝑥) = 0.
Questa è una equazione lineare omogenea. Se sul pendolo agisce una forza
esterna (pendolo forzato) l’equazione diventa

𝑢 00(𝑥) + 𝑢(𝑥) + 𝑢 0(𝑥) = 𝑔(𝑥)

dove 𝑔(𝑥) rappresenta l’entità di una forza esterna variabile nel tempo. Questa
equazione è lineare non omogenea.

Come nel caso generale le equazioni lineari di ordine 𝑛 si riconducono a sistemi


lineari di 𝑛 equazioni del primo ordine.

problema di Cauchy

Se le equazioni differenziali di ordine 𝑛 hanno uno spazio di soluzioni di


dimensione 𝑛 ci si aspetta che qualcosa del genere succeda anche per le
equazioni differenziali di ordine 𝑛 in forma normale. Lo spazio delle soluzioni
in generale non sarà lineare ma, in un certo senso, avrà comunque dimensione
𝑛 cioè le soluzioni potranno essere identificate da 𝑛 parametri indipendenti.
Per fare questo, ad una equazione differenziale in forma normale di ordine 𝑛

𝑢 (𝑛) (𝑥) = 𝑓 (𝑥, 𝑢(𝑥), . . . , 𝑢 𝑛−1 (𝑥))


condizione iniziale
si aggiunge una condizione iniziale ovvero si fissa un punto iniziale 𝑥 0 e un valore
iniziale per ognuna delle derivate di ordine inferiore a 𝑛 : 𝑢(𝑥 0 ) = 𝑦0 , 𝑢 0(𝑥 0 ) = 𝑦1 ,
. . . , 𝑢 𝑛−1 (𝑥 0 ) = 𝑦𝑛−1 . Questa condizione si chiama anche condizione di Cauchy e il
problema che si ottiene aggiungendo una condizione iniziale ad una equazione
differenziale:
𝑛−1
 𝑢 (𝑥) = 𝑓 (𝑥, 𝑢(𝑥), . . . , 𝑢 (𝑥))

 (𝑛)

 𝑢(𝑥0 ) = 𝑦0 ,




𝑢 0(𝑥0 ) = 𝑦1 ,


 ..
.





 𝑢 (𝑛−1) (𝑥0 ) = 𝑦𝑛−1


 problema di Cauchy
si chiama problema di Cauchy. Vedremo che, sotto opportune ipotesi, il problema
di Cauchy ammette una unica soluzione e questo significa, sostanzialmente, che
376 9 equazioni differenziali

l’insieme di tutte le soluzioni dell’equazione differenziale può essere descritto


dal variare degli 𝑛 parametri 𝑦0 , 𝑦1 , . . . , 𝑦𝑛−1 .

Una delle ipotesi fondamentali per garantire l’unicità delle soluzioni di un


problema di Cauchy è che le soluzioni siano definite su un intervallo. E’ chiaro
infatti che se ho due soluzioni definite su due intervalli separati, potrei unire le
due soluzioni e ottenere una soluzione definita sull’unione dei due intervalli pur
potendo scegliere condizioni iniziali indipendenti in ognuno dei due intervalli.
Viceversa una soluzione definita su un intervallo 𝐼 è soluzione anche se ristretta
ad ogni sottoinsieme di 𝐼 (che sia o no un intervallo). Se restringo una soluzione
o unisco due soluzioni ottengo formalmente soluzioni diverse in quanto i
domini di definizione sono diversi, ma queste soluzioni assumono, dove sono
definite, gli stessi valori. Per evitare questa ambiguità considereremo sempre
intervallo massimale solamente le soluzioni definite su un intervallo massimale cioè soluzioni definite
su un intervallo che non possono essere estese su intervalli più grandi.

9.2 metodi risolutivi

Una tipologia di equazioni differenziali che abbiamo già trattato è data dalle
equazioni della forma:
𝑢 0(𝑥) = 𝑓 (𝑥).
Banalmente l’insieme delle soluzioni è dato dalle primitive di 𝑓 :

𝑢∈ 𝑓.

Se 𝑓 è definita su un intervallo tutte le soluzioni 𝑢 definite sullo stesso intervallo


e, grazie al Teorema 6.27 si scrivono quindi nella forma

𝑢(𝑥) = 𝐹(𝑥) + 𝑐

dove 𝐹 è una qualunque primitiva di 𝑓 e 𝑐 ∈ ℝ è una costante additiva arbitraria.


Se 𝑓 è continua e consideriamo il problema di Cauchy:
(
𝑢 0(𝑥) = 𝑓 (𝑥)
𝑢(𝑥0 ) = 𝑦0 .

possiamo identificare una unica soluzione che si scrive nella forma:


∫ 𝑥
𝑢(𝑥) = 𝑦0 + 𝑓 (𝑡) 𝑑𝑡.
𝑥0

equazioni lineari del primo ordine

Le equazioni differenziali ordinarie del primo ordine in forma normale possono


essere scritte nella forma:

𝑢 0(𝑥) + 𝑎(𝑥)𝑢(𝑥) = 𝑏(𝑥). (9.5)


9.2 metodi risolutivi 377

Per risolvere queste equazioni si cerca di ricondurre la somma nel lato sinistro
alla derivata di un prodotto. Per fare ciò si considera una qualunque primitiva
𝐴 ∈ 𝑎 e si moltiplicano ambo i membri per 𝑒 𝐴(𝑥) :

𝑒 𝐴(𝑥) 𝑢 0(𝑥) + 𝑎(𝑥)𝑒 𝐴(𝑥) 𝑢(𝑥) = 𝑏(𝑥)𝑒 𝐴(𝑥)

essendo 𝐴0(𝑥) = 𝑎(𝑥) si osserva che il lato sinistro è ora la derivata di un


prodotto:
 0
𝑒 𝐴(𝑥) 𝑢(𝑥) = 𝑏(𝑥)𝑒 𝐴(𝑥)

da cui ∫
𝑒 𝐴(𝑥) 𝑢(𝑥) ∈ 𝑏(𝑥)𝑒 𝐴(𝑥) 𝑑𝑥.

Moltiplicando ambo i membri per 𝑒 −𝐴(𝑥) (visto che l’esponenziale non si annulla
mai questa operazione non modifica lo spazio delle soluzioni) si ottiene
∫ ∫
𝑢(𝑥) = 𝑒 −𝐴(𝑥) 𝑏(𝑥)𝑒 𝐴(𝑥) 𝑑𝑥, 𝐴(𝑥) ∈ 𝑎(𝑥) 𝑑𝑥.

Più esplicitamente scelta una qualunque primitiva del lato destro



𝐹(𝑥) ∈ 𝑏(𝑥) · 𝑒 𝐴(𝑥) 𝑑𝑥

su ogni intervallo in cui 𝑎(𝑥) e 𝑏(𝑥) sono definite si ha

𝑢(𝑥) = 𝑒 −𝐴(𝑥) · (𝐹(𝑥) + 𝑐).

per qualche 𝑐 ∈ ℝ.

Se 𝑏(𝑥) = 0 l’equazione è lineare omogenea, possiamo scegliere 𝐹(𝑥) = 0 e


quindi lo spazio delle soluzioni in questo caso è dato da

𝑢(𝑥) = 𝑐 · 𝑒 −𝐴(𝑥)

ed è quindi lo spazio vettoriale unidimensionale generato dalla funzione


𝑒 −𝐴(𝑥) .

Ogni soluzione della equazione non omogenea si può scrivere come somma di
una soluzione particolare 𝑢0 della equazione non omogenea più una generica
soluzione dell’equazione omogenea associata. Infatti:

𝑢(𝑥) = 𝑢0 (𝑥) + 𝑐𝑒 −𝐴(𝑥)

dove
𝑢0 (𝑥) = 𝑒 −𝐴(𝑥) 𝐹(𝑥)
è una particolare soluzione dell’equazione non omogenea.

Osserviamo che se 𝑎(𝑥) e 𝑏(𝑥) sono funzioni continue definite su uno stesso
intervallo 𝐼 , anche la soluzione è definita su tutto 𝐼 . Si dirà quindi che la
soluzione esiste globalmente.
378 9 equazioni differenziali

Esercizio 9.1 (autovettori dell’operatore derivata). Fissato 𝜆 ∈ ℝ trovare tutte le


soluzioni dell’equazione
𝑢 0(𝑥) = 𝜆𝑢(𝑥).

Svolgimento. Scriviamo l’equazione nella forma

𝑢 0(𝑥) − 𝜆𝑢(𝑥) = 0.

Nelle notazioni∫ precedenti abbiamo 𝑎(𝑥) = −𝜆 e quindi possiamo scegliere


𝐴(𝑥) = −𝜆𝑥 ∈ 𝑎 . Moltiplicando ambo i membri per 𝑒 −𝐴(𝑥) si ottiene

𝑒 −𝜆𝑥 𝑢 0(𝑥) − 𝜆𝑒 −𝜆𝑥 𝑢(𝑥) = 0

cioè  0
𝑒 −𝜆𝑥 · 𝑢(𝑥) =0

da cui su ogni intervallo in cui 𝑢 è definita esiste una costante 𝑐 tale che

𝑒 −𝜆𝑥 𝑢(𝑥) = 𝑐

ovvero
𝑢(𝑥) = 𝑐𝑒 𝜆𝑥 .
Abbiamo dunque trovato che le soluzioni sono definite su tutto ℝ, una soluzione
è 𝑒 𝜆𝑥 e ogni altra soluzione è multiplo di questa.

Esercizio 9.2. 1. Trovare le soluzioni dell’equazione differenziale


𝑢
𝑢0 − = 𝑥2 .
𝑥
2. Trovare le soluzioni dell’equazione differenziale

𝑥𝑢 0 − 𝑢 = 𝑥 3 .

Svolgimento. La prima è una equazione lineare non omogenea del primo ordine
del tipo (9.5). Il fattore integrante è 𝑒 𝐴(𝑥) con
∫ ∫
1
𝐴(𝑥) ∈ 𝑎(𝑥) 𝑑𝑥 = − 𝑑𝑥 3 − ln |𝑥|.
𝑥

Dunque 𝑒 𝐴(𝑥) = 1/|𝑥| . Dovremmo dunque dividere ambo i membri dell’equa-


zione per |𝑥| . Osserviamo che l’equazione non è definita per 𝑥 = 0 e possiamo
dunque distinguere i casi 𝑥 > 0 e 𝑥 < 0. Decidiamo quindi, per semplicità,
di cambiare segno all’equazione per 𝑥 < 0 cosicché possiamo dividere per 𝑥
invece che per |𝑥| . Si ottiene dunque:

𝑢0 𝑢
− 2 =𝑥
𝑥 𝑥
cioè  0
1
𝑢· =𝑥
𝑥
9.2 metodi risolutivi 379

da cui
𝑢 𝑥2

∈ 𝑥 𝑑𝑥 3 .
𝑥 2
Dunque la funzione 𝑢(𝑥)/𝑥 differisce da 𝑥 2 /2 per una costante su ognuno dei
due intervalli 𝑥 > 0 e 𝑥 < 0. Su ognuno dei due intervalli si ha dunque:

𝑢(𝑥) 𝑥 2
= +𝑐
𝑥 2
da cui
𝑥3
𝑢(𝑥) =
+ 𝑐𝑥
2
per qualche 𝑐 ∈ ℝ. Per come è stato posto il problema, la soluzione non deve
essere definita per 𝑥 = 0 e la costante 𝑐 può essere quindi diversa se 𝑥 > 0 o
𝑥 < 0.
La seconda equazione è equivalente alla prima se 𝑥 ≠ 0. Ma non è in forma
normale e le soluzioni potranno essere definite anche per 𝑥 = 0. Si avrà quindi

𝑥3
𝑢(𝑥) = + 𝑐𝑥
2
come prima ma affinché la funzione sia derivabile in 𝑥 = 0 la costante 𝑐 dovrà
essere uguale per 𝑥 > 0 e per 𝑥 < 0.

Si osservi che ogni soluzione soddisfa la condizione iniziale 𝑢(0) = 0 e che


quindi nessuna soluzione soddisfa la condizione 𝑢(0) = 𝑞 se 𝑞 ≠ 0.

Esercizio 9.3. Risolvere l’equazione differenziale:


𝑢
𝑢0 + = 1.
(1 + 𝑥 2 ) arctg 𝑥

Svolgimento. Osserviamo che l’equazione è definita solo per 𝑥 ≠ 0. Cercheremo


quindi le soluzioni sui due intervalli 𝑥 < 0 e 𝑥 > 0. Moltiplicando ambo i
membri dell’equazione per arctg 𝑥 si ottiene

1
arctg 𝑥 · 𝑢 0(𝑥) + 𝑢(𝑥) = arctg 𝑥
1 + 𝑥2
cioè:
(arctg 𝑥 · 𝑢(𝑥))0 = arctg 𝑥
da cui ∫
1
arctg 𝑥 · 𝑢(𝑥) ∈ arctg 𝑥 𝑑𝑥 3 𝑥 arctg 𝑥 − ln(1 + 𝑥 2 ).
2
Dunque su ogni intervallo su cui la soluzione è definita esisterà 𝑐 ∈ ℝ tale che

1
arctg 𝑥 · 𝑢(𝑥) = 𝑥 arctg 𝑥 − ln(1 + 𝑥 2 ) + 𝑐
2
da cui essendo 𝑥 ≠ 0 si può dividere per arctg 𝑥 e ottenere

ln(1 + 𝑥 2 ) 𝑐
𝑢(𝑥) = 𝑥 − + .
2 arctg 𝑥 arctg 𝑥
380 9 equazioni differenziali

Abbiamo quindi una famiglia di soluzioni definite per 𝑥 < 0 e una famiglia di
soluzioni definite per 𝑥 > 0.

equazioni a variabili separabili

Si chiamano equazioni a variabili separabili le equazioni del tipo:

𝑢 0(𝑥) = 𝑓 (𝑥) · 𝑔(𝑢(𝑥)). (9.6)

Questa è una equazione del primo ordine in forma normale:

𝑢 0(𝑥) = 𝐹(𝑥, 𝑢(𝑥))

dove nella funzione 𝐹 risulta possibile separare le due variabili in un prodotto:

𝐹(𝑥, 𝑦) = 𝑓 (𝑥) · 𝑔(𝑦).

Se 𝑢 è una soluzione dell’equazione (9.6) e se 𝑥 è un punto in cui 𝑔(𝑢(𝑥)) ≠ 0,


possiamo dividere ambo i membri dell’equazione per 𝑔(𝑢(𝑥)) per ottenere:

𝑢 0(𝑥)
= 𝑓 (𝑥).
𝑔(𝑢(𝑥))

Vogliamo ora scrivere il lato sinistro come la derivata della funzione composta.
Se scegliamo una primitiva di 1/𝑔 :

1
𝐻(𝑢) ∈ 𝑑𝑢
𝑔(𝑢)

si osserva che

𝑢 0(𝑥)
(𝐻(𝑢(𝑥)))0 = 𝐻 0(𝑢(𝑥)) · 𝑢 0(𝑥) = = 𝑓 (𝑥).
𝑔(𝑢(𝑥))

dunque se 𝐹 ∈ 𝑓 , su ogni intervallo in cui 𝑔(𝑢(𝑥)) ≠ 0 dovrà esistere 𝑐 ∈ ℝ
tale che
𝐻(𝑢(𝑥)) = 𝐹(𝑥) + 𝑐.
Se supponiamo inoltre che 𝐻 sia invertibile si avrà:

𝑢(𝑥) = 𝐻 −1 (𝐹(𝑥) + 𝑐).

Esempio 9.4. Risolviamo l’equazione

𝑢 0 = 𝑥𝑢 2 + 𝑥. (9.7)

E’ una equazione del primo ordine in forma normale. Raccogliendo 𝑥 al lato destro si
ottiene una equazione a variabili separabili. Dividendo ambo i membri per 𝑢 2 + 1 (che è
sempre diverso da zero) si ottiene l’equazione equivalente

𝑢0
= 𝑥.
1 + 𝑢2
9.2 metodi risolutivi 381

-4 -3 -2 -1 1 2 3 4
Figura 9.1: i grafici delle soluzioni
dell’equazione differenziale (9.7).
-1

-2

(interagisci)

Integrando il lato sinistro si ottiene:

𝑢 0(𝑥) 𝑑𝑢
∫ ∫ 
𝑑𝑥 = 3 arctg(𝑢(𝑥))
1 + 𝑢 2 (𝑥) 1 + 𝑢2 𝑢=𝑢(𝑥)

mentre per il lato destro si ottiene

𝑥2

𝑥 𝑑𝑥 3 .
2

Dunque su ogni intervallo si deve avere

𝑥2
arctg(𝑢(𝑥)) = + 𝑐.
2
Visto che l’arcotangente assume valori compresi tra −𝜋/2 e 𝜋/2 anche il lato destro
dovrà rimanere in tale intervallo. Dovrà quindi essere:

𝜋 𝑥2 𝜋
− < +𝑐 < . (9.8)
2 2 2
Con questa condizione possiamo invertire l’arcotangente ottenendo finalmente una
espressione per la soluzione:

𝑥2
 
𝑢(𝑥) = tg +𝑐 . (9.9)
2

Osserviamo che la condizione (9.8) equivale a richiedere che l’argomento della tangente
stia nell’intervallo − 𝜋2 , 𝜋2 . In tal caso dovrà essere 𝑐 < 𝜋2 e si osserva che se 𝑐 > − 𝜋2

la soluzione 𝑢(𝑥) è definita su un intervallo aperto centrato in 𝑥 = 0 mentre se 𝑐 ≤ − 𝜋2
la soluzione è definita su una coppia di intervalli simmetrici con ampiezza che tende
a zero quando 𝑐 → −∞. Agli estremi di tali intervalli la soluzione ha degli asintoti
verticali.

In questo caso possiamo osservare che la condizione (9.8) può essere trascurata, visto
che la funzione tg è 𝜋-periodica e quindi è possibile sommare a 𝑐 un multiplo intero
di 𝜋 senza che la soluzione venga modificata. Nell’equazione (9.9) si potrebbe quindi
considerare la funzione tg definita su tutto il suo dominio osservando che in tal caso si
382 9 equazioni differenziali

può supporre che sia 𝑐 ∈ − 𝜋2 , 𝜋2 . Invece di ottenere un singolo intervallo per ogni 𝑐


si ottengono così tutti gli infiniti intervalli.

Osservazione 9.5. L’esempio precedente mette in evidenza il fatto che le soluzioni


massimali possono essere definite su intervalli arbitrariamente piccoli anche se l’equa-
zione differenziale non presenta singolarità. Diremo in questo caso che la soluzione non
è globale.
D’altra parte si osserva che i grafici delle soluzioni riempiono tutto il piano senza mai
toccarsi l’uno con l’altro (si dice a volte che sono una fibrazione). Questo è dovuto al
fatto che questa equazione soddisfa il teorema 9.16 e quindi per ogni punto del piano
passa una ed una sola soluzione.

Esempio 9.6. Si voglia risolvere l’equazione

𝑢0 = 𝑢 2 .

Si tratta di una equazione in forma normale, del primo ordine, autonoma. In particolare
è a variabili separabili 𝑢 0 = 𝑓 (𝑢(𝑥)) · 𝑔(𝑥) con 𝑓 (𝑢) = 𝑢 2 e 𝑔(𝑥) = 1. Osserviamo
innanzitutto che 𝑢(𝑥) = 0 è soluzione in quanto 𝑢 0(𝑥) = 𝑢 2 (𝑥) = 0. Se 𝑢 è una
soluzione non identicamente nulla ci saranno dei punti in cui 𝑢(𝑥) ≠ 0. In un intorno
di tali punti possiamo dividere ambo i membri dell’equazione per 𝑢 2 (𝑥) ottenendo:

𝑢0
= 1.
𝑢2
Integrando il lato sinistro tramite cambio di variabile 𝑢 = 𝑢(𝑥), 𝑑𝑢 = 𝑢 0(𝑥) 𝑑𝑥 si
ottiene:
𝑢 (𝑥) 𝑑𝑢
∫ 0 ∫   
1 1
𝑑𝑥 = = − =−
𝑢 (𝑥)
2 𝑢 𝑢=𝑢(𝑥)
2 𝑢 𝑢=𝑢(𝑥) 𝑢(𝑥)
mentre integrando il lato destro si ha

1 𝑑𝑥 3 𝑥.

Dunque su ogni intervallo in cui 𝑢(𝑥) ≠ 0 deve esistere una costante 𝑐 ∈ ℝ tale che

1
− =𝑥+𝑐
𝑢(𝑥)

ovvero, ponendo 𝑥 0 = −𝑐

1 1
𝑢(𝑥) = − = . (9.10)
𝑥+𝑐 𝑥0 − 𝑥

In conclusione abbiamo trovato una soluzione costante 𝑢(𝑥) = 0 e una famiglia di solu-
zioni definite sugli intervalli (−∞, 𝑥 0 ) e (𝑥 0 , +∞) rappresentante dall’equazione (9.10).
Dovremmo ora chiederci se è possibile che queste soluzioni vengano mescolate tra loro,
ovvero se una soluzione può valere zero in alcune zone e soddisfare (9.10) in altre.
In questo caso la risposta è no. Basta osservare che una funzione 𝑢 che soddisfa
l’equazione (9.10) può tendere a zero solamente quando 𝑥 → +∞ o 𝑥 → −∞. Questo
significa che se consideriamo una soluzione 𝑢(𝑥) definita su un intervallo 𝐼 e se in
9.2 metodi risolutivi 383

Figura 9.2: Il baffo di Peano formato


-2 -1 1 2 3 4 5 6 7 8 9
dalle soluzioni del problema di
Cauchy (9.11).
-1

-2

(interagisci)

almeno un punto la soluzione è diversa da zero, allora la soluzione è diversa da zero su


tutto 𝐼 e soddisfa l’equazione (9.10) in quanto la soluzione nulla e la soluzione (9.10)
non sono tra loro compatibili (non possono essere incollate con continuità).

Vedremo più avanti un risultato (proposizione 9.20) che garantisce in ipotesi molto
generali (che sono soddisfatte per questa equazione) due diverse soluzioni non possono
mai incontrarsi.

Esercizio 9.7. Fissato 𝑝 > 1 si risolva l’equazione differenziale

𝑢0 = 𝑢 𝑝

e si osservi che la soluzione presenta sempre un asintoto verticale (dunque non c’è
esistenza globale).

Esempio 9.8 (baffo di Peano). Si determinino tutte le soluzioni del problema di


Cauchy ( p3
𝑢 0(𝑥) = 𝑢(𝑥)
(9.11)
𝑢(0) = 0

Svolgimento. Osserviamo che la funzione nulla 𝑢(𝑥) = 0 è soluzione dell’equa-


zione e soddisfa la condizione 𝑢(0) = 0. Ma a priori non possiamo escludere
che ci siano altre soluzioni dell’equazione che verifichino la stessa condizione
(vedremo che la proposizione 9.20 non si applica in questo caso particolare).

Nei punti in cui 𝑢(𝑥) ≠ 0 possiamo riscrivere l’equazione nella forma

𝑢 0(𝑥)
p3 = 1.
𝑢(𝑥)

Integrando il lato sinistro tramite il cambio di variabili 𝑢 = 𝑢(𝑥), 𝑑𝑢 = 𝑢 0(𝑥) 𝑑𝑥 ,


si ottiene
𝑢 0(𝑥) 𝑑𝑢
∫ ∫ 
3 p3 2
𝑑𝑥 = √3 3 𝑢 (𝑥).
𝑢 𝑢=𝑢(𝑥) 2
p3
𝑢(𝑥)
384 9 equazioni differenziali

integrando anche il lato destro troviamo dunque che su ogni intervallo su cui 𝑢
è definita e 𝑢(𝑥) ≠ 0 deve esistere una costante 𝑐 tale che

3 p3 2
𝑢 (𝑥) = 𝑥 + 𝑐.
2
Risolvendo in 𝑢(𝑥): s
 3
2
𝑢(𝑥) = ± (𝑥 + 𝑐) . (9.12)
3
Osserviamo che la proprietà precedente può essere soddisfatta solamente se
𝑥 ≥ −𝑐 ma affinché sia 𝑢(𝑥) ≠p0 dobbiamo imporre 𝑥 > −𝑐 . Ma per 𝑥 → −𝑐 + si
ha 𝑢(𝑥) → 0 e anche 𝑢 0(𝑥) = 3 𝑢(𝑥) → 0. Significa che una soluzione definita
su 𝑥 > 𝑐 mediante la (9.12) può essere estesa a tutto ℝ ponendo 𝑢(𝑥) = 0 per
𝑥 ≤ 𝑐 . Affinché valga la condizione 𝑢(0) = 0 sarà dunque sufficiente imporre la
restrizione −𝑐 ≥ 0.

Il nostro problema ha dunque infinite soluzioni definite su tutto ℝ. Per la


precisione, per ogni 𝑐 ≥ 0 (cambiamo segno alla costante trovata prima, in
modo che risulti positiva) si hanno le soluzioni

per 𝑥 ≤ 𝑐
(
0
𝑢(𝑥) = q 3
2
3 (𝑥 − 𝑐) per 𝑥 > 𝑐

e
per 𝑥 ≤ 𝑐
(
0
𝑢(𝑥) = q
3
− 2
3 (𝑥 − 𝑐) per 𝑥 > 𝑐

altri metodi risolutivi

Nella sezione precedente abbiamo visto che le equazioni lineari del primo
ordine e le equazioni a variabili separabili possono essere ricondotte al calcolo
di una primitiva. Nella sezione 9.6 verranno esposti i metodi risolutivi per le
equazioni lineari di ordine 𝑛 a coefficienti costanti.

Ci sono molti altri tipi di equazioni che possono essere ricondotti alle equazioni
lineari o alle equazioni a variabili separabili. Non potremo dilungarci su questi
metodi ma può essere utile, come riferimento non esaustivo, un elenco di alcune
tipologie di equazioni per le quali esiste un metodo risolutivo.

1. Equazione del secondo ordine senza dipendenza da 𝑢

𝐹(𝑥, 𝑢 0 , 𝑢 00) = 0

si riconduce al primo ordine ponendo 𝑢 0(𝑥) = 𝑣(𝑥), 𝑢 00(𝑥) = 𝑣 0(𝑥).


2. Equazione del secondo ordine autonoma

𝐹(𝑢, 𝑢 0 , 𝑢 00) = 0
9.2 metodi risolutivi 385

si riconduce al primo ordine ponendo 𝑢 0(𝑥) = 𝑣(𝑢(𝑥)), 𝑢 00(𝑥) = 𝑣 0(𝑢(𝑥)) ·


𝑣(𝑢(𝑥)).
3. Equazione di Bernoulli
𝑢 0 = 𝑎(𝑥)𝑢 + 𝑏(𝑥)𝑢 𝛼
si riconduce ad una equazione lineare dividendo tutto per 𝑢 𝛼 e ponendo
𝑢(𝑥)1−𝛼 = 𝑣(𝑥), 𝑢𝑢𝛼 = 1𝑣−𝛼 .
0 0

4. Equazione di Clairaut
𝑢 = 𝑥𝑢 0 + 𝑓 (𝑢 0);
derivando l’equazione si ottiene 𝑢 0 = 𝑢 0 + 𝑥𝑢 00 + 𝑓 0(𝑢 0)𝑢 00 che si fattorizza:
𝑢 00 · (𝑥 + 𝑓 0(𝑢 0)) = 0. Il secondo fattore ci permette di determinare 𝑢 0(𝑥)
e inserendo 𝑢 0 nell’equazione originaria troviamo 𝑢(𝑥). Il primo fattore
𝑢 00 = 0 ci dà come soluzione una retta che, sostituendone l’equazione nella
equazione originaria, scopriamo essere tangente alla soluzione trovata
precedentemente. A queste soluzioni bisogna aggiungere le soluzioni
non 𝐶 2 formate da un tratto della curva inizale e che poi si staccano lungo
le semirette tangenti.
5. equazione di Riccati
𝑢 0 = 𝑢 2 + 𝑏(𝑥)𝑢 + 𝑐(𝑥).
si ponga 𝑢 0(𝑥) = −𝑣 0(𝑥)/𝑣(𝑥) per ricondursi ad una equazione lineare del
secondo ordine in 𝑣 ;

Esempio 9.9 (equazione di Newton). Un sistema fisico unidimensionale soggetto a


forze che dipendono solamente dalla posizione può essere descritto da un problema di
Cauchy:
 𝑢 (𝑥) = 𝐹(𝑢(𝑥))

 00


𝑢(𝑥 ) = 𝑢
0 0

 𝑢 0(𝑥0 ) = 𝑣0


(ad esempio per il pendolo si ha 𝐹(𝑦) = − sin 𝑦 ). La funzione 𝑣 definita da 𝑣(𝑢(𝑥)) =
𝑢 0(𝑥) mette in relazione la velocità con la posizione e descrive quindi il moto nel
cosiddetto spazio delle fasi. Con tale sostituzione si trova

𝑢 00(𝑥) = 𝑣 0(𝑢(𝑥))𝑢 0(𝑥) = 𝑣 0(𝑢(𝑥))𝑣(𝑢(𝑥))

che sostituita in 𝑢 00 = 𝐹(𝑢) ci dà una equazione differenziale del primo ordine per
𝑣 = 𝑣(𝑢):
𝑣 0 𝑣 = 𝐹(𝑢).
Questa è una equazione del primo ordine a variabili separabili che può essere interpretata
come la legge di conservazione dell’energia, infatti è equivalente a

𝑑 1 2
 ∫ 
𝑣 − 𝐹(𝑢) = 0
𝑑𝑥 2

dove 12 𝑣 2 si interpreta come energia cinetica e − 𝐹 come energia potenziale. Integrando
tra 𝑥 0 e 𝑥 e utilizzando le condizioni iniziali si ottiene, con 𝑢 = 𝑢(𝑥):
∫ 𝑢
1 2 1
𝑣 (𝑢) = 𝑣 02 + 𝐹(𝑦) 𝑑𝑦.
2 2 𝑢0
386 9 equazioni differenziali

Questa equazione descrive la traiettoria del sistema nel piano delle fasi (𝑢, 𝑣) e ci
permette di ricavare 𝑣 in funzione di 𝑢 :
s ∫ 𝑢
𝑣(𝑢) = ± 𝑣02 + 2 𝐹(𝑢) 𝑑𝑢
𝑢0

che significa:
s
∫ 𝑢(𝑥)
0
𝑢 (𝑥) = ± 𝑣02 +2 𝐹(𝑦) 𝑑𝑦. (9.13)
𝑢0

Questa è una equazione autonoma in 𝑢 , quindi a variabili separabili:

𝑢 0(𝑥)
±q ∫ 𝑢(𝑥) =1
𝑣02 − 𝑢0
𝐹(𝑦) 𝑑𝑦

che può essere integrata tra 𝑥 0 e 𝑥 facendo il cambio di variabile 𝑢 = 𝑢(𝑥)

𝑢(𝑥)
𝑑𝑢

± q ∫𝑢 = 𝑥 − 𝑥0 .
𝑢0 𝑣02 − 𝐹(𝑦) 𝑑𝑦
𝑢0

In questo modo abbiamo determinato la funzione inversa della soluzione 𝑢(𝑥).

Esempio 9.10 (periodo del pendolo). Sia 𝑢(𝑥) l’angolo di scostamento dalla
verticale al tempo 𝑥 di un pendolo semplice di lunghezza ℓ . Considerando la componente
tangenziale della accelerazione di gravità (il cui modulo è 𝑔 ) l’equazione di Newton può
essere scritta nella forma:
𝑔
𝑢 00(𝑥) = − sin 𝑢(𝑥).

𝑔
Siamo quindi nel caso dell’esempio precedente dove 𝐹(𝑢) = − ℓ sin 𝑢 e se al tempo
𝑥 = 0 lasciamo cadere da fermo il pendolo da un angolo 𝑢0 , si avrà 𝑣0 = 0. L’energia
potenziale sarà data allora da
𝑢
𝑔 𝑔

− sin 𝑦 𝑑𝑦 = (cos 𝑢 − cos 𝑢0 ).
ℓ 𝑢0 ℓ

L’equazione (9.13) diventa dunque

𝑔
r
0
𝑢 (𝑥) = ± 2 (cos 𝑢(𝑥) − cos 𝑢0 ).

Separando le variabili e integrando tra 0 e 𝑥 si ottiene


s ∫
𝑥 𝑥
ℓ 𝑢 0(𝑡) 𝑑𝑡

= 𝑑𝑡 = 𝑥.
𝑔
p
0 ± 2 cos 𝑢(𝑡) − 2 cos 𝑢0 0

Cambiando variabile 𝑢 = 𝑢(𝑥), 𝑑𝑢 = 𝑢 0(𝑥)𝑑𝑥 :


s ∫
𝑢(𝑥)
ℓ 𝑑𝑢
√ = 𝑥. (9.14)
𝑔 0 ± 2 cos 𝑢 − 2 cos 𝑢0
9.2 metodi risolutivi 387

La scelta del segno ± è arbitraria ma visto che 𝑢 è continua anche 𝑢 0 = − sin 𝑢 deve
essere una funzione continua. Dunque il segno ± può cambiare solo quando 𝑢 0 = 0.
Nel punto iniziale 𝑥 = 0 abbiamo imposto 𝑢 0(0) = 0 e dunque l’energia cinetica è nulla.
Visto che l’energia cinetica non può essere negativa significa che l’energia potenziale
non può aumentare e quindi inizialmente l’angolo 𝑢(𝑥) dovrà diminuire (o almeno:
non potrà aumentare). Dunque inizialmente il segno di 𝑢 0 è negativo e rimarrà negativo
finché non si avrà nuovamente 𝑢 0(𝑥) = 0. L’integrale in (9.14) è un integrale improprio
in quanto la funzione integranda presenta un asintoto per 𝑢 → 𝑢0− dobbiamo dunque
assicurarci che l’integrale sia finito. Sviluppando cos 𝑢 nel punto 𝑢 = 𝑢0 si trova
cos 𝑢 = cos 𝑢0 − sin 𝑢0 · (𝑢 − 𝑢0 ) + 𝑜(𝑢 − 𝑢0 ) da cui

1 1 𝐶
√ =p ∼√
2 cos 𝑢 − 2 cos 𝑢0 2 sin 𝑢0 · (𝑢0 − 𝑢) + 𝑜(𝑢 − 𝑢0 ) 𝑢0 − 𝑢

che è notoriamente una funzione integrabile per 𝑢 → 𝑢0− .

Vogliamo ora calcolare il tempo 𝑥 1 in cui il pendolo raggiunge per la prima volta la
verticale, cioè 𝑢(𝑥 1 ) = 0. Ricordiamo che al tempo 𝑥 = 0 il pendolo parte da un
angolo 𝑢0 con velocità nulla. Nell’intervallo 𝑥 ∈ [0 , 𝑥 1 ] si avrà 𝑢 0(𝑥) < 0 (l’angolo
diminuisce) dunque:
s ∫
0
ℓ 𝑑𝑢
− √ = 𝑥1 .
𝑔 𝑢0 2 cos 𝑢 − 2 cos 𝑢0

Una volta raggiunta la verticale, per simmetria il pendolo tornerà a risalire fino ad
un angolo −𝑢0 mettendoci lo stesso tempo 𝑥 1 . Poi tornerà a scendere e risalire fino a
tornare all’angolo 𝑢0 mettendoci in totale un tempo 𝑇 = 4 𝑥 1 che è quindi il periodo di
oscillazione. Si ha dunque
s ∫
𝑢0
𝑇 ℓ 𝑑𝑢
= √ .
4 𝑔 0 2 cos 𝑢 − 2 cos 𝑢0

Purtroppo l’integrale che abbiamo trovato non ha una primitiva esprimibile mediante
funzioni elementari (è un integrale ellittico). Il nostro obiettivo è ora quello di farne
uno sviluppo di Taylor per 𝑢0 → 0 che significa determinare il periodo del pendolo per piccole oscillazioni
piccole oscillazioni.

𝑢
Tramite formule di bisezione possiamo scrivere cos 𝑢 = 1 − 2 sin2 2 da cui
s
sin 𝑢2
2
𝑢0 𝑢
r 
p
2 cos 𝑢 − 2 cos 𝑢0 = 4 sin2 − 4 sin2 = 2 sin 𝑢0 1 −
2 2 sin 𝑢20

dunque ponendo
𝑢
sin 2
sin 𝑡 = 𝑢0 (9.15)
sin 2

si ha s
𝑢0 𝑢0
ℓ 𝑇 𝑑𝑢 𝑑𝑢
∫ ∫
· = √ = 𝑢0
𝑔 4 0
𝑢0
2 sin 2 1 − sin2 𝑡 0 2 sin 2 cos 𝑡
388 9 equazioni differenziali

ma per il cambio di variabile (9.15) si ha


𝑢
cos 2
cos 𝑡 𝑑𝑡 = 𝑑𝑢
2 sin 𝑢20

ovvero
𝑑𝑢 𝑑𝑡 𝑑𝑡
𝑢0 = =q
2 sin cos 𝑡 cos 𝑢2 𝑢0
2 1 − sin2 𝑡 sin2 2

e quindi
𝜋 𝜋 𝜋
𝑔 𝑇
r
𝑑𝑡 𝑑𝑡 𝑑𝑡
∫ ∫ ∫
2 2 2
· = = = .
ℓ 4 cos 𝑢2
q q
𝑢 𝑢0
0 0 1 − sin2 2
0 1 − sin2 2 sin2 𝑡

Utilizzando ora la serie binomiale (teorema 5.76) possiamo scrivere


𝜋
𝑔 𝑇 +∞  1  
r
−2 𝑢0  𝑘

2 X
· = − sin2 𝑡 sin2 𝑑𝑡.
ℓ 4 0 𝑘=0 𝑘 2
𝜋
+∞
(2 𝑘 − 1)!!  2 𝑢0  𝑘

2 X
= sin 𝑡 sin2 𝑑𝑡.
0 𝑘=0
(2 𝑘)!! 2

in quanto si ha
 
− 21 · − 32 · · · − 2 𝑘− 1
 
− 12
 
2
=
𝑘 𝑘!
(2 𝑘 − 1)!! (2 𝑘 − 1)!!
= (−1) 𝑘 𝑘 = (−1) 𝑘 .
2 · 𝑘! (2 𝑘)!!

Rispetto alla variabile sin2 𝑡 dentro all’integrale abbiamo ora una serie di potenze con
coefficienti
(2 𝑘 − 1)!!  2 𝑢0  𝑘
𝑎𝑘 = sin
(2 𝑘)!! 2
𝑎 𝑘+1
e si verifica facilmente che → sin2 𝑢20 dunque la serie di potenze converge se
𝑎𝑘
sin 𝑡 ≤
2 1
𝑢0 che significa semplicemente sin 𝑢2 < 1. Stiamo quindi facendo un
sin2 2
integrale esteso all’intero raggio di convergenza della serie. Sappiamo che la serie converge
totalmente e quindi uniformemente sugli intervalli chiusi strettamente contenuti nel
raggio di convergenza. Visto che la serie è a termini positivi le somme parziali convergono
alla somma della serie e sono tutte inferiori a tale somma. Abbiamo già visto, inoltre,
che la somma della serie è integrabile con integrale finito. Dunque possiamo applicare il
teorema di convergenza dominata (teorema 7.53 con 𝑓 = 𝑔 ) per scambiare la serie con
l’integrale:
𝜋
𝑔 𝑇 X+∞
r
(2 𝑘 − 1)!!  𝑢0  2 𝑘

2
· = sin (sin 𝑡)2 𝑘 𝑑𝑡
ℓ 4 𝑘=0
(2 𝑘)!! 2 0

l’integrale è ora sostanzialmente lo stesso 𝐼𝑛 che abbiamo calcolato nel teorema 6.87:
𝜋
𝜋
𝐼2 𝑘 𝜋 (2 𝑘 − 1)!!
∫ ∫
2
2𝑘 1
(sin 𝑡) 𝑑𝑡 = (sin 𝑡)2 𝑘 𝑑𝑡 = = ·
0 2 0 2 2 (2 𝑘)!!
9.3 funzioni vettoriali e di più variabili 389

da cui s
+∞ 2 
ℓ X (2 𝑘 − 1)!! 𝑢0  2 𝑘

𝑇 = 2𝜋 sin .
𝑔 𝑘=0 (2 𝑘)! 2

Possiamo allora cercare di scrivere i primi termini dello sviluppo di Taylor di 𝑇 = 𝑇(𝑢0 )
per 𝑢0 → 0 diciamo, per esempio, fino all’ordine 8 in 𝑢0 . Basterà considerare la somma
dei termini della serie per 𝑘 = 0 , 1 , 2 , 3 , 4 in quanto la somma dei termini per 𝑘 ≥ 5 mi
darà un contributo dell’ordine di 𝑂 sin 𝑢20
 10
= 𝑜(𝑢08 ). Dunque
 2 2 
𝑔 𝑇
r
𝑢0 𝑢0  2

1 1·3
· =1+ sin2 + sin2
ℓ 2𝜋 2 2 2·4 2
2  2 
𝑢0  3 𝑢0  4
 
1·3·5 1·3·5·7
+ sin 2
+ sin2 + 𝑜(𝑢08 )
2·4·6 2 2·4·6·8 2
!
1 𝑢0 𝑢4 𝑢6 𝑢8
2
=1+ − 4 0 + 5 02 − 8 20
4 4 2 ·3 2 ·3 ·5 2 ·3 ·5·7
!2
32 𝑢 𝑢4 𝑢6
2
+ 6 0 − 4 0 + 5 02
2 4 2 ·3 2 ·3 ·5
!3
52 𝑢 𝑢4 52 · 72 𝑢0
2 8
+ 8 0 − 40 + + 𝑜(𝑢08 )
2 4 2 ·3 214 28
𝑢02 𝑢04 𝑢06 𝑢08
=1+ − + −
24 26 · 3 27 · 32 · 5 210 · 32 · !5 · 7
3 2 𝑢04 𝑢6 𝑢8 𝑢8
+ − 5 0 + 8 0 2 + 6 02
26 24 2 ·3 2 ·3 2 ·3 ·5
!
52 𝑢 𝑢8
6
52 · 72
+ 8 60 − 80 + 22 𝑢08 + 𝑜(𝑢08 )
2 2 2 2
𝑢02 11 173 22931
=1+ + 𝑢4 + 𝑢6 + 𝑢 8 + 𝑜(𝑢08 ).
24 210 · 3 0 214 · 32 · 5 0 222 · 32 · 5 · 7 0

9.3 alcuni risultati preparatori sulle funzioni


vettoriali e di più variabili

Ci sarà utile estendere la definizione delle classi di regolarità 𝐶 𝑘 alle funzioni


vettoriali (cioè con codominio ℝ𝑛 ) e di più variabili (cioè con dominio ℝ𝑚 ).

Se Ω ⊆ ℝ𝑚 è un insieme aperto e 𝑓 : Ω → ℝ è una funzione, vogliamo


definire le derivate parziali di 𝑓 . Se 𝒙 ∈ Ω si ha 𝒙 = (𝑥 1 , . . . , 𝑥 𝑚 ) e quindi
𝑓 (𝒙) = 𝑓 (𝑥1 , . . . , 𝑥 𝑚 ). Se facciamo variare una sola componente 𝑥 𝑗 mantenendo
derivata parziale
fisse tutte le altre componenti, otteniamo una funzione di una variabile 𝑥 𝑗 ↦→
𝑔(𝑥 𝑗 ) = 𝑓 (𝑥 1 , . . . , 𝑥 𝑗 , . . . , 𝑥 𝑚 ). Definiamo dunque la derivata parziale di 𝑓
rispetto alla variabile 𝑥 𝑗 come la derivata della funzione 𝑔(𝑥 𝑗 ). Denotiamo tale
390 9 equazioni differenziali

derivata con il simbolo:


𝜕𝑓
.
𝜕𝑥 𝑗
Le derivate parziali si calcolano dunque come le usuali derivate per le funzioni
di una variabile, solamente bisogna considerare costanti tutte le variabili tranne
quella coinvolta nella derivazione. Ad esempio se 𝑓 (𝑥, 𝑣) = − sin(𝑥) − 𝑣 (come
nell’esempio fatto nell’introduzione) si ha

𝜕𝑓
= − cos(𝑥)
𝜕𝑥
𝜕𝑓
= −1 .
𝜕𝑣

Se 𝒇 : Ω ⊆ ℝ𝑚 → ℝ𝑛 è una funzione di più variabili a valori vettoriali potremo


scrivere 𝒇 = ( 𝑓1 , . . . , 𝑓𝑛 ) e considerare le derivate parziali di ogni componente:

𝜕𝒇 𝜕 𝑓1 𝜕 𝑓𝑛
 
= ,..., .
𝜕𝑥 𝑗 𝜕𝑥 𝑗 𝜕𝑥 𝑗

Definizione 9.11. Sia Ω ⊆ ℝ𝑚 un aperto. Denoteremo con 𝐶 0 (Ω, ℝ𝑛 ) lo spazio


vettoriale di tutte le funzioni continue 𝑓 : Ω → ℝ𝑛 .

Denotiamo con 𝐶 1 (Ω, ℝ𝑛 ) lo spazio vettoriale delle funzioni in 𝐶 0 (Ω, ℝ𝑛 ) tali che
𝜕𝑓
ognuna delle loro derivate parziali 𝜕𝑥 𝑗
esiste in ogni punto di Ω ed è a sua volta una
funzione continua (cioè in 𝑛 𝐶 𝑘 (Ω, ℝ𝑛 ) per
𝐶 (Ω, ℝ )). Ricorsivamente si definisce
0
𝑛
𝑘 > 1, come lo spazio delle funzioni Ω → ℝ tali che tutte le loro derivate parziali
stanno in 𝐶 𝑘−1 (Ω, ℝ𝑛 ).

Quando lo spazio di arrivo non è indicato si sottointende sempre ℝ, quindi 𝐶 𝑘 (Ω) =


𝐶 𝑘 (Ω, ℝ).

Teorema 9.12 (stabilità delle funzioni regolari). Sia Ω ⊆ ℝ𝑛 un aperto. Se


𝑓
𝑓 , 𝑔 ∈ 𝐶 𝑘 (Ω) allora anche 𝑓 + 𝑔 , 𝑓 − 𝑔 , 𝑓 · 𝑔 e 𝑔 (dove è definita) sono di classe 𝐶 𝑘 .
Se 𝑓 ∈ 𝐶 𝑘 (Ω) e 𝑔 ∈ 𝐶 𝑘 (ℝ) allora 𝑔 ◦ 𝑓 ∈ 𝐶 𝑘 (Ω).

Dimostrazione. Il fatto che la composizione di funzioni continue sia una funzione


continua è vero in generale in qualunque spazio metrico. Infatti se 𝑓 : 𝑋 → 𝑌
e 𝑔 : 𝑌 → 𝑍 e se 𝑥 𝑘 → 𝑥 in 𝑋 allora 𝑓 (𝑥 𝑘 ) → 𝑓 (𝑥) in 𝑌 (per la continuità
di 𝑓 ) e quindi 𝑔( 𝑓 (𝑥 𝑘 )) → 𝑔( 𝑓 (𝑥)) in 𝑍 (per la continuità di 𝑔 ). Dunque
(𝑔 ◦ 𝑓 )(𝑥 𝑘 ) → (𝑔 ◦ 𝑓 )(𝑥) e 𝑔 ◦ 𝑓 : 𝑋 → 𝑍 è continua.

Possiamo dunque osservare che le funzioni di due variabili 𝑠(𝑥, 𝑦) = 𝑥 + 𝑦 ,


𝑑(𝑥, 𝑦) = 𝑥 − 𝑦 e 𝑚(𝑥, 𝑦) = 𝑥 𝑦 sono funzioni continue da ℝ2 → ℝ (grazie
al teorema 2.28). Questo garantisce che la somma, la differenza e il prodotto
di funzioni continue siano funzioni continue. Anche il reciproco di funzioni
continue è una funzione continua in quanto la funzione 𝑟(𝑥) = 1/𝑥 è continua.
Ne consegue che il rapporto di funzioni continue è una funzione continua.

Veniamo ora alle derivate parziali. Per le regole di derivazione delle funzioni di
una variabile sappiamo che somma, prodotto, differenza, rapporto (ove definito)
9.4 il problema di Cauchy 391

e composizione di funzioni derivabili sono a loro volta funzioni derivabili e la


derivata si esprime sempre mediante somma, prodotto, differenza e rapporto
delle funzioni coinvolte e delle loro derivate. Dunque quello che si ottiene
combinando tra loro funzioni di classe 𝐶 𝑘 è una funzione continua le cui derivate
parziali esistono e sono di classe 𝐶 𝑘−1 , dunque è una funzione di classe 𝐶 𝑘 .

Definizione 9.13. Sia 𝒇 : [𝑎, 𝑏] → ℝ𝑚 , 𝒇 (𝑥) = ( 𝑓1 (𝑥), . . . , 𝑓𝑚 (𝑥)). Diremo che 𝒇 è


integrabile su [𝑎, 𝑏] se ogni 𝑓 𝑘 : [𝑎, 𝑏] → ℝ è integrabile su [𝑎, 𝑏] e in tal caso porremo:
∫ 𝑏 ∫ 𝑏 ∫ 𝑏 
𝒇 (𝑥) 𝑑𝑥 = 𝑓1 (𝑥) 𝑑𝑥, . . . , 𝑓𝑚 (𝑥) 𝑑𝑥 ∈ ℝ𝑚
𝑎 𝑎 𝑎

cosicché per ogni 𝑘 = 1 , . . . , 𝑚 si ha:


∫ 𝑏  ∫ 𝑏
𝒇 (𝑥) 𝑑𝑥 = 𝑓 𝑘 (𝑥) 𝑑𝑥.
𝑎 𝑘 𝑎

∫ 𝑎 ∫𝑏
Come al solito si pone inoltre 𝑏
𝒇 =− 𝑎
𝒇.

Teorema 9.14. Sia 𝒇 : [𝑎, 𝑏] → ℝ𝑚 integrabile. Allora si ha


∫ ∫
𝑏 𝑏
𝒇 (𝑥) 𝑑𝑥 ≤ | 𝒇 (𝑥)| 𝑑𝑥.


𝑎 𝑎

Dimostrazione. Posto ∫ 𝑏
𝒗= 𝒇 (𝑥) 𝑑𝑥
𝑎
si ha, usando la linearità dell’integrale e sfruttando la disuguaglianza di
Cauchy-Schwarz

𝑛 ∫ 𝑏 ∫ 𝑏X
𝑚
|𝒗| 2 = 𝒗 · 𝒗 =
X
𝑣𝑘 𝑓 𝑘 (𝑥) 𝑑𝑥 = 𝑣 𝑘 𝑓 𝑘 (𝑥) 𝑑𝑥
𝑘=1 𝑎 𝑎 𝑘=1
∫ 𝑏 ∫ 𝑏 ∫ 𝑏
= (𝒗, 𝒇 (𝑥)) 𝑑𝑥 ≤ |𝒗| · | 𝒇 (𝑥)| 𝑑𝑥 = |𝒗| | 𝒇 (𝑥)| 𝑑𝑥.
𝑎 𝑎 𝑎

Se |𝒗| ≠ 0 possiamo dividere ambo i membri per |𝒗| e ottenere la disuguaglianza


cercata. Altrimenti se |𝒗| = 0 la disuguaglianza è certamente soddisfatta in
quanto il lato destro non può essere negativo.

9.4 il problema di Cauchy

Il problema di Cauchy per i sistemi del primo ordine consiste nel trovare una
soluzione di un sistema di 𝑛 equazioni differenziali ordinarie del primo ordine
in 𝑛 incognite con un dato iniziale fissato. Cioè dato 𝑥 0 ∈ ℝ, e 𝒚 0 ∈ ℝ𝑛 si cerca
un intervallo 𝐼 ⊆ ℝ con 𝑥 0 ∈ 𝐼 e una funzione 𝒖 : 𝐼 → ℝ𝑛 che sia derivabile e
che soddisfi: (
𝒖 0(𝑥) = 𝒇 (𝑥, 𝒖(𝑥)), ∀𝑥 ∈ 𝐼
(9.16)
𝒖(𝑥0 ) = 𝒚0 .
392 9 equazioni differenziali

Definizione 9.15 (Cauchy-Lipschitz). Diremo che una funzione 𝒇 : Ω ⊆ ℝ ×


proprietà di Cauchy-Lipschitz
ℝ𝑛 → ℝ𝑚 soddisfa la proprietà di Cauchy-Lipschitz se 𝑓 è continua e se per ogni
(𝑥0 , 𝒚0 ) ∈ Ω esiste un intorno 𝑈 di (𝑥0 , 𝒚0 ) ed esiste 𝐿 ≥ 0 tale che se (𝑥, 𝒚1 ) ∈ 𝑈 e
(𝑥, 𝒚2 ) ∈ 𝑈 si ha
𝒇 (𝑥, 𝒚 ) − 𝒇 (𝑥, 𝒚 ) ≤ 𝐿 𝒚 − 𝒚

1 2 1 2

A parole potremmo dire: 𝒇 (𝑥, 𝒚) è localmente lipschitziana rispetto a 𝒚 uniformemente


rispetto a 𝑥 .

esistenza e unicità locale


per i sistemi del primo ordine Teorema 9.16 (Cauchy-Lipschitz, esistenza e unicità locale). Sia Ω un aperto
di ℝ × ℝ𝑛 e sia 𝒇 : Ω → ℝ𝑛 , una funzione con la proprietà di Cauchy-Lipschitz
(definizione 9.15).

Allora dato (𝑥 0 , 𝒚 0 ) ∈ Ω esiste 𝛿 > 0 tale che preso qualunque intervallo 𝐼 ⊆


[𝑥0 − 𝛿, 𝑥0 + 𝛿] con 𝑥0 ∈ 𝐼 esiste una unica funzione 𝒖 : 𝐼 → ℝ𝑛 tale che (𝑥, 𝒖(𝑥)) ∈ Ω
per ogni 𝑥 ∈ 𝐼 che soddisfa il problema di Cauchy (9.16).

Dimostrazione. L’idea della dimostrazione è che integrando ambo i lati dell’e-


quazione 𝒖 0 = 𝑓 (𝑥, 𝒖) e tenendo conto della condizione iniziale, si ottiene una
equazione del tipo 𝒖 = 𝑇(𝒖) dove 𝑇 è un operatore sullo spazio delle funzioni
continue. Scegliendo 𝛿 abbastanza piccolo si riuscirà a mostrare che le funzioni
definite su un intervallo di raggio 𝛿 intorno a 𝑥 0 risultano essere uno spazio
invariante per 𝑇 e, eventualmente rimpicciolendo ulteriormente 𝛿 si riuscità
poi a dimostrare che 𝑇 è una contrazione e quindi l’esistenza e unicità della
soluzione si ottiene dal teorema 7.37 del punto fisso di Banach-Caccioppoli.

Il primo passo è quello di trasformare il problema differenziale in un problema


integrale. Se 𝒖 è una funzione derivabile soluzione di (9.16) allora è chiaro
che 𝒖 0(𝑥) = 𝒇 (𝑥, 𝒖(𝑥)) è continua in quanto composizione di funzioni continue
e dunque 𝒖 è di classe 𝐶 1 . Possiamo dunque integrare tra 𝑥 0 e 𝑥 i due
lati dell’equazione differenziale, e usare la formula fondamentale del calcolo
integrale (teorema 6.22) per ottenere:
∫ 𝑥
𝒖(𝑥) − 𝒖(𝑥0 ) = 𝒇 (𝑠, 𝒖(𝑠)) 𝑑𝑠.
𝑥0

Dunque se 𝒖 risolve il problema di Cauchy allora 𝒖 soddisfa anche la seguente


equazione integrale:
∫ 𝑥
𝒖(𝑥) = 𝒚0 + 𝒇 (𝑠, 𝒖(𝑠)) 𝑑𝑠. (9.17)
𝑥0

Viceversa se 𝒖 è continua e soddisfa (9.17) allora si ha ovviamente 𝒖(𝑥 0 ) = 𝒚 0 e,


passando alle derivate (sempre grazie al teorema di Torricelli-Barrow 6.22), si
scopre che 𝒖 è derivabile e soddisfa l’equazione differenziale 𝒖 0(𝑥) = 𝒇 (𝑥, 𝒖(𝑥)).
Dunque trovare una soluzione 𝐶 1 del problema di Cauchy (9.16) è equivalente a
trovare una soluzione 𝐶 0 del problema integrale (9.17). Ci dedicheremo dunque
a questo secondo problema.

Fissato (𝑥 0 , 𝒚 0 ) ∈ Ω denotiamo con

𝐶 𝛼,𝛽 = (𝑥, 𝒚) ∈ ℝ × ℝ𝑛 : |𝑥 − 𝑥0 | ≤ 𝛼, 𝒚 − 𝒚0 ≤ 𝛽

9.4 il problema di Cauchy 393

il cilindro centrato in (𝑥 0 , 𝒚 0 ) con asse parallelo all’asse delle 𝑥 , di altezza 2 𝛼 e


raggio 𝛽 . Consideriamo un intorno 𝑈 di (𝑥 0 , 𝒚 0 ) in cui, grazie alle ipotesi, la
funzione 𝒇 sia 𝐿-lipschitziana uniformemente rispetto ad 𝑥 . L’intorno 𝑈 conterrà
certamente un cilindro 𝐶 𝛼,𝛽 per un qualche 𝛼 > 0 e 𝛽 > 0 sufficientemente
piccoli. Il cilindro 𝐶 𝛼,𝛽 è chiuso e limitato in Ω e dunque la funzione 𝒇 , essendo
continua, è limitata su 𝐶 𝛼,𝛽 per il teorema di Weierstrass. Sia 𝑀 > 0 tale che
| 𝒇 (𝑥, 𝒚)| ≤ 𝑀 per ogni (𝑥, 𝒚) ∈ 𝐶 𝛼,𝛽 e definiamo

𝛽 1
 
𝛿 = min 𝛼, , . (9.18)
𝑀 2𝐿

Il perché 𝛿 venga definito in questo modo si capirà nel prosieguo della dimostra-
zione. Consideriamo un qualunque intervallo 𝐼 ⊆ [𝑥 0 − 𝛿, 𝑥 0 + 𝛿] e definitamo
lo spazio di funzioni

𝑋 = {𝒖 ∈ 𝐶 0 (𝐼, ℝ𝑛 ) : 𝒖 − 𝒚0 ∞ ≤ 𝛽}.

Sappiamo che 𝐶 0 (𝐼, ℝ𝑛 ) è uno spazio metrico completo e 𝑋 è chiuso quindi an-
ch’esso è completo. Possiamo allora considerare l’operatore 𝑇 : 𝑋 → 𝐶 0 (𝐼, ℝ𝑛 )
definito da: ∫ 𝑥
𝑇(𝒖)(𝑥) = 𝒚0 + 𝒇 (𝑠, 𝒖(𝑠)) 𝑑𝑠.
𝑥0

Vogliamo innanzitutto verificare che 𝑋 è invariante, cioè che 𝑇(𝑋) ⊆ 𝑋 . Se


𝒖 ∈ 𝑋 e se 𝑥 ∈ 𝐼 si ha (𝑥, 𝒖(𝑥)) ∈ 𝐶 𝛿,𝛽 ⊆ 𝐶 𝛼,𝛽 e dunque (usando anche (9.18) e
il teorema 9.14)
𝑥 𝑥
∫ ∫
𝒇 (𝑠, 𝒖(𝑠)) 𝑑𝑠 ≤ 𝑀 𝑑𝑠 = |𝑥 − 𝑥 0 |𝑀 ≤ 𝛿𝑀 ≤ 𝛽.

𝑻 (𝑢)(𝑥) − 𝒚 =
0
𝑥0 𝑥0

Dunque 𝑇(𝒖) − 𝒚 0 ≤ 𝛽 e 𝑇(𝒖) ∈ 𝑋 . Abbiamo dunque che 𝑇 : 𝑋 → 𝑋 .


Verifichiamo ora che 𝑇 è una contrazione. Si ha:


∫ 𝑥
|𝑇(𝒖 1 )(𝑥) − 𝑇(𝒖 2 )(𝑥)| ≤ | 𝒇 (𝑠, 𝒖 1 (𝑠)) − 𝒇 (𝑠, 𝒖 2 (𝑠))| 𝑑𝑠


∫𝑥0𝑥
𝐿|𝒖 1 (𝑠) − 𝒖 2 (𝑠)| 𝑑𝑠


𝑥0
≤ 𝐿|𝑥 − 𝑥0 |k𝒖 1 − 𝒖 2 k ∞ ≤ 𝐿𝛿k𝒖 1 − 𝒖 2 k ∞

ovvero, facendo l’estremo superiore al variare di 𝑥 ∈ 𝐼 :

1
k𝑇(𝒖 1 ) − 𝑇(𝒖 2 )k ∞ ≤ 𝐿𝛿k𝒖 1 − 𝒖 2 k ∞ ≤ k𝒖 1 − 𝒖 2 k.
2
Dunque 𝑇 : 𝑋 → 𝑋 è una contrazione su uno spazio metrico completo. Per
il teorema di punto fisso di Banach-Caccioppoli 7.37 sappiamo quindi che
esiste una unica funzione 𝒖 ∈ 𝑋 ovvero 𝒖 : 𝐼 → ℝ𝑛 che soddisfa 𝑇(𝒖) = 𝒖
ovvero (9.17) ovvero (9.16).

La condizione di Cauchy-Lipschitz può sembrare piuttosto complicata da


verificare. Una condizione molto più semplice è che la funzione 𝒇 sia di classe
394 9 equazioni differenziali

𝐶 1 . La seguente proposizione ci dice che tale condizione è sufficiente per


applicare il teorema di Cauchy-Lipschitz.

Proposizione 9.17. Sia Ω ⊆ ℝ × ℝ𝑛 un insieme aperto. Se 𝒇 ∈ 𝐶 1 (Ω, ℝ𝑚 ) allora


𝑓 soddisfa la condizione di Cauchy-Lipschitz 9.15.

Un cubo di lato 2𝐿 centrato nel punto


𝒑 = (𝑝1 , . . . , 𝑝 𝑛 ) in ℝ𝑛 di ℝ𝑛 è l’insieme Dimostrazione. Se prendiamo un qualunque cubo chiuso 𝐾 ⊆ Ω ⊆ ℝ × ℝ𝑛
dato dal prodotto cartesiano 𝐾 = [𝑝 1 − centrato in (𝑥 0 , 𝒚 0 ), posto 𝒇 = ( 𝑓1 , . . . , 𝑓𝑚 ) sappiamo che ogni derivata parziale
𝐿, 𝑝1 + 𝐾] × · · · × [𝑝 𝑛 − 𝐿, 𝑝 𝑛 + 𝐿]
𝜕 𝑓 𝑘 /𝜕𝑦 𝑗 è continua ed è quindi
limitata (per il teorema di Weierstrass) su 𝐾 . Sia
𝐿 𝑘,𝑗 il massimo di 𝜕 𝑓 𝑘 /𝜕𝑦 𝑗 su 𝐾 e sia 𝐿 il massimo degli 𝐿 𝑘,𝑗 per 𝑘 = 1 , . . . 𝑚
e 𝑗 = 1 . . . , 𝑛 . Allora presi 𝒚, 𝒛 ∈ ℝ𝑛 con (𝑥, 𝒚), (𝑥, 𝒛) ∈ 𝐾 si può scomporre
l’incremento vettoriale 𝒛 − 𝒚 lungo le 𝑛 direzioni coordinate e applicare il
teorema di Lagrange lungo ogni direzione. Per ogni 𝑘 = 1 , . . . , 𝑚 si ha quindi:

| 𝑓 𝑘 (𝑥, 𝒛) − 𝑓 𝑘 (𝑥, 𝒚)|


𝑛
X
𝑓 𝑘 (𝑥, 𝑧1 , . . . , 𝑧 𝑗 , 𝑦 𝑗+1 , . . . , 𝑦𝑛 ) − 𝑓 𝑘 (𝑥, 𝑧1 , . . . , 𝑧 𝑗−1 , 𝑦 𝑗 , . . . , 𝑦𝑛 )


𝑗=1
𝑛
X 𝑛
X
𝐿 𝑗 𝑧 𝑗 − 𝑦 𝑗 ≤ 𝐿 𝑗 |𝑧 − 𝑦| ≤ 𝑛𝐿|𝑧 − 𝑦|


𝑗=1 𝑗=1

da cui
s
𝑚
| 𝑓 𝑘 (𝑥, 𝒛) − 𝑓 𝑘 (𝑥, 𝒚)| 2
X
| 𝒇 (𝑥, 𝒛) − 𝒇 (𝑥, 𝒚)| =
𝑘=1
s
𝑚
𝑛 2 𝐿2 |𝑧 − 𝑦| 2
X

𝑘=1

≤ 𝑛 𝑚𝐿|𝑧 − 𝑦|.

Abbiamo quindi mostrato che per ogni (𝑥 0 , 𝒚 0 ) ∈ Ω esiste un intorno del punto
(𝑥0 , 𝒚0 ) in cui la funzione 𝒇 soddisfa la condizione di Cauchy-Lipschitz.

Il teorema di Cauchy-Lipschitz garantisce l’esistenza di una soluzione definita in


un piccolo intervallo [𝑥 0 − 𝛿 0 , 𝑥 0 + 𝛿 0 ] intorno al punto iniziale 𝑥 0 . Se scegliamo
𝑥1 = 𝑥 0 + 𝛿 0 possiamo applicare nuovamente lo stesso teorema per trovare una
soluzione definita nell’intervallo [𝑥 1 − 𝛿 1 , 𝑥 1 + 𝛿 1 ] che coincida con la precedente
soluzione nel punto 𝑥 1 . Le due soluzioni coincidono sull’intersezione dei due
intervalli (grazie all’unicità della soluzione su ogni sotto-intervallo) e quindi
possono essere incollate per ottenere una soluzione definita sull’unione dei
due intervalli. Questo procedimento può essere ripetuto infinite volte ma gli
intervalli potrebbero diventare sempre più piccoli, quindi non c’è garanzia di
ottenere una soluzione definita su intervalli arbitrariamente grandi. Nel seguito
cercheremo di capire quanto grande può essere l’intervallo massimale su cui si
riesce ad estendere la soluzione.

Definizione 9.18 (soluzione/intervallo massimale). Sia 𝐼 ⊆ ℝ un intervallo non


vuoto e sia 𝒖 : 𝐼 → ℝ𝑛 una soluzione di una equazione differenziale.
9.4 il problema di Cauchy 395

Se 𝐽 ⊇ 𝐼 , 𝐽 ≠ 𝐼 è un intervallo, se 𝒗 : 𝐽 → ℝ𝑛 risolve la stessa equazione differenziale e


se 𝒗(𝑥) = 𝒖(𝑥) per ogni 𝑥 ∈ 𝐼 , diremo che 𝒗 è una estensione della soluzione 𝑢(𝑥). estensione della soluzione

Se la soluzione 𝒖 non ammette estensioni, diremo che 𝒖 è una soluzione definita su un


intervallo massimale o, più semplicemente, diremo che 𝒖 è una soluzione massimale. soluzione massimale

Proposizione 9.19 (caratterizzazione delle soluzioni massimali). Supponiamo


che 𝒇 : Ω ⊆ ℝ × ℝ𝑛 → ℝ𝑛 soddisfi la condizione di Cauchy-Lipschitz 9.15. Allora
una soluzione 𝒖 dell’equazione

𝒖 0(𝑥) = 𝒇 (𝑥, 𝒖(𝑥)) (9.19)

è definita su un intervallo massimale 𝐼 se e solo se 𝐼 è aperto e per ogni 𝐾 compatto


𝐾 ⊆ Ω e per ogni 𝑥0 ∈ 𝐼 esistono 𝑥1 , 𝑥2 ∈ 𝐼 , 𝑥1 < 𝑥 0 < 𝑥2 tali che 𝒖(𝑥1 ) ∉ 𝐾 e
𝒖(𝑥2 ) ∉ 𝐾 . Significa cioè che il grafico di 𝒖 cioè la curva (𝑥, 𝒖(𝑥)) esce da qualunque
compatto 𝐾 ⊆ Ω sia facendo crescere 𝑥 verso destra che facendo calare 𝑥 verso sinistra.
Intuitivamente il grafico della soluzione massimale tende ad arrivare ai limiti di Ω.

Dimostrazione. Prima implicazione. Supponiamo che 𝒖 : 𝐼 → ℝ𝑛 sia una soluzio-


ne di (9.19) definita su un intervallo massimale 𝐼 . Dovrà essere (𝑥, 𝒖(𝑥)) ∈ Ω
per ogni 𝑥 ∈ 𝐼 .

Mostriamo innanzitutto che 𝐼 è un intervallo aperto a destra: se non lo fosse si


avrebbe che 𝑥 0 = sup 𝐼 ∈ 𝐼 . Allora (𝑥 0 , 𝒖(𝑥 0 )) ∈ Ω e per il teorema di esistenza
e unicità locale potremmo trovare un intorno 𝐽 di 𝑥 0 e una funzione 𝒗 : 𝐽 → ℝ𝑛
che risolve (9.19) con 𝒗(𝑥 0 ) = 𝒖(𝑥 0 ). Per l’unicità delle soluzioni 𝒖 e 𝒗 devono
coincidere su 𝐼 ∩ 𝐽 e dunque facendo l’unione dei due grafici ottengo una
estensione di 𝒖 a tutto l’intervallo 𝐼 ∪ 𝐽 che è strettamente più grande di 𝐼 .
Dunque 𝒖 non poteva essere una soluzione massimale.

Mostriamo ora che la curva (𝑥, 𝒖(𝑥)) esce da ogni compatto 𝐾 ⊆ Ω sia da destra
che da sinistra. Supponiamo per assurdo che esista un compatto 𝐾 tale che
(𝑥, 𝒖(𝑥)) ∈ 𝐾 per ogni 𝑥 ∈ 𝐼 . Il grafico (𝑥, 𝒖(𝑥)) è limitato per 𝑥 ∈ 𝐼 dunque
certamente 𝐼 deve essere limitato. Inoltre abbiamo visto che 𝐼 è aperto e quindi
𝐼 = (𝑎, 𝑏) con 𝑎, 𝑏 ∈ ℝ, 𝑎 < 𝑏 .

Allora per ogni 𝑥 ∈ 𝐼 = (𝑎, 𝑏) si ha

|𝒖 0(𝑥)| = | 𝒇 (𝑥, 𝒖(𝑥))| ≤ sup | 𝒇 |.


𝐾

Visto che 𝒇 è continua (in quanto soddisfa le ipotesi del teorema di esistenza
e unicità) la funzione | 𝒇 | ha massimo su 𝐾 per il teorema di Weierstrass e
quindi esiste 𝑀 ≥ 0 tale che |𝒖 0(𝑥)| ≤ 𝑀 per ogni 𝑥 ∈ (𝑎, 𝑏). Significa che
ogni componente di 𝒖 è 𝑀 -lipschitziana, in particolare ogni componente è
uniformemente continua (teorema 7.36). Dunque la funzione 𝒖 può essere
estesa con continuità (teorema 7.34) ad una funzione 𝒗 : [𝑎, 𝑏] → ℝ𝑛 definita
anche agli estremi dell’intervallo. Visto che (𝑥, 𝒖(𝑥)) ∈ 𝐾 per ogni 𝑥 ∈ (𝑎, 𝑏)
e visto che 𝒗(𝑏) = lim𝑥→𝑏 − 𝒖(𝑥) essendo 𝐾 chiuso possiamo affermare che
(𝑏, 𝒗(𝑏)) ∈ 𝐾 . Lo stesso vale per 𝑥 → 𝑎 + dunque (𝑎, 𝒗(𝑎)) ∈ 𝐾 e dunque
(𝑥, 𝒗(𝑥)) ∈ 𝐾 ⊆ Ω per ogni 𝑥 ∈ [𝑎, 𝑏]. Vogliamo ora verificare che 𝒗 è soluzione
dell’equazione differenziale (9.19). Chiaramente 𝒗 soddisfa l’equazione per
396 9 equazioni differenziali

ogni 𝑥 ∈ (𝑎, 𝑏) in quanto su (𝑎, 𝑏) coincide con 𝒖 che è soluzione. Consideriamo


l’estremo 𝑏 . Visto che 𝒗 è continua in 𝑏 e 𝒇 è continua in (𝑏, 𝒗(𝑏)) si ha

lim 𝒗 0(𝑥) = lim 𝒇 (𝑥, 𝒗(𝑥)) = 𝒇 (𝑏, 𝒗(𝑏)) ∈ ℝ𝑛


𝑥→𝑏 − 𝑥→𝑏 −

Sappiamo però che se il limite della derivata di una funzione continua esiste ed
è finito, allora la funzione è derivabile nel punto limite e la derivata è continua
in quel punto (proposizione 5.26). Dunque 𝒗 è derivabile in 𝑏 e anche in quel
punto soddisfa l’equazione differenziale. Lo stesso vale nel punto 𝑎 . Dunque
siamo riusciti a trovare una estensione 𝒗 di 𝒖 contraddicendo l’ipotesi che 𝒖
fosse una soluzione massimale.

Seconda implicazione. Supponiamo ora 𝒖 : 𝐼 → ℝ𝑛 sia una soluzione dell’equa-


zione differenziale (9.19) definita su un intervallo 𝐼 e tale che la curva (𝑥, 𝒖(𝑥))
esca da ogni compatto 𝐾 al variare di 𝑥 ∈ 𝐼 . Vogliamo dimostrare che 𝒖 è
soluzione massimale. Innanzitutto 𝐼 non può essere compatto, altrimenti anche
𝐾 = {(𝑥, 𝒖(𝑥)) : 𝑥 ∈ 𝐼} sarebbe un compatto di Ω e ovviamente la curva non
esce da 𝐾 . Sia 𝑎 = inf 𝐼 e 𝑏 = sup 𝐼 . Siccome 𝐼 non è chiuso esso non contiene
uno dei due estremi: supponiamo sia 𝑏 . Allora se 𝒖 fosse estendibile a destra
esisterebbe una estensione continua 𝒗 : (𝑎, 𝑏] → ℝ𝑛 che coincide con 𝒖 su
(𝑎, 𝑏) e che è continua nel punto 𝑥 = 𝑏 e che soddisfa l’equazione differenziale
quindi, in particolare, (𝑏, 𝒗(𝑏)) ∈ Ω. Ma allora scelto 𝑥 0 ∈ (𝑎, 𝑏) prendiamo
𝐾 = {(𝑥, 𝒗(𝑥)) : 𝑥 ∈ [𝑥0 , 𝑏]}. Visto che 𝒗 : [𝑥0 , 𝑏] → ℝ𝑛 è continua è facile
verificare che 𝐾 è chiuso è limitato, 𝐾 ⊆ Ω. Ma ovviamente (𝑥, 𝒗(𝑥)) ∈ 𝐾 per
ogni 𝑥 ≥ 𝑥 0 , contro le ipotesi.

Proposizione 9.20 (separazione delle soluzioni). Se 𝒇 : Ω ⊆ ℝ × ℝ𝑛 → ℝ𝑛


soddisfa la condizione di Cauchy-Lipschitz e se 𝒖 : 𝐼 → ℝ𝑛 e 𝒗 : 𝐽 → ℝ𝑛 sono due
soluzioni dell’equazione differenziale 𝒖 0(𝑥) = 𝒇 (𝑥, 𝒖(𝑥)) definite su due intervalli
𝐼, 𝐽 ⊆ ℝ e se esiste 𝑥0 ∈ 𝐼 ∩ 𝐽 tale che 𝒖(𝑥0 ) = 𝒗(𝑥0 ) allora 𝒖(𝑥) = 𝒗(𝑥) per ogni
𝑥 ∈ 𝐼 ∩ 𝐽 . Detto in altri termini: nelle ipotesi del teorema di esistenza e unicità i grafici
di due soluzioni diverse definite in un intervallo non possono toccarsi.

Dimostrazione. Sia 𝑥 0 ∈ 𝐼 ∩ 𝐽 un punto in cui 𝒖(𝑥 0 ) = 𝒗(𝑥 0 ) e supponiamo per


assurdo che esista 𝑥 2 ∈ 𝐼 ∩ 𝐽 tale che 𝒖(𝑥 2 ) ≠ 𝒗(𝑥 2 ). In tal caso possiamo
considerare il punto

𝑥1 = sup {𝑥 ∈ [𝑥0 , 𝑥2 ] : 𝒖(𝑥) = 𝒗(𝑥)}.

Su tutto l’intervallo [𝑥 0 , 𝑥 1 ) si ha quindi 𝒖(𝑥) = 𝒗(𝑥) e per continuità dovrà


dunque anche essere 𝒖(𝑥 1 ) = 𝒗(𝑥 1 ). In pratica 𝑥 1 è l’ultimo punto di contatto
tra le due soluzioni. Ponendo allora il punto (𝑥 1 , 𝒖(𝑥 1 )) come dato iniziale del
problema di Cauchy scopriamo che 𝒖 e 𝒗 sono localmente due soluzioni di
tale problema. Per l’unicità locale le due soluzioni devono coincidere in un
piccolo intorno del punto 𝑥 1 , diciamo in particolare che devono coincidere su
[𝑥1 , 𝑥1 + 𝜀] ma questo è in contraddizione con la definizione di 𝑥 1 .

Teorema 9.21 (esistenza di soluzioni massimali). Sia 𝒖 : 𝐼 → ℝ𝑛 una soluzione


dell’equazione differenziale (9.19) definita su un intervallo non vuoto 𝐼 ⊆ ℝ e suppo-
niamo che tale equazioni soddisfi il teorema di esistenza e unicità locale (questo succede
9.4 il problema di Cauchy 397

ad esempio se 𝑓 ∈ 𝐶 1 ). Se 𝒖 non è essa stessa una soluzione massimale, esiste sempre


una estensione massimale 𝒗 : 𝐽 → ℝ𝑛 , 𝐽 ⊇ 𝐼 .

Dimostrazione. Supponiamo che 𝒖 non sia massimale, dunque 𝒖 ammette


estensioni. In particolare ammette estensioni definite su intervalli aperti, in
quanto se una soluzione è definita su un intervallo che non è aperto posso
sempre estenderla in un intorno aperto dei punti di frontiera dell’intervallo
mediante il teorema di esistenza locale ottenendo quindi una estensione definita
su un intervallo aperto.

Sia F l’insieme di tutte le estensioni di 𝒖 definite su intervalli aperti. Più


precisamente ogni 𝒘 ∈ F è una funzione 𝒘 : 𝐽𝒘 → ℝ𝑛 definita su un intervallo
aperto 𝐽𝒘 ⊇ 𝐼 che soddisfa l’equazione differenziale (9.19) e che coincide con 𝒖
su 𝐼 . Definiamo 𝒗 : 𝐽 → ℝ𝑛 come segue:
[
𝐽= 𝐽𝒘
𝒘∈F
𝒗(𝑥) = 𝒘(𝑥) se 𝑥 ∈ 𝐽𝒘 .

Si osservi che dato 𝑥 ∈ 𝐼 se 𝒘 1 , 𝒘 2 ∈ F sono due estensioni entrambe definite


su un punto 𝑥 , allora esse coincidono in 𝑥 per la Proposizione 9.20, dunque
𝒗(𝑥) è univocamente definita.

Essendo ogni 𝐽𝒘 aperto è chiaro che 𝐽 è aperto. E’ anche facile convincersi che
𝐽 deve essere un intervallo, in quanto tutti i 𝐽𝒘 hanno in comune i punti di 𝐼 .
Verifichiamo ora che 𝒗 soddisfa l’equazione differenziale. Preso un punto 𝑥 ∈ 𝐽
deve esistere 𝒘 tale che 𝑥 ∈ 𝐽𝒘 . Sappiamo che 𝒘 0(𝑥) = 𝑓 (𝑥, 𝒘(𝑥)) e visto che 𝒖
coincide con 𝒘 su 𝐽𝒘 possiamo dedurre che anche le derivate, in 𝑥 , coincidono:

𝒖 0(𝑥) = 𝒘 0(𝑥) = 𝑓 (𝑥, 𝒘(𝑥)) = 𝑓 (𝑥, 𝒖(𝑥)).

Dunque anche 𝒖 è soluzione di (9.19). In pratica abbiamo verificato che 𝒗 ∈ F


ed è quindi una estensione di 𝒖 . Vogliamo ora dimostrare che è una estensione
massimale. Supponiamo per assurdo che esista 𝒘 estensione di 𝒗 definita su
un intervallo 𝐽𝒘 ⊇ 𝐽 , 𝐽𝒘 ≠ 𝐽 . Posso supporre che 𝐽𝒘 sia aperto, perché in caso
contrario potrei estendere la soluzione 𝒘 in un intorno aperto dei punti di
frontiera dell’intervallo, mediante il teorema di esistenza locale, ottenendo una
estensione definita su un intervallo più grande ed aperto. Dunque 𝒘 ∈ F ma
allora, per definizione di 𝐽 , dovrà essere 𝐽 ⊇ 𝐽𝒘 : assurdo.

Teorema 9.22 (esistenza globale). Sia 𝐼 = (𝑎, 𝑏) ⊆ ℝ un intervallo aperto, Ω =


𝐼 × ℝ𝑛 e sia 𝒇 : Ω → ℝ𝑛 , 𝒇 = 𝒇 (𝑥, 𝒚) una funzione che soddisfa la proprietà di
Cauchy-Lipschitz e che sia sublineare in 𝒚 uniformemente rispetto a 𝑥 , cioè esistono
𝑚, 𝑞 ∈ ℝ tali che:

| 𝒇 (𝑥, 𝒚)| ≤ 𝑚|𝒚| + 𝑞, ∀(𝑥, 𝒚) ∈ Ω.

Allora per ogni 𝑥 0 ∈ 𝐼 e per ogni 𝒚 0 ∈ ℝ𝑛 esiste una funzione 𝒖 : 𝐼 → ℝ𝑛 (definita su


tutto 𝐼 ) soluzione del problema di Cauchy (9.16).

La dimostrazione richiede un lemma preliminare.


398 9 equazioni differenziali

Lemma 9.23 (Gronwall). Siano 𝑎, 𝑏 ∈ ℝ con 𝑎 < 𝑏 e siano 𝑚, 𝑞 ≥ 0. Sia


𝒖 : [𝑎, 𝑏) → ℝ𝑛 una funzione di classe 𝐶 1 tale che

|𝒖 0(𝑡)| ≤ 𝑚|𝒖(𝑡)| + 𝑞 ∀𝑡 ∈ [𝑎, 𝑏).

Allora 𝒖 è limitata.

Dimostrazione. Ricordando che

(|𝒖| 2 )0 = (𝒖 · 𝒖)0 = 2𝒖 · 𝒖 0

per ogni 𝑥 ∈ [𝑎, 𝑏) possiamo fare la seguente stima:


i𝑥 𝑥 𝑥
2𝒖(𝑡) · 𝒖 0(𝑡)
h ∫  0 ∫
ln(1 + |𝒖(𝑡)| 2 ) = ln(1 + |𝒖(𝑡)| 2 ) 𝑑𝑡 = 𝑑𝑡
𝑎 𝑎 𝑎 1 + |𝒖(𝑡)| 2
𝑥 𝑥
|𝒖(𝑡)||𝒖 0(𝑡)| |𝒖(𝑡)|(𝑚|𝒖(𝑡)| + 𝑞)
∫ ∫
≤2 𝑑𝑡 ≤ 2 𝑑𝑡
𝑎 1 + |𝒖(𝑡)| 2 𝑎 1 + |𝒖(𝑡)| 2
𝑥
𝑞|𝒖(𝑡)|
∫  
≤2 𝑚+ 𝑑𝑡
𝑎 1 + |𝒖(𝑡)| 2
≤ (𝑥 − 𝑎)(2𝑚 + 𝑞) ≤ (𝑏 − 𝑎)(2𝑚 + 𝑞)

avendo anche sfruttato la disuguaglianza 𝑠/(1 + 𝑠 2 ) ≤ 1/2 con 𝑠 = |𝒖(𝑡)| .


Dunque
ln(1 + |𝒖(𝑥)| 2 ) ≤ ln(1 + |𝒖(𝑎)| 2 ) + (𝑏 − 𝑎)(2𝑚 + 𝑞)
è una funzione limitata e di conseguenza anche |𝒖(𝑥)| è limitata.

Dimostrazione teorema 9.22. Sia 𝒖 una soluzione massimale del problema di


Cauchy e sia 𝐽 ⊆ 𝐼 l’intervallo massimale su cui 𝒖 è definita. Sia 𝑏 = sup 𝐽 .
Sappiamo quindi che 𝒖 è definita su [𝑥 0 , 𝑏) e quindi per il lemma precedente
deve essere limitata: esiste cioè 𝑀 > 0 per cui |𝒖(𝑥)| ≤ 𝑀 per ogni 𝑥 ∈ [𝑥 0 , 𝑏).
Se consideriamo il compatto

𝐾 = [𝑎, 𝑏] × 𝐵 𝑀 (0) = {(𝑥, 𝑦) ∈ ℝ × ℝ𝑛 : 𝑥 ∈ [𝑎, 𝑏], |𝑦| ≤ 𝑀}

abbiamo quindi verificato che (𝑥, 𝒖(𝑥)) ∈ 𝐾 per ogni 𝑥 ∈ [𝑎, 𝑏). Se fosse
𝑏 ∈ 𝐼 si avrebbe 𝐾 ⊆ Ω e quindi questo sarebbe in contraddizione con la
proposizione 9.19 che ci dice che ogni soluzione massimale esce da qualunque
compatto contenuto in Ω. Significa allora che 𝑏 ∉ 𝐼 e cioè che 𝑏 = sup 𝐽 = sup 𝐼
(non può essere sup 𝐽 > sup 𝐼 in quanto 𝐽 ⊆ 𝐼 ).

In maniera analoga (o per simmetria) si può dimostrare che inf 𝐽 = inf 𝐼 e


dunque 𝐽 = 𝐼 come volevamo dimostrare

9.5 il problema di Cauchy per equazioni di ordine 𝑛

Il problema di Cauchy per le equazioni di ordine 𝑛 è il problema di determinare


la soluzione di una equazione differenziale ordinaria di ordine 𝑛 in forma
normale accoppiato ad una condizione iniziale per il valore della funzione e
9.5 il problema di Cauchy per equazioni di ordine 𝑛 399

di tutte le sue derivate fino all’ordine 𝑛 . Dato Ω ⊆ ℝ × ℝ𝑛 aperto, 𝑓 ∈ 𝐶 0 (Ω),


𝒚 = (𝑦1 , . . . , 𝑦𝑛 ) ∈ ℝ𝑛 si tratta quindi di trovare un intervallo 𝐼 ⊆ ℝ e una
funzione 𝑢 ∈ 𝐶 𝑛 (𝐼) che soddisfi le seguenti condizioni:

𝑢 (𝑛) (𝑥) = 𝑓 (𝑥, 𝑢(𝑥), 𝑢 0(𝑥), . . . , 𝑢 (𝑛−1) (𝑥))






𝑢(𝑥0 ) = 𝑦1





𝑢 0(𝑥0 ) = 𝑦2


(9.20)
 ..
.





 𝑢 (𝑛−1) (𝑥0 ) = 𝑦𝑛 .


esistenza e unicità locale

Teorema 9.24 (esistenza e unicità per le equazioni di ordine 𝑛 ). Sia 𝑓 : Ω → ℝ


una funzione che soddisfa la condizione di Cauchy-Lipschitz. Allora il problema di
Cauchy (9.20) ammette una unica soluzione locale. Esiste cioè un 𝛿 > 0 tale che per
ogni intervallo 𝐼 ⊆ [𝑥 0 − 𝛿, 𝑥 0 + 𝛿] esiste una unica 𝑢 ∈ 𝐶 𝑛 (𝐼) che soddisfa (9.20). esistenza e unicità globale

Se poi Ω è della forma Ω = 𝐼 × ℝ𝑛 con 𝐼 ⊆ ℝ intervallo aperto e se 𝑓 è anche sublineare


(come nelle ipotesi di esistenza globale) allora il problema di Cauchy (9.20) ammette
una unica soluzione definita su tutto 𝐼 .

Dimostrazione. Se 𝑢 ∈ 𝐶 𝑛 è una funzione scalare possiamo considerare la


funzione vettoriale 𝒖 ∈ 𝐶 1 le cui componenti sono 𝑢 e le sue prime 𝑛 − 1
derivate:
𝒖(𝑥) = (𝑢(𝑥), 𝑢 0(𝑥), . . . , 𝑢 (𝑛−1) (𝑥))
ovvero 𝑢 𝑘 (𝑥) = 𝑢 (𝑘−1) (𝑥) per 𝑘 = 1 , . . . , 𝑛 essendo 𝒖(𝑥) = (𝑢1 (𝑥), . . . , 𝑢𝑛 (𝑥)).

Con questa trasformazione il problema (9.20) si può scrivere nella forma:



 𝑢10 (𝑥) = 𝑢2

𝑢20 (𝑥) = 𝑢3



..



.





𝑢 0
(𝑥) = 𝑢𝑛


 𝑛−1



𝑢 0 (𝑥) = 𝑓 (𝑥, 𝑢1 (𝑥), 𝑢2 (𝑥), . . . , 𝑢𝑛 (𝑥))
𝑛





𝑢1 (𝑥0 ) = 𝑦1




..



.





 𝑢𝑛 (𝑥0 ) = 𝑦𝑛


ovvero posto 𝒇 (𝑥, 𝒚) = (𝑦2 , 𝑦3 , . . . , 𝑦𝑛 , 𝑓 (𝑥, 𝒚)) abbiamo una funzione vettoriale
𝒇 : Ω → ℝ𝑛 e il problema (9.20) risulta equivalente a
(
𝒖 0(𝑥) = 𝒇 (𝑥, 𝒖(𝑥))
(9.21)
𝒖(𝑥0 ) = 𝒚.
400 9 equazioni differenziali

Visto che 𝑓 è continua, anche 𝒇 risulta continua. Verifichiamo se 𝒇 soddisfa la


condizione di Lipschitz. Per ipotesi 𝑓 la soddisfa, cioè esiste 𝐿 > 0 tale che:

| 𝑓 (𝑥, 𝒚) − 𝑓 (𝑥, 𝒛)| ≤ 𝐿|𝒚 − 𝒛|.

Ma allora si ha
s
𝑛
|𝑦 𝑘 − 𝑧 𝑘 | 2 + | 𝑓 (𝑥, 𝒚) − 𝑓 (𝑥, 𝒛)| 2
X
| 𝒇 (𝑥, 𝒚) − 𝒇 (𝑥, 𝒛)| =
𝑘=2
q √
≤ |𝒚 − 𝒛| 2 + 𝐿2 |𝒚 − 𝒛| 2 = 1 + 𝐿2 · |𝒚 − 𝒛|.

Dunque la funzione 𝒇 verifica le ipotesi del teorema di Cauchy-Lipschitz: esiste


dunque una soluzione 𝒖 di tale problema in un opportuno intervallo centrato
nel punto 𝑥 0 . Ponendo 𝑢 = 𝑢1 (la prima componente di 𝒖 ) si osserva che
𝑢 è di classe 𝐶 𝑛 . Infatti sappiamo che 𝒖 è di classe 𝐶 1 ed essendo 𝑢10 = 𝑢2 ,
𝑢20 = 𝑢3 , . . . , 𝑢𝑛− 𝑛
1 = 𝑢𝑛 ed essendo 𝑢𝑛 ∈ 𝐶 , si scopre che 𝑢 = 𝑢1 è di classe 𝐶
0 1

ed è una soluzione del problema (9.20). Anche l’unicità segue direttamente


dall’equivalenza delle due formulazioni.

L’esistenza globale segue in maniera analoga dal teorema per i sistemi del primo
ordine. Basti osservare che se la funzione 𝑓 soddisfa l’ipotesi di sublinearità
anche 𝒇 la soddisfa.

9.6 equazioni lineari di ordine 𝑛


equazioni lineari di ordine 𝑛
Le equazioni differenziali ordinarie lineari di ordine 𝑛 in forma normale possono
essere scritte nella forma:

𝑢 (𝑛) (𝑥) + 𝑎 𝑛−1 (𝑥)𝑢 (𝑛−1) (𝑥) + · · · + 𝑎1 (𝑥)𝑢 0(𝑥) + 𝑎0 𝑢(𝑥) = 𝑏(𝑥) (9.22)

con 𝑎 𝑘 : 𝐴 → ℝ, 𝑏 : 𝐴 → ℝ funzioni continue definite su uno stesso dominio


omogenea
𝐴 ⊆ ℝ. Nel caso 𝑏(𝑥) = 0 l’equazione si dice essere omogenea e si può scrivere
come:

𝑢 (𝑛) (𝑥) + 𝑎 𝑛−1 (𝑥)𝑢 (𝑛−1) (𝑥) + · · · + 𝑎 1 (𝑥)𝑢 0(𝑥) + 𝑎0 𝑢(𝑥) = 0. (9.23)

equazione non omogenea In generale l’equazione (9.22) viene chiamata equazione non omogenea e la
equazione omogenea associata
corrispondente equazione (9.23) viene chiamata equazione omogenea associata.

Teorema 9.25 (struttura delle soluzioni di una equazione lineare). Siano 𝑎 𝑘 ∈


𝐶 0 (𝐼) con 𝐼 ⊆ ℝ un intervallo aperto.

1. L’insieme 𝑉 delle soluzioni dell’equazione lineare omogenea (9.23) è un sottospazio


vettoriale di 𝐶 𝑛 (𝐼) di dimensione 𝑛 . Inoltre, fissato un punto qualunque 𝑥 0 ∈ 𝐼
jet
l’operatore 𝐽 : 𝑉 → ℝ𝑛 (chiamato jet) definito da

𝐽(𝑢) = (𝑢(𝑥0 ), 𝑢 0(𝑥0 ), 𝑢 00(𝑥 0 ), . . . , 𝑢 (𝑛−1) (𝑥0 )) (9.24)

è un operatore lineare bigettivo (cioè un isomorfismo di spazi vettoriali).


9.6 equazioni lineari di ordine 𝑛 401

2. L’insieme delle soluzioni dell’equazione non omogenea (9.22) è un sottospazio


affine di 𝐶 𝑛 (𝐴) di dimensione 𝑛 , parallelo al sottospazio delle soluzioni dell’equa-
zione omogenea associata (9.23). In particolare se 𝑢0 è una soluzione particolare
dell’equazione non omogenea (9.22) ogni altra soluzione 𝑢 di (9.22) si scrive
nella forma
𝑢 = 𝑢0 + 𝑣
con 𝑣 soluzione dell’equazione omogenea associata.

Dimostrazione. Innanzitutto il teorema 9.22 di esistenza globale garantisce che


le soluzioni delle equazioni (9.22) e (9.23) esistono e sono funzioni in 𝐶 𝑛 (𝐼).

Possiamo riscrivere l’equazione (9.22) nella forma

𝐿𝑢 = 𝑏

con
𝑛−1
X
𝐿𝑢 = 𝑢 (𝑛) + 𝑎 𝑘 𝑢 (𝑘)
𝑘=0

L’equazione omogenea (9.23) risulta quindi essere

𝐿𝑢 = 0.

Si osservi che 𝐿 : 𝐶 𝑛 (𝐼) → 𝐶 0 (𝐼) è un operatore lineare in quanto la somma, la


derivata e la moltiplicazione per una funzione sono operatori lineari sullo spazio
vettoriale delle funzioni. Dunque l’insieme 𝑉 delle soluzioni dell’equazione
omogenea non è altro che ker 𝐿 che notoriamente è uno spazio vettoriale visto
che se 𝐿(𝑢) = 0 e 𝐿(𝑣) = 0 allora anche 𝐿(𝜆𝑢 + 𝜇𝑣) = 𝜆𝐿(𝑢) + 𝜇𝐿(𝑣) = 0.

Possiamo ora determinare la dimensione di tale spazio, mettendo in corrispon-


denza le soluzioni dell’equazione con un loro dato iniziale, tramite l’applicazione
𝐽(𝑢) definita da (9.24). Chiaramente 𝐽 è lineare perché l’operatore derivata e la
valutazione in un punto sono operatori lineari. Osserviamo che 𝐽 è suriettivo
perché dato un qualunque 𝒚 ∈ ℝ𝑛 per il teorema 9.24 di esistenza (globale) di
soluzioni per il problema di Cauchy di ordine 𝑛 sappiamo esistere una soluzione
𝑢 ∈ 𝑉 tale che 𝐽(𝑢) = 𝒚. Ma 𝐽 è anche iniettivo perché se 𝑢, 𝑣 ∈ 𝑉 sono due
soluzioni con 𝐽(𝑢) = 𝐽(𝑣) significa che 𝑢 e 𝑣 verificano lo stesso problema di
Cauchy. Per l’unicità della soluzione risulta quindi 𝑢 = 𝑣 . Abbiamo quindi
mostrato che 𝐽 : 𝑉 → ℝ𝑛 è un isomorfismo di spazi vettoriali, quindi dim 𝑉 = 𝑛 .

Per quanto riguarda l’equazione non omogenea sia

𝑊 = {𝑣 ∈ 𝐶 𝑛 (𝐴) : 𝐿𝑣 = 𝑏}

l’insieme di tutte le soluzioni. Se consideriamo una soluzione particolare 𝑣 0 ∈ 𝑊


e se 𝑣 ∈ 𝑊 è una qualunque altra soluzione, si osserva che

𝐿(𝑣 − 𝑣0 ) = 𝐿(𝑣) − 𝐿(𝑣0 ) = 𝑏 − 𝑏 = 0.

Significa che 𝑢 = 𝑣 − 𝑣 0 è soluzione dell’equazione omogenea associata: 𝑢 ∈


𝑉 = ker 𝐿. Dunque ogni soluzione 𝑣 dell’equazione non omogenea si può
402 9 equazioni differenziali

scrivere nella forma 𝑣 = 𝑣 0 + 𝑢 con 𝑣 0 soluzione particolare della non omogenea


e 𝑢 soluzione generale dell’equazione omogenea associata ovvero

𝑊 = 𝑣0 + 𝑉.

Teorema 9.26 (maggiore regolarità delle soluzioni). Se 𝑢(𝑥) è una soluzione


dell’equazione differenziale lineare (9.22) e se i coefficienti 𝑎 1 , . . . , 𝑎 𝑛−1 , 𝑏 sono funzioni
di classe 𝐶 𝑚 per un certo 𝑚 ∈ ℕ allora la soluzione è di classe 𝐶 𝑚+𝑛 . In particolare se
i coefficienti sono di classe 𝐶 ∞ le soluzioni sono anch’esse di classe 𝐶 ∞ .

Dimostrazione. Se 𝑢 è soluzione di (9.22) per definizione sappiamo che 𝑢 è


derivabile 𝑛 volte nell’intervallo 𝐼 su cui è definita. Se scriviamo l’equazione in
forma normale:
𝑛−1
X
𝑢 (𝑛) (𝑥) = 𝑏(𝑥) − 𝑎 𝑘 (𝑥)𝑢 (𝑘) (𝑥)
𝑘=0

essendo 𝑎 𝑘 ∈ 𝐶 0 sappiamo che 𝑢 (𝑛) è continua dunque 𝑢 è di classe 𝐶 𝑛 .


Supponiamo ora che sia 𝑢 ∈ 𝐶 𝑗 per qualche 𝑗 ≥ 𝑛 . I coefficienti dell’equazione
sono di classe 𝐶 𝑚 e vengono moltiplicati per le derivate di 𝑢 che sono almeno di
classe 𝐶 𝑗−𝑛+1 . Se 𝑗 − 𝑛 + 1 ≤ 𝑚 allora il lato destro della precedente equazione
è di classe 𝑗 − 𝑛 + 1. Dunque 𝑢 (𝑛) ∈ 𝐶 𝑗−𝑛+1 da cui 𝑢 ∈ 𝐶 𝑗+1 . Un passo alla volta
è quindi possibile incrementare la regolarità di 𝑢 ∈ 𝐶 𝑗 finché 𝑗 − 𝑛 + 1 ≤ 𝑚 cioè
finché 𝑗 ≤ 𝑚 + 𝑛 − 1. A quel punto otteniamo 𝑢 ∈ 𝐶 𝑗+1 = 𝐶 𝑚+𝑛 .

Se i coefficienti sono di classe 𝐶 ∞ il procedimento non termina mai e si ottiene


dunque che anche 𝑢 è di classe 𝐶 ∞ .

9.7 equazioni lineari di ordine 𝑛 a coefficienti


costanti

Una equazione differenziale ordinaria di ordine 𝑛 a coefficienti costanti è una


equazione del tipo:
𝑛
X
𝑎 𝑘 · 𝑢 (𝑘) (𝑥) = 0 (9.25)
𝑘=0

con 𝑎 𝑘 ∈ ℝ. Senza perdita di generalità possiamo supporre che sia 𝑎 𝑛 ≠ 0


cosicchè tale equazione può essere scritta in forma normale e rientra nella casi-
stica generale che abbiamo considerato nel capitolo precedente. In particolare
sappiamo che lo spazio delle soluzioni è uno spazio vettoriale di dimensione
𝑛 . Osserviamo che il teorema di esistenza e unicità globale garantisce che
le soluzioni dell’equazione differenziale lineare a coefficienti costanti siano
funzioni di classe 𝐶 𝑛 definite su tutto ℝ. Ma i coefficienti costanti sono di classe
𝐶 ∞ dunque la maggiore regolarità delle soluzioni ci dice, in questo caso, che le
soluzioni dovranno essere funzioni di classe 𝐶 ∞ .

Per motivi puramente algebrici sarà utile considerare le funzioni a valori


complessi. Ricordiamo che se 𝑢(𝑥) è una funzione a valori complessi, allora si
9.7 equazioni lineari di ordine 𝑛 a coefficienti costanti 403

può scrivere 𝑢(𝑥) = 𝑓 (𝑥) + 𝑖 𝑔(𝑥) con 𝑓 e 𝑔 funzioni a valori reali. Si definisce
allora 𝑢 0(𝑥) = 𝑓 0(𝑥) + 𝑖 𝑔 0(𝑥). Denotiamo con 𝐷 : 𝐶 ∞ (ℝ , ℂ) → 𝐶 ∞ (ℝ , ℂ)
l’operatore derivata: 𝐷𝑢 = 𝑢 0.
Osserviamo esplicitamente che anche quando 𝜆 ∈ ℂ risulta, come nel caso
𝜆∈ℝ
𝐷𝑒 𝜆𝑥 = 𝜆𝑒 𝜆𝑥 . (9.26)
Si potrebbe fare la verifica diretta riconducendosi alle funzioni sin e cos tra-
mite le formule di Eulero ma questa è in realtà una proprietà fondamentale
dell’esponenziale complesso che discende direttamente dal teorema 3.45:

𝑒 𝜆(𝑥+ℎ) − 𝑒 𝜆𝑥 𝑒 𝜆ℎ − 1 𝑒 𝜆ℎ − 1
lim = lim 𝑒 𝜆𝑥 = 𝜆𝑒 𝜆𝑥 lim = 𝜆𝑒 𝜆𝑥 .
ℎ→0 ℎ ℎ→0 ℎ ℎ→0 𝜆ℎ

Se 𝑃 ∈ ℝ[𝑥] è un polinomio di grado 𝑛 possiamo valutare 𝑃 sull’operatore


derivata 𝐷 : 𝐶 ∞ (ℝ , ℂ) → 𝐶 ∞ (ℝ , ℂ). Questo ha senso perché sullo spazio
𝐶 ∞ (ℝ , ℂ) sono definite le operazioni di spazio vettoriale reale (somma e
prodotto per scalare) in più l’operazione di moltiplicazione 𝐷 · 𝐷 e quindi la
potenza 𝐷 𝑘 va intesa come composizione dell’operatore lineare con se stesso. In
pratica l’operatore 𝑃(𝐷) : 𝐶 ∞ (ℝ , ℂ) → 𝐶 ∞ (ℝ , ℂ) risulta definito come segue
𝑛 𝑛
𝑎𝑘 𝐷𝑘 𝑢 =
X X
𝑃(𝐷)[𝑢] = 𝑎 𝑘 𝑢 (𝑘)
𝑘=0 𝑘=0

(utilizziamo le parentesi quadre per indicare, come convenzione, che la funzione


è lineare in quell’argomento). Si osservi che 𝐷 0 = 𝐼 è l’identità ma tenendo
valida la convenzione 𝐷 0 = 1 ci capiterà di scrivere 𝜆 al posto di 𝜆𝐼 quando
𝜆 ∈ ℝ.
L’equazione lineare omogenea a coefficienti costanti (9.25) si può scrivere più
espressivamente nella forma

𝑃(𝐷)[𝑢] = 0

Se l’equazione è in forma normale si avrà deg 𝑃 = 𝑛 (in quanto il cofficiente 𝑎 𝑛


del termine di grado massimo è 1 per le equazioni in forma normale).

Teorema 9.27. Sia 𝑃 un polinomio e sia 𝜆 ∈ ℂ una radice di 𝑃 con molteplicità


𝑚 . Allora se 𝑝(𝑥) è un polinomio (a coefficienti complessi) di grado inferiore a 𝑚 , la
funzione 𝑢(𝑥) = 𝑝(𝑥)𝑒 𝜆𝑥 è soluzione (complessa) dell’equazione differenziale

𝑃(𝐷)[𝑢] = 0.

Dimostrazione. Se il polinomio 𝑃(𝑡) ha una radice 𝜆 con molteplicità 𝑚 significa


che 𝑃(𝑡) è divisibile per (𝑡 − 𝜆)𝑚 cioè esiste un polinomio 𝑅(𝑡) tale che

𝑃(𝑡) = 𝑅(𝑡) · (𝑡 − 𝜆)𝑚 .

Ma allora possiamo decomporre anche l’equazione differenziale:

𝑃(𝐷)[𝑢] = 𝑅(𝐷)[(𝐷 − 𝜆)𝑚 𝑢].


404 9 equazioni differenziali

Se 𝑢(𝑥) = 𝑝(𝑥)𝑒 𝜆𝑥 si ha, utilizzando (9.26),

(𝐷 − 𝜆)𝑢(𝑥) = 𝐷𝑢(𝑥) − 𝜆𝑢(𝑥) = 𝑝 0(𝑥)𝑒 𝜆𝑥 + 𝑝(𝑥)𝜆𝑒 𝜆𝑥 − 𝜆𝑝(𝑥)𝑒 𝜆𝑥


= 𝑝 0(𝑥)𝑒 𝜆𝑥 ,

da cui
(𝐷 − 𝜆)𝑚 𝑢(𝑥) = 𝑝 (𝑚) (𝑥) · 𝑒 𝜆𝑥 .
Visto che la derivata di un polinomio è un polinomio di grado inferiore, se
il polinomio 𝑝 ha grado inferiore a 𝑚 risulta che 𝑝 (𝑚) = 0. Dunque, come
volevamo dimostrare,

𝑃(𝐷)[𝑢] = 𝑅(𝐷)[(𝐷 − 𝜆)𝑚 𝑢] = 𝑅(𝐷)[0] = 0.

Teorema 9.28 (indipendenza delle soluzioni fondamentali complesse). Il sot-


toinsieme B di 𝐶 ∞ (ℝ , ℂ) dato dalle funzioni 𝑢(𝑥) della forma

𝑢(𝑥) = 𝑥 𝑚 𝑒 𝜆𝑥

al variare di 𝑚 ∈ ℕ , e 𝜆 ∈ ℂ è un sottoinsieme linearmente indipendente dello spazio


vettoriale 𝐶 ∞ (ℝ , ℂ) sul campo ℂ.

Dimostrazione. Si tratta di mostrare che se una combinazione lineare finita di


tali funzioni è identicamente nulla, allora tutti i coefficienti sono nulli.

Supponiamo per assurdo che esistano 𝑢1 , . . . , 𝑢𝑁 ∈ B

𝑢 𝑘 (𝑥) = 𝑥 𝑚 𝑘 𝑒 𝜆 𝑘 𝑥 , 𝑘 = 1, . . . , 𝑁

tali che
𝑁
𝑐 𝑘 𝑥 𝑚𝑘 𝑒 𝜆𝑘 𝑥 = 0
X
∀𝑥 ∈ ℝ
𝑘=1

per una qualche scelta di coefficienti 𝑐 𝑘 ∈ ℂ non tutti nulli. Sommando assieme
i monomi che moltiplicano gli esponenziali con lo stesso coefficiente, potremo
riscrivere la relazione precedente nella forma:

𝑀
𝑃 𝑗 (𝑥)𝑒 𝜆 𝑗 𝑥 = 0
X
∀𝑥 ∈ ℝ (9.27)
𝑗=1

con i coefficienti 𝜆 𝑗 tutti diversi tra loro e con 𝑃 𝑗 polinomi non nulli.

Abbiamo già osservato che (𝐷 − 𝜆)𝑃(𝑥)𝑒 𝜆𝑥 = 𝑃 0(𝑥)𝑒 𝜆𝑥 mentre se 𝜆 ≠ 𝜇 si ha


(𝐷 − 𝜆)𝑃(𝑥)𝑒 𝜇𝑥 = 𝑄(𝑥)𝑒 𝜇𝑥 con 𝑄 polinomio dello stesso grado di 𝑃 in quanto:

(𝐷 − 𝜆)𝑃(𝑥)𝑒 𝜇𝑥 = (𝑃 0(𝑥) + (𝜇 − 𝜆)𝑃(𝑥))𝑒 𝜇𝑥 .


9.7 equazioni lineari di ordine 𝑛 a coefficienti costanti 405

Posto 𝑑 𝑗 = deg 𝑃 𝑗 applichiamo all’equazione (9.27) l’operatore (𝐷−𝜆1 )𝑑1 . Quello


che si ottiene è:
𝑀
𝑘 1 𝑒 𝜆1 𝑥 + 𝑄 𝑗 (𝑥)𝑒 𝜆 𝑗 𝑥 = 0
X
∀𝑥 ∈ ℝ (9.28)
𝑗=2

dove 𝑘 1 è la derivata 𝑑1 -esima del polinomio 𝑃1 . Visto che 𝑃1 è un polinomio di


grado 𝑑1 la sua derivata 𝑑1 -esima è un polinomio di grado 0 non nullo, dunque
è una costante 𝑘 1 ≠ 0. I polinomi 𝑄 𝑗 hanno invece lo stesso grado dei 𝑃 𝑗 perché
abbiamo visto che se 𝜆 ≠ 𝜇 il grado del polinomio non cambia.

Ora applichiamo in sequenza all’equazione (9.28) gli operatori (𝐷 − 𝜆 𝑗 )𝑑 𝑗 +1 per


𝑗 = 2, . . . , 𝑀 . Applicando tali operatori il coefficiente 𝑘 1 cambierà, ma rimarrà
comunque diverso da zero (chiamiamolo 𝑘 ≠ 0) mentre tutti gli altri polinomi
verranno annullati, perché i rispettivi polinomi vengono derivati una volta in
più del loro grado. Si otterrà quindi:

𝑘𝑒 𝜆1 𝑥 = 0 ∀𝑥 ∈ ℝ.

Ma questo è assurdo perché per 𝑥 = 0 si ottiene 𝑘 = 0, che abbiamo escluso.

I risultati precedenti ci permettono di determinare tutte le soluzioni reali delle


equazioni lineari omogenee a coefficienti costanti come nel seguente esempio.

Esempio 9.29. Si determinino tutte le soluzioni dell’equazione differenziale

𝑢 (5) (𝑥) + 2𝑢 000(𝑥) + 𝑢 0(𝑥) = 0.

Svolgimento. L’equazione può essere scritta nella forma

𝑃(𝐷)[𝑢] = 0

con 𝑃(𝑡) = 𝑡 5 + 2𝑡 3 + 𝑡 . Possiamo fattorizzare il polinomio 𝑃 nel campo


complesso:
𝑡 5 + 2𝑡 3 + 𝑡 = 𝑡(𝑡 2 + 1)2 = 𝑡(𝑡 + 𝑖)2 (𝑡 − 𝑖)2 .
Il polinomio ha una radice 𝜆0 = 0 con molteplicità uno e due radici complesse
coniugate 𝜆1 = 𝑖 , 𝜆2 = −𝑖 con molteplicità due. Risulta quindi che le seguenti
funzioni devono essere soluzioni complesse dell’equazione:

1, 𝑒 𝑖𝑥 , 𝑥𝑒 𝑖𝑥 , 𝑒 −𝑖𝑥 , 𝑥𝑒 −𝑖𝑥 .

Per il teorema precedente sappiamo che queste funzioni sono indipendenti.


Tramite la formula di Eulero possiamo scrivere:

𝑒 𝑖𝑥 = cos 𝑥 + 𝑖 sin 𝑥, 𝑒 −𝑖𝑥 = cos 𝑥 − 𝑖 sin 𝑥

da cui si ottiene che anche le funzioni

1, cos 𝑥, 𝑥 cos 𝑥, sin 𝑥, 𝑥 sin 𝑥 (9.29)


406 9 equazioni differenziali

generano lo stesso spazio di soluzioni e sono quindi anch’esse indipendenti.


Dunque lo spazio generato ha dimensione 5, come l’ordine dell’equazione.
Per il teorema 9.25sappiamo però che anche lo spazio di tutte le soluzioni
ha dimensione pari all’ordine dell’equazione, dunque lo spazio che abbiamo
determinato esaurisce tutte le soluzioni. Ogni soluzione reale o complessa si
potrà dunque scrivere nella forma:

𝑢(𝑥) = 𝑐 1 + 𝑐 2 cos 𝑥 + 𝑐 3 sin 𝑥 + 𝑐 4 𝑥 cos 𝑥 + 𝑐5 𝑥 sin 𝑥 (9.30)

con 𝑐 1 , 𝑐 2 , . . . , 𝑐 5 ∈ ℂ opportuni coefficienti complessi.

Se i coefficienti 𝑐 1 , 𝑐 2 , . . . , 𝑐 5 sono reali si otterranno certamente soluzioni


reali ma è anche vero il viceversa: ogni soluzione reale si può scrivere nella
forma (9.30) con coefficienti 𝑐 1 , 𝑐 2 , . . . , 𝑐 5 reali. Infatti se prendiamo la parte
immaginaria di (9.30) e poniamo 𝑏 𝑗 = Im 𝑐 𝑗 otteniamo:

0 = 𝑏 1 + 𝑏 2 cos 𝑥 + 𝑏 3 sin 𝑥 + 𝑏 4 𝑥 cos 𝑥 + 𝑏 5 𝑥 sin 𝑥.

Visto che le funzioni scelte sono indipendenti, una combinazione lineare nulla
ha tutti i coefficienti nulli: 𝑏 𝑗 = 0 e quindi i coefficienti 𝑐 𝑗 sono tutti reali.

Formalizzando in generale il metodo utilizzato nell’esercizio precedente possia-


mo dare il seguente enunciato.

Teorema 9.30 (soluzioni dell’equazione lineare omogenea a coefficienti costanti).


Se 𝑃(𝑡) è un polinomio a coefficienti reali. Ogni soluzione 𝑢 : ℝ → ℝ dell’equazione
differenziale
𝑃(𝐷)[𝑢] = 0
si scrive nella forma

𝑛𝑘
𝑁 X 𝑚𝑙
𝑀 X
𝑐 𝑘 𝑗 𝑥 𝑗 𝑒 𝜆𝑘 𝑥 + 𝑥 𝑗 𝑒 𝛼 𝑘 𝑥 (𝑎 𝑘 𝑗 cos(𝛽 𝑘 𝑥) + 𝑏 𝑘 𝑗 sin(𝛽 𝑘 𝑥))
X X
𝑢(𝑥) = (9.31)
𝑘=1 𝑗=1 𝑘=1 𝑗=1

dove 𝜆1 , . . . , 𝜆 𝑁 sono le radici reali del polinomio 𝑃(𝑡), 𝑛1 , . . . , 𝑛 𝑁 sono le rispettive


molteplicità, 𝛼 𝑘 ± 𝑖𝛽 𝑘 sono le radici complesse coniugate (non reali) del polinomio 𝑃
con 𝑘 = 1 , . . . , 𝑀 ognuna con molteplicità 𝑚 𝑘 e infine 𝑐 𝑘 𝑗 , 𝑎 𝑘 𝑗 , 𝑏 𝑘 𝑗 ∈ ℝ sono costanti
arbitrarie.

Dimostrazione. Sappiamo che le funzioni complesse

𝑥 𝑗 𝑒 𝜆𝑘 𝑥 , 𝑥 𝑗 𝑒 (𝛼 𝑘 +𝑖𝛽 𝑘 )𝑥 (9.32)

sono soluzioni dell’equazione se 𝑗 è inferiore alla molteplicità della corrispon-


dente radice reale 𝜆 𝑘 o complessa 𝛼 𝑘 + 𝑖𝛽 𝑘 . Dunque

𝑢 𝑘,𝑗 (𝑥) = 𝑥 𝑗 𝑒 𝜆 𝑘 𝑥
9.7 equazioni lineari di ordine 𝑛 a coefficienti costanti 407

è soluzione se 𝑗 < 𝑛 𝑘 . Per le radici complesse applichiamo la formula di Eulero:

1 𝑗 (𝛼 𝑘 +𝑖𝛽 𝑘 )𝑥 1 𝑗 (𝛼 𝑘 −𝑖𝛽 𝑘 )𝑥
𝑥 𝑗 𝑒 𝛼 𝑘 𝑥 cos(𝛽 𝑘 𝑥) =
𝑥 𝑒 + 𝑥 𝑒 (9.33)
2 2
𝑗 𝛼𝑘 𝑥 1 𝑗 (𝛼 𝑘 +𝑖𝛽 𝑘 )𝑥 1
𝑥 𝑒 sin(𝛽 𝑘 𝑥) = 𝑥 𝑒 − 𝑥 𝑗 𝑒 (𝛼 𝑘 −𝑖𝛽 𝑘 )𝑥 (9.34)
2𝑖 2𝑖
dunque anche le funzioni

𝑣 𝑘 𝑗 (𝑥) = 𝑥 𝑗 𝑒 𝛼 𝑘 𝑥 cos 𝑥, 𝑤 𝑘 𝑗 (𝑥) = 𝑥 𝑗 𝑒 𝛼 𝑘 𝑥 sin 𝑥

essendo combinazione lineare di soluzioni, sono anch’esse soluzioni. Queste


soluzioni sono inoltre indipendenti in quanto le funzioni in (9.32) lo sono (per
il teorema precedente) e possono essere ricondotte alle (9.33) tramite la formula
di Eulero.

Abbiamo dunque trovato un insieme formato da

𝑁
X 𝑀
X
𝑛= 𝑛𝑘 + 2 𝑚𝑘
𝑘=1 𝑘=1

soluzioni reali indipendenti. Il numero 𝑛 è pari alla somma delle molteplicità


delle radici (reali e complesse) del polinomio 𝑃 e dunque, per il teorema
fondamentale dell’algebra, coincide con il grado di 𝑃 . Sappiamo allora che
lo spazio delle soluzioni di 𝑃(𝐷)[𝑢] = 0 ha dimensione 𝑛 e quindi abbiamo
trovato una base di tutte le soluzioni reali. Significa che ogni soluzione si scrive
nella forma (9.31).

Osservazione 9.31 (fase delle soluzioni oscillanti). Quando si vanno a scrivere le


soluzioni nella forma (9.31) può essere utile osservare che ogni combinazione lineare di
seni e coseni con la stessa pulsazione 𝛽 è una singola onda eventualmente sfasata di un
angolo 𝜃 :
𝑎 cos(𝛽𝑥) + 𝑏 sin(𝛽𝑥) = 𝜌 cos(𝛽𝑥 − 𝜃)

dove 𝜌 = |𝑎 + 𝑖𝑏| = 𝑎 2 + 𝑏 2 e 𝜃 = arg(𝑎 + 𝑖𝑏). Infatti posto 𝑎 = 𝜌 cos 𝜃 ,
𝑏 = 𝜌 sin 𝜃 si ha, grazie alla formula di addizione:

𝑎 cos(𝛽𝑥) + 𝑏 sin(𝛽𝑥) = 𝜌(cos 𝜃 cos(𝛽𝑥) + sin 𝜃 sin(𝛽𝑥)) = 𝜌 cos(𝛽𝑥 − 𝜃).

Teorema 9.32 (metodo di similarità). Consideriamo l’equazione non omogenea


complessa
𝑃(𝐷)[𝑢] = 𝑞(𝑥)𝑒 𝜆𝑥 . (9.35)
con 𝑃 e 𝑞 polinomi a coefficienti complessi. Sia 𝑚 la molteplicità di 𝜆 come radice di 𝑃
(𝑚 = 0 se 𝜆 non è radice di 𝑃 ). Allora una soluzione particolare di (9.35) può essere
scritta nella forma
𝑢(𝑥) = 𝑝(𝑥)𝑥 𝑚 𝑒 𝜆𝑥 (9.36)
con 𝑝 un polinomio (incognito) di grado uguale al grado di 𝑞 .

Dimostrazione. Se 𝑢(𝑥) = 𝑥 𝑚 𝑝(𝑥)𝑒 𝜆𝑥 vogliamo capire come agisce l’operatore


𝑃(𝐷) su 𝑢 , in particolare dato un qualunque polinomio 𝑞 vogliamo capire se
408 9 equazioni differenziali

esiste un polinomio 𝑝 , dello stesso grado di 𝑞 , tale che applicando 𝑃(𝐷) ad 𝑢(𝑥)
si ottiene 𝑞(𝑥)𝑒 𝜆𝑥 .

Fattorizziamo il polinomio 𝑃(𝑧):

𝑃(𝑧) = (𝑧 − 𝜆1 )𝑚1 . . . (𝑧 − 𝜆𝑛 )𝑚𝑛

dove 𝜆1 , . . . , 𝜆𝑛 ∈ ℂ sono le radici distinte di 𝑃(𝑧) e 𝑚1 , . . . , 𝑚𝑛 ∈ ℕ sono le


relative molteplicità. Dunque l’operatore 𝑃(𝐷) può essere fattorizzato nella
forma corrispondente:

𝑃(𝐷) = (𝐷 − 𝜆1 )𝑚1 . . . (𝐷 − 𝜆𝑛 )𝑚𝑛 .

Chiamiamo 𝑉𝑚𝑛 lo spazio vettoriale dei polinomi della forma 𝑥 𝑚 𝑝(𝑥) con
deg 𝑝 < 𝑛 . Una base di 𝑉𝑚𝑛 sono i monomi 𝑥 𝑚 , 𝑥 𝑚+1 , . . . , 𝑥 𝑚+𝑛 e dunque 𝑉𝑚𝑛 è
uno spazio vettoriale di dimensione 𝑛 .

La dimostrazione del teorema si basa sull’ossevazione di come agisce l’operatore


(𝐷 − 𝜆 𝑘 )𝑚 𝑘 sulle funzioni del tipo 𝑢(𝑥) = 𝑝(𝑥)𝑒 𝜆𝑥 con 𝑝 ∈ 𝑉𝑚𝑛 . In generale se 𝑝
è un polinomio si ha

(𝐷 − 𝜆 𝑘 )(𝑝(𝑥)𝑒 𝜆𝑥 ) = [(𝜆 − 𝜆 𝑘 )𝑝(𝑥) + 𝑝 0(𝑥)]𝑒 𝜆𝑥 .

Dobbiamo allora distinguere due casi. Se 𝜆 ≠ 𝜆 𝑘 allora la funzione 𝑝(𝑥)𝑒 𝜆𝑥 viene


trasformata nella funzione 𝑞(𝑥)𝑒 𝜆𝑥 dove 𝑞 è un polinomio dello stesso grado
di 𝑝 , in quanto il termine di grado massimo di 𝑝 viene moltiplicato per 𝜆 − 𝜆 𝑘
mentre il polinomio 𝑝 0 ha il grado inferiore al grado di 𝑝 e quindi non influenza il
termine di grado massimo. Se chiamiamo 𝑇𝑘 : 𝑉0𝑛 → 𝑉0𝑛 l’operatore lineare che
manda il polinomio 𝑝(𝑥) nel polinomio 𝑞(𝑥) = (𝜆 − 𝜆 𝑘 )𝑝(𝑥) + 𝑝 0(𝑥) osserviamo
che 𝑇𝑘 è iniettivo in quanto, visto che 𝑇𝑘 preserva il grado del polinomio, l’unico
polinomio che può andare a zero è il polinomio nullo. Dunque, per il teorema
𝑚
del rango, 𝑇𝑘 è bigettivo e di conseguenza 𝑇𝑘 𝑘 : 𝑉0𝑛 → 𝑉0𝑛 è bigettivo.

Se invece 𝜆 = 𝜆 𝑘 osserviamo ora che l’operatore 𝑇𝑘 non è altro che la derivata:


𝑞(𝑥) = 𝑝 0(𝑥). E se 𝑚 = 𝑚 𝑘 è la molteplicità di 𝜆 come radice di 𝑃 , l’operatore
𝑚
𝑇𝑘 𝑘 non è altro che la derivata 𝑚 -esima. Tale operatore non è invertibile su 𝑉0𝑛
in quanto manda a zero tutti i polinomi di grado inferiore a 𝑚 . Ma se partiamo
da un polinomio in 𝑉𝑚𝑛 allora l’operatore 𝑇𝑘𝑚 : 𝑉𝑚𝑛 → 𝑉0𝑛 diventa invertibile:
infatti in 𝑉𝑚𝑛 ci sono polinomi della forma 𝑎 𝑚 𝑥 𝑚 + 𝑎 𝑚+1 𝑥 𝑚+1 + · · · + 𝑎 𝑛+𝑚 𝑥 𝑛+𝑚
e facendone la derivata 𝑚 -esima si può ottenere il polinomio nullo solamente
se tutti i coefficienti sono nulli. Risulta quindi che, se 𝜆 = 𝜆 𝑘 , l’operatore
𝑇𝑘𝑚 : 𝑉𝑚𝑛 → 𝑉0𝑛 è invertibile.

Siamo arrivati alla conclusione. Se prendiamo un polinomio 𝑝(𝑥) in 𝑉𝑚𝑛 e


applichiamo 𝑃(𝐷) alla corrispondente funzione 𝑢(𝑥) = 𝑝(𝑥)𝑒 𝜆𝑥 possiamo
applicare sequenzialmente gli operatori (𝐷 − 𝜆 𝑘 )𝑚 𝑘 . Questi agiscono sulla
funzione 𝑢 modificando il polinomio 𝑝 . Se 𝜆 è radice di 𝑃 al primo passaggio
applichiamo l’operatore (𝐷 − 𝜆 𝑘 )𝑚 𝑘 con 𝜆 𝑘 = 𝜆 e 𝑚 𝑘 = 𝑚 cosicché il polinomio
𝑝 ∈ 𝑉𝑚𝑛 viene trasformato, in maniera biunivoca, in un polinomio di 𝑉0𝑛 .
Dopodiché applico tutti gli altri operatori (𝐷 − 𝜆 𝑘 )𝑚 𝑘 con 𝜆 𝑘 ≠ 𝜆 trasformando
il polinomio di 𝑉0𝑛 in un altro polinomio di 𝑉0𝑛 ma sempre in maniera biunivoca.
9.7 equazioni lineari di ordine 𝑛 a coefficienti costanti 409

Ne risulta che alla fine ottengo una mappa biunivoca tra 𝑉𝑚𝑛 → 𝑉0𝑛 e qualunque
sia 𝑞 ∈ 𝑉0𝑛 sappiamo esister un 𝑢 ∈ 𝑉𝑚𝑛 che viene mandato in 𝑞 .

Osservazione 9.33. Si noti che nella dimostrazione precedente abbiamo investigato la


struttura dell’operatore differenziale 𝐷 a coefficienti costanti. Quello che abbiamo fatto è
in realtà il processo di decomposizione di Jordan di un operatore lineare. L’operatore
𝐷 ha come autovettori le funzioni 𝑒 𝜆 𝑘 𝑥 con 𝜆 𝑘 radici del polinomio 𝑃 . Si osserva
però che le funzioni della forma 𝑥 𝑗 𝑒 𝜆 𝑘 𝑥 sono autovettori generalizzati in quanto
iterando l’operatore 𝐷 − 𝜆 𝑘 vengono mandati in un autovettore e sono quindi una base
dell’autospazio relativo all’autovettore 𝜆 𝑘 .
𝑗
La base formata dalle funzione della forma 𝑥𝑗 ! 𝑒 𝜆 𝑗 𝑥 è una base a ventaglio e la matrice
che rappresenta l’operatore 𝐷 risulta essere una matrice a blocchi nella forma di Jordan:
gli autovalori stanno sulla diagonale e una fila di 1 si trova al di sopra della diagonale.

Il nucleo dell’operatore 𝑃(𝐷) si decompone come somma diretta dei nuclei degli operatori
(𝐷 − 𝜆 𝑘 )𝑚 𝑘 .

Definizione 9.34 (wronksiano). Siano 𝑢1 , . . . , 𝑢𝑛 funzioni di classe 𝐶 𝑛−1 . La


matrice
𝑢1 (𝑥) 𝑢2 (𝑥) ... 𝑢𝑛 (𝑥)
© 𝑢 0 (𝑥) 𝑢20 (𝑥) ... 𝑢𝑛0 (𝑥) ª®
­ 1
𝑊(𝑥) = ­
­ .. .. ® (9.37)
­ . . ®
®
(𝑛−1) (𝑛−1) (𝑛−1)
«𝑢1 (𝑥) 𝑢2 (𝑥) ... 𝑢𝑛 (𝑥)¬
è chiamata matrice wronksiana. Il determinante di tale matrice 𝑤(𝑥) = det 𝑊(𝑥) è matrice e
chiamato determinante wronksiano.
determinante wronksiano

Teorema 9.35. Sia 𝐼 ⊆ ℝ un intervallo aperto non vuoto e siano 𝑎 𝑗 ∈ 𝐶 0 (𝐼, ℂ). Siano
𝑢1 , . . . , 𝑢𝑛 funzioni di classe 𝐶 𝑛 soluzioni dell’equazione lineare omogenea in forma
normale:
𝑛
X
𝑢 (𝑛) = 𝑎 𝑗 (𝑥)𝑢 (𝑗−1) (𝑥). (9.38)
𝑗=1

Sia 𝑊(𝑥) la matrice wronksiana (9.37). Allora le seguenti proprietà sono equivalenti:

1. le funzioni 𝑢1 , . . . , 𝑢𝑛 sono linearmente indipendenti;


2. per ogni 𝑥 ∈ 𝐼 si ha det 𝑊(𝑥) ≠ 0;
3. esiste 𝑥 ∈ 𝐼 tale che det 𝑊(𝑥) ≠ 0.

Dimostrazione. Ovviamente 2 implica 3.

Dimostriamo che 3 implica 1. Passando alla implicazione contropositiva dob-


biamo mostrare che se 𝑢1 , . . . , 𝑢𝑛 sono linearmente dipendenti allora per ogni
𝑥 ∈ 𝐼 si ha det 𝑊(𝑥) = 0. Ma se le funzioni sono dipendenti significa che esiste
𝝀 ≠ 0 tale che
𝑛
X
𝜆 𝑘 𝑢 𝑘 (𝑥) = 0 ∀𝑥 ∈ 𝐼. (9.39)
𝑘=1

Derivando si ottiene, per ogni 𝑗 = 0 , . . . , 𝑛 − 1:


𝑛
X (𝑗)
𝜆 𝑘 𝑢 𝑘 (𝑥) = 0 ∀𝑥 ∈ 𝐼
𝑘=1
410 9 equazioni differenziali

e quindi
𝑊(𝑥) 𝝀 = 0 ∀𝑥 ∈ 𝐼.
Ma allora la matrice 𝑊(𝑥) non è invertibile e quindi det 𝑊(𝑥) = 0, come
volevamo dimostrare.

Dimostriamo infine che 1 implica 2 cioè che se 𝑣 1 , . . . , 𝑣 𝑛 sono indipendenti


allora det 𝑊(𝑥) ≠ 0 per ogni 𝑥 ∈ 𝐼 . Fissato 𝑥 ∈ 𝐼 consideriamo il funzionale
𝐽(𝑣) = (𝑣(𝑥), 𝑣 0(𝑥), . . . , 𝑣 (𝑛−1) (𝑥)) cosicché si ha

𝑊(𝑥) = (𝐽(𝑢1 ), . . . , 𝐽(𝑢𝑛 )).

In base al teorema 9.25 ci ricordiamo che 𝐽 risulta essere un isomorfismo di


spazi vettoriali, dunque se 𝑣 1 , . . . , 𝑣 𝑛 sono indipendenti anche 𝐽(𝑣 1 ), . . . , 𝐽(𝑣 𝑛 )
dovranno essere indipendenti. Ma visto che le colonne della matrice 𝑊(𝑥) sono
indipendenti significa che det 𝑊(𝑥) ≠ 0, come volevamo dimostrare.

Teorema 9.36 (metodo della variazione delle costanti arbitrarie). Si consideri una
generica equazione differenziale lineare non omogenea di ordine 𝑛 in forma normale:

𝑛−1
X
𝑢 (𝑛) (𝑥) = 𝑎 𝑘 (𝑥)𝑢 (𝑘) (𝑥) + 𝑏(𝑥) (9.40)
𝑘=0

dove 𝑎 0 , . . . , 𝑎 𝑛−1 , 𝑏 ∈ 𝐶 0 (𝐴, ℂ) sono funzioni definite su un aperto 𝐴 ⊆ ℝ e si cerca


una soluzione 𝑢 ∈ 𝐶 𝑛 (𝐴, ℂ).

Se 𝑣 1 , . . . , 𝑣 𝑛 ∈ 𝐶 𝑛 (𝐴, ℂ) sono soluzioni indipendenti dell’equazione omogenea


associata:
𝑛−1
X
𝑢 (𝑛) (𝑥) = 𝑎 𝑘 (𝑥)𝑢 (𝑘) (𝑥)
𝑘=0

allora esistono delle funzioni 𝑐 𝑘 ∈ 𝐶 (𝐴, ℂ) per 𝑘 = 0 , 1 , . . . , 𝑛 − 1 tali che


1

P𝑛 0
𝑐 (𝑥)𝑣 𝑘 (𝑥) = 0

𝑘=1 𝑘



𝑛
𝑐 0 (𝑥)𝑣 0𝑘 (𝑥) = 0

 P
 𝑘=1 𝑘


..


. (9.41)

𝑛 (𝑛−2)
𝑐 0 (𝑥)𝑣 𝑘

(𝑥) = 0
 P
𝑘=1 𝑘



𝑛 (𝑛−1)
 𝑘=1 𝑐 𝑘 (𝑥)𝑣 𝑘 (𝑥) = 𝑏(𝑥).
0

 P

E in tal caso la funzione


𝑛
X
𝑢(𝑥) = 𝑐 𝑘 (𝑥)𝑣 𝑘 (𝑥)
𝑘=1

risolve l’equazione non omogenea (9.40).

Dimostrazione. Osserviamo innanzitutto che se esistono le funzioni 𝑐 𝑘 che


soddisfano il sistema (9.41) allora la funzione 𝑢 = 𝑐 1 · 𝑣 1 + · · · + 𝑐 𝑛 · 𝑣 𝑛 risolve
l’equazione non omogenea. Infatti dalla formula di derivazione del prodotto si
ha:
𝑛
X 𝑛
X 𝑛
X
𝑢0 = 𝑐 𝑘 𝑣 0𝑘 + 𝑐 0𝑘 𝑣 𝑘 = 𝑐 𝑘 𝑣 0𝑘
𝑘=1 𝑘=1 𝑘=1
9.7 equazioni lineari di ordine 𝑛 a coefficienti costanti 411

essendo il secondo addendo nullo per ipotesi (9.41). Ma allora si può proseguire
con le derivate:
𝑛
X 𝑛
X 𝑛
X
𝑢 00 = 𝑐 𝑘 𝑣 00𝑘 + 𝑐 0𝑘 𝑣 0𝑘 = 𝑐 𝑘 𝑣 00𝑘
𝑘=1 𝑘=1 𝑘=1

fino alla derivata (𝑛 − 1)-esima:


𝑛
(𝑛−1)
X
𝑢 (𝑛−1) = 𝑐𝑘 𝑣𝑘 .
𝑘=1

Per l’ultima derivata si ha infine:


𝑛 𝑛 𝑛
(𝑛) (𝑛−1) (𝑛)
X X X
𝑢 (𝑛) = 𝑐𝑘 𝑣𝑘 + 𝑐 0𝑘 𝑣 𝑘 = 𝑐 𝑘 𝑣 𝑘 + 𝑏.
𝑘=1 𝑘=1 𝑘=1

Ma allora si osserva che si ha


𝑛−1 𝑛 𝑛−1 𝑛
X X (𝑛)
X X (𝑗)
𝑢 (𝑛) + 𝑎 𝑗 𝑢 (𝑗) = 𝑐𝑘 𝑣𝑘 + 𝑏 + 𝑎𝑗 𝑐𝑘 𝑣𝑘
𝑗=0 𝑘=1 𝑗=0 𝑘=1
" #
𝑛 𝑛−1
X (𝑛)
X (𝑗)
= 𝑐𝑘 𝑣𝑘 + 𝑎𝑗 𝑣𝑘 +𝑏 =𝑏
𝑘=1 𝑗=0

in quanto le funzioni 𝑣 𝑗 , per ipotesi, risolvono l’equazione omogenea.

Rimane quindi solo da verificare che esistono funzioni 𝑐 𝑘 ∈ 𝐶 1 (𝐴, ℂ) che


soddisfano il sistema (9.41). Si osserva che l’equazione (9.41) si scrive nella
forma
𝑊(𝑥)𝒄0(𝑥) = 𝒃(𝑥)
dove 𝑊(𝑥) è la matrice wronksiana 𝑊(𝑥) associata alle soluzioni 𝑣 1 , . . . , 𝑣 𝑛 ,
𝒄(𝑥) = (𝑐 1 (𝑥), . . . , 𝑐 𝑛 (𝑥)) e 𝒃(𝑥) = (0, . . . , 0 , 𝑏(𝑥)). Siccome 𝑣1 , . . . , 𝑣 𝑛 per
ipotesi sono indipendenti, per il teorema 9.35 sappiamo che det 𝑊(𝑥) ≠ 0 per
ogni 𝑥 e quindi il sistema 𝑊(𝑥)𝒅(𝑥) = 𝒃(𝑥) ammette una unica soluzione 𝑑(𝑥)
per ogni 𝑥 ∈ 𝐼 . Visto che 𝑊(𝑥) e 𝒃(𝑥) hanno coefficienti continui, anche la
soluzione 𝒅(𝑥) = 𝑊(𝑥)−1 𝒃(𝑥) dovrà essere continua (che i coefficienti della
matrice 𝑊(𝑥)−1 siano continui lo si vede ad esempio scrivendo 𝑊(𝑥)−1 tramite
la matrice dei cofattori e sfruttando il fatto che il determinante è una funzione
continua) e quindi, fissato un punto 𝑥 0 ∈ 𝐼 , potremo definire
∫ 𝑥
𝑐 𝑘 (𝑥) = 𝑑 𝑘 (𝑡) 𝑑𝑡
𝑥0

per determinare le funzioni 𝑐 𝑘 .

Esercizio 9.37. Trovare tutte le soluzioni dell’equazione lineare non omogenea a


coefficienti costanti:
1
𝑢 00(𝑥) + 𝑢(𝑥) = .
cos 𝑥

Svolgimento. Il polinomio associato è 𝑃(𝜆) = 𝜆2 + 1 che ha due radici complesse


coniugate ±𝑖 . Due soluzioni indipendenti dell’equazione omogenea 𝑢 00 + 𝑢 = 0
412 9 equazioni differenziali

sono dunque (come noto):

𝑢1 (𝑥) = cos 𝑥, 𝑢2 (𝑥) = sin 𝑥.

La soluzione generale dell’omogenea è dunque della forma:

𝑢(𝑥) = 𝐴 cos 𝑥 + 𝐵 sin 𝑥.

Per trovare una soluzione particolare della equazione non omogenea utilizziamo
il metodo della variazione delle costanti, cioè cerchiamo una soluzione della
forma:
𝑢∗ (𝑥) = 𝐴(𝑥) cos 𝑥 + 𝐵(𝑥) sin 𝑥.
I coefficienti 𝐴(𝑥) e 𝐵(𝑥) si determinano risolvendo il sistema
(
𝐴0(𝑥) · cos 𝑥 +𝐵0(𝑥) · sin 𝑥 = 0 ,
𝐴0(𝑥) · (− sin 𝑥) +𝐵0(𝑥) · cos 𝑥 = cos 𝑥 .
1

Si trova quindi (
sin 𝑥
𝐴0(𝑥) = − cos 𝑥 · 𝐵 (𝑥)
0

𝐵0(𝑥) = 1
da cui, integrando, si trova

𝐴(𝑥) = ln | cos 𝑥|, 𝐵(𝑥) = 𝑥

e quindi
𝑢∗ (𝑥) = cos 𝑥 · ln | cos 𝑥| + 𝑥 sin 𝑥.

Tutte le soluzioni dell’equazione data si scrivono quindi come somma della


soluzione particolare della non omogenea più la soluzione generale della
omogenea:

𝑢(𝑥) = 𝑎 cos 𝑥 + 𝑏 sin 𝑥 + cos 𝑥 · ln | cos 𝑥| + 𝑥 sin 𝑥.

9.8 sistemi lineari

Un sistema lineare omogeneo a coefficienti costanti del primo ordine si scrive in


generale nella forma:
𝒖 0(𝑥) = 𝐴𝒖(𝑥)
dove 𝐴 è una matrice 𝑛 × 𝑛 costante e la funzione vettoriale incognita sarà
𝒖 : ℝ → ℝ𝑛 . Come per i sistemi lineari algebrici sarà utile, se possibile, cercare
un sistema di riferimento in cui la matrice 𝐴 risulti essere diagonale. Se facciamo
il cambio di variabile
𝒖 = 𝑀𝒗
tramite una matrice invertibile 𝑀 , si ottiene 𝒖 0 = (𝑀𝒗)0 = 𝑀𝒗 0 (si faccia la
verifica!... stiamo supponendo che 𝑀 sia una matrice costante) e dunque il
9.8 sistemi lineari 413

sistema lineare diventa:


𝑀𝒗 0 = 𝐴𝑀𝒗
ovvero
𝒗 0 = 𝑀 −1 𝐴𝑀𝒗.
A meno di un cambio di variabili potremo quindi sostituire la matrice 𝐴 con
una qualunque matrice simile ad essa: 𝑀 −1 𝐴𝑀 . In particolare se la matrice 𝐴
è diagonalizzabile (ad esempio se gli autovalori di 𝐴 sono tutti reali e distinti)
potremo ricondurci a un sistema diagonale:


 𝑣 0 = 𝜆1 𝑣 1
. 1


.

 .
 𝑣 0𝑛 = 𝜆𝑛 𝑣 𝑛



dove 𝜆1 , . . . , 𝜆𝑛 sono gli autovalori della matrice 𝐴. La matrice 𝑀 del cambio
di base avrà come vettori colonna gli autovettori della matrice 𝐴, che quindi
rappresentano la nuova base. A questo punto abbiamo 𝑛 equazioni indipendenti
che possono essere risolte senza difficoltà:

𝑣1 (𝑥) = 𝑐 1 𝑒 𝜆1 𝑥
𝑣2 (𝑥) = 𝑐 2 𝑒 𝜆2 𝑥
..
.
𝑣 𝑛 (𝑥) = 𝑐 𝑛 𝑒 𝜆𝑛 𝑥

con 𝑐 1 , . . . , 𝑐 𝑛 costanti arbitrarie.

Se la matrice 𝐴 non è diagonalizzabile sul campo reale è possibile che risulti


diagonalizzabile nel campo complesso. Più in generale la matrice potrà essere
portata in forma di Jordan. Per brevità non cercheremo di trattare il caso
generale, ma ci concentreremo sul caso 𝑛 = 2 che contiene comunque una
casistica piuttosto ampia.

sistemi 2 × 2

Nel caso 𝑛 = 2 sarà comodo usare 𝑡 come variabile indipendente (al posto di 𝑥 )
e chiamare 𝑥(𝑡) e 𝑦(𝑡) le due coordinate della funzione vettoriale incognita. Il
sistema che vogliamo trattare sarà quindi della forma:
(
𝑥 0(𝑡) = 𝑎 · 𝑥(𝑡) + 𝑏 · 𝑦(𝑡)
𝑢 0(𝑡) = 𝑐 · 𝑥(𝑡) + 𝑑 · 𝑦(𝑡).

dove 𝑎, 𝑏, 𝑐, 𝑑 sono i coefficienti costanti (reali) della matrice

𝑎 𝑏
 
𝐴= .
𝑐 𝑑

Vedremo che il comportamento del sistema potrà essere classificato in base agli
autovalori della matrice. Siano 𝜆 e 𝜇 gli autovalori (eventualmente complessi)
414 9 equazioni differenziali

della matrice 𝐴 cioè gli zeri del polinomio caratteristico:

𝑃(𝑧) = det(𝐴 − 𝑧𝐼) = 𝑧 2 − (𝑎 + 𝑑)𝑧 + 𝑎𝑑 − 𝑏𝑐.

Se gli autovalori sono reali e distinti la matrice è diagonalizzabile, se 𝒗, 𝒘 sono


gli autovettori corrispondeti agli autovettori 𝜆, 𝜇, si potrà quindi fare il cambio
di variabile
𝑥
 
= 𝑋𝒗 + 𝑌𝒘
𝑦
tramite il quale le equazioni si separano:
(
𝑋 0 = 𝜆𝑋
𝑌 0 = 𝜇𝑌

da cui si ottiene 𝑋 = 𝑎𝑒 𝜆𝑡 , 𝑌 = 𝑏𝑒 𝜇𝑡 con 𝑎, 𝑏 ∈ ℝ costanti arbitrarie.

Visto che le equazioni a coefficienti costanti sono autonome sappiamo che una
traslazione temporale di una soluzione rimane una soluzione. Infatti si osserva
che (
𝑋(𝑡 + 𝑐) = 𝑎𝑒 𝜆(𝑡+𝑐) = 𝑎𝑒 𝜆𝑐 𝑒 𝜆𝑡 ,
𝑌(𝑡 + 𝑐) = 𝑏𝑒 𝜇(𝑡+𝑐) = 𝑏𝑒 𝜇𝑐 𝑒 𝜇𝑡 .

Questo ci permette di disegnare le traiettorie delle soluzioni nel piano (𝑥, 𝑦).
Su tale piano le traslazioni temporali di una soluzione si rappresentano sulla
stessa traiettoria. Traiettorie diverse non potranno invece mai incontrarsi per
l’unicità della soluzione.

Se 𝑎 = 𝑏 = 0 si ottiene la soluzione nulla 𝑋 = 0, 𝑌 = 0 che, nel piano delle fasi, si


rappresenta con un singolo punto nell’origine. Se 𝑏 = 0 le soluzioni sono della
forma 𝑋 = 𝑎𝑒 𝜆𝑡 , 𝑌 = 0 che ha una traiettoria, nel piano 𝑥 𝑦 lungo la semiretta
uscente dall’origine con direzione 𝒗 se 𝑎 > 0 e con direzione −𝒗 se 𝑎 < 0. La
soluzione andrà verso 0 (all’aumentare di 𝑡 ) se 𝜆 < 0 e sarà invece uscente da 0
se 𝜆 > 0. Analogamente si ha una traiettoria sulle due semirette con direzione
𝒘 e −𝒘 quando 𝑎 = 0 e 𝑏 ≠ 0.

Se entrambi 𝑎 e 𝑏 sono non nulli potremo trovare l’equazione della traiettoria


eliminando la variabile 𝑡 nelle equazioni che rappresentano la soluzione. Se
𝑋 = 𝑎𝑒 𝜆𝑡 , 𝑌 = 𝑏𝑒 𝜇𝑡 risulta

|𝑏| 𝜆 |𝑋 | 𝜇 𝑒 𝜆𝑡𝜇
= =1
|𝑎| 𝜇 |𝑌| 𝜆 𝑒 𝜇𝑡𝜆

da cui 𝜇
𝑌 = 𝑘|𝑋 | 𝜆
con 𝑘 costante arbitraria.
sella Se i segni di 𝜆 e 𝜇 sono opposti, si ottiene una configurazione chiamata sella (si
veda figura). Lungo l’autovettore con autovalore negativo ci sarà convergenza
verso l’origine, ma questa convergenza è instabile in quanto ogni altra curva
tenderà invece a essere deviata e a tendere asintoticamente verso la direzione
dell’autovettore con autovalore positivo.
9.8 sistemi lineari 415

1
1

-2 -1 1 2 -2 -1 1 2

-1
-1

(a) sella (instabile)


(b) nodo stabile

1
1

-1 1 -1 1 2

-1
-1

(c) nodo improprio stabile -2


Figura 9.3:
(d) stella stabile

1
(interagisci) (interagisci)
1

-2 -1 1 2

-2 -1 1 2

-1 (interagisci) (interagisci)
-1

-2

(e) fuoco stabile


(f) centro (stabile)
(interagisci) (interagisci)

Se 𝜆 e 𝜇 sono entrambi negativi si ha un nodo stabile in cui tutte le curve nodo stabile
convergono verso l’origine (soluzione attrattiva). Se invece 𝜆 e 𝜇 sono entrambi
positivi le curve saranno percorse in senso inverso e saranno uscenti dall’origine:
si avrà allora un nodo instabile. nodo instabile

Se gli autovalori sono coincidenti 𝜆 = 𝜇 e se la matrice è diagonalizzabile allora


la matrice è diagonale, tutti i vettori sono autovettori quindi in ogni direzione c’è
una traiettoria rettilinea. La configurazione si chiama stella (stabile o instabile a stella
seconda del segno negativo o positivo).

Se gli autovalori sono coincidenti 𝜆 = 𝜇 e la matrice non è diagonalizzabile


consideriamo l’autovettore (unico) 𝒖 con 𝐴𝒖 = 𝜆𝒖 e prendiamo un qualunque
vettore 𝒘 indipendente da 𝒖 . Allora si avrà

𝐴𝒘 = 𝛼𝒖 + 𝛽𝒘.

Certamente 𝛼 ≠ 0 altrimenti 𝒘 sarebbe un autovettore e la matrice sarebbe


𝛽
diagonalizzabile. Consideriamo allora 𝒗 = 𝒘/𝛼 cosicché si ha 𝐴𝒗 = 𝒖 + 𝛼 𝒘 .
Nella base 𝒖, 𝒗 la matrice 𝐴 diventa triangolare, e sulla diagonale troviamo
𝛽 𝛽
i valori 𝜆 e 𝛼 . Ma allora 𝛼 = 𝜆 in quanto sulla diagonale abbiamo solo gli
autovalori. Dunque se 𝑋 , 𝑌 sono le coordinate nel sistema 𝒖, 𝒗 , il sistema di
416 9 equazioni differenziali

equazioni diventa: (
𝑋 0 = 𝜆𝑋 + 𝑌
𝑌 0 = 𝜆𝑌.

Dalla seconda equazione si ottiene quindi 𝑌 = 𝑎𝑒 𝜆𝑡 con 𝑎 ∈ ℝ costante arbitraria


e sostituendo nella prima si ottiene l’equazione

𝑋 0 − 𝜆𝑋 = 𝑎𝑒 𝜆𝑡

che può essere risolta trovando una seconda costante arbitraria 𝑏 ∈ ℝ e

𝑋 = (𝑎𝑡 + 𝑏)𝑒 𝜆𝑡 .

Se 𝑎 = 0 una traiettoria con 𝑌 = 0 cioè nella direzione dell’unico autovettore. Se


𝜆 < 0 tale traiettoria sarà convergente a 0 altrimenti sarà divergente. Se 𝑎 ≠ 0
possiamo eliminare 𝑡 ponendo:

1 𝑌
𝑡= ln
𝜆 𝑎
e quindi
𝑎 𝑌 𝑌 𝑌 𝑌 𝑏
 
𝑋= ln + 𝑏 = ln + 𝑌.
𝜆 𝑎 𝑎 𝜆 𝑎 𝑎
Studiando il grafico di questa funzione si ottengono qualitativamente le curve
nodo improprio
disegnate in figura: la configurazione si chiama nodo improprio. Come per i nodi
le traiettorie convergono all’origine se 𝜆 < 0 e divergono se 𝜆 > 0.

Proviamo a trattare il caso, più interessante, degli autovalori complessi. Se la


matrice è a coefficienti reali gli autovalori, quando non reali, saranno certamente
complessi coniugati:
𝜆 = 𝛼 − 𝑖𝛽, 𝜇 = 𝛼 + 𝑖𝛽
con 𝛼, 𝛽 ∈ ℝ, 𝛽 ≠ 0.

Sia 𝒗 + 𝑖𝒘 un autovettore complesso relativo all’autovalore 𝛼 − 𝑖𝛽 . Allora si


ha

𝐴𝒗 + 𝑖𝐴𝒘 = 𝐴(𝒗 + 𝑖𝒘) = (𝛼 − 𝑖𝛽)(𝒗 + 𝑖𝒘) = 𝛼𝒗 + 𝛽𝒘 + 𝑖(−𝛽𝒗 + 𝛼𝒘).

Uguagliando parte reale e parte immaginaria si trova

𝐴𝒗 = 𝛼𝒗 + 𝛽𝒘, 𝐴𝒘 = −𝛽𝒗 + 𝛼𝒘.

A questo punto non è difficile verificare che 𝒗 − 𝑖𝒘 è un autovettore relativo


all’autovalore coniugato 𝛼 + 𝑖𝛽 . Visto che 𝒗 ± 𝑖𝒘 sono due autovettori con
Si
 potrebbe osservare che la matrice autovalori distinti sicuramente sono vettori indipendenti. Dunque anche 𝒗 e 𝒘
𝛼 −𝛽

𝛽 𝛼
è la matrice che rappresenta la (che si ottengono come multipli di somma e differenza) sono vettori, stavolta
moltiplicazione complessa per il numero reali indipendenti. Se 𝑋 , 𝑌 sono le coordinate nella base 𝒗 , 𝒘 , l’equazione
𝛼 + 𝑖𝛽 . Dunque chiamando 𝑍 = 𝑋 + 𝑖𝑌 il differenziale diventa: (
sistema si potrebbe scrivere nella forma
𝑋 0 = 𝛼𝑋 − 𝛽𝑌
𝑍0 = (𝛼+𝑖𝛽)𝑍 e si potrebbe quindi osser-
vare immediatamente che la soluzione 𝑌 0 = 𝛽𝑋 + 𝛼𝑌.
deve essere della forma 𝑍 = 𝑐𝑒 (𝛼+𝑖𝛽)𝑡
con 𝑐 costante complessa. Ponendo poi Si ha allora
𝑐 = 𝜌𝑒 𝑖𝜃 si ottiene il risultato.
9.8 sistemi lineari 417

𝑋 00 = 𝛼𝑋 0 − 𝛽𝑌 0 = 𝛼𝑋 0 − 𝛽(𝛽𝑋 + 𝛼𝑌)
da cui, usando 𝛽𝑌 = 𝛼𝑋 − 𝑋 0 possiamo eliminare la variabile 𝑌 e ottenere una
equazione del secondo ordine in 𝑋 :

𝑋 00 = 𝛼𝑋 0 − 𝛽2 𝑋 − 𝛼(𝛼𝑋 − 𝑋 0) = 2𝛼𝑋 0 − (𝛼 2 + 𝛽2 )𝑋

ovvero
𝑋 00 − 2 𝛼𝑋 0 + (𝛼2 + 𝛽 2 )𝑋 = 0.
Risolvendo questa equazione del secondo ordine ci si accorge che le radici del
polinomio caratteristico sono proprio 𝛼 ± 𝑖𝛽 e quindi le soluzioni si scrivono
nella forma
𝑋 = 𝑒 𝛼𝑡 (𝑎 cos 𝛽𝑡 + 𝑏 sin 𝛽𝑡)
da cui

𝛽𝑌 = 𝛼𝑋 − 𝑋 0
= 𝛼𝑒 𝛼𝑡 (𝑎 cos 𝛽𝑡 + 𝑏 sin 𝛽𝑡)
− 𝛼𝑒 𝛼𝑡 (𝑎 cos 𝛽𝑡 + 𝑏 sin 𝛽𝑡) − 𝑒 𝛼𝑡 (−𝛽𝑎 sin 𝛽𝑡 + 𝑏𝛽 cos 𝛽𝑡)
= 𝛽𝑒 𝛼𝑡 (𝑎 sin 𝛽𝑡 − 𝑏 cos 𝛽𝑡).

𝑎
Dunque, ponendo 𝜌 = 𝑎 2 + 𝑏 2 e scegliendo 𝜃 tale che cos 𝜃 = 𝜌 e sin 𝜃 = − 𝜌𝑏 ,
si ha (
𝑋 = 𝜌𝑒 𝛼𝑡 cos(𝛽𝑡 + 𝜃),
𝑌 = 𝜌𝑒 𝛼𝑡 sin(𝛽𝑡 + 𝜃).
Se 𝛼 ≠ 0 le traiettorie corrispondenti formano delle spirali ellittiche che si
avvitano nella direzione che porta il vettore 𝒗 verso il vettore 𝒘 . Se 𝛼 < 0 le
spirali convergono verso l’origine del sistema: avremo un fuoco stabile. Se 𝛼 > 0 fuoco stabile
le orbite divergono chiameremo la configurazione un fuoco instabile. Se 𝛼 = 0 le
traiettorie sono delle ellissi concentriche, le soluzioni sono quindi periodiche e fuoco instabile

la configurazione si chiama centro. centro

Se almeno uno dei due autovalori è nullo il comportamento del sistema è


degenere, si hanno delle soluzioni banali che non andremo a investigare.

matrice esponenziale

Per risolvere, in astratto, il sistema 𝑛 × 𝑛 del primo ordine, lineare omogeneo a


coefficienti costanti
𝒖 0 = 𝐴𝒖
introduciamo le seguenti nozioni.

Sia 𝐴 una matrice quadrata 𝑛 × 𝑛 . Definiamo la norma (norma operatoriale) di


𝐴 come segue:
k𝐴k = sup |𝐴𝒗|
|𝒗|≤ 1
418 9 equazioni differenziali

q
dove |𝒗| = 𝑣 12 + · · · + 𝑣 𝑛2 è l’usuale norma del vettore 𝒗 ∈ ℝ𝑛 . Osserviamo
che 𝒗 ↦→ 𝐴𝒗 è una funzione continua e che {𝒗 : |𝒗| ≤ 1} è un insieme compatto,
dunque il sup nella definizione è in realtà un max.

Per le proprietà del sup si ha:

|𝐴𝒗| ≤ k𝐴k |𝑣| e k𝐴𝐵k ≤ k𝐴k k𝐵k.

Dunque possiamo affermare il valore assoluto di ogni elemento di una matrice


si stima con la norma della matrice: 𝐴 𝑖𝑗 ≤ k𝐴k , infatti:

𝐴 𝑖𝑗 = (𝐴𝒆 𝑗 )𝑖 ≤ 𝐴𝑒 𝑗 ≤ k𝐴k

(dove 𝒆 𝑗 è il 𝑗 -esimo vettore della base canonica di ℝ𝑛 ).

Se 𝐴 𝑘 è una successione di matrici, diremo che 𝐴 𝑘 → 𝐴 se ogni elemento della


matrice 𝐴 𝑘 converge al corrispondente elemento della matrice 𝐴: (𝐴 𝑘 )𝑖𝑗 → 𝐴 𝑖𝑗 .
Questo corrisponde a considerare la matrice 𝑛 × 𝑛 come un vettore dello spazio
2
ℝ(𝑛 ) .
Se 𝐴(𝑡) è una funzione a valori matrici (ovvero una matrice i cui elementi sono
funzioni di 𝑡 ), si potrà farne la derivata come si fa per le funzioni vettoriali:
(𝐴0(𝑡))𝑖𝑗 = (𝐴 𝑖𝑗 (𝑡))0 cioè componente per componente. Le usuali regole per le
derivate valgono anche per le matrici, in particolare non è difficile verificare (si
espliciti la definizione del prodotto di matrici) che

(𝐴(𝑡)𝐵(𝑡))0 = 𝐴0(𝑡)𝐵(𝑡) + 𝐴(𝑡)𝐵0(𝑡)

dove, puntualizziamo, è importante mantenere i prodotti nell’ordine giusto, in


quanto il prodotto di matrici può non essere commutativo.

Se 𝐴 è una matrice quadrata, si definisce la matrice potenza 𝐴 𝑘 per ogni 𝑘


naturale, mediante le proprietà

𝐴0 = 𝐼, 𝐴 𝑘+1 = 𝐴 𝑘 𝐴.

(se 𝐴 è invertibile si possono definire anche le potenze negative 𝐴−𝑘 = (𝐴−1 ) 𝑘 =


(𝐴 𝑘 )−1 ).

Definiamo allora la matrice esponenziale di 𝐴:



𝐴𝑘
𝑒𝐴 =
X
.
𝑘=0
𝑘!

Per dare significato a questa definizione dobbiamo verificare che la serie appena
scritta sia convergente. Cioè dobbiamo verificare che per ogni coppia di indici
𝑖𝑗 sia convergente la serie numerica:

∞ (𝐴 𝑘 )
X 𝑖𝑗
.
𝑘=0
𝑘!

Per quanto detto prima sappiamo che (𝐴 𝑘 )𝑖𝑗 ≤ 𝐴 𝑘 ≤ k𝐴k 𝑘 . Dunque la serie

in questione è assolutamente convergente in quanto il suo valore assoluto si


9.8 sistemi lineari 419

stima con la serie



X k𝐴k 𝑘
= 𝑒 k𝐴k
𝑘=0
𝑘!

che è convergente. La definizione della matrice 𝑒 𝐴 è dunque ben posta e si ha


𝐴
𝑒 ≤ 𝑒 k𝐴k .

Teorema 9.38 (proprietà dell’esponenziale matrice). Siano 𝐴 e 𝐵 matrici quadrate


𝑛 × 𝑛 e 𝑡 uno scalare. Valgono le seguenti proprietà:

1. 𝑒 0 = 𝐼 (dove 0 è la matrice nulla 𝑛 × 𝑛 ed 𝐼 è la matrice identità con le stesse


dimensioni);
2. se 𝐴𝐵 = 𝐵𝐴 allora 𝑒 𝐴 𝐵 = 𝐵𝑒 𝐴 ;
3. (𝑒 𝑡𝐴 )0 = 𝐴𝑒 𝑡𝐴 ;
4. 𝑒 −𝐴 = (𝑒 𝐴 )−1 (in particolare la matrice esponenziale è sempre invertibile);
5. se 𝒖(𝑡) è una funzione a valori in ℝ𝑛 che soddisfa l’equazione differenziale
𝒖 0(𝑡) = 𝐴𝒖(𝑡) allora 𝒖(𝑡) = 𝑒 𝑡𝐴 𝒖(0);
6. se 𝐴𝐵 = 𝐵𝐴 allora 𝑒 𝐴+𝐵 = 𝑒 𝐴 𝑒 𝐵 ;
7. se 𝐴 è invertibile allora 𝑒 𝐴𝐵𝐴 = 𝐴𝑒 𝐵 𝐴−1 ;
−1

8. se 𝐴 è la matrice diagonale 𝐴 = diag(𝜆1 , . . . , 𝜆𝑛 ), allora 𝑒 𝐴 è pure una matrice


diagonale con 𝑒 𝐴 = diag(𝑒 𝜆1 , . . . , 𝑒 𝜆𝑛 );
9. se 𝐴 è una matrice triangolare con la diagonale nulla (cioè 𝐴 𝑖𝑗 = 0 se 𝑖 ≥ 𝑗 )
𝑘
allora 𝑒 𝐴 = 𝑛𝑘=0 𝐴𝑘 ! (basta sommare i primi 𝑛 + 1 termini);
P
10. se 𝐵 è una matrice triangolare (cioè 𝐵 𝑖𝑗 = 0 se 𝑖 > 𝑗 ) allora 𝐵 = 𝐷 + 𝐴 con
𝐷 matrice diagonale e 𝐴 matrice triangolare con la diagonale nulla e quindi
𝑒 𝐵 = 𝑒 𝐷 𝑒 𝐴 si può calcolare riconducendosi ai punti precedenti.

Dimostrazione. 1. Per quanto riguarda 𝑒 0 osserviamo che per definizione 00 = 𝐼


mentre 0 𝑘 = 0 se 𝑘 > 0. Dunque direttamente dalla definizione si ottiene 𝑒 0 = 𝐼 .

2. Se 𝐴𝐵 = 𝐵𝐴 osserviamo che si ha anche 𝐴 𝑘 𝐵 = 𝐵𝐴 𝑘 (la matrice 𝐵 commuta


con ogni fattore del prodotto 𝐴 𝑘 ). Dunque:

𝑁 𝑁
X 𝐴𝑘 X 𝐴𝑘
𝐵=𝐵
𝑘=0
𝑘! 𝑘=0
𝑘!

e passando al limite 𝑁 → ∞ si ottiene 𝑒 𝐴 𝐵 = 𝐵𝑒 𝐴 .

3. Per calcolare la derivata di 𝑒 𝑡𝐴 vogliamo dimostrare che la serie che definisce


𝑒 𝑡𝐴 converge totalmente quando 𝑡 varia in un qualunque intervallo limitato.
Poniamo allora 𝑡 ∈ [−𝑀, 𝑀]. Si ha:

(𝑡𝐴) 𝑘 |𝑡 | 𝑘 𝐴 𝑘 𝑀 𝑘 k𝐴k 𝑘

sup = sup ≤
𝑡∈[−𝑀,𝑀] 𝑘! 𝑡∈[−𝑀,𝑀] 𝑘! 𝑘!

la cui serie è convergente qualunque sia 𝑀 ∈ ℝ. Dunque la serie che definisce


𝑒 𝑡𝐴 è una serie di funzioni continue e derivabili che converge totalmente su ogni
420 9 equazioni differenziali

intervallo limitato. Possiamo quindi derivare la serie termine a termine:



((𝑡𝐴) 𝑘 )0 ∞
𝑘𝑡 𝑘−1 𝐴 𝑘 ∞ 𝑘−1 𝑘−1
𝑡 𝐴
(𝑒 𝑡𝐴 )0 = = 𝐴𝑒 𝑡𝐴 .
X X X
= =𝐴
𝑘=0
𝑘! 𝑘=1
𝑘! 𝑘=1
(𝑘 − 1)!

4. Dimostriamo ora che 𝑈(𝑡) = 𝑒 𝑡𝐴 𝑒 −𝑡𝐴 = 𝐼 per ogni 𝑡 . Si ha:

𝑈 0(𝑡) = 𝐴𝑒 𝑡𝐴 𝑒 −𝑡𝐴 + 𝑒 𝑡𝐴 (−𝐴)𝑒 −𝑡𝐴 = 𝐴𝑒 𝑡𝐴 𝑒 −𝑡𝐴 − 𝐴𝑒 𝑡𝐴 𝑒 −𝑡𝐴 = 0

(𝐴𝑒 𝑡𝐴 = 𝑒 𝑡𝐴 𝐴 in quanto 𝐴 e 𝑡𝐴 commutano). Dunque 𝑈 0(𝑡) = 0 cioè 𝑈(𝑡) è


costante ovvero 𝑈(𝑡) = 𝑈(0). Ma 𝑈(0) = 𝐼 in quanto 𝑒 0 = 𝐼 e quindi 𝑈(𝑡) = 𝐼
per ogni 𝑡 .

5. Prendiamo l’equazione 𝒖 0 = 𝐴𝒖 , moltiplicando a sinistra per 𝑒 −𝑡𝐴 l’equazione


diventa 𝑒 −𝑡𝐴 𝒖 0 − 𝑒 −𝑡𝐴 𝐴𝒖 = 0 cioè (𝑒 −𝑡𝐴 𝒖)0 = 0. Questo significa che la funzione
𝑒 −𝑡𝐴 𝒖 = 𝑐 costante e moltiplicando a sinistra per 𝑒 𝑡𝐴 si ottiene dunque 𝒖 = 𝑒 𝑡𝐴 𝑐
come volevasi dimostrare.

6. Per dimostrare la proprietà 𝑒 𝐴+𝐵 = 𝑒 𝐴 𝑒 𝐵 consideriamo la quantità 𝑈(𝑡) =


𝑒 −𝑡(𝐴+𝐵) 𝑒 𝑡𝐴 𝑒 𝑡𝐵 . Se dimostriamo che 𝑈 è costante, visto che 𝒖(0) = 𝐼 si avrà anche
𝑈(1) = 𝐼 che è equivalente a quanto vogliamo dimostrare. Dunque verifichiamo
che la derivata è nulla, sfruttando l’ipotesi 𝐴𝐵 = 𝐵𝐴 che ci permette di far
commutare i prodotti:

𝑈 0(𝑡) = −(𝐴 + 𝐵)𝑒 −𝑡(𝐴+𝐵) 𝑒 𝑡𝐴 𝑒 𝑡𝐵 + 𝑒 −𝑡(𝐴+𝐵) 𝐴𝑒 𝑡𝐴 𝑒 𝑡𝐵 + 𝑒 −𝑡(𝐴+𝐵) 𝑒 𝑡𝐴 𝐵𝑒 𝑡𝐵


= [−(𝐴 + 𝐵) + 𝐴 + 𝐵]𝑈(𝑡) = 0.

7. Se 𝐴 è invertibile allora (𝐴𝐵𝐴−1 ) 𝑘 = 𝐴𝐵𝐴−1 𝐴𝐵𝐴 . . . 𝐴𝐵𝐴−1 = 𝐴𝐵 𝑘 𝐴−1 .


Dunque nelle somme parziali della serie che definisce l’esponenziale 𝑒 𝐴𝐵𝐴
−1

si può raccogliere 𝐴 a sinistra e 𝐴−1 a destra e al centro rimane la serie che


definisce 𝑒 𝐵 .

8. Se la matrice 𝐴 è diagonale con 𝐴 𝑖𝑖 = 𝜆 𝑖 allora 𝐴 𝑘 risulta essere una matrice


diagonale con (𝐴 𝑘 )𝑖𝑖 = 𝜆 𝑖𝑘 . Dunque nella definizione di esponenziale 𝑒 𝐴 i
termini della serie sono tutte matrici diagonali, e sulla diagonale compare la
serie che definisce l’esponenziale 𝑒 𝜆𝑖 .

9. Se 𝐴 è una matrice triangolare con 𝐴 𝑖𝑗 = 0 quando 𝑖 ≥ 𝑗 , si osserva che 𝐴2


avrà degli zeri anche sopra la diagonale: (𝐴2 )𝑖𝑗 = 0 quando 𝑖 + 1 ≥ 𝑗 (si applichi
la definizione di prodotto, riga per colonna). Nelle moltiplicazioni successive
𝐴3 , 𝐴4 , . . . si aggiungerà sempre una diagonale di zeri finché la matrice non si
annulla completamente 𝐴𝑛 = 0. Dunque la serie che definisce 𝑒 𝐴 contiene solo
un numero finito di termini (i primi 𝑛 + 1) e può essere calcolata esplicitamente.

10. L’ultima proprietà è una osservazione che non richiede dimostrazione.

9.9 studio qualitativo delle soluzioni

Non sempre è possibile determinare esplicitamente le soluzioni di una equazio-


ne differenziale. Ci proponiamo quindi di trovare dei metodi per determinare
9.9 studio qualitativo delle soluzioni 421

Figura 9.4: Studio qualitativo dell’esem-


-5 -4 -3 -2 -1 1 2 3 4 5 6
pio 9.39.

-1

(interagisci)

alcune proprietà salienti delle soluzioni, senza doverle determinare esplici-


tamente. Considereremo unicamente equazioni del primo ordine in forma
normale:
𝑢 0(𝑥) = 𝑓 (𝑥, 𝑢(𝑥)) (9.42)
con 𝑓 : Ω ⊆ ℝ2 → ℝ.

Ricordiamo che se 𝑓 soddisfa la condizione di Cauchy-Lipschitz (definizio-


ne 9.15), in particolare se 𝑓 è di classe 𝐶 1 allora i grafici delle soluzioni massimali
dell’equazione differenziale (9.42) fibrano la regione Ω nel senso che per ogni
punto di Ω passa una unica soluzione massimale (teorema 9.16 di Cauchy-
Lipschitz e proposizione 9.20). Inoltre la proposizione 9.19 ci dice che le
soluzioni massimali escono da qualunque compatto contenuto in Ω ovvero
raggiungono sempre la frontiera di Ω.

Esempio 9.39. Dimostrare che il seguente problema di Cauchy


(
𝑢 0(𝑥) = (𝑢 2 (𝑥) − 1) · 𝑥 · sin 𝑥
𝑢(0) = 0

ammette una unica soluzione massimale 𝑢(𝑥) definita su tutto ℝ (dunque la soluzione
è globale).

Svolgimento. In questo caso si ha 𝑓 (𝑥, 𝑦) = (𝑦 2 − 1)𝑥 sin 𝑥 , che è una funzione


di classe ℂ1 su tutto Ω = ℝ2 . Vale dunque il teorema di esistenza ed unicità
delle soluzioni. Notiamo inoltre (per verifica diretta) che 𝑢0 (𝑥) = −1 e 𝑢1 (𝑥) = 1
sono soluzioni costanti dell’equazione differenziale (9.42) in quanto 𝑓 (𝑥, −1) =
𝑓 (𝑥, 1) = 0 per ogni 𝑥 ∈ ℝ (se 𝑥 rappresenta il tempo le soluzioni costanti si
chiamano anche stazionarie). Il grafico della soluzione 𝑢(𝑥) dunque non può
toccare i grafici delle due funzioni 𝑢0 = −1 e 𝑢1 = 1 e visto che 𝑢(0) = 0 e
che 𝑢 è una funzione continua significa che per ogni 𝑥 si ha −1 < 𝑢(𝑥) < 1.
Consideriamo ora il compatto 𝐾 𝑀 = [−𝑀, 𝑀] × [−1 , 1]. Sappiamo che la
soluzione massimale 𝑢(𝑥) del problema di Cauchy preso in considerazione
deve uscire da ogni compatto 𝐾 𝑀 . Visto però che 𝑢(𝑥) ∈ (−1 , 1) significa
che necessariamente il grafico della soluzione massimale 𝑢(𝑥) raggiunge i
due segmenti verticali 𝑥 = −𝑀 e 𝑥 = 𝑀 e dunque l’intervallo massimale di
esistenza contiene l’intervallo [−𝑀, 𝑀]. Siccome questo è vero per ogni 𝑀 ,
l’intervallo massimale di esistenza della soluzione è 𝐼 = ℝ e dunque la soluzione
è globale.
422 9 equazioni differenziali

monotonia e punti critici delle soluzioni

Dopo aver determinato le zone di Ω su cui vale il teorema di esistenza e unicità, è


utile studiare il segno di 𝑓 . Infatti le soluzioni 𝑢(𝑥) dell’equazione differenziale
(9.42) saranno strettamente crescenti dove 𝑓 > 0, strettamente decrescenti dove
𝑓 < 0 e avranno un punto critico dove 𝑓 = 0.
Un primo caso notevole è il caso in cui 𝑓 si annulla su una retta orizzontale 𝑦 = 𝑐 .
In questo caso la funzione costante 𝑢(𝑥) = 𝑐 è una soluzione dell’equazione
differenziale (9.42). Inoltre (nell’ipotesi 𝑓 ∈ ℂ1 ) tale costante non può essere
attraversata dalle altre soluzioni dell’equazione differenziale.
È importante capire se le soluzioni dell’equazione differenziale attraversano
o no la curva { 𝑓 = 0}. Infatti questo ci permette di determinare il segno della
derivata 𝑢 0(𝑥) e quindi di ottenere importanti informazioni sull’andamento
della soluzione 𝑢(𝑥) (monotonia, massimi e minimi relativi...).
Più in generale è interessante capire quando una soluzione di una equazione
differenziale può attraversare una determinata curva.

Teorema 9.40. Sia 𝑢(𝑥) una soluzione dell’equazione differenziale (9.42) definita su
un intervallo 𝐼 e sia 𝑢0 (𝑥) una funzione qualunque definita su 𝐼 , di classe ℂ1 e tale che
il suo grafico sia interamente contenuto nel dominio Ω di definizione di 𝑓 . Supponiamo
che in un punto fissato 𝑥 0 interno ad 𝐼 si abbia 𝑢(𝑥 0 ) < 𝑢0 (𝑥 0 ) e supponiamo inoltre
che per ogni 𝑥 > 𝑥 0 si abbia 𝑢00 (𝑥) > 𝑓 (𝑥, 𝑢0 (𝑥)). Allora per ogni 𝑥 > 𝑥 0 si ha
𝑢(𝑥) < 𝑢0 (𝑥).
Analogamente se 𝑢(𝑥 0 ) > 𝑢0 (𝑥 0 ) e se per ogni 𝑥 si ha 𝑢00 (𝑥) < 𝑓 (𝑥, 𝑢0 (𝑥) risulterà
𝑢(𝑥) > 𝑢0 (𝑥) per ogni 𝑥 > 𝑥0 .
Risultati analoghi si hanno per 𝑥 < 𝑥 0 .

Dimostrazione. Supponiamo per assurdo che l’insieme 𝐽 = {𝑥 ∈ 𝐼 : 𝑥 ≥


𝑥0 e 𝑢(𝑥) = 𝑢0 (𝑥)} non sia vuoto. Tale insieme è chiuso ed inferiormente
limitato, quindi se non è vuoto, ammette minimo. Sia 𝑥¯ il minimo di 𝐽 . Si-
curamente 𝑥¯ > 𝑥 0 in quanto 𝑢( 𝑥) ¯ = 𝑢0 ( 𝑥)
¯ . Inoltre per ogni 𝑥 ∈ [𝑥0 , 𝑥[
¯ si ha
𝑢(𝑥) − 𝑢0 (𝑥) < 0 e quindi 𝑢 0( 𝑥)
¯ ≥ 𝑢00 ( 𝑥)
¯ (in quanto il rapporto incrementale
sinistro di 𝑦 − 𝑦0 è sempre positivo).
Questo è assurdo in quanto per ipotesi si ha invece 𝑢 0( 𝑥)
¯ = 𝑓 ( 𝑥,
¯ 𝑢( 𝑥))
¯ =
𝑓 ( 𝑥,
¯ 𝑢0 ( 𝑥))
¯ < 𝑢0 ( 𝑥)
0 ¯.

Se ad esempio 𝑢0 (𝑥) è una funzione il cui grafico è contenuto in { 𝑓 = 0} (cioé


𝑓 (𝑥, 𝑢0 (𝑥)) = 0) allora una soluzione 𝑢(𝑥) dell’equazione differenziale può
attraversare la curva 𝑢0 (𝑥) dall’alto verso il basso nei punti in cui 𝑢00 (𝑥) > 0 e
dal basso verso l’alto nei punti in cui 𝑢00 (𝑥) < 0.

Esempio 9.41. Mostrare che il seguente problema di Cauchy


(
𝑢 0 = 1 − 𝑥𝑢 3
𝑢(0) = 0

ammette una soluzione 𝑢(𝑥) definita su tutto ℝ.


9.9 studio qualitativo delle soluzioni 423

Svolgimento. Posto 𝑓 (𝑥, 𝑦) = 𝑥 𝑦 3 abbiamo che 𝑓 si annulla sul grafico della



funzione 𝑢0 (𝑥) = 1/ 3 𝑥 . Per 𝑥 > 0 la soluzione è crescente quando si trova al
di sotto della funzione 𝑢0 ed è decrescente quando si trova al di sopra. Inoltre
essendo 𝑢00 < 0 le soluzioni possono attraversare la funzione 𝑢0 (𝑥) solo passando
da sotto a sopra.

Sia 𝑢(𝑥) la soluzione del problema di Cachy in questione, definita su un


intervallo massimale 𝐼 . Il dato iniziale è (0 , 0) ∈ { 𝑓 > 0}. Dunque la soluzione
risulta essere strettamente crescente in un intorno di 0.

Vogliamo dimostrare innanzitutto che necessariamente la soluzione incontra


entrambi i rami del grafico di 𝑢0 (𝑥). Sia infatti 𝜖 > 0 sufficientemente piccolo
da appartenere all’intervallo 𝐼 di esistenza della soluzione e sia 𝛿 = 𝑢(𝜖).
Consideriamo il compatto 𝐾 = {(𝑥, 𝑦) : 𝜖/2 ≤ 𝑥 ≤ 1/𝛿 2 , 0 ≤ 𝑦 ≤ 1/𝑠 𝑞𝑟𝑡𝑥}. Il
punto (𝜖, 𝑢(𝜖)) è interno al compatto 𝐾 ma la soluzione deve uscire dal compatto
per un qualche 𝑥 > 𝜖 . La soluzione però non può toccare la retta 𝑦 = 0 in
quanto all’interno del compatto rimane sempre positiva e crescente. Non può
neanche toccare il segmento verticale 𝑥 = 1/𝛿 2 , 𝑦 ∈ [0 , 𝛿] in quanto 𝑢(𝜖) = 𝛿
e per 𝑥 > 0 la soluzione è strettamente crescente. Dunque necessariamente la

soluzione deve incontrare il grafico della funzione 𝑢0 (𝑥) = 1/ 𝑥 in un punto
𝑥¯ > 0.

Nel punto 𝑥 = 𝑥¯ la soluzione 𝑢(𝑥) attraversa la curva 𝑢0 (𝑥). Infatti in tale punto
𝑢 0( 𝑥)
¯ = 0 mentre 𝑢00 ( 𝑥)
¯ < 0. Dunque in un intorno destro di 𝑥¯ la soluzione si
trova al di sopra della curva 𝑢0 (𝑥) e quindi risulta essere decrescente (in 𝑥¯ la
soluzione presenta un massimo relativo).

Il Teorema 9.40 garantisce inoltre che la soluzione non può più riattraversare il
grafico della funzione 𝑢0 in quanto 𝑢00 < 0. Dunque la soluzione è decrescente e
limitata. Dunque (usando come al solito la proposizione 9.19) possiamo dedurre
che la soluzione massimale è definita per ogni 𝑥 > 0.

Un ragionamento analogo si fa per 𝑥 < 0 ottenendo l’esistenza globale della


soluzione.

Esempio 9.42. Dimostriamo che il problema di Cauchy


(
𝑢 0 = −𝑥(𝑢 3 − sin 𝑥)
𝑢(0) = 0

ammette una soluzione 𝑢(𝑥) definita su tutto ℝ.

Dimostrazione. Sia 𝑢(𝑥) la soluzione massimale del problema di Cauchy definita


su un intervallo massimale 𝐼 .

Mostriamo innanzitutto che |𝑢(𝑥)| < 2 per ogni 𝑥 ∈ 𝐼 . Infatti per 𝑥 > 0 sulla
curva 𝑢1 (𝑥) = 2 si ha 𝑓 (𝑥, 2) = −𝑥(8 − sin 𝑥) < −𝑥 < 0 = 𝑢10 (𝑥). Dunque per il
Teorema 9.40 la soluzione per 𝑥 > 0 non può mai attraversare la retta 𝑦 = 2.
Discorso analogo si fa per la retta 𝑦 = −2 e anche per 𝑥 < 0 mostrando che il
grafico della soluzione non può mai toccare le rette 𝑦 = 2 e 𝑦 = −2 né per 𝑥 > 0
né per 𝑥 < 0 e che quindi 𝑢(𝑥) risulta limitata (in realtà si può essere più precisi
e mostrare che |𝑢(𝑥)| ≤ 1).
424 9 equazioni differenziali

A questo punto si applica, come al solito, il Teorema 9.19 ai compatti 𝐾 𝑀 =


[−𝑀, 𝑀] × [−2 , 2] mostrando che la soluzione deve avere esistenza globale.

teoremi di confronto

Teorema 9.43. Sia 𝐼 ⊆ ℝ un intervallo su cui sono definite due funzioni derivabili
𝑓 (𝑥) e 𝑔(𝑥). Siano 𝑥0 < 𝑥1 due punti di 𝐼 . Se 𝑓 (𝑥1 ) < 𝑔(𝑥1 ) e 𝑓 (𝑥 2 ) > 𝑔(𝑥 2 ) allora
esiste un punto 𝑥¯ ∈ (𝑥 1 , 𝑥 2 ) tale che 𝑓 ( 𝑥)
¯ = 𝑔( 𝑥)
¯ e 𝑓 0( 𝑥)
¯ ≥ 𝑔 0( 𝑥)
¯.

Teorema 9.44. Consideriamo due funzioni 𝑢(𝑥) e 𝑣(𝑥) soluzioni dei rispettivi problemi
di Cauchy ( (
𝑢 0(𝑥) = 𝑓 (𝑥, 𝑢(𝑥)) 𝑣 0(𝑥) = 𝑔(𝑥, 𝑣(𝑥))
𝑢(𝑥0 ) = 𝑢0 𝑣(𝑥 0 ) = 𝑣 0

su un intervallo 𝐼 che contiene il punto 𝑥 0 . Sia Ω ⊆ ℝ2 un sottoinsieme degli insiemi


di definizione di 𝑓 e 𝑔 tale che i grafici delle soluzioni 𝑢(𝑥) e 𝑣(𝑥) siano contenuti in Ω
al variare di 𝑥 ∈ 𝐼 . Supponiamo che per ogni (𝑥, 𝑦) ∈ Ω si abbia 𝑓 (𝑥, 𝑦) < 𝑔(𝑥, 𝑦).
Allora per ogni 𝑥 ∈ 𝐼 , 𝑥 > 𝑥 0 si ha 𝑢(𝑥) < 𝑣(𝑥) mentre per ogni 𝑥 ∈ 𝐼 , 𝑥 < 𝑥 0 si ha
𝑢(𝑥) > 𝑣(𝑥).

Teorema 9.45. Sia 𝑓 : (𝑥 0 , +∞) → ℝ una funzione di classe 𝐶 1 tale che il limite

lim 𝑓 0(𝑥) = ℓ
𝑥→+∞

esiste, finito o infinito. Se ℓ ≠ 0 allora 𝑓 non può avere un asintoto orizzontale per
𝑥 → +∞.
Listati A
python 3
Il seguente codice è scritto in python 3, un linguaggio di programmazione molto
semplice e pulito che permette, tra l’altro, di utilizzare diverse librerie utili per
il calcolo numerico e scientifico.

A.1 bisection.py

github
Vedi esempio 2.81.
1 def bisection(f, a, b, digits=10):
2 fa = f(a)
3 fb = f(b)
4 assert fb*fa <= 0
5 while 2 * 10**digits * (b-a) > 1:
6 c = (a+b)/2
7 fc = f(c)
8 if fc*fa < 0:
9 b = c
10 fb = fc
11 else:
12 a = c
13 fa = fc
14 return (a+b)/2
15
16 # la libreria decimal ci permette di effettuare calcoli su numeri
17 # con sviluppo decimale arbitrariamente lungo
18 from decimal import Decimal, getcontext
19 getcontext().prec = 110 # numero di cifre da utilizzare nei calcoli
20
21 # l’operatore lambda permette di definire una
22 # funzione senza dovergli dare un nome
23
24 x = bisection(lambda x: x*x-2, Decimal(0), Decimal(2), digits=100)
25 print("solution to x^2 = 2 {:.101}".format(x))
26
27 x = bisection(lambda x: x*x-3, Decimal(0), Decimal(2), digits=100)
28 print("solution to x^2 = 3: {:.101}".format(x))
29
30 x = bisection(lambda x: x*x-x-1, Decimal(0), Decimal(2), digits=100)
31 print("solution to x^2 = x+1: {:.101}".format(x))
32
33 x = bisection(lambda x: x*x*x*x*x - x - 1,
34 Decimal(0), Decimal(2), digits=100)
35 print("solution to x^5 - x = 1: {:.100}".format(x))
426 A Listati

A.2 series.py

Vedi esempio 3.11.


1 """
2 Calcola la somma della serie 1/k^2 con un errore prefissato
github 3 """
4
5 err = 0.5E-6 # errore al di sotto della sesta cifra decimale
6 S = 0.0
7 k = 1
8 while k < 1/err:
9 S += 1.0/k**2
10 k += 1
11 print("somma della serie 1/k^2: {:.7}".format(S))

A.3 compute_e.py

Vedi tabella 3.1.


1 # la libreria decimal ci permette di effettuare calcoli su numeri
2 # con sviluppo decimale arbitrariamente lungo
github 3 from decimal import Decimal, getcontext
4 def compute_e(digits):
5 sum = Decimal(0)
6 k = 0
7 k_factorial = 1
8 while k_factorial * k < 10**digits:
9 sum += Decimal(1)/Decimal(k_factorial)
10 k += 1
11 k_factorial *= k
12 return sum
13
14 getcontext().prec = 1100 # numero di cifre da utilizzare nei calcoli
15 print("e: {:.1001}".format(compute_e(1100)))

A.4 compute_pi.py

Vedi esercizio 5.79.


1 from decimal import Decimal, getcontext
2
github 3 def compute_pi(digits):
4 sum = Decimal(0)
5 k = 0
6 factor = Decimal(1)/2
7 while 3*(2*k+1)*4**k < 4*10**digits:
8 sum += factor / (2*k+1)
9 factor *= Decimal(2*k+1) / (2*k+2) / 4
10 k += 1
11 return sum * 6
A.5 Mandelbrot.py 427

12
13 getcontext().prec = 1100 # numero di cifre da utilizzare nei calcoli
14 print("pi: {:.1001}".format(compute_pi(1100)))

A.5 Mandelbrot.py

github
Vedi figura 8.8.
1 # per funzionare anche con python2
2 from __future__ import print_function
3
4 # la libreria numerica numpy ci permette di fare velocemente
5 # operazioni su matrici di numeri complessi
6 import numpy as np
7
8 xres, yres = 6400, 4800
9 iterations = 40
10
11 # cx e’ una suddivisione dell’intervallo [-2,1] in xres punti
12 cx = 3.0*np.arange(xres)/xres - 2.0
13 # cy e’ una suddivisione dell’intervallo [-1,1] in yres punti
14 cy = (2.0*np.arange(yres)/yres - 1.0) * 3.0 * yres / 2.0 / xres
15 # c e’ una matrice yres x xres contenente i numeri complessi
16 # con parte reale cx e parte immaginaria cy.
17 c = cx[np.newaxis,:] + 1j * cy[:,np.newaxis]
18
19 # z e’ una matrice di numeri complessi, inizialmente nulli, su cui
20 # faremo l’iterazione con ognuno dei dati iniziali
21 # presi dalla matrice c
22 z = np.zeros((yres, xres), dtype=np.complex)
23 for n in range(iterations):
24 print("{}% completed".format(n*100//iterations))
25 z = z*z + c
26
27 # consideriamo l’insieme dei punti che dopo iterations iterazioni
28 # non sono usciti dal disco di raggio 2.
29 mandelbrot = np.logical_not(np.abs(z) < 2.0)
30
31 # utilizziamo la libreria imageio che ci permette di
32 # trasformare facilmente una matrice in una immagine
33 from imageio import imwrite
34 filename = ’mandelbrot.png’
35 print("saving image to", filename)
36
37 # converti la matrice booleana in interi a 8 bit
38 image = mandelbrot * np.uint8(255)
39 # salva l’uimmagine su file
40 imwrite(filename, image)
428 A Listati

A.6 Koch.py

github
Vedi figura 7.4.
1 import sys
2 from math import *
3
4 def affine_koch(t, s, iter):
5 """
6 t, s are affine (triangular) coordinates
7 @return positive if inside, negative if outside
8 """
9 if t+s > 1: return 1.
10 if t<=0 or s<=0: return -1.
11 if 3*(t+s) < 2: return -.5
12 if iter <= 0: return 0.
13 if 3*s >= 2: return affine_koch(3*t, 3*s-2, iter-1)
14 if 3*t >= 2: return affine_koch(3*t-2, 3*s, iter-1)
15 if 3*t <= 1: return affine_koch(3*t-2+3*s, 2-3*s, iter-1)
16 return affine_koch(2-3*t,3*s-2+3*t, iter-1)
17
18 RAD_3 = sqrt(3)
19
20 def koch(x, y, iter):
21 return affine_koch(1 - x - y/RAD_3, x - y/RAD_3, iter)
22
23 def pbm_image(out, xres, yres):
24 iter = 1 + log(max(xres, yres))/log(3)
25 out.write("P1\n")
26 out.write("# koch PBM by Emanuele Paolini\n")
27 out.write("{} {}\n".format(xres, yres))
28 for y in range(yres):
29 for x in range(xres):
30 k = koch(x*1./xres, (yres-1-y)*1./xres, iter)
31 out.write(’0’ if k<=0 else ’1’)
32 out.write("\n")
33
34 xres = 6400
35 yres = 2000
36 filename = "koch.pbm"
37
38 if len(sys.argv) >= 2:
39 filename = sys.argv[1]
40
41 if len(sys.argv) == 4:
42 xres, yres = map(int,argv[2:])
43
44 print("Writing to file: {}\n".format(filename))
45 with open(filename, "w") as out:
46 pbm_image(out, xres, yres);
A.7 Fourier.py 429

A.7 Fourier.py

Vedi figura 7.3


1 from sympy import *
2 from sympy.plotting import plot
3 # se usi jupyter: %matplotlib inline github
4
5 def e(k):
6 """
7 k-esimo elemento della base hilbertiana
8 """
9 k = Integer(k)
10 if k == 0:
11 return lambda x: 1/sqrt(2*pi)
12 elif k % 2 == 0:
13 return lambda x: cos(k/2 * x)/sqrt(pi)
14 else:
15 return lambda x: sin((k+1)/2 * x)/sqrt(pi)
16
17 def f(g):
18 """
19 integra g contro la funzione che vale -1
20 in (-pi,0) e 1 in (0,pi)
21 """
22 x = symbols("x")
23 return integrate(g(x), (x, 0, pi)) - integrate(g(x), (x, pi, 2*pi))
24
25 def fourier(f, n):
26 """
27 calcola l’n-esimo polinomio trigonometrico approssimante f
28 """
29 return lambda x: sum([f(e(k)) * e(k)(x) for k in range(n+1)])
30
31
32 """
33 Calcola e disegna lo sviluppo di Fourier
34 """
35 x = symbols(’x’)
36 n = 61
37 print("polinomio trigonometrico di ordine {}".format(n))
38 pol = fourier(f,n)(x)
39 print(pol)
40 fig = plot(pol, (x, 0, 2*pi))
41 if hasattr(fig, "savefig"):
42 fig.savefig("fourier.png", dpi=600)
43 else:
44 fig.save("fourier.png")
Bibliografia

[1] R. Courant and F. John. Introduction to calculus and analysis. Interscience


Publishers, 1965.
[2] E. Giusti. Analisi matematica 1. Bollati Boringhieri, 2012.
[3] P. Marcellini and C. Sbordone. Analisi matematica uno. Liguori Editore, 1998.
[4] C. D. Pagani and S. Salsa. Analisi matematica Volume 1. Zanichelli, 1993.
[5] E. Paolini. Appunti di logica. http://pagine.dm.unipi.it/paolini/
didattica/appunti/logica.pdf.

[6] W. Rudin. Analisi matematica. McGraw-Hill, 1991.


(download)
Indice analitico

!, 25 problema di Basilea, 392


!!, 26 339
+∞, −∞, 52 𝜋, iv abeliano, 21
𝐴𝐶 , 11 cifre decimali, 228 additività, 276
𝐴[𝑥], 29 definizione, 148 additività dell’integrale, 244
𝐴𝐵 , 7 formula di addizione, 61
𝐶 ∞ , 202 Gregory-Leibniz, formule della
𝐶 𝑘 , 202 227, 327 trigonometria, 146
𝑂 grande, 214 irrazionalità, 288 aleph, 18
𝑍𝐹 , 11 prodotto di Wallis, 289 algoritmo
𝑍𝐹𝐶 , 11 𝜓 , iv calcolo della radice
k·k 𝐶 0 , 312 exp 𝑧 , 139 𝑛 -esima, 346
ℂ, 60 sinh, cosh, 152 di Erone, 346
Γ funzione di Eulero, 280 𝜌, iv di Euclide, 161
Im 𝑧 , 61 settcosh, 154 AM, 197
settsinh, 154 anello, 24
𝕂 [𝑥], 29
𝜎, iv antiderivata, 252
Re 𝑧 , 61
∼, 96 aperto, 300
Σ, iv
sin, 146 approssimazione
ℤ, 24
sviluppo in serie, 146 di exp, 143
ℵ0 , 18
argomento, 155
𝛼, iv sinh,
√ 152
2 arrotondamento, 37
≈, 41
cifre decimali, 108 asintoticamente equivalenti,
ℝ̄, 52
sviluppo in serie, 226 96
𝛽 , iv
sup, 35 asintoto
𝜒, iv
𝜏, iv obliquo, 182
cos, 146
definizione, 148 orizzontale, 182
sviluppo in serie, 146
tg 𝑥 , 151 verticale, 182
cosh, 152
asintoto obliquo, 206
𝛿, iv tgh, 153
asintoto orizzontale e obliquo,
𝜀, iv 𝜃 , iv
182
exp 𝜁
assioma
approssimazione, 143 di Riemann, 339
della scelta, 11
𝛾, iv 𝑒 , 92
di infinito, 21
, 96 cifre decimali, 144
associatività, 21
inf, 35 è irrazionale, 144
assolutamente
∞, 63 𝑒 ∉ ℚ, 144
integrabile, 281
𝜆, iv 𝑓 (𝑗) , 202
assolutamente convergente,
, 96 𝑛 !, 25
124
P(·), 5 𝑛 !!, 26
𝜇, iv 𝑜 piccolo, 214 Banach
𝜈, iv ℕ , 22 spazio di, 305
esistenza e unicità loca-
𝜔, iv teorema delle contrazioni,
le
𝜑, iv, 367 , 308
per i sistemi del primo
𝜋 ordine base
hilbertiana, 329 centro, 417 ordinamento, 21
Basilea Cesàro, 106 uniforme, 203
problema di, 339 Chebyshev continuo, 21
Bernoulli, 91 polinomio di, 332 ipotesi del, 18
equazione di, 385 chiuso, 300 contrazione, 308
Bessel chiusura, 301 controimmagine
disuguaglianza di, 329 cifre insieme, 8
biettiva, 8 𝜋
√, 228 convergente, 86
bigettiva, 8 2, 108 convergenza
binomiale 𝑒 , 144 assoluta
serie, 222 Clairaut integrale, 281
binomiale centrale, 289 equazione di, 385 condizionata di una serie,
binomio classe di equivalenza, 6 127
coefficienti, 32 codominio, 7 dominata, 317
potenza, 32 coefficienti binomiali, 32
bisezione incondizionata, 125
coefficienti di Fourier, 333
metodo di, 107 puntuale, 311
combinazioni baricentriche,
Bolzano-Weierstrass, 101 totale, 325
196
uniforme, 309
commutatività, 21
Caccioppoli uniforme di una serie,
compatto, 303
perimetro, 110 323
complessi
Renato, 110 convergenza dominata, 317
addizione, 61
teorema delle contrazioni, convergenza dominata
coniugio, 61
308 uniforme, 316
modulo, 62
cambio convesso, 191
moltiplicazione, 61
di variabile, 255 coordinate
unitari, 155
cambio di variabile, 276 vettore, 20
campana completamento del quadrato,
57 coordinate, componenti,
di Gauss, 271 vettore, 20
campo ordinato, 46 completezza, 305
di ℝ, 306 coppia, 5
campo ordinato continuo, coseno
46 di 𝐶 0 ([𝑎, 𝑏]), 312
completo, 305 iperbolico, 152
Cantor
Dedekind, 21 costante, 41
insieme di, 124, 343
componenti di Lipschitz, 203
primo metodo diagonale,
vettore, 20 di Nepero, 92
50
condizione iniziale, 375 crescente, 41
carabineri
teorema dei, 83 condizione necessaria per la crescita esponenziale, 89
carattere convergenza, 113 criterio
dell’integrale, 273 confronto tra limiti, 83 del confronto asintotico,
di una serie, 111, 114 congergenza 117
di una serie a termini integrale, 272 del confronto per serie,
positivi, 116 congiunzione logica, 1 116
di una successione, 86 coniugato, 61 del rapporto alla Cesàro,
cardinalità, 9 contare, 11 106
Cauchy, 199 continua, 67, 302 del rapporto per le
successione di, 304 continua nel punto, 67 successioni, 95
Cauchy-Schwarz continuità, 67 del rapporto per serie,
disuguaglianza di, 199, delle serie di potenze, 118
297 137 della radice, 117
della radice per di Cauchy-Schwarz, 199, lineare omogenea,
successioni, 96 297 374
di condensazione di di Jensen, 196, 250 lineari di ordine 𝑛 ,
Cauchy, 120 di Young, 198 400
di integrabilità, 238 media aritmetica media non omogenea, 400
di Leibniz, 126 geometrica, 197 omogenea associata,
di monotonia, 184 triangolare 400
curva di Köch, 343, 344 inversa, 295 ordinaria, 371
disuguaglianza di ordine, 371
De Giorgi Cauchy-Schwarz, sistema, 372
Ennio, 110 199 funzionale, 371
de l’Hospital, 201 disuguaglianza di Young, ricorsiva
decomposizione 297 lineare, 363
dei polinomi complessi, divergente, 86 equipotenza, 9
168 divergenza equivalenza
in fratti semplici integrale, 272 asintotica, 96
complessi, 265 divisione, 46 Erone
decrescente, 41 divisione tra polinomi, 161 algoritmo di, 346
Dedekind divisore, 25 esistenza e unicità globale,
finito, 12 dominio, 7 399
infinito, 12 doppio fattoriale, 26 esistenza e unicità locale,
Dedekind-completo, 21 399
definitivamente, 82 EDO, 371 espressioni polinomiali, 29
densa, 21 EDP, 371 estensione della soluzione,
densità di ℚ, 39 elementare 395
derivata, 174 funzione, 271 estremo
delle funzioni elementari, elemento inferiore, 35
177 d’area, 234 superiore, 35
non continua, 189 inverso, 21 Euclide
parziale, 181, 389 neutro, 21 algoritmo di divisione,
derivato, 301 elevamento a potenza, 25 161
determinante ennuple, 20 Euler
wronksiano, 409 epigrafico, 191 Leonhard, 110
differenza, 15 epigrafico di 𝑓 , 191 Eulero, 110, 117
dinamica equazione formula di, 146, 148
complessa, 368 di Bernoulli, 385 problema di Basilea,
discontinuità a salto, 183 di Clairaut, 385 339
discontinuità eliminabile, di Newton, 385
183 di Riccati, 385 fase, 155
disgiunzione logica, 1 differenziale, 371 fattoriale, 25
dispari, 25, 54 alle derivate parziali, doppio, 26
distanza, 295 371 formula di Stirling, 291
di Hausdorff, 340 autonoma, 372 semi fattoriale, 26
euclidea, 299 in forma implicita, stima asintotica, 284
indotta, 296, 300 372 fattorizzazione
Manhattan, 299 in forma normale, dei polinomi complessi,
uniforme, 309 372 168
disuguaglianza lineare, 374 Feynman
di Bernoulli, 91 lineare a coefficienti trucco per gli integrali,
di Bessel, 329 costanti, 374 319
trucco per le derivate, di una variabile, 181 fondamentale della
180 dispari, 54 trigonometria, 146
Fibonacci, 345, 367 esponenziale, 47, 141 illimitata, 87
formula esplicita, 367 gaussiana, 271, 280, immaginario, 61
successione di, 345, 349 320 immagine, 8
finito, 34 hoelderiana, 203 insieme, 8
insieme, 12 integrale, 250 implicazioni, 1
flesso verticale, 182 inversa, 8 indeterminata, 86
forme indeterminate, 80 invertibile, 8 induttivo, 12
formula lipschitziana, 202, 307 inf, 35
di addizione, 146 monotòna, 41, 70
inferiormente
di Eulero, 146, 148 pari, 54
limitato, 35, 55
di Gregory-Lebniz per periodica, 54
infinitesimo, 96
𝜋/4, 227, 327 polinomiale, 31
infinito, 34, 63, 96
di Newton-Mercator, razionale, 260
insieme, 12
226 speciale, 271
suriettiva, 70 iniettiva, 7
di Stirling, 291 insieme
di Taylor, 206 funzione segno, 67
funzioni controimmagine, 8
con resto di Lagrange,
circolari, 146 degli zeri, 54
207
elementari, 271 delle parti, 5
con resto di Peano,
iperboliche, 152 di Cantor, 124, 343
209
trigonometriche, 146 di convergenza, 134
di Wallis, 289
funzioni lineari, 55 di Mandelbrot, 368
di Werner, 331
funzioni quadratiche, 56 equipotente, 9
fondamentale del calcolo
fuoco instabile, 417 finito, 12
integrale, 251
fuoco stabile, 417 infinito, 12
fondamentale della
trigonometria, 146 invariante, 348
Gauss
Fourier insieme finito, 12
funzione di, 271, 280,
serie di, 329 insieme infinito, 12
320
fratti semplici insieme quoziente, 6
GM, 197
scomposizione grado, 31 insieme vuoto, 3
complessa, 265 polinomio, 31 insiemi
frequentemente, 83 grafico, 7 equipotenti, 9
frontiera, 301 Gregory integrabile
funzione approssimazione 𝜋, 227, assolutamente, 281
Γ di Eulero, 280 327 integrabilità, 237
analitica, 219, 220 Gregory-Leibniz, 227, 327 controesempio, 241
bigettiva, 8 gruppo, 21 funzioni continue, 246
composta, 8 gruppo ordinato, 21 funzioni monotone,
concava, 191 247
Heine-Cantor, 304
continua, 67, 70 integrala
Hermite
convessa, 191 di una serie, 323
scomposizione in fratti
derivabile con derivata integrale, 237
semplici, 265
non continua, 189 additività, 244
Hilbert
di Dirichlet, 241 cambio di variabile,
base di, 329
di errore, 271 255
Hoelder, 203
di Heaviside, 247 carattere, 273
di più variabili, 181 identità convergente, 272
convergenza assoluta, jet, 365, 400 di Vandermonde, 365
281 Jordan wronksiana, 409
definizione, 237 misura di, 233 matrice e, 409
di Lebesgue, 317 media
di Riemann, 237 k, iv aritmetica, 197
divergente, 272 geometrica, 197
funzioni elementari, Lagrange, 184 media aritmetica geometrica,
254 Landau 197
gaussiana, 280, 320 simboli di, 214 metodo
improprio, 272 lattina di bisezione, 107
additività, 276 problema della, 186 minimo, 16
cambio di variabile, Lebesgue relativo, 182
276 integrale di, 317 minorante, 16
carattere, 273 Leibniz misura
convergente, 272 approssimazione 𝜋, 227, di Peano-Jordan, 233
convergenza assoluta, 327 trasformazione lineare,
281 criterio di, 126 234
divergenza, 272 limitata, 55, 86 misurabile, 233
indeterminato, 273 limitato, 35, 165, 303 modulo, 62
linearità, 276 inferiormente, 35 modulo di continuità, 204
monotonia, 276 superiormente, 35 molteplicità, 168
per parti, 277 limite moltiplicazione, 45, 61
indeterminato, 273 confronto, 83 monotonia, 41, 276
per parti, 258 del prodotto, 80 monotòna, 41
sostituzione diretta, del rapporto, 80
255 della somma, 80 naturali, 22
sostituzione inversa, destro/sinistro, 74 negativo, 22
255 di funzione, 73 negazione logica, 1
integrazione per parti, 277 superiore/inferiore, neutro, 21
intervallo, 53 102 Newton
intervallo massimale, 376 limiti che si riconducono al equazione di, 385
intorni, 73 numero 𝑒 , 92 Newton-Mercator, 226
destri/sinistri, 73 linea nodo
intorno, 301 retta, 56 instabile, 415
inversa destra, 10 linearità, 276 stabile, 415
inversa sinistra, 10 linearità della somma infinita, nodo improprio, 416
inverso, 21 113 norma, 296
invertibile, 8 linearizzazione, 174 𝐶 0 , 312
ipotesi Lipschitz, 202 𝑝 in ℝ𝑛 , 299
del continuo, 18 logaritmo, 50 euclidea di ℝ𝑛 , 299
irrazionalità logaritmo naturale, 94 Manhattan, 299
di 𝜋, 288 uniforme, 309
di 𝑒 , 144 maggiorante, 16 normato, 296
isoperimetrico Mandelbrot notazione posizionale
problema, 110 insieme di, 368 decimale, 24
Manhattan numeri
j, iv distanza, 299 complessi, 60
Jensen norma, 299 immaginari, 61
disuguaglianza di, 196, massimo, 16 naturali, 22
250 matrice numeri interi, 24
numeri naturali, 11 variabili, 181 di ℝ𝑛 , 298
numeri razionali, 38 polinomio, 29 prodotto scalare definito
numero algoritmo di Euclide, positivo, 297
negativo, 22 161 proposizione, 1
positivo, 22 caratteristico, 363 proprietà
di una equazione archimedea, 36
O grande, 214 ricorsiva lineare, associativa, 21
o piccolo, 214 363 commutativa, 21
ODE, 371 di Chebyshev, 332 dei valori intermedi,
omogenea, 400 di MacLaurin, 206 108
omomorfismo, 42 di secondo grado, 56 delle funzioni seno e
opposto, 21, 22 di Taylor, 206 coseno, 146
ordinale, 19 divisione, 161 proprietà del
ordine fattorizzazione parallelogramma,
continuo, 21 complessa, 168 297
di infinito, 96 grado, 31 proprietà di Cauchy-Lipschitz,
equazione differenziale, polinomio trigonometrico, 392
371 331 punto
ordine di infinito/infinitesimo, polirettangolo angoloso, 182
96 critico, 182
cartesiano, 232
ordini di infinito, 97 di accumulazione, 74,
positivo, 22
oscillazioni 301
potenza, 47
piccole del pendolo, di aderenza, 301
del binomio, 32
386 di cuspide, 182
insiemi, 7
di flesso, 182
palla, 300 predicato, 1
di frontiera, 301
parallelogramma preimmagine, 8
di massimo, 55
proprietà del, 297 insieme, 8
di minimo, 55
pari, 25, 54 primi
esterno, 301
parte somma dei reciproci,
fisso, 308, 348
esterna, 301 132
interno, 301
immaginaria, 61 primitiva, 252
isolato, 301
intera, 37 principio
limite, 102
interna, 301 di annullamento dei
stazionario, 182
reale, 61 polinomi, 163
punto di massimo/minimo,
partizione di Riemann, 237 di sovrapposizione,
55
PDE, 371 374
punto isolato, 76
Peano-Jordan, 233 problema
python 3, 425
misura di, 233 della lattina, 186
pendolo di Basilea, 339 quantificatore esistenziale, 2
periodo del, 386 di Cauchy, 375 quantificatore universale, 2
periodica, 54 di Didone, 110
periodo isoperimetrico, 110 radiante, 146, 157
del pendolo, 386 prodotti radice
permanenza del segno, 80 notevoli, 31 cubica, 49
permutazione, 28 prodotti infiniti, 132 quadrata, 49
piccole oscillazioni, 386, 387 prodotto, 24 radice 𝑛 -esima
Pitagora prodotto limitata per algoritmo di Erone, 346
teorema, 297 infinitesima, 88 radici 𝑛 -esime, 160
più prodotto scalare raggio di convergenza, 135
rapporto a termini positivi, 116 somme superiori/inferiori,
aureo, 367 armonica, 120 237
criterio del, 95 a segni alterni, 126, sostituzione
incrementale, 175 226 diretta, 255
rappresentazione cartesiana, generalizzata, 121 inversa, 255
61 binomiale, 222 sottosuccessione, 99
reciproco, 21, 46 carattere, 111 sottrazione, 22
regolare, 86 che differiscono su un spazio
relazione, 5 numero finito di di Banach, 305
relazione d’ordine, 15 termini, 114 di Hilbert, 305
relazione d’ordine totale, 15 convergenza uniforme, metrico, 295, 300
relazione di equivalenza, 6 323 speciale
retta, 56 funzione, 271
derivata, 324
tangente, 174 stabilità
di Fourier, 329, 333
rettangolo, 231 del carattere, 114
di Newton-Mercator,
Riccati stella, 415
226
equazione di, 385 Stirling formula di, 291
di potenze, 133
ricorsione, 345 strettamente
geometrica, 112
Riemann crescente, 41
funzione 𝜁 , 339 integrale, 323
somma, 111 decrescente, 41
integrale di, 237 monotòna, 41
partizione di, 237 stabilità del carattere,
114 successione, 85
somme inferiori, 237
telescopica, 115 carattere, 86
somme superiori, 237
convergente, 86
suddivisione di, 237 termini, 111
definita per ricorrenza,
Rolle, 184 settore
345
Ruffini, 163 di coseno iperbolico,
di Cauchy, 304
154
scambio della derivata con di Fibonacci, 345, 349,
di seno iperbolico, 154
l’integrale, 318 367
sfera 𝑛 -dimensionale, 300
scelta divergente, 86
simboli di Landau, 214
assioma della, 11 indeterminata, 86
sistema
Schwarz massimizzanti, 109
dinamico minimizzanti, 109
disuguaglianza di
discreto, 345 regolare, 86
Cauchy-, 199
sistema ortonormale, 329 ricorsiva, 345
scomposizione
sistemi di equazioni successore, 11
in fratti semplici
differenziali, 372 suddivisione di Riemann,
complessi, 265
soluzione massimale, 395 237
sella, 414
somma, 111, 323 sup, 35
semi fattoriale, 26
semigruppo, 89 dei reciproci dei primi, superiormente
seno 132 limitato, 35
iperbolico, 152 della serie geometrica, superiormente limitata, 55
senza ritardo, 371 112 surgettiva, 7
sequenzialmente di Cesàro, 106 sviluppo
chiuso, 165 di una serie, 111 polinomio di Taylor,
compatto, 303 per parti, 130 213
continua, 302 telescopica, 28 serie di Taylor, 225
serie somme sviluppo del binomio, 297
a segni alterni, 126 parziali, 111 sviluppo di Fourier, 333
sviluppo in serie di Heine-Cantor, 205, una
coseno, 146 304 variabile, 181
seno, 146 di Hermite, 265 uniforme continuità, 203
di Lagrange, 184 uniformemente continua,
tangente di Leibniz, 126 304
di Pitagora, 297 unitario, 155
funzione trigonometrica,
di Rolle, 184 unità, 21
151
di Ruffini, 163 unità immaginaria, 61
iperbolica, 153
di Taylor con resto di uno, 21
Taylor
Lagrange, 207
polinomi delle funzioni
di Taylor con resto di valore assoluto, 39
elementari, 213
Peano, 209 Vandermonde, 365
resto di Lagrange, 207
di Torricelli-Barrow, variabile
resto di Peano, 209
250 funzione di una, 181
sviluppi in serie delle
di Weierstrass, 109 variabili
funzioni elementari,
fondamentale del calcolo funzione di più, 181
225
integrale, 250 variabili libere, 2
telescopico, 28
fondamentale vettore, 20
teorema
dell’algebra, 166 Von Newumann, 19
convergenza dominata, integrazione di una serie
317 di funzioni, 323 w, iv
degli zeri, 107 Jensen, 250 Wallis
dei carabinieri, 84 Lebesgue, 317 approssimazione di 𝜋,
dei due carabinieri, 83 termini, 111 289
del confronto, 83 di una serie, 111 Weiestrass
dell’asintoto, 205 topologia, 300 Karl, 110
della permanenza del Torricelli-Barrow Werner
segno, 80 teorema di, 250 formula di, 331
delle contrazioni, 308 trigonometria wronksiano, 409
derivazione di una serie formule di addizione,
di funzioni, 324 146 x, iv
di Banach-Caccioppoli, funzioni elementari,
308 146 y, iv
di Bolzano-Weierstrass, identità fondamentale, Young
101 146 disuguaglianza di, 198,
di Cauchy, 199 trucco 297
di convergenza dominata, di Feynman, 180, 319
316 per gli integrali, 319 zero, 11, 21
di de l’Hospital, 201 per le derivate, 180 di una funzione, 54

Potrebbero piacerti anche