Analisi Uno

Appunti di
Analisi Matematica Uno
Emanuele Paolini
27 maggio 2021
manu-fatto
This work is licensed under a Creative Commons “Attribution-NonCommercial-
ShareAlike 4.0 International” license.
Introduzione
Queste note sono nate come appunti per il corso di Analisi Matematica del
corso di studi in Fisica dell’Università di Pisa negli anni accademici 2017/18,
2018/19, 2019/20 e 2020/21.
Le note (come il corso a cui fanno riferimento) riguardano l’analisi delle

funzioni di una variabile reale. Gli argomenti trattati sono serie e successioni
numeriche, il calcolo differenziale e il calcolo integrale. Viene anche introdotta
la convergenza uniforme allo scopo di considerare, come ultimo argomento, lo
studio delle equazioni differenziali ordinarie. Da subito vengono introdotti i
numeri complessi che vengono utilizzati laddove possono aiutare a dare una
visione più unitaria e concettualmente più semplice degli argomenti trattati (in
particolare nello studio delle serie di potenze, nella definizione delle funzioni
trigonometriche, nella risoluzione delle equazioni differenziali lineari).
Le note sono estensive, non c’è alcun tentativo di concisione. L’obiettivo è quello
di raccogliere tutti quei risultati che non sempre è possibile esporre in maniera
dettagliata e rigorosa a lezione. Troveremo, ad esempio, definizioni equivalenti
della funzione esponenziale e una definizione analitica (tramite serie di potenze)
delle funzioni trigonometriche (e di 𝜋). Proponiamo la dimostrazione del
teorema fondamentale dell’algebra, della formula di Stirling e di Wallis, e
dell’irrazionalità di 𝑒 e di 𝜋. Viene proposta una definizione formale dei
simboli di Landau 𝑜 -piccolo e 𝑂 -grande con i relativi teoremi per trattare queste
espressioni. Lo stesso viene fatto per il simbolo di integrale indefinito. Vengono
trattati quei risultati algebrici che permettono di giustificare gli algoritmi per
il calcolo delle primitive delle funzioni razionali e per risolvere le equazioni
differenziali lineari con il metodo di similarità.
I risultati più importanti sono marcati con degli asterischi sul margine della
pagina: *** molto importante, ** importante, * rilevante. Il lettore è invitato
a non perdere tempo sui risultati più marginali se i risultati importanti non
sono del tutto chiari. Le figure non sono frequenti ma a margine di molte
di esse è presente un QR-code (un quadrato formato da una nuvola di pixel)
che permette di accedere alla figura online e modicarne i parametri. Nella
versione PDF il QR-code è cliccabile. Nella versione cartacea si può usare la
fotocamera del proprio smartphone per scansionare il codice e visitare la pagina
corrispondente. In alternativa si può visitare la pagina https://paolini.
github.io/AnalisiUno/ dove sono inseriti tutti i collegamenti alle figure
interattive. Queste note sono rese disponibili liberamente sia in formato PDF
che in forma di sorgente LATEX. Un modo per sostenere questo progetto e
mantenerlo disponibile liberamente per tutti, è quello di acquistarne una copia
cartacea.
Il materiale è costantemente in evoluzione e certamente contiene errori e

incoerenze. Ogni suggerimento o commento è benvenuto!
contributi
Ringrazio: Valerio Amico, Rico Bellani, Fabio Bensch, Jacopo Bernardini, Elia
Bonistalli, Antonino Calderone, Davide Campanella Galanti, Alessandro Can-
zonieri, Giulio Carlo, Luca Casagrande, Alessandro Casini, Giulio Cianti, Luca
Ciceri, Tommaso Ceccotti, Giorgio Ciocca, Luca Ciucci, Francesco Debortoli,
Martino Dimartino, Igor Di Tota, Irene Iorio, Marco Labella, Davide Labroscia-
no, Viviana Lippolis, Luigina Mazzone, Roberto Menta, Michele Monti, Elena
Morano, Aurora Mugnai, Marco Nuti, Ruben Pariente, Daniele Pavarini, Gu-
glielmo Pellitteri, Paolo Pennoni, Davide Perrone, Lorenzo Pierfederici, Mattia
Ripepe, Francesco Rodriguez, Gabriele Scarci, Maria Antonella Secondo, Irene
Silvestro, Alessio Squilloni, Antonio Tagliente, Francesco Enrico Teofilo, Laura
Toni, Giacomo Trupiano, Bianca Turini, Francesco Vaselli, Antoine Venturini,
Matteo Vilucchio, Piero Viscone che hanno segnalato errori e correzioni.
Ringrazio i colleghi Vincenzo Tortorelli e Pietro Majer che mi hanno dato molti
suggerimenti preziosi.
pronuncia delle lettere straniere
inglesi:
𝐽 𝑗 gei (i lunga)
𝐾 𝑘 cappa (key)
𝑊 𝑤 vu doppia
𝑋 𝑥 ics
𝑌 𝑦 ipsilon (i greca)
greche:
𝐴 𝛼 alfa 𝐼 𝜄 iota 𝑃 𝜌 ro
𝐵 𝛽 beta 𝐾 𝜅 kappa† Σ 𝜎 sigma
Γ 𝛾 gamma Λ 𝜆 lambda 𝑇 𝜏 tau
Δ 𝛿 delta 𝑀 𝜇 mi (mu) 𝑌 𝜐 ipsilon§
𝐸 𝜀 epsilon 𝑁 𝜈 ni (nu) Φ 𝜑 fi
𝑍 𝜁 zeta∗ Ξ 𝜉 csi 𝑋 𝜒 chi
𝐻 𝜂 eta 𝑂 𝑜 omicron Ψ 𝜓 psi
Θ 𝜃 teta Π 𝜋 pi‡ Ω 𝜔 omega
ebraiche:
ℵ alef
∗ pronunciato usualmente con la 𝑧 dolce per distinguerlo dalla 𝑧 .

† in inglese si distingue la pronuncia tra 𝑘 key e 𝜅 kappa.
‡ in italiano pi greco in inglese pai, per distinguere da 𝑝 .
§ si pronuncia upsilon per distinguerla da 𝑦 .
Indice
Indice v
1 fondamenti 1
1.1 proposizioni e predicati . . . . . . . . . . . . . . . . . . . . . . . 1
1.2 teoria degli insiemi . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.3 relazioni . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
1.4 funzioni . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
1.5 cardinalità . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
1.6 i numeri naturali . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
1.7 insiemi prodotto . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
1.8 la retta dei numeri reali . . . . . . . . . . . . . . . . . . . . . . . 20
1.9 i numeri naturali e interi . . . . . . . . . . . . . . . . . . . . . . 22
1.10 polinomi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
1.11 coefficienti binomiali . . . . . . . . . . . . . . . . . . . . . . . . 31
1.12 cardinalità finite . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
1.13 estremo superiore . . . . . . . . . . . . . . . . . . . . . . . . . . 35
1.14 l’insieme dei numeri razionali . . . . . . . . . . . . . . . . . . . 37
1.15 valore assoluto . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
1.16 numeri decimali . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
1.17 isomorfismi di gruppi ordinati . . . . . . . . . . . . . . . . . . . 41
1.18 funzione esponenziale e potenza . . . . . . . . . . . . . . . . . . 46
1.19 radice 𝑛 -esima . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48
1.20 logaritmo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50
1.21 cardinalità infinite . . . . . . . . . . . . . . . . . . . . . . . . . . 50
1.22 punti all’infinito . . . . . . . . . . . . . . . . . . . . . . . . . . . 52
1.23 intervalli . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53
1.24 andamento del grafico di una funzione . . . . . . . . . . . . . . 53
1.25 funzioni lineari . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
1.26 funzioni quadratiche . . . . . . . . . . . . . . . . . . . . . . . . 56
1.27 equazioni e disequazioni . . . . . . . . . . . . . . . . . . . . . . 58
1.28 i numeri complessi . . . . . . . . . . . . . . . . . . . . . . . . . . 60
2 funzioni continue, limiti e successioni 67

2.1 funzioni continue . . . . . . . . . . . . . . . . . . . . . . . . . . 67
2.2 limite di funzione . . . . . . . . . . . . . . . . . . . . . . . . . . 72
2.3 proprietà frequenti e definitive . . . . . . . . . . . . . . . . . . . 82
2.4 criteri di confronto . . . . . . . . . . . . . . . . . . . . . . . . . . 83
2.5 successioni . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85
2.6 limite di successione . . . . . . . . . . . . . . . . . . . . . . . . . 85
2.7 successioni limitate . . . . . . . . . . . . . . . . . . . . . . . . . 86
2.8 successioni monotòne . . . . . . . . . . . . . . . . . . . . . . . . 88
2.9 la costante di Nepero . . . . . . . . . . . . . . . . . . . . . . . . 89
2.10 criteri del rapporto e della radice . . . . . . . . . . . . . . . . . . 95
2.11 ordini di infinito, equivalenza asintotica . . . . . . . . . . . . . . 96
2.12 successioni estratte . . . . . . . . . . . . . . . . . . . . . . . . . . 99
2.13 punti limite . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101
2.14 il teorema degli zeri . . . . . . . . . . . . . . . . . . . . . . . . . 107
2.15 il teorema di Weierstrass . . . . . . . . . . . . . . . . . . . . . . 109
2.16 successioni ricorsive . . . . . . . . . . . . . . . . . . . . . . . . . 110
3 serie 111
3.1 serie telescopiche . . . . . . . . . . . . . . . . . . . . . . . . . . 115
3.2 serie a termini positivi . . . . . . . . . . . . . . . . . . . . . . . . 116
associatività della somma di una serie . . . . . . . . . . . . . . . 119
la serie armonica . . . . . . . . . . . . . . . . . . . . . . . . . . . 120
3.3 rappresentazione posizionale dei numeri reali . . . . . . . . . . 122
3.4 convergenza assoluta . . . . . . . . . . . . . . . . . . . . . . . . 124
3.5 serie a segno variabile . . . . . . . . . . . . . . . . . . . . . . . . 126
3.6 somme multiple . . . . . . . . . . . . . . . . . . . . . . . . . . . 128
3.7 somma per parti . . . . . . . . . . . . . . . . . . . . . . . . . . . 130
3.8 prodotti infiniti . . . . . . . . . . . . . . . . . . . . . . . . . . . . 132
3.9 le serie di potenze . . . . . . . . . . . . . . . . . . . . . . . . . . 133
3.10 la serie esponenziale . . . . . . . . . . . . . . . . . . . . . . . . . 139
3.11 le funzioni trigonometriche . . . . . . . . . . . . . . . . . . . . . 145
3.12 funzioni trigonometriche inverse . . . . . . . . . . . . . . . . . . 150
3.13 funzioni iperboliche . . . . . . . . . . . . . . . . . . . . . . . . . 152
3.14 esercizi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 154
4 i numeri complessi 155

4.1 rappresentazione polare dei numeri complessi . . . . . . . . . . 155
4.2 interpretazione geometrica . . . . . . . . . . . . . . . . . . . . . 156
4.3 radici complesse 𝑛 -esime . . . . . . . . . . . . . . . . . . . . . . 160
4.4 ancora polinomi . . . . . . . . . . . . . . . . . . . . . . . . . . . 161
4.5 il teorema fondamentale dell’algebra . . . . . . . . . . . . . . . 164
4.6 fattorizzazione dei polinomi . . . . . . . . . . . . . . . . . . . . 168
5 calcolo differenziale 173

5.1 derivata . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 173
5.2 derivate parziali . . . . . . . . . . . . . . . . . . . . . . . . . . . 181
5.3 punti notevoli . . . . . . . . . . . . . . . . . . . . . . . . . . . . 181
5.4 criteri di monotonia . . . . . . . . . . . . . . . . . . . . . . . . . 183
5.5 convessità . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 191
5.6 teoremi di Cauchy e de l’Hospital . . . . . . . . . . . . . . . . . 199
5.7 classi di regolarità . . . . . . . . . . . . . . . . . . . . . . . . . . 202
5.8 formula di Taylor . . . . . . . . . . . . . . . . . . . . . . . . . . 206
5.9 operazioni con i simboli di Landau . . . . . . . . . . . . . . . . 214
5.10 funzioni analitiche . . . . . . . . . . . . . . . . . . . . . . . . . . 219
5.11 derivata complessa . . . . . . . . . . . . . . . . . . . . . . . . . 229
6 calcolo integrale 231

6.1 misura di Peano-Jordan . . . . . . . . . . . . . . . . . . . . . . . 231
6.2 integrale di Riemann . . . . . . . . . . . . . . . . . . . . . . . . 237
6.3 teorema fondamentale del calcolo integrale . . . . . . . . . . . . 250
6.4 calcolo delle primitive . . . . . . . . . . . . . . . . . . . . . . . . 254
6.5 integrale di una funzione razionale . . . . . . . . . . . . . . . . 260
6.6 integrali che si riconducono a funzioni razionali . . . . . . . . . 267
6.7 funzioni speciali . . . . . . . . . . . . . . . . . . . . . . . . . . . 271
6.8 integrali impropri . . . . . . . . . . . . . . . . . . . . . . . . . . 271
6.9 studio di funzioni integrali . . . . . . . . . . . . . . . . . . . . . 284
6.10 alcune applicazioni del calcolo integrale . . . . . . . . . . . . . 288
7 spazi di funzioni 295

7.1 spazi metrici e topologia . . . . . . . . . . . . . . . . . . . . . . 300
7.2 completezza . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 304
7.3 convergenza uniforme . . . . . . . . . . . . . . . . . . . . . . . . 309
7.4 passaggio al limite sotto il segno di integrale . . . . . . . . . . . 312
7.5 scambio della derivata con il limite . . . . . . . . . . . . . . . . 321
serie di funzioni . . . . . . . . . . . . . . . . . . . . . . . . . . . 323
7.6 convergenza integrale . . . . . . . . . . . . . . . . . . . . . . . . 327
serie di Fourier . . . . . . . . . . . . . . . . . . . . . . . . . . . . 329
7.7 divagazione sui frattali autosimili . . . . . . . . . . . . . . . . . 340
8 successioni ricorsive 345

8.1 equazioni ricorsive autonome del primo ordine . . . . . . . . . 346
8.2 approfondimenti . . . . . . . . . . . . . . . . . . . . . . . . . . . 362
8.3 equazioni ricorsive lineari . . . . . . . . . . . . . . . . . . . . . . 363
8.4 dinamica complessa . . . . . . . . . . . . . . . . . . . . . . . . . 368
9 equazioni differenziali 371

9.1 classificazione . . . . . . . . . . . . . . . . . . . . . . . . . . . . 371
equazioni lineari . . . . . . . . . . . . . . . . . . . . . . . . . . . 374
problema di Cauchy . . . . . . . . . . . . . . . . . . . . . . . . . 375
9.2 metodi risolutivi . . . . . . . . . . . . . . . . . . . . . . . . . . . 376
equazioni lineari del primo ordine . . . . . . . . . . . . . . . . . 376
equazioni a variabili separabili . . . . . . . . . . . . . . . . . . . 380
altri metodi risolutivi . . . . . . . . . . . . . . . . . . . . . . . . 384
9.3 funzioni vettoriali e di più variabili . . . . . . . . . . . . . . . . 389
9.4 il problema di Cauchy . . . . . . . . . . . . . . . . . . . . . . . . 391
9.5 il problema di Cauchy per equazioni di ordine 𝑛 . . . . . . . . . 398
9.6 equazioni lineari di ordine 𝑛 . . . . . . . . . . . . . . . . . . . . 400
9.7 equazioni lineari di ordine 𝑛 a coefficienti costanti . . . . . . . . 402
9.8 sistemi lineari . . . . . . . . . . . . . . . . . . . . . . . . . . . . 412
sistemi 2 × 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 413
matrice esponenziale . . . . . . . . . . . . . . . . . . . . . . . . 417
9.9 studio qualitativo delle soluzioni . . . . . . . . . . . . . . . . . . 420
monotonia e punti critici delle soluzioni . . . . . . . . . . . . . . 422
teoremi di confronto . . . . . . . . . . . . . . . . . . . . . . . . . 424
A Listati 425
A.1 bisection.py . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 425
A.2 series.py . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 426
A.3 compute_e.py . . . . . . . . . . . . . . . . . . . . . . . . . . . . 426
A.4 compute_pi.py . . . . . . . . . . . . . . . . . . . . . . . . . . . . 426
A.5 Mandelbrot.py . . . . . . . . . . . . . . . . . . . . . . . . . . . . 427
A.6 Koch.py . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 428
A.7 Fourier.py . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 429
Indice analitico 433

fondamenti 1
1.1 proposizioni e predicati
Se, come diceva Galileo, la matematica è il linguaggio della scienza, è importante

che la matematica sia essa stessa espressa in un linguaggio che risulti essere
il più possibile oggettivo e non ambiguo. La logica è la disciplina matematica
che si occupa dello studio e della formalizzazione del linguaggio matematico.
In questo capitolo riassumiamo in maniera breve ed intuitiva alcuni concetti
che probabilmente sono noti e contemporaneamente fissiamo le notazioni che
verranno utilizzate nel seguito.
Una proposizione è una frase (formalmente diremmo formula) che assume un proposizione
valore di verità ben definito: vero oppure falso. Un esempio di proposizione
(falsa) è “2+2=5”.
E’ possibile combinare più proposizioni mediante gli operatori logici. Se 𝑃 e 𝑄

sono proposizioni si può costruire la proposizione 𝑃 ∧ 𝑄 chiamata congiunzione
logica. Tale proposizione si può leggere “𝑃 e 𝑄 ” ed è una proposizione che congiunzione
risulta essere vera solamente nel caso in cui sia 𝑃 che 𝑄 siano vere. Spesso la
congiunzione logica è sottointesa: se si fa un elenco di proposizioni 𝑃, 𝑄, 𝑅 si
intende usualmente la loro congiunzione 𝑃 ∧ 𝑄 ∧ 𝑅 cioè si intende che devono
essere tutte vere. La disgiunzione logica denotata con 𝑃 ∨ 𝑄 si può leggere “𝑃 disgiunzione
o 𝑄 ” ed è una proposizione che è vera se almeno una tra 𝑃 e 𝑄 è vera. La
negazione logica denotata con ¬𝑃 è una proposizione che si può leggere “non 𝑃 ” negazione
che è vera quando 𝑃 è falsa ed è falsa quando 𝑃 è vera.
Operatori logici molto utilizzati sono le implicazioni. La proposizione 𝑃 ⇒ 𝑄 si implicazioni

può leggere “𝑃 implica 𝑄 ” e significa che 𝑄 è vera se 𝑃 è vera. Non si confonda
il valore di verità di 𝑃 ⇒ 𝑄 con il valore di verità di 𝑄 . Se 𝑃 è vera allora
𝑃 ⇒ 𝑄 è vera o falsa a seconda che 𝑄 sia vera o falsa. Ma se 𝑃 è falsa allora
l’implicazione 𝑃 ⇒ 𝑄 è vera indipendentemente dal valore di 𝑄 . In effetti
𝑃 ⇒ 𝑄 è equivalente a 𝑄 ∨ ¬𝑃 perché per la verità di 𝑃 ⇒ 𝑄 basta che 𝑄 sia
vera (quando 𝑃 è vera) oppure che 𝑃 sia falsa.
La freccia inversa 𝑃 ⇐ 𝑄 si può utilizzare per invertire l’implicazione: è

equivalente a 𝑄 ⇒ 𝑃 . Se valgono entrambe le implicazioni (𝑃 ⇐ 𝑄) ∧ (𝑃 ⇒ 𝑄)
è facile convincersi che 𝑃 e 𝑄 devono avere lo stesso valore di verità: diremo
quindi che sono equivalenti e scriveremo 𝑃 ⇔ 𝑄 .
Nella tabella 1.1 sono riportati tutti i valori di verità che si possono ottenere
combinando tra loro due proposizioni. Nella tabella 1.2 sono riportate alcune
proprietà di tali operatori: queste proprietà possono essere capite interpretando
il loro significato ma possono anche essere dedotte meccanicamente tramite la
tabella di verità delle operazioni.
predicato
Un predicato è una proposizione che contiene una o più variabili, il cui valore di
verità, quindi, può dipendere dal valore assegnato alle variabili. Un esempio di
predicato è 𝑥 + 2 = 5 che risulta essere vero se 𝑥 = 3 e falso altrimenti.
2 1 fondamenti
Tabella 1.1: La tabella di verità degli 𝑃 𝑄 ¬𝑃 𝑃∧𝑄 𝑃∨𝑄 𝑃⇒𝑄 𝑃⇐𝑄 𝑃⇔𝑄
operatori logici.
V V F V V V V V
V F F F V F V F
F V V F V V F F
F F V F F V V V
Tabella 1.2: Alcune proprietà degli ope- ¬¬𝑃 ⇐⇒ 𝑃 doppia negazione

ratori logici.
𝑃∧𝑄 ⇐⇒ 𝑄∧𝑃 simmetria
𝑃∨𝑄 ⇐⇒ 𝑄∨𝑃
¬(𝑃 ∧ 𝑄) ⇐⇒ (¬𝑃) ∨ (¬𝑄) formule di De Morgan
¬(𝑃 ∨ 𝑄) ⇐⇒ (¬𝑃) ∧ (¬𝑄)
(𝑃 ∧ 𝑄) ∨ 𝑅 ⇐⇒ (𝑃 ∨ 𝑅) ∧ (𝑄 ∨ 𝑅) proprietà distributiva
(𝑃 ∨ 𝑄) ∧ 𝑅 ⇐⇒ (𝑃 ∧ 𝑅) ∨ (𝑄 ∧ 𝑅)
(𝑃 ⇒ 𝑄) ⇐⇒ (𝑄 ⇐ 𝑃) antisimmetria
¬(𝑃 ⇒ 𝑄) ⇐⇒ 𝑃 ∧ (¬𝑄) controesempio
(𝑃 ⇒ 𝑄) ⇐⇒ ¬(𝑃 ∧ (¬𝑄)) dimostrazione per assurdo
(𝑃 ⇒ 𝑄) ⇐⇒ (¬𝑄 ⇒ ¬𝑃) implicazione contropositiva
Se un predicato dipende da una o più variabili queste si chiamano variabili

variabili libere
libere. E’ possibile chiudere una variabile libera mediante un quantificatore. Il
quantificatore universale denotato col simbolo ∀ serve ad affermare che il predicato
quantificatore universale è vero per ogni possibile valore della variabile quantificata. Ad esempio la
proposizione ∀𝑥 : 𝑥 + 2 = 5 significa: “per ogni 𝑥 si ha 𝑥 + 2 = 5” ed è una
proposizione falsa. Il quantificatore ∀𝑥 rende muta la variabile 𝑥 del predicato
𝑥 + 2 = 5 nel senso che la proposizione non dipende più dal valore di quella
variabile, che non è più una variabile libera.
quantificatore esistenziale Il quantificatore esistenziale denotato col simbolo ∃ serve ad affermare che il
predicato è vero per almeno un valore della variabile quantificata. Ad esempio
la proposizione ∃𝑥 : 𝑥 + 2 = 5 significa: “esiste almeno un 𝑥 per cui risulta
𝑥 + 2 = 5”. Quello che si ottiene è una proposizione in cui la variabile 𝑥 è muta.
In questo caso la proposizione è vera in quanto per 𝑥 = 3 il predicato è vero.
Un predicato può dipendere da più variabili ed è quindi possibile inserire più

quantificatori. In tal caso l’ordine dei quantificatori può essere rilevante. Delle
seguenti proposizioni la prima è vera, la seconda invece è falsa:
∀𝑥 : ∃𝑦 : 𝑥 + 2 = 𝑦
∃𝑦 : ∀𝑥 : 𝑥 + 2 = 𝑦.
Alcune proprietà dei quantificatori logici sono riportate nella tabella 1.3.
Tabella 1.3: Alcune proprietà dei quanti- ¬∀𝑥 : 𝑃(𝑥) ⇐⇒ ∃𝑥 : ¬𝑃(𝑥)

ficatori logici ( 𝑐 è una qualunque costan-
te)
¬∃𝑥 : 𝑃(𝑥) ⇐⇒ ∀𝑥 : ¬𝑃(𝑥)
∀𝑥 : 𝑃(𝑥) =⇒ 𝑃(𝑐)
∃𝑥 : 𝑃(𝑥) ⇐= 𝑃(𝑐)
𝑃 ∧ ∀𝑥 : 𝑄(𝑥) ⇐⇒ ∀𝑥 : 𝑃 ∧ 𝑄(𝑥)
𝑃 ∧ ∃𝑥 : 𝑄(𝑥) ⇐⇒ ∃𝑥 : 𝑃 ∧ 𝑄(𝑥)
1.2 teoria degli insiemi 3
Spesso il quantificatore universale viene sottointeso ad esempio con 𝑥 + 𝑦 = 𝑥 + 𝑦

se non indicato diversamente si intende che tutte le variabili libere sono
quantificate tramite quantificatore universale: ∀𝑥 : ∀𝑦 : 𝑥 + 𝑦 = 𝑦 + 𝑥 . Inoltre
il segno di interpunzione : può essere omesso ∀𝑥∀𝑦 𝑥 + 𝑦 = 𝑦 + 𝑥 oppure
una quantificazione può essere fatta contemporaneamente su più variabili
∀𝑥, 𝑦 : 𝑥 + 𝑦 = 𝑦 + 𝑥 . A volte, se non crea ambiguità, si potranno scrivere i
quantificatori anche a fine frase 𝑥 + 𝑦 = 𝑦 + 𝑥, ∀𝑥∀𝑦 .
1.2 teoria degli insiemi
Nei paragrafi precedenti abbiamo visto che i predicati possono essere combinati
tra loro e quantificati. Ma quali sono i predicati elementari che possiamo
considerare? La teoria degli insiemi ci fornisce la formalizzazione del concetto
di appartenenza: il predicato di base (l’unico che ci servirà) è un predicato della
forma 𝑥 ∈ 𝐴 che significa “l’oggetto 𝑥 è un elemento dell’insieme 𝐴”. La
teoria degli insiemi non spiega (né tantomento definisce) cosa siano gli oggetti
e cosa siano gli insiemi perché questi sono concetti primitivi (come lo sono i
punti e le rette per la geometria euclidea). La teoria degli insiemi ci fornisce,
semplicemente, le regole formali che possono essere utilizzate per trattare i
predicati della forma 𝑥 ∈ 𝐴. Ad esempio un assioma della teoria degli insiemi è
il seguente:
∃𝐴 : ¬∃𝑥 : 𝑥 ∈ 𝐴
che significa: “esiste un insieme 𝐴 che non contiene alcun elemento 𝑥 ” ovvero insieme vuoto
stiamo dicendo che esiste l’insieme vuoto che normalmente viene denotato con
il simbolo ∅. Altri opportuni assiomi della teoria degli insiemi garantiscono
l’esistenza dell’unione 𝐴 ∪ 𝐵, intersezione 𝐴 ∩ 𝐵 e differenza 𝐴 \ 𝐵 di due
insiemi qualunque 𝐴 e 𝐵. Tali operazioni tra insiemi possono essere ricondotte
alla relazione di appartenenza e possono quindi essere definite come segue:
𝑥 ∈ 𝐴 ∪ 𝐵 ⇐⇒ (𝑥 ∈ 𝐴) ∨ (𝑥 ∈ 𝐵)
𝑥 ∈ 𝐴 ∩ 𝐵 ⇐⇒ (𝑥 ∈ 𝐴) ∧ (𝑥 ∈ 𝐵)
𝑥 ∈ 𝐴 \ 𝐵 ⇐⇒ (𝑥 ∈ 𝐴) ∧ ¬(𝑥 ∈ 𝐵).
La negazione dell’appartenenza ¬(𝑥 ∈ 𝐴) viene usualmente abbreviata con

𝑥 ∉ 𝐴.
Sempre utilizzando la semplice relazione di appartenenza possiamo definire

le relazioni di inclusione e uguaglianza tra insiemi: 𝐴 ⊆ 𝐵 si legge “𝐴 è un
sottoinsieme di 𝐵” e 𝐴 = 𝐵 si legge “𝐴 è uguale a 𝐵”. Queste relazioni sono
definite dalle seguenti proprietà:
𝐴 ⊆ 𝐵 ⇐⇒ ∀𝑥 : (𝑥 ∈ 𝐴 =⇒ 𝑥 ∈ 𝐵)
𝐴 = 𝐵 ⇐⇒ ∀𝑥 : (𝑥 ∈ 𝐴 ⇐⇒ 𝑥 ∈ 𝐵).
Ovviamente la relazione 𝐴 ⊆ 𝐵 può essere invertita: scriveremo 𝐴 ⊇ 𝐵 (che si

può leggere: “𝐴 è un soprainsieme di 𝐵”) per indicare 𝐵 ⊆ 𝐴. Scriveremo anche
𝐴 ≠ 𝐵 per indicare la relazione opposta dell’uguaglianza ovvero: ¬(𝐴 = 𝐵).
4 1 fondamenti
Risulta molto utile la possibilità di costruire insiemi di insiemi. Per questo

motivo la teoria degli insiemi usualmente non fa distinzione tra oggetti e insiemi
di oggetti. Nella relazione primitiva 𝑥 ∈ 𝐴 anche 𝑥 può essere un insieme.
Possiamo allora immaginare che ogni oggetto del nostro universo sia un insieme.
In questo modo la relazione di uguaglianza 𝐴 = 𝐵 che abbiamo definito sopra
risulta ben definita per ogni coppia di oggetti (o insiemi, che è lo stesso) 𝐴 e
𝐵.
Visto che gli elementi di un insieme A sono a loro volta insiemi, è possibile
L’intersezione di una famiglia vuota di considerare l’unione A e, se A ≠ ∅, l’intersezione A di tutti gli elementi
S T
insiemi darebbe l’insieme universo, che
vedremo non può essere definito.
di A. Questo estende il concetto di unione e intersezione anche a famiglie
eventualmente infinite:
[
𝑥∈ A ⇐⇒ ∃𝐴 ∈ A : 𝑥 ∈ 𝐴,
\
𝑥∈ A ⇐⇒ ∀𝐴 ∈ A : 𝑥 ∈ 𝐴.
Un altro assioma della teoria degli insiemi garantisce che per ogni 𝑥 esiste un
insieme il cui unico elemento è 𝑥 . Tale insieme si chiama singoletto e si denota
con {𝑥}. La proprietà che definisce il singoletto è la seguente:
𝑦 ∈ {𝑥} ⇐⇒ 𝑦 = 𝑥.
Facendo l’unione di singoletti possiamo definire (per elencazione) insiemi che

contengono un numero finito di oggetti:
{𝑎, 𝑏} = {𝑎} ∪ {𝑏}

{𝑎, 𝑏, 𝑐} = {𝑎, 𝑏} ∪ {𝑐}
{𝑎, 𝑏, 𝑐, 𝑑} = {𝑎, 𝑏, 𝑐} ∪ {𝑑}
..
.
Si faccia però attenzione: l’insieme {𝑎, 𝑏} contiene due elementi solamente se

𝑎 ≠ 𝑏 , infatti se 𝑎 = 𝑏 si potrà facilmente verificare che
{𝑎, 𝑎} = {𝑎}. (1.1)
Esercizio 1.1. Verificare (1.1) utilizzando le definizioni formali date in precedenza.
Svolgimento. Utilizzando le definizioni di unione, di singoletto e di disgiunzione

logica si ha l’equivalenza dei seguenti predicati:
𝑥 ∈ {𝑎, 𝑎}
𝑥 ∈ {𝑎} ∪ {𝑎}
(𝑥 ∈ {𝑎}) ∨ (𝑥 ∈ {𝑎})
(𝑥 = 𝑎) ∨ (𝑥 = 𝑎)
𝑥=𝑎
𝑥 ∈ {𝑎}
1.3 relazioni 5
e dunque {𝑎, 𝑎} = {𝑎} per la definizione di uguaglianza tra insiemi.
Se 𝑃(𝑥) è un predicato in una sola variabile 𝑥 vorremmo poter definire l’insieme,

denotato con {𝑥 : 𝑃(𝑥)} di tutti gli oggetti 𝑥 che rendono vero il predicato
𝑃(𝑥):
𝑎 ∈ {𝑥 : 𝑃(𝑥)} ⇐⇒ 𝑃(𝑎).
Sorprendentemente se inseriamo questo assioma nella teoria degli insiemi si
giunge ad un paradosso (paradosso di Russell, si veda [5]) e si ottiene quindi
una teoria incoerente (cioè una teoria in cui tutte le proposizioni sono vere).
Per evitare l’incoerenza è necessario limitare l’assioma (chiamato assioma di
specificazione) alla costruzione di sottoinsiemi di insiemi già costruiti. Se 𝐵 è un
insieme e 𝑃(𝑥) è un predicato possiamo considerare l’insieme {𝑥 ∈ 𝐵 : 𝑃(𝑥)}
che è il sottoinsieme di 𝐵 formato da tutti gli elementi di 𝐵 che soddisfano il
predicato:
𝑎 ∈ {𝑥 ∈ 𝐵 : 𝑃(𝑥)} ⇐⇒ (𝑎 ∈ 𝐵 ∧ 𝑃(𝑎)).
Per completare la teoria degli insiemi introduciamo anche il concetto di insieme

delle parti. Un apposito assioma garantisce che dato un qualunque insieme 𝐴 insieme delle parti
esiste l’insieme P(𝐴) delle parti di 𝐴 che è l’insieme di tutti i sottoinsiemi di 𝐴:
𝑥 ∈ P(𝐴) ⇐⇒ 𝑥 ⊆ 𝐴. (1.2)
1.3 relazioni
Grazie agli assiomi precedenti è possibile definire il prodotto cartesiano di due

insiemi: sarà questo un concetto molto importante nel seguito. Innanzitutto
coppia
dobbiamo definire il concetto di coppia: dati 𝑎, 𝑏 definiamo la coppia (𝑎, 𝑏)
con primo elemento 𝑎 e secondo elemento 𝑏 come un oggetto che ha questa Un modo formale per definire la coppia
proprietà tramite l’utilizzo di insiemi è dovuto a
(𝑎, 𝑏) = (𝑎 0 , 𝑏 0) ⇐⇒ (𝑎 = 𝑎 0) ∧ (𝑏 = 𝑏 0). (1.3) Kuratowski:
(𝑎, 𝑏) = {𝑎, {𝑎, 𝑏}}.

Stiamo cioè richiedendo che una coppia venga identificata dai due elementi che
la compongono in cui, però, è importante anche l’ordine in cui vengono elencati Non è difficile verificare che questa
definizione soddisfa la proprietà (1.3)
(a differenza dell’insieme {𝑎, 𝑏}, in cui l’ordine degli elementi è irrilevante).
Se definiamo (𝑎, 𝑏) = {𝑎, {𝑎, 𝑏}} (si veda
Il prodotto cartesiano 𝐴 × 𝐵 di due insiemi 𝐴 e 𝐵 è l’insieme di tutte le coppieil nota precedente) possiamo formalmente
definire
cui primo elemento sta in 𝐴 e il secondo elemento sta in 𝐵:
𝐴 × 𝐵 = 𝐶 ∈ P(𝐴 ∪ 𝐵) :

(𝑎, 𝑏) ∈ 𝐴 × 𝐵 ⇐⇒ (𝑎 ∈ 𝐴 ∧ 𝑏 ∈ 𝐵). ∃𝑎 : ∃𝑏 : 𝑎 ∈ 𝐴, 𝑏 ∈ 𝐵,
𝐶 = {𝑎, {𝑎, 𝑏}}

Se rappresentiamo gli elementi di 𝐴 come dei punti su una retta orizzontale

(asse delle 𝑥 ) e gli elementi di 𝐵 come dei punti su una retta verticale (asse delle
𝑦 ) gli elementi di 𝐴 × 𝐵 possono essere rappresentati come i punti del piano che
proiettati sull’asse delle 𝑥 vanno in 𝐴 e proiettati sull’asse delle 𝑦 vanno in 𝐵.
relazione
Una relazione 𝑅 tra gli elementi di un insieme 𝐴 e gli elementi di un insieme
𝐵 non è altro che un sottoinsieme di 𝐴 × 𝐵. Per una relazione 𝑅 ⊆ 𝐴 × 𝐵 si
userà la notazione infissa 𝑎𝑅𝑏 per indicare (𝑎, 𝑏) ∈ 𝑅 . Ad esempio se prendo
6 1 fondamenti
𝐴
𝐵
𝐵 𝑓
(𝑎2 ,𝑏 3 ) (𝑎4 ,𝑏 3 ) 𝑎1
𝑏3 𝑏1
(𝑎 3 ,𝑏 2 ) 𝑎2
𝑏2 𝑏2
(𝑎1 ,𝑏 1 ) 𝑎3
Figura 1.1: La funzione 𝑓 : 𝐴 → 𝐵, 𝑓 = 𝑏1 𝑏3
{𝑎1 ↦→ 𝑏1 , 𝑎2 ↦→ 𝑏 3 , 𝑎3 ↦→ 𝑏2 , 𝑎4 ↦→ 𝑏3 } 𝑎4
rappresentata tramite grafico e tramite 𝐴
diagrammi di Venn. 𝑎1 𝑎2 𝑎3 𝑎4
𝐴 = 𝐵 = {1 , 2 , 3} e considero la relazione 𝑅 = {(1, 2), (1 , 3), (2 , 3)} il predicato

𝑎𝑅𝑏 rappresenta l’usuale relazione d’ordine 𝑎 < 𝑏 sui tre numeri considerati.
Definizione 1.2 (relazione di equivalenza). Se 𝑅 ⊆ 𝐴 × 𝐴 è una relazione

relazione di equivalenza sull’insieme 𝐴, diremo che 𝑅 è una relazione di equivalenza se valgono le seguenti
proprietà (tipiche dell’uguaglianza)
1. riflessiva: 𝑥𝑅𝑥 ;
2. simmetrica: se 𝑥𝑅𝑦 allora 𝑦𝑅𝑥 ;
3. transitiva: 𝑥𝑅𝑦 e 𝑦𝑅𝑧 allora 𝑥𝑅𝑧 .
Se 𝑅 è una relazione di equivalenza diremo che 𝑥 è equivalente a 𝑦 (tramite 𝑅 ) se 𝑥𝑅𝑦 .

Dato 𝑥 ∈ 𝐴 l’insieme di tutti gli elementi di 𝐴 che sono equivalenti a 𝑦 tramite 𝑅 si
classe di equivalenza
chiama classe di equivalenza di 𝑥 . Si definisce in questo modo:
[𝑥]𝑅 = {𝑦 ∈ 𝐴 : 𝑥𝑅𝑦}.
insieme quoziente
Se 𝑅 è una relazione di equivalenza su 𝐴 definiamo l’insieme quoziente come l’insieme
di tutte le classi di equivalenza:
𝐴/𝑅 = {[𝑥]𝑅 : 𝑥 ∈ 𝐴} = {𝐵 ∈ P(𝐴) : ∃𝑥 ∈ 𝐴 𝐵 = [𝑥]}.
Se 𝑅 è una relazione 𝐴 l’insieme quoziente 𝐴/𝑅 rappresenta l’insieme degli

oggetti di 𝐴 in cui vengono identificati tra loro gli oggetti equivalenti. Spesso
diremo che 𝐴/𝑅 rappresenta 𝐴 a meno della equivalenza 𝑅 .
Ad esempio se 𝐴 = {1 , 2 , 3 , 4 , 5} e prendiamo 𝐷 = {1 , 3 , 5} (i numeri dispari)

e 𝑃 = {2 , 4} = 𝐴 \ 𝐵 (i numeri pari) possiamo definire una relazione 𝑅 su 𝐴
mediante la proprietà:
𝑥𝑅𝑦 ⇐⇒ (𝑥 ∈ 𝑃 ∧ 𝑦 ∈ 𝑃) ∨ (𝑥 ∈ 𝐷 ∧ 𝑦 ∈ 𝐷).
La relazione 𝑅 rappresenta la proprietà degli elementi di 𝐴 di avere la stessa

“parità”. Si avrà [1]𝑅 = [3]𝑅 = [5]𝑅 = 𝐷 e [2]𝑅 = [4]𝑅 = 𝑃 . Dunque
𝐴/𝑅 = {𝑃, 𝐷}
e, in effetti, questo insieme ha due elementi 𝑃 e 𝐷 che è quello che si ottiene

identificando i numeri di 𝐴 in base alla proprietà di essere pari o dispari.
1.4 funzioni 7
1.4 funzioni
Per introdurre il concetto di funzione è utile utilizzare una notazione alternativa

per la coppia: invece di denotarla con (𝑎, 𝑏) useremo la notazione 𝑎 ↦→ 𝑏 e
penseremo intuitivamente alla coppia come ad una freccia che collega l’oggetto
𝑎 all’oggetto 𝑏 . Dunque il prodotto cartesiano 𝐴 × 𝐵 risulta essere l’insieme di
tutte le frecce che partono dagli elementi di 𝐴 e arrivano agli elementi di 𝐵.
Una funzione 𝑓 : 𝐴 → 𝐵 è un insieme di frecce che mandano ogni punto di 𝐴

in modo univoco in un punto di 𝐵. Formalmente 𝑓 è quindi un sottoinsieme di
𝐴 × 𝐵 (ed è quindi una relazione) con la proprietà che per ogni 𝑎 ∈ 𝐴 c’è una
ed una sola freccia uscente da 𝑎 : esiste cioè un unico 𝑏 ∈ 𝐵 tale che (𝑎, 𝑏) ∈ 𝑓 .
𝑓
Invece di scrivere (𝑎, 𝑏) ∈ 𝑓 potremo scrivere in modo più espressivo 𝑎 ↦→ 𝑏 .
𝑓
Dato 𝑎 ∈ 𝐴 esiste dunque un unico 𝑏 ∈ 𝐵 tale che 𝑎 ↦→ 𝑏 : chiameremo 𝑓 (𝑎) tale
oggetto 𝑏 . Si avrà dunque
𝑓
𝑏 = 𝑓 (𝑎) ⇐⇒ 𝑎 ↦→ 𝑏.
L’insieme di tutte le funzioni 𝑓 : 𝐴 → 𝐵 viene usualmente denotato con 𝐵 𝐴 . 𝐵𝐴
L’insieme 𝐴 viene chiamato dominio della funzione 𝑓 , l’insieme 𝐵 viene chiamato dominio
codominio. La funzione 𝑓 rappresenta quindi un modo di assegnare in maniera
codominio
univoca ad ogni elemento del dominio un elemento del codominio. Da un
punto di vista informatico potremmo dire che 𝐴 è l’insieme dei possibili input e
𝐵 è l’insieme dei possibili output della funzione 𝑓 .
Sebbene abbiamo costruito il concetto di funzione utilizzando la teoria degli

insiemi, nel seguito non assumeremo mai che le funzioni siano state definite in
questo modo, ma useremo solamente le loro proprietà senza andare ad indagare
quale sia esattamente la loro costruzione interna. Quindi invece di scrivere
(𝑎, 𝑏) ∈ 𝑓 scriveremo sempre 𝑓 (𝑎) = 𝑏 . Sarà comunque molto importante
considerare l’insieme che rappresenta 𝑓 ma questo verrà chiamato grafico di 𝑓 , grafico
𝐺 𝑓 e potrà essere definito in questo modo:
𝐺 𝑓 = {(𝑥, 𝑦) ∈ 𝐴 × 𝐵 : 𝑓 (𝑥) = 𝑦}.
Nella nostra costruzione risulta effettivamente 𝐺 𝑓 = 𝑓 . Anticipiamo fin da

subito che lo studio dei grafici delle funzioni reali è uno degli argomenti
principali di questo corso.
Capita molto spesso che un fenomeno possa essere modellizzato matematica-

mente tramite una funzione: si sa che ad un certo input 𝑎 corrisponde un output
𝑏 = 𝑓 (𝑎). Molto spesso il problema da risolvere è quello di determinare l’input
giusto 𝑎 per ottenere l’output voluto 𝑏 . Questo problema corrisponde ad invertire
la funzione 𝑓 : dato 𝑏 ∈ 𝐵 determinare 𝑥 ∈ 𝐴 tale che 𝑓 (𝑥) = 𝑏 .
surgettiva
Una funzione 𝑓 : 𝐴 → 𝐵 si dice essere surgettiva (o suriettiva) se per ogni 𝑏 ∈ 𝐵
esiste almeno un 𝑥 ∈ 𝐴 per cui 𝑓 (𝑥) = 𝑏 . Questo significa che il problema
dell’inversione ha almeno una soluzione, qualunque sia 𝑏 ∈ 𝐵. Una funzione
iniettiva
𝑓 : 𝐴 → 𝐵 si dice essere iniettiva se non esistono due punti distinti 𝑎, 𝑎 0 ∈ 𝐴,
𝑎 ≠ 𝑎 0 tali che 𝑓 (𝑎) = 𝑓 (𝑎 0). Questo significa che il problema dell’inversione
8 1 fondamenti
𝑓 (𝑥) = 𝑏 ha al più una soluzione (la soluzione, se esiste, è unica). Una funzione
bigettiva
𝑓 : 𝐴 → 𝐵 si dice essere bigettiva (o biettiva) o invertibile se è sia iniettiva che
surgettiva. Questo significa che il problema dell’inversione 𝑓 (𝑥) = 𝑏 ha una
invertibile unica soluzione 𝑥 ∈ 𝐴 qualunque sia 𝑏 ∈ 𝐵. In particolare, se 𝑓 è invertibile,
Attenzione: in alcuni testi (tra cui [2]) per ogni 𝑏 ∈ 𝐵 esiste un unico 𝑎 ∈ 𝐴 per cui 𝑓 (𝑎) = 𝑏 . Chiamato 𝑎 = 𝑔(𝑏)
si considerano invertibili le funzioni l’unico 𝑎 ∈ 𝐴 per cui 𝑓 (𝑎) = 𝑏 si ottiene dunque una funzione 𝑔 : 𝐵 → 𝐴 con le
iniettive, anche se non surgettive.
proprietà:
∀𝑎 ∈ 𝐴 : 𝑔( 𝑓 (𝑎)) = 𝑎, ∀𝑏 ∈ 𝐵 : 𝑓 (𝑔(𝑏)) = 𝑏.
funzione inversa
Una funzione 𝑔 con queste proprietà viene chiamata funzione inversa di 𝑓 e viene
usualmente denotata con il simbolo 𝑓 −1 .
Se 𝑓 : 𝐴 → 𝐵 e 𝑔 : 𝐵 → 𝐶 sono due funzioni in cui il codominio della prima

funzione composta coincide con il dominio della seconda, allora definiamo la funzione composta
𝑔 ◦ 𝑓 : 𝐴 → 𝐶 che si ottiene applicando prima 𝑓 e poi 𝑔 :
(𝑔 ◦ 𝑓 )(𝑥) = 𝑔( 𝑓 (𝑥)).
Se il codominio di 𝑓 non coincide col dominio di 𝑔 è possibile dare comunque

senso alla funzione 𝑔 ◦ 𝑓 che risulta però definita solamente nei punti del
dominio di 𝑓 che vengono mandati, tramite 𝑓 nel dominio di 𝑔 .
Introduciamo ora delle notazioni che sarà comodo utilizzare nel seguito. Se
𝑓 : 𝐴 → 𝐵 è una funzione e se 𝐶 ⊆ 𝐴 definiamo
𝑓 (𝐶) = { 𝑓 (𝑎) : 𝑎 ∈ 𝐶} = {𝑏 ∈ 𝐵 : ∃𝑎 ∈ 𝐶 : 𝑏 = 𝑓 (𝑎)}.

insieme immagine
L’insieme 𝑓 (𝐶) ⊆ 𝐵 si chiama immagine di 𝐶 (tramite 𝑓 ) ed è formato da tutti
i punti che si ottengono applicando 𝑓 agli elementi di 𝐶 . L’immagine 𝑓 (𝐴)
dell’intero dominio 𝐴 si chiama immagine di 𝑓 . Si noti che 𝑓 è surgettiva se
e solo se 𝑓 (𝐴) = 𝐵 (cioè se l’immagine coincide col codominio). Anche se
𝑓 : 𝐴 → 𝐵 non fosse iniettiva, per ogni 𝐶 ⊆ 𝐵 possiamo definire
𝑓 −1 (𝐶) = {𝑎 ∈ 𝐴 : 𝑓 (𝑎) ∈ 𝐶}.

preimmagine
L’insieme 𝑓 −1 (𝐶) ⊆ 𝐴 si chiama preimmagine o controimmagine di 𝐶 (tramite 𝑓 )
ed è formato da tutti i punti di 𝐴 che applicando 𝑓 vanno in 𝐶 . Si noti che se
𝑏 ∈ 𝐵 l’insieme 𝑓 −1 ({𝑏}) non è altro che l’insieme delle soluzioni dell’equazione
𝑓 (𝑥) = 𝑏 . Come abbiamo già visto tale insieme contiene almeno un elemento se
𝑓 è suriettiva, contiene al più un elemento se 𝑓 è iniettiva e contiene esattamente
un elemento 𝑓 −1 ({𝑏}) = 𝑓 −1 (𝑏) se 𝑓 è bigettiva.

La notazione 𝑓 (𝐶) appena introdotta è formalmente ambigua in quanto potrebbe

non essere chiaro se 𝐶 è un elemento oppure un sottoinsieme del dominio di 𝑓 .
In pratica il contesto dovrebbe rendere chiaro cosa si intende.
Più in generale ci capiterà di estendere questo abuso di notazione non solo alle
funzioni, ma anche alle relazioni e alle operazioni. Ad esempio se 𝐴 e 𝐵 sono
insiemi di numeri ci capiterà di scrivere 𝐴 ≤ 𝐵 per indendere che ogni elemento
di 𝐴 è minore o uguale ad ogni elemento di 𝐵 oppure 𝐴 + 𝐵 per intendere
l’insieme di tutti i numeri che si ottengono sommando un numero di 𝐴 ad un
numero di 𝐵.
1.5 cardinalità 9
𝐴
𝐴\𝐵
𝐵
Figura 1.2: Nella dimostrazione del teo-

rema di Cantor-Bernstein 𝐴 è rappresen-
tato da un quadrato e 𝐵 da un cerchio
contenuto in 𝐴. L’immagine di 𝐴 in 𝐵 è
rappresentata da un quadrato contenuto
in 𝐵 e così via. La parte ombreggiata è
l’insieme 𝐷 .
1.5 cardinalità
Definizione 1.3 (cardinalità). Diremo che due insiemi 𝐴 e 𝐵 hanno la stessa

cardinalità (oppure sono equipotenti) se esiste una funzione bigettiva 𝑓 : 𝐴 → 𝐵. cardinalità
Scriveremo in tal caso:
#𝐴 = #𝐵.
Se esiste una funzione iniettiva 𝑓 : 𝐴 → 𝐵 significa che 𝐴 ha la stessa cardinalità di un
sottoinsieme di 𝐵 (in quanto 𝑓 : 𝐴 → 𝑓 (𝐴) risulta essere bigettiva). Scriveremo in tal
caso:
#𝐴 ≤ #𝐵.
Intuitivamente se due insiemi hanno la stessa cardinalità significa che hanno lo

stesso numero di elementi. Ma la precedente definizione riesce a catturare tale
concetto senza dover ricorrere al concetto di numero. Questo ha il vantaggio
che questa definizione si applica a qualunque insieme, anche con un numero
“infinito” di elementi.
Si osservi che non abbiamo dato una definizione di #𝐴 e quindi non stiamo
definendo la cardinalità di un insieme ma stiamo soltanto definendo una
relazione tra insiemi che denotiamo, impropriamente, come una uguaglianza:
#𝐴 = #𝐵. E’ ovvio che #𝐴 = #𝐴 in quanto l’identità 𝑓 : 𝐴 → 𝐴, 𝑓 (𝑥) = 𝑥 è
bigettiva. E’ anche chiaro che se #𝐴 = #𝐵 e #𝐵 = #𝐶 allora #𝐴 = #𝐶 in quanto
componendo tra loro due funzioni bigettive si ottiene ancora una funzione
bigettiva.
Il seguente teorema giustifica l’utilizzo del simbolo ≤ nella definizione prece-

dente.
Teorema 1.4 (Cantor-Bernstein). Se #𝐴 ≤ #𝐵 e #𝐵 ≤ #𝐴 allora #𝐴 = #𝐵.
Dimostrazione. Per prima cosa al posto dell’ipotesi #𝐵 ≤ #𝐴 prendiamo l’ipotesi

apparentemente più forte 𝐵 ⊆ 𝐴. Vedremo alla fine che questa ipotesi non ci fa
perdere di generalità.
Essendo per ipotesi #𝐴 ≤ #𝐵 esiste 𝑓 : 𝐴 → 𝐵 iniettiva. Intuitivamente l’idea è

quella di definire l’insieme
𝐷 = (𝐴 \ 𝐵) ∪ 𝑓 (𝐴 \ 𝐵) ∪ 𝑓 2 (𝐴 \ 𝐵) ∪ . . .
10 1 fondamenti
e di definire la biezione 𝜑 : 𝐴 → 𝐵 mandando ogni "buccia" 𝑓 𝑛 (𝐴 \ 𝐵) in

𝑓 𝑛+1 (𝐴 \ 𝐵) e lasciando fisso il resto di 𝐵.
Per farlo in maniera rigorosa consideriamo allora la famiglia di insiemi F =
{𝑋 ⊆ 𝐴 : 𝑋 ⊇ 𝐴 \ 𝐵, 𝑓 (𝑋) ⊆ 𝑋} e definiamo 𝐷 = F. Osserviamo che 𝐴 ∈ F
T
quindi F ≠ ∅.
E’ facile verificare che 𝑓 (𝐷) ⊆ 𝐷 infatti dato 𝑥 ∈ 𝐷 per ogni 𝑋 ∈ F deve essere
𝑥 ∈ 𝑋 ma allora 𝑓 (𝑥) ∈ 𝑋 (per come è definito F), dunque 𝑓 (𝑥) ∈ 𝐷 . In modo
analogo si dimostra che 𝐷 ⊇ 𝐴 \ 𝐵 e dunque concludiamo che 𝐷 ∈ F.
Verifichiamo ora che 𝑓 (𝐷) = 𝐷 ∩ 𝐵. Da un lato se 𝑥 ∈ 𝐷 allora 𝑓 (𝑥) ∈ 𝑓 (𝐷) ⊆ 𝐷

e 𝑓 (𝑥) ⊆ 𝑓 (𝐴) ⊆ 𝐵 da cui 𝑓 (𝑥) ∈ 𝐷 ∩ 𝐵. Dall’altro lato se 𝑦 ∈ 𝐷 ∩ 𝐵 e non fosse
𝑦 ∈ 𝑓 (𝐷) allora potremmo considerare l’insieme 𝑋 = 𝐷 \ {𝑦} e osservare che
𝑋 ∈ F. Infatti in primo luogo 𝑋 ⊇ 𝐴 \ 𝐵 in quanto 𝐷 ha questa proprietà e
𝑦 ∈ 𝐵. Inoltre dato qualunque 𝑥 ∈ 𝑋 visto che 𝑋 ⊆ 𝐷 allora 𝑓 (𝑥) ∈ 𝑓 (𝐷) e, per
ipotesi, 𝑦 ∉ 𝑓 (𝐷) dunque 𝑓 (𝑥) ≠ 𝑦 da cui 𝑓 (𝑥) ∈ 𝑋 . Dunque 𝑋 ∈ F ma allora
dovrebbe essere 𝐷 ⊆ 𝑋 mentre per costruzione abbiamo 𝑦 ∈ 𝐷 ma non in 𝑋 .
Possiamo allora definire 𝜑 : 𝐴 → 𝐵

(
𝑓 (𝑥) se 𝑥 ∈ 𝐷,
𝜑(𝑥) =
𝑥 altrimenti.
Chiaramente 𝜑 è iniettiva in quanto 𝑓 è iniettiva e manda 𝐷 in 𝐷 e l’identità è

iniettiva e manda 𝐴 \ 𝐷 in 𝐴 \ 𝐷 .
Per dimostrare che 𝜑 è suriettiva consideriamo qualunque 𝑦 ∈ 𝐵. Se 𝑦 ∉ 𝐷

allora 𝜑(𝑦) = 𝑦 . Se invece 𝑦 ∈ 𝐷 essendo 𝑦 ∈ 𝐷 ∩ 𝐵 = 𝑓 (𝐷) esisterà 𝑥 ∈ 𝐷 tale
che 𝜑(𝑥) = 𝑓 (𝑥) = 𝑦 .
Abbiamo dimostrato il teorema nel caso 𝐵 ⊆ 𝐴. Nel caso generale sappiamo

che esiste 𝑓 : 𝐴 → 𝐵 iniettiva ed esiste 𝑔 : 𝐵 → 𝐴 iniettiva. Definiamo 𝐵˜ = 𝑔(𝐵)
e definiamo 𝑓˜ : 𝐴 → 𝐵˜ tramite 𝑓˜(𝑥) = 𝑔( 𝑓 (𝑥)). Chiaramente 𝐵˜ ⊆ 𝐴 e 𝑓˜ è
iniettiva. Dunque ci siamo ricondotti alle ipotesi particolari e sappiamo che
esiste 𝜑˜ : 𝐴 → 𝐵˜ bigettiva. Ma allora possiamo definire 𝜑 : 𝐴 → 𝐵 come
𝜑(𝑥) = 𝑔 −1 ( 𝜑(𝑥))
˜ . Essendo 𝜑(𝐴)
˜ = 𝐵˜ ed essendo 𝑔 : 𝐵 → 𝐵˜ bigettiva, risulta
che anche 𝜑 sia bigettiva.
Se #𝐴 ≤ #𝐵 esiste 𝑓 : 𝐴 → 𝐵 iniettiva e possiamo considerare l’insieme

immagine 𝐶 = 𝑓 (𝐴) e osservare che 𝑓 : 𝐴 → 𝐶 risulta essere bigettiva. Dunque
#𝐴 ≤ #𝐵 è equivalente a richiedere che esista 𝐶 ⊆ 𝐵 tale che #𝐴 = #𝐶 . In tal
caso, se 𝐴 non è vuoto, è anche possibile dimostrare che esiste una funzione
𝑔 : 𝐵 → 𝐴 surgettiva, in quanto si può prendere l’inversa di 𝑓 : 𝐴 → 𝐶 ed
estenderla ad un valore fissato qualunque 𝑎 0 ∈ 𝐴 sui punti di 𝐵 \ 𝐶 . Significa
che se #𝐴 ≤ #𝐵 esiste una funzione surgettiva 𝑔 : 𝐵 → 𝐴. Tale funzione 𝑔 ha la
inversa sinistra proprietà che 𝑔( 𝑓 (𝑎)) = 𝑎 per ogni 𝑎 ∈ 𝐴 e si chiama dunque inversa sinistra di
𝑓.
Viceversa se esiste 𝑓 : 𝐴 → 𝐵 surgettiva per ogni 𝑏 ∈ 𝐵 l’insieme 𝑓 −1 ({𝑏}) non è
mai vuoto e quindi è chiaro che debba esistere una funzione 𝑔 : 𝐵 → 𝐴 tale che
𝑔(𝑏) è un elemento di tale insieme e dunque 𝑓 (𝑔(𝑏)) = 𝑏 . In tal caso 𝑔 è una
inversa destra funzione iniettiva che si chiama inversa destra di 𝑓 . Abbiamo quindi dimostrato
1.6 i numeri naturali 11
che se esiste 𝑓 : 𝐴 → 𝐵 surgettiva allora #𝐵 ≤ #𝐴.
Per quanto questo possa sembrare strano il procedimento che ci garantisce di

poter definire la funzione 𝑔 necessita di un apposito assioma.
Assioma 1.5 (della scelta). Siq 𝐹 : 𝐴 → P(𝐵) una funzione tale che 𝑓 (𝑎) ≠ ∅ per
ogni 𝑎 ∈ 𝐴. Allora esiste una funzione 𝑓 : 𝐴 → 𝐵 tale che 𝑓 (𝑎) ∈ 𝐹(𝑎) per ogni
𝑎 ∈ 𝐴.
L’assioma della scelta (denotato spesso con 𝐴𝐶 , axiom of choice) è un assioma 𝐴𝐶

per certi versi controverso e alcuni matematici preferiscono non utilizzarlo nelle
loro dimostrazioni. La teoria degli insiemi senza l’assioma della scelta si chiama
𝑍𝐹 (Zermelo-Fraenkel) mentre se si aggiunge l’assioma della scelta (choice) la 𝑍𝐹
teoria si chiama 𝑍𝐹𝐶 .
𝑍𝐹𝐶
1.6 i numeri naturali

Giuseppe Peano (1858–1932), matemati-
co torinese, contribuì a porre i fondamen-
Definizione 1.6 (assiomi di Peano). Un insieme ℕ dotato di una funzione 𝜎 : ℕ → ℕ
ti della logica matematica. La notazione
e di un elemento 0 ∈ ℕ che soddisfano le seguenti proprietà si dice essere un insieme di ∃ per il quantificatore universale si deve
numeri naturali se valgono le seguenti proprietà: a lui.
1. 𝜎 è iniettiva: se 𝜎(𝑚) = 𝜎(𝑛) allora 𝑚 = 𝑛 ; numeri naturali
2. per ogni 𝑛 ∈ ℕ si ha 𝜎(𝑛) ≠ 0;

3. induttività: se 𝐴 ⊆ ℕ è un sottoinsieme tale che
i) 0 ∈ 𝐴;
ii) 𝑛 ∈ 𝐴 =⇒ 𝜎(𝑛) ∈ 𝐴
allora 𝐴 = ℕ .
La definizione originale di Peano pren-
deva 1 come primo numero naturale ma
Dato 𝑛 ∈ ℕ il numero 𝜎(𝑛) si chiama il successore di 𝑛 . Il numero 0 ∈ ℕ che
nella matematica moderna risulta più
per assioma non è il successore di nessun’altro numero naturale si chiama zero. comodo includere anche 0 tra i numeri
Possiamo anche dare un nome ai primi nove numeri naturali: naturali, così come si considera il vuoto
come un insieme valido.
1 = 𝜎(0), 2 = 𝜎(1), 3 = 𝜎(2), 4 = 𝜎(3), 5 = 𝜎(4), successore
6 = 𝜎(5), 7 = 𝜎(6), 8 = 𝜎(7), 9 = 𝜎(8) zero
cosicché intuiamo come la funzione 𝜎 rappresenti l’usuale operazione del

contare:
𝜎 𝜎 𝜎 𝜎 𝜎 𝜎 𝜎
0 ↦→ 1 ↦→ 2 ↦→ 3 ↦→ 4 ↦→ 5 ↦→ 6 ↦→ . . .
Il primi due assiomi servono a garantire che in questo processo del contare contare
troviamo sempre numeri diversi (non si torna mai indietro) in quanto nessun
numero può avere come successore 0 o un numero già incontrato in precedenza
(che se non è zero è il successore di un altro numero).
L’ultimo assioma serve a garantire che questo processo del contare esaurisce
tutti i numeri naturali, e che quindi non ci sono dei naturali irraggiungibili
partendo da zero.
Normalmente la proprietà induttiva dei numeri naturali viene utilizzata tramite Il principio di induzione non è un teore-
ma della teoria degli insiemi in quanto
il seguente meta-teorema. si riferisce il concetto di predicato che è
esterno al sistema stesso.
12 1 fondamenti
Teorema 1.7 (principio di induzione). Sia 𝑃(𝑛) un predicato. Se
1. vale 𝑃(0) e
2. ∀𝑛 ∈ ℕ : 𝑃(𝑛) =⇒ 𝑃(𝑛 + 1)
allora 𝑃(𝑛) è vero per ogni 𝑛 ∈ ℕ .
Dimostrazione. Consideriamo l’insieme 𝐴 = {𝑛 ∈ ℕ : 𝑃(𝑛)}. Grazie alle ipotesi

del teorema possiamo applicare la proprietà induttiva dei numeri naturali per
dedurre che 𝐴 = ℕ . Dunque 𝑃(𝑛) è soddisfatta per ogni 𝑛 ∈ ℕ .
Il fatto che 𝜎 : ℕ → ℕ sia iniettiva ma non suriettiva significa che ℕ può essere
messo in corrispondenza biunivoca con 𝜎(ℕ ) che è un sottoinsieme proprio di ℕ .
In particolare #ℕ = #(ℕ \ {0}). Questa proprietà è per certi versi paradossale
ed identifica gli insiemi infiniti, nel senso di Dedekind:
insieme finito
Definizione 1.8 (Dedekind infinito). Diremo che un insieme 𝑋 è finito (più

insieme infinito precisamente: Dedekind-finito) se ogni funzione iniettiva 𝑓 : 𝑋 → 𝑋 è bigettiva.
Diremo che un insieme 𝑋 è infinito (più precisamente Dedekind-infinito) se non è finito

ovvero se se esiste 𝑓 : 𝑋 → 𝑋 iniettiva ma non suriettiva.
Un sottoinsieme 𝐴 di un insieme di 𝑋 si
chiama anche parte. Se 𝐴 ⊆ 𝑋 , 𝐴 ≠ 𝑋 si
dice che 𝐴 è una parte propria di 𝑋 . In particolare un insieme infinito può essere messo in corrispondenza biunivoca
L’insieme ℕ dei numeri naturali è il più con una sua parte propria in quanto 𝑓 : 𝑋 → 𝑓 (𝑋) è bigettiva e 𝑋 \ 𝑓 (𝑋) ≠ ∅.
piccolo insieme infinito
induttivo
Se 𝑋 è un qualunque insieme infinito, dentro 𝑋 possiamo costruire un insieme
che soddisfa gli assiomi di Peano. Infatti fissata 𝑓 : 𝑋 → 𝑋 iniettiva ma non
suriettiva basta scegliere 0 ∈ 𝑋 \ 𝑓 (𝑋). Dopodiché diciamo che un sottoinsieme
𝐼 ⊆ 𝑋 è induttivo se 0 ∈ 𝐼 e se 𝑛 ∈ 𝐼 =⇒ 𝑓 (𝑛) ∈ 𝐼 . Possiamo quindi definire:
\
ℕ= 𝐼
𝐼 ⊆ 𝑋 induttivo
e osservare che ovviamente ℕ stesso è un sottoinsieme induttivo di 𝑋 . Dunque

se 𝑛 ∈ ℕ si ha 𝑓 (𝑛) ∈ ℕ e quindi la restrizione di 𝑓 a ℕ è una funzione 𝜎 : ℕ → ℕ
che è certamente iniettiva (in quanto restrizione di una funzione iniettiva) non è
suriettiva (in quanto 0 non è nell’immagine di 𝑓 e tantomeno nell’immagine di
𝜎) e soddisfa la proprietà induttiva perche se prendiamo 𝐴 ⊆ ℕ tale che 0 ∈ 𝐴
e 𝑛 ∈ 𝐴 =⇒ 𝜎(𝑛) ∈ 𝐴 allora significa che 𝐴 è induttivo e quindi, per come è
definito ℕ , deve essere ℕ ⊆ 𝐴. Dunque 𝐴 = ℕ .
Per garantire l’esistenza dell’insieme dei numeri naturali basta quindi supporre
che esista almeno un insieme infinito. Sarà opportuno prendere questo come
assioma perché se esaminiamo gli assiomi che abbiamo introdotto finora ci
accorgiamo che l’insieme vuoto e tutti gli insiemi che possono essere costruiti a
partire da esso sono tutti finiti.
Assioma 1.9 (infinito). Esiste un insieme infinito. E non è restrittivo supporre che
tale insieme sia un insieme ℕ che soddisfa gli assiomi di Peano.
Teorema 1.10 (definizione per induzione). Sia 𝑋 un insieme, sia 𝛼 ∈ 𝑋 e sia

𝑔 : 𝑋 → 𝑋 una funzione. Allora esiste una unica funzione 𝑓 : ℕ → 𝑋 tale che
(
𝑓 (0) = 𝛼,
(1.4)
𝑓 (𝜎(𝑛)) = 𝑔( 𝑓 (𝑛)).
Si avrà dunque
𝑓 (0) = 𝛼, 𝑓 (1) = 𝑔(𝛼), 𝑓 (2) = 𝑔(𝑔(𝛼)), 𝑓 (3) = 𝑔(𝑔(𝑔(𝛼))) . . .
Più in generale se abbiamo 𝛼 ∈ 𝑋 e una funzione 𝑔 : ℕ × 𝑋 → 𝑋 esisterà una unica

funzione 𝑓 : ℕ → 𝑋 tale che
(
𝑓 (0) = 𝛼,
(1.5)
𝑓 (𝜎(𝑛)) = 𝑔(𝑛, 𝑓 (𝑛)).
Dimostrazione. Dobbiamo ricordarci che le funzioni 𝑓 : ℕ → 𝑋 non sono altro

che relazioni e cioè sottoinsiemi del prodotto ℕ × 𝑋 . L’idea è quindi di prendere
il più piccolo sottoinsieme di ℕ × 𝑋 che possa rappresentare una funzione con
le proprietà richieste. Consideriamo dunque la famiglia di insiemi:
F = {𝐹 ∈ P(ℕ × 𝑋) : (0, 𝛼) ∈ 𝐹, (𝑛, 𝑥) ∈ 𝐹 ⇒ (𝜎(𝑛), 𝑔(𝑥)) ∈ 𝐹}.
Chiaramente F non è vuota in quanto ℕ × 𝑋 ∈ F. Possiamo dunque farne

l’intersezione e definire un insieme 𝑓 :
\
𝑓 = 𝐹.
𝐹∈F
L’insieme 𝑓 che abbiamo definito rappresenta una relazione tra ℕ e 𝑋 . Visto

che (0 , 𝛼) ∈ 𝐹 per ogni 𝐹 ∈ F dovrà essere (0 , 𝛼) ∈ 𝑓 . Inoltre se (𝑛, 𝑥) ∈ 𝑓
allora (𝑛, 𝑥) ∈ 𝐹 per ogni 𝐹 ∈ F e quindi (𝜎(𝑛), 𝑔(𝑥)) ∈ 𝐹 per ogni 𝐹 ∈ F da cui
(𝜎(𝑛), 𝑔(𝑥)) ∈ 𝑓 . Significa che 𝑓 ∈ F.
Vogliamo ora dimostrare che 𝑓 è una funzione, cioè che è univocamente definita
su tutto ℕ . Per prima cosa consideriamo l’insieme su cui 𝑓 è definita e cioè
𝐴 = {𝑛 ∈ ℕ : ∃𝑥 ∈ 𝑋 : (𝑛, 𝑥) ∈ 𝑓 } e dimostriamo, per induzione, che 𝐴 = ℕ . In
effetti (0 , 𝛼) ∈ 𝑓 quindi 0 ∈ 𝐴. E se 𝑛 ∈ 𝐴 sappiamo che esiste 𝑥 ∈ 𝑋 tale che
(𝑛, 𝑥) ∈ 𝑓 e dunque, essendo 𝑓 ∈ F, anche (𝜎(𝑛), 𝑔(𝑥)) ∈ 𝑓 da cui 𝜎(𝑛) ∈ 𝐴.
Abbiamo dimostrato che 𝑓 è definita su tutto ℕ .
Dimostriamo ora che 𝑓 è univoca. Consideriamo l’insieme su cui 𝑓 è uni-

vocamente definita: 𝐵 = {𝑛 ∈ ℕ : ∃! 𝑥 ∈ 𝑋 : (𝑛, 𝑥) ∈ 𝑓 }. Di nuovo vogliamo
dimostrare per induzione che 𝐵 = ℕ . Per dimostrare che 0 ∈ 𝐵, visto che già
sappiamo che (0 , 𝛼) ∈ 𝑓 , dobbiamo dimostrare che se 𝑥 ≠ 𝛼 si ha (0 , 𝑥) ∉ 𝑓 . Sia
dunque 𝑥 ≠ 𝛼 e consideriamo l’insieme 𝐹 = 𝑓 \ {(0 , 𝑥)}. Chiaramente 𝐹 ∈ F
in quanto (0 , 𝛼) ∈ 𝐹 visto che (0 , 𝛼) ∈ 𝑓 e (0 , 𝛼) ≠ (0 , 𝑥) inoltre se (𝑛, 𝑦) ∈ 𝐹
allora (𝑛, 𝑦) ∈ 𝑓 e quindi (𝜎(𝑛), 𝑔(𝑦)) ∈ 𝑓 . Ma certamente (𝜎(𝑛), 𝑔(𝑦)) ≠ (0 , 𝑥)
in quanto 𝜎(𝑛) ≠ 0 dunque (𝜎(𝑛), 𝑔(𝑦)) ∈ 𝐹 . Visto che 𝐹 ∈ F si deve avere
𝑓 ⊆ 𝐹 e dunque (0 , 𝑥) ∉ 𝑓 . Dunque 𝑓 è univocamente definita in 0.
14 1 fondamenti
Dobbiamo ora mostrare che se 𝑛 ∈ 𝐵 anche 𝜎(𝑛) ∈ 𝐵. Se 𝑛 ∈ 𝐵 significa che c’è

un unico 𝑥 ∈ 𝑋 tale che (𝑛, 𝑥) ∈ 𝑓 e certamente anche (𝜎(𝑛), 𝑔(𝑥)) ∈ 𝑓 . Pren-
diamo allora 𝑦 ≠ 𝑔(𝑥), vorremo dimostrare che (𝜎(𝑛), 𝑦) ∉ 𝑓 . Consideriamo,
similmente a prima, l’insieme 𝐹 = 𝑓 \ {(𝜎(𝑛), 𝑦)} e cerchiamo di dimostra-
re che 𝐹 ∈ F. Chiaramente (0 , 𝛼) ∈ 𝐹 perché (0 , 𝛼) ∈ 𝑓 e non può essere
(0 , 𝛼) = (𝜎(𝑛), 𝑦) in quanto 𝜎(𝑛) ≠ 0. Se ora supponiamo che sia (𝑚, 𝑧) ∈ 𝐹
certamente sarà (𝑚, 𝑧) ∈ 𝑓 e dunque (𝜎(𝑚), 𝑔(𝑧)) ∈ 𝑓 : dobbiamo mostrare
che (𝜎(𝑚), 𝑔(𝑧)) ∈ 𝐹 . D’altra parte se fosse (𝜎(𝑚), 𝑔(𝑧)) = (𝜎(𝑛), 𝑦) dovrebbe
essere 𝑚 = 𝑛 in quanto 𝜎 è iniettiva. Ma visto che 𝑓 è univocamente definita su
𝑛 dovrà allora essere anche (𝑛, 𝑧) = (𝑛, 𝑥) e quindi 𝑔(𝑧) = 𝑔(𝑥) ≠ 𝑦 . Dunque
(𝜎(𝑚), 𝑔(𝑧)) ∈ 𝐹 e 𝐹 ∈ F. Ma allora 𝑓 ⊆ 𝐹 e quindi (𝜎(𝑛), 𝑦) ∉ 𝑓 . Significa
che 𝑓 è univocamente definita anche in 𝜎(𝑛). Per induzione 𝐵 = ℕ ed 𝑓 è una
funzione 𝑓 : ℕ → 𝑋 .
Ovviamente visto che 𝑓 ∈ F sappiamo che 𝑓 soddisfa le proprietà richieste dal

teorema.
Nella seconda parte del teorema, dove 𝑔 : ℕ ×𝑋 → 𝑋 , possiamo considerare l’in-

sieme 𝑌 = ℕ × 𝑋 e la funzione 𝐺 : 𝑌 → 𝑌 definita da 𝐺(𝑛, 𝑥) = (𝜎(𝑛), 𝑔(𝑛, 𝑥)).
Allora applicando la prima parte possiamo trovare 𝐹 : ℕ → 𝑌 tale che 𝐹(0) =
(0 , 𝛼) e 𝐹(𝜎(𝑛)) = 𝐺(𝐹(𝑛)). Basterà prendere come 𝑓 (𝑛) la seconda componente
di 𝐺(𝑛).
Per induzione possiamo definire la somma tra numeri naturali:

(
𝑛 + 0 = 𝑛,
𝑛 + 𝜎(𝑚) = 𝜎(𝑛 + 𝑚).
Osservando che 𝑛 + 1 = 𝑛 + 𝜎(0) = 𝜎(𝑛 + 0) = 𝜎(𝑛) potremo d’ora in poi scrivere

𝑛 + 1 al posto di 𝜎(𝑛) ed abbandonare la funzione 𝜎. Abbiamo quindi definito
l’addizione in modo che valga 𝑛 + 0 = 𝑛 e 𝑛 + (𝑚 + 1) = (𝑛 + 𝑚) + 1. Possiamo
da questo dedurre le altre proprietà della somma.
Teorema 1.11. L’addizione su ℕ soddisfa le seguenti
1. proprietà associativa: (𝑛 + 𝑚) + 𝑘 = 𝑛 + (𝑚 + 𝑘),

2. elemento neutro: 𝑛 + 0 = 0 + 𝑛 = 𝑛 ,
3. proprietà commutativa: 𝑛 + 𝑚 = 𝑚 + 𝑛 ,
4. proprietà invariantiva: se 𝑚 + 𝑘 = 𝑛 + 𝑘 allora 𝑚 = 𝑛 .
Dimostrazione. Per la proprietà associativa facciamo la dimostrazione per indu-

zione su 𝑘 . Se 𝑘 = 0 è chiaro che (𝑛 + 𝑚) + 0 = 𝑛 + 𝑚 = 𝑛 + (𝑚 + 0). Supponendo
ora di sapere che vale (𝑛 + 𝑚) + 𝑘 = 𝑛 + (𝑚 + 𝑘) cerchiamo di dimostrare che
(𝑛 + 𝑚) + (𝑘 + 1) = 𝑛 + (𝑚 + (𝑘 + 1)). Ricordando la definizione induttiva di
addizione e usando l’ipotesi induttiva si ha
(𝑛 + 𝑚) + (𝑘 + 1) = ((𝑛 + 𝑚) + 𝑘) + 1 = (𝑛 + (𝑚 + 𝑘)) + 1
= 𝑛 + ((𝑚 + 𝑘) + 1) = 𝑛 + (𝑚 + (𝑘 + 1))
come volevamo dimostrare.

Per quanto riguarda l’elemento neutro sappiamo per definizione che 𝑛 + 0 = 𝑛 .

Dimostriamo per induzione che vale anche 0 + 𝑛 = 𝑛 . Per 𝑛 = 0 si riconduce al
primo caso. Supponendo per induzione che valga 0 + 𝑛 = 𝑛 possiamo osservare
che per la definizione di addizione si ha:
0 + (𝑛 + 1) = (0 + 𝑛) + 1 = 𝑛 + 1

Consideriamo la proprietà commutativa. Dobbiamo innanzitutto dimostrare
che 𝑛 + 1 = 1 + 𝑛 . Lo facciamo per induzione: se 𝑛 = 0 si applica la proprietà
dell’elemento neutro. Se, per induzione, supponiamo che valga 𝑛 + 1 = 1 + 𝑛
allora si ha
(𝑛 + 1) + 1 = (1 + 𝑛) + 1 = 1 + (𝑛 + 1)
che è quanto dovevamo dimostrare. Possiamo ora dimostrare per induzione su
𝑚 che per ogni 𝑛 vale 𝑛 + 𝑚 = 𝑚 + 𝑛 . Il caso 𝑚 = 0 si riconduce alla proprietà
dell’elemento neutro: 𝑛 + 0 = 𝑛 = 0 + 𝑛 . Se ora per induzione supponiamo
che valga 𝑛 + 𝑚 = 𝑚 + 𝑛 possiamo utilizzare il caso precedente e la proprietà
associativa per ottenere:
𝑛+𝑚+1= 𝑚+𝑛+1= 𝑚+1+𝑛
che è quanto dovevamo dimostrare.

Dimostriamo la proprietà invariantiva per induzione su 𝑘 . Se 𝑘 = 0 è ovvio
che da 𝑚 + 𝑘 = 𝑛 + 𝑘 si possa dedurre 𝑚 = 𝑛 visto che 𝑚 + 0 = 𝑚 e 𝑛 + 0 = 𝑛 .
Supponiamo allora che la proprietà sia valida per un certo 𝑘 e dimostriamola
per 𝑘 + 1. Dunque se vale 𝑚 + 𝑘 + 1 = 𝑛 + 𝑘 + 1 si ha (𝑚 + 1) + 𝑘 = (𝑛 + 1) + 𝑘 e
quindi, per ipotesi induttiva, 𝑚 + 1 = 𝑛 + 1. Scritto in altri termini 𝜎(𝑚) = 𝜎(𝑛)
da cui, grazie al fatto che 𝜎 è iniettiva, si deduce 𝑚 = 𝑛 .
Possiamo ora definire una relazione ≤ su ℕ ponendo
𝑚 ≤ 𝑛 ⇐⇒ ∃𝑘 ∈ ℕ : 𝑛 = 𝑚 + 𝑘.
Se 𝑚 ≤ 𝑛 cioè se esiste 𝑘 ∈ ℕ tale che 𝑛 = 𝑚 + 𝑘 tale numero 𝑘 è unico in quanto

se fosse 𝑚 + 𝑗 = 𝑛 = 𝑚 + 𝑘 potremmo dedurre 𝑘 = 𝑗 dalla proprietà invariantiva
della addizione. Possiamo dunque definire la differenza: 𝑘 = 𝑛 − 𝑚 . differenza
Vogliamo dimostrare che la relazione ≤ appena introdotta soddisfa le seguenti
proprietà.
Definizione 1.12 (relazione d’ordine). Una relazione ≤ su un insieme 𝑋 viene detta

relazione d’ordine se soddisfa le seguenti proprietà (per ogni 𝑥, 𝑦, 𝑧 ∈ 𝑋 ): relazione d’ordine
1. riflessiva: 𝑥 ≤ 𝑥 ;
2. antisimmetrica: 𝑥 ≤ 𝑦 ∧ 𝑦 ≤ 𝑥 =⇒ 𝑥 = 𝑦 ;
3. transitiva: 𝑥 ≤ 𝑦 ∧ 𝑦 ≤ 𝑧 =⇒ 𝑥 ≤ 𝑧 .
Si dice inoltre che la relazione d’ordine ≤ è una relazione d’ordine totale (o lineare) relazione d’ordine totale
se vale
4. dicotomia: 𝑥 ≤ 𝑦 ∨ 𝑦 ≤ 𝑥 .
16 1 fondamenti
Se ≤ è una relazione d’ordine su 𝑋 si definisce la relazione inversa ≥ ponendo

𝑥 ≥ 𝑦 quando 𝑦 ≤ 𝑥 . La proprietà riflessiva identifica gli ordinamenti larghi.
Si definisce il corrispondente ordinamento stretto < ponendo 𝑥 < 𝑦 quando
𝑥 ≤ 𝑦 ∧ 𝑥 ≠ 𝑦 e la relazione inversa > ponendo 𝑥 > 𝑦 quando 𝑦 < 𝑥 .
Teorema 1.13. La relazione ≤ è una relazione d’ordine totale su ℕ .
Dimostrazione. Il fatto che 𝑥 + 0 = 𝑥 dimostra la proprietà riflessiva.
Per la proprietà transitiva è sufficiente osservare che se 𝑦 = 𝑥 + 𝑘 e 𝑧 = 𝑦 + 𝑗

allora 𝑧 = 𝑥 + 𝑘 + 𝑗 .
Per la proprietà antisimmetrica supponiamo di avere 𝑥 = 𝑦 + 𝑘 e 𝑦 = 𝑥 + 𝑗 .

Deduciamo che 𝑥 + 𝑘 + 𝑗 = 𝑦 + 𝑘 + 𝑗 da cui 𝑥 = 𝑦 per la proprietà invariantiva
dell’addizione.
Per mostrare che l’ordinamento è totale dobbiamo invece procedere con una
dimostrazione per induzione. Per induzione su 𝑥 ∈ ℕ vogliamo mostrare che
per ogni 𝑦 ∈ ℕ si ha 𝑥 ≤ 𝑦 oppure 𝑦 ≤ 𝑥 . Se 𝑥 = 0 il fatto è ovvio in quanto
𝑦 = 𝑦 + 0 e quindi 𝑦 ≥ 0 per ogni 𝑦 ∈ ℕ . Supponiamo ora di sapere che 𝑥 ≤ 𝑦
oppure 𝑦 ≤ 𝑥 . Se 𝑦 ≤ 𝑥 significa che 𝑥 = 𝑦 + 𝑘 per un qualche 𝑘 ∈ ℕ . Ma
allora 𝑥 + 1 = 𝑦 + 𝑘 + 1 e quindi vale anche 𝑦 ≤ 𝑥 + 1. Se invece 𝑥 ≤ 𝑦 significa
che esiste 𝑘 ∈ ℕ per cui 𝑦 = 𝑥 + 𝑘 . Se 𝑘 ≠ 0 allora 𝑘 = 1 + 𝑗 con 𝑗 ∈ ℕ da
cui 𝑦 = 𝑥 + 1 + 𝑗 e dunque anche 𝑥 + 1 ≤ 𝑦 . Se 𝑘 = 0 allora 𝑥 = 𝑦 e dunque
𝑥 + 1 = 𝑦 + 1 che ci porta alla disuguaglianza inversa 𝑥 + 1 ≥ 𝑦 . In ogni caso il
passo induttivo è dimostrato.
Definizione 1.14 (maggiorante, minorante, massimo, minimo). Sia ≤ una

relazione d’ordine su un insieme 𝑋 e siano 𝑎 ∈ 𝑋 e 𝐴 ⊆ 𝑋 .
minorante
Diremo che 𝑎 è un minorante di 𝐴 e scriveremo:
𝑎≤𝐴
minimo se per ogni 𝑥 ∈ 𝐴 risulta 𝑎 ≤ 𝑥 . Se 𝑎 è un minorante e inoltre 𝑎 ∈ 𝐴 diremo che 𝑎 è il

minimo di 𝐴 e scriveremo:
𝑎 = min 𝐴.
maggiorante
Analogamente diremo che 𝑎 è un maggiorante di 𝐴 e scriveremo 𝑎 ≥ 𝐴 se 𝑎 ≤ 𝑥 per
massimo ogni 𝑥 ∈ 𝐴 e diremo che 𝑎 è il massimo di 𝐴 e scriveremo 𝑎 = max 𝐴 se 𝑎 ≥ 𝐴 e
𝑎 ∈ 𝐴.
Massimo e minimo di un insieme 𝐴, se esistono, sono unici. Infatti se 𝑥

e 𝑦 fossero due minimi di 𝐴 si avrebbe 𝑥 ≤ 𝑦 in quanto 𝑥 ≤ 𝐴 e 𝑦 ∈ 𝐴.
Analogamente si avrebbe 𝑦 ≤ 𝑥 e quindi 𝑥 = 𝑦 . Ragionamento analogo se 𝑥 e 𝑦
fossero due massimi.
Se 𝐴 è un insieme finito il massimo e il minimo esistono sempre.
Teorema 1.15 (principio del buon ordinamento). Sia 𝐴 ⊆ ℕ , 𝐴 ≠ ∅. Allora 𝐴 ha

minimo.
Dimostrazione. Osserviamo che se 𝑛 ∈ ℕ è un minorante di 𝐴 ⊆ ℕ allora o

𝑛 ∈ 𝐴 e quindi 𝑛 è il minimo di 𝐴 oppure anche 𝑛 + 1 è un minorante di 𝐴 in
quanto non ci sono numeri interi compresi tra 𝑛 e 𝑛 + 1.
Dunque se 𝐴 non avesse minimo, per il principio di induzione ogni 𝑛 ∈ ℕ

sarebbe un minorante di 𝐴. In tal caso 𝐴 dovrebbe essere vuoto perché se 𝑎 ∈ 𝐴
certamente 𝑎 + 1 non è un minorante di 𝐴.
Vogliamo ora dimostrare che l’insieme dei numeri naturali è sostanzialmente

unico nel senso che se ci sono due insiemi che soddisfano gli assiomi di Peano
allora è possibile mettere in corrispondenza gli elementi dei due insiemi in
modo che lo zero vada in zero e numeri corrispondenti abbiano successori
corrispondenti.
Teorema 1.16 (unicità dei numeri naturali). Se ℕ e ℕ0 sono due insiemi che
soddisfano gli assiomi di Peano con zero 0 ∈ ℕ e 00 ∈ ℕ0 e funzioni successore 𝜎 su
ℕ e 𝜎0 su ℕ0 allora esiste una funzione bigettiva 𝑓 : ℕ → ℕ0 tale che 𝑓 (0) = 00 e
𝑓 (𝜎(𝑛)) = 𝜎0( 𝑓 (𝑛)).
Dimostrazione. Possiamo definire 𝑓 per induzione:

(
𝑓 (0) = 00
𝑓 (𝜎(𝑛)) = 𝜎0( 𝑓 (𝑛))
così rimane solo da dimostrare che 𝑓 è una bigezione.
Per dimostrare che 𝑓 è iniettiva consideriamo l’insieme
𝐴 = {𝑎 ∈ ℕ : ∃𝑏 ∈ ℕ , 𝑏 ≠ 𝑎, 𝑓 (𝑎) = 𝑓 (𝑏)}.
Se tale insieme è vuoto allora 𝑓 è effettivamente iniettiva. Supponiamo allora

per assurdo che 𝐴 sia vuoto. In tal caso possiamo considerare il minimo
𝑎 = min 𝐴 (grazie al teorema 1.15). Dovrà quindi esistere 𝑏 ∈ ℕ tale che 𝑏 ≠ 𝑎 e
𝑓 (𝑏) = 𝑓 (𝑎). Ovviamente anche 𝑏 ∈ 𝐴 e quindi dovrà essere 𝑏 > 𝑎 in quanto
𝑎 è il minimo. Dunque 𝑏 > 0 e 𝑓 (𝑏) = 𝑓 (𝜎(𝑏 − 1)) = 𝜎0( 𝑓 (𝑏 − 1)). Se 𝑎 = 0
abbiamo 𝑓 (𝑎) = 00 e quindi da 𝑓 (𝑎) = 𝑓 (𝑏) otteniamo che 00 è nell’immagine
di 𝜎0 che è contrario agli assiomi di Peano. Se invece 𝑎 > 0 si avrà, come per 𝑏 ,
𝑓 (𝑎) = 𝜎0( 𝑓 (𝑎 − 1)) e dunque 𝜎0( 𝑓 (𝑎 − 1)) = 𝜎0( 𝑓 (𝑏 − 1)). Per l’iniettività di 𝜎0
si deduce 𝑓 (𝑎 − 1) = 𝑓 (𝑏 − 1) da cui 𝑎 − 1 ∈ 𝐴. Ma questo è assurdo in quanto 𝑎
era il minimo di 𝐴.
Per dimostrare che 𝑓 è surgettiva consideriamo l’immagine 𝐵0 = 𝑓 (ℕ ) e usiamo

il principio di induzione su ℕ0 per dimostrare che 𝐵0 = ℕ0. Per prima cosa
00 ∈ 𝐵0 in quanto 00 = 𝑓 (0). Se poi 𝑛 0 ∈ 𝐵0 allora esiste 𝑛 ∈ ℕ tale che 𝑓 (𝑛) = 𝑛 0.
Ma allora 𝑓 (𝜎(𝑛)) = 𝜎0( 𝑓 (𝑛)) = 𝜎0(𝑛 0) e dunque anche 𝜎0(𝑛 0) ∈ 𝐵.
Vogliamo ora dimostrare che i numeri naturali possono essere utilizzati per
contare gli elementi degli insiemi finiti.
18 1 fondamenti
Definizione 1.17 (numero di elementi). Se 𝑛 ∈ ℕ denotiamo con
[𝑛] = {0 , 1 , . . . , 𝑛 − 1}
l’insieme dei primi 𝑛 numeri naturali. Questo è il prototipo di insieme con 𝑛 elementi.
Allora formalmente andremo a identificare #[𝑛] con 𝑛 e dunque scriveremo
#𝐴 = 𝑛, #𝐴 ≥ 𝑛, #𝐴 ≤ 𝑛
per significare rispettivamente
#𝐴 = #[𝑛], #𝐴 ≥ #[𝑛], #𝐴 ≤ #[𝑛].
Il simbolo ℵ è la prima lettera dell’alfa- La cardinalità di ℕ viene a volte indicata con il simbolo ℵ0 dunque potremo scrivere
beto ebraico e si legge aleph.
Nel seguente teorema dimostriamo che
ℵ0 è la più piccola cardinalità infinita. #𝐴 = ℵ0 , #𝐴 ≤ ℵ0 , #𝐴 ≥ ℵ0
Si potrebbe anche dimostrare che deve
esistere una cardinalità ℵ1 > ℵ0 che è per significare rispettivamente
la più piccola cardinalità maggiore di
ℵ0 . Sappiamo che #P(ℕ ) > #ℕ ma pur- # 𝐴 = #ℕ , # 𝐴 ≤ #ℕ , # 𝐴 ≥ #ℕ .
troppo non è possibile dimostrare che
#ℵ1 = #P(ℕ ) (questa si chiama ipotesi del
continuo in quanto vedremo nel teore-
ma 3.24 che #P(ℕ ) = #ℝ e l’insieme ℝ Lemma 1.18. Per ogni 𝑛 ∈ ℕ l’insieme [𝑛] = {0 , 1 , 2 , . . . , 𝑛 − 1} è finito.
viene chiamato continuo là dove ℕ viene
chiamato discreto). Dunque l’ipotesi del
continuo è un ulteriore assioma che po- Dimostrazione. Lo possiamo dimostrare per induzione su 𝑛 ∈ ℕ . Per 𝑛 = 0 si
trebbe essere aggiunto agli assiomi della ha [𝑛] = ∅ ed è ovvio che ogni funzione 𝑓 : ∅ → ∅ è bigettiva. Dunque [0] = ∅ è
teoria degli insiemi: non esistono insiemi
con cardinalità strettamente compresa
finito.
tra le cardinalità di ℕ e di P(ℕ ).
Supponiamo allora che [𝑛] sia finito e supponiamo per assurdo che [𝑛 + 1]
sia infinito. Allora esiste 𝑓 : [𝑛 + 1] → [𝑛 + 1] iniettiva ma non surgettiva.
Se componiamo 𝑓 con la funzione 𝑠 che scambia 𝑛 con 𝑓 (𝑛) otteniamo una
funzione 𝑔 = 𝑠 ◦ 𝑓 tale che 𝑔(𝑛) = 𝑛 . Se 𝑓 era iniettiva ma non surgettiva anche
𝑔 mantiene le due proprietà. Inoltre 𝑔 può essere ristretta a [𝑛] (in quanto
𝑔(𝑘) = 𝑛 solo per 𝑘 = 𝑛 visto che 𝑔 è iniettiva): 𝑔 : [𝑛] → [𝑛] e anche la funzione
ristretta risulterebbe essere iniettiva e suriettiva. Ma questo è assurdo perché
per ipotesi induttiva [𝑛] è finito.
Teorema 1.19 (caratterizzazione insiemi finiti). Un insieme 𝐴 è infinito (nel senso

di Dedekind, definizione 1.8) se e solo se #𝐴 ≥ ℵ0 . Viceversa 𝐴 è finito se e solo se
esiste 𝑛 ∈ ℕ tale che #𝐴 = 𝑛 .
Dimostrazione. Se #𝐴 ≥ ℵ0 significa che esiste una funzione iniettiva 𝑓 : ℕ → 𝐴.

Dunque se definiamo 𝜎 : 𝐴 → 𝐴 come
(
𝑎 se 𝑎 ∉ 𝑓 (ℕ )
𝜎(𝑎) =
𝑓 (𝑛 + 1) se 𝑎 = 𝑓 (𝑛)
otteniamo una funzione iniettiva ma non suriettiva (in quanto 𝜎(𝐴) = 𝐴\{ 𝑓 (0)}).
Dunque se #𝐴 ≥ ℵ0 deduciamo che 𝐴 è infinito.
1.7 insiemi prodotto 19
Viceversa se 𝐴 è infinito significa che esiste 𝜎 : 𝐴 → 𝐴 iniettiva ma non suriettiva.

Preso 𝛼 ∈ 𝐴 \ 𝜎(𝐴) possiamo definire induttivamente 𝑓 : ℕ → 𝐴 come segue:
(
𝑓 (0) = 𝛼
𝑓 (𝑛 + 1) = 𝜎( 𝑓 (𝑛))
e possiamo verificare che 𝑓 è iniettiva. Infatti supponiamo che sia 𝑓 (𝑛) = 𝑓 (𝑚).
Se 𝑓 (𝑛) = 𝑓 (𝑚) = 𝛼 allora necessariamente 𝑛 = 𝑚 = 0 perché 𝑓 (𝑛) = 𝛼 è
equivalente a 𝑛 = 0 visto che 𝜎 non assume mai il valore 𝛼 . Se 𝑓 (𝑛) = 𝑓 (𝑚) ≠ 𝛼
significa dunque che 𝑛 > 0 e 𝑚 > 0 ma allora 𝑓 (𝑛) = 𝜎( 𝑓 (𝑛 − 1)) e 𝑓 (𝑚) =
𝜎( 𝑓 (𝑚 − 1)) e dunque, essendo 𝜎 iniettiva, 𝑛 − 1 = 𝑚 − 1 da cui 𝑛 = 𝑚 . Dunque
se 𝐴 è infinito si ha #ℕ ≤ #𝐴 (significa in un certo senso che ℕ è il più piccolo
insieme infinito).
Dobbiamo ora caratterizzare gli insiemi finiti. Abbiamo già verificato che se
#𝐴 ≥ ℵ0 allora #𝐴 è infinito, dunque se #𝐴 è finito non può essere #𝐴 ≥ ℵ0 . Ma
Per dimostrare che ogni cardinalità può
da questo non siamo in grado di dedurre che #𝐴 < ℵ0 (vedi nota a margine).
essere confrontata con ogni altra bisogna
dimostrare che ogni insieme ammette un
Se #𝐴 = 𝑛 significa che #𝐴 = #[𝑛] e grazie al lemma 1.18 sappiamo che [𝑛] è buon ordinamento ovvero che ogni insie-
finito e dunque anche 𝐴 è finito. me può essere messo in corrispondenza
con un ordinale di Von Neumann cioè con
Supponiamo ora che 𝐴 sia un insieme per il quale per ogni 𝑛 ∈ ℕ si ha un insieme totalmente ordinato dalla re-
lazione di appartenenza ∈ e tale che ogni
#𝐴 ≠ 𝑛 . Dobbiamo dimostrare che 𝐴 è infinito. Per ogni 𝑛 ∈ ℕ scegliamo una elemento è anche un sottoinsieme. Gli
funzione iniettiva 𝑓𝑛 : [𝑛] → 𝐴. Dalle 𝑓𝑛 possiamo definire le funzioni iniettive ordinali di Von Neumann sono natural-
𝑔𝑛 : [𝑛] → 𝐴 in modo che 𝑔𝑛+1 sia una estensione di 𝑔𝑛 . Basterà infatti porre: mente uno contenuto nell’altro per cui
certamente hanno cardinalità confron-
tabili. Gli ordinali finiti non sono altro
( (
𝑔𝑛 (𝑘) se 𝑘 < 𝑛
𝑔0 = 𝑓0 , 𝑔𝑛+1 (𝑘) = che gli elementi di ℕ definiti mediante
min 𝑓𝑛+1 ([𝑛 + 1]) \ 𝑔𝑛 ([𝑛]) la proprietà 𝑛 + 1 = 𝑛 ∪ {𝑛}. E l’insie-
me ℕ stesso è il primo ordinale infinito
(che si denota con 𝜔 nel linguaggio degli
l’insieme 𝑓𝑛+1 ([𝑛 + 1]) \ 𝑔𝑛 ([𝑛]) essendo non vuoto in quanto # 𝑔𝑛 ([𝑛]) = 𝑛 < ordinali).
𝑛 + 1 = # 𝑓𝑛+1 ([𝑛 + 1]). Ma allora possiamo definire la funzione iniettiva qui si usa l’assioma della scelta 𝐴𝐶 .
𝑔 : ℕ → 𝐴 come 𝑔(𝑛) = 𝑔𝑛+1 (𝑛) ottenendo #𝐴 ≥ #ℕ e dunque 𝐴 è Dedekind
infinito.
1.7 insiemi prodotto
Abbiamo già visto che se 𝐴 è un insieme possiamo definire l’insieme delle

coppie di elementi di 𝐴 con il prodotto tra insiemi: 𝐴 × 𝐴. Cosa rappresenta
un prodotto ripetuto? Gli insiemi (𝐴 × 𝐴) × 𝐴 e 𝐴 × (𝐴 × 𝐴) non sono uguali,
in quanto il primo è un insieme di coppie il cui primo elemento è a sua volta
una coppia, il secondo insieme invece è un insieme di coppie il cui secondo
elemento è una coppia:
(𝐴 × 𝐴) × 𝐴 = {((𝑎0 , 𝑎1 ), 𝑎2 ) : 𝑎 0 , 𝑎1 , 𝑎2 ∈ 𝐴},
𝐴 × (𝐴 × 𝐴) = {(𝑎0 , (𝑎1 , 𝑎2 )) : 𝑎0 , 𝑎1 , 𝑎2 ∈ 𝐴}.
Questi insiemi sono molto simili tra loro e potrebbero essere identificati. Un’al-
tro insieme molto simile è l’insieme 𝐴3 . Se pensiamo al numero 3 come
20 1 fondamenti
all’insieme 3 = {0 , 1 , 2} l’insieme 𝐴3 rappresenta l’insieme di tutte le fun-

zioni 𝒂 : 0 , 1 , 2 → 𝐴. La funzione 𝒂 è univocamente determinata dal suo
valore nei tre punti del dominio: 𝑎 0 = 𝒂(0), 𝑎 1 = 𝒂(1), 𝑎 2 = 𝒂(2) in quanto
𝒂 = {0 ↦→ 𝑎0 , 1 ↦→ 𝑎 1 , 2 ↦→ 𝑎2 }. Possiamo quindi identificare 𝒂 con la tripla (o
vettore) di valori:
𝒂 = (𝑎 0 , 𝑎1 , 𝑎2 ), 𝑎0 , 𝑎1 , 𝑎2 ∈ 𝐴.
I valori 𝑎 0 , 𝑎 1 e 𝑎 2 vengono anche chiamate coordinate o componenti del vettore
coordinate, componenti, vettore
𝒂 . In effetti l’insieme 𝐴2 può essere identificato con 𝐴 × 𝐴, l’insieme 𝐴3 sarà
l’insieme delle triple di elementi di 𝐴 e in generale se 𝑛 ∈ ℕ identifichiamo con
𝐴𝑛 l’insieme delle 𝑛 -uple (leggi: ennuple) di elementi di 𝐴:
𝒂 ∈ 𝐴𝑛 ⇐⇒ 𝒂 = (𝑎 0 , 𝑎1 , . . . , 𝑎 𝑛−1 ).
1.8 la retta dei numeri reali
L’insieme ℝ dei numeri reali è un modello della retta geometrica che, a sua volta,
viene utilizzata per modellizzare tutte le quantità che si ottengono da misure
fisiche. In effetti l’esistenza di un insieme ℝ con le proprietà che andremo
ad elencare nella sezione seguente può essere intuitivamente giustificata dal
processo con cui si costruisce (fisicamente!) un righello. Presa una retta si inizia
col segnare su di essa un punto di riferimento che chiamiamo 0. Dopodiché
osserviamo che il punto 0 (come ogni altro punto) divide la retta in due parti.
In modo arbitrario chiamiamo positivi i punti che si trovano da una parte
e negativi i punti che si trovano dall’altra parte. Sulla semiretta dei numeri
positivi scegliamo, arbitrariamente, un punto 1. Il segmento compreso tra i
punti 0 e 1 sarà la nostra unità di misura.
L’addizione viene definita utilizzando i movimenti rigidi. Traslando il punto 1

di una unità alla volta si ottengono tutti i numeri naturali. Traslando all’indietro
si ottengono i numeri interi. Assumendo che tra due punti qualunque esistano
sempre punti intermedi (divisibilità) e assumendo che suddividendo la retta in
due parti esista sempre un punto di suddivisione (continuità) mostreremo come
si può suddividere ogni segmento in 𝑛 parti uguali per ogni numero naturale
𝑛 . In tal modo potremo definire i numeri razionali e la moltiplicazione per un
numero razionale. Con una estensione continua riusciremo quindi a definire la
moltiplicazione tra numeri reali. Osserveremo poi che la struttura moltiplicativa
dei numeri reali positivi soddisfa gli stessi assiomi della struttura additiva dei
reali e che quindi la costruzione fatta per costruire la moltiplicazione si può
ripetere identica per costruire l’elevamento a potenza.
Se volessimo postulare le proprietà delle traslazioni (cioè i movimenti rigidi

della retta in sé) potremmo farlo come segue. L’insieme 𝑇 di tutte le traslazioni
di ℝ è un sottoinsieme di ℝℝ (cioè 𝑇 è un insieme di funzioni 𝑡 : ℝ → ℝ) che
soddisfa le seguenti proprietà:
1. l’identità 𝑡(𝑥) = 𝑥 è in 𝑇 ;
2. dati 𝑥, 𝑦 ∈ ℝ esiste una unica 𝑡 ∈ 𝑇 tale che 𝑡(𝑥) = 𝑦 ;
3. se 𝑡1 , 𝑡2 ∈ 𝑇 allora 𝑡1 ◦ 𝑡2 ∈ 𝑇 .
1.8 la retta dei numeri reali 21
Si potrà allora fissare un punto 0 ∈ ℝ e definire 𝑥 + 𝑦 = 𝑡0 𝑦 (𝑥) dove 𝑡0 𝑦 è l’unica

traslazione che manda 0 in 𝑦 . E’ un esercizio molto interessante dedurre le
proprietà di gruppo dell’addizione dalle proprietà delle traslazioni.
Definizione 1.20 (gruppo). Un insieme 𝑋 su cui è definita una operazione ∗ si dice una operazione ∗ su 𝑋 è una funzione
∗ : 𝑋 × 𝑋 → 𝑋 per la quale si usa la
essere un gruppo se l’operazione ha le seguenti proprietà: notazione infissa: 𝑥 ∗ 𝑦 = ∗(𝑥, 𝑦).
1. associativa: ∀𝑥, 𝑦, 𝑧 ∈ 𝑋 : (𝑥 ∗ 𝑦) ∗ 𝑧 = 𝑥 ∗ (𝑦 ∗ 𝑧); gruppo

2. esistenza elemento neutro: ∃𝑒 ∈ 𝑋 : ∀𝑥 ∈ 𝑋 : 𝑒 ∗ 𝑥 = 𝑥 ∗ 𝑒 = 𝑥 ;
3. esistenza inverso: ∀𝑥 ∈ 𝑋 : ∃𝑦 ∈ 𝑋 : 𝑥 ∗ 𝑦 = 𝑦 ∗ 𝑥 = 𝑒 .
gruppo abeliano
Inoltre il gruppo si dice essere abeliano o commutativo se vale la proprietà:
4. commutativa: ∀𝑥, 𝑦 ∈ 𝑋 : 𝑥 ∗ 𝑦 = 𝑦 ∗ 𝑥 .
Quando l’operazione viene denotata con il simbolo + (addizione) diremo che il gruppo è
additivo, denoteremo con 0 (zero) l’elemento neutro e l’inverso verrà chiamato opposto.
Se invece si usa il simbolo · (moltiplicazione) diremo che il gruppo è moltiplicativo,
l’elemento neutro potrà essere denotato con il simbolo 1 (uno o unità) e l’inverso potrà
essere chiamato reciproco.
L’elemento neutro di un gruppo è unico. Se infatti 𝑥 e 𝑦 fossero due elementi

neutri si avrebbe 𝑥 = 𝑥 ∗ 𝑦 = 𝑦 . Anche l’inverso è unico: infatti se 𝑦 e 𝑧 fossero
due inversi di 𝑥 si avrebbe 𝑦 = 𝑦 ∗ 𝑥 ∗ 𝑧 = 𝑧 .
gruppo ordinato
Definizione 1.21 (gruppo ordinato). Diremo che 𝑋 è un gruppo ordinato se 𝑋 è

un gruppo (con operazione ∗ ed elemento neutro 𝑒 ) se è anche un insieme ordinato (con
relazione ≤ ) e se vale la proprietà:
1. monotonia: se 𝑥 ≤ 𝑦 allora per ogni 𝑧 si ha:
𝑥∗𝑧 ≤ 𝑦∗𝑧 e 𝑧 ∗ 𝑥 ≤ 𝑧 ∗ 𝑦.
ordinamento denso
Definizione 1.22 (ordinamento denso). Un ordinamento ≤ si dice essere densa o

ordinamento continuo
divisibile se esistono sempre punti intermedi: se 𝑥 < 𝑦 esiste 𝑧 tale che 𝑥 < 𝑧 < 𝑦 .
Gli assiomi della teoria degli insiemi che
abbiamo introdotto finora non possono
Definizione 1.23 (ordinamento continuo). Un ordinamento ≤ si dice essere conti- garantire l’esistenza di insiemi infiniti
in quanto un universo fatto solo da in-
nuo (o Dedekind-completo) se dati comunque 𝐴, 𝐵 sottoinsiemi non vuoti di 𝑋 tali
siemi finiti soddisfa tutti gli assiomi. E’
che per ogni 𝑎 ∈ 𝐴 e per ogni 𝑏 ∈ 𝐵 risulta 𝑎 ≤ 𝑏 (concisamente potremmo scrivere quindi necessario un assioma di infinito
𝐴 ≤ 𝐵) allora esiste 𝑐 ∈ 𝑋 tale che per ogni 𝑎 ∈ 𝐴 e ogni 𝑏 ∈ 𝐵 si ha 𝑎 ≤ 𝑐 ≤ 𝑏 che garantisca l’esistenza di almeno un
(concisamente 𝐴 ≤ 𝑐 ≤ 𝐵). insieme infinito. Usualmente tale insie-
me è l’insieme ℕ dei numeri naturali da
cui, con una costruzione non semplice,
Possiamo allora introdurre come assioma l’esistenza dei numeri reali. si può costruire l’insieme ℝ dei numeri
reali. Tuttavia visto che l’insieme ℝ è il
fondamento dell’analisi matematica re-
Assioma 1.24 (numeri reali). Esiste un insieme ℝ con una operazione di gruppo + putiamo sia piuttosto naturale assumere
l’esistenza di ℝ come assioma e ritrova-
(addizione) ed una relazione d’ordinamento totale ≤ che rendono ℝ un gruppo ordinato,
re (come faremo tra poco) l’insieme ℕ
denso e continuo (vedremo che la proprietà commutativa è valida di conseguenza). all’interno di ℝ.
Chiamiamo 0 l’elemento neutro dell’addizione e supponiamo inoltre che esista almeno opposto
un altro punto 1 ∈ 𝑋 tale che 1 > 0 che chiameremo unità.
sottrazione
22 1 fondamenti
L’inverso additivo di un elemento 𝑥 sarà chiamato opposto e verrà denotato

con −𝑥 , si avrà quindi 𝑥 + (−𝑥) = 0. Potremo quindi definire l’operazione di
sottrazione:
𝑥 − 𝑦 = 𝑥 + (−𝑦).
positivo Diremo che un numero 𝑥 ∈ ℝ è positivo se 𝑥 > 0 e negativo se 𝑥 < 0.

Se 𝑥 ≤ 𝑦 sommando −𝑥 da ambo i lati si ottiene 0 ≤ 𝑦 − 𝑥 e sommando ancora
−𝑦 si ottiene −𝑦 ≤ −𝑥 . Lo stesso vale con le disuguaglianze strette e con le
disuguaglianze inverse.
1.9 i numeri naturali e interi
Vediamo adesso come identificare, all’interno dei numeri reali ℝ, l’insieme dei
numeri naturali ℕ .
numeri naturali
Definizione 1.25 (numeri naturali). Un sottoinsieme 𝐴 ⊆ ℝ si dice essere induttivo
se valgono le due proprietà:
0 ∈ 𝐴,
𝑛 ∈ 𝐴 =⇒ 𝑛 + 1 ∈ 𝐴.
La famiglia di tutti i sottoinsiemi induttivi di ℝ non è vuota in quanto ℝ stesso è

induttivo. Definiamo ℕ come l’intersezione di tutti i sottoinsiemi induttivi di ℝ:
\ \
ℕ= 𝐴= {𝐴 ⊆ P(ℝ) : 𝐴 induttivo}.
𝐴 induttivo
Ovviamente ℕ deve essere a sua volta induttivo (lo si verifichi) e quindi è il “più piccolo”
ℕ sottoinsieme induttivo di ℝ.
Oltre ai numeri 0 e 1 che abbiamo già definito, si definiscono le altre cifre

decimali 2 , 3 , 4 , 5 , 6 , 7 , 8 , 9 direttamente come segue:
2 = 1 + 1, 3 = 2 + 1, 4 = 3 + 1, 5 = 4 + 1,
6 = 5 + 1, 7 = 6 + 1, 8 = 7 + 1, 9 = 8 + 1.
E’ facile dimostrare che l’insieme ℕ appena definito soddisfa gli assiomi di

Giuseppe Peano (1858–1932), matemati- Peano in particolare vale il seguente.
co torinese, contribuì a porre i fondamen-
ti della logica matematica. La notazione Teorema 1.26 (principio di induzione). Se 𝑃(𝑛) è un predicato nella variabile 𝑛 ∈ ℕ
∃ per il quantificatore universale si de-
tale che:
ve a lui. E sua l’assiomatizzazione che
caratterizza i numeri naturali: 1. 𝑃(0) è vero;
1. 0 ∈ ℕ ; 2. per ogni 𝑛 ∈ ℕ se 𝑃(𝑛) è vero allora anche 𝑃(𝑛 + 1) è vero.
2. se 𝑛 ∈ ℕ allora 𝑛 + 1 ∈ ℕ ;
3. se 𝑛, 𝑚 ∈ ℕ e 𝑛 + 1 = 𝑚 + 1 allora Allora 𝑃(𝑛) è vero per ogni 𝑛 ∈ ℕ .
𝑛 = 𝑚;
4. se 𝑛 ∈ ℕ allora 𝑛 + 1 ≠ 0;
Dimostrazione. Si consideri l’insieme 𝐴 = {𝑛 ∈ ℕ : 𝑃(𝑛) è vera}. Le ipotesi del
5. se 𝐴 ⊆ ℕ è induttivo allora 𝐴 =
ℕ. principio di induzione garantiscono che 𝐴 sia induttivo (definizione 1.25) e
quindi che ℕ ⊆ 𝐴. Dunque 𝑃(𝑛) è vera per ogni 𝑛 ∈ ℕ .
1.9 i numeri naturali e interi 23
Utilizzando il principio di induzione si possono dimostare le seguenti ben note

proprietà dei numeri naturali.
Teorema 1.27 (proprietà dei numeri naturali). Se 𝑛, 𝑚 ∈ ℕ si ha:
1. 𝑛 ≥ 0;
2. 𝑛 + 𝑚 ∈ ℕ;
3. 𝑛 + 𝑚 = 𝑚 + 𝑛;
4. se 𝑛 ≥ 𝑚 allora 𝑛 − 𝑚 ∈ ℕ ;
5. se 𝑛 > 𝑚 allora 𝑛 ≥ 𝑚 + 1.
Dimostrazione. Per il primo punto: ovviamente 0 ≥ 0. D’altra parte se 𝑛 ≥ 0

allora 𝑛 + 1 > 𝑛 + 0 ≥ 0. Dunque per induzione 𝑛 ≥ 0 per ogni 𝑛 ∈ ℕ .
Per il secondo punto consideriamo il predicato
𝑃(𝑛) : ∀𝑚 ∈ ℕ : 𝑚 + 𝑛 ∈ ℕ .
Chiaramente 𝑃(0) è vero in quanto 𝑚 + 0 = 𝑚 ∈ ℕ se 𝑚 ∈ ℕ . Ma se 𝑃(𝑛)

è verificata allora 𝑚 + 𝑛 ∈ ℕ e visto che ℕ è induttivo anche 𝑚 + (𝑛 + 1) =
(𝑚 + 𝑛) + 1 ∈ ℕ . Dunque vale 𝑃(𝑛 + 1) e dunque per ogni 𝑛 vale 𝑃(𝑛).
Per dimostrare la proprietà commutativa possiamo innanzitutto dimostrare
per induzione che 𝑛 + 1 = 1 + 𝑛 per ogni 𝑛 ∈ ℕ (lo si faccia per esercizio).
Dopodiché si considera la proposizione
𝑃(𝑛) : ∀𝑚 ∈ ℕ : 𝑛 + 𝑚 = 𝑚 + 𝑛.
𝑃(0) è vera per le proprietà dell’elemento neutro e se 𝑃(𝑛) è vera allora 𝑛+ 1 +𝑚 =

1 + 𝑛 + 𝑚 = 1 + 𝑚 + 𝑛 = 𝑚 + 1 + 𝑛 = 𝑚 + 𝑛 + 1 e quindi anche 𝑃(𝑛 + 1) è vera.
Il risultato segue per induzione.
Per il quarto punto si verifica innanzitutto che se 𝑛 ≥ 1 allora 𝑛 − 1 ∈ ℕ (lo si

dimostra per induzione osservando che (𝑛 + 1) − 1 = 𝑛 ∈ ℕ ). Dopodiché si
considera il predicato
𝑃(𝑛) : ∀𝑚 ∈ ℕ : 𝑚 ≥ 𝑛 =⇒ 𝑚 − 𝑛 ∈ ℕ .
E’ facile verificare che 𝑃(0) è vero. Supponiamo allora che 𝑃(𝑛) sia vero e
consideriamo 𝑃(𝑛 + 1) : 𝑚 ≥ 𝑛 + 1 =⇒ 𝑚 − (𝑛 + 1) ∈ ℕ . Se 𝑚 ≥ 𝑛 + 1 allora
certamente 𝑚 − 1 ≥ 𝑛 e 𝑚 ≠ 0. Abbiamo già dimostrato che 𝑚 − 1 ∈ ℕ e quindi,
applicando 𝑃(𝑛), possiamo dedurre che 𝑚 − 1 −𝑛 ∈ ℕ . Ma 𝑚 − 1 −𝑛 = 𝑚 −(𝑛 + 1)
e quindi abbiamo verificato 𝑃(𝑛 + 1).
L’ultima affermazione è equivalente a dire che se 𝑚 ∈ ℕ non ci sono numeri

naturali strettamente compresi tra 𝑚 e 𝑚 + 1. Sottraendo 𝑚 ci si riconduce a
osservare che non ci sono naturali tra 0 e 1. Ma se 0 < 𝑥 < 1 allora 𝑥 − 1 < 0
non può essere un naturale ed essendo diverso da 0 deduciamo che 𝑥 ∉ ℕ .
Esercizio 1.28. Dimostrare, utilizzando il principio di induzione, la seguente

proposizione:
∀𝑛 ∈ ℕ : ((∃𝑚 ∈ ℕ : 𝑛 = 𝑚 + 𝑚) ∨ (∃𝑚 : 𝑛 = 𝑚 + 𝑚 + 1)).

24 1 fondamenti
prodotto
Se 𝑛 ∈ ℕ e 𝑥 ∈ ℝ si può definire induttivamente il prodotto 𝑛𝑥 (a volte scriveremo
𝑛 · 𝑥 per motivi tipografici) mediante le seguenti proprietà ricorsive:
(
0𝑥 = 0,
(𝑛 + 1)𝑥 = 𝑛𝑥 + 𝑥
cosicché si avrà: 1 𝑥 = 𝑥 , 2 𝑥 = 𝑥 + 𝑥 , 3 𝑥 = 𝑥 + 𝑥 + 𝑥 , . . . Per induzione è facile

dimostrare 𝑛(𝑥 + 𝑦) = 𝑛𝑥 + 𝑛 𝑦 e che (𝑛 + 𝑚)𝑥 = 𝑛𝑥 + 𝑚𝑥 . Di conseguenza
𝑛(−𝑥) = −(𝑛𝑥). Dalle proprietà dell’iterata si ha la proprietà associativa del
prodotto
(𝑛𝑚)𝑥 = 𝑛(𝑚𝑥).
Inoltre se 0 ≤ 𝑥 ≤ 𝑦 e 𝑛 ≤ 𝑚 si ha la proprietà di monotonia:
𝑛𝑥 ≤ 𝑚 𝑦
(e se 𝑥 < 𝑦 oppure 𝑛 < 𝑚 la disuguaglianza è stretta). In particolare se 𝑛𝑥 = 0

se e solo se 𝑛 = 0 oppure 𝑥 = 0.
Per rappresentare in modo efficiente tutti i numeri naturali utilizziamo la

notazione posizionale decimale notazione posizionale decimale. Il numero rappresentato da una sequenza finita
di cifre decimali può essere definito ricorsivamente: una sequenza di una sola
cifra rappresenta il numero corrispondente alla cifra stessa, una sequenza di
𝑛 + 1 cifre rappresenta il numero rappresentato dalle prime 𝑛 cifre, moltiplicato
per (9 + 1) (dieci) e sommato alla ultima cifra. Ad esempio la sequenza di cifre
4701 (leggi: quattromilasettecentouno) significa
4701 = ((4 · (9 + 1) + 7) · (9 + 1) + 0) · (9 + 1) + 1.
Osservando che 10 = 9 + 1 si scriverà
4701 = ((4 · 10 + 7) · 10 + 0) · 10 + 1.
Se 𝑚, 𝑛 ∈ ℕ con 𝑚 < 𝑛 si ha 𝑚 − 𝑛 = −(𝑛 − 𝑚) che è l’opposto di un numero

numeri interi naturale. L’insieme dei naturali e dei loro opposti si chiama insieme dei numeri
ℤ da zahlen che significa “numeri” in interi e si denota con ℤ:
tedesco.
ℤ = ℕ − ℕ = ℕ ∪ (−ℕ ).
Possiamo facilmente estendere la moltiplicazione dai naturali agli interi con la

seguente regola:
(−𝑛) · 𝑚 = −(𝑛 · 𝑚).
Se 𝑚, 𝑛 sono numeri interi anche 𝑚 + 𝑛 , 𝑚 − 𝑛 e 𝑚 · 𝑛 sono numeri interi.
I numeri interi sono dunque un gruppo additivo e totalmente ordinato. Si
potrebbe anche verificare che ℤ è continuo ma, a differenza di ℝ, non soddisfa
la proprietà di densità: se 𝑛 è intero, tra 𝑛 e 𝑛 + 1 non ci sono altri numeri
interi.
anello
Diremo anche che ℤ è un anello abeliano con unità, in base alla seguente.
Definizione 1.29 (anello). Sia 𝐴 un insieme su cui sono definite due operazioni: +
(addizione) e · (moltiplicazione). Diremo che 𝐴 è un anello se 𝐴 è un gruppo abeliano
rispetto alla addizione, se la moltiplicazione è associativa (𝑥 · 𝑦) · 𝑧 = 𝑥 · (𝑦 · 𝑥) e se vale
la proprietà distributiva 𝑥 · (𝑦 + 𝑧) = 𝑥 · 𝑦 + 𝑥 · 𝑧 , (𝑥 + 𝑦) · 𝑧 = 𝑥 · 𝑧 + 𝑦 · 𝑧 . Se inoltre
la moltiplicazione è commutativa diremo che 𝐴 è un anello abeliano. Se inoltre esiste
un elemento 1 ∈ 𝐴 neutro per la moltiplicazione diremo che 𝐴 è un anello con unità.
Se 𝐴 è un anello allora si può dimostrare che valgono anche le usuali proprietà:
0 · 𝑥 = 𝑥 · 0 = 0, (−1) · 𝑥 = 𝑥 · (−1) = −𝑥.
Per la prima abbiamo:
0 · 𝑥 = 0 · 𝑥 + 𝑥 + (−𝑥) = (0 + 1) · 𝑥 + (−𝑥) = 𝑥 + (−𝑥) = 0
e scrivendo gli addendi in ordine opposto si ottiene anche 𝑥 · 0 = 0. Allora

possiamo dimostrare anche la seconda proprietà:
(−1) · 𝑥 = (−1) · 𝑥 + 𝑥 + (−𝑥) = (−1 + 1) · 𝑥 + (−𝑥) = 0 + (−𝑥) = −𝑥
e anche in questo caso scrivendo gli addendi in ordine opposto si ottiene

𝑥 · (−1) = −𝑥 .
Se 𝑛, 𝑚 ∈ ℤ con 𝑚 ≠ 0 e se esiste 𝑘 ∈ ℤ tale che 𝑛 = 𝑘𝑚 diremo che 𝑛 è un multiplo

multiplo di 𝑚 oppure che 𝑚 è un divisore di 𝑛 e scriveremo:
divisore
𝑛
= 𝑘.
𝑚
I multipli di 2 si chiamano numeri pari, gli interi non pari si chiamano dispari. pari
Iterando la moltiplicazione si ottiene l’elevamento a potenza; fissato 𝑚 ∈ ℕ dispari

definiamo, per ogni 𝑛 ∈ ℕ la potenza 𝑚 𝑛 ricorsivamente come segue:
elevamento a potenza
(
𝑚0 = 1
𝑚 𝑛+1 = 𝑚 · 𝑚 𝑛 .
Si avrà quindi: 𝑚 0 = 1, 𝑚 1 = 𝑚 , 𝑚 2 = 𝑚 · 𝑚 , 𝑚 3 = 𝑚 · 𝑚 · 𝑚 , . . .
Possiamo utilizzare le potenze di 10 per rappresentare in maniera alternativa le

sequenze decimali:
4701 = 4 · 103 + 7 · 102 + 0 · 10 + 1.
Definiamo il fattoriale denotato con 𝑛 ! (leggi: 𝑛 fattoriale) tramite la seguente fattoriale
(
0! = 1
(𝑛 + 1)! = (𝑛 + 1)𝑛 !
in tal modo risulta che 𝑛 ! sia il prodotto dei primi 𝑛 numeri naturali positivi:
𝑛 ! = 1 · 2 · 3 · · · 𝑛.
26 1 fondamenti
Tabella 1.4: I primi valori (e nomi) di 𝑛 0 1 2 3 4

alcune delle sequenze che abbiamo defi-
𝑛+5 5 6 7 8 9
nito.
2𝑛 1 2 4 8 16
25+𝑛 32 64 128 256 512
210+𝑛 1024 2048 4096 8192 16384
215+𝑛 32768 65536 131072 262144 524288
220+𝑛 1048576 2097152 4194304 8388608 16777216
3𝑛 1 3 9 27 81
35+𝑛 243 729 2187 6561 19683
𝑛! 1 1 2 6 24
(5 + 𝑛)! 120 720 5040 40320 362880
(10 + 𝑛)! 3628800 39916800 479001600 6227020800 87178291200
103𝑛 K (chilo) M (mega) G (giga) T (tera)
103(𝑛+5) P (peta) E (exa) Z (zetta) Y (yotta)
210𝑛 1 Ki (chibi) Mi (mebi) Gi (gibi) Ti (tebi)
210(𝑛+5) Pi (pebi) Ei (exbi) Zi (zebi) Yi (yobi)
Esercizio 1.30. Utilizzando il principio di induzione si dimostri che per ogni 𝑛 ∈ ℕ :
2𝑛 > 𝑛, (𝑛 + 1)! ≥ 2𝑛 , 𝑛𝑛 ≥ 𝑛!
A volte sarà utile considerare anche i prodotti di solamente i numeri pari o i

semi fattoriale numeri dispari fino ad un certo numero 𝑛 . Questo si chiama semi fattoriale e
si indica con 𝑛 !!. Lo possiamo definire separatamente sui numeri pari (cioè i
numeri che si possono scrivere nella forma 2𝑛 con 𝑛 ∈ ℕ ) e i numeri dispari
(che scriviamo nella forma 2𝑛 + 1):
(2𝑛)!! = 2 · 4 · 6 · · · (2𝑛)
(2𝑛 + 1)!! = 1 · 3 · 5 · · · (2𝑛 + 1).
Osservazione 1.31. Si osservi che risulta
(2𝑛)!! = (2 · 1) · (2 · 2) · (2 · 3) · · · (2 · 𝑛) = 2𝑛 · 𝑛 !
mentre
2𝑛 · 𝑛 ! · (2𝑛 + 1)!! = (2𝑛)!! · (2𝑛 + 1)!! = (2𝑛 + 1)!
Queste formule permettono di esprimere il semi fattoriale utilizzando il fattoriale intero
e le potenze.
Esercizio 1.32. Si dia una definizione per induzione del semi fattoriale (separatamente
per i pari e per i dispari) e si dimostrino, per induzione, le formule nell’osservazione
precedente.
Se 𝑓 è una funzione definita sull’insieme [𝑛] = {0 , . . . , 𝑛 − 1} a valori in un

qualunque gruppo additivo (o moltiplicativo) sarà possibile introdurre una
notazione per ripetere le operazioni di somma (e prodotto) un numero arbitrario
di volte:
𝑛−1
X
𝑓 (𝑘) = 𝑓 (0) + 𝑓 (1) + · · · + 𝑓 (𝑛 − 1) (1.6)
𝑘=0
𝑛−1
Y
𝑓 (𝑘) = 𝑓 (0) · 𝑓 (1) · · · 𝑓 (𝑛 − 1). (1.7)
𝑘=0
Formalmente questo può essere fatto tramite una definizione per induzione:
 −1
X  −1
Y
𝑓 (𝑘) = 0 , 𝑓 (𝑘) = 1 ,

 


 

𝑘=0 𝑘=0

 

! !
X𝑛 𝑛−1
X Y𝑛 𝑛−1
Y
𝑓 (𝑘) = 𝑓 (𝑘) + 𝑓 (𝑛); 𝑓 (𝑘) = 𝑓 (𝑘) · 𝑓 (𝑛).

 


 

 𝑘=0 𝑘=0  𝑘=0 𝑘=0
 
La variabile 𝑘 che si trova nelle formule (1.6) è muta: al suo posto si può utilizzare
qualunque altra variabile che non compaia altrove.
E’ naturalmente possibile anche fare una somma a partire da un indice diverso

da 0. Se 𝑎, 𝑏 ∈ ℤ porremo:
𝑏
X 𝑏−𝑎
X
𝑓 (𝑘) = 𝑓 (𝑎 + 𝑗).
𝑘=𝑎 𝑗=0
Dal punto di vista mnemonico abbiamo fatto un cambio di variabile 𝑗 = 𝑘 − 𝑎 :

per 𝑘 = 𝑎 si trova 𝑗 = 0 e per 𝑘 = 𝑏 si trova 𝑗 = 𝑏 − 𝑎 .
Esercizio 1.33. Convincersi che la somma è lineare:
𝑏
X 𝑏
X X 𝑏
X 𝑏
X
[ 𝑓 (𝑘) + 𝑔(𝑘)] = 𝑓 (𝑘) + 𝑔(𝑘), 𝑐 · 𝑓 (𝑘) = 𝑐 · 𝑓 (𝑘)
𝑘=𝑎 𝑘=𝑎 𝑘=𝑎 𝑘=𝑎 𝑘=𝑎
e additiva:
𝑐
X 𝑏
X 𝑐
X
𝑓 (𝑘) = 𝑓 (𝑘) + 𝑓 (𝑘).
𝑘=𝑎+1 𝑘=𝑎+1 𝑘=𝑏+1
Esercizio 1.34. Dimostrare che

𝑛 𝑛
X 𝑛 · (𝑛 + 1) X 𝑛 · (𝑛 + 1) · (2𝑛 + 1)
𝑘= , 𝑘2 =
𝑘=1
2 𝑘=1
6
Svolgimento. Il risultato della prima somma può essere interpretato nel modo
seguente: la media di una progressione aritmetica 1+2+···+𝑛
𝑛 è uguale alla media
tra il primo e l’ultimo termine della progressione: 1+𝑛
2 .
Una volta identificata la formula la possiamo dimostrare per induzione. Per

𝑛 = 0 la somma è pari a 0 per definizione. Se la formula è vera per un certo 𝑛 ,
si ha
!
𝑛+1 𝑛
X X 𝑛 · (𝑛 + 1) (𝑛 + 2)(𝑛 + 1)
𝑘= 𝑘 + (𝑛 + 1) = + (𝑛 + 1) =
𝑘=1 𝑘=1
2 2
28 1 fondamenti
che è quanto volevamo dimostrare.
La formula per la somma dei quadrati si può dimostrare facilmente per induzione
(lo si faccia per esercizio) se già conosciamo la formula da dimostrare.
Un metodo per trovare la formula è quello di osservare che la differenza di due

termini cubici consecutivi risulta essere quadratico:
𝑘 3 − (𝑘 − 1)3 = 3 𝑘 2 − 3 𝑘 + 1.
Sommando ambo i lati della precedente equazione si ottiene:

𝑛
X 𝑛
X 𝑛
X 𝑛
X 𝑛
X
𝑘3 − (𝑘 − 1)3 = 3 𝑘2 − 3 𝑘+ 1. (1.8)
𝑘=1 𝑘=1 𝑘=1 𝑘=1 𝑘=1
Al lato destro compare la somma di cui vogliamo calcolare il valore insieme

ad altre due somme di cui sappiamo già il valore. Basterà allora determinare
si chiama somma telescopica in quanto i il valore del lato sinistro dove osserviamo che i termini delle due somme si
termini delle due sommatorie si chiu- cancellano a vicenda, tranne l’ultimo della prima somma e il primo della seconda:
dono uno nell’altro come i tubi di un
dunque si ottiene 𝑛 3 − 03 = 𝑛 3 . Moltiplichiamo per 2 l’equazione (1.8), mettiamo
cannocchiale.
in evidenza la somma dei quadrati e utilizzando la formula 2 𝑛𝑘=1 𝑘 = 𝑛(𝑛 + 1)
P
per ottenere:
𝑛
X
𝑘 2 = 2𝑛 3 + 3𝑛(𝑛 + 1) − 2𝑛 = 𝑛 · 2(𝑛 2 − 1) + 3(𝑛 + 1)

6
𝑘=1
= 𝑛 · (𝑛 + 1)(2𝑛 + 1)

P𝑛
Con lo stesso metodo si può trovare una formula per il calcolo di 𝑘=1
𝑘 3 e così
via. . .
permutazione
Se 𝑔 : {1 , . . . , 𝑛} → {1 , . . . , 𝑛} è bigettiva (una tale funzione si chiama permuta-
zione) allora si può fare il cambio di variabile 𝑘 = 𝑔(𝑗):
𝑛−1
X 𝑛−1
X
𝑓 (𝑘) = 𝑓 (𝑔(𝑗)).
𝑘=0 𝑗=0
Questa uguaglianza può essere dimostrata facilmente nel caso in cui 𝑔 scambi
due soli indici lasciando fissi tutti gli altri (trasposizione) e poi può essere estesa
a tutte le permutazioni osservando che ogni permutazione si scrivere come
composizione di trasposizioni.
Questa proprietà è sostanzialmente la proprietà commutativa della somma

estesa ad un numero qualunque di addendi. Grazie a questa proprietà possiamo
definire la somma di una funzione definita su qualunque insieme finito. Se
𝑓 : 𝐴 → ℝ e 𝑔 : 𝐼𝑛 → 𝐴 è una bigezione (dunque #𝐴 = 𝑛 ) allora si può
definire
X 𝑛−1
X
𝑓 (𝑘) = 𝑓 (𝑔(𝑗))
𝑘∈𝐴 𝑗=0
1.10 polinomi 29
in quanto la somma sul lato destro non dipende dalla bigezione 𝑔 che abbiamo
scelto.
1.10 polinomi
Il concetto di “polinomio” è una astrazione che non risulta facile esplicitare

formalmente. Nel capitolo 9 ci sarà molto utile applicare un polinomio ad un
operatore differenziale e dunque ci teniamo ora a rendere molto chiaro cosa
intendiamo per polinomio. In particolare distingueremo tre concetti che spesso
vengono sovrapposti: espressione polinomiale, polinomio e funzione polinomiale.
Se 𝐴 è un anello abeliano con unità (per ora noi abbiamo un unico esempio
𝐴 = ℤ ma più avanti potremo scegliere 𝐴 = ℚ, 𝐴 = ℝ o 𝐴 = ℂ) possiamo
considerare tutte le espressioni (formalmente: alberi di valutazione) che possono
essere costruite utilizzando le operazioni di addizione e moltiplicazione che
coinvolgono coefficienti presi da 𝐴 e una variabile che possiamo chiamare 𝑥
(e più in generale è possibile considerare polinomi in più variabili). Queste espressioni polinomiali
espressioni verranno chiamate espressioni polinomiali su 𝐴 (o a coefficienti in
𝐴) nella variabile 𝑥 . Un esempio di espressione polinomiale è riportato in
Figura 1.3. Le espressioni polinomiali possono essere sommate e moltiplicate
tra loro per ottenere nuove espressioni. Come comoda notazione si utilizzano
le potenze intere per denotare un prodotto ripetuto 𝑛 volte: 𝑥 𝑛 = 𝑥 · · · 𝑥 .
Diremo che due espressioni sono equivalenti se è possibile trasformare una nel-
l’altra utilizzando le proprietà valide negli anelli abeliani: proprietà associativa
e commutativa per somma e prodotto, proprietà distributiva, elementi neutri
1 · 𝑥 = 𝑥 , 0 + 𝑥 = 𝑥 . Inoltre se un ramo dell’espressione non contiene la variabile
𝑥 è possibile valutare (nell’anello 𝐴) le operazioni e sostituire l’intero ramo con
il risultato di tali operazioni (e viceversa).
In particolare se abbiamo una qualunque espressione possiamo sviluppare tutti

i prodotti mediante la proprietà distributiva e poi riassociare i termini con le
stesse potenze di 𝑥 , ad esempio:
𝑃 = ((−7) · 𝑥 + 42) · (𝑥 · (2 + 𝑥) + 3 · (−1 + 𝑥))

= ((−7) · 𝑥 + 42) · (2 𝑥 + 𝑥 2 − 3 + 3 𝑥)
= 126 + 231 𝑥 + 7 𝑥 2 − 7 𝑥 3
In generale si otterrà una espressione polinomiale che diremo essere in forma

canonica:
𝑛
𝑃 = 𝑎0 + 𝑎1 𝑥 + 𝑎2 𝑥 2 + · · · + 𝑎 𝑛 𝑥 𝑛 = 𝑎𝑘 𝑥 𝑘 .
X
𝑘=0
Dunque ogni espressione polinomiale è equivalente ad una espressione polino-

miale in forma canonica.
polinomio
Se due espressioni polinomiali sono equivalenti diremo che rappresentano lo
stesso polinomio. Se 𝐴 è un anello denoteremo con 𝐴[𝑥] l’insieme di tutti i
polinomi con coefficienti in 𝐴 e variabile 𝑥 . Formalmente 𝐴[𝑥] è il quoziente
30 1 fondamenti
+ +
· 42 · ·
−7 𝑥 𝑥 + 3 +
Figura 1.3: Il polinomio

𝑃 = ((−7) · 𝑥 + 42)·(𝑥·(2+𝑥)+3 ·(−1+𝑥))
rappresentato come albero di valutazio- 2 𝑥 −1 𝑥
ne.
dell’insieme di tutte le espressioni polinomiali rispetto alla relazione di equiva-

lenza che abbiamo appena definito. Possiamo fare la somma e il prodotto di
polinomi e queste operazioni rendono 𝐴[𝑥] anch’esso un anello.
Più esplicitamente se 𝑃 e 𝑄 sono polinomi in forma canonica

𝑛 𝑚
𝑎𝑘 𝑥 𝑘 , 𝑏𝑘 𝑥 𝑘
X X
𝑃= 𝑄=
𝑘=0 𝑘=0
si avrà:
𝑁
(𝑎 𝑘 + 𝑏 𝑘 ) · 𝑥 𝑘
X
𝑃+𝑄 =
𝑘=0
dove 𝑁 è il più grande tra 𝑛 e 𝑚 e si intende che 𝑎 𝑘 = 0 per 𝑘 > 𝑛 e 𝑏 𝑘 = 0 per

𝑘 > 𝑚 . Se 𝑡 ∈ 𝐴 avremo:
𝑛
(𝑡 𝑎 𝑘 ) · 𝑥 𝑘 .
X
𝑡𝑃 =
𝑘=0
Per quanto riguarda il prodotto si avrà invece:

! ! ! !
𝑛 𝑛 𝑛 𝑚
𝑘 𝑗 𝑗 𝑘
X X X X
𝑃·𝑄 = 𝑎𝑘 𝑥 · 𝑏𝑗 𝑥 = 𝑎𝑘 𝑏𝑗 𝑥 𝑥
𝑘=0 𝑗=0 𝑘=0 𝑗=0
! !
𝑛 X
𝑚 𝑚+𝑛 𝑠
𝑗+𝑘
𝑎 𝑗 𝑏 𝑠−𝑗 𝑥 𝑠 .
X X X
= 𝑎𝑘 𝑏𝑗 𝑥 =
𝑘=0 𝑗=0 𝑠=0 𝑗=0
Le formule per la somma e il prodotto dei polinomi in forma canonica possono

essere applicate ad ognuna delle proprietà di anello per dimostrare che poli-
nomi equivalenti hanno la stessa forma canonica e che quindi due espressioni
polinomiali sono equivalenti se e solo se i coefficienti della loro forma canonica
coincidono. In pratica i polinomi a coefficienti in 𝐴 sono rappresentati dai
1.11 coefficienti binomiali 31
coefficienti delle loro forme canoniche che non sono altro che sequenze finite:
𝑛
𝑎 𝑘 𝑥 𝑘 : 𝑎 𝑘 ∈ 𝐴, 𝑛 ∈ ℕ }
X
𝐴[𝑥] = {
𝑘=0
≈ 𝐴ℕ
𝑐 = 𝒂 ∈ 𝐴 : {𝑘 ∈ ℕ : 𝒂(𝑘) ≠ 0 } è finito .
ℕ

Se il polinomio 𝑃 si scrive in forma canonica

𝑛
𝑎𝑘 𝑥 𝑘
X
𝑃=
𝑘=0
se 𝑛 > 0 possiamo supporre che il coefficiente 𝑎 𝑛 sia diverso da 0 perché

altrimenti potremmo rimuovere il termine corrispondente e ridurci ad una
somma di 𝑛 − 1 termini. In tal caso diremo che il polinomio 𝑃 ha grado 𝑛 . Se grado
𝑛 = 0 diremo anche che il polinomio è costante. Se 𝑛 = 0 e 𝑎 𝑛 = 0 diremo
che 𝑃 è il polinomio nullo. I polinomi costanti non nulli hanno grado pari a 0,
mentre il polinomio nullo, per convenzione, diremo avere grado −∞ (questa
definizione ha senso se si pensa al grado di un polinomio come al più piccolo
numero per cui tutti i coefficienti di indice maggiore a lui sono nulli).
Finora abbiamo definito il polinomio come una classe di equivalenza di espres-

sioni polinomiali. Se prendiamo una espressione 𝑃 e al posto della variabile
𝑥 mettiamo un elemento 𝑎 dell’anello 𝐴 (o di qualunque anello che estende
𝐴) allora possiamo valutare tutte le operazioni (somme e prodotti) ed ottenere
un risultato nell’anello scelto: il risultato ottenuto si indica con 𝑃(𝑎) (stessa
notazione utilizzata per le funzioni). Se 𝑃 è un polinomio nella variabile 𝑥
la funzione 𝑥 ↦→ 𝑃(𝑥) può essere chiamata funzione polinomiale e si indica funzione polinomiale
usualmente con con lo stesso nome 𝑃 dato al polinomio. Sarà il contesto a dirci
se con 𝑃 si intende il polinomio (l’espressione) o la funzione.
Come già anticipato è utile tenere separato il concetto di polinomio da quello

di funzione polinomiale in quanto lo stesso polinomio può essere valutato su
diversi anelli (ad esempio nel corso di geometria si potrà sostituire la variabile
𝑥 di un polinomio con una matrice, e nell’ultimo capitolo di questi appunti
sostituiremo la 𝑥 con un operatore differenziale).
Proseguiremo con la trattazione dei polinomi nel capitolo 4.4.
1.11 coefficienti binomiali
Capiterà spesso di imbattersi in alcuni polinomi particolari, che vengono a volte prodotti notevoli
chiamati prodotti notevoli. Di fondamentale iportanza quelli di grado 2:
(𝑥 + 1) · (𝑥 − 1) = 𝑥 2 − 1 , (𝑥 + 1)2 = 𝑥 2 + 2 𝑥 + 1.
Ma anche quelli di grado 𝑛 :
𝑛−1 𝑛−1 𝑛
𝑥𝑘 = 𝑥 𝑘+1 − 𝑥 𝑘 = 𝑥𝑛 − 1
X X X
(𝑥 − 1) ·
𝑘=0 𝑘=0 𝑘=0
32 1 fondamenti
e, mettendo −𝑥 al posto di 𝑥 e cambiando di segno:
𝑛−1
(−1) 𝑘 𝑥 𝑘 = 1 + (−1)𝑛 𝑥 𝑛 .
X
(𝑥 + 1) ·
𝑘=0
Le potenze del binomio 𝑥 + 1 sono decisamente rilevanti. Se scriviamo il

polinomio (𝑥 + 1)𝑛 in forma canonica:
𝑛
(𝑥 + 1)𝑛 = 𝑎𝑘 𝑥 𝑘
X
𝑘=0
saremmo interessati a calcolare il valore dei coefficienti 𝑎 𝑘 . Innanzitutto gli

coefficienti binomiali diamo un nome: questi coefficienti vengono chiamati coefficienti binomiali e si
I coefficienti binomiali nell’ambito del denotano nel modo seguente:
calcolo combinatorio vengono anche
𝑛

chiamati combinazioni
e denotati con il 𝑎𝑘 = .
simbolo 𝐶 𝑛,𝑘 = 𝑛𝑘 . La coincidenza tra 𝑘
le combinazioni e i coefficienti binomiali
è espressa nel teorema 1.40.
Non è difficile convincersi che se sviluppiamo il binomio (𝑥 + 𝑦)𝑛 si ottengono
potenza del binomio gli stessi coefficienti dunque in generale vale la seguente formula per la potenza
del binomio:
𝑛
𝑛 𝑘 𝑛−𝑘
(𝑥 + 𝑦)𝑛 =
X
𝑥 𝑦 .
𝑘=0
𝑘
Per determinare il valore effettivo dei coefficienti binomiali si utilizza usualmente

il seguente.
Teorema 1.35 (triangolo di Tartaglia). Per ogni 𝑛 ∈ ℕ e 𝑘 ∈ ℕ con 1 ≤ 𝑘 ≤ 𝑛 si ha
𝑛+1 𝑛 𝑛

= +
𝑘 𝑘−1 𝑘
mentre
𝑛+1 𝑛+1

=1=
0 𝑛+1
Dimostrazione. Infatti si ha
𝑛+1 𝑛
𝑛+1 𝑛

𝑘 𝑛+1
𝑥𝑘
X X
𝑥 = (1 + 𝑥) = (1 + 𝑥) ·
𝑘=0
𝑘 𝑘=0
𝑘
𝑛 𝑛
𝑛 𝑛
𝑥𝑘 + 𝑥 𝑘+1
X X
=
𝑘=0
𝑘 𝑘=0
𝑘
𝑛 𝑛+1
𝑛 𝑛

𝑥𝑘 + 𝑥𝑘
X X
=
𝑘=0
𝑘 𝑘=1
𝑘−1
𝑛
𝑛 0 X 𝑛 𝑛 𝑛 𝑛+1

𝑘
= 𝑥 + + 𝑥 + 𝑥 .
0 𝑘=1
𝑘 𝑘−1 𝑛
1.11 coefficienti binomiali 33
𝑛
Tabella 1.5: Il triangolo di Tartaglia (o
0 1 2 3 4 5 6 𝑘 di Pascal): ogni numero è la somma dei
𝑘 due numeri che si trovano nella riga
0 1 precedente sopra e immediatamente a
1 1 1 sinistra.
2 1 2 1
3 1 3 3 1
4 1 4 6 4 1
5 1 5 10 10 5 1
6 1 6 15 20 15 6 1
.. ..
𝑛 . .
Per l’unicità della forma canonica dei polinomi i coefficienti corrispondenti

devono essere uguali e quindi troviamo
𝑛+1 𝑛 𝑛+1 𝑛 𝑛 𝑛+1 𝑛

= , = + , = .
0 0 𝑘 𝑘 𝑘−1 𝑛+1 𝑛
0
Si può facilmente verificare che 0 = 1 e questo conclude la dimostrazione.
In base al teorema precedente i coefficienti binomiali si possono elencare come

nella tabella 1.5: ogni riga inizia e finisce con il numero 1 e ogni termine
intermedio coincide con la somma dei due termini nella riga precedente sopra
e a sinistra del numero considerato.
Teorema 1.36 (formula per i coefficienti binomiali). Se 𝑛 ∈ ℕ e 𝑘 ∈ ℕ , 𝑘 ≤ 𝑛 si

ha
𝑛 𝑛!

= .
𝑘 𝑘 !(𝑛 − 𝑘)!
Dimostrazione. Lo dimostriamo per induzione su 𝑛 . Per 𝑛 = 0 sappiamo che

0
0 = 1 che è ugule a 0!0! . Utilizziamo il teorema 1.35. Se 𝑘 = 0 o 𝑘 = 𝑛 sappiamo
0!
𝑛
che 𝑘 = 1 che coincide con la formula enunciata. Per gli altri casi, supponendo
per induzione che la formula sia vera per un certo 𝑛 ∈ ℕ si ha:
𝑛+1 𝑛 𝑛 𝑛! 𝑛!

= + = +
𝑘 𝑘 𝑘−1 𝑘 !(𝑛 − 𝑘)! (𝑘 − 1)!(𝑛 − 𝑘 + 1)!
𝑛 !(𝑛 − 𝑘 + 1) + 𝑛 ! 𝑘 𝑛 !(𝑛 + 1)
= =
𝑘 !(𝑛 − 𝑘 + 1)! 𝑘 !(𝑛 + 1 − 𝑘)!
(𝑛 + 1)!
=
𝑘 !(𝑛 + 1 − 𝑘)!
Si osservi che risulta, per ogni 𝑛 ∈ ℕ :
𝑛 𝑛

= = 𝑛.
1 𝑛−1
34 1 fondamenti
Esercizio 1.37. Provare che

𝑛
𝑛
= 2𝑛 .
X
𝑘=0
𝑘
1.12 cardinalità finite
Definizione 1.38 (cardinalità finite). Definiamo 𝐼𝑛 = {𝑘 ∈ ℕ : 𝑘 < 𝑛} = {0 , 1 , 2 , . . . , 𝑛−

1}. L’insieme 𝐼𝑛 è il prototipo di insieme finito con 𝑛 elementi. Se 𝐴 è un insieme
insieme finito qualunque diremo che 𝐴 è finito se #𝐴 = #𝐼𝑛 per qualche 𝑛 ∈ ℕ ovvero se esiste un
funzione bigettiva 𝑓 : 𝐼𝑛 → 𝐴. In tal caso diremo che 𝐴 ha 𝑛 elementi e scriveremo:
#𝐴 = 𝑛 (leggi: la cardinalità di 𝐴 è 𝑛 )
insieme infinito
In caso contrario diremo che 𝐴 è infinito
Affinché la notazione #𝐴 = 𝑛 abbia senso bisogna osservare che un insieme

𝐴 può essere messo in corrispondenza biunivoca con un unico 𝐼𝑛 . Se fosse
#𝐴 = 𝑛 e #𝐴 = 𝑚 esisterebbe una funzione bigettiva tra 𝐼𝑛 e 𝐼𝑚 . Allora basterà
dimostrare il seguente.
Lemma 1.39. Se esiste una funzione iniettiva 𝑓 : 𝐼𝑛 → 𝐼𝑚 allora 𝑛 ≤ 𝑚 .
Dimostrazione. Lo si dimostra per induzione su 𝑛 . Per 𝑛 = 0 certamente

𝑚 ≥ 𝑛 in quanto 𝑚 è un numero naturale. Supponiamo di avere una funzione
iniettiva 𝑓 : 𝐼𝑛+1 → 𝐼𝑚 . Scegliamo 𝛼 = 𝑓 (𝑛) ∈ 𝐼𝑚 e consideriamo la funzione
𝑔 : 𝐼𝑚 → 𝐼𝑚 che scambia 𝛼 con 𝑚 − 1. Chiaramente 𝑔 è una bigezione e quindi
𝑓 ◦ 𝑔 : 𝐼𝑛+1 → 𝐼𝑚 e ancora iniettiva. Ma ora 𝑓 ◦ 𝑔(𝑛) = 𝑚 − 1 e quindi la
restrizione di 𝑓 ◦ 𝑔 a 𝐼𝑛 è una funzione iniettiva 𝐼𝑛 → 𝐼𝑚−1 . Per ipotesi induttiva
𝑚 − 1 ≥ 𝑛 e quindi 𝑚 ≥ 𝑛 + 1.
Il precedente lemma ci dice in particolare che ℕ è un esempio di insieme infinito.

Se infatti fosse #ℕ ≤ 𝐼𝑛 per qualche 𝑛 ∈ ℕ si avrebbe #𝐼𝑛+1 ≤ #ℕ ≤ #𝐼𝑛 che,
utilizzando il teorema 1.4, è in contraddizione con il lemma.
Lasciamo al lettore il piacere di dimostrare (utilizzando il principio di induzione)

le seguenti proprietà.
Teorema 1.40 (operazioni con le cardinalità finite). Se 𝐴 e 𝐵 sono insiemi disgiunti

e finiti allora
#(𝐴 ∪ 𝐵) = #𝐴 + #𝐵.
Se 𝐴 e 𝐵 sono insiemi finiti allora (ricordiamo che 𝐵 𝐴 è l’insieme delle funzioni 𝐴 → 𝐵)
#(𝐴 × 𝐵) = #𝐴 · #𝐵, #(𝐵 𝐴 ) = #𝐵#𝐴 , #P(𝐴) = 2#𝐴 ,

# 𝑓 ∈ 𝐴𝐴 : 𝑓 bigettiva = (#𝐴)! ,

#𝐴

#{𝑋 ∈ P(𝐴) : #𝑋 = 𝑘}. = .
𝑘
1.13 estremo superiore 35
1.13 estremo superiore
Riprendiamo ora la trattazione dell’insieme ℝ dei numeri reali. Vediamo ora

quali sono le conseguenze della continuità dell’ordinamento di ℝ, proprietà che
finora non abbiamo mai utilizzato.
Definizione 1.41. Sia 𝐴 ⊆ ℝ. Se 𝐴 ha un maggiorante (cioè esiste 𝑥 ∈ ℝ tale che

𝑥 ≥ 𝐴, definizione 1.14) diremo che 𝐴 è superiormente limitato, se 𝐴 ammette un
minorante diremo che 𝐴 è inferiormente limitato, se 𝐴 ammette sia maggiorante che
minorante diremo che 𝐴 è limitato. limitato
Se 𝑥 è minimo dei maggioranti di 𝐴 diremo che 𝑥 è estremo superiore di 𝐴 se invece estremo superiore
𝑥 è massimo dei minoranti diremo che 𝑥 è estremo inferiore di 𝐴:
estremo inferiore
sup 𝐴 = min {𝑥 ∈ ℝ : 𝑥 ≥ 𝐴},
inf 𝐴 = max {𝑥 ∈ ℝ : 𝑥 ≤ 𝐴}.
Osserviamo che se l’insieme 𝐴 è finito e non vuoto, il massimo e il minimo

esistono sempre. Se, ad esempio, non esistesse il massimo di 𝐴 significa che
scelto 𝑥 𝑘 ∈ 𝐴 esisterebbe sempre 𝑥 𝑘+1 ∈ 𝐴 con 𝑥 𝑘+1 > 𝑥 𝑘 e quindi l’insieme
𝐴 dovrebbe contenere infiniti punti 𝑥 0 , 𝑥1 , . . . , 𝑥 𝑘 , . . . Insiemi infiniti, invece,
potrebbero non avere massimo/minimo. Un esempio di insieme che non ha né
massimo né minimo è l’insieme 𝐴 = {𝑥 ∈ ℝ : 0 < 𝑥 < 1} infatti per ogni 𝑥 ∈ 𝐴
si ha 𝑥2 < 𝑥 , 1+𝑥 𝑥
2 > 𝑥 con 2 ∈ 𝐴 e 2 ∈ 𝐴, dunque nessun 𝑥 ∈ 𝐴 può essere
1+𝑥
massimo o minimo. L’insieme 𝐵 = {𝑥 ∈ ℝ : 0 ≤ 𝑥 ≤ 1} ha invece massimo

max 𝐵 = 1 e minimo min 𝐵 = 0.
Teorema 1.42 (esistenza del sup). Se 𝐴 è un insieme non vuoto, superiormente

limitato, allora esiste l’estremo superiore di 𝐴. Tale numero 𝑥 = sup 𝐴 è caratterizzato
dalle seguenti proprietà
1. ∀𝑎 ∈ 𝐴 : 𝑥 ≥ 𝑎 ;
2. ∀𝜀 > 0 : ∃𝑎 ∈ 𝐴 : 𝑥 < 𝑎 + 𝜀.
Risultato analogo vale per l’estremo inferiore.
Dimostrazione. Consideriamo l’insieme dei maggioranti
𝐵 = {𝑏 ∈ ℝ : 𝑏 ≥ 𝐴}.
Per ipotesi 𝐵 è non vuoto e per come è definito risulta 𝐴 ≤ 𝐵. Dunque

dall’assioma di continuità deduciamo l’esistenza di un numero 𝑥 ∈ ℝ tale che
𝐴 ≤ 𝑥 ≤ 𝐵. La prima disuguaglianza 𝐴 ≤ 𝑥 ci dice che 𝑥 è un maggiorante
e quindi 𝑥 ∈ 𝐵, la seconda 𝑥 ≤ 𝐵 ci dice che 𝑥 è il minimo di 𝐵 e quindi
concludiamo che 𝑥 è l’estremo superiore di 𝐴.
La prima delle due proprietà caratterizzanti il sup traduce la condizione che 𝑥

sia un maggiorante di 𝐴. La seconda delle due proprietà esprime il fatto che 𝑥
sia il minimo dei maggioranti, infatti se 𝑥 è il minimo dei maggioranti significa
36 1 fondamenti
che nessun numero minore di 𝑥 è un maggiorante, ovvero che ogni 𝑥 − 𝜀 con

𝜀 > 0 non è un maggiorante, ovvero che esiste 𝑎 ∈ 𝐴 tale che 𝑎 > 𝑥 − 𝜀.
La precedente dimostrazione è l’unica in cui utilizzeremo l’assioma di continuità

dei numeri reali. D’ora in poi non utilizzeremo più tale assioma ma useremo
invece gli operatori: sup e inf. In effetti è molto semplice verificare che l’esistenza
del sup è una condizione equivalente all’assioma di continuità (basta osservare
che se 𝐴 ≤ 𝐵 allora sup 𝐴 è un elemento di separazione).
Il seguente risultato ci dice, informalmente, che non esistono quantità infinite

(ma neanche infinitesime) in ℝ.
proprietà archimedea
Teorema 1.43 (proprietà archimedea dei numeri reali). Dati 𝑥, 𝑦 ∈ ℝ con

𝑥, 𝑦 > 0 esiste 𝑛 ∈ ℕ tale che 𝑛 𝑦 > 𝑥 .
A parole: per quanto piccolo possa essere 𝑦 > 0, sommandolo a se stesso molte volte si
arriva, dopo un numero finito di passi, a superare qualunque numero 𝑥 anche molto
grande.
Dimostrazione. Fissati 𝑥, 𝑦 ∈ ℝ, 𝑥 > 0, 𝑦 > 0 consideriamo l’insieme
𝐴 = ℕ 𝑦 = {𝑛 𝑦 : 𝑛 ∈ ℕ }.
Basta dimostrare che 𝐴 non è superiormente limitato perché in tal caso dato
𝑥 ∈ ℝ esisterebbe 𝑛 ∈ ℕ per cui 𝑛 𝑦 > 𝑥 ed entrambe le affermazioni del teorema
sarebbero vere (la prima prendendo 𝑦 = 1 e la seconda prendendo 𝑥 = 1).
Chiaramente 𝐴 non è vuoto in quanto 0 ∈ 𝐴 dunque se 𝐴 per assurdo fosse

superiormente limitato esisterebbe 𝑚 = sup 𝐴, 𝑚 ∈ ℝ. Siccome 𝑚 è il minimo
dei maggioranti di 𝐴 e 𝑚 − 𝑦 è più piccolo di 𝑚 , allora 𝑚 − 𝑦 non è un
maggiorante. Dunque deve esistere 𝑛 ∈ ℕ tale che 𝑛 𝑦 > 𝑚 − 𝑦 . Ma allora
(𝑛 + 1)𝑦 = 𝑛 𝑦 + 𝑦 > 𝑚 ed essendo 𝑛 + 1 ∈ ℕ troviamo che 𝑚 non poteva essere
un maggiorante di 𝐴: assurdo.
Teorema 1.44 (principio del buon ordinamento). Sia 𝐴 ⊆ ℕ , 𝐴 ≠ ∅. Allora 𝐴 ha

minimo.
Dimostrazione. Osserviamo che se 𝑛 ∈ ℕ è un minorante di 𝐴 ⊆ ℕ allora o

𝑛 ∈ 𝐴 e quindi 𝑛 è il minimo di 𝐴 oppure anche 𝑛 + 1 è un minorante di 𝐴 in
quanto non ci sono numeri interi compresi tra 𝑛 e 𝑛 + 1.
Dunque se 𝐴 non avesse minimo, per il principio di induzione ogni 𝑛 ∈ ℕ

sarebbe un minorante di 𝐴. In tal caso 𝐴 dovrebbe essere vuoto perché se 𝑎 ∈ 𝐴
certamente 𝑎 + 1 non è un minorante di 𝐴.
Teorema 1.45 (parte intera). Dato 𝑥 ∈ ℝ esiste un unico 𝑚 ∈ ℤ tale che 𝑚 − 1 <
𝑥 ≤ 𝑚.
1.14 l’insieme dei numeri razionali 37
Dimostrazione. Supponiamo per un attimo che sia 𝑥 > 0 e consideriamo l’insie-

me 𝐴 = {𝑛 ∈ ℕ : 𝑛 ≥ 𝑥}. Tale insieme non è vuoto per la proprietà archimedea e
dunque ammette minimo per il principio del buon ordinamento. Se 𝑚 = min 𝐴
risulta quindi 𝑚 ∈ ℕ e 𝑚 − 1 < 𝑥 ≤ 𝑚 .
Se 𝑥 ≤ 0 per la proprietà archimedea esiste 𝑘 ∈ ℕ tale che 𝑘 > −𝑥 . Allora

applichiamo il risultato precedente a 𝑥 + 𝑘 e consideriamo 𝑚 − 𝑘 al posto di
𝑚.
parte intera
Definizione 1.46 (parte intera). Dato 𝑥 ∈ ℝ denotiamo con b𝑥c l’unico intero che
soddisfa b·c
𝑥 − 1 < b𝑥c ≤ 𝑥
e denotiamo con d𝑥e = −b−𝑥c l’unico intero che soddisfa (verificare!) d·e
𝑥 ≤ d𝑥e < 𝑥 + 1.
Si ha dunque
b𝑥c ≤ 𝑥 ≤ d𝑥e
con entrambe le uguaglianze che si realizzano quando 𝑥 ∈ ℤ. I due interi b𝑥c e d𝑥e
sono la migliore approssimazione intera di 𝑥 rispettivamente per difetto e per eccesso.
L’intero più vicino ad 𝑥 (approssimazione per arrotondamento) è arrotondamento
Il numero 12 verrà definito nella pros-

1 1 sima sezione sui numeri razionali, lo
𝑥+ ossia 𝑥− anticipiamo per comodità.
2 2
(le due espressioni differiscono solamente quando 𝑥 si trova nel punto medio tra due
interi consecutivi, nel qual caso la prima approssima per eccesso e la seconda per difetto).
In alcuni testi si usa la notazione [𝑥] per denotare la parte intera b𝑥c e si definisce
anche la parte frazionaria
{𝑥} = 𝑥 − [𝑥].
Per evitare ambiguità con il normale utilizzo delle parentesi non useremo queste
notazioni.
1.14 l’insieme dei numeri razionali
Teorema 1.47 (divisibilità dei numeri reali). Dato 𝑥 ∈ ℝ e dato 𝑛 ∈ ℕ , 𝑛 ≠ 0

esiste un unico 𝑦 ∈ ℝ tale che 𝑛 𝑦 = 𝑥 . Scriveremo in tal caso 𝑦 = 𝑛𝑥 o 𝑦 = 𝑥/𝑛 .
Dimostrazione. Preliminarmente vogliamo dimostrare che preso qualunque

𝑛 ∈ ℕ con 𝑛 > 0 vale la proprietà di esistenza di numeri piccoli:
∀𝜀 > 0 ∃𝛿 > 0 : 𝑛𝛿 < 𝜀. (1.9)
E’ facile dimostrare che
∀𝜀 > 0 ∃𝛼 > 0 : 2 𝛼 ≤ 𝜀
38 1 fondamenti
infatti dato 𝜀 > 0 sappiamo, per la proprietà di densità dei numeri reali, che
esiste 𝑥 ∈ ℝ tale che 0 < 𝑥 < 𝜀. Ma allora se 2 𝑥 ≤ 𝜀 basta scegliere 𝛼 = 𝑥 se
invece 2 𝑥 > 𝜀 si sceglie 𝛼 = 𝜀 − 𝑥 così da avere comunque
2 𝛼 = 2 𝜀 − 2 𝑥 < 2 𝜀 − 𝜀 = 𝜀.
Ma allora (1.9) può essere dimostrata per induzione. Per 𝑛 = 1 non è altro che
la proprietà di densità (se 0 < 𝜀 esiste 𝛿 tale che 0 < 𝛿 < 𝜀). Supponendo la
proprietà vera per un certo 𝑛 ≥ 1 sappiamo esistere 𝛿 > 0 tale che 𝑛𝛿 < 𝜀 ma
anche 𝛼 > 0 tale che 2 𝛼 ≤ 𝛿 . Allora
(𝑛 + 1)𝛼 ≤ (𝑛 + 𝑛)𝛼 = 2𝑛𝛼 ≤ 𝑛𝛿 < 𝜀
e dunque la proprietà (1.9) è verificata per ogni 𝑛 ∈ ℕ .
Passiamo ora alla dimostrazione del teorema. Senza perdita di generalità

possiamo supporre che sia 𝑥 > 0 in quanto 𝑥 = 0 è banale e se 𝑥 < 0 basta
considerare −𝑥 al posto di 𝑥 . Dato 𝑛 ∈ ℕ , 𝑛 ≠ 0, dobbiamo risolvere l’equazione
𝑛 𝑦 = 𝑥 per trovare 𝑦 . Consideriamo l’insieme
𝐴 = {𝑎 ∈ ℝ : 𝑎 ≥ 0, 𝑛𝑎 ≤ 𝑥}.
Chiaramente 𝐴 non è vuoto in quanto 0 ∈ 𝐴. Inoltre se 𝑎 > 𝑥 si ha 𝑛𝑎 > 𝑛𝑥 ≥ 𝑥 e

dunque 𝑎 ∉ 𝐴. Significa che 𝑥 è un maggiorante di 𝐴 e quindi 𝐴 è superiormente
limitato. Scegliamo allora
𝑦 = sup 𝐴.
Dobbiamo mostrare che 𝑛 𝑦 = 𝑥 . Se fosse 𝑛 𝑦 < 𝑥 posto 𝜀 = 𝑥 − 𝑛 𝑦 avremmo
𝜀 > 0 e per (1.9) sappiamo che dovrà esistere 𝛿 > 0 per cui 𝑛𝛿 < 𝜀 da cui:
𝑛(𝑦 + 𝛿) = 𝑛 𝑦 + 𝑛𝛿 < 𝑛 𝑦 + 𝜀 = 𝑥.
Dunque si avrebbe 𝑦 + 𝛿 ∈ 𝐴 da cui si conclude che 𝑦 non può essere un

maggiorante di 𝐴. Se invece fosse 𝑛 𝑦 > 𝑥 posto 𝜀 = 𝑛 𝑦 − 𝑥 prendiamo anche
in questo caso un 𝛿 > 0 con 𝑛𝛿 < 𝜀. Allora 𝑦 − 𝛿 sarebbe un maggiorante di 𝐴
perché preso qualunque 𝑎 > 𝑦 − 𝛿 si avrebbe
𝑛𝑎 > 𝑛 𝑦 − 𝑛𝛿 > 𝑛 𝑦 − 𝜀 = 𝑥
e dunque non ci può essere 𝑎 ∈ 𝐴 con 𝑎 > 𝑦 − 𝛿 . Ma se 𝑦 − 𝛿 è un maggiorante

𝑦 non può essere il minimo dei maggioranti: assurdo.
Significa quindi che 𝑛 𝑦 = 𝜀, come volevamo dimostrare.
Rimane da verificare che c’è un unico 𝑦 con tale proprietà. Ma se avessimo due
soluzioni: 𝑛 𝑦1 = 𝜀 e 𝑛 𝑦2 = 𝜀 facendo la differenza si ottiene 𝑛(𝑦1 − 𝑦2 ) = 0 da
cui (essendo 𝑛 > 1) si ottiene 𝑦1 − 𝑦2 = 0 cioè 𝑦1 = 𝑦2 .
numeri razionali
Grazie al teorema precedente possiamo definire i numeri razionali:
𝑝

ℤ
ℚ= = : 𝑝 ∈ ℤ, 𝑞 ∈ ℕ , 𝑞 ≠ 0 .
ℕ \ {0} 𝑞
1.15 valore assoluto 39
Le seguenti proprietà discendono immediatamente dalle proprietà già dimo-

strare per i numeri interi:
𝑝 0 𝑝 𝑠 𝑝+𝑠 𝑝 𝑛𝑝
= 𝑝, = 0, + = , 𝑛 = .
1 𝑞 𝑞 𝑞 𝑞 𝑞 𝑞
densità di ℚ
Teorema 1.48 (densità di ℚ in ℝ). Dati 𝑥, 𝑦 ∈ ℝ con 𝑥 < 𝑦 esiste 𝑞 ∈ ℚ tale che
𝑥 < 𝑞 < 𝑦.
Dimostrazione. Per la proprietà archimedea dei numeri reali essendo 𝑦 − 𝑥 > 0

deve esistere 𝑛 ∈ ℕ tale che 𝑦 − 𝑥 > 1/𝑛 così si avrà
𝑛𝑥 + 1 < 𝑛 𝑦.
Prendiamo allora 𝑚 = b𝑛𝑥 + 1c cosicché si abbia
𝑛𝑥 < 𝑚 ≤ 𝑛𝑥 + 1.
Mettendo insieme le due disuguaglianze e dividendo per n si ottiene, come

volevamo dimostrare,
𝑚
𝑥< < 𝑦.
𝑛
1.15 valore assoluto

valore assoluto
Definizione 1.49 (valore assoluto). Definiamo il valore assoluto |𝑥| di un numero
𝑥 ∈ ℝ nel seguente modo (
𝑥 se 𝑥 ≥ 0 ,
|𝑥| =
−𝑥 se 𝑥 < 0.
Proposizione 1.50 (proprietà del valore assoluto). Si ha
1. |𝑥| ≥ 0 (positività)
2. |𝑥| = |𝑥| (idempotenza)
3. |−𝑥| = |𝑥| (simmetria)
4. |𝑥 + 𝑦| ≤ |𝑥| + |𝑦| (convessità)
5. − 𝑦| ≤ |𝑥 − 𝑧| + |𝑧 − 𝑦| (disuguaglianza triangolare)
|𝑥
6. |𝑥| − |𝑦| ≤ |𝑥 − 𝑦| (disuguaglianza triangolare inversa)
Useremo inoltre spesso la seguente equivalenza (valida anche con < al posto di ≤ ). Se
𝑟 ≥ 0 allora
|𝑥 − 𝑦| ≤ 𝑟 ⇐⇒ 𝑦 − 𝑟 ≤ 𝑥 ≤ 𝑦 + 𝑟.
Dimostrazione. Le prime quattro proprietà sono immediate conseguenze della

definizione.
Dimostriamo innanzitutto l’ultima osservazione. Se 𝑥 ≥ 𝑦 allora 𝑥 − 𝑦 ≥ 0 e

quindi |𝑥 − 𝑦| ≤ 𝑟 è equivalente a 𝑥 − 𝑦 ≤ 𝑟 cioè 𝑥 ≤ 𝑦 + 𝑟 . Se 𝑥 < 𝑦 allora
40 1 fondamenti
𝑥 − 𝑦 < 0 e quindi |𝑥 − 𝑦| ≤ 𝑟 è equivalente a 𝑦 − 𝑥 ≤ 𝑟 cioè 𝑥 ≥ 𝑦 − 𝑟 . Viceversa

se 𝑦 − 𝑟 ≤ 𝑥 ≤ 𝑦 + 𝑟 allora vale sia 𝑥 − 𝑦 ≤ 𝑟 che 𝑦 − 𝑥 ≤ 𝑟 e dunque |𝑥 − 𝑦| ≤ 𝑟 .
Osserviamo allora che per la precedente osservazione applicata a |𝑥 − 0 | ≤ |𝑥|

si ottiene
−|𝑥| ≤ 𝑥 ≤ |𝑥|
e sommando la stessa disuguaglianza con 𝑦 al posto di 𝑥 si ottiene
−(|𝑥| + |𝑦|) ≤ 𝑥 + 𝑦 ≤ |𝑥| + |𝑦|
che è equivalente alla proprietà di convessità:
|𝑥 + 𝑦| ≤ |𝑥| + |𝑦| = |𝑥| + |𝑦|.

Ponendo 𝑦 = 𝑧 − 𝑥 nella disuguaglianza precedente, si ottiene
|𝑧| ≤ |𝑥| + |𝑧 − 𝑥|
da cui
|𝑧| − |𝑥| ≤ |𝑧 − 𝑥|.
Scambiando 𝑧 con 𝑥 si ottiene la disuguaglianza opposta e mettendole assieme
si ottiene la disuguaglianza triangolare inversa:
|𝑧| − |𝑥| ≤ |𝑧 − 𝑥|.

La disuguaglianza triangolare segue dalla convessità:
|𝑥 − 𝑦| = |𝑥 − 𝑧 + 𝑧 − 𝑦| ≤ |𝑥 − 𝑧| + |𝑧 − 𝑦|.
Osserviamo che dal punto di vista geometrico |𝑥 − 𝑦| rappresenta la distanza

tra i punti 𝑥 e 𝑦 sulla retta reale.
1.16 numeri decimali
Le frazioni il cui denominatore è una potenza di 10 si chiamano frazioni

decimali:
𝑝
𝑥 = 𝑑, 𝑝 ∈ ℤ, 𝑑 ∈ ℕ .
10
in Italia si preferisce utilizzare la virgola,
Tali frazioni si possono rappresentare scrivendo il numero intero 𝑝 e segnando
ma ci rassegnamo alla notazione anglo- un puntodi separazione prima della 𝑑 -esima cifra a partire da destra. Ad
sassone che ormai è ubiqua in tutta la esempio scriveremo:
strumentazione elettronica. 14142
1.4142 = .
104
𝑝
In generale una frazione 𝑞 ∈ ℚ può essere scritta in forma decimale solamente
se, quando ridotta ai minimi termini, risulta che 𝑞 non ha fattori primi diversi
da 2 e 5 (in quanto le potenze di dieci hanno solo questi fattori). In ogni caso le
1.17 isomorfismi di gruppi ordinati 41
frazioni decimali sono dense in ℝ in quanto dato 𝑥 ∈ ℝ per ogni 𝜀 > 0 esiste
𝑑 ∈ ℕ tale che 10−𝑑 ≤ 𝜀 e quindi posto 𝑝 = b10𝑑 · 𝑥 + 12 c si avrà
𝑝
1

𝑑 − 𝑥 ≤ < 𝜀.

10 2 · 10𝑑
In tal caso scriveremo ≈
𝑝
𝑥≈ .
10𝑑
Ad esempio scriveremo
2 6667
≈ 0.6667 =
3 104
per intendere Si osservi che in base alla definizio-
2 6667 ne data sarebbe anche corretto scrivere
− < 1 . (1.10) 3 ≈ 0.6666 che però sarebbe una appros-
2
3 104 104 simazione peggiore. Questa ambiguità è
Nel calcolo scientifico ogni uguaglianza numerica è intesa nel senso precedente, necessaria se vogliamo evitare i casi limi-
te in cui bisogna conoscere molte più ci-
se non specificato diversamente. fre decimali di quelle richieste per capire
qual è la migliore approssimazione.
Le frazioni non decimali si possono scrivere con uno sviluppo decimale periodico.
Non useremo mai questa notazione che ricordiamo solamente con un esempio.
Il numero
𝑥 = 12.34567 = 12.34567567
è la frazione che risolve l’equazione
100 𝑥 − 1234 0.567

= 100 𝑥 − 1234.567 = 0.000567
1000 1000
ovvero
1234567 − 1234
1234567 − 1234 = 99900 · 𝑥, 𝑥= .
99900
Esercizio 1.51. Dimostrare che vale (1.10).
1.17 isomorfismi di gruppi ordinati

funzioni monotòne
Definizione 1.52 (funzioni monotòne). Una funzione 𝑓 : 𝐴 → 𝐵 con 𝐴, 𝐵 insiemi

ordinati, si dice essere
crescente
1. crescente se 𝑥 ≤ 𝑦 =⇒ 𝑓 (𝑥) ≤ 𝑓 (𝑦);
decrescente
2. decrescente se 𝑥 ≤ 𝑦 =⇒ 𝑓 (𝑥) ≥ 𝑓 (𝑦);
3. monotòna se crescente o decrescente; monotòna
4. costante se crescente e decrescente; costante
5. strettamente crescente se 𝑥 < 𝑦 =⇒ 𝑓 (𝑥) < 𝑓 (𝑦);
strettamente crescente
6. strettamente decrescente se 𝑥 < 𝑦 =⇒ 𝑓 (𝑥) > 𝑓 (𝑦);
7. strettamente monotòna se strettamente crescente o strettamente decrescente. strettamente decrescente
strettamente monotòna
Si osservi che se 𝑓 : 𝐴 → ℝ è costante allora esiste 𝑐 tale che 𝑓 (𝑥) = 𝑐 per
ogni 𝑥 ∈ 𝐴. Si osservi anche che ogni funzione strettamente monotona è
anche iniettiva. Si osservi infine (fare un esempio!) che esistono funzioni che
42 1 fondamenti
non rientrano in nessuna delle categorie sopra elencate (cioè che non sono né
crescenti né decrescenti).
Si faccia attenzione alla terminologia. In alcuni testi (in particolare nei testi
anglosassoni) si utilizza il termine crescente con il significato di strettamente
crescente e si usa la dizione non decrescente o debolmente crescente per indicare il
concetto che noi abbiamo definito con crescente. In effetti con le nostre definizioni
una funzione crescente può essere costante e quindi non crescere affatto!
funzione additiva
Definizione 1.53 (funzione additiva). Sia 𝐺 un gruppo rispetto ad una operazione
𝐺 𝐻
∗ e sia 𝐻 un gruppo rispetto alla operazione ∗ . Una funzione 𝑓 : 𝐺 → 𝐻 si dice essere
un omomorfismo se per ogni 𝑥, 𝑦 ∈ 𝐺 si ha
omomorfismo
𝐺 𝐻
𝑓 (𝑥 ∗ 𝑦) = 𝑓 (𝑥) ∗ 𝑓 (𝑦).
𝐺 𝐻
Nel caso in cui le operazioni ∗ e ∗ siano denotate entrambe con il simbolo + diremo
equivalentemente che 𝑓 è additiva in quanto soddisfa la proprietà:
𝑓 (𝑥 + 𝑦) = 𝑓 (𝑥) + 𝑓 (𝑦).
Ricordiamo che abbiamo definito ℝ come un gruppo additivo, totalmente

ordinato, denso e continuo. Dato 𝑥 ∈ ℝ e 𝑛 ∈ ℕ abbiamo definito 𝑛𝑥 (somma
ripetuta) e se 𝑛 ≠ 0 abbiamo definito 𝑛𝑥 in modo che 𝑛 𝑛𝑥 = 𝑥 . Lo stesso si può
fare quindi su qualunque altro gruppo additivo, totalmente ordinato, denso e
continuo, visto che non abbiamo assunto nessuna altra ipotesi su ℝ. Il teorema
seguente ci dice che queste proprietà identificano univocamente l’insieme ℝ in
quanto dati due gruppi 𝑅 e 𝑆 con queste proprietà c’è tra di essi un isomorfismo
cioè una bigezione che mantiene sia l’operazione di gruppo, sia l’ordinamento.
Teorema 1.54 (isomorfismi di gruppi ordinati). Siano 𝑅 e 𝑆 due gruppi totalmente

ordinati, densi e continui. Scelto 𝑢 ∈ 𝑅 , 𝑢 > 0 e 𝑚 ∈ 𝑆 esiste una unica funzione
𝑓 : 𝑅 → 𝑆 che sia un omomorfismo monotono tale che 𝑓 (𝑢) = 𝑚 .
Inoltre se 𝑚 > 0 la funzione 𝑓 è strettamente crescente, se 𝑚 = 0 la funzione è costante
nulla, se 𝑚 < 0 la funzione è strettamente decrescente. Se 𝑚 ≠ 0 la funzione è anche
suriettiva ed è quindi bigettiva.
Infine 𝑓 è anche l’unica funzione monotona tale che se 𝑝 ∈ ℤ, 𝑞 ∈ ℕ \ {0} si ha
𝑝𝑢 𝑝𝑚

𝑓 = .
𝑞 𝑞
Dimostrazione. Supponiamo che l’operazione di entrambi i gruppi 𝑅 e 𝑆 sia

denotata con il simbolo +. Dunque la condizione di omomorfismo non è altro
che l’additività 𝑓 (𝑥 + 𝑦) = 𝑓 (𝑥) + 𝑓 (𝑦). Inoltre 𝑅 e 𝑆 hanno tutte le proprietà
che abbiamo già dimostrato per l’insieme ℝ dei numeri reali. In particolare
abbiamo definita la moltiplicazione 𝑛 · 𝑥 con 𝑛 ∈ ℤ e la divisione 𝑥/𝑛 con 𝑛 ∈ ℕ ,
𝑛 ≠ 0.
Sia 𝑓 : 𝑅 → 𝑆 un omomorfismo monotono tale che 𝑓 (𝑢) = 𝑚 . Allora neces-
sariamente 𝑓 (0) = 𝑓 (0 + 0) = 𝑓 (0) + 𝑓 (0) da cui 𝑓 (0) = 0. Inoltre se 𝑛 ∈ ℕ e
𝑥 ∈ 𝑅 si avrà 𝑓 (𝑛𝑥) = 𝑛 𝑓 (𝑥) (lo si dimostra per induzione: se 𝑓 (𝑛𝑥) = 𝑛 𝑓 (𝑥)

sommando 𝑓 (𝑥) ad ambo i membri ed utilizzando l’additività si ottiene
𝑓 ((𝑛 + 1)𝑥) = (𝑛 + 1) 𝑓 (𝑥)). Ma allora 𝑛 𝑓 (𝑥/𝑛) = 𝑓 (𝑥) da cui 𝑓 (𝑥/𝑛) = 𝑓 (𝑥)/𝑛 .
Osserviamo che 𝑓 (−𝑥) = − 𝑓 (𝑥) in quanto 𝑓 (𝑥) + 𝑓 (−𝑥) = 𝑓 (𝑥 − 𝑥) = 0 e dunque
la condizione 𝑓 (𝑛𝑥) = 𝑛 𝑓 (𝑥) vale per ogni 𝑛 ∈ ℤ. E dunque per ogni 𝑝 ∈ ℤ e
ogni 𝑞 ∈ ℕ \ {0} si deve avere 𝑓 (𝑝 · 𝑥/𝑞) = 𝑝 · 𝑓 (𝑥)/𝑞 . In particolare per 𝑥 = 𝑢
dobbiamo avere 𝑓 (𝑥) = 𝑚 e quindi
𝑢 𝑚

𝑓 𝑝· =𝑝· . (1.11)
𝑞 𝑞
Per fissare le idee supponiamo ora che sia 𝑚 > 0, in tal caso 𝑓 dovrà essere
monotona crescente in quanto 𝑢 > 0 e 𝑓 (𝑢) = 𝑚 > 0. Per ogni 𝑥 ∈ 𝑅
consideriamo l’insieme
𝑚 𝑢

𝐴 𝑥 = 𝑝 · : 𝑝 ≤ 𝑥, 𝑝 ∈ ℤ , 𝑞 ∈ ℕ \ {0} .
𝑞 𝑞
Dato 𝑥 ∈ 𝑅 e dato 𝑞 ∈ ℕ \ {0} scegliamo 𝑝 ∈ ℤ tale che 𝑝𝑢/𝑞 ≤ 𝑥 ≤ (𝑝 + 1)𝑢/𝑞 .

Per la monotonia di 𝑓 e grazie alla (1.11) si dovrà avere 𝑝𝑚/𝑞 ≤ 𝑓 (𝑥) ≤ (𝑝+1)𝑚/𝑞 .
Ma vale anche
𝑚 𝑚
𝑝 ≤ sup 𝐴 𝑥 ≤ (𝑝 + 1) (1.12)
𝑞 𝑞
in quanto da un lato 𝑝𝑚/𝑞 ∈ 𝐴 𝑥 e dall’altro (𝑝+1)𝑚/𝑞 è un maggiorante di 𝐴 𝑥 (in
quanto se 𝑝 0 𝑢/𝑞 0 ≤ 𝑥 allora 𝑝 0 𝑢/𝑞 0 ≤ (𝑝 + 1)𝑢/𝑞 e quindi 𝑝 0 𝑚/𝑞 ≤ (𝑝 + 1)𝑚/𝑞 ).
Dunque si ha
𝑚
| 𝑓 (𝑥) − sup 𝐴 𝑥 | ≤ .
𝑞
Posto 𝜀 = | 𝑓 (𝑥) − sup 𝐴 𝑥 | se fosse 𝜀 > 0, per la proprietà archimedea valida
in 𝑆 , potremmo trovare 𝑞 tale che 𝑞𝜀 > 𝑚 e avremmo quindi un assurdo.
Concludiamo quindi che deve necessariamente essere 𝑓 (𝑥) = sup 𝐴 𝑥 e dunque
𝑓 , se esiste, è unica.
Rimane da verificare che la funzione 𝑓 (𝑥) = sup 𝐴 𝑥 è effettivamente additiva

e monotona. Innanzitutto è facile verificare che se 𝑥 = 𝑝𝑢/𝑞 con 𝑝 ∈ ℤ e
𝑞 ∈ ℕ \ {0} si ha 𝑓 (𝑥) = 𝑝𝑚/𝑞 . Infatti ovviamente 𝑝𝑚/𝑞 ∈ 𝐴 𝑥 ed è facile
verificare che 𝑝𝑚/𝑞 è anche un maggiorante di 𝐴 𝑥 dunque in questo caso
𝑝𝑚/𝑞 = max 𝐴 𝑥 = 𝑓 (𝑥). Mostriamo ora che 𝑓 è additiva e strettamente
crescente. Dati 𝑥, 𝑦 ∈ 𝑅 e dato 𝑞 ∈ ℕ \ {0} prendiamo 𝑝, 𝑟 ∈ ℤ tali che
𝑝𝑢/𝑞 ≤ 𝑥 ≤ (𝑝 + 1)𝑢/𝑞 e 𝑟𝑢/𝑞 ≤ 𝑦 ≤ (𝑟 + 1)𝑢/𝑞 . Sommando le disuguaglianze
si avrà inoltre (𝑝 + 𝑟)𝑢/𝑞 ≤ 𝑥 + 𝑦 ≤ (𝑝 + 𝑟 + 2)𝑢/𝑞 . La proprietà (1.12) ci dice
che valgono le seguenti disuguaglianze
𝑚 𝑚 𝑚 𝑚
𝑝· ≤ 𝑓 (𝑥) ≤ (𝑝 + 1) · , 𝑟· ≤ 𝑓 (𝑦) ≤ (𝑟 + 1) ·
𝑞 𝑞 𝑞 𝑞
𝑚 𝑚
(𝑝 + 𝑟) · ≤ 𝑓 (𝑥 + 𝑦) ≤ (𝑝 + 𝑟 + 2) ·
𝑞 𝑞
da cui
𝑚
| 𝑓 (𝑥) + 𝑓 (𝑦) − 𝑓 (𝑥 + 𝑦)| ≤ 2 .
𝑞
44 1 fondamenti
Siccome 𝑞 è arbitrario deduciamo (sempre per la proprietà archimedea di 𝑆 )

che la quantità a primo membro è nulla e dunque 𝑓 è effettivamente additiva.
Similmente se 𝑥 < 𝑦 possiamo scegliere 𝑞 in modo che sia 2/𝑞 < 𝑦 − 𝑥 e,
scegliendo 𝑝, 𝑟 come prima, si ottiene
𝑚 𝑚
𝑓 (𝑥) ≤ (𝑝 + 1) < 𝑟 ≤ 𝑓 (𝑦)
𝑞 𝑞
da cui 𝑓 è strettamente crescente. La dimostrazione, quando 𝑚 > 0, è conclusa.
Se 𝑚 < 0 basta cambiare segno ad 𝑚 e alla funzione 𝑓 .
Se 𝑚 = 0 è facile mostrare che 𝑓 (𝑝𝑢) = 0 per ogni 𝑝 ∈ ℤ e quindi se 𝑝 ≤ 𝑥 ≤ 𝑝 + 1

si trova che 𝑓 (𝑥), per monotonia, non può che essere 0. Dunque la funzione
identicamente nulla è l’unica possibile soluzione.
Infine dobbiamo mostrare che se 𝑚 ≠ 0 la funzione 𝑓 : 𝑅 → 𝑆 è bigettiva.

Sappiamo già che 𝑓 è iniettiva in quanto strettamente monotona se 𝑚 ≠ 0.
Applicando quanto dimostrato finora con 𝑅 ed 𝑆 scambiati sappiamo che esiste
𝑔 : 𝑆 → 𝑅 anch’essa iniettiva. Ora se consideriamo 𝑇 = 𝑓 (𝑅) ⊆ 𝑆 osserviamo
che 𝑓 : 𝑅 → 𝑇 è bigettiva e preserva la struttura di gruppo e l’ordinamento.
Anche la sua inversa 𝑓 −1 : 𝑇 → 𝑅 ha le stesse proprietà così come ce le ha la
restrizione di 𝑔 a 𝑇 . Ma per l’unicità che abbiamo appena dimostrato l’inversa
di 𝑓 e la restrizione di 𝑔 dovranno coincidere. Significa allora che 𝑔(𝑇) = 𝑅 ed
essendo 𝑔 iniettiva dobbiamo quindi concludere che 𝑇 = 𝑆 .
Come conseguenza immediata otteniamo il seguente corollario il quale garanti-

sce che gli assiomi con cui abbiamo definito ℝ lo identificano univocamente a
meno di isomorfismi.
Corollario 1.55 (unicità di ℝ). Sia 𝑆 un gruppo additivo totalmente ordinato, denso
e continuo (come ℝ) con unità 𝑢 > 0. Allora 𝑆 è isomorfo ad ℝ nel senso che esiste
una funzione (unica) 𝑓 : ℝ → 𝑆 bigettiva, additiva, crescente con 𝑓 (1) = 𝑢 .
Possiamo inoltre finalmente dimostrare che l’addizione è commutativa.
Teorema 1.56. Se 𝑥, 𝑦 ∈ ℝ si ha 𝑥 + 𝑦 = 𝑦 + 𝑥 .
Dimostrazione. Se consideriamo il gruppo additivo ℝ ma definiamo l’addizione

con gli addendi scambiati, il teorema 1.54 ci garantisce l’esistenza di una
funzione 𝑓 : ℝ → ℝ crescente, con 𝑓 (1) = 1, tale che
𝑓 (𝑥 + 𝑦) = 𝑓 (𝑦) + 𝑓 (𝑥). (1.13)
Inoltre 𝑓 è l’unica funzione crescente tale che per ogni 𝑥 ∈ ℚ soddisfa 𝑓 (𝑥) = 𝑥 .
Visto che la funzione identica ha queste proprietà 𝑓 dovrà in effetti essere la
funzione identica 𝑓 (𝑥) = 𝑥 per ogni 𝑥 ∈ ℝ e l’equazione (1.13) si riduce a
𝑥 + 𝑦 = 𝑦 + 𝑥.
Possiamo finalmente definire su ℝ l’operazione di moltiplicazione.

moltiplicazione
Teorema 1.57 (moltiplicazione). Su ℝ esiste una unica unica operazione · che

chiameremo moltiplicazione che soddisfa le seguenti proprietà:
1. distributiva: 𝑥 · (𝑦 + 𝑧) = 𝑥 · 𝑦 + 𝑥 · 𝑧 ;
2. elemento neutro: 𝑥 · 1 = 𝑥 ;
3. monotonia: fissato 𝑥 la funzione 𝑥 · 𝑦 è monotona in 𝑦 .
Inoltre tale operazione, che chiamiamo moltiplicazione, ha anche le seguenti proprietà: moltiplicazione
1. commutativa: 𝑥 · 𝑦 = 𝑦 · 𝑥 ;
2. stretta monotonia: se 𝑥 > 0 e 𝑦 > 𝑧 allora 𝑥 · 𝑦 > 𝑥 · 𝑧 ;
3. associativa: (𝑥 · 𝑦) · 𝑧 = 𝑥 · (𝑦 · 𝑧);
4. esistenza del reciproco: se 𝑥 ≠ 0 esiste 𝑦 tale che 𝑥 𝑦 = 1;
5. elemento assorbente: 0 · 𝑥 = 0;
6. annullamento del prodotto: se 𝑥 · 𝑦 = 0 allora 𝑥 = 0 oppure 𝑦 = 0;
7. regola del segno: (−𝑥) · 𝑦 = −(𝑥 · 𝑦).
Dimostrazione. Il teorema 1.54 garantisce che per ogni 𝑥 ∈ ℝ esiste una unica
funzione 𝑚 𝑥 : ℝ → ℝ che sia additiva, monotona e tale che 𝑚 𝑥 (1) = 𝑥 . Se
definiamo
𝑥 · 𝑦 = 𝑚 𝑥 (𝑦)
otteniamo che valgono la proprietà distributiva, l’elemento neutro e la monoto-
nia. E questo è l’unico modo per garantire queste proprietà.
Dobbiamo ora verificare che tale definizione soddisfa anche le altre proprietà
enunciate. Per fare ciò ci servirà innanzitutto dimostrare che fissati 𝑎, 𝑏 ∈ ℝ si
ha
𝑚 𝑎 (𝑥) + 𝑚𝑏 (𝑥) = 𝑚 𝑎+𝑏 (𝑥) (1.14)
Consideriamo la funzione 𝑓 (𝑥) = 𝑚 𝑎 (𝑥) + 𝑚𝑏 (𝑥). E’ immediato verificare che 𝑓
è una funzione additiva in quanto 𝑚 𝑎 e 𝑚𝑏 lo sono e l’addizione è commutativa.
Se 𝑎, 𝑏 ≥ 0 è anche immediato verificare che 𝑓 è crescente in quanto 𝑚 𝑎 e 𝑚𝑏
lo sono. Siccome 𝑓 (1) = 𝑚 𝑎 (1) + 𝑚𝑏 (1) = 𝑎 + 𝑏 per il teorema 1.54 la funzione
𝑓 deve coincidere con 𝑚 𝑎+𝑏 e quindi (1.14) è verificata. Osserviamo ora che
−𝑚 𝑦 (𝑥) = 𝑚−𝑦 (𝑥) sempre grazie all’unicità nel teorema 1.54 visto che −𝑚 𝑦 è
additiva, monotona e −𝑚 𝑦 (1) = −𝑦 . Dunque se 𝑎 < 0 e 𝑏 < 0 ci possiamo
ricondurre al caso precedente cambiando tutto di segno:
𝑚 𝑎 + 𝑚𝑏 = −(𝑚−𝑎 + 𝑚−𝑏 ) = −𝑚−𝑎−𝑏 = 𝑚 𝑎+𝑏 .
Se 𝑎 ≥ 0, 𝑏 ≤ 0 e 𝑎 + 𝑏 ≥ 0 sfruttiamo (𝑎 + 𝑏) + (−𝑏) = 𝑎 per ottenere

𝑚 𝑎+𝑏 +𝑚−𝑏 = 𝑚 𝑎 che, riordinando i termini, è l’uguaglianza desiderata. Se 𝑎 ≥ 0,
𝑏 ≤ 0 e 𝑎 + 𝑏 ≤ 0 sfruttiamo −(𝑎 + 𝑏) + 𝑎 = −𝑏 per ottenere 𝑚−(𝑎+𝑏) + 𝑚 𝑎 = 𝑚−𝑏
che di nuovo ci porta a (1.14). Se 𝑏 < 0 scambiamo 𝑎 e 𝑏 per ricondurci ai casi
precedenti. Abbiamo così dimostrato (1.14).
Possiamo ora dimostrare la proprietà commutativa. Fissato 𝑦 ∈ ℝ consideriamo

la funzione 𝑓 (𝑥) = 𝑚 𝑥 (𝑦). Abbiamo appena dimostrato che 𝑓 è additiva.
Osserviamo che se 𝑦 ≥ 0 e 𝑥 ≥ 0 si ha 𝑓 (𝑥) ≥ 0 in quanto 𝑚 𝑥 è crescente e
quindi 𝑓 (𝑥) = 𝑚 𝑥 (𝑦) ≥ 𝑚 𝑥 (0) = 0. Dunque se 𝑥 1 ≤ 𝑥 2 si ha 𝑥 2 − 𝑥 1 ≥ 0 e
𝑓 (𝑥2 ) − 𝑓 (𝑥1 ) = 𝑓 (𝑥2 − 𝑥1 ) ≥ 0: significa che 𝑓 (𝑥) è crescente. Se 𝑦 < 0 si otterrà
invece che 𝑓 (𝑥) è decrescente, ma in ogni caso è monotona. Inoltre 𝑚1 (𝑦) = 𝑦
46 1 fondamenti
in quanto l’identità è additiva e monotona e quindi per unicità coincide con

𝑚1 in quanto 𝑚1 (1) = 1 come l’identità. Dunque 𝑓 (1) = 𝑚1 (𝑦) = 𝑦 . Dunque
scopriamo che 𝑓 (𝑥) = 𝑚 𝑥 (𝑦) = 𝑚 𝑦 (𝑥) ovvero 𝑥 · 𝑦 = 𝑦 · 𝑥 .
Per dimostrare la proprietà associativa fissiamo 𝑦, 𝑧 ∈ ℝ e consideriamo la

funzione 𝑓 (𝑥) = 𝑚 𝑧 (𝑚 𝑦 (𝑥)). Questa funzione è additiva in quanto 𝑚 𝑧 (𝑚 𝑦 (𝑎 +
𝑏)) = 𝑚 𝑧 (𝑚 𝑦 (𝑎) + 𝑚 𝑦 (𝑏)) = 𝑚 𝑧 (𝑚 𝑦 (𝑎)) + 𝑚 𝑧 (𝑚 𝑦 (𝑏)). Inoltre è monotona in
quanto composizione di funzioni monotone. Infine 𝑓 (1) = 𝑚 𝑧 (𝑚 𝑦 (1)) = 𝑚 𝑧 (𝑦).
Dunque per unicità si deve avere 𝑚 𝑧 (𝑚 𝑦 (𝑥)) = 𝑚𝑚𝑧 (𝑦) (𝑥). Esplicitando questa
uguaglianza si trova proprio: 𝑧 · (𝑦 · 𝑥) = (𝑧 · 𝑦) · 𝑥 .
Per dimostrare l’esistenza del reciproco basta ricordare che se 𝑦 ≠ 0 la funzione

𝑚 𝑦 è bigettiva e quindi esiste un unico 𝑥 tale che 𝑚 𝑦 (𝑥) = 𝑦 · 𝑥 = 1.
Lo zero è elemento assorbente in quanto 0 · 𝑥 = 𝑥 · 0 = 𝑚 𝑥 (0) = 0 qualunque
sia 𝑥 . D’altra parte se 𝑚 𝑥 (𝑦) = 0 se non è 𝑥 = 0 la funzione 𝑚 𝑥 è iniettiva e
quindi 𝑦 = 0 è l’unico punto in cui 𝑚 𝑥 (𝑦) = 0. Dunque vale anche la proprietà
di annullamento del prodotto.
La regola del segno deriva dall’additività in quanto 0 = 𝑥 · 0 = 𝑥 · (𝑦 − 𝑦) =

𝑥 · 𝑦 + 𝑥 · (−𝑦) da cui 𝑥 · (−𝑦) = −(𝑥 · 𝑦).
L’operazione di moltiplicazione che abbiamo appena definito su ℝ rende ℝ un

campo ordinato continuo in base alla seguente.
Definizione 1.58 (campo). Diremo che 𝕂 è un campo se 𝕂 è un anello commutativo

con unità e se ogni 𝑥 ∈ 𝕂 , 𝑥 ≠ 0 ha un inverso moltiplicativo cioè esiste 𝑦 ∈ 𝕂 tale che
reciproco 𝑥 · 𝑦 = 1. L’inverso moltiplicativo si chiama anche reciproco. Se 𝑦 ≠ 0 denotiamo con
𝑥/𝑦 o 𝑥𝑦 il prodotto di 𝑥 con il reciproco di 𝑦 . Questa operazione si chiama divisione.
divisione
Se 𝐾 è anche totalmente ordinato da una relazione ≤ e se valgono anche le seguenti
proprietà:
𝑎 ≤ 𝑏 =⇒ 𝑎 + 𝑐 ≤ 𝑏 + 𝑐, 𝑎, 𝑏 ≥ 0 =⇒ 𝑎 · 𝑏 ≥ 0
campo ordinato diremo che 𝐾 è un campo ordinato.
campo ordinato continuo Infine se l’ordinamento è continuo diremo che 𝐾 è un campo ordinato continuo.
Si può osservare che in un campo ordinato l’ordinamento è necessariamente

denso in quanto dati 𝑎, 𝑏 elementi del campo possiamo definire 𝑎+𝑏2 che è
certamente strettamente compreso tra 𝑎 e 𝑏 .
1.18 funzione esponenziale e potenza
Osserviamo che l’insieme ℝ+ = {𝑥 ∈ ℝ : 𝑥 > 0} dei reali positivi rispetto alla

operazione di moltiplicazione risulta essere un gruppo moltiplicativo totalmente
ordinato, denso e continuo. Abbiamo già dimostrato tutte queste proprietà della
moltiplicazione. La densità e continuità non vanno verificate in quanto sono
proprietà dell’ordinamento e non dell’operazione, e l’ordinamento considerato
su ℝ+ è quello ereditato da ℝ.
1.18 funzione esponenziale e potenza 47
Dunque fissato 𝑎 > 0 per il teorema 1.54 esiste una unica funzione exp 𝑎 : ℝ →
ℝ+ (chiamata funzione esponenziale di base 𝑎 ) che sia un omomorfismo monotono funzione esponenziale
del gruppo additivo ℝ con il gruppo moltiplicativo ℝ+ e tale che exp 𝑎 (1) = 𝑎 .
La proprietà di omomorfismo in questo caso si esprime nella forma seguente:
exp 𝑎 (𝑥 + 𝑦) = exp 𝑎 (𝑥) · exp 𝑎 (𝑦). (1.15)

Il teorema 1.54 ci dice anche che se 𝑛 ∈ ℕ il valore exp 𝑎 (𝑛) non è altro che il
prodotto di 𝑎 con sé stesso 𝑛 volte: exp 𝑎 (𝑛) = 𝑎 𝑛 . Ha dunque senso definire
𝑎 𝑥 = exp𝑎 (𝑥) per ogni 𝑥 ∈ ℝ. Avremo dunque la proprietà fondamentale della
funzione esponenziale:
𝑎 𝑥+𝑦 = 𝑎 𝑥 · 𝑎 𝑦 .
Per ogni 𝑎 > 0 e 𝑏 ∈ ℝ è dunque definita l’espressione 𝑎 𝑏 (si legga: 𝑎 elevato alla
potenza 𝑏 ) che si chiama potenza di base 𝑎 ed esponente 𝑏 . potenza
Quando l’esponente è negativo si ha
1
𝑎 −𝑥 =
𝑎𝑥
in quanto 𝑎 𝑥 · 𝑎 −𝑥 = 𝑎 𝑥−𝑥 = 𝑎 0 = 1. In particolare 𝑎 −1 = 1

𝑎 è un modo per
denotare l’inverso moltiplicativo.
Se 𝑎 > 1 la funzione 𝑎 𝑥 risulta essere strettamente crescente, se 𝑎 < 1 la funzione

è strettamente decrescente e se 𝑎 = 1 la funzione 1𝑥 = 1 è costante.
Se 𝑎 > 0 e 𝑏 > 0 vogliamo dimostrare che vale la proprietà:
(𝑎 · 𝑏)𝑥 = 𝑎 𝑥 · 𝑏 𝑥 .
Sarà sufficiente dimostrarlo per 𝑎 > 1 e 𝑏 > 1 in quanto gli altri casi si ottengono
di conseguenza passando al reciproco. Osservare che la funzione 𝑓 (𝑥) = 𝑎 𝑥 · 𝑏 𝑥
è un omomorfismo
𝑓 (𝑥 + 𝑦) = 𝑎 𝑥+𝑦 𝑏 𝑥+𝑦 = 𝑎 𝑥 𝑎 𝑦 𝑏 𝑥 𝑏 𝑦 = 𝑓 (𝑥) · 𝑓 (𝑦)
è crescente (in quanto prodotto di funzioni positive e crescenti) e vale 𝑓 (1) = 𝑎 · 𝑏 .

Dunque per l’unicità data dal teorema 1.54 possiamo affermare che 𝑓 (𝑥) =
(𝑎 · 𝑏)𝑥 .
Infine possiamo dimostrare la proprietà delle potenze ripetute:
𝑐
𝑎𝑏 = 𝑎 𝑏·𝑐 .
Fissati 𝑎 > 0 e 𝑏 ∈ ℝ consideriamo la funzione 𝑓 (𝑥) = 𝑎 𝑏·𝑥 . osserviamo che

𝑓 (𝑥 + 𝑦) = 𝑎 𝑏𝑥+𝑏 𝑦 = 𝑎 𝑏𝑥 · 𝑎 𝑏 𝑦 dunque la funzione 𝑓 soddisfa la proprietà di
additività. Inoltre è una funzione monotona perché composizione di funzioni
monotone. Infine 𝑓 (1) = 𝑎 𝑏 e dunque, per l’unicità data dal teorema 1.54 dovrà
𝑥
essere 𝑓 (𝑥) = 𝑎 𝑏 , come volevamo dimostrare.
Osserviamo che la funzione potenza 𝑥 𝛼 (dove si tiene fisso l’esponente e si fa

variare la base) è definita tramite la funzione esponenziale per ogni 𝑥 > 0 e per
ogni 𝛼 ∈ ℝ. Se 𝛼 > 0 è naturale definire 0𝛼 = 0 e quindi se 𝛼 > 0 possiamo
48 1 fondamenti
𝑦 = 𝑎𝑥
1 𝑥
𝑦=

𝑎 𝑎
1 𝑦 = log𝑎 𝑥
1 𝑎
𝑦 = log 1 𝑥
𝑎
Figura 1.4: Il grafico della funzione espo-
nenziale e logaritmo in base 𝑎 > 1 e
𝑎 < 1 ( 𝑎 = 2 in figura).
1
√
𝑦= 𝑥
𝑦 = 𝑥2
1
𝑦= 1
𝑥2
𝑦 = 𝑥1 1
√
𝑦 = 3𝑥
Figura 1.5: Grafici tipici di potenze e 𝑦 = 𝑥3

radici.
considerare definito 𝑥 𝛼 per ogni 𝑥 ≥ 0. Verifichiamo che la funzione 𝑓 (𝑥) = 𝑥 𝛼

è strettamente crescente se 𝛼 > 0. Infatti se 𝑥 2 > 𝑥 1 > 0 e se 𝛼 > 0 si ha
𝛼 0
𝑥2 𝑥2

𝑥2𝛼 = · 𝑥1 𝛼
> · 𝑥1 𝛼 = 𝑥1𝛼 .
𝑥1 𝑥1
1.19 radice 𝑛 -esima
Dalle proprietà delle potenze ripetute deduciamo che se 𝑥 > 0 e 𝑛 ∈ ℕ , 𝑛 ≥ 1,

si ha (𝑥 𝑛 ) 𝑛 = 𝑥 . Significa che 𝑥 𝑛 è la funzione inversa di 𝑥 𝑛 per 𝑥 > 0. Ma la
1 1
funzione 𝑥 𝑛 è definita anche per 𝑥 ≤ 0 e si distinguono due casi qualitativamente

diversi in base alla parità di 𝑛 .
Se 𝑛 è pari la funzione 𝑥 ↦→ 𝑥 𝑛 non è invertibile in quanto (−𝑥)𝑛 = 𝑥 𝑛 . Se però

restringiamo la funzione 𝑥 𝑛 ai numeri reali non negativi la funzione risulta
√
invertibile e la funzione inversa che si denota con 𝑥 ↦→ 𝑛 𝑥 può essere definita
mediante le potenze come segue:
( 1
√
𝑛 𝑥𝑛 se 𝑥 > 0
𝑥= se 𝑛 è pari.
0 se 𝑥 = 0
Se 𝑛 è dispari la funzione 𝑥 ↦→ 𝑥 𝑛 è invertibile su tutto ℝ. Infatti (−𝑥)𝑛 = −𝑥 𝑛

dunque tale funzione mantiene il segno del suo argomento. In tal caso la
1.20 logaritmo 49
√
funzione inversa denotata con 𝑥 ↦→ 𝑛
𝑥 è anch’essa definita su tutto ℝ e può
essere definita nel modo seguente
1

 𝑥𝑛 se 𝑥 > 0
√
𝑛



𝑥= 0 se 𝑥 = 0 se 𝑛 è dispari
 −(−𝑥) 𝑛1

se 𝑥 < 0


Quando l’argomento è positivo la radice 𝑛 -esima potrebbe anche essere definita

utilizzando il teorema 1.47 di divisibilità nell’ambito del gruppo moltiplicativo
ℝ+ .
radice quadrata
√
La radice seconda 2 𝑥 viene usualmente chiamata radice quadrata e viene denotata
√ √
con il simbolo 𝑥 . Analogamente la radice terza 3 𝑥 viene usualmente chiamata radice cubica
radice cubica.
Per come è definita la radice 𝑛 -esima si ha

(
√
𝑛 |𝑥| se 𝑛 è pari,
𝑥𝑛 =
𝑥 se 𝑛 è dispari.
√ √ √ 𝑛 √
p √
E’ facile verificare che le proprietà 𝑛 𝑥 · 𝑦 = 𝑛 𝑥 · 𝑛 𝑦 e 𝑚 𝑥 = 𝑛𝑚 𝑥 sono valide
in tutti i casi in cui ambo i membri sono ben definiti.
√
Il seguente teorema ci dice che 2 è irrazionale (non è razionale, ovvero non è
elemento di ℚ) in quanto risolve l’equazione 𝑥 2 = 2 che non può avere soluzioni
in ℚ.
√
Teorema 1.59 (irrazionalità di 2, Pitagora). L’equazione 𝑥 2 = 2 non ha soluzioni
𝑥 ∈ ℚ.
Dimostrazione. Supponiamo 𝑥 ∈ ℚ sia una soluzione di 𝑥 2 = 2. Allora si potrà

scrivere 𝑥 = 𝑝/𝑞 con 𝑝 ∈ ℤ e 𝑞 ∈ ℕ , 𝑞 ≠ 0. Possiamo anche supporre che la
frazione 𝑝/𝑞 sia ridotta ai minimi termini cioè che 𝑝 e 𝑞 non abbiano fattori
in comune. Moltiplicando l’equazione (𝑝/𝑞)2 = 2 per 𝑞 2 si ottiene 𝑝 2 = 2 𝑞 2 .
Risulta quindi che 𝑝 2 è pari. Ma allora anche 𝑝 è pari (perché il quadrato di
un dispari è dispari). Ma se 𝑝 è pari allora 𝑝 2 è multiplo di quattro. Ma allora
anche 2 𝑞 2 è multiplo di quattro e quindi 𝑞 2 è pari. Dunque anche 𝑞 è pari. Ma
avevamo supposto che 𝑝 e 𝑞 non avessero fattori in comune quindi questo non
può accadere.
Possiamo quindi osservare che ℚ, come ℝ, è un campo totalmente ordinato.

Evidentemente ℚ non può essere continuo, perché se lo fosse dovrebbe essere
uguale ad ℝ per il teorema di unicità degli isomorfismi
√ dei gruppi continui
ordinati e dovrebbe quindi contenere il numero 2.
logaritmo
50 1 fondamenti
1.20 logaritmo
Se 𝑎 > 0, 𝑎 ≠ 1 la funzione esponenziale exp 𝑎 : ℝ → ℝ+ è bigettiva. La funzione

inversa log 𝑎 : ℝ+ → ℝ si chiama logaritmo in base 𝑎 e si caratterizza con la
seguente proprietà:
log 𝑎 𝑥 = 𝑦 ⇐⇒ 𝑎 𝑦 = 𝑥.
La proprietà di omomorfismo diventa:
log 𝑎 (𝑥 · 𝑦) = log 𝑎 𝑥 + log 𝑎 𝑦.
Ovviamente vale log 𝑎 𝑎 = 1 e log 𝑎 1 = 0. Se 𝑎 > 1 la funzione logaritmo

è strettamente crescente, se 𝑎 < 1 è strettamente decrescente. La proprietà
dell’esponenziale ripetuto si traduce nella seguente:
log 𝑎 (𝑥 𝑦 ) = 𝑦 log 𝑎 𝑥.
E’ anche piuttosto utile ricordare la formula per il cambiamento di base:
log𝑏 𝑥
log 𝑎 𝑥 =
log 𝑎 𝑏
(valida, come tutte le formule enunciate, se l’argomento del logaritmo è positivo

e se le basi sono positive diverse da 1 e diverse tra loro). Quest’ultima formula
si dimostra moltiplicando ambo i membri per log 𝑎 𝑏 e prendendo quindi
l’esponenziale con base 𝑏 di ambo i membri.
1.21 cardinalità infinite
Abbiamo già osservato che ℕ è un insieme infinito e dunque (per il teorema 1.4)
anche ℤ, ℚ e ℝ sono infiniti. Per gli insiemi finiti se 𝐴 ⊆ 𝐵 ma 𝐴 ≠ 𝐵 risulta
#𝐴 < #𝐵 in quanto #𝐴 − #𝐵 = #(𝐵 \ 𝐴) > 0. Dobbiamo però osservare che
lo stesso non vale per gli insiemi infiniti. In effetti la funzione 𝑠 : ℕ → ℕ
definita da 𝑠(𝑥) = 𝑥 + 1 risulta essere una bigezione tra ℕ e ℕ \ {0}. Dunque
#ℕ = #(ℕ \ {0}) nonostante la differenza tra i due insiemi {0} abbia cardinalità
1. Anche l’insieme dei numeri pari o l’insieme dei quadrati perfetti (come aveva
notato già Galileo) hanno la stessa cardinalità di ℕ in quanto le funzioni 𝑛 ↦→ 2𝑛
e la funzione 𝑛 ↦→ 𝑛 2 sono iniettive.
Non è difficile trovare una funzione iniettiva da ℤ in ℕ (lo lasciamo per esercizio):
questo dimostra che anche #ℤ = #ℕ
Cantor dimostra addirittura che #ℚ = ℕ : per farlo utilizza il seguente.
Teorema 1.60 (primo metodo diagonale di Cantor). L’insieme ℕ × ℕ ha la stessa

cardinalità di ℕ . Di conseguenza
#ℕ = #ℤ = #ℚ.
1.22 punti all’infinito 51
..
𝑚 .
.. .. ..
. . .
..
3 9 - .
.. Figura 1.6: La numerazione diagonale
2 5 8 12 .
delle caselle di una scacchiera infinita.
.. Si potrebbe verificare che il numero pre-
1 2 4 7 11 .
sente nella casella di coordinate (𝑛, 𝑚) si
.. scrive come 𝑓 (𝑛, 𝑚) =
(𝑛+𝑚+1)(𝑛+𝑚)
+𝑚
0 0 1 3 6 10 . 2
ed è una funzione bigettiva 𝑓 : ℕ × ℕ →
0 1 2 3 4 ... 𝑛 ℕ.
Idea di dimostrazione. Numerare le caselle di una scacchiera infinita come in

Figura 1.6.
Visto che è piuttosto facile trovare una funzione iniettiva da ℚ in ℕ × ℤ si

deduce facilmente che #ℚ = #ℕ .
A questo punto si potrebbe pensare che tutti gli insiemi infiniti siano numerabili.
Invece preso un qualunque insieme (anche infinito) esiste un insieme con
cardinalità strettamente maggiore come dimostrato nel seguente teorema che
è un piccolo gioiello della logica. In effetti il metodo utilizzato è assimilabile
al paradosso del mentitore ed è la stessa idea ripresa da Russell nel paradosso
che ha demolito la teoria ingenua degli insiemi. L’insieme delle parti P(𝐴) è
definito a pag. 5.
Teorema 1.61 (Cantor). Se 𝐴 è un qualunque insieme allora #P(𝐴) > #𝐴.
Dimostrazione. E’ chiaro che #𝐴 ≤ #P(𝐴) in quanto la funzione 𝑓 : 𝐴 → P(𝐴)

definita da 𝑓 (𝑥) = {𝑥} è ovviamente iniettiva.
Supponiamo allora per assurdo che esista 𝑓 : 𝐴 → P(𝐴) bigettiva e consideriamo

l’insieme
𝐶 = {𝑥 ∈ 𝐴 : 𝑥 ∉ 𝑓 (𝑥)}.
Se 𝑓 fosse surgettiva dovrebbe esistere 𝑐 ∈ 𝐴 tale che 𝑓 (𝑐) = 𝐶 . Possiamo allora
chiederci se 𝑐 ∈ 𝐶 e scoprire che, per definizione di 𝐶 la proposizione 𝑐 ∈ 𝐶 è
equivalente a 𝑐 ∉ 𝑓 (𝑐) = 𝐶 . Dunque 𝑐 ∈ 𝐶 ⇐⇒ 𝑐 ∉ 𝐶 , che è assurdo.
Corollario 1.62 (non esiste l’insieme di tutti gli insiemi). Se esistesse un insieme
U (universo) tale che ∀𝑥 : 𝑥 ∈ 𝑈 , allora si avrebbe P(U) ⊆ U contraddicendo il teorema
precedente.
Per quanto riguarda l’insieme ℝ si scopre in effetti che #ℝ > #ℕ (sempre

grazie a Cantor, teorema 3.24) e si potrebbe dimostrare che effettivamente
ℝ̄
#ℝ = #P(ℕ ).
+∞, −∞
52 1 fondamenti
1.22 punti all’infinito
Definizione 1.63 (reali estesi). Denotiamo con ℝ̄ = ℝ ∪ {+∞, −∞} l’insieme dei
numeri reali a cui vengono aggiunti due ulteriori quantità che chiameremo infinite e
che denotiamo con +∞ e −∞. Diremo che 𝑥 ∈ ℝ̄ è finito se 𝑥 ∈ ℝ.
Estendiamo la relazione d’ordine imponendo che valga
−∞ ≤ 𝑥 ≤ +∞, ∀𝑥 ∈ ℝ̄.
Estendiamo anche la addizione e moltiplicazione tra reali estesi imponendo che

valga per ogni 𝑥 ∈ ℝ̄
𝑥 + (+∞) = +∞, se 𝑥 ≠ −∞
𝑥 + (−∞) = −∞, se 𝑥 ≠ +∞
𝑥 · (+∞) = +∞, 𝑥 · (−∞) = −∞, se 𝑥 > 0
𝑥 · (+∞) = −∞, 𝑥 · (−∞) = +∞, se 𝑥 < 0.
Si definiscono anche:
1 1
−(+∞) = −∞, −(−∞) = +∞, = =0
+∞ −∞
facendo però attenzione che questi formalmente non sono opposto e reciproco
in quanto su ℝ̄ non sono più garantite le regole: 𝑥 + (−𝑥) = 0 e 𝑥 · (1/𝑥) = 1.
Infatti le operazioni (+∞) + (−∞) e +∞ · 0 vengono lasciate indefinite.
Definiamo anche il valore assoluto: |+∞| = |−∞| = +∞.
Possiamo infine definire la sottrazione e la divisione tramite addizione e
moltiplicazione:
𝑥 1
𝑥 − 𝑦 = 𝑥 + (−𝑦), =𝑥· .
𝑦 𝑦
Possiamo definire gli operatori sup e inf anche sugli insiemi illimitati ponendo:
sup 𝐴 = +∞ se 𝐴 non è superiormente limitato

inf 𝐴 = −∞ se 𝐴 non è inferiormente limitato.
Osserviamo infatti che su ℝ̄ la quantità +∞ è maggiorante di qualunque insieme

e −∞ è minorante, dunque queste definizioni mantengono su ℝ̄ le proprietà
caratterizzanti: l’estremo superiore è il minimo dei maggioranti e l’estremo
inferiore è il massimo dei minoranti. Definiamo infine
sup ∅ = −∞
inf ∅ = +∞.
Queste ultime definizioni possono essere comprese da un punto di vista

strettamente logico: ogni numero reale è sia maggiorante che minorante
dell’insieme vuoto, dunque il minimo dei maggioranti non esiste in ℝ ma in ℝ̄
è −∞ e il massimo dei minoranti è +∞.
1.23 intervalli 53
1.23 intervalli
intervallo
Definizione 1.64 (intervallo). Un insieme 𝐼 ⊆ ℝ̄ si dice essere un intervallo se
contiene tutti i punti intermedi:
se 𝑥, 𝑦 ∈ 𝐼 e 𝑥 < 𝑧 < 𝑦 allora 𝑧 ∈ 𝐼 .
Teorema 1.65 (caratterizzazione intervalli di ℝ). Sia 𝐼 ⊆ ℝ un intervallo e siano

𝑎 = inf 𝐼 , 𝑏 = sup 𝐼 i suoi estremi. Allora 𝑧 ∈ 𝐼 se 𝑎 < 𝑧 < 𝑏 .
Dimostrazione. Se 𝐼 = ∅ si ha 𝑎 > 𝑏 e quindi nessuno 𝑧 verifica 𝑎 < 𝑧 < 𝑏 .

Supponiamo 𝐼 ≠ ∅ e sia 𝑎 < 𝑧 < 𝑏 . Visto che 𝑎 è il massimo dei minoranti di
𝐼 il numero 𝑧 non è un minorante dunque deve esistere 𝑥 ∈ 𝐼 tale che 𝑥 < 𝑧 .
Analogamente dovrebbe esistere 𝑦 ∈ 𝐼 con 𝑧 < 𝑦 . Ma allora, per definizione di
intervallo, anche 𝑧 ∈ 𝐼 .
Il teorema precedente ci dice che una volta identificati i due estremi di un

intervallo, tutti i punti intermedi devono stare nell’intervallo. Gli estremi,
invece, possono essere o non essere inclusi nell’intervallo. Punti esterni agli
estremi non possono invece essere elementi dell’intervallo. Possiamo quindi
caratterizzare tutti gli intervalli di ℝ introducendo le seguenti notazioni. Dati
𝑎, 𝑏 ∈ ℝ̄ con 𝑎 ≤ 𝑏 tutti i possibili intervalli con estremi 𝑎 e 𝑏 sono i seguenti:
[𝑎, 𝑏] = 𝑥 ∈ ℝ̄ : 𝑎 ≤ 𝑥 ≤ 𝑏

[𝑎, 𝑏) = 𝑥 ∈ ℝ̄ : 𝑎 ≤ 𝑥 < 𝑏

(1.16)
(𝑎, 𝑏] = 𝑥 ∈ ℝ̄ : 𝑎 < 𝑥 ≤ 𝑏

(𝑎, 𝑏) = 𝑥 ∈ ℝ̄ : 𝑎 < 𝑥 < 𝑏 .

Abbiamo utilizzato le parentesi quadre per indicare che gli estremi sono inclusi
e le parentesi tonde per indicare che gli estremi sono esclusi. Osserviamo che
in alcuni testi si usano le parentesi quadre rovesciate al posto delle parentesi
tonde.
Noi considereremo per lo più intervalli di ℝ (non di ℝ̄): in tal caso gli estremi
infiniti non potranno mai essere inclusi nell’intervallo.
1.24 andamento del grafico di una funzione
Se 𝑓 : 𝐴 ⊆ ℝ → ℝ è una funzione, un modo molto utile di rappresentarla

graficamente è quello di disegnarne il grafico, ovvero la curva del piano
cartesiano:
𝐺 𝑓 = {(𝑥, 𝑦) ∈ 𝐴 × ℝ : 𝑦 = 𝑓 (𝑥)}.
Molte proprietà della funzione potranno essere riconosciute geometricamente
guardandone il grafico.
Definizione 1.66 (simmetrie). Sia 𝑓 : 𝐴 ⊆ ℝ → ℝ una funzione. Diremo che 𝑓 è:

pari
54 1 fondamenti
1. pari se 𝐴 = −𝐴 (significa che se 𝑥 ∈ 𝐴 allora anche −𝑥 ∈ 𝐴) e
𝑓 (−𝑥) = 𝑓 (𝑥);
dispari
2. dispari se 𝐴 = −𝐴 e
𝑓 (−𝑥) = − 𝑓 (𝑥);
periodica
3. periodica di periodo 𝑇 se 𝐴 + 𝑇 = 𝐴 (significa che 𝑥 ∈ 𝐴 ⇐⇒ 𝑥 + 𝑇 ∈ 𝐴)
se per ogni 𝑥 ∈ 𝐴 si ha
𝑓 (𝑥 + 𝑇) = 𝑓 (𝑥)
Ad esempio se 𝑛 ∈ ℤ la funzione 𝑓 (𝑥) = 𝑥 𝑛 è pari se 𝑛 è pari ed è dispari se 𝑛 è

dispari. Il grafico di una funzione dispari ha una simmetria centrale, in quanto
se (𝑥, 𝑓 (𝑥)) ∈ 𝐺 𝑓 allora anche (−𝑥, − 𝑓 (𝑥)) = (−𝑥, 𝑓 (−𝑥)) ∈ 𝐺 𝑓 . Il grafico di
una funzione pari ha invece una simmetria rispetto all’asse delle ordinate 𝑥 = 0
infatti se (𝑥, 𝑓 (𝑥)) ∈ 𝐺 𝑓 allora (−𝑥, 𝑓 (𝑥)) = (−𝑥, 𝑓 (−𝑥)) ∈ 𝐺 𝑓 .
La funzione 𝑓 (𝑥) = 𝑥 − b𝑥c (la parte frazionaria di 𝑥 ) è un esempio di funzione

periodica di periodo 𝑇 = 1. Infatti è chiaro che b𝑥 + 1c = b𝑥c + 1 e quindi
𝑓 (𝑥 + 1) = 𝑓 (𝑥).
Si osservi che dispari per le funzioni non è la negazione di pari. La funzione

𝑓 (𝑥) = 𝑥 + 1 non è né pari, né dispari, né periodica (verificare).
Definizione 1.67 (zeri). Se 𝑓 : 𝐴 ⊆ ℝ → ℝ è una funzione diremo che 𝑥 ∈ 𝐴 è uno

insieme degli zeri zero di 𝑓 se 𝑓 (𝑥) = 0. L’insieme degli zeri è quindi dato da
𝑓 −1 ({0}) = {𝑥 ∈ ℝ : 𝑓 (𝑥) = 0}.
Abbiamo già accennato al fatto che uno dei problemi più comuni in matematica
è quello di invertire una funzione. In particolare dato 𝑦 ∈ ℝ ci si chiede quali
siano gli 𝑥 ∈ ℝ tali che 𝑓 (𝑥) = 𝑦 . Questo problema si riconduce a trovare gli
zeri della funzione 𝑓 (𝑥) − 𝑦 e per questo motivo siamo interessati allo studio
degli zeri.
Riprendiamo ora la definizione 1.52 (monotonia) che da ora in avanti potrà

essere applicata alle funzioni 𝑓 : 𝐴 → ℝ definite su un insieme 𝐴 ⊆ ℝ.
Dal punto di vista grafico una funzione 𝑓 è crescente se preso qualunque punto
(𝑥, 𝑓 (𝑥)) sul grafico della funzione e tracciati gli assi paralleli agli assi cartesiani,
passanti per il punto fissato, si osserva che il grafico della funzione è tutto
contenuto nel primo e terzo quadrante determinati dagli assi traslati.
E’ facile verificare che la funzione 𝑓 : [0 , +∞) → ℝ definita da 𝑓 (𝑥) = 𝑥 𝑛

è strettamente crescente se 𝑛 è un intero positivo. Se però consideriamo la
funzione definita su tutto ℝ: 𝑓 : ℝ → ℝ, 𝑓 (𝑥) = 𝑥 𝑛 allora solo se 𝑛 è dispari la
funzione rimane strettamente crescente (le funzioni pari non possono mai essere
strettamente crescenti se il loro dominio contiene almeno tre punti distinti).
Se una funzione non è monotona è piuttosto comune studiare la monotonia

della funzione ristretta a particolari intervalli: su alcuni intervalli la funzione
(ristretta) potrà essere crescente e su altri intervalli potrà essere decrescente.
1.25 funzioni lineari 55
Esercizio 1.68. Verificare che la composizione di funzioni monotone è una funzione

monotona e la composizione di funzioni strettamente monotone è strettamente monotona.
Quando è che la funzione composta risulta crescente? Quando decrescente?
Esercizio 1.69. Si dimostri che applicando una funzione strettamente crescente ai due
membri di una equazione o disequazione (stretta o larga che sia) si ottiene una equazione
o disequazione equivalente. Ovviamente è necessario che la funzione sia definita dove
viene applicata.
Lo stesso vale per le funzioni strettamente decrescenti se però si cambia il verso della
disequazione.
Definizione 1.70 (funzioni limitate, massimo/minimo). Se 𝑓 : 𝐴 → ℝ è una

funzione allora definiamo l’estremo superiore di 𝑓 come l’estremo superiore dell’immagine
di 𝑓 :
sup 𝑓 = sup 𝑓 (𝑥) = sup 𝑓 (𝐴).
𝑥∈𝐴
In maniera analoga si definiscono l’estremo inferiore inf 𝑓 , il massimo max 𝑓 e il

minimo min 𝑓 .
Dunque il massimo di una funzione è (se esiste) il valore massimo che la funzione può
assumere. I punti 𝑥 in cui la funzione assume il valore massimo 𝑓 (𝑥) vengono chiamati
punti di massimo. Analogamente i punti in cui la funzione assume il valore minimo punto di massimo/minimo
(sempre che esistano) vengono chiamati punti di minimo.
Diremo che la funzione 𝑓 è superiormente limitata se sup 𝑓 < +∞ ovvero se esiste funzione superiormente limitata
𝑀 ∈ ℝ tale che
∀𝑥 ∈ 𝐴 : 𝑓 (𝑥) ≤ 𝑀.
Diremo che la funzione 𝑓 è inferiormente limitato se inf 𝑓 > −∞ ovvero se esiste funzione inferiormente limitata
𝑀 ∈ ℝ tale che
∀𝑥 ∈ 𝐴 : 𝑓 (𝑥) ≥ 𝑀.
Diremo che la funzione 𝑓 è limitata se è sia superiormente che inferiormente limitata funzione limitata
ovvero se sup | 𝑓 | < +∞ cioè se esiste 𝑀 ∈ ℝ tale che funzione lineare
Attenzione: nell’ambito dell’algebra li-
∀𝑥 ∈ 𝐴 : | 𝑓 (𝑥)| ≤ 𝑀. neare queste funzioni verrebbero chia-
mate lineari affini, mentre le funzioni li-
neari dovrebbero sempre avere 𝑞 = 0.
Nel seguente esercizio abbiamo un esempio di funzione limitata.
Noi invece (come spesso accade nell’am-
bito dell’analisi) chiameremo lineari que-
Esercizio 1.71. Si consideri la funzione 𝑓 : ℝ → ℝ ste funzioni e chiameremo lineari omoge-
nee quelle con 𝑞 = 0. Il termine lineare
1 pervade tutta la matematica e si applica
𝑓 (𝑥) = . in particolare alle equazioni che si otten-
1 + 𝑥2 gono tramite le funzioni lineari. Purtrop-
po il nome scelto è fuorviante: la parola
Verificare che max 𝑓 = sup 𝑓 = 1, che 0 è l’unico punto di massimo, che inf 𝑓 = 0 e linea viene usata a volte come abbrevia-
che min 𝑓 non esiste. zione di linea retta, quando invece sareb-
be più giusto utilizzare l’abbreviazione
retta in quanto una linea può benissimo
essere curva. In altri contesti (come ad
1.25 funzioni lineari esempio nell’ambito degli ordinamenti)
il termine lineare rappresenta un ogget-
to unidimensionale senza ramificazioni
Le funzioni lineari 𝑓 : ℝ → ℝ sono le funzioni per le quali esistono 𝑚, 𝑞 ∈ ℝ tali ed è quindi maggiormente aderente al
significato originale della parola.
56 1 fondamenti
𝑦 = 𝑚𝑥 + 𝑞
𝑓 (𝑥2 )
Δ 𝑓 (𝑥)
𝑓 (𝑥1 )
Δ𝑥
𝑥1 𝑥2
Figura 1.7: Il grafico di una funzione

lineare.
che
𝑓 (𝑥) = 𝑚𝑥 + 𝑞.
Se prendiamo due punti (𝑥 1 , 𝑓 (𝑥 1 )) e (𝑥 2 , 𝑓 (𝑥 2 )) sul grafico di una funzione

lineare possiamo osservare che si ha
𝑓 (𝑥2 ) − 𝑓 (𝑥1 )
= 𝑚.
𝑥2 − 𝑥1
Il coefficiente 𝑚 , dunque, rappresenta la pendenza del grafico di 𝑓 , ovvero il

rapporto tra la variazione dei valori della funzione Δ 𝑓 = 𝑓 (𝑥 2 ) − 𝑓 (𝑥 1 ) e la
variazione della variabile in ingresso Δ𝑥 = 𝑥 2 − 𝑥 1 . Geometricamente questo è
il rapporto tra i due cateti (base e altezza) che formano un triangolo rettangolo
la cui ipotenusa è il segmento che congiunge i due punti sul grafico. Il fatto che
questo rapporto sia costante significa, in base al teorema di Talete, che i punti
del grafico sono allineati ovvero che il grafico di una funzione lineare è, dal
punto di vista geometrico, una retta.
Definizione 1.72 (retta). Una linea retta (più semplicemente: retta) in è un

sottospazio affine di dimensione 1 ovvero la traslazione di un sottospazio vettoriale di
dimensione 1 (si rimanda al corso di geometria).
Tutte le rette del piano, tranne quelle parallele all’asse delle ordinate, sono
grafico di una funzione lineare.
Si osservi che per 𝑚 > 0 la funzione è strettamente crescente, per 𝑚 = 0 la
funzione è costante e per 𝑚 < 0 la funzione è strettamente decrescente.
1.26 funzioni quadratiche
polinomio di secondo grado

Le funzioni espresse mediante un polinomio di secondo grado
𝑓 (𝑥) = 𝑎𝑥 2 + 𝑏𝑥 + 𝑐 (1.17)
funzioni quadratiche
con 𝑎, 𝑏, 𝑐 ∈ ℝ, 𝑎 ≠ 0, si possono chiamare funzioni quadratiche.
Il modello di funzione quadratica è la funzione 𝑓 (𝑥) = 𝑥 2 che (come tutte
le potenze di esponente positivo e pari) risulta essere una funzione pari,
strettamente crescente sull’intervallo [0 , +∞) e strettamente decrescente su
1.26 funzioni quadratiche 57
𝑥 = − 2𝑏𝑎
𝑦 = 𝑎𝑥 2 + 𝑏𝑥 + 𝑐
𝑥1 𝑥2
quadratica.
(−∞, 0]. La funzione assume solamente valori non negativi e si annulla solo
per 𝑥 = 0. Dunque l’equazione
𝑥2 = 𝑏
non ha soluzione se 𝑏 < 0 ed ha come unica soluzione 𝑥 = 0 se 𝑏 = 0.√Se 𝑏 > 0
sappiamo che questa equazione ha una unica soluzione √ positiva 𝑥1 = 𝑏 e, per
simmetria, ha anche
√ una soluzione negativa 𝑥 2 = − 𝑏 . Sintetizzando si usa
scrivere 𝑥 1,2 = ± 𝑏 per unire in una unica riga le due definizioni.
La generica funzione quadratica (1.17) può essere ricondotta al caso modello

tramite un cambio di variabile lineare. In pratica si cerca di comporre il quadrato
di un binomio con un procedimento chiamato completamento del quadrato: completamento del quadrato
𝑏 𝑐

𝑓 (𝑥) = 𝑎𝑥 + 𝑏𝑥 + 𝑐 = 𝑎 𝑥 + 𝑥 +
2 2
𝑎 𝑎
𝑏 𝑏2 𝑏2 𝑐

= 𝑎 𝑥 +2 𝑥+ 2 − 2 +
2
2𝑎 4𝑎 4𝑎 𝑎
" 2 # (1.18)
𝑏 𝑏 2 − 4 𝑎𝑐
=𝑎 𝑥+ −
2𝑎 4𝑎2
2
𝑏 𝑏 2 − 4 𝑎𝑐

=𝑎 𝑥+ − .
2𝑎 4𝑎
Ponendo 𝑋 = 𝑥 + 2𝑏𝑎 e 𝑌 = 𝑦 + 𝑏 −4 𝑎4 𝑎𝑐 l’equazione 𝑦 = 𝑎𝑥 2 + 𝑏𝑥 + 𝑐 diventa

2
quindi 𝑌 = 𝑎𝑋 2 . Significa che il grafico della funzione quadratica (1.17) si

ottiene traslando la curva 𝑦 = 𝑎𝑥 2 che, dal punto di vista geometrico, si può
facilmente dimostrare essere una parabola con fuoco nel punto di coordinate
0 , 41𝑎 e asse la retta di equazione 𝑥 = 0. Dunque il grafico di ogni funzione

quadratica è una parabola, e più precisamente: ogni parabola con direttrice
parallela all’asse delle ascisse è il grafico di una funzione quadratica.
Definizione 1.73 (parabola). Una parabola con fuoco nel punto 𝑭 = (𝐹1 , 𝐹2 ) ∈ ℝ × ℝ
e retta direttrice la retta 𝑟 ⊆ ℝ × ℝ è l’insieme dei punti 𝒙 = (𝑥 1 , 𝑥 2 ) ∈ ℝ × ℝ
equidistanti da 𝑭 e da 𝑟 :
p q
𝒙 ∈ ℝ × ℝ: (𝑥1 − 𝐹1 )2 + (𝑥2 − 𝐹2 )2 = inf (𝑥1 − 𝑃1 )2 + (𝑦1 − 𝑃1 )2 .
𝑷∈𝑟
58 1 fondamenti
Esercizio 1.74. Si dimostri che per ogni 𝑎 ≠ 0 esiste 𝑠 ≠ 0 per cui il riscalamento
𝑋 = 𝑠𝑥 , 𝑌 = 𝑠 𝑦 porta il grafico della parabola 𝑦 = 𝑎𝑥 2 nel grafico della parabola
𝑌 = 𝑋 2 . Significa che a meno di isometrie e riscalamenti c’è una unica parabola.
Ricordando le proprietà di monotonia della funzione 𝑋 ↦→ 𝑋 2 possiamo dedurre

se 𝑎 > 0 la funzione 𝑓 (𝑥) è strettamente decrescente se ristretta all’intervallo
che
−∞, − 2𝑏𝑎 ed è invece strettamente crescente sull’intervallo − 2𝑏𝑎 , +∞ . Ha

dunque un punto di minimo in 𝑥 = − 2𝑏𝑎 . Inoltre (sempre se 𝑎 > 0) la funzione

è superiormente illimitata. Viceversa se 𝑎 < 0 la funzione è inferiormente
illimitata ed ha un massimo nel punto 𝑥 = − 2𝑏𝑎 .
E’ molto importante saper risolvere equazioni e disequazioni quadratiche.
Grazie a (1.18) l’equazione
𝑎𝑥 2 + 𝑏𝑥 + 𝑐 = 0
risulta equivalente a
2
𝑏 𝑏 2 − 4 𝑎𝑐

𝑥+ = .
2𝑎 4𝑎2
Dunque se 𝑏 2 − 4 𝑎𝑐 < 0 l’equazione 𝑎𝑥 2 + 𝑏𝑥 + 𝑐 = 0 non ha soluzioni. Se
𝑏 2 − 4 𝑎𝑐 = 0 l’equazione ha una unica soluzione 𝑥 = − 2𝑏𝑎 . Infine se 𝑏 2 − 4 𝑎𝑐 > 0
si ottiene √
𝑏 𝑏 2 − 4 𝑎𝑐
𝑥+ =±
2𝑎 2𝑎
da cui la famosa formula risolutiva
√
−𝑏 ± 𝑏 2 − 4 𝑎𝑐
𝑥 1 ,2 = . (1.19)
2𝑎
Risolvendo le disequazioni allo stesso modo, si trova che la funzione 𝑎𝑥 2 + 𝑏𝑥 + 𝑐

quando 𝑎 > 0 è positiva nei punti esterni alle soluzioni dell’equazione (in tutti
i punti se le soluzioni non esistono) ed è negativa nei punti interni alle due
soluzioni. Viceversa se 𝑎 < 0 la funzione è positiva all’interno delle due
soluzioni e negativa all’esterno.
1.27 equazioni e disequazioni
Un problema matematico molto comune è quello di dover risolvere equazioni e

disequazioni del tipo:
𝑓 (𝑥) = 𝑏, 𝑓 (𝑥) ≥ 𝑏, 𝑓 (𝑥) > 𝑏, 𝑓 (𝑥) ≤ 𝑏, 𝑓 (𝑥) < 𝑏 (1.20)
dove 𝑓 : 𝐴 ⊆ ℝ → ℝ è una funzione data e 𝑏 ∈ ℝ è fissato.

Quando 𝑓 è strettamente crescente e 𝑏 ∈ 𝑓 (𝐴) la soluzione può essere scritta
banalmente: ovviamente deve essere 𝑥 ∈ 𝐴 e ogni equazione o disequazione
in (1.20) avrà la corrispondente soluzione:
𝑥 = 𝑓 −1 (𝑏), 𝑥 ≥ 𝑓 −1 (𝑏), 𝑥 > 𝑓 −1 (𝑏), 𝑥 ≤ 𝑓 −1 (𝑏), 𝑥 < 𝑓 −1 (𝑏).

1.27 equazioni e disequazioni 59
Se la funzione fosse strettamente decrescente si può procedere allo stesso modo,

ma le disuguaglianze si invertono. Se la funzione fosse strettamente crescente su
alcuni intervalli e strettamente decrescente su altri si potranno separare i diversi
casi e si otterranno più soluzioni espresse da uguaglianze o disuguaglianze.
Esempio 1.75. Si risolva la disequazione

hp i
(𝑥 + 1)4 − 3 − 2 ≤ 3.
3
log2
Svolgimento. La funzione logaritmo è strettamente crescente ed è definita quan-

do l’argomento è positivo. Dunque la disequazione data è equivalente al sistema
di disequazioni:
p3
0< (𝑥 + 1)4 − 3 − 2 ≤ 8.
Possiamo sommare 2 per ottenere
p3
2< (𝑥 + 1)4 − 3 ≤ 10.
La funzione radice cubica è strettamente crescente su tutto ℝ quindi possiamo

invertirla elevando tutto al cubo:
8 < (𝑥 + 1)4 − 3 ≤ 1000.
Sommiamo 3:
11 < (𝑥 + 1)4 ≤ 1003.
L’elevamento alla quarta potenza è strettamente crescente solo quando l’argo-
mento è positivo, ed è una funzione pari. Possiamo quindi affermare che le
nostre disequazioni sono equivalenti all’unione delle soluzioni di due sistemi:
√4 √4 √4 √4
11 < 𝑥 + 1 ≤ 1003 o − 1003 ≤ 𝑥 + 1 < 11.
Sottraendo 1 otteniamo infine

√4 √4 √4 √4
11 − 1 < 𝑥 ≤ 1003 − 1 o − 1003 − 1 ≤ 𝑥 < 11 − 1.
In definitiva l’insieme delle soluzioni è

h √
4
√4 √
4
√4 i
− 1003 − 1 , 11 − 1 ∪ 11 − 1 , 1003 − 1 .
hp i
Nell’esempio precedente la funzione 𝑓 (𝑥) = log2 3
(𝑥 + 1)4 − 3 − 2 è ottenuta
mediante composizione di funzioni elementari:
√3
𝑓 = (𝑥 ↦→ log2 𝑥) ◦ (𝑥 ↦→ 𝑥 − 2) ◦ (𝑥 ↦→ 𝑥)
◦ (𝑥 ↦→ 𝑥 − 3) ◦ (𝑥 ↦→ 𝑥 ) ◦ (𝑥 ↦→ 𝑥 + 1).
4
60 1 fondamenti
Negli intervalli in cui tutte queste funzioni sono invertibili la funzione inversa
si ottiene componendo, in ordine opposto, tutte le inverse:
√4
𝑓 −1 = (𝑥 ↦→ 𝑥 − 1) ◦ (𝑥 ↦→ 𝑥) ◦ (𝑥 ↦→ 𝑥 + 3)
◦ (𝑥 ↦→ 𝑥 3 ) ◦ (𝑥 ↦→ 𝑥 + 2) ◦ (𝑥 ↦→ 2𝑥 ).
√4
In effetti il caposaldo 1003 − 1 è proprio tale funzione valutata in 𝑏 = 3.
Il metodo precedente è puramente algebrico e si applica alle equazioni come

la (1.20) dove la variabile 𝑥 compare una sola volta e dove la funzione 𝑓 si
esprime come composizione di funzioni elementari di cui sappiamo scrivere la
funzione inversa.
Ben diverso è il caso in cui nell’equazione la variabile 𝑥 compare più di una

volta. In alcuni casi, come ad esempio,
𝑥 2 > 2𝑥 − 1
queste equazioni possono essere ricondotte al caso precedente tramite opportune

manipolazioni algebriche. Il caso delle equazioni quadratiche lo abbiamo fatto
nel paragrafo precedente utilizzato il completamento del quadrato: 𝑥 2 − 2 𝑥 =
(𝑥 − 1)2 − 1. In altri casi, come ad esempio l’equazione
2𝑥 = 𝑥 2
le manipolazioni algebriche non sono utili. Nel capitolo sul calcolo differenziale
svilupperemo degli strumenti che ci permetteranno di determinare l’andamento
di molte di queste di funzioni. Nel capitolo sulle successioni svilupperemo
invece gli strumenti che ci permetteranno di determinare le soluzioni mediante
algoritmi di approssimazione. Questi strumenti presuppongono il concetto di
limite e continuità: è sostanzialmente questo che identifica la materia chiamata
analisi matematica.
1.28 i numeri complessi

numeri complessi
Dal punto di vista geometrico l’insieme ℂ dei numeri complessi può essere visto
come un modello del piano euclideo. Sul piano euclideo fissiamo arbitrarimente
un punto 0 in modo da ottenere uno spazio vettoriale e fissiamo, arbitrariamente,
una base 𝑒1 , 𝑒2 . Identifichiamo ogni punto del piano con i corrispondenti vettori
applicati in 0. La retta generata dal vettore 𝑒1 la identifichiamo con la retta ℝ
dei numeri reali e quindi poniamo 1 = 𝑒1 . La retta ortogonale generata dal
vettore 𝑒2 verrà chiamata retta dei numeri immaginari e definiamo 𝑖 = 𝑒2 .
Un generico punto 𝑧 del piano ℂ potrà essere scritto in maniera univoca nella
base scelta: 𝑧 = 𝑥𝑒1 + 𝑦𝑒2 ovvero, per come abbiamo chiamato 𝑒1 ed 𝑒2 :
𝑧 = 𝑥 + 𝑖 𝑦.
Tale 𝑧 viene chiamato numero complesso con parte reale 𝑥 e parte immaginaria
𝑦 . Questa rappresentazione del numero complesso 𝑧 viene chiamata rappre-
1.28 i numeri complessi 61
sentazione cartesiana in quanto definisce il punto 𝑧 del piano complesso tramite rappresentazione cartesiana
le sue coordinate cartesiane 𝑥 e 𝑦 . I numeri reali sono immersi nei complessi,
nel senso che se 𝑥 ∈ ℝ allora 𝑧 = 𝑥 + 𝑖 · 0 = 𝑥 è anche un numero complesso.
Il numero complesso 𝑖 = 0 + 𝑖 · 1 viene chiamata unità immaginaria e i numeri unità immaginaria
complessi della forma 𝑖 𝑦 sono chiamati immaginari. Un numero complesso
𝑧 = 𝑥 + 𝑖 𝑦 è quindi una somma tra un numero reale ed un numero immaginario.
Il numero reale 𝑥 viene chiamato parte reale di 𝑧 e si denota con 𝑥 = Re 𝑧 . Il Re 𝑧
numero reale 𝑦 viene chiamato parte immaginaria di 𝑧 e si denota con 𝑦 = Im 𝑧
(osserviamo che la parte immaginaria di un numero complesso è un numero Im 𝑧
reale, non immaginario). Dunque 𝑧 = Re 𝑧 + 𝑖 Im 𝑧 .
L’insieme ℂ, per come è stato costruito, è uno spazio vettoriale reale di di-
mensione 2. Abbiamo quindi già definite la addizione tra elementi di ℂ e la addizione
moltiplicazione tra elementi di ℂ ed elementi di ℝ, se 𝑎, 𝑏, 𝑐, 𝑑, 𝑡 ∈ ℝ si ha:
(𝑎 + 𝑖𝑏) + (𝑐 + 𝑖𝑑) = (𝑎 + 𝑐) + 𝑖(𝑏 + 𝑑),

𝑡(𝑎 + 𝑖𝑏) = 𝑡 𝑎 + 𝑖𝑡𝑏.
Vogliamo estendere la moltiplicazione a tutte le coppie di numeri complessi. moltiplicazione

Imponendo (arbitrariamente) che valga 𝑖 · 𝑖 = −1 e che rimanga valida la
proprietà distributiva, si ottiene questa definizione:
(𝑎 + 𝑖𝑏) · (𝑐 + 𝑖𝑑) = (𝑎𝑐 − 𝑏𝑑) + 𝑖(𝑎𝑑 + 𝑏𝑐).
Si può verificare che questa moltiplicazione estende quella “scalare” definita in

precedenza. E’ anche facile verificare che addizione e moltiplicazione soddisfano
le proprietà commutativa associativa e distributiva, che 0 è elemento neutro per
la addizione, che 1 è elemento neutro della moltiplicazione. Si osservi che se
𝑧 = 𝑥 + 𝑖 𝑦 non è nullo, allora
𝑥 − 𝑖𝑦
(𝑥 + 𝑖 𝑦) · = 1.
𝑥2 + 𝑦2
Significa che ogni 𝑧 ≠ 0 ammette inverso moltiplicativo e quindi ℂ risulta essere

un campo.
Osserviamo che su ℂ non si definisce una relazione d’ordine perché in effetti

non è possibile definire un ordine “compatibile” con le operazioni appena Se ℂ fosse un campo ordinato per assur-
definite. do si dovrebbe avere, che 𝑧 2 ≥ 0 per ogni
𝑧 ∈ ℂ (questo è vero in tutti i campi or-
Su ℂ definiamo delle ulteriori operazioni. Il coniugato di un numero complesso dinati). Ma allora −1 = 𝑖 2 ≥ 0 cioè 1 ≤ 0
che è in contraddizione con la proprietà
𝑧 = 𝑥 + 𝑖 𝑦 è il numero 𝑧¯ = 𝑥 − 𝑖 𝑦 . Geometricamente l’operazione di coniugio
0 < 1 valida in ogni campo ordinato.
è una simmetria rispetto alla retta reale. I numeri reali sono in effetti punti
fissi del coniugio (il coniugato di un numero reale è il numero stesso). E’ un coniugato
semplice esercizio verificare che il coniugio “attraversa” somma e prodotto:
𝑧 + 𝑤 = 𝑧¯ + 𝑤,
¯ 𝑧 · 𝑤 = 𝑧¯ · 𝑤.
¯
Ovviamente risulta 𝑧¯ = 𝑧 . E’ anche utile osservare che si ha:

𝑧 + 𝑧¯ 𝑧 − 𝑧¯
Re 𝑧 = , Im 𝑧 = (1.21)
2 2𝑖
62 1 fondamenti
e
𝑧 · 𝑧¯ = (𝑥 + 𝑖 𝑦)(𝑥 − 𝑖 𝑦) = 𝑥 2 − 𝑖 2 𝑦 2 = 𝑥 2 + 𝑦 2 .
modulo Possiamo allora definire il modulo di un numero complesso 𝑧 = 𝑥 + 𝑖 𝑦 come il

numero reale
√ q
|𝑧| = 𝑧 · 𝑧¯ = 𝑥 2 + 𝑦 2 .
Geometricamente tale quantità rappresenta la distanza del punto 𝑧 dal punto 0

e quindi la distanza tra due numeri complessi 𝑧 e 𝑤 si potrà rappresentare con
|𝑧 − 𝑤| .
Osserviamo
√ che se 𝑧 = 𝑥 ∈ ℝ ⊆ ℂ il modulo di 𝑧 coincide con il valore assoluto:
|𝑧| = 𝑥 2 = |𝑥| e per questo motivo non distinguiamo, nelle notazioni, il
modulo dal valore assoluto. Più in generale risulta per ogni 𝑧 ∈ ℂ (la verifica è
immediata):
| Re 𝑧| ≤ |𝑧|, | Im 𝑧| ≤ |𝑧|.
Possiamo a questo punto trovare una utile formula per calcolare il reciproco di
un numero complesso. Essendo infatti 𝑧 · 𝑧¯ = |𝑧| 2 si osserva che
1 𝑧¯ 𝑧¯
= = .
𝑧 𝑧¯ · 𝑧 |𝑧| 2
Teorema 1.76. Il modulo di un numero complesso soddisfa (come il valore assoluto) le

seguenti proprietà

1. |𝑧| = |𝑧| ,
2. |−𝑧| = |𝑧| = | 𝑧¯ | ,
3. |𝑧 · 𝑤| = |𝑧| · |𝑤| .
4. |𝑧 + 𝑤| ≤ |𝑧| + |𝑤| (convessità),
5. |𝑧 − 𝑤| ≤ |𝑧 − 𝑣| + |𝑣 − 𝑤| (disuguaglianza triangolare),
Dimostrazione. La prima proprietà è ovvia in quanto il valore assoluto di un

numero reale non negativo è il numero stesso.
La seconda proprietà viene immediatamente dalla definizione.
Per la terza proprietà sia 𝑧 = 𝑥 + 𝑖 𝑦 , 𝑤 = 𝑎 + 𝑖𝑏 . Allora:
|𝑧 · 𝑤| = |(𝑥 + 𝑖 𝑦) · (𝑎 + 𝑖𝑏)| = |𝑥𝑎 − 𝑦𝑏 + 𝑖(𝑥𝑏 + 𝑎 𝑦)|

q
= (𝑥𝑎 − 𝑦𝑏)2 + (𝑥𝑏 + 𝑎 𝑦)2
q
= 𝑥 2 𝑎 2 + 𝑦 2 𝑏 2 − 2 𝑥𝑎 𝑦𝑏 + 𝑥 2 𝑏 2 + 𝑎 2 𝑦 2 + 2 𝑥𝑏𝑎 𝑦
q
= 𝑥2 𝑎2 + 𝑦2𝑏2 + 𝑥2𝑏2 + 𝑎2 𝑦2
q
= 𝑥 2 (𝑎 2 + 𝑏 2 ) + 𝑦 2 (𝑎 2 + 𝑏 2 )
q
= (𝑥 2 + 𝑦 2 )(𝑎 2 + 𝑏 2 ) = |𝑥 + 𝑖 𝑦| · |𝑎 + 𝑖𝑏|
= |𝑧| · |𝑤|.
Figura 1.9: Consideriamo i numeri com-

plessi 𝑧 = 𝑎 + 𝑖𝑏 e 𝑤 = 𝛼 + 𝑖𝛽 e suppo-
𝑦 niamo che sia 𝛼 2 = 𝑎 2 + 𝑏 2 . Si consideri
𝑢 il punto 𝑢 che si ottiene ruotando il pun-
to 𝑤 dell’angolo individuato dal punto
𝑧 . Si avrà allora 𝑢 = 𝑎 − 𝑠 + 𝑖(𝑏 + 𝑡)
𝛽 dove 𝑠 e 𝑡 sono i cateti del triangolo
𝑡 𝑤 rettangolo con ipotenusa 𝛽 . Grazie alle
proprietà di similitudine dei triangoli
𝑠
𝑧 si ha 𝛽𝑠 = 𝛼𝑏 e 𝛽𝑡 = 𝛼𝑎 da cui si ottiene
𝑏𝛽 𝑎𝛽
𝛼 quindi 𝑢 = 𝑎 − 𝛼 + 𝑖(𝑏 + 𝛼 ) ovvero
𝑏 𝛼𝑢 = (𝑎𝛼 − 𝑏𝛽) + 𝑖(𝑏𝛼 + 𝑎𝛽) = 𝑧 · 𝑤 .
𝑥 Significa che il numero complesso 𝑧 · 𝑤
si trova sulla semiretta che individua un
0 𝑎 angolo che è la somma degli angoli indi-
viduati dai numeri complessi 𝑧 e 𝑤 .
Per la quarta disuguaglianza osserviamo che si ha
|𝑧 + 𝑤| 2 = (𝑧 + 𝑤) · (¯𝑧 + 𝑤)
¯ = |𝑧| 2 + |𝑤| 2 + 𝑧 · 𝑤¯ + 𝑧¯ · 𝑤
e visto che
𝑧 · 𝑤¯ + 𝑧¯ · 𝑤 = 𝑧 · 𝑤¯ + 𝑧 · 𝑤¯ = 2 Re(𝑧 𝑤)
¯ ≤ 2 |𝑧 𝑤|
¯ = 2 |𝑧| · | 𝑤|
¯ = 2 |𝑧| · |𝑤|
otteniamo
|𝑧 + 𝑤| 2 ≤ |𝑧| 2 + |𝑤| 2 + 2 |𝑧| · |𝑤| = (|𝑧| + |𝑤|)2
che è equivalente alla disuguaglianza di convessità.
La disuguaglianza triangolare è conseguenza immediata della convessità, infatti
|𝑧 − 𝑤| = |(𝑧 − 𝑣) + (𝑣 − 𝑤)| ≤ |𝑧 − 𝑣| + |𝑣 − 𝑤|.
Possiamo ora dare una interpretazione geometrica del prodotto 𝑧 · 𝑤 tra due
numeri complessi. In primo luogo sappiamo che |𝑧 · 𝑤| = |𝑧| · |𝑤| e dunque
il punto del piano che rappresenta il prodotto 𝑧 · 𝑤 si trova ad una distanza
dall’origine che è pari al prodotto delle distanze dei punti 𝑧 e 𝑤 . Inoltre l’angolo infinito
individuato da 𝑧 · 𝑤 rispetto all’asse delle 𝑥 positive risulta uguale alla somma
degli angoli individuati dai punti 𝑧 e 𝑤 come mostrato in figura 1.9. ∞
Anche il piano dei numeri complessi può essere esteso aggiungendoci un punto
all’infinito. A differenza dei reali, su cui era presente un ordinamento che era
utile conservare, nel caso dei numeri complessi è più usuale utilizzare un unico
punto infinito che si denota con ∞. Definiamo il piano dei complessi estesi ℂ̄
come
ℂ̄ = ℂ ∪ {∞}.
64 1 fondamenti
Definiamo
𝑧+∞=∞ ∀𝑧 ∈ ℂ
𝑧−∞=∞ ∀𝑧 ∈ ℂ
𝑧·∞=∞ ∀𝑧 ∈ ℂ̄ \ {0}
𝑧/∞ = 0 ∀𝑧 ∈ ℂ
𝑧/0 = ∞ ∀𝑧 ∈ ℂ̄ \ {0}
¯ =∞
∞
|∞| = +∞ ∈ ℝ̄.
Si noti che abbiamo definito la divisione per zero di numeri complessi (e quindi
anche reali) diversi da zero. Il risultato è ∞ e quindi rimane confermato che la
divisione per zero non è una operazione valida se vogliamo un risultato finito.
Una quantità 𝑧 ∈ ℂ̄ sarà detta finita se 𝑧 ∈ ℂ.
Esempio 1.77. La funzione 𝑓 : ℂ̄ → ℂ̄ definita da
1
𝑓 (𝑧) =
𝑧
è una funzione bigettiva di ℂ̄ in sé. Dal punto di vista geometrico il coniugato di tale
funzione ovvero la funzione 𝑧 ↦→ 1𝑧¯ è l’inversione circolare rispetto al cerchio unitario di
ℂ: i punti sulla circonferenza unitaria vengono lasciati fissi, i punti all’interno vengono
mandati all’esterno rimanendo sullo stesso raggio uscente dall’origine e invertendo il
proprio modulo. I punti 0 e ∞ si scambiano.
Esercizio 1.78 (vertici di un triangolo equilatero). Si risolva l’equazione
𝑧3 − 1 = 0
nel campo complesso.
Svolgimento. Ricordiamo il prodotto notevole:
𝑧 3 − 1 = (𝑧 − 1)(𝑧 2 + 𝑧 + 1).
Dunque 𝑧 = 1 è una soluzione e le altre soluzioni devono risolvere l’equazione

𝑧 2 + 𝑧 + 1 = 0. Certamente 𝑧 = 0 non è soluzione e dunque possiamo dividere
per 𝑧 e ottenere:
1
𝑧 + 1 + = 0.
𝑧
Osserviamo ora che se 𝑧 è soluzione si ha 1 = 𝑧 3 e quindi: 1 = 𝑧 3 = |𝑧| 3 da cui

|𝑧| = 1. Ma allora 𝑧 · 𝑧¯ = |𝑧| 2 = 1 ovvero 1𝑧 = 𝑧¯ . Dunque si ha
𝑧 + 1 + 𝑧¯ = 0.
Osserviamo ora che se 𝑧 = 𝑥 + 𝑖 𝑦 con 𝑥, 𝑦 ∈ ℝ allora 𝑧 + 𝑧¯ = 2 𝑥 e quindi
2𝑥 + 1 = 0
da cui 𝑥 = − 12 . Essendo inoltre 𝑥 2 + 𝑦 2 = |𝑧| 2 = 1 si ottiene 𝑦 2 = 1 − 𝑥 2 = 3

4 da
√
cui 𝑦 = ± 23 .
L’equazione data ha quindi 3 soluzioni:
√
1 3
𝑧0 = 1, 𝑧 1 ,2 =− ±𝑖 .
2 2
Questi tre punti, se disegnati sul piano di Gauss, si trovano ai vertici di un

triangolo equilatero iscritto nella circonferenza unitaria. Infatti l’interpretazione
geometrica del prodotto di numeri complessi ci dice che il punto 𝑧 1 individua
sul piano di Gauss un angolo pari ad un terzo dell’angolo giro. Inoltre si ha
𝑧2 = 𝑧12 e dunque 𝑧2 corrisponde a 23 di angolo giro e 𝑧0 = 𝑧 13 = 1 rappresenta
l’angolo giro (o l’angolo nullo).
funzioni continue, limiti e
successioni 2
2.1 funzioni continue
Intuitivamente una funzione continua ha la proprietà che se in un punto 𝑥 0

assume un valore 𝑦0 = 𝑓 (𝑥 0 ) allora in punti abbastanza vicini ad 𝑥 0 i valori
assunti non saranno molto diversi dal valore 𝑦0 . Nella definizione seguente
questo viene formalizzato: fissato il punto 𝑥 0 e scelto un errore 𝜀 > 0 che siamo
disposti a commettere sui valori della funzione possiamo trovare un errore
𝛿 > 0 per cui nei punti che differiscono da 𝑥0 per meno di 𝛿 il valore della
funzione differisce da 𝑦0 per meno di 𝜀.
Definizione 2.1 (continuità su ℝ). Sia 𝑓 : 𝐴 ⊆ ℝ → ℝ una funzione. Diremo che

𝑓 è continua nel punto 𝑥0 ∈ 𝐴 se continua nel punto
∀𝜀 > 0 : ∃𝛿 > 0 : ∀𝑥 ∈ 𝐴 : |𝑥 − 𝑥0 | < 𝛿 =⇒ | 𝑓 (𝑥) − 𝑓 (𝑥0 )| < 𝜀. (2.1)
Diremo che 𝑓 : 𝐴 → ℝ è continua se è continua in ogni punto 𝑥 0 ∈ 𝐴. continua
Attenzione: la funzione 𝑓 (𝑥) = 𝑥1 assume vicino a 𝑥 = 0 valori molto diversi tra

loro (ad esempio 𝑓 (0.01) − 𝑓 (−0.01) = 200) ma ciò non toglie che la funzione
possa essere continua in quanto il punto 𝑥 = 0 non appartiene al dominio e
quindi, in base alla definizione precedente, non ha senso e non ha importanza
verificare se la funzione è continua in tale punto.
Teorema 2.2 (continuità del reciproco). La funzione 𝑓 : ℝ \ {0} → ℝ definita da

𝑓 (𝑥) = 𝑥1 è una funzione continua.
|𝑥 0 |
Dimostrazione. Siano 𝑥, 𝑥 0 ≠ 0. Se prendiamo 𝛿 < 2 e se |𝑥 − 𝑥 0 | < 𝛿 si avrà,
|𝑥0 |
per disuguaglianza triangolare inversa, |𝑥| > 2 . Dunque
− 1 = |𝑥 − 𝑥0 | ≤ 2𝛿 .

1
𝑥 𝑥0 |𝑥 · 𝑥0 | |𝑥0 | 2
Si ottiene quindi la condizione | 𝑓 (𝑥) − 𝑓 (𝑥 0 )| < 𝜀 se si sceglie 𝛿 in modo che

|𝑥 0 | 2 ·𝜀
risulti anche 𝛿 < 2 .
funzione segno
Esempio 2.3. La funzione segno sgn : ℝ → ℝ definita da


 1 se 𝑥 > 0


sgn(𝑥) = 0 se 𝑥 = 0

 −1 se 𝑥 < 0


è un esempio di funzione non continua.
68 2 funzioni continue, limiti e successioni
Dimostrazione. Verifichiamo che la funzione non è continua nel punto 𝑥 0 = 0.

Infatti se 𝑥 ≠ 0 si ha
| sgn(𝑥) − sgn(𝑥0 )| = | sgn(𝑥)| = 1
e quindi se scegliamo 𝜀 < 1 non è possibile trovare 𝛿 > 0 per cui valga la
condizione di continuità (2.1) nel punto 𝑥 0 = 0.
Esercizio 2.4. Dimostrare che le funzioni 𝑓 (𝑥) = 𝑥 e 𝑔(𝑥) = |𝑥| sono continue.
Dimostrare che le funzioni ℎ(𝑥) = b𝑥c e 𝑘(𝑥) = d𝑥e non sono continue (ma sono
continue in ogni punto 𝑥 0 ∈ ℝ \ ℤ).
Definizione 2.5 (operazioni sulle funzioni). Sia 𝐴 ⊆ ℝ e siano 𝑓 , 𝑔 funzioni

𝐴 → ℝ. Possiamo allora definire 𝑓 + 𝑔 , − 𝑓 , 𝑓 − 𝑔 , 𝑓 · 𝑔 , | 𝑓 | , 𝑓 𝑛 (con 𝑛 ∈ ℕ ) e (se
𝑔(𝑥) ≠ 0 per ogni 𝑥 ∈ 𝐴) anche 𝑓 /𝑔 come funzioni 𝐴 → ℝ mediante le seguenti
ovvie definizioni
( 𝑓 + 𝑔)(𝑥) = 𝑓 (𝑥) + 𝑔(𝑥), ( 𝑓 − 𝑔)(𝑥) = 𝑓 (𝑥) − 𝑔(𝑥),

( 𝑓 · 𝑔)(𝑥) = 𝑓 (𝑥) · 𝑔(𝑥), ( 𝑓 /𝑔)(𝑥) = 𝑓 (𝑥)/𝑔(𝑥),
(− 𝑓 )(𝑥) = −( 𝑓 (𝑥)), | 𝑓 |(𝑥) = | 𝑓 (𝑥)|, 𝑓 𝑛 (𝑥) = ( 𝑓 (𝑥))𝑛 .
Se 𝑓 : 𝐴 → 𝐵 e 𝑔 : 𝐵 → 𝐶 ricordiamo che abbiamo definito la funzione composta

𝑔 ◦ 𝑓 : 𝐴 → 𝐶:
(𝑔 ◦ 𝑓 )(𝑥) = 𝑔( 𝑓 (𝑥)).
Se 𝑐 ∈ ℝ è un numero considereremo a volte 𝑐 : 𝐴 → ℝ come una funzione costante.

Risulta quindi inteso che se 𝑐 ∈ ℝ e 𝑓 : 𝐴 → ℝ allora 𝑐 · 𝑓 è la funzione definita da
(𝑐 · 𝑓 )(𝑥) = 𝑐 · ( 𝑓 (𝑥)). La somma e il prodotto per costante rendono l’insieme ℝ𝐴 delle
funzioni 𝐴 → ℝ uno spazio vettoriale sul campo ℝ.
Teorema 2.6 (composizione di funzioni continue). Se 𝑓 e 𝑔 sono funzioni definite

e continue in uno stesso punto 𝑥 0 allora anche
𝑓 + 𝑔, 𝑓 · 𝑔, 𝑓 − 𝑔, | 𝑓 |, 𝑓 𝑛 (con 𝑛 ∈ ℕ )
sono funzioni definite e continue nel punto 𝑥 0 . Se inoltre 𝑔(𝑥 0 ) ≠ 0 anche la funzione
𝑓 /𝑔 è definita e continua nel punto 𝑥 0 .
Se 𝑓 : 𝐴 ⊆ ℝ → ℝ è una funzione continua nel punto 𝑥 0 ∈ 𝐴 e 𝑔 : 𝐵 ⊆ ℝ → ℝ è

una funzione continua nel punto 𝑦0 = 𝑓 (𝑥 0 ) ∈ 𝐵 allora la funzione 𝑔 ◦ 𝑓 definita in
𝑓 −1 (𝐵) è continua nel punto 𝑥 0 .
Dimostrazione. Mostriamo prima di tutto la continuità della composizione 𝑔 ◦ 𝑓 .

Per la continuità di 𝑓 in 𝑥 0 e di 𝑔 in 𝑦0 = 𝑓 (𝑥 0 ) si ha che per ogni 𝜀 > 0 esiste un
𝛾 > 0 e per ogni 𝛾 > 0 esiste un 𝛿 > 0 per cui
|𝑥 − 𝑥0 | < 𝛿 =⇒ | 𝑓 (𝑥) − 𝑓 (𝑥 0 )| < 𝛾,

|𝑦 − 𝑦0 | < 𝛾 =⇒ | 𝑔(𝑦) − 𝑔(𝑦0 )| < 𝜀
2.1 funzioni continue 69
da cui
|𝑥 − 𝑥0 | < 𝛿 =⇒ | 𝑓 (𝑥) − 𝑓 (𝑥 0 )| < 𝛾 =⇒ | 𝑔( 𝑓 (𝑥)) − 𝑔( 𝑓 (𝑥0 ))| < 𝜀
che non è altro che la condizione di continuità (2.1) per 𝑔 ◦ 𝑓 .
Se 𝑓 e 𝑔 sono continue nel punto 𝑥 0 allora per ogni 𝜀0 > 0 esistono 𝛿 1 e 𝛿 2 tali
che
|𝑥 − 𝑥0 | < 𝛿1 =⇒ | 𝑓 (𝑥) − 𝑓 (𝑥0 )| < 𝜀0 ,

|𝑥 − 𝑥0 | < 𝛿2 =⇒ | 𝑔(𝑥) − 𝑔(𝑥 0 )| < 𝜀0 .
In particolare scegliendo 𝛿 = min {𝛿 1 , 𝛿 2 } se |𝑥 − 𝑥 0 | < 𝛿 valgono contempora-

neamente entrambe le stime:
| 𝑓 (𝑥) − 𝑓 (𝑥0 )| < 𝜀0 , | 𝑔(𝑥) − 𝑔(𝑥0 )| < 𝜀0 .
Dunque per la somma osserviamo che se |𝑥 − 𝑥 0 | < 𝛿 si ha
|( 𝑓 + 𝑔)(𝑥) − ( 𝑓 + 𝑔)(𝑥0 )| = | 𝑓 (𝑥) + 𝑔(𝑥) − 𝑓 (𝑥0 ) − 𝑔(𝑥0 )|

≤ | 𝑓 (𝑥) − 𝑓 (𝑥 0 )| + | 𝑔(𝑥) − 𝑔(𝑥0 )| ≤ 2 𝜀0 .
Dato 𝜀 > 0 basterà quindi scegliere 𝜀0 = 𝜀/2 e 𝛿 come sopra per ottenere la
condizione di continuità.
Per il prodotto si ha
| 𝑓 (𝑥)𝑔(𝑥) − 𝑓 (𝑥0 )𝑔(𝑥0 )|

= | 𝑓 (𝑥)𝑔(𝑥) − 𝑓 (𝑥0 )𝑔(𝑥) + 𝑓 (𝑥0 )𝑔(𝑥) − 𝑓 (𝑥0 )𝑔(𝑥0 )|
≤ | 𝑓 (𝑥) − 𝑓 (𝑥0 )| · | 𝑔(𝑥)| + | 𝑓 (𝑥0 )| · | 𝑔(𝑥) − 𝑔(𝑥0 )|
≤ 𝜀0 | 𝑔(𝑥)| + | 𝑓 (𝑥 0 )|𝜀0 .
Osserviamo ora che | 𝑔(𝑥)| ≤ | 𝑔(𝑥) − 𝑔(𝑥 0 )|+| 𝑔(𝑥 0 )| e quindi | 𝑔(𝑥)| ≤ | 𝑔(𝑥 0 )|+𝜀0
da cui:
| 𝑓 (𝑥)𝑔(𝑥) − 𝑓 (𝑥0 )𝑔(𝑥 0 )| ≤ 𝜀0(| 𝑔(𝑥0 )| + 𝜀0) + | 𝑓 (𝑥0 )|𝜀0

= 𝜀0 · (| 𝑓 (𝑥0 )| + | 𝑔(𝑥0 )| + 𝜀0).
Possiamo facilmente rendere questa quantità inferiore a qualunque 𝜀 > 0:

basterà prendere 𝜀0 < 1 e
𝜀
𝜀0 < .
| 𝑓 (𝑥0 )| + | 𝑔(𝑥0 )| + 1
La funzione 𝑓 𝑛 è continua per induzione su 𝑛 in quanto prodotto di funzioni

continue: 𝑓 𝑛+1 = 𝑓 𝑛 · 𝑓 .
Abbiamo già visto che la funzione ℎ(𝑥) = 𝑥1 è continua, dunque se 𝑔 è continua

1
anche la funzione 𝑔(𝑥) = ℎ ◦ 𝑔 è continua essendo composizione di funzioni
𝑓
continue. Di conseguenza anche la funzione 𝑔 = 𝑓 · 1
𝑔 è continua, essendo il
prodotto di funzioni continue.
Analogamente la funzione 𝑓 − 𝑔 è la somma di 𝑓 con −𝑔 e la funzione −𝑔 è

la composizione di 𝑔 con ℎ(𝑥) = −𝑥 . E’ immediato verificare che la funzione
ℎ(𝑥) = −𝑥 è continua e dunque anche la differenza 𝑓 − 𝑔 è continua. Lo stesso
vale per la funzione | 𝑓 | che è la composizione di 𝑓 con la funzione ℎ(𝑥) = |𝑥| .
Il precedente teorema è molto importante ed utile in quanto garantisce che ogni

funzione definita tramite una espressione che coinvolge solamente le funzioni e
le operazioni elencate nell’enunciato del teorema, risulta certamente essere una
funzione continua. Come nel seguente.
Esempio 2.7. La funzione
(𝑥 − 3) · 𝑥 − 1
𝑥+𝑥
2
𝑓 (𝑥) =
1−𝑥 3
𝑥 −

𝑥
è continua.
Si intende che tale funzione è definita sull’insieme degli 𝑥 ∈ ℝ per cui tutte le operazioni
coinvolte sono definite ovvero 𝑓 : 𝐷 ⊆ ℝ → ℝ con
1 − 𝑥 3

𝐷 = 𝑥 ∈ ℝ : 𝑥 + 𝑥 ≠ 0, 𝑥 ≠ 0, 𝑥 − ≠0 .
2

𝑥
Per convincersi che questa funzione 𝑓 è continua si nota che le funzioni 𝑥 e le costanti
3 e 1 sono funzioni continue. Ma allora, per il teorema 2.6, anche le funzioni 𝑥 − 3
e 𝑥 2 = 𝑥 · 𝑥 sono continue. Dunque anche (𝑥 − 3) · 𝑥 , 𝑥 + 𝑥 2 e 𝑥 3 e 1 − 𝑥 3 sono
1 1−𝑥 3
continue. Di conseguenza sono continue pure 1+𝑥 2 e 𝑥 . E poi saranno continue

1−𝑥 3 1−𝑥 3 1−𝑥 3
anche (𝑥 − 3) · 𝑥 − 1
e𝑥− e quindi 𝑥 − e pure 𝑥 − 𝑥 . Infine sarà

1+𝑥 2 𝑥 𝑥
dunque continua 𝑓 (𝑥).
In particolare è chiaro che le funzioni lineare e quadratiche che abbiamo

introdotto nelle sezioni precedenti sono funzioni continue in quanto sono
ottenute sommando e moltiplicando tra loro funzioni continue.
Teorema 2.8 (continuità delle funzioni monotone). Sia 𝐼 ⊆ ℝ un intervallo e sia

𝑓 : 𝐼 → ℝ una funzione monotòna. Allora 𝑓 è continua se e solo se 𝑓 (𝐼) è un intervallo.
Dimostrazione. Senza perdita di generalità possiamo supporre che 𝑓 sia crescente.

Dimostriamo innanzitutto che se 𝑓 (𝐼) è intervallo allora 𝑓 è continua.
Prendiamo un punto 𝑥 0 ∈ 𝐼 e sia 𝜀 > 0. Vogliamo trovare 𝑥 1 < 𝑥 0 tale che per
ogni 𝑥 ∈ [𝑥 1 , 𝑥 0 ] ∩ 𝐼 si abbia 𝑓 (𝑥) > 𝑓 (𝑥 0 ) − 𝜀. Siccome 𝑓 (𝐼) è un intervallo
che contiene il punto 𝑓 (𝑥 0 ) ci sono due possibilità: o 𝑓 (𝑥) > 𝑓 (𝑥 0 ) − 𝜀 per ogni
𝑥 ∈ 𝐼 e quindi possiamo scegliere 𝑥1 < 𝑥0 a piacere oppure esiste 𝑥1 ∈ 𝐼 tale
che 𝑓 (𝑥 1 ) = 𝑓 (𝑥 0 ) − 2𝜀 . In questo secondo caso dovrà essere 𝑥 1 < 𝑥 0 (in quanto
𝑓 è crescente) e per monotonia si avrà, come voluto 𝑓 (𝑥) ≥ 𝑓 (𝑥1 ) > 𝑓 (𝑥0 ) − 𝜀
per ogni 𝑥 ∈ [𝑥 1 , 𝑥 0 ].
In modo analogo possiamo trovare 𝑥 2 > 𝑥 0 tale che per ogni 𝑥 ∈ [𝑥 0 , 𝑥 2 ] ∩ 𝐼
si abbia 𝑓 (𝑥) < 𝑓 (𝑥 0 ) + 𝜀. Essendo 𝑓 crescente se 𝑥 ≥ 𝑥 0 si avrà anche
2.1 funzioni continue 71
𝑓 (𝑥) ≥ 𝑓 (𝑥0 ) e se 𝑥 ≤ 𝑥0 si avrà 𝑓 (𝑥) ≤ 𝑓 (𝑥0 ). Dunque per ogni 𝑥 ∈ [𝑥 1 , 𝑥2 ]

si avrà | 𝑓 (𝑥) − 𝑓 (𝑥 0 )| < 𝜀. Basterà scegliere 𝛿 = min {𝑥 0 − 𝑥 1 , 𝑥 2 − 𝑥 0 } per
ottenere la continuità di 𝑓 in 𝑥 0 .
Supponiamo ora che 𝑓 sia una funzione continua e crescente. Vogliamo

dimostrare che 𝑓 (𝐼) è un intervallo.
Siano 𝑦1 , 𝑦2 ∈ 𝑓 (𝐼) e sia 𝑦0 ∈ ℝ con 𝑦1 < 𝑦0 < 𝑦2 . Vogliamo dimostrare che

𝑦0 ∈ 𝑓 (𝐼) cioè che esiste 𝑥 0 ∈ 𝐼 tale che 𝑓 (𝑥0 ) = 𝑦0 . Sappiamo che esistono 𝑥 1 , 𝑥2
in 𝐼 tali che 𝑓 (𝑥 1 ) = 𝑦1 e 𝑓 (𝑥 2 ) = 𝑦2 . Dovrà essere 𝑥 1 < 𝑥 2 perché 𝑓 (𝑥 1 ) < 𝑓 (𝑥 2 )
e 𝑓 è strettamente crescente. Definiamo:
𝑥0 = sup 𝐴 con 𝐴 = {𝑥 ∈ 𝐼 : 𝑓 (𝑥) < 𝑦0 },
e dimostriamo che 𝑓 (𝑥 0 ) = 𝑦0 . Chiaramente 𝑥 0 ∈ [𝑥 1 , 𝑥 2 ] in quanto 𝑥 1 ∈ 𝐴 e 𝑥 2

è un maggiorante di 𝐴 e dunque 𝑓 è definita e continua in 𝑥 0 .
Se fosse 𝑓 (𝑥 0 ) < 𝑦0 scelto 𝜀 = 𝑦0 − 𝑓 (𝑥 0 ) per la definizione di continuità dovrebbe

esistere 𝛿 > 0 tale che per ogni 𝑥 ∈ 𝐼 con |𝑥 − 𝑥 0 | < 𝛿 si abbia | 𝑓 (𝑥) − 𝑓 (𝑥 0 )| < 𝜀.
In particolare scelto 𝑥 = 𝑥 0 + 𝛿2 si avrebbe 𝑓 (𝑥) < 𝑓 (𝑥 0 ) + 𝜀 = 𝑦0 . Ma allora
avremmo 𝑥 ∈ 𝐴 che è assurdo in quanto sup 𝐴 = 𝑥 0 < 𝑥 .
Se fosse invece 𝑓 (𝑥 0 ) > 𝑦0 posto 𝜀 = 𝑓 (𝑥 0 ) − 𝑦0 , grazie alla continuità di 𝑓 in

𝑥0 , possiamo trovare 𝛿 > 0 tale che per ogni 𝑥 ∈ 𝐼 con |𝑥 − 𝑥0 | < 𝛿 si abbia
| 𝑓 (𝑥) − 𝑓 (𝑥0 )| < 𝜀. In particolare scelto 𝑡 = 𝑥 0 − 𝛿2 si ha 𝑓 (𝑡) > 𝑓 (𝑥 0 ) − 𝜀 = 𝑦0 .
Ma essendo 𝑡 < 𝑥 0 = sup 𝐴 sappiamo che 𝑡 non può essere un maggiorante di 𝐴
dunque deve esistere 𝑥 ∈ 𝐴 tale che 𝑡 < 𝑥 . Ma se 𝑥 ∈ 𝐴 allora 𝑓 (𝑥) < 𝑦0 < 𝑓 (𝑡)
che è assurdo in quanto 𝑓 è crescente.
Abbiamo quindi mostrato che 𝑓 (𝑥 0 ) = 𝑦0 e dunque che 𝑓 (𝐼) è un intervallo.
Il teorema 2.8 precedente ci permette di affermare che per 𝑎 > 0, 𝑎 ≠ 1 le funzioni

exp 𝑎 e log 𝑎 sono continue. Infatti tali funzioni sono bigezioni monotone tra gli
intervalli ℝ e ℝ+ .
Grazie al teorema 2.6 sappiamo che se 𝑛 ∈ ℕ la funzione 𝑥 𝑛 è continua su tutto

√
il suo dominio ℝ. La funzione inversa 𝑛 𝑥 è anch’essa crescente e bigettiva
come funzione [0 , +∞) → [0 , +∞) e dunque anch’essa risulta essere continua.
√
Per simmetria (si veda l’esercizio 2.9) possiamo concludere che le radici 𝑛 𝑥
sono funzioni continue su tutto il loro dominio. Anche la funzione 𝑓 (𝑥) = 𝑥 𝛼 ,
1
𝑓 : [0 , +∞) → [0 , +∞] con 𝛼 > 0 è crescente ed è invertibile (l’inversa è 𝑥 𝛼 )
e dunque è surgettiva e continua. Se 𝛼 < 0 la funzione 𝑓 (𝑥) = 𝑥 𝛼 è definita
sull’intervallo (0 , +∞) ed è anch’essa continua in quanto composizione di
funzioni continue: 𝑥 𝛼 = 𝑥 −𝛼
1
.
Esercizio 2.9. Sia 𝑓 : ℝ → ℝ una funzione pari oppure dispari. Se la restrizione di 𝑓

all’intervallo [0 , +∞) è continua allora 𝑓 è continua su tutto ℝ.
2.2 limite di funzione
Se una funzione 𝑓 non è definita in un punto 𝑥 0 non ha senso chiedersi se in tale

punto è continua. Possiamo però chiederci se è possibile definire la funzione
anche nel punto 𝑥 0 dando un valore opportuno ℓ in modo da rendere 𝑓 continua
in quel punto. Se ciò è possibile diremo che la funzione 𝑓 (𝑥) ha limite ℓ per 𝑥
che tende a 𝑥 0 e scriveremo:
𝑓 (𝑥) → ℓ per 𝑥 → 𝑥 0
(daremo tra poco una definizione con maggiore precisione e generalità).
Ad esempio la funzione 𝑓 (𝑥) = 𝑥𝑥−−11 è una funzione definita per 𝑥 ≠ 1 e coincide,

2
se 𝑥 ≠ 1 con la funzione lineare 𝑓˜(𝑥) = 𝑥 + 1 definita su tutto ℝ. Visto che 𝑓˜ è

continua e 𝑓˜(1) = 2 scriveremo:
𝑥2 − 1
→2 per 𝑥 → 1.
𝑥−1
Se estendiamo 𝑓 con un valore ℓ nel punto 𝑥 0 otteniamo in generale la funzione

(
𝑓 (𝑥) se 𝑥 ≠ 𝑥0
𝑓˜(𝑥) =
ℓ se 𝑥 = 𝑥 0
e la continuità di 𝑓˜ nel punto 𝑥 0 si scrive così:

∀𝜀 > 0 : ∃𝛿 > 0 : |𝑥 − 𝑥0 | < 𝛿 =⇒ 𝑓˜(𝑥) − 𝑓˜(𝑥0 ) < 𝜀.

Osserviamo che se 𝑥 = 𝑥 0 allora ovviamente 𝑓˜(𝑥) − 𝑓˜(𝑥 0 ) = 0 < 𝜀 dunque

possiamo supporre, nella condizione precedente, che sia 𝑥 ≠ 𝑥 0 e dunque
𝑓˜(𝑥) = 𝑓 (𝑥). Inoltre visto che 𝑓˜(𝑥0 ) = ℓ si ottiene la seguente condizione:

∀𝜀 > 0 : ∃𝛿 > 0 : ∀𝑥 ≠ 𝑥0 : |𝑥 − 𝑥0 | < 𝛿 =⇒ 𝑓˜(𝑥) − ℓ < 𝜀. (2.2)

La (2.2) potrebbe dunque essere utilizzata per definire il concetto di limite

𝑓 (𝑥) → ℓ per 𝑥 → 𝑥0 . Sarà però molto utile estendere il concetto di limite
𝑓 (𝑥) → ℓ per 𝑥 → 𝑥0 anche nei casi in cui ℓ e/o 𝑥0 possano essere infiniti (cioè
elementi dei reali estesi ℝ̄).
Per fare ciò osserviamo che se definiamo 𝐵𝜌 (𝑥 0 ) = {𝑥 ∈ ℝ : |𝑥 − 𝑥 0 | < 𝜌} la

condizione (2.2) può essere scritta anche nella forma
∀𝜀 > 0 : ∃𝛿 > 0 : 𝑥 ∈ 𝐵 𝛿 (𝑥0 ) \ {𝑥0 } =⇒ 𝑓˜(𝑥) ∈ 𝐵 𝜀 (ℓ )

la lettera 𝐵 sta per ball in quanto più in
generale (se fossimo in ℝ3 invece che in che a sua volta si può scrivere nella forma:
ℝ) l’insieme dei punti che distano meno
di 𝜌 da un punto fissato è l’interno di
una sfera piena. In geometria una sfera
∀𝜀 > 0 : ∃𝛿 > 0 : 𝑓 (𝐵 𝛿 (𝑥0 ) \ {𝑥 0 }) ⊆ 𝐵 𝜀 (ℓ ).
piena si chiama palla se contiene solo i
punti interni (e non la superficie sferica)
e si chiama disco o palla chiusa se contiene L’idea è che gli insiemi del tipo𝐵𝜌 (𝑥 0 ) rappresentano i punti vicini al punto
anche i punti della superficie.
2.2 limite di funzione 73
𝑥0 . In analogia potremmo pensare che i punti vicini a +∞ siano i punti di una

qualunque semiretta del tipo (𝑀, +∞]. Si dà quindi la seguente.
Definizione 2.10 (intorno). Per 𝑥 ∈ ℝ definiamo la famiglia degli intorni (basilari) intorni
di 𝑥 come l’insieme di tutti gli intervallini aperti, simmetrici, centrati in 𝑥 :
B𝑥 = {(𝑥 − 𝜀, 𝑥 + 𝜀) : 𝜀 > 0}.
Definiamo poi le famiglie degli intorni destri e intorni sinistri di 𝑥 come intorni destri/sinistri
B𝑥 + = {[𝑥, 𝑥 + 𝜀) : 𝜀 > 0}, B𝑥 − = {(𝑥 − 𝜀, 𝑥] : 𝜀 > 0}
e le famiglie degli intorni di +∞ e −∞ come segue
B+∞ = {(𝛼, +∞], : 𝛼 ∈ ℝ}, B−∞ = {[−∞, −𝛽), : 𝛽 ∈ ℝ}.
Per ogni 𝑥 ∈ ℝ̄ = [−∞, +∞] risultano quindi definiti gli intorni B𝑥 e per ogni 𝑥 ∈ ℝ
sono definiti gli intorni B𝑥 + e B𝑥 − .
Osservazione 2.11. Sarebbe possibile definire in maniera analoga gli intorni dei punti
in ℝ𝑛 (per l’analisi di funzioni di più variabili) o in ℂ (per l’analisi complessa). Ma in
questo corso e in questo capitolo in particolare siamo interessati allo studio delle funzioni
di una singola variabile.
Su ℝ c’è una struttura di ordine totale che è utile preservare aggiungendo due punti
all’infinito: +∞ e −∞. Su ℝ𝑛 (e su ℂ, che in questo contesto possiamo identificare con
ℝ2 ) non c’è una struttura d’ordine naturale e quindi usualmente si considera un unico
punto all’infinito ∞ i cui intorni saranno
B∞ = {{𝑥 ∈ ℝ𝑛 : |𝑥| > 𝑅} : 𝑅 > 0}.
Su ℝ𝑛 (e su ℂ) non esiste il concetto di intorno destro e sinistro proprio perché questi

concetti presuppongono un ordinamento.
In certi casi può tornare utile considerare un unico punto all’infinito, denotato con
∞, anche in ℝ (in molti testi tale punto verrebbe denotato con il simbolo ±∞) e si
potrebbero usare le notazioni +∞ = ∞− e −∞ = ∞+ visto che gli intorni di +∞ e −∞
sono in effetti intorni unilaterali del punto all’infinito.
Definizione 2.12 (limite di funzione). Sia 𝐴 ⊆ ℝ e 𝑓 : 𝐴 → ℝ. Sia 𝑥 0 ∈

[−∞, +∞] e sia ℓ ∈ [−∞, +∞]. Allora diremo che la funzione 𝑓 ha limite ℓ per 𝑥 che
tende a 𝑥 0 e scriveremo limite di funzione
𝑓 (𝑥) → ℓ per 𝑥 → 𝑥 0
se per ogni intorno di ℓ esiste un intorno di 𝑥 0 tale che la funzione valutata nell’intorno
di 𝑥 0 , tolto eventualmente 𝑥 0 , assume valori nell’intorno di ℓ :
∀𝑉 ∈ Bℓ : ∃𝑈 ∈ B𝑥0 : 𝑓 (𝑈 \ {𝑥0 }) ⊆ 𝑉. (2.3)
La stessa definizione può essere data restringendosi agli intorni destri/sinistri del
punto 𝑥 0 (nel caso 𝑥 0 ∈ ℝ). Si otterranno quindi le definizioni di limite destro e
limite destro/sinistro
limite sinistro semplicemente sostituendo B𝑥0+ o B𝑥0− al posto di B𝑥0 nella definizione
precedente. In tal caso scriveremo 𝑓 (𝑥) → ℓ per 𝑥 → 𝑥 0+ per il limite destro e 𝑓 (𝑥) → ℓ
per 𝑥 → 𝑥 0− per il limite sinistro.
Infine anche il risultato del limite può essere ℓ + o ℓ − , in tal caso useremo Bℓ + o Bℓ − al
posto di Bℓ .
Esempio 2.13. Si consideri la funzione segno:


 1 se 𝑥 > 0 ,


sgn(𝑥) = 0 se 𝑥 = 0 ,

 −1 se 𝑥 < 0.


Si può verificare che
sgn(𝑥) → 1 per 𝑥 → 0+
e
sgn(𝑥) → −1 per 𝑥 → 0−
Abbiamo già visto che nel caso in cui 𝑥 0 ∈ ℝ e ℓ ∈ ℝ siano entrambi finiti la
definizione di limite 𝑓 (𝑥) → ℓ per 𝑥 → 𝑥 0 si traduce nella condizione (2.2).
Anche negli altri casi esplicitando le definizioni di intorno si possono ottenere
delle condizioni più esplicite. Ad esempio la condizione 𝑓 (𝑥) → −∞ per
𝑥 → 𝑥0+ si traduce nel modo seguente:
∀𝛽 ∈ ℝ∃𝛿 > 0 : 𝑥0 < 𝑥 < 𝑥0 + 𝛿 =⇒ 𝑓 (𝑥) < −𝛽.
Visto che ci sono cinque diversi casi per il punto 𝑥 0 : 𝑥 0 ∈ ℝ, 𝑥 0+ , 𝑥 0− , +∞, −∞ e

altrettanti casi per ℓ (in effetti anche il risultato del limite può essere destro o
sinistro), si ottengono in tutto 25 diverse definizioni di limite.
In tutte queste definizioni di limite è sottointeso che i punti 𝑥 che vengono presi
in considerazione sono punti del dominio di 𝑓 : 𝐴 ⊆ ℝ → ℝ. Accade allora che
se esiste un intorno 𝑉 ∈ B𝑥0 per cui 𝐴 ∩ 𝑉 \ {𝑥 0 } è vuoto allora la condizione
di limite è vuota ed è quindi sempre verificata qualunque sia il valore di ℓ . E’
quindi inutile fare il limite per 𝑥 → 𝑥 0 se 𝑥 0 non soddisfa la seguente.
Definizione 2.14 (punto di accumulazione). Siano 𝐴 ⊆ ℝ un insieme e 𝑥 0 ∈

[−∞, +∞]. Diremo che 𝑥0 è un punto di accumulazione di 𝐴 se ogni intorno di 𝑥0
punto di accumulazione
contiene punti di 𝐴 diversi da 𝑥 0 , ovvero:
∀𝑈 ∈ B𝑥0 : (𝐴 \ {𝑥}) ∩ 𝑈 ≠ ∅.
Stessa definizione si può dare per 𝑥 0+ e 𝑥 0− utilizzando gli intorni destri/sinistri di 𝑥 0 .
Teorema 2.15 (unicità del limite). Sia 𝐴 ⊆ ℝ, 𝑓 : 𝐴 → ℝ, 𝑥 0 punto di accumula-

zione per 𝐴 e ℓ 1 , ℓ 2 ∈ [−∞, +∞]. Se per 𝑥 → 𝑥 0 si ha
𝑓 (𝑥) → ℓ1 e 𝑓 (𝑥) → ℓ 2
allora ℓ 1 = ℓ 2 .
Risultato analogo si ha per i limiti destro e sinistro: 𝑥 → 𝑥 0+ , 𝑥 → 𝑥 0− .
Dimostrazione. Supponiamo per assurdo che ℓ 1 ≠ ℓ 2 . Allora esiste un intorno

𝑉1 di ℓ1 ed un intorno 𝑉2 di ℓ2 tali che 𝑉1 ∩ 𝑉2 = ∅ (basta prendere degli intorni
abbastanza piccoli). Ma per le definizioni di limite 𝑓 (𝑥) → ℓ 1 e 𝑓 (𝑥) → ℓ 2
dovranno esistere 𝑈1 e 𝑈2 intorni di 𝑥 0 su cui si ha 𝑓 (𝑈1 ) ⊆ 𝑉1 e 𝑓 (𝑈2 ) ⊆ 𝑉2 .
Ma allora 𝑓 ((𝐴 \ {𝑥 0 }) ∩ 𝑈1 ) ∩ 𝑓 ((𝐴 \ {𝑥 0 }) ∩ 𝑈2 ) ⊆ 𝑉1 ∩ 𝑉2 = ∅... e questo è
assurdo perché certamente 𝑈1 ∩ 𝑈2 contiene punti di 𝐴 diversi da 𝑥 0 in quanto
𝑈1 e 𝑈2 sono uno contenuto nell’altro e 𝑥0 è un punto di accumulazione per
𝐴.
Il teorema precedente garantisce che se 𝑥 0 è un punto di accumulazione del

dominio di 𝑓 allora il limite per 𝑥 → 𝑥 0 se esiste è unico. In tal caso possiamo
dunque dare la seguente.
Definizione 2.16 (operatore di limite). Sia 𝑓 : 𝐴 ⊆ ℝ → ℝ una funzione e 𝑥 0

un punto di accumulazione per 𝐴. Se esiste ℓ ∈ [−∞, +∞] tale che 𝑓 (𝑥) → ℓ per
𝑥 → 𝑥 0 allora poniamo
lim 𝑓 (𝑥) = ℓ .
𝑥→𝑥 0
Lo stesso si può fare per il limite destro 𝑥 → 𝑥 0+ e sinistro 𝑥 → 𝑥 0− .
Abbiamo visto che in un punto di accumulazione se il limite esiste allora è unico.

Sarà però utile osservare che in effetti il limite può non esistere, come si può
verificare con un esempio.
Esempio 2.17 (in generale il limite non esiste). Il limite

𝑥
lim
𝑥→0 |𝑥|
𝑥
non esiste. Osserviamo infatti che la funzione 𝑓 (𝑥) = |𝑥|
vale 1 se 𝑥 > 0 e −1 se 𝑥 < 0.
Dunque se il limite esistesse e fosse ℓ ∈ ℝ̄ scelto 𝜀 = 1 dovrebbe esistere un intervallo
intorno di 0 della forma (−𝛿, 𝛿) tale che | 𝑓 (𝑥) − ℓ | < 1 per ogni 𝑥 in tale intervallo.
In particolare siccome in tale intervallo ci sono sicuramente sia numeri positivi che
negativi si dovrà avere contemporaneamente
| 1 − ℓ | < 1, |−1 − ℓ | < 1
che è impossibile in quanto per disuguaglianza triangolare
2 = | 1 − (−1)| ≤ | 1 − ℓ | + |−1 − ℓ | < 1 + 1 = 2
che è assurdo.
Si noti che nell’esempio precedente il limite per 𝑥 → 0 non esiste ma in realtà

esistono sia il limite per 𝑥 → 0+ (vale 1) che i limite per 𝑥 → 0− (vale 0).
Possiamo esibire un esempio “patologico” di funzione che non ammette limite

(né da destra né da sinistra) in nessun punto:
(
1 se 𝑥 ∈ ℚ
𝑓 (𝑥) =
0 se 𝑥 ∈ ℝ \ ℚ.
In ogni intervallo (𝑎, 𝑏) con 𝑎 < 𝑏 questa funzione assume sia il valore 0 che
il valore 1 in quanto sia ℚ che ℝ \ ℚ intersecano l’intervallo (sono insiemi
densi). Ma se 𝑓 avesse limite ℓ dovrebbe esistere un intervallo in cui i valori
distano meno di 𝜀 da ℓ e quindi dovrebbe essere | 1 − ℓ | < 𝜀 e | 0 − ℓ | < 𝜀 che è
impossibile se scegliamo 𝜀 < 12 .
Teorema 2.18 (collegamento tra limiti e continuità). Sia 𝐴 ⊆ ℝ, 𝑓 : 𝐴 → ℝ. Se

𝑥0 ∈ 𝐴 è un punto di accumulazione di 𝐴 allora 𝑓 è continua in 𝑥0 se e solo se
lim 𝑓 (𝑥) = 𝑓 (𝑥 0 ).
𝑥→𝑥 0
punto isolato Se 𝑥 0 ∈ 𝐴 non è punto di accumulazione diremo che 𝑥 0 è un punto isolato di 𝐴. In

tal caso la funzione 𝑓 è sempre continua nel punto 𝑥 0 .
Dimostrazione. In base alla definizione 2.1 la funzione 𝑓 è continua nel punto 𝑥 0

se
∀𝜀 > 0 : ∃𝛿 > 0 : ∀𝑥 ∈ 𝐴 : |𝑥 − 𝑥0 | < 𝛿 =⇒ | 𝑓 (𝑥) − 𝑓 (𝑥0 )| < 𝜀
mentre la definizione di limite 𝑓 (𝑥) → 𝑓 (𝑥 0 ) per 𝑥 → 𝑥 0 si espande in
∀𝜀 > 0 : ∃𝛿 > 0 : ∀𝑥 ∈ 𝐴, 𝑥 ≠ 𝑥0 : |𝑥 − 𝑥0 | < 𝛿 =⇒ | 𝑓 (𝑥) − 𝑓 (𝑥0 )| < 𝜀.
L’unica differenza è che nella definizione di limite c’è la condizione 𝑥 ≠ 𝑥 0 . Ma

visto che per 𝑥 = 𝑥 0 si ha | 𝑓 (𝑥) − 𝑓 (𝑥 0 )| = 0 tale condizione è in questo caso
inutile e quindi le due definizioni sono equivalenti.
Se il punto 𝑥 0 è isolato la definizione di continuità è sempre verificata in quanto

esiste un 𝛿 > 0 tale che il punto 𝑥 = 𝑥 0 è l’unico punto di 𝐴 nell’intorno
(𝑥0 − 𝛿, 𝑥0 + 𝛿).
Esempio 2.19. Non è difficile convincersi che gli unici punti di accumulazione per
l’insieme ℤ sono +∞ e −∞. Dunque qualunque funzione 𝑓 : ℤ → ℝ è continua in
quanto tutti i punti del suo dominio sono punti isolati.
Teorema 2.20 (località del limite). Il limite di una funzione per 𝑥 → 𝑥 0 dipende
solamente dai valori di 𝑓 in un intorno di 𝑥 0 e non dipende dal valore di 𝑓 in 𝑥 0 .
Più precisamente: se 𝐴, 𝐵 ⊆ ℝ, 𝑥 0 ∈ ℝ sono tali che esiste un intorno 𝑉 di 𝑥 0 per cui

(𝐴 \ {𝑥0 }) ∩ 𝑉 = (𝐵 \ {𝑥0 }) ∩ 𝑉 e 𝑓 (𝑥) = 𝑔(𝑥) per ogni 𝑥 ∈ (𝐴 \ {𝑥 0 }) ∩ 𝑉 allora
se 𝑓 (𝑥) → ℓ per 𝑥 → 𝑥 0 anche 𝑔(𝑥) → ℓ per 𝑥 → 𝑥 0 .
Dimostrazione. Basta osservare che nella definizione di limite non è restrittivo

supporre che l’intorno del punto 𝑥 0 sia sempre preso all’interno dell’intorno 𝑉
su cui le due funzioni coincidono.
Teorema 2.21 (restrizione del limite). Se una funzione ha limite ℓ per 𝑥 → 𝑥 0 e se

restringiamo l’insieme di definizione della funzione allora il limite della funzione non
cambia. Più precisamente se 𝑓 : 𝐴 → ℝ è una funzione tale che 𝑓 (𝑥) → ℓ per 𝑥 → 𝑥 0
e se 𝐵 ⊆ 𝐴 e 𝑔 : 𝐵 → ℝ è la restrizione di 𝑓 a 𝐵 allora anche 𝑔(𝑥) → ℓ per 𝑥 → 𝑥 0 .
Dimostrazione. Il teorema segue immediatamente dalla definizione di limite se

si osserva che restringendo il dominio la condizione di validità del limite si
indebolisce in quanto gli intorni di 𝑥 0 vengono intersecati con il dominio della
funzione.
Si osservi che a differenza del teorema sulla località del limite è possibile che
la funzione ristretta 𝑔 abbia limite quando la funzione 𝑓 non aveva limite. Si
osservi anche che in entrambi questi teoremi sarà opportuno che 𝑥 0 sia un punto
di accumulazione, altrimenti la condizione 𝑓 (𝑥) → ℓ risulta essere vuota.
Teorema 2.22 (legame tra limite, limite destro e limite sinistro). Sia 𝐴 ⊆ ℝ,
𝑓 : 𝐴 → ℝ una funzione e 𝑥0 un punto di accumulazione di 𝐴. Sia 𝐴+ = 𝐴∩[𝑥 0 , +∞)
e 𝐴− = 𝐴 ∩ (−∞, 𝑥 0 ].
Se 𝑥 0 è punto di accumulazione sia di 𝐴+ che di 𝐴− allora si ha
lim 𝑓 (𝑥) = ℓ
𝑥→𝑥0
se e solo se
lim 𝑓 (𝑥) = lim− 𝑓 (𝑥) = ℓ .
𝑥→𝑥 0+ 𝑥→𝑥0
Se 𝑥 0 è punto di accumulazione di 𝐴+ ma non di 𝐴− allora i limiti
lim 𝑓 (𝑥) e lim 𝑓 (𝑥)

𝑥→𝑥 0 𝑥→𝑥 0+
sono equivalenti. Analogamente se 𝑥 0 è punto di accumulazione di 𝐴− ma non di 𝐴+

risultano equivalenti
lim 𝑓 (𝑥) e lim− 𝑓 (𝑥).
𝑥→𝑥0 𝑥→𝑥0
Dimostrazione. Si tratta semplicemente di verificare le definizioni di limite

sfruttando il fatto che intorni di un punto 𝑥 0 sono formati dall’unione di intorno
destro e intorno sinistro.
Teorema 2.23 (limite della funzione composta/cambio di variabile). Siano

𝐴 ⊆ ℝ, 𝐵 ⊆ ℝ, 𝑥 0 un punto di accumulazione di 𝐴, 𝑦0 un punto di accumulazione
di 𝐵, ℓ ∈ [−∞, +∞]. Siano 𝑓 : 𝐴 → 𝐵, 𝑔 : 𝐵 → ℝ funzioni tali che 𝑓 (𝑥) ≠ 𝑦0 se
𝑥 ≠ 𝑥0 e
lim 𝑓 (𝑥) = 𝑦0 , lim 𝑔(𝑦) = ℓ .
𝑥→𝑥0 𝑦→𝑦0
Allora nel secondo limite si può porre 𝑦 = 𝑓 (𝑥) e al posto di 𝑦 → 𝑦0 si può mettere
𝑥 → 𝑥 0 (in quanto il primo limite ci dice che se 𝑥 → 𝑥0 allora 𝑦 → 𝑦0 ) e dunque vale:
lim 𝑔( 𝑓 (𝑥)) = ℓ .
𝑥→𝑥0
Dimostrazione. Visto che 𝑔(𝑦) → ℓ per ogni 𝑈 intorno di ℓ deve esistere un 𝑉

intorno di 𝑦0 tale che 𝑔((𝐵 \ {𝑦0 }) ∩ 𝑉) ⊆ 𝑈 e visto che 𝑓 (𝑥) → 𝑦0 deve esistere
un intorno 𝑊 di 𝑥 0 tale che 𝑓 ((𝐴 \ {𝑥 0 }) ∩ 𝑊) ⊆ 𝑉 . Ma visto che per ipotesi
𝑓 assume valori in 𝐵 \ {𝑦0 } si ha anche 𝑓 ((𝐴 \ {𝑥0 }) ∩ 𝑊) ⊆ (𝐵 \ {𝑦0 }) ∩ 𝑉 e
quindi
𝑔( 𝑓 ((𝐴 \ {𝑥0 }) ∩ 𝑊)) ⊆ 𝑔((𝐵 \ {𝑦0 }) ∩ 𝑉) ⊆ 𝑈
che significa che 𝑔( 𝑓 (𝑥)) → ℓ .
Esercizio 2.24. Si faccia un esempio di una funzione 𝑓 : ℝ → ℝ e una funzione

𝑔 : ℝ → ℝ tali che
lim 𝑓 (𝑥) = 0 , lim 𝑔(𝑥) = 0
𝑥→0 𝑥→0
ma
lim 𝑔( 𝑓 (𝑥)) = 1.
𝑥→0
Quale ipotesi nel teorema precedente viene a mancare?
Teorema 2.25 (limite di funzioni monotòne). Sia 𝑓 : 𝐴 ⊆ ℝ → ℝ una funzione

crescente. Se 𝑥 0 è un punto di accumulazione sinistro per 𝐴 il seguente limite esiste e
vale
lim− 𝑓 (𝑥) = sup 𝑓 ({𝑥 ∈ 𝐴 : 𝑥 < 𝑥 0 })
𝑥→𝑥0
e se 𝑥 0 è un punto di accumulazione destro per 𝐴 il seguente limite esiste e vale
lim 𝑓 (𝑥) = inf 𝑓 ({𝑥 ∈ 𝐴 : 𝑥 > 𝑥 0 }).

𝑥→𝑥 0+
In particolare se +∞ è punto di accumulazione per 𝐴 si ha
lim 𝑓 (𝑥) = sup 𝑓 (𝐴)

𝑥→+∞
e se −∞ è punto di accumulazione per 𝐴 si ha
lim 𝑓 (𝑥) = inf 𝑓 (𝐴).

𝑥→−∞
Gli stessi risultati valgono per le funzioni decrescenti, scambiando sup e inf.
Dimostrazione. Supponiamo che 𝑓 sia crescente e consideriamo il limite sinistro

𝑥 → 𝑥 0− . Può anche essere 𝑥0 = +∞, in tal caso il limite sinistro 𝑥 → 𝑥0−
equivale a 𝑥 → +∞. Poniamo 𝐵 = {𝑥 ∈ 𝐴 : 𝑥 < 𝑥 0 } ℓ = sup 𝐵 e ricordiamo le
proprietà che caratterizzano l’estremo superiore (sappiamo che 𝐵 non è vuoto
in quanto 𝑥 0− per ipotesi è un punto di accumulazione per 𝐴):
∀𝑥 ∈ 𝐵 : 𝑓 (𝑥) ≤ ℓ
∀𝑦 < ℓ : ∃𝛼 ∈ 𝐵 : 𝑓 (𝛼) > 𝑦.
Siccome 𝑓 è crescente, dalla seconda condizione si ottiene che per ogni 𝑥 > 𝛼
si ha 𝑓 (𝑥) ≥ 𝑓 (𝛼) > 𝑦 e mettendo insieme le due condizioni si ottiene che per
ogni 𝑦 < ℓ esiste 𝛼 ∈ ℝ tale che per ogni 𝑥 > 𝛼 si ha 𝑦 < 𝑓 (𝑥) ≤ ℓ . Certamente
si ha 𝛼 < 𝑥 0 perché 𝛼 ∈ 𝐵. Dunque la condizione 𝑥 > 𝛼 identifica un intorno

sinistro del punto 𝑥 0 e si ha dunque 𝑓 (𝑥) → ℓ per 𝑥 → 𝑥 0− .
Ragionamento analogo si può fare per il limite destro e per le funzioni decrescenti.
Esercizio 2.26. Utilizzando il teorema precedente si studino le discontinuità delle

funzioni monotone. Si dimostri quindi che l’insieme dei punti in cui una funzione
monotona non è continua può essere messo in corrispondenza biunivoca con un
sottoinsieme di ℚ e dunque tale insieme è numerabile.
Il teorema precedente si applica in particolare alle funzioni esponenziali, potenze,

radici e logaritmi negli estremi dei loro domini. Ad esempio è chiaro che se
𝑥0 ∈ (0 , +∞) si ha
lim log 𝑎 𝑥 = log 𝑎 𝑥 0
𝑥→𝑥 0
in quanto il logaritmo è una funzione continua. Se 𝑎 > 1 il logaritmo è crescente

e la sua immagine è tutto ℝ dunque si ha
lim log 𝑎 𝑥 = inf ℝ = −∞ lim log 𝑎 𝑥 = sup ℝ = +∞.

𝑥→0+ 𝑥→+∞
Per l’esponenziale avremo

lim 𝑎 𝑥 = 𝑎 𝑥0
𝑥→𝑥0
se 𝑥 0 ∈ ℝ per continuità. Se 𝑎 > 1 l’esponenziale è crescente ed ha immagine

(0 , +∞) dunque
lim 𝑎 𝑥 = 0 , lim 𝑎 𝑥 = +∞.
𝑥→−∞ 𝑥→+∞
Se 0 < 𝑎 < 1 i limiti all’infinito si scambiano in quanto 𝑎 𝑥 = 1

𝑎 −𝑥 . Per le potenze
avremo, se 𝑥 0 ∈ [0 , +∞) e 𝛼 > 0
lim 𝑥 𝛼 = 𝑥 0𝛼
𝑥→𝑥 0
per continuità. Invece essendo 𝑥 𝛼 crescente e bigettiva su [0 , +∞) si avrà
lim 𝑥 𝛼 = +∞.
𝑥→+∞
Se 𝛼 < 0 la funzione 𝑥 𝛼 è continua, decrescente e bigettiva su (0 , +∞) e dunque

in tal caso:
lim 𝑥 𝛼 = 0.
𝑥→+∞
Tutti questi limiti notevoli possono essere facilmente ricordati se teniamo in

mente i grafici delle funzioni elementari Figura 1.4 e 1.5.
Anche la funzione valore assoluto 𝑓 (𝑥)|𝑥| è separatamente monotona sugli
intervalli [0 , +∞) e (−∞, 0]. Dunque sappiamo che
lim |𝑥| = |+∞| = +∞, lim |𝑥| = |−∞| = +∞.

𝑥→+∞ 𝑥→−∞
Se 𝑥 0 ∈ ℝ ovviamente si ha pure
lim |𝑥 0 | = |𝑥 0 |
𝑥→𝑥 0
in quanto è banale verificare che la funzione |𝑥| è continua.
Ci sarà anche utile osservare che vale anche questa proprietà
lim | 𝑓 (𝑥)| = 0 ⇐⇒ lim 𝑓 (𝑥) = 0

𝑥→𝑥 0 𝑥→𝑥 0
in quanto le definizioni di limite 𝑓 (𝑥) → 0 e | 𝑓 (𝑥)| → 0 coincidono in quanto

| 𝑓 (𝑥) − 0 | = | 𝑓 (𝑥)| − 0.
permanenza del segno
Teorema 2.27 (permanenza del segno). Se
lim 𝑓 (𝑥) > 0

𝑥→𝑥0
allora esiste un intorno 𝑈 di 𝑥 0 tale che per ogni 𝑥 ∈ 𝑈 si ha 𝑓 (𝑥) > 0.
Dimostrazione. Sia ℓ ∈ [−∞, +∞] il valore del limite. Se ℓ > 0 esiste certamente
un intorno 𝑈 di ℓ tale che 𝑈 ⊆ (0 , +∞] (se ℓ ∈ ℝ basta prendere (ℓ /2 , 3ℓ /2), se
ℓ = +∞ basta prendere (1, +∞]). Per la definizione di limite esiste 𝑈 intorno di
𝑥0 tale che 𝑓 (𝑈) ⊆ 𝑉 e il risultato segue.
Teorema 2.28 (operazioni con i limiti di funzione). Se
lim 𝑓 (𝑥) = ℓ 1 , lim 𝑔(𝑥) = ℓ 2

allora si ha
lim ( 𝑓 (𝑥) + 𝑔(𝑥)) = ℓ 1 + ℓ 2 , lim ( 𝑓 (𝑥) − 𝑔(𝑥)) = ℓ 1 − ℓ 2 ,

𝑥→𝑥0 𝑥→𝑥 0
𝑓 (𝑥) ℓ1
lim 𝑓 (𝑥) · 𝑔(𝑥) = ℓ 1 · ℓ 2 , lim =
Si veda la sezione 1.22. I casi in cui le
𝑥→𝑥 0 𝑥→𝑥0 𝑔(𝑥) ℓ2
operazioni non sono definite si chiamano
usualmente forme indeterminate e sono: sempre che le operazioni utilizzate sul lato destro delle uguaglianze siano state definite.
+∞ − (+∞), −∞ − (−∞), +∞ + (−∞), Inoltre se 𝑔(𝑥) → 0+ si ha
−∞ + (+∞), 0 · (+∞), +∞ · 0 0 · (−∞), 1
−∞ · 0, 00 , +∞ −∞ +∞ −∞ lim = +∞
+∞ , −∞ , −∞ , +∞ . 𝑥→𝑥0 𝑔(𝑥)
1
(moralmente 0+ = +∞).
Dimostrazione. Consideriamo la somma dei limiti e innanzitutto il caso in cui ℓ 1

ed ℓ 2 siano entrambi finiti. In tal caso dato un qualunque intorno 𝑈 = (ℓ −𝜀, ℓ +𝜀)
se prendiamo gli intorni 𝑈1 = (ℓ 1 − 𝜀/2 , ℓ 1 + 𝜀/2) e 𝑈2 = (ℓ 2 − 𝜀/2 , ℓ 2 + 𝜀/2) si
possono trovare degli intorni 𝑉1 e 𝑉2 di 𝑥 0 per cui si ha 𝑓 (𝑉1 \ {𝑥 0 }) ⊆ 𝑈1 e
𝑓 (𝑉2 \ {𝑥0 }) ⊆ 𝑈2 e a maggior ragione questo risulta se prendiamo 𝑉 = 𝑉1 ∩ 𝑉2
al posto di 𝑉1 e 𝑉2 . Visto che 𝑈1 + 𝑈2 = 𝑈 si avrà allora ( 𝑓 + 𝑔)(𝑉 \ {𝑥 0 }) ⊆ 𝑈 .
Sempre nel caso della somma se ℓ 1 = +∞ e ℓ 2 ≠ −∞ allora ℓ 1 + ℓ 2 = +∞ e

dato un intorno di +∞ della forma 𝑈 = (𝛼, +∞] con 𝛼 > 0 possiamo prendere
𝑈1 = (2 𝛼, +∞) e 𝑈2 = (ℓ2 − 𝛼, ℓ2 + 𝛼) se ℓ2 ∈ ℝ oppure 𝑈2 = (𝛼, +∞) se ℓ2 = +∞.
In ogni caso si ha 𝑈1 + 𝑈2 = 𝑈 e si procede quindi come nel caso precedente. Il
caso ℓ 1 = −∞ si dimostra in maniera del tutto analoga.
Per la differenza basta osservare che 𝑓 (𝑥) − 𝑔(𝑥) = 𝑓 (𝑥) + (−𝑔(𝑥)). Se ℓ 2 è finito
la continuità della funzione ℎ(𝑦) = −𝑦 ci garantisce che −𝑔(𝑥) → −ℓ 2 . Lo stesso
si verifica facilmente quando ℓ 2 è infinito (basta osservare che se 𝑈 = (𝛼, +∞+]
è un intorno di +∞ allora −𝑈 = [−∞, −𝛼) è un intorno di −∞). Dunque il
limite della differenza si riconduce al limite della somma.
Per quanto riguarda il prodotto ci ricordiamo che grazie al teorema 1.54 il

gruppo additivo totalmente ordinato ℝ = (−∞, +∞) è isomorfo al gruppo
moltiplicativo ℝ+ = (0 , +∞) e di conseguenza ℝ̄ = [−∞, +∞] corrisponde a
[0+ , +∞] (l’isomorfismo ℝ+ → ℝ è dato dalla funzione log𝑎 𝑥 con 𝑎 > 1 fissato,
tale funzione preserva gli intorni dei punti corrispondenti salvo il fatto che gli
intorni di −∞ si trasformano in intorni destri di 0).
Dunque se 𝑓 > 0 e 𝑔 > 0 i risultati per il limite del prodotto sono conseguenza
dei risultati analoghi per il limite della somma. Cambiando segno ad una
delle due funzioni o ad entrambe ci si può ricondurre al caso 𝑓 > 0 e 𝑔 > 0
quando le due funzioni assumono un segno costante in almeno un intorno del
punto 𝑥 0 . Per il teorema della permanenza del segno questo è vero se ℓ 1 ≠ 0 e
ℓ2 ≠ 0: il limite del prodotto in questo caso è dunque ℓ 1 · ℓ2 . Se invece ℓ1 = 0
e ℓ 2 ∈ ℝ sappiamo che 𝑓 (𝑥) → 0 è equivalente a | 𝑓 (𝑥)| → 0 dunque in tal
caso si può rimpiazzare 𝑓 (𝑥) con | 𝑓 (𝑥)| ≥ 0 (gli eventuali punti in cui 𝑓 (𝑥) = 0
sono irrilevanti e possono essere tolti dal dominio di 𝑓 per garantire | 𝑓 | > 0) e
ottenere che il limite del prodotto è 0. Lo stesso accade se ℓ 2 = 0 con la funzione
𝑔(𝑥).
Per quanto riguarda il rapporto il teorema 1.54 ci dice che le proprietà additive
dell’opposto diventano (tramite logaritmo) proprietà moltiplicative del reciproco,
almeno se siamo nell’ambito di numeri positivi. Dunque se 𝑓 (𝑥) → ℓ con ℓ > 0
1
allora 𝑓 (𝑥) → ℓ1 . Se ℓ = 0 non possiamo concludere niente in quanto le proprietà
additive a −∞ si rispecchiano nelle proprietà moltiplicative in 0+ , non in 0.
Dunque i risultati sul limite del rapporto discendono dai risultati sul limite del
prodotto con il reciproco.
Se dobbiamo calcolare un limite in cui compare un elevamento a potenza

𝑓 (𝑥) 𝑔(𝑥) con base ed esponente variabile converrà scrivere
𝑓 (𝑥) 𝑔(𝑥) = 𝑎 𝑔(𝑥)·log𝑎 𝑓 (𝑥)
per poter applicare il teorema precedente al prodotto 𝑔(𝑥) · log 𝑎 𝑓 (𝑥).
Esempio 2.29. Si calcoli

2 + 𝑥2 − 𝑥3
lim .
𝑥→+∞ (𝑥 2 − 𝑥 + 2)2
Svolgimento. Per 𝑥 → +∞ per il teorema sul limite del prodotto sappiamo che
𝑥 2 → +∞ e 𝑥 3 → +∞. Per il teorema sulla somma dei limiti sappiamo che
2 + 𝑥 2 → +∞ ma a priori non possiamo applicare tale teorema al limite di
(2 + 𝑥 2 ) − 𝑥 3 in quanto (+∞) − (+∞) è una forma indeterminata (non rientra
nelle ipotesi di quel teorema). Bisogna allora intuire che le potenze di 𝑥 con
esponente maggiore sono preponderanti e vanno quindi messe in evidenza
tramite manipolazioni algebriche. L’espressione di cui vogliamo calcolare il

limite si può quindi riscrivere in questo modo:

2 + 𝑥2 − 𝑥3 𝑥3 2
𝑥3
+ 1
𝑥 −1 1
2
+ 1
−1
𝑥3 𝑥
(𝑥 2 − 𝑥 + 2)2
= 2 = 𝑥 · 2 .
𝑥4 1 − 1
𝑥 + 2
𝑥2
1− 1
𝑥 + 2
𝑥2
A questo punto l’espressione non presenta più forme indeterminate. Applicando

i teoremi precedenti possiamo allora affermare che si ha
2 1 2 1
1 + 𝑥 −1 1 (+∞)3
+ +∞ −1
𝑥3
lim · 2 = +∞ ·
𝑥→+∞ 𝑥 1 2 1 2
2
1− 𝑥 + 𝑥2
1− +∞ + (+∞)2
0+0−1
=0· = 0 · (−1) = 0.
(1 − 0 + 0)2
L’aver definito le operazioni sulle quantità infinite risulta in effetti comodo nello
svolgimento dei limiti. Bisogna però essere consapevoli che ℝ̄ non è un campo
e quindi le operazioni con i simboli +∞ e −∞ non rispettano molte delle regole
che siamo abituati ad avere sui numeri finiti. Sarà quindi opportuno ricondursi
immediatamente ad una espressione che abbia senso in ℝ, sulla quale potremo
applicare le manipolazioni algebriche con più tranquillità. Per questo motivo in
molti testi l’espressione intermedia in cui compaiono le operazioni eseguite sulle
quantità +∞ e −∞ non è ritenuta valida e si preferisce scrivere direttamente il
risultato.
Esempio 2.30. Si calcoli il seguente limite nel campo complesso:

1 1
lim − 2 .
𝑧→0 𝑧 𝑧 −𝑧
Dimostrazione. Anche in questo caso non possiamo applicare direttamente le

regole di calcolo del limite in quanto otterremmo la forma indeterminata ∞ − ∞.
Possiamo però operare una semplice manipolazione algebrica per eliminare
l’indeterminazione:
1 1 𝑧−1−1 𝑧−2 0−2 −2
− 2 = 2 = 2 → 2 = =∞ per 𝑧 → 0.
𝑧 𝑧 −𝑧 𝑧 −𝑧 𝑧 −𝑧 0 −0 0
2.3 proprietà frequenti e definitive
Definizione 2.31 (proprietà frequenti e definitive). Diremo che un predicato 𝑃(𝑥)

definito su un insieme 𝐴 ⊆ ℝ di cui 𝑥 0 è punto di accumulazione vale definitivamente
definitivamente
per 𝑥 → 𝑥 0 se vale in un intorno di 𝑥 0 ovvero:
∃𝑈 ∈ B𝑥0 : ∀𝑥 ∈ 𝐴 ∩ 𝑈 \ {𝑥0 } : 𝑃(𝑥).

2.4 criteri di confronto 83
Diremo che 𝑃(𝑥) vale frequentemente per 𝑥 → 𝑥 0 se in ogni intorno di 𝑥 0 c’è almeno frequentemente
un punto 𝑥 ≠ 𝑥 0 in cui vale:
∀𝑈 ∈ B𝑥0 : ∃𝑥 ∈ 𝐴 ∩ 𝑈 \ {𝑥0 } : 𝑃(𝑥).
Chiaramente se una proprietà vale definitivamente vale anche frequentemente

infatti se c’è un intorno 𝑈 su cui vale la proprietà per ogni altro intorno 𝑉 la
proprietà risulta valida su 𝑈 ∩ 𝑉 che non è mai vuoto. Se una proprietà vale
frequentemente significa in particolare che vale per infiniti valori diversi in
quanto se vale in punto 𝑥 ≠ 𝑥 0 posso sempre trovare un intorno 𝑉 di 𝑥 0 che
non contiene 𝑥 e in tale intorno trovo un ulteriore punto in cui vale la proprietà.
Iterando il procedimento posso trovare infiniti punti diversi su cui la proprietà
è valida.
Le due proprietà sono complementari nel senso che vale in base alle proprietà
dei quantificatori universali vale la seguente relazione:
non frequentemente 𝑃(𝑥) ⇐⇒ definitivamente non 𝑃(𝑥)
Se due proprietà 𝑃(𝑥) e 𝑄(𝑥) valgono definitivamente allora anche 𝑃(𝑥) ∧ 𝑄(𝑥)
vale definitivamente. Se invece valgono entrambe frequentemente allora anche
𝑃(𝑥) ∨ 𝑄(𝑥) vale frequentemente.
Esempio 2.32. La proprietà 𝑥 3 − 𝑥 > 1000 𝑥 2 + 1 vale definitivamente per 𝑥 → +∞.

La proprietà 𝑥 > 0 vale frequentemente per 𝑥 → 0.
La definizione di limite 𝑓 (𝑥) → ℓ per 𝑥 → 𝑥 0 potrebbe quindi enunciarsi così:

per ogni intorno 𝑈 di ℓ si ha 𝑓 (𝑥) ∈ 𝑈 definitivamente. E la sua negazione è:
esiste un intorno 𝑈 di ℓ per cui frequentemente 𝑓 (𝑥) ∉ 𝑈 .
Non è possibile fare confronti tra va-

2.4 criteri di confronto lori complessi, visto che sui numeri
complessi non abbiamo un ordinamento
Teorema 2.33 (criteri di confronto). Siano 𝑓 , 𝑔 , ℎ tre funzioni reali definite su uno confronto tra limiti
stesso dominio 𝐴 ⊆ ℝ con punto di accumulazione 𝑥 0
1. Se per ogni 𝑥 ∈ 𝐴 si ha
𝑓 (𝑥) ≤ 𝑔(𝑥)
e se entrambe le funzioni ammettono limite: 𝑓 (𝑥) → ℓ 1 e 𝑔(𝑥) → ℓ 2 per 𝑥 → 𝑥 0
allora
ℓ1 ≤ ℓ2 .
2. Se per ogni 𝑥 ∈ 𝐴 si ha:
𝑓 (𝑥) ≤ 𝑔(𝑥) teorema dei carabinieri
e se 𝑓 (𝑥) → +∞ allora anche 𝑔(𝑥) → +∞ per 𝑥 → 𝑥 0 . Viceversa se
𝑓 (𝑥) ≤ 𝑔(𝑥) e 𝑔(𝑥) → −∞ allora anche 𝑓 (𝑥) → −∞.
3. (teorema dei carabinieri) Se per ogni 𝑥 ∈ 𝐴 vale
𝑓 (𝑥) ≤ ℎ(𝑥) ≤ 𝑔(𝑥)
e se le due funzioni 𝑓 e 𝑔 hanno lo stesso limite: 𝑓 (𝑥) → ℓ e 𝑔(𝑥) → ℓ per

𝑥 → 𝑥0 allora anche ℎ(𝑥) → ℓ .
Dimostrazione. 1. Se per assurdo fosse ℓ 1 > ℓ 2 la funzione 𝑓 (𝑥)− 𝑔(𝑥) avrebbe

limite positivo e per il teorema della permanenza del segno dovrebbe
essere definitivamente positiva. Ma questo contraddice l’ipotesi 𝑓 (𝑥) −
𝑔(𝑥) ≤ 0.
2. Se non fosse 𝑔(𝑥) → +∞ significa che esiste 𝛼 ∈ ℝ tale che 𝑔(𝑥) < 𝛼
frequentemente. Ma visto che definitivamente 𝑓 (𝑥) > 𝛼 troviamo che
frequentemente si ha 𝑓 (𝑥) > 𝑔(𝑥) in contrasto con l’ipotesi 𝑓 (𝑥) ≤ 𝑔(𝑥).
3. Se 𝑓 e 𝑔 hanno lo stesso limite ℓ significa che per ogni 𝑈 intorno di ℓ si ha
definitivamente 𝑓 (𝑥) ∈ 𝑈 e 𝑔(𝑥) ∈ 𝑈 . Visto che 𝑈 è un intervallo anche
ℎ(𝑥) è definitivamente in 𝑈 e quindi ℎ(𝑥) → ℓ .
Esempio 2.34. Dimostrare che
lim (2 𝑥 − b𝑥c) = +∞.

𝑥→+∞
Sappiamo che b𝑥 b≤ 𝑥 dunque
2 𝑥 − b𝑥c ≥ 2 𝑥 − 𝑥 = 𝑥 → +∞.
Dunque per confronto si ottiene il risultato richiesto.
Corollario 2.35 (limitata per infinitesima). Se 𝑓 (𝑥) è una funzione limitata e

𝑔(𝑥) → 0 per 𝑥 → 𝑥0 allora anche
𝑓 (𝑥) · 𝑔(𝑥) → 0 per 𝑥 → 𝑥 − 0.
Dimostrazione. Se 𝑓 è limitata significa che esiste 𝑅 > 0 tale che | 𝑓 (𝑥)| ≤ 𝑅 per
ogni 𝑥 nel dominio di 𝑓 . Ma allora
0 ≤ | 𝑓 (𝑥) · 𝑔(𝑥)| = | 𝑓 (𝑥)| · | 𝑔(𝑥)| ≤ 𝑅| 𝑔(𝑥)| → 𝑅 · 0 = 0.

successione
Utilizziamo il grassetto per evidenziare Per confronto deduciamo che | 𝑓 (𝑥) · 𝑔(𝑥)| → 0 che è equivalente alla tesi.
il fatto che 𝒂 non è un numero ma una
lista (o vettore) di numeri. Nella scrittura
a mano non è possibile usare il grassetto,
ma potremmo sottolineare il nome della Esercizio 2.36. Mostrare che
variabile scrivendo 𝑎 invece che 𝒂 . In
→
alternativa si potrebbe scrivere 𝑎 oppure 𝑥 − b𝑥c
lim = 0.
evitare qualunque distinzione e scrivere 𝑥→+∞ 𝑥
più semplicemente 𝑎 .
2.5 successioni 85
2.5 successioni
Una successione in un insieme 𝑋 è una funzione 𝒂 : ℕ → 𝑋 . L’insieme delle

funzioni ℕ → 𝑋 viene usualmente indicato con 𝑋 ℕ e potremmo dunque
scrivere 𝒂 ∈ 𝑋 ℕ . In effetti una successione 𝒂 può essere interpretata come una
sequenza infinita di elementi di 𝑋 :
𝒂 = (𝑎 0 , 𝑎1 , 𝑎2 , . . . , 𝑎 𝑛 , . . . )
dove si intende
𝑎 𝑛 = 𝒂(𝑛).
Le componenti 𝑎 𝑛 si chiamano termini della successione. I numeri 𝑛 si chiamano,
invece, indici. L’intera successione 𝒂 può essere indicata con (𝑎 𝑛 )∞
𝑛=0 oppure
(𝑎 𝑛 )𝑛 oppure, più semplicemente, con 𝑎 𝑛 quando sia chiaro che si intende
In alcuni testi le successioni vengono
l’intera successione 𝒂 e non un singolo termine della stessa.
indicate con la notazione {𝑎 𝑛 } che però
è fuorviante in quanto una successione in
Per noi il caso più interessante sarà quello delle successioni reali 𝑎 𝑛 ∈ ℝ cioè il 𝑋 non è semplicemente un sottoinsieme
caso 𝑋 = ℝ. Considereremo però anche il caso di successioni complesse 𝑎 𝑛 ∈ ℂ di 𝑋 : l’ordine in cui vengono presi gli
(dunque 𝑋 = ℂ) perché questo potrà essere utile in alcune situazioni. elementi è rilevante.
2.6 limite di successione
Visto che 𝒂 : ℕ → ℝ (o in ℂ) è una funzione con dominio ℕ ⊆ ℝ e visto che +∞

è l’unico punto di accumulazione di ℕ sarà possibile considerare il limite
ℓ = lim 𝒂(𝑛)
𝑛→+∞
che potremmo anche scrivere con una delle seguenti notazioni:
ℓ = lim 𝒂 = lim 𝑎 𝑛 = lim 𝑎 𝑛

𝑛 𝑛→+∞
o più concisamente:
𝑎𝑛 → ℓ .
Esplicitando la definizione astratta di limite osserviamo che se (𝛼, +∞] è un

intorno di +∞ con 𝛼 > 0 la sua intersezione con ℕ (il dominio della funzione)
è l’insieme {𝑛 ∈ ℕ : 𝑛 > 𝑁 } dove 𝑁 = d𝛼e è un numero naturale. Dunque se
ℓ ∈ ℝ la condizione 𝑎 𝑛 → ℓ si esplicita nel modo seguente:
∀𝜀 > 0 : ∃𝑁 ∈ ℕ : 𝑛 > 𝑁 =⇒ |𝑎 𝑛 − ℓ | < 𝜀. (2.4)
La condizione 𝑎 𝑛 → +∞ si scrive
∀𝛼 ∈ ℝ : ∃𝑁 ∈ ℕ : 𝑛 > 𝑁 =⇒ 𝑎 𝑛 > 𝛼
e infine 𝑎 𝑛 → −∞ diventa
∀𝛼 ∈ ℝ : ∃𝑁 ∈ ℕ : 𝑛 > 𝑁 =⇒ 𝑎 𝑛 < −𝛼.

Definizione 2.37 (carattere di una successione). Sia 𝑎 𝑛 una successione a valori

reali o complessi e si consideri il limite
lim 𝑎 𝑛 .
𝑛
regolare
Se tale limite esiste diremo che la successione 𝑎 𝑛 è regolare, se il limite esiste ed è finito
diremo che la successione è convergente se il limite è infinito diremo che la successione
convergente è divergente se il limite non esiste diremo infine che la successione è indeterminata.
divergente Abbiamo dunque le seguenti alternative
indeterminata 1. la successione è convergente (ha limite finito);
2. la successione è divergente (ha limite infinito);
3. la successione è indeterminata (non ha limite).
carattere di una successione Determinare il carattere di una successione significa specificare a quale delle tre categorie
appartiene.
Esercizio 2.38. Una successione complessa 𝑧 𝑛 ∈ ℂ potrà essere scritta nella forma
𝑧 𝑛 = 𝑥 𝑛 + 𝑖 𝑦𝑛 dove 𝑥 𝑛 e 𝑦𝑛 sono successioni reali. Si può allora verificare che 𝑧 𝑛 → 𝑧
per 𝑧 ∈ ℂ se e solo se 𝑥 𝑛 → 𝑥 e 𝑦𝑛 → 𝑦 dove 𝑧 = 𝑥 + 𝑖 𝑦 con 𝑥, 𝑦 ∈ ℝ.
Si faccia attenzione al fatto che una successione 𝑎 𝑛 ∈ ℝ ⊆ ℂ può essere

interpretata sia come successione reale che come successione complessa. Le
condizioni di convergenza in ℝ o ℂ sono allora equivalenti. Ma se 𝑎 𝑛 → ∞
(in ℂ̄) significa che |𝑎 𝑛 | → +∞ e può capitare che 𝑎 𝑛 non abbia limite né +∞
né −∞ in quanto potrebbe frequentemente cambiare di segno (un esempio è
𝑎 𝑛 = (−𝑛)𝑛 ).
In generale potremmo avere delle successioni definite solamente su un sottoin-

sieme ℕ dei numeri naturali. Finché la successione è definita in un intorno di
+∞ (cioè da un certo 𝑛0 in poi) questo non ha nessuna conseguenza sul limite
per 𝑛 → +∞ (grazie alla località del limite, teorema 2.20).
Esempio 2.39. La successione 𝑎 𝑛 = 1/𝑛 è definita per 𝑛 ∈ ℕ ma 𝑛 ≠ 0. Ciò non

toglie che possiamo studiarne il limite come qualunque altra successione. Per evidenziare
il fatto che il primo indice è 𝑛 = 1 si potrà usare la notazione (𝑎 𝑛 )∞
𝑛=1 .
2.7 successioni limitate
Se abbiamo una successione 𝑎 𝑛 reale possiamo anche considerare gli operatori:
sup 𝑎 𝑛 , inf 𝑎 𝑛 , max 𝑎 𝑛 , min 𝑎 𝑛

𝑛 𝑛 𝑛 𝑛
che sono definiti come per qualunque altra funzione. Sappiamo che sup e inf
esistono sempre (in ℝ̄) mentre max e min potrebbero non esistere.
Anche il concetto di limitatezza per una successione è ereditato dallo stesso

concetto valido per le funzioni. Una successione 𝑎 𝑛 (a valori reali o complessi)
limitata
si dice essere limitata se l’insieme {|𝑎 𝑛 | : 𝑛 ∈ ℕ } è limitato. Cioè se
2.7 successioni limitate 87
sup |𝑎 𝑛 | < +∞.

𝑛
In caso contrario la successione si dice essere illimitata. Queste definizioni si illimitata

applicano tali e quali alle successioni di numeri complessi (rimpiazzando il
valore assoluto con il modulo).
Se la successione ha valori reali potremo anche parlare di limitatezza superiore

quando sup 𝑎 𝑛 < +∞ e limitatezza inferiore quando inf 𝑎 𝑛 > −∞.
Esempio 2.40. Si consideri 𝑎 𝑛 = 1

𝑛+1 definita per 𝑛 ∈ ℕ . Allora
sup 𝑎 𝑛 = max 𝑎 𝑛 = 1 , inf 𝑎 𝑛 = 0 , non esiste min 𝑎 𝑛 .
Dimostrazione. Per ogni 𝑛 ∈ ℕ si ha 𝑛 + 1 ≥ 1 e quindi 𝑎 𝑛 = 1/(𝑛 + 1) ≤ 1. Visto

poi che 𝑎 0 = 1 si ottiene immediatamente che max 𝑎 𝑛 = 1 e di conseguenza
sup 𝑎 𝑛 = 1.
Per verificare che inf 𝑎 𝑛 = 0 dobbiamo verificare innanzitutto che 0 è minorante,

e questo è vero in quanto 𝑎 𝑛 = 1/(𝑛 + 1) > 0 essendo 𝑛 + 1 ≥ 1 ≥ 0. Inoltre
dobbiamo verificare che per ogni 𝜀 > 0 esiste 𝑛 ∈ ℕ tale che 𝑎 𝑛 < 0 + 𝜀 = 𝜀.
Questo succede se 1/(𝑛 + 1) < 𝜀 ovvero se 𝑛 > 1/𝜀 − 1 ad esempio per 𝑛 = d1/𝜀e .
Abbiamo dunque verificato che inf 𝑎 𝑛 = 0. Il minimo di 𝑎 𝑛 non esiste perché se
esistesse dovrebbe essere uguale all’estremo inferiore cioè dovrebbe essere 0.
Ma questo è impossibile perché per ogni 𝑛 ∈ ℕ si ha 𝑎 𝑛 = 1/(𝑛 + 1) ≠ 0.
Visto che l’insieme ℕ su cui sono definite le successioni ha un unico punto di

accumulazione +∞ se la successione è convergente non potrà essere illimitata,
come viene espresso nel seguente.
Teorema 2.41 (limitatezza delle successioni convergenti). Se una successione

(reale o complessa) è convergente allora è anche limitata. Se una successione reale diverge
a +∞ allora è inferiormente limitata, se diverge a −∞ è superiormente limitata.
Dimostrazione. Per la definizione di limite (2.4) se 𝑎 𝑛 → ℓ con ℓ finito sappiamo

che scelto 𝜀 = 1 dovrà esistere 𝑁 ∈ ℕ tale che
∀𝑛 > 𝑁 : |𝑎 𝑛 − ℓ | < 1.
Osserviamo ora che gli indici 𝑛 per cui 𝑛 ≤ 𝑁 sono in numero finito (in effetti
sono 𝑁 + 1) e quindi esiste
𝑀 = max |𝑎 𝑛 | = max {|𝑎0 |, |𝑎1 |, . . . , |𝑎 𝑁 |}.

𝑛≤𝑁
Dunque scelto 𝑅 = max {|ℓ | + 1 , 𝑀} se 𝑛 ≤ 𝑁 si ha certamente |𝑎 𝑛 | ≤ 𝑀 ≤ 𝑅

e se 𝑛 > 𝑁 si ha comunque, per disuguaglianza triangolare,
|𝑎 𝑛 | ≤ |𝑎 𝑛 − ℓ | + |ℓ | = 1 + ℓ ≤ 𝑅.
Dunque nel complesso risulta sup𝑛 |𝑎 𝑛 | ≤ 𝑅 e la successione è limitata.

Se 𝑎 𝑛 → +∞ per la definizione di limite scelto (0 , +∞] come intorno di +∞

deve esistere in indice 𝑁 ∈ ℕ tale che se 𝑛 > 𝑁 si ha 𝑎 𝑛 > 0. Ma allora posto
𝑅 = min {0 , 𝑎0 , . . . , 𝑎 𝑁 } si avrà 𝑎 𝑛 ≥ 𝑅 per ogni 𝑛 ∈ ℕ e dunque la successione
risulta essere inferiormente limitata.
Dimostrazione analoga si fa nel caso 𝑎 𝑛 → −∞.
prodotto limitata per infinitesima

Teorema 2.42 (prodotto di limitata per infinitesima). Se 𝑎 𝑛 è una successione
limitata e 𝑏 𝑛 → 0 allora 𝑎 𝑛 · 𝑏 𝑛 → 0 (il risultato vale sia per successioni reali che per
successioni complesse).
Dimostrazione. Se 𝑎 𝑛 è limitata significa che esiste 𝑅 > 0 tale che |𝑎 𝑛 | ≤ 𝑅 per

ogni 𝑛 ∈ ℕ . Se 𝑏 𝑛 → 0 sappiamo che anche |𝑏 𝑛 | → 0, dunque
0 ≤ |𝑎 𝑛 · 𝑏 𝑛 | = |𝑎 𝑛 | · |𝑏 𝑛 | ≤ 𝑅 · |𝑏 𝑛 | → 𝑅 · 0 = 0.
Per il teorema dei due carabinieri deduciamo che |𝑎 𝑛 · 𝑏 𝑛 | → 0 e quindi

𝑎 𝑛 · 𝑏 𝑛 → 0.
2.8 successioni monotòne
Le successioni sono funzioni ℕ → ℝ si applicano le definizioni 1.52 per

classificare le successioni in base alla monotonia. Per le successioni, tuttavia, si
possono dare delle definizioni equivalenti utilizzando il principio di induzione,
come viene esplicitato nel seguente teorema.
Teorema 2.43 (successioni monotòne). Una successione 𝑎 𝑛 è
1. crescente: se per ogni 𝑛 ∈ ℕ si ha 𝑎 𝑛+1 ≥ 𝑎 𝑛 ;

2. decrescente: se per ogni 𝑛 ∈ ℕ si ha 𝑎 𝑛+1 ≤ 𝑎 𝑛 ;
3. strettamente crescente: se per ogni 𝑛 ∈ ℕ si ha 𝑎 𝑛+1 > 𝑎 𝑛 ;
4. strettamente decrescente: se per ogni 𝑛 ∈ ℕ si ha 𝑎 𝑛+1 < 𝑎 𝑛 ;
Dimostrazione. Consideriamo ad esempio la prima condizione (funzione cre-

scente). Ovviamente se 𝑎 𝑛 è crescente si ha 𝑎 𝑛+1 ≥ 𝑎 𝑛 in quanto 𝑛 + 1 > 𝑛 .
Viceversa supponiamo che per ogni 𝑛 ∈ ℕ si abbia 𝑎 𝑛+1 ≥ 𝑎 𝑛 . Allora chiara-
mente 𝑎 1 ≥ 𝑎 0 , 𝑎 2 ≥ 𝑎 1 ≥ 𝑎 0 , 𝑎 3 ≥ 𝑎 2 ≥ 𝑎 1 ≥ 𝑎 0 ... Per induzione si può quindi
dimostrare che 𝑎 𝑛 ≥ 𝑎 𝑛−1 ≥ · · · ≥ 𝑎 2 ≥ 𝑎 1 .
Gli altri casi si svolgono in maniera analoga.
Esempio 2.44. La successione 𝑎 𝑛 = 𝑛 ! è crescente in quanto per ogni 𝑛 si ha

(𝑛 + 1)! = (𝑛 + 1) · 𝑛 ! ≥ 𝑛 !.
Il teorema 2.25 ci assicura che una successione monotona ha sempre limite.

Infatti il limite per 𝑛 → +∞ è un limite sinistro. In particolare se 𝑎 𝑛 è crescente
si ha
lim 𝑎 𝑛 = sup 𝑎 𝑛
𝑛 𝑛
2.9 la costante di Nepero 89
mentre se 𝑎 𝑛 è decrescente si ha
lim 𝑎 𝑛 = inf 𝑎 𝑛 .
𝑛 𝑛
2.9 la costante di Nepero
La funzione esponenziale è legata ad un modello di crescita che si trova spesso

in natura: la crescita esponenziale. Prendiamo come esempio una popolazione crescita esponenziale
di batteri che cresce senza limitazioni di spazio e di nutrimento oppure alla
crescita di un capitale dovuto ad una rendita finanziaria.
Supponiamo che una popolazione che al tempo 𝑡0 = 0 ammonta ad un certo

numero 𝑐 di batteri, al tempo 𝑡 > 0 raggiunga una numerosità 𝑞(𝑡, 𝑐). Se lascio
crescere la popolazione per un ulteriore tempo 𝑠 > 0 troverò al tempo 𝑡 + 𝑠 la
stessa popolazione che avrei al tempo 𝑠 se al tempo zero fossi partito con la
popolazione 𝑞(𝑡):
𝑞(𝑡 + 𝑠, 𝑐) = 𝑞(𝑠, 𝑞(𝑡, 𝑐)).
L’equazione precedente si chiama proprietà di semigruppo continuo. Ma fissato
𝑡 la popolazione 𝑞(𝑡, 𝑐) deve essere proporzionale a 𝑐 perché ogni batterio ha la
sua discendenza indipendentemente dalla numerosità totale della popolazione.
In pratica si deve avere 𝑞(𝑡, 𝑐) = 𝑘(𝑡) · 𝑐 per una opportuna funzione 𝑘(𝑡) che
non dipende da 𝑐 . Dunque
𝑞(𝑡 + 𝑠, 𝑐) = 𝑞(𝑠, 𝑞(𝑡, 𝑐)) = 𝑘(𝑠) · 𝑞(𝑡, 𝑐) = 𝑘(𝑠) · 𝑘(𝑡) · 𝑐
da cui
𝑘(𝑡 + 𝑠) = 𝑘(𝑠) · 𝑘(𝑡).
In base al teorema 1.54 possiamo affermare che 𝑘(𝑡) è una funzione esponenziale
𝑘(𝑡) = 𝑎 𝑡 per una qualche costante 𝑎 . La costante 𝑎 può essere determinata
mediante la formula:
𝑞(1 , 𝑐)
𝑎 = 𝑘(1) =
𝑐
𝑒𝑞
𝑞 𝑛
1+ 𝑛
..
.
𝑞 3
1+ 𝑛
𝑞 2 Figura 2.1: L’interesse composto. Se di-
1+ 𝑛 vidiamo l’intervallo [0 , 1] in 𝑛 parti (in
𝑞
1+ 𝑛 figura 𝑛 = 5), al passo zero partiamo
1 con un capitale pari ad 1 e ad ogni passo
di ampiezza 𝑛1 moltiplichiamo il nostro
𝑞
capitale per 1 + 𝑛 (supponendo di avere
un interesse pari a 𝑞 che nel tempo 𝑛1 ci
𝑞
paga quindi 𝑛 volte il nostro capitale).
Dopo 𝑛 passi, cioè al tempo 1, avremo
1 2 3 ... 1

𝑞 𝑛

𝑛 𝑛 𝑛 un capitale pari a 1 + 𝑛 . Se 𝑛 → +∞
questa quantità tende 𝑞
ad 𝑒 .
ma questa espressione non ha un preciso significato fisico in quanto dipende

dall’unità di tempo scelta.
La costante a cui possiamo dare significato è invece l’aumento relativo istantaneo

della popolazione. Possiamo infatti supporre che se lasciamo la popolazione
crescere per un tempo Δ𝑡 molto piccolo, si otterrà un aumento di popolazione
proporzionale al tempo Δ𝑡 (stiamo qui anticipando il concetto di derivata) e alla
popolazione:
𝑞(Δ𝑡, 𝑐) = 𝑐 + 𝑟𝑐Δ𝑡 = (1 + 𝑟Δ𝑡)𝑐. (2.5)
La costante 𝑟 rappresenta quindi l’aumento relativo istantaneo della popolazione
(nel caso dell’investimento 𝑟 sarebbe il tasso di interesse istantaneo). Questa
definizione ha senso quando Δ𝑡 è piccolo in quanto non tiene conto del fatto
che nell’intervallo di tempo [𝑡, 𝑡 + Δ𝑡] la popolazione che si è aggiunta genera
anch’essa nuova popolazione (ovvero l’interesse accumulato genera anch’esso
In effetti la scoperta della costante 𝑒 è do-
vuta a Jacob Bernoulli nel 1683. Bernoulli interesse).
si chiedeva qual è l’interesse annuo effet-
tivo che si ottiene da un capitale che dia Per calcolare l’aumento della popolazione su tempi “grandi” possiamo suddi-
una rendita giornaliera (interesse com- videre gli intervalli temporali in 𝑛 intervallini di ampiezza Δ𝑡 e applicare in
posto). Se un capitale è investito ad un
tasso di interesse 𝑟 , si intende che ogni ognuno di essi la relazione (2.5). Si trova:
giorno il capitale viene aumentato di un
fattore 1 + 𝑟/365 e quindi dopo un anno 𝑞(Δ𝑡, 𝑐) = 𝑐(1 + 𝑟Δ𝑡)
il fattore moltiplicativo è (1 + 𝑟/365)365 .
𝑞(2Δ𝑡, 𝑐) = 𝑞(Δ𝑡, 𝑐)(1 + 𝑟Δ𝑡) = 𝑐(1 + 𝑟Δ𝑡)2
..
.
𝑞(𝑛Δ𝑡) = 𝑐(1 + 𝑟Δ𝑡)𝑛 .
Dunque, ponendo Δ𝑡 = 𝑡/𝑛 si ha

𝑛
𝑡

𝑞(𝑡, 𝑐) = 𝑐 1 + 𝑟
𝑛
in particolare per 𝑡 = 1/𝑟 si ottiene:

𝑛
1
𝑞(1/𝑟, 𝑐) = 𝑐 1 +
𝑛
e ricordando che 𝑞(𝑡, 𝑐) = 𝑐𝑎 𝑡 otteniamo:

𝑛
1 1
𝑎𝑟 = 1+ .
𝑛
Se per 𝑛 → +∞ (che corrisponde a Δ𝑡 → 0) la quantità sul lato destro tende ad

un numero 𝑒 (che chiameremo costante di Nepero) avremo allora
𝑎 = 𝑒𝑟 , 𝑞(𝑡, 𝑐) = 𝑐𝑒 𝑟𝑡
che è la relazione che lega le due costanti 𝑎 e 𝑟 che definiscono la crescita

esponenziale.
Risulta in effetti valido il seguente.

Teorema 2.45 (costante di Nepero). La successione

𝑛
1
𝑎𝑛 = 1 +
𝑛
è crescente e limitata, dunque è convergente.
Per dimostrare il teorema precedente ci serve preliminarmente il seguente

risultato.
disuguaglianza di Bernoulli
Teorema 2.46 (disuguaglianza di Bernoulli). Se 𝑥 > −1 e 𝑛 ∈ ℕ si ha
(1 + 𝑥)𝑛 ≥ 1 + 𝑛𝑥. (2.6)
Dimostrazione. Dimostriamo che vale (2.6) per induzione su 𝑛 . Per 𝑛 = 0 la

disequazione (2.6) diventa 1 ≥ 1 ed è quindi verificata. Se (2.6) è verificata per
un certo 𝑛 moltiplicando ambo i membri per 1 + 𝑥 > 0 si ottiene
(1 + 𝑥)𝑛+1 ≥ (1 + 𝑥)(1 + 𝑛𝑥) = 1 + (𝑛 + 1)𝑥 + 𝑛𝑥 2 ≥ 1 + (𝑛 + 1)𝑥
che è proprio la disuguaglianza (2.6) con 𝑛 + 1 al posto di 𝑛 .
Dimostrazione del teorema 2.45. Dimostriamo innanzitutto che 𝑎 𝑛 è crescente,

cioè che per ogni 𝑛 ≥ 2 si ha 𝑎 𝑛 ≥ 𝑎 𝑛−1 . E’ chiaro che 𝑎 𝑛 > 0 per ogni 𝑛 , quindi
ci riconduciamo a verificare che 𝑎𝑎𝑛−𝑛 1 ≥ 1.
Si ha
𝑛 𝑛+1 𝑛
1 + 𝑛1

𝑎𝑛 𝑛
= 𝑛−1 =
𝑎 𝑛−1 1 + 𝑛−1 1 𝑛 𝑛−1

𝑛−1
𝑛 𝑛
𝑛+1 𝑛−1 𝑛 𝑛2 − 1 𝑛

= · · = ·
𝑛 𝑛 𝑛−1 𝑛2 𝑛−1
Osserviamo ora che la disuguaglianza di Bernoulli, teorema 2.46, garantisce

𝑛 𝑛
𝑛2 − 1 𝑛 𝑛−1

1 1
= 1− 2 ≥ 1− =1− =
𝑛2 𝑛 𝑛 2 𝑛 𝑛
da cui si ottiene, come volevamo, 𝑎 𝑛 /𝑎 𝑛−1 ≥ 1 cioè 𝑎 𝑛 è crescente.

Se ora consideriamo la successione
𝑛+1
1
𝑏𝑛 = 1 +
𝑛
osserviamo che si ha
𝑛
1 1 1
𝑏𝑛 = 1 + · 1+ = 𝑎𝑛 · 1 + > 𝑎𝑛 .
𝑛 𝑛 𝑛
Per dimostrare che 𝑎 𝑛 è limitata sarà quindi sufficiente dimostrare che 𝑏 𝑛 è

superiormente limitata. Vedremo ora che 𝑏 𝑛 è decrescente (e quindi 𝑎 𝑛 ≤ 𝑏 𝑛 ≤ 𝑏 1
è superiormente limitata).
Procediamo in maniera analoga a quanto fatto per 𝑎 𝑛 :

𝑛 𝑛 𝑛
1 + 𝑛−1 1

𝑏 𝑛−1 𝑛−1
𝑛 𝑛 𝑛+1 𝑛 − 1
= 𝑛+1 = = · ·
𝑏𝑛 1 + 𝑛1 𝑛+1 𝑛+1
𝑛−1 𝑛+1 𝑛
𝑛
𝑛+1 𝑛+1
𝑛2 𝑛−1 𝑛−1

1
= · = 1+ 2 · .
𝑛 −1
2 𝑛 𝑛 −1 𝑛
In base alla disuguaglianza di Bernoulli otteniamo

𝑛+1
𝑛

1 1 1
1+ ≥ 1 + (𝑛 + 1) · ≥ 1+ = .
𝑛2 − 1 𝑛2 − 1 𝑛−1 𝑛−1
Mettendo insieme le due stime si ottiene dunque 𝑏 𝑛−1 /𝑏 𝑛 ≥ 1 che è quanto ci

rimaneva da dimostrare.
E’ quindi giustificata la seguente.
costante di Nepero Definizione 2.47 (costante di Nepero). Definiamo la costante di Nepero

Nepero è l’italianizzazione del nome del 𝑛
matematico scozzese John Napier (1550- 1
1617). Il nome 𝑒 è stato introdotto da 𝑒 = lim 1+ , 𝑛 ∈ ℕ.
𝑛→+∞ 𝑛
Eulero (Leonhard Euler 1707-1783)
Sapendo che
𝑛 𝑛+1
1 1
1+ ≤ 𝑒 ≤ 1+
𝑛 𝑛
e ponendo 𝑛 = 1 otteniamo 2 ≤ 𝑒 ≤ 4.
𝑛𝑛 𝑎 𝑛+1
Esercizio 2.48. Posto 𝑎 𝑛 = 𝑛! mostrare che 𝑎𝑛 → 𝑒.
limiti che si riconducono al numero 𝑒
Teorema 2.49 (limiti che si riconducono al numero 𝑒 ). Si ha

1
lim (1 + 𝑥) 𝑥 = 𝑒.
𝑥→0
Dimostrazione. Iniziamo col dimostrare che

𝑥
1
lim 1+ = 𝑒. (2.7)
𝑥→+∞ 𝑥
Ogni numero reale 𝑥 è compreso tra due interi consecutivi:
b𝑥c ≤ 𝑥 ≤ b𝑥c + 1
e dunque
1 1 1
1+ ≤ 1+ ≤ 1+
b𝑥c + 1 𝑥 b𝑥c
da cui b𝑥c 𝑥 b𝑥c+1
1 1 1
1+ ≤ 1+ ≤ 1+ . (2.8)
b𝑥c + 1 𝑥 b𝑥c
Per calcolare il limite della espressione a sinistra operiamo il cambio di variabile

𝑛 = b𝑥c + 1 per ottenere:
b𝑥c 𝑛−1
1 1
lim 1+ = lim 1+
𝑥→+∞ b𝑥c + 1 𝑛→+∞ 𝑛
1 𝑛

1+ 𝑛 𝑒
= lim = = 𝑒.
𝑛→+∞ 1 + 𝑛1 1
Similmente per quanto riguarda il limite della espressione a destra si può

operare il cambio di variabile 𝑛 = b𝑥c :
b𝑥c+1 𝑛+1
1 1
1+ = lim 1+
b𝑥c 𝑛→+∞ 𝑛
𝑛
1 1
= lim 1+ · 1+ = 𝑒 · 1 = 𝑒.
𝑛→+∞ 𝑛 𝑛
Dunque per il teorema dei due carabinieri otteniamo che anche l’espressione al
centro in (2.8) tende ad 𝑒 . Come conseguenza, tramite il cambio di variabile
𝑥 ↦→ 𝑥1 si ottiene
1
lim (1 + 𝑥) 𝑥 = 𝑒.
𝑥→0+
Consideriamo ora il limite per 𝑥 → −∞ della solita espressione. Tramite il

cambio di variabile 𝑦 = −𝑥 si ha
𝑥 −𝑦 −𝑦
𝑦−1

1 1
lim 1+ = lim 1− = lim
𝑥→−∞ 𝑥 𝑦→+∞ 𝑦 𝑦→+∞ 𝑦
𝑦 𝑦
𝑦

1
= lim = lim 1+
𝑦→+∞ 𝑦−1 𝑦→+∞ 𝑦−1
𝑦−1
1 1
= lim 1+ · 1+ = 𝑒 · 1 = 𝑒.
𝑦→+∞ 𝑦−1 𝑦−1
Di conseguenza, facendo il cambio di variabile 𝑥 ↦→ 1

𝑥 si ottiene
1
lim (1 + 𝑥) 𝑥 = 𝑒.
𝑥→0−
Mettendo insieme limite destro e limite sinistro si ottiene infine il limite completo
per 𝑥 → 0.
Corollario 2.50. Per ogni 𝑥 ∈ ℝ si ha

𝑥 𝑛
lim 1+ = 𝑒𝑥.
𝑛→+∞ 𝑛
Dimostrazione. Infatti, per il teorema precedente, posto 𝑎 𝑛 = 𝑥/𝑛 si ha

𝑛
𝑥𝑥
lim 1+ = 𝑒.
𝑛→+∞ 𝑛
Ma allora
𝑛 𝑥
𝑥 𝑛 𝑥𝑥

1+ = 1+ → 𝑒𝑥
𝑛 𝑛
Definizione 2.51 (logaritmi naturali). Vedremo che il numero 𝑒 risulta essere una
base naturale per la funzione esponenziale e di conseguenza per il logaritmo. Il logaritmo
logaritmo naturale
in base 𝑒 viene chiamato logaritmo naturale e viene indicato con ln = log𝑒 .
In alcuni testi si utilizza l’operatore log, indicato senza una base esplicita, ma la
definizione non è completamente condivisa. In certi testi (per lo più in ambito
matematico) si definisce log = ln = log𝑒 , in altri testi si considera log = log10 .
Corollario 2.52 (limiti notevoli). Si ha
ln (1 + 𝑥)
lim = 1; (2.9)
𝑥→0 𝑥
𝑒𝑥 − 1
lim = 1. (2.10)
𝑥→0 𝑥
Dimostrazione. Per quanto riguarda il logaritmo ci si riconduce al teorema

precedente osservando che:
ln(1 + 𝑥) 1

= ln (1 + 𝑥) 𝑥 → ln 𝑒 = 1.
𝑥
Per l’esponenziale ci si riconduce al logaritmo osservando che posto
𝑦 = 𝑒𝑥 − 1
se 𝑥 → 0 anche 𝑦 → 0 e quindi si ha:
𝑒𝑥 − 1 𝑦
= → 1.
𝑥 ln(1 + 𝑦)
Esercizio 2.53. Mostrare che

𝑛
𝑛+1

𝑛
lim 𝑛 · = 𝑒;
𝑛→+∞ 𝑛2 + 1

1
lim 𝑛 · ln 1 + = 1;
𝑛→+∞ 𝑛
(𝑛−1)!
𝑛+1

1
lim 1 − = ;
𝑛→+∞ 𝑛! 𝑒
√
𝑛
lim 𝑛 · 2 − 1 = ln 2.
𝑛→+∞
2.10 criteri del rapporto e della radice 95
2.10 criteri del rapporto e della radice
Succede spesso di dover determinare il limite del rapporto di due successioni

che tendono entrambe a infinito oppure entrambe a zero. In queste situazioni il
teorema del limite del rapporto non si applica in quanto siamo di fronte ad una
forma indeterminata. Dovremo quindi capire quale delle due successioni tende
a infinito o a zero “più velocemente”.
I teoremi che seguono si basano (in maniera più o meno implicita) sull’anda-
mento della successione geometrica:
𝑎𝑛 = 𝑞 𝑛
dove 𝑞 > 0 è una costante fissata. Dalle proprietà della funzione esponenziale
sappiamo che se 𝑞 > 1 si ha 𝑞 𝑛 → ∞. Se 𝑞 = 1 chiaramente 𝑞 𝑛 = 1 → 1 e se
𝑞 < 1 si ha 𝑞 −1 > 1 e quindi 𝑞 −𝑛 → +∞ da cui 𝑞 𝑛 → 0.
Teorema 2.54 (criterio del rapporto). Sia 𝑎 𝑛 una successione reale a termini non
negativi 𝑎 𝑛 ≥ 0 tale che esista il limite del rapporto di due termini consecutivi:
𝑎 𝑛+1
→ ℓ ∈ [0 , +∞].
𝑎𝑛
Se ℓ < 1 allora 𝑎 𝑛 → 0, se ℓ > 1 allora 𝑎 𝑛 → +∞.
Dimostrazione. Supponiamo sia ℓ < 1. Posto 𝑞 = (1 + ℓ )/2 si ha ℓ < 𝑞 < 1 e

posto 𝜀 = 𝑞 − ℓ > 0 per la definizione di limite 𝑎𝑎𝑛+𝑛 1 → ℓ dovrà esistere un
𝑁 ∈ ℕ tale che per ogni 𝑛 ≥ 𝑁 si abbia:
𝑎 𝑛+1
<ℓ +𝜀=𝑞
𝑎𝑛
ovvero 𝑎 𝑛+1 < 𝑞 · 𝑎 𝑛 . In particolare si avrà:
𝑎 𝑁+1 < 𝑞 · 𝑎 𝑁
𝑎 𝑁+2 < 𝑞 · 𝑎 𝑁+1 < 𝑞 2 · 𝑎 𝑁
𝑎 𝑁+3 < 𝑞 · 𝑎 𝑁+2 < 𝑞 3 · 𝑎 𝑁
..
.
ed è chiaro che per induzione potremo dimostrare che per ogni 𝑘 ∈ ℕ si ha
𝑎 𝑁+𝑘 < 𝑞 𝑘 · 𝑎 𝑁 .
Osserviamo però che 𝑞 𝑘 · 𝑎 𝑁 → 0 per 𝑘 → +∞ in quanto 𝑞 < 1 e quindi 𝑞 𝑘 → 0.

Dunque, tolti i primi 𝑁 termini, la successione 𝑎 𝑛 tende a zero. Ma i primi 𝑁
termini non influenzano né il carattere né il limite della successione e quindi
l’intera successione 𝑎 𝑛 tende a zero.
Il caso ℓ > 1 si fa in maniera analoga. Si sceglie 𝑞 tale che 1 < 𝑞 < ℓ e si trova,
in maniera analoga al caso precedente, che per un certo 𝑁 ∈ ℕ e per ogni 𝑘 ∈ ℕ
si ha
𝑎 𝑁+𝑘 > 𝑞 𝑘 · 𝑎 𝑁 → +∞.
Osserviamo che, nel teorema precedente (ma anche nel criterio della radice
teorema 2.56), non si può concludere alcunché nel caso in cui sia ℓ = 1. Ad
esempio le due successioni 𝑎 𝑛 = 1/𝑛 e 𝑏 𝑛 = 𝑛 hanno limiti diversi ( 𝑎 𝑛 → 0,
𝑏 𝑛 → +∞) ma per entrambe il limite del rapporto di termini consecutivi tende
ad ℓ = 1.
Esercizio 2.55. Mostrare che
𝑛!
lim =0
𝑛𝑛
(2𝑛)!
lim = +∞
(2𝑛)𝑛
criterio della radice
Teorema 2.56 (criterio della radice). Sia 𝑎 𝑛 una successione a termini positivi tale
che
√𝑛
𝑎𝑛 → ℓ
con ℓ ∈ ℝ̄. Allora se ℓ < 1 si ha 𝑎 𝑛 → 0 se invece ℓ > 1 si ha 𝑎 𝑛 → +∞.
Dimostrazione. Si può osservare che

√ 𝑛 √
𝑛
𝑎𝑛 = 𝑛
𝑎𝑛 = 𝑒 𝑛·ln 𝑎𝑛
.
Se ℓ < 1 allora il logaritmo tende ad un numero negativo, l’argomento

dell’esponenziale tende a −∞ e quindi l’esponenziale tende a zero.
Se invece ℓ > 1 il logaritmo tende ad un numero positivo e quindi l’esponenziale

tende a +∞.
ordine di infinito/infinitesimo 2.11 ordini di infinito, equivalenza asintotica
Definizione 2.57 (ordine di infinito/infinitesimo). Sia 𝐴 ⊆ ℝ, 𝑓 , 𝑔 : 𝐴 →

(0 , +∞). Sia 𝑥 0 ∈ ℝ̄ un punto di accumulazione di 𝐴.

1. Diremo che per 𝑥 → 𝑥 0 la funzione 𝑓 è molto più piccola della funzione 𝑔 e
scriveremo 𝑓 (𝑥) 𝑔(𝑥) se vale
𝑓 (𝑥)
→ 0, per 𝑥 → 𝑥 0
𝑔(𝑥)
diremo invece che 𝑓 è molto più grande di 𝑔 e scriveremo 𝑓 (𝑥) 𝑔(𝑥) se
𝑓 (𝑥)
→ +∞, per 𝑥 → 𝑥 0 .
equivalenza asintotica 𝑔(𝑥)
equivalenza asintotica 2. Diremo infine che 𝑓 e 𝑔 sono asintoticamente equivalenti per 𝑥 → 𝑥 0 e
∼ scriveremo 𝑓 (𝑥) ∼ 𝑔(𝑥) se
2.11 ordini di infinito, equivalenza asintotica 97
𝑓 (𝑥)
→ 1, per 𝑥 → 𝑥 0 .
𝑔(𝑥)
Ad esempio è facile verificare che se 𝛼 > 𝛽 > 0 allora 𝑥 𝛼 𝑥 𝛽 per 𝑥 → +∞

mentre 𝑥 𝛼 𝑥 𝛽 per 𝑥 → 0+ . Analogamente se 𝑎 > 𝑏 > 1 allora 𝑎 𝑥 𝑏 𝑥 per
𝑥 → +∞ mentre 𝑎 𝑥 𝑏 𝑥 per 𝑥 → −∞.
E’ molto facile verificare che le relazioni e sono una l’inversa dell’altra e

soddisfano la proprietà transitiva mentre la relazione ∼ soddisfa la proprietà
simmetrica e la proprietà transitiva.
ordini di infinito
Teorema 2.58 (ordini di infinito). Siano 𝑎 > 1 e 𝛼 > 0. Per 𝑛 → +∞, 𝑛 ∈ ℕ si ha
𝑛 𝛼 𝑎𝑛 𝑛! 𝑛𝑛
e per 𝑥 → +∞, 𝑥 ∈ ℝ si ha
log 𝑎 𝑥 𝑥 𝛼 𝑎 𝑥 .
Dimostrazione. Cominciamo col mostrare che 𝑎 𝑛 𝑛 ! applicando il criterio del

𝑛
rapporto alla successione 𝑎𝑛 ! :
𝑎 𝑛+1
(𝑛 + 1)! 𝑎 𝑛+1 𝑛! 1
𝑛 = 𝑛
· =𝑎· → 0 < 1.
𝑎 𝑎 (𝑛 + 1)! 𝑛+1
𝑛!
Dunque si ha, come richiesto, 𝑎 𝑛 /𝑛 ! → 0. Si procede in modo analogo per
mostrare che 𝑛 ! 𝑛 𝑛 :
(𝑛 + 1)! 𝑛𝑛 𝑛 𝑛 1
· = (𝑛 + 1 ) ·
𝑛! (𝑛 + 1)𝑛+1 𝑛+1 𝑛+1
1 1
= → < 1.
1 𝑛
1+ 𝑛 𝑒
Per dimostrare che 𝑛 𝛼 𝑎 𝑛 si può procedere con il criterio del rapporto, come
nei casi precedenti:
𝛼
(𝑛 + 1)𝛼 𝑎 𝑛 𝑛+1

1 1 𝛼 1
· 𝑛+1 = · → ·1 = <1
𝑛𝛼 𝑎 𝑎 𝑛 𝑎 𝑎
da cui 𝑛 𝛼 /𝑎 𝑛 → 0.
Per 𝑥 ∈ ℝ, cerchiamo di ricondurci ad una successione a valori interi. Osservia-

mo che si ha
b𝑥c ≤ 𝑥 ≤ b𝑥c + 1
da cui, per monotonia,
𝛼
𝛼 𝛼 𝛼 𝛼 1
b𝑥c ≤ 𝑥 ≤ (b𝑥c + 1) = b𝑥c 1+
b𝑥c
e
𝑎 b𝑥c ≤ 𝑎 𝑥 ≤ 𝑎 b𝑥c+1 = 𝑎 · 𝑎 b𝑥c .
Dunque
𝛼
b𝑥c 𝛼 𝑥𝛼 b𝑥c 𝛼 1 + 1
b𝑥c
≤ ≤ .
𝑎 · 𝑎 b𝑥c 𝑎𝑥 𝑎 b𝑥c
Ma ora, se 𝑥 → +∞ sapendo che 𝑛 = b𝑥c → +∞ possiamo effettuare un cambio
di variabile nel limite
b𝑥c 𝛼 𝑛𝛼 b𝑥c 𝛼 𝑛𝛼
lim = lim 𝑛 = 0 e lim = lim 𝑛 = 0
𝑥→+∞ 𝑎 b𝑥c 𝑛→+∞ 𝑎 𝑥→+∞ 𝑎 b𝑥c 𝑛→+∞ 𝑎
𝑥𝛼
da cui segue che 𝑎𝑥 → 0.
Per dimostrare l’ultima relazione, log 𝑎 𝑥 𝑥 𝛼 , operiamo il cambio di variabile

𝑦 = 𝛼 · log𝑎 𝑥 cosicché 𝑎 𝑦 = 𝑥 𝛼 . Notiamo che se 𝑥 → +∞ anche 𝑦 → +∞.
Dunque, per le proprietà precedenti, sappiamo che 𝑦 𝑎 𝑦 e dunque
log 𝑎 𝑥 1 𝑦
= · → 0.
𝑥𝛼 𝛼 𝑎𝑦
Le notazioni e gli ordini di infinito individuati nel teorema precedente sono

strumenti molto utili nel calcolo dei limiti.
L’equivalenza asintotica si mantiene per prodotto e rapporto: se 𝑓 ∼ 𝐹 e 𝑔 ∼ 𝐺

allora
𝑓 𝐹
𝑓 · 𝑔 ∼ 𝐹 · 𝐺, ∼ .
𝑔 𝐺
Osserviamo inoltre che se 𝑓 ∼ 𝑔 e se 𝑓 → ℓ allora anche 𝑔 → ℓ . Se poi
ℓ ∈ (0, +∞) la relazione 𝑓 ∼ ℓ è equivalente ad 𝑓 → ℓ .
Per quanto riguarda la somma è facile verificare che se 𝑓 𝑔 allora ( 𝑓 + 𝑔) ∼ 𝑓

in quanto
𝑓 +𝑔 𝑓
= + 1 → 1.
𝑔 𝑔
In un limite in cui compaiono somme di termini di ordini diversi potremo allora

raccogliere i termini di ordine massimo per individuare il limite, come facciamo
nel seguente.
Esempio 2.59. Calcolare il limite
2𝑛 4 + 3𝑛 − 3 ln 𝑛
lim √ .
𝑛→+∞ 𝑛! − 3 𝑛
Svolgimento. Si ha

3𝑛 · 2 3𝑛𝑛 + 1 − 3 ln3𝑛𝑛
4
2𝑛 +
4
3𝑛 − 3 ln 𝑛
√ = √
𝑛! − 3 𝑛

𝑛
𝑛! · 1 − 3 𝑛!
2.12 successioni estratte 99
e ricordando che risulta (teorema 2.58)

√
𝑛 4 3𝑛 , ln 𝑛 3𝑛 , 𝑛 𝑛 !, 3𝑛 𝑛 !
avremo
2𝑛 4 + 3𝑛 − 3 ln 𝑛 3𝑛
√ ∼ → 0.
𝑛! − 3 𝑛 𝑛!
Esercizio 2.60. Calcolare i seguenti limiti

√ √
ln 𝑛 2 + 𝑛 𝑛 𝑛 ! + 2𝑛
lim √ , lim ,
𝑛→+∞ 𝑒 1+ln 𝑛
· ln(𝑛 − 𝑛 𝑛)
2 𝑛→+∞ 3𝑛
p
(2𝑛)! √
q
𝑛
lim , lim 𝑒 𝑛 + 10𝑛 .
𝑛→+∞ 𝑛𝑛 𝑛→+∞
√
Esercizio 2.61. Dimostrare che 𝑛
𝑛 → 1 per 𝑛 → +∞.
2.12 successioni estratte
Definizione 2.62 (sottosuccessione). Se 𝑎 𝑛 è una successione e 𝑛 𝑘 è una successione

strettamente crescente i cui valori sono numeri naturali, allora la successione 𝑏 𝑘 = 𝑎 𝑛 𝑘
sottosuccessione
si dice essere una sottosuccessione di 𝑎 𝑛 (o anche successione estratta da 𝑎 𝑛 ).
Ricordando che una successione 𝑎 𝑛 non è altro che una funzione 𝒂 : ℕ → ℝ, la

successione 𝑛 𝑘 corrisponde ad una funzione 𝒏 : ℕ → ℕ e la sottosuccessione
𝑎 𝑛 𝑘 corrisponde alla funzione composta 𝒂 ◦ 𝒏 .
Si osservi che nella definizione precedente la variabile 𝑛 rappresenta una

variabile muta quando scriviamo la successione 𝑎 𝑛 , ma rappresenta anche il
nome della successione fissata 𝑛 𝑘 . Questo sovraccarico di significato è voluto e
se usato correttamente rende più semplice le notazioni, in quanto la successione
𝑛 𝑘 viene sostituita alla variabile 𝑛 , con lo stesso nome, nella successione 𝑎 𝑛 . La
sottosuccessione 𝑎 𝑛 𝑘 risulta essere una successione nella variabile 𝑘 , non nella
variabile 𝑛 .
Esempio 2.63. Sia 𝑎 𝑛 = 𝑛 2 la successione dei quadrati perfetti:
𝑛 0 1 2 3 4 5 6 ...
𝑎𝑛 0 1 4 9 16 25 36 ...
Consideriamo la successione dei numeri pari 𝑛 𝑘 = 2 𝑘 . la corrispondente sottosuccessione

dei quadrati perfetti 𝑏 𝑘 = 𝑎 𝑛 𝑘 rappresenta la successione dei quadrati dei numeri pari:
𝑘 0 1 2 3 4 5 6 ...
𝑛𝑘 0 2 4 6 8 10 12 ...
𝑎𝑛𝑘 0 4 16 36 64 100 144 ...
Si ha in pratica 𝑏 𝑘 = 𝑎 𝑛 𝑘 = 𝑎 2 𝑘 = (2 𝑘)2 .
Abbiamo in effetti estratto alcuni dei termini della successione originaria.
Esempio 2.64. Se 𝑎 𝑛 = (−1)𝑛 e 𝑛 𝑘 = 2 𝑘 allora 𝑎 𝑛 𝑘 = 1. Vediamo quindi che una

successione irregolare può contenere una sottosuccessione regolare.
Osserviamo che se 𝒏 : ℕ → ℕ è una funzione strettamente crescente (cioè

𝑛 𝑘 = 𝒏(𝑘) è una successione strettamente crescente di indici) allora posto
𝐴 = 𝒏(ℕ ) = {𝑛 𝑘 : 𝑘 ∈ ℕ } si ha che 𝒏 : ℕ → 𝐴 è una bigezione. Quindi 𝐴 è un
insieme infinito. Viceversa dato un qualunque insieme infinito 𝐴 ⊆ ℕ esiste
una unica successione 𝒏 : ℕ → 𝐴 bigettiva e strettamente crescente: basterà
porre, per induzione, 𝑛0 = min 𝐴, 𝑛1 = min {𝑛 ∈ 𝐴 : 𝑛 > 𝑛0 } e, in generale,
𝑛 𝑘+1 = min {𝑛 ∈ 𝐴 : 𝑛 > 𝑛 𝑘 }.
Dunque possiamo identificare le sottosuccessioni di una successione 𝒂 : ℕ → ℝ

con le restrizioni ai sottoinsiemi infiniti di ℕ . Nell’esempio precedente, si è
considerata la sottosuccessione di tutti i termini con indice pari 𝑛 𝑘 = 2 𝑘 per
ottenere la sottosuccessione 𝑎 𝑛 𝑘 = 𝑎 2 𝑘 . Si può equivalentemente pensare di
prendere l’insieme di tutti i numeri pari 𝐴 = 2ℕ e considerare la successione
ristretta ai soli indici pari:
𝑎0 , 𝑎2 , 𝑎4 , . . .
Se rinumeriamo gli indici pari usando tutti i numeri naturali otteniamo la
sottosuccessione 𝑏 𝑘 = 𝑎 𝑛 𝑘 :
𝑏0 = 𝑎0 , 𝑏1 = 𝑎2 , 𝑏2 = 𝑎4 , . . . , 𝑏 𝑘 = 𝑎 𝑛 𝑘 , . . .
Lemma 2.65 (estratte monotone). Ogni successione 𝑎 𝑛 ∈ ℝ ha una estratta 𝑎 𝑛 𝑘

monotona. Inoltre se sup 𝑎 𝑛 = +∞ c’è una estratta 𝑎 𝑛 𝑘 strettamente crescente che
tende a +∞.
Dimostrazione. Consideriamo l’insieme 𝑃 dei punti di “picco”, ovvero degli

indici di quei termini della successione che sono maggiori o uguali a tutti i
termini seguenti:
𝑃 = {𝑛 ∈ ℕ : 𝑚 ≥ 𝑛 =⇒ 𝑎 𝑛 ≥ 𝑎 𝑚 }.
Se 𝑃 è finito significa che esiste un indice 𝑛1 ∈ ℕ tale che non ci sono picchi
da 𝑛1 in poi. In particolare 𝑛1 non è un punto di picco quindi deve esistere
𝑛2 > 𝑛1 tale che 𝑎 𝑛2 > 𝑎 𝑛1 . Ma neanche 𝑛2 è un punto di picco quindi deve
esistere 𝑛3 > 𝑛2 tale che 𝑎 𝑛3 > 𝑎 𝑛2 ... procedendo induttivamente si riesce quindi
a definire una successione 𝑛 𝑘 di indici tali che 𝑎 𝑛 𝑘 risulta essere strettamente
crescente.
In particolare se sup 𝑎 𝑛 = +∞ siamo nella situazione precedente perché chiara-

mente in tal caso 𝑃 è vuoto visto che per ogni 𝑛 ∈ ℕ deve esistere 𝑚 ∈ ℕ tale
che 𝑎 𝑚 > max {𝑎 0 , 𝑎 1 , . . . 𝑎 𝑛 } e certamente 𝑚 > 𝑛 .
Se, viceversa, 𝑃 è infinito allora elencando in ordine i suoi elementi otterremo

una successione 𝑛1 < 𝑛2 < 𝑛3 , . . . di indici ognuno dei quali corrisponde ad un
2.13 punti limite 101
valore di picco. Se 𝑗 > 𝑘 si ha dunque 𝑛 𝑗 > 𝑛 𝑘 ed essendo 𝑛 𝑘 ∈ 𝑃 significa che

𝑎 𝑛 𝑗 ≤ 𝑎 𝑛 𝑘 . Dunque la successione 𝑎 𝑛 𝑘 risulta essere decrescente.
Bolzano-Weierstrass
Teorema 2.66 (Bolzano-Weierstrass). Ogni successione 𝑎 𝑛 ha una estratta regolare.
Più precisamente se 𝑎 𝑛 è una successione limitata allora esiste una sottosuccessione 𝑎 𝑛 𝑘
convergente.
Se 𝑎 𝑛 è una successione non limitata allora esiste una estratta 𝑎 𝑛 𝑘 divergente.
Dimostrazione. Cominciamo con il caso reale 𝑎 𝑛 ∈ ℝ. Il lemma 2.65 garantisce

che esiste una estratta 𝑎 𝑛 𝑘 monotona. Ma per il teorema 2.25 concludiamo
immediatamente che 𝑎 𝑛 𝑘 ha limite. Se 𝑎 𝑛 è limitata anche 𝑎 𝑛 𝑘 è limitata e quindi
in tal caso il limite è finito e dunque la successione estratta è convergente.
Se 𝑎 𝑛 non è superiormente limitata il lemma ci garantisce che l’estratta tende a
+∞ e dunque è divergente. Per simmetria se 𝑎 𝑛 non è inferiormente limitata
esiste una estratta che tende a −∞ e quindi anche in questo caso l’estratta è
divergente.
Se 𝑎 𝑛 è una successione di numeri complessi, si potrà scrivere 𝑎 𝑛 = 𝑥 𝑛 + 𝑖 𝑦𝑛
con 𝑥 𝑛 e 𝑦𝑛 successioni reali. Se 𝑎 𝑛 è limitata significa che |𝑎 𝑛 | è superiormente
limitata. Ma risulta |𝑥 𝑛 | ≤ |𝑎 𝑛 | e |𝑦𝑛 | ≤ |𝑎 𝑛 | quindi se 𝑎 𝑛 è limitata anche la parte
reale 𝑥 𝑛 e la parte immaginaria 𝑦𝑛 sono successioni limitate. Allora 𝑥 𝑛 ammette
una sotto-successione convergente 𝑥 𝑛 𝑘 . Ma 𝑦𝑛 𝑘 è anch’essa limitata e quindi
anch’essa ammette una sotto-sotto-successione 𝑦𝑛 𝑘 𝑗 convergente. Dunque la
sotto-sotto-successione 𝑎 𝑛 𝑘 𝑗 è convergente.
Se 𝑎 𝑛 ∈ ℂ non è limitata, applicando

il teorema al suo modulo |𝑎 𝑛 | troviamo
che c’è una estratta 𝑎 𝑛 𝑘 tale che 𝑎 𝑛 𝑘 → +∞. Ma questo significa che 𝑎 𝑛 → ∞ ∈
ℂ̄.
2.13 punti limite
Teorema 2.67 (ponte di collegamento tra limiti di funzione e limiti di successione).

Sia 𝐴 ⊆ ℝ, 𝑓 : 𝐴 → ℝ, sia 𝑥 0 un punto di accumulazione di 𝐴 e sia ℓ ∈ [−∞, +∞].
Le due seguenti condizioni sono equivalenti:
1. lim 𝑓 (𝑥) = ℓ ;
𝑥→𝑥0
2. per ogni successione 𝑎 𝑛 → 𝑥 0 con 𝑎 𝑛 ∈ 𝐴 \ {𝑥 0 } risulta
lim 𝑓 (𝑎 𝑛 ) = ℓ .
𝑛→+∞
Dimostrazione. Se per 𝑥 → 𝑥 0 si ha 𝑓 (𝑥) → ℓ e se 𝑎 𝑛 → 𝑥 0 con 𝑎 𝑛 ∈ 𝐴 \ {𝑥 0 }

la successione 𝑓 (𝑎 𝑛 ) non è altro che la composizione della funzione 𝑓 con la
funzione 𝑛 ↦→ 𝑎 𝑛 . Si può quindi applicare il teorema sul limite della funzione
composta per ottenere che 𝑓 (𝑎 𝑛 ) → ℓ .
Supponiamo viceversa di sapere che per ogni successione 𝑎 𝑛 → 𝑥 0 si ha
𝑓 (𝑎 𝑛 ) → ℓ . Vogliamo mostrare allora che 𝑓 (𝑥) → ℓ . Lo facciamo per assurdo:
supponiamo che esista un intorno 𝑈 di ℓ tale che preso un qualunque intorno
𝑉 di 𝑥 0 non si abbia 𝑓 ((𝐴 \ {𝑥0 }) ∩ 𝑉) ⊆ 𝑈 . Possiamo considerare per ogni

𝑛 ∈ ℕ degli intorni 𝑉𝑛 sempre più piccoli. Ad esempio nel caso 𝑥 0 ∈ ℝ
potremo scegliere 𝑉𝑛 = (𝑥 0 − 1/𝑛, 𝑥 0 + 1/𝑛), nel caso 𝑥 0 = +∞ si potrà scegliere
𝑉𝑛 = (𝑛, +∞] e nel caso 𝑥0 = −∞ si sceglierà 𝑉𝑛 = [−∞, −𝑛). Se per assurdo
𝑓 ((𝐴 \ {𝑥0 } ∩ 𝑉𝑛 )) non fosse contenuto in 𝑈 significherebbe che per ogni 𝑛 ∈ ℕ
esisterebbe 𝑎 𝑛 ∈ (𝐴 \ {𝑥 0 }) ∩ 𝑉𝑛 tale che 𝑓 (𝑎 𝑛 ) ∉ 𝑈 . Ma allora 𝑎 𝑛 risulterebbe
essere una successione in 𝐴 \ {𝑥 0 } con limite 𝑥 0 (in quanto per ogni intorno di
𝑥0 esiste un 𝑁 tale che 𝑉𝑁 sia contenuto in tale intorno e per ogni 𝑛 > 𝑁 si ha
𝑉𝑛 ⊆ 𝑉𝑁 ) ma 𝑓 (𝑎 𝑛 ) non potrebbe avere limite ℓ (essendo fuori dall’intorno 𝑈 ).
Ma questo nega l’ipotesi e conclude quindi la dimostrazione del teorema.
Proposizione 2.68 (proprietà caratteristica della convergenza). Sia 𝑓 : 𝐴 ⊆ ℝ →

ℝ e 𝑥0 punto di accumulazione di 𝐴. Sia ℓ ∈ ℝ̄. Se per ogni 𝑎 𝑛 → 𝑥0 , 𝑎 𝑛 ∈ 𝐴 \ {𝑥0 }
esiste una estratta 𝑎 𝑛 𝑘 tale che 𝑓 (𝑎 𝑛 𝑘 ) → ℓ allora 𝑓 (𝑥) → ℓ per 𝑥 → 𝑥 0 .
Dimostrazione. Se per assurdo non fosse 𝑓 (𝑥) → ℓ esisterebbe un intorno

𝑈 ∈ Bℓ per cui frequentemente 𝑓 (𝑥) ∉ 𝑈 . Questo significa che esiste una
successione 𝑎 𝑛 → 𝑥 0 con 𝑎 𝑛 ≠ 𝑥 0 tale che 𝑓 (𝑎 𝑛 ) ∉ 𝑈 . Ma allora da 𝑓 (𝑎 𝑛 ) non è
possibile estrarre una sottosuccessione che abbia limite ℓ , e questo è contrario
alle ipotesi.
Definizione 2.69 (punti limite, limite superiore, limite inferiore). Sia 𝑓 : 𝐴 ⊆

punto limite ℝ → ℝ una funzione e 𝑥0 ∈ ℝ̄ un punto di accumulazione per 𝐴. Una quantità
ℓ ∈ ℝ̄ si dice essere un punto limite di 𝑓 (𝑥) per 𝑥 → 𝑥0 se per ogni 𝑈 intorno di ℓ si
ha 𝑓 (𝑥) ∈ 𝑈 frequentemente per 𝑥 → 𝑥 0 .
limite superiore/inferiore Se denotiamo con 𝐿 ⊆ ℝ̄ l’insieme dei punti limite possiamo definire il limite superiore
e il limite inferiore rispettivamente come
lim sup 𝑎 𝑛 = sup 𝐿, lim inf 𝑎 𝑛 = inf 𝐿.

𝑥→𝑥 0 𝑥→𝑥0
Proposizione 2.70 (base numerabile di intorni). Per ogni ℓ ∈ ℝ̄ esiste una

successione 𝑈𝑛 di intorni di ℓ con queste proprietà:
1. 𝑈𝑛+1 ⊆ 𝑈𝑛 ;
2. per ogni 𝑈 intorno di ℓ esiste 𝑛 ∈ ℕ tale che 𝑈𝑛 ⊆ 𝑈 ;
3. se 𝑎 𝑛 ∈ 𝑈𝑛 allora 𝑎 𝑛 → ℓ .
Dimostrazione. Possiamo esplicitamente definire gli intorni 𝑈𝑛 come segue:
ℓ − 𝑛1 , ℓ + 𝑛1 se ℓ ∈ ℝ





𝑈𝑛 = (𝑛, +∞] se ℓ = +∞

 [−∞, −𝑛) se ℓ = −∞.


La prima proprietà è ovviamente verificata. La proprietà archimedea dei numeri
reali garantisce la validità della seconda proprietà, da cui segue immediatamente
la terza.
Proposizione 2.71 (caratterizzazione dei punti limite). Sia 𝑓 : 𝐴 ⊆ ℝ → ℝ,

𝑥0 ∈ ℝ̄ punto di accumulazione per 𝐴. Sono equivalenti:
1. ℓ è un punto limite di 𝑓 (𝑥) per 𝑥 → 𝑥 0 .
2. esiste una successione 𝑎 𝑛 ∈ 𝐴, 𝑎 𝑛 ≠ 𝑥 0 , 𝑎 𝑛 → 𝑥 0 tale che 𝑓 (𝑎 𝑛 ) → ℓ .
Dimostrazione. Siano 𝑈𝑛 intorni di ℓ e 𝑉𝑛 intorni di 𝑥 0 definiti come nella

proposizione 2.70. Se ℓ è un punto limite di 𝑓 (𝑥) per 𝑥 → 𝑥 0 significa che per
ogni 𝑈 intorno di ℓ e per ogni 𝑉 intorno di 𝑥 0 esiste 𝑥 ∈ 𝐴 ∩ 𝑉 \ {𝑥 0 } tale
che 𝑓 (𝑥) ∈ 𝑈 . Dunque per ogni 𝑛 esiste 𝑎 𝑛 ∈ 𝐴 ∩ 𝑉 \ {𝑥 0 } tale che 𝑎 𝑛 ∈ 𝑉𝑛
e 𝑓 (𝑎 𝑛 ) ∈ 𝑈𝑛 . Significa che 𝑎 𝑛 → 𝑥 0 , 𝑎 𝑛 ≠ 𝑥 0 , 𝑓 (𝑎 𝑛 ) → ℓ come volevasi
dimostrare.
Viceversa se esiste una tale successione 𝑎 𝑛 → 𝑥 0 allora per ogni 𝑉 intorno di

𝑥0 si ha definitivamente 𝑎 𝑛 ∈ 𝑉 . E se 𝑓 (𝑎 𝑛 ) → ℓ per ogni 𝑈 intorno di ℓ si ha
anche 𝑓 (𝑎 𝑛 ) ∈ 𝑈 definitivamente. Dunque esiste 𝑛 tale che 𝑎 𝑛 ∈ 𝑉 e 𝑓 (𝑎 𝑛 ) ∈ 𝑈
confermando quindi che 𝑓 (𝑥) ∈ 𝑈 frequentemente.
Molto spesso considereremo i punti limite di una successione 𝑎 𝑛 per 𝑛 → +∞.

In tal caso la caratterizzazione precedente ci dice che ℓ è un punto limite di
𝑎 𝑛 per 𝑛 → +∞ se esiste una successione di indici 𝑛 𝑘 → +∞ tale che 𝑎 𝑛 𝑘 → ℓ .
Potremmo anche supporre 𝑛 𝑘 strettamente crescente in quanto se 𝑛 𝑘 → ∞
possiamo estrarre da 𝑛 𝑘 una sottosuccessione strettamente crescente. Dunque
l’insieme dei punti limite di una successione 𝑎 𝑛 corrisponde all’insieme dei
limiti di tutte le possibili sottosuccessioni di 𝑎 𝑛 .
Esempio 2.72. La successione 𝑎 𝑛 = (−1)𝑛 ha due punti limite:
lim sup(−1)𝑛 = 1 , lim inf(−1)𝑛 = −1.

𝑛→+∞ 𝑛→+∞
Infatti la sottosuccessione dei termini con indice pari è costante 1 mentre quella dei
termini di indice dispari è costante −1. Non ci possono essere altri punti limite perché
se ci fosse 𝑎 𝑛 𝑘 → ℓ allora certamente 𝑎 𝑛 𝑘 = 1 frequentemente oppure 𝑎 𝑛 𝑘 = −1
frequentemente da cui o ℓ = 1 oppure ℓ = −1.
Esempio 2.73. Visto che #ℚ = #ℕ esiste una funzione 𝒂 : ℕ → ℚ surgettiva.

Utilizzando la proprietà di densità dei numeri razionali si può dimostrare che l’insieme
dei punti limite della corrispondente successione 𝑎 𝑛 = 𝒂(𝑛) è tutto ℝ̄.
√ √
Esercizio 2.74. Si consideri la successione 𝑎 𝑛 = 𝑛 − b 𝑛c . Calcolare
lim inf 𝑎 𝑛 , lim sup 𝑎 𝑛 .

𝑛→+∞ 𝑛→+∞
Qual è l’insieme dei punti limite di 𝑎 𝑛 per 𝑛 → +∞?
Teorema 2.75 (proprietà del limite superiore/inferiore). Sia 𝑓 : 𝐴 ⊆ ℝ → ℝ e

sia 𝑥 0 un punto di accumulazione per 𝐴. Sia 𝐿 l’insieme dei punti limite di 𝑓 (𝑥) per
𝑥 → 𝑥0 .
1. 𝐿 ≠ ∅
2. lim sup 𝑓 (𝑥) ≥ lim inf 𝑓 (𝑥);

3. se lim sup 𝑓 (𝑥) = lim inf 𝑓 (𝑥) = ℓ allora lim 𝑓 (𝑥) = ℓ ;
𝑥→𝑥 0 𝑥→𝑥0 𝑥→𝑥 0
4. l’insieme dei punti limite è chiuso per passaggio al limite: se ℓ 𝑘 ∈ 𝐿 e ℓ 𝑘 → ℓ per
qualche ℓ ∈ ℝ̄ allora ℓ ∈ 𝐿;
5. lim sup 𝑓 (𝑥) e lim inf 𝑥→𝑥0 𝑓 (𝑥) sono punti limite;
𝑥→𝑥0
6. la condizione lim sup 𝑓 (𝑥) = ℓ è equivalente a
𝑥→𝑥 0
(
∀𝑞 > ℓ : 𝑓 (𝑥) < 𝑞 definitivamente,
∀𝑞 < ℓ : 𝑓 (𝑥) > 𝑞 frequentemente,
e la condizione lim inf 𝑓 (𝑥) = ℓ è equivalente a

𝑥→𝑥 0
(
∀𝑞 > ℓ : 𝑓 (𝑥) < 𝑞 frequentemente,
∀𝑞 < ℓ : 𝑓 (𝑥) > 𝑞 definitivamente.
7. se 𝑎 𝑛 è una successione

lim sup 𝑎 𝑛 = lim sup 𝑎 𝑘 , lim inf 𝑎 𝑛 = lim inf 𝑎 𝑘 .
𝑛→+∞ 𝑛→+∞ 𝑘≥𝑛 𝑛→+∞ 𝑛→+∞ 𝑘≥𝑛
Dimostrazione. Per quanto riguarda il punto 1. il teorema 2.66 di Bolzano-

Weierstrass garantisce che sia 𝐿 ≠ ∅ e quindi sup 𝐿 ≥ inf 𝐿 da cui discende il
punto 2.
Per il punto 3. se lim sup = lim inf = ℓ significa che 𝐿 = {ℓ } ha un solo elemento.
Ma per il corollario al teorema di Bolzano Weierstrass sappiamo che da ogni
successione 𝑓 (𝑎 𝑛 ) con 𝑎 𝑛 → 𝑥 0 è possibile estrarre una sottosuccessione 𝑓 (𝑎 𝑛 𝑘 )
regolare. Il limite di tale sottosuccessione deve essere un elemento di 𝐿 e quindi
non può che essere ℓ . Allora per la proposizione 2.68 deduciamo che l’intera
successione ha limite ℓ .
Per il punto 4. sia ℓ 𝑘 ∈ 𝐿 una successione di punti limite e sia ℓ ∈ ℝ̄ tale che
ℓ 𝑘 → ℓ per 𝑘 → +∞. Ora consideriamo la successione 𝑈𝑛 di intorni di ℓ data
dalla proposizione 2.70. Visto che ℓ 𝑘 → ℓ per ogni 𝑛 deve esistere 𝑘 𝑛 tale
che ℓ 𝑘 𝑛 ∈ 𝑈𝑛 . Senza perdita di generalità possiamo supporre direttamente
che sia ℓ 𝑛 ∈ 𝑈𝑛 . Consideriamo anche gli intorni 𝑉𝑛 di 𝑥 0 dati sempre dalla
proposizione 2.70. Per ogni ℓ 𝑛 ∈ 𝐿 deve esistere una successione 𝑎 𝑘 → 𝑥 0
con 𝑎 𝑘 ≠ 𝑥 0 tale che 𝑓 (𝑎 𝑘 ) → ℓ 𝑛 . Ma allora certamente esiste 𝑘 = 𝑘 𝑛 tale che
𝑎 𝑘 𝑛 ∈ 𝑉𝑛 e 𝑓 (𝑎 𝑘 𝑛 ) ∈ 𝑈𝑛 . Posto 𝑏 𝑛 = 𝑎 𝑘 𝑛 abbiamo trovato una successione 𝑏 𝑛 tale
che 𝑏 𝑛 → 𝑥 0 (in quanto 𝑏 𝑛 ∈ 𝑉𝑛 ) e 𝑓 (𝑏 𝑛 ) → ℓ in quanto 𝑓 (𝑏 𝑛 ) ∈ 𝑈𝑛 . Dunque ℓ
è anch’esso un punto limite.
Per il punto 5 visto che 𝐿 ≠ ∅ la caratterizzazione del sup garantisce che esista
una successione ℓ 𝑛 ∈ 𝐿 tale che ℓ 𝑛 → sup 𝐿. Ma allora per il punto precedente
si deve avere sup 𝐿 ∈ 𝐿. Lo stesso per l’inf.
Per il punto 6. facciamo la dimostrazione per il lim sup (per il lim inf sarà
analogo). Se lim sup 𝑓 (𝑥) = ℓ e se fosse frequentemente 𝑓 (𝑥) ≥ 𝑞 > ℓ allora
esisterebbe una successione 𝑎 𝑛 → 𝑥 0 , 𝑎 𝑛 ≠ 𝑥 0 tale che 𝑓 (𝑎 𝑛 ) ≥ 𝑞 . Tale
successione avrebbe una estratta regolare che ha limite ≥ 𝑞 > ℓ , il che è assurdo.
Dunque definitivamente deve essere 𝑓 (𝑥) < 𝑞 per ogni 𝑞 > ℓ . Se invece fosse
definitivamente 𝑓 (𝑥) ≤ 𝑞 < ℓ per ogni successione 𝑎 𝑛 → 𝑥 0 con 𝑎 𝑛 ≠ 𝑥 0 si
dovrebbe avere 𝑓 (𝑎 𝑛 ) ≤ 𝑞 e questo contraddice il fatto che ℓ > 𝑞 è un punto
limite.
Viceversa se per ogni 𝑞 > ℓ si ha 𝑓 (𝑥) < 𝑞 definitivamente, significa che per ogni
successione 𝑎 𝑛 → 𝑥 0 si ha 𝑓 (𝑎 𝑛 ) < 𝑞 definitivamente e quindi se 𝑓 (𝑎 𝑛 ) → ℓ
dovrà essere ℓ ≤ 𝑞 . Dunque ogni 𝑞 > ℓ è un maggiorante di 𝐿 e sup 𝐿 ≤ ℓ .
Se poi per ogni 𝑞 < ℓ si ha 𝑓 (𝑥) ≥ 𝑞 frequentemente significa che esiste una
successione 𝑎 𝑛 → 𝑥 0 , 𝑎 𝑛 ≠ 𝑥 0 tale che 𝑓 (𝑎 𝑛 ) ≥ 𝑞 . Per il teorema di Bolzano-
Weierstrass si potrà trovare una estratta convergente 𝑓 (𝑎 𝑛 𝑘 ) → ℓ 0 ≥ 𝑞 . Dunque
per ogni 𝑞 < ℓ risulta sup 𝐿 ≥ 𝑞 da cui in definitiva sup 𝐿 = ℓ .
Per il punto 7. facciamo la dimostrazione per il lim sup (per il lim inf sarà
analogo). Posto 𝐴𝑛 = sup 𝑘≥𝑛 𝑎 𝑘 osserviamo che 𝐴𝑛 è decrescente in quanto
all’aumentare di 𝑛 l’insieme {𝑘 : 𝑘 ≥ 𝑛} decresce (nel senso dell’inclusione
insiemistica) e quindi il sup non aumenta. Dunque ℓ = lim 𝐴𝑛 esiste certamente
in ℝ̄. Inoltre per definizione di limite per ogni ℓ 0 > ℓ si dovrà avere 𝐴𝑛 < ℓ 0
definitivamente e quindi (essendo ovviamente 𝑎 𝑛 ≤ 𝐴𝑛 ) si avrà anche 𝑎 𝑛 < ℓ 0
definitivamente. Viceversa preso ℓ 0 < ℓ si avrà definitivamente 𝐴𝑛 > ℓ 0.
Ma questo significa che esiste 𝑘 > 𝑛 per cui si ha 𝑎 𝑘 > ℓ 0 e quindi risulta
𝑎 𝑛 > ℓ 0 frequentemente. Per il punto precedente si può quindi concludere che
ℓ = lim sup 𝑎 𝑛 .
Teorema 2.76 (operazioni con lim sup e lim inf). Siano 𝑓 , 𝑔 : 𝐴 ⊆ ℝ → ℝ e sia
𝑥0 un punto di accumulazione di 𝐴.
1. Per 𝑥 → 𝑥 0 si ha
lim sup(− 𝑓 (𝑥)) = − lim inf 𝑓 (𝑥)

𝑥→𝑥 0 𝑥→𝑥 0
lim inf(− 𝑓 (𝑥)) = − lim sup 𝑓 (𝑥);

2. se 𝜆 ≥ 0 allora
lim sup(𝜆 · 𝑓 (𝑥)) = 𝜆 · lim sup 𝑓 (𝑥),

lim inf(𝜆 · 𝑓 (𝑥)) = 𝜆 · lim inf 𝑓 (𝑥);

𝑥→𝑥 0 𝑥→𝑥 0
3. inoltre
lim sup( 𝑓 (𝑥) + 𝑔(𝑥)) ≤ lim sup 𝑓 (𝑥) + lim sup 𝑔(𝑥),
𝑥→𝑥0 𝑥→𝑥 0 𝑥→𝑥 0
lim inf( 𝑓 (𝑥) + 𝑔(𝑥)) ≥ lim inf 𝑓 (𝑥) + lim inf 𝑔(𝑥);
𝑥→𝑥 0 𝑥→𝑥0 𝑥→𝑥 0
4. e infine se 𝑓 (𝑥) ≥ 𝑔(𝑥) allora
lim sup 𝑓 (𝑥) ≥ lim sup 𝑔(𝑥), lim inf 𝑓 (𝑥) ≥ lim inf 𝑔(𝑥).
𝑥→𝑥 0 𝑥→𝑥 0 𝑥→𝑥0 𝑥→𝑥0
Dimostrazione. Per il punto 1. basti osservare che se la funzione 𝑓 (𝑥) ha 𝐿 come

insieme dei punti limite allora la funzione − 𝑓 (𝑥) ha −𝐿 come punti limite.
Quindi sup(−𝐿) = − inf 𝐿 e inf(−𝐿) = − sup 𝐿.
Per il punto 2. si osservi che se 𝐿 è l’insieme dei punti limite di 𝑓 (𝑥) allora
l’insieme dei punti limite di 𝜆 𝑓 (𝑥) è 𝜆𝐿. Se 𝜆 ≥ 0 si ha dunque sup 𝜆𝐿 = 𝜆 sup 𝐿
e inf 𝜆𝐿 = 𝜆 inf 𝐿 (se 𝜆 < 0 invece inf e sup si scambiano, come nel punto 1).
Per il punto 3. consideriamo il caso del lim sup (per il lim inf sarà analogo).
Se ℓ = lim sup( 𝑓 (𝑥) + 𝑔(𝑥)) significa che esiste una successione di 𝑎 𝑛 → 𝑥 0
tale che 𝑓 (𝑎 𝑛 ) + 𝑔(𝑎 𝑛 ) → ℓ . Ma posso estrarre una sottosuccessione tale che
anche il primo addendo 𝑓 (𝑎 𝑛 𝑘 ) abbia limite. E poi posso estrarre una sotto-
sottosuccesione in modo che anche il secondo addendo 𝑔(𝑎 𝑛 𝑘 𝑗 ) abbia limite.
Dunque avremo 𝑓 (𝑎 𝑛 𝑘 𝑗 ) → ℓ 1 , 𝑔(𝑎 𝑛 𝑘 𝑗 → ℓ 2 con ℓ 1 + ℓ 2 = ℓ . Ma allora per
definizione di lim sup si avrà lim sup 𝑓 (𝑥) ≥ ℓ 1 e lim sup 𝑔(𝑥) ≥ ℓ 2 da cui
lim sup 𝑓 (𝑥) + lim sup 𝑔(𝑥) ≥ ℓ 1 + ℓ 2 = ℓ .
Per il punto 4. si osserva che se ℓ = lim sup 𝑓 (𝑥) allora per ogni 𝑞 > ℓ si ha
definitivamente 𝑓 (𝑥) < 𝑞 e di conseguenza anche 𝑔(𝑥) < 𝑞 definitivamente.
Dunque lim sup 𝑔(𝑥) ≤ ℓ . Se invece poniamo ℓ = lim inf ℎ(𝑥) allora per ogni
𝑞 < 𝑙 si ha definitivamente 𝑔(𝑥) ≥ 𝑞 ma allora anche 𝑓 (𝑥) ≥ 𝑞 defitiviamente e
quindi lim inf 𝑓 (𝑥) ≥ ℓ .
Cesàro
Teorema 2.77 (convergenza alla Cesàro). Sia 𝑎 𝑛 una successione a termini positivi.
1. Se 𝑎 𝑛 → ℓ ∈ ℝ̄ allora
𝑛
1 X
· 𝑎𝑘 → ℓ .
𝑛 𝑘=1
𝑎 𝑛+1 √
2. Se 𝑎 𝑛 > 0, → ℓ ∈ [0, +∞] allora 𝑛 𝑎 𝑛 → ℓ .
𝑎𝑛
Dimostrazione. Dimostriamo il primo punto. Per ogni 𝑞 < ℓ visto che 𝑎 𝑛 → ℓ

deve esistere 𝑁 tale che 𝑎 𝑛 ≥ 𝑞 se 𝑛 > 𝑁 . Dunque
P𝑁
1X 𝑛
1X 𝑁
1 X 𝑛
𝑘=1
𝑎𝑘 𝑛−𝑁
𝑏𝑛 = 𝑎𝑘 ≥ 𝑎𝑘 + 𝑞= + · 𝑞 → 𝑞.
𝑛 𝑘=1 𝑛 𝑘=1 𝑛 𝑘=𝑁+1 𝑛 𝑛
Significa che per ogni 𝑞 < ℓ si ha lim inf 𝑏 𝑛 ≥ 𝑞 e dunque lim inf 𝑏 𝑛 ≥ ℓ .
Viceversa per ogni 𝑞 > ℓ ragionando in maniera analoga si ottiene che 𝑏 𝑛 non
supera una successione che tende a 𝑞 . Dunque lim sup 𝑏 𝑛 ≤ 𝑞 . Mettendo
insieme le cose si deduce che lim 𝑏 𝑛 = 𝑞 .
Il punto 2 si può ricondurre all’1. Infatti

𝑎1 𝑎𝑛
𝑎1 𝑎𝑛 ln 𝑎 0 + ln + · · · + ln
r
√ 𝑎0 𝑎 𝑛−1
ln 𝑛
𝑎 𝑛 = ln 𝑛
𝑎0 · ··· = .
𝑎0 𝑎 𝑛−1 𝑛
Posto 𝑥 𝑛 = ln 𝑎𝑎𝑛−𝑛 1 se 𝑎𝑎𝑛−𝑛 1 → ℓ si ha 𝑥 𝑛 → ln ℓ (intendendo ln 0 = −∞ e

ln(+∞) = +∞) e dunque
√ ln 𝑎 0 𝑥 1 + · · · + 𝑥 𝑛
ln 𝑛
𝑎𝑛 = + → ln ℓ .
𝑛 𝑛
2.14 il teorema degli zeri 107
Facendo l’esponenziale di ambo i membri si trova il risultato desiderato.
Esercizio 2.78. Si applichi il risultato precedente per verificare che

√
𝑛
lim 𝑛=1
e
𝑛
lim √
𝑛
= 𝑒.
𝑛!
Esercizio 2.79. Si consideri la successione

(
2𝑛 se 𝑛 pari ,
𝑎𝑛 =
𝑛 · 2𝑛 se 𝑛 dispari.
Verificare che alla successione 𝑎 𝑛 si può applicare il criterio della radice ma non il
criterio del rapporto. Usare questo esempio per mostrare che le implicazioni enunciate
nel teorema 2.77 non possono essere invertite.
2.14 il teorema degli zeri

teorema degli zeri
Teorema 2.80 (degli zeri). Sia 𝐼 ⊆ ℝ un intervallo, 𝑓 : 𝐼 → ℝ una funzione
continua, 𝑎, 𝑏 ∈ 𝐼 tali che 𝑓 (𝑎) ≤ 0 e 𝑓 (𝑏) ≥ 0. Allora esiste 𝑐 ∈ 𝐼 tale che 𝑓 (𝑐) = 0.
Dimostrazione. La dimostrazione che adottiamo è di particolare rilevanza in

quanto non solo permette di dimostrare l’esistenza del punto 𝑐 che risolve
metodo di bisezione
𝑓 (𝑥) = 0 ma ci presenta un algoritmo, il metodo di bisezione, che può essere
effettivamente utilizzato per approssimare tale soluzione.
Possiamo supporre senza perdere di generalità che sia 𝑎 < 𝑏 . Poniamo 𝐴0 = 𝑎 ,

𝐵0 = 𝑏 e consideriamo il punto medio 𝐶0 = (𝐴0 + 𝐵0 )/2. Scegliamo tra
i due intervalli [𝐴0 , 𝐶0 ] e [𝐶0 , 𝐵0 ] quello per cui il segno ai due estremi è
discorde (o, caso fortunato, nullo). Più precisamente se 𝑓 (𝐶0 ) ≥ 0 poniamo
[𝐴1 , 𝐵1 ] = [𝐴0 , 𝐶0 ] altrimenti scegliamo [𝐴1 , 𝐵1 ] = [𝐶0 , 𝐵0 ] così si ha, in ogni
caso, 𝑓 (𝐴1 ) ≤ 0, 𝑓 (𝐵1 ) ≥ 0.
Consideriamo il punto medio 𝐶1 del nuovo intervallo [𝐴1 , 𝐵1 ] e ripetiamo il

procedimento indefinitamente. Quello che otteniamo sono due successioni 𝐴𝑛 ,
𝐵𝑛 con queste proprietà (che potrebbero essere dimostrate per induzione):
1. 𝐴𝑛 < 𝐵𝑛 , 𝐵𝑛 − 𝐴𝑛 = (𝑏 − 𝑎)/2𝑛 ;
2. 𝐴𝑛 è crescente, 𝐵𝑛 è decrescente;
3. 𝑓 (𝐴𝑛 ) ≤ 0, 𝑓 (𝐵𝑛 ) ≥ 0.
Essendo 𝐴𝑛 monotòna sappiamo che 𝐴𝑛 converge 𝐴𝑛 → 𝑐 . Inoltre visto che

𝐴𝑛 ∈ [𝑎, 𝑏] anche 𝑐 ∈ [𝑎, 𝑏] (per la permanenza del segno delle successione
𝐴𝑛 − 𝑎 e 𝑏 − 𝐴𝑛 ). Passando al limite nell’uguaglianza 𝐵𝑛 = 𝐴𝑛 + (𝑏 − 𝑎)/2𝑛 si
ottiene che anche 𝐵𝑛 → 𝑐 . Essendo 𝑓 continua avremo
𝑓 (𝐴𝑛 ) → 𝑓 (𝑐), 𝑓 (𝐵𝑛 ) → 𝑓 (𝑐).

Tabella 2.1: Le prime 100 cifre decimali

√
2 ≈ 1.4142135623 7309504880 1688724209 6980785696 7187537694
di alcune costanti calcolate con il metodo
di bisezione usato nella dimostrazione 8073176679 7379907324 7846210703 8850387534 3276415727
del teorema 2.80. Si veda il codice a pa-
√
gina 425. 3 ≈ 1.7320508075 6887729352 7446341505 8723669428 0525381038
0628055806 9794519330 1690880003 7081146186 7572485757
√
5+1
𝜑= 2 ≈ 1.6180339887 4989484820 4586834365 6381177203 0917980576
2862135448 6227052604 6281890244 9707207204 1893911375
Ma 𝑓 (𝐴𝑛 ) ≤ 0 e quindi per la permanenza del segno anche 𝑓 (𝑐) ≤ 0. D’altra

parte 𝑓 (𝐵𝑛 ) ≥ 0 e quindi 𝑓 (𝑐) ≥ 0. Si ottiene dunque 𝑓 (𝑐) = 0, come volevamo
dimostrare.
Esempio 2.81. Si voglia risolvere l’equazione
𝑥 5 − 𝑥 − 1 = 0.
Svolgimento. Posto 𝑓 (𝑥) = 𝑥 5 − 𝑥 − 1 è chiaro che la funzione 𝑓 : ℝ → ℝ è

continua (in quanto composizione di funzioni continue). Osserviamo che
𝑓 (0) = −1 e 𝑓 (2) = 29, dunque la funzione soddisfa le ipotesi del teorema degli
zeri sull’intervallo [0 , 2]. Sappiamo quindi che l’equazione in questione ha
almeno una soluzione in tale intervallo.
Utilizzando il metodo di bisezione possiamo determinare una soluzione con
precisione arbitraria. Posto 𝐴0 = 0, 𝐵0 = 2 abbiamo verificato che 𝑓 (𝐴0 ) < 0 e
𝑓 (𝐵0 ) > 0. Prendiamo il punto medio 𝐶0 = 1 e calcoliamo la funzione: 𝑓 (𝐶0 ) =
−1 < 0. Sappiamo allora che una soluzione deve essere compresa nell’intevallo
[𝐴1 , 𝐵1 ] = [𝐶0 , 𝐵0 ] = [1 , 2] perché anche in tale intervallo valgono le ipotesi del
teorema degli zeri. Il punto medio di tale intervallo è 𝐶1 = 3/2 = 1.5 e risulta
𝑓 (3/2) = 163/32 > 0 dunque l’intervallo successivo che andremo a considerare
è [𝐴2 , 𝐵2 ] = [1 , 3/2]. Per non dover lavorare con troppe cifre decimali invece di
suddividere esattamente a metà quest’ultimo intervallo consideriamo un punto
intermedio 𝐶2 = 6/5 = 1.2 dove si ha 𝑓 (𝐶2 ) = 901/3125 > 0. Sappiamo allora
che una soluzione è compresa nell’intervallo [𝐴3 , 𝐵3 ] = [1 , 1.2]. Prendiamo il
punto medio 𝐶3 = 11/10 = 1.1 e troviamo 𝑓 (𝐶3 ) = −48949/105 < 0. Abbiamo
quindi ottenuto che esiste 𝑥 ∈ (1.1 , 1.2) tale che 𝑓 (𝑥) = 0. Sappiamo quindi che
|𝑥 − 1.15 | < 0.05 cioè abbiamo trovato 𝑥 con un errore inferiore a 0.05.
Con molta pazienza si può procedere con il metodo di bisezione fino ad
arrivare a verificare che 𝑓 (116/102 ) = −596583424/1010 < 0 e 𝑓 (117/102 ) =
224480357/1010 > 0 da cui si ottiene che una soluzione è compresa tra 1.16
e 1.17 con un errore inferiore a 0.005. Con il calcolatore (si veda ad esem-
pio il codice a pagina 425) si possono ottenere più cifre significative: 𝑥 =
1.1673039782614187 . . .
proprietà dei valori intermedi

Corollario 2.82 (proprietà dei valori intermedi). Sia 𝐼 ⊆ ℝ un intervallo e
𝑓 : 𝐼 → ℝ una funzione continua. Allora se 𝑓 assume due valori 𝑦1 e 𝑦2 allora 𝑓
assume anche tutti i valori intermedi tra 𝑦1 e 𝑦2 . Detto altrimenti: una funzione
continua manda intervalli in intervalli.
2.15 il teorema di Weierstrass 109
Dimostrazione. Se 𝑦1 e 𝑦2 sono valori assunti da 𝑓 significa che esistono 𝑥 1 , 𝑥 2 ∈ 𝐼

tali che 𝑓 (𝑥 1 ) = 𝑦1 e 𝑓 (𝑥 2 ) = 𝑦2 . Allora scelto 𝑦 si consideri la funzione
𝑔(𝑥) = 𝑓 (𝑥) − 𝑦 . Se 𝑦 è intermedio tra 𝑦1 e 𝑦2 la funzione 𝑔 assumerà segni
opposti in 𝑥 1 e 𝑥 2 e dunque, per il teorema degli zeri, dovrà esserci un punto
𝑥 in cui 𝑔 si annulla. In tale punto si avrà dunque 𝑓 (𝑥) = 𝑦 , come volevamo
dimostrare.
Lemma 2.83. Se 𝐼 è un intervallo di ℝ ogni funzione 𝑓 : 𝐼 → ℝ iniettiva e continua è

strettamente monotona.
Dimostrazione. Si può osservare che una funzione è strettamente monotona se

mantiene i valori intermedi cioè se dati tre punti 𝑥 < 𝑦 < 𝑧 risulta sempre che
𝑓 (𝑦) è un valore intermedio tra 𝑓 (𝑥) e 𝑓 (𝑧):
𝑓 (𝑥) < 𝑓 (𝑦) < 𝑓 (𝑧) oppure 𝑓 (𝑥) > 𝑓 (𝑦) > 𝑓 (𝑧).
Se ciò non accadesse, ad esempio se fosse 𝑓 (𝑦) > 𝑓 (𝑧) > 𝑓 (𝑥) con 𝑥 < 𝑦 < 𝑧
allora per la continuità di 𝑓 dovrebbe esistere un valore intermedio tra 𝑥 e 𝑦
in cui la funzione assume il valore 𝑓 (𝑧). Ma allora la funzione non sarebbe
iniettiva.
2.15 il teorema di Weierstrass
Ricordiamo che nella definizione 1.70 abbiamo definito i concetti di massimo,

minimo, estremo superiore e inferiore di una funzione a valori reali.
successioni minimizzanti/massimizzanti
Lemma 2.84 (successioni minimizzanti/massimizzanti). Sia 𝐴 un insieme non
vuoto e sia 𝑓 : 𝐴 → ℝ una funzione. Allora esistono due successioni 𝑎 𝑛 e 𝑏 𝑛 di punti
di 𝐴 tali che
lim 𝑓 (𝑎 𝑛 ) = inf 𝑓 (𝐴), lim 𝑓 (𝑏 𝑛 ) = sup 𝑓 (𝐴).

𝑛→+∞ 𝑛→+∞
Dimostrazione. Ricordiamo che 𝑓 (𝐴) = { 𝑓 (𝑥) : 𝑥 ∈ 𝐴} è l’immagine della fun-

zione 𝑓 . Facciamo la dimostrazione per l’estremo inferiore, risultato analogo si
potrà ottenere per l’estremo superiore.
Sia 𝑚 = inf 𝑓 (𝐴). Se 𝑚 = −∞ significa che 𝑓 (𝐴) non è inferiormente limitato,
in particolare per ogni 𝑛 ∈ ℝ esiste 𝑎 𝑛 tale che 𝑓 (𝑎 𝑛 ) < −𝑛 . Dunque (per
confronto) 𝑓 (𝑎 𝑛 ) → −∞ come volevamo dimostrare.
Se 𝑚 ∈ ℝ per le proprietà caratterizzanti l’estremo inferiore sappiamo che per
ogni 𝜀 > 0 esiste 𝑎 ∈ 𝐴 tale che 𝑓 (𝑎) < 𝑚 + 𝜀. Per ogni 𝑛 ∈ ℕ possiamo scegliere
𝜀 = 1/𝑛 e ottenere quindi una successione 𝑎 𝑛 tale che 𝑓 (𝑎 𝑛 ) < 𝑚 + 1/𝑛 . D’altra
parte essendo 𝑚 un minorante di 𝑓 (𝐴) sappiamo che 𝑚 ≤ 𝑓 (𝑎 𝑛 ). Abbiamo
dunque 𝑚 ≤ 𝑓 (𝑎 𝑛 ) < 𝑚 + 1/𝑛 e per il teorema dei carabinieri possiamo quindi
concludere che 𝑓 (𝑎 𝑛 ) → 𝑚 per 𝑛 → +∞.
teorema di Weierstrass
Teorema 2.85 (Weierstrass). Siano 𝑎, 𝑏 ∈ ℝ con 𝑎 ≤ 𝑏 e sia 𝑓 : [𝑎, 𝑏] → ℝ una
funzione continua. Allora esistono punti di massimo e di minimo per 𝑓 su [𝑎, 𝑏].
Probabilmente già dal IX secolo a.C. era Dimostrazione. Dimostriamo solamente che 𝑓 ha minimo, per il massimo la
noto ai greci che la circonferenza, tra tut- dimostrazione procede infatti in maniera del tutto analoga.
te le figure piane che racchiudono una
area prefissata, è quella di lunghezza Sia 𝑚 = inf 𝑓 ([𝑎, 𝑏]). Per il lemma precedente sappiamo che esiste una
minima (proprietà isoperimetrica). Nel-
successione 𝑎 𝑛 minimizzante ovvero tale che 𝑎 𝑛 ∈ 𝐴 e 𝑓 (𝑎 𝑛 ) → 𝑚 per 𝑛 → +∞.
l’Eneide Virgilio racconta che Didone si
trovò ad affrontare un problema simile Per il teorema di Bolzano-Weierstrass dalla successione 𝑎 𝑛 possiamo estrarre
nella fondazione di Cartagine. Una for-
malizzazione completa della proprietà
una sottosuccessione 𝑎 𝑛 𝑘 convergente: 𝑎 𝑛 𝑘 → 𝑥 0 . Visto che 𝑎 𝑛 𝑘 ∈ [𝑎, 𝑏] si avrà,
isoperimetrica del cerchio ha dovuto at- per il teorema della permanenza del segno, anche 𝑥 0 ∈ [𝑎, 𝑏] (si applichi la
tendere fino al 1800. Eulero (Leonhard permanenza del segno alle successioni 𝑎 𝑛 𝑘 − 𝑎 e 𝑏 − 𝑎 𝑛 𝑘 ).
Euler 1707–1783) pensò di aver trovato
una dimostrazione che si fondava su que- Dunque abbiamo una successione 𝑎 𝑛 𝑘 → 𝑥 0 con 𝑎 𝑛 𝑘 ∈ [𝑎, 𝑏] e 𝑥 0 ∈ [𝑎, 𝑏].
sto risultato: presa una qualunque super- Essendo 𝑓 continua si avrà dunque 𝑓 (𝑎 𝑛 𝑘 ) → 𝑓 (𝑥 0 ). Ma noi sapevamo che
ficie chiusa nello spazio, se questa non
è una sfera è possibile farne una piccola
𝑓 (𝑎 𝑛 ) → 𝑚 e dunque anche 𝑓 (𝑎 𝑛 𝑘 ) → 𝑚 . Concludiamo quindi che 𝑓 (𝑥 0 ) = 𝑚
modifica in modo da ottenere una nuova cioè 𝑚 , l’estremo inferiore, è un valore assunto dalla funzione ed è quindi un
superficie che racchiude lo stesso volu- minimo. Dal canto suo 𝑥 0 è un punto di minimo assoluto.
me ma che ha area strettamente inferiore.
Fu proprio Karl Weiestrass (1815–1897)
ad accorgersi che quanto dimostrato da Corollario 2.86 (limitatezza delle funzioni continue). Sia 𝑓 : [𝑎, 𝑏] → ℝ una
Eulero (e poi successivamente da Steiner) funzione continua. Allora 𝑓 è limitata.
non è sufficiente a garantire la minimali-
tà della sfera. Infatti Eulero dimostra che
non ci può essere un minimo che non sia Dimostrazione. Visto che 𝑓 ha massimo 𝑀 e minimo 𝑚 si ha 𝑓 (𝑥) ∈ [𝑚, 𝑀] per
la sfera, ma non dimostra che il minimo ogni 𝑥 ∈ [𝑎, 𝑏]. Ovviamente 𝑚 > −∞ e 𝑀 < +∞ in quanto 𝑚 e 𝑀 sono valori
esiste e quindi non è detto che la sfera della funzione 𝑓 .
sia il minimo: potrebbero esserci infini-
te superfici 𝑆1 , 𝑆2 , . . . , 𝑆𝑛 , . . . ognuna
con area minore di quella della sfera e
ognuna con area maggiore della succes- 2.16 successioni ricorsive
siva: 𝐴(𝑆𝑛+1 ) < 𝐴(𝑆𝑛 ). Per concludere il
ragionamento di Eulero era necessario
dimostrare che in una situazione del ge- Le successioni ricorsive sono le successioni definite per induzione (tramite il
nere le superifici 𝑆𝑛 debbano, in qualche teorema 1.10):
senso, tendere alla superficie sferica e (
che le loro aree debbano tendere all’area 𝑎0 = 𝛼
della sfera. In astratto questo è quanto 𝑎 𝑛+1 = 𝑓 (𝑎 𝑛 ).
viene enunciato nel teorema che porta il
suo nome. Dunque Weiestrass completò Si rimanda al capitolo 8 per uno studio approfondito di questo tipo di successioni.
la dimostrazione della proprietà isoperi-
La prima parte di quel capitolo è infatti accessibile con le nozioni che sono
metrica in dimensione 𝑛 = 2 (in realtà il
risultato è comunque attribuito a Steiner state sviluppate finora. La seconda parte richiederà invece degli strumenti più
che, pur non avendo colto il problema avanzati.
obiettato da Weierstrass, aveva in effetti
dimostrato tutte le proprietà necessarie
per giungere alla conclusione). Salendo
alla dimensione 𝑛 = 3 è naturale imma-
ginare che la superficie che racchiude
il volume maggiore con area fissata sia
la sfera. Questo spiega il motivo per cui
una goccia d’acqua, in assenza di gravità,
dovrebbe assumere una forma sferica: a
causa della tensione superficiale, infat-
ti, la superficie della goccia tenderà ad
avere l’area minima. Formalizzare e di-
mostrare questo risultato risulta molto
più complicato. Per superifici qualun-
que la prima dimostrazione formale per
𝑛 ≥ 3 è dovuta al matematico italiano
Ennio De Giorgi (1928–1996) che forma-
lizzò il concetto di perimetro introdotto
da Renato Caccioppoli (1904–1959).
serie 3
Data una successione 𝑎 𝑛 di numeri reali o complessi possiamo considerare la
successione delle cosiddette somme parziali somme parziali
𝑛
X
𝑆𝑛 = 𝑎𝑘 .
𝑘=0
Potremo scrivere più concisamente 𝑆𝑛 = 𝑎 𝑛 . Intuitivamente si intende

P
sommare i termini della successione 𝑎 𝑘 per 𝑘 che parte da 0 fino a 𝑘 = 𝑛 :
𝑛
X
𝑎 𝑘 = 𝑎0 + 𝑎1 + 𝑎2 + · · · + 𝑎 𝑛 .
𝑘=0
𝑛
X
Formalmente la somma 𝑆𝑛 = 𝑎 𝑘 è definita ricorsivamente dalle seguenti
𝑘=0
relazioni: (
𝑆0 = 𝑎 0 ,
𝑆𝑛+1 = 𝑆𝑛 + 𝑎 𝑛+1 .
I numeri 𝑎 𝑛 si chiamano termini della serie. Se la successione delle somme termini

parziali ammette limite il limite viene chiamato somma della serie e si indica somma
con
+∞
X 𝑛
X
𝑎 𝑘 = lim 𝑆𝑛 = lim 𝑎𝑘 .
𝑛→+∞ 𝑛→+∞
𝑘=0 𝑘=0
La terminologia già introdotta per le successioni si applica anche alle serie che
sono in effetti anch’esse delle successioni. In particolare una serie può essere
convergente, divergente o indeterminata. Questo è il carattere della serie. carattere
Più in generale si potrà considerare la somma che parte da un certo indice

𝑚 ∈ ℤ. Fissato 𝑚 si potrà ad esempio considerare la serie:
𝑛
X
𝑆𝑛 = 𝑎𝑘
𝑘=𝑚
che risulta definita per ogni 𝑛 ∈ ℕ , 𝑛 ≥ 𝑚 come
𝑆𝑛 = 𝑎 𝑚 + 𝑎 𝑚+1 + · · · + 𝑎 𝑛 .
Esempio 3.1. Consideriamo la serie 𝑆𝑛 definita come la somma dei numeri naturali da
1 a 𝑛:
𝑛
X
𝑆𝑛 = 𝑘 = 1 + 2 + · · · + 𝑛.
𝑘=1
Si può dimostrare facilmente per induzione che si ha
𝑛(𝑛 + 1)
𝑆𝑛 = .
2
112 3 serie
E mediante la definizione di limite si può verificare che risulta 𝑆𝑛 → +∞.
𝑛 è divergente:
P
Questo si esprime dicendo che la serie
+∞
X
𝑘 = +∞.
𝑘=1
Esempio 3.2 (la serie geometrica). Fissato 𝑞 ∈ ℝ o 𝑞 ∈ ℂ alla successione 𝑎 𝑛 = 𝑞 𝑛

di termini
𝑎0 = 1, 𝑎1 = 𝑞, 𝑎2 = 𝑞 2 , 𝑎3 = 𝑞 3 , . . .
𝑞 𝑛 le cui somme parziali sono
P
serie geometrica è associata la serie geometrica
𝑆0 = 1 , 𝑆1 = 1 + 𝑞, 𝑆2 = 1 + 𝑞 + 𝑞 2 , ...
Il seguente teorema ci mostra come per diversi valori di 𝑞 la serie geometrica

assume tutti i possibili caratteri: convergente, divergente, indeterminato.
somma della serie geometrica
Teorema 3.3 (somma della serie geometrica). Sia 𝑞 ∈ ℂ. Se 𝑞 ≠ 1 si ha
𝑛
1 − 𝑞 𝑛+1
𝑞𝑘 =
X
.
𝑘=0
1−𝑞
Se |𝑞| < 1 la serie geometrica converge:

+∞
1
𝑞𝑘 =
X
.
𝑘=0
1−𝑞
Se |𝑞| ≥ 1 la serie non converge ma dobbiamo distinguere se la serie si considera a valori

reali o complessi per determinarne il carattere.
Se consideriamo la serie a valori reali (quindi 𝑞 ∈ ℝ) se 𝑞 ≥ 1 la serie diverge a +∞, se

𝑞 ≤ −1 la serie è indeterminata.
Se consideriamo la serie a valori complessi 𝑞 ∈ ℂ, se |𝑞| > 1 la serie diverge a ∞, lo

stesso succede se 𝑞 = 1. Se |𝑞| = 1 ma 𝑞 ≠ 1 la serie è indeterminata.
Dimostrazione. Il primo risultato riguarda una somma finita. Si ha
𝑛 𝑛 𝑛 𝑛 𝑛+1
𝑞𝑘 = 𝑞𝑘 − 𝑞 · 𝑞𝑘 = 𝑞𝑘 − 𝑞 𝑘 = 1 − 𝑞 𝑛+1
X X X X X
(1 − 𝑞) ·
𝑘=0 𝑘=0 𝑘=0 𝑘=0 𝑘=1
da cui si ottiene, se 𝑞 ≠ 1, il risultato voluto.
Passando al limite per 𝑛 → +∞, se |𝑞| < 1 si nota che 𝑞 𝑛+1 = |𝑞| 𝑛+1 → 0 e la

1
serie converge a 1−𝑞 .
Consideriamo ora la serie a valori reali. Se 𝑞 > 1 osserviamo che 𝑞 𝑛 → +∞ e

quindi la serie diverge a +∞ (infatti in questo caso 1 − 𝑞 è negativo). Se 𝑞 = 1 si
𝑛
ha 𝑞 𝑘 = 1 e quindi 𝑞 𝑘 = 𝑛 + 1 → +∞.
X
𝑘=0
113
Per gli altri casi osserviamo che si ha
𝑛
1 − 𝑞 𝑘+1 1 𝑞
𝑞𝑘 = · 𝑞𝑘
X
= −
𝑘=0
1−𝑞 1−𝑞 1−𝑞
e dunque il carattere della serie coincide con il carattere della successione 𝑞 𝑘 . Se

consideriamo la 𝑘successione a valori complessi e se |𝑞| > 1 la serie è divergente
𝑘
a ∞ in quanto 𝑞 = |𝑞| → +∞. Se invece consideriamo la serie a valori reali e

𝑞 < 1 (il caso 𝑞 ≥ 1 l’abbiamo già considerato) la serie risulta indeterminata in
quanto in valore assoluto tende a +∞ ma il segno dei termini pari è opposto al
segno dei termini dispari.
Ci rimane da considerare il caso |𝑞| = 1, 𝑞 ≠ 1. Se 𝑞 è reale c’è solo il caso

𝑞 = −1 e sappiamo che (−1) 𝑘 è indeterminata. Anche se 𝑞 è complesso vogliamo
𝑘
dimostrare che la successione
𝑘
𝑘𝑞 è indeterminata: se non lo fosse si avrebbe
𝑞 → ℓ con |ℓ | = 1 in quanto 𝑞 = 1. e passando al limite nell’uguaglianza

𝑞 𝑘+2 = 𝑞 · 𝑞 𝑘+1
si avrebbe ℓ = 𝑞 · ℓ da cui (dividendo per ℓ ) otteniamo 𝑞 = 1. Dunque se 𝑞 ≠ 1

la successione 𝑞 𝑘 è indeterminata e così è la serie geometrica.
linearità della somma infinita
Teorema 3.4 (linearità della somma). Se 𝑎 𝑛 e 𝑏 𝑛 sono convergenti allora per
P P
ogni 𝜆, 𝜇 ∈ ℂ anche (𝜆𝑎 𝑛 + 𝜇𝑏 𝑛 ) è convergente e si h
P
+∞
X +∞
X +∞
X
(𝜆𝑎 𝑛 + 𝜇𝑏 𝑛 ) = 𝜆 𝑎𝑛 + 𝜇 𝑏𝑛 .
𝑘=0 𝑘=0 𝑘=0
Dimostrazione. Se 𝑆𝑛 e 𝑅 𝑛 sono le somme parziali delle serie 𝑎 𝑛 e 𝑏 𝑛 allora

P P
le somme parziali della serie (𝜆𝑎 𝑛 + 𝜇𝑏 𝑛 ) sono 𝜆𝑆𝑛 + 𝜇𝑅 𝑛 (in quanto sulle
P
somme finite vale la proprietà distributiva e commutativa). Ma se 𝑆𝑛 → 𝑆 e
𝑅 𝑛 → 𝑅 allora 𝜆𝑆𝑛 + 𝜇𝑅 𝑛 → 𝜆𝑆 + 𝜇𝑅 .
Osserviamo che le serie (così come le successioni) formano uno spazio vettoriale
in cui le operazioni di somma e prodotto per scalare vengono eseguite termine a
termine: 𝑎 𝑛 + 𝑏 𝑛 = (𝑎 𝑛 + 𝑏 𝑛 ), 𝜆 𝑎 𝑛 = (𝜆𝑎 𝑛 ). Il teorema precedente ci
P P P P P
dice allora che le serie (così come le successioni) convergenti sono un sottospazio
vettoriale e che la somma della serie (così come il limite della successione) è
un’operatore lineare definito su tale sottospazio.
condizione necessaria per la convergenza
𝑎 𝑛 converge
P
Teorema 3.5 (condizione necessaria per la convergenza). Se la serie
allora 𝑎 𝑛 → 0.
Dimostrazione. Se la serie 𝑎 𝑛 converge significa che le somme parziali 𝑆𝑛 =

P
P𝑛
𝑎 convergono: 𝑆𝑛 → 𝑆. Ma allora
𝑘=0 𝑘
𝑎 𝑛 = 𝑆𝑛 − 𝑆𝑛−1 → 𝑆 − 𝑆 = 0.
114 3 serie
Teorema 3.6 (stabilità del carattere). Se le due successioni 𝑎 𝑛 e 𝑏 𝑛 differiscono solo

su un numero finito di termini, allora le serie corrispondenti 𝑎 𝑛 e 𝑏 𝑛 hanno lo
P P
stabilità del carattere
stesso carattere.
Dimostrazione. Se le successioni differiscono su un numero finito di termini

significa che esiste un 𝑁 ∈ ℕ tale che per ogni 𝑘 > 𝑁 si ha 𝑎 𝑘 = 𝑏 𝑘 . Dunque
se indichiamo con 𝑆𝑛 = 𝑛𝑘=0 𝑎 𝑘 e 𝑅 𝑛 = 𝑛𝑘=0 𝑏 𝑘 le corrispondenti successioni
P P
delle somme parziali, si avrà per ogni 𝑛 > 𝑁
𝑛
X 𝑛
X 𝑁
X
𝑆𝑛 − 𝑅 𝑛 = 𝑎𝑘 − 𝑏𝑘 = (𝑎 𝑘 − 𝑏 𝑘 ) = 𝐶
𝑘=0 𝑘=0 𝑘=0
dove 𝐶 è una costante indipendente da 𝑛 . Dunque
𝑆𝑛 = 𝑅 𝑛 + 𝐶.
Se il limite di 𝑅 𝑛 non esiste allora non esiste neanche il limite di 𝑆𝑛 (altrimenti

essendo 𝑅 𝑛 = 𝑆𝑛 − 𝐶 anche il limite di 𝑅 𝑛 dovrebbe esistere). Se il limite di 𝑅 𝑛
è infinito allora il limite di 𝑆𝑛 è uguale al limite di 𝑅 𝑛 . E se il limite di 𝑅 𝑛 è
finito anche il limite di 𝑆𝑛 è finito.
Dunque il carattere della successione 𝑆𝑛 è lo stesso della successione 𝑅 𝑛 cioè le

due serie hanno lo stesso carattere.
Se una serie ha primo termine con un indice diverso da 0 ci si potrà sempre

ricondurre (con un cambio di variabile) ad una serie il cui indice parte da zero.
Ad esempio (facendo il cambio di variabile 𝑗 = 𝑘 − 1 da cui 𝑗 = 0 quando 𝑘 = 1
e ricordando che l’indice utilizzato nelle somme delle serie è una variabile
muta):
+∞ +∞ +∞
X 1 X 1 X 1
𝑘
= 𝑗+ 1
= 𝑘+1
.
𝑘=1 2 𝑗=0 2 𝑘=0 2
Si osservi inoltre che in base al teorema precedente quale sia il primo indice da
cui si comincia a sommare non è rilevante per quanto riguarda il carattere della
serie. Se però la serie è convergente la sua somma può variare, ad esempio:
!
+∞ +∞
X 1 X 1
= − 20 .
𝑘=1 2𝑘 𝑘=0 2𝑘
Nota bene: in molti libri si scrive ∞ al posto di +∞. Risulta quindi molto
comune omettere il segno + davanti a ∞ nella terminologia delle serie (e anche
delle successioni) visto che gli indici si intendono numeri naturali e quindi −∞
non avrebbe senso.
Ci sono però casi in cui può essere utile usare anche gli indici negativi, ad
esempio se 𝑎 𝑘 è definita per ogni 𝑘 ∈ ℤ si potrebbe definire (ma non lo faremo):
+∞
X +∞
X +∞
X
𝑎𝑘 = 𝑎𝑘 + 𝑎(−𝑘)
𝑘=−∞ 𝑘=0 𝑘=1
3.1 serie telescopiche 115
richiedendo che entrambe le serie al lato destro dell’uguaglianza esistano e non

abbiano somme infinite di segno opposto.
𝑎 𝑛 una serie convergente.

P
Teorema 3.7 (coda di una serie convergente). Sia
Allora
+∞
X
lim 𝑎 𝑘 = 0.
𝑛→+∞
𝑘=𝑛+1
Dimostrazione. Posto
𝑛
X
𝑆𝑛 = 𝑎𝑘 ,
𝑘=0
per definizione di serie convergente sappiamo che esiste 𝑆 finito tale che 𝑆𝑛 → 𝑆 .
Osserviamo allora che
+∞
X 𝑁
X
𝑎 𝑘 = lim 𝑎 𝑘 = lim 𝑆 𝑁 − 𝑆𝑛 = 𝑆 − 𝑆𝑛
𝑁→+∞ 𝑁→+∞
𝑘=𝑛+1 𝑘=𝑛+1
e, per 𝑛 → +∞ si ha ovviamente 𝑆 − 𝑆𝑛 → 𝑆 − 𝑆 = 0.
3.1 serie telescopiche
Una serie scritta nella forma

X
(𝑎 𝑘 − 𝑎 𝑘+1 )
viene detta telescopica in quanto i singoli termini della somma (come i tubi di serie telescopica
un cannocchiale), si semplificano uno con l’altro (permettendo al cannocchiale
di chiudersi):
𝑛
X 𝑛
X 𝑛+1
X
𝑆𝑛 = (𝑎 𝑘 − 𝑎 𝑘+1 ) = 𝑎𝑘 − 𝑎 𝑘 = 𝑎0 − 𝑎 𝑛+1 .
𝑘=0 𝑘=0 𝑘=1
In linea teorica ogni serie può essere scritta in forma telescopica, basta infatti
scegliere 𝑎 0 = 0, 𝑎 𝑛 = −𝑆𝑛−1 , affinché valga la relazione precedente. Scrivere
una serie in forma telescopica è quindi equivalente a determinare la successione
delle somme parziali.
Esempio 3.8 (serie di Mengoli). Si ha

+∞
X 1
= 1.
𝑛=1 𝑛(𝑛 + 1)
Dimostrazione. Infatti
𝑛 𝑛 𝑛 𝑛+1
X 1 X 1 1 X 1 X 1 1
= − = − =1− → 1.
𝑘=1
𝑘(𝑘 + 1) 𝑘=1 𝑘 𝑘 + 1 𝑘=1
𝑘 𝑘=2
𝑘 𝑛 + 1
116 3 serie
3.2 serie a termini positivi
Nel seguito considereremo serie i cui termini sono numeri reali positivi (o
almeno non negativi). Quando scriveremo 𝑎 𝑛 > 0 (o 𝑎 𝑛 ≥ 0) sarà sempre
sottointeso che 𝑎 𝑛 ∈ ℝ visto che per i numeri complessi non reali non abbiamo
definito la relazione d’ordine.
carattere delle serie a termini positivi
Teorema 3.9 (carattere delle serie a termini positivi). Se 𝑎 𝑛 ≥ 0 la serie 𝑎𝑛 è
P
regolare: o converge oppure diverge a +∞.
Dimostrazione. Se 𝑎 𝑛 ≥ 0 essendo 𝑎 𝑛 = 𝑆𝑛 − 𝑆𝑛−1 significa che la successione

𝑆𝑛 delle somme parziali è crescente. Dunque il limite delle 𝑆𝑛 esiste e non può
essere negativo.
criterio del confronto
𝑎𝑛 e 𝑏 𝑛 serie a termini positivi

P P
Teorema 3.10 (criterio del confronto). Siano
che si confrontano: 0 ≤ 𝑎 𝑛 ≤ 𝑏 𝑛 . Allora
+∞
X +∞
X
𝑎𝑛 ≤ 𝑏𝑛 .
𝑘=0 𝑘=0
𝑏 𝑛 converge anche 𝑎 𝑛 converge e se 𝑎 𝑛 diverge anche 𝑏𝑛

P P P P
In particolare se
diverge.
Quest’ultimo risultato vale anche se 0 ≤ 𝑎 𝑛 𝑏 𝑛 .
Dimostrazione. Se 𝑆𝑛 sono le somme parziali di 𝑎 𝑛 e 𝑅 𝑛 sono le somme parziali

P
di 𝑏 𝑛 si ha 𝑆𝑛 ≤ 𝑅 𝑛 e il risultato si riconduce al confronto tra successioni.
P
Nel caso in cui 𝑎 𝑛 𝑏 𝑛 per definizione sappiamo che 𝑏𝑎𝑛𝑛 → 0 e quindi dalla
definizione di limite sappiamo che esiste 𝑁 tale che per ogni 𝑛 > 𝑁 si ha
(avendo scelto 𝜀 = 1)
𝑎𝑛
< 1.
𝑏𝑛
Dunque si ottiene 𝑎 𝑛 ≤ 𝑏 𝑛 per tutti gli 𝑛 tranne al più un numero finito. Sapendo
che il carattere della serie non cambia se si modifica la serie su un numero finito
di termini ci si riconduce al caso precedente.
Esempio 3.11. La serie

+∞
X 1
(3.1)
𝑘=1 𝑘2
è convergente. Infatti osservando che si ha per ogni 𝑛 > 0
1 1
≤
(𝑛 + 1)2 𝑛(𝑛 + 1)
possiamo affermare che

+∞ +∞ +∞
X 1 X 1 X 1
=1+ ≤ 1 + =2
𝑘=1 𝑘2 𝑘=1 (𝑘 + 1)2
𝑘=1
𝑘(𝑘 + 1)
3.2 serie a termini positivi 117
in quanto ci siamo ricondotti alla serie telescopica di Mengoli che ha somma pari a 1.
Sappiamo quindi che la serie (3.1) è convergente senza sapere esattamente quale sia la
sua somma. Possiamo però trovare numericamente delle approssimazioni della somma,
facendo la somma dei primi termini e stimando l’errore tramite la serie di Mengoli, di
cui sappiamo calcolare la somma. Infatti se 𝑆 𝑁 è la somma parziale dei primi 𝑁 termini
e 𝑆 = lim 𝑆 𝑁 è la somma della serie, essendo 1/(𝑘 + 1)2 ≤ 1/(𝑘 2 + 𝑘) si ha
+∞
X 1 1
𝑆𝑁 ≤ 𝑆 ≤ 𝑆𝑁 + ≤ 𝑆𝑁 + .
𝑘=𝑁
𝑘(𝑘 + 1) 𝑁
Per calcolare le prime 6 cifre decimali esatte basterà quindi sommare il primo milione
di termini della serie. Lo si può fare, ad esempio, con il codice riportato a pagina 426,
ottenendo 𝑆 = 1.644934 . . .
Utilizzando strumenti molto più avanzati Eulero (Leonard Euler, 1707–1783) è riuscito
ad esprimere la somma di questa serie mediante costanti matematiche fondamentali (noi
lo faremo con un metodo diverso nell’esercizio 7.78).
criterio del confronto asintotico
Corollario 3.12 (criterio del confronto asintotico). Se 𝑎 𝑛 e 𝑏 𝑛 sono successio-
ni a termini positivi, asintoticamente equivalenti (definizione 2.57), allora le serie
corrispondenti 𝑎 𝑛 e 𝑏 𝑛 hanno lo stesso carattere.
P P
Dimostrazione. Le serie a termini positivi non possono essere indeterminate

quindi è sufficiente verificare che se una serie converge, converge anche l’altra.
Essendo 𝑎 𝑛 /𝑏 𝑛 convergente tale rapporto deve anche essere limitato, quindi
esiste 𝐶 ∈ ℝ tale che
𝑎𝑛 ≤ 𝐶 · 𝑏𝑛 .
Se la serie 𝑏 𝑛 converge anche 𝐶 · 𝑏 𝑛 converge e, per confronto, converge
P P
anche 𝑎 𝑛 .
P
Viceversa, scambiando il ruolo di 𝑎 𝑛 e 𝑏 𝑛 si verifica che se 𝑎 𝑛 converge, converge

anche 𝑏 𝑛 .

X 𝑛 2 + 2𝑛 + 3
𝑛 2𝑛 4 − 𝑛 3 + 𝑛 + 1
è convergente. Infatti si può facilmente verificare che
𝑛 2 + 2𝑛 + 3 1
∼ .
2𝑛 − 𝑛 + 𝑛 + 1
4 3 2𝑛 2
Ma sappiamo che la serie 1/𝑛 2 è convergente, di conseguenza anche la serie 1/(2𝑛 2 )

P P
lo è (per linearità della somma) e quindi, per confronto asintotico, anche la serie data è
convergente. criterio della radice
Teorema 3.14 (criterio della radice). Sia 𝑎 𝑛 una serie a termini non negativi (cioè
P
√
𝑎 𝑛 ≥ 0) tale che 𝑛 𝑎 𝑛 → ℓ ∈ [0, +∞]. Se ℓ < 1 allora la serie converge. Se ℓ > 1
allora la serie diverge.
118 3 serie
Più in generale il risultato è valido con

√
ℓ = lim sup 𝑛
𝑎𝑛
√
anche nel caso in cui il limite di 𝑛
𝑎 𝑛 non dovesse esistere.
Dimostrazione. Nel caso ℓ < 1 prendiamo 𝑞 con ℓ < 𝑞 < 1 e poniamo 𝜀 = 𝑞 − ℓ .

√ √
Per la definizione di limite 𝑛 𝑎 𝑛 → ℓ (ma basta che sia lim sup 𝑛 𝑎 𝑛 = ℓ )
sappiamo esistere 𝑁 tale che per ogni 𝑛 > 𝑁 si abbia
√
𝑛
𝑎𝑛 < ℓ + 𝜀 = 𝑞
cioè
𝑎𝑛 < 𝑞 𝑛 .
Sapendo che 𝑞 𝑛 converge, sapendo anche che il carattere della serie non
P
cambia modificando un numero finito di termini, per confronto possiamo
concludere che anche la serie 𝑎 𝑛 converge.
P
√
Se ℓ > 1 si ha che 𝑛 𝑎 𝑛 > 1 e quindi 𝑎 𝑛 > 1 per infiniti valori di 𝑛 . La successione
𝑎 𝑛 non è infinitesima e quindi la serie non può convergere.

2(ln 𝑘)−𝑘
X
𝑘
è convergente. Infatti si ha
p𝑘 ln 𝑘−𝑘 ln 𝑘 1
2ln 𝑘−𝑘 = 2 𝑘 =2 𝑘 −1 → 2− 1 = < 1.
2
criterio del rapporto
Teorema 3.16 (criterio del rapporto). Sia 𝑎 𝑛 una serie a termini non negativi
P
( 𝑎 𝑛 ≥ 0) tale che 𝑎 𝑛+1 /𝑎 𝑛 → ℓ ∈ [0 , +∞]. Se ℓ < 1 allora la serie converge. Se ℓ > 1
la serie diverge.
Dimostrazione. Non sarebbe difficile fare una dimostrazione diretta, simile alla
dimostrazione fatta per il criterio della radice. Possiamo però osservare che per
√
il criterio di convergenza alla Cesàro (teorema 2.77) si ha 𝑛 𝑎 𝑛 → ℓ quindi ci
riconduciamo al criterio della radice senza dover fare ulteriori dimostrazioni.
Esempio 3.17. Per ogni 𝑥 ≥ 0 la serie

X 𝑥𝑛
𝑛!
converge.
Dimostrazione. Applichiamo il criterio del rapporto. Posto 𝑎 𝑛 = 𝑥 𝑛 /𝑛 ! si ha
𝑎 𝑛+1 𝑥 𝑛+1 𝑛! 𝑥
= · 𝑛 = → 0 < 1.
𝑎𝑛 (𝑛 + 1)! 𝑥 𝑛+1
Dunque la serie converge.

associatività della somma di una serie
Esempio 3.18. Posto 𝑎 𝑘 = (−1) 𝑘 sappiamo che la serie corrispondente:
1−1+1−1+1...
è indeterminata perché le somme parziali sono

(
𝑛
1 se 𝑛 pari
(−1) 𝑘 =
X
𝑆𝑛 =
𝑘=0 0 se 𝑛 è dispari.
Se però associamo i termini a due a due otteniamo la serie
(1 − 1) + (1 − 1) + (1 − 1) · · · = 0 + 0 + 0 + · · · = 0
che è convergente. Il motivo è che la successione delle somme parziali di questa nuova
serie è una particolare estratta (quella con gli indici pari) della successione delle somme
parziali della serie originale. Quindi non ci dovrebbe sorprendere il fatto che nonostante
la serie originale fosse indeterminata è possibile associare i termini della serie in modo
da ottenere una serie regolare (in questo caso convergente). In effetti per il teorema 2.66
di Bolzano-Weierstrass sappiamo che è sempre possibile estrarre una sottosuccessione
regolare (convergente o divergente) da qualunque successione. Anche quando da una
serie indeterminata si estrae una serie convergente la somma della serie può dipendere
da come i termini vengono associati. Se ad esempio nella serie precedente prendessimo
solamente le somme di indice dispari otterremmo:
1 + (−1 + 1) + (−1 + 1) + · · · = 1.
L’esempio precedente ci mostra che associando i termini di una serie indeter-

minata è possibile ottenere serie con carattere e somma diversi. Il seguente
teorema ci dice che questo fenomeno cattivo può solo avvenire quando si parte
da una serie indeterminata. Se la serie è regolare allora possiamo associarne i
termini senza modificarne né il carattere né la somma. In particolare questo è
vero per le serie a termini positivi.
𝑎 𝑘 è una serie, scelta

P
Teorema 3.19 (associatività delle serie regolari). Se
comunque una successione crescente 𝑘 𝑛 con 𝑘 0 = 0 possiamo considerare la serie 𝑏 𝑛
P
i cui termini
𝑘 𝑛+
X 1 −1
𝑏𝑛 = 𝑎𝑗
𝑗=𝑘 𝑛
si ottengono associando i termini di 𝑎 𝑘 a gruppi consecutivi delimitati dalla successione

di indici 𝑘 𝑛 .
𝑎 𝑘 è regolare (convergente o divergente) allora anche la serie 𝑏 𝑛 è regolare

P P
Se la serie
e si ha
+∞
X +∞
X
𝑏𝑛 = 𝑎𝑘 .
𝑛=0 𝑘=0
𝑎 𝑘 è a termini positivi.
P
In particolare questo vale se la serie
120 3 serie
Dimostrazione. Siano 𝑆 𝑘 = 𝑘𝑗=0 𝑎 𝑗 le somme parziali della serie 𝑎 𝑗 . Allora

P P
le somme parziali della serie 𝑏 𝑛 non sono altro che la sottosuccessione 𝑆 𝑘 𝑛 .
P
Dunque se 𝑆 𝑘 converge anche ogni sua sottosuccessione converge allo stesso
limite.
Il teorema 3.9 ci dice che le serie a termini positivi sono regolari e quindi
soddisfano le ipotesi del teorema.
serie armonica
la serie armonica
Osserviamo che il criterio del rapporto non si applica alla serie armonica
X1
𝑘
𝑘
in quanto
1
𝑘+1 𝑘
= → 1.
1 𝑘+1
𝑘
Per capire se la serie armonica converge o diverge presentiamo il metodo di

condensazione che verrà enunciato in generale nel prossimo teorema ma che può
essere meglio compreso se applicato al caso particolare della serie armonica.
Mostreremo che la serie armonica diverge. L’idea è semplicemente quella di

associare gli addendi della serie armonica in gruppi di lunghezza potenze di
criterio di condensazione di Cauchy due e stimare la somma di ogni gruppo dal basso con il termine più piccolo
(cioè l’ultimo) di ogni gruppo:
+∞
X 1 1 1 1 1 1 1 1
=1+ + + + + + + +...
𝑘=1
𝑘 2 3 4 5 6 7 8
1 1 1
> 1+ +2· +4· +...
2 4 8
1 1 1
= 1 + + + + · · · = +∞.
2 2 2
Teorema 3.20 (criterio di condensazione di Cauchy). Sia 𝑎 𝑛 una successione

decrescente di numeri reali non negativi: 𝑎 𝑛 ≥ 0. Allora la serie 𝑎 𝑘 converge se e
P
solo se converge la serie X 𝑘
2 𝑎2𝑘 .
Dimostrazione. Supponiamo per comodità che le somme partano da 𝑘 = 1. Si

tratta di raggruppare i termini 𝑎 𝑘 in gruppi di potenze di due:
𝑏0 = 𝑎1 ,
𝑏1 = 𝑎2 + 𝑎3 ,
𝑏2 = 𝑎4 + 𝑎5 + 𝑎6 + 𝑎7 ,
𝑏 3 = 𝑎 8 + 𝑎 9 + 𝑎10 + · · · + 𝑎15 ,
..
.
𝑏 𝑛 = 𝑎 2𝑛 + 𝑎 2𝑛 +1 + · · · + 𝑎2𝑛+1 −1 ,
..
.
Grazie al teorema 3.19 sulla associatività delle serie a termini positivi sappiamo
che
+∞
X +∞
X
𝑎𝑘 = 𝑏𝑛 .
𝑘=1 𝑛=0
Ogni termine 𝑏 𝑛 è la somma di 2𝑛 termini della successione 𝑎 𝑘 che, essendo

la successione decrescente, possono essere stimati dall’alto e dal basso con il
primo e l’ultimo termine di ogni somma, dunque:
2𝑛 𝑎 2𝑛+1 −1 ≤ 𝑏 𝑛 ≤ 2𝑛 𝑎 2𝑛 .
Per ipotesi la serie 2𝑛 𝑎 2𝑛 è convergente dunque per confronto anche la serie

P
𝑏 𝑛 è convergente.
P
Viceversa se la serie 2𝑛 𝑎 2𝑛 è divergente anche la serie 2𝑛+1 𝑎 2𝑛+1 è divergente

P P
e sapendo che 𝑏 𝑛 ≥ 2𝑛 𝑎 2𝑛+1 −1 ≥ 12 2𝑛+1 𝑎 2𝑛+1 otteniamo, per confronto, che anche
la serie 𝑏 𝑛 è divergente.
P
serie armonica generalizzata

Corollario 3.21 (serie armonica generalizzata). La serie
X 1
𝑛 𝑛𝛼
converge se 𝛼 > 1, diverge se 0 ≤ 𝛼 ≤ 1.
Dimostrazione. Applichiamo il criterio di condensazione. Posto 𝑎 𝑛 = 1

𝑛𝛼 Si ha
1 X 𝑛(1−𝛼) X (1−𝛼) 𝑛
2 𝑛 𝑎 2𝑛 = 2𝑛
X X
= 2 = 2
𝑛 𝑛 (2𝑛 )𝛼 𝑛 𝑛
che è una serie geometrica di ragione 𝑞 = 21−𝛼 . Se 𝛼 > 1 allora 𝑞 < 1 e la

serie armonica è convergente se invece 𝛼 ≤ 1 allora 𝑞 ≥ 1 e la serie armonica è
divergente.
Esercizio 3.22. Utilizzare il criterio di condensazione per dimostrare che la serie

X 1
𝑛 · ln 𝑛
122 3 serie
diverge.
Esercizio 3.23. Per quali valori dei parametri 𝛼 ∈ ℝ e 𝛽 ∈ ℝ la serie
𝑛 𝛼 (ln 𝑛)𝛽
X
converge?
3.3 rappresentazione posizionale dei numeri reali
Quando scriviamo 3
8 = 0.375 intendiamo che vale
3 3 7 5
= + + .
8 10 102 103
Più in generale data una base 𝑑 ∈ ℕ , 𝑑 ≥ 2, ( 𝑑 = 10 nel caso della rappresen-

tazione decimale) consideriamo l’insieme [𝑑] = {0 , 1 , 2 , . . . , 𝑑 − 1} delle cifre
in base 𝑑 . Una sequenza infinita di cifre sarà quindi un elemento 𝒂 ∈ [𝑑]ℕ ,
𝒂 = (𝑎0 , 𝑎1 , . . . , 𝑎 𝑛 , . . . ) con 𝑎 𝑘 ∈ [𝑑]. Potremo quindi considerare il numero
“0.𝑎 0 𝑎 1 𝑎 2 . . .” rappresentato dalla sequenza di cifre 𝒂 :
+∞
X 𝑎𝑘
𝑟(𝒂) = .
𝑘=0 𝑑 𝑘+1
Chiaramente 𝑟(𝒂) ∈ [0 , 1] in quanto essendo 0 ≤ 𝑎 𝑘 ≤ 𝑑 − 1 risulta

+∞ +∞
X 𝑑−1 𝑑−1X 1 𝑑−1 1
0 ≤ 𝑟(𝒂) ≤ = = · = 1. (3.2)
𝑘=0 𝑑 𝑘+1 𝑑 𝑘=0 𝑑 𝑘 𝑑 1− 1
𝑑
Ogni numero 𝑥 ∈ [0 , 1) ammette una rappresentazione in cifre 𝑥 = 𝑟(𝒂) con

𝒂 ∈ [𝑑]ℕ . Infatti per ogni 𝑁 ∈ ℕ possiamo scrivere
𝑁−
X1
b𝑥 · 10𝑁 c = 𝑎 𝑘 10𝑁−1−𝑘
𝑘=0
e al crescere di 𝑁 otteniamo una sequenza di cifre 𝑎 𝑘 ∈ [𝑑] tali che

𝑁−
X1
𝑁 𝑁−1−𝑘
𝑥 · 𝑑 − 𝑎 · 𝑑 ≤1

𝑘
𝑘=0

da cui
𝑁−
X1 𝑎 𝑘 1

𝑥 − ≤ 𝑁

𝑑 𝑘+1 𝑑
𝑘=0

che, facendo tendere 𝑁 → +∞, significa 𝑟(𝒂) = 𝑥 . Il numero 𝑥 = 1 può essere

anch’esso rappresentato, basta prendere 𝑎 𝑘 = 𝑑 − 1 per ogni 𝑘 ∈ ℕ cosicché si
ottiene l’uguaglianza nel lato destro di (3.2). In base 𝑑 = 10 questo si esprime
dicendo che
0.999 . . . = 1.
3.3 rappresentazione posizionale dei numeri reali 123
Ci possiamo chiedere se è possibile che lo stesso numero abbia due rappresen-

tazioni in cifre distinte. Supponiamo quindi che esistano 𝒂, 𝒃 ∈ [𝑑]ℕ con 𝒂 ≠ 𝒃
tali che 𝑟(𝒂) = 𝑟(𝒃). Sia 𝑚 = min {𝑛 ∈ ℕ : 𝑎 𝑛 ≠ 𝑏 𝑛 } la posizione della prima
cifra diversa tra 𝒂 e 𝒃 . Si ha allora
+∞ +∞
X 𝑏𝑘 − 𝑎𝑘 𝑏𝑚 − 𝑎𝑚 X 𝑏𝑘 − 𝑎𝑘
𝑟(𝑏) − 𝑟(𝑎) = = 𝑚+
+ =𝐴+𝐵
𝑘=0 𝑑 𝑘+1 𝑑 1
𝑘=𝑚+1 𝑑
𝑘+1
con
𝑏𝑚 − 𝑎𝑚

1
|𝐴| = 𝑚+1 ≥ 𝑚+1

𝑑 𝑑
e

+∞ +∞
𝑏𝑘 − 𝑎𝑘 𝑑−1
X X
|𝐵| = ≤

𝑘=𝑚+1 𝑑 𝑘+1 𝑘=𝑚+1 𝑑 𝑘+1

+∞
𝑑−1X 1 𝑑−1 1 1
= 𝑚+
= 𝑚+2 · = .
𝑑 2
𝑘=0 𝑑 𝑘 𝑑 1 − 1
𝑑
𝑑 𝑚+1
Dunque, per disuguaglianza triangolare inversa,
0 = |𝑟(𝑏) − 𝑟(𝑎)| ≥ |𝐴| − |𝐵| ≥ 0.
Significa che tutte le disuguaglianze sono in realtà uguaglianze e quindi deve

essere |𝑏 𝑚 − 𝑎 𝑚 | = 1 e per ogni 𝑘 > 𝑚 deve essere |𝑏 𝑘 − 𝑎 𝑘 | = 𝑑− 1. Supponendo
che sia 𝑏 𝑚 = 𝑎 𝑚 + 1 (l’altro caso è analogo) per 𝑘 > 𝑚 dovrà necessariamente
essere 𝑏 𝑘 = 0 e 𝑎 𝑘 = 𝑑 − 1.
Ad esempio se 𝑑 = 10, 𝒂 = (1 , 2 , 3 , 9 , 9 , 9 , 9 , . . . ) e 𝒃 = (1 , 2 , 4 , 0 , 0 , 0 , 0 , . . . ) si
avrà 𝑟(𝒂) = 𝑟(𝒃) = 0.124.
Teorema 3.24 (Cantor). Fissata una base 𝑑 > 2 l’insieme
𝐶 = {𝑟(𝒂) : 𝒂 ∈ {0 , 2}ℕ }
ha cardinalità
#𝐶 = #P(ℕ ).
In particolare #ℝ > #ℕ .
Dimostrazione. Vogliamo verificare che 𝑟 : {0 , 2}ℕ → [0 , 1] è iniettiva. Abbiamo

già visto in generale che 𝑟(𝒂) = 𝑟(𝒃) solamente se la prima cifra diversa in
𝒂 e 𝒃 differisce di una unità. Ma siccome tutte le cifre di 𝒂 e 𝒃 per ipotesi
sono 0 oppure 2, non differiscono di una unità e quindi 𝑟 è iniettiva. Dunque
#𝐶 = #{0 , 2}ℕ . D’altra parte #{0 , 2}ℕ = #P(ℕ ) in quanto ogni 𝒂 ∈ {0 , 2}ℕ può
essere messo in corrispondenza biunivoca con l’insieme 𝒂 −1 ({0}) degli indici
𝑘 ∈ ℕ per cui 𝑎 𝑘 = 0.
Dal teorema 1.61 deduciamo che #𝐶 #P(ℕ ) > #ℕ e visto che 𝐶 ⊆ ℝ a maggior
ragione #ℝ ≥ #𝐶 > #ℕ .
124 3 serie
D’altra parte possiamo mostrare che #ℝ ≤ #P(ℕ ) in quanto possiamo costruire

una funzione 𝑓 : ℝ → P(ℚ) in questo modo:
𝑓 (𝑥) = {𝑞 ∈ ℚ : 𝑞 < 𝑥}.
Per la densità di ℚ in ℝ sappiamo che se 𝑥 < 𝑦 esiste 𝑞 ∈ ℚ con 𝑥 < 𝑞 < 𝑦

e dunque 𝑞 ∈ 𝑓 (𝑦) \ 𝑓 (𝑥) da cui 𝑓 (𝑥) ≠ 𝑓 (𝑦). Dunque 𝑓 è iniettiva, che
significa #ℝ ≤ #P(ℚ) Ma #ℕ = #ℚ dunque #P(ℚ) = #P(ℕ ) e la dimostrazione
è conclusa.
L’insieme 𝐶 definito nella precedente dimostrazione con 𝑑 = 3 è lo stesso insieme

insieme di Cantor di Cantor considerato nell’esempio 7.83. Infatti si potrebbe mostrare facilmente
che 𝐶 = 13 𝐶 ∪ ( 32 + 13 𝐶).
3.4 convergenza assoluta
Per le serie a termini positivi abbiamo molti criteri di convergenza che invece, in
generale, non si applicano alle serie di segno qualunque o alle serie di numeri
complessi. La convergenza di queste ultime, però, può a volte ricondursi
facilmente alla convergenza delle serie a termini positivi, passando al modulo
ogni termine.
Definizione 3.25 (convergenza assoluta). Diremo che una serie (a termini reali o
complessi) 𝑎 𝑛 è assolutamente convergente se la serie |𝑎 𝑛 | è convergente.
P P
assolutamente convergente
𝑎 𝑛 (reale o complessa) è
P
Teorema 3.26 (convergenza assoluta). Se una serie
assolutamente convergente allora è convergente e vale

X+∞ X +∞
𝑎𝑘 ≤ |𝑎 𝑘 |.

𝑘=0 𝑘=0
Dimostrazione. Supponiamo inizialmente che gli 𝑎 𝑛 siano numeri reali. Defi-

niamo 𝑎 𝑛+ = max {0 , 𝑎 𝑛 } e 𝑎 𝑛− = − min {0 , 𝑎 𝑛 }. Cioè se 𝑎 𝑛 ≥ 0 si ha 𝑎 𝑛+ = 𝑎 𝑛 e
𝑎 𝑛− = 0 se invece 𝑎 𝑛 ≤ 0 si ha 𝑎 𝑛+ = 0 e 𝑎 𝑛− = −𝑎 𝑛 . Dunque 𝑎 𝑛+ ≥ 0, 𝑎 𝑛− ≥ 0,
𝑎 𝑛 = 𝑎 𝑛+ − 𝑎 𝑛− e |𝑎 𝑛 | = 𝑎 𝑛+ + 𝑎 𝑛− .
Allora se |𝑎 𝑛 | converge, per confronto anche 𝑎 𝑛+ e 𝑎 𝑛− convergono. Dunque,

P P P
per il teorema sulla somma dei limiti, 𝑎 𝑛 = 𝑎 𝑛+ − 𝑎 𝑛− e quindi anche 𝑎 𝑛
P P P P
converge.
Se abbiamo una successione di complessi 𝑎 𝑛 = 𝑥 𝑛 + 𝑖 𝑦𝑛 e se |𝑎 𝑛 | converge

P
allora, per confronto, anche |𝑥 𝑛 | e |𝑦𝑛 | convergono (si osservi infatti che
P P
|𝑥| ≤ |𝑥 + 𝑖 𝑦| e |𝑦| ≤ |𝑥 + 𝑖 𝑦| ). Dunque 𝑥 𝑛 e 𝑦𝑛 convergono per quanto già
P P
dimostrato sulle serie a termini reali. Ma allora anche 𝑖 𝑦𝑛 e 𝑎 𝑛 = (𝑥 + 𝑖 𝑦𝑛 )
P P P
convergono.
Poniamo ora
𝑛
X
𝑆𝑛 = 𝑎𝑘 .
𝑘=0
3.4 convergenza assoluta 125
Per la subadditività del modulo sappiamo che per le somme finite si ha

X 𝑛 X 𝑛 +∞
X
|𝑆𝑛 | = 𝑎𝑘 ≤ |𝑎 𝑘 | ≤ |𝑎 𝑘 |.

𝑘=0 𝑘=0 𝑘=0
E per continuità del modulo, posto 𝑆 = lim 𝑆𝑛 si ha

X+∞ +∞
X
𝑎 𝑘 = |𝑆| = lim |𝑆𝑛 | ≤ |𝑎 𝑘 |.

𝑛→+∞

𝑘=0 𝑘=0
Teorema 3.27 (convergenza incondizionata). Se 𝑎 𝑛 è una serie assolutamente

P
convergente e 𝜎 : ℕ → ℕ è una qualunque funzione biettiva (permutazione dei numeri
naturali) si ha
+∞
X +∞
X
𝑎𝑛 = 𝑎 𝜎(𝑛) .
𝑛=0 𝑛=0
Dimostrazione. Basta mostrare che

" #
𝑛
X 𝑛
X
lim 𝑎𝑘 − 𝑎 𝜎(𝑗) = 0. (3.3)
𝑛→+∞
𝑘=0 𝑗=0
Visto che la serie 𝑎 𝑘 è assolutamente convergente per il teorema 3.7 sappiamo

P
che per ogni 𝜀 > 0 esiste 𝑁𝜀 ∈ ℕ tale che
+∞
X
|𝑎 𝑘 | < 𝜀.
𝑘=𝑁𝜀
Inoltre visto che 𝜎 : ℕ → ℕ è suriettiva deve esistere 𝑀 𝜀 ∈ ℕ per cui risulti
{𝜎(0), 𝜎(1), . . . , 𝜎(𝑀 𝜀 − 1)} ⊇ {0 , 1 , . . . , 𝑁𝜀 − 1}
ovvero per ogni 𝑘 < 𝑁𝜀 esiste 𝑗 < 𝑀 𝜀 tale che 𝜎(𝑗) = 𝑘 . Necessariamente deve
essere 𝑀 𝜀 ≥ 𝑁𝜀 . Per ogni 𝑛 > 𝑀 𝜀 consideriamo la differenza tra le somme
parziali:
𝑛
X 𝑛
X
𝑎𝑘 − 𝑎 𝜎(𝑗)
𝑘=0 𝑗=0
e osserviamo che se 𝑗 ≤ 𝑛 e 𝑘 = 𝜎(𝑗) ≤ 𝑛 allora i termini 𝑎 𝑘 e 𝑎 𝜎(𝑗) si elidono. I

termini che non si elidono sono gli 𝑎 𝑘 della prima somma in cui 𝜎 −1 (𝑘) > 𝑛 e
gli 𝑎 𝜎(𝑗) della seconda somma in cui 𝜎(𝑗) > 𝑛 . In ogni caso tali termini hanno
indice maggiore o uguale a 𝑁𝜀 e quindi la loro somma può essere stimata con
la somma dei loro moduli che a sua volta può essere stimata con la somma dei
moduli di tutti i termini con indice non inferiore a 𝑁𝜀 :

X 𝑛 X𝑛 X+∞
𝑎𝑘 − 𝑎 𝜎(𝑗) ≤ 2 |𝑎 𝑘 | ≤ 2𝜀.

𝑗=0
𝑘=0 𝑘=𝑁𝜀
126 3 serie
Questo garantisce la validità dell’equazione (3.3) in base alla definizione di

limite.
3.5 serie a segno variabile

P (−1)𝑘
La serie 𝑘+1 la cui somma si può scrivere come
serie armonica a segni alterni
1 1 1 1
1− + − + ...
2 3 4 5
non è assolutamente convergente (in quanto la serie 𝑘+1 1 è divergente) ma ha

P
il termine generico infinitesimo. Non abbiamo quindi nessun criterio che ci
permetta di determinarne il carattere. Possiamo però sfruttare il fatto che i segni
sono alterni cioè che i termini di indice pari hanno segno opposto ai termini di
indice dispari. Si nota infatti che posto
𝑛
X (−1) 𝑘
𝑆𝑛 =
𝑘=0
𝑘+1
si ha
1 1 1
𝑆2𝑛+2 = 𝑆2𝑛+1 + = 𝑆2 𝑛 − + < 𝑆2 𝑛
2𝑛 + 3 2𝑛 + 2 2𝑛 + 3
1 1 1
𝑆2𝑛+3 = 𝑆2𝑛+2 − = 𝑆2𝑛+1 + − > 𝑆2𝑛+1
2𝑛 + 4 2𝑛 + 3 2𝑛 + 4
Dunque la successione delle somme parziali di indice pari è decrescente mentre

sui termini di indice dispari è crescente. Avremo quindi che entrambe le
sottosuccessioni hanno limite: 𝑆2𝑛 → 𝑆 , 𝑆2𝑛+1 → 𝑅 .
Ma
1
𝑆 − 𝑅 = lim (𝑆2𝑛 − 𝑆2𝑛+1 ) = lim = 0.
𝑛→+∞ 𝑛→+∞ 2𝑛 + 2
Dunque 𝑆 = 𝑅 e l’intera successione ha limite 𝑆 . D’altra parte 𝑆 ≤ 𝑆0 in quanto
𝑆2𝑛 è decrescente e 𝑆 ≥ 𝑆1 in quanto 𝑆2𝑛+1 è crescente. Concludiamo che 𝑆 è
Per determinare il valore della somma di finito e dunque la serie è convergente.
questa serie ci serviranno degli strumenti
più avanzati. Si veda l’equazione 5.16. Questa dimostrazione può essere resa più in generale nel seguente.
criterio di Leibniz Teorema 3.28 (serie a segni alterni: criterio di Leibniz). Sia 𝑏 𝑛 una successione
monotòna e infinitesima. Allora la serie
(−1)𝑛 𝑏 𝑛
X
è convergente.
𝑛
(−1) 𝑘 𝑏 𝑘 sono le somme parziali, si osserva che la somma
X
Più precisamente se 𝑆𝑛 =
𝑘=0
della serie 𝑆 = lim 𝑆𝑛 è sempre compresa tra due termini consecutivi della successione
𝑆𝑛 :
𝑆 ∈ [min{𝑆𝑛 , 𝑆𝑛+1 }, max{𝑆𝑛 , 𝑆𝑛+1 }].
3.5 serie a segno variabile 127
Dimostrazione. Senza perdere di generalità possiamo supporre che la successione

𝑏 𝑛 sia decrescente e quindi 𝑏 𝑛 ≥ 0 (visto che il limite è zero). Posto
𝑛
(−1) 𝑘 𝑏 𝑘
X
𝑆𝑛 =
𝑘=0
si ha
𝑆2𝑛+2 = 𝑆2𝑛 − 𝑏 2𝑛+1 + 𝑏2𝑛+2

𝑆2𝑛+3 = 𝑆2𝑛+1 + 𝑏2𝑛+2 − 𝑏 2𝑛+3 .
Essendo 𝑏 𝑛 decrescente si ha 𝑏 2𝑛+2 < 𝑏 2𝑛+1 e 𝑏 2𝑛+3 < 𝑏 2𝑛+2 da cui
𝑆2𝑛+2 < 𝑆2𝑛 , 𝑆2𝑛+3 > 𝑆2𝑛+1 .
Dunque le successioni 𝑆2𝑛 e 𝑆2𝑛+1 sono monotone e di conseguenza hanno

limite:
𝑆2𝑛 → 𝑆, 𝑆2𝑛+1 → 𝑅
con 𝑆, 𝑅 ∈ [−∞, +∞]. D’altronde, essendo 𝑏 𝑛 infinitesima
𝑆 − 𝑅 = lim 𝑆2𝑛 − 𝑆2𝑛+1 = lim 𝑏2𝑛+1 = 0.

𝑛→+∞ 𝑛→+∞
Dunque 𝑆 = 𝑅 . Inoltre essendo 𝑆2𝑛 decrescente si ha 𝑆 ≤ 𝑆0 ed essendo 𝑆2𝑛+1

crescente si ha 𝑆 ≥ 𝑆1 . Dunque 𝑆 è finito e la serie converge.
Abbiamo anche ottenuto che 𝑆2𝑛−1 ≤ 𝑆 ≤ 𝑆2𝑛 e 𝑆2𝑛+1 ≤ 𝑆 ≤ 𝑆2𝑛 dunque è

verificata anche la seconda parte dell’enunciato.
Abbiamo dunque un esempio, la serie (−1) 𝑘 /𝑘 di una serie convergente ma

P
non assolutamente convergente. Il seguente teorema ci dice che per le serie di
questo tipo non è mai garantito che riordinando i termini la somma si conservi.
convergenza condizionata
Teorema 3.29 (convergenza condizionata). Sia 𝑎 𝑘 una serie convergente ma non

P
assolutamente convergente a termini reali. Allora fissato qualunque 𝑥 ∈ [−∞, +∞]
esiste un riordinamento 𝜎 : ℕ → ℕ biettivo tale che
+∞
X
𝑎 𝜎(𝑘) = 𝑥.
𝑘=0
Dimostrazione. Dividiamo i termini della successione 𝑎 𝑘 in termini maggiori o

uguali a zero e in termini negativi. Sia 𝑎 +𝑘 la sottosuccessione dei termini non
negativi e −𝑎 −𝑘 la sottosuccessione degli opposti dei termini negativi (quindi
𝑎 +𝑘 ≥ 0 e 𝑎 −𝑘 > 0). Si avrà
𝑛
X 𝑛+
X 𝑛−
X
𝑎𝑘 = 𝑎 +𝑘 − 𝑎 −𝑘
𝑘=0 𝑘=0 𝑘=0
𝑛
X 𝑛+
X 𝑛−
X
|𝑎 𝑘 | = 𝑎 +𝑘 + 𝑎 −𝑘
𝑘=0 𝑘=0 𝑘=0
128 3 serie
dove 𝑛 + + 1 e 𝑛 − + 1 sono rispettivamente il numero di termini non-negativi e

negativi tra i primi 𝑛 + 1 termini della successione 𝑎 𝑘 .
Osserviamo ora che dovrà essere

+∞
X +∞
X
𝑎 +𝑘 = +∞ e 𝑎 −𝑘 = +∞.
𝑘=0 𝑘=0
Innanzitutto le somme esistono perché le serie sono a termini non negativi. Se

entrambe queste somme fossero finite allora la serie |𝑎 𝑘 | sarebbe convergente,
P
ma per ipotesi abbiamo assunto che 𝑎 𝑘 non fosse assolutamente convergente.
P
Quindi almeno una delle due somme è infinita. Se la somma dei termini positivi
fosse infinita e quella dei termini negativi fosse finita potremmo però concludere
che anche la somma della serie 𝑎 𝑘 sarebbe infinita. Viceversa se la somma
P
dei termini positivi fosse finita e quella dei termini negativi fosse infinita la
somma 𝑎 𝑘 sarebbe −∞. Ma per ipotesi abbiamo richiesto che la serie 𝑎 𝑘
P P
fosse convergente.
Fissato 𝑥 ∈ ℝ possiamo quindi cominciare a sommare i termini positivi 𝑎 +𝑘 finché

non si raggiunge o si supera il valore 𝑥 . A quel punto cominciamo a sommare
i termini negativi finché non torniamo sotto al valore 𝑥 . Poi continuiamo a
sommare i termini positivi finché non si torna a superare 𝑥 e di nuovo poi
continuiamo con i termini negativi finché non si torna a scendere sotto 𝑥 .
Intermezzando opportunamente termini positivi e termini negativi riusciamo
quindi ad ottenere delle somme parziali che oscillano intorno al valore di 𝑥 e si
avvicinano sempre di più a 𝑥 in quanto ad ogni cambio di “rotta” la distanza
da 𝑥 è inferiore al valore assoluto dell’ultimo termine sommato e la successione
dei termini 𝑎 𝑘 è infinitesima in quanto la serie 𝑎 𝑘 è convergente.
P
Stessa cosa si può fare per ottenere una somma 𝑥 = +∞. Fissata una qualunque
successione 𝑥 𝑛 → +∞ comincio a sommare i termini positivi finché non supero
il valore 𝑥 1 + 𝑎 1− . Poi sommo un solo termine negativo, −𝑎 1− e ottengo una
somma maggiore di 𝑥 1 . Poi sommo tanti positivi finché non supero 𝑥 2 + 𝑎 2− .
Poi sommo un altro unico termine negativo e così via. Chiaramente le somme
tenderanno a +∞.
Il caso 𝑥 = −∞ si tratta in maniera analoga.
3.6 somme multiple
Teorema 3.30 (somme alla Cauchy). Sia 𝑎 𝑘,𝑗 ∈ ℂ una successione a due indici
𝑘 ∈ ℕ , 𝑗 ∈ ℕ . Se
+∞ X
X +∞
𝑎 𝑘,𝑗 < +∞

𝑘=0 𝑗=0
allora
+∞ X
X +∞ 𝑛
+∞ X
X
𝑎 𝑘,𝑗 = 𝑎 𝑘,𝑛−𝑘 .
𝑘=0 𝑗=0 𝑛=0 𝑘=0
3.6 somme multiple 129
Dimostrazione. Poniamo
+∞
X 𝑛
X
𝑏𝑘 = 𝑎 𝑘,𝑗 , 𝑐𝑛 = 𝑎 𝑘,𝑛−𝑘 .
𝑗=0 𝑘=0
Se immaginiamo i termini 𝑎 𝑘,𝑗 come i termini di una matrice infinita dove 𝑘 è

l’indice di riga e 𝑗 è l’indice di colonna, osserviamo che 𝑏 𝑘 rappresenta la somma
dei termini sulla riga 𝑘 -esima e la successione 𝑐 𝑛 rappresenta la somma (finita)
dei termini sulla diagonale 𝑘 + 𝑗 = 𝑛 . L’idea è che sommare i termini lungo
le righe oppure lungo le diagonali ci deve dare lo stesso risultato. L’ipotesi è
infatti una sorta di assoluta convergenza della serie di tutti i termini 𝑎 𝑘,𝑗 .
La tesi del teorema è

+∞
X 𝑁
X
𝑏 𝑘 = lim 𝑐𝑛
𝑁→+∞ 𝑛=0
𝑘=0
cioè per ogni 𝜀 > 0 dobbiamo trovare 𝛼 ∈ ℕ tale che per ogni 𝑁 > 𝛼 si abbia

X 𝑁 +∞
X
𝑐𝑛 − 𝑏 𝑘 < 4 𝜀.

𝑛=0 𝑘=0

Fissato 𝜀 > 0 applicando la proprietà della coda (teorema 3.7) alla serie
convergente data per ipotesi, si ottiene che esiste 𝐾 tale che:
+∞ X
+∞
𝑎 𝑘,𝑗 < 𝜀 .
X
𝑘=𝐾+1 𝑗=0
2
Sempre grazie alla proprietà della coda applicata ai singoli termini della serie
convergente per ipotesi possiamo affermare che per ogni 𝑘 ∈ {0 , 1 , . . . , 𝐾} esiste
un indice 𝐽𝑘 tale che
+∞
𝑎 𝑘,𝑗 ≤ 𝜀 .
X
𝑗=𝐽𝑘 +1 2 𝑘+2
Poniamo 𝐽 = max {𝐽0 , 𝐽1 , . . . , 𝐽𝐾 } e 𝛼 = 𝐽 + 𝐾 . Se 𝑁 ≥ 𝛼 si ha allora

X 𝑁 +∞
X X 𝑁 X𝐾
𝑐𝑛 − 𝑏𝑘 ≤ 𝑐𝑛 − 𝑏𝑘 + 𝜀

𝑛=0 𝑘=0
𝑛=0 𝑘=0

𝑁
0 𝑐 𝑛 sono
P
Osserviamo ora che i termini che vengono sommati nella serie 𝑛=
tutti i termini 𝑎 𝑘,𝑗 tali che 𝑘 + 𝑗 ≤ 𝑁 , mentre i termini che vengono sommati
in 𝐾𝑘=0 𝑏 𝑘 sono tutti i termini 𝑎 𝑘,𝑗 con 𝑘 ≤ 𝐾 . Quindi i termini in comune
P
alle due somme si cancellano e rimangono solamente i termini della prima
somma che non compaiono nella seconda e i termini della seconda somma che
non compaiono nella prima. Non ci interessa il segno di questi termini quindi
possiamo stimare la somma di tutti questi termini residui facendone la somma
130 3 serie
dei valori assoluti:

X 𝑁 X𝐾 𝑁 𝑁−𝑘
X X X 𝐾 X+∞
𝑐𝑛 − 𝑏𝑘 ≤ 𝑎 𝑘,𝑗 + 𝑎 𝑘,𝑗

𝑛=0 𝑘=0
𝑘=𝐾+1 𝑗=0 𝑘=0 𝑗=𝑁−𝐾
+∞ X
X +∞ X 𝐾 X
+∞
𝑎 𝑘,𝑗 + 𝑎 𝑘,𝑗

≤
𝑘=𝐾+1 𝑗=0 𝑘=0 𝑗=𝐽𝑘 +1
+∞
𝜀 X 𝜀
≤ + = 𝜀.
2 𝑘=0 2 𝑘+2
3.7 somma per parti
Teorema 3.31 (somma per parti). Siano 𝑎 𝑘 e 𝐵 𝑘 successioni (reali o complesse).

Posto
𝑛−1
X
𝐴𝑛 = 𝑎𝑘 , 𝑏 𝑛 = 𝐵𝑛+1 − 𝐵𝑛
somma per parti 𝑘=0
si ha
𝑛−1
X 𝑛−1
X
𝑎 𝑘 𝐵 𝑘 = 𝐴𝑛 𝐵𝑛 − 𝐴𝑚 𝐵𝑚 − 𝐴 𝑘+1 𝑏 𝑘 . (3.4)
𝑘=𝑚 𝑘=𝑚
Dimostrazione. Osserviamo che 𝑎 𝑛 = 𝐴𝑛+1 − 𝐴𝑛 dunque
𝑛−1
X
𝐴𝑛 𝐵𝑛 − 𝐴𝑚 𝐵𝑚 = (𝐴 𝑘+1 𝐵 𝑘+1 − 𝐴 𝑘 𝐵 𝑘 )
𝑘=𝑚
𝑛−1
X
= (𝐴 𝑘+1 𝐵 𝑘+1 − 𝐴 𝑘+1 𝐵 𝑘 + 𝐴 𝑘+1 𝐵 𝑘 − 𝐴 𝑘 𝐵 𝑘 )
𝑘=𝑚
𝑛−1
X 𝑛−1
X
= 𝐴 𝑘+1 𝑏 𝑘 + 𝑎 𝑘 𝐵𝑘 .
𝑘=𝑚 𝑘=𝑚
Se prendiamo 𝑎 𝑘 = (−1) 𝑘 si può osservare che 𝐴𝑛 = 𝑛− 1

(−1) 𝑘 è una successione
P
𝑘=0
limitata in quanto 𝐴𝑛 = 1 se 𝑛 è dispari mentre 𝐴𝑛 = 0 se 𝑛 è pari. Se invece
scegliamo una successione 𝐵𝑛 è positiva, decrescente e infinitesima e poniamo
𝑏 𝑛 = 𝐵𝑛+1 − 𝐵𝑛 si ha
+∞
X 𝑛−1
X
|𝑏 𝑘 | = lim (𝐵 𝑘 − 𝐵 𝑘+1 ) = lim (𝐵0 − 𝐵𝑛 ) = 𝐵0 < +∞.
𝑛→+∞ 𝑛→+∞
𝑘=0 𝑘=0
Dunque il seguente teorema è una estensione del criterio di Leibniz per le serie
a segni alterni.
3.7 somma per parti 131
Teorema 3.32 (criterio di Dirichlet). Siano 𝑎 𝑛 e 𝐵𝑛 successioni (reali o complesse) e

𝑛−1
X
poniamo 𝐴𝑛 = 𝑎 𝑘 , 𝑏 𝑛 = 𝐵𝑛+1 − 𝐵𝑛 . Se 𝐴𝑛 è limitata, 𝐵𝑛 → 0 e |𝑏 𝑛 | < +∞
P
P 𝑘=0
allora la serie 𝑎 𝑘 𝐵 𝑘 è convergente.
Dimostrazione. Per la formula di somma per parti (3.4) si ha
𝑛−1
X 𝑛−1
X
𝑎 𝑘 𝐵 𝑘 = 𝐴 𝑛 𝐵 𝑛 − 𝐴0 𝐵0 − 𝐴 𝑘+1 𝑏 𝑘 . (3.5)
𝑘=0 𝑘=0
Il primo addendo 𝐴𝑛 𝐵𝑛 tende a zero per 𝑛 → +∞ in quanto prodotto di una

successione limitata per una infinitesima. Il secondo addendo è costante. La
serie 𝐴 𝑘+1 𝑏 𝑘 è assolutamente convergente in quanto essendo |𝐴𝑛 | ≤ 𝐿 limitata
P
e 𝑏 𝑛 assolutamente convergente si ha
P
X X
|𝐴 𝑘+1 | · |𝑏 𝑘 | ≤ 𝐿 · |𝑏 𝑘 | < +∞.
Dunque il limite della somma sul lato destro converge e quindi la somma sul
lato sinistro dell’equazione (3.5) è convergente per 𝑛 → +∞.
Esercizio 3.33. Fissato 𝑧 ∈ ℂ, |𝑧| ≤ 1, 𝑧 ≠ 1 la serie

+∞ 𝑘
X 𝑧
𝑘=1
𝑘
è convergente.
Dimostrazione. Si noti che per |𝑧| < 1 si può facilmente applicare il criterio del
rapporto o della radice. Ma per |𝑧| = 1 quei criteri non si applicano e bisogna
invece utilizzare il teorema 3.32.
Posto 𝑎 𝑘 = 𝑧 𝑘 si osserva che 𝑎 𝑘 è una serie geometrica e (essendo 𝑧 ≠ 1) si ha

P
𝑛−1
1 − 𝑧𝑛
𝑧𝑘 =
X
𝐴𝑛 =
𝑘=0
1−𝑧
che è limitata, infatti:
|1 − 𝑧 𝑛 | 1 + |𝑧 𝑛 | 2
|𝐴𝑛 | = ≤ = .
| 1 − 𝑧| | 1 − 𝑧| | 1 − 𝑧|
Mentre posto 𝐵𝑛 = 1/𝑛 è chiaro che, essendo 𝐵𝑛 reale, decrescente si ha
+∞
X 𝑛−1
X
|𝐵 𝑘+1 − 𝐵 𝑘 | = lim (𝐵 𝑘 − 𝐵 𝑘+1 ) = lim (𝐵1 − 𝐵𝑛 )
𝑛→+∞ 𝑛→+∞
𝑘=1 𝑘=1

1
= lim 1− = 1 < +∞.
𝑛→+∞ 𝑛
Si applica quindi il teorema 3.32 per ottenere la convergenza della serie data.
132 3 serie
Si osservi che se |𝑧| > 1 la serie in questione non converge perché il termine
generico 𝑧 𝑘 /𝑘 non è infinitesimo. Per 𝑧 = 1 si ottiene la serie armonica, che
pure non converge.
3.8 prodotti infiniti
Così come abbiamo fatto la teoria per le somme infinite si potrebbe fare la teoria
dei prodotti infiniti ponendo
+∞
Y 𝑛
Y
𝑎 𝑘 = lim 𝑎 𝑘 = lim 𝑎0 · 𝑎1 · · · 𝑎 𝑛 .
𝑛→+∞ 𝑛→+∞
𝑘=0 𝑘=0
Supporremo sempre 𝑎 𝑘 > 0 altrimenti il segno del prodotto difficilmente sarebbe

definito. Allora, utilizzando il logaritmo (che trasforma prodotti in somme)
possiamo ricondurre i prodotti infiniti alle serie:
+∞ P𝑛
ln 𝑎 𝑘
Y
𝑎 𝑘 = lim 𝑒 𝑘=0 .
𝑛→+∞
𝑘=0
Osserviamo che se la serie dei logaritmi diverge a −∞ il prodotto infinito ha

limite 0. Avendo richiesto che i termini 𝑎 𝑘 siano tutti positivi il prodotto non
potrà mai essere minore di zero. Per mantenere l’analogia con le serie diremo
che il prodotto infinito converge se il limite dei prodotti parziali è finito e
positivo. Diremo che diverge se il limite è +∞ oppure 0.
Dunque potremo dire che il prodotto infinito converge se e solo se la serie dei
logaritmi converge.
Osserviamo quindi che condizione necessaria affinché un prodotto infinito 𝑎 𝑘

Q
sia convergente dovrà essere ln 𝑎 𝑘 → 0 ovvero 𝑎 𝑘 → 1. In tal caso visto che
ln 𝑎 𝑘 = ln(1 + (𝑎 𝑘 − 1)) ∼ 𝑎 𝑘 − 1
si osserva che se 𝑎 𝑘 → 1 il prodotto infinito 𝑎 𝑘 converge se e solo se converge

Q
la serie (𝑎 𝑘 − 1).
P
Esempio 3.34 (somma dei reciproci dei primi). Possiamo utilizzare i prodotti
infiniti per dimostrare che la somma dei reciproci dei numeri primi è divergente. Sia 𝑝 𝑘
la successione dei numeri primi ( 𝑝 1 = 2, 𝑝 2 = 3, 𝑝 3 = 5, . . . stiamo dando per scontato
che i numeri primi sono infiniti). Allora vogliamo dimostrare che
+∞ +∞
X 1 X 1
= = +∞. (3.6)
𝑘=1
𝑝𝑘 𝑛=1 𝑛
Questo risultato ha una certa rilevanza nell’ambito della teoria dei numeri in quanto ci
dice che 𝑝 𝑘 non può andare all’infinito come una potenza 𝑘 𝛼 con 𝛼 > 1 in quanto la
serie 1/𝑘 𝛼 è convergente.
P
3.9 le serie di potenze 133
Mostriamo quindi che vale (3.6). Si noti che per ogni 𝑛 ∈ ℕ il termine 𝑛1 può essere
decomposto come il prodotto di potenze dei reciproci dei numeri primi. Dunque:
+∞
X 1 1 1 1 1
= (1 + + 2 + . . . ) · (1 + + 2 + . . . )
𝑛=1 𝑛 2 2 3 3
1 1
· (1 + + + ...)··· (3.7)
5 52
+∞ X
+∞ 𝑗 +∞
Y 1 Y 1
= = .
𝑘=1 𝑗=0
𝑝𝑘 𝑘=1 1− 1
𝑝𝑘
Nei passaggi precedenti abbiamo sfruttato il fatto che nelle serie a termini positivi
possiamo riordinare e associare i termini in qualunque modo. Una serie a termini positivi
è convergente oppure divergente e la convergenza assoluta coincide con la convergenza
semplice. Visto che riordinando i termini di una serie assolutamente convergente non
si può ottenere una serie divergente, significa che riordinando i termini di una serie
divergente (a termini positivi) si ottiene sempre una serie divergente.
Ora possiamo utilizzare il fatto che il prodotto infinito ottenuto in (3.7) ha lo stesso
carattere della seguente serie
1
!
+∞ +∞
X 1 X 𝑝𝑘
1
−1 = 1
𝑘=1 1− 𝑝𝑘 𝑘=1 1− 𝑝𝑘
ma visto che 1/𝑝 𝑘 → 0 si ha

1
𝑝𝑘 1
∼
1− 1
𝑝𝑘
𝑝𝑘
e dunque, per il criterio del confronto asintotico, la serie precedente ha lo stesso carattere
della serie
+∞
X 1
𝑝
𝑘=1 𝑘
che quindi è divergente.
3.9 le serie di potenze
Se 𝑎 𝑘 è una successione di numeri complessi, la serie serie di potenze
𝑎𝑘 𝑧 𝑘
X
dipendente dal parametro 𝑧 ∈ ℂ si chiama serie di potenze di coefficienti 𝑎 𝑘 .

Se chiamiamo 𝐴 ⊆ ℂ l’insieme dei numeri complessi 𝑧 per i quali la serie di
potenze converge
𝑎 𝑘 𝑧 𝑘 è convergente
X
𝐴 = 𝑧 ∈ ℂ:

134 3 serie
la somma della serie risulta essere una funzione 𝑓 : 𝐴 → ℂ definita da

+∞
𝑎𝑘 𝑧 𝑘 .
X
𝑓 (𝑧) =
𝑘=0
insieme di convergenza
L’insieme 𝐴 si chiama insieme di convergenza (o dominio di convergenza) della serie
di potenze 𝑎 𝑘 𝑧 𝑘 .
P
Come al solito ci potrà capitare di considerare serie di potenze con l’indice 𝑘 che
parte da 1 invece che da 0 (o da qualunque altro numero naturale). Ciò non è
rilevante, potremo sempre considerare 𝑎 𝑘 = 0 per i termini che non partecipano
alla sommatoria.
Osserviamo anche che per 𝑘 = 0 il termine corrispondente della serie è 𝑎 0 · 00 = 𝑎 0

in quanto abbiamo definito 00 = 1. Dunque potremo anche scrivere:
+∞
𝑎 𝑘 𝑧 𝑘 = 𝑎0 + 𝑎1 𝑧 + 𝑎2 𝑧 2 + · · · + 𝑎 𝑛 𝑧 𝑛 + . . . .
X
𝑘=0
Le serie di potenze assomigliano quindi a dei polinomi, ma con infiniti termini.
Esempio 3.35 (la serie geometrica). La serie di potenze di coefficienti 𝑎 𝑘 = 1 è la

serie geometrica 𝑧 𝑘 . L’insieme di convergenza è il cerchio 𝐴 = {𝑧 ∈ ℂ : |𝑧| < 1}.
P
Per 𝑧 ∈ 𝐴 si ha
+∞
1
𝑧𝑘 =
X
𝑓 (𝑧) = .
𝑘=0
1−𝑧
𝑘
𝑘 |𝑧| ≥ 𝑘 1 la serie non può convergere perché il termine 𝑧 non è infinitesimo:
Se
𝑧 = |𝑧| ≥ 1.
𝑧 𝑛
𝑛
𝑛 𝑛 (ottenuta ponendo 𝑎 𝑛 = 1/𝑛 ) ha come
P
Esempio 3.36. La serie di potenze
insieme di convergenza 𝐴 = ℂ in quanto
s
𝑛 |𝑧|
𝑛 𝑧
𝑛𝑛 = 𝑛 → 0 < 1
e quindi per il criterio della radice la serie in questione converge assolutamente qualunque
sia 𝑧 ∈ ℂ.
Teorema 3.37 (convergenza delle serie di potenze). Se la serie di potenze 𝑎 𝑘 𝑧 𝑘

P
converge in un punto 𝑧 ∈ ℂ (anzi, basta che la successione 𝑎 𝑘 𝑧 𝑘 sia limitata) allora la
serie converge assolutamente per ogni 𝑤 ∈ ℂ tale che |𝑤| < |𝑧| . Viceversa, se la serie
non converge in un punto 𝑧 ∈ ℂ allora non converge in nessun 𝑤 tale che |𝑤| > |𝑤|
(anzi la successione 𝑎 𝑛 𝑤 𝑛 non è nemmeno limitata e tantomento infinitesima).
Dimostrazione. Se la serie 𝑎 𝑘 𝑧 𝑘 converge significa che la successione 𝑎 𝑘 𝑧 𝑘 è

P
infinitesima e in particolare è limitata. Esiste dunque 𝑀 tale che per ogni 𝑘 ∈ ℕ
𝑘
𝑎 𝑘 𝑧 ≤ 𝑀.
Se 𝑧 = 0 non c’è niente da dimostrare. Se 𝑧 ≠ 0 si ha

𝑀
|𝑎 𝑘 | ≤ .
|𝑧| 𝑘
Scelto ora qualunque 𝑤 ∈ ℂ con |𝑤| < |𝑧| si ha
𝑘
𝑎 𝑘 𝑤 𝑘 = |𝑎 𝑘 | · |𝑤| 𝑘 ≤ 𝑀 |𝑤| ≤ 𝑀 𝑞 𝑘

𝑘
|𝑧|
|𝑤| P 𝑘
avendo posto 𝑞 = |𝑧|
. 𝑞 converge e, per
Essendo 𝑞 < 1 la serie geometrica
𝑎 𝑘 𝑤 converge. Dunque la serie 𝑎 𝑘 𝑤 𝑘 converge
𝑘

P P
confronto, anche la serie
assolutamente.
Viceversa supponiamo che 𝑎 𝑘 𝑧 𝑘 non converga e prendiamo 𝑤 con |𝑤| > |𝑧| .
P
Allora 𝑎 𝑘 𝑤 𝑘 non può convergere, ansi 𝑎 𝑘 𝑤 𝑘 non può neanche essere limitata
P
perché se lo fosse allora, scambiando i ruoli di 𝑧 e 𝑤 , per il punto precedente la
serie 𝑎 𝑘 𝑧 𝑘 dovrebbe convergere.
P
Corollario 3.38 (l’insieme di convergenza è circolare). Sia 𝑎 𝑘 𝑧 𝑘 una serie di

P
potenze e sia 𝐴 il suo insieme di convergenza. Allora 𝐴 non è vuoto e posto
𝑅 = sup {|𝑧| : 𝑧 ∈ 𝐴}.
risulta che 𝑅 ∈ [0 , +∞] e 𝐴 coincide con il cerchio centrato in 0 e di raggio 𝑅 a meno

dei punti di bordo, nel senso che:
{𝑧 ∈ ℂ : |𝑧| < 𝑅} ⊆ 𝐴 ⊆ {𝑧 ∈ ℂ : |𝑧| ≤ 𝑅}. (3.8)
Inoltre la serie converge assolutamente in ogni 𝑧 ∈ ℂ con |𝑧| < 𝑅 mentre il termine
generico 𝑎 𝑘 𝑧 𝑘 non è nemmeno limitato (e quindi la serie non converge) quando |𝑧| > 𝑅 .
Dimostrazione. Se |𝑧| < 𝑅 significa che esiste 𝑧 0 ∈ 𝐴 tale che |𝑧 0 | > |𝑧| . Ma visto
che la serie converge in 𝑧 0 (per definizione di 𝐴) grazie al teorema precedente
possiamo affermare che la serie converge, anzi, converge assolutamente in 𝑧 .
Dunque si ottiene la prima inclusione in (3.8).
Se invece prendiamo 𝑧 ∈ ℂ con |𝑧| > 𝑅 allora certamente la serie non converge
in 𝑧 altrimenti (per come è definito 𝑅 ) avremmo 𝑅 ≥ |𝑧| . Inoltre possiamo
certamente considerare un punto 𝑧 1 ∈ ℂ tale che 𝑅 < |𝑧 1 | ≤ |𝑧| e la serie di
potenze non può convergere neanche in 𝑧 1 . Ma allora, per il teorema precedente,
deduciamo che 𝑎 𝑘 𝑧 𝑘 non è nemmeno limitata.
Abbiamo quindi mostrato l’esistenza di 𝑅 ∈ ℝ̄ che soddisfa (3.8). Chiaramente

risulta 𝑅 ≥ 0 perché 𝐴 è un insieme non vuoto (per ogni serie di potenze si ha
0 ∈ 𝐴).
raggio di convergenza
Definizione 3.39 (raggio di convergenza). Il raggio di convergenza di una serie
di potenze 𝑎 𝑘 𝑧 𝑘 è il valore 𝑅 ∈ [0 , +∞] dato dal corollario 3.38:
P
𝑎 𝑘 𝑧 𝑘 è convergente .
X
𝑅 = sup |𝑧| : 𝑧 ∈ ℂ,

136 3 serie
𝑎 𝑛 𝑧 𝑛 una serie di potenze.

P
Teorema 3.40 (calcolo del raggio di convergenza). Sia
Se esiste il limite p
lim 𝑛 |𝑎 𝑛 | = ℓ (3.9)
𝑛→+∞
allora 𝑅 = 1/ℓ è il raggio di convergenza della serie (dove si intende 𝑅 = +∞ se ℓ = 0

e 𝑅 = 0 se ℓ = +∞).
Lo stesso accade se esiste il limite

|𝑎 𝑛+1 |
lim = ℓ.
𝑛→+∞ |𝑎 𝑛 |
Più in generale risulta 𝑅 = 1/ℓ se poniamo

√
ℓ = lim sup 𝑛
𝑎𝑛 .
𝑛→+∞
anche nel caso in cui il limite in (3.9) non dovesse esistere.
Dimostrazione. Prendiamo 𝑟 ≥ 0. Applicando il criterio della radice alla serie

|𝑎 𝑛 |𝑟 𝑛 si ha
P
p
𝑛
p
𝑛
|𝑎 𝑛 |𝑟 𝑛 = 𝑟 |𝑎 𝑛 | → 𝑟ℓ .
Dunque se scegliamo un 𝑟 < 1/ℓ si ha 𝑟ℓ < 1 e la serie 𝑎 𝑛 𝑧 𝑛 converge
P
assolutamente per 𝑧 = 𝑟 . Dunque per ogni 𝑟 < 1/ℓ troviamo che 𝑟 ∈ 𝐴: ne
consegue che 𝑅 ≥ 1/ℓ . Se invece scegliamo 𝑟 > 1/ℓ si ha 𝑟ℓ > 1 e dunque
|𝑎 𝑛 |𝑟 𝑛 → +∞ e la serie non può essere convergente in 𝑧 = 𝑟 . Significa che
𝑅 ≤ 1/ℓ .
Il criterio della radice si applica anche nel caso in cui ℓ è definito tramite lim sup.
Nel caso esista il limite del rapporto |𝑎 𝑛+1 |/|𝑎 𝑛 | sappiamo (grazie al criterio di
convergenza alla Cesàro teorema 2.77) che il limite della radice coincide con il
limite del rapporto e quindi ci si riconduce al caso precedente (oppure si può
ripetere la dimostrazione utilizzando il criterio del rapporto invece del criterio
della radice).
Esempio 3.41. Nell’esempio 3.36 abbiamo visto che l’insieme di convergenza della
serie di potenze
+∞ 𝑘
X 𝑧
𝑘=1
𝑘
è
𝐴 = {𝑧 ∈ ℂ : |𝑧| ≤ 1 , 𝑧 ≠ 1}.
Il raggio di convergenza dovrà quindi essere 𝑅 = 1 e questo può essere facilmente
verificato con uno dei criteri precedenti. Ad esempio:
1
𝑛+1 𝑛
lim = lim =1
𝑛→+∞ 1
𝑛
𝑛→+∞ 𝑛+1
da cui 𝑅 = 1/1 = 1. Si osservi dunque che nessuna delle due inclusioni in (3.8) è, in
questo caso, una uguaglianza.
𝑎𝑘 𝑧 𝑘 e
P
Teorema 3.42 (stabilità del raggio di convergenza). Le serie di potenze
𝑘𝑎 𝑘 𝑧 𝑘 hanno lo stesso raggio di convergenza.
P
Dimostrazione. Sia 𝑅 il raggio di convergenza della serie 𝑎 𝑘 𝑧 𝑘 e 𝑟 il raggio di

P
convergenza della serie 𝑘𝑎 𝑘 𝑧 𝑘 .
P
Visto che per 𝑘 > 0 si ha 𝑎 𝑘 𝑧 𝑘 ≤ 𝑘𝑎 𝑘 𝑧 𝑘 la serie 𝑎 𝑘 𝑧 𝑘 converge assolutamente

P
nei punti in cui converge assolutamente la serie 𝑘𝑎 𝑘 𝑧 𝑘 . Questo significa che
P
𝑅 ≥ 𝑟.
Preso ora un punto 𝑤 con |𝑤| < 𝑅 consideriamo un qualunque punto 𝑧 con
|𝑤| < |𝑧| < 𝑅 . La serie 𝑎 𝑘 𝑧 𝑘 converge assolutamente 𝑘
𝑘 in 𝑧 quindi 𝑎 𝑘 𝑧
P
è infinitesima e limitata. Esiste quindi 𝑀 per cui 𝑎 𝑘 𝑧 ≤ 𝑀 che significa

|𝑎 𝑘 | ≤ 𝑀
/
|𝑧| 𝑘 . Ma allora
𝑘 𝑘
𝑘𝑎 𝑘 𝑤 𝑘 ≤ 𝑘|𝑎 𝑘 | |𝑤| 𝑘𝑀 |𝑤|

𝑘 ≤ |𝑧|
si ottiene 𝑘𝑎 𝑘 𝑤 𝑘 ≤ 𝑘𝑀 𝑞 𝑘 . Visto che 𝑞 < 1 sappiamo che

|𝑤|
da cui, posto 𝑞 =

|𝑧|
,
la serie 𝑘𝑀 𝑞 𝑘 è convergente e dunque, per confronto, anche la serie 𝑘𝑎 𝑘 𝑤 𝑘
P P
è assolutamente convergente. Siccome questo è vero per ogni 𝑤 con |𝑤| < 𝑅
significa che 𝑟 ≥ 𝑅 e questo conclude la dimostrazione.
√𝑘
Dimostrazione alternativa. Visto che 𝑘 → 1 si ha
p𝑘 √
lim sup 𝑘𝑎 𝑘 = lim sup 𝑘 𝑎 𝑘 .
Per il teorema 3.40 si ottiene che le due corrispondenti serie di potenze hanno
lo stesso raggio di convergenza.
continuità delle serie di potenze
Teorema 3.43. (continuità delle serie di potenze) Sia 𝑎 𝑘 𝑧 𝑘 una serie di potenze con
P
raggio di convergenza 𝑅 . Allora posto 𝐵 = {𝑧 ∈ ℂ : |𝑧| < 𝑅} la funzione 𝑓 : 𝐵 → ℂ
definita da
+∞
𝑎𝑘 𝑧 𝑘
X
𝑓 (𝑧) =
𝑘=0
è continua (su 𝐵).
Dimostrazione. Supponiamo 𝑅 > 0 altrimenti non c’è niente da dimostrare.

Fissiamo 𝑟 < 𝑅 e consideriamo due punti 𝑧, 𝑤 ∈ ℂ con |𝑧| < 𝑟 e |𝑤| < 𝑟 .
Ricordiamo che si ha
𝑧 𝑛 − 𝑤 𝑛 = (𝑧 − 𝑤) · (𝑧 𝑛−1 + 𝑤𝑧 𝑛−2 + · · · + 𝑤 𝑛−2 𝑧 + 𝑤 𝑛−1 ).
Osservando che per ogni addendo sul lato destro si ha 𝑤 𝑘 𝑧 𝑛−𝑘−1 ≤ 𝑟 𝑛−1 ,

essendoci 𝑛 addendi si ottiene
|𝑧 𝑛 − 𝑤 𝑛 | ≤ |𝑧 − 𝑤| · 𝑛 · 𝑟 𝑛−1 .
138 3 serie
Dunque

X+∞ +∞ X +∞
𝑎𝑛 𝑧 𝑛 − 𝑎𝑛 𝑤 𝑛 = 𝑎 𝑛 (𝑧 𝑛 − 𝑤 𝑛 )
X
| 𝑓 (𝑧) − 𝑓 (𝑤)| =

𝑛=0 𝑛=0 𝑛=0
+∞ +∞
|𝑎 𝑛 | · |𝑧 𝑛 − 𝑤 𝑛 | ≤ |𝑧 − 𝑤| |𝑎 𝑛 |𝑛𝑟 𝑛−1 .
X X
≤
𝑛=0 𝑛=0
Ma noi sappiamo che la serie 𝑛𝑎 𝑛 𝑧 𝑛 ha lo stesso raggio di convergenza 𝑅 della

P
serie originaria (per il teorema 3.42) dunque la serie 𝑛𝑎 𝑛 𝑟 𝑛 è assolutamente
P
convergente e, dividendo per 𝑟 , scopriamo che anche la serie 𝑛𝑎 𝑛 𝑟 𝑛−1 è
P
convergente. Posto 𝐿 = 𝑛=0 𝑛|𝑎 𝑛 |𝑟 𝑛−1 per quanto scritto sopra possiamo
P+∞
concludere che
| 𝑓 (𝑧) − 𝑓 (𝑤)| ≤ 𝐿 · |𝑧 − 𝑤|.
Dunque per ogni 𝜀 > 0 scelto 𝛿 = 𝐿𝜀 se |𝑧 − 𝑤| < 𝛿 risulta | 𝑓 (𝑧) − 𝑓 (𝑤)| ≤ 𝜀.
Significa che la funzione 𝑓 è continua nel punto 𝑧 e questo è vero per ogni 𝑧 con
|𝑧| < 𝑅 .
Il teorema precedente ci garantisce che la somma di una serie di potenze è

una funzione continua all’interno del raggio di convergenza. Nei punti che
si trovano esattamente sulla frontiera del raggio di convergenza la funzione 𝑓
potrebbe non essere continua. Ma se la serie converge in un punto di frontiera,
la somma della serie è continua se mi avvicino al punto di convergenza lungo il
raggio del disco di convergenza, come enunciato nel seguente teorema.
Teorema 3.44 (lemma di Abel). Sia

+∞
𝑎𝑘 𝑧 𝑘
X
𝑓 (𝑧) =
𝑘=0
la somma di una serie di potenze. Se la serie converge in un punto 𝑧 0 ∈ ℂ, 𝑧 0 ≠ 0,

allora la serie converge per ogni 𝑧 = 𝑡𝑧 0 con 𝑡 ∈ [0 , 1] inoltre la funzione
𝑡 ↦→ 𝑓 (𝑡𝑧)
è continua nel punto 𝑡 = 1.
Dimostrazione. Senza perdita di generalità possiamo supporre che sia 𝑓 (𝑧 0 ) = 0

infatti basterà sostituire il primo termine della serie, 𝑎 0 , con 𝑎 00 = 𝑎 0 − 𝑓 (𝑧 0 ) e
dimostrare il teorema per la serie modificata. Dunque posto
𝑛−1
𝑎 𝑘 𝑧0𝑘
X
𝐴𝑛 =
𝑘=0
si ha che 𝐴𝑛 → 𝑓 (𝑧 0 ) = 0 e, per definizione, 𝐴0 = 0. Utilizzando la formula

(3.4) di somma per parti, preso 𝑡 ∈ [0 , 1) si avrà
𝑛 𝑛 𝑛
𝑎 𝑘 · (𝑡𝑧 0 ) 𝑘 = 𝑎 𝑘 𝑧 0𝑘 · 𝑡 𝑘 = 𝐴𝑛+1 · 𝑡 𝑛+1 + 𝐴 𝑘+1 · (𝑡 𝑘 − 𝑡 𝑘+1 )
X X X
𝑘=0 𝑘=0 𝑘=0
3.10 la serie esponenziale 139
e per 𝑛 → +∞ si ottiene
+∞ +∞
𝐴 𝑘+1 (𝑡 𝑘 − 𝑡 𝑘+1 ) = (1 − 𝑡) 𝐴 𝑘+1 𝑡 𝑘 .
X X
𝑓 (𝑡 · 𝑧 0 ) = 𝑓 (𝑧0 ) · 0 +
𝑘=0 𝑘=0
Visto che 𝐴𝑛 → 0 per ogni 𝜀 > 0 esiste 𝑚 tale che per ogni 𝑘 > 𝑚 si ha |𝐴 𝑘 | ≤ 𝜀.
Dunque, per ogni 𝑡 ∈ [0 , 1), si ha
𝑚−
X1 +∞
|𝐴 𝑘+1 |𝑡 𝑘 + (1 − 𝑡) |𝐴 𝑘+1 |𝑡 𝑘
X
| 𝑓 (𝑡 · 𝑧 0 )| ≤ (1 − 𝑡)
𝑘=0 𝑘=𝑚
𝑚−
X1 𝑡𝑚
≤ (1 − 𝑡) · |𝐴 𝑘+1 | + (1 − 𝑡) · 𝜀 ·
𝑘=0
1−𝑡
𝑚−
X1
≤ (1 − 𝑡) |𝐴 𝑘+1 | + 𝜀.
𝑘=0
Scelto 𝛿 ≤ P𝑚−1 𝜀 se | 1 − 𝑡 | < 𝛿 si avrà dunque

𝑘=0
|𝐴 𝑘+1 |
| 𝑓 (𝑡 · 𝑧0 ) − 𝑓 (𝑧 0 )| = | 𝑓 (𝑡 · 𝑧0 )| < 2𝜀
che significa che 𝑡 ↦→ 𝑓 (𝑡 · 𝑧 0 ) è continua nel punto 𝑡 = 1.
3.10 la serie esponenziale

exp 𝑧
Definiamo la funzione exp : ℂ → ℂ tramite la serie di potenze
+∞ 𝑘
X 𝑧
exp(𝑧) = . (3.10)
𝑘=0
𝑘!
La funzione è definita su tutto ℂ in quanto (grazie al criterio del rapporto) è

facile verificare che il raggio di convergenza di questa serie è 𝑅 = +∞ e dunque
l’insieme di convergenza è tutto ℂ.
I teoremi seguenti ci permetteranno di affermare che la funzione exp(𝑧), definita

per ogni 𝑧 ∈ ℂ è una estensione della funzione 𝑒 𝑥 già definita per 𝑥 ∈ ℝ.
Teorema 3.45 (proprietà dell’esponenziale complesso). Si ha:
1. exp(0) = 1;
2. exp(¯𝑧 ) = exp(𝑧);
3. per ogni 𝑧, 𝑤 ∈ ℂ
exp(𝑧 + 𝑤) = exp(𝑧) · exp(𝑤);
4. per ogni 𝑧 ∈ ℂ si ha exp(𝑧) ≠ 0 e
1
exp(−𝑧) = ;
exp(𝑧)
5. la funzione exp : ℂ → ℂ è continua.

140 3 serie
6. Se 𝑧 𝑛 → 0 allora
exp(𝑧 𝑛 ) − 1
lim = 1. (3.11)
𝑛→+∞ 𝑧𝑛
Dimostrazione. 1. La proprietà exp(0) = 1 si ottiene per verifica diretta

(ricordiamo che 00 = 1 e 0! = 1).
2. La proprietà exp(¯𝑧 ) = exp 𝑧 si ottiene passando al limite la seguente
uguaglianza tra le somme parziali che sfrutta le proprietà del coniugio di
somma e prodotto:
𝑛 𝑛
X 𝑧¯ 𝑘 X 𝑧𝑘
= .
𝑘=0
𝑘! 𝑘=0
𝑘!
3. Consideriamo la matrice infinita
𝑧𝑘 𝑤𝑗
𝑚 𝑘,𝑗 = · .
𝑘! 𝑗!
Allora da un lato
+∞
X (𝑧 + 𝑤)𝑛
exp(𝑧 + 𝑤) =
𝑛=0 𝑛!
+∞ 𝑛
1 X 𝑛!
𝑧 𝑘 · 𝑤 𝑛−𝑘
X
=
𝑛=0 𝑛 ! 𝑘=0 𝑘 !(𝑛 − 𝑘)!
𝑛
+∞ X
X
= 𝑚 𝑘,𝑛−𝑘
𝑛=0 𝑘=0
e dall’altro
+∞ 𝑘 X
X 𝑧 +∞ 𝑤 𝑗 +∞ 𝑘
+∞ X
X 𝑧 𝑤𝑗
exp(𝑧) · exp(𝑤) = =
𝑘=0
𝑘! 𝑗=0
𝑗! 𝑘=0 𝑗=0
𝑘! 𝑗!
+∞ X
X +∞
= 𝑚 𝑘,𝑗 .
𝑘=0 𝑗=0
Il risultato segue dunque dal teorema 3.30.

4. Visto che
1 = exp(0) = exp(𝑧 − 𝑧) = exp(𝑧) · exp(−𝑧)
ricaviamo che exp(𝑧) ≠ 0 e exp(−𝑧) = 1/exp(𝑧).
5. La continuità discende dal risultato generale sulla continuità della somma
di una serie di potenze: teorema 3.43.
6. Direttamente dalla definizione (3.10) si ottiene
+∞ 𝑘
X 𝑧 +∞
X 𝑧𝑘
exp(𝑧) − 1 = =𝑧· .
𝑘=1
𝑘! 𝑘=0
(𝑘 + 1)!
𝑧 P 𝑘
Osserviamo ora che la serie (𝑘+ 1)!
ha raggio di convergenza infinito e
quindi è assolutamente convergente per ogni 𝑧 ∈ ℂ. In particolare la
somma di tale serie è continua e quindi se 𝑧 𝑛 → 0 si ha
exp(𝑧 𝑛 ) − 1 +∞
X 𝑧 𝑛𝑘 +∞
X 0𝑘
lim = lim = = 1.
𝑛→+∞ 𝑧𝑛 𝑛→+∞
𝑘=0
(𝑘 + 1)! 𝑘=0 (𝑘 + 1)!
Teorema 3.46 (collegamento tra le due definizioni di esponenziale). Per ogni

𝑥 ∈ ℝ si ha
exp(𝑥) = 𝑒 𝑥 .
Dimostrazione. Vogliamo applicare il teorema 1.54. Posto 𝑓 (𝑥) = exp(𝑥),

𝑓 : ℝ → ℝ sappiamo, per il teorema precedente, che 𝑓 (𝑥 + 𝑦) = 𝑓 (𝑥) · 𝑓 (𝑦).
Dobbiamo verificare che 𝑓 è crescente. Innanzitutto notiamo che se 𝑥 > 0 la
serie che definisce exp(𝑥) è a termini positivi e il primo termine è 1. Dunque per
ogni 𝑥 > 0 si ha exp(𝑥) > 1. In particolare posto 𝑎 = 𝑓 (1) si ha 𝑎 > 1. Inoltre se
𝑦 > 𝑥 si ha 𝑓 (𝑦 − 𝑥) > 1 e dunque
𝑓 (𝑦) = 𝑓 (𝑥 + 𝑦 − 𝑥) = 𝑓 (𝑥) · 𝑓 (𝑦 − 𝑥) > 𝑓 (𝑥).
La funzione è quindi strettamente crescente. Dunque è un omomorfismo

monotono dal gruppo additivo ℝ al gruppo moltiplicativo (0 , +∞). Fissato
𝑎 = 𝑓 (1) sappiamo, per quanto visto nella sezione 1.18, che c’è una unica
funzione con queste proprietà e dunque deve essere:
𝑓 (𝑥) = 𝑎 𝑥 .
Non ci rimane che dimostrare che 𝑎 = 𝑒 . Ma grazie al teorema 3.45 appena

dimostrato sappiamo che per 𝑥 → 0 si ha
𝑓 (𝑥) − 1
→ 1.
𝑥
D’altra parte sappiamo che 𝑓 (𝑥) = 𝑎 𝑥 e quindi per il limite notevole (corolla-
rio 2.52)
𝑓 (𝑥) − 1 𝑎 𝑥 − 1 𝑒 𝑥 ln 𝑎 − 1
= = · ln 𝑎 → ln 𝑎.
𝑥 𝑥 𝑥 ln 𝑎
Deduciamo quindi che ln 𝑎 = 1 ovvero che 𝑎 = 𝑒 .
Aver distinto le due definizioni di 𝑒 𝑥 (tramite funzione potenza) e di exp(𝑥)

(tramite somma della serie esponenziale) è puramente strumentale. C’è una
unica funzione esponenziale che può essere definita in un modo o nell’altro.
Non ci si fissi quindi con l’identificare le due diverse notazioni 𝑒 𝑥 ed exp(𝑥)
con le due diverse definizioni. Ogni testo avrà una sua definizione di funzione
esponenziale che può essere per certi versi arbitraria salvo poi ritrovare le
proprietà caratterizzanti di tale funzione.
Come già detto d’ora in poi scriveremo, per ogni 𝑧 ∈ ℂ
𝑒 𝑧 = exp 𝑧
142 3 serie
considerando quindi exp 𝑧 l’estensione a tutto il piano complesso della funzione

esponenziale già definita sulla retta reale.
In analogia con il corollario 2.50 si ha il seguente risultato che fornisce anche un

modo alternativo per dimostrare il teorema 3.46.
Teorema 3.47 (limite notevole esponenziale complesso). Per ogni 𝑧 ∈ ℂ risulta

+∞ 𝑘
𝑧 𝑛 X 𝑧
lim 1+ = .
𝑛→+∞ 𝑛 𝑘=0
𝑘!
Dimostrazione. Utilizzando lo sviluppo del binomio osserviamo che si ha

𝑛 𝑛
𝑧 𝑛 X 𝑛 𝑧𝑘 X 𝑧𝑘 𝑛!

1+ = = · 𝑘 .
𝑛 𝑘=0
𝑘 𝑛 𝑘
𝑘=0
𝑘 ! 𝑛 · (𝑛 − 𝑘)!
Posto per ogni 𝑘 ≤ 𝑛
𝑛! 𝑛 · (𝑛 − 1) · . . . · (𝑛 − 𝑘 + 1)
𝑐(𝑛, 𝑘) = =
𝑛𝑘· (𝑛 − 𝑘)! 𝑛𝑘
𝑛 𝑛−1 𝑛−2 𝑛−𝑘+1
= · · ·...·
𝑛 𝑛 𝑛 𝑛
osserviamo che 0 ≤ 𝑐(𝑛, 𝑘) ≤ 1 in quanto prodotto di numeri non negativi
minori o uguali ad 1. Inoltre, fissato 𝑘 , si ha 𝑐(𝑛, 𝑘) → 1 per 𝑛 → +∞ in quanto
𝑛−𝑗
ogni fattore 𝑛 tende a 1 per 𝑛 → +∞ (si noti che a 𝑘 fissato il numero di fattori
𝑘 è fissato).
Sia 𝑧 ∈ ℂ fissato e sia

+∞
X |𝑧| 𝑘
𝑆= .
𝑘=0
𝑘!
Sappiamo che la serie esponenziale è assolutamente convergente per ogni 𝑧 ∈ ℂ
(in quanto il raggio di convergenza è +∞) quindi 𝑆 è un numero reale (finito).
Dunque per il teorema 3.7 (della coda) sappiamo che per ogni 𝜀 > 0 esiste 𝑀
tale che
X+∞
|𝑧| 𝑘
< 𝜀.
𝑘=𝑀+1
𝑘!
Fissato 𝑘 ≤ 𝑀 visto che 𝑐(𝑛, 𝑘) → 1 esiste 𝑁 𝑘 > 𝑀 tale che per ogni 𝑛 > 𝑁 𝑘 si
abbia 1 − 𝑐(𝑛, 𝑘) < 𝜀 (ricordiamo che 𝑐(𝑛, 𝑘) ≤ 1). Prendiamo allora
𝑁 = max {𝑁 𝑘 : 𝑘 ≤ 𝑁 }
cosicchè per ogni 𝑛 > 𝑁 e per ogni 𝑘 ≤ 𝑀 si avrà 0 ≤ 1 − 𝑐(𝑛, 𝑘) < 𝜀. Allora,
per ogni 𝑛 > 𝑁 , possiamo spezzare la somma da 0 a 𝑛 nelle due somme da 0 a
𝑀 e da 𝑀 + 1 a 𝑛 :
𝑛
𝑛 𝑘 𝑛 𝑘 𝑘 𝑘
𝑧 𝑧 𝑛 X 𝑧 𝑧 𝑧
X X
− 1+ = − 𝑐(𝑛, 𝑘) = (1 − 𝑐(𝑛, 𝑘))

𝑘=0 𝑘 ! 𝑛 𝑘=0 𝑘 ! 𝑘 ! 𝑘=0 𝑘!

𝑛
X |𝑧| 𝑘
≤ (1 − 𝑐(𝑛, 𝑘))
𝑘=0
𝑘!
𝑀
X |𝑧| 𝑘 X𝑛
|𝑧| 𝑘
= (1 − 𝑐(𝑛, 𝑘)) + (1 − 𝑐(𝑛, 𝑘))
𝑘=0
𝑘! 𝑘=𝑀+1
𝑘!
𝑀
X |𝑧| 𝑘 𝑛
X |𝑧| 𝑘
≤ 𝜀 +
𝑘=0
𝑘! 𝑘=𝑀+1
𝑘!
+∞ 𝑘
X |𝑧|
≤𝜀 +𝜀
𝑘=0
𝑘!
≤ 𝜀𝑆 + 𝜀 = 𝜀(𝑆 + 1).
Visto che 𝜀 > 0 era arbitrario abbiamo verificato tramite la definizione che
𝑛
X 𝑧𝑘 𝑧 𝑛
− 1+ →0
𝑘=0
𝑘! 𝑛
cioè
+∞ 𝑘
𝑧 𝑛 X 𝑧
lim 1+ = .
𝑛→+∞ 𝑛 𝑘=0
𝑘!
Se 𝑥 ∈ ℝ abbiamo già visto che

𝑥 𝑛
lim 1+ = 𝑒𝑥
𝑛→+∞ 𝑛
e quindi il teorema precedente ci assicura che
exp(𝑥) = 𝑒 𝑥 .
Teorema 3.48 (approssimazione dell’esponenziale). Se |𝑧| ≤ 1 si ha

𝑛
𝑧 𝑘 |𝑧| 𝑛+1
X
exp(𝑧) − ≤ . (3.12)

𝑘=0
𝑘! 𝑛 · 𝑛!
In particolare ponendo 𝑧 = 1 si trova

𝑛
X 1 1
0<𝑒− ≤ . (3.13)
𝑘=0
𝑘! 𝑛 · 𝑛!
e per 𝑛 = 5 si ottiene
2.716 < 𝑒 < 2.719 (3.14)
144 3 serie
Tabella 3.1: Le prime 1000 cifre decimali 2.7182818284 5904523536 0287471352 6624977572 4709369995
del numero 𝑒 calcolate con il metodo
9574966967 6277240766 3035354759 4571382178 5251664274
utilizzato nella dimostrazione del teore-
ma 3.48. Si veda il codice a pagina 426. 2746639193 2003059921 8174135966 2904357290 0334295260
5956307381 3232862794 3490763233 8298807531 9525101901
1573834187 9307021540 8914993488 4167509244 7614606680
8226480016 8477411853 7423454424 3710753907 7744992069
5517027618 3860626133 1384583000 7520449338 2656029760
6737113200 7093287091 2744374704 7230696977 2093101416
9283681902 5515108657 4637721112 5238978442 5056953696
7707854499 6996794686 4454905987 9316368892 3009879312
7736178215 4249992295 7635148220 8269895193 6680331825
2886939849 6465105820 9392398294 8879332036 2509443117
3012381970 6841614039 7019837679 3206832823 7646480429
5311802328 7825098194 5581530175 6717361332 0698112509
9618188159 3041690351 5988885193 4580727386 6738589422
8792284998 9208680582 5749279610 4841984443 6346324496
8487560233 6248270419 7862320900 2160990235 3043699418
4914631409 3431738143 6405462531 5209618369 0888707016
7683964243 7814059271 4563549061 3031072085 1038375051
0115747704 1718986106 8739696552 1267154688 9570350354
Dimostrazione. La coda della serie esponenziale può essere stimata tramite la

somma di una serie geometrica:

𝑛
1 +∞
|𝑧| 𝑘 X+∞
|𝑧| 𝑛+𝑘+1
X X
exp 𝑧 − ≤ =

𝑘=0
𝑘 ! 𝑘=𝑛+1 𝑘 ! 𝑘=0
(𝑛 + 𝑘 + 1)!
𝑘
+∞
|𝑧| 𝑛+1+𝑘 |𝑧| 𝑛+1 X
+∞

X |𝑧|
≤ =
𝑘=0 (𝑛 + 1) 𝑘+1 · 𝑛 ! 𝑛 ! 𝑘=0 (𝑛 + 1)
|𝑧| 𝑛+1 1 |𝑧| 𝑛+1
= · = .
(𝑛 + 1) · 𝑛 ! 1 − |𝑧| (𝑛 + 1 − |𝑧|) · 𝑛 !
(𝑛+1)
Se |𝑧| ≤ 1 si ottiene quindi la stima (3.12). Se 𝑧 = 1 la serie esponenziale è a

termini positivi e dunque approssima 𝑒 per difetto: si ottiene dunque (3.13).
Per 𝑛 = 5 si ha
5
X 1 1 1 1 1 326
=1+1+ + + + =
𝑘=0
𝑘! 2 6 24 120 120
Dunque da un lato
326
𝑒≥ ≥ 2.716
120
e dall’altro
326 1
𝑒≤ + ≤ 2.717 + 0.002 = 2.719
120 5 · 5!
𝑒∉ℚ
Teorema 3.49 (irrazionalità di 𝑒 ). Il numero 𝑒 è irrazionale.

3.11 le funzioni trigonometriche 145
Dimostrazione. Supponiamo per assurdo che sia 𝑒 = 𝑝/𝑞 con 𝑝 ∈ ℤ e 𝑞 ∈ ℕ .

Possiamo supporre 𝑞 > 1 (non importa che la frazione sia ridotta ai minimi
termini).
Per ogni 𝑛 ∈ ℕ si ha
+∞ 𝑛 +∞
X 𝑛! X 𝑛! X 1
𝑛 !𝑒 = = + 𝑛! .
𝑘=0
𝑘! 𝑘=0
𝑘! 𝑘=𝑛+1
𝑘!
Il primo addendo nella somma precedente è intero in quanto se 𝑘 ≤ 𝑛 il rapporto

𝑛 !/𝑘 ! è intero. Grazie al teorema 3.48 per il secondo addendo se 𝑛 > 1 si ha:
+∞
X 1 1
0 < 𝑛! ≤ < 1.
𝑘=𝑛+1
𝑘! 𝑛
Risulta dunque che per ogni 𝑛 ≥ 2 il numero 𝑛 ! 𝑒 è strettamente compreso tra

due interi consecutivi e quindi non è mai intero. Dunque 𝑒 non può essere
𝑝
razionale perché se fosse 𝑒 = 𝑞 si avrebbe 𝑛 ! 𝑒 ∈ ℤ per ogni 𝑛 > 𝑞 .
3.11 le funzioni trigonometriche
Se 𝑡 ∈ ℝ il numero complesso 𝑒 𝑖𝑡 è unitario (ha modulo uno) in quanto, per le

proprietà dell’esponenziale complesso, si ha
𝑖𝑡 2
𝑒 = 𝑒 𝑖𝑡 · 𝑒 𝑖𝑡 = 𝑒 𝑖𝑡 · 𝑒 −𝑖𝑡 = 𝑒 𝑖𝑡−𝑖𝑡 = 𝑒 0 = 1.
Ci ricordiamo che il prodotto di due numeri unitari 𝑒 𝑖𝑡 , 𝑒 𝑖𝑠 è un numero

unitario che geometricamente identifica un angolo che è la somma degli angoli
identificati dai due fattori. Visto che si ha 𝑒 𝑖𝑡 · 𝑒 𝑖𝑠 = 𝑒 𝑖(𝑡+𝑠) significa che l’angolo
identificato dal numero complesso 𝑒 𝑖(𝑡+𝑠) è la somma degli angoli geometrici
identificati da 𝑒 𝑖𝑡 e da 𝑒 𝑖𝑠 . Essendo inoltre 𝑒 𝑖𝑡 una funzione continua dobbiamo
dedurre che dal punto di vista geometrico il parametro 𝑡 misura l’ampiezza
dell’angolo identificato da 𝑒 𝑖𝑡 sulla circonferenza unitaria. Più precisamente
possiamo osservare che se Δ𝑡 → 0 grazie al limite notevole dell’esponenziale
complesso otteniamo
𝑒 𝑖(𝑡+Δ𝑡) − 𝑒 𝑖𝑡 𝑒 𝑖Δ𝑡 − 1
lim = 𝑖𝑒 𝑖𝑡 lim = 𝑖𝑒 𝑖𝑡 .
Δ𝑡→0 Δ𝑡 𝑡→0 𝑖Δ𝑡
Significa che se interpretiamo 𝑡 ↦→ 𝑒 𝑖𝑡 come la legge oraria di un punto che

si muove sulla circonferenza unitaria, la velocità del punto, al tempo 𝑡 , è
rappresentata dal vettore (numero complesso) 𝑣 = 𝑖𝑒 𝑖𝑡 che non è altro che
il ruotato di 𝑒 𝑖𝑡 di un angolo retto in senso antiorario. Dunque il punto 𝑒 𝑖𝑡
si muove di moto circolare uniforme in senso antiorario sulla circonferenza
unitaria con velocità di modulo unitario. Scopriamo quindi che il punto 𝑒 𝑖𝑡 ha
percorso dal tempo 𝑡 = 0 un arco di lunghezza pari a 𝑡 .
La definizione seguente dunque può essere interpretata geometricamente

dicendo che le funzioni cos 𝑡 e sin 𝑡 sono le coordinate 𝑥 e 𝑦 del punto sulla
circonferenza unitaria 𝑥 2 + 𝑦 2 = 1 che identifica un arco di lunghezza 𝑡 misurato
146 3 serie
in senso antiorario a partire dal punto di coordinate (1 , 0). La lunghezza di un

radiante
arco unitario sulla circonferenza unitaria si chiama radiante e diremo quindi
che 𝑡 è la misura in radianti dell’angolo identificato dal punto 𝑒 𝑖𝑡 di coordinate
(cos 𝑡, sin 𝑡) sul piano complesso.
Definizione 3.50 (funzioni trigonometriche). Per ogni 𝑥 ∈ ℝ si potrà definire

cos 𝑥 = Re 𝑒 𝑖𝑥 , sin 𝑥 = Im 𝑒 𝑖𝑥
formula di Eulero cosicché valga la formula di Eulero
𝑒 𝑖𝑥 = cos 𝑥 + 𝑖 sin 𝑥.
Teorema 3.51 (proprietà delle funzioni seno e coseno). Le funzioni sin e cos
soddisfano le seguenti proprietà.
𝑒 𝑖𝑥 + 𝑒 −𝑖𝑥 𝑒 𝑖𝑥 − 𝑒 −𝑖𝑥
1. cos(𝑥) = , sin(𝑥) = ;
2 2𝑖
2. sin(−𝑥) = − sin 𝑥 (la funzione sin è dispari), cos(−𝑥) = cos 𝑥 (la funzione cos
è pari);
3. identità fondamentale della trigonometria:
cos2 𝑥 + sin2 𝑥 = 1;
4. formule di addizione:
cos(𝛼 + 𝛽) = cos 𝛼 cos 𝛽 − sin 𝛼 sin 𝛽,

sin(𝛼 + 𝛽) = sin 𝛼 cos 𝛽 + cos 𝛼 sin 𝛽 ;
5. le funzioni cos : ℝ → ℝ e sin : ℝ → ℝ sono continue;

6. si ha
+∞
𝑥 2𝑘 𝑥2 𝑥4 𝑥6
(−1) 𝑘
X
cos 𝑥 = =1− + − +... (3.15)
𝑘=0
(2 𝑘)! 2 4! 6!
+∞
𝑥 2 𝑘+1 𝑥3 𝑥5 𝑥7
(−1) 𝑘
X
sin 𝑥 = =𝑥− + − +... (3.16)
𝑘=0
(2 𝑘 + 1)! 6 5! 7!
7. vale il seguente limite notevole
sin 𝑥 1 − cos 𝑥 1
lim =1 e lim = .
𝑥→0 𝑥 𝑥→0 𝑥2 2
Dimostrazione. 1. Essendo 𝑒 𝑖𝑥 = 𝑒 𝑖𝑥 = 𝑒 −𝑖𝑥 discende dalla formula (1.21) per

il calcolo di parte reale ed immaginaria.
2. Si verifica direttamente con le formule precedenti.
3. Per 𝑥 ∈ ℝ si ha da un lato
| exp(𝑖𝑥)| 2 = exp(𝑖𝑥) · exp(𝑖𝑥) = exp(𝑖𝑥) · exp(−𝑖𝑥) = exp(0) = 1

𝑦
𝑦 = tg 𝑥
1 𝑦 = sin 𝑥
𝑥 Figura 3.1: I grafici delle funzioni sin,

− 32 𝜋 −𝜋 − 𝜋2 𝜋 𝜋 cos e tg.
2𝜋
3
2
-1
𝑦 = cos 𝑥
(interagisci)
e dall’altro
| exp(𝑖𝑥)| 2 = | cos 𝑥 + 𝑖 sin 𝑥| 2 = cos2 𝑥 + sin2 𝑥.
4. Grazie alla formula che esprime l’esponenziale della somma:
cos(𝛼 + 𝛽) + 𝑖 sin(𝛼 + 𝛽) = exp(𝑖(𝛼 + 𝛽)) = exp(𝑖𝛼) · exp(𝑖𝛽)

= (cos 𝛼 + 𝑖 sin 𝛼) · (cos 𝛽 + 𝑖 sin 𝛽)
= cos 𝛼 cos 𝛽 − sin 𝛼 sin 𝛽
+ 𝑖(sin 𝛼 cos 𝛽 + cos 𝛼 sin 𝛽)
e uguagliando parte reale e parte immaginaria si ottengono le formule di

addizione.
5. Visto che la funzione exp : ℂ → ℂ è continua anche la sua restrizione
all’asse immaginario lo è. E dunque anche parte reale (coseno) e parte
immaginaria (seno) lo sono.
6. Sia 𝑥 ∈ ℝ. Osservando che 𝑖 2 𝑘 = (𝑖 2 ) 𝑘 = (−1) 𝑘 e 𝑖 2 𝑘+1 = 𝑖 · 𝑖 2 𝑘 =
𝑖 · (−1) 𝑘 suddividendo i termini pari e dispari della serie che definisce
l’esponenziale si ha:
+∞ 𝑘 𝑘 +∞ 2 𝑘 2 𝑘 +∞ 2 𝑘+1 2 𝑘+1
X 𝑖 𝑥 X 𝑖 𝑥 X 𝑖 𝑥
exp(𝑖𝑥) = = +
𝑘=0
𝑘! 𝑘=0
(2 𝑘)! 𝑘=0
(2 𝑘 + 1)!
+∞
X 𝑘
(−1) 𝑥 2𝑘 +∞
X (−1) 𝑘 𝑥 2 𝑘+1
= +𝑖 .
𝑘=0
(2 𝑘)! 𝑘=0
(2 𝑘 + 1)!
Osserviamo ora che le due serie che compaiono a destra dell’uguaglianza

sono a termini reali e quindi la loro somma è reale. Dunque queste due
serie coincidono con la parte reale e la parte immaginaria di exp(𝑖𝑥) =
cos 𝑥 + 𝑖 sin 𝑥 .
7. Per la corrispondente proprietà dell’esponenziale sappiamo che per 𝑥 → 0
si ha
𝑒 𝑖𝑥 − 1
→ 1.
𝑖𝑥
Ma
𝑒 𝑖𝑥 − 1 cos 𝑥 − 1 + 𝑖 sin 𝑥 sin 𝑥 1 − cos 𝑥
= = +𝑖 .
𝑖𝑥 𝑖𝑥 𝑥 𝑥
148 3 serie
Scopriamo dunque che
1 − cos 𝑥 sin 𝑥
→0 e → 1.
𝑥 𝑥
D’altra parte si ha
1 − cos 𝑥 (1 − cos 𝑥) · (1 + cos 𝑥) 1 − cos2 𝑥 1

= = ·
𝑥 2 𝑥 (1 + cos 𝑥)
2 𝑥 2 1 + cos 𝑥
2
sin 𝑥

1 1 1
= · →1· = .
𝑥 1 + cos 𝑥 1 + cos 0 2
Definiamo 𝜋 come la misura in radianti dell’angolo piatto, cioè dell’angolo

𝜋 identificato dal numero 𝑒 𝑖𝜋 = −1 sul piano complesso.
𝜏 Teorema 3.52 (definizione di 𝜋). Definiamo 𝜋 come il più piccolo numero reale
positivo in cui si annulla la funzione sin 𝑥 . Si ha 𝜋 ∈ [2.8 , 4]. Le funzioni 𝑒 𝑖𝑥 , sin 𝑥 e
cos 𝑥 sono periodiche di periodo 𝜏 = 2𝜋:
𝑒 𝑖𝑥+2𝜋 = 𝑒 𝑖𝑥 , cos(𝑥 + 2𝜋) = cos 𝑥, sin(𝑥 + 2𝜋) = sin 𝑥.
La funzione sin 𝑥 è strettamente crescente nell’intervallo − 𝜋2 , 𝜋2 e strettamente mentre

la funzione cos 𝑥 è strettamente decrescente nell’intervallo [0 , 𝜋]. Si ha infine:
sin(𝜋 + 𝑥) =− sin 𝑥, cos(𝜋 + 𝑥) = − cos 𝑥.
Vale inoltre la celeberrima formula di Eulero:
𝑒 𝑖𝜋 + 1 = 0.
Dimostrazione. Il teorema 3.48 ci permette di approssimare la funzione espo-

nenziale 𝑒 𝑖𝑥 per 𝑥 ∈ [0 , 1]. Ci proponiamo quindi di determinare l’andamento
delle funzioni sin 𝑥 e cos 𝑥 in tale intervallo e definire in tale intervallo il valore
di 𝛼 = 𝜋4 . Tramite tale valore 𝛼 e tramite le formule di addizione riusciremo a
determinare l’andamento delle funzioni sin e cos su tutta la retta reale.
Se 𝑥 ∈ [0 , 1] grazie al teorema 3.48 applicato con 𝑛 = 3 sappiamo che

4
2 3

𝑒 − 1 + 𝑖𝑥 + (𝑖𝑥) + (𝑖𝑥) ≤ |𝑖𝑥|
𝑖𝑥
2 6 18
sviluppando
cos 𝑥 + 𝑖 sin 𝑥 − 1 − 𝑖𝑥 + 𝑥 + 𝑖 𝑥 ≤ 𝑥 .
2

3 4

2 6 18
Il valore assoluto delle parti reale e immaginaria di un numero complesso sono

minori del modulo del numero complesso. Dunque si ottiene:
cos 𝑥 − 1 + 𝑥 ≤ 𝑥 sin 𝑥 − 𝑥 + 𝑥 ≤ 𝑥 .

2 4

3 4

e (3.17)
2 18 6 18
Per la funzione sin 𝑥 si ha dunque
𝑥3 𝑥4 𝑥3 𝑥4
𝑥− − ≤ sin 𝑥 ≤ 𝑥 − +
6 18 6 18
e sapendo che 0 < 𝑥 < 1 possiamo affermare che
𝑥3 𝑥4 𝑥 𝑥 7
𝑥− − ≥𝑥− − = 𝑥
6 18 6 18 9
e
𝑥3 𝑥4 𝑥3 𝑥3
𝑥− + ≤𝑥− + ≤ 𝑥.
6 18 6 18
Dunque se 𝑥 ∈ [0 , 1] si ha
7
𝑥 ≤ sin 𝑥 ≤ 𝑥. (3.18)
9
Per il coseno da un lato osserviamo che da (3.17) si ottiene, se 𝑥 ∈ [0 , 1]:
𝑥2 𝑥4 1 1 4
cos 𝑥 ≥ 1 − − ≥ 1− − = > 0.
2 18 2 18 9
Dall’altro lato si ha
𝑥2 𝑥4 𝑥2 𝑥2 4
cos 𝑥 ≤ 1 − + =1− + ≤ 1 − 𝑥2 .
2 18 2 18 9
Vogliamo ora dimostrare che la funzione cos 𝑥 è strettamente decrescente

sull’intervallo [0 , 1]. Infatti se 𝑥 ∈ [0 , 1] e 𝑡 ∈ (0 , 1] si ha
cos(𝑥 + 𝑡) = cos 𝑥 cos 𝑡 − sin 𝑥 sin 𝑡 ≤ cos 𝑥 cos 𝑡 < cos 𝑥
in quanto sin 𝑥 ≥ 0, sin 𝑡 ≥ 0 e cos 𝑡 < 1 − 59 𝑡 2 < 1 se 𝑡 > 0. Dunque la

funzione cos 𝑥 è strettamente decrescente su [0 , 1]. Visto che cos2 𝑥 + sin2 𝑥 = 1
deduciamo che la funzione sin2 𝑥 è strettamente crescente in [0 , 1]. Inoltre sin 𝑥
è positiva su tale intervallo e dunque anche sin 𝑥 è strettamente crescente in
[0 , 1].
√
Vogliamo ora dimostrare che esiste 𝛼 ∈ [0 , 1] tale per cui sin 𝛼 = 22 . Visto che
sin 𝑥 è una funzione continua, e sin 0 = 0, per √
utilizzare il teorema 2.80 dei
2
valori intermedi basterà verificare che sin 1 > 2 . E infatti si ha:
√
7 2
sin 1 ≥ > .
9 2
√ √
2 2
Dunque esiste un unico 𝛼 ∈ [0 , 1] tale che sin 𝛼 = 2 . Allora anche cos 𝛼 = 2
150 3 serie
(in quanto sin2 + cos2 = 1) e quindi

√ 2
2 𝑖𝛼 2 1
𝑒 = (1 + 𝑖) = (1 + 2 𝑖 − 1) = 𝑖.
2 2
Dunque 𝛼 è la misura in radianti di metà angolo retto.
Se poniamo 𝜋 = 4 𝛼 scopriamo dunque che

2
𝑒 𝑖𝜋 = 𝑒 2𝑖𝛼 = 𝑖 2 = −1
da cui sin 𝜋 = 0 e cos 𝜋 = −1. Analogamente da 𝑒 2𝑖𝛼 = 𝑖 troviamo che sin 𝜋2 = 1

cos 𝜋2 = 0.
Dalla stima (3.18) si ottiene √

7 2
𝛼≤ ≤𝛼
9 2
da cui 𝜋 = 4 𝛼 ∈ [2.8 , 4].
Abbiamo verificato che sull’intervallo 0 , 𝜋4 la funzione sin 𝑥 è strettamente

crescente mentre cos 𝑥 è strettamente decrescente. Dalle formule di addizione

sin 𝜋2 − 𝑥 = cos 𝑥 e cos 𝜋2 − 𝑥 = sin 𝑥 . Dunque

possiamo quindi dedurre 𝜋 che
anche sull’intervallo 4 , 𝜋2 la funzione sin 𝑥 è crescente e cos 𝑥 è decrescente.

Ancora, tramite le formula di addizione troviamo che sin(𝜋 − 𝑥) = sin 𝑥 e

cos(𝜋 − 𝑥) = − cos 𝑥 da cui possiamo dedurre che sia la funzione
𝜋 sin 𝑥 che la
funzione cos 𝑥 sono strettamente decrescenti sull’intervallo 2 , 𝜋 . Possiamo
dunque affermare che sin 𝑥 > 0 se 0 < 𝑥 < 𝜋 e dunque 𝜋 è il più piccolo reale
positivo in cui la funzione sin si annulla.
Visto che sin(𝜋 + 𝑥) = − sin 𝑥 e cos(𝜋 + 𝑥) = − cos 𝑥 possiamo stabilire l’an-

damento delle funzioni sin e cos anche sull’intervallo [𝜋, 2𝜋]. Infine essendo
𝑒 2𝑖𝜋 = 1 si osserva che la funzione 𝑒 2𝑖𝑥 e di conseguenza le funzioni sin 𝑥 e cos 𝑥
sono periodiche di periodo 2𝜋.
Esercizio 3.53. Utilizzando il teorema 3.48 dimostrare che
lim 𝑛 sin(2𝜋𝑒 𝑛 !) = 2𝜋.

𝑛→+∞
3.12 funzioni trigonometriche inverse
La funzione sin : [−𝜋/2 , 𝜋/2] → [−1 , 1] risulta essere strettamente crescente.

Inoltre essendo una funzione continua e visto che sin(−𝜋/2) = −1 e sin(𝜋/2) = 1
per il teorema dei valori intermedi la funzione assume tutti i valori in [−1 , 1].
Dunque restringendo il dominio all’intervallo [−𝜋/2 , 𝜋/2] e il codominio
all’intervallo [−1 , 1] la funzione risulta invertibile. La funzione inversa
arcsin : [−1 , 1] → [−𝜋/2 , 𝜋/2]

3.12 funzioni trigonometriche inverse 151
si chiama arco seno. Per definizione di funzione inversa si ha
arcsin(sin 𝑥) = 𝑥, ∀𝑥 ∈ [−𝜋/2 , 𝜋/2]
e
sin(arcsin 𝑥) = 𝑥, ∀𝑥 ∈ [−1 , 1].
La funzione cos : [0 , 𝜋] → [−1 , 1] risulta essere strettamente decrescente e,

analogamente a quanto visto per la funzione sin possiamo verificare che ristretta
a tali intervalli è una funzione invertibile. La funzione inversa
arccos : [−1 , 1] → [0 , 𝜋]
si chiama arco coseno. Per definizione si ha
arccos(cos 𝑥) = 𝑥, ∀𝑥 ∈ [0 , 𝜋]
e
cos(arccos 𝑥) = 𝑥, ∀𝑥 ∈ [−1, 1].
tg 𝑥
La funzione
sin 𝑥
tg 𝑥 =
cos 𝑥
è definita quando cos 𝑥 ≠ 0 ovvero:
n𝜋 o
tg : ℝ \ + 𝑘𝜋 : 𝑘 ∈ ℤ → ℝ.
2
Se restringiamo la funzione all’intervallo (−𝜋/2 , 𝜋/2) possiamo facilmente
osservare che la funzione tg : (−𝜋/2 , 𝜋/2) → ℝ è strettamente crescente. Inoltre
se 𝑎 𝑛 → 𝜋/2, 𝑎 𝑛 < 𝜋/2 si ha cos(𝑎 𝑛 ) → 0 (per continuità del coseno) e
sin(𝑎 𝑛 ) → 1 dunque tg 𝑎 𝑛 → +∞. Analogamente per 𝑎 𝑛 → −𝜋/2 si trova
tg 𝑎 𝑛 → −∞. Dunque per il teorema dei valori intermedi possiamo affermare
che la funzione tg : (−𝜋/2 , 𝜋/2) → ℝ è suriettiva. E’ quindi invertibile e la
funzione inversa
arctg : ℝ → (−𝜋/2 , 𝜋/2)
si chiama arco tangente. Per definizione si ha
arctg tg 𝑥 = 𝑥, ∀𝑥 ∈ (−𝜋/2 , 𝜋/2)
e
tg arctg 𝑥 = 𝑥, ∀𝑥 ∈ ℝ.
Grazie al teorema 2.8visto che quest funzioni sono monotone e bigettive possia-
mo affermare che le funzioni arcsin, arccos e arctg sono funzioni continue.
Esercizio 3.54. Dimostrare che per ogni 𝑥 > 0 si ha
1 𝜋
arctg = − arctg 𝑥.
𝑥 2
152 3 serie
Esercizio 3.55. La serie

+∞
X sin 𝑘
𝑘=1
𝑘
è convergente.
Dimostrazione. Applichiamo il teorema 3.32. Posto 𝑎 𝑘 = sin 𝑘 e 𝐵 𝑘 = 1/𝑘 si ha
𝑛−1 𝑛−1
𝑒 𝑖𝑘 .
X X
𝐴𝑛 = sin 𝑘 = Im
𝑘=0 𝑘=0
Osserviamo allora che 𝑒 𝑖𝑘 = (𝑒 𝑖 ) 𝑘 e dunque 𝐴𝑛 è la parte immaginaria della

somma di una serie geometrica. Si può quindi calcolare esplicitamente
1 − (𝑒 𝑖 )𝑛
𝐴𝑛 = Im
1 − 𝑒𝑖
da cui
1 − 𝑒 𝑖𝑛 1 + 𝑒 𝑖𝑛

2
|𝐴𝑛 | ≤

𝑖
≤ =
1−𝑒 𝑖
1 − 𝑒 1 − 𝑒 𝑖

e dunque 𝐴𝑛 è limitata.
D’altro canto posto 𝐵 𝑘 = 1/𝑘 è chiaro che 𝐵 𝑘 è decrescente e infinitesima.
Esercizio 3.56. Determinare il carattere delle seguenti serie

X 1 1 X 1
− sin , sin 𝜋𝑛 +
𝑛 𝑛 𝑛 𝑛 𝑛
3.13 funzioni iperboliche

sinh, cosh
Definizione 3.57 (funzioni iperboliche). Le funzioni coseno iperbolico e seno

iperbolico sono definite, per ogni 𝑥 ∈ ℝ, come segue:
𝑒 𝑥 + 𝑒 −𝑥 𝑒 𝑥 − 𝑒 −𝑥
cosh 𝑥 = , sinh 𝑥 = . (3.19)
2 2
Teorema 3.58 (proprietà delle funzioni iperboliche). Valgono le seguenti proprietà.
1. la funzione sinh è dispari, cosh è pari:
sinh(−𝑥) = − sinh(𝑥), cosh(−𝑥) = cosh(𝑥);
2. i punti del piano con coordinate (cosh 𝑥, sinh 𝑥) per 𝑥 ∈ ℝ sono disposti su un
ramo di iperbole in quanto vale:
cosh2 𝑥 − sinh2 𝑥 = 1;
3.13 funzioni iperboliche 153
𝑦 = sinh 𝑥
𝑦 = cosh 𝑥 𝑦 = tgh 𝑥
1
𝑥 Figura 3.2: I grafici delle funzioni sinh,

cosh e tgh.
−1
(interagisci)
3. formule di addizione:
cosh(𝛼 + 𝛽) = cosh 𝛼 cosh 𝛽 + sinh 𝛼 sinh 𝛽,

sinh(𝛼 + 𝛽) = sinh 𝛼 cosh 𝛽 + cosh 𝛼 sinh 𝛽 ;
4. si ha
+∞
X 𝑥 2𝑘 𝑥2 𝑥4 𝑥6
cosh 𝑥 = =1+ + + +...
𝑘=0
(2 𝑘)! 2 4! 6!
+∞
X 𝑥 2 𝑘+1 𝑥3 𝑥5 𝑥7
sinh 𝑥 = =𝑥+ + + +...
𝑘=0
(2 𝑘 + 1)! 6 5! 7!
5. la funzione sinh è strettamente crescente su tutto ℝ, la funzione cosh è stretta-

mente crescente sull’intervallo [0 , +∞) e strettamente decrescente nell’intervallo
(−∞, 0];
6. per 𝑥 → +∞ si ha sinh 𝑥 → +∞, cosh 𝑥 → +∞, per 𝑥 → −∞ si ha
sinh 𝑥 → −∞, cosh 𝑥 → +∞.
Dimostrazione. I primi tre punti si dimostrano facilmente per verifica diretta,

utilizzando la definizione (3.19).
Gli sviluppi in serie si ottengono anch’essi sostituendo gli sviluppi dell’espo-
nenziale nella definizione. Nel cosh i termini di grado dispari si cancellano, nel
sinh si cancellano i termini di grado pari.
Per quanto riguarda la monotonia si osserva che se 𝑥 ≥ 0 ogni addendo delle
due serie esposte nel punto 4 è strettamente crescente (in quanto i coefficienti
sono tutti positivi) e dunque le somme delle serie, cioè la funzione cosh e la
funzione sinh sono strettamente crescenti sull’intervallo [0 , +∞). La funzione
sinh, essendo dispari, risulta inoltre crescente anche sull’intervallo (−∞, 0] e
quindi è crescente su tutto ℝ.
Per l’ultima proprietà basterà usare la definizione (3.19) e ricordare che (teore-
ma 2.58) se 𝑥 → +∞ allora 𝑒 𝑥 → +∞ ed 𝑒 −𝑥 = 𝑒1𝑥 → 0.
Osserviamo che cosh 0 = 1 e, per le proprietà di monotonia viste nel teorema

precedente si ha cosh 𝑥 ≥ cosh 0 = 1 > 0. Dunque cosh 𝑥 non si annulla mai e
si può definire per ogni 𝑥 ∈ ℝ la tangente iperbolica
tgh
154 3 serie
sinh 𝑥
tgh 𝑥 = .
cosh 𝑥
La funzione sinh : ℝ → ℝ è iniettiva in quanto strettamente crescente ed è

surgettiva in quanto è continua e quindi assume tutti i valori compresi tra
lim𝑥→+∞ sinh(𝑥) = +∞ e lim𝑥→−∞ sinh(𝑥) = −∞. Dunque sinh : ℝ → ℝ è
invertibile e la funzione inversa si chiama settore di seno iperbolico e si denota con
settsinh
settsinh : ℝ → ℝ.
Analogamente la funzione ristretta cosh : [0 , +∞) → [1 , +∞) è iniettiva in
quanto strettamente crescente ed è surgettiva in quanto è continua e assume su
[0 , +∞) tutti i valori compresi tra cosh(0) = 1 e lim𝑥→+∞ cosh 𝑥 = +∞. Dunque
la funzione cosh 𝑥 ristretta a [0 , +∞) → [1 , +∞) è invertibile e la funzione
settcosh
inversa si chiama settore di coseno iperbolico
settcosh : [1 , +∞) → [0 , +∞).
La funzione tgh 𝑥 è strettamente crescente su tutto ℝ e assume tutti i valori

strettamente compresi tra −1 e 1. La funzione inversa si chiama setttgh.
Esercizio 3.59. Fissato 𝑦 ∈ ℝ si risolva l’equazione
𝑒 𝑥 − 𝑒 −𝑥
=𝑦
2
riconducendola ad una equazione di secondo grado nella variabile 𝑡 = 𝑒 𝑥 . Si dimostri
quindi che vale √
settsinh 𝑥 = ln 𝑥 + 𝑥 2 + 1 .
In modo analogo si dimostri che vale

√
settcosh 𝑥 = ln 𝑥 + 𝑥2 − 1
e r
1+𝑥
setttgh 𝑥 = ln .
1−𝑥
3.14 esercizi
Esercizio 3.60. Determinare il carattere delle seguenti serie
X 𝑛2 − 𝑛3 X (𝑛 !)2
,
𝑛 3𝑛 𝑛 (2𝑛)!
X (−1)𝑛 X 𝑛 − 10
,
𝑛 ln |𝑛 7 − 10𝑛 5 + 3 | 𝑛 𝑛 2 + 10
i numeri complessi 4
Nel capitolo precedente abbiamo introdotto l’esponenziale complesso ed abbia-
mo osservato che la funzione 𝑓 : ℝ → ℂ definita da 𝑓 (𝑡) = 𝑒 𝑖𝑡 ha valori sulla
circonferenza unitaria in quanto 𝑒 𝑖𝑡 = 1. Tramite la definizione 3.50 abbiamo
introdotto le funzioni seno e coseno in modo che risulti 𝑓 (𝑡) = cos 𝑡 + 𝑖 sin 𝑡 .
Sappiamo che 𝑓 (0) = 𝑒 0 = 1 e, per come abbiamo definito 𝜋, sappiamo che
𝑓 (𝜋/2) = 𝑖 .
4.1 rappresentazione polare dei numeri complessi
I numeri complessi di modulo uno vengono chiamati unitari. Geometricamente complessi unitari
i numeri complessi unitari sono i punti della circonferenza unitaria centrata
nell’origine del piano complesso. Se 𝑧 = 𝑥 + 𝑖 𝑦 è unitario si ha 𝑥 2 + 𝑦 2 = 1. I
prodotti e i reciproci dei numeri complessi unitari sono anch’essi unitari, risulta
quindi che tali numeri formano un sottogruppo moltiplicativo del gruppo dei Un gruppo è un insieme su cui è definita
una operazione (spesso denotata con il
numeri complessi. simbolo della moltiplicazione) che sia
associativa, che abbia elemento neutro e
Ogni numero complesso 𝑧 potrà essere scritto nella forma tale che ogni elemento abbia un inverso.
𝑧 =𝜌·𝑢
con 𝜌 ∈ ℝ, 𝜌 > 0 e 𝑢 ∈ ℂ unitario. Basta infatti definire 𝜌 = |𝑧| e 𝑢 = 𝑧/|𝑧| (se

𝑧 ≠ 0, altrimenti si potrà scegliere arbitrariamente 𝑢 = 1).
Teorema 4.1 (argomento). Sia 𝑧 ∈ ℂ un numero complesso non nullo. Allora esiste
un unico 𝜃 ∈ [0 , 2𝜋) tale che
𝑧 = |𝑧|𝑒 𝑖𝜃 .
Denoteremo tale valore di 𝜃 come l’argomento (o fase) di 𝑧 e scriveremo argomento
𝜃 = arg 𝑧.
Se 𝑧 = 0 porremo per convenzione arg 𝑧 = 0.
Dimostrazione. Sia 𝑧 ∈ ℂ, 𝑧 ≠ 0 e poniamo 𝑢 = 𝑧/|𝑧| . Posto 𝑢 = 𝑥 + 𝑖 𝑦 con

𝑥, 𝑦 ∈ ℝ si ha |𝑢| 2 = 𝑥 2 + 𝑦 2 = 1.
Se 𝑦 ≥ 0 se vogliamo che 𝑦 = sin 𝜃 con 𝜃 ∈ [0 , 2𝜋) dovrà necessariamente essere

𝜃 ∈ [0 , 𝜋] (altrimenti si avrebbe sin 𝜃 < 0). E se vogliamo che sia 𝑥 = cos 𝜃
basterà (e si dovrà) scegliere 𝜃 = arccos 𝑥 . Visto che sin2 𝜃 + cos2 𝜃 = 1 = 𝑥 2 + 𝑦 2
sapendo che cos 𝜃 = 𝑥 si avrà sin2 𝜃 = 𝑦 2 cioè | sin 𝜃| = |𝑦| . Ma visto che 𝑦 ≥ 0 e
sin 𝜃 ≥ 0 avremo, come voluto, sin 𝜃 = 𝑦 . Se 𝑦 < 0 poniamo 𝜃 = 2𝜋 − arccos 𝑥
cosicché si avrà 𝜃 ∈ (𝜋, 2𝜋) e, come prima (verificare!), 𝑥 = cos 𝜃 , 𝑦 = sin 𝜃 .
In ogni caso per ogni 𝑧 ≠ 0 abbiamo quindi trovato l’unico 𝜃 ∈ [0 , 2𝜋) tale che
𝑢 = 𝑥 + 𝑖 𝑦 = cos 𝜃 + 𝑖 sin 𝜃 = 𝑒 𝑖𝜃 .
156 4 i numeri complessi
da cui
𝑧 = |𝑧| · 𝑒 𝑖𝜃 .
Per ogni 𝑧 ∈ ℂ posto

𝜌 = |𝑧|, 𝜃 = arg 𝑧
si avrà quindi la rappresentazione esponenziale o polare
𝑧 = 𝜌𝑒 𝑖𝜃 = 𝜌 · (cos 𝜃 + 𝑖 sin 𝜃).
Se 𝑧 = 𝑥 + 𝑖 𝑦 è la rappresentazione cartesiana, si avranno le seguenti formule di

conversione: ( (
𝑥 = 𝜌 cos 𝜃 𝜌 = 𝑥2 + 𝑦2
p
𝑦 = 𝜌 sin 𝜃 𝜃 = arg 𝑧
con
𝜋 𝑥



 2 − arctg 𝑦 se 𝑦 > 0,
 3 𝜋 − arctg 𝑥 se 𝑦 < 0,


𝑦

arg 𝑧 = 2


 𝜋 se 𝑦 = 0 e 𝑥 < 0,
se 𝑦 = 0 e 𝑥 ≥ 0.

0


4.2 interpretazione geometrica
Vogliamo ora interpretare geometricamente 𝜃 = arg 𝑧 come la misura di un

angolo. Per fare ciò dobbiamo però capire cosa si intende per angolo e come si
misura un angolo. In questa sezione ragioneremo in maniera intuitiva in quanto
le proprietà formali analitiche delle operazioni sui numeri complessi sono
già state determinate e quello che vogliamo fare è darne una interpretazione
geometrica. Daremo quindi per scontate le proprietà geometriche del piano
euclideo.
Un angolo, geometricamente, è la regione piana delimitata da due semirette

uscenti da uno stesso punto. Le due semirette si chiamano lati dell’angolo e il
punto in comune si chiama vertice.
Due angoli 𝛼, 𝛽 si dicono congruenti se è possibile traslare e ruotare uno dei

due angoli (diciamo 𝛼 ) in modo che si sovrapponga all’altro. In particolare sarà
sempre possibile trovare una traslazione che manda il vertice dell’angolo 𝛼 sul
vertice dell’angolo 𝛽 e sarà possibile trovare una rotazione che fa coincidere uno
dei due lati in modo che uno dei due angoli copra interamente l’altro. Sia 𝛼0 la
roto-traslazione di 𝛼 così individuata. Se 𝛼0 = 𝛽 diremo che i due angoli sono
congruenti, altrimenti se 𝛼0 ⊇ 𝛽 diremo che 𝛼 è maggiore di 𝛽 e se invece 𝛼0 ⊆ 𝛽
diremo che 𝛼 è minore di 𝛽 . Con un procedimento simile è in genere possibile
sommare due angoli: si sposta uno dei due tramite una roto-traslazione in modo
da far coincidere il vertice e un lato dei due angoli e in modo che i due angoli
non si sovrappongano (questo non è sempre possibile perché se gli angoli sono
troppo grandi si sovrapporranno sempre). La loro unione sarà un angolo che
chiamiamo somma degli angoli dati.
4.2 interpretazione geometrica 157
Misurare un angolo significa associare ad ogni angolo un numero (reale positivo)

in modo che si abbiano le seguenti proprietà: angoli congruenti hanno la stessa
misura, angoli maggiori hanno misure maggiori (proprietà di monotonia) e
la misura della somma di due angoli è la somma delle misure (additività). Si
può intuire che una volta scelto quale angolo ha misura 1 (l’unità di misura) la
misura di ogni altro angolo sarà univocamente determinata da queste proprietà.
Infatti la misura dei multipli e dei sottomultipli dell’unità è determinata dalla
additività della misura e la misura degli angoli incommensurabili si potrà
ottenere per approssimazione sfruttando la monotonia.
Se ora identifichiamo il piano euclideo con il piano complesso ogni angolo potrà
essere traslato e ruotato in modo che uno dei due lati vada a coincidere con la
semiretta dei reali positivi e in modo che l’angolo si estenda al di sopra di tale
semiretta e sia delimitato da una seconda semiretta passante per un punto 𝑢
a distanza 1 dall’origine ovvero con |𝑢| = 1. Vogliamo giustificare il fatto che
𝜃 = arg 𝑢 può essere scelto come misura dell’angolo. Studiando la monotonia
delle funzioni cos e sin si può verificare facilmente che 𝜃 è crescente con l’angolo.
Più rilevante è chiedersi se 𝜃 è additivo. Siano 𝑢, 𝑣 ∈ ℂ due numeri complessi
unitari che rappresentino due diversi angoli. Sia 𝜃 = arg 𝑢 e 𝜑 = arg 𝑣 da cui
𝑢 = 𝑒 𝑖𝜃 e 𝑣 = 𝑒 𝑖𝜑 . Consideriamo la trasformazione 𝑅 𝜃 (𝑧) = 𝑒 𝑖𝜃 · 𝑧 . Si nota
che 𝑅 𝜃 è una trasformazione rigida del piano ovvero una trasformazione che
mantiene la distanza tra i punti (una isometria) in quanto essendo 𝑒 𝑖𝜃 = 1 si
ha
|𝑅 𝜃 (𝑧) − 𝑅 𝜃 (𝑤)| = 𝑒 𝑖𝜃 𝑧 − 𝑒 𝑖𝜃 𝑤 = 𝑒 𝑖𝜃 · |𝑧 − 𝑤| = |𝑧 − 𝑤|.

Inoltre 𝑅 𝜃 (0) = 0 e 𝑅 𝜃 (1) = 𝑢 significa che 𝑅 𝜃 non è altro che una rotazione
che tiene fissa l’origine e manda la semiretta dei reali positivi nella semiretta
uscente da 0 e passante per 𝑢 = 𝑒 𝑖𝜃 . Dunque 𝑅 𝜃 è la trasformazione che rende
l’angolo identificato dal numero complesso unitario 𝑣 in un angolo adiacente
a quello identificato da 𝑢 . Quindi la somma (geometrica) degli angoli 𝑢 e 𝑣 è
identificata dal numero complesso unitario 𝑅 𝜃 (𝑣) = 𝑢 · 𝑣 . Ma, per la proprietà
additiva dell’esponenziale complesso,
𝑢 · 𝑣 = 𝑒 𝑖𝜃 · 𝑒 𝑖𝜑 = 𝑒 𝑖(𝜃+𝜑)
e dunque se 𝜃 + 𝜑 < 2𝜋 si ha
arg(𝑢 · 𝑣) = 𝜃 + 𝜑 = arg(𝑢) + arg(𝑣)
che corrisponde alla proprietà additiva della misura degli angoli.

radiante
L’angolo unitario identificato dal numero complesso 𝑒 𝑖 si chiama radiante ed
è l’unità di misura che abbiamo scelto per gli angoli. L’angolo retto sarà
𝜋
identificato dal numero complesso 𝑖 = 𝑒 𝑖 2 e avrà una misura pari a 𝜋2 radianti.
L’angolo piatto sarà identificato dal numero complesso −1 = 𝑒 𝑖𝜋 e avrà una
misura di 𝜋 radianti. Geometricamente la misura degli angoli può essere data
dalla lunghezza dell’arco di raggio unitario identificato dall’angolo. Dunque
la definizione geometrica di 𝜋 (rapporto tra lunghezza della circonferenza e
diametro) corrisponde a richiedere che la semicirconferenza unitaria abbia
misura 𝜋 radianti. Questo significa che la definizione analitica di 𝜋 che abbiamo
dato (teorema 3.52) si riconcilia con la definizione geometrica.
Possiamo riconciliare definizione analitica e geometrica di 𝜋 anche con delle

osservazioni dirette.
Osservazione 4.2 (lunghezza della circonferenza tramite moto circolare unifor-

me). Si considera la curva 𝑡 ↦→ 𝑒 𝑖𝑡 come l’equazione oraria del moto di un punto che
si muove nel piano complesso. Visto che 𝑒 𝑖𝑡 = 1 tale punto si muove sulla circonfe-

renza unitaria. Possiamo determinare la velocità istantanea del punto considerando la

variazione della posizione:
𝑒 𝑖(𝑡+Δ𝑡) − 𝑒 𝑖𝑡 𝑒 𝑖Δ𝑡 − 1
= 𝑒 𝑖𝑡 · .
Δ𝑡 Δ𝑡
Prendendo un incremento temporale Δ𝑡 = 𝜀/𝑛 con 𝑛 → +∞ si osserva che il modulo
della velocità è dato da
𝑖𝑡 𝑒 𝑖 𝑛𝜀 − 1

𝑣 = lim 𝑒 · 𝜀

𝑛→+∞
𝑛
e visto che 𝑒 𝑖𝑡 = 1 ricordando il limite notevole (3.11) (teorema 3.45) si ottiene che la

velocità è pari ad 1. Significa che il punto 𝑒 𝑖𝑡 si muove sulla circonferenza unitaria

con velocità unitaria e quindi la lunghezza della curva percorsa risulta numericamente
uguale al tempo trascorso. Visto che per 𝑡 che varia da 0 a 2𝜋 il punto compie un giro
completo attorno alla circonferenza unitaria significa che la lunghezza della circonferenza
unitaria è 2𝜋.
Osservazione 4.3 (lunghezza della circonferenza tramite approssimazione con

poligonali). Possiamo calcolare la lunghezza della circonferenza unitaria come il limite
dei perimetri dei poligoni di 𝑁 lati iscritti nella circonferenza. Fissato 𝑁 consideriamo
per 𝑘 = 0 , . . . , 𝑁 i punti
2𝜋𝑘
𝑢𝑘 = 𝑒 𝑖 𝑁 .
Osserviamo che
2𝜋(𝑘+1)
2𝜋𝑘
2𝜋𝑘 2𝜋 2𝜋
|𝑢 𝑘+1 − 𝑢 𝑘 | = 𝑒 𝑖 − 𝑒𝑖
𝑖 𝑁 𝑖𝑁
𝑁 𝑁 = 𝑒 · 𝑒 − 1 = 𝑒 𝑖 𝑁 − 1

cioè i punti 𝑢 𝑘 sono equidistanti tra loro. Si noti che 𝑢0 = 𝑢𝑁 = 1 e quindi i

punti 𝑢1 , . . . , 𝑢𝑁 sono gli 𝑁 vertici di un poligono regolare di 𝑁 lati iscritto nella
circonferenza unitaria. Il perimetro del poligono è quindi dato da
2𝜋

𝑃 𝑁 = 𝑁 · 𝑒 𝑖 𝑁 − 1

e per 𝑁 → +∞ si ha, sempre utilizzando il limite notevole (3.11)

2𝜋
𝑖𝑁
𝑒 − 1

𝑃𝑁 = 2𝜋 · 2𝜋 → 2𝜋.

𝑁
Osservazione 4.4 (matrici di rotazione). Fissato 𝜃 ∈ ℝ consideriamo, come prima,

la funzione 𝑅 𝜃 : ℂ → ℂ, 𝑅 𝜃 (𝑧) = 𝑒 𝑖𝜃 · 𝑧 . Un altro modo per convincerci che 𝑅 𝜃
rappresenta una rotazione di 𝜃 radianti è quello di guardare la matrice associata. Se
identifichiamo il piano complesso ℂ con ℝ2 la trasformazione 𝑅 𝜃 può essere rappresentata
da una matrice 𝑀 𝛼 che ha come colonne le coordinate di 𝑅 𝜃 (1) = 𝑒 𝑖𝜃 = cos 𝜃 + 𝑖 sin 𝜃
4.2 interpretazione geometrica 159
e le coordinate di 𝑅 𝜃 (𝑖) = 𝑒 𝑖𝜃 · 𝑖 = − sin 𝜃 + 𝑖 cos 𝜃 :
cos 𝛼 − sin 𝛼

𝑀𝛼 = .
sin 𝛼 cos 𝛼
Osservazione 4.5 (interpretazione geometrica del prodotto di numeri complessi).

Possiamo ora dare una interpretazione geometrica del prodotto tra due numeri complessi
𝑧, 𝑤 ∈ ℂ. Se 𝑧 ≠ 0 possiamo scrivere 𝑧 = |𝑧| · 𝑒 𝑖𝜃 con 𝜃 = arg 𝑧 , cosicché:
𝑧 · 𝑤 = |𝑧| · 𝑅 𝜃 (𝑤).
Si capisce quindi che il numero complesso 𝑧 · 𝑤 si ottiene ruotando 𝑤 dell’angolo

identificato da 𝑧 con l’asse dei reali positivi, e quindi riscalando il punto ottenuto di un
fattore |𝑧| . Se poniamo 𝜓 = arg 𝑤 possiamo interpretare la moltiplicazione complessa
in coordinate polari:
𝑧 · 𝑤 = |𝑧|𝑒 𝑖𝜃 · |𝑤|𝑒 𝑖𝜓 = |𝑧| · |𝑤| · 𝑒 𝑖(𝜃+𝜓) .
Dunque il prodotto di due numeri complessi è quel numero complesso che ha come
modulo il prodotto dei moduli e come argomento la somma (a meno di multipli di 2𝜋)
degli argomenti.
Osservazione 4.6 (interpretazione geometrica dell’esponenziale complesso).

Ricordiamo che (teorema 3.47)
𝑛
𝑖𝑦

𝑖𝑦
𝑒 = lim 1+ .
𝑛→+∞ 𝑛
Possiamo osservare che se 𝑦 ∈ ℝ i punti (1 + 𝑖 𝑦/𝑛) 𝑘 per 𝑘 = 1 . . . 𝑛 sono i vertici di

una spezzata formata da 𝑛 segmenti di lunghezza
𝑘+1 𝑘 𝑘
𝑖 𝑦 𝑖 𝑦 𝑖 𝑦 𝑖 𝑦
1+ − 1+ = 1+ · 1+ −1

𝑛 𝑛 𝑛 𝑛
r !𝑘 𝑛2
2 𝑦 𝑦2

|𝑦| |𝑦|
= 1+ 2 · ≤ 1+ 2 · .
𝑛 𝑛 𝑛 𝑛
In particolare la lunghezza totale della spezzata ℓ 𝑛 può essere stimata come segue
𝑛2
𝑦2

|𝑦| ≤ ℓ 𝑛 ≤ 1 + 2 · |𝑦|
𝑛
da cui osservando che

𝑛2
𝑦2

1+ 2 →1
𝑛
e utilizzando il criterio del confronto si ottiene ℓ 𝑛 → |𝑦| .
Si osserva anche che i punti di tale spezzata si avvicinano sempre di più alla circonferenza
unitaria, infatti:
𝑘 𝑛 𝑛
𝑖 𝑖 1 2

1 ≤ 1+ ≤ 1 + = 1 + 2 → 1.

𝑛 𝑛 𝑛
E’ dunque sensato pensare che il punto 𝑒 𝑖𝑦 sia il punto della circonferenza unitaria che
identifica un arco di lunghezza |𝑦| a partire dal punto 1 sull’asse reale. Se 𝑦 > 0 l’arco è
misurato in senso antiorario, altrimenti in senso orario. Avremo dunque arg 𝑒 𝑖𝑦 = 𝑦

essendo 𝑦 la lunghezza dell’arco ovvero la misura in radianti dell’angolo corrispondente.
4.3 radici complesse 𝑛 -esime
Sia 𝑐 ∈ ℂ un numero complesso 𝑐 ≠ 0. Ci poniamo il problema di determinare

le soluzioni complesse dell’equazione
radici 𝑛 -esime 𝑧 𝑛 = 𝑐.
Tali soluzioni saranno chiamate radici 𝑛 -esime di 𝑐 .
Scriviamo 𝑐 e 𝑧 in forma esponenziale:
𝑐 = 𝑟𝑒 𝑖𝛼 , 𝑧 = 𝜌𝑒 𝑖𝜃 .
Si avrà allora
𝑧 𝑛 = 𝜌𝑛 (𝑒 𝑖𝜃 )𝑛 = 𝜌𝑛 𝑒 𝑖𝑛𝜃 .
Affinche sia 𝑧 𝑛 = 𝑐 si dovrà avere l’uguaglianza dei moduli, cioè 𝜌𝑛 = 𝑟 e
l’uguaglianza a meno di multipli interi di 2𝜋 degli argomenti: 𝑛𝜃 = 𝛼 + 2 𝑘𝜋
con 𝑘 ∈ ℤ. Dunque si trova
𝛼 2𝜋
𝜃= +𝑘 𝑘 ∈ ℤ.
𝑛 𝑛
Osserviamo ora che per 𝑘 = 0 , . . . , 𝑛 − 1 il secondo addendo 𝑘 2𝜋/𝑛 assume
𝑛 valori distinti compresi in [0, 2𝜋). Per gli altri valori di 𝑘 si ottengono degli
angoli che differiscono da questi di un multiplo di 2𝜋 e quindi non si trovano
altre soluzioni.
Dunque l’equazione 𝑧 𝑛 = 𝑐 per 𝑐 ≠ 0 ha 𝑛 soluzioni distinte date da

√
𝑧𝑘 = 𝑛
𝑟 · 𝑒 𝑖𝛼/𝑛+2 𝑘𝜋𝑖/𝑛 , 𝑘 = 0, 1, . . . , 𝑛 − 1
dove 𝛼 = arg(𝑐) e 𝑟 = |𝑐| . Dal punto di vista geometrico si osserva che 𝑧 0

è il numero complesso con modulo la radice 𝑛 -esima del numero dato 𝑐 e
argomento pari ad un 𝑛 -esimo dell’argomento di 𝑐 . Tutte le altre soluzioni si
trovano sulla circonferenza centrata in 0 e passante per 𝑧 0 e risultano essere,
insieme ad 𝑧 0 , i vertici di un 𝑛 -agono regolare.
4.4 ancora polinomi 161
In particolare nel caso 𝑐 = 1 si osserva che le radici 𝑛 -esime dell’unità si

rappresentano geometricamente come i vertici dell’𝑛 -agono regolare iscritto
nella circonferenza unitaria e con un vertice in 𝑧 0 = 1.
Esercizio 4.7. Si trovino le soluzioni 𝑧 ∈ ℂ delle seguenti equazioni. Scrivere le

soluzioni in forma polare e cartesiana.
𝑧 4 = −4
𝑧6 = 𝑖
𝑧 3 = −8 𝑖
𝑧4 = 𝑧
√
𝑧2 + 1 = 𝑖 3
(𝑧 − 𝑖)4 = 1
1 + 𝑧 + 𝑧2 + 𝑧3 = 0
𝑧 14 − 𝑧 6 − 𝑧 8 + 1 = 0
4.4 ancora polinomi
Proseguiamo la trattazione dei polinomi che abbiamo iniziato nel capitolo 1.10.
Teorema 4.8 (divisione di Euclide). Se 𝕂 è un campo, dati due polinomi 𝑃 e 𝑆 in

𝕂 [𝑥] con 𝑆 ≠ 0 è possibile trovare, in modo unico, due polinomi 𝑄 (quoziente) e 𝑅
(resto) in 𝕂 [𝑥] con deg 𝑅 < deg 𝑆 tali che:
𝑃 = 𝑄 · 𝑆 + 𝑅.
Dimostrazione. Passo 1: supponiamo che sia deg 𝑃 < deg 𝑆 . In questo caso basta
prendere 𝑄 = 0 e 𝑅 = 𝑃 .
Passo 2: supponiamo che sia deg 𝑃 ≥ deg 𝑆 . Poniamo 𝑁 = deg 𝑃 e 𝑀 = deg 𝑆 .

Sia 𝑎 𝑁 ≠ 0 il coefficiente del termine di grado massimo di 𝑃 e 𝑏 𝑀 ≠ 0 il
coefficiente di grado massimo del polinomio 𝑆 . E’ allora facile verificare che il
polinomio
𝑎𝑁
· 𝑥 𝑁−𝑀 · 𝑆
𝑏𝑀
ha lo stesso grado di 𝑃 e il suo coefficiente di grado massimo è uguale ad 𝑎 𝑁 in
quanto è il prodotto di 𝑎 𝑁 /𝑏 𝑀 per 𝑏 𝑀 . Dunque il polinomio
𝑎𝑁
𝑃1 = 𝑃 − · 𝑥 𝑁−𝑀 · 𝑆
𝑏𝑀
ha grado strettamente inferiore a 𝑃 . Possiamo ora supporre, mediante un

ragionamento induttivo su deg 𝑃 − deg 𝑆 che per il polinomio 𝑃1 il risultato del
teorema sia valido cioè che esistano, dei polinomio 𝑄 1 e 𝑅 con deg 𝑅 < deg 𝑆
tali che
𝑃1 = 𝑄 1 · 𝑆 + 𝑅.
Il caso base del ragionamento induttivo, deg 𝑃 = deg 𝑆 , è garantito dal passo 1.
Avremo allora:
𝑎 𝑁 𝑁−𝑀
𝑃 = 𝑃1 + 𝑥 ·𝑆
𝑏𝑀
= 𝑄1 · 𝑆 + 𝑅1 + 𝑥 ·𝑆
𝑏𝑀
=( 𝑥 + 𝑄1 ) · 𝑆 + 𝑅1 .
𝑏𝑀
Posto quindi
𝑄= 𝑥 + 𝑄1
𝑏𝑁
il risultato è dimostrato.
Passo 3: dimostriamo che 𝑄 e 𝑅 sono unici. Se infatti avvessimo
𝑃 = 𝑄1 𝑆 + 𝑅1 = 𝑄2 𝑆 + 𝑅2
con deg 𝑅 1 < deg 𝑆 e deg 𝑅 2 < deg 𝑆 si avrebbe
(𝑄 2 − 𝑄 1 )𝑆 = 𝑅 1 − 𝑅 2 .
Se fosse 𝑄 2 ≠ 𝑄 1 il polinomio al lato sinistro avrebbe grado non inferiore al

grado di 𝑆 mentre il lato destro ha certamente grado minore di 𝑆 . Dunque
𝑄 2 = 𝑄 1 ma allora il lato sinistro è nullo e quindi anche il lato destro deve
esserlo: 𝑅 2 = 𝑅 1 .
La dimostrazione del teorema precedente fornisce anche un algoritmo, chiamato

algoritmo di Euclide, per eseguire la divisione (con resto) tra polinomi. Lo
sperimentiamo nel seguente esercizio.
Esercizio 4.9. Sia 𝑃 = 𝑥 4 − 3 𝑥 2 + 2 𝑥 + 1 e 𝑆 = 𝑥 2 − 1. Eseguire la divisione con

resto cioè: trovare 𝑄 ed 𝑅 con deg 𝑅 < deg 𝑆 tali che
𝑃 = 𝑄 · 𝑆 + 𝑅.
Svolgimento. Il rapporto tra i termini di grado massimo di 𝑃 e 𝑆 è 𝑥 4 /𝑥 2 = 𝑥 2 .

Dunque consideriamo come primo monomio 𝑥 2 . Si ha
𝑃1 = 𝑃 − 𝑥 2 · 𝑆 = 𝑥 4 − 3 𝑥 2 + 2 𝑥 + 1 − 𝑥 4 + 𝑥 2
= −2 𝑥 2 + 2 𝑥 + 1 .
Ripetiamo il procedimento con 𝑃1 al posto di 𝑃 . Il rapporto tra i termini di

grado massimo di 𝑃1 e 𝑆 è il monomio −2. Si ha
𝑃2 = 𝑃1 − (−2)𝑆 = −2𝑥 2 + 2 𝑥 + 1 + 2𝑥 2 − 2 = 2 𝑥 − 1.
Visto che deg 𝑃2 < deg 𝑆 la divisione termina e si pone 𝑅 = 2 𝑥 − 1. Si ha quindi

𝑄 = 𝑥 2 − 2 (la somma dei monomi trovati) e risulta:
𝑃 = (𝑥 2 − 2) · 𝑆 + 2𝑥 − 1.
4.4 ancora polinomi 163
Teorema 4.10 (Ruffini). Sia 𝑃 ∈ 𝕂 [𝑥] un polinomio non nullo. Se 𝑥 0 ∈ 𝕂 è tale che
𝑃(𝑥0 ) = 0 allora esiste un polinomio 𝑄 con deg 𝑄 = (deg 𝑃) − 1 tale che
𝑃 = (𝑥 − 𝑥0 ) · 𝑄.
Dimostrazione. In base al teorema precedente si può fare la divisione tra 𝑃 e

𝑆 = 𝑥 − 𝑥0 per ottenere un polinomio 𝑄 e un resto 𝑅 con deg 𝑅 < 1 tali che
𝑃 = (𝑥 − 𝑥0 ) · 𝑄 + 𝑅.
Siccome deg 𝑅 < 1 si ha in effetti che 𝑅 = 𝑐 ∈ 𝕂 è un polinomio costante e

dunque
𝑃 = (𝑥 − 𝑥0 ) · 𝑄 + 𝑐
ma valutando 𝑃 in 𝑥 = 𝑥 0 si scopre che
𝑃(𝑥0 ) = 0 · 𝑄(𝑥0 ) + 𝑐 = 𝑐
dunque 𝑐 = 𝑃(𝑥 0 ) = 0.
Possiamo ora chiederci se polinomi diversi corrispondono a funzioni polinomiali

diverse. In generale questo non è vero, se ad esempio prendessimo come campo
𝕂 = ℤ2 = {0, 1}, un campo finito in cui poniamo 1 + 1 = 0 scopriremmo
che la funzione polinomiale 𝑃(𝑥) = 𝑥 2 + 𝑥 è identicamente nulla in quanto
02 + 0 = 0 e 12 + 1 = 1 + 1 = 0 in questo campo. Ma nei casi che interessano a noi
𝕂 = ℝ o 𝕂 = ℂ questo problema non si presenta e si potrà quindi identificare
ogni polinomio con la corrispondente funzione polinomiale. Per avere questa
garanzia ci servono i seguenti risultati.
Teorema 4.11 (principio di annullamento dei polinomi). Sia 𝑃 ∈ 𝕂 [𝑥] un

polinomio non nullo di grado 𝑛 . Allora la funzione polinomiale associata a 𝑃 si annulla
in al più 𝑛 punti distinti di 𝕂 .
In particolare se un polinomio si annulla in infiniti punti distinti allora tale polinomio è

certamente nullo.
Dimostrazione. Dimostriamo per induzione su 𝑛 che se un polinomio 𝑃 di grado

non superiore a 𝑛 si annulla in 𝑛 + 1 punti distinti 𝑥 1 , . . . , 𝑥 𝑛+1 ∈ 𝕂 allora 𝑃 = 0.
Se 𝑛 = 0 il polinomio 𝑃 è costante ma si annulla in un punto e quindi è il

polinomio nullo. Se 𝑛 > 0 per il teorema di Ruffini applicato al punto 𝑥 𝑛+1
sappiamo che esise un polinomio 𝑄 di grado inferiore ad 𝑛 per cui si ha
𝑃 = (𝑥 − 𝑥 𝑛+1 ) · 𝑄
sostituendo 𝑥 = 𝑥 𝑘 con 𝑘 ≤ 𝑛 si ha 𝑥 𝑘 − 𝑥 𝑛+1 ≠ 0 e quindi
𝑃(𝑥 𝑘 )
𝑄(𝑥 𝑘 ) = = 0.
𝑥 𝑘 − 𝑥 𝑛+1
Dunque 𝑄 si annulla nei punti 𝑥 1 , . . . , 𝑥 𝑛 e, per ipotesi induttiva, scopriamo

che 𝑄 deve essere nullo. Di conseguenza anche 𝑃 è nullo.
Se 𝕂 è un insieme infinito (come nei casi 𝕂 = ℝ o 𝕂 = ℂ) si trova che se a due

polinomi 𝑃 , 𝑄 corrisponde la stessa funzione polinomiale:
𝑃(𝑥) = 𝑄(𝑥) per ogni 𝑥 ∈ 𝕂
allora 𝑃 e 𝑄 sono lo stesso polinomio 𝑃 = 𝑄 in quanto la differenza 𝑃 − 𝑄 si

annulla in tutti i punti di 𝕂 e qualunque sia il suo grado, se 𝕂 è infinito, questo
ci dice che 𝑃 − 𝑄 = 0.
Questo corollario viene spesso enunciato come segue.
Teorema 4.12 (principio di identità dei polinomi). Siano 𝑎 𝑘 e 𝑏 𝑘 coefficienti nel

campo 𝕂 = ℝ o 𝕂 = ℂ. Se per ogni 𝑥 ∈ 𝕂 si ha
𝑛 𝑚
𝑎𝑘 𝑥 𝑘 = 𝑏𝑘 𝑥 𝑘
X X
𝑘=1 𝑘=1
allora 𝑚 = 𝑛 e 𝑎 𝑘 = 𝑏 𝑘 per ogni 𝑘 = 0 , . . . , 𝑛 .
Dimostrazione. Facendo la differenza dei due lati dell’uguaglianza si ottiene

che una espressione polinomiale si annulla identicamente. Allora per il teore-
ma 4.11 tale espressione rappresenta il polinomio nullo e di conseguenza tutti i
coefficienti, che sono dati dalla differenza 𝑎 𝑘 − 𝑏 𝑘 , devono essere nulli.
4.5 il teorema fondamentale dell’algebra
Il teorema fondamentale dell’algebra afferma che ogni polinomio non costante

si annulla in almeno un punto del piano complesso.
La formula risolutiva per determinare le radici di un polinomio di secondo

grado era già nota ai Babilonesi e sebbene i numeri complessi non erano noti
(e neanche i numeri negativi) la stessa formula si applica nel caso generale e
fornisce le radici complesse.
Lo studio delle equazioni di grado superiore al secondo si sviluppa invece nel

1500 ad opera dei matematici italiani Scipione del Ferro, Gerolamo Cardano,
Niccolò Tartaglia e Lodovico Ferrari. Essi determinano le formule risolutive per
determinare le radici dei polinomi di terzo e quarto grado. Nell’applicare la
formula risolutiva per l’equazione di terzo grado può capitare di dover calcolare
la radice quadrata di un numero negativo anche in situazioni in cui tutte le
soluzioni alla fine risultano reali. Ed è proprio in questo contesto che nascono
i numeri complessi, come mero artificio matematico utilizzato per portare a
termine il conto.
Successivamente Paolo Ruffini (1765-1822) e Niels Abel (1802-1829) dimostrarono

che le equazioni di grado maggiore del quarto non ammettono una formula
risolutiva esprimibile mediante radicali. Il criterio per determinare se un
4.5 il teorema fondamentale dell’algebra 165
polinomio ammette o meno formule risolutive è dovuto al matematico francese

Évariste Galois (1811-1832) che è considerato il fondatore della teoria dei
gruppi.
Il teorema fondamentale dell’algebra, e cioè l’esistenza di radici complesse per
polinomi di grado qualunque, viene dimostrato dal matematico tedesco Carl
Friedrich Gauss (1777–1855). Questo teorema opera una svolta nel pensiero
matematico in quanto per la prima volta si dà rilevanza ad un risultato astratto di
esistenza slegato da una formula risolutiva. Il teorema non era affatto scontato,
basti pensare che sia Leibniz che Nikolas Bernoulli erano convinti di aver trovato
dei polinomi di quarto grado che non possono essere fattorizzati in contrasto
con il teorema 4.21.
Per dimostrare il teorema fondamentale dell’algebra dobbiamo estendere il
teorema di Weierstrass alle funzioni di una variabile complessa. Nel teorema
di Weierstrass reale la funzione per ipotesi è definita su un intervallo chiuso e
limitato. Nel piano complesso non esiste il concetto di intervallo in quanto non
abbiamo un ordinamento ma vedremo che comunque il teorema di Weierstrass
rimane valido per le funzioni continue definite su insiemi chiusi e limitati
secondo le seguenti definizioni.
Definizione 4.13 (chiusura sequenziale). Un insieme 𝐴 ⊆ ℂ si dice essere sequen-

zialmente chiuso se presa una qualunque successione di punti 𝑎 𝑛 ∈ 𝐴 se 𝑎 𝑛 → 𝑎 per
sequenzialmente chiuso
qualche 𝑎 ∈ ℂ allora 𝑎 ∈ 𝐴.
Definizione 4.14 (limitatezza). Un insieme 𝐴 ⊆ ℂ si dice essere limitato se

limitato
sup {|𝑧| : 𝑧 ∈ 𝐴} < +∞.
Una successione 𝑧 𝑛 ∈ ℂ si dice essere limitata se l’insieme {𝑧 𝑛 : 𝑛 ∈ ℕ } è limitato

ovvero se
sup |𝑧 𝑛 | < +∞.
𝑛∈ℕ
Teorema 4.15 (Bolzano-Weierstrass complesso). Se 𝑧 𝑛 ∈ ℂ è una successione

limitata allora è possibile estrarre una sottosuccessione 𝑧 𝑛 𝑘 convergente: 𝑧 𝑛 𝑘 → 𝑧 con
𝑧 ∈ ℂ.
Dimostrazione. Siano 𝑥 𝑛 e 𝑦𝑛 la parte reale ed immaginaria di 𝑧 𝑛 : 𝑧 𝑛 = 𝑥 𝑛 + 𝑖 𝑦𝑛 .

p q
Visto che |𝑥 𝑛 | = 𝑥 𝑛2 ≤ 𝑥 𝑛2 + 𝑦𝑛2 = |𝑧 𝑛 | e, allo stesso modo |𝑦𝑛 | ≤ |𝑧 𝑛 | ,
possiamo affermare che entrambe le successioni 𝑥 𝑛 e 𝑦𝑛 sono limitate (ma
stavolta in ℝ). Dunque possiamo applicare il teorema di Bolzano-Weierstrass
(reale) alla successione 𝑥 𝑛 per trovare una sottosuccessione 𝑥 𝑛 𝑗 → 𝑥 conver-
gente. E possiamo applicare di nuovo il teorema di Bolzano-Weierstrass alla
sottosuccessione 𝑦𝑛 𝑗 per trovare una sotto-sottosuccessione 𝑦𝑛 𝑗𝑘 → 𝑦 anch’essa
convergente. Posto 𝑛 𝑘 = 𝑛 𝑗𝑘 avremo dunque trovato una sottosuccessione
𝑧 𝑛 𝑘 = 𝑥 𝑛 𝑘 + 𝑖 𝑦𝑛 𝑘 → 𝑥 + 𝑖 𝑦 convergente.
Teorema 4.16 (Weierstrass complesso). Sia 𝐴 ⊆ ℂ un insieme non vuoto, sequen-

zialmente chiuso e limitato e sia 𝑓 : 𝐴 → ℝ una funzione continua. Allora 𝑓 ha
massimo e minimo su 𝐴.
Dimostrazione. Dimostriamo l’esistenza del minimo: per il massimo la dimo-

strazione è perfettamente analoga. Sia 𝑚 = inf 𝑓 (𝐴). Essendo 𝐴 non vuoto, per
il lemma sull’esistenza delle successioni minimizzanti sappiamo esistere una
successione 𝑧 𝑛 ∈ 𝐴 tale che 𝑓 (𝑧 𝑛 ) → 𝑚 . Essendo 𝐴 limitato possiamo applicare
il teorema di Bolzano-Weierstrass per trovare 𝑧 ∈ ℂ e una sottosuccessione
𝑧 𝑛 𝑘 → 𝑧 . Essendo 𝐴 sequenzialmente chiuso possiamo quindi affermare che
𝑧 ∈ 𝐴. Essendo 𝑓 continua concludiamo che
𝑓 (𝑧) = lim 𝑓 (𝑧 𝑛 𝑘 ) = 𝑚
𝑘→+∞
e dunque 𝑧 è un punto di minimo per 𝑓 .
Teorema 4.17 (esistenza del minimo per funzioni coercive). Sia 𝑓 : ℂ → ℝ una
funzione continua tale che per ogni successione 𝑧 𝑛 → ∞ (ovvero |𝑧 𝑛 | → +∞) si abbia
𝑓 (𝑧 𝑛 ) → +∞. Allora 𝑓 ha minimo.
Dimostrazione. Consideriamo l’insieme
𝐴 = {𝑧 ∈ ℂ : 𝑓 (𝑧) ≤ 𝑓 (0)}.
Chiaramente 0 ∈ 𝐴 e quindi 𝐴 non è vuoto. L’insieme 𝐴 è anche sequenzialmente

chiuso in quanto se 𝑧 𝑘 ∈ 𝐴 allora 𝑓 (0) − 𝑓 (𝑧 𝑘 ) ≥ 0, per continuità 𝑓 (0) − 𝑓 (𝑧 𝑘 ) →
𝑓 (0) − 𝑓 (𝑧) e per il teorema della permanenza del segno si ottiene 𝑓 (0) − 𝑓 (𝑧) ≥ 0
cioè 𝑧 ∈ 𝐴. Dimostriamo ora che 𝐴 è anche limitato. Se non lo fosse esisterebbe,
per assurdo, una successione 𝑧 𝑛 ∈ 𝐴 tale che |𝑧 𝑛 | → +∞ cioè 𝑧 𝑛 → ∞. Ma
allora, per ipotesi su 𝑓 , si avrebbe 𝑓 (𝑧 𝑛 ) → +∞ che contraddice la condizione
𝑓 (𝑧 𝑛 ) ≤ 𝑓 (0). Essendo 𝐴 non vuoto, sequenzialmente chiuso e limitato ed
essendo 𝑓 : 𝐴 → ℝ continua, possiamo applicare il teorema di Weierstrass
complesso per dedurre che 𝑓 ha minimo su 𝐴 in un punto 𝑤 ∈ 𝐴. Ma essendo
0 ∈ 𝐴 si avrà sicuramente 𝑓 (𝑤) ≤ 𝑓 (0) e per ogni 𝑧 ∈ ℂ \ 𝐴 si ha invece
𝑓 (𝑧) > 𝑓 (0) per come è stato definito 𝐴. Dunque 𝑤 è minimo di 𝑓 su tutto ℂ,
non solo su 𝐴.
teorema fondamentale dell’algebra
Teorema 4.18 (teorema fondamentale dell’algebra). Sia 𝑓 (𝑧) un polinomio di
grado 𝑁 ≥ 1 a coefficienti complessi:
𝑁
𝑎𝑗 · 𝑧𝑗
X
𝑓 (𝑧) =
𝑗=0
con 𝑎 𝑗 ∈ ℂ per 𝑗 = 0 , . . . , 𝑁 e 𝑎 𝑁 ≠ 0. Allora esiste 𝑤 ∈ ℂ tale che 𝑓 (𝑤) = 0.
Dimostrazione. Osserviamo innanzitutto che | 𝑓 (𝑧)| è coerciva cioè che se 𝑧 𝑛 → ∞

allora | 𝑓 (𝑧 𝑛 )| → +∞. Infatti si ha

𝑁 𝑁− 1
𝑗 𝑗
X
𝑎 𝑗 𝑧 𝑛 = 𝑎 𝑁 𝑧 𝑛𝑁 +
X
| 𝑓 (𝑧 𝑛 )| = 𝑎 𝑗 𝑧𝑛

𝑗=0 𝑗=0

𝑁−
X1 𝑎 𝑗
= |𝑧 𝑛 | 𝑁 · 𝑎 𝑁 + → +∞

𝑁−𝑗
𝑗=0 𝑧 𝑛

4.5 il teorema fondamentale dell’algebra 167
se 𝑧 𝑛 → ∞.
Sappiamo che tutti i polinomi sono funzioni continue in quanto somme di

prodotti di funzioni continue e il modulo è anch’esso una funzione continua
dunque | 𝑓 (𝑧)| è certamente una funzione continua.
Dunque possiamo applicare il teorema di esistenza del minimo per le funzioni

coercive: esiste 𝑤 ∈ ℂ tale che | 𝑓 (𝑤)| è minimo.
Per concludere il teorema basterà dimostrare che 𝑓 (𝑤) = 0. L’idea che vogliamo
sviluppare è che i polinomi complessi se assumono un valore 𝑓 (𝑤) in un punto
𝑤 ∈ ℂ allora assumono anche tutti i valori vicini ad esso in quanto localmente
il polinomio assomiglia ad una potenza 𝑧 𝑛 e l’equazione 𝑧 𝑛 = 𝑐 ha sempre
soluzione, come abbiamo già visto. Dunque vicino a 𝑤 ci saranno dei punti
in cui 𝑓 assume valori che in modulo sono minori a 𝑓 (𝑤): a meno che non sia
proprio 𝑓 (𝑤) = 0, nel qual caso ovviamente non è possibile avere numeri con
modulo inferiore a 0.
Possiamo scrivere il polinomio 𝑓 (𝑧) nella forma
𝑁
𝑏 𝑗 (𝑧 − 𝑤) 𝑗
X
𝑓 (𝑧) =
𝑗=0
in quanto la traslazione di un polinomio è ancora un polinomio dello stesso

grado. Dimostrare che 𝑓 (𝑤) = 0 è quindi equivalente a dimostrare che 𝑏 0 = 0.
Supponiamo allora per assurdo che sia 𝑏 0 ≠ 0. L’andamento del polinomio
vicino al punto 𝑤 è dominato dai termini di grado più basso: alcuni di questi
potrebbero essere nulli, ma possiamo considerare il primo indice 𝑘 > 0 per cui
si ha 𝑏 𝑘 ≠ 0. Allora potremo scrivere:
𝑁
𝑓 (𝑧) = 𝑏0 + 𝑏 𝑘 (𝑧 − 𝑤) 𝑘 + 𝑏 𝑗 (𝑧 − 𝑤) 𝑗 .
X
𝑗=𝑘+1
Ora scriviamo 𝑧 − 𝑤 e 𝑏 0 in forma esponenziale: 𝑧 − 𝑤 = 𝜌𝑒 𝑖𝜃 , 𝑏 0 = 𝑟𝑒 𝑖𝛼 e

applichiamo la disuguaglianza triangolare

𝑁
| 𝑓 (𝑧)| = 𝑟𝑒 𝑖𝛼 + 𝜌 𝑘 𝑒 𝑖𝜃𝑘 + 𝑏 𝑗 𝜌 𝑗 𝑒 𝑖𝜃 𝑗
X
𝑗=𝑘+1

𝑁
≤ 𝑟𝑒 𝑖𝛼 + 𝜌 𝑘 𝑒 𝑖𝜃𝑘 + 𝑏 𝑗 𝜌 𝑗 .
X
𝑗=𝑘+1
Per raggiungere un assurdo vogliamo dimostrare che esiste 𝑧 (cioè esistono 𝜌 e

𝜃 ) per cui il valore della funzione risulti in modulo minore di 𝑟 = |𝑏0 | = | 𝑓 (𝑤)| .
Innanzitutto se 𝜌 è sufficientemente piccolo possiamo rendere arbitrariamente
piccole le potenze 𝜌 𝑗 con 𝜌 > 𝑘 : basta scegliere 𝜌 ≤ 1 e 𝜌 ≤ 1/(2 𝑏 𝑗 ) cosicché
P
si avrà
𝑁 𝑁 𝑘
𝑏 𝑗 𝜌 𝑗 ≤ 𝜌 𝑘+1 𝑏 𝑗 ≤ 𝜌 .
X X
𝑗=𝑘+1 𝑗=𝑘+1
2
Per quanto riguarda il termine 𝑟𝑒 𝑖𝛼 + 𝜌 𝑘 𝑒 𝑖𝜃𝑘 sarà sufficiente scegliere 𝜃 =

(𝜋 − 𝛼)/𝑘 in modo che i due addendi abbiano fase opposta e la somma sia
distruttiva: 𝑖𝛼
𝑟𝑒 + 𝜌 𝑘 𝑒 𝑖𝜃𝑘 = 𝑒 𝑖𝛼 (𝑟 + 𝜌 𝑘 𝑟 𝑖𝜋 ) = 𝑟 − 𝜌 𝑘 .

In definitiva abbiamo
𝜌𝑘
| 𝑓 (𝑧)| = 𝑓 (𝑤 + 𝜌𝑒 𝑖𝜃 ≤ 𝑟 − 𝜌 𝑘 + < 𝑟 = | 𝑓 (𝑤)|

2
che è assurdo in quanto | 𝑓 (𝑤)| doveva essere il valore minimo.
4.6 fattorizzazione dei polinomi
Teorema 4.19 (fattorizzazione dei polinomi complessi). Sia 𝑝(𝑧) un polinomio

non nullo. Allora posto 𝑛 = deg 𝑝 esistono dei numeri complessi 𝑧 1 , 𝑧 2 , . . . , 𝑧 𝑛 ed un
numero complesso 𝑐 ≠ 0 tali che
𝑛
Y
𝑝(𝑧) = 𝑐 (𝑧 − 𝑧 𝑘 ). (4.1)
𝑘=1
Gli 𝑧 𝑘 sono unici a meno dell’ordine e 𝑐 pure è univocamente determinato.
Dimostrazione. Dimostriamo il teorema per induzione su 𝑛 = deg 𝑝 . Se 𝑛 = 0 il

polinomio 𝑝 è costante: 𝑝(𝑧) = 𝑐 . Ricordando che un prodotto di 𝑛 = 0 fattori è
uguale a 1 si ottiene quindi il risultato voluto.
Sia ora 𝑝(𝑧) un qualunque polinomio di grado 𝑛 > 0. Per il teorema fonda-
mentale dell’algebra sappiamo che esiste un numero complesso 𝑧 𝑛 tale che
𝑝(𝑧 𝑛 ) = 0. Per il teorema di Ruffini si ha allora
𝑝(𝑧) = (𝑧 − 𝑧 𝑛 )𝑞(𝑧)
con 𝑞 un qualche polinomio di grado 𝑛 − 1. Per ipotesi induttiva possiamo

dunque supporre che esistano 𝑧 1 , . . . , 𝑧 𝑛−1 e 𝑐 numeri complessi tali che
𝑛−1
Y
𝑞(𝑧) = 𝑐 (𝑧 − 𝑧 𝑘 )
𝑘=1
e la tesi segue.
Nella fattorizzazione (4.1) le radici 𝑧 𝑘 possono anche ripetersi. Se mettiamo

insieme i fattori corrispondenti alla stessa radice si ottiene una decomposizione
della forma
𝑚
(𝑧 − 𝑧 𝑘 )𝑝 𝑘
Y
𝑃(𝑧) = 𝑐 (4.2)
molteplicità 𝑘=1
con 𝑧 1 , . . . , 𝑧 𝑚 numeri complessi distinti (le radici del polinomio 𝑃 ) e 𝑝 𝑘 interi

positivi. L’esponente 𝑝 𝑘 si chiama molteplicità della radice 𝑧 𝑘 e risulta
𝑝1 + · · · + 𝑝 𝑚 = 𝑛.
4.6 fattorizzazione dei polinomi 169
Questa uguaglianza si esprime dicendo che un polinomio 𝑃 ∈ ℂ[𝑧] di grado

𝑛 ha sempre 𝑛 radici contate con la loro molteplicità. Le radici distinte sono
invece 𝑚 ≤ 𝑛 .
Se invece 𝑃 ∈ ℝ[𝑥] è un polinomio a coefficienti reali non è detto che 𝑃 abbia

radici: ad esempio il polinomio 𝑥 2 + 1 non ha radici reali in quanto 𝑥 2 + 1 > 0
come succede in ogni campo ordinato. Potrà allora essere utile pensare a 𝑃
come ad un polinomio in ℂ[𝑥] con coefficienti reali.
Se 𝑃 ∈ ℝ[𝑥] è un polinomio a coefficienti reali

𝑛
𝑎𝑘 𝑥 𝑘 ,
X
𝑃= 𝑎𝑘 ∈ ℝ
𝑘=0
possiamo pensare a 𝑃 anche come un polinomio in ℂ[𝑥], visto che 𝑎 𝑘 ∈ ℝ ⊆ ℂ.

Il seguente teorema ci dà un criterio per distinguere i polinomi a coefficienti
reali dentro a ℂ[𝑥].
Teorema 4.20. Se 𝑃 ∈ ℂ[𝑥] è un polinomio a coefficienti complessi

𝑛
𝑎𝑘 𝑥 𝑘 ,
X
𝑃= 𝑎𝑘 ∈ ℂ
𝑘=0
e se esiste un insieme infinito 𝐴 ⊆ ℝ tale che per ogni 𝑥 ∈ 𝐴 si abbia 𝑃(𝑥) ∈ ℝ allora
𝑎 𝑘 ∈ ℝ per ogni 𝑘 = 0, . . . , 𝑛 e dunque 𝑃 ∈ ℝ[𝑥].
In particolare se la funzione polinomiale associata a 𝑃 ∈ ℂ[𝑥] manda ℝ in ℝ allora 𝑃 è

un polinomio a coefficienti reali.
Dimostrazione. Consideriamo il polinomio:

𝑛
(𝑎 𝑘 − 𝑎¯ 𝑘 )𝑥 𝑘 .
X
𝑄=
𝑘=0
Allora per ogni 𝑥 ∈ 𝐴 si ha

𝑛 𝑛
𝑎𝑘 𝑥 𝑘 − 𝑎¯ 𝑘 𝑥 𝑘 = 𝑃(𝑥) − 𝑃(𝑥) = 𝑃(𝑥) − 𝑃(𝑥) = 0
X X
𝑄(𝑥) =
𝑘=0 𝑘=0
in quanto se 𝑥 ∈ ℝ risulta 𝑥 𝑘 = 𝑥¯ 𝑘 = 𝑥 𝑘 . Visto che 𝐴 è infinito, per il principio

di annullamento dei polinomi (teorema 4.11) deduciamo che 𝑄 = 0. Ma allora
tutti i coefficienti di 𝑄 devono essere nulli e cioè 𝑎¯ 𝑘 = 𝑎 𝑘 . Ne consegue che
𝑎 𝑘 ∈ ℝ per ogni 𝑘 = 0 , . . . , 𝑛 .
Rifacendoci alla fattorizzazione dei polinomi a coefficienti complessi possiamo

fattorizzare anche i polinomi a coefficienti reali se ci accontentiamo di avere
fattori quadratici invece che lineari.
Teorema 4.21 (fattorizzazione dei polinomi reali). Se 𝑃 ∈ ℝ[𝑥] è un polinomio a

coefficienti reali potremo scrivere
𝑛 𝑚
(𝑥 − 𝑥 𝑘 )𝑝 𝑘 · (𝑥 2 + 𝛼 𝑗 𝑥 + 𝛽 𝑗 )𝑞 𝑗
Y Y
𝑃=𝑎· (4.3)
𝑘=1 𝑗=1
dove 𝑎 ∈ ℝ, 𝑥 𝑘 ∈ ℝ, 𝑝 𝑘 ∈ ℕ \ {0}, 𝛼 𝑗 , 𝛽 𝑗 ∈ ℝ, 𝑞 𝑗 ∈ ℕ \ {0} con 𝛼 2𝑗 − 4𝛽 𝑗 < 0 e
𝑛
X 𝑚
X
𝑝𝑘 + 2 𝑞 𝑗 = deg 𝑃.
𝑘=1 𝑗=1
La fattorizzazione (4.3) è unica a meno dell’ordine dei fattori.
I numeri 𝑥 1 , . . . , 𝑥 𝑛 sono tutte le radici reali distinte del polinomio 𝑃 con rispettive
molteplicità 𝑝 1 , . . . , 𝑝 𝑛 mentre tutte le radici complesse (non reali) distinte saranno
𝜇1 , . . . , 𝜇𝑚 e 𝜇¯ 1 , . . . , 𝜇¯ 𝑚 con
𝑥 2 + 𝛼 𝑗 𝑥 + 𝛽 𝑗 = (𝑥 − 𝜇) · (𝑥 − 𝜇)
¯
da cui 2
𝛼 𝑗 = −2 Re 𝜇 𝑗 , 𝛽 𝑗 = 𝜇 𝑗
e 𝑞 𝑗 saranno le molteplicità delle radici 𝜇 𝑗 e 𝜇¯ 𝑗 .
Dimostrazione. Osserviamo innanzitutto che se 𝑃 è a coefficienti reali si ha
𝑃(𝑧) = 𝑃(¯𝑧 ), ∀𝑧 ∈ ℂ
dunque se 𝜇 è una radice di 𝑃 anche 𝜇¯ è una radice di 𝑃 . Ora se 𝜇 è una radice

non reale di 𝑃 sappiamo che in campo complesso 𝑃 risulta divisibile per 𝑥 − 𝜇
(teorema 4.10 di Ruffini):
𝑃 = (𝑥 − 𝜇) · 𝑃1 .
Ma anche 𝜇¯ è radice di 𝑃 ed essendo 𝜇¯ ≠ 𝜇 si dovrà avere
𝑃(𝜇)
¯
𝑄(𝜇)
¯ = =0
𝜇¯ − 𝜇
e dunque applicando nuovamente il teorema di Ruffini
𝑃 = (𝑥 − 𝜇) · (𝑥 − 𝜇)
¯ · 𝑃2 .
Ora osserviamo che
(𝑥 − 𝜇) · (𝑥 − 𝜇) ¯ + 𝜇𝜇¯ = 𝑥 2 − 2(Re 𝜇) · 𝑥 + |𝜇| 2

¯ = 𝑥 2 − (𝜇 + 𝜇)𝑥
è un polinomio a coefficienti reali e visto che 𝑃2 si ottiene dividendo 𝑃 per tale

polinomio, anche 𝑃2 è un polinomio a coefficienti reali.
Ripetendo lo stesso procedimento sul polinomio 𝑃2 potremo fattorizzare 𝑃

diminuendo il grado a passi di 2 finché non si esauriscono tutte le radici
complesse non reali accoppiandole a due a due. Dunque se 𝜇 è una radice
4.6 fattorizzazione dei polinomi 171
complessa del polinomio reale 𝑃 la molteplicità di 𝜇 è uguale alla molteplicità

di 𝜇¯ .
Dopodiché si potrà completare la fattorizzazione dividendo per i fattori lineari
𝑥 − 𝑥 𝑘 corrispondenti alle radici reali del polinomio 𝑃 . Si otterrà quindi la
fattorizzazione desiderata.
calcolo differenziale 5
5.1 derivata
Il potenziale gravitazionale generato dalla terra nello spazio, in un punto a

distanza 𝑟 dal suo centro è dato da:
𝐺𝑀
𝑈(𝑟) = −
𝑟
dove 𝑀 è la massa della terra e 𝐺 è la costante di gravitazione universale. La
funzione 𝑈(𝑟) non è affatto lineare. Se però consideriamo il campo gravita-
zionale per i punti in prossimità della superficie terrestre, ci aspettiamo un
comportamento approssimativamente lineare. Proviamo a esplicitare questa
idea.
Supponiamo di trovarci ad altezza ℎ dalla superficie terrestre. Ci troveremo

allora a distanza 𝑅 + ℎ dal centro della terra. Si avrà allora:
1
𝑈(𝑅 + ℎ) = −𝐺𝑀 .
𝑅+ℎ
Osserviamo ora che si ha
1 1 1 1 1 𝑅 − (𝑅 + ℎ)
= + − = +
𝑅+ℎ 𝑅 𝑅+ℎ 𝑅 𝑅 𝑅(𝑅 + ℎ)
1 ℎ
= −
𝑅 𝑅(𝑅 + ℎ)
1 ℎ ℎ ℎ
= − 2− +
𝑅 𝑅 𝑅(𝑅 + ℎ) 𝑅2
1 ℎ ℎ𝑅 − ℎ(𝑅 + ℎ)
= − 2−
𝑅 𝑅 𝑅 2 (𝑅 + ℎ)
ℎ 1 ℎ2
=− + + .
𝑅 2 𝑅 𝑅 2 (𝑅 + ℎ)
Dunque si avrà
𝐺𝑀 𝐺𝑀
𝑈(𝑅 + ℎ) = ℎ− + 𝜔(ℎ)
𝑅2 𝑅
= 𝑔 ℎ + 𝐶 + 𝜔(ℎ)
dove 𝑔 = 𝐺𝑀/𝑅 2 , 𝐶 è una costante (irrilevante perché il potenziale può

essere definito a meno di una costante) e 𝜔(ℎ) è una funzione con la proprietà
𝜔(ℎ)/ℎ → 0 per ℎ → 0. Dunque se ℎ è molto piccolo rispetto a 𝑅 , il termine
𝜔(ℎ) è trascurabile rispetto al termine 𝑔 ℎ (anche se entrambi tendono a zero
per ℎ → 0). Questo giustifica l’utilizzo della formula semplificata:
𝑈0 (ℎ) = 𝑔 ℎ
174 5 calcolo differenziale
Figura 5.1: Il grafico del potenziale gra-

vitazionale terrestre. Sull’asse delle 𝑥 la
distanza dal centro della terra in raggi
terrestri. Sull’asse delle 𝑦 il potenziale
gravitazionale con unità 𝐶 = 𝐺𝑀/𝑅 . La
pendenza della retta tangente al grafico
della curva per 𝑥 = 𝑅 è 𝑔 = 𝐺𝑀/𝑅 2 .
Nella figura di destra un ingrandimento
in un intorno del raggio terrestre: si nota
come il grafico del potenziale risulta qua-
si indistinguibile dal grafico della retta
tangente.
da cui l’energia potenziale 𝐸 = 𝑚 𝑔 ℎ se abbiamo una massa 𝑚 ad una altezza ℎ

sulla superficie terrestre.
linearizzazione Quello che abbiamo fatto è un procedimento di linearizzazione. Il campo

gravitazionale è descritto da una funzione non lineare: −𝐺𝑀/𝑟 . Ma quando
ci restringiamo a un piccolo intervallo di valori di 𝑟 (i valori di 𝑟 vicini ad 𝑅 ,
il raggio della terra) tale funzione risulta quasi indistinguibile, a meno di una
costante, dalla funzione lineare 𝑔 ℎ se 𝑟 = 𝑅 + ℎ . Le funzioni lineari sono molto
più semplici da trattare ed è quindi conveniente, se rimaniamo sulla superficie
terrestre, utilizzare quest’ultima formula per il potenziale gravitazionale. Il
grafico della funzione lineare che meglio approssima il grafico di una funzione
retta tangente si chiama retta tangente. Il suo coefficiente angolare, 𝑔 nel nostro esempio, si
chiama derivata.
derivata
Una volta introdotte le derivate vedremo che quello che abbiamo determinato è
la formula:
𝑈(𝑅 + ℎ) = 𝑈(𝑅) + 𝑈 0(𝑅)ℎ + 𝜔(ℎ).
Definizione 5.1 (derivata). Sia 𝐴 ⊆ ℝ, 𝑓 : 𝐴 → ℝ, 𝑥 0 un punto di accumulazione

di 𝐴. Diremo che la funzione 𝑓 è derivabile nel punto 𝑥 0 se esiste ed è finito il limite:
𝑓 (𝑥0 + ℎ) − 𝑓 (𝑥0 )
lim .
ℎ→0 ℎ
derivata In tal caso denoteremo con 𝑓 0(𝑥 0 ) il valore di tale limite che chiameremo derivata della
funzione 𝑓 nel punto 𝑥 0 .
Se 𝐵 è l’insieme dei punti di accumulazione di 𝐴 in cui 𝑓 risulta essere derivabile,

risulta quindi definita la funzione derivata 𝑓 0 : 𝐵 → ℝ.
Una funzione 𝑓 si dice essere derivabile se è derivabile in ogni punto del suo dominio.
Se 𝐶 ⊆ 𝐴 la funzione 𝑓 si dice essere derivabile su 𝐶 se è derivabile in ogni punto
dell’insieme 𝐶 (cioè se 𝐶 ⊆ 𝐵).
Notazioni alternative per denotare la derivata di una funzione:
𝑑 𝑑𝑓
𝑓0 = 𝐷𝑓 = 𝑓 = .
𝑑𝑥 𝑑𝑥
Il rapporto
𝑓 (𝑥0 + ℎ) − 𝑓 (𝑥 0 )
rapporto incrementale ℎ
5.1 derivata 175
si chiama rapporto incrementale. In effetti cambiando variabile e ponendo

𝑥 = 𝑥0 + ℎ si può scrivere
𝑓 (𝑥 0 + ℎ) − 𝑓 (𝑥0 ) 𝑓 (𝑥) − 𝑓 (𝑥 0 ) Δ 𝑓
= =
ℎ 𝑥 − 𝑥0 Δ𝑥
che risulta essere il rapporto dell’incremento della funzione 𝑓 (a volte denotato

con Δ 𝑓 ) rispetto all’incremento corrispondente della variabile 𝑥 (a volte denotato
con Δ𝑥 ). Cambiando variabile nel limite, per ℎ → 0 si avrà 𝑥 → 𝑥 0 e quindi
𝑓 (𝑥) − 𝑓 (𝑥 0 )
𝑓 0(𝑥0 ) = lim .
𝑥→𝑥 0 𝑥 − 𝑥0
Esempio 5.2. Si consideri la funzione 𝑓 (𝑥) = 1/𝑥 definita sull’insieme 𝐴 = ℝ \ {0}.

Si ha allora per ogni 𝑥 ≠ 0:
1 1
𝑥+ℎ − 𝑥 𝑥 − (𝑥 + ℎ) −1 1
𝑓 0(𝑥) = lim = lim = lim = − 2.
ℎ→0 ℎ ℎ→0 ℎ(𝑥 + ℎ)𝑥 ℎ→0 (𝑥 + ℎ)𝑥 𝑥
Risulta quindi che la funzione 1/𝑥 sia derivabile e la sua derivata è la funzione −1/𝑥 2 .
Teorema 5.3 (continuità delle funzioni derivabili). Se 𝑓 è derivabile nel punto 𝑥

allora 𝑓 è anche continua nel punto 𝑥 .
Dimostrazione. Si ha
𝑓 (𝑥 + ℎ) − 𝑓 (𝑥)
lim 𝑓 (𝑥 + ℎ) − 𝑓 (𝑥) = lim · ℎ = 𝑓 0(𝑥) · 0 = 0.
ℎ→0 ℎ→0 ℎ
Dunque 𝑓 (𝑥 + ℎ) → 𝑓 (𝑥) per ℎ → 0 e quindi 𝑓 è continua nel punto 𝑥 .
Esempio 5.4 (funzione continua ma non derivabile). La funzione 𝑓 (𝑥) = |𝑥| è un

esempio di funzione continua ma non derivabile. E’ infatti facile verificare che nel punto
𝑥0 = 0 il limite destro del rapporto incrementale è 1 mentre il limite sinistro è −1.
√
Un altro esempio è la funzione 𝑓 (𝑥) = 𝑥 che è continua ma non è derivabile nel punto
𝑥0 = 0 perché il limite del rapporto incrementale esiste ma è +∞.
Teorema 5.5 (derivata della funzione composta). Sia 𝑓 una funzione derivabile nel
punto 𝑥 0 e sia 𝑔 una funzione derivabile nel punto 𝑓 (𝑥 0 ). Allora la funzione composta
𝑔 ◦ 𝑓 è derivabile nel punto 𝑥0 e si ha:
(𝑔 ◦ 𝑓 )0(𝑥 0 ) = 𝑔 0( 𝑓 (𝑥0 )) · 𝑓 0(𝑥0 ).
Dimostrazione. Consideriamo la funzione

( 𝑔(𝑦)−𝑔( 𝑓 (𝑥
0 ))
𝑦− 𝑓 (𝑥0 )
se 𝑦 ≠ 𝑓 (𝑥 0 ),
𝐺(𝑦) =
𝑔 0( 𝑓 (𝑥 0 )) se 𝑦 = 𝑓 (𝑥 0 ).
Si avrà allora
𝑔( 𝑓 (𝑥0 + ℎ)) − 𝑔( 𝑓 (𝑥 0 )) 𝑓 (𝑥 0 + ℎ) − 𝑓 (𝑥0 )

= 𝐺( 𝑓 (𝑥0 + ℎ)) · (5.1)
ℎ ℎ
infatti se 𝑓 (𝑥 0 + ℎ) ≠ 𝑓 (𝑥 0 ) abbiamo moltiplicato e diviso per 𝑓 (𝑥 0 + ℎ) − 𝑓 (𝑥 0 )

se invece 𝑓 (𝑥 0 + ℎ) = 𝑓 (𝑥 0 ) allora anche 𝑔( 𝑓 (𝑥 0 + ℎ)) = 𝑔( 𝑓 (𝑥 0 )) e l’uguaglianza
è ancora valida perché sia il lato sinistro che il lato destro si annullano (e il
valore assegnato a 𝐺 risulta in tal caso irrilevante).
Chiaramente quando ℎ → 0 il secondo fattore sul lato destro dell’uguaglianza

(5.1) tende, per definizione, a 𝑓 0(𝑥 0 ). Per quanto riguarda il primo fattore
osserviamo che 𝐺(𝑦), per come è stata definita, risulta essere una funzione
continua nel punto 𝑦 = 𝑓 (𝑥 0 ) in quanto
𝑔(𝑦) − 𝑔( 𝑓 (𝑥 0 ))
→ 𝑔 0( 𝑓 (𝑥0 ))
𝑦 − 𝑓 (𝑥0 )
per 𝑦 → 𝑓 (𝑥 0 ). Ma anche la funzione 𝑓 è continua nel punto 𝑥 0 (in quanto

derivabile). Dunque la funzione composta 𝐺( 𝑓 (𝑥 0 + ℎ)) è continua nel punto
ℎ = 0. Risulta quindi che 𝐺( 𝑓 (𝑥0 + ℎ)) → 𝐺( 𝑓 (𝑥0 )) = 𝑔 0( 𝑓 (𝑥0 )) per ℎ → 0.
Dunque il lato destro di (5.1) ha limite 𝑔 0( 𝑓 (𝑥 0 )) · 𝑓 0(𝑥 0 ) per ℎ → 0, come
volevamo dimostrare.
Teorema 5.6 (derivata della funzione inversa). Sia 𝑓 una funzione invertibile
derivabile in un punto 𝑥 0 e supponiamo che la funzione inversa 𝑓 −1 sia continua in
𝑓 (𝑥 0 ). Se 𝑓 0(𝑥0 ) ≠ 0 allora 𝑓 −1 è derivabile in 𝑓 (𝑥0 ) e vale:
1
( 𝑓 −1 )0( 𝑓 (𝑥0 )) = .
𝑓 0(𝑥 0)
Chiamato 𝑦0 = 𝑓 (𝑥 0 ) la formula può essere anche scritta nella forma:
1
( 𝑓 −1 )0(𝑦0 ) = .
𝑓 0( 𝑓 −1 (𝑦 0 ))
Se invece 𝑓 0(𝑥 0 ) = 0 la funzione 𝑓 −1 non è derivabile in 𝑓 (𝑥 0 ).
Osserviamo che se 𝑓 è definita in un intervallo e se è invertibile e continua in

tutto l’intervallo allora certamente l’inversa è continua (Esercizio 2.83).
Dimostrazione. Posto 𝑦0 = 𝑓 (𝑥 0 ) consideriamo il rapporto incrementale di 𝑓 −1

nel punto 𝑦0 :
𝑓 −1 (𝑦) − 𝑓 −1 (𝑦0 )
.
𝑦 − 𝑦0
Per 𝑦 → 𝑦0 possiamo fare il cambio di variabile 𝑥 = 𝑓 −1 (𝑦) in quanto avendo
assunto che 𝑓 −1 sia continua in 𝑓 (𝑥 0 ) sappiamo che se 𝑦 → 𝑦0 allora 𝑥 =
𝑓 −1 (𝑦) → 𝑓 −1 (𝑦0 ) = 𝑥 0 . Si ha allora per 𝑦 → 𝑦0 che 𝑥 → 𝑥0 e, se 𝑓 0(𝑥0 ) ≠ 0:
𝑓 −1 (𝑦) − 𝑓 −1 (𝑦0 ) 𝑥 − 𝑥0 1 1
= = → .
𝑦 − 𝑦0 𝑓 (𝑥) − 𝑓 (𝑥0 ) 𝑓 (𝑥)− 𝑓 (𝑥0 ) 𝑓 0(𝑥 0)
𝑥−𝑥 0
Se invece 𝑓 0(𝑥 0 ) = 0 il rapporto incrementale della funzione inversa ha limite

infinito e quindi la funzione inversa non è derivabile in 𝑓 (𝑥 0 ).
5.1 derivata 177
Teorema 5.7 (operazioni con le derivate). Siano 𝑓 e 𝑔 due funzioni derivabili in

uno stesso punto 𝑥 0 . Allora le funzioni 𝑓 + 𝑔 , 𝑓 − 𝑔 , 𝑓 · 𝑔 e, se 𝑔(𝑥 0 ) ≠ 0 anche 𝑓 /𝑔
sono funzioni derivabili in 𝑥 0 . Nei punti in cui entrambe le funzioni sono derivabili si
ha
( 𝑓 + 𝑔)0 = 𝑓 0 + 𝑔 0 , ( 𝑓 − 𝑔)0 = 𝑓 0 − 𝑔 0 ,
0
0 0 0 𝑓 𝑓 0 𝑔 − 𝑓 𝑔0
( 𝑓 · 𝑔) = 𝑓 · 𝑔 + 𝑓 𝑔 , = .
𝑔 𝑔2
Dimostrazione. Per quanto riguarda la derivata della somma (o della differenza)

è sufficiente osservare che il rapporto incrementale della somma (o della
differenza) è la somma (o la differenza) dei rapporti incrementali e che il limite
della somma (o della differenza) è uguale alla somma (o la differenza) dei limiti.
Calcoliamo la derivata del prodotto 𝑓 · 𝑔 nel punto 𝑥 0 . Si ha
𝑓 (𝑥)𝑔(𝑥) − 𝑓 (𝑥0 )𝑔(𝑥 0 ) 𝑓 (𝑥)(𝑔(𝑥) − 𝑔(𝑥0 )) + ( 𝑓 (𝑥) − 𝑓 (𝑥0 ))𝑔(𝑥 0 )

=
𝑥 − 𝑥0 𝑥 − 𝑥0
𝑔(𝑥) − 𝑔(𝑥0 ) 𝑓 (𝑥) − 𝑓 (𝑥0 )
= 𝑓 (𝑥) + 𝑔(𝑥0 ).
𝑥 − 𝑥0 𝑥 − 𝑥0
Passando al limite per 𝑥 → 𝑥 0 ci ricordiamo che 𝑓 (𝑥) → 𝑓 (𝑥 0 ) in quanto 𝑓 è

continua in 𝑥 0 (essendo per ipotesi derivabile). I rapporti incrementali tendono
alle derivate e si ottiene quindi il risultato voluto 𝑓 (𝑥 0 )𝑔 0(𝑥 0 ) + 𝑓 0(𝑥 0 )𝑔(𝑥 0 ).
Per quanto riguarda la derivata del rapporto osserviamo che posto ℎ(𝑦) = 1/𝑦
si ha
𝑓 (𝑥)
= 𝑓 (𝑥) · ℎ(𝑔(𝑥)).
𝑔(𝑥)
Dall’esercizio già svolto sappiamo che ℎ 0(𝑦) = −1/𝑦 2 e dunque possiamo
utilizzare le formule per la derivata del prodotto e la derivata della funzione
composta per ottenere:
0
𝑓
(𝑥0 ) = ( 𝑓 · (𝑔 ◦ ℎ))0(𝑥 0 )
𝑔
= 𝑓 0(𝑥 0 ) · ℎ(𝑔(𝑥0 )) + 𝑓 (𝑥0 ) · ℎ 0(𝑔(𝑥0 )) · 𝑔 0(𝑥0 )
𝑓 0(𝑥0 ) −1 0
= + 𝑓 (𝑥0 ) · 2 𝑔 (𝑥0 )
𝑔(𝑥0 ) 𝑔 (𝑥0 )
𝑓 0(𝑥0 )𝑔(𝑥0 ) − 𝑓 (𝑥0 )𝑔 0(𝑥0 )
= .
𝑔 2 (𝑥0 )
Teorema 5.8 (derivate delle funzioni elementari). Per 𝑚, 𝑞, 𝛼 ∈ ℝ, 𝛼 ≠ 0, 𝑛 ∈ ℕ ,

𝑛 ≠ 0 valgono le regole di derivazione riassunte nella tabella 5.1: le funzioni nella
colonna 𝑓 (𝑥) hanno la derivata riportata nella colonna 𝑓 0(𝑥). Le funzioni 𝑓 (𝑥) sono
derivabili nei punti in cui la corrispondente espressione 𝑓 0(𝑥) è ben definita. In
√
particolare: la funzione 𝑛 𝑥 non è derivabile in 𝑥 = 0, le funzioni arcsin 𝑥 e arccos 𝑥
non sono derivabili nei punti −1 e 1, la funzione |𝑥| non è derivabile in 0, la funzione
Tabella 5.1: Derivate delle funzioni ele- 𝑓 (𝑥) 𝑓 0(𝑥) 𝑓 (𝑥) 𝑓 0(𝑥) 𝑓 (𝑥) 𝑓 0(𝑥)
mentari
𝑚𝑥 + 𝑞 𝑚 𝑒𝑥 𝑒𝑥 sin 𝑥 cos 𝑥
𝑥
|𝑥| |𝑥|
ln 𝑥 1
𝑥 cos 𝑥 − sin 𝑥
𝑥𝑛 𝑛𝑥 𝑛−1 sinh 𝑥 cosh 𝑥 arcsin 𝑥 √ 1
1−𝑥 2
𝑥𝛼 𝛼𝑥 𝛼−1 cosh 𝑥 sinh 𝑥 arccos 𝑥 −√ 1 2
√ 1−𝑥
𝑛
𝑥 √
𝑛
1
settsinh 𝑥 √ 1 tg 𝑥 1 + tg2 𝑥
√ 𝑛 𝑥 𝑛−1 𝑥 2 +1
𝑥 1
√
2 𝑥
settcosh 𝑥 √ 1 arctg 𝑥 1
1+𝑥 2
𝑥 2 −1
settcosh 𝑥 non è derivabile in 1. Le funzioni lineari, potenze con base positiva, potenze
con esponente intero, esponenziale, logaritmo, seno, coseno, tangente, arcotangente sono
invece derivabili in tutti i punti in cui sono definite.
Dimostrazione. Per quanto riguarda le funzioni lineari si ha:
𝑚(𝑥 + ℎ) + 𝑞 − (𝑚𝑥 + 𝑞)
(𝑚𝑥 + 𝑞)0 = lim = lim 𝑚 = 𝑚.
ℎ→0 ℎ ℎ→0
Ricordando che la derivata è un limite e che il limite in un punto dipende solo

dai valori della funzione in un intorno del punto, possiamo affermare che la
derivata del valore assoluto |𝑥| coincide con la derivata di 𝑥 cioè 1 sugli 𝑥 > 0
e coincide con la derivata di −𝑥 sugli 𝑥 < 0. Dunque 𝐷|𝑥| = 𝑥/|𝑥| se 𝑥 ≠ 0.
Se 𝑥 = 0 i limiti destro e sinistro del rapporto incrementale di |𝑥| tendono
rispettivamente a 1 e −1 e quindi la derivata non esiste.
Dimostriamo che 𝐷𝑥 𝑛 = 𝑛𝐷𝑥 𝑛−1 per 𝑛 ∈ ℕ , 𝑛 > 0, per induzione su 𝑛 .

Per 𝑛 = 1 abbiamo 𝑥 𝑛 = 𝑥 1 è lineare e quindi dalla formula precedente
𝐷𝑥 1 = 1 = 1 · 𝑥 0 . Supponendo di sapere che 𝐷𝑥 𝑛 = 𝑛𝑥 𝑛−1 si ha, applicando la
regola di derivazione del prodotto:
𝐷𝑥 𝑛+1 = 𝐷𝑥 · 𝑥 𝑛 = 1 · 𝑥 𝑛 + 𝑥 · 𝑛𝑥 𝑛−1 = 𝑥 𝑛 + 𝑛𝑥 𝑛 = (𝑛 + 1)𝑥 𝑛
dimostrando dunque il passo induttivo. Ricordando la formula di derivazione

del rapporto possiamo trovare la formula per le potenze con esponente intero
negativo:
1 −𝑛𝑥 𝑛−1
𝐷𝑥 −𝑛 = 𝐷 𝑛 = = −𝑛𝑥 𝑛−1−2𝑛 = −𝑛𝑥 −𝑛−1 .
𝑥 𝑥 2𝑛
La derivata della radice 𝑛 -esima si trova con la formula di derivazione della

funzione inversa 𝑥 𝑛 , che può essere applicata se 𝑥 ≠ 0:
√ 1 1
𝐷 𝑛𝑥 = √ = √ .
𝑛( 𝑛 𝑥)𝑛−1 𝑛
𝑛 𝑥 𝑛−1
Osserviamo che se 𝑛 è dispari la formula è valida anche per 𝑥 < 0. La derivata
della radice quadrata si ottiene ponendo 𝑛 = 2.
Per quanto riguarda la derivata dell’esponenziale ci riconduciamo ad un limite

notevole:
𝑒 𝑥+ℎ − 𝑒 𝑥 𝑒𝑥𝑒ℎ − 𝑒𝑥 𝑒ℎ − 1
𝐷𝑒 𝑥 = lim = lim = lim 𝑒 𝑥 = 𝑒𝑥.
ℎ→0 ℎ ℎ→0 ℎ ℎ→0 ℎ
5.1 derivata 179
La derivata del logaritmo si ottiene come derivata della funzione inversa

dell’esponenziale:
1 1
𝐷 ln 𝑥 = ln 𝑥 = .
𝑒 𝑥
Possiamo quindi calcolare la derivata delle potenze con base positiva e esponente
reale qualunque:
1
𝐷𝑥 𝛼 = 𝐷𝑒 𝛼 ln 𝑥 = 𝑒 𝛼 ln 𝑥 𝐷(𝛼 ln 𝑥) = 𝑥 𝛼 𝛼 = 𝛼𝑥 𝛼−1 .
𝑥
Per quanto riguarda le funzioni trigonometriche sin e cos ci ricordiamo dei

limiti notevoli:
sin ℎ 1 − cos ℎ 1 − cos ℎ 1
lim = 1, lim = lim ℎ · = 0 · = 0.
ℎ→0 ℎ ℎ→0 ℎ ℎ→0 ℎ2 2
Applicando le formule di addizione si ha
sin(𝑥 + ℎ) − sin(𝑥)
𝐷 sin 𝑥 = lim
ℎ→0 ℎ
sin(𝑥) cos(ℎ) + cos(𝑥) sin(ℎ) − sin(𝑥)
= lim
ℎ→0 ℎ
cos ℎ − 1 sin ℎ
= lim sin(𝑥) + cos(𝑥) = cos(𝑥).
ℎ→0 ℎ ℎ
e similmente
cos(𝑥 + ℎ) − cos(𝑥)
𝐷 cos 𝑥 = lim
ℎ→0 ℎ
cos(𝑥) cos(ℎ) − sin(𝑥) sin(ℎ) − cos(𝑥)
= lim
ℎ→0 ℎ
cos ℎ − 1 sin ℎ
= lim cos(𝑥) − sin(𝑥) = − sin(𝑥)
ℎ→0 ℎ ℎ
La funzioni arcsin è definita come l’inversa della restrizione della funzione sin
all’intervallo [−𝜋/2 , 𝜋/2]. Nell’intervallo aperto (−𝜋/2 , 𝜋/2) la funzione sin ha
derivata positiva e dunque risulta che la funzione inversa (che sappiamo essere
continua) è derivabile in (−1 , 1) e la sua derivata è
1 1 1
𝐷 arcsin 𝑥 = =√ =√ .
cos(arcsin 𝑥) 1 − sin arcsin 𝑥
2 1 − 𝑥2
q
Si ha infatti cos 𝑦 = 1 − sin2 𝑦 se 𝑦 ∈ [−𝜋/2 , 𝜋/2].
Analogamente la funzione arccos è definita come l’inversa della restrizione di

cos all’intervallo [0 , 𝜋] e si ha quindi, per 𝑥 ∈ (−1 , 1)
1 1 1
𝐷 arccos 𝑥 = = √ = −√ .
− sin(arccos 𝑥) − 1 − cos2 arccos 𝑥 1 − 𝑥2
Si ha infatti sin 𝑦 =
p
1 − cos2 𝑦 se 𝑦 ∈ [0 , 𝜋].
Nei punti 𝑥 = 1 e 𝑥 = −1 le funzioni arcsin e arccos non sono invece derivabili.

Per la funzione tangente possiamo utilizzare la formula di derivazione del

rapporto:
sin 𝑥 cos 𝑥 · cos 𝑥 − sin 𝑥 · (− sin 𝑥)

𝐷 tg 𝑥 = 𝐷 =
cos 𝑥 cos2 𝑥
cos 𝑥 + sin 𝑥
2 2
1
= = 1 + tg2 𝑥 = .
cos2 𝑥 cos2 𝑥
Usando la formula della derivata della funzione inversa si ha
1 1
𝐷 arctg 𝑥 = = .
1 + tg2 (arctg 𝑥) 1 + 𝑥2
Per quanto riguarda le funzioni iperboliche le derivate di sinh e cosh si ri-

conducono immediatamente alla derivata dell’esponenziale, utilizzando la
definizione (3.19). Le derivate delle funzioni inverse settsinh e settcosh si ot-
tengono dalla formula per la derivata della funzione inversa e utilizzando le
p p
relazioni cosh 𝑥 = sinh2 𝑥 + 1 e, per 𝑥 > 0, sinh 𝑥 = cosh2 𝑥 − 1:
1 1 1
𝐷 settsinh 𝑥 = =p =√
cosh(settsinh 𝑥) sinh2 (settsinh 𝑥) + 1 𝑥2 + 1
1 1 1
𝐷 settcosh 𝑥 = =p =√
sinh(settcosh 𝑥) cosh (settcosh 𝑥) − 1
2 𝑥 −1
2
Proposizione 5.9 (trucco di Feynman per le derivate). Siano 𝑓1 , . . . , 𝑓𝑛 funzioni

derivabili e siano 𝛼 1 , . . . , 𝛼 𝑛 esponenti reali. Allora:
!0
𝑛
Y 𝛼
𝑛
Y 𝑛
X 𝑓 𝑘0
𝑓𝑘 𝑘 = 𝑓𝑘 · 𝛼𝑘 .
𝑘=1 𝑘=1 𝑘=1
𝑓𝑘
Dimostrazione. Basta osservare che

!
𝑛
Y 𝛼
𝑛
X 𝛼 𝑘 −1
Y 𝛼𝑗
𝑛
X 𝑓 𝑘0 Y
𝑛
𝛼𝑗
𝑓𝑘 𝑘 = 𝛼 𝑘 𝑓 𝑘0 𝑓 𝑘 𝑓𝑗 = 𝛼𝑘 𝑓𝑗 .
𝑘=1 𝑘=1 𝑗≠𝑘 𝑘=1
𝑓𝑘 𝑗=1
Se ad esempio vogliamo calcolare la derivata della funzione

√
1 − 𝑥 2 · ln 𝑥 1
= (1 − 𝑥 2 ) 2 · ln 𝑥 · 𝑥 −1 · (cos 𝑥)−2
𝑥 · cos 𝑥
2
otteniamo
√
1 − 𝑥 2 · ln 𝑥 1 −2 𝑥 − sin 𝑥

1 1
· · + − −2 .
𝑥 · sin2 𝑥 2 1 − 𝑥 2 𝑥 ln 𝑥 𝑥 cos 𝑥
5.2 derivate parziali 181
5.2 derivate parziali
Capita a volte di avere funzioni che dipendono da più variabili o da parametri.

Ad esempio la funzione 𝑓 (𝑥, 𝑦) = 𝑥 2 𝑦 + 𝑦 2 è una funzione definita sulle coppie
di numeri reali: 𝑓 : ℝ2 → ℝ. Se considero una delle due variabili, ad esempio
la prima variabile 𝑥 , come un parametro fissato, posso identificare la funzione 𝑓
come una funzione 𝑔 : ℝ → (ℝℝ ) che ad ogni valore del parametro 𝑥 restituisce
una funzione della variabile 𝑦 :
𝑔(𝑥)(𝑦) = 𝑓 (𝑥, 𝑦).
Dunque per ogni 𝑥 fissato, posso considerare la funzione ℎ = 𝑔(𝑥) che è una
funzione della sola variabile 𝑦 : ℎ(𝑦) = 𝑔(𝑥)(𝑦) = 𝑓 (𝑥, 𝑦). E posso quindi farne
la derivata ℎ 0(𝑦) in qualunque punto 𝑦 . Il valore che ottengo si chiama derivata
parziale della funzione 𝑓 rispetto alla variabile 𝑦 calcolata nel punto (𝑥, 𝑦). Per derivata parziale
fare il calcolo della derivata possiamo applicare le usuali regole di derivazione
facendo attenzione che se stiamo facendo la derivata rispetto a 𝑦 la variabile 𝑥
va trattata come se fosse costante, perché stiamo in effetti fissando 𝑥 prima di
fare la derivata. Se 𝑓 (𝑥, 𝑦) = 𝑥 2 𝑦 + 𝑦 2 si ottiene dunque: ℎ 0(𝑦) = 𝑥 2 + 2 𝑦 . Se ora Se non siamo abituati a pensare che 𝑥
possa essere un valore fissato si provi a
consideriamo anche 𝑥 variabile otteniamo una nuova funzione di due variabili sostituire la variabile 𝑥 con una lettera
(𝑥, 𝑦) ↦→ 𝑔(𝑥)0(𝑦) = ℎ 0(𝑦) che può essere scritta cone le seguenti notazioni: diversa come 𝑐 o 𝜋 che ci dà l’idea di
una quantità costante.
𝜕 𝑓 (𝑥, 𝑦) 𝜕 𝑓 Si osservi che per le funzioni di più va-
= (𝑥, 𝑦) = 𝐷 𝑦 𝑓 (𝑥, 𝑦) = 𝑓 𝑦 (𝑥, 𝑦)
𝜕𝑦 𝜕𝑦 riabili c’è una ambiguità di fondo nelle
notazioni. Infatti se ho una espressione
= 𝐷2 𝑓 (𝑥, 𝑦) = 𝑓,2 (𝑥, 𝑦) in due variabili come 𝑥 2 𝑦 + 𝑦 2 è chiaro
= ℎ 0(𝑦) che questa rappresenta una funzione di
due variabili ma non è del tutto ovvio di-
re quale è la prima variabile e quale è la
seconda. Normalmente le variabili ven-
Analogamente potremmo fare la derivata parziale di 𝑓 rispetto alla prima
gono indicate in ordine alfabetico a par-
variabile 𝑥 . Se 𝑓 (𝑥, 𝑦) = 𝑥 2 𝑦 + 𝑦 2 si ottiene tire dalla 𝑥 ... ma è solo una convenzione.
In principio l’espressione 𝑥 2 𝑦 + 𝑦 2 po-
𝜕 𝑓 (𝑥, 𝑦) trebbe anche rappresentare una funzio-
= 2 𝑥 𝑦. ne di tre variabili 𝑥, 𝑦, 𝑧 . Dunque se ho
𝜕𝑥
una espressione che utilizza certi nomi
per le variabili è naturale usare gli stessi
Stiamo qui trattando le funzioni di più variabili come se fossero funzioni di nomi nel simbolo utilizzato per la deri-
una sola variabile dipendenti da altri parametri. Questo perché stiamo facendo vata parziale come nella notazione 𝐷 𝑦 .
Se invece le variabili non hanno un nome
un corso di analisi sulle funzioni di una variabile (reale). Per trattare tutte sarebbe più sensato indicare la variabile
le variabili come una unica variabile multidimensionale bisogna fare diverse dandone la posizione numerica come
considerazioni aggiuntive che vengono trattate nei corsi di analisi sulle funzioni nella notazione 𝐷2 . Ci sono casi in cui
di più variabili (reali). Verranno in tal caso introdotti i concetti di gradiente ∇ 𝑓 , la notazione può essere molto ambigua,
𝜕 𝑓 (𝑦,𝑥)
derivata 𝐷 𝑓 e differenziale 𝑑 𝑓 che noi non affronteremo qui. come ad esempio se scrivessi 𝜕𝑦
: sto
derivando 𝑓 rispetto alla prima varia-
bile oppure derivo 𝑓 (𝑥, 𝑦) rispetto alla
seconda variabile e poi scambio le due
variabili?
5.3 punti notevoli
In questa sezione introdurremo una terminologia che è largamente utilizzata

nello studio di funzione. Cercheremo di dare delle definizioni anche per alcuni
termini su cui potrebbe non esserci un consenso univoco. Ricordiamoci di non
usare queste definizioni in modo troppo formale: sarà sempre meglio verificare
che il nostro interlocutore ci comprenda perché spesso alcuni termini potrebbero

essere utilizzati in maniera impropria o con significati leggermente diversi.
Nel dubbio potremo sempre evitare di utilizzare questa terminologia ricondu-

cendoci ai concetti sottostanti.
Definizione 5.10 (punti notevoli). Sia 𝑓 : 𝐴 ⊆ ℝ → ℝ una funzione. Se 𝑓 è

punto critico
derivabile in un punto 𝑥 0 ∈ 𝐴 e 𝑓 0(𝑥 0 ) = 0 diremo che 𝑥 0 è un punto critico o punto
stazionario di 𝑓 .
Se 𝑥 0 ∈ 𝐴 ed esiste un intorno 𝑈 di 𝑥 0 per cui 𝑥 0 risulta essere un punto di minimo

(rispettivamente di massimo) per 𝑓 ristretta ad 𝑈 diremo che 𝑥 0 è un punto di minimo
minimo relativo
relativo o minimo locale (rispettivamente massimo relativo o massimo locale). Per
contrapposizione i punti di massimo e minimo su tutto il dominio 𝐴 vengono anche
chiamati massimo/minimo assoluto di 𝑓 .
punto di flesso
Diremo che 𝑥 0 ∈ 𝐴 è un punto di flesso per 𝑓 se 𝑓 è derivabile in un intorno di 𝑥 0
e 𝑥 0 è un punto di massimo o minimo relativo per 𝑓 0. Nel punto 𝑥 0 la retta tangente
ha equazione 𝑦 = 𝑟(𝑥) = 𝑓 0(𝑥 0 )(𝑥 − 𝑥 0 ) + 𝑓 (𝑥 0 ). Se 𝑥 0 è minimo per 𝑓 0 risulta che
𝑓 (𝑥) − 𝑟(𝑥) è crescente quindi 𝑓 (𝑥) ≥ 𝑟(𝑥) per 𝑥 ≥ 𝑥0 e 𝑓 (𝑥) ≤ 𝑟(𝑥) per 𝑥 ≤ 𝑥 0
(il grafico della funzione attraversa la retta tangente da sotto a sopra) mentre se 𝑥 0 è
massimo per 𝑓 0 risulta che 𝑓 (𝑥) ≤ 𝑟(𝑥) per 𝑥 ≥ 𝑥 0 e 𝑓 (𝑥) ≥ 𝑟(𝑥) per 𝑥 ≤ 𝑥 0 (il
grafico della funzione attraversa la tangente da sopra a sotto). Se la funzione 𝑓 non è
flesso verticale derivabile in 𝑥 0 ma il limite del rapporto incrementale esiste ed è infinito, diremo che
𝑥0 è un flesso verticale. In tale punto la retta tangente è verticale e il grafico della
funzione attraversa tale retta.
Sia 𝑥 0 ∈ 𝐴 un punto in cui la funzione 𝑓 è continua ed esistono i limiti destro e sinistro

del rapporto incrementale (che si chiamano derivata destra e derivata sinistra)
𝑓 (𝑥 + ℎ) − 𝑓 (𝑥)
𝑚 ± = lim± .
ℎ→0 ℎ
punto angoloso Se 𝑚 + ≠ 𝑚 − chiaramente 𝑓 non è derivabile in 𝑥 0 . Se entrambi 𝑚 + ed 𝑚 − sono finiti
diremo che 𝑥 0 è un punto angoloso in quanto le due semirette tangenti in 𝑥 0 (da
punto di cuspide destra e da sinistra) formano un angolo non piatto. Se 𝑚 + = −𝑚 − = +∞ oppure se
𝑚 + = −𝑚 − = −∞ diremo che il punto 𝑥0 è un punto di cuspide (c’è una semiretta
tangente verticale).
Definizione 5.11 (asintoti). Diremo che la retta 𝑦 = 𝑚𝑥 + 𝑞 è un asintoto per il

grafico di 𝑓 per 𝑥 → +∞ se risulta
lim 𝑓 (𝑥) − (𝑚𝑥 + 𝑞) = 0.

asintoto orizzontale e obliquo 𝑥→+∞
Se 𝑚 = 0 diremo che il grafico di 𝑓 ha un asintoto orizzontale 𝑦 = 𝑞 altrimenti

diremo che 𝑦 = 𝑚𝑥 + 𝑞 è un asintoto obliquo. Stessa cosa si può dire per 𝑥 → −∞.
Se 𝑥 0 ∈ ℝ e si ha
asintoto verticale lim | 𝑓 (𝑥)| = +∞
𝑥→𝑥0
diremo che la retta 𝑥 = 𝑥 0 è un asintoto verticale per il grafico della funzione 𝑓 .

5.4 criteri di monotonia 183
Definizione 5.12 (punti di discontinuità). Se per 𝑥 0 ∈ ℝ si ha
lim 𝑓 (𝑥) = ℓ 1 , lim 𝑓 (𝑥) = ℓ 2

𝑥→𝑥 0− 𝑥→𝑥 0+
e se ℓ 1 ≠ ℓ 2 diremo che nel punto 𝑥 0 la funzione 𝑓 ha una discontinuità a salto. Se discontinuità a salto
ℓ1 = ℓ2 e se 𝑓 non è definita nel punto 𝑥 0 oppure se 𝑓 (𝑥0 ) ≠ ℓ1 diremo che nel punto 𝑥0
la funzione 𝑓 ha una discontinuità eliminabile. discontinuità eliminabile
Si osservi che, nonostante la terminologia utilizzata, una funzione continua può

𝑥
avere una discontinuità a salto (ad esempio: 𝑓 (𝑥) = |𝑥| ) e può anche avere una
discontinuità eliminabile (ad esempio: 𝑓 (𝑥) = 𝑥𝑥 ).
5.4 criteri di monotonia
Teorema 5.13 (Fermat). Sia 𝑓 : (𝑎, 𝑏) → ℝ una funzione derivabile. Se 𝑥 0 ∈ (𝑎, 𝑏)

è un punto di massimo o minimo per 𝑓 allora 𝑓 0(𝑥 0 ) = 0.
Dimostrazione. Senza perdere di generalità possiamo suppore che 𝑥 0 sia un

punto di massimo per 𝑓 . Sappiamo che
𝑓 (𝑥) − 𝑓 (𝑥 0 )
𝑓 0(𝑥0 ) = lim .
𝑥→𝑥 0 𝑥 − 𝑥0
Visto che 𝑥 0 è un punto dell’intervallo aperto (𝑎, 𝑏) la funzione 𝑓 è definita in

un intorno destro di 𝑥 0 e quindi possiamo restingere il limite ai valori 𝑥 > 𝑥 0
ottenendo:
𝑓 (𝑥) − 𝑓 (𝑥0 )
𝑓 0(𝑥0 ) = lim+ .
𝑥→𝑥 0 𝑥 − 𝑥0
Visto che 𝑥 0 è un punto di massimo per 𝑓 sappiamo che 𝑓 (𝑥) − 𝑓 (𝑥 0 ) ≤ 0.
Essendo 𝑥 − 𝑥 0 > 0 l’intero rapporto incrementale risulta essere non positivo.
Dunque, per il teorema della permanenza del segno, possiamo concludere che
𝑓 0(𝑥0 ) ≤ 0.
Ma possiamo anche restringere la funzione ad un intorno sinistro di 𝑥 0 e
osservare che
𝑓 (𝑥) − 𝑓 (𝑥0 )
𝑓 0(𝑥0 ) = lim− .
𝑥→𝑥 0 𝑥 − 𝑥0
Ma ora il numeratore è, come prima, non positivo mentre il denominatore 𝑥 − 𝑥 0
è negativo. Dunque il rapporto incrementale stavolta è non negativo e quindi,
per la permanenza del segno, 𝑓 0(𝑥 0 ) ≥ 0.
Abbiamo scoperto quindi che 𝑓 0(𝑥 0 ) ≤ 0 e 𝑓 0(𝑥 0 ) ≥ 0 da cui deduciamo
𝑓 0(𝑥0 ) = 0.
Il teorema di Fermat si può enunciare dicendo che ogni punto di massimo

o minimo relativo interno al dominio di una funzione in cui la funzione è
derivabile è necessariamente un punto critico. In particolare per determinare
massimi e minimi assoluti e relativi di una funzione sarà sufficiente esaminare i
punti di frontiera, i punti di non derivabilità e i punti critici.
Rolle Teorema 5.14 (Rolle). Sia 𝑓 : [𝑎, 𝑏] → ℝ una funzione continua su tutto [𝑎, 𝑏] e
derivabile su (𝑎, 𝑏). Se 𝑓 (𝑎) = 𝑓 (𝑏) allora esiste 𝑥 0 ∈ (𝑎, 𝑏) tale che 𝑓 0(𝑥 0 ) = 0.
Dimostrazione. Essendo 𝑓 una funzione continua possiamo applicare il teorema

di Weiestrass per dedurre che 𝑓 ha massimo e minimo sull’intervallo chiuso e
limitato [𝑎, 𝑏]. Se il punto di massimo o il punto di minimo sta nell’intervallo
aperto (𝑎, 𝑏) possiamo applicare il teorema di Fermat per ottenere che la derivata
di 𝑓 si annulla in tale punto.
In caso contrario sia il punto di massimo che il punto di minimo sono estremi
dell’intervallo, cioè sono uguali ad 𝑎 o a 𝑏 . Ma visto che 𝑓 (𝑎) = 𝑓 (𝑏) i valori
massimo e minimo coincidono e quindi la funzione è costante. Ma in tal caso
𝑓 0(𝑥) = 0 per ogni 𝑥 ∈ [𝑎, 𝑏].
Lagrange
Teorema 5.15 (Lagrange). Sia 𝑓 : [𝑎, 𝑏] → ℝ una funzione continua su [𝑎, 𝑏] e

derivabile su (𝑎, 𝑏). Allora esiste un punto 𝑥 0 ∈ (𝑎, 𝑏) tale che
𝑓 (𝑏) − 𝑓 (𝑎)
𝑓 0(𝑥0 ) =
𝑏−𝑎
Dimostrazione. Consideriamo la funzione ausiliaria:
𝑓 (𝑏) − 𝑓 (𝑎)
𝑔(𝑥) = 𝑓 (𝑥) − 𝑥.
𝑏−𝑎
Per verifica diretta si osserva che
𝑏 𝑓 (𝑎) − 𝑎 𝑓 (𝑏)
𝑔(𝑏) = 𝑔(𝑎) = .
𝑏−𝑎
La funzione 𝑔 soddisfa quindi le ipotesi del teorema di Rolle e dunque esisterà
𝑥0 ∈ (𝑎, 𝑏) tale che 𝑔 0(𝑥0 ) = 0. Ma si osserva che
𝑓 (𝑏) − 𝑓 (𝑎)
𝑔 0(𝑥) = 𝑓 0(𝑥) −
𝑏−𝑎
criteri di monotonia
e dunque se 𝑔 0(𝑥 0 ) = 0 si ottiene il risultato desiderato.
Teorema 5.16 (criteri di monotonia). Sia 𝑓 : 𝐼 → ℝ una funzione definita su un

intervallo 𝐼 ⊆ ℝ. Sia 𝐽 = (inf 𝐼, sup 𝐼) l’intervallo aperto con gli stessi estremi di 𝐼 .
Supponiamo che 𝑓 sia continua su 𝐼 e derivabile su 𝐽 . Allora valgono i seguenti criteri:
1. (∀𝑥 ∈ 𝐽: 𝑓 0(𝑥) ≥ 0) ⇐⇒ 𝑓 è crescente (su tutto 𝐼 );

2. (∀𝑥 ∈ 𝐽: 𝑓 0(𝑥) ≤ 0) ⇐⇒ 𝑓 è decrescente (su tutto 𝐼 );
3. (∀𝑥 ∈ 𝐽: 𝑓 0(𝑥) = 0) ⇐⇒ 𝑓 è costante (su tutto 𝐼 );
4. (∀𝑥 ∈ 𝐽: 𝑓 0(𝑥) > 0) =⇒ 𝑓 è strettamente crescente (su tutto 𝐼 );
5. (∀𝑥 ∈ 𝐽: 𝑓 0(𝑥) < 0) =⇒ 𝑓 è strettamente decrescente (su tutto 𝐼 ).
Dimostrazione. Dimostriamo innanzitutto le implicazioni da sinistra verso

destra.
Per la prima, se 𝑓 non fosse crescente ci dovrebbero essere due punti 𝑎, 𝑏 ∈ 𝐼

tali che 𝑎 < 𝑏 ma 𝑓 (𝑎) > 𝑓 (𝑏). Dunque si avrebbe
𝑓 (𝑏) − 𝑓 (𝑎)
< 0.
𝑏−𝑎
Applicando il teorema di Lagrange all’intervallo [𝑎, 𝑏] si troverebbe un punto
𝑥 ∈ (𝑎, 𝑏) tale che 𝑓 0(𝑥) < 0. Chiaramente (𝑎, 𝑏) ⊆ 𝐽 e quindi questo contraddice
l’ipotesi 𝑓 0(𝑥) ≥ 0.
La seconda implicazione (per le funzioni decrescenti) si dimostra in maniera

analoga cambiando verso alle disuguaglianze.
Anche la terza implicazione si dimostra tramite il teorema di Lagrange in modo

analogo alle precedenti. Oppure basta osservare che se 𝑓 0(𝑥) = 0 allora valgono
contemporaneamente 𝑓 0(𝑥) ≥ 0 e 𝑓 0(𝑥) ≤ 0 quindi mettendo insieme le prime
due implicazioni si ottiene che 𝑓 è contemporaneamente crescente e decrescente
dunque è costante.
Per la quarta implicazione si procede come per la prima. Per assurdo si avrebbero
𝑎 < 𝑏 con 𝑓 (𝑏) ≤ 𝑓 (𝑎). Ma allora
𝑓 (𝑏) − 𝑓 (𝑎)
≤0
𝑏−𝑎
e applicando il teorema di Lagrange si troverebbe un punto 𝑥 ∈ (𝑎, 𝑏) con
𝑓 0(𝑥) ≤ 0, contro l’ipotesi 𝑓 0(𝑥) > 0.
La quinta implicazione si dimostra in maniera analoga cambiando verso alle

disuguaglianze.
Vediamo ora le implicazioni da destra verso sinistra. Per la prima, supponiamo

che 𝑓 sia crescente e prendiamo 𝑥 ∈ 𝐽 . Allora è chiaro che per ogni ℎ > 0 si avrà
𝑓 (𝑥 + ℎ) ≥ 𝑓 (𝑥) e dunque
𝑓 (𝑥 + ℎ) − 𝑓 (𝑥)
≥ 0.
ℎ
Facendo il limite per ℎ → 0+ si ottiene 𝑓 0(𝑥) e, per la permanenza del segno,
dovra essere 𝑓 0(𝑥) ≥ 0.
In maniera analoga (invertendo le disuguaglianze) si dimostra la seconda

implicazione.
La terza discende dalle prime due oppure, più semplicemente, dalle regole di
derivazione, in quanto la derivata di una costante è zero.
Esempio 5.17. La funzione 𝑓 (𝑥) = 1/𝑥 è definita su ℝ \ {0}, è derivabile e la derivata

𝑓 0(𝑥) = −1/𝑥 2 è ovunque negativa. La funzione 𝑓 è quindi strettamente decrescente
separatamente sui due intervalli (0 , +∞) e (−∞, 0) sui quali possiamo applicare il
criterio di monotonia. Ma non è decrescente su tutto il suo dominio in quanto, ad
esempio, 𝑓 (−1) = −1 < 1 = 𝑓 (1). Questo esempio mostra che nei criteri di monotonia
l’ipotesi che il dominio sia un intervallo è fondamentale.
Esercizio 5.18. Determinare base e altezza di una lattina cilindrica di volume 33 𝑐𝑙

che a parità di volume ha la minima superficie totale.
Svolgimento. Sia 𝑉 il volume, 𝑆 l’area della superficie totale, ℎ l’altezza e 𝑟 il

raggio di base del cilindro. Sappiamo che
𝑉 = 𝜋ℎ𝑟 2 𝑆 = 2𝜋𝑟 ℎ + 2𝜋𝑟 2 .
Ricavando ℎ dalla prima equazione e sostituendo nella seconda otteniamo
𝑉 2𝑉
𝑆 = 2𝜋𝑟 + 2𝜋𝑟 2 = + 2𝜋𝑟 2 .
𝜋𝑟 2 𝑟
La funzione 𝑆(𝑟) è definita e continua su (0 , +∞) e si ha 𝑆(𝑟) → +∞ per 𝑟 → 0+
e anche per 𝑟 → +∞. Dunque 𝑆 ammette minimo per il teorema di Weierstrass
generalizzato. Per trovare il minimo basterà calcolare la derivata
𝑑𝑆 2𝑉 4𝜋𝑟 3 − 2𝑉
= − 2 + 4𝜋𝑟 =
𝑑𝑟 𝑟 𝑟2
e trovare i punti critici
4𝜋𝑟 3 = 2𝑉
da cui
r
𝑉3
𝑟= ≈ 3.74 𝑐𝑚
2𝜋
𝑉
ℎ= ≈ 7.49 𝑐𝑚.
𝜋𝑟 2
Esercizio 5.19. Risolvere l’equazione
𝑒 𝑥 = 𝑥3 . (5.2)
Svolgimento. Il lato sinistro dell’equazione è un numero positivo e quindi

certamente possiamo supporre che sia 𝑥 > 0 altrimenti il lato destro non
sarebbe anch’esso positivo. Possiamo quindi prendere il logaritmo di ambo i
membri e ottenere l’equazione
𝑥 = 3 ln 𝑥
che è equivalente all’equazione data.
Consideriamo allora la funzione
𝑓 (𝑥) = 𝑥 − 3 ln 𝑥
cosicché le soluzioni cercate risultano essere gli zeri di 𝑓 . Si ha
3
𝑓 0(𝑥) = 1 −
𝑥
e possiamo quindi affermare che 𝑓 0(𝑥) ≷ 0 se e solo se Il simbolo ≷ serve per indicare che que-
sta diseguazione e le seguenti possono
3 essere scritte sia con il segno > che con
1≷ il segno < pur di prendere in tutte lo
𝑥
stesso segno.
ovvero (ricordiamo che stiamo supponendo 𝑥 > 0)
𝑥 ≷ 3.
Cioè: se 𝑥 > 3 si ha 𝑓 0(𝑥) > 0 e di conseguenza (teorema 5.16) 𝑓 è strettamente

crescente se ristretta all’intervallo [3 , +∞), se invece 𝑥 < 3 si ha 𝑓 0(𝑥) < 0 e di
conseguenza 𝑓 è strettamente decrescente se ristretta all’intervallo (0 , 3]. Per
capire se la funzione 𝑓 si annulla in qualche punto dobbiamo ora valutare 𝑓
negli estremi degli intervalli su cui risulta monotona. Si ha
lim 𝑓 (𝑥) = +∞, 𝑓 (3) = 3(1 − ln 3) < 0, lim 𝑓 (𝑥) = +∞.

𝑥→0+ 𝑥→+∞
Osserviamo quindi che agli estremi degli intervalli (0 , 3] e [3 , +∞) la funzione

assume segni opposti e quindi, per il teorema degli zeri (teorema 2.80), deve
annullarsi almeno una volta in ognuno dei due intervalli. D’altra parte su
ognuno dei due intervalli la funzione è strettamente monotona e quindi iniettiva,
dunque non può annullarsi più di una volta. Deduciamo quindi che la funzione
𝑓 si annulla in esattamente due punti 𝑥1 , 𝑥2 con
0 < 𝑥1 < 3 < 𝑥2 .
I punti 𝑥 1 e 𝑥 2 sono quindi univocamente determinati e possono essere calcolati,

con un errore piccolo a piacere, utilizzando il metodo di bisezione, come
abbiamo visto nella dimostrazione del teorema degli zeri.
Esempio 5.20. Si consideri la funzione
1
𝑓 (𝑥) = arctg 𝑥 + arctg .
𝑥
Si ha
1 1 −1 1 1
𝑓 0(𝑥) = + = − 2 = 0.
1+𝑥 2
1 + 𝑥2 𝑥
1 2 1+𝑥 2 𝑥 +1
Osserviamo che la funzione 𝑓 è definita su ℝ \ {0} che non è un intervallo ma è unione

di due intervalli disgiunti: (−∞, 0) ∪ (0 , +∞). Possiamo allora applicare i criteri di
monotonia separatamente ai due intervalli ottenendo che 𝑓 (𝑥) è costante su ognuno dei
due intervalli. Dunque esisteranno 𝑐 1 e 𝑐 2 tali che
(
𝑐1 se 𝑥 > 0,
𝑓 (𝑥) =
𝑐2 se 𝑥 < 0.
Possiamo determinare facilmente 𝑐 1 e 𝑐 2 osservando che

𝜋
𝑐 1 = 𝑓 (1) = arctg 1 + arctg 1 =
2
𝜋
𝑐 2 = 𝑓 (−1) = arctg(−1) + arctg(−1) = − .
2
In effetti la funzione 𝑓 pur avendo derivata nulla non è costante ma solo

localmente costante.
Esempio 5.21. Consideriamo la funzione 𝑓 (𝑥) = 𝑥 3 la cui derivata è 𝑓 0(𝑥) = 3 𝑥 2 . Per

ogni 𝑥 ∈ ℝ si ha 𝑓 0(𝑥) ≥ 0 dunque possiamo dedurre che 𝑓 è crescente. Scelto invece
𝐼 = [0 , +∞) l’intervallo aperto corrispondente è 𝐽 = (0 , +∞). Osserviamo che su 𝐽 si
ha 𝑓 0(𝑥) > 0 quindi possiamo concludere che 𝑓 è strettamente crescente su tutto 𝐼 . Lo
stesso vale per l’intervallo (−∞, 0]. Mettendo insieme le due cose possiamo concludere
che 𝑓 (𝑥) = 𝑥 3 è strettamente crescente su tutto ℝ nonostante che sia 𝑓 0(0) = 0. Questo
mostra che una funzione strettamente monotona può avere derivata nulla in un punto.
Più in generale è facile osservare che se 𝑓 è monotona ma non strettamente

monotona significa che ci sono due punti 𝑎 e 𝑏 per cui 𝑓 (𝑎) = 𝑓 (𝑏). Ma se
𝑓 è monotona allora per ogni 𝑥 ∈ [𝑎, 𝑏] si deve avere 𝑓 (𝑥) = 𝑓 (𝑎) = 𝑓 (𝑏)
(ad esempio: se 𝑓 è crescente si dovrebbe avere 𝑓 (𝑎) ≤ 𝑓 (𝑥) ≤ 𝑓 (𝑏) ma se
𝑓 (𝑎) = 𝑓 (𝑏) necessariamente 𝑓 (𝑥) = 𝑓 (𝑎) = 𝑓 (𝑏)). Dunque 𝑓 risulterebbe essere
costante su [𝑎, 𝑏] e in particolare avremmo una infinità più che numerabile
di punti in cui la derivata si annulla. Questo significa che se 𝑓 0(𝑥) ≥ 0 su un
intervallo e se 𝑓 0(𝑥) = 0 su un numero finito o anche numerabile di punti o,
ancora, su un insieme di punti con parte interna vuota, allora comunque 𝑓 è
strettamente crescente. Ragionamento analogo vale naturalmente anche per le
funzioni decrescenti.
Esercizio 5.22. Dimostrare che
𝑥2
cos 𝑥 ≥ 1 − ∀𝑥 ∈ ℝ.
2
Esercizio 5.23. Si consideri la funzione 𝑓 : ℝ → ℝ definita da
𝑓 (𝑥) = 2𝑒 𝑥−1 − 𝑥 2 .
Si mostri che 𝑓 è bigettiva e che la funzione inversa 𝑓 −1 : ℝ → ℝ è derivabile in tutti i

punti tranne il punto 1 dove ha un flesso verticale. Si calcoli ( 𝑓 −1 )0(2/𝑒).
Svolgimento. Risulta
𝑓 0(𝑥) = 2 𝑒 𝑥−1 − 2𝑥, 𝑓 00(𝑥) = 2𝑒 𝑥−1 − 2.
Dunque 𝑓 00(𝑥) > 0 per 𝑥 > 1 e 𝑓 00(𝑥) < 0 per 𝑥 < 1. Dunque per i criteri di
monotonia 𝑓 0 è strettamente crescente su [1 , +∞) e strettamente decrescente
su (−∞, 1]. Visto che 𝑓 0(1) = 0 risulta quindi che 𝑓 0(𝑥) ≥ 0 per ogni 𝑥 ∈ ℝ e
𝑓 0(𝑥) = 0 solo per 𝑥 = 1. Dunque 𝑓 è crescente per il criterio di monotonia ma
anche strettamente crescente perché se fosse crescente ma non strettamente ci
dovrebbe essere un intero intervallo in cui 𝑓 0 si annulla. Dunque 𝑓 è iniettiva.
Visto che 𝑓 (𝑥) → ±∞ per 𝑥 → ±∞ si ha sup 𝑓 (ℝ) = +∞, inf 𝑓 (ℝ) = −∞ e per
il teorema dei valori intermedi otteniamo che 𝑓 (ℝ) = ℝ. Dunque 𝑓 è anche
suriettiva ed è quindi invertibile.
La funzione inversa di 𝑓 è anch’essa monotona, è quindi continua per il
Teorema 2.8 ed è derivabile nei punti corrispondenti ai punti in cui 𝑓 ha derivata

derivabile ma con derivata non continua
0.2
(vedi esempio 5.25). L’ingrandimento
nel disegno in basso rende evidente il
0.1 fatto che la derivata oscilla tra i valori
−1 e 1 in ogni intorno di 0. La proprietà
di Darboux (teorema 5.24) rimane
-0.6 -0.5 -0.4 -0.3 -0.2 -0.1 0.1 0.2 0.3 0.4 0.5 0.6 0.7
comunque soddisfatta: la derivata
assume tutti i valori compresi tra 1 e
-0.1
−1 in ogni intorno di 𝑥 = 0 ma non ha
limite per 𝑥 → 0.
-0.2
0.0031 0.0032 0.0033 0.0034 0.0035 0.0036 0.0037 0.0038 0.0039 0.004 0.0041 0.0042 0.0043 0.0044 0.0045 0.0046 0.0047 0.0048 0.0049 0.005 0.0051 0.0052 0.0053 0.0054 0.0055
(interagisci)
non nulla. L’unico punto in cui 𝑓 ha derivata nulla è 𝑥 = 1 e visto che 𝑓 (1) = 1
risulta che 𝑓 −1 (𝑦) è derivabile per ogni 𝑦 ≠ 1 e vale
1 1
( 𝑓 −1 )0( 𝑓 (𝑥)) = = .
𝑓 0(𝑥) 2 𝑒 𝑥−1 − 2 𝑥
Osservando che 𝑓 (0) = 2/𝑒 si trova quindi
1 𝑒
( 𝑓 −1 )0(1/𝑒) = = .
2/𝑒 2
Teorema 5.24 (proprietà di Darboux). Sia 𝑓 : 𝐼 → ℝ una funzione derivabile su

un intervallo 𝐼 ⊆ ℝ. Allora la derivata soddisfa la proprietà dei valori intermedi: se
𝑎, 𝑏 ∈ 𝐼 , 𝑎 < 𝑏 e se 𝑚 è un valore intermedio tra 𝑓 0(𝑎) e 𝑓 0(𝑏) (cioè 𝑓 0(𝑎) < 𝑚 < 𝑓 0(𝑏)
o 𝑓 0(𝑏) < 𝑚 < 𝑓 0(𝑎)) allora esiste 𝑥 ∈ (𝑎, 𝑏) tale che 𝑓 0(𝑥) = 𝑚 .
Dimostrazione. Dati 𝑥, 𝑦 ∈ [𝑎, 𝑏], 𝑥 ≠ 𝑦 , possiamo considerare il rapporto

incrementale:
𝑓 (𝑦) − 𝑓 (𝑥)
𝑅(𝑥, 𝑦) = .
𝑦−𝑥
Fissato 𝑥 = 𝑎 la funzione 𝑦 ↦→ 𝑅(𝑎, 𝑦) è continua e tende a 𝑓 0(𝑎) quando 𝑦
tende ad 𝑎 . Dunque, per il teorema 2.80 dei valori intermedi, tale funzione
assume tutti i valori compresi tra 𝑓 0(𝑎) e 𝑅(𝑎, 𝑏). Analogamente fissato 𝑦 = 𝑏 la
funzione 𝑥 ↦→ 𝑅(𝑥, 𝑏) è continua e tende a 𝑓 0(𝑏) quando 𝑥 tende a 𝑏 . Dunque
tale funzione assume tutti i valori intermedi tra 𝑅(𝑎, 𝑏) e 𝑓 0(𝑏). Dunque esistono
𝑥, 𝑦 tali che 𝑅(𝑥, 𝑦) = 𝑚 e, per il teorema 5.15 di Lagrange esisterà un punto
intermedio 𝑡 ∈ (𝑥, 𝑦) in cui 𝑓 0(𝑡) = 𝑅(𝑥, 𝑦) = 𝑚 .
Esempio 5.25 (funzione derivabile con derivata non continua). La funzione

𝑓 : ℝ → ℝ definita da
(
𝑥 2 sin(1/𝑥) se 𝑥 ≠ 0
𝑓 (𝑥) =
0 se 𝑥 = 0.
è derivabile su tutto ℝ, 𝑓 0(0) = 0 ma il limite
lim 𝑓 0(𝑥)
𝑥→0
non esiste (e dunque 𝑓 0 : ℝ → ℝ non è continua in 𝑥 = 0).
Dimostrazione. La funzione 𝑥 2 sin(1/𝑥) è derivabile infinite volte su tutto il suo

dominio ℝ \ {0} in quanto composizione di funzioni elementari derivabili
infinite volte. Dunque, per la località della derivata, anche la funzione 𝑓 è
derivabile infinite volte su ℝ \ {0}. Per 𝑥 ≠ 0 possiamo quindi calcolare 𝑓 0(𝑥)
utilizzando le regole di derivazione

0 1 1 1 −1 1 1
𝑓 (𝑥) = 𝐷 𝑥 sin2
= 2 𝑥 sin + 𝑥 2 cos · 2 = 2 𝑥 sin − cos .
𝑥 𝑥 𝑥 𝑥 𝑥 𝑥
Verifichiamo ora che 𝑓 è continua e derivabile anche in 0. Si ha infatti
𝑓 (0 + ℎ) − 𝑓 (0) 1
lim = lim ℎ sin = 0
ℎ→0 ℎ ℎ→0 ℎ
e dunque 𝑓 0(0) = 0. Osserviamo però che 𝑓 0(𝑥) non ammette limite per 𝑥 → 0
in quanto per 𝑥 → 0 si ha 2 𝑥 sin(1/𝑥) → 0 ma il limite di cos(1/𝑥) invece non
esiste. Dunque 𝑓 0(𝑥) è la somma di una funzione che ha limite zero e di una
funzione il cui limite non esiste per 𝑥 → 0. Dunque 𝑓 0(𝑥) non ammette limite
per 𝑥 → 0.
Proposizione 5.26 (criterio di derivabilità). Sia 𝐼 ⊆ ℝ un intervallo, 𝑥 0 ∈ 𝐼

𝑓 : 𝐼 → ℝ una funzione continua su tutto 𝐼 e derivabile in 𝐼 \ {𝑥 0 }. Se il limite della
derivata
lim 𝑓 0(𝑥) = 𝑚
𝑥→𝑥 0
esiste ed è finito la funzione 𝑓 è derivabile anche in 𝑥 0 e vale 𝑓 0(𝑥 0 ) = 𝑚 .
Dimostrazione. Prendiamo un generico punto 𝑥 > 𝑥 0 (il caso 𝑥 < 𝑥 0 è del tutto
analogo). Per il teorema di Lagrange sappiamo esistere un punto 𝑦 ∈ (𝑥 0 , 𝑥)
tale che
𝑓 (𝑥) − 𝑓 (𝑥0 )
= 𝑓 0(𝑦).
𝑥 − 𝑥0
Per 𝑥 → 𝑥 0 si ha certamente anche 𝑦 → 𝑥 0 e dunque esiste il limite del rapporto
incrementale:
𝑓 (𝑥) − 𝑓 (𝑥0 )
𝑓 0(𝑥0 ) = lim = lim 𝑓 0(𝑦) = 𝑚.
𝑥→𝑥 0 𝑥 − 𝑥0 𝑦→𝑥0
La proposizione precedente dice che la derivata di una funzione in un punto

non può avere un valore diverso dal suo limite, se tale limite esiste. Esistono
però funzioni derivabili la cui derivata non è continua, come abbiamo visto
nell’esempio 5.25 in quanto il limite della derivata potrebbe non esistere.
5.5 convessità 191
5.5 convessità
Definizione 5.27 (funzione convessa). Sia 𝐼 ⊆ ℝ un intervallo. Una funzione

𝑓 : 𝐼 → ℝ si dice essere convessa se per ogni 𝑥, 𝑦 ∈ 𝐼 e per ogni 𝑡 ∈ [0 , 1] si ha funzione convessa
𝑓 ((1 − 𝑡)𝑥 + 𝑡 𝑦) ≤ (1 − 𝑡) 𝑓 (𝑥) + 𝑡 𝑓 (𝑦).
Analogamente diremo che 𝑓 è concava se vale la disuguaglianza inversa: funzione concava
𝑓 ((1 − 𝑡)𝑥 + 𝑡 𝑦) ≥ (1 − 𝑡) 𝑓 (𝑥) + 𝑡 𝑓 (𝑦)
(o, equivalentemente, se − 𝑓 è convessa).
Osserviamo che la retta del piano passante per i punti (𝑥, 𝑓 (𝑥)) e (𝑦, 𝑓 (𝑦)) può
essere parametrizzata in maniera uniforme per 𝑡 ∈ ℝ da
(1 − 𝑡)(𝑥, 𝑓 (𝑥)) + 𝑡(𝑦, 𝑓 (𝑦)) = ((1 − 𝑡)𝑥 + 𝑡 𝑦, (1 − 𝑡) 𝑓 (𝑥) + 𝑡 𝑓 (𝑦)).
Chiaramente per 𝑡 = 0 si ottiene il punto (𝑥, 𝑓 (𝑥)) per 𝑡 = 1 il punto (𝑦, 𝑓 (𝑦)) e
per 𝑡 ∈ [0 , 1] il segmento congiungente tali punti. La condizione di convessità
della funzione 𝑓 corrisponde quindi a richiedere che ogni corda (segmento) che
unisce due punti del grafico si trovi "al di sopra" del grafico della funzione.
Definizione 5.28 (insieme convesso). Un insieme 𝐸 ⊆ ℝ𝑛 si dice essere convesso se convesso

dati due punti qualunque 𝑎, 𝑏 ∈ 𝐸 l’intero segmento [𝑎, 𝑏] = {(1 − 𝑡)𝑎 + 𝑡𝑏 : 𝑡 ∈ [0 , 1]}
è contenuto in 𝐸 .
Teorema 5.29 (epigrafico delle funzioni convesse). Sia 𝐼 ⊆ ℝ e 𝑓 : 𝐼 ⊆ ℝ → ℝ

una funzione. Allora sono equivalenti:
1. 𝐼 è un intervallo e 𝑓 è convessa;
2. l’epigrafico di 𝑓 (o sopragrafico) ovvero l’insieme
epigrafico di 𝑓
𝐸 = (𝑥, 𝑦) ∈ ℝ : 𝑥 ∈ 𝐼, 𝑦 ≥ 𝑓 (𝑥)
2

è convesso.
Per le funzioni concave sarà il sottografico {(𝑥, 𝑦) : 𝑦 ≤ 𝑓 (𝑥)} ad essere convesso.
Dimostrazione. Supponiamo che 𝐼 sia un intervallo e 𝑓 sia convessa. Per di-

mostrare che l’epigrafico 𝐸 è convesso consideriamo due punti 𝑎, 𝑏 ∈ 𝐸 e un
qualunque punto 𝑝 sul segmento [𝑎, 𝑏]. Se 𝑎 = (𝑥 𝑎 , 𝑦 𝑎 ), 𝑏 = (𝑥 𝑏 , 𝑦𝑏 ), 𝑝 = (𝑥 𝑝 , 𝑦 𝑝 )
allora esiste un 𝑡 ∈ [0 , 1] tale che 𝑥 𝑝 = (1 − 𝑡)𝑥 𝑎 + 𝑡𝑥 𝑏 e 𝑦 𝑝 = (1 − 𝑡)𝑦 𝑎 + 𝑡 𝑦𝑏 . Visto
che 𝑎, 𝑏 ∈ 𝐸 sappiamo che 𝑦 𝑎 ≥ 𝑓 (𝑥 𝑎 ) e 𝑦𝑏 ≥ 𝑓 (𝑥 𝑏 ). Dunque necessariamente
si ha
𝑦 𝑝 ≥ (1 − 𝑡) 𝑓 (𝑥 𝑎 ) + 𝑡 𝑓 (𝑦𝑏 ).
Ma essendo 𝑓 convessa si ha:
(1 − 𝑡) 𝑓 (𝑥 𝑎 ) + 𝑡 𝑓 (𝑦𝑏 ) ≥ 𝑓 ((1 − 𝑡)𝑥 𝑎 + 𝑡𝑥 𝑏 ) = 𝑓 (𝑥 𝑝 ).
Dunque 𝑦 𝑝 ≥ 𝑓 (𝑥 𝑝 ) che significa 𝑝 ∈ 𝐸 .

Viceversa supponiamo di sapere che 𝐸 è convesso. Siano 𝑥, 𝑦 ∈ 𝐼 punti

qualunque. Allora i punti 𝑎 = (𝑥, 𝑓 (𝑥)) e 𝑏 = (𝑦, 𝑓 (𝑦)) sono certamente punti
di 𝐸 e quindi l’intero segmento [𝑎, 𝑏] deve essere contenuto in 𝐸 . Dunque per
ogni 𝑡 ∈ [0 , 1] il punto 𝑝 = ((1 − 𝑡)𝑥 + 𝑡 𝑦, (1 − 𝑡) 𝑓 (𝑥) + 𝑡 𝑓 (𝑦)) deve stare in 𝐸 .
In primo luogo deve quindi essere (1 − 𝑡)𝑥 + 𝑡 𝑦 ∈ 𝐼 e se questo è vero per ogni
𝑡 ∈ [0 , 1] significa che 𝐼 è un intervallo. In secondo luogo se 𝑝 ∈ 𝐸 significa che
(1 − 𝑡) 𝑓 (𝑥) + 𝑡 𝑓 (𝑦) ≥ 𝑓 ((1 − 𝑡)𝑥 + 𝑡 𝑦)
che corrisponde alla definizione di funzione convessa.
Lemma 5.30 (rapporto incrementale di una funzione convessa). Sia 𝐼 un intervallo

di ℝ e sia 𝑓 : 𝐼 → ℝ. Dati 𝑥, 𝑦 ∈ 𝐼 con 𝑥 ≠ 𝑦 definiamo il rapporto!incrementale di
𝑓 come:
𝑓 (𝑦) − 𝑓 (𝑥)
𝑅(𝑥, 𝑦) = .
𝑦−𝑥
Allora sono condizioni equivalenti:
1. 𝑓 è convessa;
2. per ogni 𝑥, 𝑦, 𝑧 ∈ 𝐼 se 𝑥 < 𝑦 < 𝑧 si ha 𝑅(𝑥, 𝑦) ≤ 𝑅(𝑦, 𝑧);
3. per ogni 𝑥, 𝑦, 𝑧 ∈ 𝐼 se 𝑥 < 𝑦 < 𝑧 si ha 𝑅(𝑥, 𝑦) ≤ 𝑅(𝑥, 𝑧);
4. per ogni 𝑥, 𝑦, 𝑧 ∈ 𝐼 se 𝑥 < 𝑦 < 𝑧 si ha 𝑅(𝑥, 𝑧) ≤ 𝑅(𝑦, 𝑧);
5. la funzione 𝑅(𝑥, 𝑦) è crescente in ognuna delle due variabili.
Dimostrazione. Attenzione: il lemma risulta ovvio se si utilizza la giusta in-

terpretazione geometrica (il rapporto incrementale è la pendenza della corda
corrispondente). Quella che segue è la traduzione algebrica di quanto è geo-
metricamente ovvio ma risulta inevitabilmente pesante e più difficilmente
comprensibile.
Siano 𝑥, 𝑦, 𝑧 ∈ 𝐼 con 𝑥 < 𝑦 < 𝑧 . Posto 𝑡 = (𝑦 − 𝑥)/(𝑧 − 𝑥) si ha 𝑦 = (1 − 𝑡)𝑥 + 𝑡𝑧 ,

𝑦 − 𝑥 = 𝑡(𝑧 − 𝑥), 𝑧 − 𝑦 = (1 − 𝑡)(𝑧 − 𝑥). Si ha allora
𝑓 (𝑧) − 𝑓 (𝑥) 𝑓 (𝑦) − 𝑓 (𝑥)

𝑅(𝑥, 𝑧) − 𝑅(𝑥, 𝑦) = −
𝑧−𝑥 𝑦−𝑥
𝑓 (𝑧) − 𝑓 (𝑥) 𝑓 (𝑦) − 𝑓 (𝑥)
=𝑡 −
𝑦−𝑥 𝑦−𝑥
𝑡 𝑓 (𝑧) + (1 − 𝑡) 𝑓 (𝑥) − 𝑓 (𝑦)
=
𝑦−𝑥
La condizione di convessità di 𝑓 è
𝑓 (𝑦) ≤ (1 − 𝑡) 𝑓 (𝑥) + 𝑡 𝑓 (𝑧)
ed è quindi equivalente alla condizione 𝑅(𝑥, 𝑦) ≤ 𝑅(𝑥, 𝑧). Dunque le condizioni

1 e 3 sono equivalenti.
Ma con una verifica diretta si osserva che
𝑅(𝑥, 𝑧) = 𝑡𝑅(𝑥, 𝑦) + (1 − 𝑡)𝑅(𝑦, 𝑧)

5.5 convessità 193
da cui si ottiene
𝑅(𝑦, 𝑧) − 𝑅(𝑥, 𝑧) = 𝑡[𝑅(𝑦, 𝑧) − 𝑅(𝑥, 𝑦)]
oppure anche
𝑅(𝑥, 𝑧) − 𝑅(𝑥, 𝑦) = (1 − 𝑡)[𝑅(𝑦, 𝑧) − 𝑅(𝑥, 𝑦)].
Risulta quindi che le quantità
𝑅(𝑦, 𝑧) − 𝑅(𝑥, 𝑦), 𝑅(𝑥, 𝑧) − 𝑅(𝑥, 𝑦), 𝑅(𝑦, 𝑧) − 𝑅(𝑥, 𝑧)
hanno tutte lo stesso segno. E quindi le condizioni 2, 3 e 4 sono tra loro

equivalenti (se vale una delle tre valgono tutte e tre).
Se valgono le tre condizioni 2, 3 e 4 è facile verificare che la funzione 𝑅(𝑥, 𝑦)

è crescente in entrambe le variabili. Innanzitutto per simmetria, visto che
𝑅(𝑥, 𝑦) = 𝑅(𝑦, 𝑥), è sufficiente verificare che 𝑅(𝑥, 𝑦) è crescente nella seconda
variabile 𝑦 per ogni 𝑥 fissato. Quindi dato 𝑧 > 𝑦 bisogna mostrare che
𝑅(𝑥, 𝑧) ≥ 𝑅(𝑥, 𝑦). Abbiamo allora tre possibilità a seconda che sia 𝑥 < 𝑦
oppure 𝑦 < 𝑥 < 𝑧 oppure 𝑧 < 𝑥 . Nel primo caso si ha 𝑥 < 𝑦 < 𝑧 e dunque la
disuguaglianza 𝑅(𝑥, 𝑦) ≤ 𝑅(𝑥, 𝑧) corrisponde alla condizione 3. Nel secondo
caso si ha 𝑦 < 𝑥 < 𝑧 e la condizione 𝑅(𝑥, 𝑦) ≤ 𝑅(𝑥, 𝑧) si può scrivere come
𝑅(𝑦, 𝑥) ≤ 𝑅(𝑥, 𝑧) che è, riordinando opportunamente le variabili, la condizione
2. Se, infine, 𝑦 < 𝑧 < 𝑥 la condizione 𝑅(𝑥, 𝑦) ≤ 𝑅(𝑥, 𝑧) si può scrivere
𝑅(𝑦, 𝑥) ≤ 𝑅(𝑧, 𝑥) che, riordinando le variabili, è la condizione 4.
Viceversa (e infine) se la funzione 𝑅(𝑥, 𝑦) è crescente in entrambe le variabili

in particolare è crescente nella seconda variabile e quindi se 𝑥 < 𝑦 < 𝑧 si ha
𝑅(𝑥, 𝑦) ≤ 𝑅(𝑥, 𝑧). Risulta quindi che la condizione 5 implica la 3 e quindi tutte
le altre condizioni.
Teorema 5.31. Sia 𝐼 ⊆ ℝ un intervallo e 𝑓 : 𝐼 → ℝ una funzione derivabile su tutto

𝐼 . Allora sono equivalenti:
1. 𝑓 è convessa;
2. per ogni 𝑥 0 ∈ 𝐼 e per ogni 𝑥 ∈ 𝐼 si ha
𝑓 (𝑥) ≥ 𝑓 0(𝑥0 )(𝑥 − 𝑥0 ) + 𝑓 (𝑥0 )
(geometricamente: il grafico della funzione sta sopra la retta tangente);

3. 𝑓 0 è crescente.
Analogamente per le funzioni concave si avrà che il grafico “sta sotto” la retta tangente
e che la derivata è decrescente.
Dimostrazione. Osserviamo che
𝑓 0(𝑥 0 ) = lim 𝑅(𝑥0 , 𝑥).

𝑥→𝑥0
Se 𝑓 è convessa allora, per il lemma, il rapporto incrementale 𝑅(𝑥 0 , 𝑥) è crescente

e quindi 𝑓 0(𝑥 0 ) = inf 𝑥>𝑥0 𝑅(𝑥 0 , 𝑥). In particolare 𝑓 0(𝑥 0 ) ≤ 𝑅(𝑥 0 , 𝑥) per ogni
𝑥 > 𝑥0 . In maniera analoga si trova 𝑓 0(𝑥 0 ) ≥ 𝑅(𝑥0 , 𝑥) se 𝑥 < 𝑥0 . In ogni caso

risulta quindi che per ogni 𝑥 si ha
(𝑅(𝑥0 , 𝑥) − 𝑓 0(𝑥0 ))(𝑥 − 𝑥0 ) ≥ 0
ovvero
𝑓 (𝑥) − 𝑓 (𝑥0 ) − 𝑓 0(𝑥0 )(𝑥 − 𝑥0 ) ≥ 0.
Dunque la condizione 1 implica la 2.
Se vale la condizione 2, dati 𝑥, 𝑦 ∈ 𝐼 si ha
𝑓 (𝑥) − 𝑓 (𝑦) ≥ 𝑓 0(𝑦)(𝑥 − 𝑦)
se scambiamo 𝑥 e 𝑦 e cambiamo di segno ambo i membri si ottiene invece
𝑓 (𝑥) − 𝑓 (𝑦) ≤ 𝑓 0(𝑥)(𝑥 − 𝑦)
mettendo insieme le due disuguaglianze, se ora supponiamo che sia 𝑥 > 𝑦

otteniamo proprio 𝑓 0(𝑥) ≥ 𝑓 0(𝑦) cioè 𝑓 0 è crescente (condizione 3).
Supponiamo ora di sapere che 𝑓 0 è crescente e supponiamo per assurdo che

la funzione 𝑓 non sia convessa. In base al lemma precedente dovrebbero
allora esistere tre punti 𝑥 < 𝑦 < 𝑧 tali che 𝑅(𝑥, 𝑦) > 𝑅(𝑦, 𝑧). Per il teorema di
Lagrange dovrebbe allora esistere un punto 𝑐 ∈ (𝑥, 𝑦) tale che 𝑓 0(𝑐) = 𝑅(𝑥, 𝑦) e
un punto 𝑑 ∈ (𝑦, 𝑧) tale che 𝑓 0(𝑑) = 𝑅(𝑦, 𝑧) ma allora 𝑓 0(𝑐) > 𝑓 0(𝑑) nonostante
sia 𝑐 < 𝑑 e dunque 𝑓 0 non poteva essere crescente.
Corollario 5.32 (criterio di convessità tramite derivata seconda). Sia 𝐼 ⊆ ℝ

un intervallo e sia 𝑓 : 𝐼 → ℝ una funzione derivabile due volte (cioè 𝑓 è derivabile
e anche 𝑓 0 è derivabile). Allora 𝑓 è convessa se e solo se 𝑓 00(𝑥) ≥ 0 per ogni 𝑥 ∈ 𝐼 .
Analogamente 𝑓 è concava se e solo se 𝑓 00 ≤ 0.
Dimostrazione. Per il criterio precedente 𝑓 è convessa se e solo se 𝑓 0 è crescente.

Per il criterio di monotonia 𝑓 0 è crescente se e solo se 𝑓 00 ≥ 0. Considerazioni
analoghe valgono per la concavità.
Teorema 5.33. Siano 𝑎 ∈ ℝ, 𝑏 ∈ ℝ̄, 𝑎 < 𝑏 . Sia 𝑓 : [𝑎, 𝑏) → ℝ una funzione

convessa in (𝑎, 𝑏) e continua in 𝑎 . Allora 𝑓 è convessa su tutto [𝑎, 𝑏). Risultato analogo
vale per funzioni definite su intervalli aperti a sinistra (𝑎, 𝑏] e aperti da ambo i lati
(𝑎, 𝑏).
Dimostrazione. Dati 𝑥, 𝑦 ∈ [𝑎, 𝑏) dobbiamo mostrare che per ogni 𝑡 ∈ [0 , 1] vale
𝑓 ((1 − 𝑡)𝑥 + 𝑡 𝑦) ≤ (1 − 𝑡) 𝑓 (𝑥) + 𝑡 𝑓 (𝑦).
Per ipotesi sappiamo che la disuguaglianza è valida se 𝑥, 𝑦 ∈ (𝑎, 𝑏). Dobbiamo

quindi dimostrare la disuguaglianza solamente nel caso 𝑥 = 𝑎 e 𝑦 ∈ (𝑎, 𝑏). Dato
5.5 convessità 195
qualunque 𝑡 ∈ (0 , 1) e presa una successione 𝑥 𝑘 → 𝑎 con 𝑥 𝑘 ∈ (𝑎, 𝑏) definiamo

𝑡 𝑘 in modo che sia 𝑧 = (1 − 𝑡)𝑥 + 𝑡 𝑦 = (1 − 𝑡 𝑘 )𝑥 𝑘 + 𝑡 𝑘 𝑦 cioè:
𝑥 − 𝑥 𝑘 + 𝑡(𝑦 − 𝑥)
𝑡𝑘 = .
𝑦 − 𝑥𝑘
Siccome 𝑡 𝑘 → 𝑡 per 𝑘 → +∞ se 𝑡 ∈ (0 , 1) per 𝑘 abbastanza grande anche

𝑡 𝑘 ∈ (0 , 1). Inoltre per la convessità in (𝑎, 𝑏) sappiamo che vale
𝑓 ((1 − 𝑡 𝑘 )𝑥 𝑘 + 𝑡 𝑘 𝑦) ≤ (1 − 𝑡 𝑘 ) 𝑓 (𝑥 𝑘 ) + 𝑡 𝑘 𝑓 (𝑦)
e passando a limite per 𝑘 → +∞, dalla continuità di 𝑓 in 𝑥 si ottiene
𝑓 ((1 − 𝑡)𝑥 + 𝑡 𝑦) ≤ (1 − 𝑡) 𝑓 (𝑥) + 𝑡 𝑓 (𝑦)
come volevamo dimostrare. Per 𝑡 = 0 e 𝑡 = 1 la disuguaglianza è sempre

banalmente verificata.
√
Esempio 5.34. La funzione 𝑓 (𝑥) = 𝑥 è definita su [0 , +∞) ma è derivabile
1
solamente in (0 , +∞). La sua derivata è 𝑓 0(𝑥) = 𝑥 − 2 /2 e la derivata seconda è
3
𝑓 00(𝑥) = −𝑥 − 2 /4 < 0. Dunque la funzione è concava sull’intervallo aperto (0 , +∞).
Ma essendo continua possiamo concludere che 𝑓 è concava su tutto il dominio [0 , +∞).
Teorema 5.35 (derivabilità delle funzioni convesse). Sia 𝐼 ⊆ ℝ un intervallo e

sia 𝑓 : 𝐼 → ℝ una funzione convessa. Se 𝑥 0 ∈ (inf 𝐼, sup 𝐼) esistono e sono finite la
derivata destra e sinistra di 𝑓 in 𝑥 0 :
𝑓 (𝑥) − 𝑓 (𝑥0 )
𝑓+0 (𝑥0 ) = lim+
𝑥→𝑥0 𝑥 − 𝑥0
𝑓 (𝑥) − 𝑓 (𝑥0 )
𝑓−0 (𝑥0 ) = lim−
𝑥→𝑥0 𝑥 − 𝑥0
e risulta
𝑓−0 (𝑥0 ) ≤ 𝑓+0 (𝑥0 ).
Inoltre se inf 𝐼 < 𝑥 1 < 𝑥 2 < sup 𝐼 si ha
𝑓+0 (𝑥1 ) ≤ 𝑓(0 𝑥2 ).
Se ne deduce che 𝑓 è continua in tutti i punti interni di 𝐼 e che l’insieme dei punti in
cui 𝑓 non è derivabile è al più numerabile.
Dimostrazione. Nel lemma 5.30 abbiamo osservato che il rapporto incrementale
𝑓 (𝑥) − 𝑓 (𝑥0 )
𝑅(𝑥0 , 𝑥) =
𝑥 − 𝑥0
di una funzione convessa è crescente rispetto alla variabile 𝑥 . Dunque per il

teorema 2.25 si ha
𝑓−0 (𝑥0 ) = sup 𝑅(𝑥0 , 𝑥) > −∞, 𝑓+0 (𝑥0 ) = inf 𝑅(𝑥 0 , 𝑥) < +∞
𝑥<𝑥 0 𝑥>𝑥0
e visto che se 𝑥 < 𝑥 0 e 𝑦 > 𝑥 0 si ha 𝑅(𝑥 0 , 𝑥) ≤ 𝑅(𝑥 0 , 𝑦) deduciamo che

𝑓−0 (𝑥0 ) ≤ 𝑓+0 (𝑥0 ) ed entrambi i limiti sono dunque finiti. Se 𝑥1 < 𝑥2 allora preso
un qualunque punto 𝑥 con 𝑥 1 < 𝑥 < 𝑥 2 si ha (sempre per il lemma 5.30)
𝑅(𝑥 1 , 𝑥) ≤ 𝑅(𝑥, 𝑥2 )
e dunque passando al limite si trova 𝑓+0 (𝑥 1 ) ≤ 𝑓−0 (𝑥 2 ). Le derivate destra e

sinistra esistono dunque in tutti i punti interni all’intervallo 𝐼 . In particolare 𝑓 è
continua in tali punti in quanto è continua sia da destra che da sinistra. I punti di
non derivabilità di 𝑓 sono i punti in cui le derivate destra e sinistra differiscono.
Ma ad ogni punto 𝑥 di non differenziabilità posso associare l’intervallo aperto
non vuoto 𝐼 𝑥 = ( 𝑓−0 (𝑥), 𝑓+0 (𝑥)) e per le proprietà appena viste è chiaro che questi
intervalli sono a due a due disgiunti in quanto se 𝑥 1 < 𝑥 2 l’estremo destro di
𝐼 𝑥1 è minore o uguale all’estremo sinistro di 𝐼 𝑥2 . Siccome ognuno di questi
intervalli contiene almeno un numero razionale concludiamo che il numero di
punti di discontinuità non può essere maggiore della cardinalità dei numeri
razionali.
Teorema 5.36 (retta di supporto). Sia 𝐼 ⊆ ℝ un intervallo, 𝑓 : 𝐼 → ℝ una funzione

convessa e 𝑥 0 un punto interno ad 𝐼 . Allora esiste una funzione lineare affine
𝐿(𝑥) = 𝑚𝑥 + 𝑞
tale che 𝑓 (𝑥 0 ) = 𝐿(𝑥 0 ) e per ogni 𝑥 ∈ 𝐼 si abbia 𝑓 (𝑥) ≥ 𝐿(𝑥).
Dimostrazione. Basta scegliere qualunque 𝑚 ∈ [ 𝑓−0 (𝑥 0 ), 𝑓+0 (𝑥 0 )] e considerare la

funzione lineare affine 𝐿(𝑥) = 𝑚(𝑥 − 𝑥 0 ). Se 𝑥 > 𝑥 0 allora si ha 𝑅(𝑥 0 , 𝑥) ≥ 𝑚 e
dunque 𝑓 (𝑥) − 𝑓 (𝑥 0 ) ≥ 𝑚(𝑥 − 𝑥 0 ) = 𝐿(𝑥). Viceversa se 𝑥 < 𝑥 0 si ha 𝑅(𝑥 0 , 𝑥) ≤ 𝑚
da cui, di nuovo, 𝑓 (𝑥) − 𝑓 (𝑥 0 ) ≥ 𝑚(𝑥 − 𝑥 0 ) = 𝐿(𝑥).
Il seguente teorema può essere enunciato anche per gli integrali come vedremo
nel teorema 6.21. La dimostrazione è sostanzialmente identica ed è valida anche
per funzioni convesse di più variabili.
Teorema 5.37 (combinazioni baricentriche/disuguaglianza di Jensen). Se 𝑓 è

una funzione convessa definita su un intervallo 𝐼 , dati 𝑥 1 , . . . , 𝑥 𝑛 ∈ 𝐼 e 𝜆1 , . . . , 𝜆𝑛 ∈ ℝ
tali che 𝑛𝑘=1 𝜆 𝑘 = 1 e 𝜆 𝑘 ≥ 0 per ogni 𝑘 = 1 , . . . , 𝑛 allora
P
!
𝑛
X 𝑛
X
𝑓 𝜆𝑘 𝑥 𝑘 ≤ 𝜆 𝑘 𝑓 (𝑥 𝑘 ).
𝑘=1 𝑘=1
Per le funzioni concave vale la disuguaglianza inversa.
𝑛
X
𝑥¯ = 𝜆𝑘 𝑥 𝑘 .
𝑘=1
5.5 convessità 197
Per il teorema 5.36 precedente sappiamo che esiste una retta 𝐿(𝑥) = 𝑚𝑥 + 𝑞 tale
che 𝐿( 𝑥)
¯ = 𝑓 ( 𝑥)
¯ e 𝐿(𝑥) ≤ 𝑓 (𝑥) per ogni 𝑥 ∈ 𝐼 . Allora si ha
!
𝑛
X 𝑛
X 𝑛
X 𝑛
X
𝐿 𝜆𝑘 𝑥 𝑘 = 𝑚𝜆 𝑘 𝑥 𝑘 + 𝑞 𝜆𝑘 = 𝜆 𝑘 𝐿(𝑥 𝑘 ).
𝑘=1 𝑘=1 𝑘=1 𝑘=1
Dunque
𝑛
X 𝑛
X
𝑓 ( 𝑥)
¯ = 𝐿( 𝑥)
¯ = 𝜆 𝑘 𝐿(𝑥 𝑘 ) ≤ 𝜆 𝑘 𝑓 (𝑥 𝑘 ).
𝑘=1 𝑘=1
Esempio 5.38 (disuguaglianza tra media aritmetica e media geometrica). Os-

serviamo che la funzione 𝑓 (𝑥) = ln 𝑥 è concava, infatti si ha 𝑓 00(𝑥) = −1/𝑥 2 < 0.
Dunque, per il teorema precedente, se 𝜆1 + · · · + 𝜆𝑛 = 1, 𝜆 𝑘 ≥ 0 si ha
!
𝑛
X 𝑛
X
ln 𝜆𝑘 𝑥 𝑘 ≥ 𝜆 𝑘 ln 𝑥 𝑘 .
𝑘=1 𝑘=1
Facendo l’esponenziale di ambo i membri si ottiene

𝑛 𝑛
𝜆
X Y
𝜆𝑘 𝑥 𝑘 ≥ 𝑥𝑘 𝑘 .
𝑘=1 𝑘=1
Nel caso particolare 𝜆 𝑘 = 1/𝑛 si ottiene la disuguaglianza tra media aritmetica (AM media aritmetica geometrica
per gli anglofoni) e media geometrica (GM):
𝑥1 + · · · + 𝑥 𝑛 √
≥ 𝑛 𝑥1 · · · 𝑥 𝑛 .
𝑛
Esercizio 5.39 (subadditività delle funzioni concave). Sia 𝑓 : [0 , +∞) → ℝ una

funzione concava con 𝑓 (0) ≥ 0. Allora 𝑓 è subadditiva cioè:
𝑓 (𝑥 + 𝑦) ≤ 𝑓 (𝑥) + 𝑓 (𝑦), ∀𝑥, 𝑦 ≥ 0.
Dimostrazione. Se 𝑥 = 𝑦 = 0 la disuguaglianza è ovvia. Altrimenti 𝑥 + 𝑦 > 0 e

si ha
𝑦 𝑥

𝑓 (𝑥) = 𝑓 ·0+ · (𝑥 + 𝑦)
𝑥+𝑦 𝑥+𝑦
𝑦 𝑥 𝑥
≥ 𝑓 (0) + 𝑓 (𝑥 + 𝑦) ≥ 𝑓 (𝑥 + 𝑦).
𝑥+𝑦 𝑥+𝑦 𝑥+𝑦
Scambiando 𝑥 con 𝑦 e sommando si ottiene:
𝑥 𝑦
𝑓 (𝑥) + 𝑓 (𝑦) ≥ 𝑓 (𝑥 + 𝑦) + 𝑓 (𝑥 + 𝑦) = 𝑓 (𝑥 + 𝑦).
𝑥+𝑦 𝑥+𝑦
Si osservi che sviluppando la disuguaglianza (𝑥 − 𝑦)2 ≥ 0 si ottiene:
𝑥2 + 𝑦2
𝑥𝑦 ≤ .
2
Questa disuguaglianza può essere generalizzata ad esponenti diversi come si
vede nel seguente.
Teorema 5.40 (disuguaglianza di Young). Se 𝑝 > 1, 𝑞 > 1, 1

𝑝 + 1
𝑞 = 1, 𝑥, 𝑦 ≥ 0:
𝑥𝑝 𝑦𝑞
𝑥𝑦 ≤ + . (5.3)
𝑝 𝑞
Dimostrazione. Si utilizza la disuguaglianza di convessità per la funzione

exp(𝑥) = 𝑒 𝑥 . Visto che la derivata seconda dell’esponenziale è positiva, la
funzione exp è convessa e dunque, se 𝑥 > 0 e 𝑦 > 0 si ha:

1 1
𝑥 · 𝑦 = exp(ln 𝑥 + ln 𝑦) = exp ln(𝑥 𝑝 ) + ln(𝑦 𝑞 )
𝑝 𝑞
1 1 𝑥 𝑝 𝑦𝑞
≤ · exp ln(𝑥 𝑝 ) + exp ln(𝑦 𝑞 ) = + .
𝑝 𝑞 𝑝 𝑞
Se 𝑥 = 0 o 𝑦 = 0 la disuguaglianza è ovvia in quanto il lato sinistro di (5.3) è

nullo.
Teorema 5.41 (disuguaglianza di Hölder). Se 𝑎 𝑘 ≥ 0 e 𝑏 𝑘 ≥ 0 per 𝑘 ∈ ℕ e siano

𝑝 > 1 e 𝑞 > 1 tali che 𝑝1 + 1𝑞 = 1. Allora
! 𝑝1 ! 1𝑞
X X 𝑝 X 𝑞
𝑎𝑘 𝑏𝑘 ≤ 𝑎𝑘 · 𝑏𝑘 .
𝑘 𝑘 𝑘
! 𝑝1 ! 1𝑞
X 𝑝 X 𝑞
𝐴= 𝑎𝑘 , 𝐵= 𝑏𝑘 .
𝑘 𝑘
Se 𝐴 > 0 e 𝐵 > 0 possiamo dividere il lato sinistro della disuguaglianza per il

lato destro e applicare la disuguaglianza (5.3) di Young:
𝑝 𝑞
𝑎𝑘 𝑏𝑘 X 𝑎𝑘 𝑏𝑘 X 1 𝑎𝑘 1 𝑏𝑘
P
𝑘
= · ≤ 𝑝
+
𝐴·𝐵 𝑘
𝐴 𝐵 𝑘
𝑝𝐴 𝑞 𝐵𝑞
𝑝 𝑞
1 𝑘 𝑎𝑘 1 𝑘 𝑏𝑘
P P
1 1
= 𝑝
+ = + = 1.
𝑝 𝐴 𝑞 𝐵𝑞 𝑝 𝑞
E il teorema e dimostrato.
Se fosse 𝐴 = 0 tutti i termini 𝑎 𝑘 sarebbero nulli e la disuguaglianza si riduce

banalmente a 0 ≤ 0. Lo stesso se fosse 𝐵 = 0.
disuguaglianza di Cauchy-Schwarz
5.6 teoremi di Cauchy e de l’Hospital 199
Nel caso 𝑝 = 𝑞 = 2 si ottiene la disuguaglianza di Cauchy-Schwarz

X rX rX
|𝑎 𝑘 𝑏 𝑘 | ≤ 𝑎 2𝑘 · 𝑏 2𝑘
𝑘 𝑘 𝑘
che potrebbe però essere più facilmente dimostrata per un generico prodotto
scalare, come faremo nel teorema 7.6.
5.6 teoremi di Cauchy e de l’Hospital

Cauchy
Teorema 5.42 (Cauchy). Siano 𝑓 : [𝑎, 𝑏] → ℝ e 𝑔 : [𝑎, 𝑏] → ℝ funzioni continue

su tutto [𝑎, 𝑏] e derivabili su (𝑎, 𝑏). Supponiamo inoltre che 𝑔 0(𝑥) ≠ 0 per ogni
𝑥 ∈ (𝑎, 𝑏). Allora 𝑔(𝑏) ≠ 𝑔(𝑎) ed esiste 𝑥0 ∈ (𝑎, 𝑏) tale che
𝑓 0(𝑥0 ) 𝑓 (𝑏) − 𝑓 (𝑎)

= .
𝑔 0(𝑥0 ) 𝑔(𝑏) − 𝑔(𝑎)
Dimostrazione. Si consideri la funzione ausiliaria
ℎ(𝑥) = (𝑔(𝑏) − 𝑔(𝑎)) 𝑓 (𝑥) − ( 𝑓 (𝑏) − 𝑓 (𝑎))𝑔(𝑥).
Per verifica diretta si osserva che
ℎ(𝑏) = 𝑔(𝑏) 𝑓 (𝑎) − 𝑓 (𝑏)𝑔(𝑎) = ℎ(𝑎).
Dunque ℎ verifica le ipotesi del teorema di Rolle ed esiste dunque un punto

𝑥0 ∈ (𝑎, 𝑏) per cui ℎ 0(𝑥 0 ) = 0. Essendo però
ℎ 0(𝑥) = (𝑔(𝑏) − 𝑔(𝑎)) 𝑓 0(𝑥) − ( 𝑓 (𝑏) − 𝑓 (𝑎))𝑔 0(𝑥)
si ottiene
(𝑔(𝑏) − 𝑔(𝑎)) 𝑓 0(𝑥 0 ) = ( 𝑓 (𝑏) − 𝑓 (𝑎))𝑔 0(𝑥 0 ).
Per ipotesi sappiamo che 𝑔 0(𝑥 0 ) ≠ 0. Ma necessariamente anche 𝑔(𝑏) − 𝑔(𝑎) ≠ 0
perché altrimenti potremmo applicare il teorema di Rolle alla funzione 𝑔 e
ottenere che 𝑔 0 si annulla in un punto di (𝑎, 𝑏), cosa che abbiamo escluso per
ipotesi. Dunque possiamo dividere ambo i membri per (𝑔(𝑏) − 𝑔(𝑎)) e per
𝑔 0(𝑥0 ) per ottenere l’uguaglianza enunciata nel teorema.
Teorema 5.43 (de l’Hospital 0/0). Sia 𝐼 ⊆ ℝ un intervallo, 𝑥 0 ∈ [−∞, +∞]

un punto di accumulazione di 𝐼 e siano 𝑓 , 𝑔 : 𝐼 \ {𝑥 0 } → ℝ funzioni derivabili.
Supponiamo che sia 𝑔 0(𝑥) ≠ 0 per ogni 𝑥 ∈ 𝐼 \ {𝑥 0 }. Se
lim 𝑓 (𝑥) = 0 e lim 𝑔(𝑥) = 0

e se esiste (finito o infinito) il limite
𝑓 0(𝑥)
ℓ = lim
𝑥→𝑥0 𝑔 0(𝑥)
allora si ha
𝑓 (𝑥)
lim = ℓ.
𝑥→𝑥 0 𝑔(𝑥)
Dimostrazione. Bisognerà distinguere diversi casi a seconda che 𝑥 0 sia finito

o infinito e che sia un punto interno o un estremo dell’intervallo 𝐼 . Fatta la
dimostrazione nel primo caso tutti gli altri si riconducono ad esso.
Caso 1: supponiamo che sia 𝐼 = [𝑥 0 , 𝑏]. In questo caso possiamo estendere le

funzioni 𝑓 e 𝑔 anche nel punto 𝑥 0 ponendo:
( (
𝑓 (𝑥) se 𝑥 ∈ (𝑥0 , 𝑏] 𝑔(𝑥) se 𝑥 ∈ (𝑥0 , 𝑏]
𝑓˜(𝑥) = 𝑔˜ (𝑥) =
0 se 𝑥 = 𝑥 0 , 0 se 𝑥 = 𝑥 0 .
Visto che per ipotesi 𝑓 (𝑥) → 0 e 𝑔(𝑥) → 0 per 𝑥 → 𝑥 0 risulta che 𝑓˜ e 𝑔˜ siano
funzioni continue su tutto l’intervallo [𝑥 0 , 𝑏] inoltre, sempre per ipotesi, sono
derivabili nell’intervallo (𝑥 0 , 𝑏] visto che l’estensione per 𝑥 = 𝑥 0 non modifica
le derivate negli altri punti. In particolare le funzioni estese soddisfano le
ipotesi del teorema di Cauchy in ogni intervallo [𝑥 0 , 𝑥] con 𝑥 ∈ (𝑥 0 , 𝑏], dunque
possiamo affermare che per ogni 𝑥 esiste 𝑐(𝑥) ∈ (𝑥 0 , 𝑥) tale che
𝑓 (𝑥) 𝑓˜(𝑥) − 𝑓˜(𝑥0 ) 𝑓˜0(𝑐(𝑥)) 𝑓 0(𝑐(𝑥))

= = 0 = 0 .
𝑔(𝑥) 𝑔˜ (𝑥) − 𝑔˜ (𝑥0 ) 𝑔˜ (𝑐(𝑥)) 𝑔 (𝑐(𝑥))
Ma essendo 𝑥 0 < 𝑐(𝑥) < 𝑥 per 𝑥 → 𝑥 0 si ha 𝑐(𝑥) → 𝑥 0 e quindi, tramite un

cambio di variabile (Teorema 2.23) possiamo affermare che
𝑓 (𝑥) 𝑓 0(𝑐(𝑥)) 𝑓 0(𝑥)

lim = lim 0 = lim 0 = ℓ.
𝑥→𝑥0 𝑔(𝑥) 𝑥→𝑥0 𝑔 (𝑐(𝑥)) 𝑥→𝑥0 𝑔 (𝑥)
Caso 2: supponiamo sia 𝐼 qualunque e 𝑥 0 finito. Visto che le funzioni sono

definite su 𝐼 \ {𝑥 0 } possiamo sempre supporre 𝑥 0 ∈ 𝐼 . Inoltre visto che i limiti
dipendono solo dai valori in un intorno del punto 𝑥 0 possiamo sempre supporre
che 𝐼 sia un intervallo chiuso e limitato. Nel passo precedente abbiamo fatto
il caso in cui 𝑥 0 era l’estremo inferiore di 𝐼 , ma allo stesso modo si può fare il
caso in cui 𝑥 0 è l’estremo superiore. Se invece 𝑥 0 fosse un punto interno di 𝐼
possiamo considerare separatamente il limite destro e sinistro e ricondurci ai
casi in cui 𝑥 0 era un estremo.
Caso 3: supponiamo sia 𝑥 0 = +∞. In tal caso l’intervallo 𝐼 contiene un intevallo

[𝑎, +∞) con 𝑎 ∈ ℝ. Anche in questo caso vogliamo ricondurci al primo caso
tramite il cambio di variabile 𝑡 = 1/𝑥 . Posto 𝐹(𝑡) = 𝑓 (1/𝑡) e 𝐺(𝑡) = 𝑔(1/𝑡)
si osserva che 𝐹 e 𝐺 sono definite sull’intervallo (0 , 1/𝑎], tendono a zero per
𝑡 → 0+ sono derivabili,
𝑓 0(1/𝑡) 𝑔 0(1/𝑡))
𝐹0(𝑡) = − , 𝐺0(𝑡) = −
𝑡2 𝑡2
e risulta quindi
𝐹0(𝑡) 𝑓 0(1/𝑡) 𝑓 0(𝑥)

lim+ = lim = lim = ℓ.
𝑡→0 𝐺0(𝑡) 𝑡→0+ 𝑔 0(1/𝑡) 𝑥→+∞ 𝑔 0(𝑥)
5.6 teoremi di Cauchy e de l’Hospital 201
Quindi applicano il teorema nel caso già dimostrato possiamo affermare che
𝑓 (𝑥) 𝐹(𝑡)
lim = lim+ = ℓ.
𝑥→+∞ 𝑔(𝑥) 𝑡→ 0 𝐺(𝑡)
Caso 4: il caso 𝑥 0 = −∞ si svolge in maniera analoga al caso precedente.

de l’Hospital
Teorema 5.44 (de l’Hospital ·/∞). Siano 𝑎, 𝑏 ∈ [−∞, +∞] con 𝑎 < 𝑏 . Siano
𝑓 , 𝑔 : (𝑎, 𝑏) → ℝ funzioni derivabili. Se
lim | 𝑔(𝑥)| = +∞,

𝑥→𝑎 +
se 𝑔 0(𝑥) ≠ 0 per ogni 𝑥 ∈ (𝑎, 𝑏) e se esiste il limite (finito o infinito)
𝑓 0(𝑥)
ℓ = lim+
𝑥→𝑎 𝑔 0(𝑥)
allora si ha
𝑓 (𝑥)
lim+ = ℓ.
𝑥→𝑎 𝑔(𝑥)
Risultato analogo si ha facendo i limiti per 𝑥 → 𝑏 − invece che per 𝑥 → 𝑎 + e di

conseguenza anche nel caso in cui la funzione sia definita su un intervallo “bucato”
𝑓 : (𝑎, 𝑏) \ {𝑥0 } → ℝ e si considerino i limiti “pieni” per 𝑥 → 𝑥0 .
Dimostrazione. Supponiamo per assurdo che non si abbia
𝑓 (𝑥)
lim+ = ℓ.
𝑥→𝑎 𝑔(𝑥)
Allora, per il teorema di collegamento tra limiti di funzione e limiti di successione,

deve esistere una successione 𝑎 𝑘 ∈ (𝑎, 𝑏), 𝑎 𝑘 → 𝑎 tale che non si abbia
𝑓 (𝑎 𝑘 )
lim = ℓ.
𝑘→+∞ 𝑔(𝑎 𝑘 )
Se la successione 𝑓 (𝑎 𝑘 )/𝑔(𝑎 𝑘 ) è limitata allora applicando il teorema di Bolzano

Weierstrass sappiamo esistere una sottosuccessione di 𝑎 𝑘 convergente ad un
valore 𝑚 ≠ ℓ (se tutte le sottosuccessioni convergessero ad ℓ l’intera successione
convergerebbe ad ℓ ). Se invece 𝑓 (𝑎 𝑘 )/𝑔(𝑎 𝑘 ) non è limitata possiamo estrarre
una sottosuccessione che converge a +∞ oppure a −∞. In ogni caso esiste una
successione, che chiameremo ancora 𝑎 𝑘 , ed esiste 𝑚 ∈ ℝ̄ tale che
𝑓 (𝑎 𝑘 )
lim = 𝑚 ≠ ℓ.
𝑘→+∞ 𝑔(𝑎 𝑘 )
Consideriamo ora un intorno 𝑈 di 𝑚 e un intorno 𝑉 di ℓ tali che 𝑈 ∩ 𝑉 = ∅.

Siccome 𝑓 0(𝑥)/𝑔 0(𝑥) → ℓ per 𝑥 → 𝑎 esiste un 𝑐 ∈ (𝑎, 𝑏) tale che per ogni
𝑥 ∈ (𝑎, 𝑐) si ha
𝑓 0(𝑥)
∈ 𝑉.
𝑔 0(𝑥)
Consideriamo allora il seguente rapporto incrementale
𝑓 (𝑎 𝑘 ) 𝑓 (𝑥)
𝑓 (𝑎 𝑘 ) − 𝑓 (𝑥) 𝑔(𝑎 𝑘 )
− 𝑔(𝑎 𝑘 )
=
𝑔(𝑎 𝑘 ) − 𝑔(𝑥) 1−
𝑔(𝑥)
𝑔(𝑎 𝑘 )
e osserviamo che il lato destro tende a 𝑚 per 𝑘 → +∞ in quanto 𝑓 (𝑎 𝑘 )/𝑔(𝑎 𝑘 ) →

𝑚 e visto che | 𝑔(𝑎 𝑘 )| → +∞ si ha 𝑓 (𝑥)/𝑔(𝑎 𝑘 ) → 0 e 𝑔(𝑥)/𝑔(𝑎 𝑘 ) → 0. Dunque
esisterà un 𝑘 per cui il lato destro sta nell’intorno 𝑈 di 𝑚 . Al lato sinistro
possiamo invece applicare il teorema di Cauchy e trovare quindi un punto
𝑦 ∈ (𝑎 𝑘 , 𝑐) per cui tale lato risulti uguale a 𝑓 0(𝑦)/𝑔 0(𝑦). Ma visto che 𝑦 ∈ (𝑎, 𝑐)
si dovrà avere 𝑓 0(𝑦)/𝑔 0(𝑦) ∈ 𝑉 . Questo è assurdo in quanto 𝑈 ∩ 𝑉 = ∅.
5.7 classi di regolarità
Definizione 5.45 (funzioni di classe 𝐶 𝑘 ). Dato 𝐴 ⊆ ℝ denotiamo con ℝ𝐴 l’insieme

𝐶𝑘
di tutte le funzioni 𝑓 : 𝐴 → ℝ. Per ogni 𝑘 ∈ ℕ definiamo 𝐶 𝑘 (𝐴) ⊆ ℝ𝐴 nel modo
seguente:
1. se 𝑘 = 0 poniamo
𝐶 0 (𝐴) = 𝑓 ∈ ℝ𝐴 : 𝑓 continua .

2. se 𝑘 > 0 definiamo induttivamente
𝐶 𝑘 (𝐴) = 𝑓 ∈ ℝ𝐴 : 𝑓 derivabile e 𝑓 0 ∈ 𝐶 𝑘−1 (𝐴) .

𝐶∞ Chiaramente se 𝑗 ≥ 𝑘 si ha 𝐶 𝑗 (𝐴) ⊆ 𝐶 𝑘 (𝐴) dunque 𝐶 𝑘 (𝐴) è una famiglia decrescente

(rispetto all’inclusione insiemistica) ed ha senso definire:
𝐶 ∞ (𝐴) = 𝑓 ∈ ℝ𝐴 : ∀𝑘 ∈ ℕ : 𝑓 ∈ 𝐶 𝑘 (𝐴) = 𝐶 𝑘 (𝐴).

\
𝑘∈ℕ
𝑓 (𝑗)
Le funzioni 𝑓 ∈ 𝐶 𝑘 (𝐴) sono derivabili 𝑘 volte. Utilizziamo la notazione 𝑓 (𝑗) per

denotare la 𝑗 -esima derivata di una funzione 𝑓 . Dunque avremo
𝑓 (0) = 𝑓 , 𝑓 (1) = 𝑓 0 , 𝑓 (2) = 𝑓 00 , . . .
Abbiamo già osservato che ℝ𝐴 è uno spazio vettoriale reale. Gli spazi 𝐶 𝑘 (𝐴)
per 𝑘 = 0 , . . . , ∞ sono una famiglia decrescente di sottospazi vettoriali di ℝ𝐴 .
Infatti sappiamo che la combinazione lineare di funzioni continue è continua e
che la combinazione lineare di funzioni derivabili è derivabile.
E’ importante osservare che 𝐶 1 (𝐴) non coincide con l’insieme delle funzioni
derivabili su 𝐴. Infatti abbiamo già visto nell’esempio 5.25 che esistono funzioni
funzione lipschitziana derivabili la cui derivata non è continua e quindi tali funzioni, pur essendo
derivabili, non sono di classe 𝐶 1 .
5.7 classi di regolarità 203
Definizione 5.46 (funzioni lipschitziane). Una funzione 𝑓 : 𝐴 ⊆ ℝ → ℝ si

dice essere lipschitziana (o anche 𝐿-lipschitziana se vogliamo mettere in evidenza la
dipendenza da 𝐿) se esiste 𝐿 > 0 tale che
| 𝑓 (𝑥) − 𝑓 (𝑦)| ≤ 𝐿|𝑥 − 𝑦| ∀𝑥, 𝑦 ∈ 𝐴.
La più piccola costante 𝐿 per la quale è soddisfatta la precedente relazione si chiama

costante di Lipschitz di 𝑓 . costante di Lipschitz
Teorema 5.47 (criterio di Lipschitz). Sia 𝑓 : 𝐴 ⊆ ℝ una funzione lipschitziana

con costante di Lipschitz 𝐿. Se 𝑓 è derivabile in un punto 𝑥 ∈ 𝐴 allora | 𝑓 0(𝑥)| ≤ 𝐿.
Viceversa se 𝑓 : 𝐼 ⊆ ℝ → ℝ una funzione derivabile definita su un intervallo 𝐼 e se
esiste 𝐿 tale che per ogni 𝑥 ∈ 𝐼 si ha | 𝑓 0(𝑥)| ≤ 𝐿 allora 𝑓 è lipschitziana.
Dimostrazione. Se 𝑓 è Lipschitziana significa che il rapporto incrementale è

limitato. Cioè esiste 𝐿 > 0 tale che
𝑓 (𝑥) − 𝑓 (𝑦)

𝑥−𝑦 ≤𝐿 ∀𝑥, 𝑦 ∈ 𝐴.

Dunque la derivata, che è il limite del rapporto incrementale, se esiste è anch’essa

limitata dalla stessa costante: | 𝑓 0(𝑥)| ≤ 𝐿 per ogni 𝑥 ∈ 𝐴.
Viceversa se la derivata è limitata | 𝑓 0(𝑧)| ≤ 𝐿 per ogni 𝑧 ∈ 𝐼 e se 𝑥, 𝑦 ∈ 𝐼 sono

punti qualunque, allora, per il teorema di Lagrange, il rapporto incrementale di
𝑓 è uguale alla derivata in un punto 𝑧 ∈ (𝑥, 𝑦):
𝑓 (𝑥) − 𝑓 (𝑦)

0
𝑥 − 𝑦 = | 𝑓 (𝑧)| ≤ 𝐿.

e dunque la funzione è 𝐿 lipschitziana:
| 𝑓 (𝑥) − 𝑓 (𝑦)| ≤ 𝐿|𝑥 − 𝑦|.
funzione hoelderiana
Definizione 5.48 (funzioni Hoelderiane). Sia 𝛼 > 0. Una funzione 𝑓 : 𝐴 ⊆ ℝ →

ℝ si dice essere 𝛼-Hoelderiana se esiste una costante 𝐶 > 0 tale che
| 𝑓 (𝑥) − 𝑓 (𝑦)| ≤ 𝐶 |𝑥 − 𝑦| 𝛼 . (5.4)
uniforme continuità
Definizione 5.49 (uniforme continuità). Una funzione 𝑓 : 𝐴 ⊆ ℝ → ℝ si dice
essere uniformemente continua se
∀𝜀 > 0 : ∃𝛿 > 0 : ∀𝑥, 𝑦 ∈ 𝐴 : |𝑥 − 𝑦| < 𝛿 =⇒ | 𝑓 (𝑥) − 𝑓 (𝑦)| < 𝜀.
Teorema 5.50. Ogni funzione lipschitziana è 1-Hoelderiana (e viceversa). Ogni

funzione 𝛼 -Hoelderiana è uniformemente continua. Ogni funzione uniformemente
continua è continua. Ogni funzione 𝛼 -Hoelderiana con 𝛼 > 1 ha derivata nulla.
Dimostrazione. Le prime tre affermazioni seguono direttamente dalle definizioni.

Per l’ultima osservazione si noti che se 𝛼 > 1 nella disuguaglianza (5.4) si può
dividere per |𝑥 − 𝑦| e ottenere quindi che il rapporto incrementale tende a zero
se 𝑦 → 𝑥 .
Definizione 5.51 (modulo di continuità). Sia 𝑓 : 𝐴 ⊆ ℝ → ℝ una funzione.

modulo di continuità Definiamo il modulo di continuità di 𝑓 come la funzione 𝑀 : [0 , +∞) → [0 , +∞]
definita da
𝑀(𝑟) = sup {| 𝑓 (𝑥) − 𝑓 (𝑦)| : 𝑥, 𝑦 ∈ 𝐴, |𝑥 − 𝑦| ≤ 𝑟}.
Teorema 5.52 (proprietà del modulo di continuità). Sia 𝑓 : 𝐴 → ℝ e sia

𝑀 : [0 , +∞) → [0 , +∞) il suo modulo di contintuità. La funzione 𝑀(𝑟) è crescente;
La funzione 𝑓 è uniformemente continua se e solo se
lim 𝑀(𝑟) = 0.
𝑟→0
La funzione 𝑓 è lipschitziana se e solo se esiste 𝐿 tale che
𝑀(𝑟) ≤ 𝐿𝑟.
La funzione 𝑓 è 𝛼 -Hoelderiana se e solo se esiste 𝐶 tale che
𝑀(𝑟) ≤ 𝐶𝑟 𝛼 .
Dimostrazione. Osserviamo che la condizione
𝑀(𝑟) ≤ 𝑐
è equivalente a
∀𝑥, 𝑦 ∈ 𝐴 : |𝑥 − 𝑦| ≤ 𝑟 =⇒ | 𝑓 (𝑥) − 𝑓 (𝑦)| ≤ 𝑐.
La condizione 𝑀(𝑟) → 0 per 𝑟 → 0 significa
∀𝜀 > 0 : ∃𝛿 > 0 : ∀𝑟 > 0 : 𝑟 < 𝛿 =⇒ 𝑀(𝑟) < 𝜀
e diventa quindi la condizione di uniforme continuità.
Le condizioni di lipschitzianità e di 𝛼 -hoelderianità risultano pure immediata-

mente.
Teorema 5.53 (restrizione / incollamento di funzioni uniformemente continue).

Sia 𝑓 : 𝐴 ⊆ ℝ → ℝ una funzione uniformemente continua. Se 𝐵 ⊆ 𝐴 la restrizione
𝑓|𝐵 di 𝑓 a 𝐵 è anch’essa uniformemente continua.
Siano 𝐼, 𝐽 ⊆ ℝ intervalli tali che 𝐼 ∩ 𝐽 ≠ ∅. Sia 𝑓 : 𝐼 ∪ 𝐽 → ℝ una funzione. Se 𝑓 |𝐼 e

𝑓|𝐽 sono uniformemente continue allora 𝑓 è uniformemente continua.
5.7 classi di regolarità 205
Dimostrazione. La prima parte, sulla restrizione di una funzione uniformemente

continua, deriva direttamente dalla definizione: se una qualunque proprietà
vale per ogni 𝑥, 𝑦 ∈ 𝐴 allora a maggior ragione vale per ogni 𝑥, 𝑦 ∈ 𝐵 quando
𝐵 ⊆ 𝐴.
Vediamo la seconda parte dell’enunciato: supponiamo 𝑓 sia uniformemente

continua su 𝐼 e su 𝐽 . Sia dato 𝜀 > 0 e siano 𝛿 1 e 𝛿 2 i valori di 𝛿 dati dalle
condizioni di uniforme continuità di 𝑓 rispettivamente su 𝐼 e su 𝐽 . Consideriamo
𝛿 = min {𝛿 1 , 𝛿2 }. Siano ora 𝑥, 𝑦 punti qualunque di 𝐼 ∪ 𝐽 con |𝑥 − 𝑦| < 𝛿.
Si possono allora avere due casi possibili: 𝑥 e 𝑦 stanno nello stesso intervallo
(𝐼 o 𝐽 ) oppure stanno uno in 𝐼 e l’altro in 𝐽 . Nel primo caso essendo 𝛿 < 𝛿 1 e
𝛿 < 𝛿2 l’uniforme continuità di 𝑓 su 𝐼 e su 𝐽 garantisce che valga in ogni caso
| 𝑓 (𝑥) − 𝑓 (𝑦)| < 𝜀. Nel secondo caso deve esistere un punto 𝑧 ∈ 𝐼 ∩ 𝐽 che sia un
punto intermedio tra 𝑥 e 𝑦 . Allora usando la disuguaglianza triangolare:
| 𝑓 (𝑥) − 𝑓 (𝑦)| ≤ | 𝑓 (𝑥) − 𝑓 (𝑧)| + | 𝑓 (𝑧) − 𝑓 (𝑦)| ≤ 𝜀 + 𝜀.
si ottiene dunque (salvo rimpiazzare 𝜀 con 𝜀/2) anche in questo caso la stima
voluta.
Heine-Cantor
Teorema 5.54 (Heine-Cantor). Siano 𝑎, 𝑏 ∈ ℝ, 𝑎 < 𝑏 . Sia 𝑓 : [𝑎, 𝑏] → ℝ una

funzione continua. Allora 𝑓 è uniformemente continua.
Dimostrazione. Supponiamo per assurdo che 𝑓 non sia uniformemente continua.

Allora 𝑓 soddisfa la negazione della proprietà
∀𝜀 > 0 : ∃𝛿 > 0 : ∀𝑥, 𝑦 ∈ 𝐴 : |𝑥 − 𝑦| < 𝛿 =⇒ | 𝑓 (𝑥) − 𝑓 (𝑦)| < 𝜀
che è
∃𝜀 > 0 : ∀𝛿 > 0 : ∃𝑥, 𝑦 ∈ 𝐴 : |𝑥 − 𝑦| < 𝛿 ∧ | 𝑓 (𝑥) − 𝑓 (𝑦)| ≥ 𝜀.
Dunque dato 𝜀 > 0 che soddisfa la precedente proprietà possiamo prendere

𝛿 = 1/𝑘 per ogni 𝑘 ∈ ℕ , ottenendo quindi due successioni 𝑥 𝑘 , 𝑦 𝑘 tali che
1
|𝑥 𝑘 − 𝑦 𝑘 | < e | 𝑓 (𝑥 𝑘 ) − 𝑓 (𝑦 𝑘 )| ≥ 𝜀.
𝑘
Per il teorema di Bolzano-Weierstrass esisterà una sottosuccessione convergente
𝑥 𝑘 𝑗 → 𝑐 . Visto che |𝑥 𝑘 − 𝑦 𝑘 | → 0 si dovrà avere anche 𝑦 𝑘 𝑗 → 𝑐 . Ma allora, per
la continuità di 𝑓 :
𝑓 (𝑥 𝑘 ) − 𝑓 (𝑦 𝑘 ) → | 𝑓 (𝑐) − 𝑓 (𝑐)| = 0

𝑗 𝑗
in contraddizione con la condizione | 𝑓 (𝑥 𝑘 ) − 𝑓 (𝑦 𝑘 )| ≥ 𝜀. teorema dell’asintoto
Teorema 5.55 (dell’asintoto). Sia 𝑓 : [𝑎, +∞) → ℝ una funzione continua e sia
𝑔 : [𝑎, +∞) → ℝ una funzione uniformemente continua tale che
lim 𝑓 (𝑥) − 𝑔(𝑥) = 0.

𝑥→+∞
Allora anche 𝑓 è uniformemente continua.
asintoto obliquo In particolare se 𝑓 ha un asintoto obliquo ovvero se esistono 𝑚 ∈ ℝ e 𝑞 ∈ ℝ tali che
lim 𝑓 (𝑥) − (𝑚𝑥 + 𝑞) = 0

𝑥→+∞
allora 𝑓 , se è continua, è uniformemente continua.
Risultato analogo vale per le funzioni definite su intervalli del tipo (−∞, 𝑎] (facendo i
limiti a −∞) e quindi per funzioni definite su tutto ℝ (facendo i limiti sia a +∞ che a
−∞).
Dimostrazione. Per ogni 𝜀 > 0 esiste 𝑀 > 𝑎 tale che | 𝑓 (𝑥) − 𝑔(𝑥)| < 𝜀/3 per
ogni 𝑥 ≥ 𝑀 . D’altra parte la funzione 𝑓 , per il teorema di Heine-Cantor,
è uniformemente continua su [𝑎, 𝑀 + 1] e dunque esiste 𝛿 1 > 0 tale che
presi 𝑥, 𝑦 ∈ [𝑎, 𝑀 + 1] con |𝑥 − 𝑦| < 𝛿 1 si ha | 𝑓 (𝑥) − 𝑓 (𝑦)| < 𝜀. D’altra
parte 𝑔 è uniformemente continua su [𝑀, +∞) e quindi esiste 𝛿 2 tale che dati
𝑥, 𝑦 ∈ [𝑀, +∞) con |𝑥 − 𝑦| < 𝛿 2 si ha | 𝑔(𝑥) − 𝑔(𝑦)| < 𝜀/3. Ma in quest’ultimo
caso si ha:
| 𝑓 (𝑥) − 𝑓 (𝑦)| ≤ | 𝑓 (𝑥) − 𝑔(𝑥)| + | 𝑔(𝑥) − 𝑔(𝑦)| + | 𝑔(𝑦) − 𝑓 (𝑦)|

𝜀 𝜀 𝜀
≤ + + = 𝜀.
3 3 3
Posto dunque 𝛿 = min {1 , 𝛿 1 , 𝛿 2 } scelti comunque 𝑥, 𝑦 ∈ [𝑎, +∞) con |𝑥 − 𝑦| <

𝛿 siamo certamente in uno dei due casi precedenti e quindi, in ogni caso, si
ottiene | 𝑓 (𝑥) − 𝑓 (𝑦)| < 𝜀, come dovevamo dimostrare.
Nel caso particolare 𝑔(𝑥) = 𝑚𝑥 + 𝑞 si osserva semplicemente che 𝑔 è uniforme-

mente continua in quanto è 𝐿-lipschitziana con 𝐿 = |𝑚| .
5.8 formula di Taylor
Definizione 5.56 (polinomio di Taylor). Sia 𝐴 ⊆ ℝ, 𝑓 : 𝐴 → ℝ una funzione e sia

𝑥0 ∈ 𝐴 un punto in cui la derivata 𝑛 -esima (e quindi anche le derivate precedenti) sia
definita.
Allora il polinomio:
𝑛
𝑓 (𝑘) (𝑥0 )
(𝑥 − 𝑥0 ) 𝑘
X
𝑃(𝑥) =
𝑘=0
𝑘!
polinomio di Taylor
viene detto polinomio di Taylor di ordine 𝑛 della funzione 𝑓 , centrato in 𝑥 0 .
polinomio di MacLaurin Nel caso particolare in cui sia 𝑥 0 = 0 il polinomio di Taylor viene anche chiamato
polinomio di MacLaurin.
Teorema 5.57 (caratterizzazione polinomio di Taylor). Il polinomio di Taylor di

una funzione 𝑓 , di ordine 𝑛 , centrato in 𝑥 0 è l’unico polinomio 𝑃 di grado non superiore
ad 𝑛 tale che
𝑃 (𝑘) (𝑥 0 ) = 𝑓 (𝑘) (𝑥0 ), ∀𝑘 ∈ {0, . . . , 𝑛}.
5.8 formula di Taylor 207
Dimostrazione. Ogni polinomio di grado non superiore ad 𝑛 può essere scritto

nella forma:
𝑛
𝑎 𝑘 (𝑥 − 𝑥0 ) 𝑘
X
𝑃(𝑥) =
𝑘=0
(basti notare che se 𝑃(𝑥) è un polinomio anche 𝑄(𝑡) = 𝑃(𝑥 0 + 𝑡) è un polinomio)

e le sue derivate sono:
𝑛
𝑘!
· (𝑥 − 𝑥0 ) 𝑘−𝑗 .
X
𝑃 (𝑗) (𝑥) = 𝑎𝑘 ·
𝑘=𝑗
(𝑘 − 𝑗)!
Per 𝑥 = 𝑥 0 l’unico addendo non nullo è quello con 𝑘 = 𝑗 , dunque
𝑃 (𝑘) (𝑥 0 ) = 𝑘 ! · 𝑎 𝑘 .
Dunque si ha 𝑃 (𝑘) (𝑥 0 ) = 𝑓 (𝑘) (𝑥 0 ) se e solo se 𝑎 𝑘 = 𝑓 (𝑘) (𝑥 0 )/𝑘 ! cioè se 𝑃 è il

polinomio di Taylor di 𝑓 .
Osservazione 5.58 (polinomio di Taylor della derivata). Se 𝑃𝑛 è il polinomio di

Taylor centrato in 𝑥 0 di ordine 𝑛 per 𝑓 , allora si ha
𝑛
𝑓 (𝑘) (𝑥)
· 𝑘(𝑥 − 𝑥0 ) 𝑘−1
X
𝑃𝑛0 (𝑥) =
𝑘=1
𝑘!
𝑛
𝑓 (𝑘)
(𝑥 − 𝑥 0 ) 𝑘−1
X
=
𝑘=1
(𝑘 − 1)!
𝑛−1
𝑓 (𝑗+1)
(𝑥 − 𝑥0 ) 𝑗 .
X
=
𝑗=0
𝑗!
Dunque si verifica che 𝑃𝑛0 è il polinomio di Taylor di ordine 𝑛 − 1 per 𝑓 0. In breve: il

polinomio di Taylor di ordine 𝑛 − 1 della derivata è la derivata del polinomio di Taylor
di ordine 𝑛 della funzione.
Viceversa se
𝑛
𝑎 𝑘 (𝑥 − 𝑥 0 ) 𝑘
X
𝑘=0 Vedremo che questa è una primiti-
va del polinomio dato (si veda la
è il polinomio di Taylor di ordine 𝑛 della derivata 𝑓 0(𝑥), allora il polinomio di Taylor di definizione 6.24).
ordine 𝑛 + 1 di 𝑓 sarà
𝑛
𝑎𝑘
· (𝑥 − 𝑥0 ) 𝑘+1
X
𝑃𝑛+1 (𝑥) = 𝑓 (𝑥0 ) + (5.5)
𝑘=0
𝑘+1
in quanto
𝑓 (𝑘+1) (𝑥0 ) ( 𝑓 0)(𝑘) (𝑥0 ) 𝑎𝑘 · 𝑘! 𝑎𝑘
= = = . Taylor con resto di Lagrange
(𝑘 + 1)! (𝑘 + 1)! (𝑘 + 1)! 𝑘+1
Teorema 5.59 (formula di Taylor con resto di Lagrange). Sia 𝐼 ⊆ ℝ un intervallo,

𝑥0 ∈ 𝐼 , 𝑓 ∈ 𝐶 𝑛+1 (𝐼). Sia 𝑃 il polinomio di Taylor di 𝑓 di ordine 𝑛 centrato in 𝑥 0 . Per
ogni 𝑥 ∈ 𝐼 esiste 𝑦 ∈ [𝑥 0 , 𝑥) (se 𝑥 > 𝑥 0 altrimenti si intende 𝑦 ∈ (𝑥, 𝑥 0 ]) tale che
𝑓 (𝑛+1) (𝑦)
𝑓 (𝑥) = 𝑃(𝑥) + (𝑥 − 𝑥0 )𝑛+1 .
(𝑛 + 1)!
Dimostrazione. Se 𝑥 = 𝑥 0 basta prendere 𝑦 = 𝑥 0 . Supponiamo allora che sia

𝑥 > 𝑥0 (il caso 𝑥 < 𝑥0 è del tutto analogo).
Posto 𝑅(𝑥) = 𝑓 (𝑥) − 𝑃(𝑥) osserviamo che essendo 𝑃 (𝑘) (𝑥 0 ) = 𝑓 (𝑘) (𝑥 0 ) (teo-
rema 5.57) si ha 𝑅 (𝑘) (𝑥 0 ) = 0 per 𝑘 = 0 , 1 , . . . , 𝑛 . In particolare 𝑅 (𝑘) (𝑥) =
𝑅 (𝑘) (𝑥) − 𝑅 (𝑘) (𝑥0 ) è l’incremento di 𝑅 (𝑘) sull’intervallo [𝑥0 , 𝑥]. Analogamente
osserviamo che (𝑥 − 𝑥 0 )𝑛+1 è anch’essa una funzione che si annulla in 𝑥 0 con
tutte le sue derivate e dunque (𝑥 − 𝑥 0 )𝑛+1 è l’incremento della funzione sullo
stesso intervallo.
Dunque possiamo applicare il teorema di Cauchy alle funzioni 𝑓 (𝑥) − 𝑃(𝑥) e

(𝑥 − 𝑥0 )𝑛+1 sull’intervallo [𝑥0 , 𝑥] per ottenere l’esistenza di un punto 𝑥 1 ∈ (𝑥0 , 𝑥)
tale che
𝑓 (𝑥) − 𝑃(𝑥) 𝑓 0(𝑥1 ) − 𝑃 0(𝑥1 )
= .
(𝑥 − 𝑥0 )𝑛+1 (𝑛 + 1)(𝑥1 − 𝑥0 )𝑛
Di nuovo applichiamo il teorema di Cauchy alle funzioni 𝑅0(𝑥) e (𝑛 + 1)(𝑥 − 𝑥 0 )𝑛
sull’intervallo [𝑥 0 , 𝑥 1 ] per ottenere l’esistenza di un punto 𝑥 2 ∈ (𝑥 0 , 𝑥 1 ) ⊆ (𝑥 0 , 𝑥)
tale che
𝑓 0(𝑥1 ) − 𝑃 0(𝑥1 ) 𝑓 00(𝑥2 ) − 𝑃 00(𝑥2 )
= .
(𝑛 + 1)(𝑥1 − 𝑥0 )𝑛 (𝑛 + 1)𝑛(𝑥2 − 𝑥0 )𝑛−1
Possiamo iterare il procedimento per 𝑛 + 1 volte ottenendo quindi l’esistenza di
un punto 𝑥 𝑛+1 ∈ (𝑥 0 , 𝑥) tale che
𝑓 (𝑥) − 𝑃(𝑥) 𝑓 (𝑛+1) (𝑥 𝑛+1 ) − 𝑃 (𝑛+1) (𝑥 𝑛+1 )

= .
(𝑥 − 𝑥0 )𝑛+1 (𝑛 + 1)!
Ma 𝑃 è un polinomio di grado al più 𝑛 e quindi la sua derivata (𝑛 + 1)-esima è

nulla perciò otteniamo, ponendo 𝑦 = 𝑥 𝑛+1 :
𝑓 (𝑛+1) (𝑦)
𝑓 (𝑥) − 𝑃(𝑥) = (𝑥 − 𝑥 0 )𝑛+1
(𝑛 + 1)!
Esempio 5.60 (somma della serie armonica a segni alterni). Consideriamo la

funzione 𝑓 (𝑥) = ln 𝑥 . Si osservi che
𝑓 0(𝑥) = 𝑥 −1 , 𝑓 00(𝑥) = −𝑥 −2 , 𝑓 000(𝑥) = 2 𝑥 −3 ,

(−1) 𝑘−1 (𝑘 − 1)!
𝑓 (4) (𝑥) = −3 · 2 𝑥 −4 , ... 𝑓 (𝑘) (𝑥) =
𝑥𝑘
e si ha quindi, per ogni 𝑘 ≥ 1
𝑓 (𝑘) (1) (−1) 𝑘−1

=
𝑘! 𝑘
da cui si deduce che il polinomio di Taylor di ordine 𝑛 centrato in 𝑥 0 = 1 è

𝑛
(𝑥 − 1) 𝑘
(−1) 𝑘−1
X
𝑃(𝑥) = .
𝑘=1
𝑘
La formula di Taylor con resto di Lagrange ci dice allora che per ogni 𝑥 > 1 esiste
𝑦 ∈ (1, 𝑥) tale che
𝑛
(𝑥 − 1) 𝑘 (−1)𝑛 (𝑥 − 1)𝑛+1
(−1) 𝑘−1
X
ln(𝑥) − = .
𝑘=1
𝑘 (𝑛 + 1)𝑦 𝑛+1
Se 𝑥 = 2 si ha 𝑦 > 1 e (𝑥 − 1)𝑛+1 = 1 dunque il lato destro tende a zero per 𝑛 → +∞

(attenzione che 𝑦 dipende anch’esso da 𝑛 ). Abbiamo quindi trovato la somma della serie
armonica a segni alterni:
+∞
X (−1) 𝑘−1
= ln 2.
𝑘=1
𝑘
Nel teorema seguente utilizzeremo una nuova notazione. Scriveremo
𝑓 (𝑥) = 𝑃(𝑥) + 𝑜(𝑔(𝑥)), per 𝑥 → 𝑥 0
(si legga: “ 𝑓 (𝑥) è uguale a 𝑃(𝑥) più un 𝑜 -piccolo di 𝑔(𝑥)”) se risulta
𝑓 (𝑥) − 𝑃(𝑥)
𝑓 (𝑥) − 𝑃(𝑥) 𝑔(𝑥) ovvero lim = 0.
cioè la quantità 𝑜(𝑔(𝑥)) rappresenta una funzione incognita che però sappiamo
essere trascurabile (nel senso appena descritto) della funzione 𝑔(𝑥). Questa
notazione è molto comoda ma va utilizzata con cautela: ci dedicheremo il
capitolo 5.9 a cui rimandiamo per maggiori dettagli.
Teorema 5.61 (formula di Taylor con resto di Peano). Sia 𝐼 ⊆ ℝ un intervallo,

𝑥0 ∈ 𝐼 , 𝑓 ∈ 𝐶 𝑛−1 (𝐼) con 𝑓 (𝑛−1) derivabile in 𝑥0 (in particolare è sufficiente che sia
𝑓 ∈ 𝐶 𝑛 (𝐼)). Sia 𝑃 il polinomio di Taylor di 𝑓 di ordine 𝑛 centrato in 𝑥 0 . Allora si ha
𝑓 (𝑥) − 𝑃(𝑥)
lim =0 (5.6)
𝑥→𝑥0 (𝑥 − 𝑥0 )𝑛
ovvero, scritto in maniera più espressiva:
𝑓 (𝑥) = 𝑃(𝑥) + 𝑜((𝑥 − 𝑥0 )𝑛 ). (5.7)
Viceversa se 𝑃(𝑥) è un polinomio di grado che non supera 𝑛 e vale la formula (5.7)
allora 𝑃 è il polinomio di Taylor di 𝑓 .
Dimostrazione. Iniziamo come per la dimostrazione del teorema 5.59. dobbiamo

mostrare che
𝑓 (𝑥) − 𝑃(𝑥)
lim = 0.
𝑥→𝑥 0 (𝑥 − 𝑥 0 )𝑛
Posto 𝑅(𝑥) = 𝑓 (𝑥) − 𝑃(𝑥) osserviamo che si ha 𝑅 (𝑘) (𝑥 0 ) = 0 per 𝑘 = 0 , 1 , . . . , 𝑛

e lo stesso vale per la funzione 𝑆(𝑥) = (𝑥 − 𝑥 0 )𝑛 . Dunque possiamo applicare il
teorema 5.42 di Cauchy ottenendo che esiste un punto 𝑥 1 ∈ [𝑥 0 , 𝑥] tale che
𝑓 (𝑥) − 𝑃(𝑥) 𝑓 0(𝑥1 ) − 𝑃 0(𝑥1 )

= .
(𝑥 − 𝑥0 )𝑛 𝑛(𝑥1 − 𝑥 0 )𝑛−1
Se sapessimo che 𝑓 ∈ 𝐶 𝑛 (𝐼) potrem- Possiamo iterare questo procedimento 𝑛 − 1 volte ottenendo
mo iterare 𝑛 volte e arrivare immediata-
mente al risultato in quanto 𝑓 (𝑛) (𝑥 𝑛 ) → 𝑓 (𝑥) − 𝑃(𝑥) 𝑓 0(𝑥1 ) − 𝑃 0(𝑥 1 ) 𝑓 00(𝑥 2 ) − 𝑃 00(𝑥2 )
𝑓 (𝑛) (𝑥0 ) = 0 per 𝑥 𝑛 → 𝑥0 . Ma noi ab- = = = ...
biamo supposto che la derivata 𝑛 -esima
(𝑥 − 𝑥0 )𝑛 𝑛(𝑥1 − 𝑥0 )𝑛−1 𝑛(𝑛 − 1)(𝑥2 − 𝑥0 )𝑛−2
esiste solamente nel punto 𝑥 0 e quindi 𝑓 (𝑛−1) (𝑥 𝑛−1 ) − 𝑃 (𝑛−1) (𝑥 𝑛−1 )
nell’ultimo passaggio dovremo utilizza- =
re la definizione di derivata invece che il
𝑛 !(𝑥 𝑛−1 − 𝑥 0 )
teorema di Cauchy.
con 𝑥 1 ∈ [𝑥 0 , 𝑥], 𝑥 2 ∈ [𝑥 0 , 𝑥 1 ], . . . , 𝑥 𝑛−1 ∈ [𝑥 0 , 𝑥 𝑛−2 ] ⊆ [𝑥 0 , 𝑥]. In particolare si
avrà 𝑥 𝑛−1 → 𝑥 0 per 𝑥 → 𝑥 0 e basterà quindi dimostrare che
𝑅 (𝑛−1) (𝑥)
→ 0, per 𝑥 → 𝑥 0 .
𝑥 − 𝑥0
Ma visto che la derivata del polinomio di Taylor coincide con il polinomio di

Taylor della derivata si ha che 𝑃 (𝑛−1) (𝑥) è il polinomio di Taylor di ordine 1 della
funzione 𝑓 (𝑛−1) (𝑥) si avrà
𝑃 (𝑛−1) (𝑥) = 𝑓 (𝑛−1) (𝑥 0 ) + 𝑓 (𝑛) (𝑥 0 )(𝑥 − 𝑥0 )
da cui
𝑅 (𝑛−1) (𝑥) 𝑓 (𝑛−1) (𝑥) − 𝑃 (𝑛−1) (𝑥) 𝑓 (𝑛−1) (𝑥) − 𝑓 (𝑛−1) (𝑥 0 )

= = − 𝑓 (𝑛) (𝑥0 )
𝑥 − 𝑥0 𝑥 − 𝑥0 𝑥 − 𝑥0
→ 𝑓 (𝑛) (𝑥0 ) − 𝑓 (𝑛) (𝑥0 ) = 0
per definizione di derivata 𝑛 -esima:
𝑓 (𝑛−1) (𝑥) − 𝑓 (𝑛−1) (𝑥0 )

𝑓 (𝑛) (𝑥0 ) = lim .
𝑥→𝑥 0 𝑥 − 𝑥0
Per completare la dimostrazione dobbiamo dimostrare che il polinomio di

Taylor 𝑃 è l’unico polinomio di grado non superiore ad 𝑛 che soddisfa la
condizione (5.6). Se ci fosse un altro polinomio 𝑄 con la stessa proprietà la
differenza 𝑅 = ( 𝑓 − 𝑃) − ( 𝑓 − 𝑄) = 𝑄 − 𝑃 dovrebbe essere un polinomio di
grado non superiore ad 𝑛 che soddisfa la condizione
𝑅(𝑥)
lim = 0. (5.8)
𝑥→𝑥 0 (𝑥 − 𝑥 0 )𝑛
Posto
𝑛
𝑎 𝑘 (𝑥 − 𝑥0 ) 𝑘
X
𝑅(𝑥) =
𝑘=0
osserviamo che 𝑅(𝑥) → 𝑅(𝑥 0 ) = 𝑎 0 per 𝑥 → 𝑥 0 . Affinché valga (5.8) deve

necessariamente essere 𝑎 0 = 0. Ma in tal caso possiamo raccogliere 𝑥 − 𝑥 0 a
numeratore e denominatore e da (5.8) ottenere

P𝑛
𝑘=1
𝑎 𝑘 (𝑥 − 𝑥 0 ) 𝑘−1
lim = 0.
𝑥→𝑥 0 (𝑥 − 𝑥 0 )𝑛−1
Iterando il procedimento scopriamo che tutti i coefficienti 𝑎 𝑘 devono essere

nulli e dunque 𝑄 = 𝑃 .
Definizione 5.62 (coefficiente binomiale reale). Dato 𝛼 ∈ ℝ, 𝑘 ∈ ℕ definiamo
𝛼 𝛼 · (𝛼 − 1) · · · (𝛼 − 𝑘 + 1)

= .
𝑘 𝑘!
Osserviamo che se 𝛼 ∈ ℕ questa definizione coincide con la definizione data nel

capitolo 1.11.
Teorema 5.63 (sviluppi di Taylor di alcune funzioni elementari). Per ogni 𝑛 ∈ ℕ

si hanno, per 𝑥 → 0 le relazioni riportate nella tabella 5.2.
Dimostrazione. Per definizione, il coefficiente del termine 𝑥 𝑘 nel polinomio di

Taylor di 𝑓 (𝑥) non è altro che 𝑎 𝑘 = 𝑓 (𝑘) (0)/𝑘 ! Se 𝑓 (𝑥) = 𝑒 𝑥 allora 𝑓 (𝑘) (𝑥) = 𝑒 𝑥 e
dunque 𝑓 (𝑘) (0) = 1. Si trovano quindi i coefficienti 𝑎 𝑘 = 1/𝑘 !.
Se 𝑓 (𝑥) = sin 𝑥 si ha 𝑓 0(𝑥) = cos 𝑥 , 𝑓 00(𝑥) = − sin 𝑥 , 𝑓 000(𝑥) = − cos 𝑥 e 𝑓 (4) (𝑥) =
sin 𝑥 ... e poi le derivate si ripetono ogni quattro iterazioni. Valutando le
derivate in 𝑥 = 0 si ottiene dunque la sequenza 0 , 1 , 0 , −1 , . . . che si ripete
indefinitamente. Si ottiene dunque lo sviluppo indicato. Discorso analogo si
può fare per 𝑓 (𝑥) = cos 𝑥 .
Se 𝑓 (𝑥) = (1 + 𝑥)𝛼 si ottiene 𝑓 0(𝑥) = 𝛼(1 + 𝑥)𝛼−1 , 𝑓 00(𝑥) = 𝛼(𝛼 − 1)(1 + 𝑥)𝛼−2 e
così via... Valutando le derivate in 𝑥 = 0 si ottiene la sequenza: 1, 𝛼 , 𝛼(𝛼 − 1),
𝛼(𝛼 − 1)(𝛼 − 2). . . da cui, dividendo per 𝑘 !, si ottiene che i coefficienti del
polinomio di Taylor risultano essere i coefficienti binomiali 𝛼𝑘 .
Se 𝑓 (𝑥) = ln(1 + 𝑥) osserviamo che 𝑓 (0) = 0 poi si ha 𝑓 0(𝑥) = (1 + 𝑥)−1 e le

derivate successive coincidono dunque con le derivate di (1 + 𝑥)𝛼 con 𝛼 = −1:
i coefficienti (a parte il primo che è nullo) concidono quindi con i coefficienti
binomiali
(−1)(−2)(−3) . . . (−𝑘)

−1
= = (−1) 𝑘 .
𝑘 𝑘!
Similmente se 𝑓 (𝑥) = arctg 𝑥 osserviamo che 𝑓 (0) = 0 e 𝑓 0(𝑥) = (1 + 𝑥 2 )−1 . Per

quanto già visto sappiamo che si ha
𝑛
(−1) 𝑘 𝑦 𝑘 + 𝑜(𝑦 𝑛 )
X
(1 + 𝑦)−1 =
𝑘=0
da cui sostituendo 𝑦 = 𝑥 2 si ha
𝑛
(−1) 𝑘 𝑥 2 𝑘 + 𝑜(𝑥 2𝑛 ).
X
𝑓 0(𝑥) = (1 + 𝑥 2 )−1 =
𝑘=0
Utilizzando la seconda parte del Teorema 5.61 (formula di Taylor con resto di
Peano), abbiamo verificato che vale l’equazione (5.7) per il polinomio 𝑃(𝑥) =
P𝑛
𝑘=0
(−1) 𝑘 𝑥 2 𝑘 . Dunque 𝑃(𝑥) è il polinomio di Taylor di grado 2𝑛 di 𝑓 0(𝑥). Ma il
polinomio di Taylor della derivata è la derivata del polinomio di Taylor, quindi
possiamo utilizzare (5.5) per ottenere il polinomio di Taylor riportato in tabella.
Metodo analogo si usa per 𝑓 (𝑥) = arcsin 𝑥 , osservando che
1 1
𝑓 0(𝑥) = √ = (1 − 𝑥 2 )− 2
1 − 𝑥2
𝑛 1
−2
(−𝑥 2 ) 𝑘 + 𝑜(𝑥 2𝑛 )
X
=
𝑘=0 𝑘
𝑛 − 21 · − 12 − 1 · · · − 12 − 𝑘 + 1

(−1) 𝑘 𝑥 2 𝑘 + 𝑜(𝑥 2𝑛 )
X
=
𝑘=0
𝑘!
𝑛 −1
· −3
· · · −(22𝑘−1)
2 2
(−1) 𝑘 𝑥 2 𝑘 + 𝑜(𝑥 2𝑛 )
X
=
𝑘=0
𝑘!
𝑛
(2 𝑘 − 1)!!
𝑥 2 𝑘 + 𝑜(𝑥 2𝑛 )
X
=
𝑘=0 2𝑘 · 𝑘 !
𝑛
(2 𝑘 − 1)!!
𝑥 2 𝑘 + 𝑜(𝑥 2𝑛 )
X
=
𝑘=0
(2 𝑘)!!
abbiamo trovato il polinomio di Taylor di 𝑓 0(𝑥) e utilizzando (5.5) si ottiene la

formula riportata in tabella.
Per quanto riguarda la funzione 𝑓 (𝑥) = tg 𝑥 ci limitiamo a calcolare esplicita-
mente i primi termini:
𝑓 (𝑥) = tg 𝑥 𝑓 (0) = 0
𝑓 (1) = 1 + 𝑓 2 𝑓 (1) (0) = 1
𝑓 (2) = 2 𝑓 𝑓 0 𝑓 (2) (0) = 0
𝑓 (3) = 2( 𝑓 0)2 + 2 𝑓 𝑓 00 𝑓 (3) (0) = 2
𝑓 (4) = 4 𝑓 0 𝑓 00 + 2 𝑓 0 𝑓 00 + 2 𝑓 𝑓 000 = 6 𝑓 0 𝑓 00 + 2 𝑓 𝑓 000 𝑓 (4) (0) = 0
𝑓 (5) = 6( 𝑓 00)2 + 6 𝑓 0 𝑓 000 + 2 𝑓 0 𝑓 000 + 2 𝑓 𝑓 (4)
= 6( 𝑓 00)2 + 8 𝑓 0 𝑓 000 + 2 𝑓 𝑓 (4) 𝑓 (5) (0) = 16.
Si ottengono quindi i coefficienti: 𝑎 0 = 0, 𝑎 1 = 1, 𝑎 2 = 0, 𝑎 3 = 2/3! = 1/3, 𝑎 4 = 0,

𝑎5 = 16/5! = 2/15.
Tabella 5.2: sviluppi di Taylor, per 𝑥 →

𝑛
𝑥𝑘 0, di alcune funzioni elementari. Si veda
𝑒𝑥 = + 𝑜(𝑥 𝑛 )
X
il teorema 5.63
𝑘=0
𝑘!
𝑥2 𝑥3 𝑥𝑛
=1+𝑥+ + +···+ + 𝑜(𝑥 𝑛 )
2 6 𝑛!
𝑛
𝑥 2 𝑘+1
(−1) 𝑘 + 𝑜(𝑥 2𝑛+2 )
X
sin 𝑥 =
𝑘=0
( 2 𝑘 + 1 )!
𝑥3 𝑥 2𝑛+1
=𝑥− + · · · + (−1)𝑛 + 𝑜(𝑥 2𝑛+2 )
6 (2𝑛 + 1)!
𝑛
𝑥 2𝑘
(−1) 𝑘 + 𝑜(𝑥 2𝑛+1 )
X
cos 𝑥 =
𝑘=0
(2 𝑘)!
𝑥2 𝑥4 𝑥 2𝑛
=1− + − · · · + (−1)𝑛 + 𝑜(𝑥 2𝑛+1 )
2 24 (2𝑛)!
𝑛
𝛼 𝛼
𝑥 𝑘 + 𝑜(𝑥 𝑛 )
X
(1 + 𝑥) =
𝑘=0
𝑘
𝛼(𝛼 − 1) 2 𝛼 𝑛

= 1 + 𝛼𝑥 + 𝑥 +···+ 𝑥 + 𝑜(𝑥 𝑛 )
2 𝑛
𝑛
𝑥𝑘
(−1) 𝑘−1 + 𝑜(𝑥 𝑛 )
X
ln(1 + 𝑥) =
𝑘=1
𝑘
𝑥2 𝑥3 𝑥𝑛
=𝑥− + − · · · + (−1)𝑛−1 + 𝑜(𝑥 𝑛 )
2 3 𝑛
𝑛
𝑥 2 𝑘+1
(−1) 𝑘 + 𝑜(𝑥 2𝑛+1 )
X
arctg 𝑥 =
𝑘=0
2𝑘 + 1
𝑥3 𝑥5 𝑥 2𝑛+1
=𝑥− + − · · · + (−1)𝑛 + 𝑜(𝑥 2𝑛+1 )
3 5 2𝑛 + 1
𝑥3 3 (2𝑛 − 1)!! 𝑥 2𝑛+1
arcsin 𝑥 = 𝑥 + + 𝑥5 + · · · + + 𝑜(𝑥 2𝑛+1 )
6 40 (2𝑛)!! 2𝑛 + 1
𝜋
arccos 𝑥 = − arcsin 𝑥
2
𝑥3 2
tg 𝑥 = 𝑥 + + 𝑥 5 + 𝑜(𝑥 5 ).
3 15
.
5.9 operazioni con i simboli di Landau
Le notazioni di Landau 𝑜 -piccolo e 𝑂 -grande sono comodissime per l’ela-

borazione di stime asintotiche. Bisogna però fare molta attenzione a come
queste notazioni vengono usate, perché altrimenti si rischia di fare degli errori
grossolani. Alcuni risultati controintuitivi sono ad esempio:
1. 𝑜(𝑥) − 𝑜(𝑥) = 𝑜(𝑥) (e non 0),
2. 𝑜(𝑥 2 ) = 𝑜(𝑥) ma non 𝑜(𝑥) = 𝑜(𝑥 2 ).
Il secondo esempio, in particolare, ci dice che il simbolo di uguaglianza in
realtà non è utilizzato in modo appropriato in questo contesto, perché non gode
della proprietà simmetrica. In questa sezione proponiamo una definizione
formalmente precisa dell’oggetto 𝑜 -piccolo (e 𝑂 -grande) e un modo rigoroso
per manipolarlo e confrontarlo.
Definizione 5.64 ( 𝑜 -piccolo, 𝑂 -grande). Sia 𝐴 ⊆ ℝ, 𝑥 0 punto di accumulazione

di 𝐴 e sia 𝑔 : 𝐴 → ℝ una funzione positiva su 𝐴. Definiamo allora gli insiemi di
ricordiamo che 𝐴𝐵 denota l’insieme delle funzioni:
funzioni 𝑓 : 𝐵 → 𝐴
𝑓 (𝑥)

𝐴
𝑜(𝑔) = 𝑓 ∈ ℝ : lim =0 ;
𝑥→𝑥0 𝑔(𝑥)
𝑓 (𝑥)

𝑂(𝑔) = 𝑓 ∈ ℝ𝐴 : lim sup < +∞
𝑓 (𝑥)

𝐴
= 𝑓 ∈ ℝ : ∃𝑈 ∈ U𝑥0 , 𝐶 > 0 : ∀𝑥 ∈ 𝑈 :
≤𝐶 .
𝑔(𝑥)
Espressioni come ad esempio:
sin 𝑥 − 𝑥 = 𝑜(𝑥 2 ), per 𝑥 → 0
vanno quindi interpretate come
𝑓 ∈ 𝑜(𝑔)
dove 𝑓 (𝑥) = sin 𝑥 − 𝑥 e 𝑔(𝑥) = 𝑥 2 . In questa sezione scriveremo:
sin 𝑥 − 𝑥 ∈ 𝑜(𝑥 2 ) (5.9)
per dare risalto a questa interpretazione (e mettere in evidenza il fatto che la

relazione non è affatto simmetrica).
Possiamo ora procedere ad interpretare le operazioni tra insiemi. In generale se
𝐴 e 𝐵 sono insiemi di oggetti su cui è definita una operazione ∗ (che potrebbe
essere la somma, il prodotto, il rapporto...) definiamo:
𝐴 ∗ 𝐵 = {𝑎 ∗ 𝑏 : 𝑎 ∈ 𝐴, 𝑏 ∈ 𝐵}.
Analogamente se 𝐴 è un insieme sui cui elementi è definita una operazione ∗

con un oggetto 𝑏 , definiremo:
𝐴 ∗ 𝑏 = {𝑎 ∗ 𝑏 : 𝑎 ∈ 𝐴}, 𝑏 ∗ 𝐴 = {𝑏 ∗ 𝑎 : 𝑎 ∈ 𝐴}.
5.9 operazioni con i simboli di Landau 215
Ad esempio l’espressione
sin 𝑥 = 𝑥 + 𝑜(𝑥 2 )
andrebbe formalmente intesa come
sin 𝑥 ∈ 𝑥 + 𝑜(𝑥 2 )
dove l’insieme 𝑥+𝑜(𝑥 2 ) è l’insieme di tutte le funzioni 𝑓 che possono essere scritte
nella forma 𝑓 (𝑥) = 𝑥 + ℎ(𝑥) con ℎ ∈ 𝑜(𝑥 2 ) cioè ℎ tale che ℎ(𝑥)/𝑥 2 → 0. Risulta
quindi che tale espressione è equivalente alla (5.9) in quanto se sin 𝑥 = 𝑥 + ℎ(𝑥)
con ℎ ∈ 𝑜(𝑥 2 ) significa che sin 𝑥 − 𝑥 ∈ 𝑜(𝑥 2 ).
Possiamo allora enunciare le regole algebriche di manipolazione dei simboli di

Landau.
Teorema 5.65 (operazioni con i simboli di Landau). Sia 𝐴 ⊆ ℝ, 𝑥 0 ∈ [−∞, +∞]

punto di accumulazione per 𝐴. Siano 𝑓 , 𝑔 : 𝐴 → ℝ funzioni positive, 𝑐 ∈ ℝ, 𝑐 ≠ 0,
𝑛 ∈ ℕ , 𝑛 ≠ 0. Allora, per 𝑥 → 𝑥0 si ha:
0 ∈ 𝑜( 𝑓 ) ⊆ 𝑂( 𝑓 ) 𝑓 ∈ 𝑂( 𝑓 )
𝑐 · 𝑜( 𝑓 ) = 𝑜( 𝑓 ) 𝑐 · 𝑂( 𝑓 ) = 𝑂( 𝑓 )
𝑜( 𝑓 ) + 𝑜( 𝑓 ) = 𝑜( 𝑓 ) 𝑂( 𝑓 ) + 𝑂( 𝑓 ) = 𝑂( 𝑓 )
𝑜( 𝑓 ) − 𝑜( 𝑓 ) = 𝑜( 𝑓 ) 𝑂( 𝑓 ) − 𝑂( 𝑓 ) = 𝑂( 𝑓 )
𝑜( 𝑓 · 𝑔) = 𝑓 · 𝑜(𝑔) 𝑂( 𝑓 · 𝑔) = 𝑓 · 𝑂(𝑔)
𝑜(𝑔/ 𝑓 ) = 𝑜(𝑔)/ 𝑓 𝑂(𝑔/ 𝑓 ) = 𝑂(𝑔)/ 𝑓
𝑜( 𝑓 ) · 𝑜(𝑔) ⊆ 𝑜( 𝑓 · 𝑔) 𝑂( 𝑓 ) · 𝑂(𝑔) ⊆ 𝑂( 𝑓 · 𝑔)
𝑜( 𝑓 ) · 𝑂(𝑔) ⊆ 𝑜( 𝑓 · 𝑔)
(𝑜( 𝑓 ))𝑛 ⊆ 𝑜( 𝑓 𝑛 ) (𝑂( 𝑓 ))𝑛 ⊆ 𝑂( 𝑓 𝑛 )
𝑜(𝑜( 𝑓 )) ⊆ 𝑜( 𝑓 ) 𝑂(𝑂( 𝑓 )) ⊆ 𝑂( 𝑓 )
𝑜(𝑂( 𝑓 )) ⊆ 𝑜( 𝑓 ) 𝑂(𝑜( 𝑓 )) ⊆ 𝑜( 𝑓 ).
Si osserva, in particolare, che 𝑜( 𝑓 ) e 𝑂( 𝑓 ) sono sottospazi vettoriali di ℝ𝐴 .
E’ anche possibile applicare i cambi di variabile. Se 𝑓 ∈ 𝑜(𝑔) per 𝑥 → 𝑥 0 e ℎ(𝑡) → 𝑥 0

per 𝑡 → 𝑡0 allora
ℎ ◦ 𝑓 ∈ 𝑜(ℎ ◦ 𝑔) per 𝑡 → 𝑡0 .
Dimostrazione. Visto che 0/ 𝑓 = 0 è ovvio che 0 ∈ 𝑜( 𝑓 ). L’inclusione 𝑜( 𝑓 ) ⊆ 𝑂( 𝑓 )

discende dal fatto che se ℎ ∈ 𝑜( 𝑓 ) significa che ℎ/ 𝑓 → 0 per 𝑥 → 𝑥 0 . Ma
allora esiste un intorno di 𝑥 0 in cui |ℎ/ 𝑓 | < 1 e dunque ℎ ∈ 𝑂( 𝑓 ). Ovviamente
𝑓 ∈ 𝑂( 𝑓 ) in quanto 𝑓 / 𝑓 = 1 è una funzione limitata.
Se ℎ ∈ 𝑐 · 𝑜( 𝑓 ) significa che ℎ = 𝑐 · (ℎ/𝑐) e ℎ/𝑐 ∈ 𝑜( 𝑓 ) ovvero (ℎ/𝑐)/ 𝑓 → 0. Ma

questo è equivalente a ℎ/ 𝑓 → 0 visto che 𝑐 è una costante non nulla. Il caso
degli 𝑂 grande si svolge in modo simile.
L’insieme 𝑜( 𝑓 ) + 𝑜( 𝑓 ) è formato da funzione della forma ℎ + 𝑘 con ℎ, 𝑘 ∈ 𝑜( 𝑓 ).

Ma si ha
ℎ+𝑘 ℎ 𝑘
= + → 0 + 0 = 0.
𝑓 𝑓 𝑓
Dunque 𝑜( 𝑓 ) + 𝑜( 𝑓 ) ⊆ 𝑜( 𝑓 ). Viceversa osserviamo che se ℎ ∈ 𝑜( 𝑓 ) si può

scrivere ℎ = ℎ/2 + ℎ/2 e per quanto visto prima sappiamo che ℎ/2 ∈ 𝑜( 𝑓 ).
Dunque 𝑜( 𝑓 ) ⊆ 𝑜( 𝑓 ) + 𝑜( 𝑓 ). Ragionamento simile si può fare per 𝑂( 𝑓 ): la
somma di due funzioni localmente limitate è anch’essa localmente limitata.
Osserviamo che 𝑜( 𝑓 ) − 𝑜( 𝑓 ) = 𝑜( 𝑓 ) + (−1) · 𝑜( 𝑓 ) = 𝑜( 𝑓 ) + 𝑜( 𝑓 ) = 𝑜( 𝑓 ) per quanto

già visto. Lo stesso vale per 𝑂( 𝑓 ) − 𝑂( 𝑓 ).
Se ℎ ∈ 𝑜( 𝑓 𝑔) significa che ℎ/( 𝑓 𝑔) → 0. Ma allora ℎ = 𝑓 · (ℎ/ 𝑓 ) con ℎ/ 𝑓 ∈ 𝑜(𝑔)

in quanto (ℎ/ 𝑓 )/𝑔 = ℎ/( 𝑓 𝑔) → 0. Dunque ℎ ∈ 𝑓 𝑜(𝑔) e di conseguenza
𝑜( 𝑓 𝑔) ⊆ 𝑓 · 𝑜(𝑔). Viceversa se ℎ ∈ 𝑓 · 𝑜(𝑔) significa che ℎ = 𝑓 · (ℎ/ 𝑓 ) con
ℎ/ 𝑓 ∈ 𝑜(𝑔) ovvero (ℎ/ 𝑓 )/𝑔 → 0. Dunque ℎ/( 𝑓 𝑔) → 0 che significa ℎ ∈ 𝑜( 𝑓 𝑔).
Ragionamento analogo si può fare con gli 𝑂 grande.
I risultati per la divisione si riconducono a quelli della moltiplicazione osser-

vando che la divisione per 𝑓 è uguale alla moltiplicazione per 1/ 𝑓 .
Se ℎ ∈ 𝑜( 𝑓 ) e 𝑘 ∈ 𝑜(𝑔) vogliamo mostrare che ℎ 𝑘 ∈ 𝑜( 𝑓 𝑔). Ma questo è

ovvio essendo (ℎ 𝑘)/( 𝑓 𝑔) = (ℎ/ 𝑓 ) · (𝑘/𝑔) → 0 · 0 = 0. Abbiamo mostrato che
𝑜( 𝑓 )𝑜(𝑔) ⊆ 𝑜( 𝑓 𝑔). Risultato analogo si ha negli altri due casi 𝑂( 𝑓 )𝑂(𝑔) ⊆
𝑂( 𝑓 𝑔) e 𝑜( 𝑓 )𝑂(𝑔) ⊆ 𝑜( 𝑓 𝑔), osservando che il prodotto di due funzioni limitate
è limitata e il prodotto di una limitata per una infinitesima è infinitesima.
Per quanto riguarda la potenza (𝑜( 𝑓 ))𝑛 osserviamo che si ha:
(𝑜( 𝑓 ))𝑛 = {ℎ 𝑛 : ℎ ∈ 𝑜( 𝑓 )} ⊆ {ℎ1 · · · ℎ 𝑛 : ℎ1 , . . . , ℎ 𝑛 ∈ 𝑜( 𝑓 )}

= 𝑜( 𝑓 ) · · · 𝑜( 𝑓 ) ⊆ 𝑜( 𝑓 𝑛 ).
Se ℎ ∈ 𝑜(𝑜( 𝑓 )) significa che esiste 𝑘 ∈ 𝑜( 𝑓 ) e ℎ ∈ 𝑜(𝑘). Dunque 𝑘/ 𝑓 → 0 e

ℎ/𝑘 → 0. Ma allora ℎ/ 𝑓 = (ℎ/𝑘) · (𝑘/ 𝑓 ) → 0 · 0 = 0 dunque ℎ ∈ 𝑜( 𝑓 ). Abbiamo
quindi mostrato che 𝑜(𝑜( 𝑓 )) ⊆ 𝑜( 𝑓 ). Dimostrazione analoga si può fare per gli
𝑂 grande. Anche le inclusioni 𝑜(𝑂( 𝑓 )) ⊆ 𝑜( 𝑓 ) e 𝑂(𝑜( 𝑓 )) ⊆ 𝑜( 𝑓 ) si dimostrano
in modo analogo osservando che il prodotto di una funzione limitata per una
infinitesima è infinitesima.
Per quanto riguarda il cambio di variabile, dobbiamo verificare che
𝑓 (ℎ(𝑡))
→0 per 𝑡 → 𝑡0
𝑔(ℎ(𝑡))
se 𝑓 ∈ 𝑜(𝑔) e se ℎ(𝑡) → 𝑥 0 per 𝑡 → 𝑡0 . Ma questo non è altro che il cambio di

variabile 𝑥 = ℎ(𝑡) nel limite 𝑓 (𝑥)/𝑔(𝑥) → 0 per 𝑥 → 𝑥 0 .
Esempio 5.66. Sapendo che per 𝑥 → 0 si ha
𝑥2
sin 𝑥 ∈ 𝑥 + 𝑜(𝑥 2 ), cos 𝑥 ∈ 1 − + 𝑜(𝑥 3 )
2
5.9 operazioni con i simboli di Landau 217
e ricordando che 𝑥 3 ∈ 𝑜(𝑥 2 ) possiamo dedurre, utilizzando le proprietà del teorema

precedente:
2 cos 𝑥 − sin 𝑥 ∈ 2 − 𝑥 2 + 2 𝑜(𝑥 3 ) − 𝑥 − 𝑜(𝑥 2 )

= 2 − 𝑥 − 𝑥 2 + 𝑜(𝑥 3 ) + 𝑜(𝑥 2 )
= 2 − 𝑥 − 𝑥 2 + 𝑜(𝑜(𝑥 2 )) + 𝑜(𝑥 2 )
⊆ 2 − 𝑥 − 𝑥 2 + 𝑜(𝑥 2 ) + 𝑜(𝑥 2 )
= 2 − 𝑥 − 𝑥 2 + 𝑜(𝑥 2 ).
Usualmente tutti questi passaggi vengono sottointesi, si utilizza il simbolo = al posto di

∈ e ⊆ e spesso si preferisce scrivere sempre un solo 𝑜(·) alla fine di ogni espressione.
Esempio 5.67. Con gli stessi presupposti dell’esempio precedente potremo scrivere:
(sin2 𝑥) · (2 − 2 cos 𝑥)3 ∈ (𝑥 + 𝑜(𝑥 2 ))2 · (2 − (2 − 𝑥 2 − 2 𝑜(𝑥 3 ))3

= (𝑥 + 𝑜(𝑥 2 ))2 · (𝑥 2 + 𝑜(𝑥 3 ))3
= (𝑥 2 + 2𝑥𝑜(𝑥 2 ) + (𝑜(𝑥 2 ))2 )
· (𝑥 6 + 3 𝑥 4 𝑜(𝑥 3 ) + 3 𝑥 2 (𝑜(𝑥 3 ))2 + (𝑜(𝑥 3 ))3 )
⊆ (𝑥 2 + 𝑜(𝑥 3 ) + 𝑜(𝑥 4 )) · (𝑥 6 + 𝑜(𝑥 7 ) + 𝑜(𝑥 8 ) + 𝑜(𝑥 9 ))
= (𝑥 2 + 𝑜(𝑥 3 )) · (𝑥 6 + 𝑜(𝑥 7 ))
= 𝑥 8 + 𝑥 2 𝑜(𝑥 7 ) + 𝑜(𝑥 3 )𝑥 6 + 𝑜(𝑥 3 )𝑜(𝑥 7 )
= 𝑥 8 + 𝑜(𝑥 9 ) + 𝑜(𝑥 9 ) + 𝑜(𝑥 10 ) = 𝑥 8 + 𝑜(𝑥 9 ).
Esempio 5.68. Possiamo anche fare un esercizio con il cambio di variabile. Osservando
che 𝑦 = 1 − cos 𝑥 → 0 per 𝑥 → 0 sapendo che sin 𝑦 = 𝑦 + 𝑜(𝑦 2 ) per 𝑦 → 0 e che
2 − 2 cos 𝑥 = 𝑥 2 + 𝑜(𝑥 2 ) per 𝑥 → 0 possiamo scrivere che per 𝑥 → 0 si ha:
sin(2 − 2 cos 𝑥) ∈ (2 − 2 cos 𝑥) + 𝑜((2 − 2 cos 𝑥)2 )

⊆ 𝑥 2 + 𝑜(𝑥 2 ) + 𝑜((𝑥 2 + 𝑜(𝑥 2 ))2 )
⊆ 𝑥 2 + 𝑜(𝑥 2 ) + 𝑜(𝑂(𝑥 4 ))
⊆ 𝑥 2 + 𝑜(𝑥 2 ) + 𝑜(𝑥 4 )
= 𝑥 2 + 𝑜(𝑥 2 ).
Esercizio 5.69. Dimostrare (per semplice curiosità) che valgono anche le inclusioni
inverse a quelle enunciate nel teorema:
𝑜( 𝑓 · 𝑔) ⊆ 𝑜( 𝑓 ) · 𝑜(𝑔), 𝑂( 𝑓 · 𝑔) ⊆ 𝑂( 𝑓 ) · 𝑜(𝑔),
𝑜( 𝑓 · 𝑔) ⊆ 𝑜( 𝑓 ) · 𝑂(𝑔),
𝑜( 𝑓 ) ⊆ 𝑜(𝑜( 𝑓 )), 𝑂( 𝑓 ) ⊆ 𝑂(𝑂( 𝑓 )).
Osservare invece che (𝑜( 𝑓 ))2 ≠ 𝑜( 𝑓 ) · 𝑜( 𝑓 ).
La formula di Taylor può risultare molto utile per determinare il carattere di

una serie, come nel seguente.
Esercizio 5.70. Determinare i valori di 𝛼 ∈ ℝ per i quali la serie

+∞ 𝛼
X 𝑘 1 1
(−1) − sin
𝑘=1
𝑘 𝑘
converge assolutamente e quelli per cui converge.
Soluzione. Posto 𝑓 (𝑥) = 𝑥 − sin 𝑥 , tramite sviluppo di Taylor sappiamo che si

ha, per 𝑥 → 0:
𝛼
𝑥3 𝑥 3𝛼

𝛼
𝑓 (𝑥) = (𝑥 − sin 𝑥) = 𝛼
+ 𝑜(𝑥 3 ) = (1 + 𝑜(1))𝛼
6 6𝛼
𝑥 3𝛼 𝑥 3𝛼
= (1 + 𝛼 · 𝑜(1 ) + 𝑜(𝑜(1 ))) = (1 + 𝑜(1)).
6𝛼 6𝛼
Visto che per 𝑘 → +∞ si ha 𝑥 = 1/𝑘 → 0, possiamo scrivere:

𝛼
𝛼1 1 1 1
𝑎 𝑘 = ( 𝑓 (1/𝑘)) = − sin = (1 + 𝑜(1)) ∼ 𝛼 3𝛼 .
𝑘 𝑘 6𝛼 ·𝑘 3 𝛼 6 ·𝑘
Osserviamo che la serie data è (−1) 𝑘 𝑎 𝑘 e che 𝑎 𝑘 > 0. Dunque per il criterio
P
di confronto asintotico se 3 𝛼 > 1, cioè se 𝛼 > 1/3, la serie data converge
assolutamente, se invece 𝛼 ≤ 1/3 la serie non converge assolutamente (ma
potrebbe convergere). Osserviamo inoltre che se 𝛼 ≤ 0 il termine 𝑎 𝑘 non è
neanche infinitesimo e quindi la serie non può convergere.
Per 𝛼 ∈ (0 , 1/3] possiamo provare ad utilizzare il criterio di Leibniz: la suc-

cessione 𝑎 𝑘 è infinitesima, dobbiamo verificare che sia anche definitivamente
decrescente. Avendo posto 𝑎 𝑘 = ( 𝑓 (1/𝑘))𝛼 sarà sufficiente dimostrare che la
funzione 𝑓 (𝑥) è crescente in un intorno destro di 0. Per le proprietà del polino-
mio di Taylor sappiamo che il polinomio di Taylor di ordine 2 di 𝑓 0(𝑥) è uguale
alla derivata del polinomio di Taylor di 𝑓 (𝑥) di ordine 3. Dunque possiamo
affermare immediatamente (ma sarebbe stato ugualmente veloce calcolare la
derivata e poi svilupparla) che
0
𝑥3 𝑥2

1
𝑓 0(𝑥) = + 𝑜(𝑥 2 ) = + 𝑜(𝑥 2 ) = 𝑥 2 + 𝑜(1)
6 2 2
dunque, per la permanenza del segno, deve esistere un intorno di 0 in cui

1/2 + 𝑜(1) è positivo e quindi in tale intorno risulta che 𝑓 0(𝑥) ≥ 0 cioè 𝑓 è
crescente. Dunque anche 𝑓 𝛼 è crescente e, per 𝑘 abbastanza grande, 𝑎 𝑘 è
decrescente. Si può quindi applicare il criterio di Leibniz e concludere che la
serie è convergente per ogni 𝛼 > 0.
Esercizio 5.71. Dimostrare che la seguente serie è convergente:
X√

1 1
𝑘 𝑘 tg − cos .
𝑘
𝑘 𝑘
Soluzione. In questo esercizio utilizziamo la nozione di 𝑂 -grande (ma l’esercizio

potrebbe essere risolto anche utilizzando gli 𝑜 -piccolo, come al solito). Per
5.10 funzioni analitiche 219
𝑥 → 0 si ha: qui sfruttiamo il fatto che lo sviluppo di

Taylor del terzo ordine esiste e usando
tg 𝑥 = 𝑥 + 𝑐𝑥 + 𝑜(𝑥 ) = 𝑥 + 𝑂(𝑥 )
3 3 3
la notazione degli 𝑂 -grande evitiamo di
doverci ricordare qual è il coefficiente
e analogamente
𝑐 = 13 che compare nella formula
cos 𝑥 = 1 + 𝑂(𝑥 2 )
da cui
tg 𝑥
− cos 𝑥 = 𝑂(𝑥 2 ).
𝑥
Dunque per 𝑘 → +∞ si ha
√ √

1 1 1 1
𝑎𝑘 = 𝑘 𝑘 tan − cos = 𝑘·𝑂 2 =𝑂 3 .
𝑘 𝑘 𝑘 𝑘2
Significa che per 𝑘 sufficientemente grande esiste una costante 𝐶 per cui
𝐶
𝑎𝑘 ≤ 3
.
𝑘2
Siccome sappiamo che la serie 𝑘1𝑝 è convergente se 𝑝 > 1 per il criterio del
P
confronto 𝑎 𝑘 (che è una serie a termini positivi) è anch’essa convergente.
P
5.10 funzioni analitiche
Nel capitolo sulle serie di potenze abbiamo studiato le serie di potenze della
forma
+∞
𝑎𝑘 𝑧 𝑘 .
X
𝑔(𝑧) = (5.10)
𝑘=0
E’ chiaro che se fissiamo un punto 𝑧 0 possiamo fare un cambio di variabile e

osservare che la serie
+∞
𝑎 𝑘 (𝑧 − 𝑧0 ) 𝑘 = 𝑔(𝑧 − 𝑧0 )
X
𝑓 (𝑧) = (5.11)
𝑘=0
converge nel cerchio 𝐵𝑅 (𝑧 0 ) = {𝑧 ∈ ℤ : |𝑧 − 𝑧 0 | < 𝑅} dove 𝑅 è il raggio della

serie di potenze (5.10). Diremo che la serie nell’equazione (5.11) è una serie di
potenze centrata in 𝑧 0 e chiameremo 𝑅 il suo raggio di convergenza.
Risulta allora naturale chiedersi se una serie di potenza centrata in un punto 𝑧 0

può essere traslata in un punto 𝑧 1 ≠ 𝑧 0 almeno quando 𝑧 1 ∈ 𝐵𝑅 (𝑧 0 ). La risposta,
affermativa, è data dal seguente.
Teorema 5.72 (traslazione di una serie di potenze). Si consideri la serie di

potenze (5.11) centrata in 𝑧 0 con raggio di convergenza 𝑅 ∈ (0 , +∞], si prenda un
punto 𝑧 1 ∈ 𝐵𝑅 (𝑧 0 ) e si ponga 𝑟 = 𝑅 − |𝑧 1 − 𝑧 0 | cosicché 𝐵𝑟 (𝑧 1 ) ⊆ 𝐵𝑅 (𝑧 0 ). Allora per
ogni 𝑧 ∈ 𝐵𝑟 (𝑧 1 ) si ha
+∞
𝑏 𝑘 (𝑧 − 𝑧 1 ) 𝑘
X
𝑓 (𝑧) = (5.12)
𝑘=0
per opportuni coefficienti 𝑏 𝑘 . In particolare la serie di potenze in (5.12), centrata in 𝑧 1 ,

ha raggio di convergenza non inferiore a 𝑟 .
Dimostrazione. Per semplificare le notazioni possiamo supporre, senza perdere

di generalità, che sia 𝑧 0 = 0. Informalmente vorremmo svolgere i seguenti
passaggi:
+∞ +∞
𝑎𝑘 𝑧 𝑘 = 𝑎 𝑘 (𝑧 − 𝑧 1 + 𝑧1 ) 𝑘
X X
𝑓 (𝑧) =
𝑘=0 𝑘=0
+∞ 𝑘
𝑘 𝑘−𝑗
𝑧 1 (𝑧 − 𝑧1 ) 𝑗
X X
= 𝑎𝑘
𝑘=0 𝑗=0
𝑗
!
+∞ X
+∞
𝑘 𝑘−𝑗

(𝑧 − 𝑧1 ) 𝑗
X
= 𝑎𝑘 𝑧
𝑗=0 𝑘=𝑗
𝑗 1
ottenendo quindi il risultato voluto con

+∞
𝑘 𝑘−𝑗

X
𝑏𝑗 = 𝑎𝑘 𝑧 .
𝑘=𝑗
𝑗 1
Affinché questi passaggi siano validi bisogna garantire che i termini
𝑘 𝑘−𝑗

𝑐 𝑘,𝑗 = 𝑎 𝑘 𝑧
𝑗 1
siano assolutamente sommabili, cosicché i passaggi fatti sopra risultano validi

in quanto stiamo associando e commutando i termini di una serie assolutamente
convergente. Ma ripetendo gli stessi passaggi con gli opportuni moduli si
osserva che
+∞
|𝑎 𝑘 |(|𝑧 − 𝑧 1 | + |𝑧1 |) 𝑘 .
X X
𝑐 𝑘,𝑗 =
𝑘,𝑗 𝑘=0
Visto che la serie di potenze originale è assolutamente convergente all’interno

del raggio di convergenza, possiamo affermare che essendo |𝑧 − 𝑧 1 | + |𝑧 1 | <
𝑟 + |𝑧1 | = 𝑅 la serie 𝑐 𝑘,𝑗 è assolutamente convergente, i passaggi informali
P
sono giustificati e la dimostrazione è conclusa.
La teoria delle funzioni analitiche potrebbe essere svolta, senza cambiare

sostanzialmente nulla, per le funzioni di variabile complessa. Si dovrebbe
però introdurre il concetto di derivata in senso complesso un argomento che
richiederebbe molto spazio e che esula dagli scopi di questo corso. Ci limitiamo
quindi alle funzioni reali, che sono il nostro argomento di studio.
funzione analitica
Definizione 5.73 (funzione analitica). Sia 𝐴 ⊆ ℝ un insieme aperto e sia 𝑓 : 𝐴 ⊆
ℝ → ℝ una funzione. Diremo che 𝑓 è analitica se per ogni 𝑥0 ∈ 𝐴 esiste una
successione di numeri reali 𝑎 𝑘 ed esiste 𝑅 > 0 tali che per ogni 𝑥 ∈ (𝑥 0 −𝑅, 𝑥 0 +𝑅) ⊆ 𝐴
si ha:
+∞
𝑎 𝑘 (𝑥 − 𝑥0 ) 𝑘 .
X
𝑓 (𝑥) =
𝑘=0
Il teorema 5.72 ci dice in particolare che la somma di una serie di potenze è una
funzione analitica, almeno all’interno del raggio di convergenza. Ad esempio
le funzioni 𝑒 𝑥 , sin 𝑥 e cos 𝑥 sono state definite come somma di una serie di
potenze (centrata in 𝑥 = 0) di raggio infinito e dunque risultano essere funzioni

analitiche su tutto ℝ.
Teorema 5.74 (Sviluppabilità in serie di Taylor). Se 𝑓 : 𝐴 ⊆ ℝ → ℝ è una

funzione analitica allora 𝑓 ∈ 𝐶 ∞ (𝐴) e per ogni 𝑥 0 ∈ 𝐴 esiste 𝑅 > 0, tale che per ogni
𝑥 ∈ (𝑥0 − 𝑅, 𝑥0 + 𝑅) ⊆ 𝐴 risulta
𝑓 (𝑥 0 )
+∞ (𝑘)
(𝑥 − 𝑥0 ) 𝑘 .
X
𝑓 (𝑥) = (5.13)
𝑘=0
𝑘!
Anche la derivata di 𝑓 è una funzione analitica e la serie di Taylor della derivata si

ottiene derivando termine a termine la serie di Taylor di 𝑓 .
Dimostrazione. Senza perdere di generalità supponiamo che sia 𝑥 0 = 0. Essendo

𝑓 una funzione analitica, per definizione sappiamo che esiste 𝑅 > 0 tale che per
|𝑥| < 𝑅 si ha
+∞
𝑎𝑘 𝑥 𝑘
X
𝑓 (𝑥) =
𝑘=0
con opportuni coefficienti 𝑎 𝑘 . Vogliamo mostrare che 𝑓 (𝑥) è derivabile.

Informalmente vorremmo svolgere i seguenti passaggi:
P𝑘 𝑘 𝑗 𝑘−𝑗
𝑓 (𝑥 + ℎ) − 𝑓 (𝑥) X (𝑥 + ℎ) 𝑘 − 𝑥 𝑘 X 𝑗 ℎ 𝑥
+∞ +∞
𝑗=1
= 𝑎𝑘 = 𝑎𝑘
ℎ 𝑘=1
ℎ 𝑘=1
ℎ
+∞ 𝑘
𝑘

ℎ 𝑗−1 𝑥 𝑘−𝑗
X X
= 𝑎𝑘
𝑘=1 𝑗=1
𝑗
+∞ 𝑘−1
𝑘

ℎ 𝑗 𝑥 𝑘−𝑗−1
X X
= 𝑎𝑘
𝑘=1 𝑗=0
𝑗+1
!
+∞ +∞
𝑘

𝑥 𝑘−𝑗−1 ℎ 𝑗 .
X X
= 𝑎𝑘
𝑗=0 𝑘=𝑗+1
𝑗+1
Se poniamo
𝑘

𝑐 𝑘,𝑗 = 𝑎 𝑘 𝑥 𝑘−𝑗−1
𝑗+1
i passaggi risultano giustificati se la serie 𝑘,𝑗 𝑐 𝑘,𝑗 è assolutamente convergente.
P
Ma, mettendo opportunamente i valori assoluti nei passaggi già fatti, si ha
+∞ X
X +∞ X
𝑐 𝑘,𝑗 =
+∞
|𝑥 + ℎ| 𝑘 − |𝑥| 𝑘
|𝑎 𝑘 |
𝑗=0 𝑘=𝑗+1 𝑘=1
| ℎ|
e dunque possiamo affermare che c’è convergenza assoluta se |𝑥| < 𝑅 e

|𝑥 + ℎ| < 𝑅 cioè se | ℎ| < 𝑅−|𝑥| . In tal caso i passaggi fatti prima sono giustificati
e quindi il risultato è una serie di potenze convergente per |ℎ| < 𝑅 − |𝑥| . In
particolare fissato 𝑥 la somma della serie di potenze ottenuta alla fine è una
funzione continua e per ℎ → 0 tende al termine noto della serie (quello con
𝑗 = 0), dunque si ha
𝑓 (𝑥 + ℎ) − 𝑓 (𝑥) X+∞
𝑘 𝑘−1 X+∞
lim = 𝑎𝑘 𝑥 = 𝑘𝑎 𝑘 𝑥 𝑘−1 .
ℎ→0 ℎ 𝑘=1
1 𝑘=1
Abbiamo trovato che la derivata della serie di potenze è uguale alla serie di
potenze delle derivate.
Visto che la serie delle derivate ha lo stesso raggio di convergenza 𝑅 della serie
originaria (teorema 3.42) il procedimento può essere iterato trovando che ogni
derivata è derivabile e per ogni 𝑥 ∈ (−𝑅, 𝑅) si avrà dunque:
+∞
𝑘(𝑘 − 1) · · · (𝑘 − 𝑛 + 1)𝑎 𝑘 𝑥 𝑘−𝑛 .
X
𝑓 (𝑛) (𝑥) =
𝑘=𝑛
In particolare
𝑓 (𝑛) (0) = 𝑛 ! · 𝑎 𝑛
e quindi
𝑓 (0)
+∞ (𝑘)
𝑥𝑘
X
𝑓 (𝑥) =
𝑘=0
𝑘!
come dovevamo dimostrare.
Abbiamo visto che le funzioni analitiche sono di classe 𝐶 ∞ . Il seguente esempio

ci mostra che il viceversa non è vero e dunque la classe delle funzioni analitiche
è strettamente contenuta nella classe delle funzioni 𝐶 ∞ .
Esempio 5.75 (funzione 𝐶 ∞ non analitica). La funzione

1
(
−
𝑒 𝑥2 se 𝑥 ≠ 0
𝑓 (𝑥) =
0 se 𝑥 = 0
è di classe 𝐶 ∞ in quanto per 𝑥 ≠ 0 possiamo calcolare tutte le derivate e osservare che si

possono scrivere nella forma
𝑃𝑛 (𝑥) − 12
𝑓 (𝑛) (𝑥) = 𝑒 𝑥
𝑥 3𝑛
per un opportuno polinomio 𝑃𝑛 (lo si dimostri per induzione). Dunque per 𝑥 → 0 si
ha, per ogni 𝑛 ∈ ℕ
𝑓 (𝑛) (𝑥) → 0
e quindi la funzione 𝑓 è derivabile infinite volte anche nel punto 𝑥 = 0 (grazie alla
proposizione 5.26) e risulta 𝑓 (𝑛) (0) = 0 per ogni 𝑛 ∈ ℕ . Se la funzione 𝑓 fosse analitica
in un intorno di 0 dovremmo avere, per il teorema 5.74:
+∞
0 · 𝑥𝑘 = 0
X
𝑓 (𝑥) =
𝑘=0
che è assurdo in quanto 𝑓 (𝑥) > 0 per ogni 𝑥 ≠ 0.

serie binomiale
Teorema 5.76 (serie binomiale). Per ogni 𝛼 ∈ ℝ per ogni 𝑥 ∈ (−1 , 1) si ha

+∞
𝛼 𝛼
𝑥𝑘.
X
(1 + 𝑥) =
𝑘=0
𝑘
Dimostrazione. Innanzitutto osserviamo che la serie di potenze di coefficiente

𝑎 𝑘 = 𝛼𝑘 ha raggio di convergenza 𝑅 = 1. Infatti, tramite il criterio del rapporto,

si trova:
|𝑎 𝑛+1 | |𝛼(𝛼 − 1) · · · (𝛼 − 𝑛)| 𝑛! |𝛼 − 𝑛|

= · = → 1.
|𝑎 𝑛 | (𝑛 + 1)! |𝛼(𝛼 − 1) · · · (𝛼 − 𝑛 + 1)| 𝑛+1
Dunque la funzione
+∞
𝛼
𝑥𝑘
X
𝑓 (𝑥) =
𝑘=0
𝑘
è definita per ogni 𝑥 ∈ (−1 , 1). Grazie al teorema 5.72 la funzione 𝑓 è sviluppabile
in serie di potenze nell’intorno di ogni punto dell’intervallo (−1 , 1) e dunque
è una funzione analitica su tale intervallo. Inoltre la sua derivata ha come
sviluppo la serie delle derivate:
+∞
𝛼 𝑘−1

0
X
𝑓 (𝑥) = 𝑘 𝑥 .
𝑘=1
𝑘
Per dimostrare che 𝑓 (𝑥) = (1 + 𝑥)𝛼 basta mostrare che il rapporto:
𝑓 (𝑥)
𝑢(𝑥) =
(1 + 𝑥)𝛼
è costantemente uguale ad 1. Per verifica diretta si vede che 𝑓 (0) = 1 dunque

abbiamo almeno 𝑢(0) = 1. Basta allora mostrare che 𝑢 è costante ovvero che
𝑢 0 = 0. Ma si ha
𝑓 0(𝑥)(1 + 𝑥)𝛼 − 𝑓 (𝑥)𝛼(1 + 𝑥)𝛼−1

𝑢 0(𝑥) =
(1 + 𝑥)2𝛼
(1 + 𝑥) 𝑓 (𝑥) − 𝛼 𝑓 (𝑥)
0
= .
(1 + 𝑥)𝛼+1
Osserviamo allora che

+∞ +∞
𝛼 𝑘−1 X 𝛼 𝑘

X
(1 + 𝑥) 𝑓 0(𝑥) = 𝑘 𝑥 + 𝑘 𝑥
𝑘=1
𝑘 𝑘=1
𝑘
+∞ +∞
𝛼 𝛼 𝑘

𝑥𝑘 +
X X
= (𝑘 + 1) 𝑘 𝑥
𝑘=0
𝑘+1 𝑘=0
𝑘
+∞
𝛼(𝛼 − 1) · · · (𝛼 − 𝑘) 𝛼(𝛼 − 1) · · · (𝛼 − 𝑘 + 1) 𝑘

X
= +𝑘 𝑥
𝑘=0
𝑘! 𝑘!
+∞
𝛼(𝛼 − 1) · · · (𝛼 − 𝑘 + 1)
[(𝛼 − 𝑘) + 𝑘]𝑥 𝑘
X
=
𝑘=0
𝑘!
+∞
𝛼 𝑘

X
=𝛼 𝑥 = 𝛼 · 𝑓 (𝑥).
𝑘=0
𝑘
Dunque 𝑢 0(𝑥) = 0 e 𝑓 (𝑥) = (1 + 𝑥)𝛼 per ogni 𝑥 ∈ (−1 , 1), come volevamo
dimostrare.
Non basta che una funzione sia di classe 𝐶 ∞ per garantire che sia anche analitica
e quindi può essere utile il seguente.
Teorema 5.77 (criterio di analiticità). Sia 𝑓 ∈ 𝐶 ∞ (𝐴) una funzione reale definita su
un insieme aperto 𝐴 ⊆ ℝ. Supponiamo che per ogni 𝑥 0 ∈ 𝐴 esistano 𝑟 > 0, 𝑀 > 0 e
𝐿 > 0 tali che [𝑥0 − 𝑟, 𝑥0 + 𝑟] ⊆ 𝐴 e per ogni 𝑥 ∈ [𝑥0 − 𝑟, 𝑥0 + 𝑟] e per ogni 𝑛 ∈ ℕ si
abbia
𝑓 (𝑥)
(𝑛)
≤ 𝑀 · 𝐿𝑛 .
𝑛!
Allora 𝑓 è analitica in 𝐴.
Dimostrazione. Fissiamo 𝑥 0 ∈ 𝐴. Dobbiamo dimostrare che in un intorno di

𝑥0 è possibile scrivere 𝑓 come somma di una serie di potenze 𝑎 𝑘 (𝑥 − 𝑥0 ) 𝑘 .
P
Necessariamente, per il teorema 5.74, la serie di potenze dovrà essere la serie di
Taylor, cioè vogliamo dimostrare che esiste 𝜌 > 0 tale che se |𝑥 − 𝑥 0 | < 𝜌 si ha
𝑓 (𝑥0 )
+∞ (𝑘)
(𝑥 − 𝑥0 ) 𝑘 .
X
𝑓 (𝑥) =
𝑘=0
𝑘!
Grazie alla formula di Taylor con resto di Lagrange (teorema 5.59), noi sappiamo
che
𝑛
𝑓 (𝑘) (𝑥0 ) 𝑓 (𝑛+1)(𝑦)
(𝑥 − 𝑥0 ) 𝑘 + (𝑥 − 𝑥0 )𝑛+1 .
X
𝑓 (𝑥) =
𝑘=0
𝑘 ! (𝑛 + 1 )!
Dunque sarà sufficiente mostrare che fissato 𝑥 per 𝑛 → +∞ il resto tende a zero.
Ma infatti se |𝑥 − 𝑥 0 | ≤ 𝜌 si ha

𝑓 (𝑛+1) (𝑦)
(𝑥 − 𝑥0 )𝑛+1 ≤ 𝑀 · 𝐿𝑛+1 |𝑥 − 𝑥0 | 𝑛+1 = 𝑀(𝐿𝜌)𝑛+1 → 0

(𝑛 + 1)!

se scegliamo 𝜌 in modo che sia 𝜌 < 1/𝐿.

Tabella 5.3: sviluppi in serie di Taylor,

+∞ 𝑘 di alcune funzioni elementari. Si veda il
𝑥
𝑒𝑥 =
X
teorema 5.78
𝑘=0
𝑘!
+∞
𝑥 2 𝑘+1
(−1) 𝑘
X
sin 𝑥 =
𝑘=0
(2 𝑘 + 1)!
+∞
𝑥 2𝑘
(−1) 𝑘
X
cos 𝑥 =
𝑘=0
(2 𝑘)!
+∞
𝛼
(1 + 𝑥)𝛼 = 𝑥𝑘 ,
X
se |𝑥| < 1
𝑘=0
𝑘
+∞
𝑥𝑘
(−1) 𝑘−1
X
ln(1 + 𝑥) = , se 𝑥 ∈ (−1 , 1]
𝑘=1
𝑘
+∞
𝑥 2 𝑘+1
(−1) 𝑘
X
arctg 𝑥 = , se 𝑥 ∈ [−1 , 1]
𝑘=0
2𝑘 + 1
+∞
X (2 𝑘 − 1)!! 𝑥 2 𝑘+1
arcsin 𝑥 = , se 𝑥 ∈ [−1 , 1]
𝑘=0
(2 𝑘)!! 2 𝑘 + 1
𝜋
arccos 𝑥 = − arcsin 𝑥
2
.
Teorema 5.78 (analiticità di alcune funzioni elementari). Le funzioni 𝑒 𝑥 , sin 𝑥 ,

cos 𝑥 , ln 𝑥 sono funzioni analitiche. Le funzioni arcsin e arccos sono analitiche
sull’intervallo aperto (−1 , 1). Per ogni 𝛼 ∈ ℝ la funzione 𝑥 𝛼 è analitica sull’intervallo
(0 , +∞). Valgono inoltre le formule riportate in tabella 5.3.
Dimostrazione. Che 𝑒 𝑥 , sin 𝑥 e cos 𝑥 siano funzioni analitiche discende diretta-

mente dal fatto che tali funzioni sono state definite come somma di una serie di
potenze. Dunque, grazie al teorema 5.72 sono funzioni analitiche. In alternativa
si può applicare il teorema 5.77. Le funzioni sin e cos hanno derivata limitata,
quindi le ipotesi del teorema sono facilmente verificate. Ma anche la funzione
𝑒 𝑥 ha derivata limitata se ci restringiamo ad un qualunque intervallo limitato e
dunque anche in quel caso il teorema 5.77 si applica.
Per quanto riguarda la funzione 𝑓 (𝑥) = 𝑥 𝛼 scelto un punto qualunque 𝑥 0 > 0

possiamo utilizzare il teorema 5.76:
𝛼
𝑥 − 𝑥0

𝑥 𝛼 = (𝑥0 + 𝑥 − 𝑥0 )𝛼 = 𝑥0𝛼 1 +
𝑥0
+∞ 𝑘 +∞
𝛼 𝑥 − 𝑥0 𝛼

= 𝑥0𝛼 𝑥0𝛼−𝑘 (𝑥 − 𝑥0 ) 𝑘
X X
=
𝑘=0
𝑘 𝑥0 𝑘=0
𝑘
e dunque anche 𝑥 𝛼 è sviluppabile in serie di potenze nell’intorno di un

qualunque punto 𝑥 0 > 0 ed è quindi una funzione analitica.
Osserviamo ora che se 𝑓 è derivabile ed 𝑓 0 è analitica allora anche 𝑓 è analitica.

Infatti se
+∞
𝑎 𝑘 (𝑥 − 𝑥0 ) 𝑘
X
𝑓 0(𝑥) =
𝑘=0
su un certo intervallo 𝐼 allora la funzione

+∞
𝑎𝑘
𝑥 𝑘+1
X
𝑔(𝑥) = 𝑓 (𝑥0 ) + (5.14)
𝑘=0
𝑘+1
è anch’essa analitica su 𝐼 (in quanto definita da una serie di potenze) ma

chiaramente 𝑔(𝑥 0 ) = 𝑓 (𝑥 0 ) e 𝑔 0(𝑥) = 𝑓 0(𝑥) per ogni 𝑥 ∈ 𝐼 , dunque 𝑔 − 𝑓 è
costantemente uguale a 0 cioè 𝑓 (𝑥) = 𝑔(𝑥).
La precedente osservazione si applica alle funzioni ln 𝑥 , arctg 𝑥 , arcsin 𝑥 e

arccos 𝑥 in quanto la loro derivata è una funzione potenza e quindi è analitica
per quanto già visto:
−1
𝐷 ln(1 + 𝑥) = (1 + 𝑥)−1 , 𝐷 arctg 𝑥 = 1 + 𝑥 2 ,
1
2 −2
1
2 −2
𝐷 arcsin 𝑥 = 1 + 𝑥 , 𝐷 arccos 𝑥 = − 1 + 𝑥 .
Si trovano quindi gli sviluppi in serie riportati nella tabella 5.3 validi all’interno
del raggio di convergenza di queste serie ovvero per 𝑥 ∈ (−1 , 1).
Ci ricordiamo però il teorema 3.44 (lemma di Abel) il quale garantisce che se

abbiamo una serie di potenze il cui raggio di convergenza è 𝑅 e se la serie è
convergente nel punto 𝑥 con 𝑥 = ±𝑅 allora la somma della serie risulta essere
una funzione continua fino al punto 𝑥 . Ad esempio la somma della serie di
Taylor della funzione ln(1 + 𝑥) è continua nel punto 𝑥 = 1 in quanto in tale punto
è convergente (si tratta infatti della serie armonica a segni alterni, convergente
per il criterio di Leibniz). Dunque si ha
+∞
(−1) 𝑘−1 +∞
𝑥𝑘
(−1) 𝑘−1
X X
= lim− = lim− ln(1 + 𝑥) = ln 2 (5.15)
𝑘=1
𝑘 𝑥→1
𝑘=1
𝑘 𝑥→1
e lo sviluppo in serie del logaritmo ln(1 + 𝑥) è valido su tutto l’intervallo

semiaperto (−1 , 1].
Lo stesso vale per le funzioni arctg 𝑥 , arcsin 𝑥 e arccos 𝑥 le cui serie sono
convergenti su tutto l’intervallo chiuso [−1 , 1].
Naturalmente i coefficienti delle serie di Taylor che abbiamo trovato ora coin-
cidono con i coefficienti dei polinomi di Taylor che avevamo già trovato nella
tabella 5.2 a pagina 213 in quanto troncando la serie di Taylor otteniamo un
polinomio che soddisfa la formula di Taylor (5.7) e quindi è proprio il polinomio
di Taylor.
Newton-Mercator Il teorema precedente ci permette di scrivere delle identità notevoli. Ponendo

𝑥 = 1 nella serie che definisce il logaritmo abbiamo già osservato che si ottiene
la somma della serie armonica a segni alterni di Newton-Mercator:
1 1 1 1 1
ln 2 = 1 − + − + − +... (5.16)
2 3 4 5 6
Ponendo 𝑥 = 1 nella serie di Taylor dell’arcotangente otteniamo la formula di
Gregory-Leibniz Gregory-Leibniz
𝜋 1 1 1 1 1
=1− + − + − +...
4 3 5 7 9 10
Anche lo sviluppo in serie dell’arcoseno determina una formula utile per

calcolare le cifre decimali di 𝜋. Per avere una convergenza più rapida conviene
prendere 𝑥 più possibile vicino a zero, nel seguente esercizio prendiamo 𝑥 = 21
per trovare la ben nota approssimazione 𝜋 ≈ 3.14.
Esercizio 5.79 (calcolo cifre di 𝜋). Grazie allo sviluppo di Taylor della funzione
arcsin sappiamo che
+∞
𝜋 1 X (2 𝑘 − 1)!! 1
= arcsin =
6 2 𝑘=0
(2 𝑘)!! (2 𝑘 + 1) · 22 𝑘+1
dunque
𝑛
X (2 𝑘 − 1)!! 1
𝜋=3 + 𝜀𝑛+1
𝑘=0
(2 𝑘)!! (2 𝑘 + 1) · 4 𝑘
dove
+∞ +∞
X (2 𝑘 − 1)!! 1 X 1
𝜀𝑛 = 3 ≤ 3
𝑘=𝑛
(2 𝑘)!! ( 2 𝑘 + 1) · 4 𝑘
𝑘=𝑛 (2 𝑘 + 1) · 4
𝑘
+∞
3 X 1 3 1 4
≤ 𝑛
= 𝑛
· = .
(2𝑛 + 1) · 4 𝑘=0 4 𝑘 (2𝑛 + 1) · 4 1 − 1
4
(2𝑛 + 1) · 4𝑛
Per 𝑛 = 3 si ottiene dunque
3 3·3 3·5·3
𝜋=3+ + + + 𝜀4
2 · 3 · 4 4 · 2 · 5 · 42 6 · 4 · 2 · 7 · 43
1 9 45
=3+ + + + 𝜀4
8 640 21504
con
1
0 < 𝜀4 < < 0.0018
9 · 43
da cui
3.141 < 𝜋 < 3.143
Usando questo metodo con un calcolatore possiamo trovare rapidamente molte cifre
esatte, come riportato nella tabella 5.4.
Teorema 5.80 (principio di identità delle funzioni analitiche). Se 𝑓 e 𝑔 sono due

funzioni analitiche definite su uno stesso intervallo aperto 𝐼 ⊆ ℝ allora risultano fatti
equivalenti:
1. 𝑓 (𝑥) = 𝑔(𝑥) per ogni 𝑥 ∈ 𝐼 ,

2. esiste 𝑥 0 ∈ 𝐼 tale che per ogni 𝑘 ∈ ℕ si ha 𝑓 (𝑘) (𝑥 0 ) = 𝑔 (𝑘) (𝑥 0 ),
Tabella 5.4: Le prime 1000 cifre decimali 3.1415926535 8979323846 2643383279 5028841971 6939937510
del numero 𝜋 calcolate con il metodo
5820974944 5923078164 0628620899 8628034825 3421170679
utilizzato nell’esercizio 5.79. Si veda il
codice a pagina 426. 8214808651 3282306647 0938446095 5058223172 5359408128
4811174502 8410270193 8521105559 6446229489 5493038196
4428810975 6659334461 2847564823 3786783165 2712019091
4564856692 3460348610 4543266482 1339360726 0249141273
7245870066 0631558817 4881520920 9628292540 9171536436
7892590360 0113305305 4882046652 1384146951 9415116094
3305727036 5759591953 0921861173 8193261179 3105118548
0744623799 6274956735 1885752724 8912279381 8301194912
9833673362 4406566430 8602139494 6395224737 1907021798
6094370277 0539217176 2931767523 8467481846 7669405132
0005681271 4526356082 7785771342 7577896091 7363717872
1468440901 2249534301 4654958537 1050792279 6892589235
4201995611 2129021960 8640344181 5981362977 4771309960
5187072113 4999999837 2978049951 0597317328 1609631859
5024459455 3469083026 4252230825 3344685035 2619311881
7101000313 7838752886 5875332083 8142061717 7669147303
5982534904 2875546873 1159562863 8823537875 9375195778
1857780532 1712268066 1300192787 6611195909 2164201989
3. esiste 𝑥 0 ∈ 𝐼 e 𝜌 > 0 tale che per ogni 𝑥 ∈ 𝐼 con |𝑥 − 𝑥 0 | < 𝜌 si ha 𝑓 (𝑥) = 𝑔(𝑥).
Dimostrazione. Se 𝑓 = 𝑔 allora chiaramente le derivate di 𝑓 e 𝑔 coincidono in

tutti i punti, quindi 1 =⇒ 2.
Se 𝑓 e 𝑔 sono analitiche e 𝑥 0 ∈ 𝐼 esiste un intorno del punto 𝑥 0 in cui entrambe

le funzioni possono essere scritte come somma della serie di Taylor. Ma se 𝑓 e 𝑔
hanno le stesse derivate nel punto 𝑥 0 le loro serie di Taylor coincidono e dunque
le funzioni coincidono all’interno del raggio di convergenza. Dunque 2 =⇒ 3.
Ci rimane da dimostrare che 3 =⇒ 1. Per ipotesi sappiamo che esiste 𝑥 0 ∈ 𝐼

tale che 𝑓 (𝑥) = 𝑔(𝑥) in un intorno di 𝑥 0 . Supponiamo per assurdo che esista
almeno un punto 𝑥 ∈ 𝐼 in cui 𝑓 (𝑥) ≠ 𝑔(𝑥). Senza perdita di generalità possiamo
supporre che sia 𝑥 > 𝑥 0 e possiamo prendere l’estremo inferiore di tali punti:
𝑥1 = inf {𝑥 ∈ 𝐼 : 𝑥 > 𝑥0 , 𝑓 (𝑥) ≠ 𝑔(𝑥)}.
Sappiamo che 𝑥 1 > 𝑥 0 perché in un intorno di 𝑥 0 le due funzioni coincidono

per ipotesi. Per definizione di 𝑥 1 sappiamo anche che 𝑓 (𝑥) = 𝑔(𝑥) per ogni
𝑥 ∈ [𝑥0 , 𝑥1 ) e quindi, facendo le derivate, possiamo affermare che 𝑓 (𝑘) (𝑥) =
𝑔 (𝑘) (𝑥) per ogni 𝑘 ∈ ℕ e per ogni 𝑥 ∈ [𝑥0 , 𝑥1 ). Visto che 𝑓 e 𝑔 sono di classe
𝐶 ∞ possiamo concludere, per continuità, che anche 𝑓 (𝑘) (𝑥1 ) = 𝑔 (𝑘) (𝑥 1 ) per ogni
𝑘 ∈ ℕ . Dunque le due funzioni hanno le stesse derivate nel punto 𝑥1 . Essendo 𝑓
e 𝑔 funzioni analitiche sappiamo che c’è un intorno del punto 𝑥 1 in cui entrambe
le funzioni coincidono con la somma della propria serie di Taylor. Ma avendo
le stesse derivate in 𝑥 1 le due funzioni hanno anche la stessa serie di Taylor
e quindi coincidono in un intorno di 𝑥 1 . Questo è assurdo perché per come
abbiamo definito 𝑥 1 ci devono essere dei punti arbitrariamente vicini a 𝑥 1 in cui
𝑓 (𝑥) ≠ 𝑔(𝑥).
5.11 derivata complessa 229
5.11 derivata complessa
Se abbiamo una funzione 𝑓 : 𝐴 ⊆ ℂ → ℂ possiamo definire la derivata

(complessa) esattamente come abbiamo fatto per la derivata reale:
𝑓 (𝑥 + ℎ) − 𝑓 (𝑥)
𝑓 0(𝑥) = lim
ℎ→0 ℎ
(se il limite esiste finito). Si osservi che in questo caso ℎ ∈ ℂ, il rapporto

incrementale è una divisione complessa e il limite è un limite complesso.
Ad esempio la funzione 𝑓 (𝑧) = 𝑧 è derivabile in senso complesso e la sua

derivata è 𝑓 0(𝑧) = 1 in quanto
𝑧+ℎ−𝑧 ℎ
lim = lim = 1.
ℎ→0 ℎ ℎ→0 ℎ
Le dimostrazioni che riguardano la derivata della somma e la derivata del

prodotto si ripetono formalmente identiche a come le abbiamo fatte per la
derivata reale. Potremo quindi affermare che se 𝑓 e 𝑔 sono derivabili in senso
complesso in un punto 𝑧 0 ∈ ℂ risulta
( 𝑓 + 𝑔)0(𝑧 0 ) = 𝑓 0(𝑧0 ) + 𝑔 0(𝑧0 ),

( 𝑓 · 𝑔)0(𝑧 0 ) = 𝑓 0(𝑧0 ) · 𝑔(𝑧0 ) + 𝑓 (𝑧 0 ) · 𝑔 0(𝑧0 ).
Dunque si avrà, se 𝑛 ∈ ℕ \ {0},
(𝑧 𝑛 )0 = 𝑛𝑧 𝑛−1 .
Ovviamente la derivata di una costante è nulla. La formula per la derivata della

funzione composta è anch’essa valida e si dimostra ripetendo formalmente la
stessa dimostrazione che abbiamo già visto:
( 𝑓 (𝑔(𝑧)))0 = 𝑓 0(𝑔(𝑧)) · 𝑔 0(𝑧).
Anche la formula per la derivata del reciproco si ottiene con la stessa dimostra-
zione che abbiamo già visto nel caso reale:
0
1 1
=−
𝑧 𝑧2
e di conseguenza vale la formula per la derivata del rapporto
𝑓 (𝑧) 𝑓 0(𝑧)𝑔(𝑧) − 𝑓 (𝑧)𝑔 0(𝑧)

= .
𝑔(𝑧) 𝑔 2 (𝑧)
Abbiamo quindi che ogni funzione polinomiale a coefficienti in ℂ è derivabile

in senso complesso. E lo stesso vale per le funzioni razionali ovvero i rapporti
di polinomi.
La funzione esponenziale è un’altro esempio importantissimo di funzione

complessa derivabile in quanto risulta
𝑒 𝑧+ℎ − 𝑒 𝑧 𝑒ℎ − 1
lim = lim 𝑒 𝑧 = 𝑒𝑧
ℎ→0 ℎ ℎ→0 ℎ
in virtù del noto limite notevole di cui gode la funzione esponenziale (teore-
ma 3.45). Più in generale è facile verificare che tutte le funzioni analitiche sono
derivabili in senso complesso.
Un risultato sorprendente dell’analisi complessa ci dice che è vero anche il
viceversa: ogni funzione derivabile in senso complesso in tutti i punti del suo
dominio risulta essere analitica (e in particolare di classe 𝐶 ∞ ).
In effetti la derivabilità in senso complesso è una proprietà molto forte. Ad
esempio la funzione 𝑓 (𝑧) = 𝑧¯ non risulta essere derivabile in senso complesso
in quanto
𝑧+ℎ−𝑧 ℎ̄
=
ℎ ℎ
e per ℎ → 0 il limite non esiste in quanto se ℎ è reale tale rapporto vale sempre
1 ma se ℎ è immaginario puro tale rapporto vale sempre −1.
calcolo integrale 6
6.1 misura di Peano-Jordan
In questo capitolo vogliamo dare una definizione di misura di un sottoinsieme

𝐸 ⊆ ℝ𝑛 formalizzando le stesse nozioni che sostanzialmente venivano già usate
dagli antichi greci. Lo faremo nel caso per noi più rilevante ovvero il caso planare
𝑛 = 2 in cui la misura di un insieme si chiama area. Ma l’intera costruzione
potrebbe essere fatta senza nessuna difficoltà (se non per le notazioni che si
complicano) nel caso generale della dimensione 𝑛 .
Dato un insieme 𝐸 ⊆ ℝ2 vorremmo definire la sua area 𝑚(𝐸) ∈ ℝ in modo che
valgano le seguenti proprietà:
1. se 𝐸 ∩ 𝐹 = ∅ allora 𝑚(𝐸 ∪ 𝐹) = 𝑚(𝐸) + 𝑚(𝐹) (additività);
2. se 𝐸 ⊆ 𝐹 allora 𝑚(𝐸) ≤ 𝑚(𝐹) (monotonia);
3. se 𝐸 = [𝑥 1 , 𝑥 2 ] × [𝑦1 , 𝑦2 ] allora 𝑚(𝐸) = |𝑥 2 − 𝑥 1 | · |𝑦2 − 𝑦1 | (normalizza-
zione).
Andremo a definire la misura 𝑚 su una famiglia di sottoinsiemi di ℝ2 che
chiameremo misurabili secondo Peano-Jordan. Si potrebbe dimostrare che non
è possibile definire 𝑚 su tutti i sottoinsiemi di ℝ2 in modo che valgano le
proprietà enunciate qui sopra. Sarebbe però possibile definire la misura su una
classe molto più amplia di insiemi di quelli che andremo a considerare noi,
imponendo l’additività non solo su unioni finite ma anche su unioni numerabili
( 𝜎 additività). Quello che si otterrebbe è la cosiddetta misura di Lebesgue che è
ormai una costruzione standard dell’analisi matematica ma richiederebbe una
teoria molto più complessa da sviluppare. Ci accontenteremo qui di introdurre
la misura 𝑚 finitamente additiva di Peano-Jordan che poi ci permetterà di dare
significato geometrico all’integrale di Riemann.
Diremo che un insieme 𝑅 ⊆ ℝ2 è un rettangolo se 𝑅 è il prodotto cartesiano di rettangolo
due intervalli limitati cioè
𝑅=𝐼×𝐽
con 𝑥 1 = inf 𝐼 > −∞, 𝑥 2 = sup 𝐼 < +∞, 𝑦1 = inf 𝐽 > −∞, 𝑦2 = sup 𝐽 < +∞.
Se 𝐼 = [𝑥 1 , 𝑥 2 ] e 𝐽 = [𝑦1 , 𝑦2 ] allora, affinché valga la proprietà di normalizzazione,
dovremo porre:
𝑚([𝑥1 , 𝑥2 ] × [𝑦1 , 𝑦2 ]) = |𝑥2 − 𝑥1 | · |𝑦2 − 𝑦1 |.
Se 𝐼 = (𝑥 1 , 𝑥 2 ) e 𝐽 = (𝑦1 , 𝑦2 ) sono intervalli aperti (e limitati) allora per ogni

𝜀 > 0 con 𝜀 < (𝑥2 − 𝑥 1 )/2 e 𝜀 < (𝑦2 − 𝑦1 )/2 si ha
[𝑥1 + 𝜀, 𝑥2 − 𝜀] × [𝑦1 + 𝜀, 𝑦2 − 𝜀] ⊆ (𝑥1 , 𝑥2 ) × (𝑦1 , 𝑦2 ) ⊆ [𝑥1 , 𝑥2 ] × [𝑦1 , 𝑦2 ]
da cui, affinché valga la proprietà di monotonia, si dovrà avere:
(𝑥2 − 𝑥1 − 2 𝜀) · (𝑦2 − 𝑦1 − 2 𝜀) ≤ 𝑚((𝑥1 , 𝑥2 ) × (𝑦1 , 𝑦2 )) ≤ |𝑥2 − 𝑥1 | · |𝑦2 − 𝑦1 |.

232 6 calcolo integrale
Figura 6.1: Lo stesso polirettangolo si

può ottenere come due diverse unioni di
rettangoli: (a), (b). Prendendo in consi-
derazione tutte le rette che contengono i
lati di tutti i rettangoli coinvolti si ottiene
una suddivisione (c) per cui ogni rettan-
golo in (a) o in (b) è unione di rettangoli
(a) (b) (c)
in (c).
Ma affinché questo sia vero per ogni 𝜀 > 0 si dovrà necessariamente porre:
𝑚((𝑥1 , 𝑥2 ) × (𝑦1 , 𝑦2 )) = |𝑥 2 − 𝑥1 | · |𝑦2 − 𝑦1 |.
Lo stesso vale se gli intervalli sono semiaperti o comunque se consideriamo

qualunque insieme 𝐸 tale che (𝑥 1 , 𝑥 2 )×(𝑦1 , 𝑦2 ) ⊆ 𝐸 ⊆ [𝑥 1 , 𝑥 2 ]×[𝑦1 , 𝑦2 ]. Dunque
l’area di un rettangolo non cambia se aggiungiamo o togliamo punti dai suoi
lati.
Se un insieme 𝐸 ⊆ ℝ2 può essere scritto come unione finita di rettangoli

disgiunti:
𝐸 = 𝑅1 ∪ 𝑅2 ∪ · · · ∪ 𝑅 𝑁 𝑅 𝑖 ∩ 𝑅 𝑗 = ∅ se 𝑖 ≠ 𝑗
polirettangolo cartesiano diremo che 𝐸 è un polirettangolo cartesiano. In tal caso per garantire l’additività
dell’area porremo:
𝑚(𝐸) = 𝑚(𝑅 1 ) + · · · + 𝑚(𝑅 𝑁 ).
Affinché questa sia una buona definizione dobbiamo verificare che se 𝐴 può
essere scritto come unione di rettangoli disgiunti in due modi diversi, allora
la somma delle misure dei rettangoli dà lo stesso risultato con entrambe le
decomposizioni. Questo è intuitivamente ovvio, e dipende dal fatto che date
due diverse decomposizioni in rettangoli è possibile considerare una griglia
formata da tutte le rette che contengono i lati di ogni rettangolo. Questa griglia
identifica una decomposizione in rettangolini che possono essere utilizzati
per ricostruire sia l’una che l’altra decomposizione. Ogni rettangolo delle due
decomposizioni sarà unione di rettangolini e la sua area sarà la somma delle aree
dei rettangolini. Ma visto che le due decomposizioni si suddividono negli stessi
rettangolini, le aree definite dalle due decomposizioni devono coincidere.
Per lo stesso motivo risulta chiaro che se 𝐸 e 𝐹 sono due polirettangoli anche
𝐸 ∪ 𝐹 , 𝐸 ∩ 𝐹 , 𝐸 \ 𝐹 e 𝐹 \ 𝐸 sono polirettangoli e risulta
𝑚(𝐸 ∪ 𝐹) = 𝑚(𝐸 \ 𝐹) + 𝑚(𝐸 ∩ 𝐹) + 𝑚(𝐹 \ 𝐸). (6.1)
Infatti è possibile trovare una famiglia di rettangolini (quelli identificati dalla

griglia di tutte le rette contenenti i lati dei rettangoli di 𝐸 e dei rettangoli di 𝐹 )
che sono tra loro disgiunti e tali che 𝐸 ∩ 𝐹 , 𝐸 \ 𝐹 e 𝐹 \ 𝐸 possono essere scritti
come unione di questi rettangolini. Questi insiemi sono tra loro disgiunti e
quindi, scrivendo l’area di ognuno come la somma delle aree dei rettangoli, si
trova (6.1).
Se ora prendiamo un insieme 𝐸 ⊆ ℝ2 qualunque e imponiamo che valga la

proprietà di monotonia, dovremo avere che 𝑚(𝐸), se è definibile, deve essere
l’elemento di separazione tra le misure dei polirettangoli contenuti in 𝐸 e di
quelli contenenti 𝐸 . Si giustifica quindi la seguente.
Peano-Jordan
6.1 misura di Peano-Jordan 233
𝐸 𝐹
Figura 6.2: Gli insiemi 𝐸 ed 𝐹 e i poli-
rettangoli approssimanti dall’interno e
dall’esterno. Le approssimanti possono
essere scelte in modo che la cornice tra
i polirettangoli esterni ed interni abbia
area minore di un qualunque 𝜀 > 0.
Definizione 6.1 (misura di Peano-Jordan). Sia 𝐸 ⊆ ℝ2 un insieme limitato.

Definiamo:
𝑚 ∗ (𝐸) = inf {𝑚(𝐹) : 𝐹 ⊇ 𝐸, 𝐹 polirettangolo},

𝑚∗ (𝐸) = sup {𝑚(𝐹) : 𝐹 ⊆ 𝐸, 𝐹 polirettangolo}.
Visto che 𝐸 è limitato (dunque è contenuto in un rettangolo limitato) si ha 𝑚 ∗ (𝐸) < +∞

e visto che ∅ ⊆ 𝐸 e 𝑚(∅) = 0 (l’insieme vuoto ∅ = (𝑎, 𝑎) × (𝑐, 𝑐) è un polirettangolo
di area nulla) si ha 𝑚∗ (𝐸) ≥ 0. Inoltre 𝑚∗ (𝐸) ≤ 𝑚 ∗ (𝐸) in quanto ogni polirettangolo
contenuto in 𝐸 è contenuto, e quindi ha area non superiore, ad ogni polirettangolo
contenente 𝐸 .
Se 𝑚 ∗ (𝐸) = 𝑚∗ (𝐸) diciamo che 𝐸 è misurabile secondo Peano-Jordan e poniamo misurabile
𝑚(𝐸) = 𝑚 ∗ (𝐸) = 𝑚∗ (𝐸) la sua misura di Peano-Jordan.
Teorema 6.2 (proprietà della misura di Peano-Jordan). Se 𝐸 e 𝐹 sono Peano-Jordan

misurabili allora anche 𝐸 ∪ 𝐹 , 𝐸 \ 𝐹 , 𝐹 \ 𝐸 , 𝐸 ∩ 𝐹 sono Peano-Jordan misurabili e
risulta
𝑚(𝐸 ∪ 𝐹) = 𝑚(𝐸 \ 𝐹) + 𝑚(𝐸 ∩ 𝐹) + 𝑚(𝐹 \ 𝐸)

= 𝑚(𝐸) + 𝑚(𝐹) − 𝑚(𝐸 ∩ 𝐹).
Dimostrazione. Osserviamo che un insieme 𝐸 è misurabile se e solo se per ogni

𝜀 > 0 esistono dei polirettangoli 𝐸∗ , 𝐸∗ con 𝐸∗ ⊆ 𝐸 ⊆ 𝐸∗ tali che 𝑚(𝐸∗ ) − 𝑚(𝐸∗ ) <
𝜀 (basta utilizzare la caratterizzazione di estremo superiore e inferiore).
Dunque nelle nostre ipotesi per ogni 𝜀 > 0 esistono dei polirettangoli 𝐸 ∗ , 𝐸∗ , 𝐹 ∗ ,
𝐹∗ tali che
𝐸∗ ⊆ 𝐸 ⊆ 𝐸 ∗ , 𝐹∗ ⊆ 𝐹 ⊆ 𝐹 ∗
con
𝑚(𝐸∗ ) − 𝑚(𝐸∗ ) < 𝜀, 𝑚(𝐹 ∗ ) − 𝑚(𝐹∗ ) < 𝜀.
Possiamo allora approssimare gli insiemi 𝐸 ∩ 𝐹 , 𝐸 ∪ 𝐹 e 𝐸 \ 𝐹 dall’interno e
dall’esterno con polirettangoli:
𝐸∗ ∩ 𝐹∗ ⊆ 𝐸 ∩ 𝐹 ⊆ 𝐸∗ ∩ 𝐹 ∗ ,
𝐸∗ ∪ 𝐹∗ ⊆ 𝐸 ∪ 𝐹 ⊆ 𝐸∗ ∪ 𝐹 ∗ ,
𝐸∗ \ 𝐹 ∗ ⊆ 𝐸 \ 𝐹 ⊆ 𝐸∗ \ 𝐹∗ .
Le differenze tra gli approssimanti esterni e gli approssimanti interni è sempre

contenuta nell’unione delle cornici Δ = (𝐸 ∗ \ 𝐸∗ ) ∪ (𝐹 ∗ \ 𝐹∗ ) (si faccia riferimento
alla figura 6.2):
(𝐸∗ ∩ 𝐹 ∗ ) \ (𝐸∗ ∩ 𝐹∗ ) ⊆ Δ
(𝐸∗ ∪ 𝐹 ∗ ) \ (𝐸∗ ∪ 𝐹∗ ) ⊆ Δ
(𝐸∗ \ 𝐹∗ ) \ (𝐸∗ \ 𝐹 ∗ ) ⊆ Δ
e dunque essendo 𝑚(Δ) < 2 𝜀 ed essendo 𝜀 > 0 arbitrario possiamo concludere

che gli insiemi 𝐸 ∩ 𝐹 , 𝐸 ∪ 𝐹 ed 𝐸 \ 𝐹 sono misurabili. Con le stesse considerazioni
si può facilmente verificare che l’unione dei polirettangoli disgiunti 𝐸∗ \ 𝐹 ∗ e
𝐸∗ ∩ 𝐹∗ differisce dal polirettangolo 𝐸∗ per un insieme di misura minore di 𝜀 e
dunque, passando al limite per 𝜀 → 0 si ottiene:
𝑚(𝐸 \ 𝐹) + 𝑚(𝐸 ∩ 𝐹) = 𝑚(𝐸).
Invertendo i ruoli di 𝐸 ed 𝐹 si ottiene che anche 𝐹 \ 𝐸 è misurabile e vale la

relazione analoga. Con considerazioni del tutto simili si ottiene
𝑚(𝐸 ∪ 𝐹) = 𝑚(𝐸) + 𝑚(𝐹 \ 𝐸).
Di conseguenza si ottengono le uguaglianze enunciate nel teorema.
Teorema 6.3 (elemento d’area di una trasformazione lineare). Sia 𝐸 ⊆ ℝ2 e sia

𝐿 : ℝ2 → ℝ2 una trasformazione lineare affine:
𝑥 𝑥

𝐿(𝑥, 𝑦) = 𝑀 · + 0
𝑦 𝑦0
con 𝑀 matrice 2 × 2 e (𝑥 0 , 𝑦0 ) ∈ ℝ2 . Allora se 𝐸 è misurabile secondo Peano-Jordan

anche 𝐿(𝐸) lo è. E in tal caso si ha
𝑚(𝐿(𝐸)) = | det 𝑀 | · 𝑚(𝐸). (6.2)
Dimostrazione. Osserviamo innanzitutto che è sufficiente verificare quello che

succede nel caso in cui 𝐸 sia un rettangolo. Infatti un generico insieme misurabile
𝐸 può essere approssimato, per ogni 𝜀 > 0 con polirettangoli 𝐸± con 𝐸− ⊆ 𝐸 ⊆
𝐸+ e 𝑚(𝐸+ ) − 𝑚(𝐸− ) < 𝜀. Supponiamo che 𝑅 +𝑘 , 𝑘 = 1, . . . , 𝑁 siano i rettangoli
che compongono 𝐸 + e 𝑅 −𝑘 , 𝑘 = 1 , . . . , 𝑀 siano i rettangoli che compongono 𝐸 − .
Se sappiamo che la trasformazione 𝐿 manda rettangoli in insiemi misurabili
e se sappiamo che sui rettangoli vale 𝑚(𝐿(𝑅 ±𝑘 )) = 𝑐 · 𝑚(𝑅 ±𝑘 ) (per una qualche
costante 𝑐 ≥ 0) allora si deduce che 𝐿(𝑅 +𝑘 ) può essere approssimato dall’esterno
con un polirettangolo 𝐹 𝑘+ in modo che risulti 𝑚(𝐹 𝑘+ ) − 𝑚(𝐿(𝑅 +𝑘 )) < 𝜀/𝑁 mentre
𝐿(𝑅 −𝑘 ) può essere approssimato dall’interno con un polirettangolo 𝐹 𝑘− in modo
che si abbia 𝑚(𝐿(𝑅 −𝑘 )) − 𝑚(𝐹 𝑘− ) < 𝜀/𝑀 . Facendo l’unione 𝐹 + = 𝐹1+ ∪ · · · ∪ 𝐹𝑁
+
e
𝐹 = 𝐹1 ∪ · · · ∪ 𝐹𝑀 si ottengono dei polirettangoli tali che 𝐹 ⊆ 𝐿(𝐸) ⊆ 𝐹 e
− − − − +
𝑚(𝐹 + ) − 𝑚(𝐹 − ) < (𝑐 · 𝑚(𝐸+ ) + 𝜀) − (𝑐 · 𝑚(𝐸− ) − 𝜀) < (𝑐 + 1)𝜀. Essendo 𝜀 > 0

arbitrario si deduce che 𝐹 = 𝐿(𝐸) è misurabile e 𝑚(𝐿(𝐸)) = 𝑐 · 𝑚(𝐸).
Passo 1. Supponiamo che sia 𝐿(𝑥, 𝑦) = (𝜆𝑥, 𝜇𝑦) (una trasformazione lineare
diagonale). Se 𝐸 è un rettangolo 𝐸 = [𝑥 1 , 𝑥 2 ] × [𝑦1 , 𝑦2 ] allora se 𝜆 ≥ 0, 𝜇 ≥ 0
6.1 misura di Peano-Jordan 235
allora 𝐿(𝐸) = [𝜆𝑥 1 , 𝜆𝑥 2 ] × [𝜇𝑦1 , 𝜇𝑦2 ] e chiaramente 𝑚(𝐿(𝐸)) = 𝜆(𝑥 2 − 𝑥 1 )𝜇(𝑦2 −

𝑦1 ) = 𝜆𝜇𝑚(𝐸). Visto che det 𝐿 = 𝜆𝜇 abbiamo ottenuto il risultato voluto. Se 𝜆
o 𝜇 hanno segno negativo gli estremi degli intervalli si possono scambiare e in
tal caso si ottiene 𝑚(𝐿(𝐸)) = |𝜆||𝑥 2 − 𝑥 1 | · |𝜇| · |𝑦2 − 𝑦1 | e quindi, come voluto,
𝑚(𝐿(𝐸)) = | det 𝐿| · 𝑚(𝐸).
Una eventuale componente di traslazione (𝑥 0 , 𝑦0 ) non ha nessuna rilevanza e

non la considereremo mai nel seguito in quanto i rettangoli traslati mantengono
la stessa misura.
Passo 2. Supponiamo che sia 𝐿(𝑥, 𝑦) = (𝑦, 𝑥) (la riflessione rispetto

alla
retta
0 1
𝑦 = 𝑥 ). Questa trasformazione ha matrice associata 𝑀 = che ha
1 0
determinante −1. Analiticamente scambia tra loro le coordinate 𝑥 ed 𝑦 . E’
quindi immediato verificare che i rettangoli vengono mandati in rettangoli con
base e altezza scambiata e dunque la misura di Peano-Jordan (e la misurabilità)
rimangono invariate. Dunque il teorema è banalmente valido in questo caso.
Passo 3. Supponiamo che sia 𝐸 = [𝑎, 𝑏] × [𝑐, 𝑑] e 𝐿(𝑥, 𝑞) = (𝑥, 𝑚𝑥 + 𝑞) con

𝑚 ∈ ℝ fissato (stiamo utilizzando le coordinate (𝑥, 𝑞) nel dominio di 𝐿 e le
coordianate (𝑥, 𝑦) nel codominio). Allora
𝐿(𝐸) = {(𝑥, 𝑦) ∈ ℝ2 : 𝑥 ∈ [𝑎, 𝑏], 𝑚𝑥 + 𝑐 ≤ 𝑦 ≤ 𝑚𝑥 + 𝑑}
è un parallelogramma. Supponiamo per fissare le idee che sia 𝑚 ≥ 0. Per ogni

𝑛 ∈ ℕ posso affettare l’insieme 𝐿(𝐸) con le rette verticali 𝑥 𝑘 = 𝑎 + 𝑛𝑘 (𝑏 − 𝑎) e
posso identificare i rettangoli, per 𝑘 = 1 , . . . , 𝑛 :
𝑅 −𝑘,𝑛 = {(𝑥, 𝑦) ∈ ℝ2 : 𝑥 ∈ [𝑥 𝑘−1 , 𝑥 𝑘 ), 𝑦 ∈ [𝑚𝑥 𝑘 + 𝑐, 𝑚𝑥 𝑘−1 + 𝑑]},

𝑅 +𝑘,𝑛 = {(𝑥, 𝑦) ∈ ℝ2 : 𝑥 ∈ [𝑥 𝑘−1 , 𝑥 𝑘 ), 𝑦 ∈ [𝑚𝑥 𝑘−1 + 𝑐, 𝑚𝑥 𝑘 + 𝑑]}.
e i polirettangoli ottenuti mettendo insieme questi rettangoli:
𝑃𝑛− = 𝑅 −1,𝑛 ∪ 𝑅 −2,𝑛 ∪ · · · ∪ 𝑅 −𝑛,𝑛 ,

𝑃𝑛+ = 𝑅 +1,𝑛 ∪ 𝑅 +2,𝑛 ∪ · · · ∪ 𝑅 +𝑛,𝑛 .
Per come li abbiamo costruiti si osserva che
𝑃𝑛− ⊆ 𝐿(𝐴) ⊆ 𝑃𝑛+ .
Ma è facile calcolare le misure di questi polirettangoli:

𝑛
X 𝑛
X
𝑚(𝑃𝑛− ) = 𝑚(𝑅 −𝑘,𝑛 ) = (𝑥 𝑘 − 𝑥 𝑘−1 ) · (𝑑 − 𝑐 − 𝑚(𝑥 𝑘 − 𝑥 𝑘−1 ))
𝑘=1 𝑘=1
𝑛
X 𝑏−𝑎 𝑚 𝑚
= · 𝑑−𝑐− = (𝑏 − 𝑎) · 𝑑 − 𝑐 −
𝑘=1
𝑛 𝑛 𝑛
𝑛
X 𝑚
𝑚(𝑃 + ) = 𝑚(𝑅 +𝑘,𝑛 ) = · · · = (𝑏 − 𝑎) · 𝑑 − 𝑐 +
𝑘=1
𝑛
ma visto che per 𝑛 → +∞ si ha 𝑚(𝑃𝑛− ) → (𝑏 −𝑎)·(𝑑−𝑐) e 𝑚(𝑃𝑛+ ) → (𝑏 −𝑎)·(𝑑−𝑐)

e visto che si ha
𝑚(𝑃𝑛− ) ≤ 𝑚∗ (𝐿(𝐴)) ≤ 𝑚 ∗ (𝐿(𝐸)) ≤ 𝑚(𝑃𝑛+ )
otteniamo che 𝐿(𝐸) è misurabile

e 𝑚(𝐿(𝐸)) = (𝑏 − 𝑎) · (𝑑 − 𝑐) = 𝑚(𝐸). La matrice
1 0
associata ad 𝐿 è 𝑀 = e dunque det 𝑀 = 1. Abbiamo quindi trovato il
𝑚 1
risultato voluto.
Passo 4. Sia 𝐿 una qualunque applicazione lineare che si ottiene come composi-
zione delle applicazioni considerate in precedenza: 𝐿 = 𝐿𝑛 ◦ · · · ◦ 𝐿2 ◦ 𝐿1 . Allora
per quanto già visto sappiamo che se 𝐸 è un qualunque insieme Peano-Jordan
misurabile risulta
𝐿(𝐸) = 𝐿𝑛 (. . . (𝐿2 (𝐿1 (𝐸))) . . . ) = | det 𝐿𝑛 | · · · | det 𝐿2 | · | det 𝐿1 | · 𝑚(𝐸)
e dunque anche 𝐿(𝐸) è Peano-Jordan misurabile e visto che
| det 𝐿| = | det 𝐿𝑛 | · · · | det 𝐿1 |
la formula (6.2) è verificata.
Passo 5. Per concludere la dimostrazione è dunque sufficiente verificare che ogni

trasformazione lineare si può scrivere come composizione delle trasformazioni
già considerate. In generale il teorema può essere formulato in dimensione
qualunque (in ℝ𝑛 invece che ℝ2 ) e la dimostrazione procede esattamente nello
stesso modo considerando solo trasformazioni che coinvolgono due coordinate.
La trasformazione che scambia due coordinate (passo 2) è rappresentata da una
matrice che se moltiplicata a sinistra di una matrice generica 𝑀 ne scambia le
righe, se moltiplicata a destra ne scambia le colonne. La trasformazione del
passo 3 se applicata a sinistra somma ad una riga il multiplo di un’altra riga, se
applicata a destra somma ad una colonna il multiplo di un’altra colonna. Tramite
il metodo di riduzione di Gauss (riduzione completa) è possibile trasformare
ogni matrice utilizzando solamente queste trasfromazioni in modo da mantenere
invariato il modulo del determinante e rendere la matrice diagonale. A quel
punto ci siamo ricondotti al passo 1.
Nel caso planare 𝑛 = 2 che stiamo considerando possiamo fare esplicitamente

la riduzione di Gauss. Supponiamo che la trasformazione lineare 𝐿 sia associata
ad una matrice generica:
𝑎 𝑏

𝑀= .
𝑐 𝑑
A meno di scambiare righe e colonne possiamo supporre che sia 𝑎 ≠ 0 (se tutti
gli elementi fossero nulli avremmo 𝑀 = 0 che è già in forma diagonale). Allora
moltiplichiamo la seconda riga per un multiplo 𝑚 della prima in modo da
annullare il termine 𝑏 :
𝑎 𝑏 𝑎 𝑏

1 0
· =
𝑚 1 𝑐 𝑑 𝑐 + 𝑚𝑎 𝑑 + 𝑚𝑏
6.2 integrale di Riemann 237
scegliendo 𝑚 = − 𝑎𝑐 e ponendo 𝑑0 = 𝑑 + 𝑚𝑏 abbiamo ottenuto la matrice:
𝑎 𝑏

.
0 𝑑0
Ora osserviamo che
𝑘

0 1 1 0 0 1 1
· · = ·
1 0 𝑘 1 1 0 0 1
Dunque possiamo utilizzare anche quest’ultima matrice moltiplicandola a

destra:
𝑎 𝑏 𝑘 𝑎 𝑎𝑘 + 𝑏

1
· =
0 𝑑0 0 1 0 𝑑0
dunque scegliendo 𝑘 = − 𝑏𝑎 si ottiene finalmente una matrice diagonale.
L’integrale di Riemann, che andremo a definire nella prossima sezione, ci

permetterà di osservare che ogni figura geometrica delimitata dal grafico di una
curva sufficientemente regolare risulta essere misurabile secondo Peano-Jordan.
Inoltre il calcolo integrale ci permetterà di determinare l’area di tali figure in
modo piuttosto semplice.
6.2 integrale di Riemann
Definizione 6.4 (integrale di Riemann). Siano 𝑎, 𝑏 ∈ ℝ, 𝑎 ≤ 𝑏 . Un insieme suddivisione di Riemann

𝑃 ⊆ [𝑎, 𝑏] si dice essere una suddivisione di Riemann dell’intervallo [𝑎, 𝑏] se 𝑃 è
un insieme finito tale che 𝑎, 𝑏 ∈ 𝑃 . In particolare 𝑃 si potrà scrivere come
𝑃 = {𝑥 0 , 𝑥1 , . . . , 𝑥 𝑁 }
con
𝑎 = 𝑥 0 < 𝑥1 < · · · < 𝑥 𝑁−1 < 𝑥 𝑁 = 𝑏.
Sia 𝑓 : [𝑎, 𝑏] → ℝ una funzione limitata. Data una qualunque suddivisione 𝑃 di somme superiori/inferiori
[𝑎, 𝑏] definiamo rispettivamente le somme superiori e le somme inferiori come
𝑁
X
𝑆∗ ( 𝑓 , 𝑃) = (𝑥 𝑘 − 𝑥 𝑘−1 ) · sup 𝑓 ([𝑥 𝑘−1 , 𝑥 𝑘 ])
𝑘=1
𝑁
X
𝑆∗ ( 𝑓 , 𝑃) = (𝑥 𝑘 − 𝑥 𝑘−1 ) · inf 𝑓 ([𝑥 𝑘−1 , 𝑥 𝑘 ]).
𝑘=1
Definiamo infine
𝐼 ∗ ( 𝑓 ) = inf {𝑆∗ ( 𝑓 , 𝑃) : 𝑃 suddivisione di [𝑎, 𝑏]}

𝐼∗ ( 𝑓 ) = sup {𝑆∗ ( 𝑓 , 𝑃) : 𝑃 suddivisione di [𝑎, 𝑏]}.
integrale di Riemann
Se 𝐼∗( 𝑓 ) = 𝐼∗ ( 𝑓 ) diremo che 𝑓 è Riemann-integrabile e diremo che l’integrale di 𝑓 su
[𝑎, 𝑏] è il valore comune 𝐼 ∗ ( 𝑓 ) = 𝐼∗ ( 𝑓 ) che verrà denotato con

∫ 𝑏 ∫ 𝑏
𝑓 oppure con 𝑓 (𝑥) 𝑑𝑥.
𝑎 𝑎
Se 𝑏 < 𝑎 e se 𝑓 è Riemann integrabile su [𝑏, 𝑎] definiamo per convenzione:

∫ 𝑏 ∫ 𝑎
𝑓 =− 𝑓.
𝑎 𝑏
Lemma 6.5. Sia 𝑓 : [𝑎, 𝑏] → ℝ una funzione limitata. Se 𝑃 e 𝑄 sono due suddivisioni
qualunque dell’intervallo [𝑎, 𝑏] si ha
𝑆∗ ( 𝑓 , 𝑃) ≤ 𝑆∗ ( 𝑓 , 𝑃 ∪ 𝑄) ≤ 𝑆∗ ( 𝑓 , 𝑃 ∪ 𝑄) ≤ 𝑆∗ ( 𝑓 , 𝑄). (6.3)
Di conseguenza 𝐼∗ ( 𝑓 ) ≤ 𝐼 ∗ ( 𝑓 ).
Dimostrazione. Sia 𝑃 una qualunque suddivisione di [𝑎, 𝑏] e sia 𝑦 ∈ [𝑎, 𝑏] un

punto qualunque. Posto 𝑃 0 = 𝑃 ∪ {𝑦} vogliamo mostrare che si ha
𝑆∗ ( 𝑓 , 𝑃) ≤ 𝑆∗ ( 𝑓 , 𝑃 0) ≤ 𝑆∗ ( 𝑓 , 𝑃 0) ≤ 𝑆∗ ( 𝑓 , 𝑃). (6.4)
Se 𝑦 ∈ 𝑃 non c’è niente da dimostrare in quanto risulterebbe 𝑃 0 = 𝑃 e la

disuguaglianza 𝑆∗ ( 𝑓 , 𝑃 0) ≤ 𝑆 ∗ ( 𝑓 , 𝑃 0) è sempre verificata in quanto ogni estremo
superiore che compare nella definizione di 𝑆 ∗ è maggiore o uguale al corrispon-
dente estremo inferiore che compare nella definizione di 𝑆∗ . Supponiamo allora
che 𝑦 ∉ 𝑃 e dunque che 𝑦 sia compreso tra due punti consecutivi 𝑥 𝑘−1 , 𝑥 𝑘 della
suddivisione 𝑃 :
𝑎 = 𝑥 0 < 𝑥1 < · · · < 𝑥 𝑘−1 < 𝑦 < 𝑥 𝑘 < · · · < 𝑥 𝑁 = 𝑏.
Allora le somme che definiscono 𝑆∗ ( 𝑓 , 𝑃) e 𝑆∗ ( 𝑓 , 𝑃 0) differiscono solo sull’inter-

vallo [𝑥 𝑘−1 , 𝑥 𝑘 ]. Ma osservando che
inf 𝑓 ≤ inf 𝑓 e inf 𝑓 ≤ inf 𝑓

[𝑥 𝑘−1 ,𝑥 𝑘 ] [𝑥 𝑘−1 ,𝑦] [𝑥 𝑘−1 ,𝑥 𝑘 ] [𝑦,𝑥 𝑘 ]
si ottiene 𝑆∗ ( 𝑓 , 𝑃) ≤ 𝑆∗ ( 𝑓 , 𝑃 0). In maniera analoga si ottiene 𝑆 ∗ ( 𝑓 , 𝑃) ≥ 𝑆 ∗ ( 𝑓 , 𝑃 0).

Dunque (6.4) è dimostrata. Ma allora se 𝑃 e 𝑄 sono suddivisioni qualunque
osserviamo che 𝑃 ∪ 𝑄 si può ottenere da 𝑃 aggiungendo uno alla volta i punti
di 𝑄 . Iterando la (6.4) si ottiene (6.3). Facendo l’estremo inferiore al variare
di 𝑄 si ottiene 𝑆∗ ( 𝑓 , 𝑃) ≤ 𝐼 ∗ ( 𝑓 ) e facendo l’estremo superiore al variare di 𝑃 si
ottiene 𝐼∗ ( 𝑓 ) ≤ 𝐼 ∗ ( 𝑓 ).
criteri di integrabilità
Teorema 6.6 (criteri di integrabilità). Sia 𝑓 : [𝑎, 𝑏] → ℝ una funzione limitata.
1. La funzione 𝑓 è Riemann-integrabile se e solo se per ogni 𝜀 > 0 esiste una

suddivisione 𝑃 tale che
𝑆 ∗ ( 𝑓 , 𝑃) − 𝑆∗ ( 𝑓 , 𝑃) < 𝜀.
2. Se 𝑓 è Riemann-integrabile su [𝑎, 𝑏] allora esiste una successione 𝑃𝑛 di

suddivisioni tali che
∫ 𝑏
∗
lim 𝑆 ( 𝑓 , 𝑃𝑛 ) = lim 𝑆∗ ( 𝑓 , 𝑃𝑛 ) = 𝑓. (6.5)
𝑛→+∞ 𝑛→+∞ 𝑎
Viceversa se 𝑓 è limitata ed esiste una successione 𝑃𝑛 di suddivisioni di [𝑎, 𝑏]

per cui si ha
lim (𝑆 ∗ ( 𝑓 , 𝑃𝑛 ) − 𝑆∗ ( 𝑓 , 𝑃𝑛 )) = 0
𝑛→+∞
allora la funzione 𝑓 è Riemann-integrabile e vale (6.5).
Dimostrazione. Se esiste una suddivisione 𝑃 tale che 𝑆 ∗ ( 𝑓 , 𝑃) − 𝑆∗ ( 𝑓 , 𝑃) < 𝜀

possiamo immediatamente concludere che
𝐼 ∗ ( 𝑓 ) − 𝐼∗ ( 𝑓 ) ≤ 𝑆∗ ( 𝑓 , 𝑃) − 𝑆∗ ( 𝑓 , 𝑃) < 𝜀.
Se questo è vero per ogni 𝜀 > 0 deduciamo che 𝐼 ∗ ( 𝑓 ) − 𝐼∗ ( 𝑓 ) = 0 e dunque che 𝑓

è Riemann-integrabile.
Viceversa qualunque sia 𝑓 , per le proprietà di sup e inf esistono 𝑄 e 𝑅

suddivisioni tali che
𝜀 𝜀
𝐼 ∗ ( 𝑓 ) ≥ 𝑆∗ ( 𝑓 , 𝑄) − e 𝐼∗ ( 𝑓 ) ≤ 𝑆∗ ( 𝑓 , 𝑅) +
2 2
da cui, per il lemma precedente, ponendo 𝑃 = 𝑄 ∪ 𝑅 se 𝑓 è Riemann integrabile
si ottiene
𝑆∗ ( 𝑓 , 𝑃) − 𝑆∗ ( 𝑓 , 𝑃) ≤ 𝑆 ∗ ( 𝑓 , 𝑄) − 𝑆∗ ( 𝑓 , 𝑅)
𝜀 𝜀
≤ 𝐼 ∗ ( 𝑓 ) + − 𝐼∗ ( 𝑓 ) − = 𝜀.
2 2
Dimostriamo ora il secondo punto. Supponiamo dapprima che 𝑓 sia Riemann-

integrabile su [𝑎, 𝑏]. Allora per il punto precedente per ogni 𝑛 ∈ ℕ ponendo
𝜀 = 1/𝑛 possiamo trovare una suddivisione 𝑃𝑛 tale che
1
𝑆 ∗ ( 𝑓 , 𝑃𝑛 ) − 𝑆 ∗ ( 𝑓 , 𝑃𝑛 ) <
𝑛
da cui
1 1
𝐼 ∗ ( 𝑓 ) ≤ 𝑆 ∗ ( 𝑓 , 𝑃𝑛 ) ≤ 𝑆 ∗ ( 𝑓 , 𝑃𝑛 ) + ≤ 𝐼∗ ( 𝑓 ) +
𝑛 𝑛
∫𝑏
perciò passando al limite per 𝑛 → +∞, essendo 𝐼 ∗ ( 𝑓 ) = 𝐼∗ ( 𝑓 ) = 𝑎
𝑓 deve
valere ∫ 𝑏
∗
lim 𝑆 ( 𝑓 , 𝑃𝑛 ) = lim 𝑆∗ ( 𝑓 , 𝑃𝑛 ) = 𝑓.
𝑎
Viceversa se
lim 𝑆 ∗ ( 𝑓 , 𝑃𝑛 ) − 𝑆∗ ( 𝑓 , 𝑃𝑛 ) = 0
𝑛→+∞
per ogni 𝜀 > 0 esiste 𝑛 tale che
𝑆∗ ( 𝑓 , 𝑃𝑛 ) − 𝑆∗ ( 𝑓 , 𝑃𝑛 ) < 𝜀.
Per il punto precedente concludiamo che 𝑓 è Riemann-integrabile. D’altra parte

sappiamo che
∫ 𝑏
𝑆 ∗ ( 𝑓 , 𝑃𝑛 ) ≤ 𝐼 ∗ ( 𝑓 ) = 𝑓 = 𝐼 ∗ ( 𝑓 ) ≤ 𝑆 ∗ ( 𝑓 , 𝑃𝑛 )
𝑎
dunque se 𝑆 ∗ ( 𝑓 , 𝑃𝑛 ) − 𝑆∗ ( 𝑓 , 𝑃𝑛 ) → 0 necessariamente l’integrale coincide con i

limiti di 𝑆 ∗ ( 𝑓 , 𝑃𝑛 ) e di 𝑆∗ ( 𝑓 , 𝑃𝑛 ).
Esempio 6.7 (calcolo dell’integrale tramite le suddivisioni). Mostriamo che per

ogni 𝑏 > 0 la funzione 𝑓 (𝑥) = 𝑥 2 è Riemann-integrabile sull’intervallo [0 , 𝑏] e si ha
𝑏
𝑏3
∫
𝑥 2 𝑑𝑥 = .
0 3
Dimostrazione. Consideriamo le suddivisioni equispaziate dell’intervallo [0 , 𝑏],

cioè dividiamo [0 , 𝑏] in 𝑁 intervalli ognuno di ampiezza 𝑏/𝑁 :
𝑘𝑏

𝑃𝑁 = : 𝑘 ∈ 0, 1, . . . , 𝑁 .
𝑁
Si ha
𝑁 𝑁 𝑁
X 𝑏 𝑏 X 𝑘2𝑏2 𝑏3 X
𝑆 ∗ ( 𝑓 , 𝑃𝑁 ) = sup 𝑓 · = = 3 𝑘2.
𝑘=1 [(𝑘−1)𝑏/𝑁 ,𝑘𝑏/𝑁]
𝑁 𝑁 𝑘=1 𝑁 2 𝑁 𝑘=1
Ricordiamo ora che vale

𝑛
X 𝑛(𝑛 + 1)(2𝑛 + 1) 2𝑛 3 + 3𝑛 2 + 𝑛
𝑘2 = =
𝑘=1
6 6
(tale formula può essere facilmente verificata per induzione). Dunque si ha
𝑏 3 2𝑁 3 + 3𝑁 2 + 𝑁 𝑏3 12 𝑏3

3
𝑆 ∗ ( 𝑓 , 𝑃𝑁 ) = = 2+ + →
𝑁 3 6 6 𝑁 𝑁 3
per 𝑁 → +∞. Analogamente si trova
𝑁 𝑁
X 𝑏 𝑏 X (𝑘 − 1)2 𝑏 2 𝑏 3 𝑁−
X1 2
𝑆∗ ( 𝑓 , 𝑃𝑁 ) = inf 𝑓 · = = 3 𝑘
𝑘=1 [(𝑘−1)𝑏/𝑁 ,𝑘𝑏/𝑁]
𝑁 𝑁 𝑘=1 𝑁 2 𝑁 𝑘=0
e osservando che si ha
𝑁−
X1 𝑁−
X1 2(𝑁 − 1)3 + 3(𝑁 − 2)2 + (𝑁 − 1)
𝑘2 = 𝑘2 =
𝑘=0 𝑘=1
6
otteniamo
𝑏3 𝑏3
𝑆∗ ≥ sup 𝑆∗ ( 𝑓 , 𝑃𝑁 ) ≥ lim 𝑆∗ ( 𝑓 , 𝑃𝑁 ) = → .
𝑁 𝑁→+∞ 3 3
La dimostrazione si conclude quindi applicando il criterio (6.5) del teorema

precedente.
Teorema 6.8 (integrale della costante). Se 𝑓 : [𝑎, 𝑏] → ℝ è costante: 𝑓 (𝑥) = 𝑐

allora 𝑓 è Riemann-integrabile e si ha
∫ 𝑏
𝑓 = 𝑐 · (𝑏 − 𝑎).
𝑎
Dimostrazione. Visto che su ogni 𝐴 ⊆ [𝑎, 𝑏] si ha
sup 𝑓 = inf 𝑓 = 𝑐
𝐴 𝐴
è facile verificare che si ha
𝑆∗ ( 𝑓 , 𝑃) = 𝑆∗ ( 𝑓 , 𝑃) = 𝑐 · (𝑏 − 𝑎)
qualunque sia la suddivisione 𝑃 di [𝑎, 𝑏]. Il risultato segue immediatamente.
Non tutte le funzioni sono Riemann-integrabili come ci mostra il seguente

esempio.
funzione di Dirichlet
Esempio 6.9 (funzione di Dirichlet). Sia 𝑎 < 𝑏 e sia 𝑓 : [𝑎, 𝑏] → ℝ la funzione

definita da (
1 se 𝑥 ∈ ℚ
𝑓 (𝑥) =
0 se 𝑥 ∉ ℚ.
Allora 𝑓 non è Riemann-integrabile.
Dimostrazione. Sia 𝑃 = {𝑥 0 , 𝑥 1 , . . . , 𝑥 𝑁 } con 𝑎 = 𝑥 0 < 𝑥 1 < · · · < 𝑥 𝑁 = 𝑏 una

qualunque suddivisione di [𝑎, 𝑏]. Allora basta osservare che, per la densità dei
razionali, in qualunque intervallino 𝐼 = [𝑥 𝑘−1 , 𝑥 𝑘 ] sono presenti infiniti punti
razionali e infiniti punti irrazionali. Dunque sup 𝑓 (𝐼) = 1 e inf 𝑓 (𝐼) = 0 e di
conseguenza
𝑁
X
𝑆∗ ( 𝑓 , 𝑃) = (𝑥 𝑘 − 𝑥 𝑘−1 ) · 1 = 𝑏 − 𝑎
𝑘=1
𝑁
X
𝑆∗ ( 𝑓 , 𝑃) = (𝑥 𝑘 − 𝑥 𝑘−1 ) · 0 = 0
𝑘=1
da cui 𝐼 ∗ ( 𝑓 ) = 𝑏 − 𝑎 ≠ 0 = 𝐼∗ ( 𝑓 ).
Teorema 6.10 (monotonia dell’integrale). Sia 𝑎 ≤ 𝑏 e siano 𝑓 , 𝑔 : [𝑎, 𝑏] → ℝ due

funzioni Riemann-integrabili. Se per ogni 𝑥 ∈ [𝑎, 𝑏] si ha 𝑓 (𝑥) ≤ 𝑔(𝑥) allora
∫ 𝑏 ∫ 𝑏
𝑓 (𝑥) ≤ 𝑔(𝑥).
𝑎 𝑎
∫𝑏
In particolare se 𝑓 ≥ 0 allora 𝑎
𝑓 ≥ 0.
Dimostrazione. Chiaramente se 𝑓 ≤ 𝑔 si avrà che il sup di 𝑓 su qualunque

intervallo sarà minore o uguale al sup di 𝑔 sullo stesso intervallo. Dunque su
ogni suddivisione 𝑃 di [𝑎, 𝑏] si avrà:
𝑆∗ ( 𝑓 , 𝑃) ≤ 𝑆∗ (𝑔, 𝑃)
da cui si ottiene immediatamente 𝐼 ∗ ( 𝑓 ) ≤ 𝐼 ∗ (𝑔) e il risultato segue.
Teorema 6.11 (linearità dell’integrale). Siano 𝑓 , 𝑔 : [𝑎, 𝑏] → ℝ due funzioni

Riemann-integrabili e siano 𝜆, 𝜇 ∈ ℝ. Allora 𝜆 𝑓 + 𝜇𝑔 è Riemann integrabile e si ha
∫ 𝑏 ∫ 𝑏 ∫ 𝑏
(𝜆 𝑓 + 𝜇𝑔) = 𝜆 𝑓 +𝜇 𝑔.
𝑎 𝑎 𝑎
In particolare l’insieme delle funzioni Riemann-integrabili su [𝑎, 𝑏] risulta essere uno

spazio vettoriale reale e l’integrale è una applicazione lineare su tale spazio, a valori in
ℝ.
Dimostrazione. Mostriamo innanzitutto che

∫ 𝑏 ∫ 𝑏
(− 𝑓 ) = − 𝑓. (6.6)
𝑎 𝑎
Questo deriva dal fatto che su qualunque insieme 𝐴 si ha sup𝐴 (− 𝑓 ) = − inf𝐴 𝑓

e dunque per una qualunque suddivisione 𝑃 si ha
𝑆∗ (− 𝑓 , 𝑃) = −𝑆∗ ( 𝑓 , 𝑃).
Se ne deduce che 𝐼 ∗ (− 𝑓 ) = −𝐼∗ ( 𝑓 ) e, analogamente, 𝐼∗ (− 𝑓 ) = −𝐼 ∗ ( 𝑓 ). Dunque se

𝑓 è Riemann-integrabile anche − 𝑓 lo è e vale la proprietà (6.6).
Ora se 𝜆 ≥ 0 vogliamo mostrare che vale

∫ 𝑏 ∫ 𝑏
𝜆𝑓 = 𝜆 𝑓. (6.7)
𝑎 𝑎
Semplicemente si osserva che sup𝐼 𝜆 𝑓 = 𝜆 sup𝐼 𝑓 e dunque 𝑆 ∗ (𝜆 𝑓 , 𝑃) =

𝜆𝑆∗ ( 𝑓 , 𝑃) per ogni suddivisione 𝑃 . Ne consegue che 𝐼 ∗ (𝜆 𝑓 ) = 𝜆𝐼 ∗ ( 𝑓 ). In maniera
analoga si può mostrare che 𝐼∗ (𝜆 𝑓 ) = 𝜆𝐼∗ ( 𝑓 ). Dunque se 𝑓 è Riemann-integrabile
anche 𝜆 𝑓 (con 𝜆 ≥ 0) lo è e vale (6.7).
Mettendo assieme (6.6) e (6.7) si ottiene che (6.7) vale per ogni 𝜆 ∈ ℝ. Lo
stesso sarà vero se mettiamo 𝑔 al posto di 𝑓 e 𝜇 al posto di 𝜆. Per concludere la
dimostrazione sarà dunque sufficiente mostrare che vale anche
∫ 𝑏 ∫ 𝑏 ∫ 𝑏
( 𝑓 + 𝑔) = 𝑓 + 𝑔.
𝑎 𝑎 𝑎
Osserviamo che su qualunque insieme 𝐴 si ha
sup( 𝑓 + 𝑔) ≤ sup 𝑓 + sup 𝑔.

𝐴 𝐴 𝐴
Infatti per le proprietà dell’estremo superiore per ogni 𝜀 > 0 esiste 𝑥 ∈ 𝐴 tale
che
sup( 𝑓 + 𝑔) ≤ 𝑓 (𝑥) + 𝑔(𝑥) + 𝜀.
𝐴
Ma chiaramente 𝑓 (𝑥) ≤ sup𝐴 𝑓 e 𝑔(𝑥) ≤ sup𝐴 𝑔 dunque si ottiene
sup( 𝑓 + 𝑔) ≤ sup 𝑓 + sup 𝑔 + 𝜀.

𝐴 𝐴 𝐴
Passando al limite per 𝜀 → 0+ si ottiene la disuguaglianza voluta. Questo

significa che
𝑆∗ ( 𝑓 + 𝑔) ≤ 𝑆∗ ( 𝑓 ) + 𝑆∗ (𝑔).
analogamente si potrà dimostrare che
𝑆∗ ( 𝑓 + 𝑔) ≥ 𝑆∗ ( 𝑓 ) + 𝑆∗ (𝑔).
Si ottiene dunque
𝐼 ∗ ( 𝑓 + 𝑔) ≤ 𝐼 ∗ ( 𝑓 ) + 𝐼 ∗ (𝑔) e 𝐼∗ ( 𝑓 + 𝑔) ≥ 𝐼∗ ( 𝑓 ) + 𝐼∗ (𝑔)
e dunque se 𝑓 e 𝑔 sono integrabili anche 𝑓 + 𝑔 risulta integrabile e vale la (6.2).
Per concludere che l’insieme delle funzioni integrali sia uno spazio vettoriale è
sufficiente osservare che, grazie al teorema 6.8, la funzione 0 risulta integrabile.
Teorema 6.12 (proprietà di reticolo). Se 𝑓 e 𝑔 sono funzioni a valori reali definiamo

le funzioni 𝑓 ∧ 𝑔 (minimo), 𝑓 ∨ 𝑔 (massimo), 𝑓 + (parte positiva) e 𝑓 − (parte negativa)
come segue:
( 𝑓 ∧ 𝑔)(𝑥) = min { 𝑓 (𝑥), 𝑔(𝑥)} ( 𝑓 ∨ 𝑔)(𝑥) = max { 𝑓 (𝑥), 𝑔(𝑥)}

( (
𝑓 (𝑥) se 𝑓 (𝑥) > 0 − 𝑓 (𝑥) se 𝑓 (𝑥) < 0
𝑓 + (𝑥) = 𝑓 − (𝑥) =
0 altrimenti 0 altrimenti.
Risulta 𝑓 = 𝑓 + − 𝑓 − , | 𝑓 | = 𝑓 + + 𝑓 − .
Se 𝑓 è una funzione Riemann-integrabile sull’intervallo [𝑎, 𝑏] allora anche | 𝑓 | , 𝑓 + e

𝑓 − sono integrabili e, se anche 𝑔 è Riemann-integrabile su [𝑎, 𝑏], allora anche 𝑓 ∨ 𝑔 e
𝑓 ∧ 𝑔 sono integrabili sullo stesso intervallo. Inoltre si ha
∫
∫ 𝑏 𝑏
|𝑓| ≥ 𝑓 . (6.8)

𝑎 𝑎
Dimostrazione. Dimostriamo innanzitutto che se 𝑓 è integrabile anche | 𝑓 | lo è.

Basta osservare che in generale se 𝑥, 𝑦 ∈ [𝑎, 𝑏] si ha
| 𝑓 (𝑥)| − | 𝑓 (𝑦)| ≤ | 𝑓 (𝑥) − 𝑓 (𝑦)|
da cui per ogni 𝐴 ⊆ [𝑎, 𝑏]
sup | 𝑓 (𝑥)| − inf | 𝑓 (𝑦)| ≤ sup 𝑓 (𝑥) − inf 𝑓 (𝑦)

𝑥∈𝐴 𝑦∈𝐴 𝑥∈𝐴 𝑦∈𝐴
e quindi per ogni suddivisione 𝑃 si avrà
𝑆∗ (| 𝑓 |, 𝑃) − 𝑆∗ (| 𝑓 |, 𝑃) ≤ 𝑆∗ ( 𝑓 , 𝑃) − 𝑆∗ ( 𝑓 , 𝑃).
Ma se 𝑓 è integrabile allora il lato destro può essere reso arbitrariamente piccolo

(teorema 6.6) e di conseguenza anche il lato sinistro. Dunque la funzione | 𝑓 | è
integrabile (se 𝑓 lo è).
Ma allora basta osservare che
|𝑓| + 𝑓 |𝑓| − 𝑓
𝑓+ = , 𝑓− = ,
2 2
𝑓 + 𝑔 − | 𝑓 − 𝑔| 𝑓 + 𝑔 + | 𝑓 − 𝑔|
𝑓 ∧𝑔= , 𝑓 ∨𝑔=
2 2
per dedurre che anche 𝑓 + , 𝑓 − , 𝑓 ∧ 𝑔 e 𝑓 ∨ 𝑔 sono integrabili, grazie alla linearità
dell’integrale (teorema 6.11).
Per dimostrare (6.8) basta osservare che

∫ ∫ ∫ 𝑛 ∫ 𝑏
𝑏 𝑏 ∫ 𝑏 ∫ 𝑏
+ − + −
𝑓 = 𝑓 − 𝑓 ≤ 𝑓 − 𝑓 = | 𝑓 |.

𝑎 𝑎 𝑎 𝑎 𝑎 𝑎
additività dell’integrale
Teorema 6.13 (additività dell’integrale). Sia 𝑓 : [𝑎, 𝑏] → ℝ una funzione limitata
e sia 𝑐 ∈ [𝑎, 𝑏]. Allora 𝑓 è Riemann-integrabile su [𝑎, 𝑏] se e solo se 𝑓 è Riemann-
integrabile su [𝑎, 𝑐] e su [𝑐, 𝑏]. E in tal caso risulta
∫ 𝑏 ∫ 𝑐 ∫ 𝑏
𝑓 = 𝑓 + 𝑓. (6.9)
𝑎 𝑎 𝑐
In base alla convenzione ∫ 𝑎 ∫ 𝑏

𝑓 =− 𝑓
𝑏 𝑎
la formula (6.9) è valida non solo se 𝑎 ≤ 𝑐 ≤ 𝑏 ma anche se 𝑎, 𝑏, 𝑐 sono in qualunque

ordine, purché la funzione 𝑓 sia integrabile sull’intervallo che contiene tutti e tre i punti
𝑎, 𝑏, 𝑐 .
Dimostrazione. Supponiamo che 𝑓 sia integrabile su [𝑎, 𝑐] e su [𝑐, 𝑏]. Allora, in

base ai criteri di integrabilità, per ogni 𝜀 > 0 esisteranno una suddivisione 𝑃 di
[𝑎, 𝑐] e una suddivisione 𝑄 di [𝑐, 𝑏] tali che
𝜀 𝜀
𝑆∗ ( 𝑓 , 𝑃) − 𝑆∗ ( 𝑓 , 𝑃) < , 𝑆∗ ( 𝑓 , 𝑄) − 𝑆∗ ( 𝑓 , 𝑄) < .
2 2
L’insieme 𝑅 = 𝑃 ∪ 𝑄 risulta essere una suddivisione di [𝑎, 𝑏] su cui si avrà
𝑆∗ ( 𝑓 , 𝑅) = 𝑆∗ ( 𝑓 , 𝑃) + 𝑆∗ ( 𝑓 , 𝑄), 𝑆∗ ( 𝑓 , 𝑅) = 𝑆∗ ( 𝑓 , 𝑃) + 𝑆∗ ( 𝑓 , 𝑄) (6.10)
e dunque
𝜀 𝜀
𝑆∗ ( 𝑓 , 𝑅) − 𝑆∗ ( 𝑓 , 𝑅) ≤ + = 𝜀.
2 2
Applicando nuovamente il criterio di integrabilità in senso invertito otteniamo

dunque l’integrabilità di 𝑓 su [𝑎, 𝑏] e le equazioni (6.10) garantiscono l’additività
dell’integrale rispetto al dominio.
Viceversa se 𝑓 è integrabile su [𝑎, 𝑏] il criterio di integrabilità ci garantisce che
per ogni 𝜀 > 0 esiste una suddivisione 𝑅 di [𝑎, 𝑏] tale che
𝑆∗ ( 𝑓 , 𝑅) − 𝑆∗ ( 𝑓 , 𝑅) < 𝜀.
Se ora consideriamo 𝑅0 = 𝑅 ∪ {𝑐} sappiamo che 𝑆 ∗ ( 𝑓 , 𝑅0) ≤ 𝑆 ∗ ( 𝑓 , 𝑅) e

𝑆∗ ( 𝑓 , 𝑅0) ≥ 𝑆∗ ( 𝑓 , 𝑅) dunque anche 𝑅0 soddisfa la proprietà
𝑆∗ ( 𝑓 , 𝑅0) − 𝑆∗ ( 𝑓 , 𝑅0) < 𝜀.
Ma ora è chiaro che posto 𝑃 = 𝑅0 ∩ [𝑎, 𝑐] e 𝑄 = 𝑅0 ∩ [𝑐, 𝑏] risulta che 𝑃 e 𝑄

siano suddivisioni di [𝑎, 𝑐] e [𝑐, 𝑏] rispettivamente e che
𝑆∗ ( 𝑓 , 𝑅0) = 𝑆∗ ( 𝑓 , 𝑃) + 𝑆∗ ( 𝑓 , 𝑄),
𝑆∗ ( 𝑓 , 𝑅0) = 𝑆∗ ( 𝑓 , 𝑃) + 𝑆∗ ( 𝑓 , 𝑄).
Dunque si ha
(𝑆 ∗ ( 𝑓 , 𝑃) − 𝑆∗ ( 𝑓 , 𝑃)) + (𝑆∗ ( 𝑓 , 𝑄) − 𝑆∗ ( 𝑓 , 𝑄)) = 𝑆∗ ( 𝑓 , 𝑅0) − 𝑆∗ ( 𝑓 , 𝑅0)

< 𝜀.
Visto che entrambi gli addendi 𝑆 ∗ − 𝑆∗ sono non negativi risulta che valgono
separatamente le disuguaglianze
𝑆∗ ( 𝑓 , 𝑃) − 𝑆∗ ( 𝑓 , 𝑃) < 𝜀, 𝑆∗ ( 𝑓 , 𝑄) − 𝑆∗ ( 𝑓 , 𝑄) < 𝜀.
Dunque 𝑓 è integrabile sia su [𝑎, 𝑐] che su [𝑐, 𝑏]. E nuovamente possiamo

osservare che l’integrale è additivo sul dominio.
Il seguente risultato mette in corrispondenza l’integrale di Riemann con la

misura di Peano-Jordan ed è un modo formale per dare all’integrale di Riemann
il significato di area (con segno) del sottografico della funzione integranda. Nel
seguito non faremo mai uso di questo risultato che serve solo a soddisfare la
nostra intuizione.
Teorema 6.14 (interpretazione geometrica dell’integrale). Sia 𝑓 : [𝑎, 𝑏] → ℝ,

una funzione limitata, 𝑎 ≤ 𝑏 . Posto
𝐸+ = {(𝑥, 𝑦) ∈ [𝑎, 𝑏] × ℝ : 0 ≤ 𝑦 ≤ 𝑓 (𝑥)},

𝐸− = {(𝑥, 𝑦) ∈ [𝑎, 𝑏] × ℝ : 𝑓 (𝑥) ≤ 𝑦 ≤ 0}
si ha che 𝑓 è Riemann-integrabile su [𝑎, 𝑏] se e solo se gli insiemi 𝐸 + ed 𝐸 − sono

misurabili secondo Peano-Jordan. E in tal caso risulta:
∫ 𝑏
𝑓 = 𝑚(𝐸+ ) − 𝑚(𝐸− )
𝑎
dove 𝑚 è la misura di Peano-Jordan.

Dimostrazione. Passo 1: supponiamo che sia 𝑓 (𝑥) ≥ 0 per ogni 𝑥 ∈ [𝑎, 𝑏].
Se 𝑃 = {𝑥 0 , 𝑥 1 , . . . , 𝑥 𝑁 } è una suddivione di [𝑎, 𝑏] è chiaro che posto 𝐼 𝑘 =
[𝑥 𝑘 , 𝑥 𝑘+1 ] l’unione dei rettangoli 𝑅 𝑘 = 𝐼 𝑘 × [0 , inf𝐼 𝑘 𝑓 ] ci dà un polirettangolo
contenuto in 𝐸 + . E 𝑆∗ ( 𝑓 , 𝑃) rappresenta proprio la misura di tale polirettangolo.
Dunque 𝑚∗ (𝐸 + ) ≥ 𝑆∗ ( 𝑓 , 𝑃) per ogni suddivisione 𝑃 e quindi 𝑚∗ (𝐸 + ) ≥ 𝐼∗ ( 𝑓 , 𝑃).
Ragionando in maniera analoga con i rettangoli la cui altezza è il sup di 𝑓 , si
osserva che 𝑆 ∗ ( 𝑓 , 𝑃) rappresenta la misura di un polirettangolo contenente 𝐸 +
e dunque 𝑚 ∗ (𝐸 + ) ≤ 𝐼 ∗ ( 𝑓 , 𝑃).
D’altra parte preso un qualunque polirettangolo che contenuto in 𝐸 + possiamo

considerare la suddivisione 𝑃 formata da 𝑎 , 𝑏 e da tutte le coordinate 𝑥 dei
lati dei rettangoli che compongono il polirettangolo. E’ chiaro il polirettangolo
sarà allora contenuto nell’unione dei rettangoli determinati da 𝑃 con altezza
l’estremo inferiore di 𝑓 . Dunque 𝑚∗ (𝐸 + ) ≤ 𝐼∗ ( 𝑓 ). Analogamente se prendiamo
un polirettangolo che contiene 𝐸 + possiamo innanzitutto tagliare tutti i rettangoli
con le rette 𝑥 = 𝑎 e 𝑥 = 𝑏 e rimuovere eventuali rettangoli che si trovino a
sinistra di 𝑥 = 𝑎 o a destra di 𝑥 = 𝑏 . Questo diminuisce la misura del
polirettangolo e mantiene l’inclusione di 𝐸 + . A questo punto consideriamo la
suddivisione 𝑃 ottenuta prendendo i punti 𝑎 , 𝑏 e tutte le coordinate 𝑥 dei lati
verticali dei rettangoli che formano il polirettangolo. E’ chiaro allora che la
misura del polirettangolo originario è maggiore o uguale a 𝑆 ∗ ( 𝑓 , 𝑃) e dunque
𝑚 ∗ (𝐸+ ) ≥ 𝐼 ∗ ( 𝑓 ).
Essendo dunque 𝑚∗ (𝐸 + ) = 𝐼∗ ( 𝑓 ) e 𝑚 ∗ (𝐸 + ) = 𝐼∗ ( 𝑓 ) risulta che se 𝑓 ≥ 0 allora 𝑓 è

Riemann-integrabile se e solo se 𝐸 + è Peano-Jordan misurabile e in tal caso si
∫𝑏
ha 𝑎
𝑓 = 𝑚(𝐸+ ).
Passo 2: sia 𝑓 : [𝑎, 𝑏] → ℝ qualunque. Allora si avrà 𝑓 = 𝑓 + − 𝑓 − . A 𝑓 + e 𝑓 −

potremo applicare il passo precedente. Osserviamo che l’insieme 𝐸 + di 𝑓 −
non è altro che la riflessione (rispetto all’asse delle ascisse) dell’insieme 𝐸 − di
𝑓 e questi insiemi hanno la stessa misura di Peano-Jordan. Dunque, se 𝑓 è
Riemann-integrabile anche 𝑓 + e 𝑓 − lo sono (Teorema 6.12) dunque 𝐸 + ed 𝐸 −
sono Peano-Jordan misurabili per il passo precedente e si ha
∫ 𝑏 ∫ 𝑏 ∫ 𝑏
+
𝑓 = 𝑓 − 𝑓 − = 𝑚(𝐸+ ) − 𝑚(𝐸− ). (6.11)
𝑎 𝑎 𝑎
Viceversa se 𝐸 + ed 𝐸 − sono Peano-Jordan misurabili allora 𝑓 + ed 𝑓 − sono

Riemann-integrabili (per il passo precedente) e anche 𝑓 = 𝑓 + − 𝑓 − è Riemann-
integrabile (Teorema 6.11) e di nuovo deve valere (6.11).
integrabilità delle funzioni continue
Teorema 6.15 (integrabilità delle funzioni continue). Sia 𝑓 : [𝑎, 𝑏] → ℝ una

funzione continua. Allora 𝑓 è limitata e Riemann-integrabile.
Dimostrazione. Per il teorema di Weierstrass sappiamo che 𝑓 è limitata. Per il

teorema di Heine-Cantor sappiamo che 𝑓 è uniformemente continua, dunque
per ogni 𝜀 > 0 esiste un 𝛿 > 0 tale che
|𝑥 − 𝑦| < 𝛿 =⇒ | 𝑓 (𝑥) − 𝑓 (𝑦)| < 𝜀.

Possiamo allora considerare una suddivisione 𝑃𝛿 con la proprietà che gli

intervalli individuati dalla suddivisione abbiano tutti ampiezza minore di 𝛿 (ad
esempio potremmo prendere la suddivisione formata da (𝑏 − 𝑎)/𝛿 + 2 punti
equispaziati in [𝑎, 𝑏]). Su ogni intervallo 𝐼 di tale suddivisione si avrà che
se 𝑥, 𝑦 ∈ 𝐼 allora | 𝑓 (𝑥) − 𝑓 (𝑦)| < 𝜀 da cui si deduce sup𝐼 𝑓 − inf𝐼 𝑓 ≤ 𝜀. In
particolare, sommando su tutti gli intervalli, si avrà
!
𝑁
X
𝑆 ∗ ( 𝑓 , 𝑃𝛿 ) − 𝑆∗ ( 𝑓 , 𝑃𝛿 ) = (𝑥 𝑘 − 𝑥 𝑘−1 ) sup 𝑓 − inf 𝑓
𝑘=1 [𝑥 𝑘−1 ,𝑥 𝑘 ] [𝑥 𝑘−1 ,𝑥 𝑘 ]
𝑁
X
≤𝜀 (𝑥 𝑘 − 𝑥 𝑘−1 ) = 𝜀(𝑏 − 𝑎).
𝑘=1
Visto che questa quantità può essere resa arbitrariamente piccola per 𝜀 → 0,
in base ai criteri di integrabilità possiamo concludere che la funzione 𝑓 è
integrabile.
integrabilità delle funzioni monotone

Teorema 6.16 (integrabilità delle funzioni monotone). Sia 𝑓 : [𝑎, 𝑏] → ℝ una
funzione monotona. Allora 𝑓 è limitata e Riemann-integrabile.
Dimostrazione. Supponiamo, per fissare le idee, che 𝑓 sia crescente.
Chiaramente 𝑓 è limitata in quanto 𝑓 (𝑎) ≤ 𝑓 (𝑥) ≤ 𝑓 (𝑏) per ogni 𝑥 ∈ [𝑎, 𝑏].
Per avere l’integrabilità e sufficiente mostrare che esiste una successione di sud-
divisioni 𝑃𝑛 tale che 𝑆 ∗ ( 𝑓 , 𝑃𝑛 ) − 𝑆∗ ( 𝑓 , 𝑃𝑛 ) → 0. Consideriamo la suddivisione
equispaziata 𝑃𝑛 = {𝑥 𝑘 : 𝑘 = 0 , 1 , . . . , 𝑛} con 𝑥 𝑘 = 𝑎 + 𝑘(𝑏 − 𝑎)/𝑁 . In tal caso su
ogni intervallino [𝑥 𝑘−1 , 𝑥 𝑘 ] si ha
sup 𝑓 ([𝑥 𝑘−1 , 𝑥 𝑘 ]) = 𝑓 (𝑥 𝑘 ), inf 𝑓 ([𝑥 𝑘−1 , 𝑥 𝑘 ]) = 𝑓 (𝑥 𝑘−1 ).
Dunque la differenza tra le somme superiori e le somme inferiori è telescopica e

si ha, per 𝑛 → +∞
𝑛 𝑛
X 𝑏−𝑎 X 𝑏−𝑎
𝑆∗ ( 𝑓 , 𝑃) − 𝑆∗ ( 𝑓 , 𝑃) = 𝑓 (𝑥 𝑘 ) − 𝑓 (𝑥 𝑘−1 )
𝑘=1
𝑛 𝑘=1
𝑛
𝑏−𝑎
= ( 𝑓 (𝑏) − 𝑓 (𝑎)) → 0.
𝑛
E’ quanto volevamo dimostrare.
funzione di Heaviside
Esempio 6.17 (funzione di Heaviside). Sia 𝑎 < 0 < 𝑏 . La funzione 𝐻 : [𝑎, 𝑏] → ℝ

definita da (
1 se 𝑥 ≥ 0
𝐻(𝑥) =
0 se 𝑥 < 0
è crescente quindi integrabile.
Teorema 6.18 (continuità dell’integrale). Sia 𝑓 : [𝑎, 𝑏] → ℝ una funzione limitata

e tale che per ogni 𝑐 ∈ (𝑎, 𝑏] risulta che 𝑓 sia Riemann-integrabile su [𝑐, 𝑏]. Allora 𝑓 è
Riemann-integrabile su [𝑎, 𝑐] e risulta

∫ 𝑏 ∫ 𝑏
𝑓 = lim+ 𝑓.
𝑎 𝑐→𝑎 𝑐
Analogamente se 𝑓 è integrabile su ogni intervallo [𝑎, 𝑐] con 𝑐 ∈ [𝑎, 𝑏) allora 𝑓 è

integrabile su [𝑎, 𝑏] e vale
∫ 𝑏 ∫ 𝑐
𝑓 = lim− 𝑓.
𝑎 𝑐→𝑏 𝑎
Dimostrazione. Dimostriamo solamente la prima parte, visto che la seconda si

tratta in maniera del tutto analoga. Supponiamo quindi che 𝑓 sia integrabile su
ogni intervallo [𝑐, 𝑏] con 𝑐 ∈ (𝑎, 𝑏]. Sappiamo inoltre che 𝑓 è limitata su tutto
[𝑎, 𝑏] e quindi esiste 𝑀 > 0 tale che | 𝑓 (𝑥)| ≤ 𝑀 per ogni 𝑥 ∈ [𝑎, 𝑏]. Fissato
𝜀 > 0 qualunque, scegliamo 𝑐 = 𝑎 + 𝜀/(4 𝑀) e, sapendo che 𝑓 è integrabile su
[𝑐, 𝑏], consideriamo una suddivisione 𝑄 𝜀 di [𝑐, 𝑏] tale che
𝜀
𝑆 ∗ ( 𝑓 , 𝑄 𝜀 ) − 𝑆∗ ( 𝑓 , 𝑄 𝜀 ) < .
2
Ma allora posto 𝑃𝜀 = {𝑎} ∪ 𝑄 𝜀 otteniamo:
𝑆∗ ( 𝑓 , 𝑃𝜀 ) = 𝑆∗ ( 𝑓 , 𝑄 𝜀 ) + (𝑐 − 𝑎) sup 𝑓 ≤ 𝑆∗ ( 𝑓 , 𝑄 𝜀 ) + 𝑀 · (𝑐 − 𝑎)
[𝑎,𝑐]
𝑆∗ ( 𝑓 , 𝑃𝜀 ) = 𝑆∗ ( 𝑓 , 𝑄 𝜀 ) + (𝑐 − 𝑎) inf 𝑓 ≥ 𝑆∗ ( 𝑓 , 𝑄 𝜀 ) − 𝑀 · (𝑐 − 𝑎)
[𝑎,𝑐]
da cui
𝑆 ∗ ( 𝑓 , 𝑃𝜀 ) − 𝑆∗ ( 𝑓 , 𝑃𝜀 ) ≤ 𝑆∗ ( 𝑓 , 𝑄 𝜀 ) − 𝑆∗ ( 𝑓 , 𝑄𝜀) + 2 𝑀 · (𝑐 − 𝑎)
𝜀 𝜀
< + 2𝑀 = 𝜀.
2 4𝑀
Dunque, la funzione 𝑓 è integrabile. Ma si ha
𝑏 𝑏
𝜀
∫ ∫
3 3
𝑓 ≤ 𝑆 ∗ ( 𝑓 , 𝑃𝜀 ) ≤ 𝑆 ∗ ( 𝑓 , 𝑄 𝜀 ) + ≤ 𝑆∗ ( 𝑓 , 𝑄 𝜀 ) + 𝜀 ≤ 𝑓 + 𝜀
𝑎 2 2 𝜀
𝑎+ 4 𝑀 2
𝑏 𝑏
𝜀
∫ ∫
3 3
𝑓 ≥ 𝑆∗ ( 𝑓 , 𝑃𝜀 ) ≥ 𝑆∗ ( 𝑓 , 𝑃𝜀 ) − ≥ 𝑆 ∗ ( 𝑓 , 𝑃𝜀 ) − 𝜀 ≥ 𝑓 − 𝜀
𝑎 2 2 𝜀
𝑎+ 4 𝑀 2
da cui, passando al limite per 𝜀 → 0+ , si ottiene

∫ 𝑏 ∫ 𝑏 ∫ 𝑏
lim+ 𝑓 ≤ 𝑓 ≤ lim+ 𝑓
𝑐→𝑎 𝑐 𝑎 𝑐→𝑎 𝑐
e quindi l’uguaglianza.

(
sin 1
𝑥 se 𝑥 ≠ 0,
𝑓 (𝑥) =
0 se 𝑥 = 0
è integrabile su ogni intervallo chiuso e limitato [𝑎, 𝑏].
Dimostrazione. Su ogni intervallo [𝜀, 𝑏] con 𝜀 > 0 e 𝑏 > 𝜀 la funzione è integrabile

in quanto su tali intervalli è continua (la funzione è continua su tutto ℝ \ {0}).
Inoltre la funzione è limitata, quindi per il teorema precedente possiamo
concludere che è integrabile su [0 , 𝑏] per ogni 𝑏 > 0.
In maniera analoga (per simmetria) la funzione è integrabile su [𝑎, 0] per ogni

𝑎 < 0. Dunque, per additività, la funzione è integrabile su ogni [𝑎, 𝑏] con 𝑎 < 0
e 𝑏 > 0 e di conseguenza (sempre grazie al teorema 6.13) è integrabile su ogni
intervallo [𝑎, 𝑏].
Teorema 6.20 (del valor medio). Siano 𝑎, 𝑏 ∈ ℝ, 𝑎 < 𝑏 e sia 𝑓 : [𝑎, 𝑏] → ℝ una
funzione continua. Allora esiste un punto 𝑦 ∈ [𝑎, 𝑏] tale che
∫𝑏
𝑎
𝑓
= 𝑓 (𝑦).
𝑏−𝑎
La quantità
∫𝑏
𝑎
𝑓
𝑏−𝑎
si chiama valor medio integrale di 𝑓 su [𝑎, 𝑏] e spesso si indica con il simbolo
∫ 𝑏
− 𝑓.
𝑎
Dimostrazione. Per il teorema di Weierstrass la funzione 𝑓 ha massimo 𝑀 e

minimo 𝑚 sull’intervallo [𝑎, 𝑏] cosicché per ogni 𝑥 ∈ [𝑎, 𝑏] si avrà:
𝑚 ≤ 𝑓 (𝑥) ≤ 𝑀.
Risulta quindi, per la monotonia dell’integrale:

∫ 𝑏 ∫ 𝑏 ∫ 𝑏
(𝑏 − 𝑎)𝑚 = 𝑚≤ 𝑓 ≤ 𝑀 = (𝑏 − 𝑎)𝑀
𝑎 𝑎 𝑎
ovvero ∫𝑏
𝑎
𝑓
𝑚≤≤ 𝑀.
𝑏−𝑎
Dunque la media integrale è un valore intermedio tra il minimo e il massimo
della funzione e quindi, per il teorema dei valori intermedi, dovrà esistere un
punto 𝑦 ∈ [𝑎, 𝑏] dove la funzione assume tale valore.
Il seguente risultato è una versione continua della disuguaglianza di convessità

per le combinazioni baricentriche.
Teorema 6.21 (disuguaglianza di Jensen). Sia 𝑓 : [𝑎, 𝑏] → 𝐼 ⊆ ℝ una funzione

continua a valori in un intervallo 𝐼 e sia 𝜑 : 𝐼 → ℝ una funzione convessa e continua.
Sia inoltre 𝑔 : [𝑎, 𝑏] → ℝ una funzione continua tale che
∫ 𝑏
𝑔(𝑥) 𝑑𝑥 = 1
𝑎
Allora si ha ∫ 𝑏 ∫ 𝑏
𝜑 𝑓 (𝑥)𝑔(𝑥) 𝑑𝑥 ≤ 𝜑( 𝑓 (𝑥))𝑔(𝑥) 𝑑𝑥.
𝑎 𝑎
Nel caso particolare in cui si scelga 𝑔 la funzione costante 𝑔(𝑥) = 1/(𝑏 − 𝑎) si ottiene
la formulazione più espressiva:
∫ 𝑏 ∫ 𝑏
𝜑 − 𝑓 (𝑥) 𝑑𝑥 ≤ − 𝜑( 𝑓 (𝑥)) 𝑑𝑥.
𝑎 𝑎
Dimostrazione. Le ipotesi di continuità di 𝑓 , 𝑔 e 𝜑 sono sovrabbondanti, ma ci

servono per avere una garanzia immediata che entrambe le funzioni integrande
siano effettivamente Riemann-integrabili. Posto
∫ 𝑏
𝑦0 = 𝑓 (𝑥)𝑔(𝑥) 𝑑𝑥
𝑎
scegliamo una funzione affine 𝐿(𝑦) = 𝑚 𝑦 + 𝑞 tale che 𝐿(𝑦0 ) = 𝜑(𝑦0 ) e 𝐿(𝑦) ≤
𝜑(𝑦) per ogni 𝑦 ∈ 𝐼 (grazie al teorema 5.36). Per la linearità dell’integrale si ha:
∫ 𝑏 ∫ 𝑏 ∫ 𝑏
𝐿(𝑦0 ) = 𝑚 𝑓 (𝑥)𝑔(𝑥) 𝑑𝑥 + 𝑞 𝑔(𝑥) 𝑑𝑥 = 𝐿( 𝑓 (𝑥))𝑔(𝑥) 𝑑𝑥.
𝑎 𝑎 𝑎
Allora per la monotonia dell’integrale risulta

∫ 𝑏 ∫ 𝑏
𝜑(𝑦0 ) = 𝐿(𝑦0 ) = 𝐿( 𝑓 (𝑥))𝑔(𝑥) 𝑑𝑥 ≤ 𝜑( 𝑓 (𝑥))𝑔(𝑥) 𝑑𝑥.
𝑎 𝑎
6.3 teorema fondamentale del calcolo integrale

teor. fondamentale
Teorema 6.22 (Torricelli-Barrow: teorema fondamentale del calcolo integrale).
Sia 𝐼 ⊆ ℝ un intervallo, sia 𝑥 0 ∈ 𝐼 e sia 𝑓 : 𝐼 → ℝ una funzione continua. Allora la
funzione integrale funzione integrale 𝐹 : 𝐼 → ℝ
∫ 𝑥
𝐹(𝑥) = 𝑓
𝑥0
è ben definita, è derivabile e si ha per ogni 𝑥 ∈ 𝐼
𝐹0(𝑥) = 𝑓 (𝑥).
In particolare essendo 𝑓 ∈ 𝐶 0 (𝐼) si ha 𝐹 ∈ 𝐶 1 (𝐼).

6.3 teorema fondamentale del calcolo integrale 251
Inoltre se 𝐺 : 𝐼 → ℝ è una qualunque funzione tale che 𝐺0(𝑥) = 𝑓 (𝑥) per ogni 𝑥 ∈ 𝐼 ,
allora per ogni 𝑎, 𝑏 ∈ 𝐼 si ha formula fondamentale del calcolo integrale
∫ 𝑏
𝑓 = 𝐺(𝑏) − 𝐺(𝑎).
𝑎
Dimostrazione. Osserviamo innanzitutto che la funzione 𝑓 , essendo continua, è

integrabile
∫𝑥 su ogni intervallo chiuso e limitato contenuto in 𝐼 . Dunque l’integrale
𝑥
𝑓 è ben definito.
0
Per ogni ℎ ≠ 0, se 𝑥 + ℎ ∈ 𝐼 per l’additività dell’integrale si ha

∫ 𝑥+ℎ ∫𝑥 𝑥+ℎ
𝑓 − 𝑓
∫
𝐹(𝑥 + ℎ) − 𝐹(𝑥) 𝑥0 𝑥0 𝑥
𝑓
= = .
ℎ ℎ ℎ
Applicando ora il teorema del valor medio possiamo affermare che esiste un
punto 𝜉(ℎ) nell’intervallo di estremi 𝑥 e 𝑥 + ℎ tale che
∫𝑥+ℎ
𝑥
𝑓
= 𝑓 (𝜉(ℎ)).
ℎ
Per ℎ → 0, si ha 𝜉(ℎ) → 𝑥 e, per continuità di 𝑓 , 𝑓 (𝜉(ℎ)) → 𝑓 (𝑥). Dunque
abbiamo mostrato che 𝐹 è derivabile in 𝑥 :
𝐹(𝑥 + ℎ) − 𝐹(𝑥)
lim = 𝑓 (𝑥)
ℎ→0 ℎ
e 𝐹0(𝑥) = 𝑓 (𝑥).
Dunque se 𝑎, 𝑏 ∈ 𝐼 sono punti qualunque si ha:

∫ 𝑏 ∫ 𝑏 ∫ 𝑎
𝑓 = 𝑓 − 𝑓 = 𝐹(𝑏) − 𝐹(𝑎).
𝑎 𝑥0 𝑥0
E se 𝐺 : 𝐼 → ℝ è una qualunque funzione tale che 𝐺0(𝑥) = 𝑓 (𝑥) si avrà

𝐺0(𝑥) = 𝐹0(𝑥) per ogni 𝑥 ∈ 𝐼 e dunque (𝐺 − 𝐹)0 = 0 su 𝐼 . Per i criteri di
monotonia possiamo concludere che 𝐺 − 𝐹 è costante su 𝐼 : 𝐺 − 𝐹 = 𝑐 . Dunque
si ha
∫ 𝑏
𝑓 = 𝐹(𝑏) − 𝐹(𝑎) = (𝐺(𝑏) − 𝑐) − (𝐺(𝑎) − 𝑐) = 𝐺(𝑏) − 𝐺(𝑎).
𝑎
Esempio 6.23. Si voglia calcolare

∫ 𝑏
𝑥 2 𝑑𝑥.
0
Basterà osservare che posto 𝐺(𝑥) = 𝑥3 si ha 𝐺0(𝑥) = 𝑥 2 e quindi, grazie alla formula
3
fondamentale del calcolo integrale si ha
𝑏
𝑏3
∫
𝑥 2 𝑑𝑥 = 𝐺(𝑏) − 𝐺(0) = .
0 3
E’ evidente quanto questo metodo risolutivo sia molto più semplice e potente di quello
utilizzato nell’esempio 6.7.
Definizione 6.24 (primitiva). Sia 𝐴 ⊆ ℝ e sia 𝑓 : 𝐴 → ℝ una funzione qualunque.

primitiva Una funzione 𝐹 : 𝐴 → ℝ si dice essere una primitiva (o antiderivata) di 𝑓 se 𝐹 è
derivabile e 𝐹0(𝑥) = 𝑓 (𝑥) per ogni 𝑥 ∈ 𝐴.
Il teorema fondamentale del calcolo integrale può dunque essere espresso nel
modo seguente: ogni funzione 𝑓 continua, definita su un intervallo, ammette
almeno una primitiva e se 𝐹 è una qualunque primitiva di 𝑓 si ha
∫ 𝑏
𝑓 = 𝐹(𝑏) − 𝐹(𝑎).
𝑎
Per indicare la differenza 𝐹(𝑏) − 𝐹(𝑎) si usano talvolta le seguenti notazioni:
[𝐹(𝑥)]𝑏𝑥=𝑎 = [𝐹]𝑏𝑎 = 𝐹(𝑥)| 𝑏𝑥=𝑎 = 𝐹| 𝑏𝑎 = 𝐹(𝑏) − 𝐹(𝑎).
Il calcolo degli integrali si riduce quindi alla determinazione delle primitive

ovvero ad invertire l’operatore di derivata. Risulterà quindi importante avere
degli strumenti per determinare le primitive di una funzione.
Definizione 6.25 (integrale indefinito). L’insieme di tutte le primitive di una

funzione 𝑓 : 𝐴 → ℝ si indica con il simbolo
∫ ∫
𝑓 oppure 𝑓 (𝑥) 𝑑𝑥
e si chiama integrale indefinito. Il motivo di questa notazione (e del nome) deriva

dal teorema fondamentale del calcolo integrale, in base al quale se 𝑓 : [𝑎, 𝑏] → ℝ è
continua si ha ∫ ∫ 𝑏 𝑏
𝑓 = 𝑓 .
𝑎 𝑎
Osservazione 6.26. Si faccia attenzione però che nel caso di funzioni non continue è
possibile che le funzioni integrali non siano primitive. Ad esempio se si∫ prende la funzione
𝑥
di Heaviside 𝐻(𝑥) definita nell’esempio 6.17 si può osservare che 0 𝐻(𝑡) 𝑑𝑡 = |𝑥| è
una funzione integrale ma non è una primitiva (e l’insieme delle primitive, in questo
caso, è vuoto).
Se pensiamo all’operatore∫lineare 𝐷 definito sull’insieme delle funzioni derivabili

𝐷 𝑓 = 𝑓 0 si può pensare a 𝑓 come all’insieme delle controimmagini di 𝑓 tramite
𝐷 ovvero: ∫
𝑓 = 𝐷 −1 ({ 𝑓 }) = {𝐹 : 𝐷𝐹 = 𝑓 }.
6.3 teorema fondamentale del calcolo integrale 253
∫
Dunque 𝑓 è l’insieme delle soluzioni 𝐹 dell’equazione lineare non omogenea
𝐷𝐹 = 𝑓 . L’equazione omogenea associata è 𝐷𝐹 = 0. Se le funzioni sono
definite su un intervallo allora le soluzioni dell’equazione omogenea sono le
costanti
∫ (come enunciato nel seguente teorema). Dunque in tal caso lo spazio
𝑓 è uno spazio affine di dimensione 1 parallelo allo spazio vettoriale delle
funzioni costanti. Ma se scegliamo un dominio che non è un intervallo (come
nell’esempio 6.28) si avrà uno spazio la cui dimensione è pari al numero di
intervalli che compongono il dominio.
Teorema 6.27 (proprietà delle primitive). Sia 𝑓 : 𝐼 → ℝ una funzione continua

definita su un intervallo non vuoto 𝐼 ⊆ ℝ. Allora
1. esiste almeno una primitiva 𝐹 di 𝑓 ;

2. data una primitiva 𝐹 di 𝑓 ogni altra primitiva 𝐺 differisce da 𝐹 per una costante:
∃𝑐 ∈ ℝ : 𝐺 = 𝐹 + 𝑐 .
∫
Detto in altri termini se 𝑓 è continua 𝑓 non è vuoto e se inoltre il dominio di 𝑓 è un
∫
intervallo e 𝐹 ∈ 𝑓 è una qualunque primitiva, allora
∫
𝑓 = {𝐹 + 𝑐 : 𝑐 ∈ ℝ}.
Osserviamo che l’insieme delle funzioni costanti su un intervallo non è altro che
ker 𝐷 ovvero lo spazio di annullamento dell’operatore derivata. Stiamo dunque
semplicemente osservando che le controimmagini di un operatore lineare sono
spazi affini paralleli al nucleo dell’operatore.
Dimostrazione. Scelto un punto 𝑥 0 ∈ 𝐼 possiamo considerare la funzione

integrale ∫ 𝑥
𝐹(𝑥) = 𝑓 (𝑡) 𝑑𝑡.
𝑥0
Il teorema fondamentale del calcolo integrale ci assicura che 𝐹 è una primitiva

di 𝑓 .
Viceversa se 𝐹 e 𝐺 sono due primitive di 𝑓 allora si ha:
𝐹 0 = 𝐺0 = 𝑓 .
Posto 𝐻 = 𝐺−𝐹 avremo quindi 𝐻 0 = 0 sull’intervallo 𝐼 . Per i criteri di monotonia

sappiamo quindi che 𝐻 è costante, ovvero esiste 𝑐 ∈ ℝ tale che 𝐻(𝑥) = 𝑐 per
ogni 𝑥 ∈ 𝐼 . Dunque si ottiene, come voluto: 𝐺 = 𝐹 + 𝐻 = 𝐹 + 𝑐 .
Se la funzione 𝑓 non è definita su un intervallo l’insieme delle primitive avrà

dimensione maggiore di 1, come si vede nel seguente.
Esempio 6.28 (primitive sugli insiemi non connessi). Consideriamo la funzione

𝑓 (𝑥) = 1/𝑥 . Osserviamo che 𝑓 : (−∞, 0) ∪ (0, +∞) → ℝ è definita sull’unione di due
intervalli. Per verifica diretta possiamo osservare che la funzione 𝐹(𝑥) = ln |𝑥| è una
primitiva di 𝑓 . Per ottenere l’insieme di tutte le primitive possiamo aggiungere ad 𝐹
una qualunque funzione con derivata nulla sul dominio di 𝑓 . Le funzioni con derivata
nulla sono costanti su ogni intervallo e quindi troviamo che per ogni 𝑐 1 , 𝑐 2 ∈ ℝ la
funzione (
ln(𝑥) + 𝑐 1 se 𝑥 > 0 ,
𝐺(𝑥) =
ln(−𝑥) + 𝑐 2 se 𝑥 < 0
è una primitiva di 𝑓 e non ci sono altre primitive.

In questo caso lo spazio delle primitive ha dimensione 2 in quanto il nucleo dell’operatore
derivata sullo spazio delle funzioni definite sull’unione di due intervalli ha dimensione 2.
Questo è l’esempio più semplice di un fenomeno piuttosto generale per cui gli operatori
differenziali su un certo spazio risultano strettamente legati alla topologia dello spazio
stesso. In questo caso la dimensione del nucleo dell’operatore derivata 𝐷 è uguale al
numero di componenti connesse del dominio delle funzioni nel dominio di 𝐷 .
6.4 calcolo delle primitive

∫
Come già detto utilizzeremo la notazione 𝑓 per indicare le primitive della
∫
funzione 𝑓 . Ma invece di scrivere 𝐹 ∈ 𝑓 per indicare che 𝐹 è una primitiva
∫
di 𝑓 potremo scrivere più semplicemente ma con abuso di notazione 𝑓 = 𝐹
ricordando (come facevamo con la notazione degli 𝑜 -piccolo) che tale relazione
non è affatto simmetrica. Tradizionalmente si scrive
∫
cos 𝑥 𝑑𝑥 = sin 𝑥 + 𝑐 (6.12)
ma potremmo anche scrivere più semplicemente:

∫
cos 𝑥 𝑑𝑥 = sin 𝑥. (6.13)
Il modo di scrivere (6.12) è solo apparen-

temente migliore di (6.13) in quanto in
alcuni casi non tutte le primitive posso
essere determinate a meno di una costan- Teorema 6.29 (primitive di alcune funzioni elementari). Si ha per ogni 𝛼 ∈ ℝ,
te (si veda l’esempio 6.28). Vale quindi 𝛼 ≠ −1
la regola (valida in generale per tutte le
notazioni che richiedono una interpreta- 𝑥 𝛼+1
∫ ∫
𝛼 1
zione) di usare con cautela e cognizione 𝑥 𝑑𝑥 3 , 𝑑𝑥 3 ln |𝑥|
di causa la notazione degli integrali in-
𝛼+1 𝑥
∫ ∫ ∫
definiti: bisogna essere consapevoli del 𝑥 𝑥
significato di quello che scriviamo e dob-
𝑒 𝑑𝑥 3 𝑒 , cos 𝑥 𝑑𝑥 3 sin 𝑥, sin 𝑥 𝑑𝑥 3 − cos 𝑥
biamo utilizzare una notazione che sia ∫ ∫
comprensibile a chi ci ascolta. cosh 𝑥 𝑑𝑥 3 sinh 𝑥, sinh 𝑥 𝑑𝑥 3 cosh 𝑥,
∫ ∫
1 1
𝑑𝑥 3 arctg 𝑥, √ 𝑑𝑥 3 arcsin 𝑥,
1 + 𝑥2 1 − 𝑥2
∫
1 √
√ 𝑑𝑥 3 settsinh 𝑥 = ln 𝑥 + 𝑥 2 + 1
𝑥2 + 1
∫
1 √
√ 𝑑𝑥 3 settcosh 𝑥 = ln 𝑥 + 𝑥 2 − 1 .
𝑥2 − 1
Dimostrazione. E’ sufficiente fare riferimento alla corrispondente tabella delle

derivate delle funzioni elementari (teorema 5.8).
6.4 calcolo delle primitive 255
Teorema 6.30 (linearità dell’integrale indefinito). Per ogni 𝜆, 𝜇 ∈ ℝ e se 𝑓 , 𝑔 sono

funzioni qualunque si ha:
∫ ∫ ∫
(𝜆 𝑓 + 𝜇𝑔) ⊇ 𝜆 𝑓 +𝜇 𝑔
Dimostrazione. Ogni elemento∫dell’insieme

∫ che si trova sul lato destro si scrive
nella forma 𝜆𝐹 + 𝜇𝐺 con 𝐹 ∈ 𝑓 e 𝐺 ∈ 𝑔 . Dunque si ha 𝐹0 = 𝑓 e 𝐺0 = 𝑔 da
cui
(𝜆𝐹 + 𝜇𝐺)0 = 𝜆 𝑓 + 𝜇𝑔
e quindi ∫
𝜆𝐹 + 𝜇𝐺 ∈ (𝜆 𝑓 + 𝜇𝑔)
come dovevamo dimostrare.
Teorema 6.31 (cambio di variabile negli integrali). Valgono le seguenti proprietà:

sostituzione diretta
1. se 𝑔 : 𝐴 → ℝ è derivabile e 𝑓 : 𝑔(𝐴) → ℝ allora
∫ ∫
0
𝑓 (𝑔(𝑥))𝑔 (𝑥) 𝑑𝑥 ⊇ 𝑓 (𝑦) 𝑑𝑦
𝑦=𝑔(𝑥)
dove si intende
[𝐹(𝑦)] 𝑦=𝑔(𝑥) = 𝐹(𝑔(𝑥));
cambio di variabile
2. se 𝑔 ∈ 𝐶 1 ([𝑎, 𝑏]) e 𝑓 ∈ 𝐶 0 (𝑔([𝑎, 𝑏])) allora
∫ 𝑔(𝑏) ∫ 𝑏
𝑓 (𝑥) 𝑑𝑥 = 𝑓 (𝑔(𝑡)) 𝑔 0(𝑡) 𝑑𝑡 ;
𝑔(𝑎) 𝑎
3. se 𝑔 ∈ 𝐶 1 ([𝑎, 𝑏]) è iniettiva, 𝑓 ∈ 𝐶 0 (𝑔([𝑎, 𝑏])) allora 𝑔 −1 è definita su 𝑔([𝑎, 𝑏]) sostituzione inversa
e si ha ∫ ∫
𝑓 (𝑥) 𝑑𝑥 ⊇ 𝑓 (𝑔(𝑡))𝑔 0(𝑡) 𝑑𝑡 (6.14)
𝑡=𝑔 −1 (𝑥)
Dimostrazione. Per la prima parte basta osservare che se 𝐹(𝑦) è una qualunque
primitiva di 𝑓 (𝑦) allora 𝐹(𝑔(𝑥)) è una primitiva di 𝑓 (𝑔(𝑥)) · 𝑔 0(𝑥) (basta applicare
la formula di derivazione della funzione composta). Dunque ogni elemento
dell’insieme di destra in (6.14) è elemento dell’insieme di sinistra.
Per la seconda parte sappiamo che 𝑓 , essendo continua, ammette almeno una
primitiva 𝐹(𝑥). Per il punto precedente sappiamo che 𝐹(𝑔(𝑡)) è una primitiva
di 𝑓 (𝑔(𝑡))𝑔 0(𝑡) (basta farne la derivata per verificarlo). Dunque, utilizzando la
formula fondamentale del calcolo, si ottiene:
∫ 𝑔(𝑏)
𝑔(𝑏)
𝑓 (𝑥) 𝑑𝑥 = [𝐹(𝑥)] 𝑔(𝑎) = 𝐹(𝑔(𝑏)) − 𝐹(𝑔(𝑎))
𝑔(𝑎)
e ∫ 𝑏
𝑓 (𝑔(𝑡))𝑔 0(𝑡) 𝑑𝑡 = [𝐹(𝑔(𝑡))]𝑏𝑎 = 𝐹(𝑔(𝑏)) − 𝐹(𝑔(𝑎)).
𝑎
Le due espressioni sono uguali, come volevamo dimostrare.
Per la terza parte sia 𝐹 una qualunque funzione elemento dell’insieme sul lato
destro della relazione che vogliamo dimostrare. Si avrà 𝐹(𝑥) = 𝐻(𝑔 −1 (𝑥)) con
𝐻(𝑡) primitiva di 𝑓 (𝑔(𝑡))𝑔 0(𝑡). Ma allora, per la formula fondamentale del
calcolo integrale, si ha
∫ 𝑡
𝐻(𝑡) − 𝐻(𝑎) = 𝑓 (𝑔(𝑠))𝑔 0(𝑠) 𝑑𝑠
𝑎
da cui
∫ 𝑔 −1 (𝑥)
𝐹(𝑥) − 𝐹(𝑔(𝑎)) = 𝐻(𝑔 −1 (𝑥)) − 𝐻(𝑎) = 𝑓 (𝑔(𝑡))𝑔 0(𝑡) 𝑑𝑡
𝑎
utilizzando il punto precedente sappiamo però che vale

∫ 𝑔 −1 (𝑥) ∫ 𝑥
𝐹(𝑥) − 𝐹(𝑔(𝑎)) = 𝑓 (𝑔(𝑡))𝑔 0(𝑡) 𝑑𝑡 = 𝑓 (𝑠) 𝑑𝑠.
𝑎 𝑔(𝑎)
Dunque derivando ambo i membri, grazie ancora al teorema fondamentale

otteniamo:
𝐹0(𝑥) = 𝑓 (𝑥)
∫
cioè 𝐹 ∈ 𝑓 , come dovevamo dimostrare.
Le formule del teorema precedente si scrivono usualmente nella forma

∫ ∫
0
𝑓 (𝑔(𝑥))𝑔 (𝑥) 𝑑𝑥 = 𝑓 (𝑦) 𝑑𝑦
dove si intende che le variabili 𝑥 e 𝑦 devono soddisfare la relazione 𝑦 = 𝑔(𝑥)

(o, viceversa, 𝑥 = 𝑔 −1 (𝑦)). Per memorizzare tale formula si usa normalmente
definire il differenziale di una funzione 𝑔 come 𝑑𝑔(𝑥) = 𝑔 0(𝑥) 𝑑𝑥 (coerentemente
con la notazione 𝑔 0 = 𝑑𝑔/𝑑𝑥 ) cosicché se 𝑦 = 𝑔(𝑥) si ha 𝑑𝑦 = 𝑔 0(𝑥) 𝑑𝑥 . Non
daremo qui una definizione formale di cosa sia un differenziale ma senz’altro
utilizzeremo questa comoda notazione, pensandola semplicemente come una
facilitazione tipografica.
Esercizio 6.32. Vogliamo calcolare

∫
cos2 (𝑥) 𝑑𝑥.
Ricordando che cos(2𝑡) = cos2 𝑡 − sin2 𝑡 = 2 cos2 𝑡 − 1 si ha cos2 𝑡 = (1 + cos(2𝑡))/2

(formula di bisezione). Dunque
1 + cos(2𝑡) cos(2𝑡)
∫ ∫ ∫ ∫
1
cos2 (𝑡) 𝑑𝑡 = 𝑑𝑡 = 𝑑𝑡 + 𝑑𝑡.
2 2 2
∫
Chiaramente 12 𝑑𝑡 = 𝑡/2. Nel secondo integrale possiamo fare un cambio di variabile,
ponendo 2𝑡 = 𝑠 da cui 2 𝑑𝑡 = 𝑑𝑠 :
cos(2𝑡)
∫ ∫ ∫
1 1 1
𝑑𝑡 = cos(2𝑡) 2 𝑑𝑡 = cos 𝑠 𝑑𝑠 = [sin 𝑠]𝑠=2𝑡
2 4 4 𝑠=2𝑡
4
1 1
= sin(2𝑡) = sin 𝑡 cos 𝑡.
4 2
In definitiva otteniamo
𝑡 + sin 𝑡 cos 𝑡
∫
cos2 (𝑥) 𝑑𝑥 = .
2
Esempio 6.33. Vogliamo calcolare

∫ √
1 − 𝑥 2 𝑑𝑥.
La funzione integranda è definita per 𝑥 ∈ [−1 , 1]. Ci viene in mente di operare la

sostituzione 𝑥 = sin 𝑡 con 𝑡 ∈ [−𝜋/2 , 𝜋/2]. Osserviamo che su [−𝜋/2 , 𝜋/2] la
funzione sin 𝑡 è derivabile, invertibile e la sua inversa è 𝑡 = arcsin 𝑥 . Informalmente si
ha
𝑥 = sin 𝑡, 𝑑𝑥 = cos 𝑡 𝑑𝑡
da cui si ottiene la formula
∫ √ ∫ q
1− 𝑥2 𝑑𝑥 = 1 − sin (𝑡) cos 𝑡 𝑑𝑡
2
.
𝑡=arcsin 𝑥
p
Osserviamo ora che per 𝑡 ∈ [−𝜋/2 , 𝜋/2] risulta 1 − sin2 (𝑡) = cos 𝑡 e dunque
l’integrale diventa
∫ q ∫
1 − sin (𝑡) cos 𝑡 𝑑𝑡 =
2
cos2 (𝑡) 𝑑𝑡.
Quest’ultimo integrale lo abbiamo calcolato nell’esercizio precedente. Dunque otteniamo:

∫ √
𝑡 + sin 𝑡 cos 𝑡
∫
(𝑥=sin 𝑡)
1− 𝑥2 𝑑𝑥 = cos2 (𝑡) 𝑑𝑡 =
2
√
𝑡 + (sin 𝑡) 1 − sin 𝑡 2
=
2
√
(𝑡=arcsin 𝑥) arcsin 𝑥 + 𝑥 1 − 𝑥 2
= .
2
√
Si osservi che il grafico 𝑦 = 1 − 𝑥 2 dell’esempio precedente è una semicircon-
ferenza e dunque l’integrale
" √ #1
∫ 1 √ arcsin 𝑥 + 𝑥 1 − 𝑥 2 𝜋
1 − 𝑥 𝑑𝑥 =
2 = .
−1 2 2
−1
rappresenta l’area di un semicerchio unitario.

integrale per parti
Teorema 6.34 (integrazione per parti). Sia 𝑓 : 𝐴∫ ⊆ ℝ → ℝ una funzione qualunque,

sia 𝑔 : 𝐴 → ℝ una funzione derivabile e sia 𝐹 ∈ 𝑓 . Allora
∫ ∫
𝑓 ·𝑔 ⊇𝐹·𝑔− 𝐹 · 𝑔0.
∫
In particolare se 𝑓 ∈ 𝐶 0 ([𝑎, 𝑏]) e 𝑔 ∈ 𝐶 1 ([𝑎, 𝑏]) e 𝐹 ∈ 𝑓 , si ha
∫ 𝑏 ∫ 𝑏
𝑓 · 𝑔 = [𝐹 · 𝑔]𝑏𝑎 − 𝐹 · 𝑔0.
𝑎 𝑎
Dimostrazione.
∫ Ogni funzione dell’insieme di destra si scrive nella forma 𝐹 · 𝑔 −𝐻
con 𝐻 ∈ 𝐹 · 𝑔 0. Dunque 𝐻 0 = 𝐹 · 𝑔 0 e, per ipotesi, 𝐹0 = 𝑓 da cui
(𝐹 · 𝑔 − 𝐻)0 = 𝐹0 · 𝑔 + 𝐹 · 𝑔 0 − 𝐻 0 = 𝐹0 · 𝑔 = 𝑓 · 𝑔
La seconda parte del teorema deriva direttamente dalla formula fondamentale

del calcolo integrale (valida in quanto sia 𝑓 · 𝑔 che 𝐹 · 𝑔 0 sono funzioni continue),
osservando che
∫ 𝑏 ∫ 𝑏
𝐹·𝑔− 𝐹 · 𝑔0 = [𝐹 · 𝑔]𝑏𝑎 − 𝐹 · 𝑔0.
𝑎 𝑎

∫
𝑥 cos 𝑥 𝑑𝑥.
Il metodo di integrazione per parti ci permette di ricondurre l’integrale di un prodotto

ad un integrale di un prodotto in cui uno dei fattori viene integrato e l’altro derivato. In
questo caso sarà conveniente derivare il fattore 𝑥 e integrare il fattore cos 𝑥 in modo da
ricondursi all’integrale di 1 · sin 𝑥 , che sappiamo svolgere. Precisamente si ha
∫ ∫
𝑥 cos 𝑥 𝑑𝑥 = 𝑥 sin 𝑥 − 1 · sin 𝑥 𝑑𝑥 = 𝑥 sin 𝑥 + cos 𝑥.

∫
𝑒 𝑥 cos 𝑥 𝑑𝑥.
In questo caso
∫ se utilizziamo l’integrazione per parti possiamo ricondurre questo
integrale a 𝑒 𝑥 sin 𝑥 . Integrando ancora per parti ci si ricondurrà nuovamente ad
𝑒 𝑥 cos 𝑥 . Se però in questi passaggi si riottiene la quantità originale con un segno
∫
cambiato, si potrà risolvere l’equazione ottenuta per trovare il risultato cercato.

Precisamente:
∫ ∫
𝑥 𝑥
𝑒 cos 𝑥 𝑑𝑥 = 𝑒 sin 𝑥 − 𝑒 𝑥 sin 𝑥 𝑑𝑥
∫
𝑥 𝑥 𝑥
= 𝑒 sin 𝑥 − 𝑒 (− cos 𝑥) − 𝑒 (− cos 𝑥) 𝑑𝑥
∫
= 𝑒 𝑥 sin 𝑥 + 𝑒 𝑥 cos 𝑥 − 𝑒 𝑥 cos 𝑥 𝑑𝑥
da cui: ∫
2· 𝑒 𝑥 cos 𝑥 𝑑𝑥 = 𝑒 𝑥 sin 𝑥 + 𝑒 𝑥 cos 𝑥
ovvero
𝑒 𝑥 (sin 𝑥 + cos 𝑥)
∫
𝑒 𝑥 cos 𝑥 𝑑𝑥 = .
2
Teorema 6.37 (ancora primitive di funzioni elementari). Si ha

∫
ln 𝑥 𝑑𝑥 = 𝑥 ln 𝑥 − 𝑥,
∫ √
arctg 𝑥 𝑑𝑥 = 𝑥 arctg 𝑥 − ln 1 + 𝑥 2 ,
∫ √
arcsin 𝑥 𝑑𝑥 = 𝑥 arcsin 𝑥 + 1 − 𝑥 2 ,
∫ √
arccos 𝑥 𝑑𝑥 = 𝑥 arccos 𝑥 − 1 − 𝑥 2 .
Dimostrazione. L’idea, in tutti i casi, è che la derivata della funzione integranda

è molto più semplice della funzione stessa (nei primi due casi è una funzione
razionale negli altri due una funzione irrazionale ma non trascendente). Può
quindi risultare utile applicare l’integrazione per parti nella forma:
∫ ∫ ∫
𝑓 (𝑥) 𝑑𝑥 = 1 · 𝑓 (𝑥) 𝑑𝑥 = 𝑥 𝑓 (𝑥) − 𝑥 𝑓 0(𝑥) 𝑑𝑥.
Nel primo caso si ha:

∫ ∫ ∫
1
ln 𝑥 𝑑𝑥 = 𝑥 ln 𝑥 − 𝑥 𝑑𝑥 = 𝑥 ln 𝑥 − 1 𝑑𝑥 = 𝑥 ln 𝑥 − 𝑥.
𝑥
Nel secondo caso:

𝑥
∫ ∫
arctg 𝑥 𝑑𝑥 = 𝑥 arctg 𝑥 − 𝑑𝑥.
1 + 𝑥2
Operiamo quindi un cambio di variabile 𝑦 = 1 + 𝑥 2 :
𝑥
∫ ∫ ∫
1 1 𝑦=1+𝑥 2 1 1
𝑑𝑥 = 2 𝑥 𝑑𝑥 = 𝑑𝑦
1+𝑥 2 2 1+𝑥 2 2 𝑦
ln 𝑦 1
= ln 1 + 𝑥 2

=
2 2
da cui, in conclusione:
∫
1
arctg 𝑥 𝑑𝑥 = 𝑥 arctg 𝑥 − ln 1 + 𝑥 2 .

2
Nel terzo caso:

𝑥
∫ ∫
1 · arcsin 𝑥 𝑑𝑥 = 𝑥 · arcsin 𝑥 − √ 𝑑𝑥
1 − 𝑥2
e operando la sostituzione 𝑦 = 1 − 𝑥 2 si arriva a

∫ √
arcsin 𝑥 𝑑𝑥 = 𝑥 · arcsin 𝑥 + 1 − 𝑥 2 .
L’ultimo integrale si svolge in maniera analoga.
Osservazione 6.38. Se si applica il metodo di integrazione per parti nella ricerca

1 1 1
della primitiva della funzione 𝑥 ln 𝑥 , integrando il fattore 𝑥 e derivando il fattore ln 𝑥 si
ottiene un fenomeno a prima vista sconcertante:
∫ ∫ 1
1 1 𝑥
𝑑𝑥 = ln 𝑥 · − ln 𝑥 · 𝑑𝑥
𝑥 ln 𝑥 ln 𝑥 − ln 2
𝑥
∫
1
=1+ 𝑑𝑥.
𝑥 ln 𝑥
Si potrebbe infatti pensare di poter semplificare gli integrali ai due lati dell’uguaglianza
per ottenere 0 = 1. Questo non si può fare perché, ricordiamolo, l’integrale indefinito
1
è un insieme di funzioni (le primitive della funzione 𝑥 ln 𝑥 in questo caso) e sappiamo
che sommando una costante ad una primitiva si ottiene un’altra primitiva. Quindi
non ci deve stupire il fatto che sommando 1 all’insieme delle primitive questo rimanga
invariato.
Per la cronaca: l’integrale in questione può essere calcolato per sostituzione, ponendo
𝑦 = ln 𝑥 trovando 𝐹(𝑥) = ln | ln 𝑥| come una delle primitive.
6.5 integrale di una funzione razionale
In questa sezione presenteremo un metodo per calcolare esplicitamente l’inte-

grale di una qualunque funzione razionale.
funzione razionale
Definizione 6.39 (funzione razionale). Una funzione 𝑓 : 𝐴 ⊆ ℝ → ℝ si dice essere
razionale se si può scrivere nella forma
𝑃(𝑥)
𝑓 (𝑥) =
𝑄(𝑥)
con 𝑃 e 𝑄 funzioni polinomiali a coefficienti reali.
Il metodo che andremo a presentare può essere utilizzato “alla cieca” in quanto
una volta trovata la decomposizione non c’è bisogno di sapere come mai il
6.5 integrale di una funzione razionale 261
metodo utilizzato funziona (e perché funziona sempre). La dimostrazione del

perché questo metodo funzioni è un esercizio non banale di algebra lineare a
cui dedicheremo il resto di questo capitolo perché, tutto sommato, pensiamo
che sia sempre utile avere la consapevolezza degli strumenti che si utilizzano.
Prima ancora di enunciare il teorema e di farne la dimostrazione, vogliamo

presentare il metodo tramite un esempio. Probabilmente questo è il modo più
semplice per capire come bisogna operare.
Esempio 6.40. Calcolare
𝑥 10 − 3 𝑥 5 + 1
∫
𝑑𝑥
𝑥 8 − 𝑥 7 + 2𝑥 6 − 2𝑥 5 + 𝑥 4 − 𝑥 3
Svolgimento. Per prima cosa vogliamo ricondurci ad una funzione razionale in

cui il grado del polinomio al numeratore sia inferiore al grado del polinomio al
denominatore. Per fare questo svolgiamo la divisione tra polinomi (teorema 4.8):
:
𝑥 10 − 3 𝑥 5 + 1 𝑥4 + 1
= 𝑥2 + 𝑥 + 8 .
𝑥8 − 𝑥7 + 2𝑥 − 2𝑥 + 𝑥 − 𝑥
6 5 4 3 𝑥 − 𝑥 + 2𝑥 6 − 2𝑥 5 + 𝑥 4 − 𝑥 3
7
L’integrale di 𝑥 2 + 𝑥 è immediato e quindi ci possiamo concentrare sulla funzione

razionale con numeratore 𝑥 4 + 1. Per procedere è ora necessario determinare
tutte le radici, reali e complesse, del polinomio a denominatore in modo da
poterlo fattorizzare come prodotto di fattori lineari e quadratici (teorema 4.21).
Non c’è un metodo generale per trovare le radici di un polinomio. In questo
caso particolare si osserva che il polinomio è divisibile per 𝑥 3 . Poi si osserva
che il polinomio di quinto grado risultante si annulla per 𝑥 = 1 (caso fortunato!)
ed è quindi divisibile per 𝑥 − 1 (teorema 4.10 di Ruffini). Il polinomio di quarto
grado risulta infine un quadrato perfetto e si ottiene quindi la fattorizzazione
cercata:
𝑥 8 − 𝑥 7 + 2 𝑥 6 − 2 𝑥 5 + 𝑥 4 − 𝑥 3 = 𝑥 3 (𝑥 − 1)(𝑥 2 + 1)2 .
Ora il teorema di decomposizione di Hermite (teorema 6.43 che andremo poi a
dimostrare) ci garantisce che ogni funzione razionale della forma
𝑃(𝑥)
𝑥 3 (𝑥 − 1)(𝑥 2 + 1)2
con deg 𝑃 < 8 (il grado del denominatore) può essere scritto nel modo seguente,
con opportune costanti 𝐴, 𝐵, 𝐶, . . . , 𝐻 :
0
𝐴 𝐵 𝐶𝑥 + 𝐷 𝐸𝑥 3 + 𝐹𝑥 2 + 𝐺𝑥 + 𝐻

+ + 2 + . (6.15)
𝑥 𝑥−1 𝑥 +1 𝑥 2 (𝑥 2 + 1)
I primi addendi hanno a denominatore i fattori in cui abbiamo decomposto il

denominatore della funzione originale. A numeratore c’è sempre un polinomio
di grado inferiore al grado del denominatore e quindi c’è una costante sopra i
fattori lineari e una funzione lineare sopra i termini quadratici. Dopodiché si
aggiunge la derivata di una funzione razionale in cui il denominatore ha gli
stessi fattori ma elevati ad una potenza di uno inferiore a quella che c’era nel
polinomio originale. A numeratore, di nuovo, un generico polinomio di grado

inferiore al denominatore. Per trovare i coefficienti 𝐴, 𝐵, 𝐶, . . . , 𝐻 (il numero
dei coefficienti è pari al grado del polinomio a denominatore) è sufficiente
svolgere la derivata in (6.15) mettere a denominatore comune tutti gli addendi
Nello svolgere la derivata della funzione e uguagliare con la funzione razionali originale:
razionale è conveniente considerare la
funzione razionale come il prodotto del 𝐴 𝐵 𝐶𝑥 + 𝐷 3𝐸𝑥 2 + 2𝐹𝑥 + 𝐺
numeratore per i reciproci dei fattori a + + 2 +
denominatore ed utilizzare la formula 𝑥 𝑥−1 𝑥 +1 𝑥 2 (𝑥 2 + 1)
−2 𝑥

per la derivata di un prodotto (invece che −2 1 1
la formula per la derivata del rapporto) + (𝐸𝑥 + 𝐹𝑥 + 𝐺𝑥 + 𝐻) ·
3 2
· + ·
𝑥 3 𝑥 2 + 1 𝑥 2 (1 + 𝑥 2 )2
moltiplicando tutto per 𝑥 3 (𝑥 − 1)(𝑥 2 + 1)2 si ottiene
𝐴𝑥 2 (𝑥 − 1)(𝑥 2 + 1)2 + 𝐵𝑥 3 (𝑥 2 + 1)2

+ (𝐶𝑥 + 𝐷)𝑥 3 (𝑥 − 1)(𝑥 2 + 1) + (3𝐸𝑥 2 + 2𝐹𝑥 + 𝐺)𝑥(𝑥 − 1)(𝑥 2 + 1)
+ (𝐸𝑥 3 + 𝐹𝑥 2 + 𝐺𝑥 + 𝐻)(−2(𝑥 − 1)(𝑥 2 + 1) − 2 𝑥 · 𝑥(𝑥 − 1))
ovvero
(𝐴 + 𝐵 + 𝐶)𝑥 7 + (−𝐴 − 𝐶 + 𝐷 − 𝐸)𝑥 6 + (2𝐴 + 2𝐵 + 𝐶 − 𝐷 + 𝐸 − 2𝐹)𝑥 5

+ (−2𝐴 − 𝐶 + 𝐷 + 𝐸 + 2𝐹 − 3𝐺)𝑥 4 + (𝐴 + 𝐵 − 𝐷 − 𝐸 + 3𝐺 − 4𝐻)𝑥 3
+ (−𝐴 − 𝐺 + 4𝐻)𝑥 2 + (𝐺 − 2𝐻)𝑥 + 2𝐻.
Ora imponiamo che quest’ultimo polinomio sia identicamente uguale al

polinomio originario 𝑥 4 + 1 ottenendo il seguente sistema lineare

 𝐴+𝐵+𝐶=0

 −𝐴−𝐶+𝐷−𝐸=0


2𝐴+2𝐵+𝐶−𝐷+𝐸−2𝐹=0




 −2𝐴−𝐶+𝐷+𝐸+2𝐹−3𝐺=1

 𝐴+𝐵−𝐷−𝐸+3𝐺−4𝐻=0

−𝐴−𝐺+4𝐻=0



 𝐺−2𝐻=0



 2𝐻=1

che risolto ci dà: 𝐴 = 1, 𝐵 = 12 , 𝐶 = − 32 , 𝐷 = 1, 𝐸 = 32 , 𝐹 = 1, 𝐺 = 1, 𝐻 = 12 .

Abbiamo ottenuto, in definitiva:
!0
𝑥4 + 1 1
1
2 1 − 23 𝑥 2𝑥
3 3
+ 𝑥2 + 𝑥 + 1
2
= + + +
𝑥 3 (𝑥 − 1)(𝑥 2 + 1)2 𝑥 𝑥 − 1 𝑥2 + 1 𝑥 2 (𝑥 2 + 1)
e osservando che
1 − 32 𝑥 2𝑥
∫ ∫ ∫
1 3 3
𝑑𝑥 = 𝑑𝑥 − 𝑑𝑥 = arctg 𝑥 − ln(𝑥 2 + 1)
𝑥2 +1 𝑥 +1
2 4 𝑥2+1 4
si ottiene infine
𝑥4 + 1
∫
1 3
𝑑𝑥 = ln |𝑥| + ln |𝑥 − 1 | + arctg 𝑥 − ln(𝑥 2 + 1)
𝑥 3 (𝑥 2
− 1)(𝑥 + 1)2 2 4
𝑥 +𝑥 +𝑥+ 2
3 3 2 1
+ 2
𝑥 2 (𝑥 2 + 1)
Il metodo esposto nell’esempio precedente è un algoritmo valido in generale:
1. si effettua la divisione con resto per ricondursi al caso in cui il numeratore

della funzione razionale ha grado inferiore al denominatore
2. si decompone il denominatore come prodotto di polinomi lineari e
quadratici
3. si utilizza la scomposizione di Hermite (teorema 6.43) per scrivere la
funzione razionale come somma di fratti semplici più la derivata di un’altra
funzione razionale. I coefficienti della scomposizione vanno trovati
risolvendo un sistema lineare.
4. si integrano i fratti semplici.
Per concludere l’algoritmo precedente è necessario saper integrare i fratti

semplici. Se il denominatore è lineare l’integrale è immediato (si ottiene un
logaritmo).
Se il denominatore è invece quadratico l’integrale può essere leggermente più

complicato ed è opportuno sapere come procedere. I termini quadratici saranno
della forma:
𝐴𝑥 + 𝐵
(6.16)
𝑥 2 + 𝛼𝑥 + 𝛽
con 𝛼 2 − 4𝛽 < 0 (in caso contrario il polinomio quadratico a denominatore può
essere scomposto in due fattori lineari, utilizzando la formula risolutiva per
le equazioni di secondo grado (1.19)). L’idea è quella di effettuare un cambio
di variabile lineare in modo da ricondursi ad un denominatore della forma
𝑦 2 + 1. Per fare questo si utilizza il metodo del completamento del quadrato
come abbiamo già fatto in (1.18):
𝛼 2 𝛼2
𝑥 2 + 𝛼𝑥 + 𝛽 = 𝑥 + +𝛽− = ...
2 4
𝛼2
a questo punto si raccoglie 𝛽 − 4 (che per ipotesi è positivo) e lo si porta dentro
il quadrato:
2
 𝛼 ª

𝛼 2 𝑥 +

2 ®
©
··· = 𝛽 − ·  q + 1
 
4

𝛼 2
®
 𝛽− 4
 

« ¬ 
𝑥+ 𝛼2
e dunque tramite la sostituzione 𝑦 = q
2
abbiamo ricondotto la nostra
𝛽− 𝛼4
funzione razionale (6.16) alla forma
𝑎𝑦 + 𝑏 𝑎 2𝑦 1
= +𝑏 2
𝑦 +1
2 2 𝑦 +1
2 𝑦 +1
che può essere integrata immediatamente.
Nel seguito proponiamo gli enunciati e le dimostrazioni che garantiscono

il funzionamento dell’algoritmo per l’integrazione delle funzioni razionali.
Difficilmente queste dimostrazioni possono essere portate a termine senza
utilizzare un minimo di proprietà delle funzioni complesse. In particolare è
necessario sapere che le derivate delle funzioni elementari complesse (somme,
prodotti, rapporti, composizione) si svolgono esattamente con le stesse regole
che si applicano alle funzioni reali (si veda a riguardo il capitolo 5.11).
Lemma 6.41 (indipendenza dei fratti semplici). Siano 𝜆1 , . . . , 𝜆𝑛 ∈ ℂ numeri

complessi distinti e siano 𝑝 1 , . . . , 𝑝 𝑛 ∈ ℕ \ {0}. Sia Ω = ℂ \ {𝜆1 , . . . , 𝜆𝑛 }. Allora le
𝑗
funzioni 𝑢𝜆 : Ω ⊆ ℂ → ℂ
𝑘
𝑗 1
𝑢𝜆 (𝑧) = 𝑘 = 1 , . . . , 𝑛, 𝑗 = 1, . . . , 𝑝 𝑛 (6.17)
𝑘
(𝑧 − 𝜆 𝑘 ) 𝑗
sono elementi linearmente indipendenti dello spazio vettoriale complesso ℂΩ .
Dimostrazione. Procediamo per induzione sul numero di funzioni 𝑁 = 𝑝 1 + · · · +

𝑝 𝑛 . Se 𝑁 = 1 abbiamo una unica funzione che non è identicamente nulla (anzi:
non si annulla mai) e quindi costituisce un insieme linearmente indipendente.
Supponiamo allora di avere un insieme formato da più funzioni nella for-

ma (6.17). Supponiamo allora di avere una combinazione lineare complessa
identicamente nulla:
𝑝𝑘
𝑛 X
X 𝑗
𝛼 𝑘,𝑗 𝑢𝜆 = 0.
𝑘
𝑘=1 𝑗=1
e consideriamo la funzione 𝑓 : Ω → ℂ definita da

𝑝𝑘
𝑛 X 𝑝𝑘
𝑛 X
𝛼 𝑘,𝑗 (𝑧 − 𝜆𝑛 )𝑝 𝑛
𝑓 (𝑧) = (𝑧 − 𝜆𝑛 )𝑝 𝑛
X X
= 𝛼 𝑘,𝑗 . (6.18)
𝑘=1 𝑗=1
(𝑧 − 𝜆 𝑘 )𝑝 𝑘 𝑘=1 𝑗=1
(𝑧 − 𝜆 𝑘 )𝑝 𝑘
Questa funzione è identicamente nulla in Ω in quanto ottenuta moltiplicando

la combinazione lineare identicamente nulla per il fattore (𝑧 − 𝜆𝑛 )𝑝 𝑛 . Ma si
osserva che si ha
lim 𝑓 (𝑧) = 𝛼 𝑛,𝑝 𝑛
𝑧→𝜆𝑛
in quanto se 𝑘 ≠ 𝑛 si ha
(𝑧 − 𝜆𝑛 )𝑝 𝑛
lim =0
𝑧→𝜆𝑛 (𝑧 − 𝜆 𝑘 )𝑝 𝑘
in quanto 𝜆 𝑘 ≠ 𝜆𝑛 e il numeratore tende a zero, se invece 𝑘 = 𝑛 e 𝑗 < 𝑝 𝑛 si ha
comunque
(𝑧 − 𝜆𝑛 )𝑝 𝑛
lim = lim (𝑧 − 𝜆𝑛 )𝑝 𝑛 −𝑗 = 0.
𝑧→𝜆𝑛 (𝑧 − 𝜆 𝑘 ) 𝑗 𝑧→𝜆𝑛
Dunque 𝛼 𝑛,𝑝 𝑛 = 0. Ma allora abbiamo una combinazione lineare nulla di 𝑁 − 1

funzioni e per ipotesi induttiva possiamo quindi concludere che anche tutti gli
altri coefficienti sono nulli.
Teorema 6.42 (scomposizione complessa in fratti semplici). Se 𝜆1 , . . . , 𝜆𝑛 sono

le radici complesse distinte del polinomio 𝑄 a coefficienti complessi, e 𝑝 1 , . . . , 𝑝 𝑛
sono le rispettive molteplicità con 𝑝 1 + · · · + 𝑝 𝑛 = deg 𝑄 e se 𝑃 è un qualunque
polinomio a coefficienti complessi con deg 𝑃 < deg 𝑄 , allora esistono, unici, dei
polinomi 𝑅 1 , . . . , 𝑅 𝑛 a coefficienti complessi con deg 𝑅 𝑘 < 𝑝 𝑘 tali che si abbia
𝑛
𝑃(𝑧) X 𝑅 𝑘 (𝑧)
= ∀𝑧 ∈ ℂ \ {𝜆1 , . . . , 𝜆𝑛 }. (6.19)
𝑄(𝑧) 𝑘=1 (𝑧 − 𝜆 𝑘 )𝑝 𝑘
Dimostrazione. Sia 𝑁 = deg 𝑄 e consideriamo l’insieme dei polinomi a coeffi-

cienti complessi di grado inferiore a 𝑁 :
𝑉𝑁 = {𝑃 ∈ ℂ[𝑧] : deg 𝑃 < 𝑁 }.
Questo è un sottospazio vettoriale di 𝑉 = ℂΩ ed ha dimensione 𝑁 (una base

è data dai monomi 1 , 𝑧, 𝑧 2 , . . . , 𝑧 𝑁−1 ). Di conseguenza è facile verificare che
anche lo spazio vettoriale
𝑃

1
𝑊𝑄 = 𝑉𝑁 · = : deg 𝑃 < 𝑁
𝑄 𝑄
i cui elementi sono le funzioni razionali che stanno al lato sinistro di (6.19),
ha la stessa dimensione dim 𝑊𝑄 = dim 𝑉𝑁 = 𝑁 . D’altra parte il lato destro
𝑗
di (6.19) è una combinazione lineare di funzioni 𝑢𝜆 = 1/(𝑧 − 𝜆 𝑘 ) 𝑗 che sono
𝑘
anch’esse elementi di 𝑊𝑄 in quanto (𝑧 − 𝜆 𝑘 ) 𝑗 divide 𝑄(𝑥) se 𝑗 ≤ 𝑝 𝑘 . Ma per il
𝑗
lemma 6.41 i vettori 𝑢𝜆 sono 𝑁 vettori indipendenti e quindi sono una base
𝑘
di 𝑊 . Significa allora che ogni elemento di 𝑊 può essere scritto in modo
𝑗
unico come combinazione lineare degli 𝑢𝜆 cioè, per ogni polinomio 𝑃 con
𝑘
deg 𝑃 < deg 𝑄 si ha
𝑝𝑛
𝐴 𝑘,𝑗 · (𝑧 − 𝜆 𝑘 )𝑝 𝑛 −𝑗
X
𝑝𝑘
𝑛 X 𝑛 𝑗=1
𝑃(𝑧) X 𝐴 𝑘,𝑗 X
= = (6.20)
𝑄(𝑧) 𝑘=1 𝑗=1 (𝑧 − 𝜆 𝑘 ) 𝑗 𝑘=1
(𝑧 − 𝜆 𝑘 )𝑝 𝑛
e posto
𝑝𝑛
𝐴 𝑘,𝑗 · (𝑧 − 𝜆 𝑘 )𝑝 𝑛 −𝑗
X
𝑅 𝑘 (𝑧) =
𝑗=1
è chiaro che 𝑅 𝑘 è un polinomio di grado inferiore a 𝑝 𝑛 univocamente determinato

dai coefficienti 𝐴 𝑘,𝑗 .
Teorema 6.43 (scomposizione di Hermite). Sia 𝑄(𝑥) un polinomio monico a

coefficienti reali con radici reali 𝜆1 , . . . , 𝜆𝑛 di molteplicità 𝑝 1 , . . . , 𝑝 𝑛 e radici complesse
coniugate non reali 𝜇1 , 𝜇¯ 1 , . . . , 𝜇𝑚 , 𝜇¯ 𝑚 di molteplicità 𝑞 1 , . . . , 𝑞 𝑚 . Posto 𝛼 𝑘 = 2 Re 𝜇 𝑘
e 𝛽 𝑘 = |𝜇 𝑘 | 2 potremo scrivere (grazie al teorema 4.21)
𝑛 𝑚
(𝑥 − 𝜆 𝑘 )𝑝 𝑘 · (𝑥 2 + 𝛼 𝑘 𝑥 + 𝛽 𝑘 )𝑞 𝑘 .
Y Y
𝑄(𝑥) = (6.21)
𝑘=1 𝑘=1
Sia 𝑃(𝑥) un qualunque polinomio a coefficienti reali con deg 𝑃 < deg 𝑄 .
Allora posto
𝑛 𝑚
˜ (𝑥 − 𝜆 𝑘 )𝑝 𝑘 −1 · (𝑥 2 + 𝛼 𝑘 𝑥 + 𝛽 𝑘 )𝑞 𝑘 −1
Y Y
𝑄(𝑥) =
𝑘=1 𝑘=1
esistono (unici) dei coefficienti reali 𝐴1 , . . . , 𝐴𝑛 , 𝐵1 , . . . , 𝐵𝑚 , 𝐶1 , . . . , 𝐶 𝑚 e un

polinomio a coefficienti reali 𝑅(𝑥) con deg 𝑅 < deg 𝑄 ˜ per cui risulta:
𝑛 𝑚 0
𝑃(𝑥) X 𝐴𝑘 𝐵𝑘 𝑥 + 𝐶𝑘 𝑅(𝑥)

X
= + + . (6.22)
𝑄(𝑥) 𝑘=1 𝑥 − 𝜆 𝑘 𝑘=1 𝑥 2 + 𝛼 𝑘 𝑥 + 𝛽 𝑘 ˜
𝑄(𝑥)
Svolgendo la derivata si potrà riscrivere il lato destro con denominatore comune 𝑄(𝑥) e
uguagliando i numeratori di lato destro e lato sinistro si otterrà un sistema lineare in
deg 𝑄 incognite che avrà una unica soluzione.
Dimostrazione. Consideriamo le funzioni
𝑗 1
𝑢𝜆 (𝑧) =
(𝑧 − 𝜆) 𝑗
1
𝑣 𝜇 (𝑧) = ,
𝑧 2 − 2 Re 𝜇 · 𝑧 + |𝜇| 2
𝑧
𝑤 𝜇 (𝑧) = ,
𝑧 2 − 2 Re 𝜇 · 𝑧 + |𝜇| 2
𝑧𝑗
𝑡 𝑗 (𝑧) = .
˜
𝑄(𝑧)
Siano 𝜆1 , . . . , 𝜆 𝑁 tutte le radici complesse del polinomio 𝑄(𝑧) con 𝑝 1 , . . . , 𝑝 𝑁 le

rispettive molteplicità. Grazie al lemma 6.41 possiamo affermare, come abbiamo
fatto nella dimostrazione del teorema 6.42 che lo spazio vettoriale 𝑉𝑄 di tutte le
𝑃(𝑧)
funzioni razionali della forma 𝑄(𝑧) con 𝑄 fissato e deg 𝑃 < deg 𝑄 è generato
dalle combinazioni lineari a coefficienti complessi delle funzioni
𝑗
𝑢𝜆 , 𝑘 = 1, . . . , 𝑁 , 𝑗 = 1, . . . , 𝑝 𝑘 .
𝑘
Analogamente lo spazio vettoriale 𝑉𝑄˜ è generato dalle funzioni
𝑗
𝑢𝜆 , 𝑘 = 1, . . . , 𝑁 , 𝑗 = 1 , . . . , 𝑝 𝑘 − 1.
𝑘
Osserviamo ora che per 𝑗 > 1 si ha
𝑑 𝑗−1 𝑑 1 1− 𝑗 𝑗
𝑢 = = = (1 − 𝑗)𝑢𝜆
𝑑𝑧 𝜆 𝑑𝑧 (𝑧 − 𝜆) 𝑗−1 (𝑧 − 𝜆) 𝑗
𝑑
significa quindi che l’operatore lineare 𝑑𝑧 manda 𝑉𝑄˜ in 𝑉𝑄 , più precisamente
𝑑 𝑗
l’immagine di 𝑑𝑧 𝑉𝑄˜
è il sottospazio di 𝑉𝑄 generato dalle funzioni 𝑢𝜆 con 𝑗 > 1.
𝑘
Tale operatore è inoltre iniettivo in quanto manda vettori della base di 𝑉𝑄˜ in
vettori della base di 𝑉𝑄 che sono certamente indipendenti. Abbiamo quindi
una decomposizione in somma diretta:
𝑑
𝑉𝑄 = 𝑉1 ⊕ 𝑉˜
𝑑𝑧 𝑄
6.6 integrali che si riconducono a funzioni razionali 267
dove 𝑉1 è lo spazio generato dalle funzioni 𝑢𝜆1 , . . . , 𝑢𝜆1 .

1 𝑁
˜ sono una base di 𝑉 ˜ dunque

Ma anche le funzioni 𝑡0 , . . . , 𝑡 𝑀−1 con 𝑀 = deg 𝑄 𝑄
una base di 𝑉𝑄 è data da
𝑢𝜆1 , . . . , 𝑢𝜆𝑁 , 𝑡00 , . . . , 𝑡 0𝑀−1
dove 𝑡 𝑚
0 è la derivata di 𝑡 . Quindi, visto che ogni combinazione lineare di
𝑚
𝑢𝜇 e 𝑢𝜇¯ può essere scritta come combinazione lineare di 𝑣𝜇 e 𝑤 𝜇 si ottiene che
un’altra base di 𝑉𝑄 è
𝑢𝜆1 , . . . , 𝑢𝜆𝑛 , 𝑣𝜇1 , . . . , 𝑣 𝜇𝑚 , 𝑤𝜇1 , . . . , 𝑤 𝜇𝑚 , 𝑡00 , . . . , 𝑡 0𝑀−1 . (6.23)
Per brevità chiamiamo 𝑒1 , . . . , 𝑒 𝑁 la base di 𝑉𝑄 elencata in (6.23). Ognuna di

queste funzioni si scrive come rapporto di polinomi a coefficienti reali il cui
denominatore è un divisore del polinomio 𝑄 che è anch’esso un polinomio
a coefficienti reali. Dunque le funzioni 𝑄 · 𝑒1 , . . . , 𝑄 · 𝑒 𝑁 sono in realtà dei
polinomi a coefficienti reali e devono necessariamente essere una base dello
spazio vettoriale complesso 𝑄 · 𝑉𝑄 che non è altro che l’insieme di tutti i
polinomi a coefficienti complessi di grado inferiore ad 𝑁 . In particolare questi
polinomi sono indipendenti. Ma allora, visti come polinomi a coefficienti reali
sono pure indipendenti e sono quindi una base dello spazio di tutti i polinomi a
coefficienti reali di grado inferiore a 𝑁 . Dunque devono esistere dei coefficienti
reali 𝛼 1 , . . . , 𝛼 𝑁 per cui si ha
𝑁
X
𝑃(𝑥) = 𝛼 𝑘 · 𝑄(𝑥) · 𝑒 𝑘 (𝑥)
𝑘=1
da cui
𝑁
𝑃(𝑥) X
= 𝛼 𝑘 · 𝑒 𝑘 (𝑥).
𝑄(𝑥) 𝑘=1
Ricordando che le funzioni 𝑒 𝑘 non sono altro che le funzioni elencate in (6.23) si
ottiene finalmente la decomposizione cercata.
6.6 integrali che si riconducono a funzioni razionali
E’ importante sapere che di qualunque funzione razionale è possibile scriverne

la primitiva utilizzando i metodi della sezione precedente. Allo stesso modo è
utile sapere che ci sono altre casistiche che si riconducono all’integrazione di
una funzione razionale.
Funzioni razionali in 𝑒 𝑥 . Se la funzione integranda 𝑓 (𝑥) si scrive nella forma
𝑓 (𝑥) = 𝑅(𝑒 𝜆𝑥 )
con 𝑅 funzione razionale e 𝜆 ≠ 0, allora si può risolvere l’integrale tramite la

sostituzione 𝑡 = 𝑒 𝜆𝑥 . Infatti si ha


 𝑒 𝜆𝑥 = 𝑡
ln 𝑡


𝑥= 𝜆

 𝑑𝑥 = 1

 𝜆𝑡
e la funzione integranda diventa una funzione razionale:
𝑅(𝑡)
∫ ∫
𝜆𝑥
𝑅(𝑒 ) 𝑑𝑥 = 𝑑𝑡
𝜆𝑡 𝑡=𝑒 𝜆𝑥
Esempio 6.44. Si voglia risolvere l’integrale

√
2 𝑒 𝑥 + 𝑒 2𝑥
∫
𝑑𝑥.
𝑒𝑥 − 4
𝑥
Soluzione. Scriviamo la funzione integranda in funzione di 𝑒 2 :
√ 𝑥 𝑥
2 𝑒 𝑥 + 𝑒 2𝑥 2𝑒 2 + 𝑒 4 2
= 𝑥 .
𝑒𝑥 − 4 𝑒2 2 − 4
𝑥
Facendo il cambio di variabile 𝑡 = 𝑒 2 , 𝑥 = 2 ln 𝑡 , 𝑑𝑥 = 2𝑡 𝑑𝑡 si ottiene una
funzione razionale in 𝑡 :
∫ √ 𝑥
2 𝑒 + 𝑒 2𝑥 2𝑡 + 𝑡 4 2 2 + 𝑡3
∫ ∫
𝑑𝑥 = · 𝑑𝑡 = 2 𝑑𝑡.
𝑒𝑥 − 4 𝑡2 − 4 𝑡 𝑡2 − 4
Facendo la divisione tra i polinomi e la riduzione ai fratti semplici si ottiene

∫ ∫ ∫
5 3
2𝑡 𝑑𝑡 + 𝑑𝑡 + 𝑑𝑡 = 𝑡 2 + 5 ln |𝑡 − 2 | + 3 ln |𝑡 + 2 |
𝑡−2 𝑡+2
𝑥
e quindi sostituendo 𝑡 = 𝑒 2 si ottiene il risultato
√ √
𝑒 𝑥 + 5 ln 𝑒 𝑥 − 2 + 3 ln 𝑒 𝑥 + 2 .

Funzioni razionali in sin2 𝑥 , cos2 𝑥 , sin 𝑥 · cos 𝑥 . Se la funzione integranda 𝑓 (𝑥) si

scrive nella forma
𝑓 (𝑥) = 𝑅(sin2 𝑥, cos2 𝑥, sin 𝑥 · cos 𝑥)
con 𝑅 funzione razionale (cioè rapporto di polinomi nelle tre variabili indicate)
allora si può risolvere l’integrale tramite la sostituzione 𝑡 = tg 𝑥 . Infatti
osservando che risulta
sin2 𝑥 1
1 + tg2 𝑥 = 1 + =
cos 𝑥
2 cos2 𝑥
6.6 integrali che si riconducono a funzioni razionali 269
da cui
1
cos2 𝑥 =
1 + tg2 𝑥
sin2 𝑥 = tg2 𝑥 · cos2 𝑥
sin 𝑥 · cos 𝑥 = tg 𝑥 · cos2 𝑥
ponendo 𝑡 = tg 𝑥 si ha:


 cos2 𝑥 = 1
1+𝑡 2
 sin2 𝑥 = 𝑡2



1+𝑡 2 (6.24)
𝑡

 sin 𝑥 · cos 𝑥 = 1+𝑡 2

 𝑑𝑥 = 1 𝑑𝑡

 1+𝑡 2
e la funzione integranda diventa una funzione razionale.

∫
1
𝑑𝑥.
cos 𝑥 · (sin 𝑥 + cos 𝑥)
Soluzione. La funzione integranda si può scrivere nella forma
1
.
sin 𝑥 · cos 𝑥 + cos2 𝑥
Effettuando la sostituzione (6.24) si ottiene
∫ ∫
1 1 1
· 𝑑𝑡 = 𝑑𝑡 = ln |𝑡 + 1 | = ln | tg 𝑥 + 1 |.
𝑡
+ 1 1 + 𝑡2 𝑡+1
1+𝑡 2 1+𝑡 2
Più in generale funzioni razionali di sin 𝑥 e cos 𝑥 . Se la funzione integranda 𝑓 (𝑥) si

scrive nella forma
𝑓 (𝑥) = 𝑅(sin 𝑥, cos 𝑥)
con 𝑅 funzione razionale, allora si può risolvere l’integrale tramite la sostituzione
𝑡 = tg 𝑥2 . Infatti con tale sostituzione si ha (usando le formule di bisezione e
riconducendosi al caso precedente)
𝑥 𝑥 1−𝑡 2


 cos 𝑥 = cos2 2 − sin2 2 = 1+𝑡 2
𝑥 𝑥 2𝑡


sin 𝑥 = 2 sin 2 cos 2 = 1+𝑡 2
(6.25)

 𝑑𝑥 =
 2
𝑑𝑡.
 1+𝑡 2
Di nuovo con questa sostituzione la funzione integranda diventa razionale.
Osservazione 6.46. Si osservi che la sostituzione (6.25) potrebbe essere sempre

utilizzata al posto della (6.24) in quanto più generale. Ma, usualmente, se è possibile
usare la sostituzione (6.24) l’integrale risulta poi più semplice da calcolare. Si faccia la
prova con l’integrale dell’esempio 6.45!

∫
1
𝑑𝑥.
sin 𝑥
Soluzione. Utilizzando la sostituzione (6.25) si ottiene

∫ ∫
1 1 2
𝑑𝑥 = 𝑑𝑡
sin 𝑥 2𝑡 1 + 𝑡2
1+𝑡 2
𝑥
∫
1

= 𝑑𝑡 = ln |𝑡| = ln tg .
𝑡 2
Funzioni razionali con radicali. Se la funzione 𝑓 (𝑥) si scrive nella forma:

√
𝑓 (𝑥) = 𝑅( 𝑛 𝑥)
con 𝑅 funzione razionale, allora si può risolvere l’integrale tramite la sostituzione

𝑥 = 𝑡 𝑛 . Infatti con tale sostituzione si ha
(√
𝑛
𝑥=𝑡
(6.26)
𝑑𝑥 = 𝑛𝑡 𝑛−1 𝑑𝑡.

√4
𝑥
∫
√2 √ 𝑑𝑥.
𝑥+ 3𝑥
Soluzione. Si osservi che la funzione integranda può essere scritta come funzione
√
razionale di 𝑡 = 12 𝑥 (abbiamo scelto il minimo comune multiplo tra i radicandi
in gioco: 12 = 𝑚𝑐𝑚(4 , 2 , 3))
√4 √
𝑥
12
𝑥3
√ √3 = √ √ .
𝑥+ 𝑥 12
𝑥6 + 𝑥4
12
Dunque utilizzando la sostituzione (6.26) con 𝑛 = 12 si ha
𝑡3 𝑡 14 𝑡 10
∫ ∫ ∫
· 12𝑡 11 𝑑𝑡 = 12 𝑑𝑡 = 12 𝑑𝑡.
𝑡 + 𝑡4
6 𝑡 + 𝑡4
6 𝑡2 +1
Procedendo con la divisione tra polinomi si ottiene

∫
1
12 𝑡 −𝑡 +𝑡 −𝑡 +1− 2
8 6 4
𝑑𝑡
2
𝑡 +1
𝑡9 𝑡7 𝑡5 𝑡3

= 12 − + − + 𝑡 − arctg 𝑡
9 7 𝑡 3
4 √4 3 12 √
12 12 √
12 √ √ √
= 𝑥 − 𝑥7 + 𝑥 5 − 4 4 𝑥 + 12 12 𝑥 − 12 arctg 12 𝑥.
3 7 5
6.7 funzioni speciali 271
6.7 funzioni speciali
E’ certamente molto utile conoscere i metodi di integrazione per poter scrivere

esplicitamente la primitiva di una generica funzione. Ma è anche molto utile
sapere che esistono alcune funzioni elementari la cui primitiva non è una
2
funzione elementare. Un esempio su tutti è la campana di Gauss 𝑓 (𝑥) = 𝑒 −𝑥 la campana di Gauss
cui funzione integrale ∫ 𝑥
2
𝐹(𝑥) = 𝑒 −𝑡 𝑑𝑡
0
non può essere espressa mediante composizione di funzioni elementari. Questo

fatto non ci deve scoraggiare più di tanto, daremo un nome alla funzione 𝐹
e ne studieremo le proprietà utilizzando la teoria che abbiamo sviluppato.
Ovviamente è probabile che prima di noi qualcun’altro si sia imbattutto in tali
funzioni e gli abbia già dato un nome e ne abbia studiato le proprietà. Queste
funzioni si chiamano usualmente funzioni speciali per distinguerle dalle funzioni
elementari. Nell’esempio specifico è stato definita la funzione di errore funzione di errore
∫ 𝑥
2 2
erf 𝑥 = √ 𝑒 −𝑡 𝑑𝑡.
𝜋 0
Altri esempi di funzioni la cui primitiva non si esprime mediante funzioni

elementari sono i seguenti:
1 𝑒𝑥 sin 𝑥 𝜋𝑥 2
, , , sin
ln 𝑥 𝑥 𝑥 2
per le quali si definiscono le rispettive primitive: logaritmo integrale, integrale
esponenziale, seno integrale, integrale di Fresnel:
li 𝑥, ei 𝑥, Si 𝑥, 𝑆𝑥.
Il teorema tramite il quale si dimostra che queste funzioni non ammettono

una primitiva esprimibile come composizione di funzioni elementari (funzioni
razionali, esponenziali, trigonometriche e loro inverse) si chiama Teorema di Il teorema di Liouville è un teorema di
Liouville. tipo algebrico e quindi va ben lontano
dagli scopi di questo corso. Per chi fosse
interessato a vederne la dimostrazione
una lettura piacevole può essere l’arti-
6.8 integrali impropri colo di Camillo De Lellis: Il teorema di
Liouville ovvero perché “non esiste” la pri-
mitiva di exp(𝑥 2 ).
La definizione di integrale di Riemann è stata data solamente per funzioni
limitate definite su un intervallo limitato. Vogliamo ora estendere la defini-
zione di integrale alle funzioni illimitate e agli intervalli illimitati. Lo faremo
riconducendoci, tramite un limite, al caso già studiato.
Definizione 6.49 (integrabilità locale). Sia 𝑓 : 𝐴 → ℝ una funzione definita su

un insieme 𝐴 ⊆ ℝ. Diremo che 𝑓 è localmente Riemann-integrabile se per ogni
intervallo chiuso e limitato [𝛼, 𝛽] ⊆ 𝐴 risulta che 𝑓 sia limitata e Riemann-integrabile
su [𝛼, 𝛽].
Osservazione 6.50. Se 𝑓 : 𝐴 → ℝ è una funzione continua, allora su ogni intervallo

[𝛼, 𝛽] ⊆ 𝐴 la funzione 𝑓 risulta essere continua e quindi limitata e Riemann-integrabile
per il teorema 6.15. Lo stesso vale per le funzioni monotone: grazie al teorema 6.16
sappiamo che una funzione monotona è limitata e Riemann-integrabile su ogni intervallo
[𝛼, 𝛽] dunque anch’essa è localmente Riemann-integrabile. Sarà molto raro avere a che
fare con funzioni localmente Riemann-integrabili che non si riconducono a questi due
casi.
Definizione 6.51 (integrale improprio). Se 𝑓 è una funzione localmente Riemann-

integrabile sull’intervallo [𝑎, 𝑏) con 𝑎 ∈ ℝ, 𝑏 ∈ (𝑎, +∞] definiamo l’integrale improprio
di 𝑓 su [𝑎, 𝑏) come:
∫ 𝑏 ∫ 𝛽
𝑓 (𝑥) 𝑑𝑥 = lim− 𝑓 (𝑥) 𝑑𝑥
𝑎 𝛽→𝑏 𝑎
se il limite a lato destro esiste (finito o infinito).
Se 𝑓 è una funzione localmente Riemann-integrabile sull’intervallo (𝑎, 𝑏] con 𝑏 ∈ ℝ,

𝑎 ∈ [−∞, 𝑏) definiamo l’integrale improprio di 𝑓 su (𝑎, 𝑏] come:
∫ 𝑏 ∫ 𝑏
𝑓 (𝑥) 𝑑𝑥 = lim+ 𝑓 (𝑥) 𝑑𝑥
𝑎 𝛼→𝑎 𝛼
se il limite esiste (finito o infinito).
Se 𝑓 è una funzione localmente Riemann-integrabile sull’intervallo (𝑎, 𝑏) con 𝑎 ∈

[−∞, +∞), 𝑏 ∈ (𝑎, +∞] preso un qualunque punto 𝑐 ∈ (𝑎, 𝑏) definiamo l’integrale
improprio di 𝑓 su (𝑎, 𝑏) come:
∫ 𝑏 ∫ 𝑐 ∫ 𝑏
𝑓 (𝑥) 𝑑𝑥 = 𝑓 (𝑥) 𝑑𝑥 + 𝑓 (𝑥) 𝑑𝑥
𝑎 𝑎 𝑐
∫ 𝑐 ∫ 𝛽
= lim+ 𝑓 (𝑥) 𝑑𝑥 + lim− 𝑓 (𝑥) 𝑑𝑥
𝛼→𝑎 𝛼 𝛽→𝑏 𝑐
sempre che entrambi i limiti esitano (finiti o infiniti) e non siano infiniti di segno opposto
(cosicché la loro somma è ben definita). In base all’osservazione 6.52 l’integrale non
dipende dal punto 𝑐 scelto.
Se 𝐼 è un intervallo di estremi 𝑎, 𝑏 ∈ [−∞, +∞], 𝑎 < 𝑏 ed esistono un numero finito

di punti 𝑥 0 , . . . , 𝑥 𝑛 ∈ 𝐼 tali che 𝑎 = 𝑥 0 < 𝑥 1 < · · · < 𝑥 𝑛 = 𝑏 e se 𝑓 risulta essere
localmente Riemann-integrabile sull’insieme 𝐴 = 𝐼 \ {𝑥 0 , . . . , 𝑥 𝑛 } allora definiamo
l’integrale improprio di 𝑓 su 𝐴 come:
∫ 𝑏 𝑛 ∫
X 𝑥𝑘
𝑓 (𝑥) 𝑑𝑥 = 𝑓 (𝑥) 𝑑𝑥
𝑎 𝑘=1 𝑥 𝑘−1
∫ 𝑥𝑘
se ogni integrale improprio 𝑥 𝑓 (𝑥) 𝑑𝑥 esiste (finito o infinito) e se la somma è ben
𝑘−1
definita in quanto tutti gli integrali infiniti hanno lo stesso segno.
∫𝑏
Se l’integrale improprio 𝑎 𝑓 (𝑥) 𝑑𝑥 esiste ed è finito (in base ad una delle definizioni
integrabile
precedenti), diremo che la funzione 𝑓 è integrabile in senso improprio (o integrabile
convergente in senso generalizzato) e diremo che l’integrale converge. Se invece l’integrale esiste
ma non è finito, diremo che l’integrale diverge. Negli altri casi diremo che l’integrale è
divergente
6.8 integrali impropri 273
indeterminato. indeterminato
∫𝑏
Determinare il carattere dell’integrale 𝑎
𝑓 (𝑥) 𝑑𝑥 significa dire se tale integrale è carattere
convergente, divergente o indeterminato.
Se gli estremi di integrazione sono scambiati, 𝑎 > 𝑏 , risulta utile utilizzare anche per
gli integrali impropri la convenzione già introdotta per gli integrali di Riemann:
∫ 𝑏 ∫ 𝑎
𝑓 (𝑥) 𝑑𝑥 = − 𝑓 (𝑥) 𝑑𝑥.
𝑎 𝑏
Osservazione 6.52. Nella definizione di integrale improprio sull’intervallo aperto

(𝑎, 𝑏) la scelta del punto 𝑐 ∈ (𝑎, 𝑏) non influenza la definizione. Se infatti scegliamo
due diversi punti 𝑐, 𝑐 0 ∈ (𝑎, 𝑏) per ogni 𝛼, 𝛽 ∈ (𝑎, 𝑏) si ha, grazie alla additività
dell’integrale di Riemann:
∫ 𝑐 ∫ 𝛽 ∫ 𝑐0 ∫ 𝛽
𝑓 (𝑥) 𝑑𝑥 + 𝑓 (𝑥) 𝑑𝑥 = 𝑓 (𝑥) 𝑑𝑥 + 𝑓 (𝑥) 𝑑𝑥.
𝛼 𝑐 𝛼 𝑐0
E quindi i limiti, se esistono, sono uguali.
Esempio 6.53. La funzione 𝑓 (𝑥) = ln 𝑥 può essere integrata in senso improprio

sull’intervallo [1 , +∞) e si ha:
∫ +∞ ∫ 𝛽
𝛽
𝑓 (𝑥) 𝑑𝑥 = lim ln(𝑥) 𝑑𝑥 = lim [𝑥 ln 𝑥 − 𝑥]1
1 𝛽→+∞ 1 𝛽→+∞
= lim (𝛽 ln 𝛽 − 𝛽 + 1) = +∞.
𝛽→+∞
Anche sull’intervallo (0 , 1] la funzione ln 𝑥 ha integrale improprio

∫ 1
ln 𝑥 𝑑𝑥 = lim+ [𝑥 ln 𝑥 − 𝑥]1𝛼 = lim+ (−1 − 𝛼 ln 𝛼 + 𝛼) = −1.
0 𝛼→0 𝛼→0
Dunque sull’intervallo (0 , +∞) la funzione ln 𝑥 ha integrale improprio

∫ +∞ ∫ 1 ∫ +∞
ln 𝑥 𝑑𝑥 = ln 𝑥 𝑑𝑥 + ln 𝑥 𝑑𝑥 = −1 + (+∞) = +∞.
0 0 1
Diremo quindi che la funzione 𝑓 (𝑥) = ln 𝑥 non è integrabile in senso improprio

sull’intervallo (0 , +∞) ma l’integrale esiste ed è divergente.
Per abbreviare le notazioni intenderemo:
[𝐹(𝑥)]𝑏𝑎 = lim− 𝐹(𝑥) − lim+ 𝐹(𝑥)

𝑥→𝑏 𝑥→𝑎
osservando che se 𝐹 è definita e continua agli estremi 𝑎 e 𝑏 questa notazione

coincide con l’usuale
[𝐹(𝑥)]𝑏𝑎 = 𝐹(𝑏) − 𝐹(𝑎).
Potremo quindi scrivere:

∫ 1
ln 𝑥 𝑑𝑥 = [𝑥 ln 𝑥 − 𝑥]10 = 1 · ln 1 − 1 − lim+ (𝑥 ln 𝑥 − 𝑥)
0 𝑥→0
= −1 − 0 = −1 .
Osserviamo che se 𝑓 : (𝑎, 𝑏) → ℝ è continua e 𝐹 : (𝑎, 𝑏) → ℝ è una sua primitiva

allora si avrà
∫ 𝑏 ∫ 𝑐 ∫ 𝛽
𝑓 (𝑥) 𝑑𝑥 = lim+ 𝑓 (𝑥) 𝑑𝑥 + lim− 𝑑𝑥
𝑎 𝛼→𝑎 𝛼 𝛽→𝑏 𝑐
= lim (𝐹(𝑐) − 𝐹(𝑥)) + lim (𝐹(𝑥) − 𝐹(𝑐))
𝑥→𝑎 𝑥→𝑏
= lim 𝐹(𝑥) − lim 𝐹(𝑥) = [𝐹(𝑥)]𝑏𝑎 .

𝑥→𝑏 𝑥→𝑎
Dunque la formula fondamentale del calcolo integrale rimane formalmente

identica per gli integrali impropri.
Esempio 6.54. Per calcolare l’integrale

∫ +∞
1
𝑑𝑥
−∞ 1 + 𝑥2
possiamo scegliere un qualunque punto 𝑐 ∈ ℝ e calcolare

∫ +∞ ∫ 𝑐 ∫ 𝛽
1 1 1
𝑑𝑥 = lim 𝑑𝑥 + lim 𝑑𝑥
−∞ 1 + 𝑥2 𝛼→−∞ 𝛼 1 + 𝑥2 𝛽→+∞ 𝑐 1 + 𝑥2
𝑐
= [arctg 𝑥]−∞ + [arctg 𝑥]+∞
𝑐
𝜋 𝜋
= arctg 𝑐 − (− ) + − arctg 𝑐 = 𝜋.
2 2
Ma più semplicemente possiamo scrivere:

+∞
𝜋 𝜋
∫
1 +∞
𝑑𝑥 = [ arctg 𝑥] −∞ = − − = 𝜋.
−∞ 1 + 𝑥2 2 2
Osservazione 6.55. Se 𝑓 : [𝑎, 𝑏] → ℝ è limitata e Riemann-integrabile su [𝑎, 𝑏]

allora, in base al teorema 6.18 si ha:
∫ 𝑏 ∫ 𝑏 ∫ 𝛽
𝑓 (𝑥) 𝑑𝑥 = lim+ 𝑓 (𝑥) 𝑑𝑥 = lim− 𝑓 (𝑥) 𝑑𝑥.
𝑎 𝛼→𝑎 𝛼 𝛽→𝑏 𝑎
Dunque in questo caso gli integrali impropri su [𝑎, 𝑏) e su (𝑎, 𝑏] coincidono con
l’usuale integrale di Riemann (e sono quindi convergenti). Allo stesso modo se 𝑓 è
localmente integrabile su [𝑎, 𝑏) l’integrale improprio su [𝑎, 𝑏) e l’integrale improprio
su (𝑎, 𝑏) coincidono. Lo stesso succede se la funzione è localmente integrabile su (𝑎, 𝑏)
e consideriamo l’insieme 𝐴 = (𝑎, 𝑏) \ {𝑥 0 , . . . , 𝑥 𝑛 }. L’integrale su (𝑎, 𝑏) coincide con
l’integrale su 𝐴 grazie all’additività dell’integrale rispetto al dominio.
∫𝑏
Questo giustifica l’aver utilizzato la stessa notazione 𝑎 sia per l’integrale di Riemann su
[𝑎, 𝑏] sia per i diversi integrali impropri su [𝑎, 𝑏), (𝑎, 𝑏], (𝑎, 𝑏) o (𝑎, 𝑏) \ {𝑥0 , . . . , 𝑥 𝑛 }.
Esempio 6.56. La funzione sin 𝑥 pur essendo integrabile su ogni intervallo chiuso e
limitato (in quanto funzione continua) non ammette integrale improprio sull’intervallo
[0 , +∞) in quanto l’integrale:
∫ 𝛽
𝛽
sin(𝑥) 𝑑𝑥 = [− cos(𝑥)]0 = − cos(𝛽) + cos(0) = 1 − cos(𝛽)
0
non ammette limite per 𝛽 → +∞.
Esempio 6.57. La funzione ln 𝑥 ammette integrale improprio sull’intervallo (0 , +∞)

in quanto si ha:
∫ +∞
ln 𝑥 𝑑𝑥 = [𝑥 ln 𝑥 − 𝑥]+∞
0 = +∞.
0
Ma visto che l’integrale diverge diremo che la funzione non è integrabile su tale intervallo.
Esempio 6.58. La funzione 2 𝑥/(𝑥 2 + 1) non è integrabile in senso improprio su ℝ in

quanto si ha
+∞
2𝑥
∫
+∞
𝑑𝑥 = ln(1 + 𝑥 2 ) 0 = +∞

0 1+𝑥 2
0
2𝑥
∫
0
𝑑𝑥 = ln(1 + 𝑥 2 ) −∞ = −∞

−∞ 1+𝑥 2
e (+∞) + (−∞) è indefinito.
Esempio 6.59. Si ha
∫ 2 ∫ 0 ∫2
1 1 1
√3 𝑑𝑥 = √3 𝑑𝑥 + √3 𝑑𝑥
−1 𝑥 −1 𝑥 0 𝑥
√ 0 √ 2
3 3 2 3 3 2 3 3 √3
= 𝑥 + 𝑥 =0− + 4−0
2 −1
2 0
2 2
3 √3
= (1 + 4).
2
Esempio 6.60. Si ha
∫ +∞
1
𝑑𝑥 = [ln 𝑥]+∞ = +∞ − (−∞) = +∞
0 𝑥 0
e ∫ 0
1
𝑑𝑥 = [ln(−𝑥)]0−∞ = −∞ − (+∞) = −∞.
−∞ 𝑥
Allora l’integrale ∫ +∞
1
𝑑𝑥
−∞ 𝑥
non è definito in quanto somma di infiniti di segno opposto.
Osservazione 6.61. Attenzione a non dimenticare i punti “cattivi” all’interno

dell’intervallo di integrazione. Se vogliamo valutare:
∫ 1
1
𝑑𝑥
−1 𝑥
Potremmo essere portati a pensare che questo integrale sia uguale a:
[ln |𝑥|]1−1 = ln | 1 | − ln |−1 | = 0.
Invece questo integrale non è definito in quanto bisogna considerare che la funzione
integranda non è definita e comunque non è limita in un intorno di 𝑥 = 0 e quindi
l’intervallo [−1 , 1] va spezzato nell’unione dei due intervalli [−1 , 0) e (0 , 1] da cui:
∫ 1
1
𝑑𝑥 = [ln |𝑥|]0−1 + [ln |𝑥|]10 = −∞ + (+∞)
−1 𝑥
ed essendoci una somma di infiniti con segno opposto la somma non ha senso e l’integrale
improprio non è definito.
monotonia Teorema 6.62 (proprietà dell’integrale improprio). Se 𝑓 ≤ 𝑔 e se entrambi gli

integrali sono definiti, risulta:
∫ 𝑏 ∫ 𝑏
𝑓 (𝑥) 𝑑𝑥 ≤ 𝑔(𝑥) 𝑑𝑥.
𝑎 𝑎
additività
Siano 𝑎, 𝑏, 𝑐 ∈ ℝ̄ con 𝑎 ≤ 𝑐 ≤ 𝑏 . Allora nella seguente uguaglianza

∫ 𝑏 ∫ 𝑐 ∫ 𝑏
𝑓 (𝑥) 𝑑𝑥 = 𝑓 (𝑥) 𝑑𝑥 + 𝑓 (𝑥) 𝑑𝑥
𝑎 𝑎 𝑐
linearità se almeno uno dei due lati è definito allora anche l’altro lato lo è e l’uguaglianza è valida.
Siano 𝜆, 𝜇 ∈ ℝ.
∫ 𝑏 ∫ 𝑏 ∫ 𝑏
(𝜆 𝑓 (𝑥) + 𝜇𝑔(𝑥)) 𝑑𝑥 = 𝜆 𝑓 (𝑥) + 𝜇 𝑔(𝑥)
𝑎 𝑎 𝑎
se il lato destro è ben definito (esistono gli integrali impropi di 𝑓 e 𝑔 e le operazioni

hanno senso).
Sia 𝑔 : (𝑎, 𝑏) → (𝑐, 𝑑) una funzione 𝐶 1 e 𝑓 : (𝑐, 𝑑) → ℝ una funzione continua e

integrabile in senso improprio su (𝑐, 𝑑). Siano −∞ ≤ 𝑎 < 𝑏 ≤ +∞ e −∞ ≤ 𝑐 < 𝑑 ≤
cambio di variabile +∞ tali che
𝑐 = lim+ 𝑔(𝑥), 𝑑 = lim 𝑔(𝑥).
𝑥→𝑎 𝑥→𝑏 −
Se 𝑓 è integrabile in senso improprio su (𝑐, 𝑑) allora 𝑓 ◦ 𝑔 è integrabile su (𝑎, 𝑏) e si ha

∫ 𝑏 ∫ 𝑑
𝑓 (𝑔(𝑥))𝑔 0(𝑥) 𝑑𝑥 = 𝑓 (𝑦) 𝑑𝑦.
𝑎 𝑐
Se invece gli estremi sono scambiati:
𝑑 = lim+ 𝑔(𝑥), 𝑐 = lim− 𝑔(𝑥)

𝑥→𝑎 𝑥→𝑏
si avrà, nelle stesse ipotesi:

∫ 𝑏 ∫ 𝑐
𝑓 (𝑔(𝑥)) 𝑑𝑥 = 𝑓 (𝑦) 𝑑𝑦.
𝑎 𝑑
Se 𝐹 è derivabile su (𝑎, 𝑏), 𝑔 è continua e 𝐺 è una primitiva di 𝑔 allora vale la formula: integrazione per parti
∫ 𝑏 ∫ 𝑏
𝐹(𝑥)𝑔(𝑥) 𝑑𝑥 = [𝐹(𝑥)𝐺(𝑥)]𝑏𝑎 − 𝐹0(𝑥)𝐺(𝑥) 𝑑𝑥
𝑎 𝑎
se le quantità sul lato destro esistono (finite o infinite) e la loro differenza non è una
forma indeterminata.
Dimostrazione. Tutte queste proprietà sono già state dimostrate per l’integrale
delle funzioni limitate su intervalli limitati. Si possono facilmente estendere
all’integrale improprio laterale osservando che il limite mantiene le proprietà
richieste. Di conseguenza le proprietà valgono per additività anche per l’inte-
grale improprio bilaterale, facendo attenzione che non si produca una somma
indeterminata +∞ + (−∞). Infine, sempre per additività, le formule sono valide
per gli integrali impropri multilaterali.
Esercizio 6.63. Si calcoli il seguente integrale doppio:

∫ +∞ ∫ +∞
−𝑡𝑥
sin 𝑡 · 𝑒 𝑑𝑡 𝑑𝑥.
0 0
Dimostrazione. L’integrale più interno può essere calcolato per parti:

∫ +∞
𝐼(𝑥) = sin 𝑡 · 𝑒 −𝑡𝑥 𝑑𝑡
0
+∞
∫ +∞
= − cos 𝑡 · 𝑒 −𝑡𝑥 −𝑥 cos 𝑡 · 𝑒 −𝑡𝑥 𝑑𝑡

0
0
∫ +∞
−𝑡𝑥 +∞ −𝑡𝑥
=0+1−𝑥 sin 𝑡 · 𝑒 +𝑥 sin 𝑡 · 𝑒 𝑑𝑡

0
0
da cui
1
𝐼(𝑥) = 1 − 𝑥 2 𝐼(𝑥), 𝐼(𝑥) =
1 + 𝑥2
e
+∞
𝜋
∫
1
𝑑𝑥 = [arctg 𝑥]+∞ = .
0 1 + 𝑥2 0
2
Teorema 6.64 (integrabilità delle funzioni positive). Sia 𝑓 : (𝑎, 𝑏) → ℝ una

funzione localmente Riemann-integrabile non negativa: 𝑓 ≥ 0. Allora l’integrale di 𝑓
esiste (finito o infinito) ed è non negativo:

∫ 𝑏
𝑓 (𝑥) 𝑑𝑥 ≥ 0.
𝑎
Dimostrazione. Sia 𝑐 ∈ (𝑎, 𝑏) un punto fissato e sia

∫ 𝑥
𝐹(𝑥) = 𝑓 (𝑡) 𝑑𝑡.
𝑐
Essendo 𝑓 localmente Riemann-integrabile la funzione 𝐹 è ben definita ed

essendo 𝑓 ≥ 0 risulta che 𝐹 è crescente in quanto se 𝑥 2 > 𝑥 1 essendo 𝑓 ≥ 0 si ha
∫ 𝑥2 ∫ 𝑥2
𝐹(𝑥2 ) − 𝐹(𝑥 1 ) = 𝑓 (𝑡) 𝑑𝑡 ≥ 0 𝑑𝑡 = 0.
𝑥1 𝑥1
Dunque esistono i limiti:

∫ 𝑏
𝑓 (𝑥) 𝑑𝑥 = lim− 𝐹(𝛽)
𝑐 𝛽→𝑏
∫ 𝑐
𝑓 (𝑥) 𝑑𝑥 = lim+ −𝐹(𝛼)
𝑎 𝛼→𝑎
ed essendo 𝐹 crescente entrambi i limiti sono non negativi e quindi la somma

dei due limiti è ben definita.
Anche se non sappiamo calcolare esplicitamente un integrale, è spesso possibile

determinarne la convergenza confrontandolo, tramite il teorema seguente, con
un integrale noto.
Teorema 6.65 (criterio di confronto e confronto asintotico). Siano 𝑓 , 𝑔 : [𝑎, 𝑏) →

ℝ (con 𝑎 ≤ 𝑏 ≤ +∞) funzioni localmente Riemann-integrabili. Supponiamo inoltre
che per ogni 𝑥 ∈ [𝑎, 𝑏) si abbia 𝑓 (𝑥) ≥ 0 e 𝑔(𝑥) ≥ 0. In queste ipotesi sappiamo che i
due integrali:
∫ 𝑏 ∫ 𝑏
𝑓 (𝑥) 𝑑𝑥, 𝑔(𝑥) 𝑑𝑥 (6.27)
𝑎 𝑎
esistono entrambi (finiti o infiniti) e sono non negativi. Inoltre abbiamo i seguenti
criteri di confronto.
1. Confronto puntuale “ ≤ ”. Supponiamo che per ogni 𝑥 ∈ [𝑎, 𝑏) si abbia

𝑓 (𝑥) ≤ 𝑔(𝑥). Allora si ha:
∫ 𝑏 ∫ 𝑏
𝑓 (𝑥) 𝑑𝑥 ≤ 𝑔(𝑥) 𝑑𝑥. (6.28)
𝑎 𝑎
In particolare se l’integrale di 𝑔 è convergente anche l’integrale di 𝑓 è convergente

mentre se l’integrale di 𝑓 è divergente anche l’integrale di 𝑔 è divergente.
2. Confronto asintotico “”. Supponiamo che per 𝑥 → 𝑏 − si abbia 𝑓 𝑔
(cioè 𝑓 /𝑔 → 0). Allora risulta che se l’integrale di 𝑔 è convergente allora
anche l’integrale di 𝑓 è convergente mentre se l’integrale di 𝑓 è divergente anche
l’integrale di 𝑔 è divergente.
3. Confronto asintotico “∼”. Suponiamo che per 𝑥 → 𝑏 − si abbia 𝑓 ∼ 𝑔 (cioè

𝑓 /𝑔 → 1). Allora i due integrali (6.27) hanno lo stesso carattere (entrambi
convergenti oppure entrambi divergenti).
Risultati analoghi valgono per funzioni definite su un intervallo aperto a sinistra: (𝑎, 𝑏]
con −∞ ≤ 𝑎 ≤ 𝑏 , in tal caso nei criteri asontotici si faranno i limiti per 𝑥 → 𝑎 + .
Dimostrazione. Gli integrali di 𝑓 e 𝑔 esistono grazie al teorema 6.64.
Se 𝑓 ≤ 𝑔 la disuguaglianza (6.28) è garantità dalla proprietà di monotonia

(teorema 6.62).
Se 𝑓 (𝑥)/𝑔(𝑥) → 0 per 𝑥 → 𝑏 − significa che esiste un punto 𝑐 ∈ [𝑎, 𝑏) tale

che per ogni 𝑥 ∈ [𝑐, 𝑏) si ha 𝑓 (𝑥)/𝑔(𝑥) ≤ 1 cioè 𝑓 (𝑥) ≤ 𝑔(𝑥). Dunque, per
l’additività e la monotonia dell’integrale, possiamo affermare che
∫ 𝑏 ∫ 𝑐 ∫ 𝑏 ∫ 𝑐 ∫ 𝑏 ∫ 𝑐 ∫ 𝑏 ∫ 𝑐
𝑓 = 𝑓 + 𝑓 ≤ 𝑓 + 𝑔= 𝑓 + 𝑔− 𝑔.
𝑎 𝑎 𝑐 𝑎 𝑐 𝑎 𝑎 𝑎
Sappiamo che gli integrali di 𝑓 e 𝑔 sull’intervallo [𝑎, 𝑐] sono convergenti in

quanto 𝑓 e 𝑔 sono limitate e Riemann-integrabili su [𝑎, 𝑐]. Dunque se l’integrale
∫𝑏 ∫𝑏 ∫𝑏
𝑎
𝑔 è convergente anche l’integrale 𝑎
𝑓 è convergente. Viceversa se 𝑎
𝑓 è
∫𝑏
divergente allora anche 𝑎
𝑔 è divergente.
Nel caso in cui 𝑓 (𝑥)/𝑔(𝑥) → 1 per 𝑥 → 𝑏 − possiamo trovare un punto 𝑐 ∈ [𝑎, 𝑏)

tale per cui 12 ≤ 𝑓 (𝑥)/𝑔(𝑥) ≤ 2 per ogni 𝑥 ∈ [𝑐, 𝑏). Si avrà allora per ogni
𝑥 ∈ [𝑐, 𝑏)
𝑓 (𝑥) ≤ 2 𝑔(𝑥), 𝑔(𝑥) ≤ 2 𝑓 (𝑥)
e si potrà quindi procedere come nel caso precedente.
Nei casi più frequenti il teorema precedente si applica confrontando la funzione

con una potenza:
(𝑥 − 𝑥0 )𝛼 , 𝛼 ∈ ℝ.
Sarà quindi utile sapere, come termine di paragone, per quali 𝛼 queste funzioni
hanno integrale convergente come nel seguente esempio.
Esempio 6.66. Sia 𝑎 > 0 e 𝑝 ∈ ℝ. Gli integrali

∫ +∞ ∫ −𝑎
1 1
𝑑𝑥, 𝑑𝑥
𝑎 𝑥𝑝 −∞ (−𝑥)𝑝
sono convergenti se e solo se 𝑝 > 1.
Sia 𝑥 0 ∈ [𝑎, 𝑏] e 𝑝 ∈ ℝ. Gli integrali

∫ 𝑥0 ∫ 𝑏
1 1
𝑑𝑥, 𝑑𝑥
𝑎 (𝑥 − 𝑥 0 )𝑝 𝑥0 (𝑥 − 𝑥0 )𝑝
sono convergenti se e solo se 𝑝 < 1.

La verifica si fa facilmente valutando il limite della primitiva 𝐹(𝑥) = 𝑥 1−𝑝 /(1 − 𝑝) negli
estremi dell’intervallo.
Esempio 6.67. L’integrale ∫ +∞

2
𝑒 −𝑥 𝑑𝑥
−∞
2
è convergente in quanto per 𝑥 → +∞ risulta 𝑒 −𝑥 1/𝑥 2 e l’integrale di 1/𝑥 2 è
convergente (esempio 6.66) in un intorno di +∞ e di −∞. Nell’esercizio ?? dimostreremo
√
che questo integrale è pari a 𝜋.
Esempio 6.68 (la funzione Γ Eulero). Si definisce Γ : (0 , +∞) → ℝ come

∫ +∞
Γ(𝑥) = 𝑒 −𝑡 𝑡 𝑥−1 𝑑𝑡.
0
L’integrale converge per ogni 𝑥 > 0 in quanto posto 𝑓 (𝑡) = 𝑒 −𝑡 𝑡 𝑥−1 per 𝑡 → 0+ si ha
𝑓 (𝑡) ∼ 𝑡 𝑥−1 che ha integrale convergente in un intorno di 0 mentre per 𝑡 → +∞ si ha
𝑓 (𝑡) 𝑒 −𝑡/2 che ha integrale convergente in un intorno di +∞.
Integrando per parti si ottiene una interessante proprietà della funzione Γ:

∫ +∞ +∞
∫ +∞
𝑒 −𝑡 𝑡 𝑥 𝑑𝑡 = −𝑒 −𝑡 𝑡 𝑥 𝑒 −𝑡 𝑥𝑡 𝑥−1 𝑑𝑡

0
+
0 0
∫ +∞
=𝑥 𝑒 −𝑡 𝑡 𝑥−1 𝑑𝑡
0
cioè Γ(𝑥 + 1) = 𝑥Γ(𝑥). Osservando che Γ(1) = 1 = 0! si può quindi dimostrare, per
induzione, che Γ(𝑛 + 1) = 𝑛 ! per ogni 𝑛 ∈ ℕ . Abbiamo quindi trovato una funzione
che estende il fattoriale da ℕ a tutto l’intervallo di numeri reali (−1 , +∞).
Nell’esercizio ?? dimostreremo che la funzione Γ è derivabile.
Non siamo ora in grado di calcolare il valore di Γ(𝑥) se 𝑥 non è intero, ma possiamo
ricondurre il valore di Γ(1/2) all’integrale della gaussiana, facendo il cambio di variabile
𝑡 = 𝑠 2 , 𝑑𝑡 = 2 𝑠𝑑𝑠 :
+∞ +∞ 2 +∞
𝑒 −𝑡 𝑒 −𝑠
∫ ∫ ∫
2
Γ(1/2) = √ 𝑑𝑡 = · 2𝑠 𝑑𝑠 = 𝑒 −𝑠 𝑑𝑠.
0 𝑡 0 𝑠 −∞
Nell’esercizio ?? troveremo il valore dell’integrale della gaussiana e potremo quindi

√
concludere che Γ(1/2) = 𝜋. Questo ci permette di calcolare il valore di Γ su tutti i
semi-interi:
√ √
1 𝜋 3 3 𝜋
Γ(3/2) = Γ(1/2) = , Γ(5/2) = Γ(3/2) = ,...
2 2 2 4
Esempio 6.69. L’integrale ∫ +∞

1
𝑑𝑥
−∞ 1 + 𝑥2
è convergente in quanto per 𝑥 → +∞ risulta 1/(1 + 𝑥 2 ) ∼ 1/𝑥 2 .
L’integrale ∫ +∞
1
𝑑𝑥
1 ln 𝑥
è divergente perché per 𝑥 → +∞ si ha 1/ln 𝑥 1/𝑥 e per 𝑥 → 1+ si ha 1/ln 𝑥 ∼
1/(𝑥 − 1). Per 𝑝 = 1 gli integrali di 1/𝑥 a +∞ e di 1/(𝑥 − 1) in 1 sono entrambi
divergenti.
Se 𝑓 : [𝑎, +∞) è una funzione localmente Riemann-integrabile e se 𝑓 (𝑥) → ℓ ≠ 0 per

𝑥 → +∞ allora l’integrale di 𝑓 è divergente. Se ℓ > 0 esisterà 𝑐 > 𝑎 tale che per 𝑥 > 𝑐
si abbia 𝑓 (𝑥) ≥ 0 (permanenza
∫ +∞ del segno). Visto che 𝑓 (𝑥) ∼ ℓ per 𝑥 → +∞ possiamo
∫ +∞
quindi concludere che 𝑐 𝑓 (𝑥) = +∞ e quindi anche 𝑎 𝑓 (𝑥) = +∞. Se ℓ < 0 si
può cambiare segno ad 𝑓 e ripetere l’argomento precedente si scopre quindi che in questo
caso l’integrale di 𝑓 è −∞.
Esercizio 6.70. Si mostri con un esempio che se una funzione 𝑓 ha integrale convergente
sull’intervallo [0 , +∞) non è detto che 𝑓 (𝑥) → 0 per 𝑥 → +∞.
Teorema 6.71 (criterio di convergenza assoluta). Sia 𝑓 : (𝑎, 𝑏) → ℝ una funzione

localmente Riemann-integrabile. Allora anche | 𝑓 | è localmente Riemann-integrabile e
se ∫ 𝑏
| 𝑓 (𝑥)| 𝑑𝑥 < +∞
𝑎
(cioè | 𝑓 | è integrabile in senso improprio) allora anche 𝑓 è integrabile in senso improprio

e
∫ 𝑏 ∫ 𝑏
𝑓 (𝑥) 𝑑𝑥 ≤ | 𝑓 (𝑥)| 𝑑𝑥 < +∞.

𝑎 𝑎
Dimostrazione. Poniamo 𝑓 = 𝑓 + − 𝑓 − con 𝑓 + ≥ 0 e 𝑓 − ≥ 0. Se 𝑓 è localmente

Riemann-integrabile 𝑓 + e 𝑓 − sono localmente Riemann-integrabili (grazie al
teorema 6.12). Osserviamo che si ha 𝑓 = 𝑓 + − 𝑓 − e | 𝑓 | = 𝑓 + + 𝑓 − . Visto che
0 ≤ 𝑓 + ≤ | 𝑓 | possiamo applicare i criteri di confronto e affermare che 𝑓 + ha
integrale convergente. Lo stesso vale per 𝑓 − e dunque per 𝑓 = 𝑓 + − 𝑓 − . Inoltre
∫ ∫ ∫ 𝑏 ∫ 𝑏
𝑏 𝑏 ∫ 𝑏 ∫ 𝑏
+
𝑓 = 𝑓 − 𝑓 − ≤ 𝑓+ + 𝑓− = | 𝑓 |.

𝑎 𝑎 𝑎 𝑎 𝑎 𝑎
Definizione 6.72 (convergenza assoluta). Quando

∫ 𝑏
| 𝑓 (𝑥)| 𝑑𝑥 < +∞
𝑎
diremo che l’integrale di 𝑓 è assolutamente convergente o che 𝑓 è assolutamente

integrabile (in senso improprio). Il teorema precedente ci garantisce che una funzione
assolutamente integrabile è integrabile.
Esempio 6.73. L’integrale

∫ +∞
sin(𝑥 2 ) · 𝑒 −𝑥 𝑑𝑥
0
è assolutamente convergente (e quindi convergente) in quanto la funzione integranda è

continua, e si ha
sin(𝑥 2 ) · 𝑒 −𝑥 ≤ 𝑒 −𝑥

da cui, per confronto,

∫ ∫ +∞
sin(𝑥 2 ) · 𝑒 −𝑥 𝑑𝑥 ≤ 𝑒 −𝑥 𝑑𝑥 < +∞.

0
Esempio 6.74 (funzione integrabile ma non assolutamente). Si consideri la

funzione 𝑓 : (0 , +∞) → ℝ definita da
sin 𝑥
𝑓 (𝑥) = .
𝑥
Visto che 𝑓 (𝑥) → 1 per 𝑥 → 0+ la funzione 𝑓 può essere estesa per continuità ad
una funzione continua sull’intervallo [0 , +∞) ponendo 𝑓 (0) = 1. Dunque l’integrale
converge sull’intervallo (0 , 1] e ci si riduce a considerare l’intervallo [1 , +∞).
Integrando per parti,

+∞ h − cos 𝑥 i +∞ ∫ +∞ cos 𝑥
sin 𝑥
∫
𝑑𝑥 = − 𝑑𝑥
1 𝑥 𝑥 1 1 𝑥2
+∞
cos 𝑥
∫
= cos 1 − 𝑑𝑥.
1 𝑥2
cos 𝑥
Osserviamo ora che la funzione 𝑥2
è integrabile per il criterio della convergenza
assoluta, in quanto:
cos 𝑥 1

2 ≤ 2
𝑥 𝑥
che è integrabile su [1 , +∞). Dunque la nostra funzione ha integrale convergente anche
in [1 , +∞) e∫dunque ha integrale convergente su tutto (0 , +∞). Nell’esercizio 7.56
+∞ sin 𝑥 𝜋
vedremo che 0 𝑥 = 2.
Tale funzione non è però integrabile assolutamente. Infatti si ha, per ogni 𝑘 ∈ ℕ
(𝑘+1)𝜋 ∫ (𝑘+1)𝜋
sin 𝑥 | sin 𝑥|
∫
𝑑𝑥 ≥ 𝑑𝑥
𝑥 (𝑘 + 1)𝜋
𝑘𝜋 𝑘𝜋
∫𝜋
0
sin 𝑥 𝑑𝑥 2
= =
(𝑘 + 1)𝜋 (𝑘 + 1)𝜋
da cui
+∞ 𝑏 b 𝜋𝑏 c−1 ∫ (𝑘+1)𝜋
sin 𝑥 𝑑𝑥 = lim
sin 𝑥 sin 𝑥
∫ ∫
X
𝑑𝑥 ≥ lim
𝑥 𝑑𝑥

𝑥 𝑏→+∞ 𝑥 𝑏→+∞
0 0 𝑘=0 𝑘𝜋
+∞
X 2
= = +∞.
𝑘=0
(𝑘 + 1)𝜋
Esercizio 6.75. Si provi ad applicare

∫ +∞ il metodo utilizzato nell’esempio 6.74 ad un
generico integrale della forma 1 𝑓 · 𝑔 identificando le ipotesi su 𝑓 e su 𝑔 che
garantiscono la convergenza dell’integrale. Si dovrebbe ottenere un criterio analogo al
teorema 3.32 di Dirichlet per la convergenza delle serie.
I criteri che abbiamo visto fin’ora mettono in evidenza una notevole analogia
tra serie e integrali. Determinare la convergenza di un integrale è però, in
generale, più semplice che determinare la convergenza della corrispondente
serie. Nell’esercizio seguente, ad esempio, è sufficiente trovare una primitiva
delle funzioni integrande, per determinare il carattere dell’integrale.
Esercizio 6.76. Si determini per quali 𝛼, 𝛽 ∈ ℝ risultano convergenti gli integrali:

1
∫ ∫ +∞
2 1 1
𝑑𝑥, 𝑑𝑥.
0 𝑥 𝛼 | ln 𝑥| 𝛽 2 𝑥 𝛼 ln𝛽 𝑥
Teorema 6.77 (collegamento tra serie ed integrali impropri). Sia 𝑓 : [1 , +∞) → ℝ

una funzione decrescente non negativa e sia 𝑎 𝑘 = 𝑓 (𝑘). Allora la serie
+∞
X
𝑎𝑘
𝑘=1
è convergente se e solo se è convergente l’integrale

∫ +∞
𝑓 (𝑥) 𝑑𝑥.
1
E, più precisamente, per ogni 𝑛 ∈ ℕ ∪ {+∞} si ha

𝑛
X ∫ 𝑛
0≤ 𝑎𝑘 − 𝑓 (𝑥) 𝑑𝑥 ≤ 𝑎1 . (6.29)
𝑘=1 1
Dimostrazione. Visto che la funzione 𝑓 , è non negativa e monotona, l’integrale

improprio di 𝑓 su [1 , +∞) esiste (finito o infinito) per il teorema 6.64. Anche la
serie 𝑓 (𝑘) essendo a termini non negativi risulta essere determinata.
P
Essendo 𝑓 decrescente, per ogni 𝑥 ∈ [𝑘, 𝑘 + 1] si ha
𝑓 (𝑘 + 1) ≤ 𝑓 (𝑥) ≤ 𝑓 (𝑘)
integrando su [𝑘, 𝑘 + 1] si ottiene

∫ 𝑘+1
𝑓 (𝑘 + 1) ≤ 𝑓 (𝑥) 𝑑𝑥 ≤ 𝑓 (𝑘)
𝑘
e sommando per 𝑘 = 1 , . . . , 𝑛 − 1 si ottiene:
𝑛
X ∫ 𝑛 𝑛−1
X
𝑓 (𝑘) ≤ 𝑓 (𝑥) 𝑑𝑥 ≤ 𝑓 (𝑘)
𝑘=2 1 𝑘=1
che implica la (6.29) se 𝑛 ∈ ℕ . Facendo tendere 𝑛 → +∞ la (6.29) rimane

comunque verificata. La prima disequazione ci permette di stimare l’integrale
con la serie e la seconda ci permette viceversa di stimare la serie con l’integrale.
Dunque se uno dei due converge anche l’altro converge, come volevamo
dimostrare.
stima asintotica 𝑛 !
Esempio 6.78 (stima asintotica di ln 𝑛 !). Osserviamo che
𝑛
Y 𝑛
X
ln(𝑛 !) = ln 𝑘= ln 𝑘.
𝑘=1 𝑘=1
Applichiamo lo stesso procedimento utilizzato nel teorema precedente alla funzione

𝑓 (𝑥) = ln 𝑥 . Visto che il logaritmo è crescente (invece che decrescente) otterremo delle
stime rovesciate, ma analoghe. Ripetendo con attenzione i conti, si ottiene:
∫ 𝑛 𝑛
X ∫ 𝑛+1
ln(𝑥) 𝑑𝑥 ≤ ln 𝑘 ≤ ln(𝑥) 𝑑𝑥
1 𝑘=2 2
∫
e ricordando che ln 𝑥 = 𝑥 ln 𝑥 − 𝑥 si ottiene
𝑛 ln 𝑛 − 𝑛 + 1 ≤ ln(𝑛 !) ≤ (𝑛 + 1) ln(𝑛 + 1) − 𝑛 − 2 ln 2 + 1
da cui, dividendo ambo i membri per 𝑛 ln 𝑛 e facendo tendere 𝑛 → +∞ si trova
ln 𝑛 !
→1
𝑛 ln 𝑛
ovvero
ln(𝑛 !) ∼ 𝑛 ln 𝑛 per 𝑛 → +∞.
Si faccia attenzione che in generale non possiamo fare l’esponenziale di ambo i membri
di una equivalenza asintotica e sperare che l’equivalenza asintotica rimanga valida. In
effetti trovare una stima asintotica per 𝑛 ! è molto più complicato (rispetto alla stima che
abbiamo trovato per il suo logaritmo). Lo faremo nel teorema 6.88 trovando la formula
di Stirling.
6.9 studio di funzioni integrali
Teorema 6.79 (derivata di una funzione integrale). Sia 𝐼 ⊆ ℝ un intervallo e

𝑓 : 𝐼 → ℝ una funzione localmente Riemann-integrabile. Siano 𝑎, 𝑏 : 𝐴 → 𝐼 funzioni
6.9 studio di funzioni integrali 285
definite su un insieme 𝐴 ⊆ ℝ. Allora è ben definita la funzione 𝐹 : 𝐴 → ℝ

∫ 𝑏(𝑥)
𝐹(𝑥) = 𝑓 (𝑡) 𝑑𝑡.
𝑎(𝑥)
Se inoltre 𝑓 è continua e se 𝑎, 𝑏 sono derivabili allora anche 𝐹 è derivabile e si ha
𝐹0(𝑥) = 𝑓 (𝑏(𝑥)) · 𝑏 0(𝑥) − 𝑓 (𝑎(𝑥)) · 𝑎 0(𝑥).
Dimostrazione. Per le ipotesi enunciate per ogni 𝑥 ∈ 𝐴 risulta che 𝑓 è integrabile

sull’intervallo [𝑎(𝑥), 𝑏(𝑥)] e dunque la funzione 𝐹 è ben definita. Fissato 𝑥 0 ∈ 𝐼
possiamo considerare la funzione integrale
∫ 𝑥
𝐺(𝑥) = 𝑓 (𝑡) 𝑑𝑡
𝑥0
e scrivere
𝑏(𝑥)
𝐹(𝑥) = [𝐺(𝑥)]𝑎(𝑥) = 𝐺(𝑏(𝑥)) − 𝐺(𝑎(𝑥)).
Se 𝑓 è continua possiamo applicare il teorema fondamentale del calcolo integrale

che garantisce che 𝐺 è derivabile e 𝐺0(𝑥) = 𝑓 (𝑥) per ogni 𝑥 ∈ 𝐼 . Dunque se
anche 𝑎 e 𝑏 sono derivabili si ha, per la formula di derivazione della funzione
composta:
𝐹0(𝑥) = 𝐺0(𝑏(𝑥)) · 𝑏 0(𝑥) − 𝐺0(𝑎(𝑥)) · 𝑎 0(𝑥) = 𝑓 (𝑏(𝑥)) · 𝑏 0(𝑥) − 𝑓 (𝑎(𝑥)) · 𝑎 0(𝑥).

∫ 𝑥4
1
𝐹(𝑥) = 𝑑𝑡
𝑥2 ln 𝑡
è definita per ogni 𝑥 ∈ ℝ \ {0 , 1 , −1} in quanto in tal caso l’intervallo [𝑥 2 , 𝑥 4 ] è

contenuto nell’insieme di definizione della funzione integranda. Si ha inoltre
4𝑥 3 2𝑥 𝑥3 − 𝑥2
𝐹0(𝑥) = − = .
ln(𝑥 4 ) ln(𝑥 2 ) ln |𝑥|
Teorema 6.81 (integrale dell’ 𝑜 -piccolo). Sia 𝑓 (𝑥) una funzione continua definita su
un intervallo [0 , 𝑏] e tale che per 𝑥 → 0+ si ha 𝑓 (𝑥) = 𝑜(𝑥 𝛼 ) per un qualche 𝛼 ≥ 0.
Allora posto ∫ 𝑥
𝐹(𝑥) = 𝑓 (𝑡) 𝑑𝑡
0
risulta 𝐹(𝑥) = 𝑜(𝑥 𝛼+1 ). In modo più conciso si può dunque scrivere
∫ 𝑥
𝑜(𝑡 𝛼 ) 𝑑𝑡 = 𝑜(𝑥 𝛼+1 ), per 𝑥 → 0+
0
se la funzione integranda è continua.

Dimostrazione. Per il teorema della media integrale (teorema 6.20) per ogni
𝑥 ∈ [0, 𝑏] deve esistere 𝑐(𝑥) ∈ [0 , 𝑥] tale che
∫ 𝑥
𝐹(𝑥) = 𝑓 (𝑡) 𝑑𝑡 = 𝑥 · 𝑓 (𝑐(𝑥)).
0
Dunque, essendo 0 ≤ 𝑐(𝑥) ≤ 𝑥 si ha
𝐹(𝑥) 𝑓 (𝑐(𝑥)) 𝑓 (𝑐(𝑥)) 𝑐(𝑥) 𝛼 𝑓 (𝑐(𝑥))

· ≤
𝑐 𝛼 (𝑥) → 0
= =
𝑥 𝛼+1 𝑥 𝛼 𝑐 𝛼 (𝑥) 𝑥
visto che 𝑓 (𝑥) = 𝑜(𝑥 𝛼 ) e che per 𝑥 → 0 anche 𝑐(𝑥) → 0 si ha infatti
𝑓 (𝑐(𝑥))
lim = 0.
𝑥→0 𝑐 𝛼 (𝑥)

sin 𝑥
2 − 𝑡 sin 𝑡 − 2 cos 𝑡
∫
1
lim+ 𝑑𝑡.
𝑥→0 𝑥4 sin2 𝑥 𝑒𝑡 − 1
Chiamata 𝑓 (𝑥) la funzione integranda non è difficile verificare, tramite le formule di

Taylor, che risulta
𝑥4
12 − 𝑜(𝑥 )
4
𝑥3
𝑓 (𝑥) = = + 𝑜(𝑥 3 ).
𝑥 + 𝑜(𝑥) 12
In particolare la funzione 𝑓 può essere estesa per continuità ponendo 𝑓 (0) = 0. Si ha
dunque, per il teorema precedente,
𝑥 𝑥
𝑡3 𝑥4
∫ ∫
𝐹(𝑥) = 𝑓 (𝑡) 𝑑𝑡 = + 𝑜(𝑡 3 ) 𝑑𝑡 = + 𝑜(𝑥 4 )
0 0 12 48
da cui
sin 𝑥
𝐹(sin 𝑥) − 𝐹(sin2 𝑥)
∫
1
𝑓 (𝑡) 𝑑𝑡 =
𝑥4 sin2 𝑥 𝑥4
(sin 𝑥)4 (sin2 𝑥)4
48 + 𝑜(sin4 𝑥) − 48 + 𝑜(sin8 𝑥)
=
𝑥4
𝑥4
48 + 𝑜(𝑥 4 ) 1
= → .
𝑥4 48

∫ 2𝑥
1
lim+ 𝑑𝑡.
𝑥→0 𝑥 𝑡 + sin 𝑡
Posto
1
𝑓 (𝑥) =
𝑥 + sin 𝑥
6.9 studio di funzioni integrali 287
si ha
1 1 1 + 𝑜(𝑥) 1
𝑓 (𝑥) = = = = + 𝑜(1).
2 𝑥 + 𝑜(𝑥 2 ) 2 𝑥(1 + 𝑜(𝑥)) 2𝑥 2𝑥
La funzione 𝑓 (𝑥) − 21𝑥 = 𝑜(1) può essere estesa per continuità anche in 𝑥 = 0 e dunque
possiamo applicare il teorema precedente per ottenere
∫ 2𝑥 ∫ 2𝑥
1
𝑓 (𝑡) 𝑑𝑡 = + 𝑜(1) 𝑑𝑡
𝑥 𝑥 2𝑡
1
= [ln 𝑡]2𝑥𝑥 + [𝑜(𝑡)]2𝑥𝑥
2
ln 2 𝑥 − ln 𝑥 ln 2 ln 2
= + 𝑜(2𝑥) − 𝑜(𝑥) = + 𝑜(𝑥) → .
2 2 2
Teorema 6.84. Siano 𝑎, 𝑏 : 𝐽 → ℝ due funzioni definite su un intervallo 𝐽 a valori in

un intervallo 𝐼 . Sia 𝑥 0 un punto di accumulazione di 𝐽 e sia 𝑎 un punto di accumulazione
di 𝐼 . Supponiamo inoltre che per 𝑥 → 𝑥 0 si abbia 𝑎(𝑥) → 𝑎 , 𝑏(𝑥) → 𝑎 . Siano
𝑓 , 𝑔 : 𝐼 → ℝ funzioni continue. Se 𝑓 (𝑥) ∼ 𝑔(𝑥) per 𝑥 → 𝑎 allora si ha
∫ 𝑏(𝑥) ∫ 𝑏(𝑥)
𝑓 (𝑡) 𝑑𝑡 ∼ 𝑔(𝑡) 𝑑𝑡 per 𝑥 → 𝑥 0 .
𝑎(𝑥) 𝑎(𝑥)
Dimostrazione. Sia 𝐹 una primitiva di 𝑓 e 𝐺 una primitiva di 𝑔 . Allora

∫ 𝑏(𝑥)
𝑓 (𝑡) 𝑑𝑡
𝑎(𝑥) 𝐹(𝑏(𝑥)) − 𝐹(𝑎(𝑥))
= .
∫ 𝑏(𝑥) 𝐺(𝑏(𝑥)) − 𝐺(𝑎(𝑥))
𝑔(𝑡) 𝑑𝑡
𝑎(𝑥)
Applicando il teorema 5.42 di Cauchy si ha
𝐹(𝑏(𝑥)) − 𝐹(𝑎(𝑥)) 𝐹0(𝑐(𝑥)) 𝑓 (𝑐(𝑥))

= 0 =
𝐺(𝑏(𝑥)) − 𝐺(𝑎(𝑥)) 𝐺 (𝑐(𝑥)) 𝑔(𝑐(𝑥))
per un certo 𝑐(𝑥) compreso tra 𝑎(𝑥) e 𝑏(𝑥). Visto che 𝑎(𝑥) → 𝑎 e 𝑏(𝑥) → 𝑎
si avrà anche 𝑐(𝑥) → 𝑎 per 𝑥 → 𝑥 0 . Essendo inoltre 𝑓 (𝑥) ∼ 𝑔(𝑥) per 𝑥 → 𝑎
facendo un cambio di variabile nel limite possiamo dedurre che
𝑓 (𝑐(𝑥))
→1 per 𝑥 → 𝑥 0 .
𝑔(𝑐(𝑥))
3𝑥 2
tg 𝑡
∫
lim 𝑑𝑥.
𝑥→0 𝑥2 𝑡2
Visto che per 𝑥 → 0 si ha

tg 𝑥 1
∼
𝑥2 𝑥
e visto che ∫ 3𝑥 2
1
𝑑𝑡 = ln(3𝑥 2 ) − ln(𝑥 2 ) = ln 3
𝑥2 𝑡
grazie al teorema precedente possiamo dedurre che il limite cercato è proprio ln 3.
6.10 alcune applicazioni del calcolo integrale

𝜋 è irrazionale
Teorema 6.86 (irrazionalità di 𝜋). Il numero 𝜋 è irrazionale.
Dimostrazione. Il nostro primo obiettivo è quello di trovare delle formule

ricorsive per il calcolo del seguente integrale:
∫ 𝜋
𝐼𝑛 = 𝑥 𝑛 (𝜋 − 𝑥)𝑛 sin 𝑥 𝑑𝑥.
0
Innanzitutto osserviamo che si ha

∫ 𝜋
𝐼0 = sin 𝑥 𝑑𝑥 = [− cos 𝑥]𝜋0 = 2
0
e, utilizzando l’integrazione per parti:

∫ 𝜋
𝐼1 = 𝑥(𝜋 − 𝑥) sin 𝑥 𝑑𝑥
0
∫ 𝜋
= [𝑥(𝜋 − 𝑥)(− cos 𝑥)]𝜋0 − (𝜋 − 2 𝑥)(− cos 𝑥) 𝑑𝑥
0
∫ 𝜋 ∫ 𝜋 ∫ 𝜋
= (𝜋 − 2 𝑥) cos 𝑥 𝑑𝑥 = 𝜋 cos 𝑥 𝑑𝑥 − 2 𝑥 cos 𝑥 𝑑𝑥
0 0 0
∫ 𝜋
= −2 [𝑥 sin 𝑥]𝜋0 − sin 𝑥 𝑑𝑥 = 2[cos 𝑥]𝜋0 = 4.
0
Per 𝑛 ≥ 2 si procede in maniera simile, la funzione 𝑥 𝑛 (𝜋 − 𝑥)𝑛 si annulla agli

estremi di integrazione quindi integrando per parti si ottiene:
∫ 𝜋
𝐼𝑛 = 𝑛𝑥 𝑛−1 (𝜋 − 𝑥)𝑛 − 𝑛𝑥 𝑛 (𝜋 − 𝑥)𝑛−1 cos 𝑥 𝑑𝑥

0
anche la funzione tra parentesi quadre si annulla agli estremi dell’intervallo di

integrazione e quindi integrando nuovamente per parti si ottiene:
∫ 𝜋
𝐼𝑛 = − 𝑛(𝑛 − 1)𝑥 𝑛−2 (𝜋 − 𝑥)𝑛 − 2𝑛 2 𝑥 𝑛−1 (𝜋 − 𝑥)𝑛−1

0
+ 𝑛(𝑛 − 1)𝑥 𝑛 (𝜋 − 𝑥)𝑛−2 sin(𝑥) 𝑑𝑥

∫ 𝜋
= 2𝑛 2 𝐼𝑛−1 − (𝑛 2 − 𝑛) (𝜋 − 𝑥)2 + 𝑥 2 𝑥 𝑛−2 (𝜋 − 𝑥)𝑛−2 sin 𝑥 𝑑𝑥

∫0 𝜋
= 2𝑛 𝐼𝑛−1 − (𝑛 − 𝑛)
2 2
𝜋2 − 2 𝑥(𝜋 − 𝑥) 𝑥 𝑛−2 (𝜋 − 𝑥)𝑛−2 sin 𝑥 𝑑𝑥

0
= 2𝑛 2 𝐼𝑛−1 − (𝑛 2 − 𝑛)𝜋2 𝐼𝑛−2 + 2(𝑛 2 − 𝑛)𝐼𝑛−1
6.10 alcune applicazioni del calcolo integrale 289
da cui
𝐼𝑛 = (4𝑛 2 − 2𝑛)𝐼𝑛−1 − (𝑛 2 − 𝑛)𝜋2 𝐼𝑛−2 . (6.30)
𝑝
Supponiamo ora per assurdo che sia 𝜋 = 𝑞 con 𝑝, 𝑞 ∈ ℕ e consideriamo la
successione
𝑞 2𝑛
𝑎𝑛 = 𝐼𝑛 .
𝑛!
Dalla relazione (6.30) deduciamo un relazione ricorsiva per 𝑎 𝑛 :
𝑞 2𝑛 𝑝 2 (𝑛 − 2)!

(𝑛 − 1)!
𝑎𝑛 = −(𝑛 2 − 𝑛) 2 2𝑛−4 𝑎 𝑛−2 + (4𝑛 2 − 2𝑛) 2𝑛−2 𝑎 𝑛−1
𝑛! 𝑞 𝑞 𝑞
= −𝑞 2 𝑝 2 𝑎 𝑛−2 + (4𝑛 − 2)𝑞 2 𝑎 𝑛−1
che ci dice, in particolare, che se 𝑎 𝑛−2 e 𝑎 𝑛−1 sono interi allora anche 𝑎 𝑛 è intero
(in quanto somma di prodotti di numeri interi). Visto che anche i primi due
termini:
𝑎 0 = 𝐼0 = 2 , 𝑎 1 = 𝑞 2 𝐼1 = 4 𝑞 2
sono interi possiamo dedurre, per induzione, che tutti i termini della successione
𝑎 𝑛 sono interi.
D’altra parte osservando che 𝑦 = 𝑥(𝜋 − 𝑥) è il grafico di una parabola con asse
𝑥 = 𝜋2 sappiamo che per ogni 𝑥 si ha 𝑥(𝜋 − 𝑥) ≤ 𝜋4 e quindi
2
𝜋2 𝑛
0 ≤ 𝑥 𝑛 (𝜋 − 𝑥)𝑛 sin 𝑥 ≤ 𝑥 𝑛 (𝜋 − 𝑥)𝑛 ≤ .
4𝑛
Dunque
𝜋2𝑛+1
0 ≤ 𝐼𝑛 ≤
4𝑛
cioè
𝑞 2𝑛 𝜋2𝑛+1
0 ≤ 𝑎𝑛 ≤ .
𝑛 ! 4𝑛
Visto che 𝑛 ! 𝐶 𝑛 , possiamo dunque affermare che 𝑎 𝑛 → 0. D’altra parte
abbiamo visto che 𝑎 𝑛 ∈ ℤ e certamente 𝑎 𝑛 > 0 in quanto 𝐼𝑛 ≠ 0 visto che 𝑓𝑛
è una funzione continua, non negativa e non identicamente nulla. Ma non è
possibile che una successione di numeri interi positivi converga a zero: abbiamo
quindi ottenuto l’assurdo. prodotto di Wallis
Teorema 6.87 (prodotto di Wallis). Si ha

+∞
𝜋 Y (2 𝑘)2 2 2 4 4 6 6 8 8
= = · · · · · · · ...
2 𝑘=1
(2 𝑘 − 1 )(2 𝑘 + 1 ) 1 3 3 5 5 7 7 9 binomiale centrale
E si ottiene di conseguenza la seguente stima asintotica per il coefficiente binomiale

centrale
2𝑛 4𝑛

∼√ per 𝑛 → +∞.
𝑛 𝜋𝑛
Dimostrazione. Consideriamo la successione di integrali:

∫ 𝜋
𝐼𝑛 = sin𝑛 (𝑥) 𝑑𝑥.
0
Essendo 0 ≤ sin𝑛 (𝑥) ≤ 1 per ogni 𝑥 ∈ [0 , 𝜋] ed essendo sin𝑛+1 (𝑥) ≤ sin𝑛 (𝑥) per
ogni 𝑥 ∈ [0 , 𝜋] è chiaro che 𝐼𝑛 è una successione decrescente di numeri positivi.
Da un calcolo diretto troviamo che

∫ 𝜋 ∫ 𝜋
𝐼0 = 1 𝑑𝑥 = 𝜋, 𝐼1 = sin(𝑥) 𝑑𝑥 = [− cos 𝑥]𝜋0 = 2.
0 0
Se 𝑛 ≥ 2, integrando per parti troviamo invece una relazione ricorsiva

∫ 𝜋
𝐼𝑛 = sin𝑛−1 (𝑥) sin(𝑥) 𝑑𝑥
0
𝜋
∫ 𝜋
𝑛−1
sin𝑛−2 cos2 (𝑥) 𝑑𝑥

= − sin (𝑥) cos(𝑥) 0
+ (𝑛 − 1)
0
∫ 𝜋
= 0 + (𝑛 − 1) sin𝑛−2 (1 − sin2 (𝑥)) 𝑑𝑥
0
= (𝑛 − 1)𝐼𝑛−2 − (𝑛 − 1)𝐼𝑛
da cui
𝑛−1
𝐼𝑛−2 . 𝐼𝑛 = (6.31)
𝑛
Questa formula ricorsiva ci permette di calcolare separatamente i termini pari
e dispari della successione utilizzando la notazione del semi fattoriale (si veda
l’osservazione 1.31):
2𝑛 − 1 2𝑛 − 3 3 1 (2𝑛 − 1)!!
𝐼2 𝑛 = · ··· · · 𝐼0 = ·𝜋
2𝑛 2𝑛 − 2 4 2 (2𝑛)!!
2𝑛 2𝑛 − 2 4 2 (2𝑛)!!
𝐼2𝑛+1 = · ··· · · 𝐼1 = · 2.
2𝑛 + 1 2𝑛 − 1 5 3 (2𝑛 + 1)!!
Ricordando che 𝐼𝑛 è decrescente si osserva che vale
𝐼2𝑛+2 𝐼2𝑛+1 2𝑛
≤ ≤ =1
𝐼2 𝑛 𝐼2 𝑛 2𝑛
e grazie a (6.31)
𝐼2𝑛+2 2𝑛 + 1
= →1
𝐼2 𝑛 2𝑛
𝐼2𝑛+1
da cui ottieniamo che 𝐼2 𝑛 → 1.
In conclusione, visto che 𝜋 compare nella formula dei termini pari, ma non
in quella dei termini dispari, e visto che le due espressioni sono asintotiche
possiamo ottenere la formula per il calcolo di 𝜋2 :
(2𝑛)!!
𝜋 𝜋 𝐼2𝑛+1 (2𝑛+1)!! ((2𝑛)!!)2
= lim = lim = lim
2 2 𝑛→+∞ 𝐼2𝑛 𝑛→+∞ (2𝑛−1)!! 𝑛→+∞ (2𝑛 + 1)!!(2𝑛 − 1)!!
(2𝑛)!!
(2𝑛)(2𝑛)(2𝑛 − 2)(2𝑛 − 2) · · · 4 · 4 · 2 · 2
= lim .
𝑛→+∞ (2𝑛 + 1)(2𝑛 − 1)(2𝑛 − 1)(2𝑛 − 3)(2𝑛 − 3) · · · 3 · 3 · 1
Per ottenere una stima asintotica del coefficiente binomiale centrale ricordiamo
che si ha (osservazione 1.31)
(2𝑛)!! = 2𝑛 𝑛 !
(2𝑛 + 1)!
(2𝑛 + 1)!! =
2𝑛 𝑛 !
dunque la stima asintotica di Wallis si può scrivere come
𝜋 (2𝑛)!!
r
∼√
2 2𝑛 + 1(2𝑛 − 1)!!
2𝑛 𝑛 !
=√
(2𝑛−1)!
2𝑛 + 1 2𝑛−1 (𝑛−1)!
2𝑛 (𝑛 !)2 2𝑛−1
=√
2𝑛 + 1(2𝑛)!
𝑛
4 (𝑛 !)2
∼√
𝑛(2𝑛)!
da cui
2𝑛 (2𝑛)! 4𝑛 √

= ∼ √ 𝜋𝑛.
𝑛 (𝑛 !)2 𝑛
formula di Stirling
Teorema 6.88 (formula di Stirling). Si ha

√ 𝑛𝑛
𝑛! ∼ 2𝜋𝑛 · 𝑛 per 𝑛 → +∞.
𝑒
Dimostrazione. Si osservi che la tesi:

√
𝑛 · 𝑛𝑛 1
lim =√
𝑛→+∞ 𝑛! · 𝑒 𝑛 2𝜋
è equivalente, passando ai logaritmi, a dimostrare che

1 1
lim ln 𝑛 + 𝑛 ln 𝑛 − ln(𝑛 !) − 𝑛 = − ln(2𝜋).
𝑛→+∞ 2 2
La prima parte della dimostrazione sarà volta a dimostrare che il limite pre-
cedente esiste ed è finito. Alla fine, per trovare il valore esatto, si utilizzerà la
formula di Wallis. La quantità 𝑛 ln 𝑛 − 𝑛 è, a meno di una costante additiva,
l’integrale del logaritmo sull’intervallo [1 , 𝑛]. Abbiamo già visto nell’esem-

pio 6.78 che ln(𝑛 !) si ottiene approssimando tale integrale con dei rettangoli. Se
procediamo invece con una approssimazione tramite trapezi, otteniamo una
stima più precisa che ci darà il termine aggiuntivo 12 ln 𝑛 , necessario per far
convergere il limite.
Osserviamo in generale che se 𝑓 : [𝑎, 𝑏] → ℝ è una funzione concava allora il

grafico di 𝑓 è compreso tra la retta passante per gli estremi (𝑎, 𝑓 (𝑎)), (𝑏, 𝑓 (𝑏))
(retta secante) e una qualunque retta tangente, ad esempio la retta tangente in
∫𝑏
((𝑎 + 𝑏)/2 , 𝑓 ((𝑎 + 𝑏)/2)). Di conseguenza l’area sotto il grafico, cioè 𝑎 𝑓 (𝑥) 𝑑𝑥
è compreso tra le aree dei due corrispondenti trapezi rettangoli. L’altezza di
entrambi i trapezi è pari a (𝑏 − 𝑎) e l’area si calcola moltiplicando l’altezza per la
media delle basi. Nel caso del trapezio con lato obliquo sulla secante, la media
delle basi è ( 𝑓 (𝑎) + 𝑓 (𝑏))/2, nel caso del trapezio con lato obliquo sulla retta
tangente nel punto medio, la media delle basi è uguale alla sezione nel punto
medio: 𝑓 ((𝑎 + 𝑏)/2). Si ottiene dunque, per ogni 𝑓 concava:
𝑏
𝑓 (𝑎) + 𝑓 (𝑏) 𝑎+𝑏
∫
(𝑏 − 𝑎) · ≤ 𝑓 (𝑥) 𝑑𝑥 ≤ (𝑏 − 𝑎) · 𝑓 .
2 𝑎 2
Applicando queste stime alla funzione 𝑓 (𝑥) = ln 𝑥 nell’intervallo [𝑘, 𝑘 + 1] si

ottiene: ∫ 𝑘+1
ln(𝑘) + ln(𝑘 + 1) 1
≤ ln 𝑥 𝑑𝑥 ≤ ln 𝑘 + .
2 𝑘 2
Chiamiamo 𝑎 𝑘 la differenza tra le prime due quantità. Chiaramente 𝑎 𝑘 ≥ 0 e

risulta
∫ 𝑘+1
ln(𝑘) + ln(𝑘 + 1)
𝑎𝑘 = ln 𝑥 𝑑𝑥 −
𝑘 2

1 ln(𝑘) + ln(𝑘 + 1)
≤ ln 𝑘 + −
2 2
2
𝑘 + 21

1 1 1
= ln = ln 1 +
2 𝑘(𝑘 + 1) 2 4(𝑘 + 𝑘)
2

1 1
= +𝑜 2 per 𝑘 → +∞.
8𝑘2 𝑘
𝑎 𝑘 è dunque convergente ovvero la successione

P
La serie
𝑛
X
𝐴𝑛 = 𝑎𝑘
𝑘=1
è convergente. Chiamiamo ℓ il limite di 𝐴𝑛 . Si ha:
𝑛−1 ∫ 𝑘+1 𝑛−1

X X ln 𝑘 + ln(𝑘 + 1)
𝐴𝑛 = ln 𝑥 𝑑𝑥 −
𝑘=1 𝑘 𝑘=1
2
𝑛 𝑛−1
ln 1 ln 𝑛
∫ X
= ln 𝑥 𝑑𝑥 − ln 𝑘 − −
1 𝑘=2
2 2
𝑛
ln 𝑛
= [𝑥 ln 𝑥 − 𝑥]1𝑛 −
X
ln 𝑘 +
𝑘=1
2
ln 𝑛
= 𝑛 ln 𝑛 − 𝑛 + 1 − ln(𝑛 !) + →ℓ
2
da cui √
𝑛𝑛 · 𝑒 · 𝑛
𝑒 𝐴𝑛 = → 𝑒ℓ
𝑒 𝑛 · 𝑛!
ovvero, posto 𝑐 = 𝑒/𝑒 ℓ ,
√
𝑛𝑛 𝑛
𝑛! ∼ 𝑐 · .
𝑒𝑛
Per determinare la costante incognita 𝑐 possiamo sfruttare la formula di Wallis
sul coefficiente binomiale centrale:
√
(2𝑛)2𝑛 2𝑛
𝑐
4𝑛 2𝑛 (2𝑛)!

∼ = ∼ 𝑒 2𝑛
√ 𝑛√ 2
𝜋𝑛 𝑛 (𝑛 !) 2
𝑛 𝑛
𝑐 𝑛
𝑒
√ √
2𝑛 𝑛
2 2 4 2
= √ = √
𝑐 𝑛 𝑐 𝑛
da cui si ottiene √
1 2
√ ∼
𝜋 𝑐
√
e quindi 𝑐 = 2𝜋.
spazi di funzioni 7
L’astrazione è una attività tipica della matematica. I risultati che abbiamo
visto fin’ora riguardano per lo più lo spazio ℝ dei numeri reali e in parte lo
spazio ℂ dei numeri complessi. E’ però evidente che molti di questi risultati si
estendono ad altre situazioni più generali. Identificare le proprietà fondamentali
che stanno alla base di un teorema è forse l’attività più importante svolta
dalla matematica. Tipicamente l’identificazione di queste proprietà oltre
a generalizzare un risultato ne rende anche più semplice la dimostrazione.
Infatti una volta identificate le ipotesi minime del teorema gli strumenti a
nostra disposizione pure si riducono e sarà più facile capire quali andranno
utilizzati. D’altra parte non potremo portare all’estremo questo tentativo di
generalizzazione in quanto ci si accorge presto che la fauna composta dagli spazi
che vanno via via a coprire tutte le possibili tipologie diventa subito enorme e
avere in mente tutte le definizioni diventa troppo oneroso.
Si veda la figura 7.1 per avere un quadro relazionale degli spazi che andremo
ora ad introdurre. Gli insiemi sono dati per noti (si vedano gli appunti di
logica [5]). Anche gli spazi vettoriali (algebra lineare) li diamo per noti, in
quanto sono usualmente oggetto del corso di geometria. Gli spazi topologici
verranno solamente accennati in quanto non saranno direttamente utili ai nostri
scopi e una trattazione completa richiederebbe molto tempo. Per lo stesso
motivo mancano completamente da questa classificazione anche altri spazi
molto rilevanti (ad esempio i gruppi e le varietà differenziali).
Definizione 7.1 (spazio metrico). Diremo che 𝑑 : 𝑋 × 𝑋 → ℝ è una distanza su distanza

𝑋 se per ogni 𝑥, 𝑦, 𝑧 ∈ 𝑋 valgono le seguenti proprietà
1. 𝑑(𝑥, 𝑦) ≥ 0 (positività);
2. 𝑑(𝑥, 𝑦) ≤ 𝑑(𝑥, 𝑧) + 𝑑(𝑧, 𝑦) (disuguaglianza triangolare);
3. 𝑑(𝑥, 𝑦) = 0 se e solo se 𝑥 = 𝑦 (separazione);
4. 𝑑(𝑥, 𝑦) = 𝑑(𝑦, 𝑥) (simmetria).
Se 𝑑 è una distanza diremo che 𝑋 è uno spazio metrico (metrizzato da 𝑑 ). spazio metrico
Osserviamo che dalle disuguaglianze triangolari:
𝑑(𝑥, 𝑧) ≤ 𝑑(𝑥, 𝑦) + 𝑑(𝑦, 𝑧), 𝑑(𝑦, 𝑧) ≤ 𝑑(𝑥, 𝑦) + 𝑑(𝑥, 𝑧)
si ottiene la disuguaglianza triangolare inversa: disuguaglianza triangolare inversa
𝑑(𝑥, 𝑦) ≥ |𝑑(𝑥, 𝑧) − 𝑑(𝑦, 𝑧)|.
Definizione 7.2 (convergenza). Se 𝑥 𝑛 ∈ 𝑋 è una successione di punti di uno spazio

metrico 𝑋 e 𝑥 ∈ 𝑋 diremo che 𝑥 𝑛 converge a 𝑥 e scriveremo
𝑥𝑛 → 𝑥
se 𝑑(𝑥 𝑛 , 𝑥) → 0 per 𝑛 → +∞.

296 7 spazi di funzioni
◦
∈, ⊆, ∪ insieme lim , 𝐴 , 𝐴¯
+, · sp. vettoriale sp. topologico ℝ̄

𝑑(𝑥, 𝑦), Lip
sp. metrico
ℚ
|𝑣| sp. normato
sp. completo
𝕊𝑛
Banach
h𝑣, 𝑤i sp. euclideo ℂ𝑛 , 𝐿 𝑝 , ℓ 𝑝
Figura 7.1: Strutture matematiche che
astraggono lo spazio ℝ𝑛 . La freccia nera Hilbert
significa: “è un”, la freccia scura: “è un 𝐿2 , ℓ 2
esempio di”, la linea chiara: “è una ope-
razione tipica di”. ℝ𝑛
Si noti che l’usuale convergenza in ℝ non è altro che la convergenza di ℝ visto

come spazio metrico con la distanza euclidea 𝑑(𝑥, 𝑦) = |𝑥 − 𝑦| .
Con l’artificio 𝑑(𝑥 𝑛 , 𝑦𝑛 ) − 𝑑(𝑥, 𝑦) = 𝑑(𝑥 𝑛 , 𝑦𝑛 ) − 𝑑(𝑥 𝑛 , 𝑦) + 𝑑(𝑥 𝑛 , 𝑦) − 𝑑(𝑥, 𝑦) e

utilizzando la disuguaglianza triangolare inversa si può facilmente risolvere il
seguente.
Esercizio 7.3 (continuità della distanza). Dimostrare che se 𝑥 𝑛 → 𝑥 e 𝑦𝑛 → 𝑦

allora 𝑑(𝑥 𝑛 , 𝑦𝑛 ) → 𝑑(𝑥, 𝑦).
norma Definizione 7.4 (spazio normato). Sia 𝑉 uno spazio vettoriale sul campo ℝ. Una
funzione 𝜑 : 𝑉 → ℝ si dice essere una norma su 𝑉 se per ogni 𝑣, 𝑤 ∈ 𝑉 e per ogni
𝜆 ∈ ℝ valgono le seguenti proprietà:
1. 𝜑(𝑣) ≥ 0 (positività);
2. 𝜑(𝜆𝑣) = |𝜆| · 𝜑(𝑣) (omogeneità e simmetria);
3. 𝜑(𝑣 + 𝑤) ≤ 𝜑(𝑣) + 𝜑(𝑤) (disuguaglianza triangolare);
4. 𝜑(𝑣) = 0 se e solo se 𝑣 = 0 (separazione).
normato
Se 𝜑 è una norma su 𝑉 diremo che 𝑉 è uno spazio vettoriale normato da 𝜑 .

distanza indotta
Se 𝜑 è una norma la funzione 𝑑(𝑣, 𝑤) = 𝜑(𝑣 − 𝑤) è chiaramente una distanza che si
chiama distanza indotta da 𝜑 . In particolare ogni spazio normato è anche uno spazio
metrico rispetto alla distanza indotta dalla norma.
Usualmente si utilizzano le notazioni |𝑣| o k𝑣 k per indicare una norma 𝜑(𝑣).
Visto che uno spazio normato è anche uno spazio metrico, negli spazi normati è
definita una convergenza. E’ facile verificare che la norma risulta essere continua
rispetto a tale convergenza, nel senso che se 𝑣 𝑘 → 𝑣 (ovvero 𝜑(𝑣 𝑘 − 𝑣) → 0)
allora 𝜑(𝑣 𝑘 ) → 𝜑(𝑣).
prodotto scalare definito positivo
297
Definizione 7.5 (spazio euclideo). Sia 𝑉 uno spazio vettoriale sul campo ℝ. Una
funzione 𝑏 : 𝑉 × 𝑉 → ℝ si dice essere un prodotto scalare definito positivo su 𝑉 se
𝑏 è una forma bilineare, simmetrica e definita positiva, ovvero se per ogni 𝑢, 𝑣, 𝑤 ∈ 𝑉
e per ogni 𝜆, 𝜇 ∈ ℝ valgono le seguenti proprietà:
1. 𝑏(𝑣, 𝑣) ≥ 0 (positività);
2. 𝑏(𝜆𝑢 +𝜇𝑣, 𝑤) = 𝜆𝑏(𝑢, 𝑤)+𝜇𝑏(𝑣, 𝑤) e 𝑏(𝑢, 𝜆𝑣 +𝜇𝑤) = 𝜆𝑏(𝑢, 𝑣)+𝜇𝑏(𝑢, 𝑤)
(bilinearità);
3. 𝑏(𝑣, 𝑤) = 𝑏(𝑤, 𝑣) (simmetria);
4. 𝑏(𝑣, 𝑣) = 0 se e solo se 𝑣 = 0 (non degenerazione).
Se 𝑏 è un prodotto scalare definito positivo su 𝑉 diremo che 𝑉 è uno spazio euclideo
(con prodotto scalare 𝑏 ).
Usualmente si utilizzano le notazioni 𝑣 · 𝑤 , (𝑣, 𝑤), h𝑣, 𝑤i o h𝑣|𝑤i per denotare un
prodotto scalare 𝑏(𝑣, 𝑤).
Se 𝑏 è un prodotto scalare definito positivo su 𝑉 il teorema seguente ci garantisce

p
che che la funzione 𝜑(𝑣) = h𝑣, 𝑣i è una norma su 𝑉 .
Dunque uno spazio euclideo ha, in modo naturale, una struttura di spazio
normato e di spazio metrico.
Teorema 7.6 (proprietà del prodotto scalare). Sia 𝑉 uno spazio euclideo con
p
prodotto scalare (definito positivo) h𝑣, 𝑤i . Si definisca |𝑣| = h𝑣, 𝑣i . Allora |𝑣| è una
norma su 𝑉 e per ogni 𝑣, 𝑤 ∈ 𝑉 valgono le seguenti proprietà:
1. sviluppo del binomio sviluppo del binomio
|𝑣 + 𝑤| 2 = |𝑣| 2 + 2 h𝑣, 𝑤i + |𝑤| 2 ;
2. teorema di Pitagora teorema di Pitagora
h𝑣, 𝑤i = 0 =⇒ |𝑣 + 𝑤| 2 = |𝑣| 2 + |𝑤| 2 ; (7.1)
3. disuguaglianza di Young disuguaglianza di Young
|𝑣| 2 + |𝑤| 2
h𝑣, 𝑤i ≤ ; (7.2)
2
4. disuguaglianza di Cauchy-Schwarz disuguaglianza di Cauchy-Schwarz
h𝑣, 𝑤i ≤ |𝑣| · |𝑤| ; (7.3)
5. proprietà del parallelogramma proprietà del parallelogramma
|𝑣 + 𝑤| 2 + |𝑣 − 𝑤| 2 = 2 |𝑣| 2 + 2 |𝑤| 2 ; (7.4)
6. continuità
se 𝑣 𝑘 → 𝑣 e 𝑤 𝑘 → 𝑤 allora h𝑣 𝑘 , 𝑤 𝑘 i → h𝑣, 𝑤i.
Dimostrazione. Osserviamo innanzitutto che |𝑣| è ben definita per ogni 𝑣 ∈ 𝑉

in quanto il prodotto scalare h𝑣, 𝑣i per definizione non è mai negativo. Allora
in generale si ha, sfruttando la bilinearità, l’usuale sviluppo del quadrato del

binomio:
|𝑣 + 𝑤| 2 = h𝑣 + 𝑤, 𝑣 + 𝑤i = h𝑣 + 𝑤, 𝑣i + h𝑣 + 𝑤, 𝑤i
= h𝑣, 𝑣i + 2 h𝑣, 𝑤i + h𝑤, 𝑤i = |𝑣| 2 + 2 h𝑣, 𝑤i + |𝑤| 2 .
Il teorema di Pitagora segue immediatamente. Ma allora si ottiene facilmente la

disuguaglianza di Young:
0 ≤ |𝑣 − 𝑤| 2 = |𝑣| 2 + |𝑤| 2 − 2 h𝑣, 𝑤i
e la proprietà del parallelogramma:
|𝑣 + 𝑤| 2 + |𝑣 − 𝑤| 2 = |𝑣| 2 + 2 h𝑣, 𝑤i + |𝑤| 2 + |𝑣| 2 − 2 h𝑣, 𝑤i + |𝑤| 2 .
Ora se |𝑣| = |𝑤| = 1 la disuguaglianza di Young ci dice che
h𝑣, 𝑤i ≤ 1.
Ma allora per ogni 𝑣 ≠ 0 e 𝑤 ≠ 0 si ottiene la disuguaglianza di Cauchy-Schwarz:
h𝑣, 𝑤i 𝑣 𝑤
=h , i ≤ 1.
|𝑣| · |𝑤| |𝑣| |𝑤|
Se invece 𝑣 = 0 o 𝑤 = 0 la disuguaglianza di Cauchy-Schwarz è ovvia in quanto

per ogni 𝑢 ∈ 𝑉 si ha h0 , 𝑢i = h𝑢, 0i = 0 per bilinearità.
Per quanto riguarda la continuità ricordiamoci che 𝑣 𝑘 → 𝑣 significa k𝑣 𝑘 − 𝑣 k →

0. Possiamo allora scrivere
h𝑣 𝑘 , 𝑤 𝑘 i − h𝑣, 𝑤i = h𝑣 𝑘 , 𝑤 𝑘 i − h𝑣, 𝑤 𝑘 i + h𝑣, 𝑤 𝑘 i − h𝑣, 𝑤i

= h𝑣 𝑘 − 𝑣, 𝑤 𝑘 i + h𝑣, 𝑤 𝑘 − 𝑤i
e, utilizzando Cauchy-Schwarz se 𝑣 𝑘 → 𝑣 e 𝑤 𝑘 → 𝑤 otteniamo
|h𝑣 𝑘 , 𝑤 𝑘 i − h𝑣, 𝑤i| ≤ |𝑣 𝑘 − 𝑣| · |𝑤 𝑘 | + |𝑣| · |𝑤 𝑘 − 𝑤|

→ 0 · |𝑤| + |𝑣| · 0 = 0.
Lo spazio vettoriale ℝ𝑛 ha una struttura euclidea canonica, come nella seguen-

te.
Definizione 7.7 (struttura euclidea di ℝ𝑛 ). Un vettore 𝒙 ∈ ℝ𝑛 è definito come una

𝑛 -upla di numeri reali:
𝒙 = (𝑥1 , . . . , 𝑥 𝑛 ).
Su ℝ𝑛 possiamo allora definire il prodotto scalare:
𝑛
X
𝒙·𝒚= 𝑥 𝑘 𝑦 𝑘 = 𝑥 1 𝑦1 + · · · + 𝑥 𝑛 𝑦 𝑛
𝑘=1
299
Questo prodotto scalare induce la norma euclidea:
√ q
|𝒙| = 𝒙·𝒙= 𝑥12 + 𝑥 22 + · · · + 𝑥 𝑛2 .
La distanza indotta da tale norma si chiama distanza euclidea: distanza euclidea

q
𝑑(𝒙, 𝒚) = |𝒙 − 𝒚| = (𝑥1 − 𝑦1 )2 + · · · + (𝑥 𝑛 − 𝑦𝑛 )2 .
Nel caso 𝑛 = 1 la norma coincide con il valore assoluto e questo giustifica l’aver
utilizzato la stessa notazione.
Se identifichiamo ℂ con ℝ2 associando al numero complesso 𝑧 = 𝑥 + 𝑖 𝑦 il punto

(𝑥, 𝑦) ∈ ℝ2 possiamo osservare che la norma euclidea coincide con il modulo del
numero complesso:
q
|𝑧| = 𝑥 2 + 𝑦 2 = |(𝑥, 𝑦)|.
Dunque ℝ, ℂ, ℝ𝑛 , sono spazi euclidei, spazi normati e spazi metrici rispetto alla
struttura euclidea canonica.
norma Manhattan
Esempio 7.8 (distanza Manhattan). Su ℝ2 possiamo definire una norma, chiamata
norma Manhattan, come segue:
𝜑(𝒙) = |𝑥1 | + |𝑥2 |.
La distanza indotta 𝑑(𝑝, 𝑞) rappresenta la lunghezza del percorso più breve per andare
da 𝑝 a 𝑞 muovendosi solamente in orizzontale o verticale (come se fossimo sulle strade
di Manhattan).
La norma Manhattan non è euclidea nel senso che non è possibile definire un prodotto
scalare che induca tale norma. Infatti se esistesse un tale prodotto scalare dovrebbe essere
valida la proprietà del parallelogramma (7.4) e invece osserviamo che scelto 𝑣 = (1 , 0) e
𝑤 = (0 , 1) si ha
𝜑(𝑣 + 𝑤)2 + 𝜑(𝑣 − 𝑤)2 = 8 ≠ 4 = 2 𝜑(𝑣)2 + 2𝜑(𝑤)2 .
L’insieme 𝐵𝑅 (𝒙 0 ) = 𝒙 ∈ ℝ2 : 𝜑(𝒙 − 𝒙 0 ) < 𝑅 dei punti di ℝ2 che distano meno di

𝑅 dal punto 𝒙 0 (si veda la definizione 7.12) è un quadrato con le diagonali, di lunghezza
2𝑅 , parallele agli assi coordinati. Se come norma 𝜑 avessimo scelto la norma euclidea
canonica di ℝ2 l’insieme 𝐵𝑅 (𝒙 0 ) sarebbe risultato essere un cerchio di raggio 𝑅 centrato
in 𝒙 0 . In generale le norme indotte da un prodotto scalare si riconoscono dalla forma di
questi insiemi: solo quando si ottengono ellissi (o ellissoidi se siamo in dimensione più
alta) la norma è euclidea. Per le altre norme si potranno ottenere dei generici insiemi
convessi simmetrici rispetto al centro 𝒙 0 .
Esempio 7.9 (norma 𝑝 ). Per ogni 𝑝 ≥ 1 si può definire su ℝ𝑛 la norma
|𝑥1 | 𝑝 + |𝑥 2 | 𝑝 + · · · + |𝑥 𝑛 | 𝑝 .
p𝑝
|𝒙| 𝑝 =
Si può inoltre definire
|𝒙| ∞ = lim |𝒙| 𝑝 = max {|𝑥1 |, |𝑥2 |, . . . , |𝑥 𝑛 |}.

𝑝→+∞
Per 𝑝 = 2 si ottiene la norma euclidea della definizione 7.7 |𝑣| 2 = |𝑣| . Per 𝑝 = 1 su ℝ2
si ottiene la norma Manhattan. Per 𝑝 = +∞ si ottiene di nuovo la√norma Manhattan a
meno di una rotazione di 45 gradi e di un riscalamento di fattore 2:
𝑥1 − 𝑥2 𝑥1 + 𝑥2

|(𝑥1 , 𝑥2 )| ∞ = ,
2 2

1
Si potrebbe dimostrare che solo per 𝑝 = 2 la norma |𝒙| 𝑝 è indotta da un prodotto scalare
in quanto solo per 𝑝 = 2 è valida la proprietà del parallelogramma (7.4).
7.1 spazi metrici e topologia
Definizione 7.10 (distanza indotta). Se 𝑑 : 𝑋 × 𝑋 → ℝ è una distanza su 𝑋 e

𝐴 ⊆ 𝑋 allora restringendo 𝑑 a 𝐴 × 𝐴 si ottiene ancora (ovviamente) una distanza. Tale
distanza indotta
restrizione si chiama distanza indotta da 𝑋 su 𝐴. Dunque se 𝐴 è un sottoinsieme di
uno spazio metrico (𝑋 , 𝑑) anche 𝐴 ha una struttura di spazio metrico.
Esempio 7.11 (sfera). Se 𝑋 ⊆ ℝ𝑛 la distanza euclidea di ℝ𝑛 induce su 𝑋 una

struttura di spazio metrico. Se 𝑋 non è un sottospazio vettoriale di ℝ𝑛 abbiamo
sfera 𝑛 -dimensionale quindi esempi di spazi metrici che non sono spazi normati. Ad esempio la sfera
𝑛 -dimensionale
𝕊𝑛 = 𝒙 ∈ ℝ𝑛+1 : |𝒙| = 1

è uno spazio metrico con la distanza indotta da ℝ𝑛 .
Per 𝑛 = 1 si osserva che 𝕊1 è la circonferenza unitaria nel piano, per 𝑛 = 2 si ottiene

l’usuale sfera unitaria immersa nello spazio tridimensionale.
palla Definizione 7.12 (palla). Sia (𝑋 , 𝑑) uno spazio metrico. Per ogni 𝑟 > 0 e per ogni
𝑥0 ∈ 𝑋 definiamo la palla di raggio 𝑟 centrata in 𝑥0 come l’insieme
𝐵𝑟 (𝑥0 ) = {𝑥 ∈ 𝑋 : 𝑑(𝑥, 𝑥0 ) < 𝑟}.
aperto
Definizione 7.13 (relazioni e proprietà topologiche). Sia (𝑋 , 𝑑) uno spazio metrico.
chiuso Un insieme 𝐴 ⊆ 𝑋 si dirà essere un insieme aperto in 𝑋 se per ogni 𝑥 ∈ 𝐴 esiste
𝑟 > 0 tale che 𝐵𝑟 (𝑥) ⊆ 𝐴. Un insieme 𝐴 ⊆ 𝑋 si dirà essere un insieme chiuso in 𝑋 se
topologia il suo complementare 𝑋 \ 𝐴 è aperto.
La famiglia di tutti gli insiemi aperti si chiama topologia dello spazio metrico 𝑋 . Tutte
le definizioni che seguono non dipendono dalla distanza 𝑑 ma solamente dalla topologia:
basterà usare aperti qualunque al posto delle palle 𝐵𝑟 (𝑥).
punto interno
Se 𝐴 ⊆ 𝑋 è un insieme qualunque 𝑥 ∈ 𝑋 è un punto qualunque diremo che:
parte interna
7.1 spazi metrici e topologia 301
parte esterna di 𝐴
◦
𝐴 𝐴
𝜕𝐴 𝐴¯ 𝐴0
Figura 7.2: Un insieme 𝐴 e la sua parte
◦
interna 𝐴, parte esterna, frontiera 𝜕𝐴,
chiusura 𝐴¯ e punti di accumulazione 𝐴0 .
1. 𝑥 è punto interno ad 𝐴 se esiste 𝑟 > 0 tale che 𝐵𝑟 (𝑥) ⊆ 𝐴; chiameremo parte

◦
interna di 𝐴 l’insieme dei punti interni di 𝐴 e la denoteremo con 𝐴;
2. 𝐴 è un intorno di 𝑥 se 𝑥 è punto interno ad 𝐴 ovvero esiste 𝑟 > 0 tale che intorno
𝐵𝑟 (𝑥) ⊆ 𝐴;
3. 𝑥 è punto esterno ad 𝐴 se è interno al complementare di 𝐴 ovvero esiste 𝑟 > 0 punto esterno
tale che 𝐵𝑟 (𝑥) ∩ 𝐴 = ∅; chiameremo parte esterna di 𝐴 l’insieme dei punti
esterni ad 𝐴; parte esterna
4. 𝑥 è punto di frontiera per 𝐴 se non è né interno né esterno ad 𝐴 ovvero per ogni punto di frontiera
𝑟 > 0 l’insieme 𝐵𝑟 (𝑥) contiene punti di 𝐴 e di 𝑋 \ 𝐴; chiameremo frontiera (o
bordo) di 𝐴 l’insieme dei punti di frontiera che denoteremo con 𝜕𝐴. frontiera
5. 𝑥 è punto di aderenza di 𝐴 se è interno o di frontiera ovvero se per ogni 𝑟 > 0 punto di aderenza
si ha 𝐵𝑟 (𝑥) ∩ 𝐴 ≠ ∅; chiameremo chiusura di 𝐴 l’insieme dei punti di aderenza,
che denoteremo con 𝐴¯ ; chiusura
6. 𝑥 è punto di accumulazione di 𝐴 se è punto di aderenza per 𝐴 \ {𝑥} ovvero
punto di accumulazione
se per ogni 𝑟 > 0 l’insieme 𝐴 ∩ 𝐵𝑟 (𝑥) contiene punti diversi da 𝑥 , chiameremo
derivato di 𝐴 l’insieme dei punti di accumulazione (che si potrebbe denotare con derivato
𝐴0);
7. 𝑥 è punto isolato di 𝐴 se è un punto di 𝐴 ma non di accumulazione per 𝐴 cioè punto isolato
se esiste 𝑟 > 0 per cui 𝐵𝑟 (𝑥) ∩ 𝐴 = {𝑥}.
Teorema 7.14 (le palle sono aperte). Sia (𝑋 , 𝑑) uno spazio metrico, sia 𝑥 ∈ 𝑋 e
𝑟 > 0. Allora la palla 𝐵𝑟 (𝑥) è un insieme aperto in 𝑋 .
Dimostrazione. Sia 𝑦 ∈ 𝐵𝑟 (𝑥): è sufficiente trovare 𝜌 > 0 tale che 𝐵𝜌 (𝑦) ⊆ 𝐵𝑟 (𝑥).
Prendendo 𝜌 = 𝑟 − 𝑑(𝑦, 𝑥) si osserva che 𝜌 > 0 e, per la disuguaglianza
triangolare, dato 𝑧 ∈ 𝐵𝜌 (𝑦) si ha
𝑑(𝑧, 𝑥) ≤ 𝑑(𝑧, 𝑦) + 𝑑(𝑦, 𝑥) < 𝜌 + 𝑑(𝑦, 𝑥) = 𝑟
da cui 𝐵𝜌 (𝑦) ⊆ 𝐵𝑟 (𝑥) come volevamo dimostrare.
Teorema 7.15 (chiusura sequenziale). Sia (𝑋 , 𝑑) uno spazio metrico. Un insieme

𝐴 ⊆ 𝑋 è chiuso se e solo se per ogni successione 𝑎 𝑛 ∈ 𝐴 se 𝑎 𝑛 → 𝑎 ∈ 𝑋 allora 𝑎 ∈ 𝐴
(il limite di punti di 𝐴, se esiste, è un punto di 𝐴).
Dimostrazione. Supponiamo che 𝐴 sia chiuso e sia 𝑎 𝑘 ∈ 𝐴 una successione

convergente ad un punto di 𝑋 : 𝑎 𝑘 → 𝑎 . Dobbiamo mostrare che 𝑎 ∈ 𝐴. Per
definizione di convergenza sappiamo che per ogni 𝜀 > 0 esiste 𝐾 ∈ ℕ tale per
ogni 𝑘 > 𝐾 si ha 𝑑(𝑎 𝑘 , 𝑎) < 𝜀 e quindi 𝑎 𝑘 ∈ 𝐵 𝜀 (𝑎). In particolare 𝐴 ∩ 𝐵 𝜀 (𝑎) ≠ ∅.
Risulta quindi che 𝑎 non è esterno ad 𝐴 e quindi, essendo 𝐴 chiuso, 𝑎 ∈ 𝐴.
Supponiamo che 𝐴 non sia chiuso e verifichiamo che in tal caso si può trovare
una successione 𝑎 𝑘 di punti di 𝐴 che converge 𝑎 𝑘 → 𝑎 ad un punto 𝑎 ∉ 𝐴. Se 𝐴
non è chiuso significa che c’è un punto 𝑎 ∈ 𝑋 \ 𝐴 che non è esterno ad 𝐴. Ciò
vuol dire che per ogni 𝑟 > 0 l’insieme 𝐵𝑟 (𝑦) ∩ 𝐴 è non vuoto. Per ogni 𝑘 ∈ ℕ
posso allora scegliere 𝑟 = 1/𝑘 e quindi so che esiste un punto 𝑎 𝑘 ∈ 𝐵𝑟 (𝑎) ∩ 𝐴
ovvero 𝑎 𝑘 ∈ 𝐴 e 𝑑(𝑎 𝑘 , 𝑎) < 1/𝑘 . Dunque 𝑎 𝑘 → 𝑎 con 𝑎 𝑘 ∈ 𝐴 ma 𝑎 ∉ 𝐴, come
Definizione 7.16 (continuità). Una funzione 𝑓 : 𝑋 → 𝑌 definita tra due spazi metrici
sequenzialmente continua
si dice essere sequenzialmente continua nel punto 𝑥 ∈ 𝑋 se per ogni successione
convergente 𝑥 𝑛 → 𝑥 in risulta che 𝑓 (𝑥 𝑛 ) → 𝑓 (𝑥). Diremo che 𝑓 è sequenzialmente
continua se è sequenzialmente continua in ogni punto 𝑥 del suo dominio 𝑋 .
continua
Una funzione 𝑓 : 𝑋 → 𝑌 definita tra due spazi metrici si dice essere continua in un
punto 𝑥 ∈ 𝑋 se
∀𝜀 > 0 : ∃𝛿 > 0 : ∀𝑦 ∈ 𝑋 : 𝑑(𝑥, 𝑦) < 𝛿 =⇒ 𝑑( 𝑓 (𝑥), 𝑓 (𝑦)) < 𝜀. (7.5)
Diremo che 𝑓 è continua se è continua in ogni punto 𝑥 del suo dominio.
Anche in questo caso abbiamo considerato due diverse nozioni di continuità che
in generale (in spazi topologici) potrebbero non coincidere ma nel caso degli
spazi metrici sono equivalenti, come dimostriamo nel seguente teorema.
Teorema 7.17 (definizioni equivalenti di continuità). Sia 𝑓 : 𝑋 → 𝑌 una funzione

definita tra due spazi metrici 𝑋 e 𝑌 . Allora 𝑓 è sequenzialmente continua in un punto
𝑥 ∈ 𝑋 se e solo se è continua nel punto 𝑥 .
Inoltre 𝑓 è continua se e solo se per ogni 𝐴 aperto in 𝑌 risulta che 𝑓 −1 (𝐴) è aperto in
𝑋 (la controimmagine di un aperto è aperta).
Dimostrazione. Supponiamo che 𝑓 sia sequenzialmente continua in 𝑥 e, per

assurdo, supponiamo che 𝑓 non sia continua nello stesso punto 𝑥 . Allora
negando (7.5) otteniamo che esiste 𝜀 > 0 tale che per ogni 𝛿 > 0 in particolare
per ogni 𝛿 = 1𝑘 con 𝑘 ∈ ℕ esiste un punto 𝑦 𝑘 tale che 𝑑(𝑦 𝑘 , 𝑥) < 1𝑘 ma
𝑑( 𝑓 (𝑦 𝑘 ), 𝑓 (𝑥)) ≥ 𝜀. Significa che 𝑦 𝑘 → 𝑥 e quindi, se 𝑓 è sequenzialmente
continua, dovrebbe essere 𝑓 (𝑦 𝑘 ) → 𝑓 (𝑥). Ma questo è in contraddizione con la
condizione 𝑑( 𝑓 (𝑦 𝑘 ), 𝑓 (𝑥)) ≥ 𝜀.
Viceversa supponiamo che 𝑓 sia continua in 𝑥 e consideriamo una qualunque
successione 𝑥 𝑘 → 𝑥 . Per dimostrare che 𝑓 (𝑥 𝑘 ) → 𝑓 (𝑥) dobbiamo verificare che
per ogni 𝜀 > 0 esiste 𝐾 ∈ ℕ tale che per ogni 𝑘 > 𝐾 si ha 𝑑( 𝑓 (𝑥 𝑘 ), 𝑓 (𝑥)) < 𝜀. Ma
dalla continuità di 𝑓 , dato 𝜀 > 0 sappiamo esistere 𝛿 > 0 per cui se 𝑑(𝑦, 𝑥) < 𝛿
allora 𝑑( 𝑓 (𝑦), 𝑓 (𝑥)) < 𝜀. Visto che 𝑥 𝑘 → 𝑥 certamente esiste 𝐾 ∈ ℕ tale che
per ogni 𝑘 > 𝐾 si ha |𝑥 𝑘 − 𝑥| < 𝛿 e quindi | 𝑓 (𝑥 𝑘 ) − 𝑓 (𝑥)| < 𝜀 come volevamo
dimostrare.
7.1 spazi metrici e topologia 303
Mostriamo ora che se 𝑓 è continua e 𝐴 è aperto in 𝑌 allora 𝑓 −1 (𝐴) è aperto in

𝑋 . Dato un punto qualunque 𝑥0 ∈ 𝑓 −1 (𝐴) sappiamo che 𝑓 (𝑥0 ) ∈ 𝐴 dunque,
essendo 𝐴 aperto, esiste 𝜀 > 0 tale che 𝐵 𝜀 ( 𝑓 (𝑥 0 )) ⊆ 𝐴. Per la continuità di 𝑓
esiste allora 𝛿 > 0 tale che se |𝑥 − 𝑥 0 | < 𝛿 allora | 𝑓 (𝑥) − 𝑓 (𝑥 0 )| < 𝜀 e quindi
𝑓 (𝑥) ∈ 𝐴. Significa che 𝐵 𝛿 (𝑥0 ) ⊆ 𝑓 −1 (𝐴). Questo è vero per ogni 𝑥0 ∈ 𝑓 −1 (𝐴)
quindi tale insieme è aperto.
Viceversa supponiamo che la controimmagine di ogni aperto sia un aperto e
dimostriamo che la funzione è continua in ogni punto. Preso un punto 𝑥 0 ∈ 𝑋
e un 𝜀 > 0 consideriamo l’aperto 𝐵 𝜀 ( 𝑓 (𝑥 0 )). La sua controimmagine è l’insieme
{𝑥 : | 𝑓 (𝑥) − 𝑓 (𝑥0 )| < 𝜀} e per ipotesi sappiamo che è aperto. Significa allora che
esiste 𝛿 > 0 tale 𝐵 𝛿 (𝑥 0 ) è contenuto in tale insieme, ovvero per ogni 𝑥 ∈ 𝐵 𝛿 (𝑥 0 )
cioè |𝑥 − 𝑥 0 | < 𝛿 risulta 𝑓 (𝑥) ∈ 𝐵 𝜀 ( 𝑓 (𝑥 0 )) cioè | 𝑓 (𝑥) − 𝑓 (𝑥 0 )| < 𝜀. Abbiamo
quindi verificato la definizione di continuità nel punto 𝑥 0 .
Definizione 7.18 (spazi limitati). Sia 𝑋 uno spazio metrico o un sottoinsieme di

uno sottospazio metrico. Si dirà che 𝑋 è limitato se è contenuto in una palla ovvero se limitato
esiste 𝑥 0 ∈ 𝑋 e 𝑅 > 0 tale che 𝑋 ⊆ 𝐵𝑅 (𝑥 0 ).
Definizione 7.19 (compattezza sequenziale). Sia 𝑋 uno spazio metrico o un

sottoinsieme di uno spazio metrico. Si dirà che 𝑋 è sequenzialmente compatto se da
sequenzialmente compatto
ogni successione 𝑥 𝑘 ∈ 𝑋 è possibile estrarre una sottosuccessione 𝑥 𝑘 𝑗 → 𝑥 convergente
ad un punto 𝑥 ∈ 𝑋 .
La definizione più generale di compattezza viene data negli spazi topologici.

Nel contesto generale compattezza e compattezza sequenziale sono concetti
diversi ma nell’ambito degli spazi metrici i due concetti coincidono. Per questo
potremo scrivere più brevemente compatto al posto di sequenzialmente compatto
compatto
quando lavoriamo negli spazi metrici.
Il teorema di Bolzano-Weierstrass afferma che gli intervalli [𝑎, 𝑏] con 𝑎, 𝑏 ∈ ℝ
sono compatti. Più in generale si può dimostrare che tutti gli insiemi chiusi
e limitati di ℝ𝑛 sono compatti. In generale questo risultato non è vero in
qualunque spazio metrico (un esempio negativo è dato dalla convergenza
uniforme, come vedremo più avanti) ma l’implicazione inversa è sempre vera,
come enunciato nel seguente teorema.
Teorema 7.20. Se 𝐴 è un sottoinsieme sequenzialmente compatto di uno spazio metrico

𝑋 allora 𝐴 è chiuso e limitato.
Dimostrazione. Chiaramente 𝐴 è chiuso in quanto presa una successione 𝑥 𝑘 ∈ 𝐴

convergente a punto 𝑥 ∈ 𝑋 sappiamo che esiste una sottosuccessione conver-
gente ad un punto di 𝐴. Ma necessariamente ogni sottosuccessione converge ad
𝑥 quindi 𝑥 ∈ 𝐴. Se 𝐴 non fosse limitato fissato 𝑎 ∈ 𝐴 per ogni 𝑘 ∈ ℕ dovrebbe
esistere un punto 𝑥 𝑘 ∈ 𝐴 tale che 𝑥 𝑘 ∉ 𝐵 𝑘 (𝑎) cioè 𝑑(𝑥 𝑘 , 𝑎) > 𝑘 . Supponiamo
allora che esista una sottosuccessione convergente 𝑥 𝑘 𝑗 → 𝑥 ∈ 𝐴. Allora per la
disuguaglianza triangolare inversa si avrebbe
𝑑(𝑥, 𝑎) ≥ 𝑑(𝑥 𝑘 𝑗 , 𝑎) − 𝑑(𝑥 𝑘 𝑗 , 𝑥) ≥ 𝑘 𝑗 − 𝑑(𝑥 𝑘 𝑗 , 𝑥) → +∞ − 0 = +∞.
Ma questo è assurdo in quanto 𝑑(𝑥, 𝑎) ∈ ℝ.

Teorema 7.21 (Weierstrass: le funzioni continue mandano compatti in compatti).

Sia 𝑓 : 𝑋 → 𝑌 una funzione continua tra due spazi metrici 𝑋 e 𝑌 . Se 𝐾 ⊆ 𝑋 è
sequenzialmente compatto allora anche 𝑓 (𝐾) è sequenzialmente compatto.
Dimostrazione. Sia 𝑦 𝑘 ∈ 𝑓 (𝐾) una qualunque successione. Allora esiste 𝑥 𝑘 ∈ 𝐾

tale che 𝑓 (𝑥 𝑘 ) = 𝑦 𝑘 . Essendo 𝐾 compatto possiamo estrarre una sottosuccessione
convergente: 𝑥 𝑘 𝑗 → 𝑥 . Essendo 𝑓 continua si ha
𝑦 𝑘 𝑗 = 𝑓 (𝑥 𝑘 𝑗 ) → 𝑓 (𝑥) ∈ 𝑓 (𝐾).
Nel caso 𝑋 = 𝑌 = ℝ recuperiamo l’usuale teorema di Weierstrass, in quanto

se 𝑓 : [𝑎, 𝑏] → ℝ è continua essendo [𝑎, 𝑏] compatto risulta che 𝑓 ([𝑎, 𝑏]) è
compatto. Ma i compatti di ℝ sono chiusi e limitati quindi hanno massimo e
minimo in quanto l’estremo superiore e l’estremo inferiore sono finiti e sono
punti di aderenza dell’insieme.
uniformemente continua
Definizione 7.22 (uniforme continuità). Sia 𝑓 : 𝑋 → 𝑌 una funzione definita tra
due spazi metrici 𝑋 e 𝑌 . Diremo che 𝑓 è uniformemente continua se
Heine-Cantor ∀𝜀 > 0 : ∃𝛿 > 0 : 𝑑(𝑥, 𝑥 0) < 𝛿 =⇒ 𝑑( 𝑓 (𝑥), 𝑓 (𝑥 0)) < 𝜀.
Teorema 7.23 (Heine-Cantor). Sia 𝑋 uno spazio metrico sequenzialmente compatto e

𝑌 uno spazio metrico. Sia 𝑓 : 𝑋 → 𝑌 una funzione continua. Allora 𝑓 è uniformemente
continua.
Dimostrazione. La dimostrazione è identica a quella già fatta nel corrispondente

teorema 5.54 per le funzioni di variabile reale.
successione di Cauchy
7.2 completezza
Definizione 7.24 (successioni di Cauchy). Sia (𝑋 , 𝑑) uno spazio metrico e 𝑥 𝑘 una

successione di punti di 𝑋 . Diremo che 𝑥 𝑘 è una successione di Cauchy se
∀𝜀 > 0 : ∃𝑛 ∈ ℕ : ∀𝑗 > 𝑛 : ∀𝑘 > 𝑛 : 𝑑(𝑥 𝑗 , 𝑥 𝑘 ) < 𝜀.
La proprietà che definisce le successioni di Cauchy si potrebbe anche scrivere

così:
lim sup 𝑑(𝑥 𝑗 , 𝑥 𝑘 ) = 0.
𝑘→+∞ 𝑗≥𝑘
Teorema 7.25 (le successioni convergenti sono di Cauchy). Sia 𝑥 𝑘 → 𝑥 una

successione convergente in uno spazio metrico (𝑋 , 𝑑). Allora 𝑥 𝑘 è di Cauchy.
7.2 completezza 305
Dimostrazione. Per definizione se 𝑥 𝑘 → 𝑥 si ha
∀𝜀 > 0 : ∃𝑛 ∈ ℕ : ∀𝑘 > 𝑛 : 𝑑(𝑥 𝑘 , 𝑥) < 𝜀.
Applicando la disuguaglianza triangolare, per ogni 𝑗, 𝑘 > 𝑛 si ottiene il risultato

desiderato:
𝑑(𝑥 𝑗 , 𝑥 𝑘 ) ≤ 𝑑(𝑥 𝑘 , 𝑥) + 𝑑(𝑥, 𝑥 𝑗 ) ≤ 2 𝜀.
completezza
Definizione 7.26 (completezza). Uno spazio metrico (𝑋 , 𝑑) si dice essere completo
completo
se ogni successione di Cauchy è convergente.
Il prototipo di spazio metrico completo è ℝ, come vedremo nel teorema 7.30.

Un esempio di spazio metrico√non completo è ℚ. Infatti se prendiamo una
successione 𝑞 𝑛 ∈ ℚ con 𝑞 𝑛 → 2 la successione 𝑞 𝑛 è convergente in ℝ e quindi
è di Cauchy in ℝ. Ma visto che 𝑞 𝑛 ∈ ℚ risulta che 𝑞 𝑛 è di Cauchy anche in ℚ (la
√ di Cauchy è la stessa). Ma in ℚ tale successione non converge in
condizione
quanto 2 ∉ ℚ.
Definizione 7.27 (spazio di Banach). Uno spazio vettoriale normato si dice essere spazio di Banach
uno spazio di Banach se, come spazio metrico, risulta essere completo. Se la norma è
euclidea, cioè deriva da un prodotto scalare, lo spazio si dirà spazio di Hilbert. spazio di Hilbert
Lemma 7.28. Ogni successione di Cauchy è limitata (più precisamente: se 𝑥 𝑛 è una

successione di Cauchy in uno spazio metrico 𝑋 allora l’insieme {𝑥 𝑛 : 𝑛 ∈ ℕ } è un
insieme limitato).
Dimostrazione. Sia 𝑥 𝑘 ∈ ℝ una successione di Cauchy. Fissato 𝜀 = 1 sappiamo

che esiste 𝑁 ∈ ℕ per cui per ogni 𝑘, 𝑗 > 𝑁 si ha 𝑑(𝑥 𝑘 , 𝑥 𝑗 ) < 1. In particolare per
ogni 𝑘 > 𝑁 si ha
𝑑(𝑥 𝑘 , 𝑥 𝑁+1 ) < 1.
Dunque posto
𝑅 = max {𝑑(𝑥0 , 𝑥1 ), 𝑑(𝑥0 , 𝑥2 ), . . . , 𝑑(𝑥0 , 𝑥 𝑁 ), 𝑑(𝑥0 , 𝑥 𝑁+1 ) + 1}
si osserva che per ogni 𝑘 ∈ ℕ si ha 𝑑(𝑥 0 , 𝑥 𝑘 ) ≤ 𝑅 < 𝑅 + 1 in quanto se 𝑘 ≤ 𝑁

abbiamo scelto appositamente 𝑅 in modo che sia più grande di 𝑑(𝑥 0 , 𝑥 𝑘 ) e se
𝑘 > 𝑁 allora
𝑑(𝑥0 , 𝑥 𝑘 ) ≤ 𝑑(𝑥0 , 𝑥 𝑁+1 ) + 𝑑(𝑥 𝑁+1 , 𝑥 𝑘 ) ≤ 𝑑(𝑥0 , 𝑥 𝑁+1 ) + 1 ≤ 𝑅.
Significa quindi che per ogni 𝑥 ∈ ℕ si ha 𝑥 𝑘 ∈ 𝐵𝑅+1 (𝑥 0 ) che è la definizione di

limitatezza in uno spazio metrico.
Lemma 7.29. Se una successione di Cauchy ha una sottosuccessione convergente,

allora l’intera successione è convergente.
Dimostrazione. Sia 𝑥 𝑘 la successione di Cauchy e sia 𝑥 𝑘 𝑗 → 𝑥 una sottosucces-

sione convergente. Allora per ogni 𝜀 > 0 esiste 𝑚 tale che se 𝑘, 𝑗 > 𝑚 allora
𝑑(𝑥 𝑘 , 𝑥 𝑗 ) < 𝜀. Visto che 𝑥 𝑘 𝑗 → 𝑥 possiamo trovare 𝑗 tale che 𝑘 𝑗 > 𝑚 e tale che
𝑑(𝑥 𝑘 𝑗 , 𝑥) < 𝜀. Ma allora
𝑑(𝑥 𝑘 , 𝑥) ≤ 𝑑(𝑥 𝑘 , 𝑥 𝑘 𝑗 ) + 𝑑(𝑥 𝑘 𝑗 , 𝑥) ≤ 2 𝜀.
E questo è vero per ogni 𝑘 > 𝑚 da cui risulta verificata la definizione di limite
𝑥 𝑘 → 𝑥.
ℝ è completo
Teorema 7.30 (completezza di ℝ). ℝ è completo.
Dimostrazione. Dobbiamo dimostrare che se 𝑥 𝑘 è una successione di Cauchy in

ℝ allora 𝑥 𝑘 converge. Per il lemma 7.28 sappiamo che 𝑥 𝑘 è limitata. Ma allora per
il teorema di Bolzano-Weierstrass sappiamo che 𝑥 𝑘 ha una estratta convergente.
Grazie al lemma 7.29 possiamo quindi concludere che la successione 𝑥 𝑘 è essa
stessa convergente.
Corollario 7.31 (completezza di ℝ𝑛 e ℂ). Gli spazi ℝ𝑛 e ℂ (con la usuale distanza

euclidea) sono completi.
Dimostrazione. Basta osservare che la convergenza (o la condizione di Cauchy)

di una successione in ℝ𝑛 si ha se e solo se ogni componente è convergente (o
di Cauchy) in ℝ. Dunque essendo ℝ completo anche ℝ𝑛 lo è. Come spazio
metrico ℂ è isomorfo ad ℝ2 dunque anch’esso è completo.
Teorema 7.32 (completezza dei compatti). Ogni spazio metrico compatto è completo.
Dimostrazione. Visto che lo spazio è compatto ogni successione di Cauchy

ammette una sottosuccessione convergente. Ma allora, grazie al lemma 7.29,
l’intera successione converge e dunque lo spazio è completo.
Teorema 7.33 (chiusi in spazi compatti e in spazi completi). Sia (𝑋 , 𝑑) uno spazio
metrico e sia 𝐴 ⊆ 𝑋 un sottoinsieme chiuso in 𝑋 . Se 𝑋 è compatto allora anche 𝐴 è
compatto, se 𝑋 è completo allora anche 𝐴 è completo.
Dimostrazione. Se 𝑋 è compatto da ogni successione in 𝐴 si può estrarre una

sottosuccessione convergente ad un punto di 𝑋 . Ma siccome 𝐴 è chiuso il punto
sta in 𝐴 e dunque la sottosuccessione è convergente in 𝐴.
Una successione di Cauchy in 𝐴 è di Cauchy anche in 𝑋 . Se 𝑋 è completo

tale successione converge ad un punto di 𝑋 . Se 𝐴 è chiuso tale punto è in 𝐴 e
dunque la successione converge in 𝐴.
Teorema 7.34 (estendibilità delle funzioni uniformemente continue). Sia 𝑓 : 𝐴 ⊆

𝑋 → 𝑌 una funzione definita su un sottoinsieme 𝐴 di uno spazio metrico 𝑋 a valori
in uno spazio metrico completo 𝑌 (ad esempio 𝑋 = ℝ e 𝑌 = ℝ). Se 𝑓 è uniformemente
continua allora esiste una unica funzione continua 𝑓˜ : 𝐴¯ → 𝑌 tale che per ogni 𝑥 ∈ 𝐴
si ha 𝑓˜(𝑥) = 𝑓 (𝑥). Inoltre 𝑓˜ è anch’essa uniformemente continua.
7.2 completezza 307
Dimostrazione. La prima osservazione è che se una funzione 𝑓 è uniformemente

continua allora 𝑓 manda successioni di Cauchy in successioni di Cauchy. Infatti
se 𝑓 è uniformemente continua si ha
∀𝜀 > 0 : ∃𝛿 > 0 : 𝑑(𝑥, 𝑦) < 𝛿 =⇒ 𝑑( 𝑓 (𝑥), 𝑓 (𝑦)) < 𝜀
e se 𝑎 𝑛 è di Cauchy si ha
∃𝑁 ∈ ℕ : 𝑘, 𝑗 > 𝑁 =⇒ 𝑑(𝑎 𝑘 , 𝑎 𝑗 ) < 𝛿
dunque mettendo insieme le due proprietà si ottiene la condizione di Cauchy

per 𝑓 (𝑎 𝑘 ):
∀𝜀 > 0 : ∃𝑁 ∈ ℕ : 𝑘, 𝑗 > 𝑁 =⇒ 𝑑( 𝑓 (𝑎 𝑘 ), 𝑓 (𝑎 𝑗 )) < 𝜀.
Preso un punto 𝑥 ∈ 𝐴¯ esiste certamente 𝑎 𝑛 ∈ 𝐴 con 𝑎 𝑛 → 𝑥 . Vogliamo

dimostrare che 𝑓 (𝑎 𝑛 ) ha limite in 𝑌 e che tale limite non dipende dalla successione
𝑎 𝑛 scelta. Se 𝑎 𝑛 → 𝑎 allora 𝑎 𝑛 è di Cauchy in 𝑋 (teorema 7.25). Per quanto
detto prima possiamo affermare che anche 𝑓 (𝑎 𝑛 ) è di Cauchy e quindi converge
in 𝑌 , in quanto 𝑌 è completo per ipotesi. Inoltre il lim 𝑓 (𝑎 𝑛 ) non dipende
dalla successione scelta perché se 𝑏 𝑛 → 𝑥 fosse un’altra successione potremmo
costruire una successione 𝑐 𝑛 che alterna i punti di 𝑎 𝑛 e 𝑏 𝑛 (ponendo, ad esempio,
𝑐2𝑛 = 𝑎 𝑛 e 𝑐 2𝑛+1 = 𝑏 𝑛 ). Anche 𝑐 𝑛 → 𝑥 ed è di Cauchy, dunque 𝑓 (𝑐 𝑛 ) converge.
Ma 𝑓 (𝑎 𝑛 ) e 𝑓 (𝑏 𝑛 ) sono sotto-successioni di 𝑓 (𝑐 𝑛 ) e dunque convergono allo
stesso limite. Abbiamo quindi dimostrato che per ogni 𝑥 ∈ 𝐴¯ esiste ℓ ∈ 𝑌 tale
che se 𝑎 𝑛 → 𝑥 , 𝑎 𝑛 ∈ 𝐴 allora 𝑓 (𝑎 𝑛 ) → ℓ . Possiamo quindi definire 𝑓˜(𝑥) = ℓ . Se
esiste una estensione continua di 𝑓 non può che essere definita in questo modo,
in quanto le funzioni continue mandano successioni convergenti in successioni
convergenti.
D’altra parte possiamo dimostrare che 𝑓˜ è una funzione uniformemente continua.

Infatti per ogni 𝜀 > 0 possiamo scegliere 𝛿 > 0 dato dall’uniforme continuità
di 𝑓 : dati 𝑥, 𝑦 ∈ 𝐴¯ con 𝑑(𝑥, 𝑦) < 𝛿/3 esisteranno 𝑥 𝑛 , 𝑦𝑛 ∈ 𝐴 con 𝑥 𝑛 → 𝑥 ,
𝑦𝑛 → 𝑦 . Si potrà quindi trovare 𝑛 sufficientemente grande in modo che
𝑑(𝑥 𝑛 , 𝑥) < 𝛿/3, 𝑑(𝑦𝑛 , 𝑦) < 𝛿/3, 𝑑( 𝑓 (𝑥 𝑛 ), 𝑓˜(𝑥)) < 𝜀, 𝑑( 𝑓 (𝑦𝑛 ), 𝑓˜(𝑦)) < 𝜀. Si avrà
allora 𝑑(𝑥 𝑛 , 𝑦𝑛 ) < 𝑑(𝑥 𝑛 , 𝑥) + 𝑑(𝑥, 𝑦) + 𝑑(𝑦, 𝑦𝑛 ) < 𝛿 , dunque 𝑑( 𝑓 (𝑥 𝑛 ), 𝑓 (𝑦𝑛 )) < 𝜀
e in conclusione
𝑑( 𝑓 (𝑥), 𝑓 (𝑦)) ≤ 𝑑( 𝑓 (𝑥), 𝑓 (𝑥 𝑛 )) + 𝑑( 𝑓 (𝑥 𝑛 ), 𝑓 (𝑦𝑛 )) + 𝑑( 𝑓 (𝑦𝑛 ), 𝑓 (𝑦)) ≤ 3𝜀.
Abbiamo quindi dimostrato l’uniforme continuità di 𝑓˜ con 3 𝜀 al posto di 𝜀 e

𝛿/3 al posto di 𝛿.
Definizione 7.35 (lipschitz). Sia 𝑓 : 𝑋 → 𝑌 una funzione definita tra due spazi
metrici e sia 𝐿 ≥ 0. Dato 𝐿 ≥ 0 diremo che 𝑓 è 𝐿-lipschitziana se per ogni 𝑥, 𝑦 ∈ 𝑋 si
ha
𝑑( 𝑓 (𝑥), 𝑓 (𝑦)) ≤ 𝐿 · 𝑑(𝑥, 𝑦).
Diremo che 𝑓 è lipschitziana se esiste 𝐿 ≥ 0 tale che 𝑓 sia 𝐿-lipschitziana.
Teorema 7.36. Se 𝑓 : 𝑋 → 𝑌 è lipschitziana allora 𝑓 è sequenzialmente continua, cioè
𝑥 𝑘 → 𝑥 =⇒ 𝑓 (𝑥 𝑘 ) → 𝑓 (𝑥).
Dimostrazione. Se 𝑥 𝑘 → 𝑥 significa che 𝑑(𝑥 𝑘 , 𝑥) → 0, quindi
𝑑( 𝑓 (𝑥 𝑘 ), 𝑓 (𝑥)) ≤ 𝐿 · 𝑑(𝑥 𝑘 , 𝑥) → 0.
Osserviamo che la distanza 𝑑(𝑥, 𝑦) di uno spazio metrico 𝑋 risulta sempre

essere una funzione 1-lipschitziana rispetto ad ognuna delle due variabili 𝑥 e 𝑦 .
Infatti per la disuguaglianza triangolare inversa si ha
|𝑑(𝑥 1 , 𝑦) − 𝑑(𝑥2 , 𝑦)| ≤ 𝑑(𝑥1 , 𝑥2 ).
Di conseguenza la norma di uno spazio normato è anch’essa 1-lipschitziana. In

particolare la distanza e la norma risultano essere funzioni continue.
teor. contrazioni
Teorema 7.37 (delle contrazioni o punto fisso di Banach-Caccioppoli). Sia 𝑋
uno spazio metrico completo non vuoto e sia 𝑓 : 𝑋 → 𝑋 una funzione 𝐿-lipschitziana
con 𝐿 < 1 (diremo che 𝑓 è una contrazione). Allora esiste ed è unico un punto 𝑥 ∈ 𝑋
tale che 𝑓 (𝑥) = 𝑥 .
Dimostrazione. Si consideri un qualunque punto 𝑝 ∈ 𝑋 e si definisca la

successione 𝑥 𝑘 ∈ 𝑋 tramite la definizione ricorsiva
(
𝑥0 = 𝑝
𝑥 𝑘+1 = 𝑓 (𝑥 𝑘 ).
Visto che 𝑓 è 𝐿-lipschitziana si avrà
𝑑(𝑥2 , 𝑥1 ) = 𝑑( 𝑓 (𝑥1 ), 𝑓 (𝑥0 )) ≤ 𝐿 · 𝑑(𝑥1 , 𝑥0 )

𝑑(𝑥3 , 𝑥2 ) = 𝑑( 𝑓 (𝑥2 ), 𝑓 (𝑥1 )) ≤ 𝐿 · 𝑑(𝑥2 , 𝑥1 ) ≤ 𝐿2 · 𝑑(𝑥1 , 𝑥0 )
𝑑(𝑥4 , 𝑥3 ) = 𝑑( 𝑓 (𝑥3 ), 𝑓 (𝑥2 )) ≤ 𝐿 · 𝑑(𝑥3 , 𝑥2 ) ≤ 𝐿3 · 𝑑(𝑥1 , 𝑥0 )
..
.
possiamo quindi dimostrare induttivamente che per ogni 𝑚 ∈ ℕ si ha
𝑑(𝑥 𝑚+1 , 𝑥 𝑚 ) ≤ 𝐿𝑚 · 𝑑(𝑥 1 , 𝑥0 ).
Ma allora per ogni 𝑘 ∈ ℕ e per ogni 𝑗 > 𝑘 utilizzando la disuguaglianza

triangolare e facendo la somma della progressione geometrica si ha
𝑗−1 𝑗−1
𝐿𝑘 − 𝐿 𝑗
𝐿𝑚 · 𝑑(𝑥1 , 𝑥0 ) =
X X
𝑑(𝑥 𝑘 , 𝑥 𝑗 ) ≤ 𝑑(𝑥 𝑚 , 𝑥 𝑚+1 ) ≤ 𝑑(𝑥1 , 𝑥0 ).
𝑚=𝑘 𝑚=𝑘
1−𝐿
Visto che 𝐿 < 1 se 𝑘 → +∞ e 𝑗 > 𝑘 questa quantità tende a zero e quindi risulta
che 𝑥 𝑘 è una successione di Cauchy. Essendo per ipotesi 𝑋 completo sappiamo
7.3 convergenza uniforme 309
che la successione converge 𝑥 𝑘 → 𝑥 ad un punto 𝑥 ∈ 𝑋 . Per la continuità di 𝑓 ,

passando al limite nell’equazione 𝑥 𝑘+1 = 𝑓 (𝑥 𝑘 ) si ottiene 𝑥 = 𝑓 (𝑥). Abbiamo
quindi trovato un punto fisso. Se 𝑦 ∈ 𝑋 fosse un altro punto fisso si avrebbe:
𝑑(𝑥, 𝑦) = 𝑑( 𝑓 (𝑥), 𝑓 (𝑦)) ≤ 𝐿 · 𝑑(𝑥, 𝑦)
che è assurdo se 𝐿 < 1 e 𝑥 ≠ 𝑦 .
7.3 convergenza uniforme
Definizione 7.38 (convergenza uniforme). Sia 𝐴 un insieme non vuoto e 𝑓 : 𝐴 → ℝ.

Definiamo la norma uniforme (o norma del sup) di 𝑓 come
norma uniforme
k 𝑓 k ∞ = sup | 𝑓 (𝑥)|
𝑥∈𝐴
Se anche 𝑔 : 𝐴 → ℝ definiamo la distanza uniforme tra 𝑓 e 𝑔 come

distanza uniforme
𝑑∞ ( 𝑓 , 𝑔) = sup | 𝑓 (𝑥) − 𝑔(𝑥)|.

𝑥∈𝐴
Se 𝑓 𝑘 è una successione di funzioni e 𝑓 è una funzione, diremo che 𝑓 𝑘 converge

uniformemente a 𝑓 e scriveremo
convergenza uniforme
𝑓𝑘 ⇒ 𝑓
se 𝑑∞ ( 𝑓 𝑘 , 𝑓 ) → 0.
Esempio 7.39. La successione

r
1
𝑓 𝑘 (𝑥) = 𝑥2 +
𝑘
converge uniformemente (su tutto ℝ) alla funzione 𝑓 (𝑥) = |𝑥| . Infatti posto 𝑔 𝑘 (𝑥) =
𝑓 𝑘 (𝑥) − 𝑓 (𝑥), la funzione 𝑔 𝑘 risulta essere derivabile per 𝑥 ≠ 0 e per 𝑥 > 0 si ha
𝑥
𝑔 0𝑘 (𝑥) = q − 1 < 0.
𝑥2 + 1
𝑘
Dunque la funzione 𝑔 𝑘 è decrescente su [0 , +∞). Per simmetria (è una funzione pari) è

crescente su (−∞, 0]. Risulta quindi che il massimo di 𝑔 𝑘 è in 𝑥 = 0. Chiaramente
𝑔 𝑘 ≥ 0 quindi si ha:
1
k 𝑓 𝑘 − 𝑓 k ∞ = sup 𝑔 𝑘 (𝑥) = 𝑔 𝑘 (0) = √ → 0.
𝑥∈ℝ 𝑘
Dunque 𝑓 𝑘 ⇒ 𝑓 .
Osserviamo che in generale k 𝑓 k ∞ e 𝑑∞ ( 𝑓 , 𝑔) possono assumere il valore +∞

(ad esempio se 𝐴 = ℝ, 𝑓 (𝑥) = 𝑥 e 𝑔(𝑥) = 0) e quindi non è detto che siano
effettivamente una norma e una distanza.
Teorema 7.40 (proprietà della norma uniforme). La norma uniforme soddisfa tutte
le proprietà di una norma (Definizione 7.4), salvo il fatto che può assumere valori in
[0 , +∞] invece che in [0 , +∞).
Dimostrazione. Chiaramente la norma uniforme non assume valori negativi

in quanto estremo superiore di un insieme (non vuoto) di numeri reali non
negativi. Inoltre se k 𝑓 k ∞ = 0 significa che | 𝑓 (𝑥)| = 0 per ogni 𝑥 e dunque 𝑓 = 0
(proprietà di separazione).
L’omogenità segue dall’omogeneità del valore assoluto, in quanto si ha
sup |(𝜆 · 𝑓 )(𝑥)| = sup |𝜆 · 𝑓 (𝑥)| = sup |𝜆| · | 𝑓 (𝑥)| = |𝜆| · sup | 𝑓 (𝑥)|.
𝑥∈𝐴 𝑥∈𝐴 𝑥∈𝐴 𝑥∈𝐴
La disuguaglianza triangolare segue dalla disuguaglianza triangolare del valore

assoluto, che viene preservata facendone l’estremo superiore:
sup | 𝑓 (𝑥) + 𝑔(𝑥)| ≤ sup [| 𝑓 (𝑥)| + | 𝑔(𝑥)|] ≤ sup | 𝑓 (𝑥)| + sup | 𝑔(𝑥)|.
𝑥∈𝐴 𝑥∈𝐴 𝑥∈𝐴 𝑥∈𝐴
Teorema 7.41. Sia 𝐴 un insieme. Lo spazio vettoriale delle funzioni limitate 𝑓 : 𝐴 → ℝ

(cioè delle funzioni con norma uniforme finita)
B(𝐴) = 𝑓 ∈ ℝ𝐴 : k 𝑓 k ∞ < +∞

dotato della norma uniforme k·k ∞ risulta essere uno spazio di Banach (ovvero uno
spazio vettoriale normato e completo). Su tale spazio di Banach la distanza indotta
dalla norma è la distanza uniforme 𝑑∞ e la convergenza indotta dalla distanza è la
convergenza uniforme.
Dimostrazione. Per definizione risulta verificato che la norma uniforme k·k ∞

assume valori finiti su B(𝐴). Dunque, in base al teorema precedente, k·k ∞
è effettivamente una norma e B(𝐴) risulta quindi essere uno spazio norma-
to. Dimostriamo ora che esso è completo, cioè che le successioni di Cauchy
convergono.
Sia 𝑓 𝑘 una successione di Cauchy in B(𝐴). Allora per ogni 𝑥 ∈ 𝐴 risulta che
𝑓 𝑘 (𝑥) è una successione di Cauchy in ℝ in quanto si ha (per definizione di sup)
𝑓 𝑘 (𝑥) − 𝑓 𝑗 (𝑥) ≤ 𝑓 𝑘 − 𝑓 𝑗

∞
e quindi se 𝑓 𝑘 − 𝑓 𝑗 < 𝜀 a maggior ragione per 𝑥 ∈ 𝐴 fissato si ha 𝑓 𝑘 (𝑥) − 𝑓 𝑗 (𝑥) <

𝜀.
Dunque per ogni 𝑥 ∈ 𝐴 la successione numerica 𝑓 𝑘 (𝑥) converge in quanto
ℝ è completo. Posto 𝑓 (𝑥) = lim 𝑓 𝑘 (𝑥) abbiamo dunque trovato un candidato
limite della successione. Dovremo ora mostrare che 𝑓 ∈ B(𝐴) e che 𝑓 𝑘 converge
uniformemente a 𝑓 . Per ogni 𝜀 > 0 per la condizione di Cauchy dovrà esistere
𝑁 ∈ ℕ tale che se 𝑘, 𝑗 > 𝑁 allora
𝑑∞ ( 𝑓 𝑘 , 𝑓 𝑗 ) < 𝜀.
7.3 convergenza uniforme 311
Ma allora per ogni 𝑥 ∈ 𝐴, per ogni 𝑘 > 𝑁 e per ogni 𝑗 > 𝑁 si avrà:
| 𝑓 𝑘 (𝑥) − 𝑓 (𝑥)| ≤ 𝑓 𝑘 (𝑥) − 𝑓 𝑗 (𝑥) + 𝑓 𝑗 (𝑥) − 𝑓 (𝑥) < 𝜀 + 𝑓 𝑗 (𝑥) − 𝑓 (𝑥).

Visto che per ogni 𝑥 si ha 𝑓 𝑗 (𝑥) → 𝑓 (𝑥), per ogni 𝑥 esiste un 𝑗 tale che
𝑓 𝑗 (𝑥) − 𝑓 (𝑥) < 𝜀 e quindi possiamo concludere che

| 𝑓 𝑘 (𝑥) − 𝑓 (𝑥)| < 2 𝜀.
Facendo il sup per 𝑥 ∈ 𝐴 si ottiene dunque
k 𝑓 𝑘 − 𝑓 k ∞ ≤ 2 𝜀.
Abbiamo quindi verificato la definizione di limite k 𝑓 𝑘 − 𝑓 k ∞ → 0. In particolare

k 𝑓 k ∞ < +∞ in quanto vale la disuguaglianza triangolare
k 𝑓 k ∞ ≤ k 𝑓 − 𝑓 𝑘 k ∞ + k 𝑓 𝑘 k ∞ < +∞
essendo k 𝑓 − 𝑓 𝑘 k ∞ → 0 e k 𝑓 𝑘 k ∞ < +∞.
Definizione 7.42 (convergenza puntuale). Sia 𝑓 𝑘 : 𝐴 → ℝ una successione di

funzioni e sia 𝑓 : 𝐴 → ℝ una funzione. Se per ogni 𝑥 ∈ 𝐴 si ha 𝑓 𝑘 (𝑥) → 𝑓 (𝑥) diremo
che la successione 𝑓 𝑘 converge puntualmente ad 𝑓 . convergenza puntuale
Teorema 7.43 (convergenza uniforme implica convergenza puntuale). Sia

𝑓 𝑘 : 𝐴 → ℝ una successione di funzioni. Se 𝑓 𝑘 converge uniformemente ad una
funzione 𝑓 allora 𝑓 𝑘 converge puntualmente ad 𝑓 .
Dimostrazione. E’ sufficiente osservare che per ogni 𝑥 ∈ 𝐴 si ha
| 𝑓 𝑘 (𝑥) − 𝑓 (𝑥)| ≤ sup | 𝑓 𝑘 (𝑦) − 𝑓 (𝑦)| = k 𝑓 𝑘 − 𝑓 k ∞ → 0.

𝑦∈𝐴
Esempio 7.44 (successione che converge puntualmente ma non uniformemente).

Sia 𝑓 𝑘 : [0 , 1] → ℝ la successione di funzioni definita da 𝑓 𝑘 (𝑥) = 𝑥 𝑘 . Se 𝑥 ∈ [0 , 1)
si ha 𝑥 𝑘 → 0 mentre se 𝑥 = 1 si ha 𝑥 𝑘 → 1. Dunque la successione 𝑓 𝑘 converge
puntualmente alla funzione
(
0 se 𝑥 ∈ [0 , 1)
𝑓 (𝑥) =
1 se 𝑥 = 1.
Osserviamo però che
𝑑∞ ( 𝑓 𝑘 , 𝑓 ) = sup | 𝑓 𝑘 (𝑥) − 𝑓 (𝑥)| ≥ lim− | 𝑓 𝑘 (𝑥) − 𝑓 (𝑥)| = 1.

𝑥∈[0 ,1] 𝑥→1
dunque non ci può essere convergenza uniforme di 𝑓 𝑘 verso 𝑓 .
E’ facile convincersi che la successione 𝑓 𝑘 dell’esempio precedente, oltre a

non convergere uniformemente non ammette nessuna estratta convergente
uniformemente. Perciò tale successione non può essere contenuta in nessun

compatto di 𝐶 0 ([0 , 1]). In particolare il disco unitario
𝐷 = 𝑓 ∈ 𝐶 0 ([0 , 1]) : k 𝑓 k ∞ ≤ 1

risulta essere un insieme chiuso e limitato che però non è compatto.
Teorema 7.45 (continuità del limite uniforme). Sia 𝑋 uno spazio metrico e siano
𝑓 𝑘 : 𝑋 → ℝ funzioni continue che convergono uniformemente ad una funzione
𝑓 : 𝑋 → ℝ. Allora anche 𝑓 è continua.
Dimostrazione. Fissato 𝑥 0 ∈ 𝑋 basta dimostrare che per ogni 𝜀 > 0 esiste

𝛿 > 0 tale che se 𝑑(𝑥, 𝑥0 ) < 𝛿 allora | 𝑓 (𝑥) − 𝑓 (𝑥0 )| < 3𝜀. Per definizione di
convergenza uniforme dato 𝜀 > 0 esiste un 𝑁 ∈ ℕ (in realtà ne esistono infiniti)
per cui 𝑑∞ ( 𝑓𝑁 , 𝑓 ) < 𝜀. Per la continuità di 𝑓𝑁 in corrispondenza dello stesso
𝜀 esiste 𝛿 > 0 tale che se 𝑑(𝑥, 𝑥0 ) < 𝛿 allora | 𝑓𝑁 (𝑥) − 𝑓𝑁 (𝑥0 )| < 𝜀. Ma allora se
𝑑(𝑥, 𝑥0 ) < 𝛿 si ha
| 𝑓 (𝑥) − 𝑓 (𝑥0 )| ≤ | 𝑓 (𝑥) − 𝑓𝑁 (𝑥)| + | 𝑓𝑁 (𝑥) − 𝑓𝑁 (𝑥0 )| + | 𝑓𝑁 (𝑥0 ) − 𝑓 (𝑥0 )|

≤ k 𝑓 − 𝑓𝑁 k ∞ + 𝜀 + k 𝑓 − 𝑓𝑁 k ∞ ≤ 3 𝜀.
𝐶 0 ([𝑎, 𝑏]) è completo
Teorema 7.46 (completezza di 𝐶 0 ([𝑎, 𝑏])). Lo spazio 𝐶 0 ([𝑎, 𝑏]) delle funzioni
continue definite su un intervallo chiuso e limitato, dotato della norma uniforme k·k ∞
risulta essere uno spazio di Banach (ovvero uno spazio vettoriale normato e completo).
Dimostrazione. Per il teorema di Weierstrass ogni funzione continua definita

sul compatto [𝑎, 𝑏] è limitata. Dunque 𝐶 0 ([𝑎, 𝑏]) è un sottospazio vettoriale
di B([𝑎, 𝑏]). Inoltre il teorema precedente (continuità del limite) ci dice che
𝐶 0 ([𝑎, 𝑏]) è un sottospazio chiuso di B([𝑎, 𝑏]). Ma B([𝑎, 𝑏]) è completo e quindi
anche 𝐶 0 ([𝑎, 𝑏]) essendo chiuso in B([𝑎, 𝑏]) è completo.
La norma uniforme è la norma naturale su 𝐶 0 ([𝑎, 𝑏]) in quanto lo rende uno

spazio completo. Per questo motivo la norma uniforme sulle funzioni continue
viene anche chiamata norma 𝐶 0 e si può denotare nel modo seguente:
k 𝑓 k 𝐶 0 = k 𝑓 k 𝐶 0 ([𝑎,𝑏]) = k 𝑓 k ∞ per 𝑓 ∈ 𝐶 0 ([𝑎, 𝑏]).
7.4 passaggio al limite sotto il segno di integrale
Nell’esempio 6.68 abbiamo definito una funzione Γ(𝑥) tramite l’integrale in 𝑑𝑡

di una funzione che dipende dal parametro 𝑥 :
∫ 𝑏
Γ(𝑥) = 𝑓 (𝑥, 𝑡) 𝑑𝑡, 𝑓 (𝑥, 𝑡) = 𝑒 −𝑡 𝑡 𝑥−1 .
𝑎
7.4 passaggio al limite sotto il segno di integrale 313
Se la funzione 𝑓 (𝑥, 𝑡) è continua e derivabile è naturale chiedersi se anche la

funzione integrale Γ risulta essere continua e derivabile. E se è derivabile è
naturale chiedersi come si può calcolare la derivata.
In generale si può rispondere facilmente a queste domande se siamo in grado

di scambiare tra loro gli operatori di limite e di integrale. Infatti osserviamo che
si ha
∫ 𝑏 ∫ 𝑏
?
lim Γ(𝑥) = lim 𝑓 (𝑥, 𝑡) 𝑑𝑡 = lim 𝑓 (𝑥, 𝑡) 𝑑𝑡
𝑥→𝑥0 𝑥→𝑥0 𝑎 𝑎 𝑥→𝑥0
∫ 𝑏
= 𝑓 (𝑥0 , 𝑡) 𝑑𝑡 = Γ(𝑥0 )
𝑎
e
𝑏
Γ(𝑥 + ℎ) − Γ(𝑥) 𝑓 (𝑥 + ℎ, 𝑡) − 𝑓 (𝑥, 𝑡)
∫
Γ0(𝑥) = lim = lim 𝑑𝑡
ℎ→0 ℎ ℎ→0 𝑎 ℎ
𝑏
𝑓 (𝑥 + ℎ, 𝑡) − 𝑓 (𝑥, 𝑡)
∫
?
= lim 𝑑𝑡
𝑎 ℎ→0 ℎ
𝑏
𝜕𝑓
∫
= (𝑥, 𝑡) 𝑑𝑡.
𝑎 𝜕𝑥
In entrambi i casi l’unico passaggio non formalmente giustificato è quello

marcato con il punto interrogativo. Lo scopo di questo capitolo è quello di
determinare alcune condizioni che permettono di effettuare lo scambio del
limite con l’integrale e lo scambio della derivata con l’integrale.
Esempio 7.47. La successione 𝑓𝑛 (𝑥) = 𝑥 𝑛 dell’esempio 7.44 converge puntualmente

alla funzione che vale 0 sull’intervallo [0 , 1).
In questo caso il limite può essere scambiato con l’integrale:

1
1
𝑥 𝑛+1
∫
1
lim 𝑓𝑛 (𝑥) 𝑑𝑥 = lim = lim =0
𝑛→+∞ −1 𝑛→+∞ 𝑛+1 −1
𝑛→+∞ 𝑛+1
∫ 1 ∫ 1
lim 𝑓𝑛 (𝑥) 𝑑𝑥 = 𝑓 (𝑥) 𝑑𝑥 = 0.
−1 𝑛→+∞ −1
L’esempio precedente ci dice che lo scambio tra il limite e l’integrale in certi

casi può essere fatto. Purtroppo la convergenza puntuale non è una ipotesi
sufficiente come si vede nel seguente esempio.
Esempio 7.48. Si consideri la successione di funzione 𝑓𝑛 : [0 , 1] → ℝ definita da

𝑛𝑥
𝑓𝑛 (𝑥) = .
1 + 𝑛2 𝑥4
Chiaramente si ha per ogni 𝑥 ∈ ℝ:
𝑛𝑥
lim = 0.
𝑛→+∞ 1 + 𝑛 2 𝑥 4
Dunque la successione 𝑓𝑛 converge puntualmente alla funzione 𝑓 = 0 identicamente

nulla. Ma lo scambio del limite con l’integrale in questo caso non è possibile in quanto
risulta
1 1 1
𝑛𝑥 𝑛𝑥
∫ ∫ ∫
lim 𝑓𝑛 (𝑥) 𝑑𝑥 = lim 𝑑𝑥 = lim 𝑑𝑥
𝑛→+∞ 0 𝑛→+∞ 0 1 + 𝑛 2 𝑥 4 𝑛→+∞ 0 1 + 𝑛 2 𝑥 4
1 1 1 𝜋
= lim arctg(𝑛𝑥 2 ) 0 = lim arctg 𝑛 =
𝑛→+∞ 2 2 𝑛→+∞ 4
mentre ovviamente
∫ 1 ∫ 1
lim 𝑓𝑛 (𝑥) 𝑑𝑥 = 0 𝑑𝑥 = 0.
0 𝑛→+∞ 0
Il motivo per cui nell’esempio precedente non si può passare al limite sotto
il segno di integrale è dovuto al fatto che la funzione 𝑓𝑛 (𝑥) pur tendendo a
zero in ogni punto 𝑥 ∈ ℝ nei punti vicini ad 𝑥 = 0 diventa, al crescere di 𝑛 ,
molto grande. In effetti il grafico della funzione 𝑓𝑛 (𝑥) si ottiene dal grafico della
𝑥
funzione 𝑓 (𝑥) = 1+𝑥 4 schiacciando la variabile 𝑥 di un fattore 𝑛 e dilatando la
variabile 𝑦 dello stesso fattore 𝑛 . Questo fa sì che l’area sotto il grafico rimanga
invariata. La funzione 𝑓𝑛 ha un punto di massimo per 𝑥 = √4 1√ (lo si verifichi
3 𝑥
studiando il segno della derivata) e in tale punto assume un valore che tende
ad infinito quando 𝑛 → +∞.
Se però c’è convergenza uniforme e l’integrale non è improprio, vale il seguen-

te.
Teorema 7.49 (passaggio al limite sotto il segno di integrale). Siano 𝑓𝑛 , 𝑓 : [𝑎, 𝑏]

funzioni limitate e Riemann integrabili sull’intervallo chiuso e limitato [𝑎, 𝑏]. Suppo-
niamo inolte che ci sia convergenza uniforme: 𝑓𝑛 ⇒ 𝑓 . Allora
∫ 𝑏 ∫ 𝑏
lim 𝑓𝑛 (𝑥) 𝑑𝑥 = 𝑓 (𝑥) 𝑑𝑥.
𝑛→+∞ 𝑎 𝑎
Inoltre scelto qualunque 𝑐 ∈ [𝑎, 𝑏] e posto

∫ 𝑥 ∫ 𝑥
𝐹 𝑘 (𝑥) = 𝑓 𝑘 (𝑡) 𝑑𝑡, 𝐹(𝑥) = 𝑓 (𝑡) 𝑑𝑡
𝑐 𝑐
si ha convergenza uniforme 𝐹 𝑘 ⇒ 𝐹 .
Dimostrazione. Se 𝑓𝑛 e 𝑓 sono Riemann-integrabili anche 𝑓𝑛 − 𝑓 e | 𝑓𝑛 − 𝑓 | lo

sono (teorema 6.12) e si ha:

∫ ∫
𝑏 ∫ 𝑏 𝑏
𝑓 (𝑥) 𝑑𝑥 − 𝑓 (𝑥) 𝑑𝑥 ≤ | 𝑓𝑛 (𝑥) − 𝑓 (𝑥)| 𝑑𝑥

𝑛
𝑎 𝑎 𝑎
∫ 𝑏
≤ sup | 𝑓𝑛 (𝑡) − 𝑓 (𝑡)| 𝑑𝑥
𝑎 𝑡∈[𝑎,𝑏]
∫ 𝑏
= sup | 𝑓𝑛 (𝑡) − 𝑓 (𝑡)| · 1 𝑑𝑥 → 0.
𝑡∈[𝑎,𝑏] 𝑎
Se poi definiamo 𝐹 e 𝐹 𝑘 come nell’enunciato, si ha

𝑥
∫
k𝐹 𝑘 − 𝐹k ∞ = sup 𝑓 𝑘 (𝑡) − 𝑓 (𝑡) 𝑑𝑡

𝑥∈[𝑎,𝑏] 𝑐
≤ sup |𝑥 − 𝑐| · k 𝑓 𝑘 − 𝑓 k ∞
𝑥∈[𝑎,𝑏]
≤ (𝑏 − 𝑎) · k 𝑓 𝑘 − 𝑓 k ∞ → 0.
Ci ricordiamo che le funzioni continue sono localmente Riemann integrabili.

Dunque il teorema precedente ci permette di affermare che l’operatore integrale
𝑆 : 𝐶 0 ([𝑎, 𝑏]) → 𝐶 0 ([𝑎, 𝑏])
∫ 𝑥
𝑆( 𝑓 )(𝑥) = 𝑓 (𝑡) 𝑑𝑡
𝑐
(che fissato 𝑐 ∈ [𝑎, 𝑏] associa ad una funzione 𝑓 ∈ 𝐶 0 ([𝑎, 𝑏]) la sua funzione
integrale) è un operatore continuo rispetto alla norma uniforme.
Purtroppo il teorema precedente non può essere valido in generale per gli
integrali impropri, abbiamo infatti il seguente esempio negativo.
Esempio 7.50. Consideriamo la successione di funzioni 𝑓𝑛 : ℝ → ℝ
1 1
𝑓𝑛 (𝑥) = · .
𝑛 1 + 𝑥−𝑛 2
𝑛
Si può osservare che sup𝑥∈ℝ | 𝑓𝑛 (𝑥)| = 𝑓𝑛 (𝑛) = 1

𝑛 e quindi 𝑓𝑛 ⇒ 0 su tutto ℝ.
Nonostante questo si ha
∫ +∞ ∫ +∞
1
𝑓𝑛 (𝑥) 𝑑𝑥 = 𝑑𝑡 = 𝜋
−∞ −∞ 1 + 𝑡2
e quindi gli integrali non tendono a zero.
Per poter effettuare il passaggio al limite all’interno di un integrale improprio ci convergenza dominata uniforme
serve una ipotesi in più, come vediamo nel seguente.
Teorema 7.51 (convergenza dominata localmente uniforme). Siano 𝑓 𝑘 : (𝑎, 𝑏) →

ℝ e 𝑓 : (𝑎, 𝑏) → ℝ funzioni localmente Riemann integrabili sull’intervallo (𝑎, 𝑏) con
−∞ ≤ 𝑎 < 𝑏 ≤ +∞ tali che per ogni [𝛼, 𝛽] ⊆ (𝑎, 𝑏) si abbia convergenza uniforme:
𝑓 𝑘 ⇒ 𝑓 sull’intervallo [𝑎, 𝛽].
Supponiamo inoltre che esista 𝑔 : (𝑎, 𝑏) → ℝ integrabile in senso improprio su (𝑎, 𝑏)
con integrale convergente e tale che
| 𝑓 𝑘 (𝑥)| ≤ 𝑔(𝑥)
per ogni 𝑘 ∈ ℕ e ogni 𝑥 ∈ [𝑎, 𝑏).
Allora 𝑓 𝑘 ed 𝑓 hanno integrale improprio convergente su (𝑎, 𝑏) e si ha

∫ 𝑏 ∫ 𝑏
lim 𝑓 𝑘 (𝑥) 𝑑𝑥 = 𝑓 (𝑥) 𝑑𝑥.
𝑘→+∞ 𝑎 𝑎
Dimostrazione. Ogni 𝑓 𝑘 è assolutamente integrabile in senso improprio in quanto

| 𝑓 𝑘 | ≤ 𝑔 dove 𝑔 ha integrale finito per ipotesi. Visto che 𝑓 𝑘 (𝑥) → 𝑓 (𝑥) per
ogni 𝑥 ∈ (𝑎, 𝑏) si ha anche | 𝑓 (𝑥)| ≤ 𝑔(𝑥) per ogni 𝑥 ∈ (𝑎, 𝑏) e dunque anche
l’integrale di 𝑓 è assolutamente convergente su (𝑎, 𝑏).
Visto che l’integrale improprio è convergente sappiamo che per ogni 𝜀 > 0
esistono 𝛼 > 𝑎 e 𝛽 < 𝑏 per cui risulta
∫ 𝑏 ∫ 𝛼
𝑔(𝑥) 𝑑𝑥 < 𝜀, 𝑔(𝑥) 𝑑𝑥 < 𝜀.
𝛽 𝑎
Ma su [𝛼, 𝛽] abbiamo la convergenza degli integrali per il teorema precedente

dunque esiste 𝑁 tale che per ogni 𝑘 > 𝑁 si ha
𝛽 𝛽
∫ ∫
𝑓 𝑘 (𝑥) 𝑑𝑥 − 𝑓 (𝑥) 𝑑𝑥 ≤ 𝜀.

𝛼 𝛼

Mettendo insieme le due cose si ottiene, per ogni 𝑘 > 𝑁

∫ ∫
𝑏 ∫ 𝑏 𝛽 ∫ 𝛽
𝑓 𝑘 (𝑥) 𝑑𝑥 − 𝑓 (𝑥) 𝑑𝑥 ≤ 𝑓 𝑘 (𝑥) 𝑑𝑥 − 𝑓 (𝑥) 𝑑𝑥

𝑎 𝑎 𝛼 𝛼
∫ 𝛼 ∫ 𝑏

( 𝑓 𝑘 (𝑥) − 𝑓 (𝑥)) 𝑑𝑥 + ( 𝑓 𝑘 (𝑥) − 𝑓 (𝑥)) 𝑑𝑥

+

𝑎 𝛽
∫ 𝛼 ∫ 𝛼 ∫ 𝑏 ∫ 𝑏
≤ 𝜀+ | 𝑓 𝑘 (𝑥)| 𝑑𝑥 + | 𝑓 (𝑥)| 𝑑𝑥 + | 𝑓 𝑘 (𝑥)| 𝑑𝑥 + | 𝑓 (𝑥)| 𝑑𝑥
𝑎 𝑎 𝛽 𝛽
∫ 𝛼 ∫ 𝑏
≤ 𝜀+2 𝑔(𝑥) 𝑑𝑥 + 2 𝑔(𝑥) 𝑑𝑥 ≤ 5𝜀.
𝑎 𝛽
Abbiamo quindi verficato la tesi tramite la definizione di limite.
Esempio 7.52. La successione 𝑓 𝑘 (𝑥) = sin(𝑥 𝑘 ) converge puntualmente a 𝑓 (𝑥) = 0

sull’intervallo 0 , 𝜋2 e la convergenza è uniforme su ogni intervallo [0 , 𝛽] con 𝛽 < 𝜋2

𝜋
𝜋 𝜋
(verificare!). Inoltre | 𝑓 𝑘 (𝑥)| = sin(𝑥 𝑘 ) ≤ 1 per ogni 𝑥 ∈ 0 ,
∫
1 𝑑𝑥 = < +∞.
2
2 e 0 2
Dunque possiamo applicare il teorema di convergenza dominata e, scambiando il limite

con l’integrale possiamo dedurre che
∫ 𝜋
2
sin(𝑥 𝑘 ) 𝑑𝑥 → 0 , per 𝑘 → +∞.
0
Nel teorema 7.53 l’ipotesi che esista una funzione 𝑔 che “domina” l’intera
successione è essenziale, come abbiamo visto nell’esempio 7.50. Invece l’ipotesi
che la successione converga uniformemente non è veramente necessaria: la
convergenza puntuale (a patto che la successione sia dominata) è sufficiente
per poter effettuare il passaggio al limite sotto il segno di integrale. Nella sua
generalità questo risultato (teorema di convergenza dominata di Lebesgue)
viene dimostrato per l’integrale di Lebesgue. Siamo però in grado di enunciarne
una versione un poco più debole valida per gli integrali impropri di Riemann
che potrà essere molto utile in tanti casi concreti.
convergenza dominata
Teorema 7.53 (convergenza dominata). Siano 𝐼 ⊆ ℝ un intervallo e siano −∞ ≤
𝑎 < 𝑏 ≤ +∞ reali estesi. Sia 𝑓 : 𝐼 × (𝑎, 𝑏) → ℝ una funzione continua e sia
𝑔 : (𝑎, 𝑏) → ℝ una funzione continua con integrale convergente
∫ 𝑏
𝑔(𝑡) < +∞
𝑎
tale per ogni 𝑥 ∈ 𝐼 e per ogni 𝑡 ∈ (𝑎, 𝑏) si abbia | 𝑓 (𝑥, 𝑡)| ≤ 𝑔(𝑡).
∫𝑏
Allora per ogni 𝑥 ∈ 𝐼 l’integrale 𝑎
𝑓 (𝑥, 𝑡) 𝑑𝑡 è convergente ed è continuo nella variabile
𝑥 , cioè: ∫ 𝑏 ∫ 𝑏
lim 𝑓 (𝑦, 𝑡) 𝑑𝑡 = 𝑓 (𝑥, 𝑡) 𝑑𝑡.
𝑦→𝑥 𝑎 𝑎
Dimostrazione. Si noti che l’indice 𝑘 → +∞, 𝑘 ∈ ℕ nel teorema 7.51 può essere
tranquillamente sostituito con un parametro continuo 𝑦 → 𝑥 , 𝑦 ∈ ℝ. Vogliamo
quindi ricondurci al teorema 7.51 e per fare questo andremo quindi a dimostrare
che fissato [𝛼, 𝛽] ⊆ (𝑎, 𝑏) e fissato 𝑥 ∈ 𝐼 si ha convergenza uniforme delle
funzioni 𝑡 ↦→ 𝑓 (𝑦, 𝑡) alla funzione 𝑡 ↦→ 𝑓 (𝑥, 𝑡) quando 𝑦 → 𝑥 .
Senza perdere di generalità possiamo supporre che 𝐼 sia un intervallo chiuso

e limitato che contiene il punto fissato 𝑥 . La funzione 𝑓 è dunque continua
sull’insieme sequenzialmente compatto 𝐼 × [𝛼, 𝛽] e quindi è uniformemente
continua per il teorema di Cantor (in due variabili). Significa che per ogni 𝜀 > 0
esiste 𝛿 > 0 tale che per ogni 𝑥 1 , 𝑥 2 ∈ 𝐼 e per ogni 𝑡, 𝑠 ∈ [𝛼, 𝛽] si ha:
p
(𝑥1 − 𝑥2 )2 + (𝑡1 − 𝑡2 )2 < 𝛿 =⇒ | 𝑓 (𝑥1 , 𝑡1 ) − 𝑓 (𝑥2 , 𝑡2 )| < 𝜀.
Ma allora per ogni 𝜀 > 0 se 𝑦 ∈ 𝐼 e |𝑥 − 𝑦| < 𝛿 si ha
sup | 𝑓 (𝑦, 𝑡) − 𝑓 (𝑥, 𝑡)| ≤ 𝜀

𝑡∈[𝛼,𝛽]
e quindi
lim 𝑑∞ (𝑡 ↦→ 𝑓 (𝑦, 𝑡), 𝑡 ↦→ 𝑓 (𝑥, 𝑡)) = 0.
𝑦→𝑥
Il teorema di convergenza dominata viene spesso utilizzato per scambiare la

derivata con l’integrale come enunciato nel seguente.
scambio della derivata con l’integrale
Teorema 7.54 (passaggio della derivata sotto il segno di integrale). Sia 𝑓 : 𝐼 ×
(𝑎, 𝑏) → ℝ una funzione, 𝐼 ⊆ ℝ un intervallo e 𝑎, 𝑏 ∈ ℝ̄ con −∞ ≤ 𝑎 < 𝑏 ≤ +∞.
Supponiamo che per ogni 𝑡 ∈ (𝑎, 𝑏) la funzione sia derivabile rispetto a 𝑥 per ogni
𝜕𝑓
𝑥 ∈ 𝐼 e che la derivata 𝜕𝑥 sia continua su tutto il rettangolo 𝐼 × (𝑎, 𝑏). Supponiamo
infine che esista una funzione 𝐺 : (𝑎, 𝑏) → ℝ localmente Riemann integrabile e con
∫𝑏
integrale 𝑎
𝐺(𝑡) 𝑑𝑡 convergente tale che per ogni 𝑥 ∈ 𝐼 e per ogni 𝑡 ∈ (𝑎, 𝑏) si abbia
𝜕𝑓

𝑥(𝑥, 𝑡) ≤ 𝐺(𝑡).

𝜕𝑥
Allora per ogni 𝑥 ∈ 𝐼 si ha
𝑏 𝑏
𝑑 𝜕𝑓
∫ ∫
𝑓 (𝑥, 𝑡) 𝑑𝑡 = (𝑥, 𝑡) 𝑑𝑡.
𝑑𝑥 𝑎 𝑎 𝜕𝑥
Dimostrazione. Fissiamo 𝑥 0 ∈ 𝐼 e definiamo

( 𝑓 (𝑥,𝑡)− 𝑓 (𝑥
0 ,𝑡)
𝑥−𝑥 0 se 𝑥 ≠ 𝑥 0
𝑔(𝑥, 𝑡) = 𝜕𝑓
𝜕𝑥
(𝑥, 𝑡) se 𝑥 = 𝑥 0 .
Osserviamo allora che la derivata dell’integrale nel punto 𝑥 0 è:

∫𝑏 ∫𝑏
𝑑 𝑏 𝑓 (𝑥, 𝑡) 𝑑𝑡 − 𝑓 (𝑥0 , 𝑡) 𝑑𝑡
∫
𝑎 𝑎
𝑓 (𝑥, 𝑡) 𝑑𝑡 = lim
𝑑𝑥 𝑎 𝑥=𝑥0
𝑥→𝑥0 𝑥 − 𝑥0
∫ 𝑏
= lim 𝑔(𝑥, 𝑡) 𝑑𝑡
𝑥→𝑥0 𝑎
∫𝑏
mentre l’integrale della derivata è 𝑎 𝑔(𝑥 0 , 𝑡) 𝑑𝑡. Basterà quindi dimostrare che
è possibile applicare il teorema 7.53 alla funzione 𝑔(𝑥, 𝑡).
E’ facile verificare che 𝐺 domina 𝑔 in quanto per il teorema di Lagrange

sappiamo che per ogni 𝑥 e per ogni 𝑡 esiste 𝑥 0 con |𝑥 0 − 𝑥 0 | < |𝑥 − 𝑥 0 | tale che
𝜕𝑓 0

| 𝑔(𝑥, 𝑡)| = (𝑥 , 𝑡) ≤ 𝐺(𝑡).

𝜕𝑥
Ci rimane quindi solo da dimostrare che la funzione 𝑔 : 𝐼 ×(𝑎, 𝑏) → ℝ è continua.

Chiaramente se 𝑥 ≠ 𝑥 0 la funzione è continua, bisogna verificare che lo sia anche
nei punti (𝑥 0 , 𝑡0 ) per ogni 𝑡0 ∈ (𝑎, 𝑏). Visto che per ipotesi 𝜕 𝑓 /𝜕𝑥 è continua,
sappiamo che
𝜕𝑓 𝜕𝑓

√
∀𝜀 > 0 : ∃𝛿 > 0 : =⇒ (𝑥, 𝑡) − (𝑥0 , 𝑡0 ) < 𝜀.

(𝑥−𝑥 0 )2 +(𝑡−𝑡0 )2 <𝛿
𝜕𝑥 𝜕𝑥
Applicando, come prima, il teorema di Lagrange sappiamo che se (𝑥, 𝑡) dista

da (𝑥 0 , 𝑡0 ) per meno di 𝛿 si ha
𝜕𝑓 0 𝜕𝑓

| 𝑔(𝑥, 𝑡) − 𝑔(𝑥0 , 𝑡0 )| = (𝑥 , 𝑡) − (𝑥 0 , 𝑡0 ) < 𝜀.

𝜕𝑥 𝜕𝑥
Questo conclude la dimostrazione della continuità di 𝑔(𝑥, 𝑡).
Esercizio 7.55 (derivata della funzione Γ). Mostrare che la funzione Γ definita da
(si veda esempio 6.68) ∫ +∞
Γ(𝑥) = 𝑒 −𝑡 · 𝑡 𝑥−1 𝑑𝑡
0
è derivabile e la sua derivata vale

∫ ∞
0
Γ (𝑥) = 𝑒 −𝑡 · ln 𝑡 · 𝑡 𝑥−1 𝑑𝑡.
0
Svolgimento. Basta verificare che si può applicare il teorema 7.54 alla funzione
𝑓 (𝑥, 𝑡) = 𝑒 −𝑡 𝑡 𝑥−1
la cui derivata parziale rispetto a 𝑥 è
𝜕𝑓
(𝑥, 𝑡) = 𝑒 −𝑡 · ln 𝑡 · 𝑡 𝑥−1 .
𝜕𝑥
Chiaramente questa funzione è continua, dobbiamo solo trovare una funzione
che la domina. Fissato 𝑥 0 > 0 possiamo restringere il dominio della variabile 𝑥
all’intervallo 𝑥20 , 2 𝑥 0 e considerare la funzione
𝑥0
n o
𝑔(𝑡) = 𝑒 −𝑡 · | ln 𝑡 | · max 𝑡 2 −1
, 𝑡 2 𝑥 0 −1 .
Si tratta di una funzione continua (in quanto composizione di funzioni continue,

osservando che anche il massimo tra due funzioni continue è una funzione
continua). Inoltre per 𝑡 → 0+ si ha
𝑥0
−1
𝑔(𝑡) ∼ | ln 𝑡| · 𝑡 2 𝑡 −1+𝜀
pur di prendere 𝜀 < 𝑥20 . Dunque l’integrale 0 𝑔(𝑡) 𝑑𝑡 è convergente per il

∫1
criterio di confronto asintotico. Se invece 𝑡 → +∞ si ha

1
𝑔(𝑡) ∼ 𝑒 −𝑡 · ln 𝑡 · 𝑡 2𝑥0 −1
𝑡2
in quanto l’esponenziale tende a zero molto più velocemente di quanto non
tendano ad infinito logaritmo e potenza. Dunque, per il criterio di confronto
∫ +∞
asintotico, anche l’integrale 1 𝑔(𝑡) 𝑑𝑡 è convergente.
Il metodo utilizzato nei prossimi esempi viene a volte chiamato trucco di Feynman: trucco di Feynman
si tratta di moltiplicare la funzione integranda per una funzione che dipende
da un parametro in modo che derivando rispetto al parametro la funzione
integranda si semplifichi.
Esercizio 7.56 (integrale notevole). Mostriamo che

+∞
sin 𝑡 𝜋
∫
𝑑𝑡 = .
0 𝑡 2
Dimostrazione. Consideriamo la funzione

+∞
sin 𝑡 −𝑡𝑥
∫
𝐹(𝑥) = 𝑒 𝑑𝑡.
0 𝑡
Possiamo derivare la funzione utilizzando il teorema 7.54 in quanto la derivata

della funzione integranda
𝜕 sin 𝑡 −𝑡𝑥

𝑒 = − sin 𝑡 · 𝑒 −𝑡𝑥
𝜕𝑥 𝑡
è dominata dalla funzione 𝑒 −𝑡 che ha integrale convergente. Dunque si ha

∫ +∞
0
𝐹 (𝑥) = − sin 𝑡 · 𝑒 −𝑡𝑥 𝑑𝑡.
0
Questo integrale si può calcolare integrando due volte per parti (si veda
esercizio 6.63) e si trova 𝐹0(𝑥) = − 1+𝑥
1
2 da cui
+∞
𝜋
∫
𝐹0(𝑥) 𝑑𝑥 = −[arctg 𝑥]+∞
0 =− .
0 2
D’altra parte per la formula fondamentale del calcolo sappiamo che il precedente
integrale non è altro che [𝐹(𝑥)]+∞0 ed è facile verificare che 𝐹(0) è proprio
l’integrale richiesto.
Basterà quindi calcolare lim𝑥→+∞ 𝐹(𝑥). Ma anche in questo caso è possibile

passare al limite dentro al segno di integrale in quanto la funzione integranda è
dominata da una funzione con integrale convergente:
(
sin 𝑡 −𝑡𝑥 se 𝑡 ≤ 1

1
𝑡 𝑒 ≤ 𝑒 −𝑡

𝑡 se 𝑡 > 1.
Allora 𝐹(𝑥) → 0 per 𝑥 → +∞ e si ottiene il risultato voluto.
Esercizio 7.57 (integrale della gaussiana). Dimostriamo che

∫ +∞ √
2
𝑒 −𝑠 𝑑𝑠 = 𝜋.
−∞
Svolgimento. Poniamo ∫ +∞
2
𝐼= 𝑒 −𝑠 𝑑𝑠.
−∞
e consideriamo la seguente funzione
+∞ 2 2
𝑒 −𝑥 (1+𝑡 )
∫
𝐹(𝑥) = 𝑑𝑡.
0 1 + 𝑡2
7.5 scambio della derivata con il limite 321
Possiamo facilmente calcolare

+∞
𝜋
∫
1
𝐹(0) = 𝑑𝑡 = [arctg 𝑡]+∞ = .
0 1+𝑡 2 0
2
Mentre se 𝑥 > 1 si ha
𝑒 −𝑥 𝑡
2 2) 2 2
𝑒 −𝑥 (1+𝑡 2 2 2
0≤ = 𝑒 −𝑥 · ≤ 𝑒 −𝑥 · 𝑒 −𝑡
1 + 𝑡2 1 + 𝑡2
e quindi per 𝑥 → +∞:
∫ 𝑥
2 2 2
0 ≤ 𝐹(𝑥) ≤ 𝑒 −𝑥 𝑒 −𝑡 𝑑𝑡 ≤ 𝑒 −𝑥 · 𝐼 → 0.
0
Calcoliamo ora la derivata di 𝐹 applicando il teorema 7.54. La funzione

integranda ha derivata
2 2)
!
𝜕 𝑒 −𝑥 (1+𝑡 2 (1+𝑡 2 )
= −2 𝑥𝑒 −𝑥 .
𝜕𝑥 1 + 𝑡 2
Se restringiamo la variabile 𝑥 ad un intervallo [𝑥 1 , 𝑥 2 ] abbiamo
1
2
2 2 2
−2𝑥𝑒 −𝑥 (1+𝑡 ) ≤ 2𝑥2 𝑒 −𝑥1 (1+𝑡 ) 2

𝑡
e dunque la funzione dominante ha integrale finito sull’intervallo (0 , +∞).
Possiamo quindi scambiare la derivata con l’integrale per ottenere
∫ +∞ ∫ +∞
0 −𝑥 2 (1+𝑡 2 ) −𝑥 2 2 𝑡2
𝐹 (𝑥) = −2𝑥 𝑒 𝑑𝑡 = −2 𝑥𝑒 𝑒 −𝑥 𝑑𝑡.
0 0
Con il cambio di variabile 𝑠 = 𝑥𝑡 , 𝑑𝑠 = 𝑥𝑑𝑡 si ottiene

∫ +∞
0 −𝑥 2 2 2
𝐹 (𝑥) = −2 𝑒 𝑒 −𝑠 𝑑𝑠 = −𝑒 −𝑥 · 𝐼.
0
Ma allora da un lato abbiamo

+∞
𝜋
∫
𝐹0(𝑥) 𝑑𝑥 = [𝐹0(𝑥)]+∞
0 =0− .
0 2
Dall’altro
+∞ +∞
𝐼2
∫ ∫
0 2
𝐹 (𝑥) 𝑑𝑥 = −𝐼 · 𝑒 −𝑥 𝑑𝑥 = − .
0 0 2
Concludiamo quindi che 𝐼 = 𝜋, come volevamo dimostrare.
2
7.5 scambio della derivata con il limite
Teorema 7.58 (scambio del limite con la derivata). Sia 𝐼 ⊆ ℝ un intervallo e

siano 𝑓 𝑘 ∈ 𝐶 1 (𝐼) funzioni tali che 𝑓 𝑘 (𝑥 0 ) converge per almeno un punto 𝑥 0 ∈ 𝐼 e la
successione delle derivate 𝑓 𝑘0 converge ad una funzione 𝑔 : 𝐼 → ℝ uniformemente su
ogni intervallo chiuso e limitato [𝑎, 𝑏] ⊆ 𝐼 . Allora esiste 𝑓 ∈ 𝐶 1 (𝐼) tale che 𝑓 0 = 𝑔 e 𝑓 𝑘
converge a 𝑓 uniformemente su ogni intervallo chiuso e limitato [𝑎, 𝑏] ⊆ 𝐼 . In queste
ipotesi si può quindi scambiare la derivata con il limite:
𝑑 𝑑

lim 𝑓 𝑘 (𝑥) = 𝑓 0(𝑥) = lim 𝑓 𝑘 (𝑥) , ∀𝑥 ∈ 𝐼.
𝑘→+∞ 𝑑𝑥 𝑑𝑥 𝑘→+∞
Dimostrazione. Per ipotesi esiste 𝑦0 ∈ ℝ tale che 𝑓 𝑘 (𝑥 0 ) → 𝑦0 . Definiamo

∫ 𝑥
𝑓 (𝑥) = 𝑦0 + 𝑔(𝑡) 𝑑𝑡.
𝑥0
Per la continuità del limite uniforme sappiamo che 𝑔 è continua, dunque

possiamo applicare il teorema fondamentale del calcolo per dedurre che 𝑓 0 = 𝑔 .
Mostriamo ora che su ogni intervallo [𝑎, 𝑏] ⊆ 𝐼 si ha 𝑓 𝑘 ⇒ 𝑓 . Per la formula
fondamentale del calcolo integrale si ha:
∫ 𝑥
𝑓 𝑘0(𝑡)𝑑𝑡 = 𝑓 𝑘 (𝑥) − 𝑓 𝑘 (𝑥 0 )
𝑥0
dunque
𝑥 𝑥
∫ ∫
sup | 𝑓 𝑘 (𝑥) − 𝑓 (𝑥)| = sup 𝑓 𝑘 (𝑥 0 ) + 𝑓 𝑘0(𝑡)
− 𝑦0 − 𝑔(𝑡) 𝑑𝑡

𝑥∈[𝑎,𝑏] 𝑥∈[𝑎,𝑏] 𝑥0 𝑥0
∫ 𝑥
0
≤ | 𝑓 𝑘 (𝑥0 ) − 𝑦0 | + sup 𝑓 (𝑡) − 𝑔(𝑡) 𝑑𝑡

𝑘
𝑥∈[𝑎,𝑏] 𝑥0

≤ | 𝑓 𝑘 (𝑥0 ) − 𝑦0 | + (𝑏 − 𝑎) 𝑓 0 − 𝑔 → 0.

𝑘
Lo spazio 𝐶 1 ([𝑎, 𝑏]) è un sottospazio vettoriale di 𝐶 0 ([𝑎, 𝑏]) ma non è chiuso,

come si deduce dall’esempio 7.39 (si potrebbe anzi dimostrare che 𝐶 1 è denso
in 𝐶 0 ) dunque 𝐶 1 non è completo rispetto alla norma uniforme. Per trasformare
lo spazio 𝐶 1 ([𝑎, 𝑏]) in uno spazio di Banach possiamo definire una norma più
forte, come ad esempio questa:
k 𝑓 k 𝐶1 = k 𝑓 k∞ + k 𝑓 0 k∞ .
Teorema 7.59 (𝐶 1 spazio di Banach). Lo spazio vettoriale 𝐶 1 ([𝑎, 𝑏]) dotato della
norma k·k 𝐶 1 risulta essere uno spazio di Banach.
Dimostrazione. E’ facile verificare che k·k 𝐶 1 è una norma su 𝐶 1 ([𝑎, 𝑏]), dobbiamo
solo verificare che lo spazio risulta completo. Sia dunque 𝑓 𝑘 una successione
di Cauchy rispetto alla norma 𝐶 1 . Allora 𝑓 𝑘0 e 𝑓 𝑘 sono entrambe successioni
di Cauchy in 𝐶 0 in quanto k 𝑓 𝑘 k ∞ ≤ k 𝑓 𝑘 k 𝐶 1 e 𝑓 𝑘0 ∞ ≤ k 𝑓 𝑘 k 𝐶 1 . Dunque, per

la completezza di 𝐶 0 , sappiamo che esistono 𝑓 , 𝑔 ∈ 𝐶 0 ([𝑎, 𝑏]) tali che 𝑓 𝑘 ⇒ 𝑓

e 𝑓 𝑘0 ⇒ 𝑔 . In base al teorema di scambio del limite con la derivata possiamo

affermare che 𝑓 ∈ 𝐶 1 e 𝑓 0 = 𝑔 , dunque
k 𝑓 𝑘 − 𝑓 k 𝐶 1 = k 𝑓 𝑘 − 𝑓 k ∞ + 𝑓 𝑘0 − 𝑔 ∞ → 0.

Il teorema di scambio del limite con l’integrale ci dice che l’operatore integrale
𝑆 : 𝐶 0 → 𝐶 1 è continuo tra i due spazi di Banach. Anche l’operatore differenziale
𝐷 : 𝐶 1 → 𝐶 0 𝑓 ↦→ 𝐷 𝑓 = 𝑓 0 è ovviamente continuo.
serie di funzioni
Se 𝑓 𝑘 : 𝐴 → ℝ è una successione di funzioni definite su uno stesso insieme 𝐴,

possiamo considerare (come abbiamo già fatto per le successioni numeriche) la
successione delle somme parziali:
𝑛
X
𝑆𝑛 (𝑥) = 𝑓 𝑘 (𝑥), 𝑥 ∈ 𝐴.
𝑘=0
Tale successione si chiama serie corrispondente alla successione di funzioni 𝑓 𝑘

𝑓𝑛 . Per ogni 𝑥 in cui la serie è convergente si può
P
e si indica a volte come
somma
quindi definire la somma della serie
+∞
X
𝑆(𝑥) = 𝑓 𝑘 (𝑥) = lim 𝑆𝑛 (𝑥).
𝑛→+∞
𝑘=0
La somma 𝑆 è dunque il limite puntuale della successione delle somme parziali

𝑆𝑛 .
I teoremi che abbiamo dimostrato per le successioni di funzioni sono quindi

validi anche per le serie di funzioni. Basterà ricordare che la convergenza
convergenza uniforme di una serie
uniforme della serie è la convergenza uniforme delle somme parziali. Dunque
𝑓 𝑘 converge uniformemente a 𝑆 se 𝑆𝑛 ⇒ 𝑆 ovvero se
P

X +∞
k𝑆 − 𝑆𝑛 k ∞ = 𝑓𝑘 → 0 per 𝑛 → +∞.

𝑘=𝑛+1
∞
integrala di una serie
Teorema 7.60 (integrale di una serie di funzioni). Sia 𝑓 𝑘 : [𝑎, 𝑏] → ℝ una

successione di funzioni continue definite sull’intervallo [𝑎, 𝑏] ⊆ ℝ. Se la serie 𝑓 𝑘
P
converge uniformemente allora si può scambiare l’integrale con la somma della serie:
!
∫ 𝑏 +∞
X +∞ ∫
X 𝑏
𝑓 𝑘 (𝑡) 𝑑𝑡 = 𝑓 𝑘 (𝑡) 𝑑𝑡 ∀𝑥 ∈ 𝐼.
𝑎 𝑘=0 𝑘=0 𝑎
Dimostrazione. La dimostrazione è una semplice conseguenza del fatto che lo

scambio può essere fatto sulle somme finite e il passaggio al limite può essere
fatto grazie al teorema di scambio del limite con l’integrale.
Sia 𝑆𝑛 = 𝑓𝑛 la successione delle somme parziali e sia 𝑆 il limite delle somme

P
parziali. Per ipotesi 𝑆𝑛 ⇒ 𝑆 . Applicando il teorema di scambio dell’integrale
con il limite si ha ∫ ∫ 𝑏 𝑏
lim 𝑆𝑛 (𝑡) 𝑑𝑡 = 𝑆(𝑡) 𝑑𝑡.
𝑛→+∞ 𝑎 𝑎
Ma da un lato, sfruttando l’additività dell’integrale sulle somme finite:
!
∫ 𝑏 ∫ 𝑏 𝑛
X
lim 𝑆𝑛 (𝑡) 𝑑𝑡 = lim 𝑓 𝑘 (𝑡) 𝑑𝑡
𝑛→+∞ 𝑎 𝑛→+∞ 𝑎 𝑘=0
𝑛 ∫
X 𝑏
= lim 𝑓 𝑘 (𝑡) 𝑑𝑡
𝑛→+∞ 𝑎
𝑘=0
∞ ∫ 𝑏
X

= 𝑓 𝑘 (𝑡) 𝑑𝑡
𝑘=0 𝑎
e dall’altro lato: !
∫ 𝑏 ∫ 𝑏 +∞
X
𝑆(𝑡) 𝑑𝑡 = 𝑓 𝑘 (𝑡) 𝑑𝑡.
𝑎 𝑎 𝑘=0
derivazione di una serie

Teorema 7.61 (derivata di una serie di funzioni). Sia 𝑓 𝑘 : 𝐼 → ℝ una successione
di funzioni continue definite sull’intervallo 𝐼 . Se le funzioni 𝑓 𝑘 sono di classe 𝐶 1 e la
serie delle derivate 𝑓 𝑘0 converge uniformemente su ogni intervallo chiuso e limitato
P
[𝑎, 𝑏] ⊆ 𝐼 e se c’è almeno un punto 𝑥0 ∈ 𝐼 tale che la serie 𝑓 𝑘 (𝑥0 ) converge, allora
P
+∞ +∞
𝑑 X X 𝑑
𝑓 𝑘 (𝑥) = 𝑓 𝑘 (𝑥) ∀𝑥 ∈ 𝐼.
𝑑𝑥 𝑘=0 𝑘=0
𝑑𝑥
Dimostrazione. Sia 𝑆𝑛 la successione delle somme parziali. Per ipotesi sappiamo

che esiste una funzione 𝑇 : 𝐼 → ℝ tale che 𝑆0𝑛 ⇒ 𝑇 in ogni intervallo [𝑎, 𝑏] ⊆ 𝐼 .
Sappiamo inoltre che 𝑆𝑛 (𝑥 0 ) converge. Dunque possiamo applicare il teorema
di scambio del limite con la derivata per ottenere che esiste 𝑆 ∈ 𝐶 1 (𝐼) tale che
𝑆𝑛 (𝑥) → 𝑆(𝑥) per ogni 𝑥 ∈ 𝐼 e
𝑆0(𝑥) = 𝑇(𝑥) ∀𝑥 ∈ 𝐼.
Ma da un lato
𝑑
𝑆0(𝑥) = lim 𝑆𝑛 (𝑥)
𝑑𝑥 𝑛→+∞
+∞
𝑑 X
= 𝑓 𝑘 (𝑥)
𝑑𝑥 𝑘=0
e dall’altro lato
𝑛
𝑑 X
𝑇(𝑥) = lim 𝑆0𝑛 (𝑥) = lim 𝑓 𝑘 (𝑥)
𝑛→+∞ 𝑛→+∞ 𝑑𝑥 𝑘=0
𝑛
X +∞
X
= lim 𝑓 𝑘0(𝑥) = 𝑓 𝑘0(𝑥).
𝑛→+∞
𝑘=0 𝑘=0
La convergenza uniforme di una serie non è molto semplice da verificare. Più

semplice è la seguente condizione, che vedremo essere più forte.
Definizione 7.62 (convergenza totale di una serie di funzioni). Siano 𝑓 𝑘 : 𝐴 → ℝ

funzioni definite su un insieme 𝐴 ⊆ ℝ. Diremo che la serie di funzioni 𝑓 𝑘 converge
P
totalmente se la serie numerica k 𝑓 𝑘 k ∞ è convergente.
P
convergenza totale
𝑓𝑛 converge totalmente allora

P
Teorema 7.63 (convergenza totale). Se la serie
converge uniformemente.
Dimostrazione. A 𝑥 fissato la serie 𝑓𝑛 (𝑥) converge assolutamente in quanto

P
∞
X ∞
X
| 𝑓𝑛 (𝑥)| ≤ k 𝑓𝑛 k ∞ < +∞.
𝑘=0 𝑘=0
Dunque la serie converge e posto

𝑛
X +∞
X
𝑆𝑛 (𝑥) = 𝑓 𝑘 (𝑥), 𝑆(𝑥) = 𝑓 𝑘 (𝑥)
𝑘=0 𝑘=0
si ha che 𝑆𝑛 → 𝑆 puntualmente. Per mostrare che 𝑆𝑛 ⇒ 𝑆 basta osservare che

per 𝑛 → +∞ si ha:

X +∞ +∞
X +∞
X
|𝑆(𝑥) − 𝑆𝑛 (𝑥)| = 𝑓 𝑘 (𝑥) ≤ | 𝑓 𝑘 (𝑥)| ≤ k 𝑓 𝑘 k ∞ → 0.

𝑘=𝑛+1 𝑘=𝑛+1 𝑘=𝑛+1
Teorema 7.64 (convergenza totale delle serie di potenze). Sia 𝑎 𝑛 𝑧 𝑛 una serie
P
di potenze e sia 𝑅 ∈ [0 , +∞] il suo raggio di convergenza. Allora la serie converge
totalmente su ogni disco 𝐷𝑟 con 𝑟 < 𝑅 .
Dimostrazione. Ora osserviamo che sul disco di raggio 𝑟 si ha 𝑎 𝑘 𝑧 𝑘 ∞ = |𝑎 𝑘 |𝑟 𝑘

e dunque
+∞ +∞
|𝑎 𝑘 |𝑟 𝑘 < +∞
X X
k𝑎 𝑘 𝑧 𝑘 k ∞ =
𝑘=0 𝑘=0
𝑎𝑘 𝑧𝑘 converge assolutamente per 𝑧 = 𝑟 essendo 𝑟 < 𝑅 .

P
in quanto la serie
Corollario 7.65. La serie di potenze

+∞
𝑎𝑘 𝑥 𝑘
X
𝑓 (𝑥) =
𝑘=0
ha lo stesso raggio di convergenza 𝑅 della serie delle derivate

+∞
𝑘𝑎 𝑘 𝑥 𝑘−1
X
𝑔(𝑥) =
𝑘=1
e per 𝑥 ∈ (−𝑅, 𝑅) si ha
𝑓 0(𝑥) = 𝑔(𝑥).
Dimostrazione. Che le due serie abbiano lo stesso raggio di convergenza l’ab-

biamo già dimostrato nel Teorema 3.42. Nel teorema precedente abbiamo
mostrato che su ogni intervallo [−𝑟, 𝑟] con 𝑟 < 𝑅 la serie di potenze con somma
𝑓 converge totalmente. Dunque converge uniformemente e possiamo scambiare
la derivata con la somma per ottenere 𝑓 0(𝑥) = 𝑔(𝑥).
Esempio 7.66. Sappiamo che la serie di potenze

+∞ 𝑘
X 𝑥
𝑓 (𝑥) =
𝑘=1
𝑘
ha raggio di convergenza 𝑅 = 1 (si usi ad esempio il criterio del rapporto). La serie delle
derivate è
+∞ +∞
1
𝑥 𝑘−1 = 𝑥𝑘 =
X X
𝑔(𝑥) = .
𝑘=1 𝑘=0
1−𝑥
Dunque per |𝑥| < 1 si ha

1
𝑓 0(𝑥) = 𝑔(𝑥) =
1−𝑥
da cui
∫ 𝑥 ∫ 𝑥
1
𝑓 (𝑥) = 𝑓 (0) + 0
𝑓 (𝑡) 𝑑𝑡 = 𝑑𝑡 = [− ln(1 − 𝑡)]0𝑥 = − ln(1 − 𝑥).
0 0 1−𝑡
Abbiamo quindi scoperto che vale

+∞ 𝑘
X 𝑥
= − ln(1 − 𝑥) per ogni 𝑥 ∈ (−1 , 1).
𝑘=1
𝑘
Osserviamo ora che la serie con somma 𝑓 (𝑥) non converge per 𝑥 = 1 (serie armonica) ma
converge per 𝑥 = −1 (criterio di Leibniz). Per il Teorema 3.44 (lemma di Abel) sappiamo
che la funzione 𝑓 (𝑥) è continua nel punto 𝑥 = −1 e dunque possiamo concludere che
+∞ 𝑘
X 𝑥
= − ln(1 − 𝑥) ∀𝑥 ∈ [−1 , 1).
𝑘=1
𝑘
In particolare abbiamo trovato la somma della serie armonica a serie alterni:

+∞
X (−1) 𝑘+1
= − 𝑓 (𝑥) = ln 2.
𝑘=1
𝑘
Osserviamo che queste informazioni sono coerenti con lo sviluppo di Taylor di ln(1 + 𝑥)
che avevamo già determinato. Ma non sono conseguenza di esso, in quanto lo sviluppo
di Taylor ci dà informazioni solamente per 𝑥 → 0 mentre ora abbiamo ottenuto
informazioni per ogni 𝑥 in [−1 , 1).
7.6 convergenza integrale 327
Esempio 7.67. Applichiamo l’idea precedente alla funzione arctg. Si ha
1 +∞
X 2 𝑘
+∞
X 𝑘 2𝑘
+∞
X (−1) 𝑘 2 𝑘+1 0
arctg0(𝑥) = = (−𝑥 ) = (−1) 𝑥 = (𝑥 ).
1 + 𝑥2 𝑘=0 𝑘=0 𝑘=0
2𝑘 + 1
La serie
+∞
(−1) 𝑘
𝑥 2 𝑘+1
X
𝑓 (𝑥) =
𝑘=0
2𝑘 + 1
ha raggio di convergenza 𝑅 = 1 e dunque per ogni 𝑥 ∈ (−1 , 1) sappiamo che la serie

delle derivate converge alla derivata della serie da cui
𝑓 0(𝑥) = arctg0 𝑥.
Visto che 𝑓 (0) = 0 = arctg 0 possiamo concludere che 𝑓 (𝑥) = arctg 𝑥 per ogni
𝑥 ∈ (−1 , 1). La serie è convergente anche per 𝑥 = 1, per il criterio di Leibniz. Per
continuità (Lemma di Abel) si ottiene che 𝑓 (1) = arctg 1. Dunque
+∞
(−1) 𝑘
𝑥 2 𝑘+1
X
arctg 𝑥 = ∀𝑥 ∈ (−1 , 1].
𝑘=0
2𝑘 + 1
In particolare per 𝑥 = 1 si ottiene la formula di Gregory-Leibniz Gregory-Leibniz
𝜋 X +∞
(−1) 𝑘 1 1 1
= = 1− + − +...
4 𝑘=0
2𝑘 + 1 3 5 7
7.6 convergenza integrale
Motivati da come viene definita la norma di un vettore in ℝ𝑛 risulta naturale

dare la seguente definizione di norma euclidea per una funzione 𝑓 : (𝑎, 𝑏) → ℝ:
s
∫ 𝑏
k 𝑓 k2 = | 𝑓 (𝑥)| 2 𝑑𝑥.
𝑎
Questa definizione ha senso, come integrale improprio, se la funzione 𝑓 è

localmente Riemann-integrabile sull’intervallo (𝑎, 𝑏) (definizione 6.49). In tal
caso l’integrale esiste, ma potrebbe assumere il valore +∞. Definiamo allora
H(𝑎, 𝑏) = 𝑓 localmente R.-integrabile su (𝑎, 𝑏) : k 𝑓 k 2 < +∞ .

Cercheremo ora di dimostrare che la norma che abbiamo introdotto è effettiva-

mente un norma (nel senso della definizione 7.4) che rende H(𝑎, 𝑏) uno spazio
vettoriale euclideo di dimensione infinita.
Innanzitutto è chiaro che qualunque sia 𝑓 si ha k 𝑓 k 2 ≥ 0. Inoltre è banale

osservare che la norma è omogenea: se 𝑡 ∈ ℝ si ha:
k𝑡 · 𝑓 k 2 = |𝑡 | · k 𝑓 k 2 .
Dunque se 𝑓 ∈ H(𝑎, 𝑏) anche 𝑡 𝑓 ∈ H(𝑎, 𝑏) per ogni 𝑡 ∈ ℝ. Se 𝑓 , 𝑔 ∈ H(𝑎, 𝑏)

per la proprietà del parallelogramma (7.4) valida in ℝ si ha
( 𝑓 (𝑥) + 𝑔(𝑥))2 ≤ 2 𝑓 2 (𝑥) + 2 𝑔 2 (𝑥)
e dunque se 𝑓 , 𝑔 ∈ H(𝑎, 𝑏) anche 𝑓 + 𝑔 ∈ H(𝑎, 𝑏). Dunque H(𝑎, 𝑏) è uno spazio

vettoriale.
Per 𝑓 , 𝑔 ∈ H(𝑎, 𝑏) possiamo ora definire il prodotto scalare:

∫ 𝑏
h 𝑓 , 𝑔i = 𝑓 (𝑥) · 𝑔(𝑥) 𝑑𝑥. (7.6)
𝑎
La disuguaglianza di Young (7.2) valida in ℝ ci dice che
𝑓 2 (𝑥) + 𝑔 2 (𝑥)
| 𝑓 (𝑥) · 𝑔(𝑥)| ≤
2
e dunque garantisce che l’integrale (7.6) sia assolutamente convergente. Dunque
se 𝑓 , 𝑔 ∈ H(𝑎, 𝑏) il prodotto scalare h 𝑓 , 𝑔i è ben definito ed è un numero finito.
A questo punto è facile verificare che h 𝑓 , 𝑔i è una forma bilineare simmetrica non
negativa. Dunque soddisfa tutte le proprietà formali date nella definizione 7.5
di prodotto scalare salvo il fatto che non è garantito che h 𝑓 , 𝑓 i = 0 implichi
𝑓 = 0. In effetti questa proprietà è falsa perché se la funzione 𝑓 2 (𝑥) ha integrale
nullo non è detto che sia identicamente nulla: l’integrale, infatti, non cambia se
la funzione viene modificata in un singolo punto.
Per ovviare a questo problema bisogna che identifichiamo due funzioni 𝑓 , 𝑔 ∈

H(𝑎, 𝑏) se k 𝑓 − 𝑔k 2 = 0:
𝑓 ∼ 𝑔 ⇐⇒ k 𝑓 − 𝑔k 2 = 0.
Chiamiamo 𝐻(𝑎, 𝑏) il quoziente:
𝐻(𝑎, 𝑏) = H(𝑎, 𝑏)/∼
cioè lo spazio vettoriale delle funzioni in H(𝑎, 𝑏) dove due funzioni vengono
identificate se la norma della differenza è nulla.
Lo spazio quoziente 𝐻(𝑎, 𝑏) risulta finalmente essere uno spazio euclideo.

Mantiene infatti la struttura vettoriale (in quanto l’insieme delle 𝑓 ∈ H(𝑎, 𝑏) con
k 𝑓 k 2 = 0 è uno spazio vettoriale) e il prodotto scalare h 𝑓 , 𝑔i (e di conseguenza
la norma k 𝑓 k 2 ) è ben definito su 𝐻(𝑎, 𝑏) e oltre alle proprietà che già abbiamo
dimostrato possiamo ora affermare che h 𝑓 , 𝑓 i = k 𝑓 k 2 = 0 se e solo se 𝑓 = 0.
Osservazione 7.68. La notazione 𝐻(𝑎, 𝑏) che scegliamo di utilizzare per definire

questo spazio non è standard. La lettera 𝐻 rimanda ad Hilbert in quanto lo studio di
questo spazio in particolare ha spinto verso l’astrazione del concetto di spazio di Hilbert.
Quello che vedremo nel seguito è che questo spazio non risulta essere completo e dunque
in realtà non è uno spazio di Hilbert. In effetti l’utilizzo degli integrali impropri è un
tentativo, di estendere l’integrale di Riemann in modo da rendere completo questo spazio.
Solo con la definizione di integrale di Lebesgue (1875–1941) si è riusciti ad estendere
l’integrale di Riemann ad una classe più amplia di funzioni fino a completare lo spazio.
L’analogo dello spazio 𝐻(𝑎, 𝑏) definito tramite integrale di Lebesgue viene usualmente
chiamato 𝐿2 . L’esponente 2 è dovuto al fatto che sarebbe possibile definire gli spazi 𝐿 𝑝 in
maniera analoga a quanto fatto nell’esempio 7.9. Si avrebbe ancora che solo per 𝑝 = 2
questi spazi normati sono euclidei, cioè solo per 𝑝 = 2 la norma è indotta da un prodotto
scalare. Tutti gli spazi 𝐿 𝑝 sono completi e dunque sono spazi di Banach. Ma 𝐿2 è anche
uno spazio di Hilbert, in quanto è dotato di prodotto scalare. Anzi potremmo dire che
𝐿2 è lo spazio di Hilbert per antonomasia e viene denotato anche con il nome 𝐻 0 (in
questo caso l’esponente denota la derivabilità delle funzioni, come in 𝐶 0 ).
Gli elementi di 𝐻(𝑎, 𝑏) non sono funzioni, ma classi di equivalenza di funzioni.

Nel seguito, però, tratteremo 𝑓 ∈ 𝐻(𝑎, 𝑏) come se fosse 𝑓 ∈ H(𝑎, 𝑏) facendo
attenzione che le nostre affermazioni rimangano valide se al posto di una
funzione 𝑓 si prende una funzione a lei equivalente. In particolare avrà senso
considerare gli integrali di queste funzioni, perché il valore dell’integrale non
dipende dal rappresentante scelto, ma non avrà senso considerare il valore
che le funzioni assumono in un singolo punto, perché questo dipende dal
rappresentante.
serie di Fourier
Lo spazio 𝐻(𝑎, 𝑏) è uno spazio vettoriale reale su cui siamo riusciti a definire un
prodotto scalare e quindi una norma. Vorremmo trovare su 𝐻(𝑎, 𝑏) una base
ortonormale rispetto alla quale sia possibile scrivere le coordinate dei vettori
(cioè delle funzioni) di 𝐻(𝑎, 𝑏). Visto che 𝐻(𝑎, 𝑏) non ha dimensione finita
non potremo sperare di trovare una base con un numero finito di elementi.
Introduciamo quindi la seguente.
Definizione 7.69 (base hilbertiana). Sia 𝑉 uno spazio euclideo. Siano 𝑒 𝑘 ∈ 𝐻(𝑎, 𝑏) sistema ortonormale
con 𝑘 ∈ ℕ . Diremo che 𝑒 𝑘 è un sistema ortonormale se h𝑒 𝑘 , 𝑒 𝑗 i = 0 quando 𝑘 ≠ 𝑗 e
base hilbertiana
h𝑒 𝑘 , 𝑒 𝑘 i = 1 per ogni 𝑘 ∈ ℕ . Diremo che 𝑒 𝑘 è una base hilbertiana se è un sistema
ortonormale e inoltre per ogni 𝑣 ∈ 𝑉 esistono 𝑐 𝑘 ∈ ℝ con 𝑘 ∈ ℕ per cui si abbia
+∞
X
𝑣= 𝑐𝑘 𝑒𝑘 . (7.7)
𝑘=0
Teorema 7.70 (disuguaglianza di Bessel). Sia 𝑒0 , 𝑒1 , 𝑒2 , . . . un sistema ortonormale

in uno spazio euclideo 𝑉 . Per ogni 𝑣 ∈ 𝑉 e per ogni 𝑘 ∈ ℕ si ponga 𝑐 𝑘 = h𝑣, 𝑒 𝑘 i . disuguaglianza di Bessel
Allora vale la disuguaglianza di Bessel:

+∞
𝑐 2𝑘 ≤ |𝑣| 2 .
X
(7.8)
𝑘=0
Vale inoltre l’uguaglianza

+∞
𝑐 2𝑘 = |𝑣| 2
X
(7.9)
𝑘=0
se e solo se vale la (7.7).

Possiamo quindi affermare che il sistema ortonormale 𝑒0 , 𝑒1 , 𝑒2 , . . . è una base hilbertiana

se e solo se per ogni 𝑣 ∈ 𝑉 vale l’uguaglianza (7.9).
Dimostrazione. Dato 𝑣 ∈ 𝑉 poniamo 𝑐 𝑘 = h𝑣, 𝑒 𝑘 i e
𝑁
X
𝑣𝑁 = 𝑐𝑘 𝑒𝑘 , 𝑤𝑁 = 𝑣 − 𝑣𝑁 .
𝑘=0
Osserviamo che per ogni 𝑛 ∈ ℕ si ha h𝑣 𝑁 , 𝑤 𝑁 i = 0 (𝑤 𝑁 è ortogonale a 𝑣 𝑁 ) in

quanto se 𝑛 ≤ 𝑁 :
𝑁
X
h𝑤 𝑁 , 𝑒 𝑛 i = h𝑣, 𝑒 𝑛 i − 𝑐 𝑘 h𝑒 𝑘 , 𝑒 𝑛 i = h𝑣, 𝑒 𝑛 i − 𝑐 𝑛 = 0
𝑘=0
e quindi
𝑁
X
h𝑤 𝑁 , 𝑣 𝑁 i = 𝑐 𝑘 h𝑤 𝑁 , 𝑒 𝑘 i = 0.
𝑘=0
dunque possiamo concludere, grazie al teorema di Pitagora (7.1)
|𝑣| 2 = |𝑣 𝑁 + 𝑤 𝑁 | 2 = |𝑣 𝑁 | 2 + |𝑤 𝑁 | 2
2
X 𝑁 𝑁
2
X
≥ |𝑣 𝑁 | = 𝑐𝑘 𝑒𝑘 = 𝑐 2𝑘 .

𝑘=0 𝑘=0
Passando al limite per 𝑁 → +∞ si ottiene la disuguaglianza di Bessel.
Abbiamo visto che |𝑤 𝑁 | 2 = |𝑣| 2 − |𝑣 𝑁 | 2 dunque la condizione |𝑤 𝑁 | 2 → 0 è

equivalente all’uguaglianza di Bessel: |𝑣 𝑁 | 2 → |𝑣| 2 . Il sistema è hilbertiano,
per definizione, se e solo se 𝑣 𝑁 → 𝑣 ovvero se 𝑤 𝑁 → 0.
Il nostro obiettivo è ora quello di produrre una base hilbertiana di 𝐻(0 , 2𝜋).
Una base di 𝐻(𝑎, 𝑏) si potrà ottenere di conseguenza traslando e riscalando
Dal punto di vista algebrico sarebbe mol-
opportunamente le funzioni della base di 𝐻(0 , 2𝜋). Consideriamo le seguenti
to più semplice considerare le funzioni
a valori complessi: funzioni trigonometriche:
𝑒 𝑖 𝑘𝑥 1
𝑒 𝑘 (𝑥) = √ 𝑒0 (𝑥) = √
2𝜋
2𝜋
al variare di 𝑘 ∈ ℤ. Preferiamo però sin(𝑘𝑥)
rimanere nell’ambito delle funzioni rea- 𝑒2 𝑘+1 (𝑥) = √ 𝑘 = 0, 1, . . . (7.10)
li per non dover introdurre la strut- 𝜋
tura hermitiana degli spazi vettoriali cos(𝑘𝑥)
complessi. 𝑒2 𝑘 (𝑥) = √ 𝑘 = 1, 2, . . .
𝜋
Ovviamente s∫
2𝜋
1
k𝑒0 k 2 = √ 𝑑𝑥 = 1
0 2𝜋
ma è anche facile verificare che
∫ 2𝜋 ∫ 2 𝑘𝜋 ∫ 2𝜋
1
cos2 (𝑘𝑥) 𝑑𝑥 = cos2 𝑦 𝑑𝑦 = cos2 𝑦 𝑑𝑦 = 𝜋
0 𝑘 0 0
da cui si ottiene k𝑒2 𝑘 k 2 = 1. Visto che la funzione sin è la traslata di cos si

ottiene analogamente che k𝑒2 𝑘+1 k 2 = 1. Dunque i vettori 𝑒0 , 𝑒1 , . . . sono tutti di
modulo unitario. Utilizzando la formula di Eulero si può trovare la formula di
Werner:
𝑒 𝑖𝑛𝑥 − 𝑒 −𝑖𝑛𝑥 𝑒 𝑖𝑚𝑥 − 𝑒 −𝑖𝑚𝑛

sin(𝑚𝑥) cos(𝑛𝑥) = ·
2 2𝑖
𝑒 𝑖(𝑚+𝑛)𝑥 𝑒 −𝑖(𝑚+𝑛)𝑥 𝑒 𝑖(𝑚−𝑛)𝑥 𝑒 −𝑖(𝑚−𝑛)𝑥
= + + −
4𝑖 4𝑖 4𝑖 4𝑖
sin ((𝑚 + 𝑛)𝑥) sin ((𝑚 − 𝑛)𝑥)
= +
2 2
da cui se 𝑚 ≠ 𝑛 :
∫ 2𝜋
1
sin(𝑚𝑥) cos(𝑛𝑥) 𝑑𝑥 = − [cos ((𝑚 + 𝑛)𝑥)]20𝜋
0 2(𝑚 + 𝑛)
1
− [cos ((𝑚 − 𝑛)𝑥)]20𝜋 = 0
2(𝑚 − 𝑛)
e se 𝑚 = 𝑛 si arriva comunque allo stesso risultato. Questo significa che

h𝑒2𝑛 , 𝑒2𝑚+1 i = 1. Discorso analogo si può fare per le funzioni sin(𝑚𝑥) sin(𝑛𝑥) e
cos(𝑚𝑥) cos(𝑛𝑥) trovando, anche in quei casi, che tali prodotti hanno integrale
nullo nell’intervallo [0 , 2𝜋]. Per nostra memoria le formule di Werner che si
trovano in questi ultimi casi sono:
cos((𝑚 + 𝑛)𝑥) cos((𝑚 − 𝑛)𝑥)

cos(𝑚𝑥) cos(𝑛𝑥) = +
2 2
cos((𝑚 − 𝑛)𝑥) cos((𝑚 + 𝑛)𝑥)
sin(𝑚𝑥) sin(𝑛𝑥) = − .
2 2
Risulta dunque che le funzioni 𝑒0 , 𝑒1 , 𝑒2 , . . . definite da (7.10) formano un

sistema ortonormale in 𝐻(0 , 2𝜋) in quanto si ha:
(
1 se 𝑚 = 𝑛
h𝑒 𝑛 , 𝑒 𝑚 i =
0 altrimenti.
Di conseguenza le funzioni 𝑒0 , 𝑒1 , 𝑒2 , . . . sono tra loro indipendenti in 𝐻(0 , 2𝜋)

in quanto se una loro combinazione lineare è nulla:
𝑛
X
𝜆𝑘 𝑒𝑘 = 0
𝑘=0
allora, facendone il prodotto scalare con 𝑒 𝑗 si ottiene:
𝑛
X 𝑛
X
0=h 𝜆𝑘 𝑒𝑘 , 𝑒 𝑗 i = 𝜆 𝑘 h𝑒 𝑘 , 𝑒 𝑗 i = 𝜆 𝑗
𝑘=0 𝑘=0
e dunque tutti i coefficienti 𝜆 𝑗 sono nulli. Possiamo in particolare dedurre che

𝐻(0 , 2𝜋) ha dimensione infinita.
Definizione 7.71 (polinomi trigonometrici). Una funzione 𝑓 si dice essere un

polinomio trigonometrico se esiste un polinomio in due variabili 𝑃(𝑋 , 𝑌) tale che
polinomio trigonometrico
𝑓 (𝑥) = 𝑃(cos 𝑥, sin 𝑥).
Possiamo verificare che 𝑓 è un polinomio trigonometrico se e solo se è possibile

scrivere 𝑓 come combinazione lineare finita delle funzioni 𝑒 𝑘 appena introdotte,
cioè se esistono 𝑐 0 , 𝑐 1 , . . . , 𝑐 𝑛 ∈ ℝ tali che
X
𝑓 = 𝑐𝑘 𝑒𝑘 .
𝑘=0
Basta infatti ricondurre le funzioni trigonometriche all’esponenziale complesso,

tramite la formula di Eulero:
cos(𝑛𝑥) + 𝑖 sin(𝑛𝑥) = 𝑒 𝑖𝑛𝑥 = (𝑒 𝑖𝑛 ) 𝑘 = (cos 𝑥 + 𝑖 sin 𝑥)𝑛

𝑛
𝑛
𝑖 𝑘 (sin 𝑥) 𝑘 (cos 𝑥)𝑛−𝑘
X
=
𝑘=0
𝑘
da cui, prendendo parte reale, e parte immaginaria si riesce ad esprimere

cos(𝑛𝑥) e sin(𝑛𝑥) come polinomio in sin 𝑥 e cos 𝑥 . Più precisamente per il
coseno si ottengono solo i termini con 𝑘 pari:
𝑛
bX
2c
𝑛

cos(𝑛𝑥) = (−1) 𝑘 (sin 𝑥)2 𝑘 (cos 𝑥)𝑛−2 𝑘
𝑘=0
2𝑘
𝑛
bX
2c
𝑛

𝑘
= cos2 𝑥 − 1 (cos 𝑥)𝑛−2 𝑘
𝑘=0
2𝑘
ovvero
cos(𝑛𝑥) = 𝑇𝑛 (cos 𝑥)
dove
𝑛
bX
2c
𝑛

𝑘
𝑇𝑛 (𝑥) = 𝑥 2 − 1 𝑥 𝑛−2 𝑘
𝑘=0
2𝑘
si chiama polinomio di Chebyshev di prima specie. Questo significa che ognuna delle
funzioni 𝑒 𝑘 che abbiamo introdotto in (7.10) è un polinomio trigonometrico
e quindi ogni combinazione finita di tali funzioni è ancora un polinomio
trigonometrico.
Viceversa per verificare che ogni polinomio trigonometrico può essere rappre-
sentato come combinazione lineare finita degli elementi 𝑒 𝑘 possiamo osservare
che se 𝑓 (𝑥) = 𝑃(cos 𝑥, sin 𝑥) è un polinomio trigonometrico allora usando le
formule di Eulero si può scrivere 𝑓 (𝑥) = 𝑄(𝑒 𝑖𝑥 , 𝑒 −𝑖𝑥 ) dove 𝑄 è un polinomio a
coefficienti complessi. Ma osservando che
𝑛
𝑒 𝑖𝑥 = 𝑒 𝑖𝑛𝑥
si ottiene che 𝑓 (𝑥) può essere scritta come combinazione lineare complessa delle
funzioni 𝑒 𝑖 𝑘𝑥 e 𝑒 −𝑖𝑘𝑥 . Utilizzando nuovamente le fomule di Eulero si deduce
che 𝑓 (𝑥) può essere scritta come combinazione lineare complessa delle funzioni
cos(𝑖 𝑘𝑥) e sin(𝑖 𝑘𝑥):

𝑛
X
𝑓 (𝑥) = (𝑧 𝑘 cos(𝑖 𝑘𝑥) + 𝑤 𝑘 sin(𝑖 𝑘𝑥)).
𝑘=0
Ma visto che sappiamo che 𝑓 (𝑥) è una funzione reale, la somma delle parti
immaginarie di questa combinazione lineare è nulla e dunque abbiamo ottenuto
che 𝑓 (𝑥) è combinazione lineare a coefficienti reali delle funzioni 𝑒 𝑛 .
Definizione 7.72 (serie di Fourier). Se 𝑓 ∈ H(0 , 2𝜋) i coefficienti 𝑐 𝑘 = h 𝑓 , 𝑒 𝑘 i si

coefficienti di Fourier
chiamano coefficienti di Fourier di 𝑓 e la serie
+∞
X
𝑐𝑘 𝑒𝑘
𝑘=0
serie di Fourier
si chiama serie di Fourier di 𝑓 . Il polinomio trigonometrico
𝑁
X
𝑓𝑁 = 𝑐𝑘 𝑒𝑘
𝑘=0
sviluppo di Fourier
si chiama sviluppo di Fourier di ordine 𝑁 per 𝑓 .
Esempio 7.73. Calcoliamo lo sviluppo di Fourier della funzione:

(
1 se 𝑥 ∈ [0 , 𝜋]
𝑓 (𝑥) =
−1 se 𝑥 ∈ [𝜋, 2𝜋].
Per quanto riguarda 𝑐 0 = h 𝑓 , 𝑒0 i si ha banalmente:

∫ 2𝜋 ∫ 𝜋 ∫ 𝜋
1 1
𝑐0 = 𝑓 (𝑥) · √ 𝑑𝑥 = √ 1 𝑑𝑥 + (−1) 𝑑𝑥 = 0.
0 2𝜋 2𝜋 0 0
Per 𝑐 2 𝑘 = h 𝑓 , 𝑒2 𝑘 i si ha
∫ 2𝜋
cos(𝑘𝑥)
𝑐2𝑘 = 𝑓 (𝑥) √ 𝑑𝑥
0 𝜋
∫ 𝜋 ∫ 2𝜋
1
=√ cos(𝑘𝑥) 𝑑𝑥 − cos(𝑘𝑥) 𝑑𝑥 = 0
𝜋 0 𝜋
per motivi di simmetria. Per calcolare 𝑐 2 𝑘+1 = h 𝑓 , 𝑒2 𝑘+1 i si trova

∫ 𝜋 ∫ 2𝜋
sin(𝑘𝑥) sin(𝑘𝑥)
𝑐 2 𝑘+1 = √ 𝑑𝑥 − √ 𝑑𝑥
0 𝜋 𝜋 𝜋
∫ 𝜋 ∫ 𝑘𝜋
2 2
=√ sin(𝑘𝑥) 𝑑𝑥 = √ sin 𝑡 𝑑𝑡
𝜋 0 𝑘 𝜋 0
(
0 se 𝑘 pari,
=
𝑘 𝜋
4
√ se 𝑘 dispari.
Figura 7.3: Lo sviluppo di Fourier del-

la funzione che vale 1 su [0 , 𝜋] e −1
4 sin(𝑥) 4 sin(3 𝑥)
su [𝜋, 2𝜋]: 𝑓61 (𝑥) = 𝜋 + 3𝜋 +
4 sin(5 𝑥) 4 sin(7 𝑥) 4 sin(9 𝑥) 4 sin(11 𝑥)
5𝜋 + 7𝜋 + 9𝜋 + 11𝜋 +
13𝜋 + 15𝜋 + 17𝜋 + 19𝜋 +
21𝜋 + 23𝜋 + 25𝜋 + 27𝜋 +
4 sin(29 𝑥) 4 sin(31 𝑥)
29𝜋 + 31𝜋 . Il codice per calco-
lare i coefficienti e generare il grafico si
trova a pagina 429.
Si trova quindi che

𝑛
X 4
𝑓2𝑛+1 (𝑥) = √ sin((2 𝑘 + 1)𝑥).
𝑘=0 (2 𝑘 + 1) 𝜋
Si veda la figura 7.3.
Risulta naturale chiedersi se quella che abbiamo introdotto è una base hilbertiana
perché solo in tal caso gli sviluppi di Fourier approssimano la funzione. Per
ottenere questo risultato dobbiamo assumere la validità del seguente teorema,
che sarebbe ora troppo lungo dimostrare.
Teorema 7.74 (densità dei polinomi trigonometrici). Per ogni funzione continua
𝑓 ∈ 𝐶 0 ([𝑎, 𝑏]) esiste una successione 𝑔 𝑘 ∈ H(𝑎, 𝑏) di polinomi trigonometrici (cioè
combinazioni lineari finite del sistema {𝑒 𝑘 }) tale che 𝑔 𝑘 converge uniformemente a 𝑓 .
Detto in altri termini: l’insieme dei polinomi trigonometrici è denso nello spazio
𝐶 0 ([𝑎, 𝑏]) rispetto alla norma uniforme.
Osserviamo che la convergenza uniforme è più forte della convergenza in

𝐻(𝑎, 𝑏) in quanto si ha, banalmente:
∫ 𝑏 ∫ 𝑏
k𝑓 k 22 = 𝑓 (𝑥) 𝑑𝑥 ≤
2
k 𝑓 k 2∞ 𝑑𝑥 = (𝑏 − 𝑎) · k 𝑓 k 2∞ .
𝑎 𝑎
Dunque il teorema precedente garantisce che ogni funzione continua in H(𝑎, 𝑏)

può essere approssimata, rispetto alla norma k·k 2 , tramite polinomi trigonome-
trici. Il teorema seguente ci permette di estendere questa proprietà a tutte le
funzioni di H(𝑎, 𝑏).
Teorema 7.75 (densità delle funzioni continue). Data una qualunque 𝑓 ∈ 𝐻(𝑎, 𝑏)
per ogni 𝜀 > 0 esiste una funzione continua 𝑔 : [𝑎, 𝑏] → ℝ tale che k 𝑓 − 𝑔 k 2 < 𝜀.
Detto in altri termini: 𝐶 0 ([𝑎, 𝑏]) è un sottospazio denso in 𝐻(𝑎, 𝑏) cioè un insieme la
cui chiusura (nella topologia di 𝐻(𝑎, 𝑏)) è tutto 𝐻(𝑎, 𝑏).
Dimostrazione. Se 𝑓 ∈ 𝐻(𝑎, 𝑏) si ha, per la disuguaglianza di Cauchy-Schwarz:

∫ 𝑏 √
| 𝑓 (𝑥)| 𝑑𝑥 ≤ k 1 k 2 · k 𝑓 k 2 = 𝑏 − 𝑎 · k 𝑓 k 2 < +∞.
𝑎
Dunque la funzione 𝑓 è assolutamente integrabile su (𝑎, 𝑏). Se 𝑓 è limita-

ta su (𝑎, 𝑏) possiamo pensare che 𝑓 sia definita su [𝑎, 𝑏] e l’integrale è un
usuale integrale di Riemann (non improprio). Per le condizioni di integra-
bilità sappiamo che per ogni 𝜀 > 0 è possibile trovare una suddivisione
𝑎 = 𝑥0 < 𝑥 1 < · · · < 𝑥 𝑛 = 𝑏 su cui l’integrale di 𝑓 differisce dagli integrali
superiore e inferiore per meno di 𝜀. Possiamo prendere come funzione 𝑔 una
interpolazione lineare cioè una funzione tale che si abbia 𝑔(𝑥 𝑘 ) = 𝑓 (𝑥 𝑘 ) sui
punti della suddivisione e che risulti lineare su ogni intervallino [𝑥 𝑘 , 𝑥 𝑘+1 ]. La
funzione 𝑔 così definita è compresa, su ogni intervallino, tra l’inf e il sup di 𝑓 e
dunque si avrà:
∫ 𝑏
| 𝑓 (𝑥) − 𝑔(𝑥)| 𝑑𝑥 < 𝜀.
𝑎
Visto però che 𝑓 è limitata sappiamo esistere 𝑀 > 0 per cui k 𝑓 k ∞ ≤ 𝑀 e di

conseguenza k 𝑔k ∞ ≤ 𝑀 e quindi k 𝑓 − 𝑔k 2 ≤ 2 𝑀 . Ma allora
∫ 𝑏 ∫ 𝑏
k 𝑓 − 𝑔 k 22 = | 𝑓 (𝑥) − 𝑔(𝑥)| 2 𝑑𝑥 ≤ k 𝑓 − 𝑔k ∞ · | 𝑓 (𝑥) − 𝑔(𝑥)| 𝑑𝑥 ≤ 2 𝑀𝜀.
𝑎 𝑎
Abbiamo quindi mostrato che una funzione limitata e integrabile può essere
approssimata con funzioni continue.
Se la funzione è integrabile in senso improprio su (𝑎, 𝑏) ma non è limitata,

per definizione di integrale improprio per ogni 𝜀 > 0 possiamo trovare un
intervallo [𝛼, 𝛽] ⊆ (𝑎, 𝑏) per 𝑓 risulta limitata su [𝛼, 𝛽 ] e l’integrale di 𝑓 su
(𝑎, 𝑏) differisce dall’integrale di 𝑓 su [𝛼, 𝛽] per meno di 𝜀. Ci possiamo quindi
ricondurre al passo precedente per trovare una funzione 𝑔 che approssima
bene 𝑓 sull’intervallo [𝛼, 𝛽]. Estendendo 𝑔 in modo costante su (𝑎, 𝑏) \ [𝛼, 𝛽] si
troverà una funzione che approssima bene 𝑓 su tutto (𝑎, 𝑏).
Grazie ai due teoremi precedenti sappiamo che ogni 𝑓 ∈ H(𝑎, 𝑏) può essere
approssimata da polinomi trigonometrici 𝑔𝑁 → 𝑓 cioè da funzioni della
forma:
𝑁
X
𝑔𝑁 = 𝑎 𝑘,𝑁 𝑒 𝑘 .
𝑘=0
Stiamo qui assumendo che il polinomio trigonometrico 𝑔𝑁 abbia ordine non

superiore ad 𝑁 , ma questo si può sempre assumere, scartando o ripetendo i
termini della successione.
Se ora consideriamo gli sviluppi di Fourier:
𝑁
X
𝑓𝑁 = 𝑐𝑘 𝑒𝑘 , 𝑐𝑘 = h 𝑓 , 𝑒𝑘 i (7.11)
𝑘=0
ci ricordiamo che per ogni 𝑘 ≤ 𝑁 risulta
𝑘 = 0𝑁 (h 𝑓 , 𝑒 𝑘 i − 𝑐 𝑘 ) = 0
X
h 𝑓 − 𝑓𝑁 , 𝑒 𝑘 i =
e quindi
𝑁
X
h 𝑓 − 𝑓𝑁 , 𝑔𝑁 − 𝑓𝑁 i = h 𝑓 − 𝑓𝑁 , (𝑎 𝑘,𝑁 − 𝑐 𝑘 )𝑒 𝑘 i = 0.
𝑘=0
Dunque, applicando il teorema di Pitagora,
k 𝑓 − 𝑓𝑁 k 22 = k 𝑓 − 𝑔𝑁 k 22 − k 𝑓𝑁 − 𝑔𝑁 k 22 ≤ k 𝑓 − 𝑔𝑁 k 22 → 0.
Abbiamo quindi dimostrato il seguente.
Teorema 7.76 (serie di Fourier). Se 𝑓 ∈ H(0 , 2𝜋) e 𝑐 𝑘 , 𝑓𝑁 sono definiti da (7.11)

allora 𝑓 𝑘 → 𝑓 in norma k·k 2 . In particolare vale l’uguaglianza di Bessel
+∞
𝑐 𝑘 = k 𝑓 k 22 .
X
(7.12)
𝑘=0
Questo significa, dunque, che il sistema ortonormale che abbiamo introdotto

è una base hilbertiana e quindi che ogni funzione 𝑓 ∈ H(0 , 2𝜋) si approssima
rispetto alla norma k·k 2 con gli sviluppi di Fourier.
Ricordiamo che se k 𝑓𝑁 − 𝑓 k 2 → 0 non è detto che si abbia la convergenza

puntuale 𝑓𝑁 (𝑥) → 𝑓 (𝑥) per ogni 𝑥 ∈ (0 , 2𝜋) in quanto il limite è unico in
𝐻(𝑎, 𝑏) ma non in H(𝑎, 𝑏) e dunque è possibile (e in effetti può succedere) che
il limite puntuale degli sviluppi di Fourier differisca, in alcuni punti, dalla
funzione che si sta approssimando.
Purtroppo lo spazio 𝐻(𝑎, 𝑏) non risulta essere completo, come si può vedere
nel seguente esempio.
Esempio 7.77 (razionali ingrassati). Dimostrare che lo spazio 𝐻(0 , 1) non è completo.
Sappiamo che l’insieme [0 , 1] ∩ ℚ è numerabile, quindi esiste una successione 𝑞 𝑘

che elenca tutti i numeri razionali nell’intervallo [0 , 1]. Poniamo inoltre 𝑟 𝑘 = 4·12𝑘
e consideriamo gli intervalli 𝐼 𝑘 = [𝑞 𝑘 − 𝑟 𝑘 , 𝑞 𝑘 + 𝑟 𝑘 ]. Prendiamo la successione di
funzioni 𝑓𝑛 : [0 , 1] → ℝ definita da
 [𝑛
 1 se 𝑥 ∈ 𝐼𝑘



𝑓𝑛 (𝑥) = 𝑘=1

 0 altrimenti


A differenza di quanto uno potrebbe pensare, queste funzioni 𝑓𝑛 non diventano mai
identicamente uguali ad 1. Anzi, si può osservare che
∫ 1 𝑛 ∫ 𝑞 𝑘 +𝑟 𝑘 𝑛 +∞
X X 1 1X 1 1
𝑓𝑛 (𝑥) 𝑑𝑥 ≤ 1 𝑑𝑥 = 𝑘
≤ 𝑘
= .
0 𝑘=1 𝑞 𝑘 −𝑟 𝑘 𝑘=1 2·2 2 𝑘=1 2 2
Si può mostrare che 𝑓 𝑘 è una successione di Cauchy in 𝐻(0 , 1) e che però non converge
in 𝐻(0 , 1).
Dimostrazione. Per verificare che 𝑓𝑛 è una successione di Cauchy possiamo

semplicemente osservare che se 𝑛 ≥ 𝑚 risulta che 𝑓𝑛 e 𝑓𝑚 differiscono solamente
sugli intervalli 𝐼 𝑘 con 𝑘 compreso tra 𝑚 ed 𝑛 . Dunque:
∫ 1 +∞ ∫ 𝑞 𝑘 +𝑟 𝑘 +∞
X X 1 1
| 𝑓𝑛 − 𝑓𝑚 | ≤ 1 𝑑𝑥 = 𝑘
= 𝑚.
0 𝑘=𝑚 𝑞 𝑘 −𝑟 𝑘 𝑘=𝑚 2·2 2
Visto che 𝑓𝑛 e 𝑓𝑚 assumono solamente i valori 0 e 1 anche | 𝑓𝑛 − 𝑓𝑚 | assume

solamente i valori 0 e 1 quindi | 𝑓𝑛 − 𝑓𝑚 | 2 = | 𝑓𝑛 − 𝑓𝑚 | . Abbiamo quindi verificato
che per 𝑛 ≥ 𝑚 si ha:
r
1
k 𝑓𝑛 − 𝑓𝑚 k 2 ≤ .
2𝑚
E’ dunque chiaro che comunque sia scelto 𝜀 > 0 possiamo scegliere 𝑁 tale che
1/2𝑁 ≤ 𝜀2 da cui si ottiene che se 𝑛, 𝑚 ≥ 𝑁 allora k 𝑓𝑛 − 𝑓𝑚 k 2 ≤ 𝜀. Cioè: 𝑓𝑛 è
una successione di Cauchy.
Supponiamo ora, per assurdo, che esista 𝑓 ∈ 𝐻(0 , 1) tale che k 𝑓𝑛 − 𝑓 k 2 → 0.

Innanzitutto visto che ogni 𝑓 𝑘 ≤ 1 possiamo supporre che sia anche 𝑓 ≤ 1 perché
altrimenti potremmo prendere 𝑔(𝑥) = min { 𝑓 (𝑥), 1} e avremmo chiaramente
k 𝑓𝑛 − 𝑔 k 2 ≤ k 𝑓𝑛 − 𝑓 k 2 → 0. In pratica stiamo dicendo che modificando la
funzione 𝑓 senza cambiarne l’integrale possiamo suppore che 𝑓 (𝑥) ≤ 1 per ogni
𝑥 ∈ [0 , 1].
Fissato un intervallo 𝐼𝑛 , per 𝑘 → +∞ si ha:

∫ 𝑞 𝑛 +𝑟𝑛 ∫ 1
2
0≤ | 𝑓 𝑘 (𝑥) − 𝑓 (𝑥)| 𝑑𝑥 ≤ | 𝑓 𝑘 (𝑥) − 𝑓 (𝑥)| 2 𝑑𝑥 = k 𝑓 𝑘 − 𝑓 k 22 → 0.
𝑞 𝑛 −𝑟𝑛 0
Ma ora se 𝑘 ≥ 𝑛 risulta che 𝑓 𝑘 = 1 su 𝐼𝑛 e quindi il valore dell’integrale

precedente non dipende da 𝑘 e dovrà quindi essere identicamente nullo:
∫ 𝑞 𝑛 +𝑟𝑛
(1 − 𝑓 (𝑥)) 𝑑𝑥 = 0
𝑞 𝑛 −𝑟𝑛
e quindi possiamo affermare che sup 𝑓 (𝐼𝑛 ) = 1 in quanto se fosse sup 𝑓 (𝐼𝑛 ) =
𝜆 < 1 l’integrale di 𝑓 (𝑥) − 1 sarebbe positivo sull’intervallo 𝐼𝑛 .
Vogliamo ora dimostrare che su ogni intervallo [𝑎, 𝑏] ⊆ [0 , 1] si ha sup 𝑓 ([𝑎, 𝑏]) =
1. Prendiamo 𝑁 abbastanza grande in modo che 𝑟 𝑁 < (𝑏 − 𝑎)/3. Allora l’in-
tervallo [𝑎 + 𝑟𝑛 , 𝑏 − 𝑟𝑛 ] ha ampiezza 2𝑟𝑛 e contiene infiniti numeri razionali.
Esistono quindi infiniti indici 𝑛 per cui 𝑞 𝑛 sta in tale intervallo. Tra questi
infiniti certamente ce n’è uno con indice 𝑛 ≥ 𝑁 (perché i 𝑞 𝑛 con 𝑛 < 𝑁 sono
in numero finito). Ma se 𝑞 𝑛 ∈ [𝑎 + 𝑟𝑛 , 𝑏 − 𝑟𝑛 ] allora 𝐼𝑛 ⊆ [𝑎, 𝑏] e quindi
sup 𝑓 ([𝑎, 𝑏]) ≥ sup 𝑓 (𝐼𝑛 ) = 1.
Questo significa che per ogni suddivisione di Riemann dell’intervallo [0 , 1]

risulta che il sup di 𝑓 sugli intervallini della suddivisione è 1 e quindi l’integrale
superiore di 𝑓 è anch’esso 1. Dunque, essendo 𝑓 integrabile,

∫ 𝑏
𝑓 (𝑥) = 1.
𝑎
Vogliamo ora concludere che questo è in contraddizione con la disuguaglianza

∫ 𝑏
1
𝑓𝑛 (𝑥) ≤
𝑎 2
che abbiamo osservato all’inizio. Si ha infatti per la disuguaglianza di Cauchy-

Schwarz
∫ 1
| 𝑓 (𝑥) − 𝑓𝑛 (𝑥)| 𝑑𝑥 ≤ k 𝑓 − 𝑓𝑛 k 2 · k 1 k 2 → 0
0
e quindi, per il criterio di convergenza assoluta,

∫ 1
( 𝑓 (𝑥) − 𝑓𝑛 (𝑥)) 𝑑𝑥 → 0.
0
Ma abbiamo visto che

∫ 1 ∫ 1 ∫ 1
1 1
( 𝑓 (𝑥) − 𝑓𝑛 (𝑥)) 𝑑𝑥 = 𝑓 (𝑥) 𝑑𝑥 − 𝑓𝑛 (𝑥) 𝑑𝑥 ≥ 1 − =
0 0 0 2 2
ottenendo quindi un assurdo.
Il fatto di avere trovato una base hilbertiana di 𝐻(0 , 2𝜋) (e quindi in ogni 𝐻(𝑎, 𝑏))
ci permette di dire che ogni funzione in 𝐻(0 , 2𝜋) può essere rappresentata dalle
sue coordinate 𝑐 𝑘 in modo che valga l’uguaglianza di Bessel:
s
+∞
X
k 𝑓 k2 = 𝑐 2𝑘 .
𝑘=0
Abbiamo in effetti definito una corrispondenza:

( )
+∞
X
𝜑 : 𝐻(0 , 2𝜋) → ℓ , 2
ℓ = 𝑐∈ℕ :
2 ℝ
𝑐 2𝑘 < +∞
𝑘=0
definita da
𝑐 𝑘 = 𝜑( 𝑓 ) = h 𝑓 , 𝑒 𝑘 i.
Chiaramente tale 𝜑 è lineare. Visto che 𝑒 𝑘 è una base hilbertiana è facile
verificare che 𝜑 è anche iniettivo. Se su ℓ 2 definiamo il prodotto scalare e la
norma corrispondente:
s
+∞
X +∞
X
h𝑥, 𝑦i = 𝑥 𝑘 𝑦𝑘 , |𝑥| 2 = 𝑥 2𝑘
𝑘=0 𝑘=0
l’uguaglianza di Bessel ci dice che 𝜑 mantiene la norma e quindi la struttura di

spazio euclideo. Si potrebbe dimostrare che ℓ 2 è completo e questo significa che
𝜑 non è suriettiva in quanto la successione 𝑓𝑛 considerata nell’esempio 7.77 è

di Cauchy in 𝐻(0 , 2𝜋), dunque 𝜑( 𝑓𝑛 ) è di Cauchy in ℓ 2 e dunque converge in ℓ 2 .
Il limite 𝑐 della successione 𝜑( 𝑓𝑛 ) rappresenta una successione di coefficienti di
Fourier che non possono essere ottenuti da nessuna funzione 𝑓 ∈ 𝐻(0 , 2𝜋).
Il problema di Basilea è un problema
Possiamo utilizzare le serie di Fourier per risolvere il seguente. posto da Mengoli nel 1650 e risolto da
Eulero nel 1734 dopo che i maggiori ma-
tematici del tempo (tra cui i famosi mem-
Esercizio 7.78 (problema di Basilea). Dimostriamo che bri della famiglia Bernoulli che vivevano
appunto a Basilea) avevano tentato inva-
+∞ no di risolverlo. Si tratta di determinare
X 1 𝜋2
= . (7.13) la somma della serie (7.13). La soluzio-
𝑘=1 𝑘2 6 ne di Eulero (completamente diversa da
quella che stiamo proponendo qui) è sta-
ta poi ripresa da Riemann che ha definito
la celebre funzione zeta
Svolgimento. Calcoliamo i coefficienti di Fourier della funzione 𝑓 (𝑥) = 𝑥 in +∞
1
𝐻(0 , 2𝜋). Si ha
X
𝜁(𝑠) =
𝑘=1
𝑘𝑠
2𝜋 2𝜋 2𝜋 √
𝑥 𝑥2
∫ ∫
1 di grandissima rilevanza nella teoria dei
𝑐0 = 𝑓 (𝑥) · 𝑒0 (𝑥) 𝑑𝑥 = √ 𝑑𝑥 = √ = 2𝜋3 numeri.
0 0 2𝜋 2𝜋 2 0
poi
∫ 2𝜋
sin(𝑘𝑥)
𝑐 2 𝑘+1 = 𝑥· √ 𝑑𝑥
0 𝜋
2𝜋 2𝜋
𝑥(− cos(𝑘𝑥))
∫
− cos(𝑘𝑥)
= √ − √ 𝑑𝑥
𝑘 𝜋 0 0 𝑘 𝜋
√
−2 𝜋 2 𝜋
= √ −0=−
𝑘 𝜋 𝑘
e infine
∫ 2𝜋
cos(𝑘𝑥)
𝑐2𝑘 = 𝑥· √ 𝑑𝑥
0 𝜋
2𝜋 2𝜋
𝑥 sin(𝑘𝑥)
∫
sin(𝑘𝑥)
= √ − √ 𝑑𝑥 = 0.
𝜋𝑘 0 0 𝜋𝑘
Allora l’equazione di Bessel (7.12) ci dice che vale

+∞ +∞ +∞
4𝜋
k𝑥k 22 =
X X X
𝑐 2𝑘 = 𝑐 0 + 𝑐 22𝑘+1 = 2𝜋3 + .
𝑘=0 𝑘=0 𝑘=1 𝑘2
Ma è facile calcolare
2𝜋 2𝜋
𝑥3 8𝜋 3
∫
k𝑥k 22 = 𝑥 2 𝑑𝑥 = =
0 3 0
3
e quindi
+∞
8𝜋 3 X 1
= 2𝜋 3 + 4𝜋
3 𝑘=1 𝑘 2
da cui segue il risultato voluto.

7.7 divagazione sui frattali autosimili
In questo capitolo mostriamo una applicazione geometrica del teorema delle

contrazioni. Considereremo uno spazio metrico i cui punti sono le figure
geometriche e vedremo che i frattali autosimili non sono altro che punti fissi di
opportune mappe contrattive.
Definizione 7.79. Siano 𝐴 e 𝐵 sottoinsiemi non vuoti di ℝ𝑛 . Definiamo la distanza

distanza di Hausdorff di Hausdorff tra 𝐴 e 𝐵 come:

𝑑H (𝐴, 𝐵) = max sup inf |𝑎 − 𝑏|, sup inf |𝑎 − 𝑏| .
𝑎∈𝐴 𝑏∈𝐵 𝑏∈𝐵 𝑎∈𝐴
Definiamo
K(ℝ𝑛 ) = {𝐴 ⊆ ℝ𝑛 : 𝐴 chiuso, limitato, non vuoto}.
Teorema 7.80 (caratterizzazione della distanza di Hausdorff). Se 𝐴 e 𝐵 sono

compatti di ℝ𝑛 (cioè chiusi e limitati) allora per ogni 𝑟 ∈ ℝ si ha
𝑑H (𝐴, 𝐵) ≤ 𝑟
se e solo se valgono entrambe le seguenti proprietà:
1. per ogni 𝑎 ∈ 𝐴 esiste 𝑏 ∈ 𝐵 tale che |𝑎 − 𝑏| ≤ 𝑟 ;

2. per ogni 𝑏 ∈ 𝐵 esiste 𝑎 ∈ 𝐴 tale che |𝑎 − 𝑏| ≤ 𝑟 .
Dimostrazione. Per ogni compatto non vuoto 𝐴 e per ogni 𝑥 ∈ ℝ𝑛 definiamo la

distanza tra il punto 𝑥 e l’insieme 𝐴 come:
𝑑(𝑥, 𝐴) = min |𝑥 − 𝑎|.

𝑎∈𝐴
Il minimo esiste in quanto 𝐴 è compatto e 𝑎 ↦→ 𝑑(𝑥, 𝑎) è una funzione continua.

Fissato 𝐴 la funzione 𝑥 ↦→ 𝑑(𝑥, 𝐴) è anch’essa continua, anzi è 1-lipschitziana.
Infatti se 𝑥 0 ∈ ℝ𝑛 esiste 𝑎 0 ∈ 𝐴 tale che 𝑑(𝑥 0 , 𝐴) = 𝑑(𝑥 0 , 𝑎 0) e dunque
𝑑(𝑥, 𝐴) = min |𝑥 − 𝑎| ≤ |𝑥 − 𝑎 0 | ≤ |𝑥 − 𝑥 0 | + |𝑥 0 − 𝑎 0 | = |𝑥 − 𝑥 0 | + 𝑑(𝑥 0 , 𝐴)

𝑥∈𝐴
da cui 𝑑(𝑥, 𝐴) − 𝑑(𝑥 0 , 𝐴) ≤ |𝑥 − 𝑥 0 | . Scambiando 𝑥 e 𝑥 0 si ottiene anche la

disuguaglianza inversa da cui la 1-lipschitzianità di 𝑑(𝑥, 𝐴). Dunque sui
compatti la funzione 𝑑(𝑥, 𝐴) assume sempre massimo e si ha:

𝑑H (𝐴, 𝐵) = max max 𝑑(𝑎, 𝐵), max 𝑑(𝑏, 𝐴) .
𝑎∈ 𝐴 𝑏∈𝐵
In particolare se 𝑑H (𝐴, 𝐵) ≤ 𝑟 per ogni 𝑎 ∈ 𝐴 si deve avere 𝑑(𝑎, 𝐵) ≤ 𝑟 e per

ogni 𝑏 ∈ 𝐵 si deve avere 𝑑(𝑏, 𝐴) ≤ 𝑟 . Ma allora valgono le due proprietà
dell’enunciato.
Viceversa se vale la proprietà 1. allora 𝑑(𝑎, 𝐵) ≤ 𝑟 e se vale la 2. 𝑑(𝑏, 𝐴) ≤ 𝑟 e di

conseguenza 𝐷H (𝐴, 𝐵) ≤ 𝑟 .
7.7 divagazione sui frattali autosimili 341
Teorema 7.81 (distanza di Hausdorff). La distanza di Hausdorff 𝑑H è una distanza

su K(ℝ𝑛 ) e lo spazio metrico K(ℝ𝑛 ) è completo.
Dimostrazione. Chiaramente se 𝐴, 𝐵 sono non vuoti si ha 𝑑H (𝐴, 𝐵) ≥ 0. Inoltre,

in base alla caratterizzazione del teorema precedente è facile osservare che
𝑑H (𝐴, 𝐵) < +∞.
Se 𝑑H (𝐴, 𝐵) = 0 significa che per ogni 𝑎 ∈ 𝐴 esiste 𝑏 ∈ 𝐵 tale che |𝑎 − 𝑏| = 0.

Cioè 𝑏 = 𝑎 . Dunque 𝐴 ⊆ 𝐵. Scambiando i ruoli di 𝐴 e 𝐵 si ottiene anche 𝐵 ⊆ 𝐴
da cui 𝐴 = 𝐵.
Che sia 𝑑H (𝐴, 𝐵) = 𝑑H (𝐵, 𝐴) è ovvio in quanto la definizione è simmetrica in

𝐴 e 𝐵.
Verifichiamo ora la disuguaglianza triangolare. Siano 𝐴, 𝐵, 𝐶 tre compatti non

vuoti. Per ogni 𝑎 ∈ 𝐴 esiste 𝑏 ∈ 𝐵 tale che |𝑎 − 𝑏| ≤ 𝑑H (𝐴, 𝐵) e per tale 𝑏 ∈ 𝐵
esiste un 𝑐 ∈ 𝐶 tale che |𝑏 − 𝑐| ≤ 𝑑H (𝐵, 𝐶). Dunque per ogni 𝑎 ∈ 𝐴 esiste un
𝑐 ∈ 𝐶 tale che
|𝑎 − 𝑐| ≤ |𝑎 − 𝑏| + |𝑏 − 𝑐| ≤ 𝑑H (𝐴, 𝐵) + 𝑑H (𝐵, 𝐶).
Scambiando i ruoli di 𝐴 e 𝐶 si ottiene anche la condizione simmetrica e dunque,

per la caratterizzazione della distanza di Hausdorff si ottiene la disuguaglianza
triangolare:
𝑑H (𝐴, 𝐶) ≤ 𝑑H (𝐴, 𝐵) + 𝑑H (𝐵, 𝐶).
Abbiamo quindi verificato che 𝑑H è una distanza su K(ℝ𝑛 ). Verifichiamo ora

che K(ℝ𝑛 ) è completo.
Sia 𝐴 𝑘 ∈ K(ℝ𝑛 ) una successione di Cauchy. Senza perdita di generalità

possiamo supporre che
1
𝑑H (𝐴 𝑘 , 𝐴 𝑘+1 ) ≤ 𝑘 .
2
Infatti essendo 𝐴 𝑘 di Cauchy è possibile trovarne una sottosuccessione con tale
proprietà, e se poi dimostriamo che la sottosuccessione converge allora l’intera
successione, essendo di Cauchy, deve convergere.
Consideriamo come candidato limite l’insieme di tutti i possibili limiti di punti

degli insiemi 𝐴 𝑘 :
𝐴 = {𝑥 ∈ ℝ𝑛 : ∃𝑥 𝑘 ∈ 𝐴 𝑘 : 𝑥 𝑘 → 𝑥}.
Per prima cosa vogliamo verificare che 𝐴 non è vuoto. Scelto un punto qualunque
𝑎 0 ∈ 𝐴0 esiste 𝑎1 ∈ 𝐴1 tale che |𝑎0 − 𝑎1 | = 𝑑H (𝐴0 , 𝐴1 ). Iterando otteniamo
una successione di punti 𝑎 𝑘 ∈ 𝐴 𝑘 tale che |𝑎 𝑘 − 𝑎 𝑘+1 | ≤ 𝑑H (𝐴 𝑘 , 𝐴 𝑘+1 ) ≤ 1/2 𝑘 .
Dunque 𝑎 𝑘 è una successione di Cauchy in ℝ𝑛 ed essendo ℝ𝑛 completo dovrà
convergere ad un punto 𝑎 che quindi è un punto di 𝐴.
Avendo assunto 𝑑H (𝐴 𝑘 , 𝐴 𝑘+1 ) < 1/2 𝑘 si ottiene (sommando la serie geometrica):
𝑛−1
X 2
𝑑H (𝐴 𝑘 , 𝐴𝑛 ) ≤ 𝑑H (𝐴 𝑗 , 𝐴 𝑗+1 ) ≤ se 𝑛 > 𝑘.
𝑗=𝑘 2𝑘
Questo ci permette di dimostrare che per ogni 𝑎 ∈ 𝐴 e per ogni 𝑘 ∈ ℕ esiste

𝑎 𝑘 ∈ 𝐴 𝑘 tale che |𝑎 − 𝑎 𝑘 | ≤ 4/2 𝑘 . Infatti se a distanza 4/2 𝑘 non ci fossero punti
di 𝐴 𝑘 allora a distanza 2/2 𝑘 non ci potrebbero essere punti di 𝐴𝑛 per nessun
𝑛 > 𝑘 in quanto visto che 𝑑H (𝐴 𝑘 , 𝐴𝑛 ) ≤ 2/2 𝑘 se ci fosse un punto di 𝐴𝑛 a
distanza inferiore a 2/2 𝑘 ci dovrebbe anche essere un punto di 𝐴 𝑘 a distanza
inferiore a 4/2 𝑘 . Ma questo è impossibile perché per come è definito 𝐴 deve
esistere 𝑥 𝑛 ∈ 𝐴𝑛 tale che 𝑥 𝑛 → 𝑎 . Abbiamo quindi mostrato che
sup inf |𝑎 − 𝑏| ≤ 4/2 𝑘 → 0.

𝑎∈𝐴 𝑏∈𝐴 𝑘
Viceversa ci proponiamo di mostrare che per ogni 𝑝 ∈ 𝐴 𝑘 esiste 𝑎 ∈ 𝐴 tale

che |𝑝 − 𝑎| < 2/2 𝑘 . Visto che 𝑑H (𝐴 𝑗+1 , 𝐴 𝑗 ) ≤ 1/2 𝑗 possiamo infatti costruire a
partire da 𝑎 𝑘 = 𝑝 ∈ 𝐴 𝑘 una successione 𝑎 𝑗 ∈ 𝐴 𝑗 con 𝑗 > 𝑘 , tale che 𝑑(𝑎 𝑗+1 , 𝑎 𝑗 ) ≤
1/2 𝑗 . Tale successione è di Cauchy quindi converge: 𝑎 𝑗 → 𝑎 e il suo limite 𝑎 è
quindi un punto di 𝐴 e si ha
∞ ∞
X X 1 2
|𝑎 − 𝑝| ≤ 𝑎 𝑗 − 𝑎 𝑗+1 ≤
𝑗
≤ 𝑘.
𝑗=𝑘 𝑗=𝑘 2 2
Abbiamo quindi dimostrato che
sup inf |𝑎 − 𝑏| ≤ 2/2 𝑘 → 0

𝑏∈𝑎 𝑘 𝑎∈𝐴
e quindi 𝑑H (𝐴 𝑘 , 𝐴) → 0.
Ci rimane solo da mostrare che 𝐴 è un insieme chiuso. Presa una successione

di punti 𝑥 𝑘 ∈ 𝐴 convergente 𝑥 𝑘 → 𝑥 , dobbiamo mostrare che 𝑥 ∈ 𝐴. Per ogni
𝑥 𝑘 ∈ 𝐴 per quanto già detto sappiamo esistere 𝑎 𝑘 ∈ 𝐴 𝑘 tale che |𝑎 𝑘 − 𝑥 𝑘 | ≤ 4/2 𝑘 .
Ma allora |𝑎 𝑘 − 𝑎| ≤ 4/2 𝑘 + |𝑥 𝑘 − 𝑎| → 0 e quindi 𝑎 𝑘 → 𝑎 da cui 𝑎 ∈ 𝐴.
Teorema 7.82 (frattali autosimilari). Siano 𝜑1 , . . . , 𝜑 𝑁 : ℝ𝑛 → ℝ𝑛 contrazioni

(cioè funzioni lipschitziane con costante di lipschitz inferiore ad 1). Allora esiste un
unico insieme 𝐶 ⊆ ℝ𝑛 chiuso e limitato tale che
𝑁
[
𝐶= 𝜑 𝑘 (𝐶).
𝑘=1
Dimostrazione. Basterà dimostrare che la funzione 𝑇 : K(ℝ𝑛 ) → K(ℝ𝑛 ) definita

da
𝑁
[
𝑇(𝐴) = 𝜑 𝑘 (𝐶)
𝑘=1
è una contrazione: dopodiché sapendo che K(ℝ𝑛 ) è completo il risultato è

conseguenza diretta del teorema di punto fisso di Banach-Caccioppoli.
Ogni 𝜑 𝑘 per ipotesi è una contrazione, cioè per ogni 𝑎, 𝑏 ∈ 𝑋
|𝜑 𝑘 (𝑎) − 𝜑 𝑘 (𝑏)| ≤ 𝐿 𝑘 |𝑎 − 𝑏|
7.7 divagazione sui frattali autosimili 343
Figura 7.4: Chiamato 𝐾 0 ∈ ℝ2 il segmen-

to [0 , 1] × {0}, in figura è rappresentata
la quarta iterata 𝐾 4 = 𝑇 4 (𝐾 0 ) della con-
trazione che definisce la curva di Köch.
A pagina 428 il codice per generare la
figura in copertina.
con 𝐿 𝑘 < 1. Posto 𝐿 = max {𝐿1 , . . . , 𝐿 𝑁 } < 1 vogliamo dimostrare che 𝑇

è 𝐿-lipschitziana (e dunque una contrazione). Siano 𝐴, 𝐵 ∈ K(ℝ𝑛 ) e sia
𝑑 = 𝑑H (𝐴, 𝐵). Preso 𝑎 0 ∈ 𝑇(𝐴) dovrà esistere 𝑘 tale che 𝑎 0 ∈ 𝜑 𝑘 (𝐴). Cioè
𝑎 0 = 𝜑 𝑘 (𝑎) con 𝑎 ∈ 𝐴. Ma allora esiste 𝑏 ∈ 𝐵 con |𝑎 − 𝑏| ≤ 𝑑H (𝐴, 𝐵) = 𝑑
e quindi 𝑏 0 = 𝜑 𝑘 (𝑏) ∈ 𝑇(𝐵) e |𝑎 0 − 𝑏 0 | = |𝜑 𝑘 (𝑎) − 𝜑 𝑘 (𝑏)| ≤ 𝐿|𝑎 − 𝑏| ≤ 𝐿 · 𝑑 .
Dunque abbiamo mostrato che
sup inf |𝑎 0 − 𝑏 0 | ≤ 𝐿𝑑H (𝐴, 𝐵).

𝑎 0 ∈𝑇(𝐴) 𝑏 ∈𝑇(𝐵)
0
La stessa disuguaglianza rimane valida con 𝐴 e 𝐵 scambiati, ottenendo quindi:
𝑑H (𝑇(𝐴), 𝑇(𝐵)) ≤ 𝐿 · 𝑑H (𝐴, 𝐵).
Esempio 7.83 (insieme di Cantor). Si prendano 𝜑, 𝜓 : ℝ → ℝ definite da
𝑥 2+𝑥
𝜑(𝑥) = , 𝜓(𝑥) = .
3 3
Chiaramente 𝜑 e 𝜓 sono 1/3-lipschitziane e dunque, per il teorema precedente, esiste

un unico insieme 𝐶 chiuso e limitato in ℝ tale che
𝐶 𝐶+2
𝐶= ∪ .
3 3
Tale insieme si chiama insieme di Cantor. insieme di Cantor
L’insieme di Cantor è un frattale autosimile in quanto si ottiene come l’unione di due

copie riscalate di sé stesso.
E’ facile mostrare che 𝐶 ⊆ [0 , 1] in quanto 𝑇 manda sottoinsiemi di [0 , 1] in sottoinsiemi

di [0 , 1]. Ogni 𝑥 ∈ [0 , 1] può essere rappresentato in base 3 con una sequenza di
cifre ternarie: 0 , 1 , 2. La funzione 𝜑(𝑥) aggiunge uno 0 in cima alla sequenza di cifre,
mentre la funzione 𝜓(𝑥) aggiunge un 2 in cima alla sequenza. Vogliamo mostrare che
𝐶 è l’insieme di tutti i numeri in [0 , 1] che possono essere scritti in base 3 utilizzando
solamente le cifre 0 e 2. Osserviamo innanzitutto che 𝐶 è chiuso: il suo complementare
in [0 , 1] è formato da tutti i numeri che in base 3 si devono scrivere utilizzando almeno
una cifra 1. Ma se c’è una cifra 1 posso modificare tutte le cifre successive rimanendo
nel complementare di 𝐶 : dunque il complementare di 𝐶 è aperto. Si osservi che gli unici
numeri che hanno una doppia rappresentazione in base 3 sono quelli che terminano con
una sequenza infinita di 2,
Esempio 7.84 (curva di Köch). Sia 𝑅 𝜃 : ℝ2 → ℝ2 la rotazione con centro l’origine di

𝜃 radianti in senso antiorario. Sia 𝛼 = 𝜋/3, 𝑝 = (1 , 0) e siano 𝜑1 , 𝜑2 , 𝜑3 , 𝜑4 : ℝ2 →
ℝ2 le funzioni definite da:
𝑣 𝑣
𝜑1 (𝑣) = , 𝜑2 (𝑣) = 𝑅 𝛼 + 𝜑1 (𝑝),
3 3
𝑣 𝑣
𝜑3 (𝑣) = 𝑅 −𝛼 + 𝜑2 (𝑝), 𝜑4 (𝑣) = + 𝜑3 (𝑝).
3 3
Allora esiste un unico insieme chiuso 𝐾 ⊆ ℝ2 tale che
𝐾 = 𝜑1 (𝐾) ∪ 𝜑2 (𝐾) ∪ 𝜑3 (𝐾) ∪ 𝜑4 (𝐾).
curva di Köch
L’insieme 𝐾 si chiama curva di Köch. E’ un frattale autosimile in quanto è composto
da quattro copie riscalate di se stesso.
successioni ricorsive 8
Nella maggior parte di questo capitolo prenderemo in considerazione le
successioni 𝑎 𝑛 definite per ricorrenza o ricorsivamente dalle condizioni:
(
𝑎0 = 𝛼,
(8.1)
𝑎 𝑛+1 = 𝑓 (𝑎 𝑛 )
Fissato il termine iniziale 𝛼 e la legge di ricorrenza 𝑓 , c’è una unica successione

che soddisfa (8.1) e i suoi termini sono:
𝑎0 = 𝛼,
𝑎1 = 𝑓 (𝑎1 ) = 𝑓 (𝛼),
𝑎2 = 𝑓 (𝑎2 ) = 𝑓 ( 𝑓 (𝛼)),
𝑎3 = 𝑓 (𝑎3 ) = 𝑓 ( 𝑓 ( 𝑓 (𝛼))),
..
.
𝑎 𝑛 = 𝑓 (𝑎 𝑛−1 ) = 𝑓 𝑛 (𝛼),
..
.
Il valore di 𝑎 𝑛 potrebbe rappresentare lo stato di un sistema che si evolve a

partire da uno stato iniziale 𝑎 0 = 𝛼 tramite la funzione 𝑓 che rappresenta il
cambiamento di stato. Il numero naturale 𝑛 potrebbe quindi rappresentare un sistema dinamico discreto
passo temporale. In tal senso (8.1) si chiama anche sistema dinamico discreto.
L’equazione 𝑎 𝑛+1 = 𝑓 (𝑎 𝑛 ) viene chiamata una equazione ricorsiva autonoma del

primo ordine. Ci sono altre tipologie di equazioni che considereremo solo
marginalmente nei capitoli successivi. Ad esempio quando abbiamo definito il
fattoriale: 𝑎 𝑛 = 𝑛 ! abbiamo dato le condizioni:
(
𝑎0 = 1
𝑎 𝑛+1 = (𝑛 + 1) · 𝑎 𝑛
ma l’equazione 𝑎 𝑛+1 = (𝑛 + 1) · 𝑎 𝑛 è della forma 𝑎 𝑛+1 = 𝑓 (𝑛, 𝑎 𝑛 ) e si dice essere

non autonoma perché la funzione di ricorrenza 𝑓 dipende esplicitamente da 𝑛
oltre che dal termine precedente 𝑎 𝑛 .
Si potrebbero anche considerare equazioni di ordine maggiore del primo. Ad Fibonacci

esempio la successione 𝐹𝑛 di Fibonacci (Leonardo Pisano, 1170–1242) i cui primi
termini sono riportati nella tabella 8.1 soddisfa l’equazione ricorsiva:
0, 1, 1, 2, 3, 5, 8, 13, 21, 34, 55, 89, 144, 233, 377, 610, 987. . . Tabella 8.1: I primi termini della suc-
cession di Fibonacci. Ogni termine è la
somma dei due precedenti.
346 8 successioni ricorsive
 𝐹 =0
 0



1𝐹 =1 (8.2)

 𝐹𝑛+2 = 𝐹𝑛+1 + 𝐹𝑛


che è una relazione del secondo ordine in quanto ogni termine può essere
definito utilizzando i valori dei due termini precedenti. Se l’equazione è lineare,
come in questo caso, si possono trovare delle formule esplicite per scrivere
l’𝑛 -esimo termine della successione. Lo faremo nella sezione 8.3
Si potrebbero anche considerare i sistemi di equazioni ricorsive. Ad esempio

se 𝑓 fosse una funzione complessa 𝑓 : ℂ → ℂ, 𝑓 (𝑥 + 𝑖 𝑦) = 𝑓1 (𝑥, 𝑦) + 𝑖 𝑓2 (𝑥, 𝑦)
con 𝑓1 , 𝑓2 : ℝ × ℝ → ℝ si potrebbe scrivere 𝑎 𝑛 = 𝑥 𝑛 + 𝑖 𝑦𝑛 con 𝑥 𝑛 , 𝑦𝑛 ∈ ℝ e
l’equazione ricorsiva 𝑎 𝑛+1 = 𝑓 (𝑎 𝑛 ) diventerebbe un sistema di due equazioni:
(
𝑥 𝑛+1 = 𝑓1 (𝑥 𝑛 , 𝑦𝑛 )
𝑦𝑛+1 = 𝑓2 (𝑥 𝑛 , 𝑦𝑛 ).
Lo studio dei sistemi va oltre gli scopi di questo capitolo, ma accenneremo

solamente ad un esempio nella sezione 8.4.
8.1 equazioni ricorsive autonome del primo ordine
Esempio 8.1 (algoritmo di Erone). Fissato un numero reale 𝑝 > 1 consideriamo la

successione definita per ricorrenza da
(
𝑎0 = 𝑝
𝑎 𝑛 +𝑝/𝑎 𝑛
𝑎 𝑛+1 = 2 .
√
Si dimostri che 𝑎 𝑛 → 𝑝.
Osserviamo, ad esempio, che per 𝑝 = 2 i primi termini della successione sono:
𝑎0 = 2,
2 + 2/2
𝑎1 = = 3/2 = 1 . 5 ,
2
3/2 + 2/(3/2)
𝑎2 = = 17/12 ≈ 1.4166666,
2
17/12 + 2/(17/12)
𝑎3 = = 577/408 ≈ 1.4142157,
2
..
.
che effettivamente sembrano avvicinarsi molto al numero

√
2 ≈ 1.4142135.
Dimostrazione. Passo 1. Dimostriamo per induzione che 𝑎 𝑛 > 0 per ogni 𝑛 ∈ ℕ .

Infatti per 𝑛 = 1 osserviamo che 𝑎 0 = 𝑝 > 0 mentre se supponiamo che 𝑎 𝑛 > 0
8.1 equazioni ricorsive autonome del primo ordine 347
𝑝
𝑎𝑛 +
otteniamo che 𝑎 𝑛+1 = 2 𝑎𝑛 è positivo in quanto è la metà della somma di
due quantità positive. Quindi, applicando il principio di induzione, possiamo
concludere che 𝑎 𝑛 > 0 per ogni 𝑛 .
Abbiamo in effetti identificato un insieme 𝐴 = {𝑥 : 𝑥 > 0} = (0 , +∞) tale che

𝑝
𝑥+
la funzione 𝑓 (𝑥) = 2 𝑥 è definita su 𝐴 e, contemporaneamente, ha valori in
𝐴. Quindi questo passaggio è fondamentale anche solo per garantire che la
successione 𝑎 𝑛 sia ben definita.
Passo 2. Dimostriamo che la successione 𝑎 𝑛 è decrescente. Per fare questo

osserviamo che essere decrescente significa: 𝑎 𝑛+1 ≤ 𝑎 𝑛 e cioé
𝑝
𝑎𝑛 + 𝑎𝑛
≤ 𝑎𝑛
2
ovvero (moltiplicando ambo i lati per 𝑎 𝑛 > 0)
𝑎 𝑛2 + 𝑝 ≤ 2 𝑎 𝑛2
che è equivalente a 𝑎 𝑛2 − 𝑝 ≥ 0. E, in effetti, questa disuguaglianza è sempre

vera in quanto per 𝑛 = 1 si riduce a 𝑎 12 − 𝑝 = 𝑝 2 − 𝑝 ≥ 0 che è soddisfatta nel
caso 𝑝 > 1. Mentre
𝑝 !2
𝑎𝑛 + 𝑎𝑛 𝑎 𝑛4 + 2𝑝𝑎 𝑛2 + 𝑝 2 − 4𝑝𝑎 𝑛2
𝑎 𝑛+
2
1 −𝑝= −𝑝=
2 4 𝑎 𝑛2
2
𝑎 𝑛4 − 2 𝑝𝑎 𝑛2 + 𝑝 2 𝑎 𝑛2 − 𝑝
= = ≥ 0.
4 𝑎 𝑛2 4 𝑎 𝑛2
Dunque 𝑎 𝑛+
2
1 ≥ 𝑝 per ogni 𝑛 ∈ ℕ e di conseguenza 𝑎 𝑛 è decrescente e inoltre
√
𝑎𝑛 > 𝑝.
Passo 3. Visto che 𝑎 𝑛 è una successione decrescente, per il teorema sulle

successioni monotòne possiamo affermare che 𝑎 𝑛 ammette limite, e cioé: 𝑎 𝑛 → ℓ
con ℓ ∈ [−∞, +∞]. Possiamo immediatamente escludere ℓ = +∞ in quanto
√
la successione è decrescente, e possiamo anche escludere ℓ < 𝑝 in quanto
√
sappiamo che 𝑎 𝑛 > 𝑝 e quindi (per il teorema della permanenza del segno)
√
ℓ ≥ 𝑝 . Inoltre
𝑝 𝑝
𝑎 𝑛 + 𝑎𝑛 ℓ+ℓ
𝑎 𝑛+1 = → .
2 2
Ma sappiamo che se 𝑎 𝑛 → ℓ anche 𝑎 𝑛+1 → ℓ (visto che 𝑎 𝑛+1 è una sottosucces-
sione di 𝑎 𝑛 ) e quindi (per l’unicità del limite)
𝑝
ℓ+ ℓ
ℓ= (8.3)
2
√
da cui si ricava ℓ 2 = 𝑝 ovvero (essendo ℓ ≥ 0) concludiamo 𝑎 𝑛 → ℓ = 𝑝.
Cominciamo ora a definire una terminologia e a fissare alcuni risultati gene-

rali che ci serviranno per trovare alcune proprietà delle successioni definite
da (8.1).
punto fisso
Definizione 8.2 (punto fisso). Diremo che 𝑥 è un punto fisso per la funzione 𝑓 se
vale
𝑓 (𝑥) = 𝑥.
Osserviamo che se 𝛼 è un punto fisso per 𝑓 la successione costante 𝑎 𝑛 = 𝛼

soddisfa l’equazione 𝑎 𝑛+1 = 𝑓 (𝑎 𝑛 ). Inoltre se 𝑎 𝑛+1 = 𝑓 (𝑎 𝑛 ), se 𝑎 𝑛 converge ad
un limite ℓ e se 𝑓 è continua in ℓ allora
𝑎 𝑛+1 = 𝑓 (𝑎 𝑛 ) → 𝑓 (ℓ )
ma visto che 𝑎 𝑛+1 ha lo stesso limite di 𝑎 𝑛 si trova che 𝑓 (ℓ ) = ℓ ovvero il limite

della successione è un punto fisso.
𝑝
𝑥+ √ √
Nell’esempio precedente la funzione 𝑓 (𝑥) = 2 𝑥 ha come punti fissi 𝑝 e − 𝑝
e l’equazione (8.3) non è altro che 𝑓 (𝑥) = 𝑥 . E in effetti abbiamo mostrato che la
successione 𝑎 𝑛 converge proprio ad un punto fisso.
insieme invariante Definizione 8.3 (insieme invariante). Un insieme 𝐴 si dice essere invariante per 𝑓
se 𝑓 (𝐴) ⊆ 𝐴 (ovvero: per ogni 𝑥 ∈ 𝐴 si ha 𝑓 (𝑥) ∈ 𝐴).
Osserviamo che se 𝐴 è un insieme invariante e 𝑎 0 ∈ 𝐴 allora la successione

definita da 𝑎 𝑛+1 = 𝑓 (𝑎 𝑛 ) assume sempre valori in 𝐴.
√
Nell’esercizio 8.1 abbiamo dimostrato che gli intervalli (0 , +∞) e ( 𝑝, +∞) sono
invarianti.
Teorema 8.4. Sia 𝐴 ⊆ ℝ un insieme invariante per 𝑓 e sia 𝑎 𝑛 una successione con
𝑎1 ∈ 𝐴 e 𝑎 𝑛+1 = 𝑓 (𝑎 𝑛 ).
𝑓 (𝑥) ≥ 𝑥 Se per ogni 𝑥 ∈ 𝐴 vale 𝑓 (𝑥) ≥ 𝑥 allora la successione 𝑎 𝑛 è crescente.
𝑓 (𝑥) ≤ 𝑥 Se per ogni 𝑥 ∈ 𝐴 vale 𝑓 (𝑥) ≤ 𝑥 allora la successione 𝑎 𝑛 è decrescente.
Dimostrazione. In effetti se 𝑓 (𝑥) ≥ 𝑥 si ha per ogni 𝑛 ∈ ℕ
𝑎 𝑛+1 = 𝑓 (𝑎 𝑛 ) ≥ 𝑎 𝑛
e quindi la successione 𝑎 𝑛 è crescente. Mentre se 𝑓 (𝑥) ≤ 𝑥 si ha
𝑎 𝑛+1 = 𝑓 (𝑎 𝑛 ) ≤ 𝑎 𝑛
e la successione è decrescente.
Esercizio 8.5. Al variare di 𝛼 ∈ ℝ determinare il limite della successione 𝑎 𝑛 definita

per ricorrenza dalle equazioni:
(
𝑎1 = 𝛼
𝑎 𝑛+1 = 𝑎 𝑛 − 𝑎 𝑛2 .
𝑓 crescente 𝑎0 ∈ 𝐴 e 𝑎 𝑛+1 = 𝑓 (𝑎 𝑛 ). Se 𝑓 è crescente su 𝐴 allora 𝑎 𝑛 è monotòna.
Dimostrazione. Osserviamo che se 𝑓 è crescente allora
𝑎 𝑛+1 ≥ 𝑎 𝑛 ⇒ 𝑓 (𝑎 𝑛+1 ) ≥ 𝑓 (𝑎 𝑛 ) ⇒ 𝑎 𝑛+2 ≥ 𝑎 𝑛+1

𝑎 𝑛+1 ≤ 𝑎 𝑛 ⇒ 𝑓 (𝑎 𝑛+1 ) ≤ 𝑓 (𝑎 𝑛 ) ⇒ 𝑎 𝑛+2 ≤ 𝑎 𝑛+1 .
Dunque se per i primi due termini si ha 𝑎 1 ≥ 𝑎 0 allora, per induzione, si ha

𝑎 𝑛+1 ≥ 𝑎 𝑛 per ogni 𝑛 e quindi la successione è crescente. Se invece 𝑎 2 ≤ 𝑎1
si dimostra per induzione che 𝑎 𝑛+1 ≤ 𝑎 𝑛 per ogni 𝑛 e quindi la successione è
decrescente.
𝑎 1 ∈ 𝐴 e 𝑎 𝑛+1 = 𝑓 (𝑎 𝑛 ). Se 𝑓 è decrescente su 𝐴 allora le due successioni 𝑎 2𝑛 (termini 𝑓 decrescente
di indice pari) e 𝑎 2𝑛+1 (termini di indice dispari) sono monotòne.
Dimostrazione. Osserviamo che
𝑎 2𝑛+2 = 𝑓 (𝑎2𝑛+1 ) = 𝑓 ( 𝑓 (𝑎 2𝑛 )) = ( 𝑓 ◦ 𝑓 )(𝑎2𝑛 )

𝑎 2𝑛+3 = 𝑓 (𝑎2𝑛+2 ) = 𝑓 ( 𝑓 (𝑎 2𝑛+1 )) = ( 𝑓 ◦ 𝑓 )(𝑎 2𝑛+1 )
cioé le sottosuccessioni dei termini di indice pari e di indice dispari soddisfano

una relazione di ricorrenza tramite la funzione 𝑓 ◦ 𝑓 (invece che 𝑓 ).
Osserviamo anche che se 𝑓 è decrescente allora 𝑓 ◦ 𝑓 è crescente. Infatti:
𝑥 ≤ 𝑦 ⇒ 𝑓 (𝑥) ≥ 𝑓 (𝑦) ⇒ 𝑓 ( 𝑓 (𝑥)) ≤ 𝑓 ( 𝑓 (𝑦)).
Dunque possiamo applicare il teorema precedente e ottenere che le due

sottosuccessioni sono entrambe monotòne.
Utilizziamo la terminologia e i risultati precedenti nei seguenti esercizi.
Esercizio 8.8 (Fibonacci). Si consideri il rapporto 𝑎 𝑛 = 𝐹𝐹𝑛+𝑛 1 di due termini successivi

della successione di Fibonacci: 𝐹0 = 1, 𝐹1 = 1, 𝐹𝑛+2 = 𝐹𝑛+1 + 𝐹𝑛 . Determinare il
limite di 𝑎 𝑛 .
Soluzione. La successione 𝑎 𝑛 soddisfa la relazione:
𝐹𝑛+2 𝐹𝑛+1 + 𝐹𝑛 𝐹𝑛 1
𝑎 𝑛+1 = = =1+ =1+ .
𝐹𝑛+1 𝐹𝑛+1 𝐹𝑛+1 𝑎𝑛
Inoltre 𝑎 0 = 𝐹2 /𝐹1 = 1. Dunque la successione 𝑎 𝑛 soddisfa le seguenti proprietà:

(
𝑎0 = 1
𝑎 𝑛+1 = 1 + 𝑎𝑛 .
1
Osserviamo che l’intervallo 𝐴 = (0 , +∞) è invariante per la funzione 𝑓 (𝑥) =

1 + 1/𝑥 . Infatti se 𝑥 ∈ 𝐴 allora 𝑥 > 0 ma anche 𝑓 (𝑥) = 1 + 1/𝑥 lo è. Su tale
intervallo, inoltre, la funzione 𝑓 è decrescente. Infatti
1 1 1 1
0<𝑥≤𝑦⇒ ≥ ⇒ 1 + ≥ 1 + ⇒ 𝑓 (𝑥) ≥ 𝑓 (𝑦).
𝑥 𝑦 𝑥 𝑦
Visto che 𝑎 0 = 1 ∈ 𝐴, 𝐴 invariante, 𝑓 decrescente su 𝐴, il Teorema 8.7 ci dice

che le due successioni 𝑎 2𝑛 e 𝑎 2𝑛+1 sono monotone e quindi ammettono limite:
𝑎2𝑛 → ℓ , 𝑎 2𝑛+1 → ℓ 0 con ℓ , ℓ 0 ∈ [0 , +∞].
Se ℓ è finito si ha:
1 1
𝑎2𝑛+1 = 𝑓 (𝑎 2𝑛 ) = 1 + →1+
𝑎 2𝑛 ℓ
e quindi dato che 𝑎 2𝑛+1 → ℓ 0 si ha ℓ 0 = 1 + 1/ℓ . Inoltre
1 1 1
𝑎2𝑛+2 = 𝑓 (𝑎 2𝑛+1 ) = 1 + →1+ 0 =1+
𝑎2𝑛+1 ℓ 1+ 1
ℓ
ℓ 2ℓ + 1
=1+ =
ℓ +1 ℓ +1
da cui, visto che 𝑎 2𝑛+2 → ℓ ,
2ℓ + 1
ℓ= .
ℓ +1
Moltiplicando ambo i membri per ℓ + 1 si ottiene
ℓ 2 + ℓ = 2ℓ + 1
ovvero ℓ 2 − ℓ − 1 = 0 da cui, utilizzando la formula risolutiva delle equazioni di

secondo grado, e ricordando che ℓ ≥ 0, si trova:
√
1+ 5
ℓ= .
2
Ma anche
√ √ √
0 1 ℓ +1 3+ 5 (3 + 5)(1 − 5)
ℓ =1+ = = √ =
ℓ ℓ 1+ 5 1−5
√ √ √
3−2 5−5 2+2 5 1+ 5
= = = = ℓ.
−4 4 2
Dunque entrambe le sottosuccessioni dei termini di indice pari e di indice
dispari convergono
√ allo stesso valore ℓ e quindi l’intera successione ci converge:
𝑎 𝑛 → (1 + 5)/2.
Il caso ℓ = +∞ si può escludere in quanto ripetendo il ragionamento fatto sopra

si otterrebbe ℓ 0 = 1 da cui: ℓ = 1 + 1/ℓ 0 = 2 che è una contraddizione.
Un metodo grafico per visualizzare l’andamento dei termini della successione

definita da (8.1) è il diagramma a ragnatela. Si disegna la curva 𝑦 = 𝑓 (𝑥) su
un piano cartesiano. Partendo dal punto di coordinate (𝛼, 0) = (𝑎 0 , 0) si
procede lungo una retta verticale fino a raggiungere il grafico della funzione
nel punto (𝑎 0 , 𝑓 (𝑎 0 )) = (𝑎 0 , 𝑎 1 ). Dopodiché si procede in orizzontale fino ad
incontrare la retta 𝑦 = 𝑥 nel punto (𝑎 1 , 𝑎 1 ) e si ripete il procedimento in modo
che le coordinate 𝑥 (ma anche le 𝑦 ) dei vertici della spezzata mi danno la
successione 𝑎 0 , 𝑎 1 , 𝑎 2 , . . . . Ad esempio il diagramma a ragnatela corrispondente
all’esercizio 8.8 è rappresentato in Figura 8.1.
Figura 8.1: Diagramma a ragnatela

relativo all’esercizio 8.8: sul rapporto
dei termini successivi della successione
di Fibonacci.
(interagisci)
Esercizio 8.9. Si consideri la successione definita per ricorrenza

(
𝑎0 = 0
𝑎 𝑛+1 = 1 + 𝑎 𝑛2 .
Determinare il limite della successione.
Soluzione. L’equazione ricorsiva è 𝑎 𝑛+1 = 𝑓 (𝑎 𝑛 ) se poniamo 𝑓 (𝑥) = 1 + 𝑥 2 . E’

facile verificare che per ogni 𝑥 si ha 𝑓 (𝑥) > 𝑥 e quindi, per il Teorema 8.4
otteniamo che la successione 𝑎 𝑛 è crescente. Dunque ammette limite: 𝑎 𝑛 → ℓ .
Se il limite fosse finito si avrebbe
𝑎 𝑛+1 = 1 + 𝑎 𝑛2 → 1 + ℓ 2
e quindi, visto che 𝑎 𝑛+1 → ℓ , si avrebbe ℓ = 1 + ℓ 2 (cioè ℓ dovrebbe essere un

punto fisso di 𝑓 ). Questa equazione abbiamo già osservato che non ha soluzioni
( 𝑥 2 + 1 > 𝑥 ) e quindi ℓ non è finito. Visto che la successione 𝑎 𝑛 è crescente
possiamo escludere che sia ℓ = −∞ e quindi l’unica possibilità che rimane è che
𝑎 𝑛 → +∞.

(
𝑎0 = 1
𝑎 𝑛+1 = 4 − 𝑎𝑛 .
1
√ √
Soluzione. Si mostra che sull’intervallo 𝐴 = (2 − 3 , 2 + 3) vale 𝑓 (𝑥) > 𝑥 , che
gli estremi di 𝐴 sono punti fissi e inoltre che la funzione 𝑓 è crescente (lo è su

relativo all’esercizio 8.9.
(interagisci)
tutto (0 , +∞)). Di conseguenza è facile verificare che 𝐴 è invariante, in quanto

si ha
√ √ √ √
2 − 3 < 𝑥 < 2 + 3 ⇒ 𝑓 (2 − 3) < 𝑓 (𝑥) < 𝑓 (2 + 3)
√ √
⇒ 2 − 3 < 𝑓 (𝑥) < 2 + 3.
Inoltre se 𝑎 0 ∈ 𝐴 allora per ogni 𝑛 ∈ ℕ si ha 𝑎 𝑛 ∈ 𝐴 ed essendo √

𝑓 (𝑥) > √
𝑥 la
successione sarà crescente. Dunque ammette limite: 𝑎 𝑛 → ℓ ∈ [2 − 3 , 2 + 3],
ℓ ≥ 𝑎 0 . Ma allora
1 1
𝑎 𝑛+1 = 4 − → 4 − = 𝑓 (ℓ )
𝑎𝑛 ℓ
√ 𝑎 𝑛+1 ha lo√stesso limite di 𝑎 𝑛 si ha ℓ = 𝑓 (ℓ ) le cui

e visto che √ uniche soluzioni
sono 2 ± 3. Ma √ 2 − 3 va scartata in quanto ℓ ≥ 𝑎 0 > 2 − 3 e quindi rimane
𝑎 𝑛 → ℓ = 2 + 3.

(
𝑎0 = 1
2
𝑎 𝑛+1 = 1 − 1
𝑎𝑛
Determinare, se esiste, il limite della successione.


(interagisci)
Soluzione. Osserviamo che:

1
𝑎0 =
2
1
𝑎1 = 1 − = −1
1/2
1
𝑎2 = 1 − =2
−1
1 1
𝑎3 = 1 − = = 𝑎0
2 2
Essendo 𝑎 3 = 𝑎 0 la successione si ripete e, (per induzione) si dimostra che
𝑎 3𝑛+𝑘 = 𝑎 𝑘 . Dunque si ha
1
𝑎 3𝑛 = 𝑎 0 =
2
𝑎 3𝑛+1 = 𝑎 1 = −1
𝑎 3𝑛+2 = 𝑎2 = 2
e la successione 𝑎 𝑛 non ammette limite.

(
𝑎0 = 0
5−𝑎 𝑛2
𝑎 𝑛+1 = 4 .
Soluzione. Si ha 𝑎 𝑛+1 = 𝑓 (𝑎 𝑛 ) se scegliamo 𝑓 (𝑥) = (5 − 𝑥 2 )/4. Osserviamo che

la funzione 𝑓 è decrescente per 𝑥 ≥ 0 (infatti 0 ≤ 𝑥 1 < 𝑥 2 implica 𝑥 12 < 𝑥 22 da

(interagisci)

(interagisci)
cui −𝑥 12 > −𝑥 22 e quindi 𝑓 (𝑥 1 ) > 𝑓 (𝑥 2 )). Osserviamo inoltre che
𝑎0 = 0
5
𝑎1 = 𝑓 (𝑎1 ) =.
4
5 5 − 25/16 55
𝑎2 = 𝑓 = =
4 4 64
Vogliamo dimostrare che l’intervallo 𝐴 = [0 , 5/4] è invariante. Visto che 𝑓 è

decrescente su tale intervallo, si ha:
5
0≤𝑥≤ ⇒ 𝑓 (0) ≥ 𝑓 (𝑥) ≥ 𝑓 (5/4)
4
5 55
⇒ ≥ 𝑓 (𝑥) ≥ ≥0
4 64
5
⇒ 0 ≤ 𝑓 (𝑥) ≤
4
cioè 𝑥 ∈ 𝐴 ⇒ 𝑓 (𝑥) ∈ 𝐴, che è quanto volevamo dimostrare.
Per il Teorema 8.7 sappiamo dunque che 𝑎 2𝑛 → ℓ e 𝑎 2𝑛+1 → ℓ 0. Entrambi i limiti

sono finiti in quanto essendo 𝑎 𝑛 ∈ 𝐴 per ogni 𝑛 , si ha ℓ , ℓ 0 ∈ 𝐴¯ = 𝐴. Dunque,
come al solito, osserviamo che si ha:
𝑎2𝑛+1 = 𝑓 (𝑎 𝑛 ) → 𝑓 (ℓ )
𝑎2𝑛+2 = 𝑓 (𝑎 𝑛+1 ) → 𝑓 (ℓ 0)
ma sapendo che 𝑎 2𝑛+1 → ℓ 0 e 𝑎 2𝑛+2 → ℓ otteniamo il seguente sistema:

(
ℓ 0 = 𝑓 (ℓ )
ℓ = 𝑓 (ℓ 0)
da cui si ottiene 𝑓 ( 𝑓 (ℓ )) = ℓ e 𝑓 ( 𝑓 (ℓ 0)) = ℓ 0. Dunque vogliamo scrivere e

risolvere l’equazione 𝑓 ( 𝑓 (𝑥)) = 𝑥 :
2
5−𝑥 2
5− 4
=𝑥
4
cioè
25 − 10 𝑥 2 + 𝑥 4
5− = 4𝑥
16
ovvero
𝑥 4 − 10 𝑥 2 + 64 𝑥 − 55 = 0.
Come facciamo a risolvere una equazione di quarto grado? In questo frangente

dobbiamo fare una osservazione di carattere generale che ci sarà di grande aiuto.
Osserviamo che se 𝑥 è una soluzione di 𝑓 (𝑥) = 𝑥 allora 𝑥 è anche soluzione
di 𝑓 ( 𝑓 (𝑥)) = 𝑥 in quanto in tal caso si ha 𝑓 ( 𝑓 (𝑥)) = 𝑓 (𝑥) = 𝑥 . Ma l’equazione
𝑓 (𝑥) = 𝑥 è una equazione di secondo grado, che quindi possiamo facilmente
risolvere:
5 − 𝑥2
=𝑥
4
𝑥 2 + 4𝑥 − 5 = 0
√
𝑥 12 = −2 ± 4 + 5 = −2 ± 3 .
Dunque abbiamo trovato due zeri del polinomio di quarto grado e tale polinomio
deve essere quindi divisibile per
𝑥 2 + 4 𝑥 − 5 = (𝑥 − 1)(𝑥 + 5).
Eseguiamo la divisione tra polinomi:
𝑥 4 − 10𝑥 2 + 64 𝑥 − 55 𝑥 4 − 10 𝑥 2 + 64 𝑥 − 55 − 𝑥 2 (𝑥 2 + 4 𝑥 − 5)
= 𝑥 2
+
𝑥 2 + 4𝑥 − 5 𝑥 2 + 4𝑥 − 5
−4𝑥 − 5 𝑥 + 64 𝑥 − 55
3 2
= 𝑥2 +
𝑥 2 + 4𝑥 − 5
− 4 𝑥 3 − 5 𝑥 2 − 64 𝑥 − 55 + 4 𝑥(𝑥 2 + 4 𝑥 − 5)
= 𝑥 2 − 4𝑥 +
𝑥 2 + 4𝑥 − 5
11 𝑥 + 44 𝑥 − 55
2
= 𝑥 2 − 4𝑥 +
𝑥 2 + 4𝑥 − 5
= 𝑥 − 4 𝑥 + 11.
2
Come previsto la divisione non ha resto. Possiamo quindi completare la

scomposizione cercando gli zeri del polinomio 𝑥 2 − 4 𝑥 + 11 che però, da un
rapido controllo, non ha soluzioni reali.
Dunque in questo caso i punti fissi di 𝑓 coincidono con i punti fissi di 𝑓 ◦ 𝑓

e dunque i due limiti ℓ , ℓ 0 devono essere elementi dell’insieme dei punti fissi:
{1 , −5}. D’altra parte −5 deve essere escluso in quanto i limiti stanno entrambi
nella chiusura dell’insieme invariante, che non comprende numeri negativi.
Concludiamo quindi che ℓ = ℓ 0 = 1 e dunque l’intera successione ha limite:

𝑎 𝑛 → 1.

(
𝑎0 = 𝛼
𝑎 𝑛+1 = 2 − 𝑎 𝑛2 .
Determinare il limite della successione nei casi: 𝛼 = −7, 𝛼 = 4 e 𝛼 = 1/42.
Soluzione. Abbiamo 𝑎 𝑛+1 = 𝑓 (𝑎 𝑛 ) con 𝑓 (𝑥) = 2 − 𝑥 2 . Determiniamo i punti fissi

di 𝑓 :
2 − 𝑥 2 = 𝑥, 𝑥2 + 𝑥 − 2 = 0
√
che ha come soluzioni 𝑥 1,2 = −1±2 1+8 cioé 𝑥 1 = −2, 𝑥 2 = 1. Tenendo conto anche
dei segni si può osservare che all’interno delle due soluzioni si ha 𝑓 (𝑥) > 𝑥
mentre all’esterno si ha 𝑓 (𝑥) < 𝑥 .
Osserviamo inoltre che 𝑓 (𝑥) è crescente per 𝑥 ≤ 0 e decrescente per 𝑥 ≥ 0.
Caso 𝛼 = −7. In questo caso consideriamo l’intervallo 𝐴 = (−∞, −2). Visto che
𝑓 è crescente su questo intervallo, e visto che −2 è un punto fisso si ha:
𝑥 < −2 ⇒ 𝑓 (𝑥) < 𝑓 (−2) ⇒ 𝑓 (𝑥) < −2
che significa che 𝐴 è un intervallo invariante.
Su questo intervallo si ha 𝑓 (𝑥) < 𝑥 e quindi 𝑎 𝑛 è decrescente e di conseguenza

ammette limite 𝑎 𝑛 → ℓ . Il limite può essere finito oppure −∞. Ma se fosse
finito allora avremmo
𝑎 𝑛+1 = 2 − 𝑎 𝑛2 → 2 − ℓ 2

(interagisci)
e siccome 𝑎 𝑛+1 → ℓ avremmo ℓ = 2 − ℓ 2 cioè ℓ è un punto fisso di 𝑓 . Ma visto

che ℓ ≤ 𝑎 1 = 𝛼 < 𝑥 1 < 𝑥 2 otteniamo un assurdo.
Dunque l’unica possibilità è che 𝑎 𝑛 → −∞. Questo stesso ragionamento vale

per ogni 𝛼 < −2.
Caso 𝛼 = 4. In questo caso si ha:
𝑎0 = 𝛼 = 4
𝑎1 = 𝑓 (𝑎0 ) = 2 − 42 = −14.
quindi 𝑎 1 ∈ 𝐴 (l’intervallo invariante del punto precedente) e dall’indice 2 in

poi ci si riconduce quindi ai risultati precedenti. Dunque anche in questo caso
𝑎 𝑛 → −∞.
Caso 𝛼 = 42 1
. Questo caso è decisamente più complesso dei precedenti. Pren-
diamo l’insieme 𝐴2 = [−2 , 2]: vogliamo dimostrare che è un insieme invariante.
Nell’intervallo [−2 , 0] la funzione è crescente e quindi ha minimo in −2 dove
vale 𝑓 (−2) = −2 ed ha massimo in 0 dove assume il valore 𝑓 (0) = 2. Nell’in-
tervallo [0 , 2] la funzione è decrescente e, di nuovo, ha massimo 𝑓 (0) = 2 e
minimo 𝑓 (2) = −2. Dunque per ogni 𝑥 ∈ [−2 , 2] si ha 𝑓 (𝑥) ∈ [−2 , 2] cioè, come
volevamo dimostrare, 𝐴2 è invariante.
Dunque visto che 𝑎 0 = 𝛼 ∈ 𝐴2 scopriamo che per ogni 𝑛 si ha 𝑎 𝑛 ∈ [−2 , 2].

Supponiamo ora che la successione abbia limite: 𝑎 𝑛 → ℓ . In tal caso, passando
al limite nell’equazione 𝑎 𝑛+1 = 𝑓 (𝑎 𝑛 ) otteniamo, come al solito, che il limite
dovrebbe essere un punto fisso di 𝑓 : o ℓ = −2 oppure ℓ = 1. Cercheremo ora
di dimostrare che questo è assurdo. Ci sono due possibilità che dobbiamo
escludere. La prima è che la successione tenda al punto fisso ℓ senza mai
uguagliarlo. La seconda è che per un certo 𝑛0 si abbia 𝑎 𝑛 = ℓ per 𝑛 = 𝑛0 e

quindi per ogni 𝑛 ≥ 𝑛0 .
Supponiamo di essere nel primo caso e supponiamo che ℓ = −2. In tal caso, per
il teorema della permanenza del segno la successione deve, da un certo indice in
poi, stare nell’intervallo [−2 , 0]. Ma in tale intervallo si ha 𝑓 (𝑥) > 𝑥 e quindi la
successione sarebbe, da un certo indice in poi, crescente. Ma visto che 𝑎 𝑛 ≥ −2
per ogni 𝑛 , non è possibile che la successione converga, crescendo, a −2.
Supponiamo allora di essere nel primo caso (la successione è sempre diversa
dai due punti fissi) e supponiamo che ℓ = 1. In questo caso da un certo indice
in poi la successione deve stare nell’intervallo [0 , 2] (altrimenti non potrebbe
convergere a 1. In tale intervallo la funzione 𝑓 è decrescente e quindi le
sottosuccessioni dei termini pari e dei termini dispari sono entrambe monotone.
Si potrebbe cercare di studiare le successioni dei termini pari 𝑎 2𝑛 e dispari 𝑎 2𝑛+1
che soddisfano una relazione di ricorrenza con la funzione 𝑓 ◦ 𝑓 al posto di 𝑓
e osservare che la successione che si trova a sinistra del punto fisso dovrebbe
decrescere e quella che si trova a destra dovrebbe crescere (e questo sarebbe
assurdo). Un metodo forse più rapido che non richiede lo studio della funzione
composta è invece il seguente. L’idea è di osservare che 𝑓 tende ad aumentare
le distanze quando ci si trova nei paraggi del punto 1. Se per assurdo 𝑎 𝑛 → 1
allora definitivamente si dovrà avere |𝑎 𝑛 − 1 | < 1/2. Ma allora si osserva che:
3
|𝑎 𝑛+1 − 1 | = 2 − 𝑎 𝑛2 − 1 = 1 − 𝑎 𝑛1 = | 1 + 𝑎 𝑛 | · | 1 − 𝑎 𝑛 | ≥

|𝑎 𝑛 − 1 |
2
in quanto se |𝑎 𝑛 − 1 | < 1/2 allora (per la disuguaglianza triangolare inversa)
| 1 + 𝑎 𝑛 | ≥ 32 . Questo è assurdo perché significa che |𝑎 𝑛 − 1 | → +∞ (per il
criterio del rapporto) quando invece dovrebbe essere |𝑎 𝑛 − 1 | → 0.
Nota. Vedremo nei prossimi teoremi che se la derivata di 𝑓 è in valore assoluto

minore di 1 allora il punto fisso sarà stabile (o attrattivo) cioè partendo da un
punto sufficientemente vicino si convergerà necessariamente al punto fisso. Se
invece la derivata è in valore assoluto maggiore di 1 il punto fisso sarà instabile
(o repulsivo). Cioè, a parte la successione costante che assume il valore esatto
del punto fisso, non è possibile che una successione converga al punto fisso.
Rimane da considerare la possibilità che la successione assuma da un certo

punto in poi il valore esatto di un punto fisso. Supponiamo ad esempio che per
un certo 𝑛 si abbia 𝑎 𝑛 = 1. Allora si deve avere
1 = 𝑎 𝑛 = 2 − (𝑎 𝑛−1 )2
da cui
𝑎 𝑛−1 = ±1.
Se 𝑎 𝑛 era il primo termine con valore 1 dovrà necessariamente essere 𝑎 𝑛−1 = −1.
Ma allora
−1 = 𝑎 𝑛−1 = 2 − (𝑎 𝑛−2 )2
√
da cui 𝑎 𝑛−2 = ± 3. Ma ora osserviamo che essendo 𝑎 0 = 𝛼 = 42 1
un numero
razionale, e osservando che ℚ è un insieme invariante per 𝑓 (perché? verificare
√
per induzione...) sappiamo che ogni 𝑎 𝑘 ∈ ℚ e quindi avremmo 𝑎 𝑛2 = 3 ∈ ℚ:
assurdo.

(interagisci)
Stesso discorso si può fare√se si avesse 𝑎 𝑛 = −2, in quanto si avrebbe 𝑎 𝑛−1 = 2,

𝑎 𝑛−2 = 0 e quindi 𝑎 𝑛−3 = ± 2.
Dunque la successione 𝑎 𝑛 non ammette limite.

(
𝑎0 = 𝛼
𝑎 𝑛+1 = 1
2−𝑎 𝑛 .
Trovare il limite della successione nel caso 𝛼 = −2021. Determinare l’insieme dei valori
di 𝛼 per i quali la successione 𝑎 𝑛 non è ben definita (in quanto per un qualche 𝑛 il
denominatore 2 − 𝑎 𝑛 si annulla). Trovare il limite nel caso 𝛼 = 2021
1000 .
Soluzione. Posto 𝑓 (𝑥) = 1/(2 − 𝑥) si osserva che la disequazione 𝑓 (𝑥) ≥ 𝑥

è verificata per ogni 𝑥 < 2. L’equazione di punto fisso 𝑓 (𝑥) = 𝑥 ha come
unica soluzione 𝑥 = 1. Sull’intervallo 𝐴 = (−∞, 1) la funzione 𝑓 è crescente e
l’intervallo risulta essere invariante. Dunque per 𝛼 = −2021 ∈ 𝐴 la successione
risulta essere crescente e superiormente limitata. Dunque converge 𝑎 𝑛 → ℓ .
Passando al limite in 𝑎 𝑛+1 = 𝑓 (𝑎 𝑛 ) si trova che ℓ deve essere un punto fisso di 𝑓
e quindi ℓ = 1.
La successione non è ben definita se per qualche 𝑛 si trovasse 𝑎 𝑛 = 2 in quanto

la funzione 𝑓 non è definita per 𝑥 = 2. Altri valori si ottengono risalendo
all’indietro la successione 𝑎 𝑛 . Dalla equazione
1
𝑎𝑛 =
2 − 𝑎 𝑛−1
si ricava
1
𝑎 𝑛−1 = 2 − .
𝑎𝑛
L’insieme dei punti partendo da quali si arriva prima o poi in 𝑥 = 2 è dato
dunque dai valori della successione
(
𝑏1 = 2
𝑏 𝑛+1 = 2 − 𝑏𝑛 .
1
Osserviamo che in questo caso specifico è possibile ricavare una formula esplicita
per il termine 𝑏 𝑛 . Osserviamo infatti che:
3 4
𝑏0 = 2, 𝑏1 = , 𝑏2 =
2 3
e proviamo a congetturare che sia 𝑏 𝑛 = 𝑛+1

𝑛 . In effetti questo si può dimostrare
per induzione. Per 𝑛 = 1 si ha (𝑛 + 1)/𝑛 = 2 = 𝑏 1 . E se supponiamo che valga
𝑏 𝑛 = (𝑛 + 1)/𝑛 si ha
𝑛 2𝑛 + 2 − 𝑛 𝑛+2
𝑏 𝑛+1 = 2 − = = .
𝑛+1 𝑛+1 𝑛+1
Dunque l’insieme dei punti partendo dai quali la successione 𝑎 𝑛 non è ben
definita è dato da:
𝑛+1

𝑋= :𝑛∈ℕ .
𝑛
Per il caso 𝛼 = 1000

2021
osserviamo che sull’intervallo 𝐴2 = (1 , 2) si ha sempre
𝑓 (𝑥) > 𝑥 (ma si potrebbe osservare che 𝐴2 non è invariante). Finché 𝑎 𝑛 rimane
in tale intervallo la successione risulta quindi crescente. Però non è possibile
che la successione rimanga sempre in 𝐴2 perché in tal caso il limite dovrebbe
essere un punto fisso. Ma l’unico punto fisso è 1 che è minore di 𝛼 e quindi la
successione, crescente, non può convergere. Necessariamente la successione
esce dall’intervallo 𝐴2 (in effetti notiamo che 𝛼 ∉ 𝑋 ) e, per un certo 𝑛 si avrà
𝑎 𝑛 > 2. Osserviamo ora che sull’intervallo 𝐴3 = (2 , +∞) si ha 𝑓 (𝑥) < 0 e
dunque se 𝑎 𝑛 ∈ 𝐴2 necessarimante 𝑎 𝑛+1 ∈ 𝐴. Dunque questo caso si riconduce
al primo studiato, e la successione tende a 1.

(
𝑎0 = 𝛼
𝑎 𝑛2 −𝑎 𝑛
𝑎 𝑛+1 = 2 .
Determinare al variare di 𝛼 il limite della successione.

(
𝑎0 = 𝛼
𝑎 𝑛+1 = 1 − 𝑎 𝑛2 .
Determinare al variare di 𝛼 il limite della successione.

Esercizio 8.17. Calcolare

1
1+ 1
1+ 1
1+ 1
1+ ...
Esercizio 8.18. Calcolare

s r
√
q
lim+ 𝑥− 𝑥− 𝑥 − 𝑥 −...
𝑥→1
Esercizio 8.19 (Mandelbrot reale). Si consideri, fissato il parametro 𝑐 , la successione

definita per ricorrenza: (
𝑎0 = 0
𝑎 𝑛+1 = 𝑎 𝑛2 + 𝑐.
Determinare i valori di 𝑐 ∈ ℝ per i quali la successione 𝑎 𝑛 risulta essere limitata.
Svolgimento. Caso 1: 𝑐 > 14 . In tal caso non ci sono punti fissi, in quanto
l’equazione 𝑥 = 𝑥 2 + 𝑐 ha discriminante negativo. Significa che 𝑥 2 + 𝑐 > 𝑥 per
ogni 𝑥 ∈ ℝ. Dunque la successione 𝑎 𝑛 è strettamente crescente e tende a +∞.
Non è limitata.
Caso 2: 0 ≤ 𝑐 ≤ 14 . In questo caso l’equazione 𝑥 = 𝑥 2 + 𝑐 ha due soluzioni

entrambe positive (le soluzioni hanno somma 1 e prodotto 𝑐 ≥ 0). Se chiamiamo
𝑥1 la più piccola delle due soluzioni possiamo dimostrare che l’intervallo [0 , 𝑥1 )
è invariante. Infatti su tali intervallo la funzione 𝑓 (𝑥) = 𝑥 2 + 𝑐 è crescente,
dunque se 0 ≤ 𝑥 < 𝑥 1 si ha 𝑓 (0) ≤ 𝑓 (𝑥) < 𝑓 (𝑥 1 ) cioè 𝑐 ≤ 𝑓 (𝑥) < 𝑥 1 . Visto
che 𝑐 ≥ 0 abbiamo mostrato che l’intervallo è invariante e la successione è
dunque limitata. Se 𝑐 = 0 la successione 𝑎 𝑛 rimane costante 𝑎 𝑛 = 0. Se 𝑐 > 0 la
successione converge al punto fisso 𝑥 1 . In ogni caso è limitata.
Caso 3: −1 ≤ 𝑐 < 0. In questo caso vogliamo mostrare che l’intervallo [𝑐, 0] è

invariante. La funzione 𝑓 (𝑥) = 𝑥 2 + 𝑐 è decrescente su tale intervallo, dunque
se 𝑐 ≤ 𝑥 ≤ 0 risulta 𝑓 (0) ≤ 𝑥 ≤ 𝑓 (𝑐). Ma 𝑓 (0) = 𝑐 e 𝑓 (𝑐) = 𝑐 2 + 𝑐 = 𝑐(𝑐 + 1) ≤ 0
se 𝑐 ≥ −1. Dunque [𝑐, 0] è invariante e 𝑎 𝑛 rimane limitata in tale intervallo.
Caso 4: −2 ≤ 𝑐 < −1. In questo caso l’equazione 𝑥 = 𝑥 2 + 𝑐 ha una soluzione

negativa ed una soluzione positiva. Chiamiamo 𝑥 2 la soluzione positiva.
Vogliamo mostrare che l’intervallo [𝑐, 𝑥 2 ] è invariante. La funzione 𝑓 (𝑥) = 𝑥 2 + 𝑐
è decrescente in [𝑐, 0] e crescente in [0 , 𝑥 2 ]. Se 0 ≤ 𝑥 ≤ 𝑥 2 si ha dunque
𝑓 (0) ≤ 𝑓 (𝑥) ≤ 𝑓 (𝑥2 ) cioè 𝑐 ≤ 𝑓 (𝑥) ≤ 𝑥2 . Dunque i punti in [0, 𝑥2 ] rimangono
nell’intervallo [𝑐, 𝑥 2 ]. Se invece 𝑐 ≤ 𝑥 ≤ 0 si ha 𝑓 (0) ≤ 𝑓 (𝑥) ≤ 𝑓 (𝑐) cioè
𝑐 ≤ 𝑓 (𝑥) ≤ 𝑐 2 + 𝑐 . Affinché sia 𝑐 2 + 𝑐 ≤ 𝑥2 basta verificare che 𝑓 (𝑐 2 + 𝑐) ≤ 𝑐 2 + 𝑐
cioè:
(𝑐 2 + 𝑐)2 + 𝑐 ≤ 𝑐 2 + 𝑐
che, sviluppando il quadrato, si riduce a 𝑐 3 (𝑐 + 2) ≤ 0 che è verificata se
−2 ≤ 𝑐 ≤ 0. Dunque l’intervallo [𝑐, 𝑥2 ] è invariante. La successione rimane
dunque limitata in tale intervallo.
Caso 5: 𝑐 < −2. In questo caso 𝑎 0 = 0, 𝑎 1 = 𝑐 , 𝑎 2 = 𝑐 2 + 𝑐 e possiamo verificare

che 𝑐 2 + 𝑐 > 𝑥 2 in quanto, come nel caso precedente, questo accade se
(𝑐 2 + 𝑐)2 + 𝑐 > 𝑐 2 + 𝑐
che si riduce a 𝑐 3 (𝑐 + 2) > 0 che è verificata se 𝑐 < −2. Ma l’intervallo (𝑥 2 , +∞)

è invariante e su tale intervallo si ha 𝑓 (𝑥) > 𝑥 dunque la successione 𝑎 𝑛 è
strettamente crescente per 𝑛 ≥ 2 e diverge a +∞. Non è dunque limitata.
Conclusione. La successione è limitata se 𝑐 ∈ [−2 , 1/4]. Altrimenti 𝑎 𝑛 → +∞.
8.2 approfondimenti
I risultati esposti finora non richiedevano alcuna nozione del calcolo differenziale
e potevano essere compresi utilizzando solamente le nozioni del capitolo 2.5.
In questo capitolo useremo invece alcuni concetti che riguardano il calcolo
differenziale.
Teorema 8.20 (criterio per la stabilità di un punto fisso). Sia 𝑥 0 ∈ ℝ, 𝑅 > 0,

𝐼 = (𝑥0 − 𝑅, 𝑥0 + 𝑅) e 𝑓 : 𝐼 → ℝ una funzione che ha 𝑥0 come punto fisso. Se 𝑓
è 𝐿-lipschitziana su 𝐼 con 𝐿 < 1 allora 𝐼 è un intervallo invariante per 𝑓 e se 𝑎 𝑛 è
una successione che soddisfa la relazione di ricorrenza 𝑎 𝑛+1 = 𝑓 (𝑎 𝑛 ) con 𝑎 0 ∈ 𝐼 allora
𝑎 𝑛 → 𝑥0 per 𝑛 → +∞.
In particolare se 𝑓 ∈ 𝐶 1 (𝐼) con punto fisso 𝑥 0 ∈ 𝐼 e sup {| 𝑓 0(𝑥)| : 𝑥 ∈ 𝐼} < 1 allora 𝐼

è invariante ed ogni successione 𝑎 𝑛 definita per ricorrenza da 𝑎 𝑛+1 = 𝑓 (𝑎 𝑛 ) con 𝑎 0 ∈ 𝐼
converge ad 𝑥 0 .
Ancora più in particolare, se 𝑓 è di classe 𝐶 1 in un intorno di un punto 𝑥 0 , se 𝑥 0 è

punto fisso di 𝑓 e | 𝑓 0(𝑥 0 )| < 1 allora esiste un intorno 𝐼 di 𝑥 0 che è invariante per 𝑓 e
ogni successione 𝑎 𝑛 definita per ricorrenza tramite 𝑎 𝑛+1 = 𝑓 (𝑎 𝑛 ) con 𝑎 0 ∈ 𝐼 converge
ad 𝑥 0 .
Dimostrazione. Osserviamo che se 𝑓 è di classe 𝐶 1 in un intorno di 𝑥 0 e | 𝑓 0(𝑥 0 )| <

1 allora, per continuità, esiste 𝐿 < 1 tale | 𝑓 0(𝑥)| < 𝐿 per ogni 𝑥 in un intorno 𝐼 di
𝑥0 . Dunque sup {| 𝑓 0(𝑥)| : 𝑥 ∈ 𝐼} ≤ 𝐿 < 1 e la funzione 𝑓 risulta dunque essere
𝐿-lipschitziana. E’ chiaro quindi che la seconda e la terza parte del teorema si
riconducono alla prima, che è quella che andremo ora a dimostrare.
Se 𝑓 è 𝐿-lipschitziana e 𝑥 0 è punto fisso di 𝑓 osserviamo che si ha
| 𝑓 (𝑥) − 𝑥 0 | = | 𝑓 (𝑥) − 𝑓 (𝑥0 )| ≤ 𝐿|𝑥 − 𝑥0 |
da cui se |𝑥 − 𝑥 0 | < 𝑅 anche | 𝑓 (𝑥) − 𝑥 0 | < 𝑅 . Dunque 𝐼 = (𝑥 0 − 𝑅, 𝑥 0 + 𝑅) è

invariante. Possiamo poi dimostrare per induzione che risulta
|𝑎 𝑛 − 𝑥0 | ≤ 𝐿𝑛 · |𝑎0 − 𝑥0 |.
8.3 equazioni ricorsive lineari 363
Infatti per 𝑛 = 0 la relazione è una uguaglianza. Il passo induttivo si ottiene

osservando che
|𝑎 𝑛+1 − 𝑥0 | = | 𝑓 (𝑎 𝑛 ) − 𝑓 (𝑥0 )| ≤ 𝐿|𝑎 𝑛 − 𝑥0 |

≤ 𝐿 · 𝐿𝑛 |𝑎 0 − 𝑥0 | = 𝐿𝑛+1 |𝑎 0 − 𝑥0 |.
Ma ora se 𝐿 < 1 si ha 𝐿𝑛 → 0 e dunque |𝑎 𝑛 − 𝑥 0 | → 0 come volevamo

dimostrare.
Teorema 8.21 (instabilità del punto fisso). Sia 𝑓 di classe 𝐶 1 in un intorno di un

suo punto fisso 𝑥 0 . Se | 𝑓 0(𝑥 0 )| > 1 allora non esiste una successione 𝑎 𝑛 che soddisfa la
relazione ricorsiva 𝑎 𝑛+1 = 𝑓 (𝑎 𝑛 ) e tale che 𝑎 𝑛 → 𝑥 0 a meno che non si abbia 𝑎 𝑛 = 𝑥 0
da un certo indice 𝑛 in poi.
Dimostrazione. Per continuità della derivata esisterà 𝐿 > 1 e un intervallo 𝐼

intorno di 𝑥 0 tale che per ogni 𝑥 ∈ 𝐼 si abbia | 𝑓 0(𝑥)| > 1. Se 𝑎 𝑛 → 𝑥 0 allora
da un certo indice 𝑛 in poi si avrà 𝑎 𝑛 ∈ 𝐼 . Se 𝑎 𝑛 verifica la relazione ricorsiva
𝑎 𝑛+1 = 𝑓 (𝑎 𝑛 ) possiamo allora applicare il teorema di Lagrange per ottenere che
per ogni 𝑛 esiste 𝑏 𝑛 compreso tra 𝑥 0 e 𝑎 𝑛 tale che:
|𝑎 𝑛+1 − 𝑥0 | = | 𝑓 (𝑎 𝑛 ) − 𝑓 (𝑥0 )| = | 𝑓 0(𝑏 𝑛 )(𝑎 𝑛 − 𝑥0 )|

≥ 𝐿 · |𝑎 𝑛 − 𝑥0 | ≥ |𝑎 𝑛 − 𝑥 0 |.
Risulta quindi che la distanza |𝑎 𝑛 − 𝑥 0 | deve essere crescente e quindi l’unica

possibilità perché 𝑎 𝑛 → 𝑥 0 è che sia 𝑎 𝑛 = 𝑥 0 .
8.3 equazioni ricorsive lineari
Fissate le costanti 𝑐 0 , 𝑐 1 , . . . , 𝑐 𝑛 , con 𝑐 𝑛 ≠ 0, diremo che l’equazione ricorsiva:

equazione ricorsiva lineare
𝑐 𝑛 · 𝑎 𝑘+𝑛 + 𝑐 𝑛−1 · 𝑎 𝑘+𝑛−1 + · · · + 𝑐1 · 𝑎 𝑘+1 + 𝑐 0 · 𝑎 𝑘 = 0 (8.4)
è una equazione ricorsiva lineare (omogenea) di ordine 𝑛 . Il polinomio 𝑃 con gli
stessi coefficienti:
𝑃(𝜆) = 𝑐 𝑛 · 𝜆𝑛 + 𝑐 𝑛−1 · 𝜆𝑛−1 + · · · + 𝑐1 · 𝜆 + 𝑐0 polinomio caratteristico
si chiama polinomio caratteristico associato all’equazione lineare (8.4).
Ad esempio la successione di Fibonacci 𝐹 𝑘 definita da (8.2) è una soluzione

dell’equazione ricorsiva lineare del secondo ordine:
𝑎 𝑘+2 − 𝑎 𝑘+1 − 𝑎 𝑘 = 0
il cui polinomio caratteristico è
𝑃(𝜆) = 𝜆2 − 𝜆 − 1.
Teorema 8.22 (indipendenza delle successioni esponenziali). Siano 𝜆1 , . . . , 𝜆𝑛

numeri complessi distinti. Allora le successioni 𝒂 𝑗 definite da
𝒂 𝑗 (𝑘) = 𝜆 𝑘𝑗
sono vettori indipendenti nello spazio vettoriale complesso ℂℕ di tutte le successioni a

valori complessi.
Dimostrazione. Dobbiamo mostrare che se una combinazione lineare delle

successioni 𝒂 𝑗 è nulla allora tutti i coefficienti sono nulli. Supponiamo quindi
di avere 𝑐 1 , . . . , 𝑐 𝑛 ∈ ℂ tali che
𝑛
X
𝑐 𝑗 𝒂 𝑗 = 0 ∈ ℂℕ .
𝑗=1
Significa che per ogni 𝑘 ∈ ℕ si ha

𝑛
𝑐 𝑗 𝜆 𝑘𝑗 = 0
X
(8.5)
𝑗=1
Dunque per ogni 𝑘 ∈ ℕ e per ogni 𝑧 ∈ ℂ si ha

𝑛
𝑐 𝑗 𝜆 𝑘𝑗 𝑧 𝑘 = 0.
X
(8.6)
𝑗=1
Sia ora 𝑅 = 1/max {|𝜆1 |, . . . , |𝜆𝑛 |} (almeno uno dei 𝜆 𝑗 è non nullo perché i
𝜆 𝑗 sono distinti e possiamo assumere 𝑛 > 1 altrimenti il teorema è banale).
Se |𝑧| < 𝑅 si ha 𝜆 𝑗 𝑧 < 1 per ogni 𝑗 , e la serie geometrica 𝜆 𝑘𝑗 𝑧 𝑘 risulta
P
quindi essere assolutamente convergente. Possiamo quindi fare la somma su 𝑘
dell’uguaglianza (8.6), scambiare le somme e ottenere, per ogni 𝑧 :
𝑛 X
X +∞ 𝑘
𝑐 𝑗 𝜆𝑗 𝑧 = 0.
𝑗=1 𝑘=0
Calcolando la somma della serie geometrica si ottiene, per ogni 𝑧 con |𝑧| < 𝑅 :
𝑛
X 𝑐𝑗
= 0.
𝑗=1
1 − 𝜆𝑗 𝑧
Scegliamo ora un indice 𝑚 cui 𝑅 = 1/|𝜆𝑚 | e posto 𝑧 = 𝑡/𝜆𝑚 osserviamo che per
𝑡 ∈ [0 , 1) si ha |𝑧| < 𝑅 , dunque possiamo fare il limite per 𝑡 → 1− ed ottenere :
𝑛
X 𝑐𝑗
lim− = 0.
𝑡→1
𝑗=1 1 − 𝜆 𝑗 𝜆𝑡𝑚
Ma se 𝑗 ≠ 𝑚 si ottiene un limite finito:

𝑐𝑗 𝑐𝑗
lim− = = ℓ𝑗 ∈ ℂ
𝑡→1 1 − 𝜆 𝑗 𝜆𝑡𝑚 1−
𝜆𝑗
𝜆𝑚
e dunque, visto che la somma dei limite è nulla, anche per 𝑗 = 𝑚 si deve ottenere
un limite finito. Ma per 𝑗 = 𝑚 si ottiene invece
𝑐𝑚
lim−
𝑡→1 1−𝑡
che è finito solo se 𝑐 𝑚 = 0.
Ma se 𝑐 𝑚 = 0 ci siamo ricondotti ad avere una combinazione lineare nulla di

𝑘 ) e dunque, per induzione, si
𝑛 − 1 successioni esponenziali (si può togliere 𝜆𝑚
può ripetere il procedimento e scoprire che anche tutti gli altri coefficienti sono
nulli.
dimostrazione alternativa. Valutando l’equazione (8.5) per 𝑘 = 0 , . . . , 𝑛 − 1 si

ottiene
𝑐1 + 𝑐 2 𝜆1 + · · · + 𝑐 𝑛 𝜆1𝑛 = 0
𝑐1 + 𝑐 2 𝜆2 + · · · + 𝑐 𝑛 𝜆2𝑛 = 0
..
.
𝑐 1 + 𝑐2 𝜆𝑛 + · · · + 𝑐 𝑛 𝜆𝑛𝑛 = 0
Vandermonde
che è un sistema lineare la cui matrice associata è la matrice di Vandermonde
1 𝜆1 𝜆21 ... 𝜆1𝑛

1 𝜆 2 𝜆22 ... 𝜆2𝑛 ®
© ª
𝑉 = . . .. .. .. ®®
.. .. . . . ®
«1 𝜆 𝑛 𝜆2𝑛 ... 𝜆𝑛𝑛 ¬
che notoriamente (lo si può dimostrare per induzione) ha determinante
𝑗−1
𝑛 Y
Y
det 𝑉 = (𝜆 𝑗 − 𝜆 𝑘 )
𝑗=2 𝑘=1
e dunque è invertibile se e solo se i 𝜆 𝑗 sono tra loro distinti.
Dunque 𝑐 1 = 𝑐 2 = · · · = 𝑐 𝑛 = 0 è l’unica soluzione del sistema lineare.
Teorema 8.23 (dimensione delle soluzioni). L’insieme 𝑊 di tutte le successioni

soluzioni dell’equazione (8.4) di ordine 𝑛 è un sottospazio vettoriale di dimensione 𝑛
dello spazio ℂℕ di tutte le sottosuccessioni.
Dimostrazione. Denotiamo con 𝒂 ∈ ℂℕ la successione 𝑎 𝑘 = 𝒂(𝑘). L’insieme 𝑊

delle soluzioni dell’equazione (8.4) è un sottospazio vettoriale di ℂℕ in quanto
se 𝒂 e 𝒃 sono soluzioni anche 𝒂 + 𝒃 è soluzione e se 𝒂 è soluzione anche 𝑡 𝒂 è
soluzione per ogni 𝑡 ∈ ℂ (si faccia la verifica). jet
Consideriamo allora l’operatore (chiamato jet) 𝐽 : 𝑊 → ℂ𝑛 definito da
𝐽(𝒂) = (𝒂(0), 𝒂(1), . . . , 𝒂(𝑛 − 1)).

E’ facile verificare che 𝐽 è un operatore lineare in quanto la valutazione di una

funzione in un punto è una operazione lineare.
Vogliamo ora determinare
ker 𝐽 = {𝒂 ∈ 𝑊 : 𝐽(𝒂) = 0}.
Se 𝒂 ∈ ker 𝐽 significa che i primi 𝑛 termini della successione 𝑎 0 , 𝑎 1 , . . . , 𝑎 𝑛−1

sono tutti nulli. Ma se 𝒂 ∈ 𝑊 sappiamo che vale (8.4) e dunque anche 𝑎 𝑛 è
nullo. Applicando (8.4) ricorsivamente otteniamo che 𝑎 𝑛+𝑘 = 0 per ogni 𝑘 ∈ ℕ e
dunque 𝒂 = 0. Dunque ker 𝐽 = {0} e per le note proprietà degli operatori lineari
possiamo affermare che 𝐽 : 𝑊 → ℂ𝑛 è iniettivo. Dunque dim 𝑊 ≤ dim ℂ𝑛 = 𝑛 .
Ma possiamo anche osservare che 𝐽 è suriettivo in quanto fissati i valori di

𝑎0 , 𝑎1 , . . . , 𝑎 𝑛−1 l’equazione (8.4) ci permette di determinare, induttivamente,
tutti i termini successivi. Dunque fissato 𝒚 = (𝑦0 , . . . , 𝑦𝑛−1 ) ∈ ℂ𝑛 è possibile
trovare 𝒂 ∈ 𝑊 tale che 𝐽(𝒂) = 𝒚 .
Visto che 𝐽 : 𝑊 → ℂ𝑛 è iniettivo e suriettivo concludiamo che dim 𝑊 =

dim ℂ𝑛 = 𝑛 .
Teorema 8.24 (caratterizzazione delle soluzioni). Se il polinomio caratteristico

dell’equazione (8.4) ha 𝑛 zeri distinti 𝜆1 , . . . , 𝜆𝑛 allora ogni soluzione dell’equazione
si scrive nella forma
𝑎 𝑘 = 𝑐 1 𝜆1𝑘 + 𝑐2 𝜆2𝑘 + · · · + 𝑐 𝑛 𝜆𝑛𝑘
dove 𝑐 1 , . . . , 𝑐 𝑛 sono costanti arbitrarie.
Dimostrazione. Sia 𝑉 = ℂℕ lo spazio vettoriale di tutte le successioni. Possiamo

definire l’operatore di shift 𝜎 : 𝑉 → 𝑉
(𝜎𝒂)(𝑘) = 𝒂(𝑘 + 1).
Risulta quindi che 𝑎 𝑘+𝑛 = (𝜎 𝑛 𝒂)(𝑘) dove 𝜎 𝑛 = 𝜎 ◦ 𝜎 ◦ · · · ◦ 𝜎 è la composizione

di 𝜎 con se stesso per 𝑛 volte. Possiamo quindi riscrivere l’equazione (8.4) nella
forma
𝑐 𝑛 𝜎 𝑛 𝒂 + · · · + 𝑐0 𝜎0 𝒂 = 0
ovvero
𝑃(𝜎)𝒂 = 0
dove con 𝑃(𝜎) si intende l’operatore 𝑃(𝜎) : 𝑉 → 𝑉 ottenuto applicando il
polinomio caratteristico 𝑃 all’operatore 𝜎 .
Se 𝜆1 , . . . , 𝜆𝑛 sono le 𝑛 radici del polinomio 𝑃 si può decomporre il polinomio

𝑃 tramite il teorema 4.10 di Ruffini
𝑃(𝜆) = 𝑎 𝑛 (𝜆 − 𝜆1 )(𝜆 − 𝜆2 ) · · · (𝜆 − 𝜆𝑛 ). (8.7)
la stessa decomposizione può essere fatta per 𝑃(𝜎) e quindi l’equazione (8.4)
può essere scritta nella forma:
(𝜎 − 𝜆1 𝐼) ◦ (𝜎 − 𝜆2 𝐼) ◦ · · · ◦ (𝜎 − 𝜆𝑛 𝐼)𝒂 = 0 (8.8)
dove 𝐼 : 𝑉 → 𝑉 è l’operatore identità 𝐼 𝒂 = 𝒂 . Visto che nella decompo-

sizione (8.7) l’ordine in cui vengono moltiplicati i fattori non conta, anche
nell’equazione (8.8) possiamo applicare gli operatori (𝜎 − 𝜆 𝑗 𝐼) in qualunque
ordine (gli operatori commutano). Dunque è immediato accorgersi che se 𝒂
risolve
(𝜎 − 𝜆 𝑗 𝐼)𝒂 = 0
per un qualunque 𝑗 = 1 , . . . , 𝑛 allora 𝒂 ∈ 𝑊 . Ma quest’ultima equazione è
facile da risolvere in quanto ponendo 𝑎 𝑘 = 𝒂(𝑘) si esplicita nella forma:
𝑎 𝑘+1 − 𝜆 𝑗 𝑎 𝑘 = 0
che è soddisfatta se se si sceglie 𝑎 𝑘 = 𝜆 𝑘𝑗 .
Dunque la successione 𝒂 𝑗 definita da
𝒂 𝑗 (𝑘) = 𝜆 𝑘𝑗
è un elemento di 𝑊 . Per 𝑗 = 1 , . . . , 𝑛 abbiamo trovato 𝑛 soluzioni distinte

𝒂 1 , . . . , 𝒂 𝑛 . Queste soluzioni sono indipendenti grazie al teorema 8.22 e quindi
essendo dim 𝑊 = 𝑛 per il teorema 8.23 possiamo affermare che queste soluzioni
formano una base di 𝑊 che è esattamente quanto volevamo dimostrare.
Esempio 8.25 (formula esplicita per la successione di Fibonacci). La successione

di Fibonacci 𝐹 𝑘 definita da (8.2) soddisfa una equazione ricorsiva lineare del secondo
ordine con polinomio associato 𝑃(𝜆) = 𝜆2 − 𝜆 − 1. Risolvendo l’equazione 𝑃(𝜆) = 0 si rapporto aureo
trovano le due radici distinte: √
1± 5
𝜆1 , 2 = .
2
La radice più grande, 𝜆2 , corrisponde al rapporto aureo che usualmente viene chiamato
𝜑. Visto che 𝜆1 𝜆2 = −1 si trova 𝜆1 = −1/𝜑. Dunque, per il teorema precedente,
sappiamo che esistono due costanti 𝑐 1 e 𝑐 2 tali che
(−1) 𝑘
𝐹𝑘 = 𝑐1 + 𝑐2 𝜑 𝑘 .
𝜑𝑘
Imponendo le condizioni 𝐹0 = 0, 𝐹1 = 1 (imporre 𝐹2 = 1 è equivalente a 𝐹0 = 0) si

ottiene
𝑐1
𝑐1 + 𝑐2 = 0, − + 𝑐2 𝜑 = 1
𝜑
√
da cui è possibile trovare 𝑐 1 = −𝑐 2 = 1/ 5 e ottenere così una formula esplicita per il
𝑘 -esimo numero di Fibonacci:
𝜑 𝑘 (−1) 𝑘+1
𝐹𝑘 = √ + √ .
5 5𝜑 𝑘
Risulta piuttosto sorprendente osservare che i valori 𝐹 𝑘 ottenuti con questa espressione
siano tutti numeri interi.
Figura 8.8: L’insieme di Mandelbrot ge-

nerato al computer. Si veda il codice a
pagina 427.
8.4 dinamica complessa
Più in generale potremmo considerare successioni 𝑧 𝑛 a valori complessi e quindi

equazioni ricorsive della forma
(
𝑧0 = 𝛼,
𝑧 𝑛+1 = 𝑓 (𝑧 𝑛 )
con 𝑓 : ℂ → ℂ. Se 𝑓 fosse lineare si potrebbe scrivere esplicitamente la soluzione

seguendo le idee presentate nella sezione 8.3.
Possiamo provare a considerare la più semplice funzione non lineare che ci

possa venire in mente cioè 𝑓 (𝑧) = 𝑧 2 + 𝑐 e il più semplice dato iniziale 𝛼 = 0 e il
problema diventa quello di studiare il comportamento delle successioni:
(
𝑧0 = 0,
(8.9)
𝑧 𝑛+1 = 𝑧 𝑛2 + 𝑐
con 𝑐 ∈ ℂ.
L’insieme dei numeri reali è invariante, dunque se 𝑐 ∈ ℝ la successione 𝑧 𝑛 rimane

reale e coincide con la successione che abbiamo studiato nell’esercizio 8.19.
insieme di Mandelbrot E’ molto complicato determinare il carattere delle successioni definite dal
sistema (8.9). Solo con l’utilizzo dei primi calcolatori Mandelbrot (1924-2010)
riuscì a rappresentare graficamente l’insieme 𝑀 dei punti 𝑐 ∈ ℂ per i quali la
successione 𝑧 𝑛 non diverge: si veda la figura 8.8.
8.4 dinamica complessa 369
Con l’esercizio 8.19 abbiamo trovato l’intersezione 𝑀 ∩ ℝ = [−2 , 1/4]. Nel

seguente esercizio ci proponiamo ora di dimostrare un’altra semplice proprietà
che può essere molto utile negli algoritmi numerici utilizzati per disegnare tale
insieme.
Esercizio 8.26 (raggio di fuga). Dimostrare che se 𝑧 𝑛 è soluzione di (8.9) se per

un qualche 𝑁 ∈ ℕ si ha |𝑧 𝑁 | > 2 allora |𝑧 𝑛 | → +∞ per 𝑛 → +∞. In particolare
l’insieme 𝑀 di Mandelbrot è contenuto nel disco {𝑧 ∈ ℂ : |𝑧| ≤ 2}.
Soluzione. Sia 𝑐 ∈ ℂ fissato e si 𝑧 𝑛 la successione definita da (8.9). Per ogni

𝜀 > 0 consideriamo l’insieme:
𝐴 𝜀 = {𝑧 ∈ ℂ : |𝑧| ≥ 𝑐 e |𝑧| ≥ 2 + 𝜀}.
Possiamo mostrare che l’insieme 𝐴 𝜀 è invariante in quanto se 𝑧 𝑛 ∈ 𝐴 𝜀 si ha
|𝑧 𝑛+1 | = 𝑧 𝑛2 + 𝑐 ≥ |𝑧 𝑛 | 2 − |𝑐| ≥ |𝑧 𝑛 | 2 − |𝑧 𝑛 | = (|𝑧 𝑛 | − 1)|𝑧 𝑛 |

(8.10)
≥ (1 + 𝜀)|𝑧 𝑛 | ≥ (1 + 𝜀)(2 + 𝜀) ≥ 2 + 𝜀.
Dunque 𝐴 𝜀 è invariante ma non solo, se 𝑧 𝑛 ∈ 𝐴 𝜀 abbiamo trovato che risulta

|𝑧 𝑛+1 | ≥ (1 + 𝜀)|𝑧 𝑛 | e dunque |𝑧 𝑛+𝑘 | ≥ (1 + 𝜀) 𝑘 |𝑧 𝑛 | e dunque |𝑧 𝑛 | → +∞ per
𝑛 → +∞.
Se |𝑐| ≤ 2 e se |𝑧 𝑁 | > 2 allora 𝑧 𝑁 ∈ 𝐴 𝜀 per un qualche 𝜀 > 0 e dunque possiamo
concludere che 𝑧 𝑛 → ∞ ∈ ℂ̄. Se invece |𝑐| > 2 è facile osservare che 𝑧 0 = 0,
𝑧1 = 𝑐 , 𝑧2 = 𝑐 2 + 𝑐 e quindi
|𝑧2 | = 𝑐 2 + 𝑐 ≥ |𝑐| 2 − |𝑐| = |𝑐|(|𝑐| − 1) ≥ |𝑐| > 2

dunque 𝑧 2 ∈ 𝐴 𝜀 e quindi, comunque, 𝑧 𝑛 → ∞.

equazioni differenziali 9
9.1 classificazione
Le equazioni differenziali sono una classe di equazioni funzionali ovvero equazio- equazioni funzionali
ni in cui l’incognita non è un numero (come accade nelle equazioni algebriche)

ma è una funzione. La funzione incognita 𝑢 , sarà quindi funzione di una
variabile indipendente 𝑢 = 𝑢(𝑥). Ad esempio 𝑢 potrebbe essere la traiettoria di
un proiettile che descrive la posizione nello spazio in funzione del tempo 𝑥 . Se
nelle equazioni algebriche il nome di gran lunga più utilizzato per l’incognita
è 𝑥 , nelle equazioni funzionali a seconda dei contesti le convenzioni possono
cambiare in maniera drastica. Si dovrà utilizzare un nome per la funzione
e un nome per la sua variabile indipendente: 𝑥 = 𝑥(𝑡), 𝑦 = 𝑦(𝑥), 𝑦 = 𝑦(𝑡),
𝑢 = 𝑢(𝑥) sono alcune delle scelte più utilizzate. Se l’incognita è una funzione
𝑢 = 𝑢(𝑥) le operazioni che possono comparire nell’equazioni sono, oltre le
usuali operazioni algebriche che agiscono sui singoli valori 𝑢(𝑥) della funzione,
anche operatori che agiscono sulla funzione 𝑢 in sé. Se l’equazione funzionale
oltre alle operazioni algebriche comprende anche l’operatore derivata, si dirà che
è una equazione differenziale. Di contro ci potranno ad esempio essere equazioni equazione differenziale
che coinvolgono l’operatore integrale e si chiameranno equazioni integrali.
Ci sono quindi diversi concetti che possono aiutare a classificare le equazioni

differenziali. Innanzitutto supporremo sempre che le nostre equazioni siano
senza ritardo
senza ritardo (o senza memoria) cioè che la funzione 𝑢 e le sue derivate 𝑢 0, 𝑢 00. . . ,
vengano tutte calcolate nello stesso punto 𝑥 . In caso contrario si parla di
equazioni differenziali funzionali (in particolare equazioni con ritardo perché le
derivate dipendono tipicamente dai valori assunti nel passato), argomento che
non toccheremo.
Se la funzione incognita è funzione di una singola variabile si dirà che l’equazione ODE
è una equazione differenziale ordinaria (abbreviato EDO in italiano, ODE per gli
anglosassoni). Di contro se la funzione incognita è funzione di più variabili PDE
l’equazione si chiamerà equazione differenziale alle derivate parziali (abbreviato EDP
in italiano e PDE in lingua inglese). In questo corso, centrato sulle funzioni di
una variabile, tratteremo quindi solamente le equazioni differenziali ordinarie. ordine
L’ordine dell’equazione differenziale è il numero massimo di derivate successive
che vengono applicate alla funzione incognita. La funzione 𝑢 sarà definita su
un intervallo 𝐼 della retta reale: 𝑢 : 𝐼 → ℝ e la funzione e le derivate vengono
tutte valutate nello stesso punto. In tal caso la forma più generale di equazione
differenziale ordinaria di ordine 𝑛 si potrà dunque scrivere come:
𝐹(𝑥, 𝑢(𝑥), 𝑢 0(𝑥), 𝑢 00(𝑥), . . . , 𝑢 (𝑛) (𝑥)) = 0 (9.1)
con 𝐹 : Ω → ℝ una funzione data, definita su un insieme Ω ⊆ 𝐼 × ℝ𝑛+1 . Una

funzione 𝑢 : 𝐼 → ℝ si dice essere una soluzione dell’equazione differenziale (9.1) se
𝑢 è derivabile almeno 𝑛 volte in ogni punto 𝑥 ∈ 𝐼 e se (9.1) è soddisfatta per
ogni 𝑥 ∈ 𝐼 .
372 9 equazioni differenziali
Usualmente si tende a semplificare la notazione evitando di scrivere sempre

esplicitamente il punto 𝑥 in cui viene calcolata la funzione. Sarà quindi usuale
scrivere l’equazione (9.1) nella forma abbreviata:
𝐹(𝑥, 𝑢, 𝑢 0 , 𝑢 00 , . . . , 𝑢 (𝑛) ) = 0
rendendo anche più evidente il fatto che l’incognita è 𝑢 , l’intera funzione, e non
un singolo valore 𝑢(𝑥).
Se ad esempio scegliamo 𝑛 = 2 e 𝐹(𝑥, 𝑢, 𝑣, 𝑧) = 𝑧 + sin 𝑢 + 𝑣 otteniamo

l’equazione differenziale:
𝑢 00(𝑥) + sin 𝑢(𝑥) + 𝑢 0(𝑥) = 0 (9.2)
che, in opportune unità di misura, è l’equazione del moto di un pendolo

smorzato, dove 𝑥 rappresenta il tempo e 𝑢 la misura dell’angolo di inclinazione
equazioni autonome del pendolo rispetto alla verticale. Osserviamo che nell’esempio precedente la
funzione 𝐹 non dipende direttamente dalla variabile 𝑥 . Equazioni con questa
proprietà si dicono equazioni autonome ed è immediato osservare che se 𝑢(𝑥)
è soluzione anche una sua traslazione temporale 𝑣(𝑥) = 𝑢(𝑥 − 𝑥 0 ) è soluzione
equazione in forma implicita dell’equazione (il moto del pendolo non dipende dall’ora in cui si svolge).
Una equazione scritta nella forma (9.1) si dice equazione in forma implicita e per
equazioni in forma normale analogia con le equazioni algebriche (si pensi all’equazione 𝑢 2 (𝑥) + 𝑥 2 = 1)
ci si aspetta che le soluzioni di tale equazioni siano meglio rappresentate da
curve piuttosto che da grafici di funzione. Risulta in effetti che la teoria delle
equazioni differenziali si applica con molta maggiore efficacia alle equazioni in
forma normale che sono le equazioni differenziali di ordine 𝑛 che possono essere
scritte esplicitando la dipendenza dalla derivata di ordine massimo:
𝑢 (𝑛) (𝑥) = 𝑓 (𝑥, 𝑢(𝑥), 𝑢 0(𝑥), . . . , 𝑢 𝑛−1 (𝑥)) (9.3)

sistemi
dove 𝑓 : Ω → ℝ è una funzione definita su Ω ⊆ 𝐼 × ℝ𝑛 . L’equazione del pendolo

si può scrivere in questa forma, scegliendo 𝑓 (𝑥, 𝑢, 𝑣) = − sin 𝑢 − 𝑣 .
Più in generale potremmo considerare sistemi di equazioni differenziali in più

incognite. Possiamo rappresentare un sistema di 𝑘 equazioni ordinarie in 𝑚
incognite nella forma:
𝑭(𝑥, 𝒖(𝑥), 𝒖 0(𝑥), . . . , 𝒖 𝑛 (𝑥)) = 0 (9.4)
dove 𝒖 è una funzione vettoriale 𝒖 : 𝐼 → ℝ𝑚 le cui componenti sono le 𝑚

funzioni incognite:
𝒖(𝑥) = (𝑢1 (𝑥), . . . , 𝑢𝑚 (𝑥))
mentre la funzione 𝑭 : 𝐼 × (ℝ𝑚 )𝑛+1 → ℝ 𝑘 è stavolta una funzione a valori
vettoriali 𝑭 = (𝐹1 , . . . , 𝐹 𝑘 ) cosicché l’equazione vettoriale (9.4) è effettivamente
9.1 classificazione 373
equivalente ad un sistema di 𝑘 equazioni:


 𝐹1 (𝑥, 𝒖(𝑥), 𝒖 0(𝑥) . . . , 𝒖 (𝑛) (𝑥)) = 0

 𝐹2 (𝑥, 𝒖(𝑥), 𝒖 0(𝑥) . . . , 𝒖 (𝑛) (𝑥)) = 0



..


 .

 𝐹 𝑘 (𝑥, 𝒖(𝑥), 𝒖 0(𝑥) . . . , 𝒖 (𝑛) (𝑥)) = 0


Vedremo che per le equazioni ordinarie del primo ordine è naturale, come
accade per le equazioni algebriche, avere lo stesso numero di equazioni e di
incognite dunque è tipico avere singole equazioni scalari del primo ordine (cioè
in cui l’incognita è una funzione a valori nel campo degli scalari ℝ) o sistemi
di 𝑘 = 𝑚 equazioni del primo ordine con incognita una funzione vettoriale 𝒖
(cioè una funzione a valori nello spazio vettoriale ℝ𝑚 ) ovvero con 𝑚 incognite
𝑢1 , . . . , 𝑢𝑚 funzioni scalari.
Una importante osservazione è il fatto generale che una equazione differenziale

di ordine 𝑛 può essere ricondotta ad un sistema di 𝑛 equazioni differenziali
del primo ordine. Basta infatti considerare come incognita il vettore (chiamato
jet)
𝒖 = (𝑢, 𝑢 0 , 𝑢 00 , . . . , 𝑢 (𝑛−1) )
comprendente tutte le derivate della funzione scalare 𝑢 fino all’ordine 𝑛 − 1.
L’equazione (9.1), di ordine 𝑛 , risulta infatti equivalente al sistema di 𝑛 equazioni
del primo ordine nella variabile 𝒖 = (𝑢1 , . . . , 𝑢𝑛 )
𝑢2 (𝑥) = 𝑢10 (𝑥)





𝑢3 (𝑥) = 𝑢20 (𝑥)




..



 .
𝑢𝑛 (𝑥) = 𝑢𝑛−
0

1 (𝑥)




 𝐹(𝑥, 𝑢1 (𝑥), 𝑢2 (𝑥), . . . , 𝑢𝑛 (𝑥), 𝑢𝑛0 (𝑥)) = 0



Nel caso, più interessante, delle equazioni in forma normale l’equazione (9.3)
di ordine 𝑛 diventa un sistema di 𝑛 equazioni normali del primo ordine in 𝑛
incognite
𝑢10 (𝑥) = 𝑢2 (𝑥)




 𝑢 0 (𝑥) = 𝑢 (𝑥)

 3
 2

..


 .
𝑢𝑛−1 (𝑥) = 𝑢𝑛 (𝑥)
0





 𝑢𝑛0 (𝑥) = 𝑓 (𝑥, 𝑢1 (𝑥), 𝑢2 (𝑥), . . . , 𝑢𝑛 (𝑥))



ovvero una equazione differenziale vettoriale del primo ordine
𝒖 0(𝑥) = 𝒇 (𝑥, 𝒖(𝑥)).
Nell’esempio del pendolo (9.2) si avrà come incognita una funzione vettoriale
𝒖(𝑥) = (𝑢(𝑥), 𝑢 0(𝑥)) le cui componenti sono posizione e velocità angolare. Il
codominio di tale funzione si chiama spazio delle fasi. L’equazione (essendo
autonoma tralasciamo la dipendenza da 𝑥 ) si scriverà nella forma 𝒖 0 = 𝒇 (𝒖) con

𝒇 (𝑦1 , 𝑦2 ) = (𝑦2 , − sin(𝑦1 ) − 𝑦2 ).
equazioni lineari
Un caso molto particolare ma decisamente importante è quello in cui la funzione

𝐹 (per le equazioni in forma implicita) o la funzione 𝑓 (per le equazioni in forma
normale) sono funzioni lineari per ogni 𝑡 rispetto alla variabile 𝑢 . In tal caso
equazioni lineari omogenee diremo che l’equazione è lineare omogenea. Più precisamente si avrà
Per evidenziare il fatto che una funzione
𝐿 è lineare tenderemo ad utilizzare le pa- 𝐹(𝑥, 𝑢(𝑥), 𝑢 0(𝑥), . . . , 𝑢 (𝑛) (𝑥)) = 𝐴 𝑥 [𝑢(𝑥), 𝑢 0(𝑥), . . . , 𝑢 (𝑛) (𝑥)]
rentesi quadre (invece che le tonde) per
racchiudere l’argomento della funzione: con 𝐴 𝑥 : ℝ𝑛+1 → ℝ operatore lineare per ogni 𝑥 ovvero 𝐴 𝑥 si rappresenta
𝐿[𝑣] = 𝐿(𝑣). tramite un vettore i cui coefficienti sono funzioni della variabile 𝑥 :
𝑛
X
𝐴 𝑥 [𝒚] = 𝑎 𝑘 (𝑥)𝑦 𝑘
𝑘=0
e l’equazione differenziale si scrive nella forma
𝑎0 (𝑥)𝑢(𝑥) + 𝑎 1 (𝑥)𝑢 0(𝑥) + · · · + 𝑎 𝑛 (𝑥)𝑢 (𝑛) (𝑥) = 0.
Nel caso in cui i coefficienti 𝑎 𝑘 (𝑡) non dipendano da 𝑥 (cioè siano funzioni
coefficienti costanti costanti) diremo che l’equazione è lineare a coefficienti costanti.
E’ facile osservare che l’insieme delle soluzioni di una equazione lineare

omogenea è uno spazio vettoriale: 𝑢 = 0 è sempre soluzione, se 𝑢 è una
soluzione e 𝜆 ∈ ℝ anche 𝜆𝑢 è soluzione e se 𝑢 e 𝑣 sono due soluzioni anche
principio di sovrapposizione 𝑢 + 𝑣 è soluzione (principio di sovrapposizione).
In effetti se le funzioni 𝑢 sono definite su un intervallo 𝐼 possiamo identificare

𝐹 con un funzionale 𝐿 : ℝ𝐼 → ℝ𝐼 definito da
𝐿[𝑢](𝑥) = 𝐹(𝑥, 𝑢(𝑥), 𝑢 0(𝑥), . . . , 𝑢 (𝑛) (𝑥))
Se l’equazione differenziale è lineare allora 𝐿 è un operatore lineare sullo spazio

vettoriale ℝ𝐼 e lo spazio delle soluzioni dell’equazione differenziale non è altro
che ker 𝐿, il nucleo dell’operatore, ed è noto che ker 𝐿 è un sottospazio vettoriale.
Nonostante ℝ𝐼 sia uno spazio vettoriale di dimensione infinita scopriremo che
(sotto opportune ipotesi) lo spazio vettoriale delle soluzioni ha dimensione
finita 𝑛 , uguale al grado dell’equazione.
Una funzione 𝑓 : 𝑉 → 𝑊 definita tra
due spazi vettoriali si dice essere af- Nel caso in cui la funzione 𝐹 (o la corrispondente 𝑓 ) sia affine si dirà che
fine se può essere scritta nella forma l’equazione differenziale è una equazione lineare (non omogenea). L’equazione
𝑓 (𝑣) = 𝐿[𝑣] + 𝑞 con 𝐿 : 𝑉 → 𝑊 operato- non omogenea avrà la forma:
re lineare e 𝑞 ∈ 𝑊 fissato. Una equazione
lineare 𝐿[𝑣] = 𝑤 può quindi sempre es-
sere scritta nella forma 𝑓 (𝑣) = 0 con 𝑓 𝑎0 (𝑥)𝑢(𝑥) + 𝑎1 (𝑥)𝑢 0(𝑥) + · · · + 𝑎 𝑛 (𝑥)𝑢 (𝑛) (𝑥) = 𝑔(𝑥).
affine.
Se 𝑣 0 e 𝑣 1 sono due soluzioni di questa equazione è chiaro che la differenza
equazione lineari
𝑢 = 𝑣1 − 𝑣0 è soluzione dell’equazione omogenea
𝑎0 (𝑥)𝑢(𝑥) + 𝑎1 (𝑥)𝑢 0(𝑥) + · · · + 𝑎 𝑛 (𝑥)𝑢 (𝑛) (𝑥) = 0.

9.1 classificazione 375
Dunque quest’ultima si chiama equazione omogenea associata alla non omoge-

nea e se 𝑣 0 è una soluzione particolare (qualunque) dell’equazione non omogenea
ogni soluzione 𝑣 dell’equazione non omogenea si scrive nella forma
𝑣 = 𝑣0 + 𝑢
con 𝑢 soluzione dell’omogenea associata. Per trovare tutte le soluzioni di una

equazione non omogenea è dunque sufficiente trovare una soluzione particolare
della non omogenea e tutte le soluzioni della equazione omogenea associata.
L’equazione del pendolo (9.2) non è lineare ma quando l’angolo 𝑢 è piccolo

(cioè per piccole oscillazioni) si ha sin 𝑢 ∼ 𝑢 . Facendo questa linearizzazione si
ottiene l’equazione
𝑢 00(𝑥) + 𝑢(𝑥) + 𝑢 0(𝑥) = 0.
Questa è una equazione lineare omogenea. Se sul pendolo agisce una forza
esterna (pendolo forzato) l’equazione diventa
𝑢 00(𝑥) + 𝑢(𝑥) + 𝑢 0(𝑥) = 𝑔(𝑥)
dove 𝑔(𝑥) rappresenta l’entità di una forza esterna variabile nel tempo. Questa
equazione è lineare non omogenea.
Come nel caso generale le equazioni lineari di ordine 𝑛 si riconducono a sistemi

lineari di 𝑛 equazioni del primo ordine.
problema di Cauchy
Se le equazioni differenziali di ordine 𝑛 hanno uno spazio di soluzioni di

dimensione 𝑛 ci si aspetta che qualcosa del genere succeda anche per le
equazioni differenziali di ordine 𝑛 in forma normale. Lo spazio delle soluzioni
in generale non sarà lineare ma, in un certo senso, avrà comunque dimensione
𝑛 cioè le soluzioni potranno essere identificate da 𝑛 parametri indipendenti.
Per fare questo, ad una equazione differenziale in forma normale di ordine 𝑛
𝑢 (𝑛) (𝑥) = 𝑓 (𝑥, 𝑢(𝑥), . . . , 𝑢 𝑛−1 (𝑥))

condizione iniziale
si aggiunge una condizione iniziale ovvero si fissa un punto iniziale 𝑥 0 e un valore
iniziale per ognuna delle derivate di ordine inferiore a 𝑛 : 𝑢(𝑥 0 ) = 𝑦0 , 𝑢 0(𝑥 0 ) = 𝑦1 ,
. . . , 𝑢 𝑛−1 (𝑥 0 ) = 𝑦𝑛−1 . Questa condizione si chiama anche condizione di Cauchy e il
problema che si ottiene aggiungendo una condizione iniziale ad una equazione
differenziale:
𝑛−1
 𝑢 (𝑥) = 𝑓 (𝑥, 𝑢(𝑥), . . . , 𝑢 (𝑥))

 (𝑛)

 𝑢(𝑥0 ) = 𝑦0 ,




𝑢 0(𝑥0 ) = 𝑦1 ,


 ..
.





 𝑢 (𝑛−1) (𝑥0 ) = 𝑦𝑛−1


 problema di Cauchy
si chiama problema di Cauchy. Vedremo che, sotto opportune ipotesi, il problema
di Cauchy ammette una unica soluzione e questo significa, sostanzialmente, che
l’insieme di tutte le soluzioni dell’equazione differenziale può essere descritto

dal variare degli 𝑛 parametri 𝑦0 , 𝑦1 , . . . , 𝑦𝑛−1 .
Una delle ipotesi fondamentali per garantire l’unicità delle soluzioni di un

problema di Cauchy è che le soluzioni siano definite su un intervallo. E’ chiaro
infatti che se ho due soluzioni definite su due intervalli separati, potrei unire le
due soluzioni e ottenere una soluzione definita sull’unione dei due intervalli pur
potendo scegliere condizioni iniziali indipendenti in ognuno dei due intervalli.
Viceversa una soluzione definita su un intervallo 𝐼 è soluzione anche se ristretta
ad ogni sottoinsieme di 𝐼 (che sia o no un intervallo). Se restringo una soluzione
o unisco due soluzioni ottengo formalmente soluzioni diverse in quanto i
domini di definizione sono diversi, ma queste soluzioni assumono, dove sono
definite, gli stessi valori. Per evitare questa ambiguità considereremo sempre
intervallo massimale solamente le soluzioni definite su un intervallo massimale cioè soluzioni definite
su un intervallo che non possono essere estese su intervalli più grandi.
9.2 metodi risolutivi
Una tipologia di equazioni differenziali che abbiamo già trattato è data dalle
equazioni della forma:
𝑢 0(𝑥) = 𝑓 (𝑥).
Banalmente l’insieme delle soluzioni è dato dalle primitive di 𝑓 :
∫
𝑢∈ 𝑓.
Se 𝑓 è definita su un intervallo tutte le soluzioni 𝑢 definite sullo stesso intervallo

e, grazie al Teorema 6.27 si scrivono quindi nella forma
𝑢(𝑥) = 𝐹(𝑥) + 𝑐
dove 𝐹 è una qualunque primitiva di 𝑓 e 𝑐 ∈ ℝ è una costante additiva arbitraria.

Se 𝑓 è continua e consideriamo il problema di Cauchy:
(
𝑢 0(𝑥) = 𝑓 (𝑥)
𝑢(𝑥0 ) = 𝑦0 .
possiamo identificare una unica soluzione che si scrive nella forma:

∫ 𝑥
𝑢(𝑥) = 𝑦0 + 𝑓 (𝑡) 𝑑𝑡.
𝑥0
equazioni lineari del primo ordine
Le equazioni differenziali ordinarie del primo ordine in forma normale possono

essere scritte nella forma:
𝑢 0(𝑥) + 𝑎(𝑥)𝑢(𝑥) = 𝑏(𝑥). (9.5)

9.2 metodi risolutivi 377
Per risolvere queste equazioni si cerca di ricondurre la somma nel lato sinistro
alla derivata di un prodotto. Per fare ciò si considera una qualunque primitiva
𝐴 ∈ 𝑎 e si moltiplicano ambo i membri per 𝑒 𝐴(𝑥) :
∫
𝑒 𝐴(𝑥) 𝑢 0(𝑥) + 𝑎(𝑥)𝑒 𝐴(𝑥) 𝑢(𝑥) = 𝑏(𝑥)𝑒 𝐴(𝑥)
essendo 𝐴0(𝑥) = 𝑎(𝑥) si osserva che il lato sinistro è ora la derivata di un

prodotto:
0
𝑒 𝐴(𝑥) 𝑢(𝑥) = 𝑏(𝑥)𝑒 𝐴(𝑥)
da cui ∫
𝑒 𝐴(𝑥) 𝑢(𝑥) ∈ 𝑏(𝑥)𝑒 𝐴(𝑥) 𝑑𝑥.
Moltiplicando ambo i membri per 𝑒 −𝐴(𝑥) (visto che l’esponenziale non si annulla
mai questa operazione non modifica lo spazio delle soluzioni) si ottiene
∫ ∫
𝑢(𝑥) = 𝑒 −𝐴(𝑥) 𝑏(𝑥)𝑒 𝐴(𝑥) 𝑑𝑥, 𝐴(𝑥) ∈ 𝑎(𝑥) 𝑑𝑥.
Più esplicitamente scelta una qualunque primitiva del lato destro

∫
𝐹(𝑥) ∈ 𝑏(𝑥) · 𝑒 𝐴(𝑥) 𝑑𝑥
su ogni intervallo in cui 𝑎(𝑥) e 𝑏(𝑥) sono definite si ha
𝑢(𝑥) = 𝑒 −𝐴(𝑥) · (𝐹(𝑥) + 𝑐).
per qualche 𝑐 ∈ ℝ.
Se 𝑏(𝑥) = 0 l’equazione è lineare omogenea, possiamo scegliere 𝐹(𝑥) = 0 e

quindi lo spazio delle soluzioni in questo caso è dato da
𝑢(𝑥) = 𝑐 · 𝑒 −𝐴(𝑥)
ed è quindi lo spazio vettoriale unidimensionale generato dalla funzione

𝑒 −𝐴(𝑥) .
Ogni soluzione della equazione non omogenea si può scrivere come somma di
una soluzione particolare 𝑢0 della equazione non omogenea più una generica
soluzione dell’equazione omogenea associata. Infatti:
𝑢(𝑥) = 𝑢0 (𝑥) + 𝑐𝑒 −𝐴(𝑥)
dove
𝑢0 (𝑥) = 𝑒 −𝐴(𝑥) 𝐹(𝑥)
è una particolare soluzione dell’equazione non omogenea.
Osserviamo che se 𝑎(𝑥) e 𝑏(𝑥) sono funzioni continue definite su uno stesso
intervallo 𝐼 , anche la soluzione è definita su tutto 𝐼 . Si dirà quindi che la
soluzione esiste globalmente.
Esercizio 9.1 (autovettori dell’operatore derivata). Fissato 𝜆 ∈ ℝ trovare tutte le

soluzioni dell’equazione
𝑢 0(𝑥) = 𝜆𝑢(𝑥).
Svolgimento. Scriviamo l’equazione nella forma
𝑢 0(𝑥) − 𝜆𝑢(𝑥) = 0.
Nelle notazioni∫ precedenti abbiamo 𝑎(𝑥) = −𝜆 e quindi possiamo scegliere

𝐴(𝑥) = −𝜆𝑥 ∈ 𝑎 . Moltiplicando ambo i membri per 𝑒 −𝐴(𝑥) si ottiene
𝑒 −𝜆𝑥 𝑢 0(𝑥) − 𝜆𝑒 −𝜆𝑥 𝑢(𝑥) = 0
cioè 0
𝑒 −𝜆𝑥 · 𝑢(𝑥) =0
da cui su ogni intervallo in cui 𝑢 è definita esiste una costante 𝑐 tale che
𝑒 −𝜆𝑥 𝑢(𝑥) = 𝑐
ovvero
𝑢(𝑥) = 𝑐𝑒 𝜆𝑥 .
Abbiamo dunque trovato che le soluzioni sono definite su tutto ℝ, una soluzione
è 𝑒 𝜆𝑥 e ogni altra soluzione è multiplo di questa.
Esercizio 9.2. 1. Trovare le soluzioni dell’equazione differenziale

𝑢
𝑢0 − = 𝑥2 .
𝑥
2. Trovare le soluzioni dell’equazione differenziale
𝑥𝑢 0 − 𝑢 = 𝑥 3 .
Svolgimento. La prima è una equazione lineare non omogenea del primo ordine
del tipo (9.5). Il fattore integrante è 𝑒 𝐴(𝑥) con
∫ ∫
1
𝐴(𝑥) ∈ 𝑎(𝑥) 𝑑𝑥 = − 𝑑𝑥 3 − ln |𝑥|.
𝑥
Dunque 𝑒 𝐴(𝑥) = 1/|𝑥| . Dovremmo dunque dividere ambo i membri dell’equa-

zione per |𝑥| . Osserviamo che l’equazione non è definita per 𝑥 = 0 e possiamo
dunque distinguere i casi 𝑥 > 0 e 𝑥 < 0. Decidiamo quindi, per semplicità,
di cambiare segno all’equazione per 𝑥 < 0 cosicché possiamo dividere per 𝑥
invece che per |𝑥| . Si ottiene dunque:
𝑢0 𝑢
− 2 =𝑥
𝑥 𝑥
cioè 0
1
𝑢· =𝑥
𝑥
da cui
𝑢 𝑥2
∫
∈ 𝑥 𝑑𝑥 3 .
𝑥 2
Dunque la funzione 𝑢(𝑥)/𝑥 differisce da 𝑥 2 /2 per una costante su ognuno dei
due intervalli 𝑥 > 0 e 𝑥 < 0. Su ognuno dei due intervalli si ha dunque:
𝑢(𝑥) 𝑥 2
= +𝑐
𝑥 2
da cui
𝑥3
𝑢(𝑥) =
+ 𝑐𝑥
2
per qualche 𝑐 ∈ ℝ. Per come è stato posto il problema, la soluzione non deve
essere definita per 𝑥 = 0 e la costante 𝑐 può essere quindi diversa se 𝑥 > 0 o
𝑥 < 0.
La seconda equazione è equivalente alla prima se 𝑥 ≠ 0. Ma non è in forma
normale e le soluzioni potranno essere definite anche per 𝑥 = 0. Si avrà quindi
𝑥3
𝑢(𝑥) = + 𝑐𝑥
2
come prima ma affinché la funzione sia derivabile in 𝑥 = 0 la costante 𝑐 dovrà
essere uguale per 𝑥 > 0 e per 𝑥 < 0.
Si osservi che ogni soluzione soddisfa la condizione iniziale 𝑢(0) = 0 e che

quindi nessuna soluzione soddisfa la condizione 𝑢(0) = 𝑞 se 𝑞 ≠ 0.
Esercizio 9.3. Risolvere l’equazione differenziale:

𝑢
𝑢0 + = 1.
(1 + 𝑥 2 ) arctg 𝑥
Svolgimento. Osserviamo che l’equazione è definita solo per 𝑥 ≠ 0. Cercheremo

quindi le soluzioni sui due intervalli 𝑥 < 0 e 𝑥 > 0. Moltiplicando ambo i
membri dell’equazione per arctg 𝑥 si ottiene
1
arctg 𝑥 · 𝑢 0(𝑥) + 𝑢(𝑥) = arctg 𝑥
1 + 𝑥2
cioè:
(arctg 𝑥 · 𝑢(𝑥))0 = arctg 𝑥
da cui ∫
1
arctg 𝑥 · 𝑢(𝑥) ∈ arctg 𝑥 𝑑𝑥 3 𝑥 arctg 𝑥 − ln(1 + 𝑥 2 ).
2
Dunque su ogni intervallo su cui la soluzione è definita esisterà 𝑐 ∈ ℝ tale che
1
arctg 𝑥 · 𝑢(𝑥) = 𝑥 arctg 𝑥 − ln(1 + 𝑥 2 ) + 𝑐
2
da cui essendo 𝑥 ≠ 0 si può dividere per arctg 𝑥 e ottenere
ln(1 + 𝑥 2 ) 𝑐
𝑢(𝑥) = 𝑥 − + .
2 arctg 𝑥 arctg 𝑥
Abbiamo quindi una famiglia di soluzioni definite per 𝑥 < 0 e una famiglia di
soluzioni definite per 𝑥 > 0.
equazioni a variabili separabili
Si chiamano equazioni a variabili separabili le equazioni del tipo:
𝑢 0(𝑥) = 𝑓 (𝑥) · 𝑔(𝑢(𝑥)). (9.6)
Questa è una equazione del primo ordine in forma normale:
𝑢 0(𝑥) = 𝐹(𝑥, 𝑢(𝑥))
dove nella funzione 𝐹 risulta possibile separare le due variabili in un prodotto:
𝐹(𝑥, 𝑦) = 𝑓 (𝑥) · 𝑔(𝑦).
Se 𝑢 è una soluzione dell’equazione (9.6) e se 𝑥 è un punto in cui 𝑔(𝑢(𝑥)) ≠ 0,

possiamo dividere ambo i membri dell’equazione per 𝑔(𝑢(𝑥)) per ottenere:
𝑢 0(𝑥)
= 𝑓 (𝑥).
𝑔(𝑢(𝑥))
Vogliamo ora scrivere il lato sinistro come la derivata della funzione composta.
Se scegliamo una primitiva di 1/𝑔 :
∫
1
𝐻(𝑢) ∈ 𝑑𝑢
𝑔(𝑢)
si osserva che
𝑢 0(𝑥)
(𝐻(𝑢(𝑥)))0 = 𝐻 0(𝑢(𝑥)) · 𝑢 0(𝑥) = = 𝑓 (𝑥).
𝑔(𝑢(𝑥))
∫
dunque se 𝐹 ∈ 𝑓 , su ogni intervallo in cui 𝑔(𝑢(𝑥)) ≠ 0 dovrà esistere 𝑐 ∈ ℝ
tale che
𝐻(𝑢(𝑥)) = 𝐹(𝑥) + 𝑐.
Se supponiamo inoltre che 𝐻 sia invertibile si avrà:
𝑢(𝑥) = 𝐻 −1 (𝐹(𝑥) + 𝑐).
Esempio 9.4. Risolviamo l’equazione
𝑢 0 = 𝑥𝑢 2 + 𝑥. (9.7)
E’ una equazione del primo ordine in forma normale. Raccogliendo 𝑥 al lato destro si
ottiene una equazione a variabili separabili. Dividendo ambo i membri per 𝑢 2 + 1 (che è
sempre diverso da zero) si ottiene l’equazione equivalente
𝑢0
= 𝑥.
1 + 𝑢2
-4 -3 -2 -1 1 2 3 4
Figura 9.1: i grafici delle soluzioni
dell’equazione differenziale (9.7).
-1
-2
(interagisci)
Integrando il lato sinistro si ottiene:
𝑢 0(𝑥) 𝑑𝑢
∫ ∫
𝑑𝑥 = 3 arctg(𝑢(𝑥))
1 + 𝑢 2 (𝑥) 1 + 𝑢2 𝑢=𝑢(𝑥)
mentre per il lato destro si ottiene
𝑥2
∫
𝑥 𝑑𝑥 3 .
2
Dunque su ogni intervallo si deve avere
𝑥2
arctg(𝑢(𝑥)) = + 𝑐.
2
Visto che l’arcotangente assume valori compresi tra −𝜋/2 e 𝜋/2 anche il lato destro
dovrà rimanere in tale intervallo. Dovrà quindi essere:
𝜋 𝑥2 𝜋
− < +𝑐 < . (9.8)
2 2 2
Con questa condizione possiamo invertire l’arcotangente ottenendo finalmente una
espressione per la soluzione:
𝑥2

𝑢(𝑥) = tg +𝑐 . (9.9)
2
Osserviamo che la condizione (9.8) equivale a richiedere che l’argomento della tangente
stia nell’intervallo − 𝜋2 , 𝜋2 . In tal caso dovrà essere 𝑐 < 𝜋2 e si osserva che se 𝑐 > − 𝜋2

la soluzione 𝑢(𝑥) è definita su un intervallo aperto centrato in 𝑥 = 0 mentre se 𝑐 ≤ − 𝜋2
la soluzione è definita su una coppia di intervalli simmetrici con ampiezza che tende
a zero quando 𝑐 → −∞. Agli estremi di tali intervalli la soluzione ha degli asintoti
verticali.
In questo caso possiamo osservare che la condizione (9.8) può essere trascurata, visto
che la funzione tg è 𝜋-periodica e quindi è possibile sommare a 𝑐 un multiplo intero
di 𝜋 senza che la soluzione venga modificata. Nell’equazione (9.9) si potrebbe quindi
considerare la funzione tg definita su tutto il suo dominio osservando che in tal caso si
può supporre che sia 𝑐 ∈ − 𝜋2 , 𝜋2 . Invece di ottenere un singolo intervallo per ogni 𝑐

si ottengono così tutti gli infiniti intervalli.
Osservazione 9.5. L’esempio precedente mette in evidenza il fatto che le soluzioni

massimali possono essere definite su intervalli arbitrariamente piccoli anche se l’equa-
zione differenziale non presenta singolarità. Diremo in questo caso che la soluzione non
è globale.
D’altra parte si osserva che i grafici delle soluzioni riempiono tutto il piano senza mai
toccarsi l’uno con l’altro (si dice a volte che sono una fibrazione). Questo è dovuto al
fatto che questa equazione soddisfa il teorema 9.16 e quindi per ogni punto del piano
passa una ed una sola soluzione.
Esempio 9.6. Si voglia risolvere l’equazione
𝑢0 = 𝑢 2 .
Si tratta di una equazione in forma normale, del primo ordine, autonoma. In particolare
è a variabili separabili 𝑢 0 = 𝑓 (𝑢(𝑥)) · 𝑔(𝑥) con 𝑓 (𝑢) = 𝑢 2 e 𝑔(𝑥) = 1. Osserviamo
innanzitutto che 𝑢(𝑥) = 0 è soluzione in quanto 𝑢 0(𝑥) = 𝑢 2 (𝑥) = 0. Se 𝑢 è una
soluzione non identicamente nulla ci saranno dei punti in cui 𝑢(𝑥) ≠ 0. In un intorno
di tali punti possiamo dividere ambo i membri dell’equazione per 𝑢 2 (𝑥) ottenendo:
𝑢0
= 1.
𝑢2
Integrando il lato sinistro tramite cambio di variabile 𝑢 = 𝑢(𝑥), 𝑑𝑢 = 𝑢 0(𝑥) 𝑑𝑥 si
ottiene:
𝑢 (𝑥) 𝑑𝑢
∫ 0 ∫
1 1
𝑑𝑥 = = − =−
𝑢 (𝑥)
2 𝑢 𝑢=𝑢(𝑥)
2 𝑢 𝑢=𝑢(𝑥) 𝑢(𝑥)
mentre integrando il lato destro si ha
∫
1 𝑑𝑥 3 𝑥.
Dunque su ogni intervallo in cui 𝑢(𝑥) ≠ 0 deve esistere una costante 𝑐 ∈ ℝ tale che
1
− =𝑥+𝑐
𝑢(𝑥)
ovvero, ponendo 𝑥 0 = −𝑐
1 1
𝑢(𝑥) = − = . (9.10)
𝑥+𝑐 𝑥0 − 𝑥
In conclusione abbiamo trovato una soluzione costante 𝑢(𝑥) = 0 e una famiglia di solu-
zioni definite sugli intervalli (−∞, 𝑥 0 ) e (𝑥 0 , +∞) rappresentante dall’equazione (9.10).
Dovremmo ora chiederci se è possibile che queste soluzioni vengano mescolate tra loro,
ovvero se una soluzione può valere zero in alcune zone e soddisfare (9.10) in altre.
In questo caso la risposta è no. Basta osservare che una funzione 𝑢 che soddisfa
l’equazione (9.10) può tendere a zero solamente quando 𝑥 → +∞ o 𝑥 → −∞. Questo
significa che se consideriamo una soluzione 𝑢(𝑥) definita su un intervallo 𝐼 e se in
Figura 9.2: Il baffo di Peano formato

-2 -1 1 2 3 4 5 6 7 8 9
dalle soluzioni del problema di
Cauchy (9.11).
-1
-2
(interagisci)
almeno un punto la soluzione è diversa da zero, allora la soluzione è diversa da zero su

tutto 𝐼 e soddisfa l’equazione (9.10) in quanto la soluzione nulla e la soluzione (9.10)
non sono tra loro compatibili (non possono essere incollate con continuità).
Vedremo più avanti un risultato (proposizione 9.20) che garantisce in ipotesi molto
generali (che sono soddisfatte per questa equazione) due diverse soluzioni non possono
mai incontrarsi.
Esercizio 9.7. Fissato 𝑝 > 1 si risolva l’equazione differenziale
𝑢0 = 𝑢 𝑝
e si osservi che la soluzione presenta sempre un asintoto verticale (dunque non c’è
esistenza globale).
Esempio 9.8 (baffo di Peano). Si determinino tutte le soluzioni del problema di

Cauchy ( p3
𝑢 0(𝑥) = 𝑢(𝑥)
(9.11)
𝑢(0) = 0
Svolgimento. Osserviamo che la funzione nulla 𝑢(𝑥) = 0 è soluzione dell’equa-

zione e soddisfa la condizione 𝑢(0) = 0. Ma a priori non possiamo escludere
che ci siano altre soluzioni dell’equazione che verifichino la stessa condizione
(vedremo che la proposizione 9.20 non si applica in questo caso particolare).
Nei punti in cui 𝑢(𝑥) ≠ 0 possiamo riscrivere l’equazione nella forma
𝑢 0(𝑥)
p3 = 1.
𝑢(𝑥)
Integrando il lato sinistro tramite il cambio di variabili 𝑢 = 𝑢(𝑥), 𝑑𝑢 = 𝑢 0(𝑥) 𝑑𝑥 ,

si ottiene
𝑢 0(𝑥) 𝑑𝑢
∫ ∫
3 p3 2
𝑑𝑥 = √3 3 𝑢 (𝑥).
𝑢 𝑢=𝑢(𝑥) 2
p3
𝑢(𝑥)
integrando anche il lato destro troviamo dunque che su ogni intervallo su cui 𝑢
è definita e 𝑢(𝑥) ≠ 0 deve esistere una costante 𝑐 tale che
3 p3 2
𝑢 (𝑥) = 𝑥 + 𝑐.
2
Risolvendo in 𝑢(𝑥): s
3
2
𝑢(𝑥) = ± (𝑥 + 𝑐) . (9.12)
3
Osserviamo che la proprietà precedente può essere soddisfatta solamente se
𝑥 ≥ −𝑐 ma affinché sia 𝑢(𝑥) ≠p0 dobbiamo imporre 𝑥 > −𝑐 . Ma per 𝑥 → −𝑐 + si
ha 𝑢(𝑥) → 0 e anche 𝑢 0(𝑥) = 3 𝑢(𝑥) → 0. Significa che una soluzione definita
su 𝑥 > 𝑐 mediante la (9.12) può essere estesa a tutto ℝ ponendo 𝑢(𝑥) = 0 per
𝑥 ≤ 𝑐 . Affinché valga la condizione 𝑢(0) = 0 sarà dunque sufficiente imporre la
restrizione −𝑐 ≥ 0.
Il nostro problema ha dunque infinite soluzioni definite su tutto ℝ. Per la

precisione, per ogni 𝑐 ≥ 0 (cambiamo segno alla costante trovata prima, in
modo che risulti positiva) si hanno le soluzioni
per 𝑥 ≤ 𝑐
(
0
𝑢(𝑥) = q 3
2
3 (𝑥 − 𝑐) per 𝑥 > 𝑐
e
per 𝑥 ≤ 𝑐
(
0
𝑢(𝑥) = q
3
− 2
3 (𝑥 − 𝑐) per 𝑥 > 𝑐
altri metodi risolutivi
Nella sezione precedente abbiamo visto che le equazioni lineari del primo
ordine e le equazioni a variabili separabili possono essere ricondotte al calcolo
di una primitiva. Nella sezione 9.6 verranno esposti i metodi risolutivi per le
equazioni lineari di ordine 𝑛 a coefficienti costanti.
Ci sono molti altri tipi di equazioni che possono essere ricondotti alle equazioni
lineari o alle equazioni a variabili separabili. Non potremo dilungarci su questi
metodi ma può essere utile, come riferimento non esaustivo, un elenco di alcune
tipologie di equazioni per le quali esiste un metodo risolutivo.
1. Equazione del secondo ordine senza dipendenza da 𝑢
𝐹(𝑥, 𝑢 0 , 𝑢 00) = 0
si riconduce al primo ordine ponendo 𝑢 0(𝑥) = 𝑣(𝑥), 𝑢 00(𝑥) = 𝑣 0(𝑥).

2. Equazione del secondo ordine autonoma
𝐹(𝑢, 𝑢 0 , 𝑢 00) = 0
si riconduce al primo ordine ponendo 𝑢 0(𝑥) = 𝑣(𝑢(𝑥)), 𝑢 00(𝑥) = 𝑣 0(𝑢(𝑥)) ·

𝑣(𝑢(𝑥)).
3. Equazione di Bernoulli
𝑢 0 = 𝑎(𝑥)𝑢 + 𝑏(𝑥)𝑢 𝛼
si riconduce ad una equazione lineare dividendo tutto per 𝑢 𝛼 e ponendo
𝑢(𝑥)1−𝛼 = 𝑣(𝑥), 𝑢𝑢𝛼 = 1𝑣−𝛼 .
0 0
4. Equazione di Clairaut
𝑢 = 𝑥𝑢 0 + 𝑓 (𝑢 0);
derivando l’equazione si ottiene 𝑢 0 = 𝑢 0 + 𝑥𝑢 00 + 𝑓 0(𝑢 0)𝑢 00 che si fattorizza:
𝑢 00 · (𝑥 + 𝑓 0(𝑢 0)) = 0. Il secondo fattore ci permette di determinare 𝑢 0(𝑥)
e inserendo 𝑢 0 nell’equazione originaria troviamo 𝑢(𝑥). Il primo fattore
𝑢 00 = 0 ci dà come soluzione una retta che, sostituendone l’equazione nella
equazione originaria, scopriamo essere tangente alla soluzione trovata
precedentemente. A queste soluzioni bisogna aggiungere le soluzioni
non 𝐶 2 formate da un tratto della curva inizale e che poi si staccano lungo
le semirette tangenti.
5. equazione di Riccati
𝑢 0 = 𝑢 2 + 𝑏(𝑥)𝑢 + 𝑐(𝑥).
si ponga 𝑢 0(𝑥) = −𝑣 0(𝑥)/𝑣(𝑥) per ricondursi ad una equazione lineare del
secondo ordine in 𝑣 ;
Esempio 9.9 (equazione di Newton). Un sistema fisico unidimensionale soggetto a

forze che dipendono solamente dalla posizione può essere descritto da un problema di
Cauchy:
 𝑢 (𝑥) = 𝐹(𝑢(𝑥))

 00


𝑢(𝑥 ) = 𝑢
0 0

 𝑢 0(𝑥0 ) = 𝑣0


(ad esempio per il pendolo si ha 𝐹(𝑦) = − sin 𝑦 ). La funzione 𝑣 definita da 𝑣(𝑢(𝑥)) =
𝑢 0(𝑥) mette in relazione la velocità con la posizione e descrive quindi il moto nel
cosiddetto spazio delle fasi. Con tale sostituzione si trova
𝑢 00(𝑥) = 𝑣 0(𝑢(𝑥))𝑢 0(𝑥) = 𝑣 0(𝑢(𝑥))𝑣(𝑢(𝑥))
che sostituita in 𝑢 00 = 𝐹(𝑢) ci dà una equazione differenziale del primo ordine per
𝑣 = 𝑣(𝑢):
𝑣 0 𝑣 = 𝐹(𝑢).
Questa è una equazione del primo ordine a variabili separabili che può essere interpretata
come la legge di conservazione dell’energia, infatti è equivalente a
𝑑 1 2
∫
𝑣 − 𝐹(𝑢) = 0
𝑑𝑥 2
∫
dove 12 𝑣 2 si interpreta come energia cinetica e − 𝐹 come energia potenziale. Integrando
tra 𝑥 0 e 𝑥 e utilizzando le condizioni iniziali si ottiene, con 𝑢 = 𝑢(𝑥):
∫ 𝑢
1 2 1
𝑣 (𝑢) = 𝑣 02 + 𝐹(𝑦) 𝑑𝑦.
2 2 𝑢0
Questa equazione descrive la traiettoria del sistema nel piano delle fasi (𝑢, 𝑣) e ci
permette di ricavare 𝑣 in funzione di 𝑢 :
s ∫ 𝑢
𝑣(𝑢) = ± 𝑣02 + 2 𝐹(𝑢) 𝑑𝑢
𝑢0
che significa:
s
∫ 𝑢(𝑥)
0
𝑢 (𝑥) = ± 𝑣02 +2 𝐹(𝑦) 𝑑𝑦. (9.13)
𝑢0
Questa è una equazione autonoma in 𝑢 , quindi a variabili separabili:
𝑢 0(𝑥)
±q ∫ 𝑢(𝑥) =1
𝑣02 − 𝑢0
𝐹(𝑦) 𝑑𝑦
che può essere integrata tra 𝑥 0 e 𝑥 facendo il cambio di variabile 𝑢 = 𝑢(𝑥)
𝑢(𝑥)
𝑑𝑢
∫
± q ∫𝑢 = 𝑥 − 𝑥0 .
𝑢0 𝑣02 − 𝐹(𝑦) 𝑑𝑦
𝑢0
In questo modo abbiamo determinato la funzione inversa della soluzione 𝑢(𝑥).
Esempio 9.10 (periodo del pendolo). Sia 𝑢(𝑥) l’angolo di scostamento dalla
verticale al tempo 𝑥 di un pendolo semplice di lunghezza ℓ . Considerando la componente
tangenziale della accelerazione di gravità (il cui modulo è 𝑔 ) l’equazione di Newton può
essere scritta nella forma:
𝑔
𝑢 00(𝑥) = − sin 𝑢(𝑥).
ℓ
𝑔
Siamo quindi nel caso dell’esempio precedente dove 𝐹(𝑢) = − ℓ sin 𝑢 e se al tempo
𝑥 = 0 lasciamo cadere da fermo il pendolo da un angolo 𝑢0 , si avrà 𝑣0 = 0. L’energia
potenziale sarà data allora da
𝑢
𝑔 𝑔
∫
− sin 𝑦 𝑑𝑦 = (cos 𝑢 − cos 𝑢0 ).
ℓ 𝑢0 ℓ
L’equazione (9.13) diventa dunque
𝑔
r
0
𝑢 (𝑥) = ± 2 (cos 𝑢(𝑥) − cos 𝑢0 ).
ℓ
Separando le variabili e integrando tra 0 e 𝑥 si ottiene

s ∫
𝑥 𝑥
ℓ 𝑢 0(𝑡) 𝑑𝑡
∫
= 𝑑𝑡 = 𝑥.
𝑔
p
0 ± 2 cos 𝑢(𝑡) − 2 cos 𝑢0 0
Cambiando variabile 𝑢 = 𝑢(𝑥), 𝑑𝑢 = 𝑢 0(𝑥)𝑑𝑥 :

s ∫
𝑢(𝑥)
ℓ 𝑑𝑢
√ = 𝑥. (9.14)
𝑔 0 ± 2 cos 𝑢 − 2 cos 𝑢0
La scelta del segno ± è arbitraria ma visto che 𝑢 è continua anche 𝑢 0 = − sin 𝑢 deve
essere una funzione continua. Dunque il segno ± può cambiare solo quando 𝑢 0 = 0.
Nel punto iniziale 𝑥 = 0 abbiamo imposto 𝑢 0(0) = 0 e dunque l’energia cinetica è nulla.
Visto che l’energia cinetica non può essere negativa significa che l’energia potenziale
non può aumentare e quindi inizialmente l’angolo 𝑢(𝑥) dovrà diminuire (o almeno:
non potrà aumentare). Dunque inizialmente il segno di 𝑢 0 è negativo e rimarrà negativo
finché non si avrà nuovamente 𝑢 0(𝑥) = 0. L’integrale in (9.14) è un integrale improprio
in quanto la funzione integranda presenta un asintoto per 𝑢 → 𝑢0− dobbiamo dunque
assicurarci che l’integrale sia finito. Sviluppando cos 𝑢 nel punto 𝑢 = 𝑢0 si trova
cos 𝑢 = cos 𝑢0 − sin 𝑢0 · (𝑢 − 𝑢0 ) + 𝑜(𝑢 − 𝑢0 ) da cui
1 1 𝐶
√ =p ∼√
2 cos 𝑢 − 2 cos 𝑢0 2 sin 𝑢0 · (𝑢0 − 𝑢) + 𝑜(𝑢 − 𝑢0 ) 𝑢0 − 𝑢
che è notoriamente una funzione integrabile per 𝑢 → 𝑢0− .
Vogliamo ora calcolare il tempo 𝑥 1 in cui il pendolo raggiunge per la prima volta la
verticale, cioè 𝑢(𝑥 1 ) = 0. Ricordiamo che al tempo 𝑥 = 0 il pendolo parte da un
angolo 𝑢0 con velocità nulla. Nell’intervallo 𝑥 ∈ [0 , 𝑥 1 ] si avrà 𝑢 0(𝑥) < 0 (l’angolo
diminuisce) dunque:
s ∫
0
ℓ 𝑑𝑢
− √ = 𝑥1 .
𝑔 𝑢0 2 cos 𝑢 − 2 cos 𝑢0
Una volta raggiunta la verticale, per simmetria il pendolo tornerà a risalire fino ad
un angolo −𝑢0 mettendoci lo stesso tempo 𝑥 1 . Poi tornerà a scendere e risalire fino a
tornare all’angolo 𝑢0 mettendoci in totale un tempo 𝑇 = 4 𝑥 1 che è quindi il periodo di
oscillazione. Si ha dunque
s ∫
𝑢0
𝑇 ℓ 𝑑𝑢
= √ .
4 𝑔 0 2 cos 𝑢 − 2 cos 𝑢0
Purtroppo l’integrale che abbiamo trovato non ha una primitiva esprimibile mediante
funzioni elementari (è un integrale ellittico). Il nostro obiettivo è ora quello di farne
uno sviluppo di Taylor per 𝑢0 → 0 che significa determinare il periodo del pendolo per piccole oscillazioni
piccole oscillazioni.
𝑢
Tramite formule di bisezione possiamo scrivere cos 𝑢 = 1 − 2 sin2 2 da cui
s
sin 𝑢2
2
𝑢0 𝑢
r
p
2 cos 𝑢 − 2 cos 𝑢0 = 4 sin2 − 4 sin2 = 2 sin 𝑢0 1 −
2 2 sin 𝑢20
dunque ponendo
𝑢
sin 2
sin 𝑡 = 𝑢0 (9.15)
sin 2
si ha s
𝑢0 𝑢0
ℓ 𝑇 𝑑𝑢 𝑑𝑢
∫ ∫
· = √ = 𝑢0
𝑔 4 0
𝑢0
2 sin 2 1 − sin2 𝑡 0 2 sin 2 cos 𝑡
ma per il cambio di variabile (9.15) si ha

𝑢
cos 2
cos 𝑡 𝑑𝑡 = 𝑑𝑢
2 sin 𝑢20
ovvero
𝑑𝑢 𝑑𝑡 𝑑𝑡
𝑢0 = =q
2 sin cos 𝑡 cos 𝑢2 𝑢0
2 1 − sin2 𝑡 sin2 2
e quindi
𝜋 𝜋 𝜋
𝑔 𝑇
r
𝑑𝑡 𝑑𝑡 𝑑𝑡
∫ ∫ ∫
2 2 2
· = = = .
ℓ 4 cos 𝑢2
q q
𝑢 𝑢0
0 0 1 − sin2 2
0 1 − sin2 2 sin2 𝑡
Utilizzando ora la serie binomiale (teorema 5.76) possiamo scrivere

𝜋
𝑔 𝑇 +∞ 1
r
−2 𝑢0 𝑘
∫
2 X
· = − sin2 𝑡 sin2 𝑑𝑡.
ℓ 4 0 𝑘=0 𝑘 2
𝜋
+∞
(2 𝑘 − 1)!! 2 𝑢0 𝑘
∫
2 X
= sin 𝑡 sin2 𝑑𝑡.
0 𝑘=0
(2 𝑘)!! 2
in quanto si ha

− 21 · − 32 · · · − 2 𝑘− 1

− 12

2
=
𝑘 𝑘!
(2 𝑘 − 1)!! (2 𝑘 − 1)!!
= (−1) 𝑘 𝑘 = (−1) 𝑘 .
2 · 𝑘! (2 𝑘)!!
Rispetto alla variabile sin2 𝑡 dentro all’integrale abbiamo ora una serie di potenze con
coefficienti
(2 𝑘 − 1)!! 2 𝑢0 𝑘
𝑎𝑘 = sin
(2 𝑘)!! 2
𝑎 𝑘+1
e si verifica facilmente che → sin2 𝑢20 dunque la serie di potenze converge se
𝑎𝑘
sin 𝑡 ≤
2 1
𝑢0 che significa semplicemente sin 𝑢2 < 1. Stiamo quindi facendo un
sin2 2
integrale esteso all’intero raggio di convergenza della serie. Sappiamo che la serie converge
totalmente e quindi uniformemente sugli intervalli chiusi strettamente contenuti nel
raggio di convergenza. Visto che la serie è a termini positivi le somme parziali convergono
alla somma della serie e sono tutte inferiori a tale somma. Abbiamo già visto, inoltre,
che la somma della serie è integrabile con integrale finito. Dunque possiamo applicare il
teorema di convergenza dominata (teorema 7.53 con 𝑓 = 𝑔 ) per scambiare la serie con
l’integrale:
𝜋
𝑔 𝑇 X+∞
r
(2 𝑘 − 1)!! 𝑢0 2 𝑘
∫
2
· = sin (sin 𝑡)2 𝑘 𝑑𝑡
ℓ 4 𝑘=0
(2 𝑘)!! 2 0
l’integrale è ora sostanzialmente lo stesso 𝐼𝑛 che abbiamo calcolato nel teorema 6.87:
𝜋
𝜋
𝐼2 𝑘 𝜋 (2 𝑘 − 1)!!
∫ ∫
2
2𝑘 1
(sin 𝑡) 𝑑𝑡 = (sin 𝑡)2 𝑘 𝑑𝑡 = = ·
0 2 0 2 2 (2 𝑘)!!
9.3 funzioni vettoriali e di più variabili 389
da cui s
+∞ 2
ℓ X (2 𝑘 − 1)!! 𝑢0 2 𝑘

𝑇 = 2𝜋 sin .
𝑔 𝑘=0 (2 𝑘)! 2
Possiamo allora cercare di scrivere i primi termini dello sviluppo di Taylor di 𝑇 = 𝑇(𝑢0 )
per 𝑢0 → 0 diciamo, per esempio, fino all’ordine 8 in 𝑢0 . Basterà considerare la somma
dei termini della serie per 𝑘 = 0 , 1 , 2 , 3 , 4 in quanto la somma dei termini per 𝑘 ≥ 5 mi
darà un contributo dell’ordine di 𝑂 sin 𝑢20
10
= 𝑜(𝑢08 ). Dunque
2 2
𝑔 𝑇
r
𝑢0 𝑢0 2

1 1·3
· =1+ sin2 + sin2
ℓ 2𝜋 2 2 2·4 2
2 2
𝑢0 3 𝑢0 4

1·3·5 1·3·5·7
+ sin 2
+ sin2 + 𝑜(𝑢08 )
2·4·6 2 2·4·6·8 2
!
1 𝑢0 𝑢4 𝑢6 𝑢8
2
=1+ − 4 0 + 5 02 − 8 20
4 4 2 ·3 2 ·3 ·5 2 ·3 ·5·7
!2
32 𝑢 𝑢4 𝑢6
2
+ 6 0 − 4 0 + 5 02
2 4 2 ·3 2 ·3 ·5
!3
52 𝑢 𝑢4 52 · 72 𝑢0
2 8
+ 8 0 − 40 + + 𝑜(𝑢08 )
2 4 2 ·3 214 28
𝑢02 𝑢04 𝑢06 𝑢08
=1+ − + −
24 26 · 3 27 · 32 · 5 210 · 32 · !5 · 7
3 2 𝑢04 𝑢6 𝑢8 𝑢8
+ − 5 0 + 8 0 2 + 6 02
26 24 2 ·3 2 ·3 2 ·3 ·5
!
52 𝑢 𝑢8
6
52 · 72
+ 8 60 − 80 + 22 𝑢08 + 𝑜(𝑢08 )
2 2 2 2
𝑢02 11 173 22931
=1+ + 𝑢4 + 𝑢6 + 𝑢 8 + 𝑜(𝑢08 ).
24 210 · 3 0 214 · 32 · 5 0 222 · 32 · 5 · 7 0
9.3 alcuni risultati preparatori sulle funzioni

vettoriali e di più variabili
Ci sarà utile estendere la definizione delle classi di regolarità 𝐶 𝑘 alle funzioni

vettoriali (cioè con codominio ℝ𝑛 ) e di più variabili (cioè con dominio ℝ𝑚 ).
Se Ω ⊆ ℝ𝑚 è un insieme aperto e 𝑓 : Ω → ℝ è una funzione, vogliamo

definire le derivate parziali di 𝑓 . Se 𝒙 ∈ Ω si ha 𝒙 = (𝑥 1 , . . . , 𝑥 𝑚 ) e quindi
𝑓 (𝒙) = 𝑓 (𝑥1 , . . . , 𝑥 𝑚 ). Se facciamo variare una sola componente 𝑥 𝑗 mantenendo
derivata parziale
fisse tutte le altre componenti, otteniamo una funzione di una variabile 𝑥 𝑗 ↦→
𝑔(𝑥 𝑗 ) = 𝑓 (𝑥 1 , . . . , 𝑥 𝑗 , . . . , 𝑥 𝑚 ). Definiamo dunque la derivata parziale di 𝑓
rispetto alla variabile 𝑥 𝑗 come la derivata della funzione 𝑔(𝑥 𝑗 ). Denotiamo tale
derivata con il simbolo:

𝜕𝑓
.
𝜕𝑥 𝑗
Le derivate parziali si calcolano dunque come le usuali derivate per le funzioni
di una variabile, solamente bisogna considerare costanti tutte le variabili tranne
quella coinvolta nella derivazione. Ad esempio se 𝑓 (𝑥, 𝑣) = − sin(𝑥) − 𝑣 (come
nell’esempio fatto nell’introduzione) si ha
𝜕𝑓
= − cos(𝑥)
𝜕𝑥
𝜕𝑓
= −1 .
𝜕𝑣
Se 𝒇 : Ω ⊆ ℝ𝑚 → ℝ𝑛 è una funzione di più variabili a valori vettoriali potremo

scrivere 𝒇 = ( 𝑓1 , . . . , 𝑓𝑛 ) e considerare le derivate parziali di ogni componente:
𝜕𝒇 𝜕 𝑓1 𝜕 𝑓𝑛

= ,..., .
𝜕𝑥 𝑗 𝜕𝑥 𝑗 𝜕𝑥 𝑗
Definizione 9.11. Sia Ω ⊆ ℝ𝑚 un aperto. Denoteremo con 𝐶 0 (Ω, ℝ𝑛 ) lo spazio

vettoriale di tutte le funzioni continue 𝑓 : Ω → ℝ𝑛 .
Denotiamo con 𝐶 1 (Ω, ℝ𝑛 ) lo spazio vettoriale delle funzioni in 𝐶 0 (Ω, ℝ𝑛 ) tali che
𝜕𝑓
ognuna delle loro derivate parziali 𝜕𝑥 𝑗
esiste in ogni punto di Ω ed è a sua volta una
funzione continua (cioè in 𝑛 𝐶 𝑘 (Ω, ℝ𝑛 ) per
𝐶 (Ω, ℝ )). Ricorsivamente si definisce
0
𝑛
𝑘 > 1, come lo spazio delle funzioni Ω → ℝ tali che tutte le loro derivate parziali
stanno in 𝐶 𝑘−1 (Ω, ℝ𝑛 ).
Quando lo spazio di arrivo non è indicato si sottointende sempre ℝ, quindi 𝐶 𝑘 (Ω) =

𝐶 𝑘 (Ω, ℝ).
Teorema 9.12 (stabilità delle funzioni regolari). Sia Ω ⊆ ℝ𝑛 un aperto. Se

𝑓
𝑓 , 𝑔 ∈ 𝐶 𝑘 (Ω) allora anche 𝑓 + 𝑔 , 𝑓 − 𝑔 , 𝑓 · 𝑔 e 𝑔 (dove è definita) sono di classe 𝐶 𝑘 .
Se 𝑓 ∈ 𝐶 𝑘 (Ω) e 𝑔 ∈ 𝐶 𝑘 (ℝ) allora 𝑔 ◦ 𝑓 ∈ 𝐶 𝑘 (Ω).
Dimostrazione. Il fatto che la composizione di funzioni continue sia una funzione

continua è vero in generale in qualunque spazio metrico. Infatti se 𝑓 : 𝑋 → 𝑌
e 𝑔 : 𝑌 → 𝑍 e se 𝑥 𝑘 → 𝑥 in 𝑋 allora 𝑓 (𝑥 𝑘 ) → 𝑓 (𝑥) in 𝑌 (per la continuità
di 𝑓 ) e quindi 𝑔( 𝑓 (𝑥 𝑘 )) → 𝑔( 𝑓 (𝑥)) in 𝑍 (per la continuità di 𝑔 ). Dunque
(𝑔 ◦ 𝑓 )(𝑥 𝑘 ) → (𝑔 ◦ 𝑓 )(𝑥) e 𝑔 ◦ 𝑓 : 𝑋 → 𝑍 è continua.
Possiamo dunque osservare che le funzioni di due variabili 𝑠(𝑥, 𝑦) = 𝑥 + 𝑦 ,

𝑑(𝑥, 𝑦) = 𝑥 − 𝑦 e 𝑚(𝑥, 𝑦) = 𝑥 𝑦 sono funzioni continue da ℝ2 → ℝ (grazie
al teorema 2.28). Questo garantisce che la somma, la differenza e il prodotto
di funzioni continue siano funzioni continue. Anche il reciproco di funzioni
continue è una funzione continua in quanto la funzione 𝑟(𝑥) = 1/𝑥 è continua.
Ne consegue che il rapporto di funzioni continue è una funzione continua.
Veniamo ora alle derivate parziali. Per le regole di derivazione delle funzioni di
una variabile sappiamo che somma, prodotto, differenza, rapporto (ove definito)
9.4 il problema di Cauchy 391
e composizione di funzioni derivabili sono a loro volta funzioni derivabili e la

derivata si esprime sempre mediante somma, prodotto, differenza e rapporto
delle funzioni coinvolte e delle loro derivate. Dunque quello che si ottiene
combinando tra loro funzioni di classe 𝐶 𝑘 è una funzione continua le cui derivate
parziali esistono e sono di classe 𝐶 𝑘−1 , dunque è una funzione di classe 𝐶 𝑘 .
Definizione 9.13. Sia 𝒇 : [𝑎, 𝑏] → ℝ𝑚 , 𝒇 (𝑥) = ( 𝑓1 (𝑥), . . . , 𝑓𝑚 (𝑥)). Diremo che 𝒇 è

integrabile su [𝑎, 𝑏] se ogni 𝑓 𝑘 : [𝑎, 𝑏] → ℝ è integrabile su [𝑎, 𝑏] e in tal caso porremo:
∫ 𝑏 ∫ 𝑏 ∫ 𝑏
𝒇 (𝑥) 𝑑𝑥 = 𝑓1 (𝑥) 𝑑𝑥, . . . , 𝑓𝑚 (𝑥) 𝑑𝑥 ∈ ℝ𝑚
𝑎 𝑎 𝑎
cosicché per ogni 𝑘 = 1 , . . . , 𝑚 si ha:

∫ 𝑏 ∫ 𝑏
𝒇 (𝑥) 𝑑𝑥 = 𝑓 𝑘 (𝑥) 𝑑𝑥.
𝑎 𝑘 𝑎
∫ 𝑎 ∫𝑏
Come al solito si pone inoltre 𝑏
𝒇 =− 𝑎
𝒇.
Teorema 9.14. Sia 𝒇 : [𝑎, 𝑏] → ℝ𝑚 integrabile. Allora si ha

∫ ∫
𝑏 𝑏
𝒇 (𝑥) 𝑑𝑥 ≤ | 𝒇 (𝑥)| 𝑑𝑥.

𝑎 𝑎
Dimostrazione. Posto ∫ 𝑏
𝒗= 𝒇 (𝑥) 𝑑𝑥
𝑎
si ha, usando la linearità dell’integrale e sfruttando la disuguaglianza di
Cauchy-Schwarz
𝑛 ∫ 𝑏 ∫ 𝑏X
𝑚
|𝒗| 2 = 𝒗 · 𝒗 =
X
𝑣𝑘 𝑓 𝑘 (𝑥) 𝑑𝑥 = 𝑣 𝑘 𝑓 𝑘 (𝑥) 𝑑𝑥
𝑘=1 𝑎 𝑎 𝑘=1
∫ 𝑏 ∫ 𝑏 ∫ 𝑏
= (𝒗, 𝒇 (𝑥)) 𝑑𝑥 ≤ |𝒗| · | 𝒇 (𝑥)| 𝑑𝑥 = |𝒗| | 𝒇 (𝑥)| 𝑑𝑥.
𝑎 𝑎 𝑎
Se |𝒗| ≠ 0 possiamo dividere ambo i membri per |𝒗| e ottenere la disuguaglianza

cercata. Altrimenti se |𝒗| = 0 la disuguaglianza è certamente soddisfatta in
quanto il lato destro non può essere negativo.
9.4 il problema di Cauchy
Il problema di Cauchy per i sistemi del primo ordine consiste nel trovare una
soluzione di un sistema di 𝑛 equazioni differenziali ordinarie del primo ordine
in 𝑛 incognite con un dato iniziale fissato. Cioè dato 𝑥 0 ∈ ℝ, e 𝒚 0 ∈ ℝ𝑛 si cerca
un intervallo 𝐼 ⊆ ℝ con 𝑥 0 ∈ 𝐼 e una funzione 𝒖 : 𝐼 → ℝ𝑛 che sia derivabile e
che soddisfi: (
𝒖 0(𝑥) = 𝒇 (𝑥, 𝒖(𝑥)), ∀𝑥 ∈ 𝐼
(9.16)
𝒖(𝑥0 ) = 𝒚0 .
Definizione 9.15 (Cauchy-Lipschitz). Diremo che una funzione 𝒇 : Ω ⊆ ℝ ×

proprietà di Cauchy-Lipschitz
ℝ𝑛 → ℝ𝑚 soddisfa la proprietà di Cauchy-Lipschitz se 𝑓 è continua e se per ogni
(𝑥0 , 𝒚0 ) ∈ Ω esiste un intorno 𝑈 di (𝑥0 , 𝒚0 ) ed esiste 𝐿 ≥ 0 tale che se (𝑥, 𝒚1 ) ∈ 𝑈 e
(𝑥, 𝒚2 ) ∈ 𝑈 si ha
𝒇 (𝑥, 𝒚 ) − 𝒇 (𝑥, 𝒚 ) ≤ 𝐿𝒚 − 𝒚

1 2 1 2
A parole potremmo dire: 𝒇 (𝑥, 𝒚) è localmente lipschitziana rispetto a 𝒚 uniformemente

rispetto a 𝑥 .
esistenza e unicità locale

per i sistemi del primo ordine Teorema 9.16 (Cauchy-Lipschitz, esistenza e unicità locale). Sia Ω un aperto
di ℝ × ℝ𝑛 e sia 𝒇 : Ω → ℝ𝑛 , una funzione con la proprietà di Cauchy-Lipschitz
(definizione 9.15).
Allora dato (𝑥 0 , 𝒚 0 ) ∈ Ω esiste 𝛿 > 0 tale che preso qualunque intervallo 𝐼 ⊆

[𝑥0 − 𝛿, 𝑥0 + 𝛿] con 𝑥0 ∈ 𝐼 esiste una unica funzione 𝒖 : 𝐼 → ℝ𝑛 tale che (𝑥, 𝒖(𝑥)) ∈ Ω
per ogni 𝑥 ∈ 𝐼 che soddisfa il problema di Cauchy (9.16).
Dimostrazione. L’idea della dimostrazione è che integrando ambo i lati dell’e-

quazione 𝒖 0 = 𝑓 (𝑥, 𝒖) e tenendo conto della condizione iniziale, si ottiene una
equazione del tipo 𝒖 = 𝑇(𝒖) dove 𝑇 è un operatore sullo spazio delle funzioni
continue. Scegliendo 𝛿 abbastanza piccolo si riuscirà a mostrare che le funzioni
definite su un intervallo di raggio 𝛿 intorno a 𝑥 0 risultano essere uno spazio
invariante per 𝑇 e, eventualmente rimpicciolendo ulteriormente 𝛿 si riuscità
poi a dimostrare che 𝑇 è una contrazione e quindi l’esistenza e unicità della
soluzione si ottiene dal teorema 7.37 del punto fisso di Banach-Caccioppoli.
Il primo passo è quello di trasformare il problema differenziale in un problema

integrale. Se 𝒖 è una funzione derivabile soluzione di (9.16) allora è chiaro
che 𝒖 0(𝑥) = 𝒇 (𝑥, 𝒖(𝑥)) è continua in quanto composizione di funzioni continue
e dunque 𝒖 è di classe 𝐶 1 . Possiamo dunque integrare tra 𝑥 0 e 𝑥 i due
lati dell’equazione differenziale, e usare la formula fondamentale del calcolo
integrale (teorema 6.22) per ottenere:
∫ 𝑥
𝒖(𝑥) − 𝒖(𝑥0 ) = 𝒇 (𝑠, 𝒖(𝑠)) 𝑑𝑠.
𝑥0
Dunque se 𝒖 risolve il problema di Cauchy allora 𝒖 soddisfa anche la seguente

equazione integrale:
∫ 𝑥
𝒖(𝑥) = 𝒚0 + 𝒇 (𝑠, 𝒖(𝑠)) 𝑑𝑠. (9.17)
𝑥0
Viceversa se 𝒖 è continua e soddisfa (9.17) allora si ha ovviamente 𝒖(𝑥 0 ) = 𝒚 0 e,

passando alle derivate (sempre grazie al teorema di Torricelli-Barrow 6.22), si
scopre che 𝒖 è derivabile e soddisfa l’equazione differenziale 𝒖 0(𝑥) = 𝒇 (𝑥, 𝒖(𝑥)).
Dunque trovare una soluzione 𝐶 1 del problema di Cauchy (9.16) è equivalente a
trovare una soluzione 𝐶 0 del problema integrale (9.17). Ci dedicheremo dunque
a questo secondo problema.
Fissato (𝑥 0 , 𝒚 0 ) ∈ Ω denotiamo con
𝐶 𝛼,𝛽 = (𝑥, 𝒚) ∈ ℝ × ℝ𝑛 : |𝑥 − 𝑥0 | ≤ 𝛼, 𝒚 − 𝒚0 ≤ 𝛽

il cilindro centrato in (𝑥 0 , 𝒚 0 ) con asse parallelo all’asse delle 𝑥 , di altezza 2 𝛼 e

raggio 𝛽 . Consideriamo un intorno 𝑈 di (𝑥 0 , 𝒚 0 ) in cui, grazie alle ipotesi, la
funzione 𝒇 sia 𝐿-lipschitziana uniformemente rispetto ad 𝑥 . L’intorno 𝑈 conterrà
certamente un cilindro 𝐶 𝛼,𝛽 per un qualche 𝛼 > 0 e 𝛽 > 0 sufficientemente
piccoli. Il cilindro 𝐶 𝛼,𝛽 è chiuso e limitato in Ω e dunque la funzione 𝒇 , essendo
continua, è limitata su 𝐶 𝛼,𝛽 per il teorema di Weierstrass. Sia 𝑀 > 0 tale che
| 𝒇 (𝑥, 𝒚)| ≤ 𝑀 per ogni (𝑥, 𝒚) ∈ 𝐶 𝛼,𝛽 e definiamo
𝛽 1

𝛿 = min 𝛼, , . (9.18)
𝑀 2𝐿
Il perché 𝛿 venga definito in questo modo si capirà nel prosieguo della dimostra-
zione. Consideriamo un qualunque intervallo 𝐼 ⊆ [𝑥 0 − 𝛿, 𝑥 0 + 𝛿] e definitamo
lo spazio di funzioni
𝑋 = {𝒖 ∈ 𝐶 0 (𝐼, ℝ𝑛 ) : 𝒖 − 𝒚0 ∞ ≤ 𝛽}.

Sappiamo che 𝐶 0 (𝐼, ℝ𝑛 ) è uno spazio metrico completo e 𝑋 è chiuso quindi an-
ch’esso è completo. Possiamo allora considerare l’operatore 𝑇 : 𝑋 → 𝐶 0 (𝐼, ℝ𝑛 )
definito da: ∫ 𝑥
𝑇(𝒖)(𝑥) = 𝒚0 + 𝒇 (𝑠, 𝒖(𝑠)) 𝑑𝑠.
𝑥0
Vogliamo innanzitutto verificare che 𝑋 è invariante, cioè che 𝑇(𝑋) ⊆ 𝑋 . Se

𝒖 ∈ 𝑋 e se 𝑥 ∈ 𝐼 si ha (𝑥, 𝒖(𝑥)) ∈ 𝐶 𝛿,𝛽 ⊆ 𝐶 𝛼,𝛽 e dunque (usando anche (9.18) e
il teorema 9.14)
𝑥 𝑥
∫ ∫
𝒇 (𝑠, 𝒖(𝑠)) 𝑑𝑠 ≤ 𝑀 𝑑𝑠 = |𝑥 − 𝑥 0 |𝑀 ≤ 𝛿𝑀 ≤ 𝛽.

𝑻 (𝑢)(𝑥) − 𝒚 =
0
𝑥0 𝑥0

Dunque 𝑇(𝒖) − 𝒚 0 ≤ 𝛽 e 𝑇(𝒖) ∈ 𝑋 . Abbiamo dunque che 𝑇 : 𝑋 → 𝑋 .

Verifichiamo ora che 𝑇 è una contrazione. Si ha:

∫ 𝑥
|𝑇(𝒖 1 )(𝑥) − 𝑇(𝒖 2 )(𝑥)| ≤ | 𝒇 (𝑠, 𝒖 1 (𝑠)) − 𝒇 (𝑠, 𝒖 2 (𝑠))| 𝑑𝑠

∫𝑥0𝑥
𝐿|𝒖 1 (𝑠) − 𝒖 2 (𝑠)| 𝑑𝑠

≤
𝑥0
≤ 𝐿|𝑥 − 𝑥0 |k𝒖 1 − 𝒖 2 k ∞ ≤ 𝐿𝛿k𝒖 1 − 𝒖 2 k ∞
ovvero, facendo l’estremo superiore al variare di 𝑥 ∈ 𝐼 :
1
k𝑇(𝒖 1 ) − 𝑇(𝒖 2 )k ∞ ≤ 𝐿𝛿k𝒖 1 − 𝒖 2 k ∞ ≤ k𝒖 1 − 𝒖 2 k.
2
Dunque 𝑇 : 𝑋 → 𝑋 è una contrazione su uno spazio metrico completo. Per
il teorema di punto fisso di Banach-Caccioppoli 7.37 sappiamo quindi che
esiste una unica funzione 𝒖 ∈ 𝑋 ovvero 𝒖 : 𝐼 → ℝ𝑛 che soddisfa 𝑇(𝒖) = 𝒖
ovvero (9.17) ovvero (9.16).
La condizione di Cauchy-Lipschitz può sembrare piuttosto complicata da

verificare. Una condizione molto più semplice è che la funzione 𝒇 sia di classe
𝐶 1 . La seguente proposizione ci dice che tale condizione è sufficiente per

applicare il teorema di Cauchy-Lipschitz.
Proposizione 9.17. Sia Ω ⊆ ℝ × ℝ𝑛 un insieme aperto. Se 𝒇 ∈ 𝐶 1 (Ω, ℝ𝑚 ) allora

𝑓 soddisfa la condizione di Cauchy-Lipschitz 9.15.
Un cubo di lato 2𝐿 centrato nel punto

𝒑 = (𝑝1 , . . . , 𝑝 𝑛 ) in ℝ𝑛 di ℝ𝑛 è l’insieme Dimostrazione. Se prendiamo un qualunque cubo chiuso 𝐾 ⊆ Ω ⊆ ℝ × ℝ𝑛
dato dal prodotto cartesiano 𝐾 = [𝑝 1 − centrato in (𝑥 0 , 𝒚 0 ), posto 𝒇 = ( 𝑓1 , . . . , 𝑓𝑚 ) sappiamo che ogni derivata parziale
𝐿, 𝑝1 + 𝐾] × · · · × [𝑝 𝑛 − 𝐿, 𝑝 𝑛 + 𝐿]
𝜕 𝑓 𝑘 /𝜕𝑦 𝑗 è continua ed è quindi
limitata (per il teorema di Weierstrass) su 𝐾 . Sia
𝐿 𝑘,𝑗 il massimo di 𝜕 𝑓 𝑘 /𝜕𝑦 𝑗 su 𝐾 e sia 𝐿 il massimo degli 𝐿 𝑘,𝑗 per 𝑘 = 1 , . . . 𝑚
e 𝑗 = 1 . . . , 𝑛 . Allora presi 𝒚, 𝒛 ∈ ℝ𝑛 con (𝑥, 𝒚), (𝑥, 𝒛) ∈ 𝐾 si può scomporre
l’incremento vettoriale 𝒛 − 𝒚 lungo le 𝑛 direzioni coordinate e applicare il
teorema di Lagrange lungo ogni direzione. Per ogni 𝑘 = 1 , . . . , 𝑚 si ha quindi:
| 𝑓 𝑘 (𝑥, 𝒛) − 𝑓 𝑘 (𝑥, 𝒚)|

𝑛
X
𝑓 𝑘 (𝑥, 𝑧1 , . . . , 𝑧 𝑗 , 𝑦 𝑗+1 , . . . , 𝑦𝑛 ) − 𝑓 𝑘 (𝑥, 𝑧1 , . . . , 𝑧 𝑗−1 , 𝑦 𝑗 , . . . , 𝑦𝑛 )

≤
𝑗=1
𝑛
X 𝑛
X
𝐿 𝑗 𝑧 𝑗 − 𝑦 𝑗 ≤ 𝐿 𝑗 |𝑧 − 𝑦| ≤ 𝑛𝐿|𝑧 − 𝑦|

≤
𝑗=1 𝑗=1
da cui
s
𝑚
| 𝑓 𝑘 (𝑥, 𝒛) − 𝑓 𝑘 (𝑥, 𝒚)| 2
X
| 𝒇 (𝑥, 𝒛) − 𝒇 (𝑥, 𝒚)| =
𝑘=1
s
𝑚
𝑛 2 𝐿2 |𝑧 − 𝑦| 2
X
≤
𝑘=1
√
≤ 𝑛 𝑚𝐿|𝑧 − 𝑦|.
Abbiamo quindi mostrato che per ogni (𝑥 0 , 𝒚 0 ) ∈ Ω esiste un intorno del punto
(𝑥0 , 𝒚0 ) in cui la funzione 𝒇 soddisfa la condizione di Cauchy-Lipschitz.
Il teorema di Cauchy-Lipschitz garantisce l’esistenza di una soluzione definita in

un piccolo intervallo [𝑥 0 − 𝛿 0 , 𝑥 0 + 𝛿 0 ] intorno al punto iniziale 𝑥 0 . Se scegliamo
𝑥1 = 𝑥 0 + 𝛿 0 possiamo applicare nuovamente lo stesso teorema per trovare una
soluzione definita nell’intervallo [𝑥 1 − 𝛿 1 , 𝑥 1 + 𝛿 1 ] che coincida con la precedente
soluzione nel punto 𝑥 1 . Le due soluzioni coincidono sull’intersezione dei due
intervalli (grazie all’unicità della soluzione su ogni sotto-intervallo) e quindi
possono essere incollate per ottenere una soluzione definita sull’unione dei
due intervalli. Questo procedimento può essere ripetuto infinite volte ma gli
intervalli potrebbero diventare sempre più piccoli, quindi non c’è garanzia di
ottenere una soluzione definita su intervalli arbitrariamente grandi. Nel seguito
cercheremo di capire quanto grande può essere l’intervallo massimale su cui si
riesce ad estendere la soluzione.
Definizione 9.18 (soluzione/intervallo massimale). Sia 𝐼 ⊆ ℝ un intervallo non

vuoto e sia 𝒖 : 𝐼 → ℝ𝑛 una soluzione di una equazione differenziale.
Se 𝐽 ⊇ 𝐼 , 𝐽 ≠ 𝐼 è un intervallo, se 𝒗 : 𝐽 → ℝ𝑛 risolve la stessa equazione differenziale e

se 𝒗(𝑥) = 𝒖(𝑥) per ogni 𝑥 ∈ 𝐼 , diremo che 𝒗 è una estensione della soluzione 𝑢(𝑥). estensione della soluzione
Se la soluzione 𝒖 non ammette estensioni, diremo che 𝒖 è una soluzione definita su un

intervallo massimale o, più semplicemente, diremo che 𝒖 è una soluzione massimale. soluzione massimale
Proposizione 9.19 (caratterizzazione delle soluzioni massimali). Supponiamo

che 𝒇 : Ω ⊆ ℝ × ℝ𝑛 → ℝ𝑛 soddisfi la condizione di Cauchy-Lipschitz 9.15. Allora
una soluzione 𝒖 dell’equazione
𝒖 0(𝑥) = 𝒇 (𝑥, 𝒖(𝑥)) (9.19)
è definita su un intervallo massimale 𝐼 se e solo se 𝐼 è aperto e per ogni 𝐾 compatto

𝐾 ⊆ Ω e per ogni 𝑥0 ∈ 𝐼 esistono 𝑥1 , 𝑥2 ∈ 𝐼 , 𝑥1 < 𝑥 0 < 𝑥2 tali che 𝒖(𝑥1 ) ∉ 𝐾 e
𝒖(𝑥2 ) ∉ 𝐾 . Significa cioè che il grafico di 𝒖 cioè la curva (𝑥, 𝒖(𝑥)) esce da qualunque
compatto 𝐾 ⊆ Ω sia facendo crescere 𝑥 verso destra che facendo calare 𝑥 verso sinistra.
Intuitivamente il grafico della soluzione massimale tende ad arrivare ai limiti di Ω.
Dimostrazione. Prima implicazione. Supponiamo che 𝒖 : 𝐼 → ℝ𝑛 sia una soluzio-

ne di (9.19) definita su un intervallo massimale 𝐼 . Dovrà essere (𝑥, 𝒖(𝑥)) ∈ Ω
per ogni 𝑥 ∈ 𝐼 .
Mostriamo innanzitutto che 𝐼 è un intervallo aperto a destra: se non lo fosse si

avrebbe che 𝑥 0 = sup 𝐼 ∈ 𝐼 . Allora (𝑥 0 , 𝒖(𝑥 0 )) ∈ Ω e per il teorema di esistenza
e unicità locale potremmo trovare un intorno 𝐽 di 𝑥 0 e una funzione 𝒗 : 𝐽 → ℝ𝑛
che risolve (9.19) con 𝒗(𝑥 0 ) = 𝒖(𝑥 0 ). Per l’unicità delle soluzioni 𝒖 e 𝒗 devono
coincidere su 𝐼 ∩ 𝐽 e dunque facendo l’unione dei due grafici ottengo una
estensione di 𝒖 a tutto l’intervallo 𝐼 ∪ 𝐽 che è strettamente più grande di 𝐼 .
Dunque 𝒖 non poteva essere una soluzione massimale.
Mostriamo ora che la curva (𝑥, 𝒖(𝑥)) esce da ogni compatto 𝐾 ⊆ Ω sia da destra
che da sinistra. Supponiamo per assurdo che esista un compatto 𝐾 tale che
(𝑥, 𝒖(𝑥)) ∈ 𝐾 per ogni 𝑥 ∈ 𝐼 . Il grafico (𝑥, 𝒖(𝑥)) è limitato per 𝑥 ∈ 𝐼 dunque
certamente 𝐼 deve essere limitato. Inoltre abbiamo visto che 𝐼 è aperto e quindi
𝐼 = (𝑎, 𝑏) con 𝑎, 𝑏 ∈ ℝ, 𝑎 < 𝑏 .
Allora per ogni 𝑥 ∈ 𝐼 = (𝑎, 𝑏) si ha
|𝒖 0(𝑥)| = | 𝒇 (𝑥, 𝒖(𝑥))| ≤ sup | 𝒇 |.

𝐾
Visto che 𝒇 è continua (in quanto soddisfa le ipotesi del teorema di esistenza
e unicità) la funzione | 𝒇 | ha massimo su 𝐾 per il teorema di Weierstrass e
quindi esiste 𝑀 ≥ 0 tale che |𝒖 0(𝑥)| ≤ 𝑀 per ogni 𝑥 ∈ (𝑎, 𝑏). Significa che
ogni componente di 𝒖 è 𝑀 -lipschitziana, in particolare ogni componente è
uniformemente continua (teorema 7.36). Dunque la funzione 𝒖 può essere
estesa con continuità (teorema 7.34) ad una funzione 𝒗 : [𝑎, 𝑏] → ℝ𝑛 definita
anche agli estremi dell’intervallo. Visto che (𝑥, 𝒖(𝑥)) ∈ 𝐾 per ogni 𝑥 ∈ (𝑎, 𝑏)
e visto che 𝒗(𝑏) = lim𝑥→𝑏 − 𝒖(𝑥) essendo 𝐾 chiuso possiamo affermare che
(𝑏, 𝒗(𝑏)) ∈ 𝐾 . Lo stesso vale per 𝑥 → 𝑎 + dunque (𝑎, 𝒗(𝑎)) ∈ 𝐾 e dunque
(𝑥, 𝒗(𝑥)) ∈ 𝐾 ⊆ Ω per ogni 𝑥 ∈ [𝑎, 𝑏]. Vogliamo ora verificare che 𝒗 è soluzione
dell’equazione differenziale (9.19). Chiaramente 𝒗 soddisfa l’equazione per
ogni 𝑥 ∈ (𝑎, 𝑏) in quanto su (𝑎, 𝑏) coincide con 𝒖 che è soluzione. Consideriamo

l’estremo 𝑏 . Visto che 𝒗 è continua in 𝑏 e 𝒇 è continua in (𝑏, 𝒗(𝑏)) si ha
lim 𝒗 0(𝑥) = lim 𝒇 (𝑥, 𝒗(𝑥)) = 𝒇 (𝑏, 𝒗(𝑏)) ∈ ℝ𝑛

𝑥→𝑏 − 𝑥→𝑏 −
Sappiamo però che se il limite della derivata di una funzione continua esiste ed
è finito, allora la funzione è derivabile nel punto limite e la derivata è continua
in quel punto (proposizione 5.26). Dunque 𝒗 è derivabile in 𝑏 e anche in quel
punto soddisfa l’equazione differenziale. Lo stesso vale nel punto 𝑎 . Dunque
siamo riusciti a trovare una estensione 𝒗 di 𝒖 contraddicendo l’ipotesi che 𝒖
fosse una soluzione massimale.
Seconda implicazione. Supponiamo ora 𝒖 : 𝐼 → ℝ𝑛 sia una soluzione dell’equa-

zione differenziale (9.19) definita su un intervallo 𝐼 e tale che la curva (𝑥, 𝒖(𝑥))
esca da ogni compatto 𝐾 al variare di 𝑥 ∈ 𝐼 . Vogliamo dimostrare che 𝒖 è
soluzione massimale. Innanzitutto 𝐼 non può essere compatto, altrimenti anche
𝐾 = {(𝑥, 𝒖(𝑥)) : 𝑥 ∈ 𝐼} sarebbe un compatto di Ω e ovviamente la curva non
esce da 𝐾 . Sia 𝑎 = inf 𝐼 e 𝑏 = sup 𝐼 . Siccome 𝐼 non è chiuso esso non contiene
uno dei due estremi: supponiamo sia 𝑏 . Allora se 𝒖 fosse estendibile a destra
esisterebbe una estensione continua 𝒗 : (𝑎, 𝑏] → ℝ𝑛 che coincide con 𝒖 su
(𝑎, 𝑏) e che è continua nel punto 𝑥 = 𝑏 e che soddisfa l’equazione differenziale
quindi, in particolare, (𝑏, 𝒗(𝑏)) ∈ Ω. Ma allora scelto 𝑥 0 ∈ (𝑎, 𝑏) prendiamo
𝐾 = {(𝑥, 𝒗(𝑥)) : 𝑥 ∈ [𝑥0 , 𝑏]}. Visto che 𝒗 : [𝑥0 , 𝑏] → ℝ𝑛 è continua è facile
verificare che 𝐾 è chiuso è limitato, 𝐾 ⊆ Ω. Ma ovviamente (𝑥, 𝒗(𝑥)) ∈ 𝐾 per
ogni 𝑥 ≥ 𝑥 0 , contro le ipotesi.
Proposizione 9.20 (separazione delle soluzioni). Se 𝒇 : Ω ⊆ ℝ × ℝ𝑛 → ℝ𝑛

soddisfa la condizione di Cauchy-Lipschitz e se 𝒖 : 𝐼 → ℝ𝑛 e 𝒗 : 𝐽 → ℝ𝑛 sono due
soluzioni dell’equazione differenziale 𝒖 0(𝑥) = 𝒇 (𝑥, 𝒖(𝑥)) definite su due intervalli
𝐼, 𝐽 ⊆ ℝ e se esiste 𝑥0 ∈ 𝐼 ∩ 𝐽 tale che 𝒖(𝑥0 ) = 𝒗(𝑥0 ) allora 𝒖(𝑥) = 𝒗(𝑥) per ogni
𝑥 ∈ 𝐼 ∩ 𝐽 . Detto in altri termini: nelle ipotesi del teorema di esistenza e unicità i grafici
di due soluzioni diverse definite in un intervallo non possono toccarsi.
Dimostrazione. Sia 𝑥 0 ∈ 𝐼 ∩ 𝐽 un punto in cui 𝒖(𝑥 0 ) = 𝒗(𝑥 0 ) e supponiamo per

assurdo che esista 𝑥 2 ∈ 𝐼 ∩ 𝐽 tale che 𝒖(𝑥 2 ) ≠ 𝒗(𝑥 2 ). In tal caso possiamo
considerare il punto
𝑥1 = sup {𝑥 ∈ [𝑥0 , 𝑥2 ] : 𝒖(𝑥) = 𝒗(𝑥)}.
Su tutto l’intervallo [𝑥 0 , 𝑥 1 ) si ha quindi 𝒖(𝑥) = 𝒗(𝑥) e per continuità dovrà

dunque anche essere 𝒖(𝑥 1 ) = 𝒗(𝑥 1 ). In pratica 𝑥 1 è l’ultimo punto di contatto
tra le due soluzioni. Ponendo allora il punto (𝑥 1 , 𝒖(𝑥 1 )) come dato iniziale del
problema di Cauchy scopriamo che 𝒖 e 𝒗 sono localmente due soluzioni di
tale problema. Per l’unicità locale le due soluzioni devono coincidere in un
piccolo intorno del punto 𝑥 1 , diciamo in particolare che devono coincidere su
[𝑥1 , 𝑥1 + 𝜀] ma questo è in contraddizione con la definizione di 𝑥 1 .
Teorema 9.21 (esistenza di soluzioni massimali). Sia 𝒖 : 𝐼 → ℝ𝑛 una soluzione

dell’equazione differenziale (9.19) definita su un intervallo non vuoto 𝐼 ⊆ ℝ e suppo-
niamo che tale equazioni soddisfi il teorema di esistenza e unicità locale (questo succede
ad esempio se 𝑓 ∈ 𝐶 1 ). Se 𝒖 non è essa stessa una soluzione massimale, esiste sempre

una estensione massimale 𝒗 : 𝐽 → ℝ𝑛 , 𝐽 ⊇ 𝐼 .
Dimostrazione. Supponiamo che 𝒖 non sia massimale, dunque 𝒖 ammette

estensioni. In particolare ammette estensioni definite su intervalli aperti, in
quanto se una soluzione è definita su un intervallo che non è aperto posso
sempre estenderla in un intorno aperto dei punti di frontiera dell’intervallo
mediante il teorema di esistenza locale ottenendo quindi una estensione definita
su un intervallo aperto.
Sia F l’insieme di tutte le estensioni di 𝒖 definite su intervalli aperti. Più

precisamente ogni 𝒘 ∈ F è una funzione 𝒘 : 𝐽𝒘 → ℝ𝑛 definita su un intervallo
aperto 𝐽𝒘 ⊇ 𝐼 che soddisfa l’equazione differenziale (9.19) e che coincide con 𝒖
su 𝐼 . Definiamo 𝒗 : 𝐽 → ℝ𝑛 come segue:
[
𝐽= 𝐽𝒘
𝒘∈F
𝒗(𝑥) = 𝒘(𝑥) se 𝑥 ∈ 𝐽𝒘 .
Si osservi che dato 𝑥 ∈ 𝐼 se 𝒘 1 , 𝒘 2 ∈ F sono due estensioni entrambe definite

su un punto 𝑥 , allora esse coincidono in 𝑥 per la Proposizione 9.20, dunque
𝒗(𝑥) è univocamente definita.
Essendo ogni 𝐽𝒘 aperto è chiaro che 𝐽 è aperto. E’ anche facile convincersi che
𝐽 deve essere un intervallo, in quanto tutti i 𝐽𝒘 hanno in comune i punti di 𝐼 .
Verifichiamo ora che 𝒗 soddisfa l’equazione differenziale. Preso un punto 𝑥 ∈ 𝐽
deve esistere 𝒘 tale che 𝑥 ∈ 𝐽𝒘 . Sappiamo che 𝒘 0(𝑥) = 𝑓 (𝑥, 𝒘(𝑥)) e visto che 𝒖
coincide con 𝒘 su 𝐽𝒘 possiamo dedurre che anche le derivate, in 𝑥 , coincidono:
𝒖 0(𝑥) = 𝒘 0(𝑥) = 𝑓 (𝑥, 𝒘(𝑥)) = 𝑓 (𝑥, 𝒖(𝑥)).
Dunque anche 𝒖 è soluzione di (9.19). In pratica abbiamo verificato che 𝒗 ∈ F

ed è quindi una estensione di 𝒖 . Vogliamo ora dimostrare che è una estensione
massimale. Supponiamo per assurdo che esista 𝒘 estensione di 𝒗 definita su
un intervallo 𝐽𝒘 ⊇ 𝐽 , 𝐽𝒘 ≠ 𝐽 . Posso supporre che 𝐽𝒘 sia aperto, perché in caso
contrario potrei estendere la soluzione 𝒘 in un intorno aperto dei punti di
frontiera dell’intervallo, mediante il teorema di esistenza locale, ottenendo una
estensione definita su un intervallo più grande ed aperto. Dunque 𝒘 ∈ F ma
allora, per definizione di 𝐽 , dovrà essere 𝐽 ⊇ 𝐽𝒘 : assurdo.
Teorema 9.22 (esistenza globale). Sia 𝐼 = (𝑎, 𝑏) ⊆ ℝ un intervallo aperto, Ω =

𝐼 × ℝ𝑛 e sia 𝒇 : Ω → ℝ𝑛 , 𝒇 = 𝒇 (𝑥, 𝒚) una funzione che soddisfa la proprietà di
Cauchy-Lipschitz e che sia sublineare in 𝒚 uniformemente rispetto a 𝑥 , cioè esistono
𝑚, 𝑞 ∈ ℝ tali che:
| 𝒇 (𝑥, 𝒚)| ≤ 𝑚|𝒚| + 𝑞, ∀(𝑥, 𝒚) ∈ Ω.
Allora per ogni 𝑥 0 ∈ 𝐼 e per ogni 𝒚 0 ∈ ℝ𝑛 esiste una funzione 𝒖 : 𝐼 → ℝ𝑛 (definita su

tutto 𝐼 ) soluzione del problema di Cauchy (9.16).
La dimostrazione richiede un lemma preliminare.

Lemma 9.23 (Gronwall). Siano 𝑎, 𝑏 ∈ ℝ con 𝑎 < 𝑏 e siano 𝑚, 𝑞 ≥ 0. Sia

𝒖 : [𝑎, 𝑏) → ℝ𝑛 una funzione di classe 𝐶 1 tale che
|𝒖 0(𝑡)| ≤ 𝑚|𝒖(𝑡)| + 𝑞 ∀𝑡 ∈ [𝑎, 𝑏).
Allora 𝒖 è limitata.
Dimostrazione. Ricordando che
(|𝒖| 2 )0 = (𝒖 · 𝒖)0 = 2𝒖 · 𝒖 0
per ogni 𝑥 ∈ [𝑎, 𝑏) possiamo fare la seguente stima:

i𝑥 𝑥 𝑥
2𝒖(𝑡) · 𝒖 0(𝑡)
h ∫ 0 ∫
ln(1 + |𝒖(𝑡)| 2 ) = ln(1 + |𝒖(𝑡)| 2 ) 𝑑𝑡 = 𝑑𝑡
𝑎 𝑎 𝑎 1 + |𝒖(𝑡)| 2
𝑥 𝑥
|𝒖(𝑡)||𝒖 0(𝑡)| |𝒖(𝑡)|(𝑚|𝒖(𝑡)| + 𝑞)
∫ ∫
≤2 𝑑𝑡 ≤ 2 𝑑𝑡
𝑎 1 + |𝒖(𝑡)| 2 𝑎 1 + |𝒖(𝑡)| 2
𝑥
𝑞|𝒖(𝑡)|
∫
≤2 𝑚+ 𝑑𝑡
𝑎 1 + |𝒖(𝑡)| 2
≤ (𝑥 − 𝑎)(2𝑚 + 𝑞) ≤ (𝑏 − 𝑎)(2𝑚 + 𝑞)
avendo anche sfruttato la disuguaglianza 𝑠/(1 + 𝑠 2 ) ≤ 1/2 con 𝑠 = |𝒖(𝑡)| .

Dunque
ln(1 + |𝒖(𝑥)| 2 ) ≤ ln(1 + |𝒖(𝑎)| 2 ) + (𝑏 − 𝑎)(2𝑚 + 𝑞)
è una funzione limitata e di conseguenza anche |𝒖(𝑥)| è limitata.
Dimostrazione teorema 9.22. Sia 𝒖 una soluzione massimale del problema di

Cauchy e sia 𝐽 ⊆ 𝐼 l’intervallo massimale su cui 𝒖 è definita. Sia 𝑏 = sup 𝐽 .
Sappiamo quindi che 𝒖 è definita su [𝑥 0 , 𝑏) e quindi per il lemma precedente
deve essere limitata: esiste cioè 𝑀 > 0 per cui |𝒖(𝑥)| ≤ 𝑀 per ogni 𝑥 ∈ [𝑥 0 , 𝑏).
Se consideriamo il compatto
𝐾 = [𝑎, 𝑏] × 𝐵 𝑀 (0) = {(𝑥, 𝑦) ∈ ℝ × ℝ𝑛 : 𝑥 ∈ [𝑎, 𝑏], |𝑦| ≤ 𝑀}
abbiamo quindi verificato che (𝑥, 𝒖(𝑥)) ∈ 𝐾 per ogni 𝑥 ∈ [𝑎, 𝑏). Se fosse
𝑏 ∈ 𝐼 si avrebbe 𝐾 ⊆ Ω e quindi questo sarebbe in contraddizione con la
proposizione 9.19 che ci dice che ogni soluzione massimale esce da qualunque
compatto contenuto in Ω. Significa allora che 𝑏 ∉ 𝐼 e cioè che 𝑏 = sup 𝐽 = sup 𝐼
(non può essere sup 𝐽 > sup 𝐼 in quanto 𝐽 ⊆ 𝐼 ).
In maniera analoga (o per simmetria) si può dimostrare che inf 𝐽 = inf 𝐼 e

dunque 𝐽 = 𝐼 come volevamo dimostrare
9.5 il problema di Cauchy per equazioni di ordine 𝑛
Il problema di Cauchy per le equazioni di ordine 𝑛 è il problema di determinare

la soluzione di una equazione differenziale ordinaria di ordine 𝑛 in forma
normale accoppiato ad una condizione iniziale per il valore della funzione e
9.5 il problema di Cauchy per equazioni di ordine 𝑛 399
di tutte le sue derivate fino all’ordine 𝑛 . Dato Ω ⊆ ℝ × ℝ𝑛 aperto, 𝑓 ∈ 𝐶 0 (Ω),

𝒚 = (𝑦1 , . . . , 𝑦𝑛 ) ∈ ℝ𝑛 si tratta quindi di trovare un intervallo 𝐼 ⊆ ℝ e una
funzione 𝑢 ∈ 𝐶 𝑛 (𝐼) che soddisfi le seguenti condizioni:
𝑢 (𝑛) (𝑥) = 𝑓 (𝑥, 𝑢(𝑥), 𝑢 0(𝑥), . . . , 𝑢 (𝑛−1) (𝑥))





𝑢(𝑥0 ) = 𝑦1





𝑢 0(𝑥0 ) = 𝑦2


(9.20)
 ..
.





 𝑢 (𝑛−1) (𝑥0 ) = 𝑦𝑛 .



esistenza e unicità locale
Teorema 9.24 (esistenza e unicità per le equazioni di ordine 𝑛 ). Sia 𝑓 : Ω → ℝ

una funzione che soddisfa la condizione di Cauchy-Lipschitz. Allora il problema di
Cauchy (9.20) ammette una unica soluzione locale. Esiste cioè un 𝛿 > 0 tale che per
ogni intervallo 𝐼 ⊆ [𝑥 0 − 𝛿, 𝑥 0 + 𝛿] esiste una unica 𝑢 ∈ 𝐶 𝑛 (𝐼) che soddisfa (9.20). esistenza e unicità globale
Se poi Ω è della forma Ω = 𝐼 × ℝ𝑛 con 𝐼 ⊆ ℝ intervallo aperto e se 𝑓 è anche sublineare

(come nelle ipotesi di esistenza globale) allora il problema di Cauchy (9.20) ammette
una unica soluzione definita su tutto 𝐼 .
Dimostrazione. Se 𝑢 ∈ 𝐶 𝑛 è una funzione scalare possiamo considerare la

funzione vettoriale 𝒖 ∈ 𝐶 1 le cui componenti sono 𝑢 e le sue prime 𝑛 − 1
derivate:
𝒖(𝑥) = (𝑢(𝑥), 𝑢 0(𝑥), . . . , 𝑢 (𝑛−1) (𝑥))
ovvero 𝑢 𝑘 (𝑥) = 𝑢 (𝑘−1) (𝑥) per 𝑘 = 1 , . . . , 𝑛 essendo 𝒖(𝑥) = (𝑢1 (𝑥), . . . , 𝑢𝑛 (𝑥)).
Con questa trasformazione il problema (9.20) si può scrivere nella forma:


 𝑢10 (𝑥) = 𝑢2

𝑢20 (𝑥) = 𝑢3



..



.





𝑢 0
(𝑥) = 𝑢𝑛


 𝑛−1



𝑢 0 (𝑥) = 𝑓 (𝑥, 𝑢1 (𝑥), 𝑢2 (𝑥), . . . , 𝑢𝑛 (𝑥))
𝑛





𝑢1 (𝑥0 ) = 𝑦1




..



.





 𝑢𝑛 (𝑥0 ) = 𝑦𝑛


ovvero posto 𝒇 (𝑥, 𝒚) = (𝑦2 , 𝑦3 , . . . , 𝑦𝑛 , 𝑓 (𝑥, 𝒚)) abbiamo una funzione vettoriale
𝒇 : Ω → ℝ𝑛 e il problema (9.20) risulta equivalente a
(
𝒖 0(𝑥) = 𝒇 (𝑥, 𝒖(𝑥))
(9.21)
𝒖(𝑥0 ) = 𝒚.
Visto che 𝑓 è continua, anche 𝒇 risulta continua. Verifichiamo se 𝒇 soddisfa la

condizione di Lipschitz. Per ipotesi 𝑓 la soddisfa, cioè esiste 𝐿 > 0 tale che:
| 𝑓 (𝑥, 𝒚) − 𝑓 (𝑥, 𝒛)| ≤ 𝐿|𝒚 − 𝒛|.
Ma allora si ha
s
𝑛
|𝑦 𝑘 − 𝑧 𝑘 | 2 + | 𝑓 (𝑥, 𝒚) − 𝑓 (𝑥, 𝒛)| 2
X
| 𝒇 (𝑥, 𝒚) − 𝒇 (𝑥, 𝒛)| =
𝑘=2
q √
≤ |𝒚 − 𝒛| 2 + 𝐿2 |𝒚 − 𝒛| 2 = 1 + 𝐿2 · |𝒚 − 𝒛|.
Dunque la funzione 𝒇 verifica le ipotesi del teorema di Cauchy-Lipschitz: esiste

dunque una soluzione 𝒖 di tale problema in un opportuno intervallo centrato
nel punto 𝑥 0 . Ponendo 𝑢 = 𝑢1 (la prima componente di 𝒖 ) si osserva che
𝑢 è di classe 𝐶 𝑛 . Infatti sappiamo che 𝒖 è di classe 𝐶 1 ed essendo 𝑢10 = 𝑢2 ,
𝑢20 = 𝑢3 , . . . , 𝑢𝑛− 𝑛
1 = 𝑢𝑛 ed essendo 𝑢𝑛 ∈ 𝐶 , si scopre che 𝑢 = 𝑢1 è di classe 𝐶
0 1
ed è una soluzione del problema (9.20). Anche l’unicità segue direttamente

dall’equivalenza delle due formulazioni.
L’esistenza globale segue in maniera analoga dal teorema per i sistemi del primo
ordine. Basti osservare che se la funzione 𝑓 soddisfa l’ipotesi di sublinearità
anche 𝒇 la soddisfa.
9.6 equazioni lineari di ordine 𝑛

equazioni lineari di ordine 𝑛
Le equazioni differenziali ordinarie lineari di ordine 𝑛 in forma normale possono
essere scritte nella forma:
𝑢 (𝑛) (𝑥) + 𝑎 𝑛−1 (𝑥)𝑢 (𝑛−1) (𝑥) + · · · + 𝑎1 (𝑥)𝑢 0(𝑥) + 𝑎0 𝑢(𝑥) = 𝑏(𝑥) (9.22)
con 𝑎 𝑘 : 𝐴 → ℝ, 𝑏 : 𝐴 → ℝ funzioni continue definite su uno stesso dominio

omogenea
𝐴 ⊆ ℝ. Nel caso 𝑏(𝑥) = 0 l’equazione si dice essere omogenea e si può scrivere
come:
𝑢 (𝑛) (𝑥) + 𝑎 𝑛−1 (𝑥)𝑢 (𝑛−1) (𝑥) + · · · + 𝑎 1 (𝑥)𝑢 0(𝑥) + 𝑎0 𝑢(𝑥) = 0. (9.23)
equazione non omogenea In generale l’equazione (9.22) viene chiamata equazione non omogenea e la
equazione omogenea associata
corrispondente equazione (9.23) viene chiamata equazione omogenea associata.
Teorema 9.25 (struttura delle soluzioni di una equazione lineare). Siano 𝑎 𝑘 ∈

𝐶 0 (𝐼) con 𝐼 ⊆ ℝ un intervallo aperto.
1. L’insieme 𝑉 delle soluzioni dell’equazione lineare omogenea (9.23) è un sottospazio

vettoriale di 𝐶 𝑛 (𝐼) di dimensione 𝑛 . Inoltre, fissato un punto qualunque 𝑥 0 ∈ 𝐼
jet
l’operatore 𝐽 : 𝑉 → ℝ𝑛 (chiamato jet) definito da
𝐽(𝑢) = (𝑢(𝑥0 ), 𝑢 0(𝑥0 ), 𝑢 00(𝑥 0 ), . . . , 𝑢 (𝑛−1) (𝑥0 )) (9.24)
è un operatore lineare bigettivo (cioè un isomorfismo di spazi vettoriali).

9.6 equazioni lineari di ordine 𝑛 401
2. L’insieme delle soluzioni dell’equazione non omogenea (9.22) è un sottospazio

affine di 𝐶 𝑛 (𝐴) di dimensione 𝑛 , parallelo al sottospazio delle soluzioni dell’equa-
zione omogenea associata (9.23). In particolare se 𝑢0 è una soluzione particolare
dell’equazione non omogenea (9.22) ogni altra soluzione 𝑢 di (9.22) si scrive
nella forma
𝑢 = 𝑢0 + 𝑣
con 𝑣 soluzione dell’equazione omogenea associata.
Dimostrazione. Innanzitutto il teorema 9.22 di esistenza globale garantisce che

le soluzioni delle equazioni (9.22) e (9.23) esistono e sono funzioni in 𝐶 𝑛 (𝐼).
Possiamo riscrivere l’equazione (9.22) nella forma
𝐿𝑢 = 𝑏
con
𝑛−1
X
𝐿𝑢 = 𝑢 (𝑛) + 𝑎 𝑘 𝑢 (𝑘)
𝑘=0
L’equazione omogenea (9.23) risulta quindi essere
𝐿𝑢 = 0.
Si osservi che 𝐿 : 𝐶 𝑛 (𝐼) → 𝐶 0 (𝐼) è un operatore lineare in quanto la somma, la

derivata e la moltiplicazione per una funzione sono operatori lineari sullo spazio
vettoriale delle funzioni. Dunque l’insieme 𝑉 delle soluzioni dell’equazione
omogenea non è altro che ker 𝐿 che notoriamente è uno spazio vettoriale visto
che se 𝐿(𝑢) = 0 e 𝐿(𝑣) = 0 allora anche 𝐿(𝜆𝑢 + 𝜇𝑣) = 𝜆𝐿(𝑢) + 𝜇𝐿(𝑣) = 0.
Possiamo ora determinare la dimensione di tale spazio, mettendo in corrispon-

denza le soluzioni dell’equazione con un loro dato iniziale, tramite l’applicazione
𝐽(𝑢) definita da (9.24). Chiaramente 𝐽 è lineare perché l’operatore derivata e la
valutazione in un punto sono operatori lineari. Osserviamo che 𝐽 è suriettivo
perché dato un qualunque 𝒚 ∈ ℝ𝑛 per il teorema 9.24 di esistenza (globale) di
soluzioni per il problema di Cauchy di ordine 𝑛 sappiamo esistere una soluzione
𝑢 ∈ 𝑉 tale che 𝐽(𝑢) = 𝒚. Ma 𝐽 è anche iniettivo perché se 𝑢, 𝑣 ∈ 𝑉 sono due
soluzioni con 𝐽(𝑢) = 𝐽(𝑣) significa che 𝑢 e 𝑣 verificano lo stesso problema di
Cauchy. Per l’unicità della soluzione risulta quindi 𝑢 = 𝑣 . Abbiamo quindi
mostrato che 𝐽 : 𝑉 → ℝ𝑛 è un isomorfismo di spazi vettoriali, quindi dim 𝑉 = 𝑛 .
Per quanto riguarda l’equazione non omogenea sia
𝑊 = {𝑣 ∈ 𝐶 𝑛 (𝐴) : 𝐿𝑣 = 𝑏}
l’insieme di tutte le soluzioni. Se consideriamo una soluzione particolare 𝑣 0 ∈ 𝑊

e se 𝑣 ∈ 𝑊 è una qualunque altra soluzione, si osserva che
𝐿(𝑣 − 𝑣0 ) = 𝐿(𝑣) − 𝐿(𝑣0 ) = 𝑏 − 𝑏 = 0.
Significa che 𝑢 = 𝑣 − 𝑣 0 è soluzione dell’equazione omogenea associata: 𝑢 ∈

𝑉 = ker 𝐿. Dunque ogni soluzione 𝑣 dell’equazione non omogenea si può
scrivere nella forma 𝑣 = 𝑣 0 + 𝑢 con 𝑣 0 soluzione particolare della non omogenea

e 𝑢 soluzione generale dell’equazione omogenea associata ovvero
𝑊 = 𝑣0 + 𝑉.
Teorema 9.26 (maggiore regolarità delle soluzioni). Se 𝑢(𝑥) è una soluzione

dell’equazione differenziale lineare (9.22) e se i coefficienti 𝑎 1 , . . . , 𝑎 𝑛−1 , 𝑏 sono funzioni
di classe 𝐶 𝑚 per un certo 𝑚 ∈ ℕ allora la soluzione è di classe 𝐶 𝑚+𝑛 . In particolare se
i coefficienti sono di classe 𝐶 ∞ le soluzioni sono anch’esse di classe 𝐶 ∞ .
Dimostrazione. Se 𝑢 è soluzione di (9.22) per definizione sappiamo che 𝑢 è

derivabile 𝑛 volte nell’intervallo 𝐼 su cui è definita. Se scriviamo l’equazione in
forma normale:
𝑛−1
X
𝑢 (𝑛) (𝑥) = 𝑏(𝑥) − 𝑎 𝑘 (𝑥)𝑢 (𝑘) (𝑥)
𝑘=0
essendo 𝑎 𝑘 ∈ 𝐶 0 sappiamo che 𝑢 (𝑛) è continua dunque 𝑢 è di classe 𝐶 𝑛 .

Supponiamo ora che sia 𝑢 ∈ 𝐶 𝑗 per qualche 𝑗 ≥ 𝑛 . I coefficienti dell’equazione
sono di classe 𝐶 𝑚 e vengono moltiplicati per le derivate di 𝑢 che sono almeno di
classe 𝐶 𝑗−𝑛+1 . Se 𝑗 − 𝑛 + 1 ≤ 𝑚 allora il lato destro della precedente equazione
è di classe 𝑗 − 𝑛 + 1. Dunque 𝑢 (𝑛) ∈ 𝐶 𝑗−𝑛+1 da cui 𝑢 ∈ 𝐶 𝑗+1 . Un passo alla volta
è quindi possibile incrementare la regolarità di 𝑢 ∈ 𝐶 𝑗 finché 𝑗 − 𝑛 + 1 ≤ 𝑚 cioè
finché 𝑗 ≤ 𝑚 + 𝑛 − 1. A quel punto otteniamo 𝑢 ∈ 𝐶 𝑗+1 = 𝐶 𝑚+𝑛 .
Se i coefficienti sono di classe 𝐶 ∞ il procedimento non termina mai e si ottiene

dunque che anche 𝑢 è di classe 𝐶 ∞ .
9.7 equazioni lineari di ordine 𝑛 a coefficienti

costanti
Una equazione differenziale ordinaria di ordine 𝑛 a coefficienti costanti è una

equazione del tipo:
𝑛
X
𝑎 𝑘 · 𝑢 (𝑘) (𝑥) = 0 (9.25)
𝑘=0
con 𝑎 𝑘 ∈ ℝ. Senza perdita di generalità possiamo supporre che sia 𝑎 𝑛 ≠ 0

cosicchè tale equazione può essere scritta in forma normale e rientra nella casi-
stica generale che abbiamo considerato nel capitolo precedente. In particolare
sappiamo che lo spazio delle soluzioni è uno spazio vettoriale di dimensione
𝑛 . Osserviamo che il teorema di esistenza e unicità globale garantisce che
le soluzioni dell’equazione differenziale lineare a coefficienti costanti siano
funzioni di classe 𝐶 𝑛 definite su tutto ℝ. Ma i coefficienti costanti sono di classe
𝐶 ∞ dunque la maggiore regolarità delle soluzioni ci dice, in questo caso, che le
soluzioni dovranno essere funzioni di classe 𝐶 ∞ .
Per motivi puramente algebrici sarà utile considerare le funzioni a valori

complessi. Ricordiamo che se 𝑢(𝑥) è una funzione a valori complessi, allora si
9.7 equazioni lineari di ordine 𝑛 a coefficienti costanti 403
può scrivere 𝑢(𝑥) = 𝑓 (𝑥) + 𝑖 𝑔(𝑥) con 𝑓 e 𝑔 funzioni a valori reali. Si definisce
allora 𝑢 0(𝑥) = 𝑓 0(𝑥) + 𝑖 𝑔 0(𝑥). Denotiamo con 𝐷 : 𝐶 ∞ (ℝ , ℂ) → 𝐶 ∞ (ℝ , ℂ)
l’operatore derivata: 𝐷𝑢 = 𝑢 0.
Osserviamo esplicitamente che anche quando 𝜆 ∈ ℂ risulta, come nel caso
𝜆∈ℝ
𝐷𝑒 𝜆𝑥 = 𝜆𝑒 𝜆𝑥 . (9.26)
Si potrebbe fare la verifica diretta riconducendosi alle funzioni sin e cos tra-
mite le formule di Eulero ma questa è in realtà una proprietà fondamentale
dell’esponenziale complesso che discende direttamente dal teorema 3.45:
𝑒 𝜆(𝑥+ℎ) − 𝑒 𝜆𝑥 𝑒 𝜆ℎ − 1 𝑒 𝜆ℎ − 1
lim = lim 𝑒 𝜆𝑥 = 𝜆𝑒 𝜆𝑥 lim = 𝜆𝑒 𝜆𝑥 .
ℎ→0 ℎ ℎ→0 ℎ ℎ→0 𝜆ℎ
Se 𝑃 ∈ ℝ[𝑥] è un polinomio di grado 𝑛 possiamo valutare 𝑃 sull’operatore

derivata 𝐷 : 𝐶 ∞ (ℝ , ℂ) → 𝐶 ∞ (ℝ , ℂ). Questo ha senso perché sullo spazio
𝐶 ∞ (ℝ , ℂ) sono definite le operazioni di spazio vettoriale reale (somma e
prodotto per scalare) in più l’operazione di moltiplicazione 𝐷 · 𝐷 e quindi la
potenza 𝐷 𝑘 va intesa come composizione dell’operatore lineare con se stesso. In
pratica l’operatore 𝑃(𝐷) : 𝐶 ∞ (ℝ , ℂ) → 𝐶 ∞ (ℝ , ℂ) risulta definito come segue
𝑛 𝑛
𝑎𝑘 𝐷𝑘 𝑢 =
X X
𝑃(𝐷)[𝑢] = 𝑎 𝑘 𝑢 (𝑘)
𝑘=0 𝑘=0
(utilizziamo le parentesi quadre per indicare, come convenzione, che la funzione

è lineare in quell’argomento). Si osservi che 𝐷 0 = 𝐼 è l’identità ma tenendo
valida la convenzione 𝐷 0 = 1 ci capiterà di scrivere 𝜆 al posto di 𝜆𝐼 quando
𝜆 ∈ ℝ.
L’equazione lineare omogenea a coefficienti costanti (9.25) si può scrivere più
espressivamente nella forma
𝑃(𝐷)[𝑢] = 0
Se l’equazione è in forma normale si avrà deg 𝑃 = 𝑛 (in quanto il cofficiente 𝑎 𝑛

del termine di grado massimo è 1 per le equazioni in forma normale).
Teorema 9.27. Sia 𝑃 un polinomio e sia 𝜆 ∈ ℂ una radice di 𝑃 con molteplicità

𝑚 . Allora se 𝑝(𝑥) è un polinomio (a coefficienti complessi) di grado inferiore a 𝑚 , la
funzione 𝑢(𝑥) = 𝑝(𝑥)𝑒 𝜆𝑥 è soluzione (complessa) dell’equazione differenziale
𝑃(𝐷)[𝑢] = 0.
Dimostrazione. Se il polinomio 𝑃(𝑡) ha una radice 𝜆 con molteplicità 𝑚 significa

che 𝑃(𝑡) è divisibile per (𝑡 − 𝜆)𝑚 cioè esiste un polinomio 𝑅(𝑡) tale che
𝑃(𝑡) = 𝑅(𝑡) · (𝑡 − 𝜆)𝑚 .
Ma allora possiamo decomporre anche l’equazione differenziale:
𝑃(𝐷)[𝑢] = 𝑅(𝐷)[(𝐷 − 𝜆)𝑚 𝑢].

Se 𝑢(𝑥) = 𝑝(𝑥)𝑒 𝜆𝑥 si ha, utilizzando (9.26),
(𝐷 − 𝜆)𝑢(𝑥) = 𝐷𝑢(𝑥) − 𝜆𝑢(𝑥) = 𝑝 0(𝑥)𝑒 𝜆𝑥 + 𝑝(𝑥)𝜆𝑒 𝜆𝑥 − 𝜆𝑝(𝑥)𝑒 𝜆𝑥

= 𝑝 0(𝑥)𝑒 𝜆𝑥 ,
da cui
(𝐷 − 𝜆)𝑚 𝑢(𝑥) = 𝑝 (𝑚) (𝑥) · 𝑒 𝜆𝑥 .
Visto che la derivata di un polinomio è un polinomio di grado inferiore, se
il polinomio 𝑝 ha grado inferiore a 𝑚 risulta che 𝑝 (𝑚) = 0. Dunque, come
volevamo dimostrare,
𝑃(𝐷)[𝑢] = 𝑅(𝐷)[(𝐷 − 𝜆)𝑚 𝑢] = 𝑅(𝐷)[0] = 0.
Teorema 9.28 (indipendenza delle soluzioni fondamentali complesse). Il sot-

toinsieme B di 𝐶 ∞ (ℝ , ℂ) dato dalle funzioni 𝑢(𝑥) della forma
𝑢(𝑥) = 𝑥 𝑚 𝑒 𝜆𝑥
al variare di 𝑚 ∈ ℕ , e 𝜆 ∈ ℂ è un sottoinsieme linearmente indipendente dello spazio

vettoriale 𝐶 ∞ (ℝ , ℂ) sul campo ℂ.
Dimostrazione. Si tratta di mostrare che se una combinazione lineare finita di

tali funzioni è identicamente nulla, allora tutti i coefficienti sono nulli.
Supponiamo per assurdo che esistano 𝑢1 , . . . , 𝑢𝑁 ∈ B
𝑢 𝑘 (𝑥) = 𝑥 𝑚 𝑘 𝑒 𝜆 𝑘 𝑥 , 𝑘 = 1, . . . , 𝑁
tali che
𝑁
𝑐 𝑘 𝑥 𝑚𝑘 𝑒 𝜆𝑘 𝑥 = 0
X
∀𝑥 ∈ ℝ
𝑘=1
per una qualche scelta di coefficienti 𝑐 𝑘 ∈ ℂ non tutti nulli. Sommando assieme
i monomi che moltiplicano gli esponenziali con lo stesso coefficiente, potremo
riscrivere la relazione precedente nella forma:
𝑀
𝑃 𝑗 (𝑥)𝑒 𝜆 𝑗 𝑥 = 0
X
∀𝑥 ∈ ℝ (9.27)
𝑗=1
con i coefficienti 𝜆 𝑗 tutti diversi tra loro e con 𝑃 𝑗 polinomi non nulli.
Abbiamo già osservato che (𝐷 − 𝜆)𝑃(𝑥)𝑒 𝜆𝑥 = 𝑃 0(𝑥)𝑒 𝜆𝑥 mentre se 𝜆 ≠ 𝜇 si ha

(𝐷 − 𝜆)𝑃(𝑥)𝑒 𝜇𝑥 = 𝑄(𝑥)𝑒 𝜇𝑥 con 𝑄 polinomio dello stesso grado di 𝑃 in quanto:
(𝐷 − 𝜆)𝑃(𝑥)𝑒 𝜇𝑥 = (𝑃 0(𝑥) + (𝜇 − 𝜆)𝑃(𝑥))𝑒 𝜇𝑥 .

Posto 𝑑 𝑗 = deg 𝑃 𝑗 applichiamo all’equazione (9.27) l’operatore (𝐷−𝜆1 )𝑑1 . Quello

che si ottiene è:
𝑀
𝑘 1 𝑒 𝜆1 𝑥 + 𝑄 𝑗 (𝑥)𝑒 𝜆 𝑗 𝑥 = 0
X
∀𝑥 ∈ ℝ (9.28)
𝑗=2
dove 𝑘 1 è la derivata 𝑑1 -esima del polinomio 𝑃1 . Visto che 𝑃1 è un polinomio di

grado 𝑑1 la sua derivata 𝑑1 -esima è un polinomio di grado 0 non nullo, dunque
è una costante 𝑘 1 ≠ 0. I polinomi 𝑄 𝑗 hanno invece lo stesso grado dei 𝑃 𝑗 perché
abbiamo visto che se 𝜆 ≠ 𝜇 il grado del polinomio non cambia.
Ora applichiamo in sequenza all’equazione (9.28) gli operatori (𝐷 − 𝜆 𝑗 )𝑑 𝑗 +1 per

𝑗 = 2, . . . , 𝑀 . Applicando tali operatori il coefficiente 𝑘 1 cambierà, ma rimarrà
comunque diverso da zero (chiamiamolo 𝑘 ≠ 0) mentre tutti gli altri polinomi
verranno annullati, perché i rispettivi polinomi vengono derivati una volta in
più del loro grado. Si otterrà quindi:
𝑘𝑒 𝜆1 𝑥 = 0 ∀𝑥 ∈ ℝ.
Ma questo è assurdo perché per 𝑥 = 0 si ottiene 𝑘 = 0, che abbiamo escluso.
I risultati precedenti ci permettono di determinare tutte le soluzioni reali delle

equazioni lineari omogenee a coefficienti costanti come nel seguente esempio.
Esempio 9.29. Si determinino tutte le soluzioni dell’equazione differenziale
𝑢 (5) (𝑥) + 2𝑢 000(𝑥) + 𝑢 0(𝑥) = 0.
Svolgimento. L’equazione può essere scritta nella forma
𝑃(𝐷)[𝑢] = 0
con 𝑃(𝑡) = 𝑡 5 + 2𝑡 3 + 𝑡 . Possiamo fattorizzare il polinomio 𝑃 nel campo

complesso:
𝑡 5 + 2𝑡 3 + 𝑡 = 𝑡(𝑡 2 + 1)2 = 𝑡(𝑡 + 𝑖)2 (𝑡 − 𝑖)2 .
Il polinomio ha una radice 𝜆0 = 0 con molteplicità uno e due radici complesse
coniugate 𝜆1 = 𝑖 , 𝜆2 = −𝑖 con molteplicità due. Risulta quindi che le seguenti
funzioni devono essere soluzioni complesse dell’equazione:
1, 𝑒 𝑖𝑥 , 𝑥𝑒 𝑖𝑥 , 𝑒 −𝑖𝑥 , 𝑥𝑒 −𝑖𝑥 .
Per il teorema precedente sappiamo che queste funzioni sono indipendenti.

Tramite la formula di Eulero possiamo scrivere:
𝑒 𝑖𝑥 = cos 𝑥 + 𝑖 sin 𝑥, 𝑒 −𝑖𝑥 = cos 𝑥 − 𝑖 sin 𝑥
da cui si ottiene che anche le funzioni
1, cos 𝑥, 𝑥 cos 𝑥, sin 𝑥, 𝑥 sin 𝑥 (9.29)

generano lo stesso spazio di soluzioni e sono quindi anch’esse indipendenti.

Dunque lo spazio generato ha dimensione 5, come l’ordine dell’equazione.
Per il teorema 9.25sappiamo però che anche lo spazio di tutte le soluzioni
ha dimensione pari all’ordine dell’equazione, dunque lo spazio che abbiamo
determinato esaurisce tutte le soluzioni. Ogni soluzione reale o complessa si
potrà dunque scrivere nella forma:
𝑢(𝑥) = 𝑐 1 + 𝑐 2 cos 𝑥 + 𝑐 3 sin 𝑥 + 𝑐 4 𝑥 cos 𝑥 + 𝑐5 𝑥 sin 𝑥 (9.30)
con 𝑐 1 , 𝑐 2 , . . . , 𝑐 5 ∈ ℂ opportuni coefficienti complessi.
Se i coefficienti 𝑐 1 , 𝑐 2 , . . . , 𝑐 5 sono reali si otterranno certamente soluzioni

reali ma è anche vero il viceversa: ogni soluzione reale si può scrivere nella
forma (9.30) con coefficienti 𝑐 1 , 𝑐 2 , . . . , 𝑐 5 reali. Infatti se prendiamo la parte
immaginaria di (9.30) e poniamo 𝑏 𝑗 = Im 𝑐 𝑗 otteniamo:
0 = 𝑏 1 + 𝑏 2 cos 𝑥 + 𝑏 3 sin 𝑥 + 𝑏 4 𝑥 cos 𝑥 + 𝑏 5 𝑥 sin 𝑥.
Visto che le funzioni scelte sono indipendenti, una combinazione lineare nulla
ha tutti i coefficienti nulli: 𝑏 𝑗 = 0 e quindi i coefficienti 𝑐 𝑗 sono tutti reali.
Formalizzando in generale il metodo utilizzato nell’esercizio precedente possia-

mo dare il seguente enunciato.
Teorema 9.30 (soluzioni dell’equazione lineare omogenea a coefficienti costanti).

Se 𝑃(𝑡) è un polinomio a coefficienti reali. Ogni soluzione 𝑢 : ℝ → ℝ dell’equazione
differenziale
𝑃(𝐷)[𝑢] = 0
si scrive nella forma
𝑛𝑘
𝑁 X 𝑚𝑙
𝑀 X
𝑐 𝑘 𝑗 𝑥 𝑗 𝑒 𝜆𝑘 𝑥 + 𝑥 𝑗 𝑒 𝛼 𝑘 𝑥 (𝑎 𝑘 𝑗 cos(𝛽 𝑘 𝑥) + 𝑏 𝑘 𝑗 sin(𝛽 𝑘 𝑥))
X X
𝑢(𝑥) = (9.31)
𝑘=1 𝑗=1 𝑘=1 𝑗=1
dove 𝜆1 , . . . , 𝜆 𝑁 sono le radici reali del polinomio 𝑃(𝑡), 𝑛1 , . . . , 𝑛 𝑁 sono le rispettive

molteplicità, 𝛼 𝑘 ± 𝑖𝛽 𝑘 sono le radici complesse coniugate (non reali) del polinomio 𝑃
con 𝑘 = 1 , . . . , 𝑀 ognuna con molteplicità 𝑚 𝑘 e infine 𝑐 𝑘 𝑗 , 𝑎 𝑘 𝑗 , 𝑏 𝑘 𝑗 ∈ ℝ sono costanti
arbitrarie.
Dimostrazione. Sappiamo che le funzioni complesse
𝑥 𝑗 𝑒 𝜆𝑘 𝑥 , 𝑥 𝑗 𝑒 (𝛼 𝑘 +𝑖𝛽 𝑘 )𝑥 (9.32)
sono soluzioni dell’equazione se 𝑗 è inferiore alla molteplicità della corrispon-

dente radice reale 𝜆 𝑘 o complessa 𝛼 𝑘 + 𝑖𝛽 𝑘 . Dunque
𝑢 𝑘,𝑗 (𝑥) = 𝑥 𝑗 𝑒 𝜆 𝑘 𝑥
è soluzione se 𝑗 < 𝑛 𝑘 . Per le radici complesse applichiamo la formula di Eulero:
1 𝑗 (𝛼 𝑘 +𝑖𝛽 𝑘 )𝑥 1 𝑗 (𝛼 𝑘 −𝑖𝛽 𝑘 )𝑥
𝑥 𝑗 𝑒 𝛼 𝑘 𝑥 cos(𝛽 𝑘 𝑥) =
𝑥 𝑒 + 𝑥 𝑒 (9.33)
2 2
𝑗 𝛼𝑘 𝑥 1 𝑗 (𝛼 𝑘 +𝑖𝛽 𝑘 )𝑥 1
𝑥 𝑒 sin(𝛽 𝑘 𝑥) = 𝑥 𝑒 − 𝑥 𝑗 𝑒 (𝛼 𝑘 −𝑖𝛽 𝑘 )𝑥 (9.34)
2𝑖 2𝑖
dunque anche le funzioni
𝑣 𝑘 𝑗 (𝑥) = 𝑥 𝑗 𝑒 𝛼 𝑘 𝑥 cos 𝑥, 𝑤 𝑘 𝑗 (𝑥) = 𝑥 𝑗 𝑒 𝛼 𝑘 𝑥 sin 𝑥
essendo combinazione lineare di soluzioni, sono anch’esse soluzioni. Queste

soluzioni sono inoltre indipendenti in quanto le funzioni in (9.32) lo sono (per
il teorema precedente) e possono essere ricondotte alle (9.33) tramite la formula
di Eulero.
Abbiamo dunque trovato un insieme formato da
𝑁
X 𝑀
X
𝑛= 𝑛𝑘 + 2 𝑚𝑘
𝑘=1 𝑘=1
soluzioni reali indipendenti. Il numero 𝑛 è pari alla somma delle molteplicità

delle radici (reali e complesse) del polinomio 𝑃 e dunque, per il teorema
fondamentale dell’algebra, coincide con il grado di 𝑃 . Sappiamo allora che
lo spazio delle soluzioni di 𝑃(𝐷)[𝑢] = 0 ha dimensione 𝑛 e quindi abbiamo
trovato una base di tutte le soluzioni reali. Significa che ogni soluzione si scrive
nella forma (9.31).
Osservazione 9.31 (fase delle soluzioni oscillanti). Quando si vanno a scrivere le

soluzioni nella forma (9.31) può essere utile osservare che ogni combinazione lineare di
seni e coseni con la stessa pulsazione 𝛽 è una singola onda eventualmente sfasata di un
angolo 𝜃 :
𝑎 cos(𝛽𝑥) + 𝑏 sin(𝛽𝑥) = 𝜌 cos(𝛽𝑥 − 𝜃)
√
dove 𝜌 = |𝑎 + 𝑖𝑏| = 𝑎 2 + 𝑏 2 e 𝜃 = arg(𝑎 + 𝑖𝑏). Infatti posto 𝑎 = 𝜌 cos 𝜃 ,
𝑏 = 𝜌 sin 𝜃 si ha, grazie alla formula di addizione:
𝑎 cos(𝛽𝑥) + 𝑏 sin(𝛽𝑥) = 𝜌(cos 𝜃 cos(𝛽𝑥) + sin 𝜃 sin(𝛽𝑥)) = 𝜌 cos(𝛽𝑥 − 𝜃).
Teorema 9.32 (metodo di similarità). Consideriamo l’equazione non omogenea

complessa
𝑃(𝐷)[𝑢] = 𝑞(𝑥)𝑒 𝜆𝑥 . (9.35)
con 𝑃 e 𝑞 polinomi a coefficienti complessi. Sia 𝑚 la molteplicità di 𝜆 come radice di 𝑃
(𝑚 = 0 se 𝜆 non è radice di 𝑃 ). Allora una soluzione particolare di (9.35) può essere
scritta nella forma
𝑢(𝑥) = 𝑝(𝑥)𝑥 𝑚 𝑒 𝜆𝑥 (9.36)
con 𝑝 un polinomio (incognito) di grado uguale al grado di 𝑞 .
Dimostrazione. Se 𝑢(𝑥) = 𝑥 𝑚 𝑝(𝑥)𝑒 𝜆𝑥 vogliamo capire come agisce l’operatore

𝑃(𝐷) su 𝑢 , in particolare dato un qualunque polinomio 𝑞 vogliamo capire se
esiste un polinomio 𝑝 , dello stesso grado di 𝑞 , tale che applicando 𝑃(𝐷) ad 𝑢(𝑥)
si ottiene 𝑞(𝑥)𝑒 𝜆𝑥 .
Fattorizziamo il polinomio 𝑃(𝑧):
𝑃(𝑧) = (𝑧 − 𝜆1 )𝑚1 . . . (𝑧 − 𝜆𝑛 )𝑚𝑛
dove 𝜆1 , . . . , 𝜆𝑛 ∈ ℂ sono le radici distinte di 𝑃(𝑧) e 𝑚1 , . . . , 𝑚𝑛 ∈ ℕ sono le

relative molteplicità. Dunque l’operatore 𝑃(𝐷) può essere fattorizzato nella
forma corrispondente:
𝑃(𝐷) = (𝐷 − 𝜆1 )𝑚1 . . . (𝐷 − 𝜆𝑛 )𝑚𝑛 .
Chiamiamo 𝑉𝑚𝑛 lo spazio vettoriale dei polinomi della forma 𝑥 𝑚 𝑝(𝑥) con
deg 𝑝 < 𝑛 . Una base di 𝑉𝑚𝑛 sono i monomi 𝑥 𝑚 , 𝑥 𝑚+1 , . . . , 𝑥 𝑚+𝑛 e dunque 𝑉𝑚𝑛 è
uno spazio vettoriale di dimensione 𝑛 .
La dimostrazione del teorema si basa sull’ossevazione di come agisce l’operatore

(𝐷 − 𝜆 𝑘 )𝑚 𝑘 sulle funzioni del tipo 𝑢(𝑥) = 𝑝(𝑥)𝑒 𝜆𝑥 con 𝑝 ∈ 𝑉𝑚𝑛 . In generale se 𝑝
è un polinomio si ha
(𝐷 − 𝜆 𝑘 )(𝑝(𝑥)𝑒 𝜆𝑥 ) = [(𝜆 − 𝜆 𝑘 )𝑝(𝑥) + 𝑝 0(𝑥)]𝑒 𝜆𝑥 .
Dobbiamo allora distinguere due casi. Se 𝜆 ≠ 𝜆 𝑘 allora la funzione 𝑝(𝑥)𝑒 𝜆𝑥 viene

trasformata nella funzione 𝑞(𝑥)𝑒 𝜆𝑥 dove 𝑞 è un polinomio dello stesso grado
di 𝑝 , in quanto il termine di grado massimo di 𝑝 viene moltiplicato per 𝜆 − 𝜆 𝑘
mentre il polinomio 𝑝 0 ha il grado inferiore al grado di 𝑝 e quindi non influenza il
termine di grado massimo. Se chiamiamo 𝑇𝑘 : 𝑉0𝑛 → 𝑉0𝑛 l’operatore lineare che
manda il polinomio 𝑝(𝑥) nel polinomio 𝑞(𝑥) = (𝜆 − 𝜆 𝑘 )𝑝(𝑥) + 𝑝 0(𝑥) osserviamo
che 𝑇𝑘 è iniettivo in quanto, visto che 𝑇𝑘 preserva il grado del polinomio, l’unico
polinomio che può andare a zero è il polinomio nullo. Dunque, per il teorema
𝑚
del rango, 𝑇𝑘 è bigettivo e di conseguenza 𝑇𝑘 𝑘 : 𝑉0𝑛 → 𝑉0𝑛 è bigettivo.
Se invece 𝜆 = 𝜆 𝑘 osserviamo ora che l’operatore 𝑇𝑘 non è altro che la derivata:

𝑞(𝑥) = 𝑝 0(𝑥). E se 𝑚 = 𝑚 𝑘 è la molteplicità di 𝜆 come radice di 𝑃 , l’operatore
𝑚
𝑇𝑘 𝑘 non è altro che la derivata 𝑚 -esima. Tale operatore non è invertibile su 𝑉0𝑛
in quanto manda a zero tutti i polinomi di grado inferiore a 𝑚 . Ma se partiamo
da un polinomio in 𝑉𝑚𝑛 allora l’operatore 𝑇𝑘𝑚 : 𝑉𝑚𝑛 → 𝑉0𝑛 diventa invertibile:
infatti in 𝑉𝑚𝑛 ci sono polinomi della forma 𝑎 𝑚 𝑥 𝑚 + 𝑎 𝑚+1 𝑥 𝑚+1 + · · · + 𝑎 𝑛+𝑚 𝑥 𝑛+𝑚
e facendone la derivata 𝑚 -esima si può ottenere il polinomio nullo solamente
se tutti i coefficienti sono nulli. Risulta quindi che, se 𝜆 = 𝜆 𝑘 , l’operatore
𝑇𝑘𝑚 : 𝑉𝑚𝑛 → 𝑉0𝑛 è invertibile.
Siamo arrivati alla conclusione. Se prendiamo un polinomio 𝑝(𝑥) in 𝑉𝑚𝑛 e

applichiamo 𝑃(𝐷) alla corrispondente funzione 𝑢(𝑥) = 𝑝(𝑥)𝑒 𝜆𝑥 possiamo
applicare sequenzialmente gli operatori (𝐷 − 𝜆 𝑘 )𝑚 𝑘 . Questi agiscono sulla
funzione 𝑢 modificando il polinomio 𝑝 . Se 𝜆 è radice di 𝑃 al primo passaggio
applichiamo l’operatore (𝐷 − 𝜆 𝑘 )𝑚 𝑘 con 𝜆 𝑘 = 𝜆 e 𝑚 𝑘 = 𝑚 cosicché il polinomio
𝑝 ∈ 𝑉𝑚𝑛 viene trasformato, in maniera biunivoca, in un polinomio di 𝑉0𝑛 .
Dopodiché applico tutti gli altri operatori (𝐷 − 𝜆 𝑘 )𝑚 𝑘 con 𝜆 𝑘 ≠ 𝜆 trasformando
il polinomio di 𝑉0𝑛 in un altro polinomio di 𝑉0𝑛 ma sempre in maniera biunivoca.
Ne risulta che alla fine ottengo una mappa biunivoca tra 𝑉𝑚𝑛 → 𝑉0𝑛 e qualunque
sia 𝑞 ∈ 𝑉0𝑛 sappiamo esister un 𝑢 ∈ 𝑉𝑚𝑛 che viene mandato in 𝑞 .
Osservazione 9.33. Si noti che nella dimostrazione precedente abbiamo investigato la

struttura dell’operatore differenziale 𝐷 a coefficienti costanti. Quello che abbiamo fatto è
in realtà il processo di decomposizione di Jordan di un operatore lineare. L’operatore
𝐷 ha come autovettori le funzioni 𝑒 𝜆 𝑘 𝑥 con 𝜆 𝑘 radici del polinomio 𝑃 . Si osserva
però che le funzioni della forma 𝑥 𝑗 𝑒 𝜆 𝑘 𝑥 sono autovettori generalizzati in quanto
iterando l’operatore 𝐷 − 𝜆 𝑘 vengono mandati in un autovettore e sono quindi una base
dell’autospazio relativo all’autovettore 𝜆 𝑘 .
𝑗
La base formata dalle funzione della forma 𝑥𝑗 ! 𝑒 𝜆 𝑗 𝑥 è una base a ventaglio e la matrice
che rappresenta l’operatore 𝐷 risulta essere una matrice a blocchi nella forma di Jordan:
gli autovalori stanno sulla diagonale e una fila di 1 si trova al di sopra della diagonale.
Il nucleo dell’operatore 𝑃(𝐷) si decompone come somma diretta dei nuclei degli operatori
(𝐷 − 𝜆 𝑘 )𝑚 𝑘 .
Definizione 9.34 (wronksiano). Siano 𝑢1 , . . . , 𝑢𝑛 funzioni di classe 𝐶 𝑛−1 . La

matrice
𝑢1 (𝑥) 𝑢2 (𝑥) ... 𝑢𝑛 (𝑥)
© 𝑢 0 (𝑥) 𝑢20 (𝑥) ... 𝑢𝑛0 (𝑥) ª®
1
𝑊(𝑥) =
.. .. ® (9.37)
. . ®
®
(𝑛−1) (𝑛−1) (𝑛−1)
«𝑢1 (𝑥) 𝑢2 (𝑥) ... 𝑢𝑛 (𝑥)¬
è chiamata matrice wronksiana. Il determinante di tale matrice 𝑤(𝑥) = det 𝑊(𝑥) è matrice e
chiamato determinante wronksiano.
determinante wronksiano
Teorema 9.35. Sia 𝐼 ⊆ ℝ un intervallo aperto non vuoto e siano 𝑎 𝑗 ∈ 𝐶 0 (𝐼, ℂ). Siano
𝑢1 , . . . , 𝑢𝑛 funzioni di classe 𝐶 𝑛 soluzioni dell’equazione lineare omogenea in forma
normale:
𝑛
X
𝑢 (𝑛) = 𝑎 𝑗 (𝑥)𝑢 (𝑗−1) (𝑥). (9.38)
𝑗=1
Sia 𝑊(𝑥) la matrice wronksiana (9.37). Allora le seguenti proprietà sono equivalenti:
1. le funzioni 𝑢1 , . . . , 𝑢𝑛 sono linearmente indipendenti;

2. per ogni 𝑥 ∈ 𝐼 si ha det 𝑊(𝑥) ≠ 0;
3. esiste 𝑥 ∈ 𝐼 tale che det 𝑊(𝑥) ≠ 0.
Dimostrazione. Ovviamente 2 implica 3.
Dimostriamo che 3 implica 1. Passando alla implicazione contropositiva dob-

biamo mostrare che se 𝑢1 , . . . , 𝑢𝑛 sono linearmente dipendenti allora per ogni
𝑥 ∈ 𝐼 si ha det 𝑊(𝑥) = 0. Ma se le funzioni sono dipendenti significa che esiste
𝝀 ≠ 0 tale che
𝑛
X
𝜆 𝑘 𝑢 𝑘 (𝑥) = 0 ∀𝑥 ∈ 𝐼. (9.39)
𝑘=1
Derivando si ottiene, per ogni 𝑗 = 0 , . . . , 𝑛 − 1:

𝑛
X (𝑗)
𝜆 𝑘 𝑢 𝑘 (𝑥) = 0 ∀𝑥 ∈ 𝐼
𝑘=1
e quindi
𝑊(𝑥) 𝝀 = 0 ∀𝑥 ∈ 𝐼.
Ma allora la matrice 𝑊(𝑥) non è invertibile e quindi det 𝑊(𝑥) = 0, come
Dimostriamo infine che 1 implica 2 cioè che se 𝑣 1 , . . . , 𝑣 𝑛 sono indipendenti

allora det 𝑊(𝑥) ≠ 0 per ogni 𝑥 ∈ 𝐼 . Fissato 𝑥 ∈ 𝐼 consideriamo il funzionale
𝐽(𝑣) = (𝑣(𝑥), 𝑣 0(𝑥), . . . , 𝑣 (𝑛−1) (𝑥)) cosicché si ha
𝑊(𝑥) = (𝐽(𝑢1 ), . . . , 𝐽(𝑢𝑛 )).
In base al teorema 9.25 ci ricordiamo che 𝐽 risulta essere un isomorfismo di

spazi vettoriali, dunque se 𝑣 1 , . . . , 𝑣 𝑛 sono indipendenti anche 𝐽(𝑣 1 ), . . . , 𝐽(𝑣 𝑛 )
dovranno essere indipendenti. Ma visto che le colonne della matrice 𝑊(𝑥) sono
indipendenti significa che det 𝑊(𝑥) ≠ 0, come volevamo dimostrare.
Teorema 9.36 (metodo della variazione delle costanti arbitrarie). Si consideri una
generica equazione differenziale lineare non omogenea di ordine 𝑛 in forma normale:
𝑛−1
X
𝑢 (𝑛) (𝑥) = 𝑎 𝑘 (𝑥)𝑢 (𝑘) (𝑥) + 𝑏(𝑥) (9.40)
𝑘=0
dove 𝑎 0 , . . . , 𝑎 𝑛−1 , 𝑏 ∈ 𝐶 0 (𝐴, ℂ) sono funzioni definite su un aperto 𝐴 ⊆ ℝ e si cerca

una soluzione 𝑢 ∈ 𝐶 𝑛 (𝐴, ℂ).
Se 𝑣 1 , . . . , 𝑣 𝑛 ∈ 𝐶 𝑛 (𝐴, ℂ) sono soluzioni indipendenti dell’equazione omogenea

associata:
𝑛−1
X
𝑢 (𝑛) (𝑥) = 𝑎 𝑘 (𝑥)𝑢 (𝑘) (𝑥)
𝑘=0
allora esistono delle funzioni 𝑐 𝑘 ∈ 𝐶 (𝐴, ℂ) per 𝑘 = 0 , 1 , . . . , 𝑛 − 1 tali che

1
P𝑛 0
𝑐 (𝑥)𝑣 𝑘 (𝑥) = 0

𝑘=1 𝑘



𝑛
𝑐 0 (𝑥)𝑣 0𝑘 (𝑥) = 0

 P
 𝑘=1 𝑘


..


. (9.41)

𝑛 (𝑛−2)
𝑐 0 (𝑥)𝑣 𝑘

(𝑥) = 0
 P
𝑘=1 𝑘



𝑛 (𝑛−1)
 𝑘=1 𝑐 𝑘 (𝑥)𝑣 𝑘 (𝑥) = 𝑏(𝑥).
0

 P

E in tal caso la funzione

𝑛
X
𝑢(𝑥) = 𝑐 𝑘 (𝑥)𝑣 𝑘 (𝑥)
𝑘=1
risolve l’equazione non omogenea (9.40).
Dimostrazione. Osserviamo innanzitutto che se esistono le funzioni 𝑐 𝑘 che

soddisfano il sistema (9.41) allora la funzione 𝑢 = 𝑐 1 · 𝑣 1 + · · · + 𝑐 𝑛 · 𝑣 𝑛 risolve
l’equazione non omogenea. Infatti dalla formula di derivazione del prodotto si
ha:
𝑛
X 𝑛
X 𝑛
X
𝑢0 = 𝑐 𝑘 𝑣 0𝑘 + 𝑐 0𝑘 𝑣 𝑘 = 𝑐 𝑘 𝑣 0𝑘
𝑘=1 𝑘=1 𝑘=1
essendo il secondo addendo nullo per ipotesi (9.41). Ma allora si può proseguire
con le derivate:
𝑛
X 𝑛
X 𝑛
X
𝑢 00 = 𝑐 𝑘 𝑣 00𝑘 + 𝑐 0𝑘 𝑣 0𝑘 = 𝑐 𝑘 𝑣 00𝑘
𝑘=1 𝑘=1 𝑘=1
fino alla derivata (𝑛 − 1)-esima:

𝑛
(𝑛−1)
X
𝑢 (𝑛−1) = 𝑐𝑘 𝑣𝑘 .
𝑘=1
Per l’ultima derivata si ha infine:

𝑛 𝑛 𝑛
(𝑛) (𝑛−1) (𝑛)
X X X
𝑢 (𝑛) = 𝑐𝑘 𝑣𝑘 + 𝑐 0𝑘 𝑣 𝑘 = 𝑐 𝑘 𝑣 𝑘 + 𝑏.
𝑘=1 𝑘=1 𝑘=1
Ma allora si osserva che si ha

𝑛−1 𝑛 𝑛−1 𝑛
X X (𝑛)
X X (𝑗)
𝑢 (𝑛) + 𝑎 𝑗 𝑢 (𝑗) = 𝑐𝑘 𝑣𝑘 + 𝑏 + 𝑎𝑗 𝑐𝑘 𝑣𝑘
𝑗=0 𝑘=1 𝑗=0 𝑘=1
" #
𝑛 𝑛−1
X (𝑛)
X (𝑗)
= 𝑐𝑘 𝑣𝑘 + 𝑎𝑗 𝑣𝑘 +𝑏 =𝑏
𝑘=1 𝑗=0
in quanto le funzioni 𝑣 𝑗 , per ipotesi, risolvono l’equazione omogenea.
Rimane quindi solo da verificare che esistono funzioni 𝑐 𝑘 ∈ 𝐶 1 (𝐴, ℂ) che

soddisfano il sistema (9.41). Si osserva che l’equazione (9.41) si scrive nella
forma
𝑊(𝑥)𝒄0(𝑥) = 𝒃(𝑥)
dove 𝑊(𝑥) è la matrice wronksiana 𝑊(𝑥) associata alle soluzioni 𝑣 1 , . . . , 𝑣 𝑛 ,
𝒄(𝑥) = (𝑐 1 (𝑥), . . . , 𝑐 𝑛 (𝑥)) e 𝒃(𝑥) = (0, . . . , 0 , 𝑏(𝑥)). Siccome 𝑣1 , . . . , 𝑣 𝑛 per
ipotesi sono indipendenti, per il teorema 9.35 sappiamo che det 𝑊(𝑥) ≠ 0 per
ogni 𝑥 e quindi il sistema 𝑊(𝑥)𝒅(𝑥) = 𝒃(𝑥) ammette una unica soluzione 𝑑(𝑥)
per ogni 𝑥 ∈ 𝐼 . Visto che 𝑊(𝑥) e 𝒃(𝑥) hanno coefficienti continui, anche la
soluzione 𝒅(𝑥) = 𝑊(𝑥)−1 𝒃(𝑥) dovrà essere continua (che i coefficienti della
matrice 𝑊(𝑥)−1 siano continui lo si vede ad esempio scrivendo 𝑊(𝑥)−1 tramite
la matrice dei cofattori e sfruttando il fatto che il determinante è una funzione
continua) e quindi, fissato un punto 𝑥 0 ∈ 𝐼 , potremo definire
∫ 𝑥
𝑐 𝑘 (𝑥) = 𝑑 𝑘 (𝑡) 𝑑𝑡
𝑥0
per determinare le funzioni 𝑐 𝑘 .
Esercizio 9.37. Trovare tutte le soluzioni dell’equazione lineare non omogenea a

coefficienti costanti:
1
𝑢 00(𝑥) + 𝑢(𝑥) = .
cos 𝑥
Svolgimento. Il polinomio associato è 𝑃(𝜆) = 𝜆2 + 1 che ha due radici complesse

coniugate ±𝑖 . Due soluzioni indipendenti dell’equazione omogenea 𝑢 00 + 𝑢 = 0
sono dunque (come noto):
𝑢1 (𝑥) = cos 𝑥, 𝑢2 (𝑥) = sin 𝑥.
La soluzione generale dell’omogenea è dunque della forma:
𝑢(𝑥) = 𝐴 cos 𝑥 + 𝐵 sin 𝑥.
Per trovare una soluzione particolare della equazione non omogenea utilizziamo
il metodo della variazione delle costanti, cioè cerchiamo una soluzione della
forma:
𝑢∗ (𝑥) = 𝐴(𝑥) cos 𝑥 + 𝐵(𝑥) sin 𝑥.
I coefficienti 𝐴(𝑥) e 𝐵(𝑥) si determinano risolvendo il sistema
(
𝐴0(𝑥) · cos 𝑥 +𝐵0(𝑥) · sin 𝑥 = 0 ,
𝐴0(𝑥) · (− sin 𝑥) +𝐵0(𝑥) · cos 𝑥 = cos 𝑥 .
1
Si trova quindi (
sin 𝑥
𝐴0(𝑥) = − cos 𝑥 · 𝐵 (𝑥)
0
𝐵0(𝑥) = 1
da cui, integrando, si trova
𝐴(𝑥) = ln | cos 𝑥|, 𝐵(𝑥) = 𝑥
e quindi
𝑢∗ (𝑥) = cos 𝑥 · ln | cos 𝑥| + 𝑥 sin 𝑥.
Tutte le soluzioni dell’equazione data si scrivono quindi come somma della

soluzione particolare della non omogenea più la soluzione generale della
omogenea:
𝑢(𝑥) = 𝑎 cos 𝑥 + 𝑏 sin 𝑥 + cos 𝑥 · ln | cos 𝑥| + 𝑥 sin 𝑥.
9.8 sistemi lineari
Un sistema lineare omogeneo a coefficienti costanti del primo ordine si scrive in

generale nella forma:
𝒖 0(𝑥) = 𝐴𝒖(𝑥)
dove 𝐴 è una matrice 𝑛 × 𝑛 costante e la funzione vettoriale incognita sarà
𝒖 : ℝ → ℝ𝑛 . Come per i sistemi lineari algebrici sarà utile, se possibile, cercare
un sistema di riferimento in cui la matrice 𝐴 risulti essere diagonale. Se facciamo
il cambio di variabile
𝒖 = 𝑀𝒗
tramite una matrice invertibile 𝑀 , si ottiene 𝒖 0 = (𝑀𝒗)0 = 𝑀𝒗 0 (si faccia la
verifica!... stiamo supponendo che 𝑀 sia una matrice costante) e dunque il
9.8 sistemi lineari 413
sistema lineare diventa:

𝑀𝒗 0 = 𝐴𝑀𝒗
ovvero
𝒗 0 = 𝑀 −1 𝐴𝑀𝒗.
A meno di un cambio di variabili potremo quindi sostituire la matrice 𝐴 con
una qualunque matrice simile ad essa: 𝑀 −1 𝐴𝑀 . In particolare se la matrice 𝐴
è diagonalizzabile (ad esempio se gli autovalori di 𝐴 sono tutti reali e distinti)
potremo ricondurci a un sistema diagonale:

 𝑣 0 = 𝜆1 𝑣 1
. 1


.

 .
 𝑣 0𝑛 = 𝜆𝑛 𝑣 𝑛



dove 𝜆1 , . . . , 𝜆𝑛 sono gli autovalori della matrice 𝐴. La matrice 𝑀 del cambio
di base avrà come vettori colonna gli autovettori della matrice 𝐴, che quindi
rappresentano la nuova base. A questo punto abbiamo 𝑛 equazioni indipendenti
che possono essere risolte senza difficoltà:
𝑣1 (𝑥) = 𝑐 1 𝑒 𝜆1 𝑥
𝑣2 (𝑥) = 𝑐 2 𝑒 𝜆2 𝑥
..
.
𝑣 𝑛 (𝑥) = 𝑐 𝑛 𝑒 𝜆𝑛 𝑥
con 𝑐 1 , . . . , 𝑐 𝑛 costanti arbitrarie.
Se la matrice 𝐴 non è diagonalizzabile sul campo reale è possibile che risulti

diagonalizzabile nel campo complesso. Più in generale la matrice potrà essere
portata in forma di Jordan. Per brevità non cercheremo di trattare il caso
generale, ma ci concentreremo sul caso 𝑛 = 2 che contiene comunque una
casistica piuttosto ampia.
sistemi 2 × 2
Nel caso 𝑛 = 2 sarà comodo usare 𝑡 come variabile indipendente (al posto di 𝑥 )
e chiamare 𝑥(𝑡) e 𝑦(𝑡) le due coordinate della funzione vettoriale incognita. Il
sistema che vogliamo trattare sarà quindi della forma:
(
𝑥 0(𝑡) = 𝑎 · 𝑥(𝑡) + 𝑏 · 𝑦(𝑡)
𝑢 0(𝑡) = 𝑐 · 𝑥(𝑡) + 𝑑 · 𝑦(𝑡).
dove 𝑎, 𝑏, 𝑐, 𝑑 sono i coefficienti costanti (reali) della matrice
𝑎 𝑏

𝐴= .
𝑐 𝑑
Vedremo che il comportamento del sistema potrà essere classificato in base agli
autovalori della matrice. Siano 𝜆 e 𝜇 gli autovalori (eventualmente complessi)
della matrice 𝐴 cioè gli zeri del polinomio caratteristico:
𝑃(𝑧) = det(𝐴 − 𝑧𝐼) = 𝑧 2 − (𝑎 + 𝑑)𝑧 + 𝑎𝑑 − 𝑏𝑐.
Se gli autovalori sono reali e distinti la matrice è diagonalizzabile, se 𝒗, 𝒘 sono

gli autovettori corrispondeti agli autovettori 𝜆, 𝜇, si potrà quindi fare il cambio
di variabile
𝑥

= 𝑋𝒗 + 𝑌𝒘
𝑦
tramite il quale le equazioni si separano:
(
𝑋 0 = 𝜆𝑋
𝑌 0 = 𝜇𝑌
da cui si ottiene 𝑋 = 𝑎𝑒 𝜆𝑡 , 𝑌 = 𝑏𝑒 𝜇𝑡 con 𝑎, 𝑏 ∈ ℝ costanti arbitrarie.
Visto che le equazioni a coefficienti costanti sono autonome sappiamo che una
traslazione temporale di una soluzione rimane una soluzione. Infatti si osserva
che (
𝑋(𝑡 + 𝑐) = 𝑎𝑒 𝜆(𝑡+𝑐) = 𝑎𝑒 𝜆𝑐 𝑒 𝜆𝑡 ,
𝑌(𝑡 + 𝑐) = 𝑏𝑒 𝜇(𝑡+𝑐) = 𝑏𝑒 𝜇𝑐 𝑒 𝜇𝑡 .
Questo ci permette di disegnare le traiettorie delle soluzioni nel piano (𝑥, 𝑦).
Su tale piano le traslazioni temporali di una soluzione si rappresentano sulla
stessa traiettoria. Traiettorie diverse non potranno invece mai incontrarsi per
l’unicità della soluzione.
Se 𝑎 = 𝑏 = 0 si ottiene la soluzione nulla 𝑋 = 0, 𝑌 = 0 che, nel piano delle fasi, si

rappresenta con un singolo punto nell’origine. Se 𝑏 = 0 le soluzioni sono della
forma 𝑋 = 𝑎𝑒 𝜆𝑡 , 𝑌 = 0 che ha una traiettoria, nel piano 𝑥 𝑦 lungo la semiretta
uscente dall’origine con direzione 𝒗 se 𝑎 > 0 e con direzione −𝒗 se 𝑎 < 0. La
soluzione andrà verso 0 (all’aumentare di 𝑡 ) se 𝜆 < 0 e sarà invece uscente da 0
se 𝜆 > 0. Analogamente si ha una traiettoria sulle due semirette con direzione
𝒘 e −𝒘 quando 𝑎 = 0 e 𝑏 ≠ 0.
Se entrambi 𝑎 e 𝑏 sono non nulli potremo trovare l’equazione della traiettoria

eliminando la variabile 𝑡 nelle equazioni che rappresentano la soluzione. Se
𝑋 = 𝑎𝑒 𝜆𝑡 , 𝑌 = 𝑏𝑒 𝜇𝑡 risulta
|𝑏| 𝜆 |𝑋 | 𝜇 𝑒 𝜆𝑡𝜇
= =1
|𝑎| 𝜇 |𝑌| 𝜆 𝑒 𝜇𝑡𝜆
da cui 𝜇
𝑌 = 𝑘|𝑋 | 𝜆
con 𝑘 costante arbitraria.
sella Se i segni di 𝜆 e 𝜇 sono opposti, si ottiene una configurazione chiamata sella (si
veda figura). Lungo l’autovettore con autovalore negativo ci sarà convergenza
verso l’origine, ma questa convergenza è instabile in quanto ogni altra curva
tenderà invece a essere deviata e a tendere asintoticamente verso la direzione
dell’autovettore con autovalore positivo.
1
1
-2 -1 1 2 -2 -1 1 2
-1
-1
(a) sella (instabile)

(b) nodo stabile
1
1
-1 1 -1 1 2
-1
-1
(c) nodo improprio stabile -2

Figura 9.3:
(d) stella stabile
1
(interagisci) (interagisci)
1
-2 -1 1 2
-2 -1 1 2
-1 (interagisci) (interagisci)
-1
-2
(e) fuoco stabile

(f) centro (stabile)
(interagisci) (interagisci)
Se 𝜆 e 𝜇 sono entrambi negativi si ha un nodo stabile in cui tutte le curve nodo stabile
convergono verso l’origine (soluzione attrattiva). Se invece 𝜆 e 𝜇 sono entrambi
positivi le curve saranno percorse in senso inverso e saranno uscenti dall’origine:
si avrà allora un nodo instabile. nodo instabile
Se gli autovalori sono coincidenti 𝜆 = 𝜇 e se la matrice è diagonalizzabile allora

la matrice è diagonale, tutti i vettori sono autovettori quindi in ogni direzione c’è
una traiettoria rettilinea. La configurazione si chiama stella (stabile o instabile a stella
seconda del segno negativo o positivo).
Se gli autovalori sono coincidenti 𝜆 = 𝜇 e la matrice non è diagonalizzabile

consideriamo l’autovettore (unico) 𝒖 con 𝐴𝒖 = 𝜆𝒖 e prendiamo un qualunque
vettore 𝒘 indipendente da 𝒖 . Allora si avrà
𝐴𝒘 = 𝛼𝒖 + 𝛽𝒘.
Certamente 𝛼 ≠ 0 altrimenti 𝒘 sarebbe un autovettore e la matrice sarebbe

𝛽
diagonalizzabile. Consideriamo allora 𝒗 = 𝒘/𝛼 cosicché si ha 𝐴𝒗 = 𝒖 + 𝛼 𝒘 .
Nella base 𝒖, 𝒗 la matrice 𝐴 diventa triangolare, e sulla diagonale troviamo
𝛽 𝛽
i valori 𝜆 e 𝛼 . Ma allora 𝛼 = 𝜆 in quanto sulla diagonale abbiamo solo gli
autovalori. Dunque se 𝑋 , 𝑌 sono le coordinate nel sistema 𝒖, 𝒗 , il sistema di
equazioni diventa: (
𝑋 0 = 𝜆𝑋 + 𝑌
𝑌 0 = 𝜆𝑌.
Dalla seconda equazione si ottiene quindi 𝑌 = 𝑎𝑒 𝜆𝑡 con 𝑎 ∈ ℝ costante arbitraria

e sostituendo nella prima si ottiene l’equazione
𝑋 0 − 𝜆𝑋 = 𝑎𝑒 𝜆𝑡
che può essere risolta trovando una seconda costante arbitraria 𝑏 ∈ ℝ e
𝑋 = (𝑎𝑡 + 𝑏)𝑒 𝜆𝑡 .
Se 𝑎 = 0 una traiettoria con 𝑌 = 0 cioè nella direzione dell’unico autovettore. Se

𝜆 < 0 tale traiettoria sarà convergente a 0 altrimenti sarà divergente. Se 𝑎 ≠ 0
possiamo eliminare 𝑡 ponendo:
1 𝑌
𝑡= ln
𝜆 𝑎
e quindi
𝑎 𝑌 𝑌 𝑌 𝑌 𝑏

𝑋= ln + 𝑏 = ln + 𝑌.
𝜆 𝑎 𝑎 𝜆 𝑎 𝑎
Studiando il grafico di questa funzione si ottengono qualitativamente le curve
nodo improprio
disegnate in figura: la configurazione si chiama nodo improprio. Come per i nodi
le traiettorie convergono all’origine se 𝜆 < 0 e divergono se 𝜆 > 0.
Proviamo a trattare il caso, più interessante, degli autovalori complessi. Se la

matrice è a coefficienti reali gli autovalori, quando non reali, saranno certamente
complessi coniugati:
𝜆 = 𝛼 − 𝑖𝛽, 𝜇 = 𝛼 + 𝑖𝛽
con 𝛼, 𝛽 ∈ ℝ, 𝛽 ≠ 0.
Sia 𝒗 + 𝑖𝒘 un autovettore complesso relativo all’autovalore 𝛼 − 𝑖𝛽 . Allora si

ha
𝐴𝒗 + 𝑖𝐴𝒘 = 𝐴(𝒗 + 𝑖𝒘) = (𝛼 − 𝑖𝛽)(𝒗 + 𝑖𝒘) = 𝛼𝒗 + 𝛽𝒘 + 𝑖(−𝛽𝒗 + 𝛼𝒘).
Uguagliando parte reale e parte immaginaria si trova
𝐴𝒗 = 𝛼𝒗 + 𝛽𝒘, 𝐴𝒘 = −𝛽𝒗 + 𝛼𝒘.
A questo punto non è difficile verificare che 𝒗 − 𝑖𝒘 è un autovettore relativo

all’autovalore coniugato 𝛼 + 𝑖𝛽 . Visto che 𝒗 ± 𝑖𝒘 sono due autovettori con
Si
potrebbe osservare che la matrice autovalori distinti sicuramente sono vettori indipendenti. Dunque anche 𝒗 e 𝒘
𝛼 −𝛽

𝛽 𝛼
è la matrice che rappresenta la (che si ottengono come multipli di somma e differenza) sono vettori, stavolta
moltiplicazione complessa per il numero reali indipendenti. Se 𝑋 , 𝑌 sono le coordinate nella base 𝒗 , 𝒘 , l’equazione
𝛼 + 𝑖𝛽 . Dunque chiamando 𝑍 = 𝑋 + 𝑖𝑌 il differenziale diventa: (
sistema si potrebbe scrivere nella forma
𝑋 0 = 𝛼𝑋 − 𝛽𝑌
𝑍0 = (𝛼+𝑖𝛽)𝑍 e si potrebbe quindi osser-
vare immediatamente che la soluzione 𝑌 0 = 𝛽𝑋 + 𝛼𝑌.
deve essere della forma 𝑍 = 𝑐𝑒 (𝛼+𝑖𝛽)𝑡
con 𝑐 costante complessa. Ponendo poi Si ha allora
𝑐 = 𝜌𝑒 𝑖𝜃 si ottiene il risultato.
𝑋 00 = 𝛼𝑋 0 − 𝛽𝑌 0 = 𝛼𝑋 0 − 𝛽(𝛽𝑋 + 𝛼𝑌)
da cui, usando 𝛽𝑌 = 𝛼𝑋 − 𝑋 0 possiamo eliminare la variabile 𝑌 e ottenere una
equazione del secondo ordine in 𝑋 :
𝑋 00 = 𝛼𝑋 0 − 𝛽2 𝑋 − 𝛼(𝛼𝑋 − 𝑋 0) = 2𝛼𝑋 0 − (𝛼 2 + 𝛽2 )𝑋
ovvero
𝑋 00 − 2 𝛼𝑋 0 + (𝛼2 + 𝛽 2 )𝑋 = 0.
Risolvendo questa equazione del secondo ordine ci si accorge che le radici del
polinomio caratteristico sono proprio 𝛼 ± 𝑖𝛽 e quindi le soluzioni si scrivono
nella forma
𝑋 = 𝑒 𝛼𝑡 (𝑎 cos 𝛽𝑡 + 𝑏 sin 𝛽𝑡)
da cui
𝛽𝑌 = 𝛼𝑋 − 𝑋 0
= 𝛼𝑒 𝛼𝑡 (𝑎 cos 𝛽𝑡 + 𝑏 sin 𝛽𝑡)
− 𝛼𝑒 𝛼𝑡 (𝑎 cos 𝛽𝑡 + 𝑏 sin 𝛽𝑡) − 𝑒 𝛼𝑡 (−𝛽𝑎 sin 𝛽𝑡 + 𝑏𝛽 cos 𝛽𝑡)
= 𝛽𝑒 𝛼𝑡 (𝑎 sin 𝛽𝑡 − 𝑏 cos 𝛽𝑡).
√
𝑎
Dunque, ponendo 𝜌 = 𝑎 2 + 𝑏 2 e scegliendo 𝜃 tale che cos 𝜃 = 𝜌 e sin 𝜃 = − 𝜌𝑏 ,
si ha (
𝑋 = 𝜌𝑒 𝛼𝑡 cos(𝛽𝑡 + 𝜃),
𝑌 = 𝜌𝑒 𝛼𝑡 sin(𝛽𝑡 + 𝜃).
Se 𝛼 ≠ 0 le traiettorie corrispondenti formano delle spirali ellittiche che si
avvitano nella direzione che porta il vettore 𝒗 verso il vettore 𝒘 . Se 𝛼 < 0 le
spirali convergono verso l’origine del sistema: avremo un fuoco stabile. Se 𝛼 > 0 fuoco stabile
le orbite divergono chiameremo la configurazione un fuoco instabile. Se 𝛼 = 0 le
traiettorie sono delle ellissi concentriche, le soluzioni sono quindi periodiche e fuoco instabile
la configurazione si chiama centro. centro
Se almeno uno dei due autovalori è nullo il comportamento del sistema è

degenere, si hanno delle soluzioni banali che non andremo a investigare.
matrice esponenziale
Per risolvere, in astratto, il sistema 𝑛 × 𝑛 del primo ordine, lineare omogeneo a

coefficienti costanti
𝒖 0 = 𝐴𝒖
introduciamo le seguenti nozioni.
Sia 𝐴 una matrice quadrata 𝑛 × 𝑛 . Definiamo la norma (norma operatoriale) di

𝐴 come segue:
k𝐴k = sup |𝐴𝒗|
|𝒗|≤ 1
q
dove |𝒗| = 𝑣 12 + · · · + 𝑣 𝑛2 è l’usuale norma del vettore 𝒗 ∈ ℝ𝑛 . Osserviamo
che 𝒗 ↦→ 𝐴𝒗 è una funzione continua e che {𝒗 : |𝒗| ≤ 1} è un insieme compatto,
dunque il sup nella definizione è in realtà un max.
Per le proprietà del sup si ha:
|𝐴𝒗| ≤ k𝐴k |𝑣| e k𝐴𝐵k ≤ k𝐴k k𝐵k.
Dunque possiamo affermare il valore assoluto di ogni elemento di una matrice

si stima con la norma della matrice: 𝐴 𝑖𝑗 ≤ k𝐴k , infatti:

𝐴 𝑖𝑗 = (𝐴𝒆 𝑗 )𝑖 ≤ 𝐴𝑒 𝑗 ≤ k𝐴k

(dove 𝒆 𝑗 è il 𝑗 -esimo vettore della base canonica di ℝ𝑛 ).
Se 𝐴 𝑘 è una successione di matrici, diremo che 𝐴 𝑘 → 𝐴 se ogni elemento della

matrice 𝐴 𝑘 converge al corrispondente elemento della matrice 𝐴: (𝐴 𝑘 )𝑖𝑗 → 𝐴 𝑖𝑗 .
Questo corrisponde a considerare la matrice 𝑛 × 𝑛 come un vettore dello spazio
2
ℝ(𝑛 ) .
Se 𝐴(𝑡) è una funzione a valori matrici (ovvero una matrice i cui elementi sono
funzioni di 𝑡 ), si potrà farne la derivata come si fa per le funzioni vettoriali:
(𝐴0(𝑡))𝑖𝑗 = (𝐴 𝑖𝑗 (𝑡))0 cioè componente per componente. Le usuali regole per le
derivate valgono anche per le matrici, in particolare non è difficile verificare (si
espliciti la definizione del prodotto di matrici) che
(𝐴(𝑡)𝐵(𝑡))0 = 𝐴0(𝑡)𝐵(𝑡) + 𝐴(𝑡)𝐵0(𝑡)
dove, puntualizziamo, è importante mantenere i prodotti nell’ordine giusto, in

quanto il prodotto di matrici può non essere commutativo.
Se 𝐴 è una matrice quadrata, si definisce la matrice potenza 𝐴 𝑘 per ogni 𝑘

naturale, mediante le proprietà
𝐴0 = 𝐼, 𝐴 𝑘+1 = 𝐴 𝑘 𝐴.
(se 𝐴 è invertibile si possono definire anche le potenze negative 𝐴−𝑘 = (𝐴−1 ) 𝑘 =

(𝐴 𝑘 )−1 ).
Definiamo allora la matrice esponenziale di 𝐴:

∞
𝐴𝑘
𝑒𝐴 =
X
.
𝑘=0
𝑘!
Per dare significato a questa definizione dobbiamo verificare che la serie appena
scritta sia convergente. Cioè dobbiamo verificare che per ogni coppia di indici
𝑖𝑗 sia convergente la serie numerica:
∞ (𝐴 𝑘 )
X 𝑖𝑗
.
𝑘=0
𝑘!
Per quanto detto prima sappiamo che (𝐴 𝑘 )𝑖𝑗 ≤ 𝐴 𝑘 ≤ k𝐴k 𝑘 . Dunque la serie

in questione è assolutamente convergente in quanto il suo valore assoluto si

stima con la serie

∞
X k𝐴k 𝑘
= 𝑒 k𝐴k
𝑘=0
𝑘!
che è convergente. La definizione della matrice 𝑒 𝐴 è dunque ben posta e si ha

𝐴
𝑒 ≤ 𝑒 k𝐴k .
Teorema 9.38 (proprietà dell’esponenziale matrice). Siano 𝐴 e 𝐵 matrici quadrate

𝑛 × 𝑛 e 𝑡 uno scalare. Valgono le seguenti proprietà:
1. 𝑒 0 = 𝐼 (dove 0 è la matrice nulla 𝑛 × 𝑛 ed 𝐼 è la matrice identità con le stesse

dimensioni);
2. se 𝐴𝐵 = 𝐵𝐴 allora 𝑒 𝐴 𝐵 = 𝐵𝑒 𝐴 ;
3. (𝑒 𝑡𝐴 )0 = 𝐴𝑒 𝑡𝐴 ;
4. 𝑒 −𝐴 = (𝑒 𝐴 )−1 (in particolare la matrice esponenziale è sempre invertibile);
5. se 𝒖(𝑡) è una funzione a valori in ℝ𝑛 che soddisfa l’equazione differenziale
𝒖 0(𝑡) = 𝐴𝒖(𝑡) allora 𝒖(𝑡) = 𝑒 𝑡𝐴 𝒖(0);
6. se 𝐴𝐵 = 𝐵𝐴 allora 𝑒 𝐴+𝐵 = 𝑒 𝐴 𝑒 𝐵 ;
7. se 𝐴 è invertibile allora 𝑒 𝐴𝐵𝐴 = 𝐴𝑒 𝐵 𝐴−1 ;
−1
8. se 𝐴 è la matrice diagonale 𝐴 = diag(𝜆1 , . . . , 𝜆𝑛 ), allora 𝑒 𝐴 è pure una matrice

diagonale con 𝑒 𝐴 = diag(𝑒 𝜆1 , . . . , 𝑒 𝜆𝑛 );
9. se 𝐴 è una matrice triangolare con la diagonale nulla (cioè 𝐴 𝑖𝑗 = 0 se 𝑖 ≥ 𝑗 )
𝑘
allora 𝑒 𝐴 = 𝑛𝑘=0 𝐴𝑘 ! (basta sommare i primi 𝑛 + 1 termini);
P
10. se 𝐵 è una matrice triangolare (cioè 𝐵 𝑖𝑗 = 0 se 𝑖 > 𝑗 ) allora 𝐵 = 𝐷 + 𝐴 con
𝐷 matrice diagonale e 𝐴 matrice triangolare con la diagonale nulla e quindi
𝑒 𝐵 = 𝑒 𝐷 𝑒 𝐴 si può calcolare riconducendosi ai punti precedenti.
Dimostrazione. 1. Per quanto riguarda 𝑒 0 osserviamo che per definizione 00 = 𝐼

mentre 0 𝑘 = 0 se 𝑘 > 0. Dunque direttamente dalla definizione si ottiene 𝑒 0 = 𝐼 .
2. Se 𝐴𝐵 = 𝐵𝐴 osserviamo che si ha anche 𝐴 𝑘 𝐵 = 𝐵𝐴 𝑘 (la matrice 𝐵 commuta

con ogni fattore del prodotto 𝐴 𝑘 ). Dunque:
𝑁 𝑁
X 𝐴𝑘 X 𝐴𝑘
𝐵=𝐵
𝑘=0
𝑘! 𝑘=0
𝑘!
e passando al limite 𝑁 → ∞ si ottiene 𝑒 𝐴 𝐵 = 𝐵𝑒 𝐴 .
3. Per calcolare la derivata di 𝑒 𝑡𝐴 vogliamo dimostrare che la serie che definisce

𝑒 𝑡𝐴 converge totalmente quando 𝑡 varia in un qualunque intervallo limitato.
Poniamo allora 𝑡 ∈ [−𝑀, 𝑀]. Si ha:
(𝑡𝐴) 𝑘 |𝑡 | 𝑘 𝐴 𝑘 𝑀 𝑘 k𝐴k 𝑘

sup = sup ≤
𝑡∈[−𝑀,𝑀] 𝑘! 𝑡∈[−𝑀,𝑀] 𝑘! 𝑘!
la cui serie è convergente qualunque sia 𝑀 ∈ ℝ. Dunque la serie che definisce

𝑒 𝑡𝐴 è una serie di funzioni continue e derivabili che converge totalmente su ogni
intervallo limitato. Possiamo quindi derivare la serie termine a termine:

∞
((𝑡𝐴) 𝑘 )0 ∞
𝑘𝑡 𝑘−1 𝐴 𝑘 ∞ 𝑘−1 𝑘−1
𝑡 𝐴
(𝑒 𝑡𝐴 )0 = = 𝐴𝑒 𝑡𝐴 .
X X X
= =𝐴
𝑘=0
𝑘! 𝑘=1
𝑘! 𝑘=1
(𝑘 − 1)!
4. Dimostriamo ora che 𝑈(𝑡) = 𝑒 𝑡𝐴 𝑒 −𝑡𝐴 = 𝐼 per ogni 𝑡 . Si ha:
𝑈 0(𝑡) = 𝐴𝑒 𝑡𝐴 𝑒 −𝑡𝐴 + 𝑒 𝑡𝐴 (−𝐴)𝑒 −𝑡𝐴 = 𝐴𝑒 𝑡𝐴 𝑒 −𝑡𝐴 − 𝐴𝑒 𝑡𝐴 𝑒 −𝑡𝐴 = 0
(𝐴𝑒 𝑡𝐴 = 𝑒 𝑡𝐴 𝐴 in quanto 𝐴 e 𝑡𝐴 commutano). Dunque 𝑈 0(𝑡) = 0 cioè 𝑈(𝑡) è

costante ovvero 𝑈(𝑡) = 𝑈(0). Ma 𝑈(0) = 𝐼 in quanto 𝑒 0 = 𝐼 e quindi 𝑈(𝑡) = 𝐼
per ogni 𝑡 .
5. Prendiamo l’equazione 𝒖 0 = 𝐴𝒖 , moltiplicando a sinistra per 𝑒 −𝑡𝐴 l’equazione

diventa 𝑒 −𝑡𝐴 𝒖 0 − 𝑒 −𝑡𝐴 𝐴𝒖 = 0 cioè (𝑒 −𝑡𝐴 𝒖)0 = 0. Questo significa che la funzione
𝑒 −𝑡𝐴 𝒖 = 𝑐 costante e moltiplicando a sinistra per 𝑒 𝑡𝐴 si ottiene dunque 𝒖 = 𝑒 𝑡𝐴 𝑐
come volevasi dimostrare.
6. Per dimostrare la proprietà 𝑒 𝐴+𝐵 = 𝑒 𝐴 𝑒 𝐵 consideriamo la quantità 𝑈(𝑡) =

𝑒 −𝑡(𝐴+𝐵) 𝑒 𝑡𝐴 𝑒 𝑡𝐵 . Se dimostriamo che 𝑈 è costante, visto che 𝒖(0) = 𝐼 si avrà anche
𝑈(1) = 𝐼 che è equivalente a quanto vogliamo dimostrare. Dunque verifichiamo
che la derivata è nulla, sfruttando l’ipotesi 𝐴𝐵 = 𝐵𝐴 che ci permette di far
commutare i prodotti:
𝑈 0(𝑡) = −(𝐴 + 𝐵)𝑒 −𝑡(𝐴+𝐵) 𝑒 𝑡𝐴 𝑒 𝑡𝐵 + 𝑒 −𝑡(𝐴+𝐵) 𝐴𝑒 𝑡𝐴 𝑒 𝑡𝐵 + 𝑒 −𝑡(𝐴+𝐵) 𝑒 𝑡𝐴 𝐵𝑒 𝑡𝐵

= [−(𝐴 + 𝐵) + 𝐴 + 𝐵]𝑈(𝑡) = 0.
7. Se 𝐴 è invertibile allora (𝐴𝐵𝐴−1 ) 𝑘 = 𝐴𝐵𝐴−1 𝐴𝐵𝐴 . . . 𝐴𝐵𝐴−1 = 𝐴𝐵 𝑘 𝐴−1 .

Dunque nelle somme parziali della serie che definisce l’esponenziale 𝑒 𝐴𝐵𝐴
−1
si può raccogliere 𝐴 a sinistra e 𝐴−1 a destra e al centro rimane la serie che

definisce 𝑒 𝐵 .
8. Se la matrice 𝐴 è diagonale con 𝐴 𝑖𝑖 = 𝜆 𝑖 allora 𝐴 𝑘 risulta essere una matrice

diagonale con (𝐴 𝑘 )𝑖𝑖 = 𝜆 𝑖𝑘 . Dunque nella definizione di esponenziale 𝑒 𝐴 i
termini della serie sono tutte matrici diagonali, e sulla diagonale compare la
serie che definisce l’esponenziale 𝑒 𝜆𝑖 .
9. Se 𝐴 è una matrice triangolare con 𝐴 𝑖𝑗 = 0 quando 𝑖 ≥ 𝑗 , si osserva che 𝐴2

avrà degli zeri anche sopra la diagonale: (𝐴2 )𝑖𝑗 = 0 quando 𝑖 + 1 ≥ 𝑗 (si applichi
la definizione di prodotto, riga per colonna). Nelle moltiplicazioni successive
𝐴3 , 𝐴4 , . . . si aggiungerà sempre una diagonale di zeri finché la matrice non si
annulla completamente 𝐴𝑛 = 0. Dunque la serie che definisce 𝑒 𝐴 contiene solo
un numero finito di termini (i primi 𝑛 + 1) e può essere calcolata esplicitamente.
10. L’ultima proprietà è una osservazione che non richiede dimostrazione.
9.9 studio qualitativo delle soluzioni
Non sempre è possibile determinare esplicitamente le soluzioni di una equazio-

ne differenziale. Ci proponiamo quindi di trovare dei metodi per determinare
9.9 studio qualitativo delle soluzioni 421
Figura 9.4: Studio qualitativo dell’esem-

-5 -4 -3 -2 -1 1 2 3 4 5 6
pio 9.39.
-1
(interagisci)
alcune proprietà salienti delle soluzioni, senza doverle determinare esplici-

tamente. Considereremo unicamente equazioni del primo ordine in forma
normale:
𝑢 0(𝑥) = 𝑓 (𝑥, 𝑢(𝑥)) (9.42)
con 𝑓 : Ω ⊆ ℝ2 → ℝ.
Ricordiamo che se 𝑓 soddisfa la condizione di Cauchy-Lipschitz (definizio-

ne 9.15), in particolare se 𝑓 è di classe 𝐶 1 allora i grafici delle soluzioni massimali
dell’equazione differenziale (9.42) fibrano la regione Ω nel senso che per ogni
punto di Ω passa una unica soluzione massimale (teorema 9.16 di Cauchy-
Lipschitz e proposizione 9.20). Inoltre la proposizione 9.19 ci dice che le
soluzioni massimali escono da qualunque compatto contenuto in Ω ovvero
raggiungono sempre la frontiera di Ω.
Esempio 9.39. Dimostrare che il seguente problema di Cauchy

(
𝑢 0(𝑥) = (𝑢 2 (𝑥) − 1) · 𝑥 · sin 𝑥
𝑢(0) = 0
ammette una unica soluzione massimale 𝑢(𝑥) definita su tutto ℝ (dunque la soluzione
è globale).
Svolgimento. In questo caso si ha 𝑓 (𝑥, 𝑦) = (𝑦 2 − 1)𝑥 sin 𝑥 , che è una funzione

di classe ℂ1 su tutto Ω = ℝ2 . Vale dunque il teorema di esistenza ed unicità
delle soluzioni. Notiamo inoltre (per verifica diretta) che 𝑢0 (𝑥) = −1 e 𝑢1 (𝑥) = 1
sono soluzioni costanti dell’equazione differenziale (9.42) in quanto 𝑓 (𝑥, −1) =
𝑓 (𝑥, 1) = 0 per ogni 𝑥 ∈ ℝ (se 𝑥 rappresenta il tempo le soluzioni costanti si
chiamano anche stazionarie). Il grafico della soluzione 𝑢(𝑥) dunque non può
toccare i grafici delle due funzioni 𝑢0 = −1 e 𝑢1 = 1 e visto che 𝑢(0) = 0 e
che 𝑢 è una funzione continua significa che per ogni 𝑥 si ha −1 < 𝑢(𝑥) < 1.
Consideriamo ora il compatto 𝐾 𝑀 = [−𝑀, 𝑀] × [−1 , 1]. Sappiamo che la
soluzione massimale 𝑢(𝑥) del problema di Cauchy preso in considerazione
deve uscire da ogni compatto 𝐾 𝑀 . Visto però che 𝑢(𝑥) ∈ (−1 , 1) significa
che necessariamente il grafico della soluzione massimale 𝑢(𝑥) raggiunge i
due segmenti verticali 𝑥 = −𝑀 e 𝑥 = 𝑀 e dunque l’intervallo massimale di
esistenza contiene l’intervallo [−𝑀, 𝑀]. Siccome questo è vero per ogni 𝑀 ,
l’intervallo massimale di esistenza della soluzione è 𝐼 = ℝ e dunque la soluzione
è globale.
monotonia e punti critici delle soluzioni
Dopo aver determinato le zone di Ω su cui vale il teorema di esistenza e unicità, è

utile studiare il segno di 𝑓 . Infatti le soluzioni 𝑢(𝑥) dell’equazione differenziale
(9.42) saranno strettamente crescenti dove 𝑓 > 0, strettamente decrescenti dove
𝑓 < 0 e avranno un punto critico dove 𝑓 = 0.
Un primo caso notevole è il caso in cui 𝑓 si annulla su una retta orizzontale 𝑦 = 𝑐 .
In questo caso la funzione costante 𝑢(𝑥) = 𝑐 è una soluzione dell’equazione
differenziale (9.42). Inoltre (nell’ipotesi 𝑓 ∈ ℂ1 ) tale costante non può essere
attraversata dalle altre soluzioni dell’equazione differenziale.
È importante capire se le soluzioni dell’equazione differenziale attraversano
o no la curva { 𝑓 = 0}. Infatti questo ci permette di determinare il segno della
derivata 𝑢 0(𝑥) e quindi di ottenere importanti informazioni sull’andamento
della soluzione 𝑢(𝑥) (monotonia, massimi e minimi relativi...).
Più in generale è interessante capire quando una soluzione di una equazione
differenziale può attraversare una determinata curva.
Teorema 9.40. Sia 𝑢(𝑥) una soluzione dell’equazione differenziale (9.42) definita su
un intervallo 𝐼 e sia 𝑢0 (𝑥) una funzione qualunque definita su 𝐼 , di classe ℂ1 e tale che
il suo grafico sia interamente contenuto nel dominio Ω di definizione di 𝑓 . Supponiamo
che in un punto fissato 𝑥 0 interno ad 𝐼 si abbia 𝑢(𝑥 0 ) < 𝑢0 (𝑥 0 ) e supponiamo inoltre
che per ogni 𝑥 > 𝑥 0 si abbia 𝑢00 (𝑥) > 𝑓 (𝑥, 𝑢0 (𝑥)). Allora per ogni 𝑥 > 𝑥 0 si ha
𝑢(𝑥) < 𝑢0 (𝑥).
Analogamente se 𝑢(𝑥 0 ) > 𝑢0 (𝑥 0 ) e se per ogni 𝑥 si ha 𝑢00 (𝑥) < 𝑓 (𝑥, 𝑢0 (𝑥) risulterà
𝑢(𝑥) > 𝑢0 (𝑥) per ogni 𝑥 > 𝑥0 .
Risultati analoghi si hanno per 𝑥 < 𝑥 0 .
Dimostrazione. Supponiamo per assurdo che l’insieme 𝐽 = {𝑥 ∈ 𝐼 : 𝑥 ≥

𝑥0 e 𝑢(𝑥) = 𝑢0 (𝑥)} non sia vuoto. Tale insieme è chiuso ed inferiormente
limitato, quindi se non è vuoto, ammette minimo. Sia 𝑥¯ il minimo di 𝐽 . Si-
curamente 𝑥¯ > 𝑥 0 in quanto 𝑢( 𝑥) ¯ = 𝑢0 ( 𝑥)
¯ . Inoltre per ogni 𝑥 ∈ [𝑥0 , 𝑥[
¯ si ha
𝑢(𝑥) − 𝑢0 (𝑥) < 0 e quindi 𝑢 0( 𝑥)
¯ ≥ 𝑢00 ( 𝑥)
¯ (in quanto il rapporto incrementale
sinistro di 𝑦 − 𝑦0 è sempre positivo).
Questo è assurdo in quanto per ipotesi si ha invece 𝑢 0( 𝑥)
¯ = 𝑓 ( 𝑥,
¯ 𝑢( 𝑥))
¯ =
𝑓 ( 𝑥,
¯ 𝑢0 ( 𝑥))
¯ < 𝑢0 ( 𝑥)
0 ¯.
Se ad esempio 𝑢0 (𝑥) è una funzione il cui grafico è contenuto in { 𝑓 = 0} (cioé

𝑓 (𝑥, 𝑢0 (𝑥)) = 0) allora una soluzione 𝑢(𝑥) dell’equazione differenziale può
attraversare la curva 𝑢0 (𝑥) dall’alto verso il basso nei punti in cui 𝑢00 (𝑥) > 0 e
dal basso verso l’alto nei punti in cui 𝑢00 (𝑥) < 0.
Esempio 9.41. Mostrare che il seguente problema di Cauchy

(
𝑢 0 = 1 − 𝑥𝑢 3
𝑢(0) = 0
ammette una soluzione 𝑢(𝑥) definita su tutto ℝ.

9.9 studio qualitativo delle soluzioni 423
Svolgimento. Posto 𝑓 (𝑥, 𝑦) = 𝑥 𝑦 3 abbiamo che 𝑓 si annulla sul grafico della

√
funzione 𝑢0 (𝑥) = 1/ 3 𝑥 . Per 𝑥 > 0 la soluzione è crescente quando si trova al
di sotto della funzione 𝑢0 ed è decrescente quando si trova al di sopra. Inoltre
essendo 𝑢00 < 0 le soluzioni possono attraversare la funzione 𝑢0 (𝑥) solo passando
da sotto a sopra.
Sia 𝑢(𝑥) la soluzione del problema di Cachy in questione, definita su un

intervallo massimale 𝐼 . Il dato iniziale è (0 , 0) ∈ { 𝑓 > 0}. Dunque la soluzione
risulta essere strettamente crescente in un intorno di 0.
Vogliamo dimostrare innanzitutto che necessariamente la soluzione incontra

entrambi i rami del grafico di 𝑢0 (𝑥). Sia infatti 𝜖 > 0 sufficientemente piccolo
da appartenere all’intervallo 𝐼 di esistenza della soluzione e sia 𝛿 = 𝑢(𝜖).
Consideriamo il compatto 𝐾 = {(𝑥, 𝑦) : 𝜖/2 ≤ 𝑥 ≤ 1/𝛿 2 , 0 ≤ 𝑦 ≤ 1/𝑠 𝑞𝑟𝑡𝑥}. Il
punto (𝜖, 𝑢(𝜖)) è interno al compatto 𝐾 ma la soluzione deve uscire dal compatto
per un qualche 𝑥 > 𝜖 . La soluzione però non può toccare la retta 𝑦 = 0 in
quanto all’interno del compatto rimane sempre positiva e crescente. Non può
neanche toccare il segmento verticale 𝑥 = 1/𝛿 2 , 𝑦 ∈ [0 , 𝛿] in quanto 𝑢(𝜖) = 𝛿
e per 𝑥 > 0 la soluzione è strettamente crescente. Dunque necessariamente la
√
soluzione deve incontrare il grafico della funzione 𝑢0 (𝑥) = 1/ 𝑥 in un punto
𝑥¯ > 0.
Nel punto 𝑥 = 𝑥¯ la soluzione 𝑢(𝑥) attraversa la curva 𝑢0 (𝑥). Infatti in tale punto
𝑢 0( 𝑥)
¯ = 0 mentre 𝑢00 ( 𝑥)
¯ < 0. Dunque in un intorno destro di 𝑥¯ la soluzione si
trova al di sopra della curva 𝑢0 (𝑥) e quindi risulta essere decrescente (in 𝑥¯ la
soluzione presenta un massimo relativo).
Il Teorema 9.40 garantisce inoltre che la soluzione non può più riattraversare il
grafico della funzione 𝑢0 in quanto 𝑢00 < 0. Dunque la soluzione è decrescente e
limitata. Dunque (usando come al solito la proposizione 9.19) possiamo dedurre
che la soluzione massimale è definita per ogni 𝑥 > 0.
Un ragionamento analogo si fa per 𝑥 < 0 ottenendo l’esistenza globale della

soluzione.
Esempio 9.42. Dimostriamo che il problema di Cauchy

(
𝑢 0 = −𝑥(𝑢 3 − sin 𝑥)
𝑢(0) = 0
ammette una soluzione 𝑢(𝑥) definita su tutto ℝ.
Dimostrazione. Sia 𝑢(𝑥) la soluzione massimale del problema di Cauchy definita

su un intervallo massimale 𝐼 .
Mostriamo innanzitutto che |𝑢(𝑥)| < 2 per ogni 𝑥 ∈ 𝐼 . Infatti per 𝑥 > 0 sulla
curva 𝑢1 (𝑥) = 2 si ha 𝑓 (𝑥, 2) = −𝑥(8 − sin 𝑥) < −𝑥 < 0 = 𝑢10 (𝑥). Dunque per il
Teorema 9.40 la soluzione per 𝑥 > 0 non può mai attraversare la retta 𝑦 = 2.
Discorso analogo si fa per la retta 𝑦 = −2 e anche per 𝑥 < 0 mostrando che il
grafico della soluzione non può mai toccare le rette 𝑦 = 2 e 𝑦 = −2 né per 𝑥 > 0
né per 𝑥 < 0 e che quindi 𝑢(𝑥) risulta limitata (in realtà si può essere più precisi
e mostrare che |𝑢(𝑥)| ≤ 1).
A questo punto si applica, come al solito, il Teorema 9.19 ai compatti 𝐾 𝑀 =

[−𝑀, 𝑀] × [−2 , 2] mostrando che la soluzione deve avere esistenza globale.
teoremi di confronto
Teorema 9.43. Sia 𝐼 ⊆ ℝ un intervallo su cui sono definite due funzioni derivabili
𝑓 (𝑥) e 𝑔(𝑥). Siano 𝑥0 < 𝑥1 due punti di 𝐼 . Se 𝑓 (𝑥1 ) < 𝑔(𝑥1 ) e 𝑓 (𝑥 2 ) > 𝑔(𝑥 2 ) allora
esiste un punto 𝑥¯ ∈ (𝑥 1 , 𝑥 2 ) tale che 𝑓 ( 𝑥)
¯ = 𝑔( 𝑥)
¯ e 𝑓 0( 𝑥)
¯ ≥ 𝑔 0( 𝑥)
¯.
Teorema 9.44. Consideriamo due funzioni 𝑢(𝑥) e 𝑣(𝑥) soluzioni dei rispettivi problemi
di Cauchy ( (
𝑢 0(𝑥) = 𝑓 (𝑥, 𝑢(𝑥)) 𝑣 0(𝑥) = 𝑔(𝑥, 𝑣(𝑥))
𝑢(𝑥0 ) = 𝑢0 𝑣(𝑥 0 ) = 𝑣 0
su un intervallo 𝐼 che contiene il punto 𝑥 0 . Sia Ω ⊆ ℝ2 un sottoinsieme degli insiemi

di definizione di 𝑓 e 𝑔 tale che i grafici delle soluzioni 𝑢(𝑥) e 𝑣(𝑥) siano contenuti in Ω
al variare di 𝑥 ∈ 𝐼 . Supponiamo che per ogni (𝑥, 𝑦) ∈ Ω si abbia 𝑓 (𝑥, 𝑦) < 𝑔(𝑥, 𝑦).
Allora per ogni 𝑥 ∈ 𝐼 , 𝑥 > 𝑥 0 si ha 𝑢(𝑥) < 𝑣(𝑥) mentre per ogni 𝑥 ∈ 𝐼 , 𝑥 < 𝑥 0 si ha
𝑢(𝑥) > 𝑣(𝑥).
Teorema 9.45. Sia 𝑓 : (𝑥 0 , +∞) → ℝ una funzione di classe 𝐶 1 tale che il limite
lim 𝑓 0(𝑥) = ℓ
𝑥→+∞
esiste, finito o infinito. Se ℓ ≠ 0 allora 𝑓 non può avere un asintoto orizzontale per
𝑥 → +∞.
Listati A
python 3
Il seguente codice è scritto in python 3, un linguaggio di programmazione molto
semplice e pulito che permette, tra l’altro, di utilizzare diverse librerie utili per
il calcolo numerico e scientifico.
A.1 bisection.py
github
Vedi esempio 2.81.
1 def bisection(f, a, b, digits=10):
2 fa = f(a)
3 fb = f(b)
4 assert fb*fa <= 0
5 while 2 * 10**digits * (b-a) > 1:
6 c = (a+b)/2
7 fc = f(c)
8 if fc*fa < 0:
9 b = c
10 fb = fc
11 else:
12 a = c
13 fa = fc
14 return (a+b)/2
15
16 # la libreria decimal ci permette di effettuare calcoli su numeri
17 # con sviluppo decimale arbitrariamente lungo
18 from decimal import Decimal, getcontext
19 getcontext().prec = 110 # numero di cifre da utilizzare nei calcoli
20
21 # l’operatore lambda permette di definire una
22 # funzione senza dovergli dare un nome
23
24 x = bisection(lambda x: x*x-2, Decimal(0), Decimal(2), digits=100)
25 print("solution to x^2 = 2 {:.101}".format(x))
26
27 x = bisection(lambda x: x*x-3, Decimal(0), Decimal(2), digits=100)
28 print("solution to x^2 = 3: {:.101}".format(x))
29
30 x = bisection(lambda x: x*x-x-1, Decimal(0), Decimal(2), digits=100)
31 print("solution to x^2 = x+1: {:.101}".format(x))
32
33 x = bisection(lambda x: x*x*x*x*x - x - 1,
34 Decimal(0), Decimal(2), digits=100)
35 print("solution to x^5 - x = 1: {:.100}".format(x))
426 A Listati
A.2 series.py
Vedi esempio 3.11.

1 """
2 Calcola la somma della serie 1/k^2 con un errore prefissato
github 3 """
4
5 err = 0.5E-6 # errore al di sotto della sesta cifra decimale
6 S = 0.0
7 k = 1
8 while k < 1/err:
9 S += 1.0/k**2
10 k += 1
11 print("somma della serie 1/k^2: {:.7}".format(S))
A.3 compute_e.py
Vedi tabella 3.1.

1 # la libreria decimal ci permette di effettuare calcoli su numeri
2 # con sviluppo decimale arbitrariamente lungo
github 3 from decimal import Decimal, getcontext
4 def compute_e(digits):
5 sum = Decimal(0)
6 k = 0
7 k_factorial = 1
8 while k_factorial * k < 10**digits:
9 sum += Decimal(1)/Decimal(k_factorial)
10 k += 1
11 k_factorial *= k
12 return sum
13
15 print("e: {:.1001}".format(compute_e(1100)))
A.4 compute_pi.py
Vedi esercizio 5.79.

1 from decimal import Decimal, getcontext
2
github 3 def compute_pi(digits):
4 sum = Decimal(0)
5 k = 0
6 factor = Decimal(1)/2
7 while 3*(2*k+1)*4**k < 4*10**digits:
8 sum += factor / (2*k+1)
9 factor *= Decimal(2*k+1) / (2*k+2) / 4
10 k += 1
11 return sum * 6
A.5 Mandelbrot.py 427
12
14 print("pi: {:.1001}".format(compute_pi(1100)))
A.5 Mandelbrot.py
github
Vedi figura 8.8.
1 # per funzionare anche con python2
2 from __future__ import print_function
3
4 # la libreria numerica numpy ci permette di fare velocemente
5 # operazioni su matrici di numeri complessi
6 import numpy as np
7
8 xres, yres = 6400, 4800
9 iterations = 40
10
11 # cx e’ una suddivisione dell’intervallo [-2,1] in xres punti
12 cx = 3.0*np.arange(xres)/xres - 2.0
13 # cy e’ una suddivisione dell’intervallo [-1,1] in yres punti
14 cy = (2.0*np.arange(yres)/yres - 1.0) * 3.0 * yres / 2.0 / xres
15 # c e’ una matrice yres x xres contenente i numeri complessi
16 # con parte reale cx e parte immaginaria cy.
17 c = cx[np.newaxis,:] + 1j * cy[:,np.newaxis]
18
19 # z e’ una matrice di numeri complessi, inizialmente nulli, su cui
20 # faremo l’iterazione con ognuno dei dati iniziali
21 # presi dalla matrice c
22 z = np.zeros((yres, xres), dtype=np.complex)
23 for n in range(iterations):
24 print("{}% completed".format(n*100//iterations))
25 z = z*z + c
26
27 # consideriamo l’insieme dei punti che dopo iterations iterazioni
28 # non sono usciti dal disco di raggio 2.
29 mandelbrot = np.logical_not(np.abs(z) < 2.0)
30
31 # utilizziamo la libreria imageio che ci permette di
32 # trasformare facilmente una matrice in una immagine
33 from imageio import imwrite
34 filename = ’mandelbrot.png’
35 print("saving image to", filename)
36
37 # converti la matrice booleana in interi a 8 bit
38 image = mandelbrot * np.uint8(255)
39 # salva l’uimmagine su file
40 imwrite(filename, image)
428 A Listati
A.6 Koch.py
github
Vedi figura 7.4.
1 import sys
2 from math import *
3
4 def affine_koch(t, s, iter):
5 """
6 t, s are affine (triangular) coordinates
7 @return positive if inside, negative if outside
8 """
9 if t+s > 1: return 1.
10 if t<=0 or s<=0: return -1.
11 if 3*(t+s) < 2: return -.5
12 if iter <= 0: return 0.
13 if 3*s >= 2: return affine_koch(3*t, 3*s-2, iter-1)
14 if 3*t >= 2: return affine_koch(3*t-2, 3*s, iter-1)
15 if 3*t <= 1: return affine_koch(3*t-2+3*s, 2-3*s, iter-1)
16 return affine_koch(2-3*t,3*s-2+3*t, iter-1)
17
18 RAD_3 = sqrt(3)
19
20 def koch(x, y, iter):
21 return affine_koch(1 - x - y/RAD_3, x - y/RAD_3, iter)
22
23 def pbm_image(out, xres, yres):
24 iter = 1 + log(max(xres, yres))/log(3)
25 out.write("P1\n")
26 out.write("# koch PBM by Emanuele Paolini\n")
27 out.write("{} {}\n".format(xres, yres))
28 for y in range(yres):
29 for x in range(xres):
30 k = koch(x*1./xres, (yres-1-y)*1./xres, iter)
31 out.write(’0’ if k<=0 else ’1’)
32 out.write("\n")
33
34 xres = 6400
35 yres = 2000
36 filename = "koch.pbm"
37
38 if len(sys.argv) >= 2:
39 filename = sys.argv[1]
40
41 if len(sys.argv) == 4:
42 xres, yres = map(int,argv[2:])
43
44 print("Writing to file: {}\n".format(filename))
45 with open(filename, "w") as out:
46 pbm_image(out, xres, yres);
A.7 Fourier.py 429
A.7 Fourier.py
Vedi figura 7.3

1 from sympy import *
2 from sympy.plotting import plot
3 # se usi jupyter: %matplotlib inline github
4
5 def e(k):
6 """
7 k-esimo elemento della base hilbertiana
8 """
9 k = Integer(k)
10 if k == 0:
11 return lambda x: 1/sqrt(2*pi)
12 elif k % 2 == 0:
13 return lambda x: cos(k/2 * x)/sqrt(pi)
14 else:
15 return lambda x: sin((k+1)/2 * x)/sqrt(pi)
16
17 def f(g):
18 """
19 integra g contro la funzione che vale -1
20 in (-pi,0) e 1 in (0,pi)
21 """
22 x = symbols("x")
23 return integrate(g(x), (x, 0, pi)) - integrate(g(x), (x, pi, 2*pi))
24
25 def fourier(f, n):
26 """
27 calcola l’n-esimo polinomio trigonometrico approssimante f
28 """
29 return lambda x: sum([f(e(k)) * e(k)(x) for k in range(n+1)])
30
31
32 """
33 Calcola e disegna lo sviluppo di Fourier
34 """
35 x = symbols(’x’)
36 n = 61
37 print("polinomio trigonometrico di ordine {}".format(n))
38 pol = fourier(f,n)(x)
39 print(pol)
40 fig = plot(pol, (x, 0, 2*pi))
41 if hasattr(fig, "savefig"):
42 fig.savefig("fourier.png", dpi=600)
43 else:
44 fig.save("fourier.png")
Bibliografia
[1] R. Courant and F. John. Introduction to calculus and analysis. Interscience

Publishers, 1965.
[2] E. Giusti. Analisi matematica 1. Bollati Boringhieri, 2012.
[3] P. Marcellini and C. Sbordone. Analisi matematica uno. Liguori Editore, 1998.
[4] C. D. Pagani and S. Salsa. Analisi matematica Volume 1. Zanichelli, 1993.
[5] E. Paolini. Appunti di logica. http://pagine.dm.unipi.it/paolini/
didattica/appunti/logica.pdf.
[6] W. Rudin. Analisi matematica. McGraw-Hill, 1991.

(download)
Indice analitico
!, 25 problema di Basilea, 392

!!, 26 339
+∞, −∞, 52 𝜋, iv abeliano, 21
𝐴𝐶 , 11 cifre decimali, 228 additività, 276
𝐴[𝑥], 29 definizione, 148 additività dell’integrale, 244
𝐴𝐵 , 7 formula di addizione, 61
𝐶 ∞ , 202 Gregory-Leibniz, formule della
𝐶 𝑘 , 202 227, 327 trigonometria, 146
𝑂 grande, 214 irrazionalità, 288 aleph, 18
𝑍𝐹 , 11 prodotto di Wallis, 289 algoritmo
𝑍𝐹𝐶 , 11 𝜓 , iv calcolo della radice
k·k 𝐶 0 , 312 exp 𝑧 , 139 𝑛 -esima, 346
ℂ, 60 sinh, cosh, 152 di Erone, 346
Γ funzione di Eulero, 280 𝜌, iv di Euclide, 161
Im 𝑧 , 61 settcosh, 154 AM, 197
settsinh, 154 anello, 24
𝕂 [𝑥], 29
𝜎, iv antiderivata, 252
Re 𝑧 , 61
∼, 96 aperto, 300
Σ, iv
sin, 146 approssimazione
ℤ, 24
sviluppo in serie, 146 di exp, 143
ℵ0 , 18
argomento, 155
𝛼, iv sinh,
√ 152
2 arrotondamento, 37
≈, 41
cifre decimali, 108 asintoticamente equivalenti,
ℝ̄, 52
sviluppo in serie, 226 96
𝛽 , iv
sup, 35 asintoto
𝜒, iv
𝜏, iv obliquo, 182
cos, 146
definizione, 148 orizzontale, 182
sviluppo in serie, 146
tg 𝑥 , 151 verticale, 182
cosh, 152
asintoto obliquo, 206
𝛿, iv tgh, 153
asintoto orizzontale e obliquo,
𝜀, iv 𝜃 , iv
182
exp 𝜁
assioma
approssimazione, 143 di Riemann, 339
della scelta, 11
𝛾, iv 𝑒 , 92
di infinito, 21
, 96 cifre decimali, 144
associatività, 21
inf, 35 è irrazionale, 144
assolutamente
∞, 63 𝑒 ∉ ℚ, 144
integrabile, 281
𝜆, iv 𝑓 (𝑗) , 202
assolutamente convergente,
, 96 𝑛 !, 25
124
P(·), 5 𝑛 !!, 26
𝜇, iv 𝑜 piccolo, 214 Banach
𝜈, iv ℕ , 22 spazio di, 305
esistenza e unicità loca-
𝜔, iv teorema delle contrazioni,
le
𝜑, iv, 367 , 308
per i sistemi del primo
𝜋 ordine base
hilbertiana, 329 centro, 417 ordinamento, 21
Basilea Cesàro, 106 uniforme, 203
problema di, 339 Chebyshev continuo, 21
Bernoulli, 91 polinomio di, 332 ipotesi del, 18
equazione di, 385 chiuso, 300 contrazione, 308
Bessel chiusura, 301 controimmagine
disuguaglianza di, 329 cifre insieme, 8
biettiva, 8 𝜋
√, 228 convergente, 86
bigettiva, 8 2, 108 convergenza
binomiale 𝑒 , 144 assoluta
serie, 222 Clairaut integrale, 281
binomiale centrale, 289 equazione di, 385 condizionata di una serie,
binomio classe di equivalenza, 6 127
coefficienti, 32 codominio, 7 dominata, 317
potenza, 32 coefficienti binomiali, 32
bisezione incondizionata, 125
coefficienti di Fourier, 333
metodo di, 107 puntuale, 311
combinazioni baricentriche,
Bolzano-Weierstrass, 101 totale, 325
196
uniforme, 309
commutatività, 21
Caccioppoli uniforme di una serie,
compatto, 303
perimetro, 110 323
complessi
Renato, 110 convergenza dominata, 317
addizione, 61
teorema delle contrazioni, convergenza dominata
coniugio, 61
308 uniforme, 316
modulo, 62
cambio convesso, 191
moltiplicazione, 61
di variabile, 255 coordinate
unitari, 155
cambio di variabile, 276 vettore, 20
campana completamento del quadrato,
57 coordinate, componenti,
di Gauss, 271 vettore, 20
campo ordinato, 46 completezza, 305
di ℝ, 306 coppia, 5
campo ordinato continuo, coseno
46 di 𝐶 0 ([𝑎, 𝑏]), 312
completo, 305 iperbolico, 152
Cantor
Dedekind, 21 costante, 41
insieme di, 124, 343
componenti di Lipschitz, 203
primo metodo diagonale,
vettore, 20 di Nepero, 92
50
condizione iniziale, 375 crescente, 41
carabineri
teorema dei, 83 condizione necessaria per la crescita esponenziale, 89
carattere convergenza, 113 criterio
dell’integrale, 273 confronto tra limiti, 83 del confronto asintotico,
di una serie, 111, 114 congergenza 117
di una serie a termini integrale, 272 del confronto per serie,
positivi, 116 congiunzione logica, 1 116
di una successione, 86 coniugato, 61 del rapporto alla Cesàro,
cardinalità, 9 contare, 11 106
Cauchy, 199 continua, 67, 302 del rapporto per le
successione di, 304 continua nel punto, 67 successioni, 95
Cauchy-Schwarz continuità, 67 del rapporto per serie,
disuguaglianza di, 199, delle serie di potenze, 118
297 137 della radice, 117
della radice per di Cauchy-Schwarz, 199, lineare omogenea,
successioni, 96 297 374
di condensazione di di Jensen, 196, 250 lineari di ordine 𝑛 ,
Cauchy, 120 di Young, 198 400
di integrabilità, 238 media aritmetica media non omogenea, 400
di Leibniz, 126 geometrica, 197 omogenea associata,
di monotonia, 184 triangolare 400
curva di Köch, 343, 344 inversa, 295 ordinaria, 371
disuguaglianza di ordine, 371
De Giorgi Cauchy-Schwarz, sistema, 372
Ennio, 110 199 funzionale, 371
de l’Hospital, 201 disuguaglianza di Young, ricorsiva
decomposizione 297 lineare, 363
dei polinomi complessi, divergente, 86 equipotenza, 9
168 divergenza equivalenza
in fratti semplici integrale, 272 asintotica, 96
complessi, 265 divisione, 46 Erone
decrescente, 41 divisione tra polinomi, 161 algoritmo di, 346
Dedekind divisore, 25 esistenza e unicità globale,
finito, 12 dominio, 7 399
infinito, 12 doppio fattoriale, 26 esistenza e unicità locale,
Dedekind-completo, 21 399
definitivamente, 82 EDO, 371 espressioni polinomiali, 29
densa, 21 EDP, 371 estensione della soluzione,
densità di ℚ, 39 elementare 395
derivata, 174 funzione, 271 estremo
delle funzioni elementari, elemento inferiore, 35
177 d’area, 234 superiore, 35
non continua, 189 inverso, 21 Euclide
parziale, 181, 389 neutro, 21 algoritmo di divisione,
derivato, 301 elevamento a potenza, 25 161
determinante ennuple, 20 Euler
wronksiano, 409 epigrafico, 191 Leonhard, 110
differenza, 15 epigrafico di 𝑓 , 191 Eulero, 110, 117
dinamica equazione formula di, 146, 148
complessa, 368 di Bernoulli, 385 problema di Basilea,
discontinuità a salto, 183 di Clairaut, 385 339
discontinuità eliminabile, di Newton, 385
183 di Riccati, 385 fase, 155
disgiunzione logica, 1 differenziale, 371 fattoriale, 25
dispari, 25, 54 alle derivate parziali, doppio, 26
distanza, 295 371 formula di Stirling, 291
di Hausdorff, 340 autonoma, 372 semi fattoriale, 26
euclidea, 299 in forma implicita, stima asintotica, 284
indotta, 296, 300 372 fattorizzazione
Manhattan, 299 in forma normale, dei polinomi complessi,
uniforme, 309 372 168
disuguaglianza lineare, 374 Feynman
di Bernoulli, 91 lineare a coefficienti trucco per gli integrali,
di Bessel, 329 costanti, 374 319
trucco per le derivate, di una variabile, 181 fondamentale della
180 dispari, 54 trigonometria, 146
Fibonacci, 345, 367 esponenziale, 47, 141 illimitata, 87
formula esplicita, 367 gaussiana, 271, 280, immaginario, 61
successione di, 345, 349 320 immagine, 8
finito, 34 hoelderiana, 203 insieme, 8
insieme, 12 integrale, 250 implicazioni, 1
flesso verticale, 182 inversa, 8 indeterminata, 86
forme indeterminate, 80 invertibile, 8 induttivo, 12
formula lipschitziana, 202, 307 inf, 35
di addizione, 146 monotòna, 41, 70
inferiormente
di Eulero, 146, 148 pari, 54
limitato, 35, 55
di Gregory-Lebniz per periodica, 54
infinitesimo, 96
𝜋/4, 227, 327 polinomiale, 31
infinito, 34, 63, 96
di Newton-Mercator, razionale, 260
insieme, 12
226 speciale, 271
suriettiva, 70 iniettiva, 7
di Stirling, 291 insieme
di Taylor, 206 funzione segno, 67
funzioni controimmagine, 8
con resto di Lagrange,
circolari, 146 degli zeri, 54
207
elementari, 271 delle parti, 5
con resto di Peano,
iperboliche, 152 di Cantor, 124, 343
209
trigonometriche, 146 di convergenza, 134
di Wallis, 289
funzioni lineari, 55 di Mandelbrot, 368
di Werner, 331
funzioni quadratiche, 56 equipotente, 9
fondamentale del calcolo
fuoco instabile, 417 finito, 12
integrale, 251
fuoco stabile, 417 infinito, 12
fondamentale della
trigonometria, 146 invariante, 348
Gauss
Fourier insieme finito, 12
funzione di, 271, 280,
serie di, 329 insieme infinito, 12
320
fratti semplici insieme quoziente, 6
GM, 197
scomposizione grado, 31 insieme vuoto, 3
complessa, 265 polinomio, 31 insiemi
frequentemente, 83 grafico, 7 equipotenti, 9
frontiera, 301 Gregory integrabile
funzione approssimazione 𝜋, 227, assolutamente, 281
Γ di Eulero, 280 327 integrabilità, 237
analitica, 219, 220 Gregory-Leibniz, 227, 327 controesempio, 241
bigettiva, 8 gruppo, 21 funzioni continue, 246
composta, 8 gruppo ordinato, 21 funzioni monotone,
concava, 191 247
Heine-Cantor, 304
continua, 67, 70 integrala
Hermite
convessa, 191 di una serie, 323
scomposizione in fratti
derivabile con derivata integrale, 237
semplici, 265
non continua, 189 additività, 244
Hilbert
di Dirichlet, 241 cambio di variabile,
base di, 329
di errore, 271 255
Hoelder, 203
di Heaviside, 247 carattere, 273
di più variabili, 181 identità convergente, 272
convergenza assoluta, jet, 365, 400 di Vandermonde, 365
281 Jordan wronksiana, 409
definizione, 237 misura di, 233 matrice e, 409
di Lebesgue, 317 media
di Riemann, 237 k, iv aritmetica, 197
divergente, 272 geometrica, 197
funzioni elementari, Lagrange, 184 media aritmetica geometrica,
254 Landau 197
gaussiana, 280, 320 simboli di, 214 metodo
improprio, 272 lattina di bisezione, 107
additività, 276 problema della, 186 minimo, 16
cambio di variabile, Lebesgue relativo, 182
276 integrale di, 317 minorante, 16
carattere, 273 Leibniz misura
convergente, 272 approssimazione 𝜋, 227, di Peano-Jordan, 233
convergenza assoluta, 327 trasformazione lineare,
281 criterio di, 126 234
divergenza, 272 limitata, 55, 86 misurabile, 233
indeterminato, 273 limitato, 35, 165, 303 modulo, 62
linearità, 276 inferiormente, 35 modulo di continuità, 204
monotonia, 276 superiormente, 35 molteplicità, 168
per parti, 277 limite moltiplicazione, 45, 61
indeterminato, 273 confronto, 83 monotonia, 41, 276
per parti, 258 del prodotto, 80 monotòna, 41
sostituzione diretta, del rapporto, 80
255 della somma, 80 naturali, 22
sostituzione inversa, destro/sinistro, 74 negativo, 22
255 di funzione, 73 negazione logica, 1
integrazione per parti, 277 superiore/inferiore, neutro, 21
intervallo, 53 102 Newton
intervallo massimale, 376 limiti che si riconducono al equazione di, 385
intorni, 73 numero 𝑒 , 92 Newton-Mercator, 226
destri/sinistri, 73 linea nodo
intorno, 301 retta, 56 instabile, 415
inversa destra, 10 linearità, 276 stabile, 415
inversa sinistra, 10 linearità della somma infinita, nodo improprio, 416
inverso, 21 113 norma, 296
invertibile, 8 linearizzazione, 174 𝐶 0 , 312
ipotesi Lipschitz, 202 𝑝 in ℝ𝑛 , 299
del continuo, 18 logaritmo, 50 euclidea di ℝ𝑛 , 299
irrazionalità logaritmo naturale, 94 Manhattan, 299
di 𝜋, 288 uniforme, 309
di 𝑒 , 144 maggiorante, 16 normato, 296
isoperimetrico Mandelbrot notazione posizionale
problema, 110 insieme di, 368 decimale, 24
Manhattan numeri
j, iv distanza, 299 complessi, 60
Jensen norma, 299 immaginari, 61
disuguaglianza di, 196, massimo, 16 naturali, 22
250 matrice numeri interi, 24
numeri naturali, 11 variabili, 181 di ℝ𝑛 , 298
numeri razionali, 38 polinomio, 29 prodotto scalare definito
numero algoritmo di Euclide, positivo, 297
negativo, 22 161 proposizione, 1
positivo, 22 caratteristico, 363 proprietà
di una equazione archimedea, 36
O grande, 214 ricorsiva lineare, associativa, 21
o piccolo, 214 363 commutativa, 21
ODE, 371 di Chebyshev, 332 dei valori intermedi,
omogenea, 400 di MacLaurin, 206 108
omomorfismo, 42 di secondo grado, 56 delle funzioni seno e
opposto, 21, 22 di Taylor, 206 coseno, 146
ordinale, 19 divisione, 161 proprietà del
ordine fattorizzazione parallelogramma,
continuo, 21 complessa, 168 297
di infinito, 96 grado, 31 proprietà di Cauchy-Lipschitz,
equazione differenziale, polinomio trigonometrico, 392
371 331 punto
ordine di infinito/infinitesimo, polirettangolo angoloso, 182
96 critico, 182
cartesiano, 232
ordini di infinito, 97 di accumulazione, 74,
positivo, 22
oscillazioni 301
potenza, 47
piccole del pendolo, di aderenza, 301
del binomio, 32
386 di cuspide, 182
insiemi, 7
di flesso, 182
palla, 300 predicato, 1
di frontiera, 301
parallelogramma preimmagine, 8
di massimo, 55
proprietà del, 297 insieme, 8
di minimo, 55
pari, 25, 54 primi
esterno, 301
parte somma dei reciproci,
fisso, 308, 348
esterna, 301 132
interno, 301
immaginaria, 61 primitiva, 252
isolato, 301
intera, 37 principio
limite, 102
interna, 301 di annullamento dei
stazionario, 182
reale, 61 polinomi, 163
punto di massimo/minimo,
partizione di Riemann, 237 di sovrapposizione,
55
PDE, 371 374
punto isolato, 76
Peano-Jordan, 233 problema
python 3, 425
misura di, 233 della lattina, 186
pendolo di Basilea, 339 quantificatore esistenziale, 2
periodo del, 386 di Cauchy, 375 quantificatore universale, 2
periodica, 54 di Didone, 110
periodo isoperimetrico, 110 radiante, 146, 157
del pendolo, 386 prodotti radice
permanenza del segno, 80 notevoli, 31 cubica, 49
permutazione, 28 prodotti infiniti, 132 quadrata, 49
piccole oscillazioni, 386, 387 prodotto, 24 radice 𝑛 -esima
Pitagora prodotto limitata per algoritmo di Erone, 346
teorema, 297 infinitesima, 88 radici 𝑛 -esime, 160
più prodotto scalare raggio di convergenza, 135
rapporto a termini positivi, 116 somme superiori/inferiori,
aureo, 367 armonica, 120 237
criterio del, 95 a segni alterni, 126, sostituzione
incrementale, 175 226 diretta, 255
rappresentazione cartesiana, generalizzata, 121 inversa, 255
61 binomiale, 222 sottosuccessione, 99
reciproco, 21, 46 carattere, 111 sottrazione, 22
regolare, 86 che differiscono su un spazio
relazione, 5 numero finito di di Banach, 305
relazione d’ordine, 15 termini, 114 di Hilbert, 305
relazione d’ordine totale, 15 convergenza uniforme, metrico, 295, 300
relazione di equivalenza, 6 323 speciale
retta, 56 funzione, 271
derivata, 324
tangente, 174 stabilità
di Fourier, 329, 333
rettangolo, 231 del carattere, 114
di Newton-Mercator,
Riccati stella, 415
226
equazione di, 385 Stirling formula di, 291
di potenze, 133
ricorsione, 345 strettamente
geometrica, 112
Riemann crescente, 41
funzione 𝜁 , 339 integrale, 323
somma, 111 decrescente, 41
integrale di, 237 monotòna, 41
partizione di, 237 stabilità del carattere,
114 successione, 85
somme inferiori, 237
telescopica, 115 carattere, 86
somme superiori, 237
convergente, 86
suddivisione di, 237 termini, 111
definita per ricorrenza,
Rolle, 184 settore
345
Ruffini, 163 di coseno iperbolico,
di Cauchy, 304
154
scambio della derivata con di Fibonacci, 345, 349,
di seno iperbolico, 154
l’integrale, 318 367
sfera 𝑛 -dimensionale, 300
scelta divergente, 86
simboli di Landau, 214
assioma della, 11 indeterminata, 86
sistema
Schwarz massimizzanti, 109
dinamico minimizzanti, 109
disuguaglianza di
discreto, 345 regolare, 86
Cauchy-, 199
sistema ortonormale, 329 ricorsiva, 345
scomposizione
sistemi di equazioni successore, 11
in fratti semplici
differenziali, 372 suddivisione di Riemann,
complessi, 265
soluzione massimale, 395 237
sella, 414
somma, 111, 323 sup, 35
semi fattoriale, 26
semigruppo, 89 dei reciproci dei primi, superiormente
seno 132 limitato, 35
iperbolico, 152 della serie geometrica, superiormente limitata, 55
senza ritardo, 371 112 surgettiva, 7
sequenzialmente di Cesàro, 106 sviluppo
chiuso, 165 di una serie, 111 polinomio di Taylor,
compatto, 303 per parti, 130 213
continua, 302 telescopica, 28 serie di Taylor, 225
serie somme sviluppo del binomio, 297
a segni alterni, 126 parziali, 111 sviluppo di Fourier, 333
sviluppo in serie di Heine-Cantor, 205, una
coseno, 146 304 variabile, 181
seno, 146 di Hermite, 265 uniforme continuità, 203
di Lagrange, 184 uniformemente continua,
tangente di Leibniz, 126 304
di Pitagora, 297 unitario, 155
funzione trigonometrica,
di Rolle, 184 unità, 21
151
di Ruffini, 163 unità immaginaria, 61
iperbolica, 153
di Taylor con resto di uno, 21
Taylor
Lagrange, 207
polinomi delle funzioni
di Taylor con resto di valore assoluto, 39
elementari, 213
Peano, 209 Vandermonde, 365
resto di Lagrange, 207
di Torricelli-Barrow, variabile
resto di Peano, 209
250 funzione di una, 181
sviluppi in serie delle
di Weierstrass, 109 variabili
funzioni elementari,
fondamentale del calcolo funzione di più, 181
225
integrale, 250 variabili libere, 2
telescopico, 28
fondamentale vettore, 20
teorema
dell’algebra, 166 Von Newumann, 19
convergenza dominata, integrazione di una serie
317 di funzioni, 323 w, iv
degli zeri, 107 Jensen, 250 Wallis
dei carabinieri, 84 Lebesgue, 317 approssimazione di 𝜋,
dei due carabinieri, 83 termini, 111 289
del confronto, 83 di una serie, 111 Weiestrass
dell’asintoto, 205 topologia, 300 Karl, 110
della permanenza del Torricelli-Barrow Werner
segno, 80 teorema di, 250 formula di, 331
delle contrazioni, 308 trigonometria wronksiano, 409
derivazione di una serie formule di addizione,
di funzioni, 324 146 x, iv
di Banach-Caccioppoli, funzioni elementari,
308 146 y, iv
di Bolzano-Weierstrass, identità fondamentale, Young
101 146 disuguaglianza di, 198,
di Cauchy, 199 trucco 297
di convergenza dominata, di Feynman, 180, 319
316 per gli integrali, 319 zero, 11, 21
di de l’Hospital, 201 per le derivate, 180 di una funzione, 54

Analisi Uno

Caricato da

Informazioni sul documento

Titolo originale

Copyright

Formati disponibili

Condividi questo documento

Condividi o incorpora il documento

Opzioni di condivisione

Hai trovato utile questo documento?

Questo contenuto è inappropriato?

Copyright:

Formati disponibili

Analisi Uno

Caricato da

Copyright:

Formati disponibili

Appunti di

Analisi Matematica Uno

Le note (come il corso a cui fanno riferimento) riguardano l’analisi delle

Il materiale è costantemente in evoluzione e certamente contiene errori e

pronuncia delle lettere straniere

∗ pronunciato usualmente con la 𝑧 dolce per distinguerlo dalla 𝑧 .

2 funzioni continue, limiti e successioni 67

4 i numeri complessi 155

5 calcolo differenziale 173

6 calcolo integrale 231

7 spazi di funzioni 295

8 successioni ricorsive 345

9 equazioni differenziali 371

Indice analitico 433

Se, come diceva Galileo, la matematica è il linguaggio della scienza, è importante

E’ possibile combinare più proposizioni mediante gli operatori logici. Se 𝑃 e 𝑄

Operatori logici molto utilizzati sono le implicazioni. La proposizione 𝑃 ⇒ 𝑄 si implicazioni

La freccia inversa 𝑃 ⇐ 𝑄 si può utilizzare per invertire l’implicazione: è

Tabella 1.2: Alcune proprietà degli ope- ¬¬𝑃 ⇐⇒ 𝑃 doppia negazione

Se un predicato dipende da una o più variabili queste si chiamano variabili

Un predicato può dipendere da più variabili ed è quindi possibile inserire più

Tabella 1.3: Alcune proprietà dei quanti- ¬∀𝑥 : 𝑃(𝑥) ⇐⇒ ∃𝑥 : ¬𝑃(𝑥)

Spesso il quantificatore universale viene sottointeso ad esempio con 𝑥 + 𝑦 = 𝑥 + 𝑦

1.2 teoria degli insiemi

La negazione dell’appartenenza ¬(𝑥 ∈ 𝐴) viene usualmente abbreviata con

Sempre utilizzando la semplice relazione di appartenenza possiamo definire

Ovviamente la relazione 𝐴 ⊆ 𝐵 può essere invertita: scriveremo 𝐴 ⊇ 𝐵 (che si

Risulta molto utile la possibilità di costruire insiemi di insiemi. Per questo

Facendo l’unione di singoletti possiamo definire (per elencazione) insiemi che

{𝑎, 𝑏} = {𝑎} ∪ {𝑏}

Si faccia però attenzione: l’insieme {𝑎, 𝑏} contiene due elementi solamente se

{𝑎, 𝑎} = {𝑎}. (1.1)

Esercizio 1.1. Verificare (1.1) utilizzando le definizioni formali date in precedenza.

Svolgimento. Utilizzando le definizioni di unione, di singoletto e di disgiunzione

e dunque {𝑎, 𝑎} = {𝑎} per la definizione di uguaglianza tra insiemi.

Se 𝑃(𝑥) è un predicato in una sola variabile 𝑥 vorremmo poter definire l’insieme,

Per completare la teoria degli insiemi introduciamo anche il concetto di insieme

Grazie agli assiomi precedenti è possibile definire il prodotto cartesiano di due

(𝑎, 𝑏) = {𝑎, {𝑎, 𝑏}}.

Se rappresentiamo gli elementi di 𝐴 come dei punti su una retta orizzontale

𝐴 = 𝐵 = {1 , 2 , 3} e considero la relazione 𝑅 = {(1, 2), (1 , 3), (2 , 3)} il predicato

Definizione 1.2 (relazione di equivalenza). Se 𝑅 ⊆ 𝐴 × 𝐴 è una relazione

Se 𝑅 è una relazione di equivalenza diremo che 𝑥 è equivalente a 𝑦 (tramite 𝑅 ) se 𝑥𝑅𝑦 .

𝐴/𝑅 = {[𝑥]𝑅 : 𝑥 ∈ 𝐴} = {𝐵 ∈ P(𝐴) : ∃𝑥 ∈ 𝐴 𝐵 = [𝑥]}.

Se 𝑅 è una relazione 𝐴 l’insieme quoziente 𝐴/𝑅 rappresenta l’insieme degli

Ad esempio se 𝐴 = {1 , 2 , 3 , 4 , 5} e prendiamo 𝐷 = {1 , 3 , 5} (i numeri dispari)

La relazione 𝑅 rappresenta la proprietà degli elementi di 𝐴 di avere la stessa

e, in effetti, questo insieme ha due elementi 𝑃 e 𝐷 che è quello che si ottiene

Per introdurre il concetto di funzione è utile utilizzare una notazione alternativa

Una funzione 𝑓 : 𝐴 → 𝐵 è un insieme di frecce che mandano ogni punto di 𝐴

L’insieme di tutte le funzioni 𝑓 : 𝐴 → 𝐵 viene usualmente denotato con 𝐵 𝐴 . 𝐵𝐴

Sebbene abbiamo costruito il concetto di funzione utilizzando la teoria degli

𝐺 𝑓 = {(𝑥, 𝑦) ∈ 𝐴 × 𝐵 : 𝑓 (𝑥) = 𝑦}.

Nella nostra costruzione risulta effettivamente 𝐺 𝑓 = 𝑓 . Anticipiamo fin da

Capita molto spesso che un fenomeno possa essere modellizzato matematica-

Se 𝑓 : 𝐴 → 𝐵 e 𝑔 : 𝐵 → 𝐶 sono due funzioni in cui il codominio della prima

Se il codominio di 𝑓 non coincide col dominio di 𝑔 è possibile dare comunque

𝑓 (𝐶) = { 𝑓 (𝑎) : 𝑎 ∈ 𝐶} = {𝑏 ∈ 𝐵 : ∃𝑎 ∈ 𝐶 : 𝑏 = 𝑓 (𝑎)}.

𝑓 −1 (𝐶) = {𝑎 ∈ 𝐴 : 𝑓 (𝑎) ∈ 𝐶}.

La notazione 𝑓 (𝐶) appena introdotta è formalmente ambigua in quanto potrebbe

Figura 1.2: Nella dimostrazione del teo-

Definizione 1.3 (cardinalità). Diremo che due insiemi 𝐴 e 𝐵 hanno la stessa

Intuitivamente se due insiemi hanno la stessa cardinalità significa che hanno lo