Sei sulla pagina 1di 446

Appunti di

Analisi Matematica Uno

Emanuele Paolini

4 novembre 2021

manu-fatto
This work is licensed under a Creative Commons “Attribution-NonCommercial-
ShareAlike 4.0 International” license.
Introduzione

Queste note sono nate come appunti per il corso di Analisi Matematica del corso di
studi in Fisica dell’Università di Pisa negli anni accademici 2017/18, 2018/19, 2019/20,
2020/21 e 2021/22.
Le note (come il corso a cui fanno riferimento) riguardano l’analisi delle funzioni di
una variabile reale. Gli argomenti trattati sono serie e successioni numeriche, il calcolo
differenziale e il calcolo integrale. Viene fatta un minimo di analisi funzionale allo
scopo di considerare, come ultimo argomento, lo studio delle equazioni differenziali
ordinarie. Da subito vengono introdotti i numeri complessi che vengono utilizzati
laddove possono aiutare a dare una visione più unitaria e concettualmente più
semplice degli argomenti trattati (in particolare nello studio delle serie di potenze,
nella definizione delle funzioni trigonometriche, nella risoluzione delle equazioni
differenziali lineari).
Le note sono estensive, non c’è alcun tentativo di concisione. L’obiettivo è quello
di raccogliere tutti quei risultati che non sempre è possibile esporre in maniera
dettagliata e rigorosa a lezione. Troveremo, ad esempio, la costruzione dei numeri
reali, definizioni equivalenti della funzione esponenziale e una definizione analitica
(tramite serie di potenze) delle funzioni trigonometriche (e di 𝜋). Proponiamo la
dimostrazione del teorema fondamentale dell’algebra, della formula di Stirling e di
Wallis, e dell’irrazionalità di 𝑒 e di 𝜋. Viene proposta una definizione formale dei
simboli di Landau 𝑜 -piccolo e 𝑂 -grande con i relativi teoremi per trattare queste
espressioni. Lo stesso viene fatto per il simbolo di integrale indefinito. Vengono trattati
quei risultati algebrici che permettono di giustificare gli algoritmi per il calcolo delle
primitive delle funzioni razionali e per risolvere le equazioni differenziali lineari con il
metodo di similarità.
Le figure non sono frequenti ma a margine di molte di esse è presente un QR-code (un
quadrato formato da una nuvola di pixel) che permette di accedere alla figura online e
modicarne i parametri. Alla pagina https://paolini.github.io/AnalisiUno/ sono
inseriti tutti i collegamenti alle figure interattive. Queste note sono rese disponibili
liberamente sia in formato PDF che in forma di sorgente LATEX. Un modo per sostenere
questo progetto e mantenerlo disponibile liberamente per tutti, è quello di acquistarne
una copia cartacea.
Il materiale è costantemente in evoluzione e certamente contiene errori e incoerenze.
Ogni suggerimento o commento è benvenuto!

contributi

Ringrazio: Valerio Amico, Rico Bellani, Fabio Bensch, Jacopo Bernardini, Elia Bonistalli,
Antonino Calderone, Davide Campanella Galanti, Alessandro Canzonieri, Giulio Carlo,
Luca Casagrande, Alessandro Casini, Giulio Cianti, Luca Ciceri, Tommaso Ceccotti,
Giorgio Ciocca, Luca Ciucci, Francesco Debortoli, Martino Dimartino, Igor Di Tota,
Irene Iorio, Marco Labella, Davide Labrosciano, Viviana Lippolis, Luigina Mazzone,
Roberto Menta, Michele Monti, Elena Morano, Aurora Mugnai, Francesco Nagni,
Marco Nuti, Ruben Pariente, Daniele Pavarini, Guglielmo Pellitteri, Paolo Pennoni,
Davide Perrone, Lorenzo Pierfederici, Mattia Ripepe, Francesco Rodriguez, Elisa
Sabadini, Gabriele Scarci, Maria Antonella Secondo, Irene Silvestro, Alessio Squilloni,
Antonio Tagliente, Francesco Enrico Teofilo, Federico Tettamanti, Laura Toni, Giacomo
Trupiano, Bianca Turini, Francesco Vaselli, Antoine Venturini, Matteo Vilucchio, Piero
Viscone che hanno segnalato errori e correzioni.
Ringrazio i colleghi Vincenzo Tortorelli e Pietro Majer che mi hanno dato molti
suggerimenti preziosi.

pronuncia delle lettere straniere

inglesi:

𝐽 𝑗 gei (i lunga)
𝐾 𝑘 cappa (key)
𝑊 𝑤 vu doppia
𝑋 𝑥 ics
𝑌 𝑦 ipsilon (i greca)

greche:

𝐴 𝛼 alfa 𝐼 𝜄 iota 𝑃 𝜌 ro
𝐵 𝛽 beta 𝐾 𝜅 kappa† Σ 𝜎 sigma
Γ 𝛾 gamma Λ 𝜆 lambda 𝑇 𝜏 tau
Δ 𝛿 delta 𝑀 𝜇 mi (mu) 𝑌 𝜐 ipsilon§
𝐸 𝜀 epsilon 𝑁 𝜈 ni (nu) Φ 𝜑 fi
𝑍 𝜁 zeta∗ Ξ 𝜉 csi 𝑋 𝜒 chi
𝐻 𝜂 eta 𝑂 𝑜 omicron Ψ 𝜓 psi
Θ 𝜃 teta Π 𝜋 pi‡ Ω 𝜔 omega

ebraiche:

ℵ alef

∗ pronunciato usualmente con la 𝑧 dolce per distinguerlo dalla 𝑧 .


† in inglese si distingue la pronuncia tra 𝑘 key e 𝜅 kappa.
‡ in italiano pi greco in inglese pai, per distinguere da 𝑝 .
§ si pronuncia upsilon per distinguerla da 𝑦 .
Indice

Indice v

1 fondamenti 1
1.1 proposizioni e predicati . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.2 teoria degli insiemi . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
1.3 relazioni . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
1.4 funzioni . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
1.5 cardinalità . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
1.6 i numeri naturali . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
iterazioni e addizione . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
ordinamento, moltiplicazione ed elevamento a potenza . . . . . . . . 20
rappresentazione posizionale dei numeri naturali . . . . . . . . . . . 22
fattoriale e semi-fattoriale . . . . . . . . . . . . . . . . . . . . . . . . . 23
buon ordinamento e unicità dei numeri naturali . . . . . . . . . . . . 24
cardinalità finite . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
sequenze finite o ennuple . . . . . . . . . . . . . . . . . . . . . . . . . 27
1.7 i numeri interi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
sommatoria e produttoria . . . . . . . . . . . . . . . . . . . . . . . . . 31
1.8 polinomi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
1.9 coefficienti binomiali . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
1.10 frazioni e numeri razionali . . . . . . . . . . . . . . . . . . . . . . . . 38
valore assoluto . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
1.11 costruzione dei numeri reali . . . . . . . . . . . . . . . . . . . . . . . 42
1.12 proprietà assiomatiche dei numeri reali . . . . . . . . . . . . . . . . . 45
estremo superiore . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
parte intera . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46
numeri decimali . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
isomorfismi di gruppi ordinati . . . . . . . . . . . . . . . . . . . . . . 48
1.13 funzione esponenziale e potenza . . . . . . . . . . . . . . . . . . . . . 54
1.14 radice 𝑛 -esima . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56
1.15 logaritmo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57
1.16 cardinalità infinite . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58
1.17 punti all’infinito . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59
1.18 intervalli . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60
1.19 andamento del grafico di una funzione . . . . . . . . . . . . . . . . . 61
1.20 funzioni lineari . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63
1.21 funzioni quadratiche . . . . . . . . . . . . . . . . . . . . . . . . . . . 64
1.22 equazioni e disequazioni . . . . . . . . . . . . . . . . . . . . . . . . . 66
1.23 i numeri complessi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67

2 funzioni continue, limiti e successioni 73


2.1 funzioni continue . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73
2.2 limite di funzione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77
2.3 proprietà frequenti e definitive . . . . . . . . . . . . . . . . . . . . . . 88
2.4 criteri di confronto . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89
2.5 successioni . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90
2.6 limite di successione . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90
2.7 successioni limitate . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92
2.8 successioni monotòne . . . . . . . . . . . . . . . . . . . . . . . . . . . 93
2.9 la costante di Nepero . . . . . . . . . . . . . . . . . . . . . . . . . . . 94
2.10 criteri del rapporto e della radice . . . . . . . . . . . . . . . . . . . . . 100
2.11 ordini di infinito, equivalenza asintotica . . . . . . . . . . . . . . . . . 101
2.12 successioni estratte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 104
2.13 punti limite . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 106
2.14 il teorema degli zeri . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111
2.15 il teorema di Weierstrass . . . . . . . . . . . . . . . . . . . . . . . . . 113
2.16 successioni ricorsive . . . . . . . . . . . . . . . . . . . . . . . . . . . . 115

3 serie 117
3.1 serie telescopiche . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121
3.2 serie a termini positivi . . . . . . . . . . . . . . . . . . . . . . . . . . . 122
associatività della somma di una serie . . . . . . . . . . . . . . . . . . 125
la serie armonica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 126
3.3 rappresentazione posizionale dei numeri reali . . . . . . . . . . . . . 128
3.4 convergenza assoluta . . . . . . . . . . . . . . . . . . . . . . . . . . . 130
3.5 serie a segno variabile . . . . . . . . . . . . . . . . . . . . . . . . . . . 131
3.6 somme multiple . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 134
3.7 somma per parti . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 136
3.8 prodotti infiniti . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 137
3.9 le serie di potenze . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 139
3.10 la serie esponenziale . . . . . . . . . . . . . . . . . . . . . . . . . . . . 144
3.11 le funzioni trigonometriche . . . . . . . . . . . . . . . . . . . . . . . . 150
3.12 funzioni trigonometriche inverse . . . . . . . . . . . . . . . . . . . . . 155
3.13 funzioni iperboliche . . . . . . . . . . . . . . . . . . . . . . . . . . . . 157
3.14 esercizi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 159

4 i numeri complessi 161


4.1 rappresentazione polare dei numeri complessi . . . . . . . . . . . . . 161
4.2 interpretazione geometrica . . . . . . . . . . . . . . . . . . . . . . . . 162
4.3 radici complesse 𝑛 -esime . . . . . . . . . . . . . . . . . . . . . . . . . 166
4.4 ancora polinomi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 167
4.5 il teorema fondamentale dell’algebra . . . . . . . . . . . . . . . . . . 170
4.6 fattorizzazione dei polinomi . . . . . . . . . . . . . . . . . . . . . . . 173

5 calcolo differenziale 177


5.1 derivata . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 177
5.2 derivate parziali . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 184
5.3 punti notevoli . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 185
5.4 criteri di monotonia . . . . . . . . . . . . . . . . . . . . . . . . . . . . 187
5.5 convessità . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 194
5.6 teoremi di Cauchy e de l’Hospital . . . . . . . . . . . . . . . . . . . . 202
5.7 classi di regolarità . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 205
5.8 formula di Taylor . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 209
5.9 operazioni con i simboli di Landau . . . . . . . . . . . . . . . . . . . 217
5.10 funzioni analitiche . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 222
5.11 derivata complessa . . . . . . . . . . . . . . . . . . . . . . . . . . . . 231
6 calcolo integrale 233
6.1 misura di Peano-Jordan . . . . . . . . . . . . . . . . . . . . . . . . . . 233
6.2 integrale di Riemann . . . . . . . . . . . . . . . . . . . . . . . . . . . 239
6.3 teorema fondamentale del calcolo integrale . . . . . . . . . . . . . . . 252
6.4 calcolo delle primitive . . . . . . . . . . . . . . . . . . . . . . . . . . . 255
6.5 integrale di una funzione razionale . . . . . . . . . . . . . . . . . . . 262
6.6 integrali che si riconducono a funzioni razionali . . . . . . . . . . . . 268
6.7 funzioni speciali . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 272
6.8 integrali impropri . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 272
6.9 studio di funzioni integrali . . . . . . . . . . . . . . . . . . . . . . . . 285
6.10 alcune applicazioni del calcolo integrale . . . . . . . . . . . . . . . . 288

7 spazi di funzioni 295


7.1 spazi metrici e topologia . . . . . . . . . . . . . . . . . . . . . . . . . 300
7.2 completezza . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 304
7.3 convergenza uniforme . . . . . . . . . . . . . . . . . . . . . . . . . . . 308
7.4 passaggio al limite sotto il segno di integrale . . . . . . . . . . . . . . 312
7.5 scambio della derivata con il limite . . . . . . . . . . . . . . . . . . . 320
serie di funzioni . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 322
7.6 convergenza integrale . . . . . . . . . . . . . . . . . . . . . . . . . . . 326
serie di Fourier . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 328
7.7 divagazione sui frattali autosimili . . . . . . . . . . . . . . . . . . . . 338

8 successioni ricorsive 343


8.1 equazioni ricorsive autonome del primo ordine . . . . . . . . . . . . 344
8.2 approfondimenti . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 360
8.3 equazioni ricorsive lineari . . . . . . . . . . . . . . . . . . . . . . . . . 361
8.4 dinamica complessa . . . . . . . . . . . . . . . . . . . . . . . . . . . . 366

9 equazioni differenziali 369


9.1 classificazione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 369
equazioni lineari . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 371
problema di Cauchy . . . . . . . . . . . . . . . . . . . . . . . . . . . . 373
9.2 metodi risolutivi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 374
equazioni lineari del primo ordine . . . . . . . . . . . . . . . . . . . . 374
equazioni a variabili separabili . . . . . . . . . . . . . . . . . . . . . . 377
altri metodi risolutivi . . . . . . . . . . . . . . . . . . . . . . . . . . . 382
9.3 funzioni vettoriali e di più variabili . . . . . . . . . . . . . . . . . . . 387
9.4 il problema di Cauchy . . . . . . . . . . . . . . . . . . . . . . . . . . . 389
9.5 il problema di Cauchy per equazioni di ordine 𝑛 . . . . . . . . . . . . 396
9.6 equazioni lineari di ordine 𝑛 . . . . . . . . . . . . . . . . . . . . . . . 398
9.7 equazioni lineari di ordine 𝑛 a coefficienti costanti . . . . . . . . . . . 400
9.8 sistemi lineari . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 409
sistemi 2 × 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 410
matrice esponenziale . . . . . . . . . . . . . . . . . . . . . . . . . . . 414
9.9 studio qualitativo delle soluzioni . . . . . . . . . . . . . . . . . . . . . 417
monotonia e punti critici delle soluzioni . . . . . . . . . . . . . . . . . 418
teoremi di confronto . . . . . . . . . . . . . . . . . . . . . . . . . . . . 420

A Listati 423
A.1 bisection.py . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 423
A.2 series.py . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 424
A.3 compute_e.py . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 424
A.4 compute_pi.py . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 424
A.5 Mandelbrot.py . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 425
A.6 Koch.py . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 426
A.7 Fourier.py . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 427

Indice analitico 431


fondamenti 1
1.1 proposizioni e predicati

Se, come diceva Galileo, la matematica è il linguaggio della natura, è importante


che la matematica sia essa stessa espressa in un linguaggio che risulti essere il più
possibile oggettivo e non ambiguo. La logica è la disciplina matematica che si occupa
dello studio e della formalizzazione del linguaggio matematico. In questo capitolo
riassumiamo in maniera sintetica ed intuitiva alcuni concetti e contemporaneamente
fissiamo le notazioni che verranno utilizzate nel seguito.

La logica studia i sistemi formali (anche detti sistemi logico-deduttivi o sistemi assiomatici) sistemi formali

che sono delle descrizioni meccaniche, non ambigue, di un linguaggio formale.


Parliamo al plurale di sistemi formali in quanto ogni ambito della matematica (o di altre
scienze) potrebbe sviluppare un proprio sistema formale specializzato per quell’ambito.
Il primo sistema formale è stato sviluppato da Euclide per descrivere le proprietà di
punti, rette e circonferenze del piano (la geometria euclidea). Al tempo di Euclide la
formalizzazione era ancora intuitiva e incompleta, la formalizzazione moderna di
tale sistema è stata completata da Hilbert, dopo duemila anni. Peano ha introdotto
un sistema assiomatico per descrivere le proprietà dei numeri naturali. Dedekind
ha individuato gli assiomi per descrivere i numeri reali. Cantor ha introdotto la
teoria degli insiemi all’interno della quale è stato possibile includere tutte le altre teorie
matematiche. Tale teoria è stata formalizzata da Zermelo e Fraenkel ed è questa la
teoria che useremo nel nostro corso.

Tutti sistemi formali descrivono un linguaggio. Per descrivere un linguaggio dobbiamo


simboli
dire innanzitutto quali sono i simboli di quel linguaggio. In generale possiamo
pensare ai simboli come alle lettere (o caratteri, nel linguaggio dell’informatica) che
possono essere utilizzati per comporre le frasi. Simboli tipici delle teorie matematiche
sono ad esempio: 𝑥 , 𝑦 , 5, 7, 𝜋, +, =, =⇒ , [, : etc. Nei linguaggi informatici i
simboli corrispondono ai caratteri presenti sulla tastiera di un computer. Nelle lingue
naturali si prenderebbero come simboli le singole lettere dell’alfabeto a cui aggiungere
eventualmente i caratteri per la punteggiatura. Una sequenza finita di simboli si chiama
formula
formula (potremmo anche chiamarle frasi). Ad esempio: 𝑥 7+ =⇒ potrebbe essere
una formula formata da quattro simboli. Tra tutte le formule un sistema formale deve
individuare quelle che si potrebbero chiamare formule ben formate ovvero le formule
a cui effettivamente vogliamo dare significato. Ad esempio la formula 𝑥 + 5 = 7
potrebbe essere una formula ben formata perché siamo in grado di dargli un significato.
Il sistema formale non dà un significato alle formule ben formate (il significato è
una estrapolazione della nostra mente) ma semplicemente deve dare delle regole per
determinare quali siano le formule ben formate e quali no. Visto che ogni simbolo
che utilizziamo può essere rappresentato al computer, possiamo pensare alle formule
come alle stringhe dei linguaggi di programmazione e possiamo pensare che il sistema
formale deve descrivere un algoritmo (cioè un procedimento meccanico) in grado di
determinare se una formula è ben formata oppure no. Tra le formule ben formate il
sistema formale deve infine specificare quali siano i teoremi. Di nuovo questo deve
essere fatto mediante un algoritmo puramente meccanico in modo da garantire che i
2 1 fondamenti

teoremi risultino oggettivi e universali: non ci può essere disaccordo sulla validità di un
teorema, eventualmente ci può essere disaccordo sulla interpretazione di tale teorema.
Tipicamente i sistemi formali sono deduttivi. Nei sistemi deduttivi si identificano alcune
formule che vengono chiamati assiomi e che vengono immediatamente riconosciuti
come teoremi. Ad esempio vedremo che il primo assioma della teoria degli insiemi (lo
vedremo) è ∃𝑋 : š𝑦 : 𝑦 ∈ 𝑋 che si potrebbe leggere “esiste un insieme 𝑋 per il quale
nessun 𝑦 è elemento di 𝑋 ” ed esprime l’esistenza dell’insieme vuoto. Oltre agli assiomi
in un sistema deduttivo vengono specificate delle regole di inferenza cioè dei modi in
cui le formule possono essere modificate o composte in modo tale che se le formule di
partenza sono teoremi anche la formula ottenuta lo è. I sillogismi di Aristotele possono
essere utilizzati come esempi di regole di inferenza. Supponiamo che le formule
“Socrate è un uomo” e “l’uomo è un animale” siano entrambi teoremi. Allora possiamo
pensare di definire una regola di inferenza che mi dice che se “ 𝑥 è un 𝑦 ” è un teorema
e “ 𝑦 è un 𝑧 ” è un teorema allora anche “ 𝑥 è un 𝑧 ” è un teorema. Con questa regola
di inferenza è quindi possibile dedurre che “Socrate è un animale” è un teorema. E’
chiaro che se le regole formali possono essere definite meccanicamente tramite un
algoritmo allora anche i teoremi possono essere determinati meccanicamente mediante
un algoritmo. La ricerca in matematica consiste nell’esplorare lo spazio delle formule
dimostrazione
ben formate per determinare quali siano effettivamente teoremi. Dare la dimostrazione
di un teorema significa esibire tutta la catena delle formule e delle regole di inferenza
che permettono di ottenere il teorema a partire dagli assiomi.

Tutto questo è un processo meccanico, ma in realtà è ovvio che i sistemi formali


vengono definiti in modo tale da aver per noi un qualche tipo di significato intuitivo.
In tal modo la ricerca delle dimostrazioni non è un processo puramente meccanico
ma segue delle linee di pensiero che possono richiedere intuizione, inventiva e anche
vero senso estetico. Tipicamente a livello intuitivo vogliamo assegnare un valore di verità
alle formule ben formate: vorremmo cioè dire che alcune formule sono vere ed altre
falso
sono false. In tal caso le formule ben formate vengono usualmente chiamate proposizioni
proposizioni (nel linguaggio naturale diremmo: affermazioni). Un esempio di proposizione (falsa)
potrebbe essere: “2+2=5”.

congiunzione
E’ possibile combinare più proposizioni mediante gli operatori logici. Se 𝑃 e 𝑄 sono
proposizioni si può costruire la proposizione 𝑃 ∧ 𝑄 chiamata congiunzione logica.
Tale proposizione si può leggere “𝑃 e 𝑄 ” ed è una proposizione che risulta essere
vera solamente nel caso in cui sia 𝑃 che 𝑄 siano vere (si veda la tabella 1.1 per un
riassunto schematico). Spesso la congiunzione logica è sottointesa: se si fa un elenco
disgiunzione
di proposizioni 𝑃, 𝑄, 𝑅 si intende usualmente la loro congiunzione 𝑃 ∧ 𝑄 ∧ 𝑅 cioè si
intende che devono essere tutte vere. La disgiunzione logica denotata con 𝑃 ∨ 𝑄 si può
negazione
leggere “𝑃 o 𝑄 ” ed è una proposizione che è vera se almeno una tra 𝑃 e 𝑄 è vera. La
negazione logica denotata con ¬𝑃 è una proposizione che si può leggere “non 𝑃 ” che è
implicazioni vera quando 𝑃 è falsa ed è falsa quando 𝑃 è vera.

Operatori logici molto utilizzati sono le implicazioni. La proposizione 𝑃 ⇒ 𝑄 si può


leggere “𝑃 implica 𝑄 ” e significa che 𝑄 è vera se 𝑃 è vera. Non si confonda il valore di
verità di 𝑃 ⇒ 𝑄 con il valore di verità di 𝑄 . Se 𝑃 è vera allora 𝑃 ⇒ 𝑄 è vera o falsa
a seconda che 𝑄 sia vera o falsa. Ma se 𝑃 è falsa allora l’implicazione 𝑃 ⇒ 𝑄 è vera
indipendentemente dal valore di 𝑄 . In effetti 𝑃 ⇒ 𝑄 è equivalente a 𝑄 ∨ ¬𝑃 perché
per la verità di 𝑃 ⇒ 𝑄 basta che 𝑄 sia vera (quando 𝑃 è vera) oppure che 𝑃 sia falsa.
1.1 proposizioni e predicati 3

𝑃 𝑄 ¬𝑃 𝑃∧𝑄 𝑃∨𝑄 𝑃⇒𝑄 𝑃⇐𝑄 𝑃⇔𝑄 Tabella 1.1: La tabella di verità degli ope-
ratori logici. F significa falso, V significa
F F V F F V V V vero.
F V V F V V F F
V F F F V F V F
V V F V V V V V

𝑃 ∨ ¬𝑃 terzo escluso Tabella 1.2: Alcune proprietà degli ope-


ratori logici. Queste proposizioni sono
¬¬𝑃 ⇐⇒ 𝑃 doppia negazione tutte vere qualunque siano i valori di ve-
𝑃∧𝑄 ⇐⇒ 𝑄∧𝑃 simmetria rità delle proposizioni 𝑃 e 𝑄 . In partico-
𝑃∨𝑄 ⇐⇒ 𝑄∨𝑃 lare le equivalenze logiche ci dicono che
¬(𝑃 ∧ 𝑄) ⇐⇒ (¬𝑃) ∨ (¬𝑄) formule di De Morgan le proposizioni ai due lati dell’equiva-
lenza assumono sempre lo stesso valore
¬(𝑃 ∨ 𝑄) ⇐⇒ (¬𝑃) ∧ (¬𝑄) di verità e quindi sono interscambiabili.
(𝑃 ∧ 𝑄) ∨ 𝑅 ⇐⇒ (𝑃 ∨ 𝑅) ∧ (𝑄 ∨ 𝑅) proprietà distributiva
(𝑃 ∨ 𝑄) ∧ 𝑅 ⇐⇒ (𝑃 ∧ 𝑅) ∨ (𝑄 ∧ 𝑅)
(𝑃 ⇒ 𝑄) ⇐⇒ (𝑄 ⇐ 𝑃) antisimmetria
(𝑃 ⇒ 𝑄) ⇐⇒ (¬𝑄 ⇒ ¬𝑃) implicazione contropositiva
¬(𝑃 ⇒ 𝑄) ⇐⇒ 𝑃 ∧ (¬𝑄) controesempio
(𝑃 ⇒ 𝑄) ⇐⇒ ¬(𝑃 ∧ (¬𝑄)) dimostrazione per assurdo

La freccia inversa 𝑃 ⇐ 𝑄 si può utilizzare per invertire l’implicazione: è equivalente a


𝑄 ⇒ 𝑃 . Se valgono entrambe le implicazioni (𝑃 ⇐ 𝑄) ∧ (𝑃 ⇒ 𝑄) è facile convincersi
che 𝑃 e 𝑄 devono avere lo stesso valore di verità: diremo quindi che sono equivalenti
e scriveremo 𝑃 ⇔ 𝑄 .

Nella tabella 1.1 sono riportati tutti i valori di verità che si possono ottenere combinando
tra loro due proposizioni. Nella tabella 1.2 sono riportate alcune proprietà di tali
operatori: queste proprietà possono essere comprese interpretando il loro significato
ma possono anche essere dedotte meccanicamente tramite la tabella di verità delle
operazioni.

Un predicato è una proposizione che contiene una o più variabili, il cui valore di verità, predicato
quindi, può dipendere dal valore assegnato alle variabili. Un esempio di predicato è
𝑥 + 2 = 5 che risulta essere vero se 𝑥 = 3 e falso altrimenti.
variabili libere
Se un predicato dipende da una o più variabili queste si chiamano variabili libere. E’
possibile chiudere una variabile libera mediante un quantificatore. Il quantificatore
quantificatore universale
universale denotato col simbolo ∀ serve ad affermare che il predicato è vero per ogni
possibile valore della variabile quantificata. Ad esempio la proposizione ∀𝑥 : 𝑥 + 2 = 5
significa: “per ogni 𝑥 si ha 𝑥 + 2 = 5” ed è una proposizione falsa. Il quantificatore ∀𝑥
rende muta la variabile 𝑥 del predicato 𝑥 + 2 = 5 nel senso che il valore di verità della
proposizione non dipende più dal valore di quella variabile, che non è più una variabile
libera ma funge solo da segnaposto. In effetti se cambio nome ad una variabile muta il
valore di verità non cambia. Ad esempio scrivere ∀𝑥 : 𝑥 + 1 = 1 + 𝑥 è equivalente ad
∀𝑧 : 𝑧 + 1 = 1 + 𝑧 .
quantificatore esistenziale
Il quantificatore esistenziale denotato col simbolo ∃ serve ad affermare che il predicato è
vero per almeno un valore della variabile quantificata. Ad esempio la proposizione
∃𝑥 : 𝑥 + 2 = 5 significa: “esiste almeno un 𝑥 per cui risulta 𝑥 + 2 = 5”. Quello che si
ottiene è una proposizione in cui la variabile 𝑥 è muta. In questo caso la proposizione
è vera in quanto per 𝑥 = 3 il predicato è vero.
4 1 fondamenti

Tabella 1.3: Alcune proprietà dei quanti- ¬∀𝑥 : 𝑃(𝑥) ⇐⇒ ∃𝑥 : ¬𝑃(𝑥)


ficatori logici ( 𝑐 è una qualunque costan-
te)
¬∃𝑥 : 𝑃(𝑥) ⇐⇒ ∀𝑥 : ¬𝑃(𝑥)
∀𝑥 : 𝑃(𝑥) =⇒ 𝑃(𝑐)
∃𝑥 : 𝑃(𝑥) ⇐= 𝑃(𝑐)
𝑃 ∧ ∀𝑥 : 𝑄(𝑥) ⇐⇒ ∀𝑥 : 𝑃 ∧ 𝑄(𝑥)
𝑃 ∧ ∃𝑥 : 𝑄(𝑥) ⇐⇒ ∃𝑥 : 𝑃 ∧ 𝑄(𝑥)

Un predicato può dipendere da più variabili ed è quindi possibile inserire più


quantificatori. In tal caso l’ordine dei quantificatori può essere rilevante. Delle
seguenti proposizioni la prima è vera, la seconda invece è falsa:

∀𝑥 : ∃𝑦 : 𝑥 + 2 = 𝑦
∃𝑦 : ∀𝑥 : 𝑥 + 2 = 𝑦.

Alcune proprietà dei quantificatori logici sono riportate nella tabella 1.3.

Spesso il quantificatore universale viene sottointeso. Ad esempio se si scrive 𝑥 + 𝑦 =


𝑥 + 𝑦 si intende che tutte le variabili libere sono quantificate tramite quantificatore
universale: ∀𝑥 : ∀𝑦 : 𝑥 + 𝑦 = 𝑦 + 𝑥 . Il segno di interpunzione : può essere omesso
∀𝑥∀𝑦 𝑥 + 𝑦 = 𝑦 + 𝑥 e una quantificazione può essere fatta contemporaneamente su
più variabili ∀𝑥, 𝑦 : 𝑥 + 𝑦 = 𝑦 + 𝑥 . A volte, se non crea ambiguità, si potranno scrivere
i quantificatori anche a fine frase 𝑥 + 𝑦 = 𝑦 + 𝑥, ∀𝑥∀𝑦 .

1.2 teoria degli insiemi

Nei paragrafi precedenti abbiamo visto che i predicati possono essere combinati tra
loro e quantificati. Ma quali sono i predicati elementari che possiamo considerare per
fondare tutta la matematica? La teoria degli insiemi ci fornisce la formalizzazione del
concetto di appartenenza: il predicato di base (l’unico che ci servirà) è un predicato
della forma 𝑥 ∈ 𝐴 che significa “l’oggetto 𝑥 è un elemento dell’insieme 𝐴”. La teoria
degli insiemi non spiega (né tantomento definisce) cosa siano gli oggetti e cosa siano
gli insiemi perché questi sono concetti primitivi (come lo sono i punti e le rette per
la geometria euclidea). La teoria degli insiemi ci fornisce, semplicemente, le regole
formali che possono essere utilizzate per trattare i predicati della forma 𝑥 ∈ 𝐴. Ad
esempio un assioma della teoria degli insiemi è il seguente.

Assioma 1.1 (insieme vuoto).


∃𝐴 : ¬∃𝑥 : 𝑥 ∈ 𝐴
insieme vuoto

L’assioma significa: “esiste un insieme 𝐴 che non contiene alcun elemento 𝑥 ” ovvero
stiamo dicendo che esiste l’insieme vuoto che normalmente viene denotato con il
simbolo ∅. Altri opportuni assiomi della teoria degli insiemi garantiscono l’esistenza
dell’unione 𝐴 ∪ 𝐵, intersezione 𝐴 ∩ 𝐵 e differenza 𝐴 \ 𝐵 di due insiemi qualunque 𝐴 e
𝐵. Tali operazioni tra insiemi possono essere ricondotte alla relazione di appartenenza
e possono quindi essere definite come segue.
1.2 teoria degli insiemi 5

Assioma 1.2 (operazioni tra insiemi). Se 𝐴 e 𝐵 sono insiemi allora esistono gli insiemi
𝐴 ∪ 𝐵, 𝐴 ∩ 𝐵 e 𝐴 \ 𝐵 tali che:

𝑥 ∈ 𝐴 ∪ 𝐵 ⇐⇒ (𝑥 ∈ 𝐴) ∨ (𝑥 ∈ 𝐵),
𝑥 ∈ 𝐴 ∩ 𝐵 ⇐⇒ (𝑥 ∈ 𝐴) ∧ (𝑥 ∈ 𝐵),
𝑥 ∈ 𝐴 \ 𝐵 ⇐⇒ (𝑥 ∈ 𝐴) ∧ ¬(𝑥 ∈ 𝐵).

La negazione dell’appartenenza ¬(𝑥 ∈ 𝐴) viene usualmente abbreviata con 𝑥 ∉ 𝐴.

Sempre utilizzando la semplice relazione di appartenenza possiamo definire le relazioni


di inclusione e uguaglianza tra insiemi: 𝐴 ⊆ 𝐵 si legge “𝐴 è un sottoinsieme di 𝐵”
e 𝐴 = 𝐵 si legge “𝐴 è uguale a 𝐵”. Queste relazioni sono definite dalle seguenti
proprietà:

𝐴 ⊆ 𝐵 ⇐⇒ ∀𝑥 : (𝑥 ∈ 𝐴 =⇒ 𝑥 ∈ 𝐵)
𝐴 = 𝐵 ⇐⇒ ∀𝑥 : (𝑥 ∈ 𝐴 ⇐⇒ 𝑥 ∈ 𝐵).

A parole diremo che 𝐴 è un sottoinsieme di 𝐵, 𝐴 ⊆ 𝐵, se ogni elemento di 𝐴 è anche


elemento di 𝐵. Diremo che 𝐴 e 𝐵 sono uguali, 𝐴 = 𝐵, se 𝐴 e 𝐵 hanno gli stessi elementi.
Ovviamente la relazione 𝐴 ⊆ 𝐵 può essere invertita: scriveremo 𝐴 ⊇ 𝐵 (che si può
leggere: “𝐴 è un soprainsieme di 𝐵”) per indicare 𝐵 ⊆ 𝐴. Scriveremo anche 𝐴 ≠ 𝐵 per
indicare la relazione opposta dell’uguaglianza ovvero: ¬(𝐴 = 𝐵). Si noti che 𝐴 = 𝐵 è
equivalente a (𝐴 ⊆ 𝐵) ∧ (𝐵 ⊆ 𝐴).

Risulta molto utile la possibilità di costruire insiemi di insiemi. Per questo motivo la
teoria degli insiemi usualmente non fa distinzione tra oggetti e insiemi di oggetti. Nella
relazione primitiva 𝑥 ∈ 𝐴 anche 𝑥 può essere un insieme. Possiamo allora immaginare
che ogni oggetto del nostro universo sia un insieme. In questo modo la relazione di
uguaglianza 𝐴 = 𝐵 che abbiamo definito sopra risulta ben definita per ogni coppia di
oggetti (o insiemi, che è lo stesso) 𝐴 e 𝐵.

Visto che gli elementi di un insieme A sono a loro volta insiemi, è possibile considerare L’intersezione di una famiglia vuota di
l’unione A e, se A ≠ ∅, l’intersezione A di tutti gli elementi di A. Questo estende
S T
insiemi darebbe l’insieme universo, che
il concetto di unione e intersezione anche a famiglie eventualmente infinite. vedremo non può essere definito.

Assioma 1.3 (unione e intersezione arbitraria). Se A è un insieme qualunque esiste


l’insieme A e se A ≠ ∅ esiste l’insieme A con le seguenti proprietà:
S T

[
𝑥∈ A ⇐⇒ ∃𝐴 ∈ A : 𝑥 ∈ 𝐴,
\
𝑥∈ A ⇐⇒ ∀𝐴 ∈ A : 𝑥 ∈ 𝐴.

Una notazione alternativa è la seguente:


[ [ \ \
A= 𝐴, A= 𝐴.
𝐴∈A 𝐴∈A

Questa notazione mette in evidenza il fatto che l’insieme A è l’unione di tutti


S
gli elementi 𝐴 dell’insieme A mentre A è l’intersezione di tutti gli elementi di A.
T
L’insieme A viene spesso chiamata una famiglia di insiemi perché i suoi elementi
vengono trattati come insiemi più che come oggetti.
6 1 fondamenti

Un altro assioma della teoria degli insiemi garantisce che per ogni 𝑥 esiste un insieme
il cui unico elemento è 𝑥 .

singoletto Assioma 1.4 (singoletto). Se 𝑥 è un insieme esiste l’insieme {𝑥}, chiamato singoletto tale
che:
𝑦 ∈ {𝑥} ⇐⇒ 𝑦 = 𝑥.

Facendo l’unione di singoletti possiamo definire (per elencazione) insiemi che conten-
gono un numero finito di oggetti:

{𝑎, 𝑏} = {𝑎} ∪ {𝑏}


{𝑎, 𝑏, 𝑐} = {𝑎, 𝑏} ∪ {𝑐}
{𝑎, 𝑏, 𝑐, 𝑑} = {𝑎, 𝑏, 𝑐} ∪ {𝑑}
..
.

Si faccia però attenzione: l’insieme {𝑎, 𝑏} contiene due elementi solamente se 𝑎 ≠ 𝑏 ,


infatti se 𝑎 = 𝑏 si potrà facilmente verificare che

{𝑎, 𝑎} = {𝑎}. (1.1)

Esercizio 1.5. Verificare (1.1) utilizzando le definizioni formali date in precedenza.

Svolgimento. Utilizzando le definizioni di unione, di singoletto e di disgiunzione logica


si ha l’equivalenza dei seguenti predicati:

𝑥 ∈ {𝑎, 𝑎}
𝑥 ∈ {𝑎} ∪ {𝑎}
(𝑥 ∈ {𝑎}) ∨ (𝑥 ∈ {𝑎})
(𝑥 = 𝑎) ∨ (𝑥 = 𝑎)
La teoria degli insiemi è stata introdotta
da Georg Cantor (1845–1918) senza una 𝑥=𝑎
vera formalizzazione logica (oggi la chia- 𝑥 ∈ {𝑎}
meremmo teoria ingenua degli insiemi).
Gottlob Frege (1848–1925) fu il primo
matematico che tentò di formalizzare la
e dunque {𝑎, 𝑎} = {𝑎} per la definizione di uguaglianza tra insiemi.
teoria degli insiemi di Cantor. Nel 1902
Bertrand Russell, avendo letto il lavoro di
Frege, gli invio una lettera che enunciava Se 𝑃(𝑥) è un predicato in una sola variabile 𝑥 vorremmo poter definire l’insieme di tutti
il paradosso da lui scovato: “Mi trovo gli oggetti che rendono vero il predicato 𝑃(𝑥). Sorprendentemente se aggiungessimo
in completo accordo con lei in tutte le
questo assioma (chiamato assioma di specificazione ingenua) nella teoria degli insiemi
parti essenziali, in particolare quando
lei rifiuta ogni elemento psicologico dan- avremmo un paradosso.
do un grande valore all’ideografia per
il fondamento della matematica e della
logica formale [. . . ] c’è solo un punto Teorema 1.6 (paradosso di Russell). Supponiamo che per ogni predicato 𝑃(𝑥) esista un
dove ho incontrato una difficoltà [...]”. insieme {𝑥 : 𝑃(𝑥)} formato da tutti gli 𝑥 che soddisfano il predicato 𝑃(𝑥):
La risposta di Frege (22 giugno 1902)
è deprimente: “La sua scoperta della 𝑎 ∈ {𝑥 : 𝑃(𝑥)} ⇐⇒ 𝑃(𝑎).
contraddizione mi ha causato una gran-
dissima sorpresa e, direi, costernazione,
perché ha scosso le basi su cui intendevo
Allora si ottiene un assurdo.
costruire l’aritmetica.”
1.3 relazioni 7

Dimostrazione. Consideriamo il predicato 𝑥 ∉ 𝑥 per il quale dovrebbe esistere l’insieme:

𝑅 = {𝑥 : 𝑥 ∉ 𝑥}.

Ma allora avremmo, per definizione:

𝑅 ∈ 𝑅 ⇐⇒ 𝑅 ∉ 𝑅

che è in contraddizione con il principio del terzo escluso (un predicato non può essere
equivalente alla sua negazione).

Per evitare l’incoerenza è necessario limitare l’assioma di specificazione alla costruzione


di sottoinsiemi di insiemi già costruiti.

Assioma 1.7 (specificazione). Se 𝑃 è un qualunque predicato con una variabile libera 𝑥 e


se 𝐵 è un insieme, allora esiste l’insieme {𝑥 ∈ 𝐵 : 𝑃(𝑥)} formato da tutti gli elementi di 𝐵 che
soddisfano il predicato 𝑃 :

𝑎 ∈ {𝑥 ∈ 𝐵 : 𝑃(𝑥)} ⇐⇒ (𝑎 ∈ 𝐵 ∧ 𝑃(𝑎)).

Per completare la teoria degli insiemi introduciamo anche il concetto di insieme delle insieme delle parti
parti cioè l’insieme di tutti i sottoinsiemi di un insieme dato.

Assioma 1.8 (insieme delle parti). Se 𝐴 è un insieme esiste l’insieme P(𝐴) delle parti di 𝐴
che è l’insieme di tutti i sottoinsiemi di 𝐴:

𝑥 ∈ P(𝐴) ⇐⇒ 𝑥 ⊆ 𝐴. (1.2)

1.3 relazioni

Grazie agli assiomi precedenti è possibile definire il prodotto cartesiano di due insiemi: coppia

sarà questo un concetto molto importante nel seguito. Innanzitutto dobbiamo definire Un modo formale per definire la coppia
il concetto di coppia: dati 𝑎, 𝑏 definiamo la coppia (𝑎, 𝑏) con primo elemento 𝑎 e secondo tramite l’utilizzo di insiemi è dovuto a
Kuratowski:
elemento 𝑏 come un oggetto che ha questa proprietà:
(𝑎, 𝑏) = {{𝑎}, {𝑎, 𝑏}}.
(𝑎, 𝑏) = (𝑎 ′ , 𝑏 ′) ⇐⇒ (𝑎 = 𝑎 ′) ∧ (𝑏 = 𝑏 ′). (1.3) Non è difficile verificare che questa defi-
nizione soddisfa la proprietà (1.3). Così
Stiamo cioè richiedendo che una coppia venga identificata dai due elementi che la possiamo definire l’insieme prodotto
compongono in cui, però, è importante anche l’ordine in cui vengono elencati (a 𝐴 × 𝐵 = 𝐶 ∈ P(𝐴 ∪ 𝐵) :

differenza dell’insieme {𝑎, 𝑏}, in cui l’ordine degli elementi è irrilevante). Nel seguito
∃𝑎 : ∃𝑏 : 𝑎 ∈ 𝐴, 𝑏 ∈ 𝐵,
useremo anche la notazione 𝑎 ↦→ 𝑏 per indicare la coppia (𝑎, 𝑏) e la chiameremo freccia
𝐶 = {𝑎, {𝑎, 𝑏}}

da 𝑎 in 𝑏 .
freccia
Il prodotto cartesiano 𝐴 × 𝐵 di due insiemi 𝐴 e 𝐵 è l’insieme di tutte le coppie il cui
primo elemento sta in 𝐴 e il secondo elemento sta in 𝐵:

(𝑎, 𝑏) ∈ 𝐴 × 𝐵 ⇐⇒ (𝑎 ∈ 𝐴 ∧ 𝑏 ∈ 𝐵).
8 1 fondamenti

Se rappresentiamo gli elementi di 𝐴 come dei punti su una retta orizzontale (asse delle
𝑥 ) e gli elementi di 𝐵 come dei punti su una retta verticale (asse delle 𝑦 ) gli elementi
di 𝐴 × 𝐵 possono essere rappresentati come i punti del piano che proiettati sull’asse
delle 𝑥 vanno in 𝐴 e proiettati sull’asse delle 𝑦 vanno in 𝐵.

relazione Una relazione 𝑅 tra gli elementi di un insieme 𝐴 e gli elementi di un insieme 𝐵 non è
altro che un sottoinsieme di 𝐴 × 𝐵. Per una relazione 𝑅 ⊆ 𝐴 × 𝐵 si userà la notazione
infissa 𝑎𝑅𝑏 per indicare (𝑎, 𝑏) ∈ 𝑅 . Con la notazione delle freccie potremo scrivere
𝑅
𝑎 ↦→ 𝑏 per indicare che la freccia 𝑎 ↦→ 𝑏 è un elemento di 𝑅 . Ad esempio se prendo
𝐴 = 𝐵 = {1 , 2 , 3} e considero la relazione 𝑅 = {(1, 2), (1 , 3), (2 , 3)} il predicato 𝑎𝑅𝑏
rappresenta l’usuale relazione d’ordine 𝑎 < 𝑏 sui tre numeri considerati.

Definizione 1.9 (relazione di equivalenza). Se 𝑅 ⊆ 𝐴 × 𝐴 è una relazione sull’insieme


relazione di equivalenza
𝐴, diremo che 𝑅 è una relazione di equivalenza se valgono le seguenti proprietà (tipiche
dell’uguaglianza)

1. riflessiva: 𝑥𝑅𝑥 ;
2. simmetrica: se 𝑥𝑅𝑦 allora 𝑦𝑅𝑥 ;
3. transitiva: se 𝑥𝑅𝑦 e 𝑦𝑅𝑧 allora 𝑥𝑅𝑧 .

Se 𝑅 è una relazione di equivalenza diremo che 𝑥 è equivalente a 𝑦 (tramite 𝑅 ) se 𝑥𝑅𝑦 .


classe di equivalenza Dato 𝑥 ∈ 𝐴 l’insieme di tutti gli elementi di 𝐴 che sono equivalenti a 𝑦 si chiama classe di
equivalenza di 𝑥 . Si definisce in questo modo:

[𝑥]𝑅 = {𝑦 ∈ 𝐴 : 𝑥𝑅𝑦}.
insieme quoziente
Se 𝑅 è una relazione di equivalenza su 𝐴 definiamo l’insieme quoziente come l’insieme di tutte
le classi di equivalenza:

𝐴/𝑅 = {[𝑥]𝑅 : 𝑥 ∈ 𝐴} = {𝐵 ∈ P(𝐴) : ∃𝑥 ∈ 𝐴 : 𝐵 = [𝑥]}.

Se 𝑅 è una relazione di equivalenza su 𝐴 l’insieme quoziente 𝐴/𝑅 rappresenta l’insieme


degli oggetti di 𝐴 in cui vengono identificati tra loro gli oggetti tra loro equivalenti.
Spesso diremo che 𝐴/𝑅 rappresenta 𝐴 a meno della equivalenza 𝑅 .

Ad esempio se 𝐴 = {1 , 2 , 3 , 4 , 5} e prendiamo 𝐷 = {1 , 3 , 5} (i numeri dispari) e


𝑃 = {2, 4} = 𝐴 \ 𝐵 (i numeri pari) possiamo definire una relazione 𝑅 su 𝐴 mediante la
proprietà:
𝑥𝑅𝑦 ⇐⇒ (𝑥 ∈ 𝑃 ∧ 𝑦 ∈ 𝑃) ∨ (𝑥 ∈ 𝐷 ∧ 𝑦 ∈ 𝐷).
La relazione 𝑅 rappresenta la proprietà degli elementi di 𝐴 di avere la stessa “parità”.
Si avrà [1]𝑅 = [3]𝑅 = [5]𝑅 = 𝐷 e [2]𝑅 = [4]𝑅 = 𝑃 . Dunque

𝐴/𝑅 = {𝑃, 𝐷} = {{2 , 4}, {1, 3, 5}}

e, in effetti, questo insieme ha due elementi 𝑃 e 𝐷 che è quello che si ottiene identificando
partizione i numeri di 𝐴 in base alla proprietà di essere pari o dispari.

L’insieme quoziente 𝐴/𝑅 è un partizione di 𝐴 in quanto è formato da insiemi disgiunti


la cui unione è tutto 𝐴. In effetti dare una partizione di 𝐴 è equivalente da dare una
relazione di equivalenza.
1.4 funzioni 9

𝐴
𝐵
𝐵 𝑓
(𝑎2 ,𝑏 3 ) (𝑎4 ,𝑏 3 ) 𝑎1
𝑏3 𝑏1
(𝑎3 ,𝑏 2 ) 𝑎2
𝑏2 𝑏2 𝑏4 Figura 1.1: La funzione 𝑓 : 𝐴 → 𝐵, 𝑓 =
(𝑎 1 ,𝑏 1 ) 𝑎3 {𝑎 1 ↦→ 𝑏1 , 𝑎2 ↦→ 𝑏3 , 𝑎3 ↦→ 𝑏 2 , 𝑎4 ↦→ 𝑏3 }
𝑏1 𝑏3 definita sull’insieme 𝐴 = {𝑎 1 , 𝑎 2 , 𝑎 3 , 𝑎 4 }
𝑎4 a valori nell’insieme 𝐵 = {𝑏 1 , 𝑏 2 , 𝑏 3 , 𝑏 4 }
𝐴 rappresentata tramite grafico e tramite
𝑎1 𝑎2 𝑎3 𝑎4 diagrammi di Venn.

1.4 funzioni

Sia 𝑓 una relazione tra due insiemi 𝐴 e 𝐵. Useremo la notazione delle frecce quindi
𝑓
scriveremo 𝑎 ↦→ 𝑏 se (𝑎, 𝑏) ∈ 𝑓 . Diremo che 𝑓 è una funzione da 𝐴 in 𝐵 e scriveremo
𝑓
𝑓 : 𝐴 → 𝐵 se per ogni 𝑎 ∈ 𝐴 esiste un unico 𝑏 ∈ 𝐵 tale che 𝑎 ↦→ 𝑏 . Potremmo dire che
𝑓 è definita su 𝐴 (perché per ogni punto di 𝐴 c’è una freccia) ed è univoca (perché tale
freccia è unica).
𝑓
Dato 𝑎 ∈ 𝐴 esiste dunque un unico 𝑏 ∈ 𝐵 tale che 𝑎 ↦→ 𝑏 : chiameremo 𝑓 (𝑎) tale oggetto
𝑏 e diremo che la funzione 𝑓 manda 𝑎 in 𝑏 . Si avrà dunque

𝑓
𝑏 = 𝑓 (𝑎) ⇐⇒ 𝑎 ↦→ 𝑏.

Gli elementi del dominio spesso vengono chiamati punti mentre gli elementi del
codominio, se sono numeri, vengono chiamati valori. La funzione 𝑓 avrà quindi valore
𝑓 (𝑎) nel punto 𝑎 . L’insieme di tutte le funzioni 𝑓 : 𝐴 → 𝐵 viene usualmente denotato
𝐵 𝐴 oppure 𝐴 → 𝐵. 𝐵𝐴

dominio
L’insieme di partenza 𝐴 viene chiamato dominio della funzione 𝑓 : 𝐴 → 𝐵, mentre
l’insieme di arrivo 𝐵 viene chiamato codominio. La funzione 𝑓 rappresenta quindi un codominio
modo di assegnare in maniera univoca ad ogni elemento del dominio un elemento del
codominio. Da un punto di vista informatico potremmo dire che 𝐴 è l’insieme dei
possibili input e 𝐵 è l’insieme dei possibili output della funzione 𝑓 .

Per come l’abbiamo definita, una funzione è dunque un insieme. In generale le funzioni
potrebbero essere definite in altri modi oppure potrebbero essere un concetto primitivo:
dunque nei capitoli seguenti useremo le funzioni senza assumere che esse siano a
loro volta degli insiemi. Ad esempio invece di scrivere (𝑎, 𝑏) ∈ 𝑓 scriveremo sempre
𝑓
𝑓 (𝑎) = 𝑏 oppure 𝑎 ↦→ 𝑏 . Sarà comunque molto importante considerare l’insieme che grafico
rappresenta 𝑓 ma questo verrà chiamato grafico di 𝑓 , 𝐺 𝑓 e potrà essere definito in
questo modo:
𝐺 𝑓 = {(𝑥, 𝑦) ∈ 𝐴 × 𝐵 : 𝑓 (𝑥) = 𝑦}.
Nella nostra costruzione risulta effettivamente 𝐺 𝑓 = 𝑓 ma, come abbiamo detto, in
generale è opportuno distinguere la funzione dal suo grafico. Uno degli argomenti
principali di questo corso è lo studio del grafico delle funzioni reali, cioè le funzioni
con dominio e codominio nell’insieme dei numeri reali.
10 1 fondamenti

Capita molto spesso che un fenomeno possa essere modellizzato matematicamente


tramite una funzione: si sa che ad un certo input 𝑎 corrisponde un output 𝑏 = 𝑓 (𝑎).
Molto spesso il problema da risolvere è quello di determinare l’input giusto 𝑎 per
ottenere l’output voluto 𝑏 . Questo problema corrisponde ad invertire la funzione 𝑓 :
dato 𝑏 ∈ 𝐵 determinare 𝑥 ∈ 𝐴 tale che 𝑓 (𝑥) = 𝑏 .

surgettiva Una funzione 𝑓 : 𝐴 → 𝐵 si dice essere surgettiva (o suriettiva) se per ogni 𝑏 ∈ 𝐵 esiste
almeno un 𝑥 ∈ 𝐴 per cui 𝑓 (𝑥) = 𝑏 . Questo significa che il problema dell’inversione
ha almeno una soluzione, qualunque sia 𝑏 ∈ 𝐵. Una funzione 𝑓 : 𝐴 → 𝐵 si dice
iniettiva essere iniettiva se non esistono due punti distinti 𝑎, 𝑎 ′ ∈ 𝐴, 𝑎 ≠ 𝑎 ′ tali che 𝑓 (𝑎) = 𝑓 (𝑎 ′).
Questo significa che il problema dell’inversione 𝑓 (𝑥) = 𝑏 ha al più una soluzione
bigettiva (la soluzione, se esiste, è unica). Una funzione 𝑓 : 𝐴 → 𝐵 si dice essere bigettiva (o
biettiva) o invertibile se è sia iniettiva che surgettiva. Questo significa che il problema
invertibile
dell’inversione 𝑓 (𝑥) = 𝑏 ha una unica soluzione 𝑥 ∈ 𝐴 qualunque sia 𝑏 ∈ 𝐵. In
Attenzione: in alcuni testi (tra cui [2])
si considerano invertibili le funzioni
particolare, se 𝑓 è invertibile, per ogni 𝑏 ∈ 𝐵 esiste un unico 𝑎 ∈ 𝐴 per cui 𝑓 (𝑎) = 𝑏 .
iniettive, anche se non surgettive. Se 𝑓 è una funzione invertibile allora la relazione inversa 𝑔 cioè la relazione tale che
𝑔 𝑓
𝑏 ↦→ 𝑎 quando 𝑎 ↦→ 𝑏 risulta essere una funzione 𝑔 : 𝐵 → 𝐴. Infatti 𝑔 è definita su
tutto 𝐵 in quanto 𝑓 è surgettiva e 𝑔 è univoca in quanto 𝑓 è iniettiva. Le proprietà
funzione inversa caratteristiche della funzione inversa 𝑔 sono:

∀𝑎 ∈ 𝐴 : 𝑔( 𝑓 (𝑎)) = 𝑎, ∀𝑏 ∈ 𝐵 : 𝑓 (𝑔(𝑏)) = 𝑏. (1.4)

La funzione inversa 𝑔 viene usualmente denotata con il simbolo 𝑓 −1 .


corrispondenza biunivoca
Se 𝑓 : 𝐴 → 𝐵 è bigettiva diremo che 𝐴 e 𝐵 sono in corrispondenza biunivoca tramite 𝑓 .
In effetti 𝑓 è una corrispondenza univoca da 𝐴 in 𝐵 (manda in modo univoco ogni
punto di 𝐴 in un punto di 𝐵) e 𝑓 −1 è una corrispondenza univoca da 𝐵 in 𝐴.

funzione composta Se 𝑓 : 𝐴 → 𝐵 e 𝑔 : 𝐵 → 𝐶 sono due funzioni in cui il codominio della prima coincide
con il dominio della seconda, allora definiamo la funzione composta 𝑔 ◦ 𝑓 : 𝐴 → 𝐶 che
si ottiene applicando prima 𝑓 e poi 𝑔 :

(𝑔 ◦ 𝑓 )(𝑥) = 𝑔( 𝑓 (𝑥))

ovvero
𝑓 𝑔
𝑥 ↦→ 𝑓 (𝑥) ↦→ (𝑔 ◦ 𝑓 )(𝑥).
Se il codominio di 𝑓 non coincide col dominio di 𝑔 è possibile dare comunque senso
alla funzione 𝑔 ◦ 𝑓 che risulta però definita solamente nei punti del dominio di 𝑓 che
vengono mandati, tramite 𝑓 nel dominio di 𝑔 .

Se 𝑓 : 𝐴 → 𝐵 è invertibile e 𝑓 −1 : 𝐵 → 𝐴 è la funzione inversa allora, per (1.4), 𝑓 −1 ◦ 𝑓


è la funzione identità di 𝐴 e 𝑓 ◦ 𝑓 −1 è la funzione identità di 𝐵 (la funzione identità
di un insieme 𝑋 è la funzione id : 𝑋 → 𝑋 che manda ogni elemento in sè stesso:
id(𝑥) = 𝑥 ).

Se 𝑓 : 𝐴 → 𝐴 è una funzione il cui dominio coincide con il codominio possiamo


comporre 𝑓 con se stessa e ottenere 𝑓 ◦ 𝑓 : 𝐴 → 𝐴. Si potrà quindi iterare e definire
𝑓 ◦ 𝑓 ◦ 𝑓 . . . Quando avremo definito i numeri naturali potremo porre 𝑓 2 = 𝑓 ◦ 𝑓 ,
𝑓 3 = 𝑓 ◦ 𝑓 ◦ 𝑓 etc. . . Analogamente se 𝑓 è bigettiva si potrà definire 𝑓 −2 = 𝑓 −1 ◦ 𝑓 −1 .
𝑓 −3 = 𝑓 −1 ◦ 𝑓 −1 ◦ 𝑓 −1 , etc. . .
1.5 cardinalità 11

Introduciamo ora delle notazioni che sarà comodo utilizzare nel seguito. Se 𝑓 : 𝐴 → 𝐵
è una funzione e se 𝐶 ⊆ 𝐴 definiamo

𝑓 (𝐶) = { 𝑓 (𝑎) : 𝑎 ∈ 𝐶} = {𝑏 ∈ 𝐵 : ∃𝑎 ∈ 𝐶 : 𝑏 = 𝑓 (𝑎)}.

L’insieme 𝑓 (𝐶) ⊆ 𝐵 si chiama immagine di 𝐶 (tramite 𝑓 ) ed è formato da tutti i punti che insieme immagine
si ottengono applicando 𝑓 agli elementi di 𝐶 . L’immagine 𝑓 (𝐴) dell’intero dominio 𝐴 si
chiama immagine di 𝑓 e si denota a volte con il simbolo Im 𝑓 . Si noti che 𝑓 è surgettiva se
e solo se 𝑓 (𝐴) = 𝐵 (cioè se l’immagine coincide col codominio). Ad esempio la funzione
definita in Figura 1.1 ha immagine 𝑓 (𝐴) = { 𝑓 (𝑎 1 ), 𝑓 (𝑎 2 ), 𝑓 (𝑎 3 ), 𝑓 (𝑎 4 )} = {𝑏 1 , 𝑏 2 , 𝑏 3 }.
Anche se 𝑓 : 𝐴 → 𝐵 non fosse iniettiva, per ogni 𝐶 ⊆ 𝐵 possiamo definire

𝑓 −1 (𝐶) = {𝑎 ∈ 𝐴 : 𝑓 (𝑎) ∈ 𝐶}.

L’insieme 𝑓 −1 (𝐶) ⊆ 𝐴 si chiama preimmagine o controimmagine di 𝐶 (tramite 𝑓 ) ed preimmagine


è formato da tutti i punti di 𝐴 che applicando 𝑓 vanno in 𝐶 . Si noti che se 𝑏 ∈ 𝐵
l’insieme 𝑓 −1 ({𝑏}) non è altro che l’insieme delle soluzioni dell’equazione 𝑓 (𝑥) = 𝑏 .
Come abbiamo già visto tale insieme contiene almeno un elemento se 𝑓 è suriettiva,
 −1un elemento se 𝑓 è iniettiva e contiene esattamente un elemento
contiene al più
𝑓 ({𝑏}) = 𝑓 (𝑏) se 𝑓 è bigettiva. Ad esempio se 𝑓 è la funzione definita in
−1

figura 1.1 si ha 𝑓 −1 ({𝑏 3 , 𝑏 4 }) = 𝑓 −1 ({𝑏 3 }) = {𝑎 2 , 𝑎 3 }, 𝑓 −1 ({𝑏 4 }) = ∅.


La notazione 𝑓 (𝐶) appena introdotta è formalmente ambigua in quanto potrebbe non
essere chiaro se 𝐶 è un elemento oppure un sottoinsieme del dominio di 𝑓 . In pratica
il contesto dovrebbe rendere chiaro cosa si intende.
Più in generale ci capiterà di estendere questo abuso di notazione non solo alle funzioni,
ma anche alle relazioni e alle operazioni. Ad esempio se 𝐴 e 𝐵 sono insiemi di numeri
ci capiterà di scrivere 𝐴 ≤ 𝐵 per intendere che ogni elemento di 𝐴 è minore o uguale
ad ogni elemento di 𝐵 oppure 𝐴 + 𝐵 per intendere l’insieme di tutti i numeri che si
ottengono sommando un numero di 𝐴 ad un numero di 𝐵.

Esercizio 1.10. Si verifichi che la composizione di funzioni iniettive è iniettiva e la composi-


zione di funzione suriettive è suriettiva (e di conseguenza la composizione di funzioni bigettive
è bigettiva).
Si verifichi che, se 𝑓 : 𝐴 → 𝐵 e 𝑔 : 𝐵 → 𝐶 sono bigettive, si ha

(𝑔 ◦ 𝑓 )−1 = 𝑓 −1 ◦ 𝑔 −1 .

Esercizio 1.11. Sia 𝑓 : 𝐴 → 𝐵 una funzione qualunque. Si verifichi che se 𝐶 ⊆ 𝐴 e 𝐷 ⊆ 𝐵


si ha
𝑓 −1 ( 𝑓 (𝐶)) ⊇ 𝐶, 𝑓 ( 𝑓 −1 (𝐷)) ⊆ 𝐷.

Che ipotesi possiamo fare su 𝑓 per avere l’uguaglianza 𝑓 ( 𝑓 −1 (𝐶)) = 𝐶 ? E per avere
𝑓 −1 ( 𝑓 (𝐷)) = 𝐷 ?

1.5 cardinalità

Definizione 1.12 (cardinalità). Diremo che due insiemi 𝐴 e 𝐵 hanno la stessa cardinalità cardinalità
12 1 fondamenti

(oppure sono equipotenti) se esiste una funzione bigettiva 𝑓 : 𝐴 → 𝐵. Scriveremo in tal caso:

#𝐴 = #𝐵.

Se esiste una funzione iniettiva 𝑓 : 𝐴 → 𝐵 significa che 𝐴 ha la stessa cardinalità di un


sottoinsieme di 𝐵 (in quanto 𝑓 : 𝐴 → 𝑓 (𝐴) risulta essere bigettiva). Scriveremo in tal caso:

#𝐴 ≤ #𝐵.

Intuitivamente se due insiemi hanno la stessa cardinalità significa che hanno lo stesso
numero di elementi. Ma la precedente definizione riesce a catturare tale concetto
senza dover ricorrere al concetto di numero. Questo ha il vantaggio di rendere questa
definizione applicabile a qualunque insieme, anche con infiniti elementi.

Si osservi che non abbiamo dato una definizione di #𝐴 e quindi non stiamo definendo
cos’è la cardinalità di un insieme ma stiamo soltanto definendo una relazione tra
insiemi che denotiamo, impropriamente, utilizzando una uguaglianza: #𝐴 = #𝐵. E’
ovvio che #𝐴 = #𝐴 in quanto l’identità id : 𝐴 → 𝐴 è bigettiva. E’ anche chiaro che
se #𝐴 = #𝐵 e #𝐵 = #𝐶 allora #𝐴 = #𝐶 in quanto componendo tra loro due funzioni
bigettive si ottiene ancora una funzione bigettiva. E’ anche chiaro che se #𝐴 = #𝐵 allora
#𝐴 ≤ #𝐵 (in quanto le funzioni bigettive sono iniettive) ed è chiaro che se #𝐴 ≤ #𝐵 e
#𝐵 ≤ #𝐶 allora #𝐴 ≤ #𝐶 (in quanto composizione di funzioni iniettive è iniettiva)

Si potrebbe anche definire #𝐴 ≥ #𝐵 quando esiste 𝑓 : 𝐴 → 𝐵 surgettiva. Vorremmo


verificare se questo coincide con #𝐵 ≤ #𝐴, cioè vogliamo avere il seguente.

Teorema 1.13. Esiste 𝑓 : 𝐴 → 𝐵 surgettiva se e solo se esiste 𝑔 : 𝐵 → 𝐴 iniettiva.

Questa funzione 𝑓 si chiama inversa sini-


stra di 𝑔 in quanto si ha 𝑓 (𝑔(𝑦)) = 𝑦 per
Dimostrazione. Da un lato se esiste 𝑔 : 𝐵 → 𝐴 iniettiva, allora 𝑔 è una bigezione tra 𝐵 e
ogni 𝑦 ∈ 𝐵 𝑓 (𝐵). La funzione inversa 𝑓 : 𝑓 (𝐵) → 𝐵 può essere estesa a tutto 𝐴 fissando un valore
qualunque (questo si può fare se 𝐵 non è vuoto) nei punti di 𝐴 \ 𝑔(𝐵). ottenendo
quindi una funzione surgettiva da 𝐴 in 𝐵. D’altro lato se esiste una funzione 𝑓 : 𝐴 → 𝐵
surgettiva, per ogni 𝑏 ∈ 𝐵 l’insieme 𝑓 −1 ({𝑏}) non è mai vuoto e quindi è chiaro che
Questa funzione 𝑔 si chiama inversa de-
stra di 𝑓 in quanto 𝑓 (𝑔(𝑦)) = 𝑦 per ogni
debba esistere una funzione 𝑔 : 𝐵 → 𝐴 tale che 𝑔(𝑏) è un qualunque elemento di tale
𝑦∈𝐵 insieme (qui si utilizza l’assioma 1.14 discusso più sotto). Chiaramente 𝑔 è iniettiva.

Nella dimostrazione del teorema precedente abbiamo utilizzato il seguente assioma


della teoria degli insiemi che, sorprendentemente, non è conseguenza degli assiomi
che abbiamo già introdotto finora.

Assioma 1.14 (della scelta). Sia 𝐹 : 𝐴 → P(𝐵) una funzione tale che 𝐹(𝑎) ≠ ∅ per ogni
𝐴𝐶 𝑎 ∈ 𝐴. Allora esiste una funzione 𝑓 : 𝐴 → 𝐵 tale che 𝑓 (𝑎) ∈ 𝐹(𝑎) per ogni 𝑎 ∈ 𝐴.

L’assioma della scelta (denotato spesso con 𝐴𝐶 , axiom of choice) è un assioma per
𝑍𝐹 certi versi controverso e alcuni matematici preferiscono non utilizzarlo nelle loro
𝑍𝐹𝐶 dimostrazioni. Il sistema formale che definisce la teoria degli insiemi senza introdurre
l’assioma della scelta si chiama 𝑍𝐹 (Zermelo-Fraenkel) mentre se si aggiunge l’assioma
della scelta (choice) la teoria si chiama 𝑍𝐹𝐶 .
1.5 cardinalità 13

𝐴
𝐴\𝐵
𝐵

Figura 1.2: Nella dimostrazione del teo-


rema di Cantor-Bernstein 𝐴 è rappresen-
tato da un quadrato e 𝐵 da un cerchio
contenuto in 𝐴. L’immagine di 𝐴 in 𝐵 è
rappresentata da un quadrato contenuto
in 𝐵 e così via. La parte ombreggiata è
l’insieme 𝐷 .

Il seguente teorema dimostra la proprietà antisimmetrica della relazione tra cardinalità.


E’ probabilmente il primo vero teorema (con dimostrazione decisamente non banale)
che andiamo a dimostrare.

Teorema 1.15 (Cantor-Bernstein). Se #𝐴 ≤ #𝐵 e #𝐵 ≤ #𝐴 allora #𝐴 = #𝐵.

Dimostrazione. Per ipotesi sappiamo che esiste 𝑔 : 𝐵 → 𝐴 iniettiva. Posto 𝐵′ = 𝑔(𝐵)


risulta che 𝑔 : 𝐵 → 𝐵′ è bigettiva. Ma allora dimostrare che esiste una bigezione tra
𝐴 e 𝐵 è equivalente a dimostrare che esiste una bigezione tra 𝐴 e 𝐵′. Dunque senza
perdere di generalità, sostituendo 𝐵′ a 𝐵 possiamo supporre che sia 𝐵 ⊆ 𝐴.

Essendo per ipotesi #𝐴 ≤ #𝐵 esiste 𝑓 : 𝐴 → 𝐵 iniettiva. Intuitivamente l’idea è quella


di definire l’insieme

𝐷 = (𝐴 \ 𝐵) ∪ 𝑓 (𝐴 \ 𝐵) ∪ 𝑓 2 (𝐴 \ 𝐵) ∪ . . .

e di definire la bigezione 𝜑 : 𝐴 → 𝐵 mandando ogni "buccia" 𝑓 𝑛 (𝐴 \ 𝐵) in 𝑓 𝑛+1 (𝐴 \ 𝐵)


e lasciando fisso il resto di 𝐵.

Per farlo in maniera rigorosa consideriamo la famiglia di insiemi F = {𝑋 ⊆ 𝐴 : 𝑋 ⊇


𝐴 \ 𝐵, 𝑓 (𝑋) ⊆ 𝑋} e definiamo 𝐷 = F. Osserviamo che 𝐴 ∈ F quindi F ≠ ∅.
T

E’ facile verificare che 𝑓 (𝐷) ⊆ 𝐷 infatti dato 𝑥 ∈ 𝐷 per ogni 𝑋 ∈ F deve essere 𝑥 ∈ 𝑋
ma allora 𝑓 (𝑥) ∈ 𝑋 (per come è definito F), dunque 𝑓 (𝑥) ∈ 𝐷 . In modo analogo si
dimostra che 𝐷 ⊇ 𝐴 \ 𝐵 e dunque concludiamo che 𝐷 ∈ F.

Verifichiamo ora che 𝑓 (𝐷) = 𝐷 ∩ 𝐵. Da un lato se 𝑥 ∈ 𝐷 allora 𝑓 (𝑥) ∈ 𝑓 (𝐷) ⊆ 𝐷


e 𝑓 (𝑥) ⊆ 𝑓 (𝐴) ⊆ 𝐵 da cui 𝑓 (𝑥) ∈ 𝐷 ∩ 𝐵. Dall’altro lato se 𝑦 ∈ 𝐷 ∩ 𝐵 e non fosse
𝑦 ∈ 𝑓 (𝐷) allora potremmo considerare l’insieme 𝑋 = 𝐷 \ {𝑦} e osservare che 𝑋 ∈ F.
Infatti in primo luogo 𝑋 ⊇ 𝐴 \ 𝐵 in quanto 𝐷 ha questa proprietà e 𝑦 ∈ 𝐵. Inoltre dato
qualunque 𝑥 ∈ 𝑋 visto che 𝑋 ⊆ 𝐷 allora 𝑓 (𝑥) ∈ 𝑓 (𝐷) e, per ipotesi, 𝑦 ∉ 𝑓 (𝐷) dunque
𝑓 (𝑥) ≠ 𝑦 da cui 𝑓 (𝑥) ∈ 𝑋 . Dunque 𝑋 ∈ F ma allora dovrebbe essere 𝐷 ⊆ 𝑋 mentre
per costruzione abbiamo 𝑦 ∈ 𝐷 ma non in 𝑋 .

Possiamo allora definire 𝜑 : 𝐴 → 𝐵


(
𝑓 (𝑥) se 𝑥 ∈ 𝐷,
𝜑(𝑥) =
𝑥 altrimenti.
14 1 fondamenti

Chiaramente 𝜑 è iniettiva in quanto 𝑓 è iniettiva e manda 𝐷 in 𝐷 e l’identità è iniettiva


e manda 𝐴 \ 𝐷 in 𝐴 \ 𝐷 .

Per dimostrare che 𝜑 è suriettiva consideriamo qualunque 𝑦 ∈ 𝐵. Se 𝑦 ∉ 𝐷 allora


𝜑(𝑦) = 𝑦 . Se invece 𝑦 ∈ 𝐷 essendo 𝑦 ∈ 𝐷 ∩ 𝐵 = 𝑓 (𝐷) esisterà 𝑥 ∈ 𝐷 tale che
𝜑(𝑥) = 𝑓 (𝑥) = 𝑦 .

1.6 i numeri naturali

I numeri naturali 0 , 1 , 2 , . . . sono i numeri che utilizziamo per contare o per fare le
iterazioni. C’è un primo numero naturale, che per noi sarà 0 e poi per ogni numero
naturale 𝑛 ce n’é uno successivo che chiameremo 𝜎(𝑛). Partendo da 0 e passando al
successivo si raggiungono tutti i numeri naturali. Queste proprietà si formalizzano
Giuseppe Peano (1858–1932), matemati-
come segue.
co torinese, contribuì a porre i fondamen-
ti della logica matematica. La notazione
∃ per il quantificatore universale si deve
a lui.
Definizione 1.16 (assiomi di Peano). Un insieme ℕ dotato di una funzione 𝜎 : ℕ → ℕ
e di un elemento 0 ∈ ℕ si dice essere un insieme di numeri naturali se valgono le seguenti
numeri naturali
proprietà:
La proprietà 1 ci dice che 𝜎 è iniettiva, la
2 che 𝜎 non è surgettiva. La 3 potrebbe es-
1. se 𝜎(𝑚) = 𝜎(𝑛) allora 𝑚 = 𝑛 ;
sere chiamata proprietà induttiva in quan-
to vedremo che garantisce la validità del 2. per ogni 𝑛 ∈ ℕ si ha 𝜎(𝑛) ≠ 0;
principio di induzione. 3. se 𝐴 ⊆ ℕ è un sottoinsieme tale che
i) 0 ∈ 𝐴;
ii) 𝑛 ∈ 𝐴 =⇒ 𝜎(𝑛) ∈ 𝐴
La definizione originale di Peano pren-
deva 1 come primo numero naturale ma allora 𝐴 = ℕ .
nella matematica moderna risulta più
comodo includere anche 0 tra i numeri
naturali, così come si considera il vuoto Il simbolo ℕ è riservato agli insiemi che soddisfano la precedente definizione. Vedremo
tra gli insiemi. nel teorema 1.35 che tali insiemi sono tra loro indistinguibili e quindi potremo dire “ℕ
è l’insieme dei numeri naturali” piuttosto che “ℕ è un insieme di numeri naturali”. Ad
esempio se ℕ è un insieme di numeri naturali anche ℕ∗ = ℕ \ {0} lo è scegliendo però
successore
1 ∈ ℕ∗ al posto di 0 ∈ ℕ .
zero

cifre decimali
Dato 𝑛 ∈ ℕ il numero 𝜎(𝑛) si chiama il successore di 𝑛 . Il numero 0 ∈ ℕ che per assioma
non è il successore di nessun’altro numero naturale si chiama zero. Per comodità diamo
un nome alle cifre decimali ovvero ai primi numeri naturali:

1 = 𝜎(0), 2 = 𝜎(1), 3 = 𝜎(2), 4 = 𝜎(3), 5 = 𝜎(4),


(1.5)
6 = 𝜎(5), 7 = 𝜎(6), 8 = 𝜎(7), 9 = 𝜎(8)

cosicché intuiamo come la funzione 𝜎 rappresenti l’usuale operazione del contare:

contare 𝜎 𝜎 𝜎 𝜎 𝜎 𝜎 𝜎
0 ↦→ 1 ↦→ 2 ↦→ 3 ↦→ 4 ↦→ 5 ↦→ 6 ↦→ . . .

Il primi due assiomi servono a garantire che in questo processo del contare troviamo
sempre numeri diversi (non si torna mai indietro) in quanto nessun numero può avere
come successore 0 o un numero già incontrato in precedenza (che se non è zero è il
successore di un altro numero).
1.6 i numeri naturali 15

L’ultimo assioma serve a garantire che questo processo del contare esaurisca tutti i
numeri naturali, e che quindi non ci siano dei naturali irraggiungibili partendo da
zero.

Normalmente la proprietà induttiva dei numeri naturali viene utilizzata tramite il


seguente meta-teorema. Il principio di induzione non è un teore-
ma della teoria degli insiemi in quanto
si riferisce il concetto di predicato che è
Teorema 1.17 (principio di induzione). Sia 𝑃(𝑛) un predicato. Se esterno al sistema stesso.

1. vale 𝑃(0) e
2. ∀𝑛 ∈ ℕ : 𝑃(𝑛) =⇒ 𝑃(𝑛 + 1)

allora 𝑃(𝑛) è verificato per ogni 𝑛 ∈ ℕ .

Dimostrazione. Consideriamo l’insieme 𝐴 = {𝑛 ∈ ℕ : 𝑃(𝑛)}. Grazie alle ipotesi del


teorema possiamo applicare la proprietà induttiva dei numeri naturali per dedurre
che 𝐴 = ℕ . Dunque 𝑃(𝑛) è soddisfatta per ogni 𝑛 ∈ ℕ .

Il fatto che 𝜎 : ℕ → ℕ sia iniettiva ma non suriettiva significa che ℕ può essere messo in
corrispondenza biunivoca con 𝜎(ℕ ) che è un sottoinsieme proprio di ℕ . In particolare
#ℕ = #(ℕ \ {0}). Questa proprietà è per certi versi paradossale (paradosso di Galileo)
Galileo Galilei (1564–1642) osservò che
e caratterizza gli insiemi infiniti, nel senso di Dedekind.
i quadrati perfetti: 1 , 4 , 9 , 16 , . . . sono
da un lato una piccola parte di tutti i
Definizione 1.18 (infinito). Diremo che un insieme 𝑋 è finito (più precisamente: Dedekind- numeri naturali (questi numeri si distan-
ziano sempre di più tra loro) ma d’altro
finito) se ogni funzione iniettiva 𝑓 : 𝑋 → 𝑋 è bigettiva.
canto sono tanti quanti i numeri natu-
rali perché la corrispondenza 𝑛 ↦→ 𝑛 2 è
Diremo che un insieme 𝑋 è infinito (più precisamente Dedekind-infinito) se non è finito ovvero
biunivoca.
se se esiste 𝑓 : 𝑋 → 𝑋 iniettiva ma non suriettiva.
insieme finito

In particolare un insieme infinito può essere messo in corrispondenza biunivoca con insieme infinito
una sua parte propria in quanto 𝑓 : 𝑋 → 𝑓 (𝑋) è bigettiva e 𝑋 \ 𝑓 (𝑋) ≠ ∅. Un sottoinsieme 𝐴 di un insieme di 𝑋 si
chiama anche parte. Se 𝐴 ⊆ 𝑋 , 𝐴 ≠ 𝑋 si
Se 𝑋 è un qualunque insieme infinito, dentro 𝑋 possiamo costruire un insieme che dice che 𝐴 è una parte propria di 𝑋 .
soddisfa gli assiomi di Peano. Infatti fissata 𝑓 : 𝑋 → 𝑋 iniettiva ma non suriettiva L’insieme ℕ dei numeri naturali è il più
basta scegliere 0 ∈ 𝑋 \ 𝑓 (𝑋). Dopodiché diciamo che un sottoinsieme 𝐼 ⊆ 𝑋 è induttivo piccolo insieme infinito
se 0 ∈ 𝐼 e se 𝑛 ∈ 𝐼 =⇒ 𝑓 (𝑛) ∈ 𝐼 . Possiamo quindi definire: induttivo
\
ℕ= 𝐼
𝐼 ⊆ 𝑋 induttivo

e osservare che ovviamente ℕ stesso è un sottoinsieme induttivo di 𝑋 . Dunque se


𝑛 ∈ ℕ si ha 𝑓 (𝑛) ∈ ℕ e quindi la restrizione di 𝑓 a ℕ è una funzione 𝜎 : ℕ → ℕ che è
certamente iniettiva (in quanto restrizione di una funzione iniettiva) non è suriettiva
(in quanto 0 non è nell’immagine di 𝑓 e tantomeno nell’immagine di 𝜎 ) e soddisfa la
proprietà induttiva perché se prendiamo 𝐴 ⊆ ℕ tale che 0 ∈ 𝐴 e 𝑛 ∈ 𝐴 =⇒ 𝜎(𝑛) ∈ 𝐴
allora significa che 𝐴 è induttivo e quindi, per come è definito ℕ , deve essere ℕ ⊆ 𝐴.
Dunque 𝐴 = ℕ . Questa osservazione ci dice che se ℕ e
ℕ′ sono due diversi insiemi di numeri
La costruzione precedente ci dice che l’insieme ℕ è il più piccolo insieme infinito nel naturali allora #ℕ ≤ #ℕ′ e #ℕ′ ≤ #ℕ per
cui, grazie al teorema 1.15, #ℕ = #ℕ′ . Nel
senso che: se 𝑋 è infinito allora #𝑋 ≥ #ℕ . teorema 1.35 vedremo che non solo esiste
una corrispondenza biunivoca tra ℕ e
Per garantire l’esistenza dell’insieme dei numeri naturali basta quindi supporre che
ℕ′ ma che esiste una corrispondenza che
esista almeno un insieme infinito. Sarà opportuno prendere questo come assioma preserva la struttura (cioè l’operazione
𝜎).
16 1 fondamenti

perché se esaminiamo gli assiomi che abbiamo introdotto finora non c’è modo di
costruire un insieme infinito.

Assioma 1.19 (infinito). Esiste un insieme infinito. E non è restrittivo supporre che tale
insieme sia un insieme ℕ che soddisfa gli assiomi di Peano.

Ora che abbiamo l’insieme infinito ℕ si pone la questione di come sarà possibile
definire delle funzioni su tale insieme. Non essendo possibile elencare tutti i valori
della funzione possiamo optare per utilizzare la proprietà induttiva: per definire
𝑓 : ℕ → 𝑋 basterà dire quanto vale 𝑓 (0) e dare una regola per definire 𝑓 (𝑛 + 1) a
partire da 𝑓 (𝑛).

Teorema 1.20 (definizione per induzione). Sia 𝑋 un insieme, sia 𝛼 ∈ 𝑋 e sia 𝑔 : 𝑋 → 𝑋


una funzione. Allora esiste una unica funzione 𝑓 : ℕ → 𝑋 tale che
(
𝑓 (0) = 𝛼,
(1.6)
𝑓 (𝜎(𝑛)) = 𝑔( 𝑓 (𝑛)).

Si avrà dunque

𝑓 (0) = 𝛼, 𝑓 (1) = 𝑔(𝛼), 𝑓 (2) = 𝑔(𝑔(𝛼)), 𝑓 (3) = 𝑔(𝑔(𝑔(𝛼))) . . .

Più in generale se abbiamo 𝛼 ∈ 𝑋 e una funzione 𝑔 : ℕ × 𝑋 → 𝑋 esisterà una unica funzione


𝑓 : ℕ → 𝑋 tale che (
𝑓 (0) = 𝛼,
(1.7)
𝑓 (𝜎(𝑛)) = 𝑔(𝑛, 𝑓 (𝑛)).

Dimostrazione. Dobbiamo ricordarci che le funzioni 𝑓 : ℕ → 𝑋 non sono altro che


relazioni e cioè sottoinsiemi del prodotto ℕ × 𝑋 . L’idea è quindi di prendere il più
piccolo sottoinsieme di ℕ × 𝑋 che possa rappresentare una funzione con le proprietà
richieste. Consideriamo dunque la famiglia di insiemi:

F = {𝐹 ∈ P(ℕ × 𝑋) : (0 , 𝛼) ∈ 𝐹, (𝑛, 𝑥) ∈ 𝐹 ⇒ (𝜎(𝑛), 𝑔(𝑥)) ∈ 𝐹}.

Chiaramente F non è vuota in quanto ℕ × 𝑋 ∈ F. Possiamo dunque farne l’intersezione


e definire un insieme 𝑓 : \
𝑓 = 𝐹.
𝐹∈F

L’insieme 𝑓 che abbiamo definito rappresenta una relazione tra ℕ e 𝑋 . Visto che
(0 , 𝛼) ∈ 𝐹 per ogni 𝐹 ∈ F dovrà essere (0 , 𝛼) ∈ 𝑓 . Inoltre se (𝑛, 𝑥) ∈ 𝑓 allora (𝑛, 𝑥) ∈ 𝐹
per ogni 𝐹 ∈ F e quindi (𝜎(𝑛), 𝑔(𝑥)) ∈ 𝐹 per ogni 𝐹 ∈ F da cui (𝜎(𝑛), 𝑔(𝑥)) ∈ 𝑓 .
Significa che 𝑓 ∈ F.

Vogliamo ora dimostrare che 𝑓 è una funzione, cioè che è univocamente definita
su tutto ℕ . Per prima cosa consideriamo l’insieme su cui 𝑓 è definita e cioè 𝐴 =
{𝑛 ∈ ℕ : ∃𝑥 ∈ 𝑋 : (𝑛, 𝑥) ∈ 𝑓 } e dimostriamo, per induzione, che 𝐴 = ℕ . In effetti
(0 , 𝛼) ∈ 𝑓 quindi 0 ∈ 𝐴. E se 𝑛 ∈ 𝐴 sappiamo che esiste 𝑥 ∈ 𝑋 tale che (𝑛, 𝑥) ∈ 𝑓 e
dunque, essendo 𝑓 ∈ F, anche (𝜎(𝑛), 𝑔(𝑥)) ∈ 𝑓 da cui 𝜎(𝑛) ∈ 𝐴. Abbiamo dimostrato
che 𝑓 è definita su tutto ℕ .
1.6 i numeri naturali 17

Dimostriamo ora che 𝑓 è univoca. Consideriamo l’insieme su cui 𝑓 è univocamente


definita: 𝐵 = {𝑛 ∈ ℕ : ∃! 𝑥 ∈ 𝑋 : (𝑛, 𝑥) ∈ 𝑓 }. Di nuovo vogliamo dimostrare per
induzione che 𝐵 = ℕ . Per dimostrare che 0 ∈ 𝐵, visto che già sappiamo che (0 , 𝛼) ∈ 𝑓 ,
dobbiamo dimostrare che se 𝑥 ≠ 𝛼 si ha (0 , 𝑥) ∉ 𝑓 . Sia dunque 𝑥 ≠ 𝛼 e consideriamo
l’insieme 𝐹 = 𝑓 \ {(0 , 𝑥)}. Chiaramente 𝐹 ∈ F in quanto (0 , 𝛼) ∈ 𝐹 visto che (0 , 𝛼) ∈ 𝑓
e (0 , 𝛼) ≠ (0 , 𝑥) inoltre se (𝑛, 𝑦) ∈ 𝐹 allora (𝑛, 𝑦) ∈ 𝑓 e quindi (𝜎(𝑛), 𝑔(𝑦)) ∈ 𝑓 . Ma
certamente (𝜎(𝑛), 𝑔(𝑦)) ≠ (0 , 𝑥) in quanto 𝜎(𝑛) ≠ 0 dunque (𝜎(𝑛), 𝑔(𝑦)) ∈ 𝐹 . Visto
che 𝐹 ∈ F si deve avere 𝑓 ⊆ 𝐹 e dunque (0 , 𝑥) ∉ 𝑓 . Dunque 𝑓 è univocamente definita
in 0.

Dobbiamo ora mostrare che se 𝑛 ∈ 𝐵 anche 𝜎(𝑛) ∈ 𝐵. Se 𝑛 ∈ 𝐵 significa che c’è un


unico 𝑥 ∈ 𝑋 tale che (𝑛, 𝑥) ∈ 𝑓 e certamente anche (𝜎(𝑛), 𝑔(𝑥)) ∈ 𝑓 . Prendiamo allora
𝑦 ≠ 𝑔(𝑥), vorremo dimostrare che (𝜎(𝑛), 𝑦) ∉ 𝑓 . Consideriamo, similmente a prima,
l’insieme 𝐹 = 𝑓 \ {(𝜎(𝑛), 𝑦)} e cerchiamo di dimostrare che 𝐹 ∈ F. Chiaramente
(0 , 𝛼) ∈ 𝐹 perché (0 , 𝛼) ∈ 𝑓 e non può essere (0 , 𝛼) = (𝜎(𝑛), 𝑦) in quanto 𝜎(𝑛) ≠
0. Se ora supponiamo che sia (𝑚, 𝑧) ∈ 𝐹 certamente sarà (𝑚, 𝑧) ∈ 𝑓 e dunque
(𝜎(𝑚), 𝑔(𝑧)) ∈ 𝑓 : dobbiamo mostrare che (𝜎(𝑚), 𝑔(𝑧)) ∈ 𝐹 . D’altra parte se fosse
(𝜎(𝑚), 𝑔(𝑧)) = (𝜎(𝑛), 𝑦) dovrebbe essere 𝑚 = 𝑛 in quanto 𝜎 è iniettiva. Ma visto che
𝑓 è univocamente definita su 𝑛 dovrà allora essere anche (𝑛, 𝑧) = (𝑛, 𝑥) e quindi
𝑔(𝑧) = 𝑔(𝑥) ≠ 𝑦 . Dunque (𝜎(𝑚), 𝑔(𝑧)) ∈ 𝐹 e 𝐹 ∈ F. Ma allora 𝑓 ⊆ 𝐹 e quindi
(𝜎(𝑛), 𝑦) ∉ 𝑓 . Significa che 𝑓 è univocamente definita anche in 𝜎(𝑛). Per induzione
𝐵 = ℕ ed 𝑓 è una funzione 𝑓 : ℕ → 𝑋 .

Ovviamente visto che 𝑓 ∈ F sappiamo che 𝑓 soddisfa le proprietà richieste dal teorema.

Nella seconda parte del teorema, dove 𝑔 : ℕ × 𝑋 → 𝑋 , possiamo considerare l’insieme


𝑌 = ℕ × 𝑋 e la funzione 𝐺 : 𝑌 → 𝑌 definita da 𝐺(𝑛, 𝑥) = (𝜎(𝑛), 𝑔(𝑛, 𝑥)). Allora
applicando la prima parte possiamo trovare 𝐹 : ℕ → 𝑌 tale che 𝐹(0) = (0 , 𝛼) e
𝐹(𝜎(𝑛)) = 𝐺(𝐹(𝑛)). Basterà prendere come 𝑓 (𝑛) la seconda componente di 𝐺(𝑛).

Useremo le definizioni per induzione per definire le iterazioni e le operazioni elementari


sui numeri naturali.

iterazioni e addizione

Data una qualunque funzione 𝑓 : 𝑋 → 𝑋 di un insieme 𝑋 in sé, possiamo fare la


composizione di 𝑓 con se stessa, e iterare il procedimento:

𝑓 ◦ 𝑓 : 𝑋 → 𝑋, ( 𝑓 ◦ 𝑓 )(𝑥) = 𝑓 ( 𝑓 (𝑥)),
La notazione 𝑓 𝑛 è ambigua in quanto
𝑓 ◦ 𝑓 ◦ 𝑓 : 𝑋 → 𝑋, ( 𝑓 ◦ 𝑓 ◦ 𝑓 )(𝑥) = 𝑓 ( 𝑓 ( 𝑓 (𝑥))), . . .
può rappresentare sia l’iterazione del-
la funzione composta, sia l’iterazione
Utilizzando i numeri naturali possiamo definire, per induzione, la funzione 𝑓 𝑛 : 𝑋 → 𝑋 dell’operazione di prodotto (ovvero la
per ogni 𝑛 ∈ ℕ (iterata 𝑛 -esima): potenza 𝑛 -esima): 𝑓 2 (𝑥) = 𝑓 ( 𝑓 (𝑥)) op-
pure 𝑓 2 (𝑥) = 𝑓 (𝑥) · 𝑓 (𝑥). Sarà il contesto
a suggerire quale sia il significato inteso
(
𝑓 0 (𝑥) = 𝑥, ∀𝑥 ∈ 𝑋 , con questa notazione.
(1.8)
𝑓 𝑛+1 (𝑥) = 𝑓 ( 𝑓 𝑛 (𝑥)), ∀𝑥 ∈ 𝑋.
18 1 fondamenti

Esempio 1.21. Sia 𝑋 = {1 , 2 , 3} e 𝑓 : 𝑋 → 𝑋 , 𝑓 = {1 ↦→ 2 , 2 ↦→ 2 , 3 ↦→ 1}. Allora le


iterate di 𝑓 sono:

𝑓 0 = {1 ↦→ 1 , 2 ↦→ 2, 3 ↦→ 3} = identità,
𝑓 1 = {1 ↦→ 2 , 2 ↦→ 2, 3 ↦→ 1} = 𝑓 ,
𝑓 2 = {1 ↦→ 2 , 2 ↦→ 2, 3 ↦→ 2} = 𝑓 ◦ 𝑓

e (lo si dimostri per induzione) per ogni 𝑛 ≥ 2 si ha 𝑓 𝑛 = 𝑓 2 .

Iterando la funzione successore 𝜎 : ℕ → ℕ possiamo definire l’operazione di addizio-


addizione ne:
𝑛 + 𝑚 = 𝜎 𝑚 (𝑛).
Ad esempio:
2 + 3 = 𝜎 3 (2) = 𝜎(𝜎(𝜎(2))) = 𝜎(𝜎(𝜎(𝜎(𝜎(0))))) = 5.

In generale per definire una operazione (binaria) ∗ su un insieme 𝑋 possiamo pensare


a ∗ come una funzione ∗ : 𝑋 → (𝑋 → 𝑋) cioè una funzione che ad ogni elemento
𝑥 ∈ 𝑋 associa una funzione ∗(𝑥) : 𝑋 → 𝑋 che a sua volta ad ogni elemento 𝑦 associa il
valore ∗(𝑥)(𝑦) che denotiamo tramite notazione infissa:

𝑥 ∗ 𝑦 = ∗(𝑥)(𝑦).

Spesso, tralasciando le parentesi, denoteremo con ∗𝑥 la funzione ∗(𝑥). Potremo quindi


anche scrivere 𝑥 ∗ 𝑦 = (∗𝑥)(𝑦).

Dunque l’addizione su ℕ può essere definita banalmente come +𝑚 = 𝜎 𝑚 cosicché si


ha effettivamente
𝑛 + 𝑚 = (+𝑚)(𝑛) = 𝜎 𝑚 (𝑛).
Una operazione binaria ∗ si può anche
identificare con una funzione ∗ : ℕ ×ℕ →
ℕ.
Osservando che 𝑛 + 1 = 𝜎 1 (𝑛) = 𝜎(𝑛) potremo d’ora in poi scrivere 𝑛 + 1 al posto di
𝜎(𝑛) ed abbandonare la funzione 𝜎.

Osserviamo che, per come è stata definita, grazie alle proprietà (1.8) dell’iterazione,
si ha 𝑛 + 0 = 𝜎 0 (𝑛) = 𝑛 e 𝑛 + 𝜎(𝑚) = 𝜎 𝜎(𝑚) (𝑛) = 𝜎(𝜎 𝑚 (𝑛)). Dunque l’addizione
soddisfa le seguenti proprietà, che caratterizzano l’addizione tramite una definizione
per induzione: (
𝑛 + 0 = 𝑛,
𝑛 + (𝑚 + 1) = (𝑛 + 𝑚) + 1
Possiamo da queste dedurre le altre ben note proprietà della somma.

Teorema 1.22. L’addizione su ℕ soddisfa le seguenti

1. proprietà associativa: (𝑛 + 𝑚) + 𝑘 = 𝑛 + (𝑚 + 𝑘),


2. elemento neutro: 𝑛 + 0 = 0 + 𝑛 = 𝑛 ,
3. proprietà commutativa: 𝑛 + 𝑚 = 𝑚 + 𝑛 ,
4. proprietà invariantiva: se 𝑚 + 𝑘 = 𝑛 + 𝑘 allora 𝑚 = 𝑛 .

Dimostrazione. Per la proprietà associativa facciamo la dimostrazione per induzione


su 𝑘 . Se 𝑘 = 0 è chiaro che (𝑛 + 𝑚) + 0 = 𝑛 + 𝑚 = 𝑛 + (𝑚 + 0). Supponendo
1.6 i numeri naturali 19

ora di sapere che vale (𝑛 + 𝑚) + 𝑘 = 𝑛 + (𝑚 + 𝑘) cerchiamo di dimostrare che


(𝑛 + 𝑚) + (𝑘 + 1) = 𝑛 + (𝑚 + (𝑘 + 1)). Ricordando la definizione induttiva di addizione
e usando l’ipotesi induttiva si ha

(𝑛 + 𝑚) + (𝑘 + 1) = ((𝑛 + 𝑚) + 𝑘) + 1 = (𝑛 + (𝑚 + 𝑘)) + 1
= 𝑛 + ((𝑚 + 𝑘) + 1) = 𝑛 + (𝑚 + (𝑘 + 1))

come volevamo dimostrare.

Per quanto riguarda l’elemento neutro sappiamo per definizione che 𝑛 + 0 = 𝑛 .


Dimostriamo per induzione che vale anche 0 + 𝑛 = 𝑛 . Per 𝑛 = 0 si riconduce al primo
caso. Supponendo per induzione che valga 0 + 𝑛 = 𝑛 possiamo osservare che per la
definizione di addizione si ha:

0 + (𝑛 + 1) = (0 + 𝑛) + 1 = 𝑛 + 1

come volevamo dimostrare.

Consideriamo la proprietà commutativa. Dobbiamo innanzitutto dimostrare che


𝑛 + 1 = 1 + 𝑛 . Lo facciamo per induzione: se 𝑛 = 0 si applica la proprietà dell’elemento
neutro. Se, per induzione, supponiamo che valga 𝑛 + 1 = 1 + 𝑛 allora si ha

(𝑛 + 1) + 1 = (1 + 𝑛) + 1 = 1 + (𝑛 + 1)

che è quanto dovevamo dimostrare. Possiamo ora dimostrare per induzione su 𝑚 che
per ogni 𝑛 vale 𝑛 + 𝑚 = 𝑚 + 𝑛 . Il caso 𝑚 = 0 si riconduce alla proprietà dell’elemento
neutro: 𝑛 + 0 = 𝑛 = 0 + 𝑛 . Se ora per induzione supponiamo che valga 𝑛 + 𝑚 = 𝑚 + 𝑛
possiamo utilizzare il caso precedente e la proprietà associativa per ottenere:

𝑛+𝑚+1= 𝑚+𝑛+1= 𝑚+1+𝑛

che è quanto dovevamo dimostrare.

Dimostriamo la proprietà invariantiva per induzione su 𝑘 . Se 𝑘 = 0 è ovvio che da


𝑚 + 𝑘 = 𝑛 + 𝑘 si possa dedurre 𝑚 = 𝑛 visto che 𝑚 + 0 = 𝑚 e 𝑛 + 0 = 𝑛 . Supponiamo
allora che la proprietà sia valida per un certo 𝑘 e dimostriamola per 𝑘 + 1. Dunque
se vale 𝑚 + 𝑘 + 1 = 𝑛 + 𝑘 + 1 si ha (𝑚 + 1) + 𝑘 = (𝑛 + 1) + 𝑘 e quindi, per ipotesi
induttiva, 𝑚 + 1 = 𝑛 + 1. Scritto in altri termini 𝜎(𝑚) = 𝜎(𝑛) da cui, grazie al fatto che
𝜎 è iniettiva, si deduce 𝑚 = 𝑛 .

Esercizio 1.23. Dimostrare, utilizzando il principio di induzione e le proprietà dell’addizione,


la seguente proposizione:

∀𝑛 ∈ ℕ : ((∃𝑚 ∈ ℕ : 𝑛 = 𝑚 + 𝑚) ∨ (∃𝑚 ∈ ℕ : 𝑛 = 𝑚 + 𝑚 + 1)).

I numeri naturali risultano essere l’insieme che naturalmente può essere utilizzato per
indicare l’operazione di iterazione. La somma sui numeri naturali corrisponde alla
composizione delle iterazioni come enunciato nel seguente.

Teorema 1.24 (composizione di iterazioni). Sia 𝑓 : 𝑋 → 𝑋 una funzione qualunque e


siano 𝑛, 𝑚 ∈ ℕ . Allora:
𝑓 𝑚 ◦ 𝑓 𝑛 = 𝑓 𝑛+𝑚 .
20 1 fondamenti

Dimostrazione. Lo si dimostra per induzione su 𝑚 . Per 𝑚 = 0 ricordando che 𝑓 0 è


sempre l’identità, la formula risulta banalmente valida. Supponendo che per un certo
𝑚 si abbia 𝑓 𝑚 ◦ 𝑓 𝑛 = 𝑓 𝑛+𝑚 si avrà di conseguenza:

𝑓 𝑚+1 ◦ 𝑓 𝑛 = 𝑓 ◦ 𝑓 𝑚 ◦ 𝑓 𝑛 = 𝑓 ◦ 𝑓 𝑛+𝑚 = 𝑓 𝑛+𝑚+1 .

ordinamento, moltiplicazione ed elevamento a potenza

Possiamo ora definire una relazione ≤ su ℕ ponendo

𝑚 ≤ 𝑛 ⇐⇒ ∃𝑘 ∈ ℕ : 𝑛 = 𝑚 + 𝑘.

Se 𝑚 ≤ 𝑛 cioè se esiste 𝑘 ∈ ℕ tale che 𝑛 = 𝑚 + 𝑘 tale numero 𝑘 è unico in quanto se


fosse 𝑚 + 𝑗 = 𝑛 = 𝑚 + 𝑘 potremmo dedurre 𝑘 = 𝑗 dalla proprietà invariantiva della
differenza
addizione. Possiamo dunque definire la differenza: 𝑘 = 𝑛 − 𝑚 .
Vogliamo dimostrare che la relazione ≤ appena introdotta è una relazione d’ordine, in
base alla seguente.

Definizione 1.25 (relazione d’ordine). Una relazione ≤ su un insieme 𝑋 viene detta


relazione d’ordine
relazione d’ordine se soddisfa le seguenti proprietà (per ogni 𝑥, 𝑦, 𝑧 ∈ 𝑋 ):
1. riflessiva: 𝑥 ≤ 𝑥 ;
2. antisimmetrica: 𝑥 ≤ 𝑦 ∧ 𝑦 ≤ 𝑥 =⇒ 𝑥 = 𝑦 ;
3. transitiva: 𝑥 ≤ 𝑦 ∧ 𝑦 ≤ 𝑧 =⇒ 𝑥 ≤ 𝑧 .

ordine totale
Si dice inoltre che la relazione d’ordine ≤ è una relazione d’ordine totale (o lineare) e diremo
che 𝑋 è totalmente ordinato se vale
4. dicotomia: 𝑥 ≤ 𝑦 ∨ 𝑦 ≤ 𝑥 .

In generale, se ≤ è una relazione d’ordine su 𝑋 si definisce la relazione inversa ≥


ponendo 𝑥 ≥ 𝑦 quando 𝑦 ≤ 𝑥 . La proprietà riflessiva identifica gli ordinamenti
larghi. Si definisce il corrispondente ordinamento stretto < ponendo 𝑥 < 𝑦 quando
𝑥 ≤ 𝑦 ∧ 𝑥 ≠ 𝑦 e la relazione inversa > ponendo 𝑥 > 𝑦 quando 𝑦 < 𝑥 .

Teorema 1.26. La relazione ≤ è una relazione d’ordine totale su ℕ .

Dimostrazione. Il fatto che 𝑥 + 0 = 𝑥 dimostra la proprietà riflessiva.


Per la proprietà transitiva è sufficiente osservare che se 𝑦 = 𝑥 + 𝑘 e 𝑧 = 𝑦 + 𝑗 allora
𝑧 = 𝑥 + 𝑘 + 𝑗.
Per la proprietà antisimmetrica supponiamo di avere 𝑥 = 𝑦 + 𝑘 e 𝑦 = 𝑥 + 𝑗 . Deduciamo
che 𝑥 + 𝑘 + 𝑗 = 𝑦 + 𝑘 + 𝑗 da cui 𝑥 = 𝑦 per la proprietà invariantiva dell’addizione.
Per mostrare che l’ordinamento è totale dobbiamo invece procedere con una dimostra-
zione per induzione. Per induzione su 𝑥 ∈ ℕ vogliamo mostrare che per ogni 𝑦 ∈ ℕ si
ha 𝑥 ≤ 𝑦 oppure 𝑦 ≤ 𝑥 . Se 𝑥 = 0 il fatto è ovvio in quanto 𝑦 = 𝑦 + 0 e quindi 𝑦 ≥ 0 per
ogni 𝑦 ∈ ℕ . Supponiamo ora di sapere che 𝑥 ≤ 𝑦 oppure 𝑦 ≤ 𝑥 . Se 𝑦 ≤ 𝑥 significa
che 𝑥 = 𝑦 + 𝑘 per un qualche 𝑘 ∈ ℕ . Ma allora 𝑥 + 1 = 𝑦 + 𝑘 + 1 e quindi vale anche
1.6 i numeri naturali 21

𝑦 ≤ 𝑥 + 1. Se invece 𝑥 ≤ 𝑦 significa che esiste 𝑘 ∈ ℕ per cui 𝑦 = 𝑥 + 𝑘 . Se 𝑘 ≠ 0 allora


𝑘 = 1 + 𝑗 con 𝑗 ∈ ℕ da cui 𝑦 = 𝑥 + 1 + 𝑗 e dunque anche 𝑥 + 1 ≤ 𝑦 . Se 𝑘 = 0 allora
𝑥 = 𝑦 e dunque 𝑥 + 1 = 𝑦 + 1 che ci porta alla disuguaglianza inversa 𝑥 + 1 ≥ 𝑦 . In
ogni caso il passo induttivo è dimostrato.

La moltiplicazione · su ℕ è intesa come somma ripetuta: 3 · 𝑛 = 𝑛 + 𝑛 + 𝑛 . La


definizione formale di 𝑛 · 𝑘 viene data per induzione su 𝑛 :
(
0 · 𝑘 = 0,
(𝑛 + 1) · 𝑘 = 𝑛 · 𝑘 + 𝑘.

Possiamo allora dimostrare le usuali proprietà della moltiplicazione.

Teorema 1.27 (proprietà della moltiplicazione). La moltiplicazione su ℕ soddisfa le


seguenti proprietà:

1. elemento neutro e assorbente: 𝑛 · 1 = 𝑛 , 𝑛 · 0 = 0,


2. proprietà distributiva: 𝑛 · (𝑘 + 𝑗) = 𝑛 · 𝑘 + 𝑛 · 𝑗 ,
3. proprietà associativa: 𝑛 · (𝑚 · 𝑘) = (𝑛 · 𝑚) · 𝑘 ,
4. proprietà commutativa: 𝑛 · 𝑚 = 𝑚 · 𝑛 .

Dimostrazione. Dimostriamo 𝑛 · 1 = 𝑛 per induzione su 𝑛 . Per 𝑛 = 0 è la definizione.


Il passo induttivo è pure molto semplice:

(𝑛 + 1) · 1 = 𝑛 · 1 + 1 = 𝑛 + 1.

Per dimostrare che 𝑛 · 0 = 0 si procede analogamente: per 𝑛 = 0 è la definizione, il


passo induttivo è il seguente:

(𝑛 + 1) · 0 = 𝑛 · 0 + 0 = 0 + 0 = 0.

Dimostriamo ora la proprietà distributiva 𝑛 · (𝑘 + 𝑗) = 𝑛 · 𝑘 + 𝑛 · 𝑗 per induzione su 𝑛 .


Per 𝑛 = 0 è banalmente verificata. Il passo induttivo è il seguente:

(𝑛 + 1) · (𝑘 + 𝑗) = 𝑛 · (𝑘 + 𝑗) + (𝑘 + 𝑗) = 𝑛 · 𝑘 + 𝑛 · 𝑗 + 𝑘 + 𝑗 = (𝑛 + 1) · 𝑘 + (𝑛 + 1) · 𝑗.

Per la proprietà associativa 𝑛 · (𝑚 · 𝑘) = (𝑛 · 𝑚) · 𝑘 procediamo per induzione su 𝑘 . Per


𝑘 = 0 è banalmente verificato grazie alla proprietà assorbente. Il passo induttivo si
ottiene, utilizzando le proprietà precedenti:

𝑛 · (𝑚 · (𝑘 + 1)) = 𝑛 · (𝑚 · 𝑘 + 𝑚 · 1) = 𝑛 · (𝑚 · 𝑘 + 𝑚) = 𝑛 · (𝑚 · 𝑘) + 𝑛 · 𝑚
= (𝑛 · 𝑚) · 𝑘 + 𝑛 · 𝑚 · 1 = (𝑛 · 𝑚) · (𝑘 + 1).

Per la proprietà commutativa 𝑛 · 𝑚 = 𝑚 · 𝑛 procediamo per induzione su 𝑛 . Per 𝑛 = 0


è banale. Il passo induttivo è:

(𝑛 + 1) · 𝑚 = 𝑛 · 𝑚 + 𝑚 = 𝑚 · 𝑛 + 𝑚 · 1 = 𝑚 · (𝑛 + 1).
22 1 fondamenti

L’elevamento a potenza si definisce come un prodotto ripetuto: 𝑘 3 = 𝑘 · 𝑘 · 𝑘 . La


definizione formale di 𝑘 𝑛 si pone per induzione su 𝑛 :
(
𝑘 0 = 1,
𝑘 𝑛+1 = 𝑘 𝑛 · 𝑘.

Si osservi che la definizione precedente è valida per ogni 𝑛 ∈ ℕ e per ogni 𝑘 ∈ ℕ . In


particolare abbiamo consapevolmente definito 00 = 1 perché questa definizione (che
in altri testi viene omessa) risulterà essere molto utile.

Teorema 1.28 (proprietà delle potenze). L’elevamento a potenza definito su ℕ ha le seguenti


proprietà:

1. 𝑘 𝑛+𝑚 = 𝑘 𝑛 · 𝑘 𝑚 ,
2. (𝑘 𝑛 )𝑚 = 𝑘 𝑛·𝑚 ,
3. (𝑘 · 𝑗)𝑛 = 𝑘 𝑛 · 𝑗 𝑛 .

Dimostrazione. La prima proprietà 𝑘 𝑛+𝑚 = 𝑘 𝑛 · 𝑘 𝑚 la dimostriamo per induzione su 𝑚 .


Per 𝑚 = 0 è banale. Il passaggio induttivo è pure molto semplice:

𝑘 𝑛+𝑚+1 = 𝑘 𝑛+𝑚 · 𝑘 = 𝑘 𝑛 · 𝑘 𝑚 · 𝑘 = 𝑘 𝑛 · 𝑘 𝑚+1 .

Anche la seconda proprietà (𝑘 𝑛 )𝑚 = 𝑘 𝑛·𝑚 la dimostriamo per induzione su 𝑚 . Il caso


𝑚 = 0 è banale. Il passo induttivo è il seguente:

(𝑘 𝑛 )𝑚+1 = (𝑘 𝑛 )𝑚 · 𝑘 𝑛 = 𝑘 𝑛·𝑚 · 𝑘 𝑛 = 𝑘 𝑛·𝑚+𝑛 = 𝑘 𝑛·(𝑚+1) .

L’ultima proprietà (𝑘 · 𝑗)𝑛 = 𝑘 𝑛 · 𝑗 𝑛 la dimostriamo per induzione su 𝑛 . Per 𝑛 = 0 è


banale. Il passo induttivo è:

(𝑘 · 𝑗)𝑛+1 = (𝑘 · 𝑗)𝑛 · (𝑘 · 𝑗) = 𝑘 𝑛 · 𝑗 𝑛 · 𝑘 · 𝑗 = 𝑘 𝑛+1 · 𝑗 𝑛+1 .

Esercizio 1.29. Dimostrare per induzione che per ogni 𝑛 ∈ ℕ , 𝑛 ≥ 4 si ha

2𝑛 ≥ 𝑛 2 .

notazione posizionale decimale rappresentazione posizionale dei numeri naturali

Per rappresentare in modo efficiente qualunque numero naturale utilizziamo la


notazione posizionale decimale. Ricordiamo che le cifre decimali 0 , 1 , 2 , . . . , 9 sono
state definite in (1.5) a pag 14. Il numero rappresentato da una sequenza finita di
cifre decimali può essere definito ricorsivamente: una sequenza di una sola cifra
rappresenta il numero corrispondente alla cifra stessa, una sequenza di 𝑛 + 1 cifre
rappresenta il numero rappresentato dalle prime 𝑛 cifre, moltiplicato per 9 + 1 (cioè
1.6 i numeri naturali 23

𝑛 0 1 2 3 4 Tabella 1.4: I primi valori (e nomi) di


alcune delle sequenze che abbiamo defi-
𝑛+5 5 6 7 8 9 nito.
2𝑛 1 2 4 8 16
25+𝑛 32 64 128 256 512
210+𝑛 1024 2048 4096 8192 16384
215+𝑛 32768 65536 131072 262144 524288
220+𝑛 1048576 2097152 4194304 8388608 16777216
3𝑛 1 3 9 27 81
35+𝑛 243 729 2187 6561 19683
𝑛! 1 1 2 6 24
(5 + 𝑛)! 120 720 5040 40320 362880
(10 + 𝑛)! 3628800 39916800 479001600 6227020800 87178291200
103𝑛 K (chilo) M (mega) G (giga) T (tera)
103(𝑛+5) P (peta) E (exa) Z (zetta) Y (yotta)
210𝑛 Ki (chibi) Mi (mebi) Gi (gibi) Ti (tebi)
210(𝑛+5) Pi (pebi) Ei (exbi) Zi (zebi) Yi (yobi)

dieci), e sommato alla ultima cifra. Ad esempio la sequenza di cifre 4701 (leggi:
quattromilasettecentouno) è definita così:

4701 = ((4 · (9 + 1) + 7) · (9 + 1) + 0) · (9 + 1) + 1.

Osservando che 10 = 9 + 1 si scriverà

4701 = ((4 · 10 + 7) · 10 + 0) · 10 + 1
= 4 · 103 + 7 · 102 + 0 · 101 + 1 · 100 .

fattoriale e semi-fattoriale
fattoriale

Definiamo il fattoriale denotato con 𝑛 ! (leggi: 𝑛 fattoriale) tramite la seguente definizione


ricorsiva (
0! = 1
(𝑛 + 1)! = (𝑛 + 1)𝑛 !
in tal modo risulta che 𝑛 ! sia il prodotto dei primi 𝑛 numeri naturali positivi:

𝑛 ! = 1 · 2 · 3 · · · 𝑛.

Esercizio 1.30. Utilizzando il principio di induzione si dimostri che per ogni 𝑛 ∈ ℕ :

2𝑛 > 𝑛, (𝑛 + 1)! ≥ 2𝑛 , 𝑛𝑛 ≥ 𝑛!
semi-fattoriale

A volte sarà utile considerare anche i prodotti di solamente i numeri pari o i numeri
dispari fino ad un certo numero 𝑛 . Questo si chiama semi-fattoriale e si indica con 𝑛 !!.
Lo possiamo definire separatamente sui numeri pari (cioè i numeri che si possono
scrivere nella forma 2𝑛 con 𝑛 ∈ ℕ ) e i numeri dispari (che scriviamo nella forma
24 1 fondamenti

2𝑛 + 1):

(2𝑛)!! = 2 · 4 · 6 · · · (2𝑛)
(2𝑛 + 1)!! = 1 · 3 · 5 · · · (2𝑛 + 1).

Osservazione 1.31. Si osservi che risulta

(2𝑛)!! = (2 · 1) · (2 · 2) · (2 · 3) · · · (2 · 𝑛) = 2𝑛 · 𝑛 !

mentre
2𝑛 · 𝑛 ! · (2𝑛 + 1)!! = (2𝑛)!! · (2𝑛 + 1)!! = (2𝑛 + 1)!
Queste formule permettono di esprimere il semi-fattoriale utilizzando il fattoriale intero e le
potenze.

Esercizio 1.32. Si dia una definizione per induzione del semi-fattoriale (separatamente per i
pari e per i dispari) e si dimostrino, per induzione, le formule nell’osservazione precedente.

buon ordinamento e unicità dei numeri naturali

Definizione 1.33 (maggiorante, minorante, massimo, minimo, limitato). Sia ≤ una


relazione d’ordine su un insieme 𝑋 e siano 𝑎 ∈ 𝑋 e 𝐴 ⊆ 𝑋 .
minorante Diremo che 𝑎 è un minorante di 𝐴 e scriveremo:

𝑎≤𝐴

se per ogni 𝑥 ∈ 𝐴 risulta 𝑎 ≤ 𝑥 . Se esiste 𝑎 per cui 𝑎 ≤ 𝐴 diremo che 𝐴 è inferiormente


minimo limitato. Se 𝑎 è un minorante e inoltre 𝑎 ∈ 𝐴 diremo che 𝑎 è il minimo di 𝐴 e scriveremo:

𝑎 = min 𝐴.

maggiorante Analogamente diremo che 𝑎 è un maggiorante di 𝐴 e scriveremo 𝑎 ≥ 𝐴 se 𝑎 ≥ 𝑥 per ogni


𝑥 ∈ 𝐴, diremo che 𝐴 è superiormente limitato se esiste 𝑎 per cui 𝑎 ≥ 𝐴 infine diremo che 𝑎 è
massimo il massimo di 𝐴 e scriveremo 𝑎 = max 𝐴 se 𝑎 ≥ 𝐴 e 𝑎 ∈ 𝐴.

Se 𝐴 è superiormente limitato e inferiormente limitato diremo che 𝐴 è limitato.

Massimo e minimo di un insieme 𝐴, se esistono, sono unici. Infatti se 𝑥 e 𝑦 fossero


due minimi di 𝐴 si avrebbe 𝑥 ≤ 𝑦 in quanto 𝑥 ≤ 𝐴 e 𝑦 ∈ 𝐴. Analogamente si avrebbe
Se 𝐴 non avesse minimo potrei definire
𝑦 ≤ 𝑥 e quindi 𝑥 = 𝑦 . Ragionamento analogo se 𝑥 e 𝑦 fossero due massimi.
per induzione una funzione 𝑓 : ℕ →
𝐴 tale che 𝑓 (0) ∈ 𝐴 è qualunque e
Se 𝐴 è un insieme finito il massimo e il minimo esistono sempre.
𝑓 (𝑛 + 1) < 𝑓 (𝑛) (visto che 𝑓 (𝑛) non è un
minimo di 𝐴 esiste un numero più pic- Teorema 1.34 (principio del buon ordinamento). Sia 𝐴 ⊆ ℕ , 𝐴 ≠ ∅. Allora 𝐴 ha minimo.
colo). Chiaramente 𝑓 è iniettiva quindi
#𝐴 ≥ #ℕ e dunque 𝐴 è infinito.
Se ci fosse un numero naturale tra 𝑛 e Dimostrazione. Osserviamo che se 𝑛 ∈ ℕ è un minorante di 𝐴 ⊆ ℕ allora o 𝑛 ∈ 𝐴 e
𝑛 + 1 sottraendo 𝑛 avremmo un numero quindi 𝑛 è il minimo di 𝐴 oppure anche 𝑛 + 1 è un minorante di 𝐴 in quanto non ci
naturale tra 0 e 1. Ma non esiste 𝑥 ∈ ℕ
sono numeri naturali strettamente compresi tra 𝑛 e 𝑛 + 1. Dunque se 𝐴 non avesse
tale che 0 < 𝑥 < 1. Infatti se 𝑥 ∈ ℕ , 𝑥 > 0
allora 𝑥 ≠ 0 e quindi esiste 𝑚 ∈ ℕ tale minimo, per il principio di induzione ogni 𝑛 ∈ ℕ sarebbe un minorante di 𝐴. In tal
che 𝑥 = 𝑚 + 1. Ma allora 𝑥 ≥ 1.
1.6 i numeri naturali 25

caso 𝐴 dovrebbe essere vuoto perché se esistesse 𝑎 ∈ 𝐴 certamente 𝑎 + 1 non sarebbe


un minorante di 𝐴.

Vogliamo ora dimostrare che l’insieme dei numeri naturali è sostanzialmente unico nel
senso che se ci sono due insiemi che soddisfano gli assiomi di Peano allora è possibile
mettere in corrispondenza gli elementi dei due insiemi in modo che lo zero vada in
zero e numeri corrispondenti abbiano successori corrispondenti.

Teorema 1.35 (unicità dei numeri naturali). Se ℕ e ℕ′ sono due insiemi che soddisfano
gli assiomi di Peano con zero 0 ∈ ℕ e 0′ ∈ ℕ′ e funzioni successore 𝜎 su ℕ e 𝜎′ su ℕ′ allora
esiste una funzione bigettiva 𝑓 : ℕ → ℕ′ tale che 𝑓 (0) = 0′ e 𝑓 (𝜎(𝑛)) = 𝜎′( 𝑓 (𝑛)).

Dimostrazione. Possiamo definire 𝑓 per induzione:


(
𝑓 (0) = 0′
𝑓 (𝜎(𝑛)) = 𝜎′( 𝑓 (𝑛))

così rimane solo da dimostrare che 𝑓 è una bigezione.

Per dimostrare che 𝑓 è iniettiva consideriamo l’insieme

𝐴 = {𝑎 ∈ ℕ : ∃𝑏 ∈ ℕ : 𝑏 ≠ 𝑎, 𝑓 (𝑎) = 𝑓 (𝑏)}.

Se tale insieme è vuoto allora 𝑓 è effettivamente iniettiva. Supponiamo allora per


assurdo che 𝐴 non sia vuoto. In tal caso possiamo considerare il minimo 𝑎 = min 𝐴
(grazie al teorema 1.34). Dovrà quindi esistere 𝑏 ∈ ℕ tale che 𝑏 ≠ 𝑎 e 𝑓 (𝑏) = 𝑓 (𝑎).
Ovviamente anche 𝑏 ∈ 𝐴 e quindi dovrà essere 𝑏 > 𝑎 in quanto 𝑎 è il minimo.
Dunque 𝑏 > 0 e 𝑓 (𝑏) = 𝑓 (𝜎(𝑏 − 1)) = 𝜎′( 𝑓 (𝑏 − 1)). Se 𝑎 = 0 abbiamo 𝑓 (𝑎) = 0′ e
quindi da 𝑓 (𝑎) = 𝑓 (𝑏) otteniamo che 0′ è nell’immagine di 𝜎′ che è contrario agli
assiomi di Peano. Se invece 𝑎 > 0 si avrà, come per 𝑏 , 𝑓 (𝑎) = 𝜎′( 𝑓 (𝑎 − 1)) e dunque
𝜎′( 𝑓 (𝑎 − 1)) = 𝜎′( 𝑓 (𝑏 − 1)). Per l’iniettività di 𝜎′ si deduce 𝑓 (𝑎 − 1) = 𝑓 (𝑏 − 1) da cui
𝑎 − 1 ∈ 𝐴. Ma questo è assurdo in quanto 𝑎 era il minimo di 𝐴.

Per dimostrare che 𝑓 è surgettiva consideriamo l’immagine 𝐵′ = 𝑓 (ℕ ) e usiamo il


principio di induzione su ℕ′ per dimostrare che 𝐵′ = ℕ′. Per prima cosa 0′ ∈ 𝐵′ in
quanto 0′ = 𝑓 (0). Se poi 𝑛 ′ ∈ 𝐵′ allora esiste 𝑛 ∈ ℕ tale che 𝑓 (𝑛) = 𝑛 ′. Ma allora
𝑓 (𝜎(𝑛)) = 𝜎′( 𝑓 (𝑛)) = 𝜎′(𝑛 ′) e dunque anche 𝜎′(𝑛 ′) ∈ 𝐵.

cardinalità finite

Vogliamo ora dimostrare che i numeri naturali possono essere utilizzati per contare gli
elementi degli insiemi finiti.
Siccome per noi il primo numero na-
turale è 0, c’è uno scarto di una unità
Definizione 1.36 (numero di elementi). Se 𝑛 ∈ ℕ denotiamo con tra gli ordinali primo, secondo, terzo. . . e
i cardinali zero, uno, due. . . La cosa può
[𝑛] = {0 , 1 , . . . , 𝑛 − 1} = {𝑘 ∈ ℕ : 𝑘 < 𝑛} sembrare strana ma in realtà è perfetta-
mente naturale e infatti in gran parte dei
linguaggi di programmazione moderni
l’insieme dei primi 𝑛 numeri naturali. Questo è il prototipo di insieme con 𝑛 elementi. Allora quando si itera una operazione 𝑛 volte
si conta da 0 a 𝑛 − 1.
26 1 fondamenti

informalmente andremo a identificare #[𝑛] con 𝑛 e dunque scriveremo

#𝐴 = 𝑛, #𝐴 ≥ 𝑛, #𝐴 ≤ 𝑛

per significare rispettivamente

#𝐴 = #[𝑛], #𝐴 ≥ #[𝑛], #𝐴 ≤ #[𝑛].

Il simbolo ℵ è la prima lettera dell’alfa-


La cardinalità di ℕ viene a volte indicata con il simbolo ℵ0 dunque potremo scrivere
beto ebraico e si legge aleph.
Abbiamo già osservato che ℕ è il più pic-
colo insieme infinito dunque ℵ0 è la più # 𝐴 = ℵ0 , #𝐴 ≤ ℵ0 , #𝐴 ≥ ℵ0
piccola cardinalità infinita. Si potrebbe
anche dimostrare che deve esistere una per significare rispettivamente
cardinalità ℵ1 > ℵ0 che è la più piccola
cardinalità maggiore di ℵ0 . Sappiamo # 𝐴 = #ℕ , #𝐴 ≤ #ℕ , # 𝐴 ≥ #ℕ .
che #P(ℕ ) > #ℕ ma curiosamente non
è possibile dimostrare che ℵ1 = #P(ℕ )
(questa si chiama ipotesi del continuo in
quanto vedremo nel teorema 3.24 che Lemma 1.37. Per ogni 𝑛 ∈ ℕ l’insieme [𝑛] = {0 , 1 , 2 , . . . , 𝑛 − 1} è finito (nel senso di
#P(ℕ ) = #ℝ e l’insieme ℝ viene chia- Dedekind, definizione 1.18).
mato continuo là dove ℕ viene chiamato
discreto). Dunque l’ipotesi del continuo
è un ulteriore assioma che potrebbe es-
Dimostrazione. Lo possiamo dimostrare per induzione su 𝑛 ∈ ℕ . Per 𝑛 = 0 si ha
sere aggiunto agli assiomi della teoria
degli insiemi: non esistono insiemi con [𝑛] = ∅ ed è ovvio che ogni funzione 𝑓 : ∅ → ∅ è bigettiva. Dunque [0] = ∅ è finito.
cardinalità strettamente compresa tra le
cardinalità di ℕ e di P(ℕ ). Supponiamo allora che [𝑛] sia finito e supponiamo per assurdo che [𝑛 + 1] sia infinito.
Allora esiste 𝑓 : [𝑛 + 1] → [𝑛 + 1] iniettiva ma non surgettiva. Se componiamo 𝑓 con la
funzione 𝑠 che scambia 𝑛 con 𝑓 (𝑛) otteniamo una funzione 𝑔 = 𝑠 ◦ 𝑓 tale che 𝑔(𝑛) = 𝑛 .
Se 𝑓 era iniettiva ma non surgettiva anche 𝑔 mantiene le due proprietà. Inoltre 𝑔
può essere ristretta a [𝑛] (in quanto 𝑔(𝑘) = 𝑛 solo per 𝑘 = 𝑛 visto che 𝑔 è iniettiva):
𝑔 : [𝑛] → [𝑛] e anche la funzione ristretta risulterebbe essere iniettiva e suriettiva. Ma
questo è assurdo perché per ipotesi induttiva [𝑛] è finito.

Teorema 1.38 (caratterizzazione insiemi finiti). Un insieme 𝐴 è infinito (nel senso di


Dedekind, definizione 1.18) se e solo se #𝐴 ≥ ℵ0 . Viceversa 𝐴 è finito se e solo se esiste 𝑛 ∈ ℕ
tale che #𝐴 = 𝑛 .

Dimostrazione. Se #𝐴 ≥ ℵ0 significa che esiste una funzione iniettiva 𝑓 : ℕ → 𝐴.


Dunque se definiamo 𝜎 : 𝐴 → 𝐴 come
(
𝑎 se 𝑎 ∉ 𝑓 (ℕ )
𝜎(𝑎) =
𝑓 (𝑛 + 1) se 𝑎 = 𝑓 (𝑛) con 𝑛 ∈ ℕ

otteniamo una funzione iniettiva ma non suriettiva (in quanto 𝜎(𝐴) = 𝐴 \ { 𝑓 (0)}).
Dunque se #𝐴 ≥ ℵ0 deduciamo che 𝐴 è infinito

Viceversa se 𝐴 è infinito significa che esiste 𝜎 : 𝐴 → 𝐴 iniettiva ma non suriettiva.


Preso 𝛼 ∈ 𝐴 \ 𝜎(𝐴) possiamo definire induttivamente 𝑓 : ℕ → 𝐴 come segue:
(
𝑓 (0) = 𝛼
𝑓 (𝑛 + 1) = 𝜎( 𝑓 (𝑛))
1.6 i numeri naturali 27

e possiamo verificare che 𝑓 è iniettiva. Infatti supponiamo che sia 𝑓 (𝑛) = 𝑓 (𝑚). Se
𝑓 (𝑛) = 𝑓 (𝑚) = 𝛼 allora necessariamente 𝑛 = 𝑚 = 0 perché 𝑓 (𝑛) = 𝛼 è equivalente a
𝑛 = 0 visto che 𝜎 non assume mai il valore 𝛼 . Se 𝑓 (𝑛) = 𝑓 (𝑚) ≠ 𝛼 significa dunque che
𝑛 > 0 e 𝑚 > 0 ma allora 𝑓 (𝑛) = 𝜎( 𝑓 (𝑛 − 1)) e 𝑓 (𝑚) = 𝜎( 𝑓 (𝑚 − 1)) e dunque, essendo
𝜎 iniettiva, 𝑛 − 1 = 𝑚 − 1 da cui 𝑛 = 𝑚 . Dunque se 𝐴 è infinito si ha #ℕ ≤ #𝐴 (in
realtà l’avevamo già osservato: ℕ è il più piccolo insieme infinito).

Dobbiamo ora caratterizzare gli insiemi finiti. Abbiamo già verificato che se #𝐴 ≥ ℵ0
allora #𝐴 è infinito, dunque se #𝐴 è finito non può essere #𝐴 ≥ ℵ0 . Ma da questo non
possiamo immediatamente dedurre che #𝐴 < ℵ0 (vedi nota a margine). Per dimostrare che ogni cardinalità può
essere confrontata con ogni altra (cioè
Se #𝐴 = 𝑛 significa che #𝐴 = #[𝑛] e grazie al lemma 1.37 sappiamo che [𝑛] è finito e che l’ordinamento dato dalla cardinalità
dunque anche 𝐴 è finito. è totale) bisogna dimostrare che ogni
insieme ammette un buon ordinamento.
Supponiamo ora che 𝐴 sia un insieme per il quale per ogni 𝑛 ∈ ℕ si ha #𝐴 > 𝑛 . La cosa diventa molto tecnica e richiede,
l’utilizzo dell’assioma della scelta.
Dobbiamo dimostrare che 𝐴 è infinito. Per ogni 𝑛 ∈ ℕ scegliamo una funzione
iniettiva 𝑓𝑛 : [𝑛] → 𝐴. Dalle 𝑓𝑛 possiamo definire le funzioni iniettive 𝑔𝑛 : [𝑛] → 𝐴 in Qui stiamo usando l’assioma della scelta
modo che 𝑔𝑛+1 sia una estensione di 𝑔𝑛 . Basterà infatti porre:

 𝑔 = 𝑓0 ,
 0


 (
𝑛 𝑔 (𝑘) se 𝑘 < 𝑛
𝑔 (𝑘) =
 𝑛+1

min 𝑓𝑛+1 ([𝑛 + 1]) \ 𝑔𝑛 ([𝑛]) altrimenti


l’insieme 𝑓𝑛+1 ([𝑛 + 1]) \ 𝑔𝑛 ([𝑛]) essendo non vuoto in quanto # 𝑔𝑛 ([𝑛]) = 𝑛 < 𝑛 + 1 =
# 𝑓𝑛+1 ([𝑛 + 1]). Ma allora possiamo definire la funzione iniettiva 𝑔 : ℕ → 𝐴 come
𝑔(𝑛) = 𝑔𝑛+1 (𝑛) ottenendo #𝐴 ≥ #ℕ e dunque 𝐴 è Dedekind infinito.

Nella dimostrazione precedente abbiamo implicitamente utilizzato il seguente lemma,


la cui dimostrazione lasciamo per esercizio.

Lemma 1.39. Se #𝐴 = 𝑛 e #𝐵 = 𝑚 con 𝑛, 𝑚 ∈ ℕ allora

#𝐴 = #𝐵 ⇐⇒ 𝑛 = 𝑚 e #𝐴 ≤ #𝐵 ⇐⇒ 𝑛 ≤ 𝑚.

Esercizio 1.40 (operazioni con le cardinalità finite). Se 𝐴 e 𝐵 sono insiemi disgiunti e


finiti allora
#(𝐴 ∪ 𝐵) = #𝐴 + #𝐵.
Se 𝐴 e 𝐵 sono insiemi finiti allora (ricordiamo che 𝐵 𝐴 è l’insieme delle funzioni 𝐴 → 𝐵)

#(𝐴 × 𝐵) = #𝐴 · #𝐵, #(𝐵 𝐴 ) = #𝐵#𝐴 , #P(𝐴) = 2#𝐴 ,


# 𝑓 ∈ 𝐴𝐴 : 𝑓 bigettiva = (#𝐴)! ,


#𝐴
 
#{𝑋 ∈ P(𝐴) : #𝑋 = 𝑘}. = .
𝑘

sequenze finite o ennuple

Abbiamo già visto che se 𝐴 è un insieme possiamo definire l’insieme delle coppie
di elementi di 𝐴 con il prodotto tra insiemi: 𝐴 × 𝐴. Cosa rappresenta un prodotto
ripetuto? Gli insiemi (𝐴 × 𝐴) × 𝐴 e 𝐴 × (𝐴 × 𝐴) non sono uguali, in quanto il primo è
28 1 fondamenti

un insieme di coppie il cui primo elemento è a sua volta una coppia, il secondo insieme
invece è un insieme di coppie il cui secondo elemento è una coppia:

(𝐴 × 𝐴) × 𝐴 = {((𝑎0 , 𝑎1 ), 𝑎2 ) : 𝑎0 , 𝑎1 , 𝑎2 ∈ 𝐴},
𝐴 × (𝐴 × 𝐴) = {(𝑎 0 , (𝑎1 , 𝑎2 )) : 𝑎 0 , 𝑎1 , 𝑎2 ∈ 𝐴}.

Questi insiemi sono molto simili tra loro e potrebbero essere identificati. Un’altro
insieme molto simile è l’insieme 𝐴[3] . Ricordando che [3] = {0 , 1 , 2} l’insieme
𝐴[3] rappresenta l’insieme di tutte le funzioni 𝒂 : {0 , 1 , 2} → 𝐴. La funzione 𝒂 è
univocamente determinata dal suo valore nei tre punti del dominio: 𝑎 0 = 𝒂(0),
𝑎1 = 𝒂(1), 𝑎 2 = 𝒂(2) in quanto 𝒂 = {0 ↦→ 𝑎 0 , 1 ↦→ 𝑎1 , 2 ↦→ 𝑎2 }. Possiamo quindi
identificare 𝒂 con la tripla (o vettore) di valori:

𝒂 = (𝑎 0 , 𝑎1 , 𝑎2 ), 𝑎0 , 𝑎1 , 𝑎2 ∈ 𝐴.

coordinate, componenti, vettore


I valori 𝑎 0 , 𝑎 1 e 𝑎 2 vengono anche chiamate coordinate o componenti del vettore 𝒂 . In
effetti l’insieme 𝐴[2] può essere identificato con 𝐴 × 𝐴, l’insieme 𝐴[3] sarà l’insieme
delle triple di elementi di 𝐴 e in generale se 𝑛 ∈ ℕ identifichiamo con 𝐴[𝑛] l’insieme
delle 𝑛 -uple (leggi: ennuple) di elementi di 𝐴:

𝒂 ∈ 𝐴[𝑛] ⇐⇒ 𝒂 = (𝑎0 , 𝑎1 , . . . , 𝑎 𝑛−1 ).

Usualmente si scrive 𝐴𝑛 invece che 𝐴[𝑛]


e 2𝐴 invece che [2]𝐴 anche perché la L’insieme [2]𝐴 è invece l’insieme delle funzioni 𝐴 → [2] che hanno quindi valore 0
notazione [𝑛] per indicare i primi 𝑛 nu- o 1. Ci si può convincere facilmente che [2]𝐴 può essere messo in corrispondenza
meri naturali non è molto utilizzata. Si
potrebbe anche definire l’insieme ℕ in
biunivoca con P(𝐴):
modo tale che risulti 𝑛 = [𝑛]: basta defi- #([2]𝐴 ) = #P(𝐴).
nire 0 = ∅ e 𝜎(𝑛) = 𝑛 ∪ {𝑛} (si faccia la
dimostrazione per induzione). Infatti possiamo considerare la funzione 𝜑 : [2]𝐴 → P(𝐴) che associa ad ogni funzione
𝑓 : 𝐴 → {0 , 1} l’insieme {𝑥 ∈ 𝐴 : 𝑓 (𝑥) = 1}.

1.7 i numeri interi

In questo capitolo vogliamo definire i numeri interi rappresentandoli come i movimenti


di traslazione su ℕ . Più precisamente per ogni naturale 𝑛 ∈ ℕ definiremo gli interi +𝑛
e −𝑛 che non sono altro che le operazioni di addizione e sottrazione: (+𝑛)(𝑘) = 𝑘 + 𝑛 ,
(−𝑛)(𝑘) = 𝑘 − 𝑛 (quest’ultima definita solo per 𝑘 ≥ 𝑛 ).

Dati due numeri naturali 𝑎, 𝑏 ∈ ℕ esiste una unica traslazione che manda 𝑎 in 𝑏 . Più
precisamente se 𝑏 ≥ 𝑎 esisterà 𝑛 ∈ ℕ tale che 𝑏 = 𝑎 + 𝑛 . La traslazione 𝑘 ↦→ 𝑘 + 𝑛 è
l’iterata 𝑛 -esima della funzione successore 𝜎 , infatti 𝜎 𝑛 (𝑘) = 𝑘 + 𝑛 . Se invece 𝑏 ≤ 𝑎
esisterà 𝑛 ∈ ℕ tale che 𝑎 = 𝑏 + 𝑛 . In tal caso possiamo pensare alla traslazione
inversa 𝑘 ↦→ 𝑘 − 𝑛 definita per 𝑘 ≥ 𝑛 come la funzione inversa (inversa sinistra) di
𝜎 𝑛 : ℕ → 𝜎 𝑛 (ℕ ). Denotiamo con il simbolo +𝑛 la traslazione in avanti 𝑘 ↦→ 𝑘 + 𝑛 e con
il simbolo −𝑛 la traslazione all’indietro 𝑘 ↦→ 𝑘 − 𝑛 . Ovviamente se 𝑛 = 0 sia +0 che
−0 rappresentano l’identità 𝑘 ↦→ 𝑘 che lascia fermi i punti di ℕ dunque +0 = −0.

Definiamo quindi:
ℤ = {+𝑛 : 𝑛 ∈ ℕ } ∪ {−𝑛 : 𝑛 ∈ ℕ }
l’insieme di tutte le traslazioni su ℕ .
1.7 i numeri interi 29

Vogliamo ora definire l’addizione su ℤ, non sarà altro che la composizione di due
traslazioni. Nel seguito useremo le ultime lettere dell’alfabeto 𝑥, 𝑦, 𝑧 per denotare gli
elementi di ℤ mentre useremo le prime lettere 𝑎, 𝑏, 𝑐, 𝑑 per denotare gli elementi di
ℕ.
𝑥 𝑦
Se 𝑎 ↦→ 𝑏 e 𝑎 ′ ↦→ 𝑏 ′ allora 𝑥 = 𝑦 se e solo se 𝑎 + 𝑏 ′ = 𝑎 ′ + 𝑏 . Inoltre se 𝑥 è l’unica Si noti ad esempio che se 𝑏 = 𝑎 + 𝑛 e
𝑥 𝑥 𝑏 ′ = 𝑎 ′ + 𝑚 allora 𝑎 + 𝑏 ′ = 𝑎 + 𝑎 ′ + 𝑚
traslazione che manda 𝑎 ↦→ 𝑏 allora per ogni 𝑐 ∈ ℕ si ha 𝑎 + 𝑐 ↦→ 𝑏 + 𝑐 (proprietà mentre 𝑎 ′ + 𝑏 = 𝑎 + 𝑎 ′ + 𝑛 dunque 𝑚 = 𝑛
invariantiva). se e solo se 𝑎 + 𝑏 ′ = 𝑎 ′ + 𝑏 . Similmente
se 𝑎 = 𝑏 + 𝑛 e 𝑎 ′ = 𝑏 ′ + 𝑚 . Se invece
𝑥 𝑦 𝑏 = 𝑎 + 𝑛 e 𝑎 ′ = 𝑏 ′ + 𝑚 le due traslazioni
Dati 𝑥, 𝑦 ∈ ℤ vogliamo definire 𝑥 + 𝑦 ∈ ℤ. Se 𝑎 ↦→ 𝑏 e 𝑐 ↦→ 𝑑 (con 𝑎, 𝑏, 𝑐, 𝑑 ∈ ℕ )
𝑥 𝑦 sono in verso opposto e l’uguaglianza
allora applicando prima 𝑥 poi 𝑦 si avrà 𝑎 + 𝑐 ↦→ 𝑏 + 𝑐 e 𝑏 + 𝑐 ↦→ 𝑏 + 𝑑 . Definiamo 𝑎 + 𝑏 ′ = 𝑎 ′ + 𝑏 risulta equivalente a
𝑥+𝑦 𝑚 + 𝑛 = 0 che significa 𝑚 = 𝑛 = 0.
quindi 𝑥 + 𝑦 ∈ ℤ come l’unica traslazione 𝑎 + 𝑐 ↦→ 𝑏 + 𝑑 . Questa è una buona
𝑥 𝑦
definizione perché se 𝑎 ′ ↦→ 𝑏 ′ e 𝑐 ′ ↦→ 𝑑′ allora si ha 𝑎 + 𝑏 ′ = 𝑎 ′ + 𝑏 , 𝑐 + 𝑑′ = 𝑐 ′ + 𝑑
da cui 𝑏 ′ + 𝑑′ + 𝑎 + 𝑐 = 𝑎 ′ + 𝑐 ′ + 𝑏 + 𝑑 che significa che 𝑎 ′ + 𝑐 ′ ↦→ 𝑏 ′ + 𝑑′ è la stessa
traslazione di 𝑎 + 𝑐 ↦→ 𝑏 + 𝑑 . Osserviamo che 𝑥 + 𝑦 = 𝑦 + 𝑥 in quanto 𝑎 + 𝑐 = 𝑐 + 𝑎 e
𝑏 + 𝑑 = 𝑑 + 𝑏 (su ℕ sappiamo già che l’addizione è commutativa).
+0
La traslazione +0 ∈ ℤ manda 0 ↦→ 0 e quindi 𝑥 + (+0) = 𝑥 per ogni 𝑥 ∈ ℤ. Inoltre se
𝑥 𝑦 𝑥+𝑦
𝑎 ↦→ 𝑏 e 𝑏 ↦→ 𝑎 allora 𝑎 ↦→ 𝑎 e quindi 𝑥 + 𝑦 = 0+ .

Possiamo anche definire un ordinamento su ℤ ponendo 𝑥 ≤ 𝑦 se la traslazione 𝑦


𝑥 𝑦
manda i punti più avanti di quanto non faccia 𝑥 . Se 𝑎 ↦→ 𝑏 e 𝑐 ↦→ 𝑑 il punto 𝑎 + 𝑐 viene
mandato in 𝑏 + 𝑐 da 𝑥 e in 𝑎 + 𝑑 da 𝑦 : poniamo dunque 𝑥 ≤ 𝑦 quando 𝑏 + 𝑐 ≤ 𝑎 + 𝑑 .
𝑥 𝑦
Se 𝑥, 𝑦, 𝑧 ∈ ℤ vogliamo mostrare che 𝑥 ≤ 𝑦 =⇒ 𝑥 + 𝑧 ≤ 𝑦 + 𝑧 . Posto 𝑎 ↦→ 𝑏 , 𝑐 ↦→ 𝑑 ,
𝑧 𝑥+𝑧 𝑦+𝑧
𝑒 ↦→ 𝑓 allora 𝑎 + 𝑐 + 𝑒 ↦→ 𝑏 + 𝑐 + 𝑓 mentre 𝑎 + 𝑐 + 𝑒 ↦→ 𝑎 + 𝑑 + 𝑓 dunque se 𝑥 ≤ 𝑦 si
ha 𝑏 + 𝑐 ≤ 𝑎 + 𝑑 da cui 𝑏 + 𝑐 + 𝑓 ≤ 𝑎 + 𝑑 + 𝑓 e quindi 𝑥 + 𝑧 ≤ 𝑦 + 𝑧 come volevamo
dimostrare.
positivo
Se 𝑥 > 0 diremo che 𝑥 è positivo se invece 𝑥 < 0 diremo che 𝑥 è negativo.
negativo
In base a quanto abbiamo osservato l’insieme ℤ con l’operazione di addizione 𝑥 + 𝑦 e
la relazione 𝑥 ≤ 𝑦 che abbiamo appena definito risulta essere, in base alle seguenti
definizioni, un gruppo additivo, abeliano, ordinato.

Definizione 1.41 (gruppo). Un insieme 𝑋 su cui è definita una operazione ∗ si dice essere gruppo

un gruppo se l’operazione ha le seguenti proprietà:

1. associativa: ∀𝑥, 𝑦, 𝑧 ∈ 𝑋 : (𝑥 ∗ 𝑦) ∗ 𝑧 = 𝑥 ∗ (𝑦 ∗ 𝑧);


2. esistenza elemento neutro: ∃𝑒 ∈ 𝑋 : ∀𝑥 ∈ 𝑋 : 𝑒 ∗ 𝑥 = 𝑥 ∗ 𝑒 = 𝑥 ;
3. esistenza inverso: ∀𝑥 ∈ 𝑋 : ∃𝑦 ∈ 𝑋 : 𝑥 ∗ 𝑦 = 𝑦 ∗ 𝑥 = 𝑒 . gruppo abeliano

Inoltre il gruppo si dice essere abeliano o commutativo se vale la proprietà:

4. commutativa: ∀𝑥, 𝑦 ∈ 𝑋 : 𝑥 ∗ 𝑦 = 𝑦 ∗ 𝑥 .

Quando l’operazione viene denotata con il simbolo + (addizione) diremo che il gruppo è additivo,
denoteremo con 0 (zero) l’elemento neutro e l’inverso di 𝑥 verrà chiamato opposto e si denota
con −𝑥 . Se invece si usa il simbolo · (moltiplicazione) diremo che il gruppo è moltiplicativo,
l’elemento neutro potrà essere denotato con il simbolo 1 (uno o unità) e l’inverso di 𝑥 potrà
essere chiamato reciproco e si denota usualmente con 𝑥 −1 .
30 1 fondamenti

L’elemento neutro di un gruppo è unico. Se infatti 𝑥 e 𝑦 fossero due elementi neutri si


avrebbe 𝑥 = 𝑥 ∗ 𝑦 = 𝑦 . Anche l’inverso è unico: infatti se 𝑦 e 𝑧 fossero due inversi di 𝑥
si avrebbe 𝑦 = 𝑦 ∗ 𝑥 ∗ 𝑧 = 𝑧 .

gruppo ordinato Definizione 1.42 (gruppo ordinato). Diremo che 𝑋 è un gruppo ordinato se 𝑋 è un gruppo
(con operazione ∗ ed elemento neutro 𝑒 ) se è anche un insieme ordinato (con relazione ≤ ) e se
vale la proprietà:

1. monotonia: se 𝑥 ≤ 𝑦 allora per ogni 𝑧 si ha:

𝑥∗𝑧 ≤ 𝑦∗𝑧 e 𝑧 ∗ 𝑥 ≤ 𝑧 ∗ 𝑦.
Ricordiamo che gli insiemi ordinati era-
no stati introdotti con la definizione 1.25. +
Osserviamo che la funzione 𝑛 ↦→ +𝑛 mette in corrispondenza ogni numero 𝑛 ∈ ℕ
Una volta definito l’ordinamento lar-
go ≤ , risultano definiti di conseguen- con la traslazione non negativa +𝑛 ∈ ℤ. Ovviamente +(𝑛 + 𝑚) = (+𝑛) + (+𝑚) e
za anche l’ordinamento inverso ≥ e gli 𝑛 ≤ 𝑚 ⇐⇒ +𝑛 ≤ +𝑚 dunque identificando 𝑛 con +𝑛 possiamo considerare ℤ una
ordinamenti stretti < e >. estensione di ℕ che mantiene inalterata l’addizione e la relazione d’ordine. Sarà quindi
consuetudine supporre che sia ℕ ⊆ ℤ.

L’insieme ℕ non è un gruppo additivo in quanto non esiste l’elemento opposto.


Significa che l’operazione inversa dell’addizione, la sottrazione, non è definita per ogni
coppia di numeri naturali. Aggiungendo i numeri negativi abbiamo quindi esteso ℕ a
ℤ in modo che ogni elemento abbia opposto, ottenendo guindi un gruppo additivo. La
differenza 𝑥 − 𝑦 di due numeri interi 𝑥, 𝑦 ∈ ℤ è definita come la somma con l’opposto:
𝑥 − 𝑦 = 𝑥 + (−𝑦) ed estende la differenza che avevamo già definito su ℕ quando
𝑥 ≥ 𝑦.
L’operazione di moltiplicazione che abbiamo definito su ℕ può essere estesa in modo
naturale a tutto ℤ. Se vogliamo mantenere la proprietà distributiva dovremo avere:

0 = 0 · 𝑛 = (𝑚 + (−𝑚)) · 𝑛 = 𝑚 · 𝑛 + (−𝑚) · 𝑛

per cui poniamo per definizione, per ogni 𝑛, 𝑚 ∈ ℕ :

(−𝑚) · 𝑛 = −(𝑚 · 𝑛), 𝑚 · (−𝑛) = −(𝑚 · 𝑛).

E’ noioso ma facile dimostrare che valgono le usuali proprietà della moltiplicazione su


ℤ.

Teorema 1.43 (proprietà moltiplicazione). La moltiplicazione su ℤ soddisfa le seguenti


proprietà.

1. elemento neutro e assorbente: 𝑛 · 1 = 𝑛 , 𝑛 · 0 = 0,


2. proprietà associativa: (𝑛 · 𝑚) · 𝑘 = 𝑛 · (𝑚 · 𝑘),
3. proprietà commutativa: 𝑛 · 𝑚 = 𝑚 · 𝑛 ,
4. proprietà distributiva: 𝑘 · (𝑚 + 𝑛) = 𝑘 · 𝑚 + 𝑘 · 𝑛 .

anello In effetti scopriamo che ℤ è un anello abeliano con unità, in base alla seguente.

Definizione 1.44 (anello). Sia 𝐴 un insieme su cui sono definite due operazioni: + (ad-
dizione) e · (moltiplicazione). Diremo che 𝐴 è un anello se 𝐴 è un gruppo abeliano rispetto
alla addizione, se la moltiplicazione è associativa (𝑥 · 𝑦) · 𝑧 = 𝑥 · (𝑦 · 𝑧) e se vale la proprietà
1.7 i numeri interi 31

distributiva 𝑥 · (𝑦 + 𝑧) = 𝑥 · 𝑦 + 𝑥 · 𝑧 , (𝑥 + 𝑦) · 𝑧 = 𝑥 · 𝑧 + 𝑦 · 𝑧 . Se inoltre la moltiplicazione


è commutativa diremo che 𝐴 è un anello abeliano. Se inoltre esiste un elemento 1 ∈ 𝐴 neutro
per la moltiplicazione diremo che 𝐴 è un anello con unità.

In generale se 𝐴 è un anello allora si può dimostrare che valgono anche le usuali


proprietà:
0 · 𝑥 = 𝑥 · 0 = 0, (−1) · 𝑥 = 𝑥 · (−1) = −𝑥.
Per la prima abbiamo:

0 · 𝑥 = 0 · 𝑥 + 𝑥 + (−𝑥) = (0 + 1) · 𝑥 + (−𝑥) = 𝑥 + (−𝑥) = 0

e scrivendo gli addendi in ordine opposto si ottiene anche 𝑥 · 0 = 0. Allora possiamo


dimostrare anche la seconda proprietà:

(−1) · 𝑥 = (−1) · 𝑥 + 𝑥 + (−𝑥) = (−1 + 1) · 𝑥 + (−𝑥) = 0 + (−𝑥) = −𝑥

e anche in questo caso scrivendo gli addendi in ordine opposto si ottiene 𝑥 ·(−1) = −𝑥 .
multiplo
Se 𝑛, 𝑚 ∈ ℤ con 𝑚 ≠ 0 e se esiste 𝑘 ∈ ℤ tale che 𝑛 = 𝑘𝑚 diremo che 𝑛 è un multiplo di
divisore
𝑚 oppure che 𝑚 è un divisore di 𝑛 e scriveremo:
𝑛
= 𝑘.
𝑚
pari

I multipli di 2 si chiamano numeri pari, gli interi non pari si dicono dispari. dispari

sommatoria e produttoria

Se 𝐴 è un insieme su cui è definita un’operazione di addizione (o di moltiplicazione) e


se 𝒂 ∈ 𝐴𝑛 è una 𝑛 -upla di elementi di 𝐴, possiamo definire la somma (o il prodotto)

𝑛−1
X
𝑎 𝑘 = 𝑎0 + 𝑎1 + · · · + 𝑎 𝑛−1
𝑘=0
(1.9)
𝑛−1
Y
𝑎 𝑘 = 𝑎0 · 𝑎1 · · · 𝑎 𝑛−1 .
𝑘=0

delle componenti del vettore 𝒂 = (𝑎 0 , . . . , 𝑎 𝑛−1 ). La definizione formale deve essere


data per induzione:

 −1
X  −1
Y
𝑎 𝑘 = 0, 𝑎 𝑘 = 1,

 


 

𝑘=0 𝑘=0

 

! !
X𝑛 𝑛−1
X Y𝑛 𝑛−1
Y
𝑎𝑘 = 𝑎 𝑘 + 𝑎𝑛 ; 𝑎𝑘 = 𝑎 𝑘 · 𝑎𝑛 .

 


 

 𝑘=0 𝑘=0  𝑘=0 𝑘=0
 

La variabile 𝑘 che si trova nelle formule (1.9) è muta: al suo posto si può utilizzare
qualunque altra variabile che non compaia altrove.
32 1 fondamenti

E’ naturalmente possibile anche fare una somma a partire da un indice diverso da 0.


Se 𝑚, 𝑛 ∈ ℤ, 𝑚 ≤ 𝑛 + 1, porremo:
𝑛
X 𝑛−𝑚
X
𝑎𝑘 = 𝑎 𝑚+𝑗 .
𝑘=𝑚 𝑗=0

Dal punto di vista mnemonico abbiamo fatto un cambio di variabile 𝑗 = 𝑘 − 𝑚 : per


𝑘 = 𝑚 si trova 𝑗 = 0 e per 𝑘 = 𝑛 si trova 𝑗 = 𝑛 − 𝑚 .

Esercizio 1.45. Se l’operazione di addizione è associativa e commutativa si può dimostrare


per induzione che la somma è lineare:
𝑛
X 𝑛
X 𝑛
X 𝑛
X 𝑛
X
[𝑎 𝑘 + 𝑏 𝑘 ] = 𝑎𝑘 + 𝑏𝑘 , 𝑐 · 𝑎𝑘 = 𝑐 · 𝑎𝑘
𝑘=𝑚 𝑘=𝑚 𝑘=𝑚 𝑘=𝑚 𝑘=𝑚

e additiva:
𝑛
X 𝑗
X 𝑛
X
𝑎𝑘 = 𝑎𝑘 + 𝑎𝑘 .
𝑘=𝑚+1 𝑘=𝑚+1 𝑘=𝑗+1

Esercizio 1.46. Dimostrare che


𝑛 𝑛
X 𝑛 · (𝑛 + 1) X 𝑛 · (𝑛 + 1) · (2𝑛 + 1)
𝑘= , 𝑘2 =
𝑘=1
2 𝑘=1
6

Svolgimento. Il risultato della prima somma può essere interpretato nel modo seguente:
la media di una progressione aritmetica 1+2+···+𝑛
𝑛 è uguale alla media tra il primo e
1+𝑛
l’ultimo termine della progressione: 2 .
Una volta identificata la formula la possiamo dimostrare per induzione. Per 𝑛 = 0 la
somma è pari a 0 per definizione. Se la formula è vera per un certo 𝑛 , si ha
!
𝑛+1 𝑛
X X 𝑛 · (𝑛 + 1) (𝑛 + 2)(𝑛 + 1)
𝑘= 𝑘 + (𝑛 + 1) = + (𝑛 + 1) =
𝑘=1 𝑘=1
2 2

che è quanto volevamo dimostrare.


La formula per la somma dei quadrati si può dimostrare facilmente per induzione (lo
si faccia per esercizio) se già conosciamo la formula da dimostrare.
Un metodo per trovare la formula è quello di osservare che la differenza di due termini
cubici consecutivi risulta essere quadratico:

𝑘 3 − (𝑘 − 1)3 = 3 𝑘 2 − 3 𝑘 + 1.

Sommando ambo i lati della precedente equazione si ottiene:


𝑛
X 𝑛
X 𝑛
X 𝑛
X 𝑛
X
𝑘3 − (𝑘 − 1)3 = 3 𝑘2 − 3 𝑘+ 1. (1.10)
𝑘=1 𝑘=1 𝑘=1 𝑘=1 𝑘=1

Al lato destro compare la somma di cui vogliamo calcolare il valore insieme ad altre
si chiama somma telescopica in quanto i due somme di cui sappiamo già il valore. Basterà allora determinare il valore del lato
termini delle due sommatorie si chiu-
dono uno nell’altro come i tubi di un
sinistro dove osserviamo che i termini delle due somme si cancellano a vicenda, tranne
cannocchiale.
1.8 polinomi 33

l’ultimo della prima somma e il primo della seconda: dunque si ottiene 𝑛 3 − 03 = 𝑛 3 .


Moltiplichiamo per 2 l’equazione (1.10), mettiamo in evidenza la somma dei quadrati
e utilizzando la formula 2 𝑛𝑘=1 𝑘 = 𝑛(𝑛 + 1) per ottenere:
P

𝑛
X
𝑘 2 = 2𝑛 3 + 3𝑛(𝑛 + 1) − 2𝑛 = 𝑛 · 2(𝑛 2 − 1) + 3(𝑛 + 1)
 
6
𝑘=1
= 𝑛 · (𝑛 + 1)(2𝑛 + 1)

che è quanto volevamo dimostrare.


P𝑛
Con lo stesso metodo si può trovare una formula per il calcolo di 𝑘=1
𝑘 3 e così
via. . .

Se 𝜎 : [𝑛] → [𝑛] è bigettiva (una tale funzione si chiama permutazione) e se l’addizione permutazione
è associativa e commutativa allora si può fare il cambio di variabile 𝑘 = 𝑔(𝑗):

𝑛−1
X 𝑛−1
X
𝑎𝑘 = 𝑎 𝜎(𝑗) .
𝑘=0 𝑗=0

Questa uguaglianza può essere dimostrata facilmente nel caso in cui 𝜎 scambi due
soli indici lasciando fissi tutti gli altri (trasposizione) e poi può essere estesa a tutte le
permutazioni osservando che ogni permutazione si scrivere come composizione di
trasposizioni.

Questa proprietà è sostanzialmente la proprietà commutativa della somma estesa ad


un numero qualunque di addendi. Grazie a questa proprietà possiamo definire la
somma di una funzione definita su qualunque insieme finito. Se 𝑓 : 𝑋 → 𝐴 (su 𝐴 è
definita una operazione + associativa e commutativa) e 𝜎 : [𝑛] → 𝑋 è una bigezione
(dunque #𝑋 = 𝑛 ) allora si può definire

X 𝑛−1
X
𝑓 (𝑥) = 𝑓 (𝜎(𝑗))
𝑥∈𝑋 𝑗=0

in quanto la somma sul lato destro non dipende dalla bigezione 𝜎 che abbiamo scelto.

1.8 polinomi

Il concetto di “polinomio” è una astrazione che non risulta facile esplicitare formalmente.
Nel capitolo 9 ci sarà molto utile applicare un polinomio ad un operatore differenziale
e dunque ci teniamo ora a rendere molto chiaro cosa intendiamo per polinomio. In
particolare distingueremo tre concetti che spesso vengono sovrapposti: espressione
polinomiale, polinomio e funzione polinomiale.

Se 𝐴 è un anello abeliano con unità (per ora noi abbiamo un unico esempio 𝐴 = ℤ
ma più avanti potremo scegliere 𝐴 = ℚ, 𝐴 = ℝ o 𝐴 = ℂ) possiamo considerare
tutte le espressioni (formalmente: alberi di valutazione) che possono essere costruite
utilizzando le operazioni di addizione e moltiplicazione che coinvolgono coefficienti
presi da 𝐴 e una variabile che possiamo chiamare 𝑥 (e più in generale è possibile
considerare polinomi in più variabili). Queste espressioni verranno chiamate espressioni
34 1 fondamenti

+ +

· 42 · ·

−7 𝑥 𝑥 + 3 +

Figura 1.3: Il polinomio


𝑃 = ((−7) · 𝑥 + 42)·(𝑥·(2+𝑥)+3 ·(−1+𝑥))
rappresentato come albero di valutazio- 2 𝑥 −1 𝑥
ne.

espressioni polinomiali
polinomiali su 𝐴 (o a coefficienti in 𝐴) nella variabile 𝑥 . Un esempio di espressione
polinomiale è riportato in Figura 1.3. Le espressioni polinomiali possono essere
sommate e moltiplicate tra loro per ottenere nuove espressioni. Come comoda
notazione si utilizzano le potenze intere per denotare un prodotto ripetuto 𝑛 volte:
𝑥𝑛 = 𝑥 · · · 𝑥.

Diremo che due espressioni sono equivalenti se è possibile trasformare una nell’altra
utilizzando le proprietà valide negli anelli abeliani: proprietà associativa e commutativa
per somma e prodotto, proprietà distributiva, elementi neutri 1 · 𝑥 = 𝑥 , 0 + 𝑥 = 𝑥 .
Inoltre se un ramo dell’espressione non contiene la variabile 𝑥 è possibile valutare
(nell’anello 𝐴) le operazioni e sostituire l’intero ramo con il risultato di tali operazioni
(e viceversa).

In particolare se abbiamo una qualunque espressione possiamo sviluppare tutti i


prodotti mediante la proprietà distributiva e poi riassociare i termini con le stesse
potenze di 𝑥 , ad esempio:

𝑃 = ((−7) · 𝑥 + 42) · (𝑥 · (2 + 𝑥) + 3 · (−1 + 𝑥))


= ((−7) · 𝑥 + 42) · (2 𝑥 + 𝑥 2 − 3 + 3 𝑥)
= 126 + 231 𝑥 + 7 𝑥 2 − 7 𝑥 3

In generale si otterrà una espressione polinomiale che diremo essere in forma canonica:
𝑛
𝑃 = 𝑎0 + 𝑎1 𝑥 + 𝑎2 𝑥 2 + · · · + 𝑎 𝑛 𝑥 𝑛 = 𝑎𝑘 𝑥 𝑘 .
X
𝑘=0

Dunque ogni espressione polinomiale è equivalente ad una espressione polinomiale


in forma canonica.

polinomio Se due espressioni polinomiali sono equivalenti diremo che rappresentano lo stesso
polinomio. Se 𝐴 è un anello denoteremo con 𝐴[𝑥] l’insieme di tutti i polinomi con
coefficienti in 𝐴 e variabile 𝑥 . Formalmente 𝐴[𝑥] è il quoziente dell’insieme di tutte
le espressioni polinomiali rispetto alla relazione di equivalenza che abbiamo appena
1.8 polinomi 35

definito. Possiamo fare la somma e il prodotto di polinomi e queste operazioni rendono


𝐴[𝑥] anch’esso un anello.

Più esplicitamente se 𝑃 e 𝑄 sono polinomi in forma canonica


𝑛 𝑚
𝑎𝑘 𝑥 𝑘 , 𝑏𝑘 𝑥 𝑘
X X
𝑃= 𝑄=
𝑘=0 𝑘=0

si avrà:
𝑁
(𝑎 𝑘 + 𝑏 𝑘 ) · 𝑥 𝑘
X
𝑃+𝑄 =
𝑘=0

dove 𝑁 è il più grande tra 𝑛 e 𝑚 e si intende che 𝑎 𝑘 = 0 per 𝑘 > 𝑛 e 𝑏 𝑘 = 0 per 𝑘 > 𝑚 .
Se 𝑡 ∈ 𝐴 avremo:
𝑛
(𝑡𝑎 𝑘 ) · 𝑥 𝑘 .
X
𝑡𝑃 =
𝑘=0

Per quanto riguarda il prodotto si avrà invece:


! ! ! !
𝑛 𝑛 𝑛 𝑚
𝑘 𝑗 𝑗 𝑘
X X X X
𝑃·𝑄 = 𝑎𝑘 𝑥 · 𝑏𝑗 𝑥 = 𝑎𝑘 𝑏𝑗 𝑥 𝑥
𝑘=0 𝑗=0 𝑘=0 𝑗=0
! !
𝑛 X
𝑚 𝑚+𝑛 𝑠
𝑗+𝑘
𝑎 𝑗 𝑏 𝑠−𝑗 𝑥 𝑠 .
X X X
= 𝑎𝑘 𝑏𝑗 𝑥 =
𝑘=0 𝑗=0 𝑠=0 𝑗=0

Le formule per la somma e il prodotto dei polinomi in forma canonica possono


essere applicate ad ognuna delle proprietà di anello per dimostrare che polinomi
equivalenti hanno la stessa forma canonica e che quindi due espressioni polinomiali
sono equivalenti se e solo se i coefficienti della loro forma canonica coincidono. In
pratica i polinomi a coefficienti in 𝐴 sono rappresentati dai coefficienti delle loro forme
canoniche che non sono altro che sequenze finite:
𝑛
𝑎 𝑘 𝑥 𝑘 : 𝑎 𝑘 ∈ 𝐴, 𝑛 ∈ ℕ }
X
𝐴[𝑥] = {
𝑘=0
≈ 𝐴ℕ
𝑐 = 𝒂 ∈ 𝐴 : {𝑘 ∈ ℕ : 𝒂(𝑘) ≠ 0 } è finito .



Se il polinomio 𝑃 si scrive in forma canonica


𝑛
𝑎𝑘 𝑥 𝑘
X
𝑃=
𝑘=0

se 𝑛 > 0 possiamo supporre che il coefficiente 𝑎 𝑛 sia diverso da 0 perché altrimenti grado
potremmo rimuovere il termine corrispondente e ridurci ad una somma di 𝑛 − 1
termini. In tal caso diremo che il polinomio 𝑃 ha grado 𝑛 . Se 𝑛 = 0 diremo anche
che il polinomio è costante. Se 𝑛 = 0 e 𝑎 𝑛 = 0 diremo che 𝑃 è il polinomio nullo.
I polinomi costanti non nulli hanno grado pari a 0, mentre il polinomio nullo, per
convenzione, diremo avere grado −∞ (questa definizione ha senso se si pensa al
grado di un polinomio come al più piccolo numero per cui tutti i coefficienti di indice
maggiore a lui sono nulli).
36 1 fondamenti

Finora abbiamo definito il polinomio come una classe di equivalenza di espressioni


polinomiali. Se prendiamo una espressione 𝑃 e al posto della variabile 𝑥 mettiamo un
elemento 𝑎 dell’anello 𝐴 (o di qualunque anello che estende 𝐴) allora possiamo valutare
tutte le operazioni (somme e prodotti) ed ottenere un risultato nell’anello scelto: il
risultato ottenuto si indica con 𝑃(𝑎) (stessa notazione utilizzata per le funzioni). Se 𝑃
è un polinomio nella variabile 𝑥 la funzione 𝑥 ↦→ 𝑃(𝑥) può essere chiamata funzione
funzione polinomiale
polinomiale e si indica usualmente con con lo stesso nome 𝑃 dato al polinomio. Sarà il
contesto a dirci se con 𝑃 si intende il polinomio (l’espressione) o la funzione.

Come già anticipato è utile tenere separato il concetto di polinomio da quello di


funzione polinomiale in quanto lo stesso polinomio può essere valutato su diversi
anelli (ad esempio nel corso di geometria si potrà sostituire la variabile 𝑥 di un
polinomio con una matrice, e nell’ultimo capitolo di questi appunti sostituiremo la 𝑥
con un operatore differenziale).

Proseguiremo con la trattazione dei polinomi nel capitolo 4.4.

1.9 coefficienti binomiali

Capiterà spesso di imbattersi in alcuni polinomi particolari, che vengono a volte


prodotti notevoli chiamati prodotti notevoli. Di fondamentale iportanza quelli di grado 2:

(𝑥 + 1) · (𝑥 − 1) = 𝑥 2 − 1 , (𝑥 + 1)2 = 𝑥 2 + 2𝑥 + 1.

Ma anche quelli di grado 𝑛 :

𝑛−1 𝑛−1 𝑛
𝑥𝑘 = 𝑥 𝑘+1 − 𝑥 𝑘 = 𝑥𝑛 − 1
X X X
(𝑥 − 1) ·
𝑘=0 𝑘=0 𝑘=0

e, mettendo −𝑥 al posto di 𝑥 e cambiando di segno:

𝑛−1
(−1) 𝑘 𝑥 𝑘 = 1 + (−1)𝑛 𝑥 𝑛 .
X
(𝑥 + 1) ·
𝑘=0

Le potenze del binomio 𝑥 + 1 sono decisamente rilevanti. Se scriviamo il polinomio


(𝑥 + 1)𝑛 in forma canonica:
𝑛
(𝑥 + 1)𝑛 = 𝑎𝑘 𝑥 𝑘
X
𝑘=0

saremmo interessati a calcolare il valore dei coefficienti 𝑎 𝑘 . Innanzitutto gli diamo un


coefficienti binomiali
nome: questi coefficienti vengono chiamati coefficienti binomiali e si denotano nel modo
I coefficienti binomiali nell’ambito del
seguente:
calcolo combinatorio vengono anche
𝑛
 
chiamati combinazioni
 e denotati con il 𝑎𝑘 = .
simbolo 𝐶 𝑛,𝑘 = 𝑛𝑘 . La coincidenza tra 𝑘
le combinazioni e i coefficienti binomiali
è espressa nel teorema 1.40.
Non è difficile convincersi che se sviluppiamo il binomio (𝑥 + 𝑦)𝑛 si ottengono gli stessi
potenza del binomio coefficienti dunque in generale vale la seguente formula per la potenza del binomio:
𝑛  
𝑛 𝑛
𝑥 𝑘 𝑦 𝑛−𝑘 .
X
(𝑥 + 𝑦) =
𝑘=0
𝑘
1.9 coefficienti binomiali 37

𝑛
  Tabella 1.5: Il triangolo di Tartaglia (o
0 1 2 3 4 5 6 𝑘 di Pascal): ogni numero è la somma dei
𝑘 due numeri che si trovano nella riga
0 1 precedente sopra e immediatamente a
1 1 1 sinistra.
2 1 2 1
3 1 3 3 1
4 1 4 6 4 1
5 1 5 10 10 5 1
6 1 6 15 20 15 6 1
.. ..
𝑛 . .

Per determinare il valore effettivo dei coefficienti binomiali si utilizza usualmente il


seguente.

Teorema 1.47 (triangolo di Tartaglia). Per ogni 𝑛 ∈ ℕ e 𝑘 ∈ ℕ con 1 ≤ 𝑘 ≤ 𝑛 si ha

𝑛+1 𝑛 𝑛
     
= +
𝑘 𝑘−1 𝑘

mentre
𝑛+1 𝑛+1
   
=1=
0 𝑛+1

Dimostrazione. Infatti si ha
𝑛+1  𝑛  
𝑛+1 𝑛

𝑥 𝑘 = (1 + 𝑥)𝑛+1 = (1 + 𝑥) · 𝑥𝑘
X X
𝑘=0
𝑘 𝑘=0
𝑘
𝑛   𝑛  
𝑛 𝑛
𝑥𝑘 + 𝑥 𝑘+1
X X
=
𝑘=0
𝑘 𝑘=0
𝑘
𝑛   𝑛+1
𝑛 𝑛
 
𝑘
𝑥𝑘
X X
= 𝑥 +
𝑘=0
𝑘 𝑘=1
𝑘−1
𝑛
𝑛 0 𝑛 𝑛 𝑛 𝑛+1
       
𝑘
X
= 𝑥 + + 𝑥 + 𝑥 .
0 𝑘=1
𝑘 𝑘−1 𝑛

Per l’unicità della forma canonica dei polinomi i coefficienti corrispondenti devono
essere uguali e quindi troviamo

𝑛+1 𝑛 𝑛+1 𝑛 𝑛 𝑛+1 𝑛


             
= , = + , = .
0 0 𝑘 𝑘 𝑘−1 𝑛+1 𝑛

0
Si può facilmente verificare che 0 = 1 e questo conclude la dimostrazione.

In base al teorema precedente i coefficienti binomiali si possono elencare come nella


tabella 1.5: ogni riga inizia e finisce con il numero 1 e ogni termine intermedio coincide
con la somma dei due termini nella riga precedente sopra e a sinistra del numero
considerato.
38 1 fondamenti

Teorema 1.48 (formula per i coefficienti binomiali). Se 𝑛 ∈ ℕ e 𝑘 ∈ ℕ , 𝑘 ≤ 𝑛 si ha

𝑛 𝑛!
 
= .
𝑘 𝑘 !(𝑛 − 𝑘)!

Dimostrazione. Lo dimostriamo per induzione su 𝑛 . Per 𝑛 = 0 sappiamo che 00 = 1



0!
. Utilizziamo il teorema 1.47. Se 𝑘 = 0 o 𝑘 = 𝑛 sappiamo che 𝑛𝑘 = 1

che è ugule a 0!0!
che coincide con la formula enunciata. Per gli altri casi, supponendo per induzione
che la formula sia vera per un certo 𝑛 ∈ ℕ si ha:

𝑛+1 𝑛 𝑛 𝑛! 𝑛!
     
= + = +
𝑘 𝑘 𝑘−1 𝑘 !(𝑛 − 𝑘)! (𝑘 − 1)!(𝑛 − 𝑘 + 1)!
𝑛 !(𝑛 − 𝑘 + 1) + 𝑛 ! 𝑘 𝑛 !(𝑛 + 1)
= =
𝑘 !(𝑛 − 𝑘 + 1)! 𝑘 !(𝑛 + 1 − 𝑘)!
(𝑛 + 1)!
=
𝑘 !(𝑛 + 1 − 𝑘)!

che è quanto dovevamo dimostrare.

Si osservi che risulta, per ogni 𝑛 ∈ ℕ :

𝑛 𝑛
   
= = 𝑛.
1 𝑛−1

Esercizio 1.49. Provare che


𝑛  
𝑛
= 2𝑛 .
X
𝑘=0
𝑘

1.10 frazioni e numeri razionali

Così come abbiamo esteso i numeri naturali affinché l’operazione di addizione abbia
una operazione inversa (la sottrazione) in modo simile possiamo estendere l’insieme
dei numeri interi in modo che anche la moltiplicazione abbia una operazione inversa
(la divisione).

Per fare questo consideriamo i “riscalamenti” su ℤ. Dati 𝑝, 𝑞 ∈ ℤ se 𝑞 ≠ 0 possiamo


considerare la funzione 𝑠 definita sui multipli di 𝑞 tale che 𝑠(𝑘 · 𝑞) = 𝑘 · 𝑝 per ogni
𝑘 ∈ ℤ. Si tratta del riscalamento che manda 𝑞 in 𝑝 e lo possiamo identificare con
𝑝
la frazione 𝑞 (formalmente una frazione non è altro che una coppia di interi (𝑞, 𝑝)
con 𝑞 ≠ 0). Osserviamo però che frazioni diverse possono rappresentare lo stesso
riscalamento nell’intersezione dei loro domini. Infatti i due riscalamenti rappresentati
𝑝 𝑝′ 𝑝
dalle frazioni 𝑞 e 𝑞′ sono definiti entrambi sul numero 𝑞 · 𝑞 ′ e si ha 𝑞 (𝑞 · 𝑞 ′) = 𝑝 · 𝑞 ′ e
𝑝′
· 𝑞 ′) = 𝑝 ′ · 𝑞 per cui se 𝑝 · 𝑞 ′ = 𝑝 ′ · 𝑞 i due riscalamenti coincidono in un punto.
𝑞 ′ (𝑞
Ma se coincidono in un punto coincidono in tutti i punti in cui sono entrambi definiti.
Diremo in tal caso che le due frazioni sono equivalenti e scriveremo

𝑝 𝑝′
∼ ′ ⇐⇒ 𝑝 · 𝑞 ′ = 𝑝 ′ · 𝑞.
𝑞 𝑞
1.10 frazioni e numeri razionali 39

I numeri razionali non sono altro che le frazioni identificate a meno di equivalenza:

ℚ = ((ℤ \ {0}) × ℤ)/∼ .

La moltiplicazione tra numeri razionali può essere definita tramite la composizione


dei riscalamenti:
𝑝 𝑝′ 𝑝
 

(𝑞 · 𝑞 ) = (𝑝 ′ · 𝑞) = 𝑝 · 𝑝 ′
𝑞 𝑞′ 𝑞
da cui
𝑝 𝑝′ 𝑝 · 𝑝′
· ′ = .
𝑞 𝑞 𝑞 · 𝑞′
Si verifica facilmente che questa definizione passa al quoziente nel senso che il prodotto di
frazioni equivalenti è equivalente al prodotto delle frazioni. Dunque la moltiplicazione
è ben definita su ℚ.
𝑞
Le frazioni del tipo 𝑞 sono tutte equivalenti tra loro e rappresentano l’elemento neutro
𝑝
della moltiplicazione. Le frazioni del tipo 1 rappresentano la moltiplicazione per
𝑝 ∈ ℤ e quindi identificano i numeri interi ℤ all’interno di ℚ. Per poter estendere
l’addizione da ℤ a ℚ in modo da preservare la proprietà distributiva sarà quindi
necessario che si abbia

𝑝 𝑝 𝑝 𝑝′
 
+ ′ (𝑞 · 𝑞 ′) = (𝑞 · 𝑞 ′) + ′ (𝑞 · 𝑞 ′) = 𝑝 · 𝑞 ′ + 𝑝 ′ · 𝑞
𝑞 𝑞 𝑞 𝑞

da cui
𝑝 𝑝′ 𝑝 · 𝑞′ + 𝑝′ · 𝑞
+ ′ = .
𝑞 𝑞 𝑞 · 𝑞′
E’ facile verificare che anche questa definizione passa al quoziente ovvero che la somma di
frazioni equivalenti è equivalente alla somma delle frazioni dunque anche l’addizione
in questo modo è ben definita su ℚ.

Abbiamo quindi esteso l’addizione e la moltiplicazione da ℤ a ℚ e ora, su ℚ. Rispetto


all’addizione ℚ risulta essere un gruppo commutativo (come lo era ℤ) in quanto ogni
𝑝 −𝑝
frazione 𝑞 ha come opposto 𝑞 e l’addizione rimane associativa e commutativa.
0 ∈ ℤ si identifica in ℚ con la classe di
Inoltre in ℚ ogni elemento diverso da 0 ha anche un inverso moltiplicativo, infatti se equivalenza delle frazioni del tipo 0𝑞 e 1
𝑞
𝑝 ≠ 0 e 𝑞 ≠ 0 si ha: è rappresentato dalle frazioni del tipo 𝑞.
𝑝 𝑞 𝑝·𝑞 1
· = ∼ .
𝑞 𝑝 𝑞·𝑝 1
Dunque ℚ \ {0} risulta essere a sua volta un gruppo moltiplicativo.
𝑝
In maniera naturale diremo che una frazione 𝑞 è non-negativa se, visto come risca-
lamento, manda gli interi non-negativi in interi non-negativi. Questo succede se
𝑝 e 𝑞 non hanno segno opposto, ovvero se 𝑝 · 𝑞 ≥ 0. Possiamo quindi definire un
ordinamento su ℚ ponendo 𝑥 ≤ 𝑦 se 𝑦 − 𝑥 è non-negativo e cioè, visto sulle frazioni,

𝑝 𝑝′ 𝑝′ · 𝑞 − 𝑝 · 𝑞′
≤ ′ ⇐⇒ ≥ 0 ⇐⇒ (𝑝 ′ · 𝑞 − 𝑝 · 𝑞 ′) · 𝑞 · 𝑞 ′ ≥ 0.
𝑞 𝑞 𝑞 · 𝑞′

Questo ordinamento estende quello di ℤ e rende sia il gruppo additivo ℚ che il gruppo
moltiplicativo ℚ+ = {𝑞 ∈ ℚ : 𝑞 > 0} un gruppo totalmente ordinato.
40 1 fondamenti

In effetti risulta che ℚ è il nostro primo esempio di campo ordinato, in base alla
seguente definizione.

Definizione 1.50 (campo). Diremo che 𝕂 è un campo se 𝕂 è un anello commutativo con


unità (definizione 1.44) e se ogni 𝑥 ∈ 𝕂 , 𝑥 ≠ 0 ha un inverso moltiplicativo cioè esiste 𝑦 ∈ 𝕂
reciproco tale che 𝑥 · 𝑦 = 1. L’inverso moltiplicativo si chiama anche reciproco. Se 𝑦 ≠ 0 denotiamo con
𝑥/𝑦 o 𝑥𝑦 il prodotto di 𝑥 con il reciproco di 𝑦 . Questa operazione si chiama divisione.
divisione
Se 𝕂 è anche totalmente ordinato da una relazione ≤ (definizione 1.25) e se valgono anche le
seguenti proprietà:

𝑎 ≤ 𝑏 =⇒ 𝑎 + 𝑐 ≤ 𝑏 + 𝑐, 𝑎, 𝑏 ≥ 0 =⇒ 𝑎 · 𝑏 ≥ 0

campo ordinato diremo che 𝕂 è un campo ordinato.

Sull’insieme numerico ℚ le operazioni di addizione e moltiplicazione sono dunque


entrambe invertibili (salvo la moltiplicazione per zero). Questo è molto utile perché ci
permette di risolvere tutte le equazioni lineari della forma :

𝑚𝑥 + 𝑞 = 0

quando 𝑚 ≠ 0. Infatti la funzione 𝑓 (𝑥) = 𝑚𝑥 + 𝑞 è una composizione di una


moltiplicazione 𝑥 ↦→ 𝑚𝑥 con una somma 𝑦 ↦→ 𝑦 + 𝑞 e la sua funzione inversa si trova
quindi invertendo le due operazioni:
−𝑞
𝑚𝑥 = −𝑞, 𝑥= .
𝑚

Ci sono però altre equazioni che vorremmo risolvere ma che non hanno soluzione su
ℚ. L’esempio più semplice (scoperto da Pitagora) è l’equazione 𝑥 2 = 2.

Teorema 1.51 (irrazionalità di 2). L’equazione 𝑥 2 = 2 non ha soluzioni in ℚ.

Dimostrazione. Supponiamo 𝑥 ∈ ℚ sia una soluzione di 𝑥 2 = 2. Allora si potrà scrivere


𝑥 = 𝑝/𝑞 con 𝑝 ∈ ℤ e 𝑞 ∈ ℕ , 𝑞 ≠ 0. Possiamo anche supporre che la frazione 𝑝/𝑞 sia
ridotta ai minimi termini cioè che 𝑝 e 𝑞 non abbiano fattori in comune. Moltiplicando
l’equazione (𝑝/𝑞)2 = 2 per 𝑞 2 si ottiene 𝑝 2 = 2 𝑞 2 . Risulta quindi che 𝑝 2 è pari. Ma
allora anche 𝑝 è pari (perché il quadrato di un dispari è dispari). Ma se 𝑝 è pari allora
𝑝 2 è multiplo di quattro. Ma allora anche 2 𝑞 2 è multiplo di quattro e quindi 𝑞 2 è pari.
Dunque anche 𝑞 è pari. Ma avevamo supposto che 𝑝 e 𝑞 non avessero fattori in comune
quindi questo non può accadere.

valore assoluto

valore assoluto
Definizione 1.52 (valore assoluto). Se 𝕂 è un campo totalmente ordinato (ad esempio
𝕂 = ℚ o, come vedremo, 𝕂 = ℝ) definiamo il valore assoluto |𝑥| di un numero 𝑥 ∈ 𝕂 nel
seguente modo: (
𝑥 se 𝑥 ≥ 0 ,
|𝑥| =
−𝑥 se 𝑥 < 0.
1.10 frazioni e numeri razionali 41

Proposizione 1.53 (proprietà del valore assoluto). Si ha

1. |𝑥| ≥ 0 (positività)
2. |𝑥| = |𝑥| (idempotenza)
3. |−𝑥| = |𝑥| (simmetria)
4. |𝑥 · 𝑦| = |𝑥| · |𝑦| (omogenità)
5. |𝑥 + 𝑦| ≤ |𝑥| + |𝑦| (convessità)
6. |𝑥 − 𝑦| ≤ |𝑥 − 𝑧| + |𝑧 − 𝑦| (disuguaglianza triangolare)
7. |𝑥| − |𝑦| ≤ |𝑥 − 𝑦| (disuguaglianza triangolare inversa)

Useremo inoltre spesso la seguente equivalenza (valida anche con < al posto di ≤ ). Se 𝑟 ≥ 0
allora
|𝑥 − 𝑦| ≤ 𝑟 ⇐⇒ 𝑦 − 𝑟 ≤ 𝑥 ≤ 𝑦 + 𝑟.

Dimostrazione. Positività, idempotenza, simmetria e omogenità sono immediate conse-


guenze della definizione.

Dimostriamo ora l’ultima osservazione. Se 𝑥 ≥ 𝑦 allora 𝑥 − 𝑦 ≥ 0 e quindi |𝑥 − 𝑦| ≤ 𝑟


è equivalente a 𝑥 − 𝑦 ≤ 𝑟 cioè 𝑥 ≤ 𝑦 + 𝑟 . Se 𝑥 < 𝑦 allora 𝑥 − 𝑦 < 0 e quindi |𝑥 − 𝑦| ≤ 𝑟
è equivalente a 𝑦 − 𝑥 ≤ 𝑟 cioè 𝑥 ≥ 𝑦 − 𝑟 . Viceversa se 𝑦 − 𝑟 ≤ 𝑥 ≤ 𝑦 + 𝑟 allora vale sia
𝑥 − 𝑦 ≤ 𝑟 che 𝑦 − 𝑥 ≤ 𝑟 e dunque |𝑥 − 𝑦| ≤ 𝑟 .

Osserviamo allora che per la precedente osservazione applicata a |𝑥 − 0 | ≤ |𝑥| si


ottiene
−|𝑥| ≤ 𝑥 ≤ |𝑥|
e sommando la stessa disuguaglianza con 𝑦 al posto di 𝑥 si ottiene

−(|𝑥| + |𝑦|) ≤ 𝑥 + 𝑦 ≤ |𝑥| + |𝑦|

che è equivalente alla proprietà di convessità:

|𝑥 + 𝑦| ≤ |𝑥| + |𝑦| = |𝑥| + |𝑦|.


Ponendo 𝑦 = 𝑧 − 𝑥 nella disuguaglianza precedente, si ottiene

|𝑧| ≤ |𝑥| + |𝑧 − 𝑥|

da cui
|𝑧| − |𝑥| ≤ |𝑧 − 𝑥|.
Scambiando 𝑧 con 𝑥 si ottiene la disuguaglianza opposta e mettendole assieme si
ottiene la disuguaglianza triangolare inversa:

|𝑧| − |𝑥| ≤ |𝑧 − 𝑥|.


La disuguaglianza triangolare segue dalla convessità:

|𝑥 − 𝑦| = |𝑥 − 𝑧 + 𝑧 − 𝑦| ≤ |𝑥 − 𝑧| + |𝑧 − 𝑦|.
42 1 fondamenti

Osserviamo che dal punto di vista geometrico |𝑥 − 𝑦| rappresenta la distanza tra i punti
𝑥 e 𝑦.

1.11 costruzione dei numeri reali

Osserviamo che l’insieme


𝐴 = 𝑥 ∈ ℚ : 𝑥2 ≤ 2


non ha massimo. Infatti se 𝑥 ∈ 𝐴 non può essere 𝑥 2 = 2 (per il teorema 1.51) e quindi
dovrà essere 𝑥 2 < 2. Ma possiamo dimostrare che se 𝑥 2 < 2 esiste 𝜀 > 0 tale per cui
(𝑥 + 𝜀)2 < 2. Infatti si ha (𝑥 + 𝜀)2 = 𝑥 2 + 2𝜀𝑥 + 𝜀2 ma se 𝑥 2 < 2 certamente dovrà
essere 𝑥 < 2 (altrimenti 𝑥 2 ≥ 4) e quindi 𝑥 2 + 2 𝜀𝑥 + 𝜀2 < 𝑥 2 + 4 𝜀2 + 𝜀2 = 𝑥 2 + 5 𝜀2 . Se
ora scegliamo 𝜀 < 1 sappiamo che 𝜀2 < 𝜀 e quindi 𝑥 2 + 5 𝜀2 < 𝑥 2 + 5 𝜀. E affinché sia
2
𝑥 2 + 5 𝜀 < 2 è sufficiente scegliere 𝜀 < 2−𝑥
5 . In tal modo abbiamo dimostrato che se
𝑥 ∈ 𝐴 allora esiste 𝜀 > 0 tale che 𝑥 + 𝜀 ∈ 𝐴. Questo significa che l’insieme 𝐴 non ha
massimo.

L’idea è ora che una ipotetica soluzione positiva dell’equazione 𝑥 2 = 2 dovrebbe potersi
approssimare, per difetto, con gli elementi dell’insieme 𝐴. Allora vogliamo utilizzare
l’insieme 𝐴 per rappresentare un tale ipotetico numero.

Procediamo dunque col definire (si ricordi la definizione 1.33):

R = {𝐴 ∈ P(ℚ) : 𝐴 ≠ ∅, 𝐴 superiormente limitato}.

Dati 𝐴, 𝐵 ∈ R scriveremo 𝐴 ∼ 𝐵 se 𝐴 e 𝐵 hanno gli stessi maggioranti, ovvero se per


ogni 𝑞 ∈ ℚ si ha 𝑞 ≥ 𝐴 ⇐⇒ 𝑞 ≥ 𝐵. Chiaramente ∼ è una relazione di equivalenza
(vedi definizione 1.9) l’insieme degli insiemi equivalenti ad 𝐴 si chiama classe di
equivalenza e viene denotata con [𝐴]∼ . Possiamo quindi definire il quoziente

ℝ = R/∼= {[𝐴]∼ : 𝐴 ∈ R}, [𝐴]∼ = {𝐵 ∈ R : 𝐵 ∼ 𝐴}


numeri reali
che chiameremo insieme dei numeri reali. L’idea di questa definizione è che i numeri
reali possono essere identificati dalle loro approssimazioni per difetto tramite numeri
razionali. Diverse approssimazioni, però, possono rappresentare lo stesso numero
reale.

Esercizio 1.54. Si mostri che si ha 𝐴 ∼ 𝐵 ∼ 𝐶 se


n 𝑛 o
𝐴 = {1}, 𝐵 = {𝑥 ∈ ℚ : 𝑥 < 1}, 𝐶= :𝑛∈ℕ .
𝑛+1

Esercizio 1.55. Si mostri che si ha 𝐴 ∼ 𝐵 se


n 𝑛 o
𝐴 = 𝑥 ∈ ℚ : 𝑥2 < 2 , 𝐵= : 𝑛 ∈ ℕ , 𝑘 ∈ ℕ , 𝑛 2 ≤ 2 · 100 𝑘 < (𝑛 + 1)2 .

10 𝑘
Verificare che  
14 141 1414 14142
𝐵 ⊇ 1, , , , .
100 10000 1000000 100000000
1.11 costruzione dei numeri reali 43

Dati 𝐴, 𝐵 ∈ R definiamo 𝐴 + 𝐵 = {𝑎 + 𝑏 : 𝑎 ∈ 𝐴, 𝑏 ∈ 𝐵}. Chiaramente 𝐴 + 𝐵 ∈ R


inoltre non è difficile dimostarare che se 𝐴 ∼ 𝐴′ e 𝐵 ∼ 𝐵′ si ha 𝐴 + 𝐵 ∼ 𝐴′ + 𝐵′. Questo
significa che è ben definita l’addizione su ℝ in modo che per ogni 𝐴, 𝐵 ∈ R si abbia:

[𝐴]∼ + [𝐵]∼ = [𝐴 + 𝐵]∼ .

Ovviamente l’addizione su ℝ è associativa e commutativa in quanto queste proprietà


valgono su ℚ e di conseguenza su R: (𝐴 + 𝐵) + 𝐶 = {𝑎 + 𝑏 + 𝑐 : 𝑎 ∈ 𝐴, 𝑏 ∈ 𝐵, 𝑐 ∈ 𝐶} =
𝐴 + (𝐵 + 𝐶) e 𝐴 + 𝐵 = {𝑎 + 𝑏 : 𝑎 ∈ 𝐴, 𝑏 ∈ 𝐵} = 𝐵 + 𝐴. Visto che 𝐴 + {0} = 𝐴 notiamo
anche che [{0}]∼ è elemento neutro dell’addizione.

Dato 𝐴 ∈ R denotiamo con 𝐴′ l’insieme dei maggioranti di 𝐴. Vogliamo dimostrare


che 𝐴 e 𝐴′ contengono punti arbitrariamente vicini:

∀𝜀 ∈ ℚ : (𝜀 > 0 =⇒ ∃𝑎 ∈ 𝐴 : ∃𝑏 ∈ 𝐴′ : 𝑏 − 𝑎 < 𝜀). (1.11)

Per fare ciò prendiamo qualunque 𝑐 ∈ 𝐴 (visto che 𝐴 ≠ ∅) e qualunque 𝑞 ∈ 𝐴′ (visto


che 𝐴 è superiormente limitato, 𝐴′ ≠ ∅). L’insieme 𝐼 = {𝑛 ∈ ℕ : 𝑐 + 𝑛𝜀 ∈ 𝐴′ } non
𝑞−𝑐
è vuoto in quanto se 𝑛 > 𝜀 si ha 𝑐 + 𝑛𝜀 > 𝑞 ed essendo 𝑞 un maggiorante di 𝐴
anche 𝑐 + 𝑛𝜀 lo è. Dunque per il buon ordinamento di ℕ (teorema 1.34) l’insieme 𝐼 ha
minimo, che chiamiamo 𝑘 . Se 𝑘 = 0 significa che 𝑐 ∈ 𝐴′ e posto 𝑎 = 𝑏 = 𝑐 si ottiene
che (1.11) è banalmente verificata. Altrimenti prendiamo 𝑏 = 𝑐 + 𝑘𝜀. Per la scelta di 𝑘
sappiamo che 𝑏 ∈ 𝐴′ e 𝑐 + (𝑘 − 1)𝜀 non è un maggiorante di 𝐴. Ma allora esiste 𝑎 ∈ 𝐴
tale che 𝑎 > 𝑐 + (𝑘 − 1)𝜀 da cui 𝑏 − 𝑎 < 𝜀 e (1.11) è ancora verificata.

Possiamo ora osservare che posto 𝐵 = −𝐴′ = {−𝑥 ∈ ℚ : 𝑥 maggiorante di 𝐴} si ha


(𝐴 + 𝐵) ∼ {0}. I maggioranti di {0} sono i 𝑞 ∈ ℚ con 𝑞 ≥ 0, vogliamo dimostrare che
anche 𝐴 + 𝐵 ha gli stessi maggioranti. Ma se 𝑎 ∈ 𝐴 e 𝑏 ∈ 𝐵 risulta che −𝑏 ≥ 𝑎 ovvero
𝑎 + 𝑏 ≤ 0 dunque 0 è un maggiorante di 𝐴 + 𝐵 e qualunque 𝑞 ≥ 0 lo è a maggior
ragione. Se invece 𝑞 < 0 per la proprietà (1.11) esistono 𝑎 ∈ 𝐴 e −𝑏 ∈ 𝐴′ (cioè 𝑏 ∈ 𝐵)
tali che (−𝑏) − 𝑎 < −𝑞 cioè 𝑎 + 𝑏 > 𝑞 . Dunque 𝑞 < 0 non è un maggiorante di 𝐴 + 𝐵 e
concludiamo che 𝐴 + 𝐵 ∼ {0}.

Questo dimostra che dato qualunque 𝑥 ∈ ℝ se 𝑥 = [𝐴]∼ posto 𝑦 = [−𝐴′] si ha


𝑥 + 𝑦 = [0]∼ . Dunque ogni 𝑥 ∈ ℝ ha opposto 𝑦 che denoteremo con 𝑦 = −𝑥 .
Abbiamo quindi dimostrato che ℝ è un gruppo rispetto all’operazione di addizione.
L’ordinamento di ℚ può essere facilmente esteso a ℝ definendo [𝐴]∼ ≤ [𝐵]∼ se ogni
maggiorante di 𝐵 è anche maggiorante di 𝐴. Questa definizione non dipende dalla
scelta di 𝐴 e 𝐵 nella loro classe di equivalenza perché all’interno della classe di
equivalenza l’insieme dei maggioranti non cambia. Chiaramente 𝑥 ≤ 𝑥 , se 𝑥 ≤ 𝑦
e 𝑦 ≤ 𝑥 si ha 𝑥 = 𝑦 e se 𝑥 ≤ 𝑦 , 𝑦 ≤ 𝑧 si ha 𝑥 ≤ 𝑧 : dunque ≤ è un ordinamento
su ℝ. E’ inoltre un ordinamento totale perché dati 𝑥 = [𝐴]∼ e 𝑦 = [𝐵] se 𝑥 ≠ 𝑦
significa che l’insieme dei maggioranti di 𝐴 è diverso dall’insieme dei maggioranti
di 𝐵. Supponiamo allora che esista 𝑞 che è maggiorante di 𝐴 ma non maggiorante di
𝐵 (se succede il viceversa basta scambiare 𝐴 e 𝐵). In tal caso 𝐵 ≥ 𝐴 in quanto ogni
maggiorante di 𝐵 deve essere maggiore di 𝑞 e quindi deve essere anche un maggiorante
di 𝐴 da cui 𝑥 ≤ 𝑦 .

L’ordinamento è compatibile con l’addizione perché se [𝐴]∼ ≤ [𝐵]∼ e 𝐴, 𝐵, 𝐶 ∈ R


allora se 𝑞 è maggiorante di 𝐵 + 𝐶 per ogni 𝑐 ∈ 𝐶 si ha che 𝑞 − 𝑐 è maggiorante di 𝐵 e
dunque 𝑞 − 𝑐 è anche maggiorante di 𝐴. Ma allora 𝑞 è maggiorante di 𝐴 + 𝐶 . Dunque
se 𝑥 ≤ 𝑦 e 𝑥, 𝑦, 𝑧 ∈ ℝ si ha 𝑥 + 𝑧 ≤ 𝑦 + 𝑧 e ℝ è un gruppo ordinato.
44 1 fondamenti

ordinamento denso Definizione 1.56 (ordinamento denso). Un ordinamento ≤ si dice essere denso o divisibile
se tra due punti distinti esiste sempre un punto intermedio:

𝑥 < 𝑦 =⇒ ∃𝑐 : 𝑥 < 𝑐 < 𝑦.

L’ordinamento di ℝ è denso. Infatti se 𝑥 < 𝑦 posto 𝑦 − 𝑥 = [𝐴]∼ sappiamo che


ogni maggiorante di 𝐴 è maggiore o uguale a 0. Ma se ogni numero positivo fosse
maggiorante di 𝐴 avremmo 𝐴 ∼ {0} che non è possibile in quanto 𝑥≠ 𝑦 . Dunque
𝑞
esiste 𝑞 > 0 che non è maggiorante di 𝐴. Ma allora 𝑦 − 𝑥 ≥ [{𝑞}]∼ > 2 ∼ = 𝜀 > 0
da cui 𝑥 < 𝑥 + 𝜀 < 𝑦 .

Definizione 1.57 (ordinamento continuo). Un ordinamento ≤ su un insieme 𝑋 si dice


essere continuo (o Dedekind-completo) se dati comunque 𝐴, 𝐵 sottoinsiemi non vuoti di 𝑋 tali
ordinamento continuo
che per ogni 𝑎 ∈ 𝐴 e per ogni 𝑏 ∈ 𝐵 risulta 𝑎 ≤ 𝑏 (concisamente scriveremo 𝐴 ≤ 𝐵) allora
esiste 𝑐 ∈ 𝑋 tale che per ogni 𝑎 ∈ 𝐴 e ogni 𝑏 ∈ 𝐵 si ha 𝑎 ≤ 𝑐 ≤ 𝑏 (concisamente 𝐴 ≤ 𝑐 ≤ 𝐵).

A parole la condizione 𝐴 ≤ 𝐵 si può esprimere dicendo che 𝐴 e 𝐵 sono separati, mentre


la condizione 𝐴 ≤ 𝑐 ≤ 𝐵 si può esprimere dicendo che 𝑐 è un elemento di separazione
tra 𝐴 e 𝐵. Allora la precedente definizione ci dice che un insieme ordinato è continuo
ogni coppia di sottoinsiemi separati ammette un elemento di separazione. In molti
testi questa condizione viene chiamata completezza o, più precisamente, completezza di
Dedekind.

Teorema 1.58. L’ordinamento di ℝ è continuo.

Dimostrazione. Siano dati A e B sottoinsiemi non vuoti di ℝ con A ≤ B. Possiamo


definire
[
𝐶= {𝐴 ∈ R : [𝐴]∼ ∈ A} = {𝑞 ∈ ℚ : ∃𝐴 ∈ R : ([𝐴]∼ ∈ A) ∧ (𝑞 ∈ 𝐴)}.

Preso qualunque 𝑎 = [𝐴]∼ ∈ A risulta ovviamente 𝐴 ⊆ 𝐶 . In particolare 𝐶 non è vuoto.


Mentre se 𝑏 = [𝐵]∼ ∈ B preso qualunque 𝑞 ∈ 𝐶 si ha 𝑞 ∈ 𝐴 per un qualche 𝐴 tale che
[𝐴]∼ = 𝑎 ∈ A. Ma visto che 𝑎 ≤ 𝑏 , ogni maggiorante di 𝐵 è anche maggiorante di 𝐴.
In particolare preso un qualunque 𝑟 maggiorante di 𝐵 risulta che 𝑟 è un maggiorante
di 𝐶 . Allora 𝐶 ∈ R e posto 𝑐 = [𝐶]∼ risulta che ogni maggiorante di 𝐶 è maggiorante
di ogni 𝐴 con [𝐴]∼ ∈ A mentre ogni maggiorante di un qualunque 𝐵 con [𝐵]∼ ∈ B
è anche un maggiorante di 𝐶 . Questo significa che 𝑐 ≥ 𝑎 per ogni 𝑎 ∈ 𝐴 e 𝑏 ≥ 𝑐 per
ogni 𝑏 ∈ 𝐵: la dimostrazione è conclusa.

Ad ogni 𝑞 ∈ ℚ si può associare l’elemento [{𝑞}]∼ di ℝ. Ovviamente se 𝑞 ≠ 𝑠 in ℚ


allora {𝑞} ed {𝑠} non hanno gli stessi maggioranti e quindi si ottengono elementi
distinti di ℝ. Identificando 𝑞 con [{𝑞}]∼ possiamo quindi pensare che ℚ ⊆ ℝ.
Prendiamo però l’insieme 𝐴 = {𝑥 ∈ ℚ : 𝑥 2 < 2}. Se fosse 𝐴 ∼ {𝑞} per qualche 𝑞 ∈ ℚ
dovremmo concludere che 𝑞 è un maggiorante di 𝐴 e che ogni 𝑠 < 𝑞 non è maggiorante
di 𝐴. Ma allora dovrebbe essere 𝑞 2 ≤ 2 perché se fosse 𝑞 2 > 2 potremmo trovare
𝑠 < 𝑞 tale che anche 𝑠 2 > 2 (basta notare che 𝑞 < 2 e prendere 𝑠 = 𝑞 − 𝜀 con 𝜀 > 0,
𝑞 2 −2
𝜀 < 1, 𝜀 < 4 così 𝑠 2 = (𝑞 − 𝜀)2 > 𝑞 2 − 2 𝜀𝑞 > 𝑞 2 − 4 𝜀 > 𝑞 2 − (𝑞 2 − 2) = 2). Dunque

ℝ ≠ ℚ, l’elemento 𝑥 = [𝐴]∼ di ℝ sarà proprio quello che chiameremo 2 e vedremo
che risolverà l’equazione 𝑥 2 = 2.
1.12 proprietà assiomatiche dei numeri reali 45

1.12 proprietà assiomatiche dei numeri reali

Nel paragrafo precedente abbiamo dimostrato che esiste un insieme ℝ su cui è definita
una operazione di addizione e un ordinamento che rendono ℝ un gruppo totalmente
ordinato, denso e continuo (definizioni 1.25, 1.56, 1.57).
Come al solito d’ora in poi non guarderemo più come è stato definito ℝ ma utilizzeremo
solamente le proprietà appena esposte. Potremmo anche pensare che ℝ debba
esistere per assioma, evitando quindi di dover esibire la costruzione fatta nel capitolo
precedente.

estremo superiore

Definizione 1.59. Sia 𝑅 un insieme ordinato (in particolare pensiamo all’insieme ℝ dei
numeri reali). Sia 𝐴 ⊆ 𝑅 . Se 𝐴 ha un maggiorante (cioè esiste 𝑥 ∈ 𝑅 tale che 𝑥 ≥ 𝐴,
definizione 1.33) diremo che 𝐴 è superiormente limitato, se 𝐴 ammette un minorante diremo
che 𝐴 è inferiormente limitato, se 𝐴 ammette sia maggiorante che minorante diremo che 𝐴 è
limitato. limitato

Se 𝑥 è minimo dei maggioranti di 𝐴 diremo che 𝑥 è estremo superiore di 𝐴 se invece 𝑥 è estremo superiore
massimo dei minoranti diremo che 𝑥 è estremo inferiore di 𝐴:
estremo inferiore
sup 𝐴 = min {𝑥 ∈ 𝑅 : 𝑥 ≥ 𝐴},
inf 𝐴 = max {𝑥 ∈ 𝑅 : 𝑥 ≤ 𝐴}.

Osserviamo che se l’insieme 𝐴 è finito e non vuoto, il massimo e il minimo esistono


sempre. Se, ad esempio, non esistesse il massimo di 𝐴 significa che scelto 𝑥 𝑘 ∈ 𝐴
esisterebbe sempre 𝑥 𝑘+1 ∈ 𝐴 con 𝑥 𝑘+1 > 𝑥 𝑘 e quindi l’insieme 𝐴 dovrebbe conte-
nere infiniti punti 𝑥 0 , 𝑥 1 , . . . , 𝑥 𝑘 , . . . Insiemi infiniti, invece, potrebbero non avere
massimo/minimo. Un esempio di insieme che non ha né massimo né minimo è
l’insieme 𝐴 = {𝑥 ∈ ℝ : 0 < 𝑥 < 1} infatti per ogni 𝑥 ∈ 𝐴 si ha 𝑥2 < 𝑥 , 1+𝑥 2 > 𝑥 con
𝑥
2 ∈ 𝐴 e 1+𝑥
2 ∈ 𝐴 , dunque nessun 𝑥 ∈ 𝐴 può essere massimo o minimo. L’insieme
𝐵 = {𝑥 ∈ ℝ : 0 ≤ 𝑥 ≤ 1} ha invece massimo max 𝐵 = 1 e minimo min 𝐵 = 0.

Teorema 1.60 (esistenza del sup). Sia 𝑅 un insieme dotato di un ordine totale e continuo (in
particolare pensiamo a 𝑅 = ℝ). Se 𝐴 ⊆ 𝑅 è un insieme non vuoto e superiormente limitato,
allora esiste l’estremo superiore di 𝐴. Se 𝐴 ⊆ 𝑅 è un insieme non vuoto e inferiormente
limitato allora esiste l’estremo inferiore di 𝐴.

Dimostrazione. Consideriamo l’insieme dei maggioranti

𝐵 = {𝑏 ∈ 𝑅 : 𝑏 ≥ 𝐴}.

Per ipotesi 𝐵 è non vuoto e per come è definito risulta 𝐴 ≤ 𝐵. Dunque dall’assioma
di continuità (definizione 1.57) deduciamo l’esistenza di un numero 𝑥 ∈ ℝ tale che
𝐴 ≤ 𝑥 ≤ 𝐵. La prima disuguaglianza 𝐴 ≤ 𝑥 ci dice che 𝑥 è un maggiorante e quindi
𝑥 ∈ 𝐵, la seconda 𝑥 ≤ 𝐵 ci dice che 𝑥 è il minimo di 𝐵 e quindi concludiamo che 𝑥 è il
minimo dei maggioranti ovvero l’estremo superiore di 𝐴.
46 1 fondamenti

Dimostrazione analoga vale per l’estremo inferiore.

L’esistenza del sup (o dell’inf) è in effetti una condizione equivalente all’assioma di


continuità. Infatti se 𝐴 ≤ 𝐵 certamente sup 𝐴, se esiste, è elemento di separazione tra
𝐴 e 𝐵.

parte intera

Se 𝑅 è un gruppo con operazione + ed elemento neutro 0, allora per ogni 𝑥 ∈ 𝑅 si


può definire il prodotto 𝑛 · 𝑥 con 𝑛 ∈ ℕ come somma ripetuta: Si pone 0 · 𝑥 = 0 e per
induzione (𝑛 + 1) · 𝑥 = 𝑛 · 𝑥 + 𝑥 .

Il seguente risultato ci dice, informalmente, che non esistono quantità infinite (ma
neanche infinitesime) in ℝ.
proprietà archimedea
Teorema 1.61 (proprietà archimedea dei numeri reali). Sia 𝑅 un gruppo totalmente
ordinato e completo (ad esempio 𝑅 = ℝ sarà per noi il caso rilevante) con operazione + ed
elemento neutro 0. Dati 𝑥, 𝑦 ∈ 𝑅 con 𝑥, 𝑦 > 0 esiste 𝑛 ∈ ℕ tale che 𝑛 · 𝑦 > 𝑥 .

A parole: per quanto piccolo possa essere 𝑦 > 0, sommandolo a se stesso molte volte si arriva,
dopo un numero finito di passi, a superare qualunque numero 𝑥 anche molto grande.

Dimostrazione. Fissati 𝑥, 𝑦 ∈ 𝑅 , 𝑥, 𝑦 > 0 consideriamo l’insieme

𝐴 = ℕ · 𝑦 = {𝑛 · 𝑦 : 𝑛 ∈ ℕ }.

Basta dimostrare che 𝐴 non è superiormente limitato perché in tal caso dato 𝑥 ∈ ℝ
esisterebbe 𝑛 ∈ ℕ per cui 𝑛 · 𝑦 > 𝑥 .

Chiaramente 𝐴 non è vuoto in quanto 0 ∈ 𝐴 dunque se 𝐴 per assurdo fosse superior-


mente limitato esisterebbe 𝑚 = sup 𝐴, 𝑚 ∈ 𝑅 . Siccome 𝑚 è il minimo dei maggioranti
di 𝐴 e 𝑚 − 𝑦 è più piccolo di 𝑚 , allora 𝑚 − 𝑦 non è un maggiorante. Dunque deve
esistere 𝑛 ∈ ℕ tale che 𝑛 𝑦 > 𝑚 − 𝑦 . Ma allora (𝑛 + 1)𝑦 = 𝑛 𝑦 + 𝑦 > 𝑚 ed essendo
𝑛 + 1 ∈ ℕ troviamo che 𝑚 non poteva essere un maggiorante di 𝐴: assurdo.

Teorema 1.62 (parte intera). Dato 𝑥 ∈ ℝ esiste un unico 𝑚 ∈ ℤ tale che 𝑚 − 1 < 𝑥 ≤ 𝑚 .

Dimostrazione. Supponiamo per un attimo che sia 𝑥 > 0 e consideriamo l’insieme


𝐴 = {𝑛 ∈ ℕ : 𝑛 ≥ 𝑥}. Tale insieme non è vuoto per la proprietà archimedea e dunque
ammette minimo per il principio del buon ordinamento. Se 𝑚 = min 𝐴 risulta quindi
𝑚 ∈ ℕ e 𝑚 − 1 < 𝑥 ≤ 𝑚.

Se 𝑥 ≤ 0 per la proprietà archimedea esiste 𝑘 ∈ ℕ tale che 𝑘 > −𝑥 . Allora applichiamo


il risultato precedente a 𝑥 + 𝑘 e consideriamo 𝑚 − 𝑘 al posto di 𝑚 .
parte intera

⌊·⌋ Definizione 1.63 (parte intera). Dato 𝑥 ∈ ℝ denotiamo con ⌊𝑥⌋ l’unico intero che soddisfa

𝑥 − 1 < ⌊𝑥⌋ ≤ 𝑥
⌈·⌉
e denotiamo con ⌈𝑥⌉ = −⌊−𝑥⌋ l’unico intero che soddisfa (verificare!)
1.12 proprietà assiomatiche dei numeri reali 47

𝑥 ≤ ⌈𝑥⌉ < 𝑥 + 1.

Si ha dunque
⌊𝑥⌋ ≤ 𝑥 ≤ ⌈𝑥⌉
con entrambe le uguaglianze che si realizzano quando 𝑥 ∈ ℤ. I due interi ⌊𝑥⌋ e ⌈𝑥⌉ sono
la migliore approssimazione intera di 𝑥 rispettivamente per difetto e per eccesso. L’intero più
vicino ad 𝑥 (approssimazione per arrotondamento) è arrotondamento
   
1 1
𝑥+ ossia 𝑥−
2 2

(le due espressioni differiscono solamente quando 𝑥 si trova nel punto medio tra due interi
consecutivi, nel qual caso la prima approssima per eccesso e la seconda per difetto).

In alcuni testi si usa la notazione [𝑥] per denotare la parte intera ⌊𝑥⌋ e si definisce
anche la parte frazionaria
{𝑥} = 𝑥 − [𝑥].
Per evitare ambiguità con il normale utilizzo delle parentesi non useremo queste
notazioni.

numeri decimali

Le frazioni il cui denominatore è una potenza di 10 si chiamano frazioni decimali:


𝑝
𝑥= , 𝑝 ∈ ℤ, 𝑑 ∈ ℕ .
10𝑑
Tali frazioni si possono rappresentare scrivendo il numero intero 𝑝 e segnando un in Italia si preferisce utilizzare la virgola,
punto di separazione prima della 𝑑 -esima cifra a partire da destra. Ad esempio ma ci rassegnamo alla notazione anglo-
sassone che ormai è ubiqua in tutta la
scriveremo: strumentazione elettronica.
14142
1.4142 = .
104
𝑝
In generale una frazione 𝑞 ∈ ℚ può essere scritta in forma decimale solamente se,
quando ridotta ai minimi termini, risulta che 𝑞 non ha fattori primi diversi da 2 e 5 (in
quanto le potenze di dieci hanno solo questi fattori). In ogni caso le frazioni decimali
sono dense in ℝ in quanto dato 𝑥 ∈ ℝ per ogni 𝜀 > 0 esiste 𝑑 ∈ ℕ tale che 10−𝑑 ≤ 𝜀 e
quindi posto 𝑝 = ⌊ 10𝑑 · 𝑥 + 12 ⌋ si avrà
𝑝
1

𝑑 − 𝑥 ≤ < 𝜀.

10 2 · 10𝑑

In tal caso scriveremo
𝑝
𝑥≈ .
10𝑑
Ad esempio scriveremo Si osservi che in base alla definizio-
2 6667 ne data sarebbe anche corretto scrivere
≈ 0.6667 = 3 ≈ 0.6666 che però sarebbe una appros-
2
3 104
simazione peggiore. Questa ambiguità è
per intendere necessaria se vogliamo evitare i casi limi-
2 6667 te in cui bisogna conoscere molte più ci-
− < 1 . (1.12) fre decimali di quelle richieste per capire
3 10 104
4
qual è la migliore approssimazione.
48 1 fondamenti

Nel calcolo scientifico ogni uguaglianza numerica è intesa nel senso precedente, se
non specificato diversamente.

Le frazioni non decimali si possono scrivere con uno sviluppo decimale periodico. Non
useremo mai questa notazione che ricordiamo solamente con un esempio. Il numero

𝑥 = 12.34567 = 12.34567567

è la frazione che risolve l’equazione

100 𝑥 − 1234 0.567


 
= 100 𝑥 − 1234.567 = 0.000567
1000 1000

ovvero
1234567 − 1234
1234567 − 1234 = 99900 · 𝑥, 𝑥= .
99900

Esercizio 1.64. Dimostrare che vale (1.12).

isomorfismi di gruppi ordinati

Intuitivamente si può ottenere ℝ a partire da una retta geometrica con lo stesso


procedimento con cui si costruisce un righello. Iniziamo col segnare sulla retta un
punto di riferimento che chiamiamo 0, dopodiché osserviamo che il punto 0 (come
ogni altro punto) divide la retta in due parti. In modo arbitrario chiamiamo positivi i
punti che si trovano da una parte e negativi i punti che si trovano dall’altra parte. Sulla
semiretta dei numeri positivi scegliamo, arbitrariamente, un punto 1. Il segmento
compreso tra i punti 0 e 1 sarà la nostra unità di misura. L’addizione potrebbe essere
definita utilizzando i movimenti rigidi. Traslando il punto 1 di una unità alla volta si
ottengono, per iterazione, tutti i numeri naturali. Traslando all’indietro si ottengono
i numeri interi negativi. Assumendo che tra due punti qualunque esistano sempre
punti intermedi (divisibilità) e assumendo che suddividendo la retta in due parti esista
sempre un punto di suddivisione (continuità) mostreremo come si può suddividere
ogni segmento in 𝑛 parti uguali per ogni numero naturale 𝑛 . In tal modo potremo
ritrovare i numeri razionali e la moltiplicazione per un numero razionale. Con una
estensione crescente riusciremo quindi a definire la moltiplicazione tra numeri reali.
Osserveremo poi che la struttura moltiplicativa dei numeri reali positivi soddisfa
gli stessi assiomi della struttura additiva dei reali e che quindi la costruzione fatta
per costruire la moltiplicazione si potrà ripetere identica per costruire l’elevamento a
potenza.

Teorema 1.65 (divisibilità). Se 𝑅 è un gruppo totalmente ordinato, denso e continuo con


operazione + ed elemento neutro 0 allora per ogni 𝑦 ∈ 𝑅 , 𝑦 ≠ 0 e per ogni 𝑛 ∈ ℕ , 𝑛 ≠ 0
esiste un unico 𝑥 ∈ 𝑅 tale che 𝑛 · 𝑥 = 𝑦 .

Dimostrazione. Vogliamo innanzitutto dimostrare che

∀𝑦 > 0 : ∃𝑥 > 0 : 𝑥 + 𝑥 ≤ 𝑦. (1.13)


1.12 proprietà assiomatiche dei numeri reali 49

Per la proprietà di densità sappiamo che esiste 𝑧 tale che 0 < 𝑧 < 𝑦 . Prendiamo
𝑤 = 𝑦 − 𝑧 . Se 𝑤 ≤ 𝑧 allora 𝑤 + 𝑤 ≤ 𝑤 + 𝑧 = 𝑦 e possiamo prendere 𝑥 = 𝑤 . Altrimenti
𝑧 + 𝑧 < 𝑤 + 𝑧 = 𝑦 e possiamo prendere 𝑥 = 𝑧 .
Ora dobbiamo dimostrare che per ogni 𝑦 ∈ 𝑅 e per ogni 𝑛 ∈ ℕ , 𝑛 ≠ 0 esiste 𝑥 ∈ 𝑅 tale
che 𝑛 · 𝑥 = 𝑦 . Per fissare le idee supponiamo che sia 𝑦 > 0: il caso 𝑦 = 0 è banale e se
𝑦 < 0 basterà applicare il risultato all’opposto −𝑦 .
Fissati 𝑛 ∈ ℕ , 𝑛 ≠ 0 e 𝑦 > 0 consideriamo allora gli insiemi:

𝐴 = {𝑎 ∈ 𝑅 : 𝑎 ≥ 0 , 𝑛 · 𝑎 ≤ 𝑦},
𝐵 = {𝑏 ∈ 𝑅 : 𝑛 · 𝑏 ≥ 𝑦}.

Chiaramente si ha 𝑎 ≤ 𝑏 per ogni 𝑎 ∈ 𝐴 e 𝑏 ∈ 𝐵 perché se 𝑛 · 𝑎 ≤ 𝑛 · 𝑏 si può dedurre


𝑎 ≤ 𝑏 (altrimenti si violerebbe la proprietà 0 ≤ 𝑎 ≤ 𝑏 =⇒ 𝑛 · 𝑎 ≤ 𝑛 · 𝑏 dimostrabile
per induzione su 𝑛 ∈ ℕ ). Chiaramente 𝐵 ≠ ∅ in quanto 𝑦 ∈ 𝐴 visto che 𝑛 · 𝑦 ≥ 𝑦 se
𝑛 ∈ ℕ , 𝑛 ≠ 0. Meno ovvio dimostrare che 𝐴 ≠ ∅ per fare questo dobbiamo considerare
l’insieme 𝑀 = {𝑚 ∈ ℕ : ∃𝑥 > 0 : 𝑚 · 𝑥 ≤ 𝑦}. Ovviamente 1 ∈ 𝑀 e la proprietà (1.13)
ci dice che anche 2 ∈ 𝑀 . Per dimostrare che 𝑀 = ℕ basta allora dimostrare che se
𝑛 ∈ 𝑀 , 𝑛 ≥ 2 allora anche 𝑛 + 1 ∈ 𝑀 . Ma 𝑛 ∈ 𝑀 significa che esiste 𝑥 > 0 tale che
𝑛 · 𝑥 ≤ 𝑦 . Per la proprietà (1.13) esiste anche 𝑧 > 0 tale che 𝑧 + 𝑧 ≤ 𝑥 e dunque

(𝑛 + 1)𝑧 ≤ (𝑛 + 𝑛)𝑧 = 𝑛(𝑧 + 𝑧) ≤ 𝑛 · 𝑥 ≤ 𝑦.

Visto che 𝑀 = ℕ possiamo affermare che 𝐴 ≠ ∅.

Dunque 𝐴 ≤ 𝐵 sono separati e non vuoti e per l’ipotesi di continuità di 𝑅 possiamo


dedurre che esiste 𝑦 elemento di separazione: 𝐴 ≤ 𝑥 ≤ 𝐵. Vogliamo dimostrare che
𝑛 · 𝑥 = 𝑦.
Se fosse 𝑛 · 𝑥 < 𝑦 vogliamo dimostrare che esiste 𝜀 > 0 tale che 𝑛 · (𝑥 + 𝜀) < 𝑦 e
questo sarebbe assurdo perché allora 𝑥 + 𝜀 ∈ 𝐴 e 𝑥 non sarebbe un maggiorante di 𝐴.
Affinché sia 𝑛 · (𝑥 + 𝜀) < 𝑦 basterà avere 𝑛 · 𝜀 < 𝑦 − 𝑛 · 𝑥 . Un tale 𝜀 > 0𝐺 esiste per
quanto visto prima riguardo all’insieme 𝑀 , mettendo 𝑦 − 𝑛 · 𝑥 al posto di 𝑦 .

Viceversa se fosse 𝑛 · 𝑥 > 𝑦 vogliamo dimostrare che esiste 𝜀 > 0 tale che 𝑛 · (𝑥 − 𝜀) > 𝑦
e questo sarebbe assurdo perché allora 𝑥 − 𝜀 ∈ 𝐵 e 𝑥 non sarebbe un minorante di 𝐵.
Anche in questo caso 𝜀 si trova facilmente imponendo la disequazione 𝑛·𝜀 < 𝑛·𝑥−𝑦 .

Ovviamente c’è un unico 𝑥 tale che 𝑛 · 𝑥 = 𝑦 perché se 𝑛 · 𝑧 = 𝑛 · 𝑥 si ha 𝑛 · (𝑧 − 𝑥) = 0


𝑦
che è solo possibile quando 𝑧 = 𝑥 . Scriveremo 𝑥 = 𝑛 .

Definizione 1.66 (omomorfismo). Siano 𝑅 ed 𝑆 due gruppi con operazione ∗ su 𝑅 e


operazione ◦ su 𝑆 . Diremo che una funzione 𝜑 : 𝑅 → 𝑆 è un omomorfismo se per ogni omomorfismo
𝑥, 𝑦 ∈ 𝑅
𝜑(𝑥 ∗ 𝑦) = 𝜑(𝑥) ◦ 𝜑(𝑦).

Sull’insieme ℝ è possibile definire la moltiplicazione per un numero 𝑛 naturale come


somma ripetuta ed è possibile definire anche la divisione in 𝑛 parti uguali (teorema 1.65)
e di conseguenza la moltiplicazione per ogni numero razionale. Allora se fissiamo
𝑢 ∈ ℝ che rappresenti l’unità, è possibile immergere ℚ dentro ℝ associando 𝑞 ∈ ℚ al
numero 𝑞 · 𝑢 ∈ ℝ. E’ quello che facciamo nel seguente.
50 1 fondamenti

Lemma 1.67. Sia 𝑅 è un gruppo totalmente ordinato, denso e continuo e sia ℚ il gruppo
dei numeri razionali con l’operazione di addizione. Allora fissato 𝑢 ∈ 𝑅 esiste un unico
omomorfismo 𝜑 : ℚ → 𝑅 tale che 𝜑(1) = 𝑢 .

Se l’operazione su 𝑅 viene denotata con il simbolo di addizione + l’omomorfismo 𝜑 può essere


naturalmente denotato con il simbolo di moltiplicazione:

𝜑(𝑞) = 𝑞 · 𝑢

cosicché la proprietà di omomorfismo è semplicemente la proprietà distributiva (𝑞 + 𝑠) · 𝑢 =


𝑞 · 𝑢 + 𝑠 · 𝑢.

Denotiamo con ℚ · 𝑢 l’immagine di 𝑓 ovvero

ℚ · 𝑢 = {𝑞 · 𝑦 : 𝑞 ∈ ℚ}.

Dimostrazione. Usiamo il simbolo + per denotare l’operazione del gruppo 𝑅 e chiamia-


mo 0 l’elemento neutro di 𝑅 .

Passo 1: definizione sugli interi. Chiaramente deve essere 𝜑(0) = 0 in quanto 𝜑(0) =
𝜑(0 + 0) = 𝜑(0) + 𝜑(0). Inoltre 𝜑(𝑛 + 1) = 𝜑(𝑛) + 𝜑(1) = 𝜑(𝑛) + 𝑢 e quindi per
induzione se 𝑛 ∈ ℕ deve essere 𝜑(𝑛) = 𝑛 · 𝑢 (addizione ripetuta).

Ma se 𝑛 ∈ ℤ si ha 0 = 𝜑(𝑛 + (−𝑛)) = 𝜑(𝑛) + 𝜑(−𝑛) da cui 𝜑(−𝑛) = −𝜑(𝑛) = −𝑛 · 𝑢 .


Dunque 𝜑 è univocamente definita su tutto ℤ.

Ma ora ricordiamo che il teorema 1.65 definisce 𝑛𝑥 per ogni 𝑥 ∈ 𝑅 e ogni 𝑛 ∈ ℕ , 𝑛 ≠ 0.


Osserviamo che la proprietà di omomorfismo ci dice che per ogni 𝑞 ∈ ℚ ed ogni 𝑛 ∈ ℤ
deve valere
𝜑(𝑛 · 𝑞) = 𝑛 · 𝜑(𝑞)
(lo si dimostra per induzione quando 𝑛 ∈ ℕ e poi sugli altri 𝑛 ∈ ℤ si utilizza la
proprietà 𝜑(−𝑞) = −𝜑(𝑞) ottenibile anch’essa dalla proprietà di omomorfismo in
quanto 𝑞 + (−𝑞) = 0 e 𝜑(0) = 0) Allora la condizione 𝜑(1) = 𝑢 e la proprietà di
omomorfismo ci dicono che dovrà essere 𝜑(𝑛) = 𝑛 · 𝑢 per ogni 𝑛 ∈ ℤ. Infatti 𝜑(0) = 0
in quanto 𝜑(0 + 0) = 𝜑(0) + 𝜑(0) e si può sottrarre da ambo i membri l’opposto di
𝜑(0). Inoltre se 𝑛 ∈ ℕ si ha 𝜑(𝑛 + 1) = 𝜑(𝑛) + 𝜑(1) = 𝜑(𝑛) + 𝑢 dunque utilizzando
l’induzione possiamo dimostrare che risulta

𝜑(𝑛) = 𝑛 · 𝑢, ∀𝑛 ∈ ℕ .

Visto che 𝜑(𝑥 − 𝑥) = 0 se vogliamo che valga la proprietà di omomorfismo dovrà


essere 𝑝 ℎ𝑖(−𝑥) = −𝜑(𝑥). Dunque dovremo porre 𝑝 ℎ𝑖(−𝑛) = −𝑛 · 𝑢 .
𝑥
Passo 2: estensione ai razionali. Nel teorema 1.65 abbiamo definito 𝑛 per ogni 𝑥 ∈ 𝑅 e
ogni 𝑛 ∈ ℕ , 𝑛 ≠ 0, in modo tale che risulti 𝑛 · 𝑛𝑥 = 𝑥 .

In effetti se 𝜑 è un omomorfismo dovrà valere 𝜑(𝑥) = 𝑛𝜑 𝑛𝑥 (dimostrazione per



induzione) da cui 𝜑 risulta univocamente definita su ogni razionale
𝑝
Dunque se 𝑞 ∈ ℚ è una frazione con 𝑝 ∈ ℤ e 𝑞 ∈ ℕ , 𝑞 ≠ 0 possiamo definire
𝑝
𝑞 · 𝑥 = 𝑝 · 𝑥/𝑞 . Scopriamo allora che 𝜑 può essere definita in modo unico su ℚ · 𝑢 se
1.12 proprietà assiomatiche dei numeri reali 51

deve soddisfare la proprietà di omomorfismo, infatti dovrà essere:


𝑝 𝑝
𝜑( · 𝑥) = · 𝜑(𝑥).
𝑞 𝑞

Non è difficile verificare che effettivamente questa definizione garantisce la proprietà


di omomorfismo.
funzioni monotòne
Definizione 1.68 (funzioni monotòne). Una funzione 𝑓 : 𝐴 → 𝐵 con 𝐴, 𝐵 insiemi ordinati,
si dice essere

1. crescente se 𝑥 ≤ 𝑦 =⇒ 𝑓 (𝑥) ≤ 𝑓 (𝑦); crescente


2. decrescente se 𝑥 ≤ 𝑦 =⇒ 𝑓 (𝑥) ≥ 𝑓 (𝑦);
decrescente
3. monotòna se crescente o decrescente;
4. costante se crescente e decrescente; monotòna
5. strettamente crescente se 𝑥 < 𝑦 =⇒ 𝑓 (𝑥) < 𝑓 (𝑦); costante
6. strettamente decrescente se 𝑥 < 𝑦 =⇒ 𝑓 (𝑥) > 𝑓 (𝑦);
strettamente crescente
7. strettamente monotòna se strettamente crescente o strettamente decrescente.
strettamente decrescente

Si osservi che se 𝑓 : 𝐴 → ℝ è costante allora esiste 𝑐 tale che 𝑓 (𝑥) = 𝑐 per ogni 𝑥 ∈ 𝐴. strettamente monotòna
Si osservi anche che ogni funzione strettamente monotona è anche iniettiva. Si osservi
infine (fare un esempio!) che esistono funzioni che non rientrano in nessuna delle
categorie sopra elencate (cioè che non sono né crescenti né decrescenti).

Si faccia attenzione alla terminologia. In alcuni testi (in particolare nei testi anglosassoni)
si utilizza il termine crescente con il significato di strettamente crescente e si usa la dizione
non decrescente o debolmente crescente per indicare il concetto che noi abbiamo definito
con crescente. In effetti con le nostre definizioni una funzione crescente può essere
costante e quindi non crescere affatto!

Teorema 1.69 (isofomorfismi di gruppi ordinati). Siano 𝑅 ed 𝑆 due gruppi con elementi
neutri 𝑒 𝑅 ed 𝑒𝑆 e denotiamo con ∗ (asterisco) l’operazione di gruppo su 𝑅 e con ◦ (circoletto)
l’operazione di gruppo su 𝑆 .

Supponiamo che 𝑅 e 𝑆 siano gruppi totalmente ordinati, densi e continui. Allora fissato
𝑢 ∈ 𝑅 con 𝑢 > 𝑒 𝑅 e fissato qualunque 𝑚 ∈ 𝑆, esiste un unico omomorfismo (definizione 1.66)
monotòno (definizione 1.68) 𝜑 : 𝑅 → 𝑆 tale che 𝜑(𝑢) = 𝑚 .

Inoltre tale funzione verifica anche le seguenti proprietà:

1. 𝜑(𝑒 𝑅 ) = 𝑒𝑆 ;
2. se 𝑚 > 𝑒𝑆 allora 𝜑 è strettamente crescente;
3. se 𝑚 < 𝑒𝑆 allora 𝜑 è strettamente decrescente;
4. se 𝑚 ≠ 0 allora 𝜑 è bigettiva.

Dimostrazione. Per rendere la notazione più semplice i punti 𝑒 𝑅 ed 𝑒𝑆 li chiameremo


entrambi 0, e le operazioni ∗ e ◦ le chiameremo entrambe +.

Rimane ora da definire 𝜑(𝑥) per 𝑥 ∈ 𝑅 \ (ℚ · 𝑢). E qui l’unicità sarà garantita dalla
monotonia. Supponiamo per fissare le idee che sia 𝑚 ≥ 0 (il caso 𝑚 < 0 si può fare
in modo analogo o si può ricondurre al precedente). Se 𝑚 ≥ 0 se vogliamo avere 𝜑
monotòna dovremo imporre che 𝜑 sia crescente in quanto 0 < 𝑢 e 𝜑(0) = 0 ≤ 𝑚 = 𝜑(𝑢).
52 1 fondamenti

Se 𝜑 deve essere crescente per ogni 𝑥 ∈ 𝑅 dovremo necessariamente avere che 𝜑(𝑥) è
elemento di separazione dei due insiemi:

𝐴 = {𝑎 · 𝑚 : 𝑎 ∈ ℚ , 𝑎 · 𝑢 ≤ 𝑥}, 𝐵 = {𝑏 · 𝑚 : 𝑏 ∈ ℚ , 𝑏 · 𝑢 ≥ 𝑥}.

Effettivamente questi insiemi sono separati e grazie alla continuità di 𝑆 possiamo


quindi trovare almeno un elemento di separazione. E tale elemento è unico in quanto
se ci fossero due elementi di separazione 𝑦1 < 𝑦2 per la densità dei razionali potremmo
trovare 𝑞 ∈ ℚ tale che 𝑦1 < 𝑞 1 · 𝑚 < 𝑦2 e allora 𝑞 · 𝑚 non può essere elemento né di 𝐴
né di 𝐵 da cui si deduce la contraddizione 𝑞 · 𝑢 > 𝑥 e 𝑞 · 𝑢 < 𝑥 .

Dunque esiste ed è unica la funzione 𝜑 : 𝑅 → 𝑆 omomorfismo crescente tale che


𝜑(𝑢) = 𝑚 .

Abbiamo costruito 𝜑 in modo che sia crescente, ma se 𝑚 > 0 possiamo verificare che
in realtà è anche strettamente crescente. Supponiamo per assurdo che esistano 𝑥 < 𝑦
con 𝜑(𝑥) = 𝜑(𝑦). Allora posto 𝜀 = 𝑦 − 𝑥 > 0 si avrebbe 𝜑(𝜀) = 𝜑(𝑦) − 𝜑(𝑥) = 0. Per il
teorema 1.61 sappiamo esistere 𝑛 ∈ ℕ tale che 𝑛 · 𝜀 > 𝑢 e quindi 𝜑(𝑛 · 𝜀) ≥ 𝜑(𝑢) = 𝑚 .
Ma questo è assurdo perché 𝜑(𝑛 · 𝜀) = 𝑛 · 𝜑(𝜀) = 0.

Analogamente se 𝑚 < 0 si verifica che 𝜑 è strettamente decrescente. Dunque se 𝑚 ≠ 0


risulta che 𝜑 è strettamente monotòna e quindi iniettiva. Vogliamo mostrare che è
anche surgettiva. Posto 𝑇 = 𝜑(𝑅) osserviamo che 𝑇 ⊆ 𝑆 dev’essere anch’esso un
gruppo totalmente ordinato, denso e continuo come tutto 𝑆 e con la stessa operazione e
lo stesso ordinamento di 𝑆 . E 𝜑 −1 : 𝑇 → 𝑅 è un isomorfismo crescente che manda 𝑚 in
𝑢 . Ma invertendo i ruoli di 𝑅 ed 𝑆 sappiamo anche esistere un omomorfismo iniettivo
𝜓 : 𝑆 → 𝑅 che manda 𝑚 in 𝑢 e la sua restrizione a 𝑇 , per unicità, deve coincidere con
𝜑−1 . Questo significa che 𝑇 = 𝑆, perché altrimenti non sarebbe possibile estendere la
bigezione 𝜑 −1 : 𝑇 → 𝑅 a tutto 𝑆 .

Come conseguenza immediata del teorema precedente otteniamo il seguente corol-


lario il quale garantisce che gli assiomi con cui abbiamo definito ℝ lo identificano
univocamente a meno di isomorfismi.

Corollario 1.70 (unicità di ℝ). Sia 𝑆 un gruppo totalmente ordinato, denso e continuo (come
ℝ) e scegliamo 𝑢 ∈ 𝑆, 𝑢 > 0 come unità. Allora 𝑆 è isomorfo ad ℝ nel senso che esiste una
funzione (unica) 𝑓 : ℝ → 𝑆 bigettiva, additiva, crescente con 𝑓 (1) = 𝑢 .

Nella definizione assiomatica di ℝ non abbiamo mai assunto che l’addizione fosse
commutativa perché in effetti possiamo dimostrare che deve esserlo, come si vede nel
seguente.

Teorema 1.71. Ogni gruppo totalmente ordinato, denso e continuo è commutativo.

Dimostrazione. Se consideriamo il gruppo additivo 𝑅 ma definiamo l’addizione con


gli addendi scambiati, fissato 𝑢 > 0 in 𝑅 per il teorema 1.69 deve esistere una funzione
𝑓 : 𝑅 → 𝑅 crescente, con 𝑓 (1) = 1, tale che

𝑓 (𝑥 + 𝑦) = 𝑓 (𝑦) + 𝑓 (𝑥). (1.14)


1.12 proprietà assiomatiche dei numeri reali 53

Inoltre 𝑓 è l’unica funzione crescente tale che per ogni 𝑥 ∈ ℚ · 𝑢 soddisfa 𝑓 (𝑥) = 𝑥 .
Visto che la funzione identica ha queste proprietà 𝑓 dovrà in effetti essere la funzione
identica 𝑓 (𝑥) = 𝑥 per ogni 𝑥 ∈ ℝ e l’equazione (1.14) si riduce a 𝑥 + 𝑦 = 𝑦 + 𝑥 .

Possiamo inoltre definire su ℝ l’operazione di moltiplicazione.

Teorema 1.72 (moltiplicazione). Su ℝ esiste una unica unica operazione · che chiameremo
moltiplicazione
moltiplicazione che soddisfa le seguenti proprietà:

1. distributiva: 𝑥 · (𝑦 + 𝑧) = 𝑥 · 𝑦 + 𝑥 · 𝑧 ;
2. elemento neutro: 𝑥 · 1 = 𝑥 ;
3. monotonia: fissato 𝑥 la funzione 𝑥 · 𝑦 è monotona in 𝑦 .
moltiplicazione
Inoltre tale operazione, che chiamiamo moltiplicazione, ha anche le seguenti proprietà:

1. commutativa: 𝑥 · 𝑦 = 𝑦 · 𝑥 ;
2. stretta monotonia: se 𝑥 > 0 e 𝑦 > 𝑧 allora 𝑥 · 𝑦 > 𝑥 · 𝑧 ;
3. associativa: (𝑥 · 𝑦) · 𝑧 = 𝑥 · (𝑦 · 𝑧);
4. esistenza del reciproco: se 𝑥 ≠ 0 esiste 𝑦 tale che 𝑥 𝑦 = 1;
5. elemento assorbente: 0 · 𝑥 = 0;
6. annullamento del prodotto: se 𝑥 · 𝑦 = 0 allora 𝑥 = 0 oppure 𝑦 = 0;
7. regola del segno: (−𝑥) · 𝑦 = −(𝑥 · 𝑦).

Dimostrazione. Il teorema 1.69 garantisce che per ogni 𝑥 ∈ ℝ esiste una unica funzione
𝑚 𝑥 : ℝ → ℝ che sia additiva, monotona e tale che 𝑚 𝑥 (1) = 𝑥 . Se definiamo

𝑥 · 𝑦 = 𝑚 𝑥 (𝑦)

otteniamo che valgono la proprietà distributiva, l’elemento neutro e la monotonia. E


questo è l’unico modo per garantire queste proprietà.

Dobbiamo ora verificare che tale definizione soddisfa anche le altre proprietà enunciate.
Per fare ciò ci servirà innanzitutto dimostrare che fissati 𝑎, 𝑏 ∈ ℝ si ha

𝑚 𝑎 (𝑥) + 𝑚𝑏 (𝑥) = 𝑚 𝑎+𝑏 (𝑥) (1.15)

Consideriamo la funzione 𝑓 (𝑥) = 𝑚 𝑎 (𝑥) + 𝑚𝑏 (𝑥). E’ immediato verificare che 𝑓 è


una funzione additiva in quanto 𝑚 𝑎 e 𝑚𝑏 lo sono e l’addizione è commutativa. Se
𝑎, 𝑏 ≥ 0 è anche immediato verificare che 𝑓 è crescente in quanto 𝑚 𝑎 e 𝑚𝑏 lo sono.
Siccome 𝑓 (1) = 𝑚 𝑎 (1) + 𝑚𝑏 (1) = 𝑎 + 𝑏 per il teorema 1.69 la funzione 𝑓 deve coincidere
con 𝑚 𝑎+𝑏 e quindi (1.15) è verificata. Osserviamo ora che −𝑚 𝑦 (𝑥) = 𝑚−𝑦 (𝑥) sempre
grazie all’unicità nel teorema 1.69 visto che −𝑚 𝑦 è additiva, monotona e −𝑚 𝑦 (1) = −𝑦 .
Dunque se 𝑎 < 0 e 𝑏 < 0 ci possiamo ricondurre al caso precedente cambiando tutto
di segno:
𝑚 𝑎 + 𝑚𝑏 = −(𝑚−𝑎 + 𝑚−𝑏 ) = −𝑚−𝑎−𝑏 = 𝑚 𝑎+𝑏 .
Se 𝑎 ≥ 0, 𝑏 ≤ 0 e 𝑎 + 𝑏 ≥ 0 sfruttiamo (𝑎 + 𝑏) + (−𝑏) = 𝑎 per ottenere 𝑚 𝑎+𝑏 + 𝑚−𝑏 = 𝑚 𝑎
che, riordinando i termini, è l’uguaglianza desiderata. Se 𝑎 ≥ 0, 𝑏 ≤ 0 e 𝑎 + 𝑏 ≤ 0
sfruttiamo −(𝑎 + 𝑏) + 𝑎 = −𝑏 per ottenere 𝑚−(𝑎+𝑏) + 𝑚 𝑎 = 𝑚−𝑏 che di nuovo ci porta
a (1.15). Se 𝑏 < 0 scambiamo 𝑎 e 𝑏 per ricondurci ai casi precedenti. Abbiamo così
dimostrato (1.15).
54 1 fondamenti

Possiamo ora dimostrare la proprietà commutativa. Fissato 𝑦 ∈ ℝ consideriamo la


funzione 𝑓 (𝑥) = 𝑚 𝑥 (𝑦). Abbiamo appena dimostrato che 𝑓 è additiva. Osserviamo
che se 𝑦 ≥ 0 e 𝑥 ≥ 0 si ha 𝑓 (𝑥) ≥ 0 in quanto 𝑚 𝑥 è crescente e quindi 𝑓 (𝑥) = 𝑚 𝑥 (𝑦) ≥
𝑚 𝑥 (0) = 0. Dunque se 𝑥1 ≤ 𝑥 2 si ha 𝑥 2 − 𝑥1 ≥ 0 e 𝑓 (𝑥2 ) − 𝑓 (𝑥1 ) = 𝑓 (𝑥2 − 𝑥1 ) ≥ 0:
significa che 𝑓 (𝑥) è crescente. Se 𝑦 < 0 si otterrà invece che 𝑓 (𝑥) è decrescente, ma in
ogni caso è monotona. Inoltre 𝑚1 (𝑦) = 𝑦 in quanto l’identità è additiva e monotona
e quindi per unicità coincide con 𝑚1 in quanto 𝑚1 (1) = 1 come l’identità. Dunque
𝑓 (1) = 𝑚1 (𝑦) = 𝑦 . Dunque scopriamo che 𝑓 (𝑥) = 𝑚 𝑥 (𝑦) = 𝑚 𝑦 (𝑥) ovvero 𝑥 · 𝑦 = 𝑦 · 𝑥 .

Per dimostrare la proprietà associativa fissiamo 𝑦, 𝑧 ∈ ℝ e consideriamo la funzione


𝑓 (𝑥) = 𝑚 𝑧 (𝑚 𝑦 (𝑥)). Questa funzione è additiva in quanto 𝑚 𝑧 (𝑚 𝑦 (𝑎 + 𝑏)) = 𝑚 𝑧 (𝑚 𝑦 (𝑎) +
𝑚 𝑦 (𝑏)) = 𝑚 𝑧 (𝑚 𝑦 (𝑎)) + 𝑚 𝑧 (𝑚 𝑦 (𝑏)). Inoltre è monotona in quanto composizione di
funzioni monotone. Infine 𝑓 (1) = 𝑚 𝑧 (𝑚 𝑦 (1)) = 𝑚 𝑧 (𝑦). Dunque per unicità si deve
avere 𝑚 𝑧 (𝑚 𝑦 (𝑥)) = 𝑚𝑚𝑧 (𝑦) (𝑥). Esplicitando questa uguaglianza si trova proprio:
𝑧 · (𝑦 · 𝑥) = (𝑧 · 𝑦) · 𝑥 .

Per dimostrare l’esistenza del reciproco basta ricordare che se 𝑦 ≠ 0 la funzione 𝑚 𝑦 è


bigettiva e quindi esiste un unico 𝑥 tale che 𝑚 𝑦 (𝑥) = 𝑦 · 𝑥 = 1.

Lo zero è elemento assorbente in quanto 0 · 𝑥 = 𝑥 · 0 = 𝑚 𝑥 (0) = 0 qualunque sia 𝑥 .


D’altra parte se 𝑚 𝑥 (𝑦) = 0 se non è 𝑥 = 0 la funzione 𝑚 𝑥 è iniettiva e quindi 𝑦 = 0 è
l’unico punto in cui 𝑚 𝑥 (𝑦) = 0. Dunque vale anche la proprietà di annullamento del
prodotto.

La regola del segno deriva dall’additività in quanto 0 = 𝑥 · 0 = 𝑥 ·(𝑦 − 𝑦) = 𝑥 · 𝑦 + 𝑥 ·(−𝑦)


da cui 𝑥 · (−𝑦) = −(𝑥 · 𝑦).

L’operazione di moltiplicazione che abbiamo appena definito su ℝ rende ℝ un campo


ordinato continuo in base alla definizione 1.50.

Si può osservare che in un campo ordinato l’ordinamento è necessariamente denso


in quanto dati 𝑎, 𝑏 elementi del campo possiamo definire 𝑎+𝑏2 che è certamente
strettamente compreso tra 𝑎 e 𝑏 .

1.13 funzione esponenziale e potenza

Osserviamo che l’insieme ℝ+ = {𝑥 ∈ ℝ : 𝑥 > 0} dei reali positivi rispetto alla opera-
zione di moltiplicazione risulta essere un gruppo moltiplicativo totalmente ordinato,
denso e continuo. Abbiamo già dimostrato tutte queste proprietà della moltiplicazione.
La densità e continuità non vanno verificate in quanto sono proprietà dell’ordinamento
funzione esponenziale
e non dell’operazione, e l’ordinamento considerato su ℝ+ è quello ereditato da ℝ.

Dunque fissato 𝑎 > 0 per il teorema 1.69 esiste una unica funzione exp 𝑎 : ℝ → ℝ+
(chiamata funzione esponenziale di base 𝑎 ) che sia un omomorfismo monotono del
gruppo additivo ℝ con il gruppo moltiplicativo ℝ+ e tale che exp 𝑎 (1) = 𝑎 . La proprietà
di omomorfismo in questo caso si esprime nella forma seguente:

exp 𝑎 (𝑥 + 𝑦) = exp 𝑎 (𝑥) · exp 𝑎 (𝑦). (1.16)


1.13 funzione esponenziale e potenza 55

Il teorema 1.69 ci dice anche che se 𝑛 ∈ ℕ il valore exp 𝑎 (𝑛) non è altro che il prodotto di
𝑎 con sé stesso 𝑛 volte: exp𝑎 (𝑛) = 𝑎 𝑛 . Ha dunque senso definire 𝑎 𝑥 = exp𝑎 (𝑥) per ogni
𝑥 ∈ ℝ. Avremo dunque la proprietà fondamentale della funzione esponenziale:

𝑎 𝑥+𝑦 = 𝑎 𝑥 · 𝑎 𝑦 .

Per ogni 𝑎 > 0 e 𝑏 ∈ ℝ è dunque definita l’espressione 𝑎 𝑏 (si legga: 𝑎 elevato alla potenza
𝑏 ) che si chiama potenza di base 𝑎 ed esponente 𝑏 . potenza

Quando l’esponente è negativo si ha

1
𝑎 −𝑥 =
𝑎𝑥

in quanto 𝑎 𝑥 · 𝑎 −𝑥 = 𝑎 𝑥−𝑥 = 𝑎 0 = 1. In particolare 𝑎 −1 = 1


𝑎 è un modo per denotare
l’inverso moltiplicativo.
Se 𝑎 > 1 la funzione 𝑎 𝑥 risulta essere strettamente crescente, se 𝑎 < 1 la funzione è
strettamente decrescente e se 𝑎 = 1 la funzione 1𝑥 = 1 è costante.
Se 𝑎 > 0 e 𝑏 > 0 vogliamo dimostrare che vale la proprietà:

(𝑎 · 𝑏)𝑥 = 𝑎 𝑥 · 𝑏 𝑥 .

Sarà sufficiente dimostrarlo per 𝑎 > 1 e 𝑏 > 1 in quanto gli altri casi si ottengono di
conseguenza passando al reciproco. Osservare che la funzione 𝑓 (𝑥) = 𝑎 𝑥 · 𝑏 𝑥 è un
omomorfismo
𝑓 (𝑥 + 𝑦) = 𝑎 𝑥+𝑦 𝑏 𝑥+𝑦 = 𝑎 𝑥 𝑎 𝑦 𝑏 𝑥 𝑏 𝑦 = 𝑓 (𝑥) · 𝑓 (𝑦)
è crescente (in quanto prodotto di funzioni positive e crescenti) e vale 𝑓 (1) = 𝑎 · 𝑏 .
Dunque per l’unicità data dal teorema 1.69 possiamo affermare che 𝑓 (𝑥) = (𝑎 · 𝑏)𝑥 .
Infine possiamo dimostrare la proprietà delle potenze ripetute:
 𝑐
𝑎𝑏 = 𝑎 𝑏·𝑐 .

Fissati 𝑎 > 0 e 𝑏 ∈ ℝ consideriamo la funzione 𝑓 (𝑥) = 𝑎 𝑏·𝑥 . osserviamo che 𝑓 (𝑥 + 𝑦) =


𝑎 𝑏𝑥+𝑏 𝑦 = 𝑎 𝑏𝑥 · 𝑎 𝑏 𝑦 dunque la funzione 𝑓 soddisfa la proprietà di additività. Inoltre è
una funzione monotona perché composizione di funzioni monotone. Infine 𝑓 (1) = 𝑎 𝑏 e
𝑥
dunque, per l’unicità data dal teorema 1.69 dovrà essere 𝑓 (𝑥) = 𝑎 𝑏 , come volevamo
dimostrare.
Osserviamo che la funzione potenza 𝑥 𝛼 (dove si tiene fisso l’esponente e si fa variare
la base) è definita tramite la funzione esponenziale per ogni 𝑥 > 0 e per ogni 𝛼 ∈ ℝ.
Se 𝛼 > 0 è naturale definire 0𝛼 = 0 e quindi se 𝛼 > 0 possiamo considerare definito 𝑥 𝛼
per ogni 𝑥 ≥ 0. Verifichiamo che la funzione 𝑓 (𝑥) = 𝑥 𝛼 è strettamente crescente se
𝛼 > 0. Infatti se 𝑥2 > 𝑥1 > 0 e se 𝛼 > 0 si ha
𝛼 0
𝑥2 𝑥2
 
𝑥2𝛼 = · 𝑥1 𝛼
> · 𝑥1 𝛼 = 𝑥1𝛼 .
𝑥1 𝑥1
56 1 fondamenti

𝑦 = 𝑎𝑥
1 𝑥
𝑦=

𝑎 𝑎

1 𝑦 = log𝑎 𝑥

1 𝑎

𝑦 = log 1 𝑥
𝑎
Figura 1.4: Il grafico della funzione espo-
nenziale e logaritmo in base 𝑎 > 1 e
𝑎 < 1 ( 𝑎 = 2 in figura).
1


𝑦= 𝑥
𝑦 = 𝑥2

1
𝑦= 1
𝑥2

𝑦 = 𝑥1 1

𝑦 = 3𝑥

Figura 1.5: Grafici tipici di potenze e 𝑦 = 𝑥3


radici.

1.14 radice 𝑛 -esima

Dalle proprietà delle potenze ripetute deduciamo che se 𝑥 > 0 e 𝑛 ∈ ℕ , 𝑛 ≥ 1, si ha


(𝑥 𝑛 ) 𝑛 = 𝑥 . Significa che 𝑥 𝑛 è la funzione inversa di 𝑥 𝑛 per 𝑥 > 0. Ma la funzione 𝑥 𝑛 è
1 1

definita anche per 𝑥 ≤ 0 e si distinguono due casi qualitativamente diversi in base alla
parità di 𝑛 .

Se 𝑛 è pari la funzione 𝑥 ↦→ 𝑥 𝑛 non è invertibile in quanto (−𝑥)𝑛 = 𝑥 𝑛 . Se però


restringiamo la funzione 𝑥 𝑛 ai numeri reali non negativi la funzione risulta invertibile e

la funzione inversa che si denota con 𝑥 ↦→ 𝑛 𝑥 può essere definita mediante le potenze
come segue: ( 1
√𝑛 𝑥 𝑛 se 𝑥 > 0
𝑥= se 𝑛 è pari.
0 se 𝑥 = 0

Se 𝑛 è dispari la funzione 𝑥 ↦→ 𝑥 𝑛 è invertibile su tutto ℝ. Infatti (−𝑥)𝑛 = −𝑥 𝑛 dunque


tale funzione mantiene il segno del suo argomento. In tal caso la funzione inversa

denotata con 𝑥 ↦→ 𝑛 𝑥 è anch’essa definita su tutto ℝ e può essere definita nel modo
seguente
1

 𝑥𝑛 se 𝑥 > 0
√𝑛



𝑥= 0 se 𝑥 = 0 se 𝑛 è dispari
 −(−𝑥) 𝑛1

se 𝑥 < 0


1.15 logaritmo 57

Quando l’argomento è positivo la radice 𝑛 -esima potrebbe anche essere definita


utilizzando il teorema 1.65 di divisibilità nell’ambito del gruppo moltiplicativo ℝ+ .


La radice seconda 2 𝑥 viene usualmente chiamata radice quadrata e viene denotata con radice quadrata
√ √
il simbolo 𝑥 . Analogamente la radice terza 3 𝑥 viene usualmente chiamata radice
radice cubica
cubica.

Per come è definita la radice 𝑛 -esima si ha


(

𝑛 |𝑥| se 𝑛 è pari,
𝑥𝑛 =
𝑥 se 𝑛 è dispari.

√ √ √ 𝑛 √
p √
E’ facile verificare che le proprietà 𝑛 𝑥 · 𝑦 = 𝑛 𝑥 · 𝑛 𝑦 e 𝑚 𝑥 = 𝑛𝑚 𝑥 sono valide in tutti
i casi in cui ambo i membri sono ben definiti.

Ricordiamo che in base al teorema 1.51 sappiamo che 2 è irrazionale (non è razionale,
ovvero non è elemento di ℚ) in quanto risolve l’equazione 𝑥 2 = 2.

Possiamo quindi osservare che ℚ, come ℝ, è un campo totalmente ordinato. Evidente-


mente ℚ non può essere continuo, perché se lo fosse dovrebbe essere uguale ad ℝ per
il teorema di unicità degli
√ isomorfismi dei gruppi continui ordinati e dovrebbe quindi
contenere il numero 2.

1.15 logaritmo logaritmo

Se 𝑎 > 0, 𝑎 ≠ 1 la funzione esponenziale exp 𝑎 : ℝ → ℝ+ è bigettiva. La funzione


inversa log 𝑎 : ℝ+ → ℝ si chiama logaritmo in base 𝑎 e si caratterizza con la seguente
proprietà:
log 𝑎 𝑥 = 𝑦 ⇐⇒ 𝑎 𝑦 = 𝑥.
La proprietà di omomorfismo diventa:

log 𝑎 (𝑥 · 𝑦) = log 𝑎 𝑥 + log 𝑎 𝑦.

Ovviamente vale log 𝑎 𝑎 = 1 e log 𝑎 1 = 0. Se 𝑎 > 1 la funzione logaritmo è strettamente


crescente, se 𝑎 < 1 è strettamente decrescente. La proprietà dell’esponenziale ripetuto
si traduce nella seguente:
log 𝑎 (𝑥 𝑦 ) = 𝑦 log 𝑎 𝑥.
E’ anche piuttosto utile ricordare la formula per il cambiamento di base:

log𝑏 𝑥
log 𝑎 𝑥 =
log 𝑎 𝑏

(valida, come tutte le formule enunciate, se l’argomento del logaritmo è positivo e se le


basi sono positive diverse da 1 e diverse tra loro). Quest’ultima formula si dimostra
moltiplicando ambo i membri per log 𝑎 𝑏 e prendendo quindi l’esponenziale con base
𝑏 di ambo i membri.
58 1 fondamenti

..
𝑚 .
.. .. ..
. . .
..
3 9 ↖ .
Figura 1.6: La numerazione diagonale ..
2 5 8 12 .
delle caselle di una scacchiera infinita.
Si potrebbe verificare che il numero pre- ..
1 2 4 7 11 .
sente nella casella di coordinate (𝑛, 𝑚) si
scrive come 𝑓 (𝑛, 𝑚) =
(𝑛+𝑚+1)(𝑛+𝑚)
+𝑚 ..
2 0 0 1 3 6 10 .
ed è una funzione bigettiva 𝑓 : ℕ × ℕ →
ℕ. 0 1 2 3 4 ... 𝑛

1.16 cardinalità infinite

Abbiamo già osservato che ℕ è un insieme infinito e dunque (per il teorema 1.15) anche
ℤ, ℚ e ℝ sono infiniti. Per gli insiemi finiti se 𝐴 ⊆ 𝐵 ma 𝐴 ≠ 𝐵 risulta #𝐴 < #𝐵 in
quanto #𝐴 − #𝐵 = #(𝐵 \ 𝐴) > 0. Dobbiamo però osservare che lo stesso non vale per
gli insiemi infiniti. In effetti la funzione 𝑠 : ℕ → ℕ definita da 𝑠(𝑥) = 𝑥 + 1 risulta
essere una bigezione tra ℕ e ℕ \ {0}. Dunque #ℕ = #(ℕ \ {0}) nonostante la differenza
tra i due insiemi {0} abbia cardinalità 1. Anche l’insieme dei numeri pari o l’insieme
dei quadrati perfetti (come aveva notato già Galileo) hanno la stessa cardinalità di ℕ in
quanto le funzioni 𝑛 ↦→ 2𝑛 e la funzione 𝑛 ↦→ 𝑛 2 sono iniettive.
Non è difficile trovare una funzione iniettiva da ℤ in ℕ (lo lasciamo per esercizio):
questo dimostra che anche #ℤ = #ℕ
Cantor dimostra addirittura che #ℚ = ℕ : per farlo utilizza il seguente.

Teorema 1.73 (primo metodo diagonale di Cantor). L’insieme ℕ × ℕ ha la stessa cardinalità


di ℕ . Di conseguenza
#ℕ = #ℤ = #ℚ .

Idea di dimostrazione. Numerare le caselle di una scacchiera infinita come in Figura 1.6.
Visto che è piuttosto facile trovare una funzione iniettiva da ℚ in ℕ × ℤ si deduce
facilmente che #ℚ = #ℕ .

A questo punto si potrebbe pensare che tutti gli insiemi infiniti siano numerabili.
Invece preso un qualunque insieme (anche infinito) esiste un insieme con cardinalità
strettamente maggiore come dimostrato nel seguente teorema che è un piccolo gioiello
della logica. In effetti il metodo utilizzato è assimilabile al paradosso del mentitore ed
è la stessa idea usata nel paradosso di Russell (teorema 1.6). L’insieme delle parti P(𝐴)
è definito a pag. 7.

Teorema 1.74 (Cantor). Se 𝐴 è un qualunque insieme allora #P(𝐴) > #𝐴.

Dimostrazione. E’ chiaro che #𝐴 ≤ #P(𝐴) in quanto la funzione 𝑓 : 𝐴 → P(𝐴) definita


da 𝑓 (𝑥) = {𝑥} è ovviamente iniettiva.
Supponiamo allora per assurdo che esista 𝑓 : 𝐴 → P(𝐴) bigettiva e consideriamo
l’insieme
𝐶 = {𝑥 ∈ 𝐴 : 𝑥 ∉ 𝑓 (𝑥)}.
1.17 punti all’infinito 59

Se 𝑓 fosse surgettiva dovrebbe esistere 𝑐 ∈ 𝐴 tale che 𝑓 (𝑐) = 𝐶 . Possiamo allora


chiederci se 𝑐 ∈ 𝐶 e scoprire che, per definizione di 𝐶 la proposizione 𝑐 ∈ 𝐶 è
equivalente a 𝑐 ∉ 𝑓 (𝑐) = 𝐶 . Dunque 𝑐 ∈ 𝐶 ⇐⇒ 𝑐 ∉ 𝐶 , che è assurdo.

Corollario 1.75 (non esiste l’insieme di tutti gli insiemi). Se esistesse un insieme U
(universo) tale che ∀𝑥 : 𝑥 ∈ 𝑈 , allora si avrebbe P(U) ⊆ U contraddicendo il teorema
precedente.

Per quanto riguarda l’insieme ℝ si scopre in effetti che #ℝ > #ℕ (sempre grazie a
Cantor, teorema 3.24) e si potrebbe dimostrare che effettivamente #ℝ = #P(ℕ ).

1.17 punti all’infinito


ℝ̄
Definizione 1.76 (reali estesi). Denotiamo con ℝ̄ = ℝ ∪ {+∞, −∞} l’insieme dei numeri
reali a cui vengono aggiunti due ulteriori quantità che chiameremo infinite e che denotiamo +∞, −∞
con +∞ e −∞. Diremo che 𝑥 ∈ ℝ̄ è finito se 𝑥 ∈ ℝ.

Estendiamo la relazione d’ordine imponendo che valga

−∞ ≤ 𝑥 ≤ +∞, ∀𝑥 ∈ ℝ̄.

Estendiamo anche la addizione e moltiplicazione tra reali estesi imponendo che valga
per ogni 𝑥 ∈ ℝ̄

𝑥 + (+∞) = +∞, se 𝑥 ≠ −∞
𝑥 + (−∞) = −∞, se 𝑥 ≠ +∞
𝑥 · (+∞) = +∞, 𝑥 · (−∞) = −∞, se 𝑥 > 0
𝑥 · (+∞) = −∞, 𝑥 · (−∞) = +∞, se 𝑥 < 0.

Si definiscono anche:
1 1
−(+∞) = −∞, −(−∞) = +∞, = =0
+∞ −∞
facendo però attenzione che questi formalmente non sono opposto e reciproco in quanto
su ℝ̄ non sono più garantite le regole: 𝑥 + (−𝑥) = 0 e 𝑥 · (1/𝑥) = 1. Infatti le operazioni
(+∞) + (−∞) e +∞ · 0 vengono lasciate indefinite.
Definiamo anche il valore assoluto: |+∞| = |−∞| = +∞.

Possiamo infine definire la sottrazione e la divisione tramite addizione e moltiplicazio-


ne:
𝑥 1
𝑥 − 𝑦 = 𝑥 + (−𝑦), =𝑥· .
𝑦 𝑦

Possiamo definire gli operatori sup e inf anche sugli insiemi illimitati ponendo:

sup 𝐴 = +∞ se 𝐴 non è superiormente limitato


inf 𝐴 = −∞ se 𝐴 non è inferiormente limitato.
60 1 fondamenti

Osserviamo infatti che su ℝ̄ la quantità +∞ è maggiorante di qualunque insieme e −∞


è minorante, dunque queste definizioni mantengono su ℝ̄ le proprietà caratterizzanti:
l’estremo superiore è il minimo dei maggioranti e l’estremo inferiore è il massimo dei
minoranti. Definiamo infine

sup ∅ = −∞
inf ∅ = +∞.

Queste ultime definizioni possono essere comprese da un punto di vista strettamente


logico: ogni numero reale è sia maggiorante che minorante dell’insieme vuoto, dunque
il minimo dei maggioranti non esiste in ℝ ma in ℝ̄ è −∞ e il massimo dei minoranti è
+∞.

1.18 intervalli
intervallo

Definizione 1.77 (intervallo). Un insieme 𝐼 ⊆ ℝ̄ si dice essere un intervallo se contiene


tutti i punti intermedi:

se 𝑥, 𝑦 ∈ 𝐼 e 𝑥 < 𝑧 < 𝑦 allora 𝑧 ∈ 𝐼 .

Teorema 1.78 (caratterizzazione intervalli di ℝ). Sia 𝐼 ⊆ ℝ un intervallo e siano 𝑎 = inf 𝐼 ,


𝑏 = sup 𝐼 i suoi estremi. Allora 𝑧 ∈ 𝐼 se 𝑎 < 𝑧 < 𝑏 .

Dimostrazione. Se 𝐼 = ∅ si ha 𝑎 > 𝑏 e quindi nessuno 𝑧 verifica 𝑎 < 𝑧 < 𝑏 . Supponiamo


𝐼 ≠ ∅ e sia 𝑎 < 𝑧 < 𝑏 . Visto che 𝑎 è il massimo dei minoranti di 𝐼 il numero 𝑧 non è un
minorante dunque deve esistere 𝑥 ∈ 𝐼 tale che 𝑥 < 𝑧 . Analogamente dovrebbe esistere
𝑦 ∈ 𝐼 con 𝑧 < 𝑦 . Ma allora, per definizione di intervallo, anche 𝑧 ∈ 𝐼 .

Il teorema precedente ci dice che una volta identificati i due estremi di un intervallo,
tutti i punti intermedi devono stare nell’intervallo. Gli estremi, invece, possono essere
o non essere inclusi nell’intervallo. Punti esterni agli estremi non possono invece
essere elementi dell’intervallo. Possiamo quindi caratterizzare tutti gli intervalli di ℝ
introducendo le seguenti notazioni. Dati 𝑎, 𝑏 ∈ ℝ̄ con 𝑎 ≤ 𝑏 tutti i possibili intervalli
con estremi 𝑎 e 𝑏 sono i seguenti:

[𝑎, 𝑏] = 𝑥 ∈ ℝ̄ : 𝑎 ≤ 𝑥 ≤ 𝑏


[𝑎, 𝑏) = 𝑥 ∈ ℝ̄ : 𝑎 ≤ 𝑥 < 𝑏

(1.17)
(𝑎, 𝑏] = 𝑥 ∈ ℝ̄ : 𝑎 < 𝑥 ≤ 𝑏


(𝑎, 𝑏) = 𝑥 ∈ ℝ̄ : 𝑎 < 𝑥 < 𝑏 .




Abbiamo utilizzato le parentesi quadre per indicare che gli estremi sono inclusi e le
parentesi tonde per indicare che gli estremi sono esclusi. Osserviamo che in alcuni
testi si usano le parentesi quadre rovesciate al posto delle parentesi tonde.

Noi considereremo per lo più intervalli di ℝ (non di ℝ̄): in tal caso gli estremi infiniti
non potranno mai essere inclusi nell’intervallo.
1.19 andamento del grafico di una funzione 61

1.19 andamento del grafico di una funzione

Se 𝑓 : 𝐴 ⊆ ℝ → ℝ è una funzione, un modo molto utile di rappresentarla graficamente


è quello di disegnarne il grafico, ovvero la curva del piano cartesiano:

𝐺 𝑓 = {(𝑥, 𝑦) ∈ 𝐴 × ℝ : 𝑦 = 𝑓 (𝑥)}.

Molte proprietà della funzione potranno essere riconosciute geometricamente guar-


dandone il grafico.

Definizione 1.79 (simmetrie). Sia 𝑓 : 𝐴 ⊆ ℝ → ℝ una funzione. Diremo che 𝑓 è:

1. pari se 𝐴 = −𝐴 (significa che se 𝑥 ∈ 𝐴 allora anche −𝑥 ∈ 𝐴) e pari

𝑓 (−𝑥) = 𝑓 (𝑥);

2. dispari se 𝐴 = −𝐴 e dispari
𝑓 (−𝑥) = − 𝑓 (𝑥);
3. periodica di periodo 𝑇 se 𝐴 + 𝑇 = 𝐴 (significa che 𝑥 ∈ 𝐴 ⇐⇒ 𝑥 + 𝑇 ∈ 𝐴) se per periodica
ogni 𝑥 ∈ 𝐴 si ha
𝑓 (𝑥 + 𝑇) = 𝑓 (𝑥)

Ad esempio se 𝑛 ∈ ℤ la funzione 𝑓 (𝑥) = 𝑥 𝑛 è pari se 𝑛 è pari ed è dispari se 𝑛 è dispari.


Il grafico di una funzione dispari ha una simmetria centrale, in quanto se (𝑥, 𝑓 (𝑥)) ∈ 𝐺 𝑓
allora anche (−𝑥, − 𝑓 (𝑥)) = (−𝑥, 𝑓 (−𝑥)) ∈ 𝐺 𝑓 . Il grafico di una funzione pari ha invece
una simmetria rispetto all’asse delle ordinate 𝑥 = 0 infatti se (𝑥, 𝑓 (𝑥)) ∈ 𝐺 𝑓 allora
(−𝑥, 𝑓 (𝑥)) = (−𝑥, 𝑓 (−𝑥)) ∈ 𝐺 𝑓 .

La funzione 𝑓 (𝑥) = 𝑥 − ⌊𝑥⌋ (la parte frazionaria di 𝑥 ) è un esempio di funzione periodica


di periodo 𝑇 = 1. Infatti è chiaro che ⌊𝑥 + 1⌋ = ⌊𝑥⌋ + 1 e quindi 𝑓 (𝑥 + 1) = 𝑓 (𝑥).

Si osservi che dispari per le funzioni non è la negazione di pari. La funzione 𝑓 (𝑥) = 𝑥 + 1
non è né pari, né dispari, né periodica (verificare).

Definizione 1.80 (zeri). Se 𝑓 : 𝐴 ⊆ ℝ → ℝ è una funzione diremo che 𝑥 ∈ 𝐴 è uno zero di


𝑓 se 𝑓 (𝑥) = 0. L’insieme degli zeri è quindi dato da insieme degli zeri

𝑓 −1 ({0}) = {𝑥 ∈ ℝ : 𝑓 (𝑥) = 0}.

Abbiamo già accennato al fatto che uno dei problemi più comuni in matematica è
quello di invertire una funzione. In particolare dato 𝑦 ∈ ℝ ci si chiede quali siano gli
𝑥 ∈ ℝ tali che 𝑓 (𝑥) = 𝑦 . Questo problema si riconduce a trovare gli zeri della funzione
𝑓 (𝑥) − 𝑦 e per questo motivo siamo interessati allo studio degli zeri.

Riprendiamo ora la definizione 1.68 (monotonia) che da ora in avanti potrà essere
applicata alle funzioni 𝑓 : 𝐴 → ℝ definite su un insieme 𝐴 ⊆ ℝ.

Dal punto di vista grafico una funzione 𝑓 è crescente se preso qualunque punto
(𝑥, 𝑓 (𝑥)) sul grafico della funzione e tracciati gli assi paralleli agli assi cartesiani,
passanti per il punto fissato, si osserva che il grafico della funzione è tutto contenuto
nel primo e terzo quadrante determinati dagli assi traslati.
62 1 fondamenti

E’ facile verificare che la funzione 𝑓 : [0 , +∞) → ℝ definita da 𝑓 (𝑥) = 𝑥 𝑛 è strettamente


crescente se 𝑛 è un intero positivo. Se però consideriamo la funzione definita su tutto
ℝ: 𝑓 : ℝ → ℝ, 𝑓 (𝑥) = 𝑥 𝑛 allora solo se 𝑛 è dispari la funzione rimane strettamente
crescente (le funzioni pari non possono mai essere strettamente crescenti se il loro
dominio contiene almeno tre punti distinti).
Se una funzione non è monotona è piuttosto comune studiare la monotonia della
funzione ristretta a particolari intervalli: su alcuni intervalli la funzione (ristretta)
potrà essere crescente e su altri intervalli potrà essere decrescente.

Esercizio 1.81. Verificare che la composizione di funzioni monotone è una funzione monotona
e la composizione di funzioni strettamente monotone è strettamente monotona. Quando è che
la funzione composta risulta crescente? Quando decrescente?

Esercizio 1.82. Si dimostri che applicando una funzione strettamente crescente ai due membri
di una equazione o disequazione (stretta o larga che sia) si ottiene una equazione o disequazione
equivalente. Ovviamente è necessario che la funzione sia definita dove viene applicata.
Lo stesso vale per le funzioni strettamente decrescenti se però si cambia il verso della disequa-
zione.

Definizione 1.83 (funzioni limitate, massimo/minimo). Se 𝑓 : 𝐴 → ℝ è una funzione


allora definiamo l’estremo superiore di 𝑓 come l’estremo superiore dell’immagine di 𝑓 :

sup 𝑓 = sup 𝑓 (𝑥) = sup 𝑓 (𝐴).


𝑥∈𝐴

In maniera analoga si definiscono l’estremo inferiore inf 𝑓 , il massimo max 𝑓 e il minimo


min 𝑓 .
Dunque il massimo di una funzione è (se esiste) il valore massimo che la funzione può
assumere. I punti 𝑥 in cui la funzione assume il valore massimo 𝑓 (𝑥) vengono chiamati punti
punto di massimo/minimo
di massimo. Analogamente i punti in cui la funzione assume il valore minimo (sempre che
esistano) vengono chiamati punti di minimo.

funzione superiormente limitata


Diremo che la funzione 𝑓 è superiormente limitata se sup 𝑓 < +∞ ovvero se esiste 𝑀 ∈ ℝ
tale che
∀𝑥 ∈ 𝐴 : 𝑓 (𝑥) ≤ 𝑀.

funzione inferiormente limitata


Diremo che la funzione 𝑓 è inferiormente limitato se inf 𝑓 > −∞ ovvero se esiste 𝑀 ∈ ℝ tale
che
∀𝑥 ∈ 𝐴 : 𝑓 (𝑥) ≥ 𝑀.

funzione limitata
Diremo che la funzione 𝑓 è limitata se è sia superiormente che inferiormente limitata ovvero
se sup | 𝑓 | < +∞ cioè se esiste 𝑀 ∈ ℝ tale che

∀𝑥 ∈ 𝐴 : | 𝑓 (𝑥)| ≤ 𝑀.

Nel seguente esercizio abbiamo un esempio di funzione limitata.

Esercizio 1.84. Si consideri la funzione 𝑓 : ℝ → ℝ

1
𝑓 (𝑥) = .
1 + 𝑥2
1.20 funzioni lineari 63

Verificare che max 𝑓 = sup 𝑓 = 1, che 0 è l’unico punto di massimo, che inf 𝑓 = 0 e che
min 𝑓 non esiste.

1.20 funzioni lineari

Le funzioni lineari 𝑓 : ℝ → ℝ sono le funzioni per le quali esistono 𝑚, 𝑞 ∈ ℝ tali che funzione lineare
Attenzione: nell’ambito dell’algebra li-
𝑓 (𝑥) = 𝑚𝑥 + 𝑞. neare queste funzioni verrebbero chia-
mate lineari affini, mentre le funzioni li-
neari dovrebbero sempre avere 𝑞 = 0.
Se prendiamo due punti (𝑥 1 , 𝑓 (𝑥 1 )) e (𝑥 2 , 𝑓 (𝑥 2 )) sul grafico di una funzione lineare
Noi invece (come spesso accade nell’am-
possiamo osservare che si ha bito dell’analisi) chiameremo lineari que-
ste funzioni e chiameremo lineari omoge-
𝑓 (𝑥2 ) − 𝑓 (𝑥1 ) nee quelle con 𝑞 = 0. Il termine lineare
= 𝑚.
𝑥2 − 𝑥1 pervade tutta la matematica e si applica
in particolare alle equazioni che si otten-
Il coefficiente 𝑚 , dunque, rappresenta la pendenza del grafico di 𝑓 , ovvero il rapporto gono tramite le funzioni lineari. Purtrop-
po il nome scelto è fuorviante: la parola
tra la variazione dei valori della funzione Δ 𝑓 = 𝑓 (𝑥 2 ) − 𝑓 (𝑥 1 ) e la variazione della linea viene usata a volte come abbrevia-
variabile in ingresso Δ𝑥 = 𝑥 2 − 𝑥 1 . Geometricamente questo è il rapporto tra i due cateti zione di linea retta, quando invece sareb-
(base e altezza) che formano un triangolo rettangolo la cui ipotenusa è il segmento che be più giusto utilizzare l’abbreviazione
retta in quanto una linea può benissimo
congiunge i due punti sul grafico. Il fatto che questo rapporto sia costante significa, in
essere curva. In altri contesti (come ad
base al teorema di Talete, che i punti del grafico sono allineati ovvero che il grafico di esempio nell’ambito degli ordinamenti)
una funzione lineare è, dal punto di vista geometrico, una retta. il termine lineare rappresenta un ogget-
to unidimensionale senza ramificazioni
ed è quindi maggiormente aderente al
Definizione 1.85 (retta). Una linea retta (più semplicemente: retta) in è un sottospazio significato originale della parola.
affine di dimensione 1 ovvero la traslazione di un sottospazio vettoriale di dimensione 1 (si
rimanda al corso di geometria).

Tutte le rette del piano, tranne quelle parallele all’asse delle ordinate, sono grafico di
una funzione lineare.
Si osservi che per 𝑚 > 0 la funzione è strettamente crescente, per 𝑚 = 0 la funzione è
costante e per 𝑚 < 0 la funzione è strettamente decrescente.

𝑦 = 𝑚𝑥 + 𝑞

𝑓 (𝑥2 )
Δ 𝑓 (𝑥)
𝑓 (𝑥1 )
Δ𝑥

𝑥1 𝑥2

Figura 1.7: Il grafico di una funzione


lineare.
64 1 fondamenti

1.21 funzioni quadratiche

polinomio di secondo grado Le funzioni espresse mediante un polinomio di secondo grado

𝑓 (𝑥) = 𝑎𝑥 2 + 𝑏𝑥 + 𝑐 (1.18)

funzioni quadratiche con 𝑎, 𝑏, 𝑐 ∈ ℝ, 𝑎 ≠ 0, si possono chiamare funzioni quadratiche.

Il modello di funzione quadratica è la funzione 𝑓 (𝑥) = 𝑥 2 che (come tutte le potenze


di esponente positivo e pari) risulta essere una funzione pari, strettamente crescente
sull’intervallo [0 , +∞) e strettamente decrescente su (−∞, 0]. La funzione assume
solamente valori non negativi e si annulla solo per 𝑥 = 0. Dunque l’equazione

𝑥2 = 𝑏

non ha soluzione se 𝑏 < 0 ed ha come unica soluzione 𝑥 = 0 se 𝑏 = 0. √Se 𝑏 > 0


sappiamo che questa equazione ha una unica soluzione √ positiva 𝑥 1 = 𝑏 e, per
simmetria,
√ ha anche una soluzione negativa 𝑥 2 = − 𝑏 . Sintetizzando si usa scrivere
𝑥1,2 = ± 𝑏 per unire in una unica riga le due definizioni.
La generica funzione quadratica (1.18) può essere ricondotta al caso modello tramite un
cambio di variabile lineare. In pratica si cerca di comporre il quadrato di un binomio
completamento del quadrato con un procedimento chiamato completamento del quadrato:

𝑏 𝑐
 
𝑓 (𝑥) = 𝑎𝑥 + 𝑏𝑥 + 𝑐 = 𝑎 𝑥 + 𝑥 +
2 2
𝑎 𝑎
𝑏 𝑏2 𝑏2 𝑐
 
= 𝑎 𝑥2 + 2 𝑥+ 2 − 2 +
2𝑎 4𝑎 4𝑎 𝑎
" 2 # (1.19)
𝑏 𝑏 2 − 4 𝑎𝑐
=𝑎 𝑥+ −
2𝑎 4𝑎2
2
𝑏 𝑏 2 − 4 𝑎𝑐

=𝑎 𝑥+ − .
2𝑎 4𝑎

Ponendo 𝑋 = 𝑥 + 2𝑏𝑎 e 𝑌 = 𝑦 + 𝑏 −4 𝑎4 𝑎𝑐 l’equazione 𝑦 = 𝑎𝑥 2 + 𝑏𝑥 + 𝑐 diventa quindi


2

𝑌 = 𝑎𝑋 2 . Significa che il grafico della funzione quadratica (1.18) si ottiene traslando la


curva 𝑦 = 𝑎𝑥 2 che, dal punto di vista geometrico, si può facilmente dimostrare essere
una parabola con fuoco nel punto di coordinate 0 , 41𝑎 e asse la retta di equazione 𝑥 = 0.

Dunque il grafico di ogni funzione quadratica è una parabola, e più precisamente:

𝑥 = − 2𝑏𝑎

𝑦 = 𝑎𝑥 2 + 𝑏𝑥 + 𝑐

𝑥1 𝑥2
Figura 1.8: Il grafico di una funzione
quadratica.
1.21 funzioni quadratiche 65

ogni parabola con direttrice parallela all’asse delle ascisse è il grafico di una funzione
quadratica.

Definizione 1.86 (parabola). Una parabola con fuoco nel punto 𝑭 = (𝐹1 , 𝐹2 ) ∈ ℝ × ℝ e
retta direttrice la retta 𝑟 ⊆ ℝ × ℝ è l’insieme dei punti 𝒙 = (𝑥 1 , 𝑥 2 ) ∈ ℝ × ℝ equidistanti da
𝑭 e da 𝑟 :
 p q 
𝒙 ∈ ℝ × ℝ: (𝑥1 − 𝐹1 )2 + (𝑥2 − 𝐹2 )2 = inf (𝑥1 − 𝑃1 )2 + (𝑦1 − 𝑃1 )2 .
𝑷∈𝑟

Esercizio 1.87. Si dimostri che per ogni 𝑎 ≠ 0 esiste 𝑠 ≠ 0 per cui il riscalamento 𝑋 = 𝑠𝑥 ,
𝑌 = 𝑠 𝑦 porta il grafico della parabola 𝑦 = 𝑎𝑥 2 nel grafico della parabola 𝑌 = 𝑋 2 . Significa
che a meno di isometrie e riscalamenti c’è una unica parabola.

Ricordando le proprietà di monotonia della funzione 𝑋 ↦→ 𝑋 2 possiamo dedurre


 se 𝑎 > 0 la funzione 𝑓 (𝑥) è strettamente decrescente se ristretta all’intervallo
che
−∞, − 2𝑏𝑎 ed è invece strettamente crescente sull’intervallo − 2𝑏𝑎 , +∞ . Ha dunque
 

un punto di minimo in 𝑥 = − 2𝑏𝑎 . Inoltre (sempre se 𝑎 > 0) la funzione è superiormente


illimitata. Viceversa se 𝑎 < 0 la funzione è inferiormente illimitata ed ha un massimo
nel punto 𝑥 = − 2𝑏𝑎 .

E’ molto importante saper risolvere equazioni e disequazioni quadratiche. Grazie


a (1.19) l’equazione
𝑎𝑥 2 + 𝑏𝑥 + 𝑐 = 0
risulta equivalente a
2
𝑏 𝑏 2 − 4 𝑎𝑐

𝑥+ = .
2𝑎 4𝑎2
Dunque se 𝑏 2 − 4 𝑎𝑐 < 0 l’equazione 𝑎𝑥 2 + 𝑏𝑥 + 𝑐 = 0 non ha soluzioni. Se 𝑏 2 − 4 𝑎𝑐 = 0
l’equazione ha una unica soluzione 𝑥 = − 2𝑏𝑎 . Infine se 𝑏 2 − 4 𝑎𝑐 > 0 si ottiene

𝑏 𝑏 2 − 4 𝑎𝑐
𝑥+ =±
2𝑎 2𝑎
da cui la famosa formula risolutiva

−𝑏 ± 𝑏 2 − 4 𝑎𝑐
𝑥 1 ,2 = . (1.20)
2𝑎

Risolvendo le disequazioni allo stesso modo, si trova che la funzione 𝑎𝑥 2 + 𝑏𝑥 + 𝑐


quando 𝑎 > 0 è positiva nei punti esterni alle soluzioni dell’equazione (in tutti i
punti se le soluzioni non esistono) ed è negativa nei punti interni alle due soluzioni.
Viceversa se 𝑎 < 0 la funzione è positiva all’interno delle due soluzioni e negativa
all’esterno.
66 1 fondamenti

1.22 equazioni e disequazioni

Un problema matematico molto comune è quello di dover risolvere equazioni e


disequazioni del tipo:

𝑓 (𝑥) = 𝑏, 𝑓 (𝑥) ≥ 𝑏, 𝑓 (𝑥) > 𝑏, 𝑓 (𝑥) ≤ 𝑏, 𝑓 (𝑥) < 𝑏 (1.21)

dove 𝑓 : 𝐴 ⊆ ℝ → ℝ è una funzione data e 𝑏 ∈ ℝ è fissato.

Quando 𝑓 è strettamente crescente e 𝑏 ∈ 𝑓 (𝐴) la soluzione può essere scritta banal-


mente: ovviamente deve essere 𝑥 ∈ 𝐴 e ogni equazione o disequazione in (1.21) avrà
la corrispondente soluzione:

𝑥 = 𝑓 −1 (𝑏), 𝑥 ≥ 𝑓 −1 (𝑏), 𝑥 > 𝑓 −1 (𝑏), 𝑥 ≤ 𝑓 −1 (𝑏), 𝑥 < 𝑓 −1 (𝑏).

Se la funzione fosse strettamente decrescente si può procedere allo stesso modo, ma


le disuguaglianze si invertono. Se la funzione fosse strettamente crescente su alcuni
intervalli e strettamente decrescente su altri si potranno separare i diversi casi e si
otterranno più soluzioni espresse da uguaglianze o disuguaglianze.

Esempio 1.88. Si risolva la disequazione


hp i
(𝑥 + 1)4 − 3 − 2 ≤ 3.
3
log2

Svolgimento. La funzione logaritmo è strettamente crescente ed è definita quando


l’argomento è positivo. Dunque la disequazione data è equivalente al sistema di
disequazioni:
p3
0< (𝑥 + 1)4 − 3 − 2 ≤ 8.
Possiamo sommare 2 per ottenere
p3
2< (𝑥 + 1)4 − 3 ≤ 10.

La funzione radice cubica è strettamente crescente su tutto ℝ quindi possiamo invertirla


elevando tutto al cubo:
8 < (𝑥 + 1)4 − 3 ≤ 1000.
Sommiamo 3:
11 < (𝑥 + 1)4 ≤ 1003.
L’elevamento alla quarta potenza è strettamente crescente solo quando l’argomento è
positivo, ed è una funzione pari. Possiamo quindi affermare che le nostre disequazioni
sono equivalenti all’unione delle soluzioni di due sistemi:
√4 √4 √4 √4
11 < 𝑥 + 1 ≤ 1003 o − 1003 ≤ 𝑥 + 1 < 11.

Sottraendo 1 otteniamo infine


√4 √4 √4 √4
11 − 1 < 𝑥 ≤ 1003 − 1 o − 1003 − 1 ≤ 𝑥 < 11 − 1.
1.23 i numeri complessi 67

In definitiva l’insieme delle soluzioni è


h √
4
√4  √
4
√4 i
− 1003 − 1 , 11 − 1 ∪ 11 − 1, 1003 − 1 .

hp i
Nell’esempio precedente la funzione 𝑓 (𝑥) = log2 3
(𝑥 + 1)4 − 3 − 2 è ottenuta
mediante composizione di funzioni elementari:
√3
𝑓 = (𝑥 ↦→ log2 𝑥) ◦ (𝑥 ↦→ 𝑥 − 2) ◦ (𝑥 ↦→ 𝑥)
◦ (𝑥 ↦→ 𝑥 − 3) ◦ (𝑥 ↦→ 𝑥 ) ◦ (𝑥 ↦→ 𝑥 + 1).
4

Negli intervalli in cui tutte queste funzioni sono invertibili la funzione inversa si ottiene
componendo, in ordine opposto, tutte le inverse:
√4
𝑓 −1 = (𝑥 ↦→ 𝑥 − 1) ◦ (𝑥 ↦→ 𝑥) ◦ (𝑥 ↦→ 𝑥 + 3)
◦ (𝑥 ↦→ 𝑥 ) ◦ (𝑥 ↦→ 𝑥 + 2) ◦ (𝑥 ↦→ 2𝑥 ).
3

√4
In effetti il caposaldo 1003 − 1 è proprio tale funzione valutata in 𝑏 = 3.

Il metodo precedente è puramente algebrico e si applica alle equazioni come la (1.21)


dove la variabile 𝑥 compare una sola volta e dove la funzione 𝑓 si esprime come
composizione di funzioni elementari di cui sappiamo scrivere la funzione inversa.

Ben diverso è il caso in cui nell’equazione la variabile 𝑥 compare più di una volta. In
alcuni casi, come ad esempio,
𝑥 2 > 2𝑥 − 1
queste equazioni possono essere ricondotte al caso precedente tramite opportune
manipolazioni algebriche. Il caso delle equazioni quadratiche lo abbiamo fatto nel
paragrafo precedente utilizzato il completamento del quadrato: 𝑥 2 − 2 𝑥 = (𝑥 − 1)2 − 1.
In altri casi, come ad esempio l’equazione

2𝑥 = 𝑥 2

le manipolazioni algebriche non sono utili. Nel capitolo sul calcolo differenziale
svilupperemo degli strumenti che ci permetteranno di determinare l’andamento di
molte di queste di funzioni. Nel capitolo sulle successioni svilupperemo invece gli
strumenti che ci permetteranno di determinare le soluzioni mediante algoritmi di
approssimazione. Questi strumenti presuppongono il concetto di limite e continuità:
è sostanzialmente questo che identifica la materia chiamata analisi matematica.

1.23 i numeri complessi


numeri complessi
Dal punto di vista geometrico l’insieme ℂ dei numeri complessi può essere visto come
un modello del piano euclideo. Sul piano euclideo fissiamo arbitrarimente un punto
0 in modo da ottenere uno spazio vettoriale e fissiamo, arbitrariamente, una base 𝑒1 ,
𝑒2 . Identifichiamo ogni punto del piano con i corrispondenti vettori applicati in 0. La
retta generata dal vettore 𝑒1 la identifichiamo con la retta ℝ dei numeri reali e quindi
68 1 fondamenti

poniamo 1 = 𝑒1 . La retta ortogonale generata dal vettore 𝑒2 verrà chiamata retta dei
numeri immaginari e definiamo 𝑖 = 𝑒2 .

Un generico punto 𝑧 del piano ℂ potrà essere scritto in maniera univoca nella base
scelta: 𝑧 = 𝑥𝑒1 + 𝑦𝑒2 ovvero, per come abbiamo chiamato 𝑒1 ed 𝑒2 :

𝑧 = 𝑥 + 𝑖 𝑦.

Tale 𝑧 viene chiamato numero complesso con parte reale 𝑥 e parte immaginaria 𝑦 .
Questa rappresentazione del numero complesso 𝑧 viene chiamata rappresentazione
rappresentazione cartesiana cartesiana in quanto definisce il punto 𝑧 del piano complesso tramite le sue coordinate
cartesiane 𝑥 e 𝑦 . I numeri reali sono immersi nei complessi, nel senso che se 𝑥 ∈ ℝ
allora 𝑧 = 𝑥 + 𝑖 · 0 = 𝑥 è anche un numero complesso. Il numero complesso 𝑖 = 0 + 𝑖 · 1
unità immaginaria viene chiamata unità immaginaria e i numeri complessi della forma 𝑖 𝑦 sono chiamati
immaginari. Un numero complesso 𝑧 = 𝑥 + 𝑖 𝑦 è quindi una somma tra un numero
reale ed un numero immaginario. Il numero reale 𝑥 viene chiamato parte reale di 𝑧 e
Re 𝑧 si denota con 𝑥 = Re 𝑧 . Il numero reale 𝑦 viene chiamato parte immaginaria di 𝑧 e si
Im 𝑧 denota con 𝑦 = Im 𝑧 (osserviamo che la parte immaginaria di un numero complesso è
un numero reale, non immaginario). Dunque 𝑧 = Re 𝑧 + 𝑖 Im 𝑧 .

L’insieme ℂ, per come è stato costruito, è uno spazio vettoriale reale di dimensione
addizione
2. Abbiamo quindi già definite la addizione tra elementi di ℂ e la moltiplicazione tra
elementi di ℂ ed elementi di ℝ, se 𝑎, 𝑏, 𝑐, 𝑑, 𝑡 ∈ ℝ si ha:

(𝑎 + 𝑖𝑏) + (𝑐 + 𝑖𝑑) = (𝑎 + 𝑐) + 𝑖(𝑏 + 𝑑),


𝑡(𝑎 + 𝑖𝑏) = 𝑡 𝑎 + 𝑖𝑡𝑏.

moltiplicazione
Vogliamo estendere la moltiplicazione a tutte le coppie di numeri complessi. Imponendo
(arbitrariamente) che valga 𝑖 · 𝑖 = −1 e che rimanga valida la proprietà distributiva, si
ottiene questa definizione:

(𝑎 + 𝑖𝑏) · (𝑐 + 𝑖𝑑) = (𝑎𝑐 − 𝑏𝑑) + 𝑖(𝑎𝑑 + 𝑏𝑐).

Si può verificare che questa moltiplicazione estende quella “scalare” definita in


precedenza. E’ anche facile verificare che addizione e moltiplicazione soddisfano
le proprietà commutativa associativa e distributiva, che 0 è elemento neutro per la
addizione, che 1 è elemento neutro della moltiplicazione. Si osservi che se 𝑧 = 𝑥 + 𝑖 𝑦
non è nullo, allora
𝑥 − 𝑖𝑦
(𝑥 + 𝑖 𝑦) · 2 = 1.
𝑥 + 𝑦2
Significa che ogni 𝑧 ≠ 0 ammette inverso moltiplicativo e quindi ℂ risulta essere un
campo.
Se ℂ fosse un campo ordinato per assur-
do si dovrebbe avere, che 𝑧 2 ≥ 0 per ogni
Osserviamo che su ℂ non si definisce una relazione d’ordine perché in effetti non è
𝑧 ∈ ℂ (questo è vero in tutti i campi or-
dinati). Ma allora −1 = 𝑖 2 ≥ 0 cioè 1 ≤ 0 possibile definire un ordine “compatibile” con le operazioni appena definite.
che è in contraddizione con la proprietà
0 < 1 valida in ogni campo ordinato. Su ℂ definiamo delle ulteriori operazioni. Il coniugato di un numero complesso
coniugato 𝑧 = 𝑥 + 𝑖 𝑦 è il numero 𝑧¯ = 𝑥 − 𝑖 𝑦 . Geometricamente l’operazione di coniugio è una
simmetria rispetto alla retta reale. I numeri reali sono in effetti punti fissi del coniugio
1.23 i numeri complessi 69

(il coniugato di un numero reale è il numero stesso). E’ un semplice esercizio verificare


che il coniugio “attraversa” somma e prodotto:

𝑧 + 𝑤 = 𝑧¯ + 𝑤,
¯ 𝑧 · 𝑤 = 𝑧¯ · 𝑤.
¯

Ovviamente risulta 𝑧¯ = 𝑧 . E’ anche utile osservare che si ha:


𝑧 + 𝑧¯ 𝑧 − 𝑧¯
Re 𝑧 = , Im 𝑧 = (1.22)
2 2𝑖
e
𝑧 · 𝑧¯ = (𝑥 + 𝑖 𝑦)(𝑥 − 𝑖 𝑦) = 𝑥 2 − 𝑖 2 𝑦 2 = 𝑥 2 + 𝑦 2 .

modulo
Possiamo allora definire il modulo di un numero complesso 𝑧 = 𝑥 + 𝑖 𝑦 come il numero
reale
√ q
|𝑧| = 𝑧 · 𝑧¯ = 𝑥 2 + 𝑦 2 .

Geometricamente tale quantità rappresenta la distanza del punto 𝑧 dal punto 0 e


quindi la distanza tra due numeri complessi 𝑧 e 𝑤 si potrà rappresentare con |𝑧 − 𝑤| .

Osserviamo
√ che se 𝑧 = 𝑥 ∈ ℝ ⊆ ℂ il modulo di 𝑧 coincide con il valore assoluto:
|𝑧| = 𝑥 = |𝑥| e per questo motivo non distinguiamo, nelle notazioni, il modulo dal
2

valore assoluto. Più in generale risulta per ogni 𝑧 ∈ ℂ (la verifica è immediata):

| Re 𝑧| ≤ |𝑧|, | Im 𝑧| ≤ |𝑧|.

Possiamo a questo punto trovare una utile formula per calcolare il reciproco di un
numero complesso. Essendo infatti 𝑧 · 𝑧¯ = |𝑧| 2 si osserva che

1 𝑧¯ 𝑧¯
= = .
𝑧 𝑧¯ · 𝑧 |𝑧| 2

Teorema 1.89. Il modulo di un numero complesso soddisfa (come il valore assoluto) le seguenti
proprietà


1. |𝑧| = |𝑧| ,
2. |−𝑧| = |𝑧| = | 𝑧¯ | ,
3. |𝑧 · 𝑤| = |𝑧| · |𝑤| .
4. |𝑧 + 𝑤| ≤ |𝑧| + |𝑤| (convessità),
5. |𝑧 − 𝑤| ≤ |𝑧 − 𝑣| + |𝑣 − 𝑤| (disuguaglianza triangolare),

Dimostrazione. La prima proprietà è ovvia in quanto il valore assoluto di un numero


reale non negativo è il numero stesso.

La seconda proprietà viene immediatamente dalla definizione.


70 1 fondamenti

Figura 1.9: Consideriamo i numeri com-


plessi 𝑧 = 𝑎 + 𝑖𝑏 e 𝑤 = 𝛼 + 𝑖𝛽 e suppo-
niamo che sia 𝛼 2 = 𝑎 2 + 𝑏 2 . Si consideri 𝑦
il punto 𝑢 che si ottiene ruotando il pun-
𝑢
to 𝑤 dell’angolo individuato dal punto
𝑧 . Si avrà allora 𝑢 = 𝑎 − 𝑠 + 𝑖(𝑏 + 𝑡)
dove 𝑠 e 𝑡 sono i cateti del triangolo 𝛽
rettangolo con ipotenusa 𝛽 . Grazie alle 𝑡 𝑤
proprietà di similitudine dei triangoli
𝑠
si ha 𝛽𝑠 = 𝛼𝑏 e 𝛽𝑡 = 𝛼𝑎 da cui si ottiene 𝑧
𝑏𝛽 𝑎𝛽
quindi 𝑢 = 𝑎 − 𝛼 + 𝑖(𝑏 + 𝛼 ) ovvero 𝛼
𝛼𝑢 = (𝑎𝛼 − 𝑏𝛽) + 𝑖(𝑏𝛼 + 𝑎𝛽) = 𝑧 · 𝑤 . 𝑏
Significa che il numero complesso 𝑧 · 𝑤 𝑥
si trova sulla semiretta che individua un
angolo che è la somma degli angoli indi- 0 𝑎
viduati dai numeri complessi 𝑧 e 𝑤 .

Per la terza proprietà sia 𝑧 = 𝑥 + 𝑖 𝑦 , 𝑤 = 𝑎 + 𝑖𝑏 . Allora:

|𝑧 · 𝑤| = |(𝑥 + 𝑖 𝑦) · (𝑎 + 𝑖𝑏)| = |𝑥𝑎 − 𝑦𝑏 + 𝑖(𝑥𝑏 + 𝑎 𝑦)|


q
= (𝑥𝑎 − 𝑦𝑏)2 + (𝑥𝑏 + 𝑎 𝑦)2
q
= 𝑥 2 𝑎 2 + 𝑦 2 𝑏 2 − 2𝑥𝑎 𝑦𝑏 + 𝑥 2 𝑏 2 + 𝑎 2 𝑦 2 + 2 𝑥𝑏𝑎 𝑦
q
= 𝑥2 𝑎2 + 𝑦2𝑏2 + 𝑥2𝑏2 + 𝑎2 𝑦2
q
= 𝑥 2 (𝑎 2 + 𝑏 2 ) + 𝑦 2 (𝑎 2 + 𝑏 2 )
q
= (𝑥 2 + 𝑦 2 )(𝑎 2 + 𝑏 2 ) = |𝑥 + 𝑖 𝑦| · |𝑎 + 𝑖𝑏|
= |𝑧| · |𝑤|.

Per la quarta disuguaglianza osserviamo che si ha

|𝑧 + 𝑤| 2 = (𝑧 + 𝑤) · (¯𝑧 + 𝑤)
¯ = |𝑧| 2 + |𝑤| 2 + 𝑧 · 𝑤¯ + 𝑧¯ · 𝑤

e visto che

𝑧 · 𝑤¯ + 𝑧¯ · 𝑤 = 𝑧 · 𝑤¯ + 𝑧 · 𝑤¯ = 2 Re(𝑧 𝑤)
¯ ≤ 2 |𝑧 𝑤|
¯ = 2 |𝑧| · | 𝑤|
¯ = 2 |𝑧| · |𝑤|

otteniamo
|𝑧 + 𝑤| 2 ≤ |𝑧| 2 + |𝑤| 2 + 2 |𝑧| · |𝑤| = (|𝑧| + |𝑤|)2
che è equivalente alla disuguaglianza di convessità.

La disuguaglianza triangolare è conseguenza immediata della convessità, infatti

|𝑧 − 𝑤| = |(𝑧 − 𝑣) + (𝑣 − 𝑤)| ≤ |𝑧 − 𝑣| + |𝑣 − 𝑤|.

Possiamo ora dare una interpretazione geometrica del prodotto 𝑧 · 𝑤 tra due numeri
complessi. In primo luogo sappiamo che |𝑧 · 𝑤| = |𝑧| · |𝑤| e dunque il punto del piano
che rappresenta il prodotto 𝑧 · 𝑤 si trova ad una distanza dall’origine che è pari al
prodotto delle distanze dei punti 𝑧 e 𝑤 . Inoltre l’angolo individuato da 𝑧 · 𝑤 rispetto
1.23 i numeri complessi 71

all’asse delle 𝑥 positive risulta uguale alla somma degli angoli individuati dai punti 𝑧
e 𝑤 come mostrato in figura 1.9.

Anche il piano dei numeri complessi può essere esteso aggiungendoci un punto
all’infinito. A differenza dei reali, su cui era presente un ordinamento che era utile infinito
conservare, nel caso dei numeri complessi è più usuale utilizzare un unico punto
infinito che si denota con ∞. Definiamo il piano dei complessi estesi ℂ̄ come ∞

ℂ̄ = ℂ ∪ {∞}.

Definiamo

𝑧+∞=∞ ∀𝑧 ∈ ℂ
𝑧−∞=∞ ∀𝑧 ∈ ℂ
𝑧·∞=∞ ∀𝑧 ∈ ℂ̄ \ {0}
𝑧/∞ = 0 ∀𝑧 ∈ ℂ
𝑧/0 = ∞ ∀𝑧 ∈ ℂ̄ \ {0}
¯ =∞

|∞| = +∞ ∈ ℝ̄.

Si noti che abbiamo definito la divisione per zero di numeri complessi (e quindi anche
reali) diversi da zero. Il risultato è ∞ e quindi rimane confermato che la divisione per
zero non è una operazione valida se vogliamo un risultato finito. Una quantità 𝑧 ∈ ℂ̄
sarà detta finita se 𝑧 ∈ ℂ.

Esempio 1.90. La funzione 𝑓 : ℂ̄ → ℂ̄ definita da

1
𝑓 (𝑧) =
𝑧

è una funzione bigettiva di ℂ̄ in sé. Dal punto di vista geometrico il coniugato di tale funzione
ovvero la funzione 𝑧 ↦→ 1𝑧¯ è l’inversione circolare rispetto al cerchio unitario di ℂ: i punti sulla
circonferenza unitaria vengono lasciati fissi, i punti all’interno vengono mandati all’esterno
rimanendo sullo stesso raggio uscente dall’origine e invertendo il proprio modulo. I punti 0 e
∞ si scambiano.

Esercizio 1.91 (vertici di un triangolo equilatero). Si risolva l’equazione

𝑧3 − 1 = 0

nel campo complesso.

Svolgimento. Ricordiamo il prodotto notevole:

𝑧 3 − 1 = (𝑧 − 1)(𝑧 2 + 𝑧 + 1).

Dunque 𝑧 = 1 è una soluzione e le altre soluzioni devono risolvere l’equazione


𝑧 2 + 𝑧 + 1 = 0. Certamente 𝑧 = 0 non è soluzione e dunque possiamo dividere per 𝑧 e
ottenere:
1
𝑧 + 1 + = 0.
𝑧
72 1 fondamenti

Osserviamo ora che se 𝑧 è soluzione si ha 1 = 𝑧 3 e quindi: 1 = 𝑧 3 = |𝑧| 3 da cui |𝑧| = 1.


Ma allora 𝑧 · 𝑧¯ = |𝑧| 2 = 1 ovvero 1𝑧 = 𝑧¯ . Dunque si ha

𝑧 + 1 + 𝑧¯ = 0.

Osserviamo ora che se 𝑧 = 𝑥 + 𝑖 𝑦 con 𝑥, 𝑦 ∈ ℝ allora 𝑧 + 𝑧¯ = 2 𝑥 e quindi

2𝑥 + 1 = 0

da cui 𝑥 = − 12 . Essendo inoltre 𝑥 2 + 𝑦 2 = |𝑧| 2 = 1 si ottiene 𝑦 2 = 1 − 𝑥 2 = 3


4 da cui

3
𝑦=± 2 .

L’equazione data ha quindi 3 soluzioni:



1 3
𝑧0 = 1, 𝑧 1 ,2 =− ±𝑖 .
2 2

Questi tre punti, se disegnati sul piano di Gauss, si trovano ai vertici di un triangolo
equilatero iscritto nella circonferenza unitaria. Infatti l’interpretazione geometrica del
prodotto di numeri complessi ci dice che il punto 𝑧 1 individua sul piano di Gauss un
angolo pari ad un terzo dell’angolo giro. Inoltre si ha 𝑧 2 = 𝑧 12 e dunque 𝑧 2 corrisponde
a 23 di angolo giro e 𝑧 0 = 𝑧 13 = 1 rappresenta l’angolo giro (o l’angolo nullo).
funzioni continue, limiti e successioni 2
2.1 funzioni continue

Intuitivamente una funzione continua ha la proprietà che se in un punto 𝑥 0 assume un


valore 𝑦0 = 𝑓 (𝑥 0 ) allora in punti abbastanza vicini ad 𝑥 0 i valori assunti non saranno
molto diversi dal valore 𝑦0 . Nella definizione seguente questo viene formalizzato:
fissato il punto 𝑥 0 e scelto un errore 𝜀 > 0 che siamo disposti a commettere sui valori
della funzione possiamo trovare un errore 𝛿 > 0 per cui nei punti che differiscono da
𝑥0 per meno di 𝛿 il valore della funzione differisce da 𝑦0 per meno di 𝜀.

Definizione 2.1 (continuità su ℝ). Sia 𝑓 : 𝐴 ⊆ ℝ → ℝ una funzione. Diremo che 𝑓 è


continua nel punto
continua nel punto 𝑥 0 ∈ 𝐴 se

∀𝜀 > 0 : ∃𝛿 > 0 : ∀𝑥 ∈ 𝐴 : |𝑥 − 𝑥0 | < 𝛿 =⇒ | 𝑓 (𝑥) − 𝑓 (𝑥0 )| < 𝜀. (2.1)

continua
Diremo che 𝑓 : 𝐴 → ℝ è continua se è continua in ogni punto 𝑥 0 ∈ 𝐴.

Attenzione: la funzione 𝑓 (𝑥) = 𝑥1 assume vicino a 𝑥 = 0 valori molto diversi tra loro
(ad esempio 𝑓 (0.01) − 𝑓 (−0.01) = 200) ma ciò non toglie che la funzione possa essere
continua in quanto il punto 𝑥 = 0 non appartiene al dominio e quindi, in base alla
definizione precedente, non ha senso e non ha importanza verificare se la funzione è
continua in tale punto.

Teorema 2.2 (continuità del reciproco). La funzione 𝑓 : ℝ \ {0} → ℝ definita da 𝑓 (𝑥) = 1


𝑥
è una funzione continua.

|𝑥0 |
Dimostrazione. Siano 𝑥, 𝑥 0 ≠ 0. Se prendiamo 𝛿 < 2 e se |𝑥 − 𝑥 0 | < 𝛿 si avrà, per
|𝑥0 |
disuguaglianza triangolare inversa, |𝑥| > 2 . Dunque

− 1 = |𝑥 − 𝑥0 | ≤ 2𝛿 .

1
𝑥 𝑥0 |𝑥 · 𝑥0 | |𝑥0 | 2

Si ottiene quindi la condizione | 𝑓 (𝑥) − 𝑓 (𝑥 0 )| < 𝜀 se si sceglie 𝛿 in modo che risulti


|𝑥 0 | 2 ·𝜀
anche 𝛿 < 2 . funzione segno

Esempio 2.3. La funzione segno sgn : ℝ → ℝ definita da



 1 se 𝑥 > 0


sgn(𝑥) = 0 se 𝑥 = 0

 −1 se 𝑥 < 0


è un esempio di funzione non continua.
74 2 funzioni continue, limiti e successioni

Dimostrazione. Verifichiamo che la funzione non è continua nel punto 𝑥 0 = 0. Infatti


se 𝑥 ≠ 0 si ha
| sgn(𝑥) − sgn(𝑥0 )| = | sgn(𝑥)| = 1
e quindi se scegliamo 𝜀 < 1 non è possibile trovare 𝛿 > 0 per cui valga la condizione
di continuità (2.1) nel punto 𝑥 0 = 0.

Esercizio 2.4. Dimostrare che le funzioni 𝑓 (𝑥) = 𝑥 e 𝑔(𝑥) = |𝑥| sono continue. Dimostrare
che le funzioni ℎ(𝑥) = ⌊𝑥⌋ e 𝑘(𝑥) = ⌈𝑥⌉ non sono continue (ma sono continue in ogni punto
𝑥0 ∈ ℝ \ ℤ).

Definizione 2.5 (operazioni sulle funzioni). Sia 𝐴 ⊆ ℝ e siano 𝑓 , 𝑔 funzioni 𝐴 → ℝ.


Possiamo allora definire 𝑓 + 𝑔 , − 𝑓 , 𝑓 − 𝑔 , 𝑓 · 𝑔 , | 𝑓 | , 𝑓 𝑛 (con 𝑛 ∈ ℕ ) e (se 𝑔(𝑥) ≠ 0 per ogni
𝑥 ∈ 𝐴) anche 𝑓 /𝑔 come funzioni 𝐴 → ℝ mediante le seguenti ovvie definizioni

( 𝑓 + 𝑔)(𝑥) = 𝑓 (𝑥) + 𝑔(𝑥), ( 𝑓 − 𝑔)(𝑥) = 𝑓 (𝑥) − 𝑔(𝑥),


( 𝑓 · 𝑔)(𝑥) = 𝑓 (𝑥) · 𝑔(𝑥), ( 𝑓 /𝑔)(𝑥) = 𝑓 (𝑥)/𝑔(𝑥),
(− 𝑓 )(𝑥) = −( 𝑓 (𝑥)), | 𝑓 |(𝑥) = | 𝑓 (𝑥)|, 𝑓 𝑛 (𝑥) = ( 𝑓 (𝑥))𝑛 .

Se 𝑓 : 𝐴 → 𝐵 e 𝑔 : 𝐵 → 𝐶 ricordiamo che abbiamo definito la funzione composta 𝑔 ◦ 𝑓 : 𝐴 →


𝐶:
(𝑔 ◦ 𝑓 )(𝑥) = 𝑔( 𝑓 (𝑥)).

Se 𝑐 ∈ ℝ è un numero considereremo a volte 𝑐 : 𝐴 → ℝ come una funzione costante. Risulta


quindi inteso che se 𝑐 ∈ ℝ e 𝑓 : 𝐴 → ℝ allora 𝑐· 𝑓 è la funzione definita da (𝑐· 𝑓 )(𝑥) = 𝑐·( 𝑓 (𝑥)).
La somma e il prodotto per costante rendono l’insieme ℝ𝐴 delle funzioni 𝐴 → ℝ uno spazio
vettoriale sul campo ℝ.

Teorema 2.6 (composizione di funzioni continue). Se 𝑓 e 𝑔 sono funzioni definite e


continue in uno stesso punto 𝑥 0 allora anche

𝑓 + 𝑔, 𝑓 · 𝑔, 𝑓 − 𝑔, | 𝑓 |, 𝑓 𝑛 (con 𝑛 ∈ ℕ )

sono funzioni definite e continue nel punto 𝑥 0 . Se inoltre 𝑔(𝑥 0 ) ≠ 0 anche la funzione 𝑓 /𝑔 è
definita e continua nel punto 𝑥 0 .

Se 𝑓 : 𝐴 ⊆ ℝ → ℝ è una funzione continua nel punto 𝑥 0 ∈ 𝐴 e 𝑔 : 𝐵 ⊆ ℝ → ℝ è una


funzione continua nel punto 𝑦0 = 𝑓 (𝑥 0 ) ∈ 𝐵 allora la funzione 𝑔 ◦ 𝑓 definita in 𝑓 −1 (𝐵) è
continua nel punto 𝑥 0 .

Dimostrazione. Mostriamo prima di tutto la continuità della composizione 𝑔 ◦ 𝑓 . Per


la continuità di 𝑓 in 𝑥 0 e di 𝑔 in 𝑦0 = 𝑓 (𝑥 0 ) si ha che per ogni 𝜀 > 0 esiste un 𝛾 > 0 e
per ogni 𝛾 > 0 esiste un 𝛿 > 0 per cui

|𝑥 − 𝑥 0 | < 𝛿 =⇒ | 𝑓 (𝑥) − 𝑓 (𝑥0 )| < 𝛾,


|𝑦 − 𝑦0 | < 𝛾 =⇒ | 𝑔(𝑦) − 𝑔(𝑦0 )| < 𝜀

da cui

|𝑥 − 𝑥0 | < 𝛿 =⇒ | 𝑓 (𝑥) − 𝑓 (𝑥0 )| < 𝛾 =⇒ | 𝑔( 𝑓 (𝑥)) − 𝑔( 𝑓 (𝑥0 ))| < 𝜀


2.1 funzioni continue 75

che non è altro che la condizione di continuità (2.1) per 𝑔 ◦ 𝑓 .

Se 𝑓 e 𝑔 sono continue nel punto 𝑥 0 allora per ogni 𝜀′ > 0 esistono 𝛿 1 e 𝛿 2 tali che

|𝑥 − 𝑥0 | < 𝛿1 =⇒ | 𝑓 (𝑥) − 𝑓 (𝑥0 )| < 𝜀′ ,


|𝑥 − 𝑥0 | < 𝛿2 =⇒ | 𝑔(𝑥) − 𝑔(𝑥0 )| < 𝜀′ .

In particolare scegliendo 𝛿 = min {𝛿 1 , 𝛿 2 } se |𝑥 − 𝑥 0 | < 𝛿 valgono contemporanea-


mente entrambe le stime:

| 𝑓 (𝑥) − 𝑓 (𝑥0 )| < 𝜀′ , | 𝑔(𝑥) − 𝑔(𝑥0 )| < 𝜀′ .

Dunque per la somma osserviamo che se |𝑥 − 𝑥 0 | < 𝛿 si ha

|( 𝑓 + 𝑔)(𝑥) − ( 𝑓 + 𝑔)(𝑥0 )| = | 𝑓 (𝑥) + 𝑔(𝑥) − 𝑓 (𝑥0 ) − 𝑔(𝑥0 )|


≤ | 𝑓 (𝑥) − 𝑓 (𝑥0 )| + | 𝑔(𝑥) − 𝑔(𝑥0 )| ≤ 2 𝜀′ .

Dato 𝜀 > 0 basterà quindi scegliere 𝜀′ = 𝜀/2 e 𝛿 come sopra per ottenere la condizione
di continuità.

Per il prodotto si ha

| 𝑓 (𝑥)𝑔(𝑥) − 𝑓 (𝑥0 )𝑔(𝑥0 )|


= | 𝑓 (𝑥)𝑔(𝑥) − 𝑓 (𝑥0 )𝑔(𝑥) + 𝑓 (𝑥0 )𝑔(𝑥) − 𝑓 (𝑥 0 )𝑔(𝑥0 )|
≤ | 𝑓 (𝑥) − 𝑓 (𝑥 0 )| · | 𝑔(𝑥)| + | 𝑓 (𝑥 0 )| · | 𝑔(𝑥) − 𝑔(𝑥0 )|
≤ 𝜀′ | 𝑔(𝑥)| + | 𝑓 (𝑥0 )|𝜀′ .

Osserviamo ora che | 𝑔(𝑥)| ≤ | 𝑔(𝑥) − 𝑔(𝑥 0 )| + | 𝑔(𝑥 0 )| e quindi | 𝑔(𝑥)| ≤ | 𝑔(𝑥 0 )| + 𝜀′ da
cui:

| 𝑓 (𝑥)𝑔(𝑥) − 𝑓 (𝑥0 )𝑔(𝑥 0 )| ≤ 𝜀′(| 𝑔(𝑥0 )| + 𝜀′) + | 𝑓 (𝑥 0 )|𝜀′


= 𝜀′ · (| 𝑓 (𝑥0 )| + | 𝑔(𝑥 0 )| + 𝜀′).

Possiamo facilmente rendere questa quantità inferiore a qualunque 𝜀 > 0: basterà


prendere 𝜀′ < 1 e
𝜀
𝜀′ < .
| 𝑓 (𝑥 0 )| + | 𝑔(𝑥0 )| + 1

La funzione 𝑓 𝑛 è continua per induzione su 𝑛 in quanto prodotto di funzioni continue:


𝑓 𝑛+1 = 𝑓 𝑛 · 𝑓 .

Abbiamo già visto che la funzione ℎ(𝑥) = 𝑥1 è continua, dunque se 𝑔 è continua anche
1
la funzione 𝑔(𝑥) = ℎ ◦ 𝑔 è continua essendo composizione di funzioni continue. Di
𝑓
conseguenza anche la funzione 𝑔 = 𝑓 · 1
𝑔 è continua, essendo il prodotto di funzioni
continue.

Analogamente la funzione 𝑓 − 𝑔 è la somma di 𝑓 con −𝑔 e la funzione −𝑔 è la


composizione di 𝑔 con ℎ(𝑥) = −𝑥 . E’ immediato verificare che la funzione ℎ(𝑥) = −𝑥 è
continua e dunque anche la differenza 𝑓 − 𝑔 è continua. Lo stesso vale per la funzione
| 𝑓 | che è la composizione di 𝑓 con la funzione ℎ(𝑥) = |𝑥| .
76 2 funzioni continue, limiti e successioni

Il precedente teorema è molto importante ed utile in quanto garantisce che ogni


funzione definita tramite una espressione che coinvolge solamente le funzioni e le
operazioni elencate nell’enunciato del teorema, risulta certamente essere una funzione
continua. Come nel seguente.

Esempio 2.7. La funzione


(𝑥 − 3) · 𝑥 − 1
𝑥+𝑥
2
𝑓 (𝑥) =
1−𝑥 3
𝑥 −

𝑥

è continua.

Si intende che tale funzione è definita sull’insieme degli 𝑥 ∈ ℝ per cui tutte le operazioni
coinvolte sono definite ovvero 𝑓 : 𝐷 ⊆ ℝ → ℝ con

1 − 𝑥 3
 
𝐷 = 𝑥 ∈ ℝ : 𝑥 + 𝑥 ≠ 0, 𝑥 ≠ 0, 𝑥 − ≠0 .
2


𝑥

Dimostrazione. Per convincersi che questa funzione 𝑓 è continua si nota che le funzioni
𝑥 e le costanti 3 e 1 sono funzioni continue. Ma allora, per il teorema 2.6, anche le
funzioni 𝑥 − 3 e 𝑥 2 = 𝑥 · 𝑥 sono continue. Dunque anche (𝑥 − 3) · 𝑥 , 𝑥 + 𝑥 2 e 𝑥 3 e
1−𝑥 3
1 − 𝑥 3 sono continue. Di conseguenza sono continue pure 1+𝑥 1
2 e 𝑥 . E poi saranno
1−𝑥 3 1−𝑥 3 1−𝑥 3
continue anche (𝑥 − 3) · 𝑥 − 1
e𝑥− e quindi 𝑥 − e pure 𝑥 − 𝑥 . Infine

1+𝑥 2 𝑥 𝑥
sarà dunque continua 𝑓 (𝑥).

In particolare è chiaro che le funzioni lineare e quadratiche che abbiamo introdotto


nelle sezioni precedenti sono funzioni continue in quanto sono ottenute sommando e
moltiplicando tra loro funzioni continue.

Teorema 2.8 (continuità delle funzioni monotone). Sia 𝐼 ⊆ ℝ un intervallo e sia 𝑓 : 𝐼 → ℝ


una funzione monotòna. Allora 𝑓 è continua se e solo se 𝑓 (𝐼) è un intervallo.

Dimostrazione. Senza perdita di generalità possiamo supporre che 𝑓 sia crescente.


Dimostriamo innanzitutto che se 𝑓 (𝐼) è intervallo allora 𝑓 è continua.

Prendiamo un punto 𝑥 0 ∈ 𝐼 e sia 𝜀 > 0. Vogliamo trovare 𝑥 1 < 𝑥 0 tale che per ogni
𝑥 ∈ [𝑥1 , 𝑥0 ] ∩ 𝐼 si abbia 𝑓 (𝑥) > 𝑓 (𝑥0 ) − 𝜀. Siccome 𝑓 (𝐼) è un intervallo che contiene
il punto 𝑓 (𝑥 0 ) ci sono due possibilità: o 𝑓 (𝑥) > 𝑓 (𝑥 0 ) − 𝜀 per ogni 𝑥 ∈ 𝐼 e quindi
possiamo scegliere 𝑥 1 < 𝑥 0 a piacere oppure esiste 𝑥 1 ∈ 𝐼 tale che 𝑓 (𝑥 1 ) = 𝑓 (𝑥 0 ) − 2𝜀 .
In questo secondo caso dovrà essere 𝑥 1 < 𝑥 0 (in quanto 𝑓 è crescente) e per monotonia
si avrà, come voluto 𝑓 (𝑥) ≥ 𝑓 (𝑥 1 ) > 𝑓 (𝑥 0 ) − 𝜀 per ogni 𝑥 ∈ [𝑥 1 , 𝑥 0 ].

In modo analogo possiamo trovare 𝑥 2 > 𝑥 0 tale che per ogni 𝑥 ∈ [𝑥 0 , 𝑥 2 ] ∩ 𝐼 si abbia
𝑓 (𝑥) < 𝑓 (𝑥0 ) + 𝜀. Essendo 𝑓 crescente se 𝑥 ≥ 𝑥0 si avrà anche 𝑓 (𝑥) ≥ 𝑓 (𝑥0 ) e se 𝑥 ≤ 𝑥0
si avrà 𝑓 (𝑥) ≤ 𝑓 (𝑥 0 ). Dunque per ogni 𝑥 ∈ [𝑥 1 , 𝑥 2 ] si avrà | 𝑓 (𝑥) − 𝑓 (𝑥 0 )| < 𝜀. Basterà
scegliere 𝛿 = min {𝑥 0 − 𝑥 1 , 𝑥 2 − 𝑥 0 } per ottenere la continuità di 𝑓 in 𝑥 0 .

Supponiamo ora che 𝑓 sia una funzione continua e crescente. Vogliamo dimostrare
che 𝑓 (𝐼) è un intervallo.

Siano 𝑦1 , 𝑦2 ∈ 𝑓 (𝐼) e sia 𝑦0 ∈ ℝ con 𝑦1 < 𝑦0 < 𝑦2 . Vogliamo dimostrare che 𝑦0 ∈ 𝑓 (𝐼)
cioè che esiste 𝑥 0 ∈ 𝐼 tale che 𝑓 (𝑥 0 ) = 𝑦0 . Sappiamo che esistono 𝑥 1 , 𝑥 2 in 𝐼 tali che
2.2 limite di funzione 77

𝑓 (𝑥1 ) = 𝑦1 e 𝑓 (𝑥2 ) = 𝑦2 . Dovrà essere 𝑥 1 < 𝑥2 perché 𝑓 (𝑥 1 ) < 𝑓 (𝑥2 ) e 𝑓 è crescente.


Definiamo:
𝑥 0 = sup 𝐴 con 𝐴 = {𝑥 ∈ 𝐼 : 𝑓 (𝑥) < 𝑦0 },
e dimostriamo che 𝑓 (𝑥 0 ) = 𝑦0 . Chiaramente 𝑥 0 ∈ [𝑥 1 , 𝑥 2 ] in quanto 𝑥 1 ∈ 𝐴 e 𝑥 2 è un
maggiorante di 𝐴 e dunque 𝑓 è definita e continua in 𝑥 0 .

Se fosse 𝑓 (𝑥 0 ) < 𝑦0 scelto 𝜀 = 𝑦0 − 𝑓 (𝑥 0 ) per la definizione di continuità dovrebbe


esistere 𝛿 > 0 tale che per ogni 𝑥 ∈ 𝐼 con |𝑥 − 𝑥 0 | < 𝛿 si abbia | 𝑓 (𝑥) − 𝑓 (𝑥 0 )| < 𝜀. In
particolare scelto 𝑥 = 𝑥 0 + 𝛿2 si avrebbe 𝑓 (𝑥) < 𝑓 (𝑥 0 ) + 𝜀 = 𝑦0 . Ma allora avremmo
𝑥 ∈ 𝐴 che è assurdo in quanto sup 𝐴 = 𝑥0 < 𝑥 .

Se fosse invece 𝑓 (𝑥 0 ) > 𝑦0 posto 𝜀 = 𝑓 (𝑥 0 ) − 𝑦0 , grazie alla continuità di 𝑓 in 𝑥 0 ,


possiamo trovare 𝛿 > 0 tale che per ogni 𝑥 ∈ 𝐼 con |𝑥 − 𝑥 0 | < 𝛿 si abbia | 𝑓 (𝑥) − 𝑓 (𝑥 0 )| <
𝜀. In particolare scelto 𝑡 = 𝑥 0 − 𝛿2 si ha 𝑓 (𝑡) > 𝑓 (𝑥 0 )−𝜀 = 𝑦0 . Ma essendo 𝑡 < 𝑥0 = sup 𝐴
sappiamo che 𝑡 non può essere un maggiorante di 𝐴 dunque deve esistere 𝑥 ∈ 𝐴 tale
che 𝑡 < 𝑥 . Ma se 𝑥 ∈ 𝐴 allora 𝑓 (𝑥) < 𝑦0 < 𝑓 (𝑡) che è assurdo in quanto 𝑓 è crescente.

Abbiamo quindi mostrato che 𝑓 (𝑥 0 ) = 𝑦0 . Questo è vero per ogni scelta di 𝑦1 < 𝑦2 in
𝑓 (𝐼) dunque 𝑓 (𝐼) è un intervallo.

Il teorema 2.8 precedente ci permette di affermare che per 𝑎 > 0, 𝑎 ≠ 1 le funzioni exp 𝑎
e log 𝑎 sono continue. Infatti tali funzioni sono bigezioni monotone tra gli intervalli ℝ
e ℝ+ .

Grazie al teorema 2.6 sappiamo che se 𝑛 ∈ ℕ la funzione 𝑥 𝑛 è continua su tutto il suo



dominio ℝ. La funzione inversa 𝑛 𝑥 è anch’essa crescente e bigettiva come funzione
[0 , +∞) → [0, +∞) e dunque anch’essa risulta essere continua. Per simmetria (si veda

l’esercizio 2.9) possiamo concludere che le radici 𝑛 𝑥 sono funzioni continue su tutto
il loro dominio. Anche la funzione 𝑓 (𝑥) = 𝑥 𝛼 , 𝑓 : [0 , +∞) → [0 , +∞] con 𝛼 > 0 è
1
crescente ed è invertibile (l’inversa è 𝑥 𝛼 ) e dunque è surgettiva e continua. Se 𝛼 < 0 la
funzione 𝑓 (𝑥) = 𝑥 𝛼 è definita sull’intervallo (0 , +∞) ed è anch’essa continua in quanto
composizione di funzioni continue: 𝑥 𝛼 = 𝑥 −𝛼 1
.

Esercizio 2.9. Sia 𝑓 : ℝ → ℝ una funzione pari oppure dispari. Se la restrizione di 𝑓


all’intervallo [0 , +∞) è continua allora 𝑓 è continua su tutto ℝ.

2.2 limite di funzione

Se una funzione 𝑓 non è definita in un punto 𝑥 0 non ha senso chiedersi se in tale punto
è continua. Possiamo però chiederci se è possibile definire la funzione anche nel punto
𝑥0 dando un valore opportuno ℓ in modo da rendere 𝑓 continua in quel punto. Se ciò
è possibile diremo che la funzione 𝑓 (𝑥) ha limite ℓ per 𝑥 che tende a 𝑥 0 e scriveremo:

𝑓 (𝑥) → ℓ per 𝑥 → 𝑥 0

(daremo tra poco una definizione con maggiore precisione e generalità).


78 2 funzioni continue, limiti e successioni

Ad esempio la funzione 𝑓 (𝑥) = 𝑥𝑥−−11 è una funzione definita per 𝑥 ≠ 1 e coincide, se


2

𝑥 ≠ 1 con la funzione lineare 𝑓˜(𝑥) = 𝑥 + 1 definita su tutto ℝ. Visto che 𝑓˜ è continua e


𝑓˜(1) = 2 scriveremo:
𝑥2 − 1
→2 per 𝑥 → 1.
𝑥−1

Se estendiamo 𝑓 con un valore ℓ nel punto 𝑥 0 otteniamo in generale la funzione


(
𝑓 (𝑥) se 𝑥 ≠ 𝑥0
𝑓˜(𝑥) =
ℓ se 𝑥 = 𝑥 0

e la continuità di 𝑓˜ nel punto 𝑥 0 si scrive così:

∀𝜀 > 0 : ∃𝛿 > 0 : |𝑥 − 𝑥0 | < 𝛿 =⇒ 𝑓˜(𝑥) − 𝑓˜(𝑥0 ) < 𝜀.


Osserviamo che se 𝑥 = 𝑥 0 allora ovviamente 𝑓˜(𝑥) − 𝑓˜(𝑥 0 ) = 0 < 𝜀 dunque possiamo


supporre, nella condizione precedente, che sia 𝑥 ≠ 𝑥 0 e dunque 𝑓˜(𝑥) = 𝑓 (𝑥). Inoltre
visto che 𝑓˜(𝑥 0 ) = ℓ e 𝑓˜(𝑥) = 𝑓 (𝑥) se 𝑥 ≠ 𝑥 0 , si ottiene la seguente condizione:

∀𝜀 > 0 : ∃𝛿 > 0 : ∀𝑥 ≠ 𝑥0 : |𝑥 − 𝑥0 | < 𝛿 =⇒ | 𝑓 (𝑥) − ℓ | < 𝜀. (2.2)

La (2.2) potrebbe dunque essere utilizzata per definire il concetto di limite 𝑓 (𝑥) → ℓ
per 𝑥 → 𝑥 0 . Sarà però molto utile estendere il concetto di limite 𝑓 (𝑥) → ℓ per 𝑥 → 𝑥 0
anche nei casi in cui ℓ e/o 𝑥 0 possano essere infiniti (cioè elementi dei reali estesi ℝ̄).

Per fare ciò osserviamo che se definiamo 𝐵𝜌 (𝑥 0 ) = {𝑥 ∈ ℝ : |𝑥 − 𝑥 0 | < 𝜌} la condizione


(2.2) può essere scritta anche nella forma

∀𝜀 > 0 : ∃𝛿 > 0 : 𝑥 ∈ 𝐵 𝛿 (𝑥0 ) \ {𝑥0 } =⇒ 𝑓 (𝑥) ∈ 𝐵 𝜀 (ℓ )

che a sua volta si può scrivere nella forma:

∀𝜀 > 0 : ∃𝛿 > 0 : 𝑓 (𝐵 𝛿 (𝑥0 ) \ {𝑥0 }) ⊆ 𝐵 𝜀 (ℓ ).


la lettera 𝐵 sta per ball in quanto più in
generale (se fossimo in ℝ3 invece che in
ℝ) l’insieme dei punti che distano meno L’idea è che gli insiemi del tipo 𝐵𝜌 (𝑥 0 ) rappresentano i punti vicini al punto 𝑥 0 . In
di 𝜌 da un punto fissato è l’interno di analogia potremmo pensare che i punti vicini a +∞ siano i punti di una qualunque
una sfera piena. In geometria una sfera semiretta del tipo (𝑀, +∞]. Si dà quindi la seguente.
piena si chiama palla se contiene solo i
punti interni (e non la superficie sferica)
e si chiama disco o palla chiusa se contiene
anche i punti della superficie.
Definizione 2.10 (intorno). Per 𝑥 ∈ ℝ definiamo la famiglia degli intorni (basilari) di 𝑥
come l’insieme di tutti gli intervallini aperti, simmetrici, centrati in 𝑥 :
intorni

intorni destri/sinistri B𝑥 = {(𝑥 − 𝜀, 𝑥 + 𝜀) : 𝜀 > 0}.

Definiamo poi le famiglie degli intorni destri e intorni sinistri di 𝑥 come

B𝑥 + = {[𝑥, 𝑥 + 𝜀) : 𝜀 > 0}, B𝑥 − = {(𝑥 − 𝜀, 𝑥] : 𝜀 > 0}

e le famiglie degli intorni di +∞ e −∞ come segue

B+∞ = {(𝛼, +∞], : 𝛼 ∈ ℝ}, B−∞ = {[−∞, −𝛽), : 𝛽 ∈ ℝ}.


2.2 limite di funzione 79

Per ogni 𝑥 ∈ ℝ̄ = [−∞, +∞] risultano quindi definiti gli intorni B𝑥 e per ogni 𝑥 ∈ ℝ sono
definiti gli intorni B𝑥 + e B𝑥 − .

Osservazione 2.11. Sarebbe possibile definire in maniera analoga gli intorni dei punti in ℝ𝑛
(per l’analisi di funzioni di più variabili) o in ℂ (per l’analisi complessa). Ma in questo corso
e in questo capitolo in particolare siamo interessati allo studio delle funzioni di una singola
variabile.
Su ℝ c’è una struttura di ordine totale che è utile preservare aggiungendo due punti all’infinito:
+∞ e −∞. Su ℝ𝑛 (e su ℂ, che in questo contesto possiamo identificare con ℝ2 ) non c’è una
struttura d’ordine naturale e quindi usualmente si considera un unico punto all’infinito ∞ i
cui intorni saranno
B∞ = {{𝑥 ∈ ℝ𝑛 : |𝑥| > 𝑅} : 𝑅 > 0}.

Su ℝ𝑛 (e su ℂ) non esiste il concetto di intorno destro e sinistro proprio perché questi concetti
presuppongono un ordinamento.
In certi casi può tornare utile considerare un unico punto all’infinito, denotato con ∞, anche
in ℝ (in molti testi tale punto verrebbe denotato con il simbolo ±∞) e si potrebbero usare le
notazioni +∞ = ∞− e −∞ = ∞+ visto che gli intorni di +∞ e −∞ sono in effetti intorni
unilaterali del punto all’infinito.

Definizione 2.12 (limite di funzione). Sia 𝐴 ⊆ ℝ e 𝑓 : 𝐴 → ℝ. Sia 𝑥 0 ∈ [−∞, +∞] e sia


ℓ ∈ [−∞, +∞]. Allora diremo che la funzione 𝑓 ha limite ℓ per 𝑥 che tende a 𝑥0 e scriveremo
limite di funzione

𝑓 (𝑥) → ℓ per 𝑥 → 𝑥 0

se per ogni intorno di ℓ esiste un intorno di 𝑥 0 tale che la funzione valutata nell’intorno di 𝑥 0 ,
tolto eventualmente 𝑥 0 , assume valori nell’intorno di ℓ :

∀𝑉 ∈ Bℓ : ∃𝑈 ∈ B𝑥0 : 𝑓 (𝑈 \ {𝑥0 }) ⊆ 𝑉. (2.3)

La stessa definizione può essere data restringendosi agli intorni destri/sinistri del punto 𝑥 0
(nel caso 𝑥 0 ∈ ℝ). Si otterranno quindi le definizioni di limite destro e limite sinistro
limite destro/sinistro
semplicemente sostituendo B𝑥0+ o B𝑥0− al posto di B𝑥0 nella definizione precedente. In tal caso
scriveremo 𝑓 (𝑥) → ℓ per 𝑥 → 𝑥 0+ per il limite destro e 𝑓 (𝑥) → ℓ per 𝑥 → 𝑥 0− per il limite
sinistro.
Infine anche il risultato del limite può essere ℓ + o ℓ − , in tal caso useremo Bℓ + o Bℓ − al posto
di Bℓ .

Esempio 2.13. Si consideri la funzione segno:



 1 se 𝑥 > 0 ,


sgn(𝑥) = 0 se 𝑥 = 0 ,

 −1 se 𝑥 < 0.


Si può verificare che
sgn(𝑥) → 1 per 𝑥 → 0+
e
sgn(𝑥) → −1 per 𝑥 → 0−
80 2 funzioni continue, limiti e successioni

Abbiamo già visto che nel caso in cui 𝑥 0 ∈ ℝ e ℓ ∈ ℝ siano entrambi finiti la definizione
di limite 𝑓 (𝑥) → ℓ per 𝑥 → 𝑥 0 si traduce nella condizione (2.2).

Anche negli altri casi esplicitando le definizioni di intorno si possono ottenere delle
condizioni più esplicite. Ad esempio la condizione 𝑓 (𝑥) → −∞ per 𝑥 → 𝑥 0+ si traduce
nel modo seguente:

∀𝛽 ∈ ℝ∃𝛿 > 0 : 𝑥0 < 𝑥 < 𝑥0 + 𝛿 =⇒ 𝑓 (𝑥) < −𝛽.

Visto che ci sono cinque diversi casi per il punto 𝑥 0 : 𝑥 0 ∈ ℝ, 𝑥 0+ , 𝑥 0− , +∞, −∞ e


altrettanti casi per ℓ (in effetti anche il risultato del limite può essere destro o sinistro), si
ottengono in tutto 25 diverse definizioni di limite.

In tutte queste definizioni di limite è sottointeso che i punti 𝑥 che vengono presi in
considerazione sono punti del dominio di 𝑓 : 𝐴 ⊆ ℝ → ℝ. Accade allora che se esiste
un intorno 𝑉 ∈ B𝑥0 per cui 𝐴 ∩ 𝑉 \ {𝑥 0 } è vuoto allora la condizione di limite è vuota
ed è quindi sempre verificata qualunque sia il valore di ℓ . E’ quindi inutile fare il limite
per 𝑥 → 𝑥 0 se 𝑥 0 non soddisfa la seguente.

Definizione 2.14 (punto di accumulazione). Siano 𝐴 ⊆ ℝ un insieme e 𝑥 0 ∈ [−∞, +∞].


punto di accumulazione Diremo che 𝑥 0 è un punto di accumulazione di 𝐴 se ogni intorno di 𝑥 0 contiene punti di 𝐴
diversi da 𝑥 0 , ovvero:
∀𝑈 ∈ B𝑥0 : (𝐴 \ {𝑥}) ∩ 𝑈 ≠ ∅.

Stessa definizione si può dare per 𝑥 0+ e 𝑥 0− utilizzando gli intorni destri/sinistri di 𝑥 0 .

Teorema 2.15 (unicità del limite). Sia 𝐴 ⊆ ℝ, 𝑓 : 𝐴 → ℝ, 𝑥 0 punto di accumulazione per


𝐴 e ℓ1 , ℓ2 ∈ [−∞, +∞]. Se per 𝑥 → 𝑥0 si ha

𝑓 (𝑥) → ℓ1 e 𝑓 (𝑥) → ℓ2

allora ℓ 1 = ℓ 2 .

Risultato analogo si ha per i limiti destro e sinistro: 𝑥 → 𝑥 0+ , 𝑥 → 𝑥 0− .

Dimostrazione. Supponiamo per assurdo che ℓ 1 ≠ ℓ 2 . Allora esiste un intorno 𝑉1


di ℓ 1 ed un intorno 𝑉2 di ℓ 2 tali che 𝑉1 ∩ 𝑉2 = ∅ (basta prendere degli intorni
abbastanza piccoli). Ma per le definizioni di limite 𝑓 (𝑥) → ℓ 1 e 𝑓 (𝑥) → ℓ 2 dovranno
esistere 𝑈1 e 𝑈2 intorni di 𝑥 0 su cui si ha 𝑓 (𝑈1 ) ⊆ 𝑉1 e 𝑓 (𝑈2 ) ⊆ 𝑉2 . Ma allora
𝑓 ((𝐴 \ {𝑥0 }) ∩ 𝑈1 ) ∩ 𝑓 ((𝐴 \ {𝑥0 }) ∩ 𝑈2 ) ⊆ 𝑉1 ∩ 𝑉2 = ∅... e questo è assurdo perché
certamente 𝑈1 ∩ 𝑈2 contiene punti di 𝐴 diversi da 𝑥 0 in quanto 𝑈1 e 𝑈2 sono uno
contenuto nell’altro e 𝑥 0 è un punto di accumulazione per 𝐴.

Il teorema precedente garantisce che se 𝑥 0 è un punto di accumulazione del dominio


di 𝑓 allora il limite per 𝑥 → 𝑥 0 se esiste è unico. In tal caso possiamo dunque dare la
seguente.

Definizione 2.16 (operatore di limite). Sia 𝑓 : 𝐴 ⊆ ℝ → ℝ una funzione e 𝑥 0 un punto di


accumulazione per 𝐴. Se esiste ℓ ∈ [−∞, +∞] tale che 𝑓 (𝑥) → ℓ per 𝑥 → 𝑥 0 allora poniamo

lim 𝑓 (𝑥) = ℓ .
𝑥→𝑥 0
2.2 limite di funzione 81

Lo stesso si può fare per il limite destro 𝑥 → 𝑥 0+ e sinistro 𝑥 → 𝑥 0− .

Abbiamo visto che in un punto di accumulazione se il limite esiste allora è unico. Sarà
però utile osservare che in effetti il limite può non esistere, come si può verificare con
un esempio.

Esempio 2.17 (in generale il limite non esiste). Il limite


𝑥
lim
𝑥→0 |𝑥|

non esiste.

𝑥
Dimostrazione. Osserviamo infatti che la funzione 𝑓 (𝑥) = |𝑥|
vale 1 se 𝑥 > 0 e −1 se
𝑥 < 0. Dunque se il limite esistesse e fosse ℓ ∈ ℝ̄ scelto 𝜀 = 1 dovrebbe esistere un
intervallo intorno di 0 della forma (−𝛿, 𝛿) tale che | 𝑓 (𝑥) − ℓ | < 1 per ogni 𝑥 in tale
intervallo. In particolare siccome in tale intervallo ci sono sicuramente sia numeri
positivi che negativi si dovrà avere contemporaneamente

| 1 − ℓ | < 1, |−1 − ℓ | < 1

che è impossibile in quanto per disuguaglianza triangolare

2 = | 1 − (−1)| ≤ | 1 − ℓ | + |−1 − ℓ | < 1 + 1 = 2

che è assurdo.

Si noti che nell’esempio precedente il limite per 𝑥 → 0 non esiste ma in realtà esistono
sia il limite per 𝑥 → 0+ (vale 1) che i limite per 𝑥 → 0− (vale 0). Possiamo esibire un
esempio “patologico” di funzione che non ammette limite (né da destra né da sinistra)
in nessun punto: (
1 se 𝑥 ∈ ℚ
𝑓 (𝑥) =
0 se 𝑥 ∈ ℝ \ ℚ.

In ogni intervallo (𝑎, 𝑏) con 𝑎 < 𝑏 questa funzione assume sia il valore 0 che il valore 1
in quanto sia ℚ che ℝ \ ℚ intersecano l’intervallo (sono insiemi densi). Ma se 𝑓 avesse
limite ℓ dovrebbe esistere un intervallo in cui i valori distano meno di 𝜀 da ℓ e quindi
dovrebbe essere | 1 − ℓ | < 𝜀 e | 0 − ℓ | < 𝜀 che è impossibile se scegliamo 𝜀 < 21 .

Teorema 2.18 (collegamento tra limiti e continuità). Sia 𝐴 ⊆ ℝ, 𝑓 : 𝐴 → ℝ. Se 𝑥 0 ∈ 𝐴


è un punto di accumulazione di 𝐴 allora 𝑓 è continua in 𝑥 0 se e solo se

lim 𝑓 (𝑥) = 𝑓 (𝑥 0 ).
𝑥→𝑥 0

punto isolato
Se 𝑥 0 ∈ 𝐴 non è punto di accumulazione diremo che 𝑥 0 è un punto isolato di 𝐴. In tal caso la
funzione 𝑓 è sempre continua nel punto 𝑥 0 .

Dimostrazione. In base alla definizione 2.1 la funzione 𝑓 è continua nel punto 𝑥 0 se

∀𝜀 > 0 : ∃𝛿 > 0 : ∀𝑥 ∈ 𝐴 : |𝑥 − 𝑥0 | < 𝛿 =⇒ | 𝑓 (𝑥) − 𝑓 (𝑥 0 )| < 𝜀


82 2 funzioni continue, limiti e successioni

mentre la definizione di limite 𝑓 (𝑥) → 𝑓 (𝑥 0 ) per 𝑥 → 𝑥 0 si espande in

∀𝜀 > 0 : ∃𝛿 > 0 : ∀𝑥 ∈ 𝐴, 𝑥 ≠ 𝑥 0 : |𝑥 − 𝑥0 | < 𝛿 =⇒ | 𝑓 (𝑥) − 𝑓 (𝑥0 )| < 𝜀.

L’unica differenza è che nella definizione di limite c’è la condizione 𝑥 ≠ 𝑥 0 . Ma visto


che per 𝑥 = 𝑥 0 si ha | 𝑓 (𝑥) − 𝑓 (𝑥 0 )| = 0 tale condizione è in questo caso inutile e quindi
le due definizioni sono equivalenti.

Se il punto 𝑥 0 è isolato la definizione di continuità è sempre verificata in quanto esiste


un 𝛿 > 0 tale che il punto 𝑥 = 𝑥 0 è l’unico punto di 𝐴 nell’intorno (𝑥 0 − 𝛿, 𝑥 0 + 𝛿).

Esempio 2.19. Non è difficile convincersi che gli unici punti di accumulazione per l’insieme
ℤ sono +∞ e −∞. Dunque qualunque funzione 𝑓 : ℤ → ℝ è continua in quanto tutti i punti
del suo dominio sono punti isolati.

Teorema 2.20 (località del limite). Il limite di una funzione per 𝑥 → 𝑥 0 dipende solamente
dai valori di 𝑓 in un intorno di 𝑥 0 e non dipende dal valore di 𝑓 in 𝑥 0 .

Più precisamente: se 𝐴, 𝐵 ⊆ ℝ, 𝑥 0 ∈ ℝ sono tali che esiste un intorno 𝑉 di 𝑥 0 per cui


(𝐴 \ {𝑥0 }) ∩ 𝑉 = (𝐵 \ {𝑥 0 }) ∩ 𝑉 e 𝑓 (𝑥) = 𝑔(𝑥) per ogni 𝑥 ∈ (𝐴 \ {𝑥0 }) ∩ 𝑉 allora se
𝑓 (𝑥) → ℓ per 𝑥 → 𝑥0 anche 𝑔(𝑥) → ℓ per 𝑥 → 𝑥0 .

Dimostrazione. Basta osservare che nella definizione di limite non è restrittivo supporre
che l’intorno del punto 𝑥 0 sia sempre preso all’interno dell’intorno 𝑉 su cui le due
funzioni coincidono.

Teorema 2.21 (restrizione del limite). Se una funzione ha limite ℓ per 𝑥 → 𝑥 0 e se


restringiamo l’insieme di definizione della funzione allora il limite della funzione non cambia.
Più precisamente se 𝑓 : 𝐴 → ℝ è una funzione tale che 𝑓 (𝑥) → ℓ per 𝑥 → 𝑥 0 e se 𝐵 ⊆ 𝐴 e
𝑔 : 𝐵 → ℝ è la restrizione di 𝑓 a 𝐵 allora anche 𝑔(𝑥) → ℓ per 𝑥 → 𝑥0 .

Dimostrazione. Il teorema segue immediatamente dalla definizione di limite se si


osserva che restringendo il dominio la condizione di validità del limite si indebolisce
in quanto gli intorni di 𝑥 0 vengono intersecati con il dominio della funzione.

Si osservi che a differenza del teorema sulla località del limite è possibile che la funzione
ristretta 𝑔 abbia limite quando la funzione 𝑓 non aveva limite. Si osservi anche che
in entrambi questi teoremi sarà opportuno che 𝑥 0 sia un punto di accumulazione,
altrimenti la condizione 𝑓 (𝑥) → ℓ risulta essere vuota.

Teorema 2.22 (legame tra limite, limite destro e limite sinistro). Sia 𝐴 ⊆ ℝ, 𝑓 : 𝐴 → ℝ
una funzione e 𝑥 0 un punto di accumulazione di 𝐴. Sia 𝐴+ = 𝐴 ∩ [𝑥 0 , +∞) e 𝐴− =
𝐴 ∩ (−∞, 𝑥0 ].

Se 𝑥 0 è punto di accumulazione sia di 𝐴+ che di 𝐴− allora si ha

lim 𝑓 (𝑥) = ℓ
𝑥→𝑥 0

se e solo se
lim 𝑓 (𝑥) = lim− 𝑓 (𝑥) = ℓ .
𝑥→𝑥 0+ 𝑥→𝑥0
2.2 limite di funzione 83

Se 𝑥 0 è punto di accumulazione di 𝐴+ ma non di 𝐴− allora i limiti

lim 𝑓 (𝑥) e lim 𝑓 (𝑥)


𝑥→𝑥0 𝑥→𝑥 0+

sono equivalenti. Analogamente se 𝑥 0 è punto di accumulazione di 𝐴− ma non di 𝐴+ risultano


equivalenti
lim 𝑓 (𝑥) e lim− 𝑓 (𝑥).
𝑥→𝑥0 𝑥→𝑥0

Dimostrazione. Si tratta semplicemente di verificare le definizioni di limite sfruttando


il fatto che intorni di un punto 𝑥 0 sono formati dall’unione di intorno destro e intorno
sinistro.

Teorema 2.23 (limite della funzione composta/cambio di variabile). Siano 𝐴 ⊆ ℝ, 𝐵 ⊆


ℝ, 𝑥0 un punto di accumulazione di 𝐴, 𝑦0 un punto di accumulazione di 𝐵, ℓ ∈ [−∞, +∞].
Siano 𝑓 : 𝐴 → 𝐵, 𝑔 : 𝐵 → ℝ funzioni tali che 𝑓 (𝑥) ≠ 𝑦0 se 𝑥 ≠ 𝑥 0 e

lim 𝑓 (𝑥) = 𝑦0 , lim 𝑔(𝑦) = ℓ .


𝑥→𝑥0 𝑦→𝑦0

Allora nel secondo limite si può porre 𝑦 = 𝑓 (𝑥) e al posto di 𝑦 → 𝑦0 si può mettere 𝑥 → 𝑥 0
(in quanto il primo limite ci dice che se 𝑥 → 𝑥 0 allora 𝑦 → 𝑦0 ) e dunque vale:

lim 𝑔( 𝑓 (𝑥)) = ℓ .
𝑥→𝑥0

Dimostrazione. Visto che 𝑔(𝑦) → ℓ per ogni 𝑈 intorno di ℓ deve esistere un 𝑉 intorno
di 𝑦0 tale che 𝑔((𝐵 \ {𝑦0 }) ∩ 𝑉) ⊆ 𝑈 e visto che 𝑓 (𝑥) → 𝑦0 deve esistere un intorno
𝑊 di 𝑥0 tale che 𝑓 ((𝐴 \ {𝑥0 }) ∩ 𝑊) ⊆ 𝑉 . Ma visto che per ipotesi 𝑓 assume valori in
𝐵 \ {𝑦0 } si ha anche 𝑓 ((𝐴 \ {𝑥0 }) ∩ 𝑊) ⊆ (𝐵 \ {𝑦0 }) ∩ 𝑉 e quindi

𝑔( 𝑓 ((𝐴 \ {𝑥0 }) ∩ 𝑊)) ⊆ 𝑔((𝐵 \ {𝑦0 }) ∩ 𝑉) ⊆ 𝑈

che significa che 𝑔( 𝑓 (𝑥)) → ℓ .

Esercizio 2.24. Si faccia un esempio di una funzione 𝑓 : ℝ → ℝ e una funzione 𝑔 : ℝ → ℝ


tali che
lim 𝑓 (𝑥) = 0 , lim 𝑔(𝑥) = 0
𝑥→0 𝑥→0
ma
lim 𝑔( 𝑓 (𝑥)) = 1.
𝑥→0

Quale ipotesi nel teorema precedente viene a mancare?

Teorema 2.25 (limite di funzioni monotòne). Sia 𝑓 : 𝐴 ⊆ ℝ → ℝ una funzione crescente.


Se 𝑥 0 è un punto di accumulazione sinistro per 𝐴 il seguente limite esiste e vale

lim 𝑓 (𝑥) = sup 𝑓 ({𝑥 ∈ 𝐴 : 𝑥 < 𝑥 0 })


𝑥→𝑥 0−

e se 𝑥 0 è un punto di accumulazione destro per 𝐴 il seguente limite esiste e vale

lim 𝑓 (𝑥) = inf 𝑓 ({𝑥 ∈ 𝐴 : 𝑥 > 𝑥 0 }).


𝑥→𝑥0+
84 2 funzioni continue, limiti e successioni

In particolare se +∞ è punto di accumulazione per 𝐴 si ha

lim 𝑓 (𝑥) = sup 𝑓 (𝐴)


𝑥→+∞

e se −∞ è punto di accumulazione per 𝐴 si ha

lim 𝑓 (𝑥) = inf 𝑓 (𝐴).


𝑥→−∞

Gli stessi risultati valgono per le funzioni decrescenti, scambiando sup e inf.

Dimostrazione. Supponiamo che 𝑓 sia crescente e consideriamo il limite sinistro 𝑥 →


𝑥0− . Può anche essere 𝑥0 = +∞, in tal caso il limite sinistro 𝑥 → 𝑥0− equivale a
𝑥 → +∞. Poniamo 𝐵 = {𝑥 ∈ 𝐴 : 𝑥 < 𝑥0 } e ℓ = sup 𝑓 (𝐵) e ricordiamo le proprietà che
caratterizzano l’estremo superiore (sappiamo che 𝐵 non è vuoto in quanto 𝑥 0− per
ipotesi è un punto di accumulazione per 𝐴):

∀𝑥 ∈ 𝐵 : 𝑓 (𝑥) ≤ ℓ
∀𝑦 < ℓ : ∃𝛼 ∈ 𝐵 : 𝑓 (𝛼) > 𝑦.

Siccome 𝑓 è crescente, dalla seconda condizione si ottiene che per ogni 𝑥 > 𝛼 si ha
𝑓 (𝑥) ≥ 𝑓 (𝛼) > 𝑦 e mettendo insieme le due condizioni si ottiene che per ogni 𝑦 < ℓ
esiste 𝛼 ∈ ℝ tale che per ogni 𝑥 > 𝛼 si ha 𝑦 < 𝑓 (𝑥) ≤ ℓ . Certamente si ha 𝛼 < 𝑥 0
perché 𝛼 ∈ 𝐵. Dunque la condizione 𝑥 > 𝛼 identifica un intorno sinistro del punto 𝑥 0
e si ha dunque 𝑓 (𝑥) → ℓ per 𝑥 → 𝑥 0− .

Ragionamento analogo si può fare per il limite destro e per le funzioni decrescenti.

Esercizio 2.26. Utilizzando il teorema precedente si studino le discontinuità delle funzioni


monotone. Si dimostri quindi che l’insieme dei punti in cui una funzione monotona non è
continua può essere messo in corrispondenza biunivoca con un sottoinsieme di ℚ e dunque
tale insieme è numerabile.

Il teorema precedente si applica in particolare alle funzioni esponenziali, potenze, radici


e logaritmi negli estremi dei loro domini. Ad esempio è chiaro che se 𝑥 0 ∈ (0 , +∞) si
ha
lim log 𝑎 𝑥 = log 𝑎 𝑥 0
𝑥→𝑥 0

in quanto il logaritmo è una funzione continua. Se 𝑎 > 1 il logaritmo è crescente e la


sua immagine è tutto ℝ dunque si ha

lim log 𝑎 𝑥 = inf ℝ = −∞ lim log 𝑎 𝑥 = sup ℝ = +∞.


𝑥→0+ 𝑥→+∞

Per l’esponenziale avremo


lim 𝑎 𝑥 = 𝑎 𝑥0
𝑥→𝑥 0

se 𝑥 0 ∈ ℝ per continuità. Se 𝑎 > 1 l’esponenziale è crescente ed ha immagine (0 , +∞)


dunque
lim 𝑎 𝑥 = 0 , lim 𝑎 𝑥 = +∞.
𝑥→−∞ 𝑥→+∞
2.2 limite di funzione 85

Se 0 < 𝑎 < 1 i limiti all’infinito si scambiano in quanto 𝑎 𝑥 = 1


𝑎 −𝑥 . Per le potenze avremo,
se 𝑥 0 ∈ [0 , +∞) e 𝛼 > 0
lim 𝑥 𝛼 = 𝑥 0𝛼
𝑥→𝑥 0

per continuità. Invece essendo 𝑥 𝛼 crescente e bigettiva su [0 , +∞) si avrà

lim 𝑥 𝛼 = +∞.
𝑥→+∞

Se 𝛼 < 0 la funzione 𝑥 𝛼 è continua, decrescente e bigettiva su (0 , +∞) e dunque in tal


caso:
lim 𝑥 𝛼 = 0.
𝑥→+∞

Tutti questi limiti notevoli possono essere facilmente ricordati se teniamo in mente i
grafici delle funzioni elementari Figura 1.4 e 1.5.

Anche la funzione valore assoluto 𝑓 (𝑥)|𝑥| è separatamente monotona sugli intervalli


[0 , +∞) e (−∞, 0]. Dunque sappiamo che

lim |𝑥| = |+∞| = +∞, lim |𝑥| = |−∞| = +∞.


𝑥→+∞ 𝑥→−∞

Se 𝑥 0 ∈ ℝ ovviamente si ha pure

lim |𝑥 0 | = |𝑥 0 |
𝑥→𝑥0

in quanto è banale verificare che la funzione |𝑥| è continua.

Ci sarà anche utile osservare che vale anche questa proprietà

lim | 𝑓 (𝑥)| = 0 ⇐⇒ lim 𝑓 (𝑥) = 0


𝑥→𝑥 0 𝑥→𝑥 0

in quanto le definizioni di limite 𝑓 (𝑥) → 0 e | 𝑓 (𝑥)| → 0 coincidono in quanto


| 𝑓 (𝑥) − 0 | = | 𝑓 (𝑥)| − 0 .
permanenza del segno

Teorema 2.27 (permanenza del segno). Se

lim 𝑓 (𝑥) > 0


𝑥→𝑥 0

allora esiste un intorno 𝑈 di 𝑥 0 tale che per ogni 𝑥 ∈ 𝑈 si ha 𝑓 (𝑥) > 0.

Dimostrazione. Sia ℓ ∈ [−∞, +∞] il valore del limite. Se ℓ > 0 esiste certamente un
intorno 𝑈 di ℓ tale che 𝑈 ⊆ (0 , +∞] (se ℓ ∈ ℝ basta prendere (ℓ /2 , 3ℓ /2), se ℓ = +∞
basta prendere (1 , +∞]). Per la definizione di limite esiste 𝑈 intorno di 𝑥 0 tale che
𝑓 (𝑈) ⊆ 𝑉 e il risultato segue.

Teorema 2.28 (operazioni con i limiti di funzione). Se

lim 𝑓 (𝑥) = ℓ 1 , lim 𝑔(𝑥) = ℓ 2


𝑥→𝑥 0 𝑥→𝑥 0
86 2 funzioni continue, limiti e successioni

allora si ha

lim ( 𝑓 (𝑥) + 𝑔(𝑥)) = ℓ 1 + ℓ 2 , lim ( 𝑓 (𝑥) − 𝑔(𝑥)) = ℓ 1 − ℓ 2 ,


𝑥→𝑥 0 𝑥→𝑥 0
𝑓 (𝑥) ℓ1
lim 𝑓 (𝑥) · 𝑔(𝑥) = ℓ 1 · ℓ 2 , lim =
𝑥→𝑥 0 𝑥→𝑥0 𝑔(𝑥) ℓ2

Si veda la sezione 1.17. I casi in cui le sempre che le operazioni utilizzate sul lato destro delle uguaglianze siano state definite. Inoltre
operazioni non sono definite si chiamano se 𝑔(𝑥) → 0+ si ha
usualmente forme indeterminate e sono: 1
+∞ − (+∞), −∞ − (−∞), +∞ + (−∞), lim = +∞
𝑥→𝑥0 𝑔(𝑥)
−∞ + (+∞), 0 · (+∞), +∞ · 0 0 · (−∞),
−∞ · 0, 00 , +∞ −∞ +∞ −∞
+∞ , −∞ , −∞ , +∞ . 1
(moralmente 0+ = +∞).

Dimostrazione. Consideriamo la somma dei limiti e innanzitutto il caso in cui ℓ 1 ed


ℓ2 siano entrambi finiti. In tal caso dato un qualunque intorno 𝑈 = (ℓ − 𝜀, ℓ + 𝜀) se
prendiamo gli intorni 𝑈1 = (ℓ 1 − 𝜀/2 , ℓ 1 + 𝜀/2) e 𝑈2 = (ℓ 2 − 𝜀/2 , ℓ 2 + 𝜀/2) si possono
trovare degli intorni 𝑉1 e 𝑉2 di 𝑥 0 per cui si ha 𝑓 (𝑉1 \ {𝑥 0 }) ⊆ 𝑈1 e 𝑓 (𝑉2 \ {𝑥 0 }) ⊆ 𝑈2
e a maggior ragione questo risulta se prendiamo 𝑉 = 𝑉1 ∩ 𝑉2 al posto di 𝑉1 e 𝑉2 . Visto
che 𝑈1 + 𝑈2 = 𝑈 si avrà allora ( 𝑓 + 𝑔)(𝑉 \ {𝑥 0 }) ⊆ 𝑈 .

Sempre nel caso della somma se ℓ 1 = +∞ e ℓ 2 ≠ −∞ allora ℓ 1 + ℓ 2 = +∞ e dato un


intorno di +∞ della forma 𝑈 = (𝛼, +∞] con 𝛼 > 0 possiamo prendere 𝑈1 = (2 𝛼, +∞)
e 𝑈2 = (ℓ 2 − 𝛼, ℓ 2 + 𝛼) se ℓ 2 ∈ ℝ oppure 𝑈2 = (𝛼, +∞) se ℓ 2 = +∞. In ogni caso si ha
𝑈1 + 𝑈2 = 𝑈 e si procede quindi come nel caso precedente. Il caso ℓ1 = −∞ si dimostra
in maniera del tutto analoga.

Per la differenza basta osservare che 𝑓 (𝑥) − 𝑔(𝑥) = 𝑓 (𝑥) + (−𝑔(𝑥)). Se ℓ 2 è finito la
continuità della funzione ℎ(𝑦) = −𝑦 ci garantisce che −𝑔(𝑥) → −ℓ 2 . Lo stesso si
verifica facilmente quando ℓ 2 è infinito (basta osservare che se 𝑈 = (𝛼, +∞+] è un
intorno di +∞ allora −𝑈 = [−∞, −𝛼) è un intorno di −∞). Dunque il limite della
differenza si riconduce al limite della somma.

Per quanto riguarda il prodotto ci ricordiamo che grazie al teorema 1.69 il gruppo
additivo totalmente ordinato ℝ = (−∞, +∞) è isomorfo al gruppo moltiplicativo
ℝ+ = (0, +∞) e di conseguenza ℝ̄ = [−∞, +∞] corrisponde a [0+ , +∞] (l’isomorfismo
ℝ+ → ℝ è dato dalla funzione log𝑎 𝑥 con 𝑎 > 1 fissato, tale funzione preserva gli
intorni dei punti corrispondenti salvo il fatto che gli intorni di −∞ si trasformano in
intorni destri di 0).

Dunque se 𝑓 > 0 e 𝑔 > 0 i risultati per il limite del prodotto sono conseguenza dei
risultati analoghi per il limite della somma. Cambiando segno ad una delle due
funzioni o ad entrambe ci si può ricondurre al caso 𝑓 > 0 e 𝑔 > 0 quando le due
funzioni assumono un segno costante in almeno un intorno del punto 𝑥 0 . Per il teorema
della permanenza del segno questo è vero se ℓ 1 ≠ 0 e ℓ 2 ≠ 0: il limite del prodotto
in questo caso è dunque ℓ 1 · ℓ 2 . Se invece ℓ 1 = 0 e ℓ 2 ∈ ℝ sappiamo che 𝑓 (𝑥) → 0 è
equivalente a | 𝑓 (𝑥)| → 0 dunque in tal caso si può rimpiazzare 𝑓 (𝑥) con | 𝑓 (𝑥)| ≥ 0
(gli eventuali punti in cui 𝑓 (𝑥) = 0 sono irrilevanti e possono essere tolti dal dominio
di 𝑓 per garantire | 𝑓 | > 0) e ottenere che il limite del prodotto è 0. Lo stesso accade se
ℓ2 = 0 con la funzione 𝑔(𝑥).

Per quanto riguarda il rapporto il teorema 1.69 ci dice che le proprietà additive
dell’opposto diventano (tramite logaritmo) proprietà moltiplicative del reciproco,
2.2 limite di funzione 87

almeno se siamo nell’ambito di numeri positivi. Dunque se 𝑓 (𝑥) → ℓ con ℓ > 0 allora
1
𝑓 (𝑥)
→ ℓ1 . Se ℓ = 0 non possiamo concludere niente in quanto le proprietà additive a
−∞ si rispecchiano nelle proprietà moltiplicative in 0+ , non in 0. Dunque i risultati sul
limite del rapporto discendono dai risultati sul limite del prodotto con il reciproco.

Se dobbiamo calcolare un limite in cui compare un elevamento a potenza 𝑓 (𝑥) 𝑔(𝑥) con
base ed esponente variabile converrà scrivere

𝑓 (𝑥) 𝑔(𝑥) = 𝑎 𝑔(𝑥)·log𝑎 𝑓 (𝑥)

per poter applicare il teorema precedente al prodotto 𝑔(𝑥) · log 𝑎 𝑓 (𝑥).

Esempio 2.29. Si calcoli


2 + 𝑥2 − 𝑥3
lim .
𝑥→+∞ (𝑥 2 − 𝑥 + 2)2

Svolgimento. Per 𝑥 → +∞ per il teorema sul limite del prodotto sappiamo che
𝑥 2 → +∞ e 𝑥 3 → +∞. Per il teorema sulla somma dei limiti sappiamo che 2 +𝑥 2 → +∞
ma a priori non possiamo applicare tale teorema al limite di (2 + 𝑥 2 ) − 𝑥 3 in quanto
(+∞) − (+∞) è una forma indeterminata (non rientra nelle ipotesi di quel teorema).
Bisogna allora intuire che le potenze di 𝑥 con esponente maggiore sono preponderanti
e vanno quindi messe in evidenza tramite manipolazioni algebriche. L’espressione di
cui vogliamo calcolare il limite si può quindi riscrivere in questo modo:
 
2+𝑥 −𝑥2 3 𝑥3 2
𝑥3
+ 1
𝑥 −1 1
2
+ 1
−1
𝑥3 𝑥
(𝑥 2 − 𝑥 + 2)2
=  2 = 𝑥 ·  2 .
𝑥4 1− 1
𝑥 + 2
𝑥2
1− 1
𝑥 + 2
𝑥2

A questo punto l’espressione non presenta più forme indeterminate. Applicando i


teoremi precedenti possiamo allora affermare che si ha

2 1 2 1
1 + 𝑥 −1 1 (+∞)3
+ +∞ −1
𝑥3
lim ·   2 = +∞ · 
𝑥→+∞ 𝑥
2
1 2 1 2
1− 𝑥 + 𝑥2
1− +∞ + (+∞)2
0+0−1
=0· = 0 · (−1) = 0.
(1 − 0 + 0)2

L’aver definito le operazioni sulle quantità infinite risulta in effetti comodo nello
svolgimento dei limiti. Bisogna però essere consapevoli che ℝ̄ non è un campo e quindi
le operazioni con i simboli +∞ e −∞ non rispettano molte delle regole che siamo
abituati ad avere sui numeri finiti. Sarà quindi opportuno ricondursi immediatamente
ad una espressione che abbia senso in ℝ, sulla quale potremo applicare le manipolazioni
algebriche con più tranquillità. Per questo motivo in molti testi l’espressione intermedia
in cui compaiono le operazioni eseguite sulle quantità +∞ e −∞ non è ritenuta valida
e si preferisce scrivere direttamente il risultato.
88 2 funzioni continue, limiti e successioni

Esempio 2.30. Si calcoli il seguente limite nel campo complesso:


 
1 1
lim − 2 .
𝑧→0 𝑧 𝑧 −𝑧

Dimostrazione. Anche in questo caso non possiamo applicare direttamente le regole


di calcolo del limite in quanto otterremmo la forma indeterminata ∞ − ∞. Possiamo
però operare una semplice manipolazione algebrica per eliminare l’indeterminazione:

1 1 𝑧−1−1 𝑧−2 0−2 −2


− = 2 = 2 → 2 = =∞ per 𝑧 → 0.
𝑧 𝑧2 − 𝑧 𝑧 −𝑧 𝑧 −𝑧 0 −0 0

2.3 proprietà frequenti e definitive

Definizione 2.31 (proprietà frequenti e definitive). Diremo che un predicato 𝑃(𝑥) definito
definitivamente
su un insieme 𝐴 ⊆ ℝ di cui 𝑥 0 è punto di accumulazione vale definitivamente per 𝑥 → 𝑥 0 se
vale in un intorno di 𝑥 0 ovvero:

∃𝑈 ∈ B𝑥0 : ∀𝑥 ∈ 𝐴 ∩ 𝑈 \ {𝑥0 } : 𝑃(𝑥).

frequentemente
Diremo che 𝑃(𝑥) vale frequentemente per 𝑥 → 𝑥 0 se in ogni intorno di 𝑥 0 c’è almeno un
punto 𝑥 ≠ 𝑥 0 in cui vale:

∀𝑈 ∈ B𝑥0 : ∃𝑥 ∈ 𝐴 ∩ 𝑈 \ {𝑥0 } : 𝑃(𝑥).

Chiaramente se una proprietà vale definitivamente vale anche frequentemente infatti


se c’è un intorno 𝑈 su cui vale la proprietà per ogni altro intorno 𝑉 la proprietà risulta
valida su 𝑈 ∩ 𝑉 che non è mai vuoto. Se una proprietà vale frequentemente significa
in particolare che vale per infiniti valori diversi in quanto se vale in punto 𝑥 ≠ 𝑥 0
posso sempre trovare un intorno 𝑉 di 𝑥 0 che non contiene 𝑥 e in tale intorno trovo un
ulteriore punto in cui vale la proprietà. Iterando il procedimento posso trovare infiniti
punti diversi su cui la proprietà è valida.
Le due proprietà sono complementari nel senso che in base alle proprietà dei
quantificatori logici vale la seguente relazione:

non frequentemente 𝑃(𝑥) ⇐⇒ definitivamente non 𝑃(𝑥)

Se due proprietà 𝑃(𝑥) e 𝑄(𝑥) valgono definitivamente allora anche 𝑃(𝑥) ∧ 𝑄(𝑥) vale
definitivamente. Se invece valgono entrambe frequentemente allora anche 𝑃(𝑥) ∨ 𝑄(𝑥)
vale frequentemente.

Esempio 2.32. La proprietà 𝑥 3 − 𝑥 > 1000 𝑥 2 + 1 vale definitivamente per 𝑥 → +∞. La


proprietà 𝑥 > 0 vale frequentemente per 𝑥 → 0.

La definizione di limite 𝑓 (𝑥) → ℓ per 𝑥 → 𝑥 0 potrebbe quindi enunciarsi così: per


ogni intorno 𝑈 di ℓ si ha 𝑓 (𝑥) ∈ 𝑈 definitivamente. E la sua negazione è: esiste un
intorno 𝑈 di ℓ per cui frequentemente 𝑓 (𝑥) ∉ 𝑈 .
2.4 criteri di confronto 89

2.4 criteri di confronto

Teorema 2.33 (criteri di confronto). Siano 𝑓 , 𝑔 , ℎ tre funzioni reali definite su uno stesso Non è possibile fare confronti tra va-
lori complessi, visto che sui numeri
dominio 𝐴 ⊆ ℝ con punto di accumulazione 𝑥 0 complessi non abbiamo un ordinamento

1. Se per ogni 𝑥 ∈ 𝐴 si ha confronto tra limiti


𝑓 (𝑥) ≤ 𝑔(𝑥)
e se entrambe le funzioni ammettono limite: 𝑓 (𝑥) → ℓ 1 e 𝑔(𝑥) → ℓ 2 per 𝑥 → 𝑥 0 allora

ℓ1 ≤ ℓ2 .

2. Se per ogni 𝑥 ∈ 𝐴 si ha:


𝑓 (𝑥) ≤ 𝑔(𝑥)
e se 𝑓 (𝑥) → +∞ allora anche 𝑔(𝑥) → +∞ per 𝑥 → 𝑥 0 . Viceversa se 𝑓 (𝑥) ≤ 𝑔(𝑥) e
𝑔(𝑥) → −∞ allora anche 𝑓 (𝑥) → −∞.
3. (teorema dei carabinieri) Se per ogni 𝑥 ∈ 𝐴 vale teorema dei carabinieri

𝑓 (𝑥) ≤ ℎ(𝑥) ≤ 𝑔(𝑥)

e se le due funzioni 𝑓 e 𝑔 hanno lo stesso limite: 𝑓 (𝑥) → ℓ e 𝑔(𝑥) → ℓ per 𝑥 → 𝑥 0


allora anche ℎ(𝑥) → ℓ .

Dimostrazione. 1. Se per assurdo fosse ℓ 1 > ℓ 2 la funzione 𝑓 (𝑥) − 𝑔(𝑥) avrebbe


limite positivo e per il teorema della permanenza del segno dovrebbe essere
definitivamente positiva. Ma questo contraddice l’ipotesi 𝑓 (𝑥) − 𝑔(𝑥) ≤ 0.
2. Se non fosse 𝑔(𝑥) → +∞ significa che esiste 𝛼 ∈ ℝ tale che 𝑔(𝑥) < 𝛼 frequente-
mente. Ma visto che definitivamente 𝑓 (𝑥) > 𝛼 troviamo che frequentemente si
ha 𝑓 (𝑥) > 𝑔(𝑥) in contrasto con l’ipotesi 𝑓 (𝑥) ≤ 𝑔(𝑥).
3. Se 𝑓 e 𝑔 hanno lo stesso limite ℓ significa che per ogni 𝑈 intorno di ℓ si ha
definitivamente 𝑓 (𝑥) ∈ 𝑈 e 𝑔(𝑥) ∈ 𝑈 . Visto che 𝑈 è un intervallo anche ℎ(𝑥) è
definitivamente in 𝑈 e quindi ℎ(𝑥) → ℓ .

Esempio 2.34. Dimostrare che

lim (2 𝑥 − ⌊𝑥⌋) = +∞.


𝑥→+∞

Svolgimento. Sappiamo che ⌊𝑥⌋ ≤ 𝑥 dunque

2 𝑥 − ⌊𝑥⌋ ≥ 2 𝑥 − 𝑥 = 𝑥 → +∞.

Dunque per confronto si ottiene il risultato richiesto.

Corollario 2.35 (limitata per infinitesima). Se 𝑓 (𝑥) è una funzione limitata e 𝑔(𝑥) → 0
per 𝑥 → 𝑥 0 allora anche

𝑓 (𝑥) · 𝑔(𝑥) → 0 per 𝑥 → 𝑥 − 0.


90 2 funzioni continue, limiti e successioni

Dimostrazione. Se 𝑓 è limitata significa che esiste 𝑅 > 0 tale che | 𝑓 (𝑥)| ≤ 𝑅 per ogni 𝑥
nel dominio di 𝑓 . Ma allora

0 ≤ | 𝑓 (𝑥) · 𝑔(𝑥)| = | 𝑓 (𝑥)| · | 𝑔(𝑥)| ≤ 𝑅| 𝑔(𝑥)| → 𝑅 · 0 = 0.

Per confronto deduciamo che | 𝑓 (𝑥) · 𝑔(𝑥)| → 0 che è equivalente alla tesi.

Esercizio 2.36. Mostrare che


𝑥 − ⌊𝑥⌋
lim = 0.
𝑥→+∞ 𝑥

2.5 successioni
successione

Una successione in un insieme 𝑋 è una funzione 𝒂 : ℕ → 𝑋 . L’insieme delle funzioni


ℕ → 𝑋 viene usualmente indicato con 𝑋 ℕ e potremmo dunque scrivere 𝒂 ∈ 𝑋 ℕ .
Utilizziamo il grassetto per evidenziare
il fatto che 𝒂 non è un numero ma una In effetti una successione 𝒂 può essere interpretata come una sequenza infinita di
lista (o vettore) di numeri. Nella scrittura elementi di 𝑋 :
a mano non è possibile usare il grassetto, 𝒂 = (𝑎0 , 𝑎1 , 𝑎2 , . . . , 𝑎 𝑛 , . . . )
ma potremmo sottolineare il nome della
variabile scrivendo 𝑎 invece che 𝒂 . In dove si intende

alternativa si potrebbe scrivere 𝑎 oppure 𝑎 𝑛 = 𝒂(𝑛).
evitare qualunque distinzione e scrivere
più semplicemente 𝑎 . Le componenti 𝑎 𝑛 si chiamano termini della successione. I numeri 𝑛 si chiamano,
invece, indici. L’intera successione 𝒂 può essere indicata con (𝑎 𝑛 )∞𝑛=0 oppure (𝑎 𝑛 )𝑛
oppure, più semplicemente, con 𝑎 𝑛 quando sia chiaro che si intende l’intera successione
𝒂 e non un singolo termine della stessa.

Per noi il caso più interessante sarà quello delle successioni reali 𝑎 𝑛 ∈ ℝ cioè il caso
In alcuni testi le successioni vengono 𝑋 = ℝ. Considereremo però anche il caso di successioni complesse 𝑎 𝑛 ∈ ℂ (dunque
indicate con la notazione {𝑎 𝑛 } che però 𝑋 = ℂ) perché questo potrà essere utile in alcune situazioni.
è fuorviante in quanto una successione in
𝑋 non è semplicemente un sottoinsieme
di 𝑋 : l’ordine in cui vengono presi gli
elementi è rilevante.
2.6 limite di successione

Visto che 𝒂 : ℕ → ℝ (o in ℂ) è una funzione con dominio ℕ ⊆ ℝ e visto che +∞ è


l’unico punto di accumulazione di ℕ sarà possibile considerare il limite

ℓ = lim 𝒂(𝑛)
𝑛→+∞

che potremmo anche scrivere con una delle seguenti notazioni:

ℓ = lim 𝒂 = lim 𝑎 𝑛 = lim 𝑎 𝑛


𝑛 𝑛→+∞

o più concisamente:
𝑎𝑛 → ℓ .

Esplicitando la definizione astratta di limite osserviamo che se (𝛼, +∞] è un intorno


di +∞ con 𝛼 > 0 la sua intersezione con ℕ (il dominio della funzione) è l’insieme
2.6 limite di successione 91

{𝑛 ∈ ℕ : 𝑛 > 𝑁 } dove 𝑁 = ⌈𝛼⌉ è un numero naturale. Dunque se ℓ ∈ ℝ la condizione


𝑎 𝑛 → ℓ si esplicita nel modo seguente:

∀𝜀 > 0 : ∃𝑁 ∈ ℕ : 𝑛 > 𝑁 =⇒ |𝑎 𝑛 − ℓ | < 𝜀. (2.4)

La condizione 𝑎 𝑛 → +∞ si scrive

∀𝛼 ∈ ℝ : ∃𝑁 ∈ ℕ : 𝑛 > 𝑁 =⇒ 𝑎 𝑛 > 𝛼

e infine 𝑎 𝑛 → −∞ diventa

∀𝛼 ∈ ℝ : ∃𝑁 ∈ ℕ : 𝑛 > 𝑁 =⇒ 𝑎 𝑛 < −𝛼.

Definizione 2.37 (carattere di una successione). Sia 𝑎 𝑛 una successione a valori reali o
complessi e si consideri il limite
lim 𝑎 𝑛 .
𝑛

Se tale limite esiste diremo che la successione 𝑎 𝑛 è regolare, se il limite esiste ed è finito diremo regolare
che la successione è convergente se il limite è infinito diremo che la successione è divergente se convergente
il limite non esiste diremo infine che la successione è indeterminata.
divergente
Abbiamo dunque le seguenti alternative
indeterminata

1. la successione è convergente (ha limite finito);


2. la successione è divergente (ha limite infinito);
3. la successione è indeterminata (non ha limite). carattere di una successione

Determinare il carattere di una successione significa specificare a quale delle tre categorie
appartiene.

Esercizio 2.38. Una successione complessa 𝑧 𝑛 ∈ ℂ potrà essere scritta nella forma 𝑧 𝑛 =
𝑥 𝑛 + 𝑖 𝑦𝑛 dove 𝑥 𝑛 e 𝑦𝑛 sono successioni reali. Si può allora verificare che 𝑧 𝑛 → 𝑧 per 𝑧 ∈ ℂ
se e solo se 𝑥 𝑛 → 𝑥 e 𝑦𝑛 → 𝑦 dove 𝑧 = 𝑥 + 𝑖 𝑦 con 𝑥, 𝑦 ∈ ℝ.

Si faccia attenzione al fatto che una successione 𝑎 𝑛 ∈ ℝ ⊆ ℂ può essere interpretata sia
come successione reale che come successione complessa. Le condizioni di convergenza
in ℝ o ℂ sono allora equivalenti. Ma se 𝑎 𝑛 → ∞ (in ℂ̄) significa che |𝑎 𝑛 | → +∞ e può
capitare che 𝑎 𝑛 non abbia limite né +∞ né −∞ in quanto potrebbe frequentemente
cambiare di segno (un esempio è 𝑎 𝑛 = (−𝑛)𝑛 ).

In generale potremmo avere delle successioni definite solamente su un sottoinsieme ℕ


dei numeri naturali. Finché la successione è definita in un intorno di +∞ (cioè da un
certo 𝑛0 in poi) questo non ha nessuna conseguenza sul limite per 𝑛 → +∞ (grazie
alla località del limite, teorema 2.20).

Esempio 2.39. La successione 𝑎 𝑛 = 1/𝑛 è definita per 𝑛 ∈ ℕ ma 𝑛 ≠ 0. Ciò non toglie che
possiamo studiarne il limite come qualunque altra successione. Per evidenziare il fatto che il
primo indice è 𝑛 = 1 si potrà usare la notazione (𝑎 𝑛 )∞
𝑛=1 .
92 2 funzioni continue, limiti e successioni

2.7 successioni limitate

Se abbiamo una successione 𝑎 𝑛 reale possiamo anche considerare gli operatori:

sup 𝑎 𝑛 , inf 𝑎 𝑛 , max 𝑎 𝑛 , min 𝑎 𝑛


𝑛 𝑛 𝑛 𝑛

che sono definiti come per qualunque altra funzione. Sappiamo che sup e inf esistono
sempre (in ℝ̄) mentre max e min potrebbero non esistere.

Anche il concetto di limitatezza per una successione è ereditato dallo stesso concetto
valido per le funzioni. Una successione 𝑎 𝑛 (a valori reali o complessi) si dice essere
limitata limitata se l’insieme {|𝑎 𝑛 | : 𝑛 ∈ ℕ } è limitato. Cioè se

sup |𝑎 𝑛 | < +∞.


𝑛

illimitata In caso contrario la successione si dice essere illimitata. Queste definizioni si applicano
tali e quali alle successioni di numeri complessi (rimpiazzando il valore assoluto con il
modulo).

Se la successione ha valori reali potremo anche parlare di limitatezza superiore quando


sup 𝑎 𝑛 < +∞ e limitatezza inferiore quando inf 𝑎 𝑛 > −∞.

Esempio 2.40. Si consideri 𝑎 𝑛 = 1


𝑛+1 definita per 𝑛 ∈ ℕ . Allora

sup 𝑎 𝑛 = max 𝑎 𝑛 = 1 , inf 𝑎 𝑛 = 0 , non esiste min 𝑎 𝑛 .

Dimostrazione. Per ogni 𝑛 ∈ ℕ si ha 𝑛 + 1 ≥ 1 e quindi 𝑎 𝑛 = 1/(𝑛 + 1) ≤ 1. Visto poi


che 𝑎 0 = 1 si ottiene immediatamente che max 𝑎 𝑛 = 1 e di conseguenza sup 𝑎 𝑛 = 1.

Per verificare che inf 𝑎 𝑛 = 0 dobbiamo verificare innanzitutto che 0 è minorante, e


questo è vero in quanto 𝑎 𝑛 = 1/(𝑛 + 1) > 0 essendo 𝑛 + 1 ≥ 1 ≥ 0. Inoltre dobbiamo
verificare che per ogni 𝜀 > 0 esiste 𝑛 ∈ ℕ tale che 𝑎 𝑛 < 0 + 𝜀 = 𝜀. Questo succede
se 1/(𝑛 + 1) < 𝜀 ovvero se 𝑛 > 1/𝜀 − 1 ad esempio per 𝑛 = ⌈1/𝜀⌉ . Abbiamo dunque
verificato che inf 𝑎 𝑛 = 0. Il minimo di 𝑎 𝑛 non esiste perché se esistesse dovrebbe essere
uguale all’estremo inferiore cioè dovrebbe essere 0. Ma questo è impossibile perché
per ogni 𝑛 ∈ ℕ si ha 𝑎 𝑛 = 1/(𝑛 + 1) ≠ 0.

Visto che l’insieme ℕ su cui sono definite le successioni ha un unico punto di


accumulazione +∞ se la successione è convergente non potrà essere illimitata, come
viene espresso nel seguente.

Teorema 2.41 (limitatezza delle successioni convergenti). Se una successione (reale o


complessa) è convergente allora è anche limitata. Se una successione reale diverge a +∞ allora
è inferiormente limitata, se diverge a −∞ è superiormente limitata.

Dimostrazione. Per la definizione di limite (2.4) se 𝑎 𝑛 → ℓ con ℓ finito sappiamo che


scelto 𝜀 = 1 dovrà esistere 𝑁 ∈ ℕ tale che

∀𝑛 > 𝑁 : |𝑎 𝑛 − ℓ | < 1.
2.8 successioni monotòne 93

Osserviamo ora che gli indici 𝑛 per cui 𝑛 ≤ 𝑁 sono in numero finito (in effetti sono
𝑁 + 1) e quindi esiste

𝑀 = max |𝑎 𝑛 | = max {|𝑎 0 |, |𝑎1 |, . . . , |𝑎 𝑁 |}.


𝑛≤𝑁

Dunque scelto 𝑅 = max {|ℓ | + 1 , 𝑀} se 𝑛 ≤ 𝑁 si ha certamente |𝑎 𝑛 | ≤ 𝑀 ≤ 𝑅 e se


𝑛 > 𝑁 si ha comunque, per disuguaglianza triangolare,

|𝑎 𝑛 | ≤ |𝑎 𝑛 − ℓ | + |ℓ | = 1 + ℓ ≤ 𝑅.

Dunque nel complesso risulta sup𝑛 |𝑎 𝑛 | ≤ 𝑅 e la successione è limitata.

Se 𝑎 𝑛 → +∞ per la definizione di limite scelto (0 , +∞] come intorno di +∞ deve esistere


in indice 𝑁 ∈ ℕ tale che se 𝑛 > 𝑁 si ha 𝑎 𝑛 > 0. Ma allora posto 𝑅 = min {0 , 𝑎 0 , . . . , 𝑎 𝑁 }
si avrà 𝑎 𝑛 ≥ 𝑅 per ogni 𝑛 ∈ ℕ e dunque la successione risulta essere inferiormente
limitata.

Dimostrazione analoga si fa nel caso 𝑎 𝑛 → −∞.

2.8 successioni monotòne

Le successioni sono funzioni ℕ → ℝ e dunque si applicano le definizioni 1.68 per


classificare le successioni in base alla monotonia. Per le successioni, tuttavia, si possono
dare delle definizioni equivalenti utilizzando il principio di induzione, come viene
esplicitato nel seguente teorema.

Teorema 2.42 (successioni monotòne). Una successione 𝑎 𝑛 è

1. crescente: se per ogni 𝑛 ∈ ℕ si ha 𝑎 𝑛+1 ≥ 𝑎 𝑛 ;


2. decrescente: se per ogni 𝑛 ∈ ℕ si ha 𝑎 𝑛+1 ≤ 𝑎 𝑛 ;
3. strettamente crescente: se per ogni 𝑛 ∈ ℕ si ha 𝑎 𝑛+1 > 𝑎 𝑛 ;
4. strettamente decrescente: se per ogni 𝑛 ∈ ℕ si ha 𝑎 𝑛+1 < 𝑎 𝑛 ;

Dimostrazione. Consideriamo ad esempio la prima condizione (funzione crescente).


Ovviamente se 𝑎 𝑛 è crescente si ha 𝑎 𝑛+1 ≥ 𝑎 𝑛 in quanto 𝑛 + 1 > 𝑛 . Viceversa
supponiamo che per ogni 𝑛 ∈ ℕ si abbia 𝑎 𝑛+1 ≥ 𝑎 𝑛 . Allora chiaramente 𝑎 1 ≥ 𝑎 0 ,
𝑎 2 ≥ 𝑎 1 ≥ 𝑎0 , 𝑎3 ≥ 𝑎2 ≥ 𝑎1 ≥ 𝑎0 ... Per induzione si può quindi dimostrare che
𝑎 𝑛 ≥ 𝑎 𝑛−1 ≥ · · · ≥ 𝑎2 ≥ 𝑎1 .

Gli altri casi si svolgono in maniera analoga.

Esempio 2.43. La successione 𝑎 𝑛 = 𝑛 ! è crescente in quanto per ogni 𝑛 si ha (𝑛 + 1)! =


(𝑛 + 1) · 𝑛 ! ≥ 𝑛 !.

Il teorema 2.25 ci assicura che una successione monotona ha sempre limite. Infatti il
limite per 𝑛 → +∞ è un limite sinistro. In particolare se 𝑎 𝑛 è crescente si ha

lim 𝑎 𝑛 = sup 𝑎 𝑛
𝑛 𝑛
94 2 funzioni continue, limiti e successioni

mentre se 𝑎 𝑛 è decrescente si ha

lim 𝑎 𝑛 = inf 𝑎 𝑛 .
𝑛 𝑛

2.9 la costante di Nepero

crescita esponenziale La funzione esponenziale è legata ad un modello di crescita che si trova spesso in
natura: la crescita esponenziale. Prendiamo come esempio una popolazione di batteri
che cresce senza limitazioni di spazio e di nutrimento oppure pensiamo alla crescita di
un capitale dovuto ad una rendita finanziaria.

Supponiamo che una popolazione che al tempo 𝑡0 = 0 ammonta ad un certo numero


𝑐 di batteri, al tempo 𝑡 > 0 raggiunga una numerosità 𝑞(𝑡, 𝑐). Se lascio crescere la
popolazione per un ulteriore tempo 𝑠 > 0 troverò al tempo 𝑡 + 𝑠 la stessa popolazione
che avrei al tempo 𝑠 se al tempo zero fossi partito con la popolazione 𝑞(𝑡):

𝑞(𝑡 + 𝑠, 𝑐) = 𝑞(𝑠, 𝑞(𝑡, 𝑐)).

L’equazione precedente si chiama proprietà di semigruppo continuo. Ma fissato 𝑡


la popolazione 𝑞(𝑡, 𝑐) deve essere proporzionale a 𝑐 perché ogni batterio ha la sua
discendenza indipendentemente dalla numerosità totale della popolazione. In pratica
si deve avere 𝑞(𝑡, 𝑐) = 𝑘(𝑡) · 𝑐 per una opportuna funzione 𝑘(𝑡) che non dipende da 𝑐 .
Dunque
𝑞(𝑡 + 𝑠, 𝑐) = 𝑞(𝑠, 𝑞(𝑡, 𝑐)) = 𝑘(𝑠) · 𝑞(𝑡, 𝑐) = 𝑘(𝑠) · 𝑘(𝑡) · 𝑐
da cui
𝑘(𝑡 + 𝑠) = 𝑘(𝑠) · 𝑘(𝑡).
In base al teorema 1.69 possiamo affermare che 𝑘(𝑡) è una funzione esponenziale
𝑘(𝑡) = 𝑎 𝑡 per una qualche costante 𝑎 . La costante 𝑎 può essere determinata mediante
la formula:
𝑞(1, 𝑐)
𝑎 = 𝑘(1) =
𝑐

𝑒𝑞
𝑞 𝑛
1+ 𝑛
..
.
𝑞 3
1+ 𝑛
Figura 2.1: L’interesse composto. Se di- 𝑞 2
vidiamo l’intervallo [0 , 1] in 𝑛 parti (in 1+ 𝑛 𝑞
figura 𝑛 = 5), al passo zero partiamo 1+ 𝑛
con un capitale pari ad 1 e ad ogni passo 1
di ampiezza 𝑛1 moltiplichiamo il nostro
𝑞
capitale per 1 + 𝑛 (supponendo di avere
un interesse pari a 𝑞 che nel tempo 𝑛1 ci
𝑞
paga quindi 𝑛 volte il nostro capitale).
Dopo 𝑛 passi, cioè al tempo 1, avremo

𝑞 𝑛
 1 2 3 ... 1
un capitale pari a 1 + 𝑛 . Se 𝑛 → +∞ 𝑛 𝑛 𝑛
questa quantità tende 𝑞
ad 𝑒 .
2.9 la costante di Nepero 95

ma questa espressione non ha un preciso significato fisico in quanto dipende dall’unità


di tempo scelta.

La costante a cui possiamo dare significato è invece l’aumento relativo istantaneo della
popolazione. Possiamo infatti supporre che se lasciamo la popolazione crescere per
un tempo Δ𝑡 molto piccolo, si otterrà un aumento di popolazione proporzionale al
tempo Δ𝑡 (stiamo qui anticipando il concetto di derivata) e alla popolazione:

𝑞(Δ𝑡, 𝑐) = 𝑐 + 𝑟𝑐Δ𝑡 = (1 + 𝑟Δ𝑡)𝑐. (2.5)

La costante 𝑟 rappresenta quindi l’aumento relativo istantaneo della popolazione (nel


caso dell’investimento 𝑟 sarebbe il tasso di interesse istantaneo). Questa definizione ha
senso quando Δ𝑡 è piccolo in quanto non tiene conto del fatto che nell’intervallo di
tempo [𝑡, 𝑡 + Δ𝑡] la popolazione che si è aggiunta genera anch’essa nuova popolazione In effetti la scoperta della costante 𝑒 è do-
(ovvero l’interesse accumulato genera anch’esso interesse). vuta a Jacob Bernoulli nel 1683. Bernoulli
si chiedeva qual è l’interesse annuo effet-
tivo che si ottiene da un capitale che dia
una rendita giornaliera (interesse com-
Per calcolare l’aumento della popolazione su tempi “grandi” possiamo suddividere
posto). Se un capitale è investito ad un
gli intervalli temporali in 𝑛 intervallini di ampiezza Δ𝑡 e applicare in ognuno di essi la tasso di interesse 𝑟 , si intende che ogni
relazione (2.5). Si trova: giorno il capitale viene aumentato di un
fattore 1 + 𝑟/365 e quindi dopo un anno
𝑞(Δ𝑡, 𝑐) = 𝑐(1 + 𝑟Δ𝑡) il fattore moltiplicativo è (1 + 𝑟/365)365 .

𝑞(2Δ𝑡, 𝑐) = 𝑞(Δ𝑡, 𝑐)(1 + 𝑟Δ𝑡) = 𝑐(1 + 𝑟Δ𝑡)2


..
.
𝑞(𝑛Δ𝑡) = 𝑐(1 + 𝑟Δ𝑡)𝑛 .

Dunque, ponendo Δ𝑡 = 𝑡/𝑛 si ha


𝑛
𝑡

𝑞(𝑡, 𝑐) = 𝑐 1 + 𝑟
𝑛

in particolare per 𝑡 = 1/𝑟 si ottiene:


 𝑛
1
𝑞(1/𝑟, 𝑐) = 𝑐 1 +
𝑛

e ricordando che 𝑞(𝑡, 𝑐) = 𝑐𝑎 𝑡 otteniamo:


 𝑛
1 1
𝑎𝑟 = 1+ .
𝑛

Se per 𝑛 → +∞ (che corrisponde a Δ𝑡 → 0) la quantità sul lato destro tende ad un


numero 𝑒 (che chiameremo costante di Nepero) avremo allora

𝑎 = 𝑒𝑟 , 𝑞(𝑡, 𝑐) = 𝑐𝑒 𝑟𝑡

che è la relazione che lega le due costanti 𝑎 e 𝑟 che definiscono la crescita esponenziale.

Risulta in effetti valido il seguente.


96 2 funzioni continue, limiti e successioni

Teorema 2.44 (costante di Nepero). La successione


 𝑛
1
𝑎𝑛 = 1 +
𝑛

è crescente e limitata, dunque è convergente.

Per dimostrare il teorema precedente ci serve preliminarmente il seguente risultato.

disuguaglianza di Bernoulli
Teorema 2.45 (disuguaglianza di Bernoulli). Se 𝑥 > −1 e 𝑛 ∈ ℕ si ha

(1 + 𝑥)𝑛 ≥ 1 + 𝑛𝑥. (2.6)

Dimostrazione. Dimostriamo che vale (2.6) per induzione su 𝑛 . Per 𝑛 = 0 la disequa-


zione (2.6) diventa 1 ≥ 1 ed è quindi verificata. Se (2.6) è verificata per un certo 𝑛
moltiplicando ambo i membri per 1 + 𝑥 > 0 si ottiene

(1 + 𝑥)𝑛+1 ≥ (1 + 𝑥)(1 + 𝑛𝑥) = 1 + (𝑛 + 1)𝑥 + 𝑛𝑥 2 ≥ 1 + (𝑛 + 1)𝑥

che è proprio la disuguaglianza (2.6) con 𝑛 + 1 al posto di 𝑛 .

Dimostrazione del teorema 2.44. Dimostriamo innanzitutto che 𝑎 𝑛 è crescente, cioè che
per ogni 𝑛 ≥ 2 si ha 𝑎 𝑛 ≥ 𝑎 𝑛−1 . E’ chiaro che 𝑎 𝑛 > 0 per ogni 𝑛 , quindi ci riconduciamo
a verificare che 𝑎𝑎𝑛−𝑛 1 ≥ 1.

Si ha
𝑛 𝑛+1 𝑛
1 + 𝑛1

𝑎𝑛 𝑛
=  𝑛−1 =
𝑎 𝑛−1 1 + 𝑛−1 1 𝑛 𝑛−1

𝑛−1
𝑛 𝑛
𝑛+1 𝑛−1 𝑛 𝑛2 − 1 𝑛
 
= · · = ·
𝑛 𝑛 𝑛−1 𝑛2 𝑛−1

Osserviamo ora che la disuguaglianza di Bernoulli, teorema 2.45, garantisce


𝑛 𝑛
𝑛2 − 1 𝑛 𝑛−1
 
1 1
= 1− 2 ≥ 1− =1− =
𝑛2 𝑛 𝑛2 𝑛 𝑛

da cui si ottiene, come volevamo, 𝑎 𝑛 /𝑎 𝑛−1 ≥ 1 cioè 𝑎 𝑛 è crescente.

Se ora consideriamo la successione


  𝑛+1
1
𝑏𝑛 = 1 +
𝑛

osserviamo che si ha
 𝑛    
1 1 1
𝑏𝑛 = 1 + · 1+ = 𝑎𝑛 · 1 + > 𝑎𝑛 .
𝑛 𝑛 𝑛

Per dimostrare che 𝑎 𝑛 è limitata sarà quindi sufficiente dimostrare che 𝑏 𝑛 è supe-
riormente limitata. Vedremo ora che 𝑏 𝑛 è decrescente (e quindi 𝑎 𝑛 ≤ 𝑏 𝑛 ≤ 𝑏 1 è
superiormente limitata).
2.9 la costante di Nepero 97

Procediamo in maniera analoga a quanto fatto per 𝑎 𝑛 :


𝑛 𝑛 𝑛
1 + 𝑛−1 1

𝑏 𝑛−1 𝑛−1
 𝑛 𝑛  𝑛+1 𝑛 − 1
=  𝑛+1 = = · ·
𝑏𝑛 1 + 𝑛1 𝑛+1 𝑛+1
 𝑛−1 𝑛+1 𝑛
𝑛
 𝑛+1  𝑛+1
𝑛2 𝑛−1 𝑛−1
 
1
= · = 1+ 2 · .
𝑛 −1
2 𝑛 𝑛 −1 𝑛

In base alla disuguaglianza di Bernoulli otteniamo


 𝑛+1
𝑛

1 1 1
1+ ≥ 1 + (𝑛 + 1) · ≥ 1+ = .
𝑛2 − 1 𝑛2 − 1 𝑛−1 𝑛−1

Mettendo insieme le due stime si ottiene dunque 𝑏 𝑛−1 /𝑏 𝑛 ≥ 1 che è quanto ci rimaneva
da dimostrare.

E’ quindi giustificata la seguente.

Definizione 2.46 (costante di Nepero). Definiamo la costante di Nepero costante di Nepero

 𝑛 Nepero è l’italianizzazione del nome del


1 matematico scozzese John Napier (1550-
𝑒 = lim 1+ , 𝑛 ∈ ℕ. 1617). Il nome 𝑒 è stato introdotto da
𝑛→+∞ 𝑛
Eulero (Leonhard Euler 1707-1783)

Sapendo che
 𝑛   𝑛+1
1 1
1+ ≤ 𝑒 ≤ 1+
𝑛 𝑛
e ponendo 𝑛 = 1 otteniamo 2 ≤ 𝑒 ≤ 4.

𝑛𝑛 𝑎 𝑛+1
Esercizio 2.47. Posto 𝑎 𝑛 = 𝑛! mostrare che 𝑎𝑛 → 𝑒.
limiti che si riconducono al numero 𝑒

Teorema 2.48 (limiti che si riconducono al numero 𝑒 ). Si ha


1
lim (1 + 𝑥) 𝑥 = 𝑒.
𝑥→0

Dimostrazione. Iniziamo col dimostrare che


 𝑥
1
lim 1+ = 𝑒. (2.7)
𝑥→+∞ 𝑥

Ogni numero reale 𝑥 è compreso tra due interi consecutivi:

⌊𝑥⌋ ≤ 𝑥 ≤ ⌊𝑥⌋ + 1

e dunque
1 1 1
1+ ≤ 1+ ≤ 1+
⌊𝑥⌋ + 1 𝑥 ⌊𝑥⌋
da cui   ⌊𝑥⌋  𝑥   ⌊𝑥⌋+1
1 1 1
1+ ≤ 1+ ≤ 1+ . (2.8)
⌊𝑥⌋ + 1 𝑥 ⌊𝑥⌋
98 2 funzioni continue, limiti e successioni

Per calcolare il limite della espressione a sinistra operiamo il cambio di variabile


𝑛 = ⌊𝑥⌋ + 1 per ottenere:
  ⌊𝑥⌋   𝑛−1
1 1
lim 1+ = lim 1+
𝑥→+∞ ⌊𝑥⌋ + 1 𝑛→+∞ 𝑛
1 𝑛

1+ 𝑛 𝑒
= lim = = 𝑒.
𝑛→+∞ 1 + 𝑛1 1

Similmente per quanto riguarda il limite della espressione a destra si può operare il
cambio di variabile 𝑛 = ⌊𝑥⌋ :
  ⌊𝑥⌋+1   𝑛+1
1 1
1+ = lim 1+
⌊𝑥⌋ 𝑛→+∞ 𝑛
 𝑛  
1 1
= lim 1+ · 1+ = 𝑒 · 1 = 𝑒.
𝑛→+∞ 𝑛 𝑛

Dunque per il teorema dei due carabinieri otteniamo che anche l’espressione al centro
in (2.8) tende ad 𝑒 . Come conseguenza, tramite il cambio di variabile 𝑥 ↦→ 𝑥1 si ottiene
1
lim+ (1 + 𝑥) 𝑥 = 𝑒.
𝑥→0

Consideriamo ora il limite per 𝑥 → −∞ della solita espressione. Tramite il cambio di


variabile 𝑦 = −𝑥 si ha
𝑥  −𝑦  −𝑦
𝑦−1
  
1 1
lim 1+ = lim 1− = lim
𝑥→−∞ 𝑥 𝑦→+∞ 𝑦 𝑦→+∞ 𝑦
𝑦 𝑦
𝑦
 
1
= lim = lim 1+
𝑦→+∞ 𝑦−1 𝑦→+∞ 𝑦−1
  𝑦−1  
1 1
= lim 1+ · 1+ = 𝑒 · 1 = 𝑒.
𝑦→+∞ 𝑦−1 𝑦−1

Di conseguenza, facendo il cambio di variabile 𝑥 ↦→ 1


𝑥 si ottiene
1
lim− (1 + 𝑥) 𝑥 = 𝑒.
𝑥→0

Mettendo insieme limite destro e limite sinistro si ottiene infine il limite completo per
𝑥 → 0.

Corollario 2.49. Per ogni 𝑥 ∈ ℝ si ha


 𝑥 𝑛
lim 1+ = 𝑒𝑥.
𝑛→+∞ 𝑛

Dimostrazione. Infatti, per il teorema precedente, posto 𝑎 𝑛 = 𝑥/𝑛 si ha


𝑛
 𝑥𝑥
lim 1+ = 𝑒.
𝑛→+∞ 𝑛
2.9 la costante di Nepero 99

Ma allora
𝑛 𝑥
𝑥 𝑛 𝑥𝑥
 
1+ = 1+ → 𝑒𝑥
𝑛 𝑛

Definizione 2.50 (logaritmi naturali). Vedremo che il numero 𝑒 risulta essere una base
naturale per la funzione esponenziale e di conseguenza per il logaritmo. Il logaritmo in base 𝑒 logaritmo naturale
viene chiamato logaritmo naturale e viene indicato con ln = log𝑒 .

In alcuni testi si utilizza l’operatore log, indicato senza una base esplicita, ma la
definizione non è completamente condivisa. In certi testi (per lo più in ambito
matematico) si definisce log = ln = log𝑒 , in altri testi si considera log = log10 .

Corollario 2.51 (limiti notevoli). Si ha

ln (1 + 𝑥)
lim = 1; (2.9)
𝑥→0 𝑥
𝑒𝑥 − 1
lim = 1. (2.10)
𝑥→0 𝑥

Dimostrazione. Per quanto riguarda il logaritmo ci si riconduce al teorema precedente


osservando che:
ln(1 + 𝑥)  1

= ln (1 + 𝑥) 𝑥 → ln 𝑒 = 1.
𝑥
Per l’esponenziale ci si riconduce al logaritmo osservando che posto

𝑦 = 𝑒𝑥 − 1

se 𝑥 → 0 anche 𝑦 → 0 e quindi si ha:

𝑒𝑥 − 1 𝑦
= → 1.
𝑥 ln(1 + 𝑦)

Esercizio 2.52. Mostrare che


𝑛
𝑛+1

𝑛
lim 𝑛 · = 𝑒;
𝑛→+∞ 𝑛2 + 1
 
1
lim 𝑛 · ln 1 + = 1;
𝑛→+∞ 𝑛
 (𝑛−1)!
𝑛+1

1
lim 1 − = ;
𝑛→+∞ 𝑛! 𝑒
√ 
𝑛
lim 𝑛 · 2 − 1 = ln 2.
𝑛→+∞
100 2 funzioni continue, limiti e successioni

2.10 criteri del rapporto e della radice

Succede spesso di dover determinare il limite del rapporto di due successioni che
tendono entrambe a infinito oppure entrambe a zero. In queste situazioni il teorema del
limite del rapporto non si applica in quanto siamo di fronte ad una forma indeterminata.
Dovremo quindi capire quale delle due successioni tende a infinito o a zero “più
velocemente”.

I teoremi che seguono si basano (in maniera più o meno implicita) sull’andamento
della successione geometrica:
𝑎𝑛 = 𝑞 𝑛
dove 𝑞 > 0 è una costante fissata. Dalle proprietà della funzione esponenziale
sappiamo che se 𝑞 > 1 si ha 𝑞 𝑛 → ∞. Se 𝑞 = 1 chiaramente 𝑞 𝑛 = 1 → 1 e se 𝑞 < 1 si
ha 𝑞 −1 > 1 e quindi 𝑞 −𝑛 → +∞ da cui 𝑞 𝑛 → 0.

Teorema 2.53 (criterio del rapporto). Sia 𝑎 𝑛 una successione reale a termini non negativi
𝑎 𝑛 ≥ 0 tale che esista il limite del rapporto di due termini consecutivi:
𝑎 𝑛+1
→ ℓ ∈ [0, +∞].
𝑎𝑛

Se ℓ < 1 allora 𝑎 𝑛 → 0, se ℓ > 1 allora 𝑎 𝑛 → +∞.

Dimostrazione. Supponiamo sia ℓ < 1. Posto 𝑞 = (1 + ℓ )/2 si ha ℓ < 𝑞 < 1 e posto


𝜀 = 𝑞 − ℓ > 0 per la definizione di limite 𝑎𝑎𝑛+𝑛 1 → ℓ dovrà esistere un 𝑁 ∈ ℕ tale che
per ogni 𝑛 ≥ 𝑁 si abbia:
𝑎 𝑛+1
<ℓ +𝜀=𝑞
𝑎𝑛
ovvero 𝑎 𝑛+1 < 𝑞 · 𝑎 𝑛 . In particolare si avrà:

𝑎 𝑁+1 < 𝑞 · 𝑎 𝑁
𝑎 𝑁+2 < 𝑞 · 𝑎 𝑁+1 < 𝑞 2 · 𝑎 𝑁
𝑎 𝑁+3 < 𝑞 · 𝑎 𝑁+2 < 𝑞 3 · 𝑎 𝑁
..
.

ed è chiaro che per induzione potremo dimostrare che per ogni 𝑘 ∈ ℕ si ha

𝑎 𝑁+𝑘 < 𝑞 𝑘 · 𝑎 𝑁 .

Osserviamo però che 𝑞 𝑘 · 𝑎 𝑁 → 0 per 𝑘 → +∞ in quanto 𝑞 < 1 e quindi 𝑞 𝑘 → 0.


Dunque, tolti i primi 𝑁 termini, la successione 𝑎 𝑛 tende a zero. Ma i primi 𝑁 termini
non influenzano né il carattere né il limite della successione e quindi l’intera successione
𝑎 𝑛 tende a zero.

Il caso ℓ > 1 si fa in maniera analoga. Si sceglie 𝑞 tale che 1 < 𝑞 < ℓ e si trova, in
maniera analoga al caso precedente, che per un certo 𝑁 ∈ ℕ e per ogni 𝑘 ∈ ℕ si ha

𝑎 𝑁+𝑘 > 𝑞 𝑘 · 𝑎 𝑁 → +∞.


2.11 ordini di infinito, equivalenza asintotica 101

Osserviamo che, nel teorema precedente (ma anche nel criterio della radice teore-
ma 2.55), non si può concludere alcunché nel caso in cui sia ℓ = 1. Ad esempio le
due successioni 𝑎 𝑛 = 1/𝑛 e 𝑏 𝑛 = 𝑛 hanno limiti diversi ( 𝑎 𝑛 → 0, 𝑏 𝑛 → +∞) ma per
entrambe il limite del rapporto di termini consecutivi tende ad ℓ = 1.

Esercizio 2.54. Mostrare che

𝑛!
lim =0
𝑛𝑛
(2𝑛)!
lim = +∞
(2𝑛)𝑛

criterio della radice


Teorema 2.55 (criterio della radice). Sia 𝑎 𝑛 una successione a termini positivi tale che

𝑛
𝑎𝑛 → ℓ

con ℓ ∈ ℝ̄. Allora se ℓ < 1 si ha 𝑎 𝑛 → 0 se invece ℓ > 1 si ha 𝑎 𝑛 → +∞.

Dimostrazione. Si può osservare che


√ 𝑛 √
𝑛
𝑎𝑛 = 𝑛
𝑎𝑛 = 𝑒 𝑛·ln 𝑎𝑛
.

Se ℓ < 1 allora il logaritmo tende ad un numero negativo, l’argomento dell’esponenziale


tende a −∞ e quindi l’esponenziale tende a zero.
Se invece ℓ > 1 il logaritmo tende ad un numero positivo e quindi l’esponenziale tende
a +∞.

2.11 ordini di infinito, equivalenza asintotica


ordine di infinito/infinitesimo
Definizione 2.56 (ordine di infinito/infinitesimo). Sia 𝐴 ⊆ ℝ, 𝑓 , 𝑔 : 𝐴 → (0 , +∞). Sia
𝑥0 ∈ ℝ̄ un punto di accumulazione di 𝐴.
1. Diremo che per 𝑥 → 𝑥 0 la funzione 𝑓 è molto più piccola della funzione 𝑔 e scriveremo
𝑓 (𝑥) ≪ 𝑔(𝑥) se vale ≪
𝑓 (𝑥)
→ 0, per 𝑥 → 𝑥 0
𝑔(𝑥)
diremo invece che 𝑓 è molto più grande di 𝑔 e scriveremo 𝑓 (𝑥) ≫ 𝑔(𝑥) se ≫

𝑓 (𝑥)
→ +∞, per 𝑥 → 𝑥 0 .
𝑔(𝑥)

2. Diremo infine che 𝑓 e 𝑔 sono asintoticamente equivalenti per 𝑥 → 𝑥 0 e scriveremo equivalenza asintotica
𝑓 (𝑥) ∼ 𝑔(𝑥) se
𝑓 (𝑥) equivalenza asintotica
→ 1, per 𝑥 → 𝑥 0 .
𝑔(𝑥) ∼

Ad esempio è facile verificare che se 𝛼 > 𝛽 > 0 allora 𝑥 𝛼 ≫ 𝑥 𝛽 per 𝑥 → +∞ mentre


𝑥 𝛼 ≪ 𝑥 𝛽 per 𝑥 → 0+ . Analogamente se 𝑎 > 𝑏 > 1 allora 𝑎 𝑥 ≫ 𝑏 𝑥 per 𝑥 → +∞ mentre
𝑎 𝑥 ≪ 𝑏 𝑥 per 𝑥 → −∞.
102 2 funzioni continue, limiti e successioni

E’ molto facile verificare che le relazioni ≪ e ≫ sono una l’inversa dell’altra e soddisfano
la proprietà transitiva mentre la relazione ∼ soddisfa la proprietà simmetrica e la
proprietà transitiva.

ordini di infinito
Teorema 2.57 (ordini di infinito). Siano 𝑎 > 1 e 𝛼 > 0. Per 𝑛 → +∞, 𝑛 ∈ ℕ si ha

𝑛 𝛼 ≪ 𝑎𝑛 ≪ 𝑛! ≪ 𝑛𝑛

e per 𝑥 → +∞, 𝑥 ∈ ℝ si ha
log 𝑎 𝑥 ≪ 𝑥 𝛼 ≪ 𝑎 𝑥 .

Dimostrazione. Cominciamo col mostrare che 𝑎 𝑛 ≪ 𝑛 ! applicando il criterio del


𝑛
rapporto alla successione 𝑎𝑛 ! :

𝑎 𝑛+1
(𝑛 + 1)! 𝑎 𝑛+1 𝑛! 1
𝑛 = 𝑛
· =𝑎· → 0 < 1.
𝑎 𝑎 (𝑛 + 1)! 𝑛+1
𝑛!
Dunque si ha, come richiesto, 𝑎 𝑛 /𝑛 ! → 0. Si procede in modo analogo per mostrare
che 𝑛 ! ≪ 𝑛 𝑛 :

(𝑛 + 1)! 𝑛𝑛  𝑛 𝑛 1
· = (𝑛 + 1 ) ·
𝑛! (𝑛 + 1)𝑛+1 𝑛+1 𝑛+1
1 1
=  𝑛 → < 1.
1 + 𝑛1 𝑒

Per dimostrare che 𝑛 𝛼 ≪ 𝑎 𝑛 si può procedere con il criterio del rapporto, come nei
casi precedenti:
𝛼
(𝑛 + 1)𝛼 𝑎 𝑛 𝑛+1

1 1 𝛼 1
𝛼
· 𝑛+1 = · → ·1 = <1
𝑛 𝑎 𝑎 𝑛 𝑎 𝑎

da cui 𝑛 𝛼 /𝑎 𝑛 → 0.

Per 𝑥 ∈ ℝ, cerchiamo di ricondurci ad una successione a valori interi. Osserviamo che


si ha
⌊𝑥⌋ ≤ 𝑥 ≤ ⌊𝑥⌋ + 1
da cui, per monotonia,
 𝛼
𝛼 𝛼 𝛼 𝛼 1
⌊𝑥⌋ ≤ 𝑥 ≤ (⌊𝑥⌋ + 1) = ⌊𝑥⌋ 1+
⌊𝑥⌋
e
𝑎 ⌊𝑥⌋ ≤ 𝑎 𝑥 ≤ 𝑎 ⌊𝑥⌋+1 = 𝑎 · 𝑎 ⌊𝑥⌋ .
Dunque
 𝛼
⌊𝑥⌋ 𝛼 𝑥𝛼 ⌊𝑥⌋ 𝛼 1 + 1
⌊𝑥⌋
≤ ≤ .
𝑎 · 𝑎 ⌊𝑥⌋ 𝑎𝑥 𝑎 ⌊𝑥⌋
2.11 ordini di infinito, equivalenza asintotica 103

Ma ora, se 𝑥 → +∞ sapendo che 𝑛 = ⌊𝑥⌋ → +∞ possiamo effettuare un cambio di


variabile nel limite

⌊𝑥⌋ 𝛼 𝑛𝛼 ⌊𝑥⌋ 𝛼 𝑛𝛼
lim = lim 𝑛 = 0 e lim = lim 𝑛 = 0
𝑥→+∞ 𝑎 ⌊𝑥⌋ 𝑛→+∞ 𝑎 𝑥→+∞ 𝑎 ⌊𝑥⌋ 𝑛→+∞ 𝑎

𝑥𝛼
da cui segue che 𝑎𝑥 → 0.

Per dimostrare l’ultima relazione, log 𝑎 𝑥 ≪ 𝑥 𝛼 , operiamo il cambio di variabile


𝑦 = 𝛼 · log𝑎 𝑥 cosicché 𝑎 𝑦 = 𝑥 𝛼 . Notiamo che se 𝑥 → +∞ anche 𝑦 → +∞. Dunque,
per le proprietà precedenti, sappiamo che 𝑦 ≪ 𝑎 𝑦 e dunque

log 𝑎 𝑥 1 𝑦
= · → 0.
𝑥𝛼 𝛼 𝑎𝑦

Le notazioni e gli ordini di infinito individuati nel teorema precedente sono strumenti
molto utili nel calcolo dei limiti.

L’equivalenza asintotica si mantiene per prodotto e rapporto: se 𝑓 ∼ 𝐹 e 𝑔 ∼ 𝐺 allora

𝑓 𝐹
𝑓 · 𝑔 ∼ 𝐹 · 𝐺, ∼ .
𝑔 𝐺

Osserviamo inoltre che se 𝑓 ∼ 𝑔 e se 𝑓 → ℓ allora anche 𝑔 → ℓ . Se poi ℓ ∈ (0 , +∞) la


relazione 𝑓 ∼ ℓ è equivalente ad 𝑓 → ℓ .

Per quanto riguarda la somma è facile verificare che se 𝑓 ≪ 𝑔 allora ( 𝑓 + 𝑔) ∼ 𝑓 in


quanto
𝑓 +𝑔 𝑓
= + 1 → 1.
𝑔 𝑔

In un limite in cui compaiono somme di termini di ordini diversi potremo allora


raccogliere i termini di ordine massimo per individuare il limite, come facciamo nel
seguente.

Esempio 2.58. Calcolare il limite

2𝑛 4 + 3𝑛 − 3 ln 𝑛
lim √ .
𝑛→+∞ 𝑛! − 3 𝑛

Svolgimento. Si ha
 
3𝑛 · 2 3𝑛𝑛 + 1 − 3 ln3𝑛𝑛
4

2𝑛 +
4
3𝑛 − 3 ln 𝑛
√ = √
𝑛! − 3 𝑛
 
𝑛
𝑛! · 1 − 3 𝑛!

e ricordando che risulta (teorema 2.57)



𝑛 4 ≪ 3𝑛 , ln 𝑛 ≪ 3𝑛 , 𝑛 ≪ 𝑛 !, 3𝑛 ≪ 𝑛 !
104 2 funzioni continue, limiti e successioni

avremo
2𝑛 4 + 3𝑛 − 3 ln 𝑛 3𝑛
√ ∼ → 0.
𝑛! − 3 𝑛 𝑛!

Esercizio 2.59. Calcolare i seguenti limiti


√ √
ln 𝑛 2 + 𝑛 𝑛 𝑛 ! + 2𝑛
lim √ , lim ,
𝑛→+∞ 𝑒 1+ln 𝑛
· ln(𝑛 − 𝑛 𝑛)
2 𝑛→+∞ 3𝑛
p
(2𝑛)! √
q
𝑛
lim , lim 𝑒 𝑛 + 10𝑛 .
𝑛→+∞ 𝑛𝑛 𝑛→+∞


Esercizio 2.60. Dimostrare che 𝑛
𝑛 → 1 per 𝑛 → +∞.

2.12 successioni estratte

Definizione 2.61 (sottosuccessione). Se 𝑎 𝑛 è una successione e 𝑛 𝑘 è una successione


strettamente crescente i cui valori sono numeri naturali, allora la successione 𝑏 𝑘 = 𝑎 𝑛 𝑘 si dice
sottosuccessione
essere una sottosuccessione di 𝑎 𝑛 (o anche successione estratta da 𝑎 𝑛 ).

Ricordando che una successione 𝑎 𝑛 non è altro che una funzione 𝒂 : ℕ → ℝ, la


successione 𝑛 𝑘 corrisponde ad una funzione 𝒏 : ℕ → ℕ e la sottosuccessione 𝑎 𝑛 𝑘
corrisponde alla funzione composta 𝒂 ◦ 𝒏 .

Si osservi che nella definizione precedente la variabile 𝑛 rappresenta una variabile muta
quando scriviamo la successione 𝑎 𝑛 , ma rappresenta anche il nome della successione
fissata 𝑛 𝑘 . Questo sovraccarico di significato è voluto e se usato correttamente rende
più semplice le notazioni, in quanto la successione 𝑛 𝑘 viene sostituita alla variabile 𝑛 ,
con lo stesso nome, nella successione 𝑎 𝑛 . La sottosuccessione 𝑎 𝑛 𝑘 risulta essere una
successione nella variabile 𝑘 , non nella variabile 𝑛 .

Esempio 2.62. Sia 𝑎 𝑛 = 𝑛 2 la successione dei quadrati perfetti:

𝑛 0 1 2 3 4 5 6 ...
𝑎𝑛 0 1 4 9 16 25 36 ...

Consideriamo la successione dei numeri pari 𝑛 𝑘 = 2 𝑘 . la corrispondente sottosuccessione dei


quadrati perfetti 𝑏 𝑘 = 𝑎 𝑛 𝑘 rappresenta la successione dei quadrati dei numeri pari:

𝑘 0 1 2 3 4 5 6 ...
𝑛𝑘 0 2 4 6 8 10 12 ...
𝑎𝑛𝑘 0 4 16 36 64 100 144 ...

Si ha in pratica 𝑏 𝑘 = 𝑎 𝑛 𝑘 = 𝑎 2 𝑘 = (2 𝑘)2 .

Abbiamo in effetti estratto alcuni dei termini della successione originaria.


2.12 successioni estratte 105

Esempio 2.63. Se 𝑎 𝑛 = (−1)𝑛 e 𝑛 𝑘 = 2 𝑘 allora 𝑎 𝑛 𝑘 = 1. Vediamo quindi che una successione


irregolare può contenere una sottosuccessione regolare.

Osserviamo che se 𝒏 : ℕ → ℕ è una funzione strettamente crescente (cioè 𝑛 𝑘 = 𝒏(𝑘) è


una successione strettamente crescente di indici) allora posto 𝐴 = 𝒏(ℕ ) = {𝑛 𝑘 : 𝑘 ∈ ℕ }
si ha che 𝒏 : ℕ → 𝐴 è una bigezione. Quindi 𝐴 è un insieme infinito. Viceversa
dato un qualunque insieme infinito 𝐴 ⊆ ℕ esiste una unica successione 𝒏 : ℕ → 𝐴
bigettiva e strettamente crescente: basterà porre, per induzione, 𝑛0 = min 𝐴, 𝑛1 =
min {𝑛 ∈ 𝐴 : 𝑛 > 𝑛0 } e, in generale, 𝑛 𝑘+1 = min {𝑛 ∈ 𝐴 : 𝑛 > 𝑛 𝑘 }.

Dunque possiamo identificare le sottosuccessioni di una successione 𝒂 : ℕ → ℝ con


le restrizioni ai sottoinsiemi infiniti di ℕ . Nell’esempio precedente, si è considerata
la sottosuccessione di tutti i termini con indice pari 𝑛 𝑘 = 2 𝑘 per ottenere la sottosuc-
cessione 𝑎 𝑛 𝑘 = 𝑎 2 𝑘 . Si può equivalentemente pensare di prendere l’insieme di tutti i
numeri pari 𝐴 = 2ℕ e considerare la successione ristretta ai soli indici pari:

𝑎0 , 𝑎2 , 𝑎4 , . . .

Se rinumeriamo gli indici pari usando tutti i numeri naturali otteniamo la sottosucces-
sione 𝑏 𝑘 = 𝑎 𝑛 𝑘 :
𝑏0 = 𝑎0 , 𝑏1 = 𝑎2 , 𝑏2 = 𝑎4 , . . . , 𝑏 𝑘 = 𝑎 𝑛 𝑘 , . . .

Lemma 2.64 (estratte monotone). Ogni successione 𝑎 𝑛 ∈ ℝ ha una estratta 𝑎 𝑛 𝑘 monotona.


Inoltre se sup 𝑎 𝑛 = +∞ c’è una estratta 𝑎 𝑛 𝑘 strettamente crescente che tende a +∞.

Dimostrazione. Consideriamo l’insieme 𝑃 dei punti di “picco”, ovvero degli indici di


quei termini della successione che sono maggiori o uguali a tutti i termini seguenti:

𝑃 = {𝑛 ∈ ℕ : 𝑚 ≥ 𝑛 =⇒ 𝑎 𝑛 ≥ 𝑎 𝑚 }.

Se 𝑃 è finito significa che esiste un indice 𝑛1 ∈ ℕ tale che non ci sono picchi da 𝑛1 in
poi. In particolare 𝑛1 non è un punto di picco quindi deve esistere 𝑛2 > 𝑛1 tale che
𝑎 𝑛2 > 𝑎 𝑛1 . Ma neanche 𝑛2 è un punto di picco quindi deve esistere 𝑛3 > 𝑛2 tale che
𝑎 𝑛3 > 𝑎 𝑛2 ... procedendo induttivamente si riesce quindi a definire una successione 𝑛 𝑘
di indici tali che 𝑎 𝑛 𝑘 risulta essere strettamente crescente.

In particolare se sup 𝑎 𝑛 = +∞ siamo nella situazione precedente perché chiaramente


in tal caso 𝑃 è vuoto visto che per ogni 𝑛 ∈ ℕ deve esistere 𝑚 ∈ ℕ tale che 𝑎 𝑚 >
max {𝑎 0 , 𝑎 1 , . . . 𝑎 𝑛 } e certamente 𝑚 > 𝑛 .

Se, viceversa, 𝑃 è infinito allora elencando in ordine i suoi elementi otterremo una
successione 𝑛1 < 𝑛2 < 𝑛3 , . . . di indici ognuno dei quali corrisponde ad un valore
di picco. Se 𝑗 > 𝑘 si ha dunque 𝑛 𝑗 > 𝑛 𝑘 ed essendo 𝑛 𝑘 ∈ 𝑃 significa che 𝑎 𝑛 𝑗 ≤ 𝑎 𝑛 𝑘 .
Dunque la successione 𝑎 𝑛 𝑘 risulta essere decrescente.
Bolzano-Weierstrass

Teorema 2.65 (Bolzano-Weierstrass). Ogni successione 𝑎 𝑛 ha una estratta regolare.

Più precisamente se 𝑎 𝑛 è una successione limitata allora esiste una sottosuccessione 𝑎 𝑛 𝑘


convergente.

Se 𝑎 𝑛 è una successione non limitata allora esiste una estratta 𝑎 𝑛 𝑘 divergente.


106 2 funzioni continue, limiti e successioni

Dimostrazione. Cominciamo con il caso reale 𝑎 𝑛 ∈ ℝ. Il lemma 2.64 garantisce che


esiste una estratta 𝑎 𝑛 𝑘 monotona. Ma per il teorema 2.25 concludiamo immediatamente
che 𝑎 𝑛 𝑘 ha limite. Se 𝑎 𝑛 è limitata anche 𝑎 𝑛 𝑘 è limitata e quindi in tal caso il limite è
finito e dunque la successione estratta è convergente.

Se 𝑎 𝑛 non è superiormente limitata il lemma ci garantisce che l’estratta tende a +∞


e dunque è divergente. Per simmetria se 𝑎 𝑛 non è inferiormente limitata esiste una
estratta che tende a −∞ e quindi anche in questo caso l’estratta è divergente.

Se 𝑎 𝑛 è una successione di numeri complessi, si potrà scrivere 𝑎 𝑛 = 𝑥 𝑛 + 𝑖 𝑦𝑛 con 𝑥 𝑛


e 𝑦𝑛 successioni reali. Se 𝑎 𝑛 è limitata significa che |𝑎 𝑛 | è superiormente limitata.
Ma risulta |𝑥 𝑛 | ≤ |𝑎 𝑛 | e |𝑦𝑛 | ≤ |𝑎 𝑛 | quindi se 𝑎 𝑛 è limitata anche la parte reale 𝑥 𝑛
e la parte immaginaria 𝑦𝑛 sono successioni limitate. Allora 𝑥 𝑛 ammette una sotto-
successione convergente 𝑥 𝑛 𝑘 . Ma 𝑦𝑛 𝑘 è anch’essa limitata e quindi anch’essa ammette
una sotto-sotto-successione 𝑦𝑛 𝑘 𝑗 convergente. Dunque la sotto-sotto-successione 𝑎 𝑛 𝑘 𝑗 è
convergente.

Se 𝑎 𝑛 ∈ ℂ non è limitata, applicando il teorema al suo modulo |𝑎 𝑛 | troviamo che c’è


una estratta 𝑎 𝑛 𝑘 tale che 𝑎 𝑛 𝑘 → +∞. Ma questo significa che 𝑎 𝑛 → ∞ ∈ ℂ̄.

2.13 punti limite

Teorema 2.66 (ponte di collegamento tra limiti di funzione e limiti di successione).


Sia 𝐴 ⊆ ℝ, 𝑓 : 𝐴 → ℝ, sia 𝑥 0 un punto di accumulazione di 𝐴 e sia ℓ ∈ [−∞, +∞]. Le due
seguenti condizioni sono equivalenti:

1. lim 𝑓 (𝑥) = ℓ ;
𝑥→𝑥0
2. per ogni successione 𝑎 𝑛 → 𝑥 0 con 𝑎 𝑛 ∈ 𝐴 \ {𝑥 0 } risulta

lim 𝑓 (𝑎 𝑛 ) = ℓ .
𝑛→+∞

Dimostrazione. Se per 𝑥 → 𝑥 0 si ha 𝑓 (𝑥) → ℓ e se 𝑎 𝑛 → 𝑥 0 con 𝑎 𝑛 ∈ 𝐴 \ {𝑥 0 } la


successione 𝑓 (𝑎 𝑛 ) non è altro che la composizione della funzione 𝑓 con la funzione
𝑛 ↦→ 𝑎 𝑛 . Si può quindi applicare il teorema sul limite della funzione composta per
ottenere che 𝑓 (𝑎 𝑛 ) → ℓ .

Supponiamo viceversa di sapere che per ogni successione 𝑎 𝑛 → 𝑥 0 si ha 𝑓 (𝑎 𝑛 ) → ℓ .


Vogliamo mostrare allora che 𝑓 (𝑥) → ℓ . Lo facciamo per assurdo: supponiamo che
esista un intorno 𝑈 di ℓ tale che preso un qualunque intorno 𝑉 di 𝑥 0 non si abbia
𝑓 ((𝐴\{𝑥0 })∩𝑉) ⊆ 𝑈 . Possiamo considerare per ogni 𝑛 ∈ ℕ degli intorni 𝑉𝑛 sempre più
piccoli. Ad esempio nel caso 𝑥 0 ∈ ℝ potremo scegliere 𝑉𝑛 = (𝑥 0 −1/𝑛, 𝑥 0 +1/𝑛), nel caso
𝑥0 = +∞ si potrà scegliere 𝑉𝑛 = (𝑛, +∞] e nel caso 𝑥0 = −∞ si sceglierà 𝑉𝑛 = [−∞, −𝑛).
Se per assurdo 𝑓 ((𝐴 \ {𝑥 0 } ∩𝑉𝑛 )) non fosse contenuto in 𝑈 significherebbe che per ogni
𝑛 ∈ ℕ esisterebbe 𝑎 𝑛 ∈ (𝐴 \ {𝑥0 }) ∩ 𝑉𝑛 tale che 𝑓 (𝑎 𝑛 ) ∉ 𝑈 . Ma allora 𝑎 𝑛 risulterebbe
essere una successione in 𝐴 \ {𝑥 0 } con limite 𝑥 0 (in quanto per ogni intorno di 𝑥 0
esiste un 𝑁 tale che 𝑉𝑁 sia contenuto in tale intorno e per ogni 𝑛 > 𝑁 si ha 𝑉𝑛 ⊆ 𝑉𝑁 )
ma 𝑓 (𝑎 𝑛 ) non potrebbe avere limite ℓ (essendo fuori dall’intorno 𝑈 ). Ma questo nega
l’ipotesi e conclude quindi la dimostrazione del teorema.
2.13 punti limite 107

Proposizione 2.67 (proprietà caratteristica della convergenza). Sia 𝑓 : 𝐴 ⊆ ℝ → ℝ e


𝑥0 punto di accumulazione di 𝐴. Sia ℓ ∈ ℝ̄. Se per ogni 𝑎 𝑛 → 𝑥0 , 𝑎 𝑛 ∈ 𝐴 \ {𝑥0 } esiste una
estratta 𝑎 𝑛 𝑘 tale che 𝑓 (𝑎 𝑛 𝑘 ) → ℓ allora 𝑓 (𝑥) → ℓ per 𝑥 → 𝑥 0 .

Dimostrazione. Se per assurdo non fosse 𝑓 (𝑥) → ℓ esisterebbe un intorno 𝑈 ∈ Bℓ per


cui frequentemente 𝑓 (𝑥) ∉ 𝑈 . Questo significa che esiste una successione 𝑎 𝑛 → 𝑥 0
con 𝑎 𝑛 ≠ 𝑥 0 tale che 𝑓 (𝑎 𝑛 ) ∉ 𝑈 . Ma allora da 𝑓 (𝑎 𝑛 ) non è possibile estrarre una
sottosuccessione che abbia limite ℓ , e questo è contrario alle ipotesi.

Definizione 2.68 (punti limite, limite superiore, limite inferiore). Sia 𝑓 : 𝐴 ⊆ ℝ → ℝ


una funzione e 𝑥 0 ∈ ℝ̄ un punto di accumulazione per 𝐴. Una quantità ℓ ∈ ℝ̄ si dice essere
un punto limite di 𝑓 (𝑥) per 𝑥 → 𝑥 0 se per ogni 𝑈 intorno di ℓ si ha 𝑓 (𝑥) ∈ 𝑈 frequentemente punto limite
per 𝑥 → 𝑥 0 .

Se denotiamo con 𝐿 ⊆ ℝ̄ l’insieme dei punti limite possiamo definire il limite superiore e il
limite inferiore rispettivamente come limite superiore/inferiore

lim sup 𝑎 𝑛 = sup 𝐿, lim inf 𝑎 𝑛 = inf 𝐿.


𝑥→𝑥 0 𝑥→𝑥0

Proposizione 2.69 (base numerabile di intorni). Per ogni ℓ ∈ ℝ̄ esiste una successione
𝑈𝑛 di intorni di ℓ con queste proprietà:
1. 𝑈𝑛+1 ⊆ 𝑈𝑛 ;
2. per ogni 𝑈 intorno di ℓ esiste 𝑛 ∈ ℕ tale che 𝑈𝑛 ⊆ 𝑈 ;
3. se 𝑎 𝑛 ∈ 𝑈𝑛 allora 𝑎 𝑛 → ℓ .

Dimostrazione. Possiamo esplicitamente definire gli intorni 𝑈𝑛 come segue:

ℓ − 𝑛1 , ℓ + 𝑛1 se ℓ ∈ ℝ
 




𝑈𝑛 = (𝑛, +∞] se ℓ = +∞

 [−∞, −𝑛) se ℓ = −∞.


La prima proprietà è ovviamente verificata. La proprietà archimedea dei numeri
reali garantisce la validità della seconda proprietà, da cui segue immediatamente la
terza.

Proposizione 2.70 (caratterizzazione dei punti limite). Sia 𝑓 : 𝐴 ⊆ ℝ → ℝ, 𝑥 0 ∈ ℝ̄


punto di accumulazione per 𝐴. Sono equivalenti:

1. ℓ è un punto limite di 𝑓 (𝑥) per 𝑥 → 𝑥 0 .


2. esiste una successione 𝑎 𝑛 ∈ 𝐴, 𝑎 𝑛 ≠ 𝑥 0 , 𝑎 𝑛 → 𝑥 0 tale che 𝑓 (𝑎 𝑛 ) → ℓ .

Dimostrazione. Siano 𝑈𝑛 intorni di ℓ e 𝑉𝑛 intorni di 𝑥 0 definiti come nella proposizio-


ne 2.69. Se ℓ è un punto limite di 𝑓 (𝑥) per 𝑥 → 𝑥 0 significa che per ogni 𝑈 intorno di
ℓ e per ogni 𝑉 intorno di 𝑥0 esiste 𝑥 ∈ 𝐴 ∩ 𝑉 \ {𝑥 0 } tale che 𝑓 (𝑥) ∈ 𝑈 . Dunque per
ogni 𝑛 esiste 𝑎 𝑛 ∈ 𝐴 ∩ 𝑉 \ {𝑥 0 } tale che 𝑎 𝑛 ∈ 𝑉𝑛 e 𝑓 (𝑎 𝑛 ) ∈ 𝑈𝑛 . Significa che 𝑎 𝑛 → 𝑥 0 ,
𝑎 𝑛 ≠ 𝑥0 , 𝑓 (𝑎 𝑛 ) → ℓ come volevasi dimostrare.
Viceversa se esiste una tale successione 𝑎 𝑛 → 𝑥 0 allora per ogni 𝑉 intorno di 𝑥 0 si ha
definitivamente 𝑎 𝑛 ∈ 𝑉 . E se 𝑓 (𝑎 𝑛 ) → ℓ per ogni 𝑈 intorno di ℓ si ha anche 𝑓 (𝑎 𝑛 ) ∈ 𝑈
108 2 funzioni continue, limiti e successioni

definitivamente. Dunque esiste 𝑛 tale che 𝑎 𝑛 ∈ 𝑉 e 𝑓 (𝑎 𝑛 ) ∈ 𝑈 confermando quindi


che 𝑓 (𝑥) ∈ 𝑈 frequentemente.

Molto spesso considereremo i punti limite di una successione 𝑎 𝑛 per 𝑛 → +∞. In tal
caso la caratterizzazione precedente ci dice che ℓ è un punto limite di 𝑎 𝑛 per 𝑛 → +∞
se esiste una successione di indici 𝑛 𝑘 → +∞ tale che 𝑎 𝑛 𝑘 → ℓ . Potremmo anche
supporre 𝑛 𝑘 strettamente crescente in quanto se 𝑛 𝑘 → ∞ possiamo estrarre da 𝑛 𝑘 una
sottosuccessione strettamente crescente. Dunque l’insieme dei punti limite di una
successione 𝑎 𝑛 corrisponde all’insieme dei limiti di tutte le possibili sottosuccessioni
di 𝑎 𝑛 .

Esempio 2.71. La successione 𝑎 𝑛 = (−1)𝑛 ha due punti limite:

lim sup(−1)𝑛 = 1 , lim inf(−1)𝑛 = −1.


𝑛→+∞ 𝑛→+∞

Infatti la sottosuccessione dei termini con indice pari è costante 1 mentre quella dei termini di
indice dispari è costante −1. Non ci possono essere altri punti limite perché se ci fosse 𝑎 𝑛 𝑘 → ℓ
allora certamente 𝑎 𝑛 𝑘 = 1 frequentemente oppure 𝑎 𝑛 𝑘 = −1 frequentemente da cui o ℓ = 1
oppure ℓ = −1.

Esempio 2.72. Visto che #ℚ = #ℕ esiste una funzione 𝒂 : ℕ → ℚ surgettiva. Utilizzando


la proprietà di densità dei numeri razionali si può dimostrare che l’insieme dei punti limite
della corrispondente successione 𝑎 𝑛 = 𝒂(𝑛) è tutto ℝ̄.
√ √
Esercizio 2.73. Si consideri la successione 𝑎 𝑛 = 𝑛 − ⌊ 𝑛⌋ . Calcolare

lim inf 𝑎 𝑛 , lim sup 𝑎 𝑛 .


𝑛→+∞ 𝑛→+∞

Qual è l’insieme dei punti limite di 𝑎 𝑛 per 𝑛 → +∞?

Teorema 2.74 (proprietà del limite superiore/inferiore). Sia 𝑓 : 𝐴 ⊆ ℝ → ℝ e sia 𝑥 0


un punto di accumulazione per 𝐴. Sia 𝐿 l’insieme dei punti limite di 𝑓 (𝑥) per 𝑥 → 𝑥 0 .
1. 𝐿 ≠ ∅
2. lim sup 𝑓 (𝑥) ≥ lim inf 𝑓 (𝑥);
𝑥→𝑥 0 𝑥→𝑥0
3. se lim sup 𝑓 (𝑥) = lim inf 𝑓 (𝑥) = ℓ allora lim 𝑓 (𝑥) = ℓ ;
𝑥→𝑥0 𝑥→𝑥 0 𝑥→𝑥 0
4. l’insieme dei punti limite è chiuso per passaggio al limite: se ℓ 𝑘 ∈ 𝐿 e ℓ 𝑘 → ℓ per
qualche ℓ ∈ ℝ̄ allora ℓ ∈ 𝐿;
5. lim sup 𝑓 (𝑥) e lim inf 𝑥→𝑥0 𝑓 (𝑥) sono punti limite;
𝑥→𝑥 0
6. la condizione lim sup 𝑓 (𝑥) = ℓ è equivalente a
𝑥→𝑥0
(
∀𝑞 > ℓ : 𝑓 (𝑥) < 𝑞 definitivamente,
∀𝑞 < ℓ : 𝑓 (𝑥) > 𝑞 frequentemente,

e la condizione lim inf 𝑓 (𝑥) = ℓ è equivalente a


𝑥→𝑥0
(
∀𝑞 > ℓ : 𝑓 (𝑥) < 𝑞 frequentemente,
∀𝑞 < ℓ : 𝑓 (𝑥) > 𝑞 definitivamente.
2.13 punti limite 109

7. se 𝑎 𝑛 è una successione
   
lim sup 𝑎 𝑛 = lim sup 𝑎 𝑘 , lim inf 𝑎 𝑛 = lim inf 𝑎 𝑘 .
𝑛→+∞ 𝑛→+∞ 𝑘≥𝑛 𝑛→+∞ 𝑛→+∞ 𝑘≥𝑛

Dimostrazione. Per quanto riguarda il punto 1. il teorema 2.65 di Bolzano-Weierstrass


garantisce che sia 𝐿 ≠ ∅ e quindi sup 𝐿 ≥ inf 𝐿 da cui discende il punto 2.
Per il punto 3. se lim sup = lim inf = ℓ significa che 𝐿 = {ℓ } ha un solo elemento. Ma
per il corollario al teorema di Bolzano Weierstrass sappiamo che da ogni successione
𝑓 (𝑎 𝑛 ) con 𝑎 𝑛 → 𝑥0 è possibile estrarre una sottosuccessione 𝑓 (𝑎 𝑛 𝑘 ) regolare. Il limite
di tale sottosuccessione deve essere un elemento di 𝐿 e quindi non può che essere ℓ .
Allora per la proposizione 2.67 deduciamo che l’intera successione ha limite ℓ .
Per il punto 4. sia ℓ 𝑘 ∈ 𝐿 una successione di punti limite e sia ℓ ∈ ℝ̄ tale che
ℓ 𝑘 → ℓ per 𝑘 → +∞. Ora consideriamo la successione 𝑈𝑛 di intorni di ℓ data dalla
proposizione 2.69. Visto che ℓ 𝑘 → ℓ per ogni 𝑛 deve esistere 𝑘 𝑛 tale che ℓ 𝑘 𝑛 ∈ 𝑈𝑛 . Senza
perdita di generalità possiamo supporre direttamente che sia ℓ 𝑛 ∈ 𝑈𝑛 . Consideriamo
anche gli intorni 𝑉𝑛 di 𝑥 0 dati sempre dalla proposizione 2.69. Per ogni ℓ 𝑛 ∈ 𝐿
deve esistere una successione 𝑎 𝑘 → 𝑥 0 con 𝑎 𝑘 ≠ 𝑥 0 tale che 𝑓 (𝑎 𝑘 ) → ℓ 𝑛 . Ma allora
certamente esiste 𝑘 = 𝑘 𝑛 tale che 𝑎 𝑘 𝑛 ∈ 𝑉𝑛 e 𝑓 (𝑎 𝑘 𝑛 ) ∈ 𝑈𝑛 . Posto 𝑏 𝑛 = 𝑎 𝑘 𝑛 abbiamo
trovato una successione 𝑏 𝑛 tale che 𝑏 𝑛 → 𝑥 0 (in quanto 𝑏 𝑛 ∈ 𝑉𝑛 ) e 𝑓 (𝑏 𝑛 ) → ℓ in quanto
𝑓 (𝑏 𝑛 ) ∈ 𝑈𝑛 . Dunque ℓ è anch’esso un punto limite.
Per il punto 5 visto che 𝐿 ≠ ∅ la caratterizzazione del sup garantisce che esista una
successione ℓ 𝑛 ∈ 𝐿 tale che ℓ 𝑛 → sup 𝐿. Ma allora per il punto precedente si deve
avere sup 𝐿 ∈ 𝐿. Lo stesso per l’inf.
Per il punto 6. facciamo la dimostrazione per il lim sup (per il lim inf sarà analogo).
Se lim sup 𝑓 (𝑥) = ℓ e se fosse frequentemente 𝑓 (𝑥) ≥ 𝑞 > ℓ allora esisterebbe una
successione 𝑎 𝑛 → 𝑥 0 , 𝑎 𝑛 ≠ 𝑥 0 tale che 𝑓 (𝑎 𝑛 ) ≥ 𝑞 . Tale successione avrebbe una estratta
regolare che ha limite ≥ 𝑞 > ℓ , il che è assurdo. Dunque definitivamente deve essere
𝑓 (𝑥) < 𝑞 per ogni 𝑞 > ℓ . Se invece fosse definitivamente 𝑓 (𝑥) ≤ 𝑞 < ℓ per ogni
successione 𝑎 𝑛 → 𝑥 0 con 𝑎 𝑛 ≠ 𝑥 0 si dovrebbe avere 𝑓 (𝑎 𝑛 ) ≤ 𝑞 e questo contraddice il
fatto che ℓ > 𝑞 è un punto limite.
Viceversa se per ogni 𝑞 > ℓ si ha 𝑓 (𝑥) < 𝑞 definitivamente, significa che per ogni
successione 𝑎 𝑛 → 𝑥 0 si ha 𝑓 (𝑎 𝑛 ) < 𝑞 definitivamente e quindi se 𝑓 (𝑎 𝑛 ) → ℓ dovrà
essere ℓ ≤ 𝑞 . Dunque ogni 𝑞 > ℓ è un maggiorante di 𝐿 e sup 𝐿 ≤ ℓ . Se poi per ogni
𝑞 < ℓ si ha 𝑓 (𝑥) ≥ 𝑞 frequentemente significa che esiste una successione 𝑎 𝑛 → 𝑥0 ,
𝑎 𝑛 ≠ 𝑥0 tale che 𝑓 (𝑎 𝑛 ) ≥ 𝑞 . Per il teorema di Bolzano-Weierstrass si potrà trovare una
estratta convergente 𝑓 (𝑎 𝑛 𝑘 ) → ℓ ′ ≥ 𝑞 . Dunque per ogni 𝑞 < ℓ risulta sup 𝐿 ≥ 𝑞 da cui
in definitiva sup 𝐿 = ℓ .
Per il punto 7. facciamo la dimostrazione per il lim sup (per il lim inf sarà analogo).
Posto 𝐴𝑛 = sup 𝑘≥𝑛 𝑎 𝑘 osserviamo che 𝐴𝑛 è decrescente in quanto all’aumentare di 𝑛
l’insieme {𝑘 : 𝑘 ≥ 𝑛} decresce (nel senso dell’inclusione insiemistica) e quindi il sup
non aumenta. Dunque ℓ = lim 𝐴𝑛 esiste certamente in ℝ̄. Inoltre per definizione
di limite per ogni ℓ ′ > ℓ si dovrà avere 𝐴𝑛 < ℓ ′ definitivamente e quindi (essendo
ovviamente 𝑎 𝑛 ≤ 𝐴𝑛 ) si avrà anche 𝑎 𝑛 < ℓ ′ definitivamente. Viceversa preso ℓ ′ < ℓ
si avrà definitivamente 𝐴𝑛 > ℓ ′. Ma questo significa che esiste 𝑘 > 𝑛 per cui si ha
𝑎 𝑘 > ℓ ′ e quindi risulta 𝑎 𝑛 > ℓ ′ frequentemente. Per il punto precedente si può quindi
concludere che ℓ = lim sup 𝑎 𝑛 .
110 2 funzioni continue, limiti e successioni

Teorema 2.75 (operazioni con lim sup e lim inf). Siano 𝑓 , 𝑔 : 𝐴 ⊆ ℝ → ℝ e sia 𝑥 0 un
punto di accumulazione di 𝐴.

1. Per 𝑥 → 𝑥 0 si ha

lim sup(− 𝑓 (𝑥)) = − lim inf 𝑓 (𝑥)


𝑥→𝑥0 𝑥→𝑥0

lim inf(− 𝑓 (𝑥)) = − lim sup 𝑓 (𝑥);


𝑥→𝑥 0 𝑥→𝑥 0

2. se 𝜆 ≥ 0 allora

lim sup(𝜆 · 𝑓 (𝑥)) = 𝜆 · lim sup 𝑓 (𝑥),


𝑥→𝑥 0 𝑥→𝑥0

lim inf(𝜆 · 𝑓 (𝑥)) = 𝜆 · lim inf 𝑓 (𝑥);


𝑥→𝑥 0 𝑥→𝑥 0

3. inoltre

lim sup( 𝑓 (𝑥) + 𝑔(𝑥)) ≤ lim sup 𝑓 (𝑥) + lim sup 𝑔(𝑥),
𝑥→𝑥 0 𝑥→𝑥0 𝑥→𝑥0

lim inf( 𝑓 (𝑥) + 𝑔(𝑥)) ≥ lim inf 𝑓 (𝑥) + lim inf 𝑔(𝑥);
𝑥→𝑥 0 𝑥→𝑥 0 𝑥→𝑥 0

4. e infine se 𝑓 (𝑥) ≥ 𝑔(𝑥) allora

lim sup 𝑓 (𝑥) ≥ lim sup 𝑔(𝑥), lim inf 𝑓 (𝑥) ≥ lim inf 𝑔(𝑥).
𝑥→𝑥0 𝑥→𝑥0 𝑥→𝑥0 𝑥→𝑥0

Dimostrazione. Per il punto 1. basti osservare che se la funzione 𝑓 (𝑥) ha 𝐿 come


insieme dei punti limite allora la funzione − 𝑓 (𝑥) ha −𝐿 come punti limite. Quindi
sup(−𝐿) = − inf 𝐿 e inf(−𝐿) = − sup 𝐿.

Per il punto 2. si osservi che se 𝐿 è l’insieme dei punti limite di 𝑓 (𝑥) allora l’insieme dei
punti limite di 𝜆 𝑓 (𝑥) è 𝜆𝐿. Se 𝜆 ≥ 0 si ha dunque sup 𝜆𝐿 = 𝜆 sup 𝐿 e inf 𝜆𝐿 = 𝜆 inf 𝐿
(se 𝜆 < 0 invece inf e sup si scambiano, come nel punto 1).

Per il punto 3. consideriamo il caso del lim sup (per il lim inf sarà analogo). Se
ℓ = lim sup( 𝑓 (𝑥) + 𝑔(𝑥)) significa che esiste una successione di 𝑎 𝑛 → 𝑥0 tale che
𝑓 (𝑎 𝑛 ) + 𝑔(𝑎 𝑛 ) → ℓ . Ma posso estrarre una sottosuccessione tale che anche il primo
addendo 𝑓 (𝑎 𝑛 𝑘 ) abbia limite. E poi posso estrarre una sotto-sottosuccesione in modo
che anche il secondo addendo 𝑔(𝑎 𝑛 𝑘 𝑗 ) abbia limite. Dunque avremo 𝑓 (𝑎 𝑛 𝑘 𝑗 ) → ℓ 1 ,
𝑔(𝑎 𝑛 𝑘 𝑗 → ℓ2 con ℓ1 +ℓ2 = ℓ . Ma allora per definizione di lim sup si avrà lim sup 𝑓 (𝑥) ≥ ℓ1
e lim sup 𝑔(𝑥) ≥ ℓ 2 da cui lim sup 𝑓 (𝑥) + lim sup 𝑔(𝑥) ≥ ℓ 1 + ℓ 2 = ℓ .

Per il punto 4. si osserva che se ℓ = lim sup 𝑓 (𝑥) allora per ogni 𝑞 > ℓ si ha defi-
nitivamente 𝑓 (𝑥) < 𝑞 e di conseguenza anche 𝑔(𝑥) < 𝑞 definitivamente. Dunque
lim sup 𝑔(𝑥) ≤ ℓ . Se invece poniamo ℓ = lim inf ℎ(𝑥) allora per ogni 𝑞 < 𝑙 si
Cesàro ha definitivamente 𝑔(𝑥) ≥ 𝑞 ma allora anche 𝑓 (𝑥) ≥ 𝑞 defitiviamente e quindi
lim inf 𝑓 (𝑥) ≥ ℓ .

Teorema 2.76 (convergenza alla Cesàro). Sia 𝑎 𝑛 una successione a termini positivi.
2.14 il teorema degli zeri 111

1. Se 𝑎 𝑛 → ℓ ∈ ℝ̄ allora
𝑛
1 X
· 𝑎𝑘 → ℓ .
𝑛 𝑘=1
𝑎 𝑛+1 √
2. Se 𝑎 𝑛 > 0, → ℓ ∈ [0 , +∞] allora 𝑛 𝑎 𝑛 → ℓ .
𝑎𝑛

Dimostrazione. Dimostriamo il primo punto. Per ogni 𝑞 < ℓ visto che 𝑎 𝑛 → ℓ deve
esistere 𝑁 tale che 𝑎 𝑛 ≥ 𝑞 se 𝑛 > 𝑁 . Dunque
P𝑁
1X 𝑛
1X 𝑁
1 X 𝑛
𝑘=1
𝑎𝑘 𝑛−𝑁
𝑏𝑛 = 𝑎𝑘 ≥ 𝑎𝑘 + 𝑞= + · 𝑞 → 𝑞.
𝑛 𝑘=1 𝑛 𝑘=1 𝑛 𝑘=𝑁+1 𝑛 𝑛

Significa che per ogni 𝑞 < ℓ si ha lim inf 𝑏 𝑛 ≥ 𝑞 e dunque lim inf 𝑏 𝑛 ≥ ℓ . Viceversa per
ogni 𝑞 > ℓ ragionando in maniera analoga si ottiene che 𝑏 𝑛 non supera una successione
che tende a 𝑞 . Dunque lim sup 𝑏 𝑛 ≤ 𝑞 . Mettendo insieme le cose si deduce che
lim 𝑏 𝑛 = 𝑞 .

Il punto 2 si può ricondurre all’1. Infatti


𝑎1 𝑎𝑛
𝑎1 𝑎𝑛 ln 𝑎 0 + ln + · · · + ln
r
√ 𝑎0 𝑎 𝑛−1
ln 𝑛
𝑎 𝑛 = ln 𝑛
𝑎0 · ··· = .
𝑎0 𝑎 𝑛−1 𝑛
𝑎𝑛 𝑎𝑛
Posto 𝑥 𝑛 = ln 𝑎 𝑛−1 se 𝑎 𝑛−1 → ℓ si ha 𝑥 𝑛 → ln ℓ (intendendo ln 0 = −∞ e ln(+∞) = +∞)
e dunque
√ ln 𝑎 0 𝑥 1 + · · · + 𝑥 𝑛
ln 𝑛
𝑎𝑛 = + → ln ℓ .
𝑛 𝑛
Facendo l’esponenziale di ambo i membri si trova il risultato desiderato.

Esercizio 2.77. Si applichi il risultato precedente per verificare che



𝑛
lim 𝑛=1

e
𝑛
lim √
𝑛
= 𝑒.
𝑛!

Esercizio 2.78. Si consideri la successione


(
2𝑛 se 𝑛 pari ,
𝑎𝑛 =
𝑛 · 2𝑛 se 𝑛 dispari.

Verificare che alla successione 𝑎 𝑛 si può applicare il criterio della radice ma non il criterio del
rapporto. Usare questo esempio per mostrare che le implicazioni enunciate nel teorema 2.76
non possono essere invertite.

2.14 il teorema degli zeri


teorema degli zeri
Teorema 2.79 (degli zeri). Sia 𝐼 ⊆ ℝ un intervallo, 𝑓 : 𝐼 → ℝ una funzione continua,
𝑎, 𝑏 ∈ 𝐼 tali che 𝑓 (𝑎) ≤ 0 e 𝑓 (𝑏) ≥ 0. Allora esiste 𝑐 ∈ 𝐼 tale che 𝑓 (𝑐) = 0.
112 2 funzioni continue, limiti e successioni

Dimostrazione. La dimostrazione che adottiamo è di particolare rilevanza in quanto


non solo permette di dimostrare l’esistenza del punto 𝑐 che risolve 𝑓 (𝑥) = 0 ma ci
metodo di bisezione
presenta un algoritmo, il metodo di bisezione, che può essere effettivamente utilizzato
per approssimare tale soluzione.

Possiamo supporre senza perdere di generalità che sia 𝑎 < 𝑏 . Poniamo 𝐴0 = 𝑎 , 𝐵0 = 𝑏


e consideriamo il punto medio 𝐶0 = (𝐴0 + 𝐵0 )/2. Scegliamo tra i due intervalli [𝐴0 , 𝐶0 ]
e [𝐶0 , 𝐵0 ] quello per cui il segno ai due estremi è discorde (o, caso fortunato, nullo).
Più precisamente se 𝑓 (𝐶0 ) ≥ 0 poniamo [𝐴1 , 𝐵1 ] = [𝐴0 , 𝐶0 ] altrimenti scegliamo
[𝐴1 , 𝐵1 ] = [𝐶0 , 𝐵0 ] così si ha, in ogni caso, 𝑓 (𝐴1 ) ≤ 0, 𝑓 (𝐵1 ) ≥ 0.

Consideriamo il punto medio 𝐶1 del nuovo intervallo [𝐴1 , 𝐵1 ] e ripetiamo il procedi-


mento indefinitamente. Quello che otteniamo sono due successioni 𝐴𝑛 , 𝐵𝑛 con queste
proprietà (che potrebbero essere dimostrate per induzione):

1. 𝐴𝑛 < 𝐵𝑛 , 𝐵𝑛 − 𝐴𝑛 = (𝑏 − 𝑎)/2𝑛 ;
2. 𝐴𝑛 è crescente, 𝐵𝑛 è decrescente;
3. 𝑓 (𝐴𝑛 ) ≤ 0, 𝑓 (𝐵𝑛 ) ≥ 0.

Essendo 𝐴𝑛 monotòna sappiamo che 𝐴𝑛 converge 𝐴𝑛 → 𝑐 . Inoltre visto che 𝐴𝑛 ∈ [𝑎, 𝑏]


anche 𝑐 ∈ [𝑎, 𝑏] (per la permanenza del segno delle successione 𝐴𝑛 − 𝑎 e 𝑏 − 𝐴𝑛 ).
Passando al limite nell’uguaglianza 𝐵𝑛 = 𝐴𝑛 + (𝑏 − 𝑎)/2𝑛 si ottiene che anche 𝐵𝑛 → 𝑐 .
Essendo 𝑓 continua avremo

𝑓 (𝐴𝑛 ) → 𝑓 (𝑐), 𝑓 (𝐵𝑛 ) → 𝑓 (𝑐).

Ma 𝑓 (𝐴𝑛 ) ≤ 0 e quindi per la permanenza del segno anche 𝑓 (𝑐) ≤ 0. D’altra


parte 𝑓 (𝐵𝑛 ) ≥ 0 e quindi 𝑓 (𝑐) ≥ 0. Si ottiene dunque 𝑓 (𝑐) = 0, come volevamo
dimostrare.

Esempio 2.80. Si voglia risolvere l’equazione

𝑥 5 − 𝑥 − 1 = 0.

Svolgimento. Posto 𝑓 (𝑥) = 𝑥 5 − 𝑥 − 1 è chiaro che la funzione 𝑓 : ℝ → ℝ è continua (in


quanto composizione di funzioni continue). Osserviamo che 𝑓 (0) = −1 e 𝑓 (2) = 29,
dunque la funzione soddisfa le ipotesi del teorema degli zeri sull’intervallo [0 , 2].
Sappiamo quindi che l’equazione in questione ha almeno una soluzione in tale
intervallo.

Utilizzando il metodo di bisezione possiamo determinare una soluzione con precisione


arbitraria. Posto 𝐴0 = 0, 𝐵0 = 2 abbiamo verificato che 𝑓 (𝐴0 ) < 0 e 𝑓 (𝐵0 ) > 0.
Prendiamo il punto medio 𝐶0 = 1 e calcoliamo la funzione: 𝑓 (𝐶0 ) = −1 < 0. Sappiamo
allora che una soluzione deve essere compresa nell’intevallo [𝐴1 , 𝐵1 ] = [𝐶0 , 𝐵0 ] = [1 , 2]
perché anche in tale intervallo valgono le ipotesi del teorema degli zeri. Il punto medio
di tale intervallo è 𝐶1 = 3/2 = 1.5 e risulta 𝑓 (3/2) = 163/32 > 0 dunque l’intervallo
successivo che andremo a considerare è [𝐴2 , 𝐵2 ] = [1 , 3/2]. Per non dover lavorare con
troppe cifre decimali invece di suddividere esattamente a metà quest’ultimo intervallo
consideriamo un punto intermedio 𝐶2 = 6/5 = 1.2 dove si ha 𝑓 (𝐶2 ) = 901/3125 > 0.
Sappiamo allora che una soluzione è compresa nell’intervallo [𝐴3 , 𝐵3 ] = [1 , 1.2].
Prendiamo il punto medio 𝐶3 = 11/10 = 1.1 e troviamo 𝑓 (𝐶3 ) = −48949/105 < 0.
2.15 il teorema di Weierstrass 113

√ Tabella 2.1: Le prime 100 cifre decimali


2 ≈ 1.4142135623 7309504880 1688724209 6980785696 7187537694
di alcune costanti calcolate con il metodo
8073176679 7379907324 7846210703 8850387534 3276415727 di bisezione usato nella dimostrazione
del teorema 2.79. Si veda il codice a pa-

3 ≈ 1.7320508075 6887729352 7446341505 8723669428 0525381038
gina 423.
0628055806 9794519330 1690880003 7081146186 7572485757


5+1
𝜑= 2 ≈ 1.6180339887 4989484820 4586834365 6381177203 0917980576
2862135448 6227052604 6281890244 9707207204 1893911375

Abbiamo quindi ottenuto che esiste 𝑥 ∈ (1.1 , 1.2) tale che 𝑓 (𝑥) = 0. Sappiamo quindi
che |𝑥 − 1.15 | < 0.05 cioè abbiamo trovato 𝑥 con un errore inferiore a 0.05.

Con molta pazienza si può procedere con il metodo di bisezione fino ad arrivare a
verificare che 𝑓 (116/102 ) = −596583424/1010 < 0 e 𝑓 (117/102 ) = 224480357/1010 > 0
da cui si ottiene che una soluzione è compresa tra 1.16 e 1.17 con un errore inferiore a
0.005. Con il calcolatore (si veda ad esempio il codice a pagina 423) si possono ottenere
più cifre significative: 𝑥 = 1.1673039782614187 . . .

proprietà dei valori intermedi


Corollario 2.81 (proprietà dei valori intermedi). Sia 𝐼 ⊆ ℝ un intervallo e 𝑓 : 𝐼 → ℝ una
funzione continua. Allora se 𝑓 assume due valori 𝑦1 e 𝑦2 allora 𝑓 assume anche tutti i valori
intermedi tra 𝑦1 e 𝑦2 . Detto altrimenti: una funzione continua manda intervalli in intervalli.

Dimostrazione. Se 𝑦1 e 𝑦2 sono valori assunti da 𝑓 significa che esistono 𝑥 1 , 𝑥 2 ∈ 𝐼 tali


che 𝑓 (𝑥 1 ) = 𝑦1 e 𝑓 (𝑥 2 ) = 𝑦2 . Allora scelto 𝑦 si consideri la funzione 𝑔(𝑥) = 𝑓 (𝑥) − 𝑦 .
Se 𝑦 è intermedio tra 𝑦1 e 𝑦2 la funzione 𝑔 assumerà segni opposti in 𝑥 1 e 𝑥 2 e dunque,
per il teorema degli zeri, dovrà esserci un punto 𝑥 in cui 𝑔 si annulla. In tale punto si
avrà dunque 𝑓 (𝑥) = 𝑦 , come volevamo dimostrare.

Lemma 2.82. Se 𝐼 è un intervallo di ℝ ogni funzione 𝑓 : 𝐼 → ℝ iniettiva e continua è


strettamente monotona.

Dimostrazione. Si può osservare che una funzione è strettamente monotona se mantiene


i valori intermedi cioè se dati tre punti 𝑥 < 𝑦 < 𝑧 risulta sempre che 𝑓 (𝑦) è un valore
intermedio tra 𝑓 (𝑥) e 𝑓 (𝑧):

𝑓 (𝑥) < 𝑓 (𝑦) < 𝑓 (𝑧) oppure 𝑓 (𝑥) > 𝑓 (𝑦) > 𝑓 (𝑧).

Se ciò non accadesse, ad esempio se fosse 𝑓 (𝑦) > 𝑓 (𝑧) > 𝑓 (𝑥) con 𝑥 < 𝑦 < 𝑧 allora per
la continuità di 𝑓 dovrebbe esistere un valore intermedio tra 𝑥 e 𝑦 in cui la funzione
assume il valore 𝑓 (𝑧). Ma allora la funzione non sarebbe iniettiva.

2.15 il teorema di Weierstrass

Ricordiamo che nella definizione 1.83 abbiamo definito i concetti di massimo, minimo,
estremo superiore e inferiore di una funzione a valori reali. successioni minimizzanti/massimizzanti
114 2 funzioni continue, limiti e successioni

Lemma 2.83 (successioni minimizzanti/massimizzanti). Sia 𝐴 un insieme non vuoto e


sia 𝑓 : 𝐴 → ℝ una funzione. Allora esistono due successioni 𝑎 𝑛 e 𝑏 𝑛 di punti di 𝐴 tali che

lim 𝑓 (𝑎 𝑛 ) = inf 𝑓 (𝐴), lim 𝑓 (𝑏 𝑛 ) = sup 𝑓 (𝐴).


𝑛→+∞ 𝑛→+∞

Dimostrazione. Ricordiamo che 𝑓 (𝐴) = { 𝑓 (𝑥) : 𝑥 ∈ 𝐴} è l’immagine della funzione 𝑓 .


Facciamo la dimostrazione per l’estremo inferiore, risultato analogo si potrà ottenere
per l’estremo superiore.

Sia 𝑚 = inf 𝑓 (𝐴). Se 𝑚 = −∞ significa che 𝑓 (𝐴) non è inferiormente limitato, in


particolare per ogni 𝑛 ∈ ℝ esiste 𝑎 𝑛 tale che 𝑓 (𝑎 𝑛 ) < −𝑛 . Dunque (per confronto)
𝑓 (𝑎 𝑛 ) → −∞ come volevamo dimostrare.

Se 𝑚 ∈ ℝ per le proprietà caratterizzanti l’estremo inferiore sappiamo che per ogni


𝜀 > 0 esiste 𝑎 ∈ 𝐴 tale che 𝑓 (𝑎) < 𝑚 + 𝜀. Per ogni 𝑛 ∈ ℕ possiamo scegliere
𝜀 = 1/𝑛 e ottenere quindi una successione 𝑎 𝑛 tale che 𝑓 (𝑎 𝑛 ) < 𝑚 + 1/𝑛 . D’altra
parte essendo 𝑚 un minorante di 𝑓 (𝐴) sappiamo che 𝑚 ≤ 𝑓 (𝑎 𝑛 ). Abbiamo dunque
𝑚 ≤ 𝑓 (𝑎 𝑛 ) < 𝑚 + 1/𝑛 e per il teorema dei carabinieri possiamo quindi concludere che
teorema di Weierstrass 𝑓 (𝑎 𝑛 ) → 𝑚 per 𝑛 → +∞.

Teorema 2.84 (Weierstrass). Siano 𝑎, 𝑏 ∈ ℝ con 𝑎 ≤ 𝑏 e sia 𝑓 : [𝑎, 𝑏] → ℝ una funzione


continua. Allora esistono punti di massimo e di minimo per 𝑓 su [𝑎, 𝑏].

Dimostrazione. Dimostriamo solamente che 𝑓 ha minimo, per il massimo la dimostra-


zione procede infatti in maniera del tutto analoga.

Sia 𝑚 = inf 𝑓 ([𝑎, 𝑏]). Per il lemma precedente sappiamo che esiste una successione 𝑎 𝑛
minimizzante ovvero tale che 𝑎 𝑛 ∈ 𝐴 e 𝑓 (𝑎 𝑛 ) → 𝑚 per 𝑛 → +∞.

Per il teorema di Bolzano-Weierstrass dalla successione 𝑎 𝑛 possiamo estrarre una


sottosuccessione 𝑎 𝑛 𝑘 convergente: 𝑎 𝑛 𝑘 → 𝑥 0 . Visto che 𝑎 𝑛 𝑘 ∈ [𝑎, 𝑏] si avrà, per il
teorema della permanenza del segno, anche 𝑥 0 ∈ [𝑎, 𝑏] (si applichi la permanenza del
segno alle successioni 𝑎 𝑛 𝑘 − 𝑎 e 𝑏 − 𝑎 𝑛 𝑘 ).

Dunque abbiamo una successione 𝑎 𝑛 𝑘 → 𝑥 0 con 𝑎 𝑛 𝑘 ∈ [𝑎, 𝑏] e 𝑥 0 ∈ [𝑎, 𝑏]. Essendo 𝑓


continua si avrà dunque 𝑓 (𝑎 𝑛 𝑘 ) → 𝑓 (𝑥 0 ). Ma noi sapevamo che 𝑓 (𝑎 𝑛 ) → 𝑚 e dunque
anche 𝑓 (𝑎 𝑛 𝑘 ) → 𝑚 . Concludiamo quindi che 𝑓 (𝑥 0 ) = 𝑚 cioè 𝑚 , l’estremo inferiore, è
un valore assunto dalla funzione ed è quindi un minimo. Dal canto suo 𝑥 0 è un punto
di minimo assoluto.

Corollario 2.85 (limitatezza delle funzioni continue). Sia 𝑓 : [𝑎, 𝑏] → ℝ una funzione
continua. Allora 𝑓 è limitata.

Dimostrazione. Visto che 𝑓 ha massimo 𝑀 e minimo 𝑚 si ha 𝑓 (𝑥) ∈ [𝑚, 𝑀] per ogni


𝑥 ∈ [𝑎, 𝑏]. Ovviamente 𝑚 > −∞ e 𝑀 < +∞ in quanto 𝑚 e 𝑀 sono valori della
funzione 𝑓 .
2.16 successioni ricorsive 115

2.16 successioni ricorsive Probabilmente già dal IX secolo a.C. era


noto ai greci che la circonferenza, tra tut-
te le figure piane che racchiudono una
Le successioni ricorsive sono le successioni definite per induzione (tramite il teore- area prefissata, è quella di lunghezza
ma 1.20): minima (proprietà isoperimetrica). Nel-
l’Eneide Virgilio racconta che Didone si
(
𝑎0 = 𝛼 trovò ad affrontare un problema simile
𝑎 𝑛+1 = 𝑓 (𝑎 𝑛 ). nella fondazione di Cartagine. Una for-
malizzazione completa della proprietà
Si rimanda al capitolo 8 per uno studio approfondito di questo tipo di successioni. La isoperimetrica del cerchio ha dovuto at-
prima parte di quel capitolo è infatti accessibile con le nozioni che sono state sviluppate tendere fino al 1800. Eulero (Leonhard
Euler 1707–1783) pensò di aver trovato
finora. La seconda parte richiederà invece degli strumenti più avanzati.
una dimostrazione che si fondava su que-
sto risultato: presa una qualunque super-
ficie chiusa nello spazio, se questa non
è una sfera è possibile farne una piccola
modifica in modo da ottenere una nuova
superficie che racchiude lo stesso volu-
me ma che ha area strettamente inferiore.
Fu proprio Karl Weiestrass (1815–1897)
ad accorgersi che quanto dimostrato da
Eulero (e poi successivamente da Steiner)
non è sufficiente a garantire la minimali-
tà della sfera. Infatti Eulero dimostra che
non ci può essere un minimo che non sia
la sfera, ma non dimostra che il minimo
esiste e quindi non è detto che la sfera
sia il minimo: potrebbero esserci infini-
te superfici 𝑆1 , 𝑆2 , . . . , 𝑆𝑛 , . . . ognuna
con area minore di quella della sfera e
ognuna con area maggiore della succes-
siva: 𝐴(𝑆𝑛+1 ) < 𝐴(𝑆𝑛 ). Per concludere il
ragionamento di Eulero era necessario
dimostrare che in una situazione del ge-
nere le superifici 𝑆𝑛 debbano, in qualche
senso, tendere alla superficie sferica e
che le loro aree debbano tendere all’area
della sfera. In astratto questo è quanto
viene enunciato nel teorema che porta il
suo nome. Dunque Weiestrass completò
la dimostrazione della proprietà isoperi-
metrica in dimensione 𝑛 = 2 (in realtà il
risultato è comunque attribuito a Steiner
che, pur non avendo colto il problema
obiettato da Weierstrass, aveva in effetti
dimostrato tutte le proprietà necessarie
per giungere alla conclusione). Salendo
alla dimensione 𝑛 = 3 è naturale imma-
ginare che la superficie che racchiude
il volume maggiore con area fissata sia
la sfera. Questo spiega il motivo per cui
una goccia d’acqua, in assenza di gravità,
dovrebbe assumere una forma sferica: a
causa della tensione superficiale, infat-
ti, la superficie della goccia tenderà ad
avere l’area minima. Formalizzare e di-
mostrare questo risultato risulta molto
più complicato. Per superifici qualun-
que la prima dimostrazione formale per
𝑛 ≥ 3 è dovuta al matematico italiano
Ennio De Giorgi (1928–1996) che forma-
lizzò il concetto di perimetro introdotto
da Renato Caccioppoli (1904–1959).
serie 3
Data una successione 𝑎 𝑛 di numeri reali o complessi possiamo considerare la succes-
somme parziali
sione delle cosiddette somme parziali
𝑛
X
𝑆𝑛 = 𝑎𝑘 .
𝑘=0

Potremo scrivere più concisamente 𝑆𝑛 = 𝑎 𝑛 . Intuitivamente si intende sommare i


P
termini della successione 𝑎 𝑘 per 𝑘 che parte da 0 fino a 𝑘 = 𝑛 :
𝑛
X
𝑎 𝑘 = 𝑎0 + 𝑎1 + 𝑎2 + · · · + 𝑎 𝑛 .
𝑘=0

𝑛
X
Formalmente la somma 𝑆𝑛 = 𝑎 𝑘 è definita ricorsivamente dalle seguenti relazioni:
𝑘=0
(
𝑆0 = 𝑎 0 ,
𝑆𝑛+1 = 𝑆𝑛 + 𝑎 𝑛+1 .

termini

I numeri 𝑎 𝑛 si chiamano termini della serie. Se la successione delle somme parziali somma
ammette limite il limite viene chiamato somma della serie e si indica con
+∞
X 𝑛
X
𝑎 𝑘 = lim 𝑆𝑛 = lim 𝑎𝑘 .
𝑛→+∞ 𝑛→+∞
𝑘=0 𝑘=0

La terminologia già introdotta per le successioni si applica anche alle serie che sono carattere

in effetti anch’esse delle successioni. In particolare una serie può essere convergente,
divergente o indeterminata. Questo è il carattere della serie.

Più in generale si potrà considerare la somma che parte da un certo indice 𝑚 ∈ ℤ.


Fissato 𝑚 si potrà ad esempio considerare la serie:
𝑛
X
𝑆𝑛 = 𝑎𝑘
𝑘=𝑚

che risulta definita per ogni 𝑛 ∈ ℕ , 𝑛 ≥ 𝑚 come

𝑆𝑛 = 𝑎 𝑚 + 𝑎 𝑚+1 + · · · + 𝑎 𝑛 .

Esempio 3.1. Consideriamo la serie 𝑆𝑛 definita come la somma dei numeri naturali da 1 a 𝑛 :
𝑛
X
𝑆𝑛 = 𝑘 = 1 + 2 + · · · + 𝑛.
𝑘=1
118 3 serie

Si può dimostrare facilmente per induzione che si ha

𝑛(𝑛 + 1)
𝑆𝑛 = .
2
E mediante la definizione di limite si può verificare che risulta 𝑆𝑛 → +∞.

𝑛 è divergente:
P
Questo si esprime dicendo che la serie
+∞
X
𝑘 = +∞.
𝑘=1

Esempio 3.2 (la serie geometrica). Fissato 𝑞 ∈ ℝ o 𝑞 ∈ ℂ alla successione 𝑎 𝑛 = 𝑞 𝑛 di


termini
𝑎0 = 1, 𝑎1 = 𝑞, 𝑎2 = 𝑞 2 , 𝑎3 = 𝑞 3 , . . .
𝑞 𝑛 le cui somme parziali sono
P
serie geometrica è associata la serie geometrica

𝑆0 = 1 , 𝑆1 = 1 + 𝑞, 𝑆2 = 1 + 𝑞 + 𝑞 2 , ...

Il seguente teorema ci mostra come per diversi valori di 𝑞 la serie geometrica assume
tutti i possibili caratteri: convergente, divergente, indeterminato.
somma della serie geometrica
Teorema 3.3 (somma della serie geometrica). Sia 𝑞 ∈ ℂ. Se 𝑞 ≠ 1 si ha
𝑛
1 − 𝑞 𝑛+1
𝑞𝑘 =
X
.
𝑘=0
1−𝑞

Se |𝑞| < 1 la serie geometrica converge:


+∞
1
𝑞𝑘 =
X
.
𝑘=0
1−𝑞

Se |𝑞| ≥ 1 la serie non converge ma dobbiamo distinguere se la serie si considera a valori reali
o complessi per determinarne il carattere.

Se consideriamo la serie a valori reali (quindi 𝑞 ∈ ℝ) se 𝑞 ≥ 1 la serie diverge a +∞, se


𝑞 ≤ −1 la serie è indeterminata.

Se consideriamo la serie a valori complessi 𝑞 ∈ ℂ, se |𝑞| > 1 la serie diverge a ∞, lo stesso


succede se 𝑞 = 1. Se |𝑞| = 1 ma 𝑞 ≠ 1 la serie è indeterminata.

Dimostrazione. Il primo risultato riguarda una somma finita. Si ha

𝑛 𝑛 𝑛 𝑛 𝑛+1
𝑞𝑘 = 𝑞𝑘 − 𝑞 · 𝑞𝑘 = 𝑞𝑘 − 𝑞 𝑘 = 1 − 𝑞 𝑛+1
X X X X X
(1 − 𝑞) ·
𝑘=0 𝑘=0 𝑘=0 𝑘=0 𝑘=1

da cui si ottiene, se 𝑞 ≠ 1, il risultato voluto.

Passando al limite per 𝑛 → +∞, se |𝑞| < 1 si nota che 𝑞 𝑛+1 = |𝑞| 𝑛+1 → 0 e la serie

1
converge a 1−𝑞 .
119

Consideriamo ora la serie a valori reali. Se 𝑞 > 1 osserviamo che 𝑞 𝑛 → +∞ e quindi


la serie diverge a +∞ (infatti in questo caso 1 − 𝑞 è negativo). Se 𝑞 = 1 si ha 𝑞 𝑘 = 1 e
𝑛
𝑞 𝑘 = 𝑛 + 1 → +∞.
X
quindi
𝑘=0

Per gli altri casi osserviamo che si ha

𝑛
1 − 𝑞 𝑘+1 1 𝑞
𝑞𝑘 = · 𝑞𝑘
X
= −
𝑘=0
1−𝑞 1−𝑞 1−𝑞

e dunque il carattere della serie coincide con il carattere della successione 𝑞 𝑘 . Se


consideriamo
𝑘 la successione a valori complessi e se |𝑞| > 1 la serie è divergente a ∞
𝑘
in quanto 𝑞 = |𝑞| → +∞. Se invece consideriamo la serie a valori reali e 𝑞 < 1

(il caso 𝑞 ≥ 1 l’abbiamo già considerato) la serie risulta indeterminata in quanto in
valore assoluto tende a +∞ ma il segno dei termini pari è opposto al segno dei termini
dispari.

Ci rimane da considerare il caso |𝑞| = 1, 𝑞 ≠ 1. Se 𝑞 è reale c’è solo il caso 𝑞 = −1 e


sappiamo che (−1) 𝑘 è indeterminata. Anche se 𝑞 è complesso vogliamo dimostrare
che la successione
𝑘 𝑞 𝑘 è indeterminata: se non lo fosse si avrebbe 𝑞 𝑘 → ℓ con |ℓ | = 1 in
quanto 𝑞 = 1. e passando al limite nell’uguaglianza

𝑞 𝑘+2 = 𝑞 · 𝑞 𝑘+1

si avrebbe ℓ = 𝑞 · ℓ da cui (dividendo per ℓ ) otteniamo 𝑞 = 1. Dunque se 𝑞 ≠ 1 la


successione 𝑞 𝑘 è indeterminata e così è la serie geometrica.
linearità della somma infinita

Teorema 3.4 (linearità della somma). Se 𝑎 𝑛 e 𝑏 𝑛 sono convergenti allora per ogni
P P
𝜆, 𝜇 ∈ ℂ anche (𝜆𝑎 𝑛 + 𝜇𝑏 𝑛 ) è convergente e si h
P

+∞
X +∞
X +∞
X
(𝜆𝑎 𝑛 + 𝜇𝑏 𝑛 ) = 𝜆 𝑎𝑛 + 𝜇 𝑏𝑛 .
𝑘=0 𝑘=0 𝑘=0

Dimostrazione. Se 𝑆𝑛 e 𝑅 𝑛 sono le somme parziali delle serie 𝑎 𝑛 e 𝑏 𝑛 allora le


P P
somme parziali della serie (𝜆𝑎 𝑛 + 𝜇𝑏 𝑛 ) sono 𝜆𝑆𝑛 + 𝜇𝑅 𝑛 (in quanto sulle somme
P
finite vale la proprietà distributiva e commutativa). Ma se 𝑆𝑛 → 𝑆 e 𝑅 𝑛 → 𝑅 allora
𝜆𝑆𝑛 + 𝜇𝑅 𝑛 → 𝜆𝑆 + 𝜇𝑅 .

Osserviamo che le serie (così come le successioni) formano uno spazio vettoriale in cui
le operazioni di somma e prodotto per scalare vengono eseguite termine a termine:
𝑎 𝑛 + 𝑏 𝑛 = (𝑎 𝑛 + 𝑏 𝑛 ), 𝜆 𝑎 𝑛 = (𝜆𝑎 𝑛 ). Il teorema precedente ci dice allora che
P P P P P
le serie (così come le successioni) convergenti sono un sottospazio vettoriale e che la
condizione necessaria per la convergenza
somma della serie (così come il limite della successione) è un’operatore lineare definito
su tale sottospazio.

𝑎 𝑛 converge allora
P
Teorema 3.5 (condizione necessaria per la convergenza). Se la serie
𝑎 𝑛 → 0.
120 3 serie

P𝑛
Dimostrazione. Se la serie 𝑎 𝑛 converge significa che le somme parziali 𝑆𝑛 = 𝑎𝑘
P
𝑘=0
convergono: 𝑆𝑛 → 𝑆 . Ma allora

𝑎 𝑛 = 𝑆𝑛 − 𝑆𝑛−1 → 𝑆 − 𝑆 = 0.

Teorema 3.6 (stabilità del carattere). Se le due successioni 𝑎 𝑛 e 𝑏 𝑛 differiscono solo su un


stabilità del carattere numero finito di termini, allora le serie corrispondenti 𝑎 𝑛 e 𝑏 𝑛 hanno lo stesso carattere.
P P

Dimostrazione. Se le successioni differiscono su un numero finito di termini significa


che esiste un 𝑁 ∈ ℕ tale che per ogni 𝑘 > 𝑁 si ha 𝑎 𝑘 = 𝑏 𝑘 . Dunque se indichiamo con
𝑆𝑛 = 𝑛𝑘=0 𝑎 𝑘 e 𝑅 𝑛 = 𝑛𝑘=0 𝑏 𝑘 le corrispondenti successioni delle somme parziali, si
P P
avrà per ogni 𝑛 > 𝑁

𝑛
X 𝑛
X 𝑁
X
𝑆𝑛 − 𝑅 𝑛 = 𝑎𝑘 − 𝑏𝑘 = (𝑎 𝑘 − 𝑏 𝑘 ) = 𝐶
𝑘=0 𝑘=0 𝑘=0

dove 𝐶 è una costante indipendente da 𝑛 . Dunque

𝑆𝑛 = 𝑅 𝑛 + 𝐶.

Se il limite di 𝑅 𝑛 non esiste allora non esiste neanche il limite di 𝑆𝑛 (altrimenti essendo
𝑅 𝑛 = 𝑆𝑛 − 𝐶 anche il limite di 𝑅 𝑛 dovrebbe esistere). Se il limite di 𝑅 𝑛 è infinito allora
il limite di 𝑆𝑛 è uguale al limite di 𝑅 𝑛 . E se il limite di 𝑅 𝑛 è finito anche il limite di 𝑆𝑛 è
finito.

Dunque il carattere della successione 𝑆𝑛 è lo stesso della successione 𝑅 𝑛 cioè le due


serie hanno lo stesso carattere.

Se una serie ha primo termine con un indice diverso da 0 ci si potrà sempre ricondurre
(con un cambio di variabile) ad una serie il cui indice parte da zero. Ad esempio
(facendo il cambio di variabile 𝑗 = 𝑘 − 1 da cui 𝑗 = 0 quando 𝑘 = 1 e ricordando che
l’indice utilizzato nelle somme delle serie è una variabile muta):
+∞ +∞ +∞
X 1 X 1 X 1
= = .
𝑘=1 2𝑘 𝑗=0 2 𝑗+1 𝑘=0 2 𝑘+1

Si osservi inoltre che in base al teorema precedente quale sia il primo indice da cui si
comincia a sommare non è rilevante per quanto riguarda il carattere della serie. Se
però la serie è convergente la sua somma può variare, ad esempio:
!
+∞ +∞
X 1 X 1
= − 20 .
𝑘=1 2𝑘 𝑘=0 2𝑘

Nota bene: in molti libri si scrive ∞ al posto di +∞. Risulta quindi molto comune
omettere il segno + davanti a ∞ nella terminologia delle serie (e anche delle successioni)
visto che gli indici si intendono numeri naturali e quindi −∞ non avrebbe senso.
3.1 serie telescopiche 121

Ci sono però casi in cui può essere utile usare anche gli indici negativi, ad esempio se
𝑎 𝑘 è definita per ogni 𝑘 ∈ ℤ si potrebbe definire (ma non lo faremo):
+∞
X +∞
X +∞
X
𝑎𝑘 = 𝑎𝑘 + 𝑎(−𝑘)
𝑘=−∞ 𝑘=0 𝑘=1

richiedendo che entrambe le serie al lato destro dell’uguaglianza esistano e non abbiano
somme infinite di segno opposto.

𝑎 𝑛 una serie convergente. Allora


P
Teorema 3.7 (coda di una serie convergente). Sia
+∞
X
lim 𝑎 𝑘 = 0.
𝑛→+∞
𝑘=𝑛+1

Dimostrazione. Posto
𝑛
X
𝑆𝑛 = 𝑎𝑘 ,
𝑘=0

per definizione di serie convergente sappiamo che esiste 𝑆 finito tale che 𝑆𝑛 → 𝑆 .
Osserviamo allora che
+∞
X 𝑁
X
𝑎 𝑘 = lim 𝑎 𝑘 = lim 𝑆 𝑁 − 𝑆𝑛 = 𝑆 − 𝑆𝑛
𝑁→+∞ 𝑁→+∞
𝑘=𝑛+1 𝑘=𝑛+1

e, per 𝑛 → +∞ si ha ovviamente 𝑆 − 𝑆𝑛 → 𝑆 − 𝑆 = 0.

3.1 serie telescopiche

Una serie scritta nella forma X


(𝑎 𝑘 − 𝑎 𝑘+1 )
viene detta telescopica in quanto i singoli termini della somma (come i tubi di serie telescopica
un cannocchiale), si semplificano uno con l’altro (permettendo al cannocchiale di
chiudersi):
𝑛
X 𝑛
X 𝑛+1
X
𝑆𝑛 = (𝑎 𝑘 − 𝑎 𝑘+1 ) = 𝑎𝑘 − 𝑎 𝑘 = 𝑎0 − 𝑎 𝑛+1 .
𝑘=0 𝑘=0 𝑘=1

In linea teorica ogni serie può essere scritta in forma telescopica, basta infatti scegliere
𝑎 0 = 0, 𝑎 𝑛 = −𝑆𝑛−1 , affinché valga la relazione precedente. Scrivere una serie in forma
telescopica è quindi equivalente a determinare la successione delle somme parziali.

Esempio 3.8 (serie di Mengoli). Si ha


+∞
X 1
= 1.
𝑛=1 𝑛(𝑛 + 1)

Dimostrazione. Infatti
𝑛 𝑛  𝑛 𝑛+1 
X 1 X 1 1 X 1 X 1 1
= − = − =1− → 1.
𝑘=1
𝑘(𝑘 + 1) 𝑘=1 𝑘 𝑘 + 1 𝑘=1
𝑘 𝑘=2 𝑘 𝑛+1
122 3 serie

3.2 serie a termini positivi

Nel seguito considereremo serie i cui termini sono numeri reali positivi (o almeno
non negativi). Quando scriveremo 𝑎 𝑛 > 0 (o 𝑎 𝑛 ≥ 0) sarà sempre sottointeso che
𝑎 𝑛 ∈ ℝ visto che per i numeri complessi non reali non abbiamo definito la relazione
d’ordine.
carattere delle serie a termini positivi

Teorema 3.9 (carattere delle serie a termini positivi). Se 𝑎 𝑛 ≥ 0 la serie 𝑎 𝑛 è regolare:


P
o converge oppure diverge a +∞.

Dimostrazione. Se 𝑎 𝑛 ≥ 0 essendo 𝑎 𝑛 = 𝑆𝑛 − 𝑆𝑛−1 significa che la successione 𝑆𝑛


delle somme parziali è crescente. Dunque il limite delle 𝑆𝑛 esiste e non può essere
criterio del confronto negativo.

𝑎𝑛 e 𝑏 𝑛 serie a termini positivi che si


P P
Teorema 3.10 (criterio del confronto). Siano
confrontano: 0 ≤ 𝑎 𝑛 ≤ 𝑏 𝑛 . Allora
+∞
X +∞
X
𝑎𝑛 ≤ 𝑏𝑛 .
𝑘=0 𝑘=0

𝑏 𝑛 converge anche 𝑎 𝑛 converge e se 𝑎 𝑛 diverge anche 𝑏 𝑛 diverge.


P P P P
In particolare se

Quest’ultimo risultato vale anche se 0 ≤ 𝑎 𝑛 ≪ 𝑏 𝑛 .

Dimostrazione. Se 𝑆𝑛 sono le somme parziali di 𝑎 𝑛 e 𝑅 𝑛 sono le somme parziali di


P
𝑏 𝑛 si ha 𝑆𝑛 ≤ 𝑅 𝑛 e il risultato si riconduce al confronto tra successioni.
P

Nel caso in cui 𝑎 𝑛 ≪ 𝑏 𝑛 per definizione sappiamo che 𝑏𝑎𝑛𝑛 → 0 e quindi dalla definizione
di limite sappiamo che esiste 𝑁 tale che per ogni 𝑛 > 𝑁 si ha (avendo scelto 𝜀 = 1)
𝑎𝑛
< 1.
𝑏𝑛

Dunque si ottiene 𝑎 𝑛 ≤ 𝑏 𝑛 per tutti gli 𝑛 tranne al più un numero finito. Sapendo che
il carattere della serie non cambia se si modifica la serie su un numero finito di termini
ci si riconduce al caso precedente.

Esempio 3.11. La serie


+∞
X 1
(3.1)
𝑘=1 𝑘2
è convergente. Infatti osservando che si ha per ogni 𝑛 > 0

1 1

(𝑛 + 1)2 𝑛(𝑛 + 1)
3.2 serie a termini positivi 123

possiamo affermare che


+∞ +∞ +∞
X 1 X 1 X 1
=1+ ≤ 1 + =2
𝑘=1 𝑘2 𝑘=1 (𝑘 + 1)2
𝑘=1
𝑘(𝑘 + 1)

in quanto ci siamo ricondotti alla serie telescopica di Mengoli che ha somma pari a 1.

Sappiamo quindi che la serie (3.1) è convergente senza sapere esattamente quale sia la sua
somma. Possiamo però trovare numericamente delle approssimazioni della somma, facendo
la somma dei primi termini e stimando l’errore tramite la serie di Mengoli, di cui sappiamo
calcolare la somma. Infatti se 𝑆 𝑁 è la somma parziale dei primi 𝑁 termini e 𝑆 = lim 𝑆 𝑁 è la
somma della serie, essendo 1/(𝑘 + 1)2 ≤ 1/(𝑘 2 + 𝑘) si ha
+∞
X 1 1
𝑆𝑁 ≤ 𝑆 ≤ 𝑆𝑁 + ≤ 𝑆𝑁 + .
𝑘=𝑁
𝑘(𝑘 + 1) 𝑁

Per calcolare le prime 6 cifre decimali esatte basterà quindi sommare il primo milione di
termini della serie. Lo si può fare, ad esempio, con il codice riportato a pagina 424, ottenendo
𝑆 = 1.644934 . . .

Utilizzando strumenti molto più avanzati Eulero (Leonard Euler, 1707–1783) è riuscito ad
esprimere la somma di questa serie mediante costanti matematiche fondamentali (noi lo faremo
con un metodo diverso nell’esercizio 7.78).
criterio del confronto asintotico

Corollario 3.12 (criterio del confronto asintotico). Se 𝑎 𝑛 e 𝑏 𝑛 sono successioni a termini


positivi, asintoticamente equivalenti (definizione 2.56), allora le serie corrispondenti 𝑎 𝑛 e
P
𝑏 𝑛 hanno lo stesso carattere.
P

Dimostrazione. Le serie a termini positivi non possono essere indeterminate quindi è


sufficiente verificare che se una serie converge, converge anche l’altra. Essendo 𝑎 𝑛 /𝑏 𝑛
convergente tale rapporto deve anche essere limitato, quindi esiste 𝐶 ∈ ℝ tale che

𝑎𝑛 ≤ 𝐶 · 𝑏𝑛 .

𝑏 𝑛 converge anche 𝐶 · 𝑏 𝑛 converge e, per confronto, converge anche


P P
Se la serie
𝑎𝑛 .
P

Viceversa, scambiando il ruolo di 𝑎 𝑛 e 𝑏 𝑛 si verifica che se 𝑎 𝑛 converge, converge anche


𝑏𝑛 .

Esempio 3.13. La serie


X 𝑛 2 + 2𝑛 + 3
𝑛 2𝑛 4 − 𝑛 3 + 𝑛 + 1
è convergente. Infatti si può facilmente verificare che

𝑛 2 + 2𝑛 + 3 1
∼ .
2𝑛 − 𝑛 + 𝑛 + 1
4 3 2𝑛 2

Ma sappiamo che la serie 1/𝑛 2 è convergente, di conseguenza anche la serie 1/(2𝑛 2 ) lo è


P P
criterio della radice
(per linearità della somma) e quindi, per confronto asintotico, anche la serie data è convergente.
124 3 serie

Teorema 3.14 (criterio della radice). Sia 𝑎 𝑛 una serie a termini non negativi (cioè 𝑎 𝑛 ≥ 0)
P

tale che 𝑛 𝑎 𝑛 → ℓ ∈ [0 , +∞]. Se ℓ < 1 allora la serie converge. Se ℓ > 1 allora la serie
diverge.

Più in generale il risultato è valido con



ℓ = lim sup 𝑛
𝑎𝑛

anche nel caso in cui il limite di 𝑛
𝑎 𝑛 non dovesse esistere.

Dimostrazione. Nel caso ℓ < 1 prendiamo 𝑞 con ℓ < 𝑞 < 1 e poniamo 𝜀 = 𝑞 − ℓ . Per la
√ √
definizione di limite 𝑛 𝑎 𝑛 → ℓ (ma basta che sia lim sup 𝑛 𝑎 𝑛 = ℓ ) sappiamo esistere 𝑁
tale che per ogni 𝑛 > 𝑁 si abbia

𝑛
𝑎𝑛 < ℓ + 𝜀 = 𝑞

cioè
𝑎𝑛 < 𝑞 𝑛 .
Sapendo che 𝑞 𝑛 converge, sapendo anche che il carattere della serie non cambia
P
modificando un numero finito di termini, per confronto possiamo concludere che
anche la serie 𝑎 𝑛 converge.
P

Se ℓ > 1 si ha che 𝑛 𝑎 𝑛 > 1 e quindi 𝑎 𝑛 > 1 per infiniti valori di 𝑛 . La successione 𝑎 𝑛
non è infinitesima e quindi la serie non può convergere.

Esempio 3.15. La serie


2(ln 𝑘)−𝑘
X
𝑘

è convergente. Infatti si ha
p𝑘 ln 𝑘−𝑘 ln 𝑘 1
2ln 𝑘−𝑘 = 2 𝑘 =2 𝑘 −1 → 2− 1 = < 1.
2
criterio del rapporto
Teorema 3.16 (criterio del rapporto). Sia 𝑎 𝑛 una serie a termini non negativi ( 𝑎 𝑛 ≥ 0)
P
tale che 𝑎 𝑛+1 /𝑎 𝑛 → ℓ ∈ [0 , +∞]. Se ℓ < 1 allora la serie converge. Se ℓ > 1 la serie diverge.

Dimostrazione. Non sarebbe difficile fare una dimostrazione diretta, simile alla dimo-
strazione fatta per il criterio della radice. Possiamo però osservare che per il criterio

di convergenza alla Cesàro (teorema 2.76) si ha 𝑛 𝑎 𝑛 → ℓ quindi ci riconduciamo al
criterio della radice senza dover fare ulteriori dimostrazioni.

Esempio 3.17. Per ogni 𝑥 ≥ 0 la serie


X 𝑥𝑛
𝑛!
converge.

Dimostrazione. Applichiamo il criterio del rapporto. Posto 𝑎 𝑛 = 𝑥 𝑛 /𝑛 ! si ha

𝑎 𝑛+1 𝑥 𝑛+1 𝑛! 𝑥
= · 𝑛 = → 0 < 1.
𝑎𝑛 (𝑛 + 1)! 𝑥 𝑛+1
3.2 serie a termini positivi 125

Dunque la serie converge.

associatività della somma di una serie

Esempio 3.18. Posto 𝑎 𝑘 = (−1) 𝑘 sappiamo che la serie corrispondente:

1−1+1−1+1...

è indeterminata perché le somme parziali sono


(
𝑛
1 se 𝑛 pari
(−1) 𝑘 =
X
𝑆𝑛 =
𝑘=0 0 se 𝑛 è dispari.

Se però associamo i termini a due a due otteniamo la serie

(1 − 1) + (1 − 1) + (1 − 1) · · · = 0 + 0 + 0 + · · · = 0

che è convergente. Il motivo è che la successione delle somme parziali di questa nuova serie
è una particolare estratta (quella con gli indici pari) della successione delle somme parziali
della serie originale. Quindi non ci dovrebbe sorprendere il fatto che nonostante la serie
originale fosse indeterminata è possibile associare i termini della serie in modo da ottenere
una serie regolare (in questo caso convergente). In effetti per il teorema 2.65 di Bolzano-
Weierstrass sappiamo che è sempre possibile estrarre una sottosuccessione regolare (convergente
o divergente) da qualunque successione. Anche quando da una serie indeterminata si estrae una
serie convergente la somma della serie può dipendere da come i termini vengono associati. Se ad
esempio nella serie precedente prendessimo solamente le somme di indice dispari otterremmo:

1 + (−1 + 1) + (−1 + 1) + · · · = 1.

L’esempio precedente ci mostra che associando i termini di una serie indeterminata è


possibile ottenere serie con carattere e somma diversi. Il seguente teorema ci dice che
questo fenomeno cattivo può solo avvenire quando si parte da una serie indeterminata.
Se la serie è regolare allora possiamo associarne i termini senza modificarne né il
carattere né la somma. In particolare questo è vero per le serie a termini positivi.

Teorema 3.19 (associatività delle serie regolari). Se 𝑎 𝑘 è una serie, scelta comunque
P
una successione crescente 𝑘 𝑛 con 𝑘 0 = 0 possiamo considerare la serie 𝑏 𝑛 i cui termini
P

𝑘 𝑛+
X 1 −1
𝑏𝑛 = 𝑎𝑗
𝑗=𝑘 𝑛

si ottengono associando i termini di 𝑎 𝑘 a gruppi consecutivi delimitati dalla successione di


indici 𝑘 𝑛 .

𝑎 𝑘 è regolare (convergente o divergente) allora anche la serie 𝑏 𝑛 è regolare e si


P P
Se la serie
ha
+∞
X +∞
X
𝑏𝑛 = 𝑎𝑘 .
𝑛=0 𝑘=0

𝑎 𝑘 è a termini positivi.
P
In particolare questo vale se la serie
126 3 serie

Dimostrazione. Siano 𝑆 𝑘 = 𝑘𝑗=0 𝑎 𝑗 le somme parziali della serie 𝑎 𝑗 . Allora le somme


P P
parziali della serie 𝑏 𝑛 non sono altro che la sottosuccessione 𝑆 𝑘 𝑛 . Dunque se 𝑆 𝑘
P
converge anche ogni sua sottosuccessione converge allo stesso limite.

Il teorema 3.9 ci dice che le serie a termini positivi sono regolari e quindi soddisfano le
ipotesi del teorema.

serie armonica
la serie armonica

Osserviamo che il criterio del rapporto non si applica alla serie armonica
X1
𝑘
𝑘

in quanto
1
𝑘+1 𝑘
= → 1.
1 𝑘+1
𝑘

Per capire se la serie armonica converge o diverge presentiamo il metodo di condensazione


che verrà enunciato in generale nel prossimo teorema ma che può essere meglio
compreso se applicato al caso particolare della serie armonica.

Mostreremo che la serie armonica diverge. L’idea è semplicemente quella di associare


gli addendi della serie armonica in gruppi di lunghezza potenze di due e stimare la
somma di ogni gruppo dal basso con il termine più piccolo (cioè l’ultimo) di ogni
gruppo:
+∞    
X 1 1 1 1 1 1 1 1
criterio di condensazione di Cauchy =1+ + + + + + + +...
𝑘=1
𝑘 2 3 4 5 6 7 8
1 1 1
> 1+ +2· +4· +...
2 4 8
1 1 1
= 1 + + + + · · · = +∞.
2 2 2

Teorema 3.20 (criterio di condensazione di Cauchy). Sia 𝑎 𝑛 una successione decrescente


di numeri reali non negativi: 𝑎 𝑛 ≥ 0. Allora la serie 𝑎 𝑘 converge se e solo se converge la
P
serie X 𝑘
2 𝑎2𝑘 .

Dimostrazione. Supponiamo per comodità che le somme partano da 𝑘 = 1. Si tratta di


3.2 serie a termini positivi 127

raggruppare i termini 𝑎 𝑘 in gruppi di potenze di due:

𝑏0 = 𝑎1 ,
𝑏1 = 𝑎2 + 𝑎3 ,
𝑏2 = 𝑎4 + 𝑎5 + 𝑎6 + 𝑎7 ,
𝑏 3 = 𝑎 8 + 𝑎 9 + 𝑎 10 + · · · + 𝑎15 ,
..
.
𝑏 𝑛 = 𝑎 2𝑛 + 𝑎2𝑛 +1 + · · · + 𝑎2𝑛+1 −1 ,
..
.

Grazie al teorema 3.19 sulla associatività delle serie a termini positivi sappiamo che
+∞
X +∞
X
𝑎𝑘 = 𝑏𝑛 .
𝑘=1 𝑛=0

Ogni termine 𝑏 𝑛 è la somma di 2𝑛 termini della successione 𝑎 𝑘 che, essendo la


successione decrescente, possono essere stimati dall’alto e dal basso con il primo e
l’ultimo termine di ogni somma, dunque:

2𝑛 𝑎 2𝑛+1 −1 ≤ 𝑏 𝑛 ≤ 2𝑛 𝑎 2𝑛 .

2𝑛 𝑎 2𝑛 è convergente dunque per confronto anche la serie 𝑏𝑛 è


P P
Per ipotesi la serie
convergente.

Viceversa se la serie 2𝑛 𝑎 2𝑛 è divergente anche la serie 2𝑛+1 𝑎 2𝑛+1 è divergente e


P P
sapendo che 𝑏 𝑛 ≥ 2𝑛 𝑎 2𝑛+1 −1 ≥ 12 2𝑛+1 𝑎 2𝑛+1 otteniamo, per confronto, che anche la serie
𝑏 𝑛 è divergente.
P

serie armonica generalizzata


Corollario 3.21 (serie armonica generalizzata). La serie
X 1
𝑛 𝑛𝛼

converge se 𝛼 > 1, diverge se 0 ≤ 𝛼 ≤ 1.

Dimostrazione. Applichiamo il criterio di condensazione. Posto 𝑎 𝑛 = 1


𝑛𝛼 Si ha

1 X 𝑛(1−𝛼) X  (1−𝛼)  𝑛
2 𝑛 𝑎 2𝑛 = 2𝑛
X X
= 2 = 2
𝑛 𝑛 (2𝑛 )𝛼 𝑛 𝑛

che è una serie geometrica di ragione 𝑞 = 21−𝛼 . Se 𝛼 > 1 allora 𝑞 < 1 e la serie armonica
è convergente se invece 𝛼 ≤ 1 allora 𝑞 ≥ 1 e la serie armonica è divergente.

Esercizio 3.22. Utilizzare il criterio di condensazione per dimostrare che la serie


X 1
𝑛 · ln 𝑛
diverge.
128 3 serie

Esercizio 3.23. Per quali valori dei parametri 𝛼 ∈ ℝ e 𝛽 ∈ ℝ la serie

𝑛 𝛼 (ln 𝑛)𝛽
X

converge?

3.3 rappresentazione posizionale dei numeri reali

Quando scriviamo 3
8 = 0.375 intendiamo che vale

3 3 7 5
= + 2 + 3.
8 10 10 10
Più in generale data una base 𝑑 ∈ ℕ , 𝑑 ≥ 2, ( 𝑑 = 10 nel caso della rappresentazione
decimale) consideriamo l’insieme [𝑑] = {0 , 1 , 2 , . . . , 𝑑 − 1} delle cifre in base 𝑑 . Una
sequenza infinita di cifre sarà quindi un elemento 𝒂 ∈ [𝑑]ℕ , 𝒂 = (𝑎 0 , 𝑎 1 , . . . , 𝑎 𝑛 , . . . )
con 𝑎 𝑘 ∈ [𝑑]. Potremo quindi considerare il numero “0.𝑎 0 𝑎 1 𝑎 2 . . .” rappresentato dalla
sequenza di cifre 𝒂 :
+∞
X 𝑎𝑘
𝑟(𝒂) = 𝑘+1
.
𝑘=0 𝑑

Chiaramente 𝑟(𝒂) ∈ [0 , 1] in quanto essendo 0 ≤ 𝑎 𝑘 ≤ 𝑑 − 1 risulta


+∞ +∞
X 𝑑−1 𝑑−1X 1 𝑑−1 1
0 ≤ 𝑟(𝒂) ≤ = = · = 1. (3.2)
𝑘=0 𝑑 𝑘+1 𝑑 𝑘=0 𝑑 𝑘 𝑑 1− 1
𝑑

Ogni numero 𝑥 ∈ [0 , 1) ammette una rappresentazione in cifre 𝑥 = 𝑟(𝒂) con 𝒂 ∈ [𝑑]ℕ .


Infatti per ogni 𝑁 ∈ ℕ possiamo scrivere

𝑁−
X1
⌊𝑥 · 10𝑁 ⌋ = 𝑎 𝑘 10𝑁−1−𝑘
𝑘=0

e al crescere di 𝑁 otteniamo una sequenza di cifre 𝑎 𝑘 ∈ [𝑑] tali che



𝑁−1
𝑥 · 𝑑 𝑁 − 𝑎 𝑘 · 𝑑 𝑁−1−𝑘 ≤ 1
X
𝑘=0

da cui
𝑁−
X1 𝑎 𝑘 1

𝑥 − ≤ 𝑁

𝑘+ 𝑑
𝑘=0 𝑑
1

che, facendo tendere 𝑁 → +∞, significa 𝑟(𝒂) = 𝑥 . Il numero 𝑥 = 1 può essere


anch’esso rappresentato, basta prendere 𝑎 𝑘 = 𝑑 − 1 per ogni 𝑘 ∈ ℕ cosicché si ottiene
l’uguaglianza nel lato destro di (3.2). In base 𝑑 = 10 questo si esprime dicendo che

0.999 . . . = 1.

Ci possiamo chiedere se è possibile che lo stesso numero abbia due rappresentazioni


in cifre distinte. Supponiamo quindi che esistano 𝒂, 𝒃 ∈ [𝑑]ℕ con 𝒂 ≠ 𝒃 tali che
3.3 rappresentazione posizionale dei numeri reali 129

𝑟(𝒂) = 𝑟(𝒃). Sia 𝑚 = min {𝑛 ∈ ℕ : 𝑎 𝑛 ≠ 𝑏 𝑛 } la posizione della prima cifra diversa tra
𝒂 e 𝒃 . Si ha allora
+∞ +∞
X 𝑏𝑘 − 𝑎𝑘 𝑏𝑚 − 𝑎𝑚 X 𝑏𝑘 − 𝑎𝑘
𝑟(𝑏) − 𝑟(𝑎) = = + =𝐴+𝐵
𝑘=0 𝑑 𝑘+1 𝑑 𝑚+1 𝑘=𝑚+1 𝑑
𝑘+1

con
𝑏𝑚 − 𝑎𝑚

1
|𝐴| = 𝑚+1 ≥ 𝑚+1

𝑑 𝑑
e

+∞ +∞
𝑏𝑘 − 𝑎𝑘 𝑑−1
X X
|𝐵| = ≤

𝑘=𝑚+1 𝑑 𝑘+1 𝑘=𝑚+1 𝑑 𝑘+1

+∞
𝑑−1X 1 𝑑−1 1 1
= 𝑚+
= 𝑚+2 · = .
𝑑 2
𝑘=0 𝑑
𝑘 𝑑 1− 1
𝑑
𝑑 𝑚+1

Dunque, per disuguaglianza triangolare inversa,

0 = |𝑟(𝑏) − 𝑟(𝑎)| ≥ |𝐴| − |𝐵| ≥ 0.

Significa che tutte le disuguaglianze sono in realtà uguaglianze e quindi deve essere
|𝑏 𝑚 − 𝑎 𝑚 | = 1 e per ogni 𝑘 > 𝑚 deve essere |𝑏 𝑘 − 𝑎 𝑘 | = 𝑑 − 1. Supponendo che sia
𝑏 𝑚 = 𝑎 𝑚 + 1 (l’altro caso è analogo) per 𝑘 > 𝑚 dovrà necessariamente essere 𝑏 𝑘 = 0 e
𝑎 𝑘 = 𝑑 − 1.

Ad esempio se 𝑑 = 10, 𝒂 = (1 , 2 , 3 , 9 , 9 , 9 , 9 , . . . ) e 𝒃 = (1 , 2 , 4 , 0 , 0 , 0 , 0 , . . . ) si avrà


𝑟(𝒂) = 𝑟(𝒃) = 0.124.

Teorema 3.24 (Cantor). Fissata una base 𝑑 > 2 l’insieme

𝐶 = {𝑟(𝒂) : 𝒂 ∈ {0 , 2}ℕ }

ha cardinalità
#𝐶 = #P(ℕ ).
In particolare #ℝ > #ℕ .

Dimostrazione. Vogliamo verificare che 𝑟 : {0 , 2}ℕ → [0 , 1] è iniettiva. Abbiamo già


visto in generale che 𝑟(𝒂) = 𝑟(𝒃) solamente se la prima cifra diversa in 𝒂 e 𝒃 differisce
di una unità. Ma siccome tutte le cifre di 𝒂 e 𝒃 per ipotesi sono 0 oppure 2, non
differiscono di una unità e quindi 𝑟 è iniettiva. Dunque #𝐶 = #{0 , 2}ℕ . D’altra parte
#{0 , 2}ℕ = #P(ℕ ) in quanto ogni 𝒂 ∈ {0 , 2}ℕ può essere messo in corrispondenza
biunivoca con l’insieme 𝒂 −1 ({0}) degli indici 𝑘 ∈ ℕ per cui 𝑎 𝑘 = 0.

Dal teorema 1.74 deduciamo che #𝐶 #P(ℕ ) > #ℕ e visto che 𝐶 ⊆ ℝ a maggior ragione
#ℝ ≥ # 𝐶 > #ℕ .

D’altra parte possiamo mostrare che #ℝ ≤ #P(ℕ ) in quanto possiamo costruire una
funzione 𝑓 : ℝ → P(ℚ) in questo modo:

𝑓 (𝑥) = {𝑞 ∈ ℚ : 𝑞 < 𝑥}.


130 3 serie

Per la densità di ℚ in ℝ sappiamo che se 𝑥 < 𝑦 esiste 𝑞 ∈ ℚ con 𝑥 < 𝑞 < 𝑦 e dunque
𝑞 ∈ 𝑓 (𝑦) \ 𝑓 (𝑥) da cui 𝑓 (𝑥) ≠ 𝑓 (𝑦). Dunque 𝑓 è iniettiva, che significa #ℝ ≤ #P(ℚ)
Ma #ℕ = #ℚ dunque #P(ℚ) = #P(ℕ ) e la dimostrazione è conclusa.

L’insieme 𝐶 definito nella precedente dimostrazione con 𝑑 = 3 è lo stesso insieme


insieme di Cantor
di Cantor considerato nell’esempio 7.83. Infatti si potrebbe mostrare facilmente che
𝐶 = 31 𝐶 ∪ ( 23 + 13 𝐶).

3.4 convergenza assoluta

Per le serie a termini positivi abbiamo molti criteri di convergenza che invece, in
generale, non si applicano alle serie di segno qualunque o alle serie di numeri
complessi. La convergenza di queste ultime, però, può a volte ricondursi facilmente
alla convergenza delle serie a termini positivi, passando al modulo ogni termine.

assolutamente convergente
Definizione 3.25 (convergenza assoluta). Diremo che una serie (a termini reali o complessi)
𝑎 𝑛 è assolutamente convergente se la serie |𝑎 𝑛 | è convergente.
P P

𝑎 𝑛 (reale o complessa) è assolutamente


P
Teorema 3.26 (convergenza assoluta). Se una serie
convergente allora è convergente e vale

X+∞ X +∞
𝑎𝑘 ≤ |𝑎 𝑘 |.


𝑘=0 𝑘=0

Dimostrazione. Supponiamo inizialmente che gli 𝑎 𝑛 siano numeri reali. Definiamo


𝑎 𝑛+ = max {0 , 𝑎 𝑛 } e 𝑎 𝑛− = − min {0 , 𝑎 𝑛 }. Cioè se 𝑎 𝑛 ≥ 0 si ha 𝑎 𝑛+ = 𝑎 𝑛 e 𝑎 𝑛− = 0 se invece
𝑎 𝑛 ≤ 0 si ha 𝑎 𝑛+ = 0 e 𝑎 𝑛− = −𝑎 𝑛 . Dunque 𝑎 𝑛+ ≥ 0, 𝑎 𝑛− ≥ 0,

𝑎 𝑛 = 𝑎 𝑛+ − 𝑎 𝑛− e |𝑎 𝑛 | = 𝑎 𝑛+ + 𝑎 𝑛− .

Allora se |𝑎 𝑛 | converge, per confronto anche 𝑎 𝑛+ e 𝑎 𝑛− convergono. Dunque, per


P P P
il teorema sulla somma dei limiti, 𝑎 𝑛 = 𝑎 𝑛+ − 𝑎 𝑛− e quindi anche 𝑎 𝑛 converge.
P P P P

Se abbiamo una successione di complessi 𝑎 𝑛 = 𝑥 𝑛 + 𝑖 𝑦𝑛 e se |𝑎 𝑛 | converge allora,


P
per confronto, anche |𝑥 𝑛 | e |𝑦𝑛 | convergono (si osservi infatti che |𝑥| ≤ |𝑥 + 𝑖 𝑦| e
P P
|𝑦| ≤ |𝑥 + 𝑖 𝑦| ). Dunque 𝑥 𝑛 e 𝑦𝑛 convergono per quanto già dimostrato sulle serie
P P
a termini reali. Ma allora anche 𝑖 𝑦𝑛 e 𝑎 𝑛 = (𝑥 + 𝑖 𝑦𝑛 ) convergono.
P P P

Poniamo ora
𝑛
X
𝑆𝑛 = 𝑎𝑘 .
𝑘=0

Per la subadditività del modulo sappiamo che per le somme finite si ha



X 𝑛 X 𝑛 +∞
X
|𝑆𝑛 | = 𝑎𝑘 ≤ |𝑎 𝑘 | ≤ |𝑎 𝑘 |.

𝑘=0 𝑘=0 𝑘=0
3.5 serie a segno variabile 131

E per continuità del modulo, posto 𝑆 = lim 𝑆𝑛 si ha



X+∞ +∞
X
𝑎 𝑘 = |𝑆| = lim |𝑆𝑛 | ≤ |𝑎 𝑘 |.

𝑛→+∞

𝑘=0 𝑘=0

Teorema 3.27 (convergenza incondizionata). Se 𝑎 𝑛 è una serie assolutamente conver-


P
gente e 𝜎 : ℕ → ℕ è una qualunque funzione biettiva (permutazione dei numeri naturali) si
ha
+∞
X +∞
X
𝑎𝑛 = 𝑎 𝜎(𝑛) .
𝑛=0 𝑛=0

Dimostrazione. Basta mostrare che


" #
𝑛
X 𝑛
X
lim 𝑎𝑘 − 𝑎 𝜎(𝑗) = 0. (3.3)
𝑛→+∞
𝑘=0 𝑗=0

Visto che la serie 𝑎 𝑘 è assolutamente convergente per il teorema 3.7 sappiamo che
P
per ogni 𝜀 > 0 esiste 𝑁𝜀 ∈ ℕ tale che
+∞
X
|𝑎 𝑘 | < 𝜀.
𝑘=𝑁𝜀

Inoltre visto che 𝜎 : ℕ → ℕ è suriettiva deve esistere 𝑀 𝜀 ∈ ℕ per cui risulti

{𝜎(0), 𝜎(1), . . . , 𝜎(𝑀 𝜀 − 1)} ⊇ {0 , 1 , . . . , 𝑁𝜀 − 1}

ovvero per ogni 𝑘 < 𝑁𝜀 esiste 𝑗 < 𝑀 𝜀 tale che 𝜎(𝑗) = 𝑘 . Necessariamente deve essere
𝑀 𝜀 ≥ 𝑁𝜀 . Per ogni 𝑛 > 𝑀 𝜀 consideriamo la differenza tra le somme parziali:
𝑛
X 𝑛
X
𝑎𝑘 − 𝑎 𝜎(𝑗)
𝑘=0 𝑗=0

e osserviamo che se 𝑗 ≤ 𝑛 e 𝑘 = 𝜎(𝑗) ≤ 𝑛 allora i termini 𝑎 𝑘 e 𝑎 𝜎(𝑗) si elidono. I termini


che non si elidono sono gli 𝑎 𝑘 della prima somma in cui 𝜎 −1 (𝑘) > 𝑛 e gli 𝑎 𝜎(𝑗) della
seconda somma in cui 𝜎(𝑗) > 𝑛 . In ogni caso tali termini hanno indice maggiore o
uguale a 𝑁𝜀 e quindi la loro somma può essere stimata con la somma dei loro moduli
che a sua volta può essere stimata con la somma dei moduli di tutti i termini con indice
non inferiore a 𝑁𝜀 :

X 𝑛 X𝑛 X+∞
𝑎𝑘 − 𝑎 𝜎(𝑗) ≤ 2 |𝑎 𝑘 | ≤ 2 𝜀.


𝑗=0
𝑘=0 𝑘=𝑁𝜀

Questo garantisce la validità dell’equazione (3.3) in base alla definizione di limite.

3.5 serie a segno variabile


P (−1)𝑘
La serie 𝑘+1 la cui somma si può scrivere come
serie armonica a segni alterni
132 3 serie

1 1 1 1
1− + − + ...
2 3 4 5
1 P
non è assolutamente convergente (in quanto la serie 𝑘+1 è divergente) ma ha il
termine generico infinitesimo. Non abbiamo quindi nessun criterio che ci permetta di
determinarne il carattere. Possiamo però sfruttare il fatto che i segni sono alterni cioè
che i termini di indice pari hanno segno opposto ai termini di indice dispari. Si nota
infatti che posto
𝑛
X (−1) 𝑘
𝑆𝑛 =
𝑘=0
𝑘+1
si ha
1 1 1
𝑆2𝑛+2 = 𝑆2𝑛+1 + = 𝑆2 𝑛 − + < 𝑆2 𝑛
2𝑛 + 3 2𝑛 + 2 2𝑛 + 3
1 1 1
𝑆2𝑛+3 = 𝑆2𝑛+2 − = 𝑆2𝑛+1 + − > 𝑆2𝑛+1
2𝑛 + 4 2𝑛 + 3 2𝑛 + 4

Dunque la successione delle somme parziali di indice pari è decrescente mentre sui
termini di indice dispari è crescente. Avremo quindi che entrambe le sottosuccessioni
hanno limite: 𝑆2𝑛 → 𝑆 , 𝑆2𝑛+1 → 𝑅 .

Ma
1
𝑆 − 𝑅 = lim (𝑆2𝑛 − 𝑆2𝑛+1 ) = lim = 0.
𝑛→+∞ 𝑛→+∞ 2𝑛 + 2

Dunque 𝑆 = 𝑅 e l’intera successione ha limite 𝑆 . D’altra parte 𝑆 ≤ 𝑆0 in quanto 𝑆2𝑛 è


Per determinare il valore della somma di decrescente e 𝑆 ≥ 𝑆1 in quanto 𝑆2𝑛+1 è crescente. Concludiamo che 𝑆 è finito e dunque
questa serie ci serviranno degli strumenti la serie è convergente.
più avanzati. Si veda l’equazione 5.16.

criterio di Leibniz Questa dimostrazione può essere resa più in generale nel seguente.

Teorema 3.28 (serie a segni alterni: criterio di Leibniz). Sia 𝑏 𝑛 una successione monotòna
e infinitesima. Allora la serie
(−1)𝑛 𝑏 𝑛
X

è convergente.

𝑛
(−1) 𝑘 𝑏 𝑘 sono le somme parziali, si osserva che la somma della
X
Più precisamente se 𝑆𝑛 =
𝑘=0
serie 𝑆 = lim 𝑆𝑛 è sempre compresa tra due termini consecutivi della successione 𝑆𝑛 :

𝑆 ∈ [min{𝑆𝑛 , 𝑆𝑛+1 }, max{𝑆𝑛 , 𝑆𝑛+1 }].

Dimostrazione. Senza perdere di generalità possiamo supporre che la successione 𝑏 𝑛


sia decrescente e quindi 𝑏 𝑛 ≥ 0 (visto che il limite è zero). Posto
𝑛
(−1) 𝑘 𝑏 𝑘
X
𝑆𝑛 =
𝑘=0
3.5 serie a segno variabile 133

si ha

𝑆2𝑛+2 = 𝑆2𝑛 − 𝑏 2𝑛+1 + 𝑏 2𝑛+2


𝑆2𝑛+3 = 𝑆2𝑛+1 + 𝑏 2𝑛+2 − 𝑏2𝑛+3 .

Essendo 𝑏 𝑛 decrescente si ha 𝑏 2𝑛+2 < 𝑏 2𝑛+1 e 𝑏 2𝑛+3 < 𝑏 2𝑛+2 da cui

𝑆2𝑛+2 < 𝑆2𝑛 , 𝑆2𝑛+3 > 𝑆2𝑛+1 .

Dunque le successioni 𝑆2𝑛 e 𝑆2𝑛+1 sono monotone e di conseguenza hanno limite:

𝑆2𝑛 → 𝑆, 𝑆2𝑛+1 → 𝑅

con 𝑆, 𝑅 ∈ [−∞, +∞]. D’altronde, essendo 𝑏 𝑛 infinitesima

𝑆 − 𝑅 = lim 𝑆2𝑛 − 𝑆2𝑛+1 = lim 𝑏 2𝑛+1 = 0.


𝑛→+∞ 𝑛→+∞

Dunque 𝑆 = 𝑅 . Inoltre essendo 𝑆2𝑛 decrescente si ha 𝑆 ≤ 𝑆0 ed essendo 𝑆2𝑛+1 crescente


si ha 𝑆 ≥ 𝑆1 . Dunque 𝑆 è finito e la serie converge.

Abbiamo anche ottenuto che 𝑆2𝑛−1 ≤ 𝑆 ≤ 𝑆2𝑛 e 𝑆2𝑛+1 ≤ 𝑆 ≤ 𝑆2𝑛 dunque è verificata
anche la seconda parte dell’enunciato.

Abbiamo dunque un esempio, la serie (−1) 𝑘 /𝑘 di una serie convergente ma non


P
assolutamente convergente. Il seguente teorema ci dice che per le serie di questo tipo
non è mai garantito che riordinando i termini la somma si conservi.
convergenza condizionata

Teorema 3.29 (convergenza condizionata). Sia 𝑎 𝑘 una serie convergente ma non as-
P
solutamente convergente a termini reali. Allora fissato qualunque 𝑥 ∈ [−∞, +∞] esiste un
riordinamento 𝜎 : ℕ → ℕ biettivo tale che
+∞
X
𝑎 𝜎(𝑘) = 𝑥.
𝑘=0

Dimostrazione. Dividiamo i termini della successione 𝑎 𝑘 in termini maggiori o uguali


a zero e in termini negativi. Sia 𝑎 +𝑘 la sottosuccessione dei termini non negativi e −𝑎 −𝑘
la sottosuccessione degli opposti dei termini negativi (quindi 𝑎 +𝑘 ≥ 0 e 𝑎 −𝑘 > 0). Si avrà

𝑛
X 𝑛+
X 𝑛−
X
𝑎𝑘 = 𝑎 +𝑘 − 𝑎 −𝑘
𝑘=0 𝑘=0 𝑘=0
𝑛
X 𝑛+
X 𝑛−
X
|𝑎 𝑘 | = 𝑎 +𝑘 + 𝑎 −𝑘
𝑘=0 𝑘=0 𝑘=0

dove 𝑛 + + 1 e 𝑛 − + 1 sono rispettivamente il numero di termini non-negativi e negativi


tra i primi 𝑛 + 1 termini della successione 𝑎 𝑘 .

Osserviamo ora che dovrà essere


+∞
X +∞
X
𝑎 +𝑘 = +∞ e 𝑎 −𝑘 = +∞.
𝑘=0 𝑘=0
134 3 serie

Innanzitutto le somme esistono perché le serie sono a termini non negativi. Se entrambe
queste somme fossero finite allora la serie |𝑎 𝑘 | sarebbe convergente, ma per ipotesi
P
abbiamo assunto che 𝑎 𝑘 non fosse assolutamente convergente. Quindi almeno una
P
delle due somme è infinita. Se la somma dei termini positivi fosse infinita e quella
dei termini negativi fosse finita potremmo però concludere che anche la somma della
serie 𝑎 𝑘 sarebbe infinita. Viceversa se la somma dei termini positivi fosse finita e
P
quella dei termini negativi fosse infinita la somma 𝑎 𝑘 sarebbe −∞. Ma per ipotesi
P
abbiamo richiesto che la serie 𝑎 𝑘 fosse convergente.
P

Fissato 𝑥 ∈ ℝ possiamo quindi cominciare a sommare i termini positivi 𝑎 +𝑘 finché non


si raggiunge o si supera il valore 𝑥 . A quel punto cominciamo a sommare i termini
negativi finché non torniamo sotto al valore 𝑥 . Poi continuiamo a sommare i termini
positivi finché non si torna a superare 𝑥 e di nuovo poi continuiamo con i termini
negativi finché non si torna a scendere sotto 𝑥 . Intermezzando opportunamente
termini positivi e termini negativi riusciamo quindi ad ottenere delle somme parziali
che oscillano intorno al valore di 𝑥 e si avvicinano sempre di più a 𝑥 in quanto ad
ogni cambio di “rotta” la distanza da 𝑥 è inferiore al valore assoluto dell’ultimo
termine sommato e la successione dei termini 𝑎 𝑘 è infinitesima in quanto la serie 𝑎 𝑘
P
è convergente.

Stessa cosa si può fare per ottenere una somma 𝑥 = +∞. Fissata una qualunque
successione 𝑥 𝑛 → +∞ comincio a sommare i termini positivi finché non supero il
valore 𝑥 1 + 𝑎 1− . Poi sommo un solo termine negativo, −𝑎 1− e ottengo una somma
maggiore di 𝑥 1 . Poi sommo tanti positivi finché non supero 𝑥 2 + 𝑎 2− . Poi sommo un
altro unico termine negativo e così via. Chiaramente le somme tenderanno a +∞.

Il caso 𝑥 = −∞ si tratta in maniera analoga.

3.6 somme multiple

Teorema 3.30 (somme alla Cauchy). Sia 𝑎 𝑘,𝑗 ∈ ℂ una successione a due indici 𝑘 ∈ ℕ ,
𝑗 ∈ ℕ . Se
+∞ X
X +∞
𝑎 𝑘,𝑗 < +∞

𝑘=0 𝑗=0

allora
+∞ X
X +∞ 𝑛
+∞ X
X
𝑎 𝑘,𝑗 = 𝑎 𝑘,𝑛−𝑘 .
𝑘=0 𝑗=0 𝑛=0 𝑘=0

Dimostrazione. Poniamo
+∞
X 𝑛
X
𝑏𝑘 = 𝑎 𝑘,𝑗 , 𝑐𝑛 = 𝑎 𝑘,𝑛−𝑘 .
𝑗=0 𝑘=0

Se immaginiamo i termini 𝑎 𝑘,𝑗 come i termini di una matrice infinita dove 𝑘 è l’indice
di riga e 𝑗 è l’indice di colonna, osserviamo che 𝑏 𝑘 rappresenta la somma dei termini
sulla riga 𝑘 -esima e la successione 𝑐 𝑛 rappresenta la somma (finita) dei termini sulla
diagonale 𝑘 + 𝑗 = 𝑛 . L’idea è che sommare i termini lungo le righe oppure lungo
le diagonali ci deve dare lo stesso risultato. L’ipotesi è infatti una sorta di assoluta
convergenza della serie di tutti i termini 𝑎 𝑘,𝑗 .
3.6 somme multiple 135

La tesi del teorema è


+∞
X 𝑁
X
𝑏 𝑘 = lim 𝑐𝑛
𝑁→+∞ 𝑛=0
𝑘=0

cioè per ogni 𝜀 > 0 dobbiamo trovare 𝛼 ∈ ℕ tale che per ogni 𝑁 > 𝛼 si abbia

X 𝑁 +∞
X
𝑐𝑛 − 𝑏 𝑘 < 4𝜀.


𝑛=0 𝑘=0

Fissato 𝜀 > 0 applicando la proprietà della coda (teorema 3.7) alla serie convergente
data per ipotesi, si ottiene che esiste 𝐾 tale che:
+∞ X
+∞
𝑎 𝑘,𝑗 < 𝜀 .
X
𝑘=𝐾+1 𝑗=0
2

Sempre grazie alla proprietà della coda applicata ai singoli termini della serie conver-
gente per ipotesi possiamo affermare che per ogni 𝑘 ∈ {0 , 1 , . . . , 𝐾} esiste un indice 𝐽𝑘
tale che
+∞
𝑎 𝑘,𝑗 ≤ 𝜀 .
X
𝑗=𝐽𝑘 +1 2 𝑘+2

Poniamo 𝐽 = max {𝐽0 , 𝐽1 , . . . , 𝐽𝐾 } e 𝛼 = 𝐽 + 𝐾 . Se 𝑁 ≥ 𝛼 si ha allora



X 𝑁 +∞
X X 𝑁 X𝐾
𝑐𝑛 − 𝑏𝑘 ≤ 𝑐𝑛 − 𝑏𝑘 + 𝜀


𝑛=0 𝑘=0
𝑛=0 𝑘=0

𝑁
0 𝑐 𝑛Psono tutti i
P
Osserviamo ora che i termini che vengono sommati nella serie 𝑛=
termini 𝑎 𝑘,𝑗 tali che 𝑘 + 𝑗 ≤ 𝑁 , mentre i termini che vengono sommati in 𝐾𝑘=0 𝑏 𝑘 sono
tutti i termini 𝑎 𝑘,𝑗 con 𝑘 ≤ 𝐾 . Quindi i termini in comune alle due somme si cancellano
e rimangono solamente i termini della prima somma che non compaiono nella seconda
e i termini della seconda somma che non compaiono nella prima. Non ci interessa
il segno di questi termini quindi possiamo stimare la somma di tutti questi termini
residui facendone la somma dei valori assoluti:

X 𝑁 X𝐾 𝑁 𝑁−𝑘
X X X 𝐾 X+∞
𝑐𝑛 − 𝑏𝑘 ≤ 𝑎 𝑘,𝑗 + 𝑎 𝑘,𝑗


𝑛=0 𝑘=0
𝑘=𝐾+1 𝑗=0 𝑘=0 𝑗=𝑁−𝐾
+∞ X
X +∞ X 𝐾 X
+∞
𝑎 𝑘,𝑗 + 𝑎 𝑘,𝑗


𝑘=𝐾+1 𝑗=0 𝑘=0 𝑗=𝐽𝑘 +1
+∞
𝜀 X 𝜀
≤ + = 𝜀.
2 𝑘=0 2 𝑘+2
136 3 serie

3.7 somma per parti

Teorema 3.31 (somma per parti). Siano 𝑎 𝑘 e 𝐵 𝑘 successioni (reali o complesse). Posto

𝑛−1
X
𝐴𝑛 = 𝑎𝑘 , 𝑏 𝑛 = 𝐵𝑛+1 − 𝐵𝑛
𝑘=0

somma per parti si ha


𝑛−1
X 𝑛−1
X
𝑎 𝑘 𝐵 𝑘 = 𝐴𝑛 𝐵𝑛 − 𝐴𝑚 𝐵𝑚 − 𝐴 𝑘+1 𝑏 𝑘 . (3.4)
𝑘=𝑚 𝑘=𝑚

Dimostrazione. Osserviamo che 𝑎 𝑛 = 𝐴𝑛+1 − 𝐴𝑛 dunque

𝑛−1
X
𝐴𝑛 𝐵𝑛 − 𝐴𝑚 𝐵𝑚 = (𝐴 𝑘+1 𝐵 𝑘+1 − 𝐴 𝑘 𝐵 𝑘 )
𝑘=𝑚
𝑛−1
X
= (𝐴 𝑘+1 𝐵 𝑘+1 − 𝐴 𝑘+1 𝐵 𝑘 + 𝐴 𝑘+1 𝐵 𝑘 − 𝐴 𝑘 𝐵 𝑘 )
𝑘=𝑚
𝑛−1
X 𝑛−1
X
= 𝐴 𝑘+1 𝑏 𝑘 + 𝑎 𝑘 𝐵𝑘 .
𝑘=𝑚 𝑘=𝑚

Se prendiamo 𝑎 𝑘 = (−1) 𝑘 si può osservare che 𝐴𝑛 = 𝑛− 1


(−1) 𝑘 è una successione
P
𝑘=0
limitata in quanto 𝐴𝑛 = 1 se 𝑛 è dispari mentre 𝐴𝑛 = 0 se 𝑛 è pari. Se invece scegliamo
una successione 𝐵𝑛 è positiva, decrescente e infinitesima e poniamo 𝑏 𝑛 = 𝐵𝑛+1 − 𝐵𝑛 si
ha
+∞
X 𝑛−1
X
|𝑏 𝑘 | = lim (𝐵 𝑘 − 𝐵 𝑘+1 ) = lim (𝐵0 − 𝐵𝑛 ) = 𝐵0 < +∞.
𝑛→+∞ 𝑛→+∞
𝑘=0 𝑘=0

Dunque il seguente teorema è una estensione del criterio di Leibniz per le serie a segni
alterni.

Teorema 3.32 (criterio di Dirichlet). Siano 𝑎 𝑛 e 𝐵𝑛 successioni (reali o complesse) e poniamo


𝑛−1
X
𝐴𝑛 = 𝑎 𝑘 , 𝑏 𝑛 = 𝐵𝑛+1 − 𝐵𝑛 . Se 𝐴𝑛 è limitata, 𝐵𝑛 → 0 e |𝑏 𝑛 | < +∞ allora la serie
P
𝑘=0
𝑎 𝑘 𝐵 𝑘 è convergente.
P

Dimostrazione. Per la formula di somma per parti (3.4) si ha

𝑛−1
X 𝑛−1
X
𝑎 𝑘 𝐵 𝑘 = 𝐴 𝑛 𝐵 𝑛 − 𝐴0 𝐵0 − 𝐴 𝑘+1 𝑏 𝑘 . (3.5)
𝑘=0 𝑘=0

Il primo addendo 𝐴𝑛 𝐵𝑛 tende a zero per 𝑛 → +∞ in quanto prodotto di una


successione limitata per una infinitesima. Il secondo addendo è costante. La serie
𝐴 𝑘+1 𝑏 𝑘 è assolutamente convergente in quanto essendo |𝐴𝑛 | ≤ 𝐿 limitata e 𝑏 𝑛
P P
assolutamente convergente si ha
X X
|𝐴 𝑘+1 | · |𝑏 𝑘 | ≤ 𝐿 · |𝑏 𝑘 | < +∞.
3.8 prodotti infiniti 137

Dunque il limite della somma sul lato destro converge e quindi la somma sul lato
sinistro dell’equazione (3.5) è convergente per 𝑛 → +∞.

Esercizio 3.33. Fissato 𝑧 ∈ ℂ, |𝑧| ≤ 1, 𝑧 ≠ 1 la serie


+∞ 𝑘
X 𝑧
𝑘=1
𝑘

è convergente.

Dimostrazione. Si noti che per |𝑧| < 1 si può facilmente applicare il criterio del rapporto
o della radice. Ma per |𝑧| = 1 quei criteri non si applicano e bisogna invece utilizzare
il teorema 3.32.

Posto 𝑎 𝑘 = 𝑧 𝑘 si osserva che 𝑎 𝑘 è una serie geometrica e (essendo 𝑧 ≠ 1) si ha


P

𝑛−1
1 − 𝑧𝑛
𝑧𝑘 =
X
𝐴𝑛 =
𝑘=0
1−𝑧

che è limitata, infatti:

|1 − 𝑧 𝑛 | 1 + |𝑧 𝑛 | 2
|𝐴𝑛 | = ≤ = .
| 1 − 𝑧| | 1 − 𝑧| | 1 − 𝑧|

Mentre posto 𝐵𝑛 = 1/𝑛 è chiaro che, essendo 𝐵𝑛 reale, decrescente si ha

+∞
X 𝑛−1
X
|𝐵 𝑘+1 − 𝐵 𝑘 | = lim (𝐵 𝑘 − 𝐵 𝑘+1 ) = lim (𝐵1 − 𝐵𝑛 )
𝑛→+∞ 𝑛→+∞
𝑘=1 𝑘=1
 
1
= lim 1− = 1 < +∞.
𝑛→+∞ 𝑛

Si applica quindi il teorema 3.32 per ottenere la convergenza della serie data.

Si osservi che se |𝑧| > 1 la serie in questione non converge perché il termine generico
𝑧 𝑘 /𝑘 non è infinitesimo. Per 𝑧 = 1 si ottiene la serie armonica, che pure non
converge.

3.8 prodotti infiniti

Così come abbiamo fatto la teoria per le somme infinite si potrebbe fare la teoria dei
prodotti infiniti ponendo
+∞
Y 𝑛
Y
𝑎 𝑘 = lim 𝑎 𝑘 = lim 𝑎0 · 𝑎1 · · · 𝑎 𝑛 .
𝑛→+∞ 𝑛→+∞
𝑘=0 𝑘=0

Supporremo sempre 𝑎 𝑘 > 0 altrimenti il segno del prodotto difficilmente sarebbe


definito. Allora, utilizzando il logaritmo (che trasforma prodotti in somme) possiamo
138 3 serie

ricondurre i prodotti infiniti alle serie:


+∞ P𝑛
ln 𝑎 𝑘
Y
𝑎 𝑘 = lim 𝑒 𝑘=0 .
𝑛→+∞
𝑘=0

Osserviamo che se la serie dei logaritmi diverge a −∞ il prodotto infinito ha limite 0.


Avendo richiesto che i termini 𝑎 𝑘 siano tutti positivi il prodotto non potrà mai essere
minore di zero. Per mantenere l’analogia con le serie diremo che il prodotto infinito
converge se il limite dei prodotti parziali è finito e positivo. Diremo che diverge se il
limite è +∞ oppure 0.

Dunque potremo dire che il prodotto infinito converge se e solo se la serie dei logaritmi
converge.

𝑎 𝑘 sia
Q
Osserviamo quindi che condizione necessaria affinché un prodotto infinito
convergente dovrà essere ln 𝑎 𝑘 → 0 ovvero 𝑎 𝑘 → 1. In tal caso visto che

ln 𝑎 𝑘 = ln(1 + (𝑎 𝑘 − 1)) ∼ 𝑎 𝑘 − 1

si osserva che se 𝑎 𝑘 → 1 il prodotto infinito 𝑎 𝑘 converge se e solo se converge la


Q
serie (𝑎 𝑘 − 1).
P

Esempio 3.34 (somma dei reciproci dei primi). Possiamo utilizzare i prodotti infiniti per
dimostrare che la somma dei reciproci dei numeri primi è divergente. Sia 𝑝 𝑘 la successione dei
numeri primi ( 𝑝 1 = 2, 𝑝 2 = 3, 𝑝 3 = 5, . . . stiamo dando per scontato che i numeri primi sono
infiniti). Allora vogliamo dimostrare che
+∞ +∞
X 1 X 1
= = +∞. (3.6)
𝑘=1
𝑝𝑘 𝑛=1 𝑛

Questo risultato ha una certa rilevanza nell’ambito della teoria dei numeri in quanto ci dice
che 𝑝 𝑘 non può andare all’infinito come una potenza 𝑘 𝛼 con 𝛼 > 1 in quanto la serie 1/𝑘 𝛼
P
è convergente.

Mostriamo quindi che vale (3.6). Si noti che per ogni 𝑛 ∈ ℕ il termine 1
𝑛 può essere decomposto
come il prodotto di potenze dei reciproci dei numeri primi. Dunque:
+∞
X 1 1 1 1 1
= (1 + + 2 + . . . ) · (1 + + 2 + . . . )
𝑛=1 𝑛 2 2 3 3
1 1
· (1 + + 2 + ...)··· (3.7)
5 5
+∞ X
+∞  𝑗 +∞
Y 1 Y 1
= = .
𝑘=1 𝑗=0
𝑝𝑘 𝑘=1 1− 1
𝑝𝑘

Nei passaggi precedenti abbiamo sfruttato il fatto che nelle serie a termini positivi possiamo
riordinare e associare i termini in qualunque modo. Una serie a termini positivi è convergente
oppure divergente e la convergenza assoluta coincide con la convergenza semplice. Visto che
riordinando i termini di una serie assolutamente convergente non si può ottenere una serie
divergente, significa che riordinando i termini di una serie divergente (a termini positivi) si
ottiene sempre una serie divergente.
3.9 le serie di potenze 139

Ora possiamo utilizzare il fatto che il prodotto infinito ottenuto in (3.7) ha lo stesso carattere
della seguente serie
1
!
+∞ +∞
X 1 X 𝑝𝑘
1
−1 = 1
𝑘=1 1− 𝑝𝑘 𝑘=1 1− 𝑝𝑘

ma visto che 1/𝑝 𝑘 → 0 si ha


1
𝑝𝑘 1

1− 1
𝑝𝑘
𝑝𝑘

e dunque, per il criterio del confronto asintotico, la serie precedente ha lo stesso carattere della
serie
+∞
X 1
𝑝
𝑘=1 𝑘

che quindi è divergente.

3.9 le serie di potenze

Se 𝑎 𝑘 è una successione di numeri complessi, la serie

𝑎𝑘 𝑧 𝑘
X

serie di potenze
dipendente dal parametro 𝑧 ∈ ℂ si chiama serie di potenze di coefficienti 𝑎 𝑘 . Se
chiamiamo 𝐴 ⊆ ℂ l’insieme dei numeri complessi 𝑧 per i quali la serie di potenze
converge
𝑎 𝑘 𝑧 𝑘 è convergente
X
𝐴 = 𝑧 ∈ ℂ:


la somma della serie risulta essere una funzione 𝑓 : 𝐴 → ℂ definita da


+∞
𝑎𝑘 𝑧 𝑘 .
X
𝑓 (𝑧) =
𝑘=0
insieme di convergenza
L’insieme 𝐴 si chiama insieme di convergenza (o dominio di convergenza) della serie di
potenze 𝑎 𝑘 𝑧 𝑘 .
P

Come al solito ci potrà capitare di considerare serie di potenze con l’indice 𝑘 che parte da
1 invece che da 0 (o da qualunque altro numero naturale). Ciò non è rilevante, potremo
sempre considerare 𝑎 𝑘 = 0 per i termini che non partecipano alla sommatoria.

Osserviamo anche che per 𝑘 = 0 il termine corrispondente della serie è 𝑎 0 · 00 = 𝑎 0 in


quanto abbiamo definito 00 = 1. Dunque potremo anche scrivere:
+∞
𝑎 𝑘 𝑧 𝑘 = 𝑎0 + 𝑎1 𝑧 + 𝑎2 𝑧 2 + · · · + 𝑎 𝑛 𝑧 𝑛 + . . . .
X
𝑘=0

Le serie di potenze assomigliano quindi a dei polinomi, ma con infiniti termini.

Esempio 3.35 (la serie geometrica). La serie di potenze di coefficienti 𝑎 𝑘 = 1 è la serie


geometrica 𝑧 𝑘 . L’insieme di convergenza è il cerchio 𝐴 = {𝑧 ∈ ℂ : |𝑧| < 1}. Per 𝑧 ∈ 𝐴 si
P
140 3 serie

ha
+∞
1
𝑧𝑘 =
X
𝑓 (𝑧) = .
𝑘=0
1−𝑧

Se |𝑧| ≥ 1 la serie non può convergere perché il termine 𝑧 𝑘 non è infinitesimo: 𝑧 𝑘 = |𝑧| 𝑘 ≥ 1.

𝑧𝑛
(ottenuta ponendo 𝑎 𝑛 = 1/𝑛 𝑛 ) ha come insieme di
P
Esempio 3.36. La serie di potenze 𝑛𝑛
convergenza 𝐴 = ℂ in quanto
s
𝑛 |𝑧|
𝑛 𝑧
𝑛𝑛 = 𝑛 → 0 < 1

e quindi per il criterio della radice la serie in questione converge assolutamente qualunque sia
𝑧 ∈ ℂ.

Teorema 3.37 (convergenza delle serie di potenze). Se la serie di potenze 𝑎 𝑘 𝑧 𝑘 converge


P
in un punto 𝑧 ∈ ℂ (anzi, basta che la successione 𝑎 𝑘 𝑧 𝑘 sia limitata) allora la serie converge
assolutamente per ogni 𝑤 ∈ ℂ tale che |𝑤| < |𝑧| . Viceversa, se la serie non converge in un
punto 𝑧 ∈ ℂ allora non converge in nessun 𝑤 tale che |𝑤| > |𝑤| (anzi la successione 𝑎 𝑛 𝑤 𝑛
non è nemmeno limitata e tantomento infinitesima).

𝑎 𝑘 𝑧 𝑘 converge significa che la successione 𝑎 𝑘 𝑧 𝑘 è in-


P
Dimostrazione. Se la serie
finitesima e in particolare è limitata. Esiste dunque 𝑀 tale che per ogni 𝑘 ∈
ℕ 𝑘
𝑎 𝑘 𝑧 ≤ 𝑀.

Se 𝑧 = 0 non c’è niente da dimostrare. Se 𝑧 ≠ 0 si ha


𝑀
|𝑎 𝑘 | ≤ .
|𝑧| 𝑘

Scelto ora qualunque 𝑤 ∈ ℂ con |𝑤| < |𝑧| si ha

𝑘
𝑎 𝑘 𝑤 𝑘 = |𝑎 𝑘 | · |𝑤| 𝑘 ≤ 𝑀 |𝑤| ≤ 𝑀 𝑞 𝑘

𝑘
|𝑧|

avendo posto 𝑞 =
|𝑤|
Essendo 𝑞 < 1 la serie geometrica 𝑞 𝑘 converge e, per confronto,
P
|𝑧|
.
𝑎 𝑘 𝑤 𝑘 converge. Dunque la serie 𝑎 𝑘 𝑤 𝑘 converge assolutamente.
P P
anche la serie

Viceversa supponiamo che 𝑎 𝑘 𝑧 𝑘 non converga e prendiamo 𝑤 con |𝑤| > |𝑧| . Allora
P
𝑎 𝑘 𝑤 𝑘 non può convergere, ansi 𝑎 𝑘 𝑤 𝑘 non può neanche essere limitata perché se
P
lo fosse allora, scambiando i ruoli di 𝑧 e 𝑤 , per il punto precedente la serie 𝑎 𝑘 𝑧 𝑘
P
dovrebbe convergere.

Corollario 3.38 (l’insieme di convergenza è circolare). Sia 𝑎 𝑘 𝑧 𝑘 una serie di potenze e


P
sia 𝐴 il suo insieme di convergenza. Allora 𝐴 non è vuoto e posto

𝑅 = sup {|𝑧| : 𝑧 ∈ 𝐴}.


3.9 le serie di potenze 141

risulta che 𝑅 ∈ [0 , +∞] e 𝐴 coincide con il cerchio centrato in 0 e di raggio 𝑅 a meno dei
punti di bordo, nel senso che:

{𝑧 ∈ ℂ : |𝑧| < 𝑅} ⊆ 𝐴 ⊆ {𝑧 ∈ ℂ : |𝑧| ≤ 𝑅}. (3.8)

Inoltre la serie converge assolutamente in ogni 𝑧 ∈ ℂ con |𝑧| < 𝑅 mentre il termine generico
𝑎 𝑘 𝑧 𝑘 non è nemmeno limitato (e quindi la serie non converge) quando |𝑧| > 𝑅 .

Dimostrazione. Se |𝑧| < 𝑅 significa che esiste 𝑧 0 ∈ 𝐴 tale che |𝑧 0 | > |𝑧| . Ma visto che
la serie converge in 𝑧 0 (per definizione di 𝐴) grazie al teorema precedente possiamo
affermare che la serie converge, anzi, converge assolutamente in 𝑧 . Dunque si ottiene
la prima inclusione in (3.8).

Se invece prendiamo 𝑧 ∈ ℂ con |𝑧| > 𝑅 allora certamente la serie non converge in 𝑧
altrimenti (per come è definito 𝑅 ) avremmo 𝑅 ≥ |𝑧| . Inoltre possiamo certamente
considerare un punto 𝑧 1 ∈ ℂ tale che 𝑅 < |𝑧 1 | ≤ |𝑧| e la serie di potenze non può
convergere neanche in 𝑧 1 . Ma allora, per il teorema precedente, deduciamo che 𝑎 𝑘 𝑧 𝑘
non è nemmeno limitata.

Abbiamo quindi mostrato l’esistenza di 𝑅 ∈ ℝ̄ che soddisfa (3.8). Chiaramente risulta


𝑅 ≥ 0 perché 𝐴 è un insieme non vuoto (per ogni serie di potenze si ha 0 ∈ 𝐴).

raggio di convergenza
Definizione 3.39 (raggio di convergenza). Il raggio di convergenza di una serie di potenze
𝑎 𝑘 𝑧 𝑘 è il valore 𝑅 ∈ [0 , +∞] dato dal corollario 3.38:
P

𝑎 𝑘 𝑧 𝑘 è convergente .
X
𝑅 = sup |𝑧| : 𝑧 ∈ ℂ,


𝑎 𝑛 𝑧 𝑛 una serie di potenze. Se


P
Teorema 3.40 (calcolo del raggio di convergenza). Sia
esiste il limite p
lim 𝑛 |𝑎 𝑛 | = ℓ (3.9)
𝑛→+∞

allora 𝑅 = 1/ℓ è il raggio di convergenza della serie (dove si intende 𝑅 = +∞ se ℓ = 0 e 𝑅 = 0


se ℓ = +∞).

Lo stesso accade se esiste il limite


|𝑎 𝑛+1 |
lim = ℓ.
𝑛→+∞ |𝑎 𝑛 |

Più in generale risulta 𝑅 = 1/ℓ se poniamo



ℓ = lim sup 𝑛
𝑎𝑛 .
𝑛→+∞

anche nel caso in cui il limite in (3.9) non dovesse esistere.

Dimostrazione. Prendiamo 𝑟 ≥ 0. Applicando il criterio della radice alla serie |𝑎 𝑛 |𝑟 𝑛


P
si ha p p
𝑛 𝑛
|𝑎 𝑛 |𝑟 𝑛 = 𝑟 |𝑎 𝑛 | → 𝑟ℓ .
Dunque se scegliamo un 𝑟 < 1/ℓ si ha 𝑟ℓ < 1 e la serie 𝑎 𝑛 𝑧 𝑛 converge assolutamente
P
per 𝑧 = 𝑟 . Dunque per ogni 𝑟 < 1/ℓ troviamo che 𝑟 ∈ 𝐴: ne consegue che 𝑅 ≥ 1/ℓ . Se
142 3 serie

invece scegliamo 𝑟 > 1/ℓ si ha 𝑟ℓ > 1 e dunque |𝑎 𝑛 |𝑟 𝑛 → +∞ e la serie non può essere
convergente in 𝑧 = 𝑟 . Significa che 𝑅 ≤ 1/ℓ .

Il criterio della radice si applica anche nel caso in cui ℓ è definito tramite lim sup.

Nel caso esista il limite del rapporto |𝑎 𝑛+1 |/|𝑎 𝑛 | sappiamo (grazie al criterio di con-
vergenza alla Cesàro teorema 2.76) che il limite della radice coincide con il limite
del rapporto e quindi ci si riconduce al caso precedente (oppure si può ripetere la
dimostrazione utilizzando il criterio del rapporto invece del criterio della radice).

Esempio 3.41. Nell’esempio 3.36 abbiamo visto che l’insieme di convergenza della serie di
potenze
+∞ 𝑘
X 𝑧
𝑘=1
𝑘
è
𝐴 = {𝑧 ∈ ℂ : |𝑧| ≤ 1 , 𝑧 ≠ 1}.
Il raggio di convergenza dovrà quindi essere 𝑅 = 1 e questo può essere facilmente verificato
con uno dei criteri precedenti. Ad esempio:
1
𝑛+1 𝑛
lim = lim =1
𝑛→+∞ 1
𝑛
𝑛→+∞ 𝑛+1

da cui 𝑅 = 1/1 = 1. Si osservi dunque che nessuna delle due inclusioni in (3.8) è, in questo
caso, una uguaglianza.

𝑎𝑘 𝑧 𝑘 e 𝑘𝑎 𝑘 𝑧 𝑘
P P
Teorema 3.42 (stabilità del raggio di convergenza). Le serie di potenze
hanno lo stesso raggio di convergenza.

Dimostrazione. Sia 𝑅 il raggio di convergenza della serie 𝑎 𝑘 𝑧 𝑘 e 𝑟 il raggio di


P
convergenza della serie 𝑘𝑎 𝑘 𝑧 𝑘 .
P

Visto che per 𝑘 > 0 si ha 𝑎 𝑘 𝑧 𝑘 ≤ 𝑘𝑎 𝑘 𝑧 𝑘 la serie 𝑎 𝑘 𝑧 𝑘 converge assolutamente nei


P
punti in cui converge assolutamente la serie 𝑘𝑎 𝑘 𝑧 𝑘 . Questo significa che 𝑅 ≥ 𝑟 .
P

Preso ora un punto 𝑤 con |𝑤| < 𝑅 consideriamo un qualunque punto 𝑧 con |𝑤| <
|𝑧| < 𝑅 . La serie 𝑎 𝑘 𝑧 𝑘 converge assolutamente in 𝑧 quindi 𝑎 𝑘 𝑧 𝑘 è infinitesima e
P

limitata. Esiste quindi 𝑀 per cui 𝑎 𝑘 𝑧 𝑘 ≤ 𝑀 che significa |𝑎 𝑘 | ≤ 𝑀


|𝑧| 𝑘 .

/
Ma allora

𝑘 𝑘
𝑘𝑎 𝑘 𝑤 𝑘 ≤ 𝑘|𝑎 𝑘 | |𝑤| 𝑘𝑀 |𝑤|

≤ 𝑘
|𝑧|

da cui, posto 𝑞 = |𝑧| , si ottiene 𝑘𝑎 𝑘 𝑤 𝑘 ≤ 𝑘𝑀 𝑞 𝑘 . Visto che 𝑞 < 1 sappiamo che


|𝑤|

𝑘
la serie 𝑘𝑀 𝑞 è convergente e dunque, per confronto, anche la serie 𝑘𝑎 𝑘 𝑤 è
P P 𝑘

assolutamente convergente. Siccome questo è vero per ogni 𝑤 con |𝑤| < 𝑅 significa
che 𝑟 ≥ 𝑅 e questo conclude la dimostrazione.

√𝑘
Dimostrazione alternativa. Visto che 𝑘 → 1 si ha
p𝑘 √
lim sup 𝑘𝑎 𝑘 = lim sup 𝑘 𝑎 𝑘 .
3.9 le serie di potenze 143

Per il teorema 3.40 si ottiene che le due corrispondenti serie di potenze hanno lo stesso
raggio di convergenza.

continuità delle serie di potenze


Teorema 3.43. (continuità delle serie di potenze) Sia 𝑎 𝑘 𝑧 𝑘 una serie di potenze con raggio
P
di convergenza 𝑅 . Allora posto 𝐵 = {𝑧 ∈ ℂ : |𝑧| < 𝑅} la funzione 𝑓 : 𝐵 → ℂ definita da
+∞
𝑎𝑘 𝑧 𝑘
X
𝑓 (𝑧) =
𝑘=0

è continua (su 𝐵).

Dimostrazione. Supponiamo 𝑅 > 0 altrimenti non c’è niente da dimostrare. Fissiamo


𝑟 < 𝑅 e consideriamo due punti 𝑧, 𝑤 ∈ ℂ con |𝑧| < 𝑟 e |𝑤| < 𝑟 . Ricordiamo che si ha

𝑧 𝑛 − 𝑤 𝑛 = (𝑧 − 𝑤) · (𝑧 𝑛−1 + 𝑤𝑧 𝑛−2 + · · · + 𝑤 𝑛−2 𝑧 + 𝑤 𝑛−1 ).

Osservando che per ogni addendo sul lato destro si ha 𝑤 𝑘 𝑧 𝑛−𝑘−1 ≤ 𝑟 𝑛−1 , essendoci 𝑛

addendi si ottiene
|𝑧 𝑛 − 𝑤 𝑛 | ≤ |𝑧 − 𝑤| · 𝑛 · 𝑟 𝑛−1 .
Dunque

X+∞ +∞ X +∞
𝑛 𝑛 𝑛 𝑛
X
| 𝑓 (𝑧) − 𝑓 (𝑤)| = 𝑎𝑛 𝑧 − 𝑎𝑛 𝑤 = 𝑎 𝑛 (𝑧 − 𝑤 )

𝑛=0 𝑛=0 𝑛=0
+∞ +∞
|𝑎 𝑛 | · |𝑧 𝑛 − 𝑤 𝑛 | ≤ |𝑧 − 𝑤| |𝑎 𝑛 |𝑛𝑟 𝑛−1 .
X X

𝑛=0 𝑛=0

Ma noi sappiamo che la serie 𝑛𝑎 𝑛 𝑧 𝑛 ha lo stesso raggio di convergenza 𝑅 della serie


P
originaria (per il teorema 3.42) dunque la serie 𝑛𝑎 𝑛 𝑟 𝑛 è assolutamente convergente
P
e, dividendo per 𝑟 , scopriamo che anche la serie 𝑛𝑎 𝑛 𝑟 𝑛−1 è convergente. Posto
P
𝐿 = 𝑛=0 𝑛|𝑎 𝑛 |𝑟 𝑛−1 per quanto scritto sopra possiamo concludere che
P+∞

| 𝑓 (𝑧) − 𝑓 (𝑤)| ≤ 𝐿 · |𝑧 − 𝑤|.

Dunque per ogni 𝜀 > 0 scelto 𝛿 = 𝐿𝜀 se |𝑧 − 𝑤| < 𝛿 risulta | 𝑓 (𝑧) − 𝑓 (𝑤)| ≤ 𝜀. Significa
che la funzione 𝑓 è continua nel punto 𝑧 e questo è vero per ogni 𝑧 con |𝑧| < 𝑅 .

Il teorema precedente ci garantisce che la somma di una serie di potenze è una funzione
continua all’interno del raggio di convergenza. Nei punti che si trovano esattamente
sulla frontiera del raggio di convergenza la funzione 𝑓 potrebbe non essere continua.
Ma se la serie converge in un punto di frontiera, la somma della serie è continua se
mi avvicino al punto di convergenza lungo il raggio del disco di convergenza, come
enunciato nel seguente teorema.

Teorema 3.44 (lemma di Abel). Sia


+∞
𝑎𝑘 𝑧 𝑘
X
𝑓 (𝑧) =
𝑘=0
144 3 serie

la somma di una serie di potenze. Se la serie converge in un punto 𝑧 0 ∈ ℂ, 𝑧 0 ≠ 0, allora la


serie converge per ogni 𝑧 = 𝑡𝑧 0 con 𝑡 ∈ [0 , 1] inoltre la funzione

𝑡 ↦→ 𝑓 (𝑡𝑧)

è continua nel punto 𝑡 = 1.

Dimostrazione. Senza perdita di generalità possiamo supporre che sia 𝑓 (𝑧 0 ) = 0 infatti


basterà sostituire il primo termine della serie, 𝑎 0 , con 𝑎 0′ = 𝑎 0 − 𝑓 (𝑧 0 ) e dimostrare il
teorema per la serie modificata. Dunque posto

𝑛−1
𝑎 𝑘 𝑧0𝑘
X
𝐴𝑛 =
𝑘=0

si ha che 𝐴𝑛 → 𝑓 (𝑧 0 ) = 0 e, per definizione, 𝐴0 = 0. Utilizzando la formula (3.4) di


somma per parti, preso 𝑡 ∈ [0 , 1) si avrà
𝑛 𝑛 𝑛
𝑎 𝑘 · (𝑡𝑧0 ) 𝑘 = 𝑎 𝑘 𝑧0𝑘 · 𝑡 𝑘 = 𝐴𝑛+1 · 𝑡 𝑛+1 + 𝐴 𝑘+1 · (𝑡 𝑘 − 𝑡 𝑘+1 )
X X X
𝑘=0 𝑘=0 𝑘=0

e per 𝑛 → +∞ si ottiene
+∞ +∞
𝐴 𝑘+1 (𝑡 𝑘 − 𝑡 𝑘+1 ) = (1 − 𝑡) 𝐴 𝑘+1 𝑡 𝑘 .
X X
𝑓 (𝑡 · 𝑧0 ) = 𝑓 (𝑧0 ) · 0 +
𝑘=0 𝑘=0

Visto che 𝐴𝑛 → 0 per ogni 𝜀 > 0 esiste 𝑚 tale che per ogni 𝑘 > 𝑚 si ha |𝐴 𝑘 | ≤ 𝜀.
Dunque, per ogni 𝑡 ∈ [0 , 1), si ha

𝑚−
X1 +∞
|𝐴 𝑘+1 |𝑡 𝑘 + (1 − 𝑡) |𝐴 𝑘+1 |𝑡 𝑘
X
| 𝑓 (𝑡 · 𝑧0 )| ≤ (1 − 𝑡)
𝑘=0 𝑘=𝑚
𝑚−
X1 𝑡𝑚
≤ (1 − 𝑡) · |𝐴 𝑘+1 | + (1 − 𝑡) · 𝜀 ·
𝑘=0
1−𝑡
𝑚−
X1
≤ (1 − 𝑡) |𝐴 𝑘+1 | + 𝜀.
𝑘=0

Scelto 𝛿 ≤ P𝑚−1 𝜀 se | 1 − 𝑡| < 𝛿 si avrà dunque


𝑘=0
|𝐴 𝑘+1 |

| 𝑓 (𝑡 · 𝑧0 ) − 𝑓 (𝑧0 )| = | 𝑓 (𝑡 · 𝑧0 )| < 2 𝜀

che significa che 𝑡 ↦→ 𝑓 (𝑡 · 𝑧 0 ) è continua nel punto 𝑡 = 1.

3.10 la serie esponenziale


exp 𝑧

Definiamo la funzione exp : ℂ → ℂ tramite la serie di potenze


+∞ 𝑘
X 𝑧
exp(𝑧) = . (3.10)
𝑘=0
𝑘!
3.10 la serie esponenziale 145

La funzione è definita su tutto ℂ in quanto (grazie al criterio del rapporto) è facile


verificare che il raggio di convergenza di questa serie è 𝑅 = +∞ e dunque l’insieme di
convergenza è tutto ℂ.

I teoremi seguenti ci permetteranno di affermare che la funzione exp(𝑧), definita per


ogni 𝑧 ∈ ℂ è una estensione della funzione 𝑒 𝑥 già definita per 𝑥 ∈ ℝ.

Teorema 3.45 (proprietà dell’esponenziale complesso). Si ha:

1. exp(0) = 1;
2. exp(¯𝑧 ) = exp(𝑧);
3. per ogni 𝑧, 𝑤 ∈ ℂ
exp(𝑧 + 𝑤) = exp(𝑧) · exp(𝑤);
4. per ogni 𝑧 ∈ ℂ si ha exp(𝑧) ≠ 0 e

1
exp(−𝑧) = ;
exp(𝑧)

5. la funzione exp : ℂ → ℂ è continua.


6. Se 𝑧 𝑛 → 0 allora
exp(𝑧 𝑛 ) − 1
lim = 1. (3.11)
𝑛→+∞ 𝑧𝑛

Dimostrazione. 1. La proprietà exp(0) = 1 si ottiene per verifica diretta (ricordiamo


che 00 = 1 e 0! = 1).
2. La proprietà exp(¯𝑧 ) = exp 𝑧 si ottiene passando al limite la seguente uguaglianza
tra le somme parziali che sfrutta le proprietà del coniugio di somma e prodotto:

𝑛 𝑛
X 𝑧¯ 𝑘 X 𝑧𝑘
= .
𝑘=0
𝑘! 𝑘=0
𝑘!

3. Consideriamo la matrice infinita

𝑧𝑘 𝑤𝑗
𝑚 𝑘,𝑗 = · .
𝑘! 𝑗!

Allora da un lato
+∞
X (𝑧 + 𝑤)𝑛
exp(𝑧 + 𝑤) =
𝑛=0 𝑛!
+∞ 𝑛
1 X 𝑛!
𝑧 𝑘 · 𝑤 𝑛−𝑘
X
=
𝑛=0 𝑛 ! 𝑘=0 𝑘 !(𝑛 − 𝑘)!
𝑛
+∞ X
X
= 𝑚 𝑘,𝑛−𝑘
𝑛=0 𝑘=0
146 3 serie

e dall’altro
+∞ 𝑘 X
X 𝑧 +∞ 𝑤 𝑗 +∞ 𝑘
+∞ X
X 𝑧 𝑤𝑗
exp(𝑧) · exp(𝑤) = =
𝑘=0
𝑘! 𝑗=0
𝑗! 𝑘=0 𝑗=0
𝑘! 𝑗!
+∞ X
X +∞
= 𝑚 𝑘,𝑗 .
𝑘=0 𝑗=0

Il risultato segue dunque dal teorema 3.30.


4. Visto che
1 = exp(0) = exp(𝑧 − 𝑧) = exp(𝑧) · exp(−𝑧)
ricaviamo che exp(𝑧) ≠ 0 e exp(−𝑧) = 1/exp(𝑧).
5. La continuità discende dal risultato generale sulla continuità della somma di
una serie di potenze: teorema 3.43.
6. Direttamente dalla definizione (3.10) si ottiene
+∞ 𝑘
X 𝑧 +∞
X 𝑧𝑘
exp(𝑧) − 1 = =𝑧· .
𝑘=1
𝑘! 𝑘=0
(𝑘 + 1)!

𝑧
P 𝑘
Osserviamo ora che la serie (𝑘+ 1)!
ha raggio di convergenza infinito e quindi è
assolutamente convergente per ogni 𝑧 ∈ ℂ. In particolare la somma di tale serie
è continua e quindi se 𝑧 𝑛 → 0 si ha

exp(𝑧 𝑛 ) − 1 +∞
X 𝑧 𝑛𝑘 +∞
X 0𝑘
lim = lim = = 1.
𝑛→+∞ 𝑧𝑛 𝑛→+∞
𝑘=0
(𝑘 + 1)! 𝑘=0 (𝑘 + 1)!

Teorema 3.46 (collegamento tra le due definizioni di esponenziale). Per ogni 𝑥 ∈ ℝ si


ha
exp(𝑥) = 𝑒 𝑥 .

Dimostrazione. Vogliamo applicare il teorema 1.69. Posto 𝑓 (𝑥) = exp(𝑥), 𝑓 : ℝ → ℝ


sappiamo, per il teorema precedente, che 𝑓 (𝑥 + 𝑦) = 𝑓 (𝑥) · 𝑓 (𝑦). Dobbiamo verificare
che 𝑓 è crescente. Innanzitutto notiamo che se 𝑥 > 0 la serie che definisce exp(𝑥) è a
termini positivi e il primo termine è 1. Dunque per ogni 𝑥 > 0 si ha exp(𝑥) > 1. In
particolare posto 𝑎 = 𝑓 (1) si ha 𝑎 > 1. Inoltre se 𝑦 > 𝑥 si ha 𝑓 (𝑦 − 𝑥) > 1 e dunque

𝑓 (𝑦) = 𝑓 (𝑥 + 𝑦 − 𝑥) = 𝑓 (𝑥) · 𝑓 (𝑦 − 𝑥) > 𝑓 (𝑥).

La funzione è quindi strettamente crescente. Dunque è un omomorfismo monotono


dal gruppo additivo ℝ al gruppo moltiplicativo (0 , +∞). Fissato 𝑎 = 𝑓 (1) sappiamo,
per quanto visto nella sezione 1.13, che c’è una unica funzione con queste proprietà e
dunque deve essere:
𝑓 (𝑥) = 𝑎 𝑥 .
Non ci rimane che dimostrare che 𝑎 = 𝑒 . Ma grazie al teorema 3.45 appena dimostrato
sappiamo che per 𝑥 → 0 si ha
𝑓 (𝑥) − 1
→ 1.
𝑥
3.10 la serie esponenziale 147

D’altra parte sappiamo che 𝑓 (𝑥) = 𝑎 𝑥 e quindi per il limite notevole (corollario 2.51)

𝑓 (𝑥) − 1 𝑎 𝑥 − 1 𝑒 𝑥 ln 𝑎 − 1
= = · ln 𝑎 → ln 𝑎.
𝑥 𝑥 𝑥 ln 𝑎
Deduciamo quindi che ln 𝑎 = 1 ovvero che 𝑎 = 𝑒 .

Aver distinto le due definizioni di 𝑒 𝑥 (tramite funzione potenza) e di exp(𝑥) (tramite


somma della serie esponenziale) è puramente strumentale. C’è una unica funzione
esponenziale che può essere definita in un modo o nell’altro. Non ci si fissi quindi
con l’identificare le due diverse notazioni 𝑒 𝑥 ed exp(𝑥) con le due diverse definizioni.
Ogni testo avrà una sua definizione di funzione esponenziale che può essere per certi
versi arbitraria salvo poi ritrovare le proprietà caratterizzanti di tale funzione.

Come già detto d’ora in poi scriveremo, per ogni 𝑧 ∈ ℂ

𝑒 𝑧 = exp 𝑧

considerando quindi exp 𝑧 l’estensione a tutto il piano complesso della funzione


esponenziale già definita sulla retta reale.

In analogia con il corollario 2.49 si ha il seguente risultato che fornisce anche un modo
alternativo per dimostrare il teorema 3.46.

Teorema 3.47 (limite notevole esponenziale complesso). Per ogni 𝑧 ∈ ℂ risulta


+∞ 𝑘
 𝑧 𝑛 X 𝑧
lim 1+ = .
𝑛→+∞ 𝑛 𝑘=0
𝑘!

Dimostrazione. Utilizzando lo sviluppo del binomio osserviamo che si ha


𝑛 𝑛
𝑧 𝑛 X 𝑛 𝑧𝑘 X 𝑧𝑘 𝑛!
  
1+ = = · 𝑘 .
𝑛 𝑘=0
𝑘 𝑛 𝑘
𝑘=0
𝑘 ! 𝑛 · (𝑛 − 𝑘)!

Posto per ogni 𝑘 ≤ 𝑛

𝑛! 𝑛 · (𝑛 − 1) · . . . · (𝑛 − 𝑘 + 1)
𝑐(𝑛, 𝑘) = =
𝑛𝑘· (𝑛 − 𝑘)! 𝑛𝑘
𝑛 𝑛−1 𝑛−2 𝑛−𝑘+1
= · · ·...·
𝑛 𝑛 𝑛 𝑛
osserviamo che 0 ≤ 𝑐(𝑛, 𝑘) ≤ 1 in quanto prodotto di numeri non negativi minori o
uguali ad 1. Inoltre, fissato 𝑘 , si ha 𝑐(𝑛, 𝑘) → 1 per 𝑛 → +∞ in quanto ogni fattore
𝑛−𝑗
𝑛 tende a 1 per 𝑛 → +∞ (si noti che a 𝑘 fissato il numero di fattori 𝑘 è fissato).

Sia 𝑧 ∈ ℂ fissato e sia


+∞
X |𝑧| 𝑘
𝑆= .
𝑘=0
𝑘!
Sappiamo che la serie esponenziale è assolutamente convergente per ogni 𝑧 ∈ ℂ (in
quanto il raggio di convergenza è +∞) quindi 𝑆 è un numero reale (finito). Dunque
148 3 serie

per il teorema 3.7 (della coda) sappiamo che per ogni 𝜀 > 0 esiste 𝑀 tale che

+∞
X |𝑧| 𝑘
< 𝜀.
𝑘=𝑀+1
𝑘!

Fissato 𝑘 ≤ 𝑀 visto che 𝑐(𝑛, 𝑘) → 1 esiste 𝑁 𝑘 > 𝑀 tale che per ogni 𝑛 > 𝑁 𝑘 si abbia
1 − 𝑐(𝑛, 𝑘) < 𝜀 (ricordiamo che 𝑐(𝑛, 𝑘) ≤ 1). Prendiamo allora

𝑁 = max {𝑁 𝑘 : 𝑘 ≤ 𝑁 }

cosicchè per ogni 𝑛 > 𝑁 e per ogni 𝑘 ≤ 𝑀 si avrà 0 ≤ 1 − 𝑐(𝑛, 𝑘) < 𝜀. Allora, per ogni
𝑛 > 𝑁 , possiamo spezzare la somma da 0 a 𝑛 nelle due somme da 0 a 𝑀 e da 𝑀 + 1 a
𝑛:
 𝑛
𝑛 𝑛  𝑘
𝑧𝑘  𝑧  𝑛 X 𝑧 𝑧 𝑘 X 𝑧𝑘
X
− 1+ = − 𝑐(𝑛, 𝑘) = (1 − 𝑐(𝑛, 𝑘))

𝑘=0 𝑘 ! 𝑛 𝑘=0 𝑘 ! 𝑘 ! 𝑘=0 𝑘!

𝑛
X |𝑧| 𝑘
≤ (1 − 𝑐(𝑛, 𝑘))
𝑘=0
𝑘!
𝑀
X |𝑧| 𝑘 X𝑛
|𝑧| 𝑘
= (1 − 𝑐(𝑛, 𝑘)) + (1 − 𝑐(𝑛, 𝑘))
𝑘=0
𝑘! 𝑘=𝑀+1
𝑘!
𝑀
X |𝑧| 𝑘 𝑛
X |𝑧| 𝑘
≤ 𝜀 +
𝑘=0
𝑘! 𝑘=𝑀+1
𝑘!
X+∞
|𝑧| 𝑘
≤𝜀 +𝜀
𝑘=0
𝑘!
≤ 𝜀𝑆 + 𝜀 = 𝜀(𝑆 + 1).

Visto che 𝜀 > 0 era arbitrario abbiamo verificato tramite la definizione che
𝑛
X 𝑧𝑘  𝑧 𝑛
− 1+ →0
𝑘=0
𝑘! 𝑛

cioè
+∞ 𝑘
 𝑧 𝑛 X 𝑧
lim 1+ = .
𝑛→+∞ 𝑛 𝑘=0
𝑘!

Se 𝑥 ∈ ℝ abbiamo già visto che


 𝑥 𝑛
lim 1+ = 𝑒𝑥
𝑛→+∞ 𝑛
e quindi il teorema precedente ci assicura che

exp(𝑥) = 𝑒 𝑥 .
3.10 la serie esponenziale 149

2.7182818284 5904523536 0287471352 6624977572 4709369995 Tabella 3.1: Le prime 1000 cifre decimali
del numero 𝑒 calcolate con il metodo
9574966967 6277240766 3035354759 4571382178 5251664274
utilizzato nella dimostrazione del teore-
2746639193 2003059921 8174135966 2904357290 0334295260 ma 3.48. Si veda il codice a pagina 424.
5956307381 3232862794 3490763233 8298807531 9525101901
1573834187 9307021540 8914993488 4167509244 7614606680
8226480016 8477411853 7423454424 3710753907 7744992069
5517027618 3860626133 1384583000 7520449338 2656029760
6737113200 7093287091 2744374704 7230696977 2093101416
9283681902 5515108657 4637721112 5238978442 5056953696
7707854499 6996794686 4454905987 9316368892 3009879312
7736178215 4249992295 7635148220 8269895193 6680331825
2886939849 6465105820 9392398294 8879332036 2509443117
3012381970 6841614039 7019837679 3206832823 7646480429
5311802328 7825098194 5581530175 6717361332 0698112509
9618188159 3041690351 5988885193 4580727386 6738589422
8792284998 9208680582 5749279610 4841984443 6346324496
8487560233 6248270419 7862320900 2160990235 3043699418
4914631409 3431738143 6405462531 5209618369 0888707016
7683964243 7814059271 4563549061 3031072085 1038375051
0115747704 1718986106 8739696552 1267154688 9570350354

Teorema 3.48 (approssimazione dell’esponenziale). Se |𝑧| ≤ 1 si ha



𝑛
𝑧 𝑘 |𝑧| 𝑛+1
X
exp(𝑧) − ≤ . (3.12)

𝑘=0
𝑘! 𝑛 · 𝑛!

In particolare ponendo 𝑧 = 1 si trova


𝑛
X 1 1
0<𝑒− ≤ . (3.13)
𝑘=0
𝑘! 𝑛 · 𝑛!

e per 𝑛 = 5 si ottiene
2.716 < 𝑒 < 2.719 (3.14)

Dimostrazione. La coda della serie esponenziale può essere stimata tramite la somma
di una serie geometrica:

𝑛
1 +∞
|𝑧| 𝑘 X+∞
|𝑧| 𝑛+𝑘+1
X X
exp 𝑧 − ≤ =

𝑘=0
𝑘 ! 𝑘=𝑛+1 𝑘 ! 𝑘=0
(𝑛 + 𝑘 + 1)!
𝑘
+∞
|𝑧| 𝑛+1+𝑘 |𝑧| 𝑛+1 X
+∞
X |𝑧|
≤ =
𝑘=0 (𝑛 + 1) 𝑘+1 · 𝑛 ! 𝑛 ! 𝑘=0 (𝑛 + 1)
|𝑧| 𝑛+1 1 |𝑧| 𝑛+1
= · = .
(𝑛 + 1) · 𝑛 ! 1 − |𝑧| (𝑛 + 1 − |𝑧|) · 𝑛 !
(𝑛+1)

Se |𝑧| ≤ 1 si ottiene quindi la stima (3.12). Se 𝑧 = 1 la serie esponenziale è a termini


150 3 serie

positivi e dunque approssima 𝑒 per difetto: si ottiene dunque (3.13). Per 𝑛 = 5 si ha

5
X 1 1 1 1 1 326
=1+1+ + + + =
𝑘=0
𝑘! 2 6 24 120 120

Dunque da un lato
326
𝑒≥ ≥ 2.716
120
e dall’altro
326 1
𝑒≤ + ≤ 2.717 + 0.002 = 2.719
120 5 · 5!

𝑒∉ℚ
Teorema 3.49 (irrazionalità di 𝑒 ). Il numero 𝑒 è irrazionale.

Dimostrazione. Supponiamo per assurdo che sia 𝑒 = 𝑝/𝑞 con 𝑝 ∈ ℤ e 𝑞 ∈ ℕ . Possiamo


supporre 𝑞 > 1 (non importa che la frazione sia ridotta ai minimi termini).

Per ogni 𝑛 ∈ ℕ si ha
+∞ 𝑛 +∞
X 𝑛! X 𝑛! X 1
𝑛 !𝑒 = = + 𝑛! .
𝑘=0
𝑘! 𝑘=0
𝑘! 𝑘=𝑛+1
𝑘!

Il primo addendo nella somma precedente è intero in quanto se 𝑘 ≤ 𝑛 il rapporto 𝑛 !/𝑘 !


è intero. Grazie al teorema 3.48 per il secondo addendo se 𝑛 > 1 si ha:
+∞
X 1 1
0 < 𝑛! ≤ < 1.
𝑘=𝑛+1
𝑘! 𝑛

Risulta dunque che per ogni 𝑛 ≥ 2 il numero 𝑛 ! 𝑒 è strettamente compreso tra due
interi consecutivi e quindi non è mai intero. Dunque 𝑒 non può essere razionale perché
𝑝
se fosse 𝑒 = 𝑞 si avrebbe 𝑛 ! 𝑒 ∈ ℤ per ogni 𝑛 > 𝑞 .

3.11 le funzioni trigonometriche

Se 𝑡 ∈ ℝ il numero complesso 𝑒 𝑖𝑡 è unitario (ha modulo uno) in quanto, per le proprietà


dell’esponenziale complesso, si ha
𝑖𝑡 2
𝑒 = 𝑒 𝑖𝑡 · 𝑒 𝑖𝑡 = 𝑒 𝑖𝑡 · 𝑒 −𝑖𝑡 = 𝑒 𝑖𝑡−𝑖𝑡 = 𝑒 0 = 1.

Ci ricordiamo che il prodotto di due numeri unitari 𝑒 𝑖𝑡 , 𝑒 𝑖𝑠 è un numero unitario


che geometricamente identifica un angolo che è la somma degli angoli identificati
dai due fattori. Visto che si ha 𝑒 𝑖𝑡 · 𝑒 𝑖𝑠 = 𝑒 𝑖(𝑡+𝑠) significa che l’angolo identificato dal
numero complesso 𝑒 𝑖(𝑡+𝑠) è la somma degli angoli geometrici identificati da 𝑒 𝑖𝑡 e da
𝑒 𝑖𝑠 . Essendo inoltre 𝑒 𝑖𝑡 una funzione continua dobbiamo dedurre che dal punto di
vista geometrico il parametro 𝑡 misura l’ampiezza dell’angolo identificato da 𝑒 𝑖𝑡 sulla
circonferenza unitaria. Più precisamente possiamo osservare che se Δ𝑡 → 0 grazie al
limite notevole dell’esponenziale complesso otteniamo

𝑒 𝑖(𝑡+Δ𝑡) − 𝑒 𝑖𝑡 𝑒 𝑖Δ𝑡 − 1
lim = 𝑖𝑒 𝑖𝑡 lim = 𝑖𝑒 𝑖𝑡 .
Δ𝑡→0 Δ𝑡 𝑡→0 𝑖Δ𝑡
3.11 le funzioni trigonometriche 151

Significa che se interpretiamo 𝑡 ↦→ 𝑒 𝑖𝑡 come la legge oraria di un punto che si muove


sulla circonferenza unitaria, la velocità del punto, al tempo 𝑡 , è rappresentata dal vettore
(numero complesso) 𝑣 = 𝑖𝑒 𝑖𝑡 che non è altro che il ruotato di 𝑒 𝑖𝑡 di un angolo retto in
senso antiorario. Dunque il punto 𝑒 𝑖𝑡 si muove di moto circolare uniforme in senso
antiorario sulla circonferenza unitaria con velocità di modulo unitario. Scopriamo
quindi che il punto 𝑒 𝑖𝑡 ha percorso dal tempo 𝑡 = 0 un arco di lunghezza pari a 𝑡 .

La definizione seguente dunque può essere interpretata geometricamente dicendo che


le funzioni cos 𝑡 e sin 𝑡 sono le coordinate 𝑥 e 𝑦 del punto sulla circonferenza unitaria
𝑥 2 + 𝑦 2 = 1 che identifica un arco di lunghezza 𝑡 misurato in senso antiorario a partire
dal punto di coordinate (1 , 0). La lunghezza di un arco unitario sulla circonferenza
unitaria si chiama radiante e diremo quindi che 𝑡 è la misura in radianti dell’angolo radiante
identificato dal punto 𝑒 𝑖𝑡 di coordinate (cos 𝑡, sin 𝑡) sul piano complesso.

Definizione 3.50 (funzioni trigonometriche). Per ogni 𝑥 ∈ ℝ si potrà definire


   
cos 𝑥 = Re 𝑒 𝑖𝑥 , sin 𝑥 = Im 𝑒 𝑖𝑥

cosicché valga la formula di Eulero formula di Eulero

𝑒 𝑖𝑥 = cos 𝑥 + 𝑖 sin 𝑥.

Teorema 3.51 (proprietà delle funzioni seno e coseno). Le funzioni sin e cos soddisfano
le seguenti proprietà.

𝑒 𝑖𝑥 + 𝑒 −𝑖𝑥 𝑒 𝑖𝑥 − 𝑒 −𝑖𝑥
1. cos(𝑥) = , sin(𝑥) = ;
2 2𝑖
2. sin(−𝑥) = − sin 𝑥 (la funzione sin è dispari), cos(−𝑥) = cos 𝑥 (la funzione cos è
pari);
3. identità fondamentale della trigonometria:

cos2 𝑥 + sin2 𝑥 = 1;

4. formule di addizione:

cos(𝛼 + 𝛽) = cos 𝛼 cos 𝛽 − sin 𝛼 sin 𝛽,


sin(𝛼 + 𝛽) = sin 𝛼 cos 𝛽 + cos 𝛼 sin 𝛽 ;

5. le funzioni cos : ℝ → ℝ e sin : ℝ → ℝ sono continue;


6. si ha
+∞
𝑥 2𝑘 𝑥2 𝑥4 𝑥6
(−1) 𝑘
X
cos 𝑥 = =1− + − +... (3.15)
𝑘=0
(2 𝑘)! 2 4! 6!
+∞
𝑥 2 𝑘+1 𝑥3 𝑥5 𝑥7
(−1) 𝑘
X
sin 𝑥 = =𝑥− + − +... (3.16)
𝑘=0
(2 𝑘 + 1)! 6 5! 7!

7. vale il seguente limite notevole

sin 𝑥 1 − cos 𝑥 1
lim =1 e lim = .
𝑥→0 𝑥 𝑥→0 𝑥 2 2
152 3 serie

𝑦
𝑦 = tg 𝑥

1 𝑦 = sin 𝑥

Figura 3.1: I grafici delle funzioni sin, 𝑥


cos e tg.
− 23 𝜋 −𝜋 − 𝜋2 𝜋 𝜋
2𝜋
3
2
-1
𝑦 = cos 𝑥

(interagisci)

Dimostrazione. 1. Essendo 𝑒 𝑖𝑥 = 𝑒 𝑖𝑥 = 𝑒 −𝑖𝑥 discende dalla formula (1.22) per il


calcolo di parte reale ed immaginaria.
2. Si verifica direttamente con le formule precedenti.
3. Per 𝑥 ∈ ℝ si ha da un lato

| exp(𝑖𝑥)| 2 = exp(𝑖𝑥) · exp(𝑖𝑥) = exp(𝑖𝑥) · exp(−𝑖𝑥) = exp(0) = 1

e dall’altro
| exp(𝑖𝑥)| 2 = | cos 𝑥 + 𝑖 sin 𝑥| 2 = cos2 𝑥 + sin2 𝑥.
4. Grazie alla formula che esprime l’esponenziale della somma:

cos(𝛼 + 𝛽) + 𝑖 sin(𝛼 + 𝛽) = exp(𝑖(𝛼 + 𝛽)) = exp(𝑖𝛼) · exp(𝑖𝛽)


= (cos 𝛼 + 𝑖 sin 𝛼) · (cos 𝛽 + 𝑖 sin 𝛽)
= cos 𝛼 cos 𝛽 − sin 𝛼 sin 𝛽
+ 𝑖(sin 𝛼 cos 𝛽 + cos 𝛼 sin 𝛽)

e uguagliando parte reale e parte immaginaria si ottengono le formule di


addizione.
5. Visto che la funzione exp : ℂ → ℂ è continua anche la sua restrizione all’asse
immaginario lo è. E dunque anche parte reale (coseno) e parte immaginaria
(seno) lo sono.
6. Sia 𝑥 ∈ ℝ. Osservando che 𝑖 2 𝑘 = (𝑖 2 ) 𝑘 = (−1) 𝑘 e 𝑖 2 𝑘+1 = 𝑖 · 𝑖 2 𝑘 = 𝑖 · (−1) 𝑘
suddividendo i termini pari e dispari della serie che definisce l’esponenziale si
ha:
+∞ 𝑘 𝑘 +∞ 2 𝑘 2 𝑘 +∞ 2 𝑘+1 2 𝑘+1
X 𝑖 𝑥 X 𝑖 𝑥 X 𝑖 𝑥
exp(𝑖𝑥) = = +
𝑘=0
𝑘! 𝑘=0
(2 𝑘)! 𝑘=0
(2 𝑘 + 1)!
+∞
X (−1) 𝑘 𝑥 2 𝑘 +∞
X (−1) 𝑘 𝑥 2 𝑘+1
= +𝑖 .
𝑘=0
(2 𝑘)! 𝑘=0
(2 𝑘 + 1)!

Osserviamo ora che le due serie che compaiono a destra dell’uguaglianza sono a
termini reali e quindi la loro somma è reale. Dunque queste due serie coincidono
con la parte reale e la parte immaginaria di exp(𝑖𝑥) = cos 𝑥 + 𝑖 sin 𝑥 .
7. Per la corrispondente proprietà dell’esponenziale sappiamo che per 𝑥 → 0 si ha

𝑒 𝑖𝑥 − 1
→ 1.
𝑖𝑥
3.11 le funzioni trigonometriche 153

Ma
𝑒 𝑖𝑥 − 1 cos 𝑥 − 1 + 𝑖 sin 𝑥 sin 𝑥 1 − cos 𝑥
= = +𝑖 .
𝑖𝑥 𝑖𝑥 𝑥 𝑥
Scopriamo dunque che

1 − cos 𝑥 sin 𝑥
→0 e → 1.
𝑥 𝑥
D’altra parte si ha

1 − cos 𝑥 (1 − cos 𝑥) · (1 + cos 𝑥) 1 − cos2 𝑥 1


= = ·
𝑥2 𝑥 2 (1 + cos 𝑥) 𝑥2 1 + cos 𝑥
2
sin 𝑥

1 1 1
= · →1· = .
𝑥 1 + cos 𝑥 1 + cos 0 2

Definiamo 𝜋 come la misura in radianti dell’angolo piatto, cioè dell’angolo identificato


dal numero 𝑒 𝑖𝜋 = −1 sul piano complesso.
𝜋
Teorema 3.52 (definizione di 𝜋). Definiamo 𝜋 come il più piccolo numero reale positivo
in cui si annulla la funzione sin 𝑥 . Si ha 𝜋 ∈ [2.8 , 4]. Le funzioni 𝑒 𝑖𝑥 , sin 𝑥 e cos 𝑥 sono
𝜏
periodiche di periodo 𝜏 = 2𝜋:

𝑒 𝑖𝑥+2𝜋 = 𝑒 𝑖𝑥 , cos(𝑥 + 2𝜋) = cos 𝑥, sin(𝑥 + 2𝜋) = sin 𝑥.

La funzione sin 𝑥 è strettamente crescente nell’intervallo − 𝜋2 , 𝜋2 e strettamente mentre la


 

funzione cos 𝑥 è strettamente decrescente nell’intervallo [0 , 𝜋]. Si ha infine:

sin(𝜋 + 𝑥) =− sin 𝑥, cos(𝜋 + 𝑥) = − cos 𝑥.

Vale inoltre la celeberrima formula di Eulero:

𝑒 𝑖𝜋 + 1 = 0.

Dimostrazione. Il teorema 3.48 ci permette di approssimare la funzione esponenziale


𝑒 𝑖𝑥 per 𝑥 ∈ [0, 1]. Ci proponiamo quindi di determinare l’andamento delle funzioni
sin 𝑥 e cos 𝑥 in tale intervallo e definire in tale intervallo il valore di 𝛼 = 𝜋4 . Tramite
tale valore 𝛼 e tramite le formule di addizione riusciremo a determinare l’andamento
delle funzioni sin e cos su tutta la retta reale.

Se 𝑥 ∈ [0 , 1] grazie al teorema 3.48 applicato con 𝑛 = 3 sappiamo che


4
 2 3

𝑒 − 1 + 𝑖𝑥 + (𝑖𝑥) + (𝑖𝑥) ≤ |𝑖𝑥|
𝑖𝑥
2 6 18

sviluppando

cos 𝑥 + 𝑖 sin 𝑥 − 1 − 𝑖𝑥 + 𝑥 + 𝑖 𝑥 ≤ 𝑥 .
2

3 4

2 6 18
154 3 serie

Il valore assoluto delle parti reale e immaginaria di un numero complesso sono minori
del modulo del numero complesso. Dunque si ottiene:

cos 𝑥 − 1 + 𝑥 ≤ 𝑥 sin 𝑥 − 𝑥 + 𝑥 ≤ 𝑥 .

2 4

3 4

e (3.17)
2 18 6 18

Per la funzione sin 𝑥 si ha dunque

𝑥3 𝑥4 𝑥3 𝑥4
𝑥− − ≤ sin 𝑥 ≤ 𝑥 − +
6 18 6 18
e sapendo che 0 < 𝑥 < 1 possiamo affermare che

𝑥3 𝑥4 𝑥 𝑥 7
𝑥− − ≥𝑥− − = 𝑥
6 18 6 18 9
e
𝑥3 𝑥4 𝑥3 𝑥3
𝑥− + ≤𝑥− + ≤ 𝑥.
6 18 6 18
Dunque se 𝑥 ∈ [0 , 1] si ha
7
𝑥 ≤ sin 𝑥 ≤ 𝑥. (3.18)
9
Per il coseno da un lato osserviamo che da (3.17) si ottiene, se 𝑥 ∈ [0 , 1]:

𝑥2 𝑥4 1 1 4
cos 𝑥 ≥ 1 − − ≥ 1− − = > 0.
2 18 2 18 9
Dall’altro lato si ha

𝑥2 𝑥4 𝑥2 𝑥2 4
cos 𝑥 ≤ 1 − + =1− + ≤ 1 − 𝑥2 .
2 18 2 18 9

Vogliamo ora dimostrare che la funzione cos 𝑥 è strettamente decrescente sull’intervallo


[0 , 1]. Infatti se 𝑥 ∈ [0 , 1] e 𝑡 ∈ (0 , 1] si ha

cos(𝑥 + 𝑡) = cos 𝑥 cos 𝑡 − sin 𝑥 sin 𝑡 ≤ cos 𝑥 cos 𝑡 < cos 𝑥

in quanto sin 𝑥 ≥ 0, sin 𝑡 ≥ 0 e cos 𝑡 < 1 − 59 𝑡 2 < 1 se 𝑡 > 0. Dunque la funzione


cos 𝑥 è strettamente decrescente su [0 , 1]. Visto che cos2 𝑥 + sin2 𝑥 = 1 deduciamo
che la funzione sin2 𝑥 è strettamente crescente in [0 , 1]. Inoltre sin 𝑥 è positiva su tale
intervallo e dunque anche sin 𝑥 è strettamente crescente in [0 , 1].


Vogliamo ora dimostrare che esiste 𝛼 ∈ [0 , 1] tale per cui sin 𝛼 = 22 . Visto che sin 𝑥 è
una funzione continua, e sin 0√= 0, per utilizzare il teorema 2.79 dei valori intermedi
2
basterà verificare che sin 1 > 2 . E infatti si ha:

7 2
sin 1 ≥ > .
9 2
√ √
2 2
Dunque esiste un unico 𝛼 ∈ [0 , 1] tale che sin 𝛼 = 2 . Allora anche cos 𝛼 = 2 (in
3.12 funzioni trigonometriche inverse 155

quanto sin2 + cos2 = 1) e quindi


√ 2
2 𝑖𝛼 2 1
𝑒 = (1 + 𝑖) = (1 + 2𝑖 − 1) = 𝑖.
2 2

Dunque 𝛼 è la misura in radianti di metà angolo retto.

Se poniamo 𝜋 = 4 𝛼 scopriamo dunque che


 2
𝑒 𝑖𝜋 = 𝑒 2𝑖𝛼 = 𝑖 2 = −1

da cui sin 𝜋 = 0 e cos 𝜋 = −1. Analogamente da 𝑒 2𝑖𝛼 = 𝑖 troviamo che sin 𝜋2 = 1


cos 𝜋2 = 0.

Dalla stima (3.18) si ottiene √


7 2
𝛼≤ ≤𝛼
9 2
da cui 𝜋 = 4 𝛼 ∈ [2.8 , 4].

Abbiamo verificato che sull’intervallo 0 , 𝜋4 la funzione sin 𝑥 è strettamente crescente


 

mentre cos 𝑥 è strettamente decrescente. Dalle formule di addizione possiamo quindi


𝜋 𝜋
 𝜋 𝜋  che sin 2 − 𝑥 = cos 𝑥 e cos 2 − 𝑥 = sin 𝑥 . Dunque anche sull’intervallo
 
dedurre
4 , 2 la funzione sin 𝑥 è crescente e cos 𝑥 è decrescente. Ancora, tramite le formula
di addizione troviamo che sin(𝜋 − 𝑥) = sin 𝑥 e cos(𝜋 − 𝑥) = − cos 𝑥 da cui possiamo
dedurre che sia  𝜋la funzione sin 𝑥 che la funzione cos 𝑥 sono strettamente decrescenti
sull’intervallo 2 , 𝜋 . Possiamo dunque affermare che sin 𝑥 > 0 se 0 < 𝑥 < 𝜋 e dunque

𝜋 è il più piccolo reale positivo in cui la funzione sin si annulla.

Visto che sin(𝜋 + 𝑥) = − sin 𝑥 e cos(𝜋 + 𝑥) = − cos 𝑥 possiamo stabilire l’andamento


delle funzioni sin e cos anche sull’intervallo [𝜋, 2𝜋]. Infine essendo 𝑒 2𝑖𝜋 = 1 si osserva
che la funzione 𝑒 2𝑖𝑥 e di conseguenza le funzioni sin 𝑥 e cos 𝑥 sono periodiche di
periodo 2𝜋.

Esercizio 3.53. Utilizzando il teorema 3.48 dimostrare che

lim 𝑛 sin(2𝜋𝑒 𝑛 !) = 2𝜋.


𝑛→+∞

3.12 funzioni trigonometriche inverse

La funzione sin : [−𝜋/2 , 𝜋/2] → [−1 , 1] risulta essere strettamente crescente. Inoltre
essendo una funzione continua e visto che sin(−𝜋/2) = −1 e sin(𝜋/2) = 1 per il
teorema dei valori intermedi la funzione assume tutti i valori in [−1 , 1]. Dunque
restringendo il dominio all’intervallo [−𝜋/2 , 𝜋/2] e il codominio all’intervallo [−1 , 1]
la funzione risulta invertibile. La funzione inversa

arcsin : [−1 , 1] → [−𝜋/2 , 𝜋/2]

si chiama arco seno. Per definizione di funzione inversa si ha

arcsin(sin 𝑥) = 𝑥, ∀𝑥 ∈ [−𝜋/2 , 𝜋/2]


156 3 serie

e
sin(arcsin 𝑥) = 𝑥, ∀𝑥 ∈ [−1 , 1].

La funzione cos : [0 , 𝜋] → [−1 , 1] risulta essere strettamente decrescente e, analoga-


mente a quanto visto per la funzione sin possiamo verificare che ristretta a tali intervalli
è una funzione invertibile. La funzione inversa

arccos : [−1 , 1] → [0 , 𝜋]

si chiama arco coseno. Per definizione si ha

arccos(cos 𝑥) = 𝑥, ∀𝑥 ∈ [0, 𝜋]

e
cos(arccos 𝑥) = 𝑥, ∀𝑥 ∈ [−1 , 1].

tg 𝑥 La funzione
sin 𝑥
tg 𝑥 =
cos 𝑥
è definita quando cos 𝑥 ≠ 0 ovvero:
n𝜋 o
tg : ℝ \ + 𝑘𝜋 : 𝑘 ∈ ℤ → ℝ.
2
Se restringiamo la funzione all’intervallo (−𝜋/2 , 𝜋/2) possiamo facilmente osservare
che la funzione tg : (−𝜋/2 , 𝜋/2) → ℝ è strettamente crescente. Inoltre se 𝑎 𝑛 → 𝜋/2,
𝑎 𝑛 < 𝜋/2 si ha cos(𝑎 𝑛 ) → 0 (per continuità del coseno) e sin(𝑎 𝑛 ) → 1 dunque
tg 𝑎 𝑛 → +∞. Analogamente per 𝑎 𝑛 → −𝜋/2 si trova tg 𝑎 𝑛 → −∞. Dunque per il
teorema dei valori intermedi possiamo affermare che la funzione tg : (−𝜋/2 , 𝜋/2) → ℝ
è suriettiva. E’ quindi invertibile e la funzione inversa

arctg : ℝ → (−𝜋/2 , 𝜋/2)

si chiama arco tangente. Per definizione si ha

arctg tg 𝑥 = 𝑥, ∀𝑥 ∈ (−𝜋/2 , 𝜋/2)

e
tg arctg 𝑥 = 𝑥, ∀𝑥 ∈ ℝ.

Grazie al teorema 2.8visto che quest funzioni sono monotone e bigettive possiamo
affermare che le funzioni arcsin, arccos e arctg sono funzioni continue.

Esercizio 3.54. Dimostrare che per ogni 𝑥 > 0 si ha

1 𝜋
arctg = − arctg 𝑥.
𝑥 2

Esercizio 3.55. La serie


+∞
X sin 𝑘
𝑘=1
𝑘
è convergente.
3.13 funzioni iperboliche 157

Dimostrazione. Applichiamo il teorema 3.32. Posto 𝑎 𝑘 = sin 𝑘 e 𝐵 𝑘 = 1/𝑘 si ha

𝑛−1 𝑛−1
𝑒 𝑖𝑘 .
X X
𝐴𝑛 = sin 𝑘 = Im
𝑘=0 𝑘=0

Osserviamo allora che 𝑒 𝑖 𝑘 = (𝑒 𝑖 ) 𝑘 e dunque 𝐴𝑛 è la parte immaginaria della somma di


una serie geometrica. Si può quindi calcolare esplicitamente

1 − (𝑒 𝑖 )𝑛
𝐴𝑛 = Im
1 − 𝑒𝑖
da cui
1 − 𝑒 𝑖𝑛 1 + 𝑒 𝑖𝑛

2
|𝐴𝑛 | ≤ ≤ =
1 − 𝑒𝑖 1 − 𝑒 𝑖 1 − 𝑒 𝑖

e dunque 𝐴𝑛 è limitata.

D’altro canto posto 𝐵 𝑘 = 1/𝑘 è chiaro che 𝐵 𝑘 è decrescente e infinitesima.

Esercizio 3.56. Determinare il carattere delle seguenti serie


   
X 1 1 X 1
− sin , sin 𝜋𝑛 +
𝑛 𝑛 𝑛 𝑛 𝑛

3.13 funzioni iperboliche sinh, cosh

Definizione 3.57 (funzioni iperboliche). Le funzioni coseno iperbolico e seno iperbolico


sono definite, per ogni 𝑥 ∈ ℝ, come segue:

𝑒 𝑥 + 𝑒 −𝑥 𝑒 𝑥 − 𝑒 −𝑥
cosh 𝑥 = , sinh 𝑥 = . (3.19)
2 2

Teorema 3.58 (proprietà delle funzioni iperboliche). Valgono le seguenti proprietà.

1. la funzione sinh è dispari, cosh è pari:

sinh(−𝑥) = − sinh(𝑥), cosh(−𝑥) = cosh(𝑥);

2. i punti del piano con coordinate (cosh 𝑥, sinh 𝑥) per 𝑥 ∈ ℝ sono disposti su un ramo
di iperbole in quanto vale:
cosh2 𝑥 − sinh2 𝑥 = 1;
3. formule di addizione:

cosh(𝛼 + 𝛽) = cosh 𝛼 cosh 𝛽 + sinh 𝛼 sinh 𝛽,


sinh(𝛼 + 𝛽) = sinh 𝛼 cosh 𝛽 + cosh 𝛼 sinh 𝛽 ;
158 3 serie

𝑦 = sinh 𝑥
𝑦 = cosh 𝑥 𝑦 = tgh 𝑥
1

Figura 3.2: I grafici delle funzioni sinh, 𝑥


cosh e tgh.

−1

(interagisci)

4. si ha
+∞
X 𝑥 2𝑘 𝑥2 𝑥4 𝑥6
cosh 𝑥 = =1+ + + +...
𝑘=0
(2 𝑘)! 2 4! 6!
+∞
X 𝑥 2 𝑘+1 𝑥3 𝑥5 𝑥7
sinh 𝑥 = =𝑥+ + + +...
𝑘=0
(2 𝑘 + 1)! 6 5! 7!

5. la funzione sinh è strettamente crescente su tutto ℝ, la funzione cosh è strettamente


crescente sull’intervallo [0 , +∞) e strettamente decrescente nell’intervallo (−∞, 0];
6. per 𝑥 → +∞ si ha sinh 𝑥 → +∞, cosh 𝑥 → +∞, per 𝑥 → −∞ si ha sinh 𝑥 → −∞,
cosh 𝑥 → +∞.

Dimostrazione. I primi tre punti si dimostrano facilmente per verifica diretta, utilizzan-
do la definizione (3.19).

Gli sviluppi in serie si ottengono anch’essi sostituendo gli sviluppi dell’esponenziale


nella definizione. Nel cosh i termini di grado dispari si cancellano, nel sinh si cancellano
i termini di grado pari.

Per quanto riguarda la monotonia si osserva che se 𝑥 ≥ 0 ogni addendo delle due
serie esposte nel punto 4 è strettamente crescente (in quanto i coefficienti sono tutti
positivi) e dunque le somme delle serie, cioè la funzione cosh e la funzione sinh sono
strettamente crescenti sull’intervallo [0 , +∞). La funzione sinh, essendo dispari, risulta
inoltre crescente anche sull’intervallo (−∞, 0] e quindi è crescente su tutto ℝ.

Per l’ultima proprietà basterà usare la definizione (3.19) e ricordare che (teorema 2.57)
se 𝑥 → +∞ allora 𝑒 𝑥 → +∞ ed 𝑒 −𝑥 = 𝑒1𝑥 → 0.

Osserviamo che cosh 0 = 1 e, per le proprietà di monotonia viste nel teorema precedente
si ha cosh 𝑥 ≥ cosh 0 = 1 > 0. Dunque cosh 𝑥 non si annulla mai e si può definire per
tgh
ogni 𝑥 ∈ ℝ la tangente iperbolica

sinh 𝑥
tgh 𝑥 = .
cosh 𝑥

La funzione sinh : ℝ → ℝ è iniettiva in quanto strettamente crescente ed è surgettiva


in quanto è continua e quindi assume tutti i valori compresi tra lim𝑥→+∞ sinh(𝑥) = +∞
3.14 esercizi 159

e lim𝑥→−∞ sinh(𝑥) = −∞. Dunque sinh : ℝ → ℝ è invertibile e la funzione inversa si


chiama settore di seno iperbolico e si denota con settsinh

settsinh : ℝ → ℝ.

Analogamente la funzione ristretta cosh : [0 , +∞) → [1 , +∞) è iniettiva in quanto


strettamente crescente ed è surgettiva in quanto è continua e assume su [0 , +∞) tutti i
valori compresi tra cosh(0) = 1 e lim𝑥→+∞ cosh 𝑥 = +∞. Dunque la funzione cosh 𝑥
ristretta a [0 , +∞) → [1 , +∞) è invertibile e la funzione inversa si chiama settore di
coseno iperbolico settcosh
settcosh : [1 , +∞) → [0 , +∞).

La funzione tgh 𝑥 è strettamente crescente su tutto ℝ e assume tutti i valori strettamente


compresi tra −1 e 1. La funzione inversa si chiama setttgh.

Esercizio 3.59. Fissato 𝑦 ∈ ℝ si risolva l’equazione

𝑒 𝑥 − 𝑒 −𝑥
=𝑦
2
riconducendola ad una equazione di secondo grado nella variabile 𝑡 = 𝑒 𝑥 . Si dimostri quindi
che vale  √ 
settsinh 𝑥 = ln 𝑥 + 𝑥 2 + 1 .

In modo analogo si dimostri che vale


 √ 
settcosh 𝑥 = ln 𝑥 + 𝑥2 − 1

e r
1+𝑥
setttgh 𝑥 = ln .
1−𝑥

3.14 esercizi

Esercizio 3.60. Determinare il carattere delle seguenti serie

X 𝑛2 − 𝑛3 X (𝑛 !)2
,
𝑛 3𝑛 𝑛 (2𝑛)!

X (−1)𝑛 X 𝑛 − 10
,
𝑛 ln |𝑛 7 − 10𝑛 5 + 3 | 𝑛 𝑛 2 + 10
i numeri complessi 4
Nel capitolo precedente abbiamo introdotto l’esponenziale complesso ed abbiamo
𝑖𝑡
𝑖𝑡 𝑓 : ℝ → ℂ definita da 𝑓 (𝑡) = 𝑒 ha valori sulla circonferenza
osservato che la funzione
unitaria in quanto 𝑒 = 1. Tramite la definizione 3.50 abbiamo introdotto le funzioni
seno e coseno in modo che risulti 𝑓 (𝑡) = cos 𝑡 + 𝑖 sin 𝑡 . Sappiamo che 𝑓 (0) = 𝑒 0 = 1 e,
per come abbiamo definito 𝜋, sappiamo che 𝑓 (𝜋/2) = 𝑖 .

4.1 rappresentazione polare dei numeri complessi

I numeri complessi di modulo uno vengono chiamati unitari. Geometricamente i complessi unitari
numeri complessi unitari sono i punti della circonferenza unitaria centrata nell’origine
del piano complesso. Se 𝑧 = 𝑥 + 𝑖 𝑦 è unitario si ha 𝑥 2 + 𝑦 2 = 1. I prodotti e i reciproci
dei numeri complessi unitari sono anch’essi unitari, risulta quindi che tali numeri
formano un sottogruppo moltiplicativo del gruppo dei numeri complessi. Un gruppo è un insieme su cui è definita
una operazione (spesso denotata con il
Ogni numero complesso 𝑧 potrà essere scritto nella forma simbolo della moltiplicazione) che sia
associativa, che abbia elemento neutro e
𝑧 =𝜌·𝑢 tale che ogni elemento abbia un inverso.

con 𝜌 ∈ ℝ, 𝜌 > 0 e 𝑢 ∈ ℂ unitario. Basta infatti definire 𝜌 = |𝑧| e 𝑢 = 𝑧/|𝑧| (se 𝑧 ≠ 0,


altrimenti si potrà scegliere arbitrariamente 𝑢 = 1).

Teorema 4.1 (argomento). Sia 𝑧 ∈ ℂ un numero complesso non nullo. Allora esiste un
unico 𝜃 ∈ [0 , 2𝜋) tale che
𝑧 = |𝑧|𝑒 𝑖𝜃 .
Denoteremo tale valore di 𝜃 come l’argomento (o fase) di 𝑧 e scriveremo
argomento

𝜃 = arg 𝑧.

Se 𝑧 = 0 porremo per convenzione arg 𝑧 = 0.

Dimostrazione. Sia 𝑧 ∈ ℂ, 𝑧 ≠ 0 e poniamo 𝑢 = 𝑧/|𝑧| . Posto 𝑢 = 𝑥 + 𝑖 𝑦 con 𝑥, 𝑦 ∈ ℝ si


ha |𝑢| 2 = 𝑥 2 + 𝑦 2 = 1.
Se 𝑦 ≥ 0 se vogliamo che 𝑦 = sin 𝜃 con 𝜃 ∈ [0 , 2𝜋) dovrà necessariamente essere
𝜃 ∈ [0, 𝜋] (altrimenti si avrebbe sin 𝜃 < 0). E se vogliamo che sia 𝑥 = cos 𝜃 basterà
(e si dovrà) scegliere 𝜃 = arccos 𝑥 . Visto che sin2 𝜃 + cos2 𝜃 = 1 = 𝑥 2 + 𝑦 2 sapendo
che cos 𝜃 = 𝑥 si avrà sin2 𝜃 = 𝑦 2 cioè | sin 𝜃| = |𝑦| . Ma visto che 𝑦 ≥ 0 e sin 𝜃 ≥ 0
avremo, come voluto, sin 𝜃 = 𝑦 . Se 𝑦 < 0 poniamo 𝜃 = 2𝜋 − arccos 𝑥 cosicché si avrà
𝜃 ∈ (𝜋, 2𝜋) e, come prima (verificare!), 𝑥 = cos 𝜃 , 𝑦 = sin 𝜃 .
In ogni caso per ogni 𝑧 ≠ 0 abbiamo quindi trovato l’unico 𝜃 ∈ [0 , 2𝜋) tale che

𝑢 = 𝑥 + 𝑖 𝑦 = cos 𝜃 + 𝑖 sin 𝜃 = 𝑒 𝑖𝜃 .

da cui
𝑧 = |𝑧| · 𝑒 𝑖𝜃 .
162 4 i numeri complessi

Per ogni 𝑧 ∈ ℂ posto


𝜌 = |𝑧|, 𝜃 = arg 𝑧
si avrà quindi la rappresentazione esponenziale o polare

𝑧 = 𝜌𝑒 𝑖𝜃 = 𝜌 · (cos 𝜃 + 𝑖 sin 𝜃).

Se 𝑧 = 𝑥 + 𝑖 𝑦 è la rappresentazione cartesiana, si avranno le seguenti formule di


conversione: ( (
𝑥 = 𝜌 cos 𝜃 𝜌 = 𝑥2 + 𝑦2
p

𝑦 = 𝜌 sin 𝜃 𝜃 = arg 𝑧
con
𝜋 𝑥



 2 − arctg 𝑦 se 𝑦 > 0,
 3 𝜋 − arctg 𝑥 se 𝑦 < 0,


𝑦

arg 𝑧 = 2


 𝜋 se 𝑦 = 0 e 𝑥 < 0,
se 𝑦 = 0 e 𝑥 ≥ 0.

0

4.2 interpretazione geometrica

Vogliamo ora interpretare geometricamente 𝜃 = arg 𝑧 come la misura di un angolo.


Per fare ciò dobbiamo però capire cosa si intende per angolo e come si misura un
angolo. In questa sezione ragioneremo in maniera intuitiva in quanto le proprietà
formali analitiche delle operazioni sui numeri complessi sono già state determinate e
quello che vogliamo fare è darne una interpretazione geometrica. Daremo quindi per
scontate le proprietà geometriche del piano euclideo.

Un angolo, geometricamente, è la regione piana delimitata da due semirette uscenti da


uno stesso punto. Le due semirette si chiamano lati dell’angolo e il punto in comune si
chiama vertice.

Due angoli 𝛼, 𝛽 si dicono congruenti se è possibile traslare e ruotare uno dei due angoli
(diciamo 𝛼 ) in modo che si sovrapponga all’altro. In particolare sarà sempre possibile
trovare una traslazione che manda il vertice dell’angolo 𝛼 sul vertice dell’angolo 𝛽 e
sarà possibile trovare una rotazione che fa coincidere uno dei due lati in modo che uno
dei due angoli copra interamente l’altro. Sia 𝛼′ la roto-traslazione di 𝛼 così individuata.
Se 𝛼′ = 𝛽 diremo che i due angoli sono congruenti, altrimenti se 𝛼′ ⊇ 𝛽 diremo che 𝛼
è maggiore di 𝛽 e se invece 𝛼′ ⊆ 𝛽 diremo che 𝛼 è minore di 𝛽 . Con un procedimento
simile è in genere possibile sommare due angoli: si sposta uno dei due tramite una
roto-traslazione in modo da far coincidere il vertice e un lato dei due angoli e in modo
che i due angoli non si sovrappongano (questo non è sempre possibile perché se gli
angoli sono troppo grandi si sovrapporranno sempre). La loro unione sarà un angolo
che chiamiamo somma degli angoli dati.

Misurare un angolo significa associare ad ogni angolo un numero (reale positivo) in


modo che si abbiano le seguenti proprietà: angoli congruenti hanno la stessa misura,
angoli maggiori hanno misure maggiori (proprietà di monotonia) e la misura della
somma di due angoli è la somma delle misure (additività). Si può intuire che una
4.2 interpretazione geometrica 163

volta scelto quale angolo ha misura 1 (l’unità di misura) la misura di ogni altro angolo
sarà univocamente determinata da queste proprietà. Infatti la misura dei multipli e
dei sottomultipli dell’unità è determinata dalla additività della misura e la misura
degli angoli incommensurabili si potrà ottenere per approssimazione sfruttando la
monotonia.

Se ora identifichiamo il piano euclideo con il piano complesso ogni angolo potrà essere
traslato e ruotato in modo che uno dei due lati vada a coincidere con la semiretta
dei reali positivi e in modo che l’angolo si estenda al di sopra di tale semiretta e sia
delimitato da una seconda semiretta passante per un punto 𝑢 a distanza 1 dall’origine
ovvero con |𝑢| = 1. Vogliamo giustificare il fatto che 𝜃 = arg 𝑢 può essere scelto come
misura dell’angolo. Studiando la monotonia delle funzioni cos e sin si può verificare
facilmente che 𝜃 è crescente con l’angolo. Più rilevante è chiedersi se 𝜃 è additivo.
Siano 𝑢, 𝑣 ∈ ℂ due numeri complessi unitari che rappresentino due diversi angoli.
Sia 𝜃 = arg 𝑢 e 𝜑 = arg 𝑣 da cui 𝑢 = 𝑒 𝑖𝜃 e 𝑣 = 𝑒 𝑖𝜑 . Consideriamo la trasformazione
𝑅 𝜃 (𝑧) = 𝑒 𝑖𝜃 · 𝑧 . Si nota che 𝑅 𝜃 è una trasformazione rigida del piano ovvero una
trasformazione
𝑖𝜃 che mantiene la distanza tra i punti (una isometria) in quanto essendo
𝑒 = 1 si ha

|𝑅 𝜃 (𝑧) − 𝑅 𝜃 (𝑤)| = 𝑒 𝑖𝜃 𝑧 − 𝑒 𝑖𝜃 𝑤 = 𝑒 𝑖𝜃 · |𝑧 − 𝑤| = |𝑧 − 𝑤|.


Inoltre 𝑅 𝜃 (0) = 0 e 𝑅 𝜃 (1) = 𝑢 significa che 𝑅 𝜃 non è altro che una rotazione che tiene
fissa l’origine e manda la semiretta dei reali positivi nella semiretta uscente da 0 e
passante per 𝑢 = 𝑒 𝑖𝜃 . Dunque 𝑅 𝜃 è la trasformazione che rende l’angolo identificato
dal numero complesso unitario 𝑣 in un angolo adiacente a quello identificato da 𝑢 .
Quindi la somma (geometrica) degli angoli 𝑢 e 𝑣 è identificata dal numero complesso
unitario 𝑅 𝜃 (𝑣) = 𝑢 · 𝑣 . Ma, per la proprietà additiva dell’esponenziale complesso,

𝑢 · 𝑣 = 𝑒 𝑖𝜃 · 𝑒 𝑖𝜑 = 𝑒 𝑖(𝜃+𝜑)

e dunque se 𝜃 + 𝜑 < 2𝜋 si ha

arg(𝑢 · 𝑣) = 𝜃 + 𝜑 = arg(𝑢) + arg(𝑣)

che corrisponde alla proprietà additiva della misura degli angoli.

L’angolo unitario identificato dal numero complesso 𝑒 𝑖 si chiama radiante ed è l’unità radiante

di misura che abbiamo scelto per gli angoli. L’angolo retto sarà identificato dal numero
𝜋
complesso 𝑖 = 𝑒 𝑖 2 e avrà una misura pari a 𝜋2 radianti. L’angolo piatto sarà identificato
dal numero complesso −1 = 𝑒 𝑖𝜋 e avrà una misura di 𝜋 radianti. Geometricamente
la misura degli angoli può essere data dalla lunghezza dell’arco di raggio unitario
identificato dall’angolo. Dunque la definizione geometrica di 𝜋 (rapporto tra lunghezza
della circonferenza e diametro) corrisponde a richiedere che la semicirconferenza
unitaria abbia misura 𝜋 radianti. Questo significa che la definizione analitica di 𝜋 che
abbiamo dato (teorema 3.52) si riconcilia con la definizione geometrica.

Possiamo riconciliare definizione analitica e geometrica di 𝜋 anche con delle osserva-


zioni dirette.

Osservazione 4.2 (lunghezza della circonferenza tramite moto circolare uniforme). Si


considera la curva 𝑡 ↦→ 𝑒 𝑖𝑡 come l’equazione oraria del moto di un punto che si muove nel piano
164 4 i numeri complessi

complesso. Visto che 𝑒 𝑖𝑡 = 1 tale punto si muove sulla circonferenza unitaria. Possiamo

determinare la velocità istantanea del punto considerando la variazione della posizione:

𝑒 𝑖(𝑡+Δ𝑡) − 𝑒 𝑖𝑡 𝑒 𝑖Δ𝑡 − 1
= 𝑒 𝑖𝑡 · .
Δ𝑡 Δ𝑡
Prendendo un incremento temporale Δ𝑡 = 𝜀/𝑛 con 𝑛 → +∞ si osserva che il modulo della
velocità è dato da
𝑖𝑡 𝑒 𝑖 𝑛𝜀 − 1

𝑣 = lim 𝑒 · 𝜀
𝑛→+∞
𝑛

e visto che 𝑒 𝑖𝑡 = 1 ricordando il limite notevole (3.11) (teorema 3.45) si ottiene che la velocità è

pari ad 1. Significa che il punto 𝑒 𝑖𝑡 si muove sulla circonferenza unitaria con velocità unitaria
e quindi la lunghezza della curva percorsa risulta numericamente uguale al tempo trascorso.
Visto che per 𝑡 che varia da 0 a 2𝜋 il punto compie un giro completo attorno alla circonferenza
unitaria significa che la lunghezza della circonferenza unitaria è 2𝜋.

Osservazione 4.3 (lunghezza della circonferenza tramite approssimazione con poligo-


nali). Possiamo calcolare la lunghezza della circonferenza unitaria come il limite dei perimetri
dei poligoni di 𝑁 lati iscritti nella circonferenza. Fissato 𝑁 consideriamo per 𝑘 = 0 , . . . , 𝑁 i
punti
2𝜋𝑘
𝑢𝑘 = 𝑒 𝑖 𝑁 .
Osserviamo che
2𝜋(𝑘+1)
2𝜋𝑘
2𝜋𝑘 2𝜋 2𝜋
|𝑢 𝑘+1 − 𝑢 𝑘 | = 𝑒 𝑖 − 𝑒𝑖
𝑖 𝑁 𝑖𝑁 𝑖𝑁
𝑁 𝑁 = 𝑒 · 𝑒 − 1 = 𝑒 − 1

cioè i punti 𝑢 𝑘 sono equidistanti tra loro. Si noti che 𝑢0 = 𝑢𝑁 = 1 e quindi i punti 𝑢1 , . . . , 𝑢𝑁
sono gli 𝑁 vertici di un poligono regolare di 𝑁 lati iscritto nella circonferenza unitaria. Il
perimetro del poligono è quindi dato da
2𝜋

𝑃 𝑁 = 𝑁 · 𝑒 𝑖 𝑁 − 1

e per 𝑁 → +∞ si ha, sempre utilizzando il limite notevole (3.11)


2𝜋
𝑖𝑁
𝑒 − 1

𝑃𝑁 = 2𝜋 · 2𝜋 → 2𝜋.
𝑁

Osservazione 4.4 (matrici di rotazione). Fissato 𝜃 ∈ ℝ consideriamo, come prima, la


funzione 𝑅 𝜃 : ℂ → ℂ, 𝑅 𝜃 (𝑧) = 𝑒 𝑖𝜃 · 𝑧 . Un altro modo per convincerci che 𝑅 𝜃 rappresenta
una rotazione di 𝜃 radianti è quello di guardare la matrice associata. Se identifichiamo il
piano complesso ℂ con ℝ2 la trasformazione 𝑅 𝜃 può essere rappresentata da una matrice
𝑀 𝛼 che ha come colonne le coordinate di 𝑅 𝜃 (1) = 𝑒 𝑖𝜃 = cos 𝜃 + 𝑖 sin 𝜃 e le coordinate di
𝑅 𝜃 (𝑖) = 𝑒 𝑖𝜃 · 𝑖 = − sin 𝜃 + 𝑖 cos 𝜃 :

cos 𝛼 − sin 𝛼
 
𝑀𝛼 = .
sin 𝛼 cos 𝛼

Osservazione 4.5 (interpretazione geometrica del prodotto di numeri complessi).


Possiamo ora dare una interpretazione geometrica del prodotto tra due numeri complessi
4.2 interpretazione geometrica 165

𝑧, 𝑤 ∈ ℂ. Se 𝑧 ≠ 0 possiamo scrivere 𝑧 = |𝑧| · 𝑒 𝑖𝜃 con 𝜃 = arg 𝑧 , cosicché:

𝑧 · 𝑤 = |𝑧| · 𝑅 𝜃 (𝑤).

Si capisce quindi che il numero complesso 𝑧 · 𝑤 si ottiene ruotando 𝑤 dell’angolo identificato


da 𝑧 con l’asse dei reali positivi, e quindi riscalando il punto ottenuto di un fattore |𝑧| . Se
poniamo 𝜓 = arg 𝑤 possiamo interpretare la moltiplicazione complessa in coordinate polari:

𝑧 · 𝑤 = |𝑧|𝑒 𝑖𝜃 · |𝑤|𝑒 𝑖𝜓 = |𝑧| · |𝑤| · 𝑒 𝑖(𝜃+𝜓) .

Dunque il prodotto di due numeri complessi è quel numero complesso che ha come modulo il
prodotto dei moduli e come argomento la somma (a meno di multipli di 2𝜋) degli argomenti.

Osservazione 4.6 (interpretazione geometrica dell’esponenziale complesso). Ricordia-


mo che (teorema 3.47) 𝑛
𝑖𝑦

𝑒 𝑖 𝑦 = lim 1 + .
𝑛→+∞ 𝑛

Possiamo osservare che se 𝑦 ∈ ℝ i punti (1 + 𝑖 𝑦/𝑛) 𝑘 per 𝑘 = 1 . . . 𝑛 sono i vertici di una


spezzata formata da 𝑛 segmenti di lunghezza
  𝑘+1   𝑘  𝑘  
𝑖𝑦 𝑖 𝑦 𝑖𝑦 𝑖𝑦
1+ − 1+ = 1+ · 1+ −1

𝑛 𝑛 𝑛 𝑛
r !𝑘  𝑛2
2 𝑦 𝑦2

|𝑦| |𝑦|
= 1+ 2 · ≤ 1+ 2 · .
𝑛 𝑛 𝑛 𝑛

In particolare la lunghezza totale della spezzata ℓ 𝑛 può essere stimata come segue
 𝑛2
𝑦2

|𝑦| ≤ ℓ 𝑛 ≤ 1 + 2 · |𝑦|
𝑛

da cui osservando che


 𝑛2
𝑦2

1+ 2 →1
𝑛
e utilizzando il criterio del confronto si ottiene ℓ 𝑛 → |𝑦| .

Si osserva anche che i punti di tale spezzata si avvicinano sempre di più alla circonferenza
unitaria, infatti:   𝑘 𝑛  𝑛
𝑖 𝑖 1 2

1 ≤ 1+ ≤ 1 + = 1 + → 1.

𝑛 𝑛 𝑛2

E’ dunque sensato pensare che il punto 𝑒 𝑖 𝑦 sia il punto della circonferenza unitaria che identifica
un arco di lunghezza |𝑦| a partire dal punto 1 sull’asse reale. Se 𝑦 > 0 l’arco è misurato
in senso antiorario, altrimenti in senso orario. Avremo dunque arg 𝑒 𝑖𝑦 = 𝑦 essendo 𝑦 la

lunghezza dell’arco ovvero la misura in radianti dell’angolo corrispondente.
166 4 i numeri complessi

4.3 radici complesse 𝑛 -esime

Sia 𝑐 ∈ ℂ un numero complesso 𝑐 ≠ 0. Ci poniamo il problema di determinare le


soluzioni complesse dell’equazione

𝑧 𝑛 = 𝑐.

radici 𝑛 -esime Tali soluzioni saranno chiamate radici 𝑛 -esime di 𝑐 .

Scriviamo 𝑐 e 𝑧 in forma esponenziale:

𝑐 = 𝑟𝑒 𝑖𝛼 , 𝑧 = 𝜌𝑒 𝑖𝜃 .

Si avrà allora
𝑧 𝑛 = 𝜌𝑛 (𝑒 𝑖𝜃 )𝑛 = 𝜌𝑛 𝑒 𝑖𝑛𝜃 .
Affinche sia 𝑧 𝑛 = 𝑐 si dovrà avere l’uguaglianza dei moduli, cioè 𝜌𝑛 = 𝑟 e l’uguaglianza
a meno di multipli interi di 2𝜋 degli argomenti: 𝑛𝜃 = 𝛼 + 2 𝑘𝜋 con 𝑘 ∈ ℤ. Dunque si
trova
𝛼 2𝜋
𝜃= +𝑘 𝑘 ∈ ℤ.
𝑛 𝑛
Osserviamo ora che per 𝑘 = 0 , . . . , 𝑛 − 1 il secondo addendo 𝑘 2𝜋/𝑛 assume 𝑛 valori
distinti compresi in [0 , 2𝜋). Per gli altri valori di 𝑘 si ottengono degli angoli che
differiscono da questi di un multiplo di 2𝜋 e quindi non si trovano altre soluzioni.

Dunque l’equazione 𝑧 𝑛 = 𝑐 per 𝑐 ≠ 0 ha 𝑛 soluzioni distinte date da



𝑧𝑘 = 𝑛
𝑟 · 𝑒 𝑖𝛼/𝑛+2 𝑘𝜋𝑖/𝑛 , 𝑘 = 0, 1, . . . , 𝑛 − 1

dove 𝛼 = arg(𝑐) e 𝑟 = |𝑐| . Dal punto di vista geometrico si osserva che 𝑧 0 è il numero
complesso con modulo la radice 𝑛 -esima del numero dato 𝑐 e argomento pari ad un
𝑛 -esimo dell’argomento di 𝑐 . Tutte le altre soluzioni si trovano sulla circonferenza
centrata in 0 e passante per 𝑧 0 e risultano essere, insieme ad 𝑧 0 , i vertici di un 𝑛 -agono
regolare.

In particolare nel caso 𝑐 = 1 si osserva che le radici 𝑛 -esime dell’unità si rappresentano


geometricamente come i vertici dell’𝑛 -agono regolare iscritto nella circonferenza
unitaria e con un vertice in 𝑧 0 = 1.

Esercizio 4.7. Si trovino le soluzioni 𝑧 ∈ ℂ delle seguenti equazioni. Scrivere le soluzioni in


forma polare e cartesiana.

𝑧 4 = −4
𝑧6 = 𝑖
𝑧 3 = −8 𝑖
𝑧4 = 𝑧

𝑧2 + 1 = 𝑖 3
(𝑧 − 𝑖)4 = 1
1 + 𝑧 + 𝑧2 + 𝑧3 = 0
𝑧 14 − 𝑧 6 − 𝑧 8 + 1 = 0
4.4 ancora polinomi 167

4.4 ancora polinomi

Proseguiamo la trattazione dei polinomi che abbiamo iniziato nel capitolo 1.8.

Teorema 4.8 (divisione di Euclide). Se 𝕂 è un campo, dati due polinomi 𝑃 e 𝑆 in 𝕂 [𝑥] con
𝑆 ≠ 0 è possibile trovare, in modo unico, due polinomi 𝑄 (quoziente) e 𝑅 (resto) in 𝕂 [𝑥] con
deg 𝑅 < deg 𝑆 tali che:
𝑃 = 𝑄 · 𝑆 + 𝑅.

Dimostrazione. Passo 1: supponiamo che sia deg 𝑃 < deg 𝑆 . In questo caso basta
prendere 𝑄 = 0 e 𝑅 = 𝑃 .

Passo 2: supponiamo che sia deg 𝑃 ≥ deg 𝑆 . Poniamo 𝑁 = deg 𝑃 e 𝑀 = deg 𝑆 . Sia
𝑎 𝑁 ≠ 0 il coefficiente del termine di grado massimo di 𝑃 e 𝑏 𝑀 ≠ 0 il coefficiente di
grado massimo del polinomio 𝑆 . E’ allora facile verificare che il polinomio
𝑎𝑁
· 𝑥 𝑁−𝑀 · 𝑆
𝑏𝑀

ha lo stesso grado di 𝑃 e il suo coefficiente di grado massimo è uguale ad 𝑎 𝑁 in quanto


è il prodotto di 𝑎 𝑁 /𝑏 𝑀 per 𝑏 𝑀 . Dunque il polinomio
𝑎𝑁
𝑃1 = 𝑃 − · 𝑥 𝑁−𝑀 · 𝑆
𝑏𝑀

ha grado strettamente inferiore a 𝑃 . Possiamo ora supporre, mediante un ragionamento


induttivo su deg 𝑃 − deg 𝑆 che per il polinomio 𝑃1 il risultato del teorema sia valido
cioè che esistano, dei polinomio 𝑄 1 e 𝑅 con deg 𝑅 < deg 𝑆 tali che

𝑃1 = 𝑄 1 · 𝑆 + 𝑅.

Il caso base del ragionamento induttivo, deg 𝑃 = deg 𝑆 , è garantito dal passo 1. Avremo
allora:
𝑎 𝑁 𝑁−𝑀
𝑃 = 𝑃1 + 𝑥 ·𝑆
𝑏𝑀
𝑎 𝑁 𝑁−𝑀
= 𝑄1 · 𝑆 + 𝑅1 + 𝑥 ·𝑆
𝑏𝑀
𝑎 𝑁 𝑁−𝑀
=( 𝑥 + 𝑄1 ) · 𝑆 + 𝑅1 .
𝑏𝑀

Posto quindi
𝑎 𝑁 𝑁−𝑀
𝑄= 𝑥 + 𝑄1
𝑏𝑁
il risultato è dimostrato.

Passo 3: dimostriamo che 𝑄 e 𝑅 sono unici. Se infatti avvessimo

𝑃 = 𝑄1 𝑆 + 𝑅1 = 𝑄2 𝑆 + 𝑅2

con deg 𝑅 1 < deg 𝑆 e deg 𝑅 2 < deg 𝑆 si avrebbe

(𝑄 2 − 𝑄1 )𝑆 = 𝑅 1 − 𝑅 2 .
168 4 i numeri complessi

Se fosse 𝑄 2 ≠ 𝑄 1 il polinomio al lato sinistro avrebbe grado non inferiore al grado di 𝑆


mentre il lato destro ha certamente grado minore di 𝑆 . Dunque 𝑄 2 = 𝑄 1 ma allora il
lato sinistro è nullo e quindi anche il lato destro deve esserlo: 𝑅 2 = 𝑅 1 .

La dimostrazione del teorema precedente fornisce anche un algoritmo, chiamato


algoritmo di Euclide, per eseguire la divisione (con resto) tra polinomi. Lo sperimentiamo
nel seguente esercizio.

Esercizio 4.9. Sia 𝑃 = 𝑥 4 − 3 𝑥 2 + 2 𝑥 + 1 e 𝑆 = 𝑥 2 − 1. Eseguire la divisione con resto cioè:


trovare 𝑄 ed 𝑅 con deg 𝑅 < deg 𝑆 tali che

𝑃 = 𝑄 · 𝑆 + 𝑅.

Svolgimento. Il rapporto tra i termini di grado massimo di 𝑃 e 𝑆 è 𝑥 4 /𝑥 2 = 𝑥 2 . Dunque


consideriamo come primo monomio 𝑥 2 . Si ha

𝑃1 = 𝑃 − 𝑥 2 · 𝑆 = 𝑥 4 − 3𝑥 2 + 2 𝑥 + 1 − 𝑥 4 + 𝑥 2
= −2 𝑥 2 + 2 𝑥 + 1 .

Ripetiamo il procedimento con 𝑃1 al posto di 𝑃 . Il rapporto tra i termini di grado


massimo di 𝑃1 e 𝑆 è il monomio −2. Si ha

𝑃2 = 𝑃1 − (−2)𝑆 = −2 𝑥 2 + 2 𝑥 + 1 + 2 𝑥 2 − 2 = 2 𝑥 − 1.

Visto che deg 𝑃2 < deg 𝑆 la divisione termina e si pone 𝑅 = 2 𝑥 − 1. Si ha quindi


𝑄 = 𝑥 2 − 2 (la somma dei monomi trovati) e risulta:

𝑃 = (𝑥 2 − 2) · 𝑆 + 2𝑥 − 1.

Teorema 4.10 (Ruffini). Sia 𝑃 ∈ 𝕂 [𝑥] un polinomio non nullo. Se 𝑥 0 ∈ 𝕂 è tale che
𝑃(𝑥0 ) = 0 allora esiste un polinomio 𝑄 con deg 𝑄 = (deg 𝑃) − 1 tale che

𝑃 = (𝑥 − 𝑥0 ) · 𝑄.

Dimostrazione. In base al teorema precedente si può fare la divisione tra 𝑃 e 𝑆 = 𝑥 − 𝑥 0


per ottenere un polinomio 𝑄 e un resto 𝑅 con deg 𝑅 < 1 tali che

𝑃 = (𝑥 − 𝑥0 ) · 𝑄 + 𝑅.

Siccome deg 𝑅 < 1 si ha in effetti che 𝑅 = 𝑐 ∈ 𝕂 è un polinomio costante e dunque

𝑃 = (𝑥 − 𝑥 0 ) · 𝑄 + 𝑐

ma valutando 𝑃 in 𝑥 = 𝑥 0 si scopre che

𝑃(𝑥0 ) = 0 · 𝑄(𝑥 0 ) + 𝑐 = 𝑐

dunque 𝑐 = 𝑃(𝑥 0 ) = 0.
4.4 ancora polinomi 169

Possiamo ora chiederci se polinomi diversi corrispondono a funzioni polinomiali


diverse. In generale questo non è vero, se ad esempio prendessimo come campo
𝕂 = ℤ2 = {0, 1}, un campo finito in cui poniamo 1 + 1 = 0 scopriremmo che la
funzione polinomiale 𝑃(𝑥) = 𝑥 2 + 𝑥 è identicamente nulla in quanto 02 + 0 = 0 e
12 + 1 = 1 + 1 = 0 in questo campo. Ma nei casi che interessano a noi 𝕂 = ℝ o 𝕂 = ℂ
questo problema non si presenta e si potrà quindi identificare ogni polinomio con la
corrispondente funzione polinomiale. Per avere questa garanzia ci servono i seguenti
risultati.

Teorema 4.11 (principio di annullamento dei polinomi). Sia 𝑃 ∈ 𝕂 [𝑥] un polinomio


non nullo di grado 𝑛 . Allora la funzione polinomiale associata a 𝑃 si annulla in al più 𝑛 punti
distinti di 𝕂 .

In particolare se un polinomio si annulla in infiniti punti distinti allora tale polinomio è


certamente nullo.

Dimostrazione. Dimostriamo per induzione su 𝑛 che se un polinomio 𝑃 di grado non


superiore a 𝑛 si annulla in 𝑛 + 1 punti distinti 𝑥 1 , . . . , 𝑥 𝑛+1 ∈ 𝕂 allora 𝑃 = 0.

Se 𝑛 = 0 il polinomio 𝑃 è costante ma si annulla in un punto e quindi è il polinomio


nullo. Se 𝑛 > 0 per il teorema di Ruffini applicato al punto 𝑥 𝑛+1 sappiamo che esise un
polinomio 𝑄 di grado inferiore ad 𝑛 per cui si ha

𝑃 = (𝑥 − 𝑥 𝑛+1 ) · 𝑄

sostituendo 𝑥 = 𝑥 𝑘 con 𝑘 ≤ 𝑛 si ha 𝑥 𝑘 − 𝑥 𝑛+1 ≠ 0 e quindi

𝑃(𝑥 𝑘 )
𝑄(𝑥 𝑘 ) = = 0.
𝑥 𝑘 − 𝑥 𝑛+1

Dunque 𝑄 si annulla nei punti 𝑥 1 , . . . , 𝑥 𝑛 e, per ipotesi induttiva, scopriamo che 𝑄


deve essere nullo. Di conseguenza anche 𝑃 è nullo.

Se 𝕂 è un insieme infinito (come nei casi 𝕂 = ℝ o 𝕂 = ℂ) si trova che se a due polinomi


𝑃 , 𝑄 corrisponde la stessa funzione polinomiale:

𝑃(𝑥) = 𝑄(𝑥) per ogni 𝑥 ∈ 𝕂

allora 𝑃 e 𝑄 sono lo stesso polinomio 𝑃 = 𝑄 in quanto la differenza 𝑃 − 𝑄 si annulla


in tutti i punti di 𝕂 e qualunque sia il suo grado, se 𝕂 è infinito, questo ci dice che
𝑃 − 𝑄 = 0.

Questo corollario viene spesso enunciato come segue.

Teorema 4.12 (principio di identità dei polinomi). Siano 𝑎 𝑘 e 𝑏 𝑘 coefficienti nel campo
𝕂 = ℝ o 𝕂 = ℂ. Se per ogni 𝑥 ∈ 𝕂 si ha
𝑛 𝑚
𝑎𝑘 𝑥 𝑘 = 𝑏𝑘 𝑥 𝑘
X X
𝑘=1 𝑘=1

allora 𝑚 = 𝑛 e 𝑎 𝑘 = 𝑏 𝑘 per ogni 𝑘 = 0 , . . . , 𝑛 .


170 4 i numeri complessi

Dimostrazione. Facendo la differenza dei due lati dell’uguaglianza si ottiene che una
espressione polinomiale si annulla identicamente. Allora per il teorema 4.11 tale
espressione rappresenta il polinomio nullo e di conseguenza tutti i coefficienti, che
sono dati dalla differenza 𝑎 𝑘 − 𝑏 𝑘 , devono essere nulli.

4.5 il teorema fondamentale dell’algebra

Il teorema fondamentale dell’algebra afferma che ogni polinomio non costante si


annulla in almeno un punto del piano complesso.
La formula risolutiva per determinare le radici di un polinomio di secondo grado era
già nota ai Babilonesi e sebbene i numeri complessi non erano noti (e neanche i numeri
negativi) la stessa formula si applica nel caso generale e fornisce le radici complesse.
Lo studio delle equazioni di grado superiore al secondo si sviluppa invece nel 1500 ad
opera dei matematici italiani Scipione del Ferro, Gerolamo Cardano, Niccolò Tartaglia
e Lodovico Ferrari. Essi determinano le formule risolutive per determinare le radici dei
polinomi di terzo e quarto grado. Nell’applicare la formula risolutiva per l’equazione
di terzo grado può capitare di dover calcolare la radice quadrata di un numero negativo
anche in situazioni in cui tutte le soluzioni alla fine risultano reali. Ed è proprio
in questo contesto che nascono i numeri complessi, come mero artificio matematico
utilizzato per portare a termine il conto.
Successivamente Paolo Ruffini (1765-1822) e Niels Abel (1802-1829) dimostrarono che
le equazioni di grado maggiore del quarto non ammettono una formula risolutiva
esprimibile mediante radicali. Il criterio per determinare se un polinomio ammette o
meno formule risolutive è dovuto al matematico francese Évariste Galois (1811-1832)
che è considerato il fondatore della teoria dei gruppi.
Il teorema fondamentale dell’algebra, e cioè l’esistenza di radici complesse per polinomi
di grado qualunque, viene dimostrato dal matematico tedesco Carl Friedrich Gauss
(1777–1855). Questo teorema opera una svolta nel pensiero matematico in quanto
per la prima volta si dà rilevanza ad un risultato astratto di esistenza slegato da una
formula risolutiva. Il teorema non era affatto scontato, basti pensare che sia Leibniz
che Nikolas Bernoulli erano convinti di aver trovato dei polinomi di quarto grado che
non possono essere fattorizzati in contrasto con il teorema 4.21.
Per dimostrare il teorema fondamentale dell’algebra dobbiamo estendere il teorema
di Weierstrass alle funzioni di una variabile complessa. Nel teorema di Weierstrass
reale la funzione per ipotesi è definita su un intervallo chiuso e limitato. Nel piano
complesso non esiste il concetto di intervallo in quanto non abbiamo un ordinamento
ma vedremo che comunque il teorema di Weierstrass rimane valido per le funzioni
continue definite su insiemi chiusi e limitati secondo le seguenti definizioni.

Definizione 4.13 (chiusura sequenziale). Un insieme 𝐴 ⊆ ℂ si dice essere sequenzialmente


sequenzialmente chiuso
chiuso se presa una qualunque successione di punti 𝑎 𝑛 ∈ 𝐴 se 𝑎 𝑛 → 𝑎 per qualche 𝑎 ∈ ℂ
allora 𝑎 ∈ 𝐴.

limitato
Definizione 4.14 (limitatezza). Un insieme 𝐴 ⊆ ℂ si dice essere limitato se

sup {|𝑧| : 𝑧 ∈ 𝐴} < +∞.


4.5 il teorema fondamentale dell’algebra 171

Una successione 𝑧 𝑛 ∈ ℂ si dice essere limitata se l’insieme {𝑧 𝑛 : 𝑛 ∈ ℕ } è limitato ovvero se

sup |𝑧 𝑛 | < +∞.


𝑛∈ℕ

Teorema 4.15 (Bolzano-Weierstrass complesso). Se 𝑧 𝑛 ∈ ℂ è una successione limitata


allora è possibile estrarre una sottosuccessione 𝑧 𝑛 𝑘 convergente: 𝑧 𝑛 𝑘 → 𝑧 con 𝑧 ∈ ℂ.

Dimostrazione. Siano 𝑥 𝑛 e 𝑦𝑛 la parte reale ed immaginaria di 𝑧 𝑛 : 𝑧 𝑛 = 𝑥 𝑛 + 𝑖 𝑦𝑛 .


p q
Visto che |𝑥 𝑛 | = 𝑥 𝑛2 ≤ 𝑥 𝑛2 + 𝑦𝑛2 = |𝑧 𝑛 | e, allo stesso modo |𝑦𝑛 | ≤ |𝑧 𝑛 | , possiamo
affermare che entrambe le successioni 𝑥 𝑛 e 𝑦𝑛 sono limitate (ma stavolta in ℝ). Dunque
possiamo applicare il teorema di Bolzano-Weierstrass (reale) alla successione 𝑥 𝑛 per
trovare una sottosuccessione 𝑥 𝑛 𝑗 → 𝑥 convergente. E possiamo applicare di nuovo
il teorema di Bolzano-Weierstrass alla sottosuccessione 𝑦𝑛 𝑗 per trovare una sotto-
sottosuccessione 𝑦𝑛 𝑗𝑘 → 𝑦 anch’essa convergente. Posto 𝑛 𝑘 = 𝑛 𝑗𝑘 avremo dunque
trovato una sottosuccessione 𝑧 𝑛 𝑘 = 𝑥 𝑛 𝑘 + 𝑖 𝑦𝑛 𝑘 → 𝑥 + 𝑖 𝑦 convergente.

Teorema 4.16 (Weierstrass complesso). Sia 𝐴 ⊆ ℂ un insieme non vuoto, sequenzialmente


chiuso e limitato e sia 𝑓 : 𝐴 → ℝ una funzione continua. Allora 𝑓 ha massimo e minimo su
𝐴.

Dimostrazione. Dimostriamo l’esistenza del minimo: per il massimo la dimostrazione


è perfettamente analoga. Sia 𝑚 = inf 𝑓 (𝐴). Essendo 𝐴 non vuoto, per il lem-
ma sull’esistenza delle successioni minimizzanti sappiamo esistere una successione
𝑧 𝑛 ∈ 𝐴 tale che 𝑓 (𝑧 𝑛 ) → 𝑚 . Essendo 𝐴 limitato possiamo applicare il teorema di
Bolzano-Weierstrass per trovare 𝑧 ∈ ℂ e una sottosuccessione 𝑧 𝑛 𝑘 → 𝑧 . Essendo 𝐴
sequenzialmente chiuso possiamo quindi affermare che 𝑧 ∈ 𝐴. Essendo 𝑓 continua
concludiamo che
𝑓 (𝑧) = lim 𝑓 (𝑧 𝑛 𝑘 ) = 𝑚
𝑘→+∞

e dunque 𝑧 è un punto di minimo per 𝑓 .

Teorema 4.17 (esistenza del minimo per funzioni coercive). Sia 𝑓 : ℂ → ℝ una funzione
continua tale che per ogni successione 𝑧 𝑛 → ∞ (ovvero |𝑧 𝑛 | → +∞) si abbia 𝑓 (𝑧 𝑛 ) → +∞.
Allora 𝑓 ha minimo.

Dimostrazione. Consideriamo l’insieme

𝐴 = {𝑧 ∈ ℂ : 𝑓 (𝑧) ≤ 𝑓 (0)}.

Chiaramente 0 ∈ 𝐴 e quindi 𝐴 non è vuoto. L’insieme 𝐴 è anche sequenzialmente chiuso


in quanto se 𝑧 𝑘 ∈ 𝐴 allora 𝑓 (0) − 𝑓 (𝑧 𝑘 ) ≥ 0, per continuità 𝑓 (0) − 𝑓 (𝑧 𝑘 ) → 𝑓 (0) − 𝑓 (𝑧)
e per il teorema della permanenza del segno si ottiene 𝑓 (0) − 𝑓 (𝑧) ≥ 0 cioè 𝑧 ∈ 𝐴.
Dimostriamo ora che 𝐴 è anche limitato. Se non lo fosse esisterebbe, per assurdo, una
successione 𝑧 𝑛 ∈ 𝐴 tale che |𝑧 𝑛 | → +∞ cioè 𝑧 𝑛 → ∞. Ma allora, per ipotesi su 𝑓 , si
avrebbe 𝑓 (𝑧 𝑛 ) → +∞ che contraddice la condizione 𝑓 (𝑧 𝑛 ) ≤ 𝑓 (0). Essendo 𝐴 non
vuoto, sequenzialmente chiuso e limitato ed essendo 𝑓 : 𝐴 → ℝ continua, possiamo
applicare il teorema di Weierstrass complesso per dedurre che 𝑓 ha minimo su 𝐴 in un
punto 𝑤 ∈ 𝐴. Ma essendo 0 ∈ 𝐴 si avrà sicuramente 𝑓 (𝑤) ≤ 𝑓 (0) e per ogni 𝑧 ∈ ℂ \ 𝐴
172 4 i numeri complessi

si ha invece 𝑓 (𝑧) > 𝑓 (0) per come è stato definito 𝐴. Dunque 𝑤 è minimo di 𝑓 su tutto
ℂ, non solo su 𝐴.
teorema fondamentale dell’algebra

Teorema 4.18 (teorema fondamentale dell’algebra). Sia 𝑓 (𝑧) un polinomio di grado


𝑁 ≥ 1 a coefficienti complessi:
𝑁
𝑎𝑗 · 𝑧𝑗
X
𝑓 (𝑧) =
𝑗=0

con 𝑎 𝑗 ∈ ℂ per 𝑗 = 0 , . . . , 𝑁 e 𝑎 𝑁 ≠ 0. Allora esiste 𝑤 ∈ ℂ tale che 𝑓 (𝑤) = 0.

Dimostrazione. Osserviamo innanzitutto che | 𝑓 (𝑧)| è coerciva cioè che se 𝑧 𝑛 → ∞


allora | 𝑓 (𝑧 𝑛 )| → +∞. Infatti si ha

𝑁 𝑁−
X1
𝑗 𝑗
X
𝑁
| 𝑓 (𝑧 𝑛 )| = 𝑎 𝑗 𝑧𝑛 = 𝑎 𝑁 𝑧𝑛 + 𝑎 𝑗 𝑧𝑛

𝑗=0 𝑗=0


𝑁−
X1 𝑎 𝑗
= |𝑧 𝑛 | 𝑁 · 𝑎 𝑁 + → +∞

𝑁−𝑗
𝑗=0 𝑧 𝑛

se 𝑧 𝑛 → ∞.

Sappiamo che tutti i polinomi sono funzioni continue in quanto somme di prodotti
di funzioni continue e il modulo è anch’esso una funzione continua dunque | 𝑓 (𝑧)| è
certamente una funzione continua.

Dunque possiamo applicare il teorema di esistenza del minimo per le funzioni coercive:
esiste 𝑤 ∈ ℂ tale che | 𝑓 (𝑤)| è minimo.

Per concludere il teorema basterà dimostrare che 𝑓 (𝑤) = 0. L’idea che vogliamo
sviluppare è che i polinomi complessi se assumono un valore 𝑓 (𝑤) in un punto 𝑤 ∈ ℂ
allora assumono anche tutti i valori vicini ad esso in quanto localmente il polinomio
assomiglia ad una potenza 𝑧 𝑛 e l’equazione 𝑧 𝑛 = 𝑐 ha sempre soluzione, come abbiamo
già visto. Dunque vicino a 𝑤 ci saranno dei punti in cui 𝑓 assume valori che in modulo
sono minori a 𝑓 (𝑤): a meno che non sia proprio 𝑓 (𝑤) = 0, nel qual caso ovviamente
non è possibile avere numeri con modulo inferiore a 0.

Possiamo scrivere il polinomio 𝑓 (𝑧) nella forma

𝑁
𝑏 𝑗 (𝑧 − 𝑤) 𝑗
X
𝑓 (𝑧) =
𝑗=0

in quanto la traslazione di un polinomio è ancora un polinomio dello stesso grado.


Dimostrare che 𝑓 (𝑤) = 0 è quindi equivalente a dimostrare che 𝑏 0 = 0. Supponiamo
allora per assurdo che sia 𝑏 0 ≠ 0. L’andamento del polinomio vicino al punto 𝑤 è
dominato dai termini di grado più basso: alcuni di questi potrebbero essere nulli,
ma possiamo considerare il primo indice 𝑘 > 0 per cui si ha 𝑏 𝑘 ≠ 0. Allora potremo
scrivere:
𝑁
𝑓 (𝑧) = 𝑏 0 + 𝑏 𝑘 (𝑧 − 𝑤) 𝑘 + 𝑏 𝑗 (𝑧 − 𝑤) 𝑗 .
X
𝑗=𝑘+1
4.6 fattorizzazione dei polinomi 173

Ora scriviamo 𝑧 − 𝑤 e 𝑏 0 in forma esponenziale: 𝑧 − 𝑤 = 𝜌𝑒 𝑖𝜃 , 𝑏 0 = 𝑟𝑒 𝑖𝛼 e applichiamo


la disuguaglianza triangolare

𝑁
| 𝑓 (𝑧)| = 𝑟𝑒 + 𝜌 𝑘 𝑒 𝑖𝜃𝑘 +
𝑖𝛼
𝑏 𝑗 𝜌 𝑗 𝑒 𝑖𝜃 𝑗
X
𝑗=𝑘+1

𝑁
≤ 𝑟𝑒 𝑖𝛼 + 𝜌 𝑘 𝑒 𝑖𝜃𝑘 + 𝑏 𝑗 𝜌 𝑗 .
X
𝑗=𝑘+1

Per raggiungere un assurdo vogliamo dimostrare che esiste 𝑧 (cioè esistono 𝜌 e 𝜃 ) per
cui il valore della funzione risulti in modulo minore di 𝑟 = |𝑏 0 | = | 𝑓 (𝑤)| . Innanzitutto
se 𝜌 è sufficientemente piccolo possiamo rendere arbitrariamente piccole le potenze 𝜌 𝑗
con 𝜌 > 𝑘 : basta scegliere 𝜌 ≤ 1 e 𝜌 ≤ 1/(2 𝑏 𝑗 ) cosicché si avrà
P

𝑁 𝑁 𝑘
𝑏 𝑗 𝜌 𝑗 ≤ 𝜌 𝑘+1 𝑏 𝑗 ≤ 𝜌 .
X X
𝑗=𝑘+1 𝑗=𝑘+1
2

Per quanto riguarda il termine 𝑟𝑒 𝑖𝛼 + 𝜌 𝑘 𝑒 𝑖𝜃𝑘 sarà sufficiente scegliere 𝜃 = (𝜋 − 𝛼)/𝑘 in


modo che i due addendi abbiano fase opposta e la somma sia distruttiva:
𝑖𝛼
𝑟𝑒 + 𝜌 𝑘 𝑒 𝑖𝜃𝑘 = 𝑒 𝑖𝛼 (𝑟 + 𝜌 𝑘 𝑟 𝑖𝜋 ) = 𝑟 − 𝜌 𝑘 .

In definitiva abbiamo

𝜌𝑘
| 𝑓 (𝑧)| = 𝑓 (𝑤 + 𝜌𝑒 𝑖𝜃 ≤ 𝑟 − 𝜌 𝑘 + < 𝑟 = | 𝑓 (𝑤)|

2
che è assurdo in quanto | 𝑓 (𝑤)| doveva essere il valore minimo.

4.6 fattorizzazione dei polinomi

Teorema 4.19 (fattorizzazione dei polinomi complessi). Sia 𝑝(𝑧) un polinomio non nullo.
Allora posto 𝑛 = deg 𝑝 esistono dei numeri complessi 𝑧 1 , 𝑧 2 , . . . , 𝑧 𝑛 ed un numero complesso
𝑐 ≠ 0 tali che
𝑛
Y
𝑝(𝑧) = 𝑐 (𝑧 − 𝑧 𝑘 ). (4.1)
𝑘=1

Gli 𝑧 𝑘 sono unici a meno dell’ordine e 𝑐 pure è univocamente determinato.

Dimostrazione. Dimostriamo il teorema per induzione su 𝑛 = deg 𝑝 . Se 𝑛 = 0 il


polinomio 𝑝 è costante: 𝑝(𝑧) = 𝑐 . Ricordando che un prodotto di 𝑛 = 0 fattori è uguale
a 1 si ottiene quindi il risultato voluto.

Sia ora 𝑝(𝑧) un qualunque polinomio di grado 𝑛 > 0. Per il teorema fondamentale
dell’algebra sappiamo che esiste un numero complesso 𝑧 𝑛 tale che 𝑝(𝑧 𝑛 ) = 0. Per il
teorema di Ruffini si ha allora

𝑝(𝑧) = (𝑧 − 𝑧 𝑛 )𝑞(𝑧)
174 4 i numeri complessi

con 𝑞 un qualche polinomio di grado 𝑛 − 1. Per ipotesi induttiva possiamo dunque


supporre che esistano 𝑧 1 , . . . , 𝑧 𝑛−1 e 𝑐 numeri complessi tali che

𝑛−1
Y
𝑞(𝑧) = 𝑐 (𝑧 − 𝑧 𝑘 )
𝑘=1

e la tesi segue.

Nella fattorizzazione (4.1) le radici 𝑧 𝑘 possono anche ripetersi. Se mettiamo insieme i


fattori corrispondenti alla stessa radice si ottiene una decomposizione della forma
𝑚
(𝑧 − 𝑧 𝑘 )𝑝 𝑘
Y
𝑃(𝑧) = 𝑐 (4.2)
𝑘=1

con 𝑧 1 , . . . , 𝑧 𝑚 numeri complessi distinti (le radici del polinomio 𝑃 ) e 𝑝 𝑘 interi positivi.
molteplicità L’esponente 𝑝 𝑘 si chiama molteplicità della radice 𝑧 𝑘 e risulta

𝑝1 + · · · + 𝑝 𝑚 = 𝑛.

Questa uguaglianza si esprime dicendo che un polinomio 𝑃 ∈ ℂ[𝑧] di grado 𝑛 ha


sempre 𝑛 radici contate con la loro molteplicità. Le radici distinte sono invece 𝑚 ≤ 𝑛 .

Se invece 𝑃 ∈ ℝ[𝑥] è un polinomio a coefficienti reali non è detto che 𝑃 abbia radici:
ad esempio il polinomio 𝑥 2 + 1 non ha radici reali in quanto 𝑥 2 + 1 > 0 come succede
in ogni campo ordinato. Potrà allora essere utile pensare a 𝑃 come ad un polinomio in
ℂ[𝑥] con coefficienti reali.

Se 𝑃 ∈ ℝ[𝑥] è un polinomio a coefficienti reali


𝑛
𝑎𝑘 𝑥 𝑘 ,
X
𝑃= 𝑎𝑘 ∈ ℝ
𝑘=0

possiamo pensare a 𝑃 anche come un polinomio in ℂ[𝑥], visto che 𝑎 𝑘 ∈ ℝ ⊆ ℂ. Il


seguente teorema ci dà un criterio per distinguere i polinomi a coefficienti reali dentro
a ℂ[𝑥].

Teorema 4.20. Se 𝑃 ∈ ℂ[𝑥] è un polinomio a coefficienti complessi


𝑛
𝑎𝑘 𝑥 𝑘 ,
X
𝑃= 𝑎𝑘 ∈ ℂ
𝑘=0

e se esiste un insieme infinito 𝐴 ⊆ ℝ tale che per ogni 𝑥 ∈ 𝐴 si abbia 𝑃(𝑥) ∈ ℝ allora 𝑎 𝑘 ∈ ℝ
per ogni 𝑘 = 0 , . . . , 𝑛 e dunque 𝑃 ∈ ℝ[𝑥].

In particolare se la funzione polinomiale associata a 𝑃 ∈ ℂ[𝑥] manda ℝ in ℝ allora 𝑃 è un


polinomio a coefficienti reali.

Dimostrazione. Consideriamo il polinomio:


𝑛
(𝑎 𝑘 − 𝑎¯ 𝑘 )𝑥 𝑘 .
X
𝑄=
𝑘=0
4.6 fattorizzazione dei polinomi 175

Allora per ogni 𝑥 ∈ 𝐴 si ha


𝑛 𝑛
𝑎𝑘 𝑥 𝑘 − 𝑎¯ 𝑘 𝑥 𝑘 = 𝑃(𝑥) − 𝑃(𝑥) = 𝑃(𝑥) − 𝑃(𝑥) = 0
X X
𝑄(𝑥) =
𝑘=0 𝑘=0

in quanto se 𝑥 ∈ ℝ risulta 𝑥 𝑘 = 𝑥¯ 𝑘 = 𝑥 𝑘 . Visto che 𝐴 è infinito, per il principio di


annullamento dei polinomi (teorema 4.11) deduciamo che 𝑄 = 0. Ma allora tutti i
coefficienti di 𝑄 devono essere nulli e cioè 𝑎¯ 𝑘 = 𝑎 𝑘 . Ne consegue che 𝑎 𝑘 ∈ ℝ per ogni
𝑘 = 0, . . . , 𝑛 .

Rifacendoci alla fattorizzazione dei polinomi a coefficienti complessi possiamo fattoriz-


zare anche i polinomi a coefficienti reali se ci accontentiamo di avere fattori quadratici
invece che lineari.

Teorema 4.21 (fattorizzazione dei polinomi reali). Se 𝑃 ∈ ℝ[𝑥] è un polinomio a


coefficienti reali potremo scrivere
𝑛 𝑚
(𝑥 − 𝑥 𝑘 )𝑝 𝑘 · (𝑥 2 + 𝛼 𝑗 𝑥 + 𝛽 𝑗 )𝑞 𝑗
Y Y
𝑃=𝑎· (4.3)
𝑘=1 𝑗=1

dove 𝑎 ∈ ℝ, 𝑥 𝑘 ∈ ℝ, 𝑝 𝑘 ∈ ℕ \ {0}, 𝛼 𝑗 , 𝛽 𝑗 ∈ ℝ, 𝑞 𝑗 ∈ ℕ \ {0} con 𝛼 2𝑗 − 4𝛽 𝑗 < 0 e

𝑛
X 𝑚
X
𝑝𝑘 + 2 𝑞 𝑗 = deg 𝑃.
𝑘=1 𝑗=1

La fattorizzazione (4.3) è unica a meno dell’ordine dei fattori.

I numeri 𝑥 1 , . . . , 𝑥 𝑛 sono tutte le radici reali distinte del polinomio 𝑃 con rispettive molte-
plicità 𝑝 1 , . . . , 𝑝 𝑛 mentre tutte le radici complesse (non reali) distinte saranno 𝜇1 , . . . , 𝜇𝑚 e
𝜇¯ 1 , . . . , 𝜇¯ 𝑚 con
𝑥 2 + 𝛼 𝑗 𝑥 + 𝛽 𝑗 = (𝑥 − 𝜇) · (𝑥 − 𝜇)
¯
da cui 2
𝛼 𝑗 = −2 Re 𝜇 𝑗 , 𝛽 𝑗 = 𝜇 𝑗
e 𝑞 𝑗 saranno le molteplicità delle radici 𝜇 𝑗 e 𝜇¯ 𝑗 .

Dimostrazione. Osserviamo innanzitutto che se 𝑃 è a coefficienti reali si ha

𝑃(𝑧) = 𝑃(¯𝑧 ), ∀𝑧 ∈ ℂ

dunque se 𝜇 è una radice di 𝑃 anche 𝜇¯ è una radice di 𝑃 . Ora se 𝜇 è una radice non
reale di 𝑃 sappiamo che in campo complesso 𝑃 risulta divisibile per 𝑥 − 𝜇 (teorema 4.10
di Ruffini):
𝑃 = (𝑥 − 𝜇) · 𝑃1 .
Ma anche 𝜇¯ è radice di 𝑃 ed essendo 𝜇¯ ≠ 𝜇 si dovrà avere

𝑃(𝜇)
¯
𝑄(𝜇)
¯ = =0
𝜇¯ − 𝜇
176 4 i numeri complessi

e dunque applicando nuovamente il teorema di Ruffini

𝑃 = (𝑥 − 𝜇) · (𝑥 − 𝜇)
¯ · 𝑃2 .

Ora osserviamo che

(𝑥 − 𝜇) · (𝑥 − 𝜇) ¯ + 𝜇𝜇¯ = 𝑥 2 − 2(Re 𝜇) · 𝑥 + |𝜇| 2


¯ = 𝑥 2 − (𝜇 + 𝜇)𝑥

è un polinomio a coefficienti reali e visto che 𝑃2 si ottiene dividendo 𝑃 per tale


polinomio, anche 𝑃2 è un polinomio a coefficienti reali.
Ripetendo lo stesso procedimento sul polinomio 𝑃2 potremo fattorizzare 𝑃 diminuendo
il grado a passi di 2 finché non si esauriscono tutte le radici complesse non reali
accoppiandole a due a due. Dunque se 𝜇 è una radice complessa del polinomio reale
𝑃 la molteplicità di 𝜇 è uguale alla molteplicità di 𝜇¯ .
Dopodiché si potrà completare la fattorizzazione dividendo per i fattori lineari 𝑥 − 𝑥 𝑘
corrispondenti alle radici reali del polinomio 𝑃 . Si otterrà quindi la fattorizzazione
desiderata.
calcolo differenziale 5
5.1 derivata

Il potenziale gravitazionale generato dalla terra nello spazio, in un punto a distanza 𝑟


dal suo centro è dato da:
𝐺𝑀
𝑈(𝑟) = −
𝑟
dove 𝑀 è la massa della terra e 𝐺 è la costante di gravitazione universale. La
funzione 𝑈(𝑟) non è affatto lineare. Se però consideriamo il campo gravitazionale
per i punti in prossimità della superficie terrestre, ci aspettiamo un comportamento
approssimativamente lineare. Proviamo a esplicitare questa idea.

Supponiamo di trovarci ad altezza ℎ dalla superficie terrestre. Ci troveremo allora a


distanza 𝑅 + ℎ dal centro della terra. Si avrà allora:
1
𝑈(𝑅 + ℎ) = −𝐺𝑀 .
𝑅+ℎ
Osserviamo ora che si ha

1 1 1 1 1 𝑅 − (𝑅 + ℎ)
= + − = +
𝑅+ℎ 𝑅 𝑅+ℎ 𝑅 𝑅 𝑅(𝑅 + ℎ)
1 ℎ
= −
𝑅 𝑅(𝑅 + ℎ)
1 ℎ ℎ ℎ
= − 2− +
𝑅 𝑅 𝑅(𝑅 + ℎ) 𝑅 2
1 ℎ ℎ𝑅 − ℎ(𝑅 + ℎ)
= − 2−
𝑅 𝑅 𝑅 2 (𝑅 + ℎ)
ℎ 1 ℎ2
=− + + .
𝑅 2 𝑅 𝑅 2 (𝑅 + ℎ)

Dunque si avrà

𝐺𝑀 𝐺𝑀
𝑈(𝑅 + ℎ) = ℎ− + 𝜔(ℎ)
𝑅2 𝑅
= 𝑔 ℎ + 𝐶 + 𝜔(ℎ)

dove 𝑔 = 𝐺𝑀/𝑅 2 , 𝐶 è una costante (irrilevante perché il potenziale può essere definito
a meno di una costante) e 𝜔(ℎ) è una funzione con la proprietà 𝜔(ℎ)/ℎ → 0 per ℎ → 0.
Dunque se ℎ è molto piccolo rispetto a 𝑅 , il termine 𝜔(ℎ) è trascurabile rispetto al
termine 𝑔 ℎ (anche se entrambi tendono a zero per ℎ → 0). Questo giustifica l’utilizzo
della formula semplificata:
𝑈0 (ℎ) = 𝑔 ℎ
da cui l’energia potenziale 𝐸 = 𝑚 𝑔 ℎ se abbiamo una massa 𝑚 ad una altezza ℎ sulla
superficie terrestre.
linearizzazione
Quello che abbiamo fatto è un procedimento di linearizzazione. Il campo gravitazionale
178 5 calcolo differenziale

Figura 5.1: Il grafico del potenziale gra-


vitazionale terrestre. Sull’asse delle 𝑥 la
distanza dal centro della terra in raggi
terrestri. Sull’asse delle 𝑦 il potenziale
gravitazionale con unità 𝐶 = 𝐺𝑀/𝑅 . La
pendenza della retta tangente al grafico
della curva per 𝑥 = 𝑅 è 𝑔 = 𝐺𝑀/𝑅 2 .
Nella figura di destra un ingrandimento
in un intorno del raggio terrestre: si nota
come il grafico del potenziale risulta qua-
si indistinguibile dal grafico della retta
tangente.

è descritto da una funzione non lineare: −𝐺𝑀/𝑟 . Ma quando ci restringiamo a un


piccolo intervallo di valori di 𝑟 (i valori di 𝑟 vicini ad 𝑅 , il raggio della terra) tale
funzione risulta quasi indistinguibile, a meno di una costante, dalla funzione lineare
𝑔 ℎ se 𝑟 = 𝑅 + ℎ . Le funzioni lineari sono molto più semplici da trattare ed è quindi
conveniente, se rimaniamo sulla superficie terrestre, utilizzare quest’ultima formula
per il potenziale gravitazionale. Il grafico della funzione lineare che meglio approssima
retta tangente il grafico di una funzione si chiama retta tangente. Il suo coefficiente angolare, 𝑔 nel
nostro esempio, si chiama derivata.
derivata
Una volta introdotte le derivate vedremo che quello che abbiamo determinato è la
formula:
𝑈(𝑅 + ℎ) = 𝑈(𝑅) + 𝑈 ′(𝑅)ℎ + 𝜔(ℎ).

Definizione 5.1 (derivata). Sia 𝐴 ⊆ ℝ, 𝑓 : 𝐴 → ℝ, 𝑥 0 un punto di accumulazione di 𝐴.


Diremo che la funzione 𝑓 è derivabile nel punto 𝑥 0 se esiste ed è finito il limite:

𝑓 (𝑥0 + ℎ) − 𝑓 (𝑥0 )
lim .
ℎ→0 ℎ
derivata In tal caso denoteremo con 𝑓 ′(𝑥 0 ) il valore di tale limite che chiameremo derivata della funzione
𝑓 nel punto 𝑥0 .

Se 𝐵 è l’insieme dei punti di accumulazione di 𝐴 in cui 𝑓 risulta essere derivabile, risulta


quindi definita la funzione derivata 𝑓 ′ : 𝐵 → ℝ.

Una funzione 𝑓 si dice essere derivabile se è derivabile in ogni punto del suo dominio. Se
𝐶 ⊆ 𝐴 la funzione 𝑓 si dice essere derivabile su 𝐶 se è derivabile in ogni punto dell’insieme
𝐶 (cioè se 𝐶 ⊆ 𝐵).

Notazioni alternative per denotare la derivata di una funzione:

𝑑 𝑑𝑓
𝑓′ = 𝐷𝑓 = 𝑓 = .
𝑑𝑥 𝑑𝑥

Il rapporto
𝑓 (𝑥0 + ℎ) − 𝑓 (𝑥 0 )
rapporto incrementale ℎ
si chiama rapporto incrementale. In effetti cambiando variabile e ponendo 𝑥 = 𝑥 0 + ℎ si
può scrivere
𝑓 (𝑥0 + ℎ) − 𝑓 (𝑥0 ) 𝑓 (𝑥) − 𝑓 (𝑥0 ) Δ 𝑓
= =
ℎ 𝑥 − 𝑥0 Δ𝑥
5.1 derivata 179

che risulta essere il rapporto dell’incremento della funzione 𝑓 (a volte denotato con
Δ 𝑓 ) rispetto all’incremento corrispondente della variabile 𝑥 (a volte denotato con Δ𝑥 ).
Cambiando variabile nel limite, per ℎ → 0 si avrà 𝑥 → 𝑥 0 e quindi

𝑓 (𝑥) − 𝑓 (𝑥0 )
𝑓 ′(𝑥0 ) = lim .
𝑥→𝑥 0 𝑥 − 𝑥0

Esempio 5.2. Si consideri la funzione 𝑓 (𝑥) = 1/𝑥 definita sull’insieme 𝐴 = ℝ \ {0}. Si ha


allora per ogni 𝑥 ≠ 0:
1 1
𝑥+ℎ − 𝑥 𝑥 − (𝑥 + ℎ) −1 1
𝑓 ′(𝑥) = lim = lim = lim = − 2.
ℎ→0 ℎ ℎ→0 ℎ(𝑥 + ℎ)𝑥 ℎ→0 (𝑥 + ℎ)𝑥 𝑥

Risulta quindi che la funzione 1/𝑥 sia derivabile e la sua derivata è la funzione −1/𝑥 2 .

Teorema 5.3 (continuità delle funzioni derivabili). Se 𝑓 è derivabile nel punto 𝑥 allora 𝑓
è anche continua nel punto 𝑥 .

Dimostrazione. Si ha

𝑓 (𝑥 + ℎ) − 𝑓 (𝑥)
lim 𝑓 (𝑥 + ℎ) − 𝑓 (𝑥) = lim · ℎ = 𝑓 ′(𝑥) · 0 = 0.
ℎ→0 ℎ→0 ℎ

Dunque 𝑓 (𝑥 + ℎ) → 𝑓 (𝑥) per ℎ → 0 e quindi 𝑓 è continua nel punto 𝑥 .

Esempio 5.4 (funzione continua ma non derivabile). La funzione 𝑓 (𝑥) = |𝑥| è un esempio
di funzione continua ma non derivabile. E’ infatti facile verificare che nel punto 𝑥 0 = 0 il
limite destro del rapporto incrementale è 1 mentre il limite sinistro è −1.

Un altro esempio è la funzione 𝑓 (𝑥) = 𝑥 che è continua ma non è derivabile nel punto 𝑥 0 = 0
perché il limite del rapporto incrementale esiste ma è +∞.

Teorema 5.5 (derivata della funzione composta). Sia 𝑓 una funzione derivabile nel punto
𝑥0 e sia 𝑔 una funzione derivabile nel punto 𝑓 (𝑥0 ). Allora la funzione composta 𝑔 ◦ 𝑓 è
derivabile nel punto 𝑥 0 e si ha:

(𝑔 ◦ 𝑓 )′(𝑥0 ) = 𝑔 ′( 𝑓 (𝑥0 )) · 𝑓 ′(𝑥 0 ).

Dimostrazione. Consideriamo la funzione


( 𝑔(𝑦)−𝑔( 𝑓 (𝑥
0 ))
𝑦− 𝑓 (𝑥0 )
se 𝑦 ≠ 𝑓 (𝑥 0 ),
𝐺(𝑦) =
𝑔 ′( 𝑓 (𝑥0 )) se 𝑦 = 𝑓 (𝑥 0 ).

Si avrà allora

𝑔( 𝑓 (𝑥0 + ℎ)) − 𝑔( 𝑓 (𝑥0 )) 𝑓 (𝑥0 + ℎ) − 𝑓 (𝑥0 )


= 𝐺( 𝑓 (𝑥0 + ℎ)) · (5.1)
ℎ ℎ
infatti se 𝑓 (𝑥 0 + ℎ) ≠ 𝑓 (𝑥 0 ) abbiamo moltiplicato e diviso per 𝑓 (𝑥 0 + ℎ) − 𝑓 (𝑥 0 ) se
invece 𝑓 (𝑥 0 + ℎ) = 𝑓 (𝑥 0 ) allora anche 𝑔( 𝑓 (𝑥 0 + ℎ)) = 𝑔( 𝑓 (𝑥 0 )) e l’uguaglianza è ancora
valida perché sia il lato sinistro che il lato destro si annullano (e il valore assegnato a 𝐺
risulta in tal caso irrilevante).
180 5 calcolo differenziale

Chiaramente quando ℎ → 0 il secondo fattore sul lato destro dell’uguaglianza (5.1)


tende, per definizione, a 𝑓 ′(𝑥 0 ). Per quanto riguarda il primo fattore osserviamo
che 𝐺(𝑦), per come è stata definita, risulta essere una funzione continua nel punto
𝑦 = 𝑓 (𝑥0 ) in quanto
𝑔(𝑦) − 𝑔( 𝑓 (𝑥0 ))
→ 𝑔 ′( 𝑓 (𝑥0 ))
𝑦 − 𝑓 (𝑥 0 )
per 𝑦 → 𝑓 (𝑥 0 ). Ma anche la funzione 𝑓 è continua nel punto 𝑥 0 (in quanto derivabile).
Dunque la funzione composta 𝐺( 𝑓 (𝑥 0 + ℎ)) è continua nel punto ℎ = 0. Risulta quindi
che 𝐺( 𝑓 (𝑥 0 + ℎ)) → 𝐺( 𝑓 (𝑥 0 )) = 𝑔 ′( 𝑓 (𝑥 0 )) per ℎ → 0. Dunque il lato destro di (5.1) ha
limite 𝑔 ′( 𝑓 (𝑥 0 )) · 𝑓 ′(𝑥 0 ) per ℎ → 0, come volevamo dimostrare.

Teorema 5.6 (derivata della funzione inversa). Sia 𝑓 una funzione invertibile derivabile in
un punto 𝑥 0 e supponiamo che la funzione inversa 𝑓 −1 sia continua in 𝑓 (𝑥 0 ). Se 𝑓 ′(𝑥 0 ) ≠ 0
allora 𝑓 −1 è derivabile in 𝑓 (𝑥 0 ) e vale:

1
( 𝑓 −1 )′( 𝑓 (𝑥 0 )) = .
𝑓 ′(𝑥 0 )

Chiamato 𝑦0 = 𝑓 (𝑥 0 ) la formula può essere anche scritta nella forma:

1
( 𝑓 −1 )′(𝑦0 ) = .
𝑓 ′( 𝑓 −1 (𝑦 0 ))

Se invece 𝑓 ′(𝑥 0 ) = 0 la funzione 𝑓 −1 non è derivabile in 𝑓 (𝑥 0 ).

Osserviamo che se 𝑓 è definita in un intervallo e se è invertibile e continua in tutto


l’intervallo allora certamente l’inversa è continua (Esercizio 2.82).

Dimostrazione. Posto 𝑦0 = 𝑓 (𝑥 0 ) consideriamo il rapporto incrementale di 𝑓 −1 nel


punto 𝑦0 :
𝑓 −1 (𝑦) − 𝑓 −1 (𝑦0 )
.
𝑦 − 𝑦0
Per 𝑦 → 𝑦0 possiamo fare il cambio di variabile 𝑥 = 𝑓 −1 (𝑦) in quanto avendo assunto
che 𝑓 −1 sia continua in 𝑓 (𝑥 0 ) sappiamo che se 𝑦 → 𝑦0 allora 𝑥 = 𝑓 −1 (𝑦) → 𝑓 −1 (𝑦0 ) = 𝑥 0 .
Si ha allora per 𝑦 → 𝑦0 che 𝑥 → 𝑥 0 e, se 𝑓 ′(𝑥 0 ) ≠ 0:

𝑓 −1 (𝑦) − 𝑓 −1 (𝑦0 ) 𝑥 − 𝑥0 1 1
= = → .
𝑦 − 𝑦0 𝑓 (𝑥) − 𝑓 (𝑥0 ) 𝑓 (𝑥)− 𝑓 (𝑥0 ) 𝑓 ′(𝑥 0 )
𝑥−𝑥 0

Se invece 𝑓 ′(𝑥 0 ) = 0 il rapporto incrementale della funzione inversa ha limite infinito e


quindi la funzione inversa non è derivabile in 𝑓 (𝑥 0 ).

Teorema 5.7 (operazioni con le derivate). Siano 𝑓 e 𝑔 due funzioni derivabili in uno stesso
punto 𝑥 0 . Allora le funzioni 𝑓 + 𝑔 , 𝑓 − 𝑔 , 𝑓 · 𝑔 e, se 𝑔(𝑥 0 ) ≠ 0 anche 𝑓 /𝑔 sono funzioni
derivabili in 𝑥 0 . Nei punti in cui entrambe le funzioni sono derivabili si ha

( 𝑓 + 𝑔)′ = 𝑓 ′ + 𝑔 ′ , ( 𝑓 − 𝑔)′ = 𝑓 ′ − 𝑔 ′ ,
 ′
′ ′ ′ 𝑓 𝑓 ′ 𝑔 − 𝑓 𝑔′
( 𝑓 · 𝑔) = 𝑓 · 𝑔 + 𝑓 𝑔 , = .
𝑔 𝑔2
5.1 derivata 181

𝑓 (𝑥) 𝑓 ′(𝑥) 𝑓 (𝑥) 𝑓 ′(𝑥) 𝑓 (𝑥) 𝑓 ′(𝑥) Tabella 5.1: Derivate delle funzioni ele-
mentari
𝑚𝑥 + 𝑞 𝑚 𝑒𝑥 𝑒𝑥 sin 𝑥 cos 𝑥
𝑥
|𝑥| |𝑥|
ln 𝑥 1
𝑥 cos 𝑥 − sin 𝑥
𝑥𝑛 𝑛𝑥 𝑛−1 sinh 𝑥 cosh 𝑥 arcsin 𝑥 √ 1
1−𝑥 2
𝑥𝛼 𝛼𝑥 𝛼−1 cosh 𝑥 sinh 𝑥 arccos 𝑥 −√ 1 2
√ 1−𝑥
𝑛
𝑥 √
𝑛
1
settsinh 𝑥 √ 1 tg 𝑥 1 + tg2 𝑥
√ 𝑛 𝑥 𝑛−1 𝑥 2 +1
𝑥 1

2 𝑥
settcosh 𝑥 √ 1 arctg 𝑥 1
1+𝑥 2
𝑥 2 −1

Dimostrazione. Per quanto riguarda la derivata della somma (o della differenza) è


sufficiente osservare che il rapporto incrementale della somma (o della differenza) è la
somma (o la differenza) dei rapporti incrementali e che il limite della somma (o della
differenza) è uguale alla somma (o la differenza) dei limiti.

Calcoliamo la derivata del prodotto 𝑓 · 𝑔 nel punto 𝑥 0 . Si ha

𝑓 (𝑥)𝑔(𝑥) − 𝑓 (𝑥0 )𝑔(𝑥 0 ) 𝑓 (𝑥)(𝑔(𝑥) − 𝑔(𝑥0 )) + ( 𝑓 (𝑥) − 𝑓 (𝑥0 ))𝑔(𝑥 0 )


=
𝑥 − 𝑥0 𝑥 − 𝑥0
𝑔(𝑥) − 𝑔(𝑥0 ) 𝑓 (𝑥) − 𝑓 (𝑥0 )
= 𝑓 (𝑥) + 𝑔(𝑥0 ).
𝑥 − 𝑥0 𝑥 − 𝑥0

Passando al limite per 𝑥 → 𝑥 0 ci ricordiamo che 𝑓 (𝑥) → 𝑓 (𝑥 0 ) in quanto 𝑓 è continua


in 𝑥 0 (essendo per ipotesi derivabile). I rapporti incrementali tendono alle derivate e si
ottiene quindi il risultato voluto 𝑓 (𝑥 0 )𝑔 ′(𝑥 0 ) + 𝑓 ′(𝑥 0 )𝑔(𝑥 0 ).

Per quanto riguarda la derivata del rapporto osserviamo che posto ℎ(𝑦) = 1/𝑦 si ha

𝑓 (𝑥)
= 𝑓 (𝑥) · ℎ(𝑔(𝑥)).
𝑔(𝑥)

Dall’esercizio già svolto sappiamo che ℎ ′(𝑦) = −1/𝑦 2 e dunque possiamo utilizzare le
formule per la derivata del prodotto e la derivata della funzione composta per ottenere:
 ′
𝑓
(𝑥0 ) = ( 𝑓 · (𝑔 ◦ ℎ))′(𝑥0 )
𝑔
= 𝑓 ′(𝑥0 ) · ℎ(𝑔(𝑥0 )) + 𝑓 (𝑥 0 ) · ℎ ′(𝑔(𝑥0 )) · 𝑔 ′(𝑥0 )
𝑓 ′(𝑥0 ) −1 ′
= + 𝑓 (𝑥0 ) · 2 𝑔 (𝑥0 )
𝑔(𝑥 0 ) 𝑔 (𝑥0 )
𝑓 ′(𝑥0 )𝑔(𝑥 0 ) − 𝑓 (𝑥0 )𝑔 ′(𝑥 0 )
= .
𝑔 2 (𝑥0 )

Teorema 5.8 (derivate delle funzioni elementari). Per 𝑚, 𝑞, 𝛼 ∈ ℝ, 𝛼 ≠ 0, 𝑛 ∈ ℕ , 𝑛 ≠ 0


valgono le regole di derivazione riassunte nella tabella 5.1: le funzioni nella colonna 𝑓 (𝑥)
hanno la derivata riportata nella colonna 𝑓 ′(𝑥). Le funzioni 𝑓 (𝑥) sono derivabili nei punti in

cui la corrispondente espressione 𝑓 ′(𝑥) è ben definita. In particolare: la funzione 𝑛 𝑥 non è
derivabile in 𝑥 = 0, le funzioni arcsin 𝑥 e arccos 𝑥 non sono derivabili nei punti −1 e 1, la
funzione |𝑥| non è derivabile in 0, la funzione settcosh 𝑥 non è derivabile in 1. Le funzioni
182 5 calcolo differenziale

lineari, potenze con base positiva, potenze con esponente intero, esponenziale, logaritmo, seno,
coseno, tangente, arcotangente sono invece derivabili in tutti i punti in cui sono definite.

Dimostrazione. Per quanto riguarda le funzioni lineari si ha:

𝑚(𝑥 + ℎ) + 𝑞 − (𝑚𝑥 + 𝑞)
(𝑚𝑥 + 𝑞)′ = lim = lim 𝑚 = 𝑚.
ℎ→0 ℎ ℎ→0

Ricordando che la derivata è un limite e che il limite in un punto dipende solo dai
valori della funzione in un intorno del punto, possiamo affermare che la derivata del
valore assoluto |𝑥| coincide con la derivata di 𝑥 cioè 1 sugli 𝑥 > 0 e coincide con la
derivata di −𝑥 sugli 𝑥 < 0. Dunque 𝐷|𝑥| = 𝑥/|𝑥| se 𝑥 ≠ 0. Se 𝑥 = 0 i limiti destro e
sinistro del rapporto incrementale di |𝑥| tendono rispettivamente a 1 e −1 e quindi la
derivata non esiste.

Dimostriamo che 𝐷𝑥 𝑛 = 𝑛𝐷𝑥 𝑛−1 per 𝑛 ∈ ℕ , 𝑛 > 0, per induzione su 𝑛 . Per 𝑛 = 1


abbiamo 𝑥 𝑛 = 𝑥 1 è lineare e quindi dalla formula precedente 𝐷𝑥 1 = 1 = 1 · 𝑥 0 .
Supponendo di sapere che 𝐷𝑥 𝑛 = 𝑛𝑥 𝑛−1 si ha, applicando la regola di derivazione del
prodotto:

𝐷𝑥 𝑛+1 = 𝐷𝑥 · 𝑥 𝑛 = 1 · 𝑥 𝑛 + 𝑥 · 𝑛𝑥 𝑛−1 = 𝑥 𝑛 + 𝑛𝑥 𝑛 = (𝑛 + 1)𝑥 𝑛

dimostrando dunque il passo induttivo. Ricordando la formula di derivazione del


rapporto possiamo trovare la formula per le potenze con esponente intero negativo:

1 −𝑛𝑥 𝑛−1
𝐷𝑥 −𝑛 = 𝐷 = = −𝑛𝑥 𝑛−1−2𝑛 = −𝑛𝑥 −𝑛−1 .
𝑥𝑛 𝑥 2𝑛

La derivata della radice 𝑛 -esima si trova con la formula di derivazione della funzione
inversa 𝑥 𝑛 , che può essere applicata se 𝑥 ≠ 0:

√ 1 1
𝐷 𝑛𝑥 = √ = √ .
𝑛( 𝑛 𝑥)𝑛−1 𝑛
𝑛 𝑥 𝑛−1
Osserviamo che se 𝑛 è dispari la formula è valida anche per 𝑥 < 0. La derivata della
radice quadrata si ottiene ponendo 𝑛 = 2.

Per quanto riguarda la derivata dell’esponenziale ci riconduciamo ad un limite notevole:

𝑒 𝑥+ℎ − 𝑒 𝑥 𝑒𝑥𝑒ℎ − 𝑒𝑥 𝑒ℎ − 1
𝐷𝑒 𝑥 = lim = lim = lim 𝑒 𝑥 = 𝑒𝑥.
ℎ→0 ℎ ℎ→0 ℎ ℎ→0 ℎ

La derivata del logaritmo si ottiene come derivata della funzione inversa dell’esponen-
ziale:
1 1
𝐷 ln 𝑥 = ln 𝑥 = .
𝑒 𝑥
Possiamo quindi calcolare la derivata delle potenze con base positiva e esponente reale
qualunque:
1
𝐷𝑥 𝛼 = 𝐷𝑒 𝛼 ln 𝑥 = 𝑒 𝛼 ln 𝑥 𝐷(𝛼 ln 𝑥) = 𝑥 𝛼 𝛼 = 𝛼𝑥 𝛼−1 .
𝑥
5.1 derivata 183

Per quanto riguarda le funzioni trigonometriche sin e cos ci ricordiamo dei limiti
notevoli:
sin ℎ 1 − cos ℎ 1 − cos ℎ 1
lim = 1, lim = lim ℎ · = 0 · = 0.
ℎ→0 ℎ ℎ→0 ℎ ℎ→0 ℎ 2 2

Applicando le formule di addizione si ha

sin(𝑥 + ℎ) − sin(𝑥)
𝐷 sin 𝑥 = lim
ℎ→0 ℎ
sin(𝑥) cos(ℎ) + cos(𝑥) sin(ℎ) − sin(𝑥)
= lim
ℎ→0 ℎ
cos ℎ − 1 sin ℎ
= lim sin(𝑥) + cos(𝑥) = cos(𝑥).
ℎ→0 ℎ ℎ

e similmente

cos(𝑥 + ℎ) − cos(𝑥)
𝐷 cos 𝑥 = lim
ℎ→0 ℎ
cos(𝑥) cos(ℎ) − sin(𝑥) sin(ℎ) − cos(𝑥)
= lim
ℎ→0 ℎ
cos ℎ − 1 sin ℎ
= lim cos(𝑥) − sin(𝑥) = − sin(𝑥)
ℎ→0 ℎ ℎ

La funzioni arcsin è definita come l’inversa della restrizione della funzione sin all’in-
tervallo [−𝜋/2 , 𝜋/2]. Nell’intervallo aperto (−𝜋/2 , 𝜋/2) la funzione sin ha derivata
positiva e dunque risulta che la funzione inversa (che sappiamo essere continua) è
derivabile in (−1 , 1) e la sua derivata è

1 1 1
𝐷 arcsin 𝑥 = =√ =√ .
cos(arcsin 𝑥) 1 − sin2 arcsin 𝑥 1 − 𝑥2
q
Si ha infatti cos 𝑦 = 1 − sin2 𝑦 se 𝑦 ∈ [−𝜋/2 , 𝜋/2].

Analogamente la funzione arccos è definita come l’inversa della restrizione di cos


all’intervallo [0 , 𝜋] e si ha quindi, per 𝑥 ∈ (−1 , 1)

1 1 1
𝐷 arccos 𝑥 = = √ = −√ .
− sin(arccos 𝑥) − 1 − cos2 arccos 𝑥 1 − 𝑥2

Si ha infatti sin 𝑦 =
p
1 − cos2 𝑦 se 𝑦 ∈ [0 , 𝜋].

Nei punti 𝑥 = 1 e 𝑥 = −1 le funzioni arcsin e arccos non sono invece derivabili.

Per la funzione tangente possiamo utilizzare la formula di derivazione del rapporto:

sin 𝑥 cos 𝑥 · cos 𝑥 − sin 𝑥 · (− sin 𝑥)


𝐷 tg 𝑥 = 𝐷 =
cos 𝑥 cos2 𝑥
cos 𝑥 + sin 𝑥
2 2
1
= = 1 + tg2 𝑥 = .
cos2 𝑥 cos2 𝑥
184 5 calcolo differenziale

Usando la formula della derivata della funzione inversa si ha


1 1
𝐷 arctg 𝑥 = = .
1+ tg2 (arctg 𝑥) 1 + 𝑥2

Per quanto riguarda le funzioni iperboliche le derivate di sinh e cosh si riconducono


immediatamente alla derivata dell’esponenziale, utilizzando la definizione (3.19). Le
derivate delle funzioni inverse settsinh e settcosh si ottengono dalla formula per la
p
derivata della funzione inversa e utilizzando le relazioni cosh 𝑥 = sinh2 𝑥 + 1 e, per
p
𝑥 > 0, sinh 𝑥 = cosh2 𝑥 − 1:

1 1 1
𝐷 settsinh 𝑥 = =p =√
cosh(settsinh 𝑥) sinh (settsinh 𝑥) + 1
2 𝑥 +1
2

1 1 1
𝐷 settcosh 𝑥 = =p =√
sinh(settcosh 𝑥) cosh2 (settcosh 𝑥) − 1 𝑥2 − 1

Proposizione 5.9 (trucco di Feynman per le derivate). Siano 𝑓1 , . . . , 𝑓𝑛 funzioni derivabili


e siano 𝛼 1 , . . . , 𝛼 𝑛 esponenti reali. Allora:
!′
𝑛
Y 𝛼
𝑛
Y 𝛼
𝑛
X 𝑓 𝑘′
𝑓𝑘 𝑘 = 𝑓𝑘 𝑘 · 𝛼𝑘 .
𝑘=1 𝑘=1 𝑘=1
𝑓𝑘

Dimostrazione. Basta osservare che


!′
𝑛
Y 𝛼
𝑛
X 𝛼 𝑘 −1
Y 𝛼𝑗
𝑛
X 𝑓 𝑘′ Y
𝑛
𝛼𝑗
𝑓𝑘 𝑘 = 𝛼 𝑘 𝑓 𝑘′ 𝑓 𝑘 𝑓𝑗 = 𝛼𝑘 𝑓𝑗 .
𝑘=1 𝑘=1 𝑗≠𝑘 𝑘=1
𝑓𝑘 𝑗=1

Se ad esempio vogliamo calcolare la derivata della funzione



1 − 𝑥 2 · ln 𝑥 1
= (1 − 𝑥 2 ) 2 · ln 𝑥 · 𝑥 −1 · (cos 𝑥)−2
𝑥 · cos 𝑥
2

otteniamo √
1 − 𝑥 2 · ln 𝑥 1 −2 𝑥 − sin 𝑥
 
1 1
· · + − −2 .
𝑥 · sin2 𝑥 2 1−𝑥 2 𝑥 ln 𝑥 𝑥 cos 𝑥

5.2 derivate parziali

Capita a volte di avere funzioni che dipendono da più variabili o da parametri. Ad


esempio la funzione 𝑓 (𝑥, 𝑦) = 𝑥 2 𝑦 + 𝑦 2 è una funzione definita sulle coppie di numeri
reali: 𝑓 : ℝ2 → ℝ. Se considero una delle due variabili, ad esempio la prima variabile
𝑥 , come un parametro fissato, posso identificare la funzione 𝑓 come una funzione
𝑔 : ℝ → (ℝℝ ) che ad ogni valore del parametro 𝑥 restituisce una funzione della
variabile 𝑦 :
𝑔(𝑥)(𝑦) = 𝑓 (𝑥, 𝑦).
5.3 punti notevoli 185

Dunque per ogni 𝑥 fissato, posso considerare la funzione ℎ = 𝑔(𝑥) che è una funzione
della sola variabile 𝑦 : ℎ(𝑦) = 𝑔(𝑥)(𝑦) = 𝑓 (𝑥, 𝑦). E posso quindi farne la derivata
ℎ ′(𝑦) in qualunque punto 𝑦 . Il valore che ottengo si chiama derivata parziale della derivata parziale
funzione 𝑓 rispetto alla variabile 𝑦 calcolata nel punto (𝑥, 𝑦). Per fare il calcolo della
derivata possiamo applicare le usuali regole di derivazione facendo attenzione che se
stiamo facendo la derivata rispetto a 𝑦 la variabile 𝑥 va trattata come se fosse costante,
perché stiamo in effetti fissando 𝑥 prima di fare la derivata. Se 𝑓 (𝑥, 𝑦) = 𝑥 2 𝑦 + 𝑦 2 si
ottiene dunque: ℎ ′(𝑦) = 𝑥 2 + 2 𝑦 . Se ora consideriamo anche 𝑥 variabile otteniamo una Se non siamo abituati a pensare che 𝑥
nuova funzione di due variabili (𝑥, 𝑦) ↦→ 𝑔(𝑥)′(𝑦) = ℎ ′(𝑦) che può essere scritta con le possa essere un valore fissato si provi a
sostituire la variabile 𝑥 con una lettera
seguenti notazioni: diversa come 𝑐 o 𝜋 che ci dà l’idea di
una quantità costante.
𝜕 𝑓 (𝑥, 𝑦) 𝜕 𝑓
= (𝑥, 𝑦) = 𝐷 𝑦 𝑓 (𝑥, 𝑦) = 𝑓 𝑦 (𝑥, 𝑦) Si osservi che per le funzioni di più va-
𝜕𝑦 𝜕𝑦 riabili c’è una ambiguità di fondo nelle
notazioni. Infatti se ho una espressione
= 𝐷2 𝑓 (𝑥, 𝑦) = 𝑓,2 (𝑥, 𝑦)
in due variabili come 𝑥 2 𝑦 + 𝑦 2 è chiaro
= ℎ ′(𝑦) che questa rappresenta una funzione di
due variabili ma non è del tutto ovvio di-
re quale è la prima variabile e quale è la
Analogamente potremmo fare la derivata parziale di 𝑓 rispetto alla prima variabile 𝑥 . seconda. Normalmente le variabili ven-
Se 𝑓 (𝑥, 𝑦) = 𝑥 2 𝑦 + 𝑦 2 si ottiene gono indicate in ordine alfabetico a par-
tire dalla 𝑥 ... ma è solo una convenzione.
In principio l’espressione 𝑥 2 𝑦 + 𝑦 2 po-
𝜕 𝑓 (𝑥, 𝑦)
= 2 𝑥 𝑦. trebbe anche rappresentare una funzio-
𝜕𝑥 ne di tre variabili 𝑥, 𝑦, 𝑧 . Dunque se ho
una espressione che utilizza certi nomi
per le variabili è naturale usare gli stessi
Stiamo qui trattando le funzioni di più variabili come se fossero funzioni di una sola nomi nel simbolo utilizzato per la deri-
variabile dipendenti da altri parametri. Questo perché stiamo facendo un corso di vata parziale come nella notazione 𝐷 𝑦 .
analisi sulle funzioni di una variabile (reale). Per trattare tutte le variabili come una Se invece le variabili non hanno un nome
unica variabile multidimensionale bisogna fare diverse considerazioni aggiuntive che sarebbe più sensato indicare la variabile
dandone la posizione numerica come
vengono trattate nei corsi di analisi sulle funzioni di più variabili (reali). Verranno in nella notazione 𝐷2 . Ci sono casi in cui
tal caso introdotti i concetti di gradiente ∇ 𝑓 , derivata 𝐷 𝑓 e differenziale 𝑑 𝑓 che noi non la notazione può essere molto ambigua,
𝜕 𝑓 (𝑦,𝑥)
affronteremo qui. come ad esempio se scrivessi 𝜕𝑦
: sto
derivando 𝑓 rispetto alla prima varia-
bile oppure derivo 𝑓 (𝑥, 𝑦) rispetto alla
seconda variabile e poi scambio le due
5.3 punti notevoli variabili?

In questa sezione introdurremo una terminologia che è largamente utilizzata nello


studio di funzione. Cercheremo di dare delle definizioni anche per alcuni termini
su cui potrebbe non esserci un consenso univoco. Ricordiamoci di non usare queste
definizioni in modo troppo formale: sarà sempre meglio verificare che il nostro
interlocutore ci comprenda perché spesso alcuni termini potrebbero essere utilizzati in
maniera impropria o con significati leggermente diversi.

Nel dubbio potremo sempre evitare di utilizzare questa terminologia riconducendoci


ai concetti sottostanti.

Definizione 5.10 (punti notevoli). Sia 𝑓 : 𝐴 ⊆ ℝ → ℝ una funzione. Se 𝑓 è derivabile in


punto critico
un punto 𝑥 0 ∈ 𝐴 e 𝑓 ′(𝑥 0 ) = 0 diremo che 𝑥 0 è un punto critico o punto stazionario di 𝑓 .

Se 𝑥 0 ∈ 𝐴 ed esiste un intorno 𝑈 di 𝑥 0 per cui 𝑥 0 risulta essere un punto di minimo


minimo relativo
(rispettivamente di massimo) per 𝑓 ristretta ad 𝑈 diremo che 𝑥 0 è un punto di minimo relativo
o minimo locale (rispettivamente massimo relativo o massimo locale). Per contrapposizione i
186 5 calcolo differenziale

punti di massimo e minimo su tutto il dominio 𝐴 vengono anche chiamati massimo/minimo


assoluto di 𝑓 .

punto di flesso
Diremo che 𝑥 0 ∈ 𝐴 è un punto di flesso per 𝑓 se 𝑓 è derivabile in un intorno di 𝑥 0 e 𝑥 0 è
un punto di massimo o minimo relativo per 𝑓 ′. Nel punto 𝑥 0 la retta tangente ha equazione
𝑦 = 𝑟(𝑥) = 𝑓 ′(𝑥0 )(𝑥 − 𝑥0 ) + 𝑓 (𝑥0 ). Se 𝑥0 è minimo per 𝑓 ′ risulta che 𝑓 (𝑥) − 𝑟(𝑥) è crescente
quindi 𝑓 (𝑥) ≥ 𝑟(𝑥) per 𝑥 ≥ 𝑥 0 e 𝑓 (𝑥) ≤ 𝑟(𝑥) per 𝑥 ≤ 𝑥 0 (il grafico della funzione attraversa
la retta tangente da sotto a sopra) mentre se 𝑥 0 è massimo per 𝑓 ′ risulta che 𝑓 (𝑥) ≤ 𝑟(𝑥) per
𝑥 ≥ 𝑥0 e 𝑓 (𝑥) ≥ 𝑟(𝑥) per 𝑥 ≤ 𝑥 0 (il grafico della funzione attraversa la tangente da sopra
a sotto). Se la funzione 𝑓 non è derivabile in 𝑥 0 ma il limite del rapporto incrementale esiste
flesso verticale
ed è infinito, diremo che 𝑥 0 è un flesso verticale. In tale punto la retta tangente è verticale e il
grafico della funzione attraversa tale retta.

Sia 𝑥 0 ∈ 𝐴 un punto in cui la funzione 𝑓 è continua ed esistono i limiti destro e sinistro del
rapporto incrementale (che si chiamano derivata destra e derivata sinistra)

𝑓 (𝑥 + ℎ) − 𝑓 (𝑥)
𝑚 ± = lim± .
ℎ→0 ℎ
punto angoloso Se 𝑚 + ≠ 𝑚 − chiaramente 𝑓 non è derivabile in 𝑥 0 . Se entrambi 𝑚 + ed 𝑚 − sono finiti diremo
che 𝑥 0 è un punto angoloso in quanto le due semirette tangenti in 𝑥 0 (da destra e da sinistra)
punto di cuspide formano un angolo non piatto. Se 𝑚 + = −𝑚 − = +∞ oppure se 𝑚 + = −𝑚 − = −∞ diremo
che il punto 𝑥 0 è un punto di cuspide (c’è una semiretta tangente verticale).

Definizione 5.11 (asintoti). Diremo che la retta 𝑦 = 𝑚𝑥 + 𝑞 è un asintoto per il grafico di


𝑓 per 𝑥 → +∞ se risulta
asintoto orizzontale e obliquo lim 𝑓 (𝑥) − (𝑚𝑥 + 𝑞) = 0.
𝑥→+∞

Se 𝑚 = 0 diremo che il grafico di 𝑓 ha un asintoto orizzontale 𝑦 = 𝑞 altrimenti diremo che


𝑦 = 𝑚𝑥 + 𝑞 è un asintoto obliquo. Stessa cosa si può dire per 𝑥 → −∞.

asintoto verticale Se 𝑥 0 ∈ ℝ e si ha
lim | 𝑓 (𝑥)| = +∞
𝑥→𝑥0

diremo che la retta 𝑥 = 𝑥 0 è un asintoto verticale per il grafico della funzione 𝑓 .

Definizione 5.12 (punti di discontinuità). Se per 𝑥 0 ∈ ℝ si ha


discontinuità a salto

lim 𝑓 (𝑥) = ℓ 1 , lim 𝑓 (𝑥) = ℓ 2


discontinuità eliminabile 𝑥→𝑥0− 𝑥→𝑥0+

e se ℓ 1 ≠ ℓ 2 diremo che nel punto 𝑥 0 la funzione 𝑓 ha una discontinuità a salto. Se ℓ 1 = ℓ 2 e


se 𝑓 non è definita nel punto 𝑥 0 oppure se 𝑓 (𝑥 0 ) ≠ ℓ 1 diremo che nel punto 𝑥 0 la funzione 𝑓
ha una discontinuità eliminabile.

Si osservi che, nonostante la terminologia utilizzata, una funzione continua può avere
𝑥
una discontinuità a salto (ad esempio: 𝑓 (𝑥) = |𝑥| ) e può anche avere una discontinuità
𝑥
eliminabile (ad esempio: 𝑓 (𝑥) = 𝑥 ).
5.4 criteri di monotonia 187

5.4 criteri di monotonia

Teorema 5.13 (Fermat). Sia 𝑓 : (𝑎, 𝑏) → ℝ una funzione derivabile. Se 𝑥 0 ∈ (𝑎, 𝑏) è un


punto di massimo o minimo per 𝑓 allora 𝑓 ′(𝑥 0 ) = 0.

Dimostrazione. Senza perdere di generalità possiamo suppore che 𝑥 0 sia un punto di


massimo per 𝑓 . Sappiamo che

𝑓 (𝑥) − 𝑓 (𝑥0 )
𝑓 ′(𝑥0 ) = lim .
𝑥→𝑥 0 𝑥 − 𝑥0

Visto che 𝑥 0 è un punto dell’intervallo aperto (𝑎, 𝑏) la funzione 𝑓 è definita in un


intorno destro di 𝑥 0 e quindi possiamo restingere il limite ai valori 𝑥 > 𝑥 0 ottenendo:

𝑓 (𝑥) − 𝑓 (𝑥 0 )
𝑓 ′(𝑥0 ) = lim+ .
𝑥→𝑥 0 𝑥 − 𝑥0

Visto che 𝑥 0 è un punto di massimo per 𝑓 sappiamo che 𝑓 (𝑥) − 𝑓 (𝑥 0 ) ≤ 0. Essendo


𝑥 − 𝑥0 > 0 l’intero rapporto incrementale risulta essere non positivo. Dunque, per il
teorema della permanenza del segno, possiamo concludere che 𝑓 ′(𝑥 0 ) ≤ 0.

Ma possiamo anche restringere la funzione ad un intorno sinistro di 𝑥 0 e osservare che

𝑓 (𝑥) − 𝑓 (𝑥 0 )
𝑓 ′(𝑥0 ) = lim− .
𝑥→𝑥 0 𝑥 − 𝑥0

Ma ora il numeratore è, come prima, non positivo mentre il denominatore 𝑥 − 𝑥 0 è


negativo. Dunque il rapporto incrementale stavolta è non negativo e quindi, per la
permanenza del segno, 𝑓 ′(𝑥 0 ) ≥ 0.

Abbiamo scoperto quindi che 𝑓 ′(𝑥 0 ) ≤ 0 e 𝑓 ′(𝑥 0 ) ≥ 0 da cui deduciamo 𝑓 ′(𝑥 0 ) = 0.

Il teorema di Fermat si può enunciare dicendo che ogni punto di massimo o minimo
relativo interno al dominio di una funzione in cui la funzione è derivabile è necessaria-
mente un punto critico. In particolare per determinare massimi e minimi assoluti e
relativi di una funzione sarà sufficiente esaminare i punti di frontiera, i punti di non
derivabilità e i punti critici.
Rolle

Teorema 5.14 (Rolle). Sia 𝑓 : [𝑎, 𝑏] → ℝ una funzione continua su tutto [𝑎, 𝑏] e derivabile
su (𝑎, 𝑏). Se 𝑓 (𝑎) = 𝑓 (𝑏) allora esiste 𝑥 0 ∈ (𝑎, 𝑏) tale che 𝑓 ′(𝑥 0 ) = 0.

Dimostrazione. Essendo 𝑓 una funzione continua possiamo applicare il teorema di


Weiestrass per dedurre che 𝑓 ha massimo e minimo sull’intervallo chiuso e limitato
[𝑎, 𝑏]. Se il punto di massimo o il punto di minimo sta nell’intervallo aperto (𝑎, 𝑏)
possiamo applicare il teorema di Fermat per ottenere che la derivata di 𝑓 si annulla in
tale punto.

In caso contrario sia il punto di massimo che il punto di minimo sono estremi
dell’intervallo, cioè sono uguali ad 𝑎 o a 𝑏 . Ma visto che 𝑓 (𝑎) = 𝑓 (𝑏) i valori massimo
e minimo coincidono e quindi la funzione è costante. Ma in tal caso 𝑓 ′(𝑥) = 0 per ogni
𝑥 ∈ [𝑎, 𝑏].
Lagrange
188 5 calcolo differenziale

Teorema 5.15 (Lagrange). Sia 𝑓 : [𝑎, 𝑏] → ℝ una funzione continua su [𝑎, 𝑏] e derivabile
su (𝑎, 𝑏). Allora esiste un punto 𝑥 0 ∈ (𝑎, 𝑏) tale che

𝑓 (𝑏) − 𝑓 (𝑎)
𝑓 ′(𝑥0 ) =
𝑏−𝑎

Dimostrazione. Consideriamo la funzione ausiliaria:

𝑓 (𝑏) − 𝑓 (𝑎)
𝑔(𝑥) = 𝑓 (𝑥) − 𝑥.
𝑏−𝑎
Per verifica diretta si osserva che

𝑏 𝑓 (𝑎) − 𝑎 𝑓 (𝑏)
𝑔(𝑏) = 𝑔(𝑎) = .
𝑏−𝑎
La funzione 𝑔 soddisfa quindi le ipotesi del teorema di Rolle e dunque esisterà
𝑥0 ∈ (𝑎, 𝑏) tale che 𝑔 ′(𝑥 0 ) = 0. Ma si osserva che

𝑓 (𝑏) − 𝑓 (𝑎)
𝑔 ′(𝑥) = 𝑓 ′(𝑥) −
𝑏−𝑎
e dunque se 𝑔 ′(𝑥 0 ) = 0 si ottiene il risultato desiderato.
criteri di monotonia
Teorema 5.16 (criteri di monotonia). Sia 𝑓 : 𝐼 → ℝ una funzione definita su un intervallo
𝐼 ⊆ ℝ. Sia 𝐽 = (inf 𝐼, sup 𝐼) l’intervallo aperto con gli stessi estremi di 𝐼 . Supponiamo che 𝑓
sia continua su 𝐼 e derivabile su 𝐽 . Allora valgono i seguenti criteri:

1. (∀𝑥 ∈ 𝐽: 𝑓 ′(𝑥) ≥ 0) ⇐⇒ 𝑓 è crescente (su tutto 𝐼 );


2. (∀𝑥 ∈ 𝐽: 𝑓 ′(𝑥) ≤ 0) ⇐⇒ 𝑓 è decrescente (su tutto 𝐼 );
3. (∀𝑥 ∈ 𝐽: 𝑓 ′(𝑥) = 0) ⇐⇒ 𝑓 è costante (su tutto 𝐼 );
4. (∀𝑥 ∈ 𝐽: 𝑓 ′(𝑥) > 0) =⇒ 𝑓 è strettamente crescente (su tutto 𝐼 );
5. (∀𝑥 ∈ 𝐽: 𝑓 ′(𝑥) < 0) =⇒ 𝑓 è strettamente decrescente (su tutto 𝐼 ).

Dimostrazione. Dimostriamo innanzitutto le implicazioni da sinistra verso destra.

Per la prima, se 𝑓 non fosse crescente ci dovrebbero essere due punti 𝑎, 𝑏 ∈ 𝐼 tali che
𝑎 < 𝑏 ma 𝑓 (𝑎) > 𝑓 (𝑏). Dunque si avrebbe

𝑓 (𝑏) − 𝑓 (𝑎)
< 0.
𝑏−𝑎
Applicando il teorema di Lagrange all’intervallo [𝑎, 𝑏] si troverebbe un punto 𝑥 ∈ (𝑎, 𝑏)
tale che 𝑓 ′(𝑥) < 0. Chiaramente (𝑎, 𝑏) ⊆ 𝐽 e quindi questo contraddice l’ipotesi
𝑓 ′(𝑥) ≥ 0.

La seconda implicazione (per le funzioni decrescenti) si dimostra in maniera analoga


cambiando verso alle disuguaglianze.

Anche la terza implicazione si dimostra tramite il teorema di Lagrange in modo


analogo alle precedenti. Oppure basta osservare che se 𝑓 ′(𝑥) = 0 allora valgono
contemporaneamente 𝑓 ′(𝑥) ≥ 0 e 𝑓 ′(𝑥) ≤ 0 quindi mettendo insieme le prime due
implicazioni si ottiene che 𝑓 è contemporaneamente crescente e decrescente dunque è
costante.
5.4 criteri di monotonia 189

Per la quarta implicazione si procede come per la prima. Per assurdo si avrebbero
𝑎 < 𝑏 con 𝑓 (𝑏) ≤ 𝑓 (𝑎). Ma allora

𝑓 (𝑏) − 𝑓 (𝑎)
≤0
𝑏−𝑎
e applicando il teorema di Lagrange si troverebbe un punto 𝑥 ∈ (𝑎, 𝑏) con 𝑓 ′(𝑥) ≤ 0,
contro l’ipotesi 𝑓 ′(𝑥) > 0.
La quinta implicazione si dimostra in maniera analoga cambiando verso alle disugua-
glianze.
Vediamo ora le implicazioni da destra verso sinistra. Per la prima, supponiamo
che 𝑓 sia crescente e prendiamo 𝑥 ∈ 𝐽 . Allora è chiaro che per ogni ℎ > 0 si avrà
𝑓 (𝑥 + ℎ) ≥ 𝑓 (𝑥) e dunque
𝑓 (𝑥 + ℎ) − 𝑓 (𝑥)
≥ 0.

Facendo il limite per ℎ → 0+ si ottiene 𝑓 ′(𝑥) e, per la permanenza del segno, dovra
essere 𝑓 ′(𝑥) ≥ 0.
In maniera analoga (invertendo le disuguaglianze) si dimostra la seconda implicazione.
La terza discende dalle prime due oppure, più semplicemente, dalle regole di
derivazione, in quanto la derivata di una costante è zero.

Esempio 5.17. La funzione 𝑓 (𝑥) = 1/𝑥 è definita su ℝ \{0}, è derivabile e la derivata 𝑓 ′(𝑥) =
−1/𝑥 2 è ovunque negativa. La funzione 𝑓 è quindi strettamente decrescente separatamente
sui due intervalli (0 , +∞) e (−∞, 0) sui quali possiamo applicare il criterio di monotonia. Ma
non è decrescente su tutto il suo dominio in quanto, ad esempio, 𝑓 (−1) = −1 < 1 = 𝑓 (1).
Questo esempio mostra che nei criteri di monotonia l’ipotesi che il dominio sia un intervallo è
fondamentale.

Esercizio 5.18. Determinare base e altezza di una lattina cilindrica di volume 33 𝑐𝑙 che a
parità di volume ha la minima superficie totale.

Svolgimento. Sia 𝑉 il volume, 𝑆 l’area della superficie totale, ℎ l’altezza e 𝑟 il raggio di


base del cilindro. Sappiamo che

𝑉 = 𝜋ℎ𝑟 2 𝑆 = 2𝜋𝑟 ℎ + 2𝜋𝑟 2 .

Ricavando ℎ dalla prima equazione e sostituendo nella seconda otteniamo

𝑉 2𝑉
𝑆 = 2𝜋𝑟 + 2𝜋𝑟 2 = + 2𝜋𝑟 2 .
𝜋𝑟 2 𝑟
La funzione 𝑆(𝑟) è definita e continua su (0 , +∞) e si ha 𝑆(𝑟) → +∞ per 𝑟 → 0+ e anche
per 𝑟 → +∞. Dunque 𝑆 ammette minimo per il teorema di Weierstrass generalizzato.
Per trovare il minimo basterà calcolare la derivata

𝑑𝑆 2𝑉 4𝜋𝑟 3 − 2𝑉
= − 2 + 4𝜋𝑟 =
𝑑𝑟 𝑟 𝑟2
e trovare i punti critici
4𝜋𝑟 3 = 2𝑉
190 5 calcolo differenziale

da cui
r
𝑉
3
𝑟= ≈ 3.74 𝑐𝑚
2𝜋
𝑉
ℎ= ≈ 7.49𝑐𝑚.
𝜋𝑟 2

Esercizio 5.19. Risolvere l’equazione

𝑒 𝑥 = 𝑥3 . (5.2)

Svolgimento. Il lato sinistro dell’equazione è un numero positivo e quindi certamente


possiamo supporre che sia 𝑥 > 0 altrimenti il lato destro non sarebbe anch’esso positivo.
Possiamo quindi prendere il logaritmo di ambo i membri e ottenere l’equazione

𝑥 = 3 ln 𝑥

che è equivalente all’equazione data.

Consideriamo allora la funzione

𝑓 (𝑥) = 𝑥 − 3 ln 𝑥

cosicché le soluzioni cercate risultano essere gli zeri di 𝑓 . Si ha

3
𝑓 ′(𝑥) = 1 −
Il simbolo ≷ serve per indicare che que- 𝑥
sta diseguazione e le seguenti possono
essere scritte sia con il segno > che con e possiamo quindi affermare che 𝑓 ′(𝑥) ≷ 0 se e solo se
il segno < pur di prendere in tutte lo
stesso segno. 3
1≷
𝑥
ovvero (ricordiamo che stiamo supponendo 𝑥 > 0)

𝑥 ≷ 3.

Cioè: se 𝑥 > 3 si ha 𝑓 ′(𝑥) > 0 e di conseguenza (teorema 5.16) 𝑓 è strettamente crescente


se ristretta all’intervallo [3 , +∞), se invece 𝑥 < 3 si ha 𝑓 ′(𝑥) < 0 e di conseguenza 𝑓 è
strettamente decrescente se ristretta all’intervallo (0 , 3]. Per capire se la funzione 𝑓 si
annulla in qualche punto dobbiamo ora valutare 𝑓 negli estremi degli intervalli su cui
risulta monotona. Si ha

lim 𝑓 (𝑥) = +∞, 𝑓 (3) = 3(1 − ln 3) < 0 , lim 𝑓 (𝑥) = +∞.


𝑥→0+ 𝑥→+∞

Osserviamo quindi che agli estremi degli intervalli (0 , 3] e [3 , +∞) la funzione assume
segni opposti e quindi, per il teorema degli zeri (teorema 2.79), deve annullarsi almeno
una volta in ognuno dei due intervalli. D’altra parte su ognuno dei due intervalli la
funzione è strettamente monotona e quindi iniettiva, dunque non può annullarsi più
di una volta. Deduciamo quindi che la funzione 𝑓 si annulla in esattamente due punti
5.4 criteri di monotonia 191

𝑥1 , 𝑥2 con
0 < 𝑥1 < 3 < 𝑥2 .

I punti 𝑥 1 e 𝑥 2 sono quindi univocamente determinati e possono essere calcolati, con


un errore piccolo a piacere, utilizzando il metodo di bisezione, come abbiamo visto
nella dimostrazione del teorema degli zeri.

Esempio 5.20. Si consideri la funzione

1
𝑓 (𝑥) = arctg 𝑥 + arctg .
𝑥
Si ha
1 1 −1 1 1
𝑓 ′(𝑥) = + = − 2 = 0.
1+𝑥 2
1 + 𝑥2 𝑥
1 2 1+𝑥 2 𝑥 +1

Osserviamo che la funzione 𝑓 è definita su ℝ \ {0} che non è un intervallo ma è unione di


due intervalli disgiunti: (−∞, 0) ∪ (0 , +∞). Possiamo allora applicare i criteri di monotonia
separatamente ai due intervalli ottenendo che 𝑓 (𝑥) è costante su ognuno dei due intervalli.
Dunque esisteranno 𝑐 1 e 𝑐 2 tali che
(
𝑐1 se 𝑥 > 0,
𝑓 (𝑥) =
𝑐2 se 𝑥 < 0.

Possiamo determinare facilmente 𝑐 1 e 𝑐 2 osservando che


𝜋
𝑐 1 = 𝑓 (1) = arctg 1 + arctg 1 =
2
𝜋
𝑐 2 = 𝑓 (−1) = arctg(−1) + arctg(−1) = − .
2

In effetti la funzione 𝑓 pur avendo derivata nulla non è costante ma solo localmente
costante.

Esempio 5.21. Consideriamo la funzione 𝑓 (𝑥) = 𝑥 3 la cui derivata è 𝑓 ′(𝑥) = 3 𝑥 2 . Per


ogni 𝑥 ∈ ℝ si ha 𝑓 ′(𝑥) ≥ 0 dunque possiamo dedurre che 𝑓 è crescente. Scelto invece
𝐼 = [0 , +∞) l’intervallo aperto corrispondente è 𝐽 = (0, +∞). Osserviamo che su 𝐽 si ha
𝑓 ′(𝑥) > 0 quindi possiamo concludere che 𝑓 è strettamente crescente su tutto 𝐼 . Lo stesso vale
per l’intervallo (−∞, 0]. Mettendo insieme le due cose possiamo concludere che 𝑓 (𝑥) = 𝑥 3
è strettamente crescente su tutto ℝ nonostante che sia 𝑓 ′(0) = 0. Questo mostra che una
funzione strettamente monotona può avere derivata nulla in un punto.

Più in generale è facile osservare che se 𝑓 è monotona ma non strettamente monotona


significa che ci sono due punti 𝑎 e 𝑏 per cui 𝑓 (𝑎) = 𝑓 (𝑏). Ma se 𝑓 è monotona
allora per ogni 𝑥 ∈ [𝑎, 𝑏] si deve avere 𝑓 (𝑥) = 𝑓 (𝑎) = 𝑓 (𝑏) (ad esempio: se 𝑓 è
crescente si dovrebbe avere 𝑓 (𝑎) ≤ 𝑓 (𝑥) ≤ 𝑓 (𝑏) ma se 𝑓 (𝑎) = 𝑓 (𝑏) necessariamente
𝑓 (𝑥) = 𝑓 (𝑎) = 𝑓 (𝑏)). Dunque 𝑓 risulterebbe essere costante su [𝑎, 𝑏] e in particolare
avremmo una infinità più che numerabile di punti in cui la derivata si annulla. Questo
significa che se 𝑓 ′(𝑥) ≥ 0 su un intervallo e se 𝑓 ′(𝑥) = 0 su un numero finito o anche
numerabile di punti o, ancora, su un insieme di punti con parte interna vuota, allora
comunque 𝑓 è strettamente crescente. Ragionamento analogo vale naturalmente anche
per le funzioni decrescenti.
192 5 calcolo differenziale

Esercizio 5.22. Dimostrare che

𝑥2
cos 𝑥 ≥ 1 − ∀𝑥 ∈ ℝ.
2

Esercizio 5.23. Si consideri la funzione 𝑓 : ℝ → ℝ definita da

𝑓 (𝑥) = 2 𝑒 𝑥−1 − 𝑥 2 .

Si mostri che 𝑓 è bigettiva e che la funzione inversa 𝑓 −1 : ℝ → ℝ è derivabile in tutti i punti


tranne il punto 1 dove ha un flesso verticale. Si calcoli ( 𝑓 −1 )′(2/𝑒).

Svolgimento. Risulta

𝑓 ′(𝑥) = 2 𝑒 𝑥−1 − 2𝑥, 𝑓 ′′(𝑥) = 2𝑒 𝑥−1 − 2.

Dunque 𝑓 ′′(𝑥) > 0 per 𝑥 > 1 e 𝑓 ′′(𝑥) < 0 per 𝑥 < 1. Dunque per i criteri di monotonia
𝑓 ′ è strettamente crescente su [1 , +∞) e strettamente decrescente su (−∞, 1]. Visto
che 𝑓 ′(1) = 0 risulta quindi che 𝑓 ′(𝑥) ≥ 0 per ogni 𝑥 ∈ ℝ e 𝑓 ′(𝑥) = 0 solo per 𝑥 = 1.
Dunque 𝑓 è crescente per il criterio di monotonia ma anche strettamente crescente
perché se fosse crescente ma non strettamente ci dovrebbe essere un intero intervallo
in cui 𝑓 ′ si annulla. Dunque 𝑓 è iniettiva. Visto che 𝑓 (𝑥) → ±∞ per 𝑥 → ±∞ si ha
sup 𝑓 (ℝ) = +∞, inf 𝑓 (ℝ) = −∞ e per il teorema dei valori intermedi otteniamo che
𝑓 (ℝ) = ℝ. Dunque 𝑓 è anche suriettiva ed è quindi invertibile.

La funzione inversa di 𝑓 è anch’essa monotona, è quindi continua per il Teorema 2.8


ed è derivabile nei punti corrispondenti ai punti in cui 𝑓 ha derivata non nulla. L’unico
punto in cui 𝑓 ha derivata nulla è 𝑥 = 1 e visto che 𝑓 (1) = 1 risulta che 𝑓 −1 (𝑦) è
derivabile per ogni 𝑦 ≠ 1 e vale

1 1
( 𝑓 −1 )′( 𝑓 (𝑥)) = = .
𝑓 ′(𝑥) 2 𝑒 𝑥−1 − 2𝑥

Osservando che 𝑓 (0) = 2/𝑒 si trova quindi

1 𝑒
( 𝑓 −1 )′(1/𝑒) = = .
2/𝑒 2

Teorema 5.24 (proprietà di Darboux). Sia 𝑓 : 𝐼 → ℝ una funzione derivabile su un


intervallo 𝐼 ⊆ ℝ. Allora la derivata soddisfa la proprietà dei valori intermedi: se 𝑎, 𝑏 ∈ 𝐼 ,
𝑎 < 𝑏 e se 𝑚 è un valore intermedio tra 𝑓 ′(𝑎) e 𝑓 ′(𝑏) (cioè 𝑓 ′(𝑎) < 𝑚 < 𝑓 ′(𝑏) o 𝑓 ′(𝑏) <
𝑚 < 𝑓 ′(𝑎)) allora esiste 𝑥 ∈ (𝑎, 𝑏) tale che 𝑓 ′(𝑥) = 𝑚 .

Dimostrazione. Dati 𝑥, 𝑦 ∈ [𝑎, 𝑏], 𝑥 ≠ 𝑦 , possiamo considerare il rapporto incrementale:

𝑓 (𝑦) − 𝑓 (𝑥)
𝑅(𝑥, 𝑦) = .
𝑦−𝑥

Fissato 𝑥 = 𝑎 la funzione 𝑦 ↦→ 𝑅(𝑎, 𝑦) è continua e tende a 𝑓 ′(𝑎) quando 𝑦 tende ad 𝑎 .


Dunque, per il teorema 2.79 dei valori intermedi, tale funzione assume tutti i valori
5.4 criteri di monotonia 193

Figura 5.2: Il grafico di una funzione


0.2 derivabile ma con derivata non continua
(vedi esempio 5.25). L’ingrandimento
nel disegno in basso rende evidente il
0.1
fatto che la derivata oscilla tra i valori
−1 e 1 in ogni intorno di 0. La proprietà
-0.6 -0.5 -0.4 -0.3 -0.2 -0.1 0.1 0.2 0.3 0.4 0.5 0.6 0.7 di Darboux (teorema 5.24) rimane
comunque soddisfatta: la derivata
-0.1
assume tutti i valori compresi tra 1 e
−1 in ogni intorno di 𝑥 = 0 ma non ha
limite per 𝑥 → 0.
-0.2

0.0031 0.0032 0.0033 0.0034 0.0035 0.0036 0.0037 0.0038 0.0039 0.004 0.0041 0.0042 0.0043 0.0044 0.0045 0.0046 0.0047 0.0048 0.0049 0.005 0.0051 0.0052 0.0053 0.0054 0.0055

(interagisci)

compresi tra 𝑓 ′(𝑎) e 𝑅(𝑎, 𝑏). Analogamente fissato 𝑦 = 𝑏 la funzione 𝑥 ↦→ 𝑅(𝑥, 𝑏)


è continua e tende a 𝑓 ′(𝑏) quando 𝑥 tende a 𝑏 . Dunque tale funzione assume tutti
i valori intermedi tra 𝑅(𝑎, 𝑏) e 𝑓 ′(𝑏). Dunque esistono 𝑥, 𝑦 tali che 𝑅(𝑥, 𝑦) = 𝑚
e, per il teorema 5.15 di Lagrange esisterà un punto intermedio 𝑡 ∈ (𝑥, 𝑦) in cui
𝑓 ′(𝑡) = 𝑅(𝑥, 𝑦) = 𝑚 .

Esempio 5.25 (funzione derivabile con derivata non continua). La funzione 𝑓 : ℝ → ℝ


definita da (
𝑥 2 sin(1/𝑥) se 𝑥 ≠ 0
𝑓 (𝑥) =
0 se 𝑥 = 0.

è derivabile su tutto ℝ, 𝑓 ′(0) = 0 ma il limite

lim 𝑓 ′(𝑥)
𝑥→0

non esiste (e dunque 𝑓 ′ : ℝ → ℝ non è continua in 𝑥 = 0).

Dimostrazione. La funzione 𝑥 2 sin(1/𝑥) è derivabile infinite volte su tutto il suo dominio


ℝ \ {0} in quanto composizione di funzioni elementari derivabili infinite volte. Dunque,
per la località della derivata, anche la funzione 𝑓 è derivabile infinite volte su ℝ \ {0}.
Per 𝑥 ≠ 0 possiamo quindi calcolare 𝑓 ′(𝑥) utilizzando le regole di derivazione
   
1 1 1 −1 1 1
𝑓 ′(𝑥) = 𝐷 𝑥 2 sin = 2 𝑥 sin + 𝑥 2 cos · 2 = 2𝑥 sin − cos .
𝑥 𝑥 𝑥 𝑥 𝑥 𝑥

Verifichiamo ora che 𝑓 è continua e derivabile anche in 0. Si ha infatti

𝑓 (0 + ℎ) − 𝑓 (0) 1
lim = lim ℎ sin = 0
ℎ→0 ℎ ℎ→0 ℎ

e dunque 𝑓 ′(0) = 0. Osserviamo però che 𝑓 ′(𝑥) non ammette limite per 𝑥 → 0 in
quanto per 𝑥 → 0 si ha 2 𝑥 sin(1/𝑥) → 0 ma il limite di cos(1/𝑥) invece non esiste.
Dunque 𝑓 ′(𝑥) è la somma di una funzione che ha limite zero e di una funzione il cui
limite non esiste per 𝑥 → 0. Dunque 𝑓 ′(𝑥) non ammette limite per 𝑥 → 0.
194 5 calcolo differenziale

Proposizione 5.26 (criterio di derivabilità). Sia 𝐼 ⊆ ℝ un intervallo, 𝑥 0 ∈ 𝐼 𝑓 : 𝐼 → ℝ


una funzione continua su tutto 𝐼 e derivabile in 𝐼 \ {𝑥 0 }. Se il limite della derivata

lim 𝑓 ′(𝑥) = 𝑚
𝑥→𝑥 0

esiste ed è finito la funzione 𝑓 è derivabile anche in 𝑥 0 e vale 𝑓 ′(𝑥 0 ) = 𝑚 .

Dimostrazione. Prendiamo un generico punto 𝑥 > 𝑥 0 (il caso 𝑥 < 𝑥 0 è del tutto analogo).
Per il teorema di Lagrange sappiamo esistere un punto 𝑦 ∈ (𝑥 0 , 𝑥) tale che

𝑓 (𝑥) − 𝑓 (𝑥0 )
= 𝑓 ′(𝑦).
𝑥 − 𝑥0

Per 𝑥 → 𝑥 0 si ha certamente anche 𝑦 → 𝑥 0 e dunque esiste il limite del rapporto


incrementale:
𝑓 (𝑥) − 𝑓 (𝑥 0 )
𝑓 ′(𝑥0 ) = lim = lim 𝑓 ′(𝑦) = 𝑚.
𝑥→𝑥 0 𝑥 − 𝑥0 𝑦→𝑥0

La proposizione precedente dice che la derivata di una funzione in un punto non può
avere un valore diverso dal suo limite, se tale limite esiste. Esistono però funzioni
derivabili la cui derivata non è continua, come abbiamo visto nell’esempio 5.25 in
quanto il limite della derivata potrebbe non esistere.

5.5 convessità
funzione convessa
Definizione 5.27 (funzione convessa). Sia 𝐼 ⊆ ℝ un intervallo. Una funzione 𝑓 : 𝐼 → ℝ
si dice essere convessa se per ogni 𝑥, 𝑦 ∈ 𝐼 e per ogni 𝑡 ∈ [0 , 1] si ha

funzione concava
𝑓 ((1 − 𝑡)𝑥 + 𝑡 𝑦) ≤ (1 − 𝑡) 𝑓 (𝑥) + 𝑡 𝑓 (𝑦).

Analogamente diremo che 𝑓 è concava se vale la disuguaglianza inversa:

𝑓 ((1 − 𝑡)𝑥 + 𝑡 𝑦) ≥ (1 − 𝑡) 𝑓 (𝑥) + 𝑡 𝑓 (𝑦)

(o, equivalentemente, se − 𝑓 è convessa).

Osserviamo che la retta del piano passante per i punti (𝑥, 𝑓 (𝑥)) e (𝑦, 𝑓 (𝑦)) può essere
parametrizzata in maniera uniforme per 𝑡 ∈ ℝ da

(1 − 𝑡)(𝑥, 𝑓 (𝑥)) + 𝑡(𝑦, 𝑓 (𝑦)) = ((1 − 𝑡)𝑥 + 𝑡 𝑦, (1 − 𝑡) 𝑓 (𝑥) + 𝑡 𝑓 (𝑦)).

Chiaramente per 𝑡 = 0 si ottiene il punto (𝑥, 𝑓 (𝑥)) per 𝑡 = 1 il punto (𝑦, 𝑓 (𝑦)) e per
𝑡 ∈ [0, 1] il segmento congiungente tali punti. La condizione di convessità della
convesso funzione 𝑓 corrisponde quindi a richiedere che ogni corda (segmento) che unisce due
punti del grafico si trovi "al di sopra" del grafico della funzione.
5.5 convessità 195

Definizione 5.28 (insieme convesso). Un insieme 𝐸 ⊆ ℝ𝑛 si dice essere convesso se


dati due punti qualunque 𝑎, 𝑏 ∈ 𝐸 l’intero segmento [𝑎, 𝑏] = {(1 − 𝑡)𝑎 + 𝑡𝑏 : 𝑡 ∈ [0 , 1]} è
contenuto in 𝐸 .

Teorema 5.29 (epigrafico delle funzioni convesse). Sia 𝐼 ⊆ ℝ e 𝑓 : 𝐼 ⊆ ℝ → ℝ una


funzione. Allora sono equivalenti:

1. 𝐼 è un intervallo e 𝑓 è convessa;
2. l’epigrafico di 𝑓 (o sopragrafico) ovvero l’insieme epigrafico di 𝑓

𝐸 = (𝑥, 𝑦) ∈ ℝ2 : 𝑥 ∈ 𝐼, 𝑦 ≥ 𝑓 (𝑥)


è convesso.

Per le funzioni concave sarà il sottografico {(𝑥, 𝑦) : 𝑦 ≤ 𝑓 (𝑥)} ad essere convesso.

Dimostrazione. Supponiamo che 𝐼 sia un intervallo e 𝑓 sia convessa. Per dimostrare


che l’epigrafico 𝐸 è convesso consideriamo due punti 𝑎, 𝑏 ∈ 𝐸 e un qualunque punto 𝑝
sul segmento [𝑎, 𝑏]. Se 𝑎 = (𝑥 𝑎 , 𝑦 𝑎 ), 𝑏 = (𝑥 𝑏 , 𝑦𝑏 ), 𝑝 = (𝑥 𝑝 , 𝑦 𝑝 ) allora esiste un 𝑡 ∈ [0 , 1]
tale che 𝑥 𝑝 = (1 − 𝑡)𝑥 𝑎 + 𝑡𝑥 𝑏 e 𝑦 𝑝 = (1 − 𝑡)𝑦 𝑎 + 𝑡 𝑦𝑏 . Visto che 𝑎, 𝑏 ∈ 𝐸 sappiamo che
𝑦 𝑎 ≥ 𝑓 (𝑥 𝑎 ) e 𝑦𝑏 ≥ 𝑓 (𝑥 𝑏 ). Dunque necessariamente si ha

𝑦 𝑝 ≥ (1 − 𝑡) 𝑓 (𝑥 𝑎 ) + 𝑡 𝑓 (𝑦𝑏 ).

Ma essendo 𝑓 convessa si ha:

(1 − 𝑡) 𝑓 (𝑥 𝑎 ) + 𝑡 𝑓 (𝑦𝑏 ) ≥ 𝑓 ((1 − 𝑡)𝑥 𝑎 + 𝑡𝑥 𝑏 ) = 𝑓 (𝑥 𝑝 ).

Dunque 𝑦 𝑝 ≥ 𝑓 (𝑥 𝑝 ) che significa 𝑝 ∈ 𝐸 .

Viceversa supponiamo di sapere che 𝐸 è convesso. Siano 𝑥, 𝑦 ∈ 𝐼 punti qualunque.


Allora i punti 𝑎 = (𝑥, 𝑓 (𝑥)) e 𝑏 = (𝑦, 𝑓 (𝑦)) sono certamente punti di 𝐸 e quindi l’intero
segmento [𝑎, 𝑏] deve essere contenuto in 𝐸 . Dunque per ogni 𝑡 ∈ [0 , 1] il punto
𝑝 = ((1 − 𝑡)𝑥 + 𝑡 𝑦, (1 − 𝑡) 𝑓 (𝑥) + 𝑡 𝑓 (𝑦)) deve stare in 𝐸. In primo luogo deve quindi
essere (1 − 𝑡)𝑥 + 𝑡 𝑦 ∈ 𝐼 e se questo è vero per ogni 𝑡 ∈ [0 , 1] significa che 𝐼 è un
intervallo. In secondo luogo se 𝑝 ∈ 𝐸 significa che

(1 − 𝑡) 𝑓 (𝑥) + 𝑡 𝑓 (𝑦) ≥ 𝑓 ((1 − 𝑡)𝑥 + 𝑡 𝑦)

che corrisponde alla definizione di funzione convessa.

Lemma 5.30 (rapporto incrementale di una funzione convessa). Sia 𝐼 un intervallo di ℝ


e sia 𝑓 : 𝐼 → ℝ. Dati 𝑥, 𝑦 ∈ 𝐼 con 𝑥 ≠ 𝑦 definiamo il rapporto!incrementale di 𝑓 come:

𝑓 (𝑦) − 𝑓 (𝑥)
𝑅(𝑥, 𝑦) = .
𝑦−𝑥

Allora sono condizioni equivalenti:

1. 𝑓 è convessa;
2. per ogni 𝑥, 𝑦, 𝑧 ∈ 𝐼 se 𝑥 < 𝑦 < 𝑧 si ha 𝑅(𝑥, 𝑦) ≤ 𝑅(𝑦, 𝑧);
3. per ogni 𝑥, 𝑦, 𝑧 ∈ 𝐼 se 𝑥 < 𝑦 < 𝑧 si ha 𝑅(𝑥, 𝑦) ≤ 𝑅(𝑥, 𝑧);
4. per ogni 𝑥, 𝑦, 𝑧 ∈ 𝐼 se 𝑥 < 𝑦 < 𝑧 si ha 𝑅(𝑥, 𝑧) ≤ 𝑅(𝑦, 𝑧);
196 5 calcolo differenziale

5. la funzione 𝑅(𝑥, 𝑦) è crescente in ognuna delle due variabili.

Dimostrazione. Attenzione: il lemma risulta ovvio se si utilizza la giusta interpretazione


geometrica (il rapporto incrementale è la pendenza della corda corrispondente). Quella
che segue è la traduzione algebrica di quanto è geometricamente ovvio ma risulta
inevitabilmente pesante e più difficilmente comprensibile.

Siano 𝑥, 𝑦, 𝑧 ∈ 𝐼 con 𝑥 < 𝑦 < 𝑧 . Posto 𝑡 = (𝑦 − 𝑥)/(𝑧 − 𝑥) si ha 𝑦 = (1 − 𝑡)𝑥 + 𝑡𝑧 ,


𝑦 − 𝑥 = 𝑡(𝑧 − 𝑥), 𝑧 − 𝑦 = (1 − 𝑡)(𝑧 − 𝑥). Si ha allora

𝑓 (𝑧) − 𝑓 (𝑥) 𝑓 (𝑦) − 𝑓 (𝑥)


𝑅(𝑥, 𝑧) − 𝑅(𝑥, 𝑦) = −
𝑧−𝑥 𝑦−𝑥
𝑓 (𝑧) − 𝑓 (𝑥) 𝑓 (𝑦) − 𝑓 (𝑥)
=𝑡 −
𝑦−𝑥 𝑦−𝑥
𝑡 𝑓 (𝑧) + (1 − 𝑡) 𝑓 (𝑥) − 𝑓 (𝑦)
=
𝑦−𝑥

La condizione di convessità di 𝑓 è

𝑓 (𝑦) ≤ (1 − 𝑡) 𝑓 (𝑥) + 𝑡 𝑓 (𝑧)

ed è quindi equivalente alla condizione 𝑅(𝑥, 𝑦) ≤ 𝑅(𝑥, 𝑧). Dunque le condizioni 1 e 3


sono equivalenti.

Ma con una verifica diretta si osserva che

𝑅(𝑥, 𝑧) = 𝑡𝑅(𝑥, 𝑦) + (1 − 𝑡)𝑅(𝑦, 𝑧)

da cui si ottiene
𝑅(𝑦, 𝑧) − 𝑅(𝑥, 𝑧) = 𝑡[𝑅(𝑦, 𝑧) − 𝑅(𝑥, 𝑦)]
oppure anche
𝑅(𝑥, 𝑧) − 𝑅(𝑥, 𝑦) = (1 − 𝑡)[𝑅(𝑦, 𝑧) − 𝑅(𝑥, 𝑦)].
Risulta quindi che le quantità

𝑅(𝑦, 𝑧) − 𝑅(𝑥, 𝑦), 𝑅(𝑥, 𝑧) − 𝑅(𝑥, 𝑦), 𝑅(𝑦, 𝑧) − 𝑅(𝑥, 𝑧)

hanno tutte lo stesso segno. E quindi le condizioni 2, 3 e 4 sono tra loro equivalenti (se
vale una delle tre valgono tutte e tre).

Se valgono le tre condizioni 2, 3 e 4 è facile verificare che la funzione 𝑅(𝑥, 𝑦) è crescente


in entrambe le variabili. Innanzitutto per simmetria, visto che 𝑅(𝑥, 𝑦) = 𝑅(𝑦, 𝑥),
è sufficiente verificare che 𝑅(𝑥, 𝑦) è crescente nella seconda variabile 𝑦 per ogni 𝑥
fissato. Quindi dato 𝑧 > 𝑦 bisogna mostrare che 𝑅(𝑥, 𝑧) ≥ 𝑅(𝑥, 𝑦). Abbiamo allora
tre possibilità a seconda che sia 𝑥 < 𝑦 oppure 𝑦 < 𝑥 < 𝑧 oppure 𝑧 < 𝑥 . Nel primo
caso si ha 𝑥 < 𝑦 < 𝑧 e dunque la disuguaglianza 𝑅(𝑥, 𝑦) ≤ 𝑅(𝑥, 𝑧) corrisponde alla
condizione 3. Nel secondo caso si ha 𝑦 < 𝑥 < 𝑧 e la condizione 𝑅(𝑥, 𝑦) ≤ 𝑅(𝑥, 𝑧) si
può scrivere come 𝑅(𝑦, 𝑥) ≤ 𝑅(𝑥, 𝑧) che è, riordinando opportunamente le variabili,
la condizione 2. Se, infine, 𝑦 < 𝑧 < 𝑥 la condizione 𝑅(𝑥, 𝑦) ≤ 𝑅(𝑥, 𝑧) si può scrivere
𝑅(𝑦, 𝑥) ≤ 𝑅(𝑧, 𝑥) che, riordinando le variabili, è la condizione 4.
5.5 convessità 197

Viceversa (e infine) se la funzione 𝑅(𝑥, 𝑦) è crescente in entrambe le variabili in


particolare è crescente nella seconda variabile e quindi se 𝑥 < 𝑦 < 𝑧 si ha 𝑅(𝑥, 𝑦) ≤
𝑅(𝑥, 𝑧). Risulta quindi che la condizione 5 implica la 3 e quindi tutte le altre condizioni.

Teorema 5.31. Sia 𝐼 ⊆ ℝ un intervallo e 𝑓 : 𝐼 → ℝ una funzione derivabile su tutto 𝐼 .


Allora sono equivalenti:

1. 𝑓 è convessa;
2. per ogni 𝑥 0 ∈ 𝐼 e per ogni 𝑥 ∈ 𝐼 si ha

𝑓 (𝑥) ≥ 𝑓 ′(𝑥 0 )(𝑥 − 𝑥0 ) + 𝑓 (𝑥 0 )

(geometricamente: il grafico della funzione sta sopra la retta tangente);


3. 𝑓 ′ è crescente.

Analogamente per le funzioni concave si avrà che il grafico “sta sotto” la retta tangente e che
la derivata è decrescente.

Dimostrazione. Osserviamo che

𝑓 ′(𝑥0 ) = lim 𝑅(𝑥0 , 𝑥).


𝑥→𝑥 0

Se 𝑓 è convessa allora, per il lemma, il rapporto incrementale 𝑅(𝑥 0 , 𝑥) è crescente e


quindi 𝑓 ′(𝑥 0 ) = inf 𝑥>𝑥0 𝑅(𝑥 0 , 𝑥). In particolare 𝑓 ′(𝑥 0 ) ≤ 𝑅(𝑥 0 , 𝑥) per ogni 𝑥 > 𝑥 0 . In
maniera analoga si trova 𝑓 ′(𝑥 0 ) ≥ 𝑅(𝑥 0 , 𝑥) se 𝑥 < 𝑥 0 . In ogni caso risulta quindi che
per ogni 𝑥 si ha
(𝑅(𝑥0 , 𝑥) − 𝑓 ′(𝑥0 ))(𝑥 − 𝑥0 ) ≥ 0
ovvero
𝑓 (𝑥) − 𝑓 (𝑥0 ) − 𝑓 ′(𝑥0 )(𝑥 − 𝑥 0 ) ≥ 0.
Dunque la condizione 1 implica la 2.

Se vale la condizione 2, dati 𝑥, 𝑦 ∈ 𝐼 si ha

𝑓 (𝑥) − 𝑓 (𝑦) ≥ 𝑓 ′(𝑦)(𝑥 − 𝑦)

se scambiamo 𝑥 e 𝑦 e cambiamo di segno ambo i membri si ottiene invece

𝑓 (𝑥) − 𝑓 (𝑦) ≤ 𝑓 ′(𝑥)(𝑥 − 𝑦)

mettendo insieme le due disuguaglianze, se ora supponiamo che sia 𝑥 > 𝑦 otteniamo
proprio 𝑓 ′(𝑥) ≥ 𝑓 ′(𝑦) cioè 𝑓 ′ è crescente (condizione 3).

Supponiamo ora di sapere che 𝑓 ′ è crescente e supponiamo per assurdo che la funzione
𝑓 non sia convessa. In base al lemma precedente dovrebbero allora esistere tre punti
𝑥 < 𝑦 < 𝑧 tali che 𝑅(𝑥, 𝑦) > 𝑅(𝑦, 𝑧). Per il teorema di Lagrange dovrebbe allora
esistere un punto 𝑐 ∈ (𝑥, 𝑦) tale che 𝑓 ′(𝑐) = 𝑅(𝑥, 𝑦) e un punto 𝑑 ∈ (𝑦, 𝑧) tale che
𝑓 ′(𝑑) = 𝑅(𝑦, 𝑧) ma allora 𝑓 ′(𝑐) > 𝑓 ′(𝑑) nonostante sia 𝑐 < 𝑑 e dunque 𝑓 ′ non poteva
essere crescente.
198 5 calcolo differenziale

Corollario 5.32 (criterio di convessità tramite derivata seconda). Sia 𝐼 ⊆ ℝ un intervallo


e sia 𝑓 : 𝐼 → ℝ una funzione derivabile due volte (cioè 𝑓 è derivabile e anche 𝑓 ′ è derivabile).
Allora 𝑓 è convessa se e solo se 𝑓 ′′(𝑥) ≥ 0 per ogni 𝑥 ∈ 𝐼 . Analogamente 𝑓 è concava se e solo
se 𝑓 ′′ ≤ 0.

Dimostrazione. Per il criterio precedente 𝑓 è convessa se e solo se 𝑓 ′ è crescente. Per


il criterio di monotonia 𝑓 ′ è crescente se e solo se 𝑓 ′′ ≥ 0. Considerazioni analoghe
valgono per la concavità.

Teorema 5.33. Siano 𝑎 ∈ ℝ, 𝑏 ∈ ℝ̄, 𝑎 < 𝑏 . Sia 𝑓 : [𝑎, 𝑏) → ℝ una funzione convessa in
(𝑎, 𝑏) e continua in 𝑎 . Allora 𝑓 è convessa su tutto [𝑎, 𝑏). Risultato analogo vale per funzioni
definite su intervalli aperti a sinistra (𝑎, 𝑏] e aperti da ambo i lati (𝑎, 𝑏).

Dimostrazione. Dati 𝑥, 𝑦 ∈ [𝑎, 𝑏) dobbiamo mostrare che per ogni 𝑡 ∈ [0 , 1] vale

𝑓 ((1 − 𝑡)𝑥 + 𝑡 𝑦) ≤ (1 − 𝑡) 𝑓 (𝑥) + 𝑡 𝑓 (𝑦).

Per ipotesi sappiamo che la disuguaglianza è valida se 𝑥, 𝑦 ∈ (𝑎, 𝑏). Dobbiamo quindi
dimostrare la disuguaglianza solamente nel caso 𝑥 = 𝑎 e 𝑦 ∈ (𝑎, 𝑏). Dato qualunque
𝑡 ∈ (0, 1) e presa una successione 𝑥 𝑘 → 𝑎 con 𝑥 𝑘 ∈ (𝑎, 𝑏) definiamo 𝑡 𝑘 in modo che sia
𝑧 = (1 − 𝑡)𝑥 + 𝑡 𝑦 = (1 − 𝑡 𝑘 )𝑥 𝑘 + 𝑡 𝑘 𝑦 cioè:

𝑥 − 𝑥 𝑘 + 𝑡(𝑦 − 𝑥)
𝑡𝑘 = .
𝑦 − 𝑥𝑘

Siccome 𝑡 𝑘 → 𝑡 per 𝑘 → +∞ se 𝑡 ∈ (0 , 1) per 𝑘 abbastanza grande anche 𝑡 𝑘 ∈ (0 , 1).


Inoltre per la convessità in (𝑎, 𝑏) sappiamo che vale

𝑓 ((1 − 𝑡 𝑘 )𝑥 𝑘 + 𝑡 𝑘 𝑦) ≤ (1 − 𝑡 𝑘 ) 𝑓 (𝑥 𝑘 ) + 𝑡 𝑘 𝑓 (𝑦)

e passando a limite per 𝑘 → +∞, dalla continuità di 𝑓 in 𝑥 si ottiene

𝑓 ((1 − 𝑡)𝑥 + 𝑡 𝑦) ≤ (1 − 𝑡) 𝑓 (𝑥) + 𝑡 𝑓 (𝑦)

come volevamo dimostrare. Per 𝑡 = 0 e 𝑡 = 1 la disuguaglianza è sempre banalmente


verificata.


Esempio 5.34. La funzione 𝑓 (𝑥) = 𝑥 è definita su [0 , +∞) ma è derivabile solamente in
1 3
(0 , +∞). La sua derivata è 𝑓 ′(𝑥) = 𝑥 − 2 /2 e la derivata seconda è 𝑓 ′′(𝑥) = −𝑥 − 2 /4 < 0.
Dunque la funzione è concava sull’intervallo aperto (0 , +∞). Ma essendo continua possiamo
concludere che 𝑓 è concava su tutto il dominio [0 , +∞).

Teorema 5.35 (derivabilità delle funzioni convesse). Sia 𝐼 ⊆ ℝ un intervallo e sia


𝑓 : 𝐼 → ℝ una funzione convessa. Se 𝑥0 ∈ (inf 𝐼, sup 𝐼) esistono e sono finite la derivata
destra e sinistra di 𝑓 in 𝑥 0 :

𝑓 (𝑥) − 𝑓 (𝑥0 )
𝑓+′ (𝑥0 ) = lim+
𝑥→𝑥 0 𝑥 − 𝑥0
𝑓 (𝑥) − 𝑓 (𝑥0 )
𝑓−′ (𝑥0 ) = lim−
𝑥→𝑥 0 𝑥 − 𝑥0
5.5 convessità 199

e risulta
𝑓−′ (𝑥0 ) ≤ 𝑓+′ (𝑥 0 ).
Inoltre se inf 𝐼 < 𝑥 1 < 𝑥 2 < sup 𝐼 si ha

𝑓+′ (𝑥1 ) ≤ 𝑓(′ 𝑥2 ).

Se ne deduce che 𝑓 è continua in tutti i punti interni di 𝐼 e che l’insieme dei punti in cui 𝑓
non è derivabile è al più numerabile.

Dimostrazione. Nel lemma 5.30 abbiamo osservato che il rapporto incrementale

𝑓 (𝑥) − 𝑓 (𝑥0 )
𝑅(𝑥0 , 𝑥) =
𝑥 − 𝑥0

di una funzione convessa è crescente rispetto alla variabile 𝑥 . Dunque per il teorema 2.25
si ha
𝑓−′ (𝑥0 ) = sup 𝑅(𝑥0 , 𝑥) > −∞, 𝑓+′ (𝑥0 ) = inf 𝑅(𝑥 0 , 𝑥) < +∞
𝑥<𝑥 0 𝑥>𝑥0

e visto che se 𝑥 < 𝑥 0 e 𝑦 > 𝑥 0 si ha 𝑅(𝑥 0 , 𝑥) ≤ 𝑅(𝑥 0 , 𝑦) deduciamo che 𝑓−′ (𝑥 0 ) ≤ 𝑓+′ (𝑥 0 )
ed entrambi i limiti sono dunque finiti. Se 𝑥 1 < 𝑥 2 allora preso un qualunque punto 𝑥
con 𝑥 1 < 𝑥 < 𝑥 2 si ha (sempre per il lemma 5.30)

𝑅(𝑥1 , 𝑥) ≤ 𝑅(𝑥, 𝑥2 )

e dunque passando al limite si trova 𝑓+′ (𝑥 1 ) ≤ 𝑓−′ (𝑥 2 ). Le derivate destra e sinistra


esistono dunque in tutti i punti interni all’intervallo 𝐼 . In particolare 𝑓 è continua in
tali punti in quanto è continua sia da destra che da sinistra. I punti di non derivabilità
di 𝑓 sono i punti in cui le derivate destra e sinistra differiscono. Ma ad ogni punto 𝑥 di
non differenziabilità posso associare l’intervallo aperto non vuoto 𝐼 𝑥 = ( 𝑓−′ (𝑥), 𝑓+′ (𝑥)) e
per le proprietà appena viste è chiaro che questi intervalli sono a due a due disgiunti
in quanto se 𝑥 1 < 𝑥 2 l’estremo destro di 𝐼 𝑥1 è minore o uguale all’estremo sinistro
di 𝐼 𝑥2 . Siccome ognuno di questi intervalli contiene almeno un numero razionale
concludiamo che il numero di punti di discontinuità non può essere maggiore della
cardinalità dei numeri razionali.

Teorema 5.36 (retta di supporto). Sia 𝐼 ⊆ ℝ un intervallo, 𝑓 : 𝐼 → ℝ una funzione


convessa e 𝑥 0 un punto interno ad 𝐼 . Allora esiste una funzione lineare affine

𝐿(𝑥) = 𝑚𝑥 + 𝑞

tale che 𝑓 (𝑥 0 ) = 𝐿(𝑥 0 ) e per ogni 𝑥 ∈ 𝐼 si abbia 𝑓 (𝑥) ≥ 𝐿(𝑥).

Dimostrazione. Basta scegliere qualunque 𝑚 ∈ [ 𝑓−′ (𝑥 0 ), 𝑓+′ (𝑥 0 )] e considerare la funzione


lineare affine 𝐿(𝑥) = 𝑚(𝑥 − 𝑥 0 ). Se 𝑥 > 𝑥 0 allora si ha 𝑅(𝑥 0 , 𝑥) ≥ 𝑚 e dunque
𝑓 (𝑥) − 𝑓 (𝑥0 ) ≥ 𝑚(𝑥 − 𝑥 0 ) = 𝐿(𝑥). Viceversa se 𝑥 < 𝑥0 si ha 𝑅(𝑥0 , 𝑥) ≤ 𝑚 da cui, di
nuovo, 𝑓 (𝑥) − 𝑓 (𝑥 0 ) ≥ 𝑚(𝑥 − 𝑥 0 ) = 𝐿(𝑥).

Il seguente teorema può essere enunciato anche per gli integrali come vedremo nel
teorema 6.21. La dimostrazione è sostanzialmente identica ed è valida anche per
funzioni convesse di più variabili.
200 5 calcolo differenziale

Teorema 5.37 (combinazioni baricentriche/disuguaglianza di Jensen). Se 𝑓 è una


funzione convessa definita su un intervallo 𝐼 , dati 𝑥 1 , . . . , 𝑥 𝑛 ∈ 𝐼 e 𝜆1 , . . . , 𝜆𝑛 ∈ ℝ tali che
P𝑛
𝜆 = 1 e 𝜆 𝑘 ≥ 0 per ogni 𝑘 = 1 , . . . , 𝑛 allora
𝑘=1 𝑘
!
𝑛
X 𝑛
X
𝑓 𝜆𝑘 𝑥 𝑘 ≤ 𝜆 𝑘 𝑓 (𝑥 𝑘 ).
𝑘=1 𝑘=1

Per le funzioni concave vale la disuguaglianza inversa.

Dimostrazione. Poniamo
𝑛
X
𝑥¯ = 𝜆𝑘 𝑥 𝑘 .
𝑘=1

Per il teorema 5.36 precedente sappiamo che esiste una retta 𝐿(𝑥) = 𝑚𝑥 + 𝑞 tale che
𝐿( 𝑥)
¯ = 𝑓 ( 𝑥)
¯ e 𝐿(𝑥) ≤ 𝑓 (𝑥) per ogni 𝑥 ∈ 𝐼 . Allora si ha
!
𝑛
X 𝑛
X 𝑛
X 𝑛
X
𝐿 𝜆𝑘 𝑥 𝑘 = 𝑚𝜆 𝑘 𝑥 𝑘 + 𝑞 𝜆𝑘 = 𝜆 𝑘 𝐿(𝑥 𝑘 ).
𝑘=1 𝑘=1 𝑘=1 𝑘=1

Dunque
𝑛
X 𝑛
X
𝑓 ( 𝑥)
¯ = 𝐿( 𝑥)
¯ = 𝜆 𝑘 𝐿(𝑥 𝑘 ) ≤ 𝜆 𝑘 𝑓 (𝑥 𝑘 ).
𝑘=1 𝑘=1

Esempio 5.38 (disuguaglianza tra media aritmetica e media geometrica). Osserviamo


che la funzione 𝑓 (𝑥) = ln 𝑥 è concava, infatti si ha 𝑓 ′′(𝑥) = −1/𝑥 2 < 0. Dunque, per il
teorema precedente, se 𝜆1 + · · · + 𝜆𝑛 = 1, 𝜆 𝑘 ≥ 0 si ha
!
𝑛
X 𝑛
X
ln 𝜆𝑘 𝑥 𝑘 ≥ 𝜆 𝑘 ln 𝑥 𝑘 .
𝑘=1 𝑘=1

Facendo l’esponenziale di ambo i membri si ottiene


𝑛 𝑛
𝜆
X Y
media aritmetica geometrica 𝜆𝑘 𝑥 𝑘 ≥ 𝑥𝑘 𝑘 .
𝑘=1 𝑘=1

Nel caso particolare 𝜆 𝑘 = 1/𝑛 si ottiene la disuguaglianza tra media aritmetica (AM per gli
anglofoni) e media geometrica (GM):

𝑥1 + · · · + 𝑥 𝑛 √
≥ 𝑛 𝑥1 · · · 𝑥 𝑛 .
𝑛

Esercizio 5.39 (subadditività delle funzioni concave). Sia 𝑓 : [0 , +∞) → ℝ una funzione
concava con 𝑓 (0) ≥ 0. Allora 𝑓 è subadditiva cioè:

𝑓 (𝑥 + 𝑦) ≤ 𝑓 (𝑥) + 𝑓 (𝑦), ∀𝑥, 𝑦 ≥ 0.


5.5 convessità 201

Dimostrazione. Se 𝑥 = 𝑦 = 0 la disuguaglianza è ovvia. Altrimenti 𝑥 + 𝑦 > 0 e si ha

𝑦 𝑥
 
𝑓 (𝑥) = 𝑓 ·0+ · (𝑥 + 𝑦)
𝑥+𝑦 𝑥+𝑦
𝑦 𝑥 𝑥
≥ 𝑓 (0) + 𝑓 (𝑥 + 𝑦) ≥ 𝑓 (𝑥 + 𝑦).
𝑥+𝑦 𝑥+𝑦 𝑥+𝑦

Scambiando 𝑥 con 𝑦 e sommando si ottiene:

𝑥 𝑦
𝑓 (𝑥) + 𝑓 (𝑦) ≥ 𝑓 (𝑥 + 𝑦) + 𝑓 (𝑥 + 𝑦) = 𝑓 (𝑥 + 𝑦).
𝑥+𝑦 𝑥+𝑦

Si osservi che sviluppando la disuguaglianza (𝑥 − 𝑦)2 ≥ 0 si ottiene:

𝑥2 + 𝑦2
𝑥𝑦 ≤ .
2
Questa disuguaglianza può essere generalizzata ad esponenti diversi come si vede nel
seguente.

Teorema 5.40 (disuguaglianza di Young). Se 𝑝 > 1, 𝑞 > 1, 1


𝑝 + 1
𝑞 = 1, 𝑥, 𝑦 ≥ 0:

𝑥𝑝 𝑦𝑞
𝑥𝑦 ≤ + . (5.3)
𝑝 𝑞

Dimostrazione. Si utilizza la disuguaglianza di convessità per la funzione exp(𝑥) = 𝑒 𝑥 .


Visto che la derivata seconda dell’esponenziale è positiva, la funzione exp è convessa e
dunque, se 𝑥 > 0 e 𝑦 > 0 si ha:
 
1 1
𝑥 · 𝑦 = exp(ln 𝑥 + ln 𝑦) = exp ln(𝑥 𝑝 ) + ln(𝑦 𝑞 )
𝑝 𝑞
1 1 𝑥 𝑝 𝑦𝑞
≤ · exp ln(𝑥 𝑝 ) + exp ln(𝑦 𝑞 ) = + .
𝑝 𝑞 𝑝 𝑞

Se 𝑥 = 0 o 𝑦 = 0 la disuguaglianza è ovvia in quanto il lato sinistro di (5.3) è nullo.

Teorema 5.41 (disuguaglianza di Hölder). Se 𝑎 𝑘 ≥ 0 e 𝑏 𝑘 ≥ 0 per 𝑘 ∈ ℕ e siano 𝑝 > 1 e


𝑞 > 1 tali che 𝑝1 + 1𝑞 = 1. Allora

! 𝑝1 ! 1𝑞
X X 𝑝 X 𝑞
𝑎𝑘 𝑏𝑘 ≤ 𝑎𝑘 · 𝑏𝑘 .
𝑘 𝑘 𝑘

Dimostrazione. Poniamo
! 𝑝1 ! 1𝑞
X 𝑝 X 𝑞
𝐴= 𝑎𝑘 , 𝐵= 𝑏𝑘 .
𝑘 𝑘
202 5 calcolo differenziale

Se 𝐴 > 0 e 𝐵 > 0 possiamo dividere il lato sinistro della disuguaglianza per il lato
destro e applicare la disuguaglianza (5.3) di Young:
𝑝 𝑞
𝑎𝑘 𝑏𝑘 X 𝑎𝑘 𝑏𝑘 X 1 𝑎𝑘 1 𝑏𝑘
P
𝑘
= · ≤ 𝑝
+
𝐴·𝐵 𝑘
𝐴 𝐵 𝑘
𝑝 𝐴 𝑞 𝐵𝑞
𝑝 𝑞
1 𝑘 𝑎𝑘 1 𝑘 𝑏𝑘
P P
1 1
= 𝑝
+ 𝑞
= + = 1.
𝑝 𝐴 𝑞 𝐵 𝑝 𝑞

E il teorema e dimostrato.

Se fosse 𝐴 = 0 tutti i termini 𝑎 𝑘 sarebbero nulli e la disuguaglianza si riduce banalmente


a 0 ≤ 0. Lo stesso se fosse 𝐵 = 0.

disuguaglianza di Cauchy-Schwarz Nel caso 𝑝 = 𝑞 = 2 si ottiene la disuguaglianza di Cauchy-Schwarz


X rX rX
|𝑎 𝑘 𝑏 𝑘 | ≤ 𝑎 2𝑘 · 𝑏 2𝑘
𝑘 𝑘 𝑘

che potrebbe però essere più facilmente dimostrata per un generico prodotto scalare,
come faremo nel teorema 7.6.

5.6 teoremi di Cauchy e de l’Hospital


Cauchy

Teorema 5.42 (Cauchy). Siano 𝑓 : [𝑎, 𝑏] → ℝ e 𝑔 : [𝑎, 𝑏] → ℝ funzioni continue su tutto


[𝑎, 𝑏] e derivabili su (𝑎, 𝑏). Supponiamo inoltre che 𝑔 ′(𝑥) ≠ 0 per ogni 𝑥 ∈ (𝑎, 𝑏). Allora
𝑔(𝑏) ≠ 𝑔(𝑎) ed esiste 𝑥0 ∈ (𝑎, 𝑏) tale che

𝑓 ′(𝑥0 ) 𝑓 (𝑏) − 𝑓 (𝑎)


= .
𝑔 (𝑥0 )
′ 𝑔(𝑏) − 𝑔(𝑎)

Dimostrazione. Si consideri la funzione ausiliaria

ℎ(𝑥) = (𝑔(𝑏) − 𝑔(𝑎)) 𝑓 (𝑥) − ( 𝑓 (𝑏) − 𝑓 (𝑎))𝑔(𝑥).

Per verifica diretta si osserva che

ℎ(𝑏) = 𝑔(𝑏) 𝑓 (𝑎) − 𝑓 (𝑏)𝑔(𝑎) = ℎ(𝑎).

Dunque ℎ verifica le ipotesi del teorema di Rolle ed esiste dunque un punto 𝑥 0 ∈ (𝑎, 𝑏)
per cui ℎ ′(𝑥 0 ) = 0. Essendo però

ℎ ′(𝑥) = (𝑔(𝑏) − 𝑔(𝑎)) 𝑓 ′(𝑥) − ( 𝑓 (𝑏) − 𝑓 (𝑎))𝑔 ′(𝑥)

si ottiene
(𝑔(𝑏) − 𝑔(𝑎)) 𝑓 ′(𝑥0 ) = ( 𝑓 (𝑏) − 𝑓 (𝑎))𝑔 ′(𝑥0 ).
Per ipotesi sappiamo che 𝑔 ′(𝑥 0 ) ≠ 0. Ma necessariamente anche 𝑔(𝑏) − 𝑔(𝑎) ≠ 0 perché
altrimenti potremmo applicare il teorema di Rolle alla funzione 𝑔 e ottenere che 𝑔 ′ si
annulla in un punto di (𝑎, 𝑏), cosa che abbiamo escluso per ipotesi. Dunque possiamo
5.6 teoremi di Cauchy e de l’Hospital 203

dividere ambo i membri per (𝑔(𝑏) − 𝑔(𝑎)) e per 𝑔 ′(𝑥 0 ) per ottenere l’uguaglianza
enunciata nel teorema.

Teorema 5.43 (de l’Hospital 0/0). Sia 𝐼 ⊆ ℝ un intervallo, 𝑥 0 ∈ [−∞, +∞] un punto
di accumulazione di 𝐼 e siano 𝑓 , 𝑔 : 𝐼 \ {𝑥 0 } → ℝ funzioni derivabili. Supponiamo che sia
𝑔 ′(𝑥) ≠ 0 per ogni 𝑥 ∈ 𝐼 \ {𝑥0 }. Se

lim 𝑓 (𝑥) = 0 e lim 𝑔(𝑥) = 0


𝑥→𝑥 0 𝑥→𝑥0

e se esiste (finito o infinito) il limite

𝑓 ′(𝑥)
ℓ = lim
𝑥→𝑥 0 𝑔 ′(𝑥)

allora si ha
𝑓 (𝑥)
lim = ℓ.
𝑥→𝑥0 𝑔(𝑥)

Dimostrazione. Bisognerà distinguere diversi casi a seconda che 𝑥 0 sia finito o infinito
e che sia un punto interno o un estremo dell’intervallo 𝐼 . Fatta la dimostrazione nel
primo caso tutti gli altri si riconducono ad esso.

Caso 1: supponiamo che sia 𝐼 = [𝑥 0 , 𝑏]. In questo caso possiamo estendere le funzioni
𝑓 e 𝑔 anche nel punto 𝑥 0 ponendo:
( (
𝑓 (𝑥) se 𝑥 ∈ (𝑥0 , 𝑏] 𝑔(𝑥) se 𝑥 ∈ (𝑥0 , 𝑏]
𝑓˜(𝑥) = 𝑔˜ (𝑥) =
0 se 𝑥 = 𝑥 0 , 0 se 𝑥 = 𝑥 0 .

Visto che per ipotesi 𝑓 (𝑥) → 0 e 𝑔(𝑥) → 0 per 𝑥 → 𝑥 0 risulta che 𝑓˜ e 𝑔˜ siano
funzioni continue su tutto l’intervallo [𝑥 0 , 𝑏] inoltre, sempre per ipotesi, sono derivabili
nell’intervallo (𝑥 0 , 𝑏] visto che l’estensione per 𝑥 = 𝑥 0 non modifica le derivate negli
altri punti. In particolare le funzioni estese soddisfano le ipotesi del teorema di Cauchy
in ogni intervallo [𝑥 0 , 𝑥] con 𝑥 ∈ (𝑥 0 , 𝑏], dunque possiamo affermare che per ogni 𝑥
esiste 𝑐(𝑥) ∈ (𝑥 0 , 𝑥) tale che

𝑓 (𝑥) 𝑓˜(𝑥) − 𝑓˜(𝑥0 ) 𝑓˜′(𝑐(𝑥)) 𝑓 ′(𝑐(𝑥))


= = ′ = ′ .
𝑔(𝑥) 𝑔˜ (𝑥) − 𝑔˜ (𝑥0 ) 𝑔˜ (𝑐(𝑥)) 𝑔 (𝑐(𝑥))

Ma essendo 𝑥 0 < 𝑐(𝑥) < 𝑥 per 𝑥 → 𝑥 0 si ha 𝑐(𝑥) → 𝑥 0 e quindi, tramite un cambio di


variabile (Teorema 2.23) possiamo affermare che

𝑓 (𝑥) 𝑓 ′(𝑐(𝑥)) 𝑓 ′(𝑥)


lim = lim ′ = lim ′ = ℓ.
𝑥→𝑥 0 𝑔(𝑥) 𝑥→𝑥0 𝑔 (𝑐(𝑥)) 𝑥→𝑥0 𝑔 (𝑥)

Caso 2: supponiamo sia 𝐼 qualunque e 𝑥 0 finito. Visto che le funzioni sono definite su
𝐼 \ {𝑥0 } possiamo sempre supporre 𝑥0 ∈ 𝐼 . Inoltre visto che i limiti dipendono solo
dai valori in un intorno del punto 𝑥 0 possiamo sempre supporre che 𝐼 sia un intervallo
chiuso e limitato. Nel passo precedente abbiamo fatto il caso in cui 𝑥 0 era l’estremo
inferiore di 𝐼 , ma allo stesso modo si può fare il caso in cui 𝑥 0 è l’estremo superiore. Se
invece 𝑥 0 fosse un punto interno di 𝐼 possiamo considerare separatamente il limite
destro e sinistro e ricondurci ai casi in cui 𝑥 0 era un estremo.
204 5 calcolo differenziale

Caso 3: supponiamo sia 𝑥 0 = +∞. In tal caso l’intervallo 𝐼 contiene un intevallo [𝑎, +∞)
con 𝑎 ∈ ℝ. Anche in questo caso vogliamo ricondurci al primo caso tramite il cambio
di variabile 𝑡 = 1/𝑥 . Posto 𝐹(𝑡) = 𝑓 (1/𝑡) e 𝐺(𝑡) = 𝑔(1/𝑡) si osserva che 𝐹 e 𝐺 sono
definite sull’intervallo (0 , 1/𝑎], tendono a zero per 𝑡 → 0+ sono derivabili,

𝑓 ′(1/𝑡) 𝑔 ′(1/𝑡))
𝐹′(𝑡) = − , 𝐺′(𝑡) = −
𝑡2 𝑡2
e risulta quindi
𝐹′(𝑡) 𝑓 ′(1/𝑡) 𝑓 ′(𝑥)
lim+ = lim = lim = ℓ.
𝑡→0 𝐺′(𝑡) 𝑡→0+ 𝑔 ′(1/𝑡) 𝑥→+∞ 𝑔 ′(𝑥)
Quindi applicano il teorema nel caso già dimostrato possiamo affermare che

𝑓 (𝑥) 𝐹(𝑡)
lim = lim+ = ℓ.
𝑥→+∞ 𝑔(𝑥) 𝑡→0 𝐺(𝑡)

Caso 4: il caso 𝑥 0 = −∞ si svolge in maniera analoga al caso precedente.


de l’Hospital

Teorema 5.44 (de l’Hospital ·/∞). Siano 𝑎, 𝑏 ∈ [−∞, +∞] con 𝑎 < 𝑏 . Siano 𝑓 , 𝑔 : (𝑎, 𝑏) →
ℝ funzioni derivabili. Se
lim+ | 𝑔(𝑥)| = +∞,
𝑥→𝑎

se 𝑔 ′(𝑥) ≠ 0 per ogni 𝑥 ∈ (𝑎, 𝑏) e se esiste il limite (finito o infinito)

𝑓 ′(𝑥)
ℓ = lim+
𝑥→𝑎 𝑔 ′(𝑥)

allora si ha
𝑓 (𝑥)
lim+ = ℓ.
𝑥→𝑎 𝑔(𝑥)

Risultato analogo si ha facendo i limiti per 𝑥 → 𝑏 − invece che per 𝑥 → 𝑎 + e di conseguenza


anche nel caso in cui la funzione sia definita su un intervallo “bucato” 𝑓 : (𝑎, 𝑏) \ {𝑥 0 } → ℝ
e si considerino i limiti “pieni” per 𝑥 → 𝑥 0 .

Dimostrazione. Supponiamo per assurdo che non si abbia

𝑓 (𝑥)
lim = ℓ.
𝑥→𝑎 + 𝑔(𝑥)

Allora, per il teorema di collegamento tra limiti di funzione e limiti di successione,


deve esistere una successione 𝑎 𝑘 ∈ (𝑎, 𝑏), 𝑎 𝑘 → 𝑎 tale che non si abbia

𝑓 (𝑎 𝑘 )
lim = ℓ.
𝑘→+∞ 𝑔(𝑎 𝑘 )

Se la successione 𝑓 (𝑎 𝑘 )/𝑔(𝑎 𝑘 ) è limitata allora applicando il teorema di Bolzano


Weierstrass sappiamo esistere una sottosuccessione di 𝑎 𝑘 convergente ad un valore
𝑚 ≠ ℓ (se tutte le sottosuccessioni convergessero ad ℓ l’intera successione convergerebbe
ad ℓ ). Se invece 𝑓 (𝑎 𝑘 )/𝑔(𝑎 𝑘 ) non è limitata possiamo estrarre una sottosuccessione che
5.7 classi di regolarità 205

converge a +∞ oppure a −∞. In ogni caso esiste una successione, che chiameremo
ancora 𝑎 𝑘 , ed esiste 𝑚 ∈ ℝ̄ tale che

𝑓 (𝑎 𝑘 )
lim = 𝑚 ≠ ℓ.
𝑘→+∞ 𝑔(𝑎 𝑘 )

Consideriamo ora un intorno 𝑈 di 𝑚 e un intorno 𝑉 di ℓ tali che 𝑈 ∩ 𝑉 = ∅. Siccome


𝑓 ′(𝑥)/𝑔 ′(𝑥) → ℓ per 𝑥 → 𝑎 esiste un 𝑐 ∈ (𝑎, 𝑏) tale che per ogni 𝑥 ∈ (𝑎, 𝑐) si ha

𝑓 ′(𝑥)
∈ 𝑉.
𝑔 ′(𝑥)

Consideriamo allora il seguente rapporto incrementale

<