Sei sulla pagina 1di 448

Appunti di

Analisi Matematica Uno

Emanuele Paolini

27 maggio 2021

manu-fatto
This work is licensed under a Creative Commons “Attribution-NonCommercial-
ShareAlike 4.0 International” license.
Introduzione

Queste note sono nate come appunti per il corso di Analisi Matematica del
corso di studi in Fisica dell’Università di Pisa negli anni accademici 2017/18,
2018/19, 2019/20 e 2020/21.

Le note (come il corso a cui fanno riferimento) riguardano l’analisi delle


funzioni di una variabile reale. Gli argomenti trattati sono serie e successioni
numeriche, il calcolo differenziale e il calcolo integrale. Viene anche introdotta
la convergenza uniforme allo scopo di considerare, come ultimo argomento, lo
studio delle equazioni differenziali ordinarie. Da subito vengono introdotti i
numeri complessi che vengono utilizzati laddove possono aiutare a dare una
visione più unitaria e concettualmente più semplice degli argomenti trattati (in
particolare nello studio delle serie di potenze, nella definizione delle funzioni
trigonometriche, nella risoluzione delle equazioni differenziali lineari).

Le note sono estensive, non c’è alcun tentativo di concisione. L’obiettivo è quello
di raccogliere tutti quei risultati che non sempre è possibile esporre in maniera
dettagliata e rigorosa a lezione. Troveremo, ad esempio, definizioni equivalenti
della funzione esponenziale e una definizione analitica (tramite serie di potenze)
delle funzioni trigonometriche (e di 𝜋). Proponiamo la dimostrazione del
teorema fondamentale dell’algebra, della formula di Stirling e di Wallis, e
dell’irrazionalità di 𝑒 e di 𝜋. Viene proposta una definizione formale dei
simboli di Landau 𝑜 -piccolo e 𝑂 -grande con i relativi teoremi per trattare queste
espressioni. Lo stesso viene fatto per il simbolo di integrale indefinito. Vengono
trattati quei risultati algebrici che permettono di giustificare gli algoritmi per
il calcolo delle primitive delle funzioni razionali e per risolvere le equazioni
differenziali lineari con il metodo di similarità.

I risultati più importanti sono marcati con degli asterischi sul margine della
pagina: *** molto importante, ** importante, * rilevante. Il lettore è invitato
a non perdere tempo sui risultati più marginali se i risultati importanti non
sono del tutto chiari. Le figure non sono frequenti ma a margine di molte
di esse è presente un QR-code (un quadrato formato da una nuvola di pixel)
che permette di accedere alla figura online e modicarne i parametri. Nella
versione PDF il QR-code è cliccabile. Nella versione cartacea si può usare la
fotocamera del proprio smartphone per scansionare il codice e visitare la pagina
corrispondente. In alternativa si può visitare la pagina https://paolini.
github.io/AnalisiUno/ dove sono inseriti tutti i collegamenti alle figure
interattive. Queste note sono rese disponibili liberamente sia in formato PDF
che in forma di sorgente LATEX. Un modo per sostenere questo progetto e
mantenerlo disponibile liberamente per tutti, è quello di acquistarne una copia
cartacea.

Il materiale è costantemente in evoluzione e certamente contiene errori e


incoerenze. Ogni suggerimento o commento è benvenuto!
contributi

Ringrazio: Valerio Amico, Rico Bellani, Fabio Bensch, Jacopo Bernardini, Elia
Bonistalli, Antonino Calderone, Davide Campanella Galanti, Alessandro Can-
zonieri, Giulio Carlo, Luca Casagrande, Alessandro Casini, Giulio Cianti, Luca
Ciceri, Tommaso Ceccotti, Giorgio Ciocca, Luca Ciucci, Francesco Debortoli,
Martino Dimartino, Igor Di Tota, Irene Iorio, Marco Labella, Davide Labroscia-
no, Viviana Lippolis, Luigina Mazzone, Roberto Menta, Michele Monti, Elena
Morano, Aurora Mugnai, Marco Nuti, Ruben Pariente, Daniele Pavarini, Gu-
glielmo Pellitteri, Paolo Pennoni, Davide Perrone, Lorenzo Pierfederici, Mattia
Ripepe, Francesco Rodriguez, Gabriele Scarci, Maria Antonella Secondo, Irene
Silvestro, Alessio Squilloni, Antonio Tagliente, Francesco Enrico Teofilo, Laura
Toni, Giacomo Trupiano, Bianca Turini, Francesco Vaselli, Antoine Venturini,
Matteo Vilucchio, Piero Viscone che hanno segnalato errori e correzioni.
Ringrazio i colleghi Vincenzo Tortorelli e Pietro Majer che mi hanno dato molti
suggerimenti preziosi.

pronuncia delle lettere straniere

inglesi:

𝐽 𝑗 gei (i lunga)
𝐾 𝑘 cappa (key)
𝑊 𝑤 vu doppia
𝑋 𝑥 ics
𝑌 𝑦 ipsilon (i greca)

greche:

𝐴 𝛼 alfa 𝐼 𝜄 iota 𝑃 𝜌 ro
𝐵 𝛽 beta 𝐾 𝜅 kappa† Σ 𝜎 sigma
Γ 𝛾 gamma Λ 𝜆 lambda 𝑇 𝜏 tau
Δ 𝛿 delta 𝑀 𝜇 mi (mu) 𝑌 𝜐 ipsilon§
𝐸 𝜀 epsilon 𝑁 𝜈 ni (nu) Φ 𝜑 fi
𝑍 𝜁 zeta∗ Ξ 𝜉 csi 𝑋 𝜒 chi
𝐻 𝜂 eta 𝑂 𝑜 omicron Ψ 𝜓 psi
Θ 𝜃 teta Π 𝜋 pi‡ Ω 𝜔 omega

ebraiche:

ℵ alef

∗ pronunciato usualmente con la 𝑧 dolce per distinguerlo dalla 𝑧 .


† in inglese si distingue la pronuncia tra 𝑘 key e 𝜅 kappa.
‡ in italiano pi greco in inglese pai, per distinguere da 𝑝 .
§ si pronuncia upsilon per distinguerla da 𝑦 .
Indice

Indice v

1 fondamenti 1
1.1 proposizioni e predicati . . . . . . . . . . . . . . . . . . . . . . . 1
1.2 teoria degli insiemi . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.3 relazioni . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
1.4 funzioni . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
1.5 cardinalità . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
1.6 i numeri naturali . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
1.7 insiemi prodotto . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
1.8 la retta dei numeri reali . . . . . . . . . . . . . . . . . . . . . . . 20
1.9 i numeri naturali e interi . . . . . . . . . . . . . . . . . . . . . . 22
1.10 polinomi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
1.11 coefficienti binomiali . . . . . . . . . . . . . . . . . . . . . . . . 31
1.12 cardinalità finite . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
1.13 estremo superiore . . . . . . . . . . . . . . . . . . . . . . . . . . 35
1.14 l’insieme dei numeri razionali . . . . . . . . . . . . . . . . . . . 37
1.15 valore assoluto . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
1.16 numeri decimali . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
1.17 isomorfismi di gruppi ordinati . . . . . . . . . . . . . . . . . . . 41
1.18 funzione esponenziale e potenza . . . . . . . . . . . . . . . . . . 46
1.19 radice 𝑛 -esima . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48
1.20 logaritmo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50
1.21 cardinalità infinite . . . . . . . . . . . . . . . . . . . . . . . . . . 50
1.22 punti all’infinito . . . . . . . . . . . . . . . . . . . . . . . . . . . 52
1.23 intervalli . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53
1.24 andamento del grafico di una funzione . . . . . . . . . . . . . . 53
1.25 funzioni lineari . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
1.26 funzioni quadratiche . . . . . . . . . . . . . . . . . . . . . . . . 56
1.27 equazioni e disequazioni . . . . . . . . . . . . . . . . . . . . . . 58
1.28 i numeri complessi . . . . . . . . . . . . . . . . . . . . . . . . . . 60

2 funzioni continue, limiti e successioni 67


2.1 funzioni continue . . . . . . . . . . . . . . . . . . . . . . . . . . 67
2.2 limite di funzione . . . . . . . . . . . . . . . . . . . . . . . . . . 72
2.3 proprietà frequenti e definitive . . . . . . . . . . . . . . . . . . . 82
2.4 criteri di confronto . . . . . . . . . . . . . . . . . . . . . . . . . . 83
2.5 successioni . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85
2.6 limite di successione . . . . . . . . . . . . . . . . . . . . . . . . . 85
2.7 successioni limitate . . . . . . . . . . . . . . . . . . . . . . . . . 86
2.8 successioni monotòne . . . . . . . . . . . . . . . . . . . . . . . . 88
2.9 la costante di Nepero . . . . . . . . . . . . . . . . . . . . . . . . 89
2.10 criteri del rapporto e della radice . . . . . . . . . . . . . . . . . . 95
2.11 ordini di infinito, equivalenza asintotica . . . . . . . . . . . . . . 96
2.12 successioni estratte . . . . . . . . . . . . . . . . . . . . . . . . . . 99
2.13 punti limite . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101
2.14 il teorema degli zeri . . . . . . . . . . . . . . . . . . . . . . . . . 107
2.15 il teorema di Weierstrass . . . . . . . . . . . . . . . . . . . . . . 109
2.16 successioni ricorsive . . . . . . . . . . . . . . . . . . . . . . . . . 110

3 serie 111
3.1 serie telescopiche . . . . . . . . . . . . . . . . . . . . . . . . . . 115
3.2 serie a termini positivi . . . . . . . . . . . . . . . . . . . . . . . . 116
associatività della somma di una serie . . . . . . . . . . . . . . . 119
la serie armonica . . . . . . . . . . . . . . . . . . . . . . . . . . . 120
3.3 rappresentazione posizionale dei numeri reali . . . . . . . . . . 122
3.4 convergenza assoluta . . . . . . . . . . . . . . . . . . . . . . . . 124
3.5 serie a segno variabile . . . . . . . . . . . . . . . . . . . . . . . . 126
3.6 somme multiple . . . . . . . . . . . . . . . . . . . . . . . . . . . 128
3.7 somma per parti . . . . . . . . . . . . . . . . . . . . . . . . . . . 130
3.8 prodotti infiniti . . . . . . . . . . . . . . . . . . . . . . . . . . . . 132
3.9 le serie di potenze . . . . . . . . . . . . . . . . . . . . . . . . . . 133
3.10 la serie esponenziale . . . . . . . . . . . . . . . . . . . . . . . . . 139
3.11 le funzioni trigonometriche . . . . . . . . . . . . . . . . . . . . . 145
3.12 funzioni trigonometriche inverse . . . . . . . . . . . . . . . . . . 150
3.13 funzioni iperboliche . . . . . . . . . . . . . . . . . . . . . . . . . 152
3.14 esercizi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 154

4 i numeri complessi 155


4.1 rappresentazione polare dei numeri complessi . . . . . . . . . . 155
4.2 interpretazione geometrica . . . . . . . . . . . . . . . . . . . . . 156
4.3 radici complesse 𝑛 -esime . . . . . . . . . . . . . . . . . . . . . . 160
4.4 ancora polinomi . . . . . . . . . . . . . . . . . . . . . . . . . . . 161
4.5 il teorema fondamentale dell’algebra . . . . . . . . . . . . . . . 164
4.6 fattorizzazione dei polinomi . . . . . . . . . . . . . . . . . . . . 168

5 calcolo differenziale 173


5.1 derivata . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 173
5.2 derivate parziali . . . . . . . . . . . . . . . . . . . . . . . . . . . 181
5.3 punti notevoli . . . . . . . . . . . . . . . . . . . . . . . . . . . . 181
5.4 criteri di monotonia . . . . . . . . . . . . . . . . . . . . . . . . . 183
5.5 convessità . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 191
5.6 teoremi di Cauchy e de l’Hospital . . . . . . . . . . . . . . . . . 199
5.7 classi di regolarità . . . . . . . . . . . . . . . . . . . . . . . . . . 202
5.8 formula di Taylor . . . . . . . . . . . . . . . . . . . . . . . . . . 206
5.9 operazioni con i simboli di Landau . . . . . . . . . . . . . . . . 214
5.10 funzioni analitiche . . . . . . . . . . . . . . . . . . . . . . . . . . 219
5.11 derivata complessa . . . . . . . . . . . . . . . . . . . . . . . . . 229

6 calcolo integrale 231


6.1 misura di Peano-Jordan . . . . . . . . . . . . . . . . . . . . . . . 231
6.2 integrale di Riemann . . . . . . . . . . . . . . . . . . . . . . . . 237
6.3 teorema fondamentale del calcolo integrale . . . . . . . . . . . . 250
6.4 calcolo delle primitive . . . . . . . . . . . . . . . . . . . . . . . . 254
6.5 integrale di una funzione razionale . . . . . . . . . . . . . . . . 260
6.6 integrali che si riconducono a funzioni razionali . . . . . . . . . 267
6.7 funzioni speciali . . . . . . . . . . . . . . . . . . . . . . . . . . . 271
6.8 integrali impropri . . . . . . . . . . . . . . . . . . . . . . . . . . 271
6.9 studio di funzioni integrali . . . . . . . . . . . . . . . . . . . . . 284
6.10 alcune applicazioni del calcolo integrale . . . . . . . . . . . . . 288

7 spazi di funzioni 295


7.1 spazi metrici e topologia . . . . . . . . . . . . . . . . . . . . . . 300
7.2 completezza . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 304
7.3 convergenza uniforme . . . . . . . . . . . . . . . . . . . . . . . . 309
7.4 passaggio al limite sotto il segno di integrale . . . . . . . . . . . 312
7.5 scambio della derivata con il limite . . . . . . . . . . . . . . . . 321
serie di funzioni . . . . . . . . . . . . . . . . . . . . . . . . . . . 323
7.6 convergenza integrale . . . . . . . . . . . . . . . . . . . . . . . . 327
serie di Fourier . . . . . . . . . . . . . . . . . . . . . . . . . . . . 329
7.7 divagazione sui frattali autosimili . . . . . . . . . . . . . . . . . 340

8 successioni ricorsive 345


8.1 equazioni ricorsive autonome del primo ordine . . . . . . . . . 346
8.2 approfondimenti . . . . . . . . . . . . . . . . . . . . . . . . . . . 362
8.3 equazioni ricorsive lineari . . . . . . . . . . . . . . . . . . . . . . 363
8.4 dinamica complessa . . . . . . . . . . . . . . . . . . . . . . . . . 368

9 equazioni differenziali 371


9.1 classificazione . . . . . . . . . . . . . . . . . . . . . . . . . . . . 371
equazioni lineari . . . . . . . . . . . . . . . . . . . . . . . . . . . 374
problema di Cauchy . . . . . . . . . . . . . . . . . . . . . . . . . 375
9.2 metodi risolutivi . . . . . . . . . . . . . . . . . . . . . . . . . . . 376
equazioni lineari del primo ordine . . . . . . . . . . . . . . . . . 376
equazioni a variabili separabili . . . . . . . . . . . . . . . . . . . 380
altri metodi risolutivi . . . . . . . . . . . . . . . . . . . . . . . . 384
9.3 funzioni vettoriali e di più variabili . . . . . . . . . . . . . . . . 389
9.4 il problema di Cauchy . . . . . . . . . . . . . . . . . . . . . . . . 391
9.5 il problema di Cauchy per equazioni di ordine 𝑛 . . . . . . . . . 398
9.6 equazioni lineari di ordine 𝑛 . . . . . . . . . . . . . . . . . . . . 400
9.7 equazioni lineari di ordine 𝑛 a coefficienti costanti . . . . . . . . 402
9.8 sistemi lineari . . . . . . . . . . . . . . . . . . . . . . . . . . . . 412
sistemi 2 × 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 413
matrice esponenziale . . . . . . . . . . . . . . . . . . . . . . . . 417
9.9 studio qualitativo delle soluzioni . . . . . . . . . . . . . . . . . . 420
monotonia e punti critici delle soluzioni . . . . . . . . . . . . . . 422
teoremi di confronto . . . . . . . . . . . . . . . . . . . . . . . . . 424

A Listati 425
A.1 bisection.py . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 425
A.2 series.py . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 426
A.3 compute_e.py . . . . . . . . . . . . . . . . . . . . . . . . . . . . 426
A.4 compute_pi.py . . . . . . . . . . . . . . . . . . . . . . . . . . . . 426
A.5 Mandelbrot.py . . . . . . . . . . . . . . . . . . . . . . . . . . . . 427
A.6 Koch.py . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 428
A.7 Fourier.py . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 429

Indice analitico 433


fondamenti 1
1.1 proposizioni e predicati

Se, come diceva Galileo, la matematica è il linguaggio della scienza, è importante


che la matematica sia essa stessa espressa in un linguaggio che risulti essere
il più possibile oggettivo e non ambiguo. La logica è la disciplina matematica
che si occupa dello studio e della formalizzazione del linguaggio matematico.
In questo capitolo riassumiamo in maniera breve ed intuitiva alcuni concetti
che probabilmente sono noti e contemporaneamente fissiamo le notazioni che
verranno utilizzate nel seguito.

Una proposizione è una frase (formalmente diremmo formula) che assume un proposizione
valore di verità ben definito: vero oppure falso. Un esempio di proposizione
(falsa) è “2+2=5”.

E’ possibile combinare più proposizioni mediante gli operatori logici. Se 𝑃 e 𝑄


sono proposizioni si può costruire la proposizione 𝑃 ∧ 𝑄 chiamata congiunzione
logica. Tale proposizione si può leggere “𝑃 e 𝑄 ” ed è una proposizione che congiunzione
risulta essere vera solamente nel caso in cui sia 𝑃 che 𝑄 siano vere. Spesso la
congiunzione logica è sottointesa: se si fa un elenco di proposizioni 𝑃, 𝑄, 𝑅 si
intende usualmente la loro congiunzione 𝑃 ∧ 𝑄 ∧ 𝑅 cioè si intende che devono
essere tutte vere. La disgiunzione logica denotata con 𝑃 ∨ 𝑄 si può leggere “𝑃 disgiunzione
o 𝑄 ” ed è una proposizione che è vera se almeno una tra 𝑃 e 𝑄 è vera. La
negazione logica denotata con ¬𝑃 è una proposizione che si può leggere “non 𝑃 ” negazione
che è vera quando 𝑃 è falsa ed è falsa quando 𝑃 è vera.

Operatori logici molto utilizzati sono le implicazioni. La proposizione 𝑃 ⇒ 𝑄 si implicazioni


può leggere “𝑃 implica 𝑄 ” e significa che 𝑄 è vera se 𝑃 è vera. Non si confonda
il valore di verità di 𝑃 ⇒ 𝑄 con il valore di verità di 𝑄 . Se 𝑃 è vera allora
𝑃 ⇒ 𝑄 è vera o falsa a seconda che 𝑄 sia vera o falsa. Ma se 𝑃 è falsa allora
l’implicazione 𝑃 ⇒ 𝑄 è vera indipendentemente dal valore di 𝑄 . In effetti
𝑃 ⇒ 𝑄 è equivalente a 𝑄 ∨ ¬𝑃 perché per la verità di 𝑃 ⇒ 𝑄 basta che 𝑄 sia
vera (quando 𝑃 è vera) oppure che 𝑃 sia falsa.

La freccia inversa 𝑃 ⇐ 𝑄 si può utilizzare per invertire l’implicazione: è


equivalente a 𝑄 ⇒ 𝑃 . Se valgono entrambe le implicazioni (𝑃 ⇐ 𝑄) ∧ (𝑃 ⇒ 𝑄)
è facile convincersi che 𝑃 e 𝑄 devono avere lo stesso valore di verità: diremo
quindi che sono equivalenti e scriveremo 𝑃 ⇔ 𝑄 .

Nella tabella 1.1 sono riportati tutti i valori di verità che si possono ottenere
combinando tra loro due proposizioni. Nella tabella 1.2 sono riportate alcune
proprietà di tali operatori: queste proprietà possono essere capite interpretando
il loro significato ma possono anche essere dedotte meccanicamente tramite la
tabella di verità delle operazioni.
predicato
Un predicato è una proposizione che contiene una o più variabili, il cui valore di
verità, quindi, può dipendere dal valore assegnato alle variabili. Un esempio di
predicato è 𝑥 + 2 = 5 che risulta essere vero se 𝑥 = 3 e falso altrimenti.
2 1 fondamenti

Tabella 1.1: La tabella di verità degli 𝑃 𝑄 ¬𝑃 𝑃∧𝑄 𝑃∨𝑄 𝑃⇒𝑄 𝑃⇐𝑄 𝑃⇔𝑄
operatori logici.
V V F V V V V V
V F F F V F V F
F V V F V V F F
F F V F F V V V

Tabella 1.2: Alcune proprietà degli ope- ¬¬𝑃 ⇐⇒ 𝑃 doppia negazione


ratori logici.
𝑃∧𝑄 ⇐⇒ 𝑄∧𝑃 simmetria
𝑃∨𝑄 ⇐⇒ 𝑄∨𝑃
¬(𝑃 ∧ 𝑄) ⇐⇒ (¬𝑃) ∨ (¬𝑄) formule di De Morgan
¬(𝑃 ∨ 𝑄) ⇐⇒ (¬𝑃) ∧ (¬𝑄)
(𝑃 ∧ 𝑄) ∨ 𝑅 ⇐⇒ (𝑃 ∨ 𝑅) ∧ (𝑄 ∨ 𝑅) proprietà distributiva
(𝑃 ∨ 𝑄) ∧ 𝑅 ⇐⇒ (𝑃 ∧ 𝑅) ∨ (𝑄 ∧ 𝑅)
(𝑃 ⇒ 𝑄) ⇐⇒ (𝑄 ⇐ 𝑃) antisimmetria
¬(𝑃 ⇒ 𝑄) ⇐⇒ 𝑃 ∧ (¬𝑄) controesempio
(𝑃 ⇒ 𝑄) ⇐⇒ ¬(𝑃 ∧ (¬𝑄)) dimostrazione per assurdo
(𝑃 ⇒ 𝑄) ⇐⇒ (¬𝑄 ⇒ ¬𝑃) implicazione contropositiva

Se un predicato dipende da una o più variabili queste si chiamano variabili


variabili libere
libere. E’ possibile chiudere una variabile libera mediante un quantificatore. Il
quantificatore universale denotato col simbolo ∀ serve ad affermare che il predicato
quantificatore universale è vero per ogni possibile valore della variabile quantificata. Ad esempio la
proposizione ∀𝑥 : 𝑥 + 2 = 5 significa: “per ogni 𝑥 si ha 𝑥 + 2 = 5” ed è una
proposizione falsa. Il quantificatore ∀𝑥 rende muta la variabile 𝑥 del predicato
𝑥 + 2 = 5 nel senso che la proposizione non dipende più dal valore di quella
variabile, che non è più una variabile libera.

quantificatore esistenziale Il quantificatore esistenziale denotato col simbolo ∃ serve ad affermare che il
predicato è vero per almeno un valore della variabile quantificata. Ad esempio
la proposizione ∃𝑥 : 𝑥 + 2 = 5 significa: “esiste almeno un 𝑥 per cui risulta
𝑥 + 2 = 5”. Quello che si ottiene è una proposizione in cui la variabile 𝑥 è muta.
In questo caso la proposizione è vera in quanto per 𝑥 = 3 il predicato è vero.

Un predicato può dipendere da più variabili ed è quindi possibile inserire più


quantificatori. In tal caso l’ordine dei quantificatori può essere rilevante. Delle
seguenti proposizioni la prima è vera, la seconda invece è falsa:

∀𝑥 : ∃𝑦 : 𝑥 + 2 = 𝑦
∃𝑦 : ∀𝑥 : 𝑥 + 2 = 𝑦.

Alcune proprietà dei quantificatori logici sono riportate nella tabella 1.3.

Tabella 1.3: Alcune proprietà dei quanti- ¬∀𝑥 : 𝑃(𝑥) ⇐⇒ ∃𝑥 : ¬𝑃(𝑥)


ficatori logici ( 𝑐 è una qualunque costan-
te)
¬∃𝑥 : 𝑃(𝑥) ⇐⇒ ∀𝑥 : ¬𝑃(𝑥)
∀𝑥 : 𝑃(𝑥) =⇒ 𝑃(𝑐)
∃𝑥 : 𝑃(𝑥) ⇐= 𝑃(𝑐)
𝑃 ∧ ∀𝑥 : 𝑄(𝑥) ⇐⇒ ∀𝑥 : 𝑃 ∧ 𝑄(𝑥)
𝑃 ∧ ∃𝑥 : 𝑄(𝑥) ⇐⇒ ∃𝑥 : 𝑃 ∧ 𝑄(𝑥)
1.2 teoria degli insiemi 3

Spesso il quantificatore universale viene sottointeso ad esempio con 𝑥 + 𝑦 = 𝑥 + 𝑦


se non indicato diversamente si intende che tutte le variabili libere sono
quantificate tramite quantificatore universale: ∀𝑥 : ∀𝑦 : 𝑥 + 𝑦 = 𝑦 + 𝑥 . Inoltre
il segno di interpunzione : può essere omesso ∀𝑥∀𝑦 𝑥 + 𝑦 = 𝑦 + 𝑥 oppure
una quantificazione può essere fatta contemporaneamente su più variabili
∀𝑥, 𝑦 : 𝑥 + 𝑦 = 𝑦 + 𝑥 . A volte, se non crea ambiguità, si potranno scrivere i
quantificatori anche a fine frase 𝑥 + 𝑦 = 𝑦 + 𝑥, ∀𝑥∀𝑦 .

1.2 teoria degli insiemi

Nei paragrafi precedenti abbiamo visto che i predicati possono essere combinati
tra loro e quantificati. Ma quali sono i predicati elementari che possiamo
considerare? La teoria degli insiemi ci fornisce la formalizzazione del concetto
di appartenenza: il predicato di base (l’unico che ci servirà) è un predicato della
forma 𝑥 ∈ 𝐴 che significa “l’oggetto 𝑥 è un elemento dell’insieme 𝐴”. La
teoria degli insiemi non spiega (né tantomento definisce) cosa siano gli oggetti
e cosa siano gli insiemi perché questi sono concetti primitivi (come lo sono i
punti e le rette per la geometria euclidea). La teoria degli insiemi ci fornisce,
semplicemente, le regole formali che possono essere utilizzate per trattare i
predicati della forma 𝑥 ∈ 𝐴. Ad esempio un assioma della teoria degli insiemi è
il seguente:
∃𝐴 : ¬∃𝑥 : 𝑥 ∈ 𝐴
che significa: “esiste un insieme 𝐴 che non contiene alcun elemento 𝑥 ” ovvero insieme vuoto
stiamo dicendo che esiste l’insieme vuoto che normalmente viene denotato con
il simbolo ∅. Altri opportuni assiomi della teoria degli insiemi garantiscono
l’esistenza dell’unione 𝐴 ∪ 𝐵, intersezione 𝐴 ∩ 𝐵 e differenza 𝐴 \ 𝐵 di due
insiemi qualunque 𝐴 e 𝐵. Tali operazioni tra insiemi possono essere ricondotte
alla relazione di appartenenza e possono quindi essere definite come segue:

𝑥 ∈ 𝐴 ∪ 𝐵 ⇐⇒ (𝑥 ∈ 𝐴) ∨ (𝑥 ∈ 𝐵)
𝑥 ∈ 𝐴 ∩ 𝐵 ⇐⇒ (𝑥 ∈ 𝐴) ∧ (𝑥 ∈ 𝐵)
𝑥 ∈ 𝐴 \ 𝐵 ⇐⇒ (𝑥 ∈ 𝐴) ∧ ¬(𝑥 ∈ 𝐵).

La negazione dell’appartenenza ¬(𝑥 ∈ 𝐴) viene usualmente abbreviata con


𝑥 ∉ 𝐴.

Sempre utilizzando la semplice relazione di appartenenza possiamo definire


le relazioni di inclusione e uguaglianza tra insiemi: 𝐴 ⊆ 𝐵 si legge “𝐴 è un
sottoinsieme di 𝐵” e 𝐴 = 𝐵 si legge “𝐴 è uguale a 𝐵”. Queste relazioni sono
definite dalle seguenti proprietà:

𝐴 ⊆ 𝐵 ⇐⇒ ∀𝑥 : (𝑥 ∈ 𝐴 =⇒ 𝑥 ∈ 𝐵)
𝐴 = 𝐵 ⇐⇒ ∀𝑥 : (𝑥 ∈ 𝐴 ⇐⇒ 𝑥 ∈ 𝐵).

Ovviamente la relazione 𝐴 ⊆ 𝐵 può essere invertita: scriveremo 𝐴 ⊇ 𝐵 (che si


può leggere: “𝐴 è un soprainsieme di 𝐵”) per indicare 𝐵 ⊆ 𝐴. Scriveremo anche
𝐴 ≠ 𝐵 per indicare la relazione opposta dell’uguaglianza ovvero: ¬(𝐴 = 𝐵).
4 1 fondamenti

Risulta molto utile la possibilità di costruire insiemi di insiemi. Per questo


motivo la teoria degli insiemi usualmente non fa distinzione tra oggetti e insiemi
di oggetti. Nella relazione primitiva 𝑥 ∈ 𝐴 anche 𝑥 può essere un insieme.
Possiamo allora immaginare che ogni oggetto del nostro universo sia un insieme.
In questo modo la relazione di uguaglianza 𝐴 = 𝐵 che abbiamo definito sopra
risulta ben definita per ogni coppia di oggetti (o insiemi, che è lo stesso) 𝐴 e
𝐵.

Visto che gli elementi di un insieme A sono a loro volta insiemi, è possibile
L’intersezione di una famiglia vuota di considerare l’unione A e, se A ≠ ∅, l’intersezione A di tutti gli elementi
S T
insiemi darebbe l’insieme universo, che
vedremo non può essere definito.
di A. Questo estende il concetto di unione e intersezione anche a famiglie
eventualmente infinite:
[
𝑥∈ A ⇐⇒ ∃𝐴 ∈ A : 𝑥 ∈ 𝐴,
\
𝑥∈ A ⇐⇒ ∀𝐴 ∈ A : 𝑥 ∈ 𝐴.

Un altro assioma della teoria degli insiemi garantisce che per ogni 𝑥 esiste un
insieme il cui unico elemento è 𝑥 . Tale insieme si chiama singoletto e si denota
con {𝑥}. La proprietà che definisce il singoletto è la seguente:

𝑦 ∈ {𝑥} ⇐⇒ 𝑦 = 𝑥.

Facendo l’unione di singoletti possiamo definire (per elencazione) insiemi che


contengono un numero finito di oggetti:

{𝑎, 𝑏} = {𝑎} ∪ {𝑏}


{𝑎, 𝑏, 𝑐} = {𝑎, 𝑏} ∪ {𝑐}
{𝑎, 𝑏, 𝑐, 𝑑} = {𝑎, 𝑏, 𝑐} ∪ {𝑑}
..
.

Si faccia però attenzione: l’insieme {𝑎, 𝑏} contiene due elementi solamente se


𝑎 ≠ 𝑏 , infatti se 𝑎 = 𝑏 si potrà facilmente verificare che

{𝑎, 𝑎} = {𝑎}. (1.1)

Esercizio 1.1. Verificare (1.1) utilizzando le definizioni formali date in precedenza.

Svolgimento. Utilizzando le definizioni di unione, di singoletto e di disgiunzione


logica si ha l’equivalenza dei seguenti predicati:

𝑥 ∈ {𝑎, 𝑎}
𝑥 ∈ {𝑎} ∪ {𝑎}
(𝑥 ∈ {𝑎}) ∨ (𝑥 ∈ {𝑎})
(𝑥 = 𝑎) ∨ (𝑥 = 𝑎)
𝑥=𝑎
𝑥 ∈ {𝑎}
1.3 relazioni 5

e dunque {𝑎, 𝑎} = {𝑎} per la definizione di uguaglianza tra insiemi.

Se 𝑃(𝑥) è un predicato in una sola variabile 𝑥 vorremmo poter definire l’insieme,


denotato con {𝑥 : 𝑃(𝑥)} di tutti gli oggetti 𝑥 che rendono vero il predicato
𝑃(𝑥):
𝑎 ∈ {𝑥 : 𝑃(𝑥)} ⇐⇒ 𝑃(𝑎).
Sorprendentemente se inseriamo questo assioma nella teoria degli insiemi si
giunge ad un paradosso (paradosso di Russell, si veda [5]) e si ottiene quindi
una teoria incoerente (cioè una teoria in cui tutte le proposizioni sono vere).
Per evitare l’incoerenza è necessario limitare l’assioma (chiamato assioma di
specificazione) alla costruzione di sottoinsiemi di insiemi già costruiti. Se 𝐵 è un
insieme e 𝑃(𝑥) è un predicato possiamo considerare l’insieme {𝑥 ∈ 𝐵 : 𝑃(𝑥)}
che è il sottoinsieme di 𝐵 formato da tutti gli elementi di 𝐵 che soddisfano il
predicato:
𝑎 ∈ {𝑥 ∈ 𝐵 : 𝑃(𝑥)} ⇐⇒ (𝑎 ∈ 𝐵 ∧ 𝑃(𝑎)).

Per completare la teoria degli insiemi introduciamo anche il concetto di insieme


delle parti. Un apposito assioma garantisce che dato un qualunque insieme 𝐴 insieme delle parti
esiste l’insieme P(𝐴) delle parti di 𝐴 che è l’insieme di tutti i sottoinsiemi di 𝐴:

𝑥 ∈ P(𝐴) ⇐⇒ 𝑥 ⊆ 𝐴. (1.2)

1.3 relazioni

Grazie agli assiomi precedenti è possibile definire il prodotto cartesiano di due


insiemi: sarà questo un concetto molto importante nel seguito. Innanzitutto
coppia
dobbiamo definire il concetto di coppia: dati 𝑎, 𝑏 definiamo la coppia (𝑎, 𝑏)
con primo elemento 𝑎 e secondo elemento 𝑏 come un oggetto che ha questa Un modo formale per definire la coppia
proprietà tramite l’utilizzo di insiemi è dovuto a
(𝑎, 𝑏) = (𝑎 0 , 𝑏 0) ⇐⇒ (𝑎 = 𝑎 0) ∧ (𝑏 = 𝑏 0). (1.3) Kuratowski:

(𝑎, 𝑏) = {𝑎, {𝑎, 𝑏}}.


Stiamo cioè richiedendo che una coppia venga identificata dai due elementi che
la compongono in cui, però, è importante anche l’ordine in cui vengono elencati Non è difficile verificare che questa
definizione soddisfa la proprietà (1.3)
(a differenza dell’insieme {𝑎, 𝑏}, in cui l’ordine degli elementi è irrilevante).
Se definiamo (𝑎, 𝑏) = {𝑎, {𝑎, 𝑏}} (si veda
Il prodotto cartesiano 𝐴 × 𝐵 di due insiemi 𝐴 e 𝐵 è l’insieme di tutte le coppieil nota precedente) possiamo formalmente
definire
cui primo elemento sta in 𝐴 e il secondo elemento sta in 𝐵:
𝐴 × 𝐵 = 𝐶 ∈ P(𝐴 ∪ 𝐵) :


(𝑎, 𝑏) ∈ 𝐴 × 𝐵 ⇐⇒ (𝑎 ∈ 𝐴 ∧ 𝑏 ∈ 𝐵). ∃𝑎 : ∃𝑏 : 𝑎 ∈ 𝐴, 𝑏 ∈ 𝐵,
𝐶 = {𝑎, {𝑎, 𝑏}}

Se rappresentiamo gli elementi di 𝐴 come dei punti su una retta orizzontale


(asse delle 𝑥 ) e gli elementi di 𝐵 come dei punti su una retta verticale (asse delle
𝑦 ) gli elementi di 𝐴 × 𝐵 possono essere rappresentati come i punti del piano che
proiettati sull’asse delle 𝑥 vanno in 𝐴 e proiettati sull’asse delle 𝑦 vanno in 𝐵.
relazione
Una relazione 𝑅 tra gli elementi di un insieme 𝐴 e gli elementi di un insieme
𝐵 non è altro che un sottoinsieme di 𝐴 × 𝐵. Per una relazione 𝑅 ⊆ 𝐴 × 𝐵 si
userà la notazione infissa 𝑎𝑅𝑏 per indicare (𝑎, 𝑏) ∈ 𝑅 . Ad esempio se prendo
6 1 fondamenti

𝐴
𝐵
𝐵 𝑓
(𝑎2 ,𝑏 3 ) (𝑎4 ,𝑏 3 ) 𝑎1
𝑏3 𝑏1
(𝑎 3 ,𝑏 2 ) 𝑎2
𝑏2 𝑏2
(𝑎1 ,𝑏 1 ) 𝑎3
Figura 1.1: La funzione 𝑓 : 𝐴 → 𝐵, 𝑓 = 𝑏1 𝑏3
{𝑎1 ↦→ 𝑏1 , 𝑎2 ↦→ 𝑏 3 , 𝑎3 ↦→ 𝑏2 , 𝑎4 ↦→ 𝑏3 } 𝑎4
rappresentata tramite grafico e tramite 𝐴
diagrammi di Venn. 𝑎1 𝑎2 𝑎3 𝑎4

𝐴 = 𝐵 = {1 , 2 , 3} e considero la relazione 𝑅 = {(1, 2), (1 , 3), (2 , 3)} il predicato


𝑎𝑅𝑏 rappresenta l’usuale relazione d’ordine 𝑎 < 𝑏 sui tre numeri considerati.

Definizione 1.2 (relazione di equivalenza). Se 𝑅 ⊆ 𝐴 × 𝐴 è una relazione


relazione di equivalenza sull’insieme 𝐴, diremo che 𝑅 è una relazione di equivalenza se valgono le seguenti
proprietà (tipiche dell’uguaglianza)

1. riflessiva: 𝑥𝑅𝑥 ;
2. simmetrica: se 𝑥𝑅𝑦 allora 𝑦𝑅𝑥 ;
3. transitiva: 𝑥𝑅𝑦 e 𝑦𝑅𝑧 allora 𝑥𝑅𝑧 .

Se 𝑅 è una relazione di equivalenza diremo che 𝑥 è equivalente a 𝑦 (tramite 𝑅 ) se 𝑥𝑅𝑦 .


Dato 𝑥 ∈ 𝐴 l’insieme di tutti gli elementi di 𝐴 che sono equivalenti a 𝑦 tramite 𝑅 si
classe di equivalenza
chiama classe di equivalenza di 𝑥 . Si definisce in questo modo:

[𝑥]𝑅 = {𝑦 ∈ 𝐴 : 𝑥𝑅𝑦}.
insieme quoziente
Se 𝑅 è una relazione di equivalenza su 𝐴 definiamo l’insieme quoziente come l’insieme
di tutte le classi di equivalenza:

𝐴/𝑅 = {[𝑥]𝑅 : 𝑥 ∈ 𝐴} = {𝐵 ∈ P(𝐴) : ∃𝑥 ∈ 𝐴 𝐵 = [𝑥]}.

Se 𝑅 è una relazione 𝐴 l’insieme quoziente 𝐴/𝑅 rappresenta l’insieme degli


oggetti di 𝐴 in cui vengono identificati tra loro gli oggetti equivalenti. Spesso
diremo che 𝐴/𝑅 rappresenta 𝐴 a meno della equivalenza 𝑅 .

Ad esempio se 𝐴 = {1 , 2 , 3 , 4 , 5} e prendiamo 𝐷 = {1 , 3 , 5} (i numeri dispari)


e 𝑃 = {2 , 4} = 𝐴 \ 𝐵 (i numeri pari) possiamo definire una relazione 𝑅 su 𝐴
mediante la proprietà:

𝑥𝑅𝑦 ⇐⇒ (𝑥 ∈ 𝑃 ∧ 𝑦 ∈ 𝑃) ∨ (𝑥 ∈ 𝐷 ∧ 𝑦 ∈ 𝐷).

La relazione 𝑅 rappresenta la proprietà degli elementi di 𝐴 di avere la stessa


“parità”. Si avrà [1]𝑅 = [3]𝑅 = [5]𝑅 = 𝐷 e [2]𝑅 = [4]𝑅 = 𝑃 . Dunque

𝐴/𝑅 = {𝑃, 𝐷}

e, in effetti, questo insieme ha due elementi 𝑃 e 𝐷 che è quello che si ottiene


identificando i numeri di 𝐴 in base alla proprietà di essere pari o dispari.
1.4 funzioni 7

1.4 funzioni

Per introdurre il concetto di funzione è utile utilizzare una notazione alternativa


per la coppia: invece di denotarla con (𝑎, 𝑏) useremo la notazione 𝑎 ↦→ 𝑏 e
penseremo intuitivamente alla coppia come ad una freccia che collega l’oggetto
𝑎 all’oggetto 𝑏 . Dunque il prodotto cartesiano 𝐴 × 𝐵 risulta essere l’insieme di
tutte le frecce che partono dagli elementi di 𝐴 e arrivano agli elementi di 𝐵.

Una funzione 𝑓 : 𝐴 → 𝐵 è un insieme di frecce che mandano ogni punto di 𝐴


in modo univoco in un punto di 𝐵. Formalmente 𝑓 è quindi un sottoinsieme di
𝐴 × 𝐵 (ed è quindi una relazione) con la proprietà che per ogni 𝑎 ∈ 𝐴 c’è una
ed una sola freccia uscente da 𝑎 : esiste cioè un unico 𝑏 ∈ 𝐵 tale che (𝑎, 𝑏) ∈ 𝑓 .
𝑓
Invece di scrivere (𝑎, 𝑏) ∈ 𝑓 potremo scrivere in modo più espressivo 𝑎 ↦→ 𝑏 .
𝑓
Dato 𝑎 ∈ 𝐴 esiste dunque un unico 𝑏 ∈ 𝐵 tale che 𝑎 ↦→ 𝑏 : chiameremo 𝑓 (𝑎) tale
oggetto 𝑏 . Si avrà dunque

𝑓
𝑏 = 𝑓 (𝑎) ⇐⇒ 𝑎 ↦→ 𝑏.

L’insieme di tutte le funzioni 𝑓 : 𝐴 → 𝐵 viene usualmente denotato con 𝐵 𝐴 . 𝐵𝐴

L’insieme 𝐴 viene chiamato dominio della funzione 𝑓 , l’insieme 𝐵 viene chiamato dominio
codominio. La funzione 𝑓 rappresenta quindi un modo di assegnare in maniera
codominio
univoca ad ogni elemento del dominio un elemento del codominio. Da un
punto di vista informatico potremmo dire che 𝐴 è l’insieme dei possibili input e
𝐵 è l’insieme dei possibili output della funzione 𝑓 .

Sebbene abbiamo costruito il concetto di funzione utilizzando la teoria degli


insiemi, nel seguito non assumeremo mai che le funzioni siano state definite in
questo modo, ma useremo solamente le loro proprietà senza andare ad indagare
quale sia esattamente la loro costruzione interna. Quindi invece di scrivere
(𝑎, 𝑏) ∈ 𝑓 scriveremo sempre 𝑓 (𝑎) = 𝑏 . Sarà comunque molto importante
considerare l’insieme che rappresenta 𝑓 ma questo verrà chiamato grafico di 𝑓 , grafico
𝐺 𝑓 e potrà essere definito in questo modo:

𝐺 𝑓 = {(𝑥, 𝑦) ∈ 𝐴 × 𝐵 : 𝑓 (𝑥) = 𝑦}.

Nella nostra costruzione risulta effettivamente 𝐺 𝑓 = 𝑓 . Anticipiamo fin da


subito che lo studio dei grafici delle funzioni reali è uno degli argomenti
principali di questo corso.

Capita molto spesso che un fenomeno possa essere modellizzato matematica-


mente tramite una funzione: si sa che ad un certo input 𝑎 corrisponde un output
𝑏 = 𝑓 (𝑎). Molto spesso il problema da risolvere è quello di determinare l’input
giusto 𝑎 per ottenere l’output voluto 𝑏 . Questo problema corrisponde ad invertire
la funzione 𝑓 : dato 𝑏 ∈ 𝐵 determinare 𝑥 ∈ 𝐴 tale che 𝑓 (𝑥) = 𝑏 .
surgettiva
Una funzione 𝑓 : 𝐴 → 𝐵 si dice essere surgettiva (o suriettiva) se per ogni 𝑏 ∈ 𝐵
esiste almeno un 𝑥 ∈ 𝐴 per cui 𝑓 (𝑥) = 𝑏 . Questo significa che il problema
dell’inversione ha almeno una soluzione, qualunque sia 𝑏 ∈ 𝐵. Una funzione
iniettiva
𝑓 : 𝐴 → 𝐵 si dice essere iniettiva se non esistono due punti distinti 𝑎, 𝑎 0 ∈ 𝐴,
𝑎 ≠ 𝑎 0 tali che 𝑓 (𝑎) = 𝑓 (𝑎 0). Questo significa che il problema dell’inversione
8 1 fondamenti

𝑓 (𝑥) = 𝑏 ha al più una soluzione (la soluzione, se esiste, è unica). Una funzione
bigettiva
𝑓 : 𝐴 → 𝐵 si dice essere bigettiva (o biettiva) o invertibile se è sia iniettiva che
surgettiva. Questo significa che il problema dell’inversione 𝑓 (𝑥) = 𝑏 ha una
invertibile unica soluzione 𝑥 ∈ 𝐴 qualunque sia 𝑏 ∈ 𝐵. In particolare, se 𝑓 è invertibile,
Attenzione: in alcuni testi (tra cui [2]) per ogni 𝑏 ∈ 𝐵 esiste un unico 𝑎 ∈ 𝐴 per cui 𝑓 (𝑎) = 𝑏 . Chiamato 𝑎 = 𝑔(𝑏)
si considerano invertibili le funzioni l’unico 𝑎 ∈ 𝐴 per cui 𝑓 (𝑎) = 𝑏 si ottiene dunque una funzione 𝑔 : 𝐵 → 𝐴 con le
iniettive, anche se non surgettive.
proprietà:
∀𝑎 ∈ 𝐴 : 𝑔( 𝑓 (𝑎)) = 𝑎, ∀𝑏 ∈ 𝐵 : 𝑓 (𝑔(𝑏)) = 𝑏.

funzione inversa
Una funzione 𝑔 con queste proprietà viene chiamata funzione inversa di 𝑓 e viene
usualmente denotata con il simbolo 𝑓 −1 .

Se 𝑓 : 𝐴 → 𝐵 e 𝑔 : 𝐵 → 𝐶 sono due funzioni in cui il codominio della prima


funzione composta coincide con il dominio della seconda, allora definiamo la funzione composta
𝑔 ◦ 𝑓 : 𝐴 → 𝐶 che si ottiene applicando prima 𝑓 e poi 𝑔 :

(𝑔 ◦ 𝑓 )(𝑥) = 𝑔( 𝑓 (𝑥)).

Se il codominio di 𝑓 non coincide col dominio di 𝑔 è possibile dare comunque


senso alla funzione 𝑔 ◦ 𝑓 che risulta però definita solamente nei punti del
dominio di 𝑓 che vengono mandati, tramite 𝑓 nel dominio di 𝑔 .

Introduciamo ora delle notazioni che sarà comodo utilizzare nel seguito. Se
𝑓 : 𝐴 → 𝐵 è una funzione e se 𝐶 ⊆ 𝐴 definiamo

𝑓 (𝐶) = { 𝑓 (𝑎) : 𝑎 ∈ 𝐶} = {𝑏 ∈ 𝐵 : ∃𝑎 ∈ 𝐶 : 𝑏 = 𝑓 (𝑎)}.


insieme immagine
L’insieme 𝑓 (𝐶) ⊆ 𝐵 si chiama immagine di 𝐶 (tramite 𝑓 ) ed è formato da tutti
i punti che si ottengono applicando 𝑓 agli elementi di 𝐶 . L’immagine 𝑓 (𝐴)
dell’intero dominio 𝐴 si chiama immagine di 𝑓 . Si noti che 𝑓 è surgettiva se
e solo se 𝑓 (𝐴) = 𝐵 (cioè se l’immagine coincide col codominio). Anche se
𝑓 : 𝐴 → 𝐵 non fosse iniettiva, per ogni 𝐶 ⊆ 𝐵 possiamo definire

𝑓 −1 (𝐶) = {𝑎 ∈ 𝐴 : 𝑓 (𝑎) ∈ 𝐶}.


preimmagine
L’insieme 𝑓 −1 (𝐶) ⊆ 𝐴 si chiama preimmagine o controimmagine di 𝐶 (tramite 𝑓 )
ed è formato da tutti i punti di 𝐴 che applicando 𝑓 vanno in 𝐶 . Si noti che se
𝑏 ∈ 𝐵 l’insieme 𝑓 −1 ({𝑏}) non è altro che l’insieme delle soluzioni dell’equazione
𝑓 (𝑥) = 𝑏 . Come abbiamo già visto tale insieme contiene almeno un elemento se
𝑓 è suriettiva, contiene al più un elemento se 𝑓 è iniettiva e contiene esattamente
un elemento 𝑓 −1 ({𝑏}) = 𝑓 −1 (𝑏) se 𝑓 è bigettiva.

La notazione 𝑓 (𝐶) appena introdotta è formalmente ambigua in quanto potrebbe


non essere chiaro se 𝐶 è un elemento oppure un sottoinsieme del dominio di 𝑓 .
In pratica il contesto dovrebbe rendere chiaro cosa si intende.

Più in generale ci capiterà di estendere questo abuso di notazione non solo alle
funzioni, ma anche alle relazioni e alle operazioni. Ad esempio se 𝐴 e 𝐵 sono
insiemi di numeri ci capiterà di scrivere 𝐴 ≤ 𝐵 per indendere che ogni elemento
di 𝐴 è minore o uguale ad ogni elemento di 𝐵 oppure 𝐴 + 𝐵 per intendere
l’insieme di tutti i numeri che si ottengono sommando un numero di 𝐴 ad un
numero di 𝐵.
1.5 cardinalità 9

𝐴
𝐴\𝐵
𝐵

Figura 1.2: Nella dimostrazione del teo-


rema di Cantor-Bernstein 𝐴 è rappresen-
tato da un quadrato e 𝐵 da un cerchio
contenuto in 𝐴. L’immagine di 𝐴 in 𝐵 è
rappresentata da un quadrato contenuto
in 𝐵 e così via. La parte ombreggiata è
l’insieme 𝐷 .

1.5 cardinalità

Definizione 1.3 (cardinalità). Diremo che due insiemi 𝐴 e 𝐵 hanno la stessa


cardinalità (oppure sono equipotenti) se esiste una funzione bigettiva 𝑓 : 𝐴 → 𝐵. cardinalità
Scriveremo in tal caso:
#𝐴 = #𝐵.
Se esiste una funzione iniettiva 𝑓 : 𝐴 → 𝐵 significa che 𝐴 ha la stessa cardinalità di un
sottoinsieme di 𝐵 (in quanto 𝑓 : 𝐴 → 𝑓 (𝐴) risulta essere bigettiva). Scriveremo in tal
caso:
#𝐴 ≤ #𝐵.

Intuitivamente se due insiemi hanno la stessa cardinalità significa che hanno lo


stesso numero di elementi. Ma la precedente definizione riesce a catturare tale
concetto senza dover ricorrere al concetto di numero. Questo ha il vantaggio
che questa definizione si applica a qualunque insieme, anche con un numero
“infinito” di elementi.

Si osservi che non abbiamo dato una definizione di #𝐴 e quindi non stiamo
definendo la cardinalità di un insieme ma stiamo soltanto definendo una
relazione tra insiemi che denotiamo, impropriamente, come una uguaglianza:
#𝐴 = #𝐵. E’ ovvio che #𝐴 = #𝐴 in quanto l’identità 𝑓 : 𝐴 → 𝐴, 𝑓 (𝑥) = 𝑥 è
bigettiva. E’ anche chiaro che se #𝐴 = #𝐵 e #𝐵 = #𝐶 allora #𝐴 = #𝐶 in quanto
componendo tra loro due funzioni bigettive si ottiene ancora una funzione
bigettiva.

Il seguente teorema giustifica l’utilizzo del simbolo ≤ nella definizione prece-


dente.

Teorema 1.4 (Cantor-Bernstein). Se #𝐴 ≤ #𝐵 e #𝐵 ≤ #𝐴 allora #𝐴 = #𝐵.

Dimostrazione. Per prima cosa al posto dell’ipotesi #𝐵 ≤ #𝐴 prendiamo l’ipotesi


apparentemente più forte 𝐵 ⊆ 𝐴. Vedremo alla fine che questa ipotesi non ci fa
perdere di generalità.

Essendo per ipotesi #𝐴 ≤ #𝐵 esiste 𝑓 : 𝐴 → 𝐵 iniettiva. Intuitivamente l’idea è


quella di definire l’insieme

𝐷 = (𝐴 \ 𝐵) ∪ 𝑓 (𝐴 \ 𝐵) ∪ 𝑓 2 (𝐴 \ 𝐵) ∪ . . .
10 1 fondamenti

e di definire la biezione 𝜑 : 𝐴 → 𝐵 mandando ogni "buccia" 𝑓 𝑛 (𝐴 \ 𝐵) in


𝑓 𝑛+1 (𝐴 \ 𝐵) e lasciando fisso il resto di 𝐵.
Per farlo in maniera rigorosa consideriamo allora la famiglia di insiemi F =
{𝑋 ⊆ 𝐴 : 𝑋 ⊇ 𝐴 \ 𝐵, 𝑓 (𝑋) ⊆ 𝑋} e definiamo 𝐷 = F. Osserviamo che 𝐴 ∈ F
T
quindi F ≠ ∅.

E’ facile verificare che 𝑓 (𝐷) ⊆ 𝐷 infatti dato 𝑥 ∈ 𝐷 per ogni 𝑋 ∈ F deve essere
𝑥 ∈ 𝑋 ma allora 𝑓 (𝑥) ∈ 𝑋 (per come è definito F), dunque 𝑓 (𝑥) ∈ 𝐷 . In modo
analogo si dimostra che 𝐷 ⊇ 𝐴 \ 𝐵 e dunque concludiamo che 𝐷 ∈ F.

Verifichiamo ora che 𝑓 (𝐷) = 𝐷 ∩ 𝐵. Da un lato se 𝑥 ∈ 𝐷 allora 𝑓 (𝑥) ∈ 𝑓 (𝐷) ⊆ 𝐷


e 𝑓 (𝑥) ⊆ 𝑓 (𝐴) ⊆ 𝐵 da cui 𝑓 (𝑥) ∈ 𝐷 ∩ 𝐵. Dall’altro lato se 𝑦 ∈ 𝐷 ∩ 𝐵 e non fosse
𝑦 ∈ 𝑓 (𝐷) allora potremmo considerare l’insieme 𝑋 = 𝐷 \ {𝑦} e osservare che
𝑋 ∈ F. Infatti in primo luogo 𝑋 ⊇ 𝐴 \ 𝐵 in quanto 𝐷 ha questa proprietà e
𝑦 ∈ 𝐵. Inoltre dato qualunque 𝑥 ∈ 𝑋 visto che 𝑋 ⊆ 𝐷 allora 𝑓 (𝑥) ∈ 𝑓 (𝐷) e, per
ipotesi, 𝑦 ∉ 𝑓 (𝐷) dunque 𝑓 (𝑥) ≠ 𝑦 da cui 𝑓 (𝑥) ∈ 𝑋 . Dunque 𝑋 ∈ F ma allora
dovrebbe essere 𝐷 ⊆ 𝑋 mentre per costruzione abbiamo 𝑦 ∈ 𝐷 ma non in 𝑋 .

Possiamo allora definire 𝜑 : 𝐴 → 𝐵


(
𝑓 (𝑥) se 𝑥 ∈ 𝐷,
𝜑(𝑥) =
𝑥 altrimenti.

Chiaramente 𝜑 è iniettiva in quanto 𝑓 è iniettiva e manda 𝐷 in 𝐷 e l’identità è


iniettiva e manda 𝐴 \ 𝐷 in 𝐴 \ 𝐷 .

Per dimostrare che 𝜑 è suriettiva consideriamo qualunque 𝑦 ∈ 𝐵. Se 𝑦 ∉ 𝐷


allora 𝜑(𝑦) = 𝑦 . Se invece 𝑦 ∈ 𝐷 essendo 𝑦 ∈ 𝐷 ∩ 𝐵 = 𝑓 (𝐷) esisterà 𝑥 ∈ 𝐷 tale
che 𝜑(𝑥) = 𝑓 (𝑥) = 𝑦 .

Abbiamo dimostrato il teorema nel caso 𝐵 ⊆ 𝐴. Nel caso generale sappiamo


che esiste 𝑓 : 𝐴 → 𝐵 iniettiva ed esiste 𝑔 : 𝐵 → 𝐴 iniettiva. Definiamo 𝐵˜ = 𝑔(𝐵)
e definiamo 𝑓˜ : 𝐴 → 𝐵˜ tramite 𝑓˜(𝑥) = 𝑔( 𝑓 (𝑥)). Chiaramente 𝐵˜ ⊆ 𝐴 e 𝑓˜ è
iniettiva. Dunque ci siamo ricondotti alle ipotesi particolari e sappiamo che
esiste 𝜑˜ : 𝐴 → 𝐵˜ bigettiva. Ma allora possiamo definire 𝜑 : 𝐴 → 𝐵 come
𝜑(𝑥) = 𝑔 −1 ( 𝜑(𝑥))
˜ . Essendo 𝜑(𝐴)
˜ = 𝐵˜ ed essendo 𝑔 : 𝐵 → 𝐵˜ bigettiva, risulta
che anche 𝜑 sia bigettiva.

Se #𝐴 ≤ #𝐵 esiste 𝑓 : 𝐴 → 𝐵 iniettiva e possiamo considerare l’insieme


immagine 𝐶 = 𝑓 (𝐴) e osservare che 𝑓 : 𝐴 → 𝐶 risulta essere bigettiva. Dunque
#𝐴 ≤ #𝐵 è equivalente a richiedere che esista 𝐶 ⊆ 𝐵 tale che #𝐴 = #𝐶 . In tal
caso, se 𝐴 non è vuoto, è anche possibile dimostrare che esiste una funzione
𝑔 : 𝐵 → 𝐴 surgettiva, in quanto si può prendere l’inversa di 𝑓 : 𝐴 → 𝐶 ed
estenderla ad un valore fissato qualunque 𝑎 0 ∈ 𝐴 sui punti di 𝐵 \ 𝐶 . Significa
che se #𝐴 ≤ #𝐵 esiste una funzione surgettiva 𝑔 : 𝐵 → 𝐴. Tale funzione 𝑔 ha la
inversa sinistra proprietà che 𝑔( 𝑓 (𝑎)) = 𝑎 per ogni 𝑎 ∈ 𝐴 e si chiama dunque inversa sinistra di
𝑓.
Viceversa se esiste 𝑓 : 𝐴 → 𝐵 surgettiva per ogni 𝑏 ∈ 𝐵 l’insieme 𝑓 −1 ({𝑏}) non è
mai vuoto e quindi è chiaro che debba esistere una funzione 𝑔 : 𝐵 → 𝐴 tale che
𝑔(𝑏) è un elemento di tale insieme e dunque 𝑓 (𝑔(𝑏)) = 𝑏 . In tal caso 𝑔 è una
inversa destra funzione iniettiva che si chiama inversa destra di 𝑓 . Abbiamo quindi dimostrato
1.6 i numeri naturali 11

che se esiste 𝑓 : 𝐴 → 𝐵 surgettiva allora #𝐵 ≤ #𝐴.

Per quanto questo possa sembrare strano il procedimento che ci garantisce di


poter definire la funzione 𝑔 necessita di un apposito assioma.

Assioma 1.5 (della scelta). Siq 𝐹 : 𝐴 → P(𝐵) una funzione tale che 𝑓 (𝑎) ≠ ∅ per
ogni 𝑎 ∈ 𝐴. Allora esiste una funzione 𝑓 : 𝐴 → 𝐵 tale che 𝑓 (𝑎) ∈ 𝐹(𝑎) per ogni
𝑎 ∈ 𝐴.

L’assioma della scelta (denotato spesso con 𝐴𝐶 , axiom of choice) è un assioma 𝐴𝐶


per certi versi controverso e alcuni matematici preferiscono non utilizzarlo nelle
loro dimostrazioni. La teoria degli insiemi senza l’assioma della scelta si chiama
𝑍𝐹 (Zermelo-Fraenkel) mentre se si aggiunge l’assioma della scelta (choice) la 𝑍𝐹
teoria si chiama 𝑍𝐹𝐶 .
𝑍𝐹𝐶

1.6 i numeri naturali


Giuseppe Peano (1858–1932), matemati-
co torinese, contribuì a porre i fondamen-
Definizione 1.6 (assiomi di Peano). Un insieme ℕ dotato di una funzione 𝜎 : ℕ → ℕ
ti della logica matematica. La notazione
e di un elemento 0 ∈ ℕ che soddisfano le seguenti proprietà si dice essere un insieme di ∃ per il quantificatore universale si deve
numeri naturali se valgono le seguenti proprietà: a lui.

1. 𝜎 è iniettiva: se 𝜎(𝑚) = 𝜎(𝑛) allora 𝑚 = 𝑛 ; numeri naturali

2. per ogni 𝑛 ∈ ℕ si ha 𝜎(𝑛) ≠ 0;


3. induttività: se 𝐴 ⊆ ℕ è un sottoinsieme tale che
i) 0 ∈ 𝐴;
ii) 𝑛 ∈ 𝐴 =⇒ 𝜎(𝑛) ∈ 𝐴
allora 𝐴 = ℕ .
La definizione originale di Peano pren-
deva 1 come primo numero naturale ma
Dato 𝑛 ∈ ℕ il numero 𝜎(𝑛) si chiama il successore di 𝑛 . Il numero 0 ∈ ℕ che
nella matematica moderna risulta più
per assioma non è il successore di nessun’altro numero naturale si chiama zero. comodo includere anche 0 tra i numeri
Possiamo anche dare un nome ai primi nove numeri naturali: naturali, così come si considera il vuoto
come un insieme valido.
1 = 𝜎(0), 2 = 𝜎(1), 3 = 𝜎(2), 4 = 𝜎(3), 5 = 𝜎(4), successore
6 = 𝜎(5), 7 = 𝜎(6), 8 = 𝜎(7), 9 = 𝜎(8) zero

cosicché intuiamo come la funzione 𝜎 rappresenti l’usuale operazione del


contare:
𝜎 𝜎 𝜎 𝜎 𝜎 𝜎 𝜎
0 ↦→ 1 ↦→ 2 ↦→ 3 ↦→ 4 ↦→ 5 ↦→ 6 ↦→ . . .
Il primi due assiomi servono a garantire che in questo processo del contare contare
troviamo sempre numeri diversi (non si torna mai indietro) in quanto nessun
numero può avere come successore 0 o un numero già incontrato in precedenza
(che se non è zero è il successore di un altro numero).

L’ultimo assioma serve a garantire che questo processo del contare esaurisce
tutti i numeri naturali, e che quindi non ci sono dei naturali irraggiungibili
partendo da zero.

Normalmente la proprietà induttiva dei numeri naturali viene utilizzata tramite Il principio di induzione non è un teore-
ma della teoria degli insiemi in quanto
il seguente meta-teorema. si riferisce il concetto di predicato che è
esterno al sistema stesso.
12 1 fondamenti

Teorema 1.7 (principio di induzione). Sia 𝑃(𝑛) un predicato. Se

1. vale 𝑃(0) e
2. ∀𝑛 ∈ ℕ : 𝑃(𝑛) =⇒ 𝑃(𝑛 + 1)

allora 𝑃(𝑛) è vero per ogni 𝑛 ∈ ℕ .

Dimostrazione. Consideriamo l’insieme 𝐴 = {𝑛 ∈ ℕ : 𝑃(𝑛)}. Grazie alle ipotesi


del teorema possiamo applicare la proprietà induttiva dei numeri naturali per
dedurre che 𝐴 = ℕ . Dunque 𝑃(𝑛) è soddisfatta per ogni 𝑛 ∈ ℕ .

Il fatto che 𝜎 : ℕ → ℕ sia iniettiva ma non suriettiva significa che ℕ può essere
messo in corrispondenza biunivoca con 𝜎(ℕ ) che è un sottoinsieme proprio di ℕ .
In particolare #ℕ = #(ℕ \ {0}). Questa proprietà è per certi versi paradossale
ed identifica gli insiemi infiniti, nel senso di Dedekind:
insieme finito

Definizione 1.8 (Dedekind infinito). Diremo che un insieme 𝑋 è finito (più


insieme infinito precisamente: Dedekind-finito) se ogni funzione iniettiva 𝑓 : 𝑋 → 𝑋 è bigettiva.

Diremo che un insieme 𝑋 è infinito (più precisamente Dedekind-infinito) se non è finito


ovvero se se esiste 𝑓 : 𝑋 → 𝑋 iniettiva ma non suriettiva.
Un sottoinsieme 𝐴 di un insieme di 𝑋 si
chiama anche parte. Se 𝐴 ⊆ 𝑋 , 𝐴 ≠ 𝑋 si
dice che 𝐴 è una parte propria di 𝑋 . In particolare un insieme infinito può essere messo in corrispondenza biunivoca
L’insieme ℕ dei numeri naturali è il più con una sua parte propria in quanto 𝑓 : 𝑋 → 𝑓 (𝑋) è bigettiva e 𝑋 \ 𝑓 (𝑋) ≠ ∅.
piccolo insieme infinito

induttivo
Se 𝑋 è un qualunque insieme infinito, dentro 𝑋 possiamo costruire un insieme
che soddisfa gli assiomi di Peano. Infatti fissata 𝑓 : 𝑋 → 𝑋 iniettiva ma non
suriettiva basta scegliere 0 ∈ 𝑋 \ 𝑓 (𝑋). Dopodiché diciamo che un sottoinsieme
𝐼 ⊆ 𝑋 è induttivo se 0 ∈ 𝐼 e se 𝑛 ∈ 𝐼 =⇒ 𝑓 (𝑛) ∈ 𝐼 . Possiamo quindi definire:
\
ℕ= 𝐼
𝐼 ⊆ 𝑋 induttivo

e osservare che ovviamente ℕ stesso è un sottoinsieme induttivo di 𝑋 . Dunque


se 𝑛 ∈ ℕ si ha 𝑓 (𝑛) ∈ ℕ e quindi la restrizione di 𝑓 a ℕ è una funzione 𝜎 : ℕ → ℕ
che è certamente iniettiva (in quanto restrizione di una funzione iniettiva) non è
suriettiva (in quanto 0 non è nell’immagine di 𝑓 e tantomeno nell’immagine di
𝜎) e soddisfa la proprietà induttiva perche se prendiamo 𝐴 ⊆ ℕ tale che 0 ∈ 𝐴
e 𝑛 ∈ 𝐴 =⇒ 𝜎(𝑛) ∈ 𝐴 allora significa che 𝐴 è induttivo e quindi, per come è
definito ℕ , deve essere ℕ ⊆ 𝐴. Dunque 𝐴 = ℕ .

Per garantire l’esistenza dell’insieme dei numeri naturali basta quindi supporre
che esista almeno un insieme infinito. Sarà opportuno prendere questo come
assioma perché se esaminiamo gli assiomi che abbiamo introdotto finora ci
accorgiamo che l’insieme vuoto e tutti gli insiemi che possono essere costruiti a
partire da esso sono tutti finiti.

Assioma 1.9 (infinito). Esiste un insieme infinito. E non è restrittivo supporre che
tale insieme sia un insieme ℕ che soddisfa gli assiomi di Peano.
1.6 i numeri naturali 13

Teorema 1.10 (definizione per induzione). Sia 𝑋 un insieme, sia 𝛼 ∈ 𝑋 e sia


𝑔 : 𝑋 → 𝑋 una funzione. Allora esiste una unica funzione 𝑓 : ℕ → 𝑋 tale che
(
𝑓 (0) = 𝛼,
(1.4)
𝑓 (𝜎(𝑛)) = 𝑔( 𝑓 (𝑛)).

Si avrà dunque

𝑓 (0) = 𝛼, 𝑓 (1) = 𝑔(𝛼), 𝑓 (2) = 𝑔(𝑔(𝛼)), 𝑓 (3) = 𝑔(𝑔(𝑔(𝛼))) . . .

Più in generale se abbiamo 𝛼 ∈ 𝑋 e una funzione 𝑔 : ℕ × 𝑋 → 𝑋 esisterà una unica


funzione 𝑓 : ℕ → 𝑋 tale che
(
𝑓 (0) = 𝛼,
(1.5)
𝑓 (𝜎(𝑛)) = 𝑔(𝑛, 𝑓 (𝑛)).

Dimostrazione. Dobbiamo ricordarci che le funzioni 𝑓 : ℕ → 𝑋 non sono altro


che relazioni e cioè sottoinsiemi del prodotto ℕ × 𝑋 . L’idea è quindi di prendere
il più piccolo sottoinsieme di ℕ × 𝑋 che possa rappresentare una funzione con
le proprietà richieste. Consideriamo dunque la famiglia di insiemi:

F = {𝐹 ∈ P(ℕ × 𝑋) : (0, 𝛼) ∈ 𝐹, (𝑛, 𝑥) ∈ 𝐹 ⇒ (𝜎(𝑛), 𝑔(𝑥)) ∈ 𝐹}.

Chiaramente F non è vuota in quanto ℕ × 𝑋 ∈ F. Possiamo dunque farne


l’intersezione e definire un insieme 𝑓 :
\
𝑓 = 𝐹.
𝐹∈F

L’insieme 𝑓 che abbiamo definito rappresenta una relazione tra ℕ e 𝑋 . Visto


che (0 , 𝛼) ∈ 𝐹 per ogni 𝐹 ∈ F dovrà essere (0 , 𝛼) ∈ 𝑓 . Inoltre se (𝑛, 𝑥) ∈ 𝑓
allora (𝑛, 𝑥) ∈ 𝐹 per ogni 𝐹 ∈ F e quindi (𝜎(𝑛), 𝑔(𝑥)) ∈ 𝐹 per ogni 𝐹 ∈ F da cui
(𝜎(𝑛), 𝑔(𝑥)) ∈ 𝑓 . Significa che 𝑓 ∈ F.

Vogliamo ora dimostrare che 𝑓 è una funzione, cioè che è univocamente definita
su tutto ℕ . Per prima cosa consideriamo l’insieme su cui 𝑓 è definita e cioè
𝐴 = {𝑛 ∈ ℕ : ∃𝑥 ∈ 𝑋 : (𝑛, 𝑥) ∈ 𝑓 } e dimostriamo, per induzione, che 𝐴 = ℕ . In
effetti (0 , 𝛼) ∈ 𝑓 quindi 0 ∈ 𝐴. E se 𝑛 ∈ 𝐴 sappiamo che esiste 𝑥 ∈ 𝑋 tale che
(𝑛, 𝑥) ∈ 𝑓 e dunque, essendo 𝑓 ∈ F, anche (𝜎(𝑛), 𝑔(𝑥)) ∈ 𝑓 da cui 𝜎(𝑛) ∈ 𝐴.
Abbiamo dimostrato che 𝑓 è definita su tutto ℕ .

Dimostriamo ora che 𝑓 è univoca. Consideriamo l’insieme su cui 𝑓 è uni-


vocamente definita: 𝐵 = {𝑛 ∈ ℕ : ∃! 𝑥 ∈ 𝑋 : (𝑛, 𝑥) ∈ 𝑓 }. Di nuovo vogliamo
dimostrare per induzione che 𝐵 = ℕ . Per dimostrare che 0 ∈ 𝐵, visto che già
sappiamo che (0 , 𝛼) ∈ 𝑓 , dobbiamo dimostrare che se 𝑥 ≠ 𝛼 si ha (0 , 𝑥) ∉ 𝑓 . Sia
dunque 𝑥 ≠ 𝛼 e consideriamo l’insieme 𝐹 = 𝑓 \ {(0 , 𝑥)}. Chiaramente 𝐹 ∈ F
in quanto (0 , 𝛼) ∈ 𝐹 visto che (0 , 𝛼) ∈ 𝑓 e (0 , 𝛼) ≠ (0 , 𝑥) inoltre se (𝑛, 𝑦) ∈ 𝐹
allora (𝑛, 𝑦) ∈ 𝑓 e quindi (𝜎(𝑛), 𝑔(𝑦)) ∈ 𝑓 . Ma certamente (𝜎(𝑛), 𝑔(𝑦)) ≠ (0 , 𝑥)
in quanto 𝜎(𝑛) ≠ 0 dunque (𝜎(𝑛), 𝑔(𝑦)) ∈ 𝐹 . Visto che 𝐹 ∈ F si deve avere
𝑓 ⊆ 𝐹 e dunque (0 , 𝑥) ∉ 𝑓 . Dunque 𝑓 è univocamente definita in 0.
14 1 fondamenti

Dobbiamo ora mostrare che se 𝑛 ∈ 𝐵 anche 𝜎(𝑛) ∈ 𝐵. Se 𝑛 ∈ 𝐵 significa che c’è


un unico 𝑥 ∈ 𝑋 tale che (𝑛, 𝑥) ∈ 𝑓 e certamente anche (𝜎(𝑛), 𝑔(𝑥)) ∈ 𝑓 . Pren-
diamo allora 𝑦 ≠ 𝑔(𝑥), vorremo dimostrare che (𝜎(𝑛), 𝑦) ∉ 𝑓 . Consideriamo,
similmente a prima, l’insieme 𝐹 = 𝑓 \ {(𝜎(𝑛), 𝑦)} e cerchiamo di dimostra-
re che 𝐹 ∈ F. Chiaramente (0 , 𝛼) ∈ 𝐹 perché (0 , 𝛼) ∈ 𝑓 e non può essere
(0 , 𝛼) = (𝜎(𝑛), 𝑦) in quanto 𝜎(𝑛) ≠ 0. Se ora supponiamo che sia (𝑚, 𝑧) ∈ 𝐹
certamente sarà (𝑚, 𝑧) ∈ 𝑓 e dunque (𝜎(𝑚), 𝑔(𝑧)) ∈ 𝑓 : dobbiamo mostrare
che (𝜎(𝑚), 𝑔(𝑧)) ∈ 𝐹 . D’altra parte se fosse (𝜎(𝑚), 𝑔(𝑧)) = (𝜎(𝑛), 𝑦) dovrebbe
essere 𝑚 = 𝑛 in quanto 𝜎 è iniettiva. Ma visto che 𝑓 è univocamente definita su
𝑛 dovrà allora essere anche (𝑛, 𝑧) = (𝑛, 𝑥) e quindi 𝑔(𝑧) = 𝑔(𝑥) ≠ 𝑦 . Dunque
(𝜎(𝑚), 𝑔(𝑧)) ∈ 𝐹 e 𝐹 ∈ F. Ma allora 𝑓 ⊆ 𝐹 e quindi (𝜎(𝑛), 𝑦) ∉ 𝑓 . Significa
che 𝑓 è univocamente definita anche in 𝜎(𝑛). Per induzione 𝐵 = ℕ ed 𝑓 è una
funzione 𝑓 : ℕ → 𝑋 .

Ovviamente visto che 𝑓 ∈ F sappiamo che 𝑓 soddisfa le proprietà richieste dal


teorema.

Nella seconda parte del teorema, dove 𝑔 : ℕ ×𝑋 → 𝑋 , possiamo considerare l’in-


sieme 𝑌 = ℕ × 𝑋 e la funzione 𝐺 : 𝑌 → 𝑌 definita da 𝐺(𝑛, 𝑥) = (𝜎(𝑛), 𝑔(𝑛, 𝑥)).
Allora applicando la prima parte possiamo trovare 𝐹 : ℕ → 𝑌 tale che 𝐹(0) =
(0 , 𝛼) e 𝐹(𝜎(𝑛)) = 𝐺(𝐹(𝑛)). Basterà prendere come 𝑓 (𝑛) la seconda componente
di 𝐺(𝑛).

Per induzione possiamo definire la somma tra numeri naturali:


(
𝑛 + 0 = 𝑛,
𝑛 + 𝜎(𝑚) = 𝜎(𝑛 + 𝑚).

Osservando che 𝑛 + 1 = 𝑛 + 𝜎(0) = 𝜎(𝑛 + 0) = 𝜎(𝑛) potremo d’ora in poi scrivere


𝑛 + 1 al posto di 𝜎(𝑛) ed abbandonare la funzione 𝜎. Abbiamo quindi definito
l’addizione in modo che valga 𝑛 + 0 = 𝑛 e 𝑛 + (𝑚 + 1) = (𝑛 + 𝑚) + 1. Possiamo
da questo dedurre le altre proprietà della somma.

Teorema 1.11. L’addizione su ℕ soddisfa le seguenti

1. proprietà associativa: (𝑛 + 𝑚) + 𝑘 = 𝑛 + (𝑚 + 𝑘),


2. elemento neutro: 𝑛 + 0 = 0 + 𝑛 = 𝑛 ,
3. proprietà commutativa: 𝑛 + 𝑚 = 𝑚 + 𝑛 ,
4. proprietà invariantiva: se 𝑚 + 𝑘 = 𝑛 + 𝑘 allora 𝑚 = 𝑛 .

Dimostrazione. Per la proprietà associativa facciamo la dimostrazione per indu-


zione su 𝑘 . Se 𝑘 = 0 è chiaro che (𝑛 + 𝑚) + 0 = 𝑛 + 𝑚 = 𝑛 + (𝑚 + 0). Supponendo
ora di sapere che vale (𝑛 + 𝑚) + 𝑘 = 𝑛 + (𝑚 + 𝑘) cerchiamo di dimostrare che
(𝑛 + 𝑚) + (𝑘 + 1) = 𝑛 + (𝑚 + (𝑘 + 1)). Ricordando la definizione induttiva di
addizione e usando l’ipotesi induttiva si ha

(𝑛 + 𝑚) + (𝑘 + 1) = ((𝑛 + 𝑚) + 𝑘) + 1 = (𝑛 + (𝑚 + 𝑘)) + 1
= 𝑛 + ((𝑚 + 𝑘) + 1) = 𝑛 + (𝑚 + (𝑘 + 1))

come volevamo dimostrare.


1.6 i numeri naturali 15

Per quanto riguarda l’elemento neutro sappiamo per definizione che 𝑛 + 0 = 𝑛 .


Dimostriamo per induzione che vale anche 0 + 𝑛 = 𝑛 . Per 𝑛 = 0 si riconduce al
primo caso. Supponendo per induzione che valga 0 + 𝑛 = 𝑛 possiamo osservare
che per la definizione di addizione si ha:

0 + (𝑛 + 1) = (0 + 𝑛) + 1 = 𝑛 + 1

come volevamo dimostrare.


Consideriamo la proprietà commutativa. Dobbiamo innanzitutto dimostrare
che 𝑛 + 1 = 1 + 𝑛 . Lo facciamo per induzione: se 𝑛 = 0 si applica la proprietà
dell’elemento neutro. Se, per induzione, supponiamo che valga 𝑛 + 1 = 1 + 𝑛
allora si ha
(𝑛 + 1) + 1 = (1 + 𝑛) + 1 = 1 + (𝑛 + 1)
che è quanto dovevamo dimostrare. Possiamo ora dimostrare per induzione su
𝑚 che per ogni 𝑛 vale 𝑛 + 𝑚 = 𝑚 + 𝑛 . Il caso 𝑚 = 0 si riconduce alla proprietà
dell’elemento neutro: 𝑛 + 0 = 𝑛 = 0 + 𝑛 . Se ora per induzione supponiamo
che valga 𝑛 + 𝑚 = 𝑚 + 𝑛 possiamo utilizzare il caso precedente e la proprietà
associativa per ottenere:

𝑛+𝑚+1= 𝑚+𝑛+1= 𝑚+1+𝑛

che è quanto dovevamo dimostrare.


Dimostriamo la proprietà invariantiva per induzione su 𝑘 . Se 𝑘 = 0 è ovvio
che da 𝑚 + 𝑘 = 𝑛 + 𝑘 si possa dedurre 𝑚 = 𝑛 visto che 𝑚 + 0 = 𝑚 e 𝑛 + 0 = 𝑛 .
Supponiamo allora che la proprietà sia valida per un certo 𝑘 e dimostriamola
per 𝑘 + 1. Dunque se vale 𝑚 + 𝑘 + 1 = 𝑛 + 𝑘 + 1 si ha (𝑚 + 1) + 𝑘 = (𝑛 + 1) + 𝑘 e
quindi, per ipotesi induttiva, 𝑚 + 1 = 𝑛 + 1. Scritto in altri termini 𝜎(𝑚) = 𝜎(𝑛)
da cui, grazie al fatto che 𝜎 è iniettiva, si deduce 𝑚 = 𝑛 .

Possiamo ora definire una relazione ≤ su ℕ ponendo

𝑚 ≤ 𝑛 ⇐⇒ ∃𝑘 ∈ ℕ : 𝑛 = 𝑚 + 𝑘.

Se 𝑚 ≤ 𝑛 cioè se esiste 𝑘 ∈ ℕ tale che 𝑛 = 𝑚 + 𝑘 tale numero 𝑘 è unico in quanto


se fosse 𝑚 + 𝑗 = 𝑛 = 𝑚 + 𝑘 potremmo dedurre 𝑘 = 𝑗 dalla proprietà invariantiva
della addizione. Possiamo dunque definire la differenza: 𝑘 = 𝑛 − 𝑚 . differenza
Vogliamo dimostrare che la relazione ≤ appena introdotta soddisfa le seguenti
proprietà.

Definizione 1.12 (relazione d’ordine). Una relazione ≤ su un insieme 𝑋 viene detta


relazione d’ordine se soddisfa le seguenti proprietà (per ogni 𝑥, 𝑦, 𝑧 ∈ 𝑋 ): relazione d’ordine
1. riflessiva: 𝑥 ≤ 𝑥 ;
2. antisimmetrica: 𝑥 ≤ 𝑦 ∧ 𝑦 ≤ 𝑥 =⇒ 𝑥 = 𝑦 ;
3. transitiva: 𝑥 ≤ 𝑦 ∧ 𝑦 ≤ 𝑧 =⇒ 𝑥 ≤ 𝑧 .
Si dice inoltre che la relazione d’ordine ≤ è una relazione d’ordine totale (o lineare) relazione d’ordine totale
se vale
4. dicotomia: 𝑥 ≤ 𝑦 ∨ 𝑦 ≤ 𝑥 .
16 1 fondamenti

Se ≤ è una relazione d’ordine su 𝑋 si definisce la relazione inversa ≥ ponendo


𝑥 ≥ 𝑦 quando 𝑦 ≤ 𝑥 . La proprietà riflessiva identifica gli ordinamenti larghi.
Si definisce il corrispondente ordinamento stretto < ponendo 𝑥 < 𝑦 quando
𝑥 ≤ 𝑦 ∧ 𝑥 ≠ 𝑦 e la relazione inversa > ponendo 𝑥 > 𝑦 quando 𝑦 < 𝑥 .

Teorema 1.13. La relazione ≤ è una relazione d’ordine totale su ℕ .

Dimostrazione. Il fatto che 𝑥 + 0 = 𝑥 dimostra la proprietà riflessiva.

Per la proprietà transitiva è sufficiente osservare che se 𝑦 = 𝑥 + 𝑘 e 𝑧 = 𝑦 + 𝑗


allora 𝑧 = 𝑥 + 𝑘 + 𝑗 .

Per la proprietà antisimmetrica supponiamo di avere 𝑥 = 𝑦 + 𝑘 e 𝑦 = 𝑥 + 𝑗 .


Deduciamo che 𝑥 + 𝑘 + 𝑗 = 𝑦 + 𝑘 + 𝑗 da cui 𝑥 = 𝑦 per la proprietà invariantiva
dell’addizione.

Per mostrare che l’ordinamento è totale dobbiamo invece procedere con una
dimostrazione per induzione. Per induzione su 𝑥 ∈ ℕ vogliamo mostrare che
per ogni 𝑦 ∈ ℕ si ha 𝑥 ≤ 𝑦 oppure 𝑦 ≤ 𝑥 . Se 𝑥 = 0 il fatto è ovvio in quanto
𝑦 = 𝑦 + 0 e quindi 𝑦 ≥ 0 per ogni 𝑦 ∈ ℕ . Supponiamo ora di sapere che 𝑥 ≤ 𝑦
oppure 𝑦 ≤ 𝑥 . Se 𝑦 ≤ 𝑥 significa che 𝑥 = 𝑦 + 𝑘 per un qualche 𝑘 ∈ ℕ . Ma
allora 𝑥 + 1 = 𝑦 + 𝑘 + 1 e quindi vale anche 𝑦 ≤ 𝑥 + 1. Se invece 𝑥 ≤ 𝑦 significa
che esiste 𝑘 ∈ ℕ per cui 𝑦 = 𝑥 + 𝑘 . Se 𝑘 ≠ 0 allora 𝑘 = 1 + 𝑗 con 𝑗 ∈ ℕ da
cui 𝑦 = 𝑥 + 1 + 𝑗 e dunque anche 𝑥 + 1 ≤ 𝑦 . Se 𝑘 = 0 allora 𝑥 = 𝑦 e dunque
𝑥 + 1 = 𝑦 + 1 che ci porta alla disuguaglianza inversa 𝑥 + 1 ≥ 𝑦 . In ogni caso il
passo induttivo è dimostrato.

Definizione 1.14 (maggiorante, minorante, massimo, minimo). Sia ≤ una


relazione d’ordine su un insieme 𝑋 e siano 𝑎 ∈ 𝑋 e 𝐴 ⊆ 𝑋 .
minorante
Diremo che 𝑎 è un minorante di 𝐴 e scriveremo:

𝑎≤𝐴

minimo se per ogni 𝑥 ∈ 𝐴 risulta 𝑎 ≤ 𝑥 . Se 𝑎 è un minorante e inoltre 𝑎 ∈ 𝐴 diremo che 𝑎 è il


minimo di 𝐴 e scriveremo:
𝑎 = min 𝐴.
maggiorante
Analogamente diremo che 𝑎 è un maggiorante di 𝐴 e scriveremo 𝑎 ≥ 𝐴 se 𝑎 ≤ 𝑥 per
massimo ogni 𝑥 ∈ 𝐴 e diremo che 𝑎 è il massimo di 𝐴 e scriveremo 𝑎 = max 𝐴 se 𝑎 ≥ 𝐴 e
𝑎 ∈ 𝐴.

Massimo e minimo di un insieme 𝐴, se esistono, sono unici. Infatti se 𝑥


e 𝑦 fossero due minimi di 𝐴 si avrebbe 𝑥 ≤ 𝑦 in quanto 𝑥 ≤ 𝐴 e 𝑦 ∈ 𝐴.
Analogamente si avrebbe 𝑦 ≤ 𝑥 e quindi 𝑥 = 𝑦 . Ragionamento analogo se 𝑥 e 𝑦
fossero due massimi.

Se 𝐴 è un insieme finito il massimo e il minimo esistono sempre.

Teorema 1.15 (principio del buon ordinamento). Sia 𝐴 ⊆ ℕ , 𝐴 ≠ ∅. Allora 𝐴 ha


minimo.
1.6 i numeri naturali 17

Dimostrazione. Osserviamo che se 𝑛 ∈ ℕ è un minorante di 𝐴 ⊆ ℕ allora o


𝑛 ∈ 𝐴 e quindi 𝑛 è il minimo di 𝐴 oppure anche 𝑛 + 1 è un minorante di 𝐴 in
quanto non ci sono numeri interi compresi tra 𝑛 e 𝑛 + 1.

Dunque se 𝐴 non avesse minimo, per il principio di induzione ogni 𝑛 ∈ ℕ


sarebbe un minorante di 𝐴. In tal caso 𝐴 dovrebbe essere vuoto perché se 𝑎 ∈ 𝐴
certamente 𝑎 + 1 non è un minorante di 𝐴.

Vogliamo ora dimostrare che l’insieme dei numeri naturali è sostanzialmente


unico nel senso che se ci sono due insiemi che soddisfano gli assiomi di Peano
allora è possibile mettere in corrispondenza gli elementi dei due insiemi in
modo che lo zero vada in zero e numeri corrispondenti abbiano successori
corrispondenti.

Teorema 1.16 (unicità dei numeri naturali). Se ℕ e ℕ0 sono due insiemi che
soddisfano gli assiomi di Peano con zero 0 ∈ ℕ e 00 ∈ ℕ0 e funzioni successore 𝜎 su
ℕ e 𝜎0 su ℕ0 allora esiste una funzione bigettiva 𝑓 : ℕ → ℕ0 tale che 𝑓 (0) = 00 e
𝑓 (𝜎(𝑛)) = 𝜎0( 𝑓 (𝑛)).

Dimostrazione. Possiamo definire 𝑓 per induzione:


(
𝑓 (0) = 00
𝑓 (𝜎(𝑛)) = 𝜎0( 𝑓 (𝑛))

così rimane solo da dimostrare che 𝑓 è una bigezione.

Per dimostrare che 𝑓 è iniettiva consideriamo l’insieme

𝐴 = {𝑎 ∈ ℕ : ∃𝑏 ∈ ℕ , 𝑏 ≠ 𝑎, 𝑓 (𝑎) = 𝑓 (𝑏)}.

Se tale insieme è vuoto allora 𝑓 è effettivamente iniettiva. Supponiamo allora


per assurdo che 𝐴 sia vuoto. In tal caso possiamo considerare il minimo
𝑎 = min 𝐴 (grazie al teorema 1.15). Dovrà quindi esistere 𝑏 ∈ ℕ tale che 𝑏 ≠ 𝑎 e
𝑓 (𝑏) = 𝑓 (𝑎). Ovviamente anche 𝑏 ∈ 𝐴 e quindi dovrà essere 𝑏 > 𝑎 in quanto
𝑎 è il minimo. Dunque 𝑏 > 0 e 𝑓 (𝑏) = 𝑓 (𝜎(𝑏 − 1)) = 𝜎0( 𝑓 (𝑏 − 1)). Se 𝑎 = 0
abbiamo 𝑓 (𝑎) = 00 e quindi da 𝑓 (𝑎) = 𝑓 (𝑏) otteniamo che 00 è nell’immagine
di 𝜎0 che è contrario agli assiomi di Peano. Se invece 𝑎 > 0 si avrà, come per 𝑏 ,
𝑓 (𝑎) = 𝜎0( 𝑓 (𝑎 − 1)) e dunque 𝜎0( 𝑓 (𝑎 − 1)) = 𝜎0( 𝑓 (𝑏 − 1)). Per l’iniettività di 𝜎0
si deduce 𝑓 (𝑎 − 1) = 𝑓 (𝑏 − 1) da cui 𝑎 − 1 ∈ 𝐴. Ma questo è assurdo in quanto 𝑎
era il minimo di 𝐴.

Per dimostrare che 𝑓 è surgettiva consideriamo l’immagine 𝐵0 = 𝑓 (ℕ ) e usiamo


il principio di induzione su ℕ0 per dimostrare che 𝐵0 = ℕ0. Per prima cosa
00 ∈ 𝐵0 in quanto 00 = 𝑓 (0). Se poi 𝑛 0 ∈ 𝐵0 allora esiste 𝑛 ∈ ℕ tale che 𝑓 (𝑛) = 𝑛 0.
Ma allora 𝑓 (𝜎(𝑛)) = 𝜎0( 𝑓 (𝑛)) = 𝜎0(𝑛 0) e dunque anche 𝜎0(𝑛 0) ∈ 𝐵.

Vogliamo ora dimostrare che i numeri naturali possono essere utilizzati per
contare gli elementi degli insiemi finiti.
18 1 fondamenti

Definizione 1.17 (numero di elementi). Se 𝑛 ∈ ℕ denotiamo con

[𝑛] = {0 , 1 , . . . , 𝑛 − 1}

l’insieme dei primi 𝑛 numeri naturali. Questo è il prototipo di insieme con 𝑛 elementi.
Allora formalmente andremo a identificare #[𝑛] con 𝑛 e dunque scriveremo

#𝐴 = 𝑛, #𝐴 ≥ 𝑛, #𝐴 ≤ 𝑛

per significare rispettivamente

#𝐴 = #[𝑛], #𝐴 ≥ #[𝑛], #𝐴 ≤ #[𝑛].

Il simbolo ℵ è la prima lettera dell’alfa- La cardinalità di ℕ viene a volte indicata con il simbolo ℵ0 dunque potremo scrivere
beto ebraico e si legge aleph.
Nel seguente teorema dimostriamo che
ℵ0 è la più piccola cardinalità infinita. #𝐴 = ℵ0 , #𝐴 ≤ ℵ0 , #𝐴 ≥ ℵ0
Si potrebbe anche dimostrare che deve
esistere una cardinalità ℵ1 > ℵ0 che è per significare rispettivamente
la più piccola cardinalità maggiore di
ℵ0 . Sappiamo che #P(ℕ ) > #ℕ ma pur- # 𝐴 = #ℕ , # 𝐴 ≤ #ℕ , # 𝐴 ≥ #ℕ .
troppo non è possibile dimostrare che
#ℵ1 = #P(ℕ ) (questa si chiama ipotesi del
continuo in quanto vedremo nel teore-
ma 3.24 che #P(ℕ ) = #ℝ e l’insieme ℝ Lemma 1.18. Per ogni 𝑛 ∈ ℕ l’insieme [𝑛] = {0 , 1 , 2 , . . . , 𝑛 − 1} è finito.
viene chiamato continuo là dove ℕ viene
chiamato discreto). Dunque l’ipotesi del
continuo è un ulteriore assioma che po- Dimostrazione. Lo possiamo dimostrare per induzione su 𝑛 ∈ ℕ . Per 𝑛 = 0 si
trebbe essere aggiunto agli assiomi della ha [𝑛] = ∅ ed è ovvio che ogni funzione 𝑓 : ∅ → ∅ è bigettiva. Dunque [0] = ∅ è
teoria degli insiemi: non esistono insiemi
con cardinalità strettamente compresa
finito.
tra le cardinalità di ℕ e di P(ℕ ).
Supponiamo allora che [𝑛] sia finito e supponiamo per assurdo che [𝑛 + 1]
sia infinito. Allora esiste 𝑓 : [𝑛 + 1] → [𝑛 + 1] iniettiva ma non surgettiva.
Se componiamo 𝑓 con la funzione 𝑠 che scambia 𝑛 con 𝑓 (𝑛) otteniamo una
funzione 𝑔 = 𝑠 ◦ 𝑓 tale che 𝑔(𝑛) = 𝑛 . Se 𝑓 era iniettiva ma non surgettiva anche
𝑔 mantiene le due proprietà. Inoltre 𝑔 può essere ristretta a [𝑛] (in quanto
𝑔(𝑘) = 𝑛 solo per 𝑘 = 𝑛 visto che 𝑔 è iniettiva): 𝑔 : [𝑛] → [𝑛] e anche la funzione
ristretta risulterebbe essere iniettiva e suriettiva. Ma questo è assurdo perché
per ipotesi induttiva [𝑛] è finito.

Teorema 1.19 (caratterizzazione insiemi finiti). Un insieme 𝐴 è infinito (nel senso


di Dedekind, definizione 1.8) se e solo se #𝐴 ≥ ℵ0 . Viceversa 𝐴 è finito se e solo se
esiste 𝑛 ∈ ℕ tale che #𝐴 = 𝑛 .

Dimostrazione. Se #𝐴 ≥ ℵ0 significa che esiste una funzione iniettiva 𝑓 : ℕ → 𝐴.


Dunque se definiamo 𝜎 : 𝐴 → 𝐴 come
(
𝑎 se 𝑎 ∉ 𝑓 (ℕ )
𝜎(𝑎) =
𝑓 (𝑛 + 1) se 𝑎 = 𝑓 (𝑛)

otteniamo una funzione iniettiva ma non suriettiva (in quanto 𝜎(𝐴) = 𝐴\{ 𝑓 (0)}).
Dunque se #𝐴 ≥ ℵ0 deduciamo che 𝐴 è infinito.
1.7 insiemi prodotto 19

Viceversa se 𝐴 è infinito significa che esiste 𝜎 : 𝐴 → 𝐴 iniettiva ma non suriettiva.


Preso 𝛼 ∈ 𝐴 \ 𝜎(𝐴) possiamo definire induttivamente 𝑓 : ℕ → 𝐴 come segue:
(
𝑓 (0) = 𝛼
𝑓 (𝑛 + 1) = 𝜎( 𝑓 (𝑛))

e possiamo verificare che 𝑓 è iniettiva. Infatti supponiamo che sia 𝑓 (𝑛) = 𝑓 (𝑚).
Se 𝑓 (𝑛) = 𝑓 (𝑚) = 𝛼 allora necessariamente 𝑛 = 𝑚 = 0 perché 𝑓 (𝑛) = 𝛼 è
equivalente a 𝑛 = 0 visto che 𝜎 non assume mai il valore 𝛼 . Se 𝑓 (𝑛) = 𝑓 (𝑚) ≠ 𝛼
significa dunque che 𝑛 > 0 e 𝑚 > 0 ma allora 𝑓 (𝑛) = 𝜎( 𝑓 (𝑛 − 1)) e 𝑓 (𝑚) =
𝜎( 𝑓 (𝑚 − 1)) e dunque, essendo 𝜎 iniettiva, 𝑛 − 1 = 𝑚 − 1 da cui 𝑛 = 𝑚 . Dunque
se 𝐴 è infinito si ha #ℕ ≤ #𝐴 (significa in un certo senso che ℕ è il più piccolo
insieme infinito).

Dobbiamo ora caratterizzare gli insiemi finiti. Abbiamo già verificato che se
#𝐴 ≥ ℵ0 allora #𝐴 è infinito, dunque se #𝐴 è finito non può essere #𝐴 ≥ ℵ0 . Ma
Per dimostrare che ogni cardinalità può
da questo non siamo in grado di dedurre che #𝐴 < ℵ0 (vedi nota a margine).
essere confrontata con ogni altra bisogna
dimostrare che ogni insieme ammette un
Se #𝐴 = 𝑛 significa che #𝐴 = #[𝑛] e grazie al lemma 1.18 sappiamo che [𝑛] è buon ordinamento ovvero che ogni insie-
finito e dunque anche 𝐴 è finito. me può essere messo in corrispondenza
con un ordinale di Von Neumann cioè con
Supponiamo ora che 𝐴 sia un insieme per il quale per ogni 𝑛 ∈ ℕ si ha un insieme totalmente ordinato dalla re-
lazione di appartenenza ∈ e tale che ogni
#𝐴 ≠ 𝑛 . Dobbiamo dimostrare che 𝐴 è infinito. Per ogni 𝑛 ∈ ℕ scegliamo una elemento è anche un sottoinsieme. Gli
funzione iniettiva 𝑓𝑛 : [𝑛] → 𝐴. Dalle 𝑓𝑛 possiamo definire le funzioni iniettive ordinali di Von Neumann sono natural-
𝑔𝑛 : [𝑛] → 𝐴 in modo che 𝑔𝑛+1 sia una estensione di 𝑔𝑛 . Basterà infatti porre: mente uno contenuto nell’altro per cui
certamente hanno cardinalità confron-
tabili. Gli ordinali finiti non sono altro
( (
𝑔𝑛 (𝑘) se 𝑘 < 𝑛
𝑔0 = 𝑓0 , 𝑔𝑛+1 (𝑘) = che gli elementi di ℕ definiti mediante
min 𝑓𝑛+1 ([𝑛 + 1]) \ 𝑔𝑛 ([𝑛]) la proprietà 𝑛 + 1 = 𝑛 ∪ {𝑛}. E l’insie-
me ℕ stesso è il primo ordinale infinito
(che si denota con 𝜔 nel linguaggio degli
l’insieme 𝑓𝑛+1 ([𝑛 + 1]) \ 𝑔𝑛 ([𝑛]) essendo non vuoto in quanto # 𝑔𝑛 ([𝑛]) = 𝑛 < ordinali).
𝑛 + 1 = # 𝑓𝑛+1 ([𝑛 + 1]). Ma allora possiamo definire la funzione iniettiva qui si usa l’assioma della scelta 𝐴𝐶 .
𝑔 : ℕ → 𝐴 come 𝑔(𝑛) = 𝑔𝑛+1 (𝑛) ottenendo #𝐴 ≥ #ℕ e dunque 𝐴 è Dedekind
infinito.

1.7 insiemi prodotto

Abbiamo già visto che se 𝐴 è un insieme possiamo definire l’insieme delle


coppie di elementi di 𝐴 con il prodotto tra insiemi: 𝐴 × 𝐴. Cosa rappresenta
un prodotto ripetuto? Gli insiemi (𝐴 × 𝐴) × 𝐴 e 𝐴 × (𝐴 × 𝐴) non sono uguali,
in quanto il primo è un insieme di coppie il cui primo elemento è a sua volta
una coppia, il secondo insieme invece è un insieme di coppie il cui secondo
elemento è una coppia:

(𝐴 × 𝐴) × 𝐴 = {((𝑎0 , 𝑎1 ), 𝑎2 ) : 𝑎 0 , 𝑎1 , 𝑎2 ∈ 𝐴},
𝐴 × (𝐴 × 𝐴) = {(𝑎0 , (𝑎1 , 𝑎2 )) : 𝑎0 , 𝑎1 , 𝑎2 ∈ 𝐴}.

Questi insiemi sono molto simili tra loro e potrebbero essere identificati. Un’al-
tro insieme molto simile è l’insieme 𝐴3 . Se pensiamo al numero 3 come
20 1 fondamenti

all’insieme 3 = {0 , 1 , 2} l’insieme 𝐴3 rappresenta l’insieme di tutte le fun-


zioni 𝒂 : 0 , 1 , 2 → 𝐴. La funzione 𝒂 è univocamente determinata dal suo
valore nei tre punti del dominio: 𝑎 0 = 𝒂(0), 𝑎 1 = 𝒂(1), 𝑎 2 = 𝒂(2) in quanto
𝒂 = {0 ↦→ 𝑎0 , 1 ↦→ 𝑎 1 , 2 ↦→ 𝑎2 }. Possiamo quindi identificare 𝒂 con la tripla (o
vettore) di valori:
𝒂 = (𝑎 0 , 𝑎1 , 𝑎2 ), 𝑎0 , 𝑎1 , 𝑎2 ∈ 𝐴.
I valori 𝑎 0 , 𝑎 1 e 𝑎 2 vengono anche chiamate coordinate o componenti del vettore
coordinate, componenti, vettore
𝒂 . In effetti l’insieme 𝐴2 può essere identificato con 𝐴 × 𝐴, l’insieme 𝐴3 sarà
l’insieme delle triple di elementi di 𝐴 e in generale se 𝑛 ∈ ℕ identifichiamo con
𝐴𝑛 l’insieme delle 𝑛 -uple (leggi: ennuple) di elementi di 𝐴:

𝒂 ∈ 𝐴𝑛 ⇐⇒ 𝒂 = (𝑎 0 , 𝑎1 , . . . , 𝑎 𝑛−1 ).

1.8 la retta dei numeri reali

L’insieme ℝ dei numeri reali è un modello della retta geometrica che, a sua volta,
viene utilizzata per modellizzare tutte le quantità che si ottengono da misure
fisiche. In effetti l’esistenza di un insieme ℝ con le proprietà che andremo
ad elencare nella sezione seguente può essere intuitivamente giustificata dal
processo con cui si costruisce (fisicamente!) un righello. Presa una retta si inizia
col segnare su di essa un punto di riferimento che chiamiamo 0. Dopodiché
osserviamo che il punto 0 (come ogni altro punto) divide la retta in due parti.
In modo arbitrario chiamiamo positivi i punti che si trovano da una parte
e negativi i punti che si trovano dall’altra parte. Sulla semiretta dei numeri
positivi scegliamo, arbitrariamente, un punto 1. Il segmento compreso tra i
punti 0 e 1 sarà la nostra unità di misura.

L’addizione viene definita utilizzando i movimenti rigidi. Traslando il punto 1


di una unità alla volta si ottengono tutti i numeri naturali. Traslando all’indietro
si ottengono i numeri interi. Assumendo che tra due punti qualunque esistano
sempre punti intermedi (divisibilità) e assumendo che suddividendo la retta in
due parti esista sempre un punto di suddivisione (continuità) mostreremo come
si può suddividere ogni segmento in 𝑛 parti uguali per ogni numero naturale
𝑛 . In tal modo potremo definire i numeri razionali e la moltiplicazione per un
numero razionale. Con una estensione continua riusciremo quindi a definire la
moltiplicazione tra numeri reali. Osserveremo poi che la struttura moltiplicativa
dei numeri reali positivi soddisfa gli stessi assiomi della struttura additiva dei
reali e che quindi la costruzione fatta per costruire la moltiplicazione si può
ripetere identica per costruire l’elevamento a potenza.

Se volessimo postulare le proprietà delle traslazioni (cioè i movimenti rigidi


della retta in sé) potremmo farlo come segue. L’insieme 𝑇 di tutte le traslazioni
di ℝ è un sottoinsieme di ℝℝ (cioè 𝑇 è un insieme di funzioni 𝑡 : ℝ → ℝ) che
soddisfa le seguenti proprietà:

1. l’identità 𝑡(𝑥) = 𝑥 è in 𝑇 ;
2. dati 𝑥, 𝑦 ∈ ℝ esiste una unica 𝑡 ∈ 𝑇 tale che 𝑡(𝑥) = 𝑦 ;
3. se 𝑡1 , 𝑡2 ∈ 𝑇 allora 𝑡1 ◦ 𝑡2 ∈ 𝑇 .
1.8 la retta dei numeri reali 21

Si potrà allora fissare un punto 0 ∈ ℝ e definire 𝑥 + 𝑦 = 𝑡0 𝑦 (𝑥) dove 𝑡0 𝑦 è l’unica


traslazione che manda 0 in 𝑦 . E’ un esercizio molto interessante dedurre le
proprietà di gruppo dell’addizione dalle proprietà delle traslazioni.

Definizione 1.20 (gruppo). Un insieme 𝑋 su cui è definita una operazione ∗ si dice una operazione ∗ su 𝑋 è una funzione
∗ : 𝑋 × 𝑋 → 𝑋 per la quale si usa la
essere un gruppo se l’operazione ha le seguenti proprietà: notazione infissa: 𝑥 ∗ 𝑦 = ∗(𝑥, 𝑦).

1. associativa: ∀𝑥, 𝑦, 𝑧 ∈ 𝑋 : (𝑥 ∗ 𝑦) ∗ 𝑧 = 𝑥 ∗ (𝑦 ∗ 𝑧); gruppo


2. esistenza elemento neutro: ∃𝑒 ∈ 𝑋 : ∀𝑥 ∈ 𝑋 : 𝑒 ∗ 𝑥 = 𝑥 ∗ 𝑒 = 𝑥 ;
3. esistenza inverso: ∀𝑥 ∈ 𝑋 : ∃𝑦 ∈ 𝑋 : 𝑥 ∗ 𝑦 = 𝑦 ∗ 𝑥 = 𝑒 .
gruppo abeliano
Inoltre il gruppo si dice essere abeliano o commutativo se vale la proprietà:

4. commutativa: ∀𝑥, 𝑦 ∈ 𝑋 : 𝑥 ∗ 𝑦 = 𝑦 ∗ 𝑥 .

Quando l’operazione viene denotata con il simbolo + (addizione) diremo che il gruppo è
additivo, denoteremo con 0 (zero) l’elemento neutro e l’inverso verrà chiamato opposto.
Se invece si usa il simbolo · (moltiplicazione) diremo che il gruppo è moltiplicativo,
l’elemento neutro potrà essere denotato con il simbolo 1 (uno o unità) e l’inverso potrà
essere chiamato reciproco.

L’elemento neutro di un gruppo è unico. Se infatti 𝑥 e 𝑦 fossero due elementi


neutri si avrebbe 𝑥 = 𝑥 ∗ 𝑦 = 𝑦 . Anche l’inverso è unico: infatti se 𝑦 e 𝑧 fossero
due inversi di 𝑥 si avrebbe 𝑦 = 𝑦 ∗ 𝑥 ∗ 𝑧 = 𝑧 .
gruppo ordinato

Definizione 1.21 (gruppo ordinato). Diremo che 𝑋 è un gruppo ordinato se 𝑋 è


un gruppo (con operazione ∗ ed elemento neutro 𝑒 ) se è anche un insieme ordinato (con
relazione ≤ ) e se vale la proprietà:

1. monotonia: se 𝑥 ≤ 𝑦 allora per ogni 𝑧 si ha:

𝑥∗𝑧 ≤ 𝑦∗𝑧 e 𝑧 ∗ 𝑥 ≤ 𝑧 ∗ 𝑦.
ordinamento denso

Definizione 1.22 (ordinamento denso). Un ordinamento ≤ si dice essere densa o


ordinamento continuo
divisibile se esistono sempre punti intermedi: se 𝑥 < 𝑦 esiste 𝑧 tale che 𝑥 < 𝑧 < 𝑦 .
Gli assiomi della teoria degli insiemi che
abbiamo introdotto finora non possono
Definizione 1.23 (ordinamento continuo). Un ordinamento ≤ si dice essere conti- garantire l’esistenza di insiemi infiniti
in quanto un universo fatto solo da in-
nuo (o Dedekind-completo) se dati comunque 𝐴, 𝐵 sottoinsiemi non vuoti di 𝑋 tali
siemi finiti soddisfa tutti gli assiomi. E’
che per ogni 𝑎 ∈ 𝐴 e per ogni 𝑏 ∈ 𝐵 risulta 𝑎 ≤ 𝑏 (concisamente potremmo scrivere quindi necessario un assioma di infinito
𝐴 ≤ 𝐵) allora esiste 𝑐 ∈ 𝑋 tale che per ogni 𝑎 ∈ 𝐴 e ogni 𝑏 ∈ 𝐵 si ha 𝑎 ≤ 𝑐 ≤ 𝑏 che garantisca l’esistenza di almeno un
(concisamente 𝐴 ≤ 𝑐 ≤ 𝐵). insieme infinito. Usualmente tale insie-
me è l’insieme ℕ dei numeri naturali da
cui, con una costruzione non semplice,
Possiamo allora introdurre come assioma l’esistenza dei numeri reali. si può costruire l’insieme ℝ dei numeri
reali. Tuttavia visto che l’insieme ℝ è il
fondamento dell’analisi matematica re-
Assioma 1.24 (numeri reali). Esiste un insieme ℝ con una operazione di gruppo + putiamo sia piuttosto naturale assumere
l’esistenza di ℝ come assioma e ritrova-
(addizione) ed una relazione d’ordinamento totale ≤ che rendono ℝ un gruppo ordinato,
re (come faremo tra poco) l’insieme ℕ
denso e continuo (vedremo che la proprietà commutativa è valida di conseguenza). all’interno di ℝ.
Chiamiamo 0 l’elemento neutro dell’addizione e supponiamo inoltre che esista almeno opposto
un altro punto 1 ∈ 𝑋 tale che 1 > 0 che chiameremo unità.
sottrazione
22 1 fondamenti

L’inverso additivo di un elemento 𝑥 sarà chiamato opposto e verrà denotato


con −𝑥 , si avrà quindi 𝑥 + (−𝑥) = 0. Potremo quindi definire l’operazione di
sottrazione:
𝑥 − 𝑦 = 𝑥 + (−𝑦).

positivo Diremo che un numero 𝑥 ∈ ℝ è positivo se 𝑥 > 0 e negativo se 𝑥 < 0.


Se 𝑥 ≤ 𝑦 sommando −𝑥 da ambo i lati si ottiene 0 ≤ 𝑦 − 𝑥 e sommando ancora
−𝑦 si ottiene −𝑦 ≤ −𝑥 . Lo stesso vale con le disuguaglianze strette e con le
disuguaglianze inverse.

1.9 i numeri naturali e interi

Vediamo adesso come identificare, all’interno dei numeri reali ℝ, l’insieme dei
numeri naturali ℕ .
numeri naturali
Definizione 1.25 (numeri naturali). Un sottoinsieme 𝐴 ⊆ ℝ si dice essere induttivo
se valgono le due proprietà:

0 ∈ 𝐴,
𝑛 ∈ 𝐴 =⇒ 𝑛 + 1 ∈ 𝐴.

La famiglia di tutti i sottoinsiemi induttivi di ℝ non è vuota in quanto ℝ stesso è


induttivo. Definiamo ℕ come l’intersezione di tutti i sottoinsiemi induttivi di ℝ:
\ \
ℕ= 𝐴= {𝐴 ⊆ P(ℝ) : 𝐴 induttivo}.
𝐴 induttivo

Ovviamente ℕ deve essere a sua volta induttivo (lo si verifichi) e quindi è il “più piccolo”
ℕ sottoinsieme induttivo di ℝ.

Oltre ai numeri 0 e 1 che abbiamo già definito, si definiscono le altre cifre


decimali 2 , 3 , 4 , 5 , 6 , 7 , 8 , 9 direttamente come segue:

2 = 1 + 1, 3 = 2 + 1, 4 = 3 + 1, 5 = 4 + 1,
6 = 5 + 1, 7 = 6 + 1, 8 = 7 + 1, 9 = 8 + 1.

E’ facile dimostrare che l’insieme ℕ appena definito soddisfa gli assiomi di


Giuseppe Peano (1858–1932), matemati- Peano in particolare vale il seguente.
co torinese, contribuì a porre i fondamen-
ti della logica matematica. La notazione Teorema 1.26 (principio di induzione). Se 𝑃(𝑛) è un predicato nella variabile 𝑛 ∈ ℕ
∃ per il quantificatore universale si de-
tale che:
ve a lui. E sua l’assiomatizzazione che
caratterizza i numeri naturali: 1. 𝑃(0) è vero;
1. 0 ∈ ℕ ; 2. per ogni 𝑛 ∈ ℕ se 𝑃(𝑛) è vero allora anche 𝑃(𝑛 + 1) è vero.
2. se 𝑛 ∈ ℕ allora 𝑛 + 1 ∈ ℕ ;
3. se 𝑛, 𝑚 ∈ ℕ e 𝑛 + 1 = 𝑚 + 1 allora Allora 𝑃(𝑛) è vero per ogni 𝑛 ∈ ℕ .
𝑛 = 𝑚;
4. se 𝑛 ∈ ℕ allora 𝑛 + 1 ≠ 0;
Dimostrazione. Si consideri l’insieme 𝐴 = {𝑛 ∈ ℕ : 𝑃(𝑛) è vera}. Le ipotesi del
5. se 𝐴 ⊆ ℕ è induttivo allora 𝐴 =
ℕ. principio di induzione garantiscono che 𝐴 sia induttivo (definizione 1.25) e
quindi che ℕ ⊆ 𝐴. Dunque 𝑃(𝑛) è vera per ogni 𝑛 ∈ ℕ .
1.9 i numeri naturali e interi 23

Utilizzando il principio di induzione si possono dimostare le seguenti ben note


proprietà dei numeri naturali.

Teorema 1.27 (proprietà dei numeri naturali). Se 𝑛, 𝑚 ∈ ℕ si ha:

1. 𝑛 ≥ 0;
2. 𝑛 + 𝑚 ∈ ℕ;
3. 𝑛 + 𝑚 = 𝑚 + 𝑛;
4. se 𝑛 ≥ 𝑚 allora 𝑛 − 𝑚 ∈ ℕ ;
5. se 𝑛 > 𝑚 allora 𝑛 ≥ 𝑚 + 1.

Dimostrazione. Per il primo punto: ovviamente 0 ≥ 0. D’altra parte se 𝑛 ≥ 0


allora 𝑛 + 1 > 𝑛 + 0 ≥ 0. Dunque per induzione 𝑛 ≥ 0 per ogni 𝑛 ∈ ℕ .

Per il secondo punto consideriamo il predicato

𝑃(𝑛) : ∀𝑚 ∈ ℕ : 𝑚 + 𝑛 ∈ ℕ .

Chiaramente 𝑃(0) è vero in quanto 𝑚 + 0 = 𝑚 ∈ ℕ se 𝑚 ∈ ℕ . Ma se 𝑃(𝑛)


è verificata allora 𝑚 + 𝑛 ∈ ℕ e visto che ℕ è induttivo anche 𝑚 + (𝑛 + 1) =
(𝑚 + 𝑛) + 1 ∈ ℕ . Dunque vale 𝑃(𝑛 + 1) e dunque per ogni 𝑛 vale 𝑃(𝑛).
Per dimostrare la proprietà commutativa possiamo innanzitutto dimostrare
per induzione che 𝑛 + 1 = 1 + 𝑛 per ogni 𝑛 ∈ ℕ (lo si faccia per esercizio).
Dopodiché si considera la proposizione

𝑃(𝑛) : ∀𝑚 ∈ ℕ : 𝑛 + 𝑚 = 𝑚 + 𝑛.

𝑃(0) è vera per le proprietà dell’elemento neutro e se 𝑃(𝑛) è vera allora 𝑛+ 1 +𝑚 =


1 + 𝑛 + 𝑚 = 1 + 𝑚 + 𝑛 = 𝑚 + 1 + 𝑛 = 𝑚 + 𝑛 + 1 e quindi anche 𝑃(𝑛 + 1) è vera.
Il risultato segue per induzione.

Per il quarto punto si verifica innanzitutto che se 𝑛 ≥ 1 allora 𝑛 − 1 ∈ ℕ (lo si


dimostra per induzione osservando che (𝑛 + 1) − 1 = 𝑛 ∈ ℕ ). Dopodiché si
considera il predicato

𝑃(𝑛) : ∀𝑚 ∈ ℕ : 𝑚 ≥ 𝑛 =⇒ 𝑚 − 𝑛 ∈ ℕ .

E’ facile verificare che 𝑃(0) è vero. Supponiamo allora che 𝑃(𝑛) sia vero e
consideriamo 𝑃(𝑛 + 1) : 𝑚 ≥ 𝑛 + 1 =⇒ 𝑚 − (𝑛 + 1) ∈ ℕ . Se 𝑚 ≥ 𝑛 + 1 allora
certamente 𝑚 − 1 ≥ 𝑛 e 𝑚 ≠ 0. Abbiamo già dimostrato che 𝑚 − 1 ∈ ℕ e quindi,
applicando 𝑃(𝑛), possiamo dedurre che 𝑚 − 1 −𝑛 ∈ ℕ . Ma 𝑚 − 1 −𝑛 = 𝑚 −(𝑛 + 1)
e quindi abbiamo verificato 𝑃(𝑛 + 1).

L’ultima affermazione è equivalente a dire che se 𝑚 ∈ ℕ non ci sono numeri


naturali strettamente compresi tra 𝑚 e 𝑚 + 1. Sottraendo 𝑚 ci si riconduce a
osservare che non ci sono naturali tra 0 e 1. Ma se 0 < 𝑥 < 1 allora 𝑥 − 1 < 0
non può essere un naturale ed essendo diverso da 0 deduciamo che 𝑥 ∉ ℕ .

Esercizio 1.28. Dimostrare, utilizzando il principio di induzione, la seguente


proposizione:

∀𝑛 ∈ ℕ : ((∃𝑚 ∈ ℕ : 𝑛 = 𝑚 + 𝑚) ∨ (∃𝑚 : 𝑛 = 𝑚 + 𝑚 + 1)).


24 1 fondamenti

prodotto
Se 𝑛 ∈ ℕ e 𝑥 ∈ ℝ si può definire induttivamente il prodotto 𝑛𝑥 (a volte scriveremo
𝑛 · 𝑥 per motivi tipografici) mediante le seguenti proprietà ricorsive:
(
0𝑥 = 0,
(𝑛 + 1)𝑥 = 𝑛𝑥 + 𝑥

cosicché si avrà: 1 𝑥 = 𝑥 , 2 𝑥 = 𝑥 + 𝑥 , 3 𝑥 = 𝑥 + 𝑥 + 𝑥 , . . . Per induzione è facile


dimostrare 𝑛(𝑥 + 𝑦) = 𝑛𝑥 + 𝑛 𝑦 e che (𝑛 + 𝑚)𝑥 = 𝑛𝑥 + 𝑚𝑥 . Di conseguenza
𝑛(−𝑥) = −(𝑛𝑥). Dalle proprietà dell’iterata si ha la proprietà associativa del
prodotto
(𝑛𝑚)𝑥 = 𝑛(𝑚𝑥).
Inoltre se 0 ≤ 𝑥 ≤ 𝑦 e 𝑛 ≤ 𝑚 si ha la proprietà di monotonia:

𝑛𝑥 ≤ 𝑚 𝑦

(e se 𝑥 < 𝑦 oppure 𝑛 < 𝑚 la disuguaglianza è stretta). In particolare se 𝑛𝑥 = 0


se e solo se 𝑛 = 0 oppure 𝑥 = 0.

Per rappresentare in modo efficiente tutti i numeri naturali utilizziamo la


notazione posizionale decimale notazione posizionale decimale. Il numero rappresentato da una sequenza finita
di cifre decimali può essere definito ricorsivamente: una sequenza di una sola
cifra rappresenta il numero corrispondente alla cifra stessa, una sequenza di
𝑛 + 1 cifre rappresenta il numero rappresentato dalle prime 𝑛 cifre, moltiplicato
per (9 + 1) (dieci) e sommato alla ultima cifra. Ad esempio la sequenza di cifre
4701 (leggi: quattromilasettecentouno) significa

4701 = ((4 · (9 + 1) + 7) · (9 + 1) + 0) · (9 + 1) + 1.

Osservando che 10 = 9 + 1 si scriverà

4701 = ((4 · 10 + 7) · 10 + 0) · 10 + 1.

Se 𝑚, 𝑛 ∈ ℕ con 𝑚 < 𝑛 si ha 𝑚 − 𝑛 = −(𝑛 − 𝑚) che è l’opposto di un numero


numeri interi naturale. L’insieme dei naturali e dei loro opposti si chiama insieme dei numeri
ℤ da zahlen che significa “numeri” in interi e si denota con ℤ:
tedesco.
ℤ = ℕ − ℕ = ℕ ∪ (−ℕ ).

Possiamo facilmente estendere la moltiplicazione dai naturali agli interi con la


seguente regola:
(−𝑛) · 𝑚 = −(𝑛 · 𝑚).
Se 𝑚, 𝑛 sono numeri interi anche 𝑚 + 𝑛 , 𝑚 − 𝑛 e 𝑚 · 𝑛 sono numeri interi.
I numeri interi sono dunque un gruppo additivo e totalmente ordinato. Si
potrebbe anche verificare che ℤ è continuo ma, a differenza di ℝ, non soddisfa
la proprietà di densità: se 𝑛 è intero, tra 𝑛 e 𝑛 + 1 non ci sono altri numeri
interi.
anello

Diremo anche che ℤ è un anello abeliano con unità, in base alla seguente.
1.9 i numeri naturali e interi 25

Definizione 1.29 (anello). Sia 𝐴 un insieme su cui sono definite due operazioni: +
(addizione) e · (moltiplicazione). Diremo che 𝐴 è un anello se 𝐴 è un gruppo abeliano
rispetto alla addizione, se la moltiplicazione è associativa (𝑥 · 𝑦) · 𝑧 = 𝑥 · (𝑦 · 𝑥) e se vale
la proprietà distributiva 𝑥 · (𝑦 + 𝑧) = 𝑥 · 𝑦 + 𝑥 · 𝑧 , (𝑥 + 𝑦) · 𝑧 = 𝑥 · 𝑧 + 𝑦 · 𝑧 . Se inoltre
la moltiplicazione è commutativa diremo che 𝐴 è un anello abeliano. Se inoltre esiste
un elemento 1 ∈ 𝐴 neutro per la moltiplicazione diremo che 𝐴 è un anello con unità.

Se 𝐴 è un anello allora si può dimostrare che valgono anche le usuali proprietà:

0 · 𝑥 = 𝑥 · 0 = 0, (−1) · 𝑥 = 𝑥 · (−1) = −𝑥.

Per la prima abbiamo:

0 · 𝑥 = 0 · 𝑥 + 𝑥 + (−𝑥) = (0 + 1) · 𝑥 + (−𝑥) = 𝑥 + (−𝑥) = 0

e scrivendo gli addendi in ordine opposto si ottiene anche 𝑥 · 0 = 0. Allora


possiamo dimostrare anche la seconda proprietà:

(−1) · 𝑥 = (−1) · 𝑥 + 𝑥 + (−𝑥) = (−1 + 1) · 𝑥 + (−𝑥) = 0 + (−𝑥) = −𝑥

e anche in questo caso scrivendo gli addendi in ordine opposto si ottiene


𝑥 · (−1) = −𝑥 .

Se 𝑛, 𝑚 ∈ ℤ con 𝑚 ≠ 0 e se esiste 𝑘 ∈ ℤ tale che 𝑛 = 𝑘𝑚 diremo che 𝑛 è un multiplo


multiplo di 𝑚 oppure che 𝑚 è un divisore di 𝑛 e scriveremo:
divisore
𝑛
= 𝑘.
𝑚

I multipli di 2 si chiamano numeri pari, gli interi non pari si chiamano dispari. pari

Iterando la moltiplicazione si ottiene l’elevamento a potenza; fissato 𝑚 ∈ ℕ dispari


definiamo, per ogni 𝑛 ∈ ℕ la potenza 𝑚 𝑛 ricorsivamente come segue:
elevamento a potenza
(
𝑚0 = 1
𝑚 𝑛+1 = 𝑚 · 𝑚 𝑛 .

Si avrà quindi: 𝑚 0 = 1, 𝑚 1 = 𝑚 , 𝑚 2 = 𝑚 · 𝑚 , 𝑚 3 = 𝑚 · 𝑚 · 𝑚 , . . .

Possiamo utilizzare le potenze di 10 per rappresentare in maniera alternativa le


sequenze decimali:

4701 = 4 · 103 + 7 · 102 + 0 · 10 + 1.

Definiamo il fattoriale denotato con 𝑛 ! (leggi: 𝑛 fattoriale) tramite la seguente fattoriale

(
0! = 1
(𝑛 + 1)! = (𝑛 + 1)𝑛 !

in tal modo risulta che 𝑛 ! sia il prodotto dei primi 𝑛 numeri naturali positivi:

𝑛 ! = 1 · 2 · 3 · · · 𝑛.
26 1 fondamenti

Tabella 1.4: I primi valori (e nomi) di 𝑛 0 1 2 3 4


alcune delle sequenze che abbiamo defi-
𝑛+5 5 6 7 8 9
nito.
2𝑛 1 2 4 8 16
25+𝑛 32 64 128 256 512
210+𝑛 1024 2048 4096 8192 16384
215+𝑛 32768 65536 131072 262144 524288
220+𝑛 1048576 2097152 4194304 8388608 16777216
3𝑛 1 3 9 27 81
35+𝑛 243 729 2187 6561 19683
𝑛! 1 1 2 6 24
(5 + 𝑛)! 120 720 5040 40320 362880
(10 + 𝑛)! 3628800 39916800 479001600 6227020800 87178291200
103𝑛 K (chilo) M (mega) G (giga) T (tera)
103(𝑛+5) P (peta) E (exa) Z (zetta) Y (yotta)
210𝑛 1 Ki (chibi) Mi (mebi) Gi (gibi) Ti (tebi)
210(𝑛+5) Pi (pebi) Ei (exbi) Zi (zebi) Yi (yobi)

Esercizio 1.30. Utilizzando il principio di induzione si dimostri che per ogni 𝑛 ∈ ℕ :

2𝑛 > 𝑛, (𝑛 + 1)! ≥ 2𝑛 , 𝑛𝑛 ≥ 𝑛!

A volte sarà utile considerare anche i prodotti di solamente i numeri pari o i


semi fattoriale numeri dispari fino ad un certo numero 𝑛 . Questo si chiama semi fattoriale e
si indica con 𝑛 !!. Lo possiamo definire separatamente sui numeri pari (cioè i
numeri che si possono scrivere nella forma 2𝑛 con 𝑛 ∈ ℕ ) e i numeri dispari
(che scriviamo nella forma 2𝑛 + 1):

(2𝑛)!! = 2 · 4 · 6 · · · (2𝑛)
(2𝑛 + 1)!! = 1 · 3 · 5 · · · (2𝑛 + 1).

Osservazione 1.31. Si osservi che risulta

(2𝑛)!! = (2 · 1) · (2 · 2) · (2 · 3) · · · (2 · 𝑛) = 2𝑛 · 𝑛 !

mentre
2𝑛 · 𝑛 ! · (2𝑛 + 1)!! = (2𝑛)!! · (2𝑛 + 1)!! = (2𝑛 + 1)!
Queste formule permettono di esprimere il semi fattoriale utilizzando il fattoriale intero
e le potenze.

Esercizio 1.32. Si dia una definizione per induzione del semi fattoriale (separatamente
per i pari e per i dispari) e si dimostrino, per induzione, le formule nell’osservazione
precedente.

Se 𝑓 è una funzione definita sull’insieme [𝑛] = {0 , . . . , 𝑛 − 1} a valori in un


qualunque gruppo additivo (o moltiplicativo) sarà possibile introdurre una
notazione per ripetere le operazioni di somma (e prodotto) un numero arbitrario
1.9 i numeri naturali e interi 27

di volte:
𝑛−1
X
𝑓 (𝑘) = 𝑓 (0) + 𝑓 (1) + · · · + 𝑓 (𝑛 − 1) (1.6)
𝑘=0
𝑛−1
Y
𝑓 (𝑘) = 𝑓 (0) · 𝑓 (1) · · · 𝑓 (𝑛 − 1). (1.7)
𝑘=0

Formalmente questo può essere fatto tramite una definizione per induzione:

 −1
X  −1
Y
𝑓 (𝑘) = 0 , 𝑓 (𝑘) = 1 ,

 


 

𝑘=0 𝑘=0

 

! !
X𝑛 𝑛−1
X Y𝑛 𝑛−1
Y
𝑓 (𝑘) = 𝑓 (𝑘) + 𝑓 (𝑛); 𝑓 (𝑘) = 𝑓 (𝑘) · 𝑓 (𝑛).

 


 

 𝑘=0 𝑘=0  𝑘=0 𝑘=0
 

La variabile 𝑘 che si trova nelle formule (1.6) è muta: al suo posto si può utilizzare
qualunque altra variabile che non compaia altrove.

E’ naturalmente possibile anche fare una somma a partire da un indice diverso


da 0. Se 𝑎, 𝑏 ∈ ℤ porremo:

𝑏
X 𝑏−𝑎
X
𝑓 (𝑘) = 𝑓 (𝑎 + 𝑗).
𝑘=𝑎 𝑗=0

Dal punto di vista mnemonico abbiamo fatto un cambio di variabile 𝑗 = 𝑘 − 𝑎 :


per 𝑘 = 𝑎 si trova 𝑗 = 0 e per 𝑘 = 𝑏 si trova 𝑗 = 𝑏 − 𝑎 .

Esercizio 1.33. Convincersi che la somma è lineare:

𝑏
X 𝑏
X X 𝑏
X 𝑏
X
[ 𝑓 (𝑘) + 𝑔(𝑘)] = 𝑓 (𝑘) + 𝑔(𝑘), 𝑐 · 𝑓 (𝑘) = 𝑐 · 𝑓 (𝑘)
𝑘=𝑎 𝑘=𝑎 𝑘=𝑎 𝑘=𝑎 𝑘=𝑎

e additiva:
𝑐
X 𝑏
X 𝑐
X
𝑓 (𝑘) = 𝑓 (𝑘) + 𝑓 (𝑘).
𝑘=𝑎+1 𝑘=𝑎+1 𝑘=𝑏+1

Esercizio 1.34. Dimostrare che


𝑛 𝑛
X 𝑛 · (𝑛 + 1) X 𝑛 · (𝑛 + 1) · (2𝑛 + 1)
𝑘= , 𝑘2 =
𝑘=1
2 𝑘=1
6

Svolgimento. Il risultato della prima somma può essere interpretato nel modo
seguente: la media di una progressione aritmetica 1+2+···+𝑛
𝑛 è uguale alla media
tra il primo e l’ultimo termine della progressione: 1+𝑛
2 .

Una volta identificata la formula la possiamo dimostrare per induzione. Per


𝑛 = 0 la somma è pari a 0 per definizione. Se la formula è vera per un certo 𝑛 ,
si ha
!
𝑛+1 𝑛
X X 𝑛 · (𝑛 + 1) (𝑛 + 2)(𝑛 + 1)
𝑘= 𝑘 + (𝑛 + 1) = + (𝑛 + 1) =
𝑘=1 𝑘=1
2 2
28 1 fondamenti

che è quanto volevamo dimostrare.

La formula per la somma dei quadrati si può dimostrare facilmente per induzione
(lo si faccia per esercizio) se già conosciamo la formula da dimostrare.

Un metodo per trovare la formula è quello di osservare che la differenza di due


termini cubici consecutivi risulta essere quadratico:

𝑘 3 − (𝑘 − 1)3 = 3 𝑘 2 − 3 𝑘 + 1.

Sommando ambo i lati della precedente equazione si ottiene:


𝑛
X 𝑛
X 𝑛
X 𝑛
X 𝑛
X
𝑘3 − (𝑘 − 1)3 = 3 𝑘2 − 3 𝑘+ 1. (1.8)
𝑘=1 𝑘=1 𝑘=1 𝑘=1 𝑘=1

Al lato destro compare la somma di cui vogliamo calcolare il valore insieme


ad altre due somme di cui sappiamo già il valore. Basterà allora determinare
si chiama somma telescopica in quanto i il valore del lato sinistro dove osserviamo che i termini delle due somme si
termini delle due sommatorie si chiu- cancellano a vicenda, tranne l’ultimo della prima somma e il primo della seconda:
dono uno nell’altro come i tubi di un
dunque si ottiene 𝑛 3 − 03 = 𝑛 3 . Moltiplichiamo per 2 l’equazione (1.8), mettiamo
cannocchiale.
in evidenza la somma dei quadrati e utilizzando la formula 2 𝑛𝑘=1 𝑘 = 𝑛(𝑛 + 1)
P
per ottenere:
𝑛
X
𝑘 2 = 2𝑛 3 + 3𝑛(𝑛 + 1) − 2𝑛 = 𝑛 · 2(𝑛 2 − 1) + 3(𝑛 + 1)
 
6
𝑘=1
= 𝑛 · (𝑛 + 1)(2𝑛 + 1)

che è quanto volevamo dimostrare.


P𝑛
Con lo stesso metodo si può trovare una formula per il calcolo di 𝑘=1
𝑘 3 e così
via. . .

permutazione
Se 𝑔 : {1 , . . . , 𝑛} → {1 , . . . , 𝑛} è bigettiva (una tale funzione si chiama permuta-
zione) allora si può fare il cambio di variabile 𝑘 = 𝑔(𝑗):

𝑛−1
X 𝑛−1
X
𝑓 (𝑘) = 𝑓 (𝑔(𝑗)).
𝑘=0 𝑗=0

Questa uguaglianza può essere dimostrata facilmente nel caso in cui 𝑔 scambi
due soli indici lasciando fissi tutti gli altri (trasposizione) e poi può essere estesa
a tutte le permutazioni osservando che ogni permutazione si scrivere come
composizione di trasposizioni.

Questa proprietà è sostanzialmente la proprietà commutativa della somma


estesa ad un numero qualunque di addendi. Grazie a questa proprietà possiamo
definire la somma di una funzione definita su qualunque insieme finito. Se
𝑓 : 𝐴 → ℝ e 𝑔 : 𝐼𝑛 → 𝐴 è una bigezione (dunque #𝐴 = 𝑛 ) allora si può
definire
X 𝑛−1
X
𝑓 (𝑘) = 𝑓 (𝑔(𝑗))
𝑘∈𝐴 𝑗=0
1.10 polinomi 29

in quanto la somma sul lato destro non dipende dalla bigezione 𝑔 che abbiamo
scelto.

1.10 polinomi

Il concetto di “polinomio” è una astrazione che non risulta facile esplicitare


formalmente. Nel capitolo 9 ci sarà molto utile applicare un polinomio ad un
operatore differenziale e dunque ci teniamo ora a rendere molto chiaro cosa
intendiamo per polinomio. In particolare distingueremo tre concetti che spesso
vengono sovrapposti: espressione polinomiale, polinomio e funzione polinomiale.

Se 𝐴 è un anello abeliano con unità (per ora noi abbiamo un unico esempio
𝐴 = ℤ ma più avanti potremo scegliere 𝐴 = ℚ, 𝐴 = ℝ o 𝐴 = ℂ) possiamo
considerare tutte le espressioni (formalmente: alberi di valutazione) che possono
essere costruite utilizzando le operazioni di addizione e moltiplicazione che
coinvolgono coefficienti presi da 𝐴 e una variabile che possiamo chiamare 𝑥
(e più in generale è possibile considerare polinomi in più variabili). Queste espressioni polinomiali
espressioni verranno chiamate espressioni polinomiali su 𝐴 (o a coefficienti in
𝐴) nella variabile 𝑥 . Un esempio di espressione polinomiale è riportato in
Figura 1.3. Le espressioni polinomiali possono essere sommate e moltiplicate
tra loro per ottenere nuove espressioni. Come comoda notazione si utilizzano
le potenze intere per denotare un prodotto ripetuto 𝑛 volte: 𝑥 𝑛 = 𝑥 · · · 𝑥 .

Diremo che due espressioni sono equivalenti se è possibile trasformare una nel-
l’altra utilizzando le proprietà valide negli anelli abeliani: proprietà associativa
e commutativa per somma e prodotto, proprietà distributiva, elementi neutri
1 · 𝑥 = 𝑥 , 0 + 𝑥 = 𝑥 . Inoltre se un ramo dell’espressione non contiene la variabile
𝑥 è possibile valutare (nell’anello 𝐴) le operazioni e sostituire l’intero ramo con
il risultato di tali operazioni (e viceversa).

In particolare se abbiamo una qualunque espressione possiamo sviluppare tutti


i prodotti mediante la proprietà distributiva e poi riassociare i termini con le
stesse potenze di 𝑥 , ad esempio:

𝑃 = ((−7) · 𝑥 + 42) · (𝑥 · (2 + 𝑥) + 3 · (−1 + 𝑥))


= ((−7) · 𝑥 + 42) · (2 𝑥 + 𝑥 2 − 3 + 3 𝑥)
= 126 + 231 𝑥 + 7 𝑥 2 − 7 𝑥 3

In generale si otterrà una espressione polinomiale che diremo essere in forma


canonica:
𝑛
𝑃 = 𝑎0 + 𝑎1 𝑥 + 𝑎2 𝑥 2 + · · · + 𝑎 𝑛 𝑥 𝑛 = 𝑎𝑘 𝑥 𝑘 .
X
𝑘=0

Dunque ogni espressione polinomiale è equivalente ad una espressione polino-


miale in forma canonica.
polinomio
Se due espressioni polinomiali sono equivalenti diremo che rappresentano lo
stesso polinomio. Se 𝐴 è un anello denoteremo con 𝐴[𝑥] l’insieme di tutti i
polinomi con coefficienti in 𝐴 e variabile 𝑥 . Formalmente 𝐴[𝑥] è il quoziente
30 1 fondamenti

+ +

· 42 · ·

−7 𝑥 𝑥 + 3 +

Figura 1.3: Il polinomio


𝑃 = ((−7) · 𝑥 + 42)·(𝑥·(2+𝑥)+3 ·(−1+𝑥))
rappresentato come albero di valutazio- 2 𝑥 −1 𝑥
ne.

dell’insieme di tutte le espressioni polinomiali rispetto alla relazione di equiva-


lenza che abbiamo appena definito. Possiamo fare la somma e il prodotto di
polinomi e queste operazioni rendono 𝐴[𝑥] anch’esso un anello.

Più esplicitamente se 𝑃 e 𝑄 sono polinomi in forma canonica


𝑛 𝑚
𝑎𝑘 𝑥 𝑘 , 𝑏𝑘 𝑥 𝑘
X X
𝑃= 𝑄=
𝑘=0 𝑘=0

si avrà:
𝑁
(𝑎 𝑘 + 𝑏 𝑘 ) · 𝑥 𝑘
X
𝑃+𝑄 =
𝑘=0

dove 𝑁 è il più grande tra 𝑛 e 𝑚 e si intende che 𝑎 𝑘 = 0 per 𝑘 > 𝑛 e 𝑏 𝑘 = 0 per


𝑘 > 𝑚 . Se 𝑡 ∈ 𝐴 avremo:
𝑛
(𝑡 𝑎 𝑘 ) · 𝑥 𝑘 .
X
𝑡𝑃 =
𝑘=0

Per quanto riguarda il prodotto si avrà invece:


! ! ! !
𝑛 𝑛 𝑛 𝑚
𝑘 𝑗 𝑗 𝑘
X X X X
𝑃·𝑄 = 𝑎𝑘 𝑥 · 𝑏𝑗 𝑥 = 𝑎𝑘 𝑏𝑗 𝑥 𝑥
𝑘=0 𝑗=0 𝑘=0 𝑗=0
! !
𝑛 X
𝑚 𝑚+𝑛 𝑠
𝑗+𝑘
𝑎 𝑗 𝑏 𝑠−𝑗 𝑥 𝑠 .
X X X
= 𝑎𝑘 𝑏𝑗 𝑥 =
𝑘=0 𝑗=0 𝑠=0 𝑗=0

Le formule per la somma e il prodotto dei polinomi in forma canonica possono


essere applicate ad ognuna delle proprietà di anello per dimostrare che poli-
nomi equivalenti hanno la stessa forma canonica e che quindi due espressioni
polinomiali sono equivalenti se e solo se i coefficienti della loro forma canonica
coincidono. In pratica i polinomi a coefficienti in 𝐴 sono rappresentati dai
1.11 coefficienti binomiali 31

coefficienti delle loro forme canoniche che non sono altro che sequenze finite:
𝑛
𝑎 𝑘 𝑥 𝑘 : 𝑎 𝑘 ∈ 𝐴, 𝑛 ∈ ℕ }
X
𝐴[𝑥] = {
𝑘=0
≈ 𝐴ℕ
𝑐 = 𝒂 ∈ 𝐴 : {𝑘 ∈ ℕ : 𝒂(𝑘) ≠ 0 } è finito .



Se il polinomio 𝑃 si scrive in forma canonica


𝑛
𝑎𝑘 𝑥 𝑘
X
𝑃=
𝑘=0

se 𝑛 > 0 possiamo supporre che il coefficiente 𝑎 𝑛 sia diverso da 0 perché


altrimenti potremmo rimuovere il termine corrispondente e ridurci ad una
somma di 𝑛 − 1 termini. In tal caso diremo che il polinomio 𝑃 ha grado 𝑛 . Se grado
𝑛 = 0 diremo anche che il polinomio è costante. Se 𝑛 = 0 e 𝑎 𝑛 = 0 diremo
che 𝑃 è il polinomio nullo. I polinomi costanti non nulli hanno grado pari a 0,
mentre il polinomio nullo, per convenzione, diremo avere grado −∞ (questa
definizione ha senso se si pensa al grado di un polinomio come al più piccolo
numero per cui tutti i coefficienti di indice maggiore a lui sono nulli).

Finora abbiamo definito il polinomio come una classe di equivalenza di espres-


sioni polinomiali. Se prendiamo una espressione 𝑃 e al posto della variabile
𝑥 mettiamo un elemento 𝑎 dell’anello 𝐴 (o di qualunque anello che estende
𝐴) allora possiamo valutare tutte le operazioni (somme e prodotti) ed ottenere
un risultato nell’anello scelto: il risultato ottenuto si indica con 𝑃(𝑎) (stessa
notazione utilizzata per le funzioni). Se 𝑃 è un polinomio nella variabile 𝑥
la funzione 𝑥 ↦→ 𝑃(𝑥) può essere chiamata funzione polinomiale e si indica funzione polinomiale
usualmente con con lo stesso nome 𝑃 dato al polinomio. Sarà il contesto a dirci
se con 𝑃 si intende il polinomio (l’espressione) o la funzione.

Come già anticipato è utile tenere separato il concetto di polinomio da quello


di funzione polinomiale in quanto lo stesso polinomio può essere valutato su
diversi anelli (ad esempio nel corso di geometria si potrà sostituire la variabile
𝑥 di un polinomio con una matrice, e nell’ultimo capitolo di questi appunti
sostituiremo la 𝑥 con un operatore differenziale).

Proseguiremo con la trattazione dei polinomi nel capitolo 4.4.

1.11 coefficienti binomiali

Capiterà spesso di imbattersi in alcuni polinomi particolari, che vengono a volte prodotti notevoli
chiamati prodotti notevoli. Di fondamentale iportanza quelli di grado 2:

(𝑥 + 1) · (𝑥 − 1) = 𝑥 2 − 1 , (𝑥 + 1)2 = 𝑥 2 + 2 𝑥 + 1.

Ma anche quelli di grado 𝑛 :

𝑛−1 𝑛−1 𝑛
𝑥𝑘 = 𝑥 𝑘+1 − 𝑥 𝑘 = 𝑥𝑛 − 1
X X X
(𝑥 − 1) ·
𝑘=0 𝑘=0 𝑘=0
32 1 fondamenti

e, mettendo −𝑥 al posto di 𝑥 e cambiando di segno:

𝑛−1
(−1) 𝑘 𝑥 𝑘 = 1 + (−1)𝑛 𝑥 𝑛 .
X
(𝑥 + 1) ·
𝑘=0

Le potenze del binomio 𝑥 + 1 sono decisamente rilevanti. Se scriviamo il


polinomio (𝑥 + 1)𝑛 in forma canonica:
𝑛
(𝑥 + 1)𝑛 = 𝑎𝑘 𝑥 𝑘
X
𝑘=0

saremmo interessati a calcolare il valore dei coefficienti 𝑎 𝑘 . Innanzitutto gli


coefficienti binomiali diamo un nome: questi coefficienti vengono chiamati coefficienti binomiali e si
I coefficienti binomiali nell’ambito del denotano nel modo seguente:
calcolo combinatorio vengono anche
𝑛
 
chiamati combinazioni
 e denotati con il 𝑎𝑘 = .
simbolo 𝐶 𝑛,𝑘 = 𝑛𝑘 . La coincidenza tra 𝑘
le combinazioni e i coefficienti binomiali
è espressa nel teorema 1.40.
Non è difficile convincersi che se sviluppiamo il binomio (𝑥 + 𝑦)𝑛 si ottengono
potenza del binomio gli stessi coefficienti dunque in generale vale la seguente formula per la potenza
del binomio:
𝑛  
𝑛 𝑘 𝑛−𝑘
(𝑥 + 𝑦)𝑛 =
X
𝑥 𝑦 .
𝑘=0
𝑘

Per determinare il valore effettivo dei coefficienti binomiali si utilizza usualmente


il seguente.

Teorema 1.35 (triangolo di Tartaglia). Per ogni 𝑛 ∈ ℕ e 𝑘 ∈ ℕ con 1 ≤ 𝑘 ≤ 𝑛 si ha

𝑛+1 𝑛 𝑛
     
= +
𝑘 𝑘−1 𝑘

mentre
𝑛+1 𝑛+1
   
=1=
0 𝑛+1

Dimostrazione. Infatti si ha
𝑛+1  𝑛  
𝑛+1 𝑛

𝑘 𝑛+1
𝑥𝑘
X X
𝑥 = (1 + 𝑥) = (1 + 𝑥) ·
𝑘=0
𝑘 𝑘=0
𝑘
𝑛   𝑛  
𝑛 𝑛
𝑥𝑘 + 𝑥 𝑘+1
X X
=
𝑘=0
𝑘 𝑘=0
𝑘
𝑛   𝑛+1
𝑛 𝑛
 
𝑥𝑘 + 𝑥𝑘
X X
=
𝑘=0
𝑘 𝑘=1
𝑘−1
𝑛
𝑛 0 X 𝑛 𝑛 𝑛 𝑛+1
       
𝑘
= 𝑥 + + 𝑥 + 𝑥 .
0 𝑘=1
𝑘 𝑘−1 𝑛
1.11 coefficienti binomiali 33

𝑛
  Tabella 1.5: Il triangolo di Tartaglia (o
0 1 2 3 4 5 6 𝑘 di Pascal): ogni numero è la somma dei
𝑘 due numeri che si trovano nella riga
0 1 precedente sopra e immediatamente a
1 1 1 sinistra.
2 1 2 1
3 1 3 3 1
4 1 4 6 4 1
5 1 5 10 10 5 1
6 1 6 15 20 15 6 1
.. ..
𝑛 . .

Per l’unicità della forma canonica dei polinomi i coefficienti corrispondenti


devono essere uguali e quindi troviamo

𝑛+1 𝑛 𝑛+1 𝑛 𝑛 𝑛+1 𝑛


             
= , = + , = .
0 0 𝑘 𝑘 𝑘−1 𝑛+1 𝑛

0
Si può facilmente verificare che 0 = 1 e questo conclude la dimostrazione.

In base al teorema precedente i coefficienti binomiali si possono elencare come


nella tabella 1.5: ogni riga inizia e finisce con il numero 1 e ogni termine
intermedio coincide con la somma dei due termini nella riga precedente sopra
e a sinistra del numero considerato.

Teorema 1.36 (formula per i coefficienti binomiali). Se 𝑛 ∈ ℕ e 𝑘 ∈ ℕ , 𝑘 ≤ 𝑛 si


ha
𝑛 𝑛!
 
= .
𝑘 𝑘 !(𝑛 − 𝑘)!

Dimostrazione. Lo dimostriamo per induzione su 𝑛 . Per 𝑛 = 0 sappiamo che


0
0 = 1 che è ugule a 0!0! . Utilizziamo il teorema 1.35. Se 𝑘 = 0 o 𝑘 = 𝑛 sappiamo
0!
𝑛
che 𝑘 = 1 che coincide con la formula enunciata. Per gli altri casi, supponendo
per induzione che la formula sia vera per un certo 𝑛 ∈ ℕ si ha:

𝑛+1 𝑛 𝑛 𝑛! 𝑛!
     
= + = +
𝑘 𝑘 𝑘−1 𝑘 !(𝑛 − 𝑘)! (𝑘 − 1)!(𝑛 − 𝑘 + 1)!
𝑛 !(𝑛 − 𝑘 + 1) + 𝑛 ! 𝑘 𝑛 !(𝑛 + 1)
= =
𝑘 !(𝑛 − 𝑘 + 1)! 𝑘 !(𝑛 + 1 − 𝑘)!
(𝑛 + 1)!
=
𝑘 !(𝑛 + 1 − 𝑘)!

che è quanto dovevamo dimostrare.

Si osservi che risulta, per ogni 𝑛 ∈ ℕ :

𝑛 𝑛
   
= = 𝑛.
1 𝑛−1
34 1 fondamenti

Esercizio 1.37. Provare che


𝑛  
𝑛
= 2𝑛 .
X
𝑘=0
𝑘

1.12 cardinalità finite

Definizione 1.38 (cardinalità finite). Definiamo 𝐼𝑛 = {𝑘 ∈ ℕ : 𝑘 < 𝑛} = {0 , 1 , 2 , . . . , 𝑛−


1}. L’insieme 𝐼𝑛 è il prototipo di insieme finito con 𝑛 elementi. Se 𝐴 è un insieme
insieme finito qualunque diremo che 𝐴 è finito se #𝐴 = #𝐼𝑛 per qualche 𝑛 ∈ ℕ ovvero se esiste un
funzione bigettiva 𝑓 : 𝐼𝑛 → 𝐴. In tal caso diremo che 𝐴 ha 𝑛 elementi e scriveremo:

#𝐴 = 𝑛 (leggi: la cardinalità di 𝐴 è 𝑛 )

insieme infinito
In caso contrario diremo che 𝐴 è infinito

Affinché la notazione #𝐴 = 𝑛 abbia senso bisogna osservare che un insieme


𝐴 può essere messo in corrispondenza biunivoca con un unico 𝐼𝑛 . Se fosse
#𝐴 = 𝑛 e #𝐴 = 𝑚 esisterebbe una funzione bigettiva tra 𝐼𝑛 e 𝐼𝑚 . Allora basterà
dimostrare il seguente.

Lemma 1.39. Se esiste una funzione iniettiva 𝑓 : 𝐼𝑛 → 𝐼𝑚 allora 𝑛 ≤ 𝑚 .

Dimostrazione. Lo si dimostra per induzione su 𝑛 . Per 𝑛 = 0 certamente


𝑚 ≥ 𝑛 in quanto 𝑚 è un numero naturale. Supponiamo di avere una funzione
iniettiva 𝑓 : 𝐼𝑛+1 → 𝐼𝑚 . Scegliamo 𝛼 = 𝑓 (𝑛) ∈ 𝐼𝑚 e consideriamo la funzione
𝑔 : 𝐼𝑚 → 𝐼𝑚 che scambia 𝛼 con 𝑚 − 1. Chiaramente 𝑔 è una bigezione e quindi
𝑓 ◦ 𝑔 : 𝐼𝑛+1 → 𝐼𝑚 e ancora iniettiva. Ma ora 𝑓 ◦ 𝑔(𝑛) = 𝑚 − 1 e quindi la
restrizione di 𝑓 ◦ 𝑔 a 𝐼𝑛 è una funzione iniettiva 𝐼𝑛 → 𝐼𝑚−1 . Per ipotesi induttiva
𝑚 − 1 ≥ 𝑛 e quindi 𝑚 ≥ 𝑛 + 1.

Il precedente lemma ci dice in particolare che ℕ è un esempio di insieme infinito.


Se infatti fosse #ℕ ≤ 𝐼𝑛 per qualche 𝑛 ∈ ℕ si avrebbe #𝐼𝑛+1 ≤ #ℕ ≤ #𝐼𝑛 che,
utilizzando il teorema 1.4, è in contraddizione con il lemma.

Lasciamo al lettore il piacere di dimostrare (utilizzando il principio di induzione)


le seguenti proprietà.

Teorema 1.40 (operazioni con le cardinalità finite). Se 𝐴 e 𝐵 sono insiemi disgiunti


e finiti allora
#(𝐴 ∪ 𝐵) = #𝐴 + #𝐵.
Se 𝐴 e 𝐵 sono insiemi finiti allora (ricordiamo che 𝐵 𝐴 è l’insieme delle funzioni 𝐴 → 𝐵)

#(𝐴 × 𝐵) = #𝐴 · #𝐵, #(𝐵 𝐴 ) = #𝐵#𝐴 , #P(𝐴) = 2#𝐴 ,


# 𝑓 ∈ 𝐴𝐴 : 𝑓 bigettiva = (#𝐴)! ,


#𝐴
 
#{𝑋 ∈ P(𝐴) : #𝑋 = 𝑘}. = .
𝑘
1.13 estremo superiore 35

1.13 estremo superiore

Riprendiamo ora la trattazione dell’insieme ℝ dei numeri reali. Vediamo ora


quali sono le conseguenze della continuità dell’ordinamento di ℝ, proprietà che
finora non abbiamo mai utilizzato.

Definizione 1.41. Sia 𝐴 ⊆ ℝ. Se 𝐴 ha un maggiorante (cioè esiste 𝑥 ∈ ℝ tale che


𝑥 ≥ 𝐴, definizione 1.14) diremo che 𝐴 è superiormente limitato, se 𝐴 ammette un
minorante diremo che 𝐴 è inferiormente limitato, se 𝐴 ammette sia maggiorante che
minorante diremo che 𝐴 è limitato. limitato

Se 𝑥 è minimo dei maggioranti di 𝐴 diremo che 𝑥 è estremo superiore di 𝐴 se invece estremo superiore
𝑥 è massimo dei minoranti diremo che 𝑥 è estremo inferiore di 𝐴:
estremo inferiore
sup 𝐴 = min {𝑥 ∈ ℝ : 𝑥 ≥ 𝐴},
inf 𝐴 = max {𝑥 ∈ ℝ : 𝑥 ≤ 𝐴}.

Osserviamo che se l’insieme 𝐴 è finito e non vuoto, il massimo e il minimo


esistono sempre. Se, ad esempio, non esistesse il massimo di 𝐴 significa che
scelto 𝑥 𝑘 ∈ 𝐴 esisterebbe sempre 𝑥 𝑘+1 ∈ 𝐴 con 𝑥 𝑘+1 > 𝑥 𝑘 e quindi l’insieme
𝐴 dovrebbe contenere infiniti punti 𝑥 0 , 𝑥1 , . . . , 𝑥 𝑘 , . . . Insiemi infiniti, invece,
potrebbero non avere massimo/minimo. Un esempio di insieme che non ha né
massimo né minimo è l’insieme 𝐴 = {𝑥 ∈ ℝ : 0 < 𝑥 < 1} infatti per ogni 𝑥 ∈ 𝐴
si ha 𝑥2 < 𝑥 , 1+𝑥 𝑥
2 > 𝑥 con 2 ∈ 𝐴 e 2 ∈ 𝐴, dunque nessun 𝑥 ∈ 𝐴 può essere
1+𝑥

massimo o minimo. L’insieme 𝐵 = {𝑥 ∈ ℝ : 0 ≤ 𝑥 ≤ 1} ha invece massimo


max 𝐵 = 1 e minimo min 𝐵 = 0.

Teorema 1.42 (esistenza del sup). Se 𝐴 è un insieme non vuoto, superiormente


limitato, allora esiste l’estremo superiore di 𝐴. Tale numero 𝑥 = sup 𝐴 è caratterizzato
dalle seguenti proprietà

1. ∀𝑎 ∈ 𝐴 : 𝑥 ≥ 𝑎 ;
2. ∀𝜀 > 0 : ∃𝑎 ∈ 𝐴 : 𝑥 < 𝑎 + 𝜀.

Risultato analogo vale per l’estremo inferiore.

Dimostrazione. Consideriamo l’insieme dei maggioranti

𝐵 = {𝑏 ∈ ℝ : 𝑏 ≥ 𝐴}.

Per ipotesi 𝐵 è non vuoto e per come è definito risulta 𝐴 ≤ 𝐵. Dunque


dall’assioma di continuità deduciamo l’esistenza di un numero 𝑥 ∈ ℝ tale che
𝐴 ≤ 𝑥 ≤ 𝐵. La prima disuguaglianza 𝐴 ≤ 𝑥 ci dice che 𝑥 è un maggiorante
e quindi 𝑥 ∈ 𝐵, la seconda 𝑥 ≤ 𝐵 ci dice che 𝑥 è il minimo di 𝐵 e quindi
concludiamo che 𝑥 è l’estremo superiore di 𝐴.

La prima delle due proprietà caratterizzanti il sup traduce la condizione che 𝑥


sia un maggiorante di 𝐴. La seconda delle due proprietà esprime il fatto che 𝑥
sia il minimo dei maggioranti, infatti se 𝑥 è il minimo dei maggioranti significa
36 1 fondamenti

che nessun numero minore di 𝑥 è un maggiorante, ovvero che ogni 𝑥 − 𝜀 con


𝜀 > 0 non è un maggiorante, ovvero che esiste 𝑎 ∈ 𝐴 tale che 𝑎 > 𝑥 − 𝜀.

La precedente dimostrazione è l’unica in cui utilizzeremo l’assioma di continuità


dei numeri reali. D’ora in poi non utilizzeremo più tale assioma ma useremo
invece gli operatori: sup e inf. In effetti è molto semplice verificare che l’esistenza
del sup è una condizione equivalente all’assioma di continuità (basta osservare
che se 𝐴 ≤ 𝐵 allora sup 𝐴 è un elemento di separazione).

Il seguente risultato ci dice, informalmente, che non esistono quantità infinite


(ma neanche infinitesime) in ℝ.
proprietà archimedea

Teorema 1.43 (proprietà archimedea dei numeri reali). Dati 𝑥, 𝑦 ∈ ℝ con


𝑥, 𝑦 > 0 esiste 𝑛 ∈ ℕ tale che 𝑛 𝑦 > 𝑥 .

A parole: per quanto piccolo possa essere 𝑦 > 0, sommandolo a se stesso molte volte si
arriva, dopo un numero finito di passi, a superare qualunque numero 𝑥 anche molto
grande.

Dimostrazione. Fissati 𝑥, 𝑦 ∈ ℝ, 𝑥 > 0, 𝑦 > 0 consideriamo l’insieme

𝐴 = ℕ 𝑦 = {𝑛 𝑦 : 𝑛 ∈ ℕ }.

Basta dimostrare che 𝐴 non è superiormente limitato perché in tal caso dato
𝑥 ∈ ℝ esisterebbe 𝑛 ∈ ℕ per cui 𝑛 𝑦 > 𝑥 ed entrambe le affermazioni del teorema
sarebbero vere (la prima prendendo 𝑦 = 1 e la seconda prendendo 𝑥 = 1).

Chiaramente 𝐴 non è vuoto in quanto 0 ∈ 𝐴 dunque se 𝐴 per assurdo fosse


superiormente limitato esisterebbe 𝑚 = sup 𝐴, 𝑚 ∈ ℝ. Siccome 𝑚 è il minimo
dei maggioranti di 𝐴 e 𝑚 − 𝑦 è più piccolo di 𝑚 , allora 𝑚 − 𝑦 non è un
maggiorante. Dunque deve esistere 𝑛 ∈ ℕ tale che 𝑛 𝑦 > 𝑚 − 𝑦 . Ma allora
(𝑛 + 1)𝑦 = 𝑛 𝑦 + 𝑦 > 𝑚 ed essendo 𝑛 + 1 ∈ ℕ troviamo che 𝑚 non poteva essere
un maggiorante di 𝐴: assurdo.

Teorema 1.44 (principio del buon ordinamento). Sia 𝐴 ⊆ ℕ , 𝐴 ≠ ∅. Allora 𝐴 ha


minimo.

Dimostrazione. Osserviamo che se 𝑛 ∈ ℕ è un minorante di 𝐴 ⊆ ℕ allora o


𝑛 ∈ 𝐴 e quindi 𝑛 è il minimo di 𝐴 oppure anche 𝑛 + 1 è un minorante di 𝐴 in
quanto non ci sono numeri interi compresi tra 𝑛 e 𝑛 + 1.

Dunque se 𝐴 non avesse minimo, per il principio di induzione ogni 𝑛 ∈ ℕ


sarebbe un minorante di 𝐴. In tal caso 𝐴 dovrebbe essere vuoto perché se 𝑎 ∈ 𝐴
certamente 𝑎 + 1 non è un minorante di 𝐴.

Teorema 1.45 (parte intera). Dato 𝑥 ∈ ℝ esiste un unico 𝑚 ∈ ℤ tale che 𝑚 − 1 <
𝑥 ≤ 𝑚.
1.14 l’insieme dei numeri razionali 37

Dimostrazione. Supponiamo per un attimo che sia 𝑥 > 0 e consideriamo l’insie-


me 𝐴 = {𝑛 ∈ ℕ : 𝑛 ≥ 𝑥}. Tale insieme non è vuoto per la proprietà archimedea e
dunque ammette minimo per il principio del buon ordinamento. Se 𝑚 = min 𝐴
risulta quindi 𝑚 ∈ ℕ e 𝑚 − 1 < 𝑥 ≤ 𝑚 .

Se 𝑥 ≤ 0 per la proprietà archimedea esiste 𝑘 ∈ ℕ tale che 𝑘 > −𝑥 . Allora


applichiamo il risultato precedente a 𝑥 + 𝑘 e consideriamo 𝑚 − 𝑘 al posto di
𝑚.
parte intera
Definizione 1.46 (parte intera). Dato 𝑥 ∈ ℝ denotiamo con b𝑥c l’unico intero che
soddisfa b·c
𝑥 − 1 < b𝑥c ≤ 𝑥
e denotiamo con d𝑥e = −b−𝑥c l’unico intero che soddisfa (verificare!) d·e

𝑥 ≤ d𝑥e < 𝑥 + 1.

Si ha dunque
b𝑥c ≤ 𝑥 ≤ d𝑥e
con entrambe le uguaglianze che si realizzano quando 𝑥 ∈ ℤ. I due interi b𝑥c e d𝑥e
sono la migliore approssimazione intera di 𝑥 rispettivamente per difetto e per eccesso.
L’intero più vicino ad 𝑥 (approssimazione per arrotondamento) è arrotondamento

    Il numero 12 verrà definito nella pros-


1 1 sima sezione sui numeri razionali, lo
𝑥+ ossia 𝑥− anticipiamo per comodità.
2 2

(le due espressioni differiscono solamente quando 𝑥 si trova nel punto medio tra due
interi consecutivi, nel qual caso la prima approssima per eccesso e la seconda per difetto).

In alcuni testi si usa la notazione [𝑥] per denotare la parte intera b𝑥c e si definisce
anche la parte frazionaria
{𝑥} = 𝑥 − [𝑥].
Per evitare ambiguità con il normale utilizzo delle parentesi non useremo queste
notazioni.

1.14 l’insieme dei numeri razionali

Teorema 1.47 (divisibilità dei numeri reali). Dato 𝑥 ∈ ℝ e dato 𝑛 ∈ ℕ , 𝑛 ≠ 0


esiste un unico 𝑦 ∈ ℝ tale che 𝑛 𝑦 = 𝑥 . Scriveremo in tal caso 𝑦 = 𝑛𝑥 o 𝑦 = 𝑥/𝑛 .

Dimostrazione. Preliminarmente vogliamo dimostrare che preso qualunque


𝑛 ∈ ℕ con 𝑛 > 0 vale la proprietà di esistenza di numeri piccoli:

∀𝜀 > 0 ∃𝛿 > 0 : 𝑛𝛿 < 𝜀. (1.9)

E’ facile dimostrare che

∀𝜀 > 0 ∃𝛼 > 0 : 2 𝛼 ≤ 𝜀
38 1 fondamenti

infatti dato 𝜀 > 0 sappiamo, per la proprietà di densità dei numeri reali, che
esiste 𝑥 ∈ ℝ tale che 0 < 𝑥 < 𝜀. Ma allora se 2 𝑥 ≤ 𝜀 basta scegliere 𝛼 = 𝑥 se
invece 2 𝑥 > 𝜀 si sceglie 𝛼 = 𝜀 − 𝑥 così da avere comunque

2 𝛼 = 2 𝜀 − 2 𝑥 < 2 𝜀 − 𝜀 = 𝜀.

Ma allora (1.9) può essere dimostrata per induzione. Per 𝑛 = 1 non è altro che
la proprietà di densità (se 0 < 𝜀 esiste 𝛿 tale che 0 < 𝛿 < 𝜀). Supponendo la
proprietà vera per un certo 𝑛 ≥ 1 sappiamo esistere 𝛿 > 0 tale che 𝑛𝛿 < 𝜀 ma
anche 𝛼 > 0 tale che 2 𝛼 ≤ 𝛿 . Allora

(𝑛 + 1)𝛼 ≤ (𝑛 + 𝑛)𝛼 = 2𝑛𝛼 ≤ 𝑛𝛿 < 𝜀

e dunque la proprietà (1.9) è verificata per ogni 𝑛 ∈ ℕ .

Passiamo ora alla dimostrazione del teorema. Senza perdita di generalità


possiamo supporre che sia 𝑥 > 0 in quanto 𝑥 = 0 è banale e se 𝑥 < 0 basta
considerare −𝑥 al posto di 𝑥 . Dato 𝑛 ∈ ℕ , 𝑛 ≠ 0, dobbiamo risolvere l’equazione
𝑛 𝑦 = 𝑥 per trovare 𝑦 . Consideriamo l’insieme

𝐴 = {𝑎 ∈ ℝ : 𝑎 ≥ 0, 𝑛𝑎 ≤ 𝑥}.

Chiaramente 𝐴 non è vuoto in quanto 0 ∈ 𝐴. Inoltre se 𝑎 > 𝑥 si ha 𝑛𝑎 > 𝑛𝑥 ≥ 𝑥 e


dunque 𝑎 ∉ 𝐴. Significa che 𝑥 è un maggiorante di 𝐴 e quindi 𝐴 è superiormente
limitato. Scegliamo allora
𝑦 = sup 𝐴.
Dobbiamo mostrare che 𝑛 𝑦 = 𝑥 . Se fosse 𝑛 𝑦 < 𝑥 posto 𝜀 = 𝑥 − 𝑛 𝑦 avremmo
𝜀 > 0 e per (1.9) sappiamo che dovrà esistere 𝛿 > 0 per cui 𝑛𝛿 < 𝜀 da cui:

𝑛(𝑦 + 𝛿) = 𝑛 𝑦 + 𝑛𝛿 < 𝑛 𝑦 + 𝜀 = 𝑥.

Dunque si avrebbe 𝑦 + 𝛿 ∈ 𝐴 da cui si conclude che 𝑦 non può essere un


maggiorante di 𝐴. Se invece fosse 𝑛 𝑦 > 𝑥 posto 𝜀 = 𝑛 𝑦 − 𝑥 prendiamo anche
in questo caso un 𝛿 > 0 con 𝑛𝛿 < 𝜀. Allora 𝑦 − 𝛿 sarebbe un maggiorante di 𝐴
perché preso qualunque 𝑎 > 𝑦 − 𝛿 si avrebbe

𝑛𝑎 > 𝑛 𝑦 − 𝑛𝛿 > 𝑛 𝑦 − 𝜀 = 𝑥

e dunque non ci può essere 𝑎 ∈ 𝐴 con 𝑎 > 𝑦 − 𝛿 . Ma se 𝑦 − 𝛿 è un maggiorante


𝑦 non può essere il minimo dei maggioranti: assurdo.

Significa quindi che 𝑛 𝑦 = 𝜀, come volevamo dimostrare.

Rimane da verificare che c’è un unico 𝑦 con tale proprietà. Ma se avessimo due
soluzioni: 𝑛 𝑦1 = 𝜀 e 𝑛 𝑦2 = 𝜀 facendo la differenza si ottiene 𝑛(𝑦1 − 𝑦2 ) = 0 da
cui (essendo 𝑛 > 1) si ottiene 𝑦1 − 𝑦2 = 0 cioè 𝑦1 = 𝑦2 .
numeri razionali

Grazie al teorema precedente possiamo definire i numeri razionali:

𝑝
 

ℚ= = : 𝑝 ∈ ℤ, 𝑞 ∈ ℕ , 𝑞 ≠ 0 .
ℕ \ {0} 𝑞
1.15 valore assoluto 39

Le seguenti proprietà discendono immediatamente dalle proprietà già dimo-


strare per i numeri interi:

𝑝 0 𝑝 𝑠 𝑝+𝑠 𝑝 𝑛𝑝
= 𝑝, = 0, + = , 𝑛 = .
1 𝑞 𝑞 𝑞 𝑞 𝑞 𝑞

densità di ℚ
Teorema 1.48 (densità di ℚ in ℝ). Dati 𝑥, 𝑦 ∈ ℝ con 𝑥 < 𝑦 esiste 𝑞 ∈ ℚ tale che
𝑥 < 𝑞 < 𝑦.

Dimostrazione. Per la proprietà archimedea dei numeri reali essendo 𝑦 − 𝑥 > 0


deve esistere 𝑛 ∈ ℕ tale che 𝑦 − 𝑥 > 1/𝑛 così si avrà

𝑛𝑥 + 1 < 𝑛 𝑦.

Prendiamo allora 𝑚 = b𝑛𝑥 + 1c cosicché si abbia

𝑛𝑥 < 𝑚 ≤ 𝑛𝑥 + 1.

Mettendo insieme le due disuguaglianze e dividendo per n si ottiene, come


volevamo dimostrare,
𝑚
𝑥< < 𝑦.
𝑛

1.15 valore assoluto


valore assoluto
Definizione 1.49 (valore assoluto). Definiamo il valore assoluto |𝑥| di un numero
𝑥 ∈ ℝ nel seguente modo (
𝑥 se 𝑥 ≥ 0 ,
|𝑥| =
−𝑥 se 𝑥 < 0.

Proposizione 1.50 (proprietà del valore assoluto). Si ha

1. |𝑥| ≥ 0 (positività)
2. |𝑥| = |𝑥| (idempotenza)
3. |−𝑥| = |𝑥| (simmetria)
4. |𝑥 + 𝑦| ≤ |𝑥| + |𝑦| (convessità)
5. − 𝑦| ≤ |𝑥 − 𝑧| + |𝑧 − 𝑦| (disuguaglianza triangolare)
|𝑥
6. |𝑥| − |𝑦| ≤ |𝑥 − 𝑦| (disuguaglianza triangolare inversa)

Useremo inoltre spesso la seguente equivalenza (valida anche con < al posto di ≤ ). Se
𝑟 ≥ 0 allora
|𝑥 − 𝑦| ≤ 𝑟 ⇐⇒ 𝑦 − 𝑟 ≤ 𝑥 ≤ 𝑦 + 𝑟.

Dimostrazione. Le prime quattro proprietà sono immediate conseguenze della


definizione.

Dimostriamo innanzitutto l’ultima osservazione. Se 𝑥 ≥ 𝑦 allora 𝑥 − 𝑦 ≥ 0 e


quindi |𝑥 − 𝑦| ≤ 𝑟 è equivalente a 𝑥 − 𝑦 ≤ 𝑟 cioè 𝑥 ≤ 𝑦 + 𝑟 . Se 𝑥 < 𝑦 allora
40 1 fondamenti

𝑥 − 𝑦 < 0 e quindi |𝑥 − 𝑦| ≤ 𝑟 è equivalente a 𝑦 − 𝑥 ≤ 𝑟 cioè 𝑥 ≥ 𝑦 − 𝑟 . Viceversa


se 𝑦 − 𝑟 ≤ 𝑥 ≤ 𝑦 + 𝑟 allora vale sia 𝑥 − 𝑦 ≤ 𝑟 che 𝑦 − 𝑥 ≤ 𝑟 e dunque |𝑥 − 𝑦| ≤ 𝑟 .

Osserviamo allora che per la precedente osservazione applicata a |𝑥 − 0 | ≤ |𝑥|


si ottiene
−|𝑥| ≤ 𝑥 ≤ |𝑥|
e sommando la stessa disuguaglianza con 𝑦 al posto di 𝑥 si ottiene

−(|𝑥| + |𝑦|) ≤ 𝑥 + 𝑦 ≤ |𝑥| + |𝑦|

che è equivalente alla proprietà di convessità:

|𝑥 + 𝑦| ≤ |𝑥| + |𝑦| = |𝑥| + |𝑦|.


Ponendo 𝑦 = 𝑧 − 𝑥 nella disuguaglianza precedente, si ottiene

|𝑧| ≤ |𝑥| + |𝑧 − 𝑥|

da cui
|𝑧| − |𝑥| ≤ |𝑧 − 𝑥|.
Scambiando 𝑧 con 𝑥 si ottiene la disuguaglianza opposta e mettendole assieme
si ottiene la disuguaglianza triangolare inversa:

|𝑧| − |𝑥| ≤ |𝑧 − 𝑥|.


La disuguaglianza triangolare segue dalla convessità:

|𝑥 − 𝑦| = |𝑥 − 𝑧 + 𝑧 − 𝑦| ≤ |𝑥 − 𝑧| + |𝑧 − 𝑦|.

Osserviamo che dal punto di vista geometrico |𝑥 − 𝑦| rappresenta la distanza


tra i punti 𝑥 e 𝑦 sulla retta reale.

1.16 numeri decimali

Le frazioni il cui denominatore è una potenza di 10 si chiamano frazioni


decimali:
𝑝
𝑥 = 𝑑, 𝑝 ∈ ℤ, 𝑑 ∈ ℕ .
10
in Italia si preferisce utilizzare la virgola,
Tali frazioni si possono rappresentare scrivendo il numero intero 𝑝 e segnando
ma ci rassegnamo alla notazione anglo- un puntodi separazione prima della 𝑑 -esima cifra a partire da destra. Ad
sassone che ormai è ubiqua in tutta la esempio scriveremo:
strumentazione elettronica. 14142
1.4142 = .
104
𝑝
In generale una frazione 𝑞 ∈ ℚ può essere scritta in forma decimale solamente
se, quando ridotta ai minimi termini, risulta che 𝑞 non ha fattori primi diversi
da 2 e 5 (in quanto le potenze di dieci hanno solo questi fattori). In ogni caso le
1.17 isomorfismi di gruppi ordinati 41

frazioni decimali sono dense in ℝ in quanto dato 𝑥 ∈ ℝ per ogni 𝜀 > 0 esiste
𝑑 ∈ ℕ tale che 10−𝑑 ≤ 𝜀 e quindi posto 𝑝 = b10𝑑 · 𝑥 + 12 c si avrà
𝑝
1

𝑑 − 𝑥 ≤ < 𝜀.

10 2 · 10𝑑
In tal caso scriveremo ≈
𝑝
𝑥≈ .
10𝑑
Ad esempio scriveremo
2 6667
≈ 0.6667 =
3 104
per intendere Si osservi che in base alla definizio-
2 6667 ne data sarebbe anche corretto scrivere
− < 1 . (1.10) 3 ≈ 0.6666 che però sarebbe una appros-
2
3 104 104 simazione peggiore. Questa ambiguità è
Nel calcolo scientifico ogni uguaglianza numerica è intesa nel senso precedente, necessaria se vogliamo evitare i casi limi-
te in cui bisogna conoscere molte più ci-
se non specificato diversamente. fre decimali di quelle richieste per capire
qual è la migliore approssimazione.
Le frazioni non decimali si possono scrivere con uno sviluppo decimale periodico.
Non useremo mai questa notazione che ricordiamo solamente con un esempio.
Il numero
𝑥 = 12.34567 = 12.34567567
è la frazione che risolve l’equazione

100 𝑥 − 1234 0.567


 
= 100 𝑥 − 1234.567 = 0.000567
1000 1000

ovvero
1234567 − 1234
1234567 − 1234 = 99900 · 𝑥, 𝑥= .
99900

Esercizio 1.51. Dimostrare che vale (1.10).

1.17 isomorfismi di gruppi ordinati


funzioni monotòne

Definizione 1.52 (funzioni monotòne). Una funzione 𝑓 : 𝐴 → 𝐵 con 𝐴, 𝐵 insiemi


ordinati, si dice essere
crescente
1. crescente se 𝑥 ≤ 𝑦 =⇒ 𝑓 (𝑥) ≤ 𝑓 (𝑦);
decrescente
2. decrescente se 𝑥 ≤ 𝑦 =⇒ 𝑓 (𝑥) ≥ 𝑓 (𝑦);
3. monotòna se crescente o decrescente; monotòna
4. costante se crescente e decrescente; costante
5. strettamente crescente se 𝑥 < 𝑦 =⇒ 𝑓 (𝑥) < 𝑓 (𝑦);
strettamente crescente
6. strettamente decrescente se 𝑥 < 𝑦 =⇒ 𝑓 (𝑥) > 𝑓 (𝑦);
7. strettamente monotòna se strettamente crescente o strettamente decrescente. strettamente decrescente

strettamente monotòna
Si osservi che se 𝑓 : 𝐴 → ℝ è costante allora esiste 𝑐 tale che 𝑓 (𝑥) = 𝑐 per
ogni 𝑥 ∈ 𝐴. Si osservi anche che ogni funzione strettamente monotona è
anche iniettiva. Si osservi infine (fare un esempio!) che esistono funzioni che
42 1 fondamenti

non rientrano in nessuna delle categorie sopra elencate (cioè che non sono né
crescenti né decrescenti).
Si faccia attenzione alla terminologia. In alcuni testi (in particolare nei testi
anglosassoni) si utilizza il termine crescente con il significato di strettamente
crescente e si usa la dizione non decrescente o debolmente crescente per indicare il
concetto che noi abbiamo definito con crescente. In effetti con le nostre definizioni
una funzione crescente può essere costante e quindi non crescere affatto!

funzione additiva
Definizione 1.53 (funzione additiva). Sia 𝐺 un gruppo rispetto ad una operazione
𝐺 𝐻
∗ e sia 𝐻 un gruppo rispetto alla operazione ∗ . Una funzione 𝑓 : 𝐺 → 𝐻 si dice essere
un omomorfismo se per ogni 𝑥, 𝑦 ∈ 𝐺 si ha
omomorfismo
𝐺 𝐻
𝑓 (𝑥 ∗ 𝑦) = 𝑓 (𝑥) ∗ 𝑓 (𝑦).

𝐺 𝐻
Nel caso in cui le operazioni ∗ e ∗ siano denotate entrambe con il simbolo + diremo
equivalentemente che 𝑓 è additiva in quanto soddisfa la proprietà:

𝑓 (𝑥 + 𝑦) = 𝑓 (𝑥) + 𝑓 (𝑦).

Ricordiamo che abbiamo definito ℝ come un gruppo additivo, totalmente


ordinato, denso e continuo. Dato 𝑥 ∈ ℝ e 𝑛 ∈ ℕ abbiamo definito 𝑛𝑥 (somma
ripetuta) e se 𝑛 ≠ 0 abbiamo definito 𝑛𝑥 in modo che 𝑛 𝑛𝑥 = 𝑥 . Lo stesso si può
fare quindi su qualunque altro gruppo additivo, totalmente ordinato, denso e
continuo, visto che non abbiamo assunto nessuna altra ipotesi su ℝ. Il teorema
seguente ci dice che queste proprietà identificano univocamente l’insieme ℝ in
quanto dati due gruppi 𝑅 e 𝑆 con queste proprietà c’è tra di essi un isomorfismo
cioè una bigezione che mantiene sia l’operazione di gruppo, sia l’ordinamento.

Teorema 1.54 (isomorfismi di gruppi ordinati). Siano 𝑅 e 𝑆 due gruppi totalmente


ordinati, densi e continui. Scelto 𝑢 ∈ 𝑅 , 𝑢 > 0 e 𝑚 ∈ 𝑆 esiste una unica funzione
𝑓 : 𝑅 → 𝑆 che sia un omomorfismo monotono tale che 𝑓 (𝑢) = 𝑚 .
Inoltre se 𝑚 > 0 la funzione 𝑓 è strettamente crescente, se 𝑚 = 0 la funzione è costante
nulla, se 𝑚 < 0 la funzione è strettamente decrescente. Se 𝑚 ≠ 0 la funzione è anche
suriettiva ed è quindi bigettiva.
Infine 𝑓 è anche l’unica funzione monotona tale che se 𝑝 ∈ ℤ, 𝑞 ∈ ℕ \ {0} si ha

𝑝𝑢 𝑝𝑚
 
𝑓 = .
𝑞 𝑞

Dimostrazione. Supponiamo che l’operazione di entrambi i gruppi 𝑅 e 𝑆 sia


denotata con il simbolo +. Dunque la condizione di omomorfismo non è altro
che l’additività 𝑓 (𝑥 + 𝑦) = 𝑓 (𝑥) + 𝑓 (𝑦). Inoltre 𝑅 e 𝑆 hanno tutte le proprietà
che abbiamo già dimostrato per l’insieme ℝ dei numeri reali. In particolare
abbiamo definita la moltiplicazione 𝑛 · 𝑥 con 𝑛 ∈ ℤ e la divisione 𝑥/𝑛 con 𝑛 ∈ ℕ ,
𝑛 ≠ 0.
Sia 𝑓 : 𝑅 → 𝑆 un omomorfismo monotono tale che 𝑓 (𝑢) = 𝑚 . Allora neces-
sariamente 𝑓 (0) = 𝑓 (0 + 0) = 𝑓 (0) + 𝑓 (0) da cui 𝑓 (0) = 0. Inoltre se 𝑛 ∈ ℕ e
1.17 isomorfismi di gruppi ordinati 43

𝑥 ∈ 𝑅 si avrà 𝑓 (𝑛𝑥) = 𝑛 𝑓 (𝑥) (lo si dimostra per induzione: se 𝑓 (𝑛𝑥) = 𝑛 𝑓 (𝑥)


sommando 𝑓 (𝑥) ad ambo i membri ed utilizzando l’additività si ottiene
𝑓 ((𝑛 + 1)𝑥) = (𝑛 + 1) 𝑓 (𝑥)). Ma allora 𝑛 𝑓 (𝑥/𝑛) = 𝑓 (𝑥) da cui 𝑓 (𝑥/𝑛) = 𝑓 (𝑥)/𝑛 .
Osserviamo che 𝑓 (−𝑥) = − 𝑓 (𝑥) in quanto 𝑓 (𝑥) + 𝑓 (−𝑥) = 𝑓 (𝑥 − 𝑥) = 0 e dunque
la condizione 𝑓 (𝑛𝑥) = 𝑛 𝑓 (𝑥) vale per ogni 𝑛 ∈ ℤ. E dunque per ogni 𝑝 ∈ ℤ e
ogni 𝑞 ∈ ℕ \ {0} si deve avere 𝑓 (𝑝 · 𝑥/𝑞) = 𝑝 · 𝑓 (𝑥)/𝑞 . In particolare per 𝑥 = 𝑢
dobbiamo avere 𝑓 (𝑥) = 𝑚 e quindi

𝑢 𝑚
 
𝑓 𝑝· =𝑝· . (1.11)
𝑞 𝑞

Per fissare le idee supponiamo ora che sia 𝑚 > 0, in tal caso 𝑓 dovrà essere
monotona crescente in quanto 𝑢 > 0 e 𝑓 (𝑢) = 𝑚 > 0. Per ogni 𝑥 ∈ 𝑅
consideriamo l’insieme

𝑚 𝑢
 
𝐴 𝑥 = 𝑝 · : 𝑝 ≤ 𝑥, 𝑝 ∈ ℤ , 𝑞 ∈ ℕ \ {0} .
𝑞 𝑞

Dato 𝑥 ∈ 𝑅 e dato 𝑞 ∈ ℕ \ {0} scegliamo 𝑝 ∈ ℤ tale che 𝑝𝑢/𝑞 ≤ 𝑥 ≤ (𝑝 + 1)𝑢/𝑞 .


Per la monotonia di 𝑓 e grazie alla (1.11) si dovrà avere 𝑝𝑚/𝑞 ≤ 𝑓 (𝑥) ≤ (𝑝+1)𝑚/𝑞 .
Ma vale anche
𝑚 𝑚
𝑝 ≤ sup 𝐴 𝑥 ≤ (𝑝 + 1) (1.12)
𝑞 𝑞
in quanto da un lato 𝑝𝑚/𝑞 ∈ 𝐴 𝑥 e dall’altro (𝑝+1)𝑚/𝑞 è un maggiorante di 𝐴 𝑥 (in
quanto se 𝑝 0 𝑢/𝑞 0 ≤ 𝑥 allora 𝑝 0 𝑢/𝑞 0 ≤ (𝑝 + 1)𝑢/𝑞 e quindi 𝑝 0 𝑚/𝑞 ≤ (𝑝 + 1)𝑚/𝑞 ).
Dunque si ha
𝑚
| 𝑓 (𝑥) − sup 𝐴 𝑥 | ≤ .
𝑞
Posto 𝜀 = | 𝑓 (𝑥) − sup 𝐴 𝑥 | se fosse 𝜀 > 0, per la proprietà archimedea valida
in 𝑆 , potremmo trovare 𝑞 tale che 𝑞𝜀 > 𝑚 e avremmo quindi un assurdo.
Concludiamo quindi che deve necessariamente essere 𝑓 (𝑥) = sup 𝐴 𝑥 e dunque
𝑓 , se esiste, è unica.

Rimane da verificare che la funzione 𝑓 (𝑥) = sup 𝐴 𝑥 è effettivamente additiva


e monotona. Innanzitutto è facile verificare che se 𝑥 = 𝑝𝑢/𝑞 con 𝑝 ∈ ℤ e
𝑞 ∈ ℕ \ {0} si ha 𝑓 (𝑥) = 𝑝𝑚/𝑞 . Infatti ovviamente 𝑝𝑚/𝑞 ∈ 𝐴 𝑥 ed è facile
verificare che 𝑝𝑚/𝑞 è anche un maggiorante di 𝐴 𝑥 dunque in questo caso
𝑝𝑚/𝑞 = max 𝐴 𝑥 = 𝑓 (𝑥). Mostriamo ora che 𝑓 è additiva e strettamente
crescente. Dati 𝑥, 𝑦 ∈ 𝑅 e dato 𝑞 ∈ ℕ \ {0} prendiamo 𝑝, 𝑟 ∈ ℤ tali che
𝑝𝑢/𝑞 ≤ 𝑥 ≤ (𝑝 + 1)𝑢/𝑞 e 𝑟𝑢/𝑞 ≤ 𝑦 ≤ (𝑟 + 1)𝑢/𝑞 . Sommando le disuguaglianze
si avrà inoltre (𝑝 + 𝑟)𝑢/𝑞 ≤ 𝑥 + 𝑦 ≤ (𝑝 + 𝑟 + 2)𝑢/𝑞 . La proprietà (1.12) ci dice
che valgono le seguenti disuguaglianze
𝑚 𝑚 𝑚 𝑚
𝑝· ≤ 𝑓 (𝑥) ≤ (𝑝 + 1) · , 𝑟· ≤ 𝑓 (𝑦) ≤ (𝑟 + 1) ·
𝑞 𝑞 𝑞 𝑞
𝑚 𝑚
(𝑝 + 𝑟) · ≤ 𝑓 (𝑥 + 𝑦) ≤ (𝑝 + 𝑟 + 2) ·
𝑞 𝑞

da cui
𝑚
| 𝑓 (𝑥) + 𝑓 (𝑦) − 𝑓 (𝑥 + 𝑦)| ≤ 2 .
𝑞
44 1 fondamenti

Siccome 𝑞 è arbitrario deduciamo (sempre per la proprietà archimedea di 𝑆 )


che la quantità a primo membro è nulla e dunque 𝑓 è effettivamente additiva.
Similmente se 𝑥 < 𝑦 possiamo scegliere 𝑞 in modo che sia 2/𝑞 < 𝑦 − 𝑥 e,
scegliendo 𝑝, 𝑟 come prima, si ottiene
𝑚 𝑚
𝑓 (𝑥) ≤ (𝑝 + 1) < 𝑟 ≤ 𝑓 (𝑦)
𝑞 𝑞

da cui 𝑓 è strettamente crescente. La dimostrazione, quando 𝑚 > 0, è conclusa.

Se 𝑚 < 0 basta cambiare segno ad 𝑚 e alla funzione 𝑓 .

Se 𝑚 = 0 è facile mostrare che 𝑓 (𝑝𝑢) = 0 per ogni 𝑝 ∈ ℤ e quindi se 𝑝 ≤ 𝑥 ≤ 𝑝 + 1


si trova che 𝑓 (𝑥), per monotonia, non può che essere 0. Dunque la funzione
identicamente nulla è l’unica possibile soluzione.

Infine dobbiamo mostrare che se 𝑚 ≠ 0 la funzione 𝑓 : 𝑅 → 𝑆 è bigettiva.


Sappiamo già che 𝑓 è iniettiva in quanto strettamente monotona se 𝑚 ≠ 0.
Applicando quanto dimostrato finora con 𝑅 ed 𝑆 scambiati sappiamo che esiste
𝑔 : 𝑆 → 𝑅 anch’essa iniettiva. Ora se consideriamo 𝑇 = 𝑓 (𝑅) ⊆ 𝑆 osserviamo
che 𝑓 : 𝑅 → 𝑇 è bigettiva e preserva la struttura di gruppo e l’ordinamento.
Anche la sua inversa 𝑓 −1 : 𝑇 → 𝑅 ha le stesse proprietà così come ce le ha la
restrizione di 𝑔 a 𝑇 . Ma per l’unicità che abbiamo appena dimostrato l’inversa
di 𝑓 e la restrizione di 𝑔 dovranno coincidere. Significa allora che 𝑔(𝑇) = 𝑅 ed
essendo 𝑔 iniettiva dobbiamo quindi concludere che 𝑇 = 𝑆 .

Come conseguenza immediata otteniamo il seguente corollario il quale garanti-


sce che gli assiomi con cui abbiamo definito ℝ lo identificano univocamente a
meno di isomorfismi.

Corollario 1.55 (unicità di ℝ). Sia 𝑆 un gruppo additivo totalmente ordinato, denso
e continuo (come ℝ) con unità 𝑢 > 0. Allora 𝑆 è isomorfo ad ℝ nel senso che esiste
una funzione (unica) 𝑓 : ℝ → 𝑆 bigettiva, additiva, crescente con 𝑓 (1) = 𝑢 .

Possiamo inoltre finalmente dimostrare che l’addizione è commutativa.

Teorema 1.56. Se 𝑥, 𝑦 ∈ ℝ si ha 𝑥 + 𝑦 = 𝑦 + 𝑥 .

Dimostrazione. Se consideriamo il gruppo additivo ℝ ma definiamo l’addizione


con gli addendi scambiati, il teorema 1.54 ci garantisce l’esistenza di una
funzione 𝑓 : ℝ → ℝ crescente, con 𝑓 (1) = 1, tale che

𝑓 (𝑥 + 𝑦) = 𝑓 (𝑦) + 𝑓 (𝑥). (1.13)

Inoltre 𝑓 è l’unica funzione crescente tale che per ogni 𝑥 ∈ ℚ soddisfa 𝑓 (𝑥) = 𝑥 .
Visto che la funzione identica ha queste proprietà 𝑓 dovrà in effetti essere la
funzione identica 𝑓 (𝑥) = 𝑥 per ogni 𝑥 ∈ ℝ e l’equazione (1.13) si riduce a
𝑥 + 𝑦 = 𝑦 + 𝑥.

Possiamo finalmente definire su ℝ l’operazione di moltiplicazione.


moltiplicazione
1.17 isomorfismi di gruppi ordinati 45

Teorema 1.57 (moltiplicazione). Su ℝ esiste una unica unica operazione · che


chiameremo moltiplicazione che soddisfa le seguenti proprietà:

1. distributiva: 𝑥 · (𝑦 + 𝑧) = 𝑥 · 𝑦 + 𝑥 · 𝑧 ;
2. elemento neutro: 𝑥 · 1 = 𝑥 ;
3. monotonia: fissato 𝑥 la funzione 𝑥 · 𝑦 è monotona in 𝑦 .

Inoltre tale operazione, che chiamiamo moltiplicazione, ha anche le seguenti proprietà: moltiplicazione

1. commutativa: 𝑥 · 𝑦 = 𝑦 · 𝑥 ;
2. stretta monotonia: se 𝑥 > 0 e 𝑦 > 𝑧 allora 𝑥 · 𝑦 > 𝑥 · 𝑧 ;
3. associativa: (𝑥 · 𝑦) · 𝑧 = 𝑥 · (𝑦 · 𝑧);
4. esistenza del reciproco: se 𝑥 ≠ 0 esiste 𝑦 tale che 𝑥 𝑦 = 1;
5. elemento assorbente: 0 · 𝑥 = 0;
6. annullamento del prodotto: se 𝑥 · 𝑦 = 0 allora 𝑥 = 0 oppure 𝑦 = 0;
7. regola del segno: (−𝑥) · 𝑦 = −(𝑥 · 𝑦).

Dimostrazione. Il teorema 1.54 garantisce che per ogni 𝑥 ∈ ℝ esiste una unica
funzione 𝑚 𝑥 : ℝ → ℝ che sia additiva, monotona e tale che 𝑚 𝑥 (1) = 𝑥 . Se
definiamo
𝑥 · 𝑦 = 𝑚 𝑥 (𝑦)
otteniamo che valgono la proprietà distributiva, l’elemento neutro e la monoto-
nia. E questo è l’unico modo per garantire queste proprietà.

Dobbiamo ora verificare che tale definizione soddisfa anche le altre proprietà
enunciate. Per fare ciò ci servirà innanzitutto dimostrare che fissati 𝑎, 𝑏 ∈ ℝ si
ha
𝑚 𝑎 (𝑥) + 𝑚𝑏 (𝑥) = 𝑚 𝑎+𝑏 (𝑥) (1.14)
Consideriamo la funzione 𝑓 (𝑥) = 𝑚 𝑎 (𝑥) + 𝑚𝑏 (𝑥). E’ immediato verificare che 𝑓
è una funzione additiva in quanto 𝑚 𝑎 e 𝑚𝑏 lo sono e l’addizione è commutativa.
Se 𝑎, 𝑏 ≥ 0 è anche immediato verificare che 𝑓 è crescente in quanto 𝑚 𝑎 e 𝑚𝑏
lo sono. Siccome 𝑓 (1) = 𝑚 𝑎 (1) + 𝑚𝑏 (1) = 𝑎 + 𝑏 per il teorema 1.54 la funzione
𝑓 deve coincidere con 𝑚 𝑎+𝑏 e quindi (1.14) è verificata. Osserviamo ora che
−𝑚 𝑦 (𝑥) = 𝑚−𝑦 (𝑥) sempre grazie all’unicità nel teorema 1.54 visto che −𝑚 𝑦 è
additiva, monotona e −𝑚 𝑦 (1) = −𝑦 . Dunque se 𝑎 < 0 e 𝑏 < 0 ci possiamo
ricondurre al caso precedente cambiando tutto di segno:

𝑚 𝑎 + 𝑚𝑏 = −(𝑚−𝑎 + 𝑚−𝑏 ) = −𝑚−𝑎−𝑏 = 𝑚 𝑎+𝑏 .

Se 𝑎 ≥ 0, 𝑏 ≤ 0 e 𝑎 + 𝑏 ≥ 0 sfruttiamo (𝑎 + 𝑏) + (−𝑏) = 𝑎 per ottenere


𝑚 𝑎+𝑏 +𝑚−𝑏 = 𝑚 𝑎 che, riordinando i termini, è l’uguaglianza desiderata. Se 𝑎 ≥ 0,
𝑏 ≤ 0 e 𝑎 + 𝑏 ≤ 0 sfruttiamo −(𝑎 + 𝑏) + 𝑎 = −𝑏 per ottenere 𝑚−(𝑎+𝑏) + 𝑚 𝑎 = 𝑚−𝑏
che di nuovo ci porta a (1.14). Se 𝑏 < 0 scambiamo 𝑎 e 𝑏 per ricondurci ai casi
precedenti. Abbiamo così dimostrato (1.14).

Possiamo ora dimostrare la proprietà commutativa. Fissato 𝑦 ∈ ℝ consideriamo


la funzione 𝑓 (𝑥) = 𝑚 𝑥 (𝑦). Abbiamo appena dimostrato che 𝑓 è additiva.
Osserviamo che se 𝑦 ≥ 0 e 𝑥 ≥ 0 si ha 𝑓 (𝑥) ≥ 0 in quanto 𝑚 𝑥 è crescente e
quindi 𝑓 (𝑥) = 𝑚 𝑥 (𝑦) ≥ 𝑚 𝑥 (0) = 0. Dunque se 𝑥 1 ≤ 𝑥 2 si ha 𝑥 2 − 𝑥 1 ≥ 0 e
𝑓 (𝑥2 ) − 𝑓 (𝑥1 ) = 𝑓 (𝑥2 − 𝑥1 ) ≥ 0: significa che 𝑓 (𝑥) è crescente. Se 𝑦 < 0 si otterrà
invece che 𝑓 (𝑥) è decrescente, ma in ogni caso è monotona. Inoltre 𝑚1 (𝑦) = 𝑦
46 1 fondamenti

in quanto l’identità è additiva e monotona e quindi per unicità coincide con


𝑚1 in quanto 𝑚1 (1) = 1 come l’identità. Dunque 𝑓 (1) = 𝑚1 (𝑦) = 𝑦 . Dunque
scopriamo che 𝑓 (𝑥) = 𝑚 𝑥 (𝑦) = 𝑚 𝑦 (𝑥) ovvero 𝑥 · 𝑦 = 𝑦 · 𝑥 .

Per dimostrare la proprietà associativa fissiamo 𝑦, 𝑧 ∈ ℝ e consideriamo la


funzione 𝑓 (𝑥) = 𝑚 𝑧 (𝑚 𝑦 (𝑥)). Questa funzione è additiva in quanto 𝑚 𝑧 (𝑚 𝑦 (𝑎 +
𝑏)) = 𝑚 𝑧 (𝑚 𝑦 (𝑎) + 𝑚 𝑦 (𝑏)) = 𝑚 𝑧 (𝑚 𝑦 (𝑎)) + 𝑚 𝑧 (𝑚 𝑦 (𝑏)). Inoltre è monotona in
quanto composizione di funzioni monotone. Infine 𝑓 (1) = 𝑚 𝑧 (𝑚 𝑦 (1)) = 𝑚 𝑧 (𝑦).
Dunque per unicità si deve avere 𝑚 𝑧 (𝑚 𝑦 (𝑥)) = 𝑚𝑚𝑧 (𝑦) (𝑥). Esplicitando questa
uguaglianza si trova proprio: 𝑧 · (𝑦 · 𝑥) = (𝑧 · 𝑦) · 𝑥 .

Per dimostrare l’esistenza del reciproco basta ricordare che se 𝑦 ≠ 0 la funzione


𝑚 𝑦 è bigettiva e quindi esiste un unico 𝑥 tale che 𝑚 𝑦 (𝑥) = 𝑦 · 𝑥 = 1.
Lo zero è elemento assorbente in quanto 0 · 𝑥 = 𝑥 · 0 = 𝑚 𝑥 (0) = 0 qualunque
sia 𝑥 . D’altra parte se 𝑚 𝑥 (𝑦) = 0 se non è 𝑥 = 0 la funzione 𝑚 𝑥 è iniettiva e
quindi 𝑦 = 0 è l’unico punto in cui 𝑚 𝑥 (𝑦) = 0. Dunque vale anche la proprietà
di annullamento del prodotto.

La regola del segno deriva dall’additività in quanto 0 = 𝑥 · 0 = 𝑥 · (𝑦 − 𝑦) =


𝑥 · 𝑦 + 𝑥 · (−𝑦) da cui 𝑥 · (−𝑦) = −(𝑥 · 𝑦).

L’operazione di moltiplicazione che abbiamo appena definito su ℝ rende ℝ un


campo ordinato continuo in base alla seguente.

Definizione 1.58 (campo). Diremo che 𝕂 è un campo se 𝕂 è un anello commutativo


con unità e se ogni 𝑥 ∈ 𝕂 , 𝑥 ≠ 0 ha un inverso moltiplicativo cioè esiste 𝑦 ∈ 𝕂 tale che
reciproco 𝑥 · 𝑦 = 1. L’inverso moltiplicativo si chiama anche reciproco. Se 𝑦 ≠ 0 denotiamo con
𝑥/𝑦 o 𝑥𝑦 il prodotto di 𝑥 con il reciproco di 𝑦 . Questa operazione si chiama divisione.
divisione
Se 𝐾 è anche totalmente ordinato da una relazione ≤ e se valgono anche le seguenti
proprietà:

𝑎 ≤ 𝑏 =⇒ 𝑎 + 𝑐 ≤ 𝑏 + 𝑐, 𝑎, 𝑏 ≥ 0 =⇒ 𝑎 · 𝑏 ≥ 0

campo ordinato diremo che 𝐾 è un campo ordinato.

campo ordinato continuo Infine se l’ordinamento è continuo diremo che 𝐾 è un campo ordinato continuo.

Si può osservare che in un campo ordinato l’ordinamento è necessariamente


denso in quanto dati 𝑎, 𝑏 elementi del campo possiamo definire 𝑎+𝑏2 che è
certamente strettamente compreso tra 𝑎 e 𝑏 .

1.18 funzione esponenziale e potenza

Osserviamo che l’insieme ℝ+ = {𝑥 ∈ ℝ : 𝑥 > 0} dei reali positivi rispetto alla


operazione di moltiplicazione risulta essere un gruppo moltiplicativo totalmente
ordinato, denso e continuo. Abbiamo già dimostrato tutte queste proprietà della
moltiplicazione. La densità e continuità non vanno verificate in quanto sono
proprietà dell’ordinamento e non dell’operazione, e l’ordinamento considerato
su ℝ+ è quello ereditato da ℝ.
1.18 funzione esponenziale e potenza 47

Dunque fissato 𝑎 > 0 per il teorema 1.54 esiste una unica funzione exp 𝑎 : ℝ →
ℝ+ (chiamata funzione esponenziale di base 𝑎 ) che sia un omomorfismo monotono funzione esponenziale
del gruppo additivo ℝ con il gruppo moltiplicativo ℝ+ e tale che exp 𝑎 (1) = 𝑎 .
La proprietà di omomorfismo in questo caso si esprime nella forma seguente:

exp 𝑎 (𝑥 + 𝑦) = exp 𝑎 (𝑥) · exp 𝑎 (𝑦). (1.15)


Il teorema 1.54 ci dice anche che se 𝑛 ∈ ℕ il valore exp 𝑎 (𝑛) non è altro che il
prodotto di 𝑎 con sé stesso 𝑛 volte: exp 𝑎 (𝑛) = 𝑎 𝑛 . Ha dunque senso definire
𝑎 𝑥 = exp𝑎 (𝑥) per ogni 𝑥 ∈ ℝ. Avremo dunque la proprietà fondamentale della
funzione esponenziale:
𝑎 𝑥+𝑦 = 𝑎 𝑥 · 𝑎 𝑦 .

Per ogni 𝑎 > 0 e 𝑏 ∈ ℝ è dunque definita l’espressione 𝑎 𝑏 (si legga: 𝑎 elevato alla
potenza 𝑏 ) che si chiama potenza di base 𝑎 ed esponente 𝑏 . potenza

Quando l’esponente è negativo si ha

1
𝑎 −𝑥 =
𝑎𝑥

in quanto 𝑎 𝑥 · 𝑎 −𝑥 = 𝑎 𝑥−𝑥 = 𝑎 0 = 1. In particolare 𝑎 −1 = 1


𝑎 è un modo per
denotare l’inverso moltiplicativo.

Se 𝑎 > 1 la funzione 𝑎 𝑥 risulta essere strettamente crescente, se 𝑎 < 1 la funzione


è strettamente decrescente e se 𝑎 = 1 la funzione 1𝑥 = 1 è costante.

Se 𝑎 > 0 e 𝑏 > 0 vogliamo dimostrare che vale la proprietà:

(𝑎 · 𝑏)𝑥 = 𝑎 𝑥 · 𝑏 𝑥 .

Sarà sufficiente dimostrarlo per 𝑎 > 1 e 𝑏 > 1 in quanto gli altri casi si ottengono
di conseguenza passando al reciproco. Osservare che la funzione 𝑓 (𝑥) = 𝑎 𝑥 · 𝑏 𝑥
è un omomorfismo

𝑓 (𝑥 + 𝑦) = 𝑎 𝑥+𝑦 𝑏 𝑥+𝑦 = 𝑎 𝑥 𝑎 𝑦 𝑏 𝑥 𝑏 𝑦 = 𝑓 (𝑥) · 𝑓 (𝑦)

è crescente (in quanto prodotto di funzioni positive e crescenti) e vale 𝑓 (1) = 𝑎 · 𝑏 .


Dunque per l’unicità data dal teorema 1.54 possiamo affermare che 𝑓 (𝑥) =
(𝑎 · 𝑏)𝑥 .
Infine possiamo dimostrare la proprietà delle potenze ripetute:
 𝑐
𝑎𝑏 = 𝑎 𝑏·𝑐 .

Fissati 𝑎 > 0 e 𝑏 ∈ ℝ consideriamo la funzione 𝑓 (𝑥) = 𝑎 𝑏·𝑥 . osserviamo che


𝑓 (𝑥 + 𝑦) = 𝑎 𝑏𝑥+𝑏 𝑦 = 𝑎 𝑏𝑥 · 𝑎 𝑏 𝑦 dunque la funzione 𝑓 soddisfa la proprietà di
additività. Inoltre è una funzione monotona perché composizione di funzioni
monotone. Infine 𝑓 (1) = 𝑎 𝑏 e dunque, per l’unicità data dal teorema 1.54 dovrà
𝑥
essere 𝑓 (𝑥) = 𝑎 𝑏 , come volevamo dimostrare.

Osserviamo che la funzione potenza 𝑥 𝛼 (dove si tiene fisso l’esponente e si fa


variare la base) è definita tramite la funzione esponenziale per ogni 𝑥 > 0 e per
ogni 𝛼 ∈ ℝ. Se 𝛼 > 0 è naturale definire 0𝛼 = 0 e quindi se 𝛼 > 0 possiamo
48 1 fondamenti

𝑦 = 𝑎𝑥
1 𝑥
𝑦=

𝑎 𝑎

1 𝑦 = log𝑎 𝑥

1 𝑎

𝑦 = log 1 𝑥
𝑎
Figura 1.4: Il grafico della funzione espo-
nenziale e logaritmo in base 𝑎 > 1 e
𝑎 < 1 ( 𝑎 = 2 in figura).
1


𝑦= 𝑥
𝑦 = 𝑥2

1
𝑦= 1
𝑥2

𝑦 = 𝑥1 1

𝑦 = 3𝑥

Figura 1.5: Grafici tipici di potenze e 𝑦 = 𝑥3


radici.

considerare definito 𝑥 𝛼 per ogni 𝑥 ≥ 0. Verifichiamo che la funzione 𝑓 (𝑥) = 𝑥 𝛼


è strettamente crescente se 𝛼 > 0. Infatti se 𝑥 2 > 𝑥 1 > 0 e se 𝛼 > 0 si ha
𝛼 0
𝑥2 𝑥2
 
𝑥2𝛼 = · 𝑥1 𝛼
> · 𝑥1 𝛼 = 𝑥1𝛼 .
𝑥1 𝑥1

1.19 radice 𝑛 -esima

Dalle proprietà delle potenze ripetute deduciamo che se 𝑥 > 0 e 𝑛 ∈ ℕ , 𝑛 ≥ 1,


si ha (𝑥 𝑛 ) 𝑛 = 𝑥 . Significa che 𝑥 𝑛 è la funzione inversa di 𝑥 𝑛 per 𝑥 > 0. Ma la
1 1

funzione 𝑥 𝑛 è definita anche per 𝑥 ≤ 0 e si distinguono due casi qualitativamente


diversi in base alla parità di 𝑛 .

Se 𝑛 è pari la funzione 𝑥 ↦→ 𝑥 𝑛 non è invertibile in quanto (−𝑥)𝑛 = 𝑥 𝑛 . Se però


restringiamo la funzione 𝑥 𝑛 ai numeri reali non negativi la funzione risulta

invertibile e la funzione inversa che si denota con 𝑥 ↦→ 𝑛 𝑥 può essere definita
mediante le potenze come segue:
( 1

𝑛 𝑥𝑛 se 𝑥 > 0
𝑥= se 𝑛 è pari.
0 se 𝑥 = 0

Se 𝑛 è dispari la funzione 𝑥 ↦→ 𝑥 𝑛 è invertibile su tutto ℝ. Infatti (−𝑥)𝑛 = −𝑥 𝑛


dunque tale funzione mantiene il segno del suo argomento. In tal caso la
1.20 logaritmo 49


funzione inversa denotata con 𝑥 ↦→ 𝑛
𝑥 è anch’essa definita su tutto ℝ e può
essere definita nel modo seguente
1

 𝑥𝑛 se 𝑥 > 0

𝑛



𝑥= 0 se 𝑥 = 0 se 𝑛 è dispari
 −(−𝑥) 𝑛1

se 𝑥 < 0

Quando l’argomento è positivo la radice 𝑛 -esima potrebbe anche essere definita


utilizzando il teorema 1.47 di divisibilità nell’ambito del gruppo moltiplicativo
ℝ+ .
radice quadrata

La radice seconda 2 𝑥 viene usualmente chiamata radice quadrata e viene denotata
√ √
con il simbolo 𝑥 . Analogamente la radice terza 3 𝑥 viene usualmente chiamata radice cubica
radice cubica.

Per come è definita la radice 𝑛 -esima si ha


(

𝑛 |𝑥| se 𝑛 è pari,
𝑥𝑛 =
𝑥 se 𝑛 è dispari.

√ √ √ 𝑛 √
p √
E’ facile verificare che le proprietà 𝑛 𝑥 · 𝑦 = 𝑛 𝑥 · 𝑛 𝑦 e 𝑚 𝑥 = 𝑛𝑚 𝑥 sono valide
in tutti i casi in cui ambo i membri sono ben definiti.

Il seguente teorema ci dice che 2 è irrazionale (non è razionale, ovvero non è
elemento di ℚ) in quanto risolve l’equazione 𝑥 2 = 2 che non può avere soluzioni
in ℚ.


Teorema 1.59 (irrazionalità di 2, Pitagora). L’equazione 𝑥 2 = 2 non ha soluzioni
𝑥 ∈ ℚ.

Dimostrazione. Supponiamo 𝑥 ∈ ℚ sia una soluzione di 𝑥 2 = 2. Allora si potrà


scrivere 𝑥 = 𝑝/𝑞 con 𝑝 ∈ ℤ e 𝑞 ∈ ℕ , 𝑞 ≠ 0. Possiamo anche supporre che la
frazione 𝑝/𝑞 sia ridotta ai minimi termini cioè che 𝑝 e 𝑞 non abbiano fattori
in comune. Moltiplicando l’equazione (𝑝/𝑞)2 = 2 per 𝑞 2 si ottiene 𝑝 2 = 2 𝑞 2 .
Risulta quindi che 𝑝 2 è pari. Ma allora anche 𝑝 è pari (perché il quadrato di
un dispari è dispari). Ma se 𝑝 è pari allora 𝑝 2 è multiplo di quattro. Ma allora
anche 2 𝑞 2 è multiplo di quattro e quindi 𝑞 2 è pari. Dunque anche 𝑞 è pari. Ma
avevamo supposto che 𝑝 e 𝑞 non avessero fattori in comune quindi questo non
può accadere.

Possiamo quindi osservare che ℚ, come ℝ, è un campo totalmente ordinato.


Evidentemente ℚ non può essere continuo, perché se lo fosse dovrebbe essere
uguale ad ℝ per il teorema di unicità degli isomorfismi
√ dei gruppi continui
ordinati e dovrebbe quindi contenere il numero 2.
logaritmo
50 1 fondamenti

1.20 logaritmo

Se 𝑎 > 0, 𝑎 ≠ 1 la funzione esponenziale exp 𝑎 : ℝ → ℝ+ è bigettiva. La funzione


inversa log 𝑎 : ℝ+ → ℝ si chiama logaritmo in base 𝑎 e si caratterizza con la
seguente proprietà:
log 𝑎 𝑥 = 𝑦 ⇐⇒ 𝑎 𝑦 = 𝑥.
La proprietà di omomorfismo diventa:

log 𝑎 (𝑥 · 𝑦) = log 𝑎 𝑥 + log 𝑎 𝑦.

Ovviamente vale log 𝑎 𝑎 = 1 e log 𝑎 1 = 0. Se 𝑎 > 1 la funzione logaritmo


è strettamente crescente, se 𝑎 < 1 è strettamente decrescente. La proprietà
dell’esponenziale ripetuto si traduce nella seguente:

log 𝑎 (𝑥 𝑦 ) = 𝑦 log 𝑎 𝑥.

E’ anche piuttosto utile ricordare la formula per il cambiamento di base:

log𝑏 𝑥
log 𝑎 𝑥 =
log 𝑎 𝑏

(valida, come tutte le formule enunciate, se l’argomento del logaritmo è positivo


e se le basi sono positive diverse da 1 e diverse tra loro). Quest’ultima formula
si dimostra moltiplicando ambo i membri per log 𝑎 𝑏 e prendendo quindi
l’esponenziale con base 𝑏 di ambo i membri.

1.21 cardinalità infinite

Abbiamo già osservato che ℕ è un insieme infinito e dunque (per il teorema 1.4)
anche ℤ, ℚ e ℝ sono infiniti. Per gli insiemi finiti se 𝐴 ⊆ 𝐵 ma 𝐴 ≠ 𝐵 risulta
#𝐴 < #𝐵 in quanto #𝐴 − #𝐵 = #(𝐵 \ 𝐴) > 0. Dobbiamo però osservare che
lo stesso non vale per gli insiemi infiniti. In effetti la funzione 𝑠 : ℕ → ℕ
definita da 𝑠(𝑥) = 𝑥 + 1 risulta essere una bigezione tra ℕ e ℕ \ {0}. Dunque
#ℕ = #(ℕ \ {0}) nonostante la differenza tra i due insiemi {0} abbia cardinalità
1. Anche l’insieme dei numeri pari o l’insieme dei quadrati perfetti (come aveva
notato già Galileo) hanno la stessa cardinalità di ℕ in quanto le funzioni 𝑛 ↦→ 2𝑛
e la funzione 𝑛 ↦→ 𝑛 2 sono iniettive.

Non è difficile trovare una funzione iniettiva da ℤ in ℕ (lo lasciamo per esercizio):
questo dimostra che anche #ℤ = #ℕ

Cantor dimostra addirittura che #ℚ = ℕ : per farlo utilizza il seguente.

Teorema 1.60 (primo metodo diagonale di Cantor). L’insieme ℕ × ℕ ha la stessa


cardinalità di ℕ . Di conseguenza

#ℕ = #ℤ = #ℚ.
1.22 punti all’infinito 51

..
𝑚 .
.. .. ..
. . .
..
3 9 - .
.. Figura 1.6: La numerazione diagonale
2 5 8 12 .
delle caselle di una scacchiera infinita.
.. Si potrebbe verificare che il numero pre-
1 2 4 7 11 .
sente nella casella di coordinate (𝑛, 𝑚) si
.. scrive come 𝑓 (𝑛, 𝑚) =
(𝑛+𝑚+1)(𝑛+𝑚)
+𝑚
0 0 1 3 6 10 . 2
ed è una funzione bigettiva 𝑓 : ℕ × ℕ →
0 1 2 3 4 ... 𝑛 ℕ.

Idea di dimostrazione. Numerare le caselle di una scacchiera infinita come in


Figura 1.6.

Visto che è piuttosto facile trovare una funzione iniettiva da ℚ in ℕ × ℤ si


deduce facilmente che #ℚ = #ℕ .

A questo punto si potrebbe pensare che tutti gli insiemi infiniti siano numerabili.
Invece preso un qualunque insieme (anche infinito) esiste un insieme con
cardinalità strettamente maggiore come dimostrato nel seguente teorema che
è un piccolo gioiello della logica. In effetti il metodo utilizzato è assimilabile
al paradosso del mentitore ed è la stessa idea ripresa da Russell nel paradosso
che ha demolito la teoria ingenua degli insiemi. L’insieme delle parti P(𝐴) è
definito a pag. 5.

Teorema 1.61 (Cantor). Se 𝐴 è un qualunque insieme allora #P(𝐴) > #𝐴.

Dimostrazione. E’ chiaro che #𝐴 ≤ #P(𝐴) in quanto la funzione 𝑓 : 𝐴 → P(𝐴)


definita da 𝑓 (𝑥) = {𝑥} è ovviamente iniettiva.

Supponiamo allora per assurdo che esista 𝑓 : 𝐴 → P(𝐴) bigettiva e consideriamo


l’insieme
𝐶 = {𝑥 ∈ 𝐴 : 𝑥 ∉ 𝑓 (𝑥)}.
Se 𝑓 fosse surgettiva dovrebbe esistere 𝑐 ∈ 𝐴 tale che 𝑓 (𝑐) = 𝐶 . Possiamo allora
chiederci se 𝑐 ∈ 𝐶 e scoprire che, per definizione di 𝐶 la proposizione 𝑐 ∈ 𝐶 è
equivalente a 𝑐 ∉ 𝑓 (𝑐) = 𝐶 . Dunque 𝑐 ∈ 𝐶 ⇐⇒ 𝑐 ∉ 𝐶 , che è assurdo.

Corollario 1.62 (non esiste l’insieme di tutti gli insiemi). Se esistesse un insieme
U (universo) tale che ∀𝑥 : 𝑥 ∈ 𝑈 , allora si avrebbe P(U) ⊆ U contraddicendo il teorema
precedente.

Per quanto riguarda l’insieme ℝ si scopre in effetti che #ℝ > #ℕ (sempre


grazie a Cantor, teorema 3.24) e si potrebbe dimostrare che effettivamente
ℝ̄
#ℝ = #P(ℕ ).
+∞, −∞
52 1 fondamenti

1.22 punti all’infinito

Definizione 1.63 (reali estesi). Denotiamo con ℝ̄ = ℝ ∪ {+∞, −∞} l’insieme dei
numeri reali a cui vengono aggiunti due ulteriori quantità che chiameremo infinite e
che denotiamo con +∞ e −∞. Diremo che 𝑥 ∈ ℝ̄ è finito se 𝑥 ∈ ℝ.

Estendiamo la relazione d’ordine imponendo che valga

−∞ ≤ 𝑥 ≤ +∞, ∀𝑥 ∈ ℝ̄.

Estendiamo anche la addizione e moltiplicazione tra reali estesi imponendo che


valga per ogni 𝑥 ∈ ℝ̄

𝑥 + (+∞) = +∞, se 𝑥 ≠ −∞
𝑥 + (−∞) = −∞, se 𝑥 ≠ +∞
𝑥 · (+∞) = +∞, 𝑥 · (−∞) = −∞, se 𝑥 > 0
𝑥 · (+∞) = −∞, 𝑥 · (−∞) = +∞, se 𝑥 < 0.

Si definiscono anche:
1 1
−(+∞) = −∞, −(−∞) = +∞, = =0
+∞ −∞
facendo però attenzione che questi formalmente non sono opposto e reciproco
in quanto su ℝ̄ non sono più garantite le regole: 𝑥 + (−𝑥) = 0 e 𝑥 · (1/𝑥) = 1.
Infatti le operazioni (+∞) + (−∞) e +∞ · 0 vengono lasciate indefinite.
Definiamo anche il valore assoluto: |+∞| = |−∞| = +∞.
Possiamo infine definire la sottrazione e la divisione tramite addizione e
moltiplicazione:
𝑥 1
𝑥 − 𝑦 = 𝑥 + (−𝑦), =𝑥· .
𝑦 𝑦

Possiamo definire gli operatori sup e inf anche sugli insiemi illimitati ponendo:

sup 𝐴 = +∞ se 𝐴 non è superiormente limitato


inf 𝐴 = −∞ se 𝐴 non è inferiormente limitato.

Osserviamo infatti che su ℝ̄ la quantità +∞ è maggiorante di qualunque insieme


e −∞ è minorante, dunque queste definizioni mantengono su ℝ̄ le proprietà
caratterizzanti: l’estremo superiore è il minimo dei maggioranti e l’estremo
inferiore è il massimo dei minoranti. Definiamo infine

sup ∅ = −∞
inf ∅ = +∞.

Queste ultime definizioni possono essere comprese da un punto di vista


strettamente logico: ogni numero reale è sia maggiorante che minorante
dell’insieme vuoto, dunque il minimo dei maggioranti non esiste in ℝ ma in ℝ̄
è −∞ e il massimo dei minoranti è +∞.
1.23 intervalli 53

1.23 intervalli
intervallo
Definizione 1.64 (intervallo). Un insieme 𝐼 ⊆ ℝ̄ si dice essere un intervallo se
contiene tutti i punti intermedi:

se 𝑥, 𝑦 ∈ 𝐼 e 𝑥 < 𝑧 < 𝑦 allora 𝑧 ∈ 𝐼 .

Teorema 1.65 (caratterizzazione intervalli di ℝ). Sia 𝐼 ⊆ ℝ un intervallo e siano


𝑎 = inf 𝐼 , 𝑏 = sup 𝐼 i suoi estremi. Allora 𝑧 ∈ 𝐼 se 𝑎 < 𝑧 < 𝑏 .

Dimostrazione. Se 𝐼 = ∅ si ha 𝑎 > 𝑏 e quindi nessuno 𝑧 verifica 𝑎 < 𝑧 < 𝑏 .


Supponiamo 𝐼 ≠ ∅ e sia 𝑎 < 𝑧 < 𝑏 . Visto che 𝑎 è il massimo dei minoranti di
𝐼 il numero 𝑧 non è un minorante dunque deve esistere 𝑥 ∈ 𝐼 tale che 𝑥 < 𝑧 .
Analogamente dovrebbe esistere 𝑦 ∈ 𝐼 con 𝑧 < 𝑦 . Ma allora, per definizione di
intervallo, anche 𝑧 ∈ 𝐼 .

Il teorema precedente ci dice che una volta identificati i due estremi di un


intervallo, tutti i punti intermedi devono stare nell’intervallo. Gli estremi,
invece, possono essere o non essere inclusi nell’intervallo. Punti esterni agli
estremi non possono invece essere elementi dell’intervallo. Possiamo quindi
caratterizzare tutti gli intervalli di ℝ introducendo le seguenti notazioni. Dati
𝑎, 𝑏 ∈ ℝ̄ con 𝑎 ≤ 𝑏 tutti i possibili intervalli con estremi 𝑎 e 𝑏 sono i seguenti:

[𝑎, 𝑏] = 𝑥 ∈ ℝ̄ : 𝑎 ≤ 𝑥 ≤ 𝑏


[𝑎, 𝑏) = 𝑥 ∈ ℝ̄ : 𝑎 ≤ 𝑥 < 𝑏

(1.16)
(𝑎, 𝑏] = 𝑥 ∈ ℝ̄ : 𝑎 < 𝑥 ≤ 𝑏


(𝑎, 𝑏) = 𝑥 ∈ ℝ̄ : 𝑎 < 𝑥 < 𝑏 .




Abbiamo utilizzato le parentesi quadre per indicare che gli estremi sono inclusi
e le parentesi tonde per indicare che gli estremi sono esclusi. Osserviamo che
in alcuni testi si usano le parentesi quadre rovesciate al posto delle parentesi
tonde.

Noi considereremo per lo più intervalli di ℝ (non di ℝ̄): in tal caso gli estremi
infiniti non potranno mai essere inclusi nell’intervallo.

1.24 andamento del grafico di una funzione

Se 𝑓 : 𝐴 ⊆ ℝ → ℝ è una funzione, un modo molto utile di rappresentarla


graficamente è quello di disegnarne il grafico, ovvero la curva del piano
cartesiano:
𝐺 𝑓 = {(𝑥, 𝑦) ∈ 𝐴 × ℝ : 𝑦 = 𝑓 (𝑥)}.
Molte proprietà della funzione potranno essere riconosciute geometricamente
guardandone il grafico.

Definizione 1.66 (simmetrie). Sia 𝑓 : 𝐴 ⊆ ℝ → ℝ una funzione. Diremo che 𝑓 è:


pari
54 1 fondamenti

1. pari se 𝐴 = −𝐴 (significa che se 𝑥 ∈ 𝐴 allora anche −𝑥 ∈ 𝐴) e

𝑓 (−𝑥) = 𝑓 (𝑥);

dispari
2. dispari se 𝐴 = −𝐴 e
𝑓 (−𝑥) = − 𝑓 (𝑥);

periodica
3. periodica di periodo 𝑇 se 𝐴 + 𝑇 = 𝐴 (significa che 𝑥 ∈ 𝐴 ⇐⇒ 𝑥 + 𝑇 ∈ 𝐴)
se per ogni 𝑥 ∈ 𝐴 si ha
𝑓 (𝑥 + 𝑇) = 𝑓 (𝑥)

Ad esempio se 𝑛 ∈ ℤ la funzione 𝑓 (𝑥) = 𝑥 𝑛 è pari se 𝑛 è pari ed è dispari se 𝑛 è


dispari. Il grafico di una funzione dispari ha una simmetria centrale, in quanto
se (𝑥, 𝑓 (𝑥)) ∈ 𝐺 𝑓 allora anche (−𝑥, − 𝑓 (𝑥)) = (−𝑥, 𝑓 (−𝑥)) ∈ 𝐺 𝑓 . Il grafico di
una funzione pari ha invece una simmetria rispetto all’asse delle ordinate 𝑥 = 0
infatti se (𝑥, 𝑓 (𝑥)) ∈ 𝐺 𝑓 allora (−𝑥, 𝑓 (𝑥)) = (−𝑥, 𝑓 (−𝑥)) ∈ 𝐺 𝑓 .

La funzione 𝑓 (𝑥) = 𝑥 − b𝑥c (la parte frazionaria di 𝑥 ) è un esempio di funzione


periodica di periodo 𝑇 = 1. Infatti è chiaro che b𝑥 + 1c = b𝑥c + 1 e quindi
𝑓 (𝑥 + 1) = 𝑓 (𝑥).

Si osservi che dispari per le funzioni non è la negazione di pari. La funzione


𝑓 (𝑥) = 𝑥 + 1 non è né pari, né dispari, né periodica (verificare).

Definizione 1.67 (zeri). Se 𝑓 : 𝐴 ⊆ ℝ → ℝ è una funzione diremo che 𝑥 ∈ 𝐴 è uno


insieme degli zeri zero di 𝑓 se 𝑓 (𝑥) = 0. L’insieme degli zeri è quindi dato da

𝑓 −1 ({0}) = {𝑥 ∈ ℝ : 𝑓 (𝑥) = 0}.

Abbiamo già accennato al fatto che uno dei problemi più comuni in matematica
è quello di invertire una funzione. In particolare dato 𝑦 ∈ ℝ ci si chiede quali
siano gli 𝑥 ∈ ℝ tali che 𝑓 (𝑥) = 𝑦 . Questo problema si riconduce a trovare gli
zeri della funzione 𝑓 (𝑥) − 𝑦 e per questo motivo siamo interessati allo studio
degli zeri.

Riprendiamo ora la definizione 1.52 (monotonia) che da ora in avanti potrà


essere applicata alle funzioni 𝑓 : 𝐴 → ℝ definite su un insieme 𝐴 ⊆ ℝ.

Dal punto di vista grafico una funzione 𝑓 è crescente se preso qualunque punto
(𝑥, 𝑓 (𝑥)) sul grafico della funzione e tracciati gli assi paralleli agli assi cartesiani,
passanti per il punto fissato, si osserva che il grafico della funzione è tutto
contenuto nel primo e terzo quadrante determinati dagli assi traslati.

E’ facile verificare che la funzione 𝑓 : [0 , +∞) → ℝ definita da 𝑓 (𝑥) = 𝑥 𝑛


è strettamente crescente se 𝑛 è un intero positivo. Se però consideriamo la
funzione definita su tutto ℝ: 𝑓 : ℝ → ℝ, 𝑓 (𝑥) = 𝑥 𝑛 allora solo se 𝑛 è dispari la
funzione rimane strettamente crescente (le funzioni pari non possono mai essere
strettamente crescenti se il loro dominio contiene almeno tre punti distinti).

Se una funzione non è monotona è piuttosto comune studiare la monotonia


della funzione ristretta a particolari intervalli: su alcuni intervalli la funzione
(ristretta) potrà essere crescente e su altri intervalli potrà essere decrescente.
1.25 funzioni lineari 55

Esercizio 1.68. Verificare che la composizione di funzioni monotone è una funzione


monotona e la composizione di funzioni strettamente monotone è strettamente monotona.
Quando è che la funzione composta risulta crescente? Quando decrescente?

Esercizio 1.69. Si dimostri che applicando una funzione strettamente crescente ai due
membri di una equazione o disequazione (stretta o larga che sia) si ottiene una equazione
o disequazione equivalente. Ovviamente è necessario che la funzione sia definita dove
viene applicata.

Lo stesso vale per le funzioni strettamente decrescenti se però si cambia il verso della
disequazione.

Definizione 1.70 (funzioni limitate, massimo/minimo). Se 𝑓 : 𝐴 → ℝ è una


funzione allora definiamo l’estremo superiore di 𝑓 come l’estremo superiore dell’immagine
di 𝑓 :
sup 𝑓 = sup 𝑓 (𝑥) = sup 𝑓 (𝐴).
𝑥∈𝐴

In maniera analoga si definiscono l’estremo inferiore inf 𝑓 , il massimo max 𝑓 e il


minimo min 𝑓 .

Dunque il massimo di una funzione è (se esiste) il valore massimo che la funzione può
assumere. I punti 𝑥 in cui la funzione assume il valore massimo 𝑓 (𝑥) vengono chiamati
punti di massimo. Analogamente i punti in cui la funzione assume il valore minimo punto di massimo/minimo
(sempre che esistano) vengono chiamati punti di minimo.

Diremo che la funzione 𝑓 è superiormente limitata se sup 𝑓 < +∞ ovvero se esiste funzione superiormente limitata
𝑀 ∈ ℝ tale che
∀𝑥 ∈ 𝐴 : 𝑓 (𝑥) ≤ 𝑀.
Diremo che la funzione 𝑓 è inferiormente limitato se inf 𝑓 > −∞ ovvero se esiste funzione inferiormente limitata
𝑀 ∈ ℝ tale che
∀𝑥 ∈ 𝐴 : 𝑓 (𝑥) ≥ 𝑀.
Diremo che la funzione 𝑓 è limitata se è sia superiormente che inferiormente limitata funzione limitata
ovvero se sup | 𝑓 | < +∞ cioè se esiste 𝑀 ∈ ℝ tale che funzione lineare
Attenzione: nell’ambito dell’algebra li-
∀𝑥 ∈ 𝐴 : | 𝑓 (𝑥)| ≤ 𝑀. neare queste funzioni verrebbero chia-
mate lineari affini, mentre le funzioni li-
neari dovrebbero sempre avere 𝑞 = 0.
Nel seguente esercizio abbiamo un esempio di funzione limitata.
Noi invece (come spesso accade nell’am-
bito dell’analisi) chiameremo lineari que-
Esercizio 1.71. Si consideri la funzione 𝑓 : ℝ → ℝ ste funzioni e chiameremo lineari omoge-
nee quelle con 𝑞 = 0. Il termine lineare
1 pervade tutta la matematica e si applica
𝑓 (𝑥) = . in particolare alle equazioni che si otten-
1 + 𝑥2 gono tramite le funzioni lineari. Purtrop-
po il nome scelto è fuorviante: la parola
Verificare che max 𝑓 = sup 𝑓 = 1, che 0 è l’unico punto di massimo, che inf 𝑓 = 0 e linea viene usata a volte come abbrevia-
che min 𝑓 non esiste. zione di linea retta, quando invece sareb-
be più giusto utilizzare l’abbreviazione
retta in quanto una linea può benissimo
essere curva. In altri contesti (come ad
1.25 funzioni lineari esempio nell’ambito degli ordinamenti)
il termine lineare rappresenta un ogget-
to unidimensionale senza ramificazioni
Le funzioni lineari 𝑓 : ℝ → ℝ sono le funzioni per le quali esistono 𝑚, 𝑞 ∈ ℝ tali ed è quindi maggiormente aderente al
significato originale della parola.
56 1 fondamenti

𝑦 = 𝑚𝑥 + 𝑞

𝑓 (𝑥2 )
Δ 𝑓 (𝑥)
𝑓 (𝑥1 )
Δ𝑥

𝑥1 𝑥2

Figura 1.7: Il grafico di una funzione


lineare.

che
𝑓 (𝑥) = 𝑚𝑥 + 𝑞.

Se prendiamo due punti (𝑥 1 , 𝑓 (𝑥 1 )) e (𝑥 2 , 𝑓 (𝑥 2 )) sul grafico di una funzione


lineare possiamo osservare che si ha

𝑓 (𝑥2 ) − 𝑓 (𝑥1 )
= 𝑚.
𝑥2 − 𝑥1

Il coefficiente 𝑚 , dunque, rappresenta la pendenza del grafico di 𝑓 , ovvero il


rapporto tra la variazione dei valori della funzione Δ 𝑓 = 𝑓 (𝑥 2 ) − 𝑓 (𝑥 1 ) e la
variazione della variabile in ingresso Δ𝑥 = 𝑥 2 − 𝑥 1 . Geometricamente questo è
il rapporto tra i due cateti (base e altezza) che formano un triangolo rettangolo
la cui ipotenusa è il segmento che congiunge i due punti sul grafico. Il fatto che
questo rapporto sia costante significa, in base al teorema di Talete, che i punti
del grafico sono allineati ovvero che il grafico di una funzione lineare è, dal
punto di vista geometrico, una retta.

Definizione 1.72 (retta). Una linea retta (più semplicemente: retta) in è un


sottospazio affine di dimensione 1 ovvero la traslazione di un sottospazio vettoriale di
dimensione 1 (si rimanda al corso di geometria).

Tutte le rette del piano, tranne quelle parallele all’asse delle ordinate, sono
grafico di una funzione lineare.
Si osservi che per 𝑚 > 0 la funzione è strettamente crescente, per 𝑚 = 0 la
funzione è costante e per 𝑚 < 0 la funzione è strettamente decrescente.

1.26 funzioni quadratiche

polinomio di secondo grado


Le funzioni espresse mediante un polinomio di secondo grado

𝑓 (𝑥) = 𝑎𝑥 2 + 𝑏𝑥 + 𝑐 (1.17)

funzioni quadratiche
con 𝑎, 𝑏, 𝑐 ∈ ℝ, 𝑎 ≠ 0, si possono chiamare funzioni quadratiche.
Il modello di funzione quadratica è la funzione 𝑓 (𝑥) = 𝑥 2 che (come tutte
le potenze di esponente positivo e pari) risulta essere una funzione pari,
strettamente crescente sull’intervallo [0 , +∞) e strettamente decrescente su
1.26 funzioni quadratiche 57

𝑥 = − 2𝑏𝑎

𝑦 = 𝑎𝑥 2 + 𝑏𝑥 + 𝑐

𝑥1 𝑥2
Figura 1.8: Il grafico di una funzione
quadratica.

(−∞, 0]. La funzione assume solamente valori non negativi e si annulla solo
per 𝑥 = 0. Dunque l’equazione
𝑥2 = 𝑏
non ha soluzione se 𝑏 < 0 ed ha come unica soluzione 𝑥 = 0 se 𝑏 = 0.√Se 𝑏 > 0
sappiamo che questa equazione ha una unica soluzione √ positiva 𝑥1 = 𝑏 e, per
simmetria, ha anche
√ una soluzione negativa 𝑥 2 = − 𝑏 . Sintetizzando si usa
scrivere 𝑥 1,2 = ± 𝑏 per unire in una unica riga le due definizioni.

La generica funzione quadratica (1.17) può essere ricondotta al caso modello


tramite un cambio di variabile lineare. In pratica si cerca di comporre il quadrato
di un binomio con un procedimento chiamato completamento del quadrato: completamento del quadrato

𝑏 𝑐
 
𝑓 (𝑥) = 𝑎𝑥 + 𝑏𝑥 + 𝑐 = 𝑎 𝑥 + 𝑥 +
2 2
𝑎 𝑎
𝑏 𝑏2 𝑏2 𝑐
 
= 𝑎 𝑥 +2 𝑥+ 2 − 2 +
2
2𝑎 4𝑎 4𝑎 𝑎
" 2 # (1.18)
𝑏 𝑏 2 − 4 𝑎𝑐
=𝑎 𝑥+ −
2𝑎 4𝑎2
2
𝑏 𝑏 2 − 4 𝑎𝑐

=𝑎 𝑥+ − .
2𝑎 4𝑎

Ponendo 𝑋 = 𝑥 + 2𝑏𝑎 e 𝑌 = 𝑦 + 𝑏 −4 𝑎4 𝑎𝑐 l’equazione 𝑦 = 𝑎𝑥 2 + 𝑏𝑥 + 𝑐 diventa


2

quindi 𝑌 = 𝑎𝑋 2 . Significa che il grafico della funzione quadratica (1.17) si


ottiene traslando la curva 𝑦 = 𝑎𝑥 2 che, dal punto di vista geometrico, si può
facilmente dimostrare essere una parabola con fuoco nel punto di coordinate
0 , 41𝑎 e asse la retta di equazione 𝑥 = 0. Dunque il grafico di ogni funzione

quadratica è una parabola, e più precisamente: ogni parabola con direttrice
parallela all’asse delle ascisse è il grafico di una funzione quadratica.

Definizione 1.73 (parabola). Una parabola con fuoco nel punto 𝑭 = (𝐹1 , 𝐹2 ) ∈ ℝ × ℝ
e retta direttrice la retta 𝑟 ⊆ ℝ × ℝ è l’insieme dei punti 𝒙 = (𝑥 1 , 𝑥 2 ) ∈ ℝ × ℝ
equidistanti da 𝑭 e da 𝑟 :
 p q 
𝒙 ∈ ℝ × ℝ: (𝑥1 − 𝐹1 )2 + (𝑥2 − 𝐹2 )2 = inf (𝑥1 − 𝑃1 )2 + (𝑦1 − 𝑃1 )2 .
𝑷∈𝑟
58 1 fondamenti

Esercizio 1.74. Si dimostri che per ogni 𝑎 ≠ 0 esiste 𝑠 ≠ 0 per cui il riscalamento
𝑋 = 𝑠𝑥 , 𝑌 = 𝑠 𝑦 porta il grafico della parabola 𝑦 = 𝑎𝑥 2 nel grafico della parabola
𝑌 = 𝑋 2 . Significa che a meno di isometrie e riscalamenti c’è una unica parabola.

Ricordando le proprietà di monotonia della funzione 𝑋 ↦→ 𝑋 2 possiamo dedurre


 se 𝑎 > 0 la funzione 𝑓 (𝑥) è strettamente decrescente se ristretta all’intervallo
che 
−∞, − 2𝑏𝑎 ed è invece strettamente crescente sull’intervallo − 2𝑏𝑎 , +∞ . Ha
 

dunque un punto di minimo in 𝑥 = − 2𝑏𝑎 . Inoltre (sempre se 𝑎 > 0) la funzione


è superiormente illimitata. Viceversa se 𝑎 < 0 la funzione è inferiormente
illimitata ed ha un massimo nel punto 𝑥 = − 2𝑏𝑎 .
E’ molto importante saper risolvere equazioni e disequazioni quadratiche.
Grazie a (1.18) l’equazione

𝑎𝑥 2 + 𝑏𝑥 + 𝑐 = 0

risulta equivalente a
2
𝑏 𝑏 2 − 4 𝑎𝑐

𝑥+ = .
2𝑎 4𝑎2
Dunque se 𝑏 2 − 4 𝑎𝑐 < 0 l’equazione 𝑎𝑥 2 + 𝑏𝑥 + 𝑐 = 0 non ha soluzioni. Se
𝑏 2 − 4 𝑎𝑐 = 0 l’equazione ha una unica soluzione 𝑥 = − 2𝑏𝑎 . Infine se 𝑏 2 − 4 𝑎𝑐 > 0
si ottiene √
𝑏 𝑏 2 − 4 𝑎𝑐
𝑥+ =±
2𝑎 2𝑎
da cui la famosa formula risolutiva

−𝑏 ± 𝑏 2 − 4 𝑎𝑐
𝑥 1 ,2 = . (1.19)
2𝑎

Risolvendo le disequazioni allo stesso modo, si trova che la funzione 𝑎𝑥 2 + 𝑏𝑥 + 𝑐


quando 𝑎 > 0 è positiva nei punti esterni alle soluzioni dell’equazione (in tutti
i punti se le soluzioni non esistono) ed è negativa nei punti interni alle due
soluzioni. Viceversa se 𝑎 < 0 la funzione è positiva all’interno delle due
soluzioni e negativa all’esterno.

1.27 equazioni e disequazioni

Un problema matematico molto comune è quello di dover risolvere equazioni e


disequazioni del tipo:

𝑓 (𝑥) = 𝑏, 𝑓 (𝑥) ≥ 𝑏, 𝑓 (𝑥) > 𝑏, 𝑓 (𝑥) ≤ 𝑏, 𝑓 (𝑥) < 𝑏 (1.20)

dove 𝑓 : 𝐴 ⊆ ℝ → ℝ è una funzione data e 𝑏 ∈ ℝ è fissato.


Quando 𝑓 è strettamente crescente e 𝑏 ∈ 𝑓 (𝐴) la soluzione può essere scritta
banalmente: ovviamente deve essere 𝑥 ∈ 𝐴 e ogni equazione o disequazione
in (1.20) avrà la corrispondente soluzione:

𝑥 = 𝑓 −1 (𝑏), 𝑥 ≥ 𝑓 −1 (𝑏), 𝑥 > 𝑓 −1 (𝑏), 𝑥 ≤ 𝑓 −1 (𝑏), 𝑥 < 𝑓 −1 (𝑏).


1.27 equazioni e disequazioni 59

Se la funzione fosse strettamente decrescente si può procedere allo stesso modo,


ma le disuguaglianze si invertono. Se la funzione fosse strettamente crescente su
alcuni intervalli e strettamente decrescente su altri si potranno separare i diversi
casi e si otterranno più soluzioni espresse da uguaglianze o disuguaglianze.

Esempio 1.75. Si risolva la disequazione


hp i
(𝑥 + 1)4 − 3 − 2 ≤ 3.
3
log2

Svolgimento. La funzione logaritmo è strettamente crescente ed è definita quan-


do l’argomento è positivo. Dunque la disequazione data è equivalente al sistema
di disequazioni:
p3
0< (𝑥 + 1)4 − 3 − 2 ≤ 8.
Possiamo sommare 2 per ottenere
p3
2< (𝑥 + 1)4 − 3 ≤ 10.

La funzione radice cubica è strettamente crescente su tutto ℝ quindi possiamo


invertirla elevando tutto al cubo:

8 < (𝑥 + 1)4 − 3 ≤ 1000.

Sommiamo 3:
11 < (𝑥 + 1)4 ≤ 1003.
L’elevamento alla quarta potenza è strettamente crescente solo quando l’argo-
mento è positivo, ed è una funzione pari. Possiamo quindi affermare che le
nostre disequazioni sono equivalenti all’unione delle soluzioni di due sistemi:
√4 √4 √4 √4
11 < 𝑥 + 1 ≤ 1003 o − 1003 ≤ 𝑥 + 1 < 11.

Sottraendo 1 otteniamo infine


√4 √4 √4 √4
11 − 1 < 𝑥 ≤ 1003 − 1 o − 1003 − 1 ≤ 𝑥 < 11 − 1.

In definitiva l’insieme delle soluzioni è


h √
4
√4  √
4
√4 i
− 1003 − 1 , 11 − 1 ∪ 11 − 1 , 1003 − 1 .

hp i
Nell’esempio precedente la funzione 𝑓 (𝑥) = log2 3
(𝑥 + 1)4 − 3 − 2 è ottenuta
mediante composizione di funzioni elementari:
√3
𝑓 = (𝑥 ↦→ log2 𝑥) ◦ (𝑥 ↦→ 𝑥 − 2) ◦ (𝑥 ↦→ 𝑥)
◦ (𝑥 ↦→ 𝑥 − 3) ◦ (𝑥 ↦→ 𝑥 ) ◦ (𝑥 ↦→ 𝑥 + 1).
4
60 1 fondamenti

Negli intervalli in cui tutte queste funzioni sono invertibili la funzione inversa
si ottiene componendo, in ordine opposto, tutte le inverse:
√4
𝑓 −1 = (𝑥 ↦→ 𝑥 − 1) ◦ (𝑥 ↦→ 𝑥) ◦ (𝑥 ↦→ 𝑥 + 3)
◦ (𝑥 ↦→ 𝑥 3 ) ◦ (𝑥 ↦→ 𝑥 + 2) ◦ (𝑥 ↦→ 2𝑥 ).
√4
In effetti il caposaldo 1003 − 1 è proprio tale funzione valutata in 𝑏 = 3.

Il metodo precedente è puramente algebrico e si applica alle equazioni come


la (1.20) dove la variabile 𝑥 compare una sola volta e dove la funzione 𝑓 si
esprime come composizione di funzioni elementari di cui sappiamo scrivere la
funzione inversa.

Ben diverso è il caso in cui nell’equazione la variabile 𝑥 compare più di una


volta. In alcuni casi, come ad esempio,

𝑥 2 > 2𝑥 − 1

queste equazioni possono essere ricondotte al caso precedente tramite opportune


manipolazioni algebriche. Il caso delle equazioni quadratiche lo abbiamo fatto
nel paragrafo precedente utilizzato il completamento del quadrato: 𝑥 2 − 2 𝑥 =
(𝑥 − 1)2 − 1. In altri casi, come ad esempio l’equazione

2𝑥 = 𝑥 2

le manipolazioni algebriche non sono utili. Nel capitolo sul calcolo differenziale
svilupperemo degli strumenti che ci permetteranno di determinare l’andamento
di molte di queste di funzioni. Nel capitolo sulle successioni svilupperemo
invece gli strumenti che ci permetteranno di determinare le soluzioni mediante
algoritmi di approssimazione. Questi strumenti presuppongono il concetto di
limite e continuità: è sostanzialmente questo che identifica la materia chiamata
analisi matematica.

1.28 i numeri complessi


numeri complessi
Dal punto di vista geometrico l’insieme ℂ dei numeri complessi può essere visto
come un modello del piano euclideo. Sul piano euclideo fissiamo arbitrarimente
un punto 0 in modo da ottenere uno spazio vettoriale e fissiamo, arbitrariamente,
una base 𝑒1 , 𝑒2 . Identifichiamo ogni punto del piano con i corrispondenti vettori
applicati in 0. La retta generata dal vettore 𝑒1 la identifichiamo con la retta ℝ
dei numeri reali e quindi poniamo 1 = 𝑒1 . La retta ortogonale generata dal
vettore 𝑒2 verrà chiamata retta dei numeri immaginari e definiamo 𝑖 = 𝑒2 .

Un generico punto 𝑧 del piano ℂ potrà essere scritto in maniera univoca nella
base scelta: 𝑧 = 𝑥𝑒1 + 𝑦𝑒2 ovvero, per come abbiamo chiamato 𝑒1 ed 𝑒2 :

𝑧 = 𝑥 + 𝑖 𝑦.

Tale 𝑧 viene chiamato numero complesso con parte reale 𝑥 e parte immaginaria
𝑦 . Questa rappresentazione del numero complesso 𝑧 viene chiamata rappre-
1.28 i numeri complessi 61

sentazione cartesiana in quanto definisce il punto 𝑧 del piano complesso tramite rappresentazione cartesiana
le sue coordinate cartesiane 𝑥 e 𝑦 . I numeri reali sono immersi nei complessi,
nel senso che se 𝑥 ∈ ℝ allora 𝑧 = 𝑥 + 𝑖 · 0 = 𝑥 è anche un numero complesso.
Il numero complesso 𝑖 = 0 + 𝑖 · 1 viene chiamata unità immaginaria e i numeri unità immaginaria
complessi della forma 𝑖 𝑦 sono chiamati immaginari. Un numero complesso
𝑧 = 𝑥 + 𝑖 𝑦 è quindi una somma tra un numero reale ed un numero immaginario.
Il numero reale 𝑥 viene chiamato parte reale di 𝑧 e si denota con 𝑥 = Re 𝑧 . Il Re 𝑧
numero reale 𝑦 viene chiamato parte immaginaria di 𝑧 e si denota con 𝑦 = Im 𝑧
(osserviamo che la parte immaginaria di un numero complesso è un numero Im 𝑧

reale, non immaginario). Dunque 𝑧 = Re 𝑧 + 𝑖 Im 𝑧 .

L’insieme ℂ, per come è stato costruito, è uno spazio vettoriale reale di di-
mensione 2. Abbiamo quindi già definite la addizione tra elementi di ℂ e la addizione
moltiplicazione tra elementi di ℂ ed elementi di ℝ, se 𝑎, 𝑏, 𝑐, 𝑑, 𝑡 ∈ ℝ si ha:

(𝑎 + 𝑖𝑏) + (𝑐 + 𝑖𝑑) = (𝑎 + 𝑐) + 𝑖(𝑏 + 𝑑),


𝑡(𝑎 + 𝑖𝑏) = 𝑡 𝑎 + 𝑖𝑡𝑏.

Vogliamo estendere la moltiplicazione a tutte le coppie di numeri complessi. moltiplicazione


Imponendo (arbitrariamente) che valga 𝑖 · 𝑖 = −1 e che rimanga valida la
proprietà distributiva, si ottiene questa definizione:

(𝑎 + 𝑖𝑏) · (𝑐 + 𝑖𝑑) = (𝑎𝑐 − 𝑏𝑑) + 𝑖(𝑎𝑑 + 𝑏𝑐).

Si può verificare che questa moltiplicazione estende quella “scalare” definita in


precedenza. E’ anche facile verificare che addizione e moltiplicazione soddisfano
le proprietà commutativa associativa e distributiva, che 0 è elemento neutro per
la addizione, che 1 è elemento neutro della moltiplicazione. Si osservi che se
𝑧 = 𝑥 + 𝑖 𝑦 non è nullo, allora

𝑥 − 𝑖𝑦
(𝑥 + 𝑖 𝑦) · = 1.
𝑥2 + 𝑦2

Significa che ogni 𝑧 ≠ 0 ammette inverso moltiplicativo e quindi ℂ risulta essere


un campo.

Osserviamo che su ℂ non si definisce una relazione d’ordine perché in effetti


non è possibile definire un ordine “compatibile” con le operazioni appena Se ℂ fosse un campo ordinato per assur-
definite. do si dovrebbe avere, che 𝑧 2 ≥ 0 per ogni
𝑧 ∈ ℂ (questo è vero in tutti i campi or-
Su ℂ definiamo delle ulteriori operazioni. Il coniugato di un numero complesso dinati). Ma allora −1 = 𝑖 2 ≥ 0 cioè 1 ≤ 0
che è in contraddizione con la proprietà
𝑧 = 𝑥 + 𝑖 𝑦 è il numero 𝑧¯ = 𝑥 − 𝑖 𝑦 . Geometricamente l’operazione di coniugio
0 < 1 valida in ogni campo ordinato.
è una simmetria rispetto alla retta reale. I numeri reali sono in effetti punti
fissi del coniugio (il coniugato di un numero reale è il numero stesso). E’ un coniugato
semplice esercizio verificare che il coniugio “attraversa” somma e prodotto:

𝑧 + 𝑤 = 𝑧¯ + 𝑤,
¯ 𝑧 · 𝑤 = 𝑧¯ · 𝑤.
¯

Ovviamente risulta 𝑧¯ = 𝑧 . E’ anche utile osservare che si ha:


𝑧 + 𝑧¯ 𝑧 − 𝑧¯
Re 𝑧 = , Im 𝑧 = (1.21)
2 2𝑖
62 1 fondamenti

e
𝑧 · 𝑧¯ = (𝑥 + 𝑖 𝑦)(𝑥 − 𝑖 𝑦) = 𝑥 2 − 𝑖 2 𝑦 2 = 𝑥 2 + 𝑦 2 .

modulo Possiamo allora definire il modulo di un numero complesso 𝑧 = 𝑥 + 𝑖 𝑦 come il


numero reale
√ q
|𝑧| = 𝑧 · 𝑧¯ = 𝑥 2 + 𝑦 2 .

Geometricamente tale quantità rappresenta la distanza del punto 𝑧 dal punto 0


e quindi la distanza tra due numeri complessi 𝑧 e 𝑤 si potrà rappresentare con
|𝑧 − 𝑤| .

Osserviamo
√ che se 𝑧 = 𝑥 ∈ ℝ ⊆ ℂ il modulo di 𝑧 coincide con il valore assoluto:
|𝑧| = 𝑥 2 = |𝑥| e per questo motivo non distinguiamo, nelle notazioni, il
modulo dal valore assoluto. Più in generale risulta per ogni 𝑧 ∈ ℂ (la verifica è
immediata):
| Re 𝑧| ≤ |𝑧|, | Im 𝑧| ≤ |𝑧|.

Possiamo a questo punto trovare una utile formula per calcolare il reciproco di
un numero complesso. Essendo infatti 𝑧 · 𝑧¯ = |𝑧| 2 si osserva che

1 𝑧¯ 𝑧¯
= = .
𝑧 𝑧¯ · 𝑧 |𝑧| 2

Teorema 1.76. Il modulo di un numero complesso soddisfa (come il valore assoluto) le


seguenti proprietà

1. |𝑧| = |𝑧| ,
2. |−𝑧| = |𝑧| = | 𝑧¯ | ,
3. |𝑧 · 𝑤| = |𝑧| · |𝑤| .
4. |𝑧 + 𝑤| ≤ |𝑧| + |𝑤| (convessità),
5. |𝑧 − 𝑤| ≤ |𝑧 − 𝑣| + |𝑣 − 𝑤| (disuguaglianza triangolare),

Dimostrazione. La prima proprietà è ovvia in quanto il valore assoluto di un


numero reale non negativo è il numero stesso.

La seconda proprietà viene immediatamente dalla definizione.

Per la terza proprietà sia 𝑧 = 𝑥 + 𝑖 𝑦 , 𝑤 = 𝑎 + 𝑖𝑏 . Allora:

|𝑧 · 𝑤| = |(𝑥 + 𝑖 𝑦) · (𝑎 + 𝑖𝑏)| = |𝑥𝑎 − 𝑦𝑏 + 𝑖(𝑥𝑏 + 𝑎 𝑦)|


q
= (𝑥𝑎 − 𝑦𝑏)2 + (𝑥𝑏 + 𝑎 𝑦)2
q
= 𝑥 2 𝑎 2 + 𝑦 2 𝑏 2 − 2 𝑥𝑎 𝑦𝑏 + 𝑥 2 𝑏 2 + 𝑎 2 𝑦 2 + 2 𝑥𝑏𝑎 𝑦
q
= 𝑥2 𝑎2 + 𝑦2𝑏2 + 𝑥2𝑏2 + 𝑎2 𝑦2
q
= 𝑥 2 (𝑎 2 + 𝑏 2 ) + 𝑦 2 (𝑎 2 + 𝑏 2 )
q
= (𝑥 2 + 𝑦 2 )(𝑎 2 + 𝑏 2 ) = |𝑥 + 𝑖 𝑦| · |𝑎 + 𝑖𝑏|
= |𝑧| · |𝑤|.
1.28 i numeri complessi 63

Figura 1.9: Consideriamo i numeri com-


plessi 𝑧 = 𝑎 + 𝑖𝑏 e 𝑤 = 𝛼 + 𝑖𝛽 e suppo-
𝑦 niamo che sia 𝛼 2 = 𝑎 2 + 𝑏 2 . Si consideri
𝑢 il punto 𝑢 che si ottiene ruotando il pun-
to 𝑤 dell’angolo individuato dal punto
𝑧 . Si avrà allora 𝑢 = 𝑎 − 𝑠 + 𝑖(𝑏 + 𝑡)
𝛽 dove 𝑠 e 𝑡 sono i cateti del triangolo
𝑡 𝑤 rettangolo con ipotenusa 𝛽 . Grazie alle
proprietà di similitudine dei triangoli
𝑠
𝑧 si ha 𝛽𝑠 = 𝛼𝑏 e 𝛽𝑡 = 𝛼𝑎 da cui si ottiene
𝑏𝛽 𝑎𝛽
𝛼 quindi 𝑢 = 𝑎 − 𝛼 + 𝑖(𝑏 + 𝛼 ) ovvero
𝑏 𝛼𝑢 = (𝑎𝛼 − 𝑏𝛽) + 𝑖(𝑏𝛼 + 𝑎𝛽) = 𝑧 · 𝑤 .
𝑥 Significa che il numero complesso 𝑧 · 𝑤
si trova sulla semiretta che individua un
0 𝑎 angolo che è la somma degli angoli indi-
viduati dai numeri complessi 𝑧 e 𝑤 .

Per la quarta disuguaglianza osserviamo che si ha

|𝑧 + 𝑤| 2 = (𝑧 + 𝑤) · (¯𝑧 + 𝑤)
¯ = |𝑧| 2 + |𝑤| 2 + 𝑧 · 𝑤¯ + 𝑧¯ · 𝑤

e visto che

𝑧 · 𝑤¯ + 𝑧¯ · 𝑤 = 𝑧 · 𝑤¯ + 𝑧 · 𝑤¯ = 2 Re(𝑧 𝑤)
¯ ≤ 2 |𝑧 𝑤|
¯ = 2 |𝑧| · | 𝑤|
¯ = 2 |𝑧| · |𝑤|

otteniamo
|𝑧 + 𝑤| 2 ≤ |𝑧| 2 + |𝑤| 2 + 2 |𝑧| · |𝑤| = (|𝑧| + |𝑤|)2
che è equivalente alla disuguaglianza di convessità.

La disuguaglianza triangolare è conseguenza immediata della convessità, infatti

|𝑧 − 𝑤| = |(𝑧 − 𝑣) + (𝑣 − 𝑤)| ≤ |𝑧 − 𝑣| + |𝑣 − 𝑤|.

Possiamo ora dare una interpretazione geometrica del prodotto 𝑧 · 𝑤 tra due
numeri complessi. In primo luogo sappiamo che |𝑧 · 𝑤| = |𝑧| · |𝑤| e dunque
il punto del piano che rappresenta il prodotto 𝑧 · 𝑤 si trova ad una distanza
dall’origine che è pari al prodotto delle distanze dei punti 𝑧 e 𝑤 . Inoltre l’angolo infinito
individuato da 𝑧 · 𝑤 rispetto all’asse delle 𝑥 positive risulta uguale alla somma
degli angoli individuati dai punti 𝑧 e 𝑤 come mostrato in figura 1.9. ∞

Anche il piano dei numeri complessi può essere esteso aggiungendoci un punto
all’infinito. A differenza dei reali, su cui era presente un ordinamento che era
utile conservare, nel caso dei numeri complessi è più usuale utilizzare un unico
punto infinito che si denota con ∞. Definiamo il piano dei complessi estesi ℂ̄
come
ℂ̄ = ℂ ∪ {∞}.
64 1 fondamenti

Definiamo

𝑧+∞=∞ ∀𝑧 ∈ ℂ
𝑧−∞=∞ ∀𝑧 ∈ ℂ
𝑧·∞=∞ ∀𝑧 ∈ ℂ̄ \ {0}
𝑧/∞ = 0 ∀𝑧 ∈ ℂ
𝑧/0 = ∞ ∀𝑧 ∈ ℂ̄ \ {0}
¯ =∞

|∞| = +∞ ∈ ℝ̄.

Si noti che abbiamo definito la divisione per zero di numeri complessi (e quindi
anche reali) diversi da zero. Il risultato è ∞ e quindi rimane confermato che la
divisione per zero non è una operazione valida se vogliamo un risultato finito.
Una quantità 𝑧 ∈ ℂ̄ sarà detta finita se 𝑧 ∈ ℂ.

Esempio 1.77. La funzione 𝑓 : ℂ̄ → ℂ̄ definita da

1
𝑓 (𝑧) =
𝑧

è una funzione bigettiva di ℂ̄ in sé. Dal punto di vista geometrico il coniugato di tale
funzione ovvero la funzione 𝑧 ↦→ 1𝑧¯ è l’inversione circolare rispetto al cerchio unitario di
ℂ: i punti sulla circonferenza unitaria vengono lasciati fissi, i punti all’interno vengono
mandati all’esterno rimanendo sullo stesso raggio uscente dall’origine e invertendo il
proprio modulo. I punti 0 e ∞ si scambiano.

Esercizio 1.78 (vertici di un triangolo equilatero). Si risolva l’equazione

𝑧3 − 1 = 0

nel campo complesso.

Svolgimento. Ricordiamo il prodotto notevole:

𝑧 3 − 1 = (𝑧 − 1)(𝑧 2 + 𝑧 + 1).

Dunque 𝑧 = 1 è una soluzione e le altre soluzioni devono risolvere l’equazione


𝑧 2 + 𝑧 + 1 = 0. Certamente 𝑧 = 0 non è soluzione e dunque possiamo dividere
per 𝑧 e ottenere:
1
𝑧 + 1 + = 0.
𝑧
Osserviamo ora che se 𝑧 è soluzione si ha 1 = 𝑧 3 e quindi: 1 = 𝑧 3 = |𝑧| 3 da cui

|𝑧| = 1. Ma allora 𝑧 · 𝑧¯ = |𝑧| 2 = 1 ovvero 1𝑧 = 𝑧¯ . Dunque si ha

𝑧 + 1 + 𝑧¯ = 0.

Osserviamo ora che se 𝑧 = 𝑥 + 𝑖 𝑦 con 𝑥, 𝑦 ∈ ℝ allora 𝑧 + 𝑧¯ = 2 𝑥 e quindi

2𝑥 + 1 = 0
1.28 i numeri complessi 65

da cui 𝑥 = − 12 . Essendo inoltre 𝑥 2 + 𝑦 2 = |𝑧| 2 = 1 si ottiene 𝑦 2 = 1 − 𝑥 2 = 3


4 da

cui 𝑦 = ± 23 .
L’equazione data ha quindi 3 soluzioni:

1 3
𝑧0 = 1, 𝑧 1 ,2 =− ±𝑖 .
2 2

Questi tre punti, se disegnati sul piano di Gauss, si trovano ai vertici di un


triangolo equilatero iscritto nella circonferenza unitaria. Infatti l’interpretazione
geometrica del prodotto di numeri complessi ci dice che il punto 𝑧 1 individua
sul piano di Gauss un angolo pari ad un terzo dell’angolo giro. Inoltre si ha
𝑧2 = 𝑧12 e dunque 𝑧2 corrisponde a 23 di angolo giro e 𝑧0 = 𝑧 13 = 1 rappresenta
l’angolo giro (o l’angolo nullo).
funzioni continue, limiti e
successioni 2
2.1 funzioni continue

Intuitivamente una funzione continua ha la proprietà che se in un punto 𝑥 0


assume un valore 𝑦0 = 𝑓 (𝑥 0 ) allora in punti abbastanza vicini ad 𝑥 0 i valori
assunti non saranno molto diversi dal valore 𝑦0 . Nella definizione seguente
questo viene formalizzato: fissato il punto 𝑥 0 e scelto un errore 𝜀 > 0 che siamo
disposti a commettere sui valori della funzione possiamo trovare un errore
𝛿 > 0 per cui nei punti che differiscono da 𝑥0 per meno di 𝛿 il valore della
funzione differisce da 𝑦0 per meno di 𝜀.

Definizione 2.1 (continuità su ℝ). Sia 𝑓 : 𝐴 ⊆ ℝ → ℝ una funzione. Diremo che


𝑓 è continua nel punto 𝑥0 ∈ 𝐴 se continua nel punto

∀𝜀 > 0 : ∃𝛿 > 0 : ∀𝑥 ∈ 𝐴 : |𝑥 − 𝑥0 | < 𝛿 =⇒ | 𝑓 (𝑥) − 𝑓 (𝑥0 )| < 𝜀. (2.1)

Diremo che 𝑓 : 𝐴 → ℝ è continua se è continua in ogni punto 𝑥 0 ∈ 𝐴. continua

Attenzione: la funzione 𝑓 (𝑥) = 𝑥1 assume vicino a 𝑥 = 0 valori molto diversi tra


loro (ad esempio 𝑓 (0.01) − 𝑓 (−0.01) = 200) ma ciò non toglie che la funzione
possa essere continua in quanto il punto 𝑥 = 0 non appartiene al dominio e
quindi, in base alla definizione precedente, non ha senso e non ha importanza
verificare se la funzione è continua in tale punto.

Teorema 2.2 (continuità del reciproco). La funzione 𝑓 : ℝ \ {0} → ℝ definita da


𝑓 (𝑥) = 𝑥1 è una funzione continua.

|𝑥 0 |
Dimostrazione. Siano 𝑥, 𝑥 0 ≠ 0. Se prendiamo 𝛿 < 2 e se |𝑥 − 𝑥 0 | < 𝛿 si avrà,
|𝑥0 |
per disuguaglianza triangolare inversa, |𝑥| > 2 . Dunque

− 1 = |𝑥 − 𝑥0 | ≤ 2𝛿 .

1
𝑥 𝑥0 |𝑥 · 𝑥0 | |𝑥0 | 2

Si ottiene quindi la condizione | 𝑓 (𝑥) − 𝑓 (𝑥 0 )| < 𝜀 se si sceglie 𝛿 in modo che


|𝑥 0 | 2 ·𝜀
risulti anche 𝛿 < 2 .
funzione segno
Esempio 2.3. La funzione segno sgn : ℝ → ℝ definita da



 1 se 𝑥 > 0


sgn(𝑥) = 0 se 𝑥 = 0

 −1 se 𝑥 < 0


è un esempio di funzione non continua.
68 2 funzioni continue, limiti e successioni

Dimostrazione. Verifichiamo che la funzione non è continua nel punto 𝑥 0 = 0.


Infatti se 𝑥 ≠ 0 si ha

| sgn(𝑥) − sgn(𝑥0 )| = | sgn(𝑥)| = 1

e quindi se scegliamo 𝜀 < 1 non è possibile trovare 𝛿 > 0 per cui valga la
condizione di continuità (2.1) nel punto 𝑥 0 = 0.

Esercizio 2.4. Dimostrare che le funzioni 𝑓 (𝑥) = 𝑥 e 𝑔(𝑥) = |𝑥| sono continue.
Dimostrare che le funzioni ℎ(𝑥) = b𝑥c e 𝑘(𝑥) = d𝑥e non sono continue (ma sono
continue in ogni punto 𝑥 0 ∈ ℝ \ ℤ).

Definizione 2.5 (operazioni sulle funzioni). Sia 𝐴 ⊆ ℝ e siano 𝑓 , 𝑔 funzioni


𝐴 → ℝ. Possiamo allora definire 𝑓 + 𝑔 , − 𝑓 , 𝑓 − 𝑔 , 𝑓 · 𝑔 , | 𝑓 | , 𝑓 𝑛 (con 𝑛 ∈ ℕ ) e (se
𝑔(𝑥) ≠ 0 per ogni 𝑥 ∈ 𝐴) anche 𝑓 /𝑔 come funzioni 𝐴 → ℝ mediante le seguenti
ovvie definizioni

( 𝑓 + 𝑔)(𝑥) = 𝑓 (𝑥) + 𝑔(𝑥), ( 𝑓 − 𝑔)(𝑥) = 𝑓 (𝑥) − 𝑔(𝑥),


( 𝑓 · 𝑔)(𝑥) = 𝑓 (𝑥) · 𝑔(𝑥), ( 𝑓 /𝑔)(𝑥) = 𝑓 (𝑥)/𝑔(𝑥),
(− 𝑓 )(𝑥) = −( 𝑓 (𝑥)), | 𝑓 |(𝑥) = | 𝑓 (𝑥)|, 𝑓 𝑛 (𝑥) = ( 𝑓 (𝑥))𝑛 .

Se 𝑓 : 𝐴 → 𝐵 e 𝑔 : 𝐵 → 𝐶 ricordiamo che abbiamo definito la funzione composta


𝑔 ◦ 𝑓 : 𝐴 → 𝐶:
(𝑔 ◦ 𝑓 )(𝑥) = 𝑔( 𝑓 (𝑥)).

Se 𝑐 ∈ ℝ è un numero considereremo a volte 𝑐 : 𝐴 → ℝ come una funzione costante.


Risulta quindi inteso che se 𝑐 ∈ ℝ e 𝑓 : 𝐴 → ℝ allora 𝑐 · 𝑓 è la funzione definita da
(𝑐 · 𝑓 )(𝑥) = 𝑐 · ( 𝑓 (𝑥)). La somma e il prodotto per costante rendono l’insieme ℝ𝐴 delle
funzioni 𝐴 → ℝ uno spazio vettoriale sul campo ℝ.

Teorema 2.6 (composizione di funzioni continue). Se 𝑓 e 𝑔 sono funzioni definite


e continue in uno stesso punto 𝑥 0 allora anche

𝑓 + 𝑔, 𝑓 · 𝑔, 𝑓 − 𝑔, | 𝑓 |, 𝑓 𝑛 (con 𝑛 ∈ ℕ )

sono funzioni definite e continue nel punto 𝑥 0 . Se inoltre 𝑔(𝑥 0 ) ≠ 0 anche la funzione
𝑓 /𝑔 è definita e continua nel punto 𝑥 0 .

Se 𝑓 : 𝐴 ⊆ ℝ → ℝ è una funzione continua nel punto 𝑥 0 ∈ 𝐴 e 𝑔 : 𝐵 ⊆ ℝ → ℝ è


una funzione continua nel punto 𝑦0 = 𝑓 (𝑥 0 ) ∈ 𝐵 allora la funzione 𝑔 ◦ 𝑓 definita in
𝑓 −1 (𝐵) è continua nel punto 𝑥 0 .

Dimostrazione. Mostriamo prima di tutto la continuità della composizione 𝑔 ◦ 𝑓 .


Per la continuità di 𝑓 in 𝑥 0 e di 𝑔 in 𝑦0 = 𝑓 (𝑥 0 ) si ha che per ogni 𝜀 > 0 esiste un
𝛾 > 0 e per ogni 𝛾 > 0 esiste un 𝛿 > 0 per cui

|𝑥 − 𝑥0 | < 𝛿 =⇒ | 𝑓 (𝑥) − 𝑓 (𝑥 0 )| < 𝛾,


|𝑦 − 𝑦0 | < 𝛾 =⇒ | 𝑔(𝑦) − 𝑔(𝑦0 )| < 𝜀
2.1 funzioni continue 69

da cui

|𝑥 − 𝑥0 | < 𝛿 =⇒ | 𝑓 (𝑥) − 𝑓 (𝑥 0 )| < 𝛾 =⇒ | 𝑔( 𝑓 (𝑥)) − 𝑔( 𝑓 (𝑥0 ))| < 𝜀

che non è altro che la condizione di continuità (2.1) per 𝑔 ◦ 𝑓 .

Se 𝑓 e 𝑔 sono continue nel punto 𝑥 0 allora per ogni 𝜀0 > 0 esistono 𝛿 1 e 𝛿 2 tali
che

|𝑥 − 𝑥0 | < 𝛿1 =⇒ | 𝑓 (𝑥) − 𝑓 (𝑥0 )| < 𝜀0 ,


|𝑥 − 𝑥0 | < 𝛿2 =⇒ | 𝑔(𝑥) − 𝑔(𝑥 0 )| < 𝜀0 .

In particolare scegliendo 𝛿 = min {𝛿 1 , 𝛿 2 } se |𝑥 − 𝑥 0 | < 𝛿 valgono contempora-


neamente entrambe le stime:

| 𝑓 (𝑥) − 𝑓 (𝑥0 )| < 𝜀0 , | 𝑔(𝑥) − 𝑔(𝑥0 )| < 𝜀0 .

Dunque per la somma osserviamo che se |𝑥 − 𝑥 0 | < 𝛿 si ha

|( 𝑓 + 𝑔)(𝑥) − ( 𝑓 + 𝑔)(𝑥0 )| = | 𝑓 (𝑥) + 𝑔(𝑥) − 𝑓 (𝑥0 ) − 𝑔(𝑥0 )|


≤ | 𝑓 (𝑥) − 𝑓 (𝑥 0 )| + | 𝑔(𝑥) − 𝑔(𝑥0 )| ≤ 2 𝜀0 .

Dato 𝜀 > 0 basterà quindi scegliere 𝜀0 = 𝜀/2 e 𝛿 come sopra per ottenere la
condizione di continuità.

Per il prodotto si ha

| 𝑓 (𝑥)𝑔(𝑥) − 𝑓 (𝑥0 )𝑔(𝑥0 )|


= | 𝑓 (𝑥)𝑔(𝑥) − 𝑓 (𝑥0 )𝑔(𝑥) + 𝑓 (𝑥0 )𝑔(𝑥) − 𝑓 (𝑥0 )𝑔(𝑥0 )|
≤ | 𝑓 (𝑥) − 𝑓 (𝑥0 )| · | 𝑔(𝑥)| + | 𝑓 (𝑥0 )| · | 𝑔(𝑥) − 𝑔(𝑥0 )|
≤ 𝜀0 | 𝑔(𝑥)| + | 𝑓 (𝑥 0 )|𝜀0 .

Osserviamo ora che | 𝑔(𝑥)| ≤ | 𝑔(𝑥) − 𝑔(𝑥 0 )|+| 𝑔(𝑥 0 )| e quindi | 𝑔(𝑥)| ≤ | 𝑔(𝑥 0 )|+𝜀0
da cui:

| 𝑓 (𝑥)𝑔(𝑥) − 𝑓 (𝑥0 )𝑔(𝑥 0 )| ≤ 𝜀0(| 𝑔(𝑥0 )| + 𝜀0) + | 𝑓 (𝑥0 )|𝜀0


= 𝜀0 · (| 𝑓 (𝑥0 )| + | 𝑔(𝑥0 )| + 𝜀0).

Possiamo facilmente rendere questa quantità inferiore a qualunque 𝜀 > 0:


basterà prendere 𝜀0 < 1 e
𝜀
𝜀0 < .
| 𝑓 (𝑥0 )| + | 𝑔(𝑥0 )| + 1

La funzione 𝑓 𝑛 è continua per induzione su 𝑛 in quanto prodotto di funzioni


continue: 𝑓 𝑛+1 = 𝑓 𝑛 · 𝑓 .

Abbiamo già visto che la funzione ℎ(𝑥) = 𝑥1 è continua, dunque se 𝑔 è continua


1
anche la funzione 𝑔(𝑥) = ℎ ◦ 𝑔 è continua essendo composizione di funzioni
𝑓
continue. Di conseguenza anche la funzione 𝑔 = 𝑓 · 1
𝑔 è continua, essendo il
prodotto di funzioni continue.
70 2 funzioni continue, limiti e successioni

Analogamente la funzione 𝑓 − 𝑔 è la somma di 𝑓 con −𝑔 e la funzione −𝑔 è


la composizione di 𝑔 con ℎ(𝑥) = −𝑥 . E’ immediato verificare che la funzione
ℎ(𝑥) = −𝑥 è continua e dunque anche la differenza 𝑓 − 𝑔 è continua. Lo stesso
vale per la funzione | 𝑓 | che è la composizione di 𝑓 con la funzione ℎ(𝑥) = |𝑥| .

Il precedente teorema è molto importante ed utile in quanto garantisce che ogni


funzione definita tramite una espressione che coinvolge solamente le funzioni e
le operazioni elencate nell’enunciato del teorema, risulta certamente essere una
funzione continua. Come nel seguente.

Esempio 2.7. La funzione

(𝑥 − 3) · 𝑥 − 1
𝑥+𝑥
2
𝑓 (𝑥) =
1−𝑥 3
𝑥 −

𝑥

è continua.
Si intende che tale funzione è definita sull’insieme degli 𝑥 ∈ ℝ per cui tutte le operazioni
coinvolte sono definite ovvero 𝑓 : 𝐷 ⊆ ℝ → ℝ con

1 − 𝑥 3
 
𝐷 = 𝑥 ∈ ℝ : 𝑥 + 𝑥 ≠ 0, 𝑥 ≠ 0, 𝑥 − ≠0 .
2


𝑥

Per convincersi che questa funzione 𝑓 è continua si nota che le funzioni 𝑥 e le costanti
3 e 1 sono funzioni continue. Ma allora, per il teorema 2.6, anche le funzioni 𝑥 − 3
e 𝑥 2 = 𝑥 · 𝑥 sono continue. Dunque anche (𝑥 − 3) · 𝑥 , 𝑥 + 𝑥 2 e 𝑥 3 e 1 − 𝑥 3 sono
1 1−𝑥 3
continue. Di conseguenza sono continue pure 1+𝑥 2 e 𝑥 . E poi saranno continue

1−𝑥 3 1−𝑥 3 1−𝑥 3
anche (𝑥 − 3) · 𝑥 − 1
e𝑥− e quindi 𝑥 − e pure 𝑥 − 𝑥 . Infine sarà

1+𝑥 2 𝑥 𝑥
dunque continua 𝑓 (𝑥).

In particolare è chiaro che le funzioni lineare e quadratiche che abbiamo


introdotto nelle sezioni precedenti sono funzioni continue in quanto sono
ottenute sommando e moltiplicando tra loro funzioni continue.

Teorema 2.8 (continuità delle funzioni monotone). Sia 𝐼 ⊆ ℝ un intervallo e sia


𝑓 : 𝐼 → ℝ una funzione monotòna. Allora 𝑓 è continua se e solo se 𝑓 (𝐼) è un intervallo.

Dimostrazione. Senza perdita di generalità possiamo supporre che 𝑓 sia crescente.


Dimostriamo innanzitutto che se 𝑓 (𝐼) è intervallo allora 𝑓 è continua.
Prendiamo un punto 𝑥 0 ∈ 𝐼 e sia 𝜀 > 0. Vogliamo trovare 𝑥 1 < 𝑥 0 tale che per
ogni 𝑥 ∈ [𝑥 1 , 𝑥 0 ] ∩ 𝐼 si abbia 𝑓 (𝑥) > 𝑓 (𝑥 0 ) − 𝜀. Siccome 𝑓 (𝐼) è un intervallo
che contiene il punto 𝑓 (𝑥 0 ) ci sono due possibilità: o 𝑓 (𝑥) > 𝑓 (𝑥 0 ) − 𝜀 per ogni
𝑥 ∈ 𝐼 e quindi possiamo scegliere 𝑥1 < 𝑥0 a piacere oppure esiste 𝑥1 ∈ 𝐼 tale
che 𝑓 (𝑥 1 ) = 𝑓 (𝑥 0 ) − 2𝜀 . In questo secondo caso dovrà essere 𝑥 1 < 𝑥 0 (in quanto
𝑓 è crescente) e per monotonia si avrà, come voluto 𝑓 (𝑥) ≥ 𝑓 (𝑥1 ) > 𝑓 (𝑥0 ) − 𝜀
per ogni 𝑥 ∈ [𝑥 1 , 𝑥 0 ].
In modo analogo possiamo trovare 𝑥 2 > 𝑥 0 tale che per ogni 𝑥 ∈ [𝑥 0 , 𝑥 2 ] ∩ 𝐼
si abbia 𝑓 (𝑥) < 𝑓 (𝑥 0 ) + 𝜀. Essendo 𝑓 crescente se 𝑥 ≥ 𝑥 0 si avrà anche
2.1 funzioni continue 71

𝑓 (𝑥) ≥ 𝑓 (𝑥0 ) e se 𝑥 ≤ 𝑥0 si avrà 𝑓 (𝑥) ≤ 𝑓 (𝑥0 ). Dunque per ogni 𝑥 ∈ [𝑥 1 , 𝑥2 ]


si avrà | 𝑓 (𝑥) − 𝑓 (𝑥 0 )| < 𝜀. Basterà scegliere 𝛿 = min {𝑥 0 − 𝑥 1 , 𝑥 2 − 𝑥 0 } per
ottenere la continuità di 𝑓 in 𝑥 0 .

Supponiamo ora che 𝑓 sia una funzione continua e crescente. Vogliamo


dimostrare che 𝑓 (𝐼) è un intervallo.

Siano 𝑦1 , 𝑦2 ∈ 𝑓 (𝐼) e sia 𝑦0 ∈ ℝ con 𝑦1 < 𝑦0 < 𝑦2 . Vogliamo dimostrare che


𝑦0 ∈ 𝑓 (𝐼) cioè che esiste 𝑥 0 ∈ 𝐼 tale che 𝑓 (𝑥0 ) = 𝑦0 . Sappiamo che esistono 𝑥 1 , 𝑥2
in 𝐼 tali che 𝑓 (𝑥 1 ) = 𝑦1 e 𝑓 (𝑥 2 ) = 𝑦2 . Dovrà essere 𝑥 1 < 𝑥 2 perché 𝑓 (𝑥 1 ) < 𝑓 (𝑥 2 )
e 𝑓 è strettamente crescente. Definiamo:

𝑥0 = sup 𝐴 con 𝐴 = {𝑥 ∈ 𝐼 : 𝑓 (𝑥) < 𝑦0 },

e dimostriamo che 𝑓 (𝑥 0 ) = 𝑦0 . Chiaramente 𝑥 0 ∈ [𝑥 1 , 𝑥 2 ] in quanto 𝑥 1 ∈ 𝐴 e 𝑥 2


è un maggiorante di 𝐴 e dunque 𝑓 è definita e continua in 𝑥 0 .

Se fosse 𝑓 (𝑥 0 ) < 𝑦0 scelto 𝜀 = 𝑦0 − 𝑓 (𝑥 0 ) per la definizione di continuità dovrebbe


esistere 𝛿 > 0 tale che per ogni 𝑥 ∈ 𝐼 con |𝑥 − 𝑥 0 | < 𝛿 si abbia | 𝑓 (𝑥) − 𝑓 (𝑥 0 )| < 𝜀.
In particolare scelto 𝑥 = 𝑥 0 + 𝛿2 si avrebbe 𝑓 (𝑥) < 𝑓 (𝑥 0 ) + 𝜀 = 𝑦0 . Ma allora
avremmo 𝑥 ∈ 𝐴 che è assurdo in quanto sup 𝐴 = 𝑥 0 < 𝑥 .

Se fosse invece 𝑓 (𝑥 0 ) > 𝑦0 posto 𝜀 = 𝑓 (𝑥 0 ) − 𝑦0 , grazie alla continuità di 𝑓 in


𝑥0 , possiamo trovare 𝛿 > 0 tale che per ogni 𝑥 ∈ 𝐼 con |𝑥 − 𝑥0 | < 𝛿 si abbia
| 𝑓 (𝑥) − 𝑓 (𝑥0 )| < 𝜀. In particolare scelto 𝑡 = 𝑥 0 − 𝛿2 si ha 𝑓 (𝑡) > 𝑓 (𝑥 0 ) − 𝜀 = 𝑦0 .
Ma essendo 𝑡 < 𝑥 0 = sup 𝐴 sappiamo che 𝑡 non può essere un maggiorante di 𝐴
dunque deve esistere 𝑥 ∈ 𝐴 tale che 𝑡 < 𝑥 . Ma se 𝑥 ∈ 𝐴 allora 𝑓 (𝑥) < 𝑦0 < 𝑓 (𝑡)
che è assurdo in quanto 𝑓 è crescente.

Abbiamo quindi mostrato che 𝑓 (𝑥 0 ) = 𝑦0 e dunque che 𝑓 (𝐼) è un intervallo.

Il teorema 2.8 precedente ci permette di affermare che per 𝑎 > 0, 𝑎 ≠ 1 le funzioni


exp 𝑎 e log 𝑎 sono continue. Infatti tali funzioni sono bigezioni monotone tra gli
intervalli ℝ e ℝ+ .

Grazie al teorema 2.6 sappiamo che se 𝑛 ∈ ℕ la funzione 𝑥 𝑛 è continua su tutto



il suo dominio ℝ. La funzione inversa 𝑛 𝑥 è anch’essa crescente e bigettiva
come funzione [0 , +∞) → [0 , +∞) e dunque anch’essa risulta essere continua.

Per simmetria (si veda l’esercizio 2.9) possiamo concludere che le radici 𝑛 𝑥
sono funzioni continue su tutto il loro dominio. Anche la funzione 𝑓 (𝑥) = 𝑥 𝛼 ,
1
𝑓 : [0 , +∞) → [0 , +∞] con 𝛼 > 0 è crescente ed è invertibile (l’inversa è 𝑥 𝛼 )
e dunque è surgettiva e continua. Se 𝛼 < 0 la funzione 𝑓 (𝑥) = 𝑥 𝛼 è definita
sull’intervallo (0 , +∞) ed è anch’essa continua in quanto composizione di
funzioni continue: 𝑥 𝛼 = 𝑥 −𝛼
1
.

Esercizio 2.9. Sia 𝑓 : ℝ → ℝ una funzione pari oppure dispari. Se la restrizione di 𝑓


all’intervallo [0 , +∞) è continua allora 𝑓 è continua su tutto ℝ.
72 2 funzioni continue, limiti e successioni

2.2 limite di funzione

Se una funzione 𝑓 non è definita in un punto 𝑥 0 non ha senso chiedersi se in tale


punto è continua. Possiamo però chiederci se è possibile definire la funzione
anche nel punto 𝑥 0 dando un valore opportuno ℓ in modo da rendere 𝑓 continua
in quel punto. Se ciò è possibile diremo che la funzione 𝑓 (𝑥) ha limite ℓ per 𝑥
che tende a 𝑥 0 e scriveremo:

𝑓 (𝑥) → ℓ per 𝑥 → 𝑥 0

(daremo tra poco una definizione con maggiore precisione e generalità).

Ad esempio la funzione 𝑓 (𝑥) = 𝑥𝑥−−11 è una funzione definita per 𝑥 ≠ 1 e coincide,


2

se 𝑥 ≠ 1 con la funzione lineare 𝑓˜(𝑥) = 𝑥 + 1 definita su tutto ℝ. Visto che 𝑓˜ è


continua e 𝑓˜(1) = 2 scriveremo:

𝑥2 − 1
→2 per 𝑥 → 1.
𝑥−1

Se estendiamo 𝑓 con un valore ℓ nel punto 𝑥 0 otteniamo in generale la funzione


(
𝑓 (𝑥) se 𝑥 ≠ 𝑥0
𝑓˜(𝑥) =
ℓ se 𝑥 = 𝑥 0

e la continuità di 𝑓˜ nel punto 𝑥 0 si scrive così:



∀𝜀 > 0 : ∃𝛿 > 0 : |𝑥 − 𝑥0 | < 𝛿 =⇒ 𝑓˜(𝑥) − 𝑓˜(𝑥0 ) < 𝜀.


Osserviamo che se 𝑥 = 𝑥 0 allora ovviamente 𝑓˜(𝑥) − 𝑓˜(𝑥 0 ) = 0 < 𝜀 dunque

possiamo supporre, nella condizione precedente, che sia 𝑥 ≠ 𝑥 0 e dunque
𝑓˜(𝑥) = 𝑓 (𝑥). Inoltre visto che 𝑓˜(𝑥0 ) = ℓ si ottiene la seguente condizione:

∀𝜀 > 0 : ∃𝛿 > 0 : ∀𝑥 ≠ 𝑥0 : |𝑥 − 𝑥0 | < 𝛿 =⇒ 𝑓˜(𝑥) − ℓ < 𝜀. (2.2)

La (2.2) potrebbe dunque essere utilizzata per definire il concetto di limite


𝑓 (𝑥) → ℓ per 𝑥 → 𝑥0 . Sarà però molto utile estendere il concetto di limite
𝑓 (𝑥) → ℓ per 𝑥 → 𝑥0 anche nei casi in cui ℓ e/o 𝑥0 possano essere infiniti (cioè
elementi dei reali estesi ℝ̄).

Per fare ciò osserviamo che se definiamo 𝐵𝜌 (𝑥 0 ) = {𝑥 ∈ ℝ : |𝑥 − 𝑥 0 | < 𝜌} la


condizione (2.2) può essere scritta anche nella forma

∀𝜀 > 0 : ∃𝛿 > 0 : 𝑥 ∈ 𝐵 𝛿 (𝑥0 ) \ {𝑥0 } =⇒ 𝑓˜(𝑥) ∈ 𝐵 𝜀 (ℓ )


la lettera 𝐵 sta per ball in quanto più in
generale (se fossimo in ℝ3 invece che in che a sua volta si può scrivere nella forma:
ℝ) l’insieme dei punti che distano meno
di 𝜌 da un punto fissato è l’interno di
una sfera piena. In geometria una sfera
∀𝜀 > 0 : ∃𝛿 > 0 : 𝑓 (𝐵 𝛿 (𝑥0 ) \ {𝑥 0 }) ⊆ 𝐵 𝜀 (ℓ ).
piena si chiama palla se contiene solo i
punti interni (e non la superficie sferica)
e si chiama disco o palla chiusa se contiene L’idea è che gli insiemi del tipo𝐵𝜌 (𝑥 0 ) rappresentano i punti vicini al punto
anche i punti della superficie.
2.2 limite di funzione 73

𝑥0 . In analogia potremmo pensare che i punti vicini a +∞ siano i punti di una


qualunque semiretta del tipo (𝑀, +∞]. Si dà quindi la seguente.

Definizione 2.10 (intorno). Per 𝑥 ∈ ℝ definiamo la famiglia degli intorni (basilari) intorni
di 𝑥 come l’insieme di tutti gli intervallini aperti, simmetrici, centrati in 𝑥 :

B𝑥 = {(𝑥 − 𝜀, 𝑥 + 𝜀) : 𝜀 > 0}.

Definiamo poi le famiglie degli intorni destri e intorni sinistri di 𝑥 come intorni destri/sinistri

B𝑥 + = {[𝑥, 𝑥 + 𝜀) : 𝜀 > 0}, B𝑥 − = {(𝑥 − 𝜀, 𝑥] : 𝜀 > 0}

e le famiglie degli intorni di +∞ e −∞ come segue

B+∞ = {(𝛼, +∞], : 𝛼 ∈ ℝ}, B−∞ = {[−∞, −𝛽), : 𝛽 ∈ ℝ}.

Per ogni 𝑥 ∈ ℝ̄ = [−∞, +∞] risultano quindi definiti gli intorni B𝑥 e per ogni 𝑥 ∈ ℝ
sono definiti gli intorni B𝑥 + e B𝑥 − .

Osservazione 2.11. Sarebbe possibile definire in maniera analoga gli intorni dei punti
in ℝ𝑛 (per l’analisi di funzioni di più variabili) o in ℂ (per l’analisi complessa). Ma in
questo corso e in questo capitolo in particolare siamo interessati allo studio delle funzioni
di una singola variabile.

Su ℝ c’è una struttura di ordine totale che è utile preservare aggiungendo due punti
all’infinito: +∞ e −∞. Su ℝ𝑛 (e su ℂ, che in questo contesto possiamo identificare con
ℝ2 ) non c’è una struttura d’ordine naturale e quindi usualmente si considera un unico
punto all’infinito ∞ i cui intorni saranno

B∞ = {{𝑥 ∈ ℝ𝑛 : |𝑥| > 𝑅} : 𝑅 > 0}.

Su ℝ𝑛 (e su ℂ) non esiste il concetto di intorno destro e sinistro proprio perché questi


concetti presuppongono un ordinamento.

In certi casi può tornare utile considerare un unico punto all’infinito, denotato con
∞, anche in ℝ (in molti testi tale punto verrebbe denotato con il simbolo ±∞) e si
potrebbero usare le notazioni +∞ = ∞− e −∞ = ∞+ visto che gli intorni di +∞ e −∞
sono in effetti intorni unilaterali del punto all’infinito.

Definizione 2.12 (limite di funzione). Sia 𝐴 ⊆ ℝ e 𝑓 : 𝐴 → ℝ. Sia 𝑥 0 ∈


[−∞, +∞] e sia ℓ ∈ [−∞, +∞]. Allora diremo che la funzione 𝑓 ha limite ℓ per 𝑥 che
tende a 𝑥 0 e scriveremo limite di funzione
𝑓 (𝑥) → ℓ per 𝑥 → 𝑥 0
se per ogni intorno di ℓ esiste un intorno di 𝑥 0 tale che la funzione valutata nell’intorno
di 𝑥 0 , tolto eventualmente 𝑥 0 , assume valori nell’intorno di ℓ :

∀𝑉 ∈ Bℓ : ∃𝑈 ∈ B𝑥0 : 𝑓 (𝑈 \ {𝑥0 }) ⊆ 𝑉. (2.3)

La stessa definizione può essere data restringendosi agli intorni destri/sinistri del
punto 𝑥 0 (nel caso 𝑥 0 ∈ ℝ). Si otterranno quindi le definizioni di limite destro e
limite destro/sinistro
74 2 funzioni continue, limiti e successioni

limite sinistro semplicemente sostituendo B𝑥0+ o B𝑥0− al posto di B𝑥0 nella definizione
precedente. In tal caso scriveremo 𝑓 (𝑥) → ℓ per 𝑥 → 𝑥 0+ per il limite destro e 𝑓 (𝑥) → ℓ
per 𝑥 → 𝑥 0− per il limite sinistro.
Infine anche il risultato del limite può essere ℓ + o ℓ − , in tal caso useremo Bℓ + o Bℓ − al
posto di Bℓ .

Esempio 2.13. Si consideri la funzione segno:



 1 se 𝑥 > 0 ,


sgn(𝑥) = 0 se 𝑥 = 0 ,

 −1 se 𝑥 < 0.


Si può verificare che
sgn(𝑥) → 1 per 𝑥 → 0+
e
sgn(𝑥) → −1 per 𝑥 → 0−

Abbiamo già visto che nel caso in cui 𝑥 0 ∈ ℝ e ℓ ∈ ℝ siano entrambi finiti la
definizione di limite 𝑓 (𝑥) → ℓ per 𝑥 → 𝑥 0 si traduce nella condizione (2.2).
Anche negli altri casi esplicitando le definizioni di intorno si possono ottenere
delle condizioni più esplicite. Ad esempio la condizione 𝑓 (𝑥) → −∞ per
𝑥 → 𝑥0+ si traduce nel modo seguente:

∀𝛽 ∈ ℝ∃𝛿 > 0 : 𝑥0 < 𝑥 < 𝑥0 + 𝛿 =⇒ 𝑓 (𝑥) < −𝛽.

Visto che ci sono cinque diversi casi per il punto 𝑥 0 : 𝑥 0 ∈ ℝ, 𝑥 0+ , 𝑥 0− , +∞, −∞ e


altrettanti casi per ℓ (in effetti anche il risultato del limite può essere destro o
sinistro), si ottengono in tutto 25 diverse definizioni di limite.
In tutte queste definizioni di limite è sottointeso che i punti 𝑥 che vengono presi
in considerazione sono punti del dominio di 𝑓 : 𝐴 ⊆ ℝ → ℝ. Accade allora che
se esiste un intorno 𝑉 ∈ B𝑥0 per cui 𝐴 ∩ 𝑉 \ {𝑥 0 } è vuoto allora la condizione
di limite è vuota ed è quindi sempre verificata qualunque sia il valore di ℓ . E’
quindi inutile fare il limite per 𝑥 → 𝑥 0 se 𝑥 0 non soddisfa la seguente.

Definizione 2.14 (punto di accumulazione). Siano 𝐴 ⊆ ℝ un insieme e 𝑥 0 ∈


[−∞, +∞]. Diremo che 𝑥0 è un punto di accumulazione di 𝐴 se ogni intorno di 𝑥0
punto di accumulazione
contiene punti di 𝐴 diversi da 𝑥 0 , ovvero:

∀𝑈 ∈ B𝑥0 : (𝐴 \ {𝑥}) ∩ 𝑈 ≠ ∅.

Stessa definizione si può dare per 𝑥 0+ e 𝑥 0− utilizzando gli intorni destri/sinistri di 𝑥 0 .

Teorema 2.15 (unicità del limite). Sia 𝐴 ⊆ ℝ, 𝑓 : 𝐴 → ℝ, 𝑥 0 punto di accumula-


zione per 𝐴 e ℓ 1 , ℓ 2 ∈ [−∞, +∞]. Se per 𝑥 → 𝑥 0 si ha

𝑓 (𝑥) → ℓ1 e 𝑓 (𝑥) → ℓ 2

allora ℓ 1 = ℓ 2 .
2.2 limite di funzione 75

Risultato analogo si ha per i limiti destro e sinistro: 𝑥 → 𝑥 0+ , 𝑥 → 𝑥 0− .

Dimostrazione. Supponiamo per assurdo che ℓ 1 ≠ ℓ 2 . Allora esiste un intorno


𝑉1 di ℓ1 ed un intorno 𝑉2 di ℓ2 tali che 𝑉1 ∩ 𝑉2 = ∅ (basta prendere degli intorni
abbastanza piccoli). Ma per le definizioni di limite 𝑓 (𝑥) → ℓ 1 e 𝑓 (𝑥) → ℓ 2
dovranno esistere 𝑈1 e 𝑈2 intorni di 𝑥 0 su cui si ha 𝑓 (𝑈1 ) ⊆ 𝑉1 e 𝑓 (𝑈2 ) ⊆ 𝑉2 .
Ma allora 𝑓 ((𝐴 \ {𝑥 0 }) ∩ 𝑈1 ) ∩ 𝑓 ((𝐴 \ {𝑥 0 }) ∩ 𝑈2 ) ⊆ 𝑉1 ∩ 𝑉2 = ∅... e questo è
assurdo perché certamente 𝑈1 ∩ 𝑈2 contiene punti di 𝐴 diversi da 𝑥 0 in quanto
𝑈1 e 𝑈2 sono uno contenuto nell’altro e 𝑥0 è un punto di accumulazione per
𝐴.

Il teorema precedente garantisce che se 𝑥 0 è un punto di accumulazione del


dominio di 𝑓 allora il limite per 𝑥 → 𝑥 0 se esiste è unico. In tal caso possiamo
dunque dare la seguente.

Definizione 2.16 (operatore di limite). Sia 𝑓 : 𝐴 ⊆ ℝ → ℝ una funzione e 𝑥 0


un punto di accumulazione per 𝐴. Se esiste ℓ ∈ [−∞, +∞] tale che 𝑓 (𝑥) → ℓ per
𝑥 → 𝑥 0 allora poniamo
lim 𝑓 (𝑥) = ℓ .
𝑥→𝑥 0

Lo stesso si può fare per il limite destro 𝑥 → 𝑥 0+ e sinistro 𝑥 → 𝑥 0− .

Abbiamo visto che in un punto di accumulazione se il limite esiste allora è unico.


Sarà però utile osservare che in effetti il limite può non esistere, come si può
verificare con un esempio.

Esempio 2.17 (in generale il limite non esiste). Il limite


𝑥
lim
𝑥→0 |𝑥|
𝑥
non esiste. Osserviamo infatti che la funzione 𝑓 (𝑥) = |𝑥|
vale 1 se 𝑥 > 0 e −1 se 𝑥 < 0.
Dunque se il limite esistesse e fosse ℓ ∈ ℝ̄ scelto 𝜀 = 1 dovrebbe esistere un intervallo
intorno di 0 della forma (−𝛿, 𝛿) tale che | 𝑓 (𝑥) − ℓ | < 1 per ogni 𝑥 in tale intervallo.
In particolare siccome in tale intervallo ci sono sicuramente sia numeri positivi che
negativi si dovrà avere contemporaneamente

| 1 − ℓ | < 1, |−1 − ℓ | < 1

che è impossibile in quanto per disuguaglianza triangolare

2 = | 1 − (−1)| ≤ | 1 − ℓ | + |−1 − ℓ | < 1 + 1 = 2

che è assurdo.

Si noti che nell’esempio precedente il limite per 𝑥 → 0 non esiste ma in realtà


esistono sia il limite per 𝑥 → 0+ (vale 1) che i limite per 𝑥 → 0− (vale 0).
76 2 funzioni continue, limiti e successioni

Possiamo esibire un esempio “patologico” di funzione che non ammette limite


(né da destra né da sinistra) in nessun punto:
(
1 se 𝑥 ∈ ℚ
𝑓 (𝑥) =
0 se 𝑥 ∈ ℝ \ ℚ.

In ogni intervallo (𝑎, 𝑏) con 𝑎 < 𝑏 questa funzione assume sia il valore 0 che
il valore 1 in quanto sia ℚ che ℝ \ ℚ intersecano l’intervallo (sono insiemi
densi). Ma se 𝑓 avesse limite ℓ dovrebbe esistere un intervallo in cui i valori
distano meno di 𝜀 da ℓ e quindi dovrebbe essere | 1 − ℓ | < 𝜀 e | 0 − ℓ | < 𝜀 che è
impossibile se scegliamo 𝜀 < 12 .

Teorema 2.18 (collegamento tra limiti e continuità). Sia 𝐴 ⊆ ℝ, 𝑓 : 𝐴 → ℝ. Se


𝑥0 ∈ 𝐴 è un punto di accumulazione di 𝐴 allora 𝑓 è continua in 𝑥0 se e solo se

lim 𝑓 (𝑥) = 𝑓 (𝑥 0 ).
𝑥→𝑥 0

punto isolato Se 𝑥 0 ∈ 𝐴 non è punto di accumulazione diremo che 𝑥 0 è un punto isolato di 𝐴. In


tal caso la funzione 𝑓 è sempre continua nel punto 𝑥 0 .

Dimostrazione. In base alla definizione 2.1 la funzione 𝑓 è continua nel punto 𝑥 0


se
∀𝜀 > 0 : ∃𝛿 > 0 : ∀𝑥 ∈ 𝐴 : |𝑥 − 𝑥0 | < 𝛿 =⇒ | 𝑓 (𝑥) − 𝑓 (𝑥0 )| < 𝜀
mentre la definizione di limite 𝑓 (𝑥) → 𝑓 (𝑥 0 ) per 𝑥 → 𝑥 0 si espande in

∀𝜀 > 0 : ∃𝛿 > 0 : ∀𝑥 ∈ 𝐴, 𝑥 ≠ 𝑥0 : |𝑥 − 𝑥0 | < 𝛿 =⇒ | 𝑓 (𝑥) − 𝑓 (𝑥0 )| < 𝜀.

L’unica differenza è che nella definizione di limite c’è la condizione 𝑥 ≠ 𝑥 0 . Ma


visto che per 𝑥 = 𝑥 0 si ha | 𝑓 (𝑥) − 𝑓 (𝑥 0 )| = 0 tale condizione è in questo caso
inutile e quindi le due definizioni sono equivalenti.

Se il punto 𝑥 0 è isolato la definizione di continuità è sempre verificata in quanto


esiste un 𝛿 > 0 tale che il punto 𝑥 = 𝑥 0 è l’unico punto di 𝐴 nell’intorno
(𝑥0 − 𝛿, 𝑥0 + 𝛿).

Esempio 2.19. Non è difficile convincersi che gli unici punti di accumulazione per
l’insieme ℤ sono +∞ e −∞. Dunque qualunque funzione 𝑓 : ℤ → ℝ è continua in
quanto tutti i punti del suo dominio sono punti isolati.

Teorema 2.20 (località del limite). Il limite di una funzione per 𝑥 → 𝑥 0 dipende
solamente dai valori di 𝑓 in un intorno di 𝑥 0 e non dipende dal valore di 𝑓 in 𝑥 0 .

Più precisamente: se 𝐴, 𝐵 ⊆ ℝ, 𝑥 0 ∈ ℝ sono tali che esiste un intorno 𝑉 di 𝑥 0 per cui


(𝐴 \ {𝑥0 }) ∩ 𝑉 = (𝐵 \ {𝑥0 }) ∩ 𝑉 e 𝑓 (𝑥) = 𝑔(𝑥) per ogni 𝑥 ∈ (𝐴 \ {𝑥 0 }) ∩ 𝑉 allora
se 𝑓 (𝑥) → ℓ per 𝑥 → 𝑥 0 anche 𝑔(𝑥) → ℓ per 𝑥 → 𝑥 0 .

Dimostrazione. Basta osservare che nella definizione di limite non è restrittivo


supporre che l’intorno del punto 𝑥 0 sia sempre preso all’interno dell’intorno 𝑉
su cui le due funzioni coincidono.
2.2 limite di funzione 77

Teorema 2.21 (restrizione del limite). Se una funzione ha limite ℓ per 𝑥 → 𝑥 0 e se


restringiamo l’insieme di definizione della funzione allora il limite della funzione non
cambia. Più precisamente se 𝑓 : 𝐴 → ℝ è una funzione tale che 𝑓 (𝑥) → ℓ per 𝑥 → 𝑥 0
e se 𝐵 ⊆ 𝐴 e 𝑔 : 𝐵 → ℝ è la restrizione di 𝑓 a 𝐵 allora anche 𝑔(𝑥) → ℓ per 𝑥 → 𝑥 0 .

Dimostrazione. Il teorema segue immediatamente dalla definizione di limite se


si osserva che restringendo il dominio la condizione di validità del limite si
indebolisce in quanto gli intorni di 𝑥 0 vengono intersecati con il dominio della
funzione.

Si osservi che a differenza del teorema sulla località del limite è possibile che
la funzione ristretta 𝑔 abbia limite quando la funzione 𝑓 non aveva limite. Si
osservi anche che in entrambi questi teoremi sarà opportuno che 𝑥 0 sia un punto
di accumulazione, altrimenti la condizione 𝑓 (𝑥) → ℓ risulta essere vuota.

Teorema 2.22 (legame tra limite, limite destro e limite sinistro). Sia 𝐴 ⊆ ℝ,
𝑓 : 𝐴 → ℝ una funzione e 𝑥0 un punto di accumulazione di 𝐴. Sia 𝐴+ = 𝐴∩[𝑥 0 , +∞)
e 𝐴− = 𝐴 ∩ (−∞, 𝑥 0 ].

Se 𝑥 0 è punto di accumulazione sia di 𝐴+ che di 𝐴− allora si ha

lim 𝑓 (𝑥) = ℓ
𝑥→𝑥0

se e solo se
lim 𝑓 (𝑥) = lim− 𝑓 (𝑥) = ℓ .
𝑥→𝑥 0+ 𝑥→𝑥0

Se 𝑥 0 è punto di accumulazione di 𝐴+ ma non di 𝐴− allora i limiti

lim 𝑓 (𝑥) e lim 𝑓 (𝑥)


𝑥→𝑥 0 𝑥→𝑥 0+

sono equivalenti. Analogamente se 𝑥 0 è punto di accumulazione di 𝐴− ma non di 𝐴+


risultano equivalenti
lim 𝑓 (𝑥) e lim− 𝑓 (𝑥).
𝑥→𝑥0 𝑥→𝑥0

Dimostrazione. Si tratta semplicemente di verificare le definizioni di limite


sfruttando il fatto che intorni di un punto 𝑥 0 sono formati dall’unione di intorno
destro e intorno sinistro.

Teorema 2.23 (limite della funzione composta/cambio di variabile). Siano


𝐴 ⊆ ℝ, 𝐵 ⊆ ℝ, 𝑥 0 un punto di accumulazione di 𝐴, 𝑦0 un punto di accumulazione
di 𝐵, ℓ ∈ [−∞, +∞]. Siano 𝑓 : 𝐴 → 𝐵, 𝑔 : 𝐵 → ℝ funzioni tali che 𝑓 (𝑥) ≠ 𝑦0 se
𝑥 ≠ 𝑥0 e
lim 𝑓 (𝑥) = 𝑦0 , lim 𝑔(𝑦) = ℓ .
𝑥→𝑥0 𝑦→𝑦0

Allora nel secondo limite si può porre 𝑦 = 𝑓 (𝑥) e al posto di 𝑦 → 𝑦0 si può mettere
𝑥 → 𝑥 0 (in quanto il primo limite ci dice che se 𝑥 → 𝑥0 allora 𝑦 → 𝑦0 ) e dunque vale:

lim 𝑔( 𝑓 (𝑥)) = ℓ .
𝑥→𝑥0
78 2 funzioni continue, limiti e successioni

Dimostrazione. Visto che 𝑔(𝑦) → ℓ per ogni 𝑈 intorno di ℓ deve esistere un 𝑉


intorno di 𝑦0 tale che 𝑔((𝐵 \ {𝑦0 }) ∩ 𝑉) ⊆ 𝑈 e visto che 𝑓 (𝑥) → 𝑦0 deve esistere
un intorno 𝑊 di 𝑥 0 tale che 𝑓 ((𝐴 \ {𝑥 0 }) ∩ 𝑊) ⊆ 𝑉 . Ma visto che per ipotesi
𝑓 assume valori in 𝐵 \ {𝑦0 } si ha anche 𝑓 ((𝐴 \ {𝑥0 }) ∩ 𝑊) ⊆ (𝐵 \ {𝑦0 }) ∩ 𝑉 e
quindi
𝑔( 𝑓 ((𝐴 \ {𝑥0 }) ∩ 𝑊)) ⊆ 𝑔((𝐵 \ {𝑦0 }) ∩ 𝑉) ⊆ 𝑈
che significa che 𝑔( 𝑓 (𝑥)) → ℓ .

Esercizio 2.24. Si faccia un esempio di una funzione 𝑓 : ℝ → ℝ e una funzione


𝑔 : ℝ → ℝ tali che
lim 𝑓 (𝑥) = 0 , lim 𝑔(𝑥) = 0
𝑥→0 𝑥→0
ma
lim 𝑔( 𝑓 (𝑥)) = 1.
𝑥→0

Quale ipotesi nel teorema precedente viene a mancare?

Teorema 2.25 (limite di funzioni monotòne). Sia 𝑓 : 𝐴 ⊆ ℝ → ℝ una funzione


crescente. Se 𝑥 0 è un punto di accumulazione sinistro per 𝐴 il seguente limite esiste e
vale
lim− 𝑓 (𝑥) = sup 𝑓 ({𝑥 ∈ 𝐴 : 𝑥 < 𝑥 0 })
𝑥→𝑥0

e se 𝑥 0 è un punto di accumulazione destro per 𝐴 il seguente limite esiste e vale

lim 𝑓 (𝑥) = inf 𝑓 ({𝑥 ∈ 𝐴 : 𝑥 > 𝑥 0 }).


𝑥→𝑥 0+

In particolare se +∞ è punto di accumulazione per 𝐴 si ha

lim 𝑓 (𝑥) = sup 𝑓 (𝐴)


𝑥→+∞

e se −∞ è punto di accumulazione per 𝐴 si ha

lim 𝑓 (𝑥) = inf 𝑓 (𝐴).


𝑥→−∞

Gli stessi risultati valgono per le funzioni decrescenti, scambiando sup e inf.

Dimostrazione. Supponiamo che 𝑓 sia crescente e consideriamo il limite sinistro


𝑥 → 𝑥 0− . Può anche essere 𝑥0 = +∞, in tal caso il limite sinistro 𝑥 → 𝑥0−
equivale a 𝑥 → +∞. Poniamo 𝐵 = {𝑥 ∈ 𝐴 : 𝑥 < 𝑥 0 } ℓ = sup 𝐵 e ricordiamo le
proprietà che caratterizzano l’estremo superiore (sappiamo che 𝐵 non è vuoto
in quanto 𝑥 0− per ipotesi è un punto di accumulazione per 𝐴):

∀𝑥 ∈ 𝐵 : 𝑓 (𝑥) ≤ ℓ
∀𝑦 < ℓ : ∃𝛼 ∈ 𝐵 : 𝑓 (𝛼) > 𝑦.

Siccome 𝑓 è crescente, dalla seconda condizione si ottiene che per ogni 𝑥 > 𝛼
si ha 𝑓 (𝑥) ≥ 𝑓 (𝛼) > 𝑦 e mettendo insieme le due condizioni si ottiene che per
ogni 𝑦 < ℓ esiste 𝛼 ∈ ℝ tale che per ogni 𝑥 > 𝛼 si ha 𝑦 < 𝑓 (𝑥) ≤ ℓ . Certamente
2.2 limite di funzione 79

si ha 𝛼 < 𝑥 0 perché 𝛼 ∈ 𝐵. Dunque la condizione 𝑥 > 𝛼 identifica un intorno


sinistro del punto 𝑥 0 e si ha dunque 𝑓 (𝑥) → ℓ per 𝑥 → 𝑥 0− .
Ragionamento analogo si può fare per il limite destro e per le funzioni decrescenti.

Esercizio 2.26. Utilizzando il teorema precedente si studino le discontinuità delle


funzioni monotone. Si dimostri quindi che l’insieme dei punti in cui una funzione
monotona non è continua può essere messo in corrispondenza biunivoca con un
sottoinsieme di ℚ e dunque tale insieme è numerabile.

Il teorema precedente si applica in particolare alle funzioni esponenziali, potenze,


radici e logaritmi negli estremi dei loro domini. Ad esempio è chiaro che se
𝑥0 ∈ (0 , +∞) si ha
lim log 𝑎 𝑥 = log 𝑎 𝑥 0
𝑥→𝑥 0

in quanto il logaritmo è una funzione continua. Se 𝑎 > 1 il logaritmo è crescente


e la sua immagine è tutto ℝ dunque si ha

lim log 𝑎 𝑥 = inf ℝ = −∞ lim log 𝑎 𝑥 = sup ℝ = +∞.


𝑥→0+ 𝑥→+∞

Per l’esponenziale avremo


lim 𝑎 𝑥 = 𝑎 𝑥0
𝑥→𝑥0

se 𝑥 0 ∈ ℝ per continuità. Se 𝑎 > 1 l’esponenziale è crescente ed ha immagine


(0 , +∞) dunque
lim 𝑎 𝑥 = 0 , lim 𝑎 𝑥 = +∞.
𝑥→−∞ 𝑥→+∞

Se 0 < 𝑎 < 1 i limiti all’infinito si scambiano in quanto 𝑎 𝑥 = 1


𝑎 −𝑥 . Per le potenze
avremo, se 𝑥 0 ∈ [0 , +∞) e 𝛼 > 0

lim 𝑥 𝛼 = 𝑥 0𝛼
𝑥→𝑥 0

per continuità. Invece essendo 𝑥 𝛼 crescente e bigettiva su [0 , +∞) si avrà

lim 𝑥 𝛼 = +∞.
𝑥→+∞

Se 𝛼 < 0 la funzione 𝑥 𝛼 è continua, decrescente e bigettiva su (0 , +∞) e dunque


in tal caso:
lim 𝑥 𝛼 = 0.
𝑥→+∞

Tutti questi limiti notevoli possono essere facilmente ricordati se teniamo in


mente i grafici delle funzioni elementari Figura 1.4 e 1.5.
Anche la funzione valore assoluto 𝑓 (𝑥)|𝑥| è separatamente monotona sugli
intervalli [0 , +∞) e (−∞, 0]. Dunque sappiamo che

lim |𝑥| = |+∞| = +∞, lim |𝑥| = |−∞| = +∞.


𝑥→+∞ 𝑥→−∞

Se 𝑥 0 ∈ ℝ ovviamente si ha pure

lim |𝑥 0 | = |𝑥 0 |
𝑥→𝑥 0
80 2 funzioni continue, limiti e successioni

in quanto è banale verificare che la funzione |𝑥| è continua.

Ci sarà anche utile osservare che vale anche questa proprietà

lim | 𝑓 (𝑥)| = 0 ⇐⇒ lim 𝑓 (𝑥) = 0


𝑥→𝑥 0 𝑥→𝑥 0

in quanto le definizioni di limite 𝑓 (𝑥) → 0 e | 𝑓 (𝑥)| → 0 coincidono in quanto


| 𝑓 (𝑥) − 0 | = | 𝑓 (𝑥)| − 0 .
permanenza del segno
Teorema 2.27 (permanenza del segno). Se

lim 𝑓 (𝑥) > 0


𝑥→𝑥0

allora esiste un intorno 𝑈 di 𝑥 0 tale che per ogni 𝑥 ∈ 𝑈 si ha 𝑓 (𝑥) > 0.

Dimostrazione. Sia ℓ ∈ [−∞, +∞] il valore del limite. Se ℓ > 0 esiste certamente
un intorno 𝑈 di ℓ tale che 𝑈 ⊆ (0 , +∞] (se ℓ ∈ ℝ basta prendere (ℓ /2 , 3ℓ /2), se
ℓ = +∞ basta prendere (1, +∞]). Per la definizione di limite esiste 𝑈 intorno di
𝑥0 tale che 𝑓 (𝑈) ⊆ 𝑉 e il risultato segue.

Teorema 2.28 (operazioni con i limiti di funzione). Se

lim 𝑓 (𝑥) = ℓ 1 , lim 𝑔(𝑥) = ℓ 2


𝑥→𝑥0 𝑥→𝑥0

allora si ha

lim ( 𝑓 (𝑥) + 𝑔(𝑥)) = ℓ 1 + ℓ 2 , lim ( 𝑓 (𝑥) − 𝑔(𝑥)) = ℓ 1 − ℓ 2 ,


𝑥→𝑥0 𝑥→𝑥 0
𝑓 (𝑥) ℓ1
lim 𝑓 (𝑥) · 𝑔(𝑥) = ℓ 1 · ℓ 2 , lim =
Si veda la sezione 1.22. I casi in cui le
𝑥→𝑥 0 𝑥→𝑥0 𝑔(𝑥) ℓ2
operazioni non sono definite si chiamano
usualmente forme indeterminate e sono: sempre che le operazioni utilizzate sul lato destro delle uguaglianze siano state definite.
+∞ − (+∞), −∞ − (−∞), +∞ + (−∞), Inoltre se 𝑔(𝑥) → 0+ si ha
−∞ + (+∞), 0 · (+∞), +∞ · 0 0 · (−∞), 1
−∞ · 0, 00 , +∞ −∞ +∞ −∞ lim = +∞
+∞ , −∞ , −∞ , +∞ . 𝑥→𝑥0 𝑔(𝑥)

1
(moralmente 0+ = +∞).

Dimostrazione. Consideriamo la somma dei limiti e innanzitutto il caso in cui ℓ 1


ed ℓ 2 siano entrambi finiti. In tal caso dato un qualunque intorno 𝑈 = (ℓ −𝜀, ℓ +𝜀)
se prendiamo gli intorni 𝑈1 = (ℓ 1 − 𝜀/2 , ℓ 1 + 𝜀/2) e 𝑈2 = (ℓ 2 − 𝜀/2 , ℓ 2 + 𝜀/2) si
possono trovare degli intorni 𝑉1 e 𝑉2 di 𝑥 0 per cui si ha 𝑓 (𝑉1 \ {𝑥 0 }) ⊆ 𝑈1 e
𝑓 (𝑉2 \ {𝑥0 }) ⊆ 𝑈2 e a maggior ragione questo risulta se prendiamo 𝑉 = 𝑉1 ∩ 𝑉2
al posto di 𝑉1 e 𝑉2 . Visto che 𝑈1 + 𝑈2 = 𝑈 si avrà allora ( 𝑓 + 𝑔)(𝑉 \ {𝑥 0 }) ⊆ 𝑈 .

Sempre nel caso della somma se ℓ 1 = +∞ e ℓ 2 ≠ −∞ allora ℓ 1 + ℓ 2 = +∞ e


dato un intorno di +∞ della forma 𝑈 = (𝛼, +∞] con 𝛼 > 0 possiamo prendere
𝑈1 = (2 𝛼, +∞) e 𝑈2 = (ℓ2 − 𝛼, ℓ2 + 𝛼) se ℓ2 ∈ ℝ oppure 𝑈2 = (𝛼, +∞) se ℓ2 = +∞.
In ogni caso si ha 𝑈1 + 𝑈2 = 𝑈 e si procede quindi come nel caso precedente. Il
caso ℓ 1 = −∞ si dimostra in maniera del tutto analoga.
2.2 limite di funzione 81

Per la differenza basta osservare che 𝑓 (𝑥) − 𝑔(𝑥) = 𝑓 (𝑥) + (−𝑔(𝑥)). Se ℓ 2 è finito
la continuità della funzione ℎ(𝑦) = −𝑦 ci garantisce che −𝑔(𝑥) → −ℓ 2 . Lo stesso
si verifica facilmente quando ℓ 2 è infinito (basta osservare che se 𝑈 = (𝛼, +∞+]
è un intorno di +∞ allora −𝑈 = [−∞, −𝛼) è un intorno di −∞). Dunque il
limite della differenza si riconduce al limite della somma.

Per quanto riguarda il prodotto ci ricordiamo che grazie al teorema 1.54 il


gruppo additivo totalmente ordinato ℝ = (−∞, +∞) è isomorfo al gruppo
moltiplicativo ℝ+ = (0 , +∞) e di conseguenza ℝ̄ = [−∞, +∞] corrisponde a
[0+ , +∞] (l’isomorfismo ℝ+ → ℝ è dato dalla funzione log𝑎 𝑥 con 𝑎 > 1 fissato,
tale funzione preserva gli intorni dei punti corrispondenti salvo il fatto che gli
intorni di −∞ si trasformano in intorni destri di 0).

Dunque se 𝑓 > 0 e 𝑔 > 0 i risultati per il limite del prodotto sono conseguenza
dei risultati analoghi per il limite della somma. Cambiando segno ad una
delle due funzioni o ad entrambe ci si può ricondurre al caso 𝑓 > 0 e 𝑔 > 0
quando le due funzioni assumono un segno costante in almeno un intorno del
punto 𝑥 0 . Per il teorema della permanenza del segno questo è vero se ℓ 1 ≠ 0 e
ℓ2 ≠ 0: il limite del prodotto in questo caso è dunque ℓ 1 · ℓ2 . Se invece ℓ1 = 0
e ℓ 2 ∈ ℝ sappiamo che 𝑓 (𝑥) → 0 è equivalente a | 𝑓 (𝑥)| → 0 dunque in tal
caso si può rimpiazzare 𝑓 (𝑥) con | 𝑓 (𝑥)| ≥ 0 (gli eventuali punti in cui 𝑓 (𝑥) = 0
sono irrilevanti e possono essere tolti dal dominio di 𝑓 per garantire | 𝑓 | > 0) e
ottenere che il limite del prodotto è 0. Lo stesso accade se ℓ 2 = 0 con la funzione
𝑔(𝑥).

Per quanto riguarda il rapporto il teorema 1.54 ci dice che le proprietà additive
dell’opposto diventano (tramite logaritmo) proprietà moltiplicative del reciproco,
almeno se siamo nell’ambito di numeri positivi. Dunque se 𝑓 (𝑥) → ℓ con ℓ > 0
1
allora 𝑓 (𝑥) → ℓ1 . Se ℓ = 0 non possiamo concludere niente in quanto le proprietà
additive a −∞ si rispecchiano nelle proprietà moltiplicative in 0+ , non in 0.
Dunque i risultati sul limite del rapporto discendono dai risultati sul limite del
prodotto con il reciproco.

Se dobbiamo calcolare un limite in cui compare un elevamento a potenza


𝑓 (𝑥) 𝑔(𝑥) con base ed esponente variabile converrà scrivere

𝑓 (𝑥) 𝑔(𝑥) = 𝑎 𝑔(𝑥)·log𝑎 𝑓 (𝑥)

per poter applicare il teorema precedente al prodotto 𝑔(𝑥) · log 𝑎 𝑓 (𝑥).

Esempio 2.29. Si calcoli


2 + 𝑥2 − 𝑥3
lim .
𝑥→+∞ (𝑥 2 − 𝑥 + 2)2

Svolgimento. Per 𝑥 → +∞ per il teorema sul limite del prodotto sappiamo che
𝑥 2 → +∞ e 𝑥 3 → +∞. Per il teorema sulla somma dei limiti sappiamo che
2 + 𝑥 2 → +∞ ma a priori non possiamo applicare tale teorema al limite di
(2 + 𝑥 2 ) − 𝑥 3 in quanto (+∞) − (+∞) è una forma indeterminata (non rientra
nelle ipotesi di quel teorema). Bisogna allora intuire che le potenze di 𝑥 con
esponente maggiore sono preponderanti e vanno quindi messe in evidenza
82 2 funzioni continue, limiti e successioni

tramite manipolazioni algebriche. L’espressione di cui vogliamo calcolare il


limite si può quindi riscrivere in questo modo:
 
2 + 𝑥2 − 𝑥3 𝑥3 2
𝑥3
+ 1
𝑥 −1 1
2
+ 1
−1
𝑥3 𝑥
(𝑥 2 − 𝑥 + 2)2
=  2 = 𝑥 ·  2 .
𝑥4 1 − 1
𝑥 + 2
𝑥2
1− 1
𝑥 + 2
𝑥2

A questo punto l’espressione non presenta più forme indeterminate. Applicando


i teoremi precedenti possiamo allora affermare che si ha

2 1 2 1
1 + 𝑥 −1 1 (+∞)3
+ +∞ −1
𝑥3
lim ·  2 = +∞ · 
𝑥→+∞ 𝑥  1 2 1 2
2
1− 𝑥 + 𝑥2
1− +∞ + (+∞)2
0+0−1
=0· = 0 · (−1) = 0.
(1 − 0 + 0)2

L’aver definito le operazioni sulle quantità infinite risulta in effetti comodo nello
svolgimento dei limiti. Bisogna però essere consapevoli che ℝ̄ non è un campo
e quindi le operazioni con i simboli +∞ e −∞ non rispettano molte delle regole
che siamo abituati ad avere sui numeri finiti. Sarà quindi opportuno ricondursi
immediatamente ad una espressione che abbia senso in ℝ, sulla quale potremo
applicare le manipolazioni algebriche con più tranquillità. Per questo motivo in
molti testi l’espressione intermedia in cui compaiono le operazioni eseguite sulle
quantità +∞ e −∞ non è ritenuta valida e si preferisce scrivere direttamente il
risultato.

Esempio 2.30. Si calcoli il seguente limite nel campo complesso:


 
1 1
lim − 2 .
𝑧→0 𝑧 𝑧 −𝑧

Dimostrazione. Anche in questo caso non possiamo applicare direttamente le


regole di calcolo del limite in quanto otterremmo la forma indeterminata ∞ − ∞.
Possiamo però operare una semplice manipolazione algebrica per eliminare
l’indeterminazione:
1 1 𝑧−1−1 𝑧−2 0−2 −2
− 2 = 2 = 2 → 2 = =∞ per 𝑧 → 0.
𝑧 𝑧 −𝑧 𝑧 −𝑧 𝑧 −𝑧 0 −0 0

2.3 proprietà frequenti e definitive

Definizione 2.31 (proprietà frequenti e definitive). Diremo che un predicato 𝑃(𝑥)


definito su un insieme 𝐴 ⊆ ℝ di cui 𝑥 0 è punto di accumulazione vale definitivamente
definitivamente
per 𝑥 → 𝑥 0 se vale in un intorno di 𝑥 0 ovvero:

∃𝑈 ∈ B𝑥0 : ∀𝑥 ∈ 𝐴 ∩ 𝑈 \ {𝑥0 } : 𝑃(𝑥).


2.4 criteri di confronto 83

Diremo che 𝑃(𝑥) vale frequentemente per 𝑥 → 𝑥 0 se in ogni intorno di 𝑥 0 c’è almeno frequentemente
un punto 𝑥 ≠ 𝑥 0 in cui vale:

∀𝑈 ∈ B𝑥0 : ∃𝑥 ∈ 𝐴 ∩ 𝑈 \ {𝑥0 } : 𝑃(𝑥).

Chiaramente se una proprietà vale definitivamente vale anche frequentemente


infatti se c’è un intorno 𝑈 su cui vale la proprietà per ogni altro intorno 𝑉 la
proprietà risulta valida su 𝑈 ∩ 𝑉 che non è mai vuoto. Se una proprietà vale
frequentemente significa in particolare che vale per infiniti valori diversi in
quanto se vale in punto 𝑥 ≠ 𝑥 0 posso sempre trovare un intorno 𝑉 di 𝑥 0 che
non contiene 𝑥 e in tale intorno trovo un ulteriore punto in cui vale la proprietà.
Iterando il procedimento posso trovare infiniti punti diversi su cui la proprietà
è valida.

Le due proprietà sono complementari nel senso che vale in base alle proprietà
dei quantificatori universali vale la seguente relazione:

non frequentemente 𝑃(𝑥) ⇐⇒ definitivamente non 𝑃(𝑥)

Se due proprietà 𝑃(𝑥) e 𝑄(𝑥) valgono definitivamente allora anche 𝑃(𝑥) ∧ 𝑄(𝑥)
vale definitivamente. Se invece valgono entrambe frequentemente allora anche
𝑃(𝑥) ∨ 𝑄(𝑥) vale frequentemente.

Esempio 2.32. La proprietà 𝑥 3 − 𝑥 > 1000 𝑥 2 + 1 vale definitivamente per 𝑥 → +∞.


La proprietà 𝑥 > 0 vale frequentemente per 𝑥 → 0.

La definizione di limite 𝑓 (𝑥) → ℓ per 𝑥 → 𝑥 0 potrebbe quindi enunciarsi così:


per ogni intorno 𝑈 di ℓ si ha 𝑓 (𝑥) ∈ 𝑈 definitivamente. E la sua negazione è:
esiste un intorno 𝑈 di ℓ per cui frequentemente 𝑓 (𝑥) ∉ 𝑈 .

Non è possibile fare confronti tra va-


2.4 criteri di confronto lori complessi, visto che sui numeri
complessi non abbiamo un ordinamento

Teorema 2.33 (criteri di confronto). Siano 𝑓 , 𝑔 , ℎ tre funzioni reali definite su uno confronto tra limiti
stesso dominio 𝐴 ⊆ ℝ con punto di accumulazione 𝑥 0

1. Se per ogni 𝑥 ∈ 𝐴 si ha
𝑓 (𝑥) ≤ 𝑔(𝑥)
e se entrambe le funzioni ammettono limite: 𝑓 (𝑥) → ℓ 1 e 𝑔(𝑥) → ℓ 2 per 𝑥 → 𝑥 0
allora
ℓ1 ≤ ℓ2 .
2. Se per ogni 𝑥 ∈ 𝐴 si ha:
𝑓 (𝑥) ≤ 𝑔(𝑥) teorema dei carabinieri
e se 𝑓 (𝑥) → +∞ allora anche 𝑔(𝑥) → +∞ per 𝑥 → 𝑥 0 . Viceversa se
𝑓 (𝑥) ≤ 𝑔(𝑥) e 𝑔(𝑥) → −∞ allora anche 𝑓 (𝑥) → −∞.
84 2 funzioni continue, limiti e successioni

3. (teorema dei carabinieri) Se per ogni 𝑥 ∈ 𝐴 vale

𝑓 (𝑥) ≤ ℎ(𝑥) ≤ 𝑔(𝑥)

e se le due funzioni 𝑓 e 𝑔 hanno lo stesso limite: 𝑓 (𝑥) → ℓ e 𝑔(𝑥) → ℓ per


𝑥 → 𝑥0 allora anche ℎ(𝑥) → ℓ .

Dimostrazione. 1. Se per assurdo fosse ℓ 1 > ℓ 2 la funzione 𝑓 (𝑥)− 𝑔(𝑥) avrebbe


limite positivo e per il teorema della permanenza del segno dovrebbe
essere definitivamente positiva. Ma questo contraddice l’ipotesi 𝑓 (𝑥) −
𝑔(𝑥) ≤ 0.
2. Se non fosse 𝑔(𝑥) → +∞ significa che esiste 𝛼 ∈ ℝ tale che 𝑔(𝑥) < 𝛼
frequentemente. Ma visto che definitivamente 𝑓 (𝑥) > 𝛼 troviamo che
frequentemente si ha 𝑓 (𝑥) > 𝑔(𝑥) in contrasto con l’ipotesi 𝑓 (𝑥) ≤ 𝑔(𝑥).
3. Se 𝑓 e 𝑔 hanno lo stesso limite ℓ significa che per ogni 𝑈 intorno di ℓ si ha
definitivamente 𝑓 (𝑥) ∈ 𝑈 e 𝑔(𝑥) ∈ 𝑈 . Visto che 𝑈 è un intervallo anche
ℎ(𝑥) è definitivamente in 𝑈 e quindi ℎ(𝑥) → ℓ .

Esempio 2.34. Dimostrare che

lim (2 𝑥 − b𝑥c) = +∞.


𝑥→+∞

Sappiamo che b𝑥 b≤ 𝑥 dunque

2 𝑥 − b𝑥c ≥ 2 𝑥 − 𝑥 = 𝑥 → +∞.

Dunque per confronto si ottiene il risultato richiesto.

Corollario 2.35 (limitata per infinitesima). Se 𝑓 (𝑥) è una funzione limitata e


𝑔(𝑥) → 0 per 𝑥 → 𝑥0 allora anche

𝑓 (𝑥) · 𝑔(𝑥) → 0 per 𝑥 → 𝑥 − 0.

Dimostrazione. Se 𝑓 è limitata significa che esiste 𝑅 > 0 tale che | 𝑓 (𝑥)| ≤ 𝑅 per
ogni 𝑥 nel dominio di 𝑓 . Ma allora

0 ≤ | 𝑓 (𝑥) · 𝑔(𝑥)| = | 𝑓 (𝑥)| · | 𝑔(𝑥)| ≤ 𝑅| 𝑔(𝑥)| → 𝑅 · 0 = 0.


successione
Utilizziamo il grassetto per evidenziare Per confronto deduciamo che | 𝑓 (𝑥) · 𝑔(𝑥)| → 0 che è equivalente alla tesi.
il fatto che 𝒂 non è un numero ma una
lista (o vettore) di numeri. Nella scrittura
a mano non è possibile usare il grassetto,
ma potremmo sottolineare il nome della Esercizio 2.36. Mostrare che
variabile scrivendo 𝑎 invece che 𝒂 . In

alternativa si potrebbe scrivere 𝑎 oppure 𝑥 − b𝑥c
lim = 0.
evitare qualunque distinzione e scrivere 𝑥→+∞ 𝑥
più semplicemente 𝑎 .
2.5 successioni 85

2.5 successioni

Una successione in un insieme 𝑋 è una funzione 𝒂 : ℕ → 𝑋 . L’insieme delle


funzioni ℕ → 𝑋 viene usualmente indicato con 𝑋 ℕ e potremmo dunque
scrivere 𝒂 ∈ 𝑋 ℕ . In effetti una successione 𝒂 può essere interpretata come una
sequenza infinita di elementi di 𝑋 :

𝒂 = (𝑎 0 , 𝑎1 , 𝑎2 , . . . , 𝑎 𝑛 , . . . )

dove si intende
𝑎 𝑛 = 𝒂(𝑛).
Le componenti 𝑎 𝑛 si chiamano termini della successione. I numeri 𝑛 si chiamano,
invece, indici. L’intera successione 𝒂 può essere indicata con (𝑎 𝑛 )∞
𝑛=0 oppure
(𝑎 𝑛 )𝑛 oppure, più semplicemente, con 𝑎 𝑛 quando sia chiaro che si intende
In alcuni testi le successioni vengono
l’intera successione 𝒂 e non un singolo termine della stessa.
indicate con la notazione {𝑎 𝑛 } che però
è fuorviante in quanto una successione in
Per noi il caso più interessante sarà quello delle successioni reali 𝑎 𝑛 ∈ ℝ cioè il 𝑋 non è semplicemente un sottoinsieme
caso 𝑋 = ℝ. Considereremo però anche il caso di successioni complesse 𝑎 𝑛 ∈ ℂ di 𝑋 : l’ordine in cui vengono presi gli
(dunque 𝑋 = ℂ) perché questo potrà essere utile in alcune situazioni. elementi è rilevante.

2.6 limite di successione

Visto che 𝒂 : ℕ → ℝ (o in ℂ) è una funzione con dominio ℕ ⊆ ℝ e visto che +∞


è l’unico punto di accumulazione di ℕ sarà possibile considerare il limite

ℓ = lim 𝒂(𝑛)
𝑛→+∞

che potremmo anche scrivere con una delle seguenti notazioni:

ℓ = lim 𝒂 = lim 𝑎 𝑛 = lim 𝑎 𝑛


𝑛 𝑛→+∞

o più concisamente:
𝑎𝑛 → ℓ .

Esplicitando la definizione astratta di limite osserviamo che se (𝛼, +∞] è un


intorno di +∞ con 𝛼 > 0 la sua intersezione con ℕ (il dominio della funzione)
è l’insieme {𝑛 ∈ ℕ : 𝑛 > 𝑁 } dove 𝑁 = d𝛼e è un numero naturale. Dunque se
ℓ ∈ ℝ la condizione 𝑎 𝑛 → ℓ si esplicita nel modo seguente:

∀𝜀 > 0 : ∃𝑁 ∈ ℕ : 𝑛 > 𝑁 =⇒ |𝑎 𝑛 − ℓ | < 𝜀. (2.4)

La condizione 𝑎 𝑛 → +∞ si scrive

∀𝛼 ∈ ℝ : ∃𝑁 ∈ ℕ : 𝑛 > 𝑁 =⇒ 𝑎 𝑛 > 𝛼

e infine 𝑎 𝑛 → −∞ diventa

∀𝛼 ∈ ℝ : ∃𝑁 ∈ ℕ : 𝑛 > 𝑁 =⇒ 𝑎 𝑛 < −𝛼.


86 2 funzioni continue, limiti e successioni

Definizione 2.37 (carattere di una successione). Sia 𝑎 𝑛 una successione a valori


reali o complessi e si consideri il limite

lim 𝑎 𝑛 .
𝑛

regolare
Se tale limite esiste diremo che la successione 𝑎 𝑛 è regolare, se il limite esiste ed è finito
diremo che la successione è convergente se il limite è infinito diremo che la successione
convergente è divergente se il limite non esiste diremo infine che la successione è indeterminata.
divergente Abbiamo dunque le seguenti alternative
indeterminata 1. la successione è convergente (ha limite finito);
2. la successione è divergente (ha limite infinito);
3. la successione è indeterminata (non ha limite).

carattere di una successione Determinare il carattere di una successione significa specificare a quale delle tre categorie
appartiene.

Esercizio 2.38. Una successione complessa 𝑧 𝑛 ∈ ℂ potrà essere scritta nella forma
𝑧 𝑛 = 𝑥 𝑛 + 𝑖 𝑦𝑛 dove 𝑥 𝑛 e 𝑦𝑛 sono successioni reali. Si può allora verificare che 𝑧 𝑛 → 𝑧
per 𝑧 ∈ ℂ se e solo se 𝑥 𝑛 → 𝑥 e 𝑦𝑛 → 𝑦 dove 𝑧 = 𝑥 + 𝑖 𝑦 con 𝑥, 𝑦 ∈ ℝ.

Si faccia attenzione al fatto che una successione 𝑎 𝑛 ∈ ℝ ⊆ ℂ può essere


interpretata sia come successione reale che come successione complessa. Le
condizioni di convergenza in ℝ o ℂ sono allora equivalenti. Ma se 𝑎 𝑛 → ∞
(in ℂ̄) significa che |𝑎 𝑛 | → +∞ e può capitare che 𝑎 𝑛 non abbia limite né +∞
né −∞ in quanto potrebbe frequentemente cambiare di segno (un esempio è
𝑎 𝑛 = (−𝑛)𝑛 ).

In generale potremmo avere delle successioni definite solamente su un sottoin-


sieme ℕ dei numeri naturali. Finché la successione è definita in un intorno di
+∞ (cioè da un certo 𝑛0 in poi) questo non ha nessuna conseguenza sul limite
per 𝑛 → +∞ (grazie alla località del limite, teorema 2.20).

Esempio 2.39. La successione 𝑎 𝑛 = 1/𝑛 è definita per 𝑛 ∈ ℕ ma 𝑛 ≠ 0. Ciò non


toglie che possiamo studiarne il limite come qualunque altra successione. Per evidenziare
il fatto che il primo indice è 𝑛 = 1 si potrà usare la notazione (𝑎 𝑛 )∞
𝑛=1 .

2.7 successioni limitate

Se abbiamo una successione 𝑎 𝑛 reale possiamo anche considerare gli operatori:

sup 𝑎 𝑛 , inf 𝑎 𝑛 , max 𝑎 𝑛 , min 𝑎 𝑛


𝑛 𝑛 𝑛 𝑛

che sono definiti come per qualunque altra funzione. Sappiamo che sup e inf
esistono sempre (in ℝ̄) mentre max e min potrebbero non esistere.

Anche il concetto di limitatezza per una successione è ereditato dallo stesso


concetto valido per le funzioni. Una successione 𝑎 𝑛 (a valori reali o complessi)
limitata
si dice essere limitata se l’insieme {|𝑎 𝑛 | : 𝑛 ∈ ℕ } è limitato. Cioè se
2.7 successioni limitate 87

sup |𝑎 𝑛 | < +∞.


𝑛

In caso contrario la successione si dice essere illimitata. Queste definizioni si illimitata


applicano tali e quali alle successioni di numeri complessi (rimpiazzando il
valore assoluto con il modulo).

Se la successione ha valori reali potremo anche parlare di limitatezza superiore


quando sup 𝑎 𝑛 < +∞ e limitatezza inferiore quando inf 𝑎 𝑛 > −∞.

Esempio 2.40. Si consideri 𝑎 𝑛 = 1


𝑛+1 definita per 𝑛 ∈ ℕ . Allora

sup 𝑎 𝑛 = max 𝑎 𝑛 = 1 , inf 𝑎 𝑛 = 0 , non esiste min 𝑎 𝑛 .

Dimostrazione. Per ogni 𝑛 ∈ ℕ si ha 𝑛 + 1 ≥ 1 e quindi 𝑎 𝑛 = 1/(𝑛 + 1) ≤ 1. Visto


poi che 𝑎 0 = 1 si ottiene immediatamente che max 𝑎 𝑛 = 1 e di conseguenza
sup 𝑎 𝑛 = 1.

Per verificare che inf 𝑎 𝑛 = 0 dobbiamo verificare innanzitutto che 0 è minorante,


e questo è vero in quanto 𝑎 𝑛 = 1/(𝑛 + 1) > 0 essendo 𝑛 + 1 ≥ 1 ≥ 0. Inoltre
dobbiamo verificare che per ogni 𝜀 > 0 esiste 𝑛 ∈ ℕ tale che 𝑎 𝑛 < 0 + 𝜀 = 𝜀.
Questo succede se 1/(𝑛 + 1) < 𝜀 ovvero se 𝑛 > 1/𝜀 − 1 ad esempio per 𝑛 = d1/𝜀e .
Abbiamo dunque verificato che inf 𝑎 𝑛 = 0. Il minimo di 𝑎 𝑛 non esiste perché se
esistesse dovrebbe essere uguale all’estremo inferiore cioè dovrebbe essere 0.
Ma questo è impossibile perché per ogni 𝑛 ∈ ℕ si ha 𝑎 𝑛 = 1/(𝑛 + 1) ≠ 0.

Visto che l’insieme ℕ su cui sono definite le successioni ha un unico punto di


accumulazione +∞ se la successione è convergente non potrà essere illimitata,
come viene espresso nel seguente.

Teorema 2.41 (limitatezza delle successioni convergenti). Se una successione


(reale o complessa) è convergente allora è anche limitata. Se una successione reale diverge
a +∞ allora è inferiormente limitata, se diverge a −∞ è superiormente limitata.

Dimostrazione. Per la definizione di limite (2.4) se 𝑎 𝑛 → ℓ con ℓ finito sappiamo


che scelto 𝜀 = 1 dovrà esistere 𝑁 ∈ ℕ tale che

∀𝑛 > 𝑁 : |𝑎 𝑛 − ℓ | < 1.

Osserviamo ora che gli indici 𝑛 per cui 𝑛 ≤ 𝑁 sono in numero finito (in effetti
sono 𝑁 + 1) e quindi esiste

𝑀 = max |𝑎 𝑛 | = max {|𝑎0 |, |𝑎1 |, . . . , |𝑎 𝑁 |}.


𝑛≤𝑁

Dunque scelto 𝑅 = max {|ℓ | + 1 , 𝑀} se 𝑛 ≤ 𝑁 si ha certamente |𝑎 𝑛 | ≤ 𝑀 ≤ 𝑅


e se 𝑛 > 𝑁 si ha comunque, per disuguaglianza triangolare,

|𝑎 𝑛 | ≤ |𝑎 𝑛 − ℓ | + |ℓ | = 1 + ℓ ≤ 𝑅.

Dunque nel complesso risulta sup𝑛 |𝑎 𝑛 | ≤ 𝑅 e la successione è limitata.


88 2 funzioni continue, limiti e successioni

Se 𝑎 𝑛 → +∞ per la definizione di limite scelto (0 , +∞] come intorno di +∞


deve esistere in indice 𝑁 ∈ ℕ tale che se 𝑛 > 𝑁 si ha 𝑎 𝑛 > 0. Ma allora posto
𝑅 = min {0 , 𝑎0 , . . . , 𝑎 𝑁 } si avrà 𝑎 𝑛 ≥ 𝑅 per ogni 𝑛 ∈ ℕ e dunque la successione
risulta essere inferiormente limitata.

Dimostrazione analoga si fa nel caso 𝑎 𝑛 → −∞.

prodotto limitata per infinitesima


Teorema 2.42 (prodotto di limitata per infinitesima). Se 𝑎 𝑛 è una successione
limitata e 𝑏 𝑛 → 0 allora 𝑎 𝑛 · 𝑏 𝑛 → 0 (il risultato vale sia per successioni reali che per
successioni complesse).

Dimostrazione. Se 𝑎 𝑛 è limitata significa che esiste 𝑅 > 0 tale che |𝑎 𝑛 | ≤ 𝑅 per


ogni 𝑛 ∈ ℕ . Se 𝑏 𝑛 → 0 sappiamo che anche |𝑏 𝑛 | → 0, dunque

0 ≤ |𝑎 𝑛 · 𝑏 𝑛 | = |𝑎 𝑛 | · |𝑏 𝑛 | ≤ 𝑅 · |𝑏 𝑛 | → 𝑅 · 0 = 0.

Per il teorema dei due carabinieri deduciamo che |𝑎 𝑛 · 𝑏 𝑛 | → 0 e quindi


𝑎 𝑛 · 𝑏 𝑛 → 0.

2.8 successioni monotòne

Le successioni sono funzioni ℕ → ℝ si applicano le definizioni 1.52 per


classificare le successioni in base alla monotonia. Per le successioni, tuttavia, si
possono dare delle definizioni equivalenti utilizzando il principio di induzione,
come viene esplicitato nel seguente teorema.

Teorema 2.43 (successioni monotòne). Una successione 𝑎 𝑛 è

1. crescente: se per ogni 𝑛 ∈ ℕ si ha 𝑎 𝑛+1 ≥ 𝑎 𝑛 ;


2. decrescente: se per ogni 𝑛 ∈ ℕ si ha 𝑎 𝑛+1 ≤ 𝑎 𝑛 ;
3. strettamente crescente: se per ogni 𝑛 ∈ ℕ si ha 𝑎 𝑛+1 > 𝑎 𝑛 ;
4. strettamente decrescente: se per ogni 𝑛 ∈ ℕ si ha 𝑎 𝑛+1 < 𝑎 𝑛 ;

Dimostrazione. Consideriamo ad esempio la prima condizione (funzione cre-


scente). Ovviamente se 𝑎 𝑛 è crescente si ha 𝑎 𝑛+1 ≥ 𝑎 𝑛 in quanto 𝑛 + 1 > 𝑛 .
Viceversa supponiamo che per ogni 𝑛 ∈ ℕ si abbia 𝑎 𝑛+1 ≥ 𝑎 𝑛 . Allora chiara-
mente 𝑎 1 ≥ 𝑎 0 , 𝑎 2 ≥ 𝑎 1 ≥ 𝑎 0 , 𝑎 3 ≥ 𝑎 2 ≥ 𝑎 1 ≥ 𝑎 0 ... Per induzione si può quindi
dimostrare che 𝑎 𝑛 ≥ 𝑎 𝑛−1 ≥ · · · ≥ 𝑎 2 ≥ 𝑎 1 .

Gli altri casi si svolgono in maniera analoga.

Esempio 2.44. La successione 𝑎 𝑛 = 𝑛 ! è crescente in quanto per ogni 𝑛 si ha


(𝑛 + 1)! = (𝑛 + 1) · 𝑛 ! ≥ 𝑛 !.

Il teorema 2.25 ci assicura che una successione monotona ha sempre limite.


Infatti il limite per 𝑛 → +∞ è un limite sinistro. In particolare se 𝑎 𝑛 è crescente
si ha
lim 𝑎 𝑛 = sup 𝑎 𝑛
𝑛 𝑛
2.9 la costante di Nepero 89

mentre se 𝑎 𝑛 è decrescente si ha

lim 𝑎 𝑛 = inf 𝑎 𝑛 .
𝑛 𝑛

2.9 la costante di Nepero

La funzione esponenziale è legata ad un modello di crescita che si trova spesso


in natura: la crescita esponenziale. Prendiamo come esempio una popolazione crescita esponenziale
di batteri che cresce senza limitazioni di spazio e di nutrimento oppure alla
crescita di un capitale dovuto ad una rendita finanziaria.

Supponiamo che una popolazione che al tempo 𝑡0 = 0 ammonta ad un certo


numero 𝑐 di batteri, al tempo 𝑡 > 0 raggiunga una numerosità 𝑞(𝑡, 𝑐). Se lascio
crescere la popolazione per un ulteriore tempo 𝑠 > 0 troverò al tempo 𝑡 + 𝑠 la
stessa popolazione che avrei al tempo 𝑠 se al tempo zero fossi partito con la
popolazione 𝑞(𝑡):
𝑞(𝑡 + 𝑠, 𝑐) = 𝑞(𝑠, 𝑞(𝑡, 𝑐)).
L’equazione precedente si chiama proprietà di semigruppo continuo. Ma fissato
𝑡 la popolazione 𝑞(𝑡, 𝑐) deve essere proporzionale a 𝑐 perché ogni batterio ha la
sua discendenza indipendentemente dalla numerosità totale della popolazione.
In pratica si deve avere 𝑞(𝑡, 𝑐) = 𝑘(𝑡) · 𝑐 per una opportuna funzione 𝑘(𝑡) che
non dipende da 𝑐 . Dunque

𝑞(𝑡 + 𝑠, 𝑐) = 𝑞(𝑠, 𝑞(𝑡, 𝑐)) = 𝑘(𝑠) · 𝑞(𝑡, 𝑐) = 𝑘(𝑠) · 𝑘(𝑡) · 𝑐

da cui
𝑘(𝑡 + 𝑠) = 𝑘(𝑠) · 𝑘(𝑡).
In base al teorema 1.54 possiamo affermare che 𝑘(𝑡) è una funzione esponenziale
𝑘(𝑡) = 𝑎 𝑡 per una qualche costante 𝑎 . La costante 𝑎 può essere determinata
mediante la formula:
𝑞(1 , 𝑐)
𝑎 = 𝑘(1) =
𝑐

𝑒𝑞
𝑞 𝑛
1+ 𝑛
..
.
𝑞 3
1+ 𝑛
𝑞 2 Figura 2.1: L’interesse composto. Se di-
1+ 𝑛 vidiamo l’intervallo [0 , 1] in 𝑛 parti (in
𝑞
1+ 𝑛 figura 𝑛 = 5), al passo zero partiamo
1 con un capitale pari ad 1 e ad ogni passo
di ampiezza 𝑛1 moltiplichiamo il nostro
𝑞
capitale per 1 + 𝑛 (supponendo di avere
un interesse pari a 𝑞 che nel tempo 𝑛1 ci
𝑞
paga quindi 𝑛 volte il nostro capitale).
Dopo 𝑛 passi, cioè al tempo 1, avremo
1 2 3 ... 1

𝑞 𝑛

𝑛 𝑛 𝑛 un capitale pari a 1 + 𝑛 . Se 𝑛 → +∞
questa quantità tende 𝑞
ad 𝑒 .
90 2 funzioni continue, limiti e successioni

ma questa espressione non ha un preciso significato fisico in quanto dipende


dall’unità di tempo scelta.

La costante a cui possiamo dare significato è invece l’aumento relativo istantaneo


della popolazione. Possiamo infatti supporre che se lasciamo la popolazione
crescere per un tempo Δ𝑡 molto piccolo, si otterrà un aumento di popolazione
proporzionale al tempo Δ𝑡 (stiamo qui anticipando il concetto di derivata) e alla
popolazione:
𝑞(Δ𝑡, 𝑐) = 𝑐 + 𝑟𝑐Δ𝑡 = (1 + 𝑟Δ𝑡)𝑐. (2.5)
La costante 𝑟 rappresenta quindi l’aumento relativo istantaneo della popolazione
(nel caso dell’investimento 𝑟 sarebbe il tasso di interesse istantaneo). Questa
definizione ha senso quando Δ𝑡 è piccolo in quanto non tiene conto del fatto
che nell’intervallo di tempo [𝑡, 𝑡 + Δ𝑡] la popolazione che si è aggiunta genera
anch’essa nuova popolazione (ovvero l’interesse accumulato genera anch’esso
In effetti la scoperta della costante 𝑒 è do-
vuta a Jacob Bernoulli nel 1683. Bernoulli interesse).
si chiedeva qual è l’interesse annuo effet-
tivo che si ottiene da un capitale che dia Per calcolare l’aumento della popolazione su tempi “grandi” possiamo suddi-
una rendita giornaliera (interesse com- videre gli intervalli temporali in 𝑛 intervallini di ampiezza Δ𝑡 e applicare in
posto). Se un capitale è investito ad un
tasso di interesse 𝑟 , si intende che ogni ognuno di essi la relazione (2.5). Si trova:
giorno il capitale viene aumentato di un
fattore 1 + 𝑟/365 e quindi dopo un anno 𝑞(Δ𝑡, 𝑐) = 𝑐(1 + 𝑟Δ𝑡)
il fattore moltiplicativo è (1 + 𝑟/365)365 .
𝑞(2Δ𝑡, 𝑐) = 𝑞(Δ𝑡, 𝑐)(1 + 𝑟Δ𝑡) = 𝑐(1 + 𝑟Δ𝑡)2
..
.
𝑞(𝑛Δ𝑡) = 𝑐(1 + 𝑟Δ𝑡)𝑛 .

Dunque, ponendo Δ𝑡 = 𝑡/𝑛 si ha


𝑛
𝑡

𝑞(𝑡, 𝑐) = 𝑐 1 + 𝑟
𝑛

in particolare per 𝑡 = 1/𝑟 si ottiene:


 𝑛
1
𝑞(1/𝑟, 𝑐) = 𝑐 1 +
𝑛

e ricordando che 𝑞(𝑡, 𝑐) = 𝑐𝑎 𝑡 otteniamo:


 𝑛
1 1
𝑎𝑟 = 1+ .
𝑛

Se per 𝑛 → +∞ (che corrisponde a Δ𝑡 → 0) la quantità sul lato destro tende ad


un numero 𝑒 (che chiameremo costante di Nepero) avremo allora

𝑎 = 𝑒𝑟 , 𝑞(𝑡, 𝑐) = 𝑐𝑒 𝑟𝑡

che è la relazione che lega le due costanti 𝑎 e 𝑟 che definiscono la crescita


esponenziale.

Risulta in effetti valido il seguente.


2.9 la costante di Nepero 91

Teorema 2.45 (costante di Nepero). La successione


 𝑛
1
𝑎𝑛 = 1 +
𝑛

è crescente e limitata, dunque è convergente.

Per dimostrare il teorema precedente ci serve preliminarmente il seguente


risultato.

disuguaglianza di Bernoulli
Teorema 2.46 (disuguaglianza di Bernoulli). Se 𝑥 > −1 e 𝑛 ∈ ℕ si ha

(1 + 𝑥)𝑛 ≥ 1 + 𝑛𝑥. (2.6)

Dimostrazione. Dimostriamo che vale (2.6) per induzione su 𝑛 . Per 𝑛 = 0 la


disequazione (2.6) diventa 1 ≥ 1 ed è quindi verificata. Se (2.6) è verificata per
un certo 𝑛 moltiplicando ambo i membri per 1 + 𝑥 > 0 si ottiene

(1 + 𝑥)𝑛+1 ≥ (1 + 𝑥)(1 + 𝑛𝑥) = 1 + (𝑛 + 1)𝑥 + 𝑛𝑥 2 ≥ 1 + (𝑛 + 1)𝑥

che è proprio la disuguaglianza (2.6) con 𝑛 + 1 al posto di 𝑛 .

Dimostrazione del teorema 2.45. Dimostriamo innanzitutto che 𝑎 𝑛 è crescente,


cioè che per ogni 𝑛 ≥ 2 si ha 𝑎 𝑛 ≥ 𝑎 𝑛−1 . E’ chiaro che 𝑎 𝑛 > 0 per ogni 𝑛 , quindi
ci riconduciamo a verificare che 𝑎𝑎𝑛−𝑛 1 ≥ 1.
Si ha
𝑛 𝑛+1 𝑛
1 + 𝑛1

𝑎𝑛 𝑛
=  𝑛−1 =
𝑎 𝑛−1 1 + 𝑛−1 1 𝑛 𝑛−1

𝑛−1
𝑛 𝑛
𝑛+1 𝑛−1 𝑛 𝑛2 − 1 𝑛
 
= · · = ·
𝑛 𝑛 𝑛−1 𝑛2 𝑛−1

Osserviamo ora che la disuguaglianza di Bernoulli, teorema 2.46, garantisce


𝑛 𝑛
𝑛2 − 1 𝑛 𝑛−1
 
1 1
= 1− 2 ≥ 1− =1− =
𝑛2 𝑛 𝑛 2 𝑛 𝑛

da cui si ottiene, come volevamo, 𝑎 𝑛 /𝑎 𝑛−1 ≥ 1 cioè 𝑎 𝑛 è crescente.


Se ora consideriamo la successione
  𝑛+1
1
𝑏𝑛 = 1 +
𝑛

osserviamo che si ha
 𝑛    
1 1 1
𝑏𝑛 = 1 + · 1+ = 𝑎𝑛 · 1 + > 𝑎𝑛 .
𝑛 𝑛 𝑛

Per dimostrare che 𝑎 𝑛 è limitata sarà quindi sufficiente dimostrare che 𝑏 𝑛 è


superiormente limitata. Vedremo ora che 𝑏 𝑛 è decrescente (e quindi 𝑎 𝑛 ≤ 𝑏 𝑛 ≤ 𝑏 1
è superiormente limitata).
92 2 funzioni continue, limiti e successioni

Procediamo in maniera analoga a quanto fatto per 𝑎 𝑛 :


𝑛 𝑛 𝑛
1 + 𝑛−1 1

𝑏 𝑛−1 𝑛−1
 𝑛 𝑛  𝑛+1 𝑛 − 1
=  𝑛+1 = = · ·
𝑏𝑛 1 + 𝑛1 𝑛+1 𝑛+1
 𝑛−1 𝑛+1 𝑛
𝑛
 𝑛+1  𝑛+1
𝑛2 𝑛−1 𝑛−1
 
1
= · = 1+ 2 · .
𝑛 −1
2 𝑛 𝑛 −1 𝑛

In base alla disuguaglianza di Bernoulli otteniamo


 𝑛+1
𝑛

1 1 1
1+ ≥ 1 + (𝑛 + 1) · ≥ 1+ = .
𝑛2 − 1 𝑛2 − 1 𝑛−1 𝑛−1

Mettendo insieme le due stime si ottiene dunque 𝑏 𝑛−1 /𝑏 𝑛 ≥ 1 che è quanto ci


rimaneva da dimostrare.

E’ quindi giustificata la seguente.

costante di Nepero Definizione 2.47 (costante di Nepero). Definiamo la costante di Nepero


Nepero è l’italianizzazione del nome del  𝑛
matematico scozzese John Napier (1550- 1
1617). Il nome 𝑒 è stato introdotto da 𝑒 = lim 1+ , 𝑛 ∈ ℕ.
𝑛→+∞ 𝑛
Eulero (Leonhard Euler 1707-1783)

Sapendo che
 𝑛   𝑛+1
1 1
1+ ≤ 𝑒 ≤ 1+
𝑛 𝑛
e ponendo 𝑛 = 1 otteniamo 2 ≤ 𝑒 ≤ 4.

𝑛𝑛 𝑎 𝑛+1
Esercizio 2.48. Posto 𝑎 𝑛 = 𝑛! mostrare che 𝑎𝑛 → 𝑒.
limiti che si riconducono al numero 𝑒

Teorema 2.49 (limiti che si riconducono al numero 𝑒 ). Si ha


1
lim (1 + 𝑥) 𝑥 = 𝑒.
𝑥→0

Dimostrazione. Iniziamo col dimostrare che


 𝑥
1
lim 1+ = 𝑒. (2.7)
𝑥→+∞ 𝑥

Ogni numero reale 𝑥 è compreso tra due interi consecutivi:

b𝑥c ≤ 𝑥 ≤ b𝑥c + 1

e dunque
1 1 1
1+ ≤ 1+ ≤ 1+
b𝑥c + 1 𝑥 b𝑥c
da cui   b𝑥c  𝑥   b𝑥c+1
1 1 1
1+ ≤ 1+ ≤ 1+ . (2.8)
b𝑥c + 1 𝑥 b𝑥c
2.9 la costante di Nepero 93

Per calcolare il limite della espressione a sinistra operiamo il cambio di variabile


𝑛 = b𝑥c + 1 per ottenere:
  b𝑥c   𝑛−1
1 1
lim 1+ = lim 1+
𝑥→+∞ b𝑥c + 1 𝑛→+∞ 𝑛
1 𝑛

1+ 𝑛 𝑒
= lim = = 𝑒.
𝑛→+∞ 1 + 𝑛1 1

Similmente per quanto riguarda il limite della espressione a destra si può


operare il cambio di variabile 𝑛 = b𝑥c :
  b𝑥c+1   𝑛+1
1 1
1+ = lim 1+
b𝑥c 𝑛→+∞ 𝑛
 𝑛  
1 1
= lim 1+ · 1+ = 𝑒 · 1 = 𝑒.
𝑛→+∞ 𝑛 𝑛

Dunque per il teorema dei due carabinieri otteniamo che anche l’espressione al
centro in (2.8) tende ad 𝑒 . Come conseguenza, tramite il cambio di variabile
𝑥 ↦→ 𝑥1 si ottiene
1
lim (1 + 𝑥) 𝑥 = 𝑒.
𝑥→0+

Consideriamo ora il limite per 𝑥 → −∞ della solita espressione. Tramite il


cambio di variabile 𝑦 = −𝑥 si ha
𝑥  −𝑦  −𝑦
𝑦−1
  
1 1
lim 1+ = lim 1− = lim
𝑥→−∞ 𝑥 𝑦→+∞ 𝑦 𝑦→+∞ 𝑦
𝑦 𝑦
𝑦
 
1
= lim = lim 1+
𝑦→+∞ 𝑦−1 𝑦→+∞ 𝑦−1
  𝑦−1  
1 1
= lim 1+ · 1+ = 𝑒 · 1 = 𝑒.
𝑦→+∞ 𝑦−1 𝑦−1

Di conseguenza, facendo il cambio di variabile 𝑥 ↦→ 1


𝑥 si ottiene
1
lim (1 + 𝑥) 𝑥 = 𝑒.
𝑥→0−

Mettendo insieme limite destro e limite sinistro si ottiene infine il limite completo
per 𝑥 → 0.

Corollario 2.50. Per ogni 𝑥 ∈ ℝ si ha


 𝑥 𝑛
lim 1+ = 𝑒𝑥.
𝑛→+∞ 𝑛

Dimostrazione. Infatti, per il teorema precedente, posto 𝑎 𝑛 = 𝑥/𝑛 si ha


𝑛
 𝑥𝑥
lim 1+ = 𝑒.
𝑛→+∞ 𝑛
94 2 funzioni continue, limiti e successioni

Ma allora
𝑛 𝑥
𝑥 𝑛 𝑥𝑥
 
1+ = 1+ → 𝑒𝑥
𝑛 𝑛

Definizione 2.51 (logaritmi naturali). Vedremo che il numero 𝑒 risulta essere una
base naturale per la funzione esponenziale e di conseguenza per il logaritmo. Il logaritmo
logaritmo naturale
in base 𝑒 viene chiamato logaritmo naturale e viene indicato con ln = log𝑒 .

In alcuni testi si utilizza l’operatore log, indicato senza una base esplicita, ma la
definizione non è completamente condivisa. In certi testi (per lo più in ambito
matematico) si definisce log = ln = log𝑒 , in altri testi si considera log = log10 .

Corollario 2.52 (limiti notevoli). Si ha

ln (1 + 𝑥)
lim = 1; (2.9)
𝑥→0 𝑥
𝑒𝑥 − 1
lim = 1. (2.10)
𝑥→0 𝑥

Dimostrazione. Per quanto riguarda il logaritmo ci si riconduce al teorema


precedente osservando che:

ln(1 + 𝑥)  1

= ln (1 + 𝑥) 𝑥 → ln 𝑒 = 1.
𝑥
Per l’esponenziale ci si riconduce al logaritmo osservando che posto

𝑦 = 𝑒𝑥 − 1

se 𝑥 → 0 anche 𝑦 → 0 e quindi si ha:

𝑒𝑥 − 1 𝑦
= → 1.
𝑥 ln(1 + 𝑦)

Esercizio 2.53. Mostrare che


𝑛
𝑛+1

𝑛
lim 𝑛 · = 𝑒;
𝑛→+∞ 𝑛2 + 1
 
1
lim 𝑛 · ln 1 + = 1;
𝑛→+∞ 𝑛
 (𝑛−1)!
𝑛+1

1
lim 1 − = ;
𝑛→+∞ 𝑛! 𝑒
√ 
𝑛
lim 𝑛 · 2 − 1 = ln 2.
𝑛→+∞
2.10 criteri del rapporto e della radice 95

2.10 criteri del rapporto e della radice

Succede spesso di dover determinare il limite del rapporto di due successioni


che tendono entrambe a infinito oppure entrambe a zero. In queste situazioni il
teorema del limite del rapporto non si applica in quanto siamo di fronte ad una
forma indeterminata. Dovremo quindi capire quale delle due successioni tende
a infinito o a zero “più velocemente”.
I teoremi che seguono si basano (in maniera più o meno implicita) sull’anda-
mento della successione geometrica:

𝑎𝑛 = 𝑞 𝑛

dove 𝑞 > 0 è una costante fissata. Dalle proprietà della funzione esponenziale
sappiamo che se 𝑞 > 1 si ha 𝑞 𝑛 → ∞. Se 𝑞 = 1 chiaramente 𝑞 𝑛 = 1 → 1 e se
𝑞 < 1 si ha 𝑞 −1 > 1 e quindi 𝑞 −𝑛 → +∞ da cui 𝑞 𝑛 → 0.

Teorema 2.54 (criterio del rapporto). Sia 𝑎 𝑛 una successione reale a termini non
negativi 𝑎 𝑛 ≥ 0 tale che esista il limite del rapporto di due termini consecutivi:
𝑎 𝑛+1
→ ℓ ∈ [0 , +∞].
𝑎𝑛

Se ℓ < 1 allora 𝑎 𝑛 → 0, se ℓ > 1 allora 𝑎 𝑛 → +∞.

Dimostrazione. Supponiamo sia ℓ < 1. Posto 𝑞 = (1 + ℓ )/2 si ha ℓ < 𝑞 < 1 e


posto 𝜀 = 𝑞 − ℓ > 0 per la definizione di limite 𝑎𝑎𝑛+𝑛 1 → ℓ dovrà esistere un
𝑁 ∈ ℕ tale che per ogni 𝑛 ≥ 𝑁 si abbia:
𝑎 𝑛+1
<ℓ +𝜀=𝑞
𝑎𝑛

ovvero 𝑎 𝑛+1 < 𝑞 · 𝑎 𝑛 . In particolare si avrà:

𝑎 𝑁+1 < 𝑞 · 𝑎 𝑁
𝑎 𝑁+2 < 𝑞 · 𝑎 𝑁+1 < 𝑞 2 · 𝑎 𝑁
𝑎 𝑁+3 < 𝑞 · 𝑎 𝑁+2 < 𝑞 3 · 𝑎 𝑁
..
.

ed è chiaro che per induzione potremo dimostrare che per ogni 𝑘 ∈ ℕ si ha

𝑎 𝑁+𝑘 < 𝑞 𝑘 · 𝑎 𝑁 .

Osserviamo però che 𝑞 𝑘 · 𝑎 𝑁 → 0 per 𝑘 → +∞ in quanto 𝑞 < 1 e quindi 𝑞 𝑘 → 0.


Dunque, tolti i primi 𝑁 termini, la successione 𝑎 𝑛 tende a zero. Ma i primi 𝑁
termini non influenzano né il carattere né il limite della successione e quindi
l’intera successione 𝑎 𝑛 tende a zero.
Il caso ℓ > 1 si fa in maniera analoga. Si sceglie 𝑞 tale che 1 < 𝑞 < ℓ e si trova,
in maniera analoga al caso precedente, che per un certo 𝑁 ∈ ℕ e per ogni 𝑘 ∈ ℕ
si ha
𝑎 𝑁+𝑘 > 𝑞 𝑘 · 𝑎 𝑁 → +∞.
96 2 funzioni continue, limiti e successioni

Osserviamo che, nel teorema precedente (ma anche nel criterio della radice
teorema 2.56), non si può concludere alcunché nel caso in cui sia ℓ = 1. Ad
esempio le due successioni 𝑎 𝑛 = 1/𝑛 e 𝑏 𝑛 = 𝑛 hanno limiti diversi ( 𝑎 𝑛 → 0,
𝑏 𝑛 → +∞) ma per entrambe il limite del rapporto di termini consecutivi tende
ad ℓ = 1.

Esercizio 2.55. Mostrare che

𝑛!
lim =0
𝑛𝑛
(2𝑛)!
lim = +∞
(2𝑛)𝑛
criterio della radice
Teorema 2.56 (criterio della radice). Sia 𝑎 𝑛 una successione a termini positivi tale
che
√𝑛
𝑎𝑛 → ℓ
con ℓ ∈ ℝ̄. Allora se ℓ < 1 si ha 𝑎 𝑛 → 0 se invece ℓ > 1 si ha 𝑎 𝑛 → +∞.

Dimostrazione. Si può osservare che


√ 𝑛 √
𝑛
𝑎𝑛 = 𝑛
𝑎𝑛 = 𝑒 𝑛·ln 𝑎𝑛
.

Se ℓ < 1 allora il logaritmo tende ad un numero negativo, l’argomento


dell’esponenziale tende a −∞ e quindi l’esponenziale tende a zero.

Se invece ℓ > 1 il logaritmo tende ad un numero positivo e quindi l’esponenziale


tende a +∞.

ordine di infinito/infinitesimo 2.11 ordini di infinito, equivalenza asintotica

Definizione 2.57 (ordine di infinito/infinitesimo). Sia 𝐴 ⊆ ℝ, 𝑓 , 𝑔 : 𝐴 →


(0 , +∞). Sia 𝑥 0 ∈ ℝ̄ un punto di accumulazione di 𝐴.

1. Diremo che per 𝑥 → 𝑥 0 la funzione 𝑓 è molto più piccola della funzione 𝑔 e
scriveremo 𝑓 (𝑥)  𝑔(𝑥) se vale

𝑓 (𝑥)
→ 0, per 𝑥 → 𝑥 0
 𝑔(𝑥)

diremo invece che 𝑓 è molto più grande di 𝑔 e scriveremo 𝑓 (𝑥)  𝑔(𝑥) se

𝑓 (𝑥)
→ +∞, per 𝑥 → 𝑥 0 .
equivalenza asintotica 𝑔(𝑥)
equivalenza asintotica 2. Diremo infine che 𝑓 e 𝑔 sono asintoticamente equivalenti per 𝑥 → 𝑥 0 e
∼ scriveremo 𝑓 (𝑥) ∼ 𝑔(𝑥) se
2.11 ordini di infinito, equivalenza asintotica 97

𝑓 (𝑥)
→ 1, per 𝑥 → 𝑥 0 .
𝑔(𝑥)

Ad esempio è facile verificare che se 𝛼 > 𝛽 > 0 allora 𝑥 𝛼  𝑥 𝛽 per 𝑥 → +∞


mentre 𝑥 𝛼  𝑥 𝛽 per 𝑥 → 0+ . Analogamente se 𝑎 > 𝑏 > 1 allora 𝑎 𝑥  𝑏 𝑥 per
𝑥 → +∞ mentre 𝑎 𝑥  𝑏 𝑥 per 𝑥 → −∞.

E’ molto facile verificare che le relazioni  e  sono una l’inversa dell’altra e


soddisfano la proprietà transitiva mentre la relazione ∼ soddisfa la proprietà
simmetrica e la proprietà transitiva.
ordini di infinito

Teorema 2.58 (ordini di infinito). Siano 𝑎 > 1 e 𝛼 > 0. Per 𝑛 → +∞, 𝑛 ∈ ℕ si ha

𝑛 𝛼  𝑎𝑛  𝑛!  𝑛𝑛

e per 𝑥 → +∞, 𝑥 ∈ ℝ si ha

log 𝑎 𝑥  𝑥 𝛼  𝑎 𝑥 .

Dimostrazione. Cominciamo col mostrare che 𝑎 𝑛  𝑛 ! applicando il criterio del


𝑛
rapporto alla successione 𝑎𝑛 ! :

𝑎 𝑛+1
(𝑛 + 1)! 𝑎 𝑛+1 𝑛! 1
𝑛 = 𝑛
· =𝑎· → 0 < 1.
𝑎 𝑎 (𝑛 + 1)! 𝑛+1
𝑛!
Dunque si ha, come richiesto, 𝑎 𝑛 /𝑛 ! → 0. Si procede in modo analogo per
mostrare che 𝑛 !  𝑛 𝑛 :

(𝑛 + 1)! 𝑛𝑛  𝑛 𝑛 1
· = (𝑛 + 1 ) ·
𝑛! (𝑛 + 1)𝑛+1 𝑛+1 𝑛+1
1 1
=  → < 1.
1 𝑛
1+ 𝑛 𝑒

Per dimostrare che 𝑛 𝛼  𝑎 𝑛 si può procedere con il criterio del rapporto, come
nei casi precedenti:
𝛼
(𝑛 + 1)𝛼 𝑎 𝑛 𝑛+1

1 1 𝛼 1
· 𝑛+1 = · → ·1 = <1
𝑛𝛼 𝑎 𝑎 𝑛 𝑎 𝑎

da cui 𝑛 𝛼 /𝑎 𝑛 → 0.

Per 𝑥 ∈ ℝ, cerchiamo di ricondurci ad una successione a valori interi. Osservia-


mo che si ha
b𝑥c ≤ 𝑥 ≤ b𝑥c + 1
da cui, per monotonia,
 𝛼
𝛼 𝛼 𝛼 𝛼 1
b𝑥c ≤ 𝑥 ≤ (b𝑥c + 1) = b𝑥c 1+
b𝑥c
98 2 funzioni continue, limiti e successioni

e
𝑎 b𝑥c ≤ 𝑎 𝑥 ≤ 𝑎 b𝑥c+1 = 𝑎 · 𝑎 b𝑥c .
Dunque
 𝛼
b𝑥c 𝛼 𝑥𝛼 b𝑥c 𝛼 1 + 1
b𝑥c
≤ ≤ .
𝑎 · 𝑎 b𝑥c 𝑎𝑥 𝑎 b𝑥c
Ma ora, se 𝑥 → +∞ sapendo che 𝑛 = b𝑥c → +∞ possiamo effettuare un cambio
di variabile nel limite

b𝑥c 𝛼 𝑛𝛼 b𝑥c 𝛼 𝑛𝛼
lim = lim 𝑛 = 0 e lim = lim 𝑛 = 0
𝑥→+∞ 𝑎 b𝑥c 𝑛→+∞ 𝑎 𝑥→+∞ 𝑎 b𝑥c 𝑛→+∞ 𝑎

𝑥𝛼
da cui segue che 𝑎𝑥 → 0.

Per dimostrare l’ultima relazione, log 𝑎 𝑥  𝑥 𝛼 , operiamo il cambio di variabile


𝑦 = 𝛼 · log𝑎 𝑥 cosicché 𝑎 𝑦 = 𝑥 𝛼 . Notiamo che se 𝑥 → +∞ anche 𝑦 → +∞.
Dunque, per le proprietà precedenti, sappiamo che 𝑦  𝑎 𝑦 e dunque

log 𝑎 𝑥 1 𝑦
= · → 0.
𝑥𝛼 𝛼 𝑎𝑦

Le notazioni e gli ordini di infinito individuati nel teorema precedente sono


strumenti molto utili nel calcolo dei limiti.

L’equivalenza asintotica si mantiene per prodotto e rapporto: se 𝑓 ∼ 𝐹 e 𝑔 ∼ 𝐺


allora
𝑓 𝐹
𝑓 · 𝑔 ∼ 𝐹 · 𝐺, ∼ .
𝑔 𝐺
Osserviamo inoltre che se 𝑓 ∼ 𝑔 e se 𝑓 → ℓ allora anche 𝑔 → ℓ . Se poi
ℓ ∈ (0, +∞) la relazione 𝑓 ∼ ℓ è equivalente ad 𝑓 → ℓ .

Per quanto riguarda la somma è facile verificare che se 𝑓  𝑔 allora ( 𝑓 + 𝑔) ∼ 𝑓


in quanto
𝑓 +𝑔 𝑓
= + 1 → 1.
𝑔 𝑔

In un limite in cui compaiono somme di termini di ordini diversi potremo allora


raccogliere i termini di ordine massimo per individuare il limite, come facciamo
nel seguente.

Esempio 2.59. Calcolare il limite

2𝑛 4 + 3𝑛 − 3 ln 𝑛
lim √ .
𝑛→+∞ 𝑛! − 3 𝑛

Svolgimento. Si ha
 
3𝑛 · 2 3𝑛𝑛 + 1 − 3 ln3𝑛𝑛
4

2𝑛 +
4
3𝑛 − 3 ln 𝑛
√ = √
𝑛! − 3 𝑛
 
𝑛
𝑛! · 1 − 3 𝑛!
2.12 successioni estratte 99

e ricordando che risulta (teorema 2.58)



𝑛 4  3𝑛 , ln 𝑛  3𝑛 , 𝑛  𝑛 !, 3𝑛  𝑛 !

avremo
2𝑛 4 + 3𝑛 − 3 ln 𝑛 3𝑛
√ ∼ → 0.
𝑛! − 3 𝑛 𝑛!

Esercizio 2.60. Calcolare i seguenti limiti


√ √
ln 𝑛 2 + 𝑛 𝑛 𝑛 ! + 2𝑛
lim √ , lim ,
𝑛→+∞ 𝑒 1+ln 𝑛
· ln(𝑛 − 𝑛 𝑛)
2 𝑛→+∞ 3𝑛
p
(2𝑛)! √
q
𝑛
lim , lim 𝑒 𝑛 + 10𝑛 .
𝑛→+∞ 𝑛𝑛 𝑛→+∞


Esercizio 2.61. Dimostrare che 𝑛
𝑛 → 1 per 𝑛 → +∞.

2.12 successioni estratte

Definizione 2.62 (sottosuccessione). Se 𝑎 𝑛 è una successione e 𝑛 𝑘 è una successione


strettamente crescente i cui valori sono numeri naturali, allora la successione 𝑏 𝑘 = 𝑎 𝑛 𝑘
sottosuccessione
si dice essere una sottosuccessione di 𝑎 𝑛 (o anche successione estratta da 𝑎 𝑛 ).

Ricordando che una successione 𝑎 𝑛 non è altro che una funzione 𝒂 : ℕ → ℝ, la


successione 𝑛 𝑘 corrisponde ad una funzione 𝒏 : ℕ → ℕ e la sottosuccessione
𝑎 𝑛 𝑘 corrisponde alla funzione composta 𝒂 ◦ 𝒏 .

Si osservi che nella definizione precedente la variabile 𝑛 rappresenta una


variabile muta quando scriviamo la successione 𝑎 𝑛 , ma rappresenta anche il
nome della successione fissata 𝑛 𝑘 . Questo sovraccarico di significato è voluto e
se usato correttamente rende più semplice le notazioni, in quanto la successione
𝑛 𝑘 viene sostituita alla variabile 𝑛 , con lo stesso nome, nella successione 𝑎 𝑛 . La
sottosuccessione 𝑎 𝑛 𝑘 risulta essere una successione nella variabile 𝑘 , non nella
variabile 𝑛 .

Esempio 2.63. Sia 𝑎 𝑛 = 𝑛 2 la successione dei quadrati perfetti:

𝑛 0 1 2 3 4 5 6 ...
𝑎𝑛 0 1 4 9 16 25 36 ...

Consideriamo la successione dei numeri pari 𝑛 𝑘 = 2 𝑘 . la corrispondente sottosuccessione


dei quadrati perfetti 𝑏 𝑘 = 𝑎 𝑛 𝑘 rappresenta la successione dei quadrati dei numeri pari:

𝑘 0 1 2 3 4 5 6 ...
𝑛𝑘 0 2 4 6 8 10 12 ...
𝑎𝑛𝑘 0 4 16 36 64 100 144 ...
100 2 funzioni continue, limiti e successioni

Si ha in pratica 𝑏 𝑘 = 𝑎 𝑛 𝑘 = 𝑎 2 𝑘 = (2 𝑘)2 .

Abbiamo in effetti estratto alcuni dei termini della successione originaria.

Esempio 2.64. Se 𝑎 𝑛 = (−1)𝑛 e 𝑛 𝑘 = 2 𝑘 allora 𝑎 𝑛 𝑘 = 1. Vediamo quindi che una


successione irregolare può contenere una sottosuccessione regolare.

Osserviamo che se 𝒏 : ℕ → ℕ è una funzione strettamente crescente (cioè


𝑛 𝑘 = 𝒏(𝑘) è una successione strettamente crescente di indici) allora posto
𝐴 = 𝒏(ℕ ) = {𝑛 𝑘 : 𝑘 ∈ ℕ } si ha che 𝒏 : ℕ → 𝐴 è una bigezione. Quindi 𝐴 è un
insieme infinito. Viceversa dato un qualunque insieme infinito 𝐴 ⊆ ℕ esiste
una unica successione 𝒏 : ℕ → 𝐴 bigettiva e strettamente crescente: basterà
porre, per induzione, 𝑛0 = min 𝐴, 𝑛1 = min {𝑛 ∈ 𝐴 : 𝑛 > 𝑛0 } e, in generale,
𝑛 𝑘+1 = min {𝑛 ∈ 𝐴 : 𝑛 > 𝑛 𝑘 }.

Dunque possiamo identificare le sottosuccessioni di una successione 𝒂 : ℕ → ℝ


con le restrizioni ai sottoinsiemi infiniti di ℕ . Nell’esempio precedente, si è
considerata la sottosuccessione di tutti i termini con indice pari 𝑛 𝑘 = 2 𝑘 per
ottenere la sottosuccessione 𝑎 𝑛 𝑘 = 𝑎 2 𝑘 . Si può equivalentemente pensare di
prendere l’insieme di tutti i numeri pari 𝐴 = 2ℕ e considerare la successione
ristretta ai soli indici pari:
𝑎0 , 𝑎2 , 𝑎4 , . . .
Se rinumeriamo gli indici pari usando tutti i numeri naturali otteniamo la
sottosuccessione 𝑏 𝑘 = 𝑎 𝑛 𝑘 :

𝑏0 = 𝑎0 , 𝑏1 = 𝑎2 , 𝑏2 = 𝑎4 , . . . , 𝑏 𝑘 = 𝑎 𝑛 𝑘 , . . .

Lemma 2.65 (estratte monotone). Ogni successione 𝑎 𝑛 ∈ ℝ ha una estratta 𝑎 𝑛 𝑘


monotona. Inoltre se sup 𝑎 𝑛 = +∞ c’è una estratta 𝑎 𝑛 𝑘 strettamente crescente che
tende a +∞.

Dimostrazione. Consideriamo l’insieme 𝑃 dei punti di “picco”, ovvero degli


indici di quei termini della successione che sono maggiori o uguali a tutti i
termini seguenti:

𝑃 = {𝑛 ∈ ℕ : 𝑚 ≥ 𝑛 =⇒ 𝑎 𝑛 ≥ 𝑎 𝑚 }.

Se 𝑃 è finito significa che esiste un indice 𝑛1 ∈ ℕ tale che non ci sono picchi
da 𝑛1 in poi. In particolare 𝑛1 non è un punto di picco quindi deve esistere
𝑛2 > 𝑛1 tale che 𝑎 𝑛2 > 𝑎 𝑛1 . Ma neanche 𝑛2 è un punto di picco quindi deve
esistere 𝑛3 > 𝑛2 tale che 𝑎 𝑛3 > 𝑎 𝑛2 ... procedendo induttivamente si riesce quindi
a definire una successione 𝑛 𝑘 di indici tali che 𝑎 𝑛 𝑘 risulta essere strettamente
crescente.

In particolare se sup 𝑎 𝑛 = +∞ siamo nella situazione precedente perché chiara-


mente in tal caso 𝑃 è vuoto visto che per ogni 𝑛 ∈ ℕ deve esistere 𝑚 ∈ ℕ tale
che 𝑎 𝑚 > max {𝑎 0 , 𝑎 1 , . . . 𝑎 𝑛 } e certamente 𝑚 > 𝑛 .

Se, viceversa, 𝑃 è infinito allora elencando in ordine i suoi elementi otterremo


una successione 𝑛1 < 𝑛2 < 𝑛3 , . . . di indici ognuno dei quali corrisponde ad un
2.13 punti limite 101

valore di picco. Se 𝑗 > 𝑘 si ha dunque 𝑛 𝑗 > 𝑛 𝑘 ed essendo 𝑛 𝑘 ∈ 𝑃 significa che


𝑎 𝑛 𝑗 ≤ 𝑎 𝑛 𝑘 . Dunque la successione 𝑎 𝑛 𝑘 risulta essere decrescente.

Bolzano-Weierstrass
Teorema 2.66 (Bolzano-Weierstrass). Ogni successione 𝑎 𝑛 ha una estratta regolare.
Più precisamente se 𝑎 𝑛 è una successione limitata allora esiste una sottosuccessione 𝑎 𝑛 𝑘
convergente.
Se 𝑎 𝑛 è una successione non limitata allora esiste una estratta 𝑎 𝑛 𝑘 divergente.

Dimostrazione. Cominciamo con il caso reale 𝑎 𝑛 ∈ ℝ. Il lemma 2.65 garantisce


che esiste una estratta 𝑎 𝑛 𝑘 monotona. Ma per il teorema 2.25 concludiamo
immediatamente che 𝑎 𝑛 𝑘 ha limite. Se 𝑎 𝑛 è limitata anche 𝑎 𝑛 𝑘 è limitata e quindi
in tal caso il limite è finito e dunque la successione estratta è convergente.
Se 𝑎 𝑛 non è superiormente limitata il lemma ci garantisce che l’estratta tende a
+∞ e dunque è divergente. Per simmetria se 𝑎 𝑛 non è inferiormente limitata
esiste una estratta che tende a −∞ e quindi anche in questo caso l’estratta è
divergente.
Se 𝑎 𝑛 è una successione di numeri complessi, si potrà scrivere 𝑎 𝑛 = 𝑥 𝑛 + 𝑖 𝑦𝑛
con 𝑥 𝑛 e 𝑦𝑛 successioni reali. Se 𝑎 𝑛 è limitata significa che |𝑎 𝑛 | è superiormente
limitata. Ma risulta |𝑥 𝑛 | ≤ |𝑎 𝑛 | e |𝑦𝑛 | ≤ |𝑎 𝑛 | quindi se 𝑎 𝑛 è limitata anche la parte
reale 𝑥 𝑛 e la parte immaginaria 𝑦𝑛 sono successioni limitate. Allora 𝑥 𝑛 ammette
una sotto-successione convergente 𝑥 𝑛 𝑘 . Ma 𝑦𝑛 𝑘 è anch’essa limitata e quindi
anch’essa ammette una sotto-sotto-successione 𝑦𝑛 𝑘 𝑗 convergente. Dunque la
sotto-sotto-successione 𝑎 𝑛 𝑘 𝑗 è convergente.

Se 𝑎 𝑛 ∈ ℂ non è limitata, applicando


il teorema al suo modulo |𝑎 𝑛 | troviamo
che c’è una estratta 𝑎 𝑛 𝑘 tale che 𝑎 𝑛 𝑘 → +∞. Ma questo significa che 𝑎 𝑛 → ∞ ∈
ℂ̄.

2.13 punti limite

Teorema 2.67 (ponte di collegamento tra limiti di funzione e limiti di successione).


Sia 𝐴 ⊆ ℝ, 𝑓 : 𝐴 → ℝ, sia 𝑥 0 un punto di accumulazione di 𝐴 e sia ℓ ∈ [−∞, +∞].
Le due seguenti condizioni sono equivalenti:
1. lim 𝑓 (𝑥) = ℓ ;
𝑥→𝑥0
2. per ogni successione 𝑎 𝑛 → 𝑥 0 con 𝑎 𝑛 ∈ 𝐴 \ {𝑥 0 } risulta

lim 𝑓 (𝑎 𝑛 ) = ℓ .
𝑛→+∞

Dimostrazione. Se per 𝑥 → 𝑥 0 si ha 𝑓 (𝑥) → ℓ e se 𝑎 𝑛 → 𝑥 0 con 𝑎 𝑛 ∈ 𝐴 \ {𝑥 0 }


la successione 𝑓 (𝑎 𝑛 ) non è altro che la composizione della funzione 𝑓 con la
funzione 𝑛 ↦→ 𝑎 𝑛 . Si può quindi applicare il teorema sul limite della funzione
composta per ottenere che 𝑓 (𝑎 𝑛 ) → ℓ .
Supponiamo viceversa di sapere che per ogni successione 𝑎 𝑛 → 𝑥 0 si ha
𝑓 (𝑎 𝑛 ) → ℓ . Vogliamo mostrare allora che 𝑓 (𝑥) → ℓ . Lo facciamo per assurdo:
supponiamo che esista un intorno 𝑈 di ℓ tale che preso un qualunque intorno
102 2 funzioni continue, limiti e successioni

𝑉 di 𝑥 0 non si abbia 𝑓 ((𝐴 \ {𝑥0 }) ∩ 𝑉) ⊆ 𝑈 . Possiamo considerare per ogni


𝑛 ∈ ℕ degli intorni 𝑉𝑛 sempre più piccoli. Ad esempio nel caso 𝑥 0 ∈ ℝ
potremo scegliere 𝑉𝑛 = (𝑥 0 − 1/𝑛, 𝑥 0 + 1/𝑛), nel caso 𝑥 0 = +∞ si potrà scegliere
𝑉𝑛 = (𝑛, +∞] e nel caso 𝑥0 = −∞ si sceglierà 𝑉𝑛 = [−∞, −𝑛). Se per assurdo
𝑓 ((𝐴 \ {𝑥0 } ∩ 𝑉𝑛 )) non fosse contenuto in 𝑈 significherebbe che per ogni 𝑛 ∈ ℕ
esisterebbe 𝑎 𝑛 ∈ (𝐴 \ {𝑥 0 }) ∩ 𝑉𝑛 tale che 𝑓 (𝑎 𝑛 ) ∉ 𝑈 . Ma allora 𝑎 𝑛 risulterebbe
essere una successione in 𝐴 \ {𝑥 0 } con limite 𝑥 0 (in quanto per ogni intorno di
𝑥0 esiste un 𝑁 tale che 𝑉𝑁 sia contenuto in tale intorno e per ogni 𝑛 > 𝑁 si ha
𝑉𝑛 ⊆ 𝑉𝑁 ) ma 𝑓 (𝑎 𝑛 ) non potrebbe avere limite ℓ (essendo fuori dall’intorno 𝑈 ).
Ma questo nega l’ipotesi e conclude quindi la dimostrazione del teorema.

Proposizione 2.68 (proprietà caratteristica della convergenza). Sia 𝑓 : 𝐴 ⊆ ℝ →


ℝ e 𝑥0 punto di accumulazione di 𝐴. Sia ℓ ∈ ℝ̄. Se per ogni 𝑎 𝑛 → 𝑥0 , 𝑎 𝑛 ∈ 𝐴 \ {𝑥0 }
esiste una estratta 𝑎 𝑛 𝑘 tale che 𝑓 (𝑎 𝑛 𝑘 ) → ℓ allora 𝑓 (𝑥) → ℓ per 𝑥 → 𝑥 0 .

Dimostrazione. Se per assurdo non fosse 𝑓 (𝑥) → ℓ esisterebbe un intorno


𝑈 ∈ Bℓ per cui frequentemente 𝑓 (𝑥) ∉ 𝑈 . Questo significa che esiste una
successione 𝑎 𝑛 → 𝑥 0 con 𝑎 𝑛 ≠ 𝑥 0 tale che 𝑓 (𝑎 𝑛 ) ∉ 𝑈 . Ma allora da 𝑓 (𝑎 𝑛 ) non è
possibile estrarre una sottosuccessione che abbia limite ℓ , e questo è contrario
alle ipotesi.

Definizione 2.69 (punti limite, limite superiore, limite inferiore). Sia 𝑓 : 𝐴 ⊆


punto limite ℝ → ℝ una funzione e 𝑥0 ∈ ℝ̄ un punto di accumulazione per 𝐴. Una quantità
ℓ ∈ ℝ̄ si dice essere un punto limite di 𝑓 (𝑥) per 𝑥 → 𝑥0 se per ogni 𝑈 intorno di ℓ si
ha 𝑓 (𝑥) ∈ 𝑈 frequentemente per 𝑥 → 𝑥 0 .
limite superiore/inferiore Se denotiamo con 𝐿 ⊆ ℝ̄ l’insieme dei punti limite possiamo definire il limite superiore
e il limite inferiore rispettivamente come

lim sup 𝑎 𝑛 = sup 𝐿, lim inf 𝑎 𝑛 = inf 𝐿.


𝑥→𝑥 0 𝑥→𝑥0

Proposizione 2.70 (base numerabile di intorni). Per ogni ℓ ∈ ℝ̄ esiste una


successione 𝑈𝑛 di intorni di ℓ con queste proprietà:

1. 𝑈𝑛+1 ⊆ 𝑈𝑛 ;
2. per ogni 𝑈 intorno di ℓ esiste 𝑛 ∈ ℕ tale che 𝑈𝑛 ⊆ 𝑈 ;
3. se 𝑎 𝑛 ∈ 𝑈𝑛 allora 𝑎 𝑛 → ℓ .

Dimostrazione. Possiamo esplicitamente definire gli intorni 𝑈𝑛 come segue:

ℓ − 𝑛1 , ℓ + 𝑛1 se ℓ ∈ ℝ
 




𝑈𝑛 = (𝑛, +∞] se ℓ = +∞

 [−∞, −𝑛) se ℓ = −∞.


La prima proprietà è ovviamente verificata. La proprietà archimedea dei numeri
reali garantisce la validità della seconda proprietà, da cui segue immediatamente
la terza.
2.13 punti limite 103

Proposizione 2.71 (caratterizzazione dei punti limite). Sia 𝑓 : 𝐴 ⊆ ℝ → ℝ,


𝑥0 ∈ ℝ̄ punto di accumulazione per 𝐴. Sono equivalenti:
1. ℓ è un punto limite di 𝑓 (𝑥) per 𝑥 → 𝑥 0 .
2. esiste una successione 𝑎 𝑛 ∈ 𝐴, 𝑎 𝑛 ≠ 𝑥 0 , 𝑎 𝑛 → 𝑥 0 tale che 𝑓 (𝑎 𝑛 ) → ℓ .

Dimostrazione. Siano 𝑈𝑛 intorni di ℓ e 𝑉𝑛 intorni di 𝑥 0 definiti come nella


proposizione 2.70. Se ℓ è un punto limite di 𝑓 (𝑥) per 𝑥 → 𝑥 0 significa che per
ogni 𝑈 intorno di ℓ e per ogni 𝑉 intorno di 𝑥 0 esiste 𝑥 ∈ 𝐴 ∩ 𝑉 \ {𝑥 0 } tale
che 𝑓 (𝑥) ∈ 𝑈 . Dunque per ogni 𝑛 esiste 𝑎 𝑛 ∈ 𝐴 ∩ 𝑉 \ {𝑥 0 } tale che 𝑎 𝑛 ∈ 𝑉𝑛
e 𝑓 (𝑎 𝑛 ) ∈ 𝑈𝑛 . Significa che 𝑎 𝑛 → 𝑥 0 , 𝑎 𝑛 ≠ 𝑥 0 , 𝑓 (𝑎 𝑛 ) → ℓ come volevasi
dimostrare.

Viceversa se esiste una tale successione 𝑎 𝑛 → 𝑥 0 allora per ogni 𝑉 intorno di


𝑥0 si ha definitivamente 𝑎 𝑛 ∈ 𝑉 . E se 𝑓 (𝑎 𝑛 ) → ℓ per ogni 𝑈 intorno di ℓ si ha
anche 𝑓 (𝑎 𝑛 ) ∈ 𝑈 definitivamente. Dunque esiste 𝑛 tale che 𝑎 𝑛 ∈ 𝑉 e 𝑓 (𝑎 𝑛 ) ∈ 𝑈
confermando quindi che 𝑓 (𝑥) ∈ 𝑈 frequentemente.

Molto spesso considereremo i punti limite di una successione 𝑎 𝑛 per 𝑛 → +∞.


In tal caso la caratterizzazione precedente ci dice che ℓ è un punto limite di
𝑎 𝑛 per 𝑛 → +∞ se esiste una successione di indici 𝑛 𝑘 → +∞ tale che 𝑎 𝑛 𝑘 → ℓ .
Potremmo anche supporre 𝑛 𝑘 strettamente crescente in quanto se 𝑛 𝑘 → ∞
possiamo estrarre da 𝑛 𝑘 una sottosuccessione strettamente crescente. Dunque
l’insieme dei punti limite di una successione 𝑎 𝑛 corrisponde all’insieme dei
limiti di tutte le possibili sottosuccessioni di 𝑎 𝑛 .

Esempio 2.72. La successione 𝑎 𝑛 = (−1)𝑛 ha due punti limite:

lim sup(−1)𝑛 = 1 , lim inf(−1)𝑛 = −1.


𝑛→+∞ 𝑛→+∞

Infatti la sottosuccessione dei termini con indice pari è costante 1 mentre quella dei
termini di indice dispari è costante −1. Non ci possono essere altri punti limite perché
se ci fosse 𝑎 𝑛 𝑘 → ℓ allora certamente 𝑎 𝑛 𝑘 = 1 frequentemente oppure 𝑎 𝑛 𝑘 = −1
frequentemente da cui o ℓ = 1 oppure ℓ = −1.

Esempio 2.73. Visto che #ℚ = #ℕ esiste una funzione 𝒂 : ℕ → ℚ surgettiva.


Utilizzando la proprietà di densità dei numeri razionali si può dimostrare che l’insieme
dei punti limite della corrispondente successione 𝑎 𝑛 = 𝒂(𝑛) è tutto ℝ̄.

√ √
Esercizio 2.74. Si consideri la successione 𝑎 𝑛 = 𝑛 − b 𝑛c . Calcolare

lim inf 𝑎 𝑛 , lim sup 𝑎 𝑛 .


𝑛→+∞ 𝑛→+∞

Qual è l’insieme dei punti limite di 𝑎 𝑛 per 𝑛 → +∞?

Teorema 2.75 (proprietà del limite superiore/inferiore). Sia 𝑓 : 𝐴 ⊆ ℝ → ℝ e


sia 𝑥 0 un punto di accumulazione per 𝐴. Sia 𝐿 l’insieme dei punti limite di 𝑓 (𝑥) per
𝑥 → 𝑥0 .
1. 𝐿 ≠ ∅
104 2 funzioni continue, limiti e successioni

2. lim sup 𝑓 (𝑥) ≥ lim inf 𝑓 (𝑥);


𝑥→𝑥0 𝑥→𝑥 0
3. se lim sup 𝑓 (𝑥) = lim inf 𝑓 (𝑥) = ℓ allora lim 𝑓 (𝑥) = ℓ ;
𝑥→𝑥 0 𝑥→𝑥0 𝑥→𝑥 0
4. l’insieme dei punti limite è chiuso per passaggio al limite: se ℓ 𝑘 ∈ 𝐿 e ℓ 𝑘 → ℓ per
qualche ℓ ∈ ℝ̄ allora ℓ ∈ 𝐿;
5. lim sup 𝑓 (𝑥) e lim inf 𝑥→𝑥0 𝑓 (𝑥) sono punti limite;
𝑥→𝑥0
6. la condizione lim sup 𝑓 (𝑥) = ℓ è equivalente a
𝑥→𝑥 0
(
∀𝑞 > ℓ : 𝑓 (𝑥) < 𝑞 definitivamente,
∀𝑞 < ℓ : 𝑓 (𝑥) > 𝑞 frequentemente,

e la condizione lim inf 𝑓 (𝑥) = ℓ è equivalente a


𝑥→𝑥 0
(
∀𝑞 > ℓ : 𝑓 (𝑥) < 𝑞 frequentemente,
∀𝑞 < ℓ : 𝑓 (𝑥) > 𝑞 definitivamente.

7. se 𝑎 𝑛 è una successione
   
lim sup 𝑎 𝑛 = lim sup 𝑎 𝑘 , lim inf 𝑎 𝑛 = lim inf 𝑎 𝑘 .
𝑛→+∞ 𝑛→+∞ 𝑘≥𝑛 𝑛→+∞ 𝑛→+∞ 𝑘≥𝑛

Dimostrazione. Per quanto riguarda il punto 1. il teorema 2.66 di Bolzano-


Weierstrass garantisce che sia 𝐿 ≠ ∅ e quindi sup 𝐿 ≥ inf 𝐿 da cui discende il
punto 2.

Per il punto 3. se lim sup = lim inf = ℓ significa che 𝐿 = {ℓ } ha un solo elemento.
Ma per il corollario al teorema di Bolzano Weierstrass sappiamo che da ogni
successione 𝑓 (𝑎 𝑛 ) con 𝑎 𝑛 → 𝑥 0 è possibile estrarre una sottosuccessione 𝑓 (𝑎 𝑛 𝑘 )
regolare. Il limite di tale sottosuccessione deve essere un elemento di 𝐿 e quindi
non può che essere ℓ . Allora per la proposizione 2.68 deduciamo che l’intera
successione ha limite ℓ .

Per il punto 4. sia ℓ 𝑘 ∈ 𝐿 una successione di punti limite e sia ℓ ∈ ℝ̄ tale che
ℓ 𝑘 → ℓ per 𝑘 → +∞. Ora consideriamo la successione 𝑈𝑛 di intorni di ℓ data
dalla proposizione 2.70. Visto che ℓ 𝑘 → ℓ per ogni 𝑛 deve esistere 𝑘 𝑛 tale
che ℓ 𝑘 𝑛 ∈ 𝑈𝑛 . Senza perdita di generalità possiamo supporre direttamente
che sia ℓ 𝑛 ∈ 𝑈𝑛 . Consideriamo anche gli intorni 𝑉𝑛 di 𝑥 0 dati sempre dalla
proposizione 2.70. Per ogni ℓ 𝑛 ∈ 𝐿 deve esistere una successione 𝑎 𝑘 → 𝑥 0
con 𝑎 𝑘 ≠ 𝑥 0 tale che 𝑓 (𝑎 𝑘 ) → ℓ 𝑛 . Ma allora certamente esiste 𝑘 = 𝑘 𝑛 tale che
𝑎 𝑘 𝑛 ∈ 𝑉𝑛 e 𝑓 (𝑎 𝑘 𝑛 ) ∈ 𝑈𝑛 . Posto 𝑏 𝑛 = 𝑎 𝑘 𝑛 abbiamo trovato una successione 𝑏 𝑛 tale
che 𝑏 𝑛 → 𝑥 0 (in quanto 𝑏 𝑛 ∈ 𝑉𝑛 ) e 𝑓 (𝑏 𝑛 ) → ℓ in quanto 𝑓 (𝑏 𝑛 ) ∈ 𝑈𝑛 . Dunque ℓ
è anch’esso un punto limite.

Per il punto 5 visto che 𝐿 ≠ ∅ la caratterizzazione del sup garantisce che esista
una successione ℓ 𝑛 ∈ 𝐿 tale che ℓ 𝑛 → sup 𝐿. Ma allora per il punto precedente
si deve avere sup 𝐿 ∈ 𝐿. Lo stesso per l’inf.

Per il punto 6. facciamo la dimostrazione per il lim sup (per il lim inf sarà
analogo). Se lim sup 𝑓 (𝑥) = ℓ e se fosse frequentemente 𝑓 (𝑥) ≥ 𝑞 > ℓ allora
esisterebbe una successione 𝑎 𝑛 → 𝑥 0 , 𝑎 𝑛 ≠ 𝑥 0 tale che 𝑓 (𝑎 𝑛 ) ≥ 𝑞 . Tale
2.13 punti limite 105

successione avrebbe una estratta regolare che ha limite ≥ 𝑞 > ℓ , il che è assurdo.
Dunque definitivamente deve essere 𝑓 (𝑥) < 𝑞 per ogni 𝑞 > ℓ . Se invece fosse
definitivamente 𝑓 (𝑥) ≤ 𝑞 < ℓ per ogni successione 𝑎 𝑛 → 𝑥 0 con 𝑎 𝑛 ≠ 𝑥 0 si
dovrebbe avere 𝑓 (𝑎 𝑛 ) ≤ 𝑞 e questo contraddice il fatto che ℓ > 𝑞 è un punto
limite.

Viceversa se per ogni 𝑞 > ℓ si ha 𝑓 (𝑥) < 𝑞 definitivamente, significa che per ogni
successione 𝑎 𝑛 → 𝑥 0 si ha 𝑓 (𝑎 𝑛 ) < 𝑞 definitivamente e quindi se 𝑓 (𝑎 𝑛 ) → ℓ
dovrà essere ℓ ≤ 𝑞 . Dunque ogni 𝑞 > ℓ è un maggiorante di 𝐿 e sup 𝐿 ≤ ℓ .
Se poi per ogni 𝑞 < ℓ si ha 𝑓 (𝑥) ≥ 𝑞 frequentemente significa che esiste una
successione 𝑎 𝑛 → 𝑥 0 , 𝑎 𝑛 ≠ 𝑥 0 tale che 𝑓 (𝑎 𝑛 ) ≥ 𝑞 . Per il teorema di Bolzano-
Weierstrass si potrà trovare una estratta convergente 𝑓 (𝑎 𝑛 𝑘 ) → ℓ 0 ≥ 𝑞 . Dunque
per ogni 𝑞 < ℓ risulta sup 𝐿 ≥ 𝑞 da cui in definitiva sup 𝐿 = ℓ .

Per il punto 7. facciamo la dimostrazione per il lim sup (per il lim inf sarà
analogo). Posto 𝐴𝑛 = sup 𝑘≥𝑛 𝑎 𝑘 osserviamo che 𝐴𝑛 è decrescente in quanto
all’aumentare di 𝑛 l’insieme {𝑘 : 𝑘 ≥ 𝑛} decresce (nel senso dell’inclusione
insiemistica) e quindi il sup non aumenta. Dunque ℓ = lim 𝐴𝑛 esiste certamente
in ℝ̄. Inoltre per definizione di limite per ogni ℓ 0 > ℓ si dovrà avere 𝐴𝑛 < ℓ 0
definitivamente e quindi (essendo ovviamente 𝑎 𝑛 ≤ 𝐴𝑛 ) si avrà anche 𝑎 𝑛 < ℓ 0
definitivamente. Viceversa preso ℓ 0 < ℓ si avrà definitivamente 𝐴𝑛 > ℓ 0.
Ma questo significa che esiste 𝑘 > 𝑛 per cui si ha 𝑎 𝑘 > ℓ 0 e quindi risulta
𝑎 𝑛 > ℓ 0 frequentemente. Per il punto precedente si può quindi concludere che
ℓ = lim sup 𝑎 𝑛 .

Teorema 2.76 (operazioni con lim sup e lim inf). Siano 𝑓 , 𝑔 : 𝐴 ⊆ ℝ → ℝ e sia
𝑥0 un punto di accumulazione di 𝐴.

1. Per 𝑥 → 𝑥 0 si ha

lim sup(− 𝑓 (𝑥)) = − lim inf 𝑓 (𝑥)


𝑥→𝑥 0 𝑥→𝑥 0

lim inf(− 𝑓 (𝑥)) = − lim sup 𝑓 (𝑥);


𝑥→𝑥0 𝑥→𝑥0

2. se 𝜆 ≥ 0 allora

lim sup(𝜆 · 𝑓 (𝑥)) = 𝜆 · lim sup 𝑓 (𝑥),


𝑥→𝑥0 𝑥→𝑥 0

lim inf(𝜆 · 𝑓 (𝑥)) = 𝜆 · lim inf 𝑓 (𝑥);


𝑥→𝑥 0 𝑥→𝑥 0

3. inoltre

lim sup( 𝑓 (𝑥) + 𝑔(𝑥)) ≤ lim sup 𝑓 (𝑥) + lim sup 𝑔(𝑥),
𝑥→𝑥0 𝑥→𝑥 0 𝑥→𝑥 0

lim inf( 𝑓 (𝑥) + 𝑔(𝑥)) ≥ lim inf 𝑓 (𝑥) + lim inf 𝑔(𝑥);
𝑥→𝑥 0 𝑥→𝑥0 𝑥→𝑥 0

4. e infine se 𝑓 (𝑥) ≥ 𝑔(𝑥) allora

lim sup 𝑓 (𝑥) ≥ lim sup 𝑔(𝑥), lim inf 𝑓 (𝑥) ≥ lim inf 𝑔(𝑥).
𝑥→𝑥 0 𝑥→𝑥 0 𝑥→𝑥0 𝑥→𝑥0
106 2 funzioni continue, limiti e successioni

Dimostrazione. Per il punto 1. basti osservare che se la funzione 𝑓 (𝑥) ha 𝐿 come


insieme dei punti limite allora la funzione − 𝑓 (𝑥) ha −𝐿 come punti limite.
Quindi sup(−𝐿) = − inf 𝐿 e inf(−𝐿) = − sup 𝐿.

Per il punto 2. si osservi che se 𝐿 è l’insieme dei punti limite di 𝑓 (𝑥) allora
l’insieme dei punti limite di 𝜆 𝑓 (𝑥) è 𝜆𝐿. Se 𝜆 ≥ 0 si ha dunque sup 𝜆𝐿 = 𝜆 sup 𝐿
e inf 𝜆𝐿 = 𝜆 inf 𝐿 (se 𝜆 < 0 invece inf e sup si scambiano, come nel punto 1).

Per il punto 3. consideriamo il caso del lim sup (per il lim inf sarà analogo).
Se ℓ = lim sup( 𝑓 (𝑥) + 𝑔(𝑥)) significa che esiste una successione di 𝑎 𝑛 → 𝑥 0
tale che 𝑓 (𝑎 𝑛 ) + 𝑔(𝑎 𝑛 ) → ℓ . Ma posso estrarre una sottosuccessione tale che
anche il primo addendo 𝑓 (𝑎 𝑛 𝑘 ) abbia limite. E poi posso estrarre una sotto-
sottosuccesione in modo che anche il secondo addendo 𝑔(𝑎 𝑛 𝑘 𝑗 ) abbia limite.
Dunque avremo 𝑓 (𝑎 𝑛 𝑘 𝑗 ) → ℓ 1 , 𝑔(𝑎 𝑛 𝑘 𝑗 → ℓ 2 con ℓ 1 + ℓ 2 = ℓ . Ma allora per
definizione di lim sup si avrà lim sup 𝑓 (𝑥) ≥ ℓ 1 e lim sup 𝑔(𝑥) ≥ ℓ 2 da cui
lim sup 𝑓 (𝑥) + lim sup 𝑔(𝑥) ≥ ℓ 1 + ℓ 2 = ℓ .

Per il punto 4. si osserva che se ℓ = lim sup 𝑓 (𝑥) allora per ogni 𝑞 > ℓ si ha
definitivamente 𝑓 (𝑥) < 𝑞 e di conseguenza anche 𝑔(𝑥) < 𝑞 definitivamente.
Dunque lim sup 𝑔(𝑥) ≤ ℓ . Se invece poniamo ℓ = lim inf ℎ(𝑥) allora per ogni
𝑞 < 𝑙 si ha definitivamente 𝑔(𝑥) ≥ 𝑞 ma allora anche 𝑓 (𝑥) ≥ 𝑞 defitiviamente e
quindi lim inf 𝑓 (𝑥) ≥ ℓ .
Cesàro
Teorema 2.77 (convergenza alla Cesàro). Sia 𝑎 𝑛 una successione a termini positivi.

1. Se 𝑎 𝑛 → ℓ ∈ ℝ̄ allora
𝑛
1 X
· 𝑎𝑘 → ℓ .
𝑛 𝑘=1
𝑎 𝑛+1 √
2. Se 𝑎 𝑛 > 0, → ℓ ∈ [0, +∞] allora 𝑛 𝑎 𝑛 → ℓ .
𝑎𝑛

Dimostrazione. Dimostriamo il primo punto. Per ogni 𝑞 < ℓ visto che 𝑎 𝑛 → ℓ


deve esistere 𝑁 tale che 𝑎 𝑛 ≥ 𝑞 se 𝑛 > 𝑁 . Dunque
P𝑁
1X 𝑛
1X 𝑁
1 X 𝑛
𝑘=1
𝑎𝑘 𝑛−𝑁
𝑏𝑛 = 𝑎𝑘 ≥ 𝑎𝑘 + 𝑞= + · 𝑞 → 𝑞.
𝑛 𝑘=1 𝑛 𝑘=1 𝑛 𝑘=𝑁+1 𝑛 𝑛

Significa che per ogni 𝑞 < ℓ si ha lim inf 𝑏 𝑛 ≥ 𝑞 e dunque lim inf 𝑏 𝑛 ≥ ℓ .
Viceversa per ogni 𝑞 > ℓ ragionando in maniera analoga si ottiene che 𝑏 𝑛 non
supera una successione che tende a 𝑞 . Dunque lim sup 𝑏 𝑛 ≤ 𝑞 . Mettendo
insieme le cose si deduce che lim 𝑏 𝑛 = 𝑞 .

Il punto 2 si può ricondurre all’1. Infatti


𝑎1 𝑎𝑛
𝑎1 𝑎𝑛 ln 𝑎 0 + ln + · · · + ln
r
√ 𝑎0 𝑎 𝑛−1
ln 𝑛
𝑎 𝑛 = ln 𝑛
𝑎0 · ··· = .
𝑎0 𝑎 𝑛−1 𝑛

Posto 𝑥 𝑛 = ln 𝑎𝑎𝑛−𝑛 1 se 𝑎𝑎𝑛−𝑛 1 → ℓ si ha 𝑥 𝑛 → ln ℓ (intendendo ln 0 = −∞ e


ln(+∞) = +∞) e dunque

√ ln 𝑎 0 𝑥 1 + · · · + 𝑥 𝑛
ln 𝑛
𝑎𝑛 = + → ln ℓ .
𝑛 𝑛
2.14 il teorema degli zeri 107

Facendo l’esponenziale di ambo i membri si trova il risultato desiderato.

Esercizio 2.78. Si applichi il risultato precedente per verificare che



𝑛
lim 𝑛=1

e
𝑛
lim √
𝑛
= 𝑒.
𝑛!

Esercizio 2.79. Si consideri la successione


(
2𝑛 se 𝑛 pari ,
𝑎𝑛 =
𝑛 · 2𝑛 se 𝑛 dispari.

Verificare che alla successione 𝑎 𝑛 si può applicare il criterio della radice ma non il
criterio del rapporto. Usare questo esempio per mostrare che le implicazioni enunciate
nel teorema 2.77 non possono essere invertite.

2.14 il teorema degli zeri


teorema degli zeri
Teorema 2.80 (degli zeri). Sia 𝐼 ⊆ ℝ un intervallo, 𝑓 : 𝐼 → ℝ una funzione
continua, 𝑎, 𝑏 ∈ 𝐼 tali che 𝑓 (𝑎) ≤ 0 e 𝑓 (𝑏) ≥ 0. Allora esiste 𝑐 ∈ 𝐼 tale che 𝑓 (𝑐) = 0.

Dimostrazione. La dimostrazione che adottiamo è di particolare rilevanza in


quanto non solo permette di dimostrare l’esistenza del punto 𝑐 che risolve
metodo di bisezione
𝑓 (𝑥) = 0 ma ci presenta un algoritmo, il metodo di bisezione, che può essere
effettivamente utilizzato per approssimare tale soluzione.

Possiamo supporre senza perdere di generalità che sia 𝑎 < 𝑏 . Poniamo 𝐴0 = 𝑎 ,


𝐵0 = 𝑏 e consideriamo il punto medio 𝐶0 = (𝐴0 + 𝐵0 )/2. Scegliamo tra
i due intervalli [𝐴0 , 𝐶0 ] e [𝐶0 , 𝐵0 ] quello per cui il segno ai due estremi è
discorde (o, caso fortunato, nullo). Più precisamente se 𝑓 (𝐶0 ) ≥ 0 poniamo
[𝐴1 , 𝐵1 ] = [𝐴0 , 𝐶0 ] altrimenti scegliamo [𝐴1 , 𝐵1 ] = [𝐶0 , 𝐵0 ] così si ha, in ogni
caso, 𝑓 (𝐴1 ) ≤ 0, 𝑓 (𝐵1 ) ≥ 0.

Consideriamo il punto medio 𝐶1 del nuovo intervallo [𝐴1 , 𝐵1 ] e ripetiamo il


procedimento indefinitamente. Quello che otteniamo sono due successioni 𝐴𝑛 ,
𝐵𝑛 con queste proprietà (che potrebbero essere dimostrate per induzione):

1. 𝐴𝑛 < 𝐵𝑛 , 𝐵𝑛 − 𝐴𝑛 = (𝑏 − 𝑎)/2𝑛 ;
2. 𝐴𝑛 è crescente, 𝐵𝑛 è decrescente;
3. 𝑓 (𝐴𝑛 ) ≤ 0, 𝑓 (𝐵𝑛 ) ≥ 0.

Essendo 𝐴𝑛 monotòna sappiamo che 𝐴𝑛 converge 𝐴𝑛 → 𝑐 . Inoltre visto che


𝐴𝑛 ∈ [𝑎, 𝑏] anche 𝑐 ∈ [𝑎, 𝑏] (per la permanenza del segno delle successione
𝐴𝑛 − 𝑎 e 𝑏 − 𝐴𝑛 ). Passando al limite nell’uguaglianza 𝐵𝑛 = 𝐴𝑛 + (𝑏 − 𝑎)/2𝑛 si
ottiene che anche 𝐵𝑛 → 𝑐 . Essendo 𝑓 continua avremo

𝑓 (𝐴𝑛 ) → 𝑓 (𝑐), 𝑓 (𝐵𝑛 ) → 𝑓 (𝑐).


108 2 funzioni continue, limiti e successioni

Tabella 2.1: Le prime 100 cifre decimali



2 ≈ 1.4142135623 7309504880 1688724209 6980785696 7187537694
di alcune costanti calcolate con il metodo
di bisezione usato nella dimostrazione 8073176679 7379907324 7846210703 8850387534 3276415727
del teorema 2.80. Si veda il codice a pa-

gina 425. 3 ≈ 1.7320508075 6887729352 7446341505 8723669428 0525381038
0628055806 9794519330 1690880003 7081146186 7572485757


5+1
𝜑= 2 ≈ 1.6180339887 4989484820 4586834365 6381177203 0917980576
2862135448 6227052604 6281890244 9707207204 1893911375

Ma 𝑓 (𝐴𝑛 ) ≤ 0 e quindi per la permanenza del segno anche 𝑓 (𝑐) ≤ 0. D’altra


parte 𝑓 (𝐵𝑛 ) ≥ 0 e quindi 𝑓 (𝑐) ≥ 0. Si ottiene dunque 𝑓 (𝑐) = 0, come volevamo
dimostrare.

Esempio 2.81. Si voglia risolvere l’equazione

𝑥 5 − 𝑥 − 1 = 0.

Svolgimento. Posto 𝑓 (𝑥) = 𝑥 5 − 𝑥 − 1 è chiaro che la funzione 𝑓 : ℝ → ℝ è


continua (in quanto composizione di funzioni continue). Osserviamo che
𝑓 (0) = −1 e 𝑓 (2) = 29, dunque la funzione soddisfa le ipotesi del teorema degli
zeri sull’intervallo [0 , 2]. Sappiamo quindi che l’equazione in questione ha
almeno una soluzione in tale intervallo.
Utilizzando il metodo di bisezione possiamo determinare una soluzione con
precisione arbitraria. Posto 𝐴0 = 0, 𝐵0 = 2 abbiamo verificato che 𝑓 (𝐴0 ) < 0 e
𝑓 (𝐵0 ) > 0. Prendiamo il punto medio 𝐶0 = 1 e calcoliamo la funzione: 𝑓 (𝐶0 ) =
−1 < 0. Sappiamo allora che una soluzione deve essere compresa nell’intevallo
[𝐴1 , 𝐵1 ] = [𝐶0 , 𝐵0 ] = [1 , 2] perché anche in tale intervallo valgono le ipotesi del
teorema degli zeri. Il punto medio di tale intervallo è 𝐶1 = 3/2 = 1.5 e risulta
𝑓 (3/2) = 163/32 > 0 dunque l’intervallo successivo che andremo a considerare
è [𝐴2 , 𝐵2 ] = [1 , 3/2]. Per non dover lavorare con troppe cifre decimali invece di
suddividere esattamente a metà quest’ultimo intervallo consideriamo un punto
intermedio 𝐶2 = 6/5 = 1.2 dove si ha 𝑓 (𝐶2 ) = 901/3125 > 0. Sappiamo allora
che una soluzione è compresa nell’intervallo [𝐴3 , 𝐵3 ] = [1 , 1.2]. Prendiamo il
punto medio 𝐶3 = 11/10 = 1.1 e troviamo 𝑓 (𝐶3 ) = −48949/105 < 0. Abbiamo
quindi ottenuto che esiste 𝑥 ∈ (1.1 , 1.2) tale che 𝑓 (𝑥) = 0. Sappiamo quindi che
|𝑥 − 1.15 | < 0.05 cioè abbiamo trovato 𝑥 con un errore inferiore a 0.05.
Con molta pazienza si può procedere con il metodo di bisezione fino ad
arrivare a verificare che 𝑓 (116/102 ) = −596583424/1010 < 0 e 𝑓 (117/102 ) =
224480357/1010 > 0 da cui si ottiene che una soluzione è compresa tra 1.16
e 1.17 con un errore inferiore a 0.005. Con il calcolatore (si veda ad esem-
pio il codice a pagina 425) si possono ottenere più cifre significative: 𝑥 =
1.1673039782614187 . . .

proprietà dei valori intermedi


Corollario 2.82 (proprietà dei valori intermedi). Sia 𝐼 ⊆ ℝ un intervallo e
𝑓 : 𝐼 → ℝ una funzione continua. Allora se 𝑓 assume due valori 𝑦1 e 𝑦2 allora 𝑓
assume anche tutti i valori intermedi tra 𝑦1 e 𝑦2 . Detto altrimenti: una funzione
continua manda intervalli in intervalli.
2.15 il teorema di Weierstrass 109

Dimostrazione. Se 𝑦1 e 𝑦2 sono valori assunti da 𝑓 significa che esistono 𝑥 1 , 𝑥 2 ∈ 𝐼


tali che 𝑓 (𝑥 1 ) = 𝑦1 e 𝑓 (𝑥 2 ) = 𝑦2 . Allora scelto 𝑦 si consideri la funzione
𝑔(𝑥) = 𝑓 (𝑥) − 𝑦 . Se 𝑦 è intermedio tra 𝑦1 e 𝑦2 la funzione 𝑔 assumerà segni
opposti in 𝑥 1 e 𝑥 2 e dunque, per il teorema degli zeri, dovrà esserci un punto
𝑥 in cui 𝑔 si annulla. In tale punto si avrà dunque 𝑓 (𝑥) = 𝑦 , come volevamo
dimostrare.

Lemma 2.83. Se 𝐼 è un intervallo di ℝ ogni funzione 𝑓 : 𝐼 → ℝ iniettiva e continua è


strettamente monotona.

Dimostrazione. Si può osservare che una funzione è strettamente monotona se


mantiene i valori intermedi cioè se dati tre punti 𝑥 < 𝑦 < 𝑧 risulta sempre che
𝑓 (𝑦) è un valore intermedio tra 𝑓 (𝑥) e 𝑓 (𝑧):

𝑓 (𝑥) < 𝑓 (𝑦) < 𝑓 (𝑧) oppure 𝑓 (𝑥) > 𝑓 (𝑦) > 𝑓 (𝑧).

Se ciò non accadesse, ad esempio se fosse 𝑓 (𝑦) > 𝑓 (𝑧) > 𝑓 (𝑥) con 𝑥 < 𝑦 < 𝑧
allora per la continuità di 𝑓 dovrebbe esistere un valore intermedio tra 𝑥 e 𝑦
in cui la funzione assume il valore 𝑓 (𝑧). Ma allora la funzione non sarebbe
iniettiva.

2.15 il teorema di Weierstrass

Ricordiamo che nella definizione 1.70 abbiamo definito i concetti di massimo,


minimo, estremo superiore e inferiore di una funzione a valori reali.

successioni minimizzanti/massimizzanti
Lemma 2.84 (successioni minimizzanti/massimizzanti). Sia 𝐴 un insieme non
vuoto e sia 𝑓 : 𝐴 → ℝ una funzione. Allora esistono due successioni 𝑎 𝑛 e 𝑏 𝑛 di punti
di 𝐴 tali che

lim 𝑓 (𝑎 𝑛 ) = inf 𝑓 (𝐴), lim 𝑓 (𝑏 𝑛 ) = sup 𝑓 (𝐴).


𝑛→+∞ 𝑛→+∞

Dimostrazione. Ricordiamo che 𝑓 (𝐴) = { 𝑓 (𝑥) : 𝑥 ∈ 𝐴} è l’immagine della fun-


zione 𝑓 . Facciamo la dimostrazione per l’estremo inferiore, risultato analogo si
potrà ottenere per l’estremo superiore.
Sia 𝑚 = inf 𝑓 (𝐴). Se 𝑚 = −∞ significa che 𝑓 (𝐴) non è inferiormente limitato,
in particolare per ogni 𝑛 ∈ ℝ esiste 𝑎 𝑛 tale che 𝑓 (𝑎 𝑛 ) < −𝑛 . Dunque (per
confronto) 𝑓 (𝑎 𝑛 ) → −∞ come volevamo dimostrare.
Se 𝑚 ∈ ℝ per le proprietà caratterizzanti l’estremo inferiore sappiamo che per
ogni 𝜀 > 0 esiste 𝑎 ∈ 𝐴 tale che 𝑓 (𝑎) < 𝑚 + 𝜀. Per ogni 𝑛 ∈ ℕ possiamo scegliere
𝜀 = 1/𝑛 e ottenere quindi una successione 𝑎 𝑛 tale che 𝑓 (𝑎 𝑛 ) < 𝑚 + 1/𝑛 . D’altra
parte essendo 𝑚 un minorante di 𝑓 (𝐴) sappiamo che 𝑚 ≤ 𝑓 (𝑎 𝑛 ). Abbiamo
dunque 𝑚 ≤ 𝑓 (𝑎 𝑛 ) < 𝑚 + 1/𝑛 e per il teorema dei carabinieri possiamo quindi
concludere che 𝑓 (𝑎 𝑛 ) → 𝑚 per 𝑛 → +∞.

teorema di Weierstrass
Teorema 2.85 (Weierstrass). Siano 𝑎, 𝑏 ∈ ℝ con 𝑎 ≤ 𝑏 e sia 𝑓 : [𝑎, 𝑏] → ℝ una
funzione continua. Allora esistono punti di massimo e di minimo per 𝑓 su [𝑎, 𝑏].
110 2 funzioni continue, limiti e successioni

Probabilmente già dal IX secolo a.C. era Dimostrazione. Dimostriamo solamente che 𝑓 ha minimo, per il massimo la
noto ai greci che la circonferenza, tra tut- dimostrazione procede infatti in maniera del tutto analoga.
te le figure piane che racchiudono una
area prefissata, è quella di lunghezza Sia 𝑚 = inf 𝑓 ([𝑎, 𝑏]). Per il lemma precedente sappiamo che esiste una
minima (proprietà isoperimetrica). Nel-
successione 𝑎 𝑛 minimizzante ovvero tale che 𝑎 𝑛 ∈ 𝐴 e 𝑓 (𝑎 𝑛 ) → 𝑚 per 𝑛 → +∞.
l’Eneide Virgilio racconta che Didone si
trovò ad affrontare un problema simile Per il teorema di Bolzano-Weierstrass dalla successione 𝑎 𝑛 possiamo estrarre
nella fondazione di Cartagine. Una for-
malizzazione completa della proprietà
una sottosuccessione 𝑎 𝑛 𝑘 convergente: 𝑎 𝑛 𝑘 → 𝑥 0 . Visto che 𝑎 𝑛 𝑘 ∈ [𝑎, 𝑏] si avrà,
isoperimetrica del cerchio ha dovuto at- per il teorema della permanenza del segno, anche 𝑥 0 ∈ [𝑎, 𝑏] (si applichi la
tendere fino al 1800. Eulero (Leonhard permanenza del segno alle successioni 𝑎 𝑛 𝑘 − 𝑎 e 𝑏 − 𝑎 𝑛 𝑘 ).
Euler 1707–1783) pensò di aver trovato
una dimostrazione che si fondava su que- Dunque abbiamo una successione 𝑎 𝑛 𝑘 → 𝑥 0 con 𝑎 𝑛 𝑘 ∈ [𝑎, 𝑏] e 𝑥 0 ∈ [𝑎, 𝑏].
sto risultato: presa una qualunque super- Essendo 𝑓 continua si avrà dunque 𝑓 (𝑎 𝑛 𝑘 ) → 𝑓 (𝑥 0 ). Ma noi sapevamo che
ficie chiusa nello spazio, se questa non
è una sfera è possibile farne una piccola
𝑓 (𝑎 𝑛 ) → 𝑚 e dunque anche 𝑓 (𝑎 𝑛 𝑘 ) → 𝑚 . Concludiamo quindi che 𝑓 (𝑥 0 ) = 𝑚
modifica in modo da ottenere una nuova cioè 𝑚 , l’estremo inferiore, è un valore assunto dalla funzione ed è quindi un
superficie che racchiude lo stesso volu- minimo. Dal canto suo 𝑥 0 è un punto di minimo assoluto.
me ma che ha area strettamente inferiore.
Fu proprio Karl Weiestrass (1815–1897)
ad accorgersi che quanto dimostrato da Corollario 2.86 (limitatezza delle funzioni continue). Sia 𝑓 : [𝑎, 𝑏] → ℝ una
Eulero (e poi successivamente da Steiner) funzione continua. Allora 𝑓 è limitata.
non è sufficiente a garantire la minimali-
tà della sfera. Infatti Eulero dimostra che
non ci può essere un minimo che non sia Dimostrazione. Visto che 𝑓 ha massimo 𝑀 e minimo 𝑚 si ha 𝑓 (𝑥) ∈ [𝑚, 𝑀] per
la sfera, ma non dimostra che il minimo ogni 𝑥 ∈ [𝑎, 𝑏]. Ovviamente 𝑚 > −∞ e 𝑀 < +∞ in quanto 𝑚 e 𝑀 sono valori
esiste e quindi non è detto che la sfera della funzione 𝑓 .
sia il minimo: potrebbero esserci infini-
te superfici 𝑆1 , 𝑆2 , . . . , 𝑆𝑛 , . . . ognuna
con area minore di quella della sfera e
ognuna con area maggiore della succes- 2.16 successioni ricorsive
siva: 𝐴(𝑆𝑛+1 ) < 𝐴(𝑆𝑛 ). Per concludere il
ragionamento di Eulero era necessario
dimostrare che in una situazione del ge- Le successioni ricorsive sono le successioni definite per induzione (tramite il
nere le superifici 𝑆𝑛 debbano, in qualche teorema 1.10):
senso, tendere alla superficie sferica e (
che le loro aree debbano tendere all’area 𝑎0 = 𝛼
della sfera. In astratto questo è quanto 𝑎 𝑛+1 = 𝑓 (𝑎 𝑛 ).
viene enunciato nel teorema che porta il
suo nome. Dunque Weiestrass completò Si rimanda al capitolo 8 per uno studio approfondito di questo tipo di successioni.
la dimostrazione della proprietà isoperi-
La prima parte di quel capitolo è infatti accessibile con le nozioni che sono
metrica in dimensione 𝑛 = 2 (in realtà il
risultato è comunque attribuito a Steiner state sviluppate finora. La seconda parte richiederà invece degli strumenti più
che, pur non avendo colto il problema avanzati.
obiettato da Weierstrass, aveva in effetti
dimostrato tutte le proprietà necessarie
per giungere alla conclusione). Salendo
alla dimensione 𝑛 = 3 è naturale imma-
ginare che la superficie che racchiude
il volume maggiore con area fissata sia
la sfera. Questo spiega il motivo per cui
una goccia d’acqua, in assenza di gravità,
dovrebbe assumere una forma sferica: a
causa della tensione superficiale, infat-
ti, la superficie della goccia tenderà ad
avere l’area minima. Formalizzare e di-
mostrare questo risultato risulta molto
più complicato. Per superifici qualun-
que la prima dimostrazione formale per
𝑛 ≥ 3 è dovuta al matematico italiano
Ennio De Giorgi (1928–1996) che forma-
lizzò il concetto di perimetro introdotto
da Renato Caccioppoli (1904–1959).
serie 3
Data una successione 𝑎 𝑛 di numeri reali o complessi possiamo considerare la
successione delle cosiddette somme parziali somme parziali

𝑛
X
𝑆𝑛 = 𝑎𝑘 .
𝑘=0

Potremo scrivere più concisamente 𝑆𝑛 = 𝑎 𝑛 . Intuitivamente si intende


P
sommare i termini della successione 𝑎 𝑘 per 𝑘 che parte da 0 fino a 𝑘 = 𝑛 :
𝑛
X
𝑎 𝑘 = 𝑎0 + 𝑎1 + 𝑎2 + · · · + 𝑎 𝑛 .
𝑘=0

𝑛
X
Formalmente la somma 𝑆𝑛 = 𝑎 𝑘 è definita ricorsivamente dalle seguenti
𝑘=0
relazioni: (
𝑆0 = 𝑎 0 ,
𝑆𝑛+1 = 𝑆𝑛 + 𝑎 𝑛+1 .

I numeri 𝑎 𝑛 si chiamano termini della serie. Se la successione delle somme termini


parziali ammette limite il limite viene chiamato somma della serie e si indica somma
con
+∞
X 𝑛
X
𝑎 𝑘 = lim 𝑆𝑛 = lim 𝑎𝑘 .
𝑛→+∞ 𝑛→+∞
𝑘=0 𝑘=0

La terminologia già introdotta per le successioni si applica anche alle serie che
sono in effetti anch’esse delle successioni. In particolare una serie può essere
convergente, divergente o indeterminata. Questo è il carattere della serie. carattere

Più in generale si potrà considerare la somma che parte da un certo indice


𝑚 ∈ ℤ. Fissato 𝑚 si potrà ad esempio considerare la serie:
𝑛
X
𝑆𝑛 = 𝑎𝑘
𝑘=𝑚

che risulta definita per ogni 𝑛 ∈ ℕ , 𝑛 ≥ 𝑚 come

𝑆𝑛 = 𝑎 𝑚 + 𝑎 𝑚+1 + · · · + 𝑎 𝑛 .

Esempio 3.1. Consideriamo la serie 𝑆𝑛 definita come la somma dei numeri naturali da
1 a 𝑛:
𝑛
X
𝑆𝑛 = 𝑘 = 1 + 2 + · · · + 𝑛.
𝑘=1

Si può dimostrare facilmente per induzione che si ha

𝑛(𝑛 + 1)
𝑆𝑛 = .
2
112 3 serie

E mediante la definizione di limite si può verificare che risulta 𝑆𝑛 → +∞.

𝑛 è divergente:
P
Questo si esprime dicendo che la serie
+∞
X
𝑘 = +∞.
𝑘=1

Esempio 3.2 (la serie geometrica). Fissato 𝑞 ∈ ℝ o 𝑞 ∈ ℂ alla successione 𝑎 𝑛 = 𝑞 𝑛


di termini
𝑎0 = 1, 𝑎1 = 𝑞, 𝑎2 = 𝑞 2 , 𝑎3 = 𝑞 3 , . . .
𝑞 𝑛 le cui somme parziali sono
P
serie geometrica è associata la serie geometrica

𝑆0 = 1 , 𝑆1 = 1 + 𝑞, 𝑆2 = 1 + 𝑞 + 𝑞 2 , ...

Il seguente teorema ci mostra come per diversi valori di 𝑞 la serie geometrica


assume tutti i possibili caratteri: convergente, divergente, indeterminato.
somma della serie geometrica
Teorema 3.3 (somma della serie geometrica). Sia 𝑞 ∈ ℂ. Se 𝑞 ≠ 1 si ha
𝑛
1 − 𝑞 𝑛+1
𝑞𝑘 =
X
.
𝑘=0
1−𝑞

Se |𝑞| < 1 la serie geometrica converge:


+∞
1
𝑞𝑘 =
X
.
𝑘=0
1−𝑞

Se |𝑞| ≥ 1 la serie non converge ma dobbiamo distinguere se la serie si considera a valori


reali o complessi per determinarne il carattere.

Se consideriamo la serie a valori reali (quindi 𝑞 ∈ ℝ) se 𝑞 ≥ 1 la serie diverge a +∞, se


𝑞 ≤ −1 la serie è indeterminata.

Se consideriamo la serie a valori complessi 𝑞 ∈ ℂ, se |𝑞| > 1 la serie diverge a ∞, lo


stesso succede se 𝑞 = 1. Se |𝑞| = 1 ma 𝑞 ≠ 1 la serie è indeterminata.

Dimostrazione. Il primo risultato riguarda una somma finita. Si ha

𝑛 𝑛 𝑛 𝑛 𝑛+1
𝑞𝑘 = 𝑞𝑘 − 𝑞 · 𝑞𝑘 = 𝑞𝑘 − 𝑞 𝑘 = 1 − 𝑞 𝑛+1
X X X X X
(1 − 𝑞) ·
𝑘=0 𝑘=0 𝑘=0 𝑘=0 𝑘=1

da cui si ottiene, se 𝑞 ≠ 1, il risultato voluto.

Passando al limite per 𝑛 → +∞, se |𝑞| < 1 si nota che 𝑞 𝑛+1 = |𝑞| 𝑛+1 → 0 e la

1
serie converge a 1−𝑞 .

Consideriamo ora la serie a valori reali. Se 𝑞 > 1 osserviamo che 𝑞 𝑛 → +∞ e


quindi la serie diverge a +∞ (infatti in questo caso 1 − 𝑞 è negativo). Se 𝑞 = 1 si
𝑛
ha 𝑞 𝑘 = 1 e quindi 𝑞 𝑘 = 𝑛 + 1 → +∞.
X
𝑘=0
113

Per gli altri casi osserviamo che si ha

𝑛
1 − 𝑞 𝑘+1 1 𝑞
𝑞𝑘 = · 𝑞𝑘
X
= −
𝑘=0
1−𝑞 1−𝑞 1−𝑞

e dunque il carattere della serie coincide con il carattere della successione 𝑞 𝑘 . Se


consideriamo la 𝑘successione a valori complessi e se |𝑞| > 1 la serie è divergente
𝑘
a ∞ in quanto 𝑞 = |𝑞| → +∞. Se invece consideriamo la serie a valori reali e


𝑞 < 1 (il caso 𝑞 ≥ 1 l’abbiamo già considerato) la serie risulta indeterminata in
quanto in valore assoluto tende a +∞ ma il segno dei termini pari è opposto al
segno dei termini dispari.

Ci rimane da considerare il caso |𝑞| = 1, 𝑞 ≠ 1. Se 𝑞 è reale c’è solo il caso


𝑞 = −1 e sappiamo che (−1) 𝑘 è indeterminata. Anche se 𝑞 è complesso vogliamo
𝑘
dimostrare che la successione
𝑘
𝑘𝑞 è indeterminata: se non lo fosse si avrebbe
𝑞 → ℓ con |ℓ | = 1 in quanto 𝑞 = 1. e passando al limite nell’uguaglianza

𝑞 𝑘+2 = 𝑞 · 𝑞 𝑘+1

si avrebbe ℓ = 𝑞 · ℓ da cui (dividendo per ℓ ) otteniamo 𝑞 = 1. Dunque se 𝑞 ≠ 1


la successione 𝑞 𝑘 è indeterminata e così è la serie geometrica.
linearità della somma infinita
Teorema 3.4 (linearità della somma). Se 𝑎 𝑛 e 𝑏 𝑛 sono convergenti allora per
P P
ogni 𝜆, 𝜇 ∈ ℂ anche (𝜆𝑎 𝑛 + 𝜇𝑏 𝑛 ) è convergente e si h
P

+∞
X +∞
X +∞
X
(𝜆𝑎 𝑛 + 𝜇𝑏 𝑛 ) = 𝜆 𝑎𝑛 + 𝜇 𝑏𝑛 .
𝑘=0 𝑘=0 𝑘=0

Dimostrazione. Se 𝑆𝑛 e 𝑅 𝑛 sono le somme parziali delle serie 𝑎 𝑛 e 𝑏 𝑛 allora


P P
le somme parziali della serie (𝜆𝑎 𝑛 + 𝜇𝑏 𝑛 ) sono 𝜆𝑆𝑛 + 𝜇𝑅 𝑛 (in quanto sulle
P
somme finite vale la proprietà distributiva e commutativa). Ma se 𝑆𝑛 → 𝑆 e
𝑅 𝑛 → 𝑅 allora 𝜆𝑆𝑛 + 𝜇𝑅 𝑛 → 𝜆𝑆 + 𝜇𝑅 .

Osserviamo che le serie (così come le successioni) formano uno spazio vettoriale
in cui le operazioni di somma e prodotto per scalare vengono eseguite termine a
termine: 𝑎 𝑛 + 𝑏 𝑛 = (𝑎 𝑛 + 𝑏 𝑛 ), 𝜆 𝑎 𝑛 = (𝜆𝑎 𝑛 ). Il teorema precedente ci
P P P P P
dice allora che le serie (così come le successioni) convergenti sono un sottospazio
vettoriale e che la somma della serie (così come il limite della successione) è
un’operatore lineare definito su tale sottospazio.
condizione necessaria per la convergenza

𝑎 𝑛 converge
P
Teorema 3.5 (condizione necessaria per la convergenza). Se la serie
allora 𝑎 𝑛 → 0.

Dimostrazione. Se la serie 𝑎 𝑛 converge significa che le somme parziali 𝑆𝑛 =


P
P𝑛
𝑎 convergono: 𝑆𝑛 → 𝑆. Ma allora
𝑘=0 𝑘

𝑎 𝑛 = 𝑆𝑛 − 𝑆𝑛−1 → 𝑆 − 𝑆 = 0.
114 3 serie

Teorema 3.6 (stabilità del carattere). Se le due successioni 𝑎 𝑛 e 𝑏 𝑛 differiscono solo


su un numero finito di termini, allora le serie corrispondenti 𝑎 𝑛 e 𝑏 𝑛 hanno lo
P P
stabilità del carattere
stesso carattere.

Dimostrazione. Se le successioni differiscono su un numero finito di termini


significa che esiste un 𝑁 ∈ ℕ tale che per ogni 𝑘 > 𝑁 si ha 𝑎 𝑘 = 𝑏 𝑘 . Dunque
se indichiamo con 𝑆𝑛 = 𝑛𝑘=0 𝑎 𝑘 e 𝑅 𝑛 = 𝑛𝑘=0 𝑏 𝑘 le corrispondenti successioni
P P
delle somme parziali, si avrà per ogni 𝑛 > 𝑁

𝑛
X 𝑛
X 𝑁
X
𝑆𝑛 − 𝑅 𝑛 = 𝑎𝑘 − 𝑏𝑘 = (𝑎 𝑘 − 𝑏 𝑘 ) = 𝐶
𝑘=0 𝑘=0 𝑘=0

dove 𝐶 è una costante indipendente da 𝑛 . Dunque

𝑆𝑛 = 𝑅 𝑛 + 𝐶.

Se il limite di 𝑅 𝑛 non esiste allora non esiste neanche il limite di 𝑆𝑛 (altrimenti


essendo 𝑅 𝑛 = 𝑆𝑛 − 𝐶 anche il limite di 𝑅 𝑛 dovrebbe esistere). Se il limite di 𝑅 𝑛
è infinito allora il limite di 𝑆𝑛 è uguale al limite di 𝑅 𝑛 . E se il limite di 𝑅 𝑛 è
finito anche il limite di 𝑆𝑛 è finito.

Dunque il carattere della successione 𝑆𝑛 è lo stesso della successione 𝑅 𝑛 cioè le


due serie hanno lo stesso carattere.

Se una serie ha primo termine con un indice diverso da 0 ci si potrà sempre


ricondurre (con un cambio di variabile) ad una serie il cui indice parte da zero.
Ad esempio (facendo il cambio di variabile 𝑗 = 𝑘 − 1 da cui 𝑗 = 0 quando 𝑘 = 1
e ricordando che l’indice utilizzato nelle somme delle serie è una variabile
muta):
+∞ +∞ +∞
X 1 X 1 X 1
𝑘
= 𝑗+ 1
= 𝑘+1
.
𝑘=1 2 𝑗=0 2 𝑘=0 2

Si osservi inoltre che in base al teorema precedente quale sia il primo indice da
cui si comincia a sommare non è rilevante per quanto riguarda il carattere della
serie. Se però la serie è convergente la sua somma può variare, ad esempio:
!
+∞ +∞
X 1 X 1
= − 20 .
𝑘=1 2𝑘 𝑘=0 2𝑘

Nota bene: in molti libri si scrive ∞ al posto di +∞. Risulta quindi molto
comune omettere il segno + davanti a ∞ nella terminologia delle serie (e anche
delle successioni) visto che gli indici si intendono numeri naturali e quindi −∞
non avrebbe senso.

Ci sono però casi in cui può essere utile usare anche gli indici negativi, ad
esempio se 𝑎 𝑘 è definita per ogni 𝑘 ∈ ℤ si potrebbe definire (ma non lo faremo):
+∞
X +∞
X +∞
X
𝑎𝑘 = 𝑎𝑘 + 𝑎(−𝑘)
𝑘=−∞ 𝑘=0 𝑘=1
3.1 serie telescopiche 115

richiedendo che entrambe le serie al lato destro dell’uguaglianza esistano e non


abbiano somme infinite di segno opposto.

𝑎 𝑛 una serie convergente.


P
Teorema 3.7 (coda di una serie convergente). Sia
Allora
+∞
X
lim 𝑎 𝑘 = 0.
𝑛→+∞
𝑘=𝑛+1

Dimostrazione. Posto
𝑛
X
𝑆𝑛 = 𝑎𝑘 ,
𝑘=0

per definizione di serie convergente sappiamo che esiste 𝑆 finito tale che 𝑆𝑛 → 𝑆 .
Osserviamo allora che
+∞
X 𝑁
X
𝑎 𝑘 = lim 𝑎 𝑘 = lim 𝑆 𝑁 − 𝑆𝑛 = 𝑆 − 𝑆𝑛
𝑁→+∞ 𝑁→+∞
𝑘=𝑛+1 𝑘=𝑛+1

e, per 𝑛 → +∞ si ha ovviamente 𝑆 − 𝑆𝑛 → 𝑆 − 𝑆 = 0.

3.1 serie telescopiche

Una serie scritta nella forma


X
(𝑎 𝑘 − 𝑎 𝑘+1 )

viene detta telescopica in quanto i singoli termini della somma (come i tubi di serie telescopica
un cannocchiale), si semplificano uno con l’altro (permettendo al cannocchiale
di chiudersi):

𝑛
X 𝑛
X 𝑛+1
X
𝑆𝑛 = (𝑎 𝑘 − 𝑎 𝑘+1 ) = 𝑎𝑘 − 𝑎 𝑘 = 𝑎0 − 𝑎 𝑛+1 .
𝑘=0 𝑘=0 𝑘=1

In linea teorica ogni serie può essere scritta in forma telescopica, basta infatti
scegliere 𝑎 0 = 0, 𝑎 𝑛 = −𝑆𝑛−1 , affinché valga la relazione precedente. Scrivere
una serie in forma telescopica è quindi equivalente a determinare la successione
delle somme parziali.

Esempio 3.8 (serie di Mengoli). Si ha


+∞
X 1
= 1.
𝑛=1 𝑛(𝑛 + 1)

Dimostrazione. Infatti
𝑛 𝑛  𝑛 𝑛+1 
X 1 X 1 1 X 1 X 1 1
= − = − =1− → 1.
𝑘=1
𝑘(𝑘 + 1) 𝑘=1 𝑘 𝑘 + 1 𝑘=1
𝑘 𝑘=2
𝑘 𝑛 + 1
116 3 serie

3.2 serie a termini positivi

Nel seguito considereremo serie i cui termini sono numeri reali positivi (o
almeno non negativi). Quando scriveremo 𝑎 𝑛 > 0 (o 𝑎 𝑛 ≥ 0) sarà sempre
sottointeso che 𝑎 𝑛 ∈ ℝ visto che per i numeri complessi non reali non abbiamo
definito la relazione d’ordine.
carattere delle serie a termini positivi
Teorema 3.9 (carattere delle serie a termini positivi). Se 𝑎 𝑛 ≥ 0 la serie 𝑎𝑛 è
P
regolare: o converge oppure diverge a +∞.

Dimostrazione. Se 𝑎 𝑛 ≥ 0 essendo 𝑎 𝑛 = 𝑆𝑛 − 𝑆𝑛−1 significa che la successione


𝑆𝑛 delle somme parziali è crescente. Dunque il limite delle 𝑆𝑛 esiste e non può
essere negativo.
criterio del confronto

𝑎𝑛 e 𝑏 𝑛 serie a termini positivi


P P
Teorema 3.10 (criterio del confronto). Siano
che si confrontano: 0 ≤ 𝑎 𝑛 ≤ 𝑏 𝑛 . Allora
+∞
X +∞
X
𝑎𝑛 ≤ 𝑏𝑛 .
𝑘=0 𝑘=0

𝑏 𝑛 converge anche 𝑎 𝑛 converge e se 𝑎 𝑛 diverge anche 𝑏𝑛


P P P P
In particolare se
diverge.

Quest’ultimo risultato vale anche se 0 ≤ 𝑎 𝑛  𝑏 𝑛 .

Dimostrazione. Se 𝑆𝑛 sono le somme parziali di 𝑎 𝑛 e 𝑅 𝑛 sono le somme parziali


P
di 𝑏 𝑛 si ha 𝑆𝑛 ≤ 𝑅 𝑛 e il risultato si riconduce al confronto tra successioni.
P

Nel caso in cui 𝑎 𝑛  𝑏 𝑛 per definizione sappiamo che 𝑏𝑎𝑛𝑛 → 0 e quindi dalla
definizione di limite sappiamo che esiste 𝑁 tale che per ogni 𝑛 > 𝑁 si ha
(avendo scelto 𝜀 = 1)
𝑎𝑛
< 1.
𝑏𝑛
Dunque si ottiene 𝑎 𝑛 ≤ 𝑏 𝑛 per tutti gli 𝑛 tranne al più un numero finito. Sapendo
che il carattere della serie non cambia se si modifica la serie su un numero finito
di termini ci si riconduce al caso precedente.

Esempio 3.11. La serie


+∞
X 1
(3.1)
𝑘=1 𝑘2
è convergente. Infatti osservando che si ha per ogni 𝑛 > 0

1 1

(𝑛 + 1)2 𝑛(𝑛 + 1)

possiamo affermare che


+∞ +∞ +∞
X 1 X 1 X 1
=1+ ≤ 1 + =2
𝑘=1 𝑘2 𝑘=1 (𝑘 + 1)2
𝑘=1
𝑘(𝑘 + 1)
3.2 serie a termini positivi 117

in quanto ci siamo ricondotti alla serie telescopica di Mengoli che ha somma pari a 1.

Sappiamo quindi che la serie (3.1) è convergente senza sapere esattamente quale sia la
sua somma. Possiamo però trovare numericamente delle approssimazioni della somma,
facendo la somma dei primi termini e stimando l’errore tramite la serie di Mengoli, di
cui sappiamo calcolare la somma. Infatti se 𝑆 𝑁 è la somma parziale dei primi 𝑁 termini
e 𝑆 = lim 𝑆 𝑁 è la somma della serie, essendo 1/(𝑘 + 1)2 ≤ 1/(𝑘 2 + 𝑘) si ha
+∞
X 1 1
𝑆𝑁 ≤ 𝑆 ≤ 𝑆𝑁 + ≤ 𝑆𝑁 + .
𝑘=𝑁
𝑘(𝑘 + 1) 𝑁

Per calcolare le prime 6 cifre decimali esatte basterà quindi sommare il primo milione
di termini della serie. Lo si può fare, ad esempio, con il codice riportato a pagina 426,
ottenendo 𝑆 = 1.644934 . . .

Utilizzando strumenti molto più avanzati Eulero (Leonard Euler, 1707–1783) è riuscito
ad esprimere la somma di questa serie mediante costanti matematiche fondamentali (noi
lo faremo con un metodo diverso nell’esercizio 7.78).
criterio del confronto asintotico
Corollario 3.12 (criterio del confronto asintotico). Se 𝑎 𝑛 e 𝑏 𝑛 sono successio-
ni a termini positivi, asintoticamente equivalenti (definizione 2.57), allora le serie
corrispondenti 𝑎 𝑛 e 𝑏 𝑛 hanno lo stesso carattere.
P P

Dimostrazione. Le serie a termini positivi non possono essere indeterminate


quindi è sufficiente verificare che se una serie converge, converge anche l’altra.
Essendo 𝑎 𝑛 /𝑏 𝑛 convergente tale rapporto deve anche essere limitato, quindi
esiste 𝐶 ∈ ℝ tale che
𝑎𝑛 ≤ 𝐶 · 𝑏𝑛 .
Se la serie 𝑏 𝑛 converge anche 𝐶 · 𝑏 𝑛 converge e, per confronto, converge
P P
anche 𝑎 𝑛 .
P

Viceversa, scambiando il ruolo di 𝑎 𝑛 e 𝑏 𝑛 si verifica che se 𝑎 𝑛 converge, converge


anche 𝑏 𝑛 .

Esempio 3.13. La serie


X 𝑛 2 + 2𝑛 + 3
𝑛 2𝑛 4 − 𝑛 3 + 𝑛 + 1
è convergente. Infatti si può facilmente verificare che

𝑛 2 + 2𝑛 + 3 1
∼ .
2𝑛 − 𝑛 + 𝑛 + 1
4 3 2𝑛 2

Ma sappiamo che la serie 1/𝑛 2 è convergente, di conseguenza anche la serie 1/(2𝑛 2 )


P P
lo è (per linearità della somma) e quindi, per confronto asintotico, anche la serie data è
convergente. criterio della radice

Teorema 3.14 (criterio della radice). Sia 𝑎 𝑛 una serie a termini non negativi (cioè
P

𝑎 𝑛 ≥ 0) tale che 𝑛 𝑎 𝑛 → ℓ ∈ [0, +∞]. Se ℓ < 1 allora la serie converge. Se ℓ > 1
allora la serie diverge.
118 3 serie

Più in generale il risultato è valido con



ℓ = lim sup 𝑛
𝑎𝑛

anche nel caso in cui il limite di 𝑛
𝑎 𝑛 non dovesse esistere.

Dimostrazione. Nel caso ℓ < 1 prendiamo 𝑞 con ℓ < 𝑞 < 1 e poniamo 𝜀 = 𝑞 − ℓ .


√ √
Per la definizione di limite 𝑛 𝑎 𝑛 → ℓ (ma basta che sia lim sup 𝑛 𝑎 𝑛 = ℓ )
sappiamo esistere 𝑁 tale che per ogni 𝑛 > 𝑁 si abbia

𝑛
𝑎𝑛 < ℓ + 𝜀 = 𝑞

cioè
𝑎𝑛 < 𝑞 𝑛 .
Sapendo che 𝑞 𝑛 converge, sapendo anche che il carattere della serie non
P
cambia modificando un numero finito di termini, per confronto possiamo
concludere che anche la serie 𝑎 𝑛 converge.
P

Se ℓ > 1 si ha che 𝑛 𝑎 𝑛 > 1 e quindi 𝑎 𝑛 > 1 per infiniti valori di 𝑛 . La successione
𝑎 𝑛 non è infinitesima e quindi la serie non può convergere.

Esempio 3.15. La serie


2(ln 𝑘)−𝑘
X
𝑘

è convergente. Infatti si ha
p𝑘 ln 𝑘−𝑘 ln 𝑘 1
2ln 𝑘−𝑘 = 2 𝑘 =2 𝑘 −1 → 2− 1 = < 1.
2
criterio del rapporto
Teorema 3.16 (criterio del rapporto). Sia 𝑎 𝑛 una serie a termini non negativi
P
( 𝑎 𝑛 ≥ 0) tale che 𝑎 𝑛+1 /𝑎 𝑛 → ℓ ∈ [0 , +∞]. Se ℓ < 1 allora la serie converge. Se ℓ > 1
la serie diverge.

Dimostrazione. Non sarebbe difficile fare una dimostrazione diretta, simile alla
dimostrazione fatta per il criterio della radice. Possiamo però osservare che per

il criterio di convergenza alla Cesàro (teorema 2.77) si ha 𝑛 𝑎 𝑛 → ℓ quindi ci
riconduciamo al criterio della radice senza dover fare ulteriori dimostrazioni.

Esempio 3.17. Per ogni 𝑥 ≥ 0 la serie


X 𝑥𝑛
𝑛!
converge.

Dimostrazione. Applichiamo il criterio del rapporto. Posto 𝑎 𝑛 = 𝑥 𝑛 /𝑛 ! si ha

𝑎 𝑛+1 𝑥 𝑛+1 𝑛! 𝑥
= · 𝑛 = → 0 < 1.
𝑎𝑛 (𝑛 + 1)! 𝑥 𝑛+1

Dunque la serie converge.


3.2 serie a termini positivi 119

associatività della somma di una serie

Esempio 3.18. Posto 𝑎 𝑘 = (−1) 𝑘 sappiamo che la serie corrispondente:

1−1+1−1+1...

è indeterminata perché le somme parziali sono


(
𝑛
1 se 𝑛 pari
(−1) 𝑘 =
X
𝑆𝑛 =
𝑘=0 0 se 𝑛 è dispari.

Se però associamo i termini a due a due otteniamo la serie

(1 − 1) + (1 − 1) + (1 − 1) · · · = 0 + 0 + 0 + · · · = 0

che è convergente. Il motivo è che la successione delle somme parziali di questa nuova
serie è una particolare estratta (quella con gli indici pari) della successione delle somme
parziali della serie originale. Quindi non ci dovrebbe sorprendere il fatto che nonostante
la serie originale fosse indeterminata è possibile associare i termini della serie in modo
da ottenere una serie regolare (in questo caso convergente). In effetti per il teorema 2.66
di Bolzano-Weierstrass sappiamo che è sempre possibile estrarre una sottosuccessione
regolare (convergente o divergente) da qualunque successione. Anche quando da una
serie indeterminata si estrae una serie convergente la somma della serie può dipendere
da come i termini vengono associati. Se ad esempio nella serie precedente prendessimo
solamente le somme di indice dispari otterremmo:

1 + (−1 + 1) + (−1 + 1) + · · · = 1.

L’esempio precedente ci mostra che associando i termini di una serie indeter-


minata è possibile ottenere serie con carattere e somma diversi. Il seguente
teorema ci dice che questo fenomeno cattivo può solo avvenire quando si parte
da una serie indeterminata. Se la serie è regolare allora possiamo associarne i
termini senza modificarne né il carattere né la somma. In particolare questo è
vero per le serie a termini positivi.

𝑎 𝑘 è una serie, scelta


P
Teorema 3.19 (associatività delle serie regolari). Se
comunque una successione crescente 𝑘 𝑛 con 𝑘 0 = 0 possiamo considerare la serie 𝑏 𝑛
P
i cui termini
𝑘 𝑛+
X 1 −1
𝑏𝑛 = 𝑎𝑗
𝑗=𝑘 𝑛

si ottengono associando i termini di 𝑎 𝑘 a gruppi consecutivi delimitati dalla successione


di indici 𝑘 𝑛 .

𝑎 𝑘 è regolare (convergente o divergente) allora anche la serie 𝑏 𝑛 è regolare


P P
Se la serie
e si ha
+∞
X +∞
X
𝑏𝑛 = 𝑎𝑘 .
𝑛=0 𝑘=0

𝑎 𝑘 è a termini positivi.
P
In particolare questo vale se la serie
120 3 serie

Dimostrazione. Siano 𝑆 𝑘 = 𝑘𝑗=0 𝑎 𝑗 le somme parziali della serie 𝑎 𝑗 . Allora


P P
le somme parziali della serie 𝑏 𝑛 non sono altro che la sottosuccessione 𝑆 𝑘 𝑛 .
P
Dunque se 𝑆 𝑘 converge anche ogni sua sottosuccessione converge allo stesso
limite.

Il teorema 3.9 ci dice che le serie a termini positivi sono regolari e quindi
soddisfano le ipotesi del teorema.

serie armonica

la serie armonica

Osserviamo che il criterio del rapporto non si applica alla serie armonica
X1
𝑘
𝑘

in quanto
1
𝑘+1 𝑘
= → 1.
1 𝑘+1
𝑘

Per capire se la serie armonica converge o diverge presentiamo il metodo di


condensazione che verrà enunciato in generale nel prossimo teorema ma che può
essere meglio compreso se applicato al caso particolare della serie armonica.

Mostreremo che la serie armonica diverge. L’idea è semplicemente quella di


associare gli addendi della serie armonica in gruppi di lunghezza potenze di
criterio di condensazione di Cauchy due e stimare la somma di ogni gruppo dal basso con il termine più piccolo
(cioè l’ultimo) di ogni gruppo:
+∞    
X 1 1 1 1 1 1 1 1
=1+ + + + + + + +...
𝑘=1
𝑘 2 3 4 5 6 7 8
1 1 1
> 1+ +2· +4· +...
2 4 8
1 1 1
= 1 + + + + · · · = +∞.
2 2 2

Teorema 3.20 (criterio di condensazione di Cauchy). Sia 𝑎 𝑛 una successione


decrescente di numeri reali non negativi: 𝑎 𝑛 ≥ 0. Allora la serie 𝑎 𝑘 converge se e
P
solo se converge la serie X 𝑘
2 𝑎2𝑘 .
3.2 serie a termini positivi 121

Dimostrazione. Supponiamo per comodità che le somme partano da 𝑘 = 1. Si


tratta di raggruppare i termini 𝑎 𝑘 in gruppi di potenze di due:

𝑏0 = 𝑎1 ,
𝑏1 = 𝑎2 + 𝑎3 ,
𝑏2 = 𝑎4 + 𝑎5 + 𝑎6 + 𝑎7 ,
𝑏 3 = 𝑎 8 + 𝑎 9 + 𝑎10 + · · · + 𝑎15 ,
..
.
𝑏 𝑛 = 𝑎 2𝑛 + 𝑎 2𝑛 +1 + · · · + 𝑎2𝑛+1 −1 ,
..
.

Grazie al teorema 3.19 sulla associatività delle serie a termini positivi sappiamo
che
+∞
X +∞
X
𝑎𝑘 = 𝑏𝑛 .
𝑘=1 𝑛=0

Ogni termine 𝑏 𝑛 è la somma di 2𝑛 termini della successione 𝑎 𝑘 che, essendo


la successione decrescente, possono essere stimati dall’alto e dal basso con il
primo e l’ultimo termine di ogni somma, dunque:

2𝑛 𝑎 2𝑛+1 −1 ≤ 𝑏 𝑛 ≤ 2𝑛 𝑎 2𝑛 .

Per ipotesi la serie 2𝑛 𝑎 2𝑛 è convergente dunque per confronto anche la serie


P
𝑏 𝑛 è convergente.
P

Viceversa se la serie 2𝑛 𝑎 2𝑛 è divergente anche la serie 2𝑛+1 𝑎 2𝑛+1 è divergente


P P
e sapendo che 𝑏 𝑛 ≥ 2𝑛 𝑎 2𝑛+1 −1 ≥ 12 2𝑛+1 𝑎 2𝑛+1 otteniamo, per confronto, che anche
la serie 𝑏 𝑛 è divergente.
P

serie armonica generalizzata


Corollario 3.21 (serie armonica generalizzata). La serie
X 1
𝑛 𝑛𝛼

converge se 𝛼 > 1, diverge se 0 ≤ 𝛼 ≤ 1.

Dimostrazione. Applichiamo il criterio di condensazione. Posto 𝑎 𝑛 = 1


𝑛𝛼 Si ha

1 X 𝑛(1−𝛼) X  (1−𝛼)  𝑛
2 𝑛 𝑎 2𝑛 = 2𝑛
X X
= 2 = 2
𝑛 𝑛 (2𝑛 )𝛼 𝑛 𝑛

che è una serie geometrica di ragione 𝑞 = 21−𝛼 . Se 𝛼 > 1 allora 𝑞 < 1 e la


serie armonica è convergente se invece 𝛼 ≤ 1 allora 𝑞 ≥ 1 e la serie armonica è
divergente.

Esercizio 3.22. Utilizzare il criterio di condensazione per dimostrare che la serie


X 1
𝑛 · ln 𝑛
122 3 serie

diverge.

Esercizio 3.23. Per quali valori dei parametri 𝛼 ∈ ℝ e 𝛽 ∈ ℝ la serie

𝑛 𝛼 (ln 𝑛)𝛽
X

converge?

3.3 rappresentazione posizionale dei numeri reali

Quando scriviamo 3
8 = 0.375 intendiamo che vale

3 3 7 5
= + + .
8 10 102 103

Più in generale data una base 𝑑 ∈ ℕ , 𝑑 ≥ 2, ( 𝑑 = 10 nel caso della rappresen-


tazione decimale) consideriamo l’insieme [𝑑] = {0 , 1 , 2 , . . . , 𝑑 − 1} delle cifre
in base 𝑑 . Una sequenza infinita di cifre sarà quindi un elemento 𝒂 ∈ [𝑑]ℕ ,
𝒂 = (𝑎0 , 𝑎1 , . . . , 𝑎 𝑛 , . . . ) con 𝑎 𝑘 ∈ [𝑑]. Potremo quindi considerare il numero
“0.𝑎 0 𝑎 1 𝑎 2 . . .” rappresentato dalla sequenza di cifre 𝒂 :
+∞
X 𝑎𝑘
𝑟(𝒂) = .
𝑘=0 𝑑 𝑘+1

Chiaramente 𝑟(𝒂) ∈ [0 , 1] in quanto essendo 0 ≤ 𝑎 𝑘 ≤ 𝑑 − 1 risulta


+∞ +∞
X 𝑑−1 𝑑−1X 1 𝑑−1 1
0 ≤ 𝑟(𝒂) ≤ = = · = 1. (3.2)
𝑘=0 𝑑 𝑘+1 𝑑 𝑘=0 𝑑 𝑘 𝑑 1− 1
𝑑

Ogni numero 𝑥 ∈ [0 , 1) ammette una rappresentazione in cifre 𝑥 = 𝑟(𝒂) con


𝒂 ∈ [𝑑]ℕ . Infatti per ogni 𝑁 ∈ ℕ possiamo scrivere

𝑁−
X1
b𝑥 · 10𝑁 c = 𝑎 𝑘 10𝑁−1−𝑘
𝑘=0

e al crescere di 𝑁 otteniamo una sequenza di cifre 𝑎 𝑘 ∈ [𝑑] tali che



𝑁−
X1
𝑁 𝑁−1−𝑘
𝑥 · 𝑑 − 𝑎 · 𝑑 ≤1

𝑘
𝑘=0

da cui
𝑁−
X1 𝑎 𝑘 1

𝑥 − ≤ 𝑁

𝑑 𝑘+1 𝑑
𝑘=0

che, facendo tendere 𝑁 → +∞, significa 𝑟(𝒂) = 𝑥 . Il numero 𝑥 = 1 può essere


anch’esso rappresentato, basta prendere 𝑎 𝑘 = 𝑑 − 1 per ogni 𝑘 ∈ ℕ cosicché si
ottiene l’uguaglianza nel lato destro di (3.2). In base 𝑑 = 10 questo si esprime
dicendo che
0.999 . . . = 1.
3.3 rappresentazione posizionale dei numeri reali 123

Ci possiamo chiedere se è possibile che lo stesso numero abbia due rappresen-


tazioni in cifre distinte. Supponiamo quindi che esistano 𝒂, 𝒃 ∈ [𝑑]ℕ con 𝒂 ≠ 𝒃
tali che 𝑟(𝒂) = 𝑟(𝒃). Sia 𝑚 = min {𝑛 ∈ ℕ : 𝑎 𝑛 ≠ 𝑏 𝑛 } la posizione della prima
cifra diversa tra 𝒂 e 𝒃 . Si ha allora
+∞ +∞
X 𝑏𝑘 − 𝑎𝑘 𝑏𝑚 − 𝑎𝑚 X 𝑏𝑘 − 𝑎𝑘
𝑟(𝑏) − 𝑟(𝑎) = = 𝑚+
+ =𝐴+𝐵
𝑘=0 𝑑 𝑘+1 𝑑 1
𝑘=𝑚+1 𝑑
𝑘+1

con
𝑏𝑚 − 𝑎𝑚

1
|𝐴| = 𝑚+1 ≥ 𝑚+1

𝑑 𝑑
e

+∞ +∞
𝑏𝑘 − 𝑎𝑘 𝑑−1
X X
|𝐵| = ≤

𝑘=𝑚+1 𝑑 𝑘+1 𝑘=𝑚+1 𝑑 𝑘+1

+∞
𝑑−1X 1 𝑑−1 1 1
= 𝑚+
= 𝑚+2 · = .
𝑑 2
𝑘=0 𝑑 𝑘 𝑑 1 − 1
𝑑
𝑑 𝑚+1

Dunque, per disuguaglianza triangolare inversa,

0 = |𝑟(𝑏) − 𝑟(𝑎)| ≥ |𝐴| − |𝐵| ≥ 0.

Significa che tutte le disuguaglianze sono in realtà uguaglianze e quindi deve


essere |𝑏 𝑚 − 𝑎 𝑚 | = 1 e per ogni 𝑘 > 𝑚 deve essere |𝑏 𝑘 − 𝑎 𝑘 | = 𝑑− 1. Supponendo
che sia 𝑏 𝑚 = 𝑎 𝑚 + 1 (l’altro caso è analogo) per 𝑘 > 𝑚 dovrà necessariamente
essere 𝑏 𝑘 = 0 e 𝑎 𝑘 = 𝑑 − 1.

Ad esempio se 𝑑 = 10, 𝒂 = (1 , 2 , 3 , 9 , 9 , 9 , 9 , . . . ) e 𝒃 = (1 , 2 , 4 , 0 , 0 , 0 , 0 , . . . ) si
avrà 𝑟(𝒂) = 𝑟(𝒃) = 0.124.

Teorema 3.24 (Cantor). Fissata una base 𝑑 > 2 l’insieme

𝐶 = {𝑟(𝒂) : 𝒂 ∈ {0 , 2}ℕ }

ha cardinalità
#𝐶 = #P(ℕ ).
In particolare #ℝ > #ℕ .

Dimostrazione. Vogliamo verificare che 𝑟 : {0 , 2}ℕ → [0 , 1] è iniettiva. Abbiamo


già visto in generale che 𝑟(𝒂) = 𝑟(𝒃) solamente se la prima cifra diversa in
𝒂 e 𝒃 differisce di una unità. Ma siccome tutte le cifre di 𝒂 e 𝒃 per ipotesi
sono 0 oppure 2, non differiscono di una unità e quindi 𝑟 è iniettiva. Dunque
#𝐶 = #{0 , 2}ℕ . D’altra parte #{0 , 2}ℕ = #P(ℕ ) in quanto ogni 𝒂 ∈ {0 , 2}ℕ può
essere messo in corrispondenza biunivoca con l’insieme 𝒂 −1 ({0}) degli indici
𝑘 ∈ ℕ per cui 𝑎 𝑘 = 0.

Dal teorema 1.61 deduciamo che #𝐶 #P(ℕ ) > #ℕ e visto che 𝐶 ⊆ ℝ a maggior
ragione #ℝ ≥ #𝐶 > #ℕ .
124 3 serie

D’altra parte possiamo mostrare che #ℝ ≤ #P(ℕ ) in quanto possiamo costruire


una funzione 𝑓 : ℝ → P(ℚ) in questo modo:

𝑓 (𝑥) = {𝑞 ∈ ℚ : 𝑞 < 𝑥}.

Per la densità di ℚ in ℝ sappiamo che se 𝑥 < 𝑦 esiste 𝑞 ∈ ℚ con 𝑥 < 𝑞 < 𝑦


e dunque 𝑞 ∈ 𝑓 (𝑦) \ 𝑓 (𝑥) da cui 𝑓 (𝑥) ≠ 𝑓 (𝑦). Dunque 𝑓 è iniettiva, che
significa #ℝ ≤ #P(ℚ) Ma #ℕ = #ℚ dunque #P(ℚ) = #P(ℕ ) e la dimostrazione
è conclusa.

L’insieme 𝐶 definito nella precedente dimostrazione con 𝑑 = 3 è lo stesso insieme


insieme di Cantor di Cantor considerato nell’esempio 7.83. Infatti si potrebbe mostrare facilmente
che 𝐶 = 13 𝐶 ∪ ( 32 + 13 𝐶).

3.4 convergenza assoluta

Per le serie a termini positivi abbiamo molti criteri di convergenza che invece, in
generale, non si applicano alle serie di segno qualunque o alle serie di numeri
complessi. La convergenza di queste ultime, però, può a volte ricondursi
facilmente alla convergenza delle serie a termini positivi, passando al modulo
ogni termine.

Definizione 3.25 (convergenza assoluta). Diremo che una serie (a termini reali o
complessi) 𝑎 𝑛 è assolutamente convergente se la serie |𝑎 𝑛 | è convergente.
P P
assolutamente convergente

𝑎 𝑛 (reale o complessa) è
P
Teorema 3.26 (convergenza assoluta). Se una serie
assolutamente convergente allora è convergente e vale

X+∞ X +∞
𝑎𝑘 ≤ |𝑎 𝑘 |.


𝑘=0 𝑘=0

Dimostrazione. Supponiamo inizialmente che gli 𝑎 𝑛 siano numeri reali. Defi-


niamo 𝑎 𝑛+ = max {0 , 𝑎 𝑛 } e 𝑎 𝑛− = − min {0 , 𝑎 𝑛 }. Cioè se 𝑎 𝑛 ≥ 0 si ha 𝑎 𝑛+ = 𝑎 𝑛 e
𝑎 𝑛− = 0 se invece 𝑎 𝑛 ≤ 0 si ha 𝑎 𝑛+ = 0 e 𝑎 𝑛− = −𝑎 𝑛 . Dunque 𝑎 𝑛+ ≥ 0, 𝑎 𝑛− ≥ 0,

𝑎 𝑛 = 𝑎 𝑛+ − 𝑎 𝑛− e |𝑎 𝑛 | = 𝑎 𝑛+ + 𝑎 𝑛− .

Allora se |𝑎 𝑛 | converge, per confronto anche 𝑎 𝑛+ e 𝑎 𝑛− convergono. Dunque,


P P P
per il teorema sulla somma dei limiti, 𝑎 𝑛 = 𝑎 𝑛+ − 𝑎 𝑛− e quindi anche 𝑎 𝑛
P P P P
converge.

Se abbiamo una successione di complessi 𝑎 𝑛 = 𝑥 𝑛 + 𝑖 𝑦𝑛 e se |𝑎 𝑛 | converge


P
allora, per confronto, anche |𝑥 𝑛 | e |𝑦𝑛 | convergono (si osservi infatti che
P P
|𝑥| ≤ |𝑥 + 𝑖 𝑦| e |𝑦| ≤ |𝑥 + 𝑖 𝑦| ). Dunque 𝑥 𝑛 e 𝑦𝑛 convergono per quanto già
P P
dimostrato sulle serie a termini reali. Ma allora anche 𝑖 𝑦𝑛 e 𝑎 𝑛 = (𝑥 + 𝑖 𝑦𝑛 )
P P P
convergono.

Poniamo ora
𝑛
X
𝑆𝑛 = 𝑎𝑘 .
𝑘=0
3.4 convergenza assoluta 125

Per la subadditività del modulo sappiamo che per le somme finite si ha



X 𝑛 X 𝑛 +∞
X
|𝑆𝑛 | = 𝑎𝑘 ≤ |𝑎 𝑘 | ≤ |𝑎 𝑘 |.

𝑘=0 𝑘=0 𝑘=0

E per continuità del modulo, posto 𝑆 = lim 𝑆𝑛 si ha



X+∞ +∞
X
𝑎 𝑘 = |𝑆| = lim |𝑆𝑛 | ≤ |𝑎 𝑘 |.

𝑛→+∞

𝑘=0 𝑘=0

Teorema 3.27 (convergenza incondizionata). Se 𝑎 𝑛 è una serie assolutamente


P
convergente e 𝜎 : ℕ → ℕ è una qualunque funzione biettiva (permutazione dei numeri
naturali) si ha
+∞
X +∞
X
𝑎𝑛 = 𝑎 𝜎(𝑛) .
𝑛=0 𝑛=0

Dimostrazione. Basta mostrare che


" #
𝑛
X 𝑛
X
lim 𝑎𝑘 − 𝑎 𝜎(𝑗) = 0. (3.3)
𝑛→+∞
𝑘=0 𝑗=0

Visto che la serie 𝑎 𝑘 è assolutamente convergente per il teorema 3.7 sappiamo


P
che per ogni 𝜀 > 0 esiste 𝑁𝜀 ∈ ℕ tale che
+∞
X
|𝑎 𝑘 | < 𝜀.
𝑘=𝑁𝜀

Inoltre visto che 𝜎 : ℕ → ℕ è suriettiva deve esistere 𝑀 𝜀 ∈ ℕ per cui risulti

{𝜎(0), 𝜎(1), . . . , 𝜎(𝑀 𝜀 − 1)} ⊇ {0 , 1 , . . . , 𝑁𝜀 − 1}

ovvero per ogni 𝑘 < 𝑁𝜀 esiste 𝑗 < 𝑀 𝜀 tale che 𝜎(𝑗) = 𝑘 . Necessariamente deve
essere 𝑀 𝜀 ≥ 𝑁𝜀 . Per ogni 𝑛 > 𝑀 𝜀 consideriamo la differenza tra le somme
parziali:
𝑛
X 𝑛
X
𝑎𝑘 − 𝑎 𝜎(𝑗)
𝑘=0 𝑗=0

e osserviamo che se 𝑗 ≤ 𝑛 e 𝑘 = 𝜎(𝑗) ≤ 𝑛 allora i termini 𝑎 𝑘 e 𝑎 𝜎(𝑗) si elidono. I


termini che non si elidono sono gli 𝑎 𝑘 della prima somma in cui 𝜎 −1 (𝑘) > 𝑛 e
gli 𝑎 𝜎(𝑗) della seconda somma in cui 𝜎(𝑗) > 𝑛 . In ogni caso tali termini hanno
indice maggiore o uguale a 𝑁𝜀 e quindi la loro somma può essere stimata con
la somma dei loro moduli che a sua volta può essere stimata con la somma dei
moduli di tutti i termini con indice non inferiore a 𝑁𝜀 :

X 𝑛 X𝑛 X+∞
𝑎𝑘 − 𝑎 𝜎(𝑗) ≤ 2 |𝑎 𝑘 | ≤ 2𝜀.


𝑗=0
𝑘=0 𝑘=𝑁𝜀
126 3 serie

Questo garantisce la validità dell’equazione (3.3) in base alla definizione di


limite.

3.5 serie a segno variabile


P (−1)𝑘
La serie 𝑘+1 la cui somma si può scrivere come
serie armonica a segni alterni

1 1 1 1
1− + − + ...
2 3 4 5

non è assolutamente convergente (in quanto la serie 𝑘+1 1 è divergente) ma ha


P
il termine generico infinitesimo. Non abbiamo quindi nessun criterio che ci
permetta di determinarne il carattere. Possiamo però sfruttare il fatto che i segni
sono alterni cioè che i termini di indice pari hanno segno opposto ai termini di
indice dispari. Si nota infatti che posto
𝑛
X (−1) 𝑘
𝑆𝑛 =
𝑘=0
𝑘+1

si ha
1 1 1
𝑆2𝑛+2 = 𝑆2𝑛+1 + = 𝑆2 𝑛 − + < 𝑆2 𝑛
2𝑛 + 3 2𝑛 + 2 2𝑛 + 3
1 1 1
𝑆2𝑛+3 = 𝑆2𝑛+2 − = 𝑆2𝑛+1 + − > 𝑆2𝑛+1
2𝑛 + 4 2𝑛 + 3 2𝑛 + 4

Dunque la successione delle somme parziali di indice pari è decrescente mentre


sui termini di indice dispari è crescente. Avremo quindi che entrambe le
sottosuccessioni hanno limite: 𝑆2𝑛 → 𝑆 , 𝑆2𝑛+1 → 𝑅 .
Ma
1
𝑆 − 𝑅 = lim (𝑆2𝑛 − 𝑆2𝑛+1 ) = lim = 0.
𝑛→+∞ 𝑛→+∞ 2𝑛 + 2
Dunque 𝑆 = 𝑅 e l’intera successione ha limite 𝑆 . D’altra parte 𝑆 ≤ 𝑆0 in quanto
𝑆2𝑛 è decrescente e 𝑆 ≥ 𝑆1 in quanto 𝑆2𝑛+1 è crescente. Concludiamo che 𝑆 è
Per determinare il valore della somma di finito e dunque la serie è convergente.
questa serie ci serviranno degli strumenti
più avanzati. Si veda l’equazione 5.16. Questa dimostrazione può essere resa più in generale nel seguente.

criterio di Leibniz Teorema 3.28 (serie a segni alterni: criterio di Leibniz). Sia 𝑏 𝑛 una successione
monotòna e infinitesima. Allora la serie

(−1)𝑛 𝑏 𝑛
X

è convergente.
𝑛
(−1) 𝑘 𝑏 𝑘 sono le somme parziali, si osserva che la somma
X
Più precisamente se 𝑆𝑛 =
𝑘=0
della serie 𝑆 = lim 𝑆𝑛 è sempre compresa tra due termini consecutivi della successione
𝑆𝑛 :
𝑆 ∈ [min{𝑆𝑛 , 𝑆𝑛+1 }, max{𝑆𝑛 , 𝑆𝑛+1 }].
3.5 serie a segno variabile 127

Dimostrazione. Senza perdere di generalità possiamo supporre che la successione


𝑏 𝑛 sia decrescente e quindi 𝑏 𝑛 ≥ 0 (visto che il limite è zero). Posto
𝑛
(−1) 𝑘 𝑏 𝑘
X
𝑆𝑛 =
𝑘=0

si ha

𝑆2𝑛+2 = 𝑆2𝑛 − 𝑏 2𝑛+1 + 𝑏2𝑛+2


𝑆2𝑛+3 = 𝑆2𝑛+1 + 𝑏2𝑛+2 − 𝑏 2𝑛+3 .

Essendo 𝑏 𝑛 decrescente si ha 𝑏 2𝑛+2 < 𝑏 2𝑛+1 e 𝑏 2𝑛+3 < 𝑏 2𝑛+2 da cui

𝑆2𝑛+2 < 𝑆2𝑛 , 𝑆2𝑛+3 > 𝑆2𝑛+1 .

Dunque le successioni 𝑆2𝑛 e 𝑆2𝑛+1 sono monotone e di conseguenza hanno


limite:
𝑆2𝑛 → 𝑆, 𝑆2𝑛+1 → 𝑅
con 𝑆, 𝑅 ∈ [−∞, +∞]. D’altronde, essendo 𝑏 𝑛 infinitesima

𝑆 − 𝑅 = lim 𝑆2𝑛 − 𝑆2𝑛+1 = lim 𝑏2𝑛+1 = 0.


𝑛→+∞ 𝑛→+∞

Dunque 𝑆 = 𝑅 . Inoltre essendo 𝑆2𝑛 decrescente si ha 𝑆 ≤ 𝑆0 ed essendo 𝑆2𝑛+1


crescente si ha 𝑆 ≥ 𝑆1 . Dunque 𝑆 è finito e la serie converge.

Abbiamo anche ottenuto che 𝑆2𝑛−1 ≤ 𝑆 ≤ 𝑆2𝑛 e 𝑆2𝑛+1 ≤ 𝑆 ≤ 𝑆2𝑛 dunque è


verificata anche la seconda parte dell’enunciato.

Abbiamo dunque un esempio, la serie (−1) 𝑘 /𝑘 di una serie convergente ma


P
non assolutamente convergente. Il seguente teorema ci dice che per le serie di
questo tipo non è mai garantito che riordinando i termini la somma si conservi.
convergenza condizionata

Teorema 3.29 (convergenza condizionata). Sia 𝑎 𝑘 una serie convergente ma non


P
assolutamente convergente a termini reali. Allora fissato qualunque 𝑥 ∈ [−∞, +∞]
esiste un riordinamento 𝜎 : ℕ → ℕ biettivo tale che
+∞
X
𝑎 𝜎(𝑘) = 𝑥.
𝑘=0

Dimostrazione. Dividiamo i termini della successione 𝑎 𝑘 in termini maggiori o


uguali a zero e in termini negativi. Sia 𝑎 +𝑘 la sottosuccessione dei termini non
negativi e −𝑎 −𝑘 la sottosuccessione degli opposti dei termini negativi (quindi
𝑎 +𝑘 ≥ 0 e 𝑎 −𝑘 > 0). Si avrà

𝑛
X 𝑛+
X 𝑛−
X
𝑎𝑘 = 𝑎 +𝑘 − 𝑎 −𝑘
𝑘=0 𝑘=0 𝑘=0
𝑛
X 𝑛+
X 𝑛−
X
|𝑎 𝑘 | = 𝑎 +𝑘 + 𝑎 −𝑘
𝑘=0 𝑘=0 𝑘=0
128 3 serie

dove 𝑛 + + 1 e 𝑛 − + 1 sono rispettivamente il numero di termini non-negativi e


negativi tra i primi 𝑛 + 1 termini della successione 𝑎 𝑘 .

Osserviamo ora che dovrà essere


+∞
X +∞
X
𝑎 +𝑘 = +∞ e 𝑎 −𝑘 = +∞.
𝑘=0 𝑘=0

Innanzitutto le somme esistono perché le serie sono a termini non negativi. Se


entrambe queste somme fossero finite allora la serie |𝑎 𝑘 | sarebbe convergente,
P
ma per ipotesi abbiamo assunto che 𝑎 𝑘 non fosse assolutamente convergente.
P
Quindi almeno una delle due somme è infinita. Se la somma dei termini positivi
fosse infinita e quella dei termini negativi fosse finita potremmo però concludere
che anche la somma della serie 𝑎 𝑘 sarebbe infinita. Viceversa se la somma
P
dei termini positivi fosse finita e quella dei termini negativi fosse infinita la
somma 𝑎 𝑘 sarebbe −∞. Ma per ipotesi abbiamo richiesto che la serie 𝑎 𝑘
P P
fosse convergente.

Fissato 𝑥 ∈ ℝ possiamo quindi cominciare a sommare i termini positivi 𝑎 +𝑘 finché


non si raggiunge o si supera il valore 𝑥 . A quel punto cominciamo a sommare
i termini negativi finché non torniamo sotto al valore 𝑥 . Poi continuiamo a
sommare i termini positivi finché non si torna a superare 𝑥 e di nuovo poi
continuiamo con i termini negativi finché non si torna a scendere sotto 𝑥 .
Intermezzando opportunamente termini positivi e termini negativi riusciamo
quindi ad ottenere delle somme parziali che oscillano intorno al valore di 𝑥 e si
avvicinano sempre di più a 𝑥 in quanto ad ogni cambio di “rotta” la distanza
da 𝑥 è inferiore al valore assoluto dell’ultimo termine sommato e la successione
dei termini 𝑎 𝑘 è infinitesima in quanto la serie 𝑎 𝑘 è convergente.
P

Stessa cosa si può fare per ottenere una somma 𝑥 = +∞. Fissata una qualunque
successione 𝑥 𝑛 → +∞ comincio a sommare i termini positivi finché non supero
il valore 𝑥 1 + 𝑎 1− . Poi sommo un solo termine negativo, −𝑎 1− e ottengo una
somma maggiore di 𝑥 1 . Poi sommo tanti positivi finché non supero 𝑥 2 + 𝑎 2− .
Poi sommo un altro unico termine negativo e così via. Chiaramente le somme
tenderanno a +∞.

Il caso 𝑥 = −∞ si tratta in maniera analoga.

3.6 somme multiple

Teorema 3.30 (somme alla Cauchy). Sia 𝑎 𝑘,𝑗 ∈ ℂ una successione a due indici
𝑘 ∈ ℕ , 𝑗 ∈ ℕ . Se
+∞ X
X +∞
𝑎 𝑘,𝑗 < +∞

𝑘=0 𝑗=0

allora
+∞ X
X +∞ 𝑛
+∞ X
X
𝑎 𝑘,𝑗 = 𝑎 𝑘,𝑛−𝑘 .
𝑘=0 𝑗=0 𝑛=0 𝑘=0
3.6 somme multiple 129

Dimostrazione. Poniamo
+∞
X 𝑛
X
𝑏𝑘 = 𝑎 𝑘,𝑗 , 𝑐𝑛 = 𝑎 𝑘,𝑛−𝑘 .
𝑗=0 𝑘=0

Se immaginiamo i termini 𝑎 𝑘,𝑗 come i termini di una matrice infinita dove 𝑘 è


l’indice di riga e 𝑗 è l’indice di colonna, osserviamo che 𝑏 𝑘 rappresenta la somma
dei termini sulla riga 𝑘 -esima e la successione 𝑐 𝑛 rappresenta la somma (finita)
dei termini sulla diagonale 𝑘 + 𝑗 = 𝑛 . L’idea è che sommare i termini lungo
le righe oppure lungo le diagonali ci deve dare lo stesso risultato. L’ipotesi è
infatti una sorta di assoluta convergenza della serie di tutti i termini 𝑎 𝑘,𝑗 .

La tesi del teorema è


+∞
X 𝑁
X
𝑏 𝑘 = lim 𝑐𝑛
𝑁→+∞ 𝑛=0
𝑘=0

cioè per ogni 𝜀 > 0 dobbiamo trovare 𝛼 ∈ ℕ tale che per ogni 𝑁 > 𝛼 si abbia

X 𝑁 +∞
X
𝑐𝑛 − 𝑏 𝑘 < 4 𝜀.


𝑛=0 𝑘=0

Fissato 𝜀 > 0 applicando la proprietà della coda (teorema 3.7) alla serie
convergente data per ipotesi, si ottiene che esiste 𝐾 tale che:
+∞ X
+∞
𝑎 𝑘,𝑗 < 𝜀 .
X
𝑘=𝐾+1 𝑗=0
2

Sempre grazie alla proprietà della coda applicata ai singoli termini della serie
convergente per ipotesi possiamo affermare che per ogni 𝑘 ∈ {0 , 1 , . . . , 𝐾} esiste
un indice 𝐽𝑘 tale che
+∞
𝑎 𝑘,𝑗 ≤ 𝜀 .
X
𝑗=𝐽𝑘 +1 2 𝑘+2

Poniamo 𝐽 = max {𝐽0 , 𝐽1 , . . . , 𝐽𝐾 } e 𝛼 = 𝐽 + 𝐾 . Se 𝑁 ≥ 𝛼 si ha allora



X 𝑁 +∞
X X 𝑁 X𝐾
𝑐𝑛 − 𝑏𝑘 ≤ 𝑐𝑛 − 𝑏𝑘 + 𝜀


𝑛=0 𝑘=0
𝑛=0 𝑘=0

𝑁
0 𝑐 𝑛 sono
P
Osserviamo ora che i termini che vengono sommati nella serie 𝑛=
tutti i termini 𝑎 𝑘,𝑗 tali che 𝑘 + 𝑗 ≤ 𝑁 , mentre i termini che vengono sommati
in 𝐾𝑘=0 𝑏 𝑘 sono tutti i termini 𝑎 𝑘,𝑗 con 𝑘 ≤ 𝐾 . Quindi i termini in comune
P
alle due somme si cancellano e rimangono solamente i termini della prima
somma che non compaiono nella seconda e i termini della seconda somma che
non compaiono nella prima. Non ci interessa il segno di questi termini quindi
possiamo stimare la somma di tutti questi termini residui facendone la somma
130 3 serie

dei valori assoluti:



X 𝑁 X𝐾 𝑁 𝑁−𝑘
X X X 𝐾 X+∞
𝑐𝑛 − 𝑏𝑘 ≤ 𝑎 𝑘,𝑗 + 𝑎 𝑘,𝑗


𝑛=0 𝑘=0
𝑘=𝐾+1 𝑗=0 𝑘=0 𝑗=𝑁−𝐾
+∞ X
X +∞ X 𝐾 X
+∞
𝑎 𝑘,𝑗 + 𝑎 𝑘,𝑗


𝑘=𝐾+1 𝑗=0 𝑘=0 𝑗=𝐽𝑘 +1
+∞
𝜀 X 𝜀
≤ + = 𝜀.
2 𝑘=0 2 𝑘+2

3.7 somma per parti

Teorema 3.31 (somma per parti). Siano 𝑎 𝑘 e 𝐵 𝑘 successioni (reali o complesse).


Posto
𝑛−1
X
𝐴𝑛 = 𝑎𝑘 , 𝑏 𝑛 = 𝐵𝑛+1 − 𝐵𝑛
somma per parti 𝑘=0

si ha
𝑛−1
X 𝑛−1
X
𝑎 𝑘 𝐵 𝑘 = 𝐴𝑛 𝐵𝑛 − 𝐴𝑚 𝐵𝑚 − 𝐴 𝑘+1 𝑏 𝑘 . (3.4)
𝑘=𝑚 𝑘=𝑚

Dimostrazione. Osserviamo che 𝑎 𝑛 = 𝐴𝑛+1 − 𝐴𝑛 dunque

𝑛−1
X
𝐴𝑛 𝐵𝑛 − 𝐴𝑚 𝐵𝑚 = (𝐴 𝑘+1 𝐵 𝑘+1 − 𝐴 𝑘 𝐵 𝑘 )
𝑘=𝑚
𝑛−1
X
= (𝐴 𝑘+1 𝐵 𝑘+1 − 𝐴 𝑘+1 𝐵 𝑘 + 𝐴 𝑘+1 𝐵 𝑘 − 𝐴 𝑘 𝐵 𝑘 )
𝑘=𝑚
𝑛−1
X 𝑛−1
X
= 𝐴 𝑘+1 𝑏 𝑘 + 𝑎 𝑘 𝐵𝑘 .
𝑘=𝑚 𝑘=𝑚

Se prendiamo 𝑎 𝑘 = (−1) 𝑘 si può osservare che 𝐴𝑛 = 𝑛− 1


(−1) 𝑘 è una successione
P
𝑘=0
limitata in quanto 𝐴𝑛 = 1 se 𝑛 è dispari mentre 𝐴𝑛 = 0 se 𝑛 è pari. Se invece
scegliamo una successione 𝐵𝑛 è positiva, decrescente e infinitesima e poniamo
𝑏 𝑛 = 𝐵𝑛+1 − 𝐵𝑛 si ha
+∞
X 𝑛−1
X
|𝑏 𝑘 | = lim (𝐵 𝑘 − 𝐵 𝑘+1 ) = lim (𝐵0 − 𝐵𝑛 ) = 𝐵0 < +∞.
𝑛→+∞ 𝑛→+∞
𝑘=0 𝑘=0

Dunque il seguente teorema è una estensione del criterio di Leibniz per le serie
a segni alterni.
3.7 somma per parti 131

Teorema 3.32 (criterio di Dirichlet). Siano 𝑎 𝑛 e 𝐵𝑛 successioni (reali o complesse) e


𝑛−1
X
poniamo 𝐴𝑛 = 𝑎 𝑘 , 𝑏 𝑛 = 𝐵𝑛+1 − 𝐵𝑛 . Se 𝐴𝑛 è limitata, 𝐵𝑛 → 0 e |𝑏 𝑛 | < +∞
P
P 𝑘=0
allora la serie 𝑎 𝑘 𝐵 𝑘 è convergente.

Dimostrazione. Per la formula di somma per parti (3.4) si ha

𝑛−1
X 𝑛−1
X
𝑎 𝑘 𝐵 𝑘 = 𝐴 𝑛 𝐵 𝑛 − 𝐴0 𝐵0 − 𝐴 𝑘+1 𝑏 𝑘 . (3.5)
𝑘=0 𝑘=0

Il primo addendo 𝐴𝑛 𝐵𝑛 tende a zero per 𝑛 → +∞ in quanto prodotto di una


successione limitata per una infinitesima. Il secondo addendo è costante. La
serie 𝐴 𝑘+1 𝑏 𝑘 è assolutamente convergente in quanto essendo |𝐴𝑛 | ≤ 𝐿 limitata
P
e 𝑏 𝑛 assolutamente convergente si ha
P

X X
|𝐴 𝑘+1 | · |𝑏 𝑘 | ≤ 𝐿 · |𝑏 𝑘 | < +∞.

Dunque il limite della somma sul lato destro converge e quindi la somma sul
lato sinistro dell’equazione (3.5) è convergente per 𝑛 → +∞.

Esercizio 3.33. Fissato 𝑧 ∈ ℂ, |𝑧| ≤ 1, 𝑧 ≠ 1 la serie


+∞ 𝑘
X 𝑧
𝑘=1
𝑘

è convergente.

Dimostrazione. Si noti che per |𝑧| < 1 si può facilmente applicare il criterio del
rapporto o della radice. Ma per |𝑧| = 1 quei criteri non si applicano e bisogna
invece utilizzare il teorema 3.32.

Posto 𝑎 𝑘 = 𝑧 𝑘 si osserva che 𝑎 𝑘 è una serie geometrica e (essendo 𝑧 ≠ 1) si ha


P

𝑛−1
1 − 𝑧𝑛
𝑧𝑘 =
X
𝐴𝑛 =
𝑘=0
1−𝑧

che è limitata, infatti:

|1 − 𝑧 𝑛 | 1 + |𝑧 𝑛 | 2
|𝐴𝑛 | = ≤ = .
| 1 − 𝑧| | 1 − 𝑧| | 1 − 𝑧|

Mentre posto 𝐵𝑛 = 1/𝑛 è chiaro che, essendo 𝐵𝑛 reale, decrescente si ha

+∞
X 𝑛−1
X
|𝐵 𝑘+1 − 𝐵 𝑘 | = lim (𝐵 𝑘 − 𝐵 𝑘+1 ) = lim (𝐵1 − 𝐵𝑛 )
𝑛→+∞ 𝑛→+∞
𝑘=1 𝑘=1
 
1
= lim 1− = 1 < +∞.
𝑛→+∞ 𝑛

Si applica quindi il teorema 3.32 per ottenere la convergenza della serie data.
132 3 serie

Si osservi che se |𝑧| > 1 la serie in questione non converge perché il termine
generico 𝑧 𝑘 /𝑘 non è infinitesimo. Per 𝑧 = 1 si ottiene la serie armonica, che
pure non converge.

3.8 prodotti infiniti

Così come abbiamo fatto la teoria per le somme infinite si potrebbe fare la teoria
dei prodotti infiniti ponendo
+∞
Y 𝑛
Y
𝑎 𝑘 = lim 𝑎 𝑘 = lim 𝑎0 · 𝑎1 · · · 𝑎 𝑛 .
𝑛→+∞ 𝑛→+∞
𝑘=0 𝑘=0

Supporremo sempre 𝑎 𝑘 > 0 altrimenti il segno del prodotto difficilmente sarebbe


definito. Allora, utilizzando il logaritmo (che trasforma prodotti in somme)
possiamo ricondurre i prodotti infiniti alle serie:
+∞ P𝑛
ln 𝑎 𝑘
Y
𝑎 𝑘 = lim 𝑒 𝑘=0 .
𝑛→+∞
𝑘=0

Osserviamo che se la serie dei logaritmi diverge a −∞ il prodotto infinito ha


limite 0. Avendo richiesto che i termini 𝑎 𝑘 siano tutti positivi il prodotto non
potrà mai essere minore di zero. Per mantenere l’analogia con le serie diremo
che il prodotto infinito converge se il limite dei prodotti parziali è finito e
positivo. Diremo che diverge se il limite è +∞ oppure 0.

Dunque potremo dire che il prodotto infinito converge se e solo se la serie dei
logaritmi converge.

Osserviamo quindi che condizione necessaria affinché un prodotto infinito 𝑎 𝑘


Q
sia convergente dovrà essere ln 𝑎 𝑘 → 0 ovvero 𝑎 𝑘 → 1. In tal caso visto che

ln 𝑎 𝑘 = ln(1 + (𝑎 𝑘 − 1)) ∼ 𝑎 𝑘 − 1

si osserva che se 𝑎 𝑘 → 1 il prodotto infinito 𝑎 𝑘 converge se e solo se converge


Q
la serie (𝑎 𝑘 − 1).
P

Esempio 3.34 (somma dei reciproci dei primi). Possiamo utilizzare i prodotti
infiniti per dimostrare che la somma dei reciproci dei numeri primi è divergente. Sia 𝑝 𝑘
la successione dei numeri primi ( 𝑝 1 = 2, 𝑝 2 = 3, 𝑝 3 = 5, . . . stiamo dando per scontato
che i numeri primi sono infiniti). Allora vogliamo dimostrare che
+∞ +∞
X 1 X 1
= = +∞. (3.6)
𝑘=1
𝑝𝑘 𝑛=1 𝑛

Questo risultato ha una certa rilevanza nell’ambito della teoria dei numeri in quanto ci
dice che 𝑝 𝑘 non può andare all’infinito come una potenza 𝑘 𝛼 con 𝛼 > 1 in quanto la
serie 1/𝑘 𝛼 è convergente.
P
3.9 le serie di potenze 133

Mostriamo quindi che vale (3.6). Si noti che per ogni 𝑛 ∈ ℕ il termine 𝑛1 può essere
decomposto come il prodotto di potenze dei reciproci dei numeri primi. Dunque:
+∞
X 1 1 1 1 1
= (1 + + 2 + . . . ) · (1 + + 2 + . . . )
𝑛=1 𝑛 2 2 3 3
1 1
· (1 + + + ...)··· (3.7)
5 52
+∞ X
+∞  𝑗 +∞
Y 1 Y 1
= = .
𝑘=1 𝑗=0
𝑝𝑘 𝑘=1 1− 1
𝑝𝑘

Nei passaggi precedenti abbiamo sfruttato il fatto che nelle serie a termini positivi
possiamo riordinare e associare i termini in qualunque modo. Una serie a termini positivi
è convergente oppure divergente e la convergenza assoluta coincide con la convergenza
semplice. Visto che riordinando i termini di una serie assolutamente convergente non
si può ottenere una serie divergente, significa che riordinando i termini di una serie
divergente (a termini positivi) si ottiene sempre una serie divergente.

Ora possiamo utilizzare il fatto che il prodotto infinito ottenuto in (3.7) ha lo stesso
carattere della seguente serie
1
!
+∞ +∞
X 1 X 𝑝𝑘
1
−1 = 1
𝑘=1 1− 𝑝𝑘 𝑘=1 1− 𝑝𝑘

ma visto che 1/𝑝 𝑘 → 0 si ha


1
𝑝𝑘 1

1− 1
𝑝𝑘
𝑝𝑘

e dunque, per il criterio del confronto asintotico, la serie precedente ha lo stesso carattere
della serie
+∞
X 1
𝑝
𝑘=1 𝑘

che quindi è divergente.

3.9 le serie di potenze

Se 𝑎 𝑘 è una successione di numeri complessi, la serie serie di potenze

𝑎𝑘 𝑧 𝑘
X

dipendente dal parametro 𝑧 ∈ ℂ si chiama serie di potenze di coefficienti 𝑎 𝑘 .


Se chiamiamo 𝐴 ⊆ ℂ l’insieme dei numeri complessi 𝑧 per i quali la serie di
potenze converge

𝑎 𝑘 𝑧 𝑘 è convergente
X
𝐴 = 𝑧 ∈ ℂ:

134 3 serie

la somma della serie risulta essere una funzione 𝑓 : 𝐴 → ℂ definita da


+∞
𝑎𝑘 𝑧 𝑘 .
X
𝑓 (𝑧) =
𝑘=0

insieme di convergenza
L’insieme 𝐴 si chiama insieme di convergenza (o dominio di convergenza) della serie
di potenze 𝑎 𝑘 𝑧 𝑘 .
P

Come al solito ci potrà capitare di considerare serie di potenze con l’indice 𝑘 che
parte da 1 invece che da 0 (o da qualunque altro numero naturale). Ciò non è
rilevante, potremo sempre considerare 𝑎 𝑘 = 0 per i termini che non partecipano
alla sommatoria.

Osserviamo anche che per 𝑘 = 0 il termine corrispondente della serie è 𝑎 0 · 00 = 𝑎 0


in quanto abbiamo definito 00 = 1. Dunque potremo anche scrivere:
+∞
𝑎 𝑘 𝑧 𝑘 = 𝑎0 + 𝑎1 𝑧 + 𝑎2 𝑧 2 + · · · + 𝑎 𝑛 𝑧 𝑛 + . . . .
X
𝑘=0

Le serie di potenze assomigliano quindi a dei polinomi, ma con infiniti termini.

Esempio 3.35 (la serie geometrica). La serie di potenze di coefficienti 𝑎 𝑘 = 1 è la


serie geometrica 𝑧 𝑘 . L’insieme di convergenza è il cerchio 𝐴 = {𝑧 ∈ ℂ : |𝑧| < 1}.
P
Per 𝑧 ∈ 𝐴 si ha
+∞
1
𝑧𝑘 =
X
𝑓 (𝑧) = .
𝑘=0
1−𝑧
𝑘
𝑘 |𝑧| ≥ 𝑘 1 la serie non può convergere perché il termine 𝑧 non è infinitesimo:
Se
𝑧 = |𝑧| ≥ 1.

𝑧 𝑛
𝑛
𝑛 𝑛 (ottenuta ponendo 𝑎 𝑛 = 1/𝑛 ) ha come
P
Esempio 3.36. La serie di potenze
insieme di convergenza 𝐴 = ℂ in quanto
s
𝑛 |𝑧|
𝑛 𝑧
𝑛𝑛 = 𝑛 → 0 < 1

e quindi per il criterio della radice la serie in questione converge assolutamente qualunque
sia 𝑧 ∈ ℂ.

Teorema 3.37 (convergenza delle serie di potenze). Se la serie di potenze 𝑎 𝑘 𝑧 𝑘


P
converge in un punto 𝑧 ∈ ℂ (anzi, basta che la successione 𝑎 𝑘 𝑧 𝑘 sia limitata) allora la
serie converge assolutamente per ogni 𝑤 ∈ ℂ tale che |𝑤| < |𝑧| . Viceversa, se la serie
non converge in un punto 𝑧 ∈ ℂ allora non converge in nessun 𝑤 tale che |𝑤| > |𝑤|
(anzi la successione 𝑎 𝑛 𝑤 𝑛 non è nemmeno limitata e tantomento infinitesima).

Dimostrazione. Se la serie 𝑎 𝑘 𝑧 𝑘 converge significa che la successione 𝑎 𝑘 𝑧 𝑘 è


P
infinitesima e in particolare è limitata. Esiste dunque 𝑀 tale che per ogni 𝑘 ∈ ℕ
𝑘
𝑎 𝑘 𝑧 ≤ 𝑀.
3.9 le serie di potenze 135

Se 𝑧 = 0 non c’è niente da dimostrare. Se 𝑧 ≠ 0 si ha


𝑀
|𝑎 𝑘 | ≤ .
|𝑧| 𝑘

Scelto ora qualunque 𝑤 ∈ ℂ con |𝑤| < |𝑧| si ha

𝑘
𝑎 𝑘 𝑤 𝑘 = |𝑎 𝑘 | · |𝑤| 𝑘 ≤ 𝑀 |𝑤| ≤ 𝑀 𝑞 𝑘

𝑘
|𝑧|
|𝑤| P 𝑘
avendo posto 𝑞 = |𝑧|
. 𝑞 converge e, per
Essendo 𝑞 < 1 la serie geometrica
𝑎 𝑘 𝑤 converge. Dunque la serie 𝑎 𝑘 𝑤 𝑘 converge
𝑘

P P
confronto, anche la serie
assolutamente.

Viceversa supponiamo che 𝑎 𝑘 𝑧 𝑘 non converga e prendiamo 𝑤 con |𝑤| > |𝑧| .
P
Allora 𝑎 𝑘 𝑤 𝑘 non può convergere, ansi 𝑎 𝑘 𝑤 𝑘 non può neanche essere limitata
P
perché se lo fosse allora, scambiando i ruoli di 𝑧 e 𝑤 , per il punto precedente la
serie 𝑎 𝑘 𝑧 𝑘 dovrebbe convergere.
P

Corollario 3.38 (l’insieme di convergenza è circolare). Sia 𝑎 𝑘 𝑧 𝑘 una serie di


P
potenze e sia 𝐴 il suo insieme di convergenza. Allora 𝐴 non è vuoto e posto

𝑅 = sup {|𝑧| : 𝑧 ∈ 𝐴}.

risulta che 𝑅 ∈ [0 , +∞] e 𝐴 coincide con il cerchio centrato in 0 e di raggio 𝑅 a meno


dei punti di bordo, nel senso che:

{𝑧 ∈ ℂ : |𝑧| < 𝑅} ⊆ 𝐴 ⊆ {𝑧 ∈ ℂ : |𝑧| ≤ 𝑅}. (3.8)

Inoltre la serie converge assolutamente in ogni 𝑧 ∈ ℂ con |𝑧| < 𝑅 mentre il termine
generico 𝑎 𝑘 𝑧 𝑘 non è nemmeno limitato (e quindi la serie non converge) quando |𝑧| > 𝑅 .

Dimostrazione. Se |𝑧| < 𝑅 significa che esiste 𝑧 0 ∈ 𝐴 tale che |𝑧 0 | > |𝑧| . Ma visto
che la serie converge in 𝑧 0 (per definizione di 𝐴) grazie al teorema precedente
possiamo affermare che la serie converge, anzi, converge assolutamente in 𝑧 .
Dunque si ottiene la prima inclusione in (3.8).

Se invece prendiamo 𝑧 ∈ ℂ con |𝑧| > 𝑅 allora certamente la serie non converge
in 𝑧 altrimenti (per come è definito 𝑅 ) avremmo 𝑅 ≥ |𝑧| . Inoltre possiamo
certamente considerare un punto 𝑧 1 ∈ ℂ tale che 𝑅 < |𝑧 1 | ≤ |𝑧| e la serie di
potenze non può convergere neanche in 𝑧 1 . Ma allora, per il teorema precedente,
deduciamo che 𝑎 𝑘 𝑧 𝑘 non è nemmeno limitata.

Abbiamo quindi mostrato l’esistenza di 𝑅 ∈ ℝ̄ che soddisfa (3.8). Chiaramente


risulta 𝑅 ≥ 0 perché 𝐴 è un insieme non vuoto (per ogni serie di potenze si ha
0 ∈ 𝐴).
raggio di convergenza
Definizione 3.39 (raggio di convergenza). Il raggio di convergenza di una serie
di potenze 𝑎 𝑘 𝑧 𝑘 è il valore 𝑅 ∈ [0 , +∞] dato dal corollario 3.38:
P

𝑎 𝑘 𝑧 𝑘 è convergente .
X
𝑅 = sup |𝑧| : 𝑧 ∈ ℂ,

136 3 serie

𝑎 𝑛 𝑧 𝑛 una serie di potenze.


P
Teorema 3.40 (calcolo del raggio di convergenza). Sia
Se esiste il limite p
lim 𝑛 |𝑎 𝑛 | = ℓ (3.9)
𝑛→+∞

allora 𝑅 = 1/ℓ è il raggio di convergenza della serie (dove si intende 𝑅 = +∞ se ℓ = 0


e 𝑅 = 0 se ℓ = +∞).

Lo stesso accade se esiste il limite


|𝑎 𝑛+1 |
lim = ℓ.
𝑛→+∞ |𝑎 𝑛 |

Più in generale risulta 𝑅 = 1/ℓ se poniamo



ℓ = lim sup 𝑛
𝑎𝑛 .
𝑛→+∞

anche nel caso in cui il limite in (3.9) non dovesse esistere.

Dimostrazione. Prendiamo 𝑟 ≥ 0. Applicando il criterio della radice alla serie


|𝑎 𝑛 |𝑟 𝑛 si ha
P
p
𝑛
p
𝑛
|𝑎 𝑛 |𝑟 𝑛 = 𝑟 |𝑎 𝑛 | → 𝑟ℓ .
Dunque se scegliamo un 𝑟 < 1/ℓ si ha 𝑟ℓ < 1 e la serie 𝑎 𝑛 𝑧 𝑛 converge
P
assolutamente per 𝑧 = 𝑟 . Dunque per ogni 𝑟 < 1/ℓ troviamo che 𝑟 ∈ 𝐴: ne
consegue che 𝑅 ≥ 1/ℓ . Se invece scegliamo 𝑟 > 1/ℓ si ha 𝑟ℓ > 1 e dunque
|𝑎 𝑛 |𝑟 𝑛 → +∞ e la serie non può essere convergente in 𝑧 = 𝑟 . Significa che
𝑅 ≤ 1/ℓ .

Il criterio della radice si applica anche nel caso in cui ℓ è definito tramite lim sup.

Nel caso esista il limite del rapporto |𝑎 𝑛+1 |/|𝑎 𝑛 | sappiamo (grazie al criterio di
convergenza alla Cesàro teorema 2.77) che il limite della radice coincide con il
limite del rapporto e quindi ci si riconduce al caso precedente (oppure si può
ripetere la dimostrazione utilizzando il criterio del rapporto invece del criterio
della radice).

Esempio 3.41. Nell’esempio 3.36 abbiamo visto che l’insieme di convergenza della
serie di potenze
+∞ 𝑘
X 𝑧
𝑘=1
𝑘
è
𝐴 = {𝑧 ∈ ℂ : |𝑧| ≤ 1 , 𝑧 ≠ 1}.
Il raggio di convergenza dovrà quindi essere 𝑅 = 1 e questo può essere facilmente
verificato con uno dei criteri precedenti. Ad esempio:
1
𝑛+1 𝑛
lim = lim =1
𝑛→+∞ 1
𝑛
𝑛→+∞ 𝑛+1

da cui 𝑅 = 1/1 = 1. Si osservi dunque che nessuna delle due inclusioni in (3.8) è, in
questo caso, una uguaglianza.
3.9 le serie di potenze 137

𝑎𝑘 𝑧 𝑘 e
P
Teorema 3.42 (stabilità del raggio di convergenza). Le serie di potenze
𝑘𝑎 𝑘 𝑧 𝑘 hanno lo stesso raggio di convergenza.
P

Dimostrazione. Sia 𝑅 il raggio di convergenza della serie 𝑎 𝑘 𝑧 𝑘 e 𝑟 il raggio di


P
convergenza della serie 𝑘𝑎 𝑘 𝑧 𝑘 .
P

Visto che per 𝑘 > 0 si ha 𝑎 𝑘 𝑧 𝑘 ≤ 𝑘𝑎 𝑘 𝑧 𝑘 la serie 𝑎 𝑘 𝑧 𝑘 converge assolutamente


P
nei punti in cui converge assolutamente la serie 𝑘𝑎 𝑘 𝑧 𝑘 . Questo significa che
P
𝑅 ≥ 𝑟.

Preso ora un punto 𝑤 con |𝑤| < 𝑅 consideriamo un qualunque punto 𝑧 con
|𝑤| < |𝑧| < 𝑅 . La serie 𝑎 𝑘 𝑧 𝑘 converge assolutamente 𝑘
𝑘 in 𝑧 quindi 𝑎 𝑘 𝑧
P
è infinitesima e limitata. Esiste quindi 𝑀 per cui 𝑎 𝑘 𝑧 ≤ 𝑀 che significa

|𝑎 𝑘 | ≤ 𝑀
/
|𝑧| 𝑘 . Ma allora

𝑘 𝑘
𝑘𝑎 𝑘 𝑤 𝑘 ≤ 𝑘|𝑎 𝑘 | |𝑤| 𝑘𝑀 |𝑤|

𝑘 ≤ |𝑧|

si ottiene 𝑘𝑎 𝑘 𝑤 𝑘 ≤ 𝑘𝑀 𝑞 𝑘 . Visto che 𝑞 < 1 sappiamo che


|𝑤|
da cui, posto 𝑞 =

|𝑧|
,
la serie 𝑘𝑀 𝑞 𝑘 è convergente e dunque, per confronto, anche la serie 𝑘𝑎 𝑘 𝑤 𝑘
P P
è assolutamente convergente. Siccome questo è vero per ogni 𝑤 con |𝑤| < 𝑅
significa che 𝑟 ≥ 𝑅 e questo conclude la dimostrazione.

√𝑘
Dimostrazione alternativa. Visto che 𝑘 → 1 si ha
p𝑘 √
lim sup 𝑘𝑎 𝑘 = lim sup 𝑘 𝑎 𝑘 .

Per il teorema 3.40 si ottiene che le due corrispondenti serie di potenze hanno
lo stesso raggio di convergenza.
continuità delle serie di potenze

Teorema 3.43. (continuità delle serie di potenze) Sia 𝑎 𝑘 𝑧 𝑘 una serie di potenze con
P
raggio di convergenza 𝑅 . Allora posto 𝐵 = {𝑧 ∈ ℂ : |𝑧| < 𝑅} la funzione 𝑓 : 𝐵 → ℂ
definita da
+∞
𝑎𝑘 𝑧 𝑘
X
𝑓 (𝑧) =
𝑘=0

è continua (su 𝐵).

Dimostrazione. Supponiamo 𝑅 > 0 altrimenti non c’è niente da dimostrare.


Fissiamo 𝑟 < 𝑅 e consideriamo due punti 𝑧, 𝑤 ∈ ℂ con |𝑧| < 𝑟 e |𝑤| < 𝑟 .
Ricordiamo che si ha

𝑧 𝑛 − 𝑤 𝑛 = (𝑧 − 𝑤) · (𝑧 𝑛−1 + 𝑤𝑧 𝑛−2 + · · · + 𝑤 𝑛−2 𝑧 + 𝑤 𝑛−1 ).

Osservando che per ogni addendo sul lato destro si ha 𝑤 𝑘 𝑧 𝑛−𝑘−1 ≤ 𝑟 𝑛−1 ,

essendoci 𝑛 addendi si ottiene

|𝑧 𝑛 − 𝑤 𝑛 | ≤ |𝑧 − 𝑤| · 𝑛 · 𝑟 𝑛−1 .
138 3 serie

Dunque

X+∞ +∞ X +∞
𝑎𝑛 𝑧 𝑛 − 𝑎𝑛 𝑤 𝑛 = 𝑎 𝑛 (𝑧 𝑛 − 𝑤 𝑛 )
X
| 𝑓 (𝑧) − 𝑓 (𝑤)| =

𝑛=0 𝑛=0 𝑛=0
+∞ +∞
|𝑎 𝑛 | · |𝑧 𝑛 − 𝑤 𝑛 | ≤ |𝑧 − 𝑤| |𝑎 𝑛 |𝑛𝑟 𝑛−1 .
X X

𝑛=0 𝑛=0

Ma noi sappiamo che la serie 𝑛𝑎 𝑛 𝑧 𝑛 ha lo stesso raggio di convergenza 𝑅 della


P
serie originaria (per il teorema 3.42) dunque la serie 𝑛𝑎 𝑛 𝑟 𝑛 è assolutamente
P
convergente e, dividendo per 𝑟 , scopriamo che anche la serie 𝑛𝑎 𝑛 𝑟 𝑛−1 è
P
convergente. Posto 𝐿 = 𝑛=0 𝑛|𝑎 𝑛 |𝑟 𝑛−1 per quanto scritto sopra possiamo
P+∞
concludere che
| 𝑓 (𝑧) − 𝑓 (𝑤)| ≤ 𝐿 · |𝑧 − 𝑤|.
Dunque per ogni 𝜀 > 0 scelto 𝛿 = 𝐿𝜀 se |𝑧 − 𝑤| < 𝛿 risulta | 𝑓 (𝑧) − 𝑓 (𝑤)| ≤ 𝜀.
Significa che la funzione 𝑓 è continua nel punto 𝑧 e questo è vero per ogni 𝑧 con
|𝑧| < 𝑅 .

Il teorema precedente ci garantisce che la somma di una serie di potenze è


una funzione continua all’interno del raggio di convergenza. Nei punti che
si trovano esattamente sulla frontiera del raggio di convergenza la funzione 𝑓
potrebbe non essere continua. Ma se la serie converge in un punto di frontiera,
la somma della serie è continua se mi avvicino al punto di convergenza lungo il
raggio del disco di convergenza, come enunciato nel seguente teorema.

Teorema 3.44 (lemma di Abel). Sia


+∞
𝑎𝑘 𝑧 𝑘
X
𝑓 (𝑧) =
𝑘=0

la somma di una serie di potenze. Se la serie converge in un punto 𝑧 0 ∈ ℂ, 𝑧 0 ≠ 0,


allora la serie converge per ogni 𝑧 = 𝑡𝑧 0 con 𝑡 ∈ [0 , 1] inoltre la funzione

𝑡 ↦→ 𝑓 (𝑡𝑧)

è continua nel punto 𝑡 = 1.

Dimostrazione. Senza perdita di generalità possiamo supporre che sia 𝑓 (𝑧 0 ) = 0


infatti basterà sostituire il primo termine della serie, 𝑎 0 , con 𝑎 00 = 𝑎 0 − 𝑓 (𝑧 0 ) e
dimostrare il teorema per la serie modificata. Dunque posto

𝑛−1
𝑎 𝑘 𝑧0𝑘
X
𝐴𝑛 =
𝑘=0

si ha che 𝐴𝑛 → 𝑓 (𝑧 0 ) = 0 e, per definizione, 𝐴0 = 0. Utilizzando la formula


(3.4) di somma per parti, preso 𝑡 ∈ [0 , 1) si avrà
𝑛 𝑛 𝑛
𝑎 𝑘 · (𝑡𝑧 0 ) 𝑘 = 𝑎 𝑘 𝑧 0𝑘 · 𝑡 𝑘 = 𝐴𝑛+1 · 𝑡 𝑛+1 + 𝐴 𝑘+1 · (𝑡 𝑘 − 𝑡 𝑘+1 )
X X X
𝑘=0 𝑘=0 𝑘=0
3.10 la serie esponenziale 139

e per 𝑛 → +∞ si ottiene
+∞ +∞
𝐴 𝑘+1 (𝑡 𝑘 − 𝑡 𝑘+1 ) = (1 − 𝑡) 𝐴 𝑘+1 𝑡 𝑘 .
X X
𝑓 (𝑡 · 𝑧 0 ) = 𝑓 (𝑧0 ) · 0 +
𝑘=0 𝑘=0

Visto che 𝐴𝑛 → 0 per ogni 𝜀 > 0 esiste 𝑚 tale che per ogni 𝑘 > 𝑚 si ha |𝐴 𝑘 | ≤ 𝜀.
Dunque, per ogni 𝑡 ∈ [0 , 1), si ha

𝑚−
X1 +∞
|𝐴 𝑘+1 |𝑡 𝑘 + (1 − 𝑡) |𝐴 𝑘+1 |𝑡 𝑘
X
| 𝑓 (𝑡 · 𝑧 0 )| ≤ (1 − 𝑡)
𝑘=0 𝑘=𝑚
𝑚−
X1 𝑡𝑚
≤ (1 − 𝑡) · |𝐴 𝑘+1 | + (1 − 𝑡) · 𝜀 ·
𝑘=0
1−𝑡
𝑚−
X1
≤ (1 − 𝑡) |𝐴 𝑘+1 | + 𝜀.
𝑘=0

Scelto 𝛿 ≤ P𝑚−1 𝜀 se | 1 − 𝑡 | < 𝛿 si avrà dunque


𝑘=0
|𝐴 𝑘+1 |

| 𝑓 (𝑡 · 𝑧0 ) − 𝑓 (𝑧 0 )| = | 𝑓 (𝑡 · 𝑧0 )| < 2𝜀

che significa che 𝑡 ↦→ 𝑓 (𝑡 · 𝑧 0 ) è continua nel punto 𝑡 = 1.

3.10 la serie esponenziale


exp 𝑧
Definiamo la funzione exp : ℂ → ℂ tramite la serie di potenze
+∞ 𝑘
X 𝑧
exp(𝑧) = . (3.10)
𝑘=0
𝑘!

La funzione è definita su tutto ℂ in quanto (grazie al criterio del rapporto) è


facile verificare che il raggio di convergenza di questa serie è 𝑅 = +∞ e dunque
l’insieme di convergenza è tutto ℂ.

I teoremi seguenti ci permetteranno di affermare che la funzione exp(𝑧), definita


per ogni 𝑧 ∈ ℂ è una estensione della funzione 𝑒 𝑥 già definita per 𝑥 ∈ ℝ.

Teorema 3.45 (proprietà dell’esponenziale complesso). Si ha:

1. exp(0) = 1;
2. exp(¯𝑧 ) = exp(𝑧);
3. per ogni 𝑧, 𝑤 ∈ ℂ
exp(𝑧 + 𝑤) = exp(𝑧) · exp(𝑤);
4. per ogni 𝑧 ∈ ℂ si ha exp(𝑧) ≠ 0 e

1
exp(−𝑧) = ;
exp(𝑧)

5. la funzione exp : ℂ → ℂ è continua.


140 3 serie

6. Se 𝑧 𝑛 → 0 allora
exp(𝑧 𝑛 ) − 1
lim = 1. (3.11)
𝑛→+∞ 𝑧𝑛

Dimostrazione. 1. La proprietà exp(0) = 1 si ottiene per verifica diretta


(ricordiamo che 00 = 1 e 0! = 1).
2. La proprietà exp(¯𝑧 ) = exp 𝑧 si ottiene passando al limite la seguente
uguaglianza tra le somme parziali che sfrutta le proprietà del coniugio di
somma e prodotto:
𝑛 𝑛
X 𝑧¯ 𝑘 X 𝑧𝑘
= .
𝑘=0
𝑘! 𝑘=0
𝑘!
3. Consideriamo la matrice infinita

𝑧𝑘 𝑤𝑗
𝑚 𝑘,𝑗 = · .
𝑘! 𝑗!

Allora da un lato
+∞
X (𝑧 + 𝑤)𝑛
exp(𝑧 + 𝑤) =
𝑛=0 𝑛!
+∞ 𝑛
1 X 𝑛!
𝑧 𝑘 · 𝑤 𝑛−𝑘
X
=
𝑛=0 𝑛 ! 𝑘=0 𝑘 !(𝑛 − 𝑘)!
𝑛
+∞ X
X
= 𝑚 𝑘,𝑛−𝑘
𝑛=0 𝑘=0

e dall’altro
+∞ 𝑘 X
X 𝑧 +∞ 𝑤 𝑗 +∞ 𝑘
+∞ X
X 𝑧 𝑤𝑗
exp(𝑧) · exp(𝑤) = =
𝑘=0
𝑘! 𝑗=0
𝑗! 𝑘=0 𝑗=0
𝑘! 𝑗!
+∞ X
X +∞
= 𝑚 𝑘,𝑗 .
𝑘=0 𝑗=0

Il risultato segue dunque dal teorema 3.30.


4. Visto che
1 = exp(0) = exp(𝑧 − 𝑧) = exp(𝑧) · exp(−𝑧)
ricaviamo che exp(𝑧) ≠ 0 e exp(−𝑧) = 1/exp(𝑧).
5. La continuità discende dal risultato generale sulla continuità della somma
di una serie di potenze: teorema 3.43.
6. Direttamente dalla definizione (3.10) si ottiene
+∞ 𝑘
X 𝑧 +∞
X 𝑧𝑘
exp(𝑧) − 1 = =𝑧· .
𝑘=1
𝑘! 𝑘=0
(𝑘 + 1)!

𝑧 P 𝑘
Osserviamo ora che la serie (𝑘+ 1)!
ha raggio di convergenza infinito e
quindi è assolutamente convergente per ogni 𝑧 ∈ ℂ. In particolare la
3.10 la serie esponenziale 141

somma di tale serie è continua e quindi se 𝑧 𝑛 → 0 si ha

exp(𝑧 𝑛 ) − 1 +∞
X 𝑧 𝑛𝑘 +∞
X 0𝑘
lim = lim = = 1.
𝑛→+∞ 𝑧𝑛 𝑛→+∞
𝑘=0
(𝑘 + 1)! 𝑘=0 (𝑘 + 1)!

Teorema 3.46 (collegamento tra le due definizioni di esponenziale). Per ogni


𝑥 ∈ ℝ si ha
exp(𝑥) = 𝑒 𝑥 .

Dimostrazione. Vogliamo applicare il teorema 1.54. Posto 𝑓 (𝑥) = exp(𝑥),


𝑓 : ℝ → ℝ sappiamo, per il teorema precedente, che 𝑓 (𝑥 + 𝑦) = 𝑓 (𝑥) · 𝑓 (𝑦).
Dobbiamo verificare che 𝑓 è crescente. Innanzitutto notiamo che se 𝑥 > 0 la
serie che definisce exp(𝑥) è a termini positivi e il primo termine è 1. Dunque per
ogni 𝑥 > 0 si ha exp(𝑥) > 1. In particolare posto 𝑎 = 𝑓 (1) si ha 𝑎 > 1. Inoltre se
𝑦 > 𝑥 si ha 𝑓 (𝑦 − 𝑥) > 1 e dunque

𝑓 (𝑦) = 𝑓 (𝑥 + 𝑦 − 𝑥) = 𝑓 (𝑥) · 𝑓 (𝑦 − 𝑥) > 𝑓 (𝑥).

La funzione è quindi strettamente crescente. Dunque è un omomorfismo


monotono dal gruppo additivo ℝ al gruppo moltiplicativo (0 , +∞). Fissato
𝑎 = 𝑓 (1) sappiamo, per quanto visto nella sezione 1.18, che c’è una unica
funzione con queste proprietà e dunque deve essere:

𝑓 (𝑥) = 𝑎 𝑥 .

Non ci rimane che dimostrare che 𝑎 = 𝑒 . Ma grazie al teorema 3.45 appena


dimostrato sappiamo che per 𝑥 → 0 si ha

𝑓 (𝑥) − 1
→ 1.
𝑥
D’altra parte sappiamo che 𝑓 (𝑥) = 𝑎 𝑥 e quindi per il limite notevole (corolla-
rio 2.52)
𝑓 (𝑥) − 1 𝑎 𝑥 − 1 𝑒 𝑥 ln 𝑎 − 1
= = · ln 𝑎 → ln 𝑎.
𝑥 𝑥 𝑥 ln 𝑎
Deduciamo quindi che ln 𝑎 = 1 ovvero che 𝑎 = 𝑒 .

Aver distinto le due definizioni di 𝑒 𝑥 (tramite funzione potenza) e di exp(𝑥)


(tramite somma della serie esponenziale) è puramente strumentale. C’è una
unica funzione esponenziale che può essere definita in un modo o nell’altro.
Non ci si fissi quindi con l’identificare le due diverse notazioni 𝑒 𝑥 ed exp(𝑥)
con le due diverse definizioni. Ogni testo avrà una sua definizione di funzione
esponenziale che può essere per certi versi arbitraria salvo poi ritrovare le
proprietà caratterizzanti di tale funzione.

Come già detto d’ora in poi scriveremo, per ogni 𝑧 ∈ ℂ

𝑒 𝑧 = exp 𝑧
142 3 serie

considerando quindi exp 𝑧 l’estensione a tutto il piano complesso della funzione


esponenziale già definita sulla retta reale.

In analogia con il corollario 2.50 si ha il seguente risultato che fornisce anche un


modo alternativo per dimostrare il teorema 3.46.

Teorema 3.47 (limite notevole esponenziale complesso). Per ogni 𝑧 ∈ ℂ risulta


+∞ 𝑘
 𝑧 𝑛 X 𝑧
lim 1+ = .
𝑛→+∞ 𝑛 𝑘=0
𝑘!

Dimostrazione. Utilizzando lo sviluppo del binomio osserviamo che si ha


𝑛 𝑛
𝑧 𝑛 X 𝑛 𝑧𝑘 X 𝑧𝑘 𝑛!
  
1+ = = · 𝑘 .
𝑛 𝑘=0
𝑘 𝑛 𝑘
𝑘=0
𝑘 ! 𝑛 · (𝑛 − 𝑘)!

Posto per ogni 𝑘 ≤ 𝑛

𝑛! 𝑛 · (𝑛 − 1) · . . . · (𝑛 − 𝑘 + 1)
𝑐(𝑛, 𝑘) = =
𝑛𝑘· (𝑛 − 𝑘)! 𝑛𝑘
𝑛 𝑛−1 𝑛−2 𝑛−𝑘+1
= · · ·...·
𝑛 𝑛 𝑛 𝑛
osserviamo che 0 ≤ 𝑐(𝑛, 𝑘) ≤ 1 in quanto prodotto di numeri non negativi
minori o uguali ad 1. Inoltre, fissato 𝑘 , si ha 𝑐(𝑛, 𝑘) → 1 per 𝑛 → +∞ in quanto
𝑛−𝑗
ogni fattore 𝑛 tende a 1 per 𝑛 → +∞ (si noti che a 𝑘 fissato il numero di fattori
𝑘 è fissato).

Sia 𝑧 ∈ ℂ fissato e sia


+∞
X |𝑧| 𝑘
𝑆= .
𝑘=0
𝑘!
Sappiamo che la serie esponenziale è assolutamente convergente per ogni 𝑧 ∈ ℂ
(in quanto il raggio di convergenza è +∞) quindi 𝑆 è un numero reale (finito).
Dunque per il teorema 3.7 (della coda) sappiamo che per ogni 𝜀 > 0 esiste 𝑀
tale che
X+∞
|𝑧| 𝑘
< 𝜀.
𝑘=𝑀+1
𝑘!

Fissato 𝑘 ≤ 𝑀 visto che 𝑐(𝑛, 𝑘) → 1 esiste 𝑁 𝑘 > 𝑀 tale che per ogni 𝑛 > 𝑁 𝑘 si
abbia 1 − 𝑐(𝑛, 𝑘) < 𝜀 (ricordiamo che 𝑐(𝑛, 𝑘) ≤ 1). Prendiamo allora

𝑁 = max {𝑁 𝑘 : 𝑘 ≤ 𝑁 }

cosicchè per ogni 𝑛 > 𝑁 e per ogni 𝑘 ≤ 𝑀 si avrà 0 ≤ 1 − 𝑐(𝑛, 𝑘) < 𝜀. Allora,
per ogni 𝑛 > 𝑁 , possiamo spezzare la somma da 0 a 𝑛 nelle due somme da 0 a
3.10 la serie esponenziale 143

𝑀 e da 𝑀 + 1 a 𝑛 :
 𝑛
𝑛 𝑘 𝑛  𝑘 𝑘 𝑘
𝑧 𝑧  𝑛 X 𝑧 𝑧 𝑧
X  X
− 1+ = − 𝑐(𝑛, 𝑘) = (1 − 𝑐(𝑛, 𝑘))

𝑘=0 𝑘 ! 𝑛 𝑘=0 𝑘 ! 𝑘 ! 𝑘=0 𝑘!

𝑛
X |𝑧| 𝑘
≤ (1 − 𝑐(𝑛, 𝑘))
𝑘=0
𝑘!
𝑀
X |𝑧| 𝑘 X𝑛
|𝑧| 𝑘
= (1 − 𝑐(𝑛, 𝑘)) + (1 − 𝑐(𝑛, 𝑘))
𝑘=0
𝑘! 𝑘=𝑀+1
𝑘!
𝑀
X |𝑧| 𝑘 𝑛
X |𝑧| 𝑘
≤ 𝜀 +
𝑘=0
𝑘! 𝑘=𝑀+1
𝑘!
+∞ 𝑘
X |𝑧|
≤𝜀 +𝜀
𝑘=0
𝑘!
≤ 𝜀𝑆 + 𝜀 = 𝜀(𝑆 + 1).

Visto che 𝜀 > 0 era arbitrario abbiamo verificato tramite la definizione che
𝑛
X 𝑧𝑘  𝑧 𝑛
− 1+ →0
𝑘=0
𝑘! 𝑛

cioè
+∞ 𝑘
 𝑧 𝑛 X 𝑧
lim 1+ = .
𝑛→+∞ 𝑛 𝑘=0
𝑘!

Se 𝑥 ∈ ℝ abbiamo già visto che


 𝑥 𝑛
lim 1+ = 𝑒𝑥
𝑛→+∞ 𝑛
e quindi il teorema precedente ci assicura che

exp(𝑥) = 𝑒 𝑥 .

Teorema 3.48 (approssimazione dell’esponenziale). Se |𝑧| ≤ 1 si ha



𝑛
𝑧 𝑘 |𝑧| 𝑛+1
X
exp(𝑧) − ≤ . (3.12)

𝑘=0
𝑘! 𝑛 · 𝑛!

In particolare ponendo 𝑧 = 1 si trova


𝑛
X 1 1
0<𝑒− ≤ . (3.13)
𝑘=0
𝑘! 𝑛 · 𝑛!

e per 𝑛 = 5 si ottiene
2.716 < 𝑒 < 2.719 (3.14)
144 3 serie

Tabella 3.1: Le prime 1000 cifre decimali 2.7182818284 5904523536 0287471352 6624977572 4709369995
del numero 𝑒 calcolate con il metodo
9574966967 6277240766 3035354759 4571382178 5251664274
utilizzato nella dimostrazione del teore-
ma 3.48. Si veda il codice a pagina 426. 2746639193 2003059921 8174135966 2904357290 0334295260
5956307381 3232862794 3490763233 8298807531 9525101901
1573834187 9307021540 8914993488 4167509244 7614606680
8226480016 8477411853 7423454424 3710753907 7744992069
5517027618 3860626133 1384583000 7520449338 2656029760
6737113200 7093287091 2744374704 7230696977 2093101416
9283681902 5515108657 4637721112 5238978442 5056953696
7707854499 6996794686 4454905987 9316368892 3009879312
7736178215 4249992295 7635148220 8269895193 6680331825
2886939849 6465105820 9392398294 8879332036 2509443117
3012381970 6841614039 7019837679 3206832823 7646480429
5311802328 7825098194 5581530175 6717361332 0698112509
9618188159 3041690351 5988885193 4580727386 6738589422
8792284998 9208680582 5749279610 4841984443 6346324496
8487560233 6248270419 7862320900 2160990235 3043699418
4914631409 3431738143 6405462531 5209618369 0888707016
7683964243 7814059271 4563549061 3031072085 1038375051
0115747704 1718986106 8739696552 1267154688 9570350354

Dimostrazione. La coda della serie esponenziale può essere stimata tramite la


somma di una serie geometrica:

𝑛
1 +∞
|𝑧| 𝑘 X+∞
|𝑧| 𝑛+𝑘+1
X X
exp 𝑧 − ≤ =

𝑘=0
𝑘 ! 𝑘=𝑛+1 𝑘 ! 𝑘=0
(𝑛 + 𝑘 + 1)!
𝑘
+∞
|𝑧| 𝑛+1+𝑘 |𝑧| 𝑛+1 X
+∞

X |𝑧|
≤ =
𝑘=0 (𝑛 + 1) 𝑘+1 · 𝑛 ! 𝑛 ! 𝑘=0 (𝑛 + 1)
|𝑧| 𝑛+1 1 |𝑧| 𝑛+1
= · = .
(𝑛 + 1) · 𝑛 ! 1 − |𝑧| (𝑛 + 1 − |𝑧|) · 𝑛 !
(𝑛+1)

Se |𝑧| ≤ 1 si ottiene quindi la stima (3.12). Se 𝑧 = 1 la serie esponenziale è a


termini positivi e dunque approssima 𝑒 per difetto: si ottiene dunque (3.13).
Per 𝑛 = 5 si ha
5
X 1 1 1 1 1 326
=1+1+ + + + =
𝑘=0
𝑘! 2 6 24 120 120

Dunque da un lato
326
𝑒≥ ≥ 2.716
120
e dall’altro
326 1
𝑒≤ + ≤ 2.717 + 0.002 = 2.719
120 5 · 5!

𝑒∉ℚ

Teorema 3.49 (irrazionalità di 𝑒 ). Il numero 𝑒 è irrazionale.


3.11 le funzioni trigonometriche 145

Dimostrazione. Supponiamo per assurdo che sia 𝑒 = 𝑝/𝑞 con 𝑝 ∈ ℤ e 𝑞 ∈ ℕ .


Possiamo supporre 𝑞 > 1 (non importa che la frazione sia ridotta ai minimi
termini).

Per ogni 𝑛 ∈ ℕ si ha
+∞ 𝑛 +∞
X 𝑛! X 𝑛! X 1
𝑛 !𝑒 = = + 𝑛! .
𝑘=0
𝑘! 𝑘=0
𝑘! 𝑘=𝑛+1
𝑘!

Il primo addendo nella somma precedente è intero in quanto se 𝑘 ≤ 𝑛 il rapporto


𝑛 !/𝑘 ! è intero. Grazie al teorema 3.48 per il secondo addendo se 𝑛 > 1 si ha:
+∞
X 1 1
0 < 𝑛! ≤ < 1.
𝑘=𝑛+1
𝑘! 𝑛

Risulta dunque che per ogni 𝑛 ≥ 2 il numero 𝑛 ! 𝑒 è strettamente compreso tra


due interi consecutivi e quindi non è mai intero. Dunque 𝑒 non può essere
𝑝
razionale perché se fosse 𝑒 = 𝑞 si avrebbe 𝑛 ! 𝑒 ∈ ℤ per ogni 𝑛 > 𝑞 .

3.11 le funzioni trigonometriche

Se 𝑡 ∈ ℝ il numero complesso 𝑒 𝑖𝑡 è unitario (ha modulo uno) in quanto, per le


proprietà dell’esponenziale complesso, si ha
𝑖𝑡 2
𝑒 = 𝑒 𝑖𝑡 · 𝑒 𝑖𝑡 = 𝑒 𝑖𝑡 · 𝑒 −𝑖𝑡 = 𝑒 𝑖𝑡−𝑖𝑡 = 𝑒 0 = 1.

Ci ricordiamo che il prodotto di due numeri unitari 𝑒 𝑖𝑡 , 𝑒 𝑖𝑠 è un numero


unitario che geometricamente identifica un angolo che è la somma degli angoli
identificati dai due fattori. Visto che si ha 𝑒 𝑖𝑡 · 𝑒 𝑖𝑠 = 𝑒 𝑖(𝑡+𝑠) significa che l’angolo
identificato dal numero complesso 𝑒 𝑖(𝑡+𝑠) è la somma degli angoli geometrici
identificati da 𝑒 𝑖𝑡 e da 𝑒 𝑖𝑠 . Essendo inoltre 𝑒 𝑖𝑡 una funzione continua dobbiamo
dedurre che dal punto di vista geometrico il parametro 𝑡 misura l’ampiezza
dell’angolo identificato da 𝑒 𝑖𝑡 sulla circonferenza unitaria. Più precisamente
possiamo osservare che se Δ𝑡 → 0 grazie al limite notevole dell’esponenziale
complesso otteniamo

𝑒 𝑖(𝑡+Δ𝑡) − 𝑒 𝑖𝑡 𝑒 𝑖Δ𝑡 − 1
lim = 𝑖𝑒 𝑖𝑡 lim = 𝑖𝑒 𝑖𝑡 .
Δ𝑡→0 Δ𝑡 𝑡→0 𝑖Δ𝑡

Significa che se interpretiamo 𝑡 ↦→ 𝑒 𝑖𝑡 come la legge oraria di un punto che


si muove sulla circonferenza unitaria, la velocità del punto, al tempo 𝑡 , è
rappresentata dal vettore (numero complesso) 𝑣 = 𝑖𝑒 𝑖𝑡 che non è altro che
il ruotato di 𝑒 𝑖𝑡 di un angolo retto in senso antiorario. Dunque il punto 𝑒 𝑖𝑡
si muove di moto circolare uniforme in senso antiorario sulla circonferenza
unitaria con velocità di modulo unitario. Scopriamo quindi che il punto 𝑒 𝑖𝑡 ha
percorso dal tempo 𝑡 = 0 un arco di lunghezza pari a 𝑡 .

La definizione seguente dunque può essere interpretata geometricamente


dicendo che le funzioni cos 𝑡 e sin 𝑡 sono le coordinate 𝑥 e 𝑦 del punto sulla
circonferenza unitaria 𝑥 2 + 𝑦 2 = 1 che identifica un arco di lunghezza 𝑡 misurato
146 3 serie

in senso antiorario a partire dal punto di coordinate (1 , 0). La lunghezza di un


radiante
arco unitario sulla circonferenza unitaria si chiama radiante e diremo quindi
che 𝑡 è la misura in radianti dell’angolo identificato dal punto 𝑒 𝑖𝑡 di coordinate
(cos 𝑡, sin 𝑡) sul piano complesso.

Definizione 3.50 (funzioni trigonometriche). Per ogni 𝑥 ∈ ℝ si potrà definire


   
cos 𝑥 = Re 𝑒 𝑖𝑥 , sin 𝑥 = Im 𝑒 𝑖𝑥

formula di Eulero cosicché valga la formula di Eulero

𝑒 𝑖𝑥 = cos 𝑥 + 𝑖 sin 𝑥.

Teorema 3.51 (proprietà delle funzioni seno e coseno). Le funzioni sin e cos
soddisfano le seguenti proprietà.

𝑒 𝑖𝑥 + 𝑒 −𝑖𝑥 𝑒 𝑖𝑥 − 𝑒 −𝑖𝑥
1. cos(𝑥) = , sin(𝑥) = ;
2 2𝑖
2. sin(−𝑥) = − sin 𝑥 (la funzione sin è dispari), cos(−𝑥) = cos 𝑥 (la funzione cos
è pari);
3. identità fondamentale della trigonometria:

cos2 𝑥 + sin2 𝑥 = 1;

4. formule di addizione:

cos(𝛼 + 𝛽) = cos 𝛼 cos 𝛽 − sin 𝛼 sin 𝛽,


sin(𝛼 + 𝛽) = sin 𝛼 cos 𝛽 + cos 𝛼 sin 𝛽 ;

5. le funzioni cos : ℝ → ℝ e sin : ℝ → ℝ sono continue;


6. si ha
+∞
𝑥 2𝑘 𝑥2 𝑥4 𝑥6
(−1) 𝑘
X
cos 𝑥 = =1− + − +... (3.15)
𝑘=0
(2 𝑘)! 2 4! 6!
+∞
𝑥 2 𝑘+1 𝑥3 𝑥5 𝑥7
(−1) 𝑘
X
sin 𝑥 = =𝑥− + − +... (3.16)
𝑘=0
(2 𝑘 + 1)! 6 5! 7!

7. vale il seguente limite notevole

sin 𝑥 1 − cos 𝑥 1
lim =1 e lim = .
𝑥→0 𝑥 𝑥→0 𝑥2 2

Dimostrazione. 1. Essendo 𝑒 𝑖𝑥 = 𝑒 𝑖𝑥 = 𝑒 −𝑖𝑥 discende dalla formula (1.21) per


il calcolo di parte reale ed immaginaria.
2. Si verifica direttamente con le formule precedenti.
3. Per 𝑥 ∈ ℝ si ha da un lato

| exp(𝑖𝑥)| 2 = exp(𝑖𝑥) · exp(𝑖𝑥) = exp(𝑖𝑥) · exp(−𝑖𝑥) = exp(0) = 1


3.11 le funzioni trigonometriche 147

𝑦
𝑦 = tg 𝑥

1 𝑦 = sin 𝑥

𝑥 Figura 3.1: I grafici delle funzioni sin,


− 32 𝜋 −𝜋 − 𝜋2 𝜋 𝜋 cos e tg.
2𝜋
3
2
-1
𝑦 = cos 𝑥

(interagisci)

e dall’altro

| exp(𝑖𝑥)| 2 = | cos 𝑥 + 𝑖 sin 𝑥| 2 = cos2 𝑥 + sin2 𝑥.

4. Grazie alla formula che esprime l’esponenziale della somma:

cos(𝛼 + 𝛽) + 𝑖 sin(𝛼 + 𝛽) = exp(𝑖(𝛼 + 𝛽)) = exp(𝑖𝛼) · exp(𝑖𝛽)


= (cos 𝛼 + 𝑖 sin 𝛼) · (cos 𝛽 + 𝑖 sin 𝛽)
= cos 𝛼 cos 𝛽 − sin 𝛼 sin 𝛽
+ 𝑖(sin 𝛼 cos 𝛽 + cos 𝛼 sin 𝛽)

e uguagliando parte reale e parte immaginaria si ottengono le formule di


addizione.
5. Visto che la funzione exp : ℂ → ℂ è continua anche la sua restrizione
all’asse immaginario lo è. E dunque anche parte reale (coseno) e parte
immaginaria (seno) lo sono.
6. Sia 𝑥 ∈ ℝ. Osservando che 𝑖 2 𝑘 = (𝑖 2 ) 𝑘 = (−1) 𝑘 e 𝑖 2 𝑘+1 = 𝑖 · 𝑖 2 𝑘 =
𝑖 · (−1) 𝑘 suddividendo i termini pari e dispari della serie che definisce
l’esponenziale si ha:
+∞ 𝑘 𝑘 +∞ 2 𝑘 2 𝑘 +∞ 2 𝑘+1 2 𝑘+1
X 𝑖 𝑥 X 𝑖 𝑥 X 𝑖 𝑥
exp(𝑖𝑥) = = +
𝑘=0
𝑘! 𝑘=0
(2 𝑘)! 𝑘=0
(2 𝑘 + 1)!
+∞
X 𝑘
(−1) 𝑥 2𝑘 +∞
X (−1) 𝑘 𝑥 2 𝑘+1
= +𝑖 .
𝑘=0
(2 𝑘)! 𝑘=0
(2 𝑘 + 1)!

Osserviamo ora che le due serie che compaiono a destra dell’uguaglianza


sono a termini reali e quindi la loro somma è reale. Dunque queste due
serie coincidono con la parte reale e la parte immaginaria di exp(𝑖𝑥) =
cos 𝑥 + 𝑖 sin 𝑥 .
7. Per la corrispondente proprietà dell’esponenziale sappiamo che per 𝑥 → 0
si ha
𝑒 𝑖𝑥 − 1
→ 1.
𝑖𝑥
Ma
𝑒 𝑖𝑥 − 1 cos 𝑥 − 1 + 𝑖 sin 𝑥 sin 𝑥 1 − cos 𝑥
= = +𝑖 .
𝑖𝑥 𝑖𝑥 𝑥 𝑥
148 3 serie

Scopriamo dunque che

1 − cos 𝑥 sin 𝑥
→0 e → 1.
𝑥 𝑥
D’altra parte si ha

1 − cos 𝑥 (1 − cos 𝑥) · (1 + cos 𝑥) 1 − cos2 𝑥 1


= = ·
𝑥 2 𝑥 (1 + cos 𝑥)
2 𝑥 2 1 + cos 𝑥
2
sin 𝑥

1 1 1
= · →1· = .
𝑥 1 + cos 𝑥 1 + cos 0 2

Definiamo 𝜋 come la misura in radianti dell’angolo piatto, cioè dell’angolo


𝜋 identificato dal numero 𝑒 𝑖𝜋 = −1 sul piano complesso.

𝜏 Teorema 3.52 (definizione di 𝜋). Definiamo 𝜋 come il più piccolo numero reale
positivo in cui si annulla la funzione sin 𝑥 . Si ha 𝜋 ∈ [2.8 , 4]. Le funzioni 𝑒 𝑖𝑥 , sin 𝑥 e
cos 𝑥 sono periodiche di periodo 𝜏 = 2𝜋:

𝑒 𝑖𝑥+2𝜋 = 𝑒 𝑖𝑥 , cos(𝑥 + 2𝜋) = cos 𝑥, sin(𝑥 + 2𝜋) = sin 𝑥.

La funzione sin 𝑥 è strettamente crescente nell’intervallo − 𝜋2 , 𝜋2 e strettamente mentre


 

la funzione cos 𝑥 è strettamente decrescente nell’intervallo [0 , 𝜋]. Si ha infine:

sin(𝜋 + 𝑥) =− sin 𝑥, cos(𝜋 + 𝑥) = − cos 𝑥.

Vale inoltre la celeberrima formula di Eulero:

𝑒 𝑖𝜋 + 1 = 0.

Dimostrazione. Il teorema 3.48 ci permette di approssimare la funzione espo-


nenziale 𝑒 𝑖𝑥 per 𝑥 ∈ [0 , 1]. Ci proponiamo quindi di determinare l’andamento
delle funzioni sin 𝑥 e cos 𝑥 in tale intervallo e definire in tale intervallo il valore
di 𝛼 = 𝜋4 . Tramite tale valore 𝛼 e tramite le formule di addizione riusciremo a
determinare l’andamento delle funzioni sin e cos su tutta la retta reale.

Se 𝑥 ∈ [0 , 1] grazie al teorema 3.48 applicato con 𝑛 = 3 sappiamo che


4
 2 3

𝑒 − 1 + 𝑖𝑥 + (𝑖𝑥) + (𝑖𝑥) ≤ |𝑖𝑥|
𝑖𝑥
2 6 18

sviluppando

cos 𝑥 + 𝑖 sin 𝑥 − 1 − 𝑖𝑥 + 𝑥 + 𝑖 𝑥 ≤ 𝑥 .
2

3 4

2 6 18
3.11 le funzioni trigonometriche 149

Il valore assoluto delle parti reale e immaginaria di un numero complesso sono


minori del modulo del numero complesso. Dunque si ottiene:

cos 𝑥 − 1 + 𝑥 ≤ 𝑥 sin 𝑥 − 𝑥 + 𝑥 ≤ 𝑥 .

2 4

3 4

e (3.17)
2 18 6 18

Per la funzione sin 𝑥 si ha dunque

𝑥3 𝑥4 𝑥3 𝑥4
𝑥− − ≤ sin 𝑥 ≤ 𝑥 − +
6 18 6 18
e sapendo che 0 < 𝑥 < 1 possiamo affermare che

𝑥3 𝑥4 𝑥 𝑥 7
𝑥− − ≥𝑥− − = 𝑥
6 18 6 18 9
e
𝑥3 𝑥4 𝑥3 𝑥3
𝑥− + ≤𝑥− + ≤ 𝑥.
6 18 6 18
Dunque se 𝑥 ∈ [0 , 1] si ha
7
𝑥 ≤ sin 𝑥 ≤ 𝑥. (3.18)
9
Per il coseno da un lato osserviamo che da (3.17) si ottiene, se 𝑥 ∈ [0 , 1]:

𝑥2 𝑥4 1 1 4
cos 𝑥 ≥ 1 − − ≥ 1− − = > 0.
2 18 2 18 9
Dall’altro lato si ha

𝑥2 𝑥4 𝑥2 𝑥2 4
cos 𝑥 ≤ 1 − + =1− + ≤ 1 − 𝑥2 .
2 18 2 18 9

Vogliamo ora dimostrare che la funzione cos 𝑥 è strettamente decrescente


sull’intervallo [0 , 1]. Infatti se 𝑥 ∈ [0 , 1] e 𝑡 ∈ (0 , 1] si ha

cos(𝑥 + 𝑡) = cos 𝑥 cos 𝑡 − sin 𝑥 sin 𝑡 ≤ cos 𝑥 cos 𝑡 < cos 𝑥

in quanto sin 𝑥 ≥ 0, sin 𝑡 ≥ 0 e cos 𝑡 < 1 − 59 𝑡 2 < 1 se 𝑡 > 0. Dunque la


funzione cos 𝑥 è strettamente decrescente su [0 , 1]. Visto che cos2 𝑥 + sin2 𝑥 = 1
deduciamo che la funzione sin2 𝑥 è strettamente crescente in [0 , 1]. Inoltre sin 𝑥
è positiva su tale intervallo e dunque anche sin 𝑥 è strettamente crescente in
[0 , 1].


Vogliamo ora dimostrare che esiste 𝛼 ∈ [0 , 1] tale per cui sin 𝛼 = 22 . Visto che
sin 𝑥 è una funzione continua, e sin 0 = 0, per √
utilizzare il teorema 2.80 dei
2
valori intermedi basterà verificare che sin 1 > 2 . E infatti si ha:

7 2
sin 1 ≥ > .
9 2
√ √
2 2
Dunque esiste un unico 𝛼 ∈ [0 , 1] tale che sin 𝛼 = 2 . Allora anche cos 𝛼 = 2
150 3 serie

(in quanto sin2 + cos2 = 1) e quindi


√ 2
2 𝑖𝛼 2 1
𝑒 = (1 + 𝑖) = (1 + 2 𝑖 − 1) = 𝑖.
2 2

Dunque 𝛼 è la misura in radianti di metà angolo retto.

Se poniamo 𝜋 = 4 𝛼 scopriamo dunque che


 2
𝑒 𝑖𝜋 = 𝑒 2𝑖𝛼 = 𝑖 2 = −1

da cui sin 𝜋 = 0 e cos 𝜋 = −1. Analogamente da 𝑒 2𝑖𝛼 = 𝑖 troviamo che sin 𝜋2 = 1


cos 𝜋2 = 0.

Dalla stima (3.18) si ottiene √


7 2
𝛼≤ ≤𝛼
9 2
da cui 𝜋 = 4 𝛼 ∈ [2.8 , 4].

Abbiamo verificato che sull’intervallo 0 , 𝜋4 la funzione sin 𝑥 è strettamente


 

crescente mentre cos 𝑥 è strettamente decrescente. Dalle formule di addizione


sin 𝜋2 − 𝑥 = cos 𝑥 e cos 𝜋2 − 𝑥 = sin 𝑥 . Dunque
 
possiamo quindi dedurre 𝜋 che
anche sull’intervallo 4 , 𝜋2 la funzione sin 𝑥 è crescente e cos 𝑥 è decrescente.


Ancora, tramite le formula di addizione troviamo che sin(𝜋 − 𝑥) = sin 𝑥 e


cos(𝜋 − 𝑥) = − cos 𝑥 da cui possiamo dedurre che sia la funzione
 𝜋 sin 𝑥 che la
funzione cos 𝑥 sono strettamente decrescenti sull’intervallo 2 , 𝜋 . Possiamo
dunque affermare che sin 𝑥 > 0 se 0 < 𝑥 < 𝜋 e dunque 𝜋 è il più piccolo reale
positivo in cui la funzione sin si annulla.

Visto che sin(𝜋 + 𝑥) = − sin 𝑥 e cos(𝜋 + 𝑥) = − cos 𝑥 possiamo stabilire l’an-


damento delle funzioni sin e cos anche sull’intervallo [𝜋, 2𝜋]. Infine essendo
𝑒 2𝑖𝜋 = 1 si osserva che la funzione 𝑒 2𝑖𝑥 e di conseguenza le funzioni sin 𝑥 e cos 𝑥
sono periodiche di periodo 2𝜋.

Esercizio 3.53. Utilizzando il teorema 3.48 dimostrare che

lim 𝑛 sin(2𝜋𝑒 𝑛 !) = 2𝜋.


𝑛→+∞

3.12 funzioni trigonometriche inverse

La funzione sin : [−𝜋/2 , 𝜋/2] → [−1 , 1] risulta essere strettamente crescente.


Inoltre essendo una funzione continua e visto che sin(−𝜋/2) = −1 e sin(𝜋/2) = 1
per il teorema dei valori intermedi la funzione assume tutti i valori in [−1 , 1].
Dunque restringendo il dominio all’intervallo [−𝜋/2 , 𝜋/2] e il codominio
all’intervallo [−1 , 1] la funzione risulta invertibile. La funzione inversa

arcsin : [−1 , 1] → [−𝜋/2 , 𝜋/2]


3.12 funzioni trigonometriche inverse 151

si chiama arco seno. Per definizione di funzione inversa si ha

arcsin(sin 𝑥) = 𝑥, ∀𝑥 ∈ [−𝜋/2 , 𝜋/2]

e
sin(arcsin 𝑥) = 𝑥, ∀𝑥 ∈ [−1 , 1].

La funzione cos : [0 , 𝜋] → [−1 , 1] risulta essere strettamente decrescente e,


analogamente a quanto visto per la funzione sin possiamo verificare che ristretta
a tali intervalli è una funzione invertibile. La funzione inversa

arccos : [−1 , 1] → [0 , 𝜋]

si chiama arco coseno. Per definizione si ha

arccos(cos 𝑥) = 𝑥, ∀𝑥 ∈ [0 , 𝜋]

e
cos(arccos 𝑥) = 𝑥, ∀𝑥 ∈ [−1, 1].

tg 𝑥
La funzione
sin 𝑥
tg 𝑥 =
cos 𝑥
è definita quando cos 𝑥 ≠ 0 ovvero:
n𝜋 o
tg : ℝ \ + 𝑘𝜋 : 𝑘 ∈ ℤ → ℝ.
2
Se restringiamo la funzione all’intervallo (−𝜋/2 , 𝜋/2) possiamo facilmente
osservare che la funzione tg : (−𝜋/2 , 𝜋/2) → ℝ è strettamente crescente. Inoltre
se 𝑎 𝑛 → 𝜋/2, 𝑎 𝑛 < 𝜋/2 si ha cos(𝑎 𝑛 ) → 0 (per continuità del coseno) e
sin(𝑎 𝑛 ) → 1 dunque tg 𝑎 𝑛 → +∞. Analogamente per 𝑎 𝑛 → −𝜋/2 si trova
tg 𝑎 𝑛 → −∞. Dunque per il teorema dei valori intermedi possiamo affermare
che la funzione tg : (−𝜋/2 , 𝜋/2) → ℝ è suriettiva. E’ quindi invertibile e la
funzione inversa
arctg : ℝ → (−𝜋/2 , 𝜋/2)
si chiama arco tangente. Per definizione si ha

arctg tg 𝑥 = 𝑥, ∀𝑥 ∈ (−𝜋/2 , 𝜋/2)

e
tg arctg 𝑥 = 𝑥, ∀𝑥 ∈ ℝ.

Grazie al teorema 2.8visto che quest funzioni sono monotone e bigettive possia-
mo affermare che le funzioni arcsin, arccos e arctg sono funzioni continue.

Esercizio 3.54. Dimostrare che per ogni 𝑥 > 0 si ha

1 𝜋
arctg = − arctg 𝑥.
𝑥 2
152 3 serie

Esercizio 3.55. La serie


+∞
X sin 𝑘
𝑘=1
𝑘
è convergente.

Dimostrazione. Applichiamo il teorema 3.32. Posto 𝑎 𝑘 = sin 𝑘 e 𝐵 𝑘 = 1/𝑘 si ha

𝑛−1 𝑛−1
𝑒 𝑖𝑘 .
X X
𝐴𝑛 = sin 𝑘 = Im
𝑘=0 𝑘=0

Osserviamo allora che 𝑒 𝑖𝑘 = (𝑒 𝑖 ) 𝑘 e dunque 𝐴𝑛 è la parte immaginaria della


somma di una serie geometrica. Si può quindi calcolare esplicitamente

1 − (𝑒 𝑖 )𝑛
𝐴𝑛 = Im
1 − 𝑒𝑖
da cui
1 − 𝑒 𝑖𝑛 1 + 𝑒 𝑖𝑛

2
|𝐴𝑛 | ≤

𝑖
≤ =
1−𝑒 𝑖
1 − 𝑒 1 − 𝑒 𝑖

e dunque 𝐴𝑛 è limitata.

D’altro canto posto 𝐵 𝑘 = 1/𝑘 è chiaro che 𝐵 𝑘 è decrescente e infinitesima.

Esercizio 3.56. Determinare il carattere delle seguenti serie


   
X 1 1 X 1
− sin , sin 𝜋𝑛 +
𝑛 𝑛 𝑛 𝑛 𝑛

3.13 funzioni iperboliche


sinh, cosh

Definizione 3.57 (funzioni iperboliche). Le funzioni coseno iperbolico e seno


iperbolico sono definite, per ogni 𝑥 ∈ ℝ, come segue:

𝑒 𝑥 + 𝑒 −𝑥 𝑒 𝑥 − 𝑒 −𝑥
cosh 𝑥 = , sinh 𝑥 = . (3.19)
2 2

Teorema 3.58 (proprietà delle funzioni iperboliche). Valgono le seguenti proprietà.

1. la funzione sinh è dispari, cosh è pari:

sinh(−𝑥) = − sinh(𝑥), cosh(−𝑥) = cosh(𝑥);

2. i punti del piano con coordinate (cosh 𝑥, sinh 𝑥) per 𝑥 ∈ ℝ sono disposti su un
ramo di iperbole in quanto vale:

cosh2 𝑥 − sinh2 𝑥 = 1;
3.13 funzioni iperboliche 153

𝑦 = sinh 𝑥
𝑦 = cosh 𝑥 𝑦 = tgh 𝑥
1

𝑥 Figura 3.2: I grafici delle funzioni sinh,


cosh e tgh.

−1

(interagisci)

3. formule di addizione:

cosh(𝛼 + 𝛽) = cosh 𝛼 cosh 𝛽 + sinh 𝛼 sinh 𝛽,


sinh(𝛼 + 𝛽) = sinh 𝛼 cosh 𝛽 + cosh 𝛼 sinh 𝛽 ;

4. si ha
+∞
X 𝑥 2𝑘 𝑥2 𝑥4 𝑥6
cosh 𝑥 = =1+ + + +...
𝑘=0
(2 𝑘)! 2 4! 6!
+∞
X 𝑥 2 𝑘+1 𝑥3 𝑥5 𝑥7
sinh 𝑥 = =𝑥+ + + +...
𝑘=0
(2 𝑘 + 1)! 6 5! 7!

5. la funzione sinh è strettamente crescente su tutto ℝ, la funzione cosh è stretta-


mente crescente sull’intervallo [0 , +∞) e strettamente decrescente nell’intervallo
(−∞, 0];
6. per 𝑥 → +∞ si ha sinh 𝑥 → +∞, cosh 𝑥 → +∞, per 𝑥 → −∞ si ha
sinh 𝑥 → −∞, cosh 𝑥 → +∞.

Dimostrazione. I primi tre punti si dimostrano facilmente per verifica diretta,


utilizzando la definizione (3.19).
Gli sviluppi in serie si ottengono anch’essi sostituendo gli sviluppi dell’espo-
nenziale nella definizione. Nel cosh i termini di grado dispari si cancellano, nel
sinh si cancellano i termini di grado pari.
Per quanto riguarda la monotonia si osserva che se 𝑥 ≥ 0 ogni addendo delle
due serie esposte nel punto 4 è strettamente crescente (in quanto i coefficienti
sono tutti positivi) e dunque le somme delle serie, cioè la funzione cosh e la
funzione sinh sono strettamente crescenti sull’intervallo [0 , +∞). La funzione
sinh, essendo dispari, risulta inoltre crescente anche sull’intervallo (−∞, 0] e
quindi è crescente su tutto ℝ.
Per l’ultima proprietà basterà usare la definizione (3.19) e ricordare che (teore-
ma 2.58) se 𝑥 → +∞ allora 𝑒 𝑥 → +∞ ed 𝑒 −𝑥 = 𝑒1𝑥 → 0.

Osserviamo che cosh 0 = 1 e, per le proprietà di monotonia viste nel teorema


precedente si ha cosh 𝑥 ≥ cosh 0 = 1 > 0. Dunque cosh 𝑥 non si annulla mai e
si può definire per ogni 𝑥 ∈ ℝ la tangente iperbolica
tgh
154 3 serie

sinh 𝑥
tgh 𝑥 = .
cosh 𝑥

La funzione sinh : ℝ → ℝ è iniettiva in quanto strettamente crescente ed è


surgettiva in quanto è continua e quindi assume tutti i valori compresi tra
lim𝑥→+∞ sinh(𝑥) = +∞ e lim𝑥→−∞ sinh(𝑥) = −∞. Dunque sinh : ℝ → ℝ è
invertibile e la funzione inversa si chiama settore di seno iperbolico e si denota con
settsinh
settsinh : ℝ → ℝ.
Analogamente la funzione ristretta cosh : [0 , +∞) → [1 , +∞) è iniettiva in
quanto strettamente crescente ed è surgettiva in quanto è continua e assume su
[0 , +∞) tutti i valori compresi tra cosh(0) = 1 e lim𝑥→+∞ cosh 𝑥 = +∞. Dunque
la funzione cosh 𝑥 ristretta a [0 , +∞) → [1 , +∞) è invertibile e la funzione
settcosh
inversa si chiama settore di coseno iperbolico

settcosh : [1 , +∞) → [0 , +∞).

La funzione tgh 𝑥 è strettamente crescente su tutto ℝ e assume tutti i valori


strettamente compresi tra −1 e 1. La funzione inversa si chiama setttgh.

Esercizio 3.59. Fissato 𝑦 ∈ ℝ si risolva l’equazione

𝑒 𝑥 − 𝑒 −𝑥
=𝑦
2
riconducendola ad una equazione di secondo grado nella variabile 𝑡 = 𝑒 𝑥 . Si dimostri
quindi che vale  √ 
settsinh 𝑥 = ln 𝑥 + 𝑥 2 + 1 .

In modo analogo si dimostri che vale


 √ 
settcosh 𝑥 = ln 𝑥 + 𝑥2 − 1

e r
1+𝑥
setttgh 𝑥 = ln .
1−𝑥

3.14 esercizi

Esercizio 3.60. Determinare il carattere delle seguenti serie

X 𝑛2 − 𝑛3 X (𝑛 !)2
,
𝑛 3𝑛 𝑛 (2𝑛)!

X (−1)𝑛 X 𝑛 − 10
,
𝑛 ln |𝑛 7 − 10𝑛 5 + 3 | 𝑛 𝑛 2 + 10
i numeri complessi 4
Nel capitolo precedente abbiamo introdotto l’esponenziale complesso ed abbia-
mo osservato che la funzione 𝑓 : ℝ → ℂ definita da 𝑓 (𝑡) = 𝑒 𝑖𝑡 ha valori sulla
circonferenza unitaria in quanto 𝑒 𝑖𝑡 = 1. Tramite la definizione 3.50 abbiamo
introdotto le funzioni seno e coseno in modo che risulti 𝑓 (𝑡) = cos 𝑡 + 𝑖 sin 𝑡 .
Sappiamo che 𝑓 (0) = 𝑒 0 = 1 e, per come abbiamo definito 𝜋, sappiamo che
𝑓 (𝜋/2) = 𝑖 .

4.1 rappresentazione polare dei numeri complessi

I numeri complessi di modulo uno vengono chiamati unitari. Geometricamente complessi unitari
i numeri complessi unitari sono i punti della circonferenza unitaria centrata
nell’origine del piano complesso. Se 𝑧 = 𝑥 + 𝑖 𝑦 è unitario si ha 𝑥 2 + 𝑦 2 = 1. I
prodotti e i reciproci dei numeri complessi unitari sono anch’essi unitari, risulta
quindi che tali numeri formano un sottogruppo moltiplicativo del gruppo dei Un gruppo è un insieme su cui è definita
una operazione (spesso denotata con il
numeri complessi. simbolo della moltiplicazione) che sia
associativa, che abbia elemento neutro e
Ogni numero complesso 𝑧 potrà essere scritto nella forma tale che ogni elemento abbia un inverso.

𝑧 =𝜌·𝑢

con 𝜌 ∈ ℝ, 𝜌 > 0 e 𝑢 ∈ ℂ unitario. Basta infatti definire 𝜌 = |𝑧| e 𝑢 = 𝑧/|𝑧| (se


𝑧 ≠ 0, altrimenti si potrà scegliere arbitrariamente 𝑢 = 1).

Teorema 4.1 (argomento). Sia 𝑧 ∈ ℂ un numero complesso non nullo. Allora esiste
un unico 𝜃 ∈ [0 , 2𝜋) tale che
𝑧 = |𝑧|𝑒 𝑖𝜃 .
Denoteremo tale valore di 𝜃 come l’argomento (o fase) di 𝑧 e scriveremo argomento

𝜃 = arg 𝑧.

Se 𝑧 = 0 porremo per convenzione arg 𝑧 = 0.

Dimostrazione. Sia 𝑧 ∈ ℂ, 𝑧 ≠ 0 e poniamo 𝑢 = 𝑧/|𝑧| . Posto 𝑢 = 𝑥 + 𝑖 𝑦 con


𝑥, 𝑦 ∈ ℝ si ha |𝑢| 2 = 𝑥 2 + 𝑦 2 = 1.

Se 𝑦 ≥ 0 se vogliamo che 𝑦 = sin 𝜃 con 𝜃 ∈ [0 , 2𝜋) dovrà necessariamente essere


𝜃 ∈ [0 , 𝜋] (altrimenti si avrebbe sin 𝜃 < 0). E se vogliamo che sia 𝑥 = cos 𝜃
basterà (e si dovrà) scegliere 𝜃 = arccos 𝑥 . Visto che sin2 𝜃 + cos2 𝜃 = 1 = 𝑥 2 + 𝑦 2
sapendo che cos 𝜃 = 𝑥 si avrà sin2 𝜃 = 𝑦 2 cioè | sin 𝜃| = |𝑦| . Ma visto che 𝑦 ≥ 0 e
sin 𝜃 ≥ 0 avremo, come voluto, sin 𝜃 = 𝑦 . Se 𝑦 < 0 poniamo 𝜃 = 2𝜋 − arccos 𝑥
cosicché si avrà 𝜃 ∈ (𝜋, 2𝜋) e, come prima (verificare!), 𝑥 = cos 𝜃 , 𝑦 = sin 𝜃 .

In ogni caso per ogni 𝑧 ≠ 0 abbiamo quindi trovato l’unico 𝜃 ∈ [0 , 2𝜋) tale che

𝑢 = 𝑥 + 𝑖 𝑦 = cos 𝜃 + 𝑖 sin 𝜃 = 𝑒 𝑖𝜃 .
156 4 i numeri complessi

da cui
𝑧 = |𝑧| · 𝑒 𝑖𝜃 .

Per ogni 𝑧 ∈ ℂ posto


𝜌 = |𝑧|, 𝜃 = arg 𝑧
si avrà quindi la rappresentazione esponenziale o polare

𝑧 = 𝜌𝑒 𝑖𝜃 = 𝜌 · (cos 𝜃 + 𝑖 sin 𝜃).

Se 𝑧 = 𝑥 + 𝑖 𝑦 è la rappresentazione cartesiana, si avranno le seguenti formule di


conversione: ( (
𝑥 = 𝜌 cos 𝜃 𝜌 = 𝑥2 + 𝑦2
p

𝑦 = 𝜌 sin 𝜃 𝜃 = arg 𝑧
con
𝜋 𝑥



 2 − arctg 𝑦 se 𝑦 > 0,
 3 𝜋 − arctg 𝑥 se 𝑦 < 0,


𝑦

arg 𝑧 = 2


 𝜋 se 𝑦 = 0 e 𝑥 < 0,
se 𝑦 = 0 e 𝑥 ≥ 0.

0

4.2 interpretazione geometrica

Vogliamo ora interpretare geometricamente 𝜃 = arg 𝑧 come la misura di un


angolo. Per fare ciò dobbiamo però capire cosa si intende per angolo e come si
misura un angolo. In questa sezione ragioneremo in maniera intuitiva in quanto
le proprietà formali analitiche delle operazioni sui numeri complessi sono
già state determinate e quello che vogliamo fare è darne una interpretazione
geometrica. Daremo quindi per scontate le proprietà geometriche del piano
euclideo.

Un angolo, geometricamente, è la regione piana delimitata da due semirette


uscenti da uno stesso punto. Le due semirette si chiamano lati dell’angolo e il
punto in comune si chiama vertice.

Due angoli 𝛼, 𝛽 si dicono congruenti se è possibile traslare e ruotare uno dei


due angoli (diciamo 𝛼 ) in modo che si sovrapponga all’altro. In particolare sarà
sempre possibile trovare una traslazione che manda il vertice dell’angolo 𝛼 sul
vertice dell’angolo 𝛽 e sarà possibile trovare una rotazione che fa coincidere uno
dei due lati in modo che uno dei due angoli copra interamente l’altro. Sia 𝛼0 la
roto-traslazione di 𝛼 così individuata. Se 𝛼0 = 𝛽 diremo che i due angoli sono
congruenti, altrimenti se 𝛼0 ⊇ 𝛽 diremo che 𝛼 è maggiore di 𝛽 e se invece 𝛼0 ⊆ 𝛽
diremo che 𝛼 è minore di 𝛽 . Con un procedimento simile è in genere possibile
sommare due angoli: si sposta uno dei due tramite una roto-traslazione in modo
da far coincidere il vertice e un lato dei due angoli e in modo che i due angoli
non si sovrappongano (questo non è sempre possibile perché se gli angoli sono
troppo grandi si sovrapporranno sempre). La loro unione sarà un angolo che
chiamiamo somma degli angoli dati.
4.2 interpretazione geometrica 157

Misurare un angolo significa associare ad ogni angolo un numero (reale positivo)


in modo che si abbiano le seguenti proprietà: angoli congruenti hanno la stessa
misura, angoli maggiori hanno misure maggiori (proprietà di monotonia) e
la misura della somma di due angoli è la somma delle misure (additività). Si
può intuire che una volta scelto quale angolo ha misura 1 (l’unità di misura) la
misura di ogni altro angolo sarà univocamente determinata da queste proprietà.
Infatti la misura dei multipli e dei sottomultipli dell’unità è determinata dalla
additività della misura e la misura degli angoli incommensurabili si potrà
ottenere per approssimazione sfruttando la monotonia.

Se ora identifichiamo il piano euclideo con il piano complesso ogni angolo potrà
essere traslato e ruotato in modo che uno dei due lati vada a coincidere con la
semiretta dei reali positivi e in modo che l’angolo si estenda al di sopra di tale
semiretta e sia delimitato da una seconda semiretta passante per un punto 𝑢
a distanza 1 dall’origine ovvero con |𝑢| = 1. Vogliamo giustificare il fatto che
𝜃 = arg 𝑢 può essere scelto come misura dell’angolo. Studiando la monotonia
delle funzioni cos e sin si può verificare facilmente che 𝜃 è crescente con l’angolo.
Più rilevante è chiedersi se 𝜃 è additivo. Siano 𝑢, 𝑣 ∈ ℂ due numeri complessi
unitari che rappresentino due diversi angoli. Sia 𝜃 = arg 𝑢 e 𝜑 = arg 𝑣 da cui
𝑢 = 𝑒 𝑖𝜃 e 𝑣 = 𝑒 𝑖𝜑 . Consideriamo la trasformazione 𝑅 𝜃 (𝑧) = 𝑒 𝑖𝜃 · 𝑧 . Si nota
che 𝑅 𝜃 è una trasformazione rigida del piano ovvero una trasformazione che
mantiene la distanza tra i punti (una isometria) in quanto essendo 𝑒 𝑖𝜃 = 1 si
ha
|𝑅 𝜃 (𝑧) − 𝑅 𝜃 (𝑤)| = 𝑒 𝑖𝜃 𝑧 − 𝑒 𝑖𝜃 𝑤 = 𝑒 𝑖𝜃 · |𝑧 − 𝑤| = |𝑧 − 𝑤|.

Inoltre 𝑅 𝜃 (0) = 0 e 𝑅 𝜃 (1) = 𝑢 significa che 𝑅 𝜃 non è altro che una rotazione
che tiene fissa l’origine e manda la semiretta dei reali positivi nella semiretta
uscente da 0 e passante per 𝑢 = 𝑒 𝑖𝜃 . Dunque 𝑅 𝜃 è la trasformazione che rende
l’angolo identificato dal numero complesso unitario 𝑣 in un angolo adiacente
a quello identificato da 𝑢 . Quindi la somma (geometrica) degli angoli 𝑢 e 𝑣 è
identificata dal numero complesso unitario 𝑅 𝜃 (𝑣) = 𝑢 · 𝑣 . Ma, per la proprietà
additiva dell’esponenziale complesso,

𝑢 · 𝑣 = 𝑒 𝑖𝜃 · 𝑒 𝑖𝜑 = 𝑒 𝑖(𝜃+𝜑)

e dunque se 𝜃 + 𝜑 < 2𝜋 si ha

arg(𝑢 · 𝑣) = 𝜃 + 𝜑 = arg(𝑢) + arg(𝑣)

che corrisponde alla proprietà additiva della misura degli angoli.


radiante
L’angolo unitario identificato dal numero complesso 𝑒 𝑖 si chiama radiante ed
è l’unità di misura che abbiamo scelto per gli angoli. L’angolo retto sarà
𝜋
identificato dal numero complesso 𝑖 = 𝑒 𝑖 2 e avrà una misura pari a 𝜋2 radianti.
L’angolo piatto sarà identificato dal numero complesso −1 = 𝑒 𝑖𝜋 e avrà una
misura di 𝜋 radianti. Geometricamente la misura degli angoli può essere data
dalla lunghezza dell’arco di raggio unitario identificato dall’angolo. Dunque
la definizione geometrica di 𝜋 (rapporto tra lunghezza della circonferenza e
diametro) corrisponde a richiedere che la semicirconferenza unitaria abbia
misura 𝜋 radianti. Questo significa che la definizione analitica di 𝜋 che abbiamo
dato (teorema 3.52) si riconcilia con la definizione geometrica.
158 4 i numeri complessi

Possiamo riconciliare definizione analitica e geometrica di 𝜋 anche con delle


osservazioni dirette.

Osservazione 4.2 (lunghezza della circonferenza tramite moto circolare unifor-


me). Si considera la curva 𝑡 ↦→ 𝑒 𝑖𝑡 come l’equazione oraria del moto di un punto che
si muove nel piano complesso. Visto che 𝑒 𝑖𝑡 = 1 tale punto si muove sulla circonfe-

renza unitaria. Possiamo determinare la velocità istantanea del punto considerando la


variazione della posizione:

𝑒 𝑖(𝑡+Δ𝑡) − 𝑒 𝑖𝑡 𝑒 𝑖Δ𝑡 − 1
= 𝑒 𝑖𝑡 · .
Δ𝑡 Δ𝑡
Prendendo un incremento temporale Δ𝑡 = 𝜀/𝑛 con 𝑛 → +∞ si osserva che il modulo
della velocità è dato da
𝑖𝑡 𝑒 𝑖 𝑛𝜀 − 1

𝑣 = lim 𝑒 · 𝜀

𝑛→+∞
𝑛

e visto che 𝑒 𝑖𝑡 = 1 ricordando il limite notevole (3.11) (teorema 3.45) si ottiene che la

velocità è pari ad 1. Significa che il punto 𝑒 𝑖𝑡 si muove sulla circonferenza unitaria


con velocità unitaria e quindi la lunghezza della curva percorsa risulta numericamente
uguale al tempo trascorso. Visto che per 𝑡 che varia da 0 a 2𝜋 il punto compie un giro
completo attorno alla circonferenza unitaria significa che la lunghezza della circonferenza
unitaria è 2𝜋.

Osservazione 4.3 (lunghezza della circonferenza tramite approssimazione con


poligonali). Possiamo calcolare la lunghezza della circonferenza unitaria come il limite
dei perimetri dei poligoni di 𝑁 lati iscritti nella circonferenza. Fissato 𝑁 consideriamo
per 𝑘 = 0 , . . . , 𝑁 i punti
2𝜋𝑘
𝑢𝑘 = 𝑒 𝑖 𝑁 .
Osserviamo che
2𝜋(𝑘+1)
2𝜋𝑘
2𝜋𝑘 2𝜋 2𝜋
|𝑢 𝑘+1 − 𝑢 𝑘 | = 𝑒 𝑖 − 𝑒𝑖
𝑖 𝑁 𝑖𝑁
𝑁 𝑁 = 𝑒 · 𝑒 − 1 = 𝑒 𝑖 𝑁 − 1

cioè i punti 𝑢 𝑘 sono equidistanti tra loro. Si noti che 𝑢0 = 𝑢𝑁 = 1 e quindi i


punti 𝑢1 , . . . , 𝑢𝑁 sono gli 𝑁 vertici di un poligono regolare di 𝑁 lati iscritto nella
circonferenza unitaria. Il perimetro del poligono è quindi dato da
2𝜋

𝑃 𝑁 = 𝑁 · 𝑒 𝑖 𝑁 − 1

e per 𝑁 → +∞ si ha, sempre utilizzando il limite notevole (3.11)


2𝜋
𝑖𝑁
𝑒 − 1

𝑃𝑁 = 2𝜋 · 2𝜋 → 2𝜋.

𝑁

Osservazione 4.4 (matrici di rotazione). Fissato 𝜃 ∈ ℝ consideriamo, come prima,


la funzione 𝑅 𝜃 : ℂ → ℂ, 𝑅 𝜃 (𝑧) = 𝑒 𝑖𝜃 · 𝑧 . Un altro modo per convincerci che 𝑅 𝜃
rappresenta una rotazione di 𝜃 radianti è quello di guardare la matrice associata. Se
identifichiamo il piano complesso ℂ con ℝ2 la trasformazione 𝑅 𝜃 può essere rappresentata
da una matrice 𝑀 𝛼 che ha come colonne le coordinate di 𝑅 𝜃 (1) = 𝑒 𝑖𝜃 = cos 𝜃 + 𝑖 sin 𝜃
4.2 interpretazione geometrica 159

e le coordinate di 𝑅 𝜃 (𝑖) = 𝑒 𝑖𝜃 · 𝑖 = − sin 𝜃 + 𝑖 cos 𝜃 :

cos 𝛼 − sin 𝛼
 
𝑀𝛼 = .
sin 𝛼 cos 𝛼

Osservazione 4.5 (interpretazione geometrica del prodotto di numeri complessi).


Possiamo ora dare una interpretazione geometrica del prodotto tra due numeri complessi
𝑧, 𝑤 ∈ ℂ. Se 𝑧 ≠ 0 possiamo scrivere 𝑧 = |𝑧| · 𝑒 𝑖𝜃 con 𝜃 = arg 𝑧 , cosicché:

𝑧 · 𝑤 = |𝑧| · 𝑅 𝜃 (𝑤).

Si capisce quindi che il numero complesso 𝑧 · 𝑤 si ottiene ruotando 𝑤 dell’angolo


identificato da 𝑧 con l’asse dei reali positivi, e quindi riscalando il punto ottenuto di un
fattore |𝑧| . Se poniamo 𝜓 = arg 𝑤 possiamo interpretare la moltiplicazione complessa
in coordinate polari:

𝑧 · 𝑤 = |𝑧|𝑒 𝑖𝜃 · |𝑤|𝑒 𝑖𝜓 = |𝑧| · |𝑤| · 𝑒 𝑖(𝜃+𝜓) .

Dunque il prodotto di due numeri complessi è quel numero complesso che ha come
modulo il prodotto dei moduli e come argomento la somma (a meno di multipli di 2𝜋)
degli argomenti.

Osservazione 4.6 (interpretazione geometrica dell’esponenziale complesso).


Ricordiamo che (teorema 3.47)
𝑛
𝑖𝑦

𝑖𝑦
𝑒 = lim 1+ .
𝑛→+∞ 𝑛

Possiamo osservare che se 𝑦 ∈ ℝ i punti (1 + 𝑖 𝑦/𝑛) 𝑘 per 𝑘 = 1 . . . 𝑛 sono i vertici di


una spezzata formata da 𝑛 segmenti di lunghezza
  𝑘+1   𝑘  𝑘  
𝑖 𝑦 𝑖 𝑦 𝑖 𝑦 𝑖 𝑦
1+ − 1+ = 1+ · 1+ −1

𝑛 𝑛 𝑛 𝑛
r !𝑘  𝑛2
2 𝑦 𝑦2

|𝑦| |𝑦|
= 1+ 2 · ≤ 1+ 2 · .
𝑛 𝑛 𝑛 𝑛

In particolare la lunghezza totale della spezzata ℓ 𝑛 può essere stimata come segue
 𝑛2
𝑦2

|𝑦| ≤ ℓ 𝑛 ≤ 1 + 2 · |𝑦|
𝑛

da cui osservando che


 𝑛2
𝑦2

1+ 2 →1
𝑛
e utilizzando il criterio del confronto si ottiene ℓ 𝑛 → |𝑦| .
160 4 i numeri complessi

Si osserva anche che i punti di tale spezzata si avvicinano sempre di più alla circonferenza
unitaria, infatti:
  𝑘 𝑛  𝑛
𝑖 𝑖 1 2

1 ≤ 1+ ≤ 1 + = 1 + 2 → 1.

𝑛 𝑛 𝑛

E’ dunque sensato pensare che il punto 𝑒 𝑖𝑦 sia il punto della circonferenza unitaria che
identifica un arco di lunghezza |𝑦| a partire dal punto 1 sull’asse reale. Se 𝑦 > 0 l’arco è
misurato in senso antiorario, altrimenti in senso orario. Avremo dunque arg 𝑒 𝑖𝑦 = 𝑦

essendo 𝑦 la lunghezza dell’arco ovvero la misura in radianti dell’angolo corrispondente.

4.3 radici complesse 𝑛 -esime

Sia 𝑐 ∈ ℂ un numero complesso 𝑐 ≠ 0. Ci poniamo il problema di determinare


le soluzioni complesse dell’equazione

radici 𝑛 -esime 𝑧 𝑛 = 𝑐.

Tali soluzioni saranno chiamate radici 𝑛 -esime di 𝑐 .

Scriviamo 𝑐 e 𝑧 in forma esponenziale:

𝑐 = 𝑟𝑒 𝑖𝛼 , 𝑧 = 𝜌𝑒 𝑖𝜃 .

Si avrà allora
𝑧 𝑛 = 𝜌𝑛 (𝑒 𝑖𝜃 )𝑛 = 𝜌𝑛 𝑒 𝑖𝑛𝜃 .
Affinche sia 𝑧 𝑛 = 𝑐 si dovrà avere l’uguaglianza dei moduli, cioè 𝜌𝑛 = 𝑟 e
l’uguaglianza a meno di multipli interi di 2𝜋 degli argomenti: 𝑛𝜃 = 𝛼 + 2 𝑘𝜋
con 𝑘 ∈ ℤ. Dunque si trova

𝛼 2𝜋
𝜃= +𝑘 𝑘 ∈ ℤ.
𝑛 𝑛
Osserviamo ora che per 𝑘 = 0 , . . . , 𝑛 − 1 il secondo addendo 𝑘 2𝜋/𝑛 assume
𝑛 valori distinti compresi in [0, 2𝜋). Per gli altri valori di 𝑘 si ottengono degli
angoli che differiscono da questi di un multiplo di 2𝜋 e quindi non si trovano
altre soluzioni.

Dunque l’equazione 𝑧 𝑛 = 𝑐 per 𝑐 ≠ 0 ha 𝑛 soluzioni distinte date da



𝑧𝑘 = 𝑛
𝑟 · 𝑒 𝑖𝛼/𝑛+2 𝑘𝜋𝑖/𝑛 , 𝑘 = 0, 1, . . . , 𝑛 − 1

dove 𝛼 = arg(𝑐) e 𝑟 = |𝑐| . Dal punto di vista geometrico si osserva che 𝑧 0


è il numero complesso con modulo la radice 𝑛 -esima del numero dato 𝑐 e
argomento pari ad un 𝑛 -esimo dell’argomento di 𝑐 . Tutte le altre soluzioni si
trovano sulla circonferenza centrata in 0 e passante per 𝑧 0 e risultano essere,
insieme ad 𝑧 0 , i vertici di un 𝑛 -agono regolare.
4.4 ancora polinomi 161

In particolare nel caso 𝑐 = 1 si osserva che le radici 𝑛 -esime dell’unità si


rappresentano geometricamente come i vertici dell’𝑛 -agono regolare iscritto
nella circonferenza unitaria e con un vertice in 𝑧 0 = 1.

Esercizio 4.7. Si trovino le soluzioni 𝑧 ∈ ℂ delle seguenti equazioni. Scrivere le


soluzioni in forma polare e cartesiana.

𝑧 4 = −4
𝑧6 = 𝑖
𝑧 3 = −8 𝑖
𝑧4 = 𝑧

𝑧2 + 1 = 𝑖 3
(𝑧 − 𝑖)4 = 1
1 + 𝑧 + 𝑧2 + 𝑧3 = 0
𝑧 14 − 𝑧 6 − 𝑧 8 + 1 = 0

4.4 ancora polinomi

Proseguiamo la trattazione dei polinomi che abbiamo iniziato nel capitolo 1.10.

Teorema 4.8 (divisione di Euclide). Se 𝕂 è un campo, dati due polinomi 𝑃 e 𝑆 in


𝕂 [𝑥] con 𝑆 ≠ 0 è possibile trovare, in modo unico, due polinomi 𝑄 (quoziente) e 𝑅
(resto) in 𝕂 [𝑥] con deg 𝑅 < deg 𝑆 tali che:

𝑃 = 𝑄 · 𝑆 + 𝑅.

Dimostrazione. Passo 1: supponiamo che sia deg 𝑃 < deg 𝑆 . In questo caso basta
prendere 𝑄 = 0 e 𝑅 = 𝑃 .

Passo 2: supponiamo che sia deg 𝑃 ≥ deg 𝑆 . Poniamo 𝑁 = deg 𝑃 e 𝑀 = deg 𝑆 .


Sia 𝑎 𝑁 ≠ 0 il coefficiente del termine di grado massimo di 𝑃 e 𝑏 𝑀 ≠ 0 il
coefficiente di grado massimo del polinomio 𝑆 . E’ allora facile verificare che il
polinomio
𝑎𝑁
· 𝑥 𝑁−𝑀 · 𝑆
𝑏𝑀
ha lo stesso grado di 𝑃 e il suo coefficiente di grado massimo è uguale ad 𝑎 𝑁 in
quanto è il prodotto di 𝑎 𝑁 /𝑏 𝑀 per 𝑏 𝑀 . Dunque il polinomio
𝑎𝑁
𝑃1 = 𝑃 − · 𝑥 𝑁−𝑀 · 𝑆
𝑏𝑀

ha grado strettamente inferiore a 𝑃 . Possiamo ora supporre, mediante un


ragionamento induttivo su deg 𝑃 − deg 𝑆 che per il polinomio 𝑃1 il risultato del
teorema sia valido cioè che esistano, dei polinomio 𝑄 1 e 𝑅 con deg 𝑅 < deg 𝑆
tali che
𝑃1 = 𝑄 1 · 𝑆 + 𝑅.
162 4 i numeri complessi

Il caso base del ragionamento induttivo, deg 𝑃 = deg 𝑆 , è garantito dal passo 1.
Avremo allora:
𝑎 𝑁 𝑁−𝑀
𝑃 = 𝑃1 + 𝑥 ·𝑆
𝑏𝑀
𝑎 𝑁 𝑁−𝑀
= 𝑄1 · 𝑆 + 𝑅1 + 𝑥 ·𝑆
𝑏𝑀
𝑎 𝑁 𝑁−𝑀
=( 𝑥 + 𝑄1 ) · 𝑆 + 𝑅1 .
𝑏𝑀

Posto quindi
𝑎 𝑁 𝑁−𝑀
𝑄= 𝑥 + 𝑄1
𝑏𝑁
il risultato è dimostrato.

Passo 3: dimostriamo che 𝑄 e 𝑅 sono unici. Se infatti avvessimo

𝑃 = 𝑄1 𝑆 + 𝑅1 = 𝑄2 𝑆 + 𝑅2

con deg 𝑅 1 < deg 𝑆 e deg 𝑅 2 < deg 𝑆 si avrebbe

(𝑄 2 − 𝑄 1 )𝑆 = 𝑅 1 − 𝑅 2 .

Se fosse 𝑄 2 ≠ 𝑄 1 il polinomio al lato sinistro avrebbe grado non inferiore al


grado di 𝑆 mentre il lato destro ha certamente grado minore di 𝑆 . Dunque
𝑄 2 = 𝑄 1 ma allora il lato sinistro è nullo e quindi anche il lato destro deve
esserlo: 𝑅 2 = 𝑅 1 .

La dimostrazione del teorema precedente fornisce anche un algoritmo, chiamato


algoritmo di Euclide, per eseguire la divisione (con resto) tra polinomi. Lo
sperimentiamo nel seguente esercizio.

Esercizio 4.9. Sia 𝑃 = 𝑥 4 − 3 𝑥 2 + 2 𝑥 + 1 e 𝑆 = 𝑥 2 − 1. Eseguire la divisione con


resto cioè: trovare 𝑄 ed 𝑅 con deg 𝑅 < deg 𝑆 tali che

𝑃 = 𝑄 · 𝑆 + 𝑅.

Svolgimento. Il rapporto tra i termini di grado massimo di 𝑃 e 𝑆 è 𝑥 4 /𝑥 2 = 𝑥 2 .


Dunque consideriamo come primo monomio 𝑥 2 . Si ha

𝑃1 = 𝑃 − 𝑥 2 · 𝑆 = 𝑥 4 − 3 𝑥 2 + 2 𝑥 + 1 − 𝑥 4 + 𝑥 2
= −2 𝑥 2 + 2 𝑥 + 1 .

Ripetiamo il procedimento con 𝑃1 al posto di 𝑃 . Il rapporto tra i termini di


grado massimo di 𝑃1 e 𝑆 è il monomio −2. Si ha

𝑃2 = 𝑃1 − (−2)𝑆 = −2𝑥 2 + 2 𝑥 + 1 + 2𝑥 2 − 2 = 2 𝑥 − 1.

Visto che deg 𝑃2 < deg 𝑆 la divisione termina e si pone 𝑅 = 2 𝑥 − 1. Si ha quindi


𝑄 = 𝑥 2 − 2 (la somma dei monomi trovati) e risulta:

𝑃 = (𝑥 2 − 2) · 𝑆 + 2𝑥 − 1.
4.4 ancora polinomi 163

Teorema 4.10 (Ruffini). Sia 𝑃 ∈ 𝕂 [𝑥] un polinomio non nullo. Se 𝑥 0 ∈ 𝕂 è tale che
𝑃(𝑥0 ) = 0 allora esiste un polinomio 𝑄 con deg 𝑄 = (deg 𝑃) − 1 tale che

𝑃 = (𝑥 − 𝑥0 ) · 𝑄.

Dimostrazione. In base al teorema precedente si può fare la divisione tra 𝑃 e


𝑆 = 𝑥 − 𝑥0 per ottenere un polinomio 𝑄 e un resto 𝑅 con deg 𝑅 < 1 tali che

𝑃 = (𝑥 − 𝑥0 ) · 𝑄 + 𝑅.

Siccome deg 𝑅 < 1 si ha in effetti che 𝑅 = 𝑐 ∈ 𝕂 è un polinomio costante e


dunque
𝑃 = (𝑥 − 𝑥0 ) · 𝑄 + 𝑐
ma valutando 𝑃 in 𝑥 = 𝑥 0 si scopre che

𝑃(𝑥0 ) = 0 · 𝑄(𝑥0 ) + 𝑐 = 𝑐

dunque 𝑐 = 𝑃(𝑥 0 ) = 0.

Possiamo ora chiederci se polinomi diversi corrispondono a funzioni polinomiali


diverse. In generale questo non è vero, se ad esempio prendessimo come campo
𝕂 = ℤ2 = {0, 1}, un campo finito in cui poniamo 1 + 1 = 0 scopriremmo
che la funzione polinomiale 𝑃(𝑥) = 𝑥 2 + 𝑥 è identicamente nulla in quanto
02 + 0 = 0 e 12 + 1 = 1 + 1 = 0 in questo campo. Ma nei casi che interessano a noi
𝕂 = ℝ o 𝕂 = ℂ questo problema non si presenta e si potrà quindi identificare
ogni polinomio con la corrispondente funzione polinomiale. Per avere questa
garanzia ci servono i seguenti risultati.

Teorema 4.11 (principio di annullamento dei polinomi). Sia 𝑃 ∈ 𝕂 [𝑥] un


polinomio non nullo di grado 𝑛 . Allora la funzione polinomiale associata a 𝑃 si annulla
in al più 𝑛 punti distinti di 𝕂 .

In particolare se un polinomio si annulla in infiniti punti distinti allora tale polinomio è


certamente nullo.

Dimostrazione. Dimostriamo per induzione su 𝑛 che se un polinomio 𝑃 di grado


non superiore a 𝑛 si annulla in 𝑛 + 1 punti distinti 𝑥 1 , . . . , 𝑥 𝑛+1 ∈ 𝕂 allora 𝑃 = 0.

Se 𝑛 = 0 il polinomio 𝑃 è costante ma si annulla in un punto e quindi è il


polinomio nullo. Se 𝑛 > 0 per il teorema di Ruffini applicato al punto 𝑥 𝑛+1
sappiamo che esise un polinomio 𝑄 di grado inferiore ad 𝑛 per cui si ha

𝑃 = (𝑥 − 𝑥 𝑛+1 ) · 𝑄

sostituendo 𝑥 = 𝑥 𝑘 con 𝑘 ≤ 𝑛 si ha 𝑥 𝑘 − 𝑥 𝑛+1 ≠ 0 e quindi

𝑃(𝑥 𝑘 )
𝑄(𝑥 𝑘 ) = = 0.
𝑥 𝑘 − 𝑥 𝑛+1
164 4 i numeri complessi

Dunque 𝑄 si annulla nei punti 𝑥 1 , . . . , 𝑥 𝑛 e, per ipotesi induttiva, scopriamo


che 𝑄 deve essere nullo. Di conseguenza anche 𝑃 è nullo.

Se 𝕂 è un insieme infinito (come nei casi 𝕂 = ℝ o 𝕂 = ℂ) si trova che se a due


polinomi 𝑃 , 𝑄 corrisponde la stessa funzione polinomiale:

𝑃(𝑥) = 𝑄(𝑥) per ogni 𝑥 ∈ 𝕂

allora 𝑃 e 𝑄 sono lo stesso polinomio 𝑃 = 𝑄 in quanto la differenza 𝑃 − 𝑄 si


annulla in tutti i punti di 𝕂 e qualunque sia il suo grado, se 𝕂 è infinito, questo
ci dice che 𝑃 − 𝑄 = 0.

Questo corollario viene spesso enunciato come segue.

Teorema 4.12 (principio di identità dei polinomi). Siano 𝑎 𝑘 e 𝑏 𝑘 coefficienti nel


campo 𝕂 = ℝ o 𝕂 = ℂ. Se per ogni 𝑥 ∈ 𝕂 si ha
𝑛 𝑚
𝑎𝑘 𝑥 𝑘 = 𝑏𝑘 𝑥 𝑘
X X
𝑘=1 𝑘=1

allora 𝑚 = 𝑛 e 𝑎 𝑘 = 𝑏 𝑘 per ogni 𝑘 = 0 , . . . , 𝑛 .

Dimostrazione. Facendo la differenza dei due lati dell’uguaglianza si ottiene


che una espressione polinomiale si annulla identicamente. Allora per il teore-
ma 4.11 tale espressione rappresenta il polinomio nullo e di conseguenza tutti i
coefficienti, che sono dati dalla differenza 𝑎 𝑘 − 𝑏 𝑘 , devono essere nulli.

4.5 il teorema fondamentale dell’algebra

Il teorema fondamentale dell’algebra afferma che ogni polinomio non costante


si annulla in almeno un punto del piano complesso.

La formula risolutiva per determinare le radici di un polinomio di secondo


grado era già nota ai Babilonesi e sebbene i numeri complessi non erano noti
(e neanche i numeri negativi) la stessa formula si applica nel caso generale e
fornisce le radici complesse.

Lo studio delle equazioni di grado superiore al secondo si sviluppa invece nel


1500 ad opera dei matematici italiani Scipione del Ferro, Gerolamo Cardano,
Niccolò Tartaglia e Lodovico Ferrari. Essi determinano le formule risolutive per
determinare le radici dei polinomi di terzo e quarto grado. Nell’applicare la
formula risolutiva per l’equazione di terzo grado può capitare di dover calcolare
la radice quadrata di un numero negativo anche in situazioni in cui tutte le
soluzioni alla fine risultano reali. Ed è proprio in questo contesto che nascono
i numeri complessi, come mero artificio matematico utilizzato per portare a
termine il conto.

Successivamente Paolo Ruffini (1765-1822) e Niels Abel (1802-1829) dimostrarono


che le equazioni di grado maggiore del quarto non ammettono una formula
risolutiva esprimibile mediante radicali. Il criterio per determinare se un
4.5 il teorema fondamentale dell’algebra 165

polinomio ammette o meno formule risolutive è dovuto al matematico francese


Évariste Galois (1811-1832) che è considerato il fondatore della teoria dei
gruppi.
Il teorema fondamentale dell’algebra, e cioè l’esistenza di radici complesse per
polinomi di grado qualunque, viene dimostrato dal matematico tedesco Carl
Friedrich Gauss (1777–1855). Questo teorema opera una svolta nel pensiero
matematico in quanto per la prima volta si dà rilevanza ad un risultato astratto di
esistenza slegato da una formula risolutiva. Il teorema non era affatto scontato,
basti pensare che sia Leibniz che Nikolas Bernoulli erano convinti di aver trovato
dei polinomi di quarto grado che non possono essere fattorizzati in contrasto
con il teorema 4.21.
Per dimostrare il teorema fondamentale dell’algebra dobbiamo estendere il
teorema di Weierstrass alle funzioni di una variabile complessa. Nel teorema
di Weierstrass reale la funzione per ipotesi è definita su un intervallo chiuso e
limitato. Nel piano complesso non esiste il concetto di intervallo in quanto non
abbiamo un ordinamento ma vedremo che comunque il teorema di Weierstrass
rimane valido per le funzioni continue definite su insiemi chiusi e limitati
secondo le seguenti definizioni.

Definizione 4.13 (chiusura sequenziale). Un insieme 𝐴 ⊆ ℂ si dice essere sequen-


zialmente chiuso se presa una qualunque successione di punti 𝑎 𝑛 ∈ 𝐴 se 𝑎 𝑛 → 𝑎 per
sequenzialmente chiuso
qualche 𝑎 ∈ ℂ allora 𝑎 ∈ 𝐴.

Definizione 4.14 (limitatezza). Un insieme 𝐴 ⊆ ℂ si dice essere limitato se


limitato
sup {|𝑧| : 𝑧 ∈ 𝐴} < +∞.

Una successione 𝑧 𝑛 ∈ ℂ si dice essere limitata se l’insieme {𝑧 𝑛 : 𝑛 ∈ ℕ } è limitato


ovvero se
sup |𝑧 𝑛 | < +∞.
𝑛∈ℕ

Teorema 4.15 (Bolzano-Weierstrass complesso). Se 𝑧 𝑛 ∈ ℂ è una successione


limitata allora è possibile estrarre una sottosuccessione 𝑧 𝑛 𝑘 convergente: 𝑧 𝑛 𝑘 → 𝑧 con
𝑧 ∈ ℂ.

Dimostrazione. Siano 𝑥 𝑛 e 𝑦𝑛 la parte reale ed immaginaria di 𝑧 𝑛 : 𝑧 𝑛 = 𝑥 𝑛 + 𝑖 𝑦𝑛 .


p q
Visto che |𝑥 𝑛 | = 𝑥 𝑛2 ≤ 𝑥 𝑛2 + 𝑦𝑛2 = |𝑧 𝑛 | e, allo stesso modo |𝑦𝑛 | ≤ |𝑧 𝑛 | ,
possiamo affermare che entrambe le successioni 𝑥 𝑛 e 𝑦𝑛 sono limitate (ma
stavolta in ℝ). Dunque possiamo applicare il teorema di Bolzano-Weierstrass
(reale) alla successione 𝑥 𝑛 per trovare una sottosuccessione 𝑥 𝑛 𝑗 → 𝑥 conver-
gente. E possiamo applicare di nuovo il teorema di Bolzano-Weierstrass alla
sottosuccessione 𝑦𝑛 𝑗 per trovare una sotto-sottosuccessione 𝑦𝑛 𝑗𝑘 → 𝑦 anch’essa
convergente. Posto 𝑛 𝑘 = 𝑛 𝑗𝑘 avremo dunque trovato una sottosuccessione
𝑧 𝑛 𝑘 = 𝑥 𝑛 𝑘 + 𝑖 𝑦𝑛 𝑘 → 𝑥 + 𝑖 𝑦 convergente.

Teorema 4.16 (Weierstrass complesso). Sia 𝐴 ⊆ ℂ un insieme non vuoto, sequen-


zialmente chiuso e limitato e sia 𝑓 : 𝐴 → ℝ una funzione continua. Allora 𝑓 ha
massimo e minimo su 𝐴.
166 4 i numeri complessi

Dimostrazione. Dimostriamo l’esistenza del minimo: per il massimo la dimo-


strazione è perfettamente analoga. Sia 𝑚 = inf 𝑓 (𝐴). Essendo 𝐴 non vuoto, per
il lemma sull’esistenza delle successioni minimizzanti sappiamo esistere una
successione 𝑧 𝑛 ∈ 𝐴 tale che 𝑓 (𝑧 𝑛 ) → 𝑚 . Essendo 𝐴 limitato possiamo applicare
il teorema di Bolzano-Weierstrass per trovare 𝑧 ∈ ℂ e una sottosuccessione
𝑧 𝑛 𝑘 → 𝑧 . Essendo 𝐴 sequenzialmente chiuso possiamo quindi affermare che
𝑧 ∈ 𝐴. Essendo 𝑓 continua concludiamo che

𝑓 (𝑧) = lim 𝑓 (𝑧 𝑛 𝑘 ) = 𝑚
𝑘→+∞

e dunque 𝑧 è un punto di minimo per 𝑓 .

Teorema 4.17 (esistenza del minimo per funzioni coercive). Sia 𝑓 : ℂ → ℝ una
funzione continua tale che per ogni successione 𝑧 𝑛 → ∞ (ovvero |𝑧 𝑛 | → +∞) si abbia
𝑓 (𝑧 𝑛 ) → +∞. Allora 𝑓 ha minimo.

Dimostrazione. Consideriamo l’insieme

𝐴 = {𝑧 ∈ ℂ : 𝑓 (𝑧) ≤ 𝑓 (0)}.

Chiaramente 0 ∈ 𝐴 e quindi 𝐴 non è vuoto. L’insieme 𝐴 è anche sequenzialmente


chiuso in quanto se 𝑧 𝑘 ∈ 𝐴 allora 𝑓 (0) − 𝑓 (𝑧 𝑘 ) ≥ 0, per continuità 𝑓 (0) − 𝑓 (𝑧 𝑘 ) →
𝑓 (0) − 𝑓 (𝑧) e per il teorema della permanenza del segno si ottiene 𝑓 (0) − 𝑓 (𝑧) ≥ 0
cioè 𝑧 ∈ 𝐴. Dimostriamo ora che 𝐴 è anche limitato. Se non lo fosse esisterebbe,
per assurdo, una successione 𝑧 𝑛 ∈ 𝐴 tale che |𝑧 𝑛 | → +∞ cioè 𝑧 𝑛 → ∞. Ma
allora, per ipotesi su 𝑓 , si avrebbe 𝑓 (𝑧 𝑛 ) → +∞ che contraddice la condizione
𝑓 (𝑧 𝑛 ) ≤ 𝑓 (0). Essendo 𝐴 non vuoto, sequenzialmente chiuso e limitato ed
essendo 𝑓 : 𝐴 → ℝ continua, possiamo applicare il teorema di Weierstrass
complesso per dedurre che 𝑓 ha minimo su 𝐴 in un punto 𝑤 ∈ 𝐴. Ma essendo
0 ∈ 𝐴 si avrà sicuramente 𝑓 (𝑤) ≤ 𝑓 (0) e per ogni 𝑧 ∈ ℂ \ 𝐴 si ha invece
𝑓 (𝑧) > 𝑓 (0) per come è stato definito 𝐴. Dunque 𝑤 è minimo di 𝑓 su tutto ℂ,
non solo su 𝐴.
teorema fondamentale dell’algebra
Teorema 4.18 (teorema fondamentale dell’algebra). Sia 𝑓 (𝑧) un polinomio di
grado 𝑁 ≥ 1 a coefficienti complessi:

𝑁
𝑎𝑗 · 𝑧𝑗
X
𝑓 (𝑧) =
𝑗=0

con 𝑎 𝑗 ∈ ℂ per 𝑗 = 0 , . . . , 𝑁 e 𝑎 𝑁 ≠ 0. Allora esiste 𝑤 ∈ ℂ tale che 𝑓 (𝑤) = 0.

Dimostrazione. Osserviamo innanzitutto che | 𝑓 (𝑧)| è coerciva cioè che se 𝑧 𝑛 → ∞


allora | 𝑓 (𝑧 𝑛 )| → +∞. Infatti si ha

𝑁 𝑁− 1
𝑗 𝑗
X
𝑎 𝑗 𝑧 𝑛 = 𝑎 𝑁 𝑧 𝑛𝑁 +
X
| 𝑓 (𝑧 𝑛 )| = 𝑎 𝑗 𝑧𝑛

𝑗=0 𝑗=0


𝑁−
X1 𝑎 𝑗
= |𝑧 𝑛 | 𝑁 · 𝑎 𝑁 + → +∞

𝑁−𝑗
𝑗=0 𝑧 𝑛

4.5 il teorema fondamentale dell’algebra 167

se 𝑧 𝑛 → ∞.

Sappiamo che tutti i polinomi sono funzioni continue in quanto somme di


prodotti di funzioni continue e il modulo è anch’esso una funzione continua
dunque | 𝑓 (𝑧)| è certamente una funzione continua.

Dunque possiamo applicare il teorema di esistenza del minimo per le funzioni


coercive: esiste 𝑤 ∈ ℂ tale che | 𝑓 (𝑤)| è minimo.

Per concludere il teorema basterà dimostrare che 𝑓 (𝑤) = 0. L’idea che vogliamo
sviluppare è che i polinomi complessi se assumono un valore 𝑓 (𝑤) in un punto
𝑤 ∈ ℂ allora assumono anche tutti i valori vicini ad esso in quanto localmente
il polinomio assomiglia ad una potenza 𝑧 𝑛 e l’equazione 𝑧 𝑛 = 𝑐 ha sempre
soluzione, come abbiamo già visto. Dunque vicino a 𝑤 ci saranno dei punti
in cui 𝑓 assume valori che in modulo sono minori a 𝑓 (𝑤): a meno che non sia
proprio 𝑓 (𝑤) = 0, nel qual caso ovviamente non è possibile avere numeri con
modulo inferiore a 0.

Possiamo scrivere il polinomio 𝑓 (𝑧) nella forma

𝑁
𝑏 𝑗 (𝑧 − 𝑤) 𝑗
X
𝑓 (𝑧) =
𝑗=0

in quanto la traslazione di un polinomio è ancora un polinomio dello stesso


grado. Dimostrare che 𝑓 (𝑤) = 0 è quindi equivalente a dimostrare che 𝑏 0 = 0.
Supponiamo allora per assurdo che sia 𝑏 0 ≠ 0. L’andamento del polinomio
vicino al punto 𝑤 è dominato dai termini di grado più basso: alcuni di questi
potrebbero essere nulli, ma possiamo considerare il primo indice 𝑘 > 0 per cui
si ha 𝑏 𝑘 ≠ 0. Allora potremo scrivere:

𝑁
𝑓 (𝑧) = 𝑏0 + 𝑏 𝑘 (𝑧 − 𝑤) 𝑘 + 𝑏 𝑗 (𝑧 − 𝑤) 𝑗 .
X
𝑗=𝑘+1

Ora scriviamo 𝑧 − 𝑤 e 𝑏 0 in forma esponenziale: 𝑧 − 𝑤 = 𝜌𝑒 𝑖𝜃 , 𝑏 0 = 𝑟𝑒 𝑖𝛼 e


applichiamo la disuguaglianza triangolare

𝑁
| 𝑓 (𝑧)| = 𝑟𝑒 𝑖𝛼 + 𝜌 𝑘 𝑒 𝑖𝜃𝑘 + 𝑏 𝑗 𝜌 𝑗 𝑒 𝑖𝜃 𝑗
X
𝑗=𝑘+1

𝑁
≤ 𝑟𝑒 𝑖𝛼 + 𝜌 𝑘 𝑒 𝑖𝜃𝑘 + 𝑏 𝑗 𝜌 𝑗 .
X
𝑗=𝑘+1

Per raggiungere un assurdo vogliamo dimostrare che esiste 𝑧 (cioè esistono 𝜌 e


𝜃 ) per cui il valore della funzione risulti in modulo minore di 𝑟 = |𝑏0 | = | 𝑓 (𝑤)| .
Innanzitutto se 𝜌 è sufficientemente piccolo possiamo rendere arbitrariamente
piccole le potenze 𝜌 𝑗 con 𝜌 > 𝑘 : basta scegliere 𝜌 ≤ 1 e 𝜌 ≤ 1/(2 𝑏 𝑗 ) cosicché
P
si avrà
𝑁 𝑁 𝑘
𝑏 𝑗 𝜌 𝑗 ≤ 𝜌 𝑘+1 𝑏 𝑗 ≤ 𝜌 .
X X
𝑗=𝑘+1 𝑗=𝑘+1
2

Per quanto riguarda il termine 𝑟𝑒 𝑖𝛼 + 𝜌 𝑘 𝑒 𝑖𝜃𝑘 sarà sufficiente scegliere 𝜃 =


(𝜋 − 𝛼)/𝑘 in modo che i due addendi abbiano fase opposta e la somma sia
168 4 i numeri complessi

distruttiva: 𝑖𝛼
𝑟𝑒 + 𝜌 𝑘 𝑒 𝑖𝜃𝑘 = 𝑒 𝑖𝛼 (𝑟 + 𝜌 𝑘 𝑟 𝑖𝜋 ) = 𝑟 − 𝜌 𝑘 .

In definitiva abbiamo

𝜌𝑘
| 𝑓 (𝑧)| = 𝑓 (𝑤 + 𝜌𝑒 𝑖𝜃 ≤ 𝑟 − 𝜌 𝑘 + < 𝑟 = | 𝑓 (𝑤)|

2
che è assurdo in quanto | 𝑓 (𝑤)| doveva essere il valore minimo.

4.6 fattorizzazione dei polinomi

Teorema 4.19 (fattorizzazione dei polinomi complessi). Sia 𝑝(𝑧) un polinomio


non nullo. Allora posto 𝑛 = deg 𝑝 esistono dei numeri complessi 𝑧 1 , 𝑧 2 , . . . , 𝑧 𝑛 ed un
numero complesso 𝑐 ≠ 0 tali che
𝑛
Y
𝑝(𝑧) = 𝑐 (𝑧 − 𝑧 𝑘 ). (4.1)
𝑘=1

Gli 𝑧 𝑘 sono unici a meno dell’ordine e 𝑐 pure è univocamente determinato.

Dimostrazione. Dimostriamo il teorema per induzione su 𝑛 = deg 𝑝 . Se 𝑛 = 0 il


polinomio 𝑝 è costante: 𝑝(𝑧) = 𝑐 . Ricordando che un prodotto di 𝑛 = 0 fattori è
uguale a 1 si ottiene quindi il risultato voluto.

Sia ora 𝑝(𝑧) un qualunque polinomio di grado 𝑛 > 0. Per il teorema fonda-
mentale dell’algebra sappiamo che esiste un numero complesso 𝑧 𝑛 tale che
𝑝(𝑧 𝑛 ) = 0. Per il teorema di Ruffini si ha allora

𝑝(𝑧) = (𝑧 − 𝑧 𝑛 )𝑞(𝑧)

con 𝑞 un qualche polinomio di grado 𝑛 − 1. Per ipotesi induttiva possiamo


dunque supporre che esistano 𝑧 1 , . . . , 𝑧 𝑛−1 e 𝑐 numeri complessi tali che

𝑛−1
Y
𝑞(𝑧) = 𝑐 (𝑧 − 𝑧 𝑘 )
𝑘=1

e la tesi segue.

Nella fattorizzazione (4.1) le radici 𝑧 𝑘 possono anche ripetersi. Se mettiamo


insieme i fattori corrispondenti alla stessa radice si ottiene una decomposizione
della forma
𝑚
(𝑧 − 𝑧 𝑘 )𝑝 𝑘
Y
𝑃(𝑧) = 𝑐 (4.2)
molteplicità 𝑘=1

con 𝑧 1 , . . . , 𝑧 𝑚 numeri complessi distinti (le radici del polinomio 𝑃 ) e 𝑝 𝑘 interi


positivi. L’esponente 𝑝 𝑘 si chiama molteplicità della radice 𝑧 𝑘 e risulta

𝑝1 + · · · + 𝑝 𝑚 = 𝑛.
4.6 fattorizzazione dei polinomi 169

Questa uguaglianza si esprime dicendo che un polinomio 𝑃 ∈ ℂ[𝑧] di grado


𝑛 ha sempre 𝑛 radici contate con la loro molteplicità. Le radici distinte sono
invece 𝑚 ≤ 𝑛 .

Se invece 𝑃 ∈ ℝ[𝑥] è un polinomio a coefficienti reali non è detto che 𝑃 abbia


radici: ad esempio il polinomio 𝑥 2 + 1 non ha radici reali in quanto 𝑥 2 + 1 > 0
come succede in ogni campo ordinato. Potrà allora essere utile pensare a 𝑃
come ad un polinomio in ℂ[𝑥] con coefficienti reali.

Se 𝑃 ∈ ℝ[𝑥] è un polinomio a coefficienti reali


𝑛
𝑎𝑘 𝑥 𝑘 ,
X
𝑃= 𝑎𝑘 ∈ ℝ
𝑘=0

possiamo pensare a 𝑃 anche come un polinomio in ℂ[𝑥], visto che 𝑎 𝑘 ∈ ℝ ⊆ ℂ.


Il seguente teorema ci dà un criterio per distinguere i polinomi a coefficienti
reali dentro a ℂ[𝑥].

Teorema 4.20. Se 𝑃 ∈ ℂ[𝑥] è un polinomio a coefficienti complessi


𝑛
𝑎𝑘 𝑥 𝑘 ,
X
𝑃= 𝑎𝑘 ∈ ℂ
𝑘=0

e se esiste un insieme infinito 𝐴 ⊆ ℝ tale che per ogni 𝑥 ∈ 𝐴 si abbia 𝑃(𝑥) ∈ ℝ allora
𝑎 𝑘 ∈ ℝ per ogni 𝑘 = 0, . . . , 𝑛 e dunque 𝑃 ∈ ℝ[𝑥].

In particolare se la funzione polinomiale associata a 𝑃 ∈ ℂ[𝑥] manda ℝ in ℝ allora 𝑃 è


un polinomio a coefficienti reali.

Dimostrazione. Consideriamo il polinomio:


𝑛
(𝑎 𝑘 − 𝑎¯ 𝑘 )𝑥 𝑘 .
X
𝑄=
𝑘=0

Allora per ogni 𝑥 ∈ 𝐴 si ha


𝑛 𝑛
𝑎𝑘 𝑥 𝑘 − 𝑎¯ 𝑘 𝑥 𝑘 = 𝑃(𝑥) − 𝑃(𝑥) = 𝑃(𝑥) − 𝑃(𝑥) = 0
X X
𝑄(𝑥) =
𝑘=0 𝑘=0

in quanto se 𝑥 ∈ ℝ risulta 𝑥 𝑘 = 𝑥¯ 𝑘 = 𝑥 𝑘 . Visto che 𝐴 è infinito, per il principio


di annullamento dei polinomi (teorema 4.11) deduciamo che 𝑄 = 0. Ma allora
tutti i coefficienti di 𝑄 devono essere nulli e cioè 𝑎¯ 𝑘 = 𝑎 𝑘 . Ne consegue che
𝑎 𝑘 ∈ ℝ per ogni 𝑘 = 0 , . . . , 𝑛 .

Rifacendoci alla fattorizzazione dei polinomi a coefficienti complessi possiamo


fattorizzare anche i polinomi a coefficienti reali se ci accontentiamo di avere
fattori quadratici invece che lineari.
170 4 i numeri complessi

Teorema 4.21 (fattorizzazione dei polinomi reali). Se 𝑃 ∈ ℝ[𝑥] è un polinomio a


coefficienti reali potremo scrivere
𝑛 𝑚
(𝑥 − 𝑥 𝑘 )𝑝 𝑘 · (𝑥 2 + 𝛼 𝑗 𝑥 + 𝛽 𝑗 )𝑞 𝑗
Y Y
𝑃=𝑎· (4.3)
𝑘=1 𝑗=1

dove 𝑎 ∈ ℝ, 𝑥 𝑘 ∈ ℝ, 𝑝 𝑘 ∈ ℕ \ {0}, 𝛼 𝑗 , 𝛽 𝑗 ∈ ℝ, 𝑞 𝑗 ∈ ℕ \ {0} con 𝛼 2𝑗 − 4𝛽 𝑗 < 0 e

𝑛
X 𝑚
X
𝑝𝑘 + 2 𝑞 𝑗 = deg 𝑃.
𝑘=1 𝑗=1

La fattorizzazione (4.3) è unica a meno dell’ordine dei fattori.

I numeri 𝑥 1 , . . . , 𝑥 𝑛 sono tutte le radici reali distinte del polinomio 𝑃 con rispettive
molteplicità 𝑝 1 , . . . , 𝑝 𝑛 mentre tutte le radici complesse (non reali) distinte saranno
𝜇1 , . . . , 𝜇𝑚 e 𝜇¯ 1 , . . . , 𝜇¯ 𝑚 con

𝑥 2 + 𝛼 𝑗 𝑥 + 𝛽 𝑗 = (𝑥 − 𝜇) · (𝑥 − 𝜇)
¯

da cui 2
𝛼 𝑗 = −2 Re 𝜇 𝑗 , 𝛽 𝑗 = 𝜇 𝑗
e 𝑞 𝑗 saranno le molteplicità delle radici 𝜇 𝑗 e 𝜇¯ 𝑗 .

Dimostrazione. Osserviamo innanzitutto che se 𝑃 è a coefficienti reali si ha

𝑃(𝑧) = 𝑃(¯𝑧 ), ∀𝑧 ∈ ℂ

dunque se 𝜇 è una radice di 𝑃 anche 𝜇¯ è una radice di 𝑃 . Ora se 𝜇 è una radice


non reale di 𝑃 sappiamo che in campo complesso 𝑃 risulta divisibile per 𝑥 − 𝜇
(teorema 4.10 di Ruffini):
𝑃 = (𝑥 − 𝜇) · 𝑃1 .
Ma anche 𝜇¯ è radice di 𝑃 ed essendo 𝜇¯ ≠ 𝜇 si dovrà avere

𝑃(𝜇)
¯
𝑄(𝜇)
¯ = =0
𝜇¯ − 𝜇

e dunque applicando nuovamente il teorema di Ruffini

𝑃 = (𝑥 − 𝜇) · (𝑥 − 𝜇)
¯ · 𝑃2 .

Ora osserviamo che

(𝑥 − 𝜇) · (𝑥 − 𝜇) ¯ + 𝜇𝜇¯ = 𝑥 2 − 2(Re 𝜇) · 𝑥 + |𝜇| 2


¯ = 𝑥 2 − (𝜇 + 𝜇)𝑥

è un polinomio a coefficienti reali e visto che 𝑃2 si ottiene dividendo 𝑃 per tale


polinomio, anche 𝑃2 è un polinomio a coefficienti reali.

Ripetendo lo stesso procedimento sul polinomio 𝑃2 potremo fattorizzare 𝑃


diminuendo il grado a passi di 2 finché non si esauriscono tutte le radici
complesse non reali accoppiandole a due a due. Dunque se 𝜇 è una radice
4.6 fattorizzazione dei polinomi 171

complessa del polinomio reale 𝑃 la molteplicità di 𝜇 è uguale alla molteplicità


di 𝜇¯ .
Dopodiché si potrà completare la fattorizzazione dividendo per i fattori lineari
𝑥 − 𝑥 𝑘 corrispondenti alle radici reali del polinomio 𝑃 . Si otterrà quindi la
fattorizzazione desiderata.
calcolo differenziale 5
5.1 derivata

Il potenziale gravitazionale generato dalla terra nello spazio, in un punto a


distanza 𝑟 dal suo centro è dato da:
𝐺𝑀
𝑈(𝑟) = −
𝑟
dove 𝑀 è la massa della terra e 𝐺 è la costante di gravitazione universale. La
funzione 𝑈(𝑟) non è affatto lineare. Se però consideriamo il campo gravita-
zionale per i punti in prossimità della superficie terrestre, ci aspettiamo un
comportamento approssimativamente lineare. Proviamo a esplicitare questa
idea.

Supponiamo di trovarci ad altezza ℎ dalla superficie terrestre. Ci troveremo


allora a distanza 𝑅 + ℎ dal centro della terra. Si avrà allora:
1
𝑈(𝑅 + ℎ) = −𝐺𝑀 .
𝑅+ℎ
Osserviamo ora che si ha

1 1 1 1 1 𝑅 − (𝑅 + ℎ)
= + − = +
𝑅+ℎ 𝑅 𝑅+ℎ 𝑅 𝑅 𝑅(𝑅 + ℎ)
1 ℎ
= −
𝑅 𝑅(𝑅 + ℎ)
1 ℎ ℎ ℎ
= − 2− +
𝑅 𝑅 𝑅(𝑅 + ℎ) 𝑅2
1 ℎ ℎ𝑅 − ℎ(𝑅 + ℎ)
= − 2−
𝑅 𝑅 𝑅 2 (𝑅 + ℎ)
ℎ 1 ℎ2
=− + + .
𝑅 2 𝑅 𝑅 2 (𝑅 + ℎ)

Dunque si avrà

𝐺𝑀 𝐺𝑀
𝑈(𝑅 + ℎ) = ℎ− + 𝜔(ℎ)
𝑅2 𝑅
= 𝑔 ℎ + 𝐶 + 𝜔(ℎ)

dove 𝑔 = 𝐺𝑀/𝑅 2 , 𝐶 è una costante (irrilevante perché il potenziale può


essere definito a meno di una costante) e 𝜔(ℎ) è una funzione con la proprietà
𝜔(ℎ)/ℎ → 0 per ℎ → 0. Dunque se ℎ è molto piccolo rispetto a 𝑅 , il termine
𝜔(ℎ) è trascurabile rispetto al termine 𝑔 ℎ (anche se entrambi tendono a zero
per ℎ → 0). Questo giustifica l’utilizzo della formula semplificata:

𝑈0 (ℎ) = 𝑔 ℎ
174 5 calcolo differenziale

Figura 5.1: Il grafico del potenziale gra-


vitazionale terrestre. Sull’asse delle 𝑥 la
distanza dal centro della terra in raggi
terrestri. Sull’asse delle 𝑦 il potenziale
gravitazionale con unità 𝐶 = 𝐺𝑀/𝑅 . La
pendenza della retta tangente al grafico
della curva per 𝑥 = 𝑅 è 𝑔 = 𝐺𝑀/𝑅 2 .
Nella figura di destra un ingrandimento
in un intorno del raggio terrestre: si nota
come il grafico del potenziale risulta qua-
si indistinguibile dal grafico della retta
tangente.

da cui l’energia potenziale 𝐸 = 𝑚 𝑔 ℎ se abbiamo una massa 𝑚 ad una altezza ℎ


sulla superficie terrestre.

linearizzazione Quello che abbiamo fatto è un procedimento di linearizzazione. Il campo


gravitazionale è descritto da una funzione non lineare: −𝐺𝑀/𝑟 . Ma quando
ci restringiamo a un piccolo intervallo di valori di 𝑟 (i valori di 𝑟 vicini ad 𝑅 ,
il raggio della terra) tale funzione risulta quasi indistinguibile, a meno di una
costante, dalla funzione lineare 𝑔 ℎ se 𝑟 = 𝑅 + ℎ . Le funzioni lineari sono molto
più semplici da trattare ed è quindi conveniente, se rimaniamo sulla superficie
terrestre, utilizzare quest’ultima formula per il potenziale gravitazionale. Il
grafico della funzione lineare che meglio approssima il grafico di una funzione
retta tangente si chiama retta tangente. Il suo coefficiente angolare, 𝑔 nel nostro esempio, si
chiama derivata.
derivata
Una volta introdotte le derivate vedremo che quello che abbiamo determinato è
la formula:
𝑈(𝑅 + ℎ) = 𝑈(𝑅) + 𝑈 0(𝑅)ℎ + 𝜔(ℎ).

Definizione 5.1 (derivata). Sia 𝐴 ⊆ ℝ, 𝑓 : 𝐴 → ℝ, 𝑥 0 un punto di accumulazione


di 𝐴. Diremo che la funzione 𝑓 è derivabile nel punto 𝑥 0 se esiste ed è finito il limite:

𝑓 (𝑥0 + ℎ) − 𝑓 (𝑥0 )
lim .
ℎ→0 ℎ
derivata In tal caso denoteremo con 𝑓 0(𝑥 0 ) il valore di tale limite che chiameremo derivata della
funzione 𝑓 nel punto 𝑥 0 .

Se 𝐵 è l’insieme dei punti di accumulazione di 𝐴 in cui 𝑓 risulta essere derivabile,


risulta quindi definita la funzione derivata 𝑓 0 : 𝐵 → ℝ.

Una funzione 𝑓 si dice essere derivabile se è derivabile in ogni punto del suo dominio.
Se 𝐶 ⊆ 𝐴 la funzione 𝑓 si dice essere derivabile su 𝐶 se è derivabile in ogni punto
dell’insieme 𝐶 (cioè se 𝐶 ⊆ 𝐵).

Notazioni alternative per denotare la derivata di una funzione:

𝑑 𝑑𝑓
𝑓0 = 𝐷𝑓 = 𝑓 = .
𝑑𝑥 𝑑𝑥

Il rapporto
𝑓 (𝑥0 + ℎ) − 𝑓 (𝑥 0 )
rapporto incrementale ℎ
5.1 derivata 175

si chiama rapporto incrementale. In effetti cambiando variabile e ponendo


𝑥 = 𝑥0 + ℎ si può scrivere

𝑓 (𝑥 0 + ℎ) − 𝑓 (𝑥0 ) 𝑓 (𝑥) − 𝑓 (𝑥 0 ) Δ 𝑓
= =
ℎ 𝑥 − 𝑥0 Δ𝑥

che risulta essere il rapporto dell’incremento della funzione 𝑓 (a volte denotato


con Δ 𝑓 ) rispetto all’incremento corrispondente della variabile 𝑥 (a volte denotato
con Δ𝑥 ). Cambiando variabile nel limite, per ℎ → 0 si avrà 𝑥 → 𝑥 0 e quindi

𝑓 (𝑥) − 𝑓 (𝑥 0 )
𝑓 0(𝑥0 ) = lim .
𝑥→𝑥 0 𝑥 − 𝑥0

Esempio 5.2. Si consideri la funzione 𝑓 (𝑥) = 1/𝑥 definita sull’insieme 𝐴 = ℝ \ {0}.


Si ha allora per ogni 𝑥 ≠ 0:
1 1
𝑥+ℎ − 𝑥 𝑥 − (𝑥 + ℎ) −1 1
𝑓 0(𝑥) = lim = lim = lim = − 2.
ℎ→0 ℎ ℎ→0 ℎ(𝑥 + ℎ)𝑥 ℎ→0 (𝑥 + ℎ)𝑥 𝑥

Risulta quindi che la funzione 1/𝑥 sia derivabile e la sua derivata è la funzione −1/𝑥 2 .

Teorema 5.3 (continuità delle funzioni derivabili). Se 𝑓 è derivabile nel punto 𝑥


allora 𝑓 è anche continua nel punto 𝑥 .

Dimostrazione. Si ha

𝑓 (𝑥 + ℎ) − 𝑓 (𝑥)
lim 𝑓 (𝑥 + ℎ) − 𝑓 (𝑥) = lim · ℎ = 𝑓 0(𝑥) · 0 = 0.
ℎ→0 ℎ→0 ℎ

Dunque 𝑓 (𝑥 + ℎ) → 𝑓 (𝑥) per ℎ → 0 e quindi 𝑓 è continua nel punto 𝑥 .

Esempio 5.4 (funzione continua ma non derivabile). La funzione 𝑓 (𝑥) = |𝑥| è un


esempio di funzione continua ma non derivabile. E’ infatti facile verificare che nel punto
𝑥0 = 0 il limite destro del rapporto incrementale è 1 mentre il limite sinistro è −1.

Un altro esempio è la funzione 𝑓 (𝑥) = 𝑥 che è continua ma non è derivabile nel punto
𝑥0 = 0 perché il limite del rapporto incrementale esiste ma è +∞.

Teorema 5.5 (derivata della funzione composta). Sia 𝑓 una funzione derivabile nel
punto 𝑥 0 e sia 𝑔 una funzione derivabile nel punto 𝑓 (𝑥 0 ). Allora la funzione composta
𝑔 ◦ 𝑓 è derivabile nel punto 𝑥0 e si ha:

(𝑔 ◦ 𝑓 )0(𝑥 0 ) = 𝑔 0( 𝑓 (𝑥0 )) · 𝑓 0(𝑥0 ).

Dimostrazione. Consideriamo la funzione


( 𝑔(𝑦)−𝑔( 𝑓 (𝑥
0 ))
𝑦− 𝑓 (𝑥0 )
se 𝑦 ≠ 𝑓 (𝑥 0 ),
𝐺(𝑦) =
𝑔 0( 𝑓 (𝑥 0 )) se 𝑦 = 𝑓 (𝑥 0 ).

Si avrà allora

𝑔( 𝑓 (𝑥0 + ℎ)) − 𝑔( 𝑓 (𝑥 0 )) 𝑓 (𝑥 0 + ℎ) − 𝑓 (𝑥0 )


= 𝐺( 𝑓 (𝑥0 + ℎ)) · (5.1)
ℎ ℎ
176 5 calcolo differenziale

infatti se 𝑓 (𝑥 0 + ℎ) ≠ 𝑓 (𝑥 0 ) abbiamo moltiplicato e diviso per 𝑓 (𝑥 0 + ℎ) − 𝑓 (𝑥 0 )


se invece 𝑓 (𝑥 0 + ℎ) = 𝑓 (𝑥 0 ) allora anche 𝑔( 𝑓 (𝑥 0 + ℎ)) = 𝑔( 𝑓 (𝑥 0 )) e l’uguaglianza
è ancora valida perché sia il lato sinistro che il lato destro si annullano (e il
valore assegnato a 𝐺 risulta in tal caso irrilevante).

Chiaramente quando ℎ → 0 il secondo fattore sul lato destro dell’uguaglianza


(5.1) tende, per definizione, a 𝑓 0(𝑥 0 ). Per quanto riguarda il primo fattore
osserviamo che 𝐺(𝑦), per come è stata definita, risulta essere una funzione
continua nel punto 𝑦 = 𝑓 (𝑥 0 ) in quanto

𝑔(𝑦) − 𝑔( 𝑓 (𝑥 0 ))
→ 𝑔 0( 𝑓 (𝑥0 ))
𝑦 − 𝑓 (𝑥0 )

per 𝑦 → 𝑓 (𝑥 0 ). Ma anche la funzione 𝑓 è continua nel punto 𝑥 0 (in quanto


derivabile). Dunque la funzione composta 𝐺( 𝑓 (𝑥 0 + ℎ)) è continua nel punto
ℎ = 0. Risulta quindi che 𝐺( 𝑓 (𝑥0 + ℎ)) → 𝐺( 𝑓 (𝑥0 )) = 𝑔 0( 𝑓 (𝑥0 )) per ℎ → 0.
Dunque il lato destro di (5.1) ha limite 𝑔 0( 𝑓 (𝑥 0 )) · 𝑓 0(𝑥 0 ) per ℎ → 0, come
volevamo dimostrare.

Teorema 5.6 (derivata della funzione inversa). Sia 𝑓 una funzione invertibile
derivabile in un punto 𝑥 0 e supponiamo che la funzione inversa 𝑓 −1 sia continua in
𝑓 (𝑥 0 ). Se 𝑓 0(𝑥0 ) ≠ 0 allora 𝑓 −1 è derivabile in 𝑓 (𝑥0 ) e vale:

1
( 𝑓 −1 )0( 𝑓 (𝑥0 )) = .
𝑓 0(𝑥 0)

Chiamato 𝑦0 = 𝑓 (𝑥 0 ) la formula può essere anche scritta nella forma:

1
( 𝑓 −1 )0(𝑦0 ) = .
𝑓 0( 𝑓 −1 (𝑦 0 ))

Se invece 𝑓 0(𝑥 0 ) = 0 la funzione 𝑓 −1 non è derivabile in 𝑓 (𝑥 0 ).

Osserviamo che se 𝑓 è definita in un intervallo e se è invertibile e continua in


tutto l’intervallo allora certamente l’inversa è continua (Esercizio 2.83).

Dimostrazione. Posto 𝑦0 = 𝑓 (𝑥 0 ) consideriamo il rapporto incrementale di 𝑓 −1


nel punto 𝑦0 :
𝑓 −1 (𝑦) − 𝑓 −1 (𝑦0 )
.
𝑦 − 𝑦0
Per 𝑦 → 𝑦0 possiamo fare il cambio di variabile 𝑥 = 𝑓 −1 (𝑦) in quanto avendo
assunto che 𝑓 −1 sia continua in 𝑓 (𝑥 0 ) sappiamo che se 𝑦 → 𝑦0 allora 𝑥 =
𝑓 −1 (𝑦) → 𝑓 −1 (𝑦0 ) = 𝑥 0 . Si ha allora per 𝑦 → 𝑦0 che 𝑥 → 𝑥0 e, se 𝑓 0(𝑥0 ) ≠ 0:

𝑓 −1 (𝑦) − 𝑓 −1 (𝑦0 ) 𝑥 − 𝑥0 1 1
= = → .
𝑦 − 𝑦0 𝑓 (𝑥) − 𝑓 (𝑥0 ) 𝑓 (𝑥)− 𝑓 (𝑥0 ) 𝑓 0(𝑥 0)
𝑥−𝑥 0

Se invece 𝑓 0(𝑥 0 ) = 0 il rapporto incrementale della funzione inversa ha limite


infinito e quindi la funzione inversa non è derivabile in 𝑓 (𝑥 0 ).
5.1 derivata 177

Teorema 5.7 (operazioni con le derivate). Siano 𝑓 e 𝑔 due funzioni derivabili in


uno stesso punto 𝑥 0 . Allora le funzioni 𝑓 + 𝑔 , 𝑓 − 𝑔 , 𝑓 · 𝑔 e, se 𝑔(𝑥 0 ) ≠ 0 anche 𝑓 /𝑔
sono funzioni derivabili in 𝑥 0 . Nei punti in cui entrambe le funzioni sono derivabili si
ha

( 𝑓 + 𝑔)0 = 𝑓 0 + 𝑔 0 , ( 𝑓 − 𝑔)0 = 𝑓 0 − 𝑔 0 ,
 0
0 0 0 𝑓 𝑓 0 𝑔 − 𝑓 𝑔0
( 𝑓 · 𝑔) = 𝑓 · 𝑔 + 𝑓 𝑔 , = .
𝑔 𝑔2

Dimostrazione. Per quanto riguarda la derivata della somma (o della differenza)


è sufficiente osservare che il rapporto incrementale della somma (o della
differenza) è la somma (o la differenza) dei rapporti incrementali e che il limite
della somma (o della differenza) è uguale alla somma (o la differenza) dei limiti.

Calcoliamo la derivata del prodotto 𝑓 · 𝑔 nel punto 𝑥 0 . Si ha

𝑓 (𝑥)𝑔(𝑥) − 𝑓 (𝑥0 )𝑔(𝑥 0 ) 𝑓 (𝑥)(𝑔(𝑥) − 𝑔(𝑥0 )) + ( 𝑓 (𝑥) − 𝑓 (𝑥0 ))𝑔(𝑥 0 )


=
𝑥 − 𝑥0 𝑥 − 𝑥0
𝑔(𝑥) − 𝑔(𝑥0 ) 𝑓 (𝑥) − 𝑓 (𝑥0 )
= 𝑓 (𝑥) + 𝑔(𝑥0 ).
𝑥 − 𝑥0 𝑥 − 𝑥0

Passando al limite per 𝑥 → 𝑥 0 ci ricordiamo che 𝑓 (𝑥) → 𝑓 (𝑥 0 ) in quanto 𝑓 è


continua in 𝑥 0 (essendo per ipotesi derivabile). I rapporti incrementali tendono
alle derivate e si ottiene quindi il risultato voluto 𝑓 (𝑥 0 )𝑔 0(𝑥 0 ) + 𝑓 0(𝑥 0 )𝑔(𝑥 0 ).

Per quanto riguarda la derivata del rapporto osserviamo che posto ℎ(𝑦) = 1/𝑦
si ha
𝑓 (𝑥)
= 𝑓 (𝑥) · ℎ(𝑔(𝑥)).
𝑔(𝑥)
Dall’esercizio già svolto sappiamo che ℎ 0(𝑦) = −1/𝑦 2 e dunque possiamo
utilizzare le formule per la derivata del prodotto e la derivata della funzione
composta per ottenere:
 0
𝑓
(𝑥0 ) = ( 𝑓 · (𝑔 ◦ ℎ))0(𝑥 0 )
𝑔
= 𝑓 0(𝑥 0 ) · ℎ(𝑔(𝑥0 )) + 𝑓 (𝑥0 ) · ℎ 0(𝑔(𝑥0 )) · 𝑔 0(𝑥0 )
𝑓 0(𝑥0 ) −1 0
= + 𝑓 (𝑥0 ) · 2 𝑔 (𝑥0 )
𝑔(𝑥0 ) 𝑔 (𝑥0 )
𝑓 0(𝑥0 )𝑔(𝑥0 ) − 𝑓 (𝑥0 )𝑔 0(𝑥0 )
= .
𝑔 2 (𝑥0 )

Teorema 5.8 (derivate delle funzioni elementari). Per 𝑚, 𝑞, 𝛼 ∈ ℝ, 𝛼 ≠ 0, 𝑛 ∈ ℕ ,


𝑛 ≠ 0 valgono le regole di derivazione riassunte nella tabella 5.1: le funzioni nella
colonna 𝑓 (𝑥) hanno la derivata riportata nella colonna 𝑓 0(𝑥). Le funzioni 𝑓 (𝑥) sono
derivabili nei punti in cui la corrispondente espressione 𝑓 0(𝑥) è ben definita. In

particolare: la funzione 𝑛 𝑥 non è derivabile in 𝑥 = 0, le funzioni arcsin 𝑥 e arccos 𝑥
non sono derivabili nei punti −1 e 1, la funzione |𝑥| non è derivabile in 0, la funzione
178 5 calcolo differenziale

Tabella 5.1: Derivate delle funzioni ele- 𝑓 (𝑥) 𝑓 0(𝑥) 𝑓 (𝑥) 𝑓 0(𝑥) 𝑓 (𝑥) 𝑓 0(𝑥)
mentari
𝑚𝑥 + 𝑞 𝑚 𝑒𝑥 𝑒𝑥 sin 𝑥 cos 𝑥
𝑥
|𝑥| |𝑥|
ln 𝑥 1
𝑥 cos 𝑥 − sin 𝑥
𝑥𝑛 𝑛𝑥 𝑛−1 sinh 𝑥 cosh 𝑥 arcsin 𝑥 √ 1
1−𝑥 2
𝑥𝛼 𝛼𝑥 𝛼−1 cosh 𝑥 sinh 𝑥 arccos 𝑥 −√ 1 2
√ 1−𝑥
𝑛
𝑥 √
𝑛
1
settsinh 𝑥 √ 1 tg 𝑥 1 + tg2 𝑥
√ 𝑛 𝑥 𝑛−1 𝑥 2 +1
𝑥 1

2 𝑥
settcosh 𝑥 √ 1 arctg 𝑥 1
1+𝑥 2
𝑥 2 −1

settcosh 𝑥 non è derivabile in 1. Le funzioni lineari, potenze con base positiva, potenze
con esponente intero, esponenziale, logaritmo, seno, coseno, tangente, arcotangente sono
invece derivabili in tutti i punti in cui sono definite.

Dimostrazione. Per quanto riguarda le funzioni lineari si ha:

𝑚(𝑥 + ℎ) + 𝑞 − (𝑚𝑥 + 𝑞)
(𝑚𝑥 + 𝑞)0 = lim = lim 𝑚 = 𝑚.
ℎ→0 ℎ ℎ→0

Ricordando che la derivata è un limite e che il limite in un punto dipende solo


dai valori della funzione in un intorno del punto, possiamo affermare che la
derivata del valore assoluto |𝑥| coincide con la derivata di 𝑥 cioè 1 sugli 𝑥 > 0
e coincide con la derivata di −𝑥 sugli 𝑥 < 0. Dunque 𝐷|𝑥| = 𝑥/|𝑥| se 𝑥 ≠ 0.
Se 𝑥 = 0 i limiti destro e sinistro del rapporto incrementale di |𝑥| tendono
rispettivamente a 1 e −1 e quindi la derivata non esiste.

Dimostriamo che 𝐷𝑥 𝑛 = 𝑛𝐷𝑥 𝑛−1 per 𝑛 ∈ ℕ , 𝑛 > 0, per induzione su 𝑛 .


Per 𝑛 = 1 abbiamo 𝑥 𝑛 = 𝑥 1 è lineare e quindi dalla formula precedente
𝐷𝑥 1 = 1 = 1 · 𝑥 0 . Supponendo di sapere che 𝐷𝑥 𝑛 = 𝑛𝑥 𝑛−1 si ha, applicando la
regola di derivazione del prodotto:

𝐷𝑥 𝑛+1 = 𝐷𝑥 · 𝑥 𝑛 = 1 · 𝑥 𝑛 + 𝑥 · 𝑛𝑥 𝑛−1 = 𝑥 𝑛 + 𝑛𝑥 𝑛 = (𝑛 + 1)𝑥 𝑛

dimostrando dunque il passo induttivo. Ricordando la formula di derivazione


del rapporto possiamo trovare la formula per le potenze con esponente intero
negativo:
1 −𝑛𝑥 𝑛−1
𝐷𝑥 −𝑛 = 𝐷 𝑛 = = −𝑛𝑥 𝑛−1−2𝑛 = −𝑛𝑥 −𝑛−1 .
𝑥 𝑥 2𝑛

La derivata della radice 𝑛 -esima si trova con la formula di derivazione della


funzione inversa 𝑥 𝑛 , che può essere applicata se 𝑥 ≠ 0:

√ 1 1
𝐷 𝑛𝑥 = √ = √ .
𝑛( 𝑛 𝑥)𝑛−1 𝑛
𝑛 𝑥 𝑛−1
Osserviamo che se 𝑛 è dispari la formula è valida anche per 𝑥 < 0. La derivata
della radice quadrata si ottiene ponendo 𝑛 = 2.

Per quanto riguarda la derivata dell’esponenziale ci riconduciamo ad un limite


notevole:

𝑒 𝑥+ℎ − 𝑒 𝑥 𝑒𝑥𝑒ℎ − 𝑒𝑥 𝑒ℎ − 1
𝐷𝑒 𝑥 = lim = lim = lim 𝑒 𝑥 = 𝑒𝑥.
ℎ→0 ℎ ℎ→0 ℎ ℎ→0 ℎ
5.1 derivata 179

La derivata del logaritmo si ottiene come derivata della funzione inversa


dell’esponenziale:
1 1
𝐷 ln 𝑥 = ln 𝑥 = .
𝑒 𝑥
Possiamo quindi calcolare la derivata delle potenze con base positiva e esponente
reale qualunque:

1
𝐷𝑥 𝛼 = 𝐷𝑒 𝛼 ln 𝑥 = 𝑒 𝛼 ln 𝑥 𝐷(𝛼 ln 𝑥) = 𝑥 𝛼 𝛼 = 𝛼𝑥 𝛼−1 .
𝑥

Per quanto riguarda le funzioni trigonometriche sin e cos ci ricordiamo dei


limiti notevoli:
sin ℎ 1 − cos ℎ 1 − cos ℎ 1
lim = 1, lim = lim ℎ · = 0 · = 0.
ℎ→0 ℎ ℎ→0 ℎ ℎ→0 ℎ2 2

Applicando le formule di addizione si ha

sin(𝑥 + ℎ) − sin(𝑥)
𝐷 sin 𝑥 = lim
ℎ→0 ℎ
sin(𝑥) cos(ℎ) + cos(𝑥) sin(ℎ) − sin(𝑥)
= lim
ℎ→0 ℎ
cos ℎ − 1 sin ℎ
= lim sin(𝑥) + cos(𝑥) = cos(𝑥).
ℎ→0 ℎ ℎ

e similmente

cos(𝑥 + ℎ) − cos(𝑥)
𝐷 cos 𝑥 = lim
ℎ→0 ℎ
cos(𝑥) cos(ℎ) − sin(𝑥) sin(ℎ) − cos(𝑥)
= lim
ℎ→0 ℎ
cos ℎ − 1 sin ℎ
= lim cos(𝑥) − sin(𝑥) = − sin(𝑥)
ℎ→0 ℎ ℎ

La funzioni arcsin è definita come l’inversa della restrizione della funzione sin
all’intervallo [−𝜋/2 , 𝜋/2]. Nell’intervallo aperto (−𝜋/2 , 𝜋/2) la funzione sin ha
derivata positiva e dunque risulta che la funzione inversa (che sappiamo essere
continua) è derivabile in (−1 , 1) e la sua derivata è

1 1 1
𝐷 arcsin 𝑥 = =√ =√ .
cos(arcsin 𝑥) 1 − sin arcsin 𝑥
2 1 − 𝑥2
q
Si ha infatti cos 𝑦 = 1 − sin2 𝑦 se 𝑦 ∈ [−𝜋/2 , 𝜋/2].

Analogamente la funzione arccos è definita come l’inversa della restrizione di


cos all’intervallo [0 , 𝜋] e si ha quindi, per 𝑥 ∈ (−1 , 1)

1 1 1
𝐷 arccos 𝑥 = = √ = −√ .
− sin(arccos 𝑥) − 1 − cos2 arccos 𝑥 1 − 𝑥2

Si ha infatti sin 𝑦 =
p
1 − cos2 𝑦 se 𝑦 ∈ [0 , 𝜋].

Nei punti 𝑥 = 1 e 𝑥 = −1 le funzioni arcsin e arccos non sono invece derivabili.


180 5 calcolo differenziale

Per la funzione tangente possiamo utilizzare la formula di derivazione del


rapporto:

sin 𝑥 cos 𝑥 · cos 𝑥 − sin 𝑥 · (− sin 𝑥)


𝐷 tg 𝑥 = 𝐷 =
cos 𝑥 cos2 𝑥
cos 𝑥 + sin 𝑥
2 2
1
= = 1 + tg2 𝑥 = .
cos2 𝑥 cos2 𝑥
Usando la formula della derivata della funzione inversa si ha
1 1
𝐷 arctg 𝑥 = = .
1 + tg2 (arctg 𝑥) 1 + 𝑥2

Per quanto riguarda le funzioni iperboliche le derivate di sinh e cosh si ri-


conducono immediatamente alla derivata dell’esponenziale, utilizzando la
definizione (3.19). Le derivate delle funzioni inverse settsinh e settcosh si ot-
tengono dalla formula per la derivata della funzione inversa e utilizzando le
p p
relazioni cosh 𝑥 = sinh2 𝑥 + 1 e, per 𝑥 > 0, sinh 𝑥 = cosh2 𝑥 − 1:

1 1 1
𝐷 settsinh 𝑥 = =p =√
cosh(settsinh 𝑥) sinh2 (settsinh 𝑥) + 1 𝑥2 + 1
1 1 1
𝐷 settcosh 𝑥 = =p =√
sinh(settcosh 𝑥) cosh (settcosh 𝑥) − 1
2 𝑥 −1
2

Proposizione 5.9 (trucco di Feynman per le derivate). Siano 𝑓1 , . . . , 𝑓𝑛 funzioni


derivabili e siano 𝛼 1 , . . . , 𝛼 𝑛 esponenti reali. Allora:
!0
𝑛
Y 𝛼
𝑛
Y 𝑛
X 𝑓 𝑘0
𝑓𝑘 𝑘 = 𝑓𝑘 · 𝛼𝑘 .
𝑘=1 𝑘=1 𝑘=1
𝑓𝑘

Dimostrazione. Basta osservare che


!
𝑛
Y 𝛼
𝑛
X 𝛼 𝑘 −1
Y 𝛼𝑗
𝑛
X 𝑓 𝑘0 Y
𝑛
𝛼𝑗
𝑓𝑘 𝑘 = 𝛼 𝑘 𝑓 𝑘0 𝑓 𝑘 𝑓𝑗 = 𝛼𝑘 𝑓𝑗 .
𝑘=1 𝑘=1 𝑗≠𝑘 𝑘=1
𝑓𝑘 𝑗=1

Se ad esempio vogliamo calcolare la derivata della funzione



1 − 𝑥 2 · ln 𝑥 1
= (1 − 𝑥 2 ) 2 · ln 𝑥 · 𝑥 −1 · (cos 𝑥)−2
𝑥 · cos 𝑥
2

otteniamo

1 − 𝑥 2 · ln 𝑥 1 −2 𝑥 − sin 𝑥
 
1 1
· · + − −2 .
𝑥 · sin2 𝑥 2 1 − 𝑥 2 𝑥 ln 𝑥 𝑥 cos 𝑥
5.2 derivate parziali 181

5.2 derivate parziali

Capita a volte di avere funzioni che dipendono da più variabili o da parametri.


Ad esempio la funzione 𝑓 (𝑥, 𝑦) = 𝑥 2 𝑦 + 𝑦 2 è una funzione definita sulle coppie
di numeri reali: 𝑓 : ℝ2 → ℝ. Se considero una delle due variabili, ad esempio
la prima variabile 𝑥 , come un parametro fissato, posso identificare la funzione 𝑓
come una funzione 𝑔 : ℝ → (ℝℝ ) che ad ogni valore del parametro 𝑥 restituisce
una funzione della variabile 𝑦 :

𝑔(𝑥)(𝑦) = 𝑓 (𝑥, 𝑦).

Dunque per ogni 𝑥 fissato, posso considerare la funzione ℎ = 𝑔(𝑥) che è una
funzione della sola variabile 𝑦 : ℎ(𝑦) = 𝑔(𝑥)(𝑦) = 𝑓 (𝑥, 𝑦). E posso quindi farne
la derivata ℎ 0(𝑦) in qualunque punto 𝑦 . Il valore che ottengo si chiama derivata
parziale della funzione 𝑓 rispetto alla variabile 𝑦 calcolata nel punto (𝑥, 𝑦). Per derivata parziale
fare il calcolo della derivata possiamo applicare le usuali regole di derivazione
facendo attenzione che se stiamo facendo la derivata rispetto a 𝑦 la variabile 𝑥
va trattata come se fosse costante, perché stiamo in effetti fissando 𝑥 prima di
fare la derivata. Se 𝑓 (𝑥, 𝑦) = 𝑥 2 𝑦 + 𝑦 2 si ottiene dunque: ℎ 0(𝑦) = 𝑥 2 + 2 𝑦 . Se ora Se non siamo abituati a pensare che 𝑥
possa essere un valore fissato si provi a
consideriamo anche 𝑥 variabile otteniamo una nuova funzione di due variabili sostituire la variabile 𝑥 con una lettera
(𝑥, 𝑦) ↦→ 𝑔(𝑥)0(𝑦) = ℎ 0(𝑦) che può essere scritta cone le seguenti notazioni: diversa come 𝑐 o 𝜋 che ci dà l’idea di
una quantità costante.
𝜕 𝑓 (𝑥, 𝑦) 𝜕 𝑓 Si osservi che per le funzioni di più va-
= (𝑥, 𝑦) = 𝐷 𝑦 𝑓 (𝑥, 𝑦) = 𝑓 𝑦 (𝑥, 𝑦)
𝜕𝑦 𝜕𝑦 riabili c’è una ambiguità di fondo nelle
notazioni. Infatti se ho una espressione
= 𝐷2 𝑓 (𝑥, 𝑦) = 𝑓,2 (𝑥, 𝑦) in due variabili come 𝑥 2 𝑦 + 𝑦 2 è chiaro
= ℎ 0(𝑦) che questa rappresenta una funzione di
due variabili ma non è del tutto ovvio di-
re quale è la prima variabile e quale è la
seconda. Normalmente le variabili ven-
Analogamente potremmo fare la derivata parziale di 𝑓 rispetto alla prima
gono indicate in ordine alfabetico a par-
variabile 𝑥 . Se 𝑓 (𝑥, 𝑦) = 𝑥 2 𝑦 + 𝑦 2 si ottiene tire dalla 𝑥 ... ma è solo una convenzione.
In principio l’espressione 𝑥 2 𝑦 + 𝑦 2 po-
𝜕 𝑓 (𝑥, 𝑦) trebbe anche rappresentare una funzio-
= 2 𝑥 𝑦. ne di tre variabili 𝑥, 𝑦, 𝑧 . Dunque se ho
𝜕𝑥
una espressione che utilizza certi nomi
per le variabili è naturale usare gli stessi
Stiamo qui trattando le funzioni di più variabili come se fossero funzioni di nomi nel simbolo utilizzato per la deri-
una sola variabile dipendenti da altri parametri. Questo perché stiamo facendo vata parziale come nella notazione 𝐷 𝑦 .
Se invece le variabili non hanno un nome
un corso di analisi sulle funzioni di una variabile (reale). Per trattare tutte sarebbe più sensato indicare la variabile
le variabili come una unica variabile multidimensionale bisogna fare diverse dandone la posizione numerica come
considerazioni aggiuntive che vengono trattate nei corsi di analisi sulle funzioni nella notazione 𝐷2 . Ci sono casi in cui
di più variabili (reali). Verranno in tal caso introdotti i concetti di gradiente ∇ 𝑓 , la notazione può essere molto ambigua,
𝜕 𝑓 (𝑦,𝑥)
derivata 𝐷 𝑓 e differenziale 𝑑 𝑓 che noi non affronteremo qui. come ad esempio se scrivessi 𝜕𝑦
: sto
derivando 𝑓 rispetto alla prima varia-
bile oppure derivo 𝑓 (𝑥, 𝑦) rispetto alla
seconda variabile e poi scambio le due
variabili?
5.3 punti notevoli

In questa sezione introdurremo una terminologia che è largamente utilizzata


nello studio di funzione. Cercheremo di dare delle definizioni anche per alcuni
termini su cui potrebbe non esserci un consenso univoco. Ricordiamoci di non
usare queste definizioni in modo troppo formale: sarà sempre meglio verificare
182 5 calcolo differenziale

che il nostro interlocutore ci comprenda perché spesso alcuni termini potrebbero


essere utilizzati in maniera impropria o con significati leggermente diversi.

Nel dubbio potremo sempre evitare di utilizzare questa terminologia ricondu-


cendoci ai concetti sottostanti.

Definizione 5.10 (punti notevoli). Sia 𝑓 : 𝐴 ⊆ ℝ → ℝ una funzione. Se 𝑓 è


punto critico
derivabile in un punto 𝑥 0 ∈ 𝐴 e 𝑓 0(𝑥 0 ) = 0 diremo che 𝑥 0 è un punto critico o punto
stazionario di 𝑓 .

Se 𝑥 0 ∈ 𝐴 ed esiste un intorno 𝑈 di 𝑥 0 per cui 𝑥 0 risulta essere un punto di minimo


(rispettivamente di massimo) per 𝑓 ristretta ad 𝑈 diremo che 𝑥 0 è un punto di minimo
minimo relativo
relativo o minimo locale (rispettivamente massimo relativo o massimo locale). Per
contrapposizione i punti di massimo e minimo su tutto il dominio 𝐴 vengono anche
chiamati massimo/minimo assoluto di 𝑓 .
punto di flesso
Diremo che 𝑥 0 ∈ 𝐴 è un punto di flesso per 𝑓 se 𝑓 è derivabile in un intorno di 𝑥 0
e 𝑥 0 è un punto di massimo o minimo relativo per 𝑓 0. Nel punto 𝑥 0 la retta tangente
ha equazione 𝑦 = 𝑟(𝑥) = 𝑓 0(𝑥 0 )(𝑥 − 𝑥 0 ) + 𝑓 (𝑥 0 ). Se 𝑥 0 è minimo per 𝑓 0 risulta che
𝑓 (𝑥) − 𝑟(𝑥) è crescente quindi 𝑓 (𝑥) ≥ 𝑟(𝑥) per 𝑥 ≥ 𝑥0 e 𝑓 (𝑥) ≤ 𝑟(𝑥) per 𝑥 ≤ 𝑥 0
(il grafico della funzione attraversa la retta tangente da sotto a sopra) mentre se 𝑥 0 è
massimo per 𝑓 0 risulta che 𝑓 (𝑥) ≤ 𝑟(𝑥) per 𝑥 ≥ 𝑥 0 e 𝑓 (𝑥) ≥ 𝑟(𝑥) per 𝑥 ≤ 𝑥 0 (il
grafico della funzione attraversa la tangente da sopra a sotto). Se la funzione 𝑓 non è
flesso verticale derivabile in 𝑥 0 ma il limite del rapporto incrementale esiste ed è infinito, diremo che
𝑥0 è un flesso verticale. In tale punto la retta tangente è verticale e il grafico della
funzione attraversa tale retta.

Sia 𝑥 0 ∈ 𝐴 un punto in cui la funzione 𝑓 è continua ed esistono i limiti destro e sinistro


del rapporto incrementale (che si chiamano derivata destra e derivata sinistra)

𝑓 (𝑥 + ℎ) − 𝑓 (𝑥)
𝑚 ± = lim± .
ℎ→0 ℎ
punto angoloso Se 𝑚 + ≠ 𝑚 − chiaramente 𝑓 non è derivabile in 𝑥 0 . Se entrambi 𝑚 + ed 𝑚 − sono finiti
diremo che 𝑥 0 è un punto angoloso in quanto le due semirette tangenti in 𝑥 0 (da
punto di cuspide destra e da sinistra) formano un angolo non piatto. Se 𝑚 + = −𝑚 − = +∞ oppure se
𝑚 + = −𝑚 − = −∞ diremo che il punto 𝑥0 è un punto di cuspide (c’è una semiretta
tangente verticale).

Definizione 5.11 (asintoti). Diremo che la retta 𝑦 = 𝑚𝑥 + 𝑞 è un asintoto per il


grafico di 𝑓 per 𝑥 → +∞ se risulta

lim 𝑓 (𝑥) − (𝑚𝑥 + 𝑞) = 0.


asintoto orizzontale e obliquo 𝑥→+∞

Se 𝑚 = 0 diremo che il grafico di 𝑓 ha un asintoto orizzontale 𝑦 = 𝑞 altrimenti


diremo che 𝑦 = 𝑚𝑥 + 𝑞 è un asintoto obliquo. Stessa cosa si può dire per 𝑥 → −∞.

Se 𝑥 0 ∈ ℝ e si ha
asintoto verticale lim | 𝑓 (𝑥)| = +∞
𝑥→𝑥0

diremo che la retta 𝑥 = 𝑥 0 è un asintoto verticale per il grafico della funzione 𝑓 .


5.4 criteri di monotonia 183

Definizione 5.12 (punti di discontinuità). Se per 𝑥 0 ∈ ℝ si ha

lim 𝑓 (𝑥) = ℓ 1 , lim 𝑓 (𝑥) = ℓ 2


𝑥→𝑥 0− 𝑥→𝑥 0+

e se ℓ 1 ≠ ℓ 2 diremo che nel punto 𝑥 0 la funzione 𝑓 ha una discontinuità a salto. Se discontinuità a salto
ℓ1 = ℓ2 e se 𝑓 non è definita nel punto 𝑥 0 oppure se 𝑓 (𝑥0 ) ≠ ℓ1 diremo che nel punto 𝑥0
la funzione 𝑓 ha una discontinuità eliminabile. discontinuità eliminabile

Si osservi che, nonostante la terminologia utilizzata, una funzione continua può


𝑥
avere una discontinuità a salto (ad esempio: 𝑓 (𝑥) = |𝑥| ) e può anche avere una
discontinuità eliminabile (ad esempio: 𝑓 (𝑥) = 𝑥𝑥 ).

5.4 criteri di monotonia

Teorema 5.13 (Fermat). Sia 𝑓 : (𝑎, 𝑏) → ℝ una funzione derivabile. Se 𝑥 0 ∈ (𝑎, 𝑏)


è un punto di massimo o minimo per 𝑓 allora 𝑓 0(𝑥 0 ) = 0.

Dimostrazione. Senza perdere di generalità possiamo suppore che 𝑥 0 sia un


punto di massimo per 𝑓 . Sappiamo che

𝑓 (𝑥) − 𝑓 (𝑥 0 )
𝑓 0(𝑥0 ) = lim .
𝑥→𝑥 0 𝑥 − 𝑥0

Visto che 𝑥 0 è un punto dell’intervallo aperto (𝑎, 𝑏) la funzione 𝑓 è definita in


un intorno destro di 𝑥 0 e quindi possiamo restingere il limite ai valori 𝑥 > 𝑥 0
ottenendo:
𝑓 (𝑥) − 𝑓 (𝑥0 )
𝑓 0(𝑥0 ) = lim+ .
𝑥→𝑥 0 𝑥 − 𝑥0
Visto che 𝑥 0 è un punto di massimo per 𝑓 sappiamo che 𝑓 (𝑥) − 𝑓 (𝑥 0 ) ≤ 0.
Essendo 𝑥 − 𝑥 0 > 0 l’intero rapporto incrementale risulta essere non positivo.
Dunque, per il teorema della permanenza del segno, possiamo concludere che
𝑓 0(𝑥0 ) ≤ 0.
Ma possiamo anche restringere la funzione ad un intorno sinistro di 𝑥 0 e
osservare che
𝑓 (𝑥) − 𝑓 (𝑥0 )
𝑓 0(𝑥0 ) = lim− .
𝑥→𝑥 0 𝑥 − 𝑥0
Ma ora il numeratore è, come prima, non positivo mentre il denominatore 𝑥 − 𝑥 0
è negativo. Dunque il rapporto incrementale stavolta è non negativo e quindi,
per la permanenza del segno, 𝑓 0(𝑥 0 ) ≥ 0.
Abbiamo scoperto quindi che 𝑓 0(𝑥 0 ) ≤ 0 e 𝑓 0(𝑥 0 ) ≥ 0 da cui deduciamo
𝑓 0(𝑥0 ) = 0.

Il teorema di Fermat si può enunciare dicendo che ogni punto di massimo


o minimo relativo interno al dominio di una funzione in cui la funzione è
derivabile è necessariamente un punto critico. In particolare per determinare
massimi e minimi assoluti e relativi di una funzione sarà sufficiente esaminare i
punti di frontiera, i punti di non derivabilità e i punti critici.
184 5 calcolo differenziale

Rolle Teorema 5.14 (Rolle). Sia 𝑓 : [𝑎, 𝑏] → ℝ una funzione continua su tutto [𝑎, 𝑏] e
derivabile su (𝑎, 𝑏). Se 𝑓 (𝑎) = 𝑓 (𝑏) allora esiste 𝑥 0 ∈ (𝑎, 𝑏) tale che 𝑓 0(𝑥 0 ) = 0.

Dimostrazione. Essendo 𝑓 una funzione continua possiamo applicare il teorema


di Weiestrass per dedurre che 𝑓 ha massimo e minimo sull’intervallo chiuso e
limitato [𝑎, 𝑏]. Se il punto di massimo o il punto di minimo sta nell’intervallo
aperto (𝑎, 𝑏) possiamo applicare il teorema di Fermat per ottenere che la derivata
di 𝑓 si annulla in tale punto.

In caso contrario sia il punto di massimo che il punto di minimo sono estremi
dell’intervallo, cioè sono uguali ad 𝑎 o a 𝑏 . Ma visto che 𝑓 (𝑎) = 𝑓 (𝑏) i valori
massimo e minimo coincidono e quindi la funzione è costante. Ma in tal caso
𝑓 0(𝑥) = 0 per ogni 𝑥 ∈ [𝑎, 𝑏].
Lagrange

Teorema 5.15 (Lagrange). Sia 𝑓 : [𝑎, 𝑏] → ℝ una funzione continua su [𝑎, 𝑏] e


derivabile su (𝑎, 𝑏). Allora esiste un punto 𝑥 0 ∈ (𝑎, 𝑏) tale che

𝑓 (𝑏) − 𝑓 (𝑎)
𝑓 0(𝑥0 ) =
𝑏−𝑎

Dimostrazione. Consideriamo la funzione ausiliaria:

𝑓 (𝑏) − 𝑓 (𝑎)
𝑔(𝑥) = 𝑓 (𝑥) − 𝑥.
𝑏−𝑎
Per verifica diretta si osserva che

𝑏 𝑓 (𝑎) − 𝑎 𝑓 (𝑏)
𝑔(𝑏) = 𝑔(𝑎) = .
𝑏−𝑎
La funzione 𝑔 soddisfa quindi le ipotesi del teorema di Rolle e dunque esisterà
𝑥0 ∈ (𝑎, 𝑏) tale che 𝑔 0(𝑥0 ) = 0. Ma si osserva che

𝑓 (𝑏) − 𝑓 (𝑎)
𝑔 0(𝑥) = 𝑓 0(𝑥) −
𝑏−𝑎
criteri di monotonia
e dunque se 𝑔 0(𝑥 0 ) = 0 si ottiene il risultato desiderato.

Teorema 5.16 (criteri di monotonia). Sia 𝑓 : 𝐼 → ℝ una funzione definita su un


intervallo 𝐼 ⊆ ℝ. Sia 𝐽 = (inf 𝐼, sup 𝐼) l’intervallo aperto con gli stessi estremi di 𝐼 .
Supponiamo che 𝑓 sia continua su 𝐼 e derivabile su 𝐽 . Allora valgono i seguenti criteri:

1. (∀𝑥 ∈ 𝐽: 𝑓 0(𝑥) ≥ 0) ⇐⇒ 𝑓 è crescente (su tutto 𝐼 );


2. (∀𝑥 ∈ 𝐽: 𝑓 0(𝑥) ≤ 0) ⇐⇒ 𝑓 è decrescente (su tutto 𝐼 );
3. (∀𝑥 ∈ 𝐽: 𝑓 0(𝑥) = 0) ⇐⇒ 𝑓 è costante (su tutto 𝐼 );
4. (∀𝑥 ∈ 𝐽: 𝑓 0(𝑥) > 0) =⇒ 𝑓 è strettamente crescente (su tutto 𝐼 );
5. (∀𝑥 ∈ 𝐽: 𝑓 0(𝑥) < 0) =⇒ 𝑓 è strettamente decrescente (su tutto 𝐼 ).

Dimostrazione. Dimostriamo innanzitutto le implicazioni da sinistra verso


destra.
5.4 criteri di monotonia 185

Per la prima, se 𝑓 non fosse crescente ci dovrebbero essere due punti 𝑎, 𝑏 ∈ 𝐼


tali che 𝑎 < 𝑏 ma 𝑓 (𝑎) > 𝑓 (𝑏). Dunque si avrebbe

𝑓 (𝑏) − 𝑓 (𝑎)
< 0.
𝑏−𝑎
Applicando il teorema di Lagrange all’intervallo [𝑎, 𝑏] si troverebbe un punto
𝑥 ∈ (𝑎, 𝑏) tale che 𝑓 0(𝑥) < 0. Chiaramente (𝑎, 𝑏) ⊆ 𝐽 e quindi questo contraddice
l’ipotesi 𝑓 0(𝑥) ≥ 0.

La seconda implicazione (per le funzioni decrescenti) si dimostra in maniera


analoga cambiando verso alle disuguaglianze.

Anche la terza implicazione si dimostra tramite il teorema di Lagrange in modo


analogo alle precedenti. Oppure basta osservare che se 𝑓 0(𝑥) = 0 allora valgono
contemporaneamente 𝑓 0(𝑥) ≥ 0 e 𝑓 0(𝑥) ≤ 0 quindi mettendo insieme le prime
due implicazioni si ottiene che 𝑓 è contemporaneamente crescente e decrescente
dunque è costante.

Per la quarta implicazione si procede come per la prima. Per assurdo si avrebbero
𝑎 < 𝑏 con 𝑓 (𝑏) ≤ 𝑓 (𝑎). Ma allora

𝑓 (𝑏) − 𝑓 (𝑎)
≤0
𝑏−𝑎
e applicando il teorema di Lagrange si troverebbe un punto 𝑥 ∈ (𝑎, 𝑏) con
𝑓 0(𝑥) ≤ 0, contro l’ipotesi 𝑓 0(𝑥) > 0.

La quinta implicazione si dimostra in maniera analoga cambiando verso alle


disuguaglianze.

Vediamo ora le implicazioni da destra verso sinistra. Per la prima, supponiamo


che 𝑓 sia crescente e prendiamo 𝑥 ∈ 𝐽 . Allora è chiaro che per ogni ℎ > 0 si avrà
𝑓 (𝑥 + ℎ) ≥ 𝑓 (𝑥) e dunque

𝑓 (𝑥 + ℎ) − 𝑓 (𝑥)
≥ 0.

Facendo il limite per ℎ → 0+ si ottiene 𝑓 0(𝑥) e, per la permanenza del segno,
dovra essere 𝑓 0(𝑥) ≥ 0.

In maniera analoga (invertendo le disuguaglianze) si dimostra la seconda


implicazione.

La terza discende dalle prime due oppure, più semplicemente, dalle regole di
derivazione, in quanto la derivata di una costante è zero.

Esempio 5.17. La funzione 𝑓 (𝑥) = 1/𝑥 è definita su ℝ \ {0}, è derivabile e la derivata


𝑓 0(𝑥) = −1/𝑥 2 è ovunque negativa. La funzione 𝑓 è quindi strettamente decrescente
separatamente sui due intervalli (0 , +∞) e (−∞, 0) sui quali possiamo applicare il
criterio di monotonia. Ma non è decrescente su tutto il suo dominio in quanto, ad
esempio, 𝑓 (−1) = −1 < 1 = 𝑓 (1). Questo esempio mostra che nei criteri di monotonia
l’ipotesi che il dominio sia un intervallo è fondamentale.
186 5 calcolo differenziale

Esercizio 5.18. Determinare base e altezza di una lattina cilindrica di volume 33 𝑐𝑙


che a parità di volume ha la minima superficie totale.

Svolgimento. Sia 𝑉 il volume, 𝑆 l’area della superficie totale, ℎ l’altezza e 𝑟 il


raggio di base del cilindro. Sappiamo che

𝑉 = 𝜋ℎ𝑟 2 𝑆 = 2𝜋𝑟 ℎ + 2𝜋𝑟 2 .

Ricavando ℎ dalla prima equazione e sostituendo nella seconda otteniamo

𝑉 2𝑉
𝑆 = 2𝜋𝑟 + 2𝜋𝑟 2 = + 2𝜋𝑟 2 .
𝜋𝑟 2 𝑟
La funzione 𝑆(𝑟) è definita e continua su (0 , +∞) e si ha 𝑆(𝑟) → +∞ per 𝑟 → 0+
e anche per 𝑟 → +∞. Dunque 𝑆 ammette minimo per il teorema di Weierstrass
generalizzato. Per trovare il minimo basterà calcolare la derivata

𝑑𝑆 2𝑉 4𝜋𝑟 3 − 2𝑉
= − 2 + 4𝜋𝑟 =
𝑑𝑟 𝑟 𝑟2
e trovare i punti critici
4𝜋𝑟 3 = 2𝑉
da cui
r
𝑉3
𝑟= ≈ 3.74 𝑐𝑚
2𝜋
𝑉
ℎ= ≈ 7.49 𝑐𝑚.
𝜋𝑟 2

Esercizio 5.19. Risolvere l’equazione

𝑒 𝑥 = 𝑥3 . (5.2)

Svolgimento. Il lato sinistro dell’equazione è un numero positivo e quindi


certamente possiamo supporre che sia 𝑥 > 0 altrimenti il lato destro non
sarebbe anch’esso positivo. Possiamo quindi prendere il logaritmo di ambo i
membri e ottenere l’equazione

𝑥 = 3 ln 𝑥

che è equivalente all’equazione data.

Consideriamo allora la funzione

𝑓 (𝑥) = 𝑥 − 3 ln 𝑥

cosicché le soluzioni cercate risultano essere gli zeri di 𝑓 . Si ha

3
𝑓 0(𝑥) = 1 −
𝑥
5.4 criteri di monotonia 187

e possiamo quindi affermare che 𝑓 0(𝑥) ≷ 0 se e solo se Il simbolo ≷ serve per indicare che que-
sta diseguazione e le seguenti possono
3 essere scritte sia con il segno > che con
1≷ il segno < pur di prendere in tutte lo
𝑥
stesso segno.
ovvero (ricordiamo che stiamo supponendo 𝑥 > 0)

𝑥 ≷ 3.

Cioè: se 𝑥 > 3 si ha 𝑓 0(𝑥) > 0 e di conseguenza (teorema 5.16) 𝑓 è strettamente


crescente se ristretta all’intervallo [3 , +∞), se invece 𝑥 < 3 si ha 𝑓 0(𝑥) < 0 e di
conseguenza 𝑓 è strettamente decrescente se ristretta all’intervallo (0 , 3]. Per
capire se la funzione 𝑓 si annulla in qualche punto dobbiamo ora valutare 𝑓
negli estremi degli intervalli su cui risulta monotona. Si ha

lim 𝑓 (𝑥) = +∞, 𝑓 (3) = 3(1 − ln 3) < 0, lim 𝑓 (𝑥) = +∞.


𝑥→0+ 𝑥→+∞

Osserviamo quindi che agli estremi degli intervalli (0 , 3] e [3 , +∞) la funzione


assume segni opposti e quindi, per il teorema degli zeri (teorema 2.80), deve
annullarsi almeno una volta in ognuno dei due intervalli. D’altra parte su
ognuno dei due intervalli la funzione è strettamente monotona e quindi iniettiva,
dunque non può annullarsi più di una volta. Deduciamo quindi che la funzione
𝑓 si annulla in esattamente due punti 𝑥1 , 𝑥2 con

0 < 𝑥1 < 3 < 𝑥2 .

I punti 𝑥 1 e 𝑥 2 sono quindi univocamente determinati e possono essere calcolati,


con un errore piccolo a piacere, utilizzando il metodo di bisezione, come
abbiamo visto nella dimostrazione del teorema degli zeri.

Esempio 5.20. Si consideri la funzione

1
𝑓 (𝑥) = arctg 𝑥 + arctg .
𝑥
Si ha
1 1 −1 1 1
𝑓 0(𝑥) = + = − 2 = 0.
1+𝑥 2
1 + 𝑥2 𝑥
1 2 1+𝑥 2 𝑥 +1

Osserviamo che la funzione 𝑓 è definita su ℝ \ {0} che non è un intervallo ma è unione


di due intervalli disgiunti: (−∞, 0) ∪ (0 , +∞). Possiamo allora applicare i criteri di
monotonia separatamente ai due intervalli ottenendo che 𝑓 (𝑥) è costante su ognuno dei
due intervalli. Dunque esisteranno 𝑐 1 e 𝑐 2 tali che
(
𝑐1 se 𝑥 > 0,
𝑓 (𝑥) =
𝑐2 se 𝑥 < 0.

Possiamo determinare facilmente 𝑐 1 e 𝑐 2 osservando che


𝜋
𝑐 1 = 𝑓 (1) = arctg 1 + arctg 1 =
2
𝜋
𝑐 2 = 𝑓 (−1) = arctg(−1) + arctg(−1) = − .
2
188 5 calcolo differenziale

In effetti la funzione 𝑓 pur avendo derivata nulla non è costante ma solo


localmente costante.

Esempio 5.21. Consideriamo la funzione 𝑓 (𝑥) = 𝑥 3 la cui derivata è 𝑓 0(𝑥) = 3 𝑥 2 . Per


ogni 𝑥 ∈ ℝ si ha 𝑓 0(𝑥) ≥ 0 dunque possiamo dedurre che 𝑓 è crescente. Scelto invece
𝐼 = [0 , +∞) l’intervallo aperto corrispondente è 𝐽 = (0 , +∞). Osserviamo che su 𝐽 si
ha 𝑓 0(𝑥) > 0 quindi possiamo concludere che 𝑓 è strettamente crescente su tutto 𝐼 . Lo
stesso vale per l’intervallo (−∞, 0]. Mettendo insieme le due cose possiamo concludere
che 𝑓 (𝑥) = 𝑥 3 è strettamente crescente su tutto ℝ nonostante che sia 𝑓 0(0) = 0. Questo
mostra che una funzione strettamente monotona può avere derivata nulla in un punto.

Più in generale è facile osservare che se 𝑓 è monotona ma non strettamente


monotona significa che ci sono due punti 𝑎 e 𝑏 per cui 𝑓 (𝑎) = 𝑓 (𝑏). Ma se
𝑓 è monotona allora per ogni 𝑥 ∈ [𝑎, 𝑏] si deve avere 𝑓 (𝑥) = 𝑓 (𝑎) = 𝑓 (𝑏)
(ad esempio: se 𝑓 è crescente si dovrebbe avere 𝑓 (𝑎) ≤ 𝑓 (𝑥) ≤ 𝑓 (𝑏) ma se
𝑓 (𝑎) = 𝑓 (𝑏) necessariamente 𝑓 (𝑥) = 𝑓 (𝑎) = 𝑓 (𝑏)). Dunque 𝑓 risulterebbe essere
costante su [𝑎, 𝑏] e in particolare avremmo una infinità più che numerabile
di punti in cui la derivata si annulla. Questo significa che se 𝑓 0(𝑥) ≥ 0 su un
intervallo e se 𝑓 0(𝑥) = 0 su un numero finito o anche numerabile di punti o,
ancora, su un insieme di punti con parte interna vuota, allora comunque 𝑓 è
strettamente crescente. Ragionamento analogo vale naturalmente anche per le
funzioni decrescenti.

Esercizio 5.22. Dimostrare che

𝑥2
cos 𝑥 ≥ 1 − ∀𝑥 ∈ ℝ.
2

Esercizio 5.23. Si consideri la funzione 𝑓 : ℝ → ℝ definita da

𝑓 (𝑥) = 2𝑒 𝑥−1 − 𝑥 2 .

Si mostri che 𝑓 è bigettiva e che la funzione inversa 𝑓 −1 : ℝ → ℝ è derivabile in tutti i


punti tranne il punto 1 dove ha un flesso verticale. Si calcoli ( 𝑓 −1 )0(2/𝑒).

Svolgimento. Risulta

𝑓 0(𝑥) = 2 𝑒 𝑥−1 − 2𝑥, 𝑓 00(𝑥) = 2𝑒 𝑥−1 − 2.

Dunque 𝑓 00(𝑥) > 0 per 𝑥 > 1 e 𝑓 00(𝑥) < 0 per 𝑥 < 1. Dunque per i criteri di
monotonia 𝑓 0 è strettamente crescente su [1 , +∞) e strettamente decrescente
su (−∞, 1]. Visto che 𝑓 0(1) = 0 risulta quindi che 𝑓 0(𝑥) ≥ 0 per ogni 𝑥 ∈ ℝ e
𝑓 0(𝑥) = 0 solo per 𝑥 = 1. Dunque 𝑓 è crescente per il criterio di monotonia ma
anche strettamente crescente perché se fosse crescente ma non strettamente ci
dovrebbe essere un intero intervallo in cui 𝑓 0 si annulla. Dunque 𝑓 è iniettiva.
Visto che 𝑓 (𝑥) → ±∞ per 𝑥 → ±∞ si ha sup 𝑓 (ℝ) = +∞, inf 𝑓 (ℝ) = −∞ e per
il teorema dei valori intermedi otteniamo che 𝑓 (ℝ) = ℝ. Dunque 𝑓 è anche
suriettiva ed è quindi invertibile.
La funzione inversa di 𝑓 è anch’essa monotona, è quindi continua per il
Teorema 2.8 ed è derivabile nei punti corrispondenti ai punti in cui 𝑓 ha derivata
5.4 criteri di monotonia 189

Figura 5.2: Il grafico di una funzione


derivabile ma con derivata non continua
0.2
(vedi esempio 5.25). L’ingrandimento
nel disegno in basso rende evidente il
0.1 fatto che la derivata oscilla tra i valori
−1 e 1 in ogni intorno di 0. La proprietà
di Darboux (teorema 5.24) rimane
-0.6 -0.5 -0.4 -0.3 -0.2 -0.1 0.1 0.2 0.3 0.4 0.5 0.6 0.7
comunque soddisfatta: la derivata
assume tutti i valori compresi tra 1 e
-0.1
−1 in ogni intorno di 𝑥 = 0 ma non ha
limite per 𝑥 → 0.
-0.2

0.0031 0.0032 0.0033 0.0034 0.0035 0.0036 0.0037 0.0038 0.0039 0.004 0.0041 0.0042 0.0043 0.0044 0.0045 0.0046 0.0047 0.0048 0.0049 0.005 0.0051 0.0052 0.0053 0.0054 0.0055

(interagisci)

non nulla. L’unico punto in cui 𝑓 ha derivata nulla è 𝑥 = 1 e visto che 𝑓 (1) = 1
risulta che 𝑓 −1 (𝑦) è derivabile per ogni 𝑦 ≠ 1 e vale

1 1
( 𝑓 −1 )0( 𝑓 (𝑥)) = = .
𝑓 0(𝑥) 2 𝑒 𝑥−1 − 2 𝑥

Osservando che 𝑓 (0) = 2/𝑒 si trova quindi

1 𝑒
( 𝑓 −1 )0(1/𝑒) = = .
2/𝑒 2

Teorema 5.24 (proprietà di Darboux). Sia 𝑓 : 𝐼 → ℝ una funzione derivabile su


un intervallo 𝐼 ⊆ ℝ. Allora la derivata soddisfa la proprietà dei valori intermedi: se
𝑎, 𝑏 ∈ 𝐼 , 𝑎 < 𝑏 e se 𝑚 è un valore intermedio tra 𝑓 0(𝑎) e 𝑓 0(𝑏) (cioè 𝑓 0(𝑎) < 𝑚 < 𝑓 0(𝑏)
o 𝑓 0(𝑏) < 𝑚 < 𝑓 0(𝑎)) allora esiste 𝑥 ∈ (𝑎, 𝑏) tale che 𝑓 0(𝑥) = 𝑚 .

Dimostrazione. Dati 𝑥, 𝑦 ∈ [𝑎, 𝑏], 𝑥 ≠ 𝑦 , possiamo considerare il rapporto


incrementale:
𝑓 (𝑦) − 𝑓 (𝑥)
𝑅(𝑥, 𝑦) = .
𝑦−𝑥
Fissato 𝑥 = 𝑎 la funzione 𝑦 ↦→ 𝑅(𝑎, 𝑦) è continua e tende a 𝑓 0(𝑎) quando 𝑦
tende ad 𝑎 . Dunque, per il teorema 2.80 dei valori intermedi, tale funzione
assume tutti i valori compresi tra 𝑓 0(𝑎) e 𝑅(𝑎, 𝑏). Analogamente fissato 𝑦 = 𝑏 la
funzione 𝑥 ↦→ 𝑅(𝑥, 𝑏) è continua e tende a 𝑓 0(𝑏) quando 𝑥 tende a 𝑏 . Dunque
tale funzione assume tutti i valori intermedi tra 𝑅(𝑎, 𝑏) e 𝑓 0(𝑏). Dunque esistono
𝑥, 𝑦 tali che 𝑅(𝑥, 𝑦) = 𝑚 e, per il teorema 5.15 di Lagrange esisterà un punto
intermedio 𝑡 ∈ (𝑥, 𝑦) in cui 𝑓 0(𝑡) = 𝑅(𝑥, 𝑦) = 𝑚 .

Esempio 5.25 (funzione derivabile con derivata non continua). La funzione


𝑓 : ℝ → ℝ definita da
(
𝑥 2 sin(1/𝑥) se 𝑥 ≠ 0
𝑓 (𝑥) =
0 se 𝑥 = 0.
190 5 calcolo differenziale

è derivabile su tutto ℝ, 𝑓 0(0) = 0 ma il limite

lim 𝑓 0(𝑥)
𝑥→0

non esiste (e dunque 𝑓 0 : ℝ → ℝ non è continua in 𝑥 = 0).

Dimostrazione. La funzione 𝑥 2 sin(1/𝑥) è derivabile infinite volte su tutto il suo


dominio ℝ \ {0} in quanto composizione di funzioni elementari derivabili
infinite volte. Dunque, per la località della derivata, anche la funzione 𝑓 è
derivabile infinite volte su ℝ \ {0}. Per 𝑥 ≠ 0 possiamo quindi calcolare 𝑓 0(𝑥)
utilizzando le regole di derivazione
   
0 1 1 1 −1 1 1
𝑓 (𝑥) = 𝐷 𝑥 sin2
= 2 𝑥 sin + 𝑥 2 cos · 2 = 2 𝑥 sin − cos .
𝑥 𝑥 𝑥 𝑥 𝑥 𝑥

Verifichiamo ora che 𝑓 è continua e derivabile anche in 0. Si ha infatti

𝑓 (0 + ℎ) − 𝑓 (0) 1
lim = lim ℎ sin = 0
ℎ→0 ℎ ℎ→0 ℎ

e dunque 𝑓 0(0) = 0. Osserviamo però che 𝑓 0(𝑥) non ammette limite per 𝑥 → 0
in quanto per 𝑥 → 0 si ha 2 𝑥 sin(1/𝑥) → 0 ma il limite di cos(1/𝑥) invece non
esiste. Dunque 𝑓 0(𝑥) è la somma di una funzione che ha limite zero e di una
funzione il cui limite non esiste per 𝑥 → 0. Dunque 𝑓 0(𝑥) non ammette limite
per 𝑥 → 0.

Proposizione 5.26 (criterio di derivabilità). Sia 𝐼 ⊆ ℝ un intervallo, 𝑥 0 ∈ 𝐼


𝑓 : 𝐼 → ℝ una funzione continua su tutto 𝐼 e derivabile in 𝐼 \ {𝑥 0 }. Se il limite della
derivata
lim 𝑓 0(𝑥) = 𝑚
𝑥→𝑥 0

esiste ed è finito la funzione 𝑓 è derivabile anche in 𝑥 0 e vale 𝑓 0(𝑥 0 ) = 𝑚 .

Dimostrazione. Prendiamo un generico punto 𝑥 > 𝑥 0 (il caso 𝑥 < 𝑥 0 è del tutto
analogo). Per il teorema di Lagrange sappiamo esistere un punto 𝑦 ∈ (𝑥 0 , 𝑥)
tale che
𝑓 (𝑥) − 𝑓 (𝑥0 )
= 𝑓 0(𝑦).
𝑥 − 𝑥0
Per 𝑥 → 𝑥 0 si ha certamente anche 𝑦 → 𝑥 0 e dunque esiste il limite del rapporto
incrementale:

𝑓 (𝑥) − 𝑓 (𝑥0 )
𝑓 0(𝑥0 ) = lim = lim 𝑓 0(𝑦) = 𝑚.
𝑥→𝑥 0 𝑥 − 𝑥0 𝑦→𝑥0

La proposizione precedente dice che la derivata di una funzione in un punto


non può avere un valore diverso dal suo limite, se tale limite esiste. Esistono
però funzioni derivabili la cui derivata non è continua, come abbiamo visto
nell’esempio 5.25 in quanto il limite della derivata potrebbe non esistere.
5.5 convessità 191

5.5 convessità

Definizione 5.27 (funzione convessa). Sia 𝐼 ⊆ ℝ un intervallo. Una funzione


𝑓 : 𝐼 → ℝ si dice essere convessa se per ogni 𝑥, 𝑦 ∈ 𝐼 e per ogni 𝑡 ∈ [0 , 1] si ha funzione convessa

𝑓 ((1 − 𝑡)𝑥 + 𝑡 𝑦) ≤ (1 − 𝑡) 𝑓 (𝑥) + 𝑡 𝑓 (𝑦).

Analogamente diremo che 𝑓 è concava se vale la disuguaglianza inversa: funzione concava

𝑓 ((1 − 𝑡)𝑥 + 𝑡 𝑦) ≥ (1 − 𝑡) 𝑓 (𝑥) + 𝑡 𝑓 (𝑦)

(o, equivalentemente, se − 𝑓 è convessa).

Osserviamo che la retta del piano passante per i punti (𝑥, 𝑓 (𝑥)) e (𝑦, 𝑓 (𝑦)) può
essere parametrizzata in maniera uniforme per 𝑡 ∈ ℝ da

(1 − 𝑡)(𝑥, 𝑓 (𝑥)) + 𝑡(𝑦, 𝑓 (𝑦)) = ((1 − 𝑡)𝑥 + 𝑡 𝑦, (1 − 𝑡) 𝑓 (𝑥) + 𝑡 𝑓 (𝑦)).

Chiaramente per 𝑡 = 0 si ottiene il punto (𝑥, 𝑓 (𝑥)) per 𝑡 = 1 il punto (𝑦, 𝑓 (𝑦)) e
per 𝑡 ∈ [0 , 1] il segmento congiungente tali punti. La condizione di convessità
della funzione 𝑓 corrisponde quindi a richiedere che ogni corda (segmento) che
unisce due punti del grafico si trovi "al di sopra" del grafico della funzione.

Definizione 5.28 (insieme convesso). Un insieme 𝐸 ⊆ ℝ𝑛 si dice essere convesso se convesso


dati due punti qualunque 𝑎, 𝑏 ∈ 𝐸 l’intero segmento [𝑎, 𝑏] = {(1 − 𝑡)𝑎 + 𝑡𝑏 : 𝑡 ∈ [0 , 1]}
è contenuto in 𝐸 .

Teorema 5.29 (epigrafico delle funzioni convesse). Sia 𝐼 ⊆ ℝ e 𝑓 : 𝐼 ⊆ ℝ → ℝ


una funzione. Allora sono equivalenti:
1. 𝐼 è un intervallo e 𝑓 è convessa;
2. l’epigrafico di 𝑓 (o sopragrafico) ovvero l’insieme
epigrafico di 𝑓

𝐸 = (𝑥, 𝑦) ∈ ℝ : 𝑥 ∈ 𝐼, 𝑦 ≥ 𝑓 (𝑥)
2


è convesso.
Per le funzioni concave sarà il sottografico {(𝑥, 𝑦) : 𝑦 ≤ 𝑓 (𝑥)} ad essere convesso.

Dimostrazione. Supponiamo che 𝐼 sia un intervallo e 𝑓 sia convessa. Per di-


mostrare che l’epigrafico 𝐸 è convesso consideriamo due punti 𝑎, 𝑏 ∈ 𝐸 e un
qualunque punto 𝑝 sul segmento [𝑎, 𝑏]. Se 𝑎 = (𝑥 𝑎 , 𝑦 𝑎 ), 𝑏 = (𝑥 𝑏 , 𝑦𝑏 ), 𝑝 = (𝑥 𝑝 , 𝑦 𝑝 )
allora esiste un 𝑡 ∈ [0 , 1] tale che 𝑥 𝑝 = (1 − 𝑡)𝑥 𝑎 + 𝑡𝑥 𝑏 e 𝑦 𝑝 = (1 − 𝑡)𝑦 𝑎 + 𝑡 𝑦𝑏 . Visto
che 𝑎, 𝑏 ∈ 𝐸 sappiamo che 𝑦 𝑎 ≥ 𝑓 (𝑥 𝑎 ) e 𝑦𝑏 ≥ 𝑓 (𝑥 𝑏 ). Dunque necessariamente
si ha
𝑦 𝑝 ≥ (1 − 𝑡) 𝑓 (𝑥 𝑎 ) + 𝑡 𝑓 (𝑦𝑏 ).
Ma essendo 𝑓 convessa si ha:

(1 − 𝑡) 𝑓 (𝑥 𝑎 ) + 𝑡 𝑓 (𝑦𝑏 ) ≥ 𝑓 ((1 − 𝑡)𝑥 𝑎 + 𝑡𝑥 𝑏 ) = 𝑓 (𝑥 𝑝 ).

Dunque 𝑦 𝑝 ≥ 𝑓 (𝑥 𝑝 ) che significa 𝑝 ∈ 𝐸 .


192 5 calcolo differenziale

Viceversa supponiamo di sapere che 𝐸 è convesso. Siano 𝑥, 𝑦 ∈ 𝐼 punti


qualunque. Allora i punti 𝑎 = (𝑥, 𝑓 (𝑥)) e 𝑏 = (𝑦, 𝑓 (𝑦)) sono certamente punti
di 𝐸 e quindi l’intero segmento [𝑎, 𝑏] deve essere contenuto in 𝐸 . Dunque per
ogni 𝑡 ∈ [0 , 1] il punto 𝑝 = ((1 − 𝑡)𝑥 + 𝑡 𝑦, (1 − 𝑡) 𝑓 (𝑥) + 𝑡 𝑓 (𝑦)) deve stare in 𝐸 .
In primo luogo deve quindi essere (1 − 𝑡)𝑥 + 𝑡 𝑦 ∈ 𝐼 e se questo è vero per ogni
𝑡 ∈ [0 , 1] significa che 𝐼 è un intervallo. In secondo luogo se 𝑝 ∈ 𝐸 significa che

(1 − 𝑡) 𝑓 (𝑥) + 𝑡 𝑓 (𝑦) ≥ 𝑓 ((1 − 𝑡)𝑥 + 𝑡 𝑦)

che corrisponde alla definizione di funzione convessa.

Lemma 5.30 (rapporto incrementale di una funzione convessa). Sia 𝐼 un intervallo


di ℝ e sia 𝑓 : 𝐼 → ℝ. Dati 𝑥, 𝑦 ∈ 𝐼 con 𝑥 ≠ 𝑦 definiamo il rapporto!incrementale di
𝑓 come:
𝑓 (𝑦) − 𝑓 (𝑥)
𝑅(𝑥, 𝑦) = .
𝑦−𝑥
Allora sono condizioni equivalenti:

1. 𝑓 è convessa;
2. per ogni 𝑥, 𝑦, 𝑧 ∈ 𝐼 se 𝑥 < 𝑦 < 𝑧 si ha 𝑅(𝑥, 𝑦) ≤ 𝑅(𝑦, 𝑧);
3. per ogni 𝑥, 𝑦, 𝑧 ∈ 𝐼 se 𝑥 < 𝑦 < 𝑧 si ha 𝑅(𝑥, 𝑦) ≤ 𝑅(𝑥, 𝑧);
4. per ogni 𝑥, 𝑦, 𝑧 ∈ 𝐼 se 𝑥 < 𝑦 < 𝑧 si ha 𝑅(𝑥, 𝑧) ≤ 𝑅(𝑦, 𝑧);
5. la funzione 𝑅(𝑥, 𝑦) è crescente in ognuna delle due variabili.

Dimostrazione. Attenzione: il lemma risulta ovvio se si utilizza la giusta in-


terpretazione geometrica (il rapporto incrementale è la pendenza della corda
corrispondente). Quella che segue è la traduzione algebrica di quanto è geo-
metricamente ovvio ma risulta inevitabilmente pesante e più difficilmente
comprensibile.

Siano 𝑥, 𝑦, 𝑧 ∈ 𝐼 con 𝑥 < 𝑦 < 𝑧 . Posto 𝑡 = (𝑦 − 𝑥)/(𝑧 − 𝑥) si ha 𝑦 = (1 − 𝑡)𝑥 + 𝑡𝑧 ,


𝑦 − 𝑥 = 𝑡(𝑧 − 𝑥), 𝑧 − 𝑦 = (1 − 𝑡)(𝑧 − 𝑥). Si ha allora

𝑓 (𝑧) − 𝑓 (𝑥) 𝑓 (𝑦) − 𝑓 (𝑥)


𝑅(𝑥, 𝑧) − 𝑅(𝑥, 𝑦) = −
𝑧−𝑥 𝑦−𝑥
𝑓 (𝑧) − 𝑓 (𝑥) 𝑓 (𝑦) − 𝑓 (𝑥)
=𝑡 −
𝑦−𝑥 𝑦−𝑥
𝑡 𝑓 (𝑧) + (1 − 𝑡) 𝑓 (𝑥) − 𝑓 (𝑦)
=
𝑦−𝑥

La condizione di convessità di 𝑓 è

𝑓 (𝑦) ≤ (1 − 𝑡) 𝑓 (𝑥) + 𝑡 𝑓 (𝑧)

ed è quindi equivalente alla condizione 𝑅(𝑥, 𝑦) ≤ 𝑅(𝑥, 𝑧). Dunque le condizioni


1 e 3 sono equivalenti.

Ma con una verifica diretta si osserva che

𝑅(𝑥, 𝑧) = 𝑡𝑅(𝑥, 𝑦) + (1 − 𝑡)𝑅(𝑦, 𝑧)


5.5 convessità 193

da cui si ottiene

𝑅(𝑦, 𝑧) − 𝑅(𝑥, 𝑧) = 𝑡[𝑅(𝑦, 𝑧) − 𝑅(𝑥, 𝑦)]

oppure anche

𝑅(𝑥, 𝑧) − 𝑅(𝑥, 𝑦) = (1 − 𝑡)[𝑅(𝑦, 𝑧) − 𝑅(𝑥, 𝑦)].

Risulta quindi che le quantità

𝑅(𝑦, 𝑧) − 𝑅(𝑥, 𝑦), 𝑅(𝑥, 𝑧) − 𝑅(𝑥, 𝑦), 𝑅(𝑦, 𝑧) − 𝑅(𝑥, 𝑧)

hanno tutte lo stesso segno. E quindi le condizioni 2, 3 e 4 sono tra loro


equivalenti (se vale una delle tre valgono tutte e tre).

Se valgono le tre condizioni 2, 3 e 4 è facile verificare che la funzione 𝑅(𝑥, 𝑦)


è crescente in entrambe le variabili. Innanzitutto per simmetria, visto che
𝑅(𝑥, 𝑦) = 𝑅(𝑦, 𝑥), è sufficiente verificare che 𝑅(𝑥, 𝑦) è crescente nella seconda
variabile 𝑦 per ogni 𝑥 fissato. Quindi dato 𝑧 > 𝑦 bisogna mostrare che
𝑅(𝑥, 𝑧) ≥ 𝑅(𝑥, 𝑦). Abbiamo allora tre possibilità a seconda che sia 𝑥 < 𝑦
oppure 𝑦 < 𝑥 < 𝑧 oppure 𝑧 < 𝑥 . Nel primo caso si ha 𝑥 < 𝑦 < 𝑧 e dunque la
disuguaglianza 𝑅(𝑥, 𝑦) ≤ 𝑅(𝑥, 𝑧) corrisponde alla condizione 3. Nel secondo
caso si ha 𝑦 < 𝑥 < 𝑧 e la condizione 𝑅(𝑥, 𝑦) ≤ 𝑅(𝑥, 𝑧) si può scrivere come
𝑅(𝑦, 𝑥) ≤ 𝑅(𝑥, 𝑧) che è, riordinando opportunamente le variabili, la condizione
2. Se, infine, 𝑦 < 𝑧 < 𝑥 la condizione 𝑅(𝑥, 𝑦) ≤ 𝑅(𝑥, 𝑧) si può scrivere
𝑅(𝑦, 𝑥) ≤ 𝑅(𝑧, 𝑥) che, riordinando le variabili, è la condizione 4.

Viceversa (e infine) se la funzione 𝑅(𝑥, 𝑦) è crescente in entrambe le variabili


in particolare è crescente nella seconda variabile e quindi se 𝑥 < 𝑦 < 𝑧 si ha
𝑅(𝑥, 𝑦) ≤ 𝑅(𝑥, 𝑧). Risulta quindi che la condizione 5 implica la 3 e quindi tutte
le altre condizioni.

Teorema 5.31. Sia 𝐼 ⊆ ℝ un intervallo e 𝑓 : 𝐼 → ℝ una funzione derivabile su tutto


𝐼 . Allora sono equivalenti:

1. 𝑓 è convessa;
2. per ogni 𝑥 0 ∈ 𝐼 e per ogni 𝑥 ∈ 𝐼 si ha

𝑓 (𝑥) ≥ 𝑓 0(𝑥0 )(𝑥 − 𝑥0 ) + 𝑓 (𝑥0 )

(geometricamente: il grafico della funzione sta sopra la retta tangente);


3. 𝑓 0 è crescente.

Analogamente per le funzioni concave si avrà che il grafico “sta sotto” la retta tangente
e che la derivata è decrescente.

Dimostrazione. Osserviamo che

𝑓 0(𝑥 0 ) = lim 𝑅(𝑥0 , 𝑥).


𝑥→𝑥0

Se 𝑓 è convessa allora, per il lemma, il rapporto incrementale 𝑅(𝑥 0 , 𝑥) è crescente


e quindi 𝑓 0(𝑥 0 ) = inf 𝑥>𝑥0 𝑅(𝑥 0 , 𝑥). In particolare 𝑓 0(𝑥 0 ) ≤ 𝑅(𝑥 0 , 𝑥) per ogni
194 5 calcolo differenziale

𝑥 > 𝑥0 . In maniera analoga si trova 𝑓 0(𝑥 0 ) ≥ 𝑅(𝑥0 , 𝑥) se 𝑥 < 𝑥0 . In ogni caso


risulta quindi che per ogni 𝑥 si ha

(𝑅(𝑥0 , 𝑥) − 𝑓 0(𝑥0 ))(𝑥 − 𝑥0 ) ≥ 0

ovvero
𝑓 (𝑥) − 𝑓 (𝑥0 ) − 𝑓 0(𝑥0 )(𝑥 − 𝑥0 ) ≥ 0.
Dunque la condizione 1 implica la 2.

Se vale la condizione 2, dati 𝑥, 𝑦 ∈ 𝐼 si ha

𝑓 (𝑥) − 𝑓 (𝑦) ≥ 𝑓 0(𝑦)(𝑥 − 𝑦)

se scambiamo 𝑥 e 𝑦 e cambiamo di segno ambo i membri si ottiene invece

𝑓 (𝑥) − 𝑓 (𝑦) ≤ 𝑓 0(𝑥)(𝑥 − 𝑦)

mettendo insieme le due disuguaglianze, se ora supponiamo che sia 𝑥 > 𝑦


otteniamo proprio 𝑓 0(𝑥) ≥ 𝑓 0(𝑦) cioè 𝑓 0 è crescente (condizione 3).

Supponiamo ora di sapere che 𝑓 0 è crescente e supponiamo per assurdo che


la funzione 𝑓 non sia convessa. In base al lemma precedente dovrebbero
allora esistere tre punti 𝑥 < 𝑦 < 𝑧 tali che 𝑅(𝑥, 𝑦) > 𝑅(𝑦, 𝑧). Per il teorema di
Lagrange dovrebbe allora esistere un punto 𝑐 ∈ (𝑥, 𝑦) tale che 𝑓 0(𝑐) = 𝑅(𝑥, 𝑦) e
un punto 𝑑 ∈ (𝑦, 𝑧) tale che 𝑓 0(𝑑) = 𝑅(𝑦, 𝑧) ma allora 𝑓 0(𝑐) > 𝑓 0(𝑑) nonostante
sia 𝑐 < 𝑑 e dunque 𝑓 0 non poteva essere crescente.

Corollario 5.32 (criterio di convessità tramite derivata seconda). Sia 𝐼 ⊆ ℝ


un intervallo e sia 𝑓 : 𝐼 → ℝ una funzione derivabile due volte (cioè 𝑓 è derivabile
e anche 𝑓 0 è derivabile). Allora 𝑓 è convessa se e solo se 𝑓 00(𝑥) ≥ 0 per ogni 𝑥 ∈ 𝐼 .
Analogamente 𝑓 è concava se e solo se 𝑓 00 ≤ 0.

Dimostrazione. Per il criterio precedente 𝑓 è convessa se e solo se 𝑓 0 è crescente.


Per il criterio di monotonia 𝑓 0 è crescente se e solo se 𝑓 00 ≥ 0. Considerazioni
analoghe valgono per la concavità.

Teorema 5.33. Siano 𝑎 ∈ ℝ, 𝑏 ∈ ℝ̄, 𝑎 < 𝑏 . Sia 𝑓 : [𝑎, 𝑏) → ℝ una funzione


convessa in (𝑎, 𝑏) e continua in 𝑎 . Allora 𝑓 è convessa su tutto [𝑎, 𝑏). Risultato analogo
vale per funzioni definite su intervalli aperti a sinistra (𝑎, 𝑏] e aperti da ambo i lati
(𝑎, 𝑏).

Dimostrazione. Dati 𝑥, 𝑦 ∈ [𝑎, 𝑏) dobbiamo mostrare che per ogni 𝑡 ∈ [0 , 1] vale

𝑓 ((1 − 𝑡)𝑥 + 𝑡 𝑦) ≤ (1 − 𝑡) 𝑓 (𝑥) + 𝑡 𝑓 (𝑦).

Per ipotesi sappiamo che la disuguaglianza è valida se 𝑥, 𝑦 ∈ (𝑎, 𝑏). Dobbiamo


quindi dimostrare la disuguaglianza solamente nel caso 𝑥 = 𝑎 e 𝑦 ∈ (𝑎, 𝑏). Dato
5.5 convessità 195

qualunque 𝑡 ∈ (0 , 1) e presa una successione 𝑥 𝑘 → 𝑎 con 𝑥 𝑘 ∈ (𝑎, 𝑏) definiamo


𝑡 𝑘 in modo che sia 𝑧 = (1 − 𝑡)𝑥 + 𝑡 𝑦 = (1 − 𝑡 𝑘 )𝑥 𝑘 + 𝑡 𝑘 𝑦 cioè:

𝑥 − 𝑥 𝑘 + 𝑡(𝑦 − 𝑥)
𝑡𝑘 = .
𝑦 − 𝑥𝑘

Siccome 𝑡 𝑘 → 𝑡 per 𝑘 → +∞ se 𝑡 ∈ (0 , 1) per 𝑘 abbastanza grande anche


𝑡 𝑘 ∈ (0 , 1). Inoltre per la convessità in (𝑎, 𝑏) sappiamo che vale

𝑓 ((1 − 𝑡 𝑘 )𝑥 𝑘 + 𝑡 𝑘 𝑦) ≤ (1 − 𝑡 𝑘 ) 𝑓 (𝑥 𝑘 ) + 𝑡 𝑘 𝑓 (𝑦)

e passando a limite per 𝑘 → +∞, dalla continuità di 𝑓 in 𝑥 si ottiene

𝑓 ((1 − 𝑡)𝑥 + 𝑡 𝑦) ≤ (1 − 𝑡) 𝑓 (𝑥) + 𝑡 𝑓 (𝑦)

come volevamo dimostrare. Per 𝑡 = 0 e 𝑡 = 1 la disuguaglianza è sempre


banalmente verificata.


Esempio 5.34. La funzione 𝑓 (𝑥) = 𝑥 è definita su [0 , +∞) ma è derivabile
1
solamente in (0 , +∞). La sua derivata è 𝑓 0(𝑥) = 𝑥 − 2 /2 e la derivata seconda è
3
𝑓 00(𝑥) = −𝑥 − 2 /4 < 0. Dunque la funzione è concava sull’intervallo aperto (0 , +∞).
Ma essendo continua possiamo concludere che 𝑓 è concava su tutto il dominio [0 , +∞).

Teorema 5.35 (derivabilità delle funzioni convesse). Sia 𝐼 ⊆ ℝ un intervallo e


sia 𝑓 : 𝐼 → ℝ una funzione convessa. Se 𝑥 0 ∈ (inf 𝐼, sup 𝐼) esistono e sono finite la
derivata destra e sinistra di 𝑓 in 𝑥 0 :

𝑓 (𝑥) − 𝑓 (𝑥0 )
𝑓+0 (𝑥0 ) = lim+
𝑥→𝑥0 𝑥 − 𝑥0
𝑓 (𝑥) − 𝑓 (𝑥0 )
𝑓−0 (𝑥0 ) = lim−
𝑥→𝑥0 𝑥 − 𝑥0

e risulta
𝑓−0 (𝑥0 ) ≤ 𝑓+0 (𝑥0 ).
Inoltre se inf 𝐼 < 𝑥 1 < 𝑥 2 < sup 𝐼 si ha

𝑓+0 (𝑥1 ) ≤ 𝑓(0 𝑥2 ).

Se ne deduce che 𝑓 è continua in tutti i punti interni di 𝐼 e che l’insieme dei punti in
cui 𝑓 non è derivabile è al più numerabile.

Dimostrazione. Nel lemma 5.30 abbiamo osservato che il rapporto incrementale

𝑓 (𝑥) − 𝑓 (𝑥0 )
𝑅(𝑥0 , 𝑥) =
𝑥 − 𝑥0

di una funzione convessa è crescente rispetto alla variabile 𝑥 . Dunque per il


teorema 2.25 si ha

𝑓−0 (𝑥0 ) = sup 𝑅(𝑥0 , 𝑥) > −∞, 𝑓+0 (𝑥0 ) = inf 𝑅(𝑥 0 , 𝑥) < +∞
𝑥<𝑥 0 𝑥>𝑥0
196 5 calcolo differenziale

e visto che se 𝑥 < 𝑥 0 e 𝑦 > 𝑥 0 si ha 𝑅(𝑥 0 , 𝑥) ≤ 𝑅(𝑥 0 , 𝑦) deduciamo che


𝑓−0 (𝑥0 ) ≤ 𝑓+0 (𝑥0 ) ed entrambi i limiti sono dunque finiti. Se 𝑥1 < 𝑥2 allora preso
un qualunque punto 𝑥 con 𝑥 1 < 𝑥 < 𝑥 2 si ha (sempre per il lemma 5.30)

𝑅(𝑥 1 , 𝑥) ≤ 𝑅(𝑥, 𝑥2 )

e dunque passando al limite si trova 𝑓+0 (𝑥 1 ) ≤ 𝑓−0 (𝑥 2 ). Le derivate destra e


sinistra esistono dunque in tutti i punti interni all’intervallo 𝐼 . In particolare 𝑓 è
continua in tali punti in quanto è continua sia da destra che da sinistra. I punti di
non derivabilità di 𝑓 sono i punti in cui le derivate destra e sinistra differiscono.
Ma ad ogni punto 𝑥 di non differenziabilità posso associare l’intervallo aperto
non vuoto 𝐼 𝑥 = ( 𝑓−0 (𝑥), 𝑓+0 (𝑥)) e per le proprietà appena viste è chiaro che questi
intervalli sono a due a due disgiunti in quanto se 𝑥 1 < 𝑥 2 l’estremo destro di
𝐼 𝑥1 è minore o uguale all’estremo sinistro di 𝐼 𝑥2 . Siccome ognuno di questi
intervalli contiene almeno un numero razionale concludiamo che il numero di
punti di discontinuità non può essere maggiore della cardinalità dei numeri
razionali.

Teorema 5.36 (retta di supporto). Sia 𝐼 ⊆ ℝ un intervallo, 𝑓 : 𝐼 → ℝ una funzione


convessa e 𝑥 0 un punto interno ad 𝐼 . Allora esiste una funzione lineare affine

𝐿(𝑥) = 𝑚𝑥 + 𝑞

tale che 𝑓 (𝑥 0 ) = 𝐿(𝑥 0 ) e per ogni 𝑥 ∈ 𝐼 si abbia 𝑓 (𝑥) ≥ 𝐿(𝑥).

Dimostrazione. Basta scegliere qualunque 𝑚 ∈ [ 𝑓−0 (𝑥 0 ), 𝑓+0 (𝑥 0 )] e considerare la


funzione lineare affine 𝐿(𝑥) = 𝑚(𝑥 − 𝑥 0 ). Se 𝑥 > 𝑥 0 allora si ha 𝑅(𝑥 0 , 𝑥) ≥ 𝑚 e
dunque 𝑓 (𝑥) − 𝑓 (𝑥 0 ) ≥ 𝑚(𝑥 − 𝑥 0 ) = 𝐿(𝑥). Viceversa se 𝑥 < 𝑥 0 si ha 𝑅(𝑥 0 , 𝑥) ≤ 𝑚
da cui, di nuovo, 𝑓 (𝑥) − 𝑓 (𝑥 0 ) ≥ 𝑚(𝑥 − 𝑥 0 ) = 𝐿(𝑥).

Il seguente teorema può essere enunciato anche per gli integrali come vedremo
nel teorema 6.21. La dimostrazione è sostanzialmente identica ed è valida anche
per funzioni convesse di più variabili.

Teorema 5.37 (combinazioni baricentriche/disuguaglianza di Jensen). Se 𝑓 è


una funzione convessa definita su un intervallo 𝐼 , dati 𝑥 1 , . . . , 𝑥 𝑛 ∈ 𝐼 e 𝜆1 , . . . , 𝜆𝑛 ∈ ℝ
tali che 𝑛𝑘=1 𝜆 𝑘 = 1 e 𝜆 𝑘 ≥ 0 per ogni 𝑘 = 1 , . . . , 𝑛 allora
P

!
𝑛
X 𝑛
X
𝑓 𝜆𝑘 𝑥 𝑘 ≤ 𝜆 𝑘 𝑓 (𝑥 𝑘 ).
𝑘=1 𝑘=1

Per le funzioni concave vale la disuguaglianza inversa.

Dimostrazione. Poniamo
𝑛
X
𝑥¯ = 𝜆𝑘 𝑥 𝑘 .
𝑘=1
5.5 convessità 197

Per il teorema 5.36 precedente sappiamo che esiste una retta 𝐿(𝑥) = 𝑚𝑥 + 𝑞 tale
che 𝐿( 𝑥)
¯ = 𝑓 ( 𝑥)
¯ e 𝐿(𝑥) ≤ 𝑓 (𝑥) per ogni 𝑥 ∈ 𝐼 . Allora si ha
!
𝑛
X 𝑛
X 𝑛
X 𝑛
X
𝐿 𝜆𝑘 𝑥 𝑘 = 𝑚𝜆 𝑘 𝑥 𝑘 + 𝑞 𝜆𝑘 = 𝜆 𝑘 𝐿(𝑥 𝑘 ).
𝑘=1 𝑘=1 𝑘=1 𝑘=1

Dunque
𝑛
X 𝑛
X
𝑓 ( 𝑥)
¯ = 𝐿( 𝑥)
¯ = 𝜆 𝑘 𝐿(𝑥 𝑘 ) ≤ 𝜆 𝑘 𝑓 (𝑥 𝑘 ).
𝑘=1 𝑘=1

Esempio 5.38 (disuguaglianza tra media aritmetica e media geometrica). Os-


serviamo che la funzione 𝑓 (𝑥) = ln 𝑥 è concava, infatti si ha 𝑓 00(𝑥) = −1/𝑥 2 < 0.
Dunque, per il teorema precedente, se 𝜆1 + · · · + 𝜆𝑛 = 1, 𝜆 𝑘 ≥ 0 si ha
!
𝑛
X 𝑛
X
ln 𝜆𝑘 𝑥 𝑘 ≥ 𝜆 𝑘 ln 𝑥 𝑘 .
𝑘=1 𝑘=1

Facendo l’esponenziale di ambo i membri si ottiene


𝑛 𝑛
𝜆
X Y
𝜆𝑘 𝑥 𝑘 ≥ 𝑥𝑘 𝑘 .
𝑘=1 𝑘=1

Nel caso particolare 𝜆 𝑘 = 1/𝑛 si ottiene la disuguaglianza tra media aritmetica (AM media aritmetica geometrica
per gli anglofoni) e media geometrica (GM):

𝑥1 + · · · + 𝑥 𝑛 √
≥ 𝑛 𝑥1 · · · 𝑥 𝑛 .
𝑛

Esercizio 5.39 (subadditività delle funzioni concave). Sia 𝑓 : [0 , +∞) → ℝ una


funzione concava con 𝑓 (0) ≥ 0. Allora 𝑓 è subadditiva cioè:

𝑓 (𝑥 + 𝑦) ≤ 𝑓 (𝑥) + 𝑓 (𝑦), ∀𝑥, 𝑦 ≥ 0.

Dimostrazione. Se 𝑥 = 𝑦 = 0 la disuguaglianza è ovvia. Altrimenti 𝑥 + 𝑦 > 0 e


si ha

𝑦 𝑥
 
𝑓 (𝑥) = 𝑓 ·0+ · (𝑥 + 𝑦)
𝑥+𝑦 𝑥+𝑦
𝑦 𝑥 𝑥
≥ 𝑓 (0) + 𝑓 (𝑥 + 𝑦) ≥ 𝑓 (𝑥 + 𝑦).
𝑥+𝑦 𝑥+𝑦 𝑥+𝑦

Scambiando 𝑥 con 𝑦 e sommando si ottiene:

𝑥 𝑦
𝑓 (𝑥) + 𝑓 (𝑦) ≥ 𝑓 (𝑥 + 𝑦) + 𝑓 (𝑥 + 𝑦) = 𝑓 (𝑥 + 𝑦).
𝑥+𝑦 𝑥+𝑦
198 5 calcolo differenziale

Si osservi che sviluppando la disuguaglianza (𝑥 − 𝑦)2 ≥ 0 si ottiene:

𝑥2 + 𝑦2
𝑥𝑦 ≤ .
2
Questa disuguaglianza può essere generalizzata ad esponenti diversi come si
vede nel seguente.

Teorema 5.40 (disuguaglianza di Young). Se 𝑝 > 1, 𝑞 > 1, 1


𝑝 + 1
𝑞 = 1, 𝑥, 𝑦 ≥ 0:

𝑥𝑝 𝑦𝑞
𝑥𝑦 ≤ + . (5.3)
𝑝 𝑞

Dimostrazione. Si utilizza la disuguaglianza di convessità per la funzione


exp(𝑥) = 𝑒 𝑥 . Visto che la derivata seconda dell’esponenziale è positiva, la
funzione exp è convessa e dunque, se 𝑥 > 0 e 𝑦 > 0 si ha:
 
1 1
𝑥 · 𝑦 = exp(ln 𝑥 + ln 𝑦) = exp ln(𝑥 𝑝 ) + ln(𝑦 𝑞 )
𝑝 𝑞
1 1 𝑥 𝑝 𝑦𝑞
≤ · exp ln(𝑥 𝑝 ) + exp ln(𝑦 𝑞 ) = + .
𝑝 𝑞 𝑝 𝑞

Se 𝑥 = 0 o 𝑦 = 0 la disuguaglianza è ovvia in quanto il lato sinistro di (5.3) è


nullo.

Teorema 5.41 (disuguaglianza di Hölder). Se 𝑎 𝑘 ≥ 0 e 𝑏 𝑘 ≥ 0 per 𝑘 ∈ ℕ e siano


𝑝 > 1 e 𝑞 > 1 tali che 𝑝1 + 1𝑞 = 1. Allora

! 𝑝1 ! 1𝑞
X X 𝑝 X 𝑞
𝑎𝑘 𝑏𝑘 ≤ 𝑎𝑘 · 𝑏𝑘 .
𝑘 𝑘 𝑘

Dimostrazione. Poniamo
! 𝑝1 ! 1𝑞
X 𝑝 X 𝑞
𝐴= 𝑎𝑘 , 𝐵= 𝑏𝑘 .
𝑘 𝑘

Se 𝐴 > 0 e 𝐵 > 0 possiamo dividere il lato sinistro della disuguaglianza per il


lato destro e applicare la disuguaglianza (5.3) di Young:
𝑝 𝑞
𝑎𝑘 𝑏𝑘 X 𝑎𝑘 𝑏𝑘 X 1 𝑎𝑘 1 𝑏𝑘
P
𝑘
= · ≤ 𝑝
+
𝐴·𝐵 𝑘
𝐴 𝐵 𝑘
𝑝𝐴 𝑞 𝐵𝑞
𝑝 𝑞
1 𝑘 𝑎𝑘 1 𝑘 𝑏𝑘
P P
1 1
= 𝑝
+ = + = 1.
𝑝 𝐴 𝑞 𝐵𝑞 𝑝 𝑞

E il teorema e dimostrato.

Se fosse 𝐴 = 0 tutti i termini 𝑎 𝑘 sarebbero nulli e la disuguaglianza si riduce


banalmente a 0 ≤ 0. Lo stesso se fosse 𝐵 = 0.
disuguaglianza di Cauchy-Schwarz
5.6 teoremi di Cauchy e de l’Hospital 199

Nel caso 𝑝 = 𝑞 = 2 si ottiene la disuguaglianza di Cauchy-Schwarz


X rX rX
|𝑎 𝑘 𝑏 𝑘 | ≤ 𝑎 2𝑘 · 𝑏 2𝑘
𝑘 𝑘 𝑘

che potrebbe però essere più facilmente dimostrata per un generico prodotto
scalare, come faremo nel teorema 7.6.

5.6 teoremi di Cauchy e de l’Hospital


Cauchy

Teorema 5.42 (Cauchy). Siano 𝑓 : [𝑎, 𝑏] → ℝ e 𝑔 : [𝑎, 𝑏] → ℝ funzioni continue


su tutto [𝑎, 𝑏] e derivabili su (𝑎, 𝑏). Supponiamo inoltre che 𝑔 0(𝑥) ≠ 0 per ogni
𝑥 ∈ (𝑎, 𝑏). Allora 𝑔(𝑏) ≠ 𝑔(𝑎) ed esiste 𝑥0 ∈ (𝑎, 𝑏) tale che

𝑓 0(𝑥0 ) 𝑓 (𝑏) − 𝑓 (𝑎)


= .
𝑔 0(𝑥0 ) 𝑔(𝑏) − 𝑔(𝑎)

Dimostrazione. Si consideri la funzione ausiliaria

ℎ(𝑥) = (𝑔(𝑏) − 𝑔(𝑎)) 𝑓 (𝑥) − ( 𝑓 (𝑏) − 𝑓 (𝑎))𝑔(𝑥).

Per verifica diretta si osserva che

ℎ(𝑏) = 𝑔(𝑏) 𝑓 (𝑎) − 𝑓 (𝑏)𝑔(𝑎) = ℎ(𝑎).

Dunque ℎ verifica le ipotesi del teorema di Rolle ed esiste dunque un punto


𝑥0 ∈ (𝑎, 𝑏) per cui ℎ 0(𝑥 0 ) = 0. Essendo però

ℎ 0(𝑥) = (𝑔(𝑏) − 𝑔(𝑎)) 𝑓 0(𝑥) − ( 𝑓 (𝑏) − 𝑓 (𝑎))𝑔 0(𝑥)

si ottiene
(𝑔(𝑏) − 𝑔(𝑎)) 𝑓 0(𝑥 0 ) = ( 𝑓 (𝑏) − 𝑓 (𝑎))𝑔 0(𝑥 0 ).
Per ipotesi sappiamo che 𝑔 0(𝑥 0 ) ≠ 0. Ma necessariamente anche 𝑔(𝑏) − 𝑔(𝑎) ≠ 0
perché altrimenti potremmo applicare il teorema di Rolle alla funzione 𝑔 e
ottenere che 𝑔 0 si annulla in un punto di (𝑎, 𝑏), cosa che abbiamo escluso per
ipotesi. Dunque possiamo dividere ambo i membri per (𝑔(𝑏) − 𝑔(𝑎)) e per
𝑔 0(𝑥0 ) per ottenere l’uguaglianza enunciata nel teorema.

Teorema 5.43 (de l’Hospital 0/0). Sia 𝐼 ⊆ ℝ un intervallo, 𝑥 0 ∈ [−∞, +∞]


un punto di accumulazione di 𝐼 e siano 𝑓 , 𝑔 : 𝐼 \ {𝑥 0 } → ℝ funzioni derivabili.
Supponiamo che sia 𝑔 0(𝑥) ≠ 0 per ogni 𝑥 ∈ 𝐼 \ {𝑥 0 }. Se

lim 𝑓 (𝑥) = 0 e lim 𝑔(𝑥) = 0


𝑥→𝑥0 𝑥→𝑥 0

e se esiste (finito o infinito) il limite

𝑓 0(𝑥)
ℓ = lim
𝑥→𝑥0 𝑔 0(𝑥)
200 5 calcolo differenziale

allora si ha
𝑓 (𝑥)
lim = ℓ.
𝑥→𝑥 0 𝑔(𝑥)

Dimostrazione. Bisognerà distinguere diversi casi a seconda che 𝑥 0 sia finito


o infinito e che sia un punto interno o un estremo dell’intervallo 𝐼 . Fatta la
dimostrazione nel primo caso tutti gli altri si riconducono ad esso.

Caso 1: supponiamo che sia 𝐼 = [𝑥 0 , 𝑏]. In questo caso possiamo estendere le


funzioni 𝑓 e 𝑔 anche nel punto 𝑥 0 ponendo:
( (
𝑓 (𝑥) se 𝑥 ∈ (𝑥0 , 𝑏] 𝑔(𝑥) se 𝑥 ∈ (𝑥0 , 𝑏]
𝑓˜(𝑥) = 𝑔˜ (𝑥) =
0 se 𝑥 = 𝑥 0 , 0 se 𝑥 = 𝑥 0 .

Visto che per ipotesi 𝑓 (𝑥) → 0 e 𝑔(𝑥) → 0 per 𝑥 → 𝑥 0 risulta che 𝑓˜ e 𝑔˜ siano
funzioni continue su tutto l’intervallo [𝑥 0 , 𝑏] inoltre, sempre per ipotesi, sono
derivabili nell’intervallo (𝑥 0 , 𝑏] visto che l’estensione per 𝑥 = 𝑥 0 non modifica
le derivate negli altri punti. In particolare le funzioni estese soddisfano le
ipotesi del teorema di Cauchy in ogni intervallo [𝑥 0 , 𝑥] con 𝑥 ∈ (𝑥 0 , 𝑏], dunque
possiamo affermare che per ogni 𝑥 esiste 𝑐(𝑥) ∈ (𝑥 0 , 𝑥) tale che

𝑓 (𝑥) 𝑓˜(𝑥) − 𝑓˜(𝑥0 ) 𝑓˜0(𝑐(𝑥)) 𝑓 0(𝑐(𝑥))


= = 0 = 0 .
𝑔(𝑥) 𝑔˜ (𝑥) − 𝑔˜ (𝑥0 ) 𝑔˜ (𝑐(𝑥)) 𝑔 (𝑐(𝑥))

Ma essendo 𝑥 0 < 𝑐(𝑥) < 𝑥 per 𝑥 → 𝑥 0 si ha 𝑐(𝑥) → 𝑥 0 e quindi, tramite un


cambio di variabile (Teorema 2.23) possiamo affermare che

𝑓 (𝑥) 𝑓 0(𝑐(𝑥)) 𝑓 0(𝑥)


lim = lim 0 = lim 0 = ℓ.
𝑥→𝑥0 𝑔(𝑥) 𝑥→𝑥0 𝑔 (𝑐(𝑥)) 𝑥→𝑥0 𝑔 (𝑥)

Caso 2: supponiamo sia 𝐼 qualunque e 𝑥 0 finito. Visto che le funzioni sono


definite su 𝐼 \ {𝑥 0 } possiamo sempre supporre 𝑥 0 ∈ 𝐼 . Inoltre visto che i limiti
dipendono solo dai valori in un intorno del punto 𝑥 0 possiamo sempre supporre
che 𝐼 sia un intervallo chiuso e limitato. Nel passo precedente abbiamo fatto
il caso in cui 𝑥 0 era l’estremo inferiore di 𝐼 , ma allo stesso modo si può fare il
caso in cui 𝑥 0 è l’estremo superiore. Se invece 𝑥 0 fosse un punto interno di 𝐼
possiamo considerare separatamente il limite destro e sinistro e ricondurci ai
casi in cui 𝑥 0 era un estremo.

Caso 3: supponiamo sia 𝑥 0 = +∞. In tal caso l’intervallo 𝐼 contiene un intevallo


[𝑎, +∞) con 𝑎 ∈ ℝ. Anche in questo caso vogliamo ricondurci al primo caso
tramite il cambio di variabile 𝑡 = 1/𝑥 . Posto 𝐹(𝑡) = 𝑓 (1/𝑡) e 𝐺(𝑡) = 𝑔(1/𝑡)
si osserva che 𝐹 e 𝐺 sono definite sull’intervallo (0 , 1/𝑎], tendono a zero per
𝑡 → 0+ sono derivabili,

𝑓 0(1/𝑡) 𝑔 0(1/𝑡))
𝐹0(𝑡) = − , 𝐺0(𝑡) = −
𝑡2 𝑡2
e risulta quindi

𝐹0(𝑡) 𝑓 0(1/𝑡) 𝑓 0(𝑥)


lim+ = lim = lim = ℓ.
𝑡→0 𝐺0(𝑡) 𝑡→0+ 𝑔 0(1/𝑡) 𝑥→+∞ 𝑔 0(𝑥)
5.6 teoremi di Cauchy e de l’Hospital 201

Quindi applicano il teorema nel caso già dimostrato possiamo affermare che

𝑓 (𝑥) 𝐹(𝑡)
lim = lim+ = ℓ.
𝑥→+∞ 𝑔(𝑥) 𝑡→ 0 𝐺(𝑡)

Caso 4: il caso 𝑥 0 = −∞ si svolge in maniera analoga al caso precedente.


de l’Hospital

Teorema 5.44 (de l’Hospital ·/∞). Siano 𝑎, 𝑏 ∈ [−∞, +∞] con 𝑎 < 𝑏 . Siano
𝑓 , 𝑔 : (𝑎, 𝑏) → ℝ funzioni derivabili. Se

lim | 𝑔(𝑥)| = +∞,


𝑥→𝑎 +

se 𝑔 0(𝑥) ≠ 0 per ogni 𝑥 ∈ (𝑎, 𝑏) e se esiste il limite (finito o infinito)

𝑓 0(𝑥)
ℓ = lim+
𝑥→𝑎 𝑔 0(𝑥)

allora si ha
𝑓 (𝑥)
lim+ = ℓ.
𝑥→𝑎 𝑔(𝑥)

Risultato analogo si ha facendo i limiti per 𝑥 → 𝑏 − invece che per 𝑥 → 𝑎 + e di


conseguenza anche nel caso in cui la funzione sia definita su un intervallo “bucato”
𝑓 : (𝑎, 𝑏) \ {𝑥0 } → ℝ e si considerino i limiti “pieni” per 𝑥 → 𝑥0 .

Dimostrazione. Supponiamo per assurdo che non si abbia

𝑓 (𝑥)
lim+ = ℓ.
𝑥→𝑎 𝑔(𝑥)

Allora, per il teorema di collegamento tra limiti di funzione e limiti di successione,


deve esistere una successione 𝑎 𝑘 ∈ (𝑎, 𝑏), 𝑎 𝑘 → 𝑎 tale che non si abbia

𝑓 (𝑎 𝑘 )
lim = ℓ.
𝑘→+∞ 𝑔(𝑎 𝑘 )

Se la successione 𝑓 (𝑎 𝑘 )/𝑔(𝑎 𝑘 ) è limitata allora applicando il teorema di Bolzano


Weierstrass sappiamo esistere una sottosuccessione di 𝑎 𝑘 convergente ad un
valore 𝑚 ≠ ℓ (se tutte le sottosuccessioni convergessero ad ℓ l’intera successione
convergerebbe ad ℓ ). Se invece 𝑓 (𝑎 𝑘 )/𝑔(𝑎 𝑘 ) non è limitata possiamo estrarre
una sottosuccessione che converge a +∞ oppure a −∞. In ogni caso esiste una
successione, che chiameremo ancora 𝑎 𝑘 , ed esiste 𝑚 ∈ ℝ̄ tale che

𝑓 (𝑎 𝑘 )
lim = 𝑚 ≠ ℓ.
𝑘→+∞ 𝑔(𝑎 𝑘 )

Consideriamo ora un intorno 𝑈 di 𝑚 e un intorno 𝑉 di ℓ tali che 𝑈 ∩ 𝑉 = ∅.


Siccome 𝑓 0(𝑥)/𝑔 0(𝑥) → ℓ per 𝑥 → 𝑎 esiste un 𝑐 ∈ (𝑎, 𝑏) tale che per ogni
𝑥 ∈ (𝑎, 𝑐) si ha
𝑓 0(𝑥)
∈ 𝑉.
𝑔 0(𝑥)
202 5 calcolo differenziale

Consideriamo allora il seguente rapporto incrementale

𝑓 (𝑎 𝑘 ) 𝑓 (𝑥)
𝑓 (𝑎 𝑘 ) − 𝑓 (𝑥) 𝑔(𝑎 𝑘 )
− 𝑔(𝑎 𝑘 )
=
𝑔(𝑎 𝑘 ) − 𝑔(𝑥) 1−
𝑔(𝑥)
𝑔(𝑎 𝑘 )

e osserviamo che il lato destro tende a 𝑚 per 𝑘 → +∞ in quanto 𝑓 (𝑎 𝑘 )/𝑔(𝑎 𝑘 ) →


𝑚 e visto che | 𝑔(𝑎 𝑘 )| → +∞ si ha 𝑓 (𝑥)/𝑔(𝑎 𝑘 ) → 0 e 𝑔(𝑥)/𝑔(𝑎 𝑘 ) → 0. Dunque
esisterà un 𝑘 per cui il lato destro sta nell’intorno 𝑈 di 𝑚 . Al lato sinistro
possiamo invece applicare il teorema di Cauchy e trovare quindi un punto
𝑦 ∈ (𝑎 𝑘 , 𝑐) per cui tale lato risulti uguale a 𝑓 0(𝑦)/𝑔 0(𝑦). Ma visto che 𝑦 ∈ (𝑎, 𝑐)
si dovrà avere 𝑓 0(𝑦)/𝑔 0(𝑦) ∈ 𝑉 . Questo è assurdo in quanto 𝑈 ∩ 𝑉 = ∅.

5.7 classi di regolarità

Definizione 5.45 (funzioni di classe 𝐶 𝑘 ). Dato 𝐴 ⊆ ℝ denotiamo con ℝ𝐴 l’insieme


𝐶𝑘
di tutte le funzioni 𝑓 : 𝐴 → ℝ. Per ogni 𝑘 ∈ ℕ definiamo 𝐶 𝑘 (𝐴) ⊆ ℝ𝐴 nel modo
seguente:

1. se 𝑘 = 0 poniamo

𝐶 0 (𝐴) = 𝑓 ∈ ℝ𝐴 : 𝑓 continua .


2. se 𝑘 > 0 definiamo induttivamente

𝐶 𝑘 (𝐴) = 𝑓 ∈ ℝ𝐴 : 𝑓 derivabile e 𝑓 0 ∈ 𝐶 𝑘−1 (𝐴) .




𝐶∞ Chiaramente se 𝑗 ≥ 𝑘 si ha 𝐶 𝑗 (𝐴) ⊆ 𝐶 𝑘 (𝐴) dunque 𝐶 𝑘 (𝐴) è una famiglia decrescente


(rispetto all’inclusione insiemistica) ed ha senso definire:

𝐶 ∞ (𝐴) = 𝑓 ∈ ℝ𝐴 : ∀𝑘 ∈ ℕ : 𝑓 ∈ 𝐶 𝑘 (𝐴) = 𝐶 𝑘 (𝐴).


 \
𝑘∈ℕ

𝑓 (𝑗)

Le funzioni 𝑓 ∈ 𝐶 𝑘 (𝐴) sono derivabili 𝑘 volte. Utilizziamo la notazione 𝑓 (𝑗) per


denotare la 𝑗 -esima derivata di una funzione 𝑓 . Dunque avremo

𝑓 (0) = 𝑓 , 𝑓 (1) = 𝑓 0 , 𝑓 (2) = 𝑓 00 , . . .

Abbiamo già osservato che ℝ𝐴 è uno spazio vettoriale reale. Gli spazi 𝐶 𝑘 (𝐴)
per 𝑘 = 0 , . . . , ∞ sono una famiglia decrescente di sottospazi vettoriali di ℝ𝐴 .
Infatti sappiamo che la combinazione lineare di funzioni continue è continua e
che la combinazione lineare di funzioni derivabili è derivabile.

E’ importante osservare che 𝐶 1 (𝐴) non coincide con l’insieme delle funzioni
derivabili su 𝐴. Infatti abbiamo già visto nell’esempio 5.25 che esistono funzioni
funzione lipschitziana derivabili la cui derivata non è continua e quindi tali funzioni, pur essendo
derivabili, non sono di classe 𝐶 1 .
5.7 classi di regolarità 203

Definizione 5.46 (funzioni lipschitziane). Una funzione 𝑓 : 𝐴 ⊆ ℝ → ℝ si


dice essere lipschitziana (o anche 𝐿-lipschitziana se vogliamo mettere in evidenza la
dipendenza da 𝐿) se esiste 𝐿 > 0 tale che

| 𝑓 (𝑥) − 𝑓 (𝑦)| ≤ 𝐿|𝑥 − 𝑦| ∀𝑥, 𝑦 ∈ 𝐴.

La più piccola costante 𝐿 per la quale è soddisfatta la precedente relazione si chiama


costante di Lipschitz di 𝑓 . costante di Lipschitz

Teorema 5.47 (criterio di Lipschitz). Sia 𝑓 : 𝐴 ⊆ ℝ una funzione lipschitziana


con costante di Lipschitz 𝐿. Se 𝑓 è derivabile in un punto 𝑥 ∈ 𝐴 allora | 𝑓 0(𝑥)| ≤ 𝐿.
Viceversa se 𝑓 : 𝐼 ⊆ ℝ → ℝ una funzione derivabile definita su un intervallo 𝐼 e se
esiste 𝐿 tale che per ogni 𝑥 ∈ 𝐼 si ha | 𝑓 0(𝑥)| ≤ 𝐿 allora 𝑓 è lipschitziana.

Dimostrazione. Se 𝑓 è Lipschitziana significa che il rapporto incrementale è


limitato. Cioè esiste 𝐿 > 0 tale che
𝑓 (𝑥) − 𝑓 (𝑦)

𝑥−𝑦 ≤𝐿 ∀𝑥, 𝑦 ∈ 𝐴.

Dunque la derivata, che è il limite del rapporto incrementale, se esiste è anch’essa


limitata dalla stessa costante: | 𝑓 0(𝑥)| ≤ 𝐿 per ogni 𝑥 ∈ 𝐴.

Viceversa se la derivata è limitata | 𝑓 0(𝑧)| ≤ 𝐿 per ogni 𝑧 ∈ 𝐼 e se 𝑥, 𝑦 ∈ 𝐼 sono


punti qualunque, allora, per il teorema di Lagrange, il rapporto incrementale di
𝑓 è uguale alla derivata in un punto 𝑧 ∈ (𝑥, 𝑦):

𝑓 (𝑥) − 𝑓 (𝑦)

0
𝑥 − 𝑦 = | 𝑓 (𝑧)| ≤ 𝐿.

e dunque la funzione è 𝐿 lipschitziana:

| 𝑓 (𝑥) − 𝑓 (𝑦)| ≤ 𝐿|𝑥 − 𝑦|.

funzione hoelderiana

Definizione 5.48 (funzioni Hoelderiane). Sia 𝛼 > 0. Una funzione 𝑓 : 𝐴 ⊆ ℝ →


ℝ si dice essere 𝛼-Hoelderiana se esiste una costante 𝐶 > 0 tale che

| 𝑓 (𝑥) − 𝑓 (𝑦)| ≤ 𝐶 |𝑥 − 𝑦| 𝛼 . (5.4)

uniforme continuità
Definizione 5.49 (uniforme continuità). Una funzione 𝑓 : 𝐴 ⊆ ℝ → ℝ si dice
essere uniformemente continua se

∀𝜀 > 0 : ∃𝛿 > 0 : ∀𝑥, 𝑦 ∈ 𝐴 : |𝑥 − 𝑦| < 𝛿 =⇒ | 𝑓 (𝑥) − 𝑓 (𝑦)| < 𝜀.

Teorema 5.50. Ogni funzione lipschitziana è 1-Hoelderiana (e viceversa). Ogni


funzione 𝛼 -Hoelderiana è uniformemente continua. Ogni funzione uniformemente
continua è continua. Ogni funzione 𝛼 -Hoelderiana con 𝛼 > 1 ha derivata nulla.
204 5 calcolo differenziale

Dimostrazione. Le prime tre affermazioni seguono direttamente dalle definizioni.


Per l’ultima osservazione si noti che se 𝛼 > 1 nella disuguaglianza (5.4) si può
dividere per |𝑥 − 𝑦| e ottenere quindi che il rapporto incrementale tende a zero
se 𝑦 → 𝑥 .

Definizione 5.51 (modulo di continuità). Sia 𝑓 : 𝐴 ⊆ ℝ → ℝ una funzione.


modulo di continuità Definiamo il modulo di continuità di 𝑓 come la funzione 𝑀 : [0 , +∞) → [0 , +∞]
definita da
𝑀(𝑟) = sup {| 𝑓 (𝑥) − 𝑓 (𝑦)| : 𝑥, 𝑦 ∈ 𝐴, |𝑥 − 𝑦| ≤ 𝑟}.

Teorema 5.52 (proprietà del modulo di continuità). Sia 𝑓 : 𝐴 → ℝ e sia


𝑀 : [0 , +∞) → [0 , +∞) il suo modulo di contintuità. La funzione 𝑀(𝑟) è crescente;

La funzione 𝑓 è uniformemente continua se e solo se

lim 𝑀(𝑟) = 0.
𝑟→0

La funzione 𝑓 è lipschitziana se e solo se esiste 𝐿 tale che

𝑀(𝑟) ≤ 𝐿𝑟.

La funzione 𝑓 è 𝛼 -Hoelderiana se e solo se esiste 𝐶 tale che

𝑀(𝑟) ≤ 𝐶𝑟 𝛼 .

Dimostrazione. Osserviamo che la condizione

𝑀(𝑟) ≤ 𝑐

è equivalente a

∀𝑥, 𝑦 ∈ 𝐴 : |𝑥 − 𝑦| ≤ 𝑟 =⇒ | 𝑓 (𝑥) − 𝑓 (𝑦)| ≤ 𝑐.

La condizione 𝑀(𝑟) → 0 per 𝑟 → 0 significa

∀𝜀 > 0 : ∃𝛿 > 0 : ∀𝑟 > 0 : 𝑟 < 𝛿 =⇒ 𝑀(𝑟) < 𝜀

e diventa quindi la condizione di uniforme continuità.

Le condizioni di lipschitzianità e di 𝛼 -hoelderianità risultano pure immediata-


mente.

Teorema 5.53 (restrizione / incollamento di funzioni uniformemente continue).


Sia 𝑓 : 𝐴 ⊆ ℝ → ℝ una funzione uniformemente continua. Se 𝐵 ⊆ 𝐴 la restrizione
𝑓|𝐵 di 𝑓 a 𝐵 è anch’essa uniformemente continua.

Siano 𝐼, 𝐽 ⊆ ℝ intervalli tali che 𝐼 ∩ 𝐽 ≠ ∅. Sia 𝑓 : 𝐼 ∪ 𝐽 → ℝ una funzione. Se 𝑓 |𝐼 e


𝑓|𝐽 sono uniformemente continue allora 𝑓 è uniformemente continua.
5.7 classi di regolarità 205

Dimostrazione. La prima parte, sulla restrizione di una funzione uniformemente


continua, deriva direttamente dalla definizione: se una qualunque proprietà
vale per ogni 𝑥, 𝑦 ∈ 𝐴 allora a maggior ragione vale per ogni 𝑥, 𝑦 ∈ 𝐵 quando
𝐵 ⊆ 𝐴.

Vediamo la seconda parte dell’enunciato: supponiamo 𝑓 sia uniformemente


continua su 𝐼 e su 𝐽 . Sia dato 𝜀 > 0 e siano 𝛿 1 e 𝛿 2 i valori di 𝛿 dati dalle
condizioni di uniforme continuità di 𝑓 rispettivamente su 𝐼 e su 𝐽 . Consideriamo
𝛿 = min {𝛿 1 , 𝛿2 }. Siano ora 𝑥, 𝑦 punti qualunque di 𝐼 ∪ 𝐽 con |𝑥 − 𝑦| < 𝛿.

Si possono allora avere due casi possibili: 𝑥 e 𝑦 stanno nello stesso intervallo
(𝐼 o 𝐽 ) oppure stanno uno in 𝐼 e l’altro in 𝐽 . Nel primo caso essendo 𝛿 < 𝛿 1 e
𝛿 < 𝛿2 l’uniforme continuità di 𝑓 su 𝐼 e su 𝐽 garantisce che valga in ogni caso
| 𝑓 (𝑥) − 𝑓 (𝑦)| < 𝜀. Nel secondo caso deve esistere un punto 𝑧 ∈ 𝐼 ∩ 𝐽 che sia un
punto intermedio tra 𝑥 e 𝑦 . Allora usando la disuguaglianza triangolare:

| 𝑓 (𝑥) − 𝑓 (𝑦)| ≤ | 𝑓 (𝑥) − 𝑓 (𝑧)| + | 𝑓 (𝑧) − 𝑓 (𝑦)| ≤ 𝜀 + 𝜀.

si ottiene dunque (salvo rimpiazzare 𝜀 con 𝜀/2) anche in questo caso la stima
voluta.
Heine-Cantor

Teorema 5.54 (Heine-Cantor). Siano 𝑎, 𝑏 ∈ ℝ, 𝑎 < 𝑏 . Sia 𝑓 : [𝑎, 𝑏] → ℝ una


funzione continua. Allora 𝑓 è uniformemente continua.

Dimostrazione. Supponiamo per assurdo che 𝑓 non sia uniformemente continua.


Allora 𝑓 soddisfa la negazione della proprietà

∀𝜀 > 0 : ∃𝛿 > 0 : ∀𝑥, 𝑦 ∈ 𝐴 : |𝑥 − 𝑦| < 𝛿 =⇒ | 𝑓 (𝑥) − 𝑓 (𝑦)| < 𝜀

che è

∃𝜀 > 0 : ∀𝛿 > 0 : ∃𝑥, 𝑦 ∈ 𝐴 : |𝑥 − 𝑦| < 𝛿 ∧ | 𝑓 (𝑥) − 𝑓 (𝑦)| ≥ 𝜀.

Dunque dato 𝜀 > 0 che soddisfa la precedente proprietà possiamo prendere


𝛿 = 1/𝑘 per ogni 𝑘 ∈ ℕ , ottenendo quindi due successioni 𝑥 𝑘 , 𝑦 𝑘 tali che

1
|𝑥 𝑘 − 𝑦 𝑘 | < e | 𝑓 (𝑥 𝑘 ) − 𝑓 (𝑦 𝑘 )| ≥ 𝜀.
𝑘
Per il teorema di Bolzano-Weierstrass esisterà una sottosuccessione convergente
𝑥 𝑘 𝑗 → 𝑐 . Visto che |𝑥 𝑘 − 𝑦 𝑘 | → 0 si dovrà avere anche 𝑦 𝑘 𝑗 → 𝑐 . Ma allora, per
la continuità di 𝑓 :

𝑓 (𝑥 𝑘 ) − 𝑓 (𝑦 𝑘 ) → | 𝑓 (𝑐) − 𝑓 (𝑐)| = 0

𝑗 𝑗

in contraddizione con la condizione | 𝑓 (𝑥 𝑘 ) − 𝑓 (𝑦 𝑘 )| ≥ 𝜀. teorema dell’asintoto

Teorema 5.55 (dell’asintoto). Sia 𝑓 : [𝑎, +∞) → ℝ una funzione continua e sia
𝑔 : [𝑎, +∞) → ℝ una funzione uniformemente continua tale che

lim 𝑓 (𝑥) − 𝑔(𝑥) = 0.


𝑥→+∞
206 5 calcolo differenziale

Allora anche 𝑓 è uniformemente continua.

asintoto obliquo In particolare se 𝑓 ha un asintoto obliquo ovvero se esistono 𝑚 ∈ ℝ e 𝑞 ∈ ℝ tali che

lim 𝑓 (𝑥) − (𝑚𝑥 + 𝑞) = 0


𝑥→+∞

allora 𝑓 , se è continua, è uniformemente continua.

Risultato analogo vale per le funzioni definite su intervalli del tipo (−∞, 𝑎] (facendo i
limiti a −∞) e quindi per funzioni definite su tutto ℝ (facendo i limiti sia a +∞ che a
−∞).

Dimostrazione. Per ogni 𝜀 > 0 esiste 𝑀 > 𝑎 tale che | 𝑓 (𝑥) − 𝑔(𝑥)| < 𝜀/3 per
ogni 𝑥 ≥ 𝑀 . D’altra parte la funzione 𝑓 , per il teorema di Heine-Cantor,
è uniformemente continua su [𝑎, 𝑀 + 1] e dunque esiste 𝛿 1 > 0 tale che
presi 𝑥, 𝑦 ∈ [𝑎, 𝑀 + 1] con |𝑥 − 𝑦| < 𝛿 1 si ha | 𝑓 (𝑥) − 𝑓 (𝑦)| < 𝜀. D’altra
parte 𝑔 è uniformemente continua su [𝑀, +∞) e quindi esiste 𝛿 2 tale che dati
𝑥, 𝑦 ∈ [𝑀, +∞) con |𝑥 − 𝑦| < 𝛿 2 si ha | 𝑔(𝑥) − 𝑔(𝑦)| < 𝜀/3. Ma in quest’ultimo
caso si ha:

| 𝑓 (𝑥) − 𝑓 (𝑦)| ≤ | 𝑓 (𝑥) − 𝑔(𝑥)| + | 𝑔(𝑥) − 𝑔(𝑦)| + | 𝑔(𝑦) − 𝑓 (𝑦)|


𝜀 𝜀 𝜀
≤ + + = 𝜀.
3 3 3

Posto dunque 𝛿 = min {1 , 𝛿 1 , 𝛿 2 } scelti comunque 𝑥, 𝑦 ∈ [𝑎, +∞) con |𝑥 − 𝑦| <


𝛿 siamo certamente in uno dei due casi precedenti e quindi, in ogni caso, si
ottiene | 𝑓 (𝑥) − 𝑓 (𝑦)| < 𝜀, come dovevamo dimostrare.

Nel caso particolare 𝑔(𝑥) = 𝑚𝑥 + 𝑞 si osserva semplicemente che 𝑔 è uniforme-


mente continua in quanto è 𝐿-lipschitziana con 𝐿 = |𝑚| .

5.8 formula di Taylor

Definizione 5.56 (polinomio di Taylor). Sia 𝐴 ⊆ ℝ, 𝑓 : 𝐴 → ℝ una funzione e sia


𝑥0 ∈ 𝐴 un punto in cui la derivata 𝑛 -esima (e quindi anche le derivate precedenti) sia
definita.

Allora il polinomio:
𝑛
𝑓 (𝑘) (𝑥0 )
(𝑥 − 𝑥0 ) 𝑘
X
𝑃(𝑥) =
𝑘=0
𝑘!
polinomio di Taylor
viene detto polinomio di Taylor di ordine 𝑛 della funzione 𝑓 , centrato in 𝑥 0 .

polinomio di MacLaurin Nel caso particolare in cui sia 𝑥 0 = 0 il polinomio di Taylor viene anche chiamato
polinomio di MacLaurin.

Teorema 5.57 (caratterizzazione polinomio di Taylor). Il polinomio di Taylor di


una funzione 𝑓 , di ordine 𝑛 , centrato in 𝑥 0 è l’unico polinomio 𝑃 di grado non superiore
ad 𝑛 tale che
𝑃 (𝑘) (𝑥 0 ) = 𝑓 (𝑘) (𝑥0 ), ∀𝑘 ∈ {0, . . . , 𝑛}.
5.8 formula di Taylor 207

Dimostrazione. Ogni polinomio di grado non superiore ad 𝑛 può essere scritto


nella forma:
𝑛
𝑎 𝑘 (𝑥 − 𝑥0 ) 𝑘
X
𝑃(𝑥) =
𝑘=0

(basti notare che se 𝑃(𝑥) è un polinomio anche 𝑄(𝑡) = 𝑃(𝑥 0 + 𝑡) è un polinomio)


e le sue derivate sono:
𝑛
𝑘!
· (𝑥 − 𝑥0 ) 𝑘−𝑗 .
X
𝑃 (𝑗) (𝑥) = 𝑎𝑘 ·
𝑘=𝑗
(𝑘 − 𝑗)!

Per 𝑥 = 𝑥 0 l’unico addendo non nullo è quello con 𝑘 = 𝑗 , dunque

𝑃 (𝑘) (𝑥 0 ) = 𝑘 ! · 𝑎 𝑘 .

Dunque si ha 𝑃 (𝑘) (𝑥 0 ) = 𝑓 (𝑘) (𝑥 0 ) se e solo se 𝑎 𝑘 = 𝑓 (𝑘) (𝑥 0 )/𝑘 ! cioè se 𝑃 è il


polinomio di Taylor di 𝑓 .

Osservazione 5.58 (polinomio di Taylor della derivata). Se 𝑃𝑛 è il polinomio di


Taylor centrato in 𝑥 0 di ordine 𝑛 per 𝑓 , allora si ha

𝑛
𝑓 (𝑘) (𝑥)
· 𝑘(𝑥 − 𝑥0 ) 𝑘−1
X
𝑃𝑛0 (𝑥) =
𝑘=1
𝑘!
𝑛
𝑓 (𝑘)
(𝑥 − 𝑥 0 ) 𝑘−1
X
=
𝑘=1
(𝑘 − 1)!
𝑛−1
𝑓 (𝑗+1)
(𝑥 − 𝑥0 ) 𝑗 .
X
=
𝑗=0
𝑗!

Dunque si verifica che 𝑃𝑛0 è il polinomio di Taylor di ordine 𝑛 − 1 per 𝑓 0. In breve: il


polinomio di Taylor di ordine 𝑛 − 1 della derivata è la derivata del polinomio di Taylor
di ordine 𝑛 della funzione.

Viceversa se
𝑛
𝑎 𝑘 (𝑥 − 𝑥 0 ) 𝑘
X
𝑘=0 Vedremo che questa è una primiti-
va del polinomio dato (si veda la
è il polinomio di Taylor di ordine 𝑛 della derivata 𝑓 0(𝑥), allora il polinomio di Taylor di definizione 6.24).
ordine 𝑛 + 1 di 𝑓 sarà
𝑛
𝑎𝑘
· (𝑥 − 𝑥0 ) 𝑘+1
X
𝑃𝑛+1 (𝑥) = 𝑓 (𝑥0 ) + (5.5)
𝑘=0
𝑘+1

in quanto
𝑓 (𝑘+1) (𝑥0 ) ( 𝑓 0)(𝑘) (𝑥0 ) 𝑎𝑘 · 𝑘! 𝑎𝑘
= = = . Taylor con resto di Lagrange
(𝑘 + 1)! (𝑘 + 1)! (𝑘 + 1)! 𝑘+1

Teorema 5.59 (formula di Taylor con resto di Lagrange). Sia 𝐼 ⊆ ℝ un intervallo,


𝑥0 ∈ 𝐼 , 𝑓 ∈ 𝐶 𝑛+1 (𝐼). Sia 𝑃 il polinomio di Taylor di 𝑓 di ordine 𝑛 centrato in 𝑥 0 . Per
208 5 calcolo differenziale

ogni 𝑥 ∈ 𝐼 esiste 𝑦 ∈ [𝑥 0 , 𝑥) (se 𝑥 > 𝑥 0 altrimenti si intende 𝑦 ∈ (𝑥, 𝑥 0 ]) tale che

𝑓 (𝑛+1) (𝑦)
𝑓 (𝑥) = 𝑃(𝑥) + (𝑥 − 𝑥0 )𝑛+1 .
(𝑛 + 1)!

Dimostrazione. Se 𝑥 = 𝑥 0 basta prendere 𝑦 = 𝑥 0 . Supponiamo allora che sia


𝑥 > 𝑥0 (il caso 𝑥 < 𝑥0 è del tutto analogo).

Posto 𝑅(𝑥) = 𝑓 (𝑥) − 𝑃(𝑥) osserviamo che essendo 𝑃 (𝑘) (𝑥 0 ) = 𝑓 (𝑘) (𝑥 0 ) (teo-
rema 5.57) si ha 𝑅 (𝑘) (𝑥 0 ) = 0 per 𝑘 = 0 , 1 , . . . , 𝑛 . In particolare 𝑅 (𝑘) (𝑥) =
𝑅 (𝑘) (𝑥) − 𝑅 (𝑘) (𝑥0 ) è l’incremento di 𝑅 (𝑘) sull’intervallo [𝑥0 , 𝑥]. Analogamente
osserviamo che (𝑥 − 𝑥 0 )𝑛+1 è anch’essa una funzione che si annulla in 𝑥 0 con
tutte le sue derivate e dunque (𝑥 − 𝑥 0 )𝑛+1 è l’incremento della funzione sullo
stesso intervallo.

Dunque possiamo applicare il teorema di Cauchy alle funzioni 𝑓 (𝑥) − 𝑃(𝑥) e


(𝑥 − 𝑥0 )𝑛+1 sull’intervallo [𝑥0 , 𝑥] per ottenere l’esistenza di un punto 𝑥 1 ∈ (𝑥0 , 𝑥)
tale che
𝑓 (𝑥) − 𝑃(𝑥) 𝑓 0(𝑥1 ) − 𝑃 0(𝑥1 )
= .
(𝑥 − 𝑥0 )𝑛+1 (𝑛 + 1)(𝑥1 − 𝑥0 )𝑛
Di nuovo applichiamo il teorema di Cauchy alle funzioni 𝑅0(𝑥) e (𝑛 + 1)(𝑥 − 𝑥 0 )𝑛
sull’intervallo [𝑥 0 , 𝑥 1 ] per ottenere l’esistenza di un punto 𝑥 2 ∈ (𝑥 0 , 𝑥 1 ) ⊆ (𝑥 0 , 𝑥)
tale che
𝑓 0(𝑥1 ) − 𝑃 0(𝑥1 ) 𝑓 00(𝑥2 ) − 𝑃 00(𝑥2 )
= .
(𝑛 + 1)(𝑥1 − 𝑥0 )𝑛 (𝑛 + 1)𝑛(𝑥2 − 𝑥0 )𝑛−1
Possiamo iterare il procedimento per 𝑛 + 1 volte ottenendo quindi l’esistenza di
un punto 𝑥 𝑛+1 ∈ (𝑥 0 , 𝑥) tale che

𝑓 (𝑥) − 𝑃(𝑥) 𝑓 (𝑛+1) (𝑥 𝑛+1 ) − 𝑃 (𝑛+1) (𝑥 𝑛+1 )


= .
(𝑥 − 𝑥0 )𝑛+1 (𝑛 + 1)!

Ma 𝑃 è un polinomio di grado al più 𝑛 e quindi la sua derivata (𝑛 + 1)-esima è


nulla perciò otteniamo, ponendo 𝑦 = 𝑥 𝑛+1 :

𝑓 (𝑛+1) (𝑦)
𝑓 (𝑥) − 𝑃(𝑥) = (𝑥 − 𝑥 0 )𝑛+1
(𝑛 + 1)!

che è quanto volevamo dimostrare.

Esempio 5.60 (somma della serie armonica a segni alterni). Consideriamo la


funzione 𝑓 (𝑥) = ln 𝑥 . Si osservi che

𝑓 0(𝑥) = 𝑥 −1 , 𝑓 00(𝑥) = −𝑥 −2 , 𝑓 000(𝑥) = 2 𝑥 −3 ,


(−1) 𝑘−1 (𝑘 − 1)!
𝑓 (4) (𝑥) = −3 · 2 𝑥 −4 , ... 𝑓 (𝑘) (𝑥) =
𝑥𝑘
e si ha quindi, per ogni 𝑘 ≥ 1

𝑓 (𝑘) (1) (−1) 𝑘−1


=
𝑘! 𝑘
5.8 formula di Taylor 209

da cui si deduce che il polinomio di Taylor di ordine 𝑛 centrato in 𝑥 0 = 1 è


𝑛
(𝑥 − 1) 𝑘
(−1) 𝑘−1
X
𝑃(𝑥) = .
𝑘=1
𝑘

La formula di Taylor con resto di Lagrange ci dice allora che per ogni 𝑥 > 1 esiste
𝑦 ∈ (1, 𝑥) tale che
𝑛
(𝑥 − 1) 𝑘 (−1)𝑛 (𝑥 − 1)𝑛+1
(−1) 𝑘−1
X
ln(𝑥) − = .
𝑘=1
𝑘 (𝑛 + 1)𝑦 𝑛+1

Se 𝑥 = 2 si ha 𝑦 > 1 e (𝑥 − 1)𝑛+1 = 1 dunque il lato destro tende a zero per 𝑛 → +∞


(attenzione che 𝑦 dipende anch’esso da 𝑛 ). Abbiamo quindi trovato la somma della serie
armonica a segni alterni:
+∞
X (−1) 𝑘−1
= ln 2.
𝑘=1
𝑘

Nel teorema seguente utilizzeremo una nuova notazione. Scriveremo

𝑓 (𝑥) = 𝑃(𝑥) + 𝑜(𝑔(𝑥)), per 𝑥 → 𝑥 0

(si legga: “ 𝑓 (𝑥) è uguale a 𝑃(𝑥) più un 𝑜 -piccolo di 𝑔(𝑥)”) se risulta

𝑓 (𝑥) − 𝑃(𝑥)
𝑓 (𝑥) − 𝑃(𝑥)  𝑔(𝑥) ovvero lim = 0.
𝑥→𝑥 0 𝑔(𝑥)

cioè la quantità 𝑜(𝑔(𝑥)) rappresenta una funzione incognita che però sappiamo
essere trascurabile (nel senso appena descritto) della funzione 𝑔(𝑥). Questa
notazione è molto comoda ma va utilizzata con cautela: ci dedicheremo il
capitolo 5.9 a cui rimandiamo per maggiori dettagli.

Teorema 5.61 (formula di Taylor con resto di Peano). Sia 𝐼 ⊆ ℝ un intervallo,


𝑥0 ∈ 𝐼 , 𝑓 ∈ 𝐶 𝑛−1 (𝐼) con 𝑓 (𝑛−1) derivabile in 𝑥0 (in particolare è sufficiente che sia
𝑓 ∈ 𝐶 𝑛 (𝐼)). Sia 𝑃 il polinomio di Taylor di 𝑓 di ordine 𝑛 centrato in 𝑥 0 . Allora si ha

𝑓 (𝑥) − 𝑃(𝑥)
lim =0 (5.6)
𝑥→𝑥0 (𝑥 − 𝑥0 )𝑛

ovvero, scritto in maniera più espressiva:

𝑓 (𝑥) = 𝑃(𝑥) + 𝑜((𝑥 − 𝑥0 )𝑛 ). (5.7)

Viceversa se 𝑃(𝑥) è un polinomio di grado che non supera 𝑛 e vale la formula (5.7)
allora 𝑃 è il polinomio di Taylor di 𝑓 .

Dimostrazione. Iniziamo come per la dimostrazione del teorema 5.59. dobbiamo


mostrare che
𝑓 (𝑥) − 𝑃(𝑥)
lim = 0.
𝑥→𝑥 0 (𝑥 − 𝑥 0 )𝑛

Posto 𝑅(𝑥) = 𝑓 (𝑥) − 𝑃(𝑥) osserviamo che si ha 𝑅 (𝑘) (𝑥 0 ) = 0 per 𝑘 = 0 , 1 , . . . , 𝑛


e lo stesso vale per la funzione 𝑆(𝑥) = (𝑥 − 𝑥 0 )𝑛 . Dunque possiamo applicare il
210 5 calcolo differenziale

teorema 5.42 di Cauchy ottenendo che esiste un punto 𝑥 1 ∈ [𝑥 0 , 𝑥] tale che

𝑓 (𝑥) − 𝑃(𝑥) 𝑓 0(𝑥1 ) − 𝑃 0(𝑥1 )


= .
(𝑥 − 𝑥0 )𝑛 𝑛(𝑥1 − 𝑥 0 )𝑛−1

Se sapessimo che 𝑓 ∈ 𝐶 𝑛 (𝐼) potrem- Possiamo iterare questo procedimento 𝑛 − 1 volte ottenendo
mo iterare 𝑛 volte e arrivare immediata-
mente al risultato in quanto 𝑓 (𝑛) (𝑥 𝑛 ) → 𝑓 (𝑥) − 𝑃(𝑥) 𝑓 0(𝑥1 ) − 𝑃 0(𝑥 1 ) 𝑓 00(𝑥 2 ) − 𝑃 00(𝑥2 )
𝑓 (𝑛) (𝑥0 ) = 0 per 𝑥 𝑛 → 𝑥0 . Ma noi ab- = = = ...
biamo supposto che la derivata 𝑛 -esima
(𝑥 − 𝑥0 )𝑛 𝑛(𝑥1 − 𝑥0 )𝑛−1 𝑛(𝑛 − 1)(𝑥2 − 𝑥0 )𝑛−2
esiste solamente nel punto 𝑥 0 e quindi 𝑓 (𝑛−1) (𝑥 𝑛−1 ) − 𝑃 (𝑛−1) (𝑥 𝑛−1 )
nell’ultimo passaggio dovremo utilizza- =
re la definizione di derivata invece che il
𝑛 !(𝑥 𝑛−1 − 𝑥 0 )
teorema di Cauchy.
con 𝑥 1 ∈ [𝑥 0 , 𝑥], 𝑥 2 ∈ [𝑥 0 , 𝑥 1 ], . . . , 𝑥 𝑛−1 ∈ [𝑥 0 , 𝑥 𝑛−2 ] ⊆ [𝑥 0 , 𝑥]. In particolare si
avrà 𝑥 𝑛−1 → 𝑥 0 per 𝑥 → 𝑥 0 e basterà quindi dimostrare che

𝑅 (𝑛−1) (𝑥)
→ 0, per 𝑥 → 𝑥 0 .
𝑥 − 𝑥0

Ma visto che la derivata del polinomio di Taylor coincide con il polinomio di


Taylor della derivata si ha che 𝑃 (𝑛−1) (𝑥) è il polinomio di Taylor di ordine 1 della
funzione 𝑓 (𝑛−1) (𝑥) si avrà

𝑃 (𝑛−1) (𝑥) = 𝑓 (𝑛−1) (𝑥 0 ) + 𝑓 (𝑛) (𝑥 0 )(𝑥 − 𝑥0 )

da cui

𝑅 (𝑛−1) (𝑥) 𝑓 (𝑛−1) (𝑥) − 𝑃 (𝑛−1) (𝑥) 𝑓 (𝑛−1) (𝑥) − 𝑓 (𝑛−1) (𝑥 0 )


= = − 𝑓 (𝑛) (𝑥0 )
𝑥 − 𝑥0 𝑥 − 𝑥0 𝑥 − 𝑥0
→ 𝑓 (𝑛) (𝑥0 ) − 𝑓 (𝑛) (𝑥0 ) = 0

per definizione di derivata 𝑛 -esima:

𝑓 (𝑛−1) (𝑥) − 𝑓 (𝑛−1) (𝑥0 )


𝑓 (𝑛) (𝑥0 ) = lim .
𝑥→𝑥 0 𝑥 − 𝑥0

Per completare la dimostrazione dobbiamo dimostrare che il polinomio di


Taylor 𝑃 è l’unico polinomio di grado non superiore ad 𝑛 che soddisfa la
condizione (5.6). Se ci fosse un altro polinomio 𝑄 con la stessa proprietà la
differenza 𝑅 = ( 𝑓 − 𝑃) − ( 𝑓 − 𝑄) = 𝑄 − 𝑃 dovrebbe essere un polinomio di
grado non superiore ad 𝑛 che soddisfa la condizione

𝑅(𝑥)
lim = 0. (5.8)
𝑥→𝑥 0 (𝑥 − 𝑥 0 )𝑛

Posto
𝑛
𝑎 𝑘 (𝑥 − 𝑥0 ) 𝑘
X
𝑅(𝑥) =
𝑘=0

osserviamo che 𝑅(𝑥) → 𝑅(𝑥 0 ) = 𝑎 0 per 𝑥 → 𝑥 0 . Affinché valga (5.8) deve


necessariamente essere 𝑎 0 = 0. Ma in tal caso possiamo raccogliere 𝑥 − 𝑥 0 a
5.8 formula di Taylor 211

numeratore e denominatore e da (5.8) ottenere


P𝑛
𝑘=1
𝑎 𝑘 (𝑥 − 𝑥 0 ) 𝑘−1
lim = 0.
𝑥→𝑥 0 (𝑥 − 𝑥 0 )𝑛−1

Iterando il procedimento scopriamo che tutti i coefficienti 𝑎 𝑘 devono essere


nulli e dunque 𝑄 = 𝑃 .

Definizione 5.62 (coefficiente binomiale reale). Dato 𝛼 ∈ ℝ, 𝑘 ∈ ℕ definiamo

𝛼 𝛼 · (𝛼 − 1) · · · (𝛼 − 𝑘 + 1)
 
= .
𝑘 𝑘!

Osserviamo che se 𝛼 ∈ ℕ questa definizione coincide con la definizione data nel


capitolo 1.11.

Teorema 5.63 (sviluppi di Taylor di alcune funzioni elementari). Per ogni 𝑛 ∈ ℕ


si hanno, per 𝑥 → 0 le relazioni riportate nella tabella 5.2.

Dimostrazione. Per definizione, il coefficiente del termine 𝑥 𝑘 nel polinomio di


Taylor di 𝑓 (𝑥) non è altro che 𝑎 𝑘 = 𝑓 (𝑘) (0)/𝑘 ! Se 𝑓 (𝑥) = 𝑒 𝑥 allora 𝑓 (𝑘) (𝑥) = 𝑒 𝑥 e
dunque 𝑓 (𝑘) (0) = 1. Si trovano quindi i coefficienti 𝑎 𝑘 = 1/𝑘 !.

Se 𝑓 (𝑥) = sin 𝑥 si ha 𝑓 0(𝑥) = cos 𝑥 , 𝑓 00(𝑥) = − sin 𝑥 , 𝑓 000(𝑥) = − cos 𝑥 e 𝑓 (4) (𝑥) =
sin 𝑥 ... e poi le derivate si ripetono ogni quattro iterazioni. Valutando le
derivate in 𝑥 = 0 si ottiene dunque la sequenza 0 , 1 , 0 , −1 , . . . che si ripete
indefinitamente. Si ottiene dunque lo sviluppo indicato. Discorso analogo si
può fare per 𝑓 (𝑥) = cos 𝑥 .

Se 𝑓 (𝑥) = (1 + 𝑥)𝛼 si ottiene 𝑓 0(𝑥) = 𝛼(1 + 𝑥)𝛼−1 , 𝑓 00(𝑥) = 𝛼(𝛼 − 1)(1 + 𝑥)𝛼−2 e
così via... Valutando le derivate in 𝑥 = 0 si ottiene la sequenza: 1, 𝛼 , 𝛼(𝛼 − 1),
𝛼(𝛼 − 1)(𝛼 − 2). . . da cui, dividendo per 𝑘 !, si ottiene che i coefficienti del
polinomio di Taylor risultano essere i coefficienti binomiali 𝛼𝑘 .

Se 𝑓 (𝑥) = ln(1 + 𝑥) osserviamo che 𝑓 (0) = 0 poi si ha 𝑓 0(𝑥) = (1 + 𝑥)−1 e le


derivate successive coincidono dunque con le derivate di (1 + 𝑥)𝛼 con 𝛼 = −1:
i coefficienti (a parte il primo che è nullo) concidono quindi con i coefficienti
binomiali
(−1)(−2)(−3) . . . (−𝑘)
 
−1
= = (−1) 𝑘 .
𝑘 𝑘!

Similmente se 𝑓 (𝑥) = arctg 𝑥 osserviamo che 𝑓 (0) = 0 e 𝑓 0(𝑥) = (1 + 𝑥 2 )−1 . Per


quanto già visto sappiamo che si ha
𝑛
(−1) 𝑘 𝑦 𝑘 + 𝑜(𝑦 𝑛 )
X
(1 + 𝑦)−1 =
𝑘=0

da cui sostituendo 𝑦 = 𝑥 2 si ha
𝑛
(−1) 𝑘 𝑥 2 𝑘 + 𝑜(𝑥 2𝑛 ).
X
𝑓 0(𝑥) = (1 + 𝑥 2 )−1 =
𝑘=0
212 5 calcolo differenziale

Utilizzando la seconda parte del Teorema 5.61 (formula di Taylor con resto di
Peano), abbiamo verificato che vale l’equazione (5.7) per il polinomio 𝑃(𝑥) =
P𝑛
𝑘=0
(−1) 𝑘 𝑥 2 𝑘 . Dunque 𝑃(𝑥) è il polinomio di Taylor di grado 2𝑛 di 𝑓 0(𝑥). Ma il
polinomio di Taylor della derivata è la derivata del polinomio di Taylor, quindi
possiamo utilizzare (5.5) per ottenere il polinomio di Taylor riportato in tabella.
Metodo analogo si usa per 𝑓 (𝑥) = arcsin 𝑥 , osservando che

1 1
𝑓 0(𝑥) = √ = (1 − 𝑥 2 )− 2
1 − 𝑥2
𝑛  1
−2
(−𝑥 2 ) 𝑘 + 𝑜(𝑥 2𝑛 )
X
=
𝑘=0 𝑘
𝑛 − 21 · − 12 − 1 · · · − 12 − 𝑘 + 1
  
(−1) 𝑘 𝑥 2 𝑘 + 𝑜(𝑥 2𝑛 )
X
=
𝑘=0
𝑘!
𝑛 −1
· −3
· · · −(22𝑘−1)
2 2
(−1) 𝑘 𝑥 2 𝑘 + 𝑜(𝑥 2𝑛 )
X
=
𝑘=0
𝑘!
𝑛
(2 𝑘 − 1)!!
𝑥 2 𝑘 + 𝑜(𝑥 2𝑛 )
X
=
𝑘=0 2𝑘 · 𝑘 !
𝑛
(2 𝑘 − 1)!!
𝑥 2 𝑘 + 𝑜(𝑥 2𝑛 )
X
=
𝑘=0
(2 𝑘)!!

abbiamo trovato il polinomio di Taylor di 𝑓 0(𝑥) e utilizzando (5.5) si ottiene la


formula riportata in tabella.
Per quanto riguarda la funzione 𝑓 (𝑥) = tg 𝑥 ci limitiamo a calcolare esplicita-
mente i primi termini:

𝑓 (𝑥) = tg 𝑥 𝑓 (0) = 0
𝑓 (1) = 1 + 𝑓 2 𝑓 (1) (0) = 1
𝑓 (2) = 2 𝑓 𝑓 0 𝑓 (2) (0) = 0
𝑓 (3) = 2( 𝑓 0)2 + 2 𝑓 𝑓 00 𝑓 (3) (0) = 2
𝑓 (4) = 4 𝑓 0 𝑓 00 + 2 𝑓 0 𝑓 00 + 2 𝑓 𝑓 000 = 6 𝑓 0 𝑓 00 + 2 𝑓 𝑓 000 𝑓 (4) (0) = 0
𝑓 (5) = 6( 𝑓 00)2 + 6 𝑓 0 𝑓 000 + 2 𝑓 0 𝑓 000 + 2 𝑓 𝑓 (4)
= 6( 𝑓 00)2 + 8 𝑓 0 𝑓 000 + 2 𝑓 𝑓 (4) 𝑓 (5) (0) = 16.

Si ottengono quindi i coefficienti: 𝑎 0 = 0, 𝑎 1 = 1, 𝑎 2 = 0, 𝑎 3 = 2/3! = 1/3, 𝑎 4 = 0,


𝑎5 = 16/5! = 2/15.
5.8 formula di Taylor 213

Tabella 5.2: sviluppi di Taylor, per 𝑥 →


𝑛
𝑥𝑘 0, di alcune funzioni elementari. Si veda
𝑒𝑥 = + 𝑜(𝑥 𝑛 )
X
il teorema 5.63
𝑘=0
𝑘!
𝑥2 𝑥3 𝑥𝑛
=1+𝑥+ + +···+ + 𝑜(𝑥 𝑛 )
2 6 𝑛!
𝑛
𝑥 2 𝑘+1
(−1) 𝑘 + 𝑜(𝑥 2𝑛+2 )
X
sin 𝑥 =
𝑘=0
( 2 𝑘 + 1 )!
𝑥3 𝑥 2𝑛+1
=𝑥− + · · · + (−1)𝑛 + 𝑜(𝑥 2𝑛+2 )
6 (2𝑛 + 1)!
𝑛
𝑥 2𝑘
(−1) 𝑘 + 𝑜(𝑥 2𝑛+1 )
X
cos 𝑥 =
𝑘=0
(2 𝑘)!
𝑥2 𝑥4 𝑥 2𝑛
=1− + − · · · + (−1)𝑛 + 𝑜(𝑥 2𝑛+1 )
2 24 (2𝑛)!
𝑛  
𝛼 𝛼
𝑥 𝑘 + 𝑜(𝑥 𝑛 )
X
(1 + 𝑥) =
𝑘=0
𝑘
𝛼(𝛼 − 1) 2 𝛼 𝑛
 
= 1 + 𝛼𝑥 + 𝑥 +···+ 𝑥 + 𝑜(𝑥 𝑛 )
2 𝑛
𝑛
𝑥𝑘
(−1) 𝑘−1 + 𝑜(𝑥 𝑛 )
X
ln(1 + 𝑥) =
𝑘=1
𝑘
𝑥2 𝑥3 𝑥𝑛
=𝑥− + − · · · + (−1)𝑛−1 + 𝑜(𝑥 𝑛 )
2 3 𝑛
𝑛
𝑥 2 𝑘+1
(−1) 𝑘 + 𝑜(𝑥 2𝑛+1 )
X
arctg 𝑥 =
𝑘=0
2𝑘 + 1
𝑥3 𝑥5 𝑥 2𝑛+1
=𝑥− + − · · · + (−1)𝑛 + 𝑜(𝑥 2𝑛+1 )
3 5 2𝑛 + 1
𝑥3 3 (2𝑛 − 1)!! 𝑥 2𝑛+1
arcsin 𝑥 = 𝑥 + + 𝑥5 + · · · + + 𝑜(𝑥 2𝑛+1 )
6 40 (2𝑛)!! 2𝑛 + 1
𝜋
arccos 𝑥 = − arcsin 𝑥
2
𝑥3 2
tg 𝑥 = 𝑥 + + 𝑥 5 + 𝑜(𝑥 5 ).
3 15
.
214 5 calcolo differenziale

5.9 operazioni con i simboli di Landau

Le notazioni di Landau 𝑜 -piccolo e 𝑂 -grande sono comodissime per l’ela-


borazione di stime asintotiche. Bisogna però fare molta attenzione a come
queste notazioni vengono usate, perché altrimenti si rischia di fare degli errori
grossolani. Alcuni risultati controintuitivi sono ad esempio:
1. 𝑜(𝑥) − 𝑜(𝑥) = 𝑜(𝑥) (e non 0),
2. 𝑜(𝑥 2 ) = 𝑜(𝑥) ma non 𝑜(𝑥) = 𝑜(𝑥 2 ).
Il secondo esempio, in particolare, ci dice che il simbolo di uguaglianza in
realtà non è util