Sei sulla pagina 1di 202

Appunti di Matematica

Simone Secchi
Dipartimento di Matematica ed Applicazioni
Università degli Studi di Milano–Bicocca

22 febbraio 2009
ii
Prefazione

Le dispense che state leggendo nascono dall’esperienza di insegnamento del


corso di Matematica per gli allievi biotecnologi dell’Università degli Studi di
Milano–Bicocca. Il programma del corso è piuttosto vasto, e la prima diffi-
coltà è stata quella di scegliere un libro di testo. Alcune esigenze hanno reso
molto difficile questo compito: innanzitutto è opportuno utilizzare materiale
in lingua italiana, onde evitare di aggiungere la difficoltà di apprendimento
in una lingua straniera a quella intrinseca della materia. Inoltre, la presen-
za di argomenti piuttosto avanzati (introduzione alle equazioni differenziali
ordinarie, cenni ai metodi di approssimazione) esclude la maggioranza delle
opere attualmente presenti sul mercato.
Dalle discussioni con alcuni insegnanti di scuola media superiore, è emerso
chiaramente l’abbassamento del livello dei programmi scolastici rispetto a
quelli di vent’anni fa. Basti dire che, nei licei scientifici e nei principali
istituti tecnici degli anni ’90 del secolo scorso, era consuetudine insegnare
tutti gli argomenti che tratteremo in queste dispense, sebbene con poche
dimostrazioni rigorose. Non era raro, poi, studiare il calcolo combinatorico e
qualche concetto di probabilità elementare. È chiaro che i testi più datati di
Istituzioni di Matematica sono ormai inutilizzabili per i nuovi corsi.
Questi appunti non sostituiscono in alcun modo un buon libro di testo,
ad esempio quelli elencati in bibiliografia o quelli consigliati nelle informazio-
ni sul corso all’URL http://www.matapp.unimib.it/~secchi nella sezione
dedicata alla didattica. Piuttosto vengono proposti per non “perdere la bus-
sola” durante lo studio dei testi più autorevoli. Ogni capitolo costituisce un
argomento o una serie di argomenti affini, che costituiscono l’ossatura del
corso di Matematica per la laurea di primo livello in Biotecnologie, Biologia,
e più generalmente in tutti i corsi dove non si debba insegnare il calcolo ma-
triciale e vettoriale. In questa versione ho inserito, per completezza, un breve
capitolo sulle serie numeriche (di numeri reali). Difficilmente c’è il tempo per
insegnare anche questo argomento, che in effetti sarebbe utile affrontare. Il
capitolo sulle serie non è comunque indispensabile alla comprensione del resto
delle dispense.

iii
iv

Gli argomenti trattati sono quelli classici, esposti nell’ordine più clas-
sico:1 brevi richiami di insiemistica e di teoria elementare delle funzioni,
successioni e loro limiti, limiti di funzioni e funzioni continue, derivazione,
integrazione secondo Riemann. I prerequisiti sono quelli di ogni corso di ma-
tematica a livello universitario, e comprendono l’algebra delle scuole supe-
riori, i principi della geometria analitica nel piano, le più importanti formule
della trigonometria e possibilmente la capacità di usare la logica elementare.
In queste dispense mancano, salvo poche eccezioni, esempi ed applicazio-
ni. D’altronde, libri di testo pieni di figure e di esempi banali abbondano
in ogni biblioteca universitaria. Personalmente ho sempre faticato ad im-
parare la matematica su questo genere di libri, e posso garantire che molte
applicazioni sono in realtà accademiche.

Nell’ultimo decennio, l’università italiana ha subito molti cambiamenti.


La (presunta) urgenza di aumentare il numero di laureati ha spinto il legi-
slatore a ridurre e semplificare il percorso formativo degli studenti. Se prima
avevamo – poniamo – cento laureati provenienti da lunghi corsi annuali di
otto mesi, ora abbiamo centoventi laureati che hanno assorbito come spugne
gli stessi contenuti esposti però superficialmente. Non è difficile comprendere
che i corsi di matematica generale per le lauree scientifiche hanno sopportato
tagli ed abusi di ogni sorta. Allo stato attuale delle cose (ma si sa che al peg-
gio non c’è mai fine), l’antico corso di matematica che si estendeva da ottobre
a giugno è ridotto ad un corso di dodici settimane all inclusive. Per amore
o per forza, il programma si è apertamente sbilanciato verso il calculus delle
università americane. Studiando su alcuni libri italiani più recenti, sembra
che tutto si riduca a qualche tecnica di calcolo da apprendere alla stregua del-
la ricetta per fare una torta. Questo approccio non sarebbe privo di utilità,
purché al primo corso di calculus ne seguisse uno di mathematical analysis.
Purtroppo (per chi scrive) o per fortuna (per chi deve ancora laurearsi), nel
corso di laurea in biotecnologie non c’è spazio per un corso avanzato di ma-
tematica. Queste dispense si propongono come un ragionevole compromesso
fra la praticità del calcolo e il rigore dell’analisi matematica.
1
Recentemente, sono apparsi sul mercato testi, non ancora tradotti in italiano, che
vantano una presentazione dell’analisi matematica classica secondo un ordine “naturale”.
Occorre dire che il cammino cronologico della matematica non rispecchia fedelmente quello
dei capitoli delle nostre dispense. La derivabilità è stata studiata euristicamente prima
che si fosse capito il concetto di continuità. Per molti anni ha fatto scuola l’approccio
alla Bourbaki, in cui la deduzione logica prevale sulla storia: se tutte le funzioni derivabili
risultano continue, è meglio allora spiegare innanzitutto che cosa sia una funzione conti-
nua. Personalmente penso che per fare matematica si più conveniente apprenderne le basi
secondo la dipendenza logica. Uno storico della matematica ha probabilmente un’opinione
diversa in materia.
v

La teoria elementare delle successioni viene esposta come primo esempio


per lo studio dei limiti. Infatti, la definizione di limite per una successione
(di numeri reali) è più immediata di quella per una funzione reale di una
variabile reale. Sebbene l’esperienza mi abbia dimostrato che le successioni
non sono un argomento che eccita gli studenti, continuo a credere che can-
cellarle completamente dagli argomenti trattati sarebbe una perdita più che
un guadagno.
Nelle prime pagine ho inserito alcuni cenni, volutamente superficiali e
pratici, di logica booleana elementare. Di fatto, è emerso che la più grande
difficoltà per gli studenti del primo anno è l’abitudine a trarre conclusioni
logiche da ipotesi astratte o sperimentali. È importante, in matematica,
sapere che se un insieme di oggetti è descritto dalla “sovrapposizione” di due
o più condizioni, gli oggetti che non cadono in questo insieme sono quelli che
non soddisfano almeno una dell e suddette condizioni. Altrettanto inevitabile
è l’uso delle espressioni “per ogni” ed “esiste”, che appaiono praticamente in
ogni teorema. Ho comunque preferito non usare la simbologia della logica,
come ∀ al posto di “per ogni”, ∃ al posto di “esiste”, ⇒ al posto di “implica”.
La definizione di continuità per una funzione f : [a, b] → R in x0 si leggerebbe
(∀ε > 0)(∃δ > 0)(∀x ∈ [a, b])(|x − x0 | < δ) ⇒ (|f (x) − f (x0 )| < ε).
Qualunque studente inizia a barcollare di fronte a questa scrittura. Sebbe-
ne la notazione “logica” abbia un’eleganza fuori dall’ordinario, ho preferito
attenermi a un linguaggio più discorsivo.
In alcuni casi, ho privilegiato notazioni e convenzioni minoritarie nella
letteratura italiana. Per fare qualche esempio, ho usato sistematicamente la
notazione operatoriale Df per la derivata di una funzione f . Quasi tutti
scrivono f 0 , ma per uno studente forse è meno evidente che la derivazione è
un’operazione applicata alle funzioni.
Nel contesto delle successioni, ho usato l’aggettivo “divergente” come ne-
gazione di “convergente”. Ciò contrasta con la tradizione italiana, che distin-
gue le successioni divergenti (all’infinito) da quelle oscillanti fra due valori
finiti o infiniti. Per essere espliciti, i testi italiani dicono che {n2 } è una suc-
cessione divergente, mentre {(−1)n } è indeterminata. Capiterà spesso, tutta-
via, di scrivere o pronunciare frasi come “la successione pn tende all’infinito”,
al posto della più corretta “la successione pn diverge a infinito”.
In questa versione aggiornata ho introdotto un breve paragrafo sull’inte-
grazione indefinita. Coerentemente con l’impostazione adottata, mi limito
a qualche cenno. La scelta di trascurare completamente questo argomento
appariva forse arrogante e snob: se un matematico o un fisico possono giudi-
care perfino noiose le tecniche di calcolo delle primitive, un biotecnologo ha
bisogno anche di imparare a fare qualche calcolo di routine.
vi

Il capito sull’integrazione secondo Riemann fornisce una trattazione pi ù


ampia di quella presente in molti libri di testo. Difficilmente c’è il tempo
per discutere tutti i dettagli in aula, ma la scelta di riassumere l’integrazione
definita in due o tre pagine di teoremi calati dall’alto non mi convince.
L’ultimo capitolo è un assaggio di calcolo numerico e approssimato. Sono
fortemente critico sull’opportunità di inserire questi argomenti in un corso di
matematica generale. Delle due l’una: o si insegna un’analisi numerica rigo-
rosa, fatta di teoremi e dimostrazioni, e allora occorrono molte ore di lezione;
oppure si mostra qualche tecnica senza troppi dettagli, e allora servirebbe
una ausilio informatico che renda interessanti i contenuti dal punto di vista
sperimentale. Poiché risulta impossibile, per varie ragione, attuare entram-
be le alternative, forse sarebbe meglio recuperare delle ore per approfondire
argomenti già introdotti.

Concludo con un’osservazione non particolarmente originale. La mate-


matica è come uno sport: senza esercizio non si fa molta strada. Si impara la
matematica facendola, cioè cimentandosi con gli esercizi proposti nelle eserci-
tazioni, con le prove d’esame degli anni precedenti, con gli esercizi dei libri di
testo consigliati, e anche sfruttando le ore di ricevimento dei docenti. L’uso
della rete Internet non è stato inserito fra le fonti principali di apprendimen-
to. Mentre i libri di testo danno una garanzia di correttezza dei contenuti,
la ricerca di materiale on line può portare a spiacevoli sorprese. Consiglio
pertanto di scaricare appunti e esercizi solo da siti ritenuti assolutamente
affidabili. Con rammarico devo sconsigliare allo studente lo studio sui libri
delle scuole superiori. In effetti, il concetto stesso di “dimostrazione rigoro-
sa” appare molto vago in quei libri, e la validità di un teorema è giustificata
sovente con un paio di esempi. Ricordiamo, come scherzoso ammonimento,
la storiella dei tre scenziati che viaggiano in treno: un ingegnere, un fisico e
un matematico. Passando accanto a un recinto di pecore, il primo esclama:
“Tutte le pecore sono bianche”. Il fisico lo corregge: “Tutte le pecore di questo
prato sono bianche”. Interviene infine il matematico: “No, possiamo solo dire
che esiste un prato in cui ci sono delle pecore, e queste pecore hanno almeno
un lato bianco”. A volte si sente dire che il matematico è quello scienziato a
cui piacciono i controesempi più degli esempi.
Per quanto riguarda gli esercizi, molti dei testi elencati in bibliografia (e in
particolare [6] e [13]) ne contengono a volontà. Sul sito del corso sono inoltre
raccolte le prove scritte e quasi tutte le relative soluzioni commentate. Ho
preferito evitare di aggiungere, alla fine di ogni capitolo, la classica pagina
di esercizi consigliati. Per uno studente alle prime armi, un esercizio è utile
soprattutto se è accompagnato da una soluzione completa o almeno parziale.
Tutti ricordiamo la frustrazione provocata da un esercizio che non sapevamo
vii

proprio risolvere. Incoraggio dunque tutti gli studenti ad utilizzare gli esercizi
proposti e risolti in [6].
Sono certo che molti dei miei studenti hanno letto fin qui nella speranza
di trovare la frase che ogni Autore si sente in obbligo di inserire nell’intro-
duzione alla propria opera: mi sono sforzato di rendere la matematica più
interessante, inserendo svariati esempi e modelli presi dalla realtà. Si è molto
discusso sull’opportunità di seguire il metodo “Mary Poppins” per insegnare
la matematica alle matricole.2 L’opinione di chi scrive è che gli argomenti
trattati sono sufficientemente classici e spesso familiari da lasciare spazio a
quel poco di rigore indispensabile in tutte le discipline scientifiche moderne.

Proprietà intellettuale del materiale


Queste dispense sono rese pubbliche senza oneri aggiuntivi mediante pub-
blicazione sul sito internet dell’Autore. È consentito l’uso e la riproduzione
per scopi personali di studio e senza fini di lucro. È altresì vietato apportare
qualsiasi modifica al testo da parte di terzi.
Di ogni errore e imprecisione è responsabile l’autore. Ringrazio fin d’ora
quanti vorranno segnalare considerazioni e commenti sul contenuto di queste
dispense.

Ringraziamenti tecnico–informatici
Queste dispense sono state redatte utilizzando il sistema di scrittura
3
LATEX su computer dotati dei sistemi operativi Apple Mac Os 10.4 e 10.5,
GNU/Linux Slackware 12.2, Microsoft Windows XP, e (saltuariamente) Sun
Solaris 10 su piattaforma AMD64 e PcBSD-7. L’autore è profondamente
grato a Donald Knuth per aver creato a sviluppato il sistema di videoscrit-
tura TEX, senza il quale la stesura di queste note sarebbe stata molto più
complicata. La variante LATEX è stata costruita da Leslie Lamport, ed è il
“dialetto” utilizzato per scrivere queste dispense.
Le figure sono state prodotte dall’autore mediante i programmi XFig4 e
Maple.5 . La figura 5.1 è stata creata invece con il software Asymptote.6

Cantù e Milano, febbraio 2009.


2
Basta un poco di zucchero, e la pillola va giù.
3
Si legge approssimativamente “latek”. L’URL di riferimento è http://www.tug.org
4
http://www.xfig.org
5
Maple è un marchio registrato di Maplesoft Inc. http://www.maplesoft.com
6
http://asymptote.sourceforge.net
viii
Capitolo 1

Insiemi e Funzioni

1.1 Cenni di logica elementare


Qualunque scienza esatta è fondata sul ragionamento logico– deduttivo. Per
noi, questo significa che seguiremo alcune leggi di calcolo con le proposizioni.
Non avendo né l’obiettivo, né tantomeno il tempo per occuparci della relativa
teoria, ci limiteremo a brevi cenni.

Innanzitutto, gli oggetti delle nostra logica for dummies sono le propo-
sizioni, cioè frasi di senso compiuto. Indicheremo le proposizioni con lettere
minuscolo, ad esempio p, q, r, ecc. Una proposizione potrebbe essere “se
piove, prendo l’ombrello”, oppure “la mia squadra del cuore è l’Inter”.
Esattamente come i numeri sono gli atomi del calcolo numerico, le pro-
posizioni sono i mattoni con cui costruire il linguaggio della matematica.. Si
pensi ad un teorema, che ha la forma “Se è vera p, allora è vera q”. Ogni
proposizione assume, nella logica classica, due valori: vero (V) o falso (F).1
Esaminiamo rapidamente le principali operazioni con le proposizioni.

Definizione 1.1. Data una proposizione p, la sua negazione è la proposizione


∼ p, che risulta vera quando p è falsa, e falsa quando p è vera. Quindi la
sua tavola di verità è
p ∼p
V F
F V
Ovviamente, la negazione di una proposizione si effettua seguendo l’in-
tuizione: la negazione di “oggi piove” è “oggi non piove”. Occorre prestare
1
Gli informatici usano 1 per la verità e 0 per la falsità. Segnaliamo che esiste una logica,
detta “fuzzy”, in cui una proposizione può essere qualcosa di diverso da vero o falso.

1
2 CAPITOLO 1. INSIEMI E FUNZIONI

attenzione alle insidie del linguaggio comune. Infatti, sarebbe sbagliato affer-
mare che la negazione di “oggi piove” è “oggi c’è il sole”. In effetti, potrebbe
anche nevicare!
Definizione 1.2. Date due proposizioni p e q, la loro congiunzione p ∧ q (si
legge: p e q) è vera se e solo se sia p che q sono vere, e falsa in tutte le altre
situazioni. La tavola di verità della congiunzione è pertanto
p q p∧q
V V V
V F F
F V V
F F F
In pratica, congiungere due proposizioni significa metterle a sistema: in
particolare, p ∧ (∼ p) è sempre falsa.
Definizione 1.3. Date due proposizioni p e q, la loro disgiunzione p ∨ q (si
legeg: p o q) è vera quando almeno una fra p e q è vera, e falsa altrimenti.
La tavola di verità risulta pertanto
p q p∨q
V V V
V F V
F V V
F F F
Osservazione 1.4. Lo studente faccia attenzione: l’operazione di disgiun-
zione è intesa in senso largo, non in senso esclusivo. Nel linguaggio comune,
si usa “oppure” per escludere l’eventualità che entrambe le proposizioni siano
vere. In matematica, “oppure” non esclude affatto la verità simultanea dei
due argomenti. In particolare non è contraddittorio dire che “2 è un numero
pari oppure 3 è dispari”.
Veniamo infine all’operazione su cui si costruiscono i teoremi: l’implica-
zione.
Definizione 1.5. Date due proposizioni p e q, l’implicazione p ⇒ q (si legge:
p implica q, oppure “se p allora q”) risponde alla tavola di verità
p q p⇒q
V V V
V F F
F V V
F F V
1.1. CENNI DI LOGICA ELEMENTARE 3

Infine, scriveremo brevemente p ⇔ q (da leggere “p se e solo se q”, oppure


“p equivale a q”) per indicare la proposizione (p ⇒ q) ∧ (q ⇒ p).
Lo studente legga bene la definizione precedente. Non è proprio in li -
nea con le aspettative della nostra intuizione, soprattutto nel momento in
cui si afferma che “falso implica falso” è vero. In realtà, viene semplicemente
sostenuto che da un’ipotesi falsa può essere tranquillamente dedotta una con-
clusione falsa. Si ricordi che la logica proposizionale non giudica il contenuto
delle singole proposizioni, ma solo le regole con cui si opera su di esse.
Come detto, i teoremi saranno sempre scritti nella forma, o in forme a
questa rincoducibili, Se p allora q. Lo studente, per esercizio, scriva la tavola
di verità di p ⇒ q e di (∼ q) ⇒ (∼ p). Il fatto che coincidano non è casuale,
ed anzi costituisce la tecnica di dimostrazione per antinomia.

Concludiamo con qualche parola sui quantificatori.


Definizione 1.6. Il quantificatore universale ∀ si legge “per ogni”, mentre il
quantificatore esistenziale ∃ si legge “esiste”.
I quantificatori permettono di comporre proposizioni articolate. Ad e
sempio
(∀x ∈ R)(∃n ∈ N)(n > x)
si legge “per ogni numero reale x esiste un numero naturale n tale che n
è maggiore di x”. Inoltre i quantificatori si negano scambiandoli: la nega-
zionei di “per ogni” è “esiste”, e viceversa. La negazione della precedente
proposizione è dunque

(∃x ∈ R)(∀n ∈ N)(n ≤ x),

cioè “esiste un numero reale x tale che, per ogni numero naturale n, risulta
n è minore o uguale a x”.

Vediamo ora alcuni esempi.


1. Siano p = p(x) = (“x è un numero negativo”) e q = q(x) = (“x2 ≥ 2”).
Allora l’insieme E = {x ∈ R | p(x) ∧ q(x)} è l’insieme dei numeri reali
√ grande (o uguale) di 2. Dunque stiamo
negativi, il cui quadrato è più
descrivendo l’insieme (−∞, 2].
2. Usando le rispettive tavole di verità, si verifica in pochi istanti che
p ⇒ q è logicamente equivalente a (∼ p) ∨ q. A parole, affermare che p
implica q significa affermare che o l’ipotesi p è falsa, oppure che è vera
la tesi q. In particolare, l’implicazione ⇒ non è un concetto primitivo,
alla pari di ∧ e ∨.
4 CAPITOLO 1. INSIEMI E FUNZIONI

3. Descriviamo il complementare dell’insieme

E = {x ∈ Z | x è dispari e ex ≤ 7}.

Posto p(x) = (“x è dispari”) e q(x) = (“ex ≤ 7”), osserviamo che E =


{x ∈ Z | p(x) ∧ q(x)}. Quindi il suo complementare è, per definizione,
Z \ E = {x ∈ Z |∼ p(x) ∧ q(x)} = {x ∈ Z | (∼ p(x)) ∨ (∼ q(x))} =
{x ∈ Z | x è pari oppure ex > 7}. Poiché log 7 ≈ 1.9, abbiamo una
descrizione esplicita del complementare:

Z \ E = {x ∈ Z | x è pari} ∪ (Z ∩ [2, +∞)).

4. Vogliamo negare la proposizione “Per ogni numero reale ε > 0 esiste un


numero reale δ > 0 tale che la propriet à P è vera”. Seguendo le regole
di negazione dei quantificatori, possiamo concludere che la negazione
di questa proposizione è “Esiste un numero reale ε > 0 tale che per
ogni numero reale δ > 0 la proprietà P è falsa”. Nel seguito avremo
occasione di applicare questo ragionamento abbastanza spesso.
Lo studente interessato ad approfondire la logica elementare e il calcolo
proposizionale, può consultare il primo capitolo del libro [20].

1.2 Richiami di insiemistica


Un noto proverbio recita Chi ben comincia ha la metà dell’opera.2 È un modo
gentile per sostenere che la parte più difficile di ogni impresa è l’inizio; il resto
verrà da sé. L’apprendimento dela matematica non fa eccezione a questa
regola, e addirittura si prendono delle scorciatoie. Alle scuole elementari
tutti noi abbiamo imparato a fare i conticini, ma forse nessuno ha imparato
la definizione di numero.
Anche il concetto di insieme è considerato, nella matematica elementare,
come un concetto primitivo. Questo significa che non faremo alcuno sforzo
per definirlo in termini di altri concetti già noti. Brevemente, un insieme sarà
per noi un raggruppamento3 di oggetti di natura ben specificata. Parleremo
pertanto dell’insieme delle automobili di colore rosso, come pure dell’insieme
dei gatti dagli occhi verdi.
Nota linguistica. Nelle principali lingue neolatine il sostantivo per indi-
care l’insieme matematico ha lo stesso significato doppio che ha in italiano.
2
È forse più diffusa la versione in italiano moderno Chi ben comincia, è a metà
dell’opera.
3
Oppure una collezione.
1.2. RICHIAMI DI INSIEMISTICA 5

Infatti, si usa conjunto in spagnolo, ensemble in francese, insieme in italia-


no. Questo si rispecchia nel significato intuitivo che un insieme è proprio
un raggruppamento di oggetti, che sono “messi insieme”. Il rumeno si disco-
sta leggermente con mulţime, chiaramente indicativo di una moltitudine di
oggetti. In inglese, invece, si usa il sostantivo set, e si parla di set theory.
Qui si coglie una sfumatura più pragmatica, come a voler sottolineare che un
insieme è qualcosa che viene organizzato, disposto, quasi “pronto all’uso”.
È consuetudine4 denotare gli insiemi con lettere maiuscole dell’alfabeto
latino:
A, B, C, X, Y, Z, . . .
Come detto, ogni insieme è formato dai suoi elementi, di qualunque natura
essi siano. In matematica, l’appartenenza di x all’insieme X è indicato dal
simbolo
x ∈ X.
Quindi, per ogni insieme X, risulta che5

X = {x | x ∈ X}.

Il fatto che l’elemento x non appartiene all’insieme X, si esprime scrivendo

x∈
/ X.

Allo studente dovrebbero essere familiari le operazioni elementari sugli


insiemi, cioè l’unione, l’intersezione, il complementare di insiemi. Ricordiamo
che

X ∪Y = {x | x ∈ X oppure x ∈ Y }
X ∩Y = {x | x ∈ X e x ∈ Y }
Xc = {x | x ∈
/ X}
X \Y = {x | x ∈ X e x ∈
/ Y }.

Vogliamo chiarire che la congiunzione “oppure” viene usata dai matemati-


ci in senso lato: x ∈ X ∪ Y significa che x appartiene ad almeno uno dei
due insiemi X ed Y , ed eventualmente ad entrambi. Nella lingua italiana,
l’affermazione “esco oppure resto a casa” è interpretata in maniera esclusi-
va, essendo piuttosto improbabile che io possa essere contemporaneamente
4
In certi settori della matematica, capita di denotare un insieme con una lettera
minuscola o addirittura con lettere di alfabeti non latini.
5
la sbarra verticale |, spesso sostituita dai due punti, si legge “tali che”. Quindi la
scrittura seguente si legge “X è l’insieme degli elementi x tali che x appartiene ad X”.
6 CAPITOLO 1. INSIEMI E FUNZIONI

dentro e fuori casa. A volte può capitare di dover scrivere proprio un’unione
esclusiva, e in matematica si usa la scrittura

X∆Y = {x | x appartiene a X o a Y ma non ad entrambi}


= (X ∪ Y ) \ (X ∩ Y ).

Il fatto che gli elementi di un insieme E appartengano anche a un (altro)


insieme X si scrive
E ⊂ X oppure X ⊃ E.

Osservazione 1.7. A scanso di equivoci, sottolineiamo che, per noi, scrivere


E ⊂ X non esclude affatto che E = X. Alcuni testi usano il simbolo ⊂ in
senso esclusivo, mentre usano E ⊆ X per dire quello che noi diciamo con
E ⊂ X. Si tratta di convenzioni, e crediamo che il lettore di questi appunti
non avrà mai occasione per rimpiangere le convenzioni adottate.

Probabilmente meno nota è la costruzione del prodotto cartesiano di due


insiemi. Nel nostro corso non avremo grandi occasioni di farne uso, ma
preferiamo spendere qualche parola visti i legami con il piano cartesiano.

Definizione 1.8. Dati due insiemi X ed Y , il loro prodotto cartesiano X ×Y


è l’insieme i cui elementi sono coppie ordinate del tipo (x, y) dove x ∈ X ed
y ∈Y.

L’aggettivo “ordinate” si riferisce alla seguente proprietà: due coppie (x, y)


e (x0 , y 0 ) sono uguali se e solo se x = x0 , y = y 0 .

Lo studente che volesse approfondire ulteriormente le problematiche della


moderna teoria degli insiemi, può riferirsi all’appendice di [19].

1.3 Insiemi numerici


Durante lo studio del nostro corso, lo studente si imbatterq̀uasi esclusiva-
mente con insiemi di numeri. Ci sembra utile richiamare brevemente la
terminologia dei principali insiemi numerici.
L’insieme dei numeri naturali, i primi numeri che l’uomo ha utilizzato
nella vita quotidiana, è indicato dal simbolo N. Pertanto,6

N = {0, 1, 2, 3, 4, 5, 6, . . . }.
6
Alcuni libri di testo preferiscono escludere lo zero 0 da N. È una scelta supportata
solo dal proprio gusto.
1.3. INSIEMI NUMERICI 7

Se a questi numeri aggiungiamo anche i numeri negativi, otteniamo l’insieme


dei numeri interi relativi Z, cioè

Z = {. . . , −5, −4, −3, −2, −1, 0, 1, 2, 3, 4, 5, . . . }.

La necessità di dividere fra loro dei numeri interi relativi ha spinto a costruire
un insieme più capiente di numeri, detti numeri razionali. Precisamente,
 
p
Q= | p, q ∈ Z, q 6= 0 .
q

Daremo per scontati i discorsi sulla possibilità di scrivere lo stesso numero


razione in infiniti modi diversi, sulla riduzione delle frazioni ai minimi termini,
e così via.7 L’ultimo insieme numerico che introduciamo, è anche quello
più importante. Purtroppo, la sua costruzione non è affatto elementare, né
è possibile specificare semplicemente che cosa occorra aggiungere a Q per
ottenerlo. Si tratta dell’insieme dei numeri reali R. Possiamo pensare a
R come all’insieme dei punti di una retta.8 Nonostante questa difficoltà
tecnica, i numeri reali sono ormai parte integrante della cultura di qulunque
studente delle scuole superiori. È un dato di fatto che l’uso dei numeri reali
è di facilissimo apprendimento, senza dubbio agevolato dalla diffusione delle
calcolatrici tascabili negli ultimi vent’anni. Gli sparuti studenti interessati a
capire meglio come nascano rigorosamente i numeri reali, possono consultare
uno dei testi indicati in bibliografia, ad esempio [3, 6].
Non ci sembra il caso di insistere sul fatto che9

N ⊂ Z ⊂ Q ⊂ R.

Nell’affrontare la teoria dei limiti, ci sarà utile la seguente proprietà dei nu-
meri naturali rispetto ai numeri reali. La dimostrazione può essere letta
in [24].
7
Algebricamente, Q è il primo insieme numerico, a parte l’ovvietà della costruizione di
Z, costruibile in maniera elementare ma non banale. Precisamente, i numeri razionali sono
delle classi di equivalenza di coppie ordinate di numeri interi con segno. Se lo studente
non ha capito nemmeno una parola dell’ultima frase, non è grave. In parole povere, la
frazione 1/2 è la coppia ordinata (1, 2), e il fatto che 1/2 = 2/4 = 3/6 = . . . si rispecchia
nell’introduzione di una “regola”, la relazione di equivalenza, che considera uguali le coppie
(1, 2), (2, 4), (3, 6), ecc.
8
Già quarant’anni fa, Walter Rudin osservava nella prefazione del suo libro [24] che la
maggior parte degli studenti non sente la necessità di costruire l’insieme dei numeri reali,
almeno in prima battuta.
9
In realtà, non si tratta di vere inclusioni insiemistiche; piuttosto dovremmo parlare di
immersioni.
8 CAPITOLO 1. INSIEMI E FUNZIONI

Proposizione 1.9 (Proprietà archimedea dei numeri reali). Per ogni y ∈ R


ed ogni x > 0 reale, esiste n ∈ N tale che nx > y.
Per i nostri scopi, applicheremo quasi esclusivamente il seguente
Corollario 1.10. Per ogni numero reale x > 0, esiste un numero naturale
n tale che n > x.
Dim. Ovviamente è una conseguenza diretta della Proposizione precedente.
Però si dimostra anche in modo elementare: immaginiamo che x sia scritto
nella sua espansione decimale, e “arrotondiamolo” al numero intero n succes-
sivo. Per esempio, se x = 1475.1234567, lo arrotondiamo a n = 1476. Questo
numero naturale n è quello cercato.
Una proprietà meno nota dei numeri reali è la seguente.
Proposizione 1.11. Fra due numeri reali qualsiasi e distinti, cade sempre
un numero razionale.
Non esponiamo la dimostrazione di questo fatto, che il lettore interessato
potrà studiare in [24]. Ci limitiamo ad osservare che da questa proposizione
deriva la possibilità di approssimare, con errore scelto a piacere, ogni numero
reale con un numero razionale. Infatti, sia x un numero reale, e sia ε > 0
l’errore con cui vogliamo approssimare x mediante un numero reale. Dalla
Proposizione precedente, applicata ai due numeri reali distini x − ε e x + ε,
deduciamo c he esiste un numero razionale q tale che x − ε ≤ q ≤ x + ε.
Pertanto |x − q| ≤ ε, come volevasi dimostrare.
Nota tipografica: simboli altrettanto diffusi per denotare i precedenti
insiemi numerici sono N, Z, Q e R.

Concludiamo questo paragrafo con alcune considerazioni sul valore asso-


luto di un numero reale.
Definizione 1.12. Il valore assoluto (spesso detto anche modulo) di un
numero reale x è definito come
(
x, se x ≥ 0
|x| =
−x, se x < 0

Operativamente, la definizione del valore assoluto di un qualsiasi numero


reale x è basata sul controllo del segno di x. Se x è positivo o nullo, viene
restituito il valore x. Se x è negativo, viene restituito il valore −x. Qualche
volta si trova scritto che “|x| è il numero x, senza segno”. Questa affermazione
è suggestiva ma priva di senso: tutti i numeri reale hanno un segno!
1.3. INSIEMI NUMERICI 9

Lemma 1.13. Per ogni x, y, z ∈ R, vale la disuguaglianza triangolare


|x − y| ≤ |x − z| + |z − y|. (1.1)
Dim. Basta dimostrare che, per ogni a, b ∈ R, vale la disuguaglianza
|a + b| ≤ |a| + |b|. (1.2)
Infatti, scegliendo a = x−z e b = z−y, da questa segue subito |x−z+z−y| =
|x − y| ≤ |x − z| + |z − y|, che è la tesi. Siano quindi a e b due numeri reali
qualunque. Distinguiamo vari casi.
1. Se a = 0 oppure b = 0, la tesi è ovvia.
2. Se a > 0 e b > 0, allora a+b ≥ 0. Vogliamo dimostrare che a+b ≤ a+b,
ma questo è ovvio.
3. Se a < 0 e b < 0, allora a + b < 0. Pertanto vogliamo dimostrare che
|a + b| = −a − b ≤ −a − b, e ancora una volta questa relazione è ovvia.
4. Se i due numeri a e b sono l’uno positivo e l’altro negativo, a primo
membro di (1.2) abbiamo la differenza fra due numeri positivi, e a
secondo membro abbiamo la loro somma. Ovviamente il primo membro
è minore del secondo.
Avendo verificato la tesi in tutti i casi possibili, la dimostrazione è completa.

Concludiamo con qualche informazione sulle diseguaglianze che coinvol-


gono i valori assoluti. Lo studente apprezzerà queste informazioni leggendo
il capitolo sui limiti.
Lemma 1.14. Per ogni ε > 0,
{x ∈ R : |x| ≤ ε} = {x ∈ R : −ε ≤ x ≤ ε}
{x ∈ R : |x| ≥ ε} = {x ∈ R : x ≤ −ε} ∪ {x ∈ R : x ≥ ε}

Dim. Dimostriamo la prima uguaglianza. Essendo un’uguaglianza fra due


insiemi, occorre dimostrare la doppia inclusione. Sia dunque x un numero
reale tale che |x| ≤ ε. Questo vuol dire che x ≤ ε se x ≥ 0, e che −x ≤ ε se
x < 0. Nel primo caso, 0 ≤ x ≤ ε, nel secondo −ε ≤ x < 0. L’insieme delle
“soluzioni” sarà l’unione di queste condizioni, cioè −ε ≤ x ≤ ε. Abbiamo
dimostrato che
{x ∈ R : |x| ≤ ε} ⊂ {x ∈ R : −ε ≤ x ≤ ε}
10 CAPITOLO 1. INSIEMI E FUNZIONI

Viceversa, sia x un numero reale tale che −ε ≤ x ≤ ε. Allora |x| è un numero


reale, non negativo, non superiore a ε. Quindi

{x ∈ R : |x| ≤ ε} ⊃ {x ∈ R : −ε ≤ x ≤ ε}

e pertanto i due insiemi a primo e a secondo membro coincidono. Lasciamo


allo studente la verifica della seconda uguaglianza, imitando i ragionamenti
appena visti.

Passando dai simboli alle parole, il Lemma precedente ci dice che la


relazione
|x| ≤ ε
equivale a
−ε ≤ x ≤ ε.
Similmente, la relazione
|x| ≥ ε
equivale a
x ≤ −ε oppure x ≥ ε.

Osservazione 1.15. Occorre fare attenzione quando si utilizzano quantità


aribitrarie. Ad esempio, se x è un numero reale tale che |x| < ε per ogni
ε > 0, allora x = 0. Se infatti x fosse diverso da zero, allora potremmo
scegliere ε = |x|/2 e avremmo la contraddizione |x| ≥ ε. A parole, stiamo
dicendo che l’unico numero non negativo arbitrariamente piccolo è lo zero.

1.4 Topologia della retta reale


In questa breve sezione, il lettore vedrà delle idee e dei simboli certamente già
noti fin dalle scuole medie. Eppure, dubitiamo che i professori delle scuole
medie gli abbiano mai parlato di topologie. La topologia 10 è un ramo della
matematica che si occupa di studiare in astratto il concetto di “forma”. In
che senso possiamo deformare un oggetto di gomma, cambiandone l’aspetto
esteriore, senza però dire che si rtatta di un oggetto differente? A questa e
ad altre domande tenta di rispondere proprio la topologia. Ovviamente, i
nostri numeri reali sono un caso molto particolare di “spazio topologico”, e
noi ci accontenteremo di formalizzare alcuni concetti utili nel resto del corso.
10
Dal greco topos e logos, dunque “conoscenza della forma”.
1.4. TOPOLOGIA DELLA RETTA REALE 11

Definizione 1.16. Siano a e b due numeri reali. Diciamo che a < b (a è


minore di b) se b − a è un numero positivo. Se b − a è un numero negativo,
diremo al contrario che a > b. Il simbolo a ≤ b indica il fatto che b − a è
positivo oppure zero, e analogamente a ≥ b. 11

Definizione 1.17. Sia E ⊂ R un sottoinsieme dei numeri reali. Un numero


M ∈ R è un maggiorante per E se

x≤M per ogni x ∈ E.

Analogamente, un numero m ∈ R è un minorante per E se

x ≥ m per ogni x ∈ E.

Un insieme E di numeri reali è limitato dall’alto se possiede un maggiorante,


mentre è limitato dal basso se possiede un minorante.

Per esempio, N è limitato dal basso poiché ogni numero naturale è mag-
giore o uguale a zero. Tuttavia N non è limitato dall’alto, perché esistono
numeri naturali grandi quanto vogliamo.

Definizione 1.18. Sia E un sottoinsieme di R, limitato dall’alto. L’estremo


superiore di E, denotato con
sup E,
è definito come il più piccolo di tutti i maggioranti di E. Analogamente,
l’estremo inferiore di E,
inf E,
è definito come il più grande di tutti i minoranti di E.

Osservazione 1.19. In generale, inf E e sup E non appartengono ad E. Si


confronti con la definizione di minimo e massimo nelle prossime pagine.

Sarà comodo, nel seguito, usare delle notazioni meno rigide per inf e sup.
Ad esempio, scriveremo
1
inf = 0
n∈N n

invece di  
1
inf | n ∈ N = 0.
n
11
Questa definizione, a pensarci bene, fatica a stare in piedi. Come definire un numero
positivo x, se non chiedendo che x > 0? È un circolo vizioso. Tuttavia, speriamo che lo
studente sappia distinguere un numero positivo da uno negativo in maniera quasi inconscia.
12 CAPITOLO 1. INSIEMI E FUNZIONI

La prima notazione, che sembra interpretare inf come un’operazione sui nu-
meri invece che sugli insiemi, fa il paio con la notazione per le unioni e le
intersezioni di insiemi. Infatti, se A1 , A2 e A3 sno tre insiemi qualsiasi, si
scrive
[3
Ai
i=1
invece di [ [
{A1 , A2 , A3 } = {Aj | i ∈ {1, 2, 3}} .
Queste notazioni abbreviate hanno qualche risvolto curioso. Se E è un
insieme di numeri reali, la scrittura
sup x
x∈E

coincide in tutto e per tutto con sup E, ma questa volta non possiamo dire
che sia preferibile. Ne traiamo una morale: le notazioni con il pedice sono
preferibili quando l’insieme su cui agiscono inf e sup hanno una descrizione
di tipo “funzionale” {f (x) | x ∈ E}. Per un approfondimento delle notazioni
insiemistiche, consigliamo il libro di P. Halmos [15] e quello di J. Kelley [19].
In quest’ultimo si suggerisce anche la notazione
E x2 < 1

x∈R

per significare l’insieme {x ∈ R | x2 < 1}. Possiamo ritenerci fortunati che


questa notazione non abbia mai preso piede!
Lemma 1.20. M ∈ R è l’estremo superiore di E se e solo se
1. M ≥ x per ogni x ∈ E;
2. per ogni ε > 0 esiste x ∈ E tale che M − ε ≤ x ≤ M .
Una caratterizzazione analoga vale per l’estremo inferiore.
Lemma 1.21. m ∈ R è l’estremo inderiore di E se e solo se
1. m ≤ x per ogni x ∈ E;
2. per ogni ε > 0 esiste x ∈ E tale che m ≤ x ≤ m + ε.
Non dimostriamo in questi appunti i due lemmi precedenti. Spendiamo
qualche parola sul loro significato. Il primo, ad esempio, ci dice che l’estremo
superiore di un sottoinsieme E di R è quel numero M che innanzitutto è un
maggiorante. E, in secondo luogo, ci devono essere elementi di E vicini a
piacere a M .
1.5. L’INFINITO 13

Definizione 1.22. Sia E un sottoinsieme limitato (dall’alto e dal basso) di


R, e poniamo m = inf E, M = sup E. Diciamo che m è il minimo di E se
m ∈ E, e che M è il massimo di E se M ∈ E.

Notiamo che questa definizione non è superflua. Nessuno ci garantisce


che l’estremo superiore di un insieme sia un elemento di tale insieme. In
generale, è solo un numero reale. Quindi, l’estremo superiore diventa il mas-
simo esattamente quando appartiene all’insieme in considerazione. Simili
considerazioni valgono ovviamente per l’estremo inferiore.

Definizione 1.23. Siano a < b due numeri reali. Gli insiemi

(a, b) = {x ∈ R | a < x < b}


[a, b] = {x ∈ R | a ≤ x ≤ b}
[a, b) = {x ∈ R | a ≤ x < b}
(a, b] = {x ∈ R | a < x ≤ b}.

si chiamano rispettivamente intervallo aperto, chiuso, chiuso a sinistra, chiu-


so a destra, di estremi a e b.

Osservazione 1.24. Per ricordare queste definizioni, possiamo dire che la


parentesi quadra corrisponde ad un estremo compreso, mentre quella tonda
corrisponde ad un estremo escluso. Alcuni libri usano la notazione ]a, b[ al
posto di (a, b), ecc.

Definizione 1.25. Sia x0 ∈ R un numero reale fissato. Si chiama intorno


di x0 qualunque intervallo aperto (a, b) tale che x ∈ (a, b).

Quindi ogni numero reale possiede infiniti intorni. Spesso conviene uti-
lizzare intorni simmetrici, della forma (x0 − δ, x0 + δ), dove δ > 0 si chiama
raggio dell’intorno.
Esercizio. Invitiamo lo studente a dimostrare che, se E = (a, b), allora
inf E = a, sup E = b. Inoltre, inf[a, b) = a = min[a, b), e sup[a, b) = b, ma b
non è il massimo di [a, b).

1.5 L’infinito
Nello studio dell’analisi matematica, lo studente si imbatte in un concetto
assolutamente nuovo: quello di infinito. Mentre Algebra e Geometria ele-
mentari si occupano di quantità finite (numeri, rette, piani, ecc.), l’Analisi
14 CAPITOLO 1. INSIEMI E FUNZIONI

vuole formalizzare l’idea vaga di avvicinarsi indefinitamente a qualcosa. In-


troduciamo in questa sezione, secondo una logica assai pratica, il simbolo ∞
e il suo significato.
Definizione 1.26. Per i nostri scopi, ∞ è un simbolo privo di significato
numerico.
Invitiamo il lettore a trattenere il sorriso sarcastico che la definizione
precedente potrebbe generare.12 Chiunque abbia studiato per qualche tempo
la filosofia antica e medioevale ricorda certamente gli sforzi e le acrobazie
messi in atto dai pensatori per motivare il conceto di infinito: qualcosa senza
limiti spaziali o temporali, addirittura un ente metafisico vicino alla divinità.
Nell’economia del nostro corso, non serve definire rigorosamente il simbo-
lo ∞. A noi interessa piuttosto usare ∞ come abbreviazione per esprimere
concetti già noti. Si tratta dunque di stipulare opportune convenzioni nelle
quali ∞ è una mera abbreviazione tipografica, quasi un simbolo stenografi-
co. Per esempio, se un insieme E ⊂ R non è limitato dall’alto, si conviene di
scrivere
sup E = +∞.
e se E non è limitato dal basso,

inf E = −∞.

In particolare, +∞ sembra nascondere l’idea di muoversi indefinitamente


verso destra lungo la retta (orientata) dei numeri reali. Per analogia, −∞
significa in qualche senso muoversi indefinitamente verso sinistra su tale retta.
Vogliamo però mettere in guardia lo studente dal compiere un errore fra i più
frequenti ed ingenui: +∞ e −∞ non sono numeri reali ! In particolare, ad
essi non si applicano le consuete operazioni algebriche di somma, sottrazione,
moltiplicazione e divisione.13
Vogliamo tuttavia ricordare che la Matematica moderna introduce il con-
cetto di infinito anche con significati diversi. In Geometria Proiettiva e in
Analisi Complessa si parla altrettanto spesso di infinito, sebbene da un punto
di vista più geometrico.
Osservazione 1.27. Molti libri introducono la cosiddetta retta reale estesa
R̄ = R ∪ {−∞} ∪ {+∞}, ottenuta aggiungendo ai consueti numeri reali i due
12
Chi scrive, ricorda una definizione sul proprio libro di Algebra, in cui si diceva “...
dove x è un simbolo al quale non attribuiremo alcun significato”.
13
Sappiamo che qualche studente più esperto potrebbe dire che, con i limiti, si fanno
le operazioni su ∞. Questo è parzialmente vero, e in certe discipline conviene definire
0 · ∞ = 0. L’esistenza delle forme di indecisione ci lascia però intendere che in questa
definizione il simbolo ∞ ha un significato diverso da quello che gli abbiamo finora attibuito.
1.6. PUNTI DI ACCUMULAZIONE 15

infiniti dotati di segno. Ovviamente, si richiede che, per ogni numero reale
x,
−∞ < x < +∞.
È possibile una (parziale) aritmetizzazione di R̄ estendendo le quattro ope-
razioni: per ogni x ∈ R si definisce
x + ∞ = +∞, x − ∞ = −∞
+∞ + ∞ = +∞, −∞ − ∞ = −∞
e ( (
+∞ se x > 0 −∞ se x > 0
x · (+∞) = x · (−∞) =
−∞ se x < 0, +∞ se x < 0,
(+∞) · (+∞) = +∞, (+∞) · (−∞) = −∞, (−∞) · (−∞) = +∞
Non si dà invece alcun senso alle scritture
+∞ − ∞, −∞ + ∞.
Il caso 0·(±∞) è particolare: esistono settori della matematica in cui conviene
porre 0 · (±∞) = 0, ad esempio la Teoria della Misura. Nell’Analisi Mate-
matica elementare, è opportuno evitare di definire questo prodotto, poiché
creerebbe pericolose confusioni al calcolo dei limiti. Per uno studente di un
primo corso di matematica, l’uso della retta reale estesa non presenta parti-
colari utilità, e nel resto delle dispense non utilizzeremo mai questo ambiente
numerico.

1.6 Punti di accumulazione


Introduciamo un concetto che appartiene di diritto alla matematica moderna
e che permette notevoli semplificazioni nei discorsi che faremo più avanti.
Definizione 1.28. Sia E un sottoinsieme di R. Diremo che il punto x0 ∈ R
è un punto di accumulazione per l’insieme E se, preso un qualsiasi intorno
I di x0 , si verifica che (I \ {x0 }) ∩ E 6= ∅. A parole, ogni intorno I di x0
contiene un punto di E, diverso da x0 .
Per esempio, il punto x0 = 0 è di accumulazione per
 
1 1 1 1
E = 1, , , , . . . , , . . . .
2 3 4 n
Infatti, sia I = (a, b) un intorno di 0; in particolare a < 0. Scegliamo n
naturale tale che 1/n < b. Perciò 1/n ∈ I ∩ E, e poiché 1/n 6= 0 abbiamo
16 CAPITOLO 1. INSIEMI E FUNZIONI

verificato la nostra affermazione. Lo studente potrà verificare senza sforzo


che i punti di accumulazione per un intervallo chiuso qualsiasi [a, b] sono tutti
e soli i punti di [a, b]. Invece, i punti di accumulazione di un intervallo aperto
(a, b) sono i punti di [a, b] (ci sono anche i punti a e b!).
Un esempio di natura opposta è il seguente. L’insieme N ⊂ R non possie-
de punti di accumulazione. Infatti, se scegliamo un qualsiasi numero naturale
n ∈ N, l’intorno I = (n − 1/2, n + 1/2) non contiene alcun numero naturale
ad eccezione di n stesso. Per mettere ulteriormente in luce il senso dell’esclu-
sione del punto x0 nella definizione di punto di accumulazione, consideriamo
l’insieme E = {0} ∪ (1, 2). A parole, E è composto dal singolo punto 0 e
dall’intervallo aperto (1, 2). Domanda: quali sono i punti di accumulazione
di E?
La risposta è che i punti di accumulazione di E sono esattamente i punti
dell’intervallo [1, 2]. Infatti, il punto “isolato” 0 non può essere di accumula-
zione, visto che ogni suo intorno (−δ, δ) con δ < 1 interseca E solo nel punto
0 stesso.

Può essere utile, in certi casi, adattare al simbolo ∞ alcuni concetti propri
dei punti al finito. Ad esempio, un intorno di +∞ è un qualsiasi intervallo
della forma (a, +∞), e similmente un intorno di −∞ è un qualsiasi intervallo
della forma (−∞, b). Lasciamo allo studente il seguente spunto di riflessione:
se E è un sottinsieme di R, quando +∞ è un punto di accumulazione per E?
E quando lo è −∞? Le risposte sono abbastanza semplici. In particolare,
lo studente si convincerà che +∞ è un punto di accumulazione per E = N,
l’insieme dei numeri naturali.

1.7 Appendice: la dimostrazione per induzione


Nello studio del calcolo, si incontrano spesso identità e formule che coinvolo-
gno i numeri naturali. Cerchiamo di formalizzare un metodo di dimostrazione
valido in queste situazioni.
Supponiamo che, per ogni valore dell’indice naturale n, P (n) sia una
proposizione logica. Supponiamo inoltre di poter dimostrare le seguenti
affermazioni:

1. esiste n0 ∈ N tale che P (n0 ) è vera;

2. Se è vera P (n), allora è vera anche P (n + 1).

Le proprietà dell’insieme N dei numeri naturali permettono di dimostrare che


la proposizione P (n) è allora vera per ogni n ≥ n0 .
1.7. APPENDICE: LA DIMOSTRAZIONE PER INDUZIONE 17

A parole, per dimostrare la validità di un’affermazione per ogni n natu-


rale, basta dimostrarla per n = 1, e poi dimostrare che la validità di P (n)
implica la validità di P (n + 1). Cerchiamo di chiarire il concetto con un
esempio.

Esempio: la disuguaglianza di Bernoulli. Dimostriamo che

(1 + x)n ≥ 1 + nx, per ogni x > −1 e per ogni n ∈ N.

Procediamo per induzione sul numero naturale n. Per n = 1, dobbiamo


dimostrare che 1 + x ≥ 1 + x, il che è palesemente vero. Supponiamo che la
disuguaglianza sia vera per n, e dimostriamo che deve essere vera anche per
n + 1. Quindi, per ipotesi,

(1 + x)n ≥ 1 + nx, per ogni x > −1 e per ogni n ∈ N.

Che cosa dobbiamo dimostrare? Scriviamo n + 1 al posto di n nella disugua-


glianza di Bernoulli, e troviamo

(1 + x)n+1 ≥ 1 + (n + 1)x.

Questo è il nostro obiettivo. Ma (1 + x)n+1 = (1 + x)n (1 + x) ≥ (1 + nx)(1 +


x) = 1 + x + nx + nx2 ≥ 1 + x + nx = 1 + (n + 1)x. Osserviamo che abbiamo
usato la validità della disuguaglianza per n e abbiamo trascurato il termine
nx2 ≥ 0 nell’ultimo passaggio. Il principio di induzione garantisce allora che
la disuguaglianza di Bernoulli è sempre vera.14

Esempio: somme di quadrati. Vogliamo dimostrare l’identità15


n−1
X n(n − 1)(2n − 1)
k2 = . (1.3)
k=1
6

Procediamo per induzione su n. Per n = 2,16 l’identit à si riduce a


2·1·3
12 = = 1.
6
14
La condizione x > −1 è stata usata nel passaggio (1 + x)n (1 + x) ≥ (1 + nx)(1 + x).
Se il termine 1 + x fosse negativo, dovremmo invertire il senso della disuguaglianza, e il
ragionamento perderebbe validità.
15
L’estremo superiore n − 1 appare in questa forma perché ci servirà in un esempio nel
capitolo sull’integrale di Riemann.
16
Poiché l’estremo n − 1 della somma deve essere almeno pari a quello inferiore, occorre
chiedere che n − 1 ≥ 1, cioè n ≥ 2.
18 CAPITOLO 1. INSIEMI E FUNZIONI

Supponiamo che l’identità sia vera per n, e dimostriamo che deve essere vera
anche per n + 1. Per n + 1, il primo membro di (1.3) diventa
n
X n−1
X
2
k = k 2 + n2 ,
k=1 k=1

e sfruttando l’ipotesi per n possiamo scrivere


n n−1
X X n(n − 1)(2n − 1)
k2 = k 2 + n2 = + n2 .
k=1 k=1
6

Se togliamo le parentesi a secondo membro e mettiamo a denominatore


comune, troviamo dopo qualche passaggio elementare

n(n − 1)(2n − 1) n(n + 1)(2n + 1)


+ n2 = ,
6 6
espressione che coincide con il secondo membro di (1.3) in cui n è rimpiazzato
da n+1. Questo significa esattamente che la nostra identità continua a valere
anche per n + 1, e dunque il procedimento per induzione è terminato.17

17
La prima curiosità di molti studenti è chi abbia “indovinato” l’identità (1.3). Infat-
ti,
Pn−1dimostrazione
la per induzione non è costruttiva, e non serve a dedurre quanto valga
2
k=1 k . Se nessuno ci scrivesse la formula, per induzione non riusciremmo mai a rico-
struirla. Questo tipo di formule erano il divertimento di matematici del calibro di F. Gauss,
che era solito calcolarle da bambino, mentre il maestro spiegava un’aritmetica evidente-
mente troppo noiosa. Nel libro di M. Spivak, Calculus, c’è un esercizio del primo capitolo
che suggerisce un metodo costruttivo per calcolare somme finite come quella appena vista.
Capitolo 2

Funzioni fra insiemi

Ora che abbiamo conquistato una certa familiarità con il linguaggio degli
insiemi, rivediamo rapidamente il linguaggio della teoria delle funzioni fra
insiemi.

Definizione 2.1. Siano X ed Y due insiemi qualsiasi. Una funzione f : X →


Y (si legge: f da X in Y ) è una legge che ad ogni x ∈ X associa precisamente
uno ed un solo elemento y ∈ Y , denotato anche con f (x). La notazione
completa è

f: X → Y
x 7→ f (x)

Utilizzeremo sovente la notazione più compatta f : x ∈ X 7→ f (x) ∈ Y .


L’insieme X si chiama dominio (di definizione) di f , mentre Y si chiama
codominio di f .

Notiamo che la definizione appena data nasconde una certa ambiguit à.


Che cosa sarebbe una legge? In realtà, gli studenti del corso di Matematica
imparano fin dall’inizio una definizione più rigorosa di funzione. Quella che
abbiamo proposto ricalca la definizione ingenua delle scuole superiori, e si
affida all’idea innata di legge che permette di mettere in corrispondenza due
elementi di due insiemi noti.
Purtroppo la definizione rigorosa richiederebbe l’introduzione di ulteriori
concetti che non verrebbero più utilizzati nel nostro corso. Riportiamo il
seguente commento, tratto da [1].

Possiamo pensare una funzione f : X → Y come una specie di


scatola nera, con un ingresso e un’uscita. Ogni volta che in in-
gresso entra un elemento del dominio, la scatola nera – la funzione

19
20 CAPITOLO 2. FUNZIONI FRA INSIEMI

– lo elabora e poi emette dall’uscita un elemento del codominio.


Non è importante la natura degli elementi del dominio e del codo-
minio (possono essere numeri, rette, patate, cavalleggeri prussiani
o qualsiasi altra cosa) né il tipo di processi digestivi che avven-
gono all’interno della scatola. Siano somme, prodotti, classifiche
o formine da sabbia, tutte è ammissibile purché il procedimento
usato sia sempre lo stesso: ogni volta che in ingresso infiliamo la
stessa patata, in uscita dobbiamo ottenere sempre la stessa cipol-
la – ad ogni elemento del dominio viene associato uno ed un solo
elemento del codominio, appunto.

Avvertenza. Molti studenti, ma anche molti docenti e qualche libro di testo,


hanno l’abitudine di riferirsi “alla funzione f (x)” invece che “alla funzione f ”.
Come abbiamo visto, una funzione è una legge, mentre f (x) è semplicemente
il valore che f assume in x. Per fare un paragone, sarebbe come confondere
la persona Simone Secchi con le dispense scritte da Simone Secchi.
Quindi non esiste la funzione sin x, né la funzione x2 . Più corretto, e
senz’altro più accettabile, è parlare della funzione x 7→ x2 , indicata anche
con (#)2 in alcun i libri. Quest’ultima notazione, o l’equivalente (·)2 , è
ampiamente tollerata. La scrittura (sin #)/# significherebbe “la funzione
x 7→ (sin x)/x”, e quindi # assumerebbe il valore di carattere “jolly” per la
variabile indipendente. Sfortunatamente, questa notazione è comune in molti
libri avanzati come [9], ma non ha mai fatto breccia nella tradizione dei testi
elementari.1
Lo studente, a regola, non capisce perché occorra perdere tempo in queste
disquisizioni, che non giovano molto alla sua premura di superare l’esame
finale. Lasciando da parte il doveroso rimprovero a chi crede che gli esami
universitari siano inutili scocciature da superare balbettando qualche frase
davanti al professore, stiamo parlando di un concetto veramente profondo. La
x non è una divinità, nessun medico ce ne prescrive l’uso, e solo la tradizione
invoglia a usare tale lettera per la variabil e indipendente.2 Le due scritture
x 7→ ex e ζ 7→ eζ denotano la stessa funzione: x e ζ, ma potremmo usare α, ρ
o anche z, sono soltanto simboli. Una celebre battuta dice che, in matematica,
un cappello rosso non è necessariamente un cappello, e anche se lo fosse non
sarebbe necessariamente rosso. Quello che conta veramente è il significato
attribuito ai simboli, nel nostro caso la legge, cioè la funzione, alla quale tali
simboli vengono sottoposti. In alcuni contesti avanzati, la “funzione f (x)”
1
Purtroppo, la tendenza a confondere ciò che un soggetto è con ciò che quel soggetto
fa, è un errore sempre più diffuso anche nella nostra società.
2
I fisici preferiscono usare t, come se parlassero di un tempo.
21

potrebbe anche indicare il nome di una funzione che agisce come


f (x) : t 7→ f (x)(t).
Sembra un paradosso, ma non lo è, ed anzi tali notazioni sono pressoché
obbligatorie in Geometria Differenziale e in Analisi Funzionale. Domanda
provocatoria per lo studente: chi parlerebbe della funzione g(1/2)? Se x
denota un numero, g(1/2) dovrebbe essere tanto legittimo quanto g(x)...
Per amore di verità, molti docenti continuano a ritenere essenzialmente
(o totalmente) corretta un’espressione come “sia f (x) una funzione conti-
nua”. Seguendo la prassi italica che si fanno le regole e poi si tollerano le
trasgressioni,3 i trasgressori non verranno perseguiti in sede d’esame.
Esempi. Siano X l’insieme di tutti gli uomini della Terra, e Y l’insieme
di tutti i colori. Se ad ogni uomo di X associamo il colore del suo occhio
destro,4 abbiamo costruito una funzione da X in Y .
Se X è l’insieme di tutte le scatolette di tonno di un certo negozio, e
Y è l’insieme dei numeri razionali Q, possiamo associare ad ogni x ∈ X
il suo prezzo y ∈ Q = Y , ottenendo una funzione. La scelta di Y = Q
nasconde la presunzione che nessun negoziante ci farà mai pagare π euro per
una scatoletta di tonno. Sembra perciò ragionevole che i prezzi delle scatole
di tonno siano numeri con una quantità finita di numeri decimali, e dunque
numeri razionali.
Se infine X è l’insieme di tutte le circonferenze del piano cartesiano e
Y = R, possiamo associare ad ogni circonferenza il suo raggio. Anche questa
è una funzione.
Scegliamo ora X = Y come l’insieme di tutti gli individui viventi sulla
Terra. Associando ad ogni individuo vivente i suoi genitori, non definiamo
una funzione: esistono gli orfani, e inotre potremmo associare a un x ∈ X
due elementi di Y , madre e padre.
Nel seguito, useremo quasi esclusivamente insiemi numerici e funzioni fra
di essi.
Definizione 2.2. Se f : X → Y è una data funzione, l’insieme
f (X) = {y ∈ Y | esiste x ∈ X tale che y = f (x)} ⊂ Y
si chiama immagine di X rispetto a f . Se invece V ⊂ Y , l’insieme
f −1 (V ) = {x ∈ X | f (x) ∈ V }
3
Ogni riferimento socio–politico è pienamente voluto.
4
Ci sono esseri umani – pochi – con occhi di colori differenti, dunque parlare di “colore
degli occhi” non definirebbe una funzione. Escludiamo implicitamente gli individui privi
dell’occhio destro.
22 CAPITOLO 2. FUNZIONI FRA INSIEMI

si chiama controimmagine (o preimmagine, o ancora anti-immagine) dell’in-


sieme V .

Il codominio Y è decisamente meno importante del dominio X. Effet-


tivamente, per specificare una funzione, ci servono in maniera essenziale il
dominio e la legge, mentre il codominio può essere “allargato” senza influire
troppo sulla funzione. Infatti, ciò che conta sembra essere f (X): gli elementi
di Y che non sono immagini di elementi di X possono essere sacrificati in
prima battuta. Oppure, potremmo aggiungere ulteriori elementi all’imma-
gine, senza alterare la funzione. Invitiamo il lettore a ritornare sull’esempio
delle scatolette di tonno. È vero che i prezzi sono (ragionevolmente) numeri
razionali, ma se avessimo scelto come codominio l’insieme dei numeri reali
non avremmo compromesso la nostra funzione.

Convenzione didattica. Abbiamo appena detto che una funzione si com-


pone di tre elementi: un dominio, un codominio, e una legge. Ogni studente
sa già, però, che in certi esercizi si chiede di “trovare” il dominio di definizione
di una certa funzione, scritta solitamente f (x) = . . . È una richiesta poco
chiara, a cui si conviene di attribuire un senso convenzionale molto chiaro.
Quando si lavora con funzioni reali di una variabile reale, il dominio è inteso
come il “dominio naturale”, cioè il più grande sottoinsieme di R in√cui tutte
le operazioni scritte nella formula di f hanno senso. Se f (x) = x − 1, il
dominio è l’insieme delle x tali che x−1 ≥ 0. Questo perché si può estrarre la
radice quadrata solo di numeri maggiori o uguali a zero. Se f (x) = log(3x−1),
il dominio è l’insieme delle x tali che 3x − 1 > 0, poiché solo i numeri stret-
tamente positivi hanno un logaritmo. Chiedere di trovare il dominio di una
data funzione significa chi edere allo studente di ricordare quali sono i domini
di definizioni delle principali funzioni elementari, e di fargli risolvere alcune
disequazioni. È vero che f (x) = log x può essere legittimamente definita
sul dominio [1, π], ma non si tratta del dominio naturale. Nel linguaggio
introdotto in questi appunti, sono semplicemente due funzioni diverse.

Osservazione 2.3. Una situazione che solitamente risulta insidiosa per gli
studenti è il caso delle funzioni contenenti potenze in cui sia la base che
l’esponente sono variabili. Ad esempio, qual è il dominio di definizione di
x 7→ xx ? O di x 7→ (sin x)log x ? La risposta è che per definire un’espressione
quale
f (x)g(x)

occorre imporre la condizione f (x) > 0. La ragione si capisce solo ricordando


quella teoria delle potenze che ormai non viene quasi più insegnata.
23

L’angolo dello smemorato: le potenze. Ricordiamo che, dato un qual-


siasi numero reale (positivo, nullo o negativo) x, si definisce la sua potenza
n– esima, per n ∈ N mediante la formula

xn = x · x · . . . · x (n fattori).

Indi, si definiscono le potenze con esponente intero relativo, dicendo che


1
x−n = .
xn
Naturalmente, occorre richiedere che x 6= 0. I primi dubbi arrivano per
esponenti razionali. Infatti, come definire x1/q , dove q ∈ N, q 6= 0? Di solito
si dice che
x1/q = y se e solo se x = y q .
Pertanto, bisogna distinguere fra q pari e q dispari. Nel primo caso, poiché
ogni numero elevato ad una potenza pari diventa non negativo, dovremo
imporre x ≥ 0. Nel secondo caso, invece, ogni numero x ∈ R può essere
elevato alla potenza 1/q, q dispari. Si pensi, per ricordarlo, alla radice cubica
x1/3 , definita per ogni x reale. Ad esempio, l’espressione x1/8 ha senso solo
per x ≥ 0, mentre x1/17 è definita per ogni x reale.
Ultimo passaggio, il caso dell’esponente razionale qualunque: xp/q . Ov-
viamente, possiamo pensare che la frazione p/q sia già ridotta ai minimi
termini. Poniamo allora
xp/q = (xp )1/q
se p ≥ 0, mentre
1
xp/q =
x−p/q
se p < 0. Ovviamente, dobbiamo controllare che le potenze scritte abbiano
significato: se q è un numero pari, (xp )1/q ha senso solo per xp ≥ 0, cioè per
x ≥ 0. Se q è dispari, possiamo scrivere (xp )1/q per ogni x reale. Per p < 0,
dobbiamo inoltre escludere x = 0 dalla definizione. Per esempio,

x2/3 = (x2 )1/3 ,

definita dunque per ogni x reale (perché il denominatore 3 dell’esponente è


dispari), mentre
1/2
x5/2 = x5
definita solo per x ≥ 0 perché il denominatore 2 dell’esponente è un numero
pari. Infine,
1
x−4/3 = 4/3 ,
x
24 CAPITOLO 2. FUNZIONI FRA INSIEMI

definita per ogni x 6= 0: l’unica condizione è infatti che il denominatore x4/3


sia diverso da zero.
Dopo qusta lunga digressione, non è affatto chiaro come definire xα , per
un qualunque numero α ∈ R. La risposta è insita nella costruzione dell’in-
sieme dei numeri reali.5 Ci limitiamo ad un cenno: fissato α, si approssima
α con una successione di numeri razionali {pn /qn }n∈N . La tentazione è di
definire
xα = lim xpn /qn .
n→+∞

Il problema però è che non possiamo avanzare pretese sui numeri qn : po-
trebbero essere alternativamente positivi o negativi. Allora, per essere certi
che xpn /qn abbia senso, l’unica via d’uscita è chiedere che x > 0. Morale del
discorso: possiamo elevare ad una potenza reale generica solo le basi positive.
Un approccio alternativo, dovuto a Dedekind, propone di definire xα come il
valore di

sup {rα | r ∈ Q, r ≤ x} = inf {rα | r ∈ Q, r ≥ x} .

Questa uguaglianza è però falsa per x < 0. Resta un ultimo, tremendo, dub-
bio: siccome N ⊂ Z ⊂ Q ⊂ R, come ci comportiamo davanti all’espressione
x2/3 ? Pensiamo 2/3 come un numero razionale oppure come un numero rea-
le? Già, perché le primo caso possiamo scegliere x reale, mentre nel secondo
solo x > 0! La risposta è quella più complicata6 : quando l’esponente è un
numero razionale, lo trattiamo come tale, senza pensarlo come un numero
reale.
Per togliere qualsiasi ambiguità, converrebbe distinguere rigorosamente e
senza eccezioni la funzione esponenziale dalla funzione inversa delle potenze.
In altri termini, dovremmo considerare separatamente (per esempio) le due
funzioni

f : (0, +∞) → R, f (x) = x2/3


√3
g : R → R, g(x) = x2 .

Si può seguire senz’altro questa strada, ma i matematici amano ammorbidire


le asperità della loro materia con qualche cedimento alle convenzioni.
Per concludere, c’è una situazione che molti studenti non sanno come
affrontare: come si calcola 00 ? È una domanda insidiosa, che in effetti ha già
avuto implicitamente la risposta nella discussione precedente: l’operazione 00
5
Questo è uno dei momenti, non troppo frequenti per fortuna, in cui si rimpiange di
non avere le basi di teoria dei sistemi numerici.
6
I matematici scelgono spesso la strada più ricca di bivi, almeno quando questi bivi
arricchiscano la teoria.
2.1. OPERAZIONI SULLE FUNZIONI 25

non è definita. Per x 6= 0, possiamo pensare che x0 = xm−m = xm /xm , dove


m è un numero intero (diverso da zero) qualunque. Allora, viene spontaneo
dire che x0 = 1 per x 6= 0. Ma questo ragionamento non è convincente per
x = 0, poiché x−m è già privo di significato. A volte, i matematici convengono
di dare un senso ad un’espressione indefinita, e lo fanno con lo scopo di
semplificare o unificare argomenti che richiederebbero una trattazione diversa
caso per caso. Molti studiosi di analisi matematica usano la convenzione 00 =
1, pensando che 00 = limx→0 x0 = limx→0 1 = 1. Altri, invece, preferiscono
pensare che 00 = limx→0 0x = limx→0 0 = 0. Questo, da un punto di vista
avanzato, si interpreta con il fatto che la funzione di due variabili f (x, y) =
xy , definita per x > 0 e y ∈ R, non è prolungabile per continuità in (0, 0). Chi
scrive, se proprio è obbligato, ha una maggiore simpatia per la convenzione
00 = 1, ma si tratta di gusti.

Definizione 2.4. Supponiamo che f : X → Y sia una funzione fra i due


insiemi X e Y . Se Z è un sottoinsieme di X, la nuova funzione f |Z : Z → Y
definita da f |Z(x) = f (x) per ogni x ∈ Z prende il nome di restrizione di f
all’insieme Z.7

Restringere l’azione di una funzione a un dominio di definizione più pic-


colo può apparire inutile. Il punto è che, per noi, una funzione è individuata
in modo univoco dal suo dominio, dal suo codominio, e dalla sua legge. Ad
esempio, vedremo più avanti che la funzione f : R → R definita dalla legge

−1, se x < 0

f (x) = 0, se x = 0

1, se x > 0

è discontinua nel punto x = 0, ma la sua restrizione a qualsiasi intervallo che


non contiene il punto x = 0 è continua. Questo ci convince che le restrizioni
di una funzione possono godere di proprietà che la funzione di partenza non
possiede.

2.1 Operazioni sulle funzioni


Quando lavoriamo con funzioni a valori reali, è facile estendere ad esse le quat-
tro operazioni dell’aritmetica. Basta infatti operare sulle immagini, come
nella definizione che segue.
7
A volte si usa il simbolo f|Z .
26 CAPITOLO 2. FUNZIONI FRA INSIEMI

Definizione 2.5. Sia X un insieme, e siano f : X → R e g : X → R due


funzioni a valori reali. Definiamo la loro somma, il loro prodotto e il loro
quoziente come
1. f + g : X → R, x 7→ f (x) + g(x)
2. f g : X → R, x 7→ f (x)g(x)
3. f /g : X \ {x ∈ X | g(x) = 0} → R, x 7→ f (x)/g(x),
Anche le funzioni possiedono delle operazioni, senza dubbio meno fa-
miliari di quelle algebriche. A noi ne serviranno due: la composizione e
l’inversione.
Definizione 2.6. Siano f : X → Y e g : Y → Z due funzioni. La funzione
g ◦ f : X → Z definita da
g ◦ f : x ∈ X 7→ g(f (x)) ∈ Z
si chiama funzione composta di g ed f .
Osservazione 2.7. Qualche Autore, soprattutto quelli che si occupano di
algebra, usano la convenzione della composizione in ordine inverso rispetto
al nostro. Per costoro, f ◦ g significa calcolare prima f e poi g.
Nella pratica, comporre due funzioni significa applicarle in successione,
facendo attenzione all’ordine di scrittura. Graficamente,
x ∈ X 7→ f (x) ∈ Y 7→ g(f (x)) ∈ Z,
dove la prima freccia indica l’azione di f su x e la seconda freccia l’azione
di g su f (x). Questa rappresentazione evidenzia l’ipotesi che il codominio di
f coincidesse con il dominio di g.8 In generale, non ha senso scrivere f ◦ g,
perché il codominio di g non è il dominio di f . E anche se questa condizione
strutturale è soddisfatta, è facile costruire un esempio in cui f ◦ g e g ◦ f sono
due funzioni ben distinte.
Più macchinosa è la definizione di funzione inversa. Premettiamo una
definizione fondamentale.
Definizione 2.8. Sia f : X → Y una funzione. Diciamo che f è iniettiva se
ad elementi x1 6= x2 di X sono associate sempre immagini f (x1 ) 6= f (x2 ) in
Y . Diciamo invece che f è suriettiva se f (X) = Y , cioè se per ogni y ∈ Y
esiste un x ∈ X tale che f (x) = y. Diciamo infine che f è biunivoca se è
iniettiva e suriettiva.
8
In base a quanto detto poco sopra, basterebbe che f (X) fosse un sottoinsieme del
dominio di g.
2.1. OPERAZIONI SULLE FUNZIONI 27

Supponiamo che f : X → Y sia una funzione biunivoca. Ad ogni y ∈ Y si


associa un elemento x ∈ X tale che f (x) = y. Ora, tale elemento x è unico:
se ce ne fossero due, chiamiamoli x1 e x2 , ovviamente x1 6= x2 e l’iniettività
di f implicherebbe
y = f (x1 ) 6= f (x2 ) = y,
cioè y 6= y. Questo è chiaramente impossibile, dunque esiste uno (per la
suriettività) ed uno solo (per l’iniettività) x ∈ X tale che f (x) = y. Ma
allora abbiamo costruito una funzione da y in X. Questa funzione, che
chiameremo f −1 , gode della proprietà che

f ◦ f −1 : y ∈ Y 7→ y ∈ Y (2.1)

e
f −1 ◦ f : x ∈ X 7→ x ∈ X. (2.2)
Definizione 2.9. Sia f : X → Y una funzione biunivoca. La funzione
f −1 : Y → X costruita sopra si chiama funzione inversa di f , ed è carat-
terizzata dalle condizioni (2.1) e (2.2).
Diversamente da alcuni libri di testo, saremo piuttosto rigidi sul concetto
di funzione invertibile. Come visto, per noi una funzione è invertibile quan-
do è biunivoca. Altri chiedono sono l’iniettività: il dominio della funzione
inversa sarà l’immagine della funzione diretta. Questa è una convenzione
legittima e addirittura comoda in certi contesti elementari. Noi privilegiamo
la definizione più comune fra i matematici puri. Tuttavia, lo studente si con-
vincerà facilmente di questo: qualsiasi funzione diventa suriettiva, a patto
di scegliere come codominio l’immagine della funzione. Se ci viene data una
funzione iniettiva f da un dominio X in un codominio Y , la nuova funzione
f˜: X → f (X) è una funzione biunivoca e perciò invertibile. Sebbene f˜ sia
una funzione diversa da f , è comodo indulgere in questa confusione.
Riassumendo, le (2.1) e (2.2) dicono che la funzione inversa è effetti-
vamente quell’operazione che “inverte” una funzione biunivoca rispetto alla
composizione ◦. Quando allo studente dovrà dimostrare che una certa funzio-
ne è invertibile, dovrà verificare che la funzione è iniettiva e suriettiva. Può
far comodo usare la caratterizzazione contenuta nella prossima proposizione.
Proposizione 2.10. Sia f : X → Y .
1. f è iniettiva se e solo se dall’uguaglianza f (x1 ) = f (x2 ) discende x1 =
x2 .
2. f è suriettiva se e solo se, per ogni y ∈ Y , l’equazione (nell’incognita
x ∈ X) f (x) = y possiede almeno una soluzione.
28 CAPITOLO 2. FUNZIONI FRA INSIEMI

3. f è biunivoca se e solo se, per ogni y ∈ Y , l’equazione f (x) = y possiede


esattamente una soluzione x ∈ X. In tal caso, x = f −1 (y).
Concretamente, tutto si riduce a risolvere equazioni. Purtroppo non tut-
te le equazioni sono risolvibili in termini espliciti,9 e i metodi del calcolo
differenziale ci verranno in aiuto.

2.2 Funzioni monotòne e funzioni periodiche


Spendiamo qualche parola sui rapporti fra le funzioni reali di variabile reale
e la relazione d’ordinamento fra numeri reali. Dati due numeri reali x1 e
x2 , esattamente una delle seguenti affermazioni deve essere vera: x1 < x2 ,
oppure x1 = x2 , oppure x1 > x2 .
Definizione 2.11. Sia X ⊂ R un sottoinsieme, e sia f : X → R una fun-
zione reale di una variabile reale. Diremo che f è monotona crescente (risp.
crescente in senso stretto) se è soddisfatta la condizione seguente: se x1 ,
x2 ∈ X e se x1 < x2 , allora f (x1 ) ≤ f (x2 ) (risp. f (x1 ) < f (x2 )). Di-
remo che f è monotona decrescente (risp. decrescente in senso stretto) se
è soddisfatta la condizione seguente: se x1 , x2 ∈ X e se x1 < x2 , allora
f (x1 ) ≥ f (x2 ) (risp. f (x1 ) > f (x2 )).
A parole, le funzioni monotone crescenti rispettano l’ordinamento dei
numeri reali, mentre quelle monotone decrescenti lo invertono.
Osservazione 2.12. Attenzione alla pronuncia dell’aggettivo “monotona”:
l’accento cade sulla seconda lettera o. Il professore di matematica può essere
monòtono (accento sulla prima o), mentre le funzioni sono monotòne (accento
sulla seconda o).
Teorema 2.13. Sia [a, b] un intervallo, e sia f : [a, b] → R una funzione
strettamente crescente (oppure strettamente decrescente). Allora f è inietti-
va.
Dim. Siano x1 e x2 due elementi distinti di [a, b]. Non è restrittivo supporre
che x1 < x2 . Siccome f è strettamente crescente (oppure decrescente), avre-
mo che f (x1 ) < f (x2 ) (oppure f (x1 ) > f (x2 )), e in particolare f (x1 ) 6= f (x2 ).
Pertanto f è una funzione iniettiva.
Corollario 2.14. Una funzione strettamente monotona è invertibile sulla
sua immagine, e la funzione inversa è strettamente monotona nello stesso
senso della funzione diretta.
9
Per esempio, sin x = x ha soluzione, ma non esiste una scrittura esplicita della
soluzione.
2.3. GRAFICI CARTESIANI 29

Lasciamo allo studente piò volenteroso la dimostrazione di questo corol-


lario. Una sola avvertenza: la funzione inversa rispetta il senso della mo-
notonia. Per qualche suggestione psicologica, molti studenti sono convinti
che l’inversa di una funzione crescente debba essere una funzione decrescen-
te. Basta pensare all’esempio della funzione esponenziale e della funzione
logaritmo per non sbagliarsi.
Introduciamo infine un’ulteriore proprietà di alcune funzioni che incon-
treremo spesso.
Definizione 2.15. Una funzione f : R → R è periodica di periodo T > 0 se

f (x + T ) = f (x), per ogni x ∈ R.

e T è il più piccolo numero positivo che soddisfi questa uguaglianza.


Ne consegue che, per conoscere una funzione T –periodica, basta conoscer-
la su un qualunque intervallo di ampiezza T , ad esempio [0, T ] o [−T /2, T /2].
La clausola di minimalità di T è parte integrante della definizione di
periodicità. La funzione seno ha periodo T = 2π, ma sin(α + T ) = sin α è
vera anche per tutti i multipli interi di 2π.

2.3 Grafici cartesiani


Il piano cartesiano sarà, per noi, l’insieme dei punti di un piano nel quale sono
stati scelte due rette perpendicolari. Queste rette si intersecano in un punto
detto origine, e sono chiamati assi cartesiani. I punti di questo piano sono
copppie ordinate di numeri reali, ed è suggestivo usare il simbolo R2 = R × R
per indicare brevemente il piano cartesiano.
Definizione 2.16. Sia f : X → Y una funzione, dove X, Y sono due
insiemi. Il grafico di f è il sottoinsieme di X × Y

Γ(f ) = {(x, f (x)) ∈ X × Y | x ∈ X}.

In pratica, il grafico di una funzione è costituito dalle coppie ordinate il cui


primo elemento appartiene al dominio, e il secondo elemento è l’immagine del
primo elemento. Per le nostre funzioni reali di una variabile reale, il grafico
è una sottoinsieme di R2 . Di solito si tratta di una curva (nel senso intuitivo
del termine), ma √ potrebbe anche essere un solo punto. Pensiamo infatti alla
funzione x 7→ −x2 , definita evidentemente solo in {0}. Il suo grafico è
formato dal punto {(0, 0)} ∈ R2 .
Ci sembra opportuno insistere su un punto: non tutte le curve che si
possono disegnare nel piano cartesiano sono grafici di funzioni. Prendiamo
30 CAPITOLO 2. FUNZIONI FRA INSIEMI

per esempio una circonferenza o un’ellisse: sono rappresentanti delle ben note
coniche, ma non sono certamente grafici di funzioni reali di una variabile reale.
Esistono infatti rette verticali che intersecano tali curve in due punti distinti,
contro la definizione di funzione.

Ma come si “leggono”, su un grafico cartesiano, le proprietà di una funzio-


ne? In genere, tutte le principali caratteristiche di una data funzione hanno
una visibilità notevole nel grafico cartesiano. Per esempio, la suriettività cor-
risponde al fatto che qualunque retta orizzontale interseca il grafico almeno
una volta. Se ogni retta orizzontale interseca il grafico al massimo una vol-
ta,10 la funzione è iniettiva. Se ogni r etta orizzontale interseca il grafico una
ed una sola volta, allora la funzione è biunivoca.
La periodicità si rispecchia invece in una ripetizione esatta del grafico
ogni volta che l’ascissa si sposta di una quantità pari al periodo. Come detto
sopra, basta pertanto tracciare il grafico su un intervallo di ampiezza pari al
periodo.

2.4 Funzioni elementari


In quest’ultima sezione introduttiva, riepiloghiamo le caratteristiche di alcune
funzioni di natura elementare. Queste costituiranno in un certo senso un
archivio a cui attingere esempi e controesempi nel corso del programma.

Innanzitutto, lo studente ricorderà le funzioni lineari affini, cio è le rette


del piano. Fatta eccezione per le rette verticali11 , la generica funzione linere
affine ha la forma
x 7→ mx + q,
per opportuni valori di m, q ∈ R. Le funzioni rappresentate invece da
polinomi di secondo grado sono invece parabole, e hanno la forma

x 7→ ax2 + bx + c,

dove i coefficienti a, b e c sono numeri reali.


Il lettore dovrebbe avere una certa familiarità anche con le funzioni espo-
nenziali, quelle rappresentate dalla formula

x 7→ ax ,
10
Cioè non lo interseca oppure lo interseca esattamente una volta.
11
Che non sono funzioni!
2.4. FUNZIONI ELEMENTARI 31

dove a ∈ (0, +∞).12 Il caso a = 1 non merita tante parole: la funzione


è chiaramente costante, poiché 1x = 1 qualunque sia l’esponente x. Nel
caso 0 < a < 1, la funzione esponenziale di base a è positiva, monotona
decrescente. Nel caso a > 1, essa è invece positiva ma monotona crescente.
Per quanto visto, la funzione esponenziale di base a ∈ (0, 1) ∪ (1, +∞) è
invertibile, e la sua funzione inversa si chiama logaritmo in base a. Si scrive
x ∈ (0, +∞) 7→ loga x.
Per a > 1, la funzione logaritmica è strettamente crescente, attraversa l’asse
delle ascisse per x = 1, è negativa per 0 < x < 1 e positiva per x > 1.
Per 0 < a < 1, la funzione logaritmica è strettamente decrescente, positiva
per 0 < x < 1 e negativa per x > 1. L’unico valore in cui si annulla è x = 1.
Concludiamo la panoramica con le funzioni goniometriche. Poiché una
definizione rigorosa di tali funzioni può essere data solo avendo a disposizione
strumenti che introdurremo più avanti, ci affidiamo alle conoscenze pregresse
dello studente. Probabilmente, saprà che il seno di un angolo è il rapporto fra
cateto opposto e ipotenusa di un certo triangolo rettangolo, e così via. Per
iniziare, questa “definizione” geometrica ci basta. Abbiamo dunque a nostra
disposizione due funzioni,
x∈R →
7 sin x
x∈R → 7 cos x,
chiamate rispettivamente seno e coseno, definite sull’intero insieme dei nume-
ri reali, periodiche di periodo 2π. A queste si affianca la funzione tangente,
definita come
sin x
tan x =
cos x
13
per ogni x ∈ R \ {kπ/2 | k ∈ Z}. La tangente è una funzione periodica
di periodo π, e sull’intervallo (−π/2, π/2) è strettamente crescente, nulla in
x = 0.
Osservazione 2.17. Gli angoli saranno sempre misurati in radianti. L’uso
dei gradi sessagesimali, cui lo studente è forse più abituato, si adatta male
al calcolo differenziale. Ricordiamo che la relazione fra la misura αgradi in
gradi sessagesimali e quella αrad in radianti di un angolo α è stabilita dalla
seguente proporzione:
αrad : αgradi = 2π : 360.
12
La base a è un numero positivo per ipotesi. Infatti, è problematico elevare un numero
negativo ad un esponente reale, e questo ci costringerebbe a distinguere vari casi.
13
Questa scrittura apparentemente complicata è la scrittura simbolica per la frase “x
diverso da tutti i multipli interi di π/2”.
32 CAPITOLO 2. FUNZIONI FRA INSIEMI

Quindi
π
αrad = αgradi .
180
Capitolo 3

Successioni di numeri reali

In questo capitolo, introdurremo uno degli strumenti più importanti di tutta


l’Analisi Matematica, le successioni. Ci imbatteremo per la prima volta nella
definizione di limite, e dimostreremo un certo numero di teoremi fondamentali
che avranno dei corrispettivi nella teoria dei limiti per le funzioni.

3.1 Successioni e loro limiti


Definizione 3.1. Una successione di numeri reali è una qualunque funzione
p : N → R. Per consuetudine, useremo la scrittura pn invece della più rigida
notazione funzionale p(n) per denotare il valore della funzione p in n ∈ N.
Parleremo poi, sempre con un certo abuso di notazione, della successione
{pn }.
Una successione viene spesso presentata come un allineamento (infinito)
di numeri reali
p1 , p2 , p3 , . . . , pn , pn+1 , . . .
Per questo motivo, si trova frequentemente la notazione

{p1 , p2 , p3 , . . . , pn , pn+1 , . . . } (3.1)

per indicare la successione {pn }. C’è sfortunatamente un aspetto che richiede


molta attenzione da parte dello studente. La notazione (3.1) si confonde del
tutto con l’insieme {p1 , p2 , p3 , . . . , pn , pn+1 , . . . } ⊂ R. Tutto ciò è spiacevole,
dato che una funzione è un oggetto ben diverso dalla sua immagine. A costo
di essere ripetitivi, consideriamo la successione così definita:
(
1, se n è pari
pn =
−1, se n è dispari.

33
34 CAPITOLO 3. SUCCESSIONI DI NUMERI REALI

L’immagine di {pn } è formata dall’insieme {−1, 1}, mentre la successione è


costituita da infiniti numeri reali. In questo senso l’uso delle parentesi graffe
per denotare tanto la successione quanto l’insieme dei punti sulla retta reale
da essa individuati è azzardata. La tradizione didattica, così consolidata,
rende inutile ogni battaglia contro questo abuso di notazione.
Osservazione 3.2. Osserviamo che qualunque successione è in realtà la re-
strizione a N di infinite funzioni di una variabile reale. Data infatti una
qualunque successione {pn }, possiamo definire infinite funzioni f : R → R in
maniera tale che f (n) = pn per ogni n ∈ N. Ad esempio, possiamo specificare
assolutamente a caso i valori di f (x) per x ∈ R \ N.
L’Osservazione sopra ci permette di fare una divagazione divertente con
un finale polemico. Tutti ci siamo imbattuti, prima o poi, nel seguente “rom-
picapo”: data una sequenza di quattro o cinque numeri (solitamente naturali),
dire quale sarà il numero successivo. È chiaro che, per un matematico, que-
sto è un rompicapo assolutamente ozioso: basta scrivere un numero a caso!
Chiaramente non sarà mai la soluzione prevista da chi pone il dilemma. Ad
esempio, se la sequenza è “1,3,5,7,9”, sembra plausibile congetturare che il nu-
mero successivo sarà 11, data l’assonanza evidente con i primi numeri dispari.
In tutti questi casi, il vero rompicapo è capire che cosa significhi scrivere un
numero che segue logicamente quelli dati. Un buon rompicapo dovrebbe pos-
sedere una soluzione inequivocabile, e soprattutto utilizzare questi problemi
per selezionare le future matricole universitarie appare un’idea abbastanza
discutibile.
Definizione 3.3. Una successione {pn } è crescente (risp. strettamente cre-
scente) se pn ≤ pn+1 (risp. pn < pn+1 ) per ogni n, e decrescente (risp.
strettamente decrescente) se vale la disuguaglianza opposta (risp. la disugua-
glianza stretta opposta). La successione {pn } è limitata se esiste una costante
M > 0 tale che |pn | ≤ M per ogni n.
Definizione 3.4. Diremo che la successione {pn } tende al valore ` ∈ R per
n → +∞, e scriveremo limn→+∞ pn = ` oppure pn → ` per n → +∞, se, per
ogni ε > 0 esiste N ∈ N tale che
|pn − `| < ε per ogni n > N .
Definizione 3.5. Diremo che una successione {pn } di numeri reali è con-
vergente se essa possiede un limite nel senso della definizione precedente. In
caso contrario, diremo che la successione è divergente.
Un primo avvertimento che ci sembra doveroso dare è che i libri di testo
italiani usano una terminologia molto più descrittiva. Noi abbiamo usato
3.1. SUCCESSIONI E LORO LIMITI 35

l’aggettivo “divergente” per la negazione logica di “convergente”. La tradizio-


ne italiana usa tale aggettivo per indicare che la successione tende all’infi-
nito, come vedremo fra poco. La negazione della convergenza si divide così
in due sotto-classi: tendere all’infinito e assumere infinite volte valori pros-
simi a piacere a due numeri distinti. Chi scrive, senz’altro sotto l’influsso
del bellissimo libro di Walter Rudin [24], preferisce evitare questa ulteriore
distinzione. Nell’economia di questo corso, per inciso, sarebbe anche poco
saggio dare eccessiva importanza alle successioni che “oscillano” fra due valori
diversi.

Osservazione 3.6. È fondamentale che lo studente si renda conto del se-


guente fatto: se esiste un numero N ∈ N che soddisfa le richieste contenute
nella definizione di limite, anche tutti i numeri naturali Ñ > N andranno
bene.

Un’osservazione particolarmente importante è che i “primi” termini di una


successione sono ininfluenti al fine dell’esistenza del limite.

Proposizione 3.7. Siano {pn } e {qn } due successioni, e supponiamo che


esista un numero naturale n0 tale che pn = qn per ogni n > n0 . Sotto queste
ipotesi, la successione {pn } possiede limite (finito oppure infinito) se e solo
se la successione {qn } possiede limite, ed in tal caso i due limiti coincidono.

Dim. Supponiamo che limnto+∞ pn = ` ∈ R. Per definizione, fissato ε > 0


esiste N ∈ N tale che |pn − `| < ε per ogni n > N . Posto N1 = max{N, n0 },
ovviamente |qn − `| < ε per ogni n > N1 , dal momento che qn = pn per tali
valori dell’indice n. Quindi limn→+∞ qn = `. Poiché questo ragionamento è
perfettamente simmetrico, possiamo scambiare il ruolo di {pn } e di {qn }, e
concludere che se limn→+∞ qn = ` allora anche limn→+∞ pn = `. Il caso del
limite infinito è lasciato per esercizio.

Lo studente non deve comunque sopravvalutare la portata della Proposi-


zione appena dimostrata: se il limite rappresenta il comportamento della suc-
cessione per indici molto grandi, è naturale che si disinteressi dell’andamento
della successione per valori “piccoli” dell’indice.

Ma come si controlla, operativamente, che una successione sia convergen-


te? Vediamolo con un esempio. Consideriamo la successione { n−1 n+1
}, e verifi-
chiamo che è convergente al limite ` = 1. In base alla definizione, dobbiamo
fissare a nostro piacere un numero ε > 0, e verificare che la disequazione

n − 1
n + 1 − 1 < ε

36 CAPITOLO 3. SUCCESSIONI DI NUMERI REALI

è soddisfatta per tutti i valori di n maggiori di qualche N . Riscriviamo la


disequazione facendo il denominatore comune:

n − 1 − n − 1
< ε,
n+1

cioè
2
< ε.
n+1
2
La domanda è: esiste un indice N ∈ N tale che n+1 < ε sia soddisfatta per
2
ogni n > N ? Per rispondere, “risolviamo” la disequazione n+1 < ε rispetto a
n:
2
n > − 1.
ε
Pertanto, se scegliamo N uguale al primo numero naturale maggiore di 2ε − 1,
abbiamo finito la verifica del limite proposto.
Dunque la verifica di un limite si riduce nel “risolvere” una disequazione
e nel dimostrare che l’insieme delle soluzioni contiene tutti i numeri naturali
maggiori di un opportuno valore. Prima di passare oltre, osserviamo che il
valore del limite ` è stato “regalato”, e che non saremmo riusciti a calcolar-
lo con la sola definizione. Vedremo fra poco quali strumenti esistano per
l’effettivo calcolo dei limiti.

La prossima domanda è se possano esistere due numeri `1 e `2 che siano


entrambi il limite di {pn }? La risposta è negativa.1
Proposizione 3.8. Se pn → `1 e pn → `2 , allora `1 = `2 .
Dim. Supponiamo che `1 < `2 e mostriamo che questo porta ad una contrad-
dizione. Un ragionamento del tutto simile vale anche sotto l’ipotesi (assurda)
`1 > `2 , e perciò non resta che `1 = `2 . Dunque, sia ε = 12 (`2 − `1 ) > 0.
Applichiamo la definizione di limite per `1 : esiste N1 ∈ N tale che
|pn − `1 | < ε se n > N1 .
Applicando la definizione a `2 , troviamo che esiste N2 ∈ N tale che
|pn − `2 | < ε se n > N2 .
Scegliamo N > max{N1 , N2 }. Quindi
`2 − `1 ≤ |pn − `1 | + |pn − `2 | < `2 − `1 ,
assurdo.
1
Almeno per successioni di numeri reali. In contesti molto più generali, una successione
potrebbe addirittura ad infiniti limiti diversi.
3.1. SUCCESSIONI E LORO LIMITI 37

Nella dimostrazione abbiamo usato la disuguaglianza triangolare

|x − y| ≤ |x − z| + |z − y| (3.2)

valida per ogni terna x, y, z di numeri reali. Un’altra proprietà delle suc-
cessioni convergenti, cioè delle successioni che tendono a un limite nel senso
della nostra definizione, è che sono successioni limitate.

Proposizione 3.9. Ogni successione convergente è limitata.

Dim. Infatti, se limn→+∞ pn = `, allora esiste N ∈ N, corrispondente alla


scelta di ε = 1, tale che |pn − `| < 1 se n > N . Quindi, per la disuguaglianza
triangolare,
|pn | < M = max{|p1 |, |p2 |, . . . , |pN |, 1 + |`|}.

Osservazione 3.10. È però falso che ogni successione limitata converge. La


successione {1, −1, 1, −1, 1, −1, . . . } è limitata (M = 1 nella definizione), ma
non converge. Vedremo comunque che tutte le successioni limitate hanno
una sottosuccessione convergente.

Prima di proseguire, osserviamo che alle successioni possono essere ap-


plicate le quattro operazioni algebriche. Precisamente, se {pn }, {qn } sono
successioni e se α ∈ R, possiamo definire le successioni
pn
pn + qn , αpn , pn qn ,
qn

sotto l’ovvia condizione che qn 6= 0 quando qn appare a denominatore.


Il seguente teorema afferma che l’operazione di limite rispetta le opera-
zioni algebriche.

Teorema 3.11. Siano {pn } e {qn } due successioni. Se pn → ` e qn → m


per n → +∞, allora

1. pn + qn → ` + m;

2. αpn → α`;

3. pn qn → `m;
pn `
4. qn
→ m
se m 6= 0.
38 CAPITOLO 3. SUCCESSIONI DI NUMERI REALI

Dim. Le affermazioni 1 e 2 sono ovvie. Vediamo la 3, un po’ più difficile. Per


ipotesi, dato ε > 0 esistono N1 ed N2 in N tali che |pn − `|| < ε e |qn − m| < ε
rispettivamente per n > N1 ed n > N2 . Fissiamo N > max{N1 , N2 } e
osserviamo che per n > N
|pn qn − `m| = |pn qn − `qn + `qn − `m| ≤ |pn − `||qn | + |`||qn − m| (3.3)
per la disuguaglianza triangolare. Poiché ogni successione convergente è
limitata, avremo |qn | < M , e dunque
|pn qn − `m| ≤ M ε + |`|ε = (M + |`|)ε.
Poiché ε > 0 è arbitrario, altrettanto arbitrario è il numero (M + |`|)ε, e
quindi anche 3 è dimostrata. La dimostrazione di 4 è del tutto analoga, e lo
studente può provare a dimostrarla da solo, oppure può studiarla su uno dei
llibri di testo consigliati.
Nell’ultima dimostrazione, ci sono due passaggi la cui importanza non va
sottovalutata. Lo studente deve capirli bene e saperli adattare a situazioni
simili.
Il primo passaggio è di natura logica. Se un numero ε è piccolo a piacere,
altrettanto lo è 2ε, o anche 100ε. L’importante è che il fattore moltiplicativo
di ε sia indipendente da ε stesso.2
Il secondo passaggio, è la tecnica di sommare e sottrarre una medesima
– o anche più – quantità per raggruppare termini che fanno comodo. Nell’e-
quazione (3.3), sommare e sottrarre `qn ci ha permesso di raccogliere a fattor
comune termini come |pn − `|, che sapevamo stimare con ε. Avremo l’occa-
sione di applicare questa tecnica molto spesso, e l’unica regola per scoprire
che cosa aggiungere e togliere è l’esperienza. All’inizio, si procede by trial
and error, cioè provando senza paura di sbagliare.

Molti studenti ricorderanno che quando si studiano i limiti, i guai vengono


dalle forme di indecisione. Per poterne parlare, occorre per ò estendere la
definizione di limite.
Definizione 3.12. Sia {pn } una successione. Diciamo che {pn } tende a +∞
(risp. a −∞), e scriviamo limn→+∞ pn = +∞ (risp. limn→+∞ pn = −∞) se
per ogni numero reale M > 0 esiste un indice N ∈ N tale che pn > M per
ogni n > N (risp. pn < −M per ogni n > N ).
Osservazione 3.13. Fra i matematici è in voga la locuzione “la successione
{pn } esplode”. Di solito, con questo linguaggio un po’ colorito intendono dire
che limn→+∞ pn = +∞.
2
Ovvio, perché ε−1 ε = 1 non è affatto piccolo a piacere.
3.1. SUCCESSIONI E LORO LIMITI 39

Per esercizio, verifichiamo mediante questa definizione che limn→+∞ log n =


+∞. Fissiamo arbitrariamente un numero reale M > 0, e cerchiamo di sce-
gliere N ∈ N tale che log n > M per ogni n > N . Poiché la disuguaglianza
log n > M equivale a n > eM , ci basta scegliere il primo numero naturale N
maggiore di eM .
È ovvio che non tutte le relazioni di limite possono essere verificate ap-
pliacndo pedissequamente la definizione. È conveniente dicorrere alle regole
per il calcolo algebrico dei limiti, ogni volta che ciò sia possibile in virtù dei
teoremi visti nella pagine precedenti.

Sfortunatamente, esistono situazioni in cui le regole algebriche non pos-


sono essere conclusive: stiamo parlando delle forme di indeterminazione.
Dando per scontato che n → +∞ e 1/n → 0 quando n → +∞, vediamo che
1
n· =1→1
n
e dovremmo ipotizzare che +∞ · 0 = 1. Se però cambiamo l’esempio,
1
n2 · = n → +∞
n
e dunque +∞ · 0 = +∞. C’è di che diventare matti. Ma insomma, quanto
fa “zero per infinito”? La risposta è che... non fa! È la prima forma di
indecisione che incontriamo, e nasconde un fatto piuttosto sottile: non tutti
gli infiniti sono uguali fra loro.3 Si usa scrivere [0 · ∞] fra parentesi, per
sottolineare che la moltiplicazione scritta richiede ulteriori precisazioni.
Altre forme di indecisione molto popolari fra gli studenti sono
  h i
0 ∞
, , [+∞ − ∞].
0 ∞
Altrettanto indeterminate sono le espressioni
0 , [1∞ ] ,
 0

sebbene pochi studenti sembrino ricordarsene. A parte l’ultima e “patologi-


ca” espressione,4 tutte le altre sono caratterizzate dalla presenza di 0 e ∞.
La forma di indecisione più complicata è probabilmente [+∞ − ∞], mentre
per quelle di natura moltiplicativa esistono tecniche raffinate e potenti che
incontreremo a tempo debito. L’aspetto sgradevole è che queste tecniche ri-
chiedono il calcolo differenziale, e non sono pertanto direttamente applicabili
alle successioni.
3
A conferma del fatto che ∞ non designa un numero.
4
Ci sono nascosti dei logaritmi, come vedremo più avanti.
40 CAPITOLO 3. SUCCESSIONI DI NUMERI REALI

Osservazione 3.14. Perché introdurre la teoria dei limiti per le successioni,


considerato che impareremo presto la teoria dei limiti per tutte le funzioni di
una variabile reale? La risposta è che le successioni sono uno strumento molto
utile e forniscono tecniche dimostrative particolarmente intuitive di alcuni
teoremi. Inoltre, tutto il mondo informatico che ci circonda è basato sulle
successioni: i numeri vengono rappresentati come approssimazioni decimali
(o meglio binarie), ed anche i più avanzati software di calcolo utilizzano
tecniche basate sulle successioni per fornire risposte.

3.2 Proprietà asintotiche delle successioni


In questa lezione, vedremo una serie di risultati riguardanti le propriet à
delle successioni, che valgono “da un certo indice in poi”. Innanzitutto,
formalizziamo questa frase.
Definizione 3.15. Data una successione {pn }, diremo che una proprietà
vale definitivamente per {pn } quando esiste un indice N ∈ N tale che la
proprietà vale per ogni pn con indice n > N .
Osservazione 3.16. L’aggettivo “definitivamente” dipende in modo essen-
ziale dalla successione. Per essere più chiari, “definitivamente” per una suc-
cessione {pn } non significa “definitivamente” anche per un’altra successione
{qn }. Infatti, l’indice N che funziona per la prima successione potrebbe non
essere abbastanza grande da funzionare anche per la seconda successione.
Tuttavia, non siamo di fronte ad un grande problema. Se per la prima suc-
cessione troviamo un indice N1 e per la seconda un altro indice N2 , è chiaro
che l’indice N = max{N1 , N2 } va bene per entrambe, in quanto N è più
grande sia di N1 che di N2 .5
Ad esempio, una successione è definitivamente positiva se tutti i termi-
ni sono positivi tranne (al più) un numero finito. Inoltre, una successio-
ne converge a ` se e solo se la disuguaglianza ` − ε < pn < ` + ε è vera
definitivamente.
Il primo teorema che dimostriamo è molto importante.
Teorema 3.17 (Permanenza del segno). Supponiamo che limn→+∞ pn = ` ∈
R.
1. Se ` > 0 (risp. ` < 0), allora pn > 0 (risp. pn < 0) definitivamente.
5
La scrittura N = max{N1 , N2 } significa precisamente che N è il più grande fra N1 e
N2 . Ancora più esplicitamente, si confrontano fra loro N1 e N2 , e si sceglie il maggiore dei
due: quello sarà N .
3.2. PROPRIETÀ ASINTOTICHE DELLE SUCCESSIONI 41

2. Se pn ≥ 0 (risp. pn ≤ 0) definitivamente, allora ` ≥ 0 (risp. ` ≤ 0).

Dim. Infatti, supponiamo ` > 0. Fissiamo ε = 21 `, e scegliamo N ∈ N tale


che ` − ε < pn < ` + ε per ogni n > N . Quindi, in particolare, pn > ` − ε =
1
2
ε > 0 per n > N . Questo dimostra il punto 1.
Il punto 2 segue dal punto 1. Infatti, se ` < 0, allora sarebbe anche pn < 0
definitivamente, contro l’ipotesi pn ≥ 0.

Nel punto 2 del teorema precedente, la disuguaglianza stretta nell’ipotesi


non garantisce la disugualianza stretta nella tesi. Infatti, consideriamo la
successione pn = 1/n. Chiaramente, pn > 0 per ogni n, ma pn → 0 per
n → +∞.

C’è sempre un punto sul quale gli studenti dimostrano molta difficoltà:
rendersi conto che certe successioni non hanno limite, né finito né infinito.
Volendo fare un esempio, possiamo considerare la successione

{1, −1, 1, −1, 1, −1, 1, −1, . . . }.

Questa successione alterna i due valori 1 e −1 periodicamente, e dovrebbe


essere chiaro che non può esistere alcun numero reale ` che sia limite della
successione. Si tratta di un principio generale che, per i limiti di questo corso,
non possiamo inquadrare in un teorema.6 Per sgombrare il campo da future
discussioni, precisiamo che per noi esistono solo due categorie di successioni:
quelle convergenti e quelle divergenti. La successione appena vista è pertanto
divergente. Molti testi elementari parlano invece di successioni oscillanti.
Non c’è nulla di male in questo, ma non ci sem bra utile costringere lo
studente a imparare a memoria classificazioni ben poco utili. In fondo, i
limiti sono utili quando esistono, finiti o anche infiniti. Quando non esistono,
l’importante è capire perché non esistono.
Vi è una categoria di successioni il cui comportamento è piuttosto rego-
lare. Si tratta delle successioni monotone.

Proposizione 3.18. Sia {pn } una successione monotona crescente (o de-


crescente). Se {pn } è limitata, allora {pn } converge, e il limite coincide con
supn∈N pn (oppure con inf n∈N pn se {pn } è decrescente.)
6
Lo studente più curioso si accontenterà di sapere che, a fianco del limite, esistono
anche il limite inferiore lim inf n→+∞ e il limite superiore lim supn→+∞ . Una successione
converge se e solo se i limiti inferiore e superiore sono uguali. Purtroppo, la definizione dei
limiti inferiore e superiore non è semplice, e preferiamo evitare di aggiungere complicazioni
ulteriori.
42 CAPITOLO 3. SUCCESSIONI DI NUMERI REALI

Dim. Infatti, supponiamo che {pn } sia crescente, e poniamo S = supn∈N pn .


L’ipotesti di limitatezza della successione implica che S ∈ R.7 Sia ε > 0
fissato arbitrariamente. Per definizione di estremo superiore, esiste N ∈ N
tale che S − ε < pN < S. Per la monotonia di {pn }, se n > N allora

S − ε < pN ≤ pn < S,

e questo significa che pn → S per n → +∞. La dimostrazione nel caso in cui


{pn } sia decrescente è analoga.
Forse lo studente avrà notato che la Proposizione precedente ammette
una immediata generalizzazione.
Proposizione 3.19. Una successione crescente e illimitata dall’alto diverge
a +∞. Una successione decrescente e illimitata dal basso diverge a −∞.
Dim. In effetti, la Proposizione precedente dimostra che una successione mo-
notona tende8 sempre all’estremo superiore oppure all’estremo inferiore. Se
una successione è illimitata, almeno uno di tali estremi è infinito.
Osservazione 3.20. In realtà, la gran parte dei teoremi che parlano di suc-
cessioni e dei loro limiti hanno un’immediata generalizzazione secondo la
terminologie del “definitivamente”. Solo per fare un esempio, una successione
definitivamente monotona, cioè una successione che comincia ad essere mo-
notona dopo un certo indice,9 ovviamente possiede un limite, finito o infinito.
Questo dovrebbe essere abbastanza chiaro, dal momento che i primi termini
di una successione non ne influenzano il comportamento asintotico.

Enunciamo e dimostriamo uno dei criteri più usati per dimostrare la con-
vergenza delle successioni. Come accade sovente in matematica, il principio
è quello di ricondursi al caso precedente.
Teorema 3.21 (Due carabinieri). Siano {an }, {bn } e {pn } tre successioni.
Supponiamo che limn→+∞ an = limn→+∞ bn = ` ∈ R, e che an ≤ pn ≤ bn
definitivamente. Allora limn→+∞ pn = `. Se invece an → +∞ allora pn →
+∞, e se bn → −∞ allora pn → −∞.
Dim. Infatti, fissiamo ε > 0 e scegliamo N ∈ N tale che ` − ε < an < ` + ε e
` − ε < bn < ` + ε. Quindi

` − ε < an ≤ pn ≤ bn < ` + ε,
7
A volte, scriveremo S < +∞.
8
Usiamo questo verbo con una certa imprecisione.
9
Resta inteso che la monotonia deve sussistere per sempre, oltre quel valore dell’indice.
3.3. INFINITESIMI ED INFINITI EQUIVALENTI 43

e la prima parte del teorema è dimostrata. Se am → +∞, allora pn è definiti-


vamente maggiore di qualunque numero fissato, dato che pn ≥ an . Lasciamo
allo studente il caso bn → −∞, che si tratta in maniera del tutto analoga.

Una parola di commento sulla terminologia. L’appellativo “dei due ca-


rabinieri” rappresenta la classica immagine di due carabinieri ({an } e {bn })
che scortano in prigione (il limite) il prigioniero ({pn }), affiancandolo passo
dopo passo. È un’immagine che appare in molti libri per ragazzi di cento
anni fa. Apparentemente, i corpi di polizia dei paesi anglosassoni non han-
no mai avuto l’abitudine di scortare i malfattori in questo modo, ed infatti
nessun testo di calculus dimostra alcun “two–policemen theorem”. Un’altra
spiegazione è che associare galeotti e teoremi di matematica non è un buon
modo di rendere l’analisi matematica più affascinante.
Spesso il Teorema dei due carabinieri si applica alle successioni positive,
scegliendo an = 0 per ogni n. Pensiamo all’esempio
 
sin n
.
n

Non è affatto immediato verificare che questa successione ha limite, dato che
{sin n} ha un comportamento piuttosto bizzarro. Tuttavia, basta osservare
che | sin n| ≤ 1, e quindi
sin n 1
0 ≤ ≤ ,
n n
per concludere che la successione tende a zero. Il teorema dei due carabinieri
si applica con an = 0 e bn = 1/n.
In realtà non è veramente restrittivo pensare alle successioni che conver-
gono a zero. Vale il seguente risultato, la cui dimostrazione immediata è
lasciata per esercizio.

Proposizione 3.22. Una successione {pn } converge a ` ∈ R se e solo se la


successione di numeri non negativi {|pn − `|} converge a zero.

3.3 Infinitesimi ed infiniti equivalenti


In questa sezione, vogliamo introdurre un linguaggio piuttosto diffuso e co-
modo per confrontare due successioni con lo stesso comportamento.

Definizione 3.23. Sia {pn } e {qn } due successioni, entrambe tendenti a zero
(rispettivamente ad infinito). Diciamo che {pn } è un infinitesimo (rispetti-
44 CAPITOLO 3. SUCCESSIONI DI NUMERI REALI

vamente un infinito) equivalente a {qn }, in simboli10


pn  qn ,
se
pn
lim = 1.
n→+∞ qn
Osservazione 3.24. Ovviamente, se due successioni {pn } e {qn } sono tali
che limn→+∞ pn /qn = ` 6= 0, allora pn  `qn .
La principale utilità degli infinitesimo (ed infiniti) equivalenti è contenuta
nella seguente
Proposizione 3.25. Supponiamo che {an }, {pn } e {qn } siano successioni,
e che pn  qn . Allora
lim an pn = lim an qn .
n→+∞ n→+∞

Dim. Infatti,
pn
lim an pn = lim an qn = lim an qn ,
n→+∞ n→+∞ qn n→+∞

nel senso che il limite limn→+∞ an pn esiste se e solo se esiste limn→+∞ an qn ,


e i due valori coincidono.
In breve, è possibile sostituire fra di loro gli infinitesimi (o gli infiniti)
equivalenti nelle strutture moltiplicative. Lo studente faccia attenzione a
non tentare questa strada nel caso additivo: è falso che
lim an + pn = lim an + qn
n→+∞ n→+∞
se pn  qn .

3.4 Sottosuccessioni
Immaginiamo di avere una successione
{p1 , p2 , p3 , . . . , pn , . . . }
e di selezionare alcuni elementi da essa, avendo cura di prenderli in ordine
crescente di indici. Per esempio, potremmo selezionare
p3 , p10 , p11 , p50 , p100 , . . .
Anche se a prima vista sembra un po’ curioso, abbiamo costruito un’altra
successione. Diamo una definizione generale per questo procedimento.
10
Su alcuni testi si trova pn ∼ qn , oppure pn ≈ qn .
3.5. IL NUMERO E DI NEPERO 45

Definizione 3.26. Una successione {qn } è una sottosuccessione di {pn } se


qn = pk(n) , dove k : N → N è una funzione strettamente crescente. Per
brevità, si scrive spesso {pkn }.
Teorema 3.27. Una successione converge a un limite ` se e solo se tutte le
sue sottosuccessioni convergono a `.
Omettiamo la dimostrazione di questo teorema, ma vogliamo evidenziarne
l’importanza. Per esempio, la successione {1/n2 } converge a zero perché
è una sottosuccessione di {1/n}. Per lo stesso motivo, per ogni numero
naturale κ > 0 la successione {1/nκ } converge a zero. Lo studente non deve
pensare che questo ragionamento giustifichi la scrittura limn→+∞ 1/nα = 0
per ogni numero reale α > 0. Infatti, quando α non è un numero naturale,
{nα } non è una sottosuccessione di {n}. Per esempio, quando α = 1/2, la
successione √ √ √
1, 2, 3, 4, . . . ,
non è una sottosuccessione di 1, 2, 3, 4, . . . ,
Concludiamo con un teorema di esistenza. È un caso molto speciale di uno
dei teoremi più usati in tutta l’analisi matematica, il teorema di compattezza
per successioni degli insiemi chiusi e limitati di Rn .
Teorema 3.28. Sia [a, b] un intervallo chiuso e limitato di R. Ogni suc-
cessione {pn } tale che pn ∈ [a, b] per ogni n, possiede una sottosuccessione
convergente a qualche elemento di [a, b].
Ad esempio, la successione {1, −1, 1, −1, 1, −1, . . . } cade nelle ipotesi di
questo teorema.11 Infatti una sottosuccessione convergente esiste senz’altro:
{1, 1, 1, 1, . . . }. Molto meno scontato è il fatto che la successione {sin n}
possegga una sottosuccessione convergente.
Corollario 3.29. Ogni successione limitata di numeri reali possiede una
sottosuccessione convergente.
Dim. Se {pn } è limitata, esiste M > 0 tale che |pn | < M per ogni n. Allora
pn ∈ [−M − 1, M + 1] per ogni n, e dunque si applica il teorema precedente.

3.5 Il numero e di Nepero


Lo studente avrà senza dubbio già sentito parlare del numero di Nepero,12
indicato dalla lettera e. È uno dei numeri più celebri della matematica ele-
11
Si può scegliere [a, b] = [−1, 1].
12
O meglio di John Napier.
46 CAPITOLO 3. SUCCESSIONI DI NUMERI REALI

mentare, insieme a π e all’unità immaginaria i = −1.13 Il numero e è
anche la base di logaritmi universalmente utulizzata nelle scienze, avendo
ormai soppiantato in quasi tutti i settori la più classica base 10.14 Occorre
una definizione che individui tale numero senza possibilità di errore. Esistono
due definizioni (evidentemente equivalenti) di e. La prima, e anche la più
comoda per fare i calcoli, è

X 1
e= .
n=0
n!

Il simbolo n! = 1 · 2 · 3 · · · · · (n − 1) · n è il fattoriale di n, ma il guaio è che


noi non sappiamo sommare infiniti numeri reali, come richiesto dalla formula
precedente. Dovremmo addentrarci nella teoria delle serie numeriche, ma
usciremmo dai limiti di questo corso.
Proponiamo invece la seguente definizione, ormai comprensibile allo stu-
dente:  n
1
e = lim 1 + . (3.4)
n→+∞ n
Insomma, e è il limite della successione di termine n-esimo
 n
1
en = 1 + .
n

Ma chi garantisce che {en } abbia un limite, e che questo limite sia finito?
Poiché [1∞ ] è una forma di indecisione,15 certo non i teoremi sul calcolo
algebrico dei limiti. Si potrebbe dimostrare con un po’ di fatica, ma noi
non lo faremo, che {en } è una successione monotona crescente e limitata. Di
conseguenza, {en } ha un limite finito, e battezziamo e tale limite. Usando
un programma di calcolo, si trova la seguente approssimazione con cinquanta
cifre decimali esatte:

e ≈ 2.7182818284590452353602874713526624977572470937000 . . .
13
La formula eiπ +1 = 0 è considerata una delle relazioni più belle di tutta la matematica,
poiché coinvolge in maniera semplice i cinque numeri più importanti: 0, 1, e, π ed i.
14
Questa affermazione è vera quando si vuole usare il calcolo differenziale. Un tempo
i logaritmi servivano per fare velocemente i calcoli, ed era inevitabile scegliere come base
10, poiché siamo abituati ad usare il sistema decimale per esprimere i numeri. Se fossimo
abituati ad operare nel sistema binario dei computer, useremmo con maggior profitto la
base 2.
15
Lo studente mediti sul fatto che limn→+∞ 1pn = 1, qualunque sia la successione
{pn } che diverge a ∞. Non è in contraddizione con l’affermazione che [1∞ ] è una forma
indeterminata?
3.6. APPENDICE: SUCCESSIONI DI CAUCHY 47

Si dimostra che e è un numero irrazionale e che


 n X +∞
1 1
lim 1 + = .
n→+∞ n n=0
n!

3.6 Appendice: successioni di Cauchy


Supponiamo che {pn }n sia una successione convergente ad un limite (finito)
`. Per ogni ε > 0, esiste n ∈ N tale che per ogni n > N si ha |pn − `| < ε/2.
Sia m > N ; dalla disuguaglianza triangolare deduciamo che
ε ε
|pn − pm | ≤ |pn − `| + |pm − `| < + = ε.
2 2
A parole, abbiamo dimostrato che la distanza fra due termini di indice suffi-
cientemente grande di una successione convergente può essere resa piccola a
piacere. Diamo un nome alle successioni che soddisfano questa proprietà.
Definizione 3.30. Una successione {pn }n si chiama successione di Cauchy
se, per ogni ε > 0 esiste N ∈ N tale che

|pn − pm | < ε per ogni n, m > N . (3.5)

Dalla discussione precedente, tutte le successioni convergenti sono succes-


sioni di Cauchy. Ora, di fronte a questo genere di implicazione, viene spon-
taneo domandarsi se le successioni di Cauchy coincidano con le successioni
convergenti. La risposta è contenuta nel seguente teorema.
Teorema 3.31 (Completezza di R). Ogni successione di Cauchy di numeri
reali è convergente.
Premettiamo un risultato che interverrà nella dimostrazione.
Proposizione 3.32. Sia {pn }n una successione di Cauchy. Se una sotto-
successione {pnk }k converge a un limite `, allora tutta la successione {pn }n
converge a `.
Dim. Sia ε > 0. Esiste N ∈ N tale che, per ogni n, m > N risulta |pn −pm | <
ε. Per ipotesi, in corrispondenza di ε, esiste un indice K ∈ N tale che
|pnK − `| < ε. Fissiamo un numero naturale Ñ > max{N, nK }. Per ogni
indice n > Ñ , risulta

|pn − `| ≤ |pn − pnK | + |pnK − `| < ε + ε = 2ε.

In conclusione, limn→+∞ pn = `.
48 CAPITOLO 3. SUCCESSIONI DI NUMERI REALI

Dim. del teorema di completezza. Sia {pn }n una successione di Cauchy for-
mata da numeri reali. Dalla definizione di successione di Cauchy segue che
{pn }n è necessariamente limitata.16 Sappiamo (si veda il Teorema 3.28) che
ogni successione limitata possiede una sottosuccessione convergente, e chia-
miamo ` tale limite. Dalla precedente Proposizione, tutta la successione
{pn }n deve convergere a `, e questo conclude la dimostrazione.
Il nome di questo teorema è legato al fatto che gli spazi metrici in cui tutte
le successioni di Cauchy sono necessariamente convergenti vengono chiamati
completi.

16
Lo studente si convinca di questa affermazione. Suggerimento: fissato ε = 1, tutti
i numeri della successione, ad esclusione di un numero finito N , distano l’uno dall’altro
meno di 1, e possono dunque essere inseriti in un intervallo di ampiezza 1. Allarghiamo
ora l’ampiezza di questo intervallo finché non vengano intrappolati tutti i primi N termini
della successione...
Capitolo 4

Serie numeriche

Per spiegare che cosa sia una serie numerica,1 pensiamo di raccogliere una
quantità finita di numeri reali, di ordinarli in un certo modo

p1 , p2 , . . . , pN

e di sommarli: p1 + p2 + . . . + pN . P
Si può abbreviare questa scrittura
introducendo il simbolo di sommatoria :
N
X
pi = p1 , p2 , . . . , pN .
i=1

Osservazione 4.1. L’indice i è una variabile muta. Qualunque altra lettera


potrebbe essere usata senza alterare il valore della somma:
N
X N
X N
X
pi = pj = pk = . . .
i=1 j=1 k=1

Questa operazione è chiara se sommiamo un numero finito di termi-


ni, mentre diventa confusa se vogliamo sommare gli infiniti termini di una
successione.

Definizione 4.2. Sia {pn }n una successione di numeri reali. La serie asso-
ciata a {pn }n è la successione {sn }n definita dalla formula
n
X
sn = pj .
j=1

1
Esistono anche altri tipi di serie: di funzioni, di vettori, ecc.

49
50 CAPITOLO 4. SERIE NUMERICHE

Useremo il simbolo ∞
X
pn ,
n=1
P
o anche l’abbreviazione n pn , per indicare la successione {sn }n . La succes-
sione {sn }n prende il nome di successione delle somme parziali della serie.
Osservazione 4.3. Esplicitamente, s1 = p1 , s2 = p1 + p2 , s3 = p1 + p2 + p3 ,
ecc. Osserviamo che, data una serie {sn }n , risulta pn = sn − sn−1 , e pertanto
è univocamente individuata la successione che genera la serie.
Osservazione 4.4. In esatta analogia con le successioni del capitolo pre-
cedente, poco importa da quale valore parte l’indice della serie. Se è vero
che ∞ ∞
X X
pn e pn
n=1 n=0

rappresentano due serie diverse, tuttavia è noto che la convergenza della


prima equivale alla convergenza della seconda. Per questo motivo, capiterà
di far partire la serie dall’indice 0 o dall’indice 1, a seconda della convenienza.
Ovviamente, certe volte la forma della serie impone dei limiti all’indice. Si
pensi ad una serie come

X 1
,
n=2
n−1
il cui primo indice è n = 2 perché n = 1 annullerebbe il denominatore.
Osservazione 4.5. In relazione all’osservazione precedente, possiamo sfrut-
tare il fatto che l’indice di somma è una variabile muta per effettuare un’o-
perazione che sarà il cambiamento di variabile nella teoria dell’integrale di
Riemann. Operiamo su un esempio: la serie

X 1
n=1
3n

si trasforma nella serie ∞ ∞


X 1 1X 1
=
k=0
3k+1 3 k=0 3k
mediante il cambiamento di indice k = n − 1. Per convincersene, scriviamo
“con i puntini” le due serie:

X 1 1 1 1
n
= + 2
+ 3
+ ...
n=1
3 3 3 3
51

∞  
1X 1 1 1 1 1 1
k
= 0
+ + 2 + 3 + ...
3 k=0 3 3 3 3 3 3
1 1 1
= + 2 + 3 + ...
3 3 3
Dunque una serie è semplicemente una successione, il cui termine gene-
rale è costruito sommando i primi termini di un’altra successione. Si pone
naturalmente il problema della convergenza delle serie numeriche.
Definizione 4.6. La serie ∞
P
n=1 pn converge al valore S se
n
X
S = lim pj ,
n→+∞
j=1

o, con la notazione usata finora, se S = limn→+∞ sn . Con un leggero abuso


di notazione, si scrive S = ∞
P
p
n=1 n .

L’angolo dello psichiatra. Gli studenti più attenti si saranno senz’altro ac-
corti della notazione paradossale usata comunemente perP indicare una serie.
Siccome P abbiamo definito una serie come la successione { nk=1 pk }n , usare il
simbolo ∞ n=1 pn significa confondere la serie con il suo limite! Se pensassimo
di estendere questo abuso di notazione a tutte le successioni, ci accorgerem-
mo immediatamente della pazzia compiuta: invece della successione {1/n} P n,
parleremmo della successione 0, il suo limite. La scrittura abbreviata n pn
è già migliore, ma non esente da critiche. Possiamo confrontare quest’uso
“leggero” dei simboli con l’espressione “la funzione x3 ”, che alla lettera non
è affatto una funzione, ma – al massimo – un numero reale. Probabilmente
tutto ci ò è un retaggio della confusione fra successioni, numeri e funzioni
che caratterizzava gli albori dell’analisi matematica.

Esiste una condizione necessaria e sufficiente per caratterizzare le serie


convergenti.
P∞
Teorema 4.7 (Criterio di convergenza di Cauchy). Una serie n=1 pn è
convergente se e solo se, per ogni ε > 0 esiste un numero N ∈ N tale che
q
X
|pn | < ε
n=p

per ogni p, q ∈ N tali che p > N , q > N .


Dim. È la traduzione, nel linguaggio delle serie, del teorema di completezza
di R.
52 CAPITOLO 4. SERIE NUMERICHE

A volte si riassume il contenuto di questo teorema dicendo che “le code


della serie sono piccole a piacere”.
Corollario 4.8. Se la serie ∞
P
n=1 pn è convergente, allora limn→+∞ pn = 0.

Dim. Se la serie è convergente, il criterio di Cauchy garantisce che, fissato


arbitrariamente ε > 0, esiste N ∈ N tale che, in particolare,
k
X
|pn | = |pk | < ε
n=k−1

per ogni k > N . Ma questa è la definizione del limite limn→+∞ pn = 0.


Questo corollario, letto in negativo, afferma che se il termine generale pn
di una serie
P non tende a zero, allora la serie non può convergere. Ad esempio,
n−1 n−1
la serie n n+2 non converge, dato che limn→∞ n+2 = 1. Purtroppo, non è
P 1
possibile invertire questo ragionamento: vedremo presto che la serie n n2
converge, mentre la serie n n1 non converge. Entrambe hanno tutavia un
P
termine generale tendente a zero.
Osservazione 4.9. Dato che una serie è semplicemente una successione par-
ticolare, una serie può convergere o divergere. Nella divergenza sono inclusi
tanto la divergenza all’infinito, quanto l’oscillazione. Per esempio, la serie
n
P
n (−1) oscilla fra i valori −1 e 0.

Esempio: la serie geometrica. Sia q ∈ [0, +∞) un numero fissato.


Consideriamo la serie

X
qn = 1 + q + q2 + q3 + q4 + . . .
n=0

Ci chiediamo se esistano scelte della ragione q che portano ad una serie


convergente. Togliendo le parentesi, è facile convincersi che
(1 − q) 1 + q + q 2 + q 3 + q 4 + . . . + q n = 1 − q n+1 .


Pertanto,
n
X 1 − q n+1
sn = qk = .
k=0
1−q
La successione {sn }n delle somme parziali converge se e solo se limn→+∞ q n+1
esiste finito, e questo accade se se solo se 0 < q < 1. Inoltre, abbiamo anche
il valore della serie: ∞
X 1
qn =
n=0
1−q
53

per 0 < q < 1.


P
Esempio: le serie telescopiche. Vanno sotto tale nome le serie n pn il
cui termine generale può essere scritto come

pn = qn − qn+1

per una scelta opportuna di {qn }n . È allora chiaro che


n
X n
X
pk = qk − qk+1 = q1 − q2 + q2 − q3 + q4 − q5 + . . . = q1 − qk+1 .
k=1 k=1

Si conclude subito che



X n
X
pn = lim pk = q1 − lim qn+1 . (4.1)
n→+∞ n→+∞
n=1 k=1

Una serie telescopica converge se e solo se limn→+∞ qn esiste finito. La serie


di Mengoli è un esempio di questa classe di serie:

X 1
.
n=1
n(n + 1)

Poiché
1 1 1
= − ,
n(n + 1) n n+1
possiamo porre qn = 1/n e concludere da (4.1) che la serie di Mengoli converge
a 1.
In generale, potrebbe non essere evidente fin dall’inizio che una serie è
telescopica. Di primo acchito, la serie

X (n + 1)2
log
n=1
n(n + 2)

non sembra molto telescopica. Usando però le proprietà dei logaritmi, vedia-
mo che
(n + 1)2
log = 2 log(n + 1) − log n − log(n + 2)
n(n + 2)
= [log(n + 1) − log n] − [log(n + 2) − log(n + 1)].

La serie è telescopica con qn = log(n+1)−log n. Poiché qn → 0 per n → +∞,


da (4.1) deduciamo che questa serie converge a log 2.
54 CAPITOLO 4. SERIE NUMERICHE

4.1 Serie a termini positivi


Vanno sotto questo nome le serie i cui termini sono numeri maggiori o uguali a
zero. Queste serie presentano una forte peculiarità: o convergono o divergono
all’infinito. Infatti, se pn ≥ 0 per ogni n, allora
n
X n+1
X
sn = pk ≤ pk = sn+1 ,
k=1 k=1

e dunque la serie è monotona crescente. Sappiamo che una successione mo-


notona o converge o diverge all’infinito, e questo giustifica la precedente
affermazione sulle serie a termini positivi. In effetti, vale di più.
P
Proposizione 4.10. Sia n pn una serie a termini positivi. Questa serie
è convergente se e solo se la successione {sn }n delle sue somme parziali è
limitata dall’alto.
Dim. Infatti, sappiamo che {sn }n è monotona crescente. Dalla teoria vista
nel capitolo precedente, {sn }n converge se e solo se supn |sn | < +∞, cioè se
e solo se esiste una costante C > 0 tale che sn ≤ C per ogni n.
Il principale strumento per l’analisi della convergenza delle serie a termini
positivi è il seguente teorema di confronto.
P P
Teorema 4.11. Siano n pn e n qn sue serie a termini positivi. Suppo-
niamo che pn ≤ qn per ogni n sufficientemente grande.
P P
1. Se n qn converge, allora anche n pn converge.
P P
2. Se n pn diverge, allora anche n qn diverge.
Dim. Nel primo caso, le somme parziali della prima serie sono più piccole
delle somme parziali della seconda serie, le quali per ipotesi restano limitate.
Perciò saranno limitate anche le somme parziali della prima serie.
Nel secondo caso, le somme parziali della seconda serie sono maggiori delle
somme parziali della prima serie. PoichéPqueste ultime non sono limitate, non
lo saranno nemmeno quelle della serie n qn .
Osservazione 4.12. Il criterio del confronto è destinato a fallire per le serie
di termini arbitrari. Ad esempio,
1 1
− < 2,
n n
ma la serie − n n1 diverge (a −∞), mentre la serie n 1
P P
n2
converge. Si veda
il Corollario 4.20.
4.1. SERIE A TERMINI POSITIVI 55
P P
Corollario 4.13 (Criterio del confronto asintotico). Siano n pn e n qn
sue serie a termini positivi. Supponiamo che
pn
lim = ` ∈ (0, +∞).
n→+∞ qn

Allora le due serie sono simultaneamente convergenti o divergenti.

Dim. Per l’ipotesi sul limite, esiste un numero N ∈ N tale che


` 3
qn ≤ pn ≤ `qn (4.2)
2 2
per ogni n > N . La conclusione segue immediatamente dal criterio di
confronto.
Per comprendere la potenza di questo criterio, applichiamolo all’analisi
della serie ∞
X 1
sin 2 .
n=1
n
Innanzitutto, i termini della serie sono positivi, dal momento che 0 < 1/n <
π/2 per ogni n ≥ 1 e la funzione seno è positiva nell’intervallo (0, π/2).
Dal limite notevole limx→0 sinx x = 1 deduciamo che la serie data ha lo stesso
comportamento della serie

X 1
2
,
n=1
n
e presto imparareremo che questa serie è convergente. Il criterio del confronto
asintotico garantisce che anche la serie iniziale converge.

Osservazione 4.14. Se nel criterio del P asintotico risulta ` = 0,


P confronto
non è più possibile dedurre che le serie n pn e n qn hanno lo stesso compor-
tamento rispetto alla convergenza. Per convincerci di questo, consideriamo
pn = 1/n2 e qn = 1/n. Ovviamente limn→+∞ pP
n /qn = limn→+∞ 1/n = 0, ma
impareremo presto che n n diverge, mentre n n12 converge.
P 1
Non tutto è P comunque perduto: se ` = 0, possiamo
P concludere che la
convergenza di n qn implica la convergenza di P n pn . Infatti, per
P ` = 02
vale solo la seconda disuguaglianza di (4.2), perciò n pn ≤ (3/2)` n qn .

2
Siamo volutamente imprecisi: la conclusione rigorosa sarebbe che le somme parziali
della serie con pn sono maggiorate dalle somme parziali della serie con qn . Come sappiamo,
il criterio asintotico non può garantire
P anche per i primi valori di n, e questo
la (4.2) P
potrebbe invalidare la relazione n pn ≤ (3/2)` n qn .
56 CAPITOLO 4. SERIE NUMERICHE

4.2 Criteri di convergenza


Ma esistono metodi generali per decidere se una data serie sia convergente?
La risposta è ampiamente affermativa per le serie a termini positivi, ed so-
lo parzialmente affermativa per le serie qualunque. Nel seguito, esporremo
alcuni criteri classici per studiare la natura di una serie numerica.
P
Teorema 4.15 (Criterio della radice). Sia n pn una serie a termini posi-
tivi. Supponiamo che

lim n pn = L.
n→+∞

Se L < 1, allora la serie converge; se L > 1, allora la serie diverge. Il criterio


non è applicabile se L = 1.
Dim. Supponiamo dapprima che L < 1. Preso ε−(1−L)/2, esiste un numero

naturale N tale che n pn < L + ε = (1 + L)/2 per ogni n > N . Elevando
questa diseguaglianza alla potenza n,
 n
1+L
pn < ,
2
1+L n
e poiché la serie geometricaP ∞

è convergente3 dal criterio del
P
n=0 2
confronto concludiamo che n pn converge. Se invece L > 1, prendiamo
ε = (L − 1)/2, e come prima arriviamo a
 n
√ 1 + L
n
pn > >1
2
per ogni n > N . Quindi {pn }n non tende a zero, e la serie non può convergere.

P
Teorema 4.16 (Criterio del rapporto). Sia n pn una serie a termini posi-
tivi. Supponiamo che
pn+1
lim = L.
n→+∞ pn

Se L < 1, allora la serie converge; se L > 1, allora la serie diverge. Il criterio


non è applicabile se L = 1.
Dim. Supponiamo dapprima che L < 1. Preso ε−(1−L)/2, esiste un numero
naturale N tale che pn+1 /pn < L + ε = (1 + L)/2 per ogni n > N . Quindi
pn+1 < pn (1 + L)/2 per ogni n > N . Ma allora
 2  n−N −1
1+L 1+L 1+L
pn < pn−1 < pn−2 < . . . < pN +1 ,
2 2 2
3 1+L
Infatti 2 < 1.
4.2. CRITERI DI CONVERGENZA 57

che possiamo scrivere come


 n
pN +1 1+L
pn < .
1+L N +1 2

2

1+L n
la serie geometrica convergente ∞
P 
Ancora dal confronto con P n=0 2
de-
duciamo la convergenza di n pn . Viceversa, per L > 1, preso ε = (L − 1)/2,
ripetendo gli stessi ragionamenti arriviamo a
 n
pN +1 1+L
pn >
1+L N +1 2

2

ed ancora una volta il termine generale pn non tende a zero.

Osservazione 4.17. Lo studente avrà notato che questi criteri sono sem-
plicemente applicazioni del criterio del confronto con opportune serie geo-
metriche. Le divergenze, invece, sono dedotte dal fatto che viene violata la
condizione necessaria per la convergenza di una serie. Intuitivamente, questo
fatto ci induce a sospettare che i due criteri non siano particolarmente fini nei
casi meno accademici. Come anticipato, nel caso L = 1 nessuno dei criteri è
efficace. Rimandiamo la disamina di questo fatto all’osservazione successiva.

Osservazione 4.18. Il criterio del rapporto, di solito, è di applicazione più


immediata. Ormai sappiamo che in matematica non si fanno sconti, e pun-
tualmente ciò accade anche in questa situazione. Si potrebbe mostrare che
il criterio della radice è più potente: quando è efficace, lo è anche il criterio
del rapporto. Quando non è conclusivo (per L = 1), anche il criterio del
rapporto non porta ad alcuna conclusione. Per i dettagli, rimandiamo a [24].
Volendo fare dell’ironia, né l’uno né l’altro sono criteri utili nella “pratica”.
Risultano invece importanti nella teoria delle serie di potenze, da cui prende
vita l’analisi matematica nel piano complesso.

Un criterio piuttosto efficace è il seguente, a dispetto della formulazione


vagamente misteriosa.
P
Teorema 4.19 (Criterio di condensazione). Sia n pn una serie a termini
positivi.
P Supponiamo che pn+1 ≤ pn per ogni n. Sotto tali ipotesi, la serie
n pn converge se e solo se converge la serie
X
2k p2k .
k
58 CAPITOLO 4. SERIE NUMERICHE

Dim. Poiché stiamo lavorando con P serie a P


termini positivi, ci basta dimo-
strare che le somme parziali di n pn e di k 2k p2k sono simultaneamente
limitate o non limitate dall’alto. Siano

sn = p1 + p2 + . . . + pn ,
tk = p1 + 2p2 + . . . + 2k p2k

le somme parziali delle due serie.


Per n < 2k ,

sn ≤ p1 + (p2 + p3 ) + . . . + (p2k + . . . + p2k+1 −1 )


≤ p1 + 2p2 + . . . + 2k p2k
= tk

e quindi sn ≤ tk . Invece, Per N 2k ,

sn ≥ p1 + p2 + (p3 + p4 ) + . . . + (p2k−1 +1 + . . . + p2k )


1
≥ p1 + p2 + 2p4 + . . . + 2k−1 p2k
2
1
= tk
2
e quindi tk ≤ 2pn . Unendo le due conclusioni, le succesisoni delle somme
parziali {sn }n e {tk }k sono simultaneamente limitate oppure illimitate, e
questo conclude la dimostrazione.

Corollario 4.20. Sia α ∈ R fissato. La serie n n1α converge se α > 1, e


P
diverge se α ≤ 1.

Dim. Il caso α ≤ 0 è semplice, perché il termine generale non tende a zero.


Applichiamo il criterio di condensazione, e ci riduciamo a studiare la serie
X 1 X
2k = 2(1−α)k .
k
2kα k

Si tratta di una serie geometrica di ragione 21−α . Essa sarà convergente se


e solo se 21−α < 1, cioè se e solo se α > 1, e divergente all’infinito per
α ≤ 1.

Osservazione 4.21. Il Corollario ci convince che i criteri del rapportoP e della


∞ 1
radice
P∞ 1 sono insoddisfacenti quando L = 1. Ad esempio, le due serie n=1 n
e n=1 n2 hanno entrambe L = 1 (per entrambi
P∞ 1 i criteri), ma la prima
diverge, mentre la seconda converge. La serie n=1 n prende il nome di
4.2. CRITERI DI CONVERGENZA 59

serie armonica. La sua divergenza può essere mostrata anche direttamente.


Chiamando al solito sn la somma dei suoi primi n termini, abbiamo
s1 = 1
1 3
s2 = 1 + =
2 2
3 1 1 3 1 1
s3 = + + > + + =2
2 3 4 2 4 4
1 1 1 1 1 1 1 1 5
s4 = 2+ + + + >2+ + + + =
5 6 7 8 8 8 8 8 2
e in generale
1 1 1 1
s2n = 1 + + ··· + + + ··· + =
2 n n+1 2n
1 1 1 1 1
= sn + + ··· + ≥ sn + + ··· + = sn + .
n+1 2n 2n 2n 2
Raddoppiando quindi il numero degli addendi, la somma aumenta almeno di
un termine 1/2. Deduciamo che |s2n − sn | ≥ 1/2, e quindi non può essere
soddisfatto il criterio di convergenza di Cauchy.
Questa serie ci consente un’osservazione di natura pratica. Volendo stu-
diare al computer le serie, può essere molto fuorviante leggere le prime somme
parziali e trarne conclusioni sulla convergenza. Infatti, per la serie armonica
si ha
s1 = 1
s3 < 2
s7 < 3
s15 < 4.

Per arrivare a 10 bisogna sommare più di 1000 termini, e pre superare 20


occorrono fpiù di un milione di addendi. Se si vuole arrivare a 100, che pure
non è un segno inqeuivocabile della divergenza della serie, occorre sommare
circa 1030 termini! 4 È abbastanza evidente che questa quantità di addendi
supera ampiamente le capacità di calcolo di molti personal computer.
Il punto è che le serie numeriche sono molto sensibili alle piccole pertur-
bazioni dei loro termini. La serie

X 1
n=1
n1.01
4
1030 si scrive come 1 seguito da 30 zeri.
60 CAPITOLO 4. SERIE NUMERICHE

ha termini numericamente molto prossimi a quelli della serie armonica, ma


nonostante questo è convergente. Il celebre filosofo francese Voltaire sugge-
riva maliziosamente al matematico tedesco Gauss che prima di mettersi a
fare conti per tre giorni, è meglio controllare se non si possa usare qualche
ragionamento per arrivare in porto in tre minuti.5

4.3 Convergenza assoluta e convergenza delle


serie di segno alterno
Tutti i criteri esposti si applicano alle serie a termini positivi. 6 Ci sono
criteri di convergenza per le serie qualunque? Prima di rispondere – e la
risposta non sarà del tutto soddisfacente – introduciamo il concetto di serie
assolutamente convergente.
P P
Definizione 4.22. Una serie n pn è assolutamente convergente se n |pn |
è convergente.

Poiché |pn | ≥ 0, il concetto di serie assolutamente convergente è di perti-


nenza delle serie a termini positivi. Inoltre, le serie assolutamente convergenti
sono convergenti.

Proposizione 4.23. Ogni serie assolutamente convergente è anche conver-


gente.

Dim. Basta osservare che pn ≤ |pn | ed applicare il criterio del confronto.

Osservazione 4.24. La Proposizione non si inverte: vedremo che la serie


X (−1)n

n
n

5
K.F. Gauss, uno dei più importanti matematici dell’era moderna, aveva una caparbia
invidiabile nel mettersi a fare calcoli. Oggi lo potremmo definire simpaticamente uno
“smanettone”. Ad onor del vero, certi problemi matematici possono essere risolti solo
ricorrendo a lunghe pagine di calcoli. Quello del matematico come uno scienziato che
risolve problemi difficili senza scrivere una sola riga di conti è un falso mito che lusinga
tutti gli studenti del primo anno. L’eleganza formale con cui vengono presentati i teoremi
non dovrebbe far passare in secondo piano i sacrifici e gli sforzi dei matematici che li hanno
dimostrati per la prima volta.
6
È giunto il momento di sfatare un mito: ovviamente questi criteri si applicano al-
trettanto bene alle serie a termini negativi. L’importante è che tutti i termini della serie
abbiano lo stesso segno.
4.3. CONVERGENZA ASSOLUTA E CONVERGENZA DELLE SERIE DI SEGNO ALTERNO61

converge, ma ovviamente non converge assolutamente (perché?). Questo non


diminuisce l’utilità della Proposizione 4.23. Non saremmo altrimenti in grado
di stabilire la convergenza della serie
X sin n
3
,
n
n

visto che i suoi termini non sono tutti dello stesso segno. Usando per ò la
maggiorazione | sin n| ≤ 1, possiamo concludere che questa serie converge
assolutamente, e quindi anche in senso ordinario. 7
Una classe di serie a termine di segno variabile è quella delle serie a termini
di segno alterno.
P
Definizione 4.25. Una serie n pn è detta serie a termini di segno alterno
quando pn pn+1 ≤ 0 per ogni n.
Di fatto, la Definizione richiede che ogni coppia di termini successivi nella
serie sia costituita da due numeri di segno opposto (o eventualmente nulli).
Il caso più frequente è quello delle serie del tipo
X
(−1)n pn ,

dove pn ≥ 0 per ogni n. Per queste serie esiste un potente criterio di conver-
genza (ma non di divergenze). Premettiamo un lemma che corrisponde alla
formula di integrazione per parti nel calcolo integrale.
Lemma 4.26 (Sommatoria per parti). Siano {pn }n e {qn }n due successioni.
Poniamo s−1 = 0 e
Xn
sn = pk
k=0
per n ≥ 0. Se 0 ≤ m ≤ n sono numeri naturali, allora
m
X m−1
X
pk qk = sk (qk − qk+1 ) + sm qm − sn−1 qn . (4.3)
k=n k=n

Dim.
m
X m
X m
X m−1
X
pk qk = (sk − sk−1 )qk = sk qk − sk qk+1
k=n k=n k=n k=n−1

e l’ultima espressione è uguale a (4.3).


7
A volte conviene dire che una serie converge semplicemente quando essa converge
secondo la definizione generale. In questo modo, si usa un aggettivo per distinguere la
convergenza dalla convergenza assoluta.
62 CAPITOLO 4. SERIE NUMERICHE

Teorema 4.27 (Criterio di Leibniz). Supponiamo che


P
1. le somme parziali {sn }n di n pn formino una successione limitata;

2. q0 ≥ q1 ≥ q2 ≥ . . .;

3. limn→+∞ qn = 0.
P
Allora n pn qn converge.
Dim. Scegliamo M > 0 tale che |sn | ≤ M per ogni n. Fissato arbitrariamente
ε > 0, per l’ipotesi 3 esiste un numero naturale N tale che qN ≤ ε/(2M ).
Per N ≤ n ≤ m, dal Lemma precedente ricaviamo

X m m−1
X
pk qk = sk (qk − qk+1 ) + sm qm − sn−1 qn



k=n k=n

m−1
X
≤M (sk − sk+1 ) + qm + qn = 2M qn ≤ 2M qN = ε.


k=n
P
Questo dimostra che la serie n pn qn soddisfa la condizione di Cauchy, e
quindi converge.
Corollario 4.28. Supponiamo che
1. |c1 | ≥ |c2 | ≥ |c3 | ≥ . . .;

2. c2n−1 ≥ 0, c2n ≤ 0;

3. limn→+∞ cn = 0.
P
Allora n cn converge.
Dim. Applicare il Teorema precedente con pn = (−1)n+1 e qn = |cn |.
n
Questo corollario garantisce ad esempio che n (−1)
P
n
converge. poiché
|cn | = 1/n è decrescente e tende a zero. Si noti il contrasto con la convergenza
assoluta, che in questo caso non sussiste.

Esistono “infiniti” criteri di convergenza e/o divergenza per le serie (preva-


lentemente a termini positivi). In questo breve capitolo ne abbiamo discussi
alcuni estremamente classici. Lo studente interessato potrà trovarne altri
in [21] e nei testi classici di analisi matematica come [16]. I testi più recenti
sembrano dare molto meno peso a questi criteri, dal momento che sono tutti
riconducibili al criterio di confronto (eventualmente asintotico).
Capitolo 5

Limiti di funzioni e funzioni


continue

Con questo capitolo, lasciamo il mondo delle successioni, cioè delle funzio-
ni definite sul dominio N, ed entriamo in quello delle funzioni reali di una
variabile reale. Vedremo che anche per queste funzioni è sensato pensare a
un concetto di limite, ed anzi c’è una maggiore flessibilità. Come lo stu-
dente avrà osservato, i limiti delle successioni si calcolano solo per l’indice
n → +∞. Parlando in termini estremamente imprecisi, questo non ci sor-
prende più di tanto. D’altronde, se lo spirito dei limiti è quello di vedere cosa
succede quando una variabile si avvicina a piacere a un valore, una variabile
n ∈ N non può avvicinarsi a piacere a un numero reale. Invece, una variabile
reale x può senza dubbio essere vicina a piacere a qualunque altro numero
reale.

5.1 Limiti di funzioni come limiti di successioni


Definizione 5.1. Sia f : (a, b) → R una funzione, e sia x0 un punto di
accumulazione di (a, b).1 Diremo che limx→x0 f (x) = L, o che f (x) → L
per x → x0 , se limn→+∞ f (xn ) = L per ogni successione {xn } di numeri
xn ∈ (a, b) con limn→+∞ xn = x0 e xn 6= x0 per ogni n.

Logicamente parlando, questa definizione è rigorosa: sappiamo calcola-


re i limiti di succesioni e questo è tutto quello che la definizione richiede.
Confrontando con la definizione di limite per successioni, troviamo imme-
1
Non è una svista, x0 potrebbe essere uno degli estremi del dominio di f , anche se f
non è definita per questi due valori.

63
64 CAPITOLO 5. LIMITI DI FUNZIONI E FUNZIONI CONTINUE

diatamente una diversa caratterizzazione dei limiti di funzioni.2 Per inciso,


verificare una relazione di limite con la Definizione 5.1 è praticamente impos-
sibile. Vedremo fra poco che la condizione (ii) del seguente teorema rende le
verifiche più agevoli.

Teorema 5.2. Siano f e x0 come nella Definizione. Sono equivalenti

(i) limx→x0 f (x) = L;

(ii) per ogni ε > 0 esiste δ > 0 tale che |f (x) − L| < ε per ogni x ∈ (a, b)
tale che 0 < |x − x0 | < δ.

Dim. Supponiamo che sia vera la (i) ma che la (ii) sia falsa. Allora esiste
ε > 0 ed esiste una successione {xn } tale che xn → x0 , xn 6= x0 , ma |f (xn ) −
L| ≥ ε. Questà è una contraddizione con l’ipotesi (i), e perciò anche (ii)
deve essere vera. Viceversa, supponiamo che sia vera (ii) e dimostriamo la
(i). Sia {xn } una qualunque successione di elementi di (a, b), distinti da x0
e tali che xn → x0 . Fissiamo ε > 0 e sia δ > 0 il numero la cui esistenza
è garantita dall’ipotesti (ii). Definitivamente, 0 < |xn − x0 | < ε, e dunque
|f (xn ) − L| < ε. Questo significa esattamente che limn→+∞ f (xn ) = L.
Invitiamo lo studente ad osservare e memorizzare la richiesta “xn 6= x0 ” e
l’equivalente 0 < |x − x0 |. Entrambe significano che, nell’effettuare l’opera-
zione di limite per x → x0 , possiamo (e dobbiamo) trascurare completamente
tutto ciò che avviene nel punto x0 . Nel punto x0 a cui tende la x la funzione f
potrebbe tranquillamente non essere definita. Ma anche se lo fosse, il valore
f (x0 ) non importerebbe nulla. Per esempio, le due funzioni

f (x) = x ∀x ∈ R

e (
x, x 6= 0
g(x) =
1, x = 0
assumono valori diversi in x0 = 0, e tuttavia limx→x0 f (x) = limx→x0 g(x) =
0. L’Autore di [13] sottolinea che la richiesta “|x−x0 | > 0” potrebbe tranquil-
lamente essere omessa, perché le funzioni che in questo modo non avrebbero
limite sarebbero “senza importanza”. Chi scrive rispetta ovviamente questo
punto di vista, ma non lo condivide. Il concetto di limite sembra infatti
particolarmente significativo proprio perché è applicabile in quei punti vici-
ni a piacere al dominio di definizione (i cosiddetti punti di accumulazione
2
In certi testi italiani, il prossimo teorema viene chiamato teorema ponte. Non avendo
mai capito bene questa terminologia, preferiamo evitarla.
5.1. LIMITI DI FUNZIONI COME LIMITI DI SUCCESSIONI 65

per il dominio di definizione) ma non necessariamente appartenenti al domi-


nio medesimo. Quindi, una scrittura come limx→0+ x1 = +∞ perderebbe di
significato.
Osservazione 5.3. È fondamentale che lo studente capisca il seguente fatto:
se esiste un δ > 0 come nel punto (ii) del Teorema precedente, anche tutti i
numeri positivi δ̃ < δ vanno bene. Nella pratica, questo significa che possiamo
sempre considerare restrizioni come δ ≤ 1 quando verifichiamo un limite. In
effetti, la dimostrazione di limite non pretende che si individui il migliore
δ > 0 che verifichi le richieste.

Per chiarire come si applica la definizione di limite, dimostriamo che per


ogni a > 0 √ √
lim x = a.
x→a
√ √
Infatti,√consideriamo la quantità x − a; moltiplicando e dividendo per

x + a si ottiene3
√ √
x − a = √|x − √ a| |x − a|
< √ .
x+ a a
√ √ √
Fissato allora ε > 0, si avrà | x − a| < ε non appena x ≥ 0√e |x−a| < ε a;
la relazione (ii) del Teorema sarà allora verificata con δ = ε a. Osserviamo
che
√ il risultato
√ √vale anche per a = 0, con una diversa dimostrazione. Infatti,
| x − 0| = x < ε non appena 0 ≤ x < ε2 . Basterà scegliere δ = ε2 .
Lo studente ha certamente
√ notato che il valore del limite altro non è che
il valore assunto da √x quando x = a. Insomma, sarebbe bastato sostituire
x = a nella funzione ·. Certamente non è un caso, e capiremo nel capitolo
successivo tutte le ragioni di questa apparente coincidenza.
Osservazione 5.4. Una definizione più generale di limite è la seguente. Sia
f : E → R una funzione, definita sull’insieme E ⊂ R. Sia x0 è un punto di
accumulazione di E; diciamo che

lim f (x) = L
x→x0
x∈E

se, per ogni successione {xn } di elementi xn ∈ E, escluso al più x0 stes-


so, convergente a E, accade che limn→+∞ f (xn ) = L. Oppure, in manie-
ra equivalente, se per ogni ε > 0 esiste δ > 0 tale che, per ogni x ∈
E ∩ ((x0 − δ, x0 + δ) \ {x0 }), accade che |f (x) − L| < ε.
3
√ √ √
Aumentando il denominatore, la frazione diminuisce. Poiché x+ a> a, è valida
l’ultima disuguaglianza.
66 CAPITOLO 5. LIMITI DI FUNZIONI E FUNZIONI CONTINUE

Questa definizione si riduce alle precedenti quando E è un intervallo, e


contiene automaticamente i limiti per x → ∞, ma in un corso elementare
c’e’ il rischio che l’eleganza di questa definizione non venga apprezzata.
Introduciamo ora i limiti all’infinito. Vediamo come si esprimono le
corrispondenti definizioni.
Definizione 5.5. Sia f : (a, b) → R e sia x0 ∈ [a, b]. Diremo che
limx→x0 f (x) = +∞ se per ogni K > 0 esiste δ > 0 tale che f (x) > K
per ogni x ∈ (x0 − δ, x0 + δ).
Definizione 5.6. Sia f : (a, b) → R e sia x0 ∈ [a, b]. Diremo che
limx→x0 f (x) = −∞ se per ogni K > 0 esiste δ > 0 tale che f (x) < −K
per ogni x ∈ (x0 − δ, x0 + δ).
Definizione 5.7. Sia f : (a, +∞) → R una funzione definita su un intervallo
illimitato a destra.4 Diremo che limx→+∞ f (x) = L ∈ R se per ogni ε > 0
esiste M > 0 tale che |f (x) − L| < ε per ogni x > M .
Definizione 5.8. Sia f : (−∞, b) → R una funzione definita su un intervallo
illimitato a sinistra.5 Diremo che limx→−∞ f (x) = L ∈ R se per ogni ε > 0
esiste M > 0 tale che |f (x) − L| < ε per ogni x < −M .
Definizione 5.9. Sia f : (a, +∞) → R una funzione definita su un intervallo
illimitato a destra. Diremo che limx→+∞ f (x) = +∞ ∈ R se per ogni K > 0
esiste M > 0 tale che f (x) > K per ogni x > M .
Definizione 5.10. Sia f : (a, +∞) → R una funzione definita su un inter-
vallo illimitato a destra. Diremo che limx→+∞ f (x) = −∞ ∈ R se per ogni
K > 0 esiste M > 0 tale che f (x) < −K per ogni x > M .
Ripetiamo che le definizioni scritte qui sopra non sono definizioni indi-
pendenti dalla 5.1. Le abbiamo riportate solo per convenienza, ed invitiamo
lo studente a formularle con il linguaggio della Definizione 5.1.
Concludiamo con la definizione di limiti per eccesso e per difetto.
Definizione 5.11. Sia f : (a, b) → R e sia x0 ∈ (a, b). Diremo che
lim f (x) = L
x→x0 −

se per ogni ε > 0 esiste δ > 0 tale che |f (x) − L| < ε per ogni x ∈ (x0 − δ, x0 ).
Analogamente, diremo che
lim f (x) = L
x→x0 +

se per ogni ε > 0 esiste δ > 0 tale che |f (x)−L| < ε per ogni x ∈ (x0 , x0 +δ).
4
Ricordiamo che (a, +∞) = {x ∈ R | x > a}.
5
Ricordiamo che (−∞, b) = {x ∈ R | x < b}.
5.2. TRADUZIONE DEI TEOREMI SULLE SUCCESSIONI 67

La differenza rispetto alla definizione completa di limite è che alla x è


permesso di avvicinarsi a x0 solo per valori minori oppure maggiori di x0
stesso.
La seguente proposizione afferma che una funzione ha limite se, e soltanto
se, esistono finiti ed uguali i limiti da destra e da sinistra.
Proposizione 5.12. Sia f : (a, b) → R e sia x0 ∈ (a, b). Sono equivalenti
1. limx→x0 f (x) = L
2. limx→x0 − f (x) = limx→x0 + f (x) = L.
Dim. È chiaro che se il limite esiste, a maggior ragione esistono i due limiti
direzionali, e coincidono con il valore del limite. Viceversa, supponiamo che
i due limiti direzionali esistano e coincidano: sia L il valore comune di questi
due limiti. Dalle definizioni, fissato ε > 0, esistono δ − > 0 e δ + > 0 tali che
|f (x) − L| < ε se x0 − δ − < x < x0 e |f (x) − L| < ε se x0 < x < x0 + δ + .
Definiamo δ = min{δ − , δ + }. Allora, qualunque sia x0 ∈ (x0 −δ, x0 +δ)\{x0 },
risulta |f (x) − L| < ε. Poiché ε > 0 è arbitrario, questo dimostra che
limx→x0 f (x) = L.
Osservazione 5.13. La precedente Proposizione è piuttosto intuitiva. Do-
potutto, ci sono solo due modi di avvicinarsi ad un punto: da sinistra o da
destra. E se il comportamento durante l’avvicinamento da sinistra coincide
con il comportamento avvicinandosi da destra, è naturale credere che il limi-
te debba esistere. Il discorso cambia radicalmente in dimensione maggiore o
uguale a due. Già nel piano cartesiano, esistono infiniti modi di avvicinarsi
ad un punto: lungo una retta, lungo una spirale, “saltando” da una parte
all’altra, ecc. Questo fa presagire che lo studio dei limiti per funzioni di due
o più variabili sia alquanto complicato, e che l’avvicinamento lungo direzioni
privilegiate non basterà mai a descrivere interamente i limiti.

5.2 Traduzione dei teoremi sulle successioni


La Definizione 5.1 è come la chiave di un codice segreto: ci permette di
tradurre nel linguaggio delle funzioni le proprietà dei limiti viste per le suc-
cessioni.6 Ne enunciamo alcune, con l’avvertenza che si tratta solo di alcuni
dei casi possibili per le funzioni. Per comodità, diamo gli enunciati per limiti
al finito, ma enunciati corrispondenti valgono per i limiti all’infinito.
6
In questo senso, le successioni sono sufficienti a caratterizzare tutti i limiti delle funzioni
reali di una variabile reale. Non si tratta di una banalità, visto che concettualmente i limiti
di funzione diventano un caso speciale dei limiti di successione. Al fondo c’è una proprietà
topologica di R che non abbiamo la possibilità di discutere in queste pagine.
68 CAPITOLO 5. LIMITI DI FUNZIONI E FUNZIONI CONTINUE

Teorema 5.14 (Unicità del limite). Sia f : (a, b) → R e sia x0 ∈ [a, b]. Se
limx→x0 f (x) = L1 e limx→x0 f (x) = L2 , allora L1 = L2 .
Teorema 5.15 (Limitatezza locale). Sia f : (a, b) → R e sia x0 ∈ [a, b]. Se
esiste finito il limite limx→x0 f (x), allora f è localmente limitata vicino a x0 .
Più esplicitamente, esiste un intorno I di x0 ed esiste un numero C > 0 tali
che |f (x)| < C per ogni x ∈ I.
Teorema 5.16. Sia f : (a, b) → R e sia x0 ∈ [a, b]. Se limx→x0 f (x) = L > 0,
allora esiste un intorno U di x0 in cui f > 0. Se f ≥ 0 in un intorno di x0
e se esiste il limx→x0 f (x) = L, allora L ≥ 0.
Teorema 5.17 (Due carabinieri). Siano f , g ed h tre funzioni definite in
(a, b), e sia x0 ∈ [a, b]. Supponiamo che, per ogni x ∈ (a, b), risulti g(x) ≤
f (x) ≤ h(x). Se limx→x0 g(x) = limx→x0 h(x) = L, allora limx→x0 f (x) = L.
Teorema 5.18. Sia f : (a, b) → R una funzione monotona (crescente oppure
decrescente).
(i) Se f è crescente, allora

lim f (x) = sup f (x), lim f (x) = inf f (x).


x→b− x∈(a,b) x→a+ x∈(a,b)

(ii) Se f è decrescente, allora

lim f (x) = sup f (x), lim f (x) = inf f (x).


x→a+ x∈(a,b) x→b− x∈(a,b)

5.3 Raccolta di limiti notevoli


Proposizione 5.19. Valono le seguenti relazioni di limite.
sin x
lim = 1 (5.1)
x→0 x
1 − cos x 1
lim = (5.2)
x→0 x2 2
tan x
lim = 1 (5.3)
x→0 x
lim (1 + x)1/x = e (5.4)
x→0
ex − 1
lim = 1 (5.5)
x→0 x
log(1 + x)
lim = 1 (5.6)
x→0 x
5.3. RACCOLTA DI LIMITI NOTEVOLI 69

Q T

O
P

sin x
Figura 5.1: Il limite notevole limx→0+ x
=1

Dim. Il primo limite ha una dimostrazione dal sapore geometrico. Innazi-


tutto, la funzione x 7→ sinx x è pari (lo studente lo verifichi secondo la defini-
zione), e pertanto ci basterà dimostrare il limite notevole per x → 0+ . Sia
x > 0 un angolo “piccolo”. Dalla definizione geometrica di sin x, discende
che sin x ≤ x ≤ tan x.7 Nella figura 5.1, Q è il punto di intersezione fra la
circonferenza e il segmento OT , x è la lunghezza dell’arco P Q, tan x quel-
la del segmento T P . Invece sin x è la lunghezza del segmento che scende
perpendicolarmente dal punto Q fino ad incontrare il segmento OP . Poiché
sin x > 0 per 0 < x < π2 , possiamo dividere queste disuguaglianze per sin x e
ottenere
x 1
1≤ ≤ ,
sin x cos x
e il teorema dei due carabinieri garantisce che limx→0+ sinx x = 1.
Il secondo limite notevole si ottiene dal primo:

1 − cos x (1 − cos x)(1 + cos x) 1 − cos2 x sin2 x


= = = .
x2 x2 (1 + cos x) x2 (1 + cos x) x2 (1 + cos x)
7
Si tratta di una dimostrazione in cui molto è lasciato all’intuizione geometrica, e
dunque poco apprezzata dai bourbakisti.
70 CAPITOLO 5. LIMITI DI FUNZIONI E FUNZIONI CONTINUE

Quindi
 2
1 − cos x sin x 1 1
lim = lim lim = .
x→0 x2 x→0 x x→0 x2 (1 + cos x) 2
sin x
Il terzo limite è quasi ovvio, basta scrivere tan x = cos x
ed usare il primo
limite notevole.
Il quarto limite è di solito usato come definizione del numero di Nepero
e. Spesso lo si trova scritto nella forma equivalente
 x
1
lim 1 + = e.
x→±∞ x

Gli ultimi due limiti, fra loro equivalenti (suggerimento: cambiare la variabile
1 + x = et ), possono essere dimostrati solo utilizzando la definizione della
funzione esponenziale. Non avendo tempo di discutere la costruzione delle
potenze reali con base reale, ci accontentiamo di sapere il valore dei limiti.

5.4 Continuità
È inutile sottolineare che non sempre una funzione ha limite. La funzione
f : [0, 1] → R definita da
(
0, x ∈ Q
f (x) =
1, x ∈ R \ Q

non ha limite per x → 1. Infatti, ogni intorno di 1 contiene infiniti valori di


x in cui f (x) = 0, e infiniti valori di x in cui f (x) = 1. 8
D’altronde, anche se il limite esiste, può non aver niente a che vedere
con il valore della funzione in quel punto. Abbiamo proprio sottolineato che
l’operazione di limite ignora per definizione il valore della funzione nel punto
verso cui ci stiamo avvicinando.

Definizione 5.20. Sia f : [a, b] → R una funzione reale di una variabile


reale, e sia x0 ∈ [a, b]. Diciamo che f è continua nel punto x0 se per ogni
ε > 0 esiste δ > 0 tale che |f (x)−f (x0 )| < ε per ogni x ∈ (x0 −δ, x0 +δ)∩[a, b].
Diremo che f è continua in [a, b] se è continua in ogni punto x0 ∈ [a, b].
8
Sempre per lo studente più curioso, risulta lim inf x→1− f (x) = 0 < 1 =
lim supx→1− f (x) e quindi il limite non esiste.
5.4. CONTINUITÀ 71

Confrontando questa definizione con quella di limite, abbiamo una carat-


terizzazione della continuità in termini di limiti.9
Teorema 5.21. Sia f : [a, b] → R una funzione reale di una variabile reale,
e sia x0 ∈ [a, b]. La funzione f è continua in x0 se e solo se limx→x0 f (x) =
f (x0 ).
Corollario 5.22. Una funzione f è continua in un punto x0 appartenente
al suo dominio se e solo se
lim f (x) = lim f (x) = f (x0 ).
x→x0 − x→x0 +

Dalle regole per il calcolo algebrico dei limiti, segue immediatamente che
tutte
PN le funzioni polinomiali, cioè le funzione rappresentate da un polinomio
i
i=1 ai x di qualsiasi grado N ≥ 1 sono continue in ogni punto di R. Infatti,
la somma e il prodotto di funzioni continue sono continue. Sono inoltre
continue praticamente tutte le funzioni elementari che lo studente conosce:
seno, coseno, esponenziali, logaritmi.
Osservazione. Capita spesso di sentir dire, anche da persone autorevoli,
che la funzione x 7→ 1/x è discontinua nel punto x = 0. Ora, tale funzione
non è definita in x = 0, ed è pertanto imbarazzante applicare la definizione
di continuità in questo caso. Di solito, non si fanno affermazioni relative ad
oggetti inesistenti. Per esempio, è vero o falso che i mandarini alati hanno
quattro ruote motrici?
È chiaro che questa discussione ha una natura filosofica: è lecito attribuire
proprietà a ciò che non esiste? Io credo che non si possa parlare razionalmente
del nulla, ma capisco anche l’altra posizione: il nulla non possiede alcuna
proprietà, proprio perché è nulla. Quindi, una funzione non definita in un
punto non possiede la continuità, e dunque è discontinua.10
9
Mentre la Definizione 5.20 ha validità generale, il teorema di caratterizzazione non
può coprire una caso particolare: quello di una funzione come f : (0, 1) ∪ {2} → R. Ci
chiediamo che cosa significhi dire che f è continua in x0 = 2. La Definizione 5.20 ci dice
che nei fatti f è sempre continua in tale punto, qualunque “sia il valore di f (2). Mentre
il teorema di caratterizzazione è privo di senso: non si può far avvicinare x a 2 restando
nel dominio di f . In altri termini, non ha senso scrivere limx→2 f (x). Sembra che la
definizione” di continuità proposta in [13, Definizione 7.1] risenta di questa scorrettezza.
In ogni caso, per un corso come il nostro, il dominio delle funzioni non contiene punti
isolati, ed il teorema di caratterizzazione contiene una condizione necessaria e sufficiente
per la continuità.
10
Molti dei più celebri scienziati erano anche filosofi, e queste diatribe hanno a volte
rallentato il progresso scientifico. Nelle scienze umane, la sovrapposizione fra progresso
scientifico e insegnamento religioso ha generato molte pagine buie della storia del pensiero
moderno. In questo senso, una disciplina astratta come la matematica ha sempre goduto
di maggiore libertà.
72 CAPITOLO 5. LIMITI DI FUNZIONI E FUNZIONI CONTINUE

Torniamo al nostro programma. Abbiamo osservato che effettuando le


quattro operazioni algebriche su funzioni continue, otteniamo ancora funzioni
continue. Ma che accade se componiamo due funzioni continue? La risposta
è che la composizione è ancora una funzione continua. A questo risultato
premettiamo una Proposizione sul calcolo dei limiti.
Proposizione 5.23 (Cambiamento di variabile nei limiti). Siano date due
funzioni f : (a, b) → R e g : (c, d) → R, e siano x0 ∈ (a, b), y0 ∈ (c, d). Se
(i) g(y) → L per y → y0 , y ∈ (c, d);

(ii) f (x) → y0 per x → x0 , x ∈ (a, b);

(iii) o g(y0 ) = L o f (x) 6= y0 per ogni x 6= x0


allora limx→x0 g(f (x)) = L.
Dim. Dimostriamo la Proposizione nel caso in cui valga la seconda alterna-
tiva in (iii). Fissiamo ε > 0. Per (i) esiste σ > 0 tale che se y ∈ (c, d),
y 6= y0 , |y − y0 | < σ, allora |g(y) − L| < ε. D’altra parte se si ha f (x) ∈ (c, d),
per la (iii) f (x) 6= y0 e per la (ii) esiste δ > 0 tale che se 0 < |x − x0 | < δ
allora |f (x) − y0 | < σ. Dunque in definitiva se x ∈ (a, b) ∩ f −1 (c, d), x 6= x0 ,
|x − x0 | < δ, allora |g(f (x)) − L| < ε. Per l’arbitrarietà di ge > 0, la tesi è
dimostrata. Lasciamo al lettore la dimostrazione, pi ù facile, nel caso in cui
g(y0 ) = L. Notiamo che questo significa che g è continua in y0 .
Un commento sulla Proposizione. Perché abbiamo dovuto introdurre l’al-
ternativa in (iii)? La ragione sta tutta nella condizione “0 < |x − x0 | < δ”
della definizione di limite. In altre parole, non ci interessiamo al valore della
funzione nel punto. Quando facciamo la composizione g ◦ f e facciamo tende-
re x a x0 , per poter usare l’ipotesi (i) dobbiamo accertarci che y = f (x) 6= y0 .
In caso contrario, potrebbe accadere un fenomeno bizzarro. Consideriamo la
funzione costante f : x 7→ y0 , e la funzione
(
0, y 6= y0
g(y) =
1, y = y0 .

Quindi, la funzione composta g ◦ f è la funzione costante che vale ovunque


1. Si ha f (x) → y0 per x → x0 , g(y) → 0 per y → y0 , ma nessuna delle
alternative in (iii) è soddisfatta. E infatti limx→x0 g(f (x)) = 1 6= 0.
Teorema 5.24. Siano f : (a, b) → R e g : (c, d) → R due funzioni, e siano
x0 ∈ (a, b), y0 ∈ (c, d). Se f è continua in x0 e se g è continua in y0 = f (x0 ),
allora g ◦ f è continua in g(y0 ).
5.5. INFINITESIMI ED INFINITI EQUIVALENTI 73

Dim. Basta applicare la Proposizione precedente.

Il problema della continuità della funzione inversa si pone in termini ana-


loghi: data una funzione continua ed invertibile, è vero che la funzione inversa
è continua? Nei limiti del nostro corso, la risposta è affermativa.11
Iniziamo da un’osservazione molto intuitiva. Omettiamo la dimostrazio-
ne rigorosa, ma invitiamo caldamente lo studente a convincersi con qualche
disegno della verità di quanto affermato.

Lemma 5.25. Sia f : (a, b) → R una funzione invertibile e continua in tutti


i punti di (a, b). Allora f è strettamente monotona.

L’idea che si nasconde dietro questo Lemma è la seguente: se f non fos-


se strettamente monotona, dovrebbe “andare un po’ su e un po’ giù”. Ad
esempio, dovrebbe crescere e poi decrescere. Siccome f è continua, neces-
sariamente esisterebbe una retta orizzontale che interseca il grafico di f in
almeno due punti distinti. Ciò è in contraddizione con l’invertibilità di f . Ne
segue che f o “va sempre su” o “va sempre giù”, cioè è strettamente mono-
tona. Questo discorso non sostituisce una vera dimostrazione, ma possiamo
dire che non servirebbe aggiungere molto per ottenerne una. Lo studente
interessato troverà i dettagli in [11].

Teorema 5.26. Sia f : (a, b) → R una funzione strettamente monotona e


continua in tutti i punti di (a, b). Allora l’inversa f −1 , definita sull’intervallo
(c, d), c = inf{f (x) | x ∈ (a, b)}, d = sup{f (x) | x ∈ (a, b)}, è continua in
tutti i punti di (c, d).

Per brevità, nell’enunciato siamo stati un po’ imprecisi. Se f è stret-


tamente decrescente, l’intervallo (c, d) ha un aspetto insolito, ad esempio
(5, 3). In questo caso, lo studente deve pensare di scambiare i due estremi
dell’intervallo, cioè deve prendere (d, c).

5.5 Infinitesimi ed infiniti equivalenti


Anche per le funzioni è possibile parlare di infinitesimi ed infiniti equivalenti.
Dovrebbe essere chiaro, a questo punto, che le definizioni richiedono qualche
sottigliezza.
11
Mentre il teorema di continuità delle funzioni composte è un teorema valido in generale,
quello di continuità della funzione inversa non lo è. Se studiassimo funzioni definite su
insiemi più “grandi” di R occorrerebbero ipotesi supplementari.
74 CAPITOLO 5. LIMITI DI FUNZIONI E FUNZIONI CONTINUE

Definizione 5.27. Siano f e g due funzioni, definite almeno in un intorno


bucato (x0 − δ, x0 + δ) \ {x0 } di un punto x0 . Supponiamo che limx→x0 f (x) =
limx→x0 g(x) = 0 (rispettivamente ∞). Diciamo che f e g sono infinitesimi
(rispettivamente infiniti) equivalenti per x → x0 se

f (x)
lim = 1,
x→x0 g(x)

e scriviamo
f g per x → x0 .

Osservazione 5.28. È indispensabile specificare che l’equivalenza sussiste


per x → x0 . Ad esempio f (x) = x(x−1)4 e g(x) = x(x−1)2 sono infinitesimi
equivalenti per x → 0 ma non per x → 1.

Osservazione 5.29. A costo di sembrare ottusi, ribadiamo con forza che il


quoziente f (x)/g(x) deve tendere a 1: nessun altro numero permetterebbe
la sostituzione degli infinitesimi ed infiniti equivalenti nel calcolo dei limiti
(vedi sotto).

Osservazione 5.30. Siamo stati pedanti nella definizione precedente, alme-


no nel caso degli infinitesimi. In effetti, avremmo potuto supporre addirittura
che f e g fossero continue in x0 . Infatti, le funzioni
(
f (x) se x 6= x0
f˜(x) =
0 se x = x0

e (
g(x) se x 6= x0
g̃(x) =
0 se x = x0

sono continue in x0 , e si verifica facilmente che f  g se e solo se f˜  g̃ per


x → x0 . Nel caso degli inifiniti, è ovviamente insensato pretendere che f e g
siano continue se entrambe divergono all’infinito.

Osservazione 5.31. È chiaro che definizioni simili si possono dare per x →


±∞. Ovviamente, la due funzioni dovranno essere definite (almeno) in un
intervallo del tipo (a, +∞) oppure (−∞, b). Ad esempio, f (x) = sin(1/x) e
g(x) = 1/x sono infinitesimi equivalenti per x → +∞.

Vale infine un criterio di sostituzione degli infinitesimi (e degli infiniti)


equivalenti, che lo studente potrà ricostruire per esercizio a partire dall’ana-
logo visto per le successioni (Proposizione 3.25).
5.6. TEOREMI FONDAMENTALI PER LE FUNZIONI CONTINUE 75

Per convincere lo studente che il principio di sostituzione degli infinitesimi


(ed infiniti) equivalenti non vale in ambito additivo, consideriamo il classico
limite
sin x − x
lim .
x→0 x3
Impareremo presto che tale limite vale −1/6. Ma questo conta poco: voglia-
mo invece mostrare che sbaglieremmo, se pensassimo di calcolarlo sostituendo
sin x con x. Infatti, arriveremmo alla situazione assurda
sin x − x x−x 0
lim 3
= lim 3
= lim 3 .
x→0 x x→0 x x→0 x

Ma perché stiamo sbagliando? Apparentemente, dovremmo concludere che


il limite esiste e vale zero. Invece questo ragionamento non sta in piedi, e ce
ne rendiamo conto se proviamo a capire i passaggi nascosti:

x sinx x − x x sinx x − 1 sin x



sin x − x x
−1
lim 3
= lim 3
= lim 3
= lim 2
,
x→0 x x→0 x x→0 x x→0 x
e questo limite è ancora una forma di indecisione [0/0]. Insomma, possiamo
dire un po’ paradossalmente, che il principio di sostituzione resta “quasi”
vero, ma non serve a concludere!

5.6 Teoremi fondamentali per le funzioni con-


tinue
A parte le traduzioni dei teoremi sui limiti, le funzioni continue godono di
proprietà peculiari, alcune abbastanza intuitive. Se lo studente torna con la
memoria alle parole certamente pronunciate dal suo professore di matema-
tica alle scuole superiori, “le funzioni continue sono quelle che si disegnano
senza staccare la penna dal foglio”, gli sembrerà quasi ovvio che una fun-
zione continua che parte negativa e arriva positiva debba necessariamente
annullarsi.

Teorema 5.32 (Teorema degli zeri). Sia f : [a, b] → R una funzione conti-
nua. Se f (a)f (b) < 0, allora esiste (almeno) un punto x0 ∈ (a, b) tale che
f (x0 ) = 0.

Dim. Supponiamo per comodità che f (a) < 0 e f (b) > 0. Il caso f (a) > 0 e
f (b) < 0 è identico. Definiamo l’insieme

E = {x ∈ [a, b] | f (x) < 0}.


76 CAPITOLO 5. LIMITI DI FUNZIONI E FUNZIONI CONTINUE

Ovviamente E contiene il punto a, ed è limitato dall’alto poiché b ∈ / E.


Perciò esiste in R il numero x0 = sup E. Affermiamo che f (x0 ) = 0. Infatti
se f (x0 ) < 0, evidentemente x0 < b. Inoltre per il teorema di permanenza del
segno in un intervallo a destra di x0 f sarebbe negativa. Ci sarebbero dunque
punti di E maggiori di x0 , e questo non è possibile perché x0 è l’estremo
superiore di E.
Se f (x0 ) > 0, allora x0 > a e di nuovo per la permanenza del segno ci
sarebbe un intervallo sinistro (x0 − δ, x0 ) di x0 in cui f sarebbe strettamente
positiva. I punti di E sarebbero allora tutti minori di x0 − δ, e dunque
x0 ≤ x0 − δ, assurdo. Non resta che f (x0 ) = 0, e il teorema è dimostrato.

Di questo, e di altri teoremi che vedremo, esiste una dimostrazione che fa


uso delle successioni.12 È istruttivo presentarne le idee. Si prende a1 = a e
b1 = b. Poi si calcola f nel punto mediano, cioè
 
a1 + b 1
f .
2

Se questo numero è negativo, si definisce a2 = a1 +b 2


1
, altrimenti si definisce
b2 = 2 . Supponiamo, per fissare le idee, che a2 = a1 +b
a1 +b1
2
1
. Si divide in
a2 +b1
due l’intervallo [a2 , b1 ] e si calcola f ( 2 ) Se troviamo un valore negativo,
definiamo a3 = a2 +b 2
1
, altrimenti definiamo b2 = a2 +b 2
1
. Facendo sempre
lo stesso tipo di ragionamento, si costruiscono due successioni {an } e {bn },
con la proprietà che f (an ) < 0 e f (bn ) > 0. Inoltre la prima successione
è monotona crescente, mentre la seconda è monotona decrescente. Infine,
poich é ogni volta abbiamo dimezzato l’intervallo precedente, risulta

b−a
0 ≤ bn − an ≤ . (5.7)
2n
Le successioni monotone limitate13 hanno limite, siano

a∞ = lim an , b∞ = lim bn .
n→+∞ n→+∞

La relazione (5.7) dice che a∞ = b∞ e il teorema della permanenza de segno


dice che f (a∞ ) ≤ 0, mentre f (b∞ ) ≥ 0. Poiché questi numeri coincidono,
dev’essere f (a∞ ) = 0. Abbiamo pertanto individuato un punto di [a, b] dove
f si annulla.
12
Del teorema precedente esiste anche una dimostrazione molto elegante basata su
argomenti topologici. Si veda [24].
13
Ovviamente {an } e {bn } sono limitate, perché composte di punti dell’intervallo [a, b].
5.6. TEOREMI FONDAMENTALI PER LE FUNZIONI CONTINUE 77

Il metodo con cui abbiamo costruito a∞ = b∞ si chiama metodo di bise-


zione, ed è uno dei primi metodi per il calcolo approssimato delle soluzioni
di equazioni del tipo
f (x) = 0

con f funzione continua. Pur essendo indubbiamente efficace ed elegante,


sono stati sviluppati metodi più veloci basati sul calcolo differenziale.14
Proponiamo un’interessante conseguenza del teorema degli zeri.

Teorema 5.33 (Valori intermedi). Una funzione continua definita su un


intervallo [a, b] assume tutti i valori compresi fra f (a) e f (b).

Dim. Senza ledere la generalità del discorso, supponiamo f (a) ≤ f (b). Sce-
gliamo y0 ∈ [f (a), f (b)] e dimostriamo che esiste x0 ∈ [a, b] tale che f (x0 ) =
y0 .
Se y0 = f (a), basta prendere x0 = a. Analogamente se y0 = f (b).
Se f (a) < y0 < f (b), definiamo la funzione ausiliaria g(x) = f (x) − y0 .
Ovviamente g : [a, b] → R è continua, e g(a) = f (a) − y0 < 0, g(b) = f (b) −
y0 > 0. Per il teorema degli zeri, esiste x0 ∈ [a, b] tale che g(x0 ) = 0. Ma
questo vuole dire che f (x0 ) = y0 . Il teorema è dimostrato.

Osservazione 5.34. Come si legge in [13], per molti decenni i matematici


hanno ritenuto che la continuità fosse del tutto equivalente alla proprietà
dei valori intermedi. Più precisamente, essi pensavano che se una funzione
soddisfa la proprietà dei valori intermedi in un certo intervallo [a, b], allora
deve essere continua in [a, b]. Oggi sappiamo bene che questo è falso, come
dimostra la funzione
(
sin x1 , se x 6= 0
f (x) =
0, se x = 0.

È facile vedere che, preso arbitrariamente y ∈ [−1, 1], esiste almeno un nu-
mero x ∈ R tale che sin x1 = y. 15 Tuttavia f presenta una discontinuità in
x = 0.
14
Non insistiamo sul fatto che questi metodi funzionano solo per le funzioni del calcolo
differenziale, mentre quelle continue sono indiscutibilmente più numerose. D’altra parte,
molti problemi delle scienze applicate assumono tacitamente che tutte le quantità in gioco
siano funzioni estremamente “addomesticate”.
15
Ad esempio x = 1/ arcsin y per y 6= 0. Il caso y = 0 è altrettanto facile.
78 CAPITOLO 5. LIMITI DI FUNZIONI E FUNZIONI CONTINUE

5.7 Massimi e minimi


In tutte le scienze, pure ed applicate, si pone un problema che possiamo for-
mulare in questi termini: massimizzare (o minimizzare) una certa quantità,
a sua volta dipendente da altre quantità.
Massimizzare il risparmio, minimizzare l’attrito, scegliere il percorso mi
gliore per raggiungere un indirizzo: sono tutti esempi di ottimizzazione. Poi-
ché il nostro corso ha carattere elementare, ci limiteremo ad alcune conside-
razioni relative alle funzioni reali di una variabile reale. Avvertiamo però lo
studente che si tratta solo del primo approccio ad una teoria molto ricca e
difficile, che è oggetto di ricerca attiva.
Definizione 5.35. Sia f : A ⊂ R → R una funzione definita su un insieme
A. Diremo che x0 ∈ A è un punto di minimo assoluto per f se
f (x0 ) = inf f (x).
x∈A

Analogamente diremo che x0 ∈ A è un punto di massimo assoluto per f se


f (x0 ) = sup f (x).
x∈A

In parole povere, x0 è un punto di minimo assoluto se f (x0 ) ≤ f (x) per


ogni x ∈ A. Invece x0 è un punto di massimo assoluto se f (x0 ) ≥ f (x) per
ogni x ∈ A.
Ad esempio, se f (x) = x2 per ogni x ∈ R, è ovvio che 0 è un punto di
minimo assoluto. Infatti, f (0) = 0 ≤ x2 = f (x) per ogni x ∈ R.

Avvertenza. Capita molto spesso di commettere delle piccole inesattezze


formali, parlando di massimi e minimi. Il più frequente è quello di dire “un
minimo x0 ” invece di “un punto di minimo x0 ”. A rigor di logica, il minimo è
il valore f (x0 ) della funzione nel punto di minimo. D’altra parte, una volta
individuati i punti di massimo e minimo, è immediato calcolare il valore della
funzione in tali punti. Questo spiega la tendenza a privilegiare la variabile
indipendente rispetto a quella dipendente. Di solito, il contesto chiarisce da
sé se si stia parlando di punti di minimo oppure di valori di minimo.

Consideriamo ora la funzione x 7→ (1 − x2 )2 definita per ogni x reale.


Essa è sempre maggiore o uguale a zero, e vale zero se e solo se x ∈ {−1, 1}.
Quindi x = −1 e x = 1 sono gli unici due punti di minimo assoluti. Poiché
limx→±∞ (1 − x2 )2 = +∞, la funzione non è limitata dall’alto, e non esistono
punti di massimo assoluti. Però è intuitivo che la nostra funzione, nell’inter-
vallo [−1, 1], deve avere dei valori maggiori di zero, e per simmetria rispetto
all’asse delle ordinate in x = 0 c’è una “specie di massimo”.
5.7. MASSIMI E MINIMI 79

Definizione 5.36. Sia f : A ⊂ R → R una funzione definita su un insieme


A. Diremo che x0 ∈ A è un punto di minimo relativo per f se esiste un
intorno U di x0 tale che

f (x0 ) ≤ f (x) per ogni x ∈ U ∩ A.

Diremo che x0 ∈ A è un punto di massimo relativo per f se esiste un intorno


U di x0 tale che

f (x0 ) ≥ f (x) per ogni x ∈ U ∩ A.

Quando si parla di punti di minimo o massimo relativi, si guarda in real-


tà la funzione solo “vicino” a tali punti, disinteressandosi completamente di
quanto accade “lontano” da essi. Inutile sottolineare che un punto di minimo
(o massimo) assoluto è anche un punto di minimo (o massimo) relativo. Non
è però vero il viceversa. Torneremo su queste considerazioni nel capitolo della
derivata.

Ma la ricerca dei punti di massimo e di minimo è basata solo su conside-


razioni speciali, peculiari di volta in volta per la funzione in esame? Se così
fosse, non esisterebbe nemmeno una teoria, ma solamente una raccolta di
“trucchi”. Il teorema più famoso16 che fornisce una garanzia per l’esistenza di
punti di massimo e minimo (assoluti) è dovuto al grande matematico tedesco
C. Weierstrass.17

Teorema 5.37 (Weierstrass). Sia f : [a, b] → R una funzione continua, de-


finita su un intervallo chiuso e limitato. Allora f possiede almeno un punto
di minimo assoluto ed un punto di massimo assoluto.

Dim. Presentiamo una tipica dimostrazione che usa le successioni ottimiz-


zanti. Diamo i dettagli per l’esistenza del massimo assoluto, lasciando le
ovvie modifiche allo studente per il caso del minimo. Sia M = supx∈[a,b] f (x).
Se M = +∞, pe rle proprietà dell’estremo superiore, per ogni n ∈ N esiste
xn ∈ [a, b] tale che f (xn ) > n, Dunque f (xn ) → +∞ per n → +∞. Se
M ∈ R, per ogni n ∈ N esiste xn ∈ [a, b] tale che
1
M− < f (xn ) ≤ M
n
e perciò f (xn ) → M per n → +∞. In ogni caso, esiste una successione {xn }
di punti di [a, b] tale che limn→+∞ f (xn ) = M .
16
Talmente famoso da essere citato perfino in una pubblicità televisiva negli anni passati.
17
Una pronuncia accettabile è vaierstrass.
80 CAPITOLO 5. LIMITI DI FUNZIONI E FUNZIONI CONTINUE

Per il Teorema 3.28, la successione {xn } possiede una sottosuccessione


{xnk } convergente ad un punto x1 ∈ [a, b]. Siccome f è continua, f (xn ) →
f (x0 ) per n → +∞. Ma allora

M = lim f (xn ) = lim f (xnk ) = f (x1 ).


n→+∞ k→+∞

Abbiamo così dimostrato che f (x1 ) = M = supx∈[a,b] f (x). Ciò implica che
M ∈ R e che x1 è un punto di massimo assoluto per f .
Di questo importantissimo teorema vogliamo presentare una seconda di-
mostrazione, basata sul metodo della bisezione. Seguiamo abbastanza fedel-
mente [13].
Dimostrazione alternativa. Dimostriamo ad esempio che f ha massimo as-
soluto. Detto S = supx∈[a,b] f (x), dividiamo l’intervallo I = [a, b] in due
intervalli uguali, e siano S1 e S2 gli estremi superiori di f in questi due
sottointervalli. Poiché I è l’unione di questi sottointervalli, necessariamen-
te S = max{S1 , S2 }. Abbiamo così individuato un intervallo I1 = [a1 , b1 ]
tale che supx∈[a1 ,b1 ] f (x) = S e b1 − a1 = (b − a)/2. Proseguendo allo
stesso modo, troveremmo degli int ervalli In = [an , bn ] tali che In ⊂ In−1 ,
bn − an = (b − a)/2n , e supx∈[an ,bn ] f (x) = S per ogni n ≥ 1. La successione
{an } è monotona crescente, e la successione {bn } è monotona decrescente.
Siccome entrambe sono limitate, necessariamente sono dotate di limite fini-
to. Inoltre, limn→+∞ bn = limn→+∞ an + (b − a) limn→+∞ 2−n = limn→+∞ an .
Detto x0 ∈ [a, b] il valore comune dei due limiti, vogliamo dimos trare che
f (x0 ) = S. Si ha ovviamente f (x0 ) ≤ S. Se fosse f (x0 ) < S, posto
2p = S − f (x0 ), si avrebbe f (x0 ) = S − 2p < S − p e dunque, per il
teorema della permanenza del segno, esisterebbe un intorno J di x0 tale che
f (x) < S −p per ogni x ∈ J. D’altra parte le successioni {an } e {bn } tendono
a x0 , e quindi per n abbastanza grande sia an che bn cadranno in J, e dunque
In = [an , bn ] ⊂ J. Ma allora si dovrebbe avere f (x) < S − p per ogni x ∈ In ,
il che è in contraddizione con il fatto che supx∈[an ,bn ] f (x) = S. Concludiamo
che f (x0 ) = S, e per definizione ciò significa che x0 è un punto di massimo
assoluto per la funzione f .

Osservazione 5.38. Per gli studenti più curiosi, segnaliamo che la seconda
dimostrazione è basata sulla forma del dominio di f , un intervallo chiuso e
limitato. Il teorema di Weierstrass continua a valere per qualunque funzione
continua definita su un insieme chiuso e limitato (ma non necessariamente
un intervallo). La dimostrazione alternativa non può essere estesa a questo
caso più generale, mentre la prima dimostrazione resta essenzialmente valida.
Per capirci, una funzione continua definita sull’insieme (chiuso e limitato)
5.7. MASSIMI E MINIMI 81

A = {0} ∪ {1/n | n ∈ N, n ≥ 1} possiede almeno un punto di massimo ed


un punto di minimo assoluti in A, ma non è chiaro come generalizzare l’idea
della bisezione all’insieme “stravagante” A. Osserviamo che A è costituito
dai punti della successione {1/n}n≥1 e dal limite 0 di tale successione.

Più esplicitamente, questo teorema ci dice che, sotto le ipotesi fatte, esiste
un punto x0 ∈ [a, b] di minimo assoluto per f , ed esiste un punto x1 ∈ [a, b]
di massimo assoluto per f . Lo studente deve ricordare che il contenuto
del Teorema di Weierstrass è tutto qui. Non si afferma nulla sul numero
di punti di massimo o minimo, né sulla loro localizzazione nell’intervallo
[a, b]. Potrebbero coincidere con gli estremi, potrebbero essere dieci, cento
oppure mille. E, purtroppo, non dice come individuarli. In una giornata
di pioggia, saremmo tentati di sostenere che allora è un teorema inutile. In
tal caso, faremmo bene ad attendere una giornata di sole per schiarirci le
idee. Il teorema appena enunciato ci dice che, sotto le ipotesi scritte, i punti
di massimo e minimo assoluti esistono! Sarebbe una tortura dover cercare
qualcosa che forse non esiste. Ci sarebbero studenti ormai decrepiti, ancora
impegnati a controllare se una funzione ha massimi e minimi.18
Che le ipotesi del teorema di Weierstrass servano proprio tutte, si capisce
dai prossimi esempi. Se il dominio della funzione non è un intervallo chiuso
e limitato19 possono sorge problemi. Prendiamo la funzione f : x ∈ (0, 1] 7→
1/x ∈ R. È continua sul suo dominio, ma non possiede massimo assoluto.
Infatti supx∈(0,1] f (x) = +∞. Il dominio è un intervallo primo di uno degli
estremi. Ma il teorema fallisce anche quando il dominio è un intervallo non
limitato: f : x ∈ R 7→ ex ∈ R è una funzione continua, priva di massimo
e di minimo assoluti. Infine, è evidente che la continuità sia fondamentale.
Definiamo f : [−1, 1] 7→ R come
(
|x|, x 6= 0
f (x) =
1, x = 0.

Questa funzione ha due punti di massimo assoluti negli estremi −1 e 1. Ma


non ha minimo assoluto. Infatti inf x∈[−1,1] f (x) = 0 ma non esiste nessun
x0 ∈ [−1, 1] tale che f (x0 ) = 0. È chiaro che f non è continua in x = 0.

18
È un dato di fatto che questi studenti ci sono. Forse perché il perfido professore ha
chiesto di studiare una funzione che non verifica le ipotesi del teorema di Weierstrass. La
matematica è interessante soprattutto quando obbliga a usare strumenti non ordinari.
19
In realtà la formulazione generale del teorema di Weierstrass non si limita agli
intervalli, ma non abbiamo le conoscenze per scendere nei particolari.
82 CAPITOLO 5. LIMITI DI FUNZIONI E FUNZIONI CONTINUE

5.8 Punti di discontinuità


Definizione 5.39. Una funzione è discontinua in un punto appartenente al
suo dominio di definizione, se non è continua in quel punto.

Osservazione 5.40. La definizione precedente è opinabile. Ad esempio,


tanti studenti sono fermamente convinti che la funzione x 7→ 1/(x − 2) sia di-
scontinua nel punto x = 2. In base alla nostra definizione, la stessa funzione
è continua in tutto il suo dominio di definizione. Chi ha ragione? In mate-
matica la ragione sta sempre dalla parte di chi rispetta assiomi e definizioni.
Quindi il problema si scarica sulla “giusta” definizione di punto di disconti-
nuità. Quelli che pensano sia più corretto privilegiare l’idea di disegnare un
grafico senza staccare la penna dal foglio, diranno sicuramente che c’è una
discontinuità in x = 2. Quelli che pensano le funzioni come oggetti dota-
te inevitabilmente di un dominio di definizione, probabilmente penseranno
che non ha senso parlare del comportamento di una funzione laddove non è
nemmeno definita.
Poiché la libertà di pensiero è sacra, ma per andare avanti dobbiamo sce-
gliere da che parte stare, d’ora in poi converremo che i punti di discontinuità
debbano appartenere al dominio di definizione. Pertanto, la nostra funzione
x 7→ 1/(x − 2) sarà considerata continua in tutti i punti del suo campo di
esistenza.

Ma i punti di discontinuità sono tutti uguali? Riprendiamo l’enunciato


del Corollario 5.22. In un punto di discontinuità può capitare solo un numero
molto limitato di fenomeni. Ripetiamo, a costo di perdere la voce, che x0
deve appartenere al dominio di definizione di f .
Un primo caso è quello dell’ultimo esempio della sezione precedente. La
nostra funzione “vorrebbe” essere continua, però noi le imponiamo di non
esserlo. Formalmente, ciò accade quando limx→x0 f (x) esiste finito, ma è
diverso da f (x0 ). Si usa parlare di discontinuità eliminabile in x0 . Per quanto
detto sopra, il punto x0 dovrebbe necessariamente appartenere al dominio di
definizione della funzione f . Tuttavia, proprio per il fatto che ci accingiamo a
definire opportunamente il valore f (x0 ), non è il caso di essere troppo rigidi.
In pratica, se abbiamo una funzione fatta in modo che limx→x0 f (x) esiste
finito, parliamo comunque di discontinuità eliminabile in x0 , senza neanche
controllare see x0 appartenga oppure non appartenga al dominio di f . Basta
infatti definire una nuova funzione
(
f (x), x 6= x0
f˜(x) =
limx→x0 f (x), x = x0 .
5.8. PUNTI DI DISCONTINUITÀ 83

Questa funzione coincide con f dappertutto, tranne in x0 . Inoltre f˜ è


continua in x0 , poiché f˜(x0 ) = limx→x0 f˜(x) = limx→x0 f (x).20
Un secondo caso è quello di una funzione in cui

lim f (x) 6= lim f (x),


x→x0 − x→x0 +

pur essendo entrambi numeri reali. Il valore di f (x0 ) poco importa, non ci
sono speranze che f sia continua in x0 . Intuitivamente, f “salta” dal valore
limx→x0 − f (x) al valore limx→x0 + f (x). Si parla di discontinuità a salto in x0 .
Infine, restano... tutti gli altri casi immaginabili. Ad esempio se almeno
uno dei due limiti destro e sinistro è infinito, oppure se il limite limx→x0 f (x)
non esiste, oppure se uno solo dei limiti destro e sinistro non esiste. Parleremo
di discontinuità di terza specie, senza addentrarci in ulteriori classificazioni.

20
Uno studente spiritoso potrebbe sollevare la seguente obiezione: se è permesso cam-
biare la funzione, qualunque funzione diventa continua. È un po’ provocatorio, ma ha
un fondo di verità: se iniziamo giocando a pallacanestro, non possiamo finire giocando a
briscola.
84 CAPITOLO 5. LIMITI DI FUNZIONI E FUNZIONI CONTINUE
Capitolo 6

Il calcolo differenziale

Siamo arrivati al cuore del nostro corso: introdurremo finalmente lo strumen-


to principale per analizzare il comportamento di una funzione. Molti studenti
universitari conoscono già la derivata e le sue applicazioni. Li invitiamo a
non commettere uno degli errori più spiacevoli, quello di vivere di rendita
sui ricordi liceali. Vedremo presto che a noi interessa esporre con rigore la
teoria delle funzioni derivabili, mentre nelle scuole superiori c’è la compren-
sibile tendenza a nascondere sotto il tappeto le difficoltà e le patologie. Non
tutte le funzioni sono derivabili, anzi la famiglia delle funzioni derivabili è
una sparuta minoranza nell’universo delle funzioni continue.1

6.1 Variazioni infinitesime


Spiegare che cosa sia la derivata senza essere bourbakisti 2 non è un compito
facile.
1
Questa frase non è una sciocchezza. Esistono strumenti matematici che “misurano” la
percentuale di funzioni derivabili fra le funzioni continue. E il risultato, sorprendente sono
per chi si avvicina all’ Analisi Matematica per la prima volta, è che le funzioni derivabili
sono davvero poche.
2
Dal nome di Nicholas Bourbaki. È il nome collettivo di un gruppo di matematici
francesi che, nel XX secolo, decisero di rifondare la matematica moderna da un punto
di vista completamente deduttivo. Nei loro libri non si trovano spiegazioni discorsive, ma
solo definizioni seguite da teoremi e corollari. È un approccio affascinante alla matematica,
ma considerato da molti pedagogicamente disastroso. Chi scrive ha sempre considerato i
libri pieni di grafici, figure e divagazioni varie piuttosto fuorvianti. Danno la sensazione
che tutto sia facile, mentre la realtà b̀en più dura. Se a molti basta avere una percezione
del proprio giardino, a molti altri farebbe comodo dare uno sguardo all’intera città. Le
parabole sono funzioni continue, ma ci sembra più conveniente definire in astratto la
continuità e poi applicarne i risultati alle parabole.

85
86 CAPITOLO 6. IL CALCOLO DIFFERENZIALE

C’è chi ama parlare di rette tangenti, chi di velocità ed accelerazione. Per
tutte queste motivazioni storico–filosofiche, rimandiamo lo studente ad uno
dei testi citati in bibliografia. In ogni caso, l’idea innovativa in comune è
quella di variazione infinitesima di una funzione.
Ricordiamo che, data una funzione f : (a, b) → R, la variazione di f nel
punto x0 ∈ (a, b) di incremento h è il rapporto
∆f f (x0 + h) − f (x0 )
(x0 , h) = .
∆x h
Questo rapporto è ben definito quando |h| è sufficientemente piccolo, in modo
che x0 + h ∈ (a, b). Ha allora senso domandarsi che cosa rappresenti il limite
∆f f (x0 + h) − f (x0 )
lim (x0 , h) = lim .
h→0 ∆x h→0 h
Spesso questo limite non esiste nemmeno; se consideriamo il punto x0 = 0 e
la funzione f (x) = |x|, allora
f (x0 + h) − f (x0 ) |h|
lim = lim = −1,
h→0− h h→0− h

mentre
f (x0 + h) − f (x0 ) |h|
lim = lim = 1,
h→0+ h h→0+ h

Per altre funzioni, tale limite esiste banalmente. Prendiamo le funzioni


costanti: f (x) = q per ogni x reale. Allora
f (x0 ) + h) − f (x0 ) q−q
lim = lim = 0,
h→0 h h→0 h
qualunque sia x0 . Questo non ci soprende, dato che la variazione di una fun-
zione costante non può che essere nulla, anche prima di prendere il limite per
h → 0. Se invece f (x) = mx + q è una generica funzione lineare, calcoliamo
f (x0 ) + h) − f (x0 ) [m(x0 + h) + q] − [mx0 + q]
lim = lim = m.
h→0 h h→0 h
La variazione infinitesima di una funzione lineare coincide in ogni punto con
il coefficiente angolare m. Anche per la parabola f (x) = x2 si fanno i calcoli
agevolmente:
f (x0 ) + h) − f (x0 ) (x0 + h)2 − x20
lim = lim
h→0 h h→0 h
x + 2x0 h + h2 − x20
2
= lim 0
h→0 h
= lim 2x0 + h = 2x0 .
h→0
6.1. VARIAZIONI INFINITESIME 87

Per la funzione x 7→ x2 , la variazione infinitesima dipende esplicitamente dal


punto x0 in ci la calcoliamo, e il risultato è 2x0 .

Definizione 6.1. Sia f : (a, b) → R una funzione data, e sia x0 ∈ (a, b) un


punto di (a, b). Chiamiamo derivata di f in x0 il numero

f (x0 + h) − f (x0 )
Df (x0 ) = lim , (6.1)
h→0 h
a patto che tale limite esista finito. Diremo che f è derivabile in x0 se esiste
la derivata Df (x0 ).

Altre notazioni di uso comune per la derivata sono



df df
0
f (x0 ), (x0 ), , f˙(x0 )
dx dx x=x0

La prima è forse la più diffusa e popolare, la seconda e la terza sono dovute


a Leibniz, mentre la quarta è dovuta ad I. Newton. Quest’ultima è ancora
oggi la notazione preferita in Fisica e in Meccanica, dove la Seconda Legge
di Newton ha la forma
mẍ = F.

Avvertenza. La derivata è un’operazione che dipende dalla funzione f e dal


punto x0 . In particolare, il nome della variabile indipendente non riveste al-
df
cun ruolo. Ecco perché non amiamo particolarmente la notazione dx . Quella
x a denominatore ha un’evidenza che non le compete. Infatti, se usiamo una
scrittura come f (t) = t2 , dobbiamo scrivere df dt
. Il grande vantaggio della
df
notazione “frazionaria” dx è che permette di scrivere formule come

d
sin x = cos x.
dx
La notazione
D(x 7→ sin x)(x) = cos x,
per quanto logicamente più corretta, sembra improponibile. Lo studente è
libero di scegliere la notazione preferita, con la consapevolezza che
d
sin x = cos t
dt
è una immane sciocchezza. L’importante è che, compiuta una scelta, ad essa
ci si attenga con coerenza.
88 CAPITOLO 6. IL CALCOLO DIFFERENZIALE

Prima di procedere, osserviamo che la derivata è anche caratterizzata


dall’uguaglianza
f (x) − f (x0 )
Df (x0 ) = lim .
x→x0 x − x0
Infatti, basta cambiare variabile: x = x0 + h e osservare che x → x0 se e solo
se h → 0.
Proposizione 6.2. Ogni funzione derivabile in un punto è anche continua
in quel punto.
Dim. Sia f derivabile in x0 . Allora
f (x0 + h) − f (x0 )
lim f (x0 + h) − f (x0 ) = lim · h = Df (x0 ) · 0 = 0.
h→0 h→0 h
Quindi, ricordando l’osservazione che precede questa Proposizione, f (x0 ) =
lim f (x), e la tesi è dimostrata.
x→x0

Non soltanto esistono funzioni continue ma non derivabili in un singolo


punto: Carl Weierstrass ha dimostrato il seguente, sorprendente, risultato.
Teorema 6.3 (Weierstrass). È possibile costruire una funzione, definita in
tutto R, che non è derivabile in alcun punto.
Il bello è che la dimostrazione è costruttiva, cioè si può scrivere una
formula che definisce tale funzione. Si tratta comunque di una definizione
un po’ particolare, che richiede la conoscenza delle serie di funzioni. Una
dimostrazione alternativa è contenuta in [21, Theorem 1.2, pag. 192], ma
richiede un paio di pagine di calcoli!

Vediamo adesso che la derivata identifica in modo univoco una retta che
rappresenta la migliore approssimazione lineare di ogni funzione derivabile.
Proposizione 6.4. Sia f : (a, b) → R una funzione, e sia x0 ∈ (a, b). Sono
equivalenti:
(i) f è derivabile in x0 ;
(ii) f è continua in x0 , e la retta di equazione y = Df (x0 )(x − x0 ) + f (x0 )
approssima la funzione f localmente, nel senso che
f (x) − (Df (x0 )(x − x0 ) + f (x0 ))
lim = 0.
x→x0 x − x0

Lasciamo la dimostrazione per esercizio. La retta y = Df (x0 )(x − x0 ) +


f (x0 ) si chiama retta tangente al grafico di f nel punto (x0 , f (x0 )).
6.2. IL CALCOLO DELLE DERIVATE 89

6.2 Il calcolo delle derivate


p un esercizio chiede di calcolare la derivata della funzione f (x) =
Quando
sin 5 1 + log(x − 2), di sicuro nessuno studente di buon senso cercherà di
applicare la definizione di derivata. Esistono infatti alcune regole di deriva-
zione, piuttosto facili da memorizzare, che ci aiutano a calcolare senza fatica
le derivate di funzioni anche molto complicate.
Teorema 6.5. Siano f e g due funzioni derivabili in un punto x0 . Sia c un
numero reale. Allora le funzioni x 7→ f (x)+g(x), x 7→ f (x)g(x) e x 7→ cf (x)
sono derivabili in x0 , e valgono le identià
1. D(f + g)(x0 ) = Df (x0 ) + Dg(x0 );
2. D(cf )(x0 ) = cDf (x0 );
3. D(f g)(x0 ) = Df (x0 )g(x0 ) + f (x0 )Dg(x0 ) (regola di Leibniz).
Infine, se Dg(x0 ) 6= 0, allora anche la funzione x 7→ f (x)/g(x) è derivabile
in x0 , e vale l’identità
 
f Df (x0 )g(x0 ) − f (x0 )Dg(x0 )
D (x0 ) = .
g (g(x0 ))2
Dim. Le prime due formule sono facilissime da dimostrare, e lasciamo i det-
tagli allo studente. La terza formula richiede il trucco di aggiungere e togliere
una quantità opportuna. Facciamo il limite del rapporto incrementale per la
funzione f g:
f (x)g(x) − f (x0 )g(x0 )
lim
x→x0 x − x0
f (x)g(x) − f (x0 )g(x) + f (x0 )g(x) − f (x0 )g(x0 )
= lim
x→x0 x − x0
f (x) − f (x0 ) g(x) − g(x0 )
= lim g(x) − f (x0 )
x→x0 x − x0 x − x0
= Df (x0 )g(x0 ) + f (x0 )Dg(x0 ).
La dimostrazione della formula per la derivata del quoziente potrebbe essere
fatta in modo analogo. Invece, dimostriamola innanzitutto nel caso f (x) = 1
per ogni x:
1 1
g(x)
− g(x0 ) g(x0 ) − g(x) 1
lim = lim
x→x0 x − x0 x→x0 x − x0 g(x)g(x0 )
Dg(x0 )
= − .
(g(x0 ))2
90 CAPITOLO 6. IL CALCOLO DIFFERENZIALE

Osservando che, per ogni x risulta


f (x) 1
= f (x) ,
g(x) g(x)
possiamo applicare la regola per la derivata del prodotto e l’ultima formula,
ottenendo la derivata del quoziente.
Quindi, attenzione: la derivata della somma è la somma delle derivate,
ma la derivata del prodotto è molto diversa dal prodotto delle derivate!
Un’altra regola di derivazione riguarda le funzioni composte.
Teorema 6.6 (Regola della catena). Siano f : (a, b) → R, g : (c, d) → R con
f ((a, b)) ⊂ (c, d).3 Se f è derivabile in x e se g è derivabile in f (x), allora
g ◦ f è derivabile in x e vale la relazione

D(g ◦ f )(x) = Dg(f (x))Df (x).

Dim. La funzione v : (c, d) → R data da


(
g(y)−g(f (x))
y−f (x)
, se y 6= f (x)
v(y) =
Dg(f (x)), se y = f (x)

è continua in f (x) perché g è per ipotesi derivabile in f (x). Inoltre per ogni
h sufficientemente piccolo si può scrivere
g(f (x + h)) − g(f (x)) f (x + h) − f (x)
= v(f (x + h))
h h
come si verifica subito distinguendo i due casi f (x + h) 6= f (x) e f (x + h) =
f (x). Per h → 0 si ha f (x + h) → f (x), v(f (x + h)) → v(f (x)) = Dg(f (x))
per il teorema di continuità delle funzioni composte. Quindi
g(f (x + h)) − g(f (x))
lim = Dg(f (x))Df (x),
h→0 h
e il teorema è dimostrato.
Osservazione 6.7. La precedente dimostrazione contiene in realtà una de-
finizione equivalente di derivabilità per una funzione f , introdotta da Weier-
strass. Una funzione f , definita almeno in un intorno del punto x0 , è deriva-
bile in x0 se e solo se esiste una funzione continua ω tale che

f (x) = f (x0 ) + ω(x)(x − x0 ), per ogni x.


3
Questa condizione garantisce che la funzione g ◦ f abbia senso.
6.2. IL CALCOLO DELLE DERIVATE 91

Infatti, la funzione continua ω è univocamente individuata dalla formula


(
f (x)−f (x0 )
x−x0
, x 6= x0
ω(x) =
Df (x0 ), x = x0 .

Leggendo fra le righe la dimostrazione del teorema precedente, lo studente


osserverà che la funzion v gioca esattamente il ruolo di ω per la funzione g
invece che per f .

Usando la notazione “frazionaria” per le derivate, ponendo

y = y(x), w = w(y),

la regola di derivazione delle funzioni composte prende la forma suggestiva


dw dw dy
= .
dx dy dx
Lo studente avrà notato che la dimostrazione dell’ultimo teorema non è affat-
to scontata. Per spiegarne l’aspetto più delicato, introduciamo la notazione

∆f f (x + h) − f (x)
=
∆x h
per il rapporto incrementale. Scriviamo per semplicità y = f (x). Ora, non è
vero che
∆(g ◦ f ) ∆g ∆y
= .
∆x ∆y ∆x
Il punto è che potremmo aver diviso per zero, operazione vietata in mate-
matica. Nessuno può garantire che ∆y = f (x + h) − f (x) 6= 0, a meno
di supporre che Df (x) 6= 0. Tuttavia, sarebbe assolutamente pretestuoso
aggiungere questa ipotesi nel teorema, che infatti vale comunque.4

Per applicare la regola della catena, occorre imparare ad isolare gli “atomi”
che compongono una funzione. Tutte le funzioni di questo corso sono solo
somme, prodotti, quozienti e composizioni delle solite funzioni elementari.
Per esempio x 7→ sin(1 + x) si decompone nella composizione

x 7→ 1 + x 7→ sin(1 + x).
4
D’accordo, lo studente è libero di credere che si commetterebbe un peccato veniale. In
matematica, purtroppo, le dimostrazioni sono giuste o sbagliate. Spiace comunque notare
che parecchi libri di testo, sia per le scuole superiori che per l’università, propongono una
dimostrazione sbagliata della regola della catena.
92 CAPITOLO 6. IL CALCOLO DIFFERENZIALE

Quindi
d
sin(1 + x) = cos(1 + x) · 1,
dx
poiché f (x) = 1 + x e g(y) = sin y. È molto utile ragionare come se fossimo
una calcolatrice: ci viene fornito x, e su tale variabile facciamo delle ope-
razioni. Nell’esempio, prima calcoliamo 1 + x, e poi calcoliamo il seno del
risultato. Ecco dunque le due funzioni che compongono x 7→ sin(1 + x). Non
c’è nulla di sbagliato in questo approccio, anche se presto si impara a rag-
gruppare le operazioni più comuni. Se è vero che per la funzione x 7→ 3x + 2
si prende x, si trova 3x e p oi si trova 3x + 2, ben poche persone applicano
la regola della catena a questa funzione. Più semplicemente, si nota che
d d d
(3x + 2) = (3x) + 2 = 3.
dx dx dx
Il risultato deve essere lo stesso, ma l’esperienza aiuta sempre a scegliere
quale strada prendere per giungere rapidamente al traguardo.
Esiste naturalmente una formula di derivazione della funzione inversa.
Purtroppo, l’enunciato sembra più difficile di quanto non lo sia davvero.

Teorema 6.8 (Derivata della funzione inversa). Sia f : (a, b) → (c, d) una
funzione biunivoca e derivabile nel punto x0 ∈ (a, b). Allora la funzione
inversa f −1 : (c, d) → (a, b) è derivabile nel punto y0 = f (x0 ) ∈ (c, d), e vale
la relazione
1
Df −1 (y0 ) = . (6.2)
Df (x0 )
Dim. La dimostrazione è diretta: siano y0 = f (x0 ) e k = f (x0 + h) − f (x0 ).
Per la continuità della funzione inversa, k → 0 per h → 0. Quindi

f −1 (y0 + k) − f −1 (y0 ) h
lim = lim .
k→0 k h→0 f (x0 + h) − f (x0 )

Ma questa è esattamente la relazione (6.2).


Illustriamo questo teorema con un esempio. Vogliamo calcolare la deri-
vata della funzione logaritmo, definita da y ∈ (0, +∞) 7→ log y. È noto che
questa è la funzione inversa della funzione f : x ∈ R 7→ ex , nel senso che
log ex = x per ogni x ∈ R e elog y = y per ogni y > 0. Quindi stiamo calco-
lando la derivata di f −1 . Poiché Df (x0 ) = ex0 per ogni x0 reale, la regola
del precedente teorema ci garantisce che , se y0 = ex0 , allora
1
Df −1 (y0 ) = .
ex0
6.3. I TEOREMI FONDAMENTALI DEL CALCOLO DIFFERENZIALE93

Quindi
1 1
D log(y0 ) = x
= ,
e 0 y0
e questo vale per ogni y0 > 0. Abbiamo quindi trovato la derivata del-
la funzione logaritmo, senza nemmeno scriverne il rapporto incrementale.
Seguendo questo schema, si calcolano le derivate delle funzioni inverse di se-
no, coseno, tangente. Lo studente potrà ricavare le rispettive formule per
esercizio, e troverà i dettagli nei testi citati in bibliografia.

6.3 I teoremi fondamentali del calcolo differen-


ziale
Finora, l’introduzione della derivata non sembra questa gran rivoluzione. Si
tratta di calcolare qualche limite di rapporti incrementali, usando di volta in
volta un’accorgimento particolare. Invece sono svariate le applicazioni delle
derivate all’analisi delle funzioni, e in questo paragrafo ce ne occuperemo
dettagliatamente.
Per prima cosa, può essere utile definire le derivate sinistra e destra in un
punto.

Definizione 6.9. Sia f : (a, b) → R una funzione continua, e sia x0 ∈ (a, b).
Diciamo che f possiede derivata sinistra in x0 se esiste finito il limite

f (x0 + h) − f (x0 )
lim .
h→0− h

Analogamente, f possiede derivata destra in x0 se esiste finito il limite

f (x0 + h) − f (x0 )
lim .
h→0+ h

Proposizione 6.10. Una funzione f : (a, b) → R è derivabile nel punto x0 ∈


(a, b) se e solo se f ha derivata destra e derivata sinistra in x0 , e queste sono
uguali fra loro.

Dim. È una conseguenza immediata della Proposizione 5.12.

Una prima applicazione di questo fatto è alle funzioni definite per “incol-
lamento”.
94 CAPITOLO 6. IL CALCOLO DIFFERENZIALE

Teorema 6.11. Siano p : (a, b) → R e q : (a, b) → R due funzioni continue e


derivabili. Sia x0 ∈ (a, b) un punto fissato. Definiamo la funzione f : (a, b) →
R come (
p(x), x ∈ (a, x0 )
f (x) =
q(x), x ∈ [x0 , b).

Allora

1. f è continua in x0 se e solo se p(x0 ) = q(x0 );

2. f è derivabile in x0 se e solo se p(x0 ) = q(x0 ) e Dp(x0 ) = Dq(x0 ).

La dimostrazione è evidente. Sottolineiamo che la sola condizione


Dp(x0 ) = Dq(x0 ) non è sufficiente a garantire la derivabilit à di f . In-
fatti le due funzioni p(x) = x e q(x) = x + 1 hanno la stessa derivata in
x0 = 0, ma la funzione f costruita incollandole nell’origine ha un salto.
Esempio. Applichiamo questa “ricetta” alla funzione f (x) = |x|. In effetti,
in base alla definizione del valore assoluto, possiamo scrivere
(
x, (x ≥ 0)
f (x) =
−x, (x < 0)

e da ciò deduciamo che f non è derivabile in x0 = 0. Infatti l’incollamento è


continuo in questo punto, ma la derivata di x differisce da quella di −x. In
ogni altro punto x 6= 0, la derivata vale
(
1, (x ≥ 0)
f (x) =
−1, (x < 0).

A volte si introduce la funzione segno sign : R \ {0} → R definita da sign x =


x
|x|
. Per esercizio, lo studente verifichi che f 0 (x) = sign x per ogni x 6= 0.

Il prossimo teorema, dovuto al matematico francese Fermat,5 è di fonda-


mentale importanza nella ricerca di massimi e minimi di una data funzione.

Teorema 6.12 (Fermat). Sia f : (a, b) → R una funzione, e sia x0 ∈ (a, b)


un punto di massimo (o di minimo) relativo. Se f è derivabile in x0 , allora
Df (x0 ) = 0.
5
Si pronuncia fermà.
6.3. I TEOREMI FONDAMENTALI DEL CALCOLO DIFFERENZIALE95

Dim. Supponiamo che x0 sia un minimo relativo. Dunque, esiste un intorno


[x0 − δ, x0 + δ] di x0 tale che f (x0 ) ≤ f (x) per ogni x di tale intorno. Sia
h ∈ (−δ, δ), e costruiamo il rapporto incrementale di f in x0 :

f (x0 + h) − f (x0 )
.
h
Poiché x0 + h ∈ [x0 − δ, x0 + δ], il numeratore è sempre maggiore o uguale a
zero. Ne deduciamo che
f (x0 + h) − f (x0 )
Df (x0 ) = lim ≤ 0,
h→0− h
mentre
f (x0 + h) − f (x0 )
Df (x0 ) = lim ≥ 0.
h→0+ h
Se un numero è simultaneamente ≤ 0 e ≥ 0, allora tale numero è 0. Il teorema
è così dimostrato per i minimi relativi. Per i massimi relativi, si applicano
le stesse considerazioni, e l’unica differenza è l’inversione delle ultime due
disuguaglianze.
Concretamente, il procedimento per individuare i punti di massimo e
minimo relativi di una funzione assegnata è: isolo i punti dove f non è
derivabile, e isolo gli (eventuali) estremi del dominio di definizione. Infine
cerco gli zeri della derivata. Attenzione, il teorema di Fermat è falso se x0
cade in uno degli estremi di (a, b). Come esempio, sia f : x ∈ [0, 1] 7→ x. Il
minimo assoluto è in x = 0, il massimo assoluto in x = 1. Però f 0 (x) 6= 0 per
ogni x ∈ [0, 1].

Definizione 6.13. I punti critici di una funzione derivabile f sono i punti


x tali che Df (x) = 0.

Questa definizione non è superflua: non tutti gli zeri della derivata sono
massimi oppure minimi. Se poniamo f (x) = x3 per ogni x ∈ R, troviamo
facilmente l’unico zero della derivata prima, x = 0. Ora, se x > 0 allora
x3 = f (x) > 0, mentre se x < 0 è x3 = f (x) < 0. Quindi, l’origine non è un
minimo né un massimo per f , visto che in ogni intorno dell’origine cadono
punto in cui f vale meno di 0 e punti in cui f vale più di 0. L’origine è dunque
un punto critico di f che non sa ppiamo ancora descrivere bene.6 Infine, la
funzione x 7→ |x| è un classico esempio di funzione con un punto di minimo
assoluto (quale?) dove la derivata non esiste. Il prossimo teorema dà una
6
Qualche studente ricorderà che 0 è un punto di flesso per f , ma ci arriveremo fra un
po’.
96 CAPITOLO 6. IL CALCOLO DIFFERENZIALE

condizione sufficiente affinché una funzione derivabile abbia almeno un punto


critico. Invitiamo lo studente a convincersi con esempi che la condizione posta
non è necessaria per l’esistenza di punti critici.7
Teorema 6.14 (Rolle). Sia f : [a, b] → R una funzione continua e derivabile
in (a, b). Se f (a) = f (b), allora esiste ξ ∈ (a, b) tale che 8 Df (ξ) = 0.
Dim. Per il teorema di Weierstraß la funzione f ha massimo e minimo (as-
soluti) in [a, b]. Siano xM un punto di massimo e xm un punto di minimo.
Esistono solo due casi:
1. sia xm che xM cadono agli estremi dell’intervallo [a, b]. Poiché f assume
(per ipotesi) lo stesso valore in questi due punti, il massimo assoluto
di f coincide con il minimo assoluto, e pertanto la funzione è costante.
La sua derivata è dunque sempre uguale a zero, e non c’è altro da
dimostrare.
2. Uno almeno dei due punti xm e xM cade all’interno dell’intervallo [a, b].
Per il teorema di Fermat, in questo punto la derivata di f si annulla, e
la dimostrazione è completa anche in questo caso.
In ogni caso, abbiamo verificato che la derivata di f si annulla in almeno un
punto di (a, b).
Osservazione. Il precedente teorema inaugura la serie di enunciati in cui
si tratta di funzioni continue su un intervallo chiuso [a, b] e derivabili nel-
l’intervallo aperto (a, b). Non si tratta di un’inutile complicazione introdotta
da qualche docente particolarmente cattivo, bensì di un’effettiva necessità.
L’esistenza delle derivate nei punti a e b non è necessaria. Anzi, la dimostra-
zione del teorema di De l’Hospital richiede l’uso di questi teoremi esattamente
come li abbiamo enunciati.

Il Teorema di Fermat ci dice che i punti di massimo e di minimo si na-


scondono fra i punti critici. Ma esiste un modo per stabilire se un punto
critico è un massimo, un minimo, o nessuno dei due? Ne esiste più di uno, e
il modo più facile per capirlo è studiare la monotonia della funzione. Se essa
cresce a sinistra del punto critico, e decresce dopo averlo superato, siamo
inequivocabilmente in presenza di un massimo relativo. Simmilmente per
i minimi relativi. Ma come si studia la monotonia di una f unzione? Se la
funzione è derivabile, i metodi del calcolo differenziale ci sono utili. La chiave
è un teorema celeberrimo.
7
Quello che vogliamo dire è: esistono funzioni dotate di punti critici, ma che non
soddisfano l’ipotesi fondamentale del teorema di Rolle.
8
La lettera greca ξ si legge più o meno “csi”.
6.3. I TEOREMI FONDAMENTALI DEL CALCOLO DIFFERENZIALE97

Teorema 6.15 (del valor medio, o di Lagrange). Sia f : [a, b] → R una


funzione continua e derivabile in (a, b). Allora esiste ξ ∈ (a, b) tale che

f (b) − f (a)
Df (ξ) = .
b−a
Dim. La tecnica dimostrativa consiste nell’applicare il teorema di Rolle a
una funzione ausiliaria che ne verifica le ipotesi. A tale scopo, definiamo
g : [a, b] → R mediante la formula

f (b) − f (a)
g(x) = f (x) − f (a) − (x − a).
b−a
In pratica, facciamo la differenza fra f e la retta che unisce gli estremi
(a, f (a)) con (b, f (b)). È chiaro che g è continua in [a, b], derivabile in (a, b),
e g(a) = g(b) = 0 Dunque g soddisfa le ipotesi del teorema di Rolle, sicché
esiste ξ ∈ [a, b] dove Dg(ξ) = 0. Le regole di derivazione affermano che
Dg(x) = Df (x) − f (b)−f b−a
(a)
, e la condizione Dg(ξ) = 0 si legge

f (b) − f (a)
Df (ξ) = .
b−a
Questo completa la dimostrazione del teorema.

Osservazione 6.16. Applicando alla funzione f (x) = log x il teorema pre-


cedente, si dimostra la relazione di Nepero

1 log b − log a 1
< <
b b−a a

per ogni 0 < a < b. Lasciamo i dettagli (semplicissimi) allo studente.

È frequente trovare il teorema di Lagrange come caso particolare di un


altro teorema molto famoso, dovuto al matematico francese Louis Augu-
stin Cauchy. Lo enunciamo e diamo solo uno spunto per completarne la
dimostrazione.

Teorema 6.17 (Cauchy). Siano f e g due funzioni continue su [a, b] e de-


rivabili in (a, b). Suppponiamo inoltre che Dg(x) 6= 0 per ogni x ∈ (a, b).
Allora esiste ξ ∈ [a, b] tale che

f (b) − f (a) Df (ξ)


=
g(b) − g(a) Dg(ξ)
98 CAPITOLO 6. IL CALCOLO DIFFERENZIALE

Cenno della dimostrazione. Trovare un numero erale k tale che il teorema di


Rolle sia applicabile alla funzione ausiliaria h(x) = f (x)−kg(x). Osserviamo
che l’ipotesi Dg(x) 6= 0 per ogni x ∈ (a, b) implica in particolare g(b)−g(a) 6=
0. È una conseguenza del teorema di Rolle.
Il teorema di Lagrange appare dunque come un caso particolare (per
g : x 7→ x) del teorema precedente. Il fatto che le applicazioni del teorema di
Lagrange siano molte più di quelle del teorema di Cauchy, ci ha indotti ad
attribuirgli un’evidenza maggiore.
Il prossimo risultato mostra che la derivata di una funzione (derivabile)
non può avere salti.
Teorema 6.18. Sia f : (a, b) → R una funzione derivabile. Se Df (a) < λ <
Df (b), allora esiste ξ ∈ (a, b) tale che Df (ξ) = λ.
Dim. Definiamo una funzione ausiliaria g : x ∈ (a, b) 7→ f (x) − λx. Per
ogni x ∈ (a, b), è Dg(x) = Df (x) − λ. Inoltre Dg(a) < 0, Dg(b) > 0.
Quindi g è decrescente in un intorno di a e crescente in un intorno di b. In
particolare, esiste un punto di minimo ξ ∈ (a, b) per g. Per il teorema di
Fermat, Dg(ξ) = 0, cioè Df (ξ) = λ.

6.4 Punti singolari


Sappiamo che una funzione derivabile in un punto deve essere ivi continua.
Rovesciando logicamente questa affermazione, nessuna funzione è derivabile
in un punto di discontinuità. Quindi la discontinuità è la causa più “rozza”
di perdita di derivabilità. D’altronde, abbiamo già imparato che la funzione
x 7→ |x| è continua ovunque ma non è derivabile in 0.
Definizione 6.19. I punti singolari di una funzione sono quelli in cui la
funzione è continua ma non derivabile.
Elenchiamo due tipi di punti singolari.
1. I punti angolosi. Sono quelli in cui la derivata destra e la derivata
sinistra esistono, ma non coincidono. La funzione del valore assoluto
ne è un esempio.
2. Le cuspidi. Sono quelli in cui almeno una fra la derivata destra e la
9
p sinistra è infinita. Il punto 0 è una cuspide per la funzione
derivata
x 7→ |x|.
9
Il linguaggio è comprensibile ma impreciso. Una derivata non può essere infinita, in
base alle nostre definizioni. Qui intendiamo piuttosto dire che una delle due derivate destra
o sinistra non esiste proprio perché il corrispondente limite del rapporto incrementale è
infinito.
6.5. APPLICAZIONI ALLO STUDIO DELLE FUNZIONI 99

Nei vari testi consultati, esistono piccole differenze nella classificazione dei
punti singolari. In particolare, molti libri chiamano cuspide solo un punto
singolare in cui sono infinite sia la derivata sinistra che quella destra. Poi,
però, non attribuiscono alcun nome al punto singolare in cui solo una di tali
derivate è infinita. Fortunatamente, non sembrano esserci divergenze sulla
definizione dei punti angolosi.

6.5 Applicazioni allo studio delle funzioni


Teorema 6.20. Sia f : (a, b) → R una funzione derivabile.

1. Se f è monotona crescente (risp. decrescente) allora Df (x) ≥ 0 (risp.


Df (x) ≤ 0) per ogni x ∈ (a, b).

2. Se Df (x) ≥ 0 (risp. Df (x) ≤ 0) per ogni x ∈ (a, b), allora f è


monotona crescente (risp. decrescente).

3. Se Df (x) > 0 (risp. Df (x) < 0) per ogni x ∈ (a, b), allora f è
strettamente crescente (risp. strettamente decrescente).

Dim. La prima affermazione discende dal teorema della permanenza del se-
gno applicato al rapporto incrementale. Le altre affermazioni sono conse-
guenza del teorema di Lagrange. Fissati arbitrariamente x1 < x2 in (a, b),
esiste un punto ξ ∈ (x1 , x2 ) tale che f (x2 ) − f (x1 ) = Df (ξ)(x2 − x1 ). Quindi
il segno di f (x2 ) − f (x1 ) è individuato dal segno di Df (ξ).

Iil teorema precedente fornisce una regola per decifrare la monotonia di


una funzione derivabile. Salvo qualche cautela sulla monotonia stretta, oc-
corre identificare gli intervalli dove la derivata è positiva: in tali intervalli, la
funzione cresce. La funzione invece decresce negli intervalli dove la derivata
è negativa.
Una seconda applicazione del teorema di Lagrange riguarda la derivabilità
stessa. Supponiamo che una certa funzione sia continua in (a, b) e derivabile
in tutti i punti dell’intervallo eccettuato al più un punto x0 . Come si fa a
decidere se la funzione è derivabile anche in x0 ? Si può pensare di ricorrere
alla definizione, scrivendo il rapporto incrementale centrato in x0 e facendo
tendere a zero l’incremento. Oppure si può usare il seguente criterio.

Proposizione 6.21. Sia f : (a, b) → R una funzione continua. Sia x0 ∈


(a, b) un punto, e supponiamo che f sia derivabile in (a, x0 ) ∪ (x0 , b). Se
esiste finito λ = limx→x0 Df (x0 ), allora f è derivabile in x0 e Df (x0 ) = λ.
100 CAPITOLO 6. IL CALCOLO DIFFERENZIALE

Dim. Sia x ∈ (a, b), x 6= x0 . Per il teorema di Lagrange, esiste ξ = ξ(x) tale
che f (x) − f (x0 ) = Df (ξ)(x − x0 ). Ovviamente, siccome ξ ∈ (x0 , x), si avrà
ξ → x0 per x → x0 . L’ipotesi della Proposizione garantisce allora che

f (x) − f (x0 )
lim = lim Df (ξ) = λ.
x→x0 x − x0 x→x0

Perciò f è derivabile in x0 , e Df (x0 ) = λ.

Occorre però fare attenzione, perché il criterio della Proposizione prece-


dente è sufficiente ma non necessario per l’esistenza della derivata in x0 .10
Consideriamo infatti la funzione
(
x2 sin(1/x) x 6= 0
f (x) =
0 x = 0.

Poiché
1
0 ≤ |f (x)| = x sin ≤ x2 → 0
2
x
per x → 0, f è continua un x = 0. Inoltre

f (x) − f (0) 1
lim = lim x sin = 0.
x→0 x−0 x→0 x
Dunque Df (0) = 0. Se x 6= 0, la derivata vale

1 1
Df (x) = 2x sin − cos ,
x x
che non ha limite per x → 0. La Proposizione non è perciò applicabile,
mentre la derivata di f in 0 esiste.11

Osservazione 6.22. Se riflettiamo un istante sull’enunciato della Proposi-


zione, ci accorgiamo che la sua tesi va oltre la mera esistenza della derivata in
x0 . In realtà, le ipotesi ci permettono di concludere che la funzione derivata
f 0 è continua in x0 : limx→x0 f 0 (x) = λ = f 0 (x0 ). Nei controesempi appena
discussi, è chiaro che la derivata risultava sempre discontinua in x0 .
10
In parole povere, se il criterio si applica allora la funzione è derivabile; se il criterio
fallisce, non siamo autorizzati a trarre alcuna conclusione. Invito lo studente a fare molta
attenzione.
11
L’accanimento con cui presentiamo controesempi non deve indurre lo studente a pen-
sare che tutti i teoremi siano “deboli”. Piuttosto, vogliamo evidenziare l’ottimalità delle
ipotesi.
6.6. DERIVATE SUCCESSIVE 101

6.6 Derivate successive


Se una funzione f : (a, b) → R è derivabile in (a, b), la funzione x ∈ (a, b) 7→
Df (x) definisce una funzione reale di una variabile reale, che chiamiamo
naturalmente funzione derivata di f .

Definizione 6.23. Diremo che la funzione f è derivabile due volte nel punto
x0 ∈ (a, b) se la funzione derivata di f è derivabile a sua volta in x0 . La
derivata seconda di f in x0 è denotata con uno dei simboli

d2 f
2
D f (x0 ), 00
f (x0 ), (x0 ), f¨(x0 ).
dx2
Evidentemente, è possibile iterare il ragionamento precedente, e parlare
così di derivata terza, quarta, ecc. In generale, per indicare la derivata n–
esima si usano i simboli
dn f
Dn f (x0 ), f (n) (x0 ), (x0 ).
dxn
Impareremo presto ad usare uno strumento, il polinomio di Taylor, in cui le
derivate successive rivestono un ruolo di fondamentale importanza. Nel resto
di questo paragrafo, ci concentreremo sulla derivata seconda, l’ultima ad ave-
re qualche interpretazione geometrica degno di nota. Prima però dobbiamo
introdurre una definizione.

Definizione 6.24. Sia f : (a, b) → R una funzione. Si dice che f è convessa


in (a, b) se, per ogni x1 , x2 ∈ (a, b) e per ogni λ ∈ [0, 1], risulta

f ((1 − λ)x1 + λx2 ) ≤ (1 − λ)f (x1 ) + λf (x2 ). (6.3)

Si dice invece che f è concava in (a, b) se la funzione −f , che agisce come


x 7→ −f (x), è convessa.

Posto x = (1−λ)x1 +λx2 , la disuguaglianza di convessità si può riscrivere


come
f (x2 ) − f (x1 )
f (x) ≤ f (x1 ) + (x − x1 ), x ∈ [x1 , x2 ].
x2 − x1
Essa quindi equivale all’affermazione geometrica: per ogni x1 , x2 con x1 < x2 ,
il grafico di f in [x1 , x2 ] sta al di sotto della corda per i punti (x1 , f (x1 )),
(x2 , f (x2 )).
Immaginiamo che lo studente sia stato introdotto, seppure brevemen-
te, alla convessità durante le scuole superiori. Quasi certamente gli sarà
stato insegnato un linguaggio un po’ diverso: invece di funzione convessa,
102 CAPITOLO 6. IL CALCOLO DIFFERENZIALE

Figura 6.1: Una tipica funzione convessa

Figura 6.2: Una tipica funzione concava


6.6. DERIVATE SUCCESSIVE 103

funzione che volge la concavità verso l’alto. Pur sentendoci in grado di af-
fermare che “convessità” è l’unica denominazione in voga nella matematica
contemporanea, poco importano i nomi e gli aggettivi.
Osservazione. Come visto, per noi la definizione di funzione convessa è
di natura globale, e non daremo un significato a frasi quali “la funzione è
convessa in un punto”.
Un altro punto sul quale condividiamo le perplessità dello studente è l’ap-
plicabilità della disuguaglianza di convessità. Se, per esempio, non è difficile
dimostrare con tale definizione che la funzione x 7→ x2 è convessa in tut-
to R, per funzioni più complicate risulta impossibile gestire elementarmente
le disuguaglianze. Occorrono dunque dei criteri, cioè delle condizioni atte
ad assicurare la convessità di una data funzione mediante test maneggevoli.
Eccone uno.

Proposizione 6.25. Sia f : [a, b] → R una funzione derivabile. Sono equi-


valenti:

(i) f è convessa.

(ii) La funzione x 7→ Df (x) è monotona crescente in (a, b).

(iii) Il grafico di f è sopra tutte le sue tangenti, cioè per ogni x, x0 ∈ [a, b]

f (x) ≥ f (x0 ) + Df (x0 )(x − x0 ).

La caratterizzazione più utile è l’equivalenza di (i) e (ii). La convessità


di una funzione derivabile equivale in tutto e per tutto alla monotonia della
sua derivata prima. Siccome sappiamo che la monotonia di una funzione si
riflette nel segno della derivata della funzione, abbiamo il seguente criterio
di convessità per le funzioni derivabili due volte.

Proposizione 6.26. Sia f : (a, b) → R una funzione derivabile due volte.


Sono equivalenti:

(i) f è convessa.

(ii) D2 f (x) ≥ 0 per ogni x ∈ (a, b).

Definizione 6.27. Sia f : (a, b) → R una funzione. Diremo che x0 ∈ (a, b)


è un punto di flesso per f se f è convessa in (a, x0 ) e concava in (x0 , b), o
viceversa.
104 CAPITOLO 6. IL CALCOLO DIFFERENZIALE

In altre parole, in un punto di flesso la retta tangente al grafico di f , se


esiste, attraversa tale grafico. Vogliamo invece sfatare un mito assai diffuso.
Non tutti gli zeri della derivata seconda sono punti di flesso. Sia f : x 7→ x4 .
Si ha D2 f (0) = 0, ma 0 è evidentemente un punto di minimo assoluto per f .
Vale per ò il seguente teorema.
Teorema 6.28. Una funzione f derivabile due volte e dotata di un punto di
flesso in x0 , deve verificare D2 f (x0 ) = 0.
Dim. Infatti, f deve essere convessa a sinistra di x0 e concava a destra di x0
(o viceversa). Pertanto la derivata prima di f cambia il senso di monotonia
attraversando il punto x0 . Questo implica che x0 è un punto di massimo (o
di minimo) per Df . Il teorema di Fermat garantisce allora che D(Df )(x0 ) =
D2 f (x0 ) = 0.
Osservazione 6.29. Non è facile trovare in letteratura una definizione de-
finitiva di punto di flesso. Il motivo è che si tratta di un’idea tipica per le
funzioni di una variabile. Volendo generalizzare la convessità a funzioni di un
numero maggiore di variabili, ci si imbatte nel problema seguente: mentre un
punto spezza l’asse reale R in due parti, un punto nello spazio (per esempio
tridimensionale, cioè quello in cui viviamo) non suddivide lo spazio stesso in
parti disgiunte. Non sembra dunque ragionevole parlare di punti di flesso per
funzioni di due, tre o più variabili.
Concludiamo questa sezione con qualche altra proprietà delle funzioni
convesse.
Lemma 6.30 (Disuguaglianza di Jensen, caso discreto). Supponiamo che f
sia una funzione convessa definita in un intervallo I. Allora
f (α1 x1 + . . . + αn xn ) ≤ α1 f (x1 ) + . . . + αn f (xn )
per ogni n ∈ N, x1 , . . . , xn ∈ I, α1 , . . . , αn ≥ 0 con α1 + . . . αn = 1.
Corollario 6.31. Supponiamo che f sia una funzione convessa definita in
un intervallo I. Allora
 
α1 x1 + . . . + αn xn α1 f (x1 ) + . . . + αn f (xn )
f ≤ ,
α1 + . . . αn α1 + . . . αn
per ogni x1 , . . . , xn ∈ I, α1 , . . . , αn > 0.
Corollario 6.32. Fissiamo arbitrariamente n ∈ N, ed n punti xi > 0, per
i = 1, . . . , n. Siano poi αi ≥ 0, per i = 1, . . . n, n numeri reali non negativi
tali che α1 + . . . + αn = 1. Allora
xα1 1 xα2 2 · · · xαnn ≤ α1 x1 + . . . + αn xn .
6.7. CLASSI DI REGOLARITÀ 105

Osservazione 6.33. Se scegliamo α1 = α2 = . . . = αn = 1/n nel prece-


dente corollario, otteniamo la nota relazione fra la media algebrica e media
aritmetica di n numeri reali positivi:
√ x1 + . . . + x n
n
x1 x2 · · · xn ≤ .
n
Definizione 6.34. Sia I un intervallo della retta reale, e sia f : I → R una
funzione. Diremo che f è Jensen–convessa se
 
x+y f (x) + f (y)
f ≤
2 2
per ogni x, y ∈ I.
Ovviamente, tutte le funzioni convesse son oanche Jensen–convesse. Il
viceversa è in generale falso, ma diventa vero limitatamente alle funzioni
continue.
Proposizione 6.35. Ogni funzione Jensen–convessa e continua in un inter-
vallo I è convessa in I.
Dim. Si veda, ad esempio, [21, Proposition 6.3].

6.7 Classi di regolarità


Per abbreviare alcuni enunciati, conviene introdurre una terminologia pro-
gressiva per la regolarità di una funzione. Vorremmo assegnare alla continuità
il grado di regolarità più basso, per poi passare alla derivabilità una, due,
tre, o più volte.
Definizione 6.36. Sia f : (a, b) → R una funzione. Diremo che f è di
classe C k (a, b), e scriveremo f ∈ C k (a, b), se f possiede k derivate in ogni
punto di (a, b), e se queste derivate sono tutte funzioni continue in (a, b).
Per estensione, diremo che f è di classe C ∞ (a, b), se f possiede derivate di
ordine arbitrariamente alto in (a, b).
Convenzionalmente, una funzione di classe C 0 (a, b) è semplicemente una
funzione continua in (a, b). Una funzione di classe C 1 (a, b) è una funzione
che possiede una derivata continua in (a, b). Invitiamo lo studente a prestare
attenzione alla richiesta di continuità per tutte le derivate coinvolte. Potreb-
be infatti accadere che una funzione sia derivabile, ma che la derivata abbia
una discontinuità: in questo caso non possiamo attribuire la regolarità C 1 .
Per dare qualche esempio, tutti i polinomi sono di classe C ∞ (R), così
come la funzione esponenziale, il seno e il coseno. Nei fatti, praticamente
tutte le funzioni elementari sono di classe C ∞ nel loro dominio di definizione.
106 CAPITOLO 6. IL CALCOLO DIFFERENZIALE

6.8 Grafici di funzioni


Abbiamo ormai tutti gli strumenti per effettuare uno studio qualitativo del
grafico di una funzione. Sappiamo che, in buona sostanza, il segno della
derivata prima è un indicatore della monotonia, mentre il segno della derivata
seconda descrive la convessità. Per avere un grafico rappresentativo di una
funzione, conviene mettere in risalto gli eventuali asintoti.
Nella sostanza, un asintoto è semplicemente una retta verso la quale il
grafico di una funzione si avvicina indefinitamente. Piuttosto che affron-
tare una difficile definizione unitaria di asintoto, preferiamo presentare tre
definizioni. Sebbene la terza possa inglobare la seconda con poco sforzo, è
didatticamente consigliabile tenerle separate.
Definizione 6.37. Sia f una funzione reale di variabile reale, definita alme-
no su un intervallo (a, b). La retta di equazione x = a è un asintoto verticale
destro per f se limx→a+ f (x) = ±∞. Similmente, la retta x = b è un asintoto
verticale sinistro se limx→b− f (x) = ±∞.
Nulla impedisce che una retta x = c sia simultaneamente un asintoto
verticale sinistro e destro. Ovviamente, la funzione f deve essere definita
almeno in un intorno di c, escluso al più {c}.
Definizione 6.38. Sia f una funzione definita almeno su un intervallo illi-
mitato (a, +∞). La retta di equazione y = q è un asintoto orizzontale destro
se limx→+∞ f (x) = q. Analogamente, se f è definita almeno su un inter-
vallo illimitato (−∞, a), la retta y = q è un asintoto orizzontale sinistro se
limx→−∞ f (x) = q.
Meno ovvia è la definizione di asintoto obliquo, e soprattutto è meno
immediato capire se una funzione ammetta asintoti obliqui.
Definizione 6.39. Sia f una funzione definita almeno su un intervallo il-
limitato (a, +∞). La retta di equazione y = mx + q, m 6= 0, è un asintoto
obliquo per x → +∞ se limx→+∞ |f (x) − (mx + q)| = 0. Analogamente,
possiamo definire un asintoto obliquo per x → −∞.
In primo luogo, osserviamo che una condizione necessaria affinché una
funzione f abbia un asintoto obliquo (diciamo per x → +∞) è che

lim f (x) = ±∞.


x→+∞

Questo è chiaro: se y = mx + q è un asintoto obliquo, allora

lim f (x) = lim f (x) − mx − q + mx + q = lim mx + q = ±∞.


x→+∞ x→+∞ x→+∞
6.8. GRAFICI DI FUNZIONI 107

Vediamo come calcolare i coefficienti m e q di un asintoto obliquo. Se


limx→+∞ |f (x) − (mx + q)| = 0, a maggior ragione
 
f (x) q
lim x −m− = 0.
x→+∞ x x
Quindi la parentesi deve tendere a zero, e
f (x)
m = lim . (6.4)
x→+∞ x

Ora che abbiamo trovato il coefficiente angolare m, dalla definizione stessa


di asintoto obliquo deduciamo
q = lim f (x) − mx. (6.5)
x→+∞

Non c’è bisogno di dire che considerazioni del tutto analoghe devono essere
fatte per gli asintoti obliqui per x → −∞. Evidenziamo poi che abbiamo
sempre supposto m 6= 0. Da un lato, il caso m = 0 corrisponde all’asintoto
orizzontale. Dall’altro, se la relazione (6.4) fornisce m = 0, non è corretto

affermare che esiste un asintoto orizzontale. Ad esempio, la funzione x 7→ x
non ha asintoti per x → +∞, eppure m = 0.
Da ultimo, una stessa funzione può presentare due asintoti obliqui distinti,
il primo per x → −∞ e il secondo per x → +∞. Dunque le formule (6.4)
e (6.5) devono essere applicate sia per x → +∞ che per x → −∞, senza
alcuna possibilità di fare economia sui calcoli.12
Riassumendo, studiare l’andamento di una funzione è un esercizio che
possiamo suddividere in vari passi. In particolare, lo studente potrà seguire
questo schema.
• Identificare eventuali simmetrie, anche in senso lato, o periodicità della
funzione, così come le zone in cui la funzione è continua, derivabile, ecc.
• Studiare l’andamento asintotico della funzione vicino ai punti estremi
del dominio di definizione. Questo comprende anche il calcolo dei limiti
all’infinito, e l’individuazione degli asintoti.
• Identificare il segno della derivata prima, cioè le zone in cui f è mo-
notona, e i punti critici. Determinare la natura degli eventuali punti
critici, e, quando possibile, studiare il segno della derivata seconda per
definire le regioni di convessità e gli eventuali punti di flesso.
12
Lo studente non prenda questa affermazione come un’accusa di scarsa volontà. In un
corso non specialistico come il nostro, buona parte degli esercizi consiste nel fare conti.
Prafrasando Pasolini, “calcolare stanca”, ma è anche l’unico modo per verificare se lo
studente sa usare le idee presentate a lezione.
108 CAPITOLO 6. IL CALCOLO DIFFERENZIALE

• Studiare gli eventuali punti singolari.


• Disegnare il grafico cartesiano della funzione, avendo cura di dare risalto
alle conclusioni ottenute con l’analisi dei punti precedenti.

6.9 Il teorema di De l’Hospital


La collocazione di questo paragrafo può sembrare bizzarra, dal momento che
è consuetudine introdurre il Teorema di De l’Hospital subito dopo il teorema
del valor medio. Inoltre, averlo a disposizione prima di affrontare lo studio del
grafico di una funzione è di grande aiuto in determinate circostanze. Abbiamo
preferito collocarlo in coda ai teoremi fondamentali del calcolo differenziale
per due ragioni: la prima è che questa scelta porta diritti a parlare del
polinomio di Taylor. La seconda è che tanto più un teorema è utile per gli
esercizi, tanto più lo studente tende ad abusarne. Alcuni fra gli errori più
grossolani negli elaborati d’esame riguardano esattamente questo teorema.
Certo, il docente spesso contribuisce a seminare “trappole” negli esercizi; ma
anche questo è il suo lavoro.
Per ragioni pedagogiche, scindiamo l’enunciato in due teoremi piuttosto
simili. Il primo enunciato copre la situazione [0/0], e il secondo la situazione
[qualunque cosa/∞].13
Teorema 6.40 (Prima parte). Siano f : (a, b) → R e g : (a, b) → R due
funzioni derivabili. Supponiamo che
(i) limx→a+ f (x) = limx→a+ g(x) = 0;
(ii) Dg(x) 6= 0 per ogni x ∈ (a, b);
Se
Df (x)
lim = L,
Dg(x)
x→a+

ammettendo anche la possibilità che L = ±∞, allora


f (x)
lim = L.
x→a+ g(x)

Dim. Sia q > L un numero arbitrariamente vicino a L, e scegliamo r ∈ R


tale che L < r < q. Per l’ipotesi sul limite del quoziente delle derivate, esiste
c ∈ (a, b) tale che
Df (x)
<r
Dg(x)
13
Questa simbologia è tratta da [10].
6.9. IL TEOREMA DI DE L’HOSPITAL 109

per ogni x ∈ (a, c). Ora, se a < x < y < c, il teorema di Cauchy implica
l’esistenza di un numero t ∈ (x, y) con

f (x) − f (y) Df (t)


= < r.
g(x) − g(y) Dg(t)

Facciamo tendere x → a, e vediamo che

f (y)
<r
g(y)

per ogni a < y < c. Similmente, se p < L è arbitrariamente vicino a L,


poossiamo trovare un numero c̄ tale che

f (y)
p<
g(y)

per ogni a < y < c̄. Riassumendo, abbiamo dimostrato che il rapporto
f (y)/g(y) è vicino a piacere a L, a patto di prendere y abbastanza vicino a
a. La dimostrazione del teorema è completa.

Teorema 6.41 (Seconda parte). Siano f : (a, b) → R e g : (a, b) → R due


funzioni derivabili. Supponiamo che

(i) limx→a+ g(x) = ±∞;

(ii) Dg(x) 6= 0 per ogni x ∈ (a, b);

Se
Df (x)
lim = L,
x→a+ Dg(x)

ammettendo anche la possibilità che L = ±∞, allora

f (x)
lim = L.
x→a+ g(x)

Dim. La dimostrazione è molto simile a quella della prima parte. Dobbiamo


però usare l’ipotesi g(x) → ±∞ per x → a+. Sia q > L un numero arbitra-
riamente vicino a L, e scegliamo r ∈ R tale che L < r < q. Per l’ipotesi sul
limite del quoziente delle derivate, esiste c ∈ (a, b) tale che

Df (x)
<r
Dg(x)
110 CAPITOLO 6. IL CALCOLO DIFFERENZIALE

per ogni x ∈ (a, c). Ora, se a < x < y < c, il teorema di Cauchy implica
l’esistenza di un numero t ∈ (x, y) con
f (x) − f (y) Df (t)
= < r. (6.6)
g(x) − g(y) Dg(t)
Per fissare le idee, supporremo d’ora in avanti che limx→a+ g(x) = +∞.
Lasciamo allo studente le piccole modifiche necessarie a trattare il caso
limx→a+ g(x) = −∞.
Tenendo y fissa nell’ultima equazione, scegliamo c1 ∈ (a, c) tale che
g(x) > g(y) per ogni x ∈ (a, c1 ). Questo è possibile, perch é g(x) diventa
infinitamente grande al tendere di x verso a. Per la stessa ragione, possiamo
anche supporre che g(x) > 0. Moltiplicando la (6.6) per la quantità positiva
(g(x) − g(y))/g(x), troviamo
f (x) g(y) f (y)
<r−r +
g(x) g(x) g(x)
per ogni x ∈ (a, c1 ). Facciamo tendere x → a+ e deduciamo che esiste c2
tale che
f (x)
<q
g(x)
per ogni x ∈ (a, c2 ). Un ragionamento analogo mostra che per ogni p < L
esiste c3 tale che la disuguaglianza
f (x)
p<
g(x)
sia valida per ogni x ∈ (a, c3 ). Come nella prima parte, la dimostrazione è
completa.
Qualche parola di commento. Per semplificare gli enunciati, abbiamo
presentato un caso modello, il limite per x → a+. Si tratta di una scelta
piuttosto convenzionale, visto che i teoremi continuano a valere anche per
x → x0 ∈ (a, b) e perfino per x → ±∞. È sottinteso che, per i limiti
all’infinito, le due funzioni devono essere definite almeno su un intervallo
della forma (a, +∞) o (−∞, a).
Le dimostrazione dei teoremi precedenti sono abbastanza tecniche, ma
crediamo che quella della prima parte sia piuttosto chiara. L’ipotesi sul limite
del quoziente delle derivate viene usato per mezzo del teorema di Cauchy. La
dimostrazione della seconda parte richiede qualche accorgimento tecnico sul
segno del denominatore.
Attiriamo l’attenzione dello studente su un fatto: il teorema tratta la for-
ma [qualunque cosa/∞]. Potrebbe non trattarsi di una forma indeterminata,
ciò che importa è che siano soddisfatte le ipotesi del teorema.
6.9. IL TEOREMA DI DE L’HOSPITAL 111

Osservazione 6.42. Il teorema di De l’Hospital permette di dimostrare una


parziale inversione della Proposizione 6.21. Come visto, non possiamo aspet-
tarci che l’esistenza del limite della derivata prima sia equivalente all’esistenza
della derivata prima nel punto x0 , ma possiamo comunque dire qualcosa in
più.
Proposizione 6.43. Supponiamo che f : (a, b) → R sia una funzione conti-
nua, che x0 ∈ (a, b), e che f sia derivabile in (a, x0 ) ∪ (x0 , b). Se

lim f 0 (x) = λ− 6= λ+ = lim+ f 0 (x),


x→x−
0 x→x0

allora f non è derivabile in x0 .


Dim. Applichiamo il teorema di De l’Hospital ai due intervalli (a, x0 ) e (x0 , b).
Per definizione di derivata, dobbiamo controllare l’esistenza del limite
f (x) − f (x0 )
lim .
x→x0 x − x0
Tutte le ipotesi del teorema di De l’Hospital sono soddisfatte, in particolare
f 0 (x)
lim− = λ− ,
x→x0 1

f 0 (x)
lim+ = λ+ .
x→x0 1
Quindi
f (x) − f (x0 ) f 0 (x)
lim− = lim− = λ− ,
x→x0 x − x0 x→x0 1
mentre
f (x) − f (x0 ) f 0 (x)
lim+ = lim+ = λ+ .
x→x0 x − x0 x→x0 1
Il rapporto incrementale non possiede limite per x → x0 , e dunque f non è
derivabile in x0 .
In poche parole, l’unico caso in cui la Proposizione 6.21 non si inverte, è
esattamente quello dei nostri controesempi, in cui f 0 non possiede limite per
x → x0 .
Lo studente confronti anche la Proposizione VII.24 di [6].

Oltre alle consuete applicazioni al calcolo dei limiti, il teorema di De l’Ho-


spital è il fondamento di una fra le più eleganti tecniche di approssimazione
delle funzioni. Ce ne occupiamo nel prossimo paragrafo.
112 CAPITOLO 6. IL CALCOLO DIFFERENZIALE

6.10 Il polinomio di Taylor


È piuttosto ragionevole affermare, anche nell’era del calcolo automatizza-
to, che fare dei conti con i polinomi è più semplice che farli con funzioni
qualunque. Questa osservazione tanto ovvia ha permesso di gettare le basi
del calcolo approssimato. In questo corso toccheremo superficialmente due
metodi di approssimazione, il primo locale, il secondo globale.

In questo paragrafo, studieremo la possibilità di approssimare una fun-


zione molto regolare14 mediante polinomi opportuni. Ricordiamo che un
polinomio di grado n è per noi una funzione della fo rma

Pn (x) = a0 + a1 x + a2 x2 + a3 x3 + · · · + an−1 xn−1 + an xn ,

dove i numeri reali a0 , . . . an sono i coefficienti di Pn . Introduciamo infine la


cosiddetta notazione di Landau per i limiti.

Definizione 6.44. Siano f e g due funzioni definite almeno in un intorno


di a ∈ R. Diremo che f = o(g) (si legge f è o piccolo di g) per x → a se

f (x)
lim = 0.
x→a g(x)

Osservazione 6.45. Dalla definizione segue che la notazione “o piccolo”


indica in realtà un insieme di funzioni. Per essere precisi, data una funzione
g definita (almeno) in un intorno di un punto x0 , abbiamo definito l’insieme
 
f (x)
o(g) = f | lim =0 ,
x→a g(x)

dove abbiamo sottinteso che le funzioni f di questo insieme sono anch’esse


definite (almeno) in un intorno di x0 . A rigor di logica, dovremmo scrivere
f ∈ o(g) per x → x0 invece di f = o(g). Alcuni testi, ad esempio quello
di Mureşan [21], seguono questo approccio più rigoroso ma meno consue-
to. Questa notazione sarebbe più corretta, ma ha avuto storicamente minor
fortuna. 15
14
L’aggettivo “regolare” è spesso usato come abbreviazione per espressioni riguardanti
la derivabilità. Per noi, una funzione regolare è una funzione dotata di derivata prima,
seconda, terza, ecc. Il numero esatto delle derivate non conta molto, e verrà specificato
negli enunciati dei teoremi.
15
È un peccato, perché il simbolo di uguaglianza perde in questa situazione la proprietà
simmetrica: Se f = o(g), non è affatto vero che in generale g = o(f ). Insomma, bisogna
usare il simbolo = con grandissima cautela.
6.10. IL POLINOMIO DI TAYLOR 113

Osservazione 6.46. Se c’è un “o piccolo”, ci dovrebbe essere anche un “O


grande”, dirà qualche studente. È vero, e il simbolo di O grande si utilizza
per dire che una funzione è “controllata” da un’altra, sia dall’alto che dal
basso, nell’intorno di un punto. Precisamente, se f e g sono due funzioni
definite (almeno) in un intorno di x0 , si scrive f = O(g) per x → x0 quando
si vuole dire che esistono un intorno I di x0 ed una costante C > 0 tali che
1
|g(x)| ≤ |f (x)| ≤ C|g(x)| per ogni x ∈ I.
C
In altre parole, f = O(g) significa che il rapporto |f (x)/g(x)| si mantiene
limitato nelle vicinanze di x0 . Nel caso particolare in cui g è una funzione
costante,16 la scrittura f = O(g) significa esattamente che nelle vicinanze del
punto x0 la funzione f resta limitata. Per capirci, questo esclude la presenza
di un asintoto verticale in x0 . Non ci soffermiamo oltre su questo linguaggio,
che non useremo mai nel resto del corso. Per approfondimenti, il lettore
potrà consultare il classico libro di Prodi [22].
Scegliendo nella Definizione 6.44 come g la funzione costante ed uguale a
1, f = o(1) significa semplicemente che f (x) → 0 per x → a. Lo studente si
convinca che la definizione di derivata può essere riscritta
f (x) = f (x0 ) + Df (x0 )(x − x0 ) + o(x − x0 ) per x → x0
Definizione 6.47. Siano f e g due funzioni definite almeno in un intorno
del punto x0 . Diremo che g approssima f all’ordine n se f − g = o((x − x0 )n )
per x → x0 .
Esplicitamente, richiediamo che
f (x) − g(x)
lim = 0.
x→x0 (x − x0 )n
Un caso noto e particolarmente significativo è l’approssimazione all’ordine
1, chiamata anche approssimazione lineare. Ogni funzione derivabile in un
punto è approssimabile linearmente in tale punto, e la funzione che realiz-
za l’approssimazione è la funzione lineare affine rappresentata dalla retta
tangente nel punto.
D’altronde, senza ulteriori condizioni dobbiamo aspettarci una gran quan-
tità di funzioni approssimanti. Per esempio, la funzione quadratica f : x 7→ x2
è approssimata linearmente in x0 = 0 da qualunque funzione g : x 7→ αxn ,
con α ∈ R e n ≥ 2. Infatti
x2 − αxn
lim = lim x − αxn−1 = 0.
x→0 x x→0
16
Qui non importa il valore di tale costante.
114 CAPITOLO 6. IL CALCOLO DIFFERENZIALE

Però abbiamo già imparato che la retta tangente è l’unica retta che approssi-
ma linearmente una funzione derivabile in un dato punto. Poniamo dunque
il seguente problema: determinare, se esiste, un polinomio di grado n che
approssima una funzione all’ordine n nell’intorno di un punto x0 .
Procediamo per passi successivi, chiamando f la funzione da approssimare
e supponendo x0 = 0. Il caso di x0 qualunque verr à discusso fra poco. Per
n = 1 sappiamo già che l’unico polinomio cercato è

P1 (x) = f (0) + Df (0)x.

Per n = 2, la cosa migliore è scrivere il generico polinomio di secondo grado

P2 (x) = a0 + a1 x + a2 x2

e imporre la condizione di approssimazione:

f (x) − P2 (x)
lim = 0.
x→0 x2
Il denominatore tende a zero, il numeratore a f (0) − a0 . Quindi è necessario
che a0 = f (0). Il limite si riscrive

f (x) − f (0) − a1 x − a2 x2
lim = 0.
x→0 x2
Possiamo applicare la regola di De l’Hospital, e ci riconduciamo al limite del
quoziente delle derivate

Df (x) − a1 − 2a2 x
lim .
x→0 2x
La speranza è che tale limite valga zero, e come prima è necessario che
Df (0) = a1 . Applicando una seconda volta la regola di De l’Hospital, trovia-
mo la condizione necessaria D2 f (0) = 2a2 . Se un polinomio approssimante
c’è, l’unica possibilità è che

1
P2 (x) = f (0) + Df (0)x + D2 f (0)x2 .
2
Lasciamo allo studente la verifica banale che questo P2 è effettivamente
un’approssimazione di ordine 2 di f in x0 = 0. Con la notazione di Landau,

1
f (x) = f (0) + Df (0)x + D2 f (0)x2 + o(x2 ).
2
6.10. IL POLINOMIO DI TAYLOR 115

Se avessimo scelto un punto x0 anche diverso da zero, la conclusione sarebbe


stata analoga ma un po’ meno trasparente. Il “trucco” consiste nello scrivere
il generico polinomio nella forma

P2 (x) = a0 + a1 (x − x0 ) + a2 (x − x0 )2 .

I valori per i tre coefficienti a0 , a1 e a2 sarebbero stati gli stessi. Applicando


più volte l’argomento del teorema di De l’Hospital, si dimostra il seguente
risultato.

Teorema 6.48 (Taylor). Sia f : (a, b) → R una funzione derivabile n volte,


e sia x0 ∈ (a, b) un punto fissato. Allora esiste uno ed un solo polinomio Pn
di grado (al più) n, che approssima f in x0 con ordine n. I coefficienti di Pn
sono
1
a0 = f (x0 ), ak = Dk f (x0 ) per k ≥ 1,
k!
e conseguentemente
n
X 1 k
Pn (x) = f (x0 ) + D f (x0 )(x − x0 )k .
k=1
k!

P
Notazione. Il simbolo è quello della sommatoria. Dato un insieme finito
di numeri reali {p1 , p2 , . . . , pn }, scriviamo
n
X
pk = p1 + p2 + · · · + pk .
k=1

Forse qualche lettore avrà sentito parlare della possibilità di sommare infiniti
numeri reali, l’operazione alla base della teoria delle serie numeriche. Questo
argomento esula
P dal programma del nostro corso. In ogni caso, il simbolo di
sommatoria è solo un’abbreviazione comoda sommare una quantità finita
di numeri.

Il bello della matematica è che, a parole, tutto è semplice. Adesso che


abbiamo definito il polinomio di Taylor, calcolarlo è concettualmente una
sciocchezza. Abbiamo infatti la “ricetta” che ci restituisce meccanicamente
tutti i coefficienti. Basta saper calcolare le derivate. In alcuni casi, tali calcoli
sono davvero facilissimi. Ad esempio, il polinomio di Taylor di una funzione
polinomiale è evidentemente la funzione stessa. Non c’è neanche bisogno di
fare calcoli, dato che basta inserire Pn = f nella definizione del polinomio di
approssimazione.
116 CAPITOLO 6. IL CALCOLO DIFFERENZIALE

Calcoliamo i primi tre termini del polinomio di Taylor della funzione


1
f (x) =
1 − x − x2
con punto iniziale x0 = 0. Ci servono le prime due derivate di f :
1 + 2x
Df (x) =
(1 − x − x2 )2
2(1 − x − x2 )2 + 2(1 + 2x)2 (1 − x − x2 )
D2 f (x) =
(1 − x − x2 )4
Quindi
1
P2 (x) = f (0) + Df (0)x + D2 f (0)x2 = 1 + x + 2x2 ,
2
2 2
e perciò f (x) = 1 + x + 2x + o(x ) per x → 0. Osserviamo che l’approssi-
mazione ottenuta vale solo per x in un intorno di x0 = 0, e lo studente deve
rifuggire la tentazione di estendere questa approssimazione a valori diversi di
x.

Giunti fin qui, ci resta un dubbio: è possibile stimare l’errore compiuto


con la sostituzione di Pn al posto di f ? Abbiamo visto che tale errore deve
tendere a zero più velocemente di (x − x0 )n , per x → x0 . Ma di funzioni
che tendono a zero è pieno il mondo. Sarebbe bello poter scrivere in termini
più espliciti tale errore. Per il momento ci limitiamo al prossimo risultato.
Quando avremo anche gli integrali definiti nella nostra cassetta degli attrezzi,
potremo dare una stima d iversa e spesso più utile.
Teorema 6.49 (Formula di Taylor con resto di Lagrange). Supponiamo che
f : [a, b] → R. Sia n ∈ N e supponiamo che la derivata (n − 1)–esima Dn−1 f
sia una funzione continua in (a, b) e che Dn f (x) esista per ogni x ∈ (a, b).
Siano x, x0 ∈ [a, b] due punti distinti, e sia Pn−1 il polinomio di Taylor di f
centrato nel punto x0 di ordine n − 1. Allora esiste un punto ξ compreso fra
x0 e x tale che
Dn f (ξ)
f (x) = Pn−1 (x) + (x − x0 )n .
n!
Dim. Sia M quell’unico numero reale tale che f (x) = Pn−1 (x) + M (x − x0 )n .
Definiamo la funzione g : (a, b) → R come
g(t) = f (t) − Pn−1 (t) − M (t − x0 )n .
Vogliamo dimostrare che esiste ξ compreso fra x0 e x tale che n!M = Dn f (ξ).
Derivando ripetutamente la funzione g, troviamo che
Dn g(t) = Dn f (t) − n!M.
6.10. IL POLINOMIO DI TAYLOR 117

Ci basta allora dimostrare che Dn g si annulla fra x0 e x. Poiché


Dk Pn−1 (x0 ) = Dk f (x0 )
per k = 0, . . . , n − 1, abbiamo
g(x0 ) = Dg(x0 ) = · · · = Dn−1 g(x0 ) = 0.
La nostra scelta di M implica g(x) = 0, e applicando il teorema di Lagrange
in [x0 , x] deduciamo l’esistenza di x1 ∈ [x0 , x] tale che Dg(x1 ) = 0. Poiché
Dg(x0 ) = 0 lo stesso teorema applicato in [x0 , x1 ] garantisce l’esistenza di
x2 in tale intervallo con Dg(x2 ) = 0. Dopo n passi, troviamo infine un
punto xn = ξ ∈ [x0 , xn−1 ] tale che Dn g(ξ) = 0. Poiché xn−1 è compreso per
costruzione fra x0 e x, la dimostrazione è conclusa.
Un invito alla calma. Lo studente deve osservare con attenzione che la
formula di approssimazione dell’ultimo teorema è
Dn f (ξ)
f (x) = Pn−1 (x) + (x − x0 )n .
n!
C’è un’apparente sfasatura negli indici: infatti per il termine finale
Dn f (ξ)
(x − x0 )n = o((x − x0 )n−1 ).
n!
Ma questo non è in contraddizione con la formula ricavata precedentemente.
Per avere un’approssimazione lineare dobbiamo scegliere n = 2 nell’ultimo
teorema. Non è il massimo della comodit à, ma da un punto di vista teorico
ci sembra meglio privilegiare il ruolo della regolarità di f . Se la formula di
Taylor con il resto “o piccolo” richiede n derivate per avere un’approssima-
zione all’ordine n, la formula con il resto di Lagrange richiede n + 1 derivate,
per avere lo stesso ordine di appross imazione. Per avere l’approssimazione
lineare con resto “o piccolo”, basta che la funzione sia derivabile. Se però
vogliamo la stima del resto del tipo
D2 f (ξ)
(x − x0 )2 ,
2!
chiaramente f deve avere due derivate. Lo studente non farà fatica a ricono-
scere come caso particolare del Teorema 6.49 proprio il teorema di Lagrange
(n = 1).

Uno degli usi più frequenti delle formule di Taylor è il calcolo dei limiti.
Supponiamo di voler calcolare il limite
ex − 1 − x
lim .
x→0 x2
118 CAPITOLO 6. IL CALCOLO DIFFERENZIALE

È una forma di indecisione evidente, e nessun limite notevole può risolverla


senza fare ulteriori indagini. Ma se ricordiamo la formula di Taylor per la
funzione esponenziale e la definizione di “o piccolo”, possiamo scrivere

ex − 1 − x 1 + x + x2 + o(x2 ) − 1 − x o(x2 )
= = 1 + →1
x2 x2 x2

per x → 0. Una via alternativa17 consiste nell’applicare due volte la regola


di De l’Hospital. Lasciamo allo studente i dettagli relativi.
Qualche studente intraprendente potrebbe credere che i principali limiti
possano essere dedotti dagli sviluppi di Taylor. Purtroppo, tali deduzioni
sarebbero quasi certamente scorrette da un punto di vista logico. Pensiamo
al famoso limite
sin x
lim = 1. (6.7)
x→0 x

Se usiamo lo sviluppo di Taylor sin x = x − 3!1 x3 + o(x3 ), arriviamo immedia-


tamente al risultato. Ma calcolare il polinomio di Taylor richiede il calcolo
delle derivate. Come si calcola la derivata della funzione seno in x = 0?
Facendo il limite del rapporto incrementale:

sin x − sin 0 sin x


lim = lim .
x→0 x−0 x→0 x

C’è qualcosa che non va: stiamo calcolando un limite notevole, ma abbia-
mo bisogno di conoscerlo prima di calcolarlo. Questo apparente paradosso
dovrebbe farci riflettere sull’importanza di costruire una casa partendo dalle
fondamenta, e non dal primo piano. Dando per scontata la definizione “in-
genua” delle funzioni goniometriche seno e coseno, prima dobbiamo calcolare
i limiti notevoli, e solo poi possiamo calcolare le derivate. Quelle noiose di-
suguaglianze geometriche che costituiscono la dimostrazion e elementare del
limite notevole (6.7) non sembrano facilmente evitabili.18
Infine, proponiamo un’applicazione della formula di Taylor al’analisi dei
punti critici.
17
Alternativa per modo di dire. Il polinomio di Taylor è sostanzialmente equivalente
all’uso di De l’Hospital, come visto. Se dovessimo calcolare ogni volta i coefficienti del
polinomio, tanto varrebbe usare De l’Hospital. Fortunatamente esistono le tabelle degli
sviluppi di Taylor per le principali funzioni, e il loro uso riduce sensibilmente la mole
di calcoli necessaria per calcolare molti limiti in forma indeterminata. Ovviamente, molti
software sono capaci di scrivere i polinomi di Taylor di funzioni arbitrarie in pochi secondi.
18
I matematici puri danno spesso definizioni più raffinate per la funzione seno, e questo
permette di calcolarne la derivata seguendo strade diverse. Purtroppo, nell’economia di
un primo corso di matematica questi escamotages sono troppo complicati.
6.10. IL POLINOMIO DI TAYLOR 119

Proposizione 6.50. Sia f : (a, b) → R una funzione derivabile n volte in


(a, b). Inoltre sia

Df (x0 ) = D2 f (x0 ) = · · · = Dn−1 f (x0 ) = 0, Dn f (x0 ) 6= 0.

Allora

1. se n è pari e Dn f (x0 ) > 0, x0 è un punto di minimo;

2. se n è pari e Dn f (x0 ) < 0, x0 è un punto di massimo;

3. se n è dispari, x0 non è né un punto di massimo né un punto di minimo.

Dim. Tutte le affermazioni discendono dal teorema di Taylor. Infatti, per


ipotesi si può scrivere

Dn f (x0 )
f (x) = f (x0 ) + (x − x0 )n + o((x − x0 )n )
n!
per x → x0 . Se n è pari, allora, in un intorno di x0 , f (x) − f (x0 ) ha lo stesso
segno di Dn f (x0 ), e si conclude. Se n è dispari, in ogni intorno di x0 ci sono
punti x in cui f (x) − f (x0 ) è positivo, e altri punti in cui la stessa quantità
è negativa. Pertanto, x0 non è né u massimo né un minimo relativo.
La proposizione precedente gode di una certa popolarità soprattutto nei
testi di matematica per le scuole superiori. In effetti, quasi tutte le tecniche
meccaniche, che richiedono tanti calcoli e poco ragionamento, sembrano avere
grande fortuna nell’insegnamento secondario.
Tuttavia, il calcolo delle derivate successive può essere fonte di banali er-
rori di calcolo; conviene allora cercare di studiare il segno della derivata prima
attorno a x0 , per applicare il criterio di monotonia descritto in precedenza.
Fra l’altro, esistono funzioni “maleducate” alle quali la Proposizione di-
mostrata adesso non si applica. Per esempio, la funzione P : R → R definita
da19 (
exp(−1/x2 ), x 6= 0
P (x) =
0 x=0
ha un evidente minimo in x = 0. Tuttavia si potrebbe dimostrare che per
ogni j ∈ N
Dj P (0) = 0.
A parole, tutte le derivate di P calcolate in x = 0 sono nulle! Non c’e’ speran-
za di descrivere la natura dell’origine mediante la Proposizione. Senza voler
19
P è l’iniziale di “piatta”.
120 CAPITOLO 6. IL CALCOLO DIFFERENZIALE

essere rigorosi, potremmo dire che P è “indefinitamente piatta” nell’origine.


L’andamento qualitativo di P è evidenziato nella prossima figura.

0.35

0.3

0.25

0.2

0.15

0.1

0.05

–1 –0.8 –0.6 –0.4 –0.2 0 0.2 0.4 0.6 0.8 1


x
Capitolo 7

Teoria dell’integrazione secondo


Riemann

Ogni studente universitario ha, o dovrebbe avere, una certa familiarità con
il calcolo di aree e volumi. A livello elementare, diciamo fino alle scuole
superiori, si impara a misurare perimetri, aree e volumi di speciali figure geo-
metriche. Fra queste compaiono i quadrilateri, i triangoli, i parallelepipedi,
e così via. Già la lunghezza della circonferenza pone diversi problemi tecni-
ci, generalmente superati d’autorità insegnando che la circonferenza unitaria
misura 2π.1 Sorvolando sulla definizione stessa di π, che spesso si dice valere
circa 3.14 senza altri particolari, la misurazione della lunghezza della cir-
conferenza è resa attraente mediante il classico trucco dello spago arrotolato
attorno alla circonferenza.
Con le aree, la faccenda si fa ancora più spinosa. Infatti, se ci può sem-
brare intelligente ed anche intuitivo dire che il rettangolo di lati a e b ha
un’area pari a ab (base × altezza), ben più inquietante è l’affermazione che
il cerchio di raggio r ha un’area pari a πr2 (raggio × raggio × 3.14). Qui
non c’è più lo spago da arrotolare. Nei casi più fortunati, impariamo che la
misura dell’area del cerchio si ottiene inscrivendo in esso poligoni regolari con
un numero sempre maggiore di lati, e facendo tendere all’infinito il numero
di lati. L’area del cerchio sarà allora il limite, per n → +∞, dell’area del
poligono regolare di n lati inscritto.
Ancora più in generale, consideriamo una funzione f : [a, b] → R, positiva
e continua. Nel piano cartesiano, il suo grafico y = f (x) rappresenta una
curva continua: che significato potremmo dare all’area di piano che giace
fra l’asse delle x e il grafico della funzione? Non è facile dare una risposta
1
Ovviamente, occorrerebbe specificare un’unità di misura: metri, centimetri,
chilometri.

121
122 CAPITOLO 7. INTEGRALE DI RIEMANN

completamente comprensibile da uno studente di terza media. Fu solo nel


corso del XVIII secolo che celebri matematici di nome Chauchy, Riemann,
ecc. furono in grado di introdurre una teoria potente e compatibile con
l’intuizione stessa di area.
Nelle sezioni seguenti presenteremo un approccio ormai classico all’inte-
grazione secondo Riemann. Seguiamo da vicino [24] e l’appendice di [25].
Non è d’altronde l’unico approccio possibile, e infatti in [6, 13] lo studente
può trovare presentazioni diverse dalla nostra. In [5], la teoria dell’integrale
non è veramente svolta, tranne per le funzioni continue.

Osservazione 7.1. Per molti decenni, i primi corsi di analisi matematica


per gli studenti di Scienze ed Ingegneria presentavano una teoria ristretta
dell’integrazione, dovuta a L. A. Cauchy. Si introduce un integrale definito
che esiste in generale solo sotto l’ipotesi di continuità; quindi è uno strumento
meno potente di quello che vedremo nelle prossime pagine, sebbene abbia il
pregio della maggior semplicità.

Avvertenza. In queste note, abbiamo deciso di trattare la cosiddetta inte-


grazione indefinita solo marginalmente in un paragrafo successivo. Riteniamo
infatti che la ricerca delle primitive sia una questione di esercizio, più che di
teoria. Sul mio libro di quinta liceo scientifico,2 l’Autore scriveva che “tutta
la teoria dell’integrale indefinito consiste di una definizione e di una decina
di integrali immediati”. La definizione è ovviamente quella di primitiva. Si
usa dire che alla base di tale teoria stia la necessità di invertire l’operazione
di derivazione. Data una funzione, vorremmo scriverne (almeno) un’altra la
cui derivata coincida con la funzione assegnata. Problema legittimo e al-
quanto interessante, che si risolve comunque in una definizione, un paio di
osservazioni e due regolette. Tutto il resto è esercizio. Ci piacerebbe che
lo studente prendesse consapevolezza di un fatto: in matematica la teoria
dell’integrazione è quella definita.

7.1 Partizioni del dominio


Situazione: abbiamo una funzione f : [a, b] → R, limitata, definita sull’inter-
vallo chiuso e limitato [a, b].

Osservazione 7.2. L’ipotesi di limitatezza della funzione f sarà tacitamente


mantenuta in tutto la trattazione dell’integrazione secondo Riemann. Nella
sezione dedicata agli integrali impropri e generalizzati vedremo fino a che
2
R. Ferrauto, Lezioni di Analisi Matematica. Casa editrice Dante Alighieri.
7.1. PARTIZIONI DEL DOMINIO 123

punto sia possibile parlare di integrazione definita per funzioni non limitate.
Ovviamente, l’ipotesi di limitatezza potrebbe essere rimossa fin dall’inizio
facendo ricorso all’integrazione secondo Lebesgue.

Definizione 7.3. Una partizione di [a, b] è un insieme finito di punti P =


{x0 , x1 , . . . , xn } tali che

a = x0 < x1 < x2 < · · · < xn−1 < xn = b.

Una partizione P 0 è più fine di P se contiene più punti di P . Date due


partizioni P e P 0 , il loro raffinamento comune è la partizione P ? = P ∪ P 0 .

Osservazione 7.4. Poiché le partizioni sono semplici insiemi, ad esse si ap-


plicano tutte le consuete operazioni fra insiemi: unioni, intersezioni, ecc.
Nei fatti, il raffinamento comune di due partizioni si ottiene mettendo in-
sieme i punti di entrambe, e ovviamente disponendoli in ordine crescente di
grandezza.

Definizione 7.5. L’ampiezza di una partizione P si definisce come

σ(P ) = max |xi − xi−1 |.


i=1,...,n

Notazione. Se P = {x0 , x1 , . . . , xn } è una partizione di [a, b], si pone

∆xi = xi − xi−1 .

In corrispondenza di una partizione P , introduciamo due approssimazioni,


l’una per difetto e l’altra per eccesso, dell’area sottesa dal grafico di f e
dall’asse delle ascisse. Per ogni i ∈ {0, 1, . . . , n}

mi = inf f (x), Mi = sup f (x). (7.1)


xi−1 ≤x≤xi xi−1 ≤x≤xi

La limitatezza di f garantisce ovviamente che mi e Mi sono numeri reali, cioè


−∞ < mi ≤ Mi < +∞. È chiaro che questa conclusione diviene falsa senza
ipotesi di limitatezza. Se, per esempio, f avesse un asintoto verticale x = x0
interno all’intervallo [a, b], almeno uno fra mi e Mi diventerebbe infinito per
ogni partizione contenente il punto x0 .
Siano ora
n
X n
X
L(P, f ) = mi ∆xi , U (P, f ) = Mi ∆xi .
i=1 i=1
124 CAPITOLO 7. INTEGRALE DI RIEMANN

Geometricamente, L(P, f ) è la somma delle aree dei rettangoli di base ∆xi e


di altezza mi , che rappresentano i rettangoli inscritti fra l’asse delle ascisse
e il grafico di f . Analogamente, i rettangoli di base ∆xi e altezza Mi sono
circoscritti al grafico di f . Intuitivamente, L(P, f ) è un’approssimazione per
difetto dell’area sottesa dal grafico di f , mentre U (P, f ) è un’approssimazione
per eccesso della stessa area.
Definizione 7.6. Il numero
Z b
f (x) dx = sup L(P, f )
a P

prende il nome di integrale inferiore di f su [a, b]. Analogamente, il numero


Z b
f (x) dx = inf U (P, f )
a P

prende il nome di integrale superiore di f esteso ad [a, b].


Rb Rb
Segue dall’ovvia relazione L(P, f ) ≤ U (P, f ) che a f (x) dx ≤ a f (x) dx.
Inoltre, la limitatezza di f implica che i due integrali inferiore e superiore
sono sempre numeri reali finiti. Infatti, da m ≤ f (x) ≤ M per ogni x ∈ [a, b]
discende che
−∞ < m(b − a) ≤ L(P, f ) ≤ U (P, f ) ≤ M (b − a) < +∞
per ogni partizione P . La conclusione segue prendendo l’inf e il sup al variare
delle partizioni P .
Definizione 7.7. Una funzione f : [a, b] → R è integrabile secondo Riemann
Rb Rb
se a f (x) dx = a f (x) dx. In questo caso il valore comune dei due integrali
inferioreRe superiore prendo il nome di integrale definito di f , e si denota col
b
simbolo a f (x) dx.
Osservazione. RIn queste note, abbiamo privilegiato la notazione tipica R b dei
b
libri di Calcolo a f (x) dx invece di quella, logicamente più coerente, a f .3
In effetti, dalle nostre definizioni consegue che solo f e l’intervallo [a, b] so-
no coinvolti nella definizione di integrale. La variabile x è perfettamente
superflua. Tuttavia, capita spesso di scrivere espressioni quali
Z 1
1
x2 dx = .
0 3
3
Rb Rb
Capita di veder scritto a f (x) dx, I(f, a, b), oppure a dx f (x). Quest’ultima
notazione, a mio parere detestabile, è particolarmente popolare nei libri di fisica.
7.1. PARTIZIONI DEL DOMINIO 125

Un attimo di riflessione ci convince che quella appena scritta è un’inesattezza


paragonabile a
d 3
x = 3x2 .
dx
Sarebbe una battaglia persa convincere che la scrittura corretta è più o meno
d
(t 7→ t3 )(x) = 3x2 .
dx
C’è stato qualche coraggioso che ha tentato di introdurre nell’Analisi mate-
matica elementare queste notazioni,R ma ormai nessuno ne ricorda il nome!
b Rb
Morale della favola, i simboli a f (x) dx e a f (y) dy rappresentano il
medesimo ente matematico.

Proposizione 7.8. Sia P una partizione, e sia P 0 più fine di P . Allora


L(P 0 , f ) ≥ L(P, f ), e U (P 0 , f ) ≤ U (P, f ).

Dim. Cominciamo a supporre che P 0 contenga esattamente un punto più di


P . Se x̄ è questo punto, esiste un indice i tale che xi−1 < x̄ < xi , dove xi−1
e xi sono due punti consecutivi di P . Posto

w1 = inf f (x), w2 = inf f (x),


xi−1 ≤x≤x̄ x̄≤x≤xi

è chiaro che w1 ≥ mi e w2 ≥ mi . Quindi

L(P 0 , f ) − L(P, f ) = w1 (x̄ − xi−1 ) + w2 (xi − x̄) − mi (xi − x̄ + x̄ − xi−1 )


= (w1 − mi )(x̄ − xi−1 ) + (w2 − mi )(xi − x̄) ≥ 0.

Un ragionamento del tutto analogo mostra che U (P 0 , f ) ≤ U (P, f ). Se poi


P 0 contiene un numero k > 1 di punti più di P , basta ripetere k volte il
discorso appena visto.
La definizione di integrale appena introdotta non è molto significativa ri-
spetto al calcolo effettivo degli integrali definiti. Inoltre, non abbiamo ancora
costruito una classe maneggevole di funzioni che possono essere integrate.
Quest’affermazione non dovrebbe più sorprendere lo studente: sappiamo già
che solo alcune funzioni sono continue, altre sono derivabili. Certamente non
possiamo aspettarci che “tutte” le funzioni siano integrabili.
Quella che segue è una caratterizzazione molto forte dell’integrabilit à.
Essendo una condizione necessaria e sufficiente per l’integrabilità, sarà pos-
sibile utilizzarla in maniera del tutto equivalente alla definizione di integra-
bilità.
126 CAPITOLO 7. INTEGRALE DI RIEMANN

Teorema 7.9. Una funzione limitata f : [a, b] → R è integrabile se e solo se,


per ogni ε > 0 esiste una partizione Pε tale che

U (Pε , f ) − L(Pε , f ) < ε. (7.2)


Rb
Rb
Dim. Per ogni partizione P , è L(P, f ) ≤ a
f (x) dx ≤ a
f (x) dx ≤ U (P, f ).
Rb Rb
Se vale la (7.2), allora deduciamo che 0 ≤ a f (x) dx − a f (x) dx < ε, e
Rb Rb
l’arbitrarietà di ε garantisce che a f (x) dx = a f (x) dx. Questo significa che
f è integrabile.
Viceversa, supponiamo che f sia integrabile. Fissato ε > 0, esistono due
partizioni Pq e P2 tali che
b b
ε ε
Z Z
U (P2 , f ) − f (x) dx < , f (x) dx − L(P1 , f ) < .
a 2 a 2

Se P ? è il raffinamento comune di P1 e P2 , allora U (P ? , f ) − L(P ? , f ) < ε, e


possiamo scegliere pertanto Pε = P ? .

La condizione (7.2) sarà quella che verificheremo sistematicamente per


controllare l’integrabilità delle funzioni. Prima di proseguire, vogliamo però
dare un’interpretazione più intuitiva dell’integrale di Riemann. Per quanto
ne sappiamo finora, per calcolare l’integrale di una data funzione, dovremmo
calcolare un estremo inferiore ed un estremo superiore al variare di tutte
le possibili partizioni dell’intervallo [a, b]. Non è né comodo, né intuitivo.
Vedremo fra un attimo che l’inte grale è in realtà un limite di aree di rettangoli
al tendere a zero della lunghezza delle basi dei rettangoli.

Definizione 7.10. Sia P = {x0 , . . . , xn } una partizione di [a, b]. Una somma
di Riemann per la funzione limitata f su [a, b] è una somma del tipo
n
X
Σ(P, f ) = f (ti )∆xi ,
i=1

dove ti ∈ [xi−1 , xi ] è un punto qualsiasi nell’intervallino [xi−1 , xi ].

Il teorema che segue permette di vedere l’integrale come un’operazione di


limite.

Teorema 7.11. Una funzione limitataRf è integrabile se e solo se esiste finito


b
limσ(P )→0 Σ(P, f ). In tal caso, risulta a f (x) dx = limσ(P )→0 Σ(P, f ).
7.1. PARTIZIONI DEL DOMINIO 127

Dim. Supponiamo dapprima che A = limσ(P )→0 Σ(P, f ) esista finito. Fissato
ε > 0, esiste δ > 0 tale che σ(P ) < δ implica, per ogni scelta di t1 , . . . , tn ,
ε ε
A− ≤ Σ(P, f ) ≤ A + .
2 2
Sia P una partizione qualsiasi, con σ(P ) < δ. Facendo assumere a t1 , . . . , tn
tutti i valori possibili e passando all’estremo inferiore e superiore delle corri-
spondenti somme di Riemann, si ha

inf Σ(P, f ) = L(P, f ),


t1 ,...,tn
sup Σ(P, f ) = U (P, f ).
t1 ,...,tn

e quindi
ε ε
A− ≤ L(P, f ) ≤ U (P, f ) ≤ A + .
2 4
Rb
Ma allora f è integrabile, ed anzi A = a f (x) dx per l’arbitrarietà di ε.
Viceversa, sia ε > 0 fissato. Esiste una partizione P 0 tale che U (P 0 , f ) ≤
Rb
a
f (x) dx + 2ε . Supponiamo che P 0 sia costituita da n + 1 punti e quindi
divida [a, b] in n intervalli. Siano
ε
M = sup |f (x)|, 0 < δ1 < .
x∈[a,b] 8M n

Consideriamo una partizione P tale che σ(P ) < δ1 , e denotiamo con P ? il


raffinamento comune a P 0 e P . Allora

U (P, f ) = U (P, f ) − U (P ? , f ) + U (P ? , f ) ≤ U (P, f ) − U (P ? , f ) + U (P 0 , f )


Z b
? ε
≤ U (P, f ) − U (P , f ) + + f (x) dx.
4 a

I punti di P 0 interni a intervalli di P sono al massimo n − 1, e quindi


n−1ε ε
U (P, f ) − U (P ? , f ) ≤ (n − 1) · 2M δ1 < < .
n 4 4
Quindi
b
ε
Z
U (P, f ) ≤ + f (x) dx
2 a
per ogni partizione P con σ(P ) < δ. Analogamente si può provare che esiste
δ2 > 0 tale che per ogni partizione P con σ(P ) < δ2 risulta
Z b
ε
L(P, f ) ≥ f (x) dx − .
a 2
128 CAPITOLO 7. INTEGRALE DI RIEMANN

Se σ(P ) < δ = min{δ1 , δ2 }, allora


b b
ε ε
Z Z
f (x) dx − ≤ L(P, f ) ≤ U (P, f ) ≤ + f (x) dx.
a 2 2 a

Poiché L(P, f ) ≤ Σ(P, f ) ≤ U (P, f ), si ha


Z b

Σ(P, f ) − f (x) dx ≤ε

a

per ogni partizione P con σ(P ) < δ e per ogni scelta dei punti t1 , . . . , tn . Per
Rb
definizione, questo vuol dire che a f (x) dx = limσ(P )→0 Σ(P, f ).

Osservazione 7.12. Molte attribuzioni vengono fatte per la teoria dell’in-


tegrazione definita. L. A. Cauchy dimostrò che il limite delle somme di
Riemann al tendere a zero dell’ampiezza della partizione esiste finito per tut-
te le funzioni continue. Alcuni Autori chiamano pertanto integrale secondo
Cauchy quello costruito mediante il limite delle somme di Riemann applicate
a funzioni continue. L’estensione al caso delle funzioni limitate sembra essere
dovuta a Riemann, mentre l’approccio con gli integrali inferiore e superio-
re è dovuto al matematico francese Darboux. Come vedremo, tutte queste
“teorie” vengono a coincidere per la maggior parte delle funzioni elementari
e addirittura per tutte le funzioni (limitate) che possiedono un numero finito
di punti di discontinuità nell’intervallo di integrazione [a, b].

Calcolo di un integrale mediante la definizione. Usando la teoria


delle serie numeriche e il Teorema precedente, mostriamo come calcolare un
integrale definito. Seguendo l’esempio di Archimede, calcoliamo l’area del
segmento parabolico:
Z 1
S= x2 dx.
0

Fissato arbitrariamente n ∈ N, consideriamo la partizione equi-distribuita

0 1 2 n−1 n
0= < < < ... < < = 1.
n n n n n

Dando per scontato che la funzione x 7→ x2 sia integrabile in [0, 1], il Teorema
precedente garantisce che la somma di Riemann
n  2
X k−1 1
Sn =
k=1
n n
7.1. PARTIZIONI DEL DOMINIO 129

converge al valore S dell’integrale cercato per n → +∞. Per calcolare Sn ,


osserviamo che
n
1 X 2 1 2 2 2 2

Sn = (k − 1) = 1 + 2 + 3 + . . . + (n − 1) ,
n3 k=1 n3

e dunque ci serve un’espressione chiusa per la somma dei quadrati dei primi
n − 1 numeri naturali. La formula per questa espressione è nota, ma non è
molto intuitiva. L’espressione chiusa è
 
1 1 3 1 2 1
Sn = 3 n − n + n .
n 3 2 6
Per quanto detto sopra,
Z 1
1
x2 dx = lim Sn = .
0 n→+∞ 3
È piuttosto sorprendente che questo risultato, ottenuto praticamente con lo
stesso ragionamento esposto, fosse noto già nell’antica Grecia!
La verifica dell’integrabilità della funzione x 7→ x2 è contenuta nel pros-
simo Teorema.

Una prima classe di funzioni certamente integrabili è quella delle funzioni


monotone (crescenti oppure decrescenti).
Teorema 7.13. Sia f : [a, b] → R una funzione monotona e limitata. Allora
f è integrabile.
Dim. Dimostriamo l’enunciato nel caso in cui f sia monotona crescente.
Prendiamo ε > 0 arbitrariamente piccolo, e sia n un numero naturale mag-
giore di (f (b) − f (a))(b − a)/ε. Consideriamo i punti equispaziati (nel senso
che ∆xi = xi − xi−1 = (b − a)/n per ogni valore dell’indice i)
b−a
xi = a + i, i = 0, . . . , n.
n
La partizione P = {xi }i=0,...,n verifica la condizione (7.2). Infatti, con ovvio
significato dei simboli,
n n
X X b−a
U (P, f ) − L(P, f ) = (Mi − mi )∆xi = (f (xi+1 ) − f (xi ))
i=0 i=0
n
n
b−aX b−a
= (f (xi+1 ) − f (xi )) = (f (b) − f (a)) < ε.
n i=0 n
130 CAPITOLO 7. INTEGRALE DI RIEMANN

Dunque f è integrabile su [a, b]. Il caso in cui f sia decrescente è analogo.


Di più, si deduce dal caso già dimostrato: infatti se f decresce, allora −f
cresce. Poiché è evidente che una funzione f è integrabile se e solo se lo è
−f , abbiamo concluso.
Osservazione.
Rb Il teorema precedente non dà informazioni di alcun tipo sul
valore di a f (x) dx. Ci dice soltanto che questo integrale di Riemann esiste.

Come sappiamo, una funzione monotona non è necessariamente una fun-


zione continua. Si potrebbe dimostrare che non può essere “troppo” discon-
tinua, ma questo va oltre gli scopi del nostro corso. Quindi, l’integrabilità
delle funzioni continue non è un caso particolare del teorema sulle funzioni
monotone. Purtroppo la dimostrazione che tutte le funzioni continue sono
integrabili richiede qualche fatica aggiuntiva.

7.2 La continuità uniforme e l’integrazione del-


le funzioni continue
Ripensiamo alla definizione di continuità: una funzione f è continua nel
punto x0 se per ogni ε > 0 esiste δ > 0, dipendente da ε e da x0 , tale che
|x − x0 | < δ implichi |f (x) − f (x0 )| < ε. Pensiamo alla continuità della
funzione x 7→ x2 ; si riesce a determinare esplicitamente un δ che soddisfa
questa condizione, ma non si può pretendere che lo stesso δ vada bene per ogni
x0 .4 Decisamente diverso è il caso della funzione x 7→ x. Per questa funzione,
basta scegliere δ = ε, senza specificare in quale punto x0 stiamo verificando
la continuità. Questa proprietà è così importante che le si attribuisce un
nome speciale.

Definizione 7.14. Una funzione f : D ⊂ R → R è uniformemente continua


in D se per ogni ε > 0 esiste δ > 0 tale che |f (x1 ) − f (x2 )| < ε per ogni
scelta di x1 , x2 ∈ D tali che |x1 − x2 | < δ.

La continuità uniforme è un concetto diverso dalla semplice continuità:


la funzione exp : R → (0, +∞), definita da exp x = ex , non è uniformemente
continua in R. Infatti, negare la definizione di continuità uniforme significa
dimostrare che: esiste ε > 0 tale che, scelto arbitrariamente δ > 0, esistono
4
Scriviamo un cenno della dimostrazione. Sia x0 6= 0, e fissiamo ε > 0. Se δ < ε/(2|x0 |)
e |x − x0 | < δ, allora |x2 − x20 | = |(x − x0 )(x + x0 )| < δ · 2|x0 | < ε. È evidente che δ → 0
se |x0 | → +∞. Questo rende impossibile la scelta di δ indipendentemente dal punto x0 .
7.2. CONTINUITÀ UNIFORME 131

punti x1 e x2 ∈ D tali che |x1 − x2 | < δ ma |f (x1 ) − f (x2 )| ≥ ε. Ora, se


scegliamo δ > 0 abbastanza piccolo, e se poniamo x1 = δ + 1/δ e x2 = 1/δ,
ovviamente |x1 − x2 | = δ e
δ
1 1 e − 1

δ
| exp x1 − exp x2 | = e δ e − 1 = δe δ → +∞
δ

per δ → 0+ . Per questa ragione, la funzione continua exp non può essere
uniformemente continua in R. L’ostacolo che si è frapposto fra la continuità
e la continuità uniforme è stato la possibilità di far tendere x1 e x2 all’infinito
mentre δ → 0. Il prossimo risultato ci dice che tutte le funzioni continue su
un intervallo chiuso e limitato sono addirittura uniformemente continue.

Teorema 7.15. Tutte le funzioni continue, definite su un intervallo chiuso


e limitato della forma [a, b], sono uniformemente continue su tale intervallo.

Dim. Dimostreremo il teorema ragionando per assurdo. Se neghiamo la de-


finizione di continuità uniforme, arriviamo all’enunciato: esiste ε? > 0 ed
esistono due successioni {xn } ed {yn } di punti in [a, b] tali che limn→+∞ |xn −
yn | = 0 ma |f (xn ) − f (yn )| ≥ ε? . Ora, per il Teorema 3.28, esistono due
sottosuccessioni {xnk } di {xn } e {ynk } di {yn } tali che xnk → x∞ ∈ [a, b]
e ynk → y∞ ∈ [a, b] per k → +∞, ma |f (xn ) − f (yn )| ≥ ε? . L’ipotesi che
limn→+∞ |xn − yn | = 0 implica x∞ = y∞ , e la continuità di f implica che
f (xnk ) → f (x∞ ) e f (ynk ) → y∞ per k → +∞. Ma allora

0 < ε? ≤ lim |f (xnk ) − f (ynk )| = f (x∞ ) − f (y∞ ) = 0.


k→+∞

Questa catena assurda di disuguaglianze implica che era assurda la negazione


della continuità uniforme. Pertanto, f è uniformemente continua.

Osserviamo che la funzione x ∈ R 7→ x2 ∈ [0, +∞) non è uniformemente


continua, come si può verificare imitando il ragionamento utilizzato per la
funzione exp. Lo è invece ogni sua restrizione a intervalli chiusi e limitati.
Per inciso, questo dovrebbe convincere lo studente che l’insieme di defini-
zione di una funzione è tanto importante quanto la formula analitica che la
rappresenta.

Abbiamo ormai a nostra disposizione tutti gli ingredienti per formulare e


dimostrare un teorea di integrabilità per le funzioni continue su un intervallo.

Teorema 7.16. Una funzione continua f : [a, b] → R è integrabile.


132 CAPITOLO 7. INTEGRALE DI RIEMANN

Dim. Per il teorema UC di uniforme continuità, la funzione f è uniforme-


mente continua. Dato ε > 0, esiste δ > 0 tale che |f (x1 ) − f (x2 )| < ε/(b − a)
per ogni scelta di x1 , x2 ∈ [a, b] tali che |x1 − x2 | < δ. Sia P = {x0 , . . . , xn }
una partizione di ampiezza σ(P ) < δ. Allora

n
X
U (P, f ) − L(P, f ) = (Mi − mi )∆xi
i=1
n
X ε ε
≤ (xi − xi−1 ) = (b − a) = ε.
i=0
b−a b−a

ε
poiché |xi − xi−1 | < δ e di conseguenza Mi − mi < b−a . Abbiamo costruito
una partizione P che soddisfa la (7.2), dunque f è integrabile.

Più in generale, si dimostra il seguente risultato di integrabilità. Avvisia-


mo lo studente che la dimostrazione è abbastanza complicata.

Teorema 7.17. Una funzione limitata f : [a, b] → R, avente un numero


finito di punti di discontinuità, è integrabile.

Dim. Fissato arbitrariamente ε > 0, poniamo M = maxx∈[a,b] |f (x)| e sia E


l’insieme (costituito da un numero finito di elementi) dove f è discontinua.
Siccome E è un insieme finito, possiamo ricoprirlo con un numero finito di
intervalli aperti [uj , vj ] in modo che |vj −uj | < ε. Inoltre possiamo pensare di
posizionare questi intervalli in modo che ogni elemento dell’insieme E ∩ (a, b)
sia contenuto in qualche (uj , vj ). Rimuoviamo ora gli intervalli (uj , vj ) da
[a, b]. L ’insieme K che resta è chiuso e limitato. Quindi f è uniformemente
continua su K: esiste allora δ > 0 tale che |f (x) − f (y)| < ε se x, y ∈ K e
|x − y| < δ. Costruiamo adesso una partizione P di [a, b] come segue:

1. ogni uj ed ogni vj appartengono a P ;

2. nessun punto di (uj , vj ) appartiene a P ;

3. se xj non è uno dei punti uj , allora ∆xj < δ.

Osserviamo che Mi − mi ≤ 2M per ogni i, e che Mi − mi ≤ ε a meno che


xi−1 non sia uno dei punti uj . Pertanto

U (P, f ) − L(P, f ) ≤ (b − a)ε + 2M ε.

Dal momento che ε è arbitrario, abbiamo dimostrato l’integrabilit à di f .


7.2. CONTINUITÀ UNIFORME 133

Osservazione 7.18. Al di là dei tecnicismi, l’idea della dimostrazione può


essere riassunta così: si tolgono da [a, b] dei piccoli intorni di ogni punto di
discontinuità, e si osserva che le somme di Riemann si spezzano in due. Da
un lato le somme dove f risulta continua e quindi integrabile. Dall’altra le
somme relative ai piccoli intorni appena costruiti.

Ricordando che somme, prodotti, quozienti di funzioni continue sono an-


cora funzioni continue, alla luce del teorema di integrabilità per le funzioni
continue siamo spinti a credere che l’integrabilità rispetti le usuali operazio-
ni aritmetiche. Questo è vero, ma naturalmente richiede una dimostrazione
indipendente dalla continuità. Ci limitiamo all’enunciato preciso.

Teorema 7.19. Siano f e g due funzioni limitate, definite sull’intervallo


[a, b]. Se f e g sono integrabili, allora le funzioni f + g ed f g sono integrabili.
Per ogni costante reale c, la funzione cf è integrabile. Se g(x) 6= 0 per ogni
x ∈ [a, b], allora anche f /g è integrabile. Valgono inoltre le formule
Z b Z b Z b
f (x) + g(x) dx = f (x) dx + g(x) dx,
a a a
Z b Z b
cf (x) dx = c f (x) dx
Za b Z b a


f (x) dx ≤
|f (x)| dx.
a a

Dobbiamo rifuggire dalla tentazione di estendere al prodotto f g e al quo-


ziente f /g le formule di integrazione. Non è vero che l’integrale del prodotto
è il prodotto degli integrali! Gli esempi si sprecano, e li vedremo quan-
do sapremo come calcolare di fatto un integrale definito di una funzione
assegnata.
L’integrale di Riemann gode poi di una proprietà molto interessante:
l’additività rispetto al dominio di integrazione.

Proposizione 7.20. Sia f : [a, b] → R una funzione integrabile. Se c ∈ [a, b],


allora f è integrabile su [a, c] e su [c, b], e risulta
Z b Z c Z b
f (x) dx = f (x) dx + f (x) dx.
a a c

L’ultima operazione inportante da analizzare è quella di composizione. Si


preserva l’integrabilità componendo funzioni integrabili? Sì e no: la funzione
“esterna” deve essere almeno continua. Vale precisamente il seguente teorema.
134 CAPITOLO 7. INTEGRALE DI RIEMANN

Teorema 7.21. Sia f : [a, b] → R una funzione integrabile su [a, b], e suppo-
niamo che c ≤ f (x) ≤ d per ogni x ∈ [a, b]. Sia ϕ : [c, d] → R una funzione
continua. Allora la funzione composta ϕ ◦ f : [a, b] → R è integrabile su [a, b].
Deduciamo una conseguenza notevole: se f è positiva ed integrabile, an-
che ogni potenza ad esponente reale positivo di f è ancora integrabile. An-
che x 7→ ef (x) è integrabile. Lasciamo al lettore il piacere di costruirsi altri
corollari dei risultati precedenti sull’integrabilità.

7.3 Il teorema fondamentale del calcolo inte-


grale
Arriviamo così al momento più atteso da ogni studente: la “regoletta” per
calcolare gli integrali. In altri termini, la formula che esprime il legame fra
l’integrale definito e le primitive di una funzione assegnata. Ci arriveremo
con la dovuta calma, passando attraverso una formula “esplicita” per scrivere
le primitive di una funzione continua.
Teorema 7.22. Sia f : [a, b] → R una funzione limitata e integrabile. Allora
la funzione definita da
Z x
F (x) = f (t) dt, (a ≤ x ≤ b) (7.3)
a

è continua. Se f è continua nel punto x0 ∈ [a, b], allora F è derivabile in x0


e F 0 (x0 ) = f (x0 ).
Dim. Sia M = supx∈[a,b] |f (x)|. Allora, presi x < y in [a, b], abbiamo che
Z y Z y

|F (y) − F (x)| = f (t) dt ≤ |f (t)| dt ≤ M (y − x).
x x

Quindi F è addirittura uniformemente continua. Supponiamo che f sia con-


tinua in un certo x0 . Fissiamo ε > 0 e sappiamo che esiste δ > 0 tale che
|x − x0 | < δ implica |f (x) − f (x0 )| < ε. Allora, se |h| < δ,
Z x0 +h
F (x0 + h) − F (x0 ) 1
− f (x0 ) ≤
|f (t) − f (x0 )| dt ≤ ε,
h h x0
e questo dimostra che
F (x0 + h) − F (x0 )
F 0 (x0 ) = lim = f (x0 ).
h→0 h
La dimostrazione è conclusa.
7.3. TEOREMA FONDAMENTALE DEL CALCOLO 135

Abbiamo appena visto che tutte le funzioni continue su un intervallo


hanno una primitiva abbastanza esplicita, ottenibile mediante integrazione
definita. Sottolineiamo che non si può prescindere dalla continuità di f .
Infatti, prendiamo a = 0 e b = 2. La funzione discontinua
(
0 se 0 ≤ x ≤ 1
f (x) =
1 se 1 < x ≤ 2
Rx
definisce la funzione integrale F (x) = 0
f (t) dt mediante la formula
(
0 se 0 ≤ x ≤ 1
F (x) =
x − 1 se 1 < x ≤ 2.

Questa funzione F è continua, ma non è una primitiva di f . Infatti, la


derivata di F nel punto x = 1 non esiste, trattandosi di un punto angoloso.
Il risultato che segue, noto sotto il nome di Teorema di Torricelli– Barrow,
contiene un primo legame fra integrazione definita e integrazione indefinita.

Teorema 7.23. Sia f : [a, b] → R una funzione continua. Se F è una


primitiva di f , cioè F è derivabile in ogni punto e F 0 = f , allora
Z b
f (x) dx = F (b) − F (a).
a
Rx
Dim. Poniamo G(x) = a f (t) dt. Il teorema precedente ci mostra che G è
una primitiva di f , e pertanto

d
(F (x) − G(x)) = f (x) − f (x) = 0.
dx
Quindi esiste un numero k reale tale che F (x) − G(x) = k per ogni x ∈ [a, b].
Scegliendo x = a, vediamo che F (a) − 0 = k, cioè k = F (a). Quindi
Z b
f (x) dx = G(b) = F (b) − k = F (b) − F (a).
a

La dimostrazione è conclusa.

Questo enunciato è molto importante, e dipende in modo cruciale dalla


continuità della funzione integranda f . Tuttavia questa ipotesi non serve. Il
prezzo da pagare è quello di una dimostrazione più complicata.
136 CAPITOLO 7. INTEGRALE DI RIEMANN

Teorema 7.24. Sia f : [a, b] → R una funzione integrabile. Se F è una


primitiva di f , cioè F è derivabile in ogni punto e F 0 = f , allora
Z b
f (x) dx = F (b) − F (a).
a

Dim. Sia ε > 0. Sappiamo che l’integrabilità di f implica l’esistenza di


una partizione P = {x0 , . . . , xn } tale che U (P, f ) − L(P, f ) < ε. Per ogni
i = 1, . . . , n, il teorema di Lagrange applicato alla funzione F ci dice che
esiste ti ∈ [xi−1 , xi ] tale che F (xi ) − F (xi−1 ) = f (ti )∆xi . Dal momento che
ti ∈ [xi−1 , xi ], avremo mi ≤ f (ti ) ≤ Mi , e dunque
Z
b Xn
f (x) dx − f (ti )∆xi < ε.


a
i=1

Inoltre,

F (b) − F (a) = [F (x1 ) − F (x0 )] + [F (x2 ) − F (x1 )] + · · · + [F (xn ) − F (xn−1 )]


Xn
= F (xi ) − F (xi−1 ).
i=1

Deduciamo che

Z b X n Z b

F (b) − F (a) − f (x) dx =
F (xi ) − F (xi−1 ) − f (x) dx


a a
i=1
X n Z b
= f (ti )∆xi − f (x) dx < ε.


i=1 a

Questo conclude la dimostrazione.

Osservazione 7.25. Ci sembra utile proporre il seguente argomento per la


dimostrazione del teorema precedente. Fissata arbitrariamente una parti-
zione P di [a, b], per ogni indice i esiste un punto ti ∈ [xi−1 , xi ] tale che
F (xi ) − F (xi−1 ) = f (ti )∆xi . Sommando rispetto a i, otteniamo
n
X n
X
F (b) − F (a) = F (xi ) − F (xi−1 ) = f (ti )∆xi , (?)
i=1 i=1

e a destra dell’ultimo segno di uguaglianza riconosciamo una somma di Rie-


mann per la funzione f . Invocando allora il Teorema 6.8, ci sembrerebbe
7.3. TEOREMA FONDAMENTALE DEL CALCOLO 137

lecito far tendere a zero l’ampiezza σ(P ) della partizione P e di concludere


che
Z b Xn
f (x) dx = lim f (ti )∆xi = F (b) − F (a).
a σ(P )→0
i=1

La dimostrazione è così terminata. Ne siamo proprio sicuri? La risposta è


che questa non è una dimostrazione corretta. Fare il limite delle somme di
Riemann significa che per ogni ε > 0 esiste δ > 0 tale che, per ogni partizione
P di ampiezza σ(P ) < δ e per ogni scelta dei punti ti ∈ [xi−1 , xi ] si ha

Xn Z b
f (ti )∆xi − f (x) dx < ε.



i=1 a

Invece, nel nostro ragionamento, i punti ti sono opportunamente scelti. Spo-


standoli anche solo di poco, la relazione (?) diventa in generale falsa! Si
potrebbe dimostrare con poca fatica che le cose vanno a posto quando f è
continua, dal momento che piccoli spostamenti dei punti ti comportano pic-
coli spostamenti dei valori f (ti ). Ma il teorema fondamentale del calcolo per
le funzioni continue ha una dimostrazione ancora più elementare che abbiamo
già proposto.

Ricapitolando, per calcolare un integrale definito basta procurarsi una


primitiva e applicare il teorema di Torricelli.
Un’estensione pressoché immediata al concetto di primitiva è il seguente.

Definizione 7.26. Sia (a, b) un intervallo, e sia f : (a, b) → R. Si dice che


F : (a, b) → R è una primitiva in senso esteso di f se F è continua in ogni
punto di (a, b), se F è derivabile in (a, b) eccetto al più un numero finito di
punti x1 , . . . , xn , e se F 0 (x) = f (x) per ogni x ∈ (a, b) \ {x1 , . . . , xn }.

Invitiamo lo studente a dimostrare che se F e G sono due primitive in


senso esteso di una certa f , allora F e G differiscono per una costante. Sug-
gerimento: su ciascuno degli intervalli [x1 , x2 ], [x2 , x3 ], ecc. la funzione F −G
ha derivata nulla. Quindi essa è costante su ognuno di questi intervalli. Il
punto è che le varie costanti potrebbero essere diverse: F (x) − G(x) = C1
in [x1 , x2 ], F (x) − G(x) = C2 in [x2 , x3 ], e così via. La continuità di F e di
G, assunta per ipotesi nella definizione precedente, obbliga tuttavia queste
costanti a coincidere. La conclusione è ormai a portata di mano.
138 CAPITOLO 7. INTEGRALE DI RIEMANN

7.4 Media integrale


Se f : [a, b] → R è integrabile, il numero
Z b
1
f (x) dx
b−a a

si chiama media integrale di f sull’intervallo [a, b]. Se P è una qualunque


partizione di [a, b], risulta

(b − a) inf f (x) ≤ L(P, f ) ≤ U (P, f ) ≤ (b − a) sup f (x),


x∈[a,b] x∈[a,b]

e in particolare
Z b
1
inf f (x) ≤ f (x) dx ≤ sup f (x).
x∈[a,b] b−a a x∈[a,b]

Questo mostra che la media integrale di f è un numero compreso fra l’estremo


inferiore e l’estremo superiore di f . Se f è anche continua, sappiamo dal
Teorema 5.33 che tale numero deve essere assunto in qualche punto di [a, b].
Precisamente vale il seguente risultato.

Teorema 7.27. Se f : [a, b] → R è continua, allora esiste ξ ∈ [a, b] tale che


1
Rb
f (ξ) = b−a a
f (x) dx.

7.5 Applicazioni al calcolo degli integrali defi-


niti
Ricordiamo che la formula di derivazione

(f g)0 = f 0 g + f g 0

conduce alla regola di integrazione per parti (si veda anche il paragrafo
successivo) Z Z
f (x)g (x) dx = f (x)g(x) − f 0 (x)g(x) dx.
0

Il teorema fondamentale del calcolo integrale ci dice immediatamente che


Z b Z b
0
f (x)g (x) dx = f (b)g(b) − f (a)g(a) − f 0 (x)g(x) dx.
a a
7.5. APPLICAZIONI AL CALCOLO DEGLI INTEGRALI DEFINITI 139

Un po’ più complicata è la formula per calcolare correttamente gli integrali


definiti per sostituzione. Se x = g(t), t ∈ [c, d], è un cambiamento di variabile
monotono crescente,5 allora
Z b Z g −1 (b)
f (x) dx = f (g(t))g 0 (t) dt. (7.4)
a g −1 (a)

Se invece x = g(t), t ∈ [c, d], è un cambiamento di variabile monotono


decrescente, dobbiamo usare la formula
Z b Z g −1 (a)
f (x) dx = f (g(t))g 0 (t) dt. (7.5)
a g −1 (b)

Occorre fare molta attenzione alle formule (7.4) e (7.5). Queste ci dicono
che integrando per sostituzione gli estremi di integrazione vanno cambiati.
Vediamo un esempio: vogliamo calcolare
2
log x
Z
dx.
1 x

Ponendo x = g(t) = et , la formula (7.4) afferma che

2 log 2 log 2
log x t t
Z Z Z
1
dx = e dt = t dt = (log 2)2 .
1 x log 1 et 0 2

Invitiamo gil studenti a fare molto esercizio per memorizzare queste formule.
Uno degli errori più diffusi è quello di dimenticarsi di cambiare gli estremi di
integrazione.

Osservazione 7.28. Dalla discussione appena fatta, discende che il calcolo


di un integrale definito in cui sia necessario operare per sostituzione può
essere svolto in due modi:

1. lavorando sempre con l’integrale indefinito, e applicando il teorema


fondamentale solo come ultimo passaggio;

2. lavorando direttamente sull’integrale definito, ricordando sempre di


cambiare gli estremi di integrazione coerentemente con il cambiamento
di variabile.
5
È sottinteso in questa espressione che g sia derivabile.
140 CAPITOLO 7. INTEGRALE DI RIEMANN

7.6 Cenni sulla ricerca delle primitive


L’insegnamento del paragrafo precedente è che occorre sviluppare una certa
manualità nel calcolo delle primitive. Ricordiamo che

Definizione 7.29. Una funzione F è una primitiva di una funzione f sul-


l’intervallo I se F è derivabile in I e risulta F 0 (x) = f (x) per ogni x ∈
I.

Osservazione 7.30. Se calcolare la derivata di una funzione la cui formula


si compone di funzioni elementari è sempre possibile mediante le regole di
calcolo dimostrate prima, il calcolo delle primitive delle funzioni elementari
pu ò sconfinare dall’ambito delle funzioni elementari stesse. Per capirci, si
2
può dimostrare che la funzione x 7→ ex non possiede primitive esprimibili
mediante formule elementari. Ovviamente questa funzione possiede primitive
in quanto si trata di una funzione continua. Il punto è che non riusciremo
mai a scriverle esplicitamente mediante il solo utilizzo di funzioni elementari.

Innanzitutto, quante solo le primitive di una data funzione?

Proposizione 7.31. Dati un intervallo I ed una funzione f , due primitive


di f differiscono per una costante additiva.

Dim. Siano F1 ed F2 due primitive di f su I. Poiché

(F1 − F2 )0 = F10 − F20 = f − f = 0 in I,

la funzione F1 − F2 è costante in I. Quindi esiste C ∈ R tale che F1 (x) =


F2 (x) + C per ogni x ∈ I.
Quindi, se vogliamo trovare le primitive di una funzione su un intervallo,
occorre e basta trovarne una: tutte le altre differiranno da essa per costanti
additive. Con un certo abuso di notazione, sottintendiamo l’intervallo I e
scriviamo
Z
f (x) dx = {F | F è una primitiva di f su I} . (7.6)

Questo perìo non ci aiuta nel calcolo effettivo delle primitive. Inoltre, la
definizione non è operativa, a differenza di quella di derivata. Per affrontare
questo problema, cominciamo ad osservare che ogni tabella di derivate è
automaticamente una tabella di primitive. Ad esempio, dalla regola
d
sin x = cos x
dx
7.6. CENNI SULLA RICERCA DELLE PRIMITIVE 141

deduciamo che una primitiva della funzione coseno è la funzione seno. Inoltre,
le regole algebriche per il calcolo differenziale diventano (parzialmente) ergole
per il calcolo delle primitive. Infatti, se k è una costante reale,
Z Z Z
(f (x) + g(x)) dx = f (x) dx + g(x) dx,
Z Z
k · f (x) dx = k · f (x) dx.

Non è ovviamente vero che la primitiva di un prodotto di funzioni sia il pro-


dotto delle corrispondenti primitive! La formula di Leibniz per la derivazione
dei prodotti dà origine alla regola di integrazione per parti.
Proposizione 7.32 (Integrazione per parti). Se f 4 g sono due funzioni
derivabili in un intervallo I, allora
Z Z
f (x)g (x) dx = f (x)g(x) − f 0 (x)g(x) dx.
0
(7.7)

Dim. Dalla formula di Leibniz D(f g) = Df ·g+f ·Dg segue immediatamente


che Z Z
f (x)g(x) = f (x)g(x) dx + f (x)g 0 (x) dx,
0

cioè la formula della proposizione.


Vediamo
R come si applica, in pratica, questa formula. Supponiamo di voler
x
calcolare xe dx. Come scegliere f e g? Abbiamo due possibilit à:
1. f (x) = x e g 0 (x) = ex
2. f (x) = ex e g 0 (x) = x.
Nel primo caso, la Proposizione precedente dice che
Z Z
xe dx = xe − ex dx = xex − ex + C.
x x

Nel secondo caso,


x2 x
Z 2
x x
Z
x
xe dx = e − e dx.
2 2
È evidente che la seconda alternativa ha complicato il calcolo dell’integrale
indefinito, mentre la prima l’ha risolto. Come “vedere” la scelta giusta?
Non ci sono ricette universali, ed è soprattutto l’esperienza che permette
di scegliere la strada migliore senza perdersi in calcoli inutili e complicati.
Se fin qui abbiamo dato spazio alle regole algebriche, ci manca ancora un
metodo generale per affrontare la ricerca delle primitive di funzioni ottenute
mediante composizione.
142 CAPITOLO 7. INTEGRALE DI RIEMANN

Proposizione 7.33 (Integrazione per sostituzione). Siano f ed x due fun-


zioni derivabili e tali che la composizione f ◦ x abbia significato in un certo
intervallo. Allora
Z
f 0 (x(t))x0 (t) dt = f (x(t)) + C. (7.8)

Dim. Per la regola della catena,

d
f (x(t)) = f 0 (x(t))x0 (t),
dt
f 0 (x(t))x0 (t) dt.
R
sicché f (x(t)) + C =

Questa formula è molto meno trasparente di quella di integrazione per


parti. In pratica, il metodo sembra potersi applicare solo alle funzioni in-
tegrande di un tipo molto particolare, cioè (f ◦ x)x0 . VediamoR x+2 ora S un
esempio molto semplice di applicazione. Si voglia calcolare e dx. Se po-
niamo f 0 (x) = ex e t = x + 2, allora x = x(t) = t − 2 è derivabile e l’integarle
proposto si risolve con la formula di integrazione per sostituzione:
Z Z
e x+2
dx = f 0 (x(t))x0 (t) dt = et + C = ex+2 + C.

R
Ecco un secondo esempio:
√ calcolare x sin(x2 ) dx. Poniamo x2 = t, in
0 1
modo che x = x(t) = ± t. Quindi x (t) = ± 2√ t
e l’integrale diventa


Z   Z Z
1 1 1
± t sin t ± √ dt = sin t dt = − cos t + C.
2 t 2 2

Torniamo infine alla variabile x, e poiché t = x2 possiamo scrivere


Z
1
x sin(x2 ) dx = − cos(x2 ) + C.
2

Osservazione 7.34. Nell’ultimo esempio abbiamo cercato di proporre lo


schema pratico dell’integrazione per sostituzione, che appare un po’ diverso
dal contenuto della Proposizione 7.33. Per accertarsi di non aver commesso
qualche ingenuo errore di calcolo, lo studente è senz’altro invitato a verificare
la correttezza della propria soluzione facendo la derivata della (presunta) pri-
mitiva. Se il risultato è esattamente la funzione da integrare, allora l’esercizio
è corretto. Nel prossimo paragrafo lo studente può trovare una motivazione
un po’ formale del funzionamento del metodo di sostituzione.
7.7. IL DIFFERENZIALE 143

Osservazione 7.35. Capita spesso di leggere interi paragrafi di libri di testo


dedicati ai cosiddetti “integrali quasi immediati”. Si tratta di quegli integrali
che si presentano sotto la forma generale
Z
g(f (x))f 0 (x) dx,

dove f e g sono due funzioni assegnate. In realtà, questi sono integrali


banalmente calcolabili per sostituzione: infatti, ponendo t = t(x) = f (x),
osserviamo che t0 (x) = f 0 (x), sicché
Z Z
0
g(f (x))f (x) dx = g(t) dt,

e basta allora procurarsi una primitiva G di g per concludere che


Z
g(f (x))f 0 (x) dx = G(f (x)) + C.

Il secondo esempio visto sopra era in realtà di questo tipo: infatti


Z Z
2 1
x sin(x ) dx = (2x) sin(x2 ) dx,
2
e riconosciamo un integrale “quasi immediato” nel quale f (x) = x2 e g(x) =
sin x.
Se queste sono le uniche regole generali di calcolo delle primitive, que-
sto non significa che siamo capaci di calcolare tutti gli integrali indefiniti
che possiamo concepire. Anche escludendo quei casi che non possiedono pri-
mitive esprimibili mediante funzioni elementari, il calcolo di una primitiva
può richieder l’uso ripetuto e/o sovrapposto delle regole studiate, oltre na-
turalmente ad “astuzie” di natura algebrica o analitica. Insomma, il calcolo
integrale mette alla prova lo spirito di osservazione dello studente, e costitui-
sce certamente il primo ostacolo che la sola applicazione di regole meccaniche
non permettono di aggirare.
Nel prossimo paragrafo ci occuperemo dell’integrazione indefinita di un’am-
pia classe di funzioni, e saremo costretti ad utilizzare alcuni “trucchi” per
semplificare il nostro lavoro.

7.7 Il differenziale
Definizione 7.36. Una funzione lineare L : R → R è una funzione tale che
per ogni x, y ∈ R ed ogni α, β reali risulti L(αx + βy) = αL(x) + βL(y).
144 CAPITOLO 7. INTEGRALE DI RIEMANN

Osservazione 7.37. Non è difficile rendersi conto che tutte e sole le funzioni
lineari hanno la rappresentazione

L(x) = kx

per un valore opportuno di k ∈ R. In parole povere, le funzioni lineari di una


variabile sono rappresentate da rette uscenti dall’origine degli assi cartesiani.
Definizione 7.38. Una funzione f : (a, b) → R è differenziabile nel punto
x0 ∈ (a, b) se esiste una funzione lineare L (dipendente ovviamente da x0 )
tale che
f (x0 + h) − f (x0 ) − L(h)
lim = 0. (7.9)
h→0 h
Il differenziale di f in x0 , se esiste, viene indicato dal simbolo df (x0 ).
Osservazione 7.39. Dalla precedente osservazione, deriva che f è differen-
zialbile in x0 se e solo se esiste un numero reale k tale che
f (x0 + h) − f (x0 ) − kh
lim = 0,
h→0 h
e dunque se e solo se esiste un numero reale k tale che
f (x0 + h) − f (x0 )
k = lim .
h→0 h
Dunque la differenziabilità in x0 coincide con la derivabilit à in x0 ! Di più,
df (x0 ) altro non è che la funzione lineare h 7→ f 0 (x0 )h.
Perché abbiamo introdotto l’inutile concetto di differenziale se questo
coincide (con leggero abuso di terminologia) con la derivata? Una risposta
raffinata ma poco corretta è che, per funzioni di due o più variabili, la derivata
deve essere definita mediante il differenziale per avere tutte le proprietà buone
che ci aspettiamo. Ma questa risposta non ci soddisfa, dato che per funzioni
di una variabile reale abiamo visto che è tutto tempo sprecato.
Una risposta suggestiva è che il differenziale permette di rendere pi ù
intuitiva la formula di itnegrazione per sostituzione. Infatti, se x = x(t) è
la sostituzione che vogliamo effettuare nell’integrale, allora possiamo usare il
concetto di differenziale per scrivere

dx = x0 (t) dt,

pensando che dt sia un piccolo incremento (quello che prima abbiamo de-
notato con h). Dunque, al posto di dx dobbiamo scrivere x0 (t) dt, e questo
porta direttamente alla formula di integrazione per sostituzione.
7.8. INTEGRAZIONE DELLE FUNZIONI RAZIONALI FRATTE 145

Osservazione 7.40. Capita spesso di leggere, sui testi più tradizionali di


calcolo differenziale, che i differenziali sono più flessibili delle derivate perch
é non richiedono che si specifichi da quali variabili dipendono le quantità in
esame. Uno degli esempi classici è la legge della fisica pV = nT , dove p
è la pressione, V il volume e T la temperatura (espressa in gradi Kelvin),
menter n è una costante. A questo punto, si dice che “differenziando” questa
uguaglianza, si ottiene

p dV + V dp = n dT,

qualunque siano le variabili indipendenti da cui dipendono p, V e T . Perso-


nalmente, non trovo questa conclusione così eccitante ed innovativa. Il punto
è che i matematici all’antica pensavano alle funzioni come a formule esplicite
contenenti una o pi ù variabili indipendenti. Se non potevano scriverle, si
sentivano molto a disagio. Per noi, ormai, è chiaro che la derivata opera sul-
le funzioni, indipendentemente dal nome scelto per le variabili indipendenti
che la descrivono. Nonostante ciò, i fisici matematici continuano ad utiliz-
zare un linguaggio pittoresco e simpaticamente vintage, e guai a mostrarsi
indifferenti!

7.8 Integrazione delle funzioni razionali fratte

Le seguenti formule sono tratte da [2]: per a 6= 0,


2 2ax + b
arctan p , b2 − 4ac < 0

 p
 2 2



 4ac − b 4ac − b




dx
Z  2ax + b − pb2 − 4ac
= p 1
log , b2 − 4ac > 0

ax2 + bx + c 
p
 2
b − 4ac 2
2ax + b + b − 4ac





2


− , b2 = 4ac.


2ax + b

La forma analitica delle primitive dipende essenzialmente dal segno di ∆ =


b2 − 4ac. I calcoli seguenti dovrebbero risvegliare qualche ricordo nella mente
146 CAPITOLO 7. INTEGRALE DI RIEMANN

dello studente: per a 6= 0,


2 !
2
  
b c b c b
ax2 + bx + c = a x2 + x + =a x+ + − 2
a a 2a a 4a
2 !
4ac − b2

b
= a x+ +
2a 4a2
 2 !
b ∆
= a x+ − 2
2a 4a

Vediamo che, per risolvere l’equazione algebrica di secondo grado

ax2 + bx + c = 0

dobbiamo risolvere  2 !
b ∆
a x+ − 2 = 0,
2a 4a
e cioè  2
b ∆
x+ − 2 = 0.
2a 4a
Ma questa equazione è facile:
r √
b ∆ ∆
x+ =± 2
=± .
2a 4a 2a
Lo studente non mancherà di notare che abbiamo ricavato la celeberrima
formula risolutiva per le equazioni (algebriche) di secondo grado:

−b ± ∆
x= .
2a
La presenza della radice quadrata di ∆ ci costringe a distinguere tre casi:

1. ∆ > 0

2. ∆ < 0

3. ∆ = 0.

Cominciamo dall’ultimo caso. Il polinomio ax2 + bx + c possiede due radici


reali coincidenti:
b
x1 = x2 = − .
2a
7.8. INTEGRAZIONE DELLE FUNZIONI RAZIONALI FRATTE 147

Inoltre ax2 + bx + c = a(x − x1 )2 . Quindi

dx dx
Z Z
1 1 1 2
2
= 2
=− =− .
ax + bx + c a (x − x1 ) a x − x1 2ax + b

Il caso ∆ > 0 si tratta come nel seguito. Il nostro polinomio di secondo grado
possiede le due radici reali distinte
√ √
−b − ∆ −b + ∆
x1 = , x2 = .
2a 2a

Perciò ax2 + bx + c = a(x − x1 )(x − x2 ), e

dx dx
Z Z
1
2
= .
ax + bx + c a (x − x1 )(x − x2 )

Cerchiamo due numeri reali A e B tali che


1 A B
= +
(x − x1 )(x − x2 ) x − x1 x − x2

per ogni x ∈
/ {x1 , x2 }. Mettendo a denominatore comune e operando qualche
semplificazione, otteniamo

1 = (A + B)x − Ax2 − Bx1

per ogni x ∈
/ {x1 , x2 }. Affiché questo sia vero, il coefficiente della x a secondo
membro deve essere uguale al coefficiente della x a primo membro (cioè 0), e
i termini noti devono coincidere. Pertanto occorre risolvere il sistema lineare
in due equazioni (
A+B =0
(7.10)
Ax2 + Bx1 = −1.

La soluzione si trova facilmente per sostituzione:


(
A = 1/(x1 − x2 )
B = −1/(x1 − x2 ).

Dunque

1 1 1 1 1
= − .
(x − x1 )(x − x2 ) x1 − x2 x − x1 x1 − x2 x − x2
148 CAPITOLO 7. INTEGRALE DI RIEMANN

Infine,
dx dx
Z Z
1
2
=
ax + bx + c a (x − x1 )(x − x2 )
 
1 1 1
= log |x − x1 | − log |x − x2 |
a x1 − x2 x1 − x2

1 x − x1
= log
.
a(x1 − x2 ) x − x2
Sostituendo i valori di x1 e x2 e facendo qualche calcolo algebrico, si arriva
alla formula scritta all’inizio di questo paragrafo.
L’ultimo caso è quello in cui ∆ < 0, ed è noto che il nostro polinomio
di secondo grado non possiede radici reali. Probabilmente alcuni studenti
sanno che esso possiede invece due radici complesse coniugate. Non avendo
discusso i numeri complessi, e visto che non ne trarremmo alcun vantaggio
concreto, evitiamo di insistere su tale terminologia. Per integrare la funzione
razionale ci basta osservare che
 
2 2 b c
ax + bx + c = a x + x +
a a
e che 2
b2

2b c b c
x + x+ = x+ + − 2.
a a 2a a 4a
Poiché ∆ < 0, esiste k ∈ R tale che
c b2
k2 = − 2.
a 4a
b
La sostituzione t = x + 2a
ci conduce all’integrale
dt dt
Z Z
1 1
2 2
= 2 t 2 .
a t +k ak (k) + 1

L’ulteriore sostituzione u = t/k risolve l’ultimo integrale:


dt k t
Z Z
1 1 1 1
2 t 2 = 2 2
du = arctan u + C = arctan + C.
ak (k) + 1 ak u +1 ak ak k
b
Ricordando che t = x+ 2a ed esplicitando il valore di k, si arriva dopo qualche
passaggio all’integrale voluto.
Sconsigliamo allo studente di imparare a memoria i risultati: lo sforzo
non è banale, ed è certo più importante saper riprodurre i ragionamenti nel
caso concreto.
7.8. INTEGRAZIONE DELLE FUNZIONI RAZIONALI FRATTE 149

Osservazione 7.41. Come sempre, non esiste necessariamente un unico


modo di esprimere una primitiva. Si consideri l’esempio
dx
Z
.
1 − x2
Si tratta evidentemente di una integranda di tipo razionale fratto. Ovvia-
mente 1 − x2 = (1 − x)(1 + x), e dunque
1 1 1 1 1
2
= −
1−x 21−x 21+x
e l’integrale diventa immediato:
dx
Z
1 1
2
= log |1 − x| − log |1 + x| + C.
1−x 2 2
Molti software di calcolo simbolico propongono una primitiva molto diversa:
dx
Z
= arctanh x + C.
1 − x2
Ricordiamo che
ex − e−x
sinh x =
2
e + e−x
x
cosh x =
2
sinh x
tanh x = .
cosh x
Si verifica facilmente che6
(cosh x)2 − (sinh x)2 = 1,
e dividendo per (cosh x)2 si arriva all’identità
1
(cosh x)2 =
1 − (tanh x)2
Infine,
d
sinh x = cosh x
dx
d
cosh x = sinh x
dx
d 1
tanh x = .
dx (cosh x)2
6
Si osservi la somiglianza con l’identità fondamentale della (tri)goniometria (sin α)2 +
(cos α)2 = 1.
150 CAPITOLO 7. INTEGRALE DI RIEMANN

2,4

1,6

0,8

-4,8 -4 -3,2 -2,4 -1,6 -0,8 0 0,8 1,6 2,4 3,2 4 4,8

-0,8

-1,6

-2,4

Figura 7.1: la funzione sinh

La funzione arctanh è definita come la funzione inversa di tanh. La sua


derivata vale
d 1 1
arctanh y = d
= (cosh x)2 = ,
dy dx
tanh x 1 − y2

dove y = tanh x. pertanto

dy
Z
= arctanh y + C.
1 − y2

Nelle figure 7.1, 7.2 e 7.3 appaiono i grafici qualitativi delle funzioni seno
iperbolico, coseno iperbolico e tangente iperbolica.

7.9 Il polinomio di Taylor con resto integrale


Ricordiamo che, per una funzione f : (a, b) → R derivabile n volte, vale la
formula
f (x) = Pn (x) + Rn (x),
dove
n
X 1 k
Pn (x) = f (x0 ) + D f (x0 )(x − x0 )k
k=1
k!
7.9. IL POLINOMIO DI TAYLOR CON RESTO INTEGRALE 151

2,4

1,6

0,8

-4,8 -4 -3,2 -2,4 -1,6 -0,8 0 0,8 1,6 2,4 3,2 4 4,8

-0,8

-1,6

-2,4

Figura 7.2: la funzione cosh

2,4

1,6

0,8

-4,8 -4 -3,2 -2,4 -1,6 -0,8 0 0,8 1,6 2,4 3,2 4 4,8

-0,8

-1,6

-2,4

Figura 7.3: la funzione tanh


152 CAPITOLO 7. INTEGRALE DI RIEMANN

è il polinomio di Taylor di ordine n e Rn (x) = f (x) − Pn (x) è l’errore che si


compie sostituendo Pn a f . Abbiamo già imparato che

Rn (x)
lim = 0,
x→x0 (x − x0 )n

e che è possibile esprimere tale resto mediante la derivata (n + 1)– esima in


un punto opportuno ξ:

1
Rn (x) = Dn+1 f (ξ)(x − x0 )n+1 .
(n + 1)!

Il seguente risultato illustra un’ulteriore espressione per il resto.

Teorema 7.42 (Polinomio di Taylor con resto integrale). Sia f : (a, b) → R


una funzione derivabile n+1 volte in (a, b), con derivata (n+1)–esima Dn+1 f
continua. Allora
1 x
Z
Rn (x) = (x − t)n Dn+1 f (t) dt.
n! x0

Non dimostriamo tale formula, che richiederebbe la tecnica dell’indu-


zione matematica. L’espressione integrale del resto Rn ha un’utilità quasi
esclusivamente teorica, dato che la funzione integrale coinvolta è di difficile
calcolo.

7.10 Integrali impropri


Per quanto ci riguarda, solamente le funzioni limitate possono essere integrate
su un intervallo√limitato [a, b]. Da questa classe esulano le funzioni come
x ∈ (0, 1) 7→ 1/ x e x ∈ (1, +∞) 7→ 1/x2 , per esempio. Osserviamo che si
tratta di funzioni continue, ed anzi derivabili nel loro dominio. L’integrale di
Lebesgue, la cui teoria è ben più complicata di quella vista finora, propone
una teoria che supera queste restrizioni. Noi ci accontenteremo di introdurre
i rudimenti dell’integrazione in senso generalizzato o improprio.

7.10.1 Funzioni illimitate


Per semplicità consideriamo una funzione f che sia definita e continua in un
intervallo [a, b). La funzione f potrà
R c non essere limitata. È lecito allora per
ogni c < b considerare l’integrale a f (x) dx e viene spontanea la seguente
7.10. INTEGRALI IMPROPRI 153

Definizione 7.43. Se nelle ipotesi dette esiste il limite


Z c
lim f (x) dx,
c→b− a

questo viene detto integrale (improprio) di f in (a, b) e lo si indica ancora


Rb
con la notazione a f (x) dx.
È chiaro che possiamo estendere la definizione precedente al caso in cui f
sia illimitata nell’estremo sinistro a dell’intervallo. Basta considerare il limite
Z b
lim f (x) dx.
c→a+ c

Quindi, tutto è stato ricondotto all’esistenza di un limite. Non sempre, però


è possibile calcolare esplicitamente gli integrali, ed è utile avere un teorema
che garantisca l’integrabilità impropria di f .
Teorema 7.44. Sia ϕ una funzione continua in [a, b), a valori positivi per
cui esista l’integrale improprio in (a, b), e sia f una funzione continua in
[a, b) tale che |f (x)| ≤ ϕ(x) per ogni x ∈ [a, b). Allora esiste l’integrale
improprio fra a e b di f .
Conviene pertanto costruire una scala di funzioni illimitate che ci permat-
ta di decidere per confronto se una funzione ammetta integrale improprio
o no. Consideriamo questa semplice famiglia di funzioni illimitate in ogni
intorno del’estremo b:
1
x ∈ [a, b) 7→ , (α > 0).
(b − x)α
Ora, (
c
dx log(b − a) − log(b − c), α=1
Z
= 1 1
a (b − x)α 1−α
(b − a) 1−α 1−α
− 1−α (b − c) , α =
6 1.
Perciò nel caso α = 1 l’integrale improprio non esiste in quanto
Z c
dx
lim = +∞.
c→b− a (b − x)α

Lo stesso accade per α > 1. Per α < 1


Z c
dx 1
lim α
= (b − a)1−α
c→b− a (b − x) 1−α
In conclusione, l’integrale improprio esiste se e solo se 0 < α < 1.
154 CAPITOLO 7. INTEGRALE DI RIEMANN

Diamo un cenno a un caso un po’ più generale. Supponiamo che la fun-


zione f , definita in [a, b], sia continua con l’eventuale eccezione dei punti d1 ,
d2 , . . . ,dr . Allora si può suddividere l’intervallo (a, b) in un numero finito di
intervalli, in modo che in ciascuno di essi la funzione f sia discontinua solo
in un estremo (destro o sinistro). A ciascuno di questi intervalli si possono
applicare le considerazioni fatte prima; se, per ciascuno di essi, esiste l’in-
tegrale improprio, la somma di questi si definisce come integrale improprio
della f esteso all’intervallo (a, b).
In pratica, se nell’intervallo [a, b] ci sono due punti d1 e d2 dove la funzione
f è illimitata, scriveremo
Z b Z d1 Z d2 Z b
f (x) dx = f (x) dx + f (x) dx + f (x) dx.
a a d1 d2

Il primo e l’ultimo integrale ricadono nella definizione di integrale improprio.


Il secondo è più delicato. Infatti f potrebbe essere illimitata in entrambi
gli estremi. Possiamo però ricondurlo a un integrale improprio con questo
“trucco”: scegliamo un punto c ∈ (d1 , d2 ) dove f sia continua, e scriviamo
Z d2 Z c Z d2
f (x) dx = f (x) dx + f (x) dx.
d1 d1 c
R +1
Vediamo, ad esempio, se esiste −1
√dx .
|x|
La funzione integranda è illimitata per x → 0. Suddividiamo allora
l’intervallo (−1, 1) nei due intervalli (−1, 0 e (0, 1). Si ha 7

Z −δ
1
lim √ dx = lim (−2 −δ + 2) = 2
δ→0+ −1 −x δ→0+

e Z 1
1 √
lim √ dx = lim (2 − 2 σ) = 2.
σ→0+ σ x σ→0+

7.10.2 Funzioni definite su intervalli illimitati


Consideriamo ora il secondo caso, quello di una funzione definita su un inter-
R c Supporremo che f sia continua
vallo illimitato, ad esempio del tipo (a, +∞).
in [a, +∞), e pertanto tutti gli integrali a f (x) dx hanno senso per c > a.
Definizione 7.45. Se nelle ipotesi dette esiste il limite
Z c
lim f (x) dx
c→+∞ a

questo viene detto l’integrale improprio di f in (a, +∞).


7
Lo studente noterà che abbiamo esplicitato il valore assoluto nei due integrali.
7.10. INTEGRALI IMPROPRI 155

Esempio:
+∞ c
dx dx π
Z Z
= lim = lim arctan c = .
0 x2 + 1 c→+∞ 0 x2 + 1 c→+∞ 2
Come nel caso dell’intervallo limitato, sussiste il seguente criterio del con-
fronto per l’integrale improprio su intervalli illimitati.

Teorema 7.46. Sia ϕ una funzione continua in [a, +∞), a valori positivi
per cui esista l’integrale improprio in (a, +∞), e sia f una funzione continua
in [a, b) tale che |f (x)| ≤ ϕ(x) per ogni x ∈ [a, +∞). Allora esiste l’integrale
improprio fra a e +∞ di f .

Costruiamo anche nel nostro caso una scala di funzioni che ci permetta,
per mezzo del criterio del confronto, di decidere se un integrale improprio
esiste. Consideriamo
Z c (
1 1
dx 1−α
c1−α + α−1 , α 6= 1
α
=
1 x log c, α = 1.

Se è α > 1, il limite per c → +∞ è 1/(α − 1), mentre, per α ≤ 1, è +∞.

Osservazione 7.47. L’applicazione del criterio di confronto per la conver-


genza degli integrali impropri richiede la costruzione di una funzione ϕ di
confronto, e non esistono ricette universali per questo.
156 CAPITOLO 7. INTEGRALE DI RIEMANN
Capitolo 8

Introduzione alle equazioni


differenziali ordinarie

Risolvere un’equazione significa trovare i valori di una o più incognite che


rendono vera una certa uguaglianza. Lo studente sa risolvere le equazioni
ax = b, ax2 + bx + c = 0, 2x = 4, e altre ancora. In questi esempi, l’incognita
x è un numero.1
È possibile scrivere equazioni in cui l’incognita sia una funzione e non
già un singolo numero? Un attimo di riflessione ci lascia intendere che il
senso dell’uguaglianza da verificare vada inteso come un’uguaglianza punto
per punto. Per esempio, cercare una funzione f tale che
f2 − 1 = 0
può essere interpretato come cercare una funzione f tale che f (x)2 − 1 = 0
per ogni x appartenente al dominio di f . Queste solo le cosiddette equazioni
funzionali, e sono un argomento davvero complesso.
In questo capitolo tratteremo un diverso tipo di equazioni, quelle in cui
l’incognita è una funzione ma l’uguaglianza da verificare coinvolge le derivate
dell’incognita. Sarà comodo indicare le derivate con apici: y 0 invece di Dy,
y 00 invece di D2 y, ecc.
Definizione 8.1. Un’equazione nell’incognita y : (a, b) → R del tipo
F (x, y(x), y 0 (x), y 00 (x), . . . , y (n) (x)) = 0, x ∈ (a, b) (8.1)
si chiama equazione differenziale ordinaria di ordine n. L’ordine n sta ad
indicare l’ordine di derivazione più alto della funzione incognita y che effet-
tivamente compare.
1
Che intenderemo sempre reale. In matematica si studiano equazioni le cui inconite
devono appartenere ad insiemi specificati, ad esempio Z o Q.

157
158 CAPITOLO 8. EQUAZIONI DIFFERENZIALI ORDINARIE

Definizione 8.2. L’equazione (8.1) si dice lineare se è della forma

an (x)y (n) (x) + an−1 y (n−1) (x) + · · · + a0 (x)y(x) = f (x) (8.2)

e lineare omogenea se f = 0.

Ora che sappiamo che cosa sia un’equazione differenziale2 vogliamo anche
dire che cosa sia una sua soluzione.

Definizione 8.3. Una soluzione di (8.1) è una funzione y : (a, b) → R, de-


rivabile n volte in (a, b) e verificante (8.1) per ogni x ∈ (a, b). L’insieme di
tutte le soluzioni di (8.1) in (a, b) si chiama integrale generale di (8.1) in
(a, b).

È importantissimo sottolineare che l’insieme di definizione della soluzione


non è un dato del problema, bensì parte dell’incognita. In particolare, non
è possibile pretendere che le soluzioni di una data equazione differenziale
risultino definite su un insieme da noi specificato. In termini equivalenti,
aggiungere il dominio della soluzione ai dati dell’equazione può portare a un
problema privo di soluzioni.
Un’equazione differenziale ordinaria che sappiamo già risolvere è

y 0 = f (x),

dove f è una funzione continua assegnata. Il teorema fondamentale del calco-


lo ci dice che, trovata una primitiva F di f in un intervallo (a, b), la soluzione
generale è y(x) = F (x) + C, al variare di C ∈ R.
Nei paragrafi seguenti proponiamo i metodi risolutivi per qualche altro
tipo di equazioni differenziali del primo ordine. Non diremo quasi niente della
teoria che sta alla base. Lo studente tenga bene a mente che non esistono
metodi per risolvere una generica equazioni differenziale ordinaria mediante
formule elementari.

8.1 Equazioni differenziali lineari del primo or-


dine
In questa sezione, troviamo tutte le soluzioni di una equazione differenziale
del primo ordine scritta nella forma

y 0 + a(x)y = f (x) (8.3)


2
Sottintenderemo spesso l’aggettivo ordinaria.
8.1. EQUAZIONI DIFFERENZIALI LINEARI DEL PRIMO ORDINE159

Quando si studiano le equazioni differenziali lineari, conviene sempre appli-


care il principio di sovrapposizione. Esso consiste nelle seguenti due osserva-
zioni:

1. se y1 e y2 sono soluzioni della stessa equazioni differenziale lineare


omogenea, allora c1 y1 + c2 y2 , al variare di c1 , c2 ∈ R, è ancora una
soluzione;

2. se y1 e y2 sono soluzioni della stessa equazioni differenziale lineare con


termine noto f , allora y1 − y2 è una soluzione della stessa equazione
differenziale lineare con f = 0.

Il senso pratico di questo principio è che per trovare l’integrale generale di


un’equazione differenziale lineare non omogenea, basta trovare l’integrale ge-
nerale ella corrispondente equazione omogenea e sommargli una soluzione
particolare dell’equazione non omogenea. Il vantaggio è che la soluzione
particolare può essere individuata con ogni mezzo, anche casualmente.3
Per la nostra equazione (8.3), cominciamo a trovare l’integrale generale
della corrispondente equazione omogenea

y 0 + a(x)y = 0. (8.4)

Nel seguito, supporremo sempre che a sia una funzione continua. Dividendo
per y, si ottiene formalmente

y0 d
0= + a(x) = log y(x) + a(x),
y dx
cioè
log y(x) = −A(x)
dove A è una primitiva di a.4 Il suggerimento che ne ricaviamo è che la
funzione  Z x 
y0 (x) = exp − a(s) ds (8.5)
α

dove α è un numero arbitrariamente fissato, sia una soluzione di (8.4). Lo


studente verifichi per (semplice) esercizio che y0 è davvero una soluzione.
L’integrale generale di (8.4) è

y(x) = cy0 (x), c ∈ R.


3
Questa è soltanto una frase ad effetto. Nessuno individua le soluzioni particolari
casualmente, ma sempre seguendo qualche tecnica ragionevole.
4
Ricordiamo che, per definizione di primitiva, A0 (x) = a(x).
160 CAPITOLO 8. EQUAZIONI DIFFERENZIALI ORDINARIE

Infatti,
d y(x) y 0 y0 − y00 y −ayy0 + ay0 y
= 2
= = 0,
dx y0 (x) y0 y02
e dunque y/y0 è costante.
Per trattare il caso non omogeneo, proponiamo un metodo alquanto po-
tente e generale: quello della variazione delle costanti. Al di là della denomi-
nazione paradossale, è un metodo che funziona sempre, anche se può portare
a calcoli problematici. Lo schema è il seguente. Si risolve l’equazione omoge-
nea e si determina y0 come sopra. A questo punto, cerchiamo una soluzione
particolare della forma
yf (x) = λ(x)y0 (x)
Capiamo la ragione del nome: facciamo finta che la costante reale c che de-
scrive l’integrale generale di (8.4) sia una funzione (derivabile), e cerchiamo
di sceglierla così da avere una effettiva soluzione dell’equazione non omoge-
nea. Inserendo yf nell’equazione (8.3), ci accorgiamo che yf è una soluzione
se e solo se
λ0 (x)y0 (x) + λ(x) (y00 (x) + a(x)y0 (x)) = f (x);
basta quindi scegliere λ in modo che
f (x)
λ0 (x) = .
y0 (x)
Questa è un’equazione differenziale del tutto banale, dato che si risolve sem-
plicemente scegliendo una primitiva della funzione a secondo membro. In
conclusione, l’integrale generale dell’equazione (8.3) è
 Z x 
f (s)
y(x) = y0 (x) c + ds , (8.6)
α y0 (s)

dove  Z x 
y0 (x) = exp − a(s) ds .
α
Inoltre, ciascuna di queste soluzioni è univocamente determinata dal valore
assunto in α, c = y(α).
Osservazione 8.4. Esiste un approccio più diretto al caso nonR omogeneo.
Partiamo dall’equazione y 0 +a(x)y = f (x) e poniamo v(x) = exp( a(x) dx)y(x).
La derivata di v si calcola facilmente:
R R
v 0 (x) = e a(x) dx 0
y (x) + a(x)e a(x) dx
y(x)
R
a(x) dx 0
=e (y + a(x)y) .
8.2. EQUAZIONI DEL PRIMO ORDINE A VARIABILI SEPARABILI161

Quindi y risolve la nostra equazione differenziale non omogenea se, e solo se,
v risolve l’equazione differenziale
R
v0 = e a(x) dx
f (x).
R R
a(x) dx
Ma allora v(x) = e f (x) dx + C, e possiamo ricavare la soluzione
generale5 y:
R
Z R

− a(x) dx a(x) dx
y(x) = e e f (x) dx + C .

Qualche volta, la forma specifica di f a secondo membro può suggerire


una soluzione particolare. Per esempio, una soluzione di y 0 + y = ex può
essere suggerita dal fatto ben noto che, per ogni λ, µ ∈ R,

d
(λeµx ) = λµeµx .
dx
Si verifica agevolmente che λ = 1/2 e µ = 1 fornisce la soluzione yf (x) =
(1/2)ex . Considerazioni analoghe valgono per funzioni a secondo membro di
tipo polinomiale e goniometrico.

8.2 Equazioni del primo ordine a variabili se-


parabili
Discutiamo ora alcuni esempi di equazioni differenziali del primo ordine non
lineari
y 0 = f (x, y), (8.7)
dove f è una funzione di due variabili assegnata. Una soluzione di (8.7) è
una funzione y derivabile con continuità in un intervallo (a, b) e tale che

y 0 (x) = f (x, y(x)) per ogni x ∈ (a, b).

Discuteremo inoltre la risolubilità del problema di Cauchy, ovvero del proble-


ma di trovare una soluzione di (8.7) soddisfacente la condizione y(x0 ) = y0 ,
5
Qualche studente potrebbe criticare l’uso un po’ leggero del simbolo di integrazione
indefinita: in particolare, a che serve la costante C se l’integrale indefinito continene già
tutte le infinite primitive? La critica è formalmente corretta, e possiamo dire che nella
formula seguente gli integrali denotano una primitiva scelta liberamente fra le infinite a
disposizione.
162 CAPITOLO 8. EQUAZIONI DIFFERENZIALI ORDINARIE

(x0 , y0 ) essendo un punto del piano cartesiano (appartenente al dominio di


f ). In altre parole, discuteremo la risolubilità del sistema

y 0 (x) = f (x, y(x))



(8.8)
y(x0 ) = y0 .

Geometricamente il problema consiste, dopo aver assegnato in ogni punto del


piano (x, y) un numero f (x, y), nel trovare una funzione y il cui grafico passa
per (x0 , y0 ) in ogni punto (x, y(x)) ha una pendenza assegnata f (x, y(x)).
Purtroppo non possiamo dire quasi nulla di astratto: la comparsa di una
funzione di due variabili porta tutta la discussione ad un livello di matematica
più avanzato rispetto al nostro. Questa consapevolezza dei nostri limiti non ci
impedirà tuttavia di imparare a risolvere alcuni tipi di equazioni differenziali
di tipo speciale.
I due esempi che seguono mostrano alcuni comportamenti inattesi, almeno
a un primo sguardo.

Non unicità. Per ogni a < 0 < b, le funzioni



1 2
− 4 (x − a) , x < a

y(x) = 0, a≤x≤b

1 2
4
(x − b) , x>b

6
sono tutte funzioni derivabili con continuità in R. Inoltre ognuna di esse
risolve il problema di Cauchy
 p
y 0 (x) = |y(x)|
y(0) = 0.

In contrasto con quel che capita con le equazioni lineari del primo ordine dove
la soluzione dell’equzione è univocamente determinata dal valore della stessa
in un dato punto, questa equazione non lineare presenta infinite soluzioni
diverse.

Esplosione in tempo finito. La funzione y(x) = 1/(1 − x), definita per


ogni x ∈ (−∞, 1), è soluzione del problema

y 0 (x) = y(x)2


y(0) = 1.
6
Lo studente verifichi attentamente questa affermazione.
8.2. EQUAZIONI DEL PRIMO ORDINE A VARIABILI SEPARABILI163

In questo caso, pur essendo l’equazione definita per ogni possibile coppia
(x, y) del piano cartesiano, la soluzione y è definita solo su un intervallo limi-
tato superiormente. Di più, l’ampiezza dell’intervallo dipende dal valore ini-
ziale. Ad esempio per λ > 0 la funzione yλ (x) = λ/(1 − λx), x ∈ (−∞, 1/λ),
è la soluzione del problema di Cauchy
 0
y (x) = y(x)2
y(0) = λ.

Osserviamo che. per x → 1/λ, yλ (x) → +∞. Per questa ragione, parliamo
di esplosione della soluzione al “tempo” x = 1/λ.

Per ragioni di tempo ed opportunità, ci limiteremo a considerare solo il


caso delle equazioni a variabili separabili, cioè equazioni differenziali del tipo

y 0 (x) = f (x)g(y(x)),

dove f : (a, b) → R e g : (c, d) → R sono funzioni di una sola variabile.


Il seguente teorema ci tranquillizza rispetto all’esistenza e all’unicità della
soluzione.

Teorema 8.5. Siano f : (a, b) → R e g : (c, d) → R due funzioni derivabili


con continuità, dove i due intervalli di definizione possono essere eventual-
mente illimitati. Per ogni x0 ∈ (a, b), y0 ∈ (c, d) il problema di Cauchy
 0
y (x) = f (x)g(y(x))
y(x0 ) = y0

possiede una ed una sola soluzione y : (α, β) → R.

Quindi, se le nostre equazioni a variabili separabili sono unicamente risol-


vibili (sotto le ipotesi del teorema, ovviamente), resta da capire se sia pos-
sibile scrivere esplicitamente le soluzioni. Vediamo un modello tratto dalla
Fisica.
A volte in un processo di crescita intervengono fattori esterni. È il ca-
so di una popolazione (ad esempio di batteri) la cui crescita dipende dalla
produzione di cibo. Se si mantiene costante il cibo disponibile, sufficiente di-
ciamo per L elementi della popolazione, ci si può aspettare che la rapidità di
crescita tenda a zero quando il numero di individui y tende a L. Un modello
semplice è l’equazione differenziale
 y
y 0 = ky 1 − ,
L
164 CAPITOLO 8. EQUAZIONI DIFFERENZIALI ORDINARIE

detta equazione logistica. Il parametro k è una costante del problema, e


cerchiamo le soluzioni del problema di Cauchy

y = ky 1 − Ly
 0 

y(0) = λ.

Il Teorema 8.5 dà in particolare l/unicità della soluzione. Vediamo di “indo-


vinare” una soluzione del nostro problema.
Se λ = L, allora la soluzione costante y(x) = L per ogni x ∈ R è soluzione.
Se λ 6= L, riscriviamo formalmente l’equazione come

dy
 = k dx
y 1 − Ly

che suggerisce per integrazione dei due membri



y
log = kx + C, C ∈ R.
y − L

Ricavando y,
cL
y(x) = , c ∈ R.
c + e−kx
Imponendo che y(0) = L, ricaviamo la condizione

cL

c−1
che identifica esattamente l’unica soluzione nel caso λ 6= L. Notiamo che no
avremmo potuto ricavare la soluzione costante in questo modo.

Cerchiamo adesso di adattare la tecnica dell’esempio all’equazione a va-


riabili separabili generale. Notiamo che se g(ȳ) = 0, la funzione y(x) = ȳ per
ogni x è una soluzione. Quindi, se y è una soluzione allora o y è costante
oppure y(x) non annulla mai la g. In quest’ultimo caso, g(y(x)) 6= 0 per ogni
x, e dividendo l’equazione per g(y(x)) si ottiene

y 0 (x)
= f (x).
g(y(x))

Se integriamo fra x0 e x, con la formula di integrazione per sostituzione


arriviamo a Z y(x) Z x 0 Z x
1 y (t)
dy = dt = f (s) ds.
y0 g(y) x0 g(y(t)) x0
8.2. EQUAZIONI DEL PRIMO ORDINE A VARIABILI SEPARABILI165

Chiamando F una primitiva di f e G una primitiva di 1/g, abbiamo ricavato


la soluzione in forma implicita:

G(y(x)) − G(y0 ) = F (x) − F (x0 ).

Ora, è possibile dimostrare che G è strettamente monotona, dunque inverti-


bile. Possiamo ricavare y(x) dalla relazione sopra:

y(x) = G−1 (F (x) − F (x0 ) + G(y0 )) .

In teoria, abbiamo trovato l’unica soluzione esplicitamente. In pratica, oc-


corre una dose di sano realismo: il calcolo delle primitive F e G, e soprattutto
il calcolo della fuzione inversa di G, sono spesso di difficoltà insormontabile.
Con questo non vogliamo incoraggiare lo studente a catalogare come impos-
sibile la risoluzione delle equazioni differenziali: gli esercizi dei temi d’esame
sono costruiti in modo che lo studente possa fare esplicitamente tutti i calcoli
necessari ad arrivare alla formula della soluzione.

Esempio: capitale ed interessi. Supponiamo di depositare in banca un


certo capitale u0 ad un tasso di interesse p computato continuamente. Questo
significa che in un intervallo di tempo infinitesimo dt il capitale aumenta
di una somma du = pu(t) dt proporzionale alla durata dell’intervallo e al
capitale stesso u(t). Dividendo7 per dt, otteniamo l’equazi one differenziale

u0 (t) = pu(t).

Essendo a variabili separabili, la soluzione si ottiene facilmente, ed è espressa


dalla formula
u(t) = u0 ept .
Supponiamo ora di ritirare con regolarità una certa rendita (costante) b. In
questo caso l’andamento del capitale risponderà all’equazione

u0 (t) = pu(t) − b.

È ancora a variabili separabili, e la sua soluzione si ricava risolvendo rispetto


a u l’equazione
1
log(pu − b) = t + C,
p
cioè
1
Cept + b .

u(t) =
p
7
Questi ragionamenti sono formali, ed infatti i veri interessi vengono computati ad
intervalli di tempo prefissati.
166 CAPITOLO 8. EQUAZIONI DIFFERENZIALI ORDINARIE

C+b
La costante C si ricava imponendo che u(0) = u0 , da cui u0 = p
, e dunque
C = pu0 − b. In conclusione

1
(pu0 − b)ept + b .

u(t) =
p

Si danno tre casi.

1. b < pu0 . In questo caso il capitale aumenta con il tempo, anche se


meno velocemente di quanto avveniva senza prelievo. In effetti, tutto
avviene come se si fosse partiti da un capitale iniziale u0 − pb , remunerato
all’interesse p, più un capitale fisso b/p non remunerato.

2. b > pu0 . Se si preleva troppo, il capitale diminuisce, e si estingue


in un tempo T che può essere calcolato imponendo che u(T ) = 0.
Esplicitamente, dobbiamo risolvere rispetto a T l’equazione

(pu0 − b)epT + b = 0.

Ricavando T , troviamo

1 b
T = log .
p b − pu0

3. b = pu0 . In questo caso il capitale rimane costante, sempre uguale a


u0 = b/p.

Notiamo che il capitale u0 ed il prelievo b possono essere negativi: se b > pu0


stiamo parlando di un prestito che viene estinto con versamenti regolari. A
volte può essere interessante sapere quanto occorre versare per estinguere
un prestito u0 in un certo numero T di anni. Si deve semplicemente porre
u(T ) = 0 e ricavare b:
epT
b = pu0 pT .
e −1
Se si vuole estinguere il prestito di 100 000 euro al 10% in 10 anni, si dovrà
pagare una rata di
e
b = 10000 ≈ 15800
e−1
euro all’anno, cioè circa 1317 euro al mese. Questo esempio è tratto da [13].
8.3. EQUAZIONI LINEARI DEL SECONDO ORDINE 167

8.3 Equazioni lineari del secondo ordine a coef-


ficienti costanti
Come detto nell’introduzione al capitolo, le equazioni lineari possiedono ca-
ratteristiche particolari. In questo paragrafo vedremo come utilizzare la linea-
rità dell’equazione per determinare le soluzioni. Per semplicità, ci limiteremo
alle equazioni lineari del secondo ordine a coefficienti costanti:

ay 00 + by 0 + cy = f, (8.9)

dove a, b e c sono numeri reali mentre f è una funzione assegnata.


Osservazione 8.6. Ogni equazione di ordine due può essere ricondotta ad
un sistema di equazioni di ordine uno. Consideriamo ad esempio la (8.9), e
introduciamo l’incognita ausiliaria v = y 0 . Allora la (8.9) equivale al sistema
 0
av + bv + cy = f
y 0 = v.

Da un punto di vista teorico, si tratta di un risultato di importanza fonda-


mentale, poiché permette di studiare solamente i sistemi di equazioni diffe-
renziali di primo ordine. Dal punto di vista pratico, spesso è più conveniente
sfruttare tecniche particolari, e la riduzione ad un sistema non offre molto
aiuto.
Come per le equazioni lineari del primo ordine, consideriamo innanzitutto
il caso omogeneo f = 0.
L’equazione ay 00 +by 0 +cy = 0 suggerisce la ricerca di soluzioni y tali che y,
y e y 00 siano multipli di una medesima funzione. Cerchiamo allora una solu-
0

zione y(x) = erx , per oppurtuni valori di r ∈ R. Sostituendo nell’equazione,


troviamo in effetti
erx ar2 + br + c = 0.


Questa identità può essere soddisfatta soltanto se

ar2 + br + c = 0 (8.10)

La teoria delle equazioni algebriche di secondo grado ci dice che le soluzioni


reali di (8.10) sono due, una8 oppure nessuna a seconda che il discriminante
8
Gli insegnanti delle scuole superiori amano parlare di due radici coincidenti. Non
è sbagliato, ed anzi in certi casi è di grande aiuto usare tale espressione. Per i nostri
scopi, sarebbe come dire che oggi indosso due paia di pantaloni coincidenti: logicamente
ineccepibile ma francamente superfluo. Tutto si sitema introducendo la molteplicità delle
radici di un polinomio, concetto comunque be al di là dei limiti del nostro corso.
168 CAPITOLO 8. EQUAZIONI DIFFERENZIALI ORDINARIE

∆ = b2 −4ac sia positi vo, nullo oppure negativo. Schematicamente, vediamo


come trovare le soluzioni nei tre casi.

(1) Due radici reali. L’equazione (8.10) possiede due radici reali distinte
r1 e r2 , e dunque le due funzioni

x 7→ er1 x , x 7→ er1 x

sono soluzioni. Per il principio di sovrapposizione, l’integrale generale dell’e-


quazione omogenea è
y(x) = c1 er1 x + c2 er2 x . (8.11)

(2) Una radice reale. Se ∆ = 0, l’unica radice reale è

b
r=− .
2a
Dunque abbiamo trovato una soluzione
b
x 7→ e− 2a x

per l’equazione omogenea. Malauguratamente, questa non basta a descrivere


l’integrale generale. Possiamo tuttavia provare a cercare una soluzione della
forma
b
x 7→ e− 2a x u(x).
Sostituendo, otteniamo la condizione (r = −b/(2a))
b
0 = e− 2a x (ar2 + br + c)u + au00 + (2ar + b)u0 = au00 .


Dunque u00 = 0, e integrando due volte u(x) = c1 + c2 x. L’integrale generale


della nostra equazione omogenea è pertanto
b
y(x) = e− 2a x (c1 + c2 x) . (8.12)

(3) Nessuna radice reale. Questo caso è sempre il più difficile da ana-
lizzare. Non avendo a disposizione l’algebra dei numeri complessi, è piutto-
sto macchinoso costruire le soluzioni. Ci limitiamo pertanto a proporle “ex
cathedra”. Definiamo

b 4ac − b2
α= , ω= .
2a 2a
8.3. EQUAZIONI LINEARI DEL SECONDO ORDINE 169

L’integrale generale nel caso ∆ < 0 si scrive

y(x) = Ae−αx cos(ωx + ϕ) (8.13)

al variare delle costanti A ≥ 0 e ϕ ∈ [−π/2, π/2). In alternativa, le formule


di addizione per la funzione coseno dicono che l’integrale generale può essere
scritto
y(x) = e−αx (C1 sin(ωx) + C2 cos(ωx)) , (8.14)
al variare delle costanti reali C1 e C2 . Questa formula è meno concisa della
precedente, ma spesso preferibile per fare i calcoli.

Il caso non omogeneo si discute usando il principio di sovrapposizione:


si trova l’integrale generale dell’equazione omogenea e si somma ad una so-
luzione particolare dell’equazione non omogenea. Tutto sta nel calcolare
quest’ultima. Vi sono essenzialmente tre modi, per le equazioni del secondo
ordine a coefficienti costanti.

1. Procedere per tentativi. Ad esempio, se f è un polinomio di grado n,


si cerca una soluzione particolare che sia un polinomio di grado n + 2.
Questa tecnica è la più semplice ma anche la più rischiosa, dato che
funziona solamente per classi molto ristrette di funzioni f .

2. Utilizzare il metodo della variazione delle costanti. Siano y1 e y2 due so-


luzioni dell’equazione omogenea. Si cerca una soluzione dell’equazione
non omogenea del tipo

yf (x) = c1 (x)y1 (x) + c2 (x)y2 (x), (8.15)

dove c1 e c2 sono funzioni incognite. Oltre al fatto che yf risolva l’equa-


zione, si impone la condizione ausiliaria9 c01 (x)y1 (x) + c02 (x)y2 (x) = 0.
Per trovare le incognite c1 e c2 occorre perciò risolvere il sistema

c01 (x)y1 (x) + c02 (x)y2 (x) = 0



(8.16)
c01 (x)y10 (x) + c02 (x)y20 (x) = f (x).

A dispetto delle apparenze, questo sistema non è di difficile soluzione:


basta ricavare algebricamente c01 e c02 , e integrare.
9
Se avessimo il tempo per la teoria generale delle equazioni differenziali lineari, po-
tremmo far vedere che questa condizione è tutt’altro che artificiosa. Si veda [9] per i
dettagli.
170 CAPITOLO 8. EQUAZIONI DIFFERENZIALI ORDINARIE

3. Utilizzare la formula di Duhamel.10 Se u è la soluzione del problema di


Cauchy  00
 au + bu0 + c = 0
u(0) = 0 (8.17)
 0
u (0) = 1,
allora Z x
yf (x) = u(x − s)f (s) ds.
0
Si potrebbe dimostrare che questa espressione altro non è che una con-
seguenza del metodo di variazione delle costanti. L’esperienza didattica
insegna che questo metodo risolutivo non è particolarmente gradito agli
studenti.
Esempio 8.7. Applichiamo tutti questi metodi all’equazione
y 00 − y = x2 . (8.18)
La soluzione generale dell’equazione omogenea y 00 = y = 0 è y(x) = c1 ex +
c2 e−x . Poiché il secondo membro dell’equazione è un polinomio di grado
2, cerchiamo un polinomio di grado 4 che sia una soluzione particolare. Il
generico polinomio di quarto grado ha la forma a0 + a1 x + a2 x2 + a3 x3 + a4 x4 ,
e sarà una soluzione di (8.18) se e solo se
12a4 x2 + 6a3 x − 2a2 − a0 − a1 x − a2 x2 − a3 x3 − a4 x4 = x2
per ogni x. Uguagliando i coefficienti delle stesse potenze di x, dobbiamo
risolvere il sistema 

 a4 = 0

a3 = 0



12a4 − a2 = 1

6a3 − a1 = 0





2a − a = 0.
2 0

Operando per sostituzione, troviamo molto facilmente l’unica soluzione a0 =


−2, a1 = 0, a2 = −1, a3 = a4 = 0. Quindi una soluzione particolare è la
funzione polinomiale x 7→ −x2 − 2.
Se usiamo invece il metodo della variazione delle costanti, dobbiamo
risolvere il sistema (
ex c01 + e−x c02 = 0
ex c01 − e−x c02 = x2 ,
10
Questa formula è spesso attribuita a Cauchy, che la utilizzò in una forma equivalente
ma diversa da quella che riportiamo. È interessante osservare che la formula di Duhamel
vale per tutte le equazioni differenziali lineari.
8.3. EQUAZIONI LINEARI DEL SECONDO ORDINE 171

che ci porta immediatamente a


1 1
c01 = x2 e−x , c02 = − x2 ex .
2 2
Integrando, c1 = (− 12 x2 − x − 1)e−x , c2 = (− 12 x2 + x − 1)ex , e quindi la
soluzione particolare è

yf (x) = c1 ex + c2 e−x = −x2 − 2.

Utilizzando infine la formula di Duhamel, si trova che


Z x 
1 x−2 1 s−x 2
yf (x) = e − e s ds
0 2 2
1 x x 2 −s 1 −x x 2 s
Z Z
= e s e ds − e s e ds.
2 0 2 0

Lasciamo al lettore il calcolo di questi ultimi due integrali (suggerimento:


integrare per parti due volte). Alla fine si giunge allo stesso risultato: yf (x) =
−x2 − 2. In conclusione, la soluzione generale di (8.18) è

y(x) = c1 ex + c2 e−x − x2 − 2.

Sembra evidente che, almeno per funzioni f di tipo molto particolare, con-
viene almeno tentare di indovinare una soluzione particolare yf con il primo
metodo.

Esempio 8.8. Vogliamo risolvere11 l’equazione

e−x
y 00 + 2y 0 + y = .
x
Osserviamo che il polinomio associato all’equazione è λ2 +2λ+1 = 0, che pos-
siede la radice doppia λ = −1. Dunque la soluzione generale dell’equazione
omogena sarà y0 (x) = C1 e−x + C2 xe−x . Occorre determinare una soluzione
particolare dell’equazione completa. Poiché sembra improbabile indovinare
ad occhio una soluzione, ricorriamo alla formula di Duhamel. La soluzione
del problema 
00 0
y + 2y + y = 0

y(0) = 0

 0
y (0) = 1
11
Con questa espressione intenderemo sempre che vogliamo calcolare la soluzione
generale.
172 CAPITOLO 8. EQUAZIONI DIFFERENZIALI ORDINARIE

è la funzione ȳ(x) = xe−x : basta imporre le condizioni y(0) = 0 e y 0 (0) = 1


e determinare le giuste costanti C1 e C2 . Quindi la teoria ci dice che
Z x Z x
e−s e−s
yf (x) = ȳ(x − s) ds = (x − s)e−(x−s) ds
1 s 1 s
Z x Z x
x − s −2−t+s x − s −x
= e ds = e ds
1 s 1 s
Z x
x−s
= e−x ds = e−x [x log |s| − s]s=x
s=1
1 s
= e−x (x log x − x + 1) .

Un’osservazione: abbiamo integrato fra 1 ed x invece che fra 0 ed x perché


la funzione a secondo membro dell’equazione non è definita in 0. Infine, la
soluzione generale della nostra equazione è

y(x) = C1 e−x + C2 xe−x + x(log x − 1)e−x .

Per inciso, si potrebbe far vedere che la formula di Duhamel è solo un


caso particolare del metodo della variazione delle costanti. La formula di
Duhamel sembra il metodo più invitante, sebbene sia in realtà abbastanza
insidiosa a causa degil integrali complicati a cui conduce.

Quasi tutto quello che abbiamo esposto è tratto da [11]. Numerosi esempi,
modelli e tecniche risolutive per le equazioni differenziali ordinarie si trovano
nei primi capitoli del libro [17]. Pur non presentando alcuna giustificazione
teorica dei risultati, in questo agile libretto lo studente interessato può facil-
mente impratichirsi con la risoluzione delle equazioni differenziali più comuni.
Si veda anche [8].
Capitolo 9

Metodi del calcolo approssimato

In quest’ultimo capitolo, affronteremo succintamente alcuni problemi del-


l’Analisi Numerica. Pur tenendoci a un livello di difficoltà davvero basso,
abbiamo l’ambizione di proporre alcuni metodi di calcolo approssimato. In
particolare, proporremo il metodo di interpolazione di Lagrange per costruire
un polinomio che unisca dei punti del piano cartesiano. Di seguito, vedre-
mo tre modi per tovare approssimazioni numeriche degli integrali definiti.
Trattandosi di argomenti complementari al corso, non ci soffermeremo su
molti dettagli, né discuteremo la questione più importante di tutta l’Analisi
Numerica: quella della precisione dei metodi.

9.1 Interpolazione polinomiale


Supponiamo che, durante un esperimento di laboratorio, le misurazioni ci
forniscano delle coppie numeriche rappresentative di una quantità fisica o
chimica in relazione a un’altra quantità variabile:

(x1 , y1 ), (x2 , y2 ), . . . , (xn , yn ).

La prima cosa che ci viene in mente di fare è di segnare tali punti nel piano
cartesiano, cenrcando di capire se esista una relazione fra i valori delle x e
quelli delle y.1
Innanzitutto, la presenza di punti con uguale ascissa e diverse ordinate
creerebbero problemi insormontabili, perché non ci sarebbe speranza di avere
1
Chi scrive è un matematico “puro”, e in queste situazioni è convinto che dieci o cento
punti nel piano non servano assolutamente a niente. Anche se fossero allineati lungo
una retta orizzontale, la logica matematica non ci permetterebbe di trarre la conclusione
che ogni scienziato “applicato” ne trarrebbe. Chi ci dice che, facendo anche solo una
misurazione in più, non troveremmo un punto completamente disallineato?

173
174 CAPITOLO 9. METODI DEL CALCOLO APPROSSIMATO

la y in funzione della x. Sbarazziamoci fin d’ora di tale caso, peraltro ridicolo


da un punto di vista sperimentale. Infatti, se alla stessa x corrispondessero
due valori sperimentali distinti della y, dovremmo concludere che non siamo
capaci di fare l’esperimento.
In seconda battuta, fin da bambini ci siamo divertiti a “unire i puntini”
sulle riviste di enigmistica. Questo metodo funziona sempre, e produce una
funzione continua il cui grafico è la spezzata che congiunge i dati sperimentali.
Quasi sicuramente, questa funzione non sarà però derivabile nei punti di
congiunzione. E soprattutto sarebbe presuntuoso ipotizzare che proprio quei
pochi dati calcolati siano gli “spigoli” della vera funzione che lega le ordinate
alle ascisse. Raramente i fenomeni macroscopici misurabili in laboratorio
presentano comportamenti spigolosi.
Ben consci di tutte queste difficoltà, rivolgiamo allora lo sguardo verso
una classe di funzioni che uniscono vari pregi: facilità di derivazione, di
integrazione, di calcolo dei valori. Stiamo parlando dei polinomi.
Ora, c’è un evidente legame fra il numero di dati sperimentali e il grado del
polinomio che vogliamo trovare. Se abbiamo due coppie di punti, possiamo
unirli con una retta univocamente individuata2 , ma possiamo anche unirli
con infiniti rami di parabole variamente disposte nel piano cartesiano. Per
convincere di ciò anche lo studente più scettico, scegliamo i due punti (−1, 0)
e (1, 0). La retta orizzontale y = 0 li congiunge, ma anche tutte le parabole
y = a(x2 − 1) al variare di a ∈ R.
Riassumendo, con due punti abbiamo un unico polinomio di grado 1 =
2 − 1, e infiniti polinomi di grado maggiore di 1. Per tre punti, la geometria
analitica delle scuole superiori ci assicura che esiste una ed una sola para-
bola che li unisce, ma è facile costruire infiniti polinomi di quarto grado che
passano per tali punti. Ci sembra di vedere un legame fra il numero n + 1
di dati sperimentali e il grado n del polinomio univocamente determinato. Il
seguente teorema non solo ci conforta in questa convinzione, ma ci fornisce
una formula esplicita per scrivere tutti i coefficienti del polinomio di grado n
voluto.

Teorema 9.1 (Polinomio interpolatore di Lagrange). Dati n+1 punti distinti


x0 , x1 , . . . , xn e n + 1 numeri reali y0 , y1 , . . . , yn non necessariamente distinti,
esiste uno ed un solo polinomio P di grado (minore o uguale a) n tale che
P (xj ) = yj per ogni j = 0, 1, 2, . . . , n. Questo polinomio è dato da
n
X yk Ak (x)
P (x) = , (9.1)
k=0
Ak (xk )

2
Il famoso assioma “per due punti passa una ed una sola retta”.
9.1. INTERPOLAZIONE POLINOMIALE 175

dove Y
Ak (x) = (x − xj ).
j6=k

Certo, ilQpolinomio interpolatore ha un aspetto vagamente misterioso.


Il simbolo di produttoria è analogo a quello della sommatoria: serve a
scrivere brevemente i prodotti invece che le somme. Vediamo di spiegare
brevemente perché il polinomio di Lagrange ha proprio questo aspetto. Par-
tendo dal caso molto semplice di due punti x0 e x1 , consideriamo le due
espressioni x − x0 e x − x1 . La prima si annulla per x = x0 , la seconda per
x = x1 . Se poi le dividiamo opportunamente, troviamo le espressioni
x − x0 x − x1
, .
x 1 − x0 x 0 − x1
La prima vale 1 per x = x1 . mentre la seconda vale 1 per x = x0 . Pertanto
l’espressione
x − x0 x − x1
y0 + y1
x1 − x0 x0 − x1
vale y0 per x = x0 e y1 per x = x1 . Ovviamente, al variare di x ∈ R,
questa espressione rappresenta un polinomio di primo grado. Confrontandolo
con il Teorema precedente, abbiamo costruito esattamente il polinomio di
Lagrange di primo grado. Non è difficile convincersi che il generico polinomio
di Lagrange di grado n si costruisce seguendo lo stesso principio: prima si
trovano n polinomi Aj , j = 0, 1, . . . , n, che hanno la proprietà

Aj (xi ) = 0 per ogni i 6= j,

e poi si divide per Aj (xj ) in modo da ottenere un’espressione polinomiale che


vale 1 per x = xj . Infine si moltiplica ognuna di queste espressioni per yj e
si somma rispetto a j. Il risultato è esattamente il polinomio interpolatore
di Lagrange.

Osservazione. Un approccio più concreto è il seguente. Vogliamo un


polinomio di grado (al più) n, e lo scriviamo nella forma
n
X
P (x) = ak x k .
k=0

Come troviamo i coefficienti incogniti a0 , a1 , ecc.? È semplice: imponendo


le condizioni
P (xj ) = yj , j = 0, . . . , n.
176 CAPITOLO 9. METODI DEL CALCOLO APPROSSIMATO

Ricaviamo un sistema di n + 1 equazioni lineari nelle n + 1 incognite aj ,


j = 0, . . . , n. Risolvendo questo banale3 sistema, ricaveremo il polinomio
interpolatore. Salvo errori di calcolo, l’unicità di tale polinomio significa che
ad esso possiamo arrivare in qualunque modo ci faccia comodo.

Trovato il polinomio interpolatore, che ne facciamo? In primo luogo, lo


possiamo usare proprio per interpolare, cioè per “indovinare” i valori della
funzione sperimentale nei punti compresi fra i nodi sperimentali usati per la
costruzione del polinomio.4 Solo per fare un esempio di interesse storico e
matematico, le celebri tavole dei logaritmi con cui nei secolo scorsi generazioni
di ingegneri hanno fatto i loro calcoli erano basate sull’interpolazione lineare.
Più correttamente, le tavole riportavano una grande quantità di “nodi” (i cui
logaritmi erano calcolati con metodi che qui non possiamo approfondire). Se
si voleva calcolare il logaritmo di un numero che non appariva sulle tavole, lo
si localizzava fra i due nodi adiacenti, e si faceva l’interpolazione lineare fra di
essi. Questo procedimento comportava un errore, tutto sommato trascurabile
grazie alla densità dei nodi. Ci auguriamo vivamente che il nostro studente
non si abbandoni a sorrisi di scherno verso i suoi “avi” scienziati. Se è vero
che i moderni calcolatori sanno operare con precisione molto alta, anch’essi
forniscono risposte approssimate. Facendo qualche confronto fra i risultati
del metodo delle tavole e quelli di una calcolatrice scientifica a dieci cifre
decimali, ci si accorge che le tavole “sbagliano” mediamente dalla quinta cifra
in poi. Un confronto decisamente lusinghiero, se si considera che le tavole
erano preparate calcolando con carta e matita!
Un altro uso possibile del polinomio interpolatore è quello di usarlo per
calcolare l’integrale della funzione sperimentale incognita. Infatti, questo
integrale potrebbe avere un significato concreto, e sarebbe pressoché impos-
sibile stimarne il valore in altro modo. Su questo problema ritorneremo nella
prossima sezione. Più delicato e addirittura sconsigliabile se non come ultimo
tentativo è l’uso del polinomio per calcolare la derivata della funzione speri-
mentale. La ragione di questo scetticismo dovrebbe essere chiaro. I grafici
di due funzioni possono essere molto vicini nel piano cartesiano, ma avere
pendenze molto diverse. Si pensi, intuitivamente, a una funzione costante e
a una funzione che oscilla “furiosamente” fra due valori vicini alla costante.
La prima ha pendenza identicamente nulla, la seconda ha pendenze molto
3
D’accordo, stiamo facendo dell’ironia fuori luogo.
4
Si parla invece di estrapolazione quando si pretende di calcolare i valori esterni al più
piccolo e al più grande nodo sperimentale. Questo è un procedimento molto pericoloso.
Se dati sperimentali molto fitti possono ragionevolmente indurre a un miglioramento del-
l’interpolazione, nulla ci rassicura sul fatto che il polinomio approssimi bene la funzione
sperimentale a grande distanza dai valori calcolati in laboratorio.
9.2. INTEGRAZIONE NUMERICA 177

brusche vicino alle oscillazioni. Poiché il nostro polinomio interpolatore è


costruito solo ed esclusivamente per assumere gli stessi valori della funzione
sperimentale nei nodi calcolati, è difficile credere che serva ad approssimare
accuratamente la derivata. Anche per gli esperti, la derivazione numerica
è un argomento tra i più difficili, e naturalmente non ce ne occuperemo in
questa sede.

Osservazione 9.2. Esistono altri tipi di approssimazione polinomiale, an-


ch’essi molto diffusi nei problemi delle scienze applicate. Un primo esempio
è quello di cercare un polinomio che passi per i nodi (xj , yj ) e che in tail
punti abbia un assegnato valore della derivata prima. I polinomi che se ne
ricavano5 prendono il nome di polinomi di Hermite. Pur senza soffermarci
sulle loro proprietà, è evidente che a parità di nodi occorrono polinomi di
grado più alto che per la semplice int erpolazione di Lagrange. Pensiamo ai
due punti: sappiamo che per essi passa esattamente un polinomio di grado
uno, ma il valore della derivata nei due nodi è fissato (e costante per i due
punti). Volendo prescrivere anche i due valori della derivata nei due nodi, ci
serev un polinomio di grado maggiore. Ne deduciamo che l’interpolazione di
Hermite fornisce polinomi sensibilmente diversi da quelli di Lagrange.
Un altro esempio è quello della ricerca della retta che “meglio approssima”
un insieme di punti del piano cartesiano. Abbiamo virgolettato la richiesta di
approssimazione perché non vogliamo entrare nei dettagli di questo metodo.
È però evidente che non si pu ò parlare di interpolazione: se prendiamo tre
punti non allineati nel piano cartesiano, non ci sarà nessuna retta di inter-
polazione. Ha invece senso chiedersi quale sia (se esiste) la retta che passa
più vicino a tutti i punti segnati. Fra i metodi più popolari per trattare
questo problema è quello dei minimi quadrati. Facciamo un esempio nume-
rico: prendiamo i tre punti di coordinate (−1, 0), (0, 0) e (1, 0), osservano
che appartengono alla parabola di equazione y = x2 . Si calcola abbastanza
velocemente che la retta che passa più vicino a questi punti ha equazione
y = 1/2. Siamo ben lontani dal concetto di interpolazione.

9.2 Integrazione numerica


Ci poniamo il problema di calcolare, con un’approssimazione prefissata, un
integrale definito
Z b
f (x) dx,
a

5
Lo studente rifletta sul fatto che non è affatto banale che tali polinomi esistano.
178 CAPITOLO 9. METODI DEL CALCOLO APPROSSIMATO

dove f è una funzione continua. Non è sempre possibile conoscere esplici-


tamente una primitiva di f o, comunque, esprimere il valore dell’integrale
mediante una formula in cui compaiono solo funzioni elementari; anzi si può
dire che queste situazioni favorevoli devono ritenersi eccezionali. Presentere-
mo tre metodi, tutti ispirati più o meno direttamente alla definizione stessa
di integrale di Riemann.

8.2.1 Il metodo dei rettangoli


Fissato un intero n > 0, si ponga
b−a
xk = a + k (k = 0, 1, . . . , n)
n
e si assuma come valore approssimato dell’integrale
b−a
Sn = (f (x0 ) + f (x1 ) + · · · + f (xn−1 )) .
n
Il seguente risultato esprime la precisione con cui Sn approssima il vero valore
dell’integrale.
Teorema 9.3. Ammettendo che, per qualche costante M1 > 0 si abbia
|f 0 (x)| ≤ M1 in [a, b] risulta
Z b
M1 (b − a)2


Sn − f (x) dx ≤ .

a
2 n
Rb
Quindi vediamo che limn→+∞ Sn = a f (x) dx, e l’errore commesso tende
a zero come 1/n.

8.2.2 Il metodo delle tangenti


Il metodo precedente, come era da aspettarsi, è piuttosto grossolano.
L’intuizione
P ci dice che, quando f sia abbastanza regolare, una somma del
tipo k (xk − xk−1 )f (zk ) fornisca una migliore approssimazione dell’integrale
se per ogni intervallo il punto zk coincide con il punto medio, cioè zk =
(xk−1 + xk )/2. Sia dunque ancora
b−a
xk = a + k (k = 0, 1, . . . , n)
n
e sia
xk−1 + xk
zk = .
2
Poniamo
b−a
Sn0 = (f (z1 ) + f (z2 ) + · · · + f (zn )) .
n
9.2. INTEGRAZIONE NUMERICA 179

Teorema 9.4. Sia f una funzione dotata di derivate prima e seconda con-
tinue in [a, b] e si abbia |f 00 (x)| ≤ M2 . Allora
Z b
M2 (b − a)3

0
Sn − f (x) dx ≤ .

a
24 n2

A parità di nodi, questo metodo fornisce effettivamente un’approssima-


zione migliore.

Osservazione. Spesso si definisce uno stimatore della precisione numerica,


chiamato ordine del metodo. Prendendo come funzioni–campione i soliti
polinomi, un metodo numerico è di ordine N se esso è esatto (cioè non si
comemtte nessun errore) per tutti i polinomi di ordine (non superiore a) N .
È facile convincersi che sia il metodo dei retatngoli che quelo dei trapezi sono
di ordine N = 1. Basta pensare alla costruzione delle approssimazion per
rendersi conto che Sn e Sn0 coincidono con il valore dell’integrale di f ogni
volta che f è una funzione lineare. In questo senso, invitiamo lo studente ad
usare con la dovuta cautela il concetto di precisione per i metodi numerici.
Potendosi dimostrare l’ottimalità delle stime fornite dai teoremi precedenti,
deduciamo che l’ordine è uno stimatore che non si sovrappone alla velocità
con cui l’errore tende a zero. D’altra parte, l’ordine non fa ricorso al numero
di derivate disponibili per la funzione integranda, e questo lo rende sensato
anche per le funzioni che siano solo continue. Avvertiamo che i tre metodi
precedenti sono esposti anche in [12], dove però le formule relative agli errori
sono decisamente migliorabili. Una rapida ispezione delle stime mostra che
esse sono matematicamente rigorose, ma diverse da quelle dei nostri teoremi
proprio in quanto è richiesta meno regolarità alla funzione integranda.

8.2.3 Il metodo di Cavalieri–Simpson


Il metodo delle tangenti consiste nel compiere l’integrazione dopo aver
sostituito, in ciascun intervallo della suddivisione, il grafico della funzione
con la tangente al grafico, in corrispondenza al punto di mezzo.
Viene spontaneamente l’idea di introdurre una curva che meglio appros-
simi il grafico, almeno quando queto sia abbastanza “liscio”. Il metodo che
esponiamo consiste nell’approssimare il grafico con un arco di parabola, che
coincida con la curva in corrispondenza degli estremi di ciascun intervallo e
del punto di mezzo. 6
Presa dunque la suddivisione {x0 , x1 , . . . , xn } dell’intervallo [a, b] in n in-
tervalli di uguale ampiezza, e posto zk = (xk−1 + xk )/2, consideriamo un
6
Ricordiamo infatti che servono tre punti distinti per determinare univocamente una
parabola che li congiunga.
180 CAPITOLO 9. METODI DEL CALCOLO APPROSSIMATO

polinomio di secondo grado, che potrà essere scritto nella forma


pk (x) = α(x − zk )2 + β(x − zk ) + γ,
e imponiamo le condizioni
pk (xk−1 ) = f (xk−1 ), pk (zk ) = f (zk ), pk (xk ) = f (xk ).
Ponendo
b−a
xk − zk = zk − xk−1 = σ = ,
2n
si avrà
γ = f (zk )
ασ 2 + βσ = f (xk ) − f (zk )
ασ 2 − βσ = f (xk−1 ) − f (zk ).
Si ha poi7
Z xk x k
(x − zk )3

2
pk (x) dx = α + γ(x − zk ) = ασ 3 + 2γσ.
xk−1 3 xk−1 3
Ricavando α e γ dal sistema,
Z xk
f (xk ) + f (xk−1 ) + 4f (zk )
pk (x) dx = σ
xk−1 3
b − a f (xk ) + f (xk−1 ) + 4f (zk )
= .
n 6
Sommando rispetto all’indice k, otteniamo la seguente espressione approssi-
mata dell’integrale:
n
b − a X f (xk ) + f (xk−1 ) + 4f (zk )
Sn? =
n k=1 6
b − a  
= f (x0 ) + f (xn ) + 2 f (x1 ) + f (x2 ) + · · · + f (xn−1 )
6n  
+ 4 f (z1 ) + f (z2 ) + · · · + f (zn ) .
Teorema 9.5. Sia f una funzione continua con le sue derivate fino al quarto
ordine in [a, b] e sia |D4 f (x)| ≤ M4 . Allora
Z b
M4 (b − a)5 1

?
Sn − f (x) dx ≤ .

a
2880 n4
7
Il termine β2 (x−zk )2 si semplifica perché stiamo integrando su un intervallo simmetrico
rispetto a zk .
9.2. INTEGRAZIONE NUMERICA 181

Dalla costruzione emerge chiaramente che il metodo di Cavalieri–Simpson


è esatto per i polinomi di secondo grado, e dunque è un metodo di ordine
N = 2.
Osservazione 9.6. Avvertiamo lo studente che su molti testi vengono utiliz-
zate notazioni diverse. Noi abbiamo introdotto, per ogni coppia di nodi xk e
xk+1 un noto di comodo zk . Altri autori prendono invece tre nodi consecutivi
xk−1 , xk e xk+1 della suddivisione, considerando ovviamente xk alla stregua
del nostro zk . A questo punto però bisogna scegliere obbligatoriamente n
pari, altrimenti non si riesce ad arrivare a b con l’ultimo passaggio. È chiaro
che l’idea resta sempre quella di approssimare f mediante archi di parabola.
Concludiamo con un confronto: cerchiamo di approssimare
Z 2
dx
log 2 = .
1 x
Prendendo n = 4 nel metodo delle tangenti, i punti di mezzo saranno
9 11 13 15
, , , .
8 8 8 8
Troviamo dunque
 
1 8 8 8 8
S40 = + + + = 0.6910
4 9 11 13 15
mentre log 2 = 0.6931... Con 4 suddivisioni, il valore è corretto alla seconda
cifra decimale.
Usiamo invece il metodo di Cavalieri–Simpson con n = 2. facendo qualche
calcolo si arriva a
  
? 1 1 4 4 4
S2 = 1+ + +4 + = 0.6932...
12 2 3 5 7
Come si vede, l’approssimazione ottenuta è sensibilmente migliore già con la
metà di suddivisioni.8

Il contenuto di questo paragrafo è preso dall’ultimo capitolo di [22]. Non


trattandosi di un testo specializzato nel calcolo numerico, la trattazione ha
un’impostazione molto geometrica ed intuitiva. In effetti, dubitiamo che
lo studente abbia scorto il legame fra i tre metodi proposti e l’interpola-
zione polinomiale. Per il metodo dei rettangoli, tale legame semplicemen-
te non c’è, o comunque è decisamente “degenere”. Infatti ci siamo limitati
8
A questo riguardo, si leggano gli ultimi capoversi del capitolo.
182 CAPITOLO 9. METODI DEL CALCOLO APPROSSIMATO

ad approssimare la funzione continua f con segmenti orizzontali, ottenendo


un’approssimazione chiaramente discontinua.
In realtà, il metodo di Cavalieri–Simpson consiste evidentemente nell’in-
tegrazione di un polinomio interpolatore di secondo grado, come abbiamo
evidenziato nella costruzione. Come utile esercizio, lo studente potrà veri-
ficare che partendo dal polinomio interpolatore di Lagrange passante per i
tre punti (xk , f (xk )), (zk , f (zk ), (xk+1 , f (xk+1 )) e integrandolo fra xk e xk+1
si perviene alla stessa formula. Non abbiamo seguito questa via solo perché
conveniva sfruttare la simmetria rispetto al punto mediano zk per semplificare
alcuni calcoli.
Resta da capire se l’integrazione del polinomio interpolatore di primo
grado conduca a una formula di integrazione approssimata efficiente. La
risposta è affermativa, e il metodo va sotto il nome di metodo dei trapezi.
Fissata la solita suddivisione {x0 , x1 , . . . , xn } di [a, b], per ogni intervallino
[xk−1 , xk ] possiamo introdurre il polinomio di interpolazione lineare p1 , che
esplicitamente si scrive

f (xk ) − f (xk−1 )
p1 (x) = (x − xk−1 ) + f (xk−1 ).
xk − xk−1

Integrando, 9
Z xk
f (xk ) + f (xk−1 ) b − a f (xk ) + f (xk−1 )
p1 (x) dx = (xk − xk−1 ) = .
xk−1 2 n 2

Infine, sommando rispetto all’indice k, troviamo la formula di approssima-


zione per l’integrale esteso da a a b:
n
b − a X f (xk ) + f (xk−1 )
Sntrap = .
n k=1 2

Per costruzione, questo è un metodo di ordine N = 1, dato che i polinomi


per i quali l’interpolazione lineare è sempre esatta sono quelli di grado uno.

È altresì evidente che nulla ci impedisce di considerare polinomi inter-


polatori di grado più alto di due. Potremmo infatti raggruppare i punti a
tre a tre e cercare un polinomio di terzo grado che li unisca.10 Se questo
può sembrare un gioco appassionante con cui mettere alla prova la propria
9
Lo studente si convinca che l’integrale di p1 altro non è che l’area di un trapezio
rettangolo di basi f (xk ) e f (xk−1 ) e altezza (b − a)/n.
10
Evidentemente, capiterà di dover supporre che il numero di intervalli della suddivisione
sia pari. Questo dettaglio sarà sottinteso.
9.2. INTEGRAZIONE NUMERICA 183

comprensione dell’argomento, ci si accorge in fretta che esagerare non serve


a molto. Lo studente avrà senz’altro notato che far passare un polinomio di
decimo grado per undici nodi è solo una complicazione tecnica: tanto vale
“raffinare” la suddivisione dell’intervallo e usare un polinomio di grado infe-
riore. La formula di Cavalieri–Simpson è una delle preferibili, dal momento
che unisce accuratezza e semplicità. Nella letteratura specializzata (si ve-
da [23]), molta importanza viene data ai metodi di Newton–Cotes, basati
proprio sui polinomi di Lagrange.
Infine, tutti i metodi di integrazione approssimata hanno la caratteristica
di essere facilmente implementabili in un qualsiasi linguaggio di programma-
zione moderno, come il C, il Python, il Fortran o anche uno dei linguaggi di
alto livello come Matlab, Mathematica o Maple. Per tutti si tratta solamente
di ricevere in input una stringa di dati (i nodi sulle ascisse e i corrispondenti
valori sulle ordinate) e di emettere in output un numero ottenuto mediante
alcune semplici operazioni aritmetiche.
Lo studente interessato potrà trovare alcuni esempi, assolutamente ele-
mentari e primitivi, di implementazione nel linguaggio C dei metodi dei
trapezi, delle tangenti e di Simpson sul sito dell’autore, nella sezione di di-
dattica. La scelta del linguaggio C è legata all’esistenza dei compilatore
Open Source gcc, liberamente installabile su ogni sistema operativo moder-
no e già presente nelle principali distribuzioni GNU/Linux. Naturalmente il
codice è così semplice da poter essere tradotto in tutti i linguaggi scientifici
conosciuti. Solo per comodità, riportiamo di seguito il brevissimo listato del
metodo dei trapezi in Python. La prima riga è specifica per i sistemi Unix
(GNU/Linux, *BSD, Apple Mac OS X, ecc.)
#!/usr/bin/python
def f(x) :
t = 1./x
return t
n = 1000
i=0
x1 = 1.
x2 = 1. + 1./n
S = 0.
while i<n :
x1 = x2
x2 = x2 + 1./n
S = S + (1./n)*0.5*(f(x1)+f(x2))
i = i+1
184 CAPITOLO 9. METODI DEL CALCOLO APPROSSIMATO

print S
Lo studente noterà che abbiamo evitato l’uso degli array per memorizzare
i nodi della suddivisione e le corrispondenti immagini. Un informatico note-
rebbe che il listato in Python è preferibile a quelli in C proprio perché usa
strutture più elementari. Per un matematico, al contrario, è più spontaneo
usare un array di numeri reali.
Epilogo

Siamo arrivati alla fine del nostro viaggio, durato circa dodici settimane e
accompagnato probabilmente da prove scritte intermedie. Lo studio di queste
dispense, affiancate dagli appunti del corso e delle esercitazioni, e soprattutto
completato dalla lettura di uno dei testi segnalati nella bibliografia, dovrebbe
trasmettere allo studente le conoscenze indspensabili a qualsiasi laureando in
una disciplina scientifica. Sono sicuro che solo un numero statisticamente
trascurabile di iscritti serberà un ricordo piacevole del corso di Matematica.
Resta tuttavia la speranza che, almeno una volta, le idee studiate con fatica
in questi mesi possano rivelarsi utili.
A tutti gli studenti che sono arrivati alla fine delle lezioni senza com-
mettere gesti insani, va un ringraziamento e l’invito a proseguire la carriera
universitaria con serietà e passione.

185
186 EPILOGO
Commento alla bibliografia

Innanzitutto, suggeriamo senz’altro a tutti gli studenti di leggere il classico


testo di Courant e Robbins [7]. Ne esiste una traduzione italiana risalente agli
anni ’70 del secolo scorso. È una descrizione molto piacevole e scorrevole dei
fondamenti della matematica moderna, spesso presentati attraverso esempi
e problemi di facile comprensione. Non è però un valido libro di testo per un
corso universitario.
Il fatto che il libro di G.H. Hardy [16] risalga al 1921 (ed era già la terza
ristampa!) dovrebbe essere un chiaro segnale della classicità degli argomenti
trattati nel nostro corso. A parte qualche notazione ormai caduta in disuso, il
testo di Hardy conserva ancora oggi un notevole fascino scientifico, e potrebbe
tranquillamente essere utilizzato nelle nostre università.
Un manuale molto recente, che lo studente può trovare interessante ed
educativo, è [5]. Lo stile del libro è veloce e preciso, e l’unica differenza fra il
suo contenuto e le lezioni in aula è la costruzione dell’integrale di Riemann.
In questo libro è stata privilegiata la definizione più intuitiva dell’integrale
definito mediante il limite delle somme integrali. Come dimostriamo nel
Teorema 6.10, di fatto la nostra costruzione coincide con quella di [5], ma si
rivela più maneggevole nelle dimostrazioni.
Un altro testo di riferimento per il corso è [6]: un libro moderno e ricco
di contenuti, approfondimenti ed esercizi svolti. Alcuni argomenti vengono
però trattati da un punto di vista diverso, e presuppone nel lettore una
preparazione che, di questi tempi, non sembra essere molto diffusa.
Proprio quest’anno è uscito il manuale [13] che propone per intero gli
argomenti trattati nel nostro corso (con un capitolo di ripasso della geometria
analitica, utile per rivedere o apprendere qualche concetto utilizzato anche
da noi). Il ritmo dell’esposizione è molto tranquillo, e numerosi sono gli
esempi e i commenti ai contenuti. La lunga esperienza didattica ha suggerito
all’Autore l’omissione di alcune dimostrazioni particolarmente tecniche; in
questi rari casi, lo studente troverà i dettagli sulle dispense.
Più simile alle nostre dispense è invece [11], strutturato in capitoli snelli
e adatti ad essere trattati in due ore circa di lezione. Le successioni sono

187
188 EPILOGO

introdotte soltanto alla fine, come capitolo facoltativo. Questo rende alcune
dimostrazioni meno trasparenti ed intuitive, e gli esercizi sono di un livello
senz’altro superiore a quelli che il nostro studente deve saper risolvere. Il
testo [22], scritto da o dei padri della moderna Analisi non lineare, è sta-
to considerato a lungo uno dei migliori manuali universitari per lo studio
dell’Analisi Matematica, prevalentemente rivolto a studenti del corso di Ma-
tematica o Fisica. Così come per [24], non ci sentiamo di consigliarli al nostro
lettore: appaiono qui solo perché, sporadicamente, ne abbiamo tratto spunti
e osservazioni interessanti.
Il libro [4] è probabilmente il miglior testo per lo studio astratto delle
proprietà infinitesimali delle funzioni. Il livello della presentazione è estre-
mamente elevato. Per quanto riguarda gli argomenti numerici, consigliamo
senz’altro [18, 23].
Qualche studente si chiederà se l’ordine dei nostri capitoli corrisponde
fedelmente allo sviluppo storico del calcolo infinitesimale. In realtà, la mate-
matica si è sviluppata gradualmente, e spesso i grandi matematici che hanno
sviluppato le idee esposte in queste dispense non scrivevano delle definizioni
rigorose e pulite come quelle a cui ci siamo abituati. Il libro di Hairer [15] è
un’affascinante confronto fra lo sviluppo storico del calcolo e quello pedago-
gico dei nostri giorni. Un fatto da tenere a mente è stata la “rivoluzione bour-
bakista” degli anni ’50 e ’60 del secolo appena trascorso. Partendo dalla Fran-
cia, si è diffusa la richiesta di un ripensamento nitido e logicamente rigoroso
delle discipline che compongono la matematica contemporanea. Il gruppo
Bourbaki cercò di esporre tutta la matematica moderna in modo puramente
logico–deduttivo. Questo approccio è stato molto criticato, e la principale
accusa era di nascondere la natura dell’atto creativo in matematica.
Infine, un testo apparso di recente è [21]. Gli argomenti trattati spaziano
dai numeri reali al calcolo integrale in più dimensioni. Sembra chiaramente
ispirato allo stile di [24], ma con qualche attenzione in più agil esempi e alle
necessità didattiche attuali. Gli esercizi non sono tutti originali, ed il loro
livello è decisamente avanzato.
Indice

1 Insiemi e Funzioni 1
1.1 Cenni di logica elementare . . . . . . . . . . . . . . . . . . . . 1
1.2 Richiami di insiemistica . . . . . . . . . . . . . . . . . . . . . 4
1.3 Insiemi numerici . . . . . . . . . . . . . . . . . . . . . . . . . . 6
1.4 Topologia della retta reale . . . . . . . . . . . . . . . . . . . . 10
1.5 L’infinito . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
1.6 Punti di accumulazione . . . . . . . . . . . . . . . . . . . . . . 15
1.7 Appendice: la dimostrazione per induzione . . . . . . . . . . . 16

2 Funzioni fra insiemi 19


2.1 Operazioni sulle funzioni . . . . . . . . . . . . . . . . . . . . . 25
2.2 Funzioni monotòne e funzioni periodiche . . . . . . . . . . . . 28
2.3 Grafici cartesiani . . . . . . . . . . . . . . . . . . . . . . . . . 29
2.4 Funzioni elementari . . . . . . . . . . . . . . . . . . . . . . . . 30

3 Successioni di numeri reali 33


3.1 Successioni e loro limiti . . . . . . . . . . . . . . . . . . . . . . 33
3.2 Proprietà asintotiche delle successioni . . . . . . . . . . . . . . 40
3.3 Infinitesimi ed infiniti equivalenti . . . . . . . . . . . . . . . . 43
3.4 Sottosuccessioni . . . . . . . . . . . . . . . . . . . . . . . . . . 44
3.5 Il numero e di Nepero . . . . . . . . . . . . . . . . . . . . . . 45
3.6 Appendice: successioni di Cauchy . . . . . . . . . . . . . . . . 47

4 Serie numeriche 49
4.1 Serie a termini positivi . . . . . . . . . . . . . . . . . . . . . . 54
4.2 Criteri di convergenza . . . . . . . . . . . . . . . . . . . . . . 56
4.3 Convergenza assoluta e convergenza delle serie di segno alterno 60

5 Limiti di funzioni e funzioni continue 63


5.1 Limiti di funzioni come limiti di successioni . . . . . . . . . . . 63
5.2 Traduzione dei teoremi sulle successioni . . . . . . . . . . . . . 67

189
190 INDICE

5.3 Raccolta di limiti notevoli . . . . . . . . . . . . . . . . . . . . 68


5.4 Continuità . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70
5.5 Infinitesimi ed infiniti equivalenti . . . . . . . . . . . . . . . . 73
5.6 Teoremi fondamentali per le funzioni continue . . . . . . . . . 75
5.7 Massimi e minimi . . . . . . . . . . . . . . . . . . . . . . . . . 78
5.8 Punti di discontinuità . . . . . . . . . . . . . . . . . . . . . . . 82

6 Il calcolo differenziale 85
6.1 Variazioni infinitesime . . . . . . . . . . . . . . . . . . . . . . 85
6.2 Il calcolo delle derivate . . . . . . . . . . . . . . . . . . . . . . 89
6.3 I teoremi fondamentali del calcolo differenziale . . . . . . . . . 93
6.4 Punti singolari . . . . . . . . . . . . . . . . . . . . . . . . . . . 98
6.5 Applicazioni allo studio delle funzioni . . . . . . . . . . . . . . 99
6.6 Derivate successive . . . . . . . . . . . . . . . . . . . . . . . . 101
6.7 Classi di regolarità . . . . . . . . . . . . . . . . . . . . . . . . 105
6.8 Grafici di funzioni . . . . . . . . . . . . . . . . . . . . . . . . . 106
6.9 Il teorema di De l’Hospital . . . . . . . . . . . . . . . . . . . . 108
6.10 Il polinomio di Taylor . . . . . . . . . . . . . . . . . . . . . . . 112

7 Integrale di Riemann 121


7.1 Partizioni del dominio . . . . . . . . . . . . . . . . . . . . . . 122
7.2 Continuità uniforme . . . . . . . . . . . . . . . . . . . . . . . 130
7.3 Teorema fondamentale del calcolo . . . . . . . . . . . . . . . . 134
7.4 Media integrale . . . . . . . . . . . . . . . . . . . . . . . . . . 138
7.5 Applicazioni al calcolo degli integrali definiti . . . . . . . . . . 138
7.6 Cenni sulla ricerca delle primitive . . . . . . . . . . . . . . . . 140
7.7 Il differenziale . . . . . . . . . . . . . . . . . . . . . . . . . . 143
7.8 Integrazione delle funzioni razionali fratte . . . . . . . . . . . . 145
7.9 Il polinomio di Taylor con resto integrale . . . . . . . . . . . . 150
7.10 Integrali impropri . . . . . . . . . . . . . . . . . . . . . . . . . 152
7.10.1 Funzioni illimitate . . . . . . . . . . . . . . . . . . . . 152
7.10.2 Funzioni definite su intervalli illimitati . . . . . . . . . 154

8 Equazioni differenziali ordinarie 157


8.1 Equazioni differenziali lineari del primo ordine . . . . . . . . . 158
8.2 Equazioni del primo ordine a variabili separabili . . . . . . . . 161
8.3 Equazioni lineari del secondo ordine . . . . . . . . . . . . . . . 167

9 Metodi del calcolo approssimato 173


9.1 Interpolazione polinomiale . . . . . . . . . . . . . . . . . . . . 173
9.2 Integrazione numerica . . . . . . . . . . . . . . . . . . . . . . 177
INDICE 191

Epilogo 185
192 INDICE
Bibliografia

[1] M. Abate. Geometria. McGraw–Hill.

[2] M. Abramowitz and I. A. Stegun. Handbook of mathematical functions.


National Bureau of Standards, 1972.

[3] G. Birkhoff and S. MacLane. A survey of modern algebra. MacMillan,


1977.

[4] N. Bourbaki. Éléments de Mathématiques. Fonctions d’une variable


réelle. Springer–Verlag.

[5] M. Bramanti, C. Pagani, S. Salsa. Analisi matematica 1. Zanichelli,


2008.

[6] M. Conti, D. L. Ferrario, S. Terracini, and G. Verzini. Analisi


Matematica. Apogeo, 2006.

[7] R. Courant, H. Robbins. What is mathematics? Oxford University


Press, 1996.

[8] N. Fusco, P. Marcellini, and C. Sbordone. Analisi Matematica Due.


Liguori.

[9] G. De Marco. Analisi Due. Zanichelli.

[10] G. De Marco. Analisi Uno. Zanichelli.

[11] M. Giaquinta and G. Modica. Analisi Matematica. 1. Funzioni di una


variabile. Pitagora Editrice.

[12] M. Giaquinta and G. Modica. Analisi Matematica. 2. Approssimazione


e Processi Discreti. Pitagora Editrice.

[13] E. Giusti. Elementi di analisi matematica. Bollati Boringhieri.

[14] E. Hairer. Analysis by its history. Springer–Verlag.

193
194 BIBLIOGRAFIA

[15] P. Halmos. Naïve set theory. Van Nostrand.

[16] G. H. Hardy. A course of pure mathematics. Cambridge University


Press, 1921.

[17] J. Heading. Equazioni differenziali ordinarie. Liguori.

[18] F. Jedrzejewski. Introduction aux méthodes numeriques. Springer, 2005.

[19] J. Kelley. General topology. Springer.

[20] E. Mendelson. Introduction to mathematical logic. Chapman & Hall,


1997.

[21] M. Mureşan. A concrete approach to classical analysis. Springer–Verlag.

[22] G. Prodi. Analisi matematica. Bollati Boringhieri, 1970.

[23] A. Quarteroni, R. Sacco, and F. Saleri. Matematica Numerica. Springer.

[24] W. Rudin. Principi di analisi matematica. McGraw–Hill, 1991.

[25] E. Stein, R. Shakarchi. Fourier analysis, an introduction. Princeton


University Press.

Potrebbero piacerti anche