Sei sulla pagina 1di 130

F. Ricci, A. Mennucci, T.

Pacini

COMPLEMENTI DI MATEMATICA
Seminario Fisico-Matematico I anno

Indice
Capitolo 1. ELEMENTI DI TEORIA DEGLI INSIEMI
1. Prodotto cartesiano di due insiemi
2. Relazioni
3. Relazioni di equivalenza
4. Relazioni dordine
5. Funzioni
6. Prodotto cartesiano di pi`
u insiemi
7. Linsieme dei numeri naturali
8. Cardinalit`
a di insiemi
9. Cardinalit`
a di P(A)
10. Insiemi finiti e infiniti
11. Il Lemma di Zorn
12. Dimostrazione del Lemma di Zorn
13. Il Teorema di Zermelo

5
5
6
6
8
8
9
10
12
15
16
16
18
20

Capitolo 2. INSIEMI NUMERICI E OPERAZIONI


1. Operazioni su N
2. Dai naturali agli interi relativi
3. Dagli interi relativi ai razionali
4. Costruzione del campo reale
5. Operazioni su R
6. Campi
7. Campi ordinati
8. Campi ordinati completi

21
21
22
23
24
24
26
27
28

Capitolo 3. COMPLEMENTI SULLE SUCCESSIONI DI NUMERI REALI


1. Confronti asintotici tra successioni
2. Ordini di infinito e di infinitesimo
3. Teoremi di Cesaro
4. Teorema di Stolz-Cesaro

31
31
33
34
36

Capitolo 4. SOMMATORIE SU INSIEMI INFINITI


1. Somme a termini positivi
2. Limiti lungo insiemi ordinati filtranti
3. Sommatorie a termini di segno generico
4. Sommatorie a pi`
u indici
5. Il caso I = N: confronto con la nozione di somma di una serie
6. Prodotto secondo Cauchy di due successioni
7. Convergenza incondizionata di serie

39
39
40
41
44
45
47
48

Capitolo 5. Rn , TOPOLOGIE, METRICHE E FUNZIONI CONTINUE


1. Struttura euclidea in Rn : prodotto scalare, modulo e distanza
2. Topologia di Rn

53
53
55

INDICE

3. Successioni a valori in Rn
4. Successioni e propriet`
a topologiche di sottoinsiemi di Rn
5. Punti limite di una successione
6. Spazi topologici
7. Spazi metrici
8. Funzioni continue tra spazi euclidei
Capitolo 6. SUCCESSIONI E SERIE DI FUNZIONI
1. Convergenza puntuale e uniforme
2. Continuit`
a del limite uniforme
3. La convergenza uniforme come convergenza in uno spazio metrico
4. Derivabilit`
a della funzione limite
5. Convergenza uniforme di serie di funzioni e spazi vettoriali normati
6. Serie di potenze
7. Derivabilit`
a sullasse reale
8. Serie di potenze e serie di Taylor
9. Il Lemma di Abel
10. Alcune serie notevoli

58
59
60
61
66
71
75
75
76
77
78
80
83
85
85
89
92

` VARIABILI
Capitolo 7. CALCOLO DIFFERENZIALE IN PIU
1. Derivate parziali e direzionali
2. Differenziale
3. Il teorema del differenziale totale
4. Curve regolari in Rn
5. Curve regolari e grafici
6. Funzioni implicite
7. Funzioni differenziabili da Rn a Rm
8. Composizione di funzioni differenziabili
9. Punti stazionari liberi e vincolati
10. Diagonalizzazione delle matrici simmetriche
11. Derivate di ordine superiore
12. La matrice Hessiana
13. Discussione della natura dei punti stazionari liberi

93
93
94
96
97
98
99
102
103
104
105
108
110
111

Capitolo 8. EQUAZIONI DIFFERENZIALI ORDINARIE


1. Definizioni e primi esempi
2. Metodi risolutivi per alcuni tipi di equazioni del primo ordine
3. Problemi di Cauchy per equazioni del primo ordine
4. Contrazioni di spazi metrici
5. Teorema di esistenza e unicit`
a: dimostrazione e conseguenze
6. Sistemi di equazioni differenziali ed equazioni di ordine superiore
7. Sistemi differenziali lineari a coefficienti costanti e matrice esponenziale
8. Calcolo della matrice esponenziale
9. Equazioni differenziali lineari a coefficienti costanti di ordine superiore

115
115
117
118
119
120
122
124
126
127

CAPITOLO 1

ELEMENTI DI TEORIA DEGLI INSIEMI


Diamo per note le nozioni fondamentali di teoria degli insiemi, come:
la nozione di appartenenza di un elemento a un insieme (x A),
la nozione di insieme vuoto (indicato con ) e la sua unicit`a,
la nozione di inclusione di un insieme in un altro (A B, A B),
le operazioni di unione (A B) e intersezione (A B), le propriet`a commutativa e associativa di
ciascuna di esse, la propriet`
a distributiva delluna rispetto allaltra,
la nozione di complementare di un insieme rispetto a un insieme ambiente dato (cA),
le nozioni di differenza insiemistica (A \ B, B \ A) e di differenza simmetrica (A4B) di due insiemi,
le formule di de Morgan:
c

(A B) = cA cB ,

(A B) = cA cB .

1. Prodotto cartesiano di due insiemi


Siano a, b due elementi, non necessariamente distinti tra loro. Quando si parla di coppia ordinata (a, b)
si vuole specificare la posizione dei due termini nella coppia, e cio`e che essa consiste di un primo termine a e
di un secondo termine b. Per questo motivo, la coppia (a, b) `e un entit`a del tutto diversa dallinsieme {a, b}.
Due coppie (a, b) e (a0 , b0 ) sono uguali se e solo se sono uguali a due a due i termini corrispondenti. In
formule:
(a, b) = (a0 , b0 ) a = a0 e b = b0 .
In particolare, (a, b) 6= (b, a) se a 6= b.
Per poter accogliere una simile definizione nella teoria, una coppia va definita come un insieme. La
definizione pi`
u comunemente adottata `e la seguente:


(a, b) = {a, b}, {a} .
E un semplice esercizio verificare che effettivamente



{a, b}, {a} = {a0 , b0 }, {a0 } a = a0 e b = b0 .
Siano ora A e B due insiemi. Si chiama prodotto cartesiano di A e B linsieme A B delle coppie
ordinate (a, b), al variare di a in A e di b in B:


A B = (a, b) : a A , b B .
Si osservi che, se A 6= B,
A B 6= B A .
Il prodotto cartesiano A A di un insieme A con se stesso si indica anche con A2 . Si chiama diagonale
di A2 linsieme


diag (A2 ) = (a, a) : a A .

1. ELEMENTI DI TEORIA DEGLI INSIEMI

2. Relazioni
Si chiama relazione tra elementi di un insieme A ed elementi di un insieme B un qualunque sottoinsieme
R del prodotto cartesiano A B.
Se la coppia (a, b) A B appartiene a R, si dice che a `e in relazione con b; si usa la notazione1 aRb.
Esempi.
(1) Con A = {1, 2, . . . , 100} e B = {1, 2, . . . , 200} (linsieme dei numeri naturali), poniamo la relazione
aRb M.C.D.(a, b) > 1 .
Una scrittura equivalente `e


R = (a, b) A B : M.C.D.(a, b) > 1 .
(2) Con A = B = N (linsieme dei numeri naturali), linsieme


(m, n) N2 : m n
fornisce la relazione .

3. Relazioni di equivalenza
Una relazione R tra elementi di uno stesso insieme A si dice una relazione di equivalenza su A se soddisfa
le seguenti propriet`
a:
riflessiva: a A , aRa;
simmetrica: aRb bRa;
transitiva: aRb e bRc aRc.
Simboli comunemente usati per relazioni di equivalenza sono: , ', , e simili.
Sia dunque una relazione di equivalenza. Fissato a A, si chiama classe di equivalenza di a modulo
linsieme
Ca = {b A : b a} .
Lemma 3.1. Se a a0 , allora Ca = Ca0 . Se a 6 a0 , allora Ca Ca0 = .
Dimostrazione. Supponiamo a a0 e b Ca . Allora b a e per la propriet`a transitiva b a0 .
Dunque b Ca0 . Questo prova che Ca Ca0 . Allo stesso modo si dimostra che Ca0 Ca . Dalla doppia
inclusione segue che Ca = Ca0 .
Dimostriamo ora che
(3.1)

Ca Ca0 6= = a a0 .

Infatti, sia b Ca Ca0 . Allora b a e b a0 . Per le propriet`a simmetrica e transitiva, a a0 .


Vale allora la contronominale della (3.1), cio`e
a 6 a0 = Ca Ca0 = .

Si chiama partizione di A una famiglia di sottoinsiemi non vuoti di A che siano a due a due disgiunti e
la cui unione sia tutto A.
Teorema 3.2. Le classi di equivalenza distinte modulo costituiscono una partizione di A. Viceversa, data
una partizione di A, esiste ununica relazione di equivalenza le cui classi di equivalenza siano gli elementi
della partizione stessa.
1Invece di lettere, come R, `
e comune usare simboli come , , ecc., secondo i casi (v. seguito).

3. RELAZIONI DI EQUIVALENZA

Dimostrazione. Il Lemma 3.1 dimostra che le classi di equivalenza distinte modulo sono disgiunte.
Inoltre, ogni a A appartiene alla classe Ca per la propriet`a riflessiva. Quindi lunione delle classi distinte
`e tutto A.
S
Per il viceversa, sia {Ai : i I} una partizione di A, cio`e con iI Ai = A, Ai 6= per ogni i I, e
Ai Ai0 = se i 6= i0 . Si verifica facilmente che la relazione
xRy i I tale che x, y Ai
`e di equivalenza e che le sue classi di equivalenza sono gli Ai .

Linsieme delle classi di equivalenza,


A/ = {Ca : a A}
si chiama linsieme quoziente di A modulo .
Sia (A, ) un insieme ordinato. Un elemento m A si dice massimo di A se, per ogni a A, a m.
In modo analogo si definisce il minimo di un insieme ordinato.
Lemma 3.3. Se un insieme ordinato ha un massimo (risp. minimo), esso `e unico.
Dimostrazione. Siano m e m0 due massimi. Allora m0 m e m m0 , e, per la propriet`a antisimmetrica, m = m0 . Analogamente per i minimi.

Le nozioni di massimo e di minimo si applicano ovviamente anche a sottoinsiemi di un insieme ordinato.
Un elemento m A si dice massimale se non esiste nessun elemento a A tale che m < a. In modo
analogo si definisce un elemento minimale di A.
Per un insieme A totalmente ordinato, le nozioni di elemento massimo ed elemento massimale (risp.
elemento minimo ed elemento minimale) coincidono. Se lordinamento non `e totale, il massimo `e un elemento
massimale, ma non viceversa. Un insieme parzialmente ordinato pu`o possedere pi`
u elementi massimali (risp.
minimali).
Sia ora A0 un sottoinsieme di A. Un elemento a A si dice un maggiorante di A0 se, per ogni a0 A0 ,
0
a a. In modo analogo di definisce un minorante di A0 .
Se linsieme dei maggioranti di A0 ha un minimo, questo si chiama lestremo superiore di A0 . Lestremo
inferiore di A0 si definisce come il massimo dei minoranti. Per il Lemma 3.3, lestremo superiore (risp.
inferiore), se c`e, `e unico.
I simboli max, min, sup, inf indicano rispettivamente massimo, minimo, estremo superiore ed estremo
inferiore di un sottoinsieme di un insieme ordinato.
Si noti che
un maggiorante a di A0 in A appartiene ad A0 se e solo se a = max A0 ;
se A0 A ha massimo, allora max A0 = sup A0 ;
un elemento a A `e massimale se e solo se A0 = {a} non ha maggioranti allinfuori di a stesso.
Esempi.

(1) Si consideri N ordinato dalla relazione m  n se m n. Allora min N = 1 e max N = 0. Se prendiamo
invece A = N \ {0, 1} con lordinamento indotto, A non ammette ne minimo ne massimo, i numeri
primi sono gli elementi minimali, e non ci sono elementi massimali.
(2) Nellinsieme
Q dei numeri razionali, dotato dellordinamento (totale) abituale,

 si consideri linsieme

A0 = m/n : (m/n)2 < 2 . Si dimostri che linsieme dei maggioranti di A0 `e p/q > 0 : (p/q)2 > 2
e che tale insieme non ha minimo. Dunque A0 ha dei maggioranti in Q, ma non lestremo superiore.

1. ELEMENTI DI TEORIA DEGLI INSIEMI

4. Relazioni dordine
Una relazione R tra elementi di uno stesso insieme A si chiama una relazione dordine, o un ordinamento,
su A se valgono le seguenti propriet`
a:
riflessiva: a A , aRa;
antisimmetrica: aRb e bRa a = b;
transitiva: aRb e bRc aRc.
Simboli comunemente usati per relazioni di equivalenza sono: , , e simili. I corrispondenti simboli <,
, ecc. si usano allora per indicare che
aRb e a 6= b .
Un ordinamento si dice totale se inoltre vale la propriet`a:
tricotomia: a, b A , aRb o bRa.
Altrimenti si dice che lordinamento `e parziale.
Esempi.
(1) La relazione su R `e un ordinamento totale.
(2) La relazione su P(X) (linsieme dei sottoinsiemi di un insieme X) `e un ordinamento, solo parziale
se X ha almeno due elementi.
(3) La relazione R su N data da

mRn m n
`e un ordinamento parziale.
(4) Se R `e un ordinamento su A, la relazione inversa


R1 = (a, b) : (b, a) R
`e pure un ordinamento.
(5) Se R `e un ordinamento su A e B A, la restrizione di R a B,
R|B = R B 2
`e un ordinamento su B. Se R|B `e un ordinamento totale su B, B si dice una catena di A.
Uno stesso insieme pu`
o ammettere pi`
u ordinamenti. E perci`o corretto dire che un insieme ordinato `e
una coppia (A, ), dove A `e un insieme e un ordinamento su di esso.
5. Funzioni
Una relazione R A B si dice una funzione (o anche applicazione, o mappa, o trasformazione) di A
in B se vale la seguente propriet`
a:
a A, esiste un unico b B tale che aRb.
Si scrive abitualmente R(a) = b invece di (a, b) R. Una funzione R di A in B si indica nella forma
R : A B .
Le seguenti definizioni e notazioni sono standard:
A si chiama il dominio di R e B il suo codominio;
dato A0 A, la restrizione di R ad A0 `e definita da R|A0 = R (A0 B);
linsieme


im R = b B : a A tale che R(a) = b B
si chiama linsieme immagine, o anche solo immagine, di R;
dato A0 A, si chiama immagine di A0 secondo R linsieme


R(A0 ) = b B : a A0 tale che R(a) = b = im R|A0 .

` INSIEMI
6. PRODOTTO CARTESIANO DI PIU

dato B 0 B, si chiama controimmagine di B 0 secondo R linsieme




R1 (B 0 ) = a A : R(a) B 0 .
R si dice suriettiva se im R = B;
R si dice iniettiva se
a, a0 A e a 6= a0 = R(a) 6= R(a0 ) ;
R si dice biiettiva o biunivoca, o anche corrispondenza biunivoca, se `e iniettiva e suriettiva;
se R `e biiettiva, R1 B A `e pure una funzione, detta funzione inversa di R;
se R : A B e S : B C, la funzione composta S R : A C `e definita da

S R(a) = S R(a) , a A ;
la diagonale di A2 `e una funzione, detta funzione identica di un insieme A, e indicata con A :
A A.
Osservazioni.
(1) Se una funzione R non `e suriettiva e B 0 = im R, allora R A B 0 , e dunque R definisce una
funzione suriettiva di A su B 0 . Tuttavia `e bene considerare R : A B e R : A B 0 come funzioni
diverse. Per tener conto di ci`
o in modo formalmente corretto, bisogna dire pi`
u precisamente che
una funzione da A a B `e una terna (A, B, R), con R soddisfacente la propriet`a a inizio paragrafo.
(2) Se A `e linsieme vuoto, la relazione R = `e una funzione. Infatti ogni condizione della forma
a , P (a) `e verificata.

6. Prodotto cartesiano di pi`


u insiemi
Dati tre insiemi A, B, C, si possonocostruire i prodotti
cartesiani (A B) C e A (B C), costituiti

rispettivamente dagli elementi (a, b), c e a, (b, c) , al variare di a A, b B, c C. Essi sono dunque
insiemi diversi tra loro.
Ci interessa invece definire, pi`
u semplicemente, il prodotto cartesiano A B C come linsieme delle
terne (a, b, c), con a A, b B, c C. Ma dobbiamo innanzitutto definire cosa sono le terne.
Avendo a disposizione la nozione di funzione, possiamo dare la seguente definizione:
Siano A, B, C tre insiemi. Il prodotto cartesiano A B C `e linsieme delle funzioni
f : {1, 2, 3} A B C
tali che f (1) A, f (2) B, f (3) C.
Una terna `e dunque una funzione f con le propriet`a suddette.
Questa definizione pu`
o essere adattata anche a un numero maggiore di insiemi, finito o infinito2, nel
modo seguente.
Sia I un insieme non vuoto di indici, introdotto per parametrizzare una famiglia di insiemi
A = {Ai : i I} .
Il prodotto cartesiano

iI

Ai `e linsieme delle funzioni


[
f : I
Ai
iI

tali che f (i) Ai per ogni i I.


2Perch
e non questa definizione non `
e utilizzabile per introdurre il prodotto di due insiemi?

10

1. ELEMENTI DI TEORIA DEGLI INSIEMI

E un fatto ovvio che se uno degli insiemi Ai `e vuoto, anche il prodotto cartesiano `e vuoto, perche la
condizione f (i) Ai non pu`
o essere realizzata per quel particolare i. Q
Viceversa, non `e per nulla ovvio che se nessun Ai `e vuoto, allora iI Ai `e non vuoto. Questa affermazione `e in effetti indipendente dagli assiomi della teoria degli insiemi comunemente adottatti (teoria di
Zermelo-Fraenkel, o ZF). Pertanto pu`
o essere indifferentemente accettata per vera oppure no, dando luogo a
due teorie degli insiemi diverse, una pi`
u ampia e laltra pi`
u ristretta. Nella matematica moderna essa viene
comunemente accettata, come assioma aggiuntivo, detto Assioma della scelta.
Le seguenti sono formulazioni equivalenti dellAssioma della scelta.
Il prodotto cartesiano di una famiglia non vuota di insiemi non vuoti `e non vuoto.
Data S
una famiglia {Ai : i I} di insiemi non vuoti a due a due disgiunti, esiste un sottoinsieme
B di iI Ai tale che, per ogni i I, B Ai contenga un unico elemento.
La seconda formulazione giustifica il nome di Assioma della scelta: `e possibile scegliere simultaneamente un elemento da ciascun Ai .
Q Se tutti gli Ai sono uguali tra loro (chiamiamo allora A questunico Iinsieme), il prodotto cartesiano
e linsieme di tutte funzioni f : I A. Esso viene indicato con A .
iI A `
Se I `e finito, tipicamente I = {1, 2, . . . , n}, si usa la notazione An anziche A{1,...,n} , e i suoi elementi
sono le n-uple di elementi di A, indicate abitualmente come (a1 , a2 , . . . , an ).
7. Linsieme dei numeri naturali
Dato un insieme X, chiamiamo successore di X linsieme
S(X) = X {X}.
Un insieme A si dice S-saturo se
(i) A;
(ii) se X A, anche S(X) A.
E facile verificare che lintersezione di insiemi S-saturi `e S-saturo.
Nel sistema assiomatico ZF, lAssioma dellinfinito afferma che:
Assioma dellinfinito. Esistono insiemi S-saturi.
Sia A un insieme S-saturo. Lintersezione N di tutti i suoi sottoinsiemi S-saturi `e un insieme S-saturo.
Vogliamo verificare che questo insieme `e indipendente dalla scelta di A.
Lemma 7.1. Siano A, A0 due insiemi S-saturi e siano N, N0 le intersezioni dei loro rispettivi sottoinsiemi
S-saturi. Allora N = N0 .
Dimostrazione. Si noti che A A0 `e non vuoto e che `e un sottoinsieme S-saturo sia di A che di A0 .
Se ne deduce che N coincide con lintersezione di tutti i sottoinsiemi S-saturi di A A0 . Lo stesso vale anche
per N0 , quindi N = N0 .

Linsieme N si dice linsieme dei numeri naturali. Per il Lemma 7.1, esso `e il piu piccolo insieme
S-saturo esistente, nel senso che `e quello minimo rispetto alla relazione dinclusione. Sono elementi di N gli
insiemi
0=
1 = S(0) = {} = {}
 

2 = S(1) = {} {} = , {}
n

o
3 = S(2) = , {}, , {}



n

o
4 = S(3) = , {}, , {} , , {}, , {}
ecc.

7. LINSIEME DEI NUMERI NATURALI

11

dove 0, 1, 2, . . . sono i simboli convenzionalmente usati. I puntini sospensivi sottintendono lidea intuitiva
che tutti gli elementi di N siano ottenibili iterando loperazione S. Gli enunciati che seguono contengono la
formalizzazione rigorosa di questa idea.
Lo strumento fondamentale per ricavare le propriet`a di N `e il Principio di induzione.
Teorema 7.2 (Principio di induzione). Sia P (n) un enunciato3 dipendente da un numero naturale n.
Se P (n) `e vero per n = 0, e inoltre

P (n) vero = P S(n) vero ,
allora P (n) `e vero per ogni n N.
Dimostrazione. Sia A0 = {n N : P (n) `e vero}. Allora A0 `e un sottoinsieme S-saturo di N. Dunque
N A0 . Ma anche A0 N, per cui A0 = N.

Si noti che, per ogni n N, n S(n). Piu in generale, il seguente risultato evidenzia alcune propriet`
a
di N e della funzione S : N N.
Proposizione 7.3.
(1) Per ogni n, S(n) 6= .
(2) Per ogni n, n
/ n. Di conseguenza, n S(n) (inclusione stretta).
(3) m n m n (inclusione stretta).
(4) m n m S(n).
(5) S(m) = S(n) m = n.
In particolare, S : N N \ {0} `e una corrispondenza biunivoca.
Dimostrazione. Per ogni n, n S(n). Questo dimostra (1).
Dimostriamo ora, per induzione su n, che m n m n. Per n = 0, `e ovvio. Supponiamolo vero per
n e dimostriamo che m S(n) m S(n). Se m S(n) allora si hanno due casi: (i) m n, e quindi per
ipotesi induttiva m n S(n), oppure (ii) m = n, nel qual caso m n {n} = S(n).
Sfruttando questo fatto, dimostriamo (2) per induzione su n. Per n = 0 `e ovvio. Supponiamolo vero
per n e dimostriamo che S(n)
/ S(n). Per assurdo, sia S(n) S(n). Allora S(n) n {n} e quindi (i)
S(n) n oppure (ii) S(n) {n}. Nel primo caso, per quanto visto sopra, S(n) n e quindi n n: assurdo
per ipotesi induttiva. Nel secondo caso S(n) = n e quindi si ritrova lassurdo n n. Questo dimostra (2).
Sfruttando (2) possiamo migliorare laffermazione precedente, dimostrando che m n m n. Questo
dimostra una implicazione nella (3). Laltra implicazione si dimostra di nuovo per induzione su n.
Al punto (4) limplicazione segue immediatamente dalla (2). Supponiamo ora per assurdo che m
S(n) ma m 6 n. Allora, necessariamente, n m. Per la (3), si avrebbe n m, e dunque n{n} = S(n) m,
contro lipotesi.
Dimostriamo ora la (5). Supponiamo che S(n) = S(m). Ne consegue che {n} m {m} e quindi n = m
oppure n m. Nel prima caso, abbiamo verificato la (5). Nel secondo caso, segue dalla (3) che n m e
quindi S(n) = n {n} m m {m} = S(m): assurdo.
Infine, liniettivit`
a di S e lenunciato (5). Se, per assurdo, limmagine di S non contenesse un elemento
n 6= 0, linsieme N \ {n} sarebbe S-saturo, in contrasto con la minimalit`a di N. Quindi, tenendo anche conto
del punto (1), S(N) = N \ {0}.

Osservazione 7.4. Piu in generale, nel sistema ZF lAssioma di regolarit`a permette di dimostrare che
X 6 X per ogni insieme X, e che se X {X} = X 0 {X 0 } allora X = X 0 .
Definiamo una relazione su N come segue:
m n m n.
Per le propriet
a dellinclusione `e chiaro che `e una relazione dordine.
Proposizione 7.5.
3In logica, un enunciato che dipende da una o pi`
u variabili n, x ecc., variabili in dati insiemi, si chiama predicato.

12

1. ELEMENTI DI TEORIA DEGLI INSIEMI

(1) La relazione `e un ordinamento totale su N.


(2) Ogni sottoinsieme di N non vuoto ha minimo.
Dimostrazione. Dimostriamo (1) per induzione su m, studiando la proposizione
P (m) : ogni n N `e confrontabile con m.
Per ogni insieme X, X. Ne segue che P (0) `e vera. Supponiamo vera P (m). Per ogni n N, si hanno
allora due casi: (i) n m, nel qual caso n < S(m), oppure (ii) n > m. In questo caso, per la Proposizione
7.3 (4), si ha S(m) n. In entrambi i casi, n `e confrontabile con S(m) e quindi vale P S(m) .
Per dimostrare la (2), sia B N non vuoto. Mostriamo per cominciare che
B 0 = {n N : m B tale che m n}
ha minimo. Supponiamo per assurdo che B 0 non abbia minimo. Allora 0 6 B 0 (altrimenti sarebbe il minimo).
Supponendo n 6 B 0 , mostriamo che S(n) 6 B 0 . Se per assurdo fosse S(n) B 0 , dovrebbe esistere m B 0
con m < S(n), perche B 0 non ha minimo. Allora m n, e dunque esiste m0 B con m0 m n. Ma
allora n B 0 contro lipotesi. Quindi S(n) 6 B 0 e per induzione B 0 `e vuoto, da cui lassurdo.
Sia dunque n0 = min B 0 . Per definizione di B 0 , esiste m n0 in B. Ma siccome B B 0 , deve essere
m = n0 . Quindi n0 B e ne `e il minimo.

Si noti che la (4) della Proposizione 7.5 afferma che, dato n N, non esistono elementi m N con
n < m < S(n).

Corollario 7.6. Sia P (n) una propriet`
a vera per un dato n0 N e tale che P (n) vera P S(n) vera.
Allora P (n) `e vera per ogni n n0 .
Dimostrazione. Sia B = {n n0 : P (n) `e falsa}. Dobbiamo provare
che B = . Se non fosse cos`,

B avrebbe un minimo m > n0 . Ma allora S 1 (m) n0 e P S 1 (m) sarebbe vera. Per ipotesi si avrebbe
P (m) vera, da cui lassurdo.

8. Cardinalit`
a di insiemi
Si dice che un insieme A ha la stessa cardinalit`a, o potenza, di un insieme B se esiste una funzione
biiettiva di A in B.
Si dice anche che A `e equipotente a B.
Si vede facilmente che:
un insieme A `e equipotente a se stesso (perche A `e biiettiva);
se A `e equipotente a B, B `e equipotente ad A (perche se f : A B `e biiettiva, anche f 1 : B A
lo `e);
se A `e equipotente a B e B `e equipotente a C, allora A `e equipotente a C (perche se f : A B e
g : B C sono biiettive, allora g f : A C `e biiettiva).
La relazione di equipotenza gode dunque delle propriet`a riflessiva, simmetrica e transitiva che caratterizzano le relazioni di equivalenza. Ma su quale insieme `e definita la relazione?
Vorremmo poter prendere linsieme di tutti gli insiemi, ma cos` facendo andremmo in contrasto con
gli assiomi del sistema ZF4. Accontentiamoci dunque di affermare che su una qualunque famiglia di insiemi
A = {Ai }iI lequipotenza (che indichiamo con ) `e in effetti una relazione di equivalenza.
Otteniamo dunque un insieme quoziente A/. Chiamiamo cardinalit`
a i suoi elementi.
Lidea intuitiva dietro queste nozioni `e che due insiemi sono equipotenti se sono ugualmente numerosi.
Questa intuizione `e corretta per insiemi finiti: un insieme con 37 elementi pu`o essere posto in corrispondenza
biunivoca solo con un altro insieme di 37 elementi (v. Teorema 10.1). Per insiemi infiniti la questione `e
molto pi`
u delicata, ed `e per questo motivo che la trattazione deve essere particolarmente accurata sul piano
formale. Trasferire a insiemi infiniti la nostra prima intuizione porta facilmente a errori.
4Linsieme E di tutti gli insiemi avrebbe la propriet`
a E E, in contrasto con lAssioma di regolarit`
a (v. Osservazione 7.4).

` DI INSIEMI
8. CARDINALITA

13

Una volta stabilita la nozione di equipotenza, vogliamo ora dire che certi insiemi sono meno numerosi
di altri. Stabiliamo allora una relazione R su A di minore numerosit`a nel modo seguente:
Siano A, A0 A; diciamo che A R A0 se esiste f : A A0 iniettiva.
La nostra intuizione con insiemi finiti ci dice che se A ha n elementi e A0 ha n0 elementi, esiste una
funzione iniettiva di A in A0 se e solo se n n0 . Dunque la validit`a della relazione A R A0 dipende (per
insiemi finiti) solo dalla cardinalit`
a di A e A0 . Il seguente lemma afferma che ci`o `e vero per insiemi generici.
Lemma 8.1. Supponiamo che A R A0 , e siano B, B 0 A con B A, B 0 A0 . Allora B R B 0 .
Dimostrazione. Per ipotesi, esistono:
(1) f : A A0 iniettiva;
(2) g : B A biiettiva;
(3) h : B 0 A0 biiettiva.
Consideriamo allora la composizione h1 f g : B B 0 ,

h1

B A A0 B 0 .

Essendo una composizione di funzioni iniettive, essa `e iniettiva.

Possiamo allora passare la relazione R al quoziente modulo , per definire una relazione sullinsieme
quoziente.
Indichiamo con C, C 0 due classi di equivalenza (cardinalit`a).
Diciamo che C  C 0 se, presi A C e A0 C 0 , si ha A R A0 .
Il Lemma 8.1 ci assicura che questa `e una buona definizione, ossia che la conclusione A R A0 non dipende
dalla scelta di A e A0 come rappresentanti di C e C 0 rispettivamente.

Vogliamo vedere che  `e una relazione dordine sullinsieme delle cardinalit`a. Le propriet`a riflessiva e
transitiva sono facili da verificare. Dimostrare la propriet`a antisimmetrica vuol dire dimostrare il seguente
teorema.
Teorema 8.2 (Teorema di Cantor-Bernstein). Siano A, B due insiemi, e supponiamo che esistano due
funzioni f : A B e g : B A iniettive. Allora A e B sono equipotenti.
Dimostrazione. Sia A1 = f (A) B. Allora f : A A1 `e biiettiva, per cui A A1 . Analogamente,
B B1 = g(B) A. Ricorsivamente, costruiamo

A2k = g(A2k1 ) A ,

A2k+1 = f (A2k ) B ,

B2k = f (B2k1 ) B ,

B2k+1 = g(B2k ) A .

14

1. ELEMENTI DI TEORIA DEGLI INSIEMI

A2

B2
A1

B1
B
f

Si prova facilmente per induzione che


A B1 A2 B2k1 A2k

(8.1)

B A1 B2 A2k1 B2k

e che
An A ,

Bn B ,

n .

E dunque sufficiente dimostrare che A B1 .


Per la prima catena di inclusioni nella (8.1),
\
\
A2k =
B2k+1 .
k>0

k>0

Se indichiamo con C questo sottoinsieme di A, abbiamo


A \ C = (A \ B1 ) (B1 \ A2 ) (A2k \ B2k+1 ) (B2k+1 \ A2k+2 ) ,
ossia (ponendo A0 = A a secondo membro)
[
 [

A=
(A2k \ B2k+1 )
(B2k+1 \ A2k+2 ) C .
k0

k0

Allo stesso modo,


B1 =

[

 [

(A2k \ B2k+1 )
(B2k+1 \ A2k+2 ) C .

k1

k0

In entrambi i casi, tutti gli insiemi a secondo membro sono disgiunti a due a due.
Per dimostrare che A B1 `e dunque sufficiente dimostrare lesistenza di una applicazione biiettiva
[
[
h:
(A2k \ B2k+1 )
(A2k \ B2k+1 ) .
k0

k1

` DI P(A)
9. CARDINALITA

15

Infatti, una volta ottenuta una tale funzione h, si pu`o costruire la funzione H : A B1 cos` definita:
(
S
H(x) = h(x) se x  k0 (A2k \ B2k+1 ) , 
S
H(x) = x
se x
k0 (B2k+1 \ A2k+2 ) C .
E facile allora dimostrare che H `e biiettiva.
Per costruire h, osserviamo che g f applica A2k biiettivamente su A2k+2 e B2k+1 biiettivamente su
B2k+3 . Scomponendo
A2k = B2k+1 (A2k \ B2k+1 )
A2k+2 = B2k+3 (A2k+2 \ B2k+3 ) ,
si conclude che g f S
applica A2k \ B2k+1 biiettivamente su A2k+2 \ B2k+3 . Basta allora definire h come la
restrizione di g f a k0 (A2k \ B2k+1 ).

Corollario 8.3. La relazione  tra cardinalit`
a `e un ordinamento.
Si noti che per il momento abbiamo solo dimostrato che  `e un ordinamento parziale. Come vedremo
pi`
u avanti, facendo uso dellAssioma della scelta, si dimostra che si tratta di un ordinamento totale.

9. Cardinalit`
a di P(A)
Linsieme P(A) delle parti di A `e linsieme di tutti i sottoinsiemi di A. Dimostriamo due propriet`a della
sua cardinalit`
a:
Teorema 9.1. Valgono le seguenti relazioni:
(i) card P(A) = card {0, 1}A ;
(ii) card P(A)  card A.
Dimostrazione. Per dimostrare la (i), construiamo la funzione : P(A) {0, 1}A cos` definita: dato
A A, (A0 ) = A0 , la funzione caratteristica di A0 , tale che
(
1 se a A0
A0 (a) =
0 se a 6 A0 .
0

Si verifica facilmente che `e iniettiva. Per


 la suriettivit`a, basta osservare che ogni funzione f da A in
{0, 1} `e la funzione caratteristica di f 1 {1} .
Per dimostrare la (ii) bisogna provare che da A a P(A) esistono applicazioni iniettive, ma nessuna che
sia biiettiva. E evidente che la funzione f (a) = {a} `e iniettiva da A in P(A). Supponiamo per assurdo che
g : A P(A) sia suriettiva. Poniamo
A0 = {a A : a 6 g(a)} .
Allora esiste a0 tale che A0 = g(a0 ). Ci sono due casi, a0 A0 e a0 6 A0 . Se a0 A0 , allora
a0 6 g(a0 ) = A0 , il che `e assurdo. Se a0 6 A0 , allora a0 g(a) = A0 , che `e ancora assurdo.

Questo teorema mostra che non esistono cardinalit`a massimali. Come vedremo, questo `e particolarmente
interessante per insiemi infiniti. Per esempio,

card N card P(N) card P P(N)

16

1. ELEMENTI DI TEORIA DEGLI INSIEMI

10. Insiemi finiti e infiniti


Vediamo in questo paragrafo come si definiscono rigorosamente gli insiemi finiti e le loro cardinalit`
a.
Lemma 10.1. Per n N, sia En = {k N : k < n}. Se m < n, allora card Em `e strettamente minore di
card En .
Dimostrazione. E evidente che card Em  card En , perche Em En e dunque esiste la funzione
iniettiva di inclusione : Em En . Mostriamo che invece non pu`o esistere unapplicazione iniettiva di En
in Em .
Proviamo per induzione su m che n > m, non esiste una funzione iniettiva di En in Em . Per m = 0 la
tesi `e ovvia perche E0 = mentre 0 En se n > 0.
Supponiamo la tesi vera per m e sia n > S(m). Ammettiamo per assurdo che esista f : En ES(m)
iniettiva. Poniamo n0 = S 1 (n). E allora chiaro che En = En0 {n0 }, ES(m) = Em {m} e n0 > m.
Se f (n0 ) = m, allora, per liniettivit`
a, f (En0 ) Em e dunque f|E 0 sarebbe una funzione iniettiva di Em
n
in En0 , contro lipotesi induttiva.
Se f (n0 ) = k < m, si consideri lapplicazione biiettiva : ES(m) ES(m) , tale che (k) = m, (m) = k
e (p) = p per ogni altro p ES(m) . Posto g = f , si ricade nel caso precedente.

A questo punto, si definisce finito un insieme che sia equipotente a uno (e dunque uno solo) degli En .
Se A En , si pone card A = n. Un insieme non equipotente a nessun En si dice infinito.
Teorema 10.2. Se A `e infinito, allora card A  card N. In particolare, card A  n per ogni n N.
Dimostrazione. Indichiamo con Pfin (A) linsieme delle parti finite di A e applichiamo lassioma della
scelta come segue:
(a) prendiamo Pfin (A) come insieme degli indici;
(b) dato F Pfin (A), poniamo AF = A \ F .
Siccome A `e infinito, AF `e non vuoto per ogni F Pfin (A). Per lassioma della scelta, a ogni F Pfin (A)
possiamo dunque associare un elemento (F ) A \ F . Definiamo allora f : N A con il seguente
procedimento induttivo:
(i) scegliamo f (0) in modo arbitrario;


(ii) supponendo definiti f (0), f (1), . . . , f (n), definiamo f S(n) = {f (0), f (1), . . . , f (n)} .
Si noti che la (ii) implica che, se m < n, f (n) 6= f (m), e dunque f risulta iniettiva.

Un insieme infinito A equipotente a N si dice numerabile. La cardinalit`a di N si indica con il simbolo 0
(aleph con zero).

11. Il Lemma di Zorn


Il Lemma di Zorn `e un enunciato equivalente allAssioma della scelta. Di esso viene fatto frequente
uso in vari campi della matematica. Per poterlo enunciare, dobbiamo premettere alcune nozioni relative a
insiemi ordinati.
Il Lemma di Zorn riguarda una classe speciale di insiemi ordinati, detti induttivi, cos` definiti:
Un insieme ordinato (A, ) si dice induttivo se ogni catena (cio`e ogni sottoinsieme totalmente
ordinato) di A possiede maggioranti.
Si noti che la definizione stessa implica che un insieme induttivo non `e vuoto. Infatti la catena vuota
deve avere un maggiorante in A.
Teorema 11.1 (Lemma di Zorn). Sia (A, ) un insieme ordinato induttivo. Per ogni a A esiste un
elemento massimale m a.

11. IL LEMMA DI ZORN

17

Mostriamo ora alcune applicazioni del Lemma di Zorn, rinviandone la dimostrazione al paragrafo
successivo. La prima applicazione riguarda lordinamento tra cardinalit`a.
Teorema 11.2. Dati due insiemi A e B, esiste sempre una funzione iniettiva di A in B o di B in A. Quindi
lordinamento tra cardinalit`
a `e totale.
Dimostrazione. La conclusione `e ovvia se A o B `e vuoto (si prenda la funzione vuota). Supponiamo
dunque che A e B siano non vuoti.
Indichiamo con X linsieme delle funzioni biiettive f : A0 B 0 , dove A0 A, B 0 B. Chiaramente X
non `e vuoto, perche, fissati a A e b B, la funzione f : {a} {b} tale che f (a) = b `e biiettiva.
Per dimostrare la tesi, occorre dimostrare lesistenza di una funzione f X che abbia come dominio
tutto A, oppure come immagine tutto B. Nel primo caso, allargando il codominio di f da B 0 a B, otteniamo
una funzione iniettiva da A in B; nel secondo caso, facciamo la stessa operazione su f 1 : B A0 , ottenendo
una funzione iniettiva di B in A.
Su X definiamo il seguente ordinamento:
(f : A0 B 0 )  (g : A00 B 00 ) , A0 A00 , B 0 B 00 e f = g|A0 ,
(in termini puramente insiemistici, f A0 B 0 , g A00 B 00 ; allora f  g se e solo se f g).
Si verifica facilmente che  `e una relazione dordine (parziale a meno che A e B non contengano un
unico elemento). Mostriamo che (X, ) `e induttivo.
S
= S Bi , e sia f : A B

Sia C = {fi : Ai Bi : i I} una catena di X. Poniamo A = iI Ai , B


iI
la funzione il cui grafico `e lunione dei grafici delle fi . E evidente che fi  f per ogni i I, e dunque f `e
un maggiorante di C in X.
Essendo dunque X induttivo, per il Lemma di Zorn, esso ammette un elemento massimale f0 : A0 B 0 .
Se A0 e B 0 fossero entrambi sottoinsiemi propri di A e B rispettivamente, potremmo scegliere a
A \ A0 e
0
0
0
b B \ B e definire f1 : A {
a} B {b} ponendo
(
f0 (a) se a A0
f1 (a) =
b
se a = a
.
Avremmo allora f1 X e f0 f1 , in contrasto con lipotesi di massimalit`a di f0 .

Teorema 11.3. Ogni insieme ammette un ordinamento totale.


Dimostrazione. Sia A un insieme, che supponiamo non vuoto5. Chiamiamo X linsieme delle coppie
(A , ), dove A0 A e `e un ordinamento totale su A0 . Su X definiamo la relazione
0

(A0 , )  (A00 , v) , A0 A00 e v|A0 = .


X non `e vuoto perche i sottoinsiemi di A contenenti un unico elemento ammettono un ovvio ordinamento
totale. In modo analogo al teorema precedente, si dimostra che (X, ) `e induttivo. Per il lemma di Zorn,
esiste un elemento massimale (A0 , ). Se fosse A0 6= A, potremmo prendere a
A \ A0 e definire un
0
ordinamento totale su A {
a} che estenda , stabilendo, per es., che a
sia lelemento massimo. Questo
contrasterebbe con lipotesi di massimalit`
a.

Come abbiamo anticipato, il Lemma di Zorn `e equivalente allAssioma della scelta. La dimostrazione
nel prossimo paragrafo mostrer`
a che, assumendo vero lAssioma della scelta, si dimostra il Lemma di Zorn.
Mostriamo qui che, viceversa, assumendo vero il Lemma di Zorn, si dimostra lAssioma della scelta.
Teorema 11.4. Il Lemma di Zorn implica lAssioma della scelta.
Dimostrazione. Sia {Ai : i I} una famiglia non vuota di insiemi non vuoti a due a due disgiunti.
Poniamo
n
o
[
X= B
Ai : i I , B Ai contiene al pi`
u un elemento .
iI
5Se A = , la relazione `
e un ordinamento totale.

18

1. ELEMENTI DI TEORIA DEGLI INSIEMI

Chiaramente X `e non vuoto ( X). Ordinando


X per inclusione, mostriamo che (X, ) `e induttivo.
=S

Se C = {Bj : j J} `e una catena, prendiamo B


jJ Bj . Dobbiamo mostrare che B X. Supponiamo
Ai contenga due elementi distinti b1 , b2 . Esisteranno allora j1 , j2 tali
per assurdo che esista i I tale che B
che b1 Bj1 e b2 Bj2 . Siccome C `e totalmente ordinato, uno dei due `e contenuto nellaltro. Supponiamo
che B2 B1 , per cui b1 , b2 Bj1 . Ma allora b1 , b2 Bj1 Ai . Ma poiche Bj1 X, deve essere b1 = b2 , da
cui lassurdo.
Per il Lemma di Zorn, X ammette un elemento massimale B0 . Mostriamo che per ogni i I, B0 Ai
contiene un elemento. Se, per assurdo, esistesse i0 tale che B0 Ai0 = , scegliendo un elemento b
Ai0 , avremmo linsieme B1 = B0 {b} X, strettamente maggiore di B0 , contrariamente allipotesi di
massimalit`
a.


12. Dimostrazione del Lemma di Zorn


Scomponiamo la dimostrazione in pi`
u passi. Il primo passo consiste nel ridursi a insiemi ordinati induttivi
di tipo particolare.
Diciamo che un insieme ordinato non vuoto (A, ) `e strettamente induttivo se ogni catena di A possiede
estremo superiore6.
Lemma 12.1. Se il Lemma di Zorn vale per insiemi strettamente induttivi, esso vale per insiemi induttivi.
Dimostrazione. Sia (A, ) induttivo. Chiamiamo C linsieme delle catene di A, ordinate per inclusione.
Allora (C, ) `e strettamente induttivo. Sia infatti S una
S catena di C, cio`e una famiglia {Ci : i I} di catene
di A totalmente ordinate per inclusione. Allora C = iI Ci `e pure una catena di A ed `e la minima catena
contenente ciascun Ci . Dunque C = sup S.
Sia ora a A, e ci consideri la catena Ca = {a} C. Per ipotesi, esiste in C un elemento massimale C0
con {a} C0 . Siccome A `e induttivo, C0 ammette un maggiorante a
. Poiche C0 `e massimale, deve essere
a
C0 , altrimenti C0 {
a} sarebbe unaltra catena contenente propriamente C0 . Dunque a
= max C0 ed `e
un elemento massimale di A. Inoltre a a
.

Supponiamo allora che (A, ) sia un insieme ordinato strettamente induttivo. Il secondo passo della
dimostrazione consiste nellanalizzare le funzioni f : A A tali che
(12.1)

a A,

a f (a) .

Lemma 12.2. Sia (A, ) strettamente induttivo e sia f una funzione di A in se che soddisfi la propriet`
a
(12.1). Dato a A, esiste una catena C di A tale che
(i) a = min C;
(ii) C ha massimo;
(iii) f (C) C.
Dimostrazione. Chiamiamo S linsieme dei sottoinsiemi S A tali che
(1) a = min S;
(2) f (S) S;
(3) se C `e una catena di S, sup C S.
Ovviamente S = {x A : a x} S, per cui S non `e vuoto. Sia
\
M=
S.
SS

Si verifica facilmente che M S. Se dimostriamo che M `e totalmente ordinato, la tesi `e dimostrata con
C = M.
6Gli insiemi induttivi introdotti nel paragrafo precedente sono tutti strettamente induttivi.

12. DIMOSTRAZIONE DEL LEMMA DI ZORN

19

Diciamo che un elemento b M `e una barriera se


b0 M , b0 < b = f (b0 ) b .
Vale la propriet`
a seguente:
(*) Se b `e una barriera, ogni elemento di M `e b oppure f (b).
Per dimostrarla, facciamo vedere che
Mb = {x M : x b} {x M : x f (b)} = Mb0 Mb00
`e un elemento di S.
Sicuramente a Mb . Per vedere che f (Mb ) Mb , consideriamo tre casi per x Mb . Se x < b, allora
f (x) Mb0 perche b `e una barriera e perche M S. Se x Mb00 , allora f (x) x f (b) ed `e in Mb00 . Il terzo
caso, x = b, `e ovvio.
Sia ora C una catena di Mb . Se C Mb0 , b `e un maggiorante di C, e dunque sup C Mb0 . Se C contiene
elementi di Mb00 , allora sup C f (b), `e in M , dunque sup C Mb00 .
Visto dunque che Mb S, ne segue che M Mb , per definizione di M . Ma linclusione opposta,
Mb M `e ovvia, per cui Mb = M . Questo dimostra (*).
Dimostriamo ora:
(**) Ogni elemento di M `e una barriera.
Chiamiamo B linsieme degli elementi barriera di M . Se mostriamo che B S, la (**) `e dimostrata.
Lelemento a `e una barriera, per il semplice fatto che non ci sono elementi di M minori strettamente di
a. Se x B, mostriamo che f (x) B. Se y M e y < f (x), per la (*) si ha y x. Ma allora f (y) x se
y < x, e f (y) = f (x) se y = x. In ogni caso, f (y) f (x).
Sia poi C una catena di B, e sia s = sup C. Vogliamo dimostrare che s B. Se s = max C non c`e nulla
da dimostrare, perche s C. Supponiamo dunque che C non abbia massimo.
Siccome B M S, si ha s M . Prendiamo x M , x < s. Siccome s `e il minimo maggiorante di C,
x non pu`
o essere un maggiorante di C, e dunque neanche di f (C). Esiste dunque y C tale che x 6 f (y).
Siccome y `e una barriera, ci`
o implica, per la (*), che x y.
Se x < y, allora f (x) y < s. Se x = y, siccome stiamo supponendo che C non ha massimo, esiste
y 0 C con y < y 0 . Ma allora, essendo y 0 una barriera, f (x) y 0 < s. Abbiamo cos` dimostrato la (**).
Siano infine x, y M . Essendo x una barriera, si hanno due casi: o y x, oppure y f (x) x. In
ogni caso essi sono confrontabili.


Corollario 12.3. Sia (A, ) un insieme ordinato strettamente induttivo e sia f : A A tale che f (a) a
per ogni a A. Per ogni a A esiste allora un elemento m a tale che f (m) = m.
Dimostrazione. Dato a, sia C la catena costruita nel Lemma 4.3, e sia m il suo massimo. Poiche
f (C) C, f (m) C, ma essendo f (m) m, deve necessariamente essere f (m) = m.

Conclusione della dimostrazione del Lemma di Zorn.
Per ogni b A, poniamo
(
{b}
Xb =
{x A : x > b}

se b `e massimale
altrimenti.

S
Ciascun Xb `e non vuoto, e per lassioma della scelta esiste una funzione f : A bA Xb tale che
f (b) Xb per ogni b A. Per il Corollario 12.3, dato a A, esiste m a tale che f (m) = m. Ma ci`
o
equivale a dire che m `e massimale.

20

1. ELEMENTI DI TEORIA DEGLI INSIEMI

13. Il Teorema di Zermelo


Un ordinamento su A si dice un buon ordinamento se ogni sottoinsieme non vuoto possiede un elemento
minimo. Per esempio, la Proposizione 7.5 dimostra che lordinamento standard su N `e un buon ordinamento.
Un altro esempio `e dato dallordinamento lessicografico su N2 :
(m, n) (m0 , n0 ) m < m0 oppure m = m0 e n n0 .
E chiaro che ogni buon ordinamento su A `e totale: per confrontare due suoi elementi a e b basta
prendere in esame il sottoinsieme {a, b}. E anche chiaro che ogni buon ordinamento su A ammette un
minimo assoluto: basta prendere in esame il sottoinsieme A. Il seguente teorema, noto anche come Principio
del buon ordinamento, `e invece piu delicato.
Teorema 13.1 (Teorema di Zermelo). Ogni insieme ammette un buon ordinamento.
Nel corso della dimostrazione diremo che un sottoinsieme B di un insieme bene ordinato (A, ) `e un
segmento di A se
b B , (a A e a < b) = a B .
Dimostrazione. Dato un insieme A, sia X linsieme delle coppie (B, ) dove B A e `e un buon
ordinamento su B. Su X introduciamo la relazione dordine
(B, )  (B 0 , 0 ) B 0 `e un segmento di B e 0|B = .

S
S
Se (Bi , i ) iI `e una catena in X, si verifica facilmente che
X, e che ogni Bi
iI Bi , iI i
ne `e un segmento. Quindi (X, ) `e induttivo.
Sia allora (B, ) un elemento massimale di X. Se B fosse un sottoinsieme proprio di A, potremmo
prendere un elemento a A \ B e introdurre su B {a} lordinamento che estende e pone a come massimo
di B {a}. Si vede facilmente che questo sarebbe un buon ordinamento, contro lipotesi di massimalit`
a di
(B, ).



Come si vede, nella dimostrazione `e stato usato il Lemma di Zorn, ossia lAssioma della scelta. In realt`
a
il Teorema di Zermelo `e equivalente allAssioma della scelta, come ora dimostriamo.
Teorema 13.2. Supponiamo che ogni insieme ammetta un buon ordinamento. Allora il prodotto cartesiano
di qualunque famiglia non vuota di insiemi non vuoti `e non vuoto.
S
Dimostrazione. Sia A = {Ai : i I} la famiglia di insiemi. Sia A = iI Ai la loro unione. Scegliamo
un buon ordinamento su A. Allora, per ogni i I, il sottoinsieme Ai di A ammette un minimo ai . La
funzione
f : I A,
i 7 ai
`e un elemento del prodotto cartesiano iI Ai .
Si noti che la definizione di f non richiede alcuna scelta arbitraria: in particolare questa definizione non
richiede lAssioma della scelta.

Sugli insiemi bene ordinati vale la seguente forma estesa del principio di induzione.
Proposizione 13.3. Sia (A, ) un insieme bene ordinato con minimo a0 e sia P (a) un enunciato dipendente
da a A. Se
(
P (a0 ) `e vero
P (a0 ) vero per ogni a0 < a = P (a) `e vero ,
allora P (a) `e vero per ogni a A.

CAPITOLO 2

INSIEMI NUMERICI E OPERAZIONI


1. Operazioni su N
Definiamo loperazione di somma:
+ : N N N ,
1

tra numeri naturali . Fissato m N, definiamo m + n attraverso la formula induttiva


(
m+0=m ,
(1.1)
m + S(n) = S(m + n) .
Usando ripetutamente il principio di induzione, si possono derivare le propriet`a fondamentali della
somma. Limitiamoci a verificare la propriet`a commutativa:
Proposizione 1.1. Per ogni m, n N, m + n = n + m.
Dimostrazione. Dimostriamo preliminarmente che vale lidentit`a
S(m + n) = S(m) + n ,

m, n N ,

applicando il principio di induzione alla propriet`a


P (n) : S(m + n) = S(m) + n per ogni m N .


P (0) `e ovvia. Supponendo vera P (n), dimostriamo P S(n) , ossia che S m + S(n) = S(m) + S(n). Si
ha


S m + S(n) = S S(m + n) = S S(m) + n = S(m) + S(n) ,
per ogni m N.
Possiamo ora dimostrare per induzione che
Q(n) : m + n = n + m per ogni m N
`e vera per ogni n.
Per n = 0, dobbiamo dimostrare che 0 + m = m per ogni m N. Procediamo anche qui per induzione,
ponendo R(m): 0 + m = m. Certamente R(0) `e vera, per la prima delle (1.1). Supponendo vera R(m), si
ha, per la seconda delle (1.1),
0 + S(m) = S(0 + m) = S(m) ,

che dimostra R S(m) .
Abbiamo dunque verificato che Q(0) `e vera. Supponiamo ora vera Q(n). Allora
m + S(n) = S(m + n) = S(n + m) = S(n) + m ,

cio`e Q S(n) `e vera.

m N ,


1Rimane inteso che useremo la notazione m + n, abituale per le operazioni, in luogo di +(m, n), che sarebbe appropriata
alla definizione di + come funzione.
21

22

2. INSIEMI NUMERICI E OPERAZIONI

Con procedimenti analoghi si dimostra la propriet`a associativa della somma:


(m + n) + p = m + (n + p) ,

m, n, p N .

Si noti che, posto 1 = S(0), si ha


S(n) = n + 1 .
Valgono inoltre le seguenti equivalenze.
Proposizione 1.2.
(i) Siano m, n N. Allora m n se e solo se esiste k N tale che n = m + k.
(ii) Siano m, n, k N. Allora m n se e solo se m + k n + k.
(iii) Se m + k = n + k, allora m = n.
Dimostrazione. (i) Per provare una delle due implicazioni, dimostriamo per induzione su n m che
esiste k N tale che n = m + k. Se n = m limplicazione `e vera con k = 0. Supponiamo che limplicazione
valga per n. Allora
S(n) = S(m + k) = m + S(k) .
Per limplicazione inversa, basta dimostrare per induzione su k N che m m+k. La verifica `e semplice
e viene lasciata per esercizio.
Per dimostrare la (ii) si procede per induzione su k. Anche questa dimostrazione `e lasciata per esercizio.
La (iii) `e conseguenza diretta della (ii).

Definiamo ora il prodotto
: N N N ,
come segue. Fissato m N, poniamo induttivamente
(
m0=0
(1.2)
m S(n) = m n + m .
Si verifica facilmente che 1 m = m 1 = m per ogni m N.
E possibile verificare che il prodotto soddisfa le propriet`a associativa e commutativa e che vale la
propriet`
a distributiva della somma rispetto al prodotto
(m + n) p = m p + n p .

2. Dai naturali agli interi relativi


Su N2 introduciamo la relazione di equivalenza2
(m, n) (m0 , n0 ) m + n0 = n + m0 .


Indichiamo con (m, n) la classe di equivalenza dellelemento (m, n) e indichiamo linsieme quoziente
N2 / con il simbolo Z.

(2.1)

Lemma 2.1. La relazione Z


(2.2)





(m, n) Z (p, q) m + q n + p .

`e ben definita su Z ed `e un ordinamento totale.


Dimostrazione. Per poter dire che Z `e ben definita su Z, bisogna dimostrare che se (m, n) (m0 , n0 ),
(p, q) (p0 , q 0 ) e m + q = n + p, allora m0 + q 0 = n0 + p0 . Usando ripetutamente la Proposizione 1.2 (ii) e
la (2.1) si ottiene che m + n0 + q n + n0 + p, da cui m0 + n + q n + n0 + p, e quindi m0 + q n0 + p.
Aggiungendo p0 ad ambo i membri e procedendo allo stesso modo, si conclude che m0 + q 0 n0 + p0 .
A questo punto, `e molto semplice verificare che si tratti di un ordinamento totale.

2Si verifichi che lo `
e effettivamente.

3. DAGLI INTERI RELATIVI AI RAZIONALI

23

Segue pure dalla Proposizione 1.2 che ogni classe di equivalenza contiene un unico elemento della forma
(n, 0), oppure della forma (0, n) con n 1. Si ha allora





Z = (n, 0) : n N (0, n) : n N \ {0} .
Inoltre, se 0 < m < n,










(0, n) <Z (0, m) <Z (0, 0) <Z (m, 0) <Z (n, 0) .
Le operazioni di somma e prodotto su Z si definiscono come segue:

 
 

(m, n) + (p, q) = (m + p, n + q) ,

 
 

(m, n) (p, q) = (mp + nq, np + mq) .
Una
(1)
(2)
(3)
(4)
(5)

serie di semplici verifiche mostra che valgono le seguenti propriet`a:


le propriet`
a associativa e commutativa sia per la somma che per il prodotto;
la
propriet`
a distributiva della somma rispetto al


 prodotto;
 
 



(0,
0)
`
e
lelemento
neutro
per
la
somma,
cio`
e
(m,


 n) + (0, 0) = (m, n) per ogni (m, n) Z;
(1, 0) `e lelemento
neutro
per il prodotto, cio`e (m, n) (1,


 0) = (m, n) per ogni (m, n) Z;
ogni
elemento
(m,
n)
ha
un
opposto
(lelemento
(n,
m)
), tale cio`e che la somma dei due sia


(0, 0) ;


(6) se il
elementi
di Z `e nullo,
cio`e uguale
a (0, 0) , allora
 prodotto
 di due




almeno
unodei due
 `e nullo;
0
0
(7) se (n, m) Z (n0 , m0 ) , per ogni
(p,
q)
si
ha
(n,
m)
+
(p,
q)

(n
,
m
)
+
(p,
q)
;
Z




 



(8) se (m, n) Z (0, 0) e (p, q) Z (0, 0) , anche (m, n) (p, q) Z (0, 0) .

Le (1)-(8) forniscono le abituali regole dellaritmetica. Le propriet`a (1)-(5) si riassumono dicendo che Z
`e un anello commutativo. Valendo la (6), Z `e, pi`
u precisamente, un dominio di integrit`
a. 
 

Dora in poi adottiamo la abituale notazione semplificata, con n, n e in luogo di (n, 0) , (0, n) ,
Z rispettivamente.
3. Dagli interi relativi ai razionali
Con un procedimento non molto diverso,
 si arriva a costruire il campo Q dei numeri razionali a partire
da Z. Sul prodotto cartesiano Z N \ {0} consideriamo la relazione di equivalenza
(m, n) (m0 , n0 ) mn0 = nm0 ,
e indichiamo con m
e
n la classe di equivalenza di (m, n). Con questa convenzione, si verifica facilmente che `
ben definita la relazione dordine
m0
m
0 mn0 nm0 ,
n
n
e che sono ben definite le abituali operazioni di somma e prodotto.
In aggiunta alle propriet`
a (1)-(8) presentate per Z, valgono su Q le seguenti altre propriet`a:
p
(9) ogni elemento m
n 6= 0 ha un inverso, ossia un elemento q tale che
m p
(10) vale la propriet`
a archimedea: dati n , q > 0, esiste k N tale che
m
p
k
> .
n
q

mp
n q

= 1;

Linsieme delle propriet`


a (1)-(10) conferisce a Q la struttura di campo totalmente ordinato archimedeo.
Si noti che la validit`
a della (6) su Q segue direttamente dalla (9).
E importante osservare una forte differenza tra gli ordinamenti su Z e su Q. Mentre in Z ogni elemento
n ha un immediato predecessore, n1, e un immediato successore, n+1, Q `e denso in se: dati comunque
p
p
m0
m
m0
due elementi m
n < n0 , esiste un terzo elemento q tale che n < q < n0 (basta prendere la media aritmetica
dei due).

24

2. INSIEMI NUMERICI E OPERAZIONI

4. Costruzione del campo reale


Ci sono diversi modi di costruire il campo reale R una volta analizzata la struttura di Q. Presentiamo
il procedimento pi`
u comune, basato sulla nozione di sezione di Dedekind.
Definizione 4.1. Si chiama sezione di Dedekind3 in Q un sottoinsieme S di Q che soddisfi le seguenti
propriet`
a:
(i) S `e non vuoto;
(ii) S `e superiormente limitato;
(iii) S non ha massimo;
(iv) dati q, q 0 Q, se q S e q 0 < q, allora anche q 0 S (S non ha lacune).
Esempi.
(1) Sia p Q. Allora Sp = {q Q : q < p} `e una sezione di Dedekind.
(2) Linsieme S = {q Q : q < 0 q 2 < 2} `e una sezione di Dedekind4.
Indichiamo con R linsieme delle sezioni di Dedekind su Q.
Proposizione 4.2.
(a) La relazione di inclusione tra sezioni di Dedekind di Q definisce un ordinamento totale su R.
(b) Ogni sottoinsieme di R superiormente limitato ammette estremo superiore (propriet`
a di completezza).
(c) Lapplicazione : Q R data da (p) = Sp `e strettamente crescente, e dunque iniettiva.
(d) Date S, S 0 R con5 S S 0 , esiste p Q tale che S Sp S 0 .
Dimostrazione. (a) Ovviamente si tratta di un ordinamento. Per verificare che esso `e totale, si usa
ripetutamente la propriet`
a (iv) delle sezioni. Siano S, S 0 due sezioni, e supponiamo che S 6 S 0 . Preso
p S \ S 0 , si ha necessariamente q 0 < p per ogni q 0 S 0 , cio`e S 0 Sp . Ma essendo p S, Sp S. Quindi
S 0 S.
(b) Sia E R superiormente limitato. Esiste quindi una sezione S di Q tale che S S per ogni
S E. Lunione
[
S0 =
S,
SE

`e pure una sezione. Infatti `e non vuota ed `e superiormente limitata perche contenuta in S . Se S 0 avesse
massimo, questo massimo apparterrebbe a una sezione S E, e dunque S avrebbe un massimo, il che `e
assurdo. Infine, dato q S 0 , esiste S E tale che q S. Se q 0 < q, allora q 0 S, e dunque q 0 S 0 .
Chiaramente S 0 `e un maggiorante di E, perche S S 0 per ogni S E. Daltra parte, ogni maggiorante

S di E contiene ogni S E, e dunque contiene S 0 . Quindi S 0 `e il minimo maggiorante di E.


La (c) `e evidente. Per dimostrare la (d) `e sufficiente fare unaggiunta alla dimostrazione del punto (a).
Questa dimostra che, nelle presenti ipotesi, esiste p Q tale che S Sp S 0 . Siccome S 0 non ha massimo,
esiste un elemento p0 S 0 con p0 > p. Allora S Sp0 S 0 .


5. Operazioni su R
Siano S, S 0 due sezioni di Q. Definiamo
S + S 0 = {q + q 0 : q S , q 0 S 0 } .
Lemma 5.1. S + S 0 `e una sezione di Dedekind di Q. Inoltre, per ogni p, p0 Q, Sp + Sp0 = Sp+p0 .
3Spesso diremo semplicemente sezione.
4Lo si dimostri per esercizio.
5Il simbolo indica inclusione stretta.

5. OPERAZIONI SU R

25

Dimostrazione. Chiaramente, S + S 0 `e non vuoto.


Se m, m0 sono maggioranti rispettivamente di S, S 0 in Q, allora m + m0 `e un maggiorante di S + S 0 .
Quindi S + S 0 `e superiormente limitato.
Supponiamo per assurdo che S + S 0 abbia massimo m. Allora m = q + q 0 per qualche q S e q 0 S 0 .
Siccome q non `e massimo di S, esiste r S con r > q. Ma allora r + q 0 S + S 0 e r + q 0 > m, da cui
lassurdo.
Per dimostrare che S + S 0 soddisfa la condizione (iv), si prendano q S, q 0 S 0 e r Q con r < q + q 0 .
Allora r q < q 0 , e dunque r q S 0 . Quindi r S + S 0 .
Passando alla seconda parte dellenunciato, linclusione Sp +Sp0 Sp+p0 `e ovvia. Per ottenere linclusione
opposta, si prenda r Sp+p0 . Con lo stesso procedimento usato sopra, si si trova s in modo tale che s Sp
e r s Sp0 .

Proposizione 5.2. La somma su R gode delle seguenti propriet`
a:
(a) le propriet`
a associativa e commutativa;
(b) la sezione S0 = {q Q : q < 0} `e lelemento neutro;

(c) ogni sezione S ha un opposto, S, definito come6 S = c {q : q S} { sup S} ;
(d) se S S 0 , per ogni S 00 si ha S + S 00 S 0 + S 00 .
La dimostrazione viene lasciata per esercizio.
Definiamo ora il prodotto di sue sezioni S, S 0 come segue:
se S, S 0 S0 , si pone SS 0 = {qq 0 : q, q 0 0 , q S , q 0 S 0 } {q Q : q < 0};
per gli altri casi, il prodotto si definisce in modo che siano soddisfatte le identit`a (S)S 0 = S(S 0 ) =
(SS 0 ).
Esempio. Se S = {q Q : q < 0 q 2 < 2}, allora S 2 = S2 .
Tralasciamo le dimostrazioni dei seguenti enunciati.
Proposizione 5.3. Il prodotto di due sezioni di Dedekind `e una sezione di Dedekind. Inoltre Sp Sp0 = Spp0
per ogni p, p0 Q.
Sono infine soddisfatte le seguenti propriet`
a:
(e) le propriet`
a associativa e commutativa del prodotto;
(f) la propriet`
a distributiva della somma rispetto al prodotto;
(g) la sezione S1 `e lelemento neutro per il prodotto;
(h) ogni sezione S 6= S0 ha un inverso S 1 , tale cio`e che SS 1 = S1 ;
(i) se S, S 0 S0 , anche SS 0 S0 .
Nel seguito useremo le notazioni abituali per i numeri reali, facendo riferimento esplicito alle sezioni
di Dedekind solo quando sar`
a conveniente. Attraverso lidentificazione p Sp tra numeri razionali e
corrispondenti sezioni di Dedekind, consideriamo Q R. Il Lemma 5.1 e la Proposizione 5.3 mostrano che
le operazioni sui numeri razionali coincidono con quelle sulle corrispondenti sezioni. Inoltre indicheremo con
labituale simbolo la relazione dordine su R.
Lenunciato che segue generalizza lesempio presentato sopra.
Proposizione 5.4. Dato un numero reale x > 0 e un intero n 2 esiste uno e un solo numero reale positivo
y, detto radice n-esima di x, tale che y n = x.
Dimostrazione. Lunicit`
a di y segue dal fatto che, se 0 < a < b, allora 0 < an < bn , e quindi due
numeri positivi diversi non possono avere la stessa potenza n-esima.
Per dimostrare lesistenza di y, sia S la sezione di Q corrispondente a x. Essendo S0 S, S contiene
numeri razionali positivi. Poniamo y uguale al numero corrispondente alla sezione
S 0 = {q Q : q n S q < 0} .
6Lestremo superiore di S si intende in Q, se esiste (ossia se S = S con p Q).
p

26

2. INSIEMI NUMERICI E OPERAZIONI

Per verificare che S 0 S0 (cio`e y > 0), prendiamo p S con 0 < p 1. Allora pn p `e pure in S,
n
dunque p S 0 . Si vede facilmente che S 0 = S.


6. Campi
Definizione 6.1. Si chiama campo un insieme F dotato di due operazioni, indicate con + e e dette
rispettivamente somma e prodotto, che soddisfino le seguenti propriet`
a:
(a) propriet`
a commutativa di entrambe:
x, y F ,

xy =yx ;

x+y =y+x ,

(b) propriet`
a associativa di entrambe:
x, y, z F ,

(x y) z = (x (y z) ;

(x + y) + z = x + (y + z) ,

(c) propriet`
a distributiva della somma rispetto al prodotto:
x, y, z F ,

(x + y) z = x z + y z ;

(d) le due operazioni ammettono elementi neutri distinti (abitualmente indicati con 0 e 1 rispettivamente) cio`e tali che 0 6= 1 e
x F ,

x+0=x ,

x1=x ;

(e) esistenza dellopposto:


x F , x0 F :

x + x0 = 0 ;

(f) esistenza dellinverso per elementi diversi da 0:


x F \ {0} , x00 F :

x x00 = 1 ;

Esempi.

Q, R, C;7
F = {p + q 2 : p, q Q} con le operazioni indotte da R;
se p `e un numero
 P primo, Zp = {0, 1, . . . , p 1} con le operazioni intese modulo p;
F = F0 (x) = Q }, dove P e Q sono polinomi a coefficienti in un campo F0 e Q non `e il polinomio
nullo, con le normali operazioni algebriche tra funzioni razionali.

Dagli assiomi (a)-(f) che definiscono i campi, seguono numerose propriet`a generali, di cui elenchiamo le
principali:
dato x0 F , se esiste y tale che x0 + y = y, allora x0 = 0; in particolare F ammette un unico
elemento neutro per la somma;
dato x0 F , se esiste y 6= 0 tale che x0 y = y, allora x0 = 1; in particolare F ammette un unico
elemento neutro per il prodotto;
lopposto di un elemento di F e linverso di un elemento non nullo di F sono unici; essi vengono
indicati rispettivamente con x e x1 (o anche con 1/x);

(x + y) = x + (y), (xy)1 = x1 y 1 ;
(x) = x, (x1 )1 = x;
per ogni x, x 0 = 0 e x (1) = x;
x y = 0 x = 0 o y = 0.
7Il campo complesso C non sar`
a trattato in questi appunti. Si rinvia al testo universitario.

7. CAMPI ORDINATI

27

Definizione 6.2. Siano F e F 0 due campi. Si chiama omomorfismo di F in F 0 unapplicazione : F F 0


non identicamente nulla e tale che
(6.1)

x, y F ,

(x y) = (x) (y) .

(x + y) = (x) + (y) ,
0

Un omomorfismo di F in F si dice un isomorfismo se `e biiettivo. In tal caso anche 1 `e un


isomorfismo ed F e F 0 si dicono isomorfi.
Si dimostra facilmente che
un omomorfismo soddisfa le condizioni
(0F ) = 0F 0 ,

(1F ) = 1F 0 ,

(x) = (x) ,

(x1 ) = (x)1 ;

la relazione di isomorfismo tra campi `e una relazione di equivalenza.


7. Campi ordinati
Definizione 7.1. Un campo ordinato `e un campo F dotato di un ordinamento totale tale che
(a) per ogni x, y, z F , x y = x + z y + z;
(b) x, y 0 = x y 0.
Dagli assiomi di campo ordinato seguono numerose propriet`a generali, tra cui :
per ogni x F , x2 0, e x2 = 0 se e solo se x = 0; in particolare 0 < 1 ;
x y , a > 0 = a x a y ;
x > 0 = x < 0 e x1 > 0 ;
x y > 0 se e solo se x e y sono concordi.
Lemma 7.2. Dato un campo ordinato F , esiste un unico omomorfismo : Q F . Tale isomorfismo `e
strettamente crescente, cio`e p < q = (p) < (q). In particolare esso `e iniettivo e stabilisce un isomorfismo
tra Q e un sottocampo QF di F .
Dimostrazione. Sia : Q F un omomorfismo.
Induttivamente, si deve anche avere, per ogni n N

Necessariamente, (0) = 0F e 1 = 1F .

def

(n) = 1F + + 1F = nF .
|
{z
}
n volte

Essendo (n + 1)F = nF + 1F > nF , `e strettamente crescente su N.


Inoltre deve essere
(n) = nF ,
e si prolunga quindi a una funzione strettamente crescente su Z. Si verifica facilmente che le propriet`
a
(6.1) sono soddisfatte per x, y Z.
Preso ora p = m/n Q, per poter soddisfare alla condizione (m) = (m/n)(n), dobbiamo necessariamente porre
m
1
= (m) (n)
= mF (nF )1 .

n
Questa `e una buona definizione, perche sostituendo (mk)/(nk) al posto di m/n si ottiene lo stesso
risultato. Inoltre, prendiamo m/n < m0 /n0 in Q, supponendo n, n0 > 0. Allora (n), (n0 ) > 0F , e dunque
mn0 < m0 n = (m)(n0 ) < (m0 )(n) = (m) (n)1 < (m0 ) (n0 )1 .
Quindi `e strettamente crescente e le condizioni (6.1) si verificano facilmente.


+

Definizione 7.3. Un campo ordinato F si dice archimedeo se, dati x, y > 0, esiste n N tale che nF x > y.
Proposizione 7.4. Sia F un campo ordinato. Le seguenti propriet`
a sono equivalenti:
(i) F `e archimedeo;
(ii) NF = (N) non `e superiormente limitato in F ;

28

2. INSIEMI NUMERICI E OPERAZIONI


+
(iii) inf{n1
F : n N } = 0F ;
(iv) dati x, y F con x < y, esiste q QF tale che x < q < y.

La condizione (iv) si esprime dicendo che QF `e denso in F .


Dimostrazione. (i)(ii). Basta prendere x = 1F .
(ii)(i). Siccome NF non ha maggioranti, dati x, y > 0, esiste nF > y x1 .
(ii)(iii). La (iii) vuol dire che
x > 0 n N+ : n1
F <x .
Sostituendo y = x1 , questa condizione equivale a dire che per ogni y > 0 esiste n N+ tale che y < nF ,
e questa `e la (ii).
(iii)(iv). Il caso in cui x < 0 < y `e ovvio. Possiamo dunque supporre che x e y siano concordi.
Passando eventualmente agli opposti, ci riconduciamo al caso 0 < x < y.
Sia = y x > 0. Per la (iii), esiste allora k N+ tale che kF1 < . Consideriamo linsieme
{nF kF1 : n N}. Per ipotesi, esso contiene elementi maggiori di x. Sia m in minimo intero tale che
mF kF1 > x. Allora (mF 1F ) kF1 x e quindi
mF kF1 = (mF 1F ) kF1 + kF1 < x + = y .
Dunque x < mF kF1 < y.
(iv)(iii). Presi x = 0 e y > 0, esiste mF n1
QF compreso tra 0 e y. Possiamo supporre
F
1
1
mF , nF N+
.
Allora
0
<
n

n
<
y.

F
F
F
F
Esempio. Su F = R(x), il campo delle funzioni razionali a coefficienti reali, consideriamo il seguente
ordinamento: P/Q R/S se esiste una semiretta (a, +) R tale che P (x)/Q(x) R(x)/S(x) per ogni
x (a, +).
Si dimostri per esercizio che: (a) questo `e un ordinamento totale; (b) sono soddisfatte le condizioni della
Definizione 7.1; (c) F non `e archimedeo. Si verifichi con opportuni controesempi che per F non vale nessuna
delle propriet`
a (ii), (iii), (iv) della Proposizione 7.4.
8. Campi ordinati completi
Definizione 8.1. Un campo ordinato si dice completo se ogni suo sottoinsieme non vuoto e superiormente
limitato ha estremo superiore.
Lemma 8.2. Un campo ordinato e completo `e archimedeo.
Dimostrazione. Sia F ordinato e completo, e supponiamo per assurdo che non sia archimedeo. Allora
NF sarebbe superiormente limitato, e dunque ammetterebbe estremo superiore s F . Ma dalla condizione
s nF per ogni n N segue che anche s 1F nF per ogni n N. Ma allora s 1F < s sarebbe un
maggiorante di NF , da cui lassurdo.

Teorema 8.3. Sia F un campo ordinato completo. Lomomorfismo si estende a un isomorfismo strettamente crescente di R su F . Quindi ogni campo ordinato completo `e isomorfo a R.
Dimostrazione. Per t R, poniamo


(t)
= sup (q) : q Q , q < t .
Tale elemento (t)
`e certamente definito, perche linsieme `e maggiorato da un qualunque elemento (r)
con r Q, r > t. Dimostriamo una per una le propriet`a che ci fanno concludere che `e un omomorfismo
strettamente crescente che estende .
(1) Per ogni q Q, (q)

= (q): la disuguaglianza (q)

(q) `e ovvia. Per la (iv) della Proposizione 7.4, dato x < (q) esiste q 0 < q tale che x < (q 0 ) < (q). Quindi non si pu`o avere
(q)

< (q).

8. CAMPI ORDINATI COMPLETI

29

(2) `e strettamente crescente, dunque iniettiva: se t < u R, esistono q1 , q2 Q, t < q1 < q2 < u.
Quindi (t)
(q1 ) < (q2 ) (u).

(3) `e suriettiva: dato x F , poniamo = {q Q : (q) < x} e sia t = sup R. Chiaramente, `e


la sezione di Dedekind di Q che definisce il numero reale t. Per definizione di ,
(t)
= sup{(q) :
q }. E quindi ovvio che (t)
x. La disuguaglianza opposta si dimostra come al punto (1).
(4) per ogni t, u R, (t
+ u) = (t)
+ (u):

sia q Q, q < t + u. Scegliendo q1 Q con q u < q1 < t,


si otiiene una scomposizione di q, q = q1 + q2 , con q1 < t, q2 = q q1 < u e q2 Q. Allora
(q) = (q1 ) + (q2 ) < (t)
+ (u)

.
Passando quindi allestremo superiore rispetto ai q < t + u, si ottiene che (t
+ u) (t)
+ (u).

Daltra parte, dati q1 < t, q2 < u, con q1 , q2 Q, si ha


(q1 ) + (q2 ) = (q1 + q2 ) < (t
+ u) .
Passando allestremo superiore rispetto a q1 < t, si ottiene che (t)
+ (q2 ) (t
+ u). Allo stesso
modo si ottiene la disuguaglianza (t)
+ (u)

(t
+ u).
(5) per ogni t, u R, (tu)

= (t)
(u):

per quanto visto prima, (0)

= 0 e (t)

= (t).

Quindi
basta considerare il caso t, u > 0. Si procede in modo analogo a (4).

Corollario 8.4. Ogni campo ordinato archimedeo `e isomorfo a un sottocampo di R.
Dimostrazione. Si consideri lapplicazione 1 : QF R. Essendo F archimedeo, lapplicazione
: F R definita da
(x) = sup{1 (qF ) : qF QF , qF < x} ,
1
`e iniettiva ed estende . Una ripetizione, opportunamente adattata, degli argomenti usati nella dimostrazione del Teorema 8.3 mostra che `e un omomorfismo. Per liniettivit`a, `e un isomorfismo di F sulla sua
immagine (F ) R.


CAPITOLO 3

COMPLEMENTI SULLE SUCCESSIONI DI NUMERI REALI


In questo capitolo diamo per noti nozioni e teoremi principali relativi alle successioni di numeri reali, e
in particolare:
definizione di limite,
teoremi di unicit`
a del limite, permanenza del segno, limitatezza di una successione convergente,
criterio del confronto,
criterio dei due carabinieri per lesistenza del limite finito,
esistenza del limite per successioni monotone,
convergenza di sottosuccessioni di successioni convergenti,
esistenza dei limiti superiore e inferiore (massimo e minimo limite),
criterio di convergenza di Cauchy.

1. Confronti asintotici tra successioni


Definizione 1.1. Siano (an )nN e (bn )nN due successioni.
(a) Si dice che
an = O(bn ) ,
se esistono un indice n0 e una costante M 0 tali che
n n0 ,

(1.1)

|an | M |bn | .

(b) Si dice che


an = o(bn ) ,
se per ogni > 0 esiste un indice n0 tale che
(1.2)

n n0 ,

|an | < |bn | .

I simboli O e o si chiamano simboli di Landau.


Le propriet`
a seguenti sono di semplice verifica, che viene lasciata per esercizio:
(1) an = o(bn ) = an = O(bn );
(2) se i termini bn sono definitivamente non nulli (diciamo, per n n0 ), si ha an = O(bn ) se e solo se
an
i rapporti an /bn sono limitati per n n0 , e an = o(bn ) se e solo se limn
= 0;
bn
(3) an = O(bn ) , bn = O(cn ) = an = O(cn );
(4) an = O(bn ) , bn = o(cn ) = an = o(cn ) e an = o(bn ) , bn = O(cn ) = an = o(cn );
(5) an = O(bn ) , a0n = O(bn ) = an + a0n = O(bn );
(6) an = o(bn ) , a0n = o(bn ) = an + a0n = o(bn );
(7) an = O(bn ) , a0n = O(b0n ) = an a0n = O(bn b0n ).
(8) an = O(bn ) , a0n = o(b0n ) = an a0n = o(bn b0n ).
La relazione an = o(bn ) si esprime anche dicendo che an `e trascurabile rispetto a bn . Questa terminologia
si riferisce al fatto che nel calcolo dei limiti si applica spesso la relazione
lim

an
an + o(an )
= lim
,
n
cn + o(cn )
cn
31

32

3. COMPLEMENTI SULLE SUCCESSIONI DI NUMERI REALI

che consente utili semplificazioni.


Definizione 1.2. Siano (an )nN e (bn )nN due successioni. Si dice che an  bn se an = O(bn ) e bn = O(an ).
Usando le propriet`
a (3) e (4), si dimostra facilmente quanto segue.
Proposizione 1.3.
(i) La relazione  `e una relazione di equivalenza sullinsieme delle successioni a valori reali.
(ii) Se an  bn ,
(1.3)

cn = O(an ) cn = O(bn )

cn = o(an ) cn = o(bn ) .

Le classi di equivalenza modulo  si chiamano ordini di grandezza di successioni.


Definizione 1.4. Siano a, b due ordini di grandezza e siano (an )nN a, (bn )nN b. Diciamo che a  b
se an = O(bn ).
Si vede facilmente che la validit`
a di questa condizione `e indipendente dalla scelta degli elementi di a e
b.
Proposizione 1.5. La relazione  `e ben definita sullinsieme degli ordini di grandezza di successioni, ed `e
una relazione dordine.
Osserviamo che
La relazione  non `e un ordinamento totale: si prendano, per esempio
(
(
1 se n `e pari
n se n `e pari
bn =
an =
n se n `e dispari;
1 se n `e dispari,
i rispettivi ordini di grandezza non sono confrontabili.
an
Se esiste, finito o infinito, il limite limn
= `, allora
bn
an = O(bn ) ` R ,

an = o(bn ) ` = 0 ,

an  bn ` R \ {0} .

Siano (an )nN a, (bn )nN b. Le due condizioni an = o(bn ) e a b non coincidono ne una
delle due implica laltra. Si consideri infatti che la successione identicamente nulla `e o di se stessa,
quindi an = o(bn ) 6 a b. Si prendano poi, ad esempio, le successioni
(
n se n `e pari
an =
,
bn = n ;
1 se n `e dispari
i rispettivi ordini di grandezza a e b soddisfano la condizione a b, ma an 6= o(bn ).
Introduciamo ora una relazione di equivalenza pi`
u fine di .
Definizione 1.6. Siano (an )nN , (bn )nN due successioni. Diciamo che esse sono asintoticamente equivalenti (notazione: an bn ) se an bn = o(bn ).
Che sia una relazione di equivalenza `e parte del seguente enunciato.
Proposizione 1.7.
(i) Vale limplicazione an bn = an  bn .
(ii) La relazione `e una relazione di equivalenza tra successioni.
(iii) Se i termini bn sono definitivamente diversi da 0, e il rapporto an /bn ammette limite, allora
an
=1.
an bn lim
n bn

2. ORDINI DI INFINITO E DI INFINITESIMO

33

Dimostrazione. Se an bn , dato > 0, esiste n0 tale che


|an bn | < |bn | ,
per ogni n n0 . Per tali valori di n,
|an | |an bn | + |bn | < (1 + )|bn | ,
e
|an | |bn | |an bn | > (1 )|bn | .
Questo dimostra (i).
Per dimostrare (ii) osserviamo innanzitutto che la propriet`a riflessiva di `e ovvia, mentre la propriet`
a
simmetrica segue dalla seconda equivalenza nella (1.3). Assumendo poi che an bn e bn cn , si ha, per la
propriet`
a (6),
an cn = (an bn ) + (bn cn ) = o(bn ) + o(cn ) = o(cn ) + o(cn ) = o(cn ) .
Infine, (iii) segue facilmente dalla propriet`a (2).

2. Ordini di infinito e di infinitesimo


Sia un numero reale positivo. Una successione (an )nN si dice un infinito di ordine , rispettivamente
un infinitesimo di ordine , se an  n , rispettivamente an  n .
In modo analogo si definiscono infiniti e infinitesimi di ordine rispetto a una successione campione
(bn )nN positiva e infinita, scelta in sostituzione della successione bn = n (per es., bn = en , oppure bn = log n).
Nel seguito ci limitiamo ad assumere bn = n come infinito campione, ma quello che diremo ha evidenti
estensioni al caso generale.
Se, per un dato > 0,
an
lim
= c R \ {0} ,
n n
e quindi (an )nN `e infinita di ordine , si ha
an cn ,

ossia se an = cn + o(n ) ,

e cn si chiama la parte principale di an . In modo analogo si definisce, se esiste, la parte principale di un


infinitesimo di ordine .
Esempio.
Si prenda la successione
an =
Siccome

n2 n .

n2 n
=1,
n
n
an `e infinita di ordine 1 con parte principale n. Quindi
p
n2 n = n + o(n) .

Il resto rn = n2 n n, che sappiamo essere o(n) pu`o essere a sua volta analizzato, osservando che
n
1
lim rn = lim
= .
2
n
n
2
n n+n
Quindi
1
an = n + rn = n + o(1) ,
2
dove o(1) indica ovviamente un generico infinitesimo. Analizziamo dunque il nuovo resto
1
p
1
4
rn0 = n2 n n + =
.
2
n2 n + n 12
lim

34

3. COMPLEMENTI SULLE SUCCESSIONI DI NUMERI REALI

1
Questo `e infinitesimo di ordine 1 con parte principale . Quindi
8
1
1
+ o(n1 ) .
an = n
2 8n
Iterando questo procedimento, `e possibile, calcolando iterativamente i coefficienti ck , giungere per ogni
k a una formula
ck
1
1
c2
+ + k + o(nk ) .
an = n
+
2 8n n2
n
Questo tipo di formula costituisce lo sviluppo asintotico dei termini an della successione data.
Osservazione 2.1. Le definizioni e notazioni introdotte in questi due paragrafi vengono utilizzate anche per
funzioni di variabile reale. Siccome esse possono riguardare sia il comportamento asintotico di una funzione

per x , sia quello per x x0 con x0 R, `e necessario accompagnare le espressioni f (x) = O g(x) ,
f (x) g(x), ecc. dallindicazione del punto, finito o infinito, verso cui si intendono i limiti o nel cui intorno
devono valere le maggiorazioni. Per esempio, si scrive
sin x x (x 0) ,
per esprimere che limx0

oppure

sin x x0 x ,

sin x
= 1.
x

3. Teoremi di Cesaro
Sia (an )nN una successione di numeri reali. Si chiama media di Cesaro n-esima della successione data
la media aritmetica dei termini a0 , . . . , an :
n

(3.1)

n =

a0 + a1 + + an
1 X
=
ak .
n+1
n+1
k=0

Teorema 3.1 (Primo teorema di Cesaro). Se la successione (an )nN tende al limite ` (finito o infinito),
anche la successione (n )nN tende a `.
Dimostrazione. Consideriamo per primo il caso in cui ` = +. Dato un numero M > 0, esiste un
indice n0 tale che, per ogni n n0 , an > 2M . Se n n0 si ha dunque
a0 + + an0 1
n n0
n >
+ 2M
.
n+1
n+1
Essendo
a + + a
n n0 
0
n0 1
lim
+ 2M
= 2M ,
n
n+1
n+1
a0 + + an0 1
n n0
esiste un indice n1 n0 tale che, per n n1 ,
+ 2M
> M , e dunque n > M . Quindi
n+1
n+1
limn n = +.
Per il caso ` = basta sostituire alla successione degli an la successione dei an .
Supponiamo ora che il limite ` sia finito. Sostituendo alla successione degli an la successione dei bn =
an `, e osservando che le medie di Cesaro n dei bn sono n = n `, possiamo ridurci al caso ` = 0.
Dato > 0, esiste un indice n0 tale che, per ogni n0 , |bn | < /2. Allora, per n n0 ,
|n |

|b0 | + + |bn0 1 | n n0
+
.
n+1
2 n+1

Essendo

 |b | + + |b
n n0 
0
n0 1 |
+
= ,
n
n+1
2 n+1
2
esiste un indice n1 n0 tale che, per n n1 , |n | < . Quindi limn n = 0.
lim

3. TEOREMI DI CESARO

35

Limplicazione inversa a quella dimostrata nel teorema, limn n = ` = limn an = ` non `e vera.
E possibile infatti che le medie n abbiano limite e che gli an non lo abbiano. Per esempio, si prenda
an = (1)n , le cui medie di Cesaro, uguali a
(
0
se n `e dispari
n =
1
se
n `e pari ,
n+1
tendono a 0.
Corollario 3.2. Sia (an )nN una successione di numeri reali, e si supponga che limn (an+1 an ) = `
(finito o infinito). Allora limn an /n = `.
Dimostrazione. Si consideri la successione (bn )nN , dove b0 = a0 e, per n 1, bn = an+1 an . Le
medie di Cesaro dei bn sono
b0 + + bn
an+1
n =
=
.
n+1
n+1
Quindi limn an /n = limn n1 = `, per il Teorema 3.1.

Si noti che in realt`
a il Corollario 3.2 `e equivalente al primo teorema di Cesaro. Basta osservare che
la (3.1) `e equivalente allidentit`
a
an = nn (n 1)n1 .
Quindi, applicando il Corollario 3.2 alla successione (nn )nN , si ottiene il Teorema 3.1.
Teorema 3.3 (Secondo teorema di Cesaro). Sia (an )nN una successione di numeri reali strettamente
positivi. Se limn an = ` (finito o infinito), anche la successione delle medie geometriche

n = n a0 a1 an
tende a `.
Dimostrazione. Osserviamo che, essendo an > 0 per ogni n, si ha necessariamente ` 0.
Supponiamo ` = +. Dato un numero M > 0, esiste un indice n0 tale che, per ogni n n0 , an > 2M .
Se n n0 si ha dunque
p
nn0
1
n > (a0 a1 an0 ) n (2M ) n = 2M n a0 a1 an0 (2M )n0 .

Poiche limn n b = 1 per ogni b > 0, esiste n1 n0 tale che n > M per ogni n n1 .
Per il caso ` = 0, basta sostituire agli an i loro reciproci 1/an .
Consideriamo dunque il caso 0 < ` < +. Sostituendo gli an con an /`, possiamo supporre che ` = 1.
Dato > 0, esiste un indice n0 tale che, per ogni n n0 , 1 2 < an < 1 + 2 . Allora, se n n0 ,
nn
nn


1
1
 n 0
 n 0
(a0 a1 an0 ) n 1
< n < (a0 a1 an0 ) n 1 +
.
2
2
Il limite del primo termine `e 1 2 , e il limite del terzo termine `e = 1 + 2 . Quindi esiste un indice
n1 n0 tale che, per n n1 , 1 < n < 1 + .

Usando la continuit`
a delle funzioni logaritmo ed esponenziale (che qui non diamo ancora per note), il
Teorema 3.3 si ottiene pi`
u semplicemente applicando il Teorema 3.1 alla successione log an . E fondamentale,
per la validit`
a del teorema 3.3 che gli an siano tutti strettamente positivi. Se uno solo di essi `e nullo, da
quellindice in poi tutte le medie n sono nulle, e tendono quindi a 0 indipendentemente dal limite degli an .
Corollario 3.4. Sia (an )nN una successione di numeri reali strettamente positivi, e si supponga che

limn an+1 /an = ` (finito o infinito). Allora limn n an = `.


Come prima, questo enunciato `e equivalente al Teorema 3.3, e si dimostra in modo del tutto analogo al
Corollario 3.2.

36

3. COMPLEMENTI SULLE SUCCESSIONI DI NUMERI REALI

4. Teorema di Stolz-Cesaro
Il Teorema di Stolz-Cesaro pu`
o essere visto come una forma discretizzata della regola di de lH
opital.
La discretizzazione si riferisce, in una analogia tra funzioni della variabile continua x R e funzioni
(successioni) della variabile intera n N, a una corrispondenza tra operazioni del calcolo differenziale e
integrale da un lato e operazioni aritmetiche dallaltro, come quelle indicate in tabella:
Continuo

Discreto

derivata: f 0 (x)

differenza: an+1 an

integrale:

Ra
0

somma: sn = a0 + + an

f (x) dx

media integrale:

1
a

Ra

integrale improprio:

media di Cesaro:

f (x) dx

R +
0

f (x) dx

a0 ++an
n+1

somma della serie:

n=0

an

Teorema 4.1 (Teorema di Stolz-Cesaro). Siano (an )nN , (bn )nN due successioni. Si supponga che
(i) (bn )nN sia strettamente monotona;
(ii) valga una delle seguenti condizioni:
(4.1)

lim an = lim bn = 0 ,

oppure
lim bn = + (oppure ) ;

(4.2)

(iii) lim

an+1 an
= `, finito o infinito.
bn+1 bn

Allora
(4.3)

an
=`.
n bn
lim

Si noti che nel caso (4.1), il limite (4.3) si presenta nella forma indeterminata 0/0, mentre il caso (4.2)
comprende quello di limiti nella forma indeterminata /. Si noti anche che il teorema nella forma (4.2)
comprende il Corollario 3.2 come caso particolare.
Dimostrazione. Consideriamo separatamente i quattro casi, secondo che valga la (4.1) o la (4.2) e
secondo che ` sia finito o infinito.
Forma indeterminata 0/0, ` infinito.
A meno di cambiar segno ai termini di una, o di entrambe le successioni, possiamo supporre che la
successione (bn )nN sia strettamente decrescente, e dunque bn > 0 per ogni n, e inoltre che ` = +.
Fissato M > 0, esiste n0 N tale che, per ogni n n0 ,
an+1 an
> M , ossia an an+1 > M (bn bn+1 ) .
bn+1 bn

4. TEOREMA DI STOLZ-CESARO

37

Per ogni p > 0 si ha


an an+p = (an an+1 ) + (an+1 an+2 ) + + (an+p1 an+p )

> M (bn bn+1 ) + (bn+1 bn+2 ) + + (bn+p1 bn+p )
= M (bn bn+p ) .
Passando al limite per p , si ha
an M bn .
per ogni n n0 . Si ha cos` la tesi.
Forma indeterminata 0/0, ` finito.
Come sopra, possiamo supporre che la successione (bn )nN sia strettamente decrescente, e dunque bn > 0
per ogni n. Sostituendo, se necessario, an con an `bn , possiamo anche supporre che ` = 0.
Fissato > 0, esiste n0 N tale che, per ogni n n0 ,
|an an+1 | < (bn bn+1 ) .
Per ogni p > 0 si ha allora che
|an an+p | < (bn bn+p ) .
Passando al limite per p , si ha
|an | bn ,
per ogni n n0 , e dunque la tesi.
Caso bn /, ` infinito.
Possiamo supporre che sia ` che limn bn siano +, e dunque che la successione (bn )nN sia strettamente crescente.
Fissato M > 0, esiste n0 N tale che, per ogni n n0 , an > 0 e inoltre
an+1 an
> M , ossia an+1 an > M (bn+1 bn ) .
bn+1 bn
Per n > n0 si ha
an an0 = (an an1 ) + (an1 an2 ) + + (an0 +1 an0 )

> M (bn bn1 ) + (bn1 bn2 ) + + (bn0 +1 bn0 )
= M (bn bn0 ) .
Dividendo per bn , si deduce che, per n > n0 ,


bn  a n
bn 
an
>M 1 0 + 0 >M 1 0 .
bn
bn
an
bn
Ma

bn 
lim 1 0 = 1 ,
n
bn
an
M
per cui si ha definitivamente
>
.
bn
2
Caso bn /, ` finito.
Come sopra, possiamo supporre che limn bn = +, e dunque che (bn )nN sia strettamente crescente,
e inoltre che ` = 0.
Fissato > 0, esiste n0 tale che, per ogni n n0 , bn > 0 e
|an+1 an | < (bn bn+1 ) .
Si ha allora, per n > n0 ,
|an | |an an1 | + |an1 an2 | + + |an0 +1 an0 | + |an0 |

< (bn bn1 ) + (bn1 bn2 ) + + (bn0 +1 bn0 ) + |an0 |
= (bn bn0 ) + |an0 | .

38

3. COMPLEMENTI SULLE SUCCESSIONI DI NUMERI REALI

Dividendo per bn , si ha, per n > n0 ,


a

bn  |an0 |
|an0 |
n
<+
.
< 1 0 +
bn
bn
bn
bn
an
|an0 |
Essendo lim
= 0, definitivamente si ha < 2.
n bn
bn
Esempi/Esercizi.
log n!
= 1;
n log n
(2) Si dimostri che per p N,
n
X
(4.4)
kp
(1) Si dimostri che lim

k=1

1
np+1
p+1

(n ) ,

e che, per p = 1, si ha
n
X
1
log n (n ) .
k

(4.5)

k=1

Assumendo la disuguaglianza di Bernoulli,


(1 + x) 1 + x ,

(4.6)

( 1 , x 1) ,

si dimostri che la formula (4.4) si estende a p R, p > 1, e infine che, per p > 1,

X
1
1
1

(n ) .
p
p1
k
p1 n
k=n

CAPITOLO 4

SOMMATORIE SU INSIEMI INFINITI


In questo capitolo diamo per noti nozioni e teoremi principali relativi alle serie numeriche, e in particolare:
definizione di somma di una serie,
condizione necessaria (termine n-esimo infinitesimo) per la convergenza,
criteri di convergenza per serie positive: confronto, condensazione di Cauchy, radice, rapporto,
criterio di convergenza assoluta.

1. Somme a termini positivi


Dato un insieme I, indichiamo con Pf (I) linsieme dei sottoinsiemi finiti di I.
Sia I un insieme infinito, e sia a : I R. Conveniamo di indicare con ai il valore a(i), e con (ai )iI la
funzione a.
Definizione 1.1. Sia ai 0 per ogni i I. Si chiama sommatoria su I degli ai il valore
X
X
ai = sup
ai [0, +] .
F Pf (I) iF

iI

Si dice che la sommatoria converge se tale valore `e finito.


Vediamo alcune propriet`
a generali.
Proposizione 1.2. Se la sommatoria
rabile.

iI

ai converge, allora E = {i I : ai 6= 0} `e al massimo nume-

Dimostrazione. Sia S il valore della sommatoria. Se S = 0, allora necessariamenre ai = 0 per ogni i.


Supponiamo allora 0 < S < +. PerSogni n N+ , sia En = {i : ai S/n}. Ovviamente En non pu`
o
contenere pi`
u di n elementi. Quindi E = n>0 En `e al massimo numerabile.

Per determinare il comportamento di una sommatoria a termini positivi, `e possibile limitarsi a considerare
le somme finite su particolari sottofamiglie F di Pf (I), come ora vedremo.
Definizione 1.3. Una famiglia F di sottoinsiemi finiti di I si dice cofinale se, per ogni F Pf (I), esiste
F 0 F tale che F F 0 .
Proposizione 1.4. Sia F una sottofamiglia cofinale di Pf (I). Allora
X
X
ai = sup
ai .
F F

iI

Dimostrazione. La disuguaglianza
X
(1.1)
sup
ai
F F

iF

sup

iF

ai =

F Pf (I) iF

ai

iI

`e ovvia. Daltra parte, dato F Pf (I) sia F 0 F tale che F F 0 . Allora


X
X
X
ai
ai sup
ai .
iF

F F

iF 0
39

iF

40

4. SOMMATORIE SU INSIEMI INFINITI

Prendendo lestremo superiore delle somme a primo membro al variare di F in Pf (I), si conclude che
X
X
(1.2)
ai sup
ai .
F F

iI

iF

Confrontando (1.1) e (1.2) si ha la tesi.

Corollario 1.5. Sia I = N e sia (an )nN una successione a termini non negativi. La definizione di sommatoria secondo la Definizione 1.1 coincide con quella di somma della serie (cio`e come limite delle somme
parziali).


Dimostrazione. Basta osservare che F = {0, 1, . . . , n} : n N soddisfa le ipotesi della Proposizione 1.4.

Come vedremo al paragrafo 5, la stessa equivalenza non varr`a pi`
u per successioni di segno generico.
2. Limiti lungo insiemi ordinati filtranti
La nozione di sommatoria di termini (ai )iI non negativi `e stata data come un estremo superiore di
somme finite, e questo ha consentito di definirla per un insieme generico I infinito.
Per estendere la nozione di sommatoria a termini di segno qualunque, `e necessario esprimerla come
limite. Per far questo, occorre introdurre la nozione di insieme ordinato filtrante e di limite di una funzione
definita su un insieme filtrante.
Definizione 2.1. Un insieme ordinato (X, ) si dice filtrante se, dati comunque x, y X, esiste z X tale
che x z e y z.
Linsieme filtrante a cui saremo interessati `e X = Pf (I), con I infinito, ordinato per inclusione.
E inoltre filtrante un qualunque insieme non vuoto, totalmente ordinato e privo di massimo. medskip
Definizione 2.2. Sia (X, ) un insieme ordinato filtrante e sia f : X R. Si dice che ` R `e limite di
f lungo X, e si scrive
` = lim f (x) ,
xX

se per ogni > 0 esiste x


X tale che
x  x
,

|f (x) `| < .

In modo analogo si definiscono i limiti , .


Osservazione 2.3. La dimostrazione dei seguenti teoremi per limiti lungo insiemi filtranti `e lasciata per
esercizio.
(1) Unicit`
a del limite.
(2) Esistenza del limite di funzioni crescenti, cio`e tali che x y = f (x) f (y), e uguaglianza
limxX f (x) = supxX f (x), sempre per funzioni crescenti.
(3) Teoremi del confronto.
(4) Teoremi sulle operazioni su limiti.
(5) Se limxX f (x) = ` e Y `e cofinale1 in X, allora anche limyY f (y) = `.
(6) Se ` non `e il limite di f lungo X, esistono un intorno U di ` e un sottoinsieme Y cofinale in X tale
che f (y) 6 U per ogni y Y .
(7) Esistenza di lim supxX f (x) = inf xX supyx f (x) e del lim inf (definito analogamente).
(8) Criterio di convergenza di Cauchy: f ha limite finito lungo X se e solo se per ogni > 0 esiste x0
tale che, x, y  x0 , |f (x) f (y)| < .

1 Un sottoinsieme Y di X si dice cofinale in X se per ogni x X esiste y Y tale che x y. Questa definizione estende
a generici insiemi filtranti la Definizione 1.3.

3. SOMMATORIE A TERMINI DI SEGNO GENERICO

41

3. Sommatorie a termini di segno generico


Sia I un insieme infinito e Pf (I) ordinato per inclusione.
Definizione 3.1. Sia (ai )iI definita su I e a valori reali. Si chiama sommatoria degli ai il limite
X
X
ai = lim
ai ,
F Pf (I)

iI

iF

se tale limite esiste. La sommatoria si dice convergente, divergente o indeterminata secondo che il limite
esista finito, esista infinito o non esista rispettivamente.
Per F Pf (I), poniamo
s(F ) =

ai .

iF

Dimostriamo subito, per funzioni a termini non negativi, lequivalenza di questa definizione con la
Definizione 1.1.
Proposizione 3.2. Se ai 0 per ogni i I, allora
lim

F Pf (I)

s(F ) =

sup

s(F ) .

F Pf (I)

Dimostrazione. Se gli ai sono non negativi, la funzione s(F ) `e crescente su Pf (I). La tesi segue allora
dallEsercizio (2).

Nel resto di questo paragrafo, dimostreremo che una sommatoria converge se e solo se converge la sommatoria dei suoi valori assoluti. Per cominciare, diamo unapposita formulazione del criterio di convergenza
di Cauchy adattata alle sommatorie su insiemi infiniti.
P
Lemma 3.3 (Criterio di convergenza di Cauchy per sommatorie infinite). La sommatoria iI ai
converge se e solo se per ogni > 0 esiste un insieme F0 Pf (I) tale che, per ogni F Pf (I) disgiunto da
F0 , si abbia |s(F )| < .
Dimostrazione. Supponiamo che la sommatoria converga a s R. Allora, dato > 0 esiste F0 Pf (I)
tale che |s(F 0 ) s| < per ogni F 0 F0 finito. Dato F finito e disgiunto da F0 , si consideri F 0 = F F0 .
Allora
|s(F )| = |s(F 0 ) s(F0 )| |s(F 0 ) s| + |s s(F0 )| < 2 .
Viceversa, si supponga che, dato > 0, esista un insieme F0 Pf (I) tale che, per ogni F Pf (I)
disgiunto da F0 , si abbia |s(F )| < . Si considerino due sottoinsiemi finiti di I, F 0 e F 00 , entrambi contenenti
F0 . Allora le due differenze F 0 \ F 00 e F 00 \ F 0 sono entrambe disgiunte da F0 . Quindi s(F 0 \ F 00 )| < e
analogamente per s(F 00 \ F 0 ). Osservando che
s(F 0 ) s(F 00 ) = s(F 0 \ F 00 ) s(F 00 \ F 0 ) ,
si ottiene che
|s(F 0 ) s(F 00 )| |s(F 0 )| + |s(F 00 )| < 2 .
Per il criterio di convergenza di Cauchy, v. Esercizio (8), la sommatoria converge.

Teorema 3.4. La sommatoria


(3.1)

iI

an converge se e solo se converge la serie


X X


ai
|ai | .

iI

iI

iI

|an |. In tal caso,

42

4. SOMMATORIE SU INSIEMI INFINITI

Dimostrazione. Per ogni F Pf (I), poniamo


X
s(F ) =
ai ,

(F ) =

|ai | .

iF

iF

Ovviamente, per ogni f Pf (I),




s(F ) (F ) .

(3.2)

Supponiamo che converga la serie dei valori assoluti degli ai . Allora, dato > 0, esiste F0 Pf (I) tale
che, per ogni F Pf (I) disgiunto da F0 , (F ) < . Per la (3.2) e il criterio di convergenza di Cauchy, anche
la sommatoria degli ai converge.
Viceversa, supponiamo che converga la serie degli ai . Allora, dato > 0, esiste F0 Pf (I) tale che, per
ogni F Pf (I) disgiunto da F0 , |s(F )| < . Fissato un tale F , lo si scomponga nellunione disgiunta di
F+ = {i F : ai 0} ,

F = {i F : ai < 0} .

Allora anche F+ e F sono disgiunti da F0 , per cui




s(F ) = (F ) < .

s(F+ ) = (F+ ) < ,


Pertanto,

(F ) = (F+ ) + (F ) < 2 ,
e, per il criterio di convergenza di Cauchy, anche la sommatoria dei |ai | converge.
Infine, dalla (3.2) si ricava che, per ogni F Pf (I),
X


s(F ) sup (F 0 ) =
|ai | .
F 0 Pf (I)

iI

Passando al limite,
X


ai =

iI

lim

F Pf (I)


X
s(F )
|ai | .

iI

Dimostriamo ora che una sommatoria convergente su un insieme I si pu`o scomporre in una sommatoria
(finita o infinita) di sommatorie parziali.
2
Teorema 3.5.
P Sia {Ik }kK una partizione dellinsieme I, e sia (ai )iI una funzione da I a R. Allora la
sommatoria iI ai converge se e solo se valgono le seguenti propriet`
a:
P
(i) per ogni k K, iIk |ai | converge;
P
P
(ii) posto sk = iIk |ai |, la sommatoria kK sk converge.
In tal caso,
X
XX 
(3.3)
ai =
ai .
iI

kK

iIk

Dimostrazione. Consideriamo prima il caso in cui ai 0 per ogni i I.


Supponiamo che
X
ai = sup s(F ) = s
iI

F Pf (I)

sia finito. Fissiamo E Pf (K) e, per ogni k E, Fk Pf (Ik ). Posto F =


X
s(Fk ) = s(F ) s .

kE

Fk Pf (I), si ha

kE
2Nelle applicazioni, K sar`
a finito o numerabile. Si noti che sia linsieme K, sia uno o pi`
u degli insiemi Ik possono essere
finiti. In tal caso la condizione di convergenza della corrispondente sommatoria `
e automaticamente verificata. Per completezza
di dimostrazione, si assumer`
a implicitamente che tutti questi insiemi siano infiniti.

3. SOMMATORIE A TERMINI DI SEGNO GENERICO

43

Dallinsieme E isoliamo un suo singolo elemento k0 e teniamo a primo membro il termine corrispondente:
X
s(Fk0 ) s
s(Fk ) .
kE\{k0 }

Mantenedo fissati gli Fk a secondo membro, prendiamo lestremo superiore al variare di Fk0 in Pf (Ik0 ).
Si ottiene che
X
X
ai s
s(Fk ) .
iIk0

kE\{k0 }

In particolare, la sommatoria iIk ai converge, e la propriet`a (i) `e soddisfatta. Chiamiamo sk0 la sua
0
somma. Abbiamo allora la disuguaglianza
X
sk0 +
s(Fk ) s .
kE\{k0 }

Ripetendo lo stesso procedimento iterativamente per ognuno degli altri elementi di E, si ottiene che
X
sk s .
kE

Passando allestremo superiore rispetto a E Pf (K), si ottiene la condizione (ii), e inoltre che
X
X
(3.4)
sk
ai .
iI

kK

Supponiamo viceversa che siano soddisfatte le condizioni (i) e (ii). Dato F Pf (I), poniamo, per k K,
Fk = F Ik , e inoltre chiamiamo E Pf (K) linsieme dei k per cui Fk 6= . Essendo F lunione disgiunta
degli Fk con k E, si ha allora
X
X
X
s(F ) =
s(Fk )
sk
sk .
kE

kE

kK

Passando allestremo superiore rispetto a F Pf (I), si ottiene la disuguaglianza


X
X
(3.5)
ai
sk .
iI

kK

Abbiamo dunque dimostrato, nel caso ai 0 per ogni i, lequivalenza tra la convergenza della sommatoria
su I da un lato, e le condizioni (i) e (ii) dallaltro. Inoltre, le due disuguaglianze (3.4) e (3.5) forniscono
luguaglianza (3.3).
Consideriamo ora il caso generale. Poniamo
a
i = max{ai , 0} .
P
iI ai converga. Allora, per il Teorema 5.1,
iI |ai | converge. Essendo
a+
i = max{ai , 0} ,

Seupponiamo che

0 a
i |ai | ,
anche le due sommatorie
(3.6)

iI

a
i convergono. Inoltre, essendo ai = ai ai ,
X
X
X
ai =
a+
a
i
i .
iI

iI

iI

Applicando quanto dimostrato per sommatorie a termini positivi, possiamo allora affermare che
P
P
per ogni k K, le due sommatorie iIk a+
a
i ,
i convergono,
iIkP
P
0
00
chiamate sk , sk le rispettive somme, le sommatorie kK s0k , kK s00k convergono,
P
P
P
P
+

0
00

kK sk =
iI ai ,
kK sk =
iI ai .
Da questo si deduce che
P
per ogni k K, sk = iIk |ai | = s0k + s00k , e dunque vale la (i),
P
P
PkK sk = iI |ai |, e dunque vale la (ii),
0
00

iIk ai = sk sk ,

44

4. SOMMATORIE SU INSIEMI INFINITI

0
kK (sk

s00k ) =

iI

a+
i

a
i =

iI

iI

ai , cio`e vale la (3.3).

Rimane da dimostrare limplicazione inversa. Supponiamo che valgano (i) e (ii). Per confronto, le stesse

due condizioni valgono con a+


i , oppure ai , al posto
P di |ai |. Quindi, per la prima parte della dimostrazione,
possiamo dire che convergono le due sommatorie iI a
i e che
X
XX 
a
a
.
i =
i
iI

Ma allora
X
iI

kK

iIk

ai converge e
X
X
XX  XX  XX 

ai =
a+

a
=
a+

a
=
ai .
i
i
i
i
iI

iI

iI

kK

iIk

iIk

kK

kK

iIk

4. Sommatorie a pi`
u indici
Supponiamo che linsieme I degli indici di una sommatoria sia il prodotto cartesiano di k insiemi,
I = I1 I2 Ik ,
di modo che la sommatoria assume la forma a pi`
u indici
X

ai1 ,i2 ,...,ik .

(i1 ,i2 ,...,ik )I1 I2 Ik

Per semplicit`
a di notazioni ci limiteremo a considerare il caso k = 2, denotando con I e J, anziche I1
e I2 , i due insiemi di indici. I risultati che dimostreremo hanno naturali estensioni al caso generale, che
vengono lasciate per esercizio.
Ci interessa discutere la validit`
a di alcune propriet`a che sono ovvie per somme finite, in particolare:
la sommazione per orizzontali o per verticali:
X
XX  XX 
(4.1)
aij =
aij =
aij .
(i,j)IJ

jJ

iI

iI

jJ

la propriet`
a distributiva:
(4.2)

X
(i,j)IJ

ai bj =

X
iI

ai

 X

bj

jJ

Il teorema che segue `e una diretta conseguenza del Teorema 3.5.


Teorema 4.1. Si consideri una funzione (ai,j )(i,j)IJ . Le seguenti condizioni sono equivalenti:
P
(a)
(i,j)IJ ai,j converge;
P
(b) per
P ogni j fissato, la sommatoria iI |ai,j | converge e, chiamata sj la sua somma, converge anche
jJ sj ;
P
(c) per ogni i fissato, la sommatoria jJ |ai,j | converge e, chiamata s0i la sua somma, converge anche
P
0
iI si .
Se queste condizioni sono verificate, vale luguaglianza (4.1).




Dimostrazione. Basta applicare il Teorema 3.5 alle due partizioni I {j} jJ e {i} J iI . 
A questo punto, si ottiene facilmente il seguente risultato sulla propriet`a distributiva.
P
P
P
Teorema 4.2. Date due sommatorie convergenti, iI ai e jJ bj , la sommatoria (i,j)IJ ai bj `e pure
convergente e vale luguaglianza (4.2)

5. IL CASO I = N: CONFRONTO CON LA NOZIONE DI SOMMA DI UNA SERIE

Dimostrazione. Posto A1 =
Inoltre converge la sommatoria

|ai |, per j fissato, la sommatoria

iI

sj = A1

jJ

iI

45

|ai bj | converge a sj = |bj |A1 .

|bj | .

jJ

La conclusione segue dunque dallimplicazione (b)(a) del Teorema 4.1 e dalla (4.1).

5. Il caso I = N: confronto con la nozione di somma di una serie


Se I = N, occorre dunque distinguere tra la nozione di sommatoria di una successione (an )nN secondo
la Definizione 3.1 e quella di somma della serie,

an = lim

n=0

N
X

an .

n=0

Siccome la famiglia F degli insiemi En = {0, 1, . . . , n} `e cofinale, vale limplicazione


lim

F Pf (N)

s(F ) = s = lim s(F ) = lim s(En ) = s .


n

F F

Mantenendo la distinzione simbolica tra


nN an per la sommatoria secondo la Definizione 3.1, e
P
3
a
per
la
somma
della
serie
,
si
ha
dunque
che
n
n=0
X

an = s =

nN

an = s .

n=0

Limplicazione inversa non vale. Al contrario, si hanno le seguenti caratterizzazioni della convergenza
della sommatoria.
Teorema 5.1. Per una successione (an )nN le seguenti propriet`
a sono equivalenti:
P
(1) La sommatoria nN an converge;
P
(2) la serie n=0 an converge assolutamente.
della sommatoria
P Dimostrazione. Per il Teorema 5.1, la condizione (1) equivale alla convergenza
P
|a
|.
Per
il
Corollario
1.5,
questo
equivale
alla
convergenza
della
serie
|a
|.

n
n
nN
n=0
Questa differenza va tenuta in considerazione quando si prendono in esame serie multiple, ossia con
indici variabili in Nk con k 2.
Prendiamo in esame due tipi di problema, limitandoci sempre al caso k = 2.
Data una successione doppia (amn )(m,n)N2 , la formulazione per serie della seconda uguaglianza
nella formula (4.1) diventa:
X

 X

 X

X
(5.1)
amn =
amn .
m=0

n=0

n=0

m=0

E facile vedere che in generale questa identit`a non vale in generale: se si prende ad esempio

se m = n
1
amn = 1 se m = n + 1

0
altrimenti,
si verifica che il primo membro delluguaglianza d`a 1 e il secondo 0.
3Si faccia attenzione al fatto che questa distinzione terminologica e notazionale tra sommatoria e serie `
e stata introdotta
perch
e funzionale alla presente trattazione, ma non `
e standard.

46

4. SOMMATORIE SU INSIEMI INFINITI

Siccome N2 non ha un ordinamento naturale, non `e univocamente definibile cosa sia una serie
doppia. Si ricorre allora a opportune famiglie cofinali F = {FN : N N} di Pf (N2 ), a ciascuna
delle quali si collega una diversa nozione di somma della serie doppia.
Per esempio, si ha la sommazione per quadrati se si utilizza il limite
X
lim
amn ,
N

m,nN

o la sommazione per cerchi


X

lim

amn ,

m2 +n2 N 2

oppure per triangoli


X

lim

amn ,

m+nN

ecc. Lesempio che segue mostra che diversi metodi di sommazione danno luogo a diverse nozioni
di convergenza.
Esempio.
Si prenda

am,n

n
= 1

se m = 0 , n > 0
se m = n > 0
altrimenti.

Sommando per quadrati, si ha


X

amn = 0 ,

m,nN

qualunque sia N . Sommando invece per triangoli, si ha, per N = 2k pari,


X

2k
X
1
1
> .
n
2

amn =

m+n2k

n=k+1

Tuttavia, i problemi citati sopra non si presentano in situazioni di assoluta convergenza, ossia quando
le serie in questione coincidono con le sommatorie studiate nei paragrafi precedenti. Per esempio, riguardo
allinversione dellordine di sommazione nella (5.1) vale il seguente corollario al Teorema 4.1.
Corollario 5.2. Sia (am,n )(m,n)N2 una funzione definita su N2 . Le seguenti condizioni sono equivalenti:
P
(a)
(m,n)N2 amn converge; P

(b) per ogni m fissato,


Pla serie n=0 |amn | converge e, chiamata sm la somma di questa serie, converge
anche la serie m=0 sm ; P

0
(c) per ogni n fissato,
m=0 |amn | converge e, chiamata sn la somma di questa serie, converge
Pla serie
0
anche la serie n=0 sn .
Se queste condizioni sono verificate, vale luguaglianza
(5.2)

X
(m,n)N2

amn =

X

X
m=0

n=0

 X

 X

amn =
amn .
n=0

m=0

6. PRODOTTO SECONDO CAUCHY DI DUE SUCCESSIONI

47

6. Prodotto secondo Cauchy di due successioni


Definizione 6.1. Date due successioni (an )nN e (bn )nN , si chiama prodotto secondo Cauchy delle due
successioni la successione (cn )nN il cui termine n-esimo `e
X
cn =
aj bk .
j+k=n

Si vede facilmente che, se i termini an e bn sono definitivamente nulli, e dunque si ha a che fare solo con
somme finite, vale luguaglianza
 X  X 
X
cn =
aj
bk .
n

Per discutere la validit`


a di questa uguaglianza in generale, cominciamo dal caso in cui i termini an e bn
sono non negativi.
Proposizione 6.2. Siano (an )nN e (bn )nN due successioni a termini non negativi, e sia (cn )nN il loro
prodotto secondo Cauchy. Allora

X
 X

X
an
bn ,
cn =
(6.1)
n=0

n=0

n=0

con la convenzione che 0 = 0.


Dimostrazione. Si consideri la sommatoria
X

aj bk .

(j,k)N2

Per i Corollari 1.5 e 4.2, essa `e uguale al secondo membro della (3.3). Si consideri ora la famiglia T dei
triangoli
TN = {(j, k) N2 : j + k N } .
Essa soddisfa le condizioni (1) e (2) della Proposizione 1.4, per cui
X
X
aj bk .
aj bk = sup
N N

(j,k)N2

(j,k)TN

Ma
X

aj bk =

N
X

cn ,

n=0

(j,k)Tn

per cui, applicando ancora il Corollario 1.5 si ha


X

aj bk =

cn . 

n=0

(j,k)N2

Per il prodotto secondo Cauchy di successioni a valori di segno qualunque si deduce facilmente il seguente
corollario.
Corollario 6.3. Siano (an )nN e (bn )nN due successioni assolutamente convergenti, e sia (cn )nN il loro
prodotto secondo Cauchy. Allora

X
 X

X
(6.2)
cn =
an
bn .
n=0

n=0

n=0

Osservazione 6.4. Luguaglianza 6.2 non vale in generale in assenza di convergenza assoluta. Si dimostri,
n1
P

con se stessa `e una serie il cui termine


per esempio, che il prodotto alla Cauchy della serie n=1 (1)
n
n-esimo cn non tende a zero, e dunque non converge.

48

4. SOMMATORIE SU INSIEMI INFINITI

Il prodotto secondo Cauchy interviene in vari problemi riguardanti serie di funzioni. Uno di questi
riguarda la convergenza di serie di potenze (che saranno studiate ampiamente pi`
u avanti). Si supponga di
avere due serie

X
X
an xn ,
bn xn ,
n=0

n=0

entrambe dipendenti da una variabile x (i coefficienti an e bn sono numeri reali assegnati). Si supponga di
sapere che entrambe le serie convergono quando a x vengono assegnati valori in un dato insieme E R.
Esse allora definiscono due funzioni definite su E a valori in R,
f (x) =

an xn ,

g(x) =

n=0

bn x n .

n=0

Moltiplicando i termini delle due serie a due a due, risulta naturale raggruppare insieme i prodotti
contenenti la stessa potenza di x. Si ottiene cos` una nuova serie di potenze,
 X

X
a j bk x n ,
n=0

j+k=n

che non `e altro che il prodotto secondo Cauchy delle due serie date. Si vuole sapere se essa converge a
f (x)g(x) quando x E.

7. Convergenza incondizionata di serie


Data una successione (an )nN , si consideri un suo riordinamento,
bn = an ,
dove : N N `e una funzione biiettiva.
E facile verificare che le due sommatorie
X

an ,

nN

an

nN

hanno lo stesso comportamento e, se convergenti, la stessa somma. Infatti, supponiamo che


converga a s. Dato > 0, esiste F0 Pf (N) tale che
X



an s <

nN

an

nF

per ogni F F0 . Allora


X



an s <

nF 0

per ogni F (F0 ). Quindi anche nN an = s. Limplicazione inversa si dimostra allo stesso modo.
Per quanto riguarda invece il confronto tra le due serie

an ,

n=0

an ,

n=0

si deve considerare che le rispettive somme parziali sono difficilmente confrontabili tra loro. Vediamo prima
il caso pi`
u semplice.
P
Teorema 7.1. Se la serie n=0 an `e assolutamente convergente, per ogni riordinamento dei suoi termini
si ha

X
X
an =
an .
n=0

n=0

7. CONVERGENZA INCONDIZIONATA DI SERIE

Dimostrazione.
Per il Teorema 5.1 converge la sommatoria
P
uguale a nN |an |. Quindi, per gli stessi motivi, si ha

an =

n=0

an =

nN

an =

nN

an .

49

|an |, che, per quanto detto sopra, `e

n=0

nN

Se invece una serie converge, ma non assolutamente, si ha una situazione molto diversa.
P
Teorema 7.2. Sia n=0 an una serie convergente, ma non assolutamente. Allora, per ogni R {},
esiste un riordinamento tale che

X
an = .
n=0

Dimostrazione. Ponendo
|an | + an
|an | an
a+
,
a
,
n = max{an , 0} =
n = max{an , 0} =
2
2
P
P
le serie a termini non negativi n=0 a+
n e
n=0 an divergono entrambe. Questo implica, in particolare, che
gli insiemi
E + = {n N : an 0} ,
E = {n N : an < 0} ,
sono entrambi infiniti. Inoltre E + , E formano una partizione di N.
Siano (np )pN una numerazione crescente4 degli elementi di E + e (n0q )qN una numerazione crescente
degli elementi di E .
Allora anp 0 per ogni p, an0q < 0 per ogni q, e inoltre
(7.1)

X
p=0

anp =

X
nE +

an =

a+
n = + ,

an0q =

q=0

n=0

an =

nE

a
n = .

n=0

Introduciamo le seguenti notazioni per a < b N:


[a, b) = {a, a + 1, . . . , b 1};
P
s+
p[a,b) anp ;
a,b =
P

sa,b = q[a,b) an0q .


Fissiamo ora R, 0.
Lidea della costruzione del riordinamento `e questa: si cominciano a prendere, nellordine, i primi an
positivi, fino a giungere a una somma maggiore di . A questo punto, si riparte dallinizio e si aggiungono ai
termini precedenti i primi an negativi, fermandosi quando la somma ottenuta diventa minore di . Quindi
si riprende ad aggiungere, in sequenza, termini positivi non ancora utilizzati, finche non si torna ad avere
una somma maggiore di , ecc.
Vediamo ora di seguire questa idea con espressioni precise e con le dimostrazioni necessarie.
Per la (7.1), esistono sicuramente interi p per cui
s+
0,p > .
Sia p1 il minimo p per cui questa disuguaglianza `e verificata, e poniamo
1 = s+
0,p1 .
Analogamente, esiste un minimo intero q1 per cui
+
s
0,q1 < s0,p1 ,

ossia

s+
0,p1 + s0,q1 < .
4Con questo intendiamo che la funzione p 7 n `
+
p e strettamente crescente e suriettiva da N a E .

50

4. SOMMATORIE SU INSIEMI INFINITI

Poniamo allora

1 = s+
0,p1 + s0,q1 .

Induttivamente, possiamo costruire una successione di coppie (pj , qj ), definite come segue:
pj+1 `e il minimo intero maggiore di pj per cui

+
j+1 = s+
0,p1 + s0,q1 + sp1 ,p2 + sq1 ,q2 + + spj1 ,pj + sqj1 ,qj + spj ,pj+1 > ;

(7.2)

qj+1 `e il minimo intero maggiore di qj per cui


(7.3)

j+1 = s+
0,p1 + s0,q1 + sp1 ,p2 + sq1 ,q2 + + spj ,pj+1 + sqj ,qj+1 < .

Per uniformit`
a di notazione, poniamo p0 = q0 = 0.
Costruiamo ora una funzione biiettiva : N N come segue:

[0, p1 ) {n0 , . . . , np1 1 }

0
0

[p1 , p1 + q1 ) {n0 , . . . , nq1 1 }

. . .
:
[pj1 + qj1 , pj + qj1 ) {npj1 , . . . , npj 1 }

[pj + qj1 , pj + qj ) {n0qj1 , . . . , n0qj 1 }

...

k 7 nk
k 7 n0kp1
...
k 7 nkqj1
k 7 n0kpj
...

Si noti che la successione (0, p1 , p1 + q1 , p2 + q1 , p2 + q2 , . . . ) `e strettamente crescente, e dunque gli


intervalli
[0, p1 ) , [p1 , p1 + q1 ) , [p1 + q1 , p2 + q1 ) , [p2 + q1 , p2 + q2 ) , ecc.
sono adiacenti e ricoprono N. Quindi
P `e biiettiva.
Consideriamo dunque la serie n=0 an . Chiamando Sn le sue somme parziali, si ha, per ogni j,
Spj +qj1 1 = j ,

Spj +qj 1 = j .

Dimostriamo ora che


lim j = lim j = .

Siccome la serie degli an converge, si ha limn an = 0. Dato > 0, sia n0 tale che |an | < per ogni
n n0 . Esiste dunque j0 tale che, per ogni j j0 , si abbia pj > n0 . Quindi apj < se j j0 .
Per la definizione di pj come minimo intero maggiore di pj1 per cui vale la (7.2), deve essere

+
+
s+
0,p1 + s0,q1 + + spj1 ,pj + spj1 ,pj 1 .

Ma allora

+
+
< j = s+
0,p1 + s0,q1 + + spj1 ,pj + spj1 ,pj 1 + apj < + .

In modo analogo si dimostra che il limite dei j `e .


Dato > 0, esiste dunque j00 tale che, per ogni j j00 ,
Spj +qj1 1 , Spj +qj 1 ( , + ) .
Ma allora lo stesso vale per tutte le somme parziali Sn con n pj00 + qj00 1 1.
Infatti, al variare di n in un intervallo [pj + qj 1, pj+1 + qj 1), le somme Sn crescono con n perche
an 0, quindi sono comprese tra le due estreme, Spj +qj 1 = j e Spj+1 +qj 1 = j+1 .
Analogamente, al variare di n in un intervallo [pj + qj1 1, pj + qj 1), le somme Sn decrescono con
n perche an < 0, quindi sono comprese tra le due estreme, j e j .
Questo dimostra che
lim Sn = .
n

Si lascia per esercizio ladattamento di questo procedimento ai casi < 0 finito e = .

Si dice che una serie converge incondizionatamente se, per ogni suo riordinamento, essa rimane convergente. Dai Teoremi 7.1 e 7.2 si ottiene il seguente enunciato.

7. CONVERGENZA INCONDIZIONATA DI SERIE

51

Corollario 7.3. Una serie converge incondizionatamente se e solo se converge assolutamente. In questo
caso, il valore della somma `e indipendente dal riordinamento.
Esercizio. Si dimostri che, nelle ipotesi del Teorema 7.2, esistono riordinamenti che danno luogo a una serie
indeterminata.

CAPITOLO 5

Rn , TOPOLOGIE, METRICHE E FUNZIONI CONTINUE


Da questo punto diamo per noti
la struttura di Rn come spazio vettoriale,
la teoria di limiti di funzioni a valori reali in una variabile reale,
la teoria delle funzioni continue a valori reali in una variabile reale, e in particolare:
la caratterizzazione della continuit`a in un punto tramite successioni,
il teorema della permanenza del segno,
il Teorema dei valori intermedi,
le reazioni tra monotonia e invertibilit`a per funzioni continue su un intervallo,
il Teorema di Weierstrass,
la nozione di continuit`
a uniforme e il Teorema di Heine-Cantor.

1. Struttura euclidea in Rn : prodotto scalare, modulo e distanza


Siano
x = (x1 , x2 , . . . , xn ) ,

y = (y1 , y2 , . . . , yn )

due elementi, o punti, di Rn .


Definizione 1.1. Si chiama prodotto scalare tra x e y il numero reale
x y = x1 y1 + x2 y2 + + xn yn .
Si chiama modulo di x il numero non negativo
q

|x| = x x = x21 + x22 + + x2n .


Le propriet`
a fondamentali del prodotto scalare sono le seguenti:
per ogni x, y Rn , x y = y x;
per ogni x Rn , x x 0 ed `e uguale a 0 se e solo se x = 0;
per ogni x, x0 , y Rn e R, (x + x0 ) y = x y + x0 y.
La terza propriet`
a `e la linearit`
a nella prima componente. Per la prima propriet`a (simmetria), si ha anche
linearit`
a nella seconda componente.
Una conseguenza importante e non ovvia di queste propriet`a `e la seguente disuguaglianza.
Teorema 1.2 (Disuguaglianza di Cauchy-Schwarz). Per ogni x, y Rn ,
|x y| |x| |y| ,
e vale luguaglianza se e solo se x e y sono linearmente dipendenti.
Si noti che a primo membro compare il modulo (valore assoluto) di un numero reale, mentre i moduli a
secondo membro sono moduli di vettori.
53

54

5. Rn , TOPOLOGIE, METRICHE E FUNZIONI CONTINUE

Dimostrazione. Se almeno uno tra x e y `e il vettore nullo, si ha luguaglianza 0 = 0, in coerenza con


quanto enunciato. Supponiamo allora che x e y siano entrambi diversi da 0.
Si consideri, al variare di in R il prodotto scalare
p() = (x + y) (x + y)

= x (x + y) + y (x + y)

= (x + y) x + (x + y) y
= |x|2 + 2x y + 2 |y|2 .
Si osservi che p() `e un polinomio di secondo grado in , sempre positivo su R. Quindi il suo discriminante,

= 4 (x y)2 |x|2 |y|2 ,
deve essere minore o uguale a 0, ci`e
(x y)2 |x|2 |y|2 .
Estraendo le radici quadrate positive di ambo i membri, si ottiene la disuguaglianza di Cauchy-Scxhwarz.
Si noti poi che vale luguaglianza se e solo se = 0, e dunque se e solo se esiste 0 R per cui p(0 ) = 0.
Ma questo equivale a dire che x + 0 y = 0, e dunque che x e y sono linearmente dipendenti.

Corollario 1.3. Il modulo in Rn soddisfa la disuguaglianza triangolare
|x + y| |x| + |y| ,
e si ha uguaglianza se e solo se esiste 0 per cui x = y oppure y = x.
Dimostrazione. Per la disuguaglianza di Cauchy-Schwarz si ha
|x + y|2 = (x + y) (x + y)
= |x|2 + 2x y + |y|2
|x|2 + 2|x y| + |y|2
|x|2 + 2|x| |y| + |y|2
2
= |x| + |y| .
Questo dimostra la disuguaglianza. Per avere uguaglianza, devono valere le due condizioni
xy 0 ,

|x y| = |x| |y| .

Per il Teorema 1.2, x e y devono essere linearmente dipendenti, e inoltre la costante di proporzionalit`
a
tra le loro componenti deve essere non negativa.

Siano x, y elementi non nulli di Rn . Essendo
1

xy
1,
|x||y|

esiste uno e un solo [0, ] tale che


x y = |x||y| cos .
Si dice che `e langolo compreso tra x e y.
Definizione 1.4. Due elementi x, y di Rn si dicono ortogonali se x y = 0.
A questo punto elenchiamo le propriet`a fondamentali del modulo:
per ogni x Rn , |x| 0, e |x| = 0 se e solo se x = 0;
per ogni x Rn e R, |x| = |||x|;
per ogni x, y Rn , |x + y| |x| + |y|.

2. TOPOLOGIA DI Rn

55

Definizione 1.5. Si chiama distanza euclidea su Rn la funzione


d : Rn Rn [0, +)
data da
d(x, y) = |x y| .
Dalle propriet`
a del modulo si deducono le seguenti propriet`a della distanza:
per ogni x, y Rn , d(x, y) = 0 se e solo se x = y;
per ogni x, y Rn , d(y, x) = d(x, y);
per ogni x, y Rn e R, d(x, y) = ||d(x, y);
per ogni x, y, z Rn , d(x, z) d(x, y) + d(y, z) (disuguaglianza triangolare).
Dalla propriet`
a triangolare si deduce facilmente che


d(x, z) d(y, z) d(x, y) .
(1.1)
x, y, z Rn ,
Dati tre punti x, y, z nel piano R2 , le tre distanze d(x, y), d(x, z), d(y, z) rappresentano le lunghezze
dei lati del triangolo (possibilmente degenere) di vertici x, y, z. La disuguaglianza triangolare dice che la
lunghezza di un lato `e minore o uguale della somma delle altre due, mentre la (1.1) dice che la lunghezza di
un lato `e maggiore o uguale della differenza delle altre due. Questa propriet`a si estende dunque a triangoli
in spazi di dimensione superiore.
2. Topologia di Rn
In questo paragrafo e nei due seguenti elenchiamo le nozioni principali relative alla topologia di Rn ,
presentando le principali relazioni tra di esse. Nel successivo paragrafo 6 daremo alcune nozioni su generici
spazi topologici.
Si chiama palla di centro x0 e raggio r > 0 in Rn linsieme
Bx0 ,r = {x Rn : d(x, x0 ) < r} .

(2.1)

2.1. Insiemi aperti e chiusi.


Definizione 2.1. Un sottoinsieme A di Rn si dice aperto se `e unione (possibilmente vuota) di palle, o, in
modo equivalente, se
x0 A , r > 0 : Bx0 ,r A .
Dalla definizione segue che linsieme vuoto `e aperto.
Non tutti i sottoinsiemi di Rn sono aperti. Per esempio, un insieme costituito da un unico punto x0 non
pu`
o contenere nessuna palla di centro x0 . Per esercizio, si dimostri che {x : |x| 1} non `e aperto.
Vediamo invece unimportante famiglia di insiemi aperti.
Lemma 2.2. Lintersezione di un numero finito di palle `e un aperto.
Dimostrazione. Siano Bj = Bxj ,rj , j = 1, . . . , k, le palle date e sia A la loro intersezione. Se A = ,
non c`e niente da dimostrare.
Dato x A, poniamo
j = rj d(x, xj ) > 0 ,
e quindi prendiamo r con 0 < r < min1jk j . Dimostriamo allora che Bx,r A.
Se y Bx,r si ha, per ogni j,
d(y, xj ) d(y, x) + d(x, xj ) < r + rj j rj .
Quindi y Bxj ,rj per ogni j, e dunque in A.

5. Rn , TOPOLOGIE, METRICHE E FUNZIONI CONTINUE

56

Da questo segue facilmente, usando la propriet`a distributiva dellunione rispetto allintersezione, il punto
(iii) del seguente enunciato. Gli altri punti sono ovvi.
Proposizione 2.3. La famiglia degli insieme aperti di Rn gode delle seguenti propriet`
a:
n
(i) e R sono aperti;
(ii) una qualunque unione di aperti `e aperta;
(iii) le intersezioni finite di aperti sono aperte.
Definizione 2.4. Un sottoinsieme di Rn si dice chiuso se il suo complementare `e aperto.
Usando le formule di de Morgan, si dimostra facilmente il seguente enunciato.
Proposizione 2.5. La famiglia degli insieme chiusi di Rn gode delle seguenti propriet`
a:
(i) e Rn sono chiusi;
(ii) una qualunque intersezione di chiusi `e chiusa;
(iii) le unioni finite di chiusi sono chiuse.
Si noti che e Rn sono sia aperti che chiusi, mentre esistono insiemi che non sono ne aperti ne chiusi:
per esempio, in R, gli intervalli semiaperti [a, b), con a < b.
Esempio. Si dimostri per esercizio che gli insiemi
B x0 ,r = {x Rn : d(x, x0 ) r}
sono chiusi. Un tale insieme si chiama palla chiusa di centro x0 e raggio r, mentre le palle Bx0 ,r nella (2.1)
si chiamano anche palle aperte.
2.2. Intorni di un punto, parte interna di un insieme.
Definizione 2.6. Sia x0 Rn . Si dice che un sottoinsieme U di Rn `e un intorno di x0 (o che x0 `e interno
a U ) se esiste r > 0 tale che Bx0 ,r U .
Lemma 2.7. Lintersezione di un numero finito di intorno di x0 `e ancora un intorno di x0 .
Dimostrazione. Se U1 , . . . , Uk sono intorno di x0 , siano r1 , . . . rk > 0 tali che Bx0 ,rj Uj per j =
1, . . . , k. Allora, se r = minj rj , Bx0 ,r U1 Uk .

Proposizione 2.8. Dato un qualunque sottoinsieme E di Rn , si consideri linsieme

E = {x E : E `e un intorno di x} .
Allora

(i) E `e aperto, ed `e il pi`


u grande insieme aperto contenuto in E;

(ii) un insieme E `e aperto se e solo se E = E.

Linsieme E si chiama parte interna di E.

Dimostrazione. Se x0 E, esiste una palla Bx0 ,r E. Dato allora un punto x Bx0 ,r , si ponga
= r d(x, x0 ). Allora > 0 e, per la disuguaglianza triangolare,
Bx, Bx0 ,r .

Quindi E `e un intorno di x, e pertanto x E. Dunque E `e aperto.


Sia ora A aperto, A E. Dato x A, esiste una palla Bx,r A. Dunque E `e un intorno di x, e

pertanto x E. Questo dimostra che A E, e dunque il punto (i).


Il punto (ii) `e ora evidente.

2. TOPOLOGIA DI Rn

57

2.3. Punti aderenti e chiusura di un insieme.


Definizione 2.9. Si dice che un punto x0 Rn `e aderente allinsieme E se
r > 0 ,

E Bx0 ,r 6= .

Ovviamente gli elementi di E sono tutti aderenti a E, ma potrebbero essercene altri. Per esempio, un
qualunque punto della palla chiusa B x0 ,r `e aderente alla palla aperta con lo stesso centro e stesso raggio.
Proposizione 2.10. Dato E Rn , si consideri linsieme E dei suoi punti aderenti. Allora
(i) il complementare di E `e la parte interna del complementare di E.
(ii) E `e chiuso, ed `e il pi`
u piccolo insieme chiuso contenente E;
(iii) un insieme E `e chiuso se e solo se E = E;
Dimostrazione. Dire che x 6 E equivale a dire che esiste r > 0 tale che E Bx,r = , e dunque che
Bx,r c E. Ma questo a sua volta equivale a dire che x `e interno a c E.
Questo dimostra (i), e ora (ii) e (iii) seguono direttamente dall Proposizione 2.8.


Linsieme E si chiama la chiusura di E. Linsieme F (E) = E \ E si chiama la frontiera di E.

2.4. Punti di accumulazione e derivato di un insieme.


Definizione 2.11. Un punto x0 Rn `e di accumulazione per linsieme E se

r > 0 , E Bx0 ,r \ {x0 } 6= .
Linsieme dei punti di accumulazione per E si chiama insieme derivato di E e si indica con D(E).
Chiaramente
un punto di accumulazione per E `e aderente a E;
un punto aderente a E che non sia in E `e di accumulazione per E;
i punti di E possono essere o di accumulazione per E, oppure punti isolati, secondo la definizione
seguente.
Definizione 2.12. Un punto x0 di E si dice isolato in E se


Esempio. Sia E = n1
accumulazione, 0
6 E.

r > 0 : E Bx0 ,r = {x0 } .



: n N \ {0} . Tutti i punti di E sono isolati in E, ed E ha un unico punto di

Proposizione 2.13. Linsieme derivato di un insieme E `e chiuso.


Dimostrazione. Dimostriamo che Rn \ D(E) `e aperto. Se x0 6 D(E), o non appartiene alla chiusura
di E, oppure `e un punto isolato di E. In entrambi i casi, esiste una palla Bx0 ,r che non contiene punti di E
diversi da x0 . Quindi nessun punto di Bx0 ,r pu`o essere di accumulazione per E.


5. Rn , TOPOLOGIE, METRICHE E FUNZIONI CONTINUE

58

3. Successioni a valori in Rn
Sia a : N Rn una successione di punti di Rn , che indicheremo con labituale simbolo (ak )kN .
Definizione 3.1. Si dice che ` Rn `e limite della successione (ak )kN se, per ogni > 0, esiste k0 N tale
che, per ogni k k0 , |ak `| < .
In modo equivalente possiamo dire che:
` `e limite della successione se, per ogni > 0, i punti ak sono definitivamente contenuti nella palla B`, .
Si noti anche lequivalenza
(3.1)

lim ak = ` lim |ak `| = lim d(ak , `) = 0 ,

dove il limite a secondo membro riguarda una successione di numeri reali.


Vediamo ora due propriet`
a importanti dei limiti in Rn .
Proposizione 3.2. Se limk ak = `, allora limk |ak | = |`|.
Dimostrazione. Per la disuguaglianza (1.1) si ha



0 |ak | |`| = d(ak , 0) d(`, 0) d(ak , `) .

Per la (3.1), limk |ak | |`| = 0, da cui la tesi.

Proposizione 3.3. Posto ak = (a1k , a2k , . . . ank ) e ` = (`1 , `2 , . . . `n ), si ha lequivalenza


lim ak = `

j = 1, . . . , n ,

lim ajk = `j .

Dimostrazione. Se limk ak = `, dato > 0, esiste k0 N tale che, per ogni k k0 , |ak `| < .
Allora, se k k0 ,
q
|ajk `j |

(a1k `1 )2 + + (ank `n )2 = |ak `| < .

Quindi limk ajk = `j .


Viceversa, supponiamo che sia limk ajk = `j per ogni j. dato > 0, esiste k0 tale che, per ogni k k0
e ogni j = 1, . . . , n, |ajk `j | < . Ma allora, per ogni k k0 ,
q

|ak `| = (a1k `1 )2 + + (ank `n )2 < n .


Per larbitrariet`
a di si ha la tesi.

La Proposizione 3.3 consente di ridurre lo studio di una successione di punti di Rn allo studio di n
seccessioni numeriche. Questo ha una serie di conseguenze, la cui dimostrazione `e lasciata per esercizio:
il teorema di unicit`
a del limite;
il teorema di limitatezza di una successione convergente;
convergenza di sottosuccessioni di successioni convergenti.
Adattando le definizioni di successione limitata e di successione di Cauchy (v. pi`
u avanti), si estendono
anche
il teorema di Bolzano-Weierstrass;
il criterio di convergenza di Cauchy.
Le dimostrazioni sono lasciate per esercizio.
Definizione 3.4. Una successione (ak )kN a valori in Rn si dice
(i) limitata se linsieme dei |ak | `e superiormente limitato in R (ossia se tutti i punti ak sono contenuti
in una stessa palla);
(ii) di Cauchy se per ogni > 0 esiste k0 N tale che, per ogni h, k k0 , |ah ak | < .

` TOPOLOGICHE DI SOTTOINSIEMI DI Rn
4. SUCCESSIONI E PROPRIETA

59

Esercizio. Si dimostri che


(1) se due successioni (ak )kN , (bk )kN a valori in Rn sono convergenti, rispettivamente a ` e `0 , allora
lim (ak + bk ) = ` + `0 ;

(2) se due successioni (ak )kN a valori in Rn e (k )kN a valori in R sono convergenti, rispettivamente
a ` e , allora
lim k ak = ` ;
k

(3) se due successioni (ak )kN , (bk )kN a valori in C sono convergenti1, rispettivamente a ` e `0 , allora
lim ak bk = ``0 ;

(4) vale il teorema di convergenza assoluta per serie di elementi di Rn :

X
X
|ak | converge =
ak converge ,
k=0

k=0

P
P
e in questo caso k=0 ak k=0 |ak |.
Osservazione 3.5. In dimensione n 2 il limite infinito si intende come segue:
lim ak = lim |ak | = + .

I simboli non hanno senso in Rn .


4. Successioni e propriet`
a topologiche di sottoinsiemi di Rn
Le successioni sono uno strumento utile per analizzare la topologia dei sottoinsiemi di Rn . Ne sono un
esempio importante i seguenti enunciati.
Teorema 4.1.
(i) Un punto x0 Rn `e aderente a un insieme E se e solo se esiste una successione (ak )kN tale che
ak E per ogni k e limk ak = x0 .
(ii) Un punto x0 Rn `e di accumulazione per un insieme E se e solo se esiste una successione (ak )kN
tale che ak E \ {x0 } per ogni k e limk ak = x0 .
(iii) Un insieme E `e chiuso se e solo se, per ogni successione (ak )kN di elementi di E convergente a
un limite `, anche ` E.
Dimostrazione. Dimostriamo solo lenunciato (i), le altre dimostrazioni essendo analoghe o facilmente
deducibili da questa.
1
Se x0 E, per ogni k 1, esiste un punto ak Bx0 , k1 E. Essendo |ak x0 | < , la successione degli
k
ak converge a x0 .
Viceversa, se x0 = limk ak , con ak E per ogni k, dato r > 0, gli ak sono definitivamente in Bx0 ,r .
Quindi E Bx0 ,r non `e vuoto, e dunque x0 `e aderente a E.

In termini di successioni si d`
a anche la nozione di sottoinsieme compatto di Rn . Premettiamo che un
n
insieme E R si dice limitato se `e contenuto in una palla.
Definizione 4.2. Un sottoinsieme E di Rn si dice compatto se, data comunque una successione (ak )kN di
elementi di E, esiste una sua sottosuccessione (akp )pN convergente a un elemento di E.
Come nel caso n = 1, si ha la seguente caratterizzazione dei sottoinsiemi compatti di Rn .
1Le successioni di numeri complessi vengono considerate come a valori in R2 , con componenti (<e a , =m a ).
k
k

60

5. Rn , TOPOLOGIE, METRICHE E FUNZIONI CONTINUE

Teorema 4.3. Un sottoinsieme di Rn `e compatto se e solo se `e chiuso e limitato.


Dimostrazione. Sia E compatto. Se E non fosse limitato, esisterebbe una successione (ak )kN di punti
di E con limk |ak | = +. Daltra parte, esisterebbe anche una sottosuccessione (akp )pN convergente a
` E. Ma questo `e assurdo per la Proposizione 3.2.
Sia ora x0 E. Per il Teorema 4.1, esiste una successione (ak )kN di punti di E convergente a x0 . Allora
esiste una sottosuccessione (akp )pN convergente a un elemento di E, ma questo deve essere x0 . Dunque
x0 E ed E `e chiuso.
Viceversa, sia E chiuso e limitato, e sia (ak )kN una successione di punti di E. Consideriamo la successione (a1k )kN delle prime componenti degli ak . Siccome E `e limitato, la successione (a1k )kN `e pure limitata.
Per il Teorema di Bolzano-Weierstrass, esiste una sottosuccessione (a1kp )pN convergente a un limite `1 .
Da questa sottosuccessione intendiamo estrarre una sotto-sottosuccessione di cui convergano le prime
due componenti, e cos` iterativamente per le altre componenti.
Per induzione, supponiamo, per un dato j {1, . . . , n 1}, di aver trovato una sottosuccessione (akpj )pN
tale che, prendendone le componenti i-esime, si abbia
lim ai j
p kp

= `i ,

i = 1, . . . , j .

Posto bp = akpj , consideriamo la successione delle componenti (j + 1)-esime bj+1


p . Questa successione
`e limitata, quindi il Teorema di Bolzano-Weierstrass ci assicura lesistenza di una sottosuccessione (bps )sN
di punti di E, le cui componenti (j + 1)-esime hanno limite finito `j+1 . Daltronde, anche le componenti
precedenti, bips con 1 i j, convergono a `i .
Ponendo quindi ksj+1 = kpj s , abbiamo dunque ottenuto una sottosuccessione (aksj+1 )sN tale che
lim ai j+1
s ks

= `i ,

i = 1, . . . , j + 1 .

Dopo n passi, la sottosuccessione risultante, (akpn )pN , converge a ` per la Proposizione 3.3. Siccome E
`e chiuso, ` E.


5. Punti limite di una successione


Definizione 5.1. Sia (ak )kN una successione a valori in Rn . Si dice che x Rn `e un punto limite della
successione se esiste una sottosuccessione (akp )pN convergente a x.
Le seguenti propriet`
a sono evidenti o di facile verifica:
una successione non ha punti limite se e solo se limk |ak | = +;
una successione ha un unico punto limite x se e solo se limk ak = x;
una successione limitata ammette sempre punti limite (Teorema di Bolzano-Weierstrass).
Proposizione 5.2. Data una successione (ak )kN , sia Ek = {ak0 : k 0 k}. Allora linsieme dei punti limite
della successione `e
\
Ek .
E=
kN

In particolare, E `e chiuso.
Si noti che Ek+1 Ek per ogni k e la stessa relazione vale per le chiusure.
Dimostrazione. Sia x un punto limite, x = limp akp . Per ogni k N, esiste p tale che, per p p,
kp k. Dunque x `e limite di una successione di elementi di Ek , da cui segue che x E k .
Viceversa, se x E, per ogni k N e ogni p N \ {0}, Ek Bx, p1 6= . Si scelga allora induttivamente
k1 tale che Bx,1 ,

1
kp+1 > kp tale che akp+1 Bx, p+1
.

La sottosuccessione (akp )p1 converge allora a x.

6. SPAZI TOPOLOGICI

61

Dimostriamo ora linsieme E della Proposizione 5.2 pu`o essere un qualunque chiuso di Rn .
Teorema 5.3. Sia E un sottoinsieme chiuso di Rn . Esiste allora una successione (ak )kN di elementi di E
avente E come insieme dei suoi punti limite.
Dimostrazione. Supponiamo inizialmente che E sia anche limitato. Esiste allora un ipercubo
h R R in n
o
R
Q= ,
= (x1 , . . . , xn ) : |xj | , j = 1, . . . , n ,
2 2
2
contenente E. Per ogni p N, suddividiamo [R, R] in 2p sottointervalli adiacenti2 di lunghezza 2p R.
Allora Q `e lunione di 2np cubi, e tra questi selezionamo quelli che hanno intersezione non vuota con E.
Numeriamo poi tutti i cubi cos` selezionati, partendo da quelli selezionati per p = 0, successivamente
quelli selezionati per p = 1, ecc. Si ottengono dunque una successione di cubi (Qk )kN e una successione
crescente di interi p tali che
per p k < p+1 , Qk ha lati di lunghezza 2p ;
per ogni x E e ogni p, esiste k con p k < p+1 tale che x Qk .
Si prenda allora, per ogni k, ak E Qk . Dato x E, per ogni p sia kp tale che p kp < p+1 e
x Qkp . Allora

|x akp | diam(Qk ) = 2p nR ,
dove per diam(Qk ) si intende la massima distanza tra coppie di elementi di Qk .
Quindi x = limp akp . Daltra parte, essendo E chiuso, ogni punto limite della successione (ak )kN `e
in E.
Supponiamo ora che E sia illimitato. Per p N, si ponga E(p) = E [2p , 2p ]n e si ripeta la costruzione
precedente suddividendo il cubo [2p , 2p ]n in 22np sottocubi di lato 2p . La dimostrazione per il caso E
limitato si ripete con piccole modifiche.


6. Spazi topologici
6.1. Definizioni.
La topologia fornisce una definizione assiomatica di sottoinsiemi aperti di un insieme qualsiasi. A
partire da questa, si giunge a nozioni di convergenza di successioni di elementi dellinsieme e di continuit`
a
di funzioni tra insiemi dotati di topologie.
Bisogna tener presente che la nozione generale di spazio topologico `e molto ampia e comprende topologia
con propriet`
a molto diverse da quella euclidea su Rn descritta nei paragrafi precedenti.
Questo paragrafo contiene solo una presentazione di base di alcune nozioni di topologia, finalizzate a
inquadrare in un contesto generale quanto verr`a analizzato pi`
u approfonditamente in alcuni casi particolari.
Definizione 6.1. Si chiama topologia su un insieme X una famiglia P(X) di sottoinsiemi di X, detti
aperti, che soddisfi le seguenti propriet`
a:
(i) , X ;
S
(ii) Se {Ai }iI , allora iI Ai ;
(iii) Se A1 , . . . , An , allora A1 An .
Si chiama spazio topologico una coppia (X, ), dove `e una topologia su X.
Esempi.
1. Oltre alla topologia euclidea su Rn , indichiamo le seguenti topologie:
(1) la topologia discreta = P(X) su un qualunque insieme X;
(2) la topologia indiscreta = {, X} su un qualunque insieme X;
2Non importano eventuali sovrapposizioni agli estremi. I sottointervalli si possono anche prendere chiusi.

5. Rn , TOPOLOGIE, METRICHE E FUNZIONI CONTINUE

62





(3) su R, le famiglie + = (a, +) : a R {, R} e = (, a) : a R {, R} sono topologie.
2. (Topologia prodotto) Siano (X, ) e (Y, ) due spazi topologici. Si consideri la famiglia
n[
o
=
Ai B i : Ai , B i ,
iI

di sottoinsiemi di X Y . Questa `e una topologia, detta topologia prodotto di e e a volte indicata come
. Per verificarlo, lunica propriet`
a non ovvia `e la propriet`a (iii) riguardante le intersezioni finite. Per
induzione basta ovviamente dimostrare che lintersezione di due elementi di `e ancora in . Questo segue
dalle identit`
a
[
  [

[

Ai B i
Ai 0 B i 0 =
(Ai Bi ) (Ai0 Bi0 )
iI

i0 I 0

iI , i0 I 0

(Ai Ai0 ) (Bi Bi0 ) .

iI , i0 I 0

Vediamo una prima propriet`


a importante che non vale per tutte le topologie.
Definizione 6.2. Si dice che una topologia su un insieme X `e di Haudsorff, o anche separata o T2 , se
per ogni coppia di punti x, y X con x 6= y esistono due aperti disgiunti A1 , A2 con x A1 e y A2 .
Si vede facilmente che la topologia euclidea su Rn e la topologia discreta sono T2 , mentre non lo sono le
topologie + e dellesempio (3), ne la topologia indiscreta, se X ha almeno due elementi.
Definizione 6.3. Sia (X, ) uno spazio topologico, e sia Y X. Si chiama topologia indotta da su Y la
famiglia di insiemi
|Y = {A Y : A } .
Si vede facilmente che |Y `e una topologia su Y e che, se `e T2 , anche |Y `e T2 .
Definizione 6.4. Si chiama base di una topologia una sottofamiglia B con la propriet`
a che ogni
elemento di `e unione di elementi di B.
n
n
Nella topologia euclidea su R
= {Bx,r : x
R , r > 0} `e una base. Ci sono basi ancora
 , linsieme B
3 0
n
pi`
u ristrette, per esempio B = Bx, k1 : x Q , k N \ {0} .

Definizione 6.5. Sia (X, ) uno spazio topologico e sia x0 X.


(i) Si chiama intorno di x0 un qualunque soprainsieme di un aperto contenente x0 .
(ii) Si chiama sistema fondamentale di intorni di x0 una famiglia {Ui }iI di intorni di x0 con la
propriet`
a che ogni intorno di x0 contenga almeno uno degli Ui .
Se B `e una base di , la famiglia {A : x0 A} `e un sistema fondamentale di intorni di x0 .
Nella topologia euclidea di Rn , le palle Bx0 ,r (o anche solo le palle Bx0 , k1 con k intero positivo) formano
un sistema fondamentale di intorni di x0 .
Elenchiamo brevemente come si formulano in spazi topologici generali le altre nozioni introdotte per Rn ;
un insieme si dice chiuso se il suo complementare `e aperto;
un punto x0 X si dice aderente a E se ogni intorno di x0 ha intersezione non vuota con E;
un punto x0 X si dice di accumulazione per E se ogni intorno di x0 ha intersezione non vuota
con E \ {x0 };
un punto x0 E si dice isolato in E se esiste un intorno U di x0 tale che E U = {x0 };
un sottoinsieme E di X si dice denso in X se E = X.
Le nozioni di parte interna, chiusura, frontiera, derivato di un insieme E si danno come in Rn e si
estendono al caso generale le seguenti propriet`a:
la parte interna di E `e il pi`
u grande aperto contenuto in E;
3Lo si verifichi per esercizio.

6. SPAZI TOPOLOGICI

63

la chiusura di E `e il pi`
u piccolo chiuso contenente E;
c
(E) = (c E) ;
E `e lunione disgiunta di D(E) con linsieme dei punti isolati di E.
E = E F (E) = E D(E);

X `e lunione disiunta di E, F (E), c E.


6.2. Limiti di successioni a valori in spazi topologici.
Sia (X, ) uno spazio topologico e sia a : N X una successione di elementi di X.
Definizione 6.6. Si dice che ` X `e limite della successione (an )nN se, per ogni intorno U di `, esiste
n0 N tale che, per ogni n n0 , an U .
E utile osservare che, per verificare la condizione indicata, `e sufficiente limitarsi a considerare intorni
U in un sistema fondamentale. E dunque evidente che questa definizione comprende in se quella data per
successioni a valori in Rn .
Proposizione 6.7. Se (X, ) `e uno spazio di Hausdorff, il limite di una successione a valori in X, se esiste,
`e unico.
La dimostrazione `e lasciata per esercizio. Si noti cosa pu`o succedere con topologie che non sono T2 : nella
topologia + dellesempio (3), ogni numero ` 0 `e limite della successione costante an = 0.
Il Teorema 4.1 mostra, per la topologia euclidea, come le successioni possono essere impiegate per
caratterizzare la propriet`
a di un punto di essere aderente o di accumulazione per un insieme, oppure la
propriet`
a di un insieme di essere chiuso.
In spazi topologici generali, queste equivalenze non valgono pi`
u. Dei punti (i) e (ii) del Teorema 4.1 si
mantiene solo la parte se, e del punto (iii) solo la parte solo se. Il problema `e che, nella dimostrazione
su Rn , `e stata usata una propriet`
a che non vale in generale: lesistenza, per ogni punto di Rn , di un sistema
fondamentale di intorni numerabile.
Definizione 6.8. Si dice che uno spazio topologico (X, ) soddisfa il primo assioma di numerabilit`a se ogni
elemento di X ha un sistema fondamentale di intorni numerabile.
Proposizione 6.9. Sia (X, ) uno spazio topologico che soddisfi il primo assioma di numerabilit`
a. Allora
lenunciato del Teorema 4.1 vale per (X, ).
Dimostrazione. Sia {Uk }kN una numerazione degli elementi di un sistema fondamentale di intorni di
un punto x X. Poniamo
Vk = U0 U1 Uk .
Allora anche i Vk formano un sistema fondamentale di intorni di x e in pi`
u V0 V1 Vk .
Si pu`
o allora adattare la dimostrazione del Teorema 4.1 sostituendo le palle Bx, k1 con i Vk .

6.3. Funzioni continue tra spazi topologici.
Definizione 6.10. Siano (X, ) e (Y, ) due spazi topologici. Si dice che f : X Y `e continua in x0 X
se, per ogni intorno U di f (x0 ) in Y , esiste V intorno di x0 in X tale che f (V ) U .
Teorema 6.11. Siano (X, ) e (Y, ) due spazi topologici, e sia f : X Y . Le seguenti condizioni sono
equivalenti:
(i) f `e continua in ogni x X;
(ii) per ogni aperto A di Y , f 1 (A) `e aperto in X;
(iii) per ogni chiuso C di Y , f 1 (C) `e chiuso in X.
Si dice in questo caso che f `e continua su X.

5. Rn , TOPOLOGIE, METRICHE E FUNZIONI CONTINUE

64

Dimostrazione. Mostriamo che (i)(ii). Dato A , mostriamo che f 1 (A) `e aperto. Si prenda
x f 1 (A). Siccome A `e un intorno di f (x), esiste un intorno Vx di x, che possiamo prendere aperto, tale
che f (Vx ) A. Allora
[
f 1 (A)
Vx f 1 (A) .
xf 1 (A)

Dunque f 1 (A) = xf 1 (A) Vx `e aperto.


Mostriamo ora che (ii)(i). Siano x0 X e U intorno di f (x0 ). Allora esiste A aperto in Y con
x0 A U . Ne segue che V = f 1 (A) `e aperto in X. Siccome x0 V , V `e un intorno di x0 e f (V ) U .
Infine lequivalenza (ii)(iii) segue dallindentit`a

f 1 (c Y 0 ) = c f 1 (Y 0 )
S

valida per ogni sottoinsieme Y 0 di Y .

Si noti che, dati un sottoinsieme E di X e una funzione f : X Y , le due condizioni


f `e continua su E (cio`e in ogni punto di E),
f|E `e continua (con E dotato della topologia indotta da X),
non sono equivalenti4. Si prenda ad esempio f : R R uguale alla funzione caratteristica [a,b] di un
intervallo chiuso [a, b],
(
1 se x [a, b]
[a,b] =
0 se x 6 [a, b] .
Allora f|[a,b] = 1 `e continua, ma f non `e continua negli estremi a, b.
La nozione di limite di una funzione tra due spazi topologici viene data di conseguenza come segue.
Definizione 6.12. Siano (X, ) e (Y, ) due spazi topologici, E X e f : E Y . Sia inoltre x0 un punto
di accumulazione di E in X. Si pone limxx0 f (x) = ` Y se la funzione
(
f (x) se x E \ {x0 }
f(x) =
`
se x = x0
`e continua in x0 . In modo equivalente, limxx0 f (x) = ` Y se e solo se, per ogni intorno U di ` in Y ,
esiste V intorno di x0 in X tale che f (V E) \ {x0 } U .
Definizione 6.13. Una funzione biiettiva f : X Y tra due spazi topologici (X, ) e (Y, ) si dice un
omeomorfismo se f e f 1 sono entrambe continue.
Si dice che (X, ) e (Y, ) sono omeomorfi se tra di loro esiste un omeomorfismo.
Proposizione 6.14. Siano (X, ), (Y, ), (Z, ) spazi topologici, e siano f : X Y , g : Y Z funzioni
continue. Allora anche g f : X Z `e continua.
La relazione tra spazi topologici (X, ) `e omeomorfo a (Y, ) `e una relazione di equivalenza.

Dimostrazione. Dato un aperto A in Z, g 1 (A) `e aperto in Y , e dunque f 1 g 1 (A) = (g f )1 (A)
`e aperto in X. Questo dimostra la prima parte dellenunciato. La seconda `e unovvia conseguenza della
prima.


4Precisamente, la prima implica la seconda (esercizio), ma non viceversa.

6. SPAZI TOPOLOGICI

65

6.4. Funzioni semicontinue.


Definizione 6.15. Sia (X, ) uno spazio topologico. Una funzione f : X R si dice semicontinua
inferiormente in x0 se
f (x0 ) lim inf f (x) ,
xx0

e semicontinua superiormente in x0 se
f (x0 ) lim sup f (x) .
xx0

Proposizione 6.16. Sia (X, ) uno spazio topologico. Una funzione f : X R `e semicontinua inferiormente in x0 se e solo se, dotando R della topologia + , essa `e continua in x0 .
Analogamente, f `e semicontinua superiormente in x0 se e solo se, dotando R della topologia , essa `e
continua in x0 .
Dimostrazione. La condizione f (x0 ) lim inf xx0 f (x) equivale a dire che, per ogni > 0, esiste un
intorno U di x0 tale che, per ogni x U , f (x) > f (x0 ) , ossia

f (U ) f (x0 ) , + .

Ma le semirette f (x0 ) , + formano un sistema fondamentale di intorni di f (x0 ) nella topologia + .
Questo dimostra la prima equivalenza. La seconda si dimostra in modo analogo.

6.5. Test di continuit`
a con successioni.
Una successione (xn ) a valori in uno spazio topologico (X, ) converge a x
X se, per ogni intorno U
di x
, esiste n0 N tale che an U per ogni n n0 .
Il teorema che segue mette in relazione la continuit`a di una funzione con la convergenza di successioni
nel dominio e delle loro immagini nel codominio.
Teorema 6.17. Siano (X, ) e (Y, ) due spazi topologici.
(i) Se una successione (xn )nN di elementi di X converge a x
X e f : X Y `e continua in x
,
allora la successione f (xn ) nN converge a f (
x).
(ii) Se (X, ) soddisfa il primo assioma di numerabilit`
a, una funzione f : X Y `e continua in x
se e
solo se, per ogni successione (xn )nN convergente a x
, la successione f (xn ) nN converge a f (
x).
Dimostrazione. Nelle ipotesi di (i), si prenda un intorno U di f (
x) in Y . Esiste allora V intorno di x

in X tale che f (V ) U . Preso n0 N tale che an V per ogni n n0 , si ha, per tali n, che f (xn ) U .
Questo dimostra la tesi.
Si supponga ora che (X, ) soddisfi il primo assioma di numerabilit`a. Assumendo come ipotesi che
f : X Y `e continua in x
, la (i) fornisce la tesi di una delle due implicazioni da dimostrare.

Assumiamo ora come ipotesi che, per ogni successione (xn )nN convergente a x
, la successione f (xn ) nN
converge a f (
x). Supponiamo per assurdo che f non sia continua in x
. Esiste allora un intorno U di x
tale
che, comunque scelto un intorno V di x
, si abbia f (V ) 6 U .
Fissato {Vn }nN un sistema fondamentale di intorni di x
con Vn+1 Vn per ogni n, si prenda, per ogni
n, xn Vn tale che f (xn ) 6 U . Allora la successione (xn )nN converge a x
, perche i suoi termini sono
definitivamente contenuti in ogni Vn , e dunque
in
ogni
intorno
di
x

.
Ma
le
loro
immagini f (xn ) sono tutte

fuori di U , e dunque la successione f (xn ) nN non converge a f (
x), in contrasto con lipotesi.


5. Rn , TOPOLOGIE, METRICHE E FUNZIONI CONTINUE

66

7. Spazi metrici

7.1. Distanze su insiemi.


Definizione 7.1. Si chiama distanza (o metrica) su un insieme X una funzione d : X X [0, +)
che soddisfi le seguenti propriet`
a:
(i) d(x, y) = 0 se e solo se x = y;
(ii) per ogni x, y X, d(x, y) = d(y, x);
(iii) (disuguaglianza triangolare) per ogni x, y, z X, d(x, z) d(x, y) + d(y, z).
Uno spazio metrico `e una coppia (X, d), dove d `e una distanza sullinsieme X.
Se (X, d) `e uno spazio metrico e Y X, si chiama metrica indotta da X su Y la distanza d|Y Y .
Esempi.
(1) Oltre alla distanza euclidea, su Rn sono interessanti le seguenti distanze:
1
dp (x, y) = |x1 y1 |p + + |xn yn |p p
dove 1 p < e
d (x, y) = max |xk yk | .
1kn

Le propriet`
a (i) e (ii) sono ovvie. La propriet`a (iii) `e di semplice verifica per d1 e d , ed `e
stata dimostrata per la distanza euclidea d2 . Per p generico, la verifica `e pi`
u complessa e viene qui
tralasciata.
(2) Su un qualunque insieme X,
(
0 se x = y
d(x, y) =
1 se x 6= y ,
`e una distanza.
(3) (distanza p-adica su Q) Ogni numero razionale x 6= 0 si scompone in modo unico, a meno dellordine,
come prodotto
(7.1)

mk
1 m2
x = pm
,
1 p2 pk

dove i pj sono numeri primi e gli mj interi relativi. Fissato un numero primo p, si definisce il valore
assoluto p-adico di x Q come
(
0
se x = 0
|x|p =
m
p
se pm `e il fattore con base p nella scomposizione (7.1).


Si verifica facilmente che |x + y|p max |x|p , |y|p per ogni x, y Q. Da questo segue che
dp (x, y) = |x y|p
`e una metrica su Q. In realt`
a vale una propriet`a pi`
u forte della disuguaglianza triangolare, cio`e


dp (x, z) max dp (x, y), dp (y, z) ,
x, y, z Q .
Si dice allora che dp `e una ultrametrica.
Per funzioni tra spazi metrici si adotta la seguente terminologia.
Definizione 7.2. Siano (X, d), (X 0 , d0 ) due spazi metrici, e sia f : X X 0 una funzione.
(i) Si dice che f `e una isometria di X sulla sua immagine f (X) X 0 se

d0 f (x), f (y) = d(x, y) ,
x, y X .

7. SPAZI METRICI

67

(ii) Si dice che f `e Lipschitziana se esiste una costante L > 0 tale che

d0 f (x), f (y) Ld(x, y) ,

x, y X .

(iii) Si dice che f `e una contrazione se `e Lipschitziana con costante L < 1.


Inoltre due spazi metrici (X, d), (X 0 , d0 ) si dicono
(i) isometrici se esiste una isometria suriettiva di X in X 0 ,
(ii) bi-Lipschitzianamente equivalenti se esiste unapplicazione biiettiva f : X X 0 con f e f 1
Lipschitziane.

7.2. Topologia indotta da una metrica.


Sia (X, d) uno spazio metrico. Si introduce una topologia d su X (detta topologia indotta dalla metrica
d), definendo aperte le unioni (anche vuote) di palle

Bx0 ,r = x : d(x, x0 ) < r} .
Il contenuto del paragrafo 2 si applica senza modifiche al caso generale. Il seguente enunciato risulta
dunque evidente da quanto visto finora.
Proposizione 7.3.
(i) La topologia d `e di Hausdorff e soddisfa il primo assioma di numerabilit`
a.
(ii) Funzioni Lipschitziane tra spazi metrici sono continue.
(iii) Spazi metrici bi-Lipschitzianamente equivalenti sono omeomorfi rispetto alle topologie indotte dalle
rispettive metriche.
Due distanze sullo stesso insieme X si dicono topologicamente equivalenti se inducono su X la stessa
topologia. Questo `e il caso di due distanze non isometriche, ma bi-Lipschitzianamente equivalenti.
Esempi.
1. Le distanze d1 , d2 , d su Rn sono bi-Lipschitzianamente equivalenti tra loro. Questo segue dalle disuguaglianze
(7.2)

d (x, y) d2 (x, y) d1 (x, y) nd (x, y) ,

facilmente verificabili.
La conseguente uguaglianza delle tre topologie indotte si comprende facilmente osservando che le disuguaglianze (7.2) implicano le inclusioni

1
2

Bx,r
Bx,2r
Bx,2r
Bx,2r
,

x Rn , r > 0 ,

dove B p indica la palla per la distanza dp (v. figura per n = 2). Quindi gli intorni di un punto nelle tre
topologie indotte sono gli stessi, e dunque le tre topologie hanno gli stessi aperti, cio`e coincidono.

5. Rn , TOPOLOGIE, METRICHE E FUNZIONI CONTINUE

68

6
...............................................
.............................
................
...............
............
............
..........
..........
.........
.........
........
.
.
.
.
.
.
.
........
.....
.
.
.
.
.......
.
.
.....
.......
.
.
.
.
.
......
.....
.
.
......
.
.
...
.
......
.
.
.
.
....
....
.
.
....
..
.
....
.
.
..
....
.
.
.
....
...
.
.
....
..
.
.
...
...
...
.
.
...
...
...
.
..
...
.
..
...
.
...
..
.
...
..
.
...
....
...
...
...
...
..
..
...
..
...
..
..
...
..
..
...
..
...
..
..
..
..
..
..
..
..
.
.
..
...
..
..
.
..
..
...
..
...
...
...
....
...
..
...
...
...
..
...
..
.
.
...
...
...
...
...
...
...
...
...
.
....
.
...
....
....
....
....
....
....
....
...
.
....
.
......
....
......
......
......
......
.......
.......
.......
......
.
.
.
.
........
.
.
........
.......
..........
........
...........
..........
............
..........
.................
............
...................................................................................

@
@

@
@

@
@

@
@

@
@

@
@

@
@

2. La distanza euclidea su R e la stessa distanza euclidea ristretta a un intervallo aperto proprio I sono
topologicamente equivalenti, ma non bi-Lipschitzianamente equivalenti.
3. Su R si considerino la distanza euclidea d e la distanza
y) = |x3 y 3 | .
d(x,
su (R, d), e dunque un omeomorfismo di (R, ) su
La funzione f (x) = x3 `e una isometria di (R, d)
d
(R, d ). Ma f `e pure un omeomorfismo da (R, d ) in se. Quindi f 1 f = R `e un omeomorfismo di (R, d)
su (R, d ). Questo equivale a dire che d = d .
Le due distanze sono dunque topologicamente equivalenti. Tuttavia esse non sono bi-Lipschitzianamente
y) d(x, y) per ogni x, y R, si avrebbe |x3 | L|x| per
equivalenti, per che, se esistesse L > 0 tale che d(x,
ogni x R, che `e assurdo.
4. (Esercizio) Si verifichi che una distanza p-adica su Q non `e topologicamente equivalente alla distanza
euclidea (indotta da R).
7.3. Successioni di Cauchy e funzioni uniformemente continue.
Le nozioni di successione di Cauchy e di funzione uniformemente continua non hanno senso in generale
nellambito degli spazi topologici. Il motivo `e che ciascuna di esse richiede la possibilit`a di stabilire se due
intorni di due punti diversi hanno in qualche modo la stessa taglia. Questo `e possibile, come vedremo ora,
su spazi metrici.
Sia (xn )nN una successione di elementi di uno spazio metrico (X, d). La condizione di convergenza nella
topologia d a un elemento x
X equivale alla condizione
(7.3)

> 0 n0 N : n n0 , d(xn , x
) < .

In analogia con la definizione nota per successioni di numeri reali, si pone quanto segue.

7. SPAZI METRICI

69

Definizione 7.4. Una successione (xn )nN di elementi di uno spazio metrico (X, d) si dice di Cauchy se
(7.4)

> 0 n0 N : n, m n0 , d(xn , xm ) < .

Proposizione 7.5. Ogni successione a valori in uno spazio metrico convergente `e di Cauchy.
Dimostrazione. Sia x
= limn xn . Dato > 0, se n0 `e tale che d(xn , x
) < /2 per ogni n n0 , si
ha, per n, m n0 ,
d(xn , xm ) d(xn , x
) + d(
x, xm ) < .

Limplicazione inversa non `e sempre vera. Si consideri ad esempio X = Q con la distanza euclidea.
Definizione 7.6. Uno spazio metrico (X, d) si dice completo se ogni successione di Cauchy di elementi di
X converge a un elemento di X.
Passiamo ora alla nozione di continuit`
a uniforme.
Definizione 7.7. Siano (X, d), (X 0 , d0 ) due spazi metrici. Si dice che f : X X 0 `e uniformemente
continua se, per ogni > 0, esiste > 0 tale che

(7.5)
x, y X , d(x, y) < = d0 f (x), f (y) < .
Nellenunciato che segue raggruppiamo due propriet`a che valgono sotto lipotesi di continuit`a uniforme,
ma non per generiche funzioni continue5.
Proposizione 7.8. Siano (X, d) e (X 0 , d0 ) spazi metrici.
(i) Sia f una funzione uniformemente continua da X a X 0 . Se (xn )nN `e una successione di Cauchy
in X, allora f (xn ) nN `e di Cauchy in X 0 .
(ii) Si supponga che (X 0 , d0 ) sia completo, e sia f uniformemente continua da un sottoinsieme Y denso
in X a X 0 . Allora f ammette uno e un solo prolungamento f uniformemente continuo da X a X 0 .
Dimostrazione.
(i). Dato > 0, sia > 0 tale che valga limplicazione (7.5).
 Se (xn )nN `e di Cauchy in X, esiste n0 tale
che n, m n0 = d(xn , xm ) < . Ma allora, d0 f (xn ), f (xm ) < , e questo dimostra la tesi.
(ii). Dato x X, esiste una successione (xn )nN di elementidi Y tale che limn xn = x. Allora
(xn )nN `e di Cauchy. Per quanto dimostrato al punto (i), f (xn ) nN `e di Cauchy in X 0 . Siccome X 0 `e
completo, esiste
(7.6)

y = lim f (xn ) .
n

Mostriamo che y dipende solo da x, e non dalla scelta della successione (xn )nN . Sia (
xn )nN unaltra
successione di punti di Y convergente a x.
Dato > 0, sia n0 tale che, per n n0 , si abbia d(x, xn ) < /2 e d(x, x
n ) < /2. Allora d(xn , x
n ) <
per n n0 .
Dato ora > 0, sia > 0 dato dalla (7.5). Allora, per n n0 ,




d0 y, f (
xn ) d0 y, f (xn ) + d0 f (xn ), f (
xn ) < d0 y, f (xn ) + .


xn ) < 2. Quindi limn f (
xn ) = y.
Preso n1 n0 tale che d0 y, f (xn ) < per n n1 , si ha d0 y, f (
Possiamo dunque definire f : X X 0 come f(x) = y, con y dato dalla (7.6).
Se x Y , si pu`
o scegliere la successione (xn )nN costantemente uguale a x. Quindi f(x) = f (x) per

x Y , cio`e f `e un prolungamento di f .
Se ci fosse unaltro prolungamento continuo g di f a X, dovrebbe comunque valere luguaglianza g(x) =
limn f (xn ) per ogni successione di punti di Y convergente a x. Sarebbe quindi g = f e questo dimostra
lunicit`
a del prolungamento.

5Si trovino per esercizio opportuni controesempi con X = X 0 = R.

5. Rn , TOPOLOGIE, METRICHE E FUNZIONI CONTINUE

70

7.4. Spazi metrici compatti.


Estendendo la definizione data in Rn , diciamo che uno spazio metrico (X, d) `e compatto se ogni successione di elementi di X possiede una sottosuccessione convergente6.
Un sottoinsieme Y di uno spazio metrico (X, d) si dice compatto se lo spazio (Y, d|Y Y ) `e compatto.
Senza riferimento esplicito alla metrica indotta su Y , questa condizione equivale a dire che ogni successione
di elementi di Y ammette una sottosuccessione convergente in X a un elemento di Y .
Un sottoinsieme compatto di uno spazio metrico `e necessariamente chiuso e limitato, dove limitato vuol
dire contenuto in una palla (cf. Teorema 4.3). Limplicazione inversa non vale in generale.
Riuniamo in un enunciato unico tre importanti teoremi sugli spazi compatti.
Teorema 7.9.
(i) Uno spazio metrico compatto `e completo.
(ii) Siano (X, d), (X 0 , d0 ) spazi metrici e sia f : X X 0 continua. Se X `e compatto, anche la sua
immagine f (X) `e compatta.
(iii) (Teorema di Heine-Cantor) Siano (X, d), (X 0 , d0 ) spazi metrici e sia f : X X 0 continua. Se X
`e compatto, f `e uniformemente continua.
Dimostrazione.
(i). Sia (X, d) compatto. Data una successione di Cauchy (xn )nN in X, esiste una sottosuccesione
(xnk )kN convergente a un elemento x. Mostriamo che lintera successione converge a x.
Dato > 0, esiste un intero p che soddisfi entrambe le condizioni
per k p, d(xnk , x) < ,
per n, m p, d(xn , xm ) < .
Essendo np p, si ha, per n p,
d(x, xn ) d(x, xnp ) + d(xnp , xn ) < 2 .
Quindi X `e completo.
(ii). Sia (yn )nN una successione di elementi di f (X). Per ogni n, si prenda xn X tale che f (xn ) = yn .
Per la compattezza di X, esiste una sottosuccessione (xnk )kN convergente a x. Per la continuit`a di f , si ha
lim ynk = lim f (xnk ) = f (x) f (X) .

Dunque f (X) `e compatto.


(iii). Si supponga per assurdo che f non sia uniformemente continua. Esiste quindi 0 > 0 tale che, per
ogni > 0 la condizione (7.5) sia violata. Prendendo = 1/n, esistono quindi xn , yn X con

1
d0 f (xn ), f (yn ) 0 .
(7.7)
d(xn , yn ) < ,
n
Per la compattezza di X, esiste una sottosuccessione (xnk )kN convergente a x X. Essendo
1
d(x, ynk ) d(x, xnk ) + d(xnk , ynk ) < d(x, xnk ) +
,
nk
anche (ynk )kN converge a x. Per la continuit`a di f ,
lim f (xnk ) = lim f (ynk ) = f (x) .

Sia dunque k0 tale che, per k k0 , si abbia


 0
 0
d0 f (x), f (xnk ) <
,
d0 f (x), f (ynk ) <
.
2
2
Si avrebbe allora, per k k0 ,

d0 f (xnk ), f (ynk ) < 0 ,
6Il termine corretto per indicare condizione sarebbe compattezza per successioni. Per spazi topologici generali si d`
a una
diversa definizione di compattezza, che per`
o coincide, per spazi metrici, con la compattezza per successioni.

8. FUNZIONI CONTINUE TRA SPAZI EUCLIDEI

in contrasto con la (7.7).

71

Il punto (ii) ha la seguente conseguenza importante.


Corollario 7.10 (Teorema di Weierstrass). Siano (X, d) uno spazio metrico compatto e f : X R
continua. Allora f assume valore massimo e valore minimo.

8. Funzioni continue tra spazi euclidei


Si consideri una funzione f : E Rm , con E Rn , e siano f1 , . . . , fn : E R le sue componenti
scalari, tali cio`e che

f (x) = f1 (x), . . . , fm (x) .
La nozione di continuit`
a di f in un punto di E rientra nella Definizione 6.10. Sulla base della Proposizione 3.3 e del Teorema 6.17, punto (ii), possiamo affermare quanto segue.
Proposizione 8.1. La funzione f `e continua in x0 E se e solo se ciascuna delle sue componenti scalari
fk `e continua in x0 .
8.1. Curve in Rm .
Consideriamo il caso m = 1.
Definizione 8.2. Sia I un intervallo aperto di R. Una funzione continua : I Rm si chiama curva.
La restrizione di a un sottointervallo compatto [a, b] di I si chiama arco della curva .
Ovviamente una funzione continua da un intervallo compatto [a, b] in Rm `e un arco di curva, in quanto
si pu`
o sempre prolungare in modo continuo a un intervallo aperto I = (a , b + ) con > 0.
Per le curve si adotta una apposita terminologia.
La variabile t I si chiama anche parametro della curva .
La curva si dice semplice se `e iniettiva.
Linsieme immagine (I) (Rm ) si chiama7 sostegno di .
La terminologia introdotta nei punti precedenti si applica anche ad archi di curva.
Un arco : [a, b] Rm si dice chiuso se (a) = (b).
Un arco si dice chiuso semplice se `e chiuso e vale limplicazione: t, t0 [a, b] , t < t0 , (t) =
(t0 ) = t = a , t0 = b.
Le curve non sono dunque sottoinsiemi di Rm , ma funzioni. La nozione di curva `e legata piuttosto
allidea di un punto di Rm che si sposta nel tempo. Nelle applicazioni alla meccanica, infatti, si usa questa
nozione di curva per rappresentare la legge del moto di un punto materiale nello spazio.
Del resto, una nozione di curva come sottoinsieme di Rm si scontra con serie difficolt`a. Lesempio della
curva di Peano, che ha come sostegno un intero quadrato8, mostra come il sostegno di una curva possa non
avere alcun aspetto di unidimensionalit`
a.
Si presenta spesso, comunque, lesigenza di svincolare la nozione di curva dalla definizione di una specifica
parametrizzazione. Questo risultato si ottiene, in parte, introducendo una opportuna relazione di equivalenza
tra curve o archi9.
Definizione 8.3. Siano : I Rm e : J Rm due curve (oppure due archi di curva) in Rm . Si pone
se esiste una funzione continua, suriettiva e strettamente crescente : I J tale che = .
Si verifica facilmente quanto segue:
`e effettivamente una relazione di equivalenza;
7Si usa anche il termine traiettoria.
8La curva di Peano sar`
a costruita in modo rigoroso in un successivo capitolo.
9La differenza tra i due casi dipende dal fatto che gli intervalli di definizione siano aperti oppure compatti.

5. Rn , TOPOLOGIE, METRICHE E FUNZIONI CONTINUE

72

se e sono equivalenti, esse hanno lo stesso sostegno;


se e sono equivalenti, `e semplice (risp. un arco chiuso, un arco chiuso semplice) se e solo se
lo `e .
La seconda affermazione non ammette in generale unimplicazione inversa. Per esempio, gli archi
(t) = (cos t, sin t) , t [0, 2] ,

(t) = (cos t, sin t) , t [0, 3] ,

hanno come sostegno il cerchio di centro lorigine e raggio 1 in R2 , ma non sono equivalenti.
Pi`
u semplice `e la situazione per quanto riguarda archi semplici.
Teorema 8.4. Sia un arco semplice. Esistono allora esattamente due classi di equivalenza di archi semplici
con lo stesso sostegno di : la classe C e la classe C , dove
(t) = (a + b t) ,

t [a, b] .


Dimostrazione. Sia [a, b] lintervallo su cui `e definito larco , e sia E = [a, b] . Proviamo innanzitutto che 1 : E [a, b] `e continua.
Se, per assurdo, 1 non fosse continua in un punto x = (t) E, esisterebbero 0 > 0 e una successione
di punti xn = (tn ) E, n 1, tali che
1
e |tn t| 0 .
n
Essendo [a, b] compatto, esisterebbe quindi una sottosuccessione (tnk )kN convergente a t [a, b]. Si
avrebbe allora |t t| 0 , ma anche
|xn x| <

(t) = lim (tnk ) = lim xnk = x ,


k

in contrasto con liniettivit`


a di .
Sia allora : [c, d] E un altro arco semplice con sostegno E. La composizione
= 1 : [c, d] [a, b] ,
`e continua e biiettiva, quindi o `e strettamente crescente, o `e strettamente decrescente. Nel primo caso,
= , nel secondo .

Le due classi di equivalenza C e C rappresentano dunque i due possibili orientamenti con cui si pu`
o
percorrere E senza passare due volte per lo stesso punto.
Il Teorema 8.4 non ammette un analogo per curve semplici. Si consideri per esempio una curva semplice
definita su I = (a, b), e tale che esista c I per cui
lim (t) = (c) ,

tb

(si pensi a un sostegno a forma di 9). Si osservi che esistono almeno quattro modi non equivalenti di ottenere
lo stesso sostegno con curve semplici.
8.2. Funzioni continue da Rn a R.
Passiamo a discutere la continuit`
a di funzioni di pi`
u variabili. In base alla Proposizione 8.1, sar`
a
sufficiente considerare funzioni a valori in R.
Valgono per le funzioni da Rn a R i teoremi sulla continuit`a delle funzioni somma prodotto, reciproco di
funzioni continue come nel caso n = 1. Ricordiamo poi la Proposizione 6.14 sulla continuit`a della funzione
composta.
Aggiungiamo questa semplice osservazione: se g `e una funzione di una variabile, continua su I R,
allora
f (x1 , . . . , xn ) = g(x1 ) ,
`e continua su I Rn1 .

8. FUNZIONI CONTINUE TRA SPAZI EUCLIDEI

73

Con questi strumenti si dimostra facilmente la continuit`a di funzioni di pi`


u variabili definite in termini
di funzioni elementari, per es.
x+sin y

f (x, y, z) = e 1+y2 +z2 .


In situazioni diverse, la determinazione della continuit`a di una funzione pu`o presentare aspetti problematici, e tentativi di riduzione a metodi di una variabile possono dar luogo a conclusioni sbagliate.
Partiamo da questa semplice conseguenza della Proposizione 6.14: se f `e una funzione a valori reali,
continua su E Rn , e : I E `e una curva a valori in E, allora f : I R `e continua.
In particolare, se prendiamo x0 ,v (t) = x0 + tv, parametrizzazione affine della retta passante per x0 e
parallela al vettore v, la funzione
g(t) = f (x0 + tv) ,


`e continua sullinsieme t : x0 + tv E . Con un abuso di linguaggio, diremo che g `e la restrizione di f alla
retta data.
Mostriamo ora con un esempio in due variabili che una funzione pu`
o avere restrizioni continue a tutte
le rette senza essere essa stessa continua.
Esempio.
Partiamo da una funzione (t) continua su R, nulla fuori dallintervallo [1, 3] e uguale a 1 per t = 2, per
esempio

t 1 se 1 t 2,
(8.1)
(t) = 3 t se 2 t 3,

0
altrimenti,
e poniamo
( y 
2 ,
x
f (x, y) =
0

(8.2)

se x 6= 0
se x = 0.

Si ha allora che:
f `e diversa da 0 solo nei punti (x, y) con x2 < y < 3x2 (regione aperta compresa tra due parabole
con vertice nellorigine);
f = 1 sui punti della parabola y = 2x2 con x 6= 0, ma f (0, 0) = 0; quindi f non `e continua in 0.
Tuttavia:
la restrizione di f a una qualunque retta del piano `e continua (esercizio).
Questo esempio mostra i problemi che si possono incontrare nel trattamento di limiti di funzioni di pi`
u
variabili. Si ha infatti




lim lim f (x, y) = 0 ,
lim lim f (x, y) = 0 ,
x0

y0

y0

x0

mentre non esiste


lim

f (x, y) .

(x,y)(0,0)

Quindi il calcolo di un limite non pu`


o essere sempre ridotto a una sequenza di limiti nelle singole variabili.

CAPITOLO 6

SUCCESSIONI E SERIE DI FUNZIONI


Si danno per noti i risultati fondamentali del calcolo differenziale in una variabile.
1. Convergenza puntuale e uniforme
Sia E un insieme. Consideriamo una successione di funzioni
fn : E R ,
di funzioni a valori reali.
Definizione 1.1. Si dice che la successione (fn )nN converge puntualmente su E alla funzione f : E R
se, per ogni x E, si ha
lim fn (x) = f (x) .
n

Esempi.
1. Con E = R, la successione fn (x) =

nx
1+nx2

converge puntualmente a
(
1
se x 6= 0
f (x) = x
0
se x = 0 .


2. Sempre con E = R, si ponga fn (x) = xn . La successione di numeri reali fn (x) nN ha limite finito solo
per 1 < x 1. Quindi la successione di funzioni (fn )nN non converge puntualmente su R.
Tuttavia, restringendosi a E0 = (1, 1], si ha convergenza puntuale su E0 e la funzione limite `e
(
0 se 1 < x < 1
(1.1)
f (x) =
1 se x = 1 .
Osservazione 1.2. Si osservi che la nozione di convergenza puntuale si estende in modo naturale a successioni a valori in un qualunque spazio topologico. Nel seguito non ci servir`a tuttavia tutta questa generalit`
a,
salvo il caso di funzioni a valori complessi.
Introduciamo ora una nozione pi`
u restrittiva di convergenza, la convergenza uniforme. Come sopra, E
`e un insieme e le funzioni fn sono definite su E e a valori reali.
Definizione 1.3. Si dice che la successione (fn )nN converge uniformemente su E alla funzione f : E R
se, per ogni > 0 esiste un indice n0 tale che, per ogni n n0 e ogni x E, si ha


fn (x) f (x) < .
Le due nozioni, di convergenza puntuale e convergenza uniforme, si confrontano bene esprimendo le due
condizioni in forma esplicita.
Convergenza puntuale:


> 0, x E, n0 (, x) : n n0 (, x) , fn (x) f (x) < .
75

76

6. SUCCESSIONI E SERIE DI FUNZIONI

Convergenza uniforme:


> 0, n0 () : x E, n n0 () , fn (x) f (x) < .
La differenza sta nel fatto che, dato 0 , lindice richiesto n0 , a partire dal quale fn (x) debba distare da
f (x) per meno di , possa dipendere da x, oppure debba esistere indipendentemente da x.
Il seguente enunciato `e dunque ovvio.
Lemma 1.4. Se una successione di funzioni converge uniformemente su E alla funzione f , allora vi converge
puntualmente.
Esempio.
Si consideri la successione fn (x) = xn del precedente Esempio 2. Sullinsieme E0 = (1, 1] si ha
convergenza puntuale, ma non uniforme. Si fissi infatti < 1. Se la convergenza alla funzione f in (1.1)
fosse uniforme, dovrebbe esistere un indice n0 tale che, per ogni n n0 e ogni x (1, 1), |xn | < . Ma
questo `e assurdo perche limx1 |xn | = 1.
Restringiamo ora le funzioni fn a un intervallo E = [1 + , 1 ], dove 0 < < 1/2. Dato > 0,
esistei n0 tale che (1 )n0 < . Se n n0 e x E , si ha
n

x f (x) = |xn | (1 )n < .
Quindi la convergenza alla funzione f `e uniforme su E .
Osservazione 1.5. La nozione di convergenza puntuale si estende
in modo
a valori
naturale a successioni


in un qualunque spazio metrico, sostituendo nella definizione fn (x) f (x) con d fn (x), f (x) .

2. Continuit`
a del limite uniforme
Gli esempi visti nel paragrafo precedente mostrano che funzioni continue possono convergere puntualmente a funzioni discontinue. Il teorema seguente dimostra invece che la continuit`a delle funzioni fn si
trasmette alla funzione limite f quando la convergenza `e uniforme.
Teorema 2.1. Sia (E, ) uno spazio topologico. Se le funzioni fn : E R convergono a una funzione f
uniformemente su E, e ogni fn `e continua in un punto x0 E, allora anche f `e continua in x0 .
Dimostrazione. Si fissi > 0. Per lipotesi di convergenza uniforme, esiste un indice n
tale che


f (x) fn (x) < .
x E ,
3
Per la continuit`
a di fn in x0 , esiste un intorno U di x0 in E tale che


fn (x) fn (x0 ) < .
x U ,
3
Allora, per ogni x U risulta



f (x) f (x0 ) = f (x) fn (x) + fn (x) fn (x0 ) + fn (x0 ) f (x0 )




f (x) fn (x) + fn (x) fn (x0 ) + fn (x0 ) f (x0 )
<.
Per larbitrariet`
a di , f `e continua in x0 .

3. LA CONVERGENZA UNIFORME COME CONVERGENZA IN UNO SPAZIO METRICO

77

3. La convergenza uniforme come convergenza in uno spazio metrico


Sia E un insieme. Indichiamo con B(E) linsieme delle funzioni limitate f : E R. Date f, g B(E),
poniamo


(3.1)
d(f, g) = sup f (x) g(x) .
xE

Lemma 3.1. La (3.1) definisce una distanza su B(E).


Dimostrazione. Chiaramente, d(f, g) 0 per ogni f, g B(E) e d(f, g) = 0 se e solo se f = g.
Altrettanto chiaramente, vale lidentit`
a d(f, g) = d(g, f ). Rimane dunque da verificare la disuguaglianza
triangolare.
Siano f, g, h B(E). Per ogni x E,




f (x) h(x) f (x) g(x) + g(x) h(x) d(f, g) + d(g, h) .
Ma allora


d(f, h) = sup f (x) h(x) d(f, g) + d(g, h) .

xE

Proposizione 3.2. Una successione (fn )nN di elementi di B(E) converge uniformemente su E a una
funzione f se e solo se f B(E) e
lim d(f, fn ) = 0 .
n

Dimostrazione. Si supponga che le funzioni fn convergano uniformemente su E a una funzione f .


Dato > 0 esiste un indica n0 tale che, per ogni n n0 e ogni x E,


f (x) fn (x) < .


Sia M tale che fn0 (x) M per ogni x E. Allora




f (x) f (x) fn (x) + fn (x) < M + ,
0

per ogni x E. Dunque f B(E). Inoltre, per n n0 ,




d(f, fn ) = sup f (x) fn (x) .
xE

Per larbitrariet`
a di , limn d(f, fn ) = 0.
Viceversa, se f B(E) e limn d(f, fn ) = 0, dato > 0, esiste
n0 tale che, per ogni n n0 ,
d(f, fn ) < . Ma questo implica che, per ogni x E, f (x) fn (x) < . Quindi le fn convergono
uniformemente a f .


Teorema 3.3. Lo spazio metrico B(E), d `e completo.


Dimostrazione.
Sia (fn )nN una successione di Cauchy in B(E). Si fissi x

 E. Siccome fn (x)
fm (x) d(fn , fm ), si deduce facilmente che la successione di numeri reali fn (x) nN `e pure di Cauchy.
Allora il limite
f (x) = lim fn (x)
n

esiste finito per ogni x E.


Dato > 0,
sia n0 tale che, per ogni m, n n0 , d(fm , fn ) < . Per ogni x E e n, m n0 , si ha
fm (x) fn (x) < . Dunque, per n n0 ,




f (x) fn (x) = lim fm (x) fn (x) .
m

Questo dimostra che le fn convergono a f uniformemente su E. Per la Proposizione 3.2, si ha dunque


convergenza nella metrica di B(E).

Sia ora E uno spazio metrico compatto, per es. un sottoinsieme chiuso e limitato di Rn . Indichiamo con
C(E) linsieme delle funzioni continue su E. Per il Teorema di Weierstrass, C(E) B(E). Il Teorema 2.1
ha la seguente conseguenza immediata.

78

6. SUCCESSIONI E SERIE DI FUNZIONI


Corollario 3.4. C(E) `e chiuso in B(E). In particolare, C(E), d `e pure uno spazio metrico completo.

4. Derivabilit`
a della funzione limite
Consideriamo in questo paragrafo successioni di funzioni definite su un intervallo I R. Nel caso in cui

I non sia aperto, per funzione derivabile su I intenderemo una funzione che `e derivabile in I e ammette
derivata laterale in ognuno dei due estremi che sia elemento di I.
Se vero che il limite uniforme di funzioni continue `e continuo, non `e vero in generale che il limite uniforme
di funzioni derivabili sia derivabile.
Esempio.
Ci sono molti modi di ottenere laqfunzione f (x) = |x| come limite uniforme su I = R di funzioni derivabili.
Si prenda per esempio fn (x) = x2 + n12 , il cui grafico `e il ramo superiore di uniperbole equilatera con
asintoti y = x e vertice nel punto (0, 1/n). Chiaramente fn `e derivabile su R. Essendo
r
1
1
|x| < x2 + 2 |x| + ,
n
n

si ha limn fn (x) = |x| uniformemente.




Un altro modo `e il seguente. Sullintervallo n1 , n1 si modifichi
 il grafico della funzione |x| sostituendolo
con il quarto di cerchio tangente al grafico stesso nei punti n1 , n1 . La funzione gn cos` ottenuta `e derivabile
e limn gn (x) = |x| uniformemente.
Il secondo procedimento descritto nellesempio si generalizza facilmente al caso in cui f `e una funzione
lineare a tratti, cio`e una funzione continua il cui grafico sia lunione di un numero localmente finito di segmenti
su intervalli adiacenti di R. Utilizzando questa osservazione, possiamo dimostrare il risultato che segue.
Teorema 4.1. Sia [a, b] un intervallo compatto1. Ogni funzione continua su [a, b] `e limite uniforme di una
successione di funzioni derivabili su [a, b].
Dimostrazione. Fissato un intero n > 0, si suddivida I in n sottointervalli adiacenti di lunghezza
(b a)/n. Poniamo
j
aj = a + (b a) ,
j = 0, . . . , n ,
n
e indichiamo con Ij = [aj1 , aj ], j = 1, . . . , n, il j-esimo sottointervallo della suddivisione. Chiamiamo quindi
fn la funzione tale che
fn (aj ) = f (aj ) per j = 0, . . . , n,
per j = 1, . . . , n, fn |I `e lineare.
j

Dimostriamo che le fn convergono uniformemente a f su [a, b]. Per la continuit`a uniforme di f , dato
> 0, esiste > 0 tale che
x, x0 [a, b] , |x x0 | < = |f (x) f (x0 )| < .
Si prenda ora n tale che (b a)/n < e siano I1 , . . . In i sottointervalli di I descritti sopra. Se x Ij ,
per la monotonia di fn su Ij , il valore fn (x) `e compreso tra i due valori fn (aj1 ) = f (aj1 ) e fn (aj ) = f (aj ).
Quindi




f (x) fn (x)| max f (x) f (aj1 )|, f (x) f (aj )| < ,
essendo |x aj1 | e |x aj | minori di .
Siccome la condizione (b a)/n < `e verificata definitivamente, si ottiene che d(f, fn ) < definitivamente.
1La conclusione vale anche per intervalli non compatti. Lo si dimostri per esercizio.

` DELLA FUNZIONE LIMITE


4. DERIVABILITA

79

Per quanto detto a proposito delle funzioni lineari a tratti, ogni fn `e limite uniforme su [a, b] di funzioni
derivabili su [a, b]. Si prenda quindi, per ogni n, una funzione gn derivabile su [a, b] tale che d(fn , gn ) < 1/n.
Allora si ha definitivamente d(fn , gn ) < , e dunque d(fn , gn ) < 2.
Per larbitrariet`
a di si ha la conclusione.


Il Teorema
4.1 si pu`
o esprimere in termini topologici come segue. Chiamiamo D [a, b] il sottoinsieme

di C [a, b] i cui elementi
sono le funzioni

 derivabili su [a, b].
Allora D [a, b] `e denso in C [a, b] .
Passiamo ora a discutere quali ipotesi possano garantire che se le funzioni fn sono derivabili su un
intervallo I e convergono a una funzione f , allora anche f `e derivabile su I e f 0 `e uguale al limite delle fn0 .
Si vuole cio`e avere luguaglianza

0
lim fn = lim fn0 ,
n

ossia ottenere che la derivata del limite `e il limite delle derivate.


Consideriamo prima di tutto il caso in cui I `e chiuso e limitato.
Teorema 4.2. Sia (fn )nN una successione di funzioni derivabili sullintervallo I = [a, b]. Si supponga che
(i) le derivate fn0 convergano uniformemente su I a una funzione g;
(ii) esista un punto x0 I tale che
lim fn (x0 ) = ` R .

Allora le funzioni fn convergono uniformemente su I alla funzione f che soddisfa le condizioni


(
f 0 (x) = g(x) x I
(4.1)
f (x0 ) = ` .
Prima di dare la dimostrazione si noti che se due funzioni soddisfano entrambe le condizioni (4.1), allora
coincidono. Infatti la loro differenza ha derivata nulla su tutto I, dunque `e costante per il Teorema di
Lagrange. Ma la differenza `e nulla in x0 , da cui la conclusione.
La funzione f nella (4.1) `e quella che si chiama una primitiva di g.
Dimostrazione. Dimostriamo per cominciare che la successione (fn )nN `e di Cauchy in C(I).
Per ipotesi, la successione delle derivate fn0 `e di Cauchy in C(I) e la successione dei valori fn (x0 ) `e di
Cauchy in R. Quindi, fissato > 0 esiste n0 tale che, per n, m n0 , si ha


0
fn (x0 ) fm (x0 ) < .
d(fn0 , fm
)<
e
Sia allora x [a, b]. Applicando il Teorema di Lagrange alla funzione fn fm si ha




fn (x) fm (x) fn (x) fm (x) fn (x0 ) fm (x0 ) + fn (x0 ) fm (x0 )



= |x x0 | (fn fm )0 (tx,n,m ) + fn (x0 ) fm (x0 ) ,
dove tx,n,m `e un punto strettamente compreso tra x0 e x. Dunque


d(fn , fm ) = max fn (x) fm (x)
x[a,b]


0
(b a)d(fn0 , fm
) + fn (x0 ) fm (x0 ) ,
e, se n, m n0 , d(fn , fm ) < (b a + 1). Per larbitrariet`a di , la successione (fn )nN `e di Cauchy in C(I).
Essendo C(I) completo, si ottiene una funzione f C(I) come limite uniforme delle fn . Ovviamente,
f (x0 ) = `. Dobbiamo ora dimostrare che f `e derivabile in I e la sua derivata `e g.
Fissiamo un punto x
I e consideriamo la successione di funzioni

x)
fn (x) fn (
se x 6= x

hn (x) =
xx

f 0 (
x)
se x = x
.
n

80

6. SUCCESSIONI E SERIE DI FUNZIONI

Queste funzioni sono ovviamente continue in I e convergono puntualmente alla funzione

x)
f (x) f (
se x 6= x

h(x) =
.
xx

g(
x)
se x = x
.
Se dimostriamo che le hn formano una successione di Cauchy in C(I), ne consegue che la convergenza a
h `e uniforme, e dunque h `e continua in x
. Ma questo vuol dire che
g(
x) = lim

x
x

f (x) f (
x)
= f 0 (
x) ,
xx

che `e la tesi del teorema.


Fissiamo dunque x 6= x
. Riapplicando il Teorema di Lagrange a fn fm , si ha




fn (x) fm (x) fn (
x
)

f
(
x
)
m

hn (x) hm (x) =


xx


0
0
(tx,x,n,m ) ,
= fn (tx,x,n,m ) fm
con tx,x,n,m strettamente compreso tra x e x
. Quindi


0
d(hn , hm ) = max hn (x) hm (x) d(fn0 , fm
),
x[a,b]

e questo prova che le hn formano una successione di Cauchy.

Nella dimostrazione si fatto uso dellipotesi di limitatezza dellintervallo I. Semplici esempi mostrano
che su intervalli illimitati non si pu`
o dedurre dalle stesse ipotesi la convergenza uniforme delle fn . Si ponga
per esempio, su I = R,
x
fn (x) = .
n
Le ipotesi del Teorema 4.2 sono soddisfatte, ma le fn non convergono uniformemente su R. Si noti per`
o
che su ogni sottointervallo compatto si ha convergenza uniforme. Si parla in questo caso di convergenza
uniforme sui compatti2. Si ha quindi la seguente estensione del Teorema 4.2.
Corollario 4.3. Sia (fn )nN una successione di funzioni derivabili su un intervallo I. Si supponga che
(i) le derivate fn0 convergano a una funzione g uniformemente sui compatti di I;
(ii) esista un punto x0 I tale che
lim fn (x0 ) = ` R .

Allora le funzioni fn convergono uniformemente sui compatti di I alla funzione f che soddisfa (4.1).

5. Convergenza uniforme di serie di funzioni e spazi vettoriali normati


I risultati dei paragrafi precedenti relativi alla convergenza uniforme di successioni di funzioni si applicano
allo studio della convergenza uniforme di una serie di funzioni. Naturalmente, si dice che la serie

X
fn
n=0

di funzioni a valori reali definite su uno stesso insieme E converge uniformemente su E alla funzione s se la
successione delle somme parziali
sn = f0 + + fn
converge uniformemente a s su E.
2Si vede facilmente che se una successione converge uniformemente su un insieme E, converge uniformemente su ogni
E 0 E. Quindi la convergenza uniforme sui compatti di un intervallo aperto (a, b) equivale alla convergenza uniforme su una
famiglia di sottointervalli [an , bn ] con inf n an = a e supn bn = b.

5. CONVERGENZA UNIFORME DI SERIE DI FUNZIONI E SPAZI VETTORIALI NORMATI

81

Come per le serie numeriche, importante avere a disposizione criteri di semplice verifica che assicurino
la convergenza uniforme di una serie di funzioni.
Vedremo pi`
u avanti il criterio di Weierstrass, che `e bene per`o inquadrare in un contesto pi`
u generale. Per
far questo, osserviamo che ha senso parlare di somma di una serie solo quando lo spazio ambiente `e dotato,
da un lato, di una struttura algebrica che consenta di calcolare somme finite di suoi elementi, e dallaltro, di
una topologia (meglio ancora una metrica) che consenta di calcolare limiti. Il caso che ci interessa `e quello
di particolari metriche definite su spazi vettoriali, e da questo cominciamo.
Definizione 5.1. Sia V uno spazio vettoriale su R. Si chiama norma su V una funzione
k k : V [0, +) ,
che soddisfi le seguenti propriet`
a:
(i) kvk = 0 se e solo se v = 0;
(ii) per ogni R e v V , kvk = ||kvk;
(iii) per ogni v, w V , kv + wk kvk + kwk.
Se k k `e una norma su V , la coppia (V, k k) si chiama uno spazio normato.
Il seguente enunciato stabilisce la corrispondenza tra norme su V e distanze con particolari propriet`
a.
La dimostrazione, molto semplice, `e lasciata al lettore.
Proposizione 5.2. Sia k k una norma su uno spazio vettoriale V . Allora
d(v, w) = kv wk
`e un distanza su V , detta distanza indotta dalla norma data, che gode delle ulteriori propriet`
a
(a) per ogni R e v, w V , d(v, w) = ||d(v, w);
(b) per ogni v, w, z V , d(v + z, w + z) = d(v, w).
Viceversa, ogni distanza d su V che soddisfi le propriet`
a (a) e (b) `e indotta da una norma, data da
kvk = d(v, 0) .
Esempi di distanze indotte da norme sono le distanze dp su Rn del 7.1 del Capitolo 5, nonche la distanza
(3.1) su B(E).
P
La somma di una serie n=0 vn di elementi di uno spazio vettoriale normato si definisce come il limite,
se esiste, della successione delle somme parziali
sn = v0 + + vn
nella topologia su V indotta dalla norma.
P
Definizione 5.3. Si pone s = n=0 vn se
n


X


lim s
vk = 0 .

k=0

Nello studio delle serie numeriche, `e particolarmente importante il criterio di convergenza assoluta. Ci
si pu`
o domandare se vale, per serie in spazi normati, un analogo criterio di convergenza normale:

X
X
?
kvn k < + =
vn converge.
n=0

n=0

La risposta `e positiva a condizione che lo spazio normato sia completo. Anzi, come ora vedremo, la
validit`
a dellimplicazione convergenza normale convergenza `e equivalente alla completezza dello spazio.
Teorema 5.4. Sia (V, k k) uno spazio vettoriale normato. Le due condizioni seguenti sono equivalenti:
(i) rispetto alla distanza indotta dalla norma k k, V `e completo;
P
(ii) data
n=0 kvn k < +, la serie
P comunque una successione (vn )nN di elementi di V tale che
v
converge
a
un
elemento
di
V
.
n=0 n

82

6. SUCCESSIONI E SERIE DI FUNZIONI

Dimostrazione. Supponiamo che valga la condizione (i) e sia (vn )nN tale che
Dato > 0. esiste dunque n0 tale che, per n > m n0 , kvm+1 k + + kvn k < .
Posto sn = v0 + + vn , si ha allora

n=0

kvn k < +.

d(sn , sm ) = ksn sm k = kvn+1 + + vm k kvn+1 k + + kvm k < ,


per n, m n0 . Per la completezza di V , si ha la convergenza delle somme sn a un elemento di V .
Supponiamo ora che valga la condizione (ii), e sia (xn )nN una successione di Cauchy in V rispetto alla
distanza indotta dalla norma.
Per ogni k N, esiste allora un indice nk tale che
1
n, m nk
kxn xm k < k .
2
Procedendo induttivamente su k, possiamo costruire la successione degli indici nk strettamente crescente.
Allora
1
kxnk+1 xnk k < k
2
per ogni k. Poniamo allora
(
v0 = x n0
vk =
vk = xnk xnk1 k 1 .
P
Siccome stiamo assumendo la condizione (ii), possiamo concludere che la serie k=0 vk converge in V .
Ma la ridotta p-esima di questa serie `e
p
X
v k = x np ,
k=0

per cui la sottosuccessione (xnk )kN della successione data converge.


Ma ogni successione di Cauchy in uno spazio metrico, che abbia una sottosuccessione convergente,
converge. Infatti, preso > 0, esistono
un indice n0 tale che d(xn , xm ) < per ogni n, m n0 ;
un indice k0 tale che, detto x il limite della sottosuccessione, d(x, xnk ) < per ogni k k0 .
Allora, se k k0 `e tale che nk n0 , si ha, per n n0 ,
d(x, xn ) d(x, xnk ) + d(xnk , xn ) < 2 .
Questo dimostra che (xn )nN converge, e dunque V `e completo.

Corollario 5.5 (Criterio di Weierstrass). Sia (fn )nN una successioni di funzioni a valori reali definite
su un insieme E, e si supponga che
(i) per ogni n N esiste una costante Mn 0 tale che, per ogni x E,


fn (x) Mn ;
P
(ii)
n=0 Mn < +.
P
Allora la serie n=0 fn converge uniformemente su E.
Dimostrazione. Per ipotesi, le funzioni fn sono in B(E) e


kfn k = sup fn (x) Mn .
xE

Quindi

kfn k < + .

n=0

Per il Teorema 3.3, B(E) `e completo e la tesi segue allora dal Teorema 5.4.
Si ha anche il seguente corollario del Teorema 4.3.

6. SERIE DI POTENZE

83

Teorema 5.6. Sia (fn )nN una successioni di funzioni derivabili su un intervallo I R e si supponga che
P
(i) la serie derivata n=0 fn0 converga
Puniformemente sui compatti di I;
(ii) esista un punto x0 I tale che n=0 f( x0 )n converga.
P
Allora la serie n=0 fn converge uniformemente sui compatti di I a una funzione derivabile e

X
0 X
fn =
fn0 (x)
n=0

n=0

per ogni x I.

6. Serie di potenze
Si chiama serie di potenze una serie di funzioni della forma

X
an (x x0 )n = a0 + a1 (x x0 ) + a2 (x x0 )2 + ,
n=0

dove i coefficienti an sono valori assegnati3. Il punto x0 si chiama il centro della serie.
Nella prima parte della trattazione, studieremo le serie di potenze in campo complesso, assumendo che
sia i coefficienti an , sia il centro x0 , sia la variabile x in C.Luso dei simboli z, z0 invece di x, x0 aiuter`
aa
ricordare che si `e in ambito complesso.
Non ci soffermiamo a osservare che il contenuto dei paragrafi precedenti di questo Capitolo si applica
senza modifiche a funzioni a valori complessi.
Il cambiamento di variabile z = w c trasforma una serie di potenze centrata in w0 in una serie di
potenze, nella variabile w, centrata in w0 = z0 + c. Per questo motivo enunceremo i risultati generali solo
per serie di potenze centrate in 0, cio`e della forma

X
an z n .
(6.1)
n=0

E evidente che la serie (6.1) converge per z = 0 (in generale nel suo centro), e la sua somma d`a a0 . E
possibile che il centro sia lunico punto di convergenza di una serie di potenze.
Si prenda ad esempio

X
nn z n .
n=0

Se z 6= 0,
lim |nn z n | = lim |nz|n = + ,

e la serie non pu`


o dunque convergere.
Indichiamo con E linsieme degli z C in cui la serie converge. Il lemma che segue `e alla base della
descrizione delle propriet`
a di E.
Lemma 6.1. Si supponga che la serie (6.1) converga in un punto z0 6= 0. Allora essa converge assolutamente
in ogni punto z con |z| < |z0 | e uniformemente su ogni disco chiuso di centro 0 e raggio r < |z0 |.
P
Dimostrazione. Dalla convergenza della serie n=0 an z0n , segue che limn0 an z 0n = 0 e dunque
che esiste una costante M > 0 tale che perr ogni n,
|an z0n | M .
Se |z| < |z0 |, si ha allora


n
zn
|z|

|an z n | = |an z0n | n M
.
z0
|z0 |

3Per n = 0 bisogna convenire che (x x )0 = 1 anche per x = x .


0
0

84

6. SUCCESSIONI E SERIE DI FUNZIONI

La serie geometrica di ragione |z|/|z0 | < 1 converge, e dunque si ha la prima parte della tesi.
La seconda parte della tesi si ricava facilmente, perche la disuguaglianza ottenuta dimostra anche che,
per ogni z con |z| r, si ha

n
r
|an z n | M
.
|z0 |
Basta dunque applicare il critero di Weierstrass.

Sia dunque

n
o
X
E= zC:
an z n converge .

(6.2)

n=0

Il seguente enunciato segue facilmente dal Lemma 6.1.


Teorema 6.2. Sia
R = sup |z| [0, +] .
zE

Allora ogni z con |z| < R `e in E. In particolare,


(i) se R = 0, E = {0};
(ii) se R = +, E = C;
(iii) se 0 < R < +, indicando con DR il disco aperto di centro 0 e raggio R,
DR E DR ,
e la serie converge uniformemente sui compatti di DR .
Il valore R si chiama il raggio di convergenza della serie (6.1). La dimostrazione del seguente enunciato
`e lasciata per esercizio.
P
P
Proposizione 6.3. Siano n=0 an z n e n=0 bn z n due serie di potenze centrate in 0 con raggi di convergenza R e R0 . Allora la loro somma e il loro prodotto alla Cauchy hanno raggi di convergenza maggiori o
uguali a min{R, R0 }.
Il raggio di convergenza `e esprimibile come funzione dei coefficienti della serie.
Proposizione 6.4. Data la serie (6.1), sia
` = lim sup

p
n
|an | [0, +] .

Allora
R=

1
,
`

con la convenzione che 1/0 = + e 1/(+) = 0.


Dimostrazione. Sia z 6= 0. Allora
p
p
lim sup n |an z n | = |z| lim sup n |an | = |z|` .
n

Per il criterio della radice, la serie converge se |z|` < 1 e non converge se |z|` > 1. La conclusione si
deduce facilmente.

P
Sia n=0 an z n una serie di potenze con raggio di convergenza R > 0. Chiamiamo f (z) la funzione
somma, definita sullinsieme di convergenza E in (6.2).
Teorema 6.5. La funzione f `e continua su DR .
Dimostrazione. Per la convergenza uniforme della serie sui compatti di DR , f `e continua su ognuno
di tali compatti. Ovviamente questo `e equivalente alla continuit`a su DR .


8. SERIE DI POTENZE E SERIE DI TAYLOR

85

7. Derivabilit`
a sullasse reale
P
Sia f (z) = n=0 an z n , dove la serie ha raggio di convergenza R > 0.
Restringiamo f a DR R = (R, R) e discutiamone la derivabilit`a. Per far questo consideriamo la serie
derivata

X
X
X
(7.1)
(an xn )0 =
nan xn1 =
(n + 1)an+1 xn .
n=0

n=1

n=0

Teorema 7.1. La serie (7.1) ha raggio di convergenza R. Quindi f `e derivabile su (R, R) e

X
f 0 (x) =
(n + 1)an+1 xn .
n=0

P
n1
n
Dimostrazione. Le due serie
e
n=1 nan x
n=1 nan x convergono per gli stessi valori di x.
Calcoliamo dunque
p
p


1
lim sup n n|an | = lim n n lim sup n |an | =
.
n
R
n
n
La conclusione segue dal Teorema 5.6.

Iterando lapplicazione di questo teorema alle derivate successive, si ottiene:
Corollario 7.2. La funzione f `e C su (R, R) e per ogni k N,

X
f (k) (x) =
(n + k)(n + k 1) (n + 1)an+k xn .
n=0

Esempi.
P
1. La serie n=0
(7.2)

xn
n

ha raggio di convergenza R = 1. Se f (x) `e la sua somma, si ha


f 0 (x) =

X
n=0

xn =

1
.
1x

Pertanto f `e una primitiva di 1/(1 x) sullintervallo (1, 1), ossia esiste c R tale che f (x) =
log(1 x) + c. Ma c = f (0) = 0, e dunque

X
xn
= log(1 x) .
n
n=0
2. In modo analogo si dimostra che per x (1, 1),

X
(1)n 2n+1
(7.3)
x
= arctan x .
2n + 1
n=0

8. Serie di potenze e serie di Taylor


Sia f una funzione definita in un intervallo I, derivabile infinite volte in un punto x0 I. La formula di
Taylor con resto di Peano `e dunque applicabile a ogni ordine n N:

f 00 (x0 )
f (n) (x0 )
f (x) = f (x0 ) + f 0 (x0 )(x x0 ) +
(x x0 )2 + +
(x x0 )n + o (x x0 )n
(x x0 ) .
2
n!
Si pu`
o quindi costruire la serie di Taylor

X
f (n) (x0 )
(x x0 )n
n!
n=0

86

6. SUCCESSIONI E SERIE DI FUNZIONI

e domandarsi se essa converge, almeno in un intorno di x0 , alla funzione f . La risposta `e in generale negativa
per due motivi:
la serie pu`
o avere raggio di convergenza nullo;
la serie pu`
o avere raggio di convergenza positivo, ma convergere a una funzione diversa da f .
Un esempio esplicito mostra che si pu`
o presentare la seconda possibilit`a. Si prenda
( 1
e x2
se x 6= 0
f (x) =
0
se x = 0 .
Si vede facilmente che f `e continua in x0 = 0. Dimostriamo per induzione che f ha derivate di ogni
ordine in 0 e che f (n) (0) = 0 per ogni n.
Si verifica facilmente, sempre per induzione, che f `e C su R \ {0} e che, per x 6= 0,
1 1
f (n) (x) = Pn
e x2 ,
x
dove i Pn sono polinomi. Allora, assumendo come ipotesi induttiva che f (n) (0) = 0, si ha che
f (n) (x) f (n) (0)
x0
 x

f (n+1) (0) = lim

Pn

= lim

1
x

e x2

x
2
= lim tPn (t)et
x0

=0,
perche, per ogni k,
2

et = o(e|t| ) = o(|t|k )

(t ) .

Quindi la serie di Taylor di f centrata in 0 ha tutti i termini identicamente nulli. Dunque ha raggio di
convergenza infinito ma non converge a f (x) per x 6= 0.
Che la prima possibilit`
a (raggio di convergenza nullo della serie di Taylor) sia concreta si ricava dal
seguente teorema, di cui tralasciamo la dimostrazione.
Teorema 8.1 (Teorema di Borel). Data una qualunque successione (bn )nN di numeri reali, esiste una
funzione f C su R tale che f (n) (0) = bn per ogni n.
Prendendo, ad esempio, bn = n!nnP
, e una corrispondente funzione f come nella tesi del teorema di Borel,

la serie di Taylor di f centrata in 0 `e n=0 nn xn , che ha raggio di convergenza nullo.


Queste considerazioni motivano la seguente definizione.
Definizione 8.2. Una funzione f si dice analitica sullintervallo I se `e C su I e, per ogni x0 I, la serie
di Taylor di f centrata in x0 converge a f in un intorno di x0 .
P
n
Teorema 8.3. Sia
n=0 an x una serie di potenze con raggio di convergenza R > 0 e sia f (x) la sua
somma. Allora f `e analitica in (R, R).
Dimostrazione. Per il Corollario 7.2, f `e C su (R, R). Inoltre, per ogni n,
f (n) (0) = n!an .
Dunque la serie di Taylor di f centrata in 0 `e la stessa serie
(R, R).

n=0

an xn , che dunque converge a f su

8. SERIE DI POTENZE E SERIE DI TAYLOR

87

Prendiamo ora un generico punto x0 (R, R). Sempre per il Corollario 7.2, la serie di Taylor di f
centrata in x0 `e


X
X
f (k) (x0 )
1 X
k
(n + k) (n + 1)an+k xn0 (x x0 )k
(x x0 ) =
k!
k! n=0
k=0
k=0
(8.1)





X
X
n+k
n
=
an+k x0 (x x0 )k .
k
n=0
k=0

Consideriamo la sommatoria su N a termini positivi


X n + k 
|an+k ||x0 |n |x x0 |k ,
k
(k,n)N2


2
e partizioniamo N negli insiemi Ep = (n, k) : n + k = p . Si ha
X n + k 
p
|an+k ||x0 |n |x x0 |k = |ap | |x0 | + |x x0 | ,
k
(k,n)Ep

e, per il Teorema 3.5 del Capitolo 4,


X n + k 
k

(k,n)N2

|an+k ||x0 |n |x x0 |k =

p
|ap | |x0 | + |x x0 | .

p=0

Questultima serie converge per |x0 | + |x x0 | < R, condizione che individua il massimo intervallo
centrato in x0 e contenuto in (R, R). Chiamiamo Ix0 tale intervallo. Dunque per x Ix0 la sommatoria
X n + k 
an+k xn0 (x x0 )k
k
2
(k,n)N

converge, e pertanto la serie di Taylor (8.1) pu`o essere ricombinata come serie in p delle sommatorie sugli
insiemi Ep . Ma
X n + k 
an+k xn0 (x x0 )k = ap xp ,
k
(k,n)Ep

per cui concludiamo che, per x Ix0 ,

X
f (k) (x0 )
k=0

k!

(x x0 )k =

ap xp = f (x) .

p=0

Sia f una funzione C in un intorno di x0 . Concretamente, il problema della convergenza a f in un


intorno U = (x0 , x0 + ) di x0 della sua serie di Taylor centrata in x0 si riduce a dimostare che, per
x U , il resto dello sviluppo di Taylor allordine n,
n
X
f (k) (x0 )
Rn (x) = f (x)
(x x0 )k ,
k!
k=0

tende a 0 per n .
In molti casi, la questione si risolve facendo uso di una delle due formule del resto Rn , la forma di
Lagrange e la forma integrale.
Teorema 8.4.
(i) (Resto in forma di Lagrange) Si supponga che f sia derivabile n volte in x0 e che, in U \ {x0 },
esista anche f (n+1) . Allora, per ogni x U \ {x0 }, esiste un punto tx , strettamente compreso tra
x0 e x, tale che
f (n+1) (tx )
Rn (x) =
(x x0 )n .
(n + 1)!

88

6. SUCCESSIONI E SERIE DI FUNZIONI

(ii) (Resto in forma integrale) Si supponga che f sia derivabile n + 1 volte in U . Allora, per ogni
x U \ {x0 },
Z
1 x
Rn (x) =
(x t)n f (n+1) (t) dt .
n! x0
La dimostrazione della formula (i) `e parte del normale programma di un corso di Analisi. La dimostrazione di (ii) si ottiene per induzione con una semplice integrazione per parti.
Esempio.
Per R si consideri la funzione
f (x) = (1 + x) ,
che `e C sulla semiretta (1, +) qualunque sia . Trascurando il caso N, in cui f si riduce a un
polinomio, negli altri casi non si ha prolungamento C fuori da questa semiretta.
Essendo
f(n) (x) = ( 1) ( n + 1)(1 + x)n ,
Il resto Rn (x) della formula di Taylor in forma integrale `e
Z
( 1) ( n) x
(x t)n (1 + t)n1 dt .
Rn (x) =
n!
0
Ponendo
 

( 1) ( n + 1)
,
=
n!
n
la serie di Taylor centrata in 0 `e
 
X

(8.2)

n=0

xn ,

detta serie binomiale. Per 6 N, la serie (8.2) ha raggio di convergenza 1. Per |x| < 1 si ha
Z x


Rn (x) ( 1) ( n)
|x t|n (1 + t)n1 dt
n!
0
( 1) ( n) Z x  |x t| n


=
(1 + t)1 dt .

n!
1
+
t
0
Si vede facilmente che, per x (1, 1) fissato, il rapporto |x t|/(1 + t) `e limitato superiormente, al
variare di t tra 0 e x, da una costante cx < 1. Quindi


Z x



1 n
1

Rn (x) ( 1) ( n) cnx



cx .
(1 + t)
dt = (1 + x) 1

n!
n
0
Applicando il criterio del rapporto, si ottiene che limn Rn (x) = 0. Dunque
 
X

n=0

per x (1, 1).

xn = (1 + x)

9. IL LEMMA DI ABEL

89

9. Il Lemma di Abel
P
Sia n=0 an z n una serie di potenze di raggio R, finito e strettamente positivo. Supponiamo che in un
dato punto z0 con |z0 | = R la serie converga. Il Teorema 6.5 non dice nulla sulla continuit`a della funzione
somma in z0 .
Per esempio, sappiamo che la serie logaritmica (7.2)

X
xn
n
n=1

converge in [1, 1) e che la somma `e uguale a log(1 x) per x (1, 1). Non possiamo per`o dire se, per
x = 1, la somma della serie (cio`e della serie armonica a segni alterni con primo termine negativo) `e uguale
a log 2. Per ottenere questa conclusione, sarebbe utile sapere che la serie converge uniformemente su un
intervallo comprendente il punto 1, diciamo su [1, 0].
Vedremo in questo paragrafo che la convergenza in z0 implica la convergenza uniforme sul raggio congiungente 0 a z0 , ma anche su certi sottoinsiemi chiusi del disco DR detti non tangenziali, o angoli di Stolz.
Con vertice in z0 , si consideri un angolo di ampiezza 2 < , avente per bisettrice il raggio congiungente 0
a z0 e troncato in modo da non contenere punti di modulo R allinfuori di z0 . Non `e importante come si
effettua il troncamento, perche la differenza tra due regioni cos` costruite per lo stesso valore di `e comunque
un sottoinsieme compatto del disco aperto DR , e su di esso si ha gi`a la convergenza uniforme della serie per
il Teorema 6.2. Indichiamo con Sz0 , una tale regione.
6
.....................................................
.........................
...............
...............
............
............
..........
..........
.........
.
.
.
.
.
.
.
.
........
......
.
.
.
........
.
.
.
....
.......
.
.
.
.
.
.
.......
....
.
.
.
.
......
.
.
....
......
0
.
.
.
.
.
......
.....
.
.
....
.
..
.
....
.
.
..
....
.
.
.
....
..
...........
....
....
.........
....
....
........
...
...
.......
...
......
...
.
...
.
......
...
...
.
.
.
.....
...
..
....
.
...
....
..
.
...
....
..
.
...
...
..
.
.
...
...
...
...
....
...
...
...
.
..
...
..
z0 ,
...
..
..
...
..
..
...
..
...
..
..
...
.
..
..
..
..
..
..
..
.
..
..
..
.
..
..
..
..
...
..
...
...
...
....
...
..
...
...
...
..
...
..
.
.
...
.
...
...
...
...
...
...
...
...
.
....
.
.
..
....
....
....
....
....
....
....
...
.
.....
.
.
......
......
......
......
.......
......
.......
.......
........
.......
.
.
.
.
........
.
.
......
.........
.........
..........
..........
............
...........
..............
..............
......................
..............................................................





 S

P
Teorema 9.1. (Lemma di Abel). Sia R (0, +) il raggio di convergenza della serie n=0 an z n , e
si supponga che essa converga in un punto z0 con |z0 | = R. Allora essa converge uniformemente in ogni
regione di Stolz Sz0 , , con 0 < 2 .

90

6. SUCCESSIONI E SERIE DI FUNZIONI

Dimostrazione. Il cambiamento di variabile z = z0 w trasforma la serie data nella serie

an z0n wn

n=0

nella variabile w. Essa converge in un punto w se e solo se la serie data converge in z0 w. Dunque ha raggio
di convergenza 1 e converge per w = 1. Inoltre essa converge uniformemente su un insieme A se e solo se la
serie data converge uniformemente sullinsieme z0 A = {z0 w : w A}.
modo possiamo ricondurre la dimostrazione del teorema al caso particolare in cui la serie
PIn questo
n
a
z
abbia
raggio di convergenza R = 1 e il punto di convergenza sul bordo sia z0 = 1.
n=0 n
Unaltra semplificazione della dimostrazione consiste nel ridursi al caso in cui il valore della somma in
z0 = 1 `e uguale a 0, cio`e

(9.1)

an = 0 .

n=0

Ci`
o si ottiene modificando opportunamente il coefficiente iniziale a0 . Questa variazione non altera gli
insiemi di convergenza puntuale e uniforme della serie.
Assumendo dunque questa ipotesi, poniamo
s(z) =

ak z k ,

sn (z) =

n
X

ak z k ,

An = sn (1) =

ak .

k=0

k=0

k=0

n
X

Sommando per parti, si ottiene, per ogni z C,


sn (z) = a0 + a1 z + an z n
= a0 (1 z) + (a0 + a1 )(z z 2 ) + + (a0 + a1 + + an1 )(z n1 z n )
+ (a0 + a1 + + an )z n

(9.2)
=

n1
X

Ak (z k z k+1 ) + An z n .

k=0

Per la (9.1), limn An = 0, per cui il termine An zn converge uniformemente a 0 sul disco chiuso
B(0, 1). Inoltre, si ottiene dalla (9.2) che


Ak (z k z k+1 ) = lim sn (z) An z n = s(z) ,
n

k=0

in tutti i punti in cui la serie data converge. Quindi, per |z| 1,

n1
X

X


|s(z) sn (z)| =
Ak (z k z k+1 )
Ak (z k z k+1 ) An z n
k=0

k=0

X



=
Ak (z k z k+1 ) An z n
k=n

|Ak ||z k z k+1 | + |An | .

k=n

Dato > 0, si fissi n0 tale che |An | < per ogni n n0 . Si ha allora, per n n0 e |z| 1,

X

|s(z) sn (z)|
|z k z k+1 | + 1
k=n

X


|z k z k+1 | + 1 .
k=0

9. IL LEMMA DI ABEL

91

Restringiamoci ora a z S1, con < /2. Poiche i punti di S1, , tranne il punto 1, hanno modulo
strettamente minore di 1, si ha

0
se z = 1
X
X
|z k z k+1 | =
|1 z||z|k = |1 z|

se z S1, \ {1} .
k=0
k=0
1 |z|
Dunque, per n n0 ,

sup |s(z) sn (z)|
zS1,


|1 z|
+1 .
zS1, \{1} 1 |z|
sup

La dimostrazione `e conclusa se si dimostra che questo estremo superiore `e finito.


Per far questo usiamo un argomento di geometria elementare. Si prenda S1, come in figura, delimitato
dalle due semirette uscenti dal punto 1 e da una circonferenza centrata in 0 e secante le due semirette.
Sia z un punto di S1, distinto da 1, che possiamo supporre nel semipiano superiore. La figura evidenzia
il punto |z| sul raggio da 0 a 1, il punto z 0 di intersezione della retta verticale passante per |z| con il segmento
congiungente 1 a z, e langolo formato da questo segmento e dal raggio da 0 a 1.

@
@...........
@............
....
...
@
...
...
...
@
..

...
...
... ...
... ...
... ...
... ...
... ...
... ...
... ...
.. ...
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ...
.. ..
.. ...
.. ...
.. .
..
.
...
...
...
...
..
..
..
..
....
..
...
...
....
..
...
...
..
.
...
...
..
...
.
.
..
...
...
....
....
.
.
.
..
....
....
....
...
.
.
.
..
....
......
......
......

...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
..
1,
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
...
...
...
...
..
....
....
....
...
.
..
..
..
..
...
.
..
..
..
..
...
..
...
...
....
..
...
...
..
.
...
...
...
..
.
...
...
..

@
S
z @0
z
@
Z
Z
Z@
Z@
Z
@
Z
@
Z 1
|z|

Si ha allora


|z z 0 | z 0 |z| ,
e dunque


|1 z| = |1 z 0 | + |z 0 z| |1 z 0 | + z 0 |z|

 1
= 1 |z|
+ tan
cos


2
2

1 |z|
1 |z| ,
cos
cos
come volevasi dimostrare.

92

6. SUCCESSIONI E SERIE DI FUNZIONI

10. Alcune serie notevoli


Elenchiamo alcune serie di potenze (centrate in 0) di particolare rilevanza, con lespressione della funzione
somma e il relativo raggio di convergenza.
Tabella 1. Alcune serie di uso frequente

X
1 n
x
n!
n=0

ex

R=

X
(1)n 2n+1
x
(2n + 1)!
n=0

sin x

X
(1)n 2n
x
(2n)!
n=0

cos x

sinh x

1
x2n+1
(2n
+
1)!
n=0

1
x2n
(2n)!
n=0

cosh x

X
(1)n1 n
x
n
n=1

log(1 + x)

1
x2n+1
2n
+
1
n=1

X
(1)n 2n+1
x
2n + 1
n=1
 
X

n=0

10

xn

 
1
2n 2n+1
x
n
(2n + 1)4
n
n=0

1
2

log

1+x
1x

arctg x

(1 + x)

1 ( 6 N)

arcsin x

CAPITOLO 7

` VARIABILI
CALCOLO DIFFERENZIALE IN PIU
Si danno per note le nozioni fondamentali di algebra lineare.

1. Derivate parziali e direzionali


Prendiamo una funzione f definita su un insieme A Rn a valori reali.
Definizione 1.1. Sia x
= (
x1 , . . . , x
n ) un punto interno ad A. Si chiama derivata parziale di f in x
nella
variabile xj la derivata nel punto x
j , se esiste, della funzione di una variabile
g(xj ) = f (
x1 , . . . , x
j1 , xj , x
j+1 , . . . , x
n ) ,
cio`e si pone
f (
x1 , . . . , x
j1 , x
j + h, x
j+1 , . . . , x
n ) f (
x)
f
,
(
x) = lim
h0
xj
h
se questo limite esiste finito.
Il calcolo della derivata parziale nella variabile xj si effettua dunque congelando le variabili diverse
dalla j-esima e considerando variabile solo la xj .
La definizione di derivata direzione `e pi`
u generale.
Definizione 1.2. Siano f , A e x
come sopra. Dato v 6= 0 in Rn , si chiama derivata direzionale di f rispetto
a v in x
la derivata in 0, se esiste, della funzione di una variabile g(t) = f (
x + tv), cio`e si pone
v f (
x) = lim

t0

f (
x + tv) f (
x)
,
t

se questo limite esiste finito.


Ovviamente, se ej = (0, . . . , 1, . . . , 0) `e il versore j-esimo della base canonica di Rn ,
ej f (
x) =

f
(
x) .
xj

Vediamo linterpretazione grafica della derivata direzionale per funzioni di due variabili. Supponiamo
che v = (a, b) R2 sia un versore, cio`e |v| = 1. Intersecando il grafico di f in R3 ,



Gf = x1 , x2 , f (x1 , x2 ) : (x1 , x2 ) A ,
con il piano verticale affine passante per p = (
x1 , x
2 , 0) e parallelo al sottospazio generato dai due vettori
w1 = (a, b, 0) e w2 = (0, 0, 1), si ottiene linsieme di punti
p + tw1 + uw2 : u = f (
x + tv) .
Quindi v f (
x) rappresenta il coefficiente angolare della tangente a questo grafico.
La definizione di derivata direzionali `e data anche per vettori non normalizzati1. Ovviamente, per R,
v f (
x) = v f (
x) .
1Si pu`
o anche aggiungere 0 f (
x) = 0, qualunque sia f , anche si perde il significato geometrico di questo valore.
93

` VARIABILI
7. CALCOLO DIFFERENZIALE IN PIU

94

Si osservi, che a differenza di quanto succede con funzioni di una variabile, lesistenza di tutte le derivate
parziali di una funzione in un punto non implica la continuit`
a nel punto stesso. La funzione (8.2) del
Capitolo 5, che `e discontinua nellorigine, ha tutte le derivate direzionali, uguali a 0, in quel punto.
2. Differenziale
Per funzioni di una variabile, le due seguenti propriet`a sono equivalenti:
(i) f `e derivabile in x0 ;
(ii) esiste una funzione lineare g(h) = ah che approssimi lincremento di f da x0 a x0 + h a meno di
un infinitesimo superiore al primo, cio`e tale che f (x0 + h) f (x0 ) = g(h) + o(h) per h 0.
Si verifica quindi che, quando queste condizioni sono verificate, la costante a `e univocamente determinata
ed `e uguale a f 0 (x0 ).
Proviamo a riformulare le due propriet`a per funzioni di pi`
u variabili nel modo seguente:
(i) f ha tutte le derivate direzionali in x
;
(ii) esiste una funzione lineare da Rn a R, g(h) = a1 h1 + + an hn = a h, che approssimi lincremento
di f da x
ax
+ h a meno di un infinitesimo superiore al primo, cio`e tale che

(2.1)
f (
x + h) f (
x) = g(h) + o |h|
(h 0) .
Siccome g `e continua in 0, la condizione (ii) implica che
(2.2)

lim f (x) = f (
x) ,

x
x

cio`e che f `e continua in x


. Per quanto visto nel paragrafo precedente, la (i) non implica la continuit`
a di f
in x
, e dunque le due condizioni non sono equivalenti.
Definizione 2.1. Siano A Rn e x
interno ad A. Si dice che f : A R `e differenziabile in x
se esiste
una funzione lineare g di Rn in R per cui valga la (2.1).
Teorema 2.2. Sia f differenziabile in x
. Allora
(i) f `e continua in x
;
(ii) f ammette derivate direzionali rispetto a ogni vettore v Rn e
v f (
x) = a v .
In particolare,
f
(
x) = aj ;
xj
(b) la funzione lineare g(h) = a h per cui vale la (2.1) `e unica.
(a) per ogni j = 1, . . . , n,

Dimostrazione. La (i) `e gi`


a stata dimostrata con la (2.2).
Per dimostrare la (ii), si supponga che valga la (2.1) con g(h) = a h. Allora, dato v Rn ,

f (
x + tv) f (
x) = ta v + o |tv| = ta v + o(t) ,
da cui

f (
x + tv) f (
x)
=av .
t0
t
A questo punto, le conseguenze (a) e (b) sono ovvie.
lim

Con il cambiamento di variabile x = x


+ h, si ottiene la formula seguente.
Corollario 2.3. Sia f dotata di derivate parziali in x
. Allora f `e differenziabile in x
se e solo se ammette
lo sviluppo al primo ordine per x x

n
X

f
(2.3)
f (x) = f (
x) +
(
x)(xj x
j ) + o |x x
|
(x x
) .
x
j
j=1

2. DIFFERENZIALE

Definizione 2.4.
Il vettore
x f =

95

 f

f
(
x), . . . ,
(
x)
x1
xn

si chiama il gradiente di f in x
.
Lapplicazione lineare
dx f (h) = (x f ) h
si chiama il differenziale di f in x
.
Liperpiano di Rn+1 , con coordinate (x1 , . . . , xn , y), di equazione
y = f (
x) + (x f ) (x x
)
si chiama iperpiano tangente (spesso anche piano tangente) al grafico di f in x
.
Quando f `e differenziabile in x
, il piano tangente in x
`e lunione delle rette tangenti ai grafici ottenuti
su ciascun piano (bidimensionale) verticale passante per (
x, 0) intersecandolo con il grafico di f .
Definizione 2.5. Un punto x
in cui una funzione f `e differenziabile si dice stazionario se x f = 0.
Questo equivale a dire che tutte le derivate direzionali in x
sono nulle, o anche che il piano tangente al
grafico in x
`e orizzontale (cio`e di equazione y =costante).
Proposizione 2.6. Sia f differenziabile in x
e sia x
non stazionario. Poniamo allora
x f = |x f |v0 ,
dove v0 `e il versore di x f . Al variare di v tra i versori di Rn , la derivata direzionale v f (
x) assume valore
massimo per v = v0 , e v0 f (
x) = |x f |.
Dimostrazione. Per ogni versore v,
v f (
x) = (x f ) v = |x f |(v0 v) .
Per la disuguaglianza di Cauchy-Schwarz (Teorema 1.2 del Capitolo 5), |v0 v| 1 e vale luguaglianza
se e solo se v = v0 . Ma allora v0 v assume valore massimo, uguale a 1, se e solo se v = v0 .

Possiamo dire che x f indica la direzione di massima pendenza del grafico di f in x0 , e il suo verso
quello di massima crescita.
La condizione di differenziabilit`
a in un punto consente, note le derivate parziali nel punto2, di determinare
tutte le altre derivate direzionali. Infatti, se v = (v1 , . . . , vn ) = v1 e1 + + vn en ,
v f (
x) =

n
X
j=1

vj

f
(
x) .
xj

In altri termini, i valori delle derivate direzionali sono vincolati ai valori delle derivate parziali.
Questo non succede in generale se la funzione, pur avendo tutte le derivate direzionali in un punto, non
`e ivi differenziabile, come mostra lesempio seguente.
Esempio.
In R2 introduciamo le coordinate polari
(
x1 = r cos
(2.4)
x2 = r sin

(r 0) .

Sia () una qualunque funzione continua, periodica di periodo 2 e tale che


( + ) = ()
2Oppure note le derivate direzionali rispetto ai vettori di una base di Rn .

` VARIABILI
7. CALCOLO DIFFERENZIALE IN PIU

96

per ogni . Poniamo quindi


f (r cos , r sin ) = r() .
Si osservi che una qualunque retta in R2 passante per lorigine `e lunione di due semirette determinate
dai due versori opposti

v0 = (cos 0 , sin 0 ) ,
v0 = cos(0 + ), sin(0 + ) .
Ma allora

(
t(0 )
f (tv0 ) =
|t|(0 + ) = t(0 )

se t 0
se t < 0 .

Ne segue che, per ogni , f (tv ) `e lineare in t. Dunque f ha tutte le derivate direzionali in 0, e anzi il
suo grafico `e lunione delle rette tangenti sui vari piani verticali passanti per lorigine.
Ma si vede facilmente (esercizio) che le rette tangenti giacciono sullo stesso piano se e solo se `e della
forma
() = a + b sin + c cos ,
il che non `e sempre verificato (per es. per () = sin 3).
3. Il teorema del differenziale totale
Il Teorema che presentiamo fornisce condizioni sufficienti per la differenziabilit`a di una funzione in un
punto. Esso `e utile sia per gli sviluppi teorici che nel calcolo concreto con funzioni di pi`
u variabili.
Teorema 3.1 (Teorema del differenziale totale). Sia f dotata di derivate parziali in un intorno di un
punto x
Rn . Se tali derivate sono continue in x
, allora f `e differenziabile in x
.
Dimostrazione. Possiamo supporre che lintorno di x
su cui esistono le derivate parziali di f sia
convesso, per esempio una palla Bx,r . Dimostriamo che vale la formula (2.3) partendo dalluguaglianza, per
x Bx,r ,


f (x) = f (x) f (x1 , . . . , xn2 , xn1 , x
n ) + f (x1 , . . . , xn2 , xn1 , x
n ) f (x1 , . . . , xn2 , x
n1 , x
n )

(3.1)
+ + f (x1 , x
2 , . . . , x
n ) f (
x) + f (
x)
= n (x) + n1 (x) + 1 (x) + f (
x) .
Per ogni j = 1, . . . , n, la differenza j (x) rappresenta lincremento da x
j a xj della funzione di una
variabile
hj (t) = f (x1 , . . . , xj1 , t, x
j+1 , . . . , x
n ) .
Per ipotesi, hj `e derivabile su un intervallo aperto contenente x
j e xj e
h0j (t) =

f
(x1 , . . . , xj1 , t, x
j+1 , . . . , x
n ) .
xj

Applicando il Teorema di Lagrange, otteniamo che esiste tj = tj (x), strettamente compreso tra x
j e xj ,
tale che
f
j (x) =
(x1 , . . . , xj1 , tj , x
j+1 , . . . , x
n ) (xj x
j ) .
xj
Essendo le derivate parziali continue in x
, dato > 0, esiste > 0 tale che, per ogni j,
f

f


y Bx, =
(y)
(
x) < .
xj
xj
Per l convessit`
a delle palle, se prendiamo x Bx, , anche i punti yj = (x1 , . . . , xj1 , tj , x
j+1 , . . . , x
n )
sono in Bx, . Quindi


f


(
x)(xj x
j ) < |xj x
j | |x x
| ,
j (x)
xj

4. CURVE REGOLARI IN Rn

97

per x Bx, . In altri termini,


(3.2)

j (x) =


f
(
x)(xj x
j ) = o |x x
|
xj

(x x
) .

6
(
x1 , x2 )

(t1 , x2 )

(x1 , x2 )

(
x1 , t2 )

(
x1 , x
2 )

Inserendo le n espressioni (3.2) nella (3.1) si ha la tesi.

Definizione 3.2. Una funzione f definita su un aperto A Rn si dice di classe C 1 su A se ammette le n


derivate parziali in ogni punto di A e le funzioni f /xj sono continue su A.
Chiararmente una funzione di classe C 1 su un aperto A `e continua in A e la funzione
f : A Rn
`e pure continua su A.
Definizione 3.3. Sia A Rn aperto. Una funzione continua V : A Rn si dice un campo vettoriale su
A. Una funzione f : A R si chiama un potenziale di V se V = f su A.3
4. Curve regolari in Rn
Sia I R un intervallo aperto, e = (1 , . . . , n ) : I Rn una curva.
Definizione 4.1. Se ogni componente 1 , . . . , n di `e derivabile in t I, il vettore

0 (t) = 10 (t), . . . , n0 (t)
si chiama il vettore tangente a in t.
La curva si dice regolare su I se ciascuna componente j di `e di classe C 1 in I e i vettori tangenti
sono diversi da 0 per ogni t I.
Si noti che non ha senso parlare di vettore tangente a in un punto x del sostegno quando la curva non
`e semplice. E possibile che x = (t1 ) = (t2 ), ma 0 (t1 ) 6= 0 (t2 ). Anche per questo motivo il riferimento
alla parametrizzazione della curva `e essenziale.
Applicando la (2.1) a ogni componente j di , si ottiene lenunciato seguente.
3In Fisica, se V = f

` VARIABILI
7. CALCOLO DIFFERENZIALE IN PIU

98

Lemma 4.2. Siano : I Rn una curva regolare, t I, x = (t), v = 0 (t). La retta parametrica
r(h) = x + hv `e lunica che soddisfi la condizione
(t + h) = r(h) + o(h)

(h 0) .

Sia ora f una funzione di classe C 1 su un aperto A e sia : I A una curva regolare in A. Allora la
composizione f : I R `e derivabile in I.
Proposizione 4.3 (Regola di derivazione in catena). La funzione f `e derivabile in I e
n
X

f
(f ) (t) =
(t) j0 (t) = (t) f 0 (t) .
xj
j=1
0

Dimostrazione. Siano t I, x
= (t) A. Per il Corollario 2.3,

f (x) = f (
x) + x f (x x
) + o |x x
|
(x x
) .
Sostituendo x = (t + h) e usando il Lemma 4.2, si ha, per h 0,

f (t + h) = f x
+ h 0 (t) + o(h)



= x f h 0 (t) + o(h) + o h 0 (t) + o(h)


Essendo h 0 (t) + o(h) = O(h) per h 0, lultimo termine `e o(h), e dunque
f (t + h) = x f h 0 (t) + o(h) .
Da questo segue la tesi.

Tra curve regolari si pone una relazione di equivalenza pi`


u fine di quella data nella Definizione 8.3 del
Capitolo 5.
Definizione 4.4. Siano : I Rn e : J Rn due curve regolari. Si pone se esiste una funzione
: I J di classe C 1 , con 0 (t) > 0 per ogni t I e tale che = .
Alla relazione si applica quanto detto per la relazione nel Capitolo 5. Vale inoltre la seguente
propriet`
a:
siano , con = . Allora

0 (t) = 0 (t) 0 (t) .
In altri termini, i vettori tangenti di e per valori corrispondenti dei rispettivi parametri hanno stessa
direzione e stesso verso. Le rette tangenti coincidono, a meno della parametrizzazione, e hanno lo stesso
orientamento.
5. Curve regolari e grafici
Sia f una funzione di classe C 1 su un intervallo aperto I R a valori reali. Allora la curva

(5.1)
(t) = t, f (t)
tI ,
`e semplice, il suo sostegno `e il grafico di f ed `e orientata con percorrenza da sinistra a destra. Inoltre `e
regolare, essendo

0 (t) = 1, f 0 (t) 6= 0 .
Vediamo ora che ogni curva regolare `e localmente equivalente (nel senso di ) a un grafico orientato in
uno dei due versi opposti.
Lemma 5.1. Sia = (1 , 2 ) : I R2 una curva regolare, e si supponga che 10 (t) > 0 per ogni t I.
Allora , con della forma (5.1), con f di classe C 1 .

6. FUNZIONI IMPLICITE

99

Dimostrazione. La funzione 1 applica in modo biiettivo I su un intervallo J. Ponendo f = 2 11


e = 1 , la curva = 11 : J R2 ha la forma (5.1) ed `e equivalente a .

Teorema 5.2. Sia : I R2 una curva regolare. Per ogni t I esiste un intorno It di t tale che |It sia

equivalente a , con della forma (5.1), oppure a 0 , con 0 (s) = g(s), s .
Dimostrazione. Per ogni t I, 0 (t) 6= 0. Supponiamo che 10 (t) > 0. Essendo 10 continua su I, esiste
un intorno It di t su cui 10 > 0. Ricadiamo quindi nelle ipotesi del Lemma 5.1. Se 10 (t) < 0, basta sostituire
con per ricadere nel caso precedente.
In modo analogo si procede, a componenti scambiate, se 20 (t) 6= 0.

Questo teorema ammette una naturale estensione a curve in Rn . Enunciamo solo il lemma che estende
il Lemma 5.1.
Lemma 5.3. Sia = (1 , . . . , n ) : I Rn una curva regolare, e si supponga che 10 (t) > 0 per ogni t I.
Allora , con

(s) = s, f2 (s), . . . , fn (s) ,
con f2 , . . . , fn di classe C 1 .
6. Funzioni implicite
Sia f : A R una funzione definita su A Rn , con n 2. Dato a R, linsieme


(6.1)
Ea = x A : f (x) = a ,
si chiama un insieme di livello della funzione f . Si vuole conoscere la natura di questo insieme, e in
particolare si vuol sapere se esso coincide con il grafico di una funzione di n 1 variabili, cio`e, a meno di
una rinumerazione delle variabili,


Ea = x0 , g(x0 ) : x0 = (x1 , . . . , xn1 ) B} ,
con B Rn1 .
In altri termini, data lequazione
f (x1 , . . . , xn ) = a ,
si vuole sapere se si pu`
o esplicitare una delle n variabili in funzione delle altre, cio`e stabilire che, per qualche j,
lequazione `e equivalente a
xj = g(x1 , . . . , xj1 , xj+1 , . . . , xn ) .
Quando questo succede, si dice che la funzione g `e implicitamente definita dallequazione f (x) = a.
E ben noto che la risposta generale a questo problema `e negativa, anche con funzioni f molto regolari,
per es., come supporremo dora in poi, di classe C 1 su A aperto. Linsieme Ea pu`o essere
vuoto: x21 + x22 = 1,
discreto: x21 + x22 = 0,
non rappresentabile come grafico: x21 x22 = 0,
rappresentabile come grafico, ma non di una funzione derivabile: x21 x32 = 0,
non rappresentabile come un unico grafico, ma scomponibile nellunione di pi`
u grafici: x21 + x22 = 1,
ecc.
Accontentiamoci dunque di porre il problema nella forma seguente:
dare condizioni sulla funzione f , di classe C 1 sullaperto A, perche, noto un punto x
Ea , si possa
concludere che esiste un intorno U di x
tale che Ea U sia il grafico di una funzione C 1 di n 1 variabili.
Per semplicit`
a, discuteremo il problema per funzioni f di due variabili (che indicheremo con x, y anziche
x1 , x2 ), anche se le conclusioni che trarremo ammettono naturali estensioni a funzioni di pi`
u variabili.
Partiamo da questa osservazione.

` VARIABILI
7. CALCOLO DIFFERENZIALE IN PIU

100

Lemma 6.1. Siano A aperto di R2 , f di classe C 1 su A e : I A una curva regolare con sostegno
contenuto nellinsieme di livello Ea di f . Allora, per ogni t I, i vettori 0 (t) e (t) f sono ortogonali.
Dimostrazione. La funzione composta f `e di classe C 1 su I e costantemente uguale ad a. Per la
Proposizione 4.3,
(t) f 0 (t) = (f )0 (t) = 0 ,
per ogni t I.

La relazione di ortogonalit`
a `e certamente verificata se il punto (x, y) = (t) `e stazionario per f , indipendentemente dalla direzione di 0 (t). Ma si noti che negli esempi elencati sopra sono proprio i punti stazionari
quelli in cui si verificano irregolarit`
a dellinsieme di livello.
Per poter formulare un risultato positivo, `e dunque opportuno limitarsi a punti di Ea che non siano
stazionari per f .
Supponiamo allora che y = g(x) sia implicitamente definita, nellintorno di un punto non stazionario

(
x, y) Ea , dallequazione f (x, y) = a, con g di classe C 1 sullintervallo I, e poniamo (t) = t, g(t) . Allora
vale lidentit`
a
(6.2)
Deve necessariamente essere

f
f
(
x, y) +
(
x, y)g 0 (t) = 0 .
x
y
f
(
x, y) 6= 0, perche altrimenti si annullerebbe anche laltra derivata
y

parziale.
Il teorema che segue mostra che questa condizione `e anche sufficiente per poter esplicitare y in funzione
di x nellintorno di (
x, y).
Teorema 6.2 (Teorema delle funzioni implicite in R2 ). Sia f di classe C 1 sullaperto A di R2 , e sia
f
(
x, y) A tale che
(
x, y) 6= 0. Esiste allora un intorno U = (
x 1 , x
+ 1 ) (
y 2 , y + 2 ) di (
x, y)
y
tale che, posto a = f (
x, y), linsieme U Ea sia il grafico y = g(x), con g di classe C 1 su (
x 1 , x
+ 1 ).
Inoltre,

(6.3)

f
x, g(x))
,
g 0 (x) = x
f
x, g(x))
y

per ogni x (
x 1 , x
+ 1 ).
Dimostrazione. Possiamo supporre che a = 0 e che

f
(
x, y) > 0.
y

f
> 0.
y
La funzione hx (y) = f (
x, y) `e dunque strettamente crescente su [
y , y + ], per cui
Fissiamo un rettangolo chiuso iniziale [
x , x
+ ] [
y , y + ] su cui

f (
x, y ) < 0 ,

f (
x, y + ) > 0 .

Esiste allora 1 , 0 < 1 , tale che, per ogni x [


x 1 , x
+ 1 ],
f (x, y ) < 0 ,

f (x, y + ) > 0 .

Per il Teorema di esistenza degli zeri, per ogni x [


x 1 , x
+ 1 ], la funzione hx (y) = f (x, y) si
f
0
annulla sullintervallo [
y , y + ]. Essendo hx (y) =
(x, y) > 0, hx si annulla in un unico punto, che
y
chiamiamo g(x).

6. FUNZIONI IMPLICITE

101

6
+

(
x + , y + )

x, y)
(

(
x , y )

La funzione g `e dunque implicitamente definita dallequazione f (x, y) = 0 in un intorno di (


x, y).
Vogliamo dimostriare ora che g ammette derivata continua su (
x 1 , x
+ 1 ).
Mostriamo innanzitutto che g `e continua (anzi Lipschitziana) su [
x 1 , x
+ 1 ]. Prendiamo due punti

x e x + h in tale intervallo e poniamo
k
=
k(h)
=
g(x
+
h)

g(x).
Congiungiamo
quindi i punti x, g(x) e

x + h, g(x + h) = x + h, g(x) + k per mezzo del segmento

(t) = x + th, g(x) + tk ,
t [0, 1] .
La funzione composta f `e continua su [0, 1], derivabile allinterno e nulla agli estremi. Per il Teorema
di Rolle, esiste = (h) (0, 1) tale che


f
f
x + h, g(x) + k + k
x + h, g(x) + k = 0 .
(6.4)
(f )0 () = h
x
y
Poiche il rettangolo U = [
x 1 , x
+ 1 ] [
y , y + ] `e compatto, esistono costanti M, m > 0 tali che,
per ogni (x, y) U ,

f
f


(x, y) m .
(x, y) M ,
x
y
Ricavando k dalla (6.4), si ottiene la condizione di Lipschitz


g(x + h) g(x) = |k| M |h| .
m
Allora la funzione di h
 f 

f
x + h, g(x) + k =
x + (h)h, g(x) + (h) g(x + h) g(x)
x
x
`e continua in h = 0, e dunque
 f

f
x + h, g(x) + k(h) =
x, g(x) + o(1)
(h 0) .
x
x
Analogamente per f /y. Si ha quindi che
f
f
x + h, g(x) + k)
x, g(x)) + oh0 (1)
g(x + h) g(x)
k
x
= =
= x
.
f
f
h
h
x + h, g(x) + k)
x, g(x)) + oh0 (1)
y
y

` VARIABILI
7. CALCOLO DIFFERENZIALE IN PIU

102

Passando al limite per h 0 si ottiene la derivabilit`a di g e la formula (6.5). A sua volta, (6.5) prova
la continuit`
a di g 0 .

La condizione (x,y) f 6= 0 `e dunque sufficiente per poter esplicitare una delle due variabili in funzione
dellaltra in un intorno del punto dato. Tuttavia questa condizione non `e affatto necessaria. Supponendo
a = 0, si noti infatti che f e f 2 definiscono lo stesso insieme di livello E0 , ma
(f 2 ) = 2f f
`e nullo su E0 .
Il Teorema delle funzioni implicite ha il seguente analogo per funzioni di n variabili, che ci limitiamo a
enunciare, anche se la dimostrazione `e del tutto analoga a quella del caso bidimensionale.
Per comodit`
a, indichiamo i punti x Rn come coppie (x0 , xn ) con x0 = (x1 , . . . , xn1 ) Rn1 .
Teorema 6.3 (Teorema delle funzioni implicite in Rn ). Sia f di classe C 1 sullaperto A di Rn , e sia
x
A tale che x f 6= 0. A meno di una permutazione dellordine delle variabili, supponiamo per semplicit`
a
f
(
x) 6= 0.
che
xn
Poniamo x
= (
x0 , x
n ). Esiste allora un intorno U = U 0 (
xn , x
n + ) di x
(dove U 0 `e un intorno di
0
n1
0
x
in R
) tale che, posto a = f (
x), linsieme U Ea sia il grafico xn = g(x ), con g di classe C 1 su U 0 .
Inoltre, per ogni x0 U 0 e 1 k n 1,
f 0
x , g(x0 ))
g 0
xk
(6.5)
(x ) =
.
f
xk
x0 , g(x0 ))
xn
7. Funzioni differenziabili da Rn a Rm
Consideriamo una funzione F : E Rm , con E sottoinsieme di Rn . Siano (f1 , . . . , fm ) le componenti
scalari di F , e sia x
un punto interno a E. Supponiamo che ogni fj , j = 1, . . . , m, ammetta derivate parziali
fj
in x
per ogni k = 1, . . . , n. I valori di queste derivate si raggruppano nella matrice derivata, o anche
xk
matrice Jacobiana

f1
f1
(
x)
(
x)
x1

xn


.
.
.

= fj (
..
..
..
x
)
,
DF (
x) =

xk
j=1,...,m , k=1,...,n
f

f
m
m
(
x)
(
x)
x1
xn
con m righe e n colonne. Si noti che
le riga j-esima della matrice `e il gradiente in x
della componente fj ,
la colonna k-esima `e il vettore tangente in x
k della curva
k (xk ) = F (
x1 , . . . , x
k1 , xk , x
k+1 , . . . , x
n ) ,
F
(
x).
xk
Le nozioni introdotte per funzioni a valori reali si estendono come segue alle funzioni a valori in Rm .
ossia k0 (
xk ) =

Definizione 7.1. La funzione F si dice differenziabile nel punto x


interno al suo dominio se esiste unapplicazione lineare G : Rn Rm tale che

(7.1)
F (
x + h) F (
x) = G(h) + o |h|
(h 0) .
Lo studio della differenziabilit`
a di una funzione si riduce a quello della differenziabilit`a delle sue componenti scalari, come mostra il seguente risultato.

8. COMPOSIZIONE DI FUNZIONI DIFFERENZIABILI

103

Proposizione 7.2. La funzione F `e differenziabile in x


se e solo se lo sono le sue componenti scalari
f1 , . . . , f m .
Dimostrazione. Nella (7.1) poniamo G(h) = Ah, con A = (ajk )j=1,...,m , k=1,...,n una matrice m n.
Indichiamo con vj = (aj1 , . . . , ajn ) la riga j-esima di A. Allora la condizione (7.1) equivale alle m condizioni

fj (
x + h) fj (
x) = vj h + o |h|
(h 0) .
Quindi esiste unapplicazione G che soddisfi la (7.1) se e solo se ogni fj `e differenziabile in x
.

Questa riduzione alle componenti scalari ha una serie di conseguenze sulla base dei risultati visti finora.
Corollario 7.3.
(i) Se F `e differenziabile in x
, nella (7.1) si ha G(h) = DF (
x)h.
(ii) Se F `e differenziabile in x
, essa ammette derivate direzionali, date da
v F (
x) = DF (
x)v .
(iii) Se ogni fj ammette derivate parziali in un intorno di x
e continue in x
, F `e differenziabile in x
.

8. Composizione di funzioni differenziabili


Siano date due funzioni, F da Rn a Rm e G da Rm a Rk . Pi`
u precisamente,
F : A Rm ,

G : B Rk ,

con A Rn , B Rm .
Sotto opportune ipotesi sulla differenziabilit`a di F e G, vogliamo discutere la differenziabilit`a di G F ,
ove definita.
Teorema 8.1. Siano F e G come sopra. Si supponga che
(i) F sia differenziabile in un punto x
interno ad A;
(ii) F (
x) = y sia interno a B e G sia differenziabile in y.
Allora G F `e definita in un intorno di x
, differenziabile in x
e vale lidentit`
a
D(G F )(
x) = DG(
y )DF (
x) .
Si noti che le dimensioni delle due matrici derivate rendono possibile il prodotto nellordine indicato.
Dimostrazione. Essendo y interno a B, esiste una palla By,r B. Per la continuit`a di G in y, esiste
una palla Bx,r0 , che possiamo supporre contenuta in A, tale che F (Bx,r0 ) By,r . Quindi G F `e definita su
Bx,r0 .
Si ha dunque, per x
+ h Bx,r0 e y + k By,r

F (
x + h) F (
x) = DF (
x)h + o |h|
(h 0)

G(
y + k) G(
y ) = DG(
y )k + o |k|
(k 0) .
Ponendo

k = k(h) = F (
x + h) F (
x) = F (
x + h) y = DF (
x)h + oh0 |h| ,
nella seconda formula e osservando che |k(h)| = Oh0 (|h|), si ottiene





G F (
x + h) G F (
x) = DG(
y ) DF (
x)h + oh0 |h| + oh0 |h|

= DG(
y )DF (
x)h + oh0 |h| ,
e questo d`
a la tesi.

` VARIABILI
7. CALCOLO DIFFERENZIALE IN PIU

104

Corollario 8.2 (Formula di derivazione in catena). Nelle ipotesi del Teorema 8.1, ponendo G F =
H = (h1 , . . . , hk ), vale la formula
m
X
hj
fp
gj
(
x) =
(
y)
(
x) ,
xi
yp
xi
p=1

i = 1, . . . , n , j = 1, , k .

9. Punti stazionari liberi e vincolati


Partiamo dalla seguente affermazione.
Lemma 9.1. Sia f : A R, con A Rn , differenziabile in un punto x
interno ad A. Se x
`e un punto di
massimo o di minimo locale per f , allora x f = 0.
Dimostrazione. Supponiamo che x
sia un punto di massimo locale. Per ogni j = 1, . . . , n, la funzione
gj (t) = f (
x1 , . . . , x
j1 , t, x
j+1 , . . . , x
n ) ,
definita per t in un intorno di x
j in R, ha un massimo locale in x
j ed `e derivabile in x
j . Quindi
gj0 (
xj ) =

f
(
x) = 0 .
xj

Quindi x f = 0.

Diamo allora la seguente definizione.


Definizione 9.2. Sia f : A R, con A Rn . Un punto x
interno ad A si dice un punto stazionario
libero di f se f `e differenziabile in x
e x f = 0.
Se la funzione f `e di classe C 1 su un aperto A, la ricerca dei punti di massimo o minimo locale va dunque
limitata ai punti in cui il gradiente `e nullo. Come per le funzioni di una variabile, lannullarsi del gradiente
in un punto non assicura che il punto sia di massimo o di minimo. Gi`a in una variabile le configurazioni
possibili non sono facilmente catalogabili (punti di flesso, infinite oscillazioni nellintorno del punto, ecc.).
Una situazione che si presenta solo con pi`
u variabili `e il cosiddetto punto di sella, esemplificato dalla funzione
f (x, y) = x2 y 2
nellorigine di R2 : la restrizione a una retta y = ax passante per lorigine presenta un massimo locale se
|a| > 1 e un minimo locale se |a| < 1.
Siano ora A Rn un aperto e f una funzione di classe C 1 su A. Dentro A si abbia poi linsieme di
livello (che chiameremo vincolo e supporremo non vuoto)


(9.1)
Ea = x : (x) = a ,
dove : A R `e una funzione di classe C 1 con x 6= 0 per ogni x Ea .
Chiamiamo punto di massimo locale di f vincolato a Ea un punto di Ea che sia di massimo locale per
f|Ea (e analogamente per i punti di minimo vincolato).
Si osservi che se x
A `e un punto di massimo libero per f , allora `e necessariamente di massimo
vincolato, qualunque sia il vincolo contenente x
. Al contrario, un punto di massimo, o minimo, vincolato
non `e necessariamente di massimo, o minimo, libero, e pu`o anche non essere un punto stazionario libero. Si
prenda, ad esempio, la funzione f (x, y) = x2 + y 2 , e come vincolo la retta y = 1. Il punto (0, 1) `e di minimo
vincolato, ma non `e stazionario libero.
Teorema 9.3. Siano f, di classe C 1 su A, siano a, Ea come in (9.1), con Ea 6= , e si supponga che
x 6= 0 su Ea .
Sia poi x
Ea un punto di massimo (o di minimo) di f vincolato a Ea . Allora x f `e un multiplo
scalare di x .

10. DIAGONALIZZAZIONE DELLE MATRICI SIMMETRICHE

105

Dimostrazione. Supponiamo che x


sia di massimo vincolato. Per ipotesi, x 6= 0. Supponiamo, a
meno di riordinare le variabili, che (/xn )(
x) 6= 0. Per il Teorema 6.3, in un intorno U = U 0 (
xn
, x
n + ) di x
=, Ea coincide con il grafico
xn = g(x0 ) ,
con g di classe C 1 su U 0 . Allora x
0 `e un punto di massimo locale libero della funzione

h(x0 ) = f x0 , g(x0 ) .
La funzione h `e la composizione di f con la funzione

G(x0 ) = x0 , g(x0 ) ,

G : U 0 A ,

dove U 0 Rn1 e A Rn . Per il Teorema 8.1 e il Lemma 9.1,


x0 h = (x f )DG(
x0 ) = 0 .

(9.2)
Ma

DG(
x)=

0
1
..
.

..
.

g
x0 )
x1 (

g
x0 )
x2 (

1
0
..
.

0
0
..
.

1
g
0
(
x
)
xn1

dove le n 1 colonne sono linearmente indipendenti e generano il sottospazio parallelo alliperpiano tangente
al grafico di g (cio`e a Ea ) in x
. Quindi la condizione (9.2) indica che x f `e ortogonale a tale iperpiano.
Daltra parte, la stessa conclusione vale per x , in quanto la funzione

(x0 ) = x0 , g(x0 )
`e costantemente uguale ad a. Siccome il sottospazio ortogonale a un iperpiano ha dimensione 1, esiste R
tale che
x f = x
(si noti che x 6= 0).

Definizione 9.4. Siano f, , a, Ea come nel Teorema 9.3. Un punto x
Ea si dice un punto stazionario di
f vincolato a Ea se x f `e un multiplo scalare di x .
Si deduce che, nelle ipotesi del Teorema 9.3, i punti di massimo e minimo vincolati a Ea vanno ricercati
tra i punti stazionari vincolati a Ea . La ricerca dei punti stazionari vincolati consiste dunque nella risoluzione
del sistema
(
x f = x
(9.3)
(x) = a ,
nelle incognite x, (metodo dei moltiplicatori di Lagrange).
10. Diagonalizzazione delle matrici simmetriche
Una interessante applicazione del metodo dei moltiplicatori di Lagrange `e il teorema di diagonalizzabilit`
a
su R delle matrici reali simmetriche, cio`e delle matrici quadrate A con tA = A.
Premettiamo alcune nozioni relative al prodotto scalare e alcune propriet`a delle matrici simmetriche.
Un insieme E Rn si dice un sistema ortonormale se, per ogni v, w E,
(
1 se v = w
vw =
0 se v 6= w .
Lemma 10.1.
(i) Un sistema ortonormale di vettori `e linearmente indipendente.

` VARIABILI
7. CALCOLO DIFFERENZIALE IN PIU

106

(ii) Se V `e un sottospazio vettoriale di Rn ed E `e un sistema ortonormale di vettori di V , allora E pu`


o
essere ampliato in una base ortonormale di V .
(iii) Ogni sottospazio V di Rn ha una base ortonormale.
Dimostrazione. Sia E un sistema ortonormale, e si supponga che k elementi distinti v1 , . . . vk di E
soddisfino la relazione
1 v1 + + k vk = 0 ,
per opportuni 1 , . . . , k R. Allora, per ogni j = 1, . . . , k,
0 = vj (1 v1 + + k vk ) = j .
Questo dimostra il punto (i). Sappiamo ora che un sistema ortonormale E di un sottospazio V di Rn
`e finito e che la sua cardinalit`
a k non supera dim V . Se E = {v1 , . . . , vk } con k < dim V , si prenda v V
linearmente indipendente da E. Allora
v0 = v

k
X
(v vj )vj
j=1

`e non nullo, in V , e ortogonale a ogni vj . Ponendo


1 0
v ,
|v 0 |

vk+1 =

il sistema E 0 = {v1 , . . . , vk , vk+1 } continua ad essere ortonormale. Iterando questo procedimento, si ottiene
la conclusione del punto (ii). Il punto (iii) `e una diretta conseguenza di (ii), partendo da E = .

Sia V un sottospazio vettoriale di Rn . Il sottospazio ortogonale a V , si definisce come
V = {w Rn : w v = 0 v V } ,
(che `e chiaramente uno spazio vettoriale).
Lemma 10.2. Rn `e la somma diretta di V e V .
Dimostrazione. Sia {v1 , . . . , vk } una base ortonormale di V , la si completi in una base ortonormale
{v1 , . . . , vn } di Rn . Allora {vk+1 , . . . , vn } `e un sistema ortonormale in V . Per motivi di dimensione, `e
necessariamente una base di V .

Siano ora V un sottospazio vettoriale di Rn e T : V V un applicazione lineare. Si dice che T `e
simmetrica se, per ogni v, w V ,
(T v) w = (T w) v .
Lemma 10.3. T : V V lineare, e sia {v1 , . . . , vk } una base ortonormale di V . Allora T `e simmetrica se
e solo se la matrice A = (aij ) che rappresenta T nella base data `e simmetrica (cio`e aij = aji per ogni i, j).
Dimostrazione. Se la matrice A rappresenta una qualunque applicazione lineare T in una data base,
si ha
X
T vj =
aij vi .
i

Essendo la base ortonormale, si vede facilmente che


aij = (T vj ) vi .
Se T `e simmetrica, segue che aij = aji per ogni i, j. Viceversa, se aij = aji per ogni i, j, vale luguaglianza
(T vj ) vi = (T vi ) vj per ogni i, j. Presi allora due vettori
X
X
v=
j v j ,
w=
j vj ,
j

si ha
(T v) w =

X
ij

j i (T vj ) vi =

X
ij

j i (T vi ) vj = (T w) v .

10. DIAGONALIZZAZIONE DELLE MATRICI SIMMETRICHE

107

Lemma 10.4. Sia T unapplicazione lineare simmetrica di Rn in se, e sia V un sottospazio tale che T V V .
Allora si ha anche T V V .
Dimostrazione. Sia w V . Se v V , si ha
(T w) v = w (T v) = 0 ,
perche T v V . Quindi T w V .

Nel seguito intendiamo i vettori di Rn come matrici colonna, x = t(x1 . . . xn ). Il prodotto scalare x y
si esprime dunque come prodotto matriciale tyx.
Data una matrice simmetrica n n, A = (aij ), indichiamo con T la corrispondente applicazione
simmetrica di Rn in se, riferita alla base canonica (che `e ortonormale).
Consideriamo la funzione
(10.1)

fA (x) = (T x) x = txAx =

n
X

aij xi xj =

i,j=1

n
X

ajj x2j + 2

j=1

aij xi xj ,

i<j

detta la forma quadratica associata alla matrice A. Si consideri quindi il vincolo


S:

(x) = x21 + + x2n = 1 ,

cio`e la sfera euclidea di raggio 1, centrata nellorigine di Rn .


La propriet`
a importante per noi `e la seguente.
Lemma 10.5. I punti stazionari vincolati di fA a S sono gli autovettori di A di modulo 1.
Dimostrazione. Calcoliamo il gradiente di fA in un generico punto x. Fissato k, 1 k n, la variabile
xk compare nei termini dellultimo membro della (10.1) akk x2k , 2aik xi xk con i < k, e 2akj xk xj con j > k.
Quindi,
n
X
fA
(x) = 2
akj xj = 2(Ax)k ,
xk
j=1

e in conclusione,
x fA = 2Ax .
Analogamente, essendo = fI , si ha
x = 2x .
Il sistema (9.3) identifica dunque gli autovettori di fA su S e i corrispondenti autovalori .

Teorema 10.6. Esiste una base ortonormale di Rn costituita da autovettori di T .


Dimostrazione. Procediamo per induzione sulla dimensione n. Per n = 1 lenunciato `e ovvio.
Supponiamo allora che la tesi sia vera per n 1. Per la continuit`a di fA e la compattezza di S, possiamo
dire per il Teorema di Weierstrass che fA assume valore massimo su S. Sia v1 S un punto di massimo,
che `e stazionario, e quindi un autovettore di A. Il sottospazio V = Rv1 soddisfa la condizione T V V , e
dunque lo stesso vale per V , che ha dimensione n 1. Per lipotesi induttiva, V ha una base ortonormale
{v2 , . . . , vn } di autovettori di T , che d`
a, con laggiunta di v1 , una base ortonormale di Rn .


` VARIABILI
7. CALCOLO DIFFERENZIALE IN PIU

108

11. Derivate di ordine superiore


f
su un aperto A, e questa funzione
xj
derivata ammette la derivata parziale nella variabile xk in un punto x
, il valore


f

(
x)
xk xj
Se una funzione reale f di n variabili ammette la derivata parziale

`e la derivata seconda indicata come


2f
(
x) .
xk xj
Pi`
u in generale, data una m-upla ordinata di indici (j1 , . . . , jm ), lespressione
mf
(
x) ,
xjm xj1
indica che f `e stata prima derivata prima rispetto a xj1 , poi rispetto a xj2 , ecc. in un intorno di x
, e infine
rispetto a xjm in x
.
Le derivate di ordine superiore si chiamano pure se effettuate sempre rispetto alla stessa variabile e miste
altrimenti.
Limitandoci a considerare le derivate seconde, in linea di principio una funzione di n variabili pu`o avere
fino a n2 derivate seconde in un punto. Tuttavia `e naturale porsi il problema delluguaglianza, per j 6= k,
della derivata
2f
(
x) = lim
h0
xk xj

f
x
xj (

+ hek )

f
x)
xj (

h
f (
x + hek + h0 ej ) f (
x + hek ) f (
x + h0 ej ) + f (
x)
,
= lim lim
h0 h0 0
hh0

(11.1)

con laltra derivata


2f
(
x) = lim
h0 0
xk xj

f
x
xk (

+ h0 ej )

f
x)
xk (

h0
f (
x + hek + h0 ej ) f (
x + hek ) f (
x + h0 ej ) + f (
x)
,
= lim
lim
0
0
h 0 h0
hh
Trattandosi di uno scambio dordine di due limiti in due variabili diverse, dobbiamo aspettarci che
luguaglianza non sia sempre vera. Infatti si pu`o verificare facilmente che la funzione
(
xy 3
per (x, y) 6= (0, 0)
2 +y 2
x
f (x, y) =
0
per (x, y) = (0, 0) ,
(11.2)

`e di classe C 1 su R2 ,
`e dotata di derivate seconde su R2 ,
le due derivate miste sono continue su R2 \ {(0, 0)} ma non in (0, 0),
2f
2f

(0, 0) = 1 ,
(0, 0) = 0.
yx
xy
2f
e
xk xj
2f
(con k =
6 j) in un aperto A, e che tali derivate siano continue in x
A. Allora
(
x) =
xk xj

Teorema 11.1 (Teorema di Schwarz). Supponiamo che f ammetta le due derivate seconde
2f
xj xk
2f
(
x).
xj xk

11. DERIVATE DI ORDINE SUPERIORE

109

Dimostrazione. Siccome tutti gli incrementi sono presi nelle sole variabili xj , xk , possiamo supporre
che f dipenda da due sole variabili x1 , x2 .
Si fissino h, h0 6= 0 tali che il rettangolo di estremi (
x + he1 + h0 e2 ), (
x + he1 + h0 e2 ), (
x + he1 + h0 e2 ),
0
(
x + he1 + h e2 ) sia contenuto in A.
6
(
x1 , x
2 + h0 )

(
x1 + h, x
2 + h0 )

(
x1 , x
2 )

(
x1 + h, x
2 )

Si consideri quindi lespressione


f (
x + he1 + h0 e2 ) f (
x + he1 ) f (
x + h0 e2 ) + f (
x)
0
hh
f (
x1 + h, x
2 + h0 ) f (
x1 + h, x
2 ) f (
x1 , x
2 + h0 ) + f (
x1 , x
2 )
,
=
hh0

R(h, h0 ) =

che compare sia in (11.1) sia in (11.2). Secondo il modo in cui si raggruppano a due a due gli addendi a
numeratore, essa pu`
o essere letta in due modi:
(i) ponendo
(x1 ) =

f (x1 , x
2 + h0 ) f (x1 , x
2 )
,
0
h

si ha
R(h, h0 ) =

(
x1 + h) (
x1 )
;
h

(ii) ponendo
(x2 ) =

f (
x1 + h, x2 ) f (
x1 , x2 )
,
h

si ha
(
x2 + h0 ) g(
x2 )
.
h0
Consideriamo la lettura (i). La funzione `e continua sullintervallo chiuso di estremi x
1 e x
1 + h e
derivabile al suo interno. Per il Teorema di Lagrange, esiste (0, 1) tale che
R(h, h0 ) =

f
f
(
x1 + h, x
2 + h0 )
(
x1 + h, x
2 )
x
x
1
1
R(h, h0 ) = 0 (
x1 + h) =
.
0
h

` VARIABILI
7. CALCOLO DIFFERENZIALE IN PIU

110

f
ammette derivata rispetto a x2 su A, la funzione
x1
f
u(x2 ) =
(
x1 + h, x2 ) ,
x1
`e continua sullintervallo chiuso di estremi x
2 e x
2 + h0 e derivabile al suo interno. Esiste quindi 0 (0, 1)
tale che
2f
(
x1 + h, x
2 + 0 h0 ) .
R(h, h0 ) =
x2 x1
Si noti che , 0 dipendono dalla scelta di h e h0 , ma sono comunque compresi tra 0 e 1.
Allo stesso modo, considerando la lettura (ii) e dunque scambiando il ruolo delle due variabili, si dimostra
che esistono , 0 (0, 1), dipendenti da h e h0 , tali che
Siccome

2f
(
x1 + h, x
2 + 0 h0 ) .
x1 x2
Per la continuit`
a delle due derivate miste in x
, si hanno dunque le due formule
R(h, h0 ) =

2f
(
x1 , x
2 ) + o(1)
(h, h0 ) (0, 0) ,
x2 x1
2f
R(h, h0 ) =
(
x1 , x
2 ) + o(1)
(h, h0 ) (0, 0) .
x1 x2
Passando al limite per (h, h0 ) (0, 0), si ottiene dunque la tesi.
R(h, h0 ) =

12. La matrice Hessiana


Sia f una funzione dotata di derivate parziali seconde
punto x
A. Per il Teorema 11.1, la matrice Hessiana di f
2
f
2f
x)
x)
2 (
x1 x2 (
x2 1
2f
f (
(
x)
x2 x1 x)
x22

.
.

Hx f =
..
..

2
2
f
f
x) xn x
(
x)
xn x1 (
2

continu in un aperto A Rn , continue in un


in x
,

2f

(
x
)
x1 xn

2f

(
x
)

x2 xn

..
..

2f

(
x
)
x2
n

`e simmetrica. La matrice Hessiana compare nello sviluppo di Taylor al secondo ordine di una funzione di
classe C 2 .
Teorema 12.1. Sia f una funzione di classe C 2 in un aperto A Rn , e sia x
A. Si ha allora lo sviluppo
di Taylor del secondo ordine centrato in x
,

1
f (
x + h) = f (
x) + x f h + th(Hx f )h + 0 |h|2
(h 0)
2
n
n
X

f
1 X 2f
= f (
x) +
(
x)hj +
(
x)hi hj + 0 |h|2
(h 0) .
xj
2 i,j=1 xi xj
j=1
Dimostrazione. Sia B = Bx,r una palla con centro in x
contenuta in A. Dato h con |h| < r, si
consideri la funzione
g(t) = f (
x + th) = f (
x1 + th1 , . . . , x
n + thn ) .
Essa `e definita (almeno) sullintervallo (1 , 1 + ), con = r |h|. Applicando due volte la regola
di derivazione in catena, si ha
n
X
f
g 0 (t) =
(
x + th)hj ,
x
j
j=1

13. DISCUSSIONE DELLA NATURA DEI PUNTI STAZIONARI LIBERI

111

e
g 00 (t) =

n
X

2f
(
x + th)hi hj .
xi xj
i,j=1

Applicando la formula di Taylor in una variabile con resto di Lagrange, esiste = (h) (0, 1) tale che
g 0 (1) = g(0) + g 0 (0) + g 00 () ,
ossia
(12.1)

f (
x + h) = f (
x) +

n
n
X
1 X 2f
f
(
x)hj +
(
x + h)hi hj .
xj
2 i,j=1 xi xj
j=1

Allora la differenza
f (
x + h) f (
x)

n
n
X
f
1 X 2f
(
x)hj
(
x)hi hj
xj
2 i,j=1 xi xj
j=1

`e uguale a
n
n

X
2f
1  X 2f
(
x + h)hi hj
(
x)hi hj .
2 i,j=1 xi xj
xi xj
i,j=1

Dato > 0, sia > 0 tale che, per |h0 | < e per ogni i, j,
2f

2f


(
x + h0 )
(
x) < .

xi xj
xi xj
Se |h| < si ha allora
n
n
n

X
X
f
1 X 2f


|hi ||hj |
x + h) f (
x)
(
x)hj
(
x)hi hj
f (
xj
2 i,j=1 xi xj
2 i,j=1
j=1

n2
|h|2 ,
2

che d`
a la tesi.

Si noti incidentalmente che la formula (12.1) fornisce lo sviluppo di Taylor al primo ordine con resto di
Lagrange.

13. Discussione della natura dei punti stazionari liberi


Sia f una funzione di classe C 2 su un aperto A, e sia x
A un punto stazionario, cio`e con x f = 0. Lo
studio della matrice Hessiana pu`
o consentire di determinare se x
`e un punto di massimo o minimo locale, o
di sella, o altro.
Diamo la seguente definizione.
Definizione 13.1. Una matrice simmetrica A si dice
definita positiva (risp. definita negativa) se i sui autovalori sono tutti strettamente positivi (risp.
strettamente negativi);
semidefinita positiva (risp. semidefinita negativa) se i sui autovalori sono tutti maggiori oguali a
0 (risp. minori o uguali a 0);
indefinita se ha autovalori sia positivi sia negativi.
Vale la seguente propriet`
a.

` VARIABILI
7. CALCOLO DIFFERENZIALE IN PIU

112

Lemma 13.2. Sia A una matrice simmetrica, e siano min e max i suoi autovalori minimo e massimo
rispettivamente. Allora la forma quadratica fA (x) = txAx soddisfa le disuguaglianze
min |x|2 fA (x) max |x|2 ,

(13.1)

e da ciascun lato vale luguaglianza se e solo se x `e autovettore del corrispondente autovalore.


In particolare,
Se A `e semidefinita positiva, fA (x) 0 per ogni x Rn ;
fA `e strettamente positiva fuori dallorigine se e solo se A `e definita positiva;
se A `e indefinita, fA assume sia valori positivi che negativi.
In dimensione 2, i tre casi sono esemplificati dalle tre forme quadratiche f (x, y) =
x2 + 2y 2 ,

x2 ,

x2 y 2 .

Dimostrazione.
Sia {v1 , . . . , vn } una base ortonormale di Rn in cui ogni vj `e autovettore di autovalore
Pn
j . Se x = j=1 yj vj , si ha
fA (x) =

n
X

yi yj tvi Avj =

n
X

yi yj j tvi vj =

i yi2 .

i=1

i,j=1

i,j=1

n
X

In particolare, per A = I,
|x|2 =

n
X

yi2 .

i=1

Le disuguaglianze (13.1) sono dunque ovvie. Inoltre vale luguaglianza


n
X

i yi2 = min

i=1

n
X

yi2

i=1

se e solo se vale la condizione j 6= min yj = 0, cio`e se e solo se x `e nellautospazio di autovalore min .


Analogamente per la seconda disuguaglianza. Il resto dellenunciato segue facilmente.

Torniamo dunque ai punti stazionari.
Teorema 13.3. Sia f di classe
(i) se la matrice Hessiana
(ii) se la matrice Hessiana
(iii) se la matrice Hessiana

C 2 su un aperto A, e sia x
A un suo punto stazionario. Allora
Hx f `e definita positiva, allora x
`e un punto di minimo locale;
Hx f `e definita negativa, allora x
`e un punto di massimo locale;
Hx f `e indefinita, allora x
non `e ne di massimo, ne di minimo.

Dimostrazione. Se Hx f = A `e definita positiva, si consideri la differenza




1
f (
x + h) f (
x) = fA (h) + o |h|2
h (0, 0) ,
2

per il Teorema 12.1. Esiste > 0 tale che, per |h| < , il resto o |h|2 `e minore, in valore assoluto di
(min /4)|h|2 . Per la (13.1), sempre per |h| < ,
f (
x + h) f (
x) >

min 2
|h| ,
4

e dunque x
`e di minimo locale.
Il punto (ii) `e analogo. Per il punto (iii), sia vmax e vmin autovettori di autovalore max > 0 e min < 0.
Le due funzioni g+ (t) = f (
x + tvmax ) e g (t) = f (
x + tvmin ) hanno in t = 0 un punto rispettivamente di
minimo e di massimo stretti. Quindi x
non pu`o essere ne di massimo, ne di minimo.

Nel caso in cui la matrice Hessiana `e solo semidefinita, ma con un autovalore nullo, non si pu`o concludere
in modo analogo. Le tre funzioni
f1 (x, y) = x2 + y 4 ,

f2 (x, y) = x2 y 4 ,

f3 (x, y) = x2 + y 3 ,

13. DISCUSSIONE DELLA NATURA DEI PUNTI STAZIONARI LIBERI

113


2 0
hanno tutte matrice Hessiana nellorigine uguale a
, ma nel primo caso (0, 0) `e un punto di minimo
0 0
(stretto), nel secondo si ha una configurazione che somiglia al punto di sella, nel terzo una configurazione
ancora diversa.
La nozione di punto di sella non `e facilmente formulabile in modo rigoroso in termini geometrici, soprattutto per funzioni di pi` di 2 variabili. La definizione comunemente adottata `e quella espressa al punto (iii)
(funzione C 2 con matrice Hessiana indefinita).
Togliendo lipotesi che x
sia un punto stazionario, la condizione Hx f definita positiva implica4 che, per
x=x
+ h in un intorno di x
, vale la condizione di convessit`
a stretta nel punto x
:
(13.2)

f (
x + h) > f (
x) + x f h .

Esercizio. Si dimostri che se Hx f `e semidefinita positiva in ogni punto x di un aperto convesso A, allora
lepigrafico di f `e convesso (convessit`
a di f in A nel senso ordinario).

4con una piccola modifica alla dimostrazione precedente.

CAPITOLO 8

EQUAZIONI DIFFERENZIALI ORDINARIE

Si richiede la conoscenza di nozioni e risultati relativi allintegrale di Riemann (proprio e improprio) e


allintegrazione indefinita.
1. Definizioni e primi esempi
Unequazione differenziale ordinaria di ordine n ha come incognita una funzione y(x) definita su intervallo
aperto I (non assegnato a priori) e ivi derivabile n volte. Lequazione consiste nel richiedere che, per ogni
x I, gli n + 2 numeri
x , y(x) , y 0 (x) , . . . , y (n) (x) ,
soddisfino una data relazione. Esempi di equazioni differenziali sono:
y 000
= y 00 ,
ecc.
y0 + x
Laggettivo ordinaria attribuito allequazione differenziale si riferisce al fatto che le funzioni incognite
dipendono da una sola variabile. Il termine serve quindi a distinguere le equazioni ordinarie dalle equazioni alle derivate parziali. Siccome di queste non parleremo, diremo brevemente equazione differenziale
sottintendendo il termine ordinaria.
In generale, unequazione differenziale `e definita in termini di una funzione g di n + 2 variabili, definita
su un insieme A Rn+2 , ponendo
y 0 = xy ,

(1.1)

y2 + y0 = 1 ,

g(x, y, y 0 , . . . , y (n) ) = 0 .

Ovviamente, se y(x), definita su un intervallo I, `e soluzione di unequazione differenziale, la sua restrizione a un qualunque sottointervallo I 0 I `e pure una soluzione. E dunque interessante conoscere linsieme
delle soluzioni massimali, cio`e quelle non prolungabili a soluzioni definite su intervalli pi`
u ampi. Tale insieme
si chiama lintegrale generale dellequazione differenziale.
Una singola soluzione dellequazione differenziale si chiama anche un integrale particolare dellequazione.
Lequazione differenziale si dice in forma normale se nella (1.1) `e possibile isolare lultima variabile a
primo membro:
(1.2)

y (n) = f (x, y, y 0 , . . . , y (n1) ) .

Esempi.
1. Data una funzione continua h(x) su un intervallo I, lequazione
y 0 = h(x)
ha come soluzioni massimali le primitive di h su I. Quindi, se H(x) `e una tale primitiva, lintegrale generale
dellequazione coincide con lintegrale indefinito di h, ossia linsieme delle funzioni
y(x) = H(x) + c
115

116

8. EQUAZIONI DIFFERENZIALI ORDINARIE

con c R.
2. Lintegrale generale di unequazione differenziale pu`o avere una struttura pi`
u complessa. Per esempio,
lequazione
2
y2 + y0 = 1
ha come soluzioni le sinusoidi y(x) = sin(x + ) con [0, 2), le due funzioni costanti y(x) = 1, ma anche
tutte le funzioni ottenute raccordando con continuit`a, su intervalli adiacenti, alternativamente sinusoidi e
tratti con valore costante 1.
3. Per unequazione del primo ordine in forma normale,
y 0 = f (x, y) ,
il grafico delle soluzioni deve essere ovviamente contenuto nel dominio della funzione f . La funzione f
assegna in ogni punto del dominio la pendenza che
pil grafico di una soluzione deve avere se passa per quel
punto. La figura mostra il caso dellequazione y 0 = 1 x2 y 2 .

4. Nei casi pi`


u comuni in cui serva studiare unequazione in forma non normale, si cerca di ricondurla a una,
o pi`
u, equazioni in forma normale risolvendo lequazione implicita g(t, u0 , u1 , . . . , un ) = 0 nella variabile un
(cio`e ricercando nellequazione implicita g = 0 le eventuali funzioni un = f (t, u0 , u1 , . . . , un1 ) implicitamente
definite in essa). Lequazione dellEsempio 2 si riduce in forma normale dando luogo alle due equazioni
p
p
(1.3)
y0 = 1 y2 ,
y0 = 1 y2 .
Si noti tuttavia che le soluzioni della prima equazione sono crescenti e quelle della seconda decrescenti.
Quindi non tutte le soluzioni massimali trovate nellEsempio 2 rientrano in uno dei due integrali generali
delle equazioni in (1.3) (per`
o rientrano a tratti in uno dei due alternativamente).
Nel seguito ci limiteremo a considerare solo equazioni differenziali in forma normale, anche senza
specificarlo esplicitamente.

2. METODI RISOLUTIVI PER ALCUNI TIPI DI EQUAZIONI DEL PRIMO ORDINE

117

2. Metodi risolutivi per alcuni tipi di equazioni del primo ordine


Poter risolvere esplicitamente unequazione differenziale `e un caso piuttosto raro. In questo paragrafo
vediamo i casi pi`
u comuni in cui si possono dare metodi di calcolo esplicito.
2.1. Equazioni a variabili separabili.
Si chiamano in tal modo le equazioni della forma
(2.1)

y 0 = f (x)g(y) ,

con f, g continue sugli intervalli I, J rispettivamente.


Per prima cosa si osserva che, se J `e uno zero di g, cio`e g() = 0, la funzione costante
(2.2)

y(x) =

sullintervallo I `e soluzione.
Si fissi quindi un intervallo J 0 J che non contenga zeri di g e massimale rispetto a questa propriet`
a.
Si supponga che y(x) sia una soluzione dellequazione con grafico contenuto in I J 0 , definita su un
intervallo I 0 I da determinarsi. Vale allora lidentit`a
y 0 (x)
 = f (x) ,
x I0 .
g y(x)
Si prenda ora una primitiva G di 1/g su J 0 . Si osservi che
y 0 (x)
 = (G y)0 (x) ,
g y(x)
per cui
(G y)0 (x) = f (x) ,
x I0 .
Si prenda ora una primitiva F di f su I. Esiste una costante c tale che

G y(x) = F (x) + c ,
x I0 .
Avendo g segno costante su J 0 , G `e strettamente monotona, e dunque invertibile. Quindi

(2.3)
y(x) = G1 F (x) + c .
Il dominio di questa soluzione sar`
a dunque


Ic0 = x I : F (x) + c im G .
Queste funzioni, al variare degli intervalli J 0 scelti come sopra, e insieme alle soluzioni costanti della
(2.2), consentono di comporre lintegrale generale1.
Un metodo pratico per trovare le soluzioni non costanti (ma che sottintende il ragionamento rigoroso
esposto sopra) `e il seguente.
Si scriva lequazione (2.1) nella forma
dy
= f (x)g(y) ,
dx
e la si trasformi, in modo puramente formale in
dy
= f (x) dx .
g(y)
Inserendo in ambo i membri il segno di integrazione indefinita, si arriva allespressione
Z
Z
dy
= f (x) dx .
g(y)
1Lespressione esplicita dellintegrale generale completo pu`
o essere complicata, perch
e `
e possibile che due soluzioni tra
quelle trovate sopra si raccordino in punti particolari dando luogo a possibili ramificazioni. Si veda lequazione in (3.2) pi`
u
avanti.

118

8. EQUAZIONI DIFFERENZIALI ORDINARIE

Fissate due primitive, F di f e G di 1/g, come sopra, si ottiene la relazione


G(y) = F (x) + c ,
dipendente dal parametro c, che va risolta in y. Questo vuol dire trovare le funzioni inverse dei singoli rami
monotoni di G, e dunque arrivare alla (2.3).
2.2. Equazioni lineari.
Unequazione differenziale lineare del primo ordine ha la forma
y 0 = a(x)y + b(x) ,

(2.4)

con a, b funzioni continue su un intervallo I. Lequazione si dice omogenea se b = 0.


Per risolvere lequazione (2.4), si studia prima lequazione omogenea associata
y 0 = a(x)y ,
che `e a variabili separabili. Lintegrale generale (si veda la sezione precedente) `e dato dalla formula seguente,
dove A(x) `e una primitiva di a in I,
y(x) = ceA(x) ,

cR,

che comprende anche la soluzione costante y(x) = 0.


Risolta lequazione omogenea applicata, si trova lintegrale generale dellequazione (2.4) con il cosiddetto
metodo della variazione dei coefficienti costanti. Si cerca cio`e una soluzione della forma
y(x) = c(x)eA(x) .
Sostituendo questa espressione nellequazione (2.4), si ha
c0 (x)eA(x) + c(x)a(x)eA(x) = a(x)c(x)eA(x) + b(x) .
Semplificando, si arriva a
c0 (x) = b(x)eA(x) ,
che si risolve con una integrazione indefinita. Le soluzioni massimali dellequazione (2.4) sono tutte e sole le
funzioni definite su I della forma
Z x

(2.5)
y(x) = eA(x)
b(t)eA(t) dt + c ,
x0

dove x0 `e un punto di I fissato.


3. Problemi di Cauchy per equazioni del primo ordine
Si consideri unequazione differenziale del primo ordine,
y 0 = f (x, y) ,
con f definita su un insieme aperto A R2 .
Dato un punto (x0 , y0 ) A, si vogliono conoscere le soluzioni dellequazione il cui grafico passi per tale
punto. Si vuole cio`e studiare il sistema
(
y 0 = f (x, y)
(3.1)
y(x0 ) = y0 .
Questo problema prende il nome di problema di Cauchy. Le questioni fondamentali riguardano esistenza e
unicit`
a di tali soluzioni.
Senza ipotesi ulteriori sulla funzione f , tali condizioni non sono verificate in generale, come mostrano i
seguenti esempi.

4. CONTRAZIONI DI SPAZI METRICI

119

Non esistenza: il problema di Cauchy


(
y 0 = 1 + sgn y
y(0) = 0

(3.2)

non pu`
o avere soluzione. Infatti una sua ipotetica soluzione avrebbe derivata y 0 (0) = 1 e sarebbe
dunque strettamente negativa in un intorno sinistro di 0. Ma se y(x) < 0 allora y 0 (x) = 0, quindi
y(x) sarebbe costante in un intorno sinistro di 0, il che `e incompatibile con il dato iniziale.
Non unicit`
a: il problema di Cauchy
(
p
y0 = 3 3 y2
y(0) = 0
ha almeno due soluzioni: y(x) = 0 e y(x) = x3 .

I due paragrafi successivi saranno dedicati alla dimostrazione di un fondamentale teorema che garantisce
esistenza e unicit`
a della soluzione di un problema di Cauchy.
Per introdurre le ipotesi del teorema, diamo una definizione.
Definizione 3.1. Sia f (x, y) una funzione definita sul prodotto cartesiano R = I J di due intervalli. Si
dice che f `e Lipschitziana nella variabile y se esiste una costante L > 0 tale che, per ogni x I e ogni
y1 , y2 J, si ha


f (x, y1 ) f (x, y2 ) < L|y1 y2 | .
Il teorema ha il seguente enunciato.
Teorema 3.2 (Teorema di esistenza e unicit`
a). Sia f (x, y) continua in un rettangolo aperto R = I J e
ivi Lipschitziana nella variabile y. Dato un punto (x0 , y0 ) R, esiste una e una sola soluzione del problema
di Cauchy (3.1) con grafico contenuto in R e definita almeno su un intorno di x0 .
4. Contrazioni di spazi metrici
La dimostrazione del Teorema 3.2 `e basata su una propriet`a generale di applicazioni contrattive su spazi
metrici completi.
Definizione 4.1. Sia (X, d) uno spazio metrico. Una funzione T : X X si dice una contrazione di X
se `e Lipschitziana con costante di Lipschitz < 1.
Teorema 4.2. Sia (X, d) uno spazio metrico completo, e sia T una contrazione di X. Esiste allora un unico
punto fisso x di T in X, cio`e tale che T (x) = x.
Dimostrazione. Preso un punto x0 X, si definisca ricorsivamente
xn+1 = T (xn ) .

Essendo d(xn , xn+1 ) = d(T (xn1 ), T (xn ) , si verifica per induzione che vale la disuguaglianza
d(xn , xn+1 ) n d(x0 , x1 ) .
Dati allora due interi m < n, si ha
d(xm , xn ) d(xm , xm+1 ) + d(xm+1 , xm+2 ) + + d(xn1 , xn )
(m + + n1 )d(x0 , x1 )

X

m
k d(x0 , x1 )
k=0

m
=
d(x0 , x1 ) .
1

120

8. EQUAZIONI DIFFERENZIALI ORDINARIE

Essendo < 1, questo implica che la successione `e di Cauchy e dunque converge a un punto x X.
Essendo T continua, si ha
T (x) = lim T (xn ) = lim xn+1 = x .
n

Quindi x `e un punto fisso di T , e questo dimostra lesistenza di un punto fisso.


Per dimostrare lunicit`
a, si supponga che x, y siano punti fissi. Allora

d(x, y) = d T (x), T (y) d(x, y) .
Essendo < 1, deve essere d(x, y) = 0, cio`e x = y.

5. Teorema di esistenza e unicit`


a: dimostrazione e conseguenze
Per prima cosa, riconduciamo il problema di Cauchy (3.1) a unequazione integrale.
Lemma 5.1. Siano f continua sul rettangolo I 0 J, y : I 0 J, e x0 I 0 . Le due condizioni seguenti
sono equivalenti:
(i) y `e derivabile in I 0 e soddisfa il sistema (3.1);
(ii) y `e continua in I 0 e soddisfa lequazione integrale
Z x

y(x) = y0 +
f t, y(t) dt .
x0

Dimostrazione. Supponiamo che valga la condizione (i). Per il Teorema fondamentale del calcolo
integrale,
Z x
y(x) = y0 +
y 0 (t) dt
x0
Z x

= y0 +
f t, y(t) dt .
x0

Viceversa, si supponga che valga la condizione (ii). Allora y(x0 ) = y0 . Inoltre, posto g(t) = f t, y(t) ,
la funzione
g `e continua su I 0 . Segue allora dal Teorema
 fondamentale del calcolo integrale che y(x) =
Rx
y0 + x0 g(t) dt `e derivabile e che y 0 (x) = g(x) = f x, y(x) .

Possiamo ora passare alla dimostrazione del teorema.
Dimostrazione del Teorema 3.2.
Siano a0 , b0 > 0 due numeri tali che
[x0 a0 , x0 + a0 ] [y0 b0 , y0 + b0 ] I J = R .
Poniamo Jb0 = [y0 b0 , y0 + b0 ] e, per 0 < a a0 ,
Ia = [x0 a, x0 + a] .
Consideriamo lo spazio metrico


Xa = y C(Ia ) : y(Ia ) Jb0 , y(x0 ) = y0 ,
dotato della distanza indotta da C(Ia ), e definiamo una funzione T : Xa C(Ia ) ponendo, per y Xa ,
T (y) uguale alla funzione
Z x


f t, y(t) dt .
T (y) (x) = y0 +
x0

Imponiamo ora che T applichi Xa in se. La condizione T (y) (x0 ) = y0 `e ovviamente verificata. Rimane
da imporre che, per ogni x Ia , si abbia



T (y) (x) y0 b0 .

` DIMOSTRAZIONE E CONSEGUENZE
5. TEOREMA DI ESISTENZA E UNICITA:

Ma

121

Z

x


T (y) (x) y0 =
f t, y(t) dt
x
Z x0


f t, y(t) dt

x0


f (x, y) .
a
max
(x,y)Ia0 Jb0

Posto M = max(x,y)Ia0 Jb0



f (x, y) , la condizione richiesta `e
aM b0 .

(5.1)

Imponiamo ora lulteriore condizione che T sia una contrazione di Xa . Date due funzioni y, z Xa , si
consideri la distanza tra le loro immagini,




d T (y), T (z) = max T (y) (x) T (z) (x) .
xIa

Per x Ia , si ha
Z
Z x


 x


T (y) (x) T (z) (x) =
f t, y(t) dt
f t, z(t) dt
x0
x0
Z x



=
f t, y(t) dt f t, z(t) dt
x
Z x 0



f t, y(t) dt f t, z(t) dt
x0
Z x


y(t) z(t) dt
L
x0

La d(y, z) ,
dove L `e la costante di Lipschitz di f nella seconda variabile. Si ha quindi

d T (y), T (z) La d(y, z) ,
e la condizione da imporre `e dunque
(5.2)

La < 1 .

Quindi, se a soddisfa entrambe le condizioni (5.1) e (5.2), A `e una contrazione di Xa in se. Daltra
parte, Xa `e chiuso in C(Ia ), che `e completo, e dunque `e uno spazio metrico completo. Per il Teorema 4.2, T
ammette uno e un solo punto fisso in Xa . Per il Lemma 5.1, questa `e dunque lunica soluzione del problema
di Cauchy (3.1) sullintervallo (x0 a, x0 + a).

Supponiamo ora che la funzione f (x, y) che definisce lequazione differenziale sia continua e localmente
Lipschitziana nella y su un aperto A R2 (cio`e, ogni punto di A ha un intorno rettangolare su cui f `e Lipschitziana nella y). Dato un qualunque punto (x0 , y0 ) A, si pu`o applicare il Teorema 3.2 al corrispondente
problema di Cauchy (3.1). Si ha allora il seguente risultato.
Corollario 5.2. Sia f continua e localmente Lipschitziana nella y su un aperto A R2 . I grafici delle
soluzioni massimali in A dellequazione differenziale y 0 = f (x, y) determinano una partizione di A.
Dimostrazione. Per il Teorema 3.2, ogni punto di A `e contenuto nel grafico di una soluzione, e dunque
di una soluzione massimale. Quindi i grafici di tali soluzioni ricoprono A.
Dimostriamo ora che se i grafici di due soluzioni massimali y1 (x) e y2 (x) si intersecano in un punto
(x0 , y0 ), allora coincidono. Con questo la dimostrazione sar`a conclusa.
Indichiamo con I1 , I2 i rispettivi intervalli (aperti) di definizione. Essendo entrambe le funzioni soluzioni
del problema di Cauchy (3.1), esiste un intorno (x0 , x0 + ) di x0 su cui y1 e y2 coincidono. Allora

122

8. EQUAZIONI DIFFERENZIALI ORDINARIE

(x0 , x0 + ) `e contenuto in I1 I2 , che indichiamo con (a, b). Sia J = (a0 , b0 ) il massimo sottointervallo
aperto di (a, b) su cui y1 e y2 coincidono2.
Se fosse b0 < b, avremmo un assurdo, perche si avrebbe per continuit`a y1 (b0 ) = y2 (b0 ) = y e allora
y1 , y2 sarebbero due soluzioni del problema di Cauchy con dato iniziale y(b0 ) = y. Quindi y1 e y2 dovrebbero
coincidere anche su un intorno destro di b0 , contro lipotesi di massimalit`a di J. Dunque b0 = b. Analogamente
si dimostra che a0 = a.
Dunque le due funzioni coincidono su I1 I2 . Se fosse I1 6= I2 , una almeno delle due soluzioni sarebbe
prolungabile, contro lipotesi di massimalit`a.

Esercizio. Si dimostri che, nelle ipotesi del Corollario 5.2, data una soluzione massimale y(x) dellequazione
differenziale y 0 = f (x, y) definita sullintervallo aperto (a, b) (con a, b possibilmente infiniti), per ogni compatto K A esistono un intorno Ua di a e un intorno Ub di b tali che, per ogni x Ua Ub , x, y(x) 6 K.

6. Sistemi di equazioni differenziali ed equazioni di ordine superiore


Un sistema di equazioni differenziali ordinarie del primo ordine in forma normale ha la forma
0
y1 (x) = f1 (x, y1 , . . . , yn )

y 0 (x) = f (x, y , . . . , y )
2
1
n
2

0
yn (x) = fn (x, y1 , . . . , yn )
dove le n funzioni f1 , . . . , fn sono definite su uno stesso insieme A Rn+1 . In forma compatta, ponendo
Y = (y1 , . . . .yn ) ,

F = (f1 , . . . , fn ) : A Rn ,

il sistema si scrive nella forma


Y 0 = F (x, Y ) ,

(6.1)

dove la funzione incognita Y (x) si intende definita su un intervallo in R e a valori in Rn .


Un problema di Cauchy associato al sistema (6.1) `e dato da
(
Y 0 = F (x, Y )
(6.2)
Y (x0 ) = Y0 ,
con (x0 , Y0 ) A.
Enunciato e dimostrazione del Teorema 3.2 e il contenuto del paragrafo 5R si estendono ai sistemi con le
x
ovvie modifiche notazionali e intendendo, nel Lemma 5.1, lintegrale definito x0 F t, Y (t) dt come ln-upla

Rx
degli integrali x0 fj t, Y (t) dt.
Si consideri ora unequazione di ordine n,
(6.3)

y (n) = f (x, y, y 0 , . . . , y (n1) ) ,

con f definita su un insieme A Rn+1 e a valori reali.


Lemma 6.1. Lequazione (6.3) `e equivalente al sistema
0
y1 (x) = y2

yn1
(x) = yn

0
yn (x) = f (x, y1 , . . . , yn )
nel senso che
2Si dimostri che tale intervallo massimo esiste.

6. SISTEMI DI EQUAZIONI DIFFERENZIALI ED EQUAZIONI DI ORDINE SUPERIORE

123


(i) se y(x) `e soluzione dellequazione (6.3), allora Y (x) = y(x), y 0 (x), . . . , y (n1) (x) `e soluzione del
sistema;

(ii) se Y (x) = y1 (x), . . . , yn (x) `e soluzione del sistema, allora y1 (x) `e soluzione dellequazione (6.3).
Tralasciamo la dimostrazione, del tutto ovvia.
Da questo segue in modo naturale che i problemi di Cauchy per lequazione (6.3) vanno posti nella forma
seguente:

(n)
0
(n1)

)
y = f (x, y, y , . . . , y

y(x0 ) = y0

(6.4)
y 0 (x0 ) = y00

y (n1) (x ) = y (n1) ,
0
0
(n1)

con (x0 , y0 , y00 , . . . , y0


) A, ossia assegnando, per x = x0 , i valori della funzione incognita e delle sue
derivate fino allordine n 1.
Da quanto detto finora segue facilmente il seguente enunciato.
Teorema 6.2. Sia f (x, y1 , . . . , yn ) una funzione definita su un aperto A Rn+1 a valori reali, continua e
localmente Lipschitziana nelle variabili y1 , . . . , yn .
(n1)

(i) Dato un punto (x0 , y0 , y00 , . . . , y0


) A, il problema di Cauchy (6.4) ammette una e una sola
soluzione definita in un intorno (x0 , x0 + ) di x0 .
(ii) A `e lunione disgiunta dei grafici delle funzioni

Y (x) = y(x), y 0 (x), . . . , y (n1) (x) ,
al variare di y(x) tra le soluzioni massimali dellequazione (6.3).
In modo analogo si impostano e si discutono i problemi di Cauchy relativi a sistemi di equazioni
differenziali di ordine superiore. In Fisica si incontrano frequentemente sistemi del tipo

00
0 0 0

x = f1 (t, x, y, z, x , y , z )
y 00 = f2 (t, x, y, z, x0 , y 0 , z 0 )

00
z = f3 (t, x, y, z, x0 , y 0 , z 0 )

in cui la variabile indipendente t rappresenta il tempo, la funzione incognita x(t), y(t), z(t) la posizione
di un punto materiale (supposto di massa unitaria) allistante t, e F = (f1 , f2 , f3 ) la risultante delle forze
agenti su un punto che allistante t si trovi nella posizione (x, y, z) con velocit`a (x0 , y 0 , z 0 ). Tali forze possono
dipendere dalla posizione (campi di forze), dalla velocit`a (per es. attrito), e possono essere variabili nel
tempo. Il sistema rappresenta la legge F = ma, dove laccelerazione `e a = (x00 , y 00 , z 00 ).
Come visto sopra per una singola equazione, questo sistema `e equivalente a un sistema del primo ordine
di 6 equazioni in 6 incognite,

x0 = p x

y 0 = py

z 0 = p
z
0

p
=
f
1 (t, x, y, z, px , py , pz )

py = f2 (t, x, y, z, px , py , pz )

0
pz = f3 (t, x, y, z, px , py , pz )
dove px , py , pz sono le tre componenti del momento del punto in movimento.
Un problema di Cauchy consiste dunque nellassegnazione, a un dato istante t0 , della posizione (x0 , y0 , z0 )
e del momento (px,0 , py,0 , pz,0 ).

124

8. EQUAZIONI DIFFERENZIALI ORDINARIE

Il punto (ii) del Teorema 6.2 si applica ai grafici (in R7 ) delle funzioni

t 7 x(t), y(t), z(t), px (t), py (t), pz (t) ,

dove x(t), y(t), z(t) `e una soluzione massimale. Lo spazio 6-dimensionale con coordinate (x, y, z, px , py , pz )
`e lo spazio delle fasi.
7. Sistemi differenziali lineari a coefficienti costanti e matrice esponenziale
Un sistema differenziale lineare omogeneo a coefficienti costanti ha la forma

0
y1
a11 a1n
y1
y20 a21 a2n y2


(7.1)
Y0 = . = .
.. .. = AY ,
..
.. ..
.
. .
yn0

an1

ann

yn

dove A `e una matrice nn (che possiamo anche supporre complessa, ammettendo soluzioni a valori complessi
del sistema). Il caso n = 1, in cui il sistema si riduce allequazione y 0 = ay, ha come soluzioni le funzioni
y(x) = ceax (v. paragrafo 2).
Per n generico le soluzioni assumono una forma analoga introducendo un apposita nozione di matrice
esponenziale.
Proposizione 7.1. Sia A una matrice n n, reale o complessa. La serie esponenziale

X
1 k
(7.2)
A
k!
k=0

(dove si `e posto A0 = I) `e convergente.


2

Si noti che, essendo lo spazio delle matrici n n isomorfo a Rn , la convergenza si pu`o intendere
equivalentemente componente per componente, oppure nella norma euclidea3
n
X
 12
.
kAk =
|aij |2
i,j=1

Aggiungiamo la seguente propriet`


a della norma euclidea.
Lemma 7.2. Siano A, B matrici n n. Allora
kABk kAkkBk .
Dimostrazione. Indichiamo con Ai = (ai1 , . . . , ain ) la i-esima riga della matrice A e con B j =
(b1j , . . . , bnj ) la j-esima riga della matrice B. Allora se C = (cij ) = AB, si ha, per la disuguaglianza
di Cauchy-Schwarz,
|cij | = |Ai B j | |Ai ||B j | .
Allora
n
X
2
kCk =
|cij |2
t

i,j=1
n
X

|Ai |2 |B j |2

i,j=1
n
X

|Ai |2

n
 X

i=1
2

j=1
2

= kAk kBk .
3Per matrici si chiama anche norma di Hilbert-Schmidt.

|B j |2

7. SISTEMI DIFFERENZIALI LINEARI A COEFFICIENTI COSTANTI E MATRICE ESPONENZIALE

125

Dimostrazione della Proposizione 7.1. Applicando il Teorema 5.4 del Capitolo 6, studiamo la
convergenza normale della serie (7.2). Per il Lemma 7.2, trascurando il termine iniziale si ha

X
X
1
1
kAk k
kAkk ,
k!
k!

k=1

k=1

che converge.

Si pone
eA =

X
1 k
A ,
k!

k=0

che viene detta matrice esponenziale di A.


Per ogni x R, la funzione

expA (x) = exA


`e dunque ben definita da R nello spazio delle matrici n n.
Proposizione 7.3. Valgono le seguenti propriet`
a:
(i) la funzione expA `e analitica su R (cio`e ogni sua componente `e analitica);
(ii) vale lidentit`
a
d xA
e = AexA = exA A ;
dx
(iii) Per ogni x, x0 R vale lidentit`
a
0

e(x+x )A = ex A exA = exA ex A .


Dimostrazione. Indichiamo con (Ak )ij il termine di posto (i, j) nella matrice Ak . Allora la componente
(e )ij (i, j) di exA `e

X
(Ak )ij k
(exA )ij =
x .
k!
xA

k=0

Essendo questa una serie di potenze convergente per ogni x R, il suo raggio di convergenza `e infinito
e, per il Teorema 8.3 del Capitolo 6, `e analitica su R.
E dunque possibile derivare tale serie termine a termine, ottenendo che

X
d xA
(Ak+1 )ij k
(e )ij =
x .
dx
k!
k=0

Ricomponendo la matrice, si ha

d xA X Ak+1 k
e =
x .
dx
k!
k=0

Da ogni termine si pu`


o raccogliere A a fattore, sia a destra che a sinistra, e il punto (ii) `e dimostrato.
Il punto (iii) si pu`
o ottenere svolgendo il prodotto delle due serie esponenziali di xA e x0 A (possibile per
la loro convergenza assoluta) e ricomponendo la somma raggruppando i termini dello stesso grado in A. In
0
alternativa, si pu`
o osservare che, fissato x0 , la funzione di x e(x+x )A exA ha derivata4
0
0
d (x+x0 )A xA
(e
e
) = e(x+x )A AexA e(x+x )A AexA = 0 ,
dx
0
per il punto (ii). Dunque e(x+x )A exA `e costante in x, e dunque uguale al suo valore in x = 0. Cio`e
0

e(x+x )A exA = ex A .
4Si dimostri per esercizio che la derivazione di funzioni a valori matrici rispetta la regola di Leibniz

d
(f g) = f 0 g + f g 0 .
dx

126

8. EQUAZIONI DIFFERENZIALI ORDINARIE

Per x0 = 0 questo implica che exA = (exA )1 , e da ci`o segue la prima uguaglianza. Scambiando x con
x si ha la seconda.

0

Possiamo allora descrivere le soluzioni del sistema (7.1).


Teorema 7.4. Le soluzioni massimali del sistema (7.1) sono definite su tutto R e sono tutte e sole le funzioni
Y (x) = exA v ,
al variare di v Rn . In particolare, tali soluzioni formano uno spazio vettoriale di dimensione n e le n
colonne della matrice exA ne formano una base.
Il problema di Cauchy
(
Y 0 = AY
(7.3)
Y (x0 ) = v
ha come unica soluzione Y (x) = e(xx0 )A v.
Dimostrazione. La funzione Y (x) = e(xx0 )A v `e soluzione del problema (7.3). Daltra parte la funzione
F (x, Y ) = AY `e continua e Lipschitziana in Y su tutto Rn+1 . Quindi tale soluzione `e unica. Il resto segue
facilmente.

Ripetendo quanto visto nel paragrafo 2.2, il sistema differenziale lineare non omogeneo a coefficienti
costanti
Y 0 = AY + b(x) ,
dove b(x) `e una funzione continua su un inervallo aperto I a valori in Rn `e risolto da una formula analoga a
(2.5). Le soluzioni massimali sono date, al variare di v Rn , da
Z x
 Z x
Y (x) = exA
etA b(t) dt + v =
e(xt)A b(t) dt + exA v ,
x0

x0

dove x0 I `e un punto fissato.


8. Calcolo della matrice esponenziale
Il calcolo esplicito delle matrici esponenziali exA a partire da una data matrice A n n `e possibile, in
linea di principio, a condizione di averne determinato la forma canonica di Jordan. Siccome lespressione
della forma canonica `e pi`
u semplice in ambito complesso, poniamoci in tale ambito.
Sia dunque P una matrice complessa invertibile tale che A0 = P AP 1 sia nella forma a blocchi

B1 0
0
0 B2
0

(8.1)
A0 = .
.
..
.
..
..
..
.
0
0 Br
dove i blocchi Bj sono sottomatrici quadrate di
della forma

j
0

(8.2)
Bj =
0
.
..
0

dimensione mj mj (ovviamente con m1 + + mr = n)


1
j

0
1

0
..
.

j
..
.

..
.
..

0
0

..
.
.

1
j

I termini j che appaiono sulle diagonali dei blocchi non sono necessariamente distinti tra loro e sono gli
autovalori di A. La molteplicit`
a algebrica di un autovalore (cio`e come radice del polinomio caratteristico)

8. CALCOLO DELLA MATRICE ESPONENZIALE

127

`e data dalla somma delle dimensioni mj dei blocchi in cui j = . Invece il numero di blocchi in cui j =
`e uguale alla molteplicit`
a geometrica di (cio`e la dimensione del relativo autospazio).
Il calcolo delle matrici esponenziali `e basato sulle seguenti propriet`a:
dalluguaglianza A = P 1 A0 P segue che exA = P 1 exA
con riferimento alla (8.1),
xB
e 1
0

xB2

0
e

exA = .
.
..
..
..
.
0

P;

0
0
..
.

exBr

se due matrici A1 , A2 commutano, allora


ex(A1 +A2 ) = exA1 exA2 = exA2 exA1 .
Il calcolo di exA si riduce quindi al calcolo di un singolo blocco di Jordan. Inoltre
B j = j I + Nj ,
dove

0
0

Nj =
0
.
..

1
0

0
1

0
..
.

0
..
.

..
.
..

0
0

..
.
.

1
0

Allora
exBj = exj I exNj = ej x exNj .
Il calcolo di exNj `e molto semplice, perche le potenze Nj2 , Nj3 ecc. hanno una forma simile, con ununica
m
diagonale di 1 spostata sempre pi`
u in alto. In particolare, Nj j = 0, per cui
x2 2
xmj 1
m 1
Nj + +
N j
2
(mj 1)! j

xmj 1
x2
(m
2
1)!
j
xmj 2

x (m
j 2)!
..
..
.
.
0
.

..
..
.
.
x
0
1

exNj = I + xNj +

= 0

.
..
0

x
1
0
..
.
0

In definitiva,

(8.3)

xBj

x2 j x
2 e
j x

ej x

xej x

ej x

0
..
.

0
..
.

0
..
.

xe

..
.
..
.

xmj 1 j x
(mj 1)! e
xmj 2 j x

(mj 2)! e

..
.

xej x
ej x

128

8. EQUAZIONI DIFFERENZIALI ORDINARIE

9. Equazioni differenziali lineari a coefficienti costanti di ordine superiore


Consideriamo lequazione differenziale lineare omogenea di ordine n
(9.1)

y (n) = a1 y (n1) + a2 y (n2) + + an1 y 0 + an y .

Essa pu`
o essere ricondotta, in base al Lemma 6.1, al

0
1
0
0
0
1

..
.
..
..
(9.2)
A= .
.

0
0
0
an an1 an2

sistema del primo ordine Y 0 = AY , con

0 0
0 0

..
.. .
..
. .
.

0 1
a2 a1

Dal Teorema 7.3 segue il seguente enunciato.


Corollario 9.1. Lintegrale generale dellequazione (9.1) `e uno spazio vettoriale di dimensione n di funzioni
definite su tutto R.
Per determinare una base di tale spazio, si pu`o, sempre in base al Lemma 6.1 e al Teorema 7.3, calcolare
la matrice exA ed estrarne le n componenti della prima riga. Questo richiede tuttavia il calcolo della matrice
esponenziale, che si pu`
o evitare procedendo in modo diverso.
Sullo spazio vettoriale C (R) consideriamo loperatore di derivazione D, che applica una funzione f
nella sua derivata f 0 .
Loperatore D pu`
o essere iterato un numero arbitrario di volte, di modo che
Dk f = f (k) ,
per ogni k N (si intende che D0 `e lapplicazione identica). Possiamo anche considerare combinazioni
lineari degli operatori Dk , ossia polinomi nelloperatore D. Con questo simbolismo, lequazione (9.1) assume
la forma
P (D)y = 0 ,
dove
(9.3)

P () = n a1 n1 a2 n2 an1 an ,

si chiama il polinomio caratteristico dellequazione (9.1).


La normale algebra dei polinomi si applica ai polinomi in D. Precisamente, vale lidentit`a
P (D) Q(D) = (P Q)D ,
e dunque vale la propriet`
a commutativa
P (D) Q(D) = Q(D) P (D) .
Indichiamo allora con 1 , 2 , . . . , r le soluzioni complesse distinte del polinomio (9.3), e con m1 , m2 , . . . , mr
le rispettive molteplicit`
a. Allora
P () = ( 1 )m1 ( 2 )m2 ( r )mr ,
e dunque
(9.4)

P (D) = (D 1 )m1 (D 2 )m2 (D r )mr .

Lemma 9.2. Per ogni j = 1, . . . , r, le soluzioni dellequazione differenziale


(D j )mj y = 0
sono anche soluzioni dellequazione (9.1).
Dimostrazione. Essendo possibile riordinare a piacere i fattori nella (9.4), possiamo supporre che
j = r. La conclusione `e dunque ovvia.


9. EQUAZIONI DIFFERENZIALI LINEARI A COEFFICIENTI COSTANTI DI ORDINE SUPERIORE

129

Lemma 9.3. Le soluzioni dellequazione differenziale


(D j )mj y = 0
sono tutte e sole le funzioni p(x)ej x , dove p `e un polinomio di grado strettamente minore di mj .
Dimostrazione. Si ponga y(x) = ej x z(x). Allora
(D j )y(x) = ej x z 0 (x) + j ej x z(x) j ej x z(x) = ej x z 0 (x) .
Induttivamente si ottiene che
(D j )mj y(x) = ej x z (mj ) (x) ,
e lequazione differenziale si riduce a z (mj ) = 0, le cui soluzioni sono i polinomi di grado strettamente minore
di mj .

Si ottengono in questo modo le seguenti n soluzioni dellequazione (9.1):

(9.5)

e 1 x
e 2 x
...
er x

xe1 x
xe2 x
xer x

...
...
...
...

xm1 1 e1 x
xm2 1 e2 x
...
mr 1 r x
x
e

Se dimostriamo che esse sono linearmente indipendenti, possiamo concludere che lintegrale generale
dellequazione (9.1) `e dato dalle loro combinazioni lineari.
Verificare questo `e abbastanza semplice in alcuni casi particolari.
Per esempio, supponiamo che tutte le radici siano semplici, cio`e r = n e mj = 1 per ogni j. Siano
c1 , . . . , cn coefficienti tali che
n
X
cj ej x = 0
x R .
j=1

Derivando ripetutamente, si ha allora che per ogni k N,


n
X

cj kj ej x = 0

x R .

j=1

Limitandoci ai valori k = 0, 1, . . . , n 1 e ponendo x = 0, ottieniamo il sistema


1
1

1
c1
0
1
c2 0

2
n


..
..
.. .. = ..
..
.
.
.
. . .
n1
n1
n1
cn
0
1
2
n
dova la matrice (detta di Vandermonde) ha determinante
Y
(j i ) 6= 0 .
i,j:1i<jn

Deve dunque essere c1 = c2 = = cn = 0, da cui segue che le funzioni ej x sono linearmente


indipendenti.
Supponiamo ora che le radici j possano avere molteplicit`a maggiore di uno, ma che siano tutte reali.
Allora le funzioni (9.5) si possono totalmente ordinare rispetto alla relazione o per x +. Si verifica
allora facilmente che sono linearmente indipendenti.
Per ottenere il risultato generale, possiamo fare riferimento a quanto visto nel paragrafo precedente per
i sistemi del primo ordine a coefficienti costanti, con riferimento alla matrice A nella (9.2).
Lemma 9.4. Il polinomio caratteristico della matrice (9.2) `e uguale a (1)n P , dove P `e il polinomio nella
(9.3).

130

8. EQUAZIONI DIFFERENZIALI ORDINARIE

Dimostrazione. Si consideri

A I = ...

0
an

..
.

0
1
..
.

..
.

0
0
..
.

0
an1

0
an2

a2

0
0
..
.

1
a1

e sia Q() = det(A I). Se n = 2,


Q() = (a1 ) a2 = 2 a1 a2 = P () .
Supponendo la tesi vera per n 1, chiamiamo A11 la matrice (n 1) (n 1) ottenuta eliminando la
prima riga e la prima colonna di A. Allora
Q() = det(A11 I) + (1)n+1 an ,
e, per ipotesi induttiva,
det(A11 I) = (1)n (n1 a1 n2 an1 ) .
La conclusione `e dunque immediata.

In base alla (8.3), la matrice exA = P 1 A0 P pu`o contenere nella prima riga solo combinazioni lineari
delle funzioni (9.5)5, e dunque ogni soluzione `e combinazione lineare di queste. Per il Corollario 9.1, le
funzioni (9.5) formano una base dellintegrale generale.

5Anzi, la presenza di xmj 1 ej x tra le soluzioni (9.5) indica che, necessariamente, la forma canonica di Jordan di A
contiene un unico blocco, di dimensione mj mj , con autovalore j .