Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Pacini
COMPLEMENTI DI MATEMATICA
Seminario Fisico-Matematico I anno
Indice
Capitolo 1. ELEMENTI DI TEORIA DEGLI INSIEMI
1. Prodotto cartesiano di due insiemi
2. Relazioni
3. Relazioni di equivalenza
4. Relazioni dordine
5. Funzioni
6. Prodotto cartesiano di pi`
u insiemi
7. Linsieme dei numeri naturali
8. Cardinalit`
a di insiemi
9. Cardinalit`
a di P(A)
10. Insiemi finiti e infiniti
11. Il Lemma di Zorn
12. Dimostrazione del Lemma di Zorn
13. Il Teorema di Zermelo
5
5
6
6
8
8
9
10
12
15
16
16
18
20
21
21
22
23
24
24
26
27
28
31
31
33
34
36
39
39
40
41
44
45
47
48
53
53
55
INDICE
3. Successioni a valori in Rn
4. Successioni e propriet`
a topologiche di sottoinsiemi di Rn
5. Punti limite di una successione
6. Spazi topologici
7. Spazi metrici
8. Funzioni continue tra spazi euclidei
Capitolo 6. SUCCESSIONI E SERIE DI FUNZIONI
1. Convergenza puntuale e uniforme
2. Continuit`
a del limite uniforme
3. La convergenza uniforme come convergenza in uno spazio metrico
4. Derivabilit`
a della funzione limite
5. Convergenza uniforme di serie di funzioni e spazi vettoriali normati
6. Serie di potenze
7. Derivabilit`
a sullasse reale
8. Serie di potenze e serie di Taylor
9. Il Lemma di Abel
10. Alcune serie notevoli
58
59
60
61
66
71
75
75
76
77
78
80
83
85
85
89
92
` VARIABILI
Capitolo 7. CALCOLO DIFFERENZIALE IN PIU
1. Derivate parziali e direzionali
2. Differenziale
3. Il teorema del differenziale totale
4. Curve regolari in Rn
5. Curve regolari e grafici
6. Funzioni implicite
7. Funzioni differenziabili da Rn a Rm
8. Composizione di funzioni differenziabili
9. Punti stazionari liberi e vincolati
10. Diagonalizzazione delle matrici simmetriche
11. Derivate di ordine superiore
12. La matrice Hessiana
13. Discussione della natura dei punti stazionari liberi
93
93
94
96
97
98
99
102
103
104
105
108
110
111
115
115
117
118
119
120
122
124
126
127
CAPITOLO 1
(A B) = cA cB ,
(A B) = cA cB .
2. Relazioni
Si chiama relazione tra elementi di un insieme A ed elementi di un insieme B un qualunque sottoinsieme
R del prodotto cartesiano A B.
Se la coppia (a, b) A B appartiene a R, si dice che a `e in relazione con b; si usa la notazione1 aRb.
Esempi.
(1) Con A = {1, 2, . . . , 100} e B = {1, 2, . . . , 200} (linsieme dei numeri naturali), poniamo la relazione
aRb M.C.D.(a, b) > 1 .
Una scrittura equivalente `e
R = (a, b) A B : M.C.D.(a, b) > 1 .
(2) Con A = B = N (linsieme dei numeri naturali), linsieme
(m, n) N2 : m n
fornisce la relazione .
3. Relazioni di equivalenza
Una relazione R tra elementi di uno stesso insieme A si dice una relazione di equivalenza su A se soddisfa
le seguenti propriet`
a:
riflessiva: a A , aRa;
simmetrica: aRb bRa;
transitiva: aRb e bRc aRc.
Simboli comunemente usati per relazioni di equivalenza sono: , ', , e simili.
Sia dunque una relazione di equivalenza. Fissato a A, si chiama classe di equivalenza di a modulo
linsieme
Ca = {b A : b a} .
Lemma 3.1. Se a a0 , allora Ca = Ca0 . Se a 6 a0 , allora Ca Ca0 = .
Dimostrazione. Supponiamo a a0 e b Ca . Allora b a e per la propriet`a transitiva b a0 .
Dunque b Ca0 . Questo prova che Ca Ca0 . Allo stesso modo si dimostra che Ca0 Ca . Dalla doppia
inclusione segue che Ca = Ca0 .
Dimostriamo ora che
(3.1)
Ca Ca0 6= = a a0 .
Si chiama partizione di A una famiglia di sottoinsiemi non vuoti di A che siano a due a due disgiunti e
la cui unione sia tutto A.
Teorema 3.2. Le classi di equivalenza distinte modulo costituiscono una partizione di A. Viceversa, data
una partizione di A, esiste ununica relazione di equivalenza le cui classi di equivalenza siano gli elementi
della partizione stessa.
1Invece di lettere, come R, `
e comune usare simboli come , , ecc., secondo i casi (v. seguito).
3. RELAZIONI DI EQUIVALENZA
Dimostrazione. Il Lemma 3.1 dimostra che le classi di equivalenza distinte modulo sono disgiunte.
Inoltre, ogni a A appartiene alla classe Ca per la propriet`a riflessiva. Quindi lunione delle classi distinte
`e tutto A.
S
Per il viceversa, sia {Ai : i I} una partizione di A, cio`e con iI Ai = A, Ai 6= per ogni i I, e
Ai Ai0 = se i 6= i0 . Si verifica facilmente che la relazione
xRy i I tale che x, y Ai
`e di equivalenza e che le sue classi di equivalenza sono gli Ai .
4. Relazioni dordine
Una relazione R tra elementi di uno stesso insieme A si chiama una relazione dordine, o un ordinamento,
su A se valgono le seguenti propriet`
a:
riflessiva: a A , aRa;
antisimmetrica: aRb e bRa a = b;
transitiva: aRb e bRc aRc.
Simboli comunemente usati per relazioni di equivalenza sono: , , e simili. I corrispondenti simboli <,
, ecc. si usano allora per indicare che
aRb e a 6= b .
Un ordinamento si dice totale se inoltre vale la propriet`a:
tricotomia: a, b A , aRb o bRa.
Altrimenti si dice che lordinamento `e parziale.
Esempi.
(1) La relazione su R `e un ordinamento totale.
(2) La relazione su P(X) (linsieme dei sottoinsiemi di un insieme X) `e un ordinamento, solo parziale
se X ha almeno due elementi.
(3) La relazione R su N data da
mRn mn
`e un ordinamento parziale.
(4) Se R `e un ordinamento su A, la relazione inversa
R1 = (a, b) : (b, a) R
`e pure un ordinamento.
(5) Se R `e un ordinamento su A e B A, la restrizione di R a B,
R|B = R B 2
`e un ordinamento su B. Se R|B `e un ordinamento totale su B, B si dice una catena di A.
Uno stesso insieme pu`
o ammettere pi`
u ordinamenti. E perci`o corretto dire che un insieme ordinato `e
una coppia (A, ), dove A `e un insieme e un ordinamento su di esso.
5. Funzioni
Una relazione R A B si dice una funzione (o anche applicazione, o mappa, o trasformazione) di A
in B se vale la seguente propriet`
a:
a A, esiste un unico b B tale che aRb.
Si scrive abitualmente R(a) = b invece di (a, b) R. Una funzione R di A in B si indica nella forma
R : A B .
Le seguenti definizioni e notazioni sono standard:
A si chiama il dominio di R e B il suo codominio;
dato A0 A, la restrizione di R ad A0 `e definita da R|A0 = R (A0 B);
linsieme
im R = b B : a A tale che R(a) = b B
si chiama linsieme immagine, o anche solo immagine, di R;
dato A0 A, si chiama immagine di A0 secondo R linsieme
R(A0 ) = b B : a A0 tale che R(a) = b = im R|A0 .
` INSIEMI
6. PRODOTTO CARTESIANO DI PIU
iI
10
E un fatto ovvio che se uno degli insiemi Ai `e vuoto, anche il prodotto cartesiano `e vuoto, perche la
condizione f (i) Ai non pu`
o essere realizzata per quel particolare i. Q
Viceversa, non `e per nulla ovvio che se nessun Ai `e vuoto, allora iI Ai `e non vuoto. Questa affermazione `e in effetti indipendente dagli assiomi della teoria degli insiemi comunemente adottatti (teoria di
Zermelo-Fraenkel, o ZF). Pertanto pu`
o essere indifferentemente accettata per vera oppure no, dando luogo a
due teorie degli insiemi diverse, una pi`
u ampia e laltra pi`
u ristretta. Nella matematica moderna essa viene
comunemente accettata, come assioma aggiuntivo, detto Assioma della scelta.
Le seguenti sono formulazioni equivalenti dellAssioma della scelta.
Il prodotto cartesiano di una famiglia non vuota di insiemi non vuoti `e non vuoto.
Data S
una famiglia {Ai : i I} di insiemi non vuoti a due a due disgiunti, esiste un sottoinsieme
B di iI Ai tale che, per ogni i I, B Ai contenga un unico elemento.
La seconda formulazione giustifica il nome di Assioma della scelta: `e possibile scegliere simultaneamente un elemento da ciascun Ai .
Q Se tutti gli Ai sono uguali tra loro (chiamiamo allora A questunico Iinsieme), il prodotto cartesiano
e linsieme di tutte funzioni f : I A. Esso viene indicato con A .
iI A `
Se I `e finito, tipicamente I = {1, 2, . . . , n}, si usa la notazione An anziche A{1,...,n} , e i suoi elementi
sono le n-uple di elementi di A, indicate abitualmente come (a1 , a2 , . . . , an ).
7. Linsieme dei numeri naturali
Dato un insieme X, chiamiamo successore di X linsieme
S(X) = X {X}.
Un insieme A si dice S-saturo se
(i) A;
(ii) se X A, anche S(X) A.
E facile verificare che lintersezione di insiemi S-saturi `e S-saturo.
Nel sistema assiomatico ZF, lAssioma dellinfinito afferma che:
Assioma dellinfinito. Esistono insiemi S-saturi.
Sia A un insieme S-saturo. Lintersezione N di tutti i suoi sottoinsiemi S-saturi `e un insieme S-saturo.
Vogliamo verificare che questo insieme `e indipendente dalla scelta di A.
Lemma 7.1. Siano A, A0 due insiemi S-saturi e siano N, N0 le intersezioni dei loro rispettivi sottoinsiemi
S-saturi. Allora N = N0 .
Dimostrazione. Si noti che A A0 `e non vuoto e che `e un sottoinsieme S-saturo sia di A che di A0 .
Se ne deduce che N coincide con lintersezione di tutti i sottoinsiemi S-saturi di A A0 . Lo stesso vale anche
per N0 , quindi N = N0 .
Linsieme N si dice linsieme dei numeri naturali. Per il Lemma 7.1, esso `e il piu piccolo insieme
S-saturo esistente, nel senso che `e quello minimo rispetto alla relazione dinclusione. Sono elementi di N gli
insiemi
0=
1 = S(0) = {} = {}
2 = S(1) = {} {} = , {}
n
o
3 = S(2) = , {}, , {}
n
o
4 = S(3) = , {}, , {} , , {}, , {}
ecc.
11
dove 0, 1, 2, . . . sono i simboli convenzionalmente usati. I puntini sospensivi sottintendono lidea intuitiva
che tutti gli elementi di N siano ottenibili iterando loperazione S. Gli enunciati che seguono contengono la
formalizzazione rigorosa di questa idea.
Lo strumento fondamentale per ricavare le propriet`a di N `e il Principio di induzione.
Teorema 7.2 (Principio di induzione). Sia P (n) un enunciato3 dipendente da un numero naturale n.
Se P (n) `e vero per n = 0, e inoltre
P (n) vero = P S(n) vero ,
allora P (n) `e vero per ogni n N.
Dimostrazione. Sia A0 = {n N : P (n) `e vero}. Allora A0 `e un sottoinsieme S-saturo di N. Dunque
N A0 . Ma anche A0 N, per cui A0 = N.
Si noti che, per ogni n N, n S(n). Piu in generale, il seguente risultato evidenzia alcune propriet`
a
di N e della funzione S : N N.
Proposizione 7.3.
(1) Per ogni n, S(n) 6= .
(2) Per ogni n, n
/ n. Di conseguenza, n S(n) (inclusione stretta).
(3) m n m n (inclusione stretta).
(4) m n m S(n).
(5) S(m) = S(n) m = n.
In particolare, S : N N \ {0} `e una corrispondenza biunivoca.
Dimostrazione. Per ogni n, n S(n). Questo dimostra (1).
Dimostriamo ora, per induzione su n, che m n m n. Per n = 0, `e ovvio. Supponiamolo vero per
n e dimostriamo che m S(n) m S(n). Se m S(n) allora si hanno due casi: (i) m n, e quindi per
ipotesi induttiva m n S(n), oppure (ii) m = n, nel qual caso m n {n} = S(n).
Sfruttando questo fatto, dimostriamo (2) per induzione su n. Per n = 0 `e ovvio. Supponiamolo vero
per n e dimostriamo che S(n)
/ S(n). Per assurdo, sia S(n) S(n). Allora S(n) n {n} e quindi (i)
S(n) n oppure (ii) S(n) {n}. Nel primo caso, per quanto visto sopra, S(n) n e quindi n n: assurdo
per ipotesi induttiva. Nel secondo caso S(n) = n e quindi si ritrova lassurdo n n. Questo dimostra (2).
Sfruttando (2) possiamo migliorare laffermazione precedente, dimostrando che m n m n. Questo
dimostra una implicazione nella (3). Laltra implicazione si dimostra di nuovo per induzione su n.
Al punto (4) limplicazione segue immediatamente dalla (2). Supponiamo ora per assurdo che m
S(n) ma m 6 n. Allora, necessariamente, n m. Per la (3), si avrebbe n m, e dunque n{n} = S(n) m,
contro lipotesi.
Dimostriamo ora la (5). Supponiamo che S(n) = S(m). Ne consegue che {n} m {m} e quindi n = m
oppure n m. Nel prima caso, abbiamo verificato la (5). Nel secondo caso, segue dalla (3) che n m e
quindi S(n) = n {n} m m {m} = S(m): assurdo.
Infine, liniettivit`
a di S e lenunciato (5). Se, per assurdo, limmagine di S non contenesse un elemento
n 6= 0, linsieme N \ {n} sarebbe S-saturo, in contrasto con la minimalit`a di N. Quindi, tenendo anche conto
del punto (1), S(N) = N \ {0}.
Osservazione 7.4. Piu in generale, nel sistema ZF lAssioma di regolarit`a permette di dimostrare che
X 6 X per ogni insieme X, e che se X {X} = X 0 {X 0 } allora X = X 0 .
Definiamo una relazione su N come segue:
m n m n.
Per le propriet
a dellinclusione `e chiaro che `e una relazione dordine.
Proposizione 7.5.
3In logica, un enunciato che dipende da una o pi`
u variabili n, x ecc., variabili in dati insiemi, si chiama predicato.
12
` DI INSIEMI
8. CARDINALITA
13
Una volta stabilita la nozione di equipotenza, vogliamo ora dire che certi insiemi sono meno numerosi
di altri. Stabiliamo allora una relazione R su A di minore numerosit`a nel modo seguente:
Siano A, A0 A; diciamo che A R A0 se esiste f : A A0 iniettiva.
La nostra intuizione con insiemi finiti ci dice che se A ha n elementi e A0 ha n0 elementi, esiste una
funzione iniettiva di A in A0 se e solo se n n0 . Dunque la validit`a della relazione A R A0 dipende (per
insiemi finiti) solo dalla cardinalit`
a di A e A0 . Il seguente lemma afferma che ci`o `e vero per insiemi generici.
Lemma 8.1. Supponiamo che A R A0 , e siano B, B 0 A con B A, B 0 A0 . Allora B R B 0 .
Dimostrazione. Per ipotesi, esistono:
(1) f : A A0 iniettiva;
(2) g : B A biiettiva;
(3) h : B 0 A0 biiettiva.
Consideriamo allora la composizione h1 f g : B B 0 ,
h1
B A A0 B 0 .
Possiamo allora passare la relazione R al quoziente modulo , per definire una relazione sullinsieme
quoziente.
Indichiamo con C, C 0 due classi di equivalenza (cardinalit`a).
Diciamo che C C 0 se, presi A C e A0 C 0 , si ha A R A0 .
Il Lemma 8.1 ci assicura che questa `e una buona definizione, ossia che la conclusione A R A0 non dipende
dalla scelta di A e A0 come rappresentanti di C e C 0 rispettivamente.
Vogliamo vedere che `e una relazione dordine sullinsieme delle cardinalit`a. Le propriet`a riflessiva e
transitiva sono facili da verificare. Dimostrare la propriet`a antisimmetrica vuol dire dimostrare il seguente
teorema.
Teorema 8.2 (Teorema di Cantor-Bernstein). Siano A, B due insiemi, e supponiamo che esistano due
funzioni f : A B e g : B A iniettive. Allora A e B sono equipotenti.
Dimostrazione. Sia A1 = f (A) B. Allora f : A A1 `e biiettiva, per cui A A1 . Analogamente,
B B1 = g(B) A. Ricorsivamente, costruiamo
A2k = g(A2k1 ) A ,
A2k+1 = f (A2k ) B ,
B2k = f (B2k1 ) B ,
B2k+1 = g(B2k ) A .
14
A2
B2
A1
B1
B
f
(8.1)
B A1 B2 A2k1 B2k
e che
An A ,
Bn B ,
n .
k>0
k0
[
[
(A2k \ B2k+1 )
(B2k+1 \ A2k+2 ) C .
k1
k0
In entrambi i casi, tutti gli insiemi a secondo membro sono disgiunti a due a due.
Per dimostrare che A B1 `e dunque sufficiente dimostrare lesistenza di una applicazione biiettiva
[
[
h:
(A2k \ B2k+1 )
(A2k \ B2k+1 ) .
k0
k1
` DI P(A)
9. CARDINALITA
15
Infatti, una volta ottenuta una tale funzione h, si pu`o costruire la funzione H : A B1 cos` definita:
(
S
H(x) = h(x) se x k0 (A2k \ B2k+1 ) ,
S
H(x) = x
se x
k0 (B2k+1 \ A2k+2 ) C .
E facile allora dimostrare che H `e biiettiva.
Per costruire h, osserviamo che g f applica A2k biiettivamente su A2k+2 e B2k+1 biiettivamente su
B2k+3 . Scomponendo
A2k = B2k+1 (A2k \ B2k+1 )
A2k+2 = B2k+3 (A2k+2 \ B2k+3 ) ,
si conclude che g f S
applica A2k \ B2k+1 biiettivamente su A2k+2 \ B2k+3 . Basta allora definire h come la
restrizione di g f a k0 (A2k \ B2k+1 ).
Corollario 8.3. La relazione tra cardinalit`
a `e un ordinamento.
Si noti che per il momento abbiamo solo dimostrato che `e un ordinamento parziale. Come vedremo
pi`
u avanti, facendo uso dellAssioma della scelta, si dimostra che si tratta di un ordinamento totale.
9. Cardinalit`
a di P(A)
Linsieme P(A) delle parti di A `e linsieme di tutti i sottoinsiemi di A. Dimostriamo due propriet`a della
sua cardinalit`
a:
Teorema 9.1. Valgono le seguenti relazioni:
(i) card P(A) = card {0, 1}A ;
(ii) card P(A) card A.
Dimostrazione. Per dimostrare la (i), construiamo la funzione : P(A) {0, 1}A cos` definita: dato
A A, (A0 ) = A0 , la funzione caratteristica di A0 , tale che
(
1 se a A0
A0 (a) =
0 se a 6 A0 .
0
16
17
Mostriamo ora alcune applicazioni del Lemma di Zorn, rinviandone la dimostrazione al paragrafo
successivo. La prima applicazione riguarda lordinamento tra cardinalit`a.
Teorema 11.2. Dati due insiemi A e B, esiste sempre una funzione iniettiva di A in B o di B in A. Quindi
lordinamento tra cardinalit`
a `e totale.
Dimostrazione. La conclusione `e ovvia se A o B `e vuoto (si prenda la funzione vuota). Supponiamo
dunque che A e B siano non vuoti.
Indichiamo con X linsieme delle funzioni biiettive f : A0 B 0 , dove A0 A, B 0 B. Chiaramente X
non `e vuoto, perche, fissati a A e b B, la funzione f : {a} {b} tale che f (a) = b `e biiettiva.
Per dimostrare la tesi, occorre dimostrare lesistenza di una funzione f X che abbia come dominio
tutto A, oppure come immagine tutto B. Nel primo caso, allargando il codominio di f da B 0 a B, otteniamo
una funzione iniettiva da A in B; nel secondo caso, facciamo la stessa operazione su f 1 : B A0 , ottenendo
una funzione iniettiva di B in A.
Su X definiamo il seguente ordinamento:
(f : A0 B 0 ) (g : A00 B 00 ) , A0 A00 , B 0 B 00 e f = g|A0 ,
(in termini puramente insiemistici, f A0 B 0 , g A00 B 00 ; allora f g se e solo se f g).
Si verifica facilmente che `e una relazione dordine (parziale a meno che A e B non contengano un
unico elemento). Mostriamo che (X, ) `e induttivo.
S
= S Bi , e sia f : A B
18
a A,
a f (a) .
Lemma 12.2. Sia (A, ) strettamente induttivo e sia f una funzione di A in se che soddisfi la propriet`
a
(12.1). Dato a A, esiste una catena C di A tale che
(i) a = min C;
(ii) C ha massimo;
(iii) f (C) C.
Dimostrazione. Chiamiamo S linsieme dei sottoinsiemi S A tali che
(1) a = min S;
(2) f (S) S;
(3) se C `e una catena di S, sup C S.
Ovviamente S = {x A : a x} S, per cui S non `e vuoto. Sia
\
M=
S.
SS
Si verifica facilmente che M S. Se dimostriamo che M `e totalmente ordinato, la tesi `e dimostrata con
C = M.
6Gli insiemi induttivi introdotti nel paragrafo precedente sono tutti strettamente induttivi.
19
Corollario 12.3. Sia (A, ) un insieme ordinato strettamente induttivo e sia f : A A tale che f (a) a
per ogni a A. Per ogni a A esiste allora un elemento m a tale che f (m) = m.
Dimostrazione. Dato a, sia C la catena costruita nel Lemma 4.3, e sia m il suo massimo. Poiche
f (C) C, f (m) C, ma essendo f (m) m, deve necessariamente essere f (m) = m.
Conclusione della dimostrazione del Lemma di Zorn.
Per ogni b A, poniamo
(
{b}
Xb =
{x A : x > b}
se b `e massimale
altrimenti.
S
Ciascun Xb `e non vuoto, e per lassioma della scelta esiste una funzione f : A bA Xb tale che
f (b) Xb per ogni b A. Per il Corollario 12.3, dato a A, esiste m a tale che f (m) = m. Ma ci`
o
equivale a dire che m `e massimale.
20
Come si vede, nella dimostrazione `e stato usato il Lemma di Zorn, ossia lAssioma della scelta. In realt`
a
il Teorema di Zermelo `e equivalente allAssioma della scelta, come ora dimostriamo.
Teorema 13.2. Supponiamo che ogni insieme ammetta un buon ordinamento. Allora il prodotto cartesiano
di qualunque famiglia non vuota di insiemi non vuoti `e non vuoto.
S
Dimostrazione. Sia A = {Ai : i I} la famiglia di insiemi. Sia A = iI Ai la loro unione. Scegliamo
un buon ordinamento su A. Allora, per ogni i I, il sottoinsieme Ai di A ammette un minimo ai . La
funzione
f : I A,
i 7 ai
`e un elemento del prodotto cartesiano iI Ai .
Si noti che la definizione di f non richiede alcuna scelta arbitraria: in particolare questa definizione non
richiede lAssioma della scelta.
Sugli insiemi bene ordinati vale la seguente forma estesa del principio di induzione.
Proposizione 13.3. Sia (A, ) un insieme bene ordinato con minimo a0 e sia P (a) un enunciato dipendente
da a A. Se
(
P (a0 ) `e vero
P (a0 ) vero per ogni a0 < a = P (a) `e vero ,
allora P (a) `e vero per ogni a A.
CAPITOLO 2
m, n N ,
m N ,
1Rimane inteso che useremo la notazione m + n, abituale per le operazioni, in luogo di +(m, n), che sarebbe appropriata
alla definizione di + come funzione.
21
22
m, n, p N .
(2.1)
(m, n) Z (p, q) m + q n + p .
23
Segue pure dalla Proposizione 1.2 che ogni classe di equivalenza contiene un unico elemento della forma
(n, 0), oppure della forma (0, n) con n 1. Si ha allora
Z = (n, 0) : n N (0, n) : n N \ {0} .
Inoltre, se 0 < m < n,
(0, n) <Z (0, m) <Z (0, 0) <Z (m, 0) <Z (n, 0) .
Le operazioni di somma e prodotto su Z si definiscono come segue:
(m, n) + (p, q) = (m + p, n + q) ,
(m, n) (p, q) = (mp + nq, np + mq) .
Una
(1)
(2)
(3)
(4)
(5)
(n
,
m
)
+
(p,
q)
;
Z
(8) se (m, n) Z (0, 0) e (p, q) Z (0, 0) , anche (m, n) (p, q) Z (0, 0) .
Le (1)-(8) forniscono le abituali regole dellaritmetica. Le propriet`a (1)-(5) si riassumono dicendo che Z
`e un anello commutativo. Valendo la (6), Z `e, pi`
u precisamente, un dominio di integrit`
a.
Dora in poi adottiamo la abituale notazione semplificata, con n, n e in luogo di (n, 0) , (0, n) ,
Z rispettivamente.
3. Dagli interi relativi ai razionali
Con un procedimento non molto diverso,
si arriva a costruire il campo Q dei numeri razionali a partire
da Z. Sul prodotto cartesiano Z N \ {0} consideriamo la relazione di equivalenza
(m, n) (m0 , n0 ) mn0 = nm0 ,
e indichiamo con m
e
n la classe di equivalenza di (m, n). Con questa convenzione, si verifica facilmente che `
ben definita la relazione dordine
m0
m
0 mn0 nm0 ,
n
n
e che sono ben definite le abituali operazioni di somma e prodotto.
In aggiunta alle propriet`
a (1)-(8) presentate per Z, valgono su Q le seguenti altre propriet`a:
p
(9) ogni elemento m
n 6= 0 ha un inverso, ossia un elemento q tale che
m p
(10) vale la propriet`
a archimedea: dati n , q > 0, esiste k N tale che
m
p
k
> .
n
q
mp
n q
= 1;
24
`e pure una sezione. Infatti `e non vuota ed `e superiormente limitata perche contenuta in S . Se S 0 avesse
massimo, questo massimo apparterrebbe a una sezione S E, e dunque S avrebbe un massimo, il che `e
assurdo. Infine, dato q S 0 , esiste S E tale che q S. Se q 0 < q, allora q 0 S, e dunque q 0 S 0 .
Chiaramente S 0 `e un maggiorante di E, perche S S 0 per ogni S E. Daltra parte, ogni maggiorante
5. Operazioni su R
Siano S, S 0 due sezioni di Q. Definiamo
S + S 0 = {q + q 0 : q S , q 0 S 0 } .
Lemma 5.1. S + S 0 `e una sezione di Dedekind di Q. Inoltre, per ogni p, p0 Q, Sp + Sp0 = Sp+p0 .
3Spesso diremo semplicemente sezione.
4Lo si dimostri per esercizio.
5Il simbolo indica inclusione stretta.
5. OPERAZIONI SU R
25
26
Per verificare che S 0 S0 (cio`e y > 0), prendiamo p S con 0 < p 1. Allora pn p `e pure in S,
n
dunque p S 0 . Si vede facilmente che S 0 = S.
6. Campi
Definizione 6.1. Si chiama campo un insieme F dotato di due operazioni, indicate con + e e dette
rispettivamente somma e prodotto, che soddisfino le seguenti propriet`
a:
(a) propriet`
a commutativa di entrambe:
x, y F ,
xy =yx ;
x+y =y+x ,
(b) propriet`
a associativa di entrambe:
x, y, z F ,
(x y) z = (x (y z) ;
(x + y) + z = x + (y + z) ,
(c) propriet`
a distributiva della somma rispetto al prodotto:
x, y, z F ,
(x + y) z = x z + y z ;
(d) le due operazioni ammettono elementi neutri distinti (abitualmente indicati con 0 e 1 rispettivamente) cio`e tali che 0 6= 1 e
x F ,
x+0=x ,
x1=x ;
x + x0 = 0 ;
x x00 = 1 ;
Esempi.
Q, R, C;7
F = {p + q 2 : p, q Q} con le operazioni indotte da R;
se p `e un numero
P primo, Zp = {0, 1, . . . , p 1} con le operazioni intese modulo p;
F = F0 (x) = Q }, dove P e Q sono polinomi a coefficienti in un campo F0 e Q non `e il polinomio
nullo, con le normali operazioni algebriche tra funzioni razionali.
Dagli assiomi (a)-(f) che definiscono i campi, seguono numerose propriet`a generali, di cui elenchiamo le
principali:
dato x0 F , se esiste y tale che x0 + y = y, allora x0 = 0; in particolare F ammette un unico
elemento neutro per la somma;
dato x0 F , se esiste y 6= 0 tale che x0 y = y, allora x0 = 1; in particolare F ammette un unico
elemento neutro per il prodotto;
lopposto di un elemento di F e linverso di un elemento non nullo di F sono unici; essi vengono
indicati rispettivamente con x e x1 (o anche con 1/x);
(x + y) = x + (y), (xy)1 = x1 y 1 ;
(x) = x, (x1 )1 = x;
per ogni x, x 0 = 0 e x (1) = x;
x y = 0 x = 0 o y = 0.
7Il campo complesso C non sar`
a trattato in questi appunti. Si rinvia al testo universitario.
7. CAMPI ORDINATI
27
x, y F ,
(x y) = (x) (y) .
(x + y) = (x) + (y) ,
0
(1F ) = 1F 0 ,
(x) = (x) ,
(x1 ) = (x)1 ;
Necessariamente, (0) = 0F e 1 = 1F .
def
(n) = 1F + + 1F = nF .
|
{z
}
n volte
n
Questa `e una buona definizione, perche sostituendo (mk)/(nk) al posto di m/n si ottiene lo stesso
risultato. Inoltre, prendiamo m/n < m0 /n0 in Q, supponendo n, n0 > 0. Allora (n), (n0 ) > 0F , e dunque
mn0 < m0 n = (m)(n0 ) < (m0 )(n) = (m) (n)1 < (m0 ) (n0 )1 .
Quindi `e strettamente crescente e le condizioni (6.1) si verificano facilmente.
+
Definizione 7.3. Un campo ordinato F si dice archimedeo se, dati x, y > 0, esiste n N tale che nF x > y.
Proposizione 7.4. Sia F un campo ordinato. Le seguenti propriet`
a sono equivalenti:
(i) F `e archimedeo;
(ii) NF = (N) non `e superiormente limitato in F ;
28
n
<
y.
F
F
F
F
Esempio. Su F = R(x), il campo delle funzioni razionali a coefficienti reali, consideriamo il seguente
ordinamento: P/Q R/S se esiste una semiretta (a, +) R tale che P (x)/Q(x) R(x)/S(x) per ogni
x (a, +).
Si dimostri per esercizio che: (a) questo `e un ordinamento totale; (b) sono soddisfatte le condizioni della
Definizione 7.1; (c) F non `e archimedeo. Si verifichi con opportuni controesempi che per F non vale nessuna
delle propriet`
a (ii), (iii), (iv) della Proposizione 7.4.
8. Campi ordinati completi
Definizione 8.1. Un campo ordinato si dice completo se ogni suo sottoinsieme non vuoto e superiormente
limitato ha estremo superiore.
Lemma 8.2. Un campo ordinato e completo `e archimedeo.
Dimostrazione. Sia F ordinato e completo, e supponiamo per assurdo che non sia archimedeo. Allora
NF sarebbe superiormente limitato, e dunque ammetterebbe estremo superiore s F . Ma dalla condizione
s nF per ogni n N segue che anche s 1F nF per ogni n N. Ma allora s 1F < s sarebbe un
maggiorante di NF , da cui lassurdo.
Teorema 8.3. Sia F un campo ordinato completo. Lomomorfismo si estende a un isomorfismo strettamente crescente di R su F . Quindi ogni campo ordinato completo `e isomorfo a R.
Dimostrazione. Per t R, poniamo
(t)
= sup (q) : q Q , q < t .
Tale elemento (t)
`e certamente definito, perche linsieme `e maggiorato da un qualunque elemento (r)
con r Q, r > t. Dimostriamo una per una le propriet`a che ci fanno concludere che `e un omomorfismo
strettamente crescente che estende .
(1) Per ogni q Q, (q)
(q) `e ovvia. Per la (iv) della Proposizione 7.4, dato x < (q) esiste q 0 < q tale che x < (q 0 ) < (q). Quindi non si pu`o avere
(q)
< (q).
29
(2) `e strettamente crescente, dunque iniettiva: se t < u R, esistono q1 , q2 Q, t < q1 < q2 < u.
Quindi (t)
(q1 ) < (q2 ) (u).
.
Passando quindi allestremo superiore rispetto ai q < t + u, si ottiene che (t
+ u) (t)
+ (u).
(t
+ u).
(5) per ogni t, u R, (tu)
= (t)
(u):
= 0 e (t)
= (t).
Quindi
basta considerare il caso t, u > 0. Si procede in modo analogo a (4).
Corollario 8.4. Ogni campo ordinato archimedeo `e isomorfo a un sottocampo di R.
Dimostrazione. Si consideri lapplicazione 1 : QF R. Essendo F archimedeo, lapplicazione
: F R definita da
(x) = sup{1 (qF ) : qF QF , qF < x} ,
1
`e iniettiva ed estende . Una ripetizione, opportunamente adattata, degli argomenti usati nella dimostrazione del Teorema 8.3 mostra che `e un omomorfismo. Per liniettivit`a, `e un isomorfismo di F sulla sua
immagine (F ) R.
CAPITOLO 3
(1.1)
|an | M |bn | .
n n0 ,
an
an + o(an )
= lim
,
n
cn + o(cn )
cn
31
32
cn = O(an ) cn = O(bn )
cn = o(an ) cn = o(bn ) .
an = o(bn ) ` = 0 ,
an bn ` R \ {0} .
Siano (an )nN a, (bn )nN b. Le due condizioni an = o(bn ) e a b non coincidono ne una
delle due implica laltra. Si consideri infatti che la successione identicamente nulla `e o di se stessa,
quindi an = o(bn ) 6 a b. Si prendano poi, ad esempio, le successioni
(
n se n `e pari
an =
,
bn = n ;
1 se n `e dispari
i rispettivi ordini di grandezza a e b soddisfano la condizione a b, ma an 6= o(bn ).
Introduciamo ora una relazione di equivalenza pi`
u fine di .
Definizione 1.6. Siano (an )nN , (bn )nN due successioni. Diciamo che esse sono asintoticamente equivalenti (notazione: an bn ) se an bn = o(bn ).
Che sia una relazione di equivalenza `e parte del seguente enunciato.
Proposizione 1.7.
(i) Vale limplicazione an bn = an bn .
(ii) La relazione `e una relazione di equivalenza tra successioni.
(iii) Se i termini bn sono definitivamente diversi da 0, e il rapporto an /bn ammette limite, allora
an
=1.
an bn lim
n bn
33
ossia se an = cn + o(n ) ,
n2 n .
n2 n
=1,
n
n
an `e infinita di ordine 1 con parte principale n. Quindi
p
n2 n = n + o(n) .
Il resto rn = n2 n n, che sappiamo essere o(n) pu`o essere a sua volta analizzato, osservando che
n
1
lim rn = lim
= .
2
n
n
2
n n+n
Quindi
1
an = n + rn = n + o(1) ,
2
dove o(1) indica ovviamente un generico infinitesimo. Analizziamo dunque il nuovo resto
1
p
1
4
rn0 = n2 n n + =
.
2
n2 n + n 12
lim
34
1
Questo `e infinitesimo di ordine 1 con parte principale . Quindi
8
1
1
+ o(n1 ) .
an = n
2 8n
Iterando questo procedimento, `e possibile, calcolando iterativamente i coefficienti ck , giungere per ogni
k a una formula
ck
1
1
c2
+ + k + o(nk ) .
an = n
+
2 8n n2
n
Questo tipo di formula costituisce lo sviluppo asintotico dei termini an della successione data.
Osservazione 2.1. Le definizioni e notazioni introdotte in questi due paragrafi vengono utilizzate anche per
funzioni di variabile reale. Siccome esse possono riguardare sia il comportamento asintotico di una funzione
per x , sia quello per x x0 con x0 R, `e necessario accompagnare le espressioni f (x) = O g(x) ,
f (x) g(x), ecc. dallindicazione del punto, finito o infinito, verso cui si intendono i limiti o nel cui intorno
devono valere le maggiorazioni. Per esempio, si scrive
sin x x (x 0) ,
per esprimere che limx0
oppure
sin x x0 x ,
sin x
= 1.
x
3. Teoremi di Cesaro
Sia (an )nN una successione di numeri reali. Si chiama media di Cesaro n-esima della successione data
la media aritmetica dei termini a0 , . . . , an :
n
(3.1)
n =
a0 + a1 + + an
1 X
=
ak .
n+1
n+1
k=0
Teorema 3.1 (Primo teorema di Cesaro). Se la successione (an )nN tende al limite ` (finito o infinito),
anche la successione (n )nN tende a `.
Dimostrazione. Consideriamo per primo il caso in cui ` = +. Dato un numero M > 0, esiste un
indice n0 tale che, per ogni n n0 , an > 2M . Se n n0 si ha dunque
a0 + + an0 1
n n0
n >
+ 2M
.
n+1
n+1
Essendo
a + + a
n n0
0
n0 1
lim
+ 2M
= 2M ,
n
n+1
n+1
a0 + + an0 1
n n0
esiste un indice n1 n0 tale che, per n n1 ,
+ 2M
> M , e dunque n > M . Quindi
n+1
n+1
limn n = +.
Per il caso ` = basta sostituire alla successione degli an la successione dei an .
Supponiamo ora che il limite ` sia finito. Sostituendo alla successione degli an la successione dei bn =
an `, e osservando che le medie di Cesaro n dei bn sono n = n `, possiamo ridurci al caso ` = 0.
Dato > 0, esiste un indice n0 tale che, per ogni n0 , |bn | < /2. Allora, per n n0 ,
|n |
|b0 | + + |bn0 1 | n n0
+
.
n+1
2 n+1
Essendo
|b | + + |b
n n0
0
n0 1 |
+
= ,
n
n+1
2 n+1
2
esiste un indice n1 n0 tale che, per n n1 , |n | < . Quindi limn n = 0.
lim
3. TEOREMI DI CESARO
35
Limplicazione inversa a quella dimostrata nel teorema, limn n = ` = limn an = ` non `e vera.
E possibile infatti che le medie n abbiano limite e che gli an non lo abbiano. Per esempio, si prenda
an = (1)n , le cui medie di Cesaro, uguali a
(
0
se n `e dispari
n =
1
se
n `e pari ,
n+1
tendono a 0.
Corollario 3.2. Sia (an )nN una successione di numeri reali, e si supponga che limn (an+1 an ) = `
(finito o infinito). Allora limn an /n = `.
Dimostrazione. Si consideri la successione (bn )nN , dove b0 = a0 e, per n 1, bn = an+1 an . Le
medie di Cesaro dei bn sono
b0 + + bn
an+1
n =
=
.
n+1
n+1
Quindi limn an /n = limn n1 = `, per il Teorema 3.1.
Si noti che in realt`
a il Corollario 3.2 `e equivalente al primo teorema di Cesaro. Basta osservare che
la (3.1) `e equivalente allidentit`
a
an = nn (n 1)n1 .
Quindi, applicando il Corollario 3.2 alla successione (nn )nN , si ottiene il Teorema 3.1.
Teorema 3.3 (Secondo teorema di Cesaro). Sia (an )nN una successione di numeri reali strettamente
positivi. Se limn an = ` (finito o infinito), anche la successione delle medie geometriche
n = n a0 a1 an
tende a `.
Dimostrazione. Osserviamo che, essendo an > 0 per ogni n, si ha necessariamente ` 0.
Supponiamo ` = +. Dato un numero M > 0, esiste un indice n0 tale che, per ogni n n0 , an > 2M .
Se n n0 si ha dunque
p
nn0
1
n > (a0 a1 an0 ) n (2M ) n = 2M n a0 a1 an0 (2M )n0 .
Poiche limn n b = 1 per ogni b > 0, esiste n1 n0 tale che n > M per ogni n n1 .
Per il caso ` = 0, basta sostituire agli an i loro reciproci 1/an .
Consideriamo dunque il caso 0 < ` < +. Sostituendo gli an con an /`, possiamo supporre che ` = 1.
Dato > 0, esiste un indice n0 tale che, per ogni n n0 , 1 2 < an < 1 + 2 . Allora, se n n0 ,
nn
nn
1
1
n 0
n 0
(a0 a1 an0 ) n 1
< n < (a0 a1 an0 ) n 1 +
.
2
2
Il limite del primo termine `e 1 2 , e il limite del terzo termine `e = 1 + 2 . Quindi esiste un indice
n1 n0 tale che, per n n1 , 1 < n < 1 + .
Usando la continuit`
a delle funzioni logaritmo ed esponenziale (che qui non diamo ancora per note), il
Teorema 3.3 si ottiene pi`
u semplicemente applicando il Teorema 3.1 alla successione log an . E fondamentale,
per la validit`
a del teorema 3.3 che gli an siano tutti strettamente positivi. Se uno solo di essi `e nullo, da
quellindice in poi tutte le medie n sono nulle, e tendono quindi a 0 indipendentemente dal limite degli an .
Corollario 3.4. Sia (an )nN una successione di numeri reali strettamente positivi, e si supponga che
36
4. Teorema di Stolz-Cesaro
Il Teorema di Stolz-Cesaro pu`
o essere visto come una forma discretizzata della regola di de lH
opital.
La discretizzazione si riferisce, in una analogia tra funzioni della variabile continua x R e funzioni
(successioni) della variabile intera n N, a una corrispondenza tra operazioni del calcolo differenziale e
integrale da un lato e operazioni aritmetiche dallaltro, come quelle indicate in tabella:
Continuo
Discreto
derivata: f 0 (x)
differenza: an+1 an
integrale:
Ra
0
somma: sn = a0 + + an
f (x) dx
media integrale:
1
a
Ra
integrale improprio:
media di Cesaro:
f (x) dx
R +
0
f (x) dx
a0 ++an
n+1
n=0
an
Teorema 4.1 (Teorema di Stolz-Cesaro). Siano (an )nN , (bn )nN due successioni. Si supponga che
(i) (bn )nN sia strettamente monotona;
(ii) valga una delle seguenti condizioni:
(4.1)
lim an = lim bn = 0 ,
oppure
lim bn = + (oppure ) ;
(4.2)
(iii) lim
an+1 an
= `, finito o infinito.
bn+1 bn
Allora
(4.3)
an
=`.
n bn
lim
Si noti che nel caso (4.1), il limite (4.3) si presenta nella forma indeterminata 0/0, mentre il caso (4.2)
comprende quello di limiti nella forma indeterminata /. Si noti anche che il teorema nella forma (4.2)
comprende il Corollario 3.2 come caso particolare.
Dimostrazione. Consideriamo separatamente i quattro casi, secondo che valga la (4.1) o la (4.2) e
secondo che ` sia finito o infinito.
Forma indeterminata 0/0, ` infinito.
A meno di cambiar segno ai termini di una, o di entrambe le successioni, possiamo supporre che la
successione (bn )nN sia strettamente decrescente, e dunque bn > 0 per ogni n, e inoltre che ` = +.
Fissato M > 0, esiste n0 N tale che, per ogni n n0 ,
an+1 an
> M , ossia an an+1 > M (bn bn+1 ) .
bn+1 bn
4. TEOREMA DI STOLZ-CESARO
37
38
k=1
1
np+1
p+1
(n ) ,
e che, per p = 1, si ha
n
X
1
log n (n ) .
k
(4.5)
k=1
(4.6)
( 1 , x 1) ,
si dimostri che la formula (4.4) si estende a p R, p > 1, e infine che, per p > 1,
X
1
1
1
(n ) .
p
p1
k
p1 n
k=n
CAPITOLO 4
iI
iI
iI
Dimostrazione. La disuguaglianza
X
(1.1)
sup
ai
F F
iF
sup
iF
ai =
F Pf (I) iF
ai
iI
F F
iF 0
39
iF
40
Prendendo lestremo superiore delle somme a primo membro al variare di F in Pf (I), si conclude che
X
X
(1.2)
ai sup
ai .
F F
iI
iF
Corollario 1.5. Sia I = N e sia (an )nN una successione a termini non negativi. La definizione di sommatoria secondo la Definizione 1.1 coincide con quella di somma della serie (cio`e come limite delle somme
parziali).
Dimostrazione. Basta osservare che F = {0, 1, . . . , n} : n N soddisfa le ipotesi della Proposizione 1.4.
Come vedremo al paragrafo 5, la stessa equivalenza non varr`a pi`
u per successioni di segno generico.
2. Limiti lungo insiemi ordinati filtranti
La nozione di sommatoria di termini (ai )iI non negativi `e stata data come un estremo superiore di
somme finite, e questo ha consentito di definirla per un insieme generico I infinito.
Per estendere la nozione di sommatoria a termini di segno qualunque, `e necessario esprimerla come
limite. Per far questo, occorre introdurre la nozione di insieme ordinato filtrante e di limite di una funzione
definita su un insieme filtrante.
Definizione 2.1. Un insieme ordinato (X, ) si dice filtrante se, dati comunque x, y X, esiste z X tale
che x z e y z.
Linsieme filtrante a cui saremo interessati `e X = Pf (I), con I infinito, ordinato per inclusione.
E inoltre filtrante un qualunque insieme non vuoto, totalmente ordinato e privo di massimo. medskip
Definizione 2.2. Sia (X, ) un insieme ordinato filtrante e sia f : X R. Si dice che ` R `e limite di
f lungo X, e si scrive
` = lim f (x) ,
xX
|f (x) `| < .
1 Un sottoinsieme Y di X si dice cofinale in X se per ogni x X esiste y Y tale che x y. Questa definizione estende
a generici insiemi filtranti la Definizione 1.3.
41
iI
iF
se tale limite esiste. La sommatoria si dice convergente, divergente o indeterminata secondo che il limite
esista finito, esista infinito o non esista rispettivamente.
Per F Pf (I), poniamo
s(F ) =
ai .
iF
Dimostriamo subito, per funzioni a termini non negativi, lequivalenza di questa definizione con la
Definizione 1.1.
Proposizione 3.2. Se ai 0 per ogni i I, allora
lim
F Pf (I)
s(F ) =
sup
s(F ) .
F Pf (I)
Dimostrazione. Se gli ai sono non negativi, la funzione s(F ) `e crescente su Pf (I). La tesi segue allora
dallEsercizio (2).
Nel resto di questo paragrafo, dimostreremo che una sommatoria converge se e solo se converge la sommatoria dei suoi valori assoluti. Per cominciare, diamo unapposita formulazione del criterio di convergenza
di Cauchy adattata alle sommatorie su insiemi infiniti.
P
Lemma 3.3 (Criterio di convergenza di Cauchy per sommatorie infinite). La sommatoria iI ai
converge se e solo se per ogni > 0 esiste un insieme F0 Pf (I) tale che, per ogni F Pf (I) disgiunto da
F0 , si abbia |s(F )| < .
Dimostrazione. Supponiamo che la sommatoria converga a s R. Allora, dato > 0 esiste F0 Pf (I)
tale che |s(F 0 ) s| < per ogni F 0 F0 finito. Dato F finito e disgiunto da F0 , si consideri F 0 = F F0 .
Allora
|s(F )| = |s(F 0 ) s(F0 )| |s(F 0 ) s| + |s s(F0 )| < 2 .
Viceversa, si supponga che, dato > 0, esista un insieme F0 Pf (I) tale che, per ogni F Pf (I)
disgiunto da F0 , si abbia |s(F )| < . Si considerino due sottoinsiemi finiti di I, F 0 e F 00 , entrambi contenenti
F0 . Allora le due differenze F 0 \ F 00 e F 00 \ F 0 sono entrambe disgiunte da F0 . Quindi s(F 0 \ F 00 )| < e
analogamente per s(F 00 \ F 0 ). Osservando che
s(F 0 ) s(F 00 ) = s(F 0 \ F 00 ) s(F 00 \ F 0 ) ,
si ottiene che
|s(F 0 ) s(F 00 )| |s(F 0 )| + |s(F 00 )| < 2 .
Per il criterio di convergenza di Cauchy, v. Esercizio (8), la sommatoria converge.
iI
iI
iI
42
(F ) =
|ai | .
iF
iF
(3.2)
Supponiamo che converga la serie dei valori assoluti degli ai . Allora, dato > 0, esiste F0 Pf (I) tale
che, per ogni F Pf (I) disgiunto da F0 , (F ) < . Per la (3.2) e il criterio di convergenza di Cauchy, anche
la sommatoria degli ai converge.
Viceversa, supponiamo che converga la serie degli ai . Allora, dato > 0, esiste F0 Pf (I) tale che, per
ogni F Pf (I) disgiunto da F0 , |s(F )| < . Fissato un tale F , lo si scomponga nellunione disgiunta di
F+ = {i F : ai 0} ,
F = {i F : ai < 0} .
(F ) = (F+ ) + (F ) < 2 ,
e, per il criterio di convergenza di Cauchy, anche la sommatoria dei |ai | converge.
Infine, dalla (3.2) si ricava che, per ogni F Pf (I),
X
s(F ) sup (F 0 ) =
|ai | .
F 0 Pf (I)
iI
Passando al limite,
X
ai =
iI
lim
F Pf (I)
X
s(F )
|ai | .
iI
Dimostriamo ora che una sommatoria convergente su un insieme I si pu`o scomporre in una sommatoria
(finita o infinita) di sommatorie parziali.
2
Teorema 3.5.
P Sia {Ik }kK una partizione dellinsieme I, e sia (ai )iI una funzione da I a R. Allora la
sommatoria iI ai converge se e solo se valgono le seguenti propriet`
a:
P
(i) per ogni k K, iIk |ai | converge;
P
P
(ii) posto sk = iIk |ai |, la sommatoria kK sk converge.
In tal caso,
X
XX
(3.3)
ai =
ai .
iI
kK
iIk
F Pf (I)
kE
Fk Pf (I), si ha
kE
2Nelle applicazioni, K sar`
a finito o numerabile. Si noti che sia linsieme K, sia uno o pi`
u degli insiemi Ik possono essere
finiti. In tal caso la condizione di convergenza della corrispondente sommatoria `
e automaticamente verificata. Per completezza
di dimostrazione, si assumer`
a implicitamente che tutti questi insiemi siano infiniti.
43
Dallinsieme E isoliamo un suo singolo elemento k0 e teniamo a primo membro il termine corrispondente:
X
s(Fk0 ) s
s(Fk ) .
kE\{k0 }
Mantenedo fissati gli Fk a secondo membro, prendiamo lestremo superiore al variare di Fk0 in Pf (Ik0 ).
Si ottiene che
X
X
ai s
s(Fk ) .
iIk0
kE\{k0 }
In particolare, la sommatoria iIk ai converge, e la propriet`a (i) `e soddisfatta. Chiamiamo sk0 la sua
0
somma. Abbiamo allora la disuguaglianza
X
sk0 +
s(Fk ) s .
kE\{k0 }
Ripetendo lo stesso procedimento iterativamente per ognuno degli altri elementi di E, si ottiene che
X
sk s .
kE
Passando allestremo superiore rispetto a E Pf (K), si ottiene la condizione (ii), e inoltre che
X
X
(3.4)
sk
ai .
iI
kK
Supponiamo viceversa che siano soddisfatte le condizioni (i) e (ii). Dato F Pf (I), poniamo, per k K,
Fk = F Ik , e inoltre chiamiamo E Pf (K) linsieme dei k per cui Fk 6= . Essendo F lunione disgiunta
degli Fk con k E, si ha allora
X
X
X
s(F ) =
s(Fk )
sk
sk .
kE
kE
kK
kK
Abbiamo dunque dimostrato, nel caso ai 0 per ogni i, lequivalenza tra la convergenza della sommatoria
su I da un lato, e le condizioni (i) e (ii) dallaltro. Inoltre, le due disuguaglianze (3.4) e (3.5) forniscono
luguaglianza (3.3).
Consideriamo ora il caso generale. Poniamo
a
i = max{ai , 0} .
P
iI ai converga. Allora, per il Teorema 5.1,
iI |ai | converge. Essendo
a+
i = max{ai , 0} ,
Seupponiamo che
0 a
i |ai | ,
anche le due sommatorie
(3.6)
iI
a
i convergono. Inoltre, essendo ai = ai ai ,
X
X
X
ai =
a+
a
i
i .
iI
iI
iI
Applicando quanto dimostrato per sommatorie a termini positivi, possiamo allora affermare che
P
P
per ogni k K, le due sommatorie iIk a+
a
i ,
i convergono,
iIkP
P
0
00
chiamate sk , sk le rispettive somme, le sommatorie kK s0k , kK s00k convergono,
P
P
P
P
+
0
00
kK sk =
iI ai ,
kK sk =
iI ai .
Da questo si deduce che
P
per ogni k K, sk = iIk |ai | = s0k + s00k , e dunque vale la (i),
P
P
PkK sk = iI |ai |, e dunque vale la (ii),
0
00
iIk ai = sk sk ,
44
0
kK (sk
s00k ) =
iI
a+
i
a
i =
iI
iI
Rimane da dimostrare limplicazione inversa. Supponiamo che valgano (i) e (ii). Per confronto, le stesse
Ma allora
X
iI
kK
iIk
ai converge e
X
X
XX XX XX
ai =
a+
a
=
a+
a
=
ai .
i
i
i
i
iI
iI
iI
kK
iIk
iIk
kK
kK
iIk
4. Sommatorie a pi`
u indici
Supponiamo che linsieme I degli indici di una sommatoria sia il prodotto cartesiano di k insiemi,
I = I1 I2 Ik ,
di modo che la sommatoria assume la forma a pi`
u indici
X
Per semplicit`
a di notazioni ci limiteremo a considerare il caso k = 2, denotando con I e J, anziche I1
e I2 , i due insiemi di indici. I risultati che dimostreremo hanno naturali estensioni al caso generale, che
vengono lasciate per esercizio.
Ci interessa discutere la validit`
a di alcune propriet`a che sono ovvie per somme finite, in particolare:
la sommazione per orizzontali o per verticali:
X
XX XX
(4.1)
aij =
aij =
aij .
(i,j)IJ
jJ
iI
iI
jJ
la propriet`
a distributiva:
(4.2)
X
(i,j)IJ
ai bj =
X
iI
ai
X
bj
jJ
Dimostrazione. Posto A1 =
Inoltre converge la sommatoria
iI
sj = A1
jJ
iI
45
|bj | .
jJ
La conclusione segue dunque dallimplicazione (b)(a) del Teorema 4.1 e dalla (4.1).
an = lim
n=0
N
X
an .
n=0
F Pf (N)
F F
an = s =
nN
an = s .
n=0
Limplicazione inversa non vale. Al contrario, si hanno le seguenti caratterizzazioni della convergenza
della sommatoria.
Teorema 5.1. Per una successione (an )nN le seguenti propriet`
a sono equivalenti:
P
(1) La sommatoria nN an converge;
P
(2) la serie n=0 an converge assolutamente.
della sommatoria
P Dimostrazione. Per il Teorema 5.1, la condizione (1) equivale alla convergenza
P
|a
|.
Per
il
Corollario
1.5,
questo
equivale
alla
convergenza
della
serie
|a
|.
n
n
nN
n=0
Questa differenza va tenuta in considerazione quando si prendono in esame serie multiple, ossia con
indici variabili in Nk con k 2.
Prendiamo in esame due tipi di problema, limitandoci sempre al caso k = 2.
Data una successione doppia (amn )(m,n)N2 , la formulazione per serie della seconda uguaglianza
nella formula (4.1) diventa:
X
X
X
X
(5.1)
amn =
amn .
m=0
n=0
n=0
m=0
E facile vedere che in generale questa identit`a non vale in generale: se si prende ad esempio
se m = n
1
amn = 1 se m = n + 1
0
altrimenti,
si verifica che il primo membro delluguaglianza d`a 1 e il secondo 0.
3Si faccia attenzione al fatto che questa distinzione terminologica e notazionale tra sommatoria e serie `
e stata introdotta
perch
e funzionale alla presente trattazione, ma non `
e standard.
46
Siccome N2 non ha un ordinamento naturale, non `e univocamente definibile cosa sia una serie
doppia. Si ricorre allora a opportune famiglie cofinali F = {FN : N N} di Pf (N2 ), a ciascuna
delle quali si collega una diversa nozione di somma della serie doppia.
Per esempio, si ha la sommazione per quadrati se si utilizza il limite
X
lim
amn ,
N
m,nN
lim
amn ,
m2 +n2 N 2
lim
amn ,
m+nN
ecc. Lesempio che segue mostra che diversi metodi di sommazione danno luogo a diverse nozioni
di convergenza.
Esempio.
Si prenda
am,n
n
= 1
se m = 0 , n > 0
se m = n > 0
altrimenti.
amn = 0 ,
m,nN
2k
X
1
1
> .
n
2
amn =
m+n2k
n=k+1
Tuttavia, i problemi citati sopra non si presentano in situazioni di assoluta convergenza, ossia quando
le serie in questione coincidono con le sommatorie studiate nei paragrafi precedenti. Per esempio, riguardo
allinversione dellordine di sommazione nella (5.1) vale il seguente corollario al Teorema 4.1.
Corollario 5.2. Sia (am,n )(m,n)N2 una funzione definita su N2 . Le seguenti condizioni sono equivalenti:
P
(a)
(m,n)N2 amn converge; P
0
(c) per ogni n fissato,
m=0 |amn | converge e, chiamata sn la somma di questa serie, converge
Pla serie
0
anche la serie n=0 sn .
Se queste condizioni sono verificate, vale luguaglianza
(5.2)
X
(m,n)N2
amn =
X
X
m=0
n=0
X
X
amn =
amn .
n=0
m=0
47
Si vede facilmente che, se i termini an e bn sono definitivamente nulli, e dunque si ha a che fare solo con
somme finite, vale luguaglianza
X X
X
cn =
aj
bk .
n
X
X
X
an
bn ,
cn =
(6.1)
n=0
n=0
n=0
aj bk .
(j,k)N2
Per i Corollari 1.5 e 4.2, essa `e uguale al secondo membro della (3.3). Si consideri ora la famiglia T dei
triangoli
TN = {(j, k) N2 : j + k N } .
Essa soddisfa le condizioni (1) e (2) della Proposizione 1.4, per cui
X
X
aj bk .
aj bk = sup
N N
(j,k)N2
(j,k)TN
Ma
X
aj bk =
N
X
cn ,
n=0
(j,k)Tn
aj bk =
cn .
n=0
(j,k)N2
Per il prodotto secondo Cauchy di successioni a valori di segno qualunque si deduce facilmente il seguente
corollario.
Corollario 6.3. Siano (an )nN e (bn )nN due successioni assolutamente convergenti, e sia (cn )nN il loro
prodotto secondo Cauchy. Allora
X
X
X
(6.2)
cn =
an
bn .
n=0
n=0
n=0
Osservazione 6.4. Luguaglianza 6.2 non vale in generale in assenza di convergenza assoluta. Si dimostri,
n1
P
48
Il prodotto secondo Cauchy interviene in vari problemi riguardanti serie di funzioni. Uno di questi
riguarda la convergenza di serie di potenze (che saranno studiate ampiamente pi`
u avanti). Si supponga di
avere due serie
X
X
an xn ,
bn xn ,
n=0
n=0
entrambe dipendenti da una variabile x (i coefficienti an e bn sono numeri reali assegnati). Si supponga di
sapere che entrambe le serie convergono quando a x vengono assegnati valori in un dato insieme E R.
Esse allora definiscono due funzioni definite su E a valori in R,
f (x) =
an xn ,
g(x) =
n=0
bn x n .
n=0
Moltiplicando i termini delle due serie a due a due, risulta naturale raggruppare insieme i prodotti
contenenti la stessa potenza di x. Si ottiene cos` una nuova serie di potenze,
X
X
a j bk x n ,
n=0
j+k=n
che non `e altro che il prodotto secondo Cauchy delle due serie date. Si vuole sapere se essa converge a
f (x)g(x) quando x E.
an ,
nN
an
nN
nN
an
nF
per ogni F (F0 ). Quindi anche nN an = s. Limplicazione inversa si dimostra allo stesso modo.
Per quanto riguarda invece il confronto tra le due serie
an ,
n=0
an ,
n=0
si deve considerare che le rispettive somme parziali sono difficilmente confrontabili tra loro. Vediamo prima
il caso pi`
u semplice.
P
Teorema 7.1. Se la serie n=0 an `e assolutamente convergente, per ogni riordinamento dei suoi termini
si ha
X
X
an =
an .
n=0
n=0
Dimostrazione.
Per il Teorema 5.1 converge la sommatoria
P
uguale a nN |an |. Quindi, per gli stessi motivi, si ha
an =
n=0
an =
nN
an =
nN
an .
49
n=0
nN
Se invece una serie converge, ma non assolutamente, si ha una situazione molto diversa.
P
Teorema 7.2. Sia n=0 an una serie convergente, ma non assolutamente. Allora, per ogni R {},
esiste un riordinamento tale che
X
an = .
n=0
Dimostrazione. Ponendo
|an | + an
|an | an
a+
,
a
,
n = max{an , 0} =
n = max{an , 0} =
2
2
P
P
le serie a termini non negativi n=0 a+
n e
n=0 an divergono entrambe. Questo implica, in particolare, che
gli insiemi
E + = {n N : an 0} ,
E = {n N : an < 0} ,
sono entrambi infiniti. Inoltre E + , E formano una partizione di N.
Siano (np )pN una numerazione crescente4 degli elementi di E + e (n0q )qN una numerazione crescente
degli elementi di E .
Allora anp 0 per ogni p, an0q < 0 per ogni q, e inoltre
(7.1)
X
p=0
anp =
X
nE +
an =
a+
n = + ,
an0q =
q=0
n=0
an =
nE
a
n = .
n=0
ossia
s+
0,p1 + s0,q1 < .
4Con questo intendiamo che la funzione p 7 n `
+
p e strettamente crescente e suriettiva da N a E .
50
Poniamo allora
1 = s+
0,p1 + s0,q1 .
Induttivamente, possiamo costruire una successione di coppie (pj , qj ), definite come segue:
pj+1 `e il minimo intero maggiore di pj per cui
+
j+1 = s+
0,p1 + s0,q1 + sp1 ,p2 + sq1 ,q2 + + spj1 ,pj + sqj1 ,qj + spj ,pj+1 > ;
(7.2)
j+1 = s+
0,p1 + s0,q1 + sp1 ,p2 + sq1 ,q2 + + spj ,pj+1 + sqj ,qj+1 < .
Per uniformit`
a di notazione, poniamo p0 = q0 = 0.
Costruiamo ora una funzione biiettiva : N N come segue:
0
0
. . .
:
[pj1 + qj1 , pj + qj1 ) {npj1 , . . . , npj 1 }
...
k 7 nk
k 7 n0kp1
...
k 7 nkqj1
k 7 n0kpj
...
Spj +qj 1 = j .
Siccome la serie degli an converge, si ha limn an = 0. Dato > 0, sia n0 tale che |an | < per ogni
n n0 . Esiste dunque j0 tale che, per ogni j j0 , si abbia pj > n0 . Quindi apj < se j j0 .
Per la definizione di pj come minimo intero maggiore di pj1 per cui vale la (7.2), deve essere
+
+
s+
0,p1 + s0,q1 + + spj1 ,pj + spj1 ,pj 1 .
Ma allora
+
+
< j = s+
0,p1 + s0,q1 + + spj1 ,pj + spj1 ,pj 1 + apj < + .
Si dice che una serie converge incondizionatamente se, per ogni suo riordinamento, essa rimane convergente. Dai Teoremi 7.1 e 7.2 si ottiene il seguente enunciato.
51
Corollario 7.3. Una serie converge incondizionatamente se e solo se converge assolutamente. In questo
caso, il valore della somma `e indipendente dal riordinamento.
Esercizio. Si dimostri che, nelle ipotesi del Teorema 7.2, esistono riordinamenti che danno luogo a una serie
indeterminata.
CAPITOLO 5
y = (y1 , y2 , . . . , yn )
54
|x y| = |x| |y| .
Per il Teorema 1.2, x e y devono essere linearmente dipendenti, e inoltre la costante di proporzionalit`
a
tra le loro componenti deve essere non negativa.
Siano x, y elementi non nulli di Rn . Essendo
1
xy
1,
|x||y|
2. TOPOLOGIA DI Rn
55
(2.1)
56
Da questo segue facilmente, usando la propriet`a distributiva dellunione rispetto allintersezione, il punto
(iii) del seguente enunciato. Gli altri punti sono ovvi.
Proposizione 2.3. La famiglia degli insieme aperti di Rn gode delle seguenti propriet`
a:
n
(i) e R sono aperti;
(ii) una qualunque unione di aperti `e aperta;
(iii) le intersezioni finite di aperti sono aperte.
Definizione 2.4. Un sottoinsieme di Rn si dice chiuso se il suo complementare `e aperto.
Usando le formule di de Morgan, si dimostra facilmente il seguente enunciato.
Proposizione 2.5. La famiglia degli insieme chiusi di Rn gode delle seguenti propriet`
a:
(i) e Rn sono chiusi;
(ii) una qualunque intersezione di chiusi `e chiusa;
(iii) le unioni finite di chiusi sono chiuse.
Si noti che e Rn sono sia aperti che chiusi, mentre esistono insiemi che non sono ne aperti ne chiusi:
per esempio, in R, gli intervalli semiaperti [a, b), con a < b.
Esempio. Si dimostri per esercizio che gli insiemi
B x0 ,r = {x Rn : d(x, x0 ) r}
sono chiusi. Un tale insieme si chiama palla chiusa di centro x0 e raggio r, mentre le palle Bx0 ,r nella (2.1)
si chiamano anche palle aperte.
2.2. Intorni di un punto, parte interna di un insieme.
Definizione 2.6. Sia x0 Rn . Si dice che un sottoinsieme U di Rn `e un intorno di x0 (o che x0 `e interno
a U ) se esiste r > 0 tale che Bx0 ,r U .
Lemma 2.7. Lintersezione di un numero finito di intorno di x0 `e ancora un intorno di x0 .
Dimostrazione. Se U1 , . . . , Uk sono intorno di x0 , siano r1 , . . . rk > 0 tali che Bx0 ,rj Uj per j =
1, . . . , k. Allora, se r = minj rj , Bx0 ,r U1 Uk .
Proposizione 2.8. Dato un qualunque sottoinsieme E di Rn , si consideri linsieme
E = {x E : E `e un intorno di x} .
Allora
Dimostrazione. Se x0 E, esiste una palla Bx0 ,r E. Dato allora un punto x Bx0 ,r , si ponga
= r d(x, x0 ). Allora > 0 e, per la disuguaglianza triangolare,
Bx, Bx0 ,r .
2. TOPOLOGIA DI Rn
57
E Bx0 ,r 6= .
Ovviamente gli elementi di E sono tutti aderenti a E, ma potrebbero essercene altri. Per esempio, un
qualunque punto della palla chiusa B x0 ,r `e aderente alla palla aperta con lo stesso centro e stesso raggio.
Proposizione 2.10. Dato E Rn , si consideri linsieme E dei suoi punti aderenti. Allora
(i) il complementare di E `e la parte interna del complementare di E.
(ii) E `e chiuso, ed `e il pi`
u piccolo insieme chiuso contenente E;
(iii) un insieme E `e chiuso se e solo se E = E;
Dimostrazione. Dire che x 6 E equivale a dire che esiste r > 0 tale che E Bx,r = , e dunque che
Bx,r c E. Ma questo a sua volta equivale a dire che x `e interno a c E.
Questo dimostra (i), e ora (ii) e (iii) seguono direttamente dall Proposizione 2.8.
Esempio. Sia E = n1
accumulazione, 0
6 E.
58
3. Successioni a valori in Rn
Sia a : N Rn una successione di punti di Rn , che indicheremo con labituale simbolo (ak )kN .
Definizione 3.1. Si dice che ` Rn `e limite della successione (ak )kN se, per ogni > 0, esiste k0 N tale
che, per ogni k k0 , |ak `| < .
In modo equivalente possiamo dire che:
` `e limite della successione se, per ogni > 0, i punti ak sono definitivamente contenuti nella palla B`, .
Si noti anche lequivalenza
(3.1)
j = 1, . . . , n ,
lim ajk = `j .
Dimostrazione. Se limk ak = `, dato > 0, esiste k0 N tale che, per ogni k k0 , |ak `| < .
Allora, se k k0 ,
q
|ajk `j |
La Proposizione 3.3 consente di ridurre lo studio di una successione di punti di Rn allo studio di n
seccessioni numeriche. Questo ha una serie di conseguenze, la cui dimostrazione `e lasciata per esercizio:
il teorema di unicit`
a del limite;
il teorema di limitatezza di una successione convergente;
convergenza di sottosuccessioni di successioni convergenti.
Adattando le definizioni di successione limitata e di successione di Cauchy (v. pi`
u avanti), si estendono
anche
il teorema di Bolzano-Weierstrass;
il criterio di convergenza di Cauchy.
Le dimostrazioni sono lasciate per esercizio.
Definizione 3.4. Una successione (ak )kN a valori in Rn si dice
(i) limitata se linsieme dei |ak | `e superiormente limitato in R (ossia se tutti i punti ak sono contenuti
in una stessa palla);
(ii) di Cauchy se per ogni > 0 esiste k0 N tale che, per ogni h, k k0 , |ah ak | < .
` TOPOLOGICHE DI SOTTOINSIEMI DI Rn
4. SUCCESSIONI E PROPRIETA
59
(2) se due successioni (ak )kN a valori in Rn e (k )kN a valori in R sono convergenti, rispettivamente
a ` e , allora
lim k ak = ` ;
k
(3) se due successioni (ak )kN , (bk )kN a valori in C sono convergenti1, rispettivamente a ` e `0 , allora
lim ak bk = ``0 ;
X
X
|ak | converge =
ak converge ,
k=0
k=0
P
P
e in questo caso k=0 ak k=0 |ak |.
Osservazione 3.5. In dimensione n 2 il limite infinito si intende come segue:
lim ak = lim |ak | = + .
60
= `i ,
i = 1, . . . , j .
= `i ,
i = 1, . . . , j + 1 .
Dopo n passi, la sottosuccessione risultante, (akpn )pN , converge a ` per la Proposizione 3.3. Siccome E
`e chiuso, ` E.
In particolare, E `e chiuso.
Si noti che Ek+1 Ek per ogni k e la stessa relazione vale per le chiusure.
Dimostrazione. Sia x un punto limite, x = limp akp . Per ogni k N, esiste p tale che, per p p,
kp k. Dunque x `e limite di una successione di elementi di Ek , da cui segue che x E k .
Viceversa, se x E, per ogni k N e ogni p N \ {0}, Ek Bx, p1 6= . Si scelga allora induttivamente
k1 tale che Bx,1 ,
1
kp+1 > kp tale che akp+1 Bx, p+1
.
6. SPAZI TOPOLOGICI
61
Dimostriamo ora linsieme E della Proposizione 5.2 pu`o essere un qualunque chiuso di Rn .
Teorema 5.3. Sia E un sottoinsieme chiuso di Rn . Esiste allora una successione (ak )kN di elementi di E
avente E come insieme dei suoi punti limite.
Dimostrazione. Supponiamo inizialmente che E sia anche limitato. Esiste allora un ipercubo
h R R in n
o
R
Q= ,
= (x1 , . . . , xn ) : |xj | , j = 1, . . . , n ,
2 2
2
contenente E. Per ogni p N, suddividiamo [R, R] in 2p sottointervalli adiacenti2 di lunghezza 2p R.
Allora Q `e lunione di 2np cubi, e tra questi selezionamo quelli che hanno intersezione non vuota con E.
Numeriamo poi tutti i cubi cos` selezionati, partendo da quelli selezionati per p = 0, successivamente
quelli selezionati per p = 1, ecc. Si ottengono dunque una successione di cubi (Qk )kN e una successione
crescente di interi p tali che
per p k < p+1 , Qk ha lati di lunghezza 2p ;
per ogni x E e ogni p, esiste k con p k < p+1 tale che x Qk .
Si prenda allora, per ogni k, ak E Qk . Dato x E, per ogni p sia kp tale che p kp < p+1 e
x Qkp . Allora
|x akp | diam(Qk ) = 2p nR ,
dove per diam(Qk ) si intende la massima distanza tra coppie di elementi di Qk .
Quindi x = limp akp . Daltra parte, essendo E chiuso, ogni punto limite della successione (ak )kN `e
in E.
Supponiamo ora che E sia illimitato. Per p N, si ponga E(p) = E [2p , 2p ]n e si ripeta la costruzione
precedente suddividendo il cubo [2p , 2p ]n in 22np sottocubi di lato 2p . La dimostrazione per il caso E
limitato si ripete con piccole modifiche.
6. Spazi topologici
6.1. Definizioni.
La topologia fornisce una definizione assiomatica di sottoinsiemi aperti di un insieme qualsiasi. A
partire da questa, si giunge a nozioni di convergenza di successioni di elementi dellinsieme e di continuit`
a
di funzioni tra insiemi dotati di topologie.
Bisogna tener presente che la nozione generale di spazio topologico `e molto ampia e comprende topologia
con propriet`
a molto diverse da quella euclidea su Rn descritta nei paragrafi precedenti.
Questo paragrafo contiene solo una presentazione di base di alcune nozioni di topologia, finalizzate a
inquadrare in un contesto generale quanto verr`a analizzato pi`
u approfonditamente in alcuni casi particolari.
Definizione 6.1. Si chiama topologia su un insieme X una famiglia P(X) di sottoinsiemi di X, detti
aperti, che soddisfi le seguenti propriet`
a:
(i) , X ;
S
(ii) Se {Ai }iI , allora iI Ai ;
(iii) Se A1 , . . . , An , allora A1 An .
Si chiama spazio topologico una coppia (X, ), dove `e una topologia su X.
Esempi.
1. Oltre alla topologia euclidea su Rn , indichiamo le seguenti topologie:
(1) la topologia discreta = P(X) su un qualunque insieme X;
(2) la topologia indiscreta = {, X} su un qualunque insieme X;
2Non importano eventuali sovrapposizioni agli estremi. I sottointervalli si possono anche prendere chiusi.
62
(3) su R, le famiglie + = (a, +) : a R {, R} e = (, a) : a R {, R} sono topologie.
2. (Topologia prodotto) Siano (X, ) e (Y, ) due spazi topologici. Si consideri la famiglia
n[
o
=
Ai B i : Ai , B i ,
iI
di sottoinsiemi di X Y . Questa `e una topologia, detta topologia prodotto di e e a volte indicata come
. Per verificarlo, lunica propriet`
a non ovvia `e la propriet`a (iii) riguardante le intersezioni finite. Per
induzione basta ovviamente dimostrare che lintersezione di due elementi di `e ancora in . Questo segue
dalle identit`
a
[
[
[
Ai B i
Ai 0 B i 0 =
(Ai Bi ) (Ai0 Bi0 )
iI
i0 I 0
iI , i0 I 0
iI , i0 I 0
6. SPAZI TOPOLOGICI
63
la chiusura di E `e il pi`
u piccolo chiuso contenente E;
c
(E) = (c E) ;
E `e lunione disgiunta di D(E) con linsieme dei punti isolati di E.
E = E F (E) = E D(E);
64
Dimostrazione. Mostriamo che (i)(ii). Dato A , mostriamo che f 1 (A) `e aperto. Si prenda
x f 1 (A). Siccome A `e un intorno di f (x), esiste un intorno Vx di x, che possiamo prendere aperto, tale
che f (Vx ) A. Allora
[
f 1 (A)
Vx f 1 (A) .
xf 1 (A)
6. SPAZI TOPOLOGICI
65
e semicontinua superiormente in x0 se
f (x0 ) lim sup f (x) .
xx0
Proposizione 6.16. Sia (X, ) uno spazio topologico. Una funzione f : X R `e semicontinua inferiormente in x0 se e solo se, dotando R della topologia + , essa `e continua in x0 .
Analogamente, f `e semicontinua superiormente in x0 se e solo se, dotando R della topologia , essa `e
continua in x0 .
Dimostrazione. La condizione f (x0 ) lim inf xx0 f (x) equivale a dire che, per ogni > 0, esiste un
intorno U di x0 tale che, per ogni x U , f (x) > f (x0 ) , ossia
f (U ) f (x0 ) , + .
Ma le semirette f (x0 ) , + formano un sistema fondamentale di intorni di f (x0 ) nella topologia + .
Questo dimostra la prima equivalenza. La seconda si dimostra in modo analogo.
6.5. Test di continuit`
a con successioni.
Una successione (xn ) a valori in uno spazio topologico (X, ) converge a x
X se, per ogni intorno U
di x
, esiste n0 N tale che an U per ogni n n0 .
Il teorema che segue mette in relazione la continuit`a di una funzione con la convergenza di successioni
nel dominio e delle loro immagini nel codominio.
Teorema 6.17. Siano (X, ) e (Y, ) due spazi topologici.
(i) Se una successione (xn )nN di elementi di X converge a x
X e f : X Y `e continua in x
,
allora la successione f (xn ) nN converge a f (
x).
(ii) Se (X, ) soddisfa il primo assioma di numerabilit`
a, una funzione f : X Y `e continua in x
se e
solo se, per ogni successione (xn )nN convergente a x
, la successione f (xn ) nN converge a f (
x).
Dimostrazione. Nelle ipotesi di (i), si prenda un intorno U di f (
x) in Y . Esiste allora V intorno di x
in X tale che f (V ) U . Preso n0 N tale che an V per ogni n n0 , si ha, per tali n, che f (xn ) U .
Questo dimostra la tesi.
Si supponga ora che (X, ) soddisfi il primo assioma di numerabilit`a. Assumendo come ipotesi che
f : X Y `e continua in x
, la (i) fornisce la tesi di una delle due implicazioni da dimostrare.
Assumiamo ora come ipotesi che, per ogni successione (xn )nN convergente a x
, la successione f (xn ) nN
converge a f (
x). Supponiamo per assurdo che f non sia continua in x
. Esiste allora un intorno U di x
tale
che, comunque scelto un intorno V di x
, si abbia f (V ) 6 U .
Fissato {Vn }nN un sistema fondamentale di intorni di x
con Vn+1 Vn per ogni n, si prenda, per ogni
n, xn Vn tale che f (xn ) 6 U . Allora la successione (xn )nN converge a x
, perche i suoi termini sono
definitivamente contenuti in ogni Vn , e dunque
in
ogni
intorno
di
x
.
Ma
le
loro
immagini f (xn ) sono tutte
fuori di U , e dunque la successione f (xn ) nN non converge a f (
x), in contrasto con lipotesi.
66
7. Spazi metrici
Le propriet`
a (i) e (ii) sono ovvie. La propriet`a (iii) `e di semplice verifica per d1 e d , ed `e
stata dimostrata per la distanza euclidea d2 . Per p generico, la verifica `e pi`
u complessa e viene qui
tralasciata.
(2) Su un qualunque insieme X,
(
0 se x = y
d(x, y) =
1 se x 6= y ,
`e una distanza.
(3) (distanza p-adica su Q) Ogni numero razionale x 6= 0 si scompone in modo unico, a meno dellordine,
come prodotto
(7.1)
mk
1 m2
x = pm
,
1 p2 pk
dove i pj sono numeri primi e gli mj interi relativi. Fissato un numero primo p, si definisce il valore
assoluto p-adico di x Q come
(
0
se x = 0
|x|p =
m
p
se pm `e il fattore con base p nella scomposizione (7.1).
Si verifica facilmente che |x + y|p max |x|p , |y|p per ogni x, y Q. Da questo segue che
dp (x, y) = |x y|p
`e una metrica su Q. In realt`
a vale una propriet`a pi`
u forte della disuguaglianza triangolare, cio`e
dp (x, z) max dp (x, y), dp (y, z) ,
x, y, z Q .
Si dice allora che dp `e una ultrametrica.
Per funzioni tra spazi metrici si adotta la seguente terminologia.
Definizione 7.2. Siano (X, d), (X 0 , d0 ) due spazi metrici, e sia f : X X 0 una funzione.
(i) Si dice che f `e una isometria di X sulla sua immagine f (X) X 0 se
d0 f (x), f (y) = d(x, y) ,
x, y X .
7. SPAZI METRICI
67
(ii) Si dice che f `e Lipschitziana se esiste una costante L > 0 tale che
d0 f (x), f (y) Ld(x, y) ,
x, y X .
facilmente verificabili.
La conseguente uguaglianza delle tre topologie indotte si comprende facilmente osservando che le disuguaglianze (7.2) implicano le inclusioni
1
2
Bx,r
Bx,2r
Bx,2r
Bx,2r
,
x Rn , r > 0 ,
dove B p indica la palla per la distanza dp (v. figura per n = 2). Quindi gli intorni di un punto nelle tre
topologie indotte sono gli stessi, e dunque le tre topologie hanno gli stessi aperti, cio`e coincidono.
68
6
...............................................
.............................
................
...............
............
............
..........
..........
.........
.........
........
.
.
.
.
.
.
.
........
.....
.
.
.
.
.......
.
.
.....
.......
.
.
.
.
.
......
.....
.
.
......
.
.
...
.
......
.
.
.
.
....
....
.
.
....
..
.
....
.
.
..
....
.
.
.
....
...
.
.
....
..
.
.
...
...
...
.
.
...
...
...
.
..
...
.
..
...
.
...
..
.
...
..
.
...
....
...
...
...
...
..
..
...
..
...
..
..
...
..
..
...
..
...
..
..
..
..
..
..
..
..
.
.
..
...
..
..
.
..
..
...
..
...
...
...
....
...
..
...
...
...
..
...
..
.
.
...
...
...
...
...
...
...
...
...
.
....
.
...
....
....
....
....
....
....
....
...
.
....
.
......
....
......
......
......
......
.......
.......
.......
......
.
.
.
.
........
.
.
........
.......
..........
........
...........
..........
............
..........
.................
............
...................................................................................
@
@
@
@
@
@
@
@
@
@
@
@
@
@
2. La distanza euclidea su R e la stessa distanza euclidea ristretta a un intervallo aperto proprio I sono
topologicamente equivalenti, ma non bi-Lipschitzianamente equivalenti.
3. Su R si considerino la distanza euclidea d e la distanza
y) = |x3 y 3 | .
d(x,
su (R, d), e dunque un omeomorfismo di (R, ) su
La funzione f (x) = x3 `e una isometria di (R, d)
d
(R, d ). Ma f `e pure un omeomorfismo da (R, d ) in se. Quindi f 1 f = R `e un omeomorfismo di (R, d)
su (R, d ). Questo equivale a dire che d = d .
Le due distanze sono dunque topologicamente equivalenti. Tuttavia esse non sono bi-Lipschitzianamente
y) d(x, y) per ogni x, y R, si avrebbe |x3 | L|x| per
equivalenti, per che, se esistesse L > 0 tale che d(x,
ogni x R, che `e assurdo.
4. (Esercizio) Si verifichi che una distanza p-adica su Q non `e topologicamente equivalente alla distanza
euclidea (indotta da R).
7.3. Successioni di Cauchy e funzioni uniformemente continue.
Le nozioni di successione di Cauchy e di funzione uniformemente continua non hanno senso in generale
nellambito degli spazi topologici. Il motivo `e che ciascuna di esse richiede la possibilit`a di stabilire se due
intorni di due punti diversi hanno in qualche modo la stessa taglia. Questo `e possibile, come vedremo ora,
su spazi metrici.
Sia (xn )nN una successione di elementi di uno spazio metrico (X, d). La condizione di convergenza nella
topologia d a un elemento x
X equivale alla condizione
(7.3)
> 0 n0 N : n n0 , d(xn , x
) < .
In analogia con la definizione nota per successioni di numeri reali, si pone quanto segue.
7. SPAZI METRICI
69
Definizione 7.4. Una successione (xn )nN di elementi di uno spazio metrico (X, d) si dice di Cauchy se
(7.4)
Proposizione 7.5. Ogni successione a valori in uno spazio metrico convergente `e di Cauchy.
Dimostrazione. Sia x
= limn xn . Dato > 0, se n0 `e tale che d(xn , x
) < /2 per ogni n n0 , si
ha, per n, m n0 ,
d(xn , xm ) d(xn , x
) + d(
x, xm ) < .
Limplicazione inversa non `e sempre vera. Si consideri ad esempio X = Q con la distanza euclidea.
Definizione 7.6. Uno spazio metrico (X, d) si dice completo se ogni successione di Cauchy di elementi di
X converge a un elemento di X.
Passiamo ora alla nozione di continuit`
a uniforme.
Definizione 7.7. Siano (X, d), (X 0 , d0 ) due spazi metrici. Si dice che f : X X 0 `e uniformemente
continua se, per ogni > 0, esiste > 0 tale che
(7.5)
x, y X , d(x, y) < = d0 f (x), f (y) < .
Nellenunciato che segue raggruppiamo due propriet`a che valgono sotto lipotesi di continuit`a uniforme,
ma non per generiche funzioni continue5.
Proposizione 7.8. Siano (X, d) e (X 0 , d0 ) spazi metrici.
(i) Sia f una funzione uniformemente continua da X a X 0 . Se (xn )nN `e una successione di Cauchy
in X, allora f (xn ) nN `e di Cauchy in X 0 .
(ii) Si supponga che (X 0 , d0 ) sia completo, e sia f uniformemente continua da un sottoinsieme Y denso
in X a X 0 . Allora f ammette uno e un solo prolungamento f uniformemente continuo da X a X 0 .
Dimostrazione.
(i). Dato > 0, sia > 0 tale che valga limplicazione (7.5).
Se (xn )nN `e di Cauchy in X, esiste n0 tale
che n, m n0 = d(xn , xm ) < . Ma allora, d0 f (xn ), f (xm ) < , e questo dimostra la tesi.
(ii). Dato x X, esiste una successione (xn )nN di elementidi Y tale che limn xn = x. Allora
(xn )nN `e di Cauchy. Per quanto dimostrato al punto (i), f (xn ) nN `e di Cauchy in X 0 . Siccome X 0 `e
completo, esiste
(7.6)
y = lim f (xn ) .
n
Mostriamo che y dipende solo da x, e non dalla scelta della successione (xn )nN . Sia (
xn )nN unaltra
successione di punti di Y convergente a x.
Dato > 0, sia n0 tale che, per n n0 , si abbia d(x, xn ) < /2 e d(x, x
n ) < /2. Allora d(xn , x
n ) <
per n n0 .
Dato ora > 0, sia > 0 dato dalla (7.5). Allora, per n n0 ,
d0 y, f (
xn ) d0 y, f (xn ) + d0 f (xn ), f (
xn ) < d0 y, f (xn ) + .
xn ) < 2. Quindi limn f (
xn ) = y.
Preso n1 n0 tale che d0 y, f (xn ) < per n n1 , si ha d0 y, f (
Possiamo dunque definire f : X X 0 come f(x) = y, con y dato dalla (7.6).
Se x Y , si pu`
o scegliere la successione (xn )nN costantemente uguale a x. Quindi f(x) = f (x) per
x Y , cio`e f `e un prolungamento di f .
Se ci fosse unaltro prolungamento continuo g di f a X, dovrebbe comunque valere luguaglianza g(x) =
limn f (xn ) per ogni successione di punti di Y convergente a x. Sarebbe quindi g = f e questo dimostra
lunicit`
a del prolungamento.
5Si trovino per esercizio opportuni controesempi con X = X 0 = R.
70
71
72
hanno come sostegno il cerchio di centro lorigine e raggio 1 in R2 , ma non sono equivalenti.
Pi`
u semplice `e la situazione per quanto riguarda archi semplici.
Teorema 8.4. Sia un arco semplice. Esistono allora esattamente due classi di equivalenza di archi semplici
con lo stesso sostegno di : la classe C e la classe C , dove
(t) = (a + b t) ,
t [a, b] .
Dimostrazione. Sia [a, b] lintervallo su cui `e definito larco , e sia E = [a, b] . Proviamo innanzitutto che 1 : E [a, b] `e continua.
Se, per assurdo, 1 non fosse continua in un punto x = (t) E, esisterebbero 0 > 0 e una successione
di punti xn = (tn ) E, n 1, tali che
1
e |tn t| 0 .
n
Essendo [a, b] compatto, esisterebbe quindi una sottosuccessione (tnk )kN convergente a t [a, b]. Si
avrebbe allora |t t| 0 , ma anche
|xn x| <
tb
(si pensi a un sostegno a forma di 9). Si osservi che esistono almeno quattro modi non equivalenti di ottenere
lo stesso sostegno con curve semplici.
8.2. Funzioni continue da Rn a R.
Passiamo a discutere la continuit`
a di funzioni di pi`
u variabili. In base alla Proposizione 8.1, sar`
a
sufficiente considerare funzioni a valori in R.
Valgono per le funzioni da Rn a R i teoremi sulla continuit`a delle funzioni somma prodotto, reciproco di
funzioni continue come nel caso n = 1. Ricordiamo poi la Proposizione 6.14 sulla continuit`a della funzione
composta.
Aggiungiamo questa semplice osservazione: se g `e una funzione di una variabile, continua su I R,
allora
f (x1 , . . . , xn ) = g(x1 ) ,
`e continua su I Rn1 .
73
t 1 se 1 t 2,
(8.1)
(t) = 3 t se 2 t 3,
0
altrimenti,
e poniamo
( y
2 ,
x
f (x, y) =
0
(8.2)
se x 6= 0
se x = 0.
Si ha allora che:
f `e diversa da 0 solo nei punti (x, y) con x2 < y < 3x2 (regione aperta compresa tra due parabole
con vertice nellorigine);
f = 1 sui punti della parabola y = 2x2 con x 6= 0, ma f (0, 0) = 0; quindi f non `e continua in 0.
Tuttavia:
la restrizione di f a una qualunque retta del piano `e continua (esercizio).
Questo esempio mostra i problemi che si possono incontrare nel trattamento di limiti di funzioni di pi`
u
variabili. Si ha infatti
lim lim f (x, y) = 0 ,
lim lim f (x, y) = 0 ,
x0
y0
y0
x0
f (x, y) .
(x,y)(0,0)
CAPITOLO 6
Esempi.
1. Con E = R, la successione fn (x) =
nx
1+nx2
converge puntualmente a
(
1
se x 6= 0
f (x) = x
0
se x = 0 .
2. Sempre con E = R, si ponga fn (x) = xn . La successione di numeri reali fn (x) nN ha limite finito solo
per 1 < x 1. Quindi la successione di funzioni (fn )nN non converge puntualmente su R.
Tuttavia, restringendosi a E0 = (1, 1], si ha convergenza puntuale su E0 e la funzione limite `e
(
0 se 1 < x < 1
(1.1)
f (x) =
1 se x = 1 .
Osservazione 1.2. Si osservi che la nozione di convergenza puntuale si estende in modo naturale a successioni a valori in un qualunque spazio topologico. Nel seguito non ci servir`a tuttavia tutta questa generalit`
a,
salvo il caso di funzioni a valori complessi.
Introduciamo ora una nozione pi`
u restrittiva di convergenza, la convergenza uniforme. Come sopra, E
`e un insieme e le funzioni fn sono definite su E e a valori reali.
Definizione 1.3. Si dice che la successione (fn )nN converge uniformemente su E alla funzione f : E R
se, per ogni > 0 esiste un indice n0 tale che, per ogni n n0 e ogni x E, si ha
fn (x) f (x) < .
Le due nozioni, di convergenza puntuale e convergenza uniforme, si confrontano bene esprimendo le due
condizioni in forma esplicita.
Convergenza puntuale:
> 0, x E, n0 (, x) : n n0 (, x) , fn (x) f (x) < .
75
76
Convergenza uniforme:
> 0, n0 () : x E, n n0 () , fn (x) f (x) < .
La differenza sta nel fatto che, dato 0 , lindice richiesto n0 , a partire dal quale fn (x) debba distare da
f (x) per meno di , possa dipendere da x, oppure debba esistere indipendentemente da x.
Il seguente enunciato `e dunque ovvio.
Lemma 1.4. Se una successione di funzioni converge uniformemente su E alla funzione f , allora vi converge
puntualmente.
Esempio.
Si consideri la successione fn (x) = xn del precedente Esempio 2. Sullinsieme E0 = (1, 1] si ha
convergenza puntuale, ma non uniforme. Si fissi infatti < 1. Se la convergenza alla funzione f in (1.1)
fosse uniforme, dovrebbe esistere un indice n0 tale che, per ogni n n0 e ogni x (1, 1), |xn | < . Ma
questo `e assurdo perche limx1 |xn | = 1.
Restringiamo ora le funzioni fn a un intervallo E = [1 + , 1 ], dove 0 < < 1/2. Dato > 0,
esistei n0 tale che (1 )n0 < . Se n n0 e x E , si ha
n
x f (x) = |xn | (1 )n < .
Quindi la convergenza alla funzione f `e uniforme su E .
Osservazione 1.5. La nozione di convergenza puntuale si estende
in modo
a valori
naturale a successioni
in un qualunque spazio metrico, sostituendo nella definizione fn (x) f (x) con d fn (x), f (x) .
2. Continuit`
a del limite uniforme
Gli esempi visti nel paragrafo precedente mostrano che funzioni continue possono convergere puntualmente a funzioni discontinue. Il teorema seguente dimostra invece che la continuit`a delle funzioni fn si
trasmette alla funzione limite f quando la convergenza `e uniforme.
Teorema 2.1. Sia (E, ) uno spazio topologico. Se le funzioni fn : E R convergono a una funzione f
uniformemente su E, e ogni fn `e continua in un punto x0 E, allora anche f `e continua in x0 .
Dimostrazione. Si fissi > 0. Per lipotesi di convergenza uniforme, esiste un indice n
tale che
f (x) fn (x) < .
x E ,
3
Per la continuit`
a di fn in x0 , esiste un intorno U di x0 in E tale che
fn (x) fn (x0 ) < .
x U ,
3
Allora, per ogni x U risulta
f (x) f (x0 ) = f (x) fn (x) + fn (x) fn (x0 ) + fn (x0 ) f (x0 )
f (x) fn (x) + fn (x) fn (x0 ) + fn (x0 ) f (x0 )
<.
Per larbitrariet`
a di , f `e continua in x0 .
77
xE
Proposizione 3.2. Una successione (fn )nN di elementi di B(E) converge uniformemente su E a una
funzione f se e solo se f B(E) e
lim d(f, fn ) = 0 .
n
Per larbitrariet`
a di , limn d(f, fn ) = 0.
Viceversa, se f B(E) e limn d(f, fn ) = 0, dato > 0, esiste
n0 tale che, per ogni n n0 ,
d(f, fn ) < . Ma questo implica che, per ogni x E, f (x) fn (x) < . Quindi le fn convergono
uniformemente a f .
Teorema 3.3. Lo spazio metrico B(E), d `e completo.
Dimostrazione.
Sia (fn )nN una successione di Cauchy in B(E). Si fissi x
E. Siccome fn (x)
fm (x) d(fn , fm ), si deduce facilmente che la successione di numeri reali fn (x) nN `e pure di Cauchy.
Allora il limite
f (x) = lim fn (x)
n
78
Corollario 3.4. C(E) `e chiuso in B(E). In particolare, C(E), d `e pure uno spazio metrico completo.
4. Derivabilit`
a della funzione limite
Consideriamo in questo paragrafo successioni di funzioni definite su un intervallo I R. Nel caso in cui
I non sia aperto, per funzione derivabile su I intenderemo una funzione che `e derivabile in I e ammette
derivata laterale in ognuno dei due estremi che sia elemento di I.
Se vero che il limite uniforme di funzioni continue `e continuo, non `e vero in generale che il limite uniforme
di funzioni derivabili sia derivabile.
Esempio.
Ci sono molti modi di ottenere laqfunzione f (x) = |x| come limite uniforme su I = R di funzioni derivabili.
Si prenda per esempio fn (x) = x2 + n12 , il cui grafico `e il ramo superiore di uniperbole equilatera con
asintoti y = x e vertice nel punto (0, 1/n). Chiaramente fn `e derivabile su R. Essendo
r
1
1
|x| < x2 + 2 |x| + ,
n
n
Dimostriamo che le fn convergono uniformemente a f su [a, b]. Per la continuit`a uniforme di f , dato
> 0, esiste > 0 tale che
x, x0 [a, b] , |x x0 | < = |f (x) f (x0 )| < .
Si prenda ora n tale che (b a)/n < e siano I1 , . . . In i sottointervalli di I descritti sopra. Se x Ij ,
per la monotonia di fn su Ij , il valore fn (x) `e compreso tra i due valori fn (aj1 ) = f (aj1 ) e fn (aj ) = f (aj ).
Quindi
f (x) fn (x)| max f (x) f (aj1 )|, f (x) f (aj )| < ,
essendo |x aj1 | e |x aj | minori di .
Siccome la condizione (b a)/n < `e verificata definitivamente, si ottiene che d(f, fn ) < definitivamente.
1La conclusione vale anche per intervalli non compatti. Lo si dimostri per esercizio.
79
Per quanto detto a proposito delle funzioni lineari a tratti, ogni fn `e limite uniforme su [a, b] di funzioni
derivabili su [a, b]. Si prenda quindi, per ogni n, una funzione gn derivabile su [a, b] tale che d(fn , gn ) < 1/n.
Allora si ha definitivamente d(fn , gn ) < , e dunque d(fn , gn ) < 2.
Per larbitrariet`
a di si ha la conclusione.
Il Teorema
4.1 si pu`
o esprimere in termini topologici come segue. Chiamiamo D [a, b] il sottoinsieme
di C [a, b] i cui elementi
sono le funzioni
derivabili su [a, b].
Allora D [a, b] `e denso in C [a, b] .
Passiamo ora a discutere quali ipotesi possano garantire che se le funzioni fn sono derivabili su un
intervallo I e convergono a una funzione f , allora anche f `e derivabile su I e f 0 `e uguale al limite delle fn0 .
Si vuole cio`e avere luguaglianza
0
lim fn = lim fn0 ,
n
x)
fn (x) fn (
se x 6= x
hn (x) =
xx
f 0 (
x)
se x = x
.
n
80
x)
f (x) f (
se x 6= x
h(x) =
.
xx
g(
x)
se x = x
.
Se dimostriamo che le hn formano una successione di Cauchy in C(I), ne consegue che la convergenza a
h `e uniforme, e dunque h `e continua in x
. Ma questo vuol dire che
g(
x) = lim
x
x
f (x) f (
x)
= f 0 (
x) ,
xx
f
(
x
)
m
hn (x) hm (x) =
xx
0
0
(tx,x,n,m ) ,
= fn (tx,x,n,m ) fm
con tx,x,n,m strettamente compreso tra x e x
. Quindi
0
d(hn , hm ) = max hn (x) hm (x) d(fn0 , fm
),
x[a,b]
Nella dimostrazione si fatto uso dellipotesi di limitatezza dellintervallo I. Semplici esempi mostrano
che su intervalli illimitati non si pu`
o dedurre dalle stesse ipotesi la convergenza uniforme delle fn . Si ponga
per esempio, su I = R,
x
fn (x) = .
n
Le ipotesi del Teorema 4.2 sono soddisfatte, ma le fn non convergono uniformemente su R. Si noti per`
o
che su ogni sottointervallo compatto si ha convergenza uniforme. Si parla in questo caso di convergenza
uniforme sui compatti2. Si ha quindi la seguente estensione del Teorema 4.2.
Corollario 4.3. Sia (fn )nN una successione di funzioni derivabili su un intervallo I. Si supponga che
(i) le derivate fn0 convergano a una funzione g uniformemente sui compatti di I;
(ii) esista un punto x0 I tale che
lim fn (x0 ) = ` R .
Allora le funzioni fn convergono uniformemente sui compatti di I alla funzione f che soddisfa (4.1).
X
fn
n=0
di funzioni a valori reali definite su uno stesso insieme E converge uniformemente su E alla funzione s se la
successione delle somme parziali
sn = f0 + + fn
converge uniformemente a s su E.
2Si vede facilmente che se una successione converge uniformemente su un insieme E, converge uniformemente su ogni
E 0 E. Quindi la convergenza uniforme sui compatti di un intervallo aperto (a, b) equivale alla convergenza uniforme su una
famiglia di sottointervalli [an , bn ] con inf n an = a e supn bn = b.
81
Come per le serie numeriche, importante avere a disposizione criteri di semplice verifica che assicurino
la convergenza uniforme di una serie di funzioni.
Vedremo pi`
u avanti il criterio di Weierstrass, che `e bene per`o inquadrare in un contesto pi`
u generale. Per
far questo, osserviamo che ha senso parlare di somma di una serie solo quando lo spazio ambiente `e dotato,
da un lato, di una struttura algebrica che consenta di calcolare somme finite di suoi elementi, e dallaltro, di
una topologia (meglio ancora una metrica) che consenta di calcolare limiti. Il caso che ci interessa `e quello
di particolari metriche definite su spazi vettoriali, e da questo cominciamo.
Definizione 5.1. Sia V uno spazio vettoriale su R. Si chiama norma su V una funzione
k k : V [0, +) ,
che soddisfi le seguenti propriet`
a:
(i) kvk = 0 se e solo se v = 0;
(ii) per ogni R e v V , kvk = ||kvk;
(iii) per ogni v, w V , kv + wk kvk + kwk.
Se k k `e una norma su V , la coppia (V, k k) si chiama uno spazio normato.
Il seguente enunciato stabilisce la corrispondenza tra norme su V e distanze con particolari propriet`
a.
La dimostrazione, molto semplice, `e lasciata al lettore.
Proposizione 5.2. Sia k k una norma su uno spazio vettoriale V . Allora
d(v, w) = kv wk
`e un distanza su V , detta distanza indotta dalla norma data, che gode delle ulteriori propriet`
a
(a) per ogni R e v, w V , d(v, w) = ||d(v, w);
(b) per ogni v, w, z V , d(v + z, w + z) = d(v, w).
Viceversa, ogni distanza d su V che soddisfi le propriet`
a (a) e (b) `e indotta da una norma, data da
kvk = d(v, 0) .
Esempi di distanze indotte da norme sono le distanze dp su Rn del 7.1 del Capitolo 5, nonche la distanza
(3.1) su B(E).
P
La somma di una serie n=0 vn di elementi di uno spazio vettoriale normato si definisce come il limite,
se esiste, della successione delle somme parziali
sn = v0 + + vn
nella topologia su V indotta dalla norma.
P
Definizione 5.3. Si pone s = n=0 vn se
n
X
lim
s
vk
= 0 .
k=0
Nello studio delle serie numeriche, `e particolarmente importante il criterio di convergenza assoluta. Ci
si pu`
o domandare se vale, per serie in spazi normati, un analogo criterio di convergenza normale:
X
X
?
kvn k < + =
vn converge.
n=0
n=0
La risposta `e positiva a condizione che lo spazio normato sia completo. Anzi, come ora vedremo, la
validit`
a dellimplicazione convergenza normale convergenza `e equivalente alla completezza dello spazio.
Teorema 5.4. Sia (V, k k) uno spazio vettoriale normato. Le due condizioni seguenti sono equivalenti:
(i) rispetto alla distanza indotta dalla norma k k, V `e completo;
P
(ii) data
n=0 kvn k < +, la serie
P comunque una successione (vn )nN di elementi di V tale che
v
converge
a
un
elemento
di
V
.
n=0 n
82
Dimostrazione. Supponiamo che valga la condizione (i) e sia (vn )nN tale che
Dato > 0. esiste dunque n0 tale che, per n > m n0 , kvm+1 k + + kvn k < .
Posto sn = v0 + + vn , si ha allora
n=0
kvn k < +.
Corollario 5.5 (Criterio di Weierstrass). Sia (fn )nN una successioni di funzioni a valori reali definite
su un insieme E, e si supponga che
(i) per ogni n N esiste una costante Mn 0 tale che, per ogni x E,
fn (x) Mn ;
P
(ii)
n=0 Mn < +.
P
Allora la serie n=0 fn converge uniformemente su E.
Dimostrazione. Per ipotesi, le funzioni fn sono in B(E) e
kfn k = sup fn (x) Mn .
xE
Quindi
kfn k < + .
n=0
Per il Teorema 3.3, B(E) `e completo e la tesi segue allora dal Teorema 5.4.
Si ha anche il seguente corollario del Teorema 4.3.
6. SERIE DI POTENZE
83
Teorema 5.6. Sia (fn )nN una successioni di funzioni derivabili su un intervallo I R e si supponga che
P
(i) la serie derivata n=0 fn0 converga
Puniformemente sui compatti di I;
(ii) esista un punto x0 I tale che n=0 f( x0 )n converga.
P
Allora la serie n=0 fn converge uniformemente sui compatti di I a una funzione derivabile e
X
0 X
fn =
fn0 (x)
n=0
n=0
per ogni x I.
6. Serie di potenze
Si chiama serie di potenze una serie di funzioni della forma
X
an (x x0 )n = a0 + a1 (x x0 ) + a2 (x x0 )2 + ,
n=0
dove i coefficienti an sono valori assegnati3. Il punto x0 si chiama il centro della serie.
Nella prima parte della trattazione, studieremo le serie di potenze in campo complesso, assumendo che
sia i coefficienti an , sia il centro x0 , sia la variabile x in C.Luso dei simboli z, z0 invece di x, x0 aiuter`
aa
ricordare che si `e in ambito complesso.
Non ci soffermiamo a osservare che il contenuto dei paragrafi precedenti di questo Capitolo si applica
senza modifiche a funzioni a valori complessi.
Il cambiamento di variabile z = w c trasforma una serie di potenze centrata in w0 in una serie di
potenze, nella variabile w, centrata in w0 = z0 + c. Per questo motivo enunceremo i risultati generali solo
per serie di potenze centrate in 0, cio`e della forma
X
an z n .
(6.1)
n=0
E evidente che la serie (6.1) converge per z = 0 (in generale nel suo centro), e la sua somma d`a a0 . E
possibile che il centro sia lunico punto di convergenza di una serie di potenze.
Si prenda ad esempio
X
nn z n .
n=0
Se z 6= 0,
lim |nn z n | = lim |nz|n = + ,
n
zn
|z|
|an z n | = |an z0n | n M
.
z0
|z0 |
84
La serie geometrica di ragione |z|/|z0 | < 1 converge, e dunque si ha la prima parte della tesi.
La seconda parte della tesi si ricava facilmente, perche la disuguaglianza ottenuta dimostra anche che,
per ogni z con |z| r, si ha
n
r
|an z n | M
.
|z0 |
Basta dunque applicare il critero di Weierstrass.
Sia dunque
n
o
X
E= zC:
an z n converge .
(6.2)
n=0
p
n
|an | [0, +] .
Allora
R=
1
,
`
Per il criterio della radice, la serie converge se |z|` < 1 e non converge se |z|` > 1. La conclusione si
deduce facilmente.
P
Sia n=0 an z n una serie di potenze con raggio di convergenza R > 0. Chiamiamo f (z) la funzione
somma, definita sullinsieme di convergenza E in (6.2).
Teorema 6.5. La funzione f `e continua su DR .
Dimostrazione. Per la convergenza uniforme della serie sui compatti di DR , f `e continua su ognuno
di tali compatti. Ovviamente questo `e equivalente alla continuit`a su DR .
85
7. Derivabilit`
a sullasse reale
P
Sia f (z) = n=0 an z n , dove la serie ha raggio di convergenza R > 0.
Restringiamo f a DR R = (R, R) e discutiamone la derivabilit`a. Per far questo consideriamo la serie
derivata
X
X
X
(7.1)
(an xn )0 =
nan xn1 =
(n + 1)an+1 xn .
n=0
n=1
n=0
X
f 0 (x) =
(n + 1)an+1 xn .
n=0
P
n1
n
Dimostrazione. Le due serie
e
n=1 nan x
n=1 nan x convergono per gli stessi valori di x.
Calcoliamo dunque
p
p
1
lim sup n n|an | = lim n n lim sup n |an | =
.
n
R
n
n
La conclusione segue dal Teorema 5.6.
Iterando lapplicazione di questo teorema alle derivate successive, si ottiene:
Corollario 7.2. La funzione f `e C su (R, R) e per ogni k N,
X
f (k) (x) =
(n + k)(n + k 1) (n + 1)an+k xn .
n=0
Esempi.
P
1. La serie n=0
(7.2)
xn
n
X
n=0
xn =
1
.
1x
Pertanto f `e una primitiva di 1/(1 x) sullintervallo (1, 1), ossia esiste c R tale che f (x) =
log(1 x) + c. Ma c = f (0) = 0, e dunque
X
xn
= log(1 x) .
n
n=0
2. In modo analogo si dimostra che per x (1, 1),
X
(1)n 2n+1
(7.3)
x
= arctan x .
2n + 1
n=0
X
f (n) (x0 )
(x x0 )n
n!
n=0
86
e domandarsi se essa converge, almeno in un intorno di x0 , alla funzione f . La risposta `e in generale negativa
per due motivi:
la serie pu`
o avere raggio di convergenza nullo;
la serie pu`
o avere raggio di convergenza positivo, ma convergere a una funzione diversa da f .
Un esempio esplicito mostra che si pu`
o presentare la seconda possibilit`a. Si prenda
( 1
e x2
se x 6= 0
f (x) =
0
se x = 0 .
Si vede facilmente che f `e continua in x0 = 0. Dimostriamo per induzione che f ha derivate di ogni
ordine in 0 e che f (n) (0) = 0 per ogni n.
Si verifica facilmente, sempre per induzione, che f `e C su R \ {0} e che, per x 6= 0,
1 1
f (n) (x) = Pn
e x2 ,
x
dove i Pn sono polinomi. Allora, assumendo come ipotesi induttiva che f (n) (0) = 0, si ha che
f (n) (x) f (n) (0)
x0
x
Pn
= lim
1
x
e x2
x
2
= lim tPn (t)et
x0
=0,
perche, per ogni k,
2
et = o(e|t| ) = o(|t|k )
(t ) .
Quindi la serie di Taylor di f centrata in 0 ha tutti i termini identicamente nulli. Dunque ha raggio di
convergenza infinito ma non converge a f (x) per x 6= 0.
Che la prima possibilit`
a (raggio di convergenza nullo della serie di Taylor) sia concreta si ricava dal
seguente teorema, di cui tralasciamo la dimostrazione.
Teorema 8.1 (Teorema di Borel). Data una qualunque successione (bn )nN di numeri reali, esiste una
funzione f C su R tale che f (n) (0) = bn per ogni n.
Prendendo, ad esempio, bn = n!nnP
, e una corrispondente funzione f come nella tesi del teorema di Borel,
n=0
87
Prendiamo ora un generico punto x0 (R, R). Sempre per il Corollario 7.2, la serie di Taylor di f
centrata in x0 `e
X
X
f (k) (x0 )
1 X
k
(n + k) (n + 1)an+k xn0 (x x0 )k
(x x0 ) =
k!
k! n=0
k=0
k=0
(8.1)
X
X
n+k
n
=
an+k x0 (x x0 )k .
k
n=0
k=0
(k,n)N2
|an+k ||x0 |n |x x0 |k =
p
|ap | |x0 | + |x x0 | .
p=0
Questultima serie converge per |x0 | + |x x0 | < R, condizione che individua il massimo intervallo
centrato in x0 e contenuto in (R, R). Chiamiamo Ix0 tale intervallo. Dunque per x Ix0 la sommatoria
X n + k
an+k xn0 (x x0 )k
k
2
(k,n)N
converge, e pertanto la serie di Taylor (8.1) pu`o essere ricombinata come serie in p delle sommatorie sugli
insiemi Ep . Ma
X n + k
an+k xn0 (x x0 )k = ap xp ,
k
(k,n)Ep
X
f (k) (x0 )
k=0
k!
(x x0 )k =
ap xp = f (x) .
p=0
tende a 0 per n .
In molti casi, la questione si risolve facendo uso di una delle due formule del resto Rn , la forma di
Lagrange e la forma integrale.
Teorema 8.4.
(i) (Resto in forma di Lagrange) Si supponga che f sia derivabile n volte in x0 e che, in U \ {x0 },
esista anche f (n+1) . Allora, per ogni x U \ {x0 }, esiste un punto tx , strettamente compreso tra
x0 e x, tale che
f (n+1) (tx )
Rn (x) =
(x x0 )n .
(n + 1)!
88
(ii) (Resto in forma integrale) Si supponga che f sia derivabile n + 1 volte in U . Allora, per ogni
x U \ {x0 },
Z
1 x
Rn (x) =
(x t)n f (n+1) (t) dt .
n! x0
La dimostrazione della formula (i) `e parte del normale programma di un corso di Analisi. La dimostrazione di (ii) si ottiene per induzione con una semplice integrazione per parti.
Esempio.
Per R si consideri la funzione
f (x) = (1 + x) ,
che `e C sulla semiretta (1, +) qualunque sia . Trascurando il caso N, in cui f si riduce a un
polinomio, negli altri casi non si ha prolungamento C fuori da questa semiretta.
Essendo
f(n) (x) = ( 1) ( n + 1)(1 + x)n ,
Il resto Rn (x) della formula di Taylor in forma integrale `e
Z
( 1) ( n) x
(x t)n (1 + t)n1 dt .
Rn (x) =
n!
0
Ponendo
( 1) ( n + 1)
,
=
n!
n
la serie di Taylor centrata in 0 `e
X
(8.2)
n=0
xn ,
detta serie binomiale. Per 6 N, la serie (8.2) ha raggio di convergenza 1. Per |x| < 1 si ha
Z x
Rn (x) ( 1) ( n)
|x t|n (1 + t)n1 dt
n!
0
( 1) ( n) Z x |x t| n
=
(1 + t)1 dt .
n!
1
+
t
0
Si vede facilmente che, per x (1, 1) fissato, il rapporto |x t|/(1 + t) `e limitato superiormente, al
variare di t tra 0 e x, da una costante cx < 1. Quindi
Z x
1 n
1
Rn (x) ( 1) ( n) cnx
cx .
(1 + t)
dt = (1 + x) 1
n!
n
0
Applicando il criterio del rapporto, si ottiene che limn Rn (x) = 0. Dunque
X
n=0
xn = (1 + x)
9. IL LEMMA DI ABEL
89
9. Il Lemma di Abel
P
Sia n=0 an z n una serie di potenze di raggio R, finito e strettamente positivo. Supponiamo che in un
dato punto z0 con |z0 | = R la serie converga. Il Teorema 6.5 non dice nulla sulla continuit`a della funzione
somma in z0 .
Per esempio, sappiamo che la serie logaritmica (7.2)
X
xn
n
n=1
converge in [1, 1) e che la somma `e uguale a log(1 x) per x (1, 1). Non possiamo per`o dire se, per
x = 1, la somma della serie (cio`e della serie armonica a segni alterni con primo termine negativo) `e uguale
a log 2. Per ottenere questa conclusione, sarebbe utile sapere che la serie converge uniformemente su un
intervallo comprendente il punto 1, diciamo su [1, 0].
Vedremo in questo paragrafo che la convergenza in z0 implica la convergenza uniforme sul raggio congiungente 0 a z0 , ma anche su certi sottoinsiemi chiusi del disco DR detti non tangenziali, o angoli di Stolz.
Con vertice in z0 , si consideri un angolo di ampiezza 2 < , avente per bisettrice il raggio congiungente 0
a z0 e troncato in modo da non contenere punti di modulo R allinfuori di z0 . Non `e importante come si
effettua il troncamento, perche la differenza tra due regioni cos` costruite per lo stesso valore di `e comunque
un sottoinsieme compatto del disco aperto DR , e su di esso si ha gi`a la convergenza uniforme della serie per
il Teorema 6.2. Indichiamo con Sz0 , una tale regione.
6
.....................................................
.........................
...............
...............
............
............
..........
..........
.........
.
.
.
.
.
.
.
.
........
......
.
.
.
........
.
.
.
....
.......
.
.
.
.
.
.
.......
....
.
.
.
.
......
.
.
....
......
0
.
.
.
.
.
......
.....
.
.
....
.
..
.
....
.
.
..
....
.
.
.
....
..
...........
....
....
.........
....
....
........
...
...
.......
...
......
...
.
...
.
......
...
...
.
.
.
.....
...
..
....
.
...
....
..
.
...
....
..
.
...
...
..
.
.
...
...
...
...
....
...
...
...
.
..
...
..
z0 ,
...
..
..
...
..
..
...
..
...
..
..
...
.
..
..
..
..
..
..
..
.
..
..
..
.
..
..
..
..
...
..
...
...
...
....
...
..
...
...
...
..
...
..
.
.
...
.
...
...
...
...
...
...
...
...
.
....
.
.
..
....
....
....
....
....
....
....
...
.
.....
.
.
......
......
......
......
.......
......
.......
.......
........
.......
.
.
.
.
........
.
.
......
.........
.........
..........
..........
............
...........
..............
..............
......................
..............................................................
S
P
Teorema 9.1. (Lemma di Abel). Sia R (0, +) il raggio di convergenza della serie n=0 an z n , e
si supponga che essa converga in un punto z0 con |z0 | = R. Allora essa converge uniformemente in ogni
regione di Stolz Sz0 , , con 0 < 2 .
90
an z0n wn
n=0
nella variabile w. Essa converge in un punto w se e solo se la serie data converge in z0 w. Dunque ha raggio
di convergenza 1 e converge per w = 1. Inoltre essa converge uniformemente su un insieme A se e solo se la
serie data converge uniformemente sullinsieme z0 A = {z0 w : w A}.
modo possiamo ricondurre la dimostrazione del teorema al caso particolare in cui la serie
PIn questo
n
a
z
abbia
raggio di convergenza R = 1 e il punto di convergenza sul bordo sia z0 = 1.
n=0 n
Unaltra semplificazione della dimostrazione consiste nel ridursi al caso in cui il valore della somma in
z0 = 1 `e uguale a 0, cio`e
(9.1)
an = 0 .
n=0
Ci`
o si ottiene modificando opportunamente il coefficiente iniziale a0 . Questa variazione non altera gli
insiemi di convergenza puntuale e uniforme della serie.
Assumendo dunque questa ipotesi, poniamo
s(z) =
ak z k ,
sn (z) =
n
X
ak z k ,
An = sn (1) =
ak .
k=0
k=0
k=0
n
X
(9.2)
=
n1
X
Ak (z k z k+1 ) + An z n .
k=0
Per la (9.1), limn An = 0, per cui il termine An zn converge uniformemente a 0 sul disco chiuso
B(0, 1). Inoltre, si ottiene dalla (9.2) che
Ak (z k z k+1 ) = lim sn (z) An z n = s(z) ,
n
k=0
n1
X
X
|s(z) sn (z)| =
Ak (z k z k+1 )
Ak (z k z k+1 ) An z n
k=0
k=0
X
=
Ak (z k z k+1 ) An z n
k=n
k=n
Dato > 0, si fissi n0 tale che |An | < per ogni n n0 . Si ha allora, per n n0 e |z| 1,
X
|s(z) sn (z)|
|z k z k+1 | + 1
k=n
X
|z k z k+1 | + 1 .
k=0
9. IL LEMMA DI ABEL
91
Restringiamoci ora a z S1, con < /2. Poiche i punti di S1, , tranne il punto 1, hanno modulo
strettamente minore di 1, si ha
0
se z = 1
X
X
|z k z k+1 | =
|1 z||z|k = |1 z|
se z S1, \ {1} .
k=0
k=0
1 |z|
Dunque, per n n0 ,
sup |s(z) sn (z)|
zS1,
|1 z|
+1 .
zS1, \{1} 1 |z|
sup
@
@...........
@............
....
...
@
...
...
...
@
..
...
...
... ...
... ...
... ...
... ...
... ...
... ...
... ...
.. ...
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ...
.. ..
.. ...
.. ...
.. .
..
.
...
...
...
...
..
..
..
..
....
..
...
...
....
..
...
...
..
.
...
...
..
...
.
.
..
...
...
....
....
.
.
.
..
....
....
....
...
.
.
.
..
....
......
......
......
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
..
1,
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
...
...
...
...
..
....
....
....
...
.
..
..
..
..
...
.
..
..
..
..
...
..
...
...
....
..
...
...
..
.
...
...
...
..
.
...
...
..
@
S
z @0
z
@
Z
Z
Z@
Z@
Z
@
Z
@
Z 1
|z|
Si ha allora
|z z 0 | z 0 |z| ,
e dunque
|1 z| = |1 z 0 | + |z 0 z| |1 z 0 | + z 0 |z|
1
= 1 |z|
+ tan
cos
2
2
1 |z|
1 |z| ,
cos
cos
come volevasi dimostrare.
92
X
1 n
x
n!
n=0
ex
R=
X
(1)n 2n+1
x
(2n + 1)!
n=0
sin x
X
(1)n 2n
x
(2n)!
n=0
cos x
sinh x
1
x2n+1
(2n
+
1)!
n=0
1
x2n
(2n)!
n=0
cosh x
X
(1)n1 n
x
n
n=1
log(1 + x)
1
x2n+1
2n
+
1
n=1
X
(1)n 2n+1
x
2n + 1
n=1
X
n=0
10
xn
1
2n 2n+1
x
n
(2n + 1)4
n
n=0
1
2
log
1+x
1x
arctg x
(1 + x)
1 ( 6 N)
arcsin x
CAPITOLO 7
` VARIABILI
CALCOLO DIFFERENZIALE IN PIU
Si danno per note le nozioni fondamentali di algebra lineare.
t0
f (
x + tv) f (
x)
,
t
f
(
x) .
xj
Vediamo linterpretazione grafica della derivata direzionale per funzioni di due variabili. Supponiamo
che v = (a, b) R2 sia un versore, cio`e |v| = 1. Intersecando il grafico di f in R3 ,
Gf = x1 , x2 , f (x1 , x2 ) : (x1 , x2 ) A ,
con il piano verticale affine passante per p = (
x1 , x
2 , 0) e parallelo al sottospazio generato dai due vettori
w1 = (a, b, 0) e w2 = (0, 0, 1), si ottiene linsieme di punti
p + tw1 + uw2 : u = f (
x + tv) .
Quindi v f (
x) rappresenta il coefficiente angolare della tangente a questo grafico.
La definizione di derivata direzionali `e data anche per vettori non normalizzati1. Ovviamente, per R,
v f (
x) = v f (
x) .
1Si pu`
o anche aggiungere 0 f (
x) = 0, qualunque sia f , anche si perde il significato geometrico di questo valore.
93
` VARIABILI
7. CALCOLO DIFFERENZIALE IN PIU
94
Si osservi, che a differenza di quanto succede con funzioni di una variabile, lesistenza di tutte le derivate
parziali di una funzione in un punto non implica la continuit`
a nel punto stesso. La funzione (8.2) del
Capitolo 5, che `e discontinua nellorigine, ha tutte le derivate direzionali, uguali a 0, in quel punto.
2. Differenziale
Per funzioni di una variabile, le due seguenti propriet`a sono equivalenti:
(i) f `e derivabile in x0 ;
(ii) esiste una funzione lineare g(h) = ah che approssimi lincremento di f da x0 a x0 + h a meno di
un infinitesimo superiore al primo, cio`e tale che f (x0 + h) f (x0 ) = g(h) + o(h) per h 0.
Si verifica quindi che, quando queste condizioni sono verificate, la costante a `e univocamente determinata
ed `e uguale a f 0 (x0 ).
Proviamo a riformulare le due propriet`a per funzioni di pi`
u variabili nel modo seguente:
(i) f ha tutte le derivate direzionali in x
;
(ii) esiste una funzione lineare da Rn a R, g(h) = a1 h1 + + an hn = a h, che approssimi lincremento
di f da x
ax
+ h a meno di un infinitesimo superiore al primo, cio`e tale che
(2.1)
f (
x + h) f (
x) = g(h) + o |h|
(h 0) .
Siccome g `e continua in 0, la condizione (ii) implica che
(2.2)
lim f (x) = f (
x) ,
x
x
f (
x + tv) f (
x)
=av .
t0
t
A questo punto, le conseguenze (a) e (b) sono ovvie.
lim
n
X
f
(2.3)
f (x) = f (
x) +
(
x)(xj x
j ) + o |x x
|
(x x
) .
x
j
j=1
2. DIFFERENZIALE
Definizione 2.4.
Il vettore
x f =
95
f
f
(
x), . . . ,
(
x)
x1
xn
si chiama il gradiente di f in x
.
Lapplicazione lineare
dx f (h) = (x f ) h
si chiama il differenziale di f in x
.
Liperpiano di Rn+1 , con coordinate (x1 , . . . , xn , y), di equazione
y = f (
x) + (x f ) (x x
)
si chiama iperpiano tangente (spesso anche piano tangente) al grafico di f in x
.
Quando f `e differenziabile in x
, il piano tangente in x
`e lunione delle rette tangenti ai grafici ottenuti
su ciascun piano (bidimensionale) verticale passante per (
x, 0) intersecandolo con il grafico di f .
Definizione 2.5. Un punto x
in cui una funzione f `e differenziabile si dice stazionario se x f = 0.
Questo equivale a dire che tutte le derivate direzionali in x
sono nulle, o anche che il piano tangente al
grafico in x
`e orizzontale (cio`e di equazione y =costante).
Proposizione 2.6. Sia f differenziabile in x
e sia x
non stazionario. Poniamo allora
x f = |x f |v0 ,
dove v0 `e il versore di x f . Al variare di v tra i versori di Rn , la derivata direzionale v f (
x) assume valore
massimo per v = v0 , e v0 f (
x) = |x f |.
Dimostrazione. Per ogni versore v,
v f (
x) = (x f ) v = |x f |(v0 v) .
Per la disuguaglianza di Cauchy-Schwarz (Teorema 1.2 del Capitolo 5), |v0 v| 1 e vale luguaglianza
se e solo se v = v0 . Ma allora v0 v assume valore massimo, uguale a 1, se e solo se v = v0 .
Possiamo dire che x f indica la direzione di massima pendenza del grafico di f in x0 , e il suo verso
quello di massima crescita.
La condizione di differenziabilit`
a in un punto consente, note le derivate parziali nel punto2, di determinare
tutte le altre derivate direzionali. Infatti, se v = (v1 , . . . , vn ) = v1 e1 + + vn en ,
v f (
x) =
n
X
j=1
vj
f
(
x) .
xj
In altri termini, i valori delle derivate direzionali sono vincolati ai valori delle derivate parziali.
Questo non succede in generale se la funzione, pur avendo tutte le derivate direzionali in un punto, non
`e ivi differenziabile, come mostra lesempio seguente.
Esempio.
In R2 introduciamo le coordinate polari
(
x1 = r cos
(2.4)
x2 = r sin
(r 0) .
` VARIABILI
7. CALCOLO DIFFERENZIALE IN PIU
96
(
t(0 )
f (tv0 ) =
|t|(0 + ) = t(0 )
se t 0
se t < 0 .
Ne segue che, per ogni , f (tv ) `e lineare in t. Dunque f ha tutte le derivate direzionali in 0, e anzi il
suo grafico `e lunione delle rette tangenti sui vari piani verticali passanti per lorigine.
Ma si vede facilmente (esercizio) che le rette tangenti giacciono sullo stesso piano se e solo se `e della
forma
() = a + b sin + c cos ,
il che non `e sempre verificato (per es. per () = sin 3).
3. Il teorema del differenziale totale
Il Teorema che presentiamo fornisce condizioni sufficienti per la differenziabilit`a di una funzione in un
punto. Esso `e utile sia per gli sviluppi teorici che nel calcolo concreto con funzioni di pi`
u variabili.
Teorema 3.1 (Teorema del differenziale totale). Sia f dotata di derivate parziali in un intorno di un
punto x
Rn . Se tali derivate sono continue in x
, allora f `e differenziabile in x
.
Dimostrazione. Possiamo supporre che lintorno di x
su cui esistono le derivate parziali di f sia
convesso, per esempio una palla Bx,r . Dimostriamo che vale la formula (2.3) partendo dalluguaglianza, per
x Bx,r ,
f (x) = f (x) f (x1 , . . . , xn2 , xn1 , x
n ) + f (x1 , . . . , xn2 , xn1 , x
n ) f (x1 , . . . , xn2 , x
n1 , x
n )
(3.1)
+ + f (x1 , x
2 , . . . , x
n ) f (
x) + f (
x)
= n (x) + n1 (x) + 1 (x) + f (
x) .
Per ogni j = 1, . . . , n, la differenza j (x) rappresenta lincremento da x
j a xj della funzione di una
variabile
hj (t) = f (x1 , . . . , xj1 , t, x
j+1 , . . . , x
n ) .
Per ipotesi, hj `e derivabile su un intervallo aperto contenente x
j e xj e
h0j (t) =
f
(x1 , . . . , xj1 , t, x
j+1 , . . . , x
n ) .
xj
Applicando il Teorema di Lagrange, otteniamo che esiste tj = tj (x), strettamente compreso tra x
j e xj ,
tale che
f
j (x) =
(x1 , . . . , xj1 , tj , x
j+1 , . . . , x
n ) (xj x
j ) .
xj
Essendo le derivate parziali continue in x
, dato > 0, esiste > 0 tale che, per ogni j,
f
f
y Bx, =
(y)
(
x) < .
xj
xj
Per l convessit`
a delle palle, se prendiamo x Bx, , anche i punti yj = (x1 , . . . , xj1 , tj , x
j+1 , . . . , x
n )
sono in Bx, . Quindi
f
(
x)(xj x
j ) < |xj x
j | |x x
| ,
j (x)
xj
4. CURVE REGOLARI IN Rn
97
j (x) =
f
(
x)(xj x
j ) = o |x x
|
xj
(x x
) .
6
(
x1 , x2 )
(t1 , x2 )
(x1 , x2 )
(
x1 , t2 )
(
x1 , x
2 )
` VARIABILI
7. CALCOLO DIFFERENZIALE IN PIU
98
Lemma 4.2. Siano : I Rn una curva regolare, t I, x = (t), v = 0 (t). La retta parametrica
r(h) = x + hv `e lunica che soddisfi la condizione
(t + h) = r(h) + o(h)
(h 0) .
Sia ora f una funzione di classe C 1 su un aperto A e sia : I A una curva regolare in A. Allora la
composizione f : I R `e derivabile in I.
Proposizione 4.3 (Regola di derivazione in catena). La funzione f `e derivabile in I e
n
X
f
(f ) (t) =
(t) j0 (t) = (t) f 0 (t) .
xj
j=1
0
Dimostrazione. Siano t I, x
= (t) A. Per il Corollario 2.3,
f (x) = f (
x) + x f (x x
) + o |x x
|
(x x
) .
Sostituendo x = (t + h) e usando il Lemma 4.2, si ha, per h 0,
f (t + h) = f x
+ h 0 (t) + o(h)
= x f h 0 (t) + o(h) + o h 0 (t) + o(h)
Essendo h 0 (t) + o(h) = O(h) per h 0, lultimo termine `e o(h), e dunque
f (t + h) = x f h 0 (t) + o(h) .
Da questo segue la tesi.
6. FUNZIONI IMPLICITE
99
` VARIABILI
7. CALCOLO DIFFERENZIALE IN PIU
100
Lemma 6.1. Siano A aperto di R2 , f di classe C 1 su A e : I A una curva regolare con sostegno
contenuto nellinsieme di livello Ea di f . Allora, per ogni t I, i vettori 0 (t) e (t) f sono ortogonali.
Dimostrazione. La funzione composta f `e di classe C 1 su I e costantemente uguale ad a. Per la
Proposizione 4.3,
(t) f 0 (t) = (f )0 (t) = 0 ,
per ogni t I.
La relazione di ortogonalit`
a `e certamente verificata se il punto (x, y) = (t) `e stazionario per f , indipendentemente dalla direzione di 0 (t). Ma si noti che negli esempi elencati sopra sono proprio i punti stazionari
quelli in cui si verificano irregolarit`
a dellinsieme di livello.
Per poter formulare un risultato positivo, `e dunque opportuno limitarsi a punti di Ea che non siano
stazionari per f .
Supponiamo allora che y = g(x) sia implicitamente definita, nellintorno di un punto non stazionario
(
x, y) Ea , dallequazione f (x, y) = a, con g di classe C 1 sullintervallo I, e poniamo (t) = t, g(t) . Allora
vale lidentit`
a
(6.2)
Deve necessariamente essere
f
f
(
x, y) +
(
x, y)g 0 (t) = 0 .
x
y
f
(
x, y) 6= 0, perche altrimenti si annullerebbe anche laltra derivata
y
parziale.
Il teorema che segue mostra che questa condizione `e anche sufficiente per poter esplicitare y in funzione
di x nellintorno di (
x, y).
Teorema 6.2 (Teorema delle funzioni implicite in R2 ). Sia f di classe C 1 sullaperto A di R2 , e sia
f
(
x, y) A tale che
(
x, y) 6= 0. Esiste allora un intorno U = (
x 1 , x
+ 1 ) (
y 2 , y + 2 ) di (
x, y)
y
tale che, posto a = f (
x, y), linsieme U Ea sia il grafico y = g(x), con g di classe C 1 su (
x 1 , x
+ 1 ).
Inoltre,
(6.3)
f
x, g(x))
,
g 0 (x) = x
f
x, g(x))
y
per ogni x (
x 1 , x
+ 1 ).
Dimostrazione. Possiamo supporre che a = 0 e che
f
(
x, y) > 0.
y
f
> 0.
y
La funzione hx (y) = f (
x, y) `e dunque strettamente crescente su [
y , y + ], per cui
Fissiamo un rettangolo chiuso iniziale [
x , x
+ ] [
y , y + ] su cui
f (
x, y ) < 0 ,
f (
x, y + ) > 0 .
f (x, y + ) > 0 .
6. FUNZIONI IMPLICITE
101
6
+
(
x + , y + )
x, y)
(
(
x , y )
g(x).
Congiungiamo
quindi i punti x, g(x) e
x + h, g(x + h) = x + h, g(x) + k per mezzo del segmento
(t) = x + th, g(x) + tk ,
t [0, 1] .
La funzione composta f `e continua su [0, 1], derivabile allinterno e nulla agli estremi. Per il Teorema
di Rolle, esiste = (h) (0, 1) tale che
f
f
x + h, g(x) + k + k
x + h, g(x) + k = 0 .
(6.4)
(f )0 () = h
x
y
Poiche il rettangolo U = [
x 1 , x
+ 1 ] [
y , y + ] `e compatto, esistono costanti M, m > 0 tali che,
per ogni (x, y) U ,
f
f
(x, y) m .
(x, y) M ,
x
y
Ricavando k dalla (6.4), si ottiene la condizione di Lipschitz
g(x + h) g(x) = |k| M |h| .
m
Allora la funzione di h
f
f
x + h, g(x) + k =
x + (h)h, g(x) + (h) g(x + h) g(x)
x
x
`e continua in h = 0, e dunque
f
f
x + h, g(x) + k(h) =
x, g(x) + o(1)
(h 0) .
x
x
Analogamente per f /y. Si ha quindi che
f
f
x + h, g(x) + k)
x, g(x)) + oh0 (1)
g(x + h) g(x)
k
x
= =
= x
.
f
f
h
h
x + h, g(x) + k)
x, g(x)) + oh0 (1)
y
y
` VARIABILI
7. CALCOLO DIFFERENZIALE IN PIU
102
Passando al limite per h 0 si ottiene la derivabilit`a di g e la formula (6.5). A sua volta, (6.5) prova
la continuit`
a di g 0 .
La condizione (x,y) f 6= 0 `e dunque sufficiente per poter esplicitare una delle due variabili in funzione
dellaltra in un intorno del punto dato. Tuttavia questa condizione non `e affatto necessaria. Supponendo
a = 0, si noti infatti che f e f 2 definiscono lo stesso insieme di livello E0 , ma
(f 2 ) = 2f f
`e nullo su E0 .
Il Teorema delle funzioni implicite ha il seguente analogo per funzioni di n variabili, che ci limitiamo a
enunciare, anche se la dimostrazione `e del tutto analoga a quella del caso bidimensionale.
Per comodit`
a, indichiamo i punti x Rn come coppie (x0 , xn ) con x0 = (x1 , . . . , xn1 ) Rn1 .
Teorema 6.3 (Teorema delle funzioni implicite in Rn ). Sia f di classe C 1 sullaperto A di Rn , e sia
x
A tale che x f 6= 0. A meno di una permutazione dellordine delle variabili, supponiamo per semplicit`
a
f
(
x) 6= 0.
che
xn
Poniamo x
= (
x0 , x
n ). Esiste allora un intorno U = U 0 (
xn , x
n + ) di x
(dove U 0 `e un intorno di
0
n1
0
x
in R
) tale che, posto a = f (
x), linsieme U Ea sia il grafico xn = g(x ), con g di classe C 1 su U 0 .
Inoltre, per ogni x0 U 0 e 1 k n 1,
f 0
x , g(x0 ))
g 0
xk
(6.5)
(x ) =
.
f
xk
x0 , g(x0 ))
xn
7. Funzioni differenziabili da Rn a Rm
Consideriamo una funzione F : E Rm , con E sottoinsieme di Rn . Siano (f1 , . . . , fm ) le componenti
scalari di F , e sia x
un punto interno a E. Supponiamo che ogni fj , j = 1, . . . , m, ammetta derivate parziali
fj
in x
per ogni k = 1, . . . , n. I valori di queste derivate si raggruppano nella matrice derivata, o anche
xk
matrice Jacobiana
f1
f1
(
x)
(
x)
x1
xn
.
.
.
= fj (
..
..
..
x
)
,
DF (
x) =
xk
j=1,...,m , k=1,...,n
f
f
m
m
(
x)
(
x)
x1
xn
con m righe e n colonne. Si noti che
le riga j-esima della matrice `e il gradiente in x
della componente fj ,
la colonna k-esima `e il vettore tangente in x
k della curva
k (xk ) = F (
x1 , . . . , x
k1 , xk , x
k+1 , . . . , x
n ) ,
F
(
x).
xk
Le nozioni introdotte per funzioni a valori reali si estendono come segue alle funzioni a valori in Rm .
ossia k0 (
xk ) =
103
Questa riduzione alle componenti scalari ha una serie di conseguenze sulla base dei risultati visti finora.
Corollario 7.3.
(i) Se F `e differenziabile in x
, nella (7.1) si ha G(h) = DF (
x)h.
(ii) Se F `e differenziabile in x
, essa ammette derivate direzionali, date da
v F (
x) = DF (
x)v .
(iii) Se ogni fj ammette derivate parziali in un intorno di x
e continue in x
, F `e differenziabile in x
.
G : B Rk ,
con A Rn , B Rm .
Sotto opportune ipotesi sulla differenziabilit`a di F e G, vogliamo discutere la differenziabilit`a di G F ,
ove definita.
Teorema 8.1. Siano F e G come sopra. Si supponga che
(i) F sia differenziabile in un punto x
interno ad A;
(ii) F (
x) = y sia interno a B e G sia differenziabile in y.
Allora G F `e definita in un intorno di x
, differenziabile in x
e vale lidentit`
a
D(G F )(
x) = DG(
y )DF (
x) .
Si noti che le dimensioni delle due matrici derivate rendono possibile il prodotto nellordine indicato.
Dimostrazione. Essendo y interno a B, esiste una palla By,r B. Per la continuit`a di G in y, esiste
una palla Bx,r0 , che possiamo supporre contenuta in A, tale che F (Bx,r0 ) By,r . Quindi G F `e definita su
Bx,r0 .
Si ha dunque, per x
+ h Bx,r0 e y + k By,r
F (
x + h) F (
x) = DF (
x)h + o |h|
(h 0)
G(
y + k) G(
y ) = DG(
y )k + o |k|
(k 0) .
Ponendo
k = k(h) = F (
x + h) F (
x) = F (
x + h) y = DF (
x)h + oh0 |h| ,
nella seconda formula e osservando che |k(h)| = Oh0 (|h|), si ottiene
G F (
x + h) G F (
x) = DG(
y ) DF (
x)h + oh0 |h| + oh0 |h|
= DG(
y )DF (
x)h + oh0 |h| ,
e questo d`
a la tesi.
` VARIABILI
7. CALCOLO DIFFERENZIALE IN PIU
104
Corollario 8.2 (Formula di derivazione in catena). Nelle ipotesi del Teorema 8.1, ponendo G F =
H = (h1 , . . . , hk ), vale la formula
m
X
hj
fp
gj
(
x) =
(
y)
(
x) ,
xi
yp
xi
p=1
i = 1, . . . , n , j = 1, , k .
f
(
x) = 0 .
xj
Quindi x f = 0.
105
G : U 0 A ,
(9.2)
Ma
DG(
x)=
0
1
..
.
..
.
g
x0 )
x1 (
g
x0 )
x2 (
1
0
..
.
0
0
..
.
1
g
0
(
x
)
xn1
dove le n 1 colonne sono linearmente indipendenti e generano il sottospazio parallelo alliperpiano tangente
al grafico di g (cio`e a Ea ) in x
. Quindi la condizione (9.2) indica che x f `e ortogonale a tale iperpiano.
Daltra parte, la stessa conclusione vale per x , in quanto la funzione
(x0 ) = x0 , g(x0 )
`e costantemente uguale ad a. Siccome il sottospazio ortogonale a un iperpiano ha dimensione 1, esiste R
tale che
x f = x
(si noti che x 6= 0).
Definizione 9.4. Siano f, , a, Ea come nel Teorema 9.3. Un punto x
Ea si dice un punto stazionario di
f vincolato a Ea se x f `e un multiplo scalare di x .
Si deduce che, nelle ipotesi del Teorema 9.3, i punti di massimo e minimo vincolati a Ea vanno ricercati
tra i punti stazionari vincolati a Ea . La ricerca dei punti stazionari vincolati consiste dunque nella risoluzione
del sistema
(
x f = x
(9.3)
(x) = a ,
nelle incognite x, (metodo dei moltiplicatori di Lagrange).
10. Diagonalizzazione delle matrici simmetriche
Una interessante applicazione del metodo dei moltiplicatori di Lagrange `e il teorema di diagonalizzabilit`
a
su R delle matrici reali simmetriche, cio`e delle matrici quadrate A con tA = A.
Premettiamo alcune nozioni relative al prodotto scalare e alcune propriet`a delle matrici simmetriche.
Un insieme E Rn si dice un sistema ortonormale se, per ogni v, w E,
(
1 se v = w
vw =
0 se v 6= w .
Lemma 10.1.
(i) Un sistema ortonormale di vettori `e linearmente indipendente.
` VARIABILI
7. CALCOLO DIFFERENZIALE IN PIU
106
k
X
(v vj )vj
j=1
vk+1 =
il sistema E 0 = {v1 , . . . , vk , vk+1 } continua ad essere ortonormale. Iterando questo procedimento, si ottiene
la conclusione del punto (ii). Il punto (iii) `e una diretta conseguenza di (ii), partendo da E = .
Sia V un sottospazio vettoriale di Rn . Il sottospazio ortogonale a V , si definisce come
V = {w Rn : w v = 0 v V } ,
(che `e chiaramente uno spazio vettoriale).
Lemma 10.2. Rn `e la somma diretta di V e V .
Dimostrazione. Sia {v1 , . . . , vk } una base ortonormale di V , la si completi in una base ortonormale
{v1 , . . . , vn } di Rn . Allora {vk+1 , . . . , vn } `e un sistema ortonormale in V . Per motivi di dimensione, `e
necessariamente una base di V .
Siano ora V un sottospazio vettoriale di Rn e T : V V un applicazione lineare. Si dice che T `e
simmetrica se, per ogni v, w V ,
(T v) w = (T w) v .
Lemma 10.3. T : V V lineare, e sia {v1 , . . . , vk } una base ortonormale di V . Allora T `e simmetrica se
e solo se la matrice A = (aij ) che rappresenta T nella base data `e simmetrica (cio`e aij = aji per ogni i, j).
Dimostrazione. Se la matrice A rappresenta una qualunque applicazione lineare T in una data base,
si ha
X
T vj =
aij vi .
i
si ha
(T v) w =
X
ij
j i (T vj ) vi =
X
ij
j i (T vi ) vj = (T w) v .
107
Lemma 10.4. Sia T unapplicazione lineare simmetrica di Rn in se, e sia V un sottospazio tale che T V V .
Allora si ha anche T V V .
Dimostrazione. Sia w V . Se v V , si ha
(T w) v = w (T v) = 0 ,
perche T v V . Quindi T w V .
Nel seguito intendiamo i vettori di Rn come matrici colonna, x = t(x1 . . . xn ). Il prodotto scalare x y
si esprime dunque come prodotto matriciale tyx.
Data una matrice simmetrica n n, A = (aij ), indichiamo con T la corrispondente applicazione
simmetrica di Rn in se, riferita alla base canonica (che `e ortonormale).
Consideriamo la funzione
(10.1)
fA (x) = (T x) x = txAx =
n
X
aij xi xj =
i,j=1
n
X
ajj x2j + 2
j=1
aij xi xj ,
i<j
e in conclusione,
x fA = 2Ax .
Analogamente, essendo = fI , si ha
x = 2x .
Il sistema (9.3) identifica dunque gli autovettori di fA su S e i corrispondenti autovalori .
` VARIABILI
7. CALCOLO DIFFERENZIALE IN PIU
108
(
x)
xk xj
Se una funzione reale f di n variabili ammette la derivata parziale
f
x
xj (
+ hek )
f
x)
xj (
h
f (
x + hek + h0 ej ) f (
x + hek ) f (
x + h0 ej ) + f (
x)
,
= lim lim
h0 h0 0
hh0
(11.1)
f
x
xk (
+ h0 ej )
f
x)
xk (
h0
f (
x + hek + h0 ej ) f (
x + hek ) f (
x + h0 ej ) + f (
x)
,
= lim
lim
0
0
h 0 h0
hh
Trattandosi di uno scambio dordine di due limiti in due variabili diverse, dobbiamo aspettarci che
luguaglianza non sia sempre vera. Infatti si pu`o verificare facilmente che la funzione
(
xy 3
per (x, y) 6= (0, 0)
2 +y 2
x
f (x, y) =
0
per (x, y) = (0, 0) ,
(11.2)
`e di classe C 1 su R2 ,
`e dotata di derivate seconde su R2 ,
le due derivate miste sono continue su R2 \ {(0, 0)} ma non in (0, 0),
2f
2f
(0, 0) = 1 ,
(0, 0) = 0.
yx
xy
2f
e
xk xj
2f
(con k =
6 j) in un aperto A, e che tali derivate siano continue in x
A. Allora
(
x) =
xk xj
Teorema 11.1 (Teorema di Schwarz). Supponiamo che f ammetta le due derivate seconde
2f
xj xk
2f
(
x).
xj xk
109
Dimostrazione. Siccome tutti gli incrementi sono presi nelle sole variabili xj , xk , possiamo supporre
che f dipenda da due sole variabili x1 , x2 .
Si fissino h, h0 6= 0 tali che il rettangolo di estremi (
x + he1 + h0 e2 ), (
x + he1 + h0 e2 ), (
x + he1 + h0 e2 ),
0
(
x + he1 + h e2 ) sia contenuto in A.
6
(
x1 , x
2 + h0 )
(
x1 + h, x
2 + h0 )
(
x1 , x
2 )
(
x1 + h, x
2 )
R(h, h0 ) =
che compare sia in (11.1) sia in (11.2). Secondo il modo in cui si raggruppano a due a due gli addendi a
numeratore, essa pu`
o essere letta in due modi:
(i) ponendo
(x1 ) =
f (x1 , x
2 + h0 ) f (x1 , x
2 )
,
0
h
si ha
R(h, h0 ) =
(
x1 + h) (
x1 )
;
h
(ii) ponendo
(x2 ) =
f (
x1 + h, x2 ) f (
x1 , x2 )
,
h
si ha
(
x2 + h0 ) g(
x2 )
.
h0
Consideriamo la lettura (i). La funzione `e continua sullintervallo chiuso di estremi x
1 e x
1 + h e
derivabile al suo interno. Per il Teorema di Lagrange, esiste (0, 1) tale che
R(h, h0 ) =
f
f
(
x1 + h, x
2 + h0 )
(
x1 + h, x
2 )
x
x
1
1
R(h, h0 ) = 0 (
x1 + h) =
.
0
h
` VARIABILI
7. CALCOLO DIFFERENZIALE IN PIU
110
f
ammette derivata rispetto a x2 su A, la funzione
x1
f
u(x2 ) =
(
x1 + h, x2 ) ,
x1
`e continua sullintervallo chiuso di estremi x
2 e x
2 + h0 e derivabile al suo interno. Esiste quindi 0 (0, 1)
tale che
2f
(
x1 + h, x
2 + 0 h0 ) .
R(h, h0 ) =
x2 x1
Si noti che , 0 dipendono dalla scelta di h e h0 , ma sono comunque compresi tra 0 e 1.
Allo stesso modo, considerando la lettura (ii) e dunque scambiando il ruolo delle due variabili, si dimostra
che esistono , 0 (0, 1), dipendenti da h e h0 , tali che
Siccome
2f
(
x1 + h, x
2 + 0 h0 ) .
x1 x2
Per la continuit`
a delle due derivate miste in x
, si hanno dunque le due formule
R(h, h0 ) =
2f
(
x1 , x
2 ) + o(1)
(h, h0 ) (0, 0) ,
x2 x1
2f
R(h, h0 ) =
(
x1 , x
2 ) + o(1)
(h, h0 ) (0, 0) .
x1 x2
Passando al limite per (h, h0 ) (0, 0), si ottiene dunque la tesi.
R(h, h0 ) =
.
.
Hx f =
..
..
2
2
f
f
x) xn x
(
x)
xn x1 (
2
2f
(
x
)
x1 xn
2f
(
x
)
x2 xn
..
..
2f
(
x
)
x2
n
`e simmetrica. La matrice Hessiana compare nello sviluppo di Taylor al secondo ordine di una funzione di
classe C 2 .
Teorema 12.1. Sia f una funzione di classe C 2 in un aperto A Rn , e sia x
A. Si ha allora lo sviluppo
di Taylor del secondo ordine centrato in x
,
1
f (
x + h) = f (
x) + x f h + th(Hx f )h + 0 |h|2
(h 0)
2
n
n
X
f
1 X 2f
= f (
x) +
(
x)hj +
(
x)hi hj + 0 |h|2
(h 0) .
xj
2 i,j=1 xi xj
j=1
Dimostrazione. Sia B = Bx,r una palla con centro in x
contenuta in A. Dato h con |h| < r, si
consideri la funzione
g(t) = f (
x + th) = f (
x1 + th1 , . . . , x
n + thn ) .
Essa `e definita (almeno) sullintervallo (1 , 1 + ), con = r |h|. Applicando due volte la regola
di derivazione in catena, si ha
n
X
f
g 0 (t) =
(
x + th)hj ,
x
j
j=1
111
e
g 00 (t) =
n
X
2f
(
x + th)hi hj .
xi xj
i,j=1
Applicando la formula di Taylor in una variabile con resto di Lagrange, esiste = (h) (0, 1) tale che
g 0 (1) = g(0) + g 0 (0) + g 00 () ,
ossia
(12.1)
f (
x + h) = f (
x) +
n
n
X
1 X 2f
f
(
x)hj +
(
x + h)hi hj .
xj
2 i,j=1 xi xj
j=1
Allora la differenza
f (
x + h) f (
x)
n
n
X
f
1 X 2f
(
x)hj
(
x)hi hj
xj
2 i,j=1 xi xj
j=1
`e uguale a
n
n
X
2f
1 X 2f
(
x + h)hi hj
(
x)hi hj .
2 i,j=1 xi xj
xi xj
i,j=1
Dato > 0, sia > 0 tale che, per |h0 | < e per ogni i, j,
2f
2f
(
x + h0 )
(
x) < .
xi xj
xi xj
Se |h| < si ha allora
n
n
n
X
X
f
1 X 2f
|hi ||hj |
x + h) f (
x)
(
x)hj
(
x)hi hj
f (
xj
2 i,j=1 xi xj
2 i,j=1
j=1
n2
|h|2 ,
2
che d`
a la tesi.
Si noti incidentalmente che la formula (12.1) fornisce lo sviluppo di Taylor al primo ordine con resto di
Lagrange.
` VARIABILI
7. CALCOLO DIFFERENZIALE IN PIU
112
Lemma 13.2. Sia A una matrice simmetrica, e siano min e max i suoi autovalori minimo e massimo
rispettivamente. Allora la forma quadratica fA (x) = txAx soddisfa le disuguaglianze
min |x|2 fA (x) max |x|2 ,
(13.1)
x2 ,
x2 y 2 .
Dimostrazione.
Sia {v1 , . . . , vn } una base ortonormale di Rn in cui ogni vj `e autovettore di autovalore
Pn
j . Se x = j=1 yj vj , si ha
fA (x) =
n
X
yi yj tvi Avj =
n
X
yi yj j tvi vj =
i yi2 .
i=1
i,j=1
i,j=1
n
X
In particolare, per A = I,
|x|2 =
n
X
yi2 .
i=1
i yi2 = min
i=1
n
X
yi2
i=1
C 2 su un aperto A, e sia x
A un suo punto stazionario. Allora
Hx f `e definita positiva, allora x
`e un punto di minimo locale;
Hx f `e definita negativa, allora x
`e un punto di massimo locale;
Hx f `e indefinita, allora x
non `e ne di massimo, ne di minimo.
min 2
|h| ,
4
e dunque x
`e di minimo locale.
Il punto (ii) `e analogo. Per il punto (iii), sia vmax e vmin autovettori di autovalore max > 0 e min < 0.
Le due funzioni g+ (t) = f (
x + tvmax ) e g (t) = f (
x + tvmin ) hanno in t = 0 un punto rispettivamente di
minimo e di massimo stretti. Quindi x
non pu`o essere ne di massimo, ne di minimo.
Nel caso in cui la matrice Hessiana `e solo semidefinita, ma con un autovalore nullo, non si pu`o concludere
in modo analogo. Le tre funzioni
f1 (x, y) = x2 + y 4 ,
f2 (x, y) = x2 y 4 ,
f3 (x, y) = x2 + y 3 ,
113
2 0
hanno tutte matrice Hessiana nellorigine uguale a
, ma nel primo caso (0, 0) `e un punto di minimo
0 0
(stretto), nel secondo si ha una configurazione che somiglia al punto di sella, nel terzo una configurazione
ancora diversa.
La nozione di punto di sella non `e facilmente formulabile in modo rigoroso in termini geometrici, soprattutto per funzioni di pi` di 2 variabili. La definizione comunemente adottata `e quella espressa al punto (iii)
(funzione C 2 con matrice Hessiana indefinita).
Togliendo lipotesi che x
sia un punto stazionario, la condizione Hx f definita positiva implica4 che, per
x=x
+ h in un intorno di x
, vale la condizione di convessit`
a stretta nel punto x
:
(13.2)
f (
x + h) > f (
x) + x f h .
Esercizio. Si dimostri che se Hx f `e semidefinita positiva in ogni punto x di un aperto convesso A, allora
lepigrafico di f `e convesso (convessit`
a di f in A nel senso ordinario).
CAPITOLO 8
(1.1)
y2 + y0 = 1 ,
g(x, y, y 0 , . . . , y (n) ) = 0 .
Ovviamente, se y(x), definita su un intervallo I, `e soluzione di unequazione differenziale, la sua restrizione a un qualunque sottointervallo I 0 I `e pure una soluzione. E dunque interessante conoscere linsieme
delle soluzioni massimali, cio`e quelle non prolungabili a soluzioni definite su intervalli pi`
u ampi. Tale insieme
si chiama lintegrale generale dellequazione differenziale.
Una singola soluzione dellequazione differenziale si chiama anche un integrale particolare dellequazione.
Lequazione differenziale si dice in forma normale se nella (1.1) `e possibile isolare lultima variabile a
primo membro:
(1.2)
Esempi.
1. Data una funzione continua h(x) su un intervallo I, lequazione
y 0 = h(x)
ha come soluzioni massimali le primitive di h su I. Quindi, se H(x) `e una tale primitiva, lintegrale generale
dellequazione coincide con lintegrale indefinito di h, ossia linsieme delle funzioni
y(x) = H(x) + c
115
116
con c R.
2. Lintegrale generale di unequazione differenziale pu`o avere una struttura pi`
u complessa. Per esempio,
lequazione
2
y2 + y0 = 1
ha come soluzioni le sinusoidi y(x) = sin(x + ) con [0, 2), le due funzioni costanti y(x) = 1, ma anche
tutte le funzioni ottenute raccordando con continuit`a, su intervalli adiacenti, alternativamente sinusoidi e
tratti con valore costante 1.
3. Per unequazione del primo ordine in forma normale,
y 0 = f (x, y) ,
il grafico delle soluzioni deve essere ovviamente contenuto nel dominio della funzione f . La funzione f
assegna in ogni punto del dominio la pendenza che
pil grafico di una soluzione deve avere se passa per quel
punto. La figura mostra il caso dellequazione y 0 = 1 x2 y 2 .
117
y 0 = f (x)g(y) ,
y(x) =
sullintervallo I `e soluzione.
Si fissi quindi un intervallo J 0 J che non contenga zeri di g e massimale rispetto a questa propriet`
a.
Si supponga che y(x) sia una soluzione dellequazione con grafico contenuto in I J 0 , definita su un
intervallo I 0 I da determinarsi. Vale allora lidentit`a
y 0 (x)
= f (x) ,
x I0 .
g y(x)
Si prenda ora una primitiva G di 1/g su J 0 . Si osservi che
y 0 (x)
= (G y)0 (x) ,
g y(x)
per cui
(G y)0 (x) = f (x) ,
x I0 .
Si prenda ora una primitiva F di f su I. Esiste una costante c tale che
G y(x) = F (x) + c ,
x I0 .
Avendo g segno costante su J 0 , G `e strettamente monotona, e dunque invertibile. Quindi
(2.3)
y(x) = G1 F (x) + c .
Il dominio di questa soluzione sar`
a dunque
Ic0 = x I : F (x) + c im G .
Queste funzioni, al variare degli intervalli J 0 scelti come sopra, e insieme alle soluzioni costanti della
(2.2), consentono di comporre lintegrale generale1.
Un metodo pratico per trovare le soluzioni non costanti (ma che sottintende il ragionamento rigoroso
esposto sopra) `e il seguente.
Si scriva lequazione (2.1) nella forma
dy
= f (x)g(y) ,
dx
e la si trasformi, in modo puramente formale in
dy
= f (x) dx .
g(y)
Inserendo in ambo i membri il segno di integrazione indefinita, si arriva allespressione
Z
Z
dy
= f (x) dx .
g(y)
1Lespressione esplicita dellintegrale generale completo pu`
o essere complicata, perch
e `
e possibile che due soluzioni tra
quelle trovate sopra si raccordino in punti particolari dando luogo a possibili ramificazioni. Si veda lequazione in (3.2) pi`
u
avanti.
118
(2.4)
cR,
119
(3.2)
non pu`
o avere soluzione. Infatti una sua ipotetica soluzione avrebbe derivata y 0 (0) = 1 e sarebbe
dunque strettamente negativa in un intorno sinistro di 0. Ma se y(x) < 0 allora y 0 (x) = 0, quindi
y(x) sarebbe costante in un intorno sinistro di 0, il che `e incompatibile con il dato iniziale.
Non unicit`
a: il problema di Cauchy
(
p
y0 = 3 3 y2
y(0) = 0
ha almeno due soluzioni: y(x) = 0 e y(x) = x3 .
I due paragrafi successivi saranno dedicati alla dimostrazione di un fondamentale teorema che garantisce
esistenza e unicit`
a della soluzione di un problema di Cauchy.
Per introdurre le ipotesi del teorema, diamo una definizione.
Definizione 3.1. Sia f (x, y) una funzione definita sul prodotto cartesiano R = I J di due intervalli. Si
dice che f `e Lipschitziana nella variabile y se esiste una costante L > 0 tale che, per ogni x I e ogni
y1 , y2 J, si ha
f (x, y1 ) f (x, y2 ) < L|y1 y2 | .
Il teorema ha il seguente enunciato.
Teorema 3.2 (Teorema di esistenza e unicit`
a). Sia f (x, y) continua in un rettangolo aperto R = I J e
ivi Lipschitziana nella variabile y. Dato un punto (x0 , y0 ) R, esiste una e una sola soluzione del problema
di Cauchy (3.1) con grafico contenuto in R e definita almeno su un intorno di x0 .
4. Contrazioni di spazi metrici
La dimostrazione del Teorema 3.2 `e basata su una propriet`a generale di applicazioni contrattive su spazi
metrici completi.
Definizione 4.1. Sia (X, d) uno spazio metrico. Una funzione T : X X si dice una contrazione di X
se `e Lipschitziana con costante di Lipschitz < 1.
Teorema 4.2. Sia (X, d) uno spazio metrico completo, e sia T una contrazione di X. Esiste allora un unico
punto fisso x di T in X, cio`e tale che T (x) = x.
Dimostrazione. Preso un punto x0 X, si definisca ricorsivamente
xn+1 = T (xn ) .
Essendo d(xn , xn+1 ) = d(T (xn1 ), T (xn ) , si verifica per induzione che vale la disuguaglianza
d(xn , xn+1 ) n d(x0 , x1 ) .
Dati allora due interi m < n, si ha
d(xm , xn ) d(xm , xm+1 ) + d(xm+1 , xm+2 ) + + d(xn1 , xn )
(m + + n1 )d(x0 , x1 )
X
m
k d(x0 , x1 )
k=0
m
=
d(x0 , x1 ) .
1
120
Essendo < 1, questo implica che la successione `e di Cauchy e dunque converge a un punto x X.
Essendo T continua, si ha
T (x) = lim T (xn ) = lim xn+1 = x .
n
Dimostrazione. Supponiamo che valga la condizione (i). Per il Teorema fondamentale del calcolo
integrale,
Z x
y(x) = y0 +
y 0 (t) dt
x0
Z x
= y0 +
f t, y(t) dt .
x0
Viceversa, si supponga che valga la condizione (ii). Allora y(x0 ) = y0 . Inoltre, posto g(t) = f t, y(t) ,
la funzione
g `e continua su I 0 . Segue allora dal Teorema
fondamentale del calcolo integrale che y(x) =
Rx
y0 + x0 g(t) dt `e derivabile e che y 0 (x) = g(x) = f x, y(x) .
Possiamo ora passare alla dimostrazione del teorema.
Dimostrazione del Teorema 3.2.
Siano a0 , b0 > 0 due numeri tali che
[x0 a0 , x0 + a0 ] [y0 b0 , y0 + b0 ] I J = R .
Poniamo Jb0 = [y0 b0 , y0 + b0 ] e, per 0 < a a0 ,
Ia = [x0 a, x0 + a] .
Consideriamo lo spazio metrico
Xa = y C(Ia ) : y(Ia ) Jb0 , y(x0 ) = y0 ,
dotato della distanza indotta da C(Ia ), e definiamo una funzione T : Xa C(Ia ) ponendo, per y Xa ,
T (y) uguale alla funzione
Z x
f t, y(t) dt .
T (y) (x) = y0 +
x0
Imponiamo ora che T applichi Xa in se. La condizione T (y) (x0 ) = y0 `e ovviamente verificata. Rimane
da imporre che, per ogni x Ia , si abbia
T (y) (x) y0 b0 .
` DIMOSTRAZIONE E CONSEGUENZE
5. TEOREMA DI ESISTENZA E UNICITA:
Ma
121
Z
x
T (y) (x) y0 =
f t, y(t) dt
x
Z x0
f t, y(t) dt
x0
f (x, y) .
a
max
(x,y)Ia0 Jb0
f (x, y), la condizione richiesta `e
aM b0 .
(5.1)
Imponiamo ora lulteriore condizione che T sia una contrazione di Xa . Date due funzioni y, z Xa , si
consideri la distanza tra le loro immagini,
d T (y), T (z) = max T (y) (x) T (z) (x) .
xIa
Per x Ia , si ha
Z
Z x
x
T (y) (x) T (z) (x) =
f t, y(t) dt
f t, z(t) dt
x0
x0
Z x
=
f t, y(t) dt f t, z(t) dt
x
Z x 0
f t, y(t) dt f t, z(t) dt
x0
Z x
y(t) z(t) dt
L
x0
La d(y, z) ,
dove L `e la costante di Lipschitz di f nella seconda variabile. Si ha quindi
d T (y), T (z) La d(y, z) ,
e la condizione da imporre `e dunque
(5.2)
La < 1 .
Quindi, se a soddisfa entrambe le condizioni (5.1) e (5.2), A `e una contrazione di Xa in se. Daltra
parte, Xa `e chiuso in C(Ia ), che `e completo, e dunque `e uno spazio metrico completo. Per il Teorema 4.2, T
ammette uno e un solo punto fisso in Xa . Per il Lemma 5.1, questa `e dunque lunica soluzione del problema
di Cauchy (3.1) sullintervallo (x0 a, x0 + a).
Supponiamo ora che la funzione f (x, y) che definisce lequazione differenziale sia continua e localmente
Lipschitziana nella y su un aperto A R2 (cio`e, ogni punto di A ha un intorno rettangolare su cui f `e Lipschitziana nella y). Dato un qualunque punto (x0 , y0 ) A, si pu`o applicare il Teorema 3.2 al corrispondente
problema di Cauchy (3.1). Si ha allora il seguente risultato.
Corollario 5.2. Sia f continua e localmente Lipschitziana nella y su un aperto A R2 . I grafici delle
soluzioni massimali in A dellequazione differenziale y 0 = f (x, y) determinano una partizione di A.
Dimostrazione. Per il Teorema 3.2, ogni punto di A `e contenuto nel grafico di una soluzione, e dunque
di una soluzione massimale. Quindi i grafici di tali soluzioni ricoprono A.
Dimostriamo ora che se i grafici di due soluzioni massimali y1 (x) e y2 (x) si intersecano in un punto
(x0 , y0 ), allora coincidono. Con questo la dimostrazione sar`a conclusa.
Indichiamo con I1 , I2 i rispettivi intervalli (aperti) di definizione. Essendo entrambe le funzioni soluzioni
del problema di Cauchy (3.1), esiste un intorno (x0 , x0 + ) di x0 su cui y1 e y2 coincidono. Allora
122
(x0 , x0 + ) `e contenuto in I1 I2 , che indichiamo con (a, b). Sia J = (a0 , b0 ) il massimo sottointervallo
aperto di (a, b) su cui y1 e y2 coincidono2.
Se fosse b0 < b, avremmo un assurdo, perche si avrebbe per continuit`a y1 (b0 ) = y2 (b0 ) = y e allora
y1 , y2 sarebbero due soluzioni del problema di Cauchy con dato iniziale y(b0 ) = y. Quindi y1 e y2 dovrebbero
coincidere anche su un intorno destro di b0 , contro lipotesi di massimalit`a di J. Dunque b0 = b. Analogamente
si dimostra che a0 = a.
Dunque le due funzioni coincidono su I1 I2 . Se fosse I1 6= I2 , una almeno delle due soluzioni sarebbe
prolungabile, contro lipotesi di massimalit`a.
Esercizio. Si dimostri che, nelle ipotesi del Corollario 5.2, data una soluzione massimale y(x) dellequazione
differenziale y 0 = f (x, y) definita sullintervallo aperto (a, b) (con a, b possibilmente infiniti), per ogni compatto K A esistono un intorno Ua di a e un intorno Ub di b tali che, per ogni x Ua Ub , x, y(x) 6 K.
y 0 (x) = f (x, y , . . . , y )
2
1
n
2
0
yn (x) = fn (x, y1 , . . . , yn )
dove le n funzioni f1 , . . . , fn sono definite su uno stesso insieme A Rn+1 . In forma compatta, ponendo
Y = (y1 , . . . .yn ) ,
F = (f1 , . . . , fn ) : A Rn ,
(6.1)
yn1
(x) = yn
0
yn (x) = f (x, y1 , . . . , yn )
nel senso che
2Si dimostri che tale intervallo massimo esiste.
123
(i) se y(x) `e soluzione dellequazione (6.3), allora Y (x) = y(x), y 0 (x), . . . , y (n1) (x) `e soluzione del
sistema;
(ii) se Y (x) = y1 (x), . . . , yn (x) `e soluzione del sistema, allora y1 (x) `e soluzione dellequazione (6.3).
Tralasciamo la dimostrazione, del tutto ovvia.
Da questo segue in modo naturale che i problemi di Cauchy per lequazione (6.3) vanno posti nella forma
seguente:
(n)
0
(n1)
)
y = f (x, y, y , . . . , y
y(x0 ) = y0
(6.4)
y 0 (x0 ) = y00
y (n1) (x ) = y (n1) ,
0
0
(n1)
00
0 0 0
x = f1 (t, x, y, z, x , y , z )
y 00 = f2 (t, x, y, z, x0 , y 0 , z 0 )
00
z = f3 (t, x, y, z, x0 , y 0 , z 0 )
in cui la variabile indipendente t rappresenta il tempo, la funzione incognita x(t), y(t), z(t) la posizione
di un punto materiale (supposto di massa unitaria) allistante t, e F = (f1 , f2 , f3 ) la risultante delle forze
agenti su un punto che allistante t si trovi nella posizione (x, y, z) con velocit`a (x0 , y 0 , z 0 ). Tali forze possono
dipendere dalla posizione (campi di forze), dalla velocit`a (per es. attrito), e possono essere variabili nel
tempo. Il sistema rappresenta la legge F = ma, dove laccelerazione `e a = (x00 , y 00 , z 00 ).
Come visto sopra per una singola equazione, questo sistema `e equivalente a un sistema del primo ordine
di 6 equazioni in 6 incognite,
x0 = p x
y 0 = py
z 0 = p
z
0
p
=
f
1 (t, x, y, z, px , py , pz )
py = f2 (t, x, y, z, px , py , pz )
0
pz = f3 (t, x, y, z, px , py , pz )
dove px , py , pz sono le tre componenti del momento del punto in movimento.
Un problema di Cauchy consiste dunque nellassegnazione, a un dato istante t0 , della posizione (x0 , y0 , z0 )
e del momento (px,0 , py,0 , pz,0 ).
124
Il punto (ii) del Teorema 6.2 si applica ai grafici (in R7 ) delle funzioni
t 7 x(t), y(t), z(t), px (t), py (t), pz (t) ,
dove x(t), y(t), z(t) `e una soluzione massimale. Lo spazio 6-dimensionale con coordinate (x, y, z, px , py , pz )
`e lo spazio delle fasi.
7. Sistemi differenziali lineari a coefficienti costanti e matrice esponenziale
Un sistema differenziale lineare omogeneo a coefficienti costanti ha la forma
0
y1
a11 a1n
y1
y20 a21 a2n y2
(7.1)
Y0 = . = .
.. .. = AY ,
..
.. ..
.
. .
yn0
an1
ann
yn
dove A `e una matrice nn (che possiamo anche supporre complessa, ammettendo soluzioni a valori complessi
del sistema). Il caso n = 1, in cui il sistema si riduce allequazione y 0 = ay, ha come soluzioni le funzioni
y(x) = ceax (v. paragrafo 2).
Per n generico le soluzioni assumono una forma analoga introducendo un apposita nozione di matrice
esponenziale.
Proposizione 7.1. Sia A una matrice n n, reale o complessa. La serie esponenziale
X
1 k
(7.2)
A
k!
k=0
Si noti che, essendo lo spazio delle matrici n n isomorfo a Rn , la convergenza si pu`o intendere
equivalentemente componente per componente, oppure nella norma euclidea3
n
X
12
.
kAk =
|aij |2
i,j=1
i,j=1
n
X
|Ai |2 |B j |2
i,j=1
n
X
|Ai |2
n
X
i=1
2
j=1
2
= kAk kBk .
3Per matrici si chiama anche norma di Hilbert-Schmidt.
|B j |2
125
Dimostrazione della Proposizione 7.1. Applicando il Teorema 5.4 del Capitolo 6, studiamo la
convergenza normale della serie (7.2). Per il Lemma 7.2, trascurando il termine iniziale si ha
X
X
1
1
kAk k
kAkk ,
k!
k!
k=1
k=1
che converge.
Si pone
eA =
X
1 k
A ,
k!
k=0
X
(Ak )ij k
(exA )ij =
x .
k!
xA
k=0
Essendo questa una serie di potenze convergente per ogni x R, il suo raggio di convergenza `e infinito
e, per il Teorema 8.3 del Capitolo 6, `e analitica su R.
E dunque possibile derivare tale serie termine a termine, ottenendo che
X
d xA
(Ak+1 )ij k
(e )ij =
x .
dx
k!
k=0
Ricomponendo la matrice, si ha
d xA X Ak+1 k
e =
x .
dx
k!
k=0
e(x+x )A exA = ex A .
4Si dimostri per esercizio che la derivazione di funzioni a valori matrici rispetta la regola di Leibniz
d
(f g) = f 0 g + f g 0 .
dx
126
Per x0 = 0 questo implica che exA = (exA )1 , e da ci`o segue la prima uguaglianza. Scambiando x con
x si ha la seconda.
0
x0
B1 0
0
0 B2
0
(8.1)
A0 = .
.
..
.
..
..
..
.
0
0 Br
dove i blocchi Bj sono sottomatrici quadrate di
della forma
j
0
(8.2)
Bj =
0
.
..
0
0
1
0
..
.
j
..
.
..
.
..
0
0
..
.
.
1
j
I termini j che appaiono sulle diagonali dei blocchi non sono necessariamente distinti tra loro e sono gli
autovalori di A. La molteplicit`
a algebrica di un autovalore (cio`e come radice del polinomio caratteristico)
127
`e data dalla somma delle dimensioni mj dei blocchi in cui j = . Invece il numero di blocchi in cui j =
`e uguale alla molteplicit`
a geometrica di (cio`e la dimensione del relativo autospazio).
Il calcolo delle matrici esponenziali `e basato sulle seguenti propriet`a:
dalluguaglianza A = P 1 A0 P segue che exA = P 1 exA
con riferimento alla (8.1),
xB
e 1
0
xB2
0
e
exA = .
.
..
..
..
.
0
P;
0
0
..
.
exBr
0
0
Nj =
0
.
..
1
0
0
1
0
..
.
0
..
.
..
.
..
0
0
..
.
.
1
0
Allora
exBj = exj I exNj = ej x exNj .
Il calcolo di exNj `e molto semplice, perche le potenze Nj2 , Nj3 ecc. hanno una forma simile, con ununica
m
diagonale di 1 spostata sempre pi`
u in alto. In particolare, Nj j = 0, per cui
x2 2
xmj 1
m 1
Nj + +
N j
2
(mj 1)! j
xmj 1
x2
(m
2
1)!
j
xmj 2
x (m
j 2)!
..
..
.
.
0
.
..
..
.
.
x
0
1
exNj = I + xNj +
= 0
.
..
0
x
1
0
..
.
0
In definitiva,
(8.3)
xBj
x2 j x
2 e
j x
ej x
xej x
ej x
0
..
.
0
..
.
0
..
.
xe
..
.
..
.
xmj 1 j x
(mj 1)! e
xmj 2 j x
(mj 2)! e
..
.
xej x
ej x
128
Essa pu`
o essere ricondotta, in base al Lemma 6.1, al
0
1
0
0
0
1
..
.
..
..
(9.2)
A= .
.
0
0
0
an an1 an2
0 0
0 0
..
.. .
..
. .
.
0 1
a2 a1
P () = n a1 n1 a2 n2 an1 an ,
129
(9.5)
e 1 x
e 2 x
...
er x
xe1 x
xe2 x
xer x
...
...
...
...
xm1 1 e1 x
xm2 1 e2 x
...
mr 1 r x
x
e
Se dimostriamo che esse sono linearmente indipendenti, possiamo concludere che lintegrale generale
dellequazione (9.1) `e dato dalle loro combinazioni lineari.
Verificare questo `e abbastanza semplice in alcuni casi particolari.
Per esempio, supponiamo che tutte le radici siano semplici, cio`e r = n e mj = 1 per ogni j. Siano
c1 , . . . , cn coefficienti tali che
n
X
cj ej x = 0
x R .
j=1
cj kj ej x = 0
x R .
j=1
1
1
1
c1
0
1
c2 0
2
n
..
..
.. .. = ..
..
.
.
.
. . .
n1
n1
n1
cn
0
1
2
n
dova la matrice (detta di Vandermonde) ha determinante
Y
(j i ) 6= 0 .
i,j:1i<jn
130
Dimostrazione. Si consideri
A I = ...
0
an
..
.
0
1
..
.
..
.
0
0
..
.
0
an1
0
an2
a2
0
0
..
.
1
a1
In base alla (8.3), la matrice exA = P 1 A0 P pu`o contenere nella prima riga solo combinazioni lineari
delle funzioni (9.5)5, e dunque ogni soluzione `e combinazione lineare di queste. Per il Corollario 9.1, le
funzioni (9.5) formano una base dellintegrale generale.
5Anzi, la presenza di xmj 1 ej x tra le soluzioni (9.5) indica che, necessariamente, la forma canonica di Jordan di A
contiene un unico blocco, di dimensione mj mj , con autovalore j .