Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
1 Dicembre 2011
1 Appunti per uso esclusivo degli studenti del corso di Matematica generale dellUniversit
Bocconi. Queste note servono per integrare gli appunti presi a lezione e non sostituiscono in
alcun modo il libro di testo. Si tratta di appunti e in quanto tali saranno via via aggiornati e
corretti (invitiamo gli studenti a segnalarci ogni sErio errore). Ringraziamo Simone Cerreia-
Vioglio, Margherita Cigola, Fabio Maccheroni e Fabio Tonoli per i loro preziosi commenti.
2
Indice
I Strutture 15
1 Insiemi e numeri 17
1.1 Insiemi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
1.1.1 Sottoinsiemi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
1.1.2 Operazioni . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
1.1.3 Propriet delle operazioni . . . . . . . . . . . . . . . . . . . . . 23
1.2 Numeri: introduzione intuitiva . . . . . . . . . . . . . . . . . . . . . . . 25
1.3 Struttura degli interi . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
1.3.1 Divisori e algoritmi . . . . . . . . . . . . . . . . . . . . . . . . . 31
1.3.2 Numeri primi . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
1.4 Struttura dordine di R . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
1.4.1 Massimi e minimi . . . . . . . . . . . . . . . . . . . . . . . . . . 40
1.4.2 Estremi superiore e inferiore . . . . . . . . . . . . . . . . . . . . 42
1.4.3 Densit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
1.5 Potenze e logaritmi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
1.5.1 Potenze . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
1.5.2 Potenze con esponente reale . . . . . . . . . . . . . . . . . . . . 47
1.5.3 Logaritmi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48
1.6 Numeri, dita e circuiti . . . . . . . . . . . . . . . . . . . . . . . . . . . 50
1.7 La retta reale estesa . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53
2 Struttura cartesiana e Rn 57
2.1 Prodotti cartesiani e Rn . . . . . . . . . . . . . . . . . . . . . . . . . . 57
2.2 Operazioni in Rn . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60
2.3 Struttura dordine in Rn . . . . . . . . . . . . . . . . . . . . . . . . . . 63
2.4 Applicazioni . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66
2.4.1 Incertezza . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66
2.4.2 Scelte statiche . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66
2.4.3 Scelte intertemporali . . . . . . . . . . . . . . . . . . . . . . . . 67
2.5 Ottimi secondo Pareto . . . . . . . . . . . . . . . . . . . . . . . . . . . 67
2.5.1 Scatola di Edgeworth . . . . . . . . . . . . . . . . . . . . . . . . 71
3
4 INDICE
3 Struttura lineare 77
3.1 Sottospazi vettoriali di Rn . . . . . . . . . . . . . . . . . . . . . . . . . 77
3.2 Indipendenza e dipendenza lineari . . . . . . . . . . . . . . . . . . . . . 80
3.3 Combinazioni lineari . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82
3.4 Sottospazi generati . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84
3.5 Basi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86
3.6 Basi di sottospazi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93
3.7 Titoli nanziari . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 94
4 Struttura euclidea 97
4.1 Valore assoluto e norma . . . . . . . . . . . . . . . . . . . . . . . . . . 97
4.1.1 Prodotto interno . . . . . . . . . . . . . . . . . . . . . . . . . . 97
4.1.2 Valore assoluto . . . . . . . . . . . . . . . . . . . . . . . . . . . 97
4.1.3 Norma . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98
4.2 Ortogonalit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 102
II Funzioni 139
7 Funzioni 141
7.1 Il concetto . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 141
7.2 Applicazioni . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 151
7.2.1 Incertezza . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 151
7.2.2 Scelte statiche . . . . . . . . . . . . . . . . . . . . . . . . . . . . 151
7.2.3 Scelte intertemporali . . . . . . . . . . . . . . . . . . . . . . . . 153
7.3 Propriet generali . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 154
INDICE 5
9 Successioni 213
9.1 Il concetto . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 213
9.2 Lo spazio delle successioni . . . . . . . . . . . . . . . . . . . . . . . . . 216
9.3 Applicazione: scelte intertemporali . . . . . . . . . . . . . . . . . . . . 218
9.4 Immagini e classi di successioni . . . . . . . . . . . . . . . . . . . . . . 218
9.5 Limiti: esempi introduttivi . . . . . . . . . . . . . . . . . . . . . . . . . 221
9.6 Limiti e comportamento asintotico . . . . . . . . . . . . . . . . . . . . 221
9.6.1 Convergenza . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 222
9.6.2 Divergenza . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 224
9.6.3 Limiti per eccesso e per difetto . . . . . . . . . . . . . . . . . . 226
9.6.4 Topologia di R e denizione generale di limite . . . . . . . . . . 226
9.7 Propriet dei limiti . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 228
9.7.1 Monotonia e convergenza . . . . . . . . . . . . . . . . . . . . . . 230
9.7.2 Algoritmo di Erone . . . . . . . . . . . . . . . . . . . . . . . . . 231
9.7.3 Il Teorema di Bolzano-Weierstrass . . . . . . . . . . . . . . . . . 234
9.8 Algebra dei limiti e limiti notevoli . . . . . . . . . . . . . . . . . . . . . 236
6 INDICE
21 Approssimazione 665
21.1 Approssimazione polinomiale di Taylor . . . . . . . . . . . . . . . . . . 665
21.2 Proposizione omnibus per estremi locali . . . . . . . . . . . . . . . . . . 673
21.3 Procedura omnibus di ricerca di estremi locali . . . . . . . . . . . . . . 675
21.3.1 Caso di funzioni due volte derivabili . . . . . . . . . . . . . . . . 675
21.3.2 Caso di funzioni derivabili innite volte . . . . . . . . . . . . . . 676
21.3.3 Caso generale . . . . . . . . . . . . . . . . . . . . . . . . . . . . 677
21.3.4 Commenti . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 678
21.4 Formula di Taylor: caso vettoriale . . . . . . . . . . . . . . . . . . . . . 679
21.4.1 Forme quadratiche . . . . . . . . . . . . . . . . . . . . . . . . . 679
21.4.2 Formula di Taylor . . . . . . . . . . . . . . . . . . . . . . . . . . 683
21.4.3 Condizioni del secondo ordine . . . . . . . . . . . . . . . . . . . 684
23 Complementi 701
23.1 Studio di funzioni . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 701
23.1.1 Flessi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 701
23.1.2 Asintoti . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 703
23.1.3 Studio di funzioni . . . . . . . . . . . . . . . . . . . . . . . . . . 706
23.1.4 Versiera di Agnesi . . . . . . . . . . . . . . . . . . . . . . . . . . 712
23.2 Calcolo Discreto . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 713
23.2.1 Dierenze nite . . . . . . . . . . . . . . . . . . . . . . . . . . . 714
23.2.2 Un teorema di Cesro . . . . . . . . . . . . . . . . . . . . . . . 717
23.2.3 Convergenza in media . . . . . . . . . . . . . . . . . . . . . . . 720
23.2.4 Innita pazienza . . . . . . . . . . . . . . . . . . . . . . . . . . 722
12 INDICE
VI Ottimizzazione 791
25 Anteprima 793
Strutture
15
Capitolo 1
Insiemi e numeri
1.1 Insiemi
Un insieme (o aggregato) una collezione qualsiasi di oggetti (qualsiasi). Vi sono due
modi per descrivere un insieme: elencarne direttamente gli elementi, oppure speci-
carne una propriet che li accomuna. Il secondo modo pi usuale del primo; per
esempio,
f11; 13; 17; 19; 23; 29g (1.1)
si pu descrivere come linsieme dei numeri primi tra 10 e 30. Le sedie della vostra
cucina formano un insieme di oggetti, le sedie appunto, accumunati dalla propriet
di far parte della vostra cucina. Le sedie della vostra camera da letto formano un
altro insieme, cos come le lettere dellalfabeto latino formano un insieme, distinto
dallinsieme delle lettere dellalfabeto greco (e dalle sedie o dai numeri di poco fa).
Gli insiemi si indicano abitualmente con lettere maiuscole: A, B, C, e cos via; i
loro elementi si indicano invece con lettere minuscole: a, b, c, e cos via. Per indicare
che un elemento a appartiene allinsieme A si scrive
a2A
dove 2 il simbolo di appartenenza. Al contrario, per indicare che un elemento a non
appartiene allinsieme A si scrive a 2
= A.
Osservazione fuori busta. Il concetto di insieme, apparentemente introdotto nel
1847 da Bernhard Bolzano, per noi un concetto primitivo, cio non pu essere denito
ricorrendo a nozioni pi semplici. La situazione simile a quella della geometria
Euclidea, in cui punti e linee sono concetti primitivi di signicato intuitivo che si
suppone noto al lettore. H
1.1.1 Sottoinsiemi
Le sedie della vostra camera da letto sono un sottoinsieme delle sedie della vostra casa:
una sedia che appartiene alla vostra camera da letto appartiene anche alla vostra casa.
17
18 CAPITOLO 1. INSIEMI E NUMERI
B = f11; 13; 15; 17; 19; 21; 23; 25; 27; 29g (1.2)
4 A B
2
-2 A
-4
B
-6
-6 -4 -2 0 2 4 6
Inclusione di insiemi
Nota Bene. Sebbene i due simboli 2 e siano concettualmente ben distinti e non
debbano essere quindi confusi, esiste tra loro uninteressante relazione. Si consideri
1
Si rimanda a G. Osimo et al. (2009) per richiami sulle equazioni di secondo grado.
1.1. INSIEMI 19
1.1.2 Operazioni
Vi sono tre operazioni di base tra insiemi: unione, intersezione e dierenza. Come
vedremo, esse considerano due assegnati insiemi e, a partire da essi, formano un nuovo
insieme.
La prima operazione che consideriamo lintersezione di due insiemi A e B. Come
suggerisce il termine intersezione, con essa si selezionano tutti gli elementi che
appartengono simultaneamente a entrambi gli insiemi A e B.
2
Si badi che a e fag non sono aatto la stessa cosa; a un elemento e fag un insieme, seppur
costituito da un solo elemento. Per esempio, linsieme A dei paesi della Terra con la bandiera di un
solo colore aveva (sino al 2011) un solo elemento, la Libia, ma non la Libia: Tripoli non la
capitale di A.
20 CAPITOLO 1. INSIEMI E NUMERI
Intersezione di insiemi.
Per esempio, sia A linsieme dei mancini e B linsieme dei destrimani in Italia. Lin-
tersezione A \ B linsieme degli italiani ambidestri. Se, invece, A linsieme delle
auto a benzina e B delle auto a metano, la loro intersezione A \ B linsieme delle
auto bifuel, a benzina e a metano.
Pu accadere che due insiemi non abbiano alcun elemento in comune. Per esempio,
sia
C = f10; 12; 14; 16; 18; 20; 22; 24; 26; 28; 30g (1.3)
linsieme dei numeri pari tra 10 e 30. Esso non ha alcun elemento in comune con
linsieme B in (1.2). In questo caso si parla di insiemi disgiunti, ossia che non hanno
alcun elemento in comune. Tale nozione ci d loccasione per introdurre un insieme
molto particolare, ma fondamentale.
Come primo uso della nozione, osserviamo che due insiemi A e B sono disgiunti
quando hanno intersezione vuota, cio A \ B = ;. Per esempio, per gli insiemi B e C
in (1.2) e (1.3), si ha B \ C = ;.
La scrittura A 6= ; sta ad indicare che linsieme A non vuoto, ovvero che contiene
almeno un elemento.
3
C chi pensa che gli insiemi vuoti non esistano. Egli deve ammettere allora che linsieme di tali
insiemi vuoto.
1.1. INSIEMI 21
Proposizione 1 Si ha A \ B = A se e solo se A B.
Si noti che un elemento pu appartenere ad entrambi gli insiemi (a meno che gli
insiemi siano disgiunti). Per esempio, se come prima A linsieme dei mancini e B
quello dei destrimani in Italia, linsieme unione contiene tutti gli italiani con almeno
una mano, e vi sono individui (gli ambidestri) che appartengono ad entrambi gli insiemi
.
immediato mostrare che A A [ B e che B A [ B. Ne consegue che
A \ B A [ B.
4 AB
2
-2 A
B
-4
-6
-2 0 2 4 6 8 10
Unione di insiemi
2 A- B
1
-1 B
A
-2
-3
-3 -2 -1 0 1 2 3 4 5
Dierenza di insiemi.
5
La dierenza insiemistica A B si indica spesso con la scrittura AnB.
1.1. INSIEMI 23
Per esempio, torniamo agli insiemi A e B individuati in (1.1) e (1.2). In tal caso,
ossia B A linsieme dei numeri dispari non primi tra 10 e 30. Si noti che: (i)
quando A e B sono disgiunti, si ha A B = A e B A = B, (ii) A B equivale
a A B = ; poich togliendo da A tutti gli elementi che appartengono anche a B si
priva A di tutti i suoi elementi, ossia si rimane con linsieme vuoto.
In molti casi vi un insieme generale di riferimento del quale si considerano vari sot-
toinsiemi. Per esempio, per un demografo tale insieme pu essere lintera popolazione
italiana della quale si possono considerare vari sottoinsiemi secondo le propriet de-
mograche che interessano: per esempio, let una classica variabile demograca con
la quale suddividere la popolazione in sottoinsiemi.
Linsieme generale di riferimento chiamato insieme universale o, pi comune-
mente, spazio. Non esiste una notazione consolidata per tale insieme (che quasi
sempre sottinteso), che temporaneamente indichiamo come S. In questo caso, preso
un suo sottoinsieme A qualsiasi, la dierenza S A si indica con Ac ed detta insieme
complementare di A.
Per esempio, se S linsieme di tutti gli italiani e A linsieme di tutti gli italiani
che hanno almeno 65 anni det, linsieme complementare Ac costituito da tutti gli
italiani con meno di 65 anni det.
Dim. Poich dobbiamo vericare unuguaglianza tra insiemi, al pari di quanto fatto
nella dimostrazione della Proposizione 1, occorre considerare separatemente le due
inclusioni (Ac )c A e A (Ac )c .
Se a 2 (Ac )c , allora a 2
= Ac e quindi a 2 A. Ne segue che (Ac )c A.
Viceversa, se a 2 A allora a 2 = Ac e quindi a 2 (Ac )c ; dunque A (Ac )c .
[
1
An = fa : a 2 An per almeno un indice ng
n=1
La loro intersezione \1
An
n=1
\
1
An = fa : a 2 An per ogni indice ng :
n=1
T
1
Esempio 1 Sia An linsieme dei numeri pari n. Si ha An = f0g poich 0
n=1
S
1
lunico pari tale che 0 2 An per ogni n 1. Inoltre, An = f2n : n intero positivog,
n=1
S
1
ossia An linsieme di tutti i numeri pari. N
n=1
A \ (B [ C) = (A \ B) [ (A \ C) (1.4)
e
A [ (B \ C) = (A [ B) \ (A [ C) : (1.5)
1.2. NUMERI: INTRODUZIONE INTUITIVA 25
Esempio 2 Sia A linsieme di tutti gli italiani in un dato giorno, per esempio oggi.
I suoi sottoinsiemi A1 , A2 e A3 costituiti rispettivamente dai cittadini in et scolare
o prescolare (da 0 a 17 anni), dei cittadini in et lavorativa (da 18 a 64 anni) e dagli
anziani (dai 65 anni in poi) ne costituiscono una partizione. N
I numeri naturali
0; 1; 2; 3;
non hanno bisogno di presentazione; il loro insieme sar indicato con il simbolo N.
Linsieme N dei naturali chiuso rispetto alle operazioni fondamentali di addizione
e moltiplicazione:
; 3; 2; 1; 0; 1; 2; 3;
Z = fm n : m; n 2 Ng
Proposizione 6 N Z.
importante carenza degli interi (se vogliamo dividere 1 torta tra 3 invitati, come possi-
amo quanticare le loro porzioni se abbiamo a disposizione solo Z?), si ha un ulteriore
allargamento allinsieme dei numeri razionali, indicato col simbolo Q, e dato da
nm o
Q= : m; n 2 Z con n 6= 0 :
n
In altre parole linsieme dei razionali costituito da tutte le frazioni con numeri interi
sia a numeratore sia a denominatore (non nullo).
OfB. Ogni razionale non periodico (cio con un numero nito di decimali) ammette
due rappresentazioni decimali. Per esempio, 1 = 0; 9 poich 1 0; 9 = 0; 0 = 0, oppure,
se si preferisce, perch
1
0; 9 = 3 0; 3 = 3 = 1:
3
In modo analogo, 2; 5 = 2; 49, 51; 2 = 51; 19, e cos via. In breve il periodico di 9
non ha una sua autonomia. I razionali periodici e gli irrazionali hanno invece una sola
rappresentazione decimale (che innita).
La cosa non una mera curiosit: se 0; 9 non fosse uguale a 1, si potrebbe aermare
che 0; 9 il numero che immediatamente precede 1 (senza che ve ne siano altri in
mezzo), il che violerebbe una notevole propriet che discuteremo tra breve. H
Proposizione 7 Z Q.
Linsieme dei razionali sembra dunque attrezzato con tutto quanto possa servire.
Ma alcune semplici considerazioni sulla moltiplicazione ci porteranno a inaspettate
scoperte. Se q un razionale, come ben noto, la scrittura q n con n 1 intero signica
q q q:
| {z }
n volte
-1
-2
-3
-3 -2 -1 0 1 2 3 4 5
p
Per il Teorema di Pitagora, la lunghezza dellipotenusa 2. Per quanticare enti
geometrici del tutto elementari abbiamo quindi bisogno delle radici. Ecco la, per alcuni
tragica, sorpresa9 .
p
Teorema 8 22
= Q.
p
Dim. Si
p supponga, per assurdo, che 2 2 Q. Esistono allora m; n 2 Z tali che
m=n = 2, e quindi
m 2
= 2: (1.6)
n
Supponiamo che m=n sia gi ridotta ai minimi termini, ossia che m e n non ab-
biano fattori in comune10 . Ci signica che m e n non possano essere entrambi pari
(diversamente, 2 sarebbe un loro fattore comune).
La (1.6) implica
m2 = 2n2 (1.7)
e quindi m2 pari. Siccome il quadrato di un dispari dispari, anche m pari
(diversamente, se m fosse dispari, anche m2 lo sarebbe). Quindi, esiste un intero
k 6= 0 tale che
m = 2k (1.8)
Dalla (1.7) e (1.8) segue che
n2 = 2k 2 :
8 p p
La radice quadrata 2 q si indica pi semplicemente con q, omettendo lindice 2.
9
Per la losoa pitagorica, in cui le proporzioni (ossia, i numeri razionali) erano centrali, la scoperta
della non razionalit delle radici fu un evento traumatico. Rimandiamo il lettore curioso a K. von
Fritz, The Discovery of Incommensurability by Hippasus of Metapontum, Annals of Mathematics,
46, 242-264, 1945.
10
Per esempio, 14=10 non ridotta ai minimi termini perch numeratore e denominatore hanno in
comune il fattore 2. Invece, 7=5 ridotta ai minimi termini.
1.2. NUMERI: INTRODUZIONE INTUITIVA 29
Dunque n2 pari, e quindi n pari. In conclusione, sia m sia n sono pari, il che,
come prima osservato, contraddice
p lipotesi che m=n sia ridotta ai minimi termini. La
contraddizione mostra che 2 2= Q.
questo uno dei grandi teoremi della matematica greca e la sua dimostrazione
da parte della scuola pitagorica, tra il VI e il V secolo a. C., fu un punto di svolta
nella storia della Matematica. Lasciando da parte gli aspetti losoci, dal punto di
vista matematico esso mostra la necessit di un ulteriore allargamento dellinsieme dei
numeri necessari a quanticare gli enti geometrici (nonch le grandezze economiche,
come risulter chiaro nel seguito).
Per introdurre a livello intuitivo questultimo allargamento11 , consideriamo la clas-
sica retta reale:
-1
-2
-3
-3 -2 -1 0 1 2 3 4 5 6
-1
-2
-3
-4 -2 0 2 4 6
I numeri razionali non esauriscono per la retta reale. Per esempio, anche radici
11
Per una trattazione rigorosa si rimanda al primo capitolo di W. Rudin, Principles of mathematical
analysis, McGraw-Hill, 1976.
30 CAPITOLO 1. INSIEMI E NUMERI
p
come 2 o altri numeri non razionali, come , devono trovare una loro rappresentazione
sulla retta reale12 :
-1
-2
-3
-4 -2 0 2 4 6 8
Indichiamo con R linsieme di tutti i numeri rappresentabili sulla retta reale, i cui
elementi sono detti numeri reali.
Naturalmente Q R: vi sono molti numeri reali, detti irrazionali, che non sono
razionali. Moltissime radici, , il numero e sono esempi di numeri irrazionali. In realt
si pu mostrare che la maggior dei numeri reali irrazionale. Sebbene una trattazione
rigorosa dellargomento ci porterebbe troppo lontano, il prossimo semplice risultato
gi una chiara indicazione della numerosit degli irrazionali.
Proposizione 9 Dati due reali qualsiasi a < b, esiste un irrazionale c 2 R tale che
a < c < b.
Dim.13 Per ogni naturale n 2 N si ponga
p
2
cn = a +
n
Si ha cn > a per ogni n, ed facile vericare che ogni cn irrazionale. Inoltre
p
2
cn < b () n >
b a
p
Sia dunque n 2 N qualsiasi naturale tale che n > 2= (b a) (tale n esiste per la
propriet archimedea dei reali che vedremo tra breve nella Proposizione 17). Poich
a < cn < b, la dimostrazione completa.
In conclusione, R sar linsieme di numeri che considereremo nel resto del corso, e
si rivela adeguato per la gran parte delle applicazioni economiche14 .
12
In realt, pur essendo la cosa piuttosto intuitiva, si tratta di un postulato, detto di continuit
della retta.
13
Suggerita da Simone Cerreia-Vioglio.
14
Un importante ulteriore allargamento, del quale non ci occuperemo, linsieme C dei numeri
complessi.
1.3. STRUTTURA DEGLI INTERI 31
Sempre dalle scuole elementari sappiamo come dividere tra loro due numeri interi,
usando resti e quozienti. Per esempio, se n = 7 e m = 2, si ha n = 3 2 + 1, con
quoziente 3 e resto 1. Il prossimo semplice risultato formalizza questa procedura e
mostra che essa vale per ogni coppia di interi (cosa che alle elementari davamo per
scontata, ma ora siamo grandi e non dobbiamo dare pi nulla per scontato).
n = qm + r
con 0 r < m.
0 n qm = r < (q + 1) m qm = m:
r 1 = q3 r 2 + r 3 ,
Passo 1 n = q1 m + r1
Passo 2 m = q2 r1 + r2
Passo 3 r1 = q2 r2 + r3
.......
Passo k rk 2 = q2 r k 1 (ossia, rk = 0)
Esempio 4 Consideriamo gli interi positivi 3801 e 1708. A prima vista non ovvio
quale sia il loro massimo comune divisore. Per fortuna, abbiamo a nostra disposizione
lalgoritmo di Euclide per determinarlo. Si procede come segue:
Passo 4 168 = 3 49 + 21
Passo 5 49 = 2 21 + 7
Passo 6 21 = 3 7
La bont di un algoritmo dipende dal numero di passi, cio di iterazioni, che gli
occorronno per giungere alla soluzione. Un algoritmo tanto pi potente quante
meno iterazioni usa. Per lalgoritmo di Euclide si ha la seguente notevole propriet,
dimostrata da Gabriel Lam.
Per esempio, se torniamo ai numeri 3801 e 1708, il numero di cifre qui rilevante 4.
Il Teorema di Lam ci garantisce a priori che lalgoritmo di Euclide avrebbe rischiesto
al pi 20 iterazioni. Ne abbiamo usate solo 6, ma grazie al Teorema di Lam prima di
iniziare gi sapevano che non ci avremmo comunque impiegato molto (e che, quindi,
valeva la pena tentare, sapendo di non rischiare di rimanere impantanati in un numero
estenuante di iterazioni).
Un numero naturale non primo si dice composto. Indichiamo con P linsieme dei
numeri primi. Ovviamente, P N e N P linsieme dei numeri composti. I naturali
12 = 22 3;
1.3. STRUTTURA DEGLI INTERI 35
60 = 22 3 5:
Quanto appena visto solleva due questioni: se ogni naturale ammetta una rappre-
sentazione primale (nora abbiamo solo studiato alcuni esempi particolari) e se tale
rappresentazione sia unica. Il prossimo risultato, il Teorema fondamentale dellarit-
metica, risolve entrambi i problemi mostrando che ogni intero ammette una e una sola
rappresentazione primale. In altre parole, ogni intero si pu esprime in modo univoco
come prodotto di numeri primi.
I numeri primi sono quindi gli atomidi N: non sono scindibili (in quanto divisibili
sono per 1 e per s stessi) e attraverso di essi si pu esprimere univocamente ogni altro
numero naturale. Limportanza del risultato, che mostra la centralit dei numeri primi,
ben testimoniata dal suo nome. La sua prima dimostrazione si trova nelle celebri
Disquisitiones Arithmeticae pubblicate nel 1801 da Carl Friederich Gauss, sebbene il
risultato fosse nella sua essenza gi noto a Euclide.
1050 1 33
= 10
3 1017 3
Ma quanti sono?
Vista limportanza dei numeri primi, naturale chiedersi quanti siano. Il prossimo
celeberrimo risultato, dovuto a Euclide, mostra che essi sono inniti. Dopo il Teorema
8, la seconda notevolissima gemma della matematica classica che abbiamo la fortuna
di incontrare nel volgere di poche pagine.
17
Una delle ragioni per cui lo studio di test di fattorizzazione un attivo campo di ricerca che la
di colt di fattorizzare i numeri naturali sfruttata dalla moderna crittograa per costruire codici
impenetrabili.
38 CAPITOLO 1. INSIEMI E NUMERI
q = p1 p2 pn
In conclusione, abbiamo visto alcune nozioni di base di Teoria dei numeri, la bran-
ca della Matematica che si occupa delle propriet dei numeri interi. uno dei campi
pi aascinanti e di cili della Matematica, con risultati di grande profondit, spes-
so relativamente facili da enunciare ma di cili da dimostrare. Lesempio classico al
riguardo il famoso Ultimo Teorema di Fermat, il cui enunciato molto semplice: se
n 3 non esistono tre numeri interi positivi x, y e z tali che xn + y n = z n . Grazie al
Teorema di Pitagora sappiamo che per n = 2 tali terne di interi esistono (per esempio,
32 + 42 = 52 ); lUltimo Teorema di Fermat aerma che n = 2 in realt lunico caso in
cui questa notevole propriet vale. Enunciato da Fermat, il teorema stato dimostrato
nel 1994 da Andrew Wiles dopo pi di tre secoli di inutili tentativi.
(i) riessivit: a a;
ac bc se c > 0
ac = bc = 0 se c = 0
ac bc se c < 0
Luso degli aggettivi aperto, chiuso e illimitato diverr chiaro nel Capitolo 5. Per
semplicit di notazione, nel seguito (a; b) star ad indicare sia un intervallo aperto
limitato sia gli illimitati (a; 1), ( 1; b) e ( 1; 1) = R. Analogamente, con (a; b]
e [a; b) si indicheranno sia gli intervalli semichiusi limitati sia gli illimitati ( 1; b] e
[a; 1).
(ii) Maggioranti e minoranti possono non esistere. Per esempio, per linsieme dei
numeri pari
f0; 2; 4; 6; g (1.14)
non esiste alcun reale che sia pi grande di tutti: linsieme non ha maggioranti.
Analogamente, linsieme
f0; 2; 4; 6; g (1.15)
19
Quando non vi sia pericolo di equivoci, scriveremo semplicemente 1 in luogo di +1. Il simbolo
1 fu introdotto nella Matematica da John Wallis nel Seicento e richiama una curva detta lemniscata
e una specie di cappello o di aureola (simbolo di forza) posto sul capo di alcune gure dei tarocchi:
in ogni caso non un 8 coricato
20
Il quanticatore universale 8 si legge per ogni. Quindi, la scrittura 8x 2 A si legge per ogni
elemento x appartenente allinsieme A.
1.4. STRUTTURA DORDINE DI R 41
Usando maggioranti e minoranti, diamo una prima classicazione degli insiemi della
retta reale.
Per esempio, lintervallo chiuso [0; 1] limitato poich sia superiormente sia infe-
riormente limitato, mentre linsieme (1.14) dei pari inferiormente, ma non superior-
mente, limitato (infatti, abbiamo visto come non abbia maggioranti). Analogamente,
linsieme (1.15) superiormente, ma non inferiormente, limitato.
Si noti che questa classicazione degli insiemi non esaustiva: esistono insiemi che
non ricadono in alcuno dei punti (i)-(iii) della precedente denizione. Per esempio,
Z non ha n maggioranti n minoranti in R, e quindi non soddisfa nessuno dei punti
(i)-(iii). Tali insiemi si dicono illimitati.
x^ x 8x 2 A;
x^ x 8x 2 A:
Molte applicazioni economiche vertono sulla ricerca dei massimi o dei minimi di
opportuni insiemi di possibilit alternative. Purtroppo, si tratta di nozioni piuttosto
fragili perch spesso gli insiemi non ammettono massimi o minimi.
Dim. Siano x^1 ; x^2 2 A due massimi di A. Mostriamo che x^1 = x^2 . Poich x^1 un
massimo, si ha x^1 x per ogni x 2 A. In particolare, poich x^2 2 A, si ha x^1 x^2 .
Analogamente, x^2 x^1 perch anche x^2 un massimo, e quindi x^1 = x^2 . In modo
simile si mostra lunicit del minimo.
Il massimo di un insieme A si indica con max A, e il suo minimo con min A. Per
esempio, per A = [0; 1], si ha max A = 1 e min A = 0.
Esempio 8 Abbiamo visto che linsieme dei maggioranti di [0; 1] lintervallo [1; 1).
In questo esempio luguaglianza (1.16) prende la forma max [0; 1] = min [1; 1). N
Quando esiste, il massimo quindi il pi piccolo dei maggioranti. Ma, il pi
piccolo dei maggioranti, ossia min A , pu esistere anche quando il massimo non esiste.
Per esempio, consideriamo A = [0; 1): il massimo non esiste, ma il pi piccolo dei
maggioranti esiste ed 1, cio min A = 1.
Tutto ci candida il pi piccolo dei maggioranti a essere il surrogato del massimo di
cui siamo alla ricerca. In eetti, nellesempio appena visto, il punto 1 , in mancanza
di un massimo, il valore che pi gli vicino in spirito.
Ragionando in modo analogo, il pi grande dei minoranti, ossia max A , il can-
didato naturale a surrogare il minimo, quando questi non esista. Motivati da quanto
precede, diamo la seguente denizione.
Denizione 11 Dato un insieme non vuoto A R, si dice estremo superiore di A il
pi piccolo dei maggioranti di A, ossia min A , ed estremo inferiore il pi grande dei
minoranti di A, ossia max A .
Grazie alla Proposizione 15, sia lestremo superiore sia linferiore di A, quando
esistono, sono unici. Li indichiamo con la notazione sup A e inf A. Per esempio, se
A = (0; 1), si ha inf A = 0 e sup A = 1.
Come s gi detto, se inf A 2 A, esso ne il minimo e, se sup A 2 A, ne il
massimo.
Sebbene gli estremi superiore e inferiore possano esistere in assenza di massimi e
minimi, anchessi non sempre esistono.
Esempio 9 Consideriamo linsieme A dei numeri pari in (1.14). In questo caso A = ;
e lestremo superiore non esiste. Pi in generale, se A non superiormente limitato, si
ha A = ; e lestremo superiore non esiste. In modo analogo, gli insiemi che non sono
inferiormente limitati non hanno estremo inferiore22 . N
Abbiamo trovato un ragionevole surrogato per le nozioni sia di massimo sia di
minimo, ossia lestremo superiore e linferiore. Tuttavia, per essere utili, occorre che
essi esistano per una classe su cientemente ampia di insiemi; diversamente, se anche la
loro esistenza fosse spesso problematica, sarebbero di ben poco aiuto come surrogati23 .
Per fortuna, il prossimo importante risultato, il Teorema di completezza dei reali,
garantisce lesistenza degli estremi per unampia classe di insiemi, mostrando che gli
insiemi del tipo visto nellultimo esempio sono in eetti gli unici per i quali non esistono
gli estremi.
22
Qualora A non ammetta estremo superiore, si usa scrivere sup A = +1 e, qualora non ammetta
estremo inferiore, inf A = 1. Si pone inoltre convenzionalmente sup ; = 1 e inf ; = +1. Ci
motivato dalla circostanza che ogni numero reale da considerare simultaneamente un maggiorante
e un minorante di A: naturale allora concludere che sup ; = inf ; = inf R = 1 e inf ; = sup ; =
sup R = + 1.
23
Lutilit di un surrogato dipende sia da quanto bene esso approssimi loriginale sia da quanto
ampia sia la sua disponibilit.
44 CAPITOLO 1. INSIEMI E NUMERI
Teorema 16 (di completezza dei reali) Ogni insieme A R non vuoto e superi-
ormente limitato possiede estremo superiore; se A non vuoto e inferiormente limitato
possiede estremo inferiore.
Dim. Ci limitiamo alla prima aermazione. Dire che A superiormente limitato
signica che ammette qualche maggiorante, cio che A non vuoto. Poich a h per
ogni a 2 A e ogni h 2 A , per la propriet di separazione esiste un elemento separatore
c 2 R tale che a c h per ogni a 2 A e ogni h 2 A . Poich c a per ogni a 2 A,
si ha che c un maggiorante di A, sicch c 2 A . Ma, da c h per ogni h 2 A segue
che c = min A , ossia c = sup A. Ci prova lesistenza dellestremo superiore di A.
Quindi, eccetto gli insiemi non superiormente limitati, tutti gli altri insiemi in R
ammettono estremo superiore. Analogamente, eccetto gli insiemi non inferiormente
limitati, tutti gli altri insiemi in R hanno estremo inferiore. Ci conferma che gli
estremi superiori e inferiori sono in eetti ottimi surrogati, sulla cui esistenza possiamo
contare per unamplissima classe di insiemi di R.
Si osservi che, grazie al Teorema di completezza dei reali, tutti gli insiemi limitati
hanno estremo sia superiore sia inferiore.
1.4.3 Densit
La struttura dordine utile anche per chiarire i rapporti tra gli insiemi N, Z, Q e R.
Come prima cosa rendiamo rigorosa una intuizione naturale: per quanto grande sia un
numero reale, esiste sempre un numero naturale pi grande. Si tratta della cosiddetta
propriet archimedea dei reali.
Proposizione 17 Per ogni reale a 2 R esiste un naturale n 2 N tale che n a.
Dim. Sia a 2 R. Poich linsieme N non superiormente limitato, a non un suo
maggiorante. Esiste quindi n 2 N tale che n a.
e risulta
q < q 00 < q 0 : (1.17)
Non esiste quindi il pi piccolo razionale maggiore di q. Analogamente, facile vedere
come non esista il pi grande razionale minore di q. I razionali non ammettono quindi
n predecessori n successori.
In modo del tutto simile si mostra che, dati due reali qualsiasi a < b, esiste un
reale c tale che a < c < b. Infatti
1 1
a< a+ b<b
2 2
Anche i reali non ammettono quindi n predecessori n successori. Il ritmo di razionali
e reali , per cos dire, serrato, senza interruzioni discrete. Tale propriet di Q e R
detta densit. A dierenza di N e Z, che sono insiemi discreti, Q e R sono insiemi
densi, privi di buchi.
Proposizione 18 Dati due reali qualsiasi a < b, esiste un razionale q 2 Q tale che
a < q < b.
[a + 1] = [a] + 1
Dal Caso 1 segue che lesistenza di q 2 Q tale che a < q < a + 1 < b.
Caso 3: Sia b a < 1. Grazie alla propriet archimedea dei reali, esiste n 2 N; n 6= 0;
tale che
1
n ;
b a
sicch nb na = n (b a) 1. Allora, per quanto appena visto nei casi 1 e 2, esiste
q 2 Q tale che na < q < nb. Quindi,
q
a< <b
n
OfB. Per il (pi di cile) caso 3, presentiamo una dimostrazione alternativa che prende
in esame diversi casi, a seconda che almeno uno dei reali sia razionale, oppure che siano
entrambi irrazionali.
Per esempio, siano a 2 Q e b 2 = Q, e sia = b a con 0 < < 1: Chiaramente,
n
esiste n 0 tale che > 10 (che vale infatti per ogni n > log10 (1= )). Allora,
preso q = a + 10 n , si ha q 2 Q e inoltre a < q < b. ll fatto che q 2 Q ovvio, dato
che si tratta di somma di due razionali. Inne, a < a + 10 n = q < a + = b: Il caso
di b razionale e a irrazionale si dimostra analogamente.
Pi delicato il caso in cui a e b sono entrambi irrazionali. In tale evenienza, sia
= b a < 1, e sia n 0 tale che > 10 n : Allora, preso q = [a 10n ] 10 n + 10 n ,
si ha q 2 Q e inoltre a < q < b. Il fatto che q sia razionale ovvio, dato che si tratta
della somma di due razionali. Dimostriamo che a < q < b. Infatti, si ha
q = [a 10n ] 10 n
+ 10 n
a 10n 10 n
+ 10 n
= a + 10 n
<a+ = b;
q = [a 10n ] 10 n
+ 10 n
= 10 n
([a 10n ] + 1) > 10 n
(a 10n ) = a;
dove abbiamo usato la seconda delle disuguaglianze in (1.18). Abbiamo quindi di-
mostrato che a < q < b.
La dimostrazione ha il pregio di mostrare come si possa costruire un numero
razionale che giace tra due irrazionali: in particolare, il numero razionale che si in-
serisce tra di loro si costruisce secondo quanto lintuizione suggerirebbe di fare. Si
prendono tutte le cifre decimali comuni ai due numeri, si azzerano le restanti ( ci
che si ottiene facendo [a 10n ] 10 n ) e si aggiunge una quantit positiva, razionale e pi
piccola della dierenza tra i due numeri ( ci che si fa aggiungendo 10 n ). Il numero
risultante per costruzione razionale ed incluso tra i due irrazionali considerati. H
1.5. POTENZE E LOGARITMI 47
NB. Abbiamo denito ar soltanto per a > 0. Ci per evitare pericolosi q e imbarazzanti
3 p
equivoci. Si pensi, per esempio, a ( 5) 2 . Essa si potrebbe riscrivere 2 ( 5)3 = 2 125
p 3
oppure come 2 5 che non esistono (tra i reali). Ma si potrebbe scrivere anche
3 6
q p
( 5) = ( 5) che, a sua volta, si pu riesprimere come 4 ( 5)6 = 4 15:625 che
2 4
p 6
esiste e vale circa 11; 180339 oppure come 4 5 che non esiste. O
(iv) se x > y si ha
ax > a y se a > 1
ax < a y se a < 1
ax = ay = 1 se a = 1
1.5.3 Logaritmi
Le operazioni di addizione e di moltiplicazione sono commutative (a + b = b + a e
ab = ba) e hanno perci una sola operazione inversa, rispettivamente la sottrazione e
la divisione:
b = loga c.
24
Il nome un omaggio al grande matematico arabo Al-Khuwarizmi (o Al-Quwarizmi). Un altro
omaggio algoritmo.
1.5. POTENZE E LOGARITMI 49
Si noti che, oltre a dover essere a > 0 e c > 0, devessere anche a 6= 1 perch 1b = c
impossibile salvo quando c = 1.
Alla luce della propriet (vi) di cambiamento di base, si pu prendere come base
dei logaritmi sempre lo stesso numero, per esempio 10, perch
log10 c
loga c = :
log10 a
In realt, come per le potenze ax , anche per i logaritmi la base largamente pi
comune il numero e, che verr introdotto nel Capitolo 9. In tal caso si scrive sem-
plicemente log x in luogo di loge x. A cagione della sua importanza, log x anche
chiamato logaritmo naturale di x, il che porta alla notazione ln x talvolta usata in
alternativa a log x.
loga ax = x 8x 2 R
e
aloga x = x 8x > 0.
0; 1; 2; 3; 4; 5; 6; 7; 8; 9 (1.20)
0; 1; 2; 3; 4; 5; 6; 7
e avrebbero scandito i vari numeri interi sulla base delle potenze di 8, cio 8, 64, 512,
4096, . . . Avrebbero scritto il nostro decimale 4357 come
1 2
4 0; 125 + 1 0; 0015625 = 4 8 +1 8 = 0; 41:
In generale, data una base b e linsieme di cifre
Cb = fc0 ; c1 ; :::; cb 1 g
per rappresentare gli interi tra 0 e b 1, ogni numero naturale n si scrive in base b
come
dk dk 1 d1 d0
dove k un opportuno numero naturale e
n = dk bk + dk 1 bk 1
+ + d1 b + d0
0; 1; 2; 3; 4; 5; 6; 7; 8; 9; |;
In questo caso abbiamo usato i simboli | e per le due cifre addizionali di cui abbiamo
bisogno rispetto al caso decimale. Il numero duodecimale
Si noti come la rappresentazione duodecimale 9|02 usi meno cifre di quella decimale
188630, ossia cinque invece di sei. Daltra parte, la numerazione duedicimale necessita
di 12 simboli da usare come cifre, invece dei 10 di quella decimale. un tipico trade
o che si aronta nella scelta della base con cui rappresentare i numeri: basi maggiori
permettono di rappresentare i numeri con meno cifre, ma richiedono un pi complesso
insieme di cifre. La risoluzione del trade o, e la conseguente scelta della base, dipende
dalle caratteristiche dellapplicazione di interesse.
Per esempio, in ingegneria eletronica importante avere un insieme semplicissimo
di cifre, con due soli elementi, perch calcolatori e apparecchi elettronici dispongono
in maniera naturale di due sole cifre (circuito aperto o chiuso, polarit positiva o
52 CAPITOLO 1. INSIEMI E NUMERI
Dec. 0 1 2 3 4 5 6 7 8 9 10 11 16
Bin. 0 1 10 11 100 101 110 111 1000 1001 1010 1011 10000
11 = 1 23 + 0 22 + 1 21 + 1 20
e in decimale
11 = 1 101 + 1 100
Lestrema economicit su C2 permessa dalla base 2 ha come costo il gran numero di
bit richiesto dalla rappresentazione binaria dei numeri. Per esempio, dove 16 consta di
due cifre decimali il corrispettivo binario 10000 usa cinque bit, dove 201 usa tre cifre
il corrispettivo binario 11001001 usa otto bit, dove 2171 usa quattro il corrispettivo
binario 100001111011 usa dodici bit, e cos via. Rapidamente la rappresentazione
binaria richiede un numero di bit che solo un computer in grado di digerire.
Dal punto di vista puramente matematico, la scelta della base del tutto conven-
zionale e passare da una base a unaltra facile (bench estremamente tedioso)26 . Le
basi 2 e 10 sono oggi di gran lunga le basi pi importanti, ma nel passato si sono
utilizzate come basi anche 20 (il numero delle dita di mani e piedi; ne resta traccia
nel francese dove tuttora si dice quattro-venti per ottanta e quattro-venti-dieci
per novanta), nonch 16 (gli spazi tra le dita di mani e piedi) e 60 (comodo perch
divisibile per 2, 3, 4, 5, 6, 10, 12, 15, 20 e 30; ne resta ben pi che un ricordo nel come
suddividiamo ore e minuti o nella misurazione degli angoli).
La notazione posizionale stata usata a livello di calcolo manuale dalla notte dei
tempi (si pensi ai conti svolti con labaco), ma una conquista relativamente recente
nella scrittura, resa possibile dalla fondamentale innovazione dello zero e di eccezionale
importanza per lo sviluppo della Matematica e delle sue moltissime applicazioni, com-
merciali, scientiche e tecnologiche. Iniziatasi in India (sembra intorno al V secolo),
la notazione posizionale stata sviluppata nellAlto Medioevo nel mondo arabo, da
cui il nome di numeri arabi spesso usato per le cifre (1.20), ed giunta in Occidente
26
Anche le operazioni su numeri scritti con una rappresentazione non decimale non presentano
di colt. Per esempio 11 + 9 = 20 si svolge in modo binario come
1011+
1001 =
10100
che non era posizionale e che rendeva macchinosa lesecuzione anche delle pi banali
operazioni (si provi prima a sommare CXL e M CL, e poi 140 e 1150).
Chiudiamo con lincipit del primo capitolo del Liber Abaci, con la straordinaria
innovazione che il libro portava in Occidente:
9; 8; 7; 6; 5; 4; 3; 2; 1
Cum his itaque novem guris, et cum hoc signo, quod arabice zephirum
appellatur, scribitur quilibet numerus, ut inferius demonstratur. [...] ut in
sequenti cum guris numeris super notatis ostenditur.
a + 1 = +1; a 1= 1 8a 2 R (1.21)
27
I nove segni indiani sono ... Con questi nove segni, e col segno 0, che gli arabi chiamano zero, si
scrive un qualsiasi numero, come si mostra nel seguito. [...] i numeri di cui sopra sono qui di seguito
mostrati con i segni ... E cos si continua con i rimanenti numeri.
54 CAPITOLO 1. INSIEMI E NUMERI
+1 + 1 = +1 e 1 1= 1
a (+1) = +1 e a ( 1) = 1 8a > 0
a (+1) = 1 e a ( 1) = +1 8a < 0
con, in particolare,
(v) quoziente:
a a
= =0 8a 2 R
+1 1
(vi) potenza di un numero reale:
8 +1
> a = +1 se a > 1
>
>
>
< a+1 = 0 se 0 < a < 1
>
> a 1
=0 se a > 1
>
>
: 1
a = +1 se 0 < a < 1
Mentre la somma di inniti con lo stesso segno ben denita, per esempio la somma
di due inniti positivi a sua volta un innito positivo, la somma di inniti di segno
diverso non denita. , per esempio, il caso per la somma +1 1, il cui risultato
non denito. Si tratta di un primo esempio di operazione indeterminata in R. In
particolare, sono indeterminate le seguenti operazioni:
+1 1 e 1+1 (1.22)
1.7. LA RETTA REALE ESTESA 55
(iv) le potenze:
11 ; 00 ; (+1)0 (1.25)
0
O
-1
-2
-3 -2 -1 0 1 2 3 4 5
Tutti i numeri reali che trovavano posto sulla retta trovano posto anche sul seg-
mento, estremi esclusi (qualcuno sta un po pi stretto, ma ci stanno proprio tut-
ti!). Anzi, avanzano due punti, gli estremi del segmento, ai quali naturale associare
rispettivamente +1 e 1. Limmagine geometrica di R cos un segmento chiuso.H
56 CAPITOLO 1. INSIEMI E NUMERI
Capitolo 2
Struttura cartesiana e Rn
(2; 12) :
57
58 CAPITOLO 2. STRUTTURA CARTESIANA E RN
y
3
1 a
2
0
O a x
1
-1
-2
-3 -2 -1 0 1 2 3 4 5
y
3
II I
1
0
O x
-1
III IV
-2
-3 -2 -1 0 1 2 3 4 5
2.1. PRODOTTI CARTESIANI E RN 59
(iv) f(a1 ; a2 ) 2 R2 : a21 + a22 = 1g e f(a1 ; a2 ) 2 R2 : a21 + a22 1g, ossia rispettivamente
la circonferenza e il cerchio con centro lorigine e raggio unitario .
Un elemento
x = (x1 ; x2 ; :::; xn ) 2 Rn
chiamato vettore 1 . Il prodotto cartesiano Rn si dice spazio euclideo (n-dimensionale).
Per n = 1, Rn la retta reale R, per n = 2, R2 il piano, e cos via. Cos come
per R e R2 , anche i vettori in R3 ammettono una rappresentazione graca:
1 z
0.9
0.8
a
3
0.7
0.6
0.5
a
2
0.4 O
0.3 a
1
0.2 y
x
0.1
0
0 0.2 0.4 0.6 0.8 1
2.2 Operazioni in Rn
Consideriamo due vettori in Rn :
x + y = (x1 + y1 ; x2 + y2 ; :::; xn + yn ) :
1
Per i numeri reali usiamo la lettera x invece di a.
2.2. OPERAZIONI IN RN 61
Notazione. Se x = ( x1 ; x2 ; :::; xn ), si ha x = ( 1) x e x y = x + ( 1) y.
Porremo inoltre 0 = (0; 0; :::; 0), dove il grassetto distingue il vettore 0 di zeri dallo
scalare 0.
come desiderato.
( + ) x = (( + ) x1 ; ( + ) x2 ; :::; ( + ) xn )
= ( x1 + x1 ; x2 + x2 ; :::; xn + xn )
= ( x1 ; x2 ; :::; xn ) + ( x1 ; x2 ; :::; xn ) = x + x
come desiderato.
x y = x1 y1 + x2 y2 + + xn yn ;
Altre notazioni molto diuse per il prodotto interno sono (x; y) e hx; yi.
Per esempio, per i vettori x = (1; 1; 5; 3) e y = ( 2; 3; ; 1) di R4 , si ha
x y = 1 ( 2) + ( 1) 3 + 5 + ( 3) ( 1) = 5 2:
x y
Lo studio delle propriet di base della disuguaglianza rivela una prima impor-
tante novit: quando n 2, lordine non soddisfa la completezza. Si dice perci
che un ordine parziale (a dierenza dellordine in R che completo). Infatti,
siano per esempio x = (0; 1) e y = (1; 0) in R2 : non si ha n x y n y x. molto
facile trovare vettori non confrontabili in Rn . La gura mostra i vettori di R2 che sono
oppure del vettore x = (1; 2).
5
y
4
2
2
1
0
O 1 x
-1
-2
-2 -1 0 1 2 3 4 5
Per il resto, facile vericare che su Rn continua a godere delle propriet gi viste
per n = 1, ossia:
(i) riessivit: x x;
64 CAPITOLO 2. STRUTTURA CARTESIANA E RN
Nel primo caso si parla di disuguaglianza stretta, in simboli x > y, nel secondo caso
si parla di disuguaglianza forte, in simboli x y.
x y)x>y)x y
Abbiamo cos tre nozioni di disuguaglianza tra vettori in Rn , via via pi stringenti:
(i) una nozione debole, , che permette luguaglianza tra i due vettori;
(ii) una nozione intermedia, >, che richiede almeno una disuguaglianza stretta tra
le componenti;
(iii) una nozione forte, , che richiede la disuguaglianza stretta tra tutte le compo-
nenti dei due vettori.
Quando n = 1, sia > sia si riducono al classico > su R visto nella Sezione 1.4.
Inoltre, gli stessi simboli rovesciati, cio ; <; , si usano nel caso opposto.
Un caso particolarmente importante il confronto tra un vettore x e il vettore nullo
0. Si ha la seguente terminologia:
(ii) se x > 0, cio tutte le componenti di x sono positive e almeno una di esse
strettamente positiva, il vettore x si dice strettamente positivo;
NB. La notazione e terminologia che abbiamo introdotta non lunica possibile. Alcu-
ni autori usano per esempio =; >; > in luogo di >; >; , mentre altri autori chiamano
non negativi i vettori che noi chiamiamo positivi, e cos via. Al di l della scelta
della notazione, che ha una forte componente di gusto personale, il signicato delle
nozioni introdotte dovrebbe risultare chiaro. O
Insieme alla non completezza di , la presenza di due diverse versioni della disug-
uaglianza stretta la novit pi signicativa che si ha in Rn per n 2 rispetto al caso
speciale R, cio n = 1, della Sezione 1.4.
[a; b] = fx 2 Rn : a x bg = fx 2 Rn : ai xi bi g ;
(a; b] = fx 2 R : a x bg e [a; b) = fx 2 R : a x bg .
Si hanno inoltre
NB. (i) Gli intervalli in Rn si possono esprimere come prodotti cartesiani di intervalli
in R; per esempio,
[a; b] = ni=1 [ai ; bi ] :
(ii) Nelle nozioni appena viste di intervallo abbiamo usato le disuguaglianze o .
Sostituendole con la disuguaglianza < otteniamo altri possibili intervalli che, tuttavia,
sono ben poco rilevanti per i nostri ni. O
66 CAPITOLO 2. STRUTTURA CARTESIANA E RN
2.4 Applicazioni
2.4.1 Incertezza
Consideriamo una monetina, il cui lancio ha come possibili esiti testa T o croce C. Il
primo lancio ha come insieme degli esiti 1 = fC; T g, il secondo 2 = fC; T g, e cos
via: si ha allora i = fC; T g per ogni possibili lancio. Supponiamo di lanciare due
volte la monetina. Linsieme degli esiti possibili dato dal prodotto cartesiano
Pi in generale, se lanciamo n volte la monetina, linsieme degli esiti dato dal prodotto
cartesiano
n
i=1 i = fC; T g fC; T g = fC; T gn
= f(C; C; ; C) ; (C; T; ; C) ; ; (T; T; ; T )g
Luso dei prodotti cartesiani per modellare tutti i possibili esiti di un fenomeno aleato-
rio (in questo caso il lancio di una monetina) fondamentale nel Calcolo delle proba-
bilit.
R2+ = R+ R+ = f(x1 ; x2 ) : x1 ; x2 2 R+ g ;
ossia gracamente dai punti del primo quadrante del piano. In generale, un consuma-
tore deve scegliere tra pi di due beni: qualora egli debba scegliere tra n beni, linsieme
dei panieri dato dal prodotto cartesiano
Nella Teoria della produzione, un vettore in Rn+ rappresenta invece una possibile
congurazione di n input per il produttore. In questo caso il vettore x = (x1 ; x2 ; ::; xn )
indica che il produttore ha a disposizione x1 unit del primo input, x2 unit del secondo,
..., e xn unit dellultimo.
2.5. OTTIMI SECONDO PARETO 67
Abbiamo appena visto come, nella teoria del consumatore, un vettore x = (x1 ; x2 ; ::; xn )
sia interpretabile come un paniere in cui xi la quantit del bene i-esimo, ossia x1
la quantit del bene 1, x2 la quantit del bene 2, e cos via. Ma, in unaltra
possibile interpretazione, vi un unico bene e x = (x1 ; x2 ; ::; xn ) indica la quantit di
esso disponibile in vari periodi, ossia xi la quantit del bene disponibile nelli-esimo
periodo. Per esempio, se il bene sono mele, x1 la quantit di mele nel periodo 1, x2
la quantit di mele nel periodo 2, e cos via no a xn che la quantit di mele nel
periodo n-esimo.
In questo caso, Rn+ indica lo spazio di tutti i panieri intertemporali di un dato bene
su n periodi; spesso si usa la notazione pi evocativa RT , dove T il numero di periodi
e xt la quantit di bene nel periodo t, con4 t = 1; 2; : : : ; T .
4
La notazione t = 1; 2; : : : ; T equivalente a t 2 f1; 2; : : : ; T g, cosi come la notazione i = 1; 2; : : : ; n
equivalente a i 2 f1; 2; : : : ; ng. La scelta tra esse di pura comodit.
68 CAPITOLO 2. STRUTTURA CARTESIANA E RN
3
Max A
2
1 A
0 ( ) ( ]
-1
-2
-3
-4 -2 0 2 4 6
(ii) ottimo paretiano di A, o massimale, se non esiste alcun x 2 A tale che x > x^.
Esempio 11 Sia A = [0; 1] [0; 1] il quadrato di vertici (0; 0), (0; 1), (1; 0) e (1; 1). Il
vertice (1; 1) lunico ottimo paretiano di A, mentre sono ottimi paretiani deboli tutti
i punti che giacciono sia sul lato di vertici (1; 0) e (1; 1) sia sul lato di vertici (1; 1) e
(0; 1). Nella seguente gura sono indicati in rosso gli ottimi paretiani deboli, di cui
(1; 1) lunico ottimo paretiano.
Il punto (1; 1) nellultima gura il punto di massimo, che anche lunico punto
massimale. In modo analogo linsieme della prossima gura possiede un massimo (che
quindi anche lunico massimale),
70 CAPITOLO 2. STRUTTURA CARTESIANA E RN
2
2
0
O 1
-1
-2
-3 -2 -1 0 1 2 3 4
Il Lemma 26 non vale per i massimali deboli, che possono coesistere con un massimo.
La gura dellEsempio 11 ne prova, cos come la prossima, che ha un massimo (che
anche lunico massimale) e inniti massimali deboli, segnati in rosso
2
2
0
O 1
-1
-2
-2 -1 0 1 2 3 4 5
massimale ; massimo
2.5. OTTIMI SECONDO PARETO 71
La prossima gura mostra un insieme di R2 che possiede due massimali che non sono
massimi dellinsieme.
0
-1 O
-1
-1
-2
-2 -1 0 1 2 3 4 5
Per i due massimali x0 = (1; 2) e x00 = (2; 1) della gura non si ha x0 x e x00 x
0 00
per ogni x 2 A. Tuttavia, si ha x xex x per ogni x 2 A che sia confrontabile,
0 00
rispettivamente, con x o x . La mancanza di un massimo qui dovuta alla non
confrontabilit di tutti gli elementi dellinsieme, ossia al fatto che lordine soltanto
parziale in Rn quando n > 1.
La gura illustra unaltra dierenza fondamentale tra massimo e massimale in Rn
con n > 1: il massimo di un insieme, se esiste, unico, mentre un massimale pu non
essere unico (anzi, molto spesso, non lo ).
a1 + b1 = a2 + b2 = 1: (2.1)
Per completare la descrizione del problema, dobbiamo dire quali sono i desiderata
dei due agenti. A tal ne, supponiamo che essi abbiano funzioni di utilit ua ; ub : [0; 1]
[0; 1] ! R identiche, e che, per semplicit, supponiamo siano del tipo Cobb-Douglas
p
ua (x1 ; x2 ) = ub (x1 ; x2 ) = x1 x2 (si veda lEsempio 75). Le curve di indierenza si
possono inscatolarenel seguente modo
6
Per lottimalit paretiana essenziale che gli agenti considerino unicamente le loro alternative
(panieri di beni, protti, ecc.), senza badare a quelli dei loro pari. In altre parole, che essi non provino
invidia o simili emozioni sociali. Per rendersene conto, si pensi a una trib di invidiosi, il cui capo
decidesse di raddoppiare le razioni di cibo di met dei membri della trib, lasciando invariate quelle
degli altri membri. La nuova allocazione susciterebbe vivaci proteste da parte degli invariatibench
nulla sia cambiato per loro.
2.5. OTTIMI SECONDO PARETO 73
11
0.9
0.8
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0
0
0 0.2 0.4 0.6 0.8 1
1
Scatola di Edgeworth.
che appunto la classica scatola di Edgeworth. Grazie alla condizione (2.1), possiamo
pensare a un punto (x1 ; x2 ) 2 [0; 1] [0; 1] come allassegnazione di Alberto. Anzi,
possiamo in realt identicare ogni possibile suddivisione tra i due agenti con le as-
segnazioni (x1 ; x2 ) di Alberto; infatti, le assegnazioni di Barbara (1 x1 ; 1 x2 ) sono
univocamente determinate una volta note quelle di Alberto.
linsieme di tutti i proli di utilit dei due contendenti determinati dalla suddivisione
dei due beni.
Guardando la scatola di Edgeworth, il lettore si convincer facilmente che linsieme
degli ottimi paretiani di A identicato dalla diagonale
della scatola, ossia dal luogo dei punti di tangenza delle curve di indierenza (detta
curva dei contratti). Per dimostrarlo in modo rigoroso, ci occorre il prossimo semplice
Dim. Poich x1 ; x2 2 [0; 1], semplici manipolazioni portano alla catena di equivalenze:
p p p 2
1 x1 x2 (1 x1 ) (1 x2 ) () (1 x1 x2 ) (1 x1 ) (1 x2 )
2
x1 + x2 p x1 + x2
() x1 x2 () x1 x2 () (x1 x2 )2 0.
2 2
Dim. Cominciamo col mostrare che, per qualsiasi suddivisione di beni (x1 ; x2 ) 2
= D,
ossia tale che x1 6= x2 , esiste (d; d) 2 D tale che
Per Alberto, si ha
p p p
ua ( x1 x2 ; x1 x2 ) = x1 x2 = ua (x1 ; x2 )
p p
e quindi x1 x2 ; x1 x2 per lui indierente a (x1 ; x2 ). Grazie al Lemma 27, per
Barbara si ha
p p p p
ub (1 x1 x2 ; 1 x1 x2 ) = 1 x1 x2 > (1 x1 ) (1 x2 ) = ub (1 x1 ; 1 x2 ) ,
p
dove la disuguaglianza stretta poich x1 6= x2 . Quindi, ponendo d = x1 x2 , vale la
(2.3).
Ne segue che le suddivisioni (x1 ; x2 ) al di fuori della diagonale non sono ottimi
paretiani. Rimane da mostrare che le suddivisioni sulla diagonale lo sono. Sia (d; d) 2
D e supponiamo, per contra, che esista (x1 ; x2 ) 2 [0; 1] [0; 1] tale che
ossia,
p p p p
x1 x2 > dd = d e (1 x1 ) (1 x2 ) (1 d) (1 d) = 1 d:
Quindi p
p
1 x1 x2 < 1 d (1 x1 )(1 x2 );
il che contraddice la (2.2). Ne segue che non esiste alcun (x1 ; x2 ) 2 [0; 1] [0; 1] per
cui vale la (2.4). Ci completa la dimostrazione.
Grazie alla Proposizione 28, possiamo dire che, se gli agenti massimizzano le loro
utilit Cobb-Douglas, la contrattazione si risolver in una divisione dei beni sulla
diagonale della scatola di Edgeworth, ossia tale che ogni agente abbia unugual quantit
di entrambi i beni.
Naturalmente, la Proposizione 28 non pu dire alcunch su quale dei punti della
diagonale sia poi eettivamente determinato dalla contrattazione. Linsieme D per
un sottoinsieme molto piccolo di A: grazie alla nozione di ottimo paretiano, siamo
comunque riusciti a dire qualcosa di non banale sul problema di divisione.
76 CAPITOLO 2. STRUTTURA CARTESIANA E RN
Capitolo 3
Struttura lineare
77
78 CAPITOLO 3. STRUTTURA LINEARE
Esempio 13 Sia m ne
M = fx 2 Rn : x1 = = xm = 0g :
In altre parole, M linsieme delle soluzioni del sistema indicato. Esso un sottospazio
vettoriale; infatti, il lettore pu vericare che, dati x; y 2 M e ; 2 R, si ha x+ y 2
M.
Svolgendo i calcoli3 si scopre che i vettori
10 2
t; 6t; t; t (3.2)
3 3
10 2
M= t; 6t; t; t :t2R .
3 3
N
In conclusione, tutti e solo i vettori di R4 della forma (3.2) sono soluzioni del sistema per ogni t 2 R.
80 CAPITOLO 3. STRUTTURA LINEARE
T T
vettoriale di Rn . Dunque, v + w 2 i Vi e quindi i Vi un sottospazio vettoriale
di Rn .
en = (0; 0; :::; 0; 1)
detti vettori (o versori) fondamentali di Rn . Linsieme fe1 ; :::; en g linearmente
indipendente. Si ha infatti
1 n
1e + + ne =( 1 ; :::; n)
e quindi 1e
1
+ + ne
n
= 0 implica 1 = = n = 0. N
3.2. INDIPENDENZA E DIPENDENZA LINEARI 81
m
Esempio 17 Tutti gli insiemi di vettori fxi gi=1 di Rn che contengono lorigine 0 sono
linearmente dipendenti. Infatti, senza perdita di generalit poniamo x1 = 0. Preso un
insieme f i gm
i=1 di numeri reali con 1 6= 0 e i = 0 per i = 2; :::; m si ha
1 2 m
1x + 2x + + mx =0
m
il che dimostra la lineare dipendenza dellinsieme fxi gi=1 . N
Prima di proseguire con gli esempi dobbiamo chiarire una questione lessicale.
Sebbene lindipendenza e la dipendenza lineare siano propriet da riferire a un in-
m
sieme di vettori fxi gi=1 , spesso si attribuisce ai singoli vettori, parlando di insiemi
di vettori linearmente indipendenti (dipendenti) invece di un insieme linearmente
indipendente (dipendente) di vettori.
Esempio 18 In R3 , i vettori
x1 = (1; 1; 1) ; x2 = (3; 1; 5) ; x3 = (9; 1; 25)
sono linearmente indipendenti. Infatti
1 2 3
1x + 2x + 3x = 1 (1; 1; 1) + 2 (3; 1; 5) + 3 (9; 1; 25)
= ( 1 + 3 2 + 9 3; 1 + 2 + 3; 1 + 5 2 + 25 3)
1 2 3
e quindi 1x + 2x + 3x = 0 signica
8
< 1+3 2+9 3 =0
1+ 2+ 3 = 0
:
1 + 5 2 + 25 3 = 0
1 m
x= 1x + + mx
1 2 k 1
xk = x1 + x2 + + xk 1
k k k
x1 = 2x
2
+ + mx
m
1 i=1
i =
i i 2
Per
Pm costruzione, f i gmi=1 un insieme di coe cienti reali non tutti nulli tali che
i
i=1 i x = 0. Infatti
X
m
i
ix = x1 + 2x
2
+ 3x
3
+ + mx
m
= x1 + x1 = 0
i=1
m
Ne segue che fxi gi=1 un insieme linearmente dipendente.
Dim. Se. Sia x 2 Rn una combinazione lineare di un insieme nito fxi gi2I di vettori
i 1 n n
di S. Per semplicit, poniamo fx Pgni2I = ifx ; :::; x g. Esiste quindi un insieme f i gi=1
di coe cienti reali tali che x = i=1 i x . Per la denizione di sottospazio vettoriale,
abbiamo 1 x1 + 2 x2 2 span S poich x1 ; x2 2 span S. A sua volta, ( 1 x1 + 2 x2 ) 2
spanPS implica ( 1 x1 + 2 x2 ) + 3 x3 2 span S, e cos continuando, si ottiene che
x = ni=1 i xi 2 span S, come desiderato.
3.4. SOTTOSPAZI GENERATI 85
y
6
3
2
0
O 2 x
-2
-4
-6 -4 -2 0 2 4 6
3.5 Basi
Per il Teorema 34, il sottospazio generato da un sottoinsieme S di Rn consiste di tutte
le combinazioni lineari dei vettori in S. Supponiamo che S sia un insieme linearmente
dipendente. Per il Teorema 32, alcuni vettori in S sono a loro volta esprimibili come
combinazioni lineari di altri elementi di S. Per il Corollario 35, tali vettori sono perci
ridondanti ai ni della generazione di span S. Infatti, se un vettore x in span S
combinazione lineare di vettori di S, per il Corollario 35 si ha
X
m X
m
i i
x= ix = ix
i=1 i=1
Si ha quindi
X
m
i
( i i) x =0
i=1
ed essendo i vettori in S linearmente indipendenti, risulta i i = 0 per ogni i =
1; :::; m, ossia i = i per ogni i = 1; :::; m.
Se. Sia S = fx1 ; :::; xm g e supponiamo che ogni x 2 Rn si scriva in maniera
unica come combinazione lineare di vettori in S. Ovviamente, per il Teorema 34, si
ha Rn = span S. Resta da dimostrare che S un insieme linearmente indipendente.
Supponiamo che i coe cienti reali f i gm i=1 siano tali che
X
m
i
ix =0
i=1
Siccome si ha anche
X
m
0xi = 0
i=1
concludiamo che i = 0 per ogni i = 1; :::; m poich per ipotesi il vettore 0 si scrive in
un sol modo come combinazione lineare di vettori in S.
Esempio 26 La base canonica di Rn data dai vettori fe1 ; :::; en g. Ogni x 2 Rn si
scrive in maniera unica come combinazione lineare di questi vettori. In particolare:
X
n
1 n
x = x1 e + + xn e = xi ei (3.4)
i=1
ossia i coe cienti della combinazione lineare sono le componenti del vettore x. N
Ogni vettore di Rn ricostruibile come combinazione lineare dei vettori di una
base di Rn . In un certo senso, una base perci il codice genetico per uno spazio
vettoriale, contenente tutte le informazioni necessarie per identicarne gli elementi.
Poich ci sono pi basi di Rn , tali informazioni genetiche sono quindi sintetizzabili
in diversi insiemi di vettori. perci importante capire quali sono le relazioni tra le
diverse basi. Esse sono messe in luce dal prossimo teorema, le cui notevoli implicazioni
lo rendono il Deus ex machina del capitolo.
88 CAPITOLO 3. STRUTTURA LINEARE
In ragione della sua importanza, diamo due diverse dimostrazioni del risultato. La
prima pi semplice, ma anche pi lunga e tediosa.
X
n
1 i
x = iy (3.5)
i=1
Siccome x1 6= 0, non tutti i coe cienti sono nulli (perch x1 6= 0?). Supponiamo, per
esempio, che 1 6= 0. Si ha
1 X
n
1 1 1 i
y = x iy
1 1 i=2
Ne segue che span (x1 ; y 2 ; :::; y n ) = span (y 1 ; y 2 ; :::; y n ), e dunque span (x1 ; y 2 ; :::; y n ) =
Rn . Mostriamo ora che i vettori fx1 ; y 2 ; :::; y n g sono linearmente indipendenti, cos da
poter concludere che fx1 ; y 2 ; :::; y n g una base di Rn .
Siano f i gni=1 R coe cienti tali che
X
n
1 i
1x + iy =0 (3.6)
i=2
X
n
1 i
x = yi
i=2 1
Pn
Daltra parte, per la (3.5) si ha x1 = i=1 iy
i
, e quindi
i
1 =0 e i = 8i = 2; :::; n
1
3.5. BASI 89
X
k 1 X
n
k i
x = ix + ei
iy (3.7)
i=1 i=k
Siccome i vettori x1 ; :::; xk 1 sono linearmente indipendenti, almeno uno dei coe -
P
cienti f i gni=k diverso da zero. Altrimenti si avrebbe xk = ki=11 i xi e il vettore xk
sarebbe combinazione lineare dei vettori x1 ; :::; xk 1 , il che per il Corollario 33 non
pu accadere. Sia, per esempio, k 6= 0. Si ha
1 X
k 1 X
n
i i
yek = xk + xi + yei
k i=1 k i=k+1 k
X
k 1
k k
X
n
k
i i
= i xi + xk + i yei
i=1 k k i=k+1 k
e quindi
span x1 ; :::; xk ; yek+1 ; :::; yen = span x1 ; :::; xk 1 ; yek ; :::; yen = Rn
Rimane da mostrare che i vettori x1 ; :::; xk ; yek+1 ; :::; yen sono linearmente indipen-
denti.
90 CAPITOLO 3. STRUTTURA LINEARE
X
k X
n
i
ix + ei
iy =0 (3.8)
i=1 i=k+1
X
k 1 X
n
k i i i
x = x + yei
i=1 k i=k+1 k
Essendo x1 ; :::; xk 1 ; yek ; :::; yen una base di Rn , il vettore xk si scrive in un sol modo
come loro combinazione lineare, e quindi la (3.7) implica che
i
i = per i = 1; :::; k 1 e i = k + 1; :::; n
k
X
k 1 X
n
i
ix + ei
iy =0
i=1 i=k+1
ma i vettori x1 ; :::; xk 1 ; yek+1 ; :::; yen sono linearmente indipendenti (perch?), e quin-
di possiamo concludere che
1 = = k 1 = k+1 = = n =0
che mostra che x1 ; :::; xk ; yek ; :::; yen sono linearmente indipendenti e sono dunque una
base di Rn .
x = c 1 b1 + : : : + c n bn
Dim. Senza perdita di generalit supponiamo che c1 6= 0. Dimostriamo che fx; b2 ; :::; bn g
una base di Rn . Poich c1 6= 0, si pu scrivere
1 c2 2 cn n
b1 = x b ::: b
c1 c1 c1
Ne segue che
span x; b2 ; :::; bn = span b1 ; b2 ; :::; bn = Rn
Resta da mostrare che linsieme fx; b2 ; :::; bn g linearmente indipendente, cos da
poter concludere che una base di Rn . Siano f i gni=1 R coe cienti per i quali
X
n
i
1x + ib = 0: (3.9)
i=2
Se 1 6= 0 risulta
X
n X
n
i i
x= bi = 0b1 + bi :
i=2 1 i=2 1
Dato che x si pu scrivere in un sol modo come combinazione lineare dei vettori della
n
base fbi gi=1 , possiamo concludere che c1 = 0, il che assurdo. Ci signica che 1 = 0
e la (3.9) si semplica in
X n
1 i
0b + i b = 0:
i=2
esiste almeno un indice i tale che xi 6= 0. Per il Lemma 38, fe1 ; :::; ei 1 ; x; ei+1 ; :::; en g
una base di Rn .
Poich il Teorema vale per k = 1, sia 1 < k n il pi piccolo intero per il
quale la propriet del Teorema falsa. Per il Lemma 38, 1 < k n ed esiste un
1 k
insieme x ; :::; x linearmente indipendente tale che non esistono n k vettori di
Rn che, aggiunti a x1 ; :::; xk , formano una base di Rn . Dato che x1 ; :::; xk 1 , a
5
Si noti che un singoletto fxg linearamente indipendente quando x = 0 implica = 0, il che
equivale a richiedere x 6= 0.
92 CAPITOLO 3. STRUTTURA LINEARE
sua volta, linearmente indipendente, per la minimalit di k vi sono xk ; :::; xn tali che
x1 ; :::; xk 1 ; xk ; :::; xn formano una base di Rn . Ma allora
xk = c1 x1 + + ck 1 xk 1
+ ckk xk + + cnn xn
Dim. (i) Basta porre k = n nel Teorema 37. (ii) Sia S un insieme linearmente indipen-
dente in Rn . Consideriamo prima il caso di S nito e poniamo quindi S = x1 ; :::; xk .
Vogliamo mostrare che k n. Per contraddizione, si supponga k > n. Allora,
fx1 ; :::; xn g a sua volta un insieme linearmente indipendente e per laermazione (i)
una base di Rn . Quindi, i vettori xn+1 ; :::; xk sono combinazione lineare dei vettori
fx1 ; :::; xn g, il che, per il Corollario 33, contraddice il fatto che i vettori x1 ; :::; xk
siano linearmente indipendenti. Quindi k n, il che completa la dimostrazione.
Dim. Supponiamo che Rn abbia una base di n elementi. Per la parte (ii) del Corollario
39, ogni altra base di Rn pu avere al pi n elementi. Sia x1 ; :::; xk una generica altra
3.6. BASI DI SOTTOSPAZI 93
base di Rn . Mostriamo che non pu essere k < n, cos da poter concludere che k = n.
Supponiamo che k < n. Per il Teorema 37 esisterebbero n k vettori xk+1 ; :::; xn
tali che linsieme x1 ; :::; xk ; xk+1 ; :::; xn sarebbe una base di Rn . Ci contraddice
per lassunzione che x1 ; :::; xk sia una base di Rn poich i vettori xk+1 ; :::; xn
non sono combinazione lineare dei vettori x1 ; :::; xk , essendo fx1 ; :::; xn g un insieme
linearmente indipendente. In conclusione, non si pu avere k < n e quindi k = n.
A sua volta, il Teorema 42 porta alla seguente estensione del Teorema 40.
Sebbene, alla luce del Teorema 40, il risultato non sia una sorpresa, rimane di
grande eleganza perch mostra come, al di l della loro diversit, le basi condividono
una caratteristica fondamentale qual la cardinalit.
Ci motiva la prossima denizione, implicita nella discussione che ha seguito il
Teorema 40.
Denizione 21 La dimensione di un sottospazio vettoriale V di Rn il numero di
elementi di ogni sua base.
Per il Teorema 43 tale numero unico, e lo indichiamo con dim V . La nozione
di dimensione rende interessante questa sezione (che altrimenti sarebbe una mera
rivisitazione dei risultati della sezione precedente), come mostrano i prossimi esempi.
Esempio 28 Nel caso speciale V = Rn si ha dim Rn = n, il che rende rigorosa la
discussione che ha seguito il Teorema 40. N
Esempio 29 (i) Lasse delle ascisse un sottospazio vettoriale di dimensione uno di
R2 . (ii) Il piano M = fx = (x1 ; x2 ; x3 ) 2 R3 : x1 = 0g un sottospazio vettoriale di
dimensione due di R3 : N
Esempio 30 Se V = f0g, ossia se V il sottospazio vettoriale banale costituito dalla
sola origine 0, si pone dim V = 0. Daltra parte, V non contiene vettori linearmente
indipendenti (perch?) e ha quindi come base linsieme vuoto f;g. N
L = y 1 ; :::; y n Rm
uno di tali titoli, per k = 1; 2; :::; n, sicch yik il pagamento nale del k-esimo titolo
qualora si realizzi lo stato ! i . Il mercato aperto in data 0 per operazioni di com-
pravendita dei titoli quotati. Facciamo lipotesi che il mercato sia perfetto: tutti
i titoli si possono acquistare o vendere allo scoperto in qualunque quantit (anche
enorme o piccolissima) allo stesso prezzo (i prezzi dacquisto coincidono cos con i
prezzi di vendita: non vi sono cio n dierenze denaro-lettera, n costi di transazione
o imposte e nemmeno sconti di quantit).
Una combinazione lineare di titoli
Xn
xk y k
k=1
detta portafogli e signica acquistare (se xs > 0) o vendere (se xs < 0) xk unit dei
vari titoli. Sia w 2 Rm un prolo di pagamenti nei vari stati. Se il vettore w tale che
Xn
w= xk y k
k=1
si usa dire che il portafogli identicato dalla combinazione lineare dei titoli quotati
con pesi xk , o brevemente dal vettore
x = (x1 ; x2 ; : : : ; xn ) 2 Rn
Se gli n titoli del listino sono linearmente dipendenti, alcuni di essi sono inutili
perch risultano replicabili (cio ricostruibili) attraverso portafogli degli altri titoli.
Per esempio, dei tre titoli con i vettori
fyi gi2I L
Siamo quindi giunti a una prima fondamentale classicazione dei mercati nanziari,
basata sulle nozioni di algebra lineare studiate.
Nel Capitolo 14 proseguiremo lo studio dei mercati nanziari qui intrapreso. Da
ultimo, osserviamo che i vettori fondamentali fe1 ; e2 ; :::; em g di Rm rappresentano titoli
(in genere ttizi) che pagano 1 euro se si vericher un ben preciso stato del mondo.
Essi sono detti titoli elementari (o secondo Arrow) e rappresentano assicurazioni per-
fette contro i vari stati del mondo: il generico ei 2 Rm paga 1 se si verica ! i oppure
0 negli altri stati del mondo. Essi generano lintero spazio Rm , cio M = Rm , e quindi
formano un mercato completo che replica tutti i vettori w 2 Rm . Bench ttizi, nella
Sezione 14.10 vedremo che i titoli elementari sono importanti per discutere di sistemi
di prezzo di mercato.
Capitolo 4
Struttura euclidea
La somma dei quadrati delle coordinate di un vettore non altro che il prodotto interno
del vettore per s stesso. Questa semplice osservazione sar centrale nel capitolo perch
permetter di denire la fondamentale nozione di norma usando il prodotto interno.
Al riguardo si osservi che x x = 0 se e solo se x = 0: la somma di quadrati nulla se
e solo se sono nulli tutti gli addendi.
x se x 0
jxj =
x se x < 0
97
98 CAPITOLO 4. STRUTTURA EUCLIDEA
Per esempio, j5j = j 5j = 5. Il valore assoluto gode delle seguenti propriet elementari
che lasciamo vericare al lettore:
4.1.3 Norma
La norma generalizza la nozione di valore assoluto a Rn . In particolare, la norma
(euclidea) di un vettore x 2 Rn , indicata con kxk, data da
1
q
kxk = (x x) 2 = x21 + x22 + + x2n
1 x
2
||x||
0
O x
1
-1
-2
-3 -2 -1 0 1 2 3 4 5
Per n = 3 vale una simile interpretazione geometrica, che ovviamente si perde per
n 4.
p p
Esempio 32 (i) se x = (1; 1) 2 R2 , si ha kxk = 12 + ( 1)2 = 2;
La norma gode di alcune propriet elementari che estendono a Rn quelle viste per
il valore assoluto. Il prossimo risultato raccoglie le pi semplici.
(i) kxk 0;
(iii) k xk = j j kxk.
Siccome x2i 0 per ogni i = 1; 2; ; n, da (4.3) segue che x2i = 0 per ogni i =
1; 2; ; n poich una somma di numeri non negativi nulla solo se sono tutti nulli.
La propriet (iii) estende la propriet jxyj = jxj jyj del valore assoluto. La cele-
bre disuguaglianza di Cauchy-Schwarz una diversa, e pi sottile, estensione di tale
propriet.
Ponendo Pn
xi yi
t = Pi=1
n 2
i=1 yi
si ha
X Pn X Pn
xi yi X 2
n n 2 n
x i y i
0 x2i i=1
2 Pn 2 xi yi + Pn 2 i=1
yi
i=1 i=1 yi i=1 i=1 yi i=1
Xn P 2 P 2
( ni=1 xi yi ) ( ni=1 xi yi )
= x2i 2 Pn 2 + Pn 2
i=1 i=1 yi i=1 yi
0 !2 1
X
n Pn 2 X n X n Xn X n
( i=1 xi yi )
= x2i Pn 2 = yi2 @ x2i yi2 xi yi A
i=1
y
i=1 i i=1 i=1 i=1 i=1
Pn
Poich i=1 yi2 > 0, si ha quindi
!2
X
n X
n X
n
x2i yi2 xi yi 0
i=1 i=1 i=1
4.1. VALORE ASSOLUTO E NORMA 101
cio !2
X
n X
n X
n
xi yi x2i yi2
i=1 i=1 i=1
si ottiene la (4.4).
cio ! 21 ! 12
X
n X
n X
n X
n X
n
(xi + yi )2 x2i + yi2 + 2 x2i yi2 ;
i=1 i=1 i=1 i=1 i=1
ovvero, semplicando,
! 12 ! 12
X
n X
n X
n
xi yi x2i yi2
i=1 i=1 i=1
x
2
y
0
O
-1
-2
-3 -2 -1 0 1 2 3 4 5
en = (0; 0; :::; 0; 1)
sono i versori fondamentali di Rn introdotti nel Capitolo 3. Per vedere la ragione del
loro impegnativo aggettivo, si osservi che in R2 essi sono
e1 = (1; 0) e e2 = (0; 1)
e giacciono sullasse delle ascisse e delle ordinate, rispettivamente. In particolare, i
quattro versori f e1 ; e2 g sono i versori che appartengono agli assi cartesiani di R2 .
In R3 i versori fondamentali sono
e1 = (1; 0; 0) ; e2 = (0; 1; 0) e e3 = (0; 0; 1)
e anche in questo caso i sei versori f e1 ; e2 ; e3 g sono i versori che appartengono
agli assi cartesiani di R3 .
4.2 Ortogonalit
La Sezione A.3 dellappendice mostra come due vettori x e y del piano si possano
vedere come perpendicolari quando il loro prodotto interno nullo, cio x y = 0. Ci
suggerisce la:
4.2. ORTOGONALIT 103
x y=0
Esempio 33 (i) Due versori fondamentali sono ortogonali. Per esempio, per e1 ed e2
in R3 si ha
e1 e2 = (1; 0; 0) (0; 1; 0) = 0
p p p
(ii) I vettori 2=2; 6=2 e 3=2; 1=2 sono ortogonali:
p p ! p ! p p
2 6 3 1 6 6
; ; = + =0
2 2 2 2 4 4
Dim. Si ha
come desiderato.
Dim. Sia fxi gki=1 un insieme ortogonale di Rn . Sia f i gki=1 un insieme di scalari tali
P
che ki=1 i xi = 0. Dobbiamo mostrare che 1 = 2 = = k = 0. Si ha
!
X
k X
k X
k
0 = ( j xj 0) = j xj i xi
j=1 j=1 i=1
! ! !
X
k X
k X
k
= 1 x1 i xi + 2 x2 i xi + + k xk i xi
i=1 i=1 i=1
! !
X
k X
k
2 2 2 2
= 1 x1 + 1 x1 i xi + 2 x2 + 2 x2 1 x1 + i xi
i=2 i=3
!
X
k 1
2 2
+ + k xk + k xk i xi
i=1
X
k
2 2 2 2
= 1 x1 + ( 1 x1 i xi ) + 2 x2 + 2 x2 1 x1
i=2
X
k X
k 1
2 2
+ ( 2 x2 i xi ) + + k xk + ( k xk i xi )
i=3 i=1
X
k
2 2
= i xi
i=1
Quindi,
X
k
2 2
0= i xi
i=1
xi 1
= kxi k = 1
kxi k kxi k
e
xi xj 1
= xi xj = 0
kxi k kxj k kxi k kxj k
4.2. ORTOGONALIT 105
Dim. Poich fx1 ; x2 ; :::; xn g una base, esistono n scalari 1; 2 ; :::; n tali che
X
n
i
y= ix
i=1
y = x1 y x1 + x2 y x2 + x3 y x3
9 1 1 1 3 2 1 1 1 1 1
= p p ;p ;p +p p ;p ;p +p 0; p ;p
3 3 3 3 6 6 6 6 2 2 2
N
Dim. Dimostriamo il risultato per induzione. Gi sappiamo che il risultato vale per
k = 2. Supponiamo che esso valga per k 1, cio
2
X
k 1 X
k 1
xi = kxi k2 (4.6)
i=1 i=1
Pk 1
Mostriamo che ci ne implica la validit per k. Si osservi che, posto y = i=1 xi , si
ha y?xk . Infatti, !
X
k 1 X
k 1
y x= xi xk = xi xk = 0
i=1 i=1
come desiderato.
Capitolo 5
Struttura topologica
5.1 Distanze
La norma, studiata nella Sezione 4.1, consente di denire la distanza in Rn . Cominci-
amo con n = 1, quando la norma prende la veste di valore assoluto jxj. Consideriamo
due punti x e y sulla retta, con x > y,
-1
-2
-3
-4 -2 0 2 4 6
Distanza tra x e y:
La distanza tra i due punti x y, ossia la lunghezza del segmento che li congiunge.
Daltra parte, se si prendono due punti qualsiasi x e y sulla retta, senza saperne lordine
(cio, se x y o x y), la distanza diventa
jx yj
107
108 CAPITOLO 5. STRUTTURA TOPOLOGICA
x y se x y
jx yj =
y x se x < y
e quindi il valore assoluto della dierenza fornisce la distanza tra i due punti indipen-
dentemente dal loro ordine. In simboli, possiamo scrivere
d (x; y) = jx yj 8x; y 2 R
y
2
2
1 x
2
0
O y x
1 1
-1
-2
-3 -2 -1 0 1 2 3 4 5
La distanza tra i due vettori x e y data dalla lunghezza del segmento che li congiunge.
Grazie al Teorema di Pitagora, tale distanza
q
d(x; y) = (x1 y1 )2 + (x2 y2 )2 (5.1)
poich lipotenusa del triangolo rettangolo che ha come cateti i segmenti che con-
giungono xi e yi per i = 1; 2.
5.1. DISTANZE 109
3
y
y
2
2
x x
1
2
0
O y x
1 1
-1
-2
-3 -2 -1 0 1 2 3 4 5
Osserviamo che la distanza (5.1) altro non che la norma del vettore x y (e anche
di y x), cio:
d (x; y) = kx yk
La distanza tra due vettori in R2 quindi data dalla norma della loro dierenza.
facile vedere che, applicando di nuovo il Teorema di Pitagora, anche la distanza tra
due vettori x e y in R3 data da
q
d(x; y) = (x1 y1 )2 + (x2 y2 )2 + (x3 y3 )2
e quindi si ha ancora:
d (x; y) = kx yk
A questo punto generalizziamo la nozione di distanza a n qualsiasi.
Vale la seguente proposizione per distanze tra vettori di Rn , la cui semplice di-
mostrazione (basta applicare le denizioni) lasciata al lettore.
(i) d (x; y) 0;
(ii) d (x; y) = 0 , x = y;
110 CAPITOLO 5. STRUTTURA TOPOLOGICA
Le (i)-(iv) sono tutte propriet naturali per la nozione di distanza. La (i) aerma
che una distanza sempre una quantit positiva, la (ii) che nulla solo quando i vettori
in esame sono uguali, mentre vettori diversi hanno sempre una distanza non nulla. La
(iii) aerma che la distanza una nozione simmetrica: nel misurarla non conta da
quale dei due vettori si parte. Inne, la (iv) la cosiddetta disuguaglianza triangolare:
per esempio, la distanza tra Milano (x) e Roma (y) non pu superare la somma delle
distanze tra Milano e qualsiasi altra localit z e tra tale z e Roma.
1 1 2 2
d (x; y) = = = ;
3 3 3 3
5.2 Intorni
Denizione 25 Si dice intorno (sferico) di centro x0 2 Rn e di raggio " > 0, e si
denota con B" (x0 ), linsieme
Lintorno B" (x0 ) quindi il luogo dei punti di Rn che hanno distanza da x0
strettamente minore di ". In R tale intorno lintervallo aperto (x0 "; x0 + "), cio
Infatti si ha
Dunque in R gli intorni sono intervalli; si vede senza di colt che in R2 sono cerchi,
in R3 sfere, ecc.: i punti che distano meno di " da x0 formano infatti un cerchio, una
sfera, ecc. di centro x0 .
0 ( )
x0 - x0 x0 +
-1
-2
-3
-4 -2 0 2 4 6
2
x
0
1
0
O
-1
-2
-3 -2 -1 0 1 2 3 4 5
Vediamo alcuni esempi di intorni. Per semplicit di notazione, scriveremo B" (x1 ; ::; xn )
in luogo di B" ((x1 ; ::; xn )).
(ii) Si ha
3 3 1 5
B 3 (1) = 1 ;1 + = ; :
2 2 2 2 2
(iii) Le scritture B 1 (0) e B0 (1) sono prive di senso perch deve essere " > 0.
(iv) Si ha
q
B3 (0; 0) = B3 (0) = x 2 R2 : d(x; 0) < 3 = x 2 R2 : x21 + x22 < 3 =
(v) Si ha
OfB. Un punto possiede sempre inniti intorni: uno per ogni valore di " > 0. perci
fuorviante parlare dellintorno di un punto come se ve ne fosse uno solo. H
Denizione 26 Lintervallo [x0 ; x0 + "), con " > 0, detto intorno destro di x0 2 R
di raggio ". Lintervallo (x0 "; x0 ], con " > 0, detto intorno sinistro di x0 di raggio
".
Con essi possiamo dare unutile caratterizzazione degli estremi superiore e inferiore
di un sottoinsieme di R.
Linsieme dei punti interni di A detto interno di A e si indica con int A. ovvio
che int A A.
114 CAPITOLO 5. STRUTTURA TOPOLOGICA
Esempio 38 Sia A = (0; 1). Ogni suo punto interno, cio int A = A. Sia infatti
x 2 (0; 1) e si consideri la pi piccola tra le distanze di x dai punti estremi a e b, ossia
min fd (0; x) ; d (1; x)g. Prendiamo " > 0 tale che
Si ha
B" (x) = (x "; x + ") (0; 1)
e quindi x punto interno di A. Poich x era un punto qualsiasi di A, ne segue che
int A = A. N
Esempio 39 Sia A = [0; 1]. Si ha int A = (0; 1). Infatti, procedendo come sopra
si vede che i punti in (0; 1) sono tutti interni, ossia (0; 1) int A. Rimangono da
considerare i punti estremi 0 e 1. Consideriamo 0. Ogni suo intorno ha la forma
( "; "), con " > 0, e quindi contiene anche punti di Ac . Ne segue che 0 2
= int A. In
modo analogo si mostra che 1 2 = int A. Concludiamo che int A = (0; 1).
Troviamo i punti esterni ad A = [0; 1]. Si ha
Ac = ( 1; 0) [ (1; +1)
Un punto x0 quindi di frontiera per A allorquando in ogni suo intorno cadono sia
punti di A (perch non esterno) sia punti di Ac (perch non interno). Linsieme
dei punti di frontiera si indica con @A. Intuitivamente, la frontiera il bordodi un
insieme.
Esempio 40 (i) Sia A = (0; 1). Data la natura residuale della denizione di punto di
frontiera, per determinare @A dobbiamo prima identicare i punti interni ed esterni.
Abbiamo visto che int A = (0; 1). Per trovare i punti esterni, osserviamo che Ac =
( 1; 0] [ [1; +1), sicch
I punti esterni ad A sono dunque quelli dellinsieme ( 1; 0) [ (1; +1). Ne segue che
@A = f0; 1g
5.3. TASSONOMIA DEI PUNTI DI RN 115
mentre tutti i punti tali che x21 + x22 > 1 sono esterni. Quindi,
Quindi, un punto x0 2 A isolato se esiste almeno un suo intorno B" (x0 ) tale
che A \ B" (x0 ) = fx0 g. Come suggerisce la terminologia, i punti isolati sono punti
dellinsieme staccatidal resto dellinsieme.
Come prima cosa, vediamo le relazioni dei punti di accumulazione con la classi-
cazione test vista. Ovviamente, i punti di accumulazione non sono mai esterni.
Inoltre:
Lemma 54 Sia A un sottoinsieme di Rn .
(i) Ogni punto interno di A di accumulazione, ossia int A A0 .
(ii) Un punto di frontiera di A di accumulazione se e solo se non isolato.
Dim. (i) Se x0 2 int A, esiste un intorno B"0 (x0 ) di x0 tale che B"0 (x0 ) A. Sia
B" (x0 ) un intorno qualsiasi di x0 . Lintersezione
B"0 (x0 ) \ B" (x0 ) = Bminf"0 ;"g (x0 )
a sua volta un intorno di x0 di raggio min f"0 ; "g > 0. Quindi Bminf"0 ;"g (x0 ) A
e, per completare la dimostrazione, basta considerare qualsiasi x 2 Bminf"0 ;"g (x0 ) tale
che x 6= x0 . Infatti, x appartiene anche allintorno B" (x0 ) ed distinto da x0 .
min d (x; xi )
i=1;:::;n
esiste ed strettamente positiva, ossia mini=1;:::;n d (x; xi ) > 0. Sia > 0 tale che <
mini=1;:::;n d (x; xi ) : evidente che 0 < < " in quanto < mini=1;:::;n d (x; xi ) < ":
Quindi B (x) B" (x): altres evidente, per costruzione, che per ogni i = 1; 2; :::n;
118 CAPITOLO 5. STRUTTURA TOPOLOGICA
si ha xi 2
= B (x): Dunque, se x 2 A si ha B (x) \ A = fxg; se invece x 2
= A si ha
B (x) \ A = ;: Indipendentemente dallappartenenza di x ad A; si ha
B (x) \ A fxg :
OfB. Il concetto di punto interno richiede che esista un suo intorno tutto formato
da punti dellinsieme: ci signica che ci si pu allontanare (almeno per un po) da
esso seguendo qualsiasi percorso che parte dal punto e rimanendo dentro linsieme
(insomma, si pu fare una passeggiatina in qualunque direzione senza mostrare il
passaporto): vedendo il percorso a rovescio, possiamo dire che ci si pu avvicinare al
punto, provenendo da qualunque direzione, rimanendo dentro linsieme.
Il concetto di punto di accumulazione, che non impone che il punto appartenga
allinsieme, richiede invece che ci si possa avvicinare quanto si vuole al punto saltel-
landosu punti dellinsieme (insomma, che, come quando si traversa un torrente saltel-
lando su sassi a oranti, ci si possa avvicinare quanto si vuole alla meta su sassitutti
appartenenti allinsieme) Questa idea della possibilit di avvicinarsi a un certo pun-
to rimanendo dentro un dato insieme risulter cruciale per la denizione di limite di
funzione. H
Esempio 44 Gli intervalli aperti (a; b) sono aperti (donde il nome). Infatti, sia x 2
(a; b) un punto qualsiasi di (a; b): mostriamo che interno. Sia
Si ha B" (x) (a; b) e quindi x punto interno di (a; b). Ne segue che (a; b) aperto.
N
Dato che gli intorni in R sono del tipo (a; b), essi sono tutti aperti. Il prossimo
risultato mostra che lapertura degli intorni vale in generale in Rn .
Dim. Sia B" (x0 ) un intorno di un vettore x0 2 Rn . Per mostrare che B" (x0 ) aperto
occorre mostrare che ogni suo punto interno. Sia x 2 B" (x0 ) un punto qualsiasi di
B" (x0 ). Dobbiamo dimostrare che x interno a B" (x0 ) : Sia
dove lultima disuguaglianza segue da (5.2). Dunque, B (x) B" (x0 ), il che completa
la dimostrazione.
4
x
2
3
0
O x
1
-1
-2
-3 -2 -1 0 1 2 3 4 5
Denizione 32 Linsieme
A [ @A
formato dai punti di A e dai suoi punti di frontiera detto chiusura2 di A e si indica
con A.
2
Per simmetria lessicale con chiusura, linterno di un insieme si sarebbe dovuto chiamare
apertura.
120 CAPITOLO 5. STRUTTURA TOPOLOGICA
Esempio 48 Gli intervalli chiusi [a; b] R sono chiusi (di qui il nome). Gli intervalli
illimitati (a; 1) e ( 1; a) sono aperti. Gli intervalli illimitati [a; 1) e ( 1; a] sono
chiusi. N
Le nozioni di insiemi aperti e chiusi sono tra loro speculari, come mostra il prossimo
basilare risultato.3
Dim. Solo se. Sia A aperto. Mostriamo che Ac chiuso. Sia x un arbitrario punto
di frontiera di Ac , ossia x 2 @Ac . Per denizione, x non interno n ad A n ad Ac .
Quindi, x 2= int A. Ma, A = int A siccome A aperto. Quindi x 2 = A, cio x 2 Ac . Ne
segue che @Ac Ac poich x era un punto arbitrario di @Ac . Quindi, Ac = Ac , il che
prova che linsieme complementare Ac chiuso.
4
x
2
3
0 -1 2
O x
1
-1
-1
-2
-3 -2 -1 0 1 2 3 4 5
Aperti e chiusi sono quindi due facce della stessa medaglia: dire che un insieme
chiuso/aperto equivale a dire che il suo complementare aperto/chiuso. Naturalmente,
vi sono molti insiemi che non godono di alcuna di queste propriet. Vediamone un
esempio semplicissimo.
Torniamo alla nozione di chiusura A. Il prossimo risultato mostra come essa si possa
equivalentemente vedere come laggiunta allinsieme A dei suoi punti di accumulazione
A0 . In altri termini, aggiungere i bordi equivale ad aggiungere i punti di accumulazione.
Proposizione 58 Si ha A = A [ A0 .
Dim. Sia A chiuso. Per denizione, A = A e quindi, grazie alla Proposizione 58, si
ha A [ A0 = A, cio A0 A. Viceversa, se A0 A, si ha ovviamente A [ A0 = A.
Grazie alla Proposizione 58, si ha A = A [ A0 = A.
int A A A: (5.4)
Dim. Supponiamo che A B. Sia x 2 A0 . Per ogni " > 0, si ha (B" (x) fxg)\A 6= ;.
Poich A B, ci implica (B" (x) fxg) \ B 6= ; per ogni " > 0, cio x 2 B 0 .
Dim. della Proposizione 60 . (i) Per prima cosa dimostriamo che linsieme int A dei
punti interni di A aperto. Sia x 2 int A. Per denizione, esiste un suo intorno B" (x)
contenuto in A, cio B" (x) A. Dimostriamo che tale intorno costituito da soli punti
interni di A. Supponiamo, per contra, che esista y 2 @A \ B" (x). Si ponga d = d(x; y).
Per denizione si ha d < ". Scelto un arbitrario raggio 0 < "0 < " d; facile vedere
che lintorno sferico di y di raggio "0 contenuto in B" (x), cio B"0 (y) B" (x) A.
Ma ci contraddice il fatto che y punto di frontiera di A. La contraddizione dimostra
che esiste B" (x) contenuto in int A, il che dimostra che int A aperto.
Lasciamo al lettore la verica che int A il pi grande aperto contenuto in A.
Per il punto (i), linsieme int Ac aperto, e quindi per il Teorema 57 linsieme A
chiuso.
Dimostriamo ora che A il pi piccolo chiuso che contiene A. Se A chiuso ci
banalmente vero poich A = A. Supponiamo che A non sia chiuso. Si consideri un
insieme A 6= A tale che A A A. Esiste quindi un punto di frontiera x di A
che non contenuto in A . Tale punto non pu essere un punto isolato di A perch
altrimenti apparterrebbe ad A e quindi a A . Per il Lemma 54, si ha dunque x 2 A0 .
Per il Lemma 61, ne segue che x punto di accumulazione anche per A . Allora A
non contiene tutti i suoi punti di accumulazione, e quindi non chiuso. In conclusione,
A il pi piccolo chiuso che contiene A.
Linsieme dei punti interni int A quindi il pi grande insieme aperto che approssi-
ma da dentro linsieme A, mentre la chiusura A il pi piccolo insieme chiuso che
approssima da fuorilinsieme A. La relazione (5.4) quindi il miglior panino topo-
logico che si possa avere per linsieme A con fetta inferiore aperta e fetta superiore
chiusa4 .
Risulta ora facile dimostrare una interessante e intuitiva propriet della frontiera
di un insieme.
Il risultato rende precisa lintuizione che gli aperti sono insieme privi di bordi.
Infatti, la Proposizione 63 implica che A sia aperto se e solo se @A \ A = ;. Daltra
parte, per denizione, un insieme chiuso se e solo se @A A, ossia quando include i
bordi.
e il risultato analogo vale per intersezioni di un numero nito di intorni. La cosa non
vale invece per intersezioni di inniti intorni: per esempio,
\
1
B 1 (x0 ) = fx0 g (5.5)
n
n=1
Per esempio
[
1
B 1 (x0 ) = B1 (x0 )
n
n=1
Per esempio
[
1
Bn (x0 ) = Rn .
n=1
Intersezioni nite di intorni sono quindi intorni, mentre unioni qualsiasi di intorni
sono intorni. Il prossimo risultato mostra che queste propriet di stabilit valgano per
tutti gli aperti.
immediato vedere come tutti gli intorni B" (x) siano insiemi limitati, cos come
le loro chiusure (5.3). Invece, lintervallo (a; 1) un semplice esempio di insieme non
limitato (per questa ragione lo abbiamo chiamato intervallo illimitato).
Grazie alla limitatezza possiamo denire una classe di insiemi chiusi che si rivela
molto importante per le applicazioni.
Per esempio, tutti gli intervalli chiusi e limitati in R sono compatti5 . Pi in gen-
erale, tutte le chiusure B" (x0 ) di intorni B" (x0 ) in Rn sono compatti. Per esempio,
linsieme
B1 (0) = (x1 ; :::; xn ) 2 Rn : x21 + + x2n 1
compatto in Rn . Tale classico insieme di Rn chiamato palla unitaria chiusa. La
ragione di tale terminologia evidente considerando il caso particolare n = 2:
5
Linsieme vuoto ;, per quanto banale, considerato un insieme compatto.
5.7. CHIUSURA E CONVERGENZA 127
4
x
2
3
0
O x
1
-1
-2
-3 -2 -1 0 1 2 3 4 5
Al pari dei chiusi, i compatti sono stabili per unioni nite e intersezioni qualunque,
come lasciamo provare al lettore6 .
fxn g C; xn ! x =) x 2 C (5.6)
Dim. Solo se. Sia C chiuso. Sia fxn g C una successione tale xn ! x. Vogliamo
mostrare che x 2 C. Supponiamo, per contra, che x 2 = C. Poich xn ! x, per ogni
" > 0 esiste n" 1 tale che xn 2 B" (x) per ogni n n" . Il punto x quindi di
accumulazione per C, il che contraddice x 2 = C perch C chiuso e quindi contiene
tutti i propri punti di accumulazione.
6
A questo proposito, il lettore osservi che, essendo linsieme vuoto compatto, lintersezione di due
insiemi compatti disgiunti linsieme (compatto) vuoto.
7
Pertanto, la sezione pu essere saltata in prima lettura, e letta solo dopo aver studiato le
successioni.
128 CAPITOLO 5. STRUTTURA TOPOLOGICA
Se. Sia C un insieme per il quale valga la propriet (5.6). Per assurdo, sia C
non chiuso. Allora esiste almeno un punto x di frontiera di C che non appartiene a C.
Siccome non pu essere isolato (altrimenti apparterrebbe a C), in virt del Lemma 54
x di accumulazione per C. In ogni intorno B1=n (x) cade certamente un punto di C:
chiamiamolo xn . La successione di tali xn converge a x 2
= C, contro la propriet (5.6).
Si arrivati a una contraddizione: quindi C chiuso.
6.1 Generalit
LAnalisi combinatoria, che in s una piccola parte del tutto autonoma della Matem-
atica, si rivela piuttosto utile e ricorre in molte questioni sia teoriche sia applicative.
Cominciamo con un problema molto semplice. Abbiamo a disposizione tre paia
di pantaloni e cinque magliette. Supponendo che non vi siano coppie cromatiche che
feriscono il nostro senso estetico, in quanti modi ci possiamo vestire? La risposta
molto semplice: in 3 5 = 15 modi. Infatti, detti A; B; C i pantaloni e 1; 2; 3; 4; 5 le
magliette, gli abbinamenti possibili sono
A1 ; A2 ; A3 ; A4 ; A5
B1 ; B2 ; B3 ; B4 ; B5
C1 ; C2 ; C3 ; C4 ; C5:
La semplice regola del prodotto riposa sulla circostanza che la scelta di una cer-
ta maglietta non determina alcuna restrizione sulla scelta dei pantaloni. Non sono
necessarie altri discorsi per concludere che:
Qualora si debbano eettuare due scelte, la prima delle quali preveda n diverse
possibilit alternative e la seconda m, e se nessuna delle due comporta restrizioni
allaltra, il numero complessivo delle scelte nm.
Per esempio, se A e B sono due insiemi, rispettivamente con n e m elementi,
linsieme delle coppie ordinate (a; b) con a 2 A e b 2 B contiene nm elementi.
Ci che s detto si pu facilmente estendere al caso di pi di due scelte:
Qualora si debbano eettuare k scelte, nessuna delle quali comporti restrizioni
alle altre, il numero complessivo delle scelte il prodotto del numero di possibilit
di ciascuna scelta.
Esempio 58 Quante sono le possibile targhe italiane? Una targa del tipo AA
000 AA (due lettere, tre cifre, due lettere). Le lettere utilizzabili sono 22 (le lettere
dellalfabeto inglese escluse le I,O,Q,U per evitare equivoci) e le cifre ovviamente sono
10. Il numero di targhe (diverse) perci 22 22 10 10 10 22 22 = 234:256:000.N
129
130 CAPITOLO 6. FAR DI CONTO: ANALISI COMBINATORIA
Esempio 59 La classica schedina del Totocalcio prevede di assegnare uno dei tre segni
1; ; 2 ai risultati di 13 partite. Il numero di schedine allora 3 3 3 = 313 =
1:594:323. N
6.2 Permutazioni
Denizione 36 Si chiamano permutazioni (semplici) di n oggetti tra loro distinti i
raggruppamenti che si possono formare con tutti tali oggetti, considerando diversi due
raggruppamenti1 quando dieriscono per lordine nel quale compaiono gli oggetti.
1
Sarebbe scorretto chiamarli insiemi perch, come sappiamo, in un insieme del tutto irrilevante
lordine nel quale si succedono i suoi elementi.
2
La scelta del punto esclamativo fu determinata proprio dalla sorpresa di quanto fosse veloce la
sua crescita. Pare che 60! sia gi superiore al numero degli atomi, stimato in 1080 , di tutto luniverso
osservabile.
6.2. PERMUTAZIONI 131
Esempio 61 Il giuoco del quindici una tavoletta con quindici tessere numerate
da 1 a 15 e una vuota:
1 2 3 4
5 6 7 8
9 10 11 12
13 14 15
Il giuoco consiste nellottenere una diversa congurazione dei numeri facendo scivolare
le tessere (senza sradicarle) usando la casella vuota: in breve si tratta di passare
da una permutazione a unaltra. Si pu dimostrare che, partendo da unassegnata
permutazione, se ne pu ottenere qualsiasi altra della stessa classe (pari o dispari) ma
che impossibile ottenerne una di classe opposta. Per rendersi conto intuitivamente
del perch, si consideri il giuoco ridotto a tre tessere:
1 2
3
Si vede facilmente che da tale disposizione si possono ottenere soltanto le due seguenti,
rispettivamente con rotazioni antioraria e oraria:
1 2 2 2 3
! !
3 1 3 1
e
1 2 3 1 3 1
! ! ,
3 2 2
132 CAPITOLO 6. FAR DI CONTO: ANALISI COMBINATORIA
cio che dalliniziale permutazione 123 si pu passare soltanto a 231 o a 312 (che sono
della stessa classe), ma non a 132, a 213 o a 321 (di classe opposta).
Il giuoco del quindici fu inventato negli Stati Uniti nel 1874 e divenne popolarissimo
allinizio del 900 quando Sam Loyd promise 1000 $ a chiunque fosse riuscito a invertire
le caselle 14 e 15, il che invogli milioni di persone a cimentarsi nellimpossibile impresa
(ignorando che fosse impossibile). H
Consideriamo ora il caso che tra gli n oggetti con i quali formare i vari raggruppa-
menti ce ne siano alcuni indistinguibili (uguali).
Per esempio, gli oggetti siano sei: a; a; b; b; b; c (i primi due e i secondi tre sono
indistinguibili). Se distinguessimo tutti gli oggetti utilizzando un diverso indice per
gli oggetti indistinguibili, a1 ; a2 ; b1 ; b2 ; b3 ; c, le loro permutazioni sarebbero 6!. Se ora
sopprimiamo lindice distintivo alle tre lettere b, esse possono essere permutate in
3! modi diversi nelle terne di posti da esse occupati. Tali 3! diverse permutazioni
(quando si scrive b1 ; b2 ; b3 ) non sono pi distinguibili (scrivendo b; b; b). Perci le diverse
permutazioni di a1 ; a2 ; b; b; b; c sono 6!=3!. Un analogo ragionamento mostra come,
togliendo lindice distintivo alle due lettere a, le permutazioni distinguibili si riducono
a 6!= (3!2!).
Con lo stesso argomento si prova il
Teorema 68 Il numero delle permutazioni, dette con ripetizione, di n oggetti dei
quali k1 uguali tra loro, k2 uguali tra
Ploro ma distinti dai precedenti, ..., kh uguali tra
h
loro ma diversi dai precedenti (con i=1 ki = n e ki 1 per ogni i = 1; 2; ; h)
n!
: (6.1)
k1 !k2 ! kh !
Si osservi che tale valore sempre intero.
Esempio 62 I possibili anagrammi della parola MAMMA sono
5! 120
= = 10;
3!2! 6 2
mentre quelli della parola MATEMATICA sono
10!
= 151:200:
2!3!2!
N
I valori in (6.1) sono detti coe cienti multinomiali. Un caso interessante rappre-
sentato da h = 2 nel quale vi sono soltanto due tipi di oggetti.
Corollario 69 Il numero delle permutazioni di n oggetti dei quali k uguali tra loro e
i rimanenti n k uguali tra loro, ma diversi dai precedenti,
n!
:
k! (n k)!
6.2. PERMUTAZIONI 133
6.3 Disposizioni
Denizione 37 Si dice disposizione (semplice) di classe k di n oggetti ogni raggrup-
pamento di k oggetti scelti tra gli n, considerando diversi due raggruppamenti4 quando
contengano oggetti diversi oppure gli stessi oggetti in ordine diverso.
Esempio 64 Le possibili estrazioni (cinquine) da una specica ruota nel giuoco del
lotto sono D90;5 = 90 89 88 87 86 = 5:273:912:160. Le possibili estrazioni da due
2
ruote sono D90;5 = 2; 7805 1019 e da dieci ruote D90;5
10
= 1; 6618 1097 . N
aa ; ab ; ac ; ad ; ba ; bb ; bc ; bd ; ca ; cb ; cc ; cd ; da ; db ; dc ; dd:
r
Il numero delle disposizioni con ripetizione si indica con Dn;k .
r
Teorema 71 Risulta Dn;k = nk .
Si osservi che il caso delle disposizioni con ripetizione non altro che un caso parti-
colare di quello considerato in apertura nel quale si possono fare k scelte indipendenti
ognuna delle quali con n diverse modalit.
4
Ancora sarebbe scorretto chiamarli inisemi.
6.4. COMBINAZIONI 135
6.4 Combinazioni
Denizione 39 Si dice combinazione (semplice) di classe k di n (k n) oggetti
ogni raggruppamento di k degli n oggetti, considerando diversi due raggruppamenti che
dieriscano almeno per un oggetto5 (quindi ora non si tien conto dellordine).
Teorema 72 Risulta
n
Cn;k = :
k
Pu apparire sospetto che il numero Cn;k coincida con il numero delle permutazioni
con ripetizione di n oggetti dei quali k uguali tra loro (diciamoli a) e gli altri n k
uguali tra loro ma diversi dei precedenti (diciamoli b). Ci si convince subito che
proprio cos: per contare le permutazioni basta contare in quanti modi si possono
n
disporre i k oggetti a negli n posti, che sono evidentemente : a questo punto la
k
posizione degli oggetti b obbligata (devono occupare i posti rimasti liberi).
52
= 2:598:960
5
diverse mani. Quante sono le possibili doppie coppie? Una doppia coppia una sequen-
za (non ordinata) del tipo AABBC. Per contarle opportuno scindere il problema in
piccoli passi:
(i) i due valori delle carte delle coppie (per esempio, 3 e fante, 5 e 9, ecc.) possono
essere scelti in 13
2
modi diversi;
4
(ii) i semi della prima coppia possono essere scelti in 2
modi;
4
(iii) i semi della seconda coppia possono ancora essere scelti in 2
modi;
5
Adesso si tratta di insiemi. Le combinazioni di n oggetti di classe k sono perci tutti i possibili
sottoinsiemi di k elementi delloriginario insieme di n elementi.
136 CAPITOLO 6. FAR DI CONTO: ANALISI COMBINATORIA
(iv) lultima carta pu essere scelta in 44 modi diversi (dalle 52 carte dobbiamo
detrarre le 4 della doppia coppia e le altre 4 che condurrebbero a un full e non
a una doppia coppia).
13 4 4 13 12 4 3 4 3
44 = 44 = 123:552:
2 2 2 2 3 2
Il lettore pu vericare che, delle 2:598:960 mani possibili, 1:098:240 contengono una
coppia, (123:552 una doppia coppia), 54:912 un tris, 10:200 una scala, 5:108 un colore,
3:744 un full, 624 un poker, 36 una scala a colore e 4 una scala reale. N
aa ; ab ; ac ; ad ; bb ; bc ; bd ; cc ; cd ; dd:
r
Indichiamo con Cn;k il numero delle combinazioni con ripetizione.
Teorema 73 Risulta
r n (n + 1) (n + k 1) n+k 1
Cn;k = = = Cn+k 1;k :
k! k
r n+k 1 n+k 1
Cn;k = = = Cn+k 1;k :
k n 1
6.5. BINOMIO DI NEWTON 137
(a + b)1 = a + b;
(a + b)2 = a2 + 2ab + b2 ;
(a + b)3 = a3 + 3a2 b + 3ab2 + b3 :
Pi in generale vale il
n n 1 n n 2 2 n
(a + b)n = an + a b+ a b + + abn 1
+ bn = (6.2)
1 2 n 1
Xn
n n k k
= a b :
k=0
k
Dim. Il prodotto
(a + b) (a + b) (a + b)
| {z }
n volte
La formula (6.2) detta del binomio di Newton e motiva il nome di coe cienti
n
binomiali per i valori di . In particolare
k
n
Xn
n k
(1 + x) = x :
k=0
k
n n n n
+ + + + = 2n ;
0 1 2 n
e
n n n n n n 2n
+ + + = + + + = = 2n 1 :
0 2 4 1 3 5 2
Funzioni
139
Capitolo 7
Funzioni
7.1 Il concetto
Consideriamo un fruttivendolo che allortomercato si trovi di fronte alla seguente tabel-
la che indica il prezzo unitario di un chilogrammo di noci in corrispondenza di varie
quantit (misurate in chilogrammi) di noci acquistabili dal proprio grossista:
Quantit Prezzo al kg
10 kg 4 euro
20 kg 3; 9 euro
30 kg 3; 8 euro
40 kg 3; 7 euro
In generale,
141
142 CAPITOLO 7. FUNZIONI
1.6
A B
1.4
a
1.2 f
1 b=f(a)
0.8
0.6
0.4
0.4 0.45 0.5 0.55 0.6 0.65 0.7 0.75 0.8
La regola pu essere del tutto arbitraria; ci che interessa solo che essa associ ad
ogni elemento a di A un solo 1 elemento b di B. Altro non interessa sulla natura della
regola.
Si noti che perfettamente legittimo che a due diversi elementi di A sia associato
il medesimo elemento di B, ossia
1.6
A B
1.4
a
1
1.2
1 a b
2
0.8
0.6
0.4
0.4 0.45 0.5 0.55 0.6 0.65 0.7 0.75 0.8
Legittimo
Non pu accadere invece che a uno stesso elemento di A siano associati pi elementi
di B, ossia
1
Abbiamo scritto in corsivo le parole pi importanti: la regola deve funzionare per ogni elemento
di A e, a ciascuno, associare un solo elemento di B.
7.1. IL CONCETTO 143
1.6
A B
1.4
a
1.2
b
1
1 b
2
0.8
0.6
0.4
0.4 0.45 0.5 0.55 0.6 0.65 0.7 0.75 0.8
Illegittimo
Esempio 67 Sia A linsieme dei paesi della terra e B un insieme contenente alcuni
colori (almeno quattro). La funzione f : A ! B associ a ciascun paese il colore da
attribuirgli su una carta geograca: Im f linsieme dei colori eettivamente utilizzati
almeno una volta. N
144 CAPITOLO 7. FUNZIONI
Esempio 68 La legge che associa a ogni essere umano vivente la propria data di
nascita una funzione f : A ! B, dove A linsieme degli esseri umani e, per
esempio, B linsieme delle date degli ultimi 150 anni (un codominio su cientemente
grande per contenere tutte le possibili date di nascita). N
Esempio 69 Consideriamo la regola che a ogni numero reale positivo x associa p p sia
la radice positiva sia la negativa (la cosiddetta radice algebrica), ossia f x; xg.
Per esempio, a 4 associa f 2; 2g. Tale regola non descrive una funzione f : R+ ! R
poich a ogni elemento del dominio diverso da 0 sono associati due diversi elementi
del codominio. N
Funzione x3
Funzione x2
Si osservi come in questo caso a due diversi elementi del dominio possa corrispondere
il medesimo elemento: per esempio, f (1) = f ( 1) = 1. N
p
Esempio 72 (i) Sia f : R+ ! R la funzione denita come f (x) = x, che associa a
ogni reale non negativo la sua radice (aritmetica). Il dominio la semiretta positiva e
inoltre Im f = R+ .
p
Funzione x
Inoltre, Im f = R.
Funzione log x
Esempio 73 (i) Sia f : R ! R denita come f (x) = jxj per ogni x 2 R. Graca-
mente
Funzione jxj
(ii) Sia f : R f0g ! R denita come f (x) = 1= jxj per ogni x 2 R. Gracamente
7.1. IL CONCETTO 147
1
Funzione jxj
f (x1 ; x2 ) = x1 + x2
X
n
f (x1 ; x2 ; ; xn ) = xi
i=1
che associa a ogni x = (x1 ; x2 ) 2 R2+ la radice del prodotto delle componenti; ogni
x 2 R2+ ha ununica tale radice, e quindi la regola denisce una funzione con Im f =
R+ .
3
Per essere coerenti con la notazione adottata per i vettori dovremmo scrivere f ((x1 ; x2 )); per
semplicit scriviamo, qui e nel seguito, f (x1 ; x2 ).
148 CAPITOLO 7. FUNZIONI
Per esempio, se (x1 ; x2 ) = (2; 5), allora f (x1 ; x2 ) = (2; 2 5) = (2; 10) 2 R2 .
b=f(a)
4
O anche funzioni vettoriali di vettore.
5
Nella Sezione 17.1 vedremo alcuni esempi economici di tali funzioni.
7.1. IL CONCETTO 149
Si osservi che i nomi delle variabili sono del tutto irrilevanti: si pu indierente-
mente scrivere a = f (b), oppure y = f (x), oppure s = f (t), oppure = f ( ), ecc., o
anche = f ( ): i nomi delle variabili sono semplici segnaposto e ci che conta solo
la sequenza di operazioni (quasi sempre numeriche) che conducono da a a b = f (a).
Scrivere b = a2 + 2a + 1 esattamente lo stesso che scrivere y = x2 + 2x + 1 oppure
s = t2 + 2t + 1 oppure = 2 + 2 + 1 oppure = 2 + 2 + 1: la funzione (il suo
nome f ) identicata dalle operazioni quadrato + doppio + 1 che permettono di
passare dalla variabile indipendente alla dipendente.
5
y
4
1
1
0
-1 O 1 x
-1
-2
-3 -2 -1 0 1 2 3 4
Il graco il luogo dei punti del piano del tipo (x; f (x)), al variare di x nel dominio
della funzione. Per esempio, i punti ( 1; 1), (0; 0) e (1; 1) appartengono al graco della
parabola.
Gr f = f(x; f (x)) : x 2 Ag A B:
5
y
4
0
O x
-1
-2
-3 -2 -1 0 1 2 3 4
Curva in R2
Supercie in R3
7.2. APPLICAZIONI 151
7.2 Applicazioni
7.2.1 Incertezza
Consideriamo una scommessa basata sui lanci di una monetina. In particolare, sup-
poniamo che la monetina sia lanciata due volte e che la scommessa paghi 1 euro se
si ha testa in entrambi i lanci, mentre non paga alcunch in caso contrario. Come
possiamo rappresentare in modo rigoroso tale scommessa? Indichiamo testa con T e
croce con C, cosicch il prodotto cartesiano
la funzione di produzione Cobb-Douglas in cui loutput pari alla radice n-esima del
prodotto degli input.
degli elementi del dominio che hanno y come immagine. Pi in generale, dato un
sottoinsieme D qualsiasi del codominio B, la sua controimmagine f 1 (D) linsieme
1
f (D) = fx 2 A : f (x) 2 Dg
Per esempio, f 1
([ 8; 27]) = [ 2; 3]. N
7.3. PROPRIET GENERALI 155
Si osservi come nellultimo caso, quando a < 0; si abbia f 1 (a; b) = f 1 ([0; b)). Ci
dovuto al fatto che gli elementi tra a e 0 non hanno alcuna controimmagine. Per
esempio, se D = ( 1; 2), si ha
1
p p
f (D) = 2; 2
Si noti che
1 1 1
f (D) = f ([0; 2)) = f ( 1; 2)
ossia gli elementi negativi di D sono irrilevanti (poich non appartengono allimmagine
della funzione). N
x21 + x22 = k
p
ossia la circonferenza di raggio k. Gracamente, le curve di livello si possono quindi
rappresentare come
11
Lespediente infatti lo stesso che conduce a rappresentare le montagne su una carta geograca
attraverso le cosiddette isoipse, cio le linee ideali che congiungono tra loro tutti i punti alla stessa
quota sul livello del mare. Per le funzioni di due variabili, il problema esattamente lo stesso: si pu
rappresentare una supercie in R3 attraverso le linee che congiungono i punti (x1 ; x2 ) per i quali la
funzione assume lo stesso valore k.
156 CAPITOLO 7. FUNZIONI
Due diverse curve di livello di una stessa funzione non possono avere alcun punto
in comune, cio
f 1 (k1 ) \ f 1 (k2 ) = ; (7.4)
se k1 6= k2 . Infatti, se vi fosse un punto x 2 Rn che appartiene a entrambe le curve
di livelli k1 e k2 , sarebbe f (x) = k1 e f (x) = k2 con k1 6= k2 , ma ci vietato dal
concetto di funzione che impone che essa assuma un solo valore in ogni punto.
p
Esempio 81 Sia f : R2 ! R data da f (x1 ; x2 ) = 7x21 xp 2 . Per ogni k 0, la
1 2 2
curva di livello f (k) il luogo dei punti di R di equazione 7x1 x2 = k, ovvero
7.3. PROPRIET GENERALI 157
x2 = k 2 + 7x21 . Si tratta di una parabola che interseca lasse delle ordinate in k2.
Gracamente:
:
N
Esempio 82 La funzione f : R++ R ! R data da
s
x21 + x22
f (x1 ; x2 ) =
x1
denita soltanto per x1 > 0. Le sue curve di livello hanno equazioni
s
x21 + x22
= k cio x21 + x22 k 2 x1 = 0
x1
e quindi sono circonferenze, tutte passanti per lorigine e di centri (k 2 =2; 0), tutti
sullasse delle ascisse. Gracamente:
:
158 CAPITOLO 7. FUNZIONI
Si noti che, pur avendo tutte tali circonferenze lorigine come punto comune, le vere
curve di livello sono le circonferenze private dellorigine (perch in (0; 0) la funzione
non denita) e che esse non hanno alcun punto in comune. N
OfB. Ci limitiamo a funzioni di due variabili. La generica curva di livello di f ha
equazione
f (x1 ; x2 ) = k
Essa si pu riscrivere, in forma apparentemente pi complicata
y = f (x1 ; x2 )
y=k
ma tale riscrittura ben ne suggerisce il signicato geometrico:
(i) lequazione y = f (x1 ; x2 ) rappresenta una supercie in R3 ;
(ii) lequazione y = k rappresenta un piano orizzontale (contiene i punti (x1 ; x2 ; k) 2
R3 , cio tutti i punti di quotak);
(iii) il simbolo f geometricamente signica intersezione.
La curva di livello k appare allora come lintersezione tra la supercie rappresen-
tativa di f e un piano orizzontale.
Dunque, alla buona, le varie curve di livello corrispondono a tagliare la supercie con
piani orizzontali (a vari livelli) e a rappresentare la forma delle fette cos ottenute
sul piano (x1 ; x2 ). H
7.3. PROPRIET GENERALI 159
Curve di indierenza
Vediamo una classica applicazione economica delle curve di livello. Data una funzione
di utilit u : A Rn+ ! R, le curve di livello
1
u (k) = fx 2 A : u (x) = kg
sono dette curve di indierenza. In altre parole, una curva di indierenza formata
da tutti i panieri x 2 Rn+ che hanno la stessa utilit k (e sono quindi indierenti per il
consumatore). Linsieme fu 1 (k) : k 2 Rg di tutte le curve di indierenza talvolta
chiamata mappa di indierenza.
k2
x2 =
x1
1
Al variare di k 0 otteniamo la mappa di indierenza fu (k)gk , cio:
8
y
7
6 k=3
5
k=2
4
2 k=1
0
O x
-1
0 0.5 1 1.5 2 2.5 3 3.5
N
160 CAPITOLO 7. FUNZIONI
Si noti come la propriet delle curve di indierenza di non intersecarsi non sia altro
che un caso speciale della propriet (7.4) valida per quasiasi famiglia di curve di livello.
sono dette isocosti. In altre parole, un isocosto linsieme di tutti i livelli di output
x 2 A che hanno lo stesso costo. Linsieme fc 1 (k) : k 2 Rg di tutti gli isocosti
talvolta chiamato mappa degli isocosti.
(iii) la funzione rapporto (f =g) (x) = f (x) =g (x) per ogni x 2 A, purch g (x) 6= 0.
7.3.3 Composizione
Consideriamo due funzioni f : A ! B e g : C ! D, con Im f C. Prendiamo un
punto qualsiasi x 2 A. Poich Im f C, limmagine f (x) appartiene al dominio C
della funzione g. Possiamo applicare la funzione g allimmagine f (x), ottenendo in
tal modo lelemento g (f (x)) di D. Infatti, la funzione g ha come proprio argomento
limmagine f (x) di x.
Abbiamo quindi associato a ogni elemento x dellinsieme A lelemento g (f (x))
dellinsieme D. Tale regola, detta di composizione, denisce tramite le funzioni f e g
una nuova funzione da A in D, indicata con g f . Formalmente:
(g f ) (x) = g (f (x)) 8x 2 A:
162 CAPITOLO 7. FUNZIONI
f (g (x)) = f (x + 1) = (x + 1)2 .
1.6
A B
1.4
a
1
1.2 b
1
b
3
1 a b
2 2
0.8
0.6
0.4
0.4 0.45 0.5 0.55 0.6 0.65 0.7 0.75 0.8
Funzione iniettiva da A in B
Ricordando quanto sera detto sui codomini, si pu notare che una funzione f :
A ! B si pu sempre scrivere come f : A ! Im f , che ovviamente suriettiva (basta
prendere B = Im f ). Per esempio, se scriviamo la parabola x2 come f : R ! R+ essa
diventa suriettiva. Quindi, scegliendo in modo opportuno il codominio, ogni funzione
diventa suriettiva. Ci per non signica che la suriettivit sia una nozione priva di
interesse: come si vedr, spesso infatti linsieme B ssato (per varie ragioni) a priori
ed importante distinguere le funzioni che hanno B come immagine, ossia le suriettive,
da quelle la cui immagine solo contenuta in B.
1.6
A B
1.4
a b
1 1
1.2
1 a b
2 2
0.8
a b
3 3
0.6
0.4
0.4 0.45 0.5 0.55 0.6 0.65 0.7 0.75 0.8
Solo se. Sia f : A ! B una biiezione. Per la iniettivit si ha jAj jBj. Infatti,
a ogni x 2 A corrisponde un diverso f (x) 2 B. Daltra parte, per la suriettivit si ha
jBj jAj. Infatti, per ogni y 2 B si ponga C (y) = fx 2 A : f (x) = yg. Se y1 6= y2
si ha C (y1 ) \ C (y2 ) = ;. Quindi, posto C = fC (y) : y 2 Bg, si ha jBj = jCj. Ma,
facile vedere che jCj jAj, da cui jBj jAj. In conclusione, si ha jAj = jBj.
Come vedremo nella Sezione 7.7, parafrasando una celebre battuta di David Hilbert,
questo risultato la porta del paradiso di Cantor.
Si ha quindi
1
f (f (x)) = x 8x 2 A (7.6)
e
1
f f (y) = y 8y 2 Im f (7.7)
Le funzioni inverse eettuano il percorso inverso delle originarie: da x 2 A si arriva a
f (x) 2 B, e si torna indietro con f 1 (f (x)) = x.
1.6
A B
1.4
1.2
f
1 x y
-1
f
0.8
0.6
0.4
0.4 0.45 0.5 0.55 0.6 0.65 0.7 0.75 0.8
OfB. Nel vestirsi, prima ci si mettono le mutande (f ) e poi i pantaloni (g); nello
spogliarsi, prima ci si tolgono i pantaloni (g 1 ) e poi le mutande (f 1 ). H
OfB. Il graco della funzione f 1 lo stesso di f , una volta che si siano risistemati
gli assi cartesiani. La maniera pi semplice di vederlo di tracciare il graco di f su
un foglio di carta poco spessa, guardarlo in controluce dopo aver rotato gli assi di 900
in modo da scambiare ascisse e ordinate: ci che appare il graco di f 1 .
7.4. CLASSI DI FUNZIONI 167
5 5
y y
4 4
3 3
2 2
1 1
0 0
x x
O O
-1 -1
-2 -2
-3 -2 -1 0 1 2 3 4 -3 -2 -1 0 1 2 3 4
p 1
Funzione y = f (x) = 3
x Funzione x = f (y) = y 3
jf (x)j k 8x 2 A: (7.9)
168 CAPITOLO 7. FUNZIONI
Dim. Se f limitata, esistono k 0 ; k 00 2 R tale che k 0 f (x) k 00 . Sia k > 0 tale che
k k0 k 00 k. Ne segue che vale la (7.9). Viceversa, supponiamo che valga la
(7.9). Grazie alla (4.1), che vale anche per la , si ha k f (x) k, il che implica
che f limitata sia superiormente sia inferiormente.
La funzione denita da
8
>
< 1 se x 1
f (x) = 0 se 0 < x < 1
>
: 2 se x 0
Funzioni monotone su R
Cominciamo col caso n = 1, che di particolare importanza. Nel dettaglio
(i) crescente se
x > y ) f (x) f (y) x; y 2 A; (7.10)
strettamente crescente se
(ii) decrescente se
x > y ) f (x) f (y) 8x; y 2 A; (7.12)
strettamente decrescente se
f (x) = k 8x 2 A:
Si noti che una funzione costante se e solo se sia crescente sia decrescente.
In altre parole, la costanza equivale alla compresenza di entrambe le propriet di
monotonia. per questa ragione che abbiamo introdotto la costanza tra le forme
di monotonia. A breve vedremo che nel caso vettoriale la relazione tra costanza e
monotonia un popi sottile.
Dim. Solo se. Sia f strettamente crescente e sia f (x) = f (y). Supponiamo, per
contraddizione, che x 6= y: x > y oppure y < x. In entrambi casi, per la (7.11), si ha
f (x) 6= f (y), il che contraddice f (x) = f (y). Ne segue che x = y, come desiderato.
Se. Supponiamo valga la propriet (7.13). Sia f crescente. Mostriamo che lo
anche strettamente. Sia x > y. Per la crescenza, si ha f (x) f (y) ma non pu aversi
f (x) = f (y) perch dalla (7.13) seguirebbe x = y. Si ha quindi f (x) > f (y) come
desiderato.
x se x 0
f (x) =
0 se x < 0
crescente, ma non strettamente, poich costante per ogni x < 0. Lo stesso vale per
la funzione denita da
8
< x 1 se x 1
f (x) = 0 se 1<x<1 (7.14)
:
x+1 se x 1
Si noti che nella (7.10) possiamo sostituire x > y con x y senza alcuna con-
seguenza poich si ha f (x) = f (y) se x = y. Quindi, la crescenza equivale a
che richiede che a maggiori valori dellimmagine corrispondano maggiori valori dellar-
gomento. Si osservi che ovviamente f (x) = f (y) equivale ad avere sia f (x) f (y)
sia f (y) f (x), che a loro volta, grazie alla (7.16), implicano x y e y x, ossia
x = y. Quindi, dalla (7.16) segue che
Alla luce della Proposizione 77, concludiamo che una funzione crescente che soddis-
fa anche limplicazione inversa (7.16) strettamente crescente. Il prossimo risultato
mostra che vero anche il converso, stabilendo cos uninteressante caratterizzazione
della stretta crescenza; lanalogo risultato vale per la stretta decrescenza.
Dim. Grazie a quanto visto sopra, resta da dimostrare il Solo se, ossia che una
funzione strettamente crescente soddisfa la propriet (7.18). Poich una funzione
strettamente crescente crescente, limplicazione
x y ) f (x) f (y)
f (x) f (y) ) x y
Sia f (x) f (y) e supponiamo, per contraddizione, che x < y. La stretta crescenza
implica f (x) < f (y), il che contraddice f (x) f (y). Si ha quindi x y, come
desiderato.
Funzioni monotone su Rn
Le nozioni di monotonia viste nel caso n = 1 si generalizzano in modo naturale al caso
di n qualsiasi, ma con alcuni aspetti delicati legati alle due peculiarit del caso n 2,
ossia lincompletezza di e la presenza di due nozioni di disuguaglianza stretta: > e
. Per brevit, consideriamo la monotonia crescente (nozioni analoghe valgono per
la decrescente). La nozione di crescenza si estende in modo ovvio.
7.4. CLASSI DI FUNZIONI 171
I conversi delle precedenti implicazioni non valgono. Una funzione crescente con
tratti di costanza un esempio di funzione crescente ma non fortemente. Quindi
crescenza ; forte crescenza
Inoltre, il prossimo esempio mostra che esistono funzioni fortemente crescenti ma non
strettamente crescenti, cio
forte crescenza ; stretta crescenza
15
Le nozioni di monotonia per funzioni di pi variabili studiate sono componente per componente,
cio si basano sul confronto delle componenti dei vettori che sono argomento delle funzioni. Nella
Sezione 22.2 vedremo brevemente unaltra nozione di monotonia per funzioni di pi variabili.
172 CAPITOLO 7. FUNZIONI
Funzioni di utilit
Sia u : A ! R una funzione di utilit denita su un opportuno insieme A di panieri di
beni (in genere, A Rn+ come nella Sezione 2.4.2). Una sua trasformazione f u : A !
R, dove f : Im u R ! R, denisce unaltra funzione di utilit di stesso signicato
purch
u (x) u (y) () (f u) (x) (f u) (y) x; y 2 A (7.22)
In altri termini, la funzione f u ordina i beni allo stesso modo di u, cio
x % y () (f u) (x) (f u) (y) x; y 2 A
Per la Proposizione 78, f soddisfa la (7.22) se e solo se strettamente crescente.
Quindi, una trasformazione f u a sua volta una funzione di utilit se e solo se f
strettamente crescente. Per descrivere tale fondamentale propriet di invarianza delle
funzioni di utilit si dice che esse sono ordinali, cio uniche a meno di trasformazioni
monotone (strettamente crescenti). Si tratta di una propriet che sta alla base del-
lapproccio ordinalista, in cui le funzioni di utilit sono una mera rappresentazione
numerica della preferenza %, che la nozione fondamentale (si ricordi la discussione
nella Sezione 7.2.2).
Esempio 97 Consideriamo la funzione di utilit Cobb-Douglas u : Rn++ ! R data da
Y
n
u (x1 ; x2 ; ; xn ) = xi i
i=1
Pn
con ogni i 0e i=1 i = 1. Prendendo f (x) = log x, la trasformazione
X
n
f u= i log xi
i=1
Costanza e monotonia
Oltre alla stretta monotonia, anche la relazione tra costanza e monotonia pi delicata
nel caso vettoriale che in quello scalare. Infatti, mentre anche nel caso vettoriale una
funzione costante sia crescente sia decrescente, il converso, che era banalmente vero
in R, diventa problematico a causa della possibile non confrontabilit di vettori in Rn .
Esempio 99 Sia A = fx 2 R2 : x1 + x2 = 0g il luogo dei punti della retta:
Tutti i punti su questa retta non sono tra loro confrontabili, sicch le denizioni di
crescenza e descrenza sono soddisfatte, pur se in modo vacuo, da tutte le funzioni
f : A R2 ! R. Tra esse, per esempio la funzione f (x) = x1 x2 non costante pur
essendo sia crescente sia decrescente. N
Per ristabilire il legame tra costanza e monotonia vista nel caso scalare occorre
considerare insiemi A che abbiamo la seguente propriet (o sue varianti).
Denizione 47 Un insieme A in Rn si dice direzionato ( per ) se per ogni x; y 2 A
esiste z 2 A tale che z x e z y.
7.4. CLASSI DI FUNZIONI 175
X
n
f (x) = gi (xi ) 8x = (x1 ; :::; xn ) 2 A
i=1
X
n
f (x) = xi log xi 8x = (x1 ; :::; xn ) 2 Rn++
i=1
X
T
t 1
U (x) = ut (xt )
t=1
Esempio 103 Anche nel caso statico le funzione di utilit separabili sono molto
importanti. Le funzioni di utilit usate dai primi Marginalisti erano infatti della forma
X
n
u (x) = ui (xi )
i=1
P1 P2 Pn :
Esempio 106 Un polinomio f ha grado zero quando esiste a 2 R tale che f (x) = a
per ogni x. Le funzioni costanti si possono quindi intendere come polinomi di grado
zero. N
[
Linsieme di tutti di polinomi, di ogni grado, si indica con P, cio P = Pn .
n 0
f (x) = ax
5
y
4
0
O x
-1
-2
-3 -2 -1 0 1 2 3 4
Funzione ex
x
Molto importante anche la funzione esponenziale negativa f (x) = e , il cui graco
:
178 CAPITOLO 7. FUNZIONI
2
y
1
0
O x
-1
-2
-3
-4
-5
-3 -2 -1 0 1 2 3 4
x
Funzione e
Limmagine della funzione esponenziale linsieme (0; +1) degli scalari strettamente
positivi. Inoltre, grazie al Lemma 19-(iv), la funzione esponenziale ax :
(ii) costante se a = 1,
f (x) = loga x
detta funzione logaritmica di base a > 0. Si noti che, per quanto appena osservato,
a 6= 1.
loga ax = x 8x 2 R
e
aloga x = x 8x 2 (0; +1)
1
non sono quindi altro che le relazioni (7.6) e (7.7) delle funzioni inverse, cio f (f (x)) =
x e f (f 1 (y)) = y.
7.5. FUNZIONI ELEMENTARI SU R 179
5
y
4
0
O x
-1
-2
-3 -2 -1 0 1 2 3 4
Funzione ln x
Dim. Per lesponenziale, si osservi che, quando a > 1, anche ah > 1 per ogni h > 0.
Quindi ax+h = ax ah > ax per ogni h > 0. Per la logaritmica, osservato che loga k > 0
se a > 1 e k > 1, si ha
h h
loga (x + h) = loga x 1 + = loga x + loga 1 + > loga x
x x
Funzioni trigonometriche
La funzione seno f : R ! R, indicata come f (x) = sin x, il primo esempio di
funzione trigonometrica. Per ogni x 2 R si ha:
sin (x + 2k ) = sin x 8k 2 Z
Il graco della funzione seno :
4
y
3
- 2
0
O x
-1
-2
-3
-4
-4 -2 0 2 4 6
4
y
3
-
0
O x
-1
-2
-3
-4
-4 -2 0 2 4 6
Inne, la funzione f : R 2
+ k ; k 2 Z ! R data da f (x) = tan x la funzione
tangente. Dalla (A.1) segue che
tan (x + k ) = tan x 8k 2 Z
7.5. FUNZIONI ELEMENTARI SU R 181
Il graco :
10
y
8
0
O x
-2
-4
-6
-8
-10
-4 -3 -2 -1 0 1 2 3 4
3 y
O x
-1
-2
-3
-4 -3 -2 -1 0 1 2 3 4
cos x : [0; ] ! [ 1; 1]
arccos x : [ 1; 1] ! [0; ]
e il suo graco :
y
3
0
O x
-1
-2
-3
-4 -3 -2 -1 0 1 2 3 4
tan x : ; !R
2 2
arctan x : R ! ;
2 2
e il suo graco :
7.5. FUNZIONI ELEMENTARI SU R 183
3 y
O x
-1
-2
-3
-4 -3 -2 -1 0 1 2 3 4
immediato riconoscere che, per 2 (0; =2), risulta 0 < sin < < tan .
Funzioni Periodiche
Le funzione trigonometriche sono le pi classiche funzioni periodiche.
In particolare, per ci che s detto le funzioni sin x e cos x sono periodiche di peri-
odo 2 , mentre la funzione tan x ha periodo . I loro graci evidenziano la propriet
che caratterizza le funzioni periodiche, ossia di ripetersi intatti su ogni intervallo di
ampiezza p.
p
Esempio 111 La funzione f (x1 ; x2 ) = x1 x2 ha come dominio naturale R2+ [ R2 .
Tuttavia, quando vista come funzione di utilit di tipo Cobb-Douglas il suo dominio
ristretto a R2+ perch i panieri di beni hanno sempre componenenti positive. In-
oltre, poich f (x1 ; x2 ) = 0 quando anche sola una componente nulla, il che poco
plausibile, tali funzioni di utilit si considerano spesso solo su R2++ . Considerazioni
puramente economiche portano perci a restringere il dominio sul quale si studia la
p
funzione f (x1 ; x2 ) = x1 x2 . N
detta estensione di f a C.
Risulta evidente dalle denizioni appena date che restrizione ed estensione sono
due facce della stessa medaglia: g una estensione di f se e solo se f una restrizione
di g. In particolare, una funzione denita sul suo dominio naturale A unestensione
ad A di ogni sua restrizione. anche evidente che se una funzione possiede una
restrizione/estensione, ne possiede innite18 .
1
x
se x 6= 0
g(x) =
0 se x = 0
una estensione della funzione f (x) = 1=x, che ha dominio naturale R f0g. N
x per x 0
g(x) =
log x per x > 0
una estensione della funzione f (x) = log x, che ha dominio naturale R++ . N
18
Potrebbe succedere che una funzione non possegga restrizioni o non possegga estensioni. Infatti,
sia f : A R ! R. Se A = fx0 g, cio se il dominio di f un singolo punto, allora f non possiede
restrizioni. Se invece A = R, f non possiede estensioni.
186 CAPITOLO 7. FUNZIONI
Esempio 114 Linsieme A = f11; 13; 15; 17; 19g degli interi dispari tra tra 10 e 20
nito e jAj = 5. N
Grazie alla Proposizione 75, due insiemi niti hanno la stessa potenza se e solo se
i loro elementi si possono porre in corrispondenza biunivoca: per esempio, se abbiamo
sette tazzine e sette cucchiaini, possiamo accoppiare ogni tazzina a un cucchiaino. In
particolare, abbiamo il seguente ovvio lemma.
Il punto di vista funzionale per la cardinalit, basato sulle funzioni biiettive e sul-
lindividuazione di un insieme prototipo, nel caso nito poco pi di una curiosit.
Diventa per sostanziale quando si vuole estendere la nozione di cardinalit a insiemi
inniti. Fu questa una delle intuizioni fondamentali di Georg Cantor, che port alla
nascita della teoria degli insiemi inniti. Infatti, la possibilit di instaurare una cor-
rispondenza biunivoca tra insiemi inniti consente una loro classicazione e conduce
a scoprirne propriet poco intuitive.
Gli insiemi numerabili presentano qualche piccola sorpresa: per esempio, sempre
possibile porre in corrispondenza biunivoca un insieme numerabile con un suo sot-
toinsieme proprio innito. Per esempio, linsieme P dei numeri pari chiaramente un
sottoinsieme proprio di N e si potrebbe pensare che contenga metdei suoi elemen-
ti. Purtuttavia possibile instaurare una corrispondenza uno a uno con N facendo
corrispondere a ogni numero pari la sua met:
2n 2 P $ n 2 N
e quindi jP j = jNj. Gi Galileo si era reso conto di questa notevole peculiarit degli
insiemi inniti, che li distingue nettamente dagli insiemi niti, i cui sottoinsiemi pro-
pri hanno sempre cardinalit minore19 . In un celebre passaggio dei Discorsi e di-
mostrazioni matematiche intorno a due nuove scienze 20 , pubblicato nel 1638, egli os-
servava che i numeri naturali si possono mettere in corrispondenza biunivoca con i loro
quadrati ponendo n2 $ n, sicch i quadrati, che a prima vista sembrano costituire
un sottoinsieme piuttosto piccolo di N, in realt sono in egual numero dei naturali
per via della corrispondenza n2 $ n: ... e pur nel numero innito, se concepir lo
potessimo, bisognerebbe dire, tanti essere i quadrati quanti tutti i numeri insieme.
La chiarezza di Galileo nellesporre il problema degna del suo genio. Purtroppo le
nozioni matematiche a sua disposizione erano del tutto insu cienti a sviluppare le sue
intuizioni. Per esempio, la nozione di funzione, basilare per le idee di Cantor, comincia
ad apparire, peraltro in forma molto primitiva, solo alla ne del Seicento con i lavori
di Leibniz.
Dim. Indichiamo con A0 , A1 , A2 ,: : : ,An , ::: gli insiemi e con A la loro unione.
Disponiamo visivamente gli elementi dei vari insiemi come segue:
A0 = fa00 ; a01 ; a02 ; ; a0n ; g
A1 = fa10 ; a11 ; a12 ; ; a1n ; g
A2 = fa20 ; a21 ; a22 ; ; a2n ; g
e cos via. Chiamiamo ora altezza dei vari elementi aij (che non sono altro che gli
elementi dellunione A) semplicemente la somma i+j dei suoi indici. Possiamo disporli
19
Laccennata possibilit alla base di parecchie storielle. Per esempio, lHotel del Paradiso ha
uninnit numerabile di stanze, numerate progressivamente 1; 2; 3; . In un certo momento sono
tutte occupate, ma si presenta un nuovo ospite. Come trovargli posto? Basta chiedere a tutti di
spostarsi nella stanza successiva (1 ! 2; 2 ! 3; 3 ! 4, ecc.) ed ecco che si libera la stanza numero 1.
Si pu anche fare di meglio: chiedere a tutti di spostarsi nella stanza con il numero doppio di quella
attualmente occupata (1 ! 2; 2 ! 4; 3 ! 6, ecc.) e si liberano innite stanze, le dispari.
20
Il passaggio si trova in un dialogo tra Sagredo, Salviati e Simplicio nella prima giornata.
188 CAPITOLO 7. FUNZIONI
in sequenza uttilizzando tali altezze e, quando due diversi elementi abbiano la stessa
altezza, nellordine determinato dal loro primo indice21 . Si ottiene cos la sequenza
a00 ; a01 ; a10 ; a02 ; a11 ; a20 ; a03 ; a12 ; a21 ; a30 ; a04 ; :::
0 1 1 1 2 1 2 1 3 1 3
= 0; = 1; = 1; ; = 2; ; = 2; ; = 3; ; = 3;
|1 {z } | 1 {z 1 } | 2 1 {z 2 1 } | 3 1 {z 3 1 }
altezza 1 altezza 2 altezza 3 altezza 4
Corollario 84 jQj = @0 .
A questo punto pu sorgere il sospetto che tutti gli insiemi inniti siano numerabili.
Il prossimo risultato mostra che non cos. Linsieme R dei reali non numerabile:
costituito cio da uninnit non numerabile, molto pi ricca di elementi di N.
Dim. 1 su ciente mostrare che j(0; 1)j > @0 . Infatti, essendo (0; 1) R, ci
ovviamente implica la non numerabilit di R. Per prima cosa osserviamo che j(0; 1)j
@0 . Infatti, linsieme
1
:n2N
1+n
ha la stessa cardinalit di N (stabilita dalla biiezione f (n) = 1=1 + n) ed inclusa in
(0; 1).
Poich j(0; 1)j @0 , per mostrare che j(0; 1)j > @0 basta mostrare che (0; 1) non
numerabile, cio j(0; 1)j 6= @0 . A tal ne, scriviamo tutti i numeri in (0; 1) ricorrendo
alla loro rappresentazione decimale: ogni x 2 (0; 1) si scriver come
x = 0; c0 c1 cn
con ci 2 f0; 1; :::; 9g, utilizzando sempre innite cifre (per esempio 3; 54 si scriver
3; 54000000 : : :).
Supponiamo per assurdo che (0; 1) sia numerabile: esisterebbe allora un modo di
ordinarli in sequenza
Dim. 2 Procediamo per contraddizione supponendo che esista una funzione biiettiva
f : N ! R. Grazie a essa costruiamo per induzione due successioni fxn g e fyn g tali
che
xn 1 < x n < y n < y n 1 (7.24)
per ogni n. In particolare, al primo passo si ponga f (1) < x1 < y1 . Per induzione, si
supponga che al passo n si abbia xn < yn . Si scelgano xn+1 e yn+1 secondo la seguente
regola:
(i) se f (n) 2
= (xn ; yn ), allora si pone xn < xn+1 < yn+1 < yn ;
(ii) se f (n) 2 (xn ; yn ), allora si pone f (n) < xn+1 < yn+1 < yn .
190 CAPITOLO 7. FUNZIONI
La potenza del continuo si indica con @1 . Anche in questo caso esistono sottoinsiemi
a prima vista molto pi piccoli di R che hanno la potenza del continuo. Vediamone
un esempio.
Dim. Nella prima dimostrazione del Teorema di Cantor si era mostrato che j(0; 1)j >
@0 . Si vuole ora mostrare che j(0; 1)j = @1 . Per far ci occorre mostrare che i numeri
di (0; 1) si possono porre in corrispondenza biunivoca con quelli di R. La biiezione
f : R ! (0; 1) denita da
1
f (x) =
2 + jxj
mostra che, in eetti, tale il caso (come il lettore pu vericare).
Si tratta di unaltra notevole sorpresa, gi nel caso speciale del piano R2 , che pare
contenere molti pi punti di una retta. di fronte a risultati sorprendenti di questo
tipo che Cantor scrisse in una lettera a Dedekind lo vedo, ma non ci credo. In
realt, le sue intuizioni sulluso delle funzioni biiettive nello studio della cardinalit
degli insiemi inniti hanno aperto una nuova profonda area della Matematica, ricca
anche di implicazioni losoche.
7.7. FUNZIONI BIIETTIVE E CARDINALIT 191
Guardando la (7.25) sorge spontaneo chiedersi se @0 e @1 siano gli unici numeri cardinali
inniti. Come vedremo tra breve, ci ben lungi dallesser vero. Ci apprestiamo infatti
a scoperchiare un vero e proprio vaso di Pandora (da cui per escono non mali ma
meraviglie).
Per far ci, indichiamo con 2A linsieme delle parti (o insieme potenza) di un
insieme qualsiasi A, ossia linsieme
2A = fB : B Ag
n n n n
2A = 1+ + + ::: + +
1 2 n 1 n
Xn
n k n k
= 1 1 = (1 + 1)n = 2n ;
k=0
k
Dim. Siccome A 2 2A , si ha jAj j2A j. Supponiamo, per assurdo, che sia jAj = j2A j.
Esiste allora una biiezione tra A e 2A che ad ogni elemento a 2 A fa corrispondere un
elemento b = b (a) 2 2A e viceversa: a $ b. Si osservi che tale b, essendo elemento
di 2A , un sottoinsieme di A. Consideriamo ora tutti gli elementi a 2 A tali che il
corrispondente sottoinsieme b (a) non contenga a e diciamo S linsieme di tali b (a):
esso evidentemente un sottoinsieme di A. Consideriamo ora un generico elemento
c 2 A:
(i) se c 2
= S, allora b (c) contiene c e quindi c 2 S;
Il Teorema di Cantor ore un modo molto semplice per fare un salto di cardinalit
a partire da un dato insieme A: basta considerarne linsieme delle parti 2A . Per
R
esempio, 2R > @1 , ma anche 22 > j2R j, e cos via. Possiamo quindi costruire una
successione innita di insiemi di cardinalit sempre pi grande e perci rappresentata
da numeri cardinali via via maggiori, s da arricchire la (7.25) come
Teorema 90 2N = jRj.
ossia che non esiste alcun insieme innito di cardinalit intermedia tra le potenze del
numerabile e del continuo. Un insieme che abbia cardinalit maggiore del numerabile
ha almeno la potenza del continuo.
La validit dellipotesi del continuo il primo tra i celebri problemi posti da David
Hilbert nel 1900 e rappresenta una delle questioni pi profonde della Matematica. Sia
7.7. FUNZIONI BIIETTIVE E CARDINALIT 193
come sia, con la notazione @1 = jRj, noi abbiamo implicitamente adottato tale ipotesi
perch essa giustica il considerare la potenza del continuo come il secondo numero
cardinale innito @1 dopo il primo @0 = jNj.
Lipotesi del continuo si pu quindi riformulare in modo suggestivo scrivendo
@1 = 2@0 ;
@n+1 = 2@n ;
ossia che tutti i salti di cardinalit nella (7.26), e non solo il primo da @0 a @1 , si
ottengono sempre considerando gli insiemi delle parti. Quindi,
R 2R
@2 = 22 ; @3 = 22 ;
e cos via.
incredibile quale sia la profondit dei problemi aperti dalluso, al contempo rig-
oroso e intrepido (connubio tipico della grande Matematica e base della sua bellezza),
che Cantor ha fatto delle funzioni biiettive come principio fondamentale di similarit
tra insiemi rispetto alla loro numerosit23 .
23
Il lettore curioso di approfondire le sue conoscenze di Teoria degli insiemi pu consultare P.
Halmos, Naive set theory, Van Nostrand, 1960 oppure P. Suppes, Axiomatic set theory, Van Nostrand,
1960.
194 CAPITOLO 7. FUNZIONI
Capitolo 8
8.1 Misure
Sia 2 linsieme delle parti di un insieme qualsiasi nito = f! 1 ; :::; ! n g, cio la
famiglia di tutti i sottoinsiemi di . Si ricordi dalla Proposizione 88 che la cardinalit
di 2n .
Le funzioni di insieme sono quindi funzioni con dominio linsieme delle parti 2 e
codominio la retta reale.
(A) = jAj 8A
195
196 CAPITOLO 8. APPLICAZIONE: FUNZIONI DI INSIEME E PROBABILIT
Si noti che (;) = j;j = 0. Grazie ai dati dellultimo censimento, lISTAT ha deter-
minato che let di ogni italiano descritta dalla funzione : ! R, sicch (!)
let di ! 2 A. La funzione dinsieme : 2 ! R denita da
( P
!2A (!)
se ; =6 A
(A) = jAj
0 se A = ;
indica let media di ogni gruppo A di italiani. Per esempio, se A linsieme delle
donne, (A) la loro et media. Si noti come si sia dovuto denire separatamente
linsieme vuoto perch per esso il denominatore si annulla. N
(iv) normalizzata se ( ) = 1.
purch A e B siano non vuoti; inne, ovvio che, in generale, non normalizzata.
Una funzione dinsieme che soddis le propriet (i) e (iii) detta misura. La misura
di conteggio una misura, e ci ne spiega il nome; la funzione dinsieme dellet media
non invece una misura. La propriet (ii) di monotonia implicata dalle altre due:
8.2 Probabilit
Le misure che godono anche della propriet (iv), cio che sono normalizzate, sono dette
misure di probabilit (o, pi brevemente, probabilit). In altre parole, una funzione
dinsieme P : 2 ! R una probabilit su se:
(iii) P (;) = 0 e P ( ) = 1.
Indicheremo con P una misura di probabilit. Si noti che P (A) 2 [0; 1]: la prob-
abilit di un insieme sempre compresa tra zero e uno. Per tale ragione nel seguito
scriveremo P : 2 ! [0; 1].
Vediamo alcuni esempi di spazi di probabilit, che riprendono anche quelli gi visti
nelle Sezioni 2.4.1 e 7.2.1.
Esempio 117 Come visto nella Sezione 2.4.1, il lancio di una moneta determina due
soli stati del mondo:
= fC; T g
Linsieme delle parti formato da quattro eventi: ;; fT g ; fCg ; . Il lancio di due
monete determina quattro stati del mondo:
B = f(T; C) ; (C; T )g
Esempio 118 (i) Il lancio di un dado determina sei stati del mondo:
= f1; 2; : : : ; 6g
P (!) = P (f!g) 8! 2
degli stati del mondo determinano compiutamente P su tutto 2 . Infatti ogni evento
A 2 2 costituito da alcuni stati del mondo (che sono ovviamente disgiunti) e perci
X
P (A) = P (!)
!2A
In particolare X
P (!) = P ( ) = 1:
!2
Assegnare una probabilit su 2 equivale dunque ad assegnarne i valori sui soli stati
del mondo e perci essa pu essere sintetizzata semplicemente con il vettore P 2 Rn+
dato da
P = (P (! 1 ) ; P (! 2 ) ; : : : ; P (! n ))
ovvero
P = (P1 ; P2 ; : : : ; Pn )
ponendo Pi = P (! i ). Le misure di probabilit
P P : 2 ! [0; 1] si possono quindi
identicare con i vettori P 2 Rn+ tali che ni=1 Pi = 1. Si tratta di unosservazione
tanto semplice quanto utile. Nel Capitolo 15 vedremo come linsieme dei vettori P 2
Rn+ sia un importante insieme di Rn+ , chiamato simplesso.
= f! 1 ; ! 2 ; ! 3 ; ! 4 g
Il vettore
P = (1=4; 1=4; 1=6; 1=3) 2 R4
identica la probabilit P : 2 ! [0; 1] data da
1 1 1
P (! 1 ) = P (! 2 ) = ; P (! 3 ) = ; P (! 4 ) =
4 6 3
e la probabilit degli altri dodici eventi si trova di conseguenza. N
8.2. PROBABILIT 199
Esempio 120 (i) Per il lancio di una moneta appare naturale prendere P (T ) =
P (C) = 1=2, cosicch
1 1
P = ;
2 2
(ii) Per il lancio di un dado appare naturale prendere P (i) = 1=6 per ogni i, e
quindi
1 1 1 1 1 1
P = ; ; ; ; ;
6 6 6 6 6 6
N
P (A) = P (A B) + P (A \ B) ) P (A B) = P (A) P (A \ B)
e analogamente
P (B A) = P (B) P (A \ B) :
P (A [ B) = P (A B) + P (B A) + P (A \ B)
= P (A) P (A \ B) + P (B) P (A \ B) + P (A \ B)
= P (A) + P (B) P (A \ B)
200 CAPITOLO 8. APPLICAZIONE: FUNZIONI DI INSIEME E PROBABILIT
Esempio 122 (i) Se la probabilit P assegna egual probabilit 1=2 a testa e croce, il
valore atteso della scommessa (8.1)
1 1
EP (f ) = f (T ) P (T ) + f (C) P (C) = 50 + ( 50) = 0
2 2
Le scommesse con valor medio nullo sono dette eque.
(ii) Se la probabilit P degli stati = fa; b; c; dg sono P (a) = P (b) = P (d) = 1=5
e P (c) = 2=5, la perdita media dellazienda
Visto che stiamo considerando solo insiemi niti di stati del mondo, = f! 1 ; ! 2 ; : : : ; ! n g,
ogni variabile aleatoria su assume al pi n diversi valori
f (! i ) = xi 8i = 1; :::; n (8.3)
(alcuni dei quali possono coincidere). Una variabile aleatoria pu allora essere sem-
plicemente identicata con il vettore di Rn che ne elenca i valori:
x = (f (! 1 ) ; f (! 2 ) ; : : : ; f (! n )) = (x1 ; x2 ; : : : ; xn ) (8.4)
Con questa notazione il valor medio il prodotto interno dei due vettori P e x:
X
n
EP (f ) = P x = Pi x i
i=1
2 1 3 15 25
P = ; ; ; ;
10 10 10 100 100
2 1 3 15 25 63
EP (f ) = ; ; ; ; (5; 10; 8; 6; 4) =
10 10 10 100 100 10
La rappresentazione come vettori dei titoli spesso molto utile, come dimostra
lanalisi della Sezione 3.7. Non si deve per mai dimenticare la loro natura di variabili
aleatorie.
OfB. Il lettore attento avr anche osservato come tutto ci mostri che i vettori di uno
spazio euclideo Rm si possano vedere come funzioni a valori reali denite su un insieme
nito di cardinalit m. In corsi successivi losservazione sar di grande importanza.H
(iii) P (;) = 0 e P ( ) = 1.
Tutte le probabilit sono semplici quando nito; il converso per del tutto
falso: come vedremo tra breve, esistono probabilit semplici molto importanti che sono
denite su spazi inniti. In altre parole, bench concentrino la probabilit su un evento
nito, le probabilit semplici formano unimportante classe di misure di probabilit su
spazi di cardinalit qualunque.
f! 2 : P (!) > 0g
degli stati con probabilit strettamente positiva si dice supporto di P , indicato con
supp P . Il supporto formato dagli stati che eettivamente la misura di probabilit
ritiene possibili: gli stati al di fuori del supporto hanno probabilit nulla.
Dim. Sia P una probabilit semplice. Per denizione esiste un evento nito E tale
che P (E) = 1. Quindi, P (!) = 0 se ! 2 = E, il che implica supp P E. Ne segue
che supp P un insieme nito. Inoltre, gli stati di E che non appartengono a supp P
hanno probabilit zero, cio P (!) = 0 se ! 2 E supp P . Grazie alladditivit ci
implica P (E supp P ) = 0, sicch
come desiderato.
204 CAPITOLO 8. APPLICAZIONE: FUNZIONI DI INSIEME E PROBABILIT
Il valor medio considera la variabile aleatoria solo sugli stati del supporto, som-
mandone i valori pesati per le rispettive probabilit. Quando nito si ritrova la
nozione di valor medio (8.2) dellultima sezione.
Chiudiamo con una nota terminologica: nel seguito uno spazio di probabilit ( ; P )
si dir semplice se la probabilit P semplice.
dove P una probabilit semplice sugli stati del mondo. In altre parole, si pone
V (f ) = EP u (f ) 8f 2 F
f % g () EP u (f ) EP u (g)
cio un atto preferito quando, in media, procura utilit maggiore. Ne consegue che
f e g sono indierenti se e solo se EP u (f ) = EP u (g).
Una propriet molto naturale delle funzioni di utilit del denaro la stretta crescen-
za
c > c0 =) u (c) > u (c0 )
che assegna maggior utilit a maggiori quantit di denaro. Le utilit lineari ed espo-
nenziali negative soddisfano tale propriet su tutta la retta reale e possono quindi
considerare sia guadagni sia perdite. Per esempio la scommessa equa (8.1) ha utilit
attesa zero secondo lutilit lineare, mentre ha utilit attesa
1 50 1 1 50
EP u (f ) = e + e50 = e +e 50
2 2 2
secondo lesponenziale negativa. Al contrario, lutilit quadratica strettamente monotona
solo su [0; 1), ossia per importi positivi. Inne, lutilit logaritmica per sua natura
pu considerare solo importi strettamente positivi, mentre lutilit potenza solo importi
positivi.
8.6 Lotterie
Sia ( ; P ) uno spazio di probabilit qualsiasi. Consideriamo un atto f : ! C che
ad ogni stato associa una conseguenza (per esempio monetaria quando f un titolo
nanziario).
Dato c 2 C, la curva di livello
1
f (c) = f! 2 : f (!) = cg
raccoglie tutti gli stati che, tramite la variabile aleatoria f , hanno c come conseguenza.
Nel caso di un titolo nanziario, f 1 (c) linsieme degli stati dove il titolo paga la
somma c 2 C.
La curva di livello f 1 (c) un evento, ossia un sottoinsieme di . In quanto tale
si verica con probabilit
P f 1 (c)
In altre parole, la variabile aleatoria f fa s che la conseguenza c si verichi con
probabilit P (f 1 (c)).
Pi in generale, dato un insieme di conseguenze D C la sua controimmagine
f 1 (D) linsieme
f 1 (D) = f! 2 : f (!) 2 Dg
8.6. LOTTERIE 207
La lotteria pf informa su quali siano le probabilit delle varie conseguenze che latto
f determina. Atti diversi f : ! R e g : ! R possono indurre le stesse lotterie,
cio pf = pg , come mostra il prossimo semplice esempio.
10 euro se ! = T 0 euro se ! = T
f (!) = ; g (!) =
0 euro se ! = C 10 euro se ! = C
sono due atti monetari su = fT; Cg. Se la probabilit P attribuisce probabilit 1=2
sia a T sia a C, si ha
8
1
>
> se c = 10
< 2
1
pf (c) = pg (c) = se c = 0
2
>
>
: 0 altrimenti
Quanto visto sinora, e in particolare la Denizione 94, vale per spazi di probabilit
( ; P ) qualsiasi. per giunto il momento di considerare i valor medi e dobbiamo
quindi restringerci al caso di spazi di probabilit semplici perch, grazie al Lemma 94,
essi garantiscono che le probabilit indotte siano anchesse semplici.
8.6. LOTTERIE 209
come desiderato.
Il teorema conferma limportanza delle lotterie: equivalente ordinare secondo lu-
tilit attesa gli atti o le lotterie indotte. Per lutilit attesa contano solo le conseguenze
che gli atti determinano e le probabilit con le quali si vericano. In altri termini, la
lotteria pf distilla dallatto f tutte le informazioni rilevanti per lutilit attesa.
Del resto, ragionevole che di un titolo nanziario interessi i pagamenti e le prob-
abilit con i quali essi si vericheranno e nullaltro. Due titoli nanziari che inducono
la stessa probabilit sui pagamenti sono indistinguibili dal punto di vista economico.
3
Il lettore attento avr gi osservato che, dal punto di vista formale, la funzione di utilit u : C ! R
una variabile aleatoria sullo spazio di probabilit (C; pf ).
4
Se ci non fosse, basterebbe raggruppare gli stati che hanno uguali conseguenze secondo f e
ripetere la dimostrazione per la partizione del supporto cos costruita. Lasciamo i dettagli al lettore
interessato.
210 CAPITOLO 8. APPLICAZIONE: FUNZIONI DI INSIEME E PROBABILIT
Esempio 130 La lotteria p su R tale che p (10) = p (50) = 1=2 descrive un titolo
nanziario che paga con egual probabilit 10 e 50 euro. N
p % q () Ep u (c) Eq u (c)
Detto ci, lesogeneit delle probabilit p (c) che caratterizza i problemi di decisione
in condizioni di rischio , al contempo, la forza e il limite di tale approccio. La forza
nella semplicit di una lotteria p 2 (C) rispetto alla specicazione di uno spazio
di probabilit ( ; P ) e di un atto f : ! C i quali, oltretutto, possono essere diversi
8.7. ATTI O LOTTERIE? 211
come appena visto per i titoli quotati su mercati diversi. Grazie alla (8.7), lutilit
attesa la stessa: la lotteria ha in s tutto ci che rilevante per tale criterio.
Daltro canto, lEsempio 129 mostra quali informazioni si perdono considerando
solo le lotterie p 2 (C). In particolare, solo la specicazione dello spazio di probabil-
it e degli atti permette di dar conto della genesi delle probabilit p (c), che le lotterie
p 2 (C) prendono invece a scatola chiusa. La modelizzazione con spazi di probabilit
e atti quindi pi impegnativa, ma anche molto pi informativa.
Riassumendo, vi un trade-o tra il modellare un problema di scelta aleatorio
come problema di decisione in condizioni di incertezza piuttosto che di rischio, ossia
con atti e non con lotterie. In alcuni casi la semplicit delle lotterie le rende la scelta
naturale, in altri casi invece la maggior completezza degli atti a essere rilevante. Sia
come sia, importante capire entrambe le possibili modelizzazione e, soprattutto, i loro
strettissimi legami: dietro la coppia ( (C) ; %) vi sempre un problema di decisione
in condizioni di incertezza, sia esso esplicitamente modellato o meno. Tale coppia la
forma ridottadel pi generale problema di decisione in condizioni di incertezza che
la sottende.
212 CAPITOLO 8. APPLICAZIONE: FUNZIONI DI INSIEME E PROBABILIT
Capitolo 9
Successioni
9.1 Il concetto
Una successione un elencodi inniti numeri reali, per esempio
f2; 4; 6; 8; :::g ; (9.1)
dove ogni numero occupa un posto dordine, cio segue (eccetto il primo) e precede
un altro numero reale. La prossima denizione formalizza lidea. Con N+ indichiamo
linsieme dei naturali privato dello 0.
Denizione 60 Una funzione f : N+ ! R si dice successione di numeri reali.
In altre parole, una successione una funzione che associa a ogni numero naturale
n 1 un numero reale f (n). Nellesempio (9.1), a ogni n si associa f (n) = 2n, ossia
n 7 ! 2n; (9.2)
e si ha cos la successione dei numeri pari. Limmagine f (n) si indica di solito con
xn . Con tale notazione, la successione dei numeri pari si denisce ponendo xn = 2n
per ogni n 1. Le immagini xn sono chiamate termini (o elementi) della successione.
Indicheremo con fxn g1 1
n=1 , o brevemente con fxn g, una generica successione .
Vi sono vari modi per denire una successione fxn g, ossia per descrivere la sot-
tostante funzione f : N+ ! R. Un primo modo descriverla in forma chiusa, cio
attraverso una formula: per esempio, quanto abbiamo fatto con la successione dei
pari usando la formula (9.2) per denirla. Altre formule denitorie sono per esempio
n 7 ! 2n 1; (9.3)
n 7 ! n2 ; (9.4)
1
n 7 ! p : (9.5)
2n 1
1
La scelta di far partire la successione da n = 1 invece di n = 0 una mera convenzione. In
contesti dove risultasse pi e cace partire da n = 0, perfettamente legittimo considerare successioni
1
fxn gn=0 .
213
214 CAPITOLO 9. SUCCESSIONI
f1; 3; 5; 7; g; (9.6)
f1; 4; 9; 16; g;
nella quale ogni termine la somma dei due che lo precedono. Per esempio, nella
quarta posizione troviamo il numero 2, ovvero la somma 1 + 1 dei due termini che lo
precedono, e cos via. La sottostante funzione f : N+ ! R quindi
f (1) = 0 ; f (2) = 1
(9.8)
f (n) = f (n 1) + f (n 2) per n 2
Abbiamo quindi due valori iniziali, f (1) = 0 e f (2) = 1, e una regola ricorsiva che
permette di calcolare il termine di posizione n una volta che siano noti i due termini
precedenti. A dierenza delle successioni denite attraverso una formula chiusa, per
determinare il termine xn , si devono ora preventivamente costruire, usando la regola
ricorsiva, tutti termini che lo precedono. Per esempio, per calcolare il termine x100 nella
successione (9.6) dei dispari, basta sostituire n = 100 nella formula (9.3), trovando
cos x100 = 199. Invece, per calcolare il termine x100 nella successione di Fibonacci si
devono necessariamente dapprima ricostruire per ricorrenza i primi 99 termini della
successione. Infatti, vero che per determinare x100 basta conoscere i valori di x99 e
x98 e poi usare la regola x100 = x99 + x98 , ma per determinare x99 e x98 si devono prima
conoscere x97 e x96 , e cos via.
Quindi, la denizione ricorsiva di una successione consta di uno o pi valori iniziali
e di una regola di ricorrenza che, a partire da essi, permette di costruire i vari termini
della successione. I valori iniziali sono arbitrari. Per esempio, se in (9.8) scegliamo
f (1) = 2 e f (2) = 1 abbiamo la seguente successione di Fibonacci
f (1) = a
:
f (n) = f (n 1) + b per n 2
9.1. IL CONCETTO 215
. N
1 1 1 1
1; ; ; ; ;
2 3 4 5
a; aq; aq 2 ; aq 3 ; aq 4 ;
(i) Dato n non si conosce alcuna formula che ci dica qual pn ; in altre parole, la
successione fpn g non denibile in forma chiusa.
(ii) Dato pn non si conosce alcuna formula che ci dica qual pn+1 ; in altre parole, la
successione fpn g non denibile per ricorrenza.
(iii) Dato un numero primo p qualsiasi non si conosce alcuna formula che ci dia un
numero primo q maggiore di p; in altre parole, la conoscenza di un numero primo
non d alcuna informazione sui numeri primi successivi.
no a numeri ormai molto elevati per noi, ma pur sempre inizie rispetto allinnit di
tutti i numeri primi.
OfB Circa losservazione (iii), per secoli si cercata una regola che, dato un numero
primo p, permettesse di trovarne uno pi grande q > p secondo una funzione q = f (p).
Un celebre esempio di tale ricerca dato dai numeri primi di Mersenne. Un numero
primo si dice di Mersenne se pu essere scritto nella forma 2p 1 con p primo. Si pu
mostrare che se 2p 1 primo, allora anche p lo . Per secoli si creduto (o sperato)
che valesse il, ben pi interessante, converso: p primo implica 2p 1 primo. Tale
congettura fu denitivamente smentita nel 1536 quando Hudalricus Regius dimostr
che
211 1 = 2047 = 23 89;
trovando quindi il primo controesempio a tale congettura: p = 11 non la soddisfa. In
ogni caso i numeri di Mersenne sono tra i pi importanti numeri primi. In particolare,
il pi grande numero primo noto al 2010
243112609 1
che ha 12837064 cifre ed un numero di Mersenne (la cui primalit stata determinata
nel 2008). H
x y)x>y)x y 8x; y 2 R1
(i) crescente se
x y ) g (x) g (y) x; y 2 A; (9.9)
g (x) = k 8x 2 A:
ed strettamente crescente se
x > y =) U (x) > U (y) x; y 2 R1
+:
A questo riguardo, valgono considerazioni analoghe a quelle fatte nella Sezione 7.4.4
per funzioni di utilit su Rn . In particolare, anche qui si ha
stretta crescenza ) forte crescenza ) crescenza
nella quale si ripetono i due soli valori 1 e 1. La successione costante, con generico
elemento xn = 2 per ogni n 1,
f2; 2; 2; :::g (9.11)
costituita da soli 2 (la corrispondente f quindi la funzione costante f (n) = 2 per
ogni n 1).
Al riguardo importante limmagine
Im f = ff (n) : n 1g
della successione, che consta proprio dei valori che la successione assume, al netto delle
ripetizioni. Per esempio, limmagine della successione (9.10) f 1; 1g, mentre per la
successione costante (9.11) il singoletto f2g. Limmagine d quindi uninformazione
molto importante perch indica quali valori la successione eettivamente assume, al
netto delle ripetizioni: come abbiamo visto, possono essere molto pochi e ripetersi
in continuazione lungo la successione. Daltra parte, la successione (9.6) dei dispari
non contiene alcuna ripetizione, e infatti la sua immagine costituita da tutti i suoi
termini, ossia Im f = f2n 1 : n 1g.
Tramite limmagine, nella Sezione 7.4.3 avevamo studiato varie nozioni di limitatez-
za per funzioni. Nel caso speciale delle successioni, ossia delle funzioni f : N+ ! R,
tali nozioni generali assumono la seguente forma: una successione fxn g si dice
(i) superiormente limitata se esiste k 2 R tale che xn k per ogni n 1;
(ii) inferiormente limitata se esiste k 2 R tale che xn k per ogni n 1;
(iii) limitata se sia superiormente sia inferiormente limitata, ossia se esiste k > 0
tale che jxn j k per ogni n 1.
Per esempio, la successione fxn g = f( 1)n g limitata, mentre quella dei dispari
(9.6) lo solo inferiormente.
(ii) decrescente se
xn+1 xn 8n 1;
strettamente decrescente se
xn+1 < xn 8n 1;
220 CAPITOLO 9. SUCCESSIONI
(iii) costante se sia crescente sia decrescente, ossia se esiste k 2 R tale che
xn = k 8n 1:
(v) La successione
denitivamente costante. N
1 1 1
1; p ; p ; p ; :
2 4 8
Proseguendo conpi valori, si pu vericare che, per valori di n sempre pi grandi, i suoi
termini xn = 1= 2n 1 si avvicinano sempre pi, si dice tendono, al valore L = 0.
In questo caso si dice che la successione tende a 0 e si scrive
1
lim p = 0:
n!1 2n 1
f1; 3; 5; 7; g;
f 1; 1; 1; 1; g:
Al variare dei valori di n essa continua a oscillare tra i valori 1 e 1, senza avvicinarsi
(denitivamente) ad alcun particolare valore. In questo caso si dice che la successione
oscillante o irregolare: non ammette limite.
9.6.1 Convergenza
Cominciamo con la convergenza, cio col caso (i).
Denizione 62 Una successione fxn g converge a un punto L 2 R, in simboli xn ! L
o limn!1 xn = L, se per ogni " > 0 esiste n" 1 tale che
n n" =) jxn Lj < ": (9.12)
Il numero L si dice limite della successione.
Limplicazione (9.12) si pu riscrivere come
n n" =) d (xn ; L) < ":
Quindi, una successione fxn g converge a L quando, per ogni quantit ", quantunque
piccola (ma positiva), esiste un posto dordine n" (che dipende da "!) a partire dal
quale la distanza tra i termini xn della successione e il limite L sempre minore di ",
ossia d (xn ; L) < " per ogni n n" . Una successione fxn g che converge a un punto
L 2 R si dice convergente.
S detto che la posizione n" dipende da ". Inoltre, come dovrebbe risultare chiaro
dai prossimi Esempi 135 e 136, la scelta di n" non aatto univoca: se esiste una
posizione n" tale che jxn Lj < " per ogni n n" , lo stesso vale per qualsiasi posizione
successiva che pu anchessa essere scelta come n" . La scelta di quale tra queste
posizioni chiamare n" del tutto irrilevante: la denizione chiede che ne esista (almeno)
una. I due esempi che tra breve presenteremo dovrebbero chiarire la questione.
La denizione di convergenza si pu riscrivere anche con il linguaggio degli intorni.
Si tratta di una riscrittura molto importante dal punto di vista concettuale che merita
una menzione separata.
Denizione 63 Una successione fxn g converge a un punto L 2 R se per ogni intorno
B" (L) di L esiste n" 1 tale che
n n" ) xn 2 B" (L) ;
ovvero che
n n" ) L " < xn < L + ":
9.6. LIMITI E COMPORTAMENTO ASINTOTICO 223
OfB. La denizione richiede che il cadere denitivamente dentro avvenga per ogni
intorno di L: decisivo dunque che ci accada per intorni arbitrariamente piccoli (
facile cadere in un intorno enorme, di cile in uno piccolo piccolo). H
Quindi, se prendiamo come n" un intero qualsiasi maggiore di 1=", per esempio6 n" =
[1="] + 1, abbiamo
1
n n" ) 0 < < ";
n
e quindi 0 eettivamente il limite della successione. Per esempio, se " = 10 100 , si ha
n" = 10100 + 1. Si noti che avremmo potuto scegliere come n" qualsiasi intero maggiore
di 10100 + 1. N
n p o
Esempio 136 Consideriamo la successione (9.7), cio 1= 2 n 1 . Anche qui il
naturale candidato a esserne il limite 0. Verichiamolo. Sia " > 0. Si ha
1 1 n 1 1 1
p 0 < " () n 1 < " () 2 2 > () n > 1 + 2 log2
2n 1 2 2 " "
e quindi, preso come n" qualsiasi intero maggiore di 1 + 2 log2 " 1 , per esempio n" =
2 + 2 [log2 " 1 ], si ha
1
n n" ) 0 < p <"
2n 1
100
e quindi 0 il limite della successione. Per esempio, se " = 10 si ha n" = 2 +
2 [log2 10100 ] = 2 + 200 [log2 10] = 602. N
Abbiamo visto due esempi di successioni che convergono a 0. Tali successioni sono
dette innitesime (o nulle). Grazie al prossimo risultato, il calcolo dei loro limiti ha
particolare importanza.
Se: si supponga che limn!+1 d (L; xn ) = 0. Sia " > 0. Esiste n" 1 tale che
d (L; xn ) < " per ogni n n" . Quindi, xn 2 B" (L) per ogni n n" , come desiderato.
( 1)n ( 1)n 1
d (xn ; 1) = 1 + 1 = = ! 0;
n n n
9.6.2 Divergenza
Consideriamo ora la divergenza, cominciando con la divergenza positiva. Lidea della
denizione simile, mutatis mutandis, alle precedenti.
n nK ) xn > K:
9.6. LIMITI E COMPORTAMENTO ASINTOTICO 225
OfB. La denizione richiede che la disuguaglianza valga per ogni scalare K: decisivo
che ci accada per valori arbitrariamente grandi di K ( facile essere > K quando K
piccolo, sempre pi di cile quanto pi K grande). H
n nK =) xn < K:
Un analogo risultato vale per la divergenza negativa. Si noti come lipotesi xn > 0
denitivamente sia irrilevante per una successione che diverge positivamente poich
denitivamente la successione soddisfa sempre questa condizione.
Dim. Se. Sia 1=xn ! 0. Sia K > 0. Per la Denizione 62, esiste n1=K 1
tale 1=xn < 1=K per ogni n n1=K . Quindi, xn > K per ogni n n1=K , e per la
Denizione 64 si ha xn ! +1.
Solo se. Sia xn ! +1 e sia " > 0. Per la Denizione 64, esiste n1=" tale che
xn 1=" per ogni n n1=" . Quindi, 0 < 1=xn < " per ogni n n1=" e quindi
1=xn ! 0.
226 CAPITOLO 9. SUCCESSIONI
OfB. Un intorno B" (x) di un punto tanto pi piccolo quanto pi piccolo " >
0; un intorno (K; +1] di +1 tanto pi piccolo quanto pi grande K (e simili
considerazioni valgono per gli intorni [ 1; K) di 1). H
9.6. LIMITI E COMPORTAMENTO ASINTOTICO 227
Osservato che (K; +1] e che [ 1; K) sono aperti in R per ogni K 2 R, possiamo
dare un lemma che si riveler utile nel denire i limiti di successioni e di funzioni.
Dim. Siccome la dimostrazione di (ii) analoga, basta mostrare (i). Se Sia A non
superiormente limitato, cio sia privo di maggioranti. Sia (K; +1] un intorno di +1
con K 2 R. Poich A privo di maggioranti, in particolare K non lo . Esiste quindi
x 2 A tale che x > K, cio x 2 (K; +1] \ A e x 6= +1. Ne segue che +1 punto di
accumulazione di A (in ogni intorno di +1 cadono infatti punti di A diversi da +1).
Solo se Sia +1 punto di accumulazione di A. Mostriamo che A non possiede
maggioranti. Supponiamo, per contra, che K 2 R sia un maggiorante di A. Poich
+1 punto di accumulazione di A, lintorno (K; +1] di +1 possiede un punto
x 6= +1 tale che x 2 A. Quindi K < x, il che contraddice il fatto che K sia un
maggiorante di A.
Gli insiemi A tali che (a; +1) A per qualche a 2 R formano una classe impor-
tante di insiemi non superiormente limitati. Grazie al Lemma 98, per essi +1 punto
di accumulazione. In modo simile, 1 punto di accumulazione per gli insiemi A
tali che ( 1; a) A per qualche a 2 R.
n nU =) xn 2 U (L) :
OfB. Osserviamo che se L 2 R, nU dipende da un raggio " > 0 qualsiasi (in particolare
piccolo a piacere), e si pu quindi scrivere nU = n" : Se, invece, L = +1, nU dipende da
un numero reale K qualsiasi (in particolare arbitrariamente grande) e si pu scrivere
nU = nK , con K > 0 senza perdit di generalit. Per ultimo, se L = 1, nU dipende
da un numero reale K negativo qualsiasi (in particolare arbitrariamente grande in val-
ore assoluto) e, senza perdere generalit, si pu porre nU = nK con K < 0. Del resto,
quando L nito decisivo che la propriet valga anche per valori arbitrariamente
piccoli di ", quando L = 1 invece decisivo che la propriet valga anche per valori
arbitrariamente grandi in valore assoluto di K. H
Poniamo che la successione ammetta un limite L nito e un altro +1. Per ogni
" > 0 e ogni K > 0, esistono n" e nK tali che simultaneamente dovrebbe essere
L " < xn < L + " 8n n" e xn > K 8n nK :
Basta ora prendere K = L + " per avvedersi che, per n max fn" ; nK g, le due
disuguaglianze non possono coesistere.
Gli altri casi si trattano in modo analogo.
Dim. Supponiamo xn ! L. Per la Denizione 63, per ogni " > 0 esiste n" 1 tale
che xn 2 B" (L) per ogni n n" . Quindi, tranne al pi i valori xn con 1 n < n" ,
tutti gli elementi della successione appartengono a B" (L).
Viceversa, dato un intorno qualsiasi B" (L) di L, supponiamo che tutti i termini
della successione vi appartengano, tranne al pi un numero nito di essi. Indichiamo
con fxnk g, k = 1; 2; : : : ; m, linsieme degli elementi della successione che non apparten-
gono a B" (L). Detto n" = nm + 1, si ha che xn 2 B" (L) per ogni n n" . Poich ci
vero per ogni intorno B" (L) di L, per la Denizione 63 si ha che xn ! L.
Il prossimo classico risultato, il Teorema della permanenza del segno, mostra che
se una successione ha limite L non nullo, allora i termini della successione hanno
denitivamente lo stesso segno di L.
Teorema 101 (Permanenza del segno) Sia fxn g una successione che converge al
limite L 6= 0. Allora, esiste n 1 tale che xn ha lo stesso segno di L per ogni n n,
ossia
xn L > 0 8n n:
Analogamente, se xn ! +1 ( 1), allora esiste n tale che xn positiva (negativa)
per ogni n n.
Dim. Supponiamo L > 0 (largomento analogo vale se L < 0). Sia " 2 (0; L). Per la
Denizione 62 esiste n 1 tale che jxn Lj < " per ogni n n, ossia
Il Teorema della permanenza del segno rappresenta una propriet dei limiti rispetto
alla struttura dordine che vige in R. Diamo un altro semplice risultato dello stesso
tipo, lasciando la dimostrazione al lettore.
Dim. Supponiamo xn ! L. Posto " = 1, esiste n1 1 tale che xn 2 B1 (L) per ogni
n n1 . Sia M una costante tale che M > max [1; d (x1 ; L) ; : : : ; d (xn1 1 ; L)]. Si ha
d (xn ; L) < M per ogni n 1, ossia jxn Lj < M per ogni n 1. Ci implica che
L M < xn < L + M
Dim. Sia fxn g una successione crescente in R (la dimostrazione nel caso di decrescenza
analoga). La successione fxn g pu essere limitata oppure non limitata superiormente
( infatti inferiormente limitata poich x1 xn per ogni n 1).
Supponiamo che sia limitata. Vogliamo mostrare che convergente. Sia E lim-
magine della successione. Per ipotesi, esso un sottoinsieme limitato di R. Per il
Teorema di completezza dei reali, esiste sup E. Poniamo L = sup E e mostriamo che
xn ! L. Sia " > 0. Dal fatto che L lestremo superiore di E scendono due con-
seguenze (si ricordi la Proposizione 52): (i) L xn per ogni n 1, (ii) esiste un
elemento xn" di E tale che xn" > L ". Poich fxn g una successione crescente, ne
segue che
L xn xn" > L " 8n n"
e quindi xn 2 B" (L) per ogni n n" , come desiderato.
9.7. PROPRIET DEI LIMITI 231
Se fxn g non superiormente limitata, per ogni K > 0 esiste un elemento xnK tale
che xnK > K. Essendo crescente, si ha xn xnK > K per ogni n nK e quindi essa
diverge a +1.
Il Teorema 105 garantisce dunque che ogni successione monotona non pu essere
irregolare. Siamo ora in grado di enunciare e dimostrare il teorema anticipato sopra
sulla equivalenza di limitatezza e convergenza per le successioni monotone.
1 a
xn+1 = xn + 8n 2
2 xn
p
Teorema 107 (Erone) xn ! a.
1 a 1
xn+1 = xn + < (xn + xn ) = xn :
2 xn 2
7
p
Si pu anche prendere x1 = b con b compreso tra a e a: in tal modo si accelera la convergenza
della successione.
232 CAPITOLO 9. SUCCESSIONI
2 p
Inoltre, dalla disuguaglianza (x2n a) > 0 che sempre vera per ogni xn 6= a, si
deduce progressivamente che
x4n + a2 a2
x4n 2x2n a + a2 > 0 ; > 2a ; x 2
n + > 2a
x2n x2n
2
a2 a
x2n + 2 + 2a > 4a ; xn + > 4a;
xn xn
cio, in denitiva, che
2
a 1 p
x2n+1
xn + = > a e quindi xn+1 > a:
xn 4
p
(ii) Quando
p a > 1, x1 = a >8 a. A maggior ragione, per il
p precedente punto (i),
anche x2 < a. Quando invece 0 < a < 1, x2 = 21 (a + 1) > a perch, quadrando,
si ottiene
x1 = 2;
1 2 3
x2 = 2+ == 1; 5;
2 2 2
1 3 2 17
x3 = + = ' 1; 4166667;
2 2 3=2 12
1 17 2 577
x4 = + = ' 1; 4142156;
2 12 17=12 408
1 577 2 665857
x5 = + = ' 1; 4142135:
2 408 577=408 470832
8
Se a = 1 chiaro che xn = 1 per ogni n.
9.7. PROPRIET DEI LIMITI 233
p
(ii) Calcoliamo 428356 ' 654; 48911:
x1 = 428356 ; x2 ' 214178; 5 ; x3 ' 107090; 24 ;
x4 ' 53547; 115 ; x5 ' 26777; 619 ; x6 ' 13396; 807 ;
x7 ' 6714; 3905 ; x8 ' 3389; 0936 ; x9 ' 1757; 743 ;
x10 ' 1000; 7198 ; x11 = 714; 3838 ; x12 ' 656; 9999 ;
x13 ' 654; 4939 ; x14 ' 654; 4891:
Prendendo x1 = b = 1:000 si ha unaccelerazione della convergenza:
x2 ' 714; 178 ; x3 ' 656; 9834 ; x4 ' 654; 4938 ; x5 ' 654; 4891:
p
(iii) Per 0; 13 ' 0; 3605551 si ottiene:
x1 = 0; 13 ; x2 ' 0; 565 ; x3 ' 0; 3975442 ;
x4 ' 0; 3622759 ; x5 ' 0; 3605592 ; x6 ' 0; 360555:
Si noti che, essendo 0; 13 < 1, la decrescenza non si ha dallinizio ma solo a
partire dal secondo termine. N
y
4
2a/x n+1
a/x
n
1
0
O x x x
n+1 n
-1
-1 0 1 2 3 4 5
234 CAPITOLO 9. SUCCESSIONI
(ii) xn yn ! LH, purch LH non sia una forma di indeterminazione (1.23), cio
1 0 e 0 ( 1)
(iii) xn =yn ! L=H purch yn ; H 6= 0 e L=H non sia una forma di indeterminazione
(1.24), cio
1 0
e
1 0
Dim. (i) Sia xn ! L e yn ! H, con L; H 2 R. Ci signica che, per ogni " > 0,
esistono n1 e n2 tali che
xn + yn > K + L "
e, per larbitrariet di K + L " > 0, ne segue che xn + yn ! +1. Gli altri casi di
limite innito si trattano in maniera analoga.
(ii) Sia xn ! L e yn ! H, con x; y 2 R. Ci signica che, per ogni " > 0, esistono
n1 e n2 tali che
Inoltre, essendo convergente, fyn g limitata (si ricordi la Proposizione 104): jyn j b
per ogni n. Ora, per n n3 = max fn1 ; n2 g,
jxn yn LHj = jyn (xn L) + L (yn H)j jyn j jxn Lj + jLj jyn Hj < " (b + jLj)
risulta anche, per ogni K > 0, yn > K per n n2 . Ne segue che, per n n3 =
max fn1 ; n2 g,
xn yn > (L ") K
e, per larbitrariet di (L ") K > 0, si conclude che xn yn ! +1. Se L < 0 e
H = +1, xn yn < (L + ") K e quindi xn yn ! 1. Gli altri casi di limiti inniti si
trattano in modo analogo.
11 ; 00 ; (+1)0
si ha10 :
Il logaritmo cresce al crescere del suo argomento e perci loga (L + ") = loga L + con
> 0 e loga (L ") = loga L con > 0 e, detto il pi piccolo tra e
e, per larbitrariet di (si osservi che sia sia sono arbitrariamente piccole quando
lo "), segue lasserto. Quando 0 < a < 1, il logaritmo decresce al crescere del suo
argomento e si ragiona in modo analogo.
lim n = +1;
Come abbiamo anticipato, dai due limiti elementari sopra indicati, ricordando le
Proposizioni 112 e 113, se ne deducono moltissimi altri:
(iii) si ha: 8
< +1 se > 1
n
lim = 1 se = 1
: +
0 se 0 < < 1
e
+1 se > 1
lim log n =
1 se 0 < < 1
e molti altri ancora. Per esempio, si ha
7
lim 5n + n2 + 1 = +1 + 1 + 1 = +1;
nonch
3 1
lim n2 3n + 1 = lim n2 1 + 2 = +1 (1 0 + 0) = +1;
n n
e
5 7
n2 5n 7 n2 1 n n2 1 0 0 1
lim = lim 4 6
= = ;
2n2 + 4n + 6 n2 2 + n
+ n2
2+0+0 2
e
1
5 n
lim = [0 (5 0)] = 0;
2n2
e
n (n + 1) (n + 2) n n 1 + n1 n 1 + n2
lim = lim 1 2 4
(2n 1) (3n 2) (5n 4) 2n 1 2n 3n 1 3n
5n 1 5n
1 2
1+ n
1+ n 1 1 1
= lim 1 2 4
= =
30 1 2n
1 3n
1 5n
30 1 1 1 30
Forma di indeterminazione 1 1
Consideriamo la forma di indeterminazione 1 1. Per esempio, il limite della somma
xn + yn delle successioni del tipo xn = n e yn = n2 ricade sotto questa forma di
indeterminazione il che vieta il ricorso ai precedenti risultati. Si ha per
xn + yn = n n2 = n (1 n)
non esiste.
Dunque quando si presenta un caso del tipo 1 1, pu accadere che il limite
in discorso risulti +1 oppure 1 oppure che sia nito oppure che non esista. In
altre parole, pu accadere di tutto. La semplice constatazione che si tratta di 1 1
non consente di dir nulla del limite della somma11 . Nel caso 1 1 bisogna proprio
considerare le due successioni e, volta per volta, riuscire a trovare una maniera, che
molto spesso semplice, di aggirare lindeterminazione, come abbiamo visto negli
esempietti di poco fa. Lo stesso si pu ripetere per le altre forme di indeterminazione.
Forma di indeterminazione 0 1
Siano, per esempio, xn = 1=n e yn = n3 . Il limite del loro prodotto ha la forma 0 1,
e non possiamo quindi farci guidare dai precedenti risultati. Si ha per
1
lim xn yn = lim n3 = lim n2 = +1:
n
11
Se invece si fosse trattato di una forma del tipo 1 + a, anche senza sapere come sono fatte le due
successioni, avremmo potuto dire che il limite della loro somma 1.
242 CAPITOLO 9. SUCCESSIONI
1
Se xn = e yn = n,
n3
1 1
lim xn yn = lim 3
n = lim 2 = 0:
n n
Se xn = n3 e yn = 7=n3 ,
7
lim xn yn = lim n3 = lim 7 = 7
n3
Se xn = 1=n e yn = n(cos n + 2),
lim xn yn = lim(cos n + 2)
non esiste.
Ancora, solo il calcolo diretto del limite pu stabilirne il valore: la forma di
indeterminazione pu fornire risultati del tutto diversi.
xn n2 1 1
lim = lim = lim 1 = :
yn 1 + 2n2 n2
+2 2
Ancora, Se xn = n2 (sin n + 7) e yn = n2 ,
xn
lim = lim (sin n + 7)
yn
che non esiste.
Ci vale naturalmente anche per la forma di indeterminazione 0=0. Per esempio,
sia xn = 1=n e yn = 1=n2 . Si ha
1
xn n
lim = lim 1 = lim n = +1;
yn n2
12
Poich xn =yn = 1= (yn =xn ), per i due limiti vale la Proposizione 97.
9.8. ALGEBRA DEI LIMITI E LIMITI NOTEVOLI 243
1
yn n2 1
lim = lim 1 = lim = 0:
xn n
n
somma +1 L 1
+1 +1 +1 ??
H +1 L+H 1
1 ?? 1 1
Abbiamo due casi indeterminati su nove. Passiamo al prodotto: le celle interne danno
il risultato del limite fxn yn g :
dove nella terza riga si ha ambiguit circa il segno dellinnito, a seconda che yn tenda
a 0 per eccesso o per difetto (se xn ! L > 0 e yn ! 0 allora xn yn ! 1, ecc., con
le abituali regole dei segni). Per esempio,
1 1
lim 1 = lim n = +1 e lim 1 = lim ( n) = 1:
n n
(iv) Per le ultime tre basta considerarne il logaritmo per mettersi nel caso 0 1:
Teorema 114 (Criterio del confronto) Siano fxn g, fyn g e fzn g tre successioni.
Se, denitivamente,
yn xn zn (9.16)
e
lim yn = lim zn = L 2 R (9.17)
allora
lim xn = L
13
Criterio (test in inglese) sempre sinonimo di condizione su ciente.
14
Il Teorema detto spesso dei carabinieri: fxn g accompagnata dai due carabinieri fyn g e fzn g
(uno di qua e uno di l) ed costretta ad andare dove vanno loro.
246 CAPITOLO 9. SUCCESSIONI
Dim. Sia " > 0. Dalla (9.17) segue, per la Denizione 63, che esiste n1 tale che
yn 2 B" (L) per ogni n n1 , e che esiste n2 tale che zn 2 B" (L) per ogni n n2 .
Diciamo inne n3 il posto dordine a partire dal quale risulta yn xn zn . Posto
n = max fn1 ; n2 ; n3 g, si ha quindi sia yn 2 B" (L) sia zn 2 B" (L) sia yn xn zn per
ogni n n e, per la (9.16),
Il tipico uso del risultato nel dimostrare la convergenza di una successione mostran-
do che essa pu essere intrappolatatra due opportune successioni convergenti.
sin2 n 1
0 8n 1
n2 n2
Se consideriamo le successioni con yn = 0 e zn = 1=n2 , valgono le ipotesi (9.16) e (9.17)
con L = 0. Per il Criterio del confronto si ha lim xn = 0. N
1
Esempio 146 La successione con xn = n sin n converge a 0. Infatti
1 sin n 1
8n 1
n n n
ed entrambe le successioni 1=n ! 0. N
Lesempio che precede lascia intendere che, se fxn g una successione limitata e
yn ! 1, allora
xn
!0
yn
Infatti jM=yn j xn =yn jM=yn j dove M lestremo superiore di jxn j.
Teorema 115 (Criterio del rapporto) Se esiste un numero q < 1 tale che, den-
itivamente,
xn+1
q (9.18)
xn
allora la successione fxn g tende a 0.
9.9. CRITERI DI CONVERGENZA 247
Si noti che la propriet (9.18) vale senzaltro se il rapporto xn+1 =xn ammette limite
ed esso minore di 1. Infatti, se il limite dei rapporti L < 1, essi sono denitivamente
minori di L + per ogni > 0 e si pu sempre prendere in modo che L + < 1.
Si badi che il teorema non richiede semplicemente che il rapporto jxn+1 =xn j sia < 1,
cio
xn+1
lim <1
xn
ma che ne sia discosto, cio che sia minore di un numero q a sua volta minore di 1.
Inoltre, ricordando che xn ! L se e solo se xn L ! 0, possiamo anche aermare
che
xn+1 L
< q ) xn ! L
xn L
Grazie a questa semplice osservazione il Criterio del rapporto (nonch il Criterio della
radice che vedremo tra breve) si applica allo studio della convergenza xn ! L, bench
enunciato solo per xn ! 0.
qn 1
jx1 j xn qn 1
jx1 j 8n 2
Infatti, posto
nk
xn = n
e prendendo il rapporto tra due termini consecutivi (il valor assoluto irrilevante
visto che tutti i termini sono positivi), si ha
k k
xn+1 (n + 1)k n
n+1 1 1 1 1
= n+1
= = 1+ ! <1
xn nk n n
248 CAPITOLO 9. SUCCESSIONI
Teorema 116 (Criterio della radice) Se esiste un numero q < 1 tale che, almeno
denitivamente pn
jxn j q (9.20)
allora la successione fxn g tende a 0.
9.9. CRITERI DI CONVERGENZA 249
Anche per questo risultato si possono fare considerazioni simili a quelle viste per il
Criterio
np odel rapporto. In particolare, la propriet (9.20) vale senzaltro se la successione
n
jxn j ammette limite ed esso minore di 1, cio se
p
lim n jxn j < 1
Dim. Poniamo che la disuguaglianza valga a partire da n = 1. Da
pn
jxn j q
si trae immediatamente che jxn j q n cio che q n xn q n . Visto che, essendo
0 < q < 1, q n ! 0, il risultato segue dal Criterio del confronto.
Esempio 147 Sia
n
2n2 5n + 6
xn =
3n3 7n 3
Dato che s
n
n 2n2 5n + 6 2n2 5n + 6 2
= ! <1
3n3 7n 3 3n3 7n 3 3
si ha xn ! 0. N
p
Nel prossimo esempio si ha xn ! +1 e xn ! 1. Ci mostra limportanza della
n
Teorema 117 (Cauchy) La successione fxn g convergente se e solo se a ogni " > 0
si pu associare un intero n" 1 tale che
La condizione (9.21), che si pu riscrivere come d (xn ; xm ) < " per ogni n; m n,
detta condizione di Cauchy: il suo sussistere per ogni " > 0 dunque condizione
necessaria e su ciente di convergenza.
Indichiamo ora con A linsieme dei numeri reali denitivamente minori degli elementi
della successione e con B linsieme dei numeri che ne sono denitivamente maggiori.
(i) A e B non sono vuoti: A contiene almeno il precedente xn" " e B almeno
xn" + ".
(iii) sup A = inf B perch, come s detto sopra, xn" " 2 A e xn" + " 2 B per ogni
" > 0 e risulta (xn + ") (xn ") = 2" che arbitrariamente piccola.
9.11. IL NUMERO DI NEPERO 251
Esso la base pi naturale dei logaritmi che in tal modo acquistano pregevoli
propriet. Dora in avanti si assumer senza eccezioni e come base dei logaritmi e
molto spesso come base delle potenze.
Supponiamo, per induzione, che (9.23) valga per un certo valore n 2, cio si abbia:
dove la prima disuguaglianza, dovuta allipotesi induttiva, vale solo per a > 1.
Abbiamo quindi dimostrato che (9.23) vale anche per n + 1, che era quanto si voleva
dimostrare.
Risulta
a1 = 21 = 2 b1 = 22 = 4
3 2 9 3 3 27
a2 = 2
= 4
= 2; 25 b2 = 2
= 8
= 3; 375
11 10 11 11
a10 = 10
' 2; 59 b10 = 10
' 2; 85
e quindi il numero di Nepero compreso tra 2; 59 e 2; 85. Come gi abbiamo avvertito,
il numero e trascendente e vale 2; 71828:::.
(ii) Se an ! 0 e an 6= 0, si ha:
lim (1 + an )1=an = e
Basta porre an = 1=xn per ritrovare il precedente caso (i).
(iii) Se an ! 0 e an 6= 0, si ha:
log (1 + an )
lim =1
an
Basta prendere il logaritmo nel limite precedente. Pi in generale:
logb (1 + an )
lim = logb e 80 < b 6= 1
an
(iv) Se c > 0, yn ! 0 e yn 6= 0:
c yn 1
lim = log c
yn
Basta porre cyn 1 = an (cosicch anche an ! 0) per avvedersi che
c yn 1 an
=
yn logc (1 + an )
e che quindi ci si riduce al (reciproco del) caso precedente nel quale il limite
1= logc e = loge c = log c.
(vi) Se 2 R e zn ! 0, con zn 6= 0, si ha:
(1 + zn ) 1
lim =
zn
Laermazione ovvia per = 1. Se 6= 1 si pone an = (1 + zn ) 1 ovvero
1 + an = (1 + zn ) cio log (1 + an ) = log (1 + zn ) (col che anche an ! 0). Si
ha allora
log (1 + an ) log (1 + zn ) log (1 + zn ) zn
= =
an (1 + zn ) 1 zn (1 + zn ) 1
log (1 + an ) log (1 + zn )
e, dato che !1e ! 1, ne segue lasserto.
an zn
9.12. ORDINI DI CONVERGENZA E DI DIVERGENZA 255
La prossima denizione formalizza tale intuizione, importante sia dal punto di vista
concettuale sia per il calcolo.
Denizione 68 Siano fxn g e fyn g due successioni, con i termini della prima deni-
tivamente diversi da zero.
(i) Se
yn
!0
xn
diciamo che fyn g trascurabile rispetto a fxn g; in simboli
yn = o (xn )
256 CAPITOLO 9. SUCCESSIONI
(ii) Se
yn
! k 6= 0 (9.24)
xn
diciamo che fyn g dello stesso ordine o che confrontabile con fxn g; in simboli
yn xn
yn xn
Lemma 120 Siano fxn g e fyn g due successioni con termini denitivamente diversi
da zero. Allora,
yn xn 1
! k 6= 0 () ! 6= 0
xn yn k
Lasciamo al lettore la facile dimostrazione delle altre propriet.
9.12. ORDINI DI CONVERGENZA E DI DIVERGENZA 257
NB. (i) Aermare che una successione un o (1) signica semplicemente che essa tende
a 0: infatti, xn = o (1) signica che xn =1 = xn ! 0. (ii) Posto xn = n e yn = n+k, con
k > 0, le successioni fxn g e fyn g sono asintotiche. Infatti, per quanto grande possa
258 CAPITOLO 9. SUCCESSIONI
(i) se L 2 R, yn ! L se e solo se xn ! L;
(ii) se L = +1, yn ! +1 se e solo se xn ! +1;
(iii) se L = 1, yn ! 1 se e solo se xn ! 1;
Tutto ci porta a pensare che sia possibile sostituire xn con yn (o viceversa) nel
calcolo dei limiti. Tale possibilit allettante perch darebbe loccasione di sostituire
a una successione complicata una pi semplice che le asintotica.
Per rendere precisa lintuizione cominciamo con losservare che lequivalenza asin-
totica si conserva rispetto alle operazioni fondamentali.
(i) yn +zn xn +wn purch esista k > 0 tale che denitivamente18 jxn = (xn + wn )j
k;
(ii) yn zn xn wn ;
(iii) yn =zn xn =wn purch denitivamente zn 6= 0 e wn 6= 0.
Dim. (i) Si ha
yn + zn yn zn yn xn zn wn
= + = +
xn + wn xn + wn xn + wn xn xn + wn wn xn + wn
yn xn zn xn yn zn xn zn
= + 1 = +
xn xn + wn wn xn + wn xn wn xn + wn wn
Poich yn =xn ! 1 e zn =wn ! 1, si ha
yn zn
!0
xn wn
18
Per esempio, la condizione vale se fxn g e fwn g sono entrambe denitivamente positive.
9.12. ORDINI DI CONVERGENZA E DI DIVERGENZA 259
e quindi
yn zn xn yn zn xn yn zn
0 = k!0
xn wn xn + wn xn wn xn + wn xn wn
Per il Criterio del confronto,
yn zn xn
!0
xn wn xn + wn
e quindi, essendo zn =wn ! 1, si ha
yn + zn
!1
xn + wn
come desiderato.
(ii) e (iii) Si ha
yn zn yn zn
= !1
xn wn xn wn
e yn
zn yn wn yn wn
xn = = !1
wn
zn xn xn zn
poich yn =xn ! 1 e zn =wn ! 1.
Il prossimo semplicissimo lemma molto utile: nel calcolo di un limite bene
trascurare ci che trascurabile.
Lemma 122 Si ha
xn xn + o (xn )
Dim. Basta osservare che
xn + o (xn ) o (xn )
=1+ !1
xn xn
1 3
n2 7n + 3 2 + 2 = n2 + o n2 (2 + o (1)) 2n2 ! +1
n n
H
n (n + 1) (n + 2) (n + 3) n4 + o (n4 ) n4
= 4 =1!1
(n 1) (n 2) (n 3) (n 4) n + o (n4 ) n4
H
9.12. ORDINI DI CONVERGENZA E DI DIVERGENZA 261
n 1
lim e 7+
n
n 1 n n
e 7+ =e (7 + o (1)) 7e !0
n
H
purch i rapporti siano (denitivamente) ben deniti e non nulli. Quindi, una volta
stabilita lasintoticit dei rapporti yn =zn e xn =wn , si ha automaticamente anche
lasintoticit dei loro reciproci zn =yn e wn =xn .
e5n n7 4n2 + 3n
lim
6n + n8 n4 + 5n3
6n + n8 n4 + 5n3
lim 5n
e n7 4n2 + 3n
9.12.2 Terminologia
In ragione della loro importanza, per il confronto sia di successioni innitesime sia di
successioni divergenti vi una terminologia specica. In particolare,
(i) se due successioni innitesime fxn g e fyn g sono tali che yn = o (xn ), la successione
fyn g detta innitesima di ordine superiore rispetto a fxn g;
(ii) se due successioni divergenti fxn g e fyn g sono tali che yn = o (xn ), la successione
fyn g detta innita di ordine inferiore rispetto a fxn g.
(ii) nk = o ( n ) per ogni > 1, come gi provato col Criterio del rapporto. Si ha
n
= o nk se, invece, 0 < < 1.
logk2 n 1
k1
= k1 k2
!0
log n log n
Il prossimo lemma ripota due importanti confronti di inniti, che mostrano che gli
esponenziali sono inniti di ordine inferiore rispetto a quelli di tipo n! e nn . Si noti
che il lemma implica, grazie al Lemma 120, che n = o (nn ).
n
Lemma 123 Risulta = o (n!), con > 0, e n! = o (nn ).
19
Come annunicato nella Sezione 9.11, qui e nel resto del libro consideriamo solo logaritmi naturali.
9.12. ORDINI DI CONVERGENZA E DI DIVERGENZA 263
n
Dim. (i) Posto > 0, mostriamo che = o (n!). Si ponga
n
xn =
n!
sicch
n+1
xn+1 n!
= = !0
xn (n + 1)! n 1+n
n
Per il Criterio del rapporto, xn ! 0 e quindi = o (n!).
n!
xn =
nn
risulta
n
xn+1 (n + 1)! nn n 1 1
lim = lim = lim = lim n =
xn (n + 1)n+1 n! n+1 1 + n1 e
1
Poich e < 1, per il Criterio del rapporto si ha xn ! 0 e quindi n! = o (nn ).
e la scala discendente
1 1
n; n 2 ; ::; n k ; :::; log n; log2 n; :::; logk n; :::; log log n; log2 log n; :::; logk log n; :::
Esse danno dei campioni per il comportamento asintotico di un innito fxn g. Per
esempio, se xn log n, la successione fxn g asintoticamente logaritmica; se xn n2 ,
la successione fxn g asintoticamente quadratica, e cos via.
Sebbene per brevit omettiamo i dettagli, il Lemma 123 mostra che la scala
logaritmico-esponenziale pu essere notevolmente a nata con ordini di innito del
tipo n! e nn .
Teorema 124 Si ha
inniti numeri primi, sicch possiamo parlare della loro successione fpn g. Ma, nella
Sezione 9.1 avevamo osservato come, purtroppo, sia impossibile descrivere esplicita-
mente questa successione. Ci ha portato a interrogarsi sulla distribuzione dei numeri
primi in N. Sia : N+ ! R la successione il cui termine (n) il numero di numeri
primi minori o uguali a n. Per esempio
n 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
(n) 0 1 2 2 3 3 4 4 4 4 5 5 6 6 6
10 4 4; 3 0; 921
102 25 21; 7 1; 151
103 168 145 1; 161
104 1:229 1:086 1; 132
105 9:592 8:686 1; 104
1010 455:052:511 434:294:482 1; 048
1015 29:844:570:422:669 28:952:965:460:217 1; 031
1020 2:220:819:602:560:918:840 2:171:472:409:516:250:000 1; 023
Teorema 126 Si ha
pn n log n (9.31)
La successione fpn g dei numeri primi quindi asintotica alla successione fn log ng.
Ln-esimo numero primo ha, approssimativamente, valore n log n. Per esempio, con-
sultando le esistenti tavole dei numeri primi si scopre che per n = 100 si ha pn = 541
mentre la sua stima n log n = 460 (arrotondando per difetto). Similmente:
pn
n pn n log n n log n
Come si vede, il rapporto tra pn e la sua stima n log n rimane stabilmente prossimo a
1.
Poich pn ! 1, esiste n" tale che pn n" per n n" . Quindi, la (9.32) implica che
log pn
(pn ) 1 <" 8n n"
pn
log pn
n 1 <" 8n n"
pn
cio
log pn
n !1 (9.33)
pn
Da ci segue che
log pn
log n ! log 1 = 0
pn
cio log n + log log pn log pn ! 0. Poich log pn ! +1,
log n log log pn log n + log log pn log pn
+ 1= !0
log pn log pn log pn
Ma log log pn = log pn ! 0 (perch?), e quindi
log n
!1
log pn
Moltiplicando per la (9.33) si ottiene
n log n log pn log n
=n !1
pn pn log pn
il che prova la (9.31).
en = o (yn ) . (9.34)
NB. Il fatto che il rapporto xn =yn tenda a 1 non implica aatto che le p dierenze
jxn yn j siano trascurabili. Negli esempi test visti, entrambi gli errori n e n diver-
gono positivamente. Comunque, grazie alla (9.34) sappiamo che quando fen g diverge,
tale divergenza di ordine inferiore rispetto a fyn g O
Nello studio dei termini di errore molto utile la seguente nozione di O grande.
Denizione 70 Date due successioni fxn g e fyn g, se esiste k > 0 tale che deniti-
vamente
jyn j k jxn j
diciamo che fyn g asintoticamente dominata da fxn g. In simboli xn = O (yn ).
Si noti che il valore della costante k lasciato indeterminato: conta soltanto che
tale costante esista. Il prossimo lemma mostra alcuni semplici legami tra le relazioni
, o e O.
9.12. ORDINI DI CONVERGENZA E DI DIVERGENZA 269
Dim. (i) se yn xn allora, per ogni " > 0, esiste n" tale che
yn
1 <" 8n n"
xn
Dunque jyn j = jxn j < 1 + " per ogni n n" , e quindi denitivamente jyn j (1 + ") jxn j.
(ii) se yn = o (xn ) allora, per ogni " > 0, esiste n" tale che
jyn j
<" 8n n"
jxn j
e perci jyn j = jxn j < " per ogni n n" , e quindi denitivamente jyn j " jxn j.
Lemma 128 (i) yn = O (xn ) e xn = O (yn ) se e solo se esiste k > 0 tale che,
denitivamente,
1
jxn j jyn j k jxn j (9.35)
k
(ii) yn = O (xn ) e xn = O (yn ) implicano xn yn .
Dim. (i) yn = O (xn ) implica che esista k 0 > 0 tale che, denitivamente, jyn j k 0 jxn j,
mentre xn = O (yn ) implica che esista k 00 > 0 tale che, denitivamente, jxn j k 00 jyn j.
Ponendo k = max fk 0 ; k 00 g, si ottiene la (9.35). Lasciamo al lettore la dimostrazione
della (ii).
Denizione 72 La successione fyn g stima fxn g con termine di errore di ordine fzn g
se
xn = yn + O (zn )
ossia se en = O (zn ).
Dati due stimatori fyn0 g e fyn00 g di una stessa successione fxn g con errori e0n e e00n ,
se:
(i) e0n = O (e00n ), cio se il termine di errore dello stimatore fyn0 g asintoticamente
dominato da quello di fyn00 g, allora fyn0 g uno stimatore migliore di fxn g rispetto
a fyn00 g;
(ii) e0n e00n , cio se il termine di errore dello stimatore fyn0 g confrontabile con
quello di fyn00 g, allora fyn0 g uno stimatore equivalente di fxn g rispetto a fyn00 g.
Esempio 157 Se entrambi gli errori sono inniti, cio e0n ! +1 e e00n ! +1, e se
e0n = o (e00n ) allora e0n innito di ordine inferiore di e00n (per esempio, e0n = n e e00n = n2 ).
Invece, se entrambi gli errori sono innitesimi, cio e0n ! 0 e e00n ! 0, e se e0n = o (e00n )
allora e0n innitesimo di ordine superiore di e00n (per esempio, e0n = 1=n2 e e00n = 1=n).
In tutti e due i casi, lo stimatore yn0 migliore di yn00 . N
9.13. SUCCESSIONI IN RN 271
Esempio 158 Consideriamo le successioni e n= log n del Teorema dei numeri primi.
Poich n= log n, la (9.35) diventa qui
n n
= +o (9.36)
log n log n
cio en = o (n= log n). Tuttavia si riusciti a dimostrare che esiste una costante
2 (1; 2) tale che
n n
= +O (9.37)
log n log n
cosicch en = O (n= log n). Questultima valutazione del termine di errore pi
accurata della precedente22 . Infatti, per denizione esiste k > 0 tale che
n n 1
en k =k
log n log n log 1 n
9.13 Successioni in Rn
Prendiamo ora in esame successioni xk di vettori in Rn . Per esse diamo la seguente
denizione di limite che ricalca quella gi data per successioni in R. La dierenza
fondamentale che ogni elemento della successione un vettore xk = (xk1 ; xk2 ; :::; xkn ) 2
Rn e non uno scalare.
xk x ! 0 () xki Li ! 0 8i = 1; 2; : : : ; n; (9.38)
cio se e solo se le successioni xki delle singole componenti i convergono alla compo-
nente Li del vettore L.
La convergenza di una successione di vettori dunque ricondotta alla convergenza
delle singole componenti e perci non presenta alcuna di colt n di comprensione n
di calcolo.
M zn yn M 8n; (9.39)
Dim. Grazie alla (9.39), la (9.40) segue dalla Proposizione 102. Lasciamo al lettore
vericare la seconda parte dellenunciato.
Il prossimo risultato raccoglie alcune semplici, ma utili, propriet dei limiti superiori
e inferiori. Grazie al risultato precedente, le analoghe propriet viste per successioni
convergenti sono implicate da questi risultati per i limiti superiori e inferiori.
La (i) segue quindi dalla Proposizione 102. La (ii) segue dalla (i) usando le dualit
(9.41):
Esempio 162 (i) Lintervallo [ 1; 1] linsieme dei valori limite della successione
irregolare fsin ng , mentre f0; 1g linsieme dei valori limite della successione irregolare
f( 1)n g.
(ii) Il singoletto f0g lunico valore limite della successione convergente f1=ng. N
Il prossimo risultato mostra che linsieme dei valori limite incluso nellintervallo
determinato dai limiti superiore e inferiore.
Grazie alla disuguaglianza lim inf xn lim inf xn , lintervallo [lim inf xn ; lim sup xn ]
si pu equivalentemente scrivere come
NB. Finora abbiamo considerato successioni limitate. In realt, tutto quanto si es-
tende in modo naturale a successioni qualsiasi, una volta che si permetta ai limiti
superiori e inferiori di assumere valore innito. Per esempio, per la successione fng,
che diverge positivamente. si ha lim inf xn = lim sup xn = +1; per la successione
f en g, che diverge negativamente, si ha lim sup xn = lim inf xn = 1, mentre per la
successione irregolare f( 1)n ng si ha lim inf xn = 1 e lim sup xn = +1, cosicch
[lim inf xn ; lim sup xn ] = R. Lasciamo al lettore lestensione a successioni qualsiasi di
quanto visto per le limitate. O
276 CAPITOLO 9. SUCCESSIONI
Capitolo 10
Di norma le decisioni economiche si basano su variabili il cui valore sar noto so-
lo in futuro. Al momento della decisione gli agenti devono perci basarsi sulle loro
aspettative soggettive circa tali valori. Per tale ragione le aspettative sono centrali nel-
lanalisi economia e limportanza di questa componente soggettiva uno degli aspetti
che maggiormente la distinguono dalle scienze naturali. Nel capitolo diamo una prima
illustrazione della loro importanza facendo uso delle nozioni sulle successioni imparate
nellultimo capitolo.
10.1 Un mercato
Consideriamo un mercato, che indicheremo con M , di un bene agricolo, per esempio
le patate. Esso descritto da una curva di domanda D : [k1 ; k2 ] ! R e da una curva
di oerta S : [k1 ; k2 ] ! R, con 0 k1 < k2 . Limmagine D (p) la quantit di patate
complessivamente domandata al prezzo p dai consumatori, mentre limmagine S (p)
la quantit di patate complessivamente oerta al prezzo p dai produttori. Si assume
che entrambe tali quantit rispondano istantaneamente a variazioni del prezzo p di
mercato: in particolare, ci signica che i produttori sono in grado di aggiustare in
modo istantaneo la propria produzione al prezzo p.
Per semplicit, consideriamo funzioni lineari di domanda e oerta, cio
D (p) = p (M)
S (p) = a + bp
a
[k1 ; k2 ] = ; ; (10.1)
b
277
278 CAPITOLO 10. APPLICAZIONE: PREZZI E ASPETTATIVE
nel quale entrambe le quantit sono simultaneamente positive, vi possono essere scam-
bi: per questa ragione abbiamo considerato le funzioni di domanda e oerta come def-
inite soltanto su tale intervallo, sebbene dal punto di vista matematico siano denite
su tutta la retta reale.1
Denizione 75 Una coppia (p; q) 2 R2+ di prezzi e quantit si dice equilibrio del
mercato M se
q = D (p) = S (p) :
p = a + bp
16
14
S(p)
12
10
8 D(p)
0
O k k p
1 2
-1 -0.5 0 0.5 1 1.5 2 2.5 3
1
Si noti che, a nch sia non vuoto lintervallo (10.1), si deve avere a=b = , cio a b,
che una ulteriore condizione che i coe cienti delle curve di domanda e oerta devono rispettare.
10.2. RITARDI NELLA PRODUZIONE 279
D (pt ) = pt (Mt )
S (pt ) = a + pt
descrivono il mercato, che indicheremo con Mt , delle patate in ogni t. Oltre allipotesi
di produzione istantanea gi assunta per il mercato M , lo studio dei mercati Mt si
basa su due ulteriori ipotesi: (i) in ogni t i produttori e i consumatori sono gli stessi,
sicch i coe cienti , , a e b rimangono costanti nel tempo, e (ii) il bene scambiato
in ogni t, le patate, deperibile e non conservabile sino a t + 1: le quantit domandate
in t + 1 e in t sono quindi indipendenti, e lo stesso vale per le quantit oerte.
La nozione di equilibrio considera ora tutti i mercati Mt e non solo un singolo
mercato M . Per questa ragione si richiede che domanda e oerta si equilibrino in ogni
data t, sicch in luogo della coppia (p; q) di scalari della Denizione 75 si ha ora una
coppia di successioni.
qt = D (pt ) = S (pt ) 8t 1:
D (pt ) = pt (MRt )
S (Et 1 (pt )) = a + bEt 1 (pt )
280 CAPITOLO 10. APPLICAZIONE: PREZZI E ASPETTATIVE
D (pt ) = pt
S (pt 1 ) = a + bpt 1
2
Infatti, le aspettative sul prezzo iniziale p1 non possono basarsi su alcun prezzo precedentemente
osservato.
10.4. PIGRE, MA CORRETTE 281
Laspettativa E0 (p1 ) funge da innesco: una volta ssato un valore per E0 (p1 ),
dallequazione (10.7) scende il prezzo di equilibrio p1 , che a sua volta determina sia
laspettativa E1 (p2 ) tramite lequazione (10.5) sia il prezzo di equilibrio p2 tramite
lequazione (10.6), e cos via per i periodi successivi. Quindi, a partire da una data
aspettativa iniziale E0 (p1 ), le equazioni (10.5) e (10.6) permettono di determinare
per ricorrenza le successioni di equilibrio fpt g e fEt 1 (pt )g di prezzi e aspettative.
In particolare, in ogni t 2 si determinano i prezzi pt e si formano le aspettative
Et (pt+1 ).
Et 1 (pt ) = pt 8t 1
Et 1 (pt ) = pt () pt = pt 1 8t 1 (10.9)
La condizione di costanza
pt+1 = pt = p 8t 1 (10.10)
282 CAPITOLO 10. APPLICAZIONE: PREZZI E ASPETTATIVE
a b
p = p
ossia
a
p =
+b
Si ritrova quindi il prezzo di equilibrio (10.3) del mercato con produzione istantanea.
Esiste un valore di innescoE0 (p1 ) da cui, per ricorrenza, si ottiene la successione
costante pt = p di equilibrio uniperiodale per il mercato delle patate? Se cos non
fosse, tale successione costante sarebbe un mero fantasma teorico. Losservazione
cruciale per rispondere a questa domanda che la successione costante di prezzi si
realizza quando
E0 (p1 ) = p1 (10.11)
cio quando laspettativa iniziale E0 (p1 ) corretta, ossia uguale alleettivo prezzo
p1 di equilibrio uniperiodale. Infatti, dalla relazione (10.4) e dallipotesi di aspettative
classiche (10.5), segue che
a b a b
E0 (p1 ) = p1 () p1 = E0 (p1 ) = p1 () p1 = p (10.12)
a b a b a b a
p2 = E1 (p2 ) = p =
+b
1( a) ( + b) b ( a) a
= = =p
+b +b
Iterando si ha
E2 (p3 ) = p ;
a b a b
p3 = E2 (p3 ) = p =p ;
Et 1 (pt ) = p ;
a b a b
pt = Et 1 (pt ) = p =p
Et 1 (pt ) = pt = p 8t 1
sicch in ogni t i produttori hanno aspettative corrette sul prezzo futuro. Sebbene pi-
gre, le aspettative classiche si rivelano corrette quando laspettativa iniziale azzeccata.
In questo fortunato caso iniziale, sia esso dovuto alla bravura nellelaborazione delle
proprie informazioni oppure a una pi banale fortuna del principiante, la successiva
pigrizia ben meritata.
In tal caso, si ha
a
Et 1 (pt ) = pt = 8t 1
+b
et = pt Et 1 (pt )
Et 1 (pt ) = pt 8t 1
Grazie alla relazione (10.4), nel mercato delle patate lerrore di previsione et commes-
so in t dai produttori
a b
et = pt Et 1 (pt ) = + 1 Et 1 (pt )
cio, se e solo se
a
Et 1 (pt ) =
+b
Quindi, le aspettative sono razionali se e solo se
a
Et 1 (pt ) = pt = p = 8t 1
+b
Abbiamo quindi mostrato la seguente
Un altro aspetto notevole della Proposizione 133 che il prezzo di equilibrio uniperi-
odale che si determina con aspettative razionali nel mercato M Rt con ritardi nella
produzione lo stesso del mercato con produzione istantanea, ovvero fornito dalla
(10.3). Le aspettative razionali hanno quindi annullato, in equilibrio, le dierenze nella
tecnologia di produzione: avere una tecnologia tradizionale, con semina in t 1 e pro-
duzione in t, piuttosto che una fantascientica tecnologia che consenta la produzione
istantanea, non fa alcuna dierenza sui prezzi, e quindi sulle quantit, di equilibrio
uniperiodale del mercato delle patate.
Bench molto forte, lipotesi di aspettative razionali quindi molto importante per
comprendere come lanalisi della produzione e del consumo possa essere ingannevole
senza unadeguata analisi dellinterazione di mercato e delle sue dinamiche.
a b
pt = pt 1 8t 2
286 CAPITOLO 10. APPLICAZIONE: PREZZI E ASPETTATIVE
a b a 1 1 b
pt p = pt 1 =( a) pt 1
+b +b
ab b b
= pt 1 = (pt 1 p );
+b
cio
b
pt p = (pt 1 p) 8t 2 (10.13)
b
p2 p = (p1 p)
2
b b b b
p3 p = (p2 p )= (p1 p) = (p1 p)
3
b b
p4 p = (p3 p )= (p1 p)
t 1
t 1 b
pt p = ( 1) (p1 p)
Si noti che (
1 se t dispari
( 1)t 1
=
1 se t pari
Prendendo il valore assoluto si ha quindi
t 1
b
jpt p j= jp1 pj 8t 2 (10.14)
Il valore di lim pt dipende dal rapporto b= , cio dal rapporto tra le pendenze delle
curve di domanda e oerta. Dobbiamo quindi distinguere tre casi a seconda che tale
rapporto sia maggiore, uguale o minore di 1, cio a seconda che
b< ; b= ; b> :
10.6. CONVERGENZA DEI PREZZI 287
e quindi
lim pt = p ; (10.15)
nonch
lim Et 1 (pt ) = p : (10.16)
Quando b < , i prezzi di equilibrio del mercato con ritardi di produzione e le aspetta-
tive classiche tendono al prezzo p di equilibrio del mercato con produzione istantanea.
Ci vale per qualsiasi valore iniziale p1 , e quindi per ogni valore dellaspettativa iniziale
E0 (p1 ).
I limiti (10.15) e (10.16) mostrano che, per ogni possibile aspettativa iniziale, in
modo asintotico si ha ci che la Proposizione 132 aveva mostrato valere in ogni t
quando laspettativa iniziale corretta, ossia quando E0 (p1 ) = p1 . In particolare,
lerrore di previsione asintoticamente nullo:
et = pt Et 1 (pt ) ! 0
Le aspettative classiche, pur pigre, grazie alla condizione b < sono asintoticamente
razionali, lerrore di previsione via via meno rilevante.
pt p = ( 1)t 1
(p1 p) 8t 2:
E0 (p1 ) = p1 () p1 = p :
et = pt Et 1 (pt ) = pt pt 1 = ( 1)t 1
( 1)t 2
(p1 p ) = 2 ( 1)t 1
(p1 p)
Caso 3: b > La curva di domanda meno ripida della curva di oerta. Da b >
segue che
t 1
b
lim = +1:
Quando p1 6= p , le oscillazioni
t 1
t 1 b
pt p = ( 1) (p1 p)
t 1
b
lim jpt p j = jp1 p j lim = +1:
In questo caso lerrore nellaspettativa iniziale si propaga in modo sempre pi grave, de-
terminando una spirale esplosiva di prezzi. Quando b > , la pigrizia delle aspettative
classiche porta molto lontano dalle aspettative razionali.
Et 1 (pt ) Et 2 (pt 1 )
pt 1 Et 2 (pt 1 ) :
Periodo dopo periodo, le aspettative sono aggiornate in base agli errori di previsione
commessi. Se = 1 si torna al caso classico Et 1 (pt ) = pt 1 . In generale, per
10.7. ASPETTATIVE ADATTIVE 289
Si ha dunque
X
t 1
Et 1 (pt ) = (1 )i 1
pt i + (1 )t 1
E0 (p1 ) : (10.18)
i=1
Le aspettative adattive dipendono sia dallaspettativa iniziale E0 (p1 ) sia dalla media
pesata
X
t 1
(1 )i 1 pt i
i=1
dei prezzi passati, nella quale i prezzi pi recenti ricevono un peso maggiore rispetto
ai pi remoti.
Poich 2 (0; 1), si ha limt!1 (1 )t 1 = 0 e, al crescere di t, il termine (1 )t 1
diventa via via pi piccolo. Ne segue che laspettativa iniziale E0 (p1 ) diventa, al
crescere di t, sempre meno rilevante per la formazione dellaspettativa Et 1 (pt ), mentre
diventano prevalenti i prezzi passati.
Si noti che nella (10.18) intervengono tutti i prezzi passati, pur se maggiore il
peso dei pi recenti. Ci implica che le aspettative estrapolative del tipo (10.8) non
siano adattive perch esse considerano solo gli ultimi prezzi (per esempio, in (10.8)
solo quelli degli ultimi due periodi).
Et 1 (pt ) = pt 8t 1
se e solo se
pt+1 pt = [pt pt ] = 0 8t 1
ossia, se e solo se
pt+1 = pt 8t 1:
290 CAPITOLO 10. APPLICAZIONE: PREZZI E ASPETTATIVE
Si ritrova quindi la condizione (10.10) vista nella Sezione 10.4 per il caso speciale
delle aspettative classiche. Come il lettore pu agevolmente vericare, si pu quindi
ripetere verbatim lanalisi allora svolta e mostrare che la Proposizione 132 vale, molto
pi in generale, per le aspettative adattive. Esse sono quindi razionali se e solo se
laspettativa iniziale corretta, cio E0 (p1 ) = p1 . La correttezza dellaspettativa
iniziale caratterizza la razionalit delle aspettative adattive, delle quali le aspettative
classiche sono un caso speciale.
Da quanto appena visto segue che le aspettative adattive sono razionali se e solo
se
pt = p 8t 1;
dove, al solito, p = ( a) = ( + b) il prezzo stazionario. Nella Sezione 10.6 si era
visto in quali condizioni il prezzo di equilibrio con aspettative classiche convergesse al
prezzo stazionario. Generalizziamo lanalisi al caso di aspettative adattive: al tal ne,
si noti che la relazione di equilibrio (10.4) si pu riscrivere come
a
Et 1 (pt ) = pt :
b b
Sostituendo questultima relazione nella (10.17) si ottiene
a
pt 1 pt = pt 1 + pt 1 ;
b b b b
ossia
b a
pt 1 pt = pt 1 1+
b b
il che implica
+b a
pt = 1 pt 1 + :
+b a a
pt p = 1 pt 1 + =
+b
+b 1
= 1 pt 1 +( a) =
+b
(1 ) b a
= pt 1 + (b (1 )) =
( + b)
(1 ) b a
= pt 1 =
+b
(1 ) b
= (pt 1 p ):
10.7. ASPETTATIVE ADATTIVE 291
e si devono quindi distinguere tre casi a seconda che esso sia maggiore, uguale o minore
di 1, cio a seconda che
j b (1 ) j< ; j b (1 ) j= ; j b (1 ) j>
Ricordando quanto visto nella Sezione 10.6, facile vedere che nel primo caso si ha
lim pt = p ;
cio i prezzi convergono al prezzo stazionario, che il prezzo di equilibrio con aspet-
tative razionali. Nel secondo caso i prezzi sono oscillanti, mentre nel terzo caso essi
divergono (in valor assoluto).
Consideriamo pi da vicino il caso di convergenza, il pi interessante dal punto di
vista teorico perch in esso le aspettative sono asintoticamente razionali, indipenden-
temente dal valore dellaspettativa iniziale. Si ha
b 2
j b (1 ) j< () < b (1 ) < () 1< < :
considerata nel primo caso studiato nella Sezione 10.6. Per aspettative adattive non
classiche, cio con 2 (0; 1), vale la disuguaglianza
2
> 1:
lim pt = p
Serie numeriche
11.1 Il concetto
Lidea che qui vogliamo sviluppare riguarda, grossolanamente, la possibilit di som-
mare inniti addendi. Per fare un esempio rudimentale, immaginiamo un bastone
lungo 1 metro e di tagliarlo a met, ottenendo cos due pezzi lunghi 1=2; di tagliare
poi il secondo pezzo a met, ottenendo due pezzi lunghi 1=4; di tagliare ancora il secon-
do pezzo, ottenendone due lunghi 1=8, e di proseguire idealmente, senza fermarsi mai.
Prescindendo da volgari contingenze concrete (la segatura che si forma, dopo un po
diventa quasi impossibile continuare a tagliare un moncherino lungo pochi millimetri,
ecc.), avremmo inniti pezzi di lunghezze 1=2, 1=4, 1=8, ... nei quali stato suddiviso
loriginario bastone di 1 metro. piuttosto naturale immaginare che
1 1 1 1
+ + + + + = 1; (11.1)
2 4 8 2n
cio che, ricomponendo i singoli pezzi, si ritrovi il metro di partenza.
Ci apprestiamo a dare un contenuto preciso a uguaglianze come la (11.1). Immag-
iniamo dunque una successione fxn g e di volerne sommare tutti i termini, cio di
voler eettuare loperazione
X
1
x1 + x2 + + xn + = xn :
n=1
293
294 CAPITOLO 11. SERIE NUMERICHE
nuova operazione di somma di inniti addendi, che diversa dalla somma ordinaria1
(e ce ne accorgeremo), sommeremo un numero nito di addendi, diciamo n, faremo
tendere n allinnito e assumeremo il limite, se esiste, come valore da assegnare alla
serie. Stiamo dunque pensando di costruire una nuova successione fsn g cos denita:
s1 = x 1 (11.2)
s2 = x 1 + x 2
s3 = x 1 + x 2 + x 3
sn = x 1 + + xn
se lim sn = S 2 R,
P
1
(ii) positivamente divergente, in simboli xn = +1, se lim sn = +1,
n=1
P
1
(iii) negativamente divergente, in simboli xn = 1, se lim sn = 1,
n=1
sn = 1| + 1 +{z + 1} = n + 1 ! +1
n+1 volte
sn qsn = 1 + q + q 2 + q 3 + + qn q 1 + q + q2 + q3 + + qn
= 1 + q + q2 + q3 + + qn q + q2 + q3 + + q n+1 = 1 q n+1
si ha
(1 q) sn = 1 q n+1
e quindi, essendo q 6= 1,
1 q n+1
sn =
1 q
Ne segue che
X
1
1 q n+1
q n = lim
n=0
n!+1 1 q
Lo studio di tale limite devessere separato in vari casi:
(iii) se q = 1 le somme parziali di ordine pari sono nulle mentre quelle di ordine
dispari sono uguali a 1. La successione da esse formate quindi irregolare.
dove 2 (0; 1) il fattore soggettivo di sconto. Alla luce di quanto appena visto, la
(11.4) la serie
X1
t 1
ut (xt ) (11.5)
t=1
X
1
t 1
U (x) = ut (xt ) (11.6)
t=1
per ogni intero k > 1: la dierenza tra le due somme non altro che il totale delle
modicazioni che si sono apportate.
Rispetto alle operazioni fondamentali si ha:
X
1 X
1
cxn = c xn 8c 2 R
n=1 n=1
Proposizione 135 Ogni serie con termini positivi convergente o divergente positi-
vamente. In particolare, essa convergente se e solo se superiormente limitata5 .
Si noti che la (i) la contronominale della (ii), e viceversa: infatti, grazie alla
Proposizione 135, per una serie a termini positivi la negazione della convergenza la
divergenza positiva6 . Per la loro utilit le abbiamo enunciate entrambe, ma si tratta
della stessa propriet vista in modi equivalenti.
X1
1
n=0
n!
1 1
< :
n! (n 1) n
che il generico termine della serie di Mengoli che sappiamo convergere. Vedremo
successivamente che la sua somma il numero e di Nepero. N
5
Per denizione, la serie superiormente limitata quando lo la successione delle somme parziali,
esiste cio k > 0 tale che jsn j k per ogni n 1.
6
Si ricordi che, date due propriet p e q, limplicazione :q =) :p la contronominale
dellimplicazione originaria p =) q.
7
Si ricordi che 0! = 1. Per questa ragione facciamo partire la serie da n = 0. Quando la scelta
possibile (per esempio, non questo il caso per la serie armonica, che non denita per n = 0),
la scelta di far partire una serie da n = 0 oppure P da n = 1 di pura comodit. In questo caso
1
partiamo
P1 da n = 0 perch, come vederemo, si ha n=0 1=n! = e, unespressione pi elegante di
n=1 1=n! = e 1.
300 CAPITOLO 11. SERIE NUMERICHE
che il generico termine della serie di Mengoli che sappiamo convergere8 . Se > 2,
1 1
< 2
n n
e perci si ha ancora convergenza. Inne, si pu vedere, ma la cosa pi delicata,
che la serie armonica generalizzata converge anche per tutti i valori di 2 (1; 2). N
la convergenza della serie geometrica di ragione 2=5 garantisce, per il Criterio del
confronto, la convergenza della serie. N
P
Dunque la serie 1 n=1 n diverge per ogni 1 e converge per ogni > 1.
Il caso = 1 cos lultimo caso di divergenza: basta aumentare di un nonnulla
lesponente, da 1 a 1 + " con " > 0, e la serie converge. Ci lascia intuire come la
divergenza sia estremamente lenta, come il lettore pu controllare calcolando alcune
delle somme parziali9 . Questa intuizione resa precisa dal prossimo bel risultato.
8
P1 2 2
Risulta precisamente n=1 1=n = =6, ma non abbiamo qui gli strumenti per dimostrare
questo notevole risultato.
9
Un illustre professore parlava di innito cadaverico.
11.3. SERIE CON TERMINI POSITIVI 301
Proposizione 137 Si ha
1 1 1
1+ + + + log n: (11.7)
2 3 n
In altre parole la successione delle somme parziali della serie armonica asintotica
con il logaritmo.
Dim. La dimostrazione del risultato usa nozioni di integrazione che saranno esposte
nel Capitolo 24. Sia : [0; +1) ! R la funzione denita come
1
(x) = 8x 2 [i 1; i)
i
per i 1. Quindi (x) = 1 se x 2 [0; 1), (x) = 1=2 se x 2 [1; 2), e cos via. Inoltre,
facile vedere che
1 1
(x) 8x > 0. (11.8)
x+1 x
La funzione a scala e quindi, grazie alla Proposizione 377, si ha
X
n Z n
1
= (x) dx 8k = 1; :::; n
i=k
i k 1
Il Criterio del confronto ha una bella e utile versione asintotica, basata sul confronto
asintotico dei termini delle successioni.
P1 P1
Proposizione 138 (Criterio del confronto asintotico) Siano n=1 xn e n=1 yn
due serie con i termini positivi.
302 CAPITOLO 11. SERIE NUMERICHE
P1 P
(i) Se xn yn , le serie xn e 1n=1 yn hanno lo stesso carattere.
n=1
P P1
(ii) Qualora yn = o (xn ), la serie 1n=1 yn converge se n=1 xn converge.
Dim. (i) Poich xn yn , per ogni " > 0 esiste n" 1 tale che11
xn
1 " 1+" 8n n" .
yn
Per ogni n n" si ha quindi
X
n nX
" 1 Xn
xk
nX
" 1 X
n X
n
xk = xk + yk xk + (1 + ") yk c + (1 + ") yk (11.9)
k=1 k=1 k=n
yk k=1 k=n" k=n"
"
e
X
n nX
" 1 Xn
xk X
n
xk = xk + yk c + (1 ") yk (11.10)
k=1 k=1 k=n
yk k=n"
"
Pn" 1 P
dovePsi posto c = xk . Il carattere della serie 1
n=1 n=1 yn lo stesso della se-
1
rie k=n" yPk perch i primi termini di una serie sono irrelevanti
P1 per il suo carattere.
1
Quindi,Pse n=1 yn converge, dalla (11.9) segue che anche n=1 xnP converge, men-
tre se 1 y
n=1 n diverge positivamente, dalla (11.10) segue che anche 1
n=1 xn diverge
positivamente.
(ii) Sia yn = o (xn ). Poich yn = o (xn ), per ogni " > 0 esiste n" 1 tale che
yn "xn 8n n"
1 1 1 1 1 X1
1
+ + + + + = = +1
2 3 5 7 11 p
n=1 n
Il Teorema di Eulero implica la divergenza della serie armonica per il Criterio del
confronto poich 1=pn 1=n per ogni n (si ha 1=p1 = 1=2 1, 1=p2 = 1=3 1=2,
1=p3 = 1=5 1=3, 1=p4 = 1=7 1=4, e cos via). Un momento di riessione dovrebbe
essere su ciente per rendersi conto di quanto il Teorema di Eulero sia pi potente: in
esso si sommano solo i reciproci dei numeri primi, rispetto al risultato di divergenza
della serie armonica in cui si sommano i reciproci di tutti i numeri naturali, sia primi
sia composti.
Il Teorema di Eulero conferma linnit dei numeri primi e mostra che sono densi
in N, scappandoa
P1 +1 meno rapidamente delle potenze n , con > 1, per le quali
si ha i=1 1=n < +1. P Si noti che per il Criterio del confronto da questultima
convergenza segue che nn=1 1=pn < +1 per ogni > 1.
Chiudiamo lo studio del Criterio del confronto con un importante esempio eco-
nomico.
12
Si noti che la serie inizia con n = 2 perch per n = 1 il termine non denito. Naturalmente, ci
irrilevante per il carattere della serie.
304 CAPITOLO 11. SERIE NUMERICHE
converge. Tornando a quanto visto nellEsempio 165 possiamo concludere che la serie
(11.5) converge se e solo se < 1. Il lettore curioso di sapere che cosa accade quando
! 1, cio quando la pazienza diventa innita, trova risposta nel profondo Teorema
di Frobenius-Littlewood della Sezione 23.2.4. N
Proposizione
P1 140 (Criterio del rapporto nella forma limite elementare) Sia
n=1 xn una serie con i termini positivi e non nulli, e supponiamo che il limite
lim xn+1 =xn esista.
(i) Se
xn+1
lim <1
xn
la serie converge.
(ii) Se
xn+1
lim >1
xn
la serie diverge positivamente.
(ii) La serie
X
1
2n!
n=1
3n
diverge positivamente. Infatti,
2(n+1)!
xn+1 3n+1 2 (n + 1)! 3n 1 (n + 1)! 1
= 2n!
= n+1
= = (n + 1) ! +1
xn 3n
3 2n! 3 n! 3
Si badi che il teorema richiede che i rapporti siano minori di un numero a sua volta
minore di 1 e non semplicemente che siano minori di 1. Al riguardo si osservi che per
la serie armonica i rapporti sono
1
n+1 n
1 = ;
n
n+1
Dim. Da xn+1 qxn si deduce, come nellanalogo criterio per le successioni che 0 <
xn q n 1 x1 e il primo asserto segue dalla Proposizione 102. Se invece xn+1 =xn 1,
cio se xn+1 xn > 0, fxn g crescente e perci non pu tendere a 0.
molto utile riscrivere il Criterio del rapporto usando i limiti superiori e inferiori
introdotti nella Sezione 9.14.
Lemma 142 Esiste q < 1 tale che denitivamente valga la (11.11) se e solo se
xn+1
lim sup <1 (11.12)
xn
Dim. Solo se. Supponiamo che esista q < 1 tale che denitivamente valga la (11.11).
Esiste n tale che xn+1 =xn q per ogni n n. Quindi, per ogni tale n si ha
xk+1
sup q
k n xk
il che implica
xn+1 xk+1
lim sup = lim sup q<1
xn n!1 k n xk
cio
xk+1
L " < sup <L+" 8n n
k n xk
Se prendiamo " su cientemente piccolo di modo che L + " < 1, ponendo q = L + " si
ottiene la condizione cercata.
Tutto ci porta al seguente corollario, molto comodo nel far di conto, in cui il
Criterio del rapporto espresso in termini di limiti.
P1
Corollario 143 (Criterio del rapporto nella forma limite) Sia n=1 xn una se-
rie con i termini positivi e non nulli.
(i) Se
xn+1
lim sup <1
xn
la serie converge.
(ii) Se
xn+1
lim inf >1
xn
la serie diverge positivamente.
Si noti che, grazie al Lemma 142, il punto (i) equivalente al punto (i) della
Proposizione 141. Invece, per quanto visto appena sopra, il punto (ii) pi debole
del punto (ii) della Proposizione 141 perch la condizione (11.13) solo su ciente, ma
non necessaria, per avere denitivamente xn+1 =xn 1.
Come mostrano i prossimi esempi, questa forma del Criterio del rapporto parti-
colarmente utile quando esiste il limite
xn+1
lim
xn
308 CAPITOLO 11. SERIE NUMERICHE
cio quando
xn+1 xn+1 xn+1
lim = lim sup = lim inf
xn xn xn
In tal caso notevole, il Criterio del rapporto assume lutile forma tripartita della
Proposizione 140:
(i) se
xn+1
lim <1
xn
la serie converge;
(ii) se
xn+1
lim >1
xn
la serie diverge positivamente;
(iii) se
xn+1
lim =1
xn
il criterio fallisce e non d alcuna indicazione circa il carattere della serie.
(ii) La serie
X
1
xn
n=0
n!
converge per ogni x > 0. Infatti per n 1 si ha
xn+1 n! x
n
= !0 8x > 0:
(n + 1)! x n+1
11.3. SERIE CON TERMINI POSITIVI 309
(iii) La serie
X
1
xn
n=1
n
converge per ogni 0 < x < 1. Infatti
xn+1 n n
n
= x!x
n+1 x n+1
che ovviamente < 1 quando 0 < x < 1. N
Come per la forma limite del Criterio del rapporto, anche quella del Criterio della
p
radice particolarmente utile quando esiste lim n xn . Esso assume allora la seguente
forma tripartita:
(i) se
p
lim n
xn < 1
la serie converge;
(ii) se
p
lim n
xn > 1
la serie diverge positivamente;
(iii) se
p
lim n
xn = 1
il criterio fallisce e non d alcuna indicazione circa il carattere della serie.
Al pari dellanaloga forma tripartita del Criterio del rapporto, anche per il Criterio
della radice la versione tripartita ne la forma pi utile a livello operativo. Ma,
ricordando che fatti non foste a viver come bruti ma per seguir virtute e canoscenza,
ci auguriamo che il lettore voglia sempre tenere a mente i fondamenti teorici del criterio.
converge perch r
n qn q
n
= ! 0:
n n
P p
(ii) Sia 0 q < 1: La serie 1 k n
n=1 n q converge per ogni k: infatti
n
nk q n = qnk=n !
q visto che nk=n ! 1 (dato che log nk=n = (k=n) log n ! 0). N
11.3. SERIE CON TERMINI POSITIVI 311
cio:
1 1 1 1 1 1 1
+1+ + + + + + +
2 8 4 32 16 128 64
Si ha 8 1
>
< 2(n+1) 2
xn+1 1 = 2 se n dispari
= 2n
1
xn >
: 2n+1
1 = 18 se n pari
2n 2
e
1
p 2p
se n dispari
n
xn = n
4
2
se n pari
15
Si veda Rudin (1976) p. 67.
312 CAPITOLO 11. SERIE NUMERICHE
sicch
xn+1 xn+1 1
lim sup =2 , lim inf =
xn xn 8
e
p 1
lim sup n
xn =
2
Il Criterio del rapporto fallisce, mentre il Criterio della radice garantisce la convergenza
della serie. N
Nonostante la maggior potenza del Criterio della radice, il Criterio del rapporto
rimane comunque un utile strumento perch in generale molto pi semplice calcolare
il limite di rapporti che di radici. Il Criterio della radice s pi potente dal punto di
vista teorico, ma risulta di pi di cile applicabilit dal punto di vista operativo.
Alla luce di tutto ci, in concreto nellapplicare i criteri la prima cosa da fare
vericare se lim xn+1 =xn esiste e, nel caso, calcolarlo. In tale evenienza, grazie alla
p
(11.18) sappiamo anche il valore di lim n xn e possiamo quindi giovarci della potenza
del Criterio della radice.
Se, purtroppo, lim xn+1 =xn non esiste e siamo al pi in grado di determinare
lim sup xn+1 =xn e lim inf xn+1 =xn , o ci rassegniamo alla minor potenza del Criterio
del rapporto (rischiando il fallimento come nel precedente esempio), oppure cerchiamo
p
di calcolare direttamente lim sup n xn , con la speranza che esso esista (come nel prece-
dente esempio), cos che il Criterio della radice si possa applicare nella pi comoda
forma tripartita.
Da ultimo si osservi che, per quanto potente, il Criterio della radice (e, a fortiori,
il meno potente Criterio del rapporto) fornisce solo una condizione su ciente, ma non
necessaria per la convergenza, come mostra il prossimo esempio.
Grazie alla (11.19), possiamo concludere che serie convergenti i cui termini conver-
gono a zero con velocit inferiori alla geometrica, cio tali che q n = o (xn ), sono al di
fuori della portata del Criterio della radice. Per esempio, per ogni numero naturale
k 2 si ha
qn
1 ! 0
nk
P1
e quindi q n = o n k . Per determinare la convergenza della serie n=1 n k , il Criterio
della radice quindi inutile. Ci confermato dal fatto che
r
n 1
lim =1
nk
ma grazie alla Proposizione 147 possiamo capire la ragione del fallimento del Criterio
della radice.
Proposizione 148 Si ha
X1
1
=e (11.20)
n=0
n!
314 CAPITOLO 11. SERIE NUMERICHE
1
n Xn
n 1 Xn
1 n! 1
1+ = k
=
n k=0
k n k=0
k! (n k)! nk
Daltra parte
n! k
= n (n 1) (n k + 1) n
| {z n} = n
(n k)! | {z }
k volte k volte
Quindi,
n! 1
1
(n k)! nk
il che implica
1
n Xn
1 n! 1 Xn
1
1+ =
n k=0
k! (n k)! nk k=0
k!
Ne segue che
X1
1
e . (11.21)
n=0
n!
Per ogni k 1 si ha
n! 1
lim =1 (11.22)
n!1 (n k)! nk
Infatti
n!1 n (n k) (n k + 1) nk
k
= k
=1
(n k)! n n nk
Fissiamo m 1. Per ogni n > m si ha:
1
n Xn
1 n! 1 Xm
1 n! 1 Xn
1 n! 1
1+ = = +
n k=0
k! (n k)! nk k=0
k! (n k)! nk k=m+1 k! (n k)! nk
Xm
1 n! 1
k=0
k! (n k)! nk
1
n Xm
1 n! 1 Xm
1 n! 1 Xm
1
e = lim 1+ lim k
= lim =
n!1 n n!1
k=0
k! (n k)! n k=0
k! n!1 (n k)! nk k=0
k!
x n X
1
xn
x
e = lim 1+ = (11.23)
n!1 n n=0
n!
Luguaglianza (11.23) vale per ogni scalare x e si riduce alla (11.20) nel caso speciale
x = 1. Si noti la notevolissima espressione
X
1
xn x2 x3 xn
x
e = =1+x+ + + + + (11.24)
n=0
n! 2 3! n!
X
1
della funzione esponenziale tramite una serie. Tra breve vedremo che xn =n! una
n=0
serie di potenze. Per questa ragione, luguaglianza (11.24) detta sviluppo in serie di
potenze della funzione esponenziale. un risultato tanto elegante quanto importante,
che permette di scomporrela funzione esponenziale in una somma (seppur innita)
di funzioni elementari quali le potenze xn .
Studieremo con maggiore generalit gli sviluppi in serie con gli strumenti del
Calcolo dierenziale, di cui gli sviluppi in serie sono una delle applicazioni pi notevoli.
Il prossimo risultato mostra che la convergenza della serie dei valori assoluti, veri-
cabile con i criteri test visti, garantisce quella della ben pi selvatica serie originale,
con segni qualsiasi.
P1 P1
Teorema 150 Se n=1 xn converge assolutamente, allora n=1 xn converge.
316 CAPITOLO 11. SERIE NUMERICHE
La classe delle serie assolutamente convergenti quindi contenuta in quella delle se-
rie convergenti. Come si vedr nella Sezione 11.6, tale sottoclasse ha fondamentali
propriet di regolarit rispetto alle serie convergenti di segno qualsiasi che non sono
assolutamente convergenti. In altre parole, le serie assolutamente convergenti sono, tra
le convergenti, quelle che si comportano decisamente meglio. La convergenza assoluta
unimportante condizione di regolarit.
Laermazione del Lemma piuttosto intuitiva: una serie converge se e solo se,
almeno a partire da un certo posto in poi, la somma di un numero arbitrariamente
grande di addendi arbitrariamente piccola, cio, da un certo posto in poi, gli addendi
devono essere irrilevanti.
0
Dim. del Teorema
P1 P1Indicando con Cn;k e con Cn;k rispettivamente le somme
150.
troncate di n=1 xn e di n=1 jxn j, risulta
0
jCn;k j = jxn+1 + xn+2 + + xn+k j jxn+1 j + jxn+2 j + + jxn+k j = Cn;k :
0
Da Cn:k < " segue a fortiori che jCn;k j < " che, per il precedente Lemma, garantisce
lasserto.
11.4. SERIE CON TERMINI DI SEGNO QUALSIASI 317
xn+1 n! x
n
= !0 8x 2 R;
(n + 1)! x n+1
xn+1 n n
= jxj ! jxj;
n + 1 xn n+1
che ovviamente < 1 quando 1 < x < 1. Anche questa serie quindi converge
assolutamente.
Aggiungiamo due ulteriori esempi.
(iv) La serie
x3 x5 x7 X
1
x2n+1
n
x + + = ( 1)
3! 5! 7! n=0
(2n + 1)!
converge per ogni x 2 R. Infatti
(v) La serie
x2 x4 x6 X
1
x2n
1 + + = ( 1)n+1
2! 4! 6! n=0
(2n)!
converge per ogni x 2 R. Infatti
x2n+2 (2n)! x2
= !0 8x 2 R
(2n + 2)! x2n (2n + 2) (2n + 1)
X1
( 1)n
2
.
n=1
n
Si ha j( 1)n =n2 j 2
1=nP , e quindi per il Criterio del confronto la convergenza della
serie segue da quello di 1 2
n=1 1=n . N
Passiamo alla versione per serie di segno qualsiasi del Criterio del rapporto. Per
brevit, consideriamo solo la sua forma limite, vista nel Corollario 143.
P
Corollario 153 Sia 1 n=1 xn una serie con i termini di segno qualsiasi e non (den-
itivamente) nulli, e si ponga
xn+1 xn+1
lim sup = 2 [0; +1] e lim inf = 2 [0; +1]
xn xn
Allora,
Dim. Grazie al Teorema 150, il caso < 1 segue dallanalogo caso del Corollario
143. Se > 1, si ha denitivamente jxn+1 =xn j > 1, ossia jxn+1 j jxn j > 0, dove si
ha > 0 perch, per ipotesi, i termini xn non sono nulli. Non vale quindi la condizione
necessaria di convergenza xn = o (1).
Si noti che, mentre per serie con termini positivi la condizione > 1 implica
la divergenza; per serie con termini di segno qualsiasi da > 1 segue solo la non
convergenza. Ci dovuto alle migliori propriet di regolarit delle serie con termini
positive viste nella Proposizione 135 (se non convergono divergono positivamente).
11.4. SERIE CON TERMINI DI SEGNO QUALSIASI 319
xn+1 n! jxj
n
= !0 8x 6= 0:
(n + 1)! x n+1
N
Chiudiamo con la versione del Criterio della radice, sempre nella forma limite, per
serie di segno qualsiasi: lasciamo al lettore la dimostrazione del risultato.
P1
Corollario 154 Sia n=1 xn una serie con i termini di segno qualsiasi e non nulli,
e si ponga p
n
lim sup jxn j = 2 [0; +1] .
Allora,
n+1
X
1
x1 x2 + x3 x4 + + ( 1) xn + = ( 1)n+1 xn ;
n=1
P
1
Proposizione 155 La serie ( 1)n+1 xn con i segni alternati convergente se la
n=1
successione fxn g decrescente e innitesima.
Come ben sappiamo, la condizione di nullit xn ! 0 necessaria, ma non su ciente
per la convergenza di una serie generica; per le serie a segni alternati, con laggiunta
della decrescenza dei valori assoluti16 , diventa anche su ciente.
Dim. Per lalternanza dei segni e per la decrescenza dei valori assoluti, le due
successioni
s1 ; s3 ; s5 ; : : : e s2 ; s4 ; s6 ; : : :
sono rispettivamente decrescente e crescente. Infatti
s3 = x 1 x2 + x3 x1 = s1 perch x2 + x3 0
s5 = s3 x4 + x5 s3 perch x4 + x5 0, ecc.
e
s4 = s2 + x 3 x4 s2 perch x3 x4 0
s6 = s4 + x 5 x6 s4 perch x5 x6 0, ecc..
Le due successioni, essendo monotone, ammettono limite; per di pi, visto che s2n+1
s2n = x2n+1 ! 0, il limite lo stesso per entrambe. Quindi lintiera successione fsn g
delle somme parziali ammette limite e perci la serie converge.
OfB. La successione fsn g oscilla attorno al suo limite S con oscillazioni sempre pi
piccole.
1.5
s(n)
0.5
0
O s s s ... n
1 2 3
-0.5
0 2 4 6 8 10
16 n+1
Si noti che xn il valore assoluto del termine ( 1) xn della successione.
11.4. SERIE CON TERMINI DI SEGNO QUALSIASI 321
X
1
2 m
x1 + kxk + k xk2 + +k x km + = k n 1 xk n 1 :
n=1
In altre parole, le due serie hanno lo stesso carattere: se luna converge (diverge),
anche laltra converge (diverge).
dove la seconda diseguaglianza dovuta al fatto che, poich fxn g decrescente, si ha:
(ii) La serie
X1 1
n=2 n log1+" n
invece convergente per ogni " > 0. Infatti, preso k = 2, il suo carattere lo
stesso della serie
X
1
2n X 1
1 X 1
1
= =
n=2
2 log (2 ) n=2 log (2 ) n=2 n log1+" 2
n 1+" n 1+" n 1+"
converge per > 1; qualsiasi e per = 1; > 1, mentre diverge per < 1;
qualsiasi e per = 1; 1. Usando lordinamento lessicograco <L 18 si pu
dire che si ha convergenza se e solo se [ ; ] <L [1; 1].
(iv) Simile conclusione vale per
X
1
1
n=2
n log n (log log n)
con an 2 R per ogni n 0. Per evitare banalit supporremo sempre che gli scalari an ,
0
detti coe ciente della serie, non siano denitivamente nulli; inoltre,
X1 si pone 0 = 1.
La serie (11.25) converge (diverge od oscilla) in x0 se la serie an xn0 converge
n=0
(diverge od oscilla).
Cominciamo con losservare che ogni serie di potenze converge almeno in 0: infatti
X1
an 0n = a0 .
n=0
X1
Proposizione 157 Se una serie di potenze an xn converge in x0 , allora con-
n=0
verge in ogni x tale che jxj < x0 . Se non converge in un punto x0 , allora non converge
in ogni x tale che jxj > x0 .
ogni jxj > r (quando r = 0 la serie converge solo per x = 0; quando invece r = +1 la
serie converge per ogni x 2 R); in x = r la serie pu essere convergente oppure non
convergente.
I criteri di convergenza per serie di segno qualsiasi danno semplici risultati sul
raggio di convergenza. Il pi potente segue dal Criterio della radice in forma limite.
X1
Teorema 158 (Cauchy-Hadamard) Per la serie di potenze an xn il raggio
n=0
di convergenza r = 1= (ponendo r = +1 se = 0 e r = 0 se = +1) ove
p
= lim sup n jan j 2 [0; +1] :
X
1
xn
f (x) = ;
n=1
n
1 1+1 1+1 1+
(1 1) + (1 1) + (1 1) + =0+0+0+
326 CAPITOLO 11. SERIE NUMERICHE
1 + ( 1 + 1) + ( 1 + 1) + =1+0+0+
1 + 1 + 1 + 1 + 1 + (1 1) + (1 1) + =5+0+0+ = 5:
spesso detta serie di Grandi. curioso che, no alla seconda met dellOttocento,
anche i pi grandi matematici condividessero lopinione che tale serie sommasse 1=2.
La Matematica si sviluppata, sino alla met dellOttocento, in maniera alquanto
disordinata: da un lato erano gi noti teoremi di grande complessit, ma, dallaltro,
mancava lattenzione alle denizioni ben poste e al rigore al quale oggi siamo abituati.
Il monaco Grandi, sbagliando due volte, si disse che 1 1 + 1 1 + 1 1 +
1 1 1
una serie geometrica di ragione q = 1 (giusto) e quindi ha somma 1 q = 1 ( 1) = 2
(sbagliato, perch la serie geometrica converge soltanto per jqj < 1); accorpando poi
gli addendi a due a due (sbagliato perch la propriet associativa in generale non vale
per le serie) prosegu aermando che (1 1)+(1 1)+ = 0+0+ per concludere
che
1
0+0+0+ = ;
2
11.6. PROPRIET ASSOCIATIVA E COMMUTATIVA 327
ovvero che la somma di inniti zeri vale 12 . Ci lo port non a negare lesistenza di
Dio, ma a ritenere irrilevante il suo intervento nella creazione; anche senza interventi
divini, dal nulla si crea qualcosa (basta aspettare un po): creatio ex nihilo.
Altre eleganti dimostrazionisono:
(ii) Da
1 1
=1
1+1 1+1
si deduce che
1 1
=1 1
1+1 1+1
e, cos continuando, che
1
=1 1+1 1+ :
1+1
(iv) Leibnitz osserv che sommando un numero pari di addendi si ottiene zero e che
sommandone un numero dispari si ottiene 1. La serie di Grandi contiene per
inniti addendi: non essendo innito n pari n dispari, la sua somma devessere
qualcosa tra 0 e 1. Per una legge di giustizia devesserne la media. Lo stesso
Leibnitz argoment anche sul fatto che innito pari con probabilit 1=2 e
dispari con probabilit1=2.
k k kn kn2
= + 3
m+n m m2 m
si deduce in particolare, per m = n, che
k k k k
= + ;
2m m m m
che generalizza la serie di Grandi.
328 CAPITOLO 11. SERIE NUMERICHE
(vi) Callet osserv che 1 1+1 1+ si ottiene anche come caso particolare di
1+x
=1 x2 + x3 x5 + x6 x8 +
1 + x + x2
che per, per x = 1, fornisce 2=3 = 1 1 + 1 1 + . Lagrange puntualizz
per che la serie di Callet si sarebbe dovuta correttamente scrivere
1+0 x2 + x3 + 0 x5 + x6 + 0 x8 +
(1 1) + (1 1) + (1 1) + =1 1+1 1+
11.6. PROPRIET ASSOCIATIVA E COMMUTATIVA 329
irregolare.
Possiamo per aermare che, se si dissocia ciascun termine di una serie in un
numero nito di addendi tutti dello stesso segno, allora la serie non n cambia carattere
n somma.
x x2 x3 x4 x5
log (1 + x) = 1 + + +
2 3 4 5 6
per ogni 1<x 1. In particolare, per x = 1,
1 1 1 1 1 1 1 1 1
log2 = 1 + + + + +
2 3 4 5 6 7 8 9 10
330 CAPITOLO 11. SERIE NUMERICHE
e quindi
2 1 2 1 2 1 2 1
2log2 = 2 1++ + +
3 2 5 3 7 4 9 5
e, sommando gli addendi con lo stesso denominatore e riordinando,
1 1 1 1 1
2log2 = 1 + + +
2 3 4 5 6
si ottiene luguaglianza2log2 = log2.
Il teorema sorprendente perch mostra come due concetti (le convergenze incon-
dizionata e assoluta), completamente diversi da un punto di vista logico (luno riguarda
la propriet commutativa, laltro i valori assoluti), sono in realt equivalenti.
Dim. Quando la serie contiene elementi tutti dello stesso segno, o anche denitiva-
mente dello stesso segno, lasserto una conseguenza del precedente Teorema sulla
propriet associativa.
Lunico caso da prendere in considerazione quindi che vi siano inniti addendi
positivi e inniti negativi. Consideriamo
P separatamente le due serie dei termini positivi
P
e negativi e indichiamole con 1 p
k=1 k e 1
h=1 qh ; siano inoltre Pk e Qh le loro somme
parziali.
P
Cominciamo con il caso della convergenza. P Se. Sia 1 n=1 xn assolutamente con-
vergente. Si ha allora20 Pk ! P , Qh ! Q e 1 x
n=1 n = P Q. Indichiamo
P1 con Xn la
0
sua somma parziale n-esima e con Xn la somma parziale n-esima di n=1 jxn j. Si ha
allora che Xn ! P Q e Xn0 P ! P + Q. P1
Prendiamo ora una serie 1 m=1 ym ottenuta permutando i termini di n=1 xn e
siano Ym le sue somme parziali. Scomponiamo anch P1essa nelle due
P1serie0 formate dai
0
suoi termini positivi e negativi che indicheremo con r=1 pr e con s=1 qs ; siano inne
Pr0 e Q0s le loro somme parziali. Dobbiamo provare che Ym ! P Q. Ora
p1 + + p k1 q1 + pk1 +1 + + p k2 q2 + :
Pk 1 Q1 ; Pk2 Q2 ; ; Pk i Qi ;
P1Solo seP.1 identica a quella relativa alla convergenza perch, se delle due serie
k=1 pk e h=1 qh una divergesse e laltra convergesse, lasserto sarebbe banale dato
che, riordinando i termini di una serie divergente con termini tutti positivi, si ottiene
sempre una serie divergente.
Non c che dire: una serie di questo tipo, per esempio la serie armonica con
segni alternati, non gode della propriet associativa nella maniera pi profonda: possi-
amo riorganizzarla in maniera da farle avere qualunque comportamento, convergente
o divergente.
11.7 Applicazioni
Chiudiamo il capitolo sulle serie con due applicazioni importanti. La prima lim-
potante risultato che ogni numero reale pu essere rappresentato in una qualsiasi base
intera positiva. La seconda utilizza questo risultato per dimostrare il Teorema 90,
ossia che linsieme delle parti di N ha la stessa cardinalit di R, la cui dimostrazione
era stata lasciata in sospeso nella Sezione 7.7.
(i) a intero;
Allora esiste un unico reale x tale che la successione fcn g denita ricorsivamente
da
dn+1
c0 = a ; cn+1 = cn +
rn+1
converge a x.
Dim. Sia x un numero reale e sia a il pi grande intero minore o uguale a x. Allora
esiste un numero 0 "1 < r tale che
"1
x=a+ :
r
11.7. APPLICAZIONI 333
Considerando ora il reale "1 , esistono un numero intero d1 2 f0; 1; :::r 1g e un numero
0 "2 < r tali che
"2
"1 = d1 + :
r
Iterando il procedimento n volte, facile vedere che esistono n interi d1 ; d2 ; :::dn 2
f0; 1; :::r 1g e n + 1 reali 0 "1 ; "2 ; :::"n ; "n+1 < r tali che
"2 "3 "n+1
"1 = d1 + ; "2 = d2 + ; :::; "n = dn + :
r r r
Per costruzione si ha quindi:
d1 d2 d3 dn "n+1
x=a+ + 2 + 3 + ::: + n + n+1 : (11.28)
r r r r r
Pi in generale, iterando il procedimento allinnito, esiste una successione di interi
fdi g1
i=1 , con di 2 f0; 1; :::r 1g, che permette di esprimere il reale x nel seguente modo:
X
1
di
x=a+ (11.29)
i=1
ri
X
1
di
(11.30)
i=1
ri
X
n
di
sn = :
i=1
ri
Da (11.28) si ha
"n+1 1
0 (x a) sn = n+1
< n:
r r
Siccome
1
lim
= 0;
n!1 r n
Viceversa, sia fa; d1 ; d2 ; :::dn ; :::g una successione che soddisfa le ipotesi (i) e (ii).
Per lunicit del limite, su ciente dimostrare che la serie
X
1
dh
h=1
rh
334 CAPITOLO 11. SERIE NUMERICHE
converge. A tal ne basta osservare che si tratta di una serie a termini positivi tale
che
X 1 n
di X 1 X
n n n 1
1 1 r r
i
< i 1
= k
= 1
< :
i=1
r i=1
r k=0
r 1 r
r 1
cio con successione delle somme parziali superiormente limitatata.
Il teorema rende rigorosa unidea intuitiva circa i numero reali. Quando si pensa
a un numero reale, si immagina un numero intero associato a una parte decimale con
innite cifre, che nel caso di numeri irrazionali si susseguono senza regolarit. Per la
classica base r = 10, a rappresenta il numero intero e la successione fd1 ; d2 ; :::dn ; :::g
la parte decimale del numero reale x21 .
Tuttavia, il teorema molto pi profondo e generale: la parte decimale di un
numero reale pu essere sostituita in modo univoco con qualsiasi base intera r 2
diversa da 10. In altre parole, come gi si osservato nella Sezione 1.6, lusuale rapp-
resentazione decimale dei numeri reali solo uno degli inniti modi di rappresentarlo.
Il lettore curioso pu (ri)leggere la Sezione 1.6 per avere informazioni dettagliate sul-
luso di diverse basi di rappresentazione dei numeri dalle diverse civilt nella storia.
La rappresentazione decimale risulta particolarmente comoda per il nostro modo di
numerazione, ma, per esempio, per dimostrare il Teorema 90 occorre considerare la
base binaria con r = 2 (peraltro ampiamente usata in informatica ed elettronica).
Dim. Per dimostrare che due insiemi hanno la stessa cardinalit bisogna stabilire una
corrispondenza biunivoca tra i loro elementi. Sia B 2 P(A). Allinsieme B associamo
la funzione fB 2 2A denita da
(
1 se x 2 B
fB (x) = :
0 se x 2 A B
B = fx 2 A : f (x) = 1g :
Alla luce di questo risultato, per dimostrare il Teorema 90 baster trovare una
corrispondenza biunivoca tra i numeri reali e le funzioni f : N ! f0; 1g.
Dim. del Teorema 90 Grazie alla Proposizione 163, su ciente dimostrare che
linsieme 2N delle funzioni f : N ! f0; 1g ha la potenza del continuo. In altre parole,
dobbiamo dimostrare che esiste una corrispondenza biunivoca tra 2N e R, oppure (per
la propriet transitiva dellequipotenza) tra 2N e un insieme che ha la potenza del
continuo. A tale scopo, osserviamo che lintervallo [0; 1) ha la potenza del continuo,
com facile vericare. Intendiamo quindi stabilire una biiezione tra 2N e [0; 1). Si noti,
a tal ne, che linsieme 2N altro non che linsieme delle successioni a valori in f0; 1g.
Applicando il Teorema 162 con la base r = 2, esiste una corrispondenza biunivoca
tra i numeri reali x 2 [0; 1) e le successioni fd1 ; d2 ; :::dn ; :::g, con di 2 f0; 1g per ogni
i 1.23 Si ha quindi j2N j = j[0; 1)j, il che implica 2N = jRj.
23
A essere rigorosi no in fondo (cio pedanti), osserviamo che, per avere lunivocit della rappre-
sentazione di un numero reale, da 2N abbiamo tolto linsieme delle successioni denitivamente costanti
e pari a 1, insieme che chiameremo K1 . Sarebbe quindi pi corretto dire che vi una biiezione tra
[0; 1) e il sottoinsieme di 2N denito da 2N K1 (insieme formato da tutte le successioni a valori in
f0; 1g e non denitivamenta pari a 1). Tuttavia, possibile dimostrare che linsieme K1 numerabile.
Pertanto, poich 2N K1 ha la potenza del continuo, anche 2N ha la potenza del continuo.
336 CAPITOLO 11. SERIE NUMERICHE
Capitolo 12
Limiti di funzioni
x 0; 2 0; 1 0; 01 0; 001 0; 001 0; 01 0; 1 0; 2
sin x
0; 993 0; 998 0; 99998 0; 9999999 0; 9999999 0; 99998 0; 998 0; 993
x
Inserendo altri valori via via pi vicini allorigine, si pu vericare che si hanno valori
di (sin x) =x sempre pi prossimi al limite L = 1. In questo caso si dice che il limite
di (sin x) =x per x che tende a x0 = 0 L = 1; in simboli:
sin x
lim =1
x!0 x
x per x 1
f (x) =
1 per x > 1
337
338 CAPITOLO 12. LIMITI DI FUNZIONI
il cui graco
3
y
1 1
0
O 1 x
-1
-2
-3
-3 -2 -1 0 1 2 3 4 5
Aggiungendo altri valori, via via pi vicini a x0 = 1, si pu vericare che per valori di
x sempre pi prossimi a x0 = 1 si hanno valori di f (x) sempre pi vicini a L = 1. In
questo caso si dice che il limite di f (x) per x che tende a x0 = 1 L = 1, e si scrive
lim f (x) = 1
x!1
Si osservi che il valore che la funzione assume nel punto x0 = 1 f (1) = 1, e quindi il
limite L = 1 uguale al valore f (1) della funzione in x0 = 1.
3
y
2 2
1 1
0
O 1 x
-1
-2
-3
-3 -2 -1 0 1 2 3 4 5
lim f (x) = 1
x!1
Questa volta il valore che la funzione assume nel punto 1 f (1) = 2, diverso dal valore
L = 1 del limite.
10
y
8
0
O x x
0
-2
-4
-6
-8
-10
-2 -1 0 1 2 3 4
340 CAPITOLO 12. LIMITI DI FUNZIONI
x 2; 0001 2; 001 2; 01 2; 05 2; 1 2; 2 2; 5
f (x) 10:000 1:000 100 20 10 5 2
Per valori via via pi vicini a 2 da destra la funzione assume valori via via maggiori e
non superiormente limitati. In questo caso si dice che la funzione f tende a +1 per
x che tende a 2 da destrae si scrive
lim f (x) = +1
x!2+
x 1; 5 1; 8 1; 9 1; 95 1; 99 1; 999 1; 9999
f (x) 2 5 10 20 100 1:000 10:000
Per valori via via pi vicini a 2 da sinistra la funzione assume valori negativi sempre
maggiori (in valore assoluto). In questo caso si dice che la funzione f tende a 1
per x che tende a 2 da sinistrae si scrive
lim f (x) = 1
x!2
Si osservi che
lim f (x) 6= lim f (x)
x!2+ x!2
ossia esistono i limiti destro e sinistro ma sono diversi. Come vedremo nella
Proposizione 164, la diversit dei limiti unilaterali riette il fatto che il limite bilaterale
di f (x) per x che tende a 2 non esiste. Infatti, luguaglianza dei limiti unilaterali
equivale allesistenza del limite bilaterale. Per esempio, se modichiamo la funzione
considerando f (x) = 1= jx 2j, si ha
I due limiti unilaterali sono tra loro uguali, e coincidono con il bilaterale, che in questo
caso esiste (pur se innito).
Per valori via via maggiori di x la funzione assume valori via via sempre pi vicini a
0. In questo caso si dice che la funzione tende a 0 per x che tende a +1e si scrive
lim f (x) = 0:
x!+1
lim f (x) = 0+
x!+1
dove 0+ ricorda che i valori di f (x) nel tendere a 0 rimangono strettamente positivi.
Che cosa succede se, invece, come x0 consideriamo 1? Si ha la seguente tabella
di valori:
Per valori negativi di x e sempre maggiori (in valore assoluto), la funzione assume
valori sempre pi prossimi a 0. Si dice che la funzione tende a 0 per x che tende a
1e si scrive
lim f (x) = 0:
x! 1
lim f (x) = 0 :
x! 1
Da ultimo, dopo aver visto vari tipi di limiti, consideriamo una funzione che ne sia
priva, ossia che non manifesti alcun comportamento tendenziale. Sia f : R f0g ! R
data da
1
f (x) = sin
x
Nel punto x0 = 0 la funzione non ammetta limite: per x via via pi vicino a x0 = 0 la
funzione continua a oscillare con andamento sinusoidale sempre pi serrato:
342 CAPITOLO 12. LIMITI DI FUNZIONI
1 y
0.8
0.6
0.4
0.2
0
x
-0.2
-0.4
-0.6
-0.8
-1
(i) limx!x0 f (x) = L 2 R, ossia sia il punto x0 sia il limite L sono reali (niti);
(iv) limx!+1 f (x) = 1 oppure limx! 1 f (x) = 1, ossia sia il punto x0 sia il
limite sono inniti.
12.2. FUNZIONI SCALARI 343
Formalizziamo ora la nozione di limite in questi casi. Cominciamo con il caso (i).
Come prima cosa osserviamo che si pu pensare di calcolare il limite di una funzione
con dominio A R per x0 2 R soltanto quando x0 un punto di accumulazione di A.
Ci permette di dar senso alla frase per x 2 A che tende a x0 .
se ad ogni " > 0 si pu associare " > 0 tale che, per ogni x 2 A,
La denizione richiede che, ssata qualsiasi quantit " > 0, arbitrariamente piccola,
esista un valore " tale che tutti i punti x 2 A che distano da x0 meno di " abbiano
immagini f (x) a distanza minore di " dal valore L del limite. Si noti che la condizione
d (x; x0 ) > 0 equivale a richiedere x 6= x0 .
Esempio 186 Mostriamo che limx!2 (3x 5) = 1. Dobbiamo far vedere che, per
ogni " > 0, esiste " > 0 tale che
Si ha j(3x 5) 1j < " se e solo se jx 2j < "=3 e quindi, ponendo " = "=3, si
ottiene la (12.5). N
Si noti come la quantit " dipenda dal valore ssato per ": pi piccolo il valore
di ", pi piccola anche " . Naturalmente, la scelta di " non univoca, tant che,
trovato un valore di " , anche tutti i valori pi piccoli andrebbero bene: nellEsempio
186, potevamo in realt scegliere come " qualsiasi valore (positivo) minore di "=3.
Esempio 187 Riprendiamo la funzione di Dirichlet (12.2): limx!x0 f (x) non esiste
per alcun x0 2 R. Infatti, dato x0 2 R, supponiamo, per contra, che limx!x0 f (x)
esista e sia uguale a L 2 R. Sia 0 < " < 1=2. Esiste = " tale che
1
x 2 (x0 ; x0 + ) e x 6= x0 =) jf (x) Lj < " <
2
344 CAPITOLO 12. LIMITI DI FUNZIONI
In ogni intorno (x0 ; x0 + ) esistono sia punti razionali sia punti non razionali
distinti da x0 (si veda la Proposizione 18), ovvero sia punti x 2 (x0 ; x0 + ) per
cui f (x) = 1 sia punti x 2 (x0 ; x0 + ) per cui f (x) = 0. Ma ci contraddice
jf (x) Lj < 1=2 per ogni x 2 (x0 ; x0 + ) con x 6= x0 . Dunque il limx!x0 f (x)
non esiste in alcun x0 2 R. N
Una denizione come la 82, nella quale sono esplicitate le distanze, si dice "- .
Alla luce della (12.4), immediata la riscrittura della Denizione 82 nel linguaggio
degli intorni. Per rendere pi immediatamente espressiva la simbologia, indicheremo,
anzich con la lettera B, rispettivamente con U (x0 ) un intorno di x0 di raggio (della
variabile indipendente, cio un intorno in ascissa) e con V (L) = V" (L) un intorno di
L di raggio " (della variabile dipendente, cio un intorno in ordinata).
se, per ogni intorno V" (L) di L, esiste un intorno U " (x0 ) di x0 tale che
Come nel caso della convergenza di successioni, la riscrittura nel linguaggio degli
intorni molto evocativa1 . In particolare, grazie alla topologia della retta reale estesa,
possiamo subito generalizzare la denizione in modo da includere anche i casi (ii), (iii)
e (iv), in analogia con quanto fatto con la Denizione 67 per i limiti di successioni.
se, per ogni intorno V" (L) di L, esiste un intorno U " (x0 ) di x0 tale che
se, per ogni M > 0, esiste M > 0 tale che, per ogni x 2 A, si abbia
In altre parole, per ogni costante M , per quanto grande sia, esiste M > 0 tale che
tutti i punti x 2 A che distano da x0 meno di M (escluso al pi x0 ) hanno immagini
f (x) maggiori di M .
1 1
0 < jx x0 j < M () 0 < jx 2j < =) >M
M jx 2j
e quindi
0 < jx 2j < M =) f (x) > M
ossia limx!2 f (x) = +1. N
lim f (x) = L 2 R
x!+1
se, per ogni " > 0, esiste M" > 0 tale che, per ogni x 2 A, si abbia
In questo caso, per ogni scelta di " > 0 arbitrariamente piccola, esiste un valore
M" tale che le immagini di punti x maggiori di M" distano meno di " da L.
2
Grazie al Lemma 98, il fatto che A non sia superiormente limitato garantisce che +1 ne sia
punto di accumulazione. Per esempio, ci il caso se (a; +1) A.
346 CAPITOLO 12. LIMITI DI FUNZIONI
lim f (x) = +1
x!+1
se, per ogni M > 0, esiste N tale che, per ogni x 2 A, si abbia
10 y
V(l)
6
O U(x ) x
0
0
-2
-2 -1 0 1 2 3 4
Purtroppo per in tal modo non si dice proprio nulla perch ci che che precede
sempre vero, come mostra la gura:
5
y
3 V(l)
0
O x
U(x )
-1 0
-2
-3
-4
-4 -2 0 2 4 6
Nella gura, per ogni intorno U , anche piccolissimo, di x0 esiste sempre un intorno
(di solito grandino) V di L entro il quale cadono tutti i valori di f (x) con x 2 U fx0 g.
Tale V pu sempre essere preso come un intervallo aperto che contiene f (U fx0 g).
H
348 CAPITOLO 12. LIMITI DI FUNZIONI
OfB. Come pi volte s detto, una successione una funzione denita su N+ che ha
un solo punto di accumulazione: +1. Per una successione lunico limite del quale si
pu parlare allora limn!1 che abbiamo talvolta indicato semplicemente con lim non
essendovi possibilit di equivoco. H
2 se x 1
f (x) =
x se x < 1
facile vedere che il limite limx!1 f (x) non esiste. In questi casi soccorre la pi debole
nozione di limite unilaterale, gi incontrata in modo intuitivo negli esempi introduttivi
del presente capitolo. Essi suggeriscono le diverse possibilit:
se, per ogni intorno V" (L) di L, esiste un intorno destro U +" (x0 ) = [x0 ; x0 + " ) di x0
tale che
x 2 U +" (x0 ) \ A e x 6= x0 =) f (x) 2 V" (L) (12.11)
Il valore L si dice limite destro della funzione in x0 .
12.2. FUNZIONI SCALARI 349
In particolare:
se, per ogni " > 0, esiste = " > 0 tale che, per ogni x 2 A,
Vediamo un esempio.
p
Esempiop 191 Consideriamo f : R+ ! R data da f (x) = x. Mostriamo che
limx!0+ x = 0. Sia " > 0. Risulta
p
jf (x) Lj = x < " () x < "2
se, per ogni M > 0, esiste M > 0 tale che, per ogni x 2 A,
1 1
x x0 < M () x 2< =) >M
M x 2
e quindi
0<x 2< M =) f (x) > M
ossia limx!2+ f (x) = +1. Daltra parte, per ogni x < 2 si ha
1 1
x0 x< M () 2 x< =) < M
M x 2
e quindi
0<2 x< M =) f (x) < M
ossia limx!2 f (x) = 1. N
Negli stessi termini si deniscono i limiti sinistri che si indicano con limx!x0 f (x).
Si noti che B" (x0 ) fx0 g un intorno di x0 bucato, cio privo del punto x0
stesso. La condizione B" (x0 ) fx0 g A richiede che esista almeno un tale intorno
bucato incluso in A. In altre parole, si richiede linclusione dellintorno con leventuale
eccezione del punto x0 stesso, al quale non si richiede di appartenere ad A. Natu-
ralmente, un caso ovvio e importante dove esiste un intorno B" (x0 ) che soddisfa la
condizione B" (x0 ) fx0 g A quando x0 un punto interno di A.
e quindi, per la Proposizione 164, il limite bilaterale limx!2 f (x) non esiste.
Il lettore avr osservato come la Proposizione 164 vieti che x0 sia di frontiera per A.
Infatti, se A un intervallo della retta reale, quando x0 = inf A non ha senso parlare
del limite unilaterale limx!x0 f (x), mentre quando x0 = sup A non ha senso parlare
del limite unilaterale limx!x+0 f (x). Discorso analogo se A una semiretta limitata
inferiormente (superiormente): in tal caso non esiste il limite sinistro (destro)
p per x
che tende allestremo inferiore (superiore) di A: Per esempio,
p per f (x) = x e x0 = 0,
si ha x0 = inf A (anzi, x0 = min A) e il limite limx!0 x non denito. Quando x0
un generico punto di frontiera, per esempio il punto 3 per linsieme A = (0; 3) [ [5; 19],
il problema si presenta esattamente negli stessi termini.
Notazione. Analizziamo il caso molto frequente nel quale A sia un intervallo della
retta reale3 . Quando x0 di frontiera, almeno uno dei due unilaterali non esiste e per-
ci la condizione limx!x+0 f (x) = limx!x0 f (x) perde signicato. In tali casi porremo
3
In altre parole, vale uno dei seguenti quattro casi: (i) A = (a; b); (ii) A = [a; b); (iii) A = (a; b];
(iv) A = [a; b].
352 CAPITOLO 12. LIMITI DI FUNZIONI
semplicemente limx!x0 f (x) = limx!x+0 f (x) oppure limx!x0 f (x) = limx!x0 f (x) a
seconda di quale limite unilaterale esista. La denizione di limite bilaterale infatti
perfettamente rispettata: per ogni intorno (bilaterale) V di L esiste un intorno, for-
zosamente unilaterale perch x0 di frontiera, tale che le immagini di f (esclusa al pi
f (x0 )) cadono in V .
p
Esempio 193 Sia f : R+ ! R data da f (x) = x. NellEsempio 191 avevamo visto
come limx!0+ f (x) = 0. Per quanto detto possiamo scrivere anche limx!0 f (x) = 0.
istruttivo calcolare questo limite bilaterale anche direttamente, tramite la Denizione
82. Sia " > 0. Come s visto nellEsempio 191, si ha
p
jf (x) Lj = x < " () x < "2
Lanaloga versione generalissima per i limiti unilaterali limx!x+0 f (x) e limx!x0 f (x)
si ottiene in modo ovvio sostituendo, nel primo caso, x+ 0 in luogo di x0 e intorno destro
in luogo di intorno, e nel secondo caso x0 in luogo di x0 e intorno sinistro in luogo di
intorno.
se, per ogni intorno V" (L) di L, esiste un intorno U " (x0 ) di x0 tale che
x 2 U " (x0 ) \ A e x 6= x0 =) f (x) 2 V" (L) (12.18)
Il valore L si dice limite della funzione in x0 .
La Denizione 84 ne il caso particolare con n = 1. Nella versione "- si ha
(12.17) se, per ogni " > 0, esiste " > 0 tale che, per ogni x 2 A,
0 < d (x; x0 ) < " =) d (f (x) ; L) < " (12.19)
Si noti come la (12.19) sia assolutamente identica alla (12.4): la distanza d (x; x0 ),
che jx x0 j nel caso n = 1, nel caso generale diventa kx x0 k.
P
Esempio 194 Sia f : Rn ! R data da f (x) = 1 + ni=1 xi . Verichiamo che
limx!0 f (x) = 1. Sia " > 0. Si ha
X
n X
n
d (f (x) ; 1) = 1 + xi 1 < " () xi < "
i=1 i=1
P Pn
Poniamo = "=n. Poich j ni=1 xi j
" i=1 jxi j, si ha
v
u n
uX " Xn
"2
d (x; x0 ) < " () t x 2
< () x 2
< =)
i i 2
i=1
n i=1
n
q r
2
" "2 "
x2i < 2
8i = 1; 2; : : : ; n =) jx i j = x 2
i < 2
= 8i = 1; 2; : : : ; n
n n n
Xn Xn Xn
=) jxi j < " =) d (f (x) ; 1) = xi jxi j < "
i=1 i=1 i=1
xn ! x0 =) f (xn ) ! L
Solo se: supponiamo limx!x0 f (x) = L 2 R. Sia fxn g una successione di punti
di A, con xn 6= x0 per ogni n, tale che xn ! x0 . Sia " > 0. Esiste " > 0 tale che per
ogni x 2 A con 0 < d (x; x0 ) < " si abbia d (f (x) ; L) < ". Poich xn ! x0 e xn 6= x0 ,
esiste n" 1 tale che 0 < d (xn ; x0 ) < " per ogni n n" . Per ogni n n" si ha quindi
d (f (xn ) ; L) < ", il che implica f (xn ) ! L.
Dim 1. Supponiamo, per contra, che esistano due limiti diversi tra loro L0 6= L00 . Sia
fxn g una successione in A, con denitivamente xn 6= x0 , tale che xn ! x0 . Per la
Proposizione 165, F (xn ) ! L0 e F (xn ) ! L00 , il che contraddice lunicit del limite
per successioni. Ne segue che L0 = L00 .
Dim 2. Per assurdo supponiamo che esistano due limiti diversi tra loro L1 6= L2 . Si
assume cio che
lim f (x) = L1
x!x0
e
lim f (x) = L2
x!x0
con L1 6= L2 . Senza perdita di generalit, supponiamo che L1 > L2 . Esiste uno scalare
K tale che L1 > K > L2 . Posto 0 < "1 < L1 K e 0 < "2 < K L2 , gli intorni
B"1 (L1 ) = (L1 "1 ; L1 + "1 ) e B"2 (L2 ) = (L2 "2 ; L2 + "2 ) sono disgiunti.
356 CAPITOLO 12. LIMITI DI FUNZIONI
Poich per ipotesi limx!x0 f (x) = L1 , dato il raggio "1 > 0 si pu trovare un raggio
1 > 0 tale che per
Analogamente, poich per ipotesi limx!x0 f (x) = L2 , dato il raggio "2 > 0 si puo
trovare un raggio 2 > 0 tale che per
Preso il pi piccolo dei due raggi = min f 1 ; 2 g si ha che lintorno di x0 con raggio
contenuto nei due intorni precedenti, cio in (x0 ; x0 + ) valgono entrambe le
propriet (12.20) e (12.21):
cio:
Passiamo ora al Teorema del confronto per funzioni, lasciando al lettore la di-
mostrazione (basata sul Teorema 114 e sulla Proposizione 165).
e
lim g (x) = lim h (x) = L 2 R (12.23)
x!x0 x!x0
allora
lim f (x) = L
x!x0
Dim. alternativa Preso " > 0 arbitrario, si deve dimostrare che esiste > 0 tale
che g(x) 2 (L "; L + ") per ogni x 2 (x0 ; x0 + ) \ A con x 6= x0 . Siccome
limx!x0 f (x) = L, dato " > 0, esiste 1 > 0 tale che
Siccome limx!x0 h(x) = L, dato " > 0, esiste 2 > 0 tale che
cio
g(x) 2 (L "; L + ") 8x 2 (x0 ; x0 + )
e quindi, essendo " arbitrario, si ha limx!x0 g(x) = L, come desiderato.
Linterpretazione del risultato del tutto analoga alla versione per successioni.
Vediamone una semplice applicazione, simile, mutatis mutandis, a quella vista nellE-
sempio 145.
2 1
Esempio 197 Sia f : R ! R data da f (x) = ex cos x e sia x0 = 0. Poich
1
0 cos2 1 8x 2 R;
x
considerando la monotonia della funzione esponenziale, per x 0 si ha
2 1
1 = e0 x ex cos x e1 x = ex 8x 0:
Concludiamo con la versione per funzioni del Teorema della permanenza del segno
(ancora lasciamo al lettore la dimostrazione, basata sul Teorema 101 e sulla Propo-
sizione 165).
Anche qui diamo una dimostrazione alternativa che non utilizza i limiti di succes-
sioni.
Dim. alternativa Supponiamo che sia L > 0. Poich limx!x0 f (x) = L, scelto
" = L=2 > 0, esiste un intorno U" (x0 ) di x0 tale che
L L L 3L
x 2 U" (x0 ) \ A fx0 g =) f (x) 2 L ;L + = ; :
2 2 2 2
Come gi osservato, anche per funzioni, i Teoremi del confronto e della permanenza
del segno sono propriet dei limiti rispetto alla struttura dordine. La prossima propo-
sizione, lanaloga per funzioni della Proposizione 102, rappresenta un ultimo semplice
risultato dello stesso tipo.
(ii) se L > H, allora esiste un intorno di x0 nel quale f (x) > g (x) :
Dim. (i) Per contra, sia L < H. Si ponga " = H L, sicch " > 0. Gli intorni
(L "=4; L + "=4) e (H "=4; H + "=4) sono disgiunti siccome L + "=4 < H "=4.
Poich limx!x0 f (x) = L, esiste 1 > 0 tale che per x 2 (x0 1 ; x0 + 1 ) =) f (x) 2
" "
L 4 ; L + 4 : Analogamente, poich limx!x0 g (x) = H esiste 2 > 0 tale che
" "
x 2 (x0 2 ; x0 + 2) =) g(x) 2 H ;H +
4 4
Posto = minf 1 ; 2 g, si ha
" " " "
x 2 (x0 ; x0 + ) =) L < f (x) < L + < H < g(x) < H +
4 4 4 4
cio, f (x) < g(x) per ogni x 2 B (x0 ). Ci contraddice lipotesi che sia f (x) g (x)
in un intorno Br (x0 ) di x0 .
(ii) Se valesse f (x) g(x) per ogni intorno di x0 , allora per il punto (i) si avrebbe
L H.
Dim Mostriamo solo la (i), lasciando al lettore lanaloga dimostrazione degli altri
punti. Sia fxn g una successione in A, con xn 6= x0 per ogni n 1, tale che xn ! x0 .
Per la Proposizione 165, f (xn ) ! L e g (xn ) ! M . Supponiamo che L + M non sia
una forma di indeterminazione. Per la Proposizione 112, (f + g) (xn ) ! L + M , e
quindi, dalla Proposizione 165 segue che limx!x0 (f + g) (x) = L + M .
Esempio 198 Siano f; g : R f0g ! R date da f (x) = sin x=x e g (x) = 1= jxj. Si
ha limx!0 sin x=x = 1 e limx!0 1= jxj = +1 e quindi
sin x 1
lim + = 1 + 1 = +1
x!0 x jxj
Se, invece, g (x) = ex , si ha limx!0 (sin x=x + ex ) = 1 + 1 = 2. N
Forma di indeterminazione 1 1
Cominciamo con la forma di indeterminazione 1 1. Per esempio, il limite limx!0 (f + g) (x)
della somma delle funzioni f; g : R f0g ! R date da f (x) = 1=x2 e g (x) = 1=x4
ricade sotto questa forma di indeterminazione. Svolgendo i conti si ha
1 1 1 1
(f + g) (x) = = 1
x2 x4 x2 x2
360 CAPITOLO 12. LIMITI DI FUNZIONI
e quindi
1 1
lim (f + g) (x) = lim lim 1 = 1;
x!0 x!0 x2 x!0 x2
poich (+1) ( 1) non una forma di indeterminazione. Scambiando i segni
tra queste due funzioni, ossia ponendo f (x) = 1=x2 e g (x) = 1=x4 , si ha di
nuovo una forma di indeterminazione 1 1 in x0 = 0, ma questa volta risul-
ta limx!0 (f + g) (x) = +1. Com del tutto ovvio, anche per il caso di funzioni
le forme di indeterminazione possono quindi dare risultati completamente diversi e
devono essere risolte caso per caso.
Da ultimo si noti che tali f e g danno luogo a una forma di indeterminazione
in x0 = 0, ma non in x0 6= 0. Quindi, cruciale specicare il punto x0 che si sta
considerando.
Forma di indeterminazione 0 1
Per esempio, siano f; g : R ! R date da f (x) = (x 3)2 e g (x) = 1= (x 3)4 . Il
limite limx!3 (f g) (x) ricade sotto questa forma di indeterminazione. Si ha per
1 1
lim (f g) (x) = lim (x 3)2 4 = lim = +1
x!3 x!3 (x 3) x!3 (x 3)2
Anche ora, solo il calcolo diretto del limite pu stabilirne il valore del limite.
f 5 x 5 x 1 1
lim (x) = lim = lim = lim =
x!5 g x!5 x2 25 x!5 (x 5)(x + 5) x!5 x + 5 10
f x2
(x) = lim = lim x = +1
g x!+1 x x!+1
f x2
lim (x) = lim = lim x = 1
x! 1 g x! 1 x x! 1
12.6. LIMITI ELEMENTARI E LIMITI NOTEVOLI 361
con risultato di segno opposto nei due casi: di nuovo, non resta che il calcolo diretto
del limite.
p
Daltra parte, prendendo f : R+ ! R data da f (x) = x + x 2 e g : R f1g ! R
data da g (x) = x 1, si ha
p p p
f x+ x 2 x 1+ x 1 x 1
lim (x) = lim = lim = lim 1 +
x!1 g x!1 x 1 x!1 x 1 x!1 x 1
p
x 1 1 1 3
= 1 + lim p p = 1 + lim p =1+ =
x!1 ( x 1) ( x + 1) x!1 x+1 2 2
Chiudiamo con due osservazioni.
Esempio 199 (i) Sia f : R ! R data da f (x) = xn con n 1. Per ogni x0 2 R, per
le propriet elementari dei limiti, si ha
lim xn = xn0
x!x0
(iv) Sia f : R++ ! R data da f (x) = loga x, con a > 0; a 6= 1. Per ogni x0 > 0, si
ha limx!x0 loga x = loga x0 . Inoltre,
1 se a > 1 +1 se a > 1
lim+ loga x = e lim loga x =
x!0 +1 se a < 1 x!+1 1 se a < 1
Proposizione 171 Siano f; g : R+ ! R date da f (x) = sin x=x e g (x) = (cos x 1) =x.
Allora,
sin x
lim =1 (12.26)
x!0 x
e
1 cos x 1 cos x 1
lim = 0 ; lim = (12.27)
x!0 x x!0 x2 2
Dim. facile vedere gracamente che 0 < sin x < x < tan x per x 2 (0; =2) e che
tan x < x < sin x < 0 per x 2 ( =2; 0). Quindi, dividendo tutti i termini per sin x; e
osservando che sin x > 0 quando x 2 (0; =2) e sin x < 0 quando x 2 ( =2; 0), si ha
in tutti i casi:
x 1
1< <
sin x cos x
12.6. LIMITI ELEMENTARI E LIMITI NOTEVOLI 363
(i) Se
f (x)
lim =0
x!x0 g (x)
si dice che f trascurabile rispetto a g per x ! x0 ; in simboli
f = o (g) per x ! x0
(ii) Se
f (x)
lim = k 6= 0 (12.29)
x!x0 g (x)
si dice che f confrontabile con g per x ! x0 ; in simboli
f g per x ! x0
(iii) In particolare, se
f (x)
lim =1
x!x0 g (x)
si dice che f e g sono asintotiche per x ! x0 e si scrive
facile vedere come anche per le funzioni valgano per e per le stesse propriet
viste nella Sezione 9.12 per le successioni:
(iii) se i limiti limx!x0 f (x) e limx!x0 g (x) sono entrambi niti e non nulli, allora
f g per x ! x0 ;
Consideriamo ora i casi, i pi interessanti anche per le funzioni, nei quali entrambe
le funzioni convergono a zero oppure divergono a 1. Cominciamo con la convergenza
a zero, e assumiamo che limx!x0 f (x) = limx!x0 g (x) = 0. In questo caso, intuiti-
vamente, f trascurabile rispetto a g per x ! x0 se tende a zero pi velocemente.
Siano, per esempio, x0 = 1, e f (x) = (x 1)2 e g (x) = x 1. Si ha
(x 1)2
lim = lim (x 1) ! 0
x!1 x 1 x!1
e quindi g = o (f ) per x ! 0.
Anche per funzioni il signicato di trascurabilit deve essere precisato a seconda che
si consideri la convergenza a zero oppure la divergenza allinnito. Inoltre, cruciale
il punto x0 che si considera, e ci rappresenta lunica novit signicativa rispetto a
quanto si era visto per le successioni.
(i) xk = o ( x
) per x ! +1, ossia
xk
lim x
=0
x!+1
loga x
lim =0
x!+1 xk
Si noti che per la propriet transitiva della relazione di trascurabilit, da (i) e (ii)
segue che
loga x = o ( x ) per x ! +1
Dim. Per tutte e tre le funzioni, denite da x , xk , loga x, risulta f (n 1) f (x)
f (n) dove n = [x] la parte intera di x: tali successioni sono dunque crescenti. Basta
poi utilizzare la denizione successionale di limite di una funzione e utilizzare il criterio
del confronto.
NB. Aermare che una funzione un o (1) per x ! x0 signica semplicemente che
essa tende a 0: infatti, dire che f (x) = o (1) signica che f (x) =1 = f (x) ! 0. O
Si cominci con losservare che f (x) g (x) per x ! x0 implica, per dato L 2 R,
(i) f (x) + h (x) g (x) + l (x) per x ! x0 , purch esista k > 0 e un intorno B" (x0 )
di x0 tale che
g (x)
k (12.30)
g (x) + l (x)
per ogni x 2 B" (x0 );
(iii) f (x) =h (x) g (x) =l (x) per x ! x0 , purch h (x) 6= 0 e l(x) 6= 0 in ogni punto
x 6= x0 di un intorno B" (x0 ).
Lemma 174 Si ha
Dunque,
lim f (x) = L() lim (f (x) + o (f (x))) = L
x!x0 x!x0
nonch
f (x) + o (f (x)) f (x)
per x ! x0 (12.34)
g (x) + o (g (x)) g (x)
Vediamo alcuni esempi.
368 CAPITOLO 12. LIMITI DI FUNZIONI
3
e poniamo f (x) = x e g (x) = x 2 . Per x ! +1 si ha
1 2
2x 2 + 5x 3 = o (f ) e 3 + 3x = o (g)
x 2 + 2x 4 + e x
x 2
= x2 ! +1 per x ! +1
x 4 + x 8 + 3x 10 x 4
12.7.2 Terminologia
Anche per le funzioni, per il confronto sia di funzioni entrambe convergenti a zero sia
di funzioni entrambi tendenti a 1, vi una terminologia specica. In particolare,
(i) una funzione f tale che limx!x0 f (x) = 0 si dice innitesima (o innitesimo)
per x ! x0 ;
12.7. ORDINI DI CONVERGENZA E DI DIVERGENZA 369
(ii) una funzione f tale che limx!x0 f (x) = 1 si dice innita (o innito) per
x ! x0 ;
(iii) se due funzioni f e g sono entrambe innitesime in x0 e tali che f = o (g) per
x ! x0 , la funzione f detta innitesima di ordine superiore in x0 rispetto a g;
(iv) se due funzioni f e g sono entrambe innite in x0 e tali che f = o (g) per x ! x0 ,
la funzione f detta innita di ordine inferiore rispetto a g.
Una funzione quindi innitesima di ordine superiore a unaltra se tende a zero
pi velocemente, mentre innita di grado inferiore se tende a innito pi lentamente.
Esempio 203 (i) Le funzioni denite da (x x0 )a sono innitesime per x ! x+ 0
quando a > 0 e innite quando a < 0.
(ii) Le funzioni denite da x sono innite per x ! +1 e innitesime per x ! 1
quando > 1 e viceversa quando 0 < < 1. H
(iv) logh x = o xk .
Funzioni continue
371
372 CAPITOLO 13. FUNZIONI CONTINUE
Qui x0 = 1 punto isolato nel dominio. S ha quindi che f continua sul suo dominio.
Dim. Il risultato segue immediatamente dalla Proposizione 165, una volta che si sia
osservato che, quando x0 un punto isolato di A, lunica successione contenuta in A
che tende a x0 costante: fx0 ; x0 ; g.
Vediamo alcuni esempi. Cominciamo con losservare che le funzioni elementari sono
continue.
Esempio 204 (i) Sia f : R++ ! R data da f (x) = log x. Poich limx!x0 log x =
log x0 per ogni x0 > 0, la funzione continua.
x x x0
(ii) Sia f : R ! R data da f (x) = , con > 0. Poich limx!x0 = per ogni
x0 2 R, la funzione continua.
1
Osserviamo che la richiesta xn 6= x0 della Proposizione 165 qui non compare poich x0 2 A:
373
(iii) Siano f; g : R ! R date da f (x) = sin x e g (x) = cos x. Poich limx!x0 sin x =
sin x0 e limx!x0 cos x = cos x0 , entrambe le funzioni sono continue. N
Esempio 208 La funzione di Dirichlet 12.2 non continua in alcun punto del proprio
dominio: come abbiamo visto nellEsempio 187, limx!x0 f (x) non esiste per alcun
x0 2 R. N
OfB. In modo ingenuo di potrebbe ritenere che una funzione come f (x) = 1=x abbia
una (vistosissima) discontinuit in x = 0. Dopotutto fa un saltonepassando da 1
a +1.
10
y
8
0
O x
-2
-4
-6
-8
-10
-2 -1 0 1 2 3 4
Funzione x1 :
In modo analogo si potrebbe ritenere per continua una funzione come g (x) = log x
perch non presenta alcun salto.
13.1. DISCONTINUIT 375
5
y
4
0
O x
-1
-2
-3 -2 -1 0 1 2 3 4
Funzione lg x:
13.1 Discontinuit
Come emerge dagli esempi appena visti, vi sono diversi tipi di discontinuit:
(ii) f non continua in x0 perch i limiti unilaterali limx!x0 f (x) e limx!x+0 f (x)
esistono niti, ma sono diversi, cio limx!x0 f (x) 6= limx!x+0 f (x) (e quindi
limx!x0 f (x) non esiste);
(iii) f non continua in x0 perch i limiti unilaterali limx!x0 f (x) e limx!x+0 f (x)
sono 1 oppure non esistono.
Per esempio, la discontinuit in x0 = 1 della funzione (13.2) ricade nel caso (i)
poich limx!1 f (x) esiste ma diverso da f (1). La discontinuit in x0 = 1 della
funzione (13.5) ricade nel caso (ii) poich
lim f (x) = 1 6= lim+ f (x) = 2
x!1 x!1
Invece, la discontinuit in x0 = 0 della funzione (13.3) ricade nel caso (iii) poich
lim f (x) = 1=
6 lim+ f (x) = +1
x!0 x!0
Allo stesso modo, la discontinuit in x0 = 0 della funzione (13.4) ricade nel caso (iii)
poich
lim f (x) = lim+ f (x) = lim f (x) = +1
x!0 x!0 x!0
(il limite bilaterale qui esiste, ma innito). Anche la funzione di Dirichlet ricade, in
ogni punto x0 2 R, nel caso (iii) poich facile vedere che non esistono neanche i suoi
limiti unilaterali.
per ogni coppia di punti x0 < x~0 . Quindi, questi limiti non possono essere inniti
salvo, al pi, negli estremi inf A e sup A del dominio.
Inoltre f non pu avere nemmeno discontinuit eliminabili, perch violerebbero la
monotonia. Dunque una funzione monotona pu soltanto presentare discontinuit a
salto. Ebbene, il prossimo risultato mostra che le discontinuit a salto di una funzione
monotona possono essere al pi uninnit numerabile. La dimostrazione di questo
utile risultato si basa sul seguente lemma, di interesse indipendente.
Dim. Siano fIj gj2J un insieme di intervalli disgiunti di R. Per la densit dei razionali,
ogni intervallo Ij contiene un razionale qj Poich gli intervalli sono disgiunti, si ha
qi 6= qj per i 6= j. Allora linsieme di razionali fqj gj2J un sottoinsieme proprio di Q
ed dunque un insieme al pi numerabile.
Osserviamo inne come lipotesi di monotonia della funzione sia indispensabile per
la numerabilit delle sue discontinuit: essa garantisce infatti la non sovrapponibilit
degli intervali in Im f determinati dai salti della funzione.
378 CAPITOLO 13. FUNZIONI CONTINUE
Dim. Mostriamo la (i), lasciando al lettore gli altri punti. Poich limx!x0 f (x) =
f (x0 ) 2 R e limx!x0 g (x) = g (x0 ) 2 R, grazie alla Proposizione 170-(i) si ha
e quindi f + g continua in x0 .
2 n
Per esempio, ogni polinomio f (x) = 0 + 1x + 2x + + nx continuo.
Infatti, per ogni x0 2 R si ha
2 n
lim f (x) = lim 0 + 1x + 2x + + nx
x!x0 x!x0
2 n
= lim 0 + lim 1x + lim 2x + + lim nx
x!x0 x!x0 x!x0 x!x0
2 n
= 0 + 1 x0 + 2 x0 + + n x0 = f (x0 ) :
Come mostra il prossimo esempio, il risultato pu essere utile anche nel calcolo dei
limiti poich, quando valgono le sue ipotesi, possiamo scrivere
x2
lim sin
x! x+
x2 2
lim sin = lim (g f ) (x) = (g f ) ( ) = sin = sin =1
x! x+ x! 2 2
13.3.1 Zeri
Il primo risultato, il Teorema degli zeri3 , molto intuitivo, ma la sua dimostrazione,
pur semplice, non banale, a riprova di come enunciati allapparenza molto intuitivi
possono anche essere di dimostrazione complessa. In eetti, lintuizione una gui-
da fondamentale nella ricerca di nuovi risultati, ma talvolta ingannevole. Non di
rado, propriet allapparenza intuitivamente ovvie si sono rivelate addirittura false.
Per questa ragione, la dimostrazione lunico criterio di validit di un risultato; lin-
tuizione, anche la pi ra nata, a un certo punto deve cedere il passo al rigore della
dimostrazione.
Teorema 180 (degli zeri) Sia f : [a; b] ! R una funzione continua. Se f (a)
f (b) 0, allora esiste c 2 [a; b] tale che f (c) = 0. Inoltre, se f strettamente
monotona, tale c unica.
Si noti che la condizione f (a) f (b) 0 equivale a richiedere che i due valori non
abbiano lo stesso segno. Il chiaro signicato intuitivo di questo teorema rivelato dalla
prossima gura
3
Il risultato anche noto sotto il nome di Teorema di Bolzano, che per primo ne diede una
dimostrazione nel 1817.
380 CAPITOLO 13. FUNZIONI CONTINUE
0.8 y
0.6
0.4
0.2
-0.2
-0.4
O a c b x
-0.6
-0.8
-1
0 0.5 1 1.5 2 2.5 3 3.5 4
e studiamo lequazione f (x) = 0. Lequazione pu non avere soluzioni reali: per esem-
pio, lequazione f (x) = 0 con f (x) = x2 + 1. Grazie al Teorema degli zeri, abbiamo il
seguente risultato, che garantisce che ogni polinomio di grado dispari possieda sempre
almeno una soluzione reale.
13.3.2 Equilibri
Il prossimo risultato unulteriore conseguenza del Teorema degli zeri, con una notev-
ole applicazione economica: lesistenza e lunicit del prezzo di equilibrio di mercato.
Siccome h continua, per il Teorema degli zeri esiste c 2 [a; b] tale che h (c) = 0, ossia
f (c) = g (c).
Se f strettamente decrescente e g strettamente crescente, allora h strettamente
decrescente, e quindi, sempre per il Teorema degli zeri, c unica.
q = D (p) = S (p) :
6
y
D
5
S
3
0
O b x
-1
-0.5 0 0.5 1 1.5 2
Teorema 184 (Teorema dei valori intermedi, Darboux) Sia f : [a; b] ! R con-
tinua. Posto
m = min f (x) e M = max f (x)
x2[a;b] x2[a;b]
Poich minx2[a;b] f (x) = min ff (x) : x 2 [a; b]g e maxx2[a;b] f (x) = max ff (x) : x 2 [a; b]g
sono rispettivamente il valore minimo e il valore massimo tra tutti i valori che f (x) as-
sume sullintervallo [a; b], anche il Teorema dei valori intermedi ha un chiaro signicato
intuitivo, evidenziato dalla prossima gura
5
y
4
M
3
z = f(c)
1
m
0 O a x c x b x
M m
-1
-1 0 1 2 3 4 5 6
M = f (x1 ) e m = f (x2 )
Il Teorema degli zeri un caso particolare del Teorema dei valori intermedi. Infatti,
se f (a) f (b) 0 e f continua, si ha
e il Teorema dei valori intermedi implica lesistenza di uno zero di f in [a; b].
detta funzione segno. Essa continua in tutti i punti di [ 1; 1] eccetto lorigine 0, in cui
ha una discontinuit non eliminabile a salto. Lipotesi di continuit del Teorema dei
valori intermedi non vale e in eetti la funzione presenta un notevole strappo: la sua
immagine consta dei soli tre punti f 1; 0; 1g e per ogni z 2 [ 1; 1], con z 6= 1; 0; 1,
non esiste alcun x 2 [ 1; 1] tale che sgn x = z.
Quindi, per funzioni continue, la richiesta che f sia crescente superua nella
denizione di forte crescenza.
Dim. Il Solo sesegue dalla denizione di funzione fortemente crescente. Per il Se,
sia x y. Poich x punto interno, esiste un naturale n su cientemente grande tale
che
B 1 (x) A 8n n
n
13.6. LIMITI E CONTINUIT DELLE APPLICAZIONI 385
In particolare, per ogni n n esiste zn 2 B1=n (x) tale che zn x y, dunque anche
zn y:. Per la forte crescenza si ha f (zn ) > f (y). Poich zn ! x, la continuit
implica f (zn ) ! f (x) e quindi, per la Proposizione 102 si ha
f (x) = lim f (zn ) f (y)
n
ym = fm (x1 ; :::; xn )
Per esempio, torniamo alle applicazioni dellEsempio 76.
6
Suggerito da Simone Cerreia-Vioglio.
386 CAPITOLO 13. FUNZIONI CONTINUE
f1 (x1 ; x2 ) = x1
f2 (x1 ; x2 ) = x1 x2
(ii) Se f : R3 ! R2 denita da
si ha
f1 (x1 ; x2 ; x3 ) = 2x21 + x2 + x3
f2 (x1 ; x2 ; x3 ) = x1 x42
se, per ogni intorno V" (L) di L, esiste un intorno U " (x0 ) di x0 tale che
Nella Sezione 9.13 si era visto che la convergenza di vettori equivale a quella delle
loro componenti. Ci permette (al lettore) di dimostrare il prossimo risultato che es-
tende la Proposizione 175 alle applicazioni e che conferma come la continuit, sebbene
appena caratterizzata in termini delle funzioni componenti, sia una propriet delle
applicazione nella loro interezza.
Lenunciato identico a quello della Proposizione 175; lunica dierenza che qui
f (xn ) ! f (x0 ) indica una convergenza di vettori in Rm .
Il valore di " , oltre che da ", dipende ovviamente anche dal punto x0 . Se dovesse
accadere che, dato " > 0, si possa scegliere lo stesso " per ogni x0 2 A (cio, ssato
"; lo stesso " potesse essere comune a tutti i punti del dominio di f ) avremmo un
concetto pi forte della continuit e che si dice continuit uniforme. Si tratta di
una notevole propriet di uniformit che permette di controllare la distanza delle
immagini jf (x) f (y)j tramite la sola distanza dei punti jx yj per ogni coppia di
punti x e y del dominio di f .
Il Teorema 188 non vale senza la compattezza di K. Diamo a tal proposito due
controesempi: nel primo consideriamo un insieme chiuso ma non limitato (la retta
reale), mentre nel secondo consideriamo un insieme limitato ma non chiuso (lintervallo
aperto (0; 1)).
1 1
jx yj < " =) <1 8x; y 2 (0; 1) (13.15)
x y
Siano x < y tali che jx yj < ", cio x < y < x + ". Si ha
Poich
"
lim = +1
x!0 x2 + "x
391
Capitolo 14
393
394 CAPITOLO 14. FUNZIONI E APPLICAZIONI LINEARI
Diamo ora unutile caratterizzazione: essa mostra come una funzione di pi variabili
sia lineare se e solo se rispetta le operazioni di somma e moltiplicazione scalare, cio
se preserva la struttura lineare di Rn .
(ii) f ( x) = f (x).
f ( x + y) = f ( x) + f ( y) = f (x) + f (y)
Prima di proseguire con altri esempi, vediamo unimportante propriet delle fun-
zioni lineari.
n
per ogni insieme di vettori fxi gi=1 in Rn ed ogni insieme di numeri reali f i gni=1 .
14.1.2 Rappresentazione
Denizione 98 Linsieme di tutti le funzioni lineari f : Rn ! R detto spazio duale
di Rn ed indicato con (Rn )0 .
per ogni x 2 Rn .
f (x) = x 8x 2 Rn :
396 CAPITOLO 14. FUNZIONI E APPLICAZIONI LINEARI
Dim. Abbiamo visto il Se nellEsempio 217. Resta da dimostrare il Solo se. Sia
perci f : Rn ! R una funzione lineare e consideriamo la base canonica fe1 ; :::; en g di
Rn . Poniamo
= f e1 ; :::; f (en ) :
P
Per ogni vettore x 2 Rn si ha x = ni=1 xi ei , e quindi
!
Xn Xn Xn
i i
f (x) = f xi e = xi f e = i xi = x
i=1 i=1 i=1
per ogni x 2 Rn .
Per quanto riguarda lunicit, sia 0 2 Rn un vettore tale che f (x) = 0
x per ogni
x 2 Rn . Allora, per ogni i = 1; :::; n, si ha
0 0
i = ei = f ei = ei = i
0
e quindi = .
14.1.3 Monotonia
Una funzione di pi variabili f : Rn ! R detta positiva se f (x) 0 per ogni
x 0 e strettamente positiva se f (x) > 0 per ogni x > 0. In altre parole, una
funzione (strettamente) positiva assegna valori f (x) (strettamente) positivi a vettori
x (strettamente) positivi.
In generale, la positivit una propriet molto pi debole della crescenza: per
esempio, la funzione denita da f (x) = kxk positiva ma non crescente. Una
prima notevole propriet delle funzioni lineari che per esse le due propriet diventano
equivalenti.
14.2 Matrici
Prima di passare allo studio delle applicazioni lineari, introduciamo le matrici, che
saranno centrali in tale studio.
Una matrice m n semplicemente una tavola, con m righe e n colonne, di numeri
reali 2 3
a11 a12 a1j a1n
6 a21 a22 a2j a2n 7
6 7
6 7
6 7
4 5
am1 am2 amj amn
398 CAPITOLO 14. FUNZIONI E APPLICAZIONI LINEARI
Per esempio, 2 3
1 5 7 9
4 3 2 1 4 5
12 15 11 9
una matrice 3 4, ove
a11 = 1 a12 = 5 a13 = 7 a14 = 9
a21 = 3 a22 = 2 a23 = 1 a24 = 4
a31 = 12 a32 = 15 a33 = 11 a34 = 9
Notazione. La matrice di componenti aij si indica con (aij ). Una matrice con m
righe e n colonne sar spesso indicata con A .
m n
La matrice 3 3: 2 3
1 5 1
4 3 4 2 5
1 7 9
quadrata, con i tre vettori riga
1 5 1 ; 3 4 2 ; 1 7 9
e i tre vettori colonna 2 3 2 3 2 3
1 5 1
4 3 5; 4 4 5; 4 2 5:
1 7 9
N
Esempio 220 (i) La matrice quadrata di ordine n che si ottiene accostando i vettori
fondamentali di Rn detta matrice identit (o unit) e indicata con In o, se non vi
possibilit di equivoco, semplicemente con I:
2 3
1 0 0
6 0 1 0 7
6 7
I = 6 .. .. .. .. 7
4 . . . . 5
0 0 1
(ii) La matrice m n con elementi tutti nulli detta nulla e indicata con Omn o, se
non vi possibilit di equivoco, semplicemente con O:
2 3
0 0 0
6 0 0 0 7
6 7
O = 6 .. .. .. .. 7 :
4 . . . . 5
0 0 0
N
(ii) dato 2 R e (aij ) 2 M (m; n), la moltiplicazione scalare (aij ) si denisce come:
2 3 2 3
a11 a1n a11 a1n
6 7 6 7
6 7=6 7;
4 5 4 5
am1 amn am1 amn
Esempio 221 Si ha
2 3 2 3 2 3
1 5 7 9 0 2 1 4 1 7 8 13
4 3 2 1 4 5+4 1 3 1 4 5=4 2 1 0 0 5
12 15 11 9 5 8 1 2 17 23 12 11
e 2 3 2 3
1 5 7 9 4 20 28 36
4
4 3 2 1 5 4
4 = 12 8 4 16 5 :
12 15 11 9 48 60 44 36
N
Esempio 222 Data una matrice quadrata A = (aij ) di ordine n e due scalari e ,
si ha 2 3
a11 + a12 a1n
6 a a + a2n 7
A+ I =6 4
21 22 7:
5
am1 am1 amn +
N
In altre parole, ricordando quanto detto nella Sezione 3.1, M (m; n) un altro
esempio di spazio vettoriale. Si noti che lelemento neutro per la somma la matrice
nulla.
(i) simmetrica quando aij = aji per ogni i; j = 1; 2; ; n, cio quando i due trian-
goli separati dalla diagonale principale sono limmagine speculare uno dellaltro;
(ii) triangolare inferiore se ha nulli tutti gli elementi sopra la diagonale principale,
ossia aij = 0 per i < j;
(iii) triangolare superiore se ha nulli tutti gli elementi sotto la diagonale principale,
ossia aij = 0 per i > j;
(iv) diagonale se simultaneamente triangolare inferiore e superiore, cio se ha nulli
tutti gli elementi fuori dalla diagonale principale: aij = 0 per i 6= j.
bij = aji
Esempio 224 Si ha
2 3 2 3
1 5 7 1 3 12
A=4 3 2 1 5 T 4
e A = 5 2 7 5
12 15 11 7 1 11
nonch 2 3
1 3
1 0 7 4
A= T
e A = 0 5 5:
3 5 1
7 1
N
402 CAPITOLO 14. FUNZIONI E APPLICAZIONI LINEARI
T
Risulta AT = A, cio la trasposta della trasposta la matrice iniziale. Si vede
molto facilmente che una matrice A quadrata simmetrica se e solo se AT = A.
Inoltre:
( A)T = AT e (A + B)T = AT + B T
per ogni 2 R e ogni A; B 2 M (m; n).
Inne, si noti che un vettore riga x = (x1 ; :::; xn ) 2 Rn si pu considerare come una
matrice 1 n, cio si pu identicare Rn con M (1; n). Secondo tale identicazione, la
trasposta xT di x il vettore colonna
2 3
x1
6 7
6 7;
4 5
xn
ossia xT 2 M (n; 1). Tale trasposta permette di identicare Rn anche come M (n; 1).
Nel seguito considereremo spesso i vettori di Rn come particolari matrici e, in tale
prospettiva, li considereremo talvolta come vettori riga, cio elementi di M (1; n), e
talvolta come vettori colonna, cio elementi di M (n; 1). Sia come sia, essi rimangono
in primis elementi di Rn .
a1 x; a2 x; :::; am x
sono i prodotti interni tra le righe di A e il vettore x. In particolare, AxT 2 M (m; 1).
14.2. MATRICI 403
Mentre possibile fare il prodotto Ax; non possibile eettuare il prodotto xA. Infatti
il numero di righe di A (che 3) non uguale al numero di colonne di x (che 1). N
2 3
1 2 1 0
1 3 1 4 2 5 2 2 5
AB =
0 1 4
0 1 3 2
1 1+3 2+1 0 1 2+3 5+1 1 1 1+3 2+1 3
=
0 1+1 2+4 0 0 2+1 5+4 1 0 1+1 2+4 3
1 0+3 2+1 2 7 18 10 8
= :
0 0+1 2+4 2 2 9 14 10
N
Il prodotto di matrici gode delle seguenti propriet, come il lettore pu vericare.
14.2. MATRICI 405
c1 = 50 ; c2 = 200 ; c3 = 80:
Per esempio, delle 500 unit della merce 1 prodotte dal settore 1, 50 sono riutilizzate
dalle stesso settore 1 e 0; 5 800 = 400 sono impiegate dal settore 2.
Viceversa, se si vuol garantire il vettore c = (100; 100; 100) di consumi nali, si
devono produrre
x1 = 2:250 ; x2 = 3:850 ; c3 = 2:050:
Per esempio, delle 3:850 unit della merce 2, 0; 3 2:250 = 675 sono utilizzate dal settore
1 e 1; 5 2:050 = 3:075 dal settore 3 e dunque ne restano disponibili 3:850 675 3:075 =
100.
per ogni x 2 Rn . facile vedere come T sia lineare. Fra poco, nel Teorema 200 vedremo
come in realt tutte le applicazioni lineari T : Rn ! Rm abbiano tale forma. Al
riguardo, si noti che lapplicazione (14.8) si pu scrivere nella forma T = (T1 ; :::; Tm ) :
Rn ! Rm introdotta nella Sezione 13.6 ponendo Ti (x) = ai x per ogni i = 1; :::; m,
dove ai li-esimo vettore riga della matrice A. N
0 (x) = 0
I (x) = x 8x 2 Rn :
T (x) = Ax
Concludiamo questa prima sezione con altre semplici propriet delle applicazioni
lineari, analoghe a quelle enunciate nella Proposizione 190 per le funzioni lineari. La
semplice dimostrazione lasciata al lettore.
n
per ogni insieme di vettori fxi gi=1 in Rn ed ogni insieme di numeri reali f i gni=1 .
per ogni x 2 Rn .
14.3.2 Rappresentazione
In questa sezione studiamo pi in dettaglio le applicazioni lineari T : Rn ! Rm .
Cominciamo col darne una rappresentazione. Nel Teorema di Riesz abbiamo visto
come un funzione L : Rn ! R sia lineare se e solo se esiste un vettore 2 Rn tale
che L (x) = x per ogni x 2 Rn . Il prossimo risultato generalizza tale risultato alle
applicazioni lineari.
Teorema 200 Unapplicazione T : Rn ! Rm lineare se e solo se esiste ununica
matrice A tale che
m n
T (x) = Ax (14.10)
n
per ogni x 2 R .
A detta matrice associata allapplicazione T .
Dim. Se. Tale direzione contenuta essenzialmente nellEsempio 229. Solo se.
Sia T unapplicazione lineare. Si ponga
A = T e1 ; T e2 ; :::; T (en ) ; (14.11)
ossia A la matrice m n le cui n colonne sono i vettori colonnaPT (ei ) per i = 1; :::; n.
n
Linsieme fei gi=1 una base di Rn e per ogni x 2 Rn si ha x = ni=1 xi ei . Quindi, per
ogni x 2 Rn ,
!
Xn Xn
i
T (x) = T xi e = xi T ei
2 i=1 3 i=1
2 3 2 3
a11 a12 a1n
6 a21 7 6 a22 7 6 a2n 7
6 7 6 7 6 7
= x1 6 .. 7 + x2 6 .. 7 + + xn 6 .. 7
4 . 5 4 . 5 4 . 5
am1 am2 amn
2 3 2 3
a11 x1 + a12 x2 + + a1n xn a1 x
6 a21 x1 + a22 x2 + 7 6
+ a2n xn 7 6 a2 x 7
6 7
= 6 .. 7=6 .. 7 = Ax
4 . 5 4 . 5
am1 x1 + am2 x2 + + amn xn am x
dove a1 , a2 , ..., am sono le righe di A.
Per quanto riguarda lunicit, sia B una matrice m n per cui valga la (14.10).
Considerando i vettori ei si ha
(a11 ; a21 ; :::; am1 ) = T e1 = Be1 = (b11 ; b21 ; :::; bm1 )
(a12 ; a22 ; :::; am2 ) = T e2 = Be2 = (b12 ; b22 ; :::; bm2 )
(a1n ; a2n ; :::; amn ) = T (en ) = Ben = (b1n ; b2n ; :::; bmn )
14.3. APPLICAZIONI LINEARI 411
e quindi A = B.
T (x) = (0; x2 ; x3 )
T e1 = (0; 0; 0)
T e2 = (0; 1; 0)
T e3 = (0; 0; 1)
e perci 2 3
0 0 0
A = T e1 ; T e2 ; T e3 = 4 0 1 0 5:
0 0 1
In conclusione, T (x) = Ax per ogni x 2 R3 . N
T (x) = (x1 x 3 ; x1 + x 2 + x 3 )
T e1 = (1; 1)
T e2 = (0; 1)
T e3 = ( 1; 1)
e perci
1 0 1
A = T e1 ; T e2 ; T e3 = :
1 1 1
Si pu quindi scrivere T (x) = Ax per ogni x 2 R3 . N
A = (aij ) e B = (bij ) :
q m m n
n q m
Dim. Siano fei gi=1 , f~
ei gi=1 e fei gi=1 rispettivamente le basi canoniche di Rn , Rq e
m
R . Si ha
Come abbiamo visto nella Sezione 14.2.2, il prodotto di matrici non in generale
commutativo, il che riette la mancanza di commutativit del prodotto di applicazioni
lineari.
14.4 Rango
14.4.1 Applicazioni lineari
Data unapplicazione T : Rn ! Rm , il suo nucleo ker T linsieme
ossia ker T = T 1 (0). In altre parole, il nucleo linsieme dei punti in cui lapplicazione
si annulla e quindi assume come valore il vettore nullo 0 di Rm .
Un altro insieme importante limmagine di T , che si denisce nel modo usuale
come
Im T = fx 2 Rm : x = T (y) per qualche y 2 Rn g (14.13)
414 CAPITOLO 14. FUNZIONI E APPLICAZIONI LINEARI
Il prossimo risultato mostra che tali insiemi sono entrambi sottospazi vettoriali, il
primo di Rn e il secondo di Rm .
T ( x + x0 ) = T (x) + T (x0 ) = 0 + 0 = 0
come desiderato.
Dim. Se. Sia T : Rn ! Rm unapplicazione lineare tale che ker T = f0g. Siano
x; y 2 Rn con x 6= y. Essendo x y 6= 0, lipotesi ker T = f0g implica T (x y) 6= 0,
e quindi T (x) 6= T (y). Solo se. Sia T : Rn ! Rm unapplicazione lineare iniettiva
e sia x 2 ker T . Se x 6= 0, per liniettivit si ha la contraddizione T (x) 6= T (0) = 0.
Si ha quindi x = 0, il che implica ker T = f0g.
Possiamo ora enunciare limportante Teorema di rango e nullit, che aerma che
la dimensione di Rn , cio n, sia sempre la somma delle dimensioni dei due sottospazi
ker T e Im T . A tal ne, diamo un nome alle due dimensioni.
Dim. Posto (T ) = k e (T ) = l, sia fxi gki=1 una base del sottospazio vettoriale Im T
di Rm e fxi gli=1 una base del sottospazio vettoriale ker T di Rn . Essendo fxi gki=1
Im T , per denizione esistono k vettori fyi gki=1 in Rn tali che T (yi ) = xi per ogni
i = 1; :::; k. Si ponga
S = fy1 ; :::; yk ; x1 ; :::; xl g :
Per dimostrare il teorema su ciente mostrare che S una base di Rn . Infatti in tal
caso S consta di n vettori e quindi r + l = n. Per prima cosa, mostriamo che S un
insieme linearmente indipendente. Sia f 1 ; :::; k ; 1 ; :::; l g R tale che
X
k X
l
i yi + i xi = 0: (14.15)
i=1 i=1
Pl Pl
Siccome fxi gli=1 una base di ker T , si ha i=1 iT (xi ) = T i=1 i xi = 0. Poich
T (0) = 0, la (14.15) implica
X
k X
l X
k X
k
Essendo una base, fxi gki=1 un insieme linearmente indipendente e quindi (14.16)
P
implica i = 0 per ogni i = 1; :::; k. Pertanto, (14.15) si riduce a li=1 i xi = 0, il che
implica i = 0 per ogni i = 1; :::; l poich anche fxi gli=1 , essendo una base, un insieme
linearmente indipendente. In conclusione, linsieme S linearmente indipendente.
Resta da mostrare che Rn = span S. Sia x 2 Rn e si consideri la sua immagine
T (x). Per denizione, T (x) 2 Im T e quindi, siccome fxi gki=1 una base di Im T ,
P
esiste un insieme f i gki=1 R tale che T (x) = ki=1 i xi . Avendo posto xi = T (yi )
per ogni i = 1; :::; k, si ha
!
X
k X
k
T (x) = iT (yi ) = T i yi :
i=1 i=1
Pk Pk
Pertanto, T x i=1 i yi = 0 e quindi x i=1 i yi 2 ker T . Daltra parte,
fx gl una base di ker T , e dunque esiste un insieme f i gli=1 R tale che x
Pki i=1 Pl Pk Pl
i=1 i yi= i=1 i xi . In conclusione, x = i=1 i yi + i=1 i xi , il che mostra che
x 2 span S, come desiderato.
come desiderato.
Per una generica funzione, liniettivit e suriettivit sono propriet ben diverse e
indipendenti. molto facile costruire esempi di funzioni iniettive ma non suriettive,
e viceversa. Il prossimo importante risultato, che rappresenta unaltra notevole con-
seguenza del Teorema 205, mostra come per le applicazioni lineari da Rn a Rn le due
propriet risultino invece equivalenti.
(i) T biiettiva,
(iii) Im T = Rn .
Dim. (i) implica banalmente (ii). Per il converso, assumiamo (ii), ossia ker T = f0g.
Siccome (T ) = 0, la (14.14) implica (T ) = n. Essendo Im T un sottospazio di Rn ,
ci implica Im T = Rn e pertanto, (ii) implica (iii).
Resta da dimostrare che (iii) implica (i). Si assuma quindi (iii), ossia Im T = Rn .
Per mostrare che T biiettiva ci basta mostrare che iniettiva. Usando la (14.14), da
(T ) = n scende che (T ) = 0, il che implica ker T = f0g. Per la Proposizione 204,
si ha quindi che T iniettiva, come desiderato.
Un modo equivalente per enunciare la seconda parte del Corollario 207 dire che
le seguenti condizioni sono equivalenti:
(i) T biiettiva,
(ii) (T ) = 0,
(iii) (T ) = n.
14.4. RANGO 417
Teorema 210 Per ogni matrice A, i numeri massimi di righe e di colonne linearmente
indipendenti coincidono:
(A) = AT :
Dim. Sia A = (aij ) 2 M (m; n). Nella dimostrazione indichiamo la riga i-esima con Ri
e la colonna j-esima con Cj . Dobbiamo dimostrare che il sottospazio di Rn generato
dalle righe di A, detto spazio delle righe di A, ha la stessa dimensione del sottospazio
di Rm generato dalle colonne di A, detto spazio delle colonne di A. Sia r la dimensione
dello spazio delle righe di A e sia fx1 ; x2 ; :::; xr g Rn una base di tale spazio, dove
Concentriamoci ora sulla prima colonna di A, C1 = (a11 ; a21 ; :::am1 ). La prima com-
ponente a11 di C1 uguale alla prima componente di R1 , la seconda componente a21
di C1 uguale alla prima componente di R2 , e cos via sino alla m-esima componente
am1 di C1 che uguale alla prima componente di Rm . Grazie alla (14.17), si ha
ossia 2 3 2 1 3 2 1 3 2 3
a11 w1 w2 wr1
6 a21 7 6 2 7 6 2 7 6 wr2 7
C1 = 6 7 = x11 6 w1 7 + x21 6 w2 7 + + xr1 6 7:
4 5 4 5 4 5 4 5
m m m
am1 w1 w2 wr
14.4. RANGO 419
r = (A) AT
(i) T iniettiva;
(ii) T suriettiva;
OfB. Talvolta si denisce come rango per righe il massimo numero di righe linearmente
indipendenti, e come rango per colonne ci che noi abbiamo denito come rango, ossia
il massimo numero di colonne linearmente indipendenti. Secondo queste denizioni, il
Teorema 210 aerma che il rango per colonne coincide sempre col rango per righe. Il
rango il loro comune valore.
14.4.3 Propriet
Dal Teorema 210 segue che, se A 2 M (m; n), si ha
Se accade che (A) = min fm; ng, la matrice A detta di rango pieno (o di rango
massimo): pi di tanto non pu essere.
Si noti che il rango di una matrice non cambia scambiando di posto due colonne.
Ci consente di assumere senza perdere di generalit che, per una matrice A di rango
r, siano le prime r colonne a essere linearmente indipendenti. Tale utile convenzione
verr usata pi volte nelle dimostrazioni della sezione.
(iii) (A) = AT A .
Il punto (i) mostra il comportamento del rango rispetto alle operazioni vettoriali
di somma e moltiplicazione scalare. I punti (ii) e (iii) sono interessanti propriet di
invarianza del rango rispetto alla moltiplicazione di matrici. Al riguardo, la matrice
quadrata AT A, detta matrice di Gram, importante in Statistica (la incontreremo a
proposito del Metodo dei minimi quadrati).
2 3 2 3
aR
1 aR R
1 d1 a1 d2 aR
1 dn
6 aR 7 6 a2 d1 a2 d2
R R
aR 7
2 dn 7
AD = 6
4
2 7 [d1 jd2 j
5 jdn ] = 6
4 5
aR
m aR R
m d1 am d2 aR
m dn
Supponiamo per assurdo che sia (AD) < (A) = r. Allora, nelle combinazioni lineari
(14.19) una delle prime r colonne di A ha coe ciente sempre nullo (se cos non fosse, lo
spazio delle colonne di AD avrebbe dimensione almeno r, essendo a1 ; a2 ; :::; ar vettori
linearmente indipendenti di Rm ). Senza perdita di generalit supponiamo che sia la
colonna a1 ad avere coe ciente nullo in tutte le combinazioni lineari (14.19). Allora
si ha
d11 = d12 = = d1n = 0
il che assurdo poich D ha rango pieno e non pu avere una riga di soli zeri. Quindi
lo spazio generato dalle colonne di AD ha dimensione almeno r, cio (AD) r.
Insieme alla (14.20), ci prova la tesi.
(iii) Se A, e quindi AT , sono di rango pieno, laermazione segue dal punto prece-
dente. Sia A non di rango pieno e sia (A) = r, con r < minfm; ng. Come visto nel
punto (ii), le colonne di AT A sono combinazioni lineari delle colonne di AT , quindi
BT BTB BTC
AT A = [B C] = :
CT C TB C TC
Per la propriet (ii), la submatrice B T B, che quadrata di ordine r, ha rango pieno
r. Allora, le r colonne di B T B sono vettori di Rr linearmente indipendenti. Di
conseguenza le prime r colonne di AT A sono vettori di Rn linearmente indipendenti
(se cos non fosse, le r colonne di B T B non sarebbero linearmente indipendenti). Lo
spazio delle colonne di AT A ha dimensione almeno r, cio (AT A) r. Insieme alla
(14.21), ci prova la tesi.
hanno entrambe rango 3: la prima ha le prime tre colonne linearmente indipendenti (si
tratta dei tre vettori fondamentali di R3 ); la seconda ha le prime tre righe linearmente
indipendenti. Le matrici (14.22) sono un caso particolare di matrici a scala, che sono
caratterizzate dalle seguenti propriet:
(i) le righe con componenti non tutte nulle hanno 1 come prima componente non
nulla, detta componente pilota;
(ii) le altre componenti della colonna della componente pilota sono tutte nulle;
(iii) le componenti pilota formano una scaletta da sinistra a destra: una compo-
nente pilota di una riga inferiore alla destra della componente pilota di una
riga superiore;
(iv) le eventuali righe con tutte componenti nulle sono sotto le altre righe, ossia nella
parte bassa della matrice.
nella quale le componenti pilota sono evidenziate in grassetto. Si noti che una matrice
quadrata a scala quando diagonale, eventualmente seguita da righe di soli zeri: per
esempio 2 3
1 0 0
4 0 1 0 5:
0 0 0
immediato vericare che le righe non nulle (cio le righe con almeno una com-
ponente non nulla) sono linearmente indipendenti. Il rango di una matrice a scala
perci manifesto:
Lemma 212 Il rango di una matrice a scala pari al numero di righe non nulle.
nella quale alla prima riga stata sommata la seconda moltiplicata per .
14.4. RANGO 425
ove: (1) moltiplicazione della prima riga per 1=3; (2) somma della prima riga alla
seconda; (3) somma di 5 volte la prima riga alla terza; (4) sottrazione della seconda
riga dalla prima; (5) somma della met della seconda riga alla terza; (6) somma di 3=2
della terza riga alla prima; (7) sottrazione di 22=12 della terza riga dalla seconda; (8)
moltiplicazione della seconda riga per 3=2 e della terza per 1=4. In conclusione
2 3
1 0 0 23
A=4 0 1 0 21 5
4
7
0 0 1 4
N
Tornando al calcolo del rango, che era la motivazione iniziale della sezione, la
Proposizione 211 mostra che le operazioni elementari per riga non modicano il rango
di A poich le matrici elementari sono quadrate e non singolari. Si ha quindi:
Esempio 240 Nellultimo esempio A = 3 perch tutte e tre le righe non sono
nulle. Grazie alla Proposizione 214, (A) = 3. La matrice A di rango massimo. N
1 0
A= :
1 2
1
Lapplicazione T invertibile, con T (x) = Bx per ogni x 2 R2 , dove
1 0
B= 1 1 :
2 2
Grazie al Corollario 207, nellultima sezione abbiamo visto una prima caratteriz-
zazione dellinvertibilit tramite la nozione di rango. Si pu dare unaltra caratteriz-
zazione dellinvertibilit.
Dim. Solo se. Sia T invertibile; la (14.23) implica che la (14.24) vale con S =
R = T 1 . Se. Assumiamo che esistano S; R 2 L (Rn ) tali che valga la (14.24).
Siano x; y 2 Rn , x 6= y. Si ha T (x) 6= T (y) e quindi T iniettiva. Infatti, se fosse
T (x) = T (y), per la (14.24) si avrebbe
x = R (T (x)) = R (T (y)) = y;
T (y) = T (S (x)) = x
1 0 1 1 0
A= e A = 1 1 :
1 2 2 2
Dalla (14.23) si ha
A 1 A = AA 1
= I:
Pi in generale, alla luce del Corollario 209 e della Proposizione 216, si ha la seguente
caratterizzazione:
Corollario 217 Per una matrice quadrata A di ordine n le seguenti propriet sono
equivalenti:
(i) A invertibile;
(iv) (A) = n;
Fin qui tutto bene. Il problema per calcolare materialmente linversa di una
matrice (invertibile), ossia, data una matrice invertibile A, trovare le componenti della
sua inversa A 1 . Per far ci, dobbiamo fermarci e introdurre i determinanti.
14.6. DETERMINANTI 429
14.6 Determinanti
14.6.1 Denizione
Una matrice contenuta in una matrice A 2 M (m; n) si dice sottomatrice di A. Essa si
pu pensare come ottenuta da A cancellando alcune righe e/o colonne. In particolare,
si indica con Aij la sottomatrice (m 1) (n 1) che si ottiene da A cancellando la
riga i e la colonna j.
Denizione 104 Il determinante la funzione det : M (n) ! R tale che, per ogni
A 2 M (n):
det A = ( 1)1+1 a11 det ([a22 ]) + ( 1)1+2 a12 det ([a21 ]) = a11 a22 a12 a21 :
Per esempio, se
2 4
A= ;
1 3
si ha det A = 2 3 4 1 = 2. N
430 CAPITOLO 14. FUNZIONI E APPLICAZIONI LINEARI
det A = ( 1)1+1 a11 det A11 + ( 1)1+2 a12 det A12 + ( 1)1+3 a13 det A13
= a11 det A11 a12 det A12 + a13 det A13
= a11 (a22 a33 a23 a32 ) a12 (a21 a33 a23 a31 ) + a13 (a21 a32 a22 a31 )
= a11 a22 a33 + a12 a23 a31 + a13 a21 a32 a11 a23 a32 a12 a21 a33 a13 a22 a31 :
e quindi
Esempio 246 Se A ha tutti gli elementi della prima riga tutti nulli tranne il primo
che vale 1, risulta
2 3
1 0 0 2 3
6 a21 a22 7 a22 a2n
6 a2n 7 6 .. .. .. 7
det 6 .. .. .. .. 7 = det 4 . . . 5
4 . . . . 5
an2 ann
an1 an2 ann
14.6. DETERMINANTI 431
ovvero il suo determinante coincide con quello della sottomatrice A11 . Infatti, in
X
n
det A = ( 1)1+j a1j det A1j ;
j=1
sono nulli tutti gli addendi salvo il primo. Pi in generale, per ogni scalare k si ha
2 3
k 0 0 2 3
6 a21 a22 a a
6 a2n 77 6 .
22
..
2n
.. 7 :
det 6 .. .. .. .. 7 = k det 4 .. . . 5
4 . . . . 5
an2 ann
an1 an2 ann
ottenuta scambiando i primi due elementi di N e lasciando invariati gli altri, identi-
cata dalla funzione : N ! N tale che
Teorema 219 Si ha
X Y
n
det A = sgn ai (i) (14.25)
2 i=1
14.6.2 Propriet
La prossima proposizione raccoglie le principali propriet dei determinanti, utili anche
per il loro calcolo. In essa linea sta indierentemente per riga o per colonna: le
propriet valgono infatti simmetricamente sia per le righe sia per le colonne della
matrice. Linee parallelesignica due righe oppure due colonne.
Proposizione 220 Siano A e B due matrici quadrate dello stesso ordine. Allora:
(ii) Se si moltiplica una linea di A per uno scalare k, il determinante risulta molti-
plicato per k.
(iii) Se si scambiano tra loro due linee parallele, il determinante cambia (solo) di
segno.
(vi) Se si somma a una linea un multiplo di una linea parallela, il determinante non
cambia.
(iv) Sia A la matrice che ha la riga i uguale alla riga j e sia Aij la matrice A con
le righe i e j scambiate. Allora, per il punto (iii) det Aij = det A. Tuttavia, poich
le due righe scambiate sono uguali, si ha A = Aij , quindi det Aij = det A. Questo
possibile se e solo se det Aij = det A = 0:
(v) Sia
2 1 3 2 1 3
a a
6 a2 7 6 a2 7
6 . 7 6 . 7
6 . 7 6 . 7
6 . 7 6 . 7
A=6 r 7=6 7:
6 a 7 6 b+c 7
6 . 7 6 . 7
4 .. 5 4 .. 5
am am
Indichiamo con 2 3 2 3
a1 a1
6 a2 7 6 a2 7
6 .. 7 6 .. 7
6 7 6 7
6 . 7 6 . 7
Ab = 6 7 e Ac = 6 7
6 b 7 6 c 7
6 .. 7 6 .. 7
4 . 5 4 . 5
am am
le due matrici che si ottengono considerando come r-esima riga una volta b e una volta
c. Risulta allora
!
X Yn X Y
det A = sgn ai (i) = sgn ai (i) (b + c)r (r)
2 i=1 2 i6=r
! !
X Y X Y
= sgn ai (i) br (r) + sgn ai (i) cr (r) = det Ab + det Ac
2 i6=r 2 i6=r
La matrice ottenuta da A sommando per esempio k volte la prima riga alla seconda,
B 2 3
a1
6 a2 + ka1 7
6 7
B=6 .. 7:
4 . 5
m
a
434 CAPITOLO 14. FUNZIONI E APPLICAZIONI LINEARI
Siano inoltre 2 3 2 3
a1 a1
6 ka1 7 6 a1 7
6 7 6 7
C=6 .. 7 e D=6 .. 7
4 . 5 4 . 5
am am
Per il punto (v) si ha det B = det A + det C. Daltra parte, per il punto (ii) si ha
det C = k det D. Ma poich D ha due righe uguali, per il punto (i) si ha det D = 0:
Quindi det B = det A.
(vii) La trasposizione non altera nessuno degli n! prodotti che formano il determi-
nante, nonch la loro parit.
(1) moltiplicando una riga della matrice A per una costante 6= 0 il determinante
della matrice trasformata pari a det A (punto (ii) della Proposizione 220);
(2) sommando a una riga di A il multiplo di unaltra riga, il determinante della
matrice trasformata non cambia (punto (vi) della Proposizione 220);
(3) scambiando due righe di A il determinante della matrice trasformata pari a
det A (punto (iii) della Proposizione 220).
Dim. Se (almeno) una delle due matrici, diciamo A, ha le righe linearmente dipendenti
lasserto banalmente vero perch le righe di AB, essendo combinazioni lineari di quelle
di A, sono anchesse linearmente dipendenti e quindi
che la tesi.
Se A non diagonale, possibile trasformarla in matrice diagonale applicando
opportunamente la seconda e la terza delle operazioni per righe elencate nellalgorit-
mo di Gauss. Come si visto, tali operazioni equivalgono a premoltiplicare A per
una opportuna matrice. In particolare, per sommare volte la riga r alla riga s si
premoltiplica A per la matrice Srs ( ) che la matrice identit con 6= 0 nel posto
(r; s) anzich lo 0. Per scambiare le righe r ed s si premoltiplica A per la matrice Trs
ottenuta dallidentit scambiando le righe r ed s.
Nel rendere diagonale A (cio nel diagonalizzarla), supponiamo di eettuare prima
le trasformazioni T di scambio righe e poi le trasformazioni S ( ) di somma di un
multiplo di una riga ad unaltra riga. Supponiamo inoltre che occorra eettuare h
volte la trasformazione S ( ) e k volte la trasformazione T per avere una matrice
diagonale. Sia D la matrice diagonale cos ottenuta, cio
D = S ( )S ( ) S ( )T T T A:
| {z }| {z }
h k
e quindi
det DB = ( 1)k det A det B: (14.26)
Analogamente, poich il prodotto tra matrici gode della propriet associativa, si ha
DB = (S ( ) S ( )T T A) B = (S ( ) S ( )T T ) (AB)
A = aij
con i; j = 1; 2; ; n.
1 2
A11 = e det A11 = 16:
6 4
5 2
A12 = e det A12 = 26
3 4
5 1
A13 = e det A13 = 34:
3 6
Analogamente
Quindi 2 3
16 26 34
A =4 12 4 15 5 :
6 2 16
N
Dim. Per la prima riga lasserto una semplice parafrasi della denizione di deter-
minante. Verichiamolo per la riga i-esima. Per il punto (vi) della Proposizione 220
possiamo riscrivere det A nel seguente modo:
2 3
a11 a1j a1n
6 .. .. 7
6 . . 7
6 7
det A = det 6 ai1 aij ain 7 (14.28)
6 . . 7
4 .. .. 5
an1 anj ann
2 3
a11 a1j a1n
6 .. .. 7
6 . . 7
6 7
= ai1 det 6 1 0 0 7+
6 . .. 7
4 .. . 5
an1 anj ann
2 3
a11 a1j a1n
6 .. .. 7
6 . . 7
6 7
+ aij det 6 0 1 0 7+
6 . .. 7
4 .. . 5
an1 anj ann
2 3
a11 a1j a1n
6 .. .. 7
6 . . 7
6 7
+ ain det 6 0 0 1 7
6 . .. 7
4 .. . 5
an1 anj ann
Calcoliamo il determinante della sottomatrice relativa al termine (i; j):
2 3
a11 a1j a1n
6 .. .. 7
6 . . 7
6 7
det 6 0 1 0 7 (14.29)
6 . .. 7
4 .. . 5
an1 anj ann
14.6. DETERMINANTI 439
e = 1 det Aij
det A
e quindi
2 3
a11 a1j a1n
6 .. .. 7
6 . . 7
6 7 e = ( 1)i+j det Aij = a : (14.30)
det 6 0 1 0 7 = ( 1)i+j 2
det A ij
6 . .. 7
4 .. . 5
an1 anj ann
N
440 CAPITOLO 14. FUNZIONI E APPLICAZIONI LINEARI
Proposizione 224 La somma dei prodotti degli elementi di una riga (colonna) qual-
siasi per i complementi algebrici di una diversa riga (colonna) nullo.
Dim. Immaginiamo di sostuire la i-esima riga alla q-esima. Risulta allora det A =
P n
j=1 aij aqj . Ma, daltra parte, il determinante nullo perch la matrice ha due righe
uguali.
Sommiamo i prodotti degli elementi della seconda riga per i complementi algebrici
della prima riga:
Sommiamo i prodotti degli elementi della seconda riga per i complementi algebrici
della prima riga:
(2)a31 + (1)a32 + (3)a33 = 4 1 3 = 0:
Il lettore pu vericare che si ottiene 0 in tutti i casi in cui si sommino i prodotti degli
elementi di una riga per i complementi algebrici di una riga diversa. N
1 se i = j
ij =
0 se i 6= j
(i) A invertibile;
442 CAPITOLO 14. FUNZIONI E APPLICAZIONI LINEARI
(v) (A) = n;
Dim. Se
2 3 2 3
aR
1 a1 R
6 aR 7 6 a2 R 7
A = (aij ) = 6
4
2 7
5 e A = (aij ) = 6
4
7
5
aR
n anR
si ha 2 3
aR
1
6 aR 7 R
A(A )T = 6
4
2 7 a1 j a2 R j
5 j anR :
aR
n
X
n
det A se i = q
C
ai aC
q = aji ajq = ;
0 se i 6= q
j=1
Esempio 250 Usiamo la formula (14.31) per calcolare linversa della matrice
1 2
A= :
3 5
Si ha
det A11 a22 5
a111 = ( 1)1+1 = == 5
det A a11 a22 a12 a21 1
det A21 a12 2
a121 = ( 1)1+2 = = =2
det A a11 a22 a12 a21 1
det A12 a21 3
a211 = ( 1)2+1 = = =3
det A a11 a22 a12 a21 1
det A22 a11 1
a221 = ( 1)2+2 = = = 1
det A a11 a22 a12 a21 1
e quindi
a22 a12
1 det A det A
5 2
A = a21 a11 = :
det A det A
3 1
N
Esempio 251 Una matrice diagonale A invertibile se nessun elemento della di-
agonale nullo. In tal caso linversa A 1 diagonale e la formula (14.31) implica
che
1
1 aij
se i = j
aij = :
0 se i 6= j
N
N
Da ultimo si osservi che, per stabilire se k assegnati vettori x1 ; x2 ; :::; xk 2 Rn sono
linearmente indipendenti (con k n altrimenti la risposta certamente negativa)
si pu costruire la matrice n k che ha come colonne i suddetti vettori: essi sono
linearmente indipendenti se e solo se il rango di tale matrice k. In particolare quando
k = n il determinante della matrice a dare una risposta al problema: esso diverso
da zero se e solo se i vettori sono linearmente indipendenti.
Proposizione 227 (Kronecker) Le seguenti propriet sono equivalenti per una ma-
trice A:
(i) A ha rango r;
(ii) A ha un minore di ordine r non nullo e tutti i minori di ordine r + 1 sono nulli;
(iii) A ha un minore di ordine r non nullo e tutti i minori di ordine r + 1 che lo
contengono nulli;
(iv) A ha un minore di ordine r non nullo e tutti i minori di ordine > r nulli.
(i) Si sceglie come pilota una sottomatrice quadrata di ordine di A che sia
visibilmente non singolare (con determinante non nullo); siccome locchio ha i
suoi limiti, concretamente si prende spesso una sottomatrice di ordine 2.
(ii) Si orla in tutti i modi possibili la sottomatrice pilota con una delle righe e
una delle colonne superstiti. Se tutti tali minori orlati (di ordine + 1) sono
nulli, il rango di A e il procedimento nisce qui. Se ci si imbatte in un minore
non nullo di ordine + 1, si riparte prendendolo come nuovo pilota.
Esempio 254 Sia 2 3
6 3 9 0
A=4 4 1 7 2 5:
8 10 6 12
Scegliamo come pilotail minore di ordine 2
6 3
det = 6 6= 0
4 1
e quindi il rango di A almeno 2. Con le ultime due colonne e lultima riga non
utilizzate si ottengono i seguenti minori orlati:
2 3 2 3
6 3 9 6 3 0
det 4 4 1 7 5 = 0 ; det 4 4 1 2 5=0
8 10 6 8 10 12
e perci il rango di A 2. N
Da ultimo, facciamo esplicitamente notare che il rango di una matrice simultane-
amente tante cose (e ognuna ne una plausibile denizione):
1. il rango di una matrice il massimo numero di colonne linearmente indipendenti;
2. il rango di una matrice il massimo numero di righe linearmente indipendenti;
3. il rango di una matrice il massimo ordine dei suoi minori non tutti nulli;
4. il rango di una matrice la dimensione dello spazio vettoriale delle immagini
della funzione lineare da essa determinata.
A x = b (14.32)
n nn 1 n 1
Esistenza: quali condizioni assicurano che il sistema abbia soluzione per ogni
vettore b 2 Rn , ossia quando, per ogni dato b 2 Rn , esiste x 2 Rn tale che
Ax = b?
Unicit: quali condizioni assicurano che tale soluzione sia unica, ossia quando,
per ogni dato b 2 Rn , esiste un unico x 2 Rn tale che Ax = b?
La condizione cercata perci linvertibilit della matrice A, o una delle sue equiv-
alenti propriet (ii) e (iii). Formalmente, si ha il seguente risultato, spesso chiamato
Teorema di Cramer, che discende facilmente da quanto abbiamo visto nora.
5
Si ricordi che una funzione iniettiva se e solo se tutte le sue controimmagini sono singoletti.
448 CAPITOLO 14. FUNZIONI E APPLICAZIONI LINEARI
Teorema 228 (Cramer) Sia A 2 M (n). Il sistema (14.32) ha una sola soluzione
per ogni b 2 Rn se e solo se la matrice A invertibile. La soluzione data da
x = A 1 b:
Esempio 255 Un caso particolare del sistema (14.32) si ha quando b = 0. In tal caso
il sistema detto omogeneo e, per la Proposizione 228, lunica soluzione x = 0. N
x1 + 2x2 = b1
3x1 + 5x2 = b2
si ha
1 2
A=
3 5
6
Alternativamente, si pu dimostrare il Seanche nel seguente modo, molto meccanico. Si ponga
x = A 1 b; si ha
Ax = A A 1 b = AA 1 b = Ib = b;
1
e quindi x = A e 2 Rn unaltra soluzione,
b risolve il sistema. anche lunica soluzione. Infatti, se x
si avrebbe
1 1 1
e = Ix
x e= A e=A
A x (Ae
x) = A b;
come desiderato.
14.7. SISTEMI LINEARI QUADRATI 449
77 112 210
x= ; ;
266 266 266
N
450 CAPITOLO 14. FUNZIONI E APPLICAZIONI LINEARI
1
(ii.a) determinato quando ammette una sola soluzione, cio T (b) un singoletto;
1
(ii.b) indeterminato quando ammette innite soluzioni, cio T (b) ha cardinalit
innita.
A ( x + (1 ) x0 ) = Ax + (1 ) Ax0 = b + (1 ) b = b:
Ajb
m (n+1)
la 3a riga = 2a riga 1a riga, le tre righe non sono linearmente indipendenti: (A) =
(Ajb) = 2 e il sistema possibile. N
Esempio 260 Un sistema omogeneo sempre possibile perch il vettore nullo sem-
pre una sua soluzione. Ci si conferma applicando il Teorema di Rouch-Capelli perch
per un sistema omogeneo si confrontano i ranghi di A e di Aj0: essi sono sempre uguali
e quindi il sistema sempre possibile. N
Si osservi come il Teorema di Rouch-Capelli consideri una data coppia (A; b),
mentre il Teorema di Cramer considera come data solo una matrice quadrata A. Ci
riette la nuova direzione (ii) prima menzionata e, per tale ragione, i due teoremi sono
solo parzialmente confrontabili nel caso di matrici A quadrate. Infatti, il Teorema di
Cramer considera solo il caso (A) = n, in cui la condizione (14.33) automaticamente
soddisfatta per ogni b 2 Rn (perch?); per tale caso esso pi potente del Teorema
di Rouch-Capelli: lesistenza vale per ogni vettore b e, inoltre, si ha anche lunicit.
452 CAPITOLO 14. FUNZIONI E APPLICAZIONI LINEARI
La dimostrazione si basa sulla seguente generalizzazione del Lemma 204, che aveva
stabilito lequivalenza tra iniettivit di unapplicazione T e la banalit del suo nucleo
(cio, ker T = f0g).
Corollario 232 Se x una soluzione del sistema Ax = b, tutte le altre sono del tipo
x+z
Quindi, una volta trovata una soluzione del sistema Ax = b, tutte le altre soluzioni
si trovano sommandovi le soluzioni del sistema omogeneo Ax = 0. Ci permette di
dimostrare la Proposizione 230.
Dim. della Proposizione 230 Per ipotesi, il sistema ha almeno una soluzione x.
Inoltre, poich (A) = (T ), dal Teorema di rango e nullit segue che (A)+ (T ) = n.
Se (A) = n, si ha (T ) = 0, cio ker T = f0g. Dal Corollario 232 segue che x
lunica soluzione. Se, invece, (A) < n si ha (T ) > 0 e quindi ker T un sottospazio
14.9. RISOLUZIONE DI SISTEMI 453
vettoriale non banale di Rm , con inniti elementi. Grazie al Corollario 232, sommando
tali elementi alla soluzione x si trovano le innite soluzioni del sistema.
Oltre al suo interesse teorico, da un punto di vista operativo il Corollario 232 mostra
che un possibile modo per risolvere il sistema Ax = b di trovarne una soluzione e di
sommarvi tutte le soluzioni del sistema omogeneo Ax = 0.7 La via tanto pi utile
quanto pi semplice risolvere il sistema omogeneo rispetto a quello originario.
Tirando le la dei risultati della sezione, siamo ora in grado di enunciare un risultato
generale sulla risoluzione dei sistemi lineari che combina il Teorema di Rouch-Capelli
e la Proposizione 230.
Il confronto dei ranghi (A) e (Ajb) col numero n delle incognite permette quindi
di stabilire lesistenza ed eventuale unicit delle soluzioni del sistema. Se il sistema
quadrato, si ha8 (A) = n se e solo se (A) = (Ajb) = n per ogni b 2 Rm . Il Teorema
di Cramer, che era solo parzialmente confrontabile col Teorema di Rouch-Capelli,
quindi un caso speciale del pi generale Teorema 233.
14.9.1 Cramer
piuttosto diusa lidea, sbagliata ma aggiustabile, che un sistema lineare Ax = b,
con A 2 M (m; n),
Lidea sbagliata perch pu benissimo accadere che alcune equazioni siano ridon-
danti: qualcuna multipla di unaltra oppure combinazione lineare di altre (in tali
casi esse sarebbero automaticamente vericate non appena lo fossero le altre). Alla
luce Teorema 233, le aermazioni diventano giuste a patto di intendere m come il
numero delle equazioni non ridondanti, cio come il rango di A: infatti esso conta le
equazioni che non si possono esprimere come combinazioni lineari di altre.
Losservazione conduce a una procedura che si rivela utilissima per il calcolo mate-
riale. Consideriamo un generico sistema lineare Ax = b con A 2 M (m; n) e poniamo
che (A) = k.
9
Si dice anche che vi sono pi gradi di libert che vincoli. Lopposto vale in (iii).
10
Spesso ce ne pi duna, cio c una certa libert nello scegliere quali equazioni cancellare e quali
incognite sono false.
14.9. RISOLUZIONE DI SISTEMI 455
dellEsempio 259. Dato che, come sera gi visto, per entrambe le matrici incompleta e
completa, la 3a riga = 2a riga 1a riga, le tre righe non sono linearmente indipendenti:
(A) = (Ajb) = 2 e il sistema possibile.
Lultima equazione ridondante: cancelliamola. Lultima incognita pu assumere
valore arbitrario: poniamo x3 = z. In tal modo, il sistema si riduce a:
(
x1 + 2x2 = 3 3z
6x1 + 4x2 = 7 2z
1 11 1 + 11
1a : 1 +z +2 2z +3 z = +0 z =3
4 8 4
1 11 6 + 22
2a : 6 +z +4 2z +2 z = + 0 z = 7:
4 8 4
456 CAPITOLO 14. FUNZIONI E APPLICAZIONI LINEARI
e avremmo potuto assegnare valore arbitrario alla prima incognita, diciamo x1 = z~,
anzich alla terza11 . Il sistema sarebbe diventato:
2x2 + 3 = 3 z~
;
2x2 x3 = 7 5~z
14.9.2 Gauss
La procedura di risoluzione di sistemi basata sulla regola di Cramer elegante dal punto
di vista teorico, ma dal punto di vista computazionale vi una procedura migliore,
basata sul Procedimento gaussiano di eliminazione. Vale infatti il:
Lemma 234 Due sistemi lineari hanno lo stesso insieme di soluzioni se le loro matrici
complete si trasformano nella stessa matrice a scala.
11
La tilda su z aiuta a distinguere questo caso dal precedente.
14.9. RISOLUZIONE DI SISTEMI 457
Esempio 263 NellEsempio 246 avevamo visto che il Procedimento gaussiano di elim-
inazione trasforma la matrice 2 3
3 2 4 1
4 1 0 6 9 5
5 3 7 4
nella matrice a scala 2 3
3
1 0 0 2
4 0 1 0 21 5:
4
7
0 0 1 4
La prima matrice corrisponde al sistema:
8
< 3x1 + 2x2 + 4x3 = 1
x1 + 6x3 = 9
:
5x1 + 3x2 + 7x3 = 4
e la seconda al sistema: 8 3
< x1 = 2
21
x2 = 4
: 7
x3 = 4
che ne rappresenta la soluzione. Possiamo vericarlo:
3 21 7 9 7
1a : 3 +2 +4 = +7=1
2 4 4 2 2
3 7 3 21
2a : 1 +6 = + =9
2 4 2 2
3 21 7 15 63 49
3a : 5 +3 +7 = + = 4:
2 4 4 2 4 4
N
458 CAPITOLO 14. FUNZIONI E APPLICAZIONI LINEARI
dove z1 e z2 sono valori arbitrari. Le innite soluzioni del sistema sono perci:
48 1 16 18 11 13
x1 = ; x2 = + ; x3 = ; x4 =
7 7 7 7 7 7
con ; 2 R arbitrari. In altre parole, linsieme delle soluzioni
48 1 16 18 11 13
; + ; ; : ; 2R
7 7 7 7 7 7
detta matrice dei pagamenti (nali). Essa descrive tutti i pagamenti nei vari stati
del mondo dei titoli del listino L = fy 1 ; :::; y n g: la prima colonna descrive i pagamenti
del titolo y 1 , la seconda colonna descrive i pagamenti del titolo y 2 , e cos via. Per
esempio, la matrice di pagamenti dei titoli elementari la matrice identit.
M = span L
generato dai titoli del listino linsieme dei vettori w di pagamenti replicabili con
portafogli di tali titoli. Data una matrice di pagamenti Y , lapplicazione lineare R :
Rn ! Rm denita da
R (x) = Y x
460 CAPITOLO 14. FUNZIONI E APPLICAZIONI LINEARI
M = Im R; (14.36)
Sono quindi replicabili (ricostruibili con i due titoli quotati) tutti i vettori di paga-
menti che appartengono a M e non replicabili tutti gli altri. Per esempio, (4; 8; 14) e
( 10; 10; 40) sono replicabili, mentre (4; 8; 36) e ( 10; 10; 18) non lo sono. N
12
Usando la terminologia della Sezione 3.7 si ha h = jIj = (Y ).
14.10. IL TEOREMA FONDAMENTALE DELLA FINANZA 461
f ( x + y) = f (x) + f (y)
V = f(x1 ; x2 ; 0) : x1 ; x2 2 Rg
Dim. Sia dim V = k n e sia x1 ; :::; xk una base di V . Per il Teorema 37 esistono
n k vettori xk+1 ; :::; xn tali che linsieme complessivo fx1 ; :::; xn g una base di
Rn . Sia rk+1 ; :::; rn un insieme arbitrario di n k numeri reali e sia f : Rn ! R la
funzione lineare tale che
f (xi ) per i = 1; :::; k
f xi = :
ri per i = k + 1; :::; n
13
La versione per spazi vettoriali generali uno dei risultati centrali dellAnalisi matematica. Il
lettore che vuole limitarsi alle dimostrazioni delle relazioni (14.42) e (14.47) per mercati completi pu
saltare la sezione.
14
Sebbene qui ci concentriamo su funzioni lineari, in modo simile anche le applicazioni lineari si
possono denire su qualsiasi sottospazio vettoriale di Rn .
462 CAPITOLO 14. FUNZIONI E APPLICAZIONI LINEARI
Inoltre, essendo x1 ; :::; xk una base di V , per ogni x 2 V esistono k coe cienti reali
P
f i gki=1 tali che x = ki=1 i xi , sicch:
! !
Xk X
k X
k Xk
i i i i
f (x) = f ix = if x = if x =f ix = f (x) :
i=1 i=1 i=1 i=1
n n
Quindi f : R ! R estende su R il funzionale lineare f : V ! R.
Come risulta chiaro dalla dimostrazione, lestensione lungi dallessere unica: ad
ogni insieme fri gni=k+1 di scalari associata una diversa estensione.
Esempio 267 Consideriamo lesempio precedente, con V = f(x1 ; x2 ; 0) : x1 ; x2 2 Rg
e f : V ! R denita da f (x) = x1 + x2 . Grazie al Teorema di Hahn-Banach, esiste
una funzione lineare f : R3 ! R tale che f (x) = f (x) per ogni x 2 V . Per esempio,
f (x) = x1 + x2 + x3 per ogni x 2 R3 , ma anche f (x) = x1 + x2 + x3 per ogni 2 R.
Ci conferma la non unicit dellestensione. N
Bench dallapparenza piuttosto innocua, il Teorema di Hahn-Banach un risultato
molto potente. Vediamone una prima notevole conseguenza estendendo i teoremi di
rappresentazione visti nel capitolo (Teorema 192 e Proposizione 194) a funzioni lineari
denite su sottospazi.
Teorema 236 Sia V un sottospazio vettoriale di Rn . Una funzione f : V ! R
lineare se e solo se esiste un vettore 2 Rn tale che
f (x) = x 8x 2 V (14.37)
Dim. Mostriamo il Solo seperch il converso ovvio. Sia f : V ! R una funzione
lineare. Grazie al Teorema di Hahn-Banach, esiste una funzione lineare f : Rn ! R
tale che f (x) = f (x) per ogni x 2 V . Per il Teorema 192, esiste 2 Rn tale che
f (x) = x per ogni x 2 Rn . Quindi
f (x) = f (x) = x 8x 2 V
come desiderato.
La novit sostanziale rispetto al Teorema 192 (e alla Proposizione 194) la perdita
di unicit del vettore . Infatti, la dimostrazione mostra che tale vettore sia uni-
vocamente determinato dallestensione f la cui esistenza garantita dal Teorema di
Hahn-Banach. Ma, tali estensioni sono lungi dallessere uniche e ci implica la non
unicit del vettore .
Esempio 268 Tornando agli esempi precedenti, si gi osservato che tutte le funzioni
lineari f : R3 ! R denite da f (x) = x1 + x2 + x3 , per 2 R, estendono f su Rn .
Posto = (1; 1; ), si ha f (x) = x per ogni 2 R, sicch
f (x) = x 8x 2 V
per ogni 2 R. In questo esempio esistono quindi inniti vettori per cui vale la
rappresentazione (14.37). N
14.10. IL TEOREMA FONDAMENTALE DELLA FINANZA 463
Analogo risultato vale per la forte crescenza, e questa sar in realt la versione
rilevante per il resto del capitolo. Al riguardo, si osservi che la funzione f (x) = x1 +x2
fortemente positiva, al pari di f (x) = x1 + x2 + x3 con > 0.
p = (p1 ; p2 ; : : : ; pn ) 2 Rn
il vettore che contiene i prezzi degli n titoli espressi dal mercato al tempo 0. Vista la
perfezione del mercato, il valore di mercato di un generico portafogli x semplicemente
Xn
p x= pk xk :
k=1
v (x) = p x
ed lineare. In altre parole, solo una funzione lineare pu modellare il valore dei
portafogli su un mercato perfetto. Al riguardo, si noti che il titolo y 1 identicato
dal portafogli e1 = (1; 0; :::; 0) 2 Rn , sicch v (e1 ) = p1 ; il titolo y 2 identicato dal
portafogli e2 = (0; 1; 0; :::; 0) 2 Rn , sicch v (e2 ) = p2 ; e cos via. Il valore di mercato
dei titoli quotati il loro prezzo, cio
pk = v ek 8k = 1; 2; :::; n: (14.38)
464 CAPITOLO 14. FUNZIONI E APPLICAZIONI LINEARI
Il valore di mercato di un portafogli quindi funzione solo dei suoi pagamenti nei
vari stati. Ci permette di dare la seguente fondamentale denizione di prezzo di un
pagamento replicabile. Al riguardo si ricordi la (14.38): il prezzo dei titoli quotati
uguale al loro valore di mercato.
pw = v (x)
dove w = R (x).
La Legge del prezzo unico permette quindi di estendere la nozione di prezzo dai
titoli quotati a tutti i pagamenti replicabili. Si tratta di una prima fondamentale
conseguenza di tale legge. Ma c molto di pi. Torniamo infatti alla (14.40). Da essa
si deduce facilmente lesistenza di una funzione f : M ! R tale che v = f R, cio
pw = f (w) 8w 2 M:
Teorema 239 La coppia (Y; p) soddisfa la Legge del prezzo unico se e solo se la
funzione di prezzo lineare, ossia esiste un vettore 2 Rm tale che
pw = w 8w 2 M (14.42)
La Legge del prezzo unico garantisce lesistenza della funzione di prezzo ed equivale
alla sua linearit (la funzione f data da f (z) = z per ogni z 2 Rn ). Il prezzo di
qualsiasi pagamento replicabile w la media pesata
X
m
pw = w= i wi (14.43)
i=1
dei suoi pagamenti nei vari stati. In particolare, per i titoli quotati si ha
X
m
pk = yk = i yik :
i=1
Che la linearit della funzione di prezzo caratterizzi i mercati per i quali vale la
Legge del prezzo unico (la funzione f data da f (z) = z per ogni z 2 Rn ) un
notevolissimo risultato, alla base della teoria dei prezzi delle attivit nanziarie (asset
pricing theory).
come desiderato.
La funzione f : Rm ! R quindi lineare. Grazie al Teorema 192, esiste un vettore
2 Rm tale che f (z) = z per ogni z 2 Rm . Sostituendo tale f nella (14.41) si
ottiene la (14.42). Ci completa la dimostrazione per mercati completi.
Esempio 269 (i) Supponiamo che il pagamento certo 1 = (1; 1; :::; 1) sia replicabile,
cio 1 2 M . Secondo la Legge del prezzo unico il suo prezzo
X
m
p1 = 1= i:
i=1
P
Pi in generale, per il pagamento certo k = k1 = (k; k; :::; k) si ha pk = k m i=1 i .
Secondo la Legge del prezzo unico il prezzo di un pagamento certo pari allammontare
di tale pagamento, moltiplicato per la somma delle componenti del vettore .
(ii) Supponiamo che il titolo elementare ek sia replicabile, cio ek 2 M . Secondo
la Legge del prezzo unico il suo prezzo
pek = ek = k:
La componente k-esima del vettore pu essere quindi vista come il prezzo (negativo
o positivo) del titolo elementare che paga 1 euro se e solo se si verica lo stato k-esimo.
N
14.10. IL TEOREMA FONDAMENTALE DELLA FINANZA 467
w = w1 e1 + w2 e2 + + wm em :
Quindi
pw = f (w) = p w
che la condizione (14.42) ponendo = p. Si noti che tale eguaglianza una partico-
larit del caso in esame, nel quale i titoli elementari sono quotati. Di norma i vettori
e p sono distinti.
14.10.5 Arbitraggio
Una seconda propriet fondamentale di buon funzionamento di un mercato nanziario
lassenza di arbitraggi. In particolare, un portafogli x 2 Rn detto di arbitraggio se
vale luna o laltra delle due seguenti condizioni
Yx 0 Yx>0
I ; II
p x<0 p x 0
di ovvio signicato: se valesse la prima, il portafogli x avrebbe un vettore Y x 0
di pagamenti nali (non farebbe perdere in nessuno degli stati del mondo) e avrebbe
prezzo p x < 0 (si acquisterebbe a un prezzo negativo, cio incassando soldi); se valesse
la seconda, x avrebbe un vettore Y x > 0 di pagamenti nali (non farebbe perdere in
nessuno degli stati del mondo e guadagnare almeno in uno) e avrebbe prezzo p x 0
(si acquisterebbe o gratis o a un prezzo negativo).
e
II R (x) > 0 =) v (x) > 0 8x 2 Rn : (14.45)
La prima di tali condizioni garantisce la Legge del prezzo unico.
468 CAPITOLO 14. FUNZIONI E APPLICAZIONI LINEARI
Lemma 240 Per una coppia (R; v) che soddisfa la condizione di non arbitraggio
(14.44) vale la Legge del prezzo unico.
Dim. Applicando la (14.44) al portafogli x, si ha
R (x) 0 =) v (x) 0 8x 2 Rn ;
ossia
R (x) 0 =) v (x) 0 8x 2 Rn :
Insieme alla (14.44), ci implica
R (x) = 0 =) v (x) = 0 8x 2 Rn :
Siano ora x e x0 due portafogli tali che R (x) = R (x0 ). La linearit di R implica
R (x x0 ) = 0, e quindi v (x0 x) = 0, ossia v (x0 ) = v (x).
Teorema 242 (Teorema fondamentale della Finanza) La coppia (Y; p), con p 6=
0, soddisfa le condizioni di non arbitraggio (14.44) e (14.45) se e solo se la funzione
di prezzo lineare e fortemente crescente, ossia esiste un vettore 2 Rm ++ tale che
pw = w 8w 2 M (14.47)
X
m
pw = w= i wi
i=1
dei suoi pagamenti nei vari stati, con pesi positivi. Se i prezzi che si osservano sul
mercato non si possono scrivere nella forma (14.47) per qualche vettore fortemente
positivo, ci indica la presenza di arbitraggi sul mercato, che non quindi ben funzio-
nante (intuitivamente17 un mercato in cui sono possibili arbitraggi non pu essere in
equilibrio).
Dim. Anche qui mostriamo il Solo se, poich il converso ovvio, e consideriamo un
mercato completo (cio, M = Im R = Rm ). Grazie alla Proposizione 241, f lineare
e crescente. Dobbiamo mostrare che fortemente crescente. Grazie alla versione
fortemente crescente della Proposizione 193 basta mostrare che f fortemente positiva.
Sia x 2 Rm con x 0. Essendo Im R = Rm , esiste x 2 Rn tale che R (x) = x.
Si ha quindi R (x) = x 0, sicch la (14.44) implica v (x) 0 per la linearit di v.
Quindi,
f (x) = f (R (x)) = v (x) > 0
In conclusione, la funzione lineare f fortemente positiva, e quindi fortemente cres-
cente. Grazie alla versione fortemente positiva della Proposizione 194, esiste un vettore
17
Il lettore render pi precisa tale intuizione in corsi successivi.
470 CAPITOLO 14. FUNZIONI E APPLICAZIONI LINEARI
2 Rm
++ fortemente positivo tale che f (z) = z per ogni z 2 Rm . Ci completa la di-
mostrazione per mercati completi; anche in questo caso lasciamo al lettore lestensione
a mercati incompleti, che analoga a quella del risultato precedente.
Si osservi inne che il vettore in (14.47) in generale non unico, a meno che il
mercato sia completo (perch in tal caso unico il vettore , come s gi osservato
discutendo la Proposizione 239).
Esempio 270 Supponiamo che ogni titolo elementare ek sia replicabile, cio ek 2 M .
Secondo la (14.50) il suo prezzo di non arbitraggio
sicch
pek
Qk = :
p1
La probabilit Qk pu essere quindi vista come un prezzo relativo determinato dal
rapporto tra il prezzo del titolo elementare ek e il prezzo del titolo certo 1. N
Supponiamo che P gli stati del mondo si verichino secondo una probabilit P =
(P1 ; :::; Pm ), dove m
i=1 Pi = 1 e Pi > 0 per ogni i = 1; :::; m. Quindi, Pi la prob-
abilit che lo stato ! i si verichi. La probabilit Q una nozione del tutto diversa
dalleettiva probabilit P secondo la quale gli stati si vericano; come ha mostrato
lultimo esempio, Q un prezzo relativo determinato dal mercato nanziario, cio dalla
coppia (Y; p), senza alcuna relazione con la probabilit eettiva degli stati.
Detto ci, consideriamo il rapporto tra i vettori e P ponendo
i
i = 8i = 1; :::; m:
Pi
Il vettore = ( 1 ; :::; m) 2 Rm
++ permette la seguente di scrivere la (14.47) come
pw = EP ( w) (14.51)
Infatti, si ha
X
m X
m
i
X
m
pw = w= i wi = Pi wi = Pi i wi = EP ( w) :
i=1 i=1
Pi i=1
p1 = EP ( 1) = EP ( )
pek = EP ek = k Pk
472 CAPITOLO 14. FUNZIONI E APPLICAZIONI LINEARI
sicch
pek
k = :
Pk
La componente k il rapporto tra il prezzo del titolo elementare ek e la probabilit
dello stato ! k ; se interpretiamo Pk come rischio dello stato ! k , tale rapporto pu
vedersi come prezzo per unit di rischiodello stato ! k . N
Teorema 243 (di rappresentazione dellarbitraggio) Per una coppia (Y; p) con
p 6= 0 le seguenti condizioni sono equivalenti:
pw = EP ( w) 8w 2 M: (14.53)
o, equivalentemente e pi elegantemente,
Y =p
14.10. IL TEOREMA FONDAMENTALE DELLA FINANZA 473
Tale strettamente positivo per 0 < < 13=33. Posto, per esempio, = 1=3, si ha
7 1 1
= ; ;
15 15 3
sicch i prezzi di non arbitraggio dei pagamenti replicabili sono
7 1 1
pw = w1 + w2 + w3 8w 2 M R3 :
15 15 3
474 CAPITOLO 14. FUNZIONI E APPLICAZIONI LINEARI
(ii) Prendiamo p = (12; 3; 11; 2; 11; 8). Il sistema Y = p ammette lunica soluzione
= (6=10; 1=10; 1=2), sicch la coppia (Y; p) ammette possibilit di arbitraggi
(del I tipo). Per esempio, ogni vettore di pagamenti del tipo (0; k; 0) con k > 0
lo , avendo costo (1=10) k < 0. Il sistema Y x = (0; k; 0)T ha lunica soluzione
22 20 5
x=k ; ;
124 124 124
e ciascuno di essi permette di realizzare un arbitraggio. Per maldenza, control-
liamo:
2 3 2 3 2 3 2 3 2 3
10 8 12 220 160 60 0
22k 4 20k 4 5k 4 k 4
12 5 6 5 4 5= 264 120 20 5 = 4 k 5 :
124 124 124 124
15 14 10 330 280 50 0
Esso pagher (0; 1:000; 0)T e oggi costa 100, cio fa incassare 100. Gli indicati
non sono aatto gli unici arbitraggi possibili. Per esempio, possiamo costruire
il precedente portafogli e usare lincasso 100 per acquistare pagamenti positivi
anche in ! 1 e ! 3 . Per esempio, il portafogli di pagamenti (20; 1:000; 50) ha valore
63.
14.10. IL TEOREMA FONDAMENTALE DELLA FINANZA 475
(iii) Prendiamo p = (12; 10; 4; 11; 2). Il sistema Y = p ha ora lunica soluzione
= (6=10; 0; 4=10): sono possibili arbitraggi (del II tipo). Gli stessi portafogli
indicati al punto (2), cio
22 20 5
x=k ; ;
124 124 124
con vettore (0; k; 0) di pagamenti (k > 0), hanno ora costo nullo:
22k 20k 5k k
12 10; 4 11; 2 = (264 208 56) = 0
124 124 124 124
N
14.10.8 Rendimenti
Il Teorema di rappresentazione dellarbitraggio talvolta enunciato in termini di rendi-
menti. Il rendimento lordo di un titolo quotato y che ha prezzo p il vettore R 2 Rm
tale che
yi
Ri = 8i = 1; :::; m
p
Lo scalare Ri ci che rende ogni euro investito nel titolo qualora si verichi lo stato
del mondo i-esimo ! i . Pi in generale, ogni pagamento aleatorio w ha rendimento
lordo R dato da
wi
Ri =
p
Qui R il rendimento di ogni euro investito nel portafogli che replica w qualora si
verichi lo stato del mondo i-esimo ! i .
Poich
pw Riw = wi 8i = 1; :::; m
in assenza di arbitraggi la (14.53) implica
X
m X
m X
m
pw = EP ( w) = Pi i wi = Pi i pw Riw = pw Pi i Riw = pw EP ( Rw )
i=1 i=1 i=1
cio
p w = p w EP ( R w )
Ma
pw = pw EP ( Rw ) () 1 = EP ( Rw )
e in conclusione, si ha:
EP ( R w ) = 1 8w 2 M (14.54)
476 CAPITOLO 14. FUNZIONI E APPLICAZIONI LINEARI
EQ (Rw ) = 1 8w 2 M: (14.55)
EP ( rw ) = EQ (rw ) = 0 8w 2 M:
Funzioni concave
Denizione 106 Un insieme C Rn detto convesso se, per ogni coppia di punti
x; y 2 C,
x + (1 )y 2 C 8 2 [0; 1] :
x + (1 )y
477
478 CAPITOLO 15. FUNZIONI CONCAVE
2 1
1 .5 B 0 .8
0 .6
1
0 .4
0 .5
0 .2
0 0
A
-0 .2
-0 .5
C
-0 .4
-1
-0 .6
-1 .5
-0 .8
-2 -1
-3 .5 -3 -2 .5 -2 -1 .5 -1 -0 .5 0 0 .5 1 6 6 .5 7 7 .5 8
Esempio 275 Nella retta reale gli unici insiemi convessi sono gli intervalli, limitati o
illimitati. Gli insiemi convessi possono perci vedersi come la generalizzazione a Rn
della nozione di intervallo. N
15.1. INSIEMI CONVESSI 479
Esempio 276 Gli intorni B" (x) = fy 2 Rn : kx yk < "g di Rn sono convessi. In-
fatti, siano y 0 ; y 00 2 B" (x) e 2 [0; 1]. Grazie alle propriet della norma viste nella
Proposizione 44 si ha
kx ( y 0 + (1 ) y 00 )k = k x + (1 )x ( y 0 + (1 ) y 00 )k
0
= k (x y ) + (1 ) (x y 00 )k
kx y 0 k + (1 ) kx y 00 k < "
e quindi y 0 + (1 ) y 00 2 B" (x), il che prova che lintorno B" (x) convesso. N
Non vale il converso: anche un insieme non convesso pu avere interno o chiusura
convessi. Per esempio linsieme [2; 5] [ f7g R non convesso (non un intervallo)
ma il suo interno (2; 5) lo ; linsieme (0; 1) [ (1; 5) R non convesso ma la sua
chiusura [0; 5] lo . Ancor pi interessante considerare un quadrato in R2 e privarlo
di un punto su un lato, non di vertice. Il lettore pu vericare che il quadrato privato
del punto non un insieme convesso, ma sia la chiusura sia linterno sono convessi.
X
k
i xi
i=1
480 CAPITOLO 15. FUNZIONI CONCAVE
P
con i 0 per ogni i e con ki=1 i = 1, si dice combinazione (lineare) convessa
dei vettori fxi gki=1 . Nel caso k = 2, 1 + 2 = 1 implica 2 = 1 1 , e quindi
le combinazioni convesse di due vettori hanno in eetti la forma x + (1 ) y con
2 [0; 1] vista a inizio capitolo.
Le combinazioni convesse permettono di denire una classe importante di insiemi
convessi.
Denizione 107 Data una collezione nita fxi gki=1 di vettori di Rn , il politopo da
essi generato linsieme
( k )
X X
k
2
x
1 y
-1
z
-2
-3 -2 -1 0 1 2 3 4 5
1
Si noti che
f( 1; 2; 3) : 1; 2; 3 0e 1 + 2 + 3 = 1g = f( 1; 2; 1 1 2) : 1; 2 2 [0; 1]g
15.1. INSIEMI CONVESSI 481
( k )
X X
k
i xi : i 0 8i = 1; :::; k e i =1 (15.2)
i=1 i=1
Esempio 277 Se consideriamo i quattro vettori f(0; 1) ; (1; 0) ; ( 1; 0) ; (0; 1)g, allo-
ra il politopo da loro generato il rombo
Esempio 278 Si noti che i cinque vettori f(0; 1) ; (1; 0) ; ( 1; 0) ; (0; 1) ; (1=2; 1=2)g
generano il medesimo rombo perch il vettore aggiunto (1=2; 1=2) gi apparteneva al
2
Un caveat: se, per esempio, x giace sul segmento che congiunge y e z (cio, i tre vettori sono
linearmente dipendenti), il triangolo generato da x, y e z si riduce a tale segmento. In questo caso,
i vertici sono solo y e z. Simili considerazioni valgono nel caso generale, come il rombo del prossimo
esempio mostra.
482 CAPITOLO 15. FUNZIONI CONCAVE
rombo
X
k X
k 1 X
k 1
i
i xi = i xi + k xk = (1 k) xi + k xk :
i=1 i=1 i=1
1 k
Poich abbiamo assunto che C sia chiuso rispetto alle combinazioni convesse di k 1
elementi, si ha
X
k 1
i
xi 2 C:
i=1
1 k
15.1. INSIEMI CONVESSI 483
( i=1 i=1
)
X
n
= ( 1 ; :::; n) : i 0 8i = 1; :::; n e i =1
i=1
ossia
2 = f( 1; 2; 1 1 2) : 1; 2 0e 1 + 2 1g .
N
Nel Capitolo 8 si era visto come ogni misura di probabilit denita su uno spazio
nito di stati = f! 1 ; ! 2 ; :::; ! n g si pu identicare con un vettore P 2 Rn+ dato da
P = (P1 ; P2 ; : : : ; Pn )
n 1 = (P1 ; P2 ; : : : ; Pn ) : Pi 0 8i = 1; :::; n e Pi = 1
i=1
15.1.2 Coni
Denizione 108 Un insieme C Rn detto cono se, per ogni x 2 C, accade che
x2C 8 0:
Geometricamente, C un cono se, ogni volta che x 2 C, linsieme C contiene anche
tutta la semiretta uscente dallorigine (origine inclusa) e passante per x.
5
y 7
6 y
4
3
4
2 3
2
1 O x
O x
1
0
0
-1 -1
-3 -2 -1 0 1 2 3 4 5 6 7 -6 -4 -2 0 2 4 6 8 10
x+ y2C
+ +
Siccome C un cono, si ha
x+ y =( + ) x+ y 2C
+ +
come desiderato.
(ii) Supponiamo che x; y 2 C implichi x + y 2 C per ogni ; 0. Vogliamo
mostrare che C un cono. Prendendo = = 0 si conclude che 0 2 C e, prendendo
y = 0, che x 2 C per ogni 0, cio che C un cono.
Un insieme convesso dunque chiuso rispetto alle combinazioni convesse, mentre
un cono convesso chiuso rispetto alle combinazioni lineari con pesi non negativi.
15.2. FUNZIONI CONCAVE 485
I coni possono essere chiusi, per esempio Rn+ , oppure aperti, per esempio Rn++ . I
sottospazi vettoriali formano unimportante classe di coni chiusi e convessi (omettiano
la semplice dimostrazione).
14 14
12 12
10 10
8 8
6 6
4 4
2 2
0 0
-2 x O y -2 x O y
-1 0 1 2 3 4 5 -1 0 1 2 3 4
dora in poi assumeremo, spesso senza menzionarlo, che le funzioni concave (e convesse)
considerate siano sempre denite su insiemi convessi. O
Diamo ora alcuni esempi di funzioni concave e convesse. Vericare se una funzione
gode di tali propriet usando la denizione spesso non facile. Per questo invitiamo
al lettore a cercare unintuizione graca per questi esempi, in attesa di vedere pi in l
alcune condizioni su cienti basate sul Calcolo dierenziale che semplicano la verica.
p
Esempio 282 (i) Le funzioni f; g : R+ ! R denite da f (x) = x e g (x) = log x
sono strettamente concave.
x se x 1
f (x) =
1 se x > 1
f (x) = min xi
i=1;:::;n
488 CAPITOLO 15. FUNZIONI CONCAVE
Del resto, nel rendere separatamente minime x e y si hanno pi gradi di libert che nel
renderle minime congiuntamente come somma. Ne segue che, se x; y 2 Rn e 2 [0; 1],
si ha
f ( x + (1 ) y) = min ( xi + (1 ) yi )
i=1;:::;n
min xi + (1 ) min yi = f (x) + (1 ) f (y)
i=1;:::;n i=1;:::;n
Nella Teoria del consumatore la funzione di utilit u (x) = mini=1;:::;n xi prende il nome
di funzione di utilit di Leontief, gi incontrata nella Sezione 7.4.4. N
Poich le disuguaglianze (15.3) e (15.4) sono deboli, possibile che una funzione
sia contemporaneamente concava e convessa. In tal caso, la funzione detta a ne. In
altre parole, una funzione f : C Rn ! R a ne se
f ( x + (1 ) y) = f (x) + (1 ) f (y) ;
f ( x + (1 ) y) = l ( x + (1 ) y) + q = l (x) + (1 ) l (y) + q + (1 )q
= (l (x) + q) + (1 ) (l (y) + q)
l ( x) = l (x) 8x 2 Rn , 8 2 R: (15.7)
1 1 1 1
0 = l (0) = l x x =f x x f (0)
2 2 2 2
1 1 1 1 1 1
= f (x) + f ( x) f (0) f (0) = l (x) + l ( x) ;
2 2 2 2 2 2
sicch l (x) = l ( x). Se < 0, si ha quindi:
Tutto ci prova che vale la (15.7). Alla luce del Lemma 189, per completare la
dimostrazione della linearit di l occorre mostrare che
Si ha:
x+y x y x y
l (x + y) = 2l = 2l + =2 f + f (0)
2 2 2 2 2
1 1 1 1
= 2 f (x) + f (y) f (0) f (0) = l (x) + l (y) ;
2 2 2 2
come desiderato.
f (x) = mx + q 8x 2 R (15.9)
490 CAPITOLO 15. FUNZIONI CONCAVE
con m 2 R.3 Le funzioni a ni scalari hanno quindi un aspetto ben noto: esse non
sono altro che le rette con pendenza e intercetta q; in particolare, ci conferma che le
funzioni scalari lineari sono le rette passanti per lorigine poich per esse f (0) = q = 0.
In generale, il valore f (x) di una funzionale a ne una somma pesata, con pesi
i , delle componenti xi dellargomento x, pi un termine noto q 2 R. la forma pi
semplice che pu assumere una funzione di pi variabili. Per esempio, se = (3; 4) e
q = 2, si ha la funzione a ne f : R2 ! R data da f (x) = 3x1 + 4x2 + 2.
Esempio 285 Nella Teoria della produzione le funzioni di produzioni sono spesso
ipotizzate lineari. In tal caso il vettore = ( 1 ; 2 ; :::; n ) interpretato come il vettore
dei coe cienti costanti di produzione. Infatti, considerando i versori fondamentali e1 ,
e2 , ..., en si ha
f e1 = e1 = 1
f e2 = e2 = 2
f (en ) = en = n
15.3 Propriet
15.3.1 Funzioni concave e insiemi convessi
Esiste una semplice caratterizzazione delle funzioni concave f : C Rn ! R che usa
gli insiemi convessi. Si consideri infatti linsieme
detto ipograco di f , costituito dai punti (x; y) 2 Rn+1 che giacciono al di sotto del
graco della funzione, graco che ricordiamo essere dato da:
Gr f = f(x; y) 2 C R : f (x) = yg :
3
Usiamo nel caso scalare la pi comune lettera m invece di .
15.3. PROPRIET 491
6
y
1
O x
0
0 1 2 3 4 5 6
Ipograco di funzione.
Dim. Sia f concava, e siano (x; y) ; (y; z) 2 ipof . Per denizione, y f (x) e
z f (y). Ne segue che
t + (1 )z f (x) + (1 ) f (y) f ( x + (1 ) y) ;
cio,
f (x) + (1 ) f (y) f ( x + (1 ) y) ;
come desiderato.
fx 2 C : f (x) kg
492 CAPITOLO 15. FUNZIONI CONCAVE
sono detti insiemi di soprallivello, indicati con (f k), mentre gli insiemi
fx 2 C : f (x) kg
1
f (k) = (f k) \ (f k)
1
tant che talvolta si usa la notazione (f = k) in luogo di f (k).
5
y
4
2 y=k
0
O x
-1
-2
-3 -2 -1 0 1 2 3 4
8
y
6
4
y=k
2
O x
-2
-4
-4 -3 -2 -1 0 1 2 3 4
Per le funzioni convesse vale il risultato speculare dove sono convessi gli insiemi di
sottolivello (f k).
Dim. Dato k 2 R, sia (f k) non vuoto (diversamente, il risultato ovvio perch gli
insieme vuoti sono banalmente convessi). Siano x1 ; x2 2 (f k) e 2 [0; 1]. Per la
concavit di f si ha risulta
f x1 + (1 ) x2 f x1 + (1 ) f x2 k + (1 )k = k
e perci x1 + (1 ) x2 2 (f k).
Abbiamo quindi visto che la forma usuale delle curve di indierenza implicata
dalla concavit delle funzioni di utilit, ossia, pi rigorosamente, che le funzioni concave
hanno insiemi di soprallivello convessi. Il converso non vero! Si pensi per esempio a
qualsiasi funzione f : R ! R strettamente crescente: si ha
1
(f k) = f (k) ; +1
494 CAPITOLO 15. FUNZIONI CONCAVE
per ogni k 2 R. Tutti gli insiemi di soprallivello sono convessi, bench in generale esse
non siano concave4 .
La concavit delle funzioni di utilit quindi condizione su ciente, ma non nec-
essaria, per la convessit delle curve di indierenza: vi sono funzioni di utilit non
concave che hanno curve di indierenza di questa forma. A questo punto natu-
rale chiedersi quale sia la classe di funzioni, pi ampia delle concave, caratterizzata
dallavere curve di indierenza convesse. La Sezione 15.4 risponder alla domanda
introducendo la quasi concavit.
Dim. Il Se ovvio. Per quanto riguarda il Solo sesi procede, come per il Lemma
247, per induzione su n. Sia quindi f concava. La (15.11)
Pn 1vale ovviamente
Pn 1 per n = 2.
Si supponga che valga per n 1, ossia che si abbia f i=1 i xi i=1 i f (xi ) per
ogni combinazione convessa di n 1 elementi di C. Se n = 1, la (15.11) vale in modo
banale. Sia quindi n < 1. Si ha:
! ! !
Xn X
n 1 X
n 1
i
f i xi = f i xi + n xn = f (1 n) xi + n xn
i=1 i=1 i=1
1 n
!
X
n 1
i
(1 n) f xi + n f (xn )
i=1
1 n
X
n 1
i
X
n
(1 n) f (xi ) + nf (xn ) = if (xi ) ;
i=1
1 n i=1
come desiderato.
h 1
4
Per ssare le idee, si pensi alla cubica f (x) = x3 , per cui si ha (f = c) = c 3 ; +1 per ogni
c 2 R.
15.3. PROPRIET 495
Si noti che la propriet fa s che linsieme delle funzioni concave sia un cono.
Teorema 255 Una funzione concava continua in ogni punto interno del suo do-
minio.
Dim. Dimostriamo il risultato nel caso scalare. Sia f una funzione concava denita
su un insieme convesso C R. Dimostreremo che continua in ogni intervallo chiuso
[a; b] incluso nellinterno di C: ne seguir la continuit di f sullinterno di C.
Sia m il pi piccolo tra i due valori f (a) e f (b); per ogni x = a + (1 ) b,
0 1, cio per ogni x 2 [a; b], risulta
a b b a
t
2 2
risulta, per la concavit di f ,
a+b
f t m
2
496 CAPITOLO 15. FUNZIONI CONCAVE
e perci
a+b a+b
f +t 2f m:
2 2
Posto
a+b
M = 2f m
2
si ha dunque che f anche superiormente limitata da M su [a; b].
Consideriamo ora un intervallo [a "; b + "], con " > 0 tale che anchesso sia
contenuto in C e diciamo m" e M" gli estremi inferiore e superiore di f su di esso. Se
m" = M" , la funzione costante e, a maggior ragione, continua. Sia allora m" < M" .
Consideriamo due punti x 6= y in [a; b] e poniamo
" (x y) jx yj
z=y ; = :
jx yj " + jx yj
cio
jx yj M" m"
f (x) f (y) [f (x) f (z)] (M" m" ) = (M" m" ) < jx yj :
" + jy xj "
In conclusione
jf (x) f (y)j k jx yj ;
dove k = (M" m" ) =". Ora, se y ! x, jx yj ! 0 e quindi f (y) ! f (x) che prova
la continuit di f in x. Per la genericit di x segue lasserto.
2 x2 se x 2 (0; 1)
f (x) =
0 se x 2 f0; 1g
Inne, una funzione f che sia quasi concava sia quasi convessa, ossia tale che
Esempio 287 Le funzioni scalari monotone (strettamente o meno) sono quasi a ni.
Infatti, sia f : C R ! R crescente denita sul convesso C e siano x; y 2 C e
2 [0; 1]. Senza perdita di generalit, supponiamo che x y. Quindi x x+
(1 )y y, e la crescenza implica f (x) f ( x + (1 ) y) f (y), ossia la
(15.14). Un argomento analogo vale quando f decrescente. N
5
Bruno de Finetti (1906-1985) stato un matematico applicato italiano autore di fondamentali
contributi in Calcolo delle probabilit, Statistica ed Economia teorica.
498 CAPITOLO 15. FUNZIONI CONCAVE
Le funzioni quasi concave sono dunque caratterizzate dalla convessit dei loro in-
siemi di soprallivello. La quasi concavit quindi lindebolimento della nozione di
concavit che risponde al quesito di apertura.
Nella Teoria dellutilit le funzioni di utilit quasi concave sono tutte e sole quelle
che che hanno curve di indierenza convesse, la forma usuale delle curve di indif-
ferenza. Ci rende le funzioni di utilit quasi concave la classe di gran lunga pi
importante di funzioni utilit.
Curve di indierenza Per le funzioni quasi convesse la Proposizione 256 vale con
gli insiemi di sottolivello in luogo di quelli soprallivello. Di conseguenza, una funzione f
quasi a ne ha curve di di livello (f = k) convesse perch (f = k) = (f k) \ (f k).
Il converso per falso: si prenda la funzione f : R ! R data da
( 1
x
se x 6= 0
f (x) =
0 altrimenti
15.4. FUNZIONI QUASI CONCAVE 499
1
Poich f inettiva, le sue curve di livello sono singoletti. In particolare, f (0) = f0g
e, per ogni y 6= 0,
1
f 1 (y) = :
y
Quindi, le curve di livello sono banalmente convesse. Ma f non n quasi concava n
quasi convessa, e quindi non quasi a ne.
Nella Teoria dellutilit quanto appena osservato mostra che condizione su ciente,
ma non necessaria, a nch una funzione di utilit u abbia curve di indierenza con-
vesse (in senso proprio!) che u sia quasi a ne. Si ricordi che in precedenza avevamo
parlato di convessit in senso improprio (di solito virgolettata) delle curve di indieren-
za, intendendo con ci in realt la convessit degli insiemi di soprallivello (u k). Per
quanto impropria una terminologia diusa. In senso proprio, la convessit delle curve
di indierenza la convessit delle curve di livello (u = k). Grazie alla Proposizione
256, la convessit impropria delle curve di indierenza caratterizza le funzioni di utilit
quasi concave, mentre la loro convessit propria goduta dalle funzioni di utilit quasi
a ni, senza per esserne una propriet caratterizzante.
Dim. Mostriamo solo la (i), lasciando la (ii) al lettore. Siano x; y 2 C e 2 [0; 1].
Grazie alle propriet delle funzioni f e g si ha
come desiderato.
Alla luce di tutto ci, la quasi concavit, e non la concavit, sembra essere la
propriet rilevante per le funzioni di utilit u : C Rn ! R. Infatti, grazie alla
Proposizione 257, la prima una propriet ordinale, mentre la seconda cardinale
ma non ordinale. Ma, prima di incoronare denitivamente la quasi concavit come
propriet rilevante dal punto di vista ordinalista, in luogo della concavit, occorre fare
unultima sottile osservazione. La trasformazione monotona f u quasi concava se u
concava; vale anche il viceversa? cio, tutte le funzioni quasi concave sono esprimibili
in questo modo, come trasformazioni monotone di funzioni concave?
Se questo fosse il caso, la concavit tornerebbe in gioco anche in un approccio ordi-
nalista: data una funzione quasi concava, basterebbe considerare la sua equivalente ver-
sione concava, ottenuta tramite unopportuna trasformazione strettamente crescente.
La risposta negativa: esistono funzioni quasi concave che non sono trasformazioni
monotone di funzioni concave.
g=f h (15.15)
1 1 3 1 1 1
f (0) = f g = f g x+ y
4 2 2
1 1 1 1 1 1 1 1 1
f g (x) + f g (y) = f + f (0)
2 2 2 2 2
cio
1 1 1
f (0) f
2
il che contraddice la stretta crescenza di f 1
. N
Lesempio mostra che esistono funzioni genuinamente quasi concave, non rappre-
sentabili come trasformazioni monotone di funzioni concave. la prova denitiva che
la quasi concavit, e non la concavit, la propriet rilevante in un approccio ordi-
nalista. Questa importante conclusione fu raggiunta nel 1949 da Bruno de Finetti
nellarticolo in cui introdusse le funzioni quasi concave, la cui teoria fu poi estesa nel
1954 da Werner Fenchel8 .
per ogni 2 [0; 1] . proprio la classica propriet di convessit delle curve di indif-
ferenza. Matematicamente, la convessit dellinsieme di soprallivello (u k). Poich
vale per ogni k 2 R, corrisponde alla quasi concavit delle funzioni di utilit.
Tutto bene? Quasi, perch in realt quanto appena detto si pu a nare. Si osservi
che il Principio di diversicazione implica che, per ogni x; y 2 C,
che appartiene allinsieme. Nella Teoria del consumatore molti insiemi di interesse
sono direzionati. Per esempio, tutti gli insiemi C Rn+ che contengono lorigine sono
direzionati. Infatti, in tal caso 0 x per ogni x 2 Rn e quindi lorigine stessa il
minorante comune a tutte le coppie di elementi di C.
Possiamo ora enuciare il risultato di equivalenza. Esso vale per funzioni di utilit
continue e crescenti, ipotesi standard nella Teoria del consumatore.
tn ! t ) tn x + (1 tn ) z ! tx + (1 t) z
) u (tn x + (1 tn ) z) ! u (tx + (1 t) z)
) (tn ) ! (t) :
Siccome (0) = u (z) u (y) u (x) = (1), per il Teorema di Darboux la continuit
della implica lesistenza di t 2 [0; 1] tale che (t) = u (y). Posto w = tx + (1 t) z,
si ha quindi u (w) = u (y). Inoltre, z x implica w x.
Dalla PPD segue u ( w + (1 ) y) u (w) = u (y), mentre w x implica w +
(1 )y x + (1 ) y. Grazie alla crescenza di u si ha quindi
Il risultato appena dimostrato garantisce che, nei casi di maggior interesse della
Teoria del consumatore, le due possibili interpretazioni della convessit delle curve di
indierenza sono equivalenti. Possiamo quindi considerare il Principio puro di diversi-
cazione, ossia la forma pi nitida del Principo di diversicazione, quale motivazione
delluso di funzioni quasi concave di utilit.
abbiamo una forma forte del Principio, in cui la diversicazione sempre strettamente
preferita dal consumatore. La condizione PSD implicata dalla stretta quasi concavit
di u poich
sicch
X X X
u0 (c) p (c) = + u (c) p (c) + u (c) q (c)
c2supp p c2supp p c2supp q
X X
= ( u (c) + ) q (c) = u0 (c) q (c)
c2supp p c2supp q
506 CAPITOLO 15. FUNZIONI CONCAVE
il che implica X X
u0 (c) p (c) u0 (c) q (c)
c2supp p c2supp q
come desiderato.
x2 se x 0
(x) =
0 se x < 0
sicch u0 = u data da
(u(x))2 se u (x) 0
u0 (c) = ( u) (c) = :
0 se u (x) < 0
Si ha
1 1 1 35
Ep u0 (c) = (1)2 + (3)2 + (5)2 = ' 11:67
3 3 3 3
3 1 67
Eq u0 (c) = (1)2 + (8)2 = = 16:75
4 4 4
e dunque
Ep u0 (c) < Eq u0 (c)
ribaltando in tal modo la disuglianza (15.18). Le utilit u e u0 non sono quindi
equivalenti. N
p - q; (15.20)
mentre per un decisore che non bada al rischio i due titoli sono indierenti
p q: (15.21)
508 CAPITOLO 15. FUNZIONI CONCAVE
Ci che conta per tale decisore solo il valor medio, che uguale per entrambi i titoli.
Per formalizzare queste idee, indichiamo con mp il valor medio di una lotteria
p2 (C). Possiamo riscrivere (15.19), (15.20), and (15.21) come:
mp % p; p % mp ; p mp
Denizione 111 Un decisore avverso al rischio se, per ogni lotteria p 2 (C), si
ha
mp % p
amante del rischio se
p % mp
ed neutro rispetto al rischio se
p mp
In altre parole, un decisore avverso al rischio preferisce una possibilit certa a una
incerta con lo stesso valore atteso, mentre lopposto vale per un decisore amante del
rischio. Inne, un decisiore neutrale al rischio indierente tra le due.
Si noti che non una classicazione esaustiva: vi possono essere decisori che non
rientrano in alcuna delle tre categorie della denizione. Per essi vi almeno una
coppia di lotterie p e q con p % mp e mq q. Ci evidenzia anche un importante
limite operativo della Denizione 111: per poter classicare un decisore come avver-
so/amante/neutro occorre che egli confronti tutte le lotterie con i loro valori attesi.
Quindi, bench cogente dal punto di vista concettuale, la classicazione introdotta
dalla Denizione 111 alquanto problematica dal punto di vista operativo.
Per fortuna, il prossimo importante risultato ci soccorre, rendendo operativa la
classicazione:
Dim. Dimostriamo il risultato per lavversione al rischio, lasciando al lettore gli altri
casi. Supponiamo che la funzione u sia concava. Grazie alla disuguaglianza di Jensen,
per ogni lotteria p 2 (C) si ha
!
X X
u (mp ) = cp(c) u (c) p(c);
c2supp p c2supp p
Per mostrare il converso, supponiamo che il decisore sia avverso al rischio. Sia
0 1, e siano c e c0 due importi monetari. Consideriamo la lotteria p tale che
p (c) = e p (c0 ) = 1 . Grazie allavversione al rischio:
c + (1 )c0 = mp % p (15.22)
e quindi
u ( c + (1 )c0 ) = u (mp ) u(c) + (1 )u(c0 )
il che prova la concavit di u.
5
y
u(9)
u(5)
(u(1)+u(9))/2
-5
-10
u(1)
O 1 5 9 x
-15
0 1 2 3 4 5 6
In conclusione, nella Teoria del rischio la concavit della funzione di utilit Bernoul-
liana caratterizza lavversione al rischio. Date le notevoli propriet della concavit
(specialmente nei problemi di ottimo, che sono centrali in Economia), molto impor-
tante che tale propriet abbia un cos naturale e cogente fondamento comportamentale.
510 CAPITOLO 15. FUNZIONI CONCAVE
cp Ep u (c)
Esempio 290 Se u (c) = log c e p la lotteria che assegna probabilit 1=2 a due premi
c1 e c2 , si ha
1 1 p p p p
cp = e 2 log c1 + 2 log c2 = elog c1 +log c2
= elog c 1 c2
= c1 c2
u (mp p) = Ep u (c)
mp % p () u (mp ) Ep u (c) () mp cp
Proposizione 262 Un decisore avverso al (amante del) rischio se e solo ogni lot-
teria ha premio al rischio positivo (negativo), cio p 0 ( 0)per ogni p 2 (C).
15.6. RISCHIO E CONCAVIT 511
Nel linguaggio del Lemma 189 il teorema diventa: una funzione f : R ! R con-
tinua in almeno un punto lineare se e solo se additiva. Con una minima propri-
et di regolarit, la propriet di omogeneit (i) del Lemma 189 automaticamente
soddisfatta11 .
Perci
f (x z0 ) ! f (x0 ) f (z0 ) = f (x0 z0 ) per x ! x0
che prova la continuit di f in x0 z0 e, per la genericit di x0 z0 , f ovunque
continua.
11
Tra le altre cose, il teorema consente di aermare che le funzioni additive non lineari devono
essere discontinue in ogni punto, e quindi sono estremamente irregolari. Ci le rende complicate da
descrivere (e non particolarmente belle da vedere) e per brevit non ne riportiamo esempi.
15.7. GRAN FINALE: LEQUAZIONE DI CAUCHY 513
(3) Utilizzando n volte lequazione di Cauchy, possiamo scrivere che, per ogni x 2 R
e per ogni n intero,
0 1
f (nx) = f @x
| + x{z
+ x}A = f (x) + f (x) + f (x) = nf (x)
| {z }
n volte n volte
Ora, essendo f (kx) = kf (x) per ogni x 2 R e ogni k intero e ponendo y = kx, si
deduce che
1 1 1
f (y) = kf y cio f y = f (y) 8y 2 R, 8k 2 N
k k k
f (r) = ar 8r 2 Q
La funzione f cos lineare sui razionali. Prendiamo ora una successione frk g di
razionali che tende a x irrazionale. Sappiamo che
f (rk ) = ark 8k = 1; 2; :
NB. La conclusione del Teorema 264 vale anche quando f denita solo su R+ : la
dimostrazione la stessa. Useremo questa versione del teorema nella Sezione 15.7.2.O
Essa ammette la soluzione banale f (x) = 0 per ogni x 2 R. Ogni altra sua
soluzione strettamente positiva. Infatti, se f una tale soluzione, per ogni
x 2 R si ha:
x x x x h x i2
f (x) = f + =f f = f 0
2 2 2 2 2
Inoltre, se esistesse y 6= 0 con f (y) = 0, per ogni x 2 R si avrebbe
f (x) = f ((x y) + y) = f (x y) f (y) = 0,
il che contraddice la non banalit di f .
In conclusione, ogni soluzione non banale di (15.23) strettamente positiva.
Grazie a ci, possiamo prendere i logaritmi di entrambi i membri di (15.23),
cosicch
log f (x + y) = log f (x) + log f (y) 8x; y 2 R;
che lequazione di Cauchy nella funzione incognita log f . La soluzione perci
log f (x) = mx con m 2 R, e quindi la funzione esponenziale
f (x) = emx
la soluzione non banale dellequazione funzionale (15.23).
(ii) per-pi: consideriamo lequazione funzionale
f (x y) = f (x) + f (y) 8x; y 2 R: (15.24)
Usando lidentit xy = elog x+log y essa diventa
f elog x+log y = f elog x + f elog y 8x; y 2 R:
Posto g (x) = f (ex ) per ogni x 2 R, si ha lequazione di Cauchy
g (log x + log y) = g (log x) + g (log y)
nella funzione incognita g, la cui soluzione g (x) = mx con m 2 R. Ci implica
f (ex ) = mx, ossia la funzione logaritmo
f (x) = log xm
la soluzione dellequazione funzionale (15.24).
(iii) per-per: consideriamo lequazione funzionale
f (x y) = f (x) f (y) 8x; y 2 R: (15.25)
Prendendo il logaritmo dei due membri, essa si riduce alla (ii) con log f al posto
di f , e perci la sua soluzione log f (x) = m log x ovvero la funzione potenza
f (x) = em log x = xm :
15.7. GRAN FINALE: LEQUAZIONE DI CAUCHY 515
I risultati test visti sono notevoli perch danno una fondazione funzionale alle
funzioni elementari. Per esempio, la funzione esponenziale si pu caratterizzare col
limite
x n
ex = lim 1 +
n!1 n
secondo quanto visto col Teorema 149, oppure, con un completo cambiamento di
prospettiva, come la funzione che risolve lequazione funzionale (15.23). Entrambi
i punti di vista su tale fondamentale funzione elementare sono di estrema importanza.
In ragione dellimportanza di questa nuova prospettiva sulle funzioni elementari,
diamo veste di teorema a quanto stabilito.
15.7.2 Capitalizzazione
Un problema estremamente comune, per esempio nella pratica bancaria o sui mercati
nanziari, consiste nel calcolare il valore di un capitale ad una data futura. Indichiamo
con C limporto del capitale disponibile oggi, data 0, e con M il suo montante, cio il
suo valore alla data t 0. Lipotesi pi comune, e pi semplice, che M dipenda solo
da C e da t:
M = M (C; t) : R R+ ! R
con lovvia convenzione che C > 0 signica incasso e C < 0 esborso (C = 0 signica
assenza di movimento di denaro).
ragionevole supporre che tale funzione sia additiva rispetto alla prima variabile,
crescente (almeno debolmente) rispetto alla seconda e che valga C quando t = 0.
Formalmente:
(iii) M (C; 0) = C.
Lipotesi (i), ossia che il montante di un capitale somma la somma dei due
montanti, pur di estrema semplicit, rispecchia ci che pi frequentemente accade
nella pratica. Si osservi che sarebbe insensato supporre che
Teorema 266 Qualora la funzione M sia continua almeno per un valore di C, valgono
le ipotesi (i)-(iii) se e solo se
M (C; t) = Cf (t) ;
Dim. La prima ipotesi non altro che lequazione funzionale di Cauchy relativamente
alla prima variabile che compare in M . Come sappiamo dallomonimo teorema, essa
caratterizza le funzioni lineari e quindi M (C; t) del tipo Cf (t) con f (t) (indipendente
da C e quindi) funzione per ora arbitraria di t. Per rispettare la seconda ipotesi, f (t)
devessere crescente e, per la terza, devessere f (0) = 1.
f (t) = e t = (1 + i)t = t
con ; i 0e 1
Funzioni omogenee
per ogni 0. N
Si noti che per funzioni positivamente omogenee si ha
f (0) = 0 (16.2)
Infatti, per ogni 2 [0; 1] si ha f (0) = f ( 0) = f (0), il che implica f (0) = 0. In
altre parole, le funzioni positivamente omogenee sono nulle nellorigine.
519
520 CAPITOLO 16. FUNZIONI OMOGENEE
per ogni 0. N
Oltre a essere costanti, i rendimenti di scala possono essere crescenti oppure de-
crescenti. Ci motiva le due seguenti propriet.
f ( x) f (x)
16.1. OMOGENEIT E RENDIMENTI DI SCALA 521
f ( x) f (x)
f ( x) f (x) 8 2 [0; 1]
e
f ( x) f (x) 8 1:
f ( x) = ( x1 )a ( x2 )b = a+b a b
x1 x2 = a+b
f (x)
Tirando le somme, le nozioni di omogeneit test viste si deniscono per 2 [0; 1],
cio per tagli proporzionali, su insiemi convessi contenenti lorigine, ma trovano il
loro ambiente naturale su coni dove modellano le classiche ipotesi di rendimenti sui
scala. Bench, dal punto di vista matematico, sia unosservazione molto semplice (le
dimostrazioni delle Proposizioni 267 e 267 sono elementari), il caso 1 molto
importante nelle applicazioni.
Le funzioni concave con f (0) 0 sono quindi subomogenee. Tra esse sono di
particolare interesse quelle positivamente omogenee.
16.1. OMOGENEIT E RENDIMENTI DI SCALA 523
Gli Esempi 298 e 299 mostreranno che alcune classiche funzioni usate in Economia
sono superlineari. Vediamo un primo esempio.
f (x) = min xi
i=1;:::;n
f ( x + y) = f ( + ) x+ y = ( + )f x+ y
( + ) ( + ) ( + ) ( + )
In ogni caso, si passa da coe cienti positivi e1 a coe cienti positivi qualunque
e .
1 1 1 1 1
f (x + y) = 2f (x + y) = 2f x+ y 2 f (x) + 2 f (y) = f (x) + f (y)
2 2 2 2 2
16.2 Omotetia
Nella Teoria del consumatore si usa la seguente versione ordinale della positiva omo-
geneit.
8
y
7
6 k=3
5
k=2
4
2 k=1
0
O x
-1
0 0.5 1 1.5 2 2.5 3 3.5
p
Curve di livello della funzione omotetica x2 x2
Le funzioni log f e log g sono concave grazie alla Proposizione 257. Quindi, log (f g)
concava perch somma di funzioni concave (Proposizione 254). Ne segue che f g quasi
concava perch f g = elog f g trasformazione strettamente crescente di una funzione
concava.
Problemi di ottimo
17.1 Generalit
I problemi di ottimo sono fondamentali in Economia, il cui studio si basa sullanalisi
dei problemi di ottimo degli agenti economici, quali individui (consumatori, produttori
e investitori), famiglie e governi. Per tale ragione questo il capitolo centrale del libro,
che motiva lo studio sia delle nozioni viste sinora sia di quelle che si aronteranno nei
capitoli successivi.
4 y
3
0
O x
-1
-2
-3
-4
-5
-4 -3 -2 -1 0 1 2 3 4 5
Graco di f (x) = 1 x2 :
529
530 CAPITOLO 17. PROBLEMI DI OTTIMO
(ii) limportanza del sottoinsieme del dominio in cui si interessati a stabilire le-
sistenza di punti di massimo o di minimo.
Nel caso particolare C = A, ossia quando si considera come insieme di scelta lintero
dominio, lelemento x^ si dice punto di massimo, senza ulteriori specicazioni.
Nellesempio iniziale avevamo considerato due casi:
(ii) nel secondo caso C era lintervallo [1; 2] e si aveva x^ = 1 e max f ([1; 2]) = 0.
Grazie alla Proposizione 15, il valore massimo unico. Indichiamo tale unico valore
come
max f (x) :
x2C
I punti di massimo possono invece non essere unici e il loro insieme si indica con
arg maxC f , cio
si ha maxx2R f (x) = 0 e arg maxx2R f (x) = [ 1; 1]: linsieme dei punti di mas-
simo tutto lintervallo [ 1; 1]. Daltra parte, se ci restringiamo a [1; +1), si ha
maxx2[1;+1) f (x) = 0 e arg maxx2[1;+1) f (x) = f1g, ossia 1 lunico punto di massimo
di f su [1; +1).
f (^
x) > f (x)
I massimi forti sono una classe molto importante di massimi, con la seguente
notevole propriet di unicit.
Dim. Solo se. Supponiamo per contra che esistano due distinti punti di massimo
globale forte x^1 e x^2 . Per denizione, si ha f (^ x2 ) e f (^
x1 ) > f (^ x1 ), il che
x2 ) > f (^
impossibile.
Se. Sia arg maxx2C f un singoletto f^ xg. Per ipotesi, f (^ x) f (x) per ogni
x 2 C. Supponiamo per contra che esista y 2 C tale che f (^ x) = f (y). Si ha
x) f (x) per ogni x 2 C, il che contraddice il fatto che x^ sia lunico punto
f (y) = f (^
di massimo.
In altri termini la forza di un massimo equivale alla sua unicit. Quando vale,
la forza, e quindi lunicit, dei massimi una notevolissima propriet che semplica
532 CAPITOLO 17. PROBLEMI DI OTTIMO
f (x) 1 8x 2 R
Dato che f (x1 ; x2 ) = x21 6x1 x2 + 9x22 + 3x22 = (x1 3x2 )2 + 3x22 , cio f la somma
di due quadrati, si ha che
f (x1 ; x2 ) 0 8 (x1 ; x2 ) 2 R2 :
Visto che f (0; 0) = 0, anzi vale 0 solo in esso, possiamo concludere che (0; 0) punto
di minimo forte di f su R2 . Si vede inoltre che f non superiormente limitata in R2
e perci essa non possiede punti di massimo. Il minimo di f su R2 0. N
x21 x22 x23
Esempio 302 Sia f : R3 ! R data da f (x1 ; x2 ; x3 ) = e . Consideriamo il
problema di ottimo
max f (x) sub x 2 R3 :
x
Visto che 0 < f (x1 ; x2 ; x3 ) 1 per ogni (x1 ; x2 ; x3 ) 2 R3 e che f (0; 0; 0) = 1, si ha che
(0; 0; 0) punto di massimo forte di f su R3 . La funzione non possiede invece punti di
minimo perch essa non raggiunge mai lestremo inferiore 0 dei suoi valori. Il massimo
di f su R3 1. N
534 CAPITOLO 17. PROBLEMI DI OTTIMO
Dato che 1 cos x 1, tutti i punti nei quali f (x) = 1 sono di massimo e tutti i
punti nei quali f (x) = 1 sono di minimo. I punti di massimo sono perci x^ = 2k per
k 2 Z e i punti di minimo sono x~ = (2k + 1) per k 2 Z. I valori massimo e minimo
sono rispettivamente 1 e 1.
Questi punti di massimo e minimo su R non sono forti. Tuttavia, se consideriamo
un insieme di scelta meno ambizioso, quale per esempio C = [0; 2 ), si trova lunico
punto di massimo forte x^ = 0 e lunico punto di minimo forte x~ = . N
Esempio 304 Per una funzione costante tutti punti del dominio sono simultanea-
mente di massimo e di minimo. N
Si noti che la Denizione 116 non richiede alcuna propriet alla funzione, in par-
ticolare la continuit (o la derivabilit). Per esempio, la funzione f : R ! R data da
f (x) = jxj minima per x^ = 0. La funzione f : R ! R data da
(
x + 1 se x 1
f (x) =
x se x > 1
massima per x^ = 1 ove vale 2, pur essendo discontinua in tale punto.
Pu anche accadere che un punto isolato sia di massimo (o di minimo). Per esempio,
la funzione cos denita 8
>
> x + 1 se x 1
<
f (x) = 5 se x = 2
>
>
: x se x > 4
massima per x^ = 2.
17.1.2 Propriet
I problemi di ottimo (17.2) godono di una semplice, ma importante, propriet di
invarianza.
e
max (g f ) (x) sub x 2 C
x
sono equivalenti, ossia hanno le stesse soluzioni.
Dim. Basta osservare che, grazie alla Proposizione 78, dalla stretta crescenza segue
che
f (x) f (y) () (g f ) (x) (g f ) (y) 8x; y 2 A:
Quindi f (^
x) f (x) per ogni x 2 C se e solo se (g f ) (^
x) (g f ) (x) per ogni
x 2 C.
Dim. Sia x^ 2 arg maxx2C f (x). Vogliamo mostrare che x^ 2 @C. Supponiamo, per
contra, che x^ 2
= @C, cio x^ punto interno di C. Esiste quindi un intorno B" (^ x) di
x^ incluso in C. facile vedere che esiste y 2 B" (^ x) tale che x^ y. Per la forte
crescenza di f si ha quindi f (y) > f (^
x), il che contraddice lottimalit di x^.
x0 )
e quindi f (^ x) per ogni x^ 2 arg maxx2C f (x).
f (^
Esempio 305 Si ricordi lesempio iniziale in cui avevamo considerato due diversi in-
siemi di scelta, R e [1; 2], per la funzione f (x) = 1 x2 . Si aveva maxx2[1;2] f (x) =
0 < 1 = maxx2R f (x). N
Bi (p; I) = fx 2 A : p x Ig ;
B (p; I) = x 2 Rn+ : p x I ;
con 2 [0; 1] e 2 (0; 1]. In questo caso A = R2+ e quindi Bi (p; w) = B (p; w).
(ii) Sia u : R2++ ! R la funzione di utilit Cobb-Douglas
con a 2 [0; 1]. Qui si ha A = R2++ sicch Bi (p; w) = B (p; w) \ R2++ . Consumatori
CES e Cobb-Douglass hanno quindi diversi insiemi di bilancio individuali.
(iii) Supponiamo che il consumatore abbia un paniere di sussistenza x 0, per
cui egli pu considerare solo panieri x x, pena la sopravvivenza. In questo caso
naturale assumere come dominio A della sua funzione di utilit linsieme chiuso e
convesso
A = x 2 Rn+ : x x ; (17.6)
che incluso in Rn++ . Quindi, domini A chiusi e convessi inclusi in Rn++ si possono
giusticare in termini di panieri di sussistenza x 0. Per esempio, dato un tale
paniere di sussistenza possiamo considerare le restrizioni di funzioni di utilit CES e
Cobb-Douglass sullinsieme (17.6). N
I lim p xk pxki ! +1
p ( x + (1 ) y) = (p x) + (1 ) (p y) I + (1 )I = I
Il Problema (di ottimo) del consumatore consiste nel rendere massima la propria
funzione di utilit u : A Rn+ ! R sullinsieme di bilancio Bi (p; I), ossia nel risolvere
Dati prezzi e reddito, linsieme di bilancio Bi (p; I) linsieme di scelta del Problema
del consumatore. In particolare, un paniere x^ 2 Bi (p; I) di massimo, ossia soluzione
del problema di ottimo (17.7), se
u (^
x) u (x) 8x 2 Bi (p; I) ;
mentre maxx2Bi (p;I) u (x) la massima utilit ottenibile dal consumatore. Si noti che,
grazie alla Proposizione 277, ogni trasformazione strettamente crescente g u di u
denisce un problema di ottimo
4
Si ricordi che lintersezione di due convessi convesso, e quella di due chiusi chiusa. Inoltre,
un sottoinsieme chiuso di un insieme compatto a sua volta compatto.
17.1. GENERALIT 539
equivalente alloriginale (17.7). La scelta di quale risolvere, tra tali problemi equiv-
alenti, una pura questione di comodit analitica. Al riguardo, si ricordi come nellE-
sempio 7.4.4 avessimo visto che le funzioni di utilit g u sono del tutto equivalenti
a u e quindi lequivalenza tra i problemi di ottimo non solo matematica ma anche
economica.
X
n
u (x) = i log xi
i=1
La massima utilit maxx2Bi (p;I) u (x) dipende dal reddito I e dal vettore di prezzi
p: la funzione v : Rn++ R+ ! R denita come
detta funzione indiretta di utilit e, al variare di prezzi e reddito, indica come varia
la massima utilit ottenibile dal consumatore nella scelta del proprio paniere di beni.
Come vedremo tra breve col Teorema 294, la funzione di utilit indiretta esiste per
ogni coppia (p; I) 2 Rn++ R+ purch u sia continua5 .
Esempio 308 Nel Capitolo 27 vedremo che la funzione di utilit indiretta associata
alla funzione di utilit log-lineare u (x) = log x1 + (1 ) log x2
Grazie alle (17.3) e (17.4), la propriet di monotonia vista nella Proposizione 279
acquista la seguente veste per le funzioni di utilit indirette.
I I 0 ) v (p; I) v (p; I 0 )
e
p p0 ) v (p; I) v (p0 ; I)
5
La funzione indiretta di utilit un esempio di funzione valore di un problema di ottimo, come
il lettore vedr in corsi successivi.
540 CAPITOLO 17. PROBLEMI DI OTTIMO
Come si osservato nella Sezione 7.4.4, naturale ipotizzare che la funzione di util-
it u : A Rn+ ! R sia almeno crescente. Grazie alla Proposizione 278, se assumiamo
la forte crescenza di u, la soluzione del Problema del consumatore apparterr alla fron-
tiera @Bi (p; I) dellinsieme di bilancio. Ma, grazie alla forma particolare dellinsieme
di bilancio, possiamo dare un risultato pi ne.
Dim. Sia x 2 Bi (p; I) tale che p x < I. facile vedere che esiste y x tale che
p y I. Per la forte crescenza, si ha u (y) > u (x) e quindi x non pu essere soluzione
del Problema del consumatore.
Il consumatore destina quindi tutto il proprio reddito allacquisto della soluzione x^,
cio p x^ = I.6 Questa propriet detta Legge di Walras e, grazie a essa, nel Problema
del consumatore con funzioni fortementi crescenti di utilit, si pu sostituire linsieme
di bilancio Bi (p; I) con il suo sottoinsieme
6
La Proposizione 282 pi ne della Proposizione 278 perch esistono punti della frontiera
@Bi (p; I) tale che p x < I. Per esempio, lorigine 0 2 @Bi (p; I).
7
Linsieme A di produzione pu per esempio essere determinato da condizioni tecnologiche. Si
noti che, nella terminologia della Denizione 116, si ha A = C, ossia linsieme C coincide col dominio:
omettiamo quindi la clausola sub x 2 C in (17.8).
17.1. GENERALIT 541
(b
y) (y) 8y 2 R+
mentre maxy2R+ (y) il massimo protto ottenibile dal produttore. Linsieme degli
output di massimo arg maxy (y).
La forma della funzione di ricavo dipende dal tipo di mercato nel quale il produttore
vende il bene, mentre quella della funzione di costo dipende dal tipo di mercato ove
il produttore acquista gli input necessari a produrre il bene. Consideriamo alcune
classiche forme di mercato:
r (y) = py 8y 2 R+ :
r (y) = yD (y) 8y 2 R+ :
x = (x1 ; x2 ; :::; xn )
c (y) = min
1
w x 8y 2 R+ ;
x2f (y)
mentre un produttore in concorrenza perfetta sia nel mercato delloutput sia nel
mercato degli input avr funzione di protto
ammette soluzione tutte le volte che f continua e C compatto. Ci vale anche per
lo speculare problema di ottimo con min in luogo di max.
con 2 [0; 1] e 2 (0; 1], continua e ha dominio Rn+ chiuso. Per il Teorema di
Weierstrass, il Problema del consumatore con tale funzione di utilit ha soluzione
(purch p 0). N
Alla luce della Denizione 9, per mostrare che f (K) limitato in R occorre
mostrare che sia superiormente sia inferiormente limitato in R. Supponiamo, per
contra, che f (K) non sia superiormente limitato. In tal caso esiste una successione
fyn g f (K) con limn!1 yn = +1. Sia fxn g K la corrispondente successione tale
che f (xn ) = yn per ogni n. La successione fxn g limitata poich fxn g K, ossia
contenuta nellinsieme limitato K. Per il Teorema di Bolzano-Weierstrass, esiste
una sottosuccessione fxnk g e un punto x~ 2 R tale che limk!1 xnk = x~. Poich K
chiuso, si ha x~ 2 K. Inoltre, la continuit di f implica limk!1 ynk = limk!1 f (xnk ) =
x) 2 R. Ci contraddice limk!1 ynk = limn!1 yn = +1. Ne segue che f (K)
f (~
superiormente limitato. In modo analogo si mostra che f (K) inferiormente limitato.
Possiamo quindi concludere che f (K) limitato.
Per completare la dimostrazione che f (K) compatto, ci resta da mostrare che
f (K) anche chiuso. Consideriamo una successione fyn g f (K) che converge a y 2
R. Alla luce del Teorema 66, dobbiamo mostrare che y 2 f (K). Poich fyn g f (K),
per denizione esiste una successione fxn g K tale che f (xn ) = yn . Come visto
sopra, la successione fxn g limitata. Quindi, per il Teorema di Bolzano-Weierstrass
esiste una sottosuccessione fxnk g e un punto x~ 2 R tale che limk!1 xnk = x~. Poich
K chiuso, si ha x~ 2 K. Inoltre, la continuit di f implica
y = lim ynk = lim f (xnk ) = f (~
x) :
k!1 k!1
Dim. del Teorema di Weierstrass. Come per il precedente lemma, con le nozioni
di topologia a nostra disposizione siamo in grado di dimostrare il risultato solo nel
caso n = 1. Ci limitiamo a dimostrare lesistenza di un punto di massimo perch in
modo analogo si dimostra lesistenza di un punto di minimo.
Grazie al Lemma 284, f (K) compatto, e quindi limitato. Per il Teorema di
completezza dei reali esiste sup f (K). Sia = sup f (K): per ogni n esiste yn 2
f (K) tale che yn > 1=n. Quindi, esiste una successione fyn g f (K) tale che
limn!1 yn = . Poich f (K) chiuso, 2 f (K) grazie al Teorema 66. Da ci segue
che = max f (K) e quindi esiste x1 2 K tale che f (x1 ) = maxx2K f (x).
Lesistenza del minimo si prova in maniera analoga.
Da ci segue che
(f t) = (g f t) 8t 2 R
il che implica il risultato (come il lettore pu facilmente vericare).
Tutte le funzioni continue sono coercive su insiemi compatti. Ci sar una sem-
plice conseguenza della seguente importante propriet degli insiemi di soprallivello e
sottolivello di funzioni continue.
Esempio 312 Lipotesi che C sia chiuso cruciale. Sia per esempio f : R ! R data
da f (x) = x. Se C = (0; 1), si ha (f t) \ C = [t; 1) per ogni t 2 (0; 1) e tali insiemi
non sono chiusi. N
Esempio 314 Sia f : R ! R denita come f (x) = e jxj : essa coerciva; infatti
8
>
> R se t 0
<
fx 2 R : f (x) tg = [log t; log t] se t 2 (0; 1]
>
>
: ; se t > 1
Si ponga C = [ 1; 1]. Si ha
(
( 1; et ] [ [et ; +1) [ f0g se t 0
fx 2 R : f (x) tg = ;
( 1; et ] [ [et ; +1) se t > 0
e quindi
(
; t>0
fx 2 R : f (x) tg \ C = :
[ 1; et ] [ [et ; 1] [ f0g t 0
La funzione quindi coerciva su C. N
17.3.2 Supercoercivit
Alla luce del Teorema di Tonelli, diventa importante individuare classi di funzioni
coercive. Le funzioni supercoercive ne sono un primo importante esempio.
Denizione 119 Una funzione f : A Rn ! R si dice supercoerciva su un sot-
toinsieme C di A se f (xn ) ! 1 per ogni successione fxn g C tale che kxn k !
+1.
Quando A = C, la funzione si dice supercoerciva, senza ulteriori specicazioni. La
supercoercivit richiede che f diverga a 1 lungo ogni possibile successione illimitata
che appartiene al suo dominio. In altre parole, la funzione non pu assumere valori
che crescano indenitamente su una successione che scappaallinnito. Ci fa si che
gli insiemi di soprallivello siano tutti limitati.
17.3. ESISTENZA: TEOREMA DI TONELLI 549
xn ! +1 ) f (xn ) = 1
e
xn ! 1 ) f (xn ) = 1
la funzione supercoerciva su R.
(ii) La funzione f : R2 ! R data da f (x) = x21 x22 supercoerciva su R2 .
Infatti,
q 2
f (x) = x21 + x22 = x21 + x22 = kxk2
e quindi
kxk ! +1 ) f (x) = 1
Pn
(iii) Pi in generale, la funzione f : Rn ! R data da f (x) = i=1 x2i
supercoerciva su R2 . N
Dim. Il risultato precedente implica che, per ogni t 2 R, gli insiemi (f t) \ C sono
limitati. Poich f continua e C chiuso, questi insiemi sono anche chiusi. Infatti,
sia fxn g (f t) \ C tale che xn ! x 2 Rn . Per il Teorema 66, per mostrare che
(f t) \ C chiuso, basta mostrare che x 2 (f t) \ C. Poich C chiuso, si ha
x 2 C. Poich f continua, si ha lim f (xn ) = f (x). Siccome f (xn ) t per ogni n, ne
segue che f (x) t, cio x 2 (f t). Quindi, x 2 (f t) \ C e linsieme (f t) \ C
chiuso. Essendo limitato, compatto.
Si noti che, per una funzione supercoerciva e continua tutti gli insiemi (f t) \ C
sono compatti, mentre la coercivit richiede solo che almeno uno sia non vuoto e
compatto. Ci prova ulteriormente quanto la supercoercivit sia una propriet pi
forte della coercivit (sebbene si limiti agli insiemi chiusi C, che comunque formano
una fondamentale classe di insiemi nei problemi di ottimo).
Esempio 319 (i) Sia f : Rn ! R la funzione continua denita come f (x) = 1 kxk
per ogni x 2 Rn . Se 1, il Corollario 291 implica che f sia supercoerciva. Infatti,
per ogni successione fxn g tale che kxn k ! +1, si ha denitivamente
e quindi
f (x) = 1 kxk 1 kxk
Ponendo = 1 e = 1, vale la (17.9). Per il Corollario 291, f coerciva. Si noti
che per n = = 1 si ritrova la funzione f (x) = 1 x2 dellultimo esempio.
Per il Teorema di Tonelli, f almeno un punto di massimo in Rn . Daltra parte,
facile vedere come la funzione non abbia punti di minimo in Rn (il Teorema di
Weierstrass non vale poich Rn non compatto).
2 2
(ii) Sia f : R2 ! R data da f (x) = ex1 x42 . Si ha x21 ex1 per ogni x1 2 R e
x22 x42 per ogni jx2 j 1. Insieme alla (17.10) ci implica che, denitivamente,
2
f (x) = ex1 x4 x21 x22 = kxk2 kxk
6
y
5
0 O x
-1
-2
1880 1900 1920 1940 1960 1980 2000
f (^
x) f (x) ; 8x 2 B" (^
x) \ C: (17.11)
Il valore f (^
x) della funzione in x^ si dice massimo (o valore massimo) locale di f su
C.
Esempio 320 Sia f : R ! R data da f (x) = x6 3x2 +1. NellEsempio 437 vedremo
che il suo graco :
OfB. Un punto x0 isolato del dominio di una funzione sempre punto sia di massimo
sia di minimo locale. Vi infatti almeno un suo intorno per il quale B" (x0 ) \ C
contiene soltanto x0 e perci le disuguaglianze f (x0 ) f (x) e f (x0 ) f (x) per ogni
x 2 B" (x0 ) \ C si riducono a f (x0 ) f (x0 ) e f (x0 ) f (x0 ), che sono banalmente
vere.
Il considerare punti di massimo e di minimo locale tutti i punti isolati del do-
minio pu essere giudicato sgradevole. Per evitarlo si potrebbe pensare di riformulare
la denizione di punto di massimo e di minimo imponendo in essa che x^ sia punto
di accumulazione di C. In tal modo i punti isolati, non essendo di accumulazione,
cesserebbero di essere di massimo o di minimo locale. Vi sarebbe per una conseguen-
za ancor pi sgradevole. Se un punto isolato fosse di massimo o di minimo globale,
dovremmo dire che per non lo in senso locale. Dovremmo cio fare uneccezione al
fatto che ogni punto di massimo o di minimo globale anche locale e ci, francamente,
ancora pi sgradevole10 . Insomma, il rimedio sarebbe peggiore del male. Alla ne,
meglio dunque tenersi la piccola sgradevolezza che tutti i punti isolati del dominio
sono di massimo e di minimo locali. H
Dim. Sia x^ 2 C punto di massimo locale. Per denizione, esiste un suo intorno B" (^
x)
tale che
f (^
x) f (x) 8x 2 B" (^x) : (17.12)
Supponiamo che x^ non sia di massimo globale. Esiste quindi y 2 C tale che f (y) >
x). Poich f concava, per ogni t 2 (0; 1) si ha
f (^
f (t^
x + (1 t) y) tf (^
x) + (1 t) f (y) > tf (^
x) + (1 t) f (^
x) = f (^
x) : (17.13)
Poich C convesso, si ha t^
x + (1 t) y 2 C per ogni t 2 (0; 1). Daltra parte,
lim kt^
x + (1 t) y x^k = ky x^k lim (1 t) = 0;
t!1 t!1
Essa quasi concava perch monotona. Tutti i punti x > 1 sono massimi locali ma
non globali. N
e quindi
f (tx + (1 t) y) = max f (x) ;
x2C
17.6.1 Consumo
Torniamo al Problema del consumatore (17.7):
Y
n
u (x) = xi i
i=1
P
con i > 0 e ni=1 i = 1, ha dominio Rn++ aperto. Essa continua e strettamente
concava. Il prossimo lemma mostra che coerciva su Bi (p; w); per il Teorema 294 il
Problema del consumatore ha una e una sola soluzione. Naturalmente, lesistenza di
un eventuale paniere di sussistenza x 0 restringe il dominio della funzione Cobb-
n
Douglas al dominio chiuso A = x 2 R+ : x x Rn++ ; in questo caso la coercitivit
su Bi (p; w) conseguenza immediata della Proposizione 287.
Dim. Per prima cosa mostriamo che gli insiemi di soprallivello (u t) sono chiusi per
ogni t 2 R. Se t 0 ci banalmente vero perch (u t) = ;. Sia t > 0, cosicch
(u t) 6= ;. Si consideri una successione xk (u t) che converge a un paniere
17.6. CONSUMO E PRODUZIONE 557
u xk t>0 8k
In conclusione, x~ 0. Quindi, x~ appartiene al dominio di u, dalla cui continuit segue
u xk ! u (~ x). Poich u xk t per ogni k, possiamo concludere che u (~ x) t, cio
x~ 2 (u t), come desiderato.
facile vedere che, per t > 0 su cientemente piccolo, lintersezione (u t) \
Bi (p; w) non vuota. Si ha
(u t) \ Bi (p; w) = x 2 Rn++ : u (x) t \ x 2 Rn++ : p x w
= x 2 Rn++ : u (x) t \ x 2 Rn+ : p x w
= (u t) \ B (p; w)
Siccome (u t) chiuso e B (p; w) compatto, ne segue che lintersezione (u t) \
Bi (p; w) un insieme compatto. La funzione u quindi coerciva su Bi (p; w).
Linsieme delle soluzioni del Problema del consumatore, cio dei panieri ottimi di
consumo, arg maxx2B(p;I) u (x). Se la funzione di utilit strettamente quasi concava,
tale insieme al pi un singoletto; indichiamolo con f^ x (p; I)g, cos da evidenziare la
dipendenza della soluzione dal reddito I e dal vettore p di prezzi. In particolare, tale
dipendenza si pu formalizzare con la funzione D : Rn++ R+ ! Rn denita come
D (p; I) = x^ (p; I) ; 8 (p; I) 2 Rn++ R+
La funzione D detta funzione di domanda del consumatore: ad ogni vettore (p; I)
essa associa il suo paniere ottimo. La funzione di domanda, fondamentale in Economia,
descrive perci il variare della soluzione del problema del consumatore al variare di
prezzi e reddito12 .
17.6.2 Produzione
Consideriamo il Problema del produttore (17.8):
max (y) sub y 2 R+
y
r (y)
<1
c (y)
Dim. Sia y > 0 tale che r (y) =c (y) < 1 per ogni y y. Per ogni tale y si ha
r (y)
(y) = r (y) c (y) = c (y) 1 ! 1
c (y)
r (y) p y p
= 2 = !0
c (y) y y
e quindi le ipotesi del Teorema 296 sono soddisfatte. Ne segue che il problema (17.14)
ha soluzione. Inoltre, tale soluzione unica perch strettamente concava.
17.7 Assicurazione
Le grandinate sono da sempre una grave minaccia per i raccolti e, per tale ragione,
la stipula di una polizza di assicurazione contro la grandine un problema di scelta
importante per molti contadini. Il Criterio dellutilit attesa permette di formalizzare
tale problema. Vi sono due stati del mondo rilevanti:
Supponiamo che, sulla base delle sue informazioni metereologiche, il contadino ritenga
che le probabilit P (! 1 ) e P (! 2 ) con le quali gli stati si vericheranno sono P (! 1 ) =
1 p e P (! 2 ) = p, con p 2 [0; 1]. Nel gergo assicurativo, p la probabilit del sinistro.
17.7. ASSICURAZIONE 559
= w1 w2
il danno causato dalla grandine. Per fronteggiare tale danno, il contadino pu ac-
quistare diverse quantit di una polizza assicurativa unitaria contro la grandine che
paga 1 euro di risarcimento in caso di grandine a fronte del pagamento da parte del
contadino di un premio di euro. Se il contadino acquista una quantit 0 di tale
polizza unitaria, ricever un risarcimento di euro in caso di grandine e pagher un
premio di euro.
Indichiamo con f latto che corrisponde allacquisto di unit della polizza
unitaria. Le consequenze di tale atto sono
f (! 1 ) = w1
e
f (! 2 ) = w2 +
Si noti che il premio viene pagato in ogni stato del mondo, mentre il risarcimento
pagato solo in caso di grandine. Secondo il Criterio dellutilit attesa, il contadino
valuta latto f come
EP u (f ) = u (f (! 1 )) P (! 1 ) + u (f (! 2 )) P (! 2 )
= u (w1 ) (1 p) + u (w2 + )p
= u (w1 ) (1 p) + u (w1 + )p
EP u (f ^ ) EP u (f ) 8 0
cio se essa garantisce unutilit attesa maggiore o uguale di quella garantita da qualsi-
asi altra quantit . Chiamiamo (17.15) il Problema di assicurazione e lo risolveremo
nel Capitolo 27 (Sezione 27.5.3).
= (1 p) + ( )p
= ( p)
560 CAPITOLO 17. PROBLEMI DI OTTIMO
A x = b ; (17.16)
(m n)(n 1) m 1
pu non avere soluzione. Per esempio, questo spesso il caso per sistemi con pi
equazioni che incognite: m > n.
Quando il sistema non ha soluzione non esiste alcun vettore x^ 2 Rn tale che A^x = b.
Ci detto, ci si pu chiedere se esista un surrogato della soluzione, un vettore x 2 Rn
che renda minimo lerrore di approssimazione
kAx bk (17.17)
Lerrore nullo nel caso fortunato ove x soluzione del sistema perch Ax b = 0.
In generale, lerrore (17.17) positivo perch la norma sempre 0.
Per la Proposizione 277 equivalente rendere minima la norma kAx bk oppure
la sua pi comoda trasformazione quadratica kAx bk2 . Ci motiva la prossima
denizione.
Quando esiste, la soluzione del sistema ne anche soluzione ai minimi quadrati. Per
essere un buon surrogato, occorre per che la soluzione ai minimi quadrati esista anche
quando il sistema non ha soluzione. In altre parole, il Metodo dei minimi quadrati
tanto pi utile quanto pi generali sono le condizioni che garantiscono lesistenza di
soluzioni del Problema di ottimo (17.18).
Il prossimo importante risultato mostra che, in eetti, tali soluzioni esistono e sono
uniche con la sola ipotesi (A) = n, che nel caso pi rilevante m > n equivale a
richiedere che la matrice A abbia rango massimo. Il risultato si basa sul Teorema di
Tonelli per lesistenza e sul Teorema 293 per lunicit.
Teorema 297 Il Problema di ottimo (17.18) ha una e una sola soluzione purch
(A) = n.
Il prossimo lemma mostra le notevoli propriet della funzione obiettivo g che perme-
ttono di applicare il Teorema di Tonelli e Teorema 293. Si ricordi che la condizione
(A) = n equivale alliniettivit dellapplicazione lineare F (x) = Ax.
dove la disuglianza stretta segue dalla stretta concavit della norma k k. Dunque:
g ( x1 + (1 ) x2 ) = kF ( x1 + (1 ) x2 ) bk2
2
> kF (x1 ) bk (1 ) kF (x2 ) bk2
= g (x1 ) + (1 ) g (x2 )
kyk = ky b + bk ky bk + kbk
e quindi
(g t) = fx 2 Rn : f (F (x)) tg = fx 2 Rn : F (x) 2 Bt g = F 1
(Bt )
Dim. del Teorema 297 Alla luce dellultimo lemma, il Problema (17.19), e quindi
il Problema (17.18), ha soluzione grazie al Teorema di Tonelli perch g coerciva ed
unica grazie al Teorema 293 perch g strettamente concava.
cio la somma dei quadrati degli errori yi xi che si commettono usando la funzione
di produzione f (x) = x per valutare loutput. Si ha quindi il seguente problema di
ottimo
X m
min (yi xi )2 sub 2 R
i=1
Se indichiamo con X = (x1 ; :::; xm ) e Y = (y1 ; :::; ym ) i vettori dei dati su input e
output, possiamo riscriverlo in forma matriciale come
per decidere quanto concime usare per il prossimo raccolto per un dato livello di
produzione di patate che si pregga. Con i dati a sua disposizione e la scelta di
semplicit di limitarsi a funzioni di produzione lineari, il Metodo dei minimi quadrati
gli suggerisce che questa la funzione di produzione che meglio si accorda con i dati.
18
Purtroppo la notazione qui usata, comune in statistica, non coerente con quella del Problema
(17.18). In particolare, qui svolge il ruolo di x nella (17.18).
564 CAPITOLO 17. PROBLEMI DI OTTIMO
8
y
7
1
0 O 1 2 3 4 5 6 7x
Quanto fatto dal contadino si pu ripetere per lanalisi di dati di qualsiasi coppia di
variabili. La variabile esplicativa x, detta regressore, spesso non unica. Per esempio,
tornando al nostro contadino, supponiamo che siano necessari n tipi di input x1 , x2 ,
..., x2 (cio n regressori) per produrre la quantit y di output. I dati raccolti dal
contadino sugli input sono
ha come colonne i vettori X1 , X2 , ..., Xn , sicch ogni colonna raccoglie i dati sui
regressori nei vari anni.
Il Metodo dei minimi quadrati conduce a
min kX Y k2 sub 2 Rn
17.9. PROIEZIONI E APPROSSIMAZIONI 565
1.5
1
x
0.5
0 ||x-m||
O
-0.5
m
-1
-1.5
-2
-1 0 1 2 3 4
ha una e una sola soluzione, data dal vettore m 2 V il cui errore x m ortogonale
a V , cio (x m) ?V .
f (y) = kx yk
Dim. La dimostrazione analoga a quella del Lemma 298 ed lasciata al lettore (si
ricordi dalla Proposizione 249 che V un insieme chiuso e convesso di Rn ).
Dim. del Teorema della proiezione Alla luce dellultimo lemma, il Problema
(17.23), e quindi il Problema (17.22), ha soluzione grazie al Teorema di Tonelli perch
f coerciva su V ed unica grazie al Teorema 293 perch f strettamente concava.
17.9. PROIEZIONI E APPROSSIMAZIONI 567
Esempio 323 Sia V generato dai vettori fyi gki=1 , e sia Y 2 M (k; n) la matrice che
ha tali vettori come colonne. Dato x 2 Rn , si ha x?V se e solo se
Yx=0
17.9.2 Proiezioni
Dato un sottospazio vettoriale V di Rn , la soluzione del problema di minimo (17.22)
si dice proiezione di x su V . In tal modo si denisce unapplicazione PV : Rn ! Rn
che a ogni x 2 Rn associa la sua proiezione PV (x).
Quindi
( PV (x) + PV (y) ( x + y)) ?V
e, per il Teorema della proiezione, PV (x) + PV (y) la proiezione di x + y su V ,
cio PV ( x + y) = PV (x) + PV (y).
(x PV (x)) yi = 0 8i = 1; :::; k
ossia
X
k
k (yk yi ) = x yi 8i = 1; :::; k
i=1
Si ha quindi il sistema
8
>
> 1 (y1 y1 ) + 2 (y2 y1 ) + + k (yk y1 ) = x y1
<
1 (y1 y2 ) + 2 (y2 y2 ) + + k (yk y2 ) = x y2
>
>
:
1 (y1 yk ) + 2 (y2 yk ) + + k (yk yk ) = x yk
Sia Y 2 M (n; k) la matrice che ha i vettori generatori fyi gki=1 come colonne. Possiamo
riscrivere il sistema in forma matriciale come
YT Y = YT x (17.24)
k nn kk 1 k nn 1
X
k
1
PV (x) = k yk =Y = Y Y TY Y Tx 8x 2 Rn
i=1
cio
kPIm F (b) bk ky bk y 2 Im F
Quindi, un vettore x 2 Rn soluzione ai minimi quadrati se e solo se
(X Y ) ?Xi 8i = 1; ::; n
Questa la rappresentazione matriciale della (17.28), che stata resa possibile dalla
rappresentazione matriciale delle proiezioni stabilita nel Teorema 303. Si dunque
trovata la soluzione ai minimi quadrati quando la matrice A ha rango pieno. In
notazione statistica si ritrova la classica formula
1
= X TX X TY
dei minimi quadrati.
NB. Accanto alla semicontinuit superiore vi quella inferiore, con f (x) > f (x0 ) "
in luogo di f (x) < f (x0 ) + ". Lo studio di queste due forme di semicontinuit
analogo, tant che facile vedere che f superiormente semicontinua se e solo se f
inferiormente semicontinua. Per questa ragione, consideremo solo la semicontinuit
superiore perch pi rilevante per i punti di massimo. O
In questo modo possiamo costruire una successione fxn g tale che xn ! x0 e f (xn )
f (x0 )+" per ogni n. Dunque, lim inf n f (xn ) f (x0 )+", il che contraddice lim supn f (xn )
f (x0 ) e mostra come f debba quindi essere superiormente semicontinua in x0 .
superiormente semicontinua. Infatti, essa continua in ogni x 2 (0; 1], e per quanto
riguarda x = 0 si consideri fxn g [0; 1] con xn ! 0. Per ogni tale xn si ha f (xn ) 1
e quindi lim supn f (xn ) 1 = f (0). Per la Proposizione 304, f superiormente
semicontinua anche in 0. N
Il Lemma 286 sulla chiusura degli insiemi di soprallivello continua a valere per fun-
zioni superiormente semicontinue, ed anzi una propriet caratterizzante per questa
nozione indebolita di continuit.
e quindi gli insieme (1F t) sono chiusi per ogni t 2 R. Per esempio, le funzioni
1[0;+1) : R ! R e 1[0;1] : R ! R hanno la forma
( (
1 se x 0 1 se x 2 [0; 1]
1[0;+1) (x) = e 1[0;1] (x) =
0 se x < 0 0 se x 2
= [0; 1]
N
Dim. Cominciamo col dimostrare che f superiormente limitata su C, cio supx2C f (x) <
+1. Supponiamo, per contra, che supx2C f (x) = +1. Grazie alla Proposizione 52,
esiste una successione crescente f n g f (C) tale che n " +1. Quindi, esiste una
successione fxn g C tale che f (xn ) = n per ogni n. Poich f coerciva, esiste t 2 R
tale che (f t) \ C compatto e non vuoto. Poich n " +1, si ha denitivamente
n t e quindi denitivamente xn 2 (f t) \ C. La compattezza di questo insieme
implica che la successione fxn g limitata; per il Teorema di Bolzano-Weierstrass,
esiste una sottosuccessione fxnk g che converge a un elemento x 2 (f t) \ C. La
semicontinuit di f porta alla contraddizione
Ne segue che supx2C f (x) < +1. Si ponga = supx2C f (x). Applicando di nuovo la
Proposizione 52, si costruisce una successione crescente f n g f (C) tale che n " ,
sicch esiste una successione fxn g C tale che f (xn ) = n per ogni n.
Se = t, lasserto vale perch ogni elemento di (f t)\C punto di massimo di f
in C. Sia > t. Siccome n " , si ha denitivamente n t, e quindi denitivamente
17.10. APPROFONDIMENTO SEMICONTINUO 575
Il prossimo corollario una semplice conseguenza del Teorema 306 e mostra che la
coercitivit implicata dalla semicontinuit superiore quando linsieme in cui si cerca
il punto di massimo un compatto. Questa versione del Teorema 306 si presta bene
ad un confronto col Teorema di Weierstrass, in quanto esso vale sotto le medesime
ipotesi, eccetto la semicontinuit superiore al posto della continuit.
Dim. Per la Proposizione 305, (f t)\C chiuso per ogni t 2 R, e quindi compatto.
Quindi, f coerciva su C. Essendo anche superiormente semicontinua su C, lasserto
segue dal Teorema 306.
Per il Corollario 307, la funzione ha almeno un punto di massimo nel suo dominio [0; 1].
Si pu vericare che essa non ha punti di minimo nel suo dominio (qui il Teorema di
Weierstrass non si pu applicare poich la funzione non continua). N
576 CAPITOLO 17. PROBLEMI DI OTTIMO
Parte IV
Calcolo dierenziale
577
Capitolo 18
Derivate
18.1 Denizione
La funzione c : R+ ! R indichi il costo c (x) necessario per produrre la quantit x di
output. Supponiamo il produttore voglia valutare limpatto sui costi di una variazione
x nelloutput prodotto. Per esempio, se x = 100 e x = 3, si deve valutare la
ricaduta sui costi di una variazione positiva, ossia di un incremento, di 3 unit di
output rispetto allattuale produzione di 100 unit.
La variazione x determina una variazione
c = c (x + x) c (x)
x 2 (Z f0g) = f ; 3; 2; 1; 1; 2; 3; g;
Come si vede, al crescere della produzione, mentre il costo medio scende, il rapporto
579
580 CAPITOLO 18. DERIVATE
incrementale sale. Ci signica che il costo medio di ogni unit aggiuntiva cresce e
quindi aumentare la produzione , al margine, via via pi costoso per il produttore.
In particolare, lultima unit aggiuntiva ha determinato un aumento dei costi di 5
euro e quindi per il produttore tale aumento nella produzione conveniente se (e solo
se) vi un aumento almeno uguale anche nel rapporto incrementale dei ricavi che
indicheremo con R (x), ossia nel ricavo di ogni unit aggiuntiva:
R R (x + x) R (x)
= : (18.2)
x x
Aggiungiamo alla tabella due colonne con i possibili ricavi e con i loro rapporti
incrementali:
c(x) c R
x c (x) x x
R (x) x
Come si vede, i primi due aumenti di produzione sono molto convenienti per il pro-
duttore: il secondo aumento produce un rapporto incrementale dei ricavi pari a 50
euro contro un rapporto incrementale dei costi pari a 3; 33333. Dopo lultimo aumento
di produzione, tale rapporto scende invece a soli 4 euro, inferiore al corrispondente
valore di 5 euro del rapporto incrementale dei costi. Il produttore trover quindi con-
veniente aumentare al produzione no a 105 unit, ma non no a 106. La bont della
scelta confermata dallandamento del protto (x) = R (x) c (x), che per comodit
aggiungiamo alla tabella:
c(x) c R
x c (x) x x
R (x) x
(x)
100 4:494 44; 94 5:000 506
102 4:500 44; 11767 3 5:100 33; 33333 600
105 4:510 42; 95238 3; 33333 5:200 50 690
106 4:515 42; 59434 5 5:204 4 689
c (x + x) c (x)
c0 (x) = lim : (18.3)
x!0 x
Quando esiste nito, c0 (x) chiamato costo marginale in x: esso indica la variazione
nel costo causata da variazioni innitesime di output rispetto alla quantit iniziale
x.
Quindi, la derivata non altro che il limite del rapporto incrementale quando esso
esiste ed nito. Altre notazioni usate per la derivata in x0 sono
df
Df (x0 ) e (x0 )
dx
1
Si noti che, poich il dominio (a; b) un intervallo aperto, almeno per h su cientemente piccolo,
si ha x + h 2 (a; b).
2
Luso di una determinata notazione per un ente matematico questione di comodit e di e cacia,
requisiti che non sempre ununica notazione soddisfa al meglio in ogni contesto in cui usato lente
matematico. Per questa ragione, a volte comodo avere a disposizione pi notazioni.
582 CAPITOLO 18. DERIVATE
18.1.1 Osservazioni
(i) Nelle applicazioni le due variabili y e x che compaiono in una funzione y = f (x)
hanno un signicato concreto e sono entrambe misurate rispetto a una loro unit di
misura (e, kg, litri, anni, miglia, parsec, ecc.): se indichiamo con T lunit di misura
della variabile dipendente y e S lunit di misura della variabile indipendente x, i
loro rapporti incrementali y= x, e quindi la derivata (se esiste), sono allora espressi
nellunit di misura T =S.
Per esempio, consideriamo la funzione che esprime il protto y al variare della
quantit prodotta x di una merce: poniamo che si esprima il protto in e e la quantit
prodotta in quintali. La derivata della funzione di domanda allora espressa in e/q
cio in euro al quintale.
Ne discende che la diusa pratica di rappresentare su uno stesso graco una fun-
zione e la sua derivata scorretta quando le due funzioni hanno diverse unit di
misura.
(ii) Il pi classico esempio di derivata proviene dalla sica: sia t il tempo e s lo spazio
percorso da un oggetto mobile. La funzione s (t) indichi lo spazio complessivamente
percorso no al tempo t. Il suo rapporto incrementale s= t immediatamente
interpretabile come velocit media in un intervallo di lunghezza t di tempo e quindi
la sua derivata in un punto t0 come velocit istantanea in t0 .
Si osservi che, se lo spazio misurato in km e il tempo in ore, la velocit in km/h,
cio in chilometri allora3 .
3
Il tachimetro di unautomobile mostra al guidatore proprio la derivata (in ogni istante) dello
spazio percorso al variare del tempo.
18.2. INTERPRETAZIONE GEOMETRICA 583
y
5
f(x +h)
4 0
3
f(x )
0
2
0
O a x x +h b x
0 0
-1
-1 0 1 2 3 4 5 6
h 1 1
= lim = lim = :
h!0 hx (x + h) h!0 x (x + h) x2
La derivata esiste in ogni x 6= 0 ed data da x 2 . Per esempio, la derivata in x = 1
f 0 (1) = 1, e in 2 f 0 ( 2) = 1=4. N
Esempio 333 Consideriamo la funzione f : R ! R data da
( p
x se x 0
f (x) = p :
x se x < 0
Gracamente,
funzione derivata.
La funzione derivata descrive quindi la derivata nei dierenti punti del dominio
di derivabilit, dando cos conto del comportamento complessivo della derivata di f .
Tornando agli esempi appena visti,
f (x0 + h) f (x0 )
lim+ (18.7)
h!0 h
f (x0 + h) f (x0 )
lim : (18.8)
h!0 h
Il limite bilaterale del rapporto incrementale non esiste e quindi la funzione non
derivabile in 0. Tuttavia, esistono le derivate unilaterali; in particolare
f (x0 + h) f (x)
f+0 (0) = lim+ = 1;
h!0 h
f (x0 + h) f (x)
f 0 (0) = lim = 1:
h!0 h
H
588 CAPITOLO 18. DERIVATE
f (x) f (x0 )
lim = f 0 (x0 ):
x!x0 x x0
Si ha quindi:
dove lultima eguaglianza vale poich f 0 (x0 ) esiste nito. Si perci dimostrato che
limx!x0 (f (x) f (x0 )) = 0. Daltra parte:
0 = lim (f (x) f (x0 )) = lim f (x) lim f (x0 ) = lim f (x) f (x0 );
x!x0 x!x0 x!x0 x!x0
Come s detto, le tre indicate non sono le uniche cause di non derivabilit. Per
esempio la funzione
8
< x sin 1 se x 6= 0
f (x) = x
:
0 se x = 0
ovunque continua: infatti limx!0 x sin 1=x = 0 perch jsin 1=xj 1 e quindi x
x sin 1=x x. In x0 = 0 non derivabile perch
non esiste. Si osservi che il punto non angoloso e che in esso non vi tangente
verticale. Il motivo della non derivabilit risiede nella circostanza che f , in qualsiasi
intorno di x0 = 0, compie innite oscillazioni (che fanno s che il rapporto incrementale
sin 1=h oscilli innite volte tra 1 e 1). Si noti che in questo esempio non esistono
neanche le derivate unilaterali f+0 (x) e f 0 (x).
f 0 (x) = nxn 1 :
f (x + h) f (x) (x + h)n xn
f 0 (x) = lim = lim
h!0
P h h!0 h
n n! n k k n
k=0 k!(n k)!
x h x
= lim
h!0 h
n n 1 n(n 1) n 2 2
x + nx h+ 2
x h + + nxhn 1
+ hn xn
= lim
h!0 h
n (n 1) n 2
= lim nxn 1
+ x h+ + nxhn 2
+ hn 1
= nxn 1 ;
h!0 2
come desiderato.
x
Proposizione 311 La funzione esponenziale f : R ! R data da f (x) = , con
> 0, derivabile in ogni x 2 R, con funzione derivata f 0 : R ! R data da
f 0 (x) = x
log :
Dim. Si ha
x+h x x h
f (x + h) f (x) 1
f 0 (x) = lim = lim = lim
h!0 h h!0 h h!0 h
h
1
= x lim = x log ;
h!0 h
dove lultima uguaglianza segue dal limite notevole (12.28).
f 0 (x) = cos x:
dove lultima uguaglianza segue dai limiti notevoli (12.27) per cos x e (12.26) per sin x.
Dim. Si ha
( f + g) (x + h) ( f + g) (x)
( f + g)0 (x) = lim =
h!0 h
f (x + h) f (x) g (x + h) g (x)
= lim + =
h!0 h h
f (x + h) f (x) g (x + h) g (x)
= lim + lim =
h!0 h h!0 h
= f 0 (x) + g 0 (x) ;
592 CAPITOLO 18. DERIVATE
come desiderato.
Dim. Si ha
La derivata del prodotto non quindi il prodotto delle derivate, ma data dalla
pi sottile regola (18.12). Unanaloga regola, mutatis mutandis, vale per il rapporto.
Proposizione 315 Siano f; g : (a; b) ! R due funzioni derivabili in x 2 (a; b), con
g (x) 6= 0. La funzione rapporto f =g : (a; b) ! R derivabile in x, con
0
f f 0 (x) g (x) f (x) g 0 (x)
(x) = : (18.13)
g g (x)2
4
Ovviamente non vale il converso: se la somma di due funzioni derivabile, non detto che le
singole funzioni lo siano (per esempio, f (x) = jxj e g (x) = jxj). La stessa osservazione vale anche
per le operazioni di moltiplicazione e di divisione.
18.7. ALGEBRA DELLE DERIVATE 593
1 g (x) g (x + h)
= lim
g (x) h!0 g (x + h) h
1 g (x + h) g (x) 1 g 0 (x)
= lim lim = :
g (x) h!0 h h!0 g (x + h) g (x)2
come desiderato.
e
(f g)0 (x) = 3x2 sin x + x3 cos x 8x 2 R;
nonch
0
f 3x2 sin x x3 cos x
(x) = 8x 2 R fn : n 2 Zg :
g sin2 x
Nella formula del rapporto, fn : n 2 Zg linsieme dei punti f ; 2 ; ; 0; ; 2 ; g
dove la funzione g (x) = sin x si annulla. N
Esempio 337 Sia f : R ! R data da f (x) = tan x. Poich tan x = sin x= cos x, si ha
f 0 (x) = 1 + tan2 x
Nello stesso modo si pu mostrare per induzione nita che la derivata di xn nxn 1 .
Infatti, il caso n = 1 ovvio. Supponiamo che la regola valga per n 1, cio che la
derivata di xn 1 sia (n 1) xn 2 . Grazie alla regola del prodotto si ha
dxn d (xn 1 x)
= = (n 1) xn 2
x + xn 1
1 = (n 1) xn 1
+ xn 1
= nxn 1
dx dx
come desiderato. N
Esempio 339 Sia c : R+ ! R una funzione di costo, con funzione di costo marginale
c0 : D R+ ! R. Consideriamo la funzione di costo medio cm : (0; +1) ! R data da
c (x)
cm (x) =
x
Grazie alla regola del rapporto, si ha
c(x)
xc0 (x) c (x) x c0 (x) x c0 (x) cm (x)
c0m(x) = = =
x2 x2 x
Poich x > 0, si ha
c0m (x) 0 () c0 (x) cm (x) 0 () c0 (x) cm (x) (18.14)
Dunque, la variazione nei costi medi positiva in un punto x se e solo se ivi i costi
marginali sono maggiori di quelli medi. In altre parole, i costi medi continuano a salire
ntanto che sono inferiori ai costi marginali.
Lo stesso ragionamento vale pi in generale per ogni funzione f : R+ ! R che
esperime, al variare di x 0, una grandezza economica: ricavo, protto, ecc.. La
funzione fm : (0; +1) ! R denita da
f (x)
fm (x) =
x
la corrispondente grandezza media(ricavo medio, protto medio, ecc.), mentre la
funzione derivata f 0 (x) esprime la grandezza marginale (ricavo marginale, protto
marginale, ecc.). In ogni x > 0 la funzione f 0 (x) geometricamente interpretabile
come la pendenza della retta tangente al graco di f in x, mentre fm (x) la pendenza
della retta (secante) passante per lorigine e per il punto di ascissa x.
18.8. LA REGOLA DELLA CATENA 595
Dal punto di vista geometrico, la (18.14) aerma che la variazione della media fm
0
positiva, cio fm 0, ntanto che la pendenza della retta tangente maggiore di
quella secante. N
La regola della catena5 molto utile nel calcolare la derivata di funzioni che possono
scriversi come composizione di opportune funzioni.
Esempio 342 Sia ' : R ! R data da ' (x) = sin3 (9x + 1). Per calcolare '0 (x)
opportuno vedere ' come
' = f g h; (18.17)
dove f : R ! R data da f (x) = x3 , g : R ! R data da g (x) = sin x, e h : R ! R
data da h (x) = 9x + 1. Grazie alla regola della catena si ha
'0 (x) = f 0 ((g h) (x)) (g h)0 (x) = f 0 ((g h) (x)) g 0 (h (x)) h0 (x)
= 3 sin2 (9x + 1) cos (9x + 1) 9 = 27 sin2 (9x + 1) cos (9x + 1) :
Vedere la funzione ' nella forma (18.17) ne quindi semplica il calcolo della derivata.
N
dy dy dz
= ;
dx dz dx
d
d
si comporta come un eettivo rapporto. H
1 0 1
f (y0 ) = : (18.18)
f0 (x0 )
5
Qualcuno la chiama regola della cipollaperch la derivata di una funzione composta si ottiene
sbucciando progressivamente la funzione dallesterno:
0 0
(f g h ) = (f (g (h ( )))) = f 0 (g (h ( ))) g 0 (h ( )) h0 ( ) :
18.9. DERIVATA DI FUNZIONI INVERSE 597
f (x0 + h) f (x0 )
lim = f 0 (x0 ) ;
h!0 h
ma
f (x0 + h) f (x0 ) y0 + k y0 1
= 1
= 1 1
h f (y0 + k) f 1 (y0 ) f (y0 + k) f (y0 )
k
e quindi, purch f 0 (x0 ) 6= 0, esiste anche il limite del rapporto
1 1
f (y0 + k) f (y0 )
k
per k ! 0 ed il reciproco del precedente:
1 0 1
f (y0 ) = :
f0 (x0 )
La derivata della funzione inversa si ottiene quindi dalla frazione unitaria in cui al
denominatore la derivata f 0 ha come argomento la controimmagine f 1 (y).
d log y 1 1 1 1
= 0 = x = log y =
dy f (x) e e y
f 0 (x)
F 0 (x) = eg(x) log f (x) D [g (x) log f (x)] = F (x) g 0 (x) log f (x) + g (x) :
f (x)
dxx 1
= xx log x + x = xx (1 + log x) ;
dx x
2
mentre la derivata di F (x) = xx
2
dxx 2 1 2 +1
= xx 2x log x + x2 = xx (1 + 2 log x) :
dx x
N
x
Il lettore provi a calcolare la derivata di F (x) = xx .
1
OfB. Indicando con y = f (x) una funzione e con x = f (x) la sua inversa, possiamo
riassumere ci che abbiamo visto scrivendo
dx 1
= :
dy dy
dx
18.10 Formulario
La regola della catena permette di ampliare notevolmente la portata dei risultati sulle
derivate di funzioni elementari visti nella Sezione 18.6. Gi nellEsempio 341 avevamo
visto come calcolare la derivata di una generica funzione ef (x) , molto pi generale
dellesponenziale ex della Proposizione 311.
In modo analogo si possono generalizzare tutti i risultati sulla derivazione di fun-
zioni elementari visti sinora. Riassumiamo il tutto con due tabelle: la prima riporta le
600 CAPITOLO 18. DERIVATE
f f0 Riferimento
k 0 Esempio 331
xa axa 1 Prop. 318
ex ex Prop. 311
x x
log Prop. 311
1
log x Esempio 343
x
1
loga x Esercizio per lettore
x log a
sin x cos x Prop. 312
cos x sin x Osservazione 18.10
1
tan x = 1 + tan2 x Esercizio per il lettore
cos2 x
1
cotanx = (cotan2 x) Esercizio per il lettore
sin2 x
1
arcsin x p Esercizio 344
1 x2
1
arccos x p Esercizio per il lettore
1 x2
1
arctan x Esercizio 345
1 + x2
1
arccotanx Esercizio per il lettore
1 + x2 (18.20)
Vediamone anche la versione generale, ottenuta grazie alla regola della catena.
Nella tabella f sono le funzioni elementari della tabella precedente, mentre g una
18.11. DIFFERENZIABILIT E LINEARIT 601
f g (f g)0 Immagine di g
a a 1
g (x) ag (x) g 0 (x) A R
g(x) 0 g(x)
e g (x) e A R
g(x)
g 0 (x) g(x) log A R
g 0 (x)
log g (x) A R++
g (x)
g 0 (x) 1
loga g (x) A R++
g (x) log a
sin g (x) g 0 (x) cos g (x) A R
cos g (x) g 0 (x) sin g (x) A R
g 0 (x)
tan g (x) = g 0 (x) (1 + tan2 g (x)) A R
cos2 g (x)
g 0 (x)
arcsin g (x) p A [0; 1]
1 g 2 (x)
g 0 (x)
arccos g (x) p A [0; 1]
1 g 2 (x)
g 0 (x)
arctan g (x) A R
1 + g 2 (x)
(18.21)
18.11.1 Dierenziale
Un problema fondamentale se sia possibile approssimare una funzione f : (a; b) ! R
localmente, cio in un intorno di un assegnato punto del suo dominio, tramite una
funzione a ne, ossia con una retta. Se ci fosse possibile, potremmo approssimare
localmente funzioni anche molto complicate con la pi semplice delle funzioni, ossia
con la retta.
Per rendere precisa questa idea, dati una funzione f : (a; b) ! R e un punto
x0 2 (a; b), supponiamo che esista una funzione a ne r : R ! R che approssimi f in
x0 secondo la condizione
per ogni h tale che x0 + h 2 (a; b), cio per ogni h 2 (x0 a; b x0 ). Quando h = 0,
la condizione di approssimazione locale (18.22) diventa f (x0 ) = r (x0 ): essa richiede
quindi due propriet a una retta r : R ! R a nch si possa considerarla unadeguata
approssimazione di f in x0 . La prima che la retta coincida con f in x0 , ossia
f (x0 ) = r (x0 ): nel punto x0 in esame lapprossimazione deve essere perfetta, priva di
errore. La seconda, e pi importante, che lerrore di approssimazione f (x0 + h)
r (x0 + h) in x0 + h sia o (h), ossia che, allavvicinarsi di x0 + h a x0 , lerrore vada a
zero pi velocemente di h. Il termine o (h) permette di aermare che lapprossimazione
(localmente) molto buona: f (x0 + h) r (x0 + h) tende a zero allavvicinarsi di
x0 + h a x0 con rapidit superiore a h, cio al passo compiuto.
Si noti che f (x0 ) = r (x0 ) implica, grazie alla (15.9) del Capitolo 15,
(i) il solo fatto che esista garantisce che la funzione non presenti strappi (sia con-
tinua);
Si noti che, tra le altre cose, il risultato mostra anche lunicit del dierenziale
df (x0 ).
e quindi risulta
f (x0 ) df (x0 ) per h ! 0
e quindi f continua in x0 .
cio
2
y f (x + 2h) 2f (x + h) + f (x)
f 00 (x) = lim 2
= lim
x!0 x h!0 h2
se tale limite esiste nito. H
608 CAPITOLO 18. DERIVATE
Capitolo 19
Derivazione parziale
19.1 Generalit
Finora abbiamo considerato derivate di funzioni di una variabile reale. La derivazione
per funzioni di pi variabili un argomento fondamentale, ma pi sottile, che sar
arontato in piena generalit in corsi successivi. Possiamo per indicare una prima
nozione molto semplice di derivazione in Rn , la derivazione parziale. Cominciamo dal
caso bidimensionale. Consideriamo lorigine x = (0; 0). Vi sono, intuitivamente, due
direzioni fondamentali lungo le quali avvicinarsi allorigine: la direzione orizzontale,
cio percorrendo lasse delle ascisse, e la direzione verticale, ossia percorrendo lasse
delle ordinate.
1
y
0.8
0.6
0.4
0.2
0
O x
-0.2
-0.4
-0.6
-0.8
-1
-1 -0.5 0 0.5 1
609
610 CAPITOLO 19. DERIVAZIONE PARZIALE
y1
0.8
0.6
0.4
0.2
x0
2
-0.2
-0.4
-0.6
O x x
-0.8 1
-1
-1 -0.5 0 0.5 1
Gracamente
0.8
0.6
0.4
0.2
-0.2
-0.4
-0.6
-0.8
-1
-1 -0.5 0 0.5 1
Linsieme
x + he1 : h 2 R
formato perci dai vettori di R2 con la medesima seconda coordinata, ma con una
diversa prima coordinata.
19.1. GENERALIT 611
0.8
0.6
0.4
0.2
-0.2
-0.4
-0.6
-0.8
-1
-1 -0.5 0 0.5 1
Gracamente si tratta della retta orizzontale che passa per il punto x. Per esempio,
se x lorigine (0; 0), linsieme
x + he1 : h 2 R = f(h; 0) : h 2 Rg
Gracamente:
0.8
0.6
0.4
0.2
-0.2
-0.4
-0.6
-0.8
-1
-1 -0.5 0 0.5 1
0.8
0.6
0.4
0.2
-0.2
-0.4
-0.6
-0.8
-1
-1 -0.5 0 0.5 1
Gracamente si tratta della retta verticale che passa per il punto x. Quando x
lorigine (0; 0), linsieme fx + he2 : h 2 Rg lasse delle ordinate.
La derivata parziale @f =@x1 (x) di una funzione f : R2 ! R in un punto x 2 R2
considera leetto sulla funzione f nel punto x di variazioni innitesime lungo la retta
orizzontale fx + he1 : h 2 Rg, mentre la derivata parziale @f =@x2 (x) considera leetto
sulla funzione f di variazioni innitesime lungo la retta verticale fx + he2 : h 2 Rg. In
altre parole, si studia la funzione f in x muovendosi lungo le due direzioni fondamentali
parallele agli assi cartesiani. Precisamente, deniamo derivate parziali, che si indicano
con @f =@xi o con fx0 i , nel punto x 2 R2 i limiti1
@f f (x + he1 ) f (x)
(x) = lim (19.1)
@x1 h!0 h
@f f (x + he2 ) f (x)
(x) = lim (19.2)
@x2 h!0 h
Le denizioni (19.1) e (19.2) sono cruciali per capire il signicato della derivazione
parziale, ma sono meno utili per il loro calcolo. A tal ne, ssato x 2 R2 , introduciamo
le due funzioni scalari ausiliarie, dette proiezioni, '1 ; '2 : R ! R denite come
1
Il simbolo @ si legge d rondo. Esso prende il posto di d e sottolinea che non ci si riferisce a
funzioni di una variabile.
19.1. GENERALIT 613
In altre parole, per calcolare @f =@x1 (x) abbiamo considerato f come funzione
scalare di x1 , tenendo costante laltra variabile x2 , e ne abbiamo calcolato la derivata
ordinaria in x1 . Ci quanto, implicitamente, ha fatto la proiezione '1 .
In modo simile, calcolare @f =@x2 (x) tramite la proiezione '2 equivale a considerare
f come funzione scalare di x2 , tenendo costante laltra variabile x1 , e a calcolarne
la derivata ordinaria in x2 . Una volta compreso ci, possiamo saltare un passaggio
omettendo di menzionare esplicitamente le proiezioni. Il calcolo delle derivate parziali
diventa immediato.
614 CAPITOLO 19. DERIVAZIONE PARZIALE
@f
(x) = log x2
@x1
Del resto '1 (t) = t log x2 , e quindi nel punto t = x1 si ha '01 (x1 ) = log x2 . Passiamo a
@f =@x2 (x). Se consideriamo f come funzione scalare in x2 , la sua derivata ordinaria
x1 =x2 . Quindi,
@f x1
(x) =
@x2 x2
H
OfB. Il signicato geometrico delle due proiezione del tutto simile alle curve di
livello. Fissato il punto (x1 ; x2 ), la proiezione '1 (t) = f (t; x2 ) si ottiene tagliando
la supercie che rappresenta f con il piano verticale di equazione x2 = x2 , mentre
la proiezione '2 (t) = f (x1 ; t) si ottiene tagliando la supercie che rappresenta f con
il piano verticale (e perpendicolare al precedente) di equazione x1 = x1 . Dunque,
come con un panettone, si taglia la supercie con due piani tra loro perpendicolari: le
proiezioni non sono altro che le forme delle due fette, e, in quanto tali, funzioni scalari
(il cui graco giace sul piano con cui si seziona la supercie).
assumono nella retta reale. quindi naturale denire la derivabilit parziale per fun-
zioni di pi variabili denite su intorni di Rn , ossia su insiemi U = fy 2 Rn : kx yk < "g
per qualche x 2 Rn e " > 0.2
Siano dunque e1 = (1; 0; :::; 0), e2 = (0; 1; :::; 0), ..., en = (0; 0; :::; 1) i versori
fondamentali in Rn .
Denizione 129 Una funzione f : U ! R denita (almeno) su un intorno in Rn
ammette derivate parziali in un punto x 2 U se, per ogni i = 1; 2; ; n, i limiti
f (x + hei ) f (x)
lim (19.5)
h!0 h
esistono niti. Tali limiti sono detti derivate parziali di f in x.
Precisamente il limite (19.5) si dice derivata parziale i-esima di f in x, e si indica
con
@f (x)
fx0 i (x) oppure con
@xi
In particolare, il vettore
@f @f @f
(x) ; (x) ; :::; (x) 2 Rn
@x1 @x2 @xn
delle derivate parziali in x detto gradiente di f in x e si indica con3 rf (x) o anche
semplicemente con f 0 .
Denizione 130 Una funzione f : U ! R denita (almeno) su un intorno U in Rn
si dice derivabile in un punto x 2 U se ivi ammette tutte le derivate parziali.
Quando f derivabile in tutti i punti di un sottoinsieme B di U per brevit si
dice che f derivabile su B. Secondo la denizione una funzione derivabile in un
punto quando ivi esistono tutte le sue derivate parziali. Come il lettore vedr in corsi
successivi, si tratta una nozione debole di derivabilit ma su ciente per i nostri ni.
Anche nel caso generale di n variabili indipendenti, per calcolare le derivate parziali
in un punto x utile introdurre le proiezioni 'i denite come
'i (t) = f (x1 ; : : : ; xi 1 ; t; xi+1 ; : : : ; xn ) 8i = 1; 2; : : : ; n
Usando la funzione 'i , si ha
@f (x) ' (xi + h) 'i (xi )
= lim i = '0i (xi ) 8i = 1; 2; : : : ; n
@xi h!0 h
che generalizza a Rn le formule (19.3) e (19.4), riportando anche in questo caso il
calcolo delle derivate parziali alla derivazione ordinaria di funzioni scalari.
2
Come visto nel Capitolo 5, geometricamente in R2 gli intorni sono i cerchi (privati della
circonferenza), in R3 sono le sfere (privati della circonferenza), e Rn sono le palle (aperte).
3
Il simbolo r si legge nabla.
616 CAPITOLO 19. DERIVAZIONE PARZIALE
ossia,
jf (x + h) f (x) df (x) (h)j o (khk)
lim = lim =0
h!0 khk h!0 khk
Xn
@f
df (x) (h) = rf (x) h = (x) hi 8h 2 Rn (19.10)
i=1
@xi
@f @f
rf (x) = (x) = 2x1 ; :::; (x) = 2xn = 2x 8x 2 Rn
@x1 @xn
e
kx + hk2 kxk2 = 2x h + o (khk)
per khk ! 0. N
Pn
Esempio 354 Consideriamo la funzione f : Rn++ ! R data da f (x) = i=1 log xi , il
cui gradiente
@f 1 @f 1
rf (x) = (x) = ; :::; (x) = 8x 2 Rn++
@x1 x1 @xn xn
19.2. DIFFERENZIALE TOTALE 619
1 n
du = dx1 + + dxn
x1 xn
Linuenza di ogni variazione innitesima dxi sulla variazione complessiva di utilit
du determinato dal coe ciente i =xi . N
620 CAPITOLO 19. DERIVAZIONE PARZIALE
Per quanto evocativo, il dierenziale totale (19.10) solo una versione euristica del
dierenziale df (x), che la nozione rigorosa5 .
Esempio 356 Sia f : R ! R denita come f (x) = e2x per ogni x 2 R e sia g : R2 !
R denita come g (x) = x1 x22 per ogni x 2 R2 . Calcoliamo con la regola della catena
2
il dierenziale della funzione composta f g : R2 ! R data da (f g) (x) = e2x1 x2 . Si
ha
2 2
r (f g) (x) = 2x22 e2x1 x2 ; 4x1 x2 e2x1 x2
5
Il procedere in modo euristico essenziale in matematica nella ricerca di nuovi risultati (di
avanguardia degli sforzi euristici verso il nuovo scriveva Carlo Emilio Gadda, frase quanto mai ap-
propriata per la Matematica) e nel loro uso spedito. La verica rigorosa di ci che si ottenuto per
essenziale; solo pochissimi sommi matematici, cari agli dei, possono a darsi unicamente allintuito
senza curarsi granch del rigore.
19.4. DERIVATE PARZIALI DI ORDINE SUPERIORE 621
e quindi
2
d (f g) (x) h = 2e2x1 x2 x22 h1 + 2x1 x2 h2
per ogni h 2 R2 . Il dierenziale totale (19.13) si scrive come:
2
d (f g) = 2e2x1 x2 x22 dx1 + 2x1 x2 dx2 :
Esempio 357 Sia f : (0; +1) ! R denita come f (x) = log x e sia g : R2++ ! R
p
denita come g (x1 ; x2 ) = x1 x2 . Qui la funzione g devessere ristretta su R2++ per
soddisfare la condizione Im g (0; +1). Calcoliamo con la regola della catena il
p
dierenziale della funzione composta f g : R2++ ! R data da (f g) (x) = log x1 x2 .
Si ha r r
@g (x) 1 x2 @g (x) 1 x1
= e =
@x1 2 x1 @x2 2 x2
sicch
@g (x) 0 @g (x)
r (f g) (x) = f 0 (g (x)) ; f (g (x))
@x1 @x2
r r
1 1 x2 1 1 x1 1 1
= p ;p = ;
x1 x2 2 x1 x1 x2 2 x2 2x1 2x2
e
1 1
d (f g) (x) h = h1 + h2
2x1 2x2
per ogni h 2 R2 . Il dierenziale totale (19.13) si scrive come:
1 1
d (f g) = dx1 + dx2
2x1 2x2
N
delle derivate parziali del secondo ordine, detta matrice Hessiana di f e indicata con
r2 f (x).
Esempio 359 Sia f : R2 ! R denita come f (x) = ex1 x2 + 3x2 x3 per ogni x 2 R2 .
Calcoliamo la matrice Hessiana. Si ha:
@f @f @f
(x) = x2 ex1 x2 ; (x) = x1 ex1 x2 + 3x3 ; (x) = 3x2 ,
@x1 @x2 @x3
e quindi
@f @f @f
2
(x) = x22 ex1 x2 ; (x) = (1 + x1 x2 ) ex1 x2 ; (x) = 0;
@x1 @x1 @x2 @x1 @x3
@f @f @f
(x) = (1 + x1 x2 ) ex1 x2 ; 2
(x) = x21 ex1 x2 ; (x) = 3;
@x2 @x1 @x2 @x2 @x3
@f @f @f
(x) = 0; (x) = 3; (x) = 0:
@x3 @x1 @x3 @x2 @x23
6
Si noti che con questa notazione lordine di i e j invertito. Per tale ragione, a volte si usa la
notazione @ 2 f =@xj @xi . Daltra parte, grazie al Teorema 323 la scelta irrilevante nella maggior parte
dei casi.
19.4. DERIVATE PARZIALI DI ORDINE SUPERIORE 623
Le derivate parziali del secondo ordine possono a loro volta essere viste come fun-
zioni di pi variabili e possiamo quindi cercarne le derivate parziali, che (se esistono)
diventano le derivate parziali di ordine terzo. Daltra parte, anche le derivate parziali
di ordine terzo possono essere viste come funzioni delle singole variabili, le cui derivate
parziali (se esistono) diventano le derivate di ordine quarto, e cos via.
Per esempio, tornando allEsempio 359 consideriamo la derivata parziale
@2f
(x) = (1 + x1 x2 ) ex1 x2
@x1 @x2
@2f
3
@ f @ @x1 @x2
(x) = (x) = 2x2 + x1 x22 ex1 x2 ;
@x1 @x2 @x1 @x1
@2f
@ f 3 @ @x1 @x2
(x) = = 2x1 + x21 x2 ex1 x2 ;
@x1 @x22 @x2
Teorema 323 Sia f : U Rn ! R una funzione che abbia derivate parziali del
secondo ordine su U . Se tali derivate sono continue in x 2 U , allora
@2f @2f
(x) = (x) (19.14)
@xi @xj @xj @xi
Quando sono continue, non conta lordine nel quale si considerano le derivate
parziali: possiamo indierentemente calcolare prima la derivata parziale rispetto a
xi e poi quella rispetto a xj , o fare il contrario. Il risultato non cambia, e possiamo
perci scegliere la via che pi sembra facile da calcolare, ottenendo gratis anche
laltra derivata parziale seconda. Ci semplica notevolmente il calcolo delle derivate
ed , inoltre, unelegante propriet di simmetria della matrice Hessiana.
g (x; y) = f (x) y.
Si noti come
1
g (0) = Gr f
1
in altre parole, il graco della funzione f coincide con la curva di livello g (0) =
f(x; y) 2 A : g (x; y) = 0g della funzione g di due variabili.
@g
(x0 ; y0 ) 6= 0 (19.16)
@y
allora esistono intorni U (x0 ) e V (y0 ) e ununica funzione f : U (x0 ) ! V (y0 ) tale che
@g
(x; y)
f 0 (x) = @x (19.18)
@g
(x; y)
@y
1
per ogni (x; y) 2 g (0) \ U (x0 ) V (y0 ).
ossia a
1
g (0) \ (U (x0 ) V (y0 )) = Gr f
1
La curva di livello g (0) quindi localmente rappresentabile dal graco della funzione
implicita.
Limportanza del Teorema di Dini nel consentire, grazie alla formula (19.18), il
calcolo della derivata prima della funzione implicita senza che sia necessario conoscerne
la forma chiusa. Poich la derivata prima spesso ci che realmente interessa della
funzione f (perch, per esempio, si interessati a risolvere condizioni del primo ordine)
19.5. FUNZIONI IMPLICITE 627
Esempio 365 Nel caso semplicissimo, nel quale tutto ovvio, di funzione lineare
g (x; y) = ax + by k, lequazione g (x; y) = 0 diventa
ax + by k=0
628 CAPITOLO 19. DERIVAZIONE PARZIALE
per ogni (x; y) 2 U (x0 ) V (y0 ). Pur non conoscendo la forma di f , abbiamo de-
terminato la sua funzione derivata f 0 . Lapprossimazione locale del primo ordine
1
f = 2x + o (x)
7
per x ! 0. N
per ogni (x; y) 2 U (x0 ) V (y0 ). Lapprossimazione locale del primo ordine
e
1
f (x) = y0 + f 0 (0) x + o (x) = x + o (x)
4
per x ! 0. N
630 CAPITOLO 19. DERIVAZIONE PARZIALE
1
g (k) = fx 2 A : g (x) = kg
Per tale ragione le funzioni implicite descrivono il legame tra le variabili x e y che
convivono in tali curve e, in tal modo, consentono di formulare in modo naturale
alcune propriet fondamentali delle curve di livello. Ci spiega la loro importanza.
Per esempio, consideriamo un isoquanto g 1 (k). Si tratta di una curva di livello
della funzione di produzione g : R2+ ! R: vi sono due input, x e y, e un output. I
punti (x; y) che appartengono allisoquanto sono tutte le combinazioni produttive che
mantengono costante la quantit prodotta. La funzione implicita y = f (x) informa,
localmente, su come deve variare la quantit y al variare di x per mantenere costante
la produzione complessiva. Perci, le propriet della funzione f : U (x0 ) ! V (y0 )
caratterizzano, localmente, le relazioni tra gli input che garantiscono il livello k di
output. Di solito, si assume che f sia:
19.5. FUNZIONI IMPLICITE 631
(i) decrescente, cio f 0 (x) 0 per ogni x 2 U (x0 ): i due input sono parzialmente
sostituibili e, per mantenere inalterata la quantit prodotta al livello k, a mi-
nori quantit dellinput x devono corrispondere maggiori quantit dellinput y
(e viceversa);
(ii) convessa, cio f 00 (x0 ) 0 per ogni x 2 U (x0 ): a maggiori livelli di x, sono
necessarie quantit di y via via maggiori per compensare variazioni di x a nch
la produzione rimanga al livello k.
Il valore assoluto jf 0 j della derivata della funzione implicita si dice saggio (o tasso)
marginale di trasformazione perch, per variazioni innitesime degli input, ne descrive
il grado di sostituibilit, cio la variazione da apportare a y che bilancia marginalmente
un aumento di x. Grazie alla rappresentazione funzionale (19.21) dellisoquanto, geo-
metricamente il saggio marginale di trasformazione si pu interpretare come la pen-
denza dellisoquanto in (x; y). questa la classica interpretazione del saggio, che segue
dalla (19.21).
Dal Teorema di Dini segue la classica formula
@g
(x; y)
SM Tx;y = jf 0 (x)j = @x
@g
(19.22)
@y
(x; y)
che la forma usuale nella quale si presenta la nozione di saggio marginale di trasfor-
mazione SM Tx;y . Si noti che nella (19.22) compaiono direttamente le derivate parziali
di g, che sono uguali a quelle della sua trasformazioni gk .
Per esempio, in un punto nel quale si impiegano uguali quantit dei due input, cio x =
y, se si aumenta di ununit il primo input, il secondo deve diminuire di = (1 ) per
lasciare inalterata la quantit prodotta: in particolare, quando = 1=2, la diminuzione
del secondo devessere di ununit. In un punto nel quale si impiega una quantit del
secondo input quintupla di quella del primo, cio y = 5x, un aumento di ununit del
primo input compensata dalla diminuzione di 5 = (1 ) del secondo. N
Sia h una funzione scalare strettamente crescente e derivabile. Per la Regola della
catena si ha
@h u
@x
(x; y) h0 (u (x; y)) @u
@x
(x; y) @u
@x
(x; y)
@h u
= =
@y
(x; y) h0 (u (x; y)) @u
@y
(x; y) @u
@y
(x; y)
La derivata h0 (u (x; y)) si elide e quindi il saggio marginale di sostituzione lo stesso
per u e per tutte le trasformazioni crescenti h u. Il saggio marginale di sostituzione
una nozione ordinale, invariante per trasformazioni strettamente crescenti, che non
dipende dalla scelta di una tra le equivalenti funzioni di utilit u e h u. Ci spiega la
centralit di tale nozione nella Teoria del consumatore, dove ha sostituito la nozione
di utilit marginale, che invece, come gi osservato, non una nozione ordinale.
dove si assume la stessa funzione di utilit istantanea u nei due periodi. Fissato un
livello di utilit k, sia
1
U (k) = (c1 ; c2 ) 2 R2+ : U (c1 ; c2 ) = k
19.5. FUNZIONI IMPLICITE 633
la relativa curva di indierenza e sia (c1 ; c2 ) un suo punto. Quando le ipotesi del
Teorema di Dini sono soddisfatte in tale punto, esiste una funzione implicita f :
B (c2 ) ! B (c1 ) tale che7
@U
(c1 ; c2 )
@c2 u0 (c2 )
SM SIc1 ;c2 = f 0 (c2 ) = =
@U u0 (c1 )
(c1 ; c2 )
@c1
Quando esiste
u0 (c2 )
jf 0 (c2 )j = (19.23)
u0 (c1 )
detto saggio (o tasso) marginale di sostituzione intertemporale: misura la variazione
(negativa) da apportare a c1 che bilancia marginalmente un aumento di c2 .
19.5.3 Estensioni
Chiudiamo la sezione con un paio di estensioni del Teorema di Dini.
Approssimazione quadratica
Il Teorema di Dini aerma, inter alia, che se la funzione g dierenziabile con
continuit, anche la funzione implicita f lo . Il prossimo teorema estende tale
propriet.
7
Per evitare confusione col simbolo di utilit, qui usiamo la lettera B per gli intorni.
634 CAPITOLO 19. DERIVAZIONE PARZIALE
Teorema 325 Se nel Teorema di Dini la funzione g derivabile due volte con con-
tinuit8 , allora anche la funzione implicita f ha derivata seconda continua. In tal
caso
2 2
@g(x;y) @g(x;y)
@2x @y
2 @g(x;y)
@x@y
@g(x;y) @g(x;y)
@x @y
+ @g(x;y)
@2y
@g(x;y)
@x
f 00 (x) = 3 (19.24)
@g(x;y)
@y
Ci che s visto negli ultimi due teoremi consente di fornire approssimazioni locali
di una funzione denita implicitamente. Come sappiamo, molto raro poter scri-
vere lespressione esplicita di una funzione implicitamente denita da unequazione: la
possibilit di fornirne approssimazioni risulta perci oltremodo importante.
Se g dierenziabile con continuit su un aperto A, in un punto (x0 ; y0 ) 2 A tale
che g (x0 ; y0 ) = 0 lapprossimazione del primo ordine della funzione implicitamente
denita
@g
(x0 ; f (x0 ))
f (x) = y0 @x (x x0 ) + o (x x0 )
@g
(x0 ; f (x0 ))
@y
per x ! x0 .
Se g ha derivate parziali derivabili con continuit su un aperto A, in un punto
(x0 ; y0 ) 2 A tale che g (x0 ; y0 ) = 0 lapprossimazione del secondo ordine (spesso detta
quadratica) della funzione implicita , per x ! x0 ,
00 0 2 00 0 0 00 02
gx0 gxx gy 2gxy gx gy + gyy gx
f (x) = y0 (x x0 ) + (x x0 )2 + o (x x0 )2
gy0 03
gy
dove per brevit abbiamo omesso lindicazione della dipendenza delle varie derivate
dal punto (x0 ; f (x0 )).
316
f 00 (x0 ) = >0
1331
e quindi il punto di minimo locale. N
Il caso vettoriale
Il Teorema di Dini si adatta in modo naturale al caso dove x un vettore. Siccome ora
la funzione implicita f di pi variabili, le derivate parziali @f (x) =@xk sostituiscono
la derivata f 0 (x) del caso scalare.
@g
(x0 ; y0 ) 6= 0
@y
@g
(x; y)
@f @xk 1
(x) = 8 (x; y) 2 g (0) \ U (x0 ) V (y0 ) : (19.26)
@xk @g
(x; y)
@y
Il Teorema 326 consente di estendere a Rn lo studio dei saggi marginali visto nella
sezione precedente per n = 2. Per brevit omettiamo i dettagli e ci limitiamo qui a
illustrare il teorema con un esempio analitico.
risulta
@f 2x1 @f 2x2
(x) = e (x) = 2
@x1 3y 2 @x2 3y
In particolare
4 2
rf (6; 3) = ;
27 27
Propriet dierenziali
f (x0 + h) f (x0 )
lim
h!0 h
e dire che f derivabile nel punto interno x0 se tale limite esiste nito. Indichiamo la
derivata con f 0 (x0 ).
La derivabilit dunque una nozione locale che usa solo le propriet della funzione
in un intorno, piccolo a piacere, del punto in esame.
637
638 CAPITOLO 20. PROPRIET DIFFERENZIALI
f 0 (^
x) = 0: (20.1)
Dim. Sia x^ 2 C punto interno di massimo locale su C (un argomento simile vale se
di minimo locale). Esiste quindi B" (^
x) tale che valga la (17.11), ossia f (^
x) f (x)
per ogni x 2 B" (^x) \ C. Per ogni h > 0 su cientemente piccolo, ossia h 2 (0; "), si
ha x^ + h 2 B" (^
x). Quindi
f (^
x + h) f (^
x)
0 8h 2 (0; ") ;
h
il che implica
f (^
x + h) f (^
x)
lim+ 0: (20.2)
h!0 h
Daltra parte, per ogni h < 0 su cientemente piccolo, ossia h 2 ( "; 0), si ha x^ + h 2
B" (^x). Quindi
f (^
x + h) f (^ x)
0; 8h 2 ( "; 0) ;
h
il che implica
f (^
x + h) f (^
x)
lim 0: (20.3)
h!0 h
Insieme, le (20.2) e (20.3) implicano che
f (^
x + h) f (^
x) f (^
x + h) f (^
x) f (^
x + h) f (^
x)
0 lim = lim = lim+ 0;
h!0 h h!0 h h!0 h
e quindi, dato che per ipotesi esiste f 0 (^
x),
f (^
x + h) f (^
x)
f 0 (^
x) = lim = 0;
h!0 h
20.1. ESTREMI E PUNTI CRITICI 639
come desiderato.
OfB. La condizione (20.1) ha una semplice lettura euristica. Come vedremo tra breve,
se f 0 (x0 ) > 0 la funzione strettamente crescente in x0 , se f 0 (x0 ) > 0 la funzione
ivi strettamente decrescente. Se f massima in x0 non n strettamente crescente n
decrescente e perci la derivata, se esiste, non pu che essere nulla. H
(iii) la condizione f 0 (^
x) = 0 solo necessaria.
(i) Lipotesi che x sia punto interno di C essenziale per il Teorema 327. Infatti,
consideriamo per esempio f : R ! R data da f (x) = x, e sia C = [0; 1]. Il punto di
frontiera x = 0 di minimo globale della funzione f su [0; 1], ma f 0 (0) = 1 6= 0. Allo
stesso modo, il punto di frontiera x = 1 di massimo, ma f 0 (1) = 1 6= 0. Quindi, se x
punto di massimo o di minimo locale di frontiera, non detto che si abbia f 0 (x) = 0.
(ii) Il Teorema 327 non applicabile a funzioni che, pur avendo punti interni di
massimo o di minimo, non sono derivabili in tali punti. Un esempio classico la
funzione f : R ! R data da f (x) = jxj: x = 0 punto di minimo globale, ma f non
ivi derivabile, e perci la condizione f 0 (x) = 0 non rilevante in questo caso. Un altro
esempio in proposito il seguente.
q
Esempio 374 Sia f : R ! R data da f (x) = 3 (x2 5x + 6)2 . Dato che x2 5x+6 =
(x 2) (x 3) si annulla (soltanto) per x = 2 e per x = 3, possiamo concludere che
Passiamo ora alla versione vettoriale del Teorema di Fermat. In tal caso la con-
dizione (20.1) si generalizza nella prossima condizione (20.4), ove il gradiente prende
il posto della derivata prima.
rf (^
x) = 0: (20.4)
4x1 3 + x2 = 0
:
2x2 3 + x1 = 0
facile vedere che x = (3=7; 9=7) lunica soluzione del sistema ed quindi lunico
punto stazionario di f su R2 . N
Lunica soluzione del sistema (0; 0), che quindi lunico punto critico di f su R2 .
facile vedere che questo punto non n di massimo n di minimo. Infatti, se con-
sideriamo qualsiasi punto (0; x2 ) diverso dallorigine sullasse delle ordinate e qualsiasi
punto (x1 ; 0) diverso dallorigine sullasse delle ascisse, abbiamo
e quindi in ogni intorno del punto (0; 0) vi sono sia punti in cui la funzione stret-
tamente positiva sia punti in cui strettamente negativa. Siccome f (0; 0) = 0, ci
implica che (0; 0) non pu essere n punto di massimo n di minimo. Pertanto, al pari
del caso scalare, anche per funzioni di pi variabili vi possono essere punti stazionari
che non sono n di massimo n di minimo. N
dove linsieme C un insieme aperto di Rn (si ricordi che nella Sezione 17.1 i problemi
di ottimo si erano detti liberi quando C aperto).
Assumiamo, com usuale nelle applicazioni, che f sia derivabile su C. In tal modo,
ogni eventuale estremo locale interno (essendo C aperto) e f ivi derivabile. Grazie
642 CAPITOLO 20. PROPRIET DIFFERENZIALI
rf (x) = 0
Si ha rf (x) = (4x31 4x2 ; 4x32 4x1 ) e quindi la condizione del primo ordine
(
4x31 4x2 = 0
4x32 4x1 = 0
cio (
x31 = x2
x32 = x1
I punti stazionari sono (0; 0), (1; 1) e ( 1; 1). Tra cui si debbono ricercare le eventuali
soluzioni del problema di ottimo libero
Teorema 329 (Rolle) Sia f : [a; b] ! R continua su [a; b] e derivabile su (a; b),
con f (a) = f (b). Allora, esiste (almeno) un punto critico x^ 2 (a; b), ossia un punto
x^ 2 (a; b) tale che f 0 (^
x) = 0.
Il teorema fornisce una semplice condizione su ciente a nch una funzione abbia
un punto critico. Il risultato ha unimmediata intuizione graca:
20.2. TEOREMA DEL VALOR MEDIO 643
6
y
1
O a c b x
0
0 1 2 3 4 5
Dim. Per il Teorema di Weierstrass, esistono x1 ; x2 2 [a; b] tali che f (x1 ) = minx2[a;b] f (x)
e f (x2 ) = maxx2[a;b] f (x). Poniamo m = minx2[a;b] f (x) e M = maxx2[a;b] f (x). Se
m = M , allora f costante, ossia f (x) = m = M , e quindi f 0 (x) = 0 per ogni
x 2 (a; b). Se m < M , allora almeno uno tra x1 e x2 interno ad [a; b]. Infatti, non
possono essere entrambi di frontiera perch f (a) = f (b). Se x1 punto interno di
[a; b], ossia x1 2 (a; b), allora per il Teorema 327 si ha f 0 (x1 ) = 0, e quindi x^ = x1 .
Analogamente, se x2 2 (a; b), si ha f 0 (x2 ) = 0, e quindi x^ = x2 .
p
Esempio 380 Sia f : [ 1; 1] ! R data da f (x) = 1 x2 . La funzione continua
su [ 1; 1] e derivabile su ( 1; 1). Poich f ( 1) = f (1) = 0, per il Teorema di
Rolle esiste un punto critico x^ 2 ( 1; 1), ossia tale che f 0 (^
x) = 0. In particolare, da
0 2
f (x) = x (1 x ) segue che il punto critico in ( 1; 1) x^ = 0. N
Data f : [a; b] ! R, consideriamo i punti (a; f (a)) e (b; f (b)) del suo graco. La
retta passante per tali punti ha equazione
f (b) f (a)
y = f (a) + (x a) (20.6)
b a
come il lettore pu vericare risolvendo il sistema
(
f (a) = ma + q
f (b) = mb + q
Questa retta svolge un ruolo chiave nel Teorema del valor medio (o dellincremento
nito o di Lagrange), che ora enunciamo e dimostriamo.
Teorema 330 (del valor medio, Lagrange) Sia f : [a; b] ! R continua su [a; b] e
derivabile su (a; b). Allora, esiste x^ 2 (a; b) tale che
f (b) f (a)
f 0 (^
x) = : (20.7)
b a
644 CAPITOLO 20. PROPRIET DIFFERENZIALI
6
y
1
O a c b x
0
0 1 2 3 4 5
Il nome di Teorema dellincremento nito deriva dal fatto che lincremento nito
(cio non innitesimo) f (b) f (a) della funzione sullintero intervallo [a; b] si pu
scrivere, grazie al Teorema, come
f (b) f (a) = f 0 (^
x) (b a) ;
ossia ogni punto x^ 2 [a; b] si pu scrivere nella forma a + t^(b a) con un opportuno
t^ 2 [0; 1].
Essa la dierenza tra f e la retta passante per i punti (a; f (a)) e (b; f (b)). La
funzione g continua su [a; b] e derivabile su (a; b). Inoltre, si ha g (a) = g (b) = 0.
Per il Teorema di Rolle, esiste x^ 2 (a; b) tale che g 0 (^
x) = 0. Ma,
f (b) f (a)
g 0 (x) = f 0 (x)
b a
e quindi
f (b) f (a)
f 0 (^
x) = 0;
b a
ossia x^ soddisfa la condizione (20.7).
Vediamo una prima applicazione del Teorema del valor medio (nella prossima
sezione ne vedremo unaltra ancor pi importante), che mostra che la nullit della
derivata caratterizza le funzioni costanti.
Corollario 331 Sia f : [a; b] ! R continua su [a; b] e derivabile su (a; b). Si ha
f 0 (x) = 0 per ogni x 2 (a; b) se e solo se f costante, ossia se e solo se esiste k 2 R
tale che
f (x) = k 8x 2 [a; b] :
Dim. Mostriamo il Solo se, poich il Se la semplice propriet delle derivate vista
nellEsempio 331. Sia x 2 (a; b) e applichiamo il Teorema del valor medio sullintervallo
[a; x]. Esiste quindi x^ 2 (a; x) tale che
f (x) f (a)
0 = f 0 (^
x) = ;
x a
ossia f (x) = f (a). Poich x un punto qualsiasi in (a; b), ne segue che f (x) = f (a)
per ogni x 2 [a; b). Per la continuit in b, si ha anche f (a) = f (b).
Due funzioni con uguale derivata prima sono dunque a loro volta uguali a meno
di una costante (additiva) k: luguaglianza delle derivate caratterizza le funzioni
(derivabili) uguali a meno di costanti.
646 CAPITOLO 20. PROPRIET DIFFERENZIALI
per ogni x; y 2 (a; b) \ A con x < x0 < y. Inoltre, la funzione si dice ( localmente)
strettamente crescente se le disuguaglianze in (20.8) sono strette.
A scanso di equivoci, ricordiamo che nella Sezione 7.4.4 avevamo denito la monoto-
nia in senso globale, dicendo (nella Denizione 46) che una funzione f : A R ! R
crescente se x > y =) f (x) f (y) e strettamente crescente se x > y =) f (x) >
f (y) per ogni x; y 2 A, valendo analoghe denizioni per la decrescenza.
Ovviamente, una funzione crescente su A crescente in ogni punto di A. Tra breve
vedremo che, in generale, il converso non vale, cio la monotonia locale in ogni punto
di A non garantisce la monotonia globale su A.
f crescente in x0 =) f 0 (x0 ) 0
ma
f 0 (x0 ) > 0 =) f strettamente crescente in x0 :
La non negativit della derivata necessaria per la crescenza; la sua positivit
su ciente per la stretta crescenza. Analoga caratterizzazione vale per la (stretta)
decrescenza.
8 y
0
O x
-2
-4
-6
-8
-4 -3 -2 -1 0 1 2 3 4 5
1
Graco di x
:
648 CAPITOLO 20. PROPRIET DIFFERENZIALI
Dim. Solo se. Supponiamo che f sia crescente. Sia x 2 (a; b). Per ogni h > 0 si ha
f (x + h) f (x), e quindi
f (x + h) f (x)
0:
h
Ne segue che
f (x + h) f (x) f (x + h) f (x)
f 0 (x) = lim = lim+ 0:
h!0 h h!0 h
Se. Sia f 0 (x) 0 per ogni x 2 (a; b). Siano x1 ; x2 2 (a; b) con x1 > x2 . Per il
Teorema 330 del valor medio, esiste x^ 2 (a; b) tale che
f (x1 ) f (x2 )
f 0 (^
x) = : (20.9)
x1 x2
Poich f 0 (^
x) 0 e x1 x2 > 0, da (20.9) segue che f (x1 ) f (x2 ).
Esempio 382 Sia f : R ! R data da f (x) = 3x5 +2x3 . Poich f 0 (x) = 15x4 + 6x2
0 per ogni x 2 R, per la Proposizione 334 la funzione crescente. Daltra parte, per
la parabola denita da f (x) = x2 , si ha f 0 (x) = 2x, e quindi la Proposizione 334 (e
il suo analogo per la decrescenza) permette di concludere che f non n crescente n
decrescente su R, ma che crescente su (0; 1) e decrescente su ( 1; 0). N
Mostriamo ora che la stretta crescenza implicata dalla stretta positivit della
derivata.
20.3. MONOTONIA E DERIVABILIT 649
Proposizione 335 Sia f : (a; b) ! R derivabile su (a; b), con a; b 2 R. Se f 0 (x) > 0
per ogni x 2 (a; b), allora f strettamente crescente su (a; b).
Analogo risultato vale per la stretta decrescenza e per intervalli non aperti.
Dim. La dimostrazione simile a quella appena vista della Proposizione 334 ed una
semplice applicazione Teorema 330 del valor medio. Sia f 0 (x) > 0 per ogni x 2 (a; b)
e siano x1 ; x2 2 (a; b) con x1 > x2 . Per il Teorema 330 del valor medio, esiste c 2 (a; b)
tale che
f (x1 ) f (x2 )
f 0 (c) = : (20.10)
x1 x2
Poich f 0 (c) > 0 per ogni c e x1 x2 > 0, da (20.10) segue che f (x1 ) > f (x2 ).
Il converso del precedente risultato non vale, come mostra il prossimo esempio.
Esempio 384 Per la Proposizione 335, f (x) = x2 strettamente crescente su (0; +1)
e strettamente decrescente su ( 1; 0). Per tale proposizione, la funzione f (x) =
3x5 +2x3 strettamente crescente sia su ( 1; 0) sia su (0; 1). Tuttavia la proposizione
non pu garantire alcunch circa la stretta crescenza di f su tutto R perch f 0 (0) = 0.
Per determinare se f strettamente crescente su tutto R non resta che la verica
diretta usando la denizione di stretta crescenza. A tal ne, basta osservare che
f (y) < f (0) = 0 < f (x) per ogni y < 0 < x e ci prova che eettivamente f
strettamente crescente su tutto R. N
OfB. Sera detto che f (x) (h) = f (x + h) f (x) = df (x) (h)+o (h). Consideriamo
ora i soli valori h > 0, cio immaginiamo di percorrere nel verso naturale lintervallo
(a; b) sul quale denita f . Se (e solo se) f 0 (x) > 0 per ogni x 2 (a; b) risulta
df (x) (h) = f 0 (x) h > 0 e quindi f (x) (h) > 0 perch lultimo addendo o (h) non
pu cambiare il segno del secondo membro.
Il segno della derivata (su (a; b)) si trascina dietro il segno del dierenziale che, a
sua volta, determina il segno dellincremento: dunque, se f 0 (x) > 0 per ogni x 2 (a; b),
650 CAPITOLO 20. PROPRIET DIFFERENZIALI
allora f (x) (h) = f (x + h) f (x) > 0 per ogni h > 0. Si pensi, per esempio, che f
sia un protto. Se f 0 > 0 (informazione di per s poco rilevante da un punto di vista
economico), allora f > 0 che uninformazione economicamente molto rilevante
perch mostra che, allaumentare di x, il protto cresce. H
OfB. Sera detto che lapprossimazione lineare del dierenziale fa capire se una fun-
zione va in su o in gi. ci che abbiamo visto ora. In un punto di massimo o di
minimo, la funzione non va n su n gi: perci necessariamente la derivata non n
positiva n negativa: se esiste, pu essere solo zero. H
Esempio 385 Sia A il primo quadrate (assi esclusi) di R2 dal quale sia stato soppresso
il quadrato [1; 2] (0; 1] (si veda la gura).
La funzione f : A ! R denita da
( 1
x + x2
25 1
se (x1 ; x2 ) 2 A (2; 1) (0; 1)
f (x1 ; x2 ) = 1
x + x2 (1 x2 )2
25 1
se (x1 ; x2 ) 2 (2; 1) (0; 1)
20.4. UNA CONDIZIONE SUFFICIENTE PER ESTREMI LOCALI 651
ha gradiente
( 1
25
;1 se (x1 ; x2 ) 2 A (2; 1) (0; 1)
rf (x1 ; x2 ) = 1
25
;1 + 2 (1 x2 ) se (x1 ; x2 ) 2 (2; 1) (0; 1)
1
f (0; 5; 0; 5) = 0; 5 + 0; 5 = 0; 52;
25
ma
1
f (2; 5; 0; 55) = 2; 5 + 0; 55 (1 0; 55)2 = 0; 4475:
25
Il trucco dellesempio che precede sta nella circostanza che, pur essendo A tutto
dun pezzo (connesso), le proiezioni '1 (x1 ), quando x2 2 (0; 1), hanno un dominio
che non lo , essendo formato da due intervalli disgiunti: in tal caso, come abbiamo
visto (si ricordi f (x) = 1=x), la positivit della derivata non garantisce la crescenza
globale.
6
y
O x x
0
1
0
-1 0 1 2 3 4 5
OfB. La precedente Proposizione non esclude che si abbia f 0 (x) = 0 = f 0 (y), cio che
f 0 (x) = 0, 8x 2 U \ C: in tal caso f costante e quindi simultaneamente massima
e minima su U \ C. H
Dim. Senza perdita di generalit, assumiamo che U = (x0 "; x0 + ") C. Sia
x 2 (x0 "; x0 ). Per il Teorema 330 esiste 2 (x0 "; x0 ) tale che
f (x0 ) f (x)
= f 0 ( ):
x0 x
Per la (20.11) si ha che f 0 ( ) 0, da cui si deduce che f (x0 ) f (x). In modo analogo
si dimostra che f (x0 ) f (y) per ogni y 2 (x0 ; x0 + "). In conclusione, f (x0 ) f (x)
per ogni x 2 U e dunque x0 punto di massimo locale.
Dim. Lo sviluppo di Taylor (21.5) che vedremo tra breve consente una facile di-
mostrazione che lasciamo al lettore. Se assumiamo che f sia due volte derivabile con
continuit5 , possiamo dare qui una dimostrazione diretta senza luso di Taylor. Gra-
zie alla continuit di f 00 in x0 , si ha limx!x0 f 00 (x) = f 00 (x0 ) < 0. Il Teorema della
permanenza del segno implica lesistenza di un intorno U = U" (x0 ) tale che f 00 (x) < 0
per ogni x 2 U . Quindi, per la Proposizione 335 la derivata prima f 0 strettamente
decrescente in U , ossia
Grazie alla Proposizione 337, possiamo concludere che x0 di massimo locale stretto.
Tornando allEsempio 386, grazie al Corollario 338, basta osservare che f 00 (0) =
2 < 0 per concludere che x0 = 0 punto di massimo locale forte. Si noti che,
invece, il Corollario 338 non si pu applicare allEsempio 386 perch f (x) = jxj non
derivabile in x0 = 0.
Il Corollario 338 consente di aermare che, per un punto stazionario, ossia tale che
f 0 (x0 ) = 0:
5
Ossia, f 0 e f 00 sono continue su U .
654 CAPITOLO 20. PROPRIET DIFFERENZIALI
Analogo commento vale negli altri casi: per esempio, se f 0 (x0 ) = 0 e f 00 (x0 ) 0,
la derivata in x0 nulla e non strettamente crescente (perch la sua derivata f 00 non
positiva): non si pu escludere che x0 sia di massimo.
Teorema 340 (de lHospital) Siano f; g : (a; b) ! R derivabili su (a; b), con g 0 (x) 6=
0 per ogni x 2 (a; b), e sia x0 2 [a; b], con
f 0 (x)
lim = L 2 R: (20.12)
x!x0 g 0 (x)
f (x)
lim = L:
x!x0 g (x)
f 0 (x) f (x)
lim = L =) lim = L;
x!x0 g 0 (x) x!x0 g (x)
ossia che il calcolo del limite limx!x0 f (x) =g (x) pu ricondursi al calcolo del limite
del rapporto tra le derivate: limx!x0 f 0 (x) =g 0 (x). Tanto pi semplice il secondo
rispetto alloriginario, tanto maggiore lutilit della regola. Essa si applica anche ai
limiti unilaterali, sebbene per brevit omettiamo tale parte nellenunciato.
f 0 (x) f (x)
lim 0
= L 2 R =) lim = L: (20.13)
x!x0 g (x) g (x)
6
In realt il risultato dovuto a Jean Bernoulli.
7
Ossia f; g 2 C 1 (a; b).
658 CAPITOLO 20. PROPRIET DIFFERENZIALI
f (x0 + h) f (x0 )
f (x0 + h) f (x0 + h) f (x0 ) h
= =
g (x0 + h) g (x0 + h) g (x0 ) g (x0 + h) g (x0 )
h
e quindi, poich per ipotesi limx!x0 f 0 (x) =g 0 (x) esiste (nito o innito), si ha
f (x0 + h) f (x0 )
f 0 (x) f 0 (x0 ) limh!0
lim = 0 = h =
x!x0 g 0 (x) g (x0 ) g (x0 + h) g (x0 )
limh!0
h
f (x0 + h) f (x0 )
h f (x0 + h) f (x)
= lim = lim = lim
h!0 g (x0 + h) g (x0 ) h!0 g (x0 + h) x!x0 g (x)
h
che prova la (20.13).
Il prossimo esempio mostra che per la risoluzione di alcuni limiti occorre applicare
pi volte la regola di de lHospital.
f 0 (x) ex 1 ex f (x) ex 1 ex
lim = lim = lim =) lim = lim = lim ; (20.14)
x!x0 g 0 (x) x!+1 2x 2 x!0 x x!x0 g (x) x!+1 x2 2 x!0 x
ottenendo un limite pi semplice, ma ancora irrisolto. Applichiamo di nuovo la regola
di de lHospital alle funzioni derivate f 0 ; g 0 : R ! R date da f 0 (x) = ex e g 0 (x) = x.
Ancora in ogni intervallo (a; +1), con a > 0, sono soddisfatte le ipotesi della regola
di de lHospital, e quindi
f 00 (x) ex f 0 (x) ex
lim = lim = +1 =) lim = lim = +1:
x!x0 g 00 (x) x!+1 1 x!x0 g 0 (x) x!+1 x
f (x) ex
lim = lim 2 = +1:
x!x0 g (x) x!+1 x
Per risolvere questo limite abbiamo dovuto applicare due volte la regola di de lHos-
pital. N
Esempio 396 In modo simile si pu calcolare il limite del rapporto tra f (x) = 1
cos x e g (x) = x2 per x ! 0:
2
Esempio 397 Siano f; g : R ! R date da f (x) = ex e g (x) = ex . Posto x0 = +1, il
limite limx!x0 f (x) =g (x) nella forma di indeterminazione 1=1. In ogni intervallo
(a; +1), con a > 0, sono soddisfatte le ipotesi della regola di de lHospital. Si ha
2 2 2 2
f 0 (x) 2xex xex f (x) ex xex
lim 0 = lim = 2 lim =) lim = lim = 2 lim
x!x0 g (x) x!+1 ex x!+1 ex x!x0 g (x) x!+1 ex x!+1 ex
f 0 (x) cos x
lim 0
= lim
x!x0 g (x) x!+1 1
non esiste. Se avessimo cercato di calcolare il semplice limite limx!x0 f (x) =g (x) = 0
attraverso la regola di de lHospital avremmo usato uno strumento sia inutile, data la
semplicit del limite, sia ine cace. Un uso meccanico della regola pu quindi essere
molto fuorviante. N
f (x)
lim f (x) g (x) = lim 1
x!x0 x!x0
g(x)
20.5. TEOREMA E REGOLA DI DE LHOSPITAL 661
con limx!x0 1=g (x) = 0 e si pu applicare la regola de lHospital alle funzioni f e 1=g.
Se f diversa da zero in un intorno di x0 , si pu anche scrivere
g (x)
lim f (x) g (x) = lim 1
x!x0 x!x0
f (x)
con limx!x0 1=f (x) = 1. In questo caso, la regola de lHospital si pu applicare alle
funzioni g e 1=f . Quale delle due possibili applicazioni della regola sia pi comoda
devessere valutato caso per caso.
log x
lim (x log x) = lim x 1 = +1
x!+1 x!+1 x
f 0 (^
x) f (b) f (a)
0
= : (20.17)
g (^ x) g (b) g (a)
f (b) f (a)
h (x) = f (x) f (a) (g (x) g (a))
g (b) g (a)
e si procede come nella dimostrazione del Teorema del valor medio.
f 0 (x)
x0 < x < x0 + =) < L + ": (20.18)
g 0 (x)
f 0 (^
x) f (y) f (x)
0
=
g (^ x) g (y) g (x)
e, per la (20.18), si ha
f (y) f (x)
< L + ": (20.19)
g (y) g (x)
Consideriamo due casi.
20.5. TEOREMA E REGOLA DI DE LHOSPITAL 663
limx!x0 f (x) =g (x) = L. Anche in questo caso si ha quindi limx!x0 f (x) =g (x) = L.
Si badi che il Teorema di de lHospital aerma che, se esiste il lim f 0 =g 0 , allora esiste
anche il lim f =g e che i due limiti sono uguali. Non vale il converso: pu benissimo
accadere che esista lim f =g senza che esita lim f 0 =g 0 . Gi ne abbiamo visto un esempio,
ma ne mostriamo altri due un popi complicati.
non esiste perch sia il numeratore sia il denominatore oscillano tra 0 e 2 e quindi il
rapporto oscilla tra 0 e +1. N
1
Esempio 402 Dette f (x) = x2 sin e g (x) = log (1 + x), risulta
x
f (x) x2 sin x1 x sin x1 0
lim = lim = lim = = 0;
x!0 g (x) x!0 log (1 + x) x!0 log (1 + x) 1
x
ma
f 0 (x) 2x sin x1 cos x1
lim = lim
x!0 g 0 (x) x!0 1
1+x
non esiste perch il denominatore tende a 1 e al numeratore il primo addendo tende a
0 e il secondo non ammette limite. N
Capitolo 21
Approssimazione
665
666 CAPITOLO 21. APPROSSIMAZIONE
Dim. Supponiamo che, per ogni h 2 (x0 a; b x0 ), vi siano due diversi sviluppi
2 n n 2 n n
0+ 1h + 2h + + n h + o (h ) = 0+ 1h + 2h + + n h + o (h ) : (21.2)
Risulta allora
2 n
0 = lim 0 + 1h + 2h + + nh + o (hn )
h!0
2 n
= lim 0 + 1h + 2h + + nh + o (hn ) = 0
h!0
e la (21.2) diventa
2 n
1h + 2h + + nh + o (hn ) = 1h + 2h
2
+ + nh
n
+ o (hn ) ; (21.3)
21.1. APPROSSIMAZIONE POLINOMIALE DI TAYLOR 667
Quindi,
n 1
1 = lim 1 + 2h + + nh + o hn 1
h!0
n 1
= lim 1 + 2h + + nh + o hn 1
= 1
h!0
e la (21.3) diventa
2 n
2h + + nh + o (hn ) = 2h
2
+ + nh
n
+ o (hn ) :
Iterando quanto fatto sopra, si mostra che 2 = 2 , e cos via no a mostrare che n =
n . Ci prova che vi al pi un polinomio p (h) che possa soddisfare lapprossimazione
(21.1).
1 1 X f (k) (x0 )
n
Tn (h) = f (x0 ) + f (x0 ) h + f 00 (x0 ) h2 +
0
+ f (n) (x0 ) hn = hk
2 n! k=0
k!
Per comodit di notazione si posto f (0) = f . Tale polinomio ha come coe cienti
le derivate di f nel punto x0 sino allordine n. In particolare, se x0 = 0 il polinomio
di Taylor talvolta chiamato polinomio di MacLaurin.
Il prossimo risultato, fondamentale e di grande eleganza, mostra che se f oppor-
tunamente derivabile in x0 , lunico sviluppo polinomiale dato proprio dal polinomio
di Taylor.
ossia f dierenziabile in x0 .
Dim. Alla luce del Lemma 342, su ciente mostrare che il polinomio di Taylor
soddisfa la (21.1). Cominciamo con losservare preliminarmente che, poich f deriv-
abile n 1 volte su (a; b), si ha f (k) : (a; b) ! R per ogni 1 k n 1. In-
(k)
oltre, grazie alla Proposizione 320, f continua in x0 per 1 k n 1. Siano
' : (x0 a; b x0 ) ! R e : R ! R le funzioni ausiliarie date da
X
n
f (k) (x0 )
' (h) = f (x0 + h) hk e (h) = hn :
k=0
k!
2
Da os, bocca, cio la parabola baciante.
21.1. APPROSSIMAZIONE POLINOMIALE DI TAYLOR 669
'(n 1)
(h) '(n 2)
(h) '(0) (h)
lim (n 1) (h)
= L =) lim (n 2) (h)
= L =) =) lim (0) =L (21.10)
h!0 h!0 h!0 (h)
(n 1)
con L 2 R. Semplici calcoli mostrano che (h) = n!h e '(n) (h) = f (x0 + h)
f (x0 ). Quindi,
'(n 1)
(h) 1 '(n 1) (h) 1
lim (n 1) (h)
= lim = '(n) (0) = 0;
h!0 n! h!0 h n!
e, grazie alla (21.10), possiamo concludere che vale la (21.7), come desiderato.
X
n
f (k) (x0 )
f (x) = (x x0 )k + o ((x x0 )n ) ; (21.11)
k=0
k!
X
n
f (k) (0)
f (x) = xk 8x 2 R
k=0
k!
f (k) (0)
k = 81 k n:
k!
670 CAPITOLO 21. APPROSSIMAZIONE
f 00 (0)
0 = f (0) = 0 ; 1 = f 0 (0) = 0 ; 2 = =0 ;
2!
f 000 (0) 18 f (iv) (0) 24
3 = = = 3 ; 4 = = = 1:
3! 6 4! 24
N
Esempio 404 Sia f : R++ ! R data da f (x) = log (1 + x). Essa derivabile n volte
in ogni punto del proprio dominio, con
(n 1)!
f (n) (x) = ( 1)n+1 8n 1
(1 + x)n
h h2
log (1 + x0 + h) = log (1 + x0 ) +
1 + x0 2 (1 + x0 )2
h3 n+1 hn n
+ 3 + + ( 1) n + o (h )
3 (1 + x0 ) n (1 + x 0 )
Xn
h k
= log (1 + x0 ) + ( 1)k+1 k
+ o (hn )
k=0
k (1 + x0 )
X
n
k+1 (x x0 )k
log (1 + x) = log (1 + x0 ) + ( 1) k
+ o ((x x0 )n )
k=1
k (1 + x0 )
Si noti come un semplice polinomio approssimi (e bene quanto si vuole perch o ((x x0 )n )
pu essere reso arbitrariamente piccolo) la funzione logaritmica. In particolare, lo
sviluppo di MacLaurin di ordine n di f
x2 x3 n+1 xn X n
xk
log (1 + x) = x + + +( 1) +o (xn ) = ( 1)k+1 +o (xn ) (21.12)
2 3 n k=1
k
x2 x3 xn X xk
n
x
e = 1+x+ + + + + o (xn ) = + o (xn )
2 3! n! k=0
k!
1 3 1 5 ( 1)n 2n+1
sin x = x x + x + + x + o x2n+1
3! 5! (2n + 1)!
Xn
( 1)k 2k+1
= x + o x2n+1
k=0
(2k + 1)!
1 2 1 4 ( 1)n 2n X ( 1)k n
cos x = 1 x + x + + x + o x2n = x2k + o x2n :
2 4! (2n)! k=0
(2k)!
Anche qui importante osservare come tali funzioni si possano (ben) approssimare
con semplici polinomi. N
3x2 3x4 + 6x
f 0 (x) = 6 cos x sin x ; f 00 (x) = 6(cos2 x sin2 x)
1 + x3 (1 + x3 )2
e quindi
1
f (x) = f (0) + f 0 (0) x + f 00 (0) x2 + o x2 = 3x2 + o x2 : (21.13)
2
N
OfB. Con n ssato, lapprossimazione fornita dal polinomio di Taylor buona soltanto
in un intorno (che pu essere piccolissimo) del punto x0 . Daltra parte, aumentando n
lapprossimazione migliora. Se ne conclude che, ssato n, lapprossimazione buona
(migliore di una pressata soglia di errore) soltanto in un intorno di x0 , mentre, ssato
un intervallo, esiste un valore di n che fa s che lapprossimazione in tale intervallo
672 CAPITOLO 21. APPROSSIMAZIONE
sia buona (migliore di una pressata soglia di errore): ovviamente purch la funzione
ammetta derivate no a tale ordine.
Se si ssano simultaneamente il grado n e un intervallo, in generale dunque lap-
prossimazione non controllabile: pu essere pessima. H
OfB. Si dimostra che, qualora f : (a; b) ! R sia derivabile n + 1 volte in (a; b), si pu
anche scrivere, per x0 ; x0 2 (a; b),
X n
f (k) (x0 ) k
f (x0 + h) = h + f (n+1) (x0 + #h) ;
k=0
k!
con 0 # 1. In altre parole, laddendo o (hn ) si pu sempre prendere pari alla
derivata (n + 1)-esima calcolata in un punto intermedio tra x0 e x0 + h. Lespressione
indicata permette di controllare lerrore di approssimazione: se f (n+1) (x) k per
ogni x 2 [x0 ; x0 + h] si pu concludere che lerrore di approssimazione non supera k e
quindi che
Xn
f (k) (x0 ) k Xn
f (k) (x0 ) k
h k f (x0 + h) h + k:
k=0
k! k=0
k!
H
Gli sviluppi di Taylor si rivelano molto utili anche nel calcolo dei limiti. Infatti,
sviluppando in modo appropriato f in x0 , ci si riduce ad un semplice limite di polinomi.
Illustriamo con un paio di esempi luso degli sviluppi di Taylor per il calcolo dei
limiti.
Esempio 408 Consideriamo il limite
log (1 + x3 ) 3 sin2 x
lim :
x!0 log (1 + x)
Siccome il limite per x ! 0, possiamo usare lo sviluppo di MacLaurin del secondo
ordine (21.13) e (21.12) per approssimare il numeratore e il denominatore. Grazie al
Lemma 173 e usando lalgebra degli o piccoli, si ha
log (1 + x3 ) 3 sin2 x 3x2 + o (x2 ) 3x2
lim = lim = lim = 0:
x!0 log (1 + x) x!0 x + o (x) x!0 x
Il calcolo del limite stato quindi notevolmente semplicato grazie alluso combinato
di sviluppi di MacLaurin e del confronto di innitesimi visto nel Lemma 173. N
Esempio 409 Consideriamo il limite
x sin x
lim :
x!0 log2 (1 + x)
N
21.2. PROPOSIZIONE OMNIBUS PER ESTREMI LOCALI 673
Dim. Dimostriamo il punto (i). Sia n pari e sia f (n) (x0 ) < 0. Grazie al Teorema 343,
dallipotesi f (k) (x0 ) = 0 per ogni 1 k n 1 e f (n) (x0 ) 6= 0 segue che
f (n) (x0 ) n f (n) (x0 ) n o (hn )
f (x0 + h) f (x0 ) = h + o (hn ) = h 1+ :
n! n! hn
Poich limh!0 o (hn ) =hn = 0, esiste > 0 tale che jhj < implica jo (hn ) =hn j < 1.
Quindi
o (hn )
h2( ; ) =) 1 + > 0:
hn
Siccome f (n) (x0 ) < 0, si ha dunque, essendo hn > 0 perch n pari,
f (n) (x0 ) n o (hn )
h2( ; ) =) h 1+ < 0 =) f (x0 + h) f (x0 ) < 0;
n! hn
3
Si osservi che, grazie a quanto dimostrato circa lapprossimazione di Taylor, il caso n = 2 presenta
in realt un interessante miglioramento rispetto al Corollario 338: si richiede che la funzione f sia
due volte derivabile su U , ma non necessariamente con continuit.
674 CAPITOLO 21. APPROSSIMAZIONE
ossia, ponendo x = x0 + h,
Siccome n = 4 pari, per il punto (i) della Proposizione 344, possiamo concludere che
x0 = 0 punto di massimo locale (in realt, di massimo globale, ma la Proposizione
344 non in grado di dirlo). N
1
lim g (0 + h) = lim h2 sin = 0:
h!0 h!0 h
La prima non derivabile in x = 0; la seconda lo . Infatti
f (0 + h) f (0) h sin h1 0 1
lim = lim = lim sin non esiste;
h!0 h h!0 h h!0 h
e
g (0 + h) g (0) h2 sin h1 0 1
lim = lim = lim h sin = 0:
h!0 h h!0 h h!0 h
Nessuna delle due funzioni massima o minima per x = 0 perch esse compiono innite
oscillazioni in qualunque intorno dello zero.
Per g il punto x = 0 stazionario ma in esso la funzione non ammette derivata
seconda. Infatti risulta
8
< 2x sin 1 cos 1 se x 6= 0
0 x x
g (x) =
:
0 se x = 0
e perci
non esiste. H
La condizione f 0 (x) = 0 detta condizione del primo ordine 4 , mentre f 00 (x) < 0
o f 00 (x) > 0 detta condizione del secondo ordine.
la classica procedura per trovare estremi locali basata sulle condizioni di primo
e secondo ordine. La versione appena presentata migliora quanto visto nella Sezione
20.4.1 perch, riprendendo quanto osservato in una nota precedente, essa richiede solo
che la funzione sia due volte derivabile su int C, non necessariamente con continuit.
Rimangono tuttavia le altre limitazioni osservate nella Sezione 20.4.1.
sicch
S = S (2) = S (3) = f0g e S (4) = ;;
La fase 1 individua linsieme S = f0g, su cui la fase 2 non ha per nulla da dire poich
f 00 (0) = 0. Anche la fase 3 non ha alcun esito perch f 000 (0) = 0. La fase 4 invece
risolutiva: poich f (iv) (0) < 0, possiamo concludere che x = 0 di massimo locale
forte (in realt, di massimo globale, ma la procedura non in grado di dirlo). N
In particolare, \
C (1) = C (k)
k
il sottoinsieme di int C ove f derivabile innite volte. I casi studiati nelle Sezioni
21.3.1 e 21.3.2 corrispondono, rispettivamente, a int C = C (2) e int C = C (1) .
Esempio 415 (i) La funzione f (x) = x4 derivabile innite volte su R. Per qualsiasi
sottoinsieme C in R si ha quindi C (1) = C. (ii) Per la funzione
(
x2 se x 0
f (x) = (21.14)
x2 se x > 0
si ha f 0 (x) = 2 jxj ed quindi derivabile una sola volta in 0 e innite volte negli
altri punti di R. Quindi, per qualsiasi sottoinsieme C in R si ha C = C (1) , nonch
C (1) = C f0g se 0 2 C. N
Per n = 1, si tratta dellinsieme dei punti stazionari che, per semplicit di notazione,
continuiamo a indicare con S in luogo di S (1) . Si noti che
S (n) S
3. Si calcola f 000 nellinsieme S (2) \ C (3) : se f 000 (x) 6= 0, il punto x non un estremo
locale, appartiene a S (3) se f 000 (x) = 0. Se S (3) \ C (4) = ; la procedura termina;
altrimenti si passa alla fase successiva.
La procedura termina quando S (n) \C (n+1) = ;, ossia quando nei punti S (n) rimasti
da considerare alla fase successiva la funzione non n + 1 volte derivabile. Linsieme
terminale S (n) detto residuo. Se la funzione derivabile innite volte su int C, la
procedura termina se e solo se S (n) = ;, come osservato sopra. In particolare, lasciamo
vericare al lettore che nei casi int C = C (2) e int C = C (1) la procedura si riduce a
quelle viste, rispettivamente, nelle Sezioni 21.3.1 e 21.3.2.
21.3.4 Commenti
La procedura illustrata potente. La sua benzina data dal numero di volte che
f derivabile nei punti interni di C perch ci determina il numero di fasi di cui la
procedura pu avvalersi, prima di doversi eventualmente arrestare per mancanza di
derivabilit, cio perch C (n) = ;. Da questo punto di vista, le funzioni ideali per
lapplicazione della procedura sono le innitamente derivabili (per esempio, le funzioni
elementari) ed per tal motivo che prima abbiamo considerato proprio loro.
Per quanto potente, anchessa condivide tuttavia alcuni dei limiti della sua versione
pi debole indicata nella Sezione 20.4.1. Per prima cosa, come appena osservato, la
sua benzina la derivabilit di ordine superiore, propriet della quale molte funzioni
non godono.
21.4. FORMULA DI TAYLOR: CASO VETTORIALE 679
f (x) = x2 ;
f (x1 ; x2 ) = x21 + x22 4x1 x2 ;
f (x1 ; x2 ; x3 ) = x1 x3 + 5x2 x3 + x23 ;
f (x1 ; x2 ; x3 ; x4 ) = x1 x4 2x21 + 3x2 x3 :
sono tali che f (x) = x Ax, bench non siano simmetriche. Quel che si perde senza
simmetria la corrispondenza biunivoca tra forme quadratiche e matrici. Infatti,
mentre data la forma qudratica f (x1 ; x2 ; x3 ) = 3x1 x3 x2 x3 esiste ununica matrice
simmetrica per cui la (21.15) vale, ci non pi vero se non si richiede la simmetria
della matrice, come mostrano le due matrici in (21.16), per entrambe le quali vale la
(21.15). N
Esempio 417 Riguardo la forma quadratica f (x1 ; x2 ) = x21 + x22 4x1 x2 , si ha:
1 2
A= :
2 1
21.4. FORMULA DI TAYLOR: CASO VETTORIALE 681
1 2 x1
x Ax = (x1 ; x2 ) = (x1 ; x2 ) (x1 2x2 ; 2x1 + x2 )
2 1 x2
= x21 2x1 x2 2x1 x2 + x22 = x21 + x22 4x1 x2
N
P
Esempio 418 Sia f : Rn ! R denita come f (x) = kxk2 = ni=1 x2i per ogni x 2 Rn .
La matrice simmetrica associata a questa forma quadratica la matrice identit I.
Infatti,
X
n
x Ix = x x = x2i :
i=1
Pn 2
Pi in generale, sia f (x) = i=1 con i 2 R per ogni i = 1; :::; n. Efacile vedere
i xi
che la matrice associata a f la matrice diagonale
2 3
1 0 0 0
6 0 0 0 7
6 2 7
6 0 0 0 7:
6 3 7
4 0 0 0 0 5
0 0 0 n
Esempio 419 Sia f (x1 ; x2 ; x3 ) = x21 + 2x22 + x23 + (x1 + x3 ) x2 . La matrice associata
a f : 2 3
1 12 0
A = 4 21 2 12 5 :
0 21 1
Infatti,
2 1
332
1 2
0
x1
x Ax = (x1 ; x2 ; x3 ) 4 12 2 12 5 4 x2 5
0 12 1 x3
1 1 1 1
= (x1 ; x2 ; x3 ) x1 + x2 ; x1 + 2x2 + x3 ; x2 + x3
2 2 2 2
2 2 2
= x1 + 2x2 + x3 + (x1 + x3 ) x2 :
det A1 = 1;
1 7
1 2
det A2 = det 1 = > 0;
2 2 4
3
det A3 = det A = > 0:
2
Grazie al criterio di Sylvester-Jacobi possiamo quindi concludere che la forma quadrat-
ica denita positiva. N
per ogni x 2 Rn .
Possiamo ora presentare la formula di Taylor per funzioni a pi variabili; come
nel caso scalare, anche nel nostro caso pi generale la formula di Taylor ra na lap-
prossimazione (21.18). Nellenunciarla ci limitiamo ad unapprossimazione arrestata
al secondo ordine che basta ai nostri ni, rimandando a corsi successivi lo studio di
approssimazioni di ordine superiore.
Lespressione
1
f (x0 ) + rf (x0 ) (x x0 ) + (x x0 ) r2 f (x0 ) (x x0 )
2
detta polinomio di Taylor di secondo grado in x0 . Il termine di secondo grado una
forma quadratica, la cui matrice associata, lHessiana r2 f (x), simmetrica grazie al
Teorema 323. Naturalmente, se arrestata al primo ordine la formula di Taylor si riduce
alla (21.18). Inoltre, si osservi che nel caso scalare il polinomio di Taylor assume la
ben nota forma:
1
f (x0 ) + f 0 (x0 ) (x x0 ) + f 00 (x0 ) (x x0 )2
2
Infatti, in tale caso si ha r2 f (x0 ) = f 00 (x0 ) e quindi
Al pari del caso scalare, anche qui abbiamo un trade-o tra semplicit dellap-
prossimazione e sua accuratezza. Infatti, lapprossimazione arrestata al primo ordine
(21.18) ha il pregio della semplicit rispetto a quella arrestata al secondo ordine: si
approssima con una funzione lineare invece che con un polinomio di secondo grado, a
scapito per del grado di accuratezza dellapprossimazione, dato da o (kx x0 k) invece
del migliore o kx x0 k2 .
La scelta dellordine cui arrestare la formula di Taylor dipende quindi dal partico-
lare uso al quale siamo interessati, a seconda di quale aspetto dellapprossimazione sia
in esso pi importante, se la semplicit oppure laccuratezza.
2
Esempio 420 Sia f : R2 ! R denita come f (x1 ; x2 ) = 3x21 ex2 . Si ha:
2 2
rf (x) = 6x1 ex2 ; 6x21 x2 ex2
e 2 2
2 6ex2 12x1 x2 ex2
r f (x) = 2 2
12x1 x2 ex2 6x21 ex2 (1 + 2x22 )
Per il Teorema 347, la formula di Taylor in x0 = (1; 1)
1
f (x) = f (x0 ) + (x x0 ) r2 f (x0 ) (x x0 ) + o kx x 0 k2 : (21.20)
2
Lavorando su questa semplice osservazione si ottengono le condizioni del secondo
ordine, che si basano sul segno della forma quadratica x r2 f (x0 ) x.
Nel caso scalare ritroviamo le usuali condizioni del secondo ordine, basate sul segno
della derivata seconda f 00 (^
x). Infatti, avevamo gi osservato nella (21.19) che nel caso
scalare vale
x r2 f (^x) x = f 00 (^
x) x2
sicch in questo caso il segno della forma quadratica dipende solo dal segno di f 00 (^ x);
00
ossia, essa denita negativa (positiva) se e solo se f (^ x) < 0 (> 0) ed semidenita
negativa (positiva) se e solo se f 00 (^
x) 0 ( 0).
Naturalmente, come nel caso scalare, anche nel nostro ambito pi generale la con-
dizione (i) solo necessaria a nch x^ sia un massimo locale. Infatti, consideriamo la
funzione scalare f (x) = x3 . Si ha r2 f (x) = f 00 (x) e quindi in x^ = 0 si ha r2 f (^
x) = 0.
2
La corrispondente forma quadratica x r f (^ x) x identicamente nulla ed quindi sia
semidenita negativa che positiva. Cionondimeno, x^ = 0 non n punto di massimo
n di minimo locale.
Similmente, la condizione (ii) solo su ciente a nch x^ sia un punto di massimo
locale. Si consideri la funzione scalare f (x) = x4 . Il punto x^ = 0 chiaramente un
punto di massimo (addirittura assoluto) per la funzione f . Ma, r2 f (^ x) = 0 e quindi
la corrispondente forma quadratica x r2 f (^ x) x non denita negativa.
condizione su ciente a nch x^ sia punto di massimo (minimo) forte che tale
matrice sia denita negativa (positiva).
questa unosservazione importante dal punto di vista pratico perch esistono dei
criteri, quale quello di Sylvester-Jacobi, per determinare se una matrice simmetrica
positiva/negativa denita o semidenita.
Esempio 422 Sia f : R3 ! R denita come f (x1 ; x2 ; x3 ) = x31 +x32 +3x23 2x3 +x21 x22 .
Si ha:
rf (x) = 3x21 + 2x1 x22 ; 3x22 + 2x21 x2 ; 6x3 2
e quindi 2 3
6x1 + 2x22 4x1 x2 0
r2 f (x) = 4 4x1 x2 6x2 + 2x21 0 5
0 0 6
I punti stazionari sono x = ( 3=2; 3=2; 1=3) e x = (0; 0; 1=3). In x = ( 3=2; 3=2; 1=3)
si ha 2 9 3
2
9 0
r2 f (x) = 4 9 9
2
0 5
0 0 6
e quindi
9 9
9
det < 0; det 2
9 < 0; det r2 f (x) < 0
2 9 2
Per il criterio di Sylvester-Jacobi la matrice Hessiana indenita. Grazie al Teorema
348, il punto x = ( 3=2; 3=2; 1=3) non n un minimo n un massimo locale. Per il
punto x = (0; 0; 1=3) si ha 2 3
0 0 0
r2 f (x) = 4 0 0 0 5
0 0 6
e quindi tutti i determinanti delle matrici considerate dal criterio di Sylvester-Jacobi
sono nulli. Per la Proposizione 346, la matrice Hessiana indenita. In conclusione,
la condizione del secondo ordine non dice alcunch in questo esempio. N
Capitolo 22
Concavit e dierenziabilit
y
5
f(y)
4
f(y)-f(x)
3
f(x)
2
y-x
0
O x y x
-1
-1 0 1 2 3 4 5 6
687
688 CAPITOLO 22. CONCAVIT E DIFFERENZIABILIT
In altre parole, spostandoci a destra, da [x; y] a [w; z], la pendenza delle corde
diminuisce. Questa propriet risulta intuitivamente chiara dal graco:
y
5 D
C
4
3
B
2
1 A
0
O x w y z x
-1
-1 0 1 2 3 4 5 6
y
5
C
4
3
B
2
1 A
0
O x w y x
-1
-1 0 1 2 3 4 5 6
Fatto ci, si mostra che la corda BC ha maggiore pendenza della corda BD:
22.1. CASO SCALARE 689
y
5 D
C
4
3
B
2
0
O w y z x
-1
-1 0 1 2 3 4 5 6
y = w + (1 )z
La semplice propriet geometrica (22.1) alla base del prossimo importante risul-
tato che mostra come le funzioni concave ammettano sempre almeno le derivate uni-
laterali nei punti interni del proprio dominio.
Dim. Poich x0 un punto interno, esiste un suo intorno (x0 "; x0 + ") incluso in
C, cio (x0 "; x0 + ") C. Sia 0 < a < ", cos da avere [x0 a; x0 + a] C. Sia
: [ a; a] ! R denita come
f (x0 + h) f (x0 )
(h) = 8h 2 [ a; a]
h
La propriet (22.1) implica che descrescente, cio
f (x0 + h0 ) f (x0 ) f (x0 + h00 ) f (x0 )
h0 h00 =) (h0 ) = (h00 ) = (22.4)
x0 + h0 x0 x0 + h00 x0
Infatti, se h0 < 0 < h00 basta applicare la (22.1)con w = y = x0 , x = x0 + h0 e
z = x0 + h00 . Se h0 h00 < 0, basta applicare la (22.2) con y = x0 , x = x0 + h0 e
w = x0 + h . Se 0 < h0
00
h00 basta applicare la (22.3) con w = x0 , y = x0 + h0 e
z = x0 + h00 .
Siccome decrescente su [ a; a] si ha (a) (h) ( a) per ogni h 2
[ a; a], ossia limitata. Quindi sia descrescente sia limitata, il che implica che
i limiti destro e sinistro di esistono e sono niti. Ci prova lesistenza delle derivate
unilaterali. Inoltre, la decrescenza di implica (h0 ) (h00 ) per ogni h0 < 0 < h00 ,
sicch
f+0 (x0 ) = lim+ (h) lim (h) = f 0 (x0 ) :
h!0 h!0
Per mostrare la monotonia, consideriamo x; y 2 int C tali che x < y. Grazie alla
(22.1) si ha
f (x + h) f (x) f (y + h) f (y)
8h 2 [ a; a]
x+h x y+h y
Quindi
f (x + h) f (x) f (y + h) f (y)
f+0 (x) = lim+ lim+ = f+0 (y) ;
h!0 h h!0 h
il che implica che la derivata destra decrescente. Un argomento simile vale per la
derivata sinistra.
e (
1 se x 0
f 0 (x) =
1 se x > 0
Quindi f+0 (x) f 0 (x) per ogni x 2 R ed entrambe le derivate unilaterali sono
decrescenti. N
Dim. Sia f : C R ! R continua. (i) Solo se: segue dalla Proposizione 350.
Se. Supponiamo che la derivata sinistra f+0 sia decrescente su int C.1 Siano
x; y 2 int C con y < x. Consideriamo la funzione ' : [0; 1] ! R data da
Vogliamo mostrare che ' 0. La continuit di f implica che ' continua su [0; 1].
Per il Teorema di Weierstrass, ' ha un punto di minimo b 2 [0; 1]. Poich ' (0) =
' (1) = 0, se b 2 f0; 1g si ha ' ( ) ' (b ) = 0, come desiderato. Supponiamo quindi
che b 2 (0; 1). Condizione necessaria a nch b 2 (0; 1) sia minimo che '0+ (b ) 0.
Ma,
'0+ ( ) = (x y) f+0 ( x + (1 ) y) f (x) + f (y) 8 2 (0; 1)
e quindi '0+ decrescente su (0; 1) perch 1 2 se e solo se 1 x + (1 1) y
0 0
2 x + (1 2 ) y. Da ci segue che la condizione ' + (b ) 0 implica ' + ( ) 0 per
ogni 2 [b ; 1). La funzione ' dunque decrescente su [b ; 1), e quindi su [b ; 1] perch
' continua. Ne segue che ' (b ) ' (1) = 0. Ma b minimo e dunque
Ci prova che ' 0, come desiderato. La funzione f quindi concava su int C. Grazie
alla sua continuit su C, ci implica la concavita di f sullintero C (perch?).
(ii) Solo se. Sia f strettamente concava. Per quanto appena dimostrato la
derivata unilaterale f+0 decrescente su int C. Supponiamo, per contra, che non sia
strettamente tale: esistono x; y 2 int C, con x < y, tali che f+0 (x) = f+0 (y). Quindi,
f+0 (z) = f+0 (x) per ogni z 2 [x; y]. Posto k = f+0 (x), per la versione unilaterale del
Corollario 332 si ha f (z) = kz + b, con b 2 R, per ogni z 2 [x; y], il che contraddice la
stretta concavit di f .
Se. Sia f+0 strettamente decrescente su int C. Ci implica che '0+ strettamente
decrescente su (0; 1), e quindi b 2 f0; 1g. Infatti, supponiamo per contra che b 2 (0; 1).
La condizione '0+ (b ) 0 implica '0+ ( ) < 0 per ogni 2 [b ; 1). La funzione '
dunque strettamente decrescente su [b ; 1), e quindi su [b ; 1] perch ' continua. Ne
segue che ' (b ) > ' (1) = 0, il che contraddice la minimalit di b .
1
Per comprendere la struttura di questa dimostrazione, in prima lettura il lettore pu sostituire
la derivata f 0 a quella sinistra f+0
. Una volta capita la dimostrazione in questo caso speciale, la sua
0
validit nel caso generale con f+ non dovrebbe presentare problemi.
22.1. CASO SCALARE 693
e (
1 + 3x2 se x 0
f 0 (x) =
1 3x2 se x > 0
f (h) f (0) (h + h3 ) h3
f+0 (0) = lim+ = lim+ = lim+ 1 + = 1
h!0 h h!0 h h!0 h
e
f (h) f (0) h + h3 h3
f 0 (0) = lim = lim = lim 1+ =1
h!0 h h!0 h h!0 h
Quindi f+0 (x) f 0 (x) per ogni x 2 R ed entrambe le derivate sono decrescenti. Per
il Teorema 352 la funzione concava. N
Si noti lasimmetria tra i punti (i) e (ii): mentre in (i) la decrescenza condizione
necessaria e su ciente per la concavit, in (ii) la stretta decrescenza solo condizione
su ciente per la stretta concavit. Ci segue dallanaloga asimmetria per la monotonia
tra le Proposizioni 334 e 335.
Dim. (i) Basta osservare che, grazie alla versione decrescentedella Proposizione 334,
la derivata prima f 0 decrescente su int C se e solo se f 00 (x) 0 per ogni x 2 int C.
(ii) Segue dalla versione decrescentedella Proposizione 335.
Con lulteriori ipotesi che f sia due volte derivabile su int C, la concavit equivale
alla negativit della derivata seconda, una condizione spesso di pi facile verica della
decrescenza della derivata prima. In ogni caso, grazie ai due ultimi corollari disponiamo
ora di potenti criteri dierenziali di concavit.
22.1. CASO SCALARE 695
Prima di illustrare la potenza di questi criteri con alcuni esempi, osserviamo che
per le funzioni convesse valgono risultati speculari, con la crescenza in luogo della
decrescenza (e f 00 0 in luogo di f 00 0). Lasciamo al lettore vericare questa
osservazione, che nel seguito daremo per acquisita.
p
Esempio 428 (i) Le funzioni f; g : R+ ! R denite da f (x) = x e g (x) = log x
hanno rispettivamente derivate
1 1
f 0 (x) = p e g 0 (x) =
2 x x
Dim. Sia f concava e siano x e y due punti distinti di (a; b). Se 2 (0; 1) si ha:
e dunque
f (x + (1 ) (y x)) f (x)
f (y) f (x) :
(1 )
696 CAPITOLO 22. CONCAVIT E DIFFERENZIABILIT
5 f(y)+f'(x)(y-x)
y
4.5
f(x)
4
f(y)
3.5
f(y )
3 2
2.5
2 f(y )
1
1.5
0.5
O y y y x x
1 2
0
0 1 2 3 4 5
2
Pur essendo la cosa geometricamente ovvia, sentiamo il dovere di dimostrarla. Sia z esterno
allintervallo [x; y]: poniamo che z > y. Si pu allora scrivere y = x + (1 ) z con 2 (0; 1) e, per
la concavit di f , si ha f (y) f (x) + (1 ) f (z), ovvero
1
f (z) f (y) f (x) :
1 1
Ma, essendo 1= (1 ) = > 1 e 1 = 1 1= (1 ) = = (1 ) < 0, si ha f (z) =
f ( y + (1 ) x) f (y) + (1 ) f (x) per ogni > 1. Se z < x si ragiona in modo speculare.
22.2. CASO VETTORIALE 697
Per una funzione derivabile su (a; b), si pu quindi aermare che condizione neces-
saria e su ciente di concavit che le rette tangenti nei vari punti del dominio stiano
tutte sopra il suo graco. Analoghe considerazioni valgono per la convessit: sotto il
graco invece che sopra.
Dim. Il Solo sesegue dal teorema precedente. Mostriamo il Se. Supponiamo che
valga la disuguaglianza (22.6) e consideriamo il punto z = x + (1 ) y. Scriviamo
la precedente disuguaglianza una volta relativamente ai punti z e x e unaltra ai punti
z e y:
f 0 (z) (1 ) (x y) f (x) f ( x + (1 ) y) ;
0
f (z) (y x) f (y) f ( x + (1 ) y) :
0 f (x) + (1 ) f (y) f ( x + (1 ) y) ;
Il primo problema che si incontra nel caso vettoriale quale sia la controparte vet-
toriale della decrescenza della derivata prima nel caso scalare, che grazie al Corollario
353 caratterizza la concavit scalare. La derivata prima f 0 diventa nel caso vettoriale
il gradiente rf . In particolare, supponiamo che f : U Rn ! R sia derivabile sul-
n
lintorno U , cosicch si possa scrivere rf : U ! R . Il gradiente si pu quindi vedere
come una funzione da un sottoinsieme convesso di Rn a valori in Rn . In generale,
queste funzioni hanno la forma g : C Rn ! Rn , dove C un sottoinsieme convesso
di Rn . Una tale funzione si dice decrescente se
Complementi
(i) concava nel punto x0 se esiste un suo intorno (eventualmente solo destro o solo
sinistro quando x0 sia di frontiera) nel quale essa concava;
(ii) strettamente concava nel punto x0 se esiste un suo intorno (eventualmente solo
destro o solo sinistro) nel quale essa strettamente concava.
Brevemente:
f concava in x0 =) f 00 (x0 ) 0
e
f 00 (x0 ) < 0 =) f strettamente concava in x0
Analoga caratterizzazione vale per la (stretta) convessit.
701
702 CAPITOLO 23. COMPLEMENTI
5 10
y y
0 f(x )
0
6
-5 4 f(x )
0
-10
O x x O x x
0 0
-15 -2
0 1 2 3 4 5 6 -1 0 1 2 3 4 5 6 7
OfB. Cos come la derivata prima di una funzione in un punto d informazioni sul suo
crescere o decrescere, la derivata seconda d informazioni sulla concavit o convessit
in un punto. Quanto pi jf 00 (x0 )j grande, tanto pi pronunciata la curvatura (la
pancia) di f in x0 (e la pancia allins se f 00 (x0 ) < 0, prima gura, e allingi
se f 00 (x0 ) > 0, seconda gura).
Per evitare linuenza dellunit di misura di f (x), specialmente in Economia, si
considera
f 00 (x0 )
f 0 (x0 )
(o il suo valor assoluto) che non ne dipende1 . Si osservi incidentalmente che f 00 (x0 ) =f 0 (x0 )
la derivata di log f 0 (x0 ). N
23.1.2 Asintoti
Intuitivamente, si chiama asintoto una retta alla quale il graco di una funzione si
avvicina indenitamente. Tali rette possono essere verticali, orizzontali od oblique.
Pertanto
1
y=x
2
asintoto obliquo per x ! +1 per f . N
p 1 a1
y= n
a0 x +
n a0
Se pn (x) = a0 xn + a1 xn 1 + + an un polinomio
p di grado n in x con a0 > 0 e
n
n pari, allora la funzione denita da f (x) = pn (x) per x ! +1 ha asintoto
obliquo
p 1 a1
y = n a0 x +
n a0
e per x ! 1 asintoto obliquo
p 1 a1
y= n
a0 x +
n a0
Verichiamo solo la (ii) per n dispari (per n pari i conti sono analoghi). Se n
dispari per x ! 1 si ha
p q
n
a x n n 1 + a1 + ::: + an
f (x) 0 a0 x a0 x p
= ! n a0
x x
p
quindi il coe ciente angolare dellasintoto obliquo n a0 . Inoltre
1
" 1 # 1+ a1 xn 1 +:::an n
1
p p a1 x n 1
+ :::an n p a1 x n 1
+ :::an a 0 xn
f (x) n
a0 x = n
a0 x 1+ 1 = n
a0 x a1 xn 1 +:::an
a0 x n a0 x n a 0 xn
Poich per x ! 1
1
a1 xn 1 +:::an n
1+ a 0 xn
1
1 p a1 x n 1
+ :::an p a1
a1 xn 1 +:::an
! e n
a0 x ! n
a0
a 0 xn
n a0 x n a0
si ha, per x ! 1,
p p a1 1
f (x) n
a0 x ! n
a0
a0 n
Nellesempio precedente si aveva n = 2, a0 = 1e a1 = 1; infatti, per x ! +1,
lasintoto aveva equazione
p
2 1 1 1
y= 1 x+ =x
2 1 2
706 CAPITOLO 23. COMPLEMENTI
(i) In primo luogo opportuno calcolare i limiti di f nei punti di frontiera del
dominio oltre che eventualmente per x ! 1 quando A illimitato.
(ii) Pu essere interessante stabile gli insiemi nei quali la funzione positiva, f (x)
0, crescente, f 0 (x) 0, e convessa, f 00 (x) 0. Con le intersezioni con gli assi
(f (0) con lasse delle ordinate, f (x) = 0 con lasse delle ascisse) gi si ha unidea
sommaria del suo graco.
(iii) Per individuare eventuali estremi locali, si pu usare la procedura omnibus vista
nella Sezione 21.3.
(iv) I punti nei quali f 00 (x) = 0 sono candidati ad essere di esso; lo sono senzaltro
se in essi f 000 6= 0.
(v) Inne opportuno cercare eventuali asintoti di f .
Risulta poi:
(iii) Essendo f 00 (x) = 6x 14, essa nulla per x = 7=3. La derivata seconda 0
quando x 7=3.
p p
(iv) Dato che f 00 7 3 13 < 0, il punto di massimo locale; risultando invece f 00 7+ 13
3
>
0, il punto di minimo locale. Inne il punto 7=3 di esso.
23.1. STUDIO DI FUNZIONI 707
10
y
8
0
O x
-2
-3 -2 -1 0 1 2 3 4 5 6 7
N
2
Esempio 436 Sia f : R ! R data da f (x) = e x . Entrambi i limiti, per x ! 1,
sono 0+ . La funzione sempre strettamente positiva e f (0) = 1. Cerchiamo eventuali
punti di estremo locale. La condizione del primo ordine f 0 (x) = 0 ha la forma
x2
2xe =0
e quindi x = 0 lunico punto critico. La derivata seconda
x2 x2 x2
f 00 (x) = 2e + ( 2x) e ( 2x) = 2e 2x2 1
e quindi f 00 (0) = 2: x = 0 punto di massimo locale.
Il graco della funzione
N
708 CAPITOLO 23. COMPLEMENTI
6x5 6x = 0;
Si ha poi che:
(i) f (x) 0 () x 0.
(ii) f 0 (x) = (x + 1) ex 0 () x 1.
(iii) f 00 (x) = (x + 2) ex 0 () x 2.
Si ha poi che:
(i) f (x) sempre 0 e f (0) = 0: x = 0 perci punto di minimo globale.
(ii) f 0 (x) = x (x + 2) ex 0 () x 2 ( 1; 2] [ [0; +1).
p p
(iii) f 00 (x) = (x2 + 4x + 2) ex 0 () x 2 1; 2 2 [ 2+ 2; +1
(iv) x = 2 e x = 0 sono gli unici punti stazionari. Essendo f 00 ( 2) = 2e 2 < 0,
x = 2 punto di massimo locale. Dato che f 00 (0) = 2e0 > 0 si conferma che
x = 0 di minimo.
p
(v) I due punti di ascisse 2 2 sono di esso.
710 CAPITOLO 23. COMPLEMENTI
Si ha poi che:
N
1
Esempio 441 Sia f : R ! R data da f (x) = 2x + 3 + x 2
. Essa non denita per
x = 2. Risulta
1
(i) f (0) = 3 2
= 25 ; si ha f (x) = 0 allorquando (2x + 3) (x 2) = 1 ovvero
quando 2x2 x 5 = 0, cio per
p
1 41
x= ' 1; 35 e 1; 85.
4
23.1. STUDIO DI FUNZIONI 711
(ii) Risulta
1
f 0 (x) = 2
(x 2)2
che nulla se (x 2)2 = 1=2 cio se
p
2
x=2 .
2
(iii) Dato che
2
f 00 (x) =
(x 2)3
positiva per ogni x > 2 e negativa per ogni x < 2, i due punti stazionari
p
2
2
2
sono rispettivamente di massimo e di minimo locale.
(iv) Dato che f 0 (x) ! 2 per x ! 1, la funzione presenta un asintoto obliquo.
Visto che
1
lim [f (x) 2x] = lim 3+ = 3.
x! 1 x! 1 x 2
lasintoto obliquo ha equazione y = 2x + 3. Vi poi ovviamente un asintoto
verticale di equazione x = 2.
La versiera di Agnesi una curva che si costruisce come segue. Si prende una circon-
ferenza di raggio a > 0 con centro nel punto (0; a) e si considera la retta di equazione
y = 2a. A questo punto si prendono tutte le rette che passano per lorigine 0. Ognuna
di esse intereseca la retta y = 2a in un unico punto A. Il segmento OA interseca a
sua volta la circonferenza nellorigine e in un unico punto B. La versiera il luogo dei
punti che hanno come ascissa lascissa di A e come ordinata lordinata di B.
y
1.5
A A A
3 1 2
1
0.5
-0.5
-1
O x
-1.5
-2
-2 -1 0 1 2
Con facili calcoli che lasciamo al lettore si vede che lequazione della versiera
8a3
f (x) = 8x 2 R
x2 + 4a2
23.2. CALCOLO DISCRETO 713
5
y
4
0
O x
-1
-5 0 5
8a3
f 0 (x) = 2x
(x2 + 4a2 )2
che nulla soltanto per x = 0. Dato che f 0 (x) > 0 per ogni x < 0 e f 0 (x) < 0 per
ogni x > 0, lorigine punto di massimo (globale). Risulta ancora
(i) (xn + yn ) = xn + yn ;
(ii) (xn yn ) = xn+1 yn + yn xn ;
xn yn xn xn yn
(iii) = .
yn yn yn+1
Mentre la (i) garantisce che la somma si scambia senza problemi con la dierenza
, i punti (ii) e (iii) aermano che le cose sono pi sottili per prodotti e rapporti. La
(ii) si dice regola del prodotto, mentre la (iii) la regola del rapporto.
La monotonia della successione originale quindi svelata dal segno delle dierenze.
xn = an+1 an = (a 1) an = (a 1) xn :
xn = n2 = (n + 1)2 n2 = 2n + 1
e
2 2 2
xn = n = 2 (n + 1) + 1 (2n + 1) = 2.
N
Esempio 444 Sia fxn g = nk con k 2 N. Generalizzando quanto appena visto per
k = 2, mostriamo che
k k
n = k!
Procediamo per induzione. Per k = 2 sappiamo che 2 xn = 2 = 2! Supponiamo che
per ogni 2 r k 1 si abbia r nr = r! Usando il binomio di Newton, si ha
k k k k
nk = (n + 1)k nk = nk + n 1
+ n 2
+ +1 nk
1 2
k k
= knk 1
+ n 2
+ +1
2
716 CAPITOLO 23. COMPLEMENTI
r r
e quindi, usando lipotesi di induzione n = r! per 2 r k 1 e lalgebra delle
dierenze, si ha
k 1 k k 2
nk = k 1
nknk + 1
+1+
2
k
= k k 1 nk 1 + k 1
nk 2 + + k 1
(1)
2
= k (k 1)! + 0 + + 0 = k!
Si noti che gli zeri dellultima riga seguono dallipotesi induttiva, che garantisce, per
2 r k,
k 1 k r
n = r 1 k r nk r = r 1 (k r)! = 0
In conclusione, k k
n = k 1
nk = k!, come desiderato. N
Lesempio evidenzia lanalogia tra del calcolo discreto e la derivata del calcolo
continuo. Infatti, nel continuo necessario derivare k volte xk per arrivare a una
costante e derivarlo k + 1 volte per arrivare alla costante 0. Nel discreto, bisogna
applicare k volte alla successione nk per arrivare ad una costante e k + 1 volte per
arrivare alla costante 0.
Citiamo inne la formula di sommazione per parti (che lanalogo discreto della
formula di integrazione per parti). Consideriamo la somma
X
n
as b s :
s=1
n = b1 + b2 + + bn
Proposizione 366 Convenendo di porre an+1 = 0, vale lidentit
Xn Xn
as b s = s as : (23.2)
s=1 s=1
Dim. Infatti
X
n X
n X
n
(as as+1 ) s = as s as+1 s
s=1 s=1 s=1
X
n X
n+1 X
n
= as s as s 1 = a1 1+ as s s 1
s=1 s=2 s=2
X
n X
n
= a1 b 1 + as b s = as b s ;
s=2 s=1
23.2. CALCOLO DISCRETO 717
come desiderato.
X
n X
n
as b s = s s
s=1 s=1
xn ( 1)n
= !0
yn n
Se consideriamo le loro dierenze si ha
xn xn+1 xn ( 1)n+1 (1 + 2n)
= = = ( 1)n+1
yn yn+1 yn 1 + 2n
Quindi, mentre landamento asintotico del rapporto xn =yn regolare, quello del
rapporto xn = yn delle dierenze nite irregolare. Il prossimo risultato di Ernesto
Cesro mostra che, al contrario, la regolarit del comportamento asintotico del rap-
porto xn = yn implica quella del rapporto originario xn =yn .
Teorema 367 (Cesro) Siano fyn g una successione strettamente crescente e positi-
vamente divergente e fxn g unaltra successione. Se esiste il limite (nito o innito)
del rapporto
xn
(23.3)
yn
allora esiste anche il limite di xn =yn e i due limiti sono uguali.
xm xn < k (ym yn ) ;
cio
xm xn kyn
<k+ :
ym ym
Visto che n sso e che ym ! +1 per m ! 1, risulta
xn kyn
! 0:
ym
Si ha allora che xm =ym < k + " per ogni " > 0 e ne segue lasserto.
Nello stesso modo, se xn = yn diverge a +1, xn = yn > K > 0 per ogni n n
e ne segue che xm =ym > K + ". In caso di divergenza a 1, xn = yn < K < 0 per
ogni n n e ne segue che xm =ym < K + ". In ogni caso vale lasserto.
log (1 + n)
(23.4)
n
xn log (1 + n + 1) log (1 + n) 1
= = log 1 + !0
yn 1 1+n
e quindi
log (1 + n)
lim =0
n
grazie al Teorema di Cesro. N
23.2. CALCOLO DISCRETO 719
xn xn xn xn
lim inf lim inf lim sup lim sup (23.5)
yn yn yn yn
Per vedere che il Teorema di Cesro segue da questa disuguaglianza basta osservare
che se xn = yn converge, cio se lim inf xn = yn = lim sup xn = yn , allora la (23.5)
diventa
xn xn xn xn
lim inf = lim inf = lim sup = lim sup
yn yn yn yn
cio xn =yn converge allo stesso limite.
xn+1 p 1
log = log xn+1 log xn e log n
xn = log xn :
xn n
X
n
nk+1 1
sk = + nk + o nk
s=1
k+1 2
nk+1
1k + 2k + + nk :
k+1
Poniamo
xn = 1k + 2k + + nk ; yn = nk+1
720 CAPITOLO 23. COMPLEMENTI
xn+1 xn (n + 1)k 1 1
= = h i!
yn+1 yn (n + 1)k+1 nk+1 (n + 1) 1 1 1 k+1 k+1
n+1
x1 + x2 + + xn
! L:
n
La successione Pn
i=1 xi
n
delle medie aritmetiche converge dunque sempre allo stesso limite della successione
fxn g, ma ovviamente non vale il converso: la successione delle medie pu convergere
anche quando la successione originaria non converge.
23.2. CALCOLO DISCRETO 721
Denizione 141 Si dice che una successione fxn g tende a L secondo Cesro (o in
C
media), in simboli xn ! L, quando
x1 + x2 + + xn
! L:
n
C
Esempio 448 La successione f( 1)n g irregolare, ma ( 1)n ! 0. N
di un certo interesse stabilire in quali casi vale anche il converso, cio quando
accade che dalla convergenza della successione delle medie si possa dedurre la conver-
genza della successione originaria. Si parla in proposito di Teoremi tauberiani. Ne
indichiamo uno:
Proposizione 370 (Hardy-Landau) Sia fxn g una successione per la quale esiste
k < 0 tale che
xn
>k 8n 1: (23.6)
n
C
Allora xn ! L 2 R se e solo se xn ! L.
3
Una consimile propriet stabilizzante si ha non solo per la media aritmetica semplice, ma per
ogni tipo di media: media aritmetica ponderata, geometrica, quadratica, ecc..
722 CAPITOLO 23. COMPLEMENTI
OfB. Qualora una successione non converga nemmeno in media, potremmo consid-
erare la successione delle medie delle medie che, per i motivi esposti, converge pi
facilmentedella successione delle medie: si parla di convergenza nel senso C2. Lidea
si pu chiaramente estendere alle medie delle medie fatte k volte. H
s1 = 1 ; s 2 = 0 ; s 3 = 1 ; s 4 = 0 ; s 5 = 1 ;
1+0 1 2 2 1 3
y1 = 1 ; y2 = = ; y3 = ; y4 = = ; y5 = ;
2 2 3 4 2 5
abbastanza evidente che tutte le yn con n pari valgono 1=2 e che tutte le yn con n
dispari valgono
1=2 + n=2 n+1 1 1
= = +
n 2n 2 2n
e perci tendono anchesse a 1=2. Dunque
X
1
C 1
( 1)n = .
n=1
2
X
1
t 1
U (x) = ut (xt ) 8x 2 R1 (23.7)
t=1
23.2. CALCOLO DISCRETO 723
e quindi il caso limite corrisponde alla somma delle utilit dei vari periodi, tut-
ti con egual peso unitario. Con orizzonte innito il problema si complica in modo
X
1
sostanziale poich, per il Teorema 134, la convergenza della serie ut (xt ) richiede
t=1
limt!1 ut (xt ) = 0, il che poco plausibile dal punto di vista economico.
Consideriamo invece il limite
X1
t 1
lim (1 ) ut (xt )
"1
t=1
dove ogni blocco di 0 e 1 ha lunghezza pari alla somma delle lunghezze dei blocchi
X1
precedenti. Si pu mostrare che lim "1 (1 ) t 1
xt non esiste. N
t=1
V (x) = (1 ) U (x) 8x 2 R1
Alla luce della (23.9), V una normalizzazione di U che assegna valore 1 alla
successione costante xt = 1 per ogni t.
Grazie al Teorema di Frobenius-Littlewood, si ha
1X
1
lim V (x) = lim ut (xt )
"1 T !+1 T
t=1
purch i limiti esistano. Il caso di innita pazienza perci catturato dal limite delle
utilit medie
1X
1
lim ut (xt ) (23.10)
T !+1 T
t=1
cio dal limite secondo Cesro della succesione fut (xt )g. Tale criterio pu quindi
vedersi come il caso limite per " 1 della funzione di utilit intertemporale V .
XT
Il ruolo che la somma ut (xt ) svolge nel caso (23.8) con orizzonte nito viene
t=1
dunque svolto con orizzonte innito dal limite delle utilit medie (23.10). Ques-
ta importante applicazione economica del Teorema di Frobenius-Littlewood chiude
degnamente il capitolo.
Parte V
Calcolo integrale
725
Capitolo 24
6
y
1
O a b x
0
0 1 2 3 4 5 6
Il problema come rendere rigorosa tale naturale intuizione. Per ssare le idee, nel
resto di questa sezione introduttiva considereremo una funzione f : [a; b] ! R positi-
va, cosicch il problema sia interpretabile proprio come larea della porzione di piano
A f[a;b] sottesa da f su [a; b]. Il classico procedimento che seguiremo, detto di esaus-
tione, consiste nellapprossimare la misura di A f[a;b] tramite aree di poligoni molto
semplici, i cosiddetti plurirettangoli, la cui misura si calcola in modo elementare.
Qualora lapprossimazione che si ottiene grazie a questi semplici poligoni si possa ren-
dere sempre pi precisa no a riuscire a catturare, al limite, la misura di A f[a;b] , tale
727
728 CAPITOLO 24. INTEGRALE SECONDO RIEMANN
valore sar assunto come lintegrale di f su [a; b]. Lidea del procedimento di esaus-
tione nasce nella matematica greca, dove ha trovato brillanti applicazioni nei lavori di
Ippocrate di Chio, Eudosso di Cnido e Archimede di Siracusa.
24.0.5 Plurirettangoli
Sappiamo calcolare le aree di gure geometriche elementari e, tra esse, le pi semplici
sono i rettangoli, la cui area data dal prodotto di base per altezza. Una semplice, ma
cruciale, generalizzazione dei rettangoli rappresentata dai cosiddetti plurirettangoli,
-1
-1 0 1 2 3 4 5 6 7 8 9
4 y
3.5
2.5
1.5
0.5
0
O a b x
-0.5
-1
0 1 2 3 4 5 6
729
4 y
3.5
2.5
1.5
0.5
0
O a b x
-0.5
-1
0 1 2 3 4 5 6
4 y 4 y
3.5 3.5
3 3
2.5 2.5
2 2
1.5 1.5
1 1
0.5 0.5
0 0
O a b x O a b x
-0.5 -0.5
-1 -1
0 1 2 3 4 5 6 0 1 2 3 4 5 6
24.1 Denizione
Rendiamo ora rigorosa la procedura di esaustione, cominciando con il considerare
funzioni positive f : [a; b] ! R+ . In una prossima sezione ci occuperemo di funzioni
di segno qualunque.
mi = inf f (x)
x2[xi 1 ;xi ]
Siccome abbiamo supposto che f sia limitata, per il Teorema di completezza dei reali
tale estremo inferiore esiste nito, ossia mi 2 R. Poich la lunghezza xi di ogni base
[xi 1 ; xi ]
xi = xi xi 1
larea I (f; ) di tale massimo plurirettangolo inscritto data da
X
n
I (f; ) = mi xi (24.3)
i=1
24.1. DEFINIZIONE 731
In modo analogo, costruiamo sulle basi contigue (24.2) determinate dalla suddivisione
il pi piccolo plurirettangolo che circoscrive linsieme sotteso da f . Per li-esima base
la minima altezza Mi del rettangolo di base [xi 1 ; xi ] che circoscrive linsieme sotteso
da f data da
Mi = sup f (x)
x2[xi 1 ;xi ]
Anche in questo caso, essendo f limitata, per il Teorema di completezza dei reali,
lestremo superiore esiste nito, ossia Mi 2 R. Quindi, larea S (f; ) del minimo
plurirettangolo circoscritto
X
n
S (f; ) = mi xi (24.4)
i=1
In particolare, linsieme sotteso da f compreso tra questi due valori. Quindi, I (f; )
d unapprossimazione inferiore di tale area, mentre S (f; ) ne d unapprossimazione
superiore.
e
I (f; 0 ) I (f; 00
) S (f; 00
) S (f; 0 ) (24.8)
Un ra namento comune 00 determina perci, rispetto a e 0
, migliori approssi-
mazioni, sia inferiore sia superiore, dellarea sottesa da f .
Tutto ci suggerisce la prossima denizione.
Denizione 144 Sia f : [a; b] ! R+ una funzione limitata. Si dice integrale inferiore
di f su [a; b] il valore
Z b
f (x) dx = sup I (f; ) (24.9)
a 2
Rb
Quindi, f (x) dx lestremo superiore delle aree I (f; ) dei plurirettangoli in-
a
scritti rispetto a tutte le possibili suddivisioni di [a; b], ed quindi la migliore ap-
prossimazione inferiore che si pu costruire per larea sottesa da f su [a; b] a partire
dai plurirettangoli inscritti.
Rb
In modo analogo, a f (x) dx lestremo inferiore delle aree I (f; ) dei plurirettan-
goli circoscritti rispetto a tutte le possibili suddivisioni di [a; b], ed quindi la migliore
approssimazione superiore che si pu costruire per larea sottesa da f su [a; b] a partire
dai plurirettangoli circoscritti.
Lemma 372 Per una funzione limitata f : [a; b] ! R+ esistono niti sia lintegrale
Rb Rb
inferiore sia lintegrale superiore, ossia f (x) dx 2 R+ e a f (x) dx 2 R+ .
a
24.1. DEFINIZIONE 733
e quindi
m (b a) I (f; ) S (f; ) M (b a) 8 2 ;
il che, grazie al Teorema di completezza dei reali, implica che lestremo
Rb superiore in
(24.9) e lestremo inferiore in (24.10) esistano niti e positivi, ossia f (x) dx 2 R+ e
a
Rb
a
f (x) dx 2 R+ .
e larea sottesa2 da f compresa tra tali due valori. La disuguaglianza la versione ul-
tima della disuguaglianza (24.6): gli integrali inferiore e superiore sono rispettivamente
le migliori approssimazioni inferiore e superiore dellarea sottesa da f ottenibile a par-
Rb Rb
tire dai plurirettangoli. In particolare, quando f (x) dx = a f (x) dx, larea sottesa
a
sar assunta uguale a tale valore. Ci motiva la prossima fondamentale denizione.
X
n
I (f; ) = x0 x1 + x1 x2 + + xn 1 xn = xi 1 xi
i=1
X
n
S (f; ) = x1 x1 + x2 x2 + + xn xn = xi xi
i=1
e quindi
X
n
S (f; ) I (f; ) = (x1 x0 ) x1 +(x2 x1 ) x2 + +(xn xn 1 ) xn = ( xi )2
i=1
Rb Rb
ossia a
f (x) dx = f (x) dx. Ne segue che f (x) = x integrabile. N
a
1 se x 2 Q\ [0; 1]
f (x) = (24.11)
0 se x 2
= Q\ [0; 1]
ristretta su [0; 1]. Per la Proposizione 18 sulla densit dei razionali, per ogni 0 x <
y 1 esiste un razionale q tale che x < q < y. Data qualsiasi suddivisione fxi gni=0 di
[0; 1], si ha allora
I (f; ) = 0 x1 + 0 x2 + + 0 xn = 0;
X n
S (f; ) = 1 x1 + 1 x2 + + 1n xn = xi = 1;
i=1
Rb Rb
il che implica a
f (x) dx = 0 < 1 = f (x) dx. La funzione di Dirichlet non quindi
a
integrabile3 . N
negativi sia positivi, linsieme sotteso da f su [a; b] ha in generale una parte positiva
e una parte negativa
5 y
2
+
1
O - x
0
-1
-2
-3 -2 -1 0 1 2 3 4
e lintegrale la dierenza tra le misure della parte positiva e della parte negativa.
Se esse hanno uguale valore, lintegrale nullo: il caso, per esempio, della funzione
f (x) = sin x sullintervallo [0; 2 ].
Per rendere rigorosa lidea, utile scomporre una funzione nelle sue parti positiva
e negativa.
x x 0 0 x 0
f + (x) = e f (x) = :
0 x<0 x x<0
Gracamente:
736 CAPITOLO 24. INTEGRALE SECONDO RIEMANN
Graco di f + : Graco di f :
N
e 8 [
< 0 x2 [2n ; (2n + 1) ]
f (x) = n2Z
:
sin x altrimenti
Gracamente:
Graco di f + : Graco di f :
N
24.1. DEFINIZIONE 737
f = f+ f : (24.12)
Tale denizione rende rigorosa e trasparente lidea di considerare con segno di-
verso le aree che si trovano, rispettivamente, al di sotto della parte positiva f + e al
di sopra della parte negativa f di f . Tuttavia, mostreremo subito che si pu es-
primere in modo equivalente utilizzando, anche per funzioni di segno qualunque, le
approssimazioni I (f; ) e S (f; ) della denizione di integrale di funzioni positive.
(24.3) e (24.4). Il lettore pu facilmente vericare che, per queste somme, continuano
a valere le propriet (24.5), (24.6), (24.7) e (24.8). In particolare, si ha
in perfetta analogia con quanto fatto per le funzioni positive. Il prossimo risultato
mostra che tutto si tiene, ossia la nozione di integrale di Riemann ottenuta tramite
la scomposizione (24.12) in parte positiva e negativa coincide con luguaglianza tra
integrali superiori e inferiori della (24.13).
Z b Z b Z b
f (x) dx = f (x) dx = f (x) dx:
a a a
Dim. Sia f : [a; b] ! R una funzione limitata. Sia = fxi gni=0 una suddivisione di
[a; b]. Per prima cosa mostriamo che
Quindi
sup f (x) = sup f + (x) inf f (x) ;
x2[xi 1 ;xi ] x2[xi 1 ;xi ]
x2[xi 1 ;xi ]
il che implica
I (f; ) = I f + ; S f ;
24.1. DEFINIZIONE 739
Si ha inoltre
Quindi
inf f (x) = inf f + (x) sup f (x) ;
x2[xi 1 ;xi ] x2[xi 1 ;xi ] x2[xi 1 ;xi ]
il che implica
S (f; ) = S f + ; I f ;
e
Quindi
da cui
ossia
inf S f + ; sup I f + ; = inf S f ; sup I f ; = 0:
2 2 2 2
Rimane da mostrare il Solo se. Supponiamo ora che f sia integrabile, ossia che
f + e f siano integrabili. Mostriamo allora che
0
Per ogni " > 0, esistono suddivisioni e tali che
S f +; I f +; <" e S f ; 0
I f ; 0
< ".
00 0
Se un ra namento comune di e , a maggior ragione, si ha
S f +; 00
I f +; 00
<" e S f ; 00
I f ; 00
<"
e perci
00 00
0 inf S (f; ) sup I (f; ) S (f; ) I (f; )
2 2
= S f +; 00
I f +; 00
+S f ; 00
I f ; 00
< 2";
Dim. Se. Supponiamo che, per ogni " > 0, esiste una suddivisione tale che
S (f; ) I (f; ) < ". Allora
Z b Z b
0 f (x) dx f (x) dx S (f; ) I (f; ) < "
a a
Rb Rb
e quindi, essendo " > 0 qualsiasi, si ha a
f (x) dx = f (x) dx.
a
Rb Rb
Solo se. Supponiamo a
f (x) dx. Grazie alla Proposizione 52, per
f (x) dx =
a
Rb
ogni " > 0 esistono una suddivisione tale che a f (x) dx I (f; ) < " e una suddi-
Rb
visione 0 tale che S (f; 0 ) f (x) dx < ". Sia 00 una suddivisione che ra na sia
a
sia 0 . Grazie alla (24.6) si ha I (f; ) I (f; 00 ) S (f; 00 ) S (f; 0 ), e quindi
Z b Z b
00 00 0
S (f; ) I (f; ) < S (f; ) I (f; ) < " + f (x) dx + " f (x) dx = 2";
a a
come desiderato.
Il prossimo risultato mostra che, se due funzioni sono uguali tranne che in un
numero nito di punti, allora i loro integrali, se esistono, sono uguali. Si tratta di
unimportante propriet di stabilit dellintegrale, il cui valore non cambia qualora si
modichi una funzione f : [a; b] ! R in un numero nito di punti.
Dim. Sia = fxi gni=0 la suddivisione tale che x1 < x2 < < xn 1 sono i punti in cui
f e g dieriscono, ossia f (xi ) 6= g (xi ) per ogni i = 1; 2; ; n 1, mentre f (x) = g (x)
per ogni x 2= fx1 ; x2 ; ; xn 1 g. Poich f e g sono entrambe limitate, esistono m < M
tali che
m f (x) M e m g (x) M; 8x 2 [a; b] :
Siano ' : [a; b] ! R e : [a; b] ! R funzioni ausiliarie tali che ' (x) = (x) se
x2= fx1 ; x2 ; : : : ; xn 1 g e ' (xi ) = m e (xi ) = M per ogni i = 1; 2; : : : ; n 1. Si ha
' f e' g . Fissato " > 0, consideriamo la suddivisione " data da
x0 < x 1 " < x1 + " < x2 " < x2 + " < < xn 1 " < xn 1 + " < xn :
742 CAPITOLO 24. INTEGRALE SECONDO RIEMANN
Si ha
I ('; ") = inf f (x) (x1 " x0 ) + 2" inf ' (x) + inf f (x) (x2 " x
x2[x0 ;x1 "] x2[x1 ";x1 +"] x2[x1 +";x2 "]
+2" inf ' (x) + + inf ' (x) + inf f (x) (xn xn 1
x2[x2 ";x2 +"] x2[xn 1 ";xn 1 +"] [xn 1 +";xn ]
X
n 1
+ inf f (x) ( xi 2") + inf f (x) ( xn ")
x2[xi 1 +";xi "] [xn 1 +";xn ]
i=2
X
n 1
+ inf f (x) ( xi 2") + inf f (x) ( xn ") :
x2[xi 1 +";xi "] [xn 1 +";xn ]
i=2
Perci
Poich n, m e M sono ssati (date f e g), mentre " > 0 arbitrario, grazie alla
Proposizione 374 dalla (24.18) segue che la funzione g : [a; b] ! R integrabile.
Rb Rb
Inoltre, a f (x) dx = a g (x) dx. Infatti, per ogni " > 0, si ha
Z b Z b
f (x) dx g (x) dx S ( ; " ) I ('; " ) ;
a a
Rb Rb
ossia a
f (x) dx = a
g (x) dx.
OfB. Anche se una funzione f non denita in un numero nito di punti dellintervallo
[a; b], si pu parlare del suo integrale: esso coincide con quello di qualunque funzione
denita anche nei punti mancanti e che uguale a f nei punti nei quali questultima
denita. In particolare gli integrali di f su [a; b], (a; b], [a; b) e (a; b) coincidono sempre:
Z b
ci rende non ambigua la notazione f (x) dx. H
a
Dim. Sia " > 0. Siccome integrabile, f limitata. Esistono quindi m < M tali
che m f (x) M per ogni x 2 [a; b]. Grazie al Teorema 188, g uniformemente
continua su [m; M ], ossia esiste " > 0 tale che
Daltra parte
" #
X X
2
" xi sup f (x) inf f (x) xi < ";
x2[xi 1 ;xi ]
x2[xi 1 ;xi ]
i2I
= i2I
=
P
e quindi i2I
= < ". Dunque
xi < "
" #
Xn
S (g f; ) I (g f; ) = sup (g f ) (x) inf (g f ) (x) xi
x2[xi 1 ;xi ]
x2[xi 1 ;xi ]
i=0
" #
X
= sup (g f ) (x) inf (g f ) (x) xi
x2[xi 1 ;xi ]
x2[xi 1 ;xi ]
i2I
" #
X
+ sup (g f ) (x) inf (g f ) (x) xi
x2[xi 1 ;xi ]
x2[xi 1 ;xi ]
i2I
=
X X
" xi + 2 sup g (x) xi < " (b a) + 2 sup g (x) "
i2I x2[m;M ] x2[m;M ]
i2I
=
" #
= b a + 2 sup g (x) ":
x2[m;M ]
0
x x x x x
1 2 3 4 5
-1
-1 0 1 2 3 4 5 6 7 8 9
Denizione 148 Una funzione f : [a; b] ! R si dice a scala se esistono una suddivi-
sione = fxi gni=0 e un insieme fci gni=1 di costanti tali che
X
n 1
f (x) = ci 1[xi 1 ;xi )
(x) + cn 1[xn 1 ;xn ] (x) (24.21)
i=1
e
X
n
g (x) = c1 1[x0 ;x1 ] + ci 1(xi 1 ;xi ]
(x) (24.22)
i=2
1 se x 2 A
1A (x) = :
0 se x 2
=A
Gracamente
24.3. CLASSI DI FUNZIONI INTEGRABILI 745
7 7
6 6
5 5
4 4
4 4
3
3 3
3
2 2 2 2
1 1 1 1
0 0
x x x x x x x x
1 2 3 4 1 2 3 4
-1 -1
-1 0 1 2 3 4 5 6 7 8 9 -1 0 1 2 3 4 5 6 7 8 9
Sugli intervalli
[x0 ; x1 ) [ (x1 ; x2 ) [ [ (xn 2 ; xn 1 ) [ (xn 1 ; xn ]
larea sottesa dalla funzione a scala corrisponde eettivamente a un plurirettangolo,
privato dei punti x1 < x2 < < xn 1 . In tali punti la funzione a scala dierisce
dal plurirettangolo determinato dalla suddivisione fxi gni=0 e dalle costanti fci gni=1 ,
ma, grazie alla Proposizione 375, tale discrepanza irrilevante per lintegrale: larea
sottesa dalla funzione a scala determinata dalla suddivisione fxi gni=0 e dalle costanti
fci gni=1 secondo la (24.20) pari a quella del corrispondente plurirettangolo in gura,
indipendentemente dai valori della funzione nei punti x1 < x2 < < xn 1 .
4
4
3
3
2 2
1 1
0
x x x x
1 2 3 4
-1
-1 0 1 2 3 4 5 6 7 8 9
x0 < x 1 " < x1 + " < x2 " < x2 + " < < xn 1 " < xn 1 + " < xn :
Si ha
Z b
f (x) dx I (f; ") = c1 (x1 " x0 ) + 2" inf f (x) + c2 (x2 " x1 ")
x2[x1 ";x1 +"]
a
+2" inf f (x) + + inf f (x) + cn (xn xn 1 ")
x2[x2 ";x2 +"] x2[xn 1 ";xn 1 +"]
X
n 1
= c1 ( x1 ") + 2" inf f (x)
x2[xi ";xi +"]
i=1
X
n 1
+ ci ( xi 2") + cn ( xn ")
i=2
X
n X
n 1
= ci xi " (c1 + cn ) + 2" inf f (x)
x2[xi ";xi +"]
i=1 i=1
X
n X
n
ci xi 2"M + 2" (n 1) m = ci xi + 2" ((n 1) m M) :
i=1 i=1
e quindi
Z b
!
X
n X
n
f (x) dx lim ci xi + 2" (M (n 1) m) = ci xi : (24.25)
a "!0+
i=1 i=1
Rb Pn
Le (24.24) e (24.25) implicano lintegrabilit di f , con a
f (x) dx = i=1 ci xi .
24.3. CLASSI DI FUNZIONI INTEGRABILI 747
e Z Z
b b
f (x) dx = inf h (x) dx : h f e h 2 S ([a; b]) : (24.27)
a a
Dim. Consideriamo la (24.26) (la (24.27) si mostra in modo analogo). Sia f : [a; b] !
R una funzione a scala tale che f (xi ) = f (xi ) per ogni i = 0; 1; 2; : : : ; n e
Poich
mi = inf f (y) inf f (y)
y2[xi 1 ;xi ] y2(xi 1 ;xi )
X
n Z
I (f; ) inf f (y) xi = f (x) dx
y2(xi 1 ;xi )
i=1
Perci Z Z
b
f (x) dx = sup I (f; ) sup f (x) dx
a 2 2
x~0 < x~1 " < x~1 + " < x~2 " < x~2 + " < < x~n 1 " < x~n 1 + " < x~n
Poich la disuguaglianza vale per ogni " > 0, le (24.30) e (24.31) implicano che
Z !
Xn
fe (x) dx I (f; e" ) + k lim ci x~i + 2" (m (n 1) M ) + k
"#0
i=1
X
n Z
= ci x~i + k = fe (x) dx + k;
i=1
il che porta alla contraddizione 0 k > 0. Ne segue che vale la (24.29), come
desiderato.
Sia ora h 2 S ([a; b]) tale che h f . Supponiamo che h sia determinata, secondo
la (24.20), dalla suddivisione = fxi gni=0 e dalle costanti fci gni=1 . Poich h f , si ha
ci inf x2(xi 1 ;xi ) f (x) per ogni i = 1; 2; : : : ; n. Per la (24.23),
Z X
n X
n Z
h (x) dx = ci xi inf f (y) xi = f (x) dx
y2(xi 1 ;xi )
i=1 i=1
e quindi
Z b Z
sup h (x) dx : h f e h 2 S ([a; b]) sup f (x) d (x) :
a
4
Ossia basato anche sulluso di nozioni di analisi, quali le funzioni, e non solo su quello di gure
geometriche, quali i plurirettangoli.
750 CAPITOLO 24. INTEGRALE SECONDO RIEMANN
e Z ( n )
b X X
n
f (x) dx = inf di I (ci (x)) : f (x) di 'i (x) :
a 'i 2I
i=1 i=1
H
Dim. Poich f continua su [a; b], grazie al Teorema di Weierstrass, f limitata. Sia
" > 0. Grazie al Teorema 188, f uniformemente continua, ossia esiste " > 0 tale
che
jx yj < " =) jf (x) f (y)j < " 8x; y 2 [a; b] : (24.32)
Sia = fxi gni=0 una suddivisione di [a; b] su cientemente ne da far s che ogni
xi < " . Grazie alla (24.32), per ogni i = 1; 2; : : : ; n si ha allora
f (x) se x 2
=S
f~ (x) =
limy!x f (y) se x 2 S
Teorema 380 Ogni funzione limitata f : [a; b] ! R che abbia al pi un numero nito
di discontinuit integrabile.
Omettiamo la dimostrazione (che meno immediata del caso speciale test visto
con sole discontinuit eliminabili). importante osservare che questo importante
risultato di integrabilit generalizza sia la Proposizione 379 sia la Proposizione 377
sullintegrabilit delle funzioni a scala (che, ovviamente, sono continue eccetto nei
punti delle suddivisioni che le deniscono).
e quindi
X
n X
n
S (f; ) I (f; ) = sup f (x) xi inf f (x) xi
x2[xi 1 ;xi ]
i=1 x2[xi 1 ;xi ] i=1
Xn X
n X
n
= f (xi ) xi f (xi 1 ) xi = (f (xi ) f (xi 1 )) xi
i=1 i=1 i=1
aX
n
b b a
(f (xi ) f (xi 1 )) = (f (b) f (a)) < " (f (b) f (a)) :
n i=1
n
Si noti che la Proposizione 381 non un caso particolare del Teorema 380 perch
le funzioni monotone f : [a; b] ! R possono avere inniti punti di discontinuit.
Z b Z b
( f ) (x) dx = sup I ( f; ) = sup S (f; ) = inf S (f; ) = f (x) dx:
a 2 2 2 a
a
f (x) dx = a
f (x) dx. In conclusione,
Z b Z b
f (x) dx = f (x) dx 8 2 R: (24.34)
a a
Sia " > 0. Poich f e g sono integrabili, per la Proposizione 374, esiste una
suddivisione di [a; b] tale che S (f; ) I (f; ) < " ed esiste 0 tale che S (g; 0 )
I (g; 0 ) < ". Sia 00 una suddivisione di [a; b] che ra na sia sia 0 . Grazie alla (24.6),
si ha S (f; 00 ) I (f; 00 ) < " e S (g; 00 ) I (g; 00 ) < ". Inoltre,
00 00 00 00 00 00
I (f; ) + I (g; ) I (f + g; ) S (f + g; ) S (f; ) + S (g; )
e quindi
00 00 00 00 00 00
S (f + g; ) I (f + g; ) S (f; ) I (f; ) + S (g; ) I (g; ) < 2":
Per la Proposizione 374, f + g integrabile. Inoltre,
sup I (f + g; ) sup (S (f; ) + S (g; ))
2 2
Z b Z b
sup S (f; ) + sup S (g; ) = f (x) dx + g (x) dx
2 2 a a
24.4. PROPRIET DELLINTEGRALE 753
Tra le altre cose, la linearit implica che si possa liberamente suddividere il dominio
di integrazione [a; b] in sottointervalli:
Corollario 383 Sia f : [a; b] ! R una funzione limitata e integrabile. Se a < c < b,
si ha Z b Z c Z b
f (x) dx = f (x) dx + f (x) dx: (24.36)
a a c
come desiderato.
Dim. Da f g segue
1
fg = (f + g)2 (f g)2 :
4
Terminiamo con il classico Teorema del valor medio del calcolo integrale.
Teorema 386 (del valor medio) Sia f : [a; b] ! R una funzione limitata e integra-
bile. Esiste uno scalare " #
2 inf f; sup f
x2[a;b] x2[a;b]
tale che Z b
f (x) dx = (b a) :
a
m f (x) M 8x 2 [a; b]
25
y
20
15
10
0
O a b x
-2 0 2 4 6 8
P 0 (x) = f (x) 8x 2 I:
In altre parole, il passare dalla funzione f alla sua primitiva P pu vedersi come
il procedimento inverso rispetto al passare da P a f tramite la derivazione. In questo
senso, la funzione primitiva linversa della funzione derivata5 .
Vediamo ora un paio di esempi. Al riguardo importante osservare che, come
mostrer lEsempio 459, esistono funzioni che non hanno primitive: la ricerca della
primitiva di una data funzione pu essere vana.
P1 = P2 + k:
e quindi la funzione P1 P2 ha derivata nulla su [a; b]. Per il Corollario 331, la funzione
P1 P2 costante, ossia esiste k 2 R tale che P1 = P2 + k.
Sia ora I un intervallo aperto e limitato (a; b). Sia " > 0 su cientemente piccolo
da far s che a + " < b ". Si ha
1 h
[ " "i
(a; b) = a+ ;b :
n=1
n n
Per quanto appena dimostrato, per ogni n 1 esiste una costante kn 2 R tale che
h " "i
P1 (x) = P2 (x) + kn 8x 2 a + ; b : (24.38)
n n
Sia x0 2 (a; b) tale che a + " < x0 < b ", cosicch x0 2 [a + "=n; b "=n] per
ogni n 1. Dalla (24.38) segue che P1 (x0 ) = P2 (x0 ) + kn per ogni n 1. Quindi,
kn = P1 (x0 ) P2 (x0 ) per ogni n 1, ossia k1 = k2 = = kn . Esiste dunque k 2 R
tale che P1 (x) = P2 (x) + k per ogni x 2 (a; b).
In modo simile si pu dimostrare il risultato quando I un intervallo semiaperto
e limitato (a; b] o [a; b). Se I = R, si procede come nel caso (a; b) osservando che
[
1
R = [ n; n]. Un simile argomento, che lasciamo al lettore, vale anche per gli
n=1
intervalli illimitati.
La Proposizione 387 unaltra importante applicazione del Teorema del valor medio
(del Calcolo dierenziale). Grazie ad essa, una volta individuata una primitiva P di
una funzione f , possiamo scrivere la famiglia di tutte le primitive come fP + kgk2R .
Tale importante famiglia ha un nome.
Z
x2
f (x) dx = + k:
2
Z
1
f (x) dx = log 1 + x2 + k:
2
Chiudiamo la sezione mostrando che non tutte le funzioni ammettono una primi-
tiva, e quindi un integrale indenito.
8
< 1 se x > 0
sgn (x) = 0 se x = 0
:
1 se x < 0
Essa non ammette primitiva. Supponiamo, per contra, che esista una primitiva P :
R ! R, ossia una funzione derivabile tale che P 0 = sgn x. Per la Proposizione 387
esiste k 2 R tale che
x+k se x > 0
P (x) =
x+k se x < 0
24.5.2 Formulario
La prossima tabella, ottenuta ribaltando lanaloga tabella delle derivate notevoli,
riporta alcuni integrali indeniti notevoli.
R
f f (x) dx
xa+1
xa +k 1 6= a 2 R e x > 0
a+1
xn+1
xn +k x2R
n+1
1
log x + k x>0
x
1
log jxj + k x 6= 0
x
cos x sin x + k x2R
sin x cos x x2R
ex ex x2R
x
x
>0ex2R
log
1
p arcsin x x2R
1 x2
1
tan x x2R
1 + x2
Facciamo tre osservazioni:
(i) Per le potenze si ha
Z
xa+1
xa dx = +k 8a 6= 1
a+1
su tutto R quando a tale che la funzione potenza xa ha come dominio R: per
esempio, se a = n naturale. Se invece a 2 R, per esempio a = 1=2, devessere
x > 0.
(ii) Il caso a = 1 per le potenze coperto da f (x) = 1=x.
(iii) Come sappiamo, se f (x) = log x, risulta f 0 (x) = 1=x, ma anche per f (x) =
log ( x) risulta
1 1
f 0 (x) = ( 1) = :
x x
Perci
d log jxj 1
=
dx x
e nella tabella abbiamo scritto che lintegrale di 1=x log jxj.
760 CAPITOLO 24. INTEGRALE SECONDO RIEMANN
Dim. Sia = fxi gni=0 una suddivisione di [a; b]. Se aggiungiamo e sottraiamo P (xi )
per ogni i = 1; 2; : : : ; n 1, si ha
il che implica
I (f; ) P (b) P (a) S (f; ) : (24.40)
24.5. TEOREMA FONDAMENTALE DEL CALCOLO INTEGRALE 761
Illustriamo il teorema con alcuni esempi, che riprendono le primitive calcolate negli
Esempi (456) e (457).
Per esempio,
Z 1
x 1 log 2
dx = log 2 0= :
0 1 + x2 2 2
N
Per le funzioni integrabili prive di primitive, quali la funzione segno sgn x, il Teo-
rema 388 inapplicabile e il calcolo degli integrali non pu quindi farsi tramite la
formula (24.39). In alcuni semplici casi si riesce comunque a calcolare lintegrale us-
ando direttamente la denizione. Per esempio, la funzione segno a scala e quindi
possiamo applicare la Proposizione 377, nella quale, usando la denizione di integrale,
si era determinato il valore dellintegrale per questa classe di funzioni. In particolare,
grazie alla (24.23) si ha
8
Z b >
< b a se b 0
sgn x dx = a + b se a < 0 < b :
a >
: a b se b 0
Tuttavia, quando il Teorema 388 non applicabile, il calcolo degli integrali diventa in
generale molto pi arduo.
762 CAPITOLO 24. INTEGRALE SECONDO RIEMANN
In altre parole, il valore F (x) della funzione integrale larea sottesa da f sullin-
tervallo [a; x], al variare di x. Vediamo una prima propriet delle funzioni integrali.
Dim. Poich f limitata, esiste M > 0 tale che jf (x)j M per ogni x 2 [a; b].
Siano x; y 2 [a; b]. Supponiamo y < x, cosicch
Rx jx yj = x y. Per la denizione di
funzione integrale, si ha F (x) F (y) = y f (t) dt. Grazie alla (24.37), si ha
Z x
jF (x) F (y)j = f (t) dt sup jf (t)j jx yj M jx yj :
y t2[y;x]
Forti della nozione di funzione integrale, possiamo ora tornare al problema che
aveva aperto la sezione, ossia lindividuazione di criteri che garantiscano lesistenza di
primitive per funzioni integrabili. Il prossimo importante risultato, il Secondo Teorema
fondamentale del calcolo integrale, mostra che se f continua, allora F 0 (x) = f (x) per
ogni x 2 [a; b], ossia la funzione integrale proprio una primitiva di f . La continuit di
una funzione perci una semplice e fondamentale condizione che garantisce lesistenza
di sue primitive.
Dim. Sia x0 2 (a; b). Per prima cosa vediamo quale forma assume il rapporto
incrementale di F in x0 . Consideriamo h > 0. Grazie al Corollario 383 si ha
Z x0 +h Z x0
F (x0 + h) F (x0 ) = f (t) dt f (t) dt =
a a
Z x0 Z x0 +h Z x0 Z x0 +h
= f (t) dt + f (t) dt f (t) dt = f (t) dt
a x0 a x0
e quindi, grazie al Teorema del valor medio (del calcolo integrale), avendo indicato con
x0 + #h, 0 # 1, un punto dellintervallo [x0 ; x0 + h]:
R x0 +h
F (x0 + h) F (x0 ) x0
f (t) dt hf (x0 + #h) hf (x0 )
f (x0 ) = f (x0 ) = =
h h h
= jf (x0 + #h) f (x0 )j ! 0
per la continuit di f .
Un argomento analogo vale anche se h < 0 e quindi
F (x0 + h) F (x0 )
F 0 (x0 ) = lim = f (x0 ) ;
h!0 h
completando in tal modo la dimostrazione quando x0 2 (a; b). I casi x0 = a e x0 = b
si dimostrano in modo simile, come il lettore pu agevolmente vericare.
Si conclude che esiste F 0 (x0 ) e che uguale a f (x0 ).
Chiudiamo osservando che vi sono funzioni continue la cui primitiva non esprim-
2
ibile tramite funzioni elementari.
R x2 Un classico esempio la funzione (continua) e x , il
cui integrale indenito e dx non si pu esprimere tramite funzioni elementari. In
tali casi il calcolo dei corrispondenti integrali di Riemann richiede tecniche pi ra nate
di quelle presentate in queste note. Sapere che una funzione ammette primitiva, per
esempio perch continua e quindi vale il Secondo Teorema fondamentale, cosa ben
diversa dal poterla poi calcolare.
(ii) si calcola la dierenza P (a) P (b): tale dierenza spesso indicata con le
notazioni P (x)jba o [P (x)]ba .
come desiderato.
ossia Z Z
1
x dx + log x dx = x log x + k
x
che implica Z
log x dx = x (log x 1) + k:
N
R
Esempio 464 Calcoliamo lintegrale indenito xR sin x dx. Siano f; g : (0; +1) !
RR date da f (x) = x e g (x) = cos x, cosicch x sin x dx si pu riscrivere come
f (x) g 0 (x) dx. Grazie alla (24.43) si ha
Z Z
0
f (x) g (x) dx + x sin x dx = x cos x + k
ossia Z Z
x sin x dx = cos xdx x cos x + k = sin x x cos x + k:
N
24.7. CAMBIAMENTO DI VARIABILE 767
Si osservi che nellultimo esempio, se invece avessimo posto f (x) = sin x e g (x) =
2
x =2, la regola
R (24.43) si sarebbe
R rivelata inutile. Anche con tale scelta di f e g si pu
riscrivere x sin x dx come f (x) g 0 (x) dx, ma qui la (24.43) implica
Z Z
0 x2
f (x) g (x) dx + x sin x dx = sin x + k
2
ossia Z Z
x2 1
x sin x dx = sin x x2 cos xdx + k
2 2
R 2
che ha in realt complicato le cose perch R lintegrale x cos xdx pi di cile da
calcolare rispetto allintegrale originario x sin x dx. Ci mostra che lintegrazione
per parti non pu svolgersi in modo meccanico, ma richiede un podi accortezza.
I due fattori del prodotto f (x) g 0 (x) dx sono detti rispettivamente fattor nito (f (x))
e fattor dierenziale (g 0 (x) dx), cosicch la formula si ricorda come: lintegrale del
prodotto tra un fattor nito e un fattor dierenziale uguale al prodotto tra il fattor
nito e lintegrale del fattor dierenziale meno lintegrale del prodotto tra la derivata
del fattor nito e lintegrale appena trovato. Ribadiamo che decisivo scegliere
oculatamente quale dei due fattori prendere come fattor nito e quale come fattor
dierenziale.
Considerando integrali deniti, la formula diventa ovviamente
Z b Z b
0 b
f (x) g (x) dx = f (x) g (x)ja f 0 (x) g (x) dx
a a
Z b
= f (b) g (b) f (a) g (a) f 0 (x) g (x) dx
a
Dim. Poich ' strettamente crescente, si ha ' (c) < ' (d). Dato che f continua,
grazie alla (24.41) si ha
Z '(d)
f (x) dx = F (' (d)) F (' (c)) (24.47)
'(c)
(F ')0 (t) = (F 0 ') (t) '0 (t) = (f ') (t) '0 (t)
ossia F ' una primitiva di (f ') '0 : [c; d] ! R. Grazie alla Proposizione 376, la
funzione composta f ' : [c; d] ! R integrabile. Siccome, per ipotesi, '0 : [c; d] ! R
integrabile, anche la funzione prodotto (f ') '0 : [c; d] ! R integrabile (si ricordi
quanto visto al termine della Sezione 24.4). Per il Primo Teorema fondamentale si ha
Z d
(f ') (t) '0 (t) dt = (F ') (d) (F ') (c) : (24.48)
c
Poich ' biiettiva si ha ' (c) = a e ' (d) = b. Quindi, la (24.48) e la (24.47) implicano
Z d Z b
0
(f ') (t) ' (t) dt = F (' (d)) F (' (c)) = f (x) dx;
c a
come desiderato.
Il Teorema 393, oltre ad avere un interesse teorico, pu essere molto utile nel
calcolo degli integrali. La formula (24.44), e la sua riscrittura (24.45), si possono
usare sia da destra verso sinistra sia da sinistraRverso destra. Nel primo caso, da
b
destra a sinistra, lobiettivo calcolare lintegrale a f (x) dx trovando un opportuno
R ' 1 (b)
cambiamento di variabile x = ' (t) che porti a un integrale ' 1 (a) f (' (t)) '0 (t) dt
di calcolo pi semplice. La di colt sta nel trovare un opportuno cambiamento di
24.7. CAMBIAMENTO DI VARIABILE 769
variabile x = ' (t): nulla garantisce infatti che esista un cambiamento semplicatorio
e, quandanche esista, pu non essere ovvio trovarlo.
Luso in direzione sinistra verso destra della formula (24.44) serve per calcolare un
Rd
integrale che si possa scrivere come c f (' (t)) '0 (t) dt e il cui corrispondente integrale
R '(d)
'(c)
f (x) dx, ottenuto ponendo x = ' (t), sia di pi facile risoluzione. In tal caso la
Rd
di colt sta nel riconoscere la forma composta c f (' (t)) '0 (t) dt in un dato integrale
che si intende calcolare. Anche qui, nulla garantisce che esso si possa riscrivere in
questa forma, n che, quandanche possibile, essa sia facile da riconoscere.
Presentiamo ora tre esempi che illustrano le due possibili applicazioni della formula
(24.44). I primi due esempi considerano il caso destra verso sinistra, mentre lultimo
esempio considera il caso opposto. Per semplicit usiamo le variabili x e t come
appaiono nella (24.44), sebbene si tratti ovviamente di una pura comodit, priva di
valore sostanziale.
e quindi
Z b p p p
p p p p
sin xdx = 2 sin b sin a+ a cos a b cos b :
a
p
Si noti come il punto dippartenza sia stato porre t = x, ossia specicare la funzione
inversa t = ' 1 (x) = x. Questo spesso il caso perch pi semplice pensare a
quale trasformazione di x possa semplicare lintegrazione. N
1
Poniamo t = sin x, cosicch ' (t) = sin t su [0; =2]. Dalla (18.18) segue che
1
'0 (t) = 1
:
cos sin t
con [c; d] (0; +1). Posto g (x) = x e ' (t) = log t, si pu riscrivere lintegrale come
Z d Z d
log t
dt = g (' (t)) '0 (t) dt:
c t c
y
2.5
1.5
0.5
0
O x
-0.5
-1
-4 -3 -2 -1 0 1 2 3 4
Cominciamo con domini di integrazione della forma [a; +1). Data una funzione
f : [a; +1) ! R, si consideri la funzione integrale F : [a; +1) ! R data da
Z x
F (x) = f (t) dt:
a
R +1
La denizione di integrale improprio a f (x) dx si basa sul limite limx!+1 F (x),
ossia sul comportamento asintotico della funzione integrale. Per esso si possono avere
tre casi:
(i) limx!+1 F (x) = L 2 R,
(ii) limx!+1 F (x) = 1,
(iii) limx!+1 F (x) non esiste.
I casi (i) e (ii) sono considerati dalla prossima denizione.
Denizione 152 Sia f : [a; +1) ! R una funzione integrabile su ogni intervallo
[a; b] [a; +1) con primitiva F . Se limx!+1 F (x) 2 R, si pone
Z +1
f (x) dx = lim F (x)
a x!+1
R +1
e la funzione f si dice integrabile in senso improprio su [a; +1). Il valore a
f (x) dx
detto integrale improprio (o generalizzato) di Riemann.
772 CAPITOLO 24. INTEGRALE SECONDO RIEMANN
Per brevit, nel seguito diremo che una funzione f integrabile su [a; +1), omet-
tendo in senso improprio. Si ha la seguente terminologia:
Esempio 468 Fissato > 0, sia f : [1; +1) ! R data da f (x) = x . La funzione
integrale F : [1; +1) ! R
( 1
(x1 1) se 6= 1
F (x) = 1
log x se =1
sicch 8
< +1 se 1
lim F (x) = 1
x!+1 : se >1
1
Ne segue che lintegrale improprio
Z +1
1
dx
1 x
x2
Esempio 469 Sia f : ( 1; 0] ! R data da f (x) = xe . Si ha
Z 0 Z 0
t2 1 x2 1
f (x) dx = lim te dt = lim 1+e =
1 x! 1 x x! 12 2
esiste e converge. N
Denizione 153 SiaR f : R ! R una R afunzione integrabile su ogni intervallo [a; b]. Se
+1
esistono gli integrali a f (x) dx e 1 f (x) dx, la funzione f si dice integrabile (in
senso improprio) su R e si pone
Z +1 Z +1 Z a
f (x) dx = f (x) dx + f (x) dx; (24.51)
1 a 1
R +1
purch non si abbia una forma di indeterminazione 1 1. Il valore 1 f (x) dx
detto integrale improprio (o generalizzato) secondo Riemann di f su R.
facile vedere che questa denizione non dipende dalla scelta del punto a 2 R.
Spesso, per comodit, si prendeR a = 0.
+1
Anche lintegrale improprio 1 f (x) dx si dice convergente o divergente a seconda
che il suo valore sia nito oppure sia 1.
Illustriamo ora la nozioneR con un paio diR esempi. Si noti come occorra calcolare
+1 a
separatamente i due integrali a f (x) dx e 1 f (x) dx, i cui valori devono poi essere
sommati (quando non diano luogo a una forma di indeterminazione).
x2
Esempio 471 Sia f : R ! R data da f (x) = xe . Si ha
Z +1 Z +1 Z 0
f (x) dx = f (x) dx + f (x) dx
1 0 1
Z x Z 0
t2 t2
= lim te dt + lim te dt
x!+1 0 x! 1 x
1 x2 1 x2 1 1
= lim 1 e + lim 1+e = + =0
x!+1 2 x! 12 2 2
e quindi lintegrale improprio
Z +1
x2
xe dx
1
esiste e vale 0. N
774 CAPITOLO 24. INTEGRALE SECONDO RIEMANN
Propriet Essendo deniti come limiti, le propriet degli integrali impropri seguono
dalle propriet dei limiti di funzioni viste nella Sezione 12.4. In particolare, lintegrale
improprio conserva le propriet di linearit e monotonia dellintegrale di Riemann.
Cominciamo con la linearit, che segue dallalgebra dei limiti vista nella Propo-
sizione 170.
Proposizione 394 Siano f; g : [a; +1) ! R due funzioni integrabili su [a; +1).
Allora, per ogni ; 2 R, la funzione f + g : [a; +1) ! R integrabile su [a; +1)
e risulta
Z +1 Z +1 Z +1
( f + g) (x) dx = f (x) dx + g (x) dx (24.52)
a a a
Dim. Grazie alla linearit dellintegrale di Riemann, e ai punti (i) e (ii) della Propo-
sizione 170, si ha
Z x
lim ( f + g) (x) dx = lim ( F (x) + G (x)) = lim F (x) + lim G (x) =
x!+1 a x!+1 x!+1 x!+1
Z +1 Z +1
= f (x) dx + g (x) dx
a a
ProposizioneR 395 Siano f; gR : [a; +1) ! R due funzioni integrabili su [a; +1). Se
+1 +1
f g, allora a f (x) dx a
g (x).
Dim. Grazie alla monotonia dellintegrale di Riemann, si ha F (x) G (x) per ogni
x 2 [a; +1). Per la monotonia dei limiti di funzioni, si ha quindi limx!+1 F (x)
limx!+1 G (x).
R +1
Come s visto nellEsempio 470, si ha a 0dx = 0. Una semplice conseguenza
R +1
della Proposizione 395 allora che a f (x) dx 0 quando f positiva e integrabile
su [a; +1).
24.8. INTEGRALI IMPROPRI 777
La Proposizione 395 fornisce anche un semplice criterio del confronto per la diver-
genza: date due funzioni f; g : [a; +1) ! R integrabili su [a; +1), con g f , si
ha Z +1 Z +1
f (x) dx = +1 =) g (x) dx = +1 (24.53)
a a
e Z +1 Z +1
g (x) dx = 1 =) f (x) dx = 1: (24.54)
a a
Proposizione 396 Sia f : [a; +1) ! R una funzione positiva e integrabile su ogni
[a; b] [a; +1). Allora essa integrabile su [a; +1) e
Z +1
f (t) dt = sup F (x) : (24.55)
a x2[a;+1)
R1
In particolare, a
f (t) dt converge solo se limx!+1 f (x) = 0 (purch tale limite
esista).
Le funzioni
R +1 f : [a; +1) ! R positive sono quindi integrabili
R 1 in senso impro-
prio, ossia a f (t) dt 2 R+ . In particolare, il loro integrale a f (t) dt converge
oppure diverge positivamente: tertium non datur. Si ha convergenza se e solo se
supx2[a;+1) F (x) < +1, e solo se f innitesima per x ! +1 (purch il limite
R +1
limx!+1 f (x) esista). Altrimenti, a f (t) dt diverge positivamente.
La Proposizione 396 riposa sulla seguente semplice propriet dei limiti di funzioni
monotone.
Lemma 397 Sia ' : [a; +1) ! R una funzione crescente. Allora, limx!+1 ' (x) =
supx2[a;+1) ' (x).
Dim. Consideriamo dapprima il caso supx2[a;+1) ' (x) 2 R. Sia " > 0. Poich
supx2[a;+1) ' (x) = sup ' ([a; +1)), grazie alla Proposizione 52 esiste x" 2 [a; +1)
tale che ' (x" ) > supx2[a;+1) ' (x) ". Poich ' crescente, si ha
sup ' (x) " < ' (x" ) ' (x) sup ' (x) , 8x x"
x2[a;+1) x2[a;+1)
Supponiamo che esista limx!+1 f (x). Mostriamo che lintegrale converge solo se
limx!+1 f (x) = 0. Supponiamo, per contra, che limx!+1 f (x) = L 2 (0; +1].
Dato 0 < " < L, esiste x" > 0 tale che f (x) L " > 0 per ogni x x" . Quindi
Z +1 Z +1 Z x Z x
f (t) dt f (t) dt = lim f (t) dt lim (L ") dt =
a x" x!+1 x" x!+1 x"
= (L ") lim (x x" ) = +1;
x!+1
R +1
il che mostra che a
f (t) dt diverge positivamente.
Corollario 398 Siano f; g : [a; +1) ! R due funzioni positive e integrabili su ogni
[a; b] [a; +1), con f g. Allora
Z +1 Z +1
g (x) dx 2 [0; +1) =) f (x) dx 2 [0; +1) ; (24.56)
a a
e Z +1 Z +1
f (x) dx = +1 =) g (x) dx = +1 (24.57)
a a
R +1 R +1
Dim. Grazie alla Proposizione 395, si ha a f (x) dx g (x) dx, mentre, gra-
R +1 aR
+1
zie alla Proposizione 396, si ha a f (x) dx 2 [0; +1] e a g (x) dx 2 [0; +1].
R +1 R +1 R +1
Quindi, a f (x) dx converge se a g (x) dx converge, mentre a g (x) dx diverge
R +1
positivamente se a f (x) dx diverge positivamente.
Esempio 476 Tornando alla campana gaussiana (24.50), sia f : R ! R data da
Z +1
1 x2
f (x) = p e 2 dx:
2 1
x x2 x2
g (x) f (x) () e e () x () x 2. 2
2
R +1 R +1
Grazie alla (24.56), se 2 g (x) dx converge, allora anche 2 f (x) dx converge. A
R +1
sua volta, ci implica che a f (x) dx converga per ogni a 2 R. Ci ovvio se a 2.
Se a < 2, si ha Z Z Z
+1 2 +1
f (x) dx = f (x) dx + f (x) dx
a a 2
R2
e,
R1 siccome a
f (x) dx esiste Rgrazie alla continuit di f su [a; 2], la convergenza di
1
f (x) dx implica quella di a f (x) dx.
2 R +1
Resta quindi da mostrare che 2 g (x) dx converge. Si ha
Z x
G (x) = g (x) dx = e x + e a
2
Sia 0 < " < k. Esiste x" > a tale che 0 R(k ") g (x) f (x) (k + ") g (x)
+1
per ogni x x" . Grazie alla (24.56), si ha a f (x) dx 2 [0; +1) se e solo se
R +1
a
g (x) dx 2 [0; +1).
(ii) e (iii) Sia f = o (g) per x ! +1, ossia
f (x)
lim = 0:
x!+1 g (x)
Dato " > 0 esiste x" > a tale che 0 f (x)R "g (x) per ogni x x" . Anche qui, la
R +1 +1
(24.56) implica a f (x) dx 2 [0; +1) se a g (x) dx 2 [0; +1), mentre la (24.57)
R +1 R +1
implica a g (x) dx = +1 se a f (x) dx = +1.
R +1
Alla luce dellEsempio 468, la Proposizione 399 implica che a f (x) dx converge
se esiste > 1 tale che
1 1
f oppure f = o per x ! +1:
x x
Il confronto con le potenze x un importante criterio di convergenza per gli integrali
impropri, come mostrano i prossimi due esempi.
Esempio 477 Sia f : [0; +1) ! R una funzione positiva data da
p
x+ x
f (x) = :
sin2 x + x
Poich
1
f;
x
R +1
la Proposizione 399 implica 0 f (x) dx = +1. N
24.8. INTEGRALI IMPROPRI 781
Denizione 155 Sia f : [a; b) ! R una funzione continua tale che limx!b f (x) =
1. Se Z z
lim f (x) dx = lim [F (z) F (a)]
z!b a x!+1
risulta
0 se 0 <1
lim F (x) = :
x!b +1 se 1
Ne segue che lintegrale improprio
Z b
1
dx
a (b x)
esiste per ogni 2 R: converge se 0 < 1 e diverge positivamente se 1. N
Anche per Rquesti integrali impropri vale la Proposizione 399 che permette ora di
b
aermare che a f (x) dx converge se esiste 0 < 1 tale che
1 1
f oppure f = o per x ! b :
(b x) (b x)
f (x) = an 8x 2 [n; n + 1)
per ogni k intero: infatti f sottende (prescindendo dai punti di ascissa intera che
peraltro non inuiscono sullintegrale) un plurirettangolo di basi tutte unitarie e di
altezze a1 ; a2 ; ; ak 1 . Facendo tendere k allinnito si conclude perci che
Z 1 X
1
f (x) dx = an ;
1 n=1
sia in caso di convergenza sia in caso di divergenza.
Nellintento di trarre indicazioni sul carattere di una serie dal comportamento di
un integrale, cerchiamo di rovesciarela precedente semplice osservazione.
Sia f : R++ ! R+ una funzione positiva e decrescente. Poniamo an = f (n),
n = 0; 1; 2; : : :. La positivit e la decrescenza di f consentono di aermare che
Z 1 X 1
f (x) dx an (la serie rappresenta il plurirettangolo inscritto)
0 n=1
e che
Z 1 X
1
f (x) dx an (la serie rappresenta il plurirettangolo circoscritto)
0 n=0
1.5 1.5
y y
a a
1 0 1 0
0.5 a 0.5 a
1 1
a a
2 2
. .
. .
. .
0 0
O 1 2 . . . x O 1 2 . . . x
-0.5 -0.5
-1 0 1 2 3 4 5 6 -1 0 1 2 3 4 5 6
e perci che
X
1 Z 1 X
1
an f (x) dx an :
n=1 0 n=0
Vale allora il
1
f (x) = :
xlogx
Dato che Z
1
dx = logx
xlogx
che diverge per x ! 1, si pu concludere che la serie
X1 1
n=2 nlogn
divergente. N
Lintegrale non esprimibile in forma chiusa, ma integrando per parti si scopre che:
24.10. GRAN FINALE: RIEMANN E I NUMERI PRIMI 785
x x x x x
Li (x) = + 1! 2 + 2! 3 + + (n 1)! +O (24.58)
log x log x log x logn x log n+1
x
n
x (n) log n
j (x) Li (x)j
10 0; 3 2; 2
102 3; 3 5; 1
103 23 10
104 143 17
105 906 38
1010 20:758:029 3:104
1015 891:604:962:452 1:052:619
1020 49:347:193:044:659:701 222:744:644
In eetti, da queste tabelle Li (x) sembra essere uno stimatore di ancor pi interes-
sante di x= log x. Come nello sviluppo (24.58), Li (x) e x= log x sono funzioni diverse
ma collegate, tanto da essere asintotiche per x ! +1.
Proposizione 402 Si ha
x
Li (x) per x ! +1
log x
6
Le nozioni e terminologia sviluppata nella Sezione 9.12 per successioni si adattano in modo
naturale a funzioni. Per brevit, lasciamo al lettore i dettagli.
786 CAPITOLO 24. INTEGRALE SECONDO RIEMANN
Dim. Grazie al Secondo Teorema fondamentale del calcolo integrale, si ha d Li (x) =dx =
1= log x. Quindi
d Li(x) 1
dx log x log x
d(x= log x)
= log x 1 = !1
log2 x
log x 1
dx
x x x
(x) Li (x) = (x) +O
log x log2 x log3 x
ossia
x x x
(x) = (x) Li (x) + +O
log x log2 x log3 x
e quindi
x x x
(x) j (x) Li (x)j + +O
log x log2 x log3 x
Ci implica
x x
(x) log x j (x) Li (x)j O log3 x
x x +1+ x
log2 x log2 x log2 x
x
(x) log x
1 " x 1+" 8x x"
log2 x
Quindi
x x
(x)
log x log2 x
il che, insieme alla (24.63), implica
x
j (x) Li (x)j j (x) Li (x)j log2 x
= x !0
x x
(x) log x log2 x (x) log x
Ci prova la (24.61).
Alla luce di quanto appena visto, dora in poi ci concentriamo sullo stimatore Li (x),
indicando con e (x) il suo termine di errore, cio
Prime obsession, Joseph Henry Press, Washington, 2003 e, in traduzione italiana, Marcus du Sautoy,
Lenigma dei numeri primi, Rizzoli, Milano, 2003. A livello decisamente pi avanzato si veda Harold
M. Edwards, Riemanns zeta function, Dover, Mineola, 2001.
790 CAPITOLO 24. INTEGRALE SECONDO RIEMANN
Parte VI
Ottimizzazione
791
Capitolo 25
Anteprima
S = fx 2 C : rf (x) = 0g
793
794 CAPITOLO 25. ANTEPRIMA
f (^
x) f (x) 8x 2 S (25.2)
allora tale x^ soluzione del problema di ottimo (27.1). In altre parole, si costru-
isce linsieme formato dai punti stazionari; il punto (o i punti) dellinsieme dove
f ha valore massimo la soluzione del problema di ottimo.
sono anche le soluzioni del problema (25.1) di ottimo. Ma le soluzioni del problema
(25.3) sono i punti x^ 2 S per cui vale la (25.2). Esse sono quindi le soluzioni del
problema (25.1) di ottimo, come aerma la fase 3 del Metodo di eliminazione.
6x5 6x = 0
S = f 1; 0; 1g
Se = f0g
26.1 Introduzione
La classica condizione necessaria per estremi locali del Teorema di Fermat considera
punti interni dellinsieme di scelta C, il che ne limita grandemenente lapplicabilit in
molti problemi di ottimo dellEconomia. Infatti, in molti di essi valgono le ipotesi di
monotonia della Proposizione 278 e quindi le eventuali soluzioni sono di frontiera (e
non interne). Un classico esempio il Problema del consumatore
max u (x) sub x 2 B (p; I) (26.1)
x
presentato nel Capitolo 17. Nella consueta ipotesi di monotonia, grazie alla Legge di
Walras il problema si pu riscrivere come
max u (x) sub x 2 (p; I)
x
26.2 Il problema
La forma generale di un problema di ottimo con vincoli di uguaglianza dato da
max f (x) (26.2)
x2A
sub g1 (x) = b1 ; g2 (x) = b2 ; :::; gm (x) = bm :
797
798 CAPITOLO 26. OTTIMIZZAZIONE LOCALE VINCOLATA
secondo la scrittura usata nel Capitolo 17. Tuttavia, per questa speciale classe di
problemi di ottimo, useremo spesso la pi evocativa scrittura (26.2).
26.3 Un vincolo
Nel caso di un unico vincolo di uguaglianza il problema di ottimo (26.2) diventa:
x) = ^ rg (^
rf (^ x) : (26.5)
La (26.5) ci dice che condizione necessaria a nch x^ sia soluzione locale del prob-
lema di ottimo (26.4) che i gradienti delle funzioni f e g siano tra loro proporzionali.
Il cappellosopra ricorda che tale scalare dipende dal punto x^ considerato.
Il prossimo esempio mostra come la condizione (26.5) sia necessaria, ma non
su ciente.
26.3. UN VINCOLO 799
x31 + x32
max sub x1 x2 = 0 (26.6)
x2R 2
Esso della forma (26.4), dove f : R2 ! R e g : R2 ! R sono date da f (x) =
2 1 (x31 + x32 ) e g (x) = x1 x2 , mentre b = 0. Si ha:
e quindi ^ = 0 tale che rf (0; 0) = ^ rg (0; 0). Il punto (0; 0) soddisfa quindi con
^ = 0 la condizione (26.5), ma tale punto non soluzione del problema di ottimo
(26.6). Infatti,
f (t; t) = t3 > 0 = f (0; 0) , 8t > 0. (26.7)
Si osservi che (0; 0) non neanche un punto di minimo (globale) vincolato poich
f (t; t) = t3 < 0 per ogni t < 0. N
Per capire a livello intuitivo la condizione (26.5), assumiamo che f e g siano denite
su R2 , cosicch la (26.5) ha la forma:
@f @f @g @g
(^
x) ; (^
x) =^ (^
x) ; (^
x)
@x1 @x2 @x1 @x2
ossia
@f @g @f @g
x) = ^
(^ (^
x) e x) = ^
(^ (^
x) (26.8)
@x1 @x1 @x2 @x2
La condizione rg (^ x) 6= 0 richiede che almeno una delle due derivate parziali (@g=@xi ) (^
x)
sia diversa da zero. Se, per comodit, supponiamo che lo siano entrambe e che ^ 6= 0,
allora la (26.8) equivale a
@f @f
@x1
(^
x) @x2
(^
x)
@g
= @g (26.9)
@x1
(^
x) @x2
(^
x)
Vediamo ora di capire intuitivamente perch la (26.9) necessaria a nch x^ sia
soluzione del problema di ottimo (26.4). I dierenziali di f e g nel punto x^ sono dati
da
@f @f
x) (h) = rf (^
df (^ x) h = (^
x) h1 + (^
x) h2 8h 2 R2
@x1 @x2
@g @g
x) (h) = rg (^
dg (^ x) h = (^
x) h1 + (^
x) h2 8h 2 R2
@x1 @x2
e danno unapprossimazione lineare delle dierenze f (^ x + h) f (^x) e g (^
x + h) g (^
x),
ossia delleetto su f e g determinato dal passare da x^ a x^ + h. Come ben sappiamo,
tale approssimazione tanto migliore quanto pi piccolo h. Supponiamo, idealmente,
che h sia innitesimo e che lapprossimazione sia esatta, di modo che f (^
x + h) f (^
x) =
800 CAPITOLO 26. OTTIMIZZAZIONE LOCALE VINCOLATA
x) (h) e g (^
df (^ x + h) g (^ x) (h). Dal punti di vista formale ci ovviamente
x) = dg (^
scorretto, ma qui stiamo procedendo in modo euristico, cercando di capire a livello
intuitivo la (26.9).
Proseguendo nel nostro ragionamento euristico, partiamo ora dal punto x^ e con-
sideriamo variazioni x^ + h con h innitesime. Il primo problema da porsi che essi
siano legittimi, ossia che rispettino il vincolo di uguagliaza g (^
x + h) = b. Ci signica
che g (^
x + h) = g (^ x), e quindi h deve essere tale che dg (^
x) (h) = 0. Ne segue che:
@g @g
(^
x) h1 + (^
x) h2 = 0
@x1 @x2
e quindi
@g
@x2
(^
x)
h1 = @g
h2 (26.10)
@x1
(^
x)
Leetto sulla funzione obiettivo f del passare da x^ a x^ +h dato da df (^
x) (h). Quando
h legittimo, per la (26.10) tale eetto dato da:
@g
!
@f @x2
(^
x ) @f
df (^
x) (h) = (^
x) @g
h 2 + (^
x) h2 (26.11)
@x1 @x
(^
x ) @x 2
1
che proprio la (26.9). A livello intuitivo, tutto ci spiega perch la (26.5) sia necessaria
a nch x^ sia soluzione del problema.
rf (^
x) ^ rg (^
x) = 0
26.3. UN VINCOLO 801
e
r L (x; ) = b g (x) (26.14)
il che porta alla seguente fondamentale formulazione in termini della funzione la-
grangiana della condizione necessaria di ottimalit del Lemma 407.
Dim. Sia x^ soluzione del problema di ottimo (26.4). Per il Lemma 407 esiste ^ 2 R
tale che
x) ^ rg (^
rf (^ x) = 0
Per la (26.13), la condizione equivale a
rx L x^; ^ = 0
Grazie al Teorema 408, la ricerca delle soluzioni locali del problema di ottimo
vincolato (26.4) si basa sulla ricerca dei punti stazionari di unopportuna funzione di
802 CAPITOLO 26. OTTIMIZZAZIONE LOCALE VINCOLATA
rL (x; ) = 0 (26.15)
per la ricerca dei possibili candidati ad essere soluzione del problema vincolato. Nel-
la prossima sezione vedremo come la condizione sia fondamentale nella ricerca delle
soluzioni locali del problema di ottimo (26.4) col Metodo di Lagrange.
Prima di proseguire, occorre fare due importanti osservazioni. Per prima cosa,
si osservi che in generale la coppia x^; ^ non punto di massimo del lagrangiano,
neanche quando x^ eettivamente soluzione del problema di ottimo. La coppia x^; ^
un punto stazionario per il lagrangiano, ma nulla pi. Perci, dire che la ricerca delle
soluzione del problema di ottimo vincolato si riduce alla ricerca dei punti di massimo
del lagrangiano un grave errore, come vedremo meglio nel Capitolo 9.
La seconda osservazione che il problema (26.4) ha una versione simmetrica
2. si determina linsieme C D dei punti del vincolo ove le funzioni f e gi non sono
derivabili con continuit;
26.4. METODO DI LAGRANGE 803
3. posto
D0 = fx 2 D : rg (x) = 0g
Le eventuali soluzioni locali del problema di ottimo (26.4) si devono cercare tra i
punti del sottoinsieme
S [ (C \ D0 ) [ (C D)
di C. Infatti, una soluzione locale che sia un punto regolare apparterr allinsieme S
grazie al Teorema 408. Invece, tale teorema non dice alcunch sia circa le eventuali
soluzioni locali che sono punti singolari, e che quindi appartengono allinsieme C \ D0 ,
sia circa le eventuali soluzioni locali ove le funzioni non sono derivabili con continuit,
e che cio appartengono allinsieme C D.
In conclusione, condizione necessaria a nch un punto x 2 C sia soluzione locale
del problema di ottimo (26.4) che esso appartenga al sottoinsieme S [ (C \ D0 ) [
(C D) C. Ci quanto consente di stabilire il Teorema 408. Naturalmente,
lapplicazione del teorema tanto pi e care quanto pi piccolo tale insieme, sicch
la ricerca delle soluzioni locali si possa restringere a un insieme signicativamente pi
piccolo delloriginario insieme C.
Nel Capitolo 27 la procedura sar integrata nel Metodo di eliminazione per la ricer-
ca delle soluzioni (globali) del problema di ottimo (26.4). In eetti, sono le soluzioni
globali ci che interessa maggiormente, come detto pi volte; la ricerca delle soluzioni
locali ha un mero interesse strumentale per la ricerca delle soluzioni globali. Per tale
ragione non considereremo condizioni del secondo ordine per le soluzioni locali.
Nel resto della sezione illustriamo la procedura con alcuni esempi analitici. La
prossima sezione considerer il classico Problema del consumatore.
e quindi (0; 0) lunico punto singolare, cio D0 = f(0; 0)g. Lunico punto singolare
non soddisfa il vincolo, sicch C \ D0 = ;. Abbiamo cos completato la fase 3 del
Metodo di Lagrange.
Il Lagrangiano L : R3 ! R dato da
e per trovare linsieme dei suoi punti stazionari occorre risolvere la condizione del primo
ordine (26.15): 8 @L
>
> =0
< @x1
@L
@x2
=0
>
>
: @L
@
=0
Occorre quindi risolvere il seguente sistema (non lineare) di tre equazioni
8
>
> 4x1 2 x1 = 0
<
10x2 2 x2 = 0
>
>
: 1 x2 x2 = 0
1 2
sicch
S = f(0; 1) ; (0; 1) ; (1; 0) ; ( 1; 0)g
il che completa la fase 4 del Metodo di Lagrange. In conclusione
e in questo (fortunato) caso la condizione del primo ordine necessaria per qualsiasi
soluzione locale del problema di ottimo (26.16). NellEsempio 500 del Capitolo 27
continueremo lo studio del problema di ottimo (26.16), mostrando quali tra i quattro
punti (26.17) individuati dal Metodo di Lagrange siano soluzioni (globali) del problema
di ottimo (26.16). N
X
n
kxk2
maxn e sub xi = 1 (26.18)
x2R
i=1
26.4. METODO DI LAGRANGE 805
2
n n kxk
Esso della
Pn forma (26.4), dove f : R ! R e g : R ! R sono date da f (x) = e e
2
g (x) = i=1 xi , mentre b = 1. Le funzioni sono tutte derivabili con continuit su R ,
ossia D = R2 . Come nel precedente esempio, C \ D = C e C D = ;: in tutti i punti
del vincolo le funzioni f e g sono derivabili con continuit. Abbiamo cos completato
le fasi 1 e 2 del Metodo di Lagrange.
Si ha
rg (x) = (1; 1; :::; 1)
e quindi non esistono punti singolari, cio D0 = ;. Ci completa la fase 3 del Metodo
di Lagrange.
Il Lagrangiano L : Rn ! R dato da
!
2 Xn
L (x1 ; x2 ; ) = e kxk + 1 xi ; 8 (x; ) 2 Rn+1 ;
i=1
e per trovare linsieme dei suoi punti stazionari occorre risolvere la condizione del primo
ordine (26.15) data dal seguente sistema (non lineare) di n + 1 equazioni
( @L 2
@xi
= 2xi e kxk = 0 8i = 1; :::; n
@L
Pn
@
=1 i=1 xi = 0
2
xi = ekxk
2
e sostituendo questi valori nellultima equazione troviamo
2
1 n ekxk = 0
2
ossia
2 kxk2
= e
n
Sostituendo tale valore di in ciascuna delle prime n equazioni troviamo xi = 1=n, e
quindi lunico punto (x; ) 2 Rn+1 che soddisfa la condizione del primo ordine (26.15)
1 1 1 2 n
; ; :::; ; e
n n n n
sicch S il singoletto
1 1 1
S= ; ; :::;
n n n
806 CAPITOLO 26. OTTIMIZZAZIONE LOCALE VINCOLATA
C D = (A int A) \ C
L (x; ) = u (x) + (I p x)
e, per trovare linsieme dei suoi punti stazionari, occorre risolvere la condizione del
primo ordine: 8 @L
>
> @x1
(x; ) = 0
>
>
>
>
>
<
>
>
>
> @L
(x; ) = 0
>
> @xn
>
: @L
@
(x; ) = 0
1
Si noti che A Rn+ implica int A Rn++ , cio i punti interni di A hanno sempre coordinate
strettamente positive.
808 CAPITOLO 26. OTTIMIZZAZIONE LOCALE VINCOLATA
cio
8 @u(x)
>
> @x1
p1 = 0
>
>
>
>
>
<
>
>
>
> @u(x)
pn = 0
>
> @xn
>
:
I p x=0
@u (x)
= pi 8i = 1; :::; n (26.20)
@xi
p x = I (26.21)
@u(x) @u(x)
@x1 @xn
= =
p1 pn
che evidenzia come nel paniere x soluzione (locale) del Problema del consumatore le
utilit marginali del reddito speso per i vari beni, misurate dai rapporti
@u(x)
@xi
pi
siano tutte uguali. Si noti che 1=pi la quantit del bene i acquisibile con ununit di
reddito.
In chiave ordinalista, dove la nozione di utilit marginale non ha pi cittadinanza,
la condizione (26.20) si riscrive come
@u(x)
@xi pi
@u(x)
=
pj
@xj
per ogni coppia di beni i e j del paniere soluzione x. In tale paniere, quindi, il saggio
marginale di sostituzione tra ogni coppia di beni devessere pari al rapporto tra i loro
prezzi, cio SM Sxi ;xj = pi =pj . Per n = 2 si ha la classica interpretazione geometrica
della condizione di ottimalit in un paniere (x1 ; x2 ) come uguaglianza tra la pendenza
della curva di indierenza (nel senso della Sezione 19.5.2) e quella della retta del vincolo
di bilancio.
26.5. PROBLEMA DEL CONSUMATORE 809
2
x
2
1.5
0.5
-0.5
O x
1
-1
-1 0 1 2 3 4 5 6 7
Sia come sia, le (26.20) e (26.21) sono condizioni del primo ordine del Problema
del consumatore e la loro risoluzione determina linsieme S dei punti stazionari. In
conclusione, il Metodo di Lagrange implica che le soluzioni locali del Problema del
consumatore debbano essere cercate tra i punti di
S [ ((A int A) \ C)
Oltre che punti che soddisfano le condizioni (26.20) e (26.21) del primo ordine, le
soluzioni locali possono essere punti di frontiera A int A dellinsieme A che soddisfano
il vincolo (tali soluzioni sono dette di frontiera 3 ).
u (x1 ; x2 ) = x1 x21
che molto comoda per far di conto. Con essa la condizione del primo ordine in ogni
(x1 ; x2 ) 2 R2++ assume la forma
1
= p1 ; = p2 (26.22)
x1 x2
p1 x1 + p2 x2 = I (26.23)
La (26.22) implica
1
=
p1 x1 p2 x2
Sostituendo nella (26.23), si ha
1
p1 x1 + p1 x1 = I
e quindi
I (1 )I
x1 = ; x2 =
p1 p2
In conclusione,
I (1 )I
S= ;
p1 p2
Lunica possibile soluzione locale del Problema del consumatore il paniere
I (1 )I
x= ;
p1 p2
La Sezione 27.3.1 del prossimo capitolo mostrer, grazie al Metodo di eliminazione,
che questo paniere eettivamente lunica soluzione del Problema del consumatore
nel caso Cobb-Douglass. N
Esempio 489 Consideriamo la funzione di utilit separabile u : R2+ ! R data da
u (x) = x1 + x2 . Per prima cosa si osservi che
I I
C D= 0; ; ;0
p2 p1
La condizione del primo ordine in ogni (x1 ; x2 ) 2 R2++ diventa
1 = p1 ; 1 = p2 (26.24)
p1 x1 + p2 x2 = I (26.25)
che non ha soluzioni quando p1 6= p2 (come di solito il caso). Quindi, S = ;, sicch
I I
S [ (C D) = C D= 0; ; ;0
p2 p1
Le uniche possibili soluzioni locali del Problema del consumatore sono quindi i panieri
di frontiera
I I
0; ; ;0
p2 p1
N
26.6. PI VINCOLI 811
26.6 Pi vincoli
Consideriamo ora il problema generale di ottimo (26.2), in cui vi possono essere pi
vincoli di uguaglianza. Il Lemma 407 e il Teorema 408 si generalizzano in modo
naturale al caso di pi vincoli. Scriviamo il problema (26.2) come
Dim. Sia k k la norma Euclidea. Siccome A aperto, esiste ^" > 0 su cientemente
x) = fx 2 A : kx x^k ^"g
piccolo da far si che B ^" (^ A. Dato " 2 (0; ^"], si ponga
x) = fx 2 A : kx x^k = "g. Linsieme U" (^
U" (^ x) compatto.
Per prima cosa dimostriamo una propriet che useremo in seguito.
812 CAPITOLO 26. OTTIMIZZAZIONE LOCALE VINCOLATA
Propriet 1. Per ogni " 2 (0; ^"], esiste N > 0 tale che
2
X
m
f (x) f (^
x) kx x^k N (gi (x) x))2 < 0
gi (^ (26.28)
i=1
2
X
m
f (xn ) f (^
x) kxn x^k Nn (gi (xn ) x))2
gi (^ 0
i=1
f (xn ) x) kxn
f (^ x^k2 X
m
(gi (xn ) x))2
gi (^ (26.29)
Nn i=1
f (xnk ) x) kxnk
f (^ x^k2 X
m
(gi (xnk ) x))2
gi (^ (26.30)
Nnk i=1
f (xnk ) x) kxnk
f (^ x^k2
lim =0
k Nnk
X
m
2
X
m
(gi (x ) gi (^
x)) = lim (gi (xnk ) x))2 = 0
gi (^
k
i=1 i=1
2
X
m
f (xnk ) f (^
x) kxnk x^k + Nnk (gi (xnk ) x))2
gi (^ "2 8k 1
i=1
il che contraddice f (^
x) f (x ). Questa contraddizione dimostra la Propriet 1. 4
x) ed un vettore ( "0 ;
Propriet 2. Per ogni " 2 (0; ^"], esiste x" 2 B" (^ "
1 ; :::;
"
m) 2
U1m+1 (0) tale che
@f " X
m
@gi "
" "
0 (x ) 2 x"j x^j i (x ) = 0; 8j = 1; :::; n (26.31)
@xj i=1
@xj
Dim della Propriet 2. Dato " 2 (0; ^"], sia N" > 0 la costante positiva la cui
esistenza garantita dal Propriet 1. Si denisca la funzione h" : A Rn ! R come:
2
X
m
h" (x) = f (x) f (^
x) kx x^k N" (gi (x) x))2 ;
gi (^ 8x 2 A
i=1
Si ha h" (^
x) = 0 e, per come si scelto N" ,
h" (x) > 0; 8x 2 U" (^
x) : (26.32)
La funzione h" continua sul compatto B " (^ x) = fx 2 A : kx x^k "g e, per il Teo-
x) tale che h" (x" ) h" (x) per ogni x 2 B " (^
rema di Weierstrass, esiste x" 2 B " (^ x).
" "
In particolare, h" (x ) x) = 0, e quindi la (26.32) implica che kx k < ", ossia
h" (^
" "
x 2 B" (^ x). Il punto x dunque un punto di massimo sullaperto B" (^ x) e per il
Teorema di Fermat si ha rh" (x" ) = 0. Quindi,
@f " X
m
@gi "
(x ) 2 x"j x^j 2N" gi (x" ) (x ) = 0; 8j = 1; :::; n (26.33)
@xj i=1
@xj
Si ponga:
X
m
c" = 1 + (2N" gi (x" ))2
i=1
" 1
0 =
c"
" 2N" gi (x" )
i = ; 8i = 1; :::; m
c"
814 CAPITOLO 26. OTTIMIZZAZIONE LOCALE VINCOLATA
qP
m
cosicch la (26.31) si ottiene dividendo la (26.33) per c" . Si osservi che i=0 ( "i )2 =
1, ossia ( "0 ; "1 ; :::; "m ) appartiene a U1m+1 (0). 4
Usando la Propriet 2, possiamo ora completare la dimostrazione. Si prenda una
successione decrescente f"n gn (0; ^"] con "n # 0,4 e si consideri la relativa successione
f( n0 ; n1 ; :::; nm )gn Rm+1 la cui esistenza garantita dalla Propriet 2.
Poich la successione f( n0 ; n1 ; :::; nm )gn contenuta nel compatto U1m+1 (0), per il
Teorema di Bolzano-Weierstrass esiste una sua sottosuccessione f( n0 k ; n1 k ; :::; nmk )gk
convergente in U1m+1 (0), ossia esiste ( 0 ; 1 ; :::; m ) 2 U1m+1 (0) tale che
nk nk nk
( 0 ; 1 ; :::; m) ! ( 0; 1 ; :::; m) :
Grazie alla Propriet 2, per ogni "nk esiste xnk 2 B"nk (^ x) per cui vale la (26.31),
ossia
nk @f nk X m
nk @gi
nk
0 (x ) 2 (x x^j ) i (xnk ) = 0; 8j = 1; :::; n
@xj i=1
@x j
Teorema 410 Sia x^ soluzione del problema di ottimo (26.26). Se le funzioni f; g1 ; :::; gm
x) ha rango m, allora esiste un vettore ^ 2 Rm tale che la
sono di classe C 1 e se Dg (^
coppia x^; ^ 2 Rn+m punto stazionario della funzione Lagrangiana.
per ogni (x1 ; x2 ; x3 ; 1 ; 2 ) 2 R5 . Per trovare linsieme dei suoi punti stazionari occorre
risolvere la condizione del primo ordine (26.15) data dal seguente sistema non lineare
di cinque equazioni 8
@L
>
> @x1 = 7 2 1 x1 2 = 0
>
>
> @L
< @x2 = 2 1 x2 2 = 0
@L
@x3
= 3 + 2 = 0
>
> @L 2
>
> = 1 x 1 x22 = 0
> @ 1
: @L = 1 x
@ 2 1 x2 + x3 = 0
nelle cinque incognite x1 , x2 , x3 , 1 e 2. La terza equazione implica 2 = 3 e quindi
il sistema si riduce a: 8
>
> 2 1 x1 + 4 = 0
<
1 x2 3=0
>
> 1 x1 x22 = 0
2
:
1 x1 x2 + x3 = 0
26.6. PI VINCOLI 817
La prima equazione implica 1 6= 0. Quindi, dalle prime due equazioni segue che:
2 3
= x1 e = x2
1 2 1
Sostituendo nella terza equazione si ottiene:
5
1 =
2
Se 1 = 5=2, si ha x1 = 4=5, x2 = 3=5, x3 = 4=5: Se 1 = 5=2, si ha x1 = 4=5,
x2 = 3=5, e x3 = 7=5. Abbiamo quindi trovato i due punti stazionari del Lagrangiano
4 3 4 5 4 3 7 5
; ; ; ;3 ; ; ; ; ;3
5 5 5 2 5 5 5 2
sicch
4 3 4 4 3 7
S= ; ; ; ; ;
5 5 5 5 5 5
il che completa tutti le fasi del Metodo di Lagrange. In conclusione, si ha
4 3 4 4 3 7
S [ (C \ D0 ) [ (C D) = S = ; ; ; ; ;
5 5 5 5 5 5
il che prova che nellesempio la condizione del primo ordine (26.15) necessaria per
qualsiasi soluzione locale del problema di ottimo (26.37). NellEsempio 505 del Capito-
lo 27 mostreremo quali, tra i punti di S, sono soluzioni del problema di ottimo (26.37).
N
Esempio 491 Consideriamo il problema di ottimo:
max3 x1 sub x21 + x32 = 0 e x23 + x22 2x2 = 0 (26.38)
x2R
Alla luce della prima e della terza equazione, dobbiamo considerare tre casi:
818 CAPITOLO 26. OTTIMIZZAZIONE LOCALE VINCOLATA
e tra tali tre punti si deve svolgere la ricerca delle evenuali soluzioni locali del problema
di ottimo (26.38). N
26.6. PI VINCOLI 819
2x1 1 0
Dg (x) =
1 0 1
facile vedere come per nessun valore di x1 i due vettori riga, ossia i due gradienti
rg1 (x) e rg2 (x), siano lineramente dipendenti (a livello meccanicosi verica facil-
mente che non esista alcun valore di x1 per cui la matrice Dg (x) non ha rango pieno).
Quindi, non esistono punti singolari, ossia si ha D0 = ;. Ne segue che C \ D0 = ;, e
abbiamo cos completato la fase 3 del Metodo di Lagrange.
Passiamo ora alla ricerca dellinsieme dei punti stazionari del Lagrangiano, che
qui dato da
per ogni (x1 ; x2 ; x3 ; 1 ; 2 ) 2 R5 . Per trovare tali punti occorre risolvere il seguente
sistema (non lineare) di 5 equazioni
8
@L
>
> = 2x1 2 1 x1 2 = 0
>
>
@x1
> @L
< @x2 = 2x2 + 1 = 0
@L
@x3
= 2x3 2 = 0
>
> @L 2
>
> = 1 x1 + x2 = 0
> @
: @L1 = 1 x
@ 2 1 x3 = 0
e quindi
1 1
x2 = p
3
1 e x3 = 1 p
3
:
4 2
Vi allora lunico punto stazionario
1 1 1 2 2
p
3
;p 1; 1 p ;p 2; 2 + p
2 34 3
2 34 3
2
sicch
1 1 1
S= p3
;p
3
1; 1 p3
2 4 2
il che completa tutti le fasi del Metodo di Lagrange. In conclusione, si ha
1 1 1
S [ (C \ D0 ) [ (C D) = S = p
3
;p 1; 1 p
2 34 3
2
lunico candidato a essere soluzione locale del problema di ottimo (26.39). N
Capitolo 27
Programmazione matematica
821
822 CAPITOLO 27. PROGRAMMAZIONE MATEMATICA
molto e cace sia di grande eleganza perch basata su una combinazione di risultati
globali, quali i Teoremi di Weierstrass e di Tonelli, di natura topologica, e di risultati
locali di Calcolo dierenziale, quali il Teorema di Fermat e alcune sue varianti.
27.1.1 Anatomia di C
Per presentare il Metodo di eliminazione dobbiamo prima studiare pi da vicino
linsieme C. Indichiamo con G lintersezione
G = D \ int C
ossia linsieme dei punti interni di C ove f derivabile. Poich int C e D sono aperti,
anche G lo .
Poniamo, inoltre
F = C G;
cio F linsieme dei punti di C in cui f non derivabile. Se C chiuso, linsieme F
anchesso chiuso e contiene tutti i punti di frontiera di C ; cio @C F .
Per denizione, F \ G = ; e F [ G = C. Ogni punto di C appartiene quindi a G
oppure a F . In altre parole, fF; Gg una partizione di C. Quando f derivabile in
tutti i punti interni di C si ha G = int C e F @C. In questo caso (fortunato) la par-
tizione fF; Gg di C si riduce a quella tra punti interni e di frontiera (che appartengono
a C).
Illustriamo queste nozioni con alcuni esempi. Il primo tra essi particolarmente
importante.
Esempio 493 Data g : A R2 ! R e b 2 R, sia
C = fx 2 A : g (x) = bg (27.2)
linsieme di scelta identicato da un classico vincolo di uguaglianza. Linsieme C non
ha punti interni, e quindi int C = G = ;. Ne segue che F = C. N
P
Esempio 494 Sia f : Rn ! R data da f (x) = xi . La funzione derivabile su Rn ,
n n
ossia D = R . Se C = R P , si ha G = int C = C e F = @C = ;. Se, invece, C
n
linsieme chiuso x 2 R+ : xi 1 , si ha
n X o n X o
G = int C = x 2 Rn+ : xi < 1 e F = @C = x 2 Rn+ : xi = 1
segue che
( ) ( )
X
n X
n
n n
G= x2R :0< jxi j < 1 e F = f0g [ x2R : jxi j = 1
i=1 i=1
Anche qui f non derivabile su tutto C, ma solo su un suo sottoinsieme, per cui
G int C e @C F . N
(i) insiemi C con interno non vuoto; per i quali si pu applicare il Teorema di
Fermat;
A seconda del tipo di insieme di scelta, il Metodo di eliminazione assume una forma
diversa, bench lidea di base sia la stessa, ovvero combinare risultati di esistenza
globali alla Weiertrass/Tonelli e risultati dierenziali locali alla Fermat/Lagrange.
tale che linsieme C di scelta abbia interno non vuoto. Si pu applicare il Teorema di
Fermat e il Metodo di eliminazione si articola nelle seguenti fasi:
S = fx 2 G : rf (x) = 0g :
f (^
x) f (x) 8x 2 S [ F;
C =G[F e G \ F = ;;
6x5 6x = 0;
Fase 1: Si ha
S [ @C = f0g [ fx 2 Rn : kxk = 1g
Si ha
f (0) > f (x) = 1 8x 2 @C
e la fase 4 conferma che x^ = 0 lunica soluzione del problema di ottimo
S [ (C \ D0 ) [ (C D) (27.6)
3. Si costruisce linsieme
f (^
x) f (x) 8x 2 S [ (D0 \ C) [ (Dc \ C) (27.7)
allora x^ soluzione del problema di ottimo (27.5). In altre parole, i punti del-
linsieme (27.6) nei quali f ha valore massimo sono le soluzioni del problema di
ottimo.
Per capire il Metodo di eliminazione, si osservi che, come si visto nel Capitolo
26, grazie al Teorema 408 linsieme (27.6) consta dei punti di C che sono candidati
ad essere soluzioni locali del problema di ottimo (27.5). Daltra parte, per il Teorema
di Tonelli esiste almeno una soluzione del problema di ottimo. Tale soluzione deve
appartenere allinsieme (27.6) poich una soluzione del problema di ottimo ne , a
fortiori, soluzione locale. Quindi, le soluzioni del problema ristrettodi ottimo
sono anche le soluzioni del problema (27.5) di ottimo. Ma le soluzioni del problema
(27.8) sono i punti x^ 2 S [ (D0 \ C) [ (Dc \ C) per cui vale la (27.7). Esse sono
quindi soluzioni del problema (27.5) di ottimo, come aerma la fase 3 del Metodo di
eliminazione.
2
Si osservi che questi punti x soddisfanno sicuramente il vincolo e quindi si ha sempre S C D0 ;
non occorre quindi vericare se per un punto x 2 S si abbia anche x 2 C.
828 CAPITOLO 27. PROGRAMMAZIONE MATEMATICA
Vale ancora quanto osservato nella Sezione 27.2.2: quando nella prima fase del
Metodo di eliminazione si usa il Teorema di Weiertrass, come sottoprodotto si ot-
tengono anche i punti di minimo globale, ossia i punti x 2 C che risolvono il problema
speculare minx f (x) sub x 2 C = (gi (x) = bi 8i = 1; :::; m).
sicch i punti (0; 1) e (0; 1) sono soluzioni del problema di ottimo (27.9). N
e quindi linsieme (f t) compatto e non vuoto per t 2 (0; 1]. Per il Teorema di
Tonelli, f possiede almeno un punto di massimo su C, e ci completa la prima fase
del Metodo di eliminazione.
NellEsempio 486 il Metodo di Lagrange aveva mostrato che
1 1 1
S [ (C \ D0 ) [ (C D) = ; ; :::;
n n n
Ne segue che
q q
3
(f t) \ C [0; lg t] lg t; lg3 t 8t 2 (0; 1]
Linsieme
C = x = (x1 ; x2 ) 2 R2 : x1 = x2
non compatto e la funzione f non coerciva su C. Infatti
; se t > 0
(f t) \ C =
C se t 0
Ne segue che non valgono le ipotesi del Teorema di Tonelli, e quindi la prima fase del
Metodo di eliminazione fallisca e il Metodo non si pu perci applicare al problema
(27.12) di ottimo.
Daltra parte, immediato vericare che f (x) = 0 per ogni x 2 C, e quindi ogni
punto di C soluzione del problema (27.12). Il Metodo di eliminazione non qui stato
in grado di risolvere un problema piuttosto banale di ottimo. N
Linsieme
C = x = (x1 ; x2 ; x3 ) 2 R3 : x21 + x22 = 1 e x1 + x2 x3 = 1
ovviamente chiuso. Mostriamo che esso anche limitato, e quindi compatto. Per
gli x1 e x2 tali che x21 + x22 = 1 si ha x1 ; x2 2 [ 1; 1], mentre per gli x3 tali che
x3 = x1 + x2 1 e x1 ; x2 2 [ 1; 1] si ha x3 2 [ 3; 1]. Ne segue che
C [0; 1] [0; 1] [ 3; 1]
e perci linsieme C limitato. In conclusione C compatto, il che completa la prima
fase del Metodo di eliminazione poich la funzione obiettivo f continua (si noti che
qui vale il Teorema di Weierstrass).
NellEsempio ?? il Metodo di Lagrange aveva mostrato che
4 3 4 4 3 7
S [ (C \ D0 ) [ (C D) = ; ; ; ; ;
5 5 5 5 5 5
il che completa la fase 2 del Metodo di eliminazione. Si ha:
4 3 4
f ; ; = 8,
5 5 5
4 3 7 49
f ; ; =
5 5 5 5
3
Questa seconda via che usa il Lagrangiano involuta rispetto allo studio diretto della successione
xn = (n; n), ma vi sono casi in cui utile prima ridursi a S [ (D0 \ C) [ (C D), per poi stabilire
che nessuno di questi candidati eettivamente soluzione del problema.
832 CAPITOLO 27. PROGRAMMAZIONE MATEMATICA
e ci implica che
4 3 4
; ;
5 5 5
la soluzione del problema di ottimo (27.14), mentre
4 3 7
; ;
5 5 5
il che mostra che C limitato. Come nellesempio precedente, anche qui le ipotesi del
Teorema di Weierstrass sono soddisfatte e questo completa la prima fase del Metodo
di eliminazione.
NellEsempio ?? il Metodo di Lagrange aveva mostrato che
n p o
S [ (C \ D0 ) [ (C D) = 8; 2; 0 ; (0; 0; 0)
ilpche implica che (0; 0; 0) la soluzione del problema di ottimo (27.15), mentre
8; 2; 0 punto di minimo (globale) vincolato. N
Linsieme
C = x = (x1 ; x2 ; x3 ) 2 R3 : x21 x2 = 1 e x1 = x3
chiuso, ma non limitato p (e quindi non compatto). Infatti, si consideri la succes-
sione fxn g data da xn = 1 + n; n; 1 n . Essa appartiene a C, ma kxn k ! +1 e
quindi non esiste alcun intorno in R3 che possa contenerla.
Daltra parte, grazie alla Proposizione 290 la f coercitiva e continua, e quindi vale
il Teorema di Tonelli. La prima fase del Metodo di eliminazione quindi soddisfatta.
NellEsempio ?? il Metodi Lagrange aveva mostrato che
1 1 1
S [ (C \ D0 ) [ (C D) = p
3
;p 1; 1 p
2 34 3
2
Linsieme (27.6) un singoletto e ci permette subito di concludere che il punto
1 1 1
p
3
;p 1; 1 p
2 34 3
2
la soluzione del problema di ottimo (27.16). Si noti come in questo caso il metodo
di eliminazione non dica alcunch sullesistenza di eventuali punti di minimo globale
vincolato in quanto la prima fase si basa sul Teorema di Tonelli e non sul Teorema di
Weierstrass. N
Si osservi da ultimo che non abbiamo parlato di condizioni del secondo ordine da
usare nella risoluzione di problemi di ottimo vincolato, mentre nella Sezione 20.4 del
Capitolo 18 avevamo parlato in dettaglio di tali condizioni nei problemi senza vincoli.
Lomissione non casuale ed dovuta al cambiamento di prospettiva, da locale a
globale, fatta in questo capitolo rispetto al Capitolo 18. Le condizioni del secondo
ordine sono infatti di poco interesse per la ricerca di punti di massimo globale, ed il
loro contributo marginale a tale ricerca di solito pi che compensato dalla pesantezza
dei calcoli che esse comportano. Per tale ragione non ne parliamo.
27.3 Applicazioni
27.3.1 Problema del consumatore
Consideriamo il classico Problema del consumatore (17.7), ossia il problema di ottimo
Y
n
u (x1 ; x2 ; ; xn ) = xi i
i=1
Pn
con ogni i >0e i=1 i = 1 soddisfa lipotesi, con A = D = int A = Rn++ .
La prima fase del Metodo segue dal Teorema 294, unapplicazione del Teorema di
Weierstrass che aveva mostrato che il Problema del consumatore ha soluzione. Per la
seconda fase, nella Sezione 26.5 del Capitolo 26 il Metodo di Lagrange aveva mostrato
che linsieme (27.6) per il Problema del consumatore
S [ ((A int A) \ C)
Le soluzioni del Problema del consumatore sono quindi i panieri x^ 2 S[((A int A) \ C)
tali che
u (^
x) u (x) 8x 2 S [ ((A int A) \ C)
In altre parole, occorre confrontare tra loro le utilit che si ottengono con i punti
stazionari in S e con i punti di frontiera che soddisfano il vincolo in (A int A) \ C. Il
loro confronto richiede il calcolo dei loro valori e perci il Metodo tanto pi e cace
quanto pi piccolo linsieme S [ ((A int A) \ C).
Come s visto nel Capitolo 17, quando la soluzione del Problema del consumatore
unica, la indichiamo con x^ (p; I) per evidenziarne la dipendenza da prezzi e reddito
ed essa determina la funzione di domanda D : Rn++ R+ ! Rn denita come
I (1 )I
S= ;
p1 p2
I (1 )I
x= ;
p1 p2
27.3. APPLICAZIONI 835
Il confronto tra gli Esempi 488 e 508 evidenzia la potenza del Metodo di elim-
inazione: luso dei moltiplicatori di Lagrange ci aveva consentito di individuare un
unico candidato in Rn++ a rappresentare la soluzione del Problema del consumatore,
senza per poter concludere alcunch di denitivo circa la sua natura (se massimo,
minimo o altro) n tantomeno sulla sua unicit, che una propriet importantissima
delle soluzioni. Tutto ci stato svelato dal Metodo di eliminazione, che ha mostrato
come il candidato eettivamente lunica soluzione del Problema del consumatore.
Nel Teorema 296 della Sezione 17.6 avevamo visto condizioni nelle quali il problema
ha soluzione. Inquadriamo ora tale risultato nel Metodo di eliminazione della Sezione
27.2.1.
Assumiamo che:
(E.1) le funzioni di ricavo e di costo siano continue su R+ e derivabili su (0; +1), con
c (0) > r (0).
(E.2) c (y) ! +1 e
r (y)
<1 (27.20)
c (y)
per ogni y su cientemente grande.
836 CAPITOLO 27. PROGRAMMAZIONE MATEMATICA
Fase 2: La (27.20) implica (y) ! 1 (come si era visto nella dimostrazione del
Teorema 296). La funzione continua quindi coerciva su R+ .
Fase 3: Si ha
0
S = fx 2 (0; +1) : (y) = 0g = fx 2 (0; +1) : r0 (y) = c0 (y)g
Poich (0) < 0 e (y) ! 1, per il Teorema di Darboux, esiste y > 0 tale che
(y) = (0). Per il Teorema di Rolle, S =
6 ;.
Fase 4: Si ha
f (y) : y 2 S [ F g = f (y) : y 2 S [ f0gg
Le soluzioni del Problema sono le yb 2 S [ F tali che
(b
y) (y) 8y 2 S [ f0g
c (y) y2 per y ! +1
Per esempio, c (y) = + y 2 , con > 0, soddisfa queste condizioni, come anche
p
c (y) = + y 2 y.
Grazie a queste ipotesi, lassunzione (E.1) ovviamente soddisfatta. Verichiamo
la (E.2):
r (y) py p
2
= !0
c (y) y y
Quindi, entrambe le condizioni (E.1) e (E.2) sono soddisfatte. Il Problema del pro-
duttore dunque risolvibile col Metodo di eliminazione. In particolare, si ha
npo
S=
2
Poich
(p=2) = p2 =2 > (0) = 0,
possiamo concludere che yb = p=2 lunica soluzione. N
27.4. PROGRAMMAZIONE DIFFERENZIALE CONCAVA 837
Il prossimo, magico, risultato che la ragione per cui la concavit cos importante
nella Programmazione. una conseguenza della disuglianza
Dim. Sia x^ 2 int C tale che rf (^x) = 0. Sia U un intorno qualsiasi incluso in int C.
Poich f concava su U , grazie alla (27.22) si pu scrivere
f (y) x) + rf (^
f (^ x) (y x^) ; 8y 2 U .
Vediamo ora la ratio del Metodo concavo. Per il Teorema 411, tutti i punti
stazionari in S sono soluzioni, il che giustica la costruzione di S nella fase 2 nonch
quanto aermato nella parte (a) della fase 3.
Daltra parte, il Teorema 411 implica che, se un punto di G soluzione del problema
di ottimo, esso stazionario. Quindi, solo tra i punti di frontiera vi possono essere altre
soluzioni del problema. Ecco perch la parte (b) della fase 3 si concentra sullinsieme
di non derivabilit F per cercare tali altre eventuali soluzioni. Per vericare se un
punto x^ 2 F soluzione basta confrontarne il valore con un y 2 S qualsiasi, che gi
sappiamo essere soluzione. Ci quanto prescrive la parte (b) della fase 3.
Naturalmente, se f strettamente concava e S 6= ;, lunica soluzione appartiene a S
ed quindi superuo considerare linsieme di non derivabilit F , con ci semplicando
non poco il Metodo concavo. Al riguardo, si osservi che nelle applicazioni economiche
la funzione obiettivo f spesso strettamente concava perch, come gi osservato,
lunicit della soluzione molto importante.
Il Metodo concavo si giova delle propriet di ottimalit delle funzioni concave, che
gi stabiliscono un legame tra propriet locali e globali. Si pensi al Teorema 292 che
assicura che, per le funzioni concave, i massimi locali sono sempre globali . Il Metodo
concavo si basa questi aspetti glocali propri della concavit per usare il Calcolo
dierenziale nella ricerca delle soluzioni di problemi di ottimo dierenziali concavi.
Gli aspetti glocali della concavit rendono superuo luso dei risultati globali di
esistenza delle funzioni coercive, sui quali si era basato il Metodo di eliminazione.
Fase 1: Quindi, G = C e F = ;.
Sia, invece, C = [1; 2]. In questo caso S = ; e quindi il Metodo concavo non
applicabile. Tuttavia, si vede subito che x^ = 1 lunica soluzione del problema
( 27.23). Il Metodo non sostituisce quindi il buon senso. N
27.5. ESEMPI 839
Esempio 511 Torniamo alla funzione f (x) = 1 kxk2 dellEsempio 497, con C = Rn .
La funzione strettamente concava e possiamo quindi risolvere col Metodo concavo il
problema di ottimo
max 1 kxk2 sub x 2 Rn (27.24)
x
prima risolto col Metodo di eliminazione (nonch a occhio).
Fase 1: Si ha G = C e F = ;, come gi visto.
Fase 2: Si ha S = f0g :
Fase 3: Il punto stazionario x^ = 0 soluzione del problema (27.24) ed, essendo f
strettamente concava, essa lunica soluzione. Ci completa la fase 3.
Quando applicabile, il Metodo concavo quindi pi potente di quello di elimi-
nazione. N
27.5 Esempi
27.5.1 Problema del produttore
Se assumiamo che r sia concava e c convessa, il Problema del produttore
max (y) sub y 2 R+
y
che caratterizza il Metodo dei minimi quadrati abbia ununica soluzione x purch
(A) = n. Per illustrare la portata del Metodo di eliminazione, mostriamo come il
risultato sia ottenibile anche con tale Metodo, che in aggiunta permette di determinare
la forma della soluzione x .
A tal ne studiamo lequivalente Problema di ottimo (17.19), cio
Fase 1: Si ha G = R e F = ;.
della (27.26).
27.5. ESEMPI 841
Dalla condizione del primo ordine segue che lunico punto stazionario
1
x = A? A A? b
cio Pn
ai b i
x = Pi=1
n 2
i=1 ai
quando n = 1. Quindi, S = fx g.
Esempio 513 Nel caso n = 1 la funzione di produzione lineare cercata dal contadino
della Sezione 17.8.2 Pn
^ xi yi
f (x) = x = Pi=1 n 2
x (27.27)
i=1 xi
con termine di errore Pn
xi yi
yi Pi=1
n 2
xi 8i = 1; :::; n
i=1 xi
In generale tale funzione f : Rn ! R
1
f (x) = X ? X X ?Y x
27.5.3 Assicurazione
Torniamo al Problema di assicurazione (17.15)
max EP u (f ) sub 0
(1 p)
u0 (w1 + )= u0 (w1 )
p (1 )
Poich
(1 p)
R 1 () Rp (27.29)
p (1 )
occorre distinguere tre sottocasi:
1. = p: il premio equo. In tal caso, grazie alla (27.29) la condizione del primo
ordine diventa
u0 (w1 + ) = u0 (w1 ) (27.30)
Essendo u00 < 0, la deriva prima u0 strettamente decrescente, e quindi
u0 (w1 + ) = u0 (w1 ) () w1 + = w1 () =
2. > p: il premio iniquo. Supponiamo che la funzione u sia tale che esista
un unico punto stazionario che risolva tale condizione6 , ossia S = f g. La
(27.29) implica
(1 p)
>1
p (1 )
cosicch dalla condizione del primo ordine segue che
3. < p: il premio superequo. Procedendo come nel caso precedente, si mostra che
lunico punto stazionario prevede una sovracopertura, con risarcimento superiore
al danno.
6
Nel caso equo questa richiesta superua perch = lunico punto stazionario per ogni u.
27.5. ESEMPI 843
e
EP u (f0 ) = u (w1 ) (1 p) + u (w1 )p
Poich u strettamente concava, si ha
Tirando le la, lassicurato sceglier una copertura piena quando il premio equo,
eliminando in tal modo il rischio perch latto f pari a w1 in ogni stato del
mondo. Per il nostro contadino, che grandini o meno il suo raccolto gli garantir il
reddito certo w1 .
Quando, invece, il premio iniquo (ossia il premio per ogni euro di copertura
maggiore della probabilit del sinistro) e la polizza ha quindi un prezzo pi alto, leven-
tuale soluzione comporta una copertura solo parziale: in caso di sinistro lassicurato
incorrer in un danno. Il rischio permane, sebbene attenuato dalla parziale copertura
assicurativa. Il contrario vale quando il premio superequo.
844 CAPITOLO 27. PROGRAMMAZIONE MATEMATICA
Capitolo 28
Applicazione: investimento
dove c1i = c (i) per ogni stato ! i . Grazie a tale identicazione, la decisione di Lorenzo
tra coppie
(c0 ; c1 ) 2 R+ Rm
+
di consumo oggi e domani. Supponiamo che egli ordini le coppie secondo la funzione
obiettivo V : R+ Rm + ! R data da
dove
P = (P1 ; P2 ; :::; Pm ) 2 Rm
+
X
m
EP u (c1 ) = u (c1i ) Pi
i=1
845
846 CAPITOLO 28. APPLICAZIONE: INVESTIMENTO
u0 (c1 )
u0 (c0 )
p = (p0 ; p1 ) 2 R++ Rm
++
B (p; I) = (c0 ; c1 ) 2 R+ Rm
+ : p0 c0 I0 e p1i c1i I1i per ogni i
consta di tutte le coppie (c0 ; c1 ) che Lorenzo pu acquistare dati i prezzi del bene e i
suoi redditi presenti e futuri.
1
Grazie allormai solita identicazione tra variabili aleatorie e vettori.
28.2. CARPE DIEM 847
Una coppia c^ = (^
c0 ; c^1 ) 2 B (p; I) ne soluzione quando
V (^
c) V (c) 8c = (c0 ; c1 ) 2 B (p; I)
Proposizione 412 (Carpe diem) Sia u : R+ ! R strettamente crescente e contin-
ua. Il Problema (28.3) ha ununica soluzione c^ = (^
c0 ; c^1 ) data da
I0 I1i
c^0 = e c^1i = 8i = 1; :::; m
p0 p1i
In altre parole, sia oggi sia domani Lorenzo esaurisce tutto il suo reddito in con-
sumo: carpe diem! La struttura del problema fa s che per Lorenzo sia ottimo consid-
erare in modo del tutto separato loggi e il domani, e spendere in ognuno di essi tutto
il suo reddito. In un certo senso, la proposizione ricorda la Legge di Walras.
y = (y1 ; :::; ym ) 2 Rm
I0 p0 c0 0 (28.4)
in reddito di domani
I0 p0 c0
yi 8i = 1; :::; m (28.5)
py
se si vericher li-esimo stato. Infatti
I0 p0 c0
(28.6)
py
la quantit di titolo y che linvestitore pu acquistare al prezzo py avendo risparmiato
I0 p0 c0 . Tale quantit pagher la somma (28.5) se si vericher lo stato ! i .
Per linvestitore il risparmio equivale a minor consumo oggi per nanziare, col
pagamento del titolo, maggior consumo domani. Anche loperazione opposta per
legittima: egli pu decidere di consumare oggi pi di quanto lattuale reddito gli
consentirebbe, sicch
I0 p0 c0 < 0
nanziando tale maggior consumo con la vendita di quantit (28.6) del titolo y, il che
lobbligher domani a pagare la somma (28.5) se si vericher lo stato ! i . Le cambiali
sono un esempio di tale titolo nanziario.
del titolo y che egli detiene dopo aver operato sul mercato (in acquisto o in vendita),
linsieme di bilancio diventa
B (p; py ; I) = (c0 ; c1 ) 2 R+ Rm
+ : p0 c0 + py b = I0 e p1i c1i I1i + byi per ogni i
Linsieme B (p; py ; I) composto da tutte le coppie (c0 ; c1 ) di consumo che, dati i prezzi
p e i redditi I, linvestitore pu nanziare grazie allesistenza di un mercato perfetto
del titolo y di prezzo py .
Una coppia c^ = (^
c0 ; c^1 ) 2 B (p; py ; I) soluzione del problema di ottimo se
V (^
c) V (c) 8c = (c0 ; c1 ) 2 B (p; py ; I)
dove ^b = I0 p0 c^0 .
(p; py ; I) = (c0 ; c1 ) 2 R+ Rm
+ : p0 c0 + py b = I0 e p1i c1i = I1i + byi per ogni i
segue che
I0 I1i
c0 0 () b e ci1 0 () b :
py py
Ponendo
I0 I11 I1m
a= e a = max ; :::;
p0 py py
si ha a 0 a e possiamo quindi denire la funzione scalare f : [a; a] ! R come
I0 py b X
m
I1i + byi
f (b) = u + u Pi 8b 2 [a; a]
p0 i=1
p1i
Il problema di ottimo
max f (b) sub b 2 [a; a] (28.10)
b
Dim. Si ha
f ^b f (b)
! !
I0 py^b X
m
I1i + ^byi
() u + u Pi
p0 i=1
p1i
I0 py b Xm
I1i + byi
u + u Pi
p0 i=1
p1i
X
m X
m
() u (^
c0 ) + u (^
c1i ) Pi u (c0 ) + u (c1i ) Pi
i=1 i=1
come desiderato.
Grazie al lemma, possiamo studiare il problema di ottimo (28.10) che ha una fun-
zione obiettivo scalare. Tale funzione eredita le propriet di dierenziabilit e concavit
della funzione di utilit u. In particolare, facile vericare che f dierenziabile su
(a; a) se u dierenziabile su (0; +1). Inoltre:
28.4. RISOLUZIONE DEL PROBLEMA 851
I0 py ( b + (1 ) b0 ) X
m
I1i + ( b + (1 ) b0 ) y i
f ( b + (1 ) b0 ) = u + u Pi
p0 i=1
p1i
I0 py b (1 ) py b 0 X
m
I1i + byi + (1 ) b0 y i
= u + u Pi
p0 i=1
p1i
I0 + (1 ) I0 py b (1 ) p y b0
= u
p0
X
m
I1i + (1 ) I1i + byi + (1 ) b0 y i
+ u Pi
i=1
p1i
I0 py b I0 p y b0
= u + (1 )
p0 p0
X
m
I1i + byi I1i + b0 yi
+ u + (1 ) Pi
i=1
p1i p1i
I0 py b I0 p y b0
> u + (1 )u
p0 p0
!
X
m
I1i + byi X
m
I1i + b0 yi
+ u + (1 ) u Pi
i=1
p1i i=1
p1i
= f (b) + (1 ) f (b0 )
come desiderato.
I0 py b py Xm
I1i + byi yi
f 0 (b) = u0 + u0 Pi = 0
p0 p0 i=1
p1i p1i
cio
I0 py b py X
m
I1i + byi yi
0
u = u0 Pi (28.11)
p0 p0 i=1
p1i p1i
852 CAPITOLO 28. APPLICAZIONE: INVESTIMENTO
n o
Se esiste ^b 2 (a; a) per il quale vale la (28.11) si ha S = ^b . Diversamente, S = ; e
il Metodo si arresta.
n o
Fase 3: Sia S non vuoto, cioe S = ^b . Il punto ^b soluzione del problema. I punti
a e a sono anchessi soluzioni se, rispettivamente, f (a) = f ^b e f (a) = f ^b .
quindi decisivo vericare se esiste ^b 2 (a; a) che soddisfa la condizione del primo
ordine (28.11).
c2
u (c) =
2
e si ponga p0 = p1i per ogni i. La condizione (28.11) diventa
X
m
(I0 py b) py = (I1i + byi ) yi Pi
i=1
cio
EP (y 2 ) + p2y
b=
I0 py EP (I1 y)
Ne segue che b 2 (a; a) se e solo se
EP (y 2 ) + p2y
a< <a
I0 py EP (I1 y)
Quando il prezzo del bene lo stesso oggi e domani, ossia p0 = p1i per ogni i,
luguaglianza diventa
X
m
u0 (^
c1i ) u0 (^
c1 )
py = y i Pi = EP y
i=1
u0 (^
c0 ) 0
u (^c0 )
28.5. PREZZI DEI TITOLI 853
Supponiamo che, invece di un unico titolo, esista un listino L di n titoli che generano
un mercato nanziario M . Per il Teorema di rappresentazione della nanza della
Sezione 14.10, esiste un fattore stocastico di sconto 2 Rm ++ tale che
py = EP ( y) 8y 2 L
Vale il fondamentale:
u0 (^
c1i )
i = 0
8i = 1; :::; m (28.12)
u (^c0 )
Dim. Mostriamo il risultato quando L consti di m titoli (tanti quanti gli stati del
mondo) linearmente indipendenti. Per ogni y 2 L si ha
X
m
u0 (^
c1i ) X
m X
m
u0 (^
c1i )
y i Pi = i yi Pi () i Pi y i = 0
i=1
u0 (^
c0 ) i=1 i=1
u0 (^
c0 )
u0 (^
c1i )
0 i Pi = 0 8i = 1; :::; m
u (^c0 )
cio
u0 (^
c1i )
= i 8i = 1; :::; m
u0 (^
c0 )
come desiderato.
u0 (^
c1 )
=
u0 (^
c0 )
nel consumo ottimo c^. Ci vale per ogni investitore che abbia la funzione obiettivo
V (c0 ; c1 ) = u (c0 )+ EP u (c1 ), indipendentemente da quale sia la sua specica funzione
di utilit istantanea u. In altre parole:
854 CAPITOLO 28. APPLICAZIONE: INVESTIMENTO
(i) tutti gli investitori con funzioni obiettivo di tale forma hanno lo stesso saggio
marginale di sostituzione intertemporale;
(ii) tale saggio, che soggettivo, uguale al fattore stocastico di sconto del mercato
nanziario.
Chiudiamo osservando che vale lipotesi di costanza dei prezzi p0 = p1i quando il
bene deperibile lunico esistente nelleconomia. Consideriamo per esempio unisola
tropicale popolata da agenti che hanno a disposizione un albero che la mattina produce
una data quantit di un frutto, perfettamente omogeneo. Tale frutto deperisce nellarco
della giornata ed lunico bene presente nellisola.
In tale economia con un unico bene si ha p0 = p1i = 1 perch sia oggi sia domani
le quantit del frutto, che perfettamente omogeneo, si scambiano uno a uno. Le
quantit I0 e I1 sono le dotazioni del bene che lagente ha oggi e domani, ossia le
quantit del frutto che il loro albero produce. Il titolo nanziario unattivit reale
che paga in quantit di bene: py la quantit di frutto che occorre pagare oggi per
avere diritto a ricevere domani le quantit y = (y1 ; :::; ym ) di frutto a seconda dello
stato del mondo che si verica.
Le economie mono-bene sono spesso usate per la loro semplicit, che consente
di isolare fenomeni economici di interesse nella loro essenzialit; per esempio, per esse
vale il Teorema 416 senza altra ipotesi che la completezza del mercato.
Parte VII
Appendici
855
Appendice A
Richiami di trigonometria
A.1 Generalit
Si chiama abitualmente circonferenza trigonometrica una circonferenza con il centro
nellorigine degli assi cartesiani e di raggio 1, orientata in senso antiorario e percorsa
a partire dal punto sul semiasse positivo delle ascisse (cio dal punto di coordinate
(1; 0)).
y
1.5
0.5
(1,0)
0
O x
-0.5
-1
-1.5
-2
-2 -1 0 1 2
Circonferenza trigonometrica.
manifesto che ogni punto sulla circonferenza determina un angolo delimitato dal
semiasse positivo delle ascisse e dalla retta congiungente il punto con lorigine degli assi
e, viceversa, che ogni angolo determina un punto sulla circonferenza; equivalentemente
anzich intendere la corrispondenza tra punti e angoli si pu intenderla tra punti e archi
di circonferenza.
857
858 APPENDICE A. RICHIAMI DI TRIGONOMETRIA
y
1.5
P
0.5
'
0
O A x
-0.5
-1
-1.5
-2
-2 -1 0 1 2
0
Il punto P genera langolo e larco :
(i) Angoli e :
(ii) Angoli e 2
:
(iii) Angoli e 2
+ :
(iv) Angoli e :
sin ( ) = sin ; cos ( )= cos :
(v) Angoli e + :
sin ( + ) = sin ; cos ( + ) = cos :
A.3 Perpendicolarit
La circonferenza trigonometrica formata dai punti x 2 R2 di norma unitaria, cio
kxk = 1. Quindi, qualsiasi punto x 2 R2 si riporta su tale circonferenza dividendolo
per la sua norma kxk poich kx= kxkk = 1. Ne segue che
x2 x1
sin = e cos =
kxk kxk
ovvero
x = (kxk cos ; kxk sin )
Tale rappresentazione trigonometrica del vettore x detta polare, e le componenti
kxk cos e kxk sin sono dette coordinate polari.
Siano x e y due vettori del piano R2 che determinano gli angoli e . Grazie alla
(A.2) si ha:
cio
x y
= cos ( )
kxk kyk
dove langolo che dierenza degli angoli determinati dai due punti. Tale
angolo retto, cio i vettori x e y sono perpendicolari, quando
x y
= cos = 0
kxk kyk 2
ossia se e solo se x y = 0. In altre parole, due vettori del piano R2 sono perpendicolari
quando il loro prodotto interno nullo.
862 APPENDICE A. RICHIAMI DI TRIGONOMETRIA
Appendice B
Elementi di logica
Ci limiteremo ai tratti veramente essenziali della logica, tanto pi che le sue operazioni
di base sono straordinariamente simili alle operazioni tra insiemi e ne condividono le
propriet.
Chiameremo proposizione ogni aermazione che possa essere o vera o falsa1 . In-
dicheremo una proposizione con lettere quali p; q; : : :.
Sono dunque escluse tutte le aermazioni ancora incerte, come per esempio do-
mani piover. Indicheremo per brevit con 1 e 0 rispettivamente la verit o la falsit
di una proposizione: essi sono detti valori di verit.
Le pi semplici operazioni tra proposizioni sono:
(i) Negazione. Sia p una proposizione; si indica con :p, e si legge non p, la
proposizione che vera quando p falsa e che falsa quando p vera.
Possiamo sintetizzare le tre denizioni in tabelle che indicano i vari valori di verit2 :
1
Tertium non datur.
La dicotomia vero-falsorisale al mondo greco, ma negata da molte losoe orientali: il monaco
Mumon, nel suo celebre Mumonkhan, nel quale sosteneva che la non conoscenza insensata; la
conoscenza un inganno, aermava che la via (per lilluminazione) non pu essere descritta con
parole e nemmeno con non parole.
2
I valori di verit di p ^ q e di p _ q sono rispettivamente il minimo e il massimo dei valori di verit
di p e di q.
863
864 APPENDICE B. ELEMENTI DI LOGICA
p q p^q p_q
1 1 1 1
p :p 1 0 0 1
1 0 0 1 0 1
0 1 ; 0 0 0 0
p q p =) q
1 1 1
1 0 0
0 1 1
0 0 1
865
p q p =) q :p :q :p =) :q
1 1 1 0 0 1
1 0 0 0 1 0
0 1 1 1 0 1
0 0 1 1 1 1
provarlo basta mostrare che P (1) vera e che P (k) =) P (k + 1), cio che la
propriet vera per n = 1 e che, se vera per n = k, allora vera anche per n = k + 1.
In tal modo P (1) =) P (2), P (2) =) P (3), P (3) =) P (4) e cos via e
dunque la propriet sempre vera4 (essendolo P (1)).
Come esempi vediamo il calcolo di alcune somme che ricorrono abbastanza spesso.
(i) Sia
Xn n (n + 1)
1+2+ +n= s= :
s=1 2
Per n = 1 la propriet banalmente vera poich
1 (1 + 1)
1=
2
Sia ora vera per n = k, cio
Xk k (k + 1)
s=
s=1 2
Dobbiamo provare che vera anche per n = k + 1, cio che
Xk+1 (k + 1) (k + 2)
s= :
s=1 2
Infatti5
Xk+1 Xk k (k + 1) (k + 1) (k + 2)
s= s + (k + 1) = +k+1= :
s=1 s=1 2 2
In particolare, la somma dei primi n numeri dispari vale n2 :
Xn Xn Xn n (n + 1)
(2s 1) = 2 s 1=2 n = n2 :
s=1 s=1 s=1 2
(ii) Sia
Xn
n (n + 1) (2n + 1)
12 + 22 + + n2 = s2 = :
s=1 6
Per n = 1 la propriet banalmente vera poich
1 (1 + 1) (2 + 1)
12 =
6
4
Ci sono tanti soldati tutti in la. Il primo ha la scarlattina destra, una rara forma di scarlattina
che contagia istantaneamente chi a destra del malato: tutti la prendono perch il primo lattacca
al secondo, il secondo al terzo, ecc..
5
Unaltra dimostrazione si limita a osservare che la somma del primo e dellultimo addendo n+1,
la somma del secondo e del penultimo ancora n + 1, ecc.. Ci sono n=2 coppie e quindi la somma
(n + 1) n=2.
867
(iii) Sia
!2
Xn X
n
n2 (n + 1)2
3 3 3 3
1 +2 + +n = s = s = :
s=1
s=1
4
Per n = 1 la propriet banalmente vera poich
12 (1 + 1)2
3
1 = :
4
Procedendo come sopra si ha
Xk+1 Xk k 2 (k + 1)2 3
s 3
= 3
s + (k + 1) = + (k + 1)3 =
s=1 s=1 4
2 2
(k + 1) [k + 4 (k + 1)] (k + 1)2 (k + 2)2
= = :
4 4
Presentiamo qui i tratti essenziali delle coniche, ovvero delle curve esprimibili con
unequazione di secondo grado in due variabili. Si tratta delle curve pi celebri: ellisse
(in particolare circonferenza), iperbole e parabola. Esse sono dette coniche o sezioni
coniche perch si possono ottenere sezionando un doppio cono (illimitato).
Costruzione della parabola come Costruzione dellellisse e della Costruzione delliperbole com
sezione conica. circonferenza come sezioni coniche. conica.
869
870 APPENDICE C. CENNI SULLE CONICHE
C.1 I classici
Denizione 156 Si dice circonferenza il luogo dei punti equidistanti da un punto
sso, detto centro.
y
1.5
0.5
0
O x
-0.5
-1
-1.5
-2
-2 -1 0 1 2
x2 + y 2 = r 2 :
Denizione 157 Si dice ellisse (o ellissi) il luogo dei punti per i quali costante la
somma delle distanze da due punti ssi detti fuochi.
Prendendo il riferimento cartesiano in modo che i due fuochi siano sullasse delle
ascisse e che lasse delle ordinate passi per il loro punto medio, i fuochi hanno coordi-
nate ( b; 0) e (b; 0). Detta 2c > 2b = 0 la somma costante delle distanze di un punto
dellellisse dai due fuochi, lequazione
q q
(x + b) + y + (x b)2 + y 2 = 2c
2 2
C.1. I CLASSICI 871
che si pu riscrivere
c2 b2 x 2 + c 2 y 2 = c 2 c 2 b2
e inne, ponendo c2 b2 = a2 e dividendo per a2 c2 ,
x2 y 2
+ 2 =1
c2 a
che detta equazione canonica dellellisse.
4 y
3
2
a
1
b
0
O c x
-1
-2
-3
-4
-6 -4 -2 0 2 4 6
Graco dellellisse.
Il rapporto p
b c 2 a2
= ;
c c
certamente compreso tra 0 e 1, detto eccentricit dellellisse. Quando a = c, col
che b = 0 e i due fuochi diventano un sol punto, si ritrova una circonferenza (la cui
eccentricit 0).
Denizione 158 Si dice iperbole il luogo dei punti per i quali costante la dierenza
delle distanze da due punti ssi detti fuochi.
Prendendo il riferimento cartesiano in modo che i due fuochi siano sullasse delle
ascisse e che lasse delle ordinate passi nel loro punto medio, i fuochi hanno coordinate
( b; 0) e (b; 0). Detta 2c, 0 < 2c < 2b, la dierenza costante delle distanze di un punto
delliperbole dai due fuochi, lequazione
q q
(x + b)2 + y 2 (x b)2 + y 2 = 2c
872 APPENDICE C. CENNI SULLE CONICHE
che si pu riscrivere
c2 b2 x 2 + c 2 y 2 = c 2 c 2 b2
e inne, ponendo c2 b2 = a2 e dividendo per a2 c 2 ,
x2 y2
=1
c2 a2
che detta equazione canonica delliperbole.
6
y
b
0
c x
O
-2
-4
-6
-8 -6 -4 -2 0 2 4 6 8
Graco delliperbole.
Il rapporto p
b c 2 + a2
= ;
c c
certamente maggiore di 1, detto eccentricit delliperbole.
Le due rette di equazione
a ap 2 a ap 2
y= x c2 ; y= + x c2
c c c c
sono dette asintoti delliperbole. Si pu vedere infatti che la dierenza tra iperbole e
asintoto tende a zero per x ! 1: liperbole si avvicina indenitamente a ciascuno
dei due asintoti.
Quando i due asintoti sono tra loro perpendicolari, cio quando a = c, liperbole
detta equilatera: la sua equazione semplicemente
x2 y 2 = a2 :
Denizione 159 Si dice parabola il luogo dei punti equidistanti da un punto sso
detto fuoco e da una retta ssa detta direttrice.
C.2. LE CONICHE IN GENERALE 873
1.5 y
0.5
F
0
V x
-0.5
-1
-1.5
d
-2
-1 0 1 2 3 4
Prendendo il riferimento cartesiano in modo che il fuoco sia sullasse delle ascisse,
che la direttrice sia parallela allasse delle ordinate e che lorigine sia il punto medio tra
a a
fuoco e direttrice, il fuoco ha coordinate ; 0 e la direttrice ha equazione x = .
2 2
Lequazione (canonica) della parabola allora
r
a 2 a
x + y2 = x + ;
2 2
ovvero
y 2 = 2ax:
Denizione 160 Si dice conica il luogo dei punti del piano di equazione
Indicando con
a11 a12
A33 =
a12 a22
la sottomatrice ottenuta da A eliminando la terza riga e colonna, si possono riconoscere
i vari tipi di coniche.
DizionErio biograco
Archimede (Siracusa 287 a.C. circa 212 a.C.) considerato il maggior matematico
dellantichit e tra i pi grandi di tutti i tempi. Fu anche un grande ingegnere
del mondo classico, avendo applicato la matematica a numerosi problemi pratici e
inventato numerosi strumenti, quali lo specchio ustore, la pompa a spirale, e altri.
875
876 APPENDICE D. DIZIONERIO BIOGRAFICO
Daniel Bernoulli (Groninga 1700 Basilea 1782) Figlio di Johann, fu, oltre che
matematico, economista e naturalista. Avviato alla medicina, si occup invece di
varie altre discipline: importante il suo contributo, con lHydrodynamica del 1738,
alla dinamica dei uidi e suo il Teorema fondamentale dellidrodinamica.
Il suo Specimen theoriae novae de mensura sortis del 1738 una pietra miliare
nella storia della Teoria economica. In poche pagine, Bernoulli espone con straordi-
nario acume alcune delle idee fondamentali della Teoria dellutilit, tra cui il criterio
dellutilit attesa e il principio dellutilit marginale decrescente.
Jakob Bernoulli (Basilea 1654 1705) Matematico, della famiglia svizzera Bernoul-
li, originaria di Anversa, che cont non meno di sette studiosi di alto o altissimo livello.
Jakob Bernoulli svilupp il calcolo dierenziale, si occup di equazioni dierenziali e
fu il precursore del calcolo delle variazioni. Nel 1713 usc il volume postumo Ars con-
jectandi con una prima versione della legge dei grandi numeri, uno dei risultati centrali
del Calcolo delle probabilit.
877
Ernesto Cesro (Napoli 1859 - Torre Annunziata 1906) Matematico italiano, in-
segn a Napoli e Palermo. Svolse importanti ricerche in Analisi e in particolare nella
Teoria delle serie divergenti, nella quale introdusse il celebre criterio di convergenza
che porta il suo nome.
878 APPENDICE D. DIZIONERIO BIOGRAFICO
Jean Gaston Darboux (Nmes, 1842 Parigi 1917) Matematico francese, insegn
a Parigi. Diede importanti contributi alle equazioni dierenziali alle derivate parziali,
alla teoria delle supercie e a parecchie applicazioni meccaniche. Il suo nome legato
alla cosiddetta propriet di Darboux, secondo la quale una funzione continua denita su
un intervallo chiuso, assume tutti i valori compresi tra il suo minimo e il suo massimo.
Democrito (Abdera 460 a.C. circa 380 o 360 a.C. circa) Filosofo greco, allievo di
Leucippo. Ebbe interessi molto vasti: cosmologia, matematica, geograa e medicina.
Diogene Laerzio, nelle Vite dei loso, riporta pi di settanta sue opere, ma noi ne
possediamo solo frammenti.
La dottrina atomistica di Democrito, intesa a dare una spiegazione delluniverso
sico, aermava lesistenza del non-essere accanto allessere (il non-pieno, cio il vuoto,
e il pieno): nello spazio vuoto si possono muovere inniti corpuscoli invisibili chiamati
atomi.
In un certo senso fu il lontano precursore della teoria dellutilit, avendo egli con-
cluso che la ragione, capace di eettuare un calcolo tra i piaceri, la guida morale
della vita delluomo saggio.
Ren Descartes (Cartesio) (La Haye 1596 Stoccolma 1650) Filosofo e matem-
atico francese. Dopo aver studiato nel collegio dei Gesuiti di La Flche, si arruol
nellesercito di Maurizio di Nassau in Olanda, ove conobbe lo scienziato Beckman e
cominci a occuparsi di problemi di Fisica matematica. Trasferitosi in Germania, agli
ordini di Massimiliano, tra il 10 e l11 ottobre 1619 fece un sogno che determin un
nuovo corso di vita e di studi. Nel sogno intravide la possibilit di unimpostazione
unitaria dei problemi della Fisica matematica utilizzando rigorosamente il linguaggio
matematico. Dedic il resto della sua vita a tale progetto.
Nel 1637 pubblic il celebre Discorso sul metodo, fondamento della moderna im-
postazione scientica, e nel 1641 le Meditazioni.
Diofanto (Alessandria, II - III Secolo a.C.) il precursore della teoria dei numeri
e dellalgebra. Nella sua opera si riscontrano i primi esempi di simboli algebrici e di
simboli specici per le incognite e la trattazione della sottrazione, delle potenze e la
nozione di uguaglianza. Studi successioni numeriche che descrivono poligoni.
879
Ulisse Dini (Pisa 1845 1918) Matematico italiano, insegn alluniversit di Pisa.
Port a conclusione una radicale revisione dei fondamenti dellAnalisi matematica,
nello spirito di Cauchy e di Weierstrass. Diede molti contributi alla geometria dif-
ferenziale, alle equazioni dierenziali e alle funzioni analitiche. Il suo nome legato
al Teorema sullesistenza e unicit di una funzione implicita. Il teorema apparve per
la prima volta nelle dispense redatte dal Dini per il corso di Analisi reale dellanno
accademico 1877-1888.
Peter Gustav Lejeune Dirichlet (Dren 1805 Gottinga 1859) Matematico tedesco
formatosi a Parigi con Fourier, Poisson e altri. Insegn a Breslavia, Berlino e Gottinga:
qui succedette a Gauss e spos la sorella del compositore Felix Mendelssohn-Bartholdy.
Diede importanti contributi alla teoria dei numeri, al calcolo integrale, ai criteri di
convergenza per le serie e alla Fisica matematica.
Euclide (IV - III Secolo a.C.) Della sua vita non ci noto quasi nulla. Il suo lavoro
fondamentale, gli Elementi, in tredici libri (i primi quattro sulla geometria nel piano, i
successivi sei sui numeri, lundicesimo sulla geometria solida, il penultimo sui problemi
dellinnito e lultimo sui cinque poliedri regolari: tetraedro, esaedro, ottaedro, dode-
caedro e icosaedro), fu a lungo il pi diuso testo di matematica, usato nelle scuole
no a un paio di secoli addietro. Gli Elementi sono certamente successivi a Platone
(che mor nel 347 a.C.) e anteriori ad Archimede che, in molti punti, prosegu lopera
di Euclide. Gli Elementi rappresentano una mirabile sintesi della matematica greca
dei tre secoli precedenti (Talete, Pitagora, Ippocrate, Democrito, Eudosso e altri); del
tutto nuova, e molto moderna, tuttavia limpostazione rigorosamente assiomatica
che li rende il modello di impostazione ipotetico-deduttiva di stampo aristotelico.
880 APPENDICE D. DIZIONERIO BIOGRAFICO
Eudosso di Cnido (prima met del IV Secolo a.C.) Fu lideatore del metodo di
esaustione per il calcolo delle aeree; esso, precorrendo il concetto di limite, considera
una successione di gure geometriche inscritte e circoscritte nella gura della quale
si vuol valutare larea che pu cos essere approssimata, con la precisione voluta, per
difetto e per eccesso. Studi la teoria delle proporzioni, successivamente utilizzata da
Euclide.
Propose anche un nuovo modello planetario che, seguito da Aristotele, port al
sistema geocentrico di Claudio Tolomeo.
Nicol Fontana (detto Tartaglia) (Brescia 1499 Venezia 1557) Nato poveris-
simo, detto Tartaglia per la sua balbuzie, fu autodidatta ed considerato uno dei
maggiori algebristi del Cinquecento. Diede contributi alla soluzione delle equazioni di
terzo grado.
Nel 1534 Anton Maria Fiore lanci una pubblica sda sulla soluzione dellequazione
x3 + px + q = 0, alla quale Tartaglia diede soluzione. Ne segu una lunga polemica,
di vasta risonanza, con Cardano, che nel 1545 pubblic la sua teoria generale delle
equazioni di terzo grado.
Galileo Galilei (Pisa 1564 Arcetri 1642) Celebre scienziato italiano, autore di
una vera e propria rivoluzione scientica. Sin dalla giovinezza si dedic alla Fisica: la
sua scoperta dellisocronismo delle oscillazioni del pendolo del 1583. Studi Platone,
Euclide e Archimede, che molto lo inuenz come si pu evincere dal suo prima lavoro
La bilancetta del 1586 e dal successivo sul centro di gravit dei corpi.
Diventato lettore di Matematica alluniversit di Pisa, si occup di meccanica (la
sua opera De Motu uscir soltanto postuma) aprendo la via alla moderna dinamica.
Nel 1592 Galilei ottenne la cattedra di Matematica alluniversit di Padova, che gli
garant ampia libert di pensiero e ove trascorse diciotto anni. In questo periodo scopr
882 APPENDICE D. DIZIONERIO BIOGRAFICO
la legge della caduta dei gravi nel 1604 e nel 1610, basandosi su una scoperta olandese,
mise a punto il telescopio con il quale, tra la ne del 1609 e i primi mesi del 1610,
scopr le macchie lunari, le fasi di Venere, i quattro satelliti (oggi detti galileiani) di
Giove e, pi tardi, le macchie solari. Nel 1619 pubblic a Venezia il Sidereus Nuncius,
che suscit ampie polemiche.
Le opere fondamentali di Galilei sono Il Saggiatore del 1630 e il Dialogo sopra i
due massimi sistemi del mondo del 1632. In essi, avendo accettato la nuova teoria
copernicana che metteva in dubbio la vecchia concezione dellastronomia, si fece pal-
adino della nuova teoria. Avversato dalla Chiesa, fu condannato nel 1633 al carcere,
che evit abiurando.
Negli ultimi anni, che trascorse ad Arcetri, si dedic ai Discorsi e dimostrazioni
matematiche intorno a due nuove scienze attinenti alla meccanica ed i movimenti
locali, che pu essere considerata il vero inizio del pensiero scientico moderno.
Luigi Guido Grandi (Cremona 1671 Pisa 1742) Frate camaldolese, fu professore
a Firenze, prima di losoa e successivamente di matematica. Il suo nome legato
alla serie detta di Grandi.
Heinrich Eduard Heine (Berlino 1821 Halle 1881) Matematico tedesco che in-
segn nelle universit di Bonn e di Halle. Si occup di funzioni speciali e forn il
concetto di continuit uniforme.
John Richard Hicks (Warwick 1904 Blockley 1989) Economista inglese, riprese
e sistematizz limpostazione ordinalista di Pareto contribuendo alla sua aermazione
quale base della Teoria del consumatore. Diede importanti contributi in macroecono-
mia (fu tra gli autori del modello IS-LM) e in economia dinamica.
883
Johan Jensen (Nakskov 1859 Copenhagen 1925) Matematico danese. Pur avendo
una spiccata inclinazione per gli studi matematici, nel 1861 accett un impiego presso
una socit telefonica Bell a Copenaghen, che mantenne sino al 1924.
Parallelamente si dedic anche alla Matematica. Si occup della congettura di
Riemann, di serie e di funzioni speciali, ma il suo nome legato alla funzione convesse,
che introdusse in un lavoro del 1905 (la celebre disuguaglianza per le funzioni convesse
che porta il suo nome ne ricorda il ruolo pioneristico).
William Stanley Jevons (Liverpool 1835 Bexill 1882) Economista e losofo in-
glese, legato allutilitarismo di Bentham. Con Walras e Menger uno dei fondatori
della scuola marginalista. Nei suoi scritti Elementary Lessons in Logic del 1870 e Prin-
ciples of Science del 1874 sostenne lapplicazione della logica matematica alle scienze
naturali e sociali. La sua opera principale, The Theory of Polical Economy del 1871,
analizza il comportamento del consumatore in base alla razionalit della sua condotta
economica.
Muh.ammad ibn Musa al-Khuwarizm (750 circa Bagdad 850 circa) Matemati-
co, astronomo e geografo arabo. Scrisse un libro di aritmetica per illustrare il sistema
posizionale indiano; ne rimane solo una traduzione latina che si inizia con Algorithmi
dicit: algoritmo, corruzione del nome dellautore, ora entrato nelluso per indicare
un procedimento di calcolo.
Un volume di algebra, nel quale si occup di equazioni, Al-jabr wmuqabala
(Rispristinare e contrapporre) dell830: dal nome arabo al-jabr derivato algebra.
Fu autore di opere di astronomia e di geograa: nelle prime utilizz i metodi
dellastronomia indiana e nelle seconde della Geograa di Tolomeo.
Anche il nome logaritmo si deve ricollegare a una deformazione del suo nome.
884 APPENDICE D. DIZIONERIO BIOGRAFICO
Giuseppe Luigi Lagrange (Torino 1736 Parigi 1813) Matematico italiano, con
Eulero il pi importante matematico del Settecento, trascorse i primi trentanni della
sua vita a Torino, i successivi ventuno a Berlino e gli ultimi ventisei a Parigi.
Nel 1757 fond, con alcuni colleghi, una societ scientica che sarebbe poi diventata
lAccademia delle Scienze di Torino. Si occup di calcolo delle variazioni, di calcolo
delle probabilit, di serie, di equazioni algebriche e di equazioni dierenziali, per le
quali forn il metodo di variazioni delle costanti. Il suo nome legato alla funzione
lagrangiana e ai moltiplicatori di Lagrange per problemi di ottimo vincolato.
Fu anche un eccellente sico matematico. Si occup di meccanica celeste, risolse
molti problemi sulla librazione lunare e introdusse la funzione di Lagrange denita
come dierenza tra energia cinetica e potenziale.
Gabriel Lam (Tours 1795 Parigi 1870) Matematico francese, insegn a Parigi.
Si occup di teoria dei numeri, e in particolare dellultimo teorema di Fermat, di
meccanica, di termodinamica e di teoria dellelasticit. Il suo contributo pi rilevante
fu lintroduzione delle coordinate curvilinee.
humain (uscito postumo nel 1753); nel 1712 pubblic lEssai de Theodice, sur la bont
de Dieu, la libert de lhomme e lorigin du mal. I Principes de la nature et de la grce
fonds en raison e i Principes de philosophie furono pubblicati nel 1718 e nel 1720.
Ben nota la disputa che scoppi con Newton circa la priorit della scoperta del
calcolo innitesimale; essa lo amareggi profondamente e contribu a isolarlo dal mondo
no alla morte, avvenuta per una crisi di gotta, nel 1716.
Leibnitz insegu un progetto di sapere universale, attraverso una teoria dellin-
venzione, gi elaborata da Ramon Lull (Raimondo Lullo) nel Medioevo e ripresa nel
Rinascimento, che avrebbe dovuto condurre a un linguaggio universale in grado di
esprimere qualsiasi nozione e da metterne in luce i collegamenti. Da Aristotele, Leib-
nitz prese lidea che ogni sostanza ha una forma immutabile e distinta dalle altre: la
monade che rispecchia lordine delluniverso.
Wassily Leontief (Vasilij Leontev) (Pietroburgo 1905 New York 1999) Econo-
mista russo, che studi a Pietroburgo e a Berlino. Trasferitosi negli Stati Uniti, in-
segn nelle universit di Harvard e di New York. Il suo nome legato allanalisi delle
interdipendenze settoriali.
Carl Menger (Nowy Sacz 1840 Vienna 1921) Economista austriaco, professore
a Vienna dal 1873, fu uno dei fondatori del marginalismo. La sua Untersuchungen
ber die Methode der Sozialwissenschaften und der politischen konomie insbesondere
del 1883 sostenne che soltanto il metodo deduttivo consentiva di giungere a leggi
economiche generali e che su ciente analizzare il comportamento razionale dei singoli
individui per descrivere lintero processo economico. Su tali punti ebbe una lunga
disputa con G. von Schmoller.
La sua opera principale, Grundstze der Volkswirtschaftslehere del 1871, partendo
dai bisogni di beni, fornisce una chiara formulazione dellequilibrio del consumatore.
Pietro Mengoli (Bologna 1626 1686) La sua opera precorre lAnalisi innitesi-
male, a lui di poco successiva. Stabil che condizione necessaria di convergenza di una
serie che il suo termine generale tenda a zero e che una serie con i termini positivi
convergente se le sue somme parziali sono limitate.
886 APPENDICE D. DIZIONERIO BIOGRAFICO
Marin Mersenne (Oiz 1588 Parigi 1648) Filosofo e scienziato francese. Entrato
nellorine dei Minimi nel 1611, si diede alla losoa, prima attaccando il pensiero
rinascimentale e poi redigendo opere di erudizione scientica, tra le quali Cogita-
ta phusica-mathematica del 1644. Intrattenne una ricchissima corrispondenza con
Cartesio, Galileo, Gassendi, Hobbes, Huygens e Torricelli.
I suoi studi musicali rappresentano la base teorica del Clavicembalo ben temperato
di Bach.
Isaac Newton (Woolsthorpe 1642 Londra 1727) Studi a Cambridge, ove fu in-
uenzato dal losofo Henry Moore e dal matematico Isaac Barrow, ma la sua for-
mazione fu in gran parte frutto di studi autonomi.
Nel 1714 cos sintetizz la fase iniziale della sua attivit: Allinizio del 1665 scop-
ersi il metodo di approssimazione delle serie e la regola per ridurre qualsiasi esponente
di ogni binomio a tali serie. Il medesimo anno, in maggio, scopersi il metodo delle
tangenti di Gregory e di Sluse, e in novembre ero in possesso del metodo diretto delle
ussioni2 , e lanno successivo, in gennaio, avevo la teoria dei colori, nel maggio seguente
ero in possesso del metodo inverso delle ussioni. Nello stesso tempo iniziai a pensare
alla gravitazione che si estende no allorbita della luna e (avendo trovato come cal-
colare la forza per eetto della quale un globo che ruota dentro una sfera preme la
supercie della sfera), dalle legge di Keplero sei tempi periodici dei pianeti che sono
nella ragione di 3 a 2 delle loro distanze dai centri delle loro orbite, ho dedotto che la
forza che trattiene i pianeti nelle loro orbite deve essere mutuamente come il quadrato
delle loro distanze dai centri intorno ai quali essi ruotano; e per mezzo di ci confrontai
la forza richiesta per trattenere la Luna nella sua orbita con la forza di gravit sulla
supercie della Terra, e trovai la risposta quasi soddisfacente.
A solo venticinque anni aveva gi ottenuto risultati di enorme rilevanza.
Alla ne del 1669 fu nominato professore di matematica e insegn ottica, algebra e
aritmetica e i moti dei corpi celesti. Nel 1672 divenne membro della Royal Society. Nel
1689 fu eletto in Parlamento come rappresentante universitario. Nonostante le varie
2
Le derivate.
887
cariche, condusse sempre una vita molto ritirata. Storica la disputa con Leibnitz
sulla priorit della scoperta del calcolo innitesimale.
I suoi lavori fondamentali sono De Systemate Mundi del 1687 e i Philosophiae
Naturalis Principia Mathematica.
Blaise Pascal (Clermont Ferrand, 1623 Parigi 1662) Filosofo e scienziato francese.
Dibattuto tra fede e ragione, ritenne inizialmente (tra il 1646 e il 1654) che, nelle
discipline dei sensi e del ragionamento (come la sica e la matematica), il solo giudice
la ragione, mentre per la storia (e la rivelazione) deve valere un principio dautorit.
Nel 1654 strinse stretti rapporti con Port-Royal che lo portarono a una sorta di
conversione alla fede, alla base della quale non stanno n lesprit de gometrie (la
ragione) n lesprit de nesse (lintuizione), ma soprattutto il cuore che ha ragioni
che la ragione non conosce; luomo non capace di nessuna certezza eppure ne ha
assoluto bisogno. Di questo periodo sono le sue opere pi celebri: le Provinciales del
1654 e i Pense, pubblicato nel 1670, ove compare la celebre scommessa.
Sul piano scientico, Pascal si occup inizialmente di geometria (Essai pour le
coniques del 1640) e successivamente di problemi del vuoto (Trait de lquilibre des
liqueurs del 1653, ma pubblicato postumo). Nel 1654 si occup di un problema postogli
dal cavaliere di Mr sul giuoco dei dadi; le sei lettere che si scambiarono Pascal e
Fermat sullargomento sono il primo accenno al calcolo delle probabilit.
Si occup anche della cicloide e del calcolo dei volumi. Il suo ultimo lavoro, il
Trait de sinus du quart du cercle fu probabilmente lelemento decisivo che condusse
Leibnitz al calcolo dierenziale.
Pitagora (Samo 570 a.C. circa Metaponto primo terzo del V Secolo a.C.) Pare
che abbia trascorso la giovinezza in viaggi, spinto dal desiderio di sapere (losoa);
in essi ebbe modo di conoscere i saperi egizio e orientale. Verso i quarantanni emigr
nella Magna Grecia e, a Crotone, fond una cerchia religiosa di tipo esoterico. Mor,
probabilmente suicida, a Metaponto.
888 APPENDICE D. DIZIONERIO BIOGRAFICO
Il pitagorismo, che ebbe stretti legami con lorsmo e i misteri dionisiaci, rappresen-
t unastrazione intellettuale di tipo religioso, dotata di un vero e proprio catechismo
fondato sul rispetto della volont divina, sulla felicit della propria condizione, sul-
la difesa della legalit, sulla fedelt agli amici e sulla comunione dei beni materiali.
Verso la met del V Secolo a.C. ai pitagorici spiritualisti si contrapposero i pitagorici
matematici, dediti alla scienza e allattivit intellettuale.
Nel pensiero di Pitagora, luniverso armonia e numeroe, in base al numero, si
pu spiegare lesistenza e il futuro di tutte le cose. Il dieci il numero perfetto perch
somma dei primi quattro interi (10 = 1 + 2 + 3 + 4): il suo simbolo la tetrakts,
formata da un triangolo equilatero di dieci punti, e su di essa i pitagorici facevano i
giuramenti pi solenni.
Il nome di Pitagora indissolubilmente legato al teorema che ne porta il nome,
anche se in realt egli si limit a sistemare conoscenze antiche, gi note
p agli Egizi. Sua
anche lelegante dimostrazione della non razionalit del numero 2.
Jules-Henri Poincar (Nancy 1854 Parigi 1912) Filosofo della scienza e matem-
atico francese. Diede contributi alle equazioni dierenziali, alle funzioni fuchsiane,
allelettrodinamica, alla propagazione delle onde elettromagnetiche e a teorie cosmogo-
niche.
Il pensiero di Poincar si collega al movimento di revisione del razionalismo e
dellempirismo positivista. Fu assertore del principio di non contraddittoriet, cio
della soggezione del pensiero matematico alla sola coerenza interna, senza che vi sia
la necessit che esista qualche oggetto reale che vi si conformi.
Le sue principali opere losoche sono La science et lhypothse del 1901 e La valeur
de la science del 1905.
considerato uno degli ultimi grandi uomini di scienza con interessi poliedrici.
Michel Rolle (Ambert 1652 Parigi 1719) Di umili origini, fu essenzialmente au-
todidatta. Acquist notoriet, e anche una certa sicurezza economica, risolvendo un
889
problema che era stato pubblicamente proposto (trovare quattro numeri tali che le
dierenze di ogni coppia sia un quadrato perfetto e che inoltre la somma dei primi tre
sia un quadrato perfetto). Successivamente lavor al Ministero della guerra e fu eletto
membro dellAcadmie Royal des Sciences.
Il suo nome inscindibilmente legato al celebre Teorema che aerma che, se una
funzione derivabile denita su un intervallo e assume lo stesso valore negli estremi,
esiste almeno un punto nel quale la sua derivata nulla.
Eugen Slutsky (Yaroslav 1880 Mosca 1948) Economista e statistico russo che
diede importanti contributi allanalisi del comportamento del consumatore (con la
celebre analisi degli eetti di reddito e di sostituzione che porta il suo nome) e al
Calcolo delle probabilit.
Talete (Mileto 624 a.C. circa met del VI Secolo a.C.) Di origine fenicia, fu uno
dei Sette Sapienti della Grecia. Aristotele lo considera il padre della losoa sica.
Non si conosce nessuno dei suoi scritti, ma gli attribuisce di aver fondato la geome-
tria su basi diverse dalle egizie. Il pi noto dei teoremi a lui attribuiti aerma la
proporzionalit dei segmenti determinati da un fascio di rette su due trasversali.
Ebbe grandissima fama per aver predetto leclissi di Sole del 28 maggio 585 a.C..
Brook Taylor (Edmonton 1685 Londra 1731) Allievo di Newton, svilupp le idee
del maestro nellAnalisi matematica: di particolare rilievo la formula dello sviluppo
in serie di una funzione.
890 APPENDICE D. DIZIONERIO BIOGRAFICO
Leonida Tonelli (Gallipoli 1885 Pisa 1946) Matematico italiano, diede contribu-
ti fondamentali al Calcolo delle variazioni sviluppando il cosiddetto Metodo diretto
basato sulle propriet di ottimalit delle funzioni semicontinue. Forn risultati anche
per la teoria dellintegrazione e per le serie trigonometriche.
Charles Jean de la Valle Poussin (Lovanio 1866 1962) Matematico belga, pro-
fessore a Lovanio, dimostr, in contemporanea con Hadamard, il Teorema dei numeri
primi. Si occup anche di teoria dellintegrazione, di equazioni dierenziali, di fun-
zioni di variabile complessa e di rappresentazione conforme. Scrisse un celebre Cours
danalyse, pi volte aggiornato dal 1899 al 1922.