Sei sulla pagina 1di 11

1

UNIVR Facolt`
a di Economia Corso di Matematica finanziaria 2008/09

Funzioni implicite
Indice
1 Premesse

2 Funzioni definite implicitamente

3 Teorema della funzione implicita in R2

4 Teorema della funzione implicita in Rn

5 Teorema della funzione implicita per funzioni vettoriali

Premesse

Prima di iniziare a trattare gli argomenti specifici di questa dispensa occorre fissare bene alcuni concetti basilari.
Sono concetti per nulla nuovi per lo studente, almeno non dovrebbero esserlo, ma essendo questioni dette allinizio di
ogni corso di matematica e poi raramente riprese, voglio qui farne una rapida riproposizione per poi assumere che gli
studenti abbiano veramente presente la questione.
Quando diciamo che f `e una funzione da R a R questo significa che ad ogni elemento di R viene associato
attraverso la funzione (trasformazione, applicazione, corrispondenza, . . . , ci sono molti modi di chiamarla) uno ed uno
solo elemento di R. Questo in generale (il principio vale anche se la funzione `e da R2 a R, da Rn a R, o anche da Rn
a Rm ).
Tra breve parleremo di grafici, dato che le questioni di questa dispensa hanno anche un interessante aspetto
geometrico. Allora, se abbiamo la nostra funzione f : R R e pensiamo al suo grafico,1 la propriet`
a caratteristica
della funzione porta ad avere che per ogni x c`e un solo punto corrispondente nel grafico, cio`e c`e un solo punto del
grafico di ascissa x. Si pu`
o anche dire, usando la geometria, che se tracciamo tutte le possibili rette verticali, ciascuna
di queste incontra il grafico in un solo punto. Per dare un po pi`
u di generalit`a al discorso, se la funzione `e definita in
un sottoinsieme A di R (`e il caso pi`
u frequente) si scrive allora f : A R R e si pu`
o dire che se tracciamo rette
verticali, ciascuna di queste incontra il grafico al pi`
u in un punto, cio`e o in un punto o in nessun punto. Sulla base di
queste considerazioni possiamo dire che ad esempio una circonferenza non `e, lo studente forse lo ricorder`a, il grafico
di nessuna funzione, dato che ci sono rette verticali che incontrano la circonferenza in due punti.
Per`o, data una funzione f e mantenendo sempre le x sullasse orizzontale e le y su quello verticale, possiamo anche
disegnare il grafico di f prendendo y come variabile e x = f (y) come valore.
Se facciamo questo dobbiamo attenderci che la propriet`
a caratteristica del grafico cos` ottenuto sia che, se tracciamo
questa volta rette orizzontali, ciascuna di queste incontra il grafico al pi`
u in un punto.
In generale una curva nel piano pu`
o avere oppure no queste propriet`
a caratteristiche dei grafici. Pu`o averne una
(ad esempio quella con le rette orizzontali) e non laltra, pu`
o averle entrambe o nessuna delle due. Ad esempio, una
parabola con lasse verticale ha la propriet`
a caratteristica con le rette verticali (e non con quelle orizzontali), una retta
obliqua le ha entrambe e una circonferenza non ne ha nessuna delle due.
Quando nel seguito si dir`
a che un certo insieme del piano `e il grafico di una funzione vorr`a dire che questo insieme
ha la propriet`
a caratteristica dei grafici, e occorrer`
a specificare in quale dei due sensi: se ha la propriet`
a con le rette
verticali possiamo dire che `e il grafico di una funzione da x a y, mentre se ha la propriet`
a con le rette orizzontali `e il
grafico di una funzione da y a x.
Esercizio Quale utile esercizio lo studente potrebbe disegnare il grafico delle funzioni
t 7 t 1

t 7 t2

t 7 t3

t 7 (t 1)2

1 Vale la pena qui ricordare che il grafico di una f : R R `


e un insieme di punti nel piano, precisamente i punti del tipo (x, f (x)), cio`
e
i punti in cui la prima componente (ascissa) `
e la x e la seconda (ordinata) `
e il valore che la funzione associa alla x, che come si sa viene
indicato con f (x). Lasse della variabile `
e detto anche asse delle x e lasse dei valori `
e detto anche asse delle y, e lequazione del grafico si
scrive quindi di solito con y = f (x).
Siamo abituati, come noto, a riportare sullasse orizzontale le x e su quello verticale i valori f (x): `
e bene ricordare che questa per`
o`
e
soltanto una convenzione e potremmo anche fare il contrario.

UNIVR Facolt`
a di Economia Corso di Matematica finanziaria 2008/09

prima come funzione da x a y e poi come funzione da y a x.


Esercizio Lo studente disegni nel piano le soluzioni delle equazioni
x2 y = 0

x y2 = 0

xy = 1

x2 + y 2 = 1

e dica se gli insiemi ottenuti hanno la propriet`


a caratteristica dei grafici di funzioni, specificando eventualmente se da
x a y o da y a x.
Esempio Consideriamo la funzione logaritmica, cio`e la funzione che ad ogni numero reale positivo associa il suo
logaritmo, ad esempio in base e (che si scrive log). Se rappresentiamo il suo grafico pensando che sia y = log x
abbiamo la figura qui sotto a sinistra, se rappresentiamo il suo grafico pensando invece che sia x = log y abbiamo la
figura al centro.
y
y x = log y y = x
y
y = log x
1
1

x = log y

y = log x

x
x

La figura a destra suggerisce invece quale sia il legame tra i due grafici. Si tratta di una simmetria rispetto alla
retta bisettrice del primo e terzo quadrante, cio`e la retta di equazione y = x. Non dovrebbe essere difficile capire che
passando da y = f (x) a x = f (y) viene fatto sostanzialmente uno scambio tra x e y e scambiare le due componenti
porta a spostarsi nel piano perpendicolarmente (simmetricamente) alla retta y = x.
Altro aspetto fondamentale sulla questione della propriet`
a caratteristica dei grafici. Pu`o succedere che un certo
insieme del piano non abbia la propriet`
a caratteristica del grafico di una funzione, mettiamo da y a x, ma ce labbia
in prossimit`a di un punto particolare, cio`e in un intorno di tale punto.
y
Esempio Consideriamo la parabola di equazione x = y 2 . Questa curva non `e il
grafico di una funzione da x a y in quanto ci sono rette verticali che incontrano la
1
parabola in due punti.
Per`
o, se consideriamo il suo punto (1, 1), possiamo dire che certamente c`e un intorno
di tale punto (intorno in R2 , cio`e cerchietto con centro in (1, 1)) nel quale la parabola
x
1
ha la propriet`
a caratteristica dei grafici delle funzioni da x a y nel senso che, se della
parabola consideriamo soltanto i punti che stanno in quellintorno, quella parte di
parabola ha la propriet`
a caratteristica dei grafici delle funzioni da x a y. Questo fatto
si esprime dicendo che la parabola, nel punto (1, 1), ha localmente quella propriet`
a.2
Attenzione. La validit`a della propriet`
a locale, cio`e il fatto che la propriet`
a sia vera localmente, dipende in genere
dal punto che consideriamo. Con la nostra parabola, la propriet`
a caratteristica dei grafici delle funzioni da x a y `e
vera localmente in tutti i punti tranne lorigine.
b

Funzioni definite implicitamente


y

Siano X, Y R e sia f : X Y R. Sia poi U X un intervallo aperto e sia


infine g : U R una funzione definita in U .
Definizione Diciamo che lequazione f (x, y) = 0 definisce implicitamente la
funzione g nellintervallo U se per ogni x U si ha f (x, g(x)) = 0.

f (x, y) = 0
y = g(x)

Y
( U

Esempio Consideriamo la funzione f (x, y) = x2 + y 2 1, definita intutto R2 (quindi in R R). Lequazione


f (x, y) = 0, cio`e x2 + y 2 = 1, definisce implicitamente la funzione g(x) = 1 x2 nellintervallo U = (1, 1). Infatti
p
2

2
1 x2 1 = 0 per ogni x (1, 1).
f x, g(x) = x2 + g(x) 1 = x2 +

2 Si faccia attenzione che ho detto che esiste un intorno in cui succede quello. Non ho detto che in ogni intorno succede (infatti non
`
e vero). Pu`
o essere che succeda solo in intorni molto piccoli. Con la parabola si pu`
o ad esempio vedere facilmente che non succede se
lintorno contiene lorigine.

UNIVR Facolt`
a di Economia Corso di Matematica finanziaria 2008/09

Si osservi che la stessa equazione definisce implicitamente anche la funzione g(x) = 1 x2 , sempre nello stesso
intervallo U , dato che in U vale anche la f (x, g(x)) = 0.
Esempio Consideriamo la funzione f (x, y) = x2 y 2 , definita in tutto R2 . Lequazione f (x, y) = 0, cio`e x2 y 2 = 0,
definisce implicitamente la funzione g(x) = x nellintervallo U = R. Infatti

2
f x, g(x) = x2 g(x) = x2 x2 = 0

per ogni x R.

Si osservi che la stessa equazione definisce implicitamente anche la funzione g(x) = x, sempre in tutto R, dato
che in U vale anche la f (x, g(x)) = 0.
Si osservi ancora che la stessa equazione definisce implicitamente anche la funzione x 7= |x|, e anche la funzione
x 7= |x|, che sono diverse dalle precedenti.
Osservazione Si noti che nei due esempi precedenti gli insiemi del piano formati dalle soluzioni dellequazione
f (x, y) = 0 non hanno la propriet`
a caratteristica dei grafici.3
Osservazione Riprendendo le ipotesi iniziali, se V Y e h : V R `e una funzione definita in V , diciamo che
lequazione f (x, y) = 0 definisce implicitamente la funzione h in V se per ogni y V si ha f (h(y), y) = 0. Quindi
lequazione pu`
o definire implicitamente una funzione della x o una funzione della y.
Esercizio Data la funzione f (x, y) = x y 2 , lo studente dica quali funzioni g della variabile x vengono definite
implicitamente dallequazione f (x, y) = 0 nellintervallo U = (0, +).
Il teorema che studiamo in questa dispensa, cio`e il teorema della funzione implicita (o teorema di Dini) presenta
delle condizioni sufficienti affinche le soluzioni di una certa equazione f (x, y) = 0 siano il grafico di una funzione, ossia
definiscano implicitamente una sola funzione. Data unequazione in due variabili x, y, sappiamo per esperienza che
talvolta `e facile ricavare y in funzione di x (o x in funzione di y), altre volte `e molto difficile o addirittura impossibile.4
Il teorema della funzione implicita risponde al seguente problema di natura operativa: data unequazione in due
variabili, esiste, almeno teoricamente, la possibilit`a di scrivere le soluzioni esplicitando una variabile rispetto allaltra?
` bene dire subito che il teorema comunque d`
E
a un risultato teorico, non fornisce un metodo operativo per trovare
questa funzione che lega le due variabili (un metodo operativo generale non esiste).
Il teorema che vediamo ha natura locale, cio`e le ipotesi consentono di provare lunicit`a di questa funzione ma nelle
vicinanze di un punto, non su tutto linsieme di definizione.
Per semplificare la comprensione del teorema, che non `e tra i pi`
u facili, presento lo stesso teorema in tre casi distinti,
di difficolt`a crescente. Il primo caso `e ambientato in R2 (relativo ad una equazione), il secondo in Rn (relativo ancora
ad una sola equazione) e il terzo riguarda il caso delle funzioni a valori vettoriali (relativo ad un sistema di equazioni).

Teorema della funzione implicita in R2

Ecco subito lenunciato del teorema. Ricordo che una funzione si dice di classe C 1 se ha derivate continue.

Teorema Sia f una funzione a valori reali di classe C 1 nellinsieme A R2 e sia (x, y) un punto interno ad A per
cui si abbia f (x, y) = 0. Se fy (x, y) 6= 0 allora esistono

un intorno B = I (x, y), A,
un intorno U = I(x, r) e

ununica funzione g di classe C 1 nellintorno U tali che



(i) x, g(x) B per ogni x U ;

(ii) lequazione f (x, y) = 0 definisce implicitamente la funzione g nellintorno U .


Si ha inoltre che la derivata della funzione g nel punto x `e data da
g (x) =

fx (x, y)
.
fy (x, y)

3 Si tratta nel primo caso della circonferenza di centro lorigine e raggio 1 e nel secondo dellinsieme formato dalle due rette di equazione
y = x e y = x, dato che lequazione x2 y 2 = 0 si pu`
o scrivere come (x y)(x + y) = 0.
4 Nellequazione x2 y = 0 `
e immediato ricavare y in funzione di x; nellequazione x2 + y 2 1 = 0 gi`
a non `
e pi`
u cos` facile; nellequazione
yexy 1 = 0 `
e impossibile ricavare y, mentre `
e ancora possibile ricavare x; infine nellequazione xyexy 1 = 0 `
e impossibile ricavare sia y
sia x.

UNIVR Facolt`
a di Economia Corso di Matematica finanziaria 2008/09

Le osservazioni che seguono sono importanti per capire a fondo il senso del teorema.
Osservazione Il teorema dice quindi che nelle ipotesi fatte lequazione f (x, y) = 0, nelle vicinanze della sua soluzione
(x, y) (quindi localmente), `e il grafico di una funzione (e una sola). Tale funzione (la funzione g nellenunciato del
teorema) viene detta funzione implicita, cio`e implicitamente definita in modo unico dallequazione di partenza.
Osservazione Lipotesi chiave `e fy (x, y) 6= 0, cio`e che la derivata parziale rispetto alla seconda variabile nel punto
(x, y) non sia nulla. Si noti che, in tale ipotesi, la funzione g `e funzione di x e consente quindi di esprimere y in funzione
di x. Possiamo allora sintetizzare il significato in questi termini: data la nostra equazione f (x, y) = 0, verificata nel
punto (x, y), se la derivata parziale di f rispetto ad y `e diversa da zero nel punto (x, y), allora lequazione iniziale
definisce implicitamente, in modo unico, y in funzione di x.
Osservazione Non `e difficile intuire che se `e fx (x, y) 6= 0, allora possiamo scrivere x in funzione di y, attraverso una
certa funzione implicita h (quindi x = h(y)). Formalmente possiamo dire che in questo caso esistono

un intorno B = I (x, y), A,
un intorno V = I(y, r) e

ununica funzione h di classe C 1 nellintorno V tali che



(i) h(y), y B per ogni y V ;

(ii) lequazione f (x, y) = 0 definisce implicitamente la funzione h nellintorno V .


Naturalmente la derivata della funzione h nel punto y `e data da
h (y) =

fy (x, y)
.
fx (x, y)

` chiaro che se per una funzione f si ha che entrambe le derivate parziali in (x, y) sono diverse da
Osservazione E
zero, allora `e possibile esprimere sia y in funzione di x sia x in funzione di y attraverso due funzioni, in genere distinte.
Vediamo ora qualche esempio.
Esempi
Consideriamo lequazione x2 y = 0 (quindi f (x, y) = x2 y).
Preso un qualunque punto P = (x, y) della parabola, si ha fy (x, y) = 1
e quindi possiamo dire che in un intorno di P lequazione definisce ununica
` ovvio che tale funzione `e la
funzione g, che esprime y in funzione di x. E
2
g(x) = x (se lintorno di P `e quello indicato in grigio, lintorno U `e quello
sullasse x indicato nella figura.5 La derivata della funzione g in x `e

g (x) =

fx (x,y)
fy (x,y)

2x
1

y
y

P
b

U
x

= 2x.

Consideriamo lequazione xy 2 = 0 (quindi f (x, y) = xy 2 ). Essa definisce come noto la parabola rappresentata
qui sotto.
La derivata parziale rispetto ad y `e fy (x, y) = 2y. Essa `e diversa da zero
y
se y 6= 0. Quindi possiamo dire che in tutti i punti della parabola diversi
dallorigine il teorema della funzione implicita permette di dire che localmente
la parabola `e il grafico di una funzione g da x a y. Sia allora (x, y) un punto
sulla parabola
diverso dallorigine. Se y > 0 tale funzione

`e evidentemente la
g(x) = x, mentre se y < 0 tale funzione `e la g(x) = x.
Nellorigine il teorema non `e applicabile, almeno non se cerchiamo la possibilit`a
x
U
di esplicitare y in funzione di x (in prossimit`a dellorigine non esiste infatti
ununica
funzione implicita del tipo y = g(x)).
V
Osservando che invece fx (x, y) = 1 qualunque sia (x, y), possiamo dire che
in prossimit`a di ogni punto (x, y) della parabola, anche dellorigine, essa `e il
grafico di una funzione h da y ad x. Tale funzione `e evidentemente h(y) = y 2 .
b

1
=
La derivata della funzione g in x `e g (x) = 2y

1
2y .

La derivata della funzione h in y `e h (y) = 2y


1 = 2y.

5 Questo `
e un caso in cui la funzione g(x) = x2 `
e la funzione implicita in tutto R, ma abbiamo gi`
a detto che in altri casi pu`
o non essere
cos`.

UNIVR Facolt`
a di Economia Corso di Matematica finanziaria 2008/09

Consideriamo lequazione x2 + y 2 = 1 (quindi f (x, y) = x2 + y 2 1). Essa definisce come noto la circonferenza
di centro lorigine e raggio 1, rappresentata qui sotto.
y
La derivata parziale rispetto ad y `e fy (x, y) = 2y. Quindi in prossimit`a dei
punti (x, y) della circonferenza con y 6= 0 esiste ununica funzione g (da x a y)
implicitamente definita dallequazione. Gli unici punti in cui il teorema non `e
applicabile nel senso detto sono (1, 0) e (1, 0).

` possibile dare unespressione alla funzione g: se y > 0 si ha g(x) = 1 x2 ,


E

mentre se y < 0 si ha g(x) = 1 x2 .

Osservando invece che fx (x, y) = 2x, il teorema permette di dire che in prossimit`a dei punti (x, y) della circonferenza con x 6= 0, cio`e tutti i punti ad eccezione
di (0, 1) e (0, 1), esiste ununica funzione h (da y a x) implicitamente definita
dallequazione. Lascio allo studente determinare lespressione di tale funzione.
x
La derivata della funzione g in x `e g (x) = 2x
2y = y .

Consideriamo lequazione x2 y 2 = 0 (quindi f (x, y) = x2 y 2 ). Essa definisce come


gi`a visto una coppia di rette, bisettrici del primo e terzo oppure del secondo e quarto
quadrante, come rappresentato a fianco.
La derivata parziale rispetto ad y `e fy (x, y) = 2y. Lunico punto soluzione dellequazione con y = 0 `e lorigine. Quindi possiamo dire che in prossimit`a di ogni soluzione
(x, y) 6= (0, 0) `e definita ununica funzione implicita g (da x a y).
Per quanto riguarda lespressione della funzione implicita possiamo dire che: se x y > 0
si ha g(x) = x, mentre se x y < 0 si ha g(x) = x.
2x
= xy (che risulta uguale a 1).
La derivata della funzione g in x `e g (x) = 2y
fx (x, y)

Dato che
h (da y a x).

y=x

y
V
b

y = x

= 2x, in prossimit`a di ogni soluzione (x, y) 6= (0, 0) `e definita anche una sola funzione implicita

Nellorigine il teorema non `e applicabile, ne in un senso ne nellaltro. Infatti la figura mostra bene che nelle
vicinanze dellorigine la funzione implicitamente definita dallequazione non `e unica.
Osservazione Negli esempi presentati non `e difficile esplicitare una variabile rispetto allaltra. Ci sono situazioni
invece in cui la cosa `e molto pi`
u difficile, se non impossibile.
Si consideri ad esempio lequazione x3 + 2xy + y 3 = 0, dove appare proibitivo qualsiasi tentativo di ricavare una
o laltra variabile. In questa equazione non `e facile nemmeno trovare soluzioni iniziali diverse dallorigine e dal punto
(1, 1) (dove evidentemente lequazione `e verificata). Se poniamo

f (x, y) = x3 + 2xy + y 3 , allora abbiamo f (x, y) = 3x2 + 2y, 2x + 3y 2 .

Allora possiamo osservare che nellorigine il teorema non `e applicabile (nessuna delle due derivate parziali `e diversa da
zero), mentre il teorema `e applicabile nel punto (x, y) = (1, 1), dove si ha f (1, 1) = (1, 1). Quindi possiamo
dire che in prossimit`a di (1, 1) c`e una funzione implicita g (da x a y) il cui grafico coincide con la curva definita
dallequazione. Di questa funzione g non possiamo trovare lespressione, ma ad esempio possiamo calcolare la derivata
in x = 1. Si ha infatti
f (1, 1)
= 1.
g (x) = x
fy (1, 1)
Vediamo ancora un paio di esempi.
Esempi
Consideriamo lequazione y 2 + ex 1 = 0 e sia f (x, y) = y 2 + ex 1. Consideriamo poi la soluzione (x, y) = (0, 0)
e studiamo lapplicabilit`
a del teorema della funzione implicita in tale punto.
Abbiamo fy (x, y) = 2y e fy (0, 0) = 0. Quindi il teorema non consente di affermare lesistenza, in prossimit`a
dellorigine, di ununica funzione g da x a y.

UNIVR Facolt`
a di Economia Corso di Matematica finanziaria 2008/09

Per`o abbiamo fx (x, y) = ex e fx (0, 0) = 1. Quindi possiamo dire che in prossimit`a


dellorigine esiste ununica funzione implicita h da y a x. Si pu`
o trovare in questo
caso lespressione di h, trasformando lequazione in

ex = 1 y 2 , x = log(1 y 2 )
quindi h(y) = log(1 y 2 ) .

1
b

Lo studio di questa funzione (che lascio per esercizio) porta a trovare che il grafico
`e quello riportato a fianco. Da questo si capisce il motivo della non applicabilit`
a del
teorema nel primo caso: infatti in prossimit`a dellorigine non `e unica la funzione da
x a y implicitamente definita.

Possiamo osservare che nei punti diversi dallorigine che sono soluzione dellequazione y 2 + ex 1 = 0 il teorema
`e applicabile: infatti la fy (x, y) certamente `e diversa da zero. Quindi in prossimit`a di questi punti c`e ununica
funzione implicita g (da x a y). Lespressione di questa funzione si trova facilmente con i passaggi

y 2 = 1 ex , y = 1 ex .

Quindi per le soluzioni che stanno


quadrante la funzione `e g(x) = 1 ex e per quelle del terzo
nel secondo
quadrante la funzione `e g(x) = 1 ex .
Consideriamo lequazione x+ex+y 1 = 0 e sia f (x, y) = x+ex+y 1. Consideriamo poi la soluzione (x, y) = (0, 0)
e studiamo lapplicabilit`
a del teorema della funzione implicita in tale punto. Abbiamo

e f (0, 0) = (2, 1).
f (x, y) = 1 + ex+y , ex+y
Quindi il teorema consente di affermare che in prossimit`a dellorigine esiste ununica funzione g da x a y
implicitamente definita dallequazione.
f (0,0)

Con il teorema della funzione implicita possiamo calcolare la derivata di g in 0: si ha g (0) = fx (0,0) = 2.
y

Non `e difficile trovare anche lespressione di g, trasformando lequazione in




1x
1x
x y
y
, y = log(1 x) x
, y = log
x+e e =1 , e =
ex
ex
Un semplice studio di questa funzione porta a trovare il grafico qui a fianco.
Dato che anche la derivata parziale di f rispetto ad x `e diversa da zero nellorigine, il teorema consente di affermare che, sempre in prossimit`a dellorigine,
esiste anche ununica funzione h da y a x implicitamente definita dallequazione, come `e ovvio dal grafico. Lespressione di h per`o non si pu`
o trovare con
metodi elementari.6 Data una generica soluzione (x, y), si pu`
o dire per`o quanto
vale la derivata di h in y.
1x
ex+y
Si ha h (y) = 1+e
x+y = 2x .


quindi g(x) = log(1 x) x .
y

1x

Teorema della funzione implicita in Rn

Il teorema della funzione implicita pu`


o essere generalizzato a funzioni di pi`
u di due variabili. Significa che, anziche
considerare unequazione iniziale di due variabili, consideriamo unequazione in n variabili. In parole povere il teorema
in questo caso studia la possibilit`a che una delle variabili sia funzione delle altre n 1. Nel seguito indico con fn la
derivata parziale di f rispetto alla n-esima variabile.
Prima di enunciare il teorema, in cui ora le notazioni sono purtroppo un po pesanti, faccio una precisazione relativa
proprio alle notazioni. Data una funzione f di n variabili possiamo scrivere come noto f (x) = f (x1 , x2 , . . . , xn ). Il
gradiente di f `e come noto

f (x) = f1 (x), f2 (x), . . . , fn (x)

dove ciascuna delle derivate parziali `e naturalmente funzione, come la f , di n variabili. Nellenunciato del teorema che
6 Lo

studente rifletta che questo equivale a dire che non siamo in grado di trovare lespressione della funzione inversa di g.

UNIVR Facolt`
a di Economia Corso di Matematica finanziaria 2008/09

ora vediamo mi servir`a per comodit`


a introdurre un gradiente parziale, cio`e un gradiente relativo soltanto ad alcune
delle variabili. Cos` con la notazione x1 ,...,xk f indico allora il gradiente di f relativo alle sole variabili x1 , . . . , xk . 7
Ecco finalmente lenunciato del teorema.
Teorema Sia f una funzione a valori reali di classe C 1 nellinsieme A Rn e sia x = (x1 , x2 , . . . , xn ) un punto
interno ad A per cui si abbia f (x) = 0. Se fn (x) 6= 0 allora esistono

un intorno B = I x, A,

un intorno U = I (x1 , . . . , xn1 ), r e
ununica funzione g di classe C 1 nellintorno U tali che

(i) x1 , . . . , xn1 , g(x1 , . . . , xn1 ) B per ogni (x1 , . . . , xn1 ) U ;

(ii) lequazione f (x1 , x2 , . . . , xn ) = 0 definisce implicitamente la funzione g nellintorno U , cio`e



f (x1 , . . . , xn1 , g(x1 , . . . , xn1 ) = 0 per ogni (x1 , . . . , xn1 ) U .
Si ha inoltre che il gradiente della funzione g nel punto (x1 , . . . , xn1 ) `e dato da
g(x1 , . . . , xn1 ) =

1
fn (x)

x1 ,...,xn1 f (x).

Osservazione Al di l`a delle complicazioni formali il senso del teorema `e lo stesso di quello in R2 . Detto semplicemente, il fatto che la derivata parziale rispetto ad xn sia diversa da zero permette di dire che la n-esima variabile
` chiaro che se invece fosse la f diversa da zero, allora sarebbe la variabile xk
`e (localmente) funzione delle altre. E
k
funzione delle altre.
Osservazione Rispetto al caso in R2 la funzione implicita `e ora funzione di n 1 variabili e quindi non si parla
pi`
u di derivata di g ma di gradiente, nelle variabili di cui g `e funzione (il gradiente di g si esprime poi attraverso il
gradiente parziale di f ). Per proseguire nella generalizzazione di poco fa, se fosse fk (x) 6= 0, avremmo che la funzione
implicita g (funzione di tutte le variabili tranne la xk , cio`e di x1 , . . . , xk1 , xk+1 , . . . , xn ) avrebbe un gradiente dato da
g(x1 , . . . , xk1 , xk+1 , . . . , xn ) =

1
x ,...,xk1 ,xk+1 ,...,xn f (x).
fk (x) 1

Vediamo ora un paio di esempi per vedere le cose in concreto.


Esempio Consideriamo lequazione x21 + x22 + x23 = 14, che identifica una superficie sferica in R3 . Poniamo
f (x1 , x2 , x3 ) = x21 + x22 + x23 14.
Data la soluzione x = (x1 , x2 , x3 ) = (1, 2, 3), ci chiediamo se la superficie sferica definisca implicitamente, in prossimit`a
del punto (1, 2, 3), il grafico di una sola funzione che permetta di esprimere ad esempio x3 in funzione di x1 , x2 .
Il teorema ci dice di andare a calcolare f3 (1, 2, 3). Si trova
f3 (x1 , x2 , x3 ) = 2x3

e quindi f3 (1, 2, 3) = 6 6= 0.

Allora possiamo dire che certamente in un intorno di (1, 2, 3) abbiamo ununica funzione implicita g (definita in un
intorno di (1, 2)) che esprime x3 in funzione di x1 , x2 e tale per cui la superficie sferica (sempre in prossimit`a del punto
(1, 2, 3)) ha equazione x3 = g(x1 , x2 ). Si pu`
o notare che, essendo f (x) = (2, 4, 6), in cui nessuna componente si
annulla, si pu`
o applicare il teorema su ciascuna variabile. Quindi localmente esistono le funzioni implicite e tali
che
x1 = (x2 , x3 ) e x2 = (x1 , x3 ).
7 In realt`
a le variabili non saranno sempre necessariamente consecutive, ma non appesantisco ulteriormente la notazione per tenere
conto di questo aspetto. Mi spiego comunque con un esempio: data la funzione f (x1 , x2 , x3 ), potrei avere il suo gradiente parziale rispetto
ad x1 , x3 e lo indicherei ovviamente con x1 ,x3 f .
Per lo studente curioso che si chiedesse come si possa tenere conto nella notazione della possibilit`
a che le variabili non siano consecutive,
dico che una notazione adeguata a questa necessit`
a`
e

xi1 ,xi2 ,...,xi f


k

, con i1 , i2 , . . . , ik {1, 2, . . . , n},

dove gli indici i1 , i2 , . . . , ik non sono appunto necessariamente 1, 2, . . . , k.

UNIVR Facolt`
a di Economia Corso di Matematica finanziaria 2008/09

Esempio Consideriamo lequazione x2 y + z 2 = 0. Poniamo


f (x, y, z) = x2 y + z 2 .
Lorigine `e certamente soluzione dellequazione. Chiediamoci se localmente ogni variabile `e funzione delle altre due.
Il gradiente di f `e
z


f (x, y, z) = 2x, 1, 2z e quindi f (0, 0, 0) = 0, 1, 0 .

Allora possiamo affermare che in un intorno dellorigine la y `e funzione di x, z, cio`e


che esiste una funzione implicita g, definita in un intorno di (0, 0), tale che y = g(x, z)
in tale intorno. Osserviamo che invece il teorema non `e applicabile se cerchiamo di
esprimere x in funzione di y, z oppure z in funzione di x, y.
x
Possiamo dire che il gradiente della funzione g in (0, 0) `e
g(0, 0) =

1
1
x,z f (0, 0, 0) =
(0, 0) = (0, 0).
fy (0, 0, 0)
1

La conclusione non sorprende se si pensa che lequazione iniziale definisce un paraboloide con vertice nellorigine e
asse di simmetria lasse y, come raffigurato a fianco.

Teorema della funzione implicita per funzioni vettoriali

Il teorema della funzione implicita ha una generalizzazione ulteriore che affronta la situazione in cui anziche una sola
equazione abbiamo un sistema di equazioni. Anche in questo caso, volendo dare una preliminare interpretazione del
risultato, possiamo dire che, dato un sistema di n incognite ed m equazioni (e le equazioni devono essere meno delle
incognite), si cerca qui la possibilit`a che il sistema dato permetta di esplicitare m variabili rispetto alle altre n m.
Nellenunciato, per ridurre la scrittura del sistema in questione, useremo una funzione di n variabili a valori in Rm
(non `e una novit`a: abbiamo visto in precedenza che un sistema lineare si pu`
o scrivere utilizzando una trasformazione
lineare da Rn a Rm ). In generale una funzione da Rn a Rm si pu`
o scrivere per esteso come una

f1 (x1 , x2 , . . . , xn )
f2 (x1 , x2 , . . . , xn )

f (x) = f (x1 , x2 , . . . , xn ) =
,
..

.
fm (x1 , x2 , . . . , xn )

dove sono esplicitamente indicate le m componenti del vettore f (x), tutte funzioni delle n variabili x1 , x2 , . . . , xn .
Se f `e derivabile, la derivata di f `e una matrice,8 che si chiama matrice Jacobiana di f , ed `e

f1
f1
f1
(x)
(x)
.
.
.
(x)
x2
xn

x1

f2
f2
f2
(x)
(x)
.
.
.
(x)
x1
x
x
2
n

Jf (x) =
..
..
..

..

.
.
.
.

fm
fm
fm
(x)
(x)
.
.
.
(x)
x1
x2
xn

Si noti che la prima colonna si ottiene derivando rispetto ad x1 , la seconda rispetto ad x2 e cos` via le altre.
Come accadeva nella sezione precedente quando abbiamo parlato di gradiente parziale, anche qui possiamo pensare
alla matrice Jacobiana parziale, intendendo che se siamo interessati alle derivate rispetto ad x1 , x2 , . . . , xk possiamo
scrivere
Jx1 ,x2 ,...,xk f.
Si tratta naturalmente di una sottomatrice di Jf , quella formata dalle sue prime k colonne.9
Ecco lenunciato del teorema.

pensi che la derivata di una funzione da Rn a R `


e un vettore (gradiente). Non dovrebbe sorprendere che la derivata di una funzione
da Rn a Rm sia una matrice. Incidentalmente, la derivata di una trasformazione lineare `
e la sua matrice di rappresentazione.
9 Si noti che ha senso solo questo tipo di sottomatrici di Jf , cio`
e solo quelle che considerano alcune colonne ma tutte le righe. Infatti,
se `
e sensato considerare un sottoinsieme di colonne, che significa appunto derivare rispetto ad un sottoinsieme di variabili, non `
e sensato
considerare un sottoinsieme di righe, che vorrebbe dire considerare solo una parte delle componenti di f .
8 Si

UNIVR Facolt`
a di Economia Corso di Matematica finanziaria 2008/09

Teorema Sia f : A Rn Rm una funzione di classe C 1 e sia m < n. Sia poi x = (x1 , x2 , . . . , xn ) un punto interno
ad A per cui si abbia f (x) = 0.
Se la matrice Jacobiana di f ha rango m e si ha che Jx1 ,x2 ,...,xm f (x) `e non singolare, allora esistono

un intorno B = I x, A,

un intorno U = I (xm+1 , . . . , xn ), r e
ununica funzione g : U Rm di classe C 1 tali che


(i) g1 (xm+1 , . . . , xn ), . . . , gm (xm+1 , . . . , xn ), xm+1 , . . . , xn B per ogni (xm+1 , . . . , xn ) U ;

(ii) lequazione vettoriale f (x1 , x2 , . . . , xn ) = 0 definisce implicitamente la funzione g nellintorno U .


Si ha inoltre che la derivata della funzione g, cio`e la sua matrice Jacobiana nel punto (xm+1 , . . . , xn ) `e data da

1
Jxm+1 ,...,xn f (x).
Jg(xm+1 , . . . , xn ) = Jx1 ,x2 ,...,xm f (x)
Osservazione Dire che la matrice Jacobiana di f ha rango m equivale a dire che ha rango massimo, dato che m < n.
Osservazione Lipotesi sulla matrice Jacobiana `e lequivalente dellipotesi fy (x) 6= 0 del primo enunciato che abbiamo incontrato. Si osservi che, come in quello il non annullarsi della derivata rispetto ad y permetteva di esplicitare y
in funzione dellaltra (cio`e x), cos` qui la non singolarit`a della derivata rispetto alle variabili x1 , x2 , . . . , xm permette
di esplicitare x1 , x2 , . . . , xm in funzione delle altre (cio`e xm+1 , . . . , xn ).
Osservazione Si noti ancora che tanto la funzione f quanto la funzione implicita g sono funzioni a valori vettoriali.
Questo `e il motivo per cui anche la derivata della g `e una matrice Jacobiana. La formula che fornisce Jg `e lequivalente
f (x,y)
della formula che nel primo enunciato studiato forniva la derivata della funzione implicita, cio`e g (x) = fx (x,y) . Ci
y
sono evidenti analogie con questa formula, soprattutto se riscriviamo questultima evidenziando il reciproco della
derivata:

1
1
e
Jg(xm+1 , . . . , xn ) = Jx1 ,x2 ,...,xm f (x)
Jxm+1 ,...,xn f (x).
g (x) =
fx (x, y)
fy (x, y)
In entrambe si ha linverso della derivata rispetto alle variabili che si vogliono esplicitare per tutte le altre derivate.
Esempio Consideriamo il sistema (non lineare) di equazioni

e poniamo

x21 + x2 x3 = 0
x1 x2 + x23 = 0


 2
x1 + x2 x3
.
f (x1 , x2 , x3 ) =
x1 x2 + x23

Consideriamo poi il punto x = (x1 , x2 , x3 ) = (1, 1, 1), che `e evidentemente una soluzione del sistema. Abbiamo 3
incognite e 2 equazioni: la possibilit`a `e che due delle incognite si possano scrivere in funzione della terza incognita.
Vediamo se, in base al teorema della funzione implicita, `e possibile affermare che in prossimit`a di questa soluzione
x1 , x2 sono funzioni di x3 . La matrice Jacobiana di f `e




2x2 x3 x2
2 1 1
Jf (x1 , x2 , x3 ) =
.
e quindi Jf (1, 1, 1) =
x2 x1 2x3
1 1 2
La condizione sufficiente per affermare quanto sopra `e che la sottomatrice formata dalle colonne relative a x1 , x2 (cio`e
relative alla derivazione rispetto ad x1 , x2 ) sia non singolare (e di conseguenza la matrice Jacobiana abbia rango 2).
La sottomatrice formata dalle prime due colonne `e certamente non singolare dato che il suo determinante `e uguale a
3. Pertanto possiamo affermare che esiste una funzione implicita g definita in un intorno di x3 = 1 a valori in R2 , per
cui si pu`
o scrivere in tale intorno

 
x1 = g1 (x3 )
x1
= g(x3 ) , che significa
.
x2
x2 = g2 (x3 )

10

UNIVR Facolt`
a di Economia Corso di Matematica finanziaria 2008/09

Possiamo anche affermare che nel punto (x1 , x2 ) = (1, 1) la matrice Jacobiana di questa funzione implicita g `e
1  

 

   

1
1
1 3
1
2 1
1
1
1 1
Jx3 f (x) =
=
Jg(1) = Jx1 ,x2 f (x)
=
.
=
2
1 1
2
1
1 2
3
3 3
Da notare che il teorema `e applicabile anche per quanto riguarda la possibilit`a di scrivere (x2 , x3 ) in funzione di x1 e
(x1 , x3 ) in funzione di x2 , dato che tutti i minori del secondo ordine della matrice Jacobiana di f sono diversi da zero.
Esercizio Il sistema di equazioni lineari10


x py = 1
px + y = 1

ha, per p = 0, la soluzione x = 1, y = 1.


Si studi la possibilit`a di esprimere il vettore soluzione (x, y) in funzione del parametro p, in prossimit`a della
soluzione indicata. Si determinino inoltre i tassi di variazione di x e y rispetto a p.
Poniamo



x py 1
F (x, y, p) =
.
px + y + 1

Ovviamente F `e una funzione di R3 R2 e risulta F (1, 1, 0) = 0.


La derivata di F rispetto ad x, y, cio`e la matrice Jacobiana parziale Jx,y f , `e



1
1 p
, da cui Jx,y F (1, 1, 0) =
Jx,y F (x, y, p) =
0
p 1

0
1

Trattandosi della matrice identit`


a, essa `e non singolare. Il teorema della funzione implicita dice allora che `e possibile
esprimere localmente (x, y) in funzione del parametro p, che cio`e possiamo scrivere (x, y) = (x(p), y(p)). 11
Per calcolare il tasso di variazione (cio`e la derivata) di x e y rispetto al parametro serve
 
 
y
1
Jp F (x, y, p) =
, da cui Jp F (1, 1, 0) =
.
x
1
Si ha allora

 
   


1
1
1
1 0
x (0)
.
=
= Jx,y F (1, 1, 0)
Jp F (1, 1, 0) =
y (0)
1
1
0 1

Quindi tanto la x quanto la y variano, al variare del parametro p, in prossimit`a del valore p = 0, con un tasso di
variazione pari a 1. In particolare decrescono nello stesso modo al crescere di p.
In questo caso si pu`
o verificare il risultato ottenuto risolvendo il sistema lineare al variare di p. Si trova facilmente
(regola di Cramer) che le soluzioni sono:
 



1  
  
1
1
1
1 p
1p
1
1 p
x
=
.
=
=
y
1
p 1
1
p 1
1 + p2
1 + p2 1 p
Quindi si ha
d
x (p) = y (p) =
dp

1p
1 + p2

p2 2p 1
,
(1 + p2 )2

e, calcolando tale funzione in p = 0, risulta x (0) = y (0) = 1.


Esercizio Il sistema

(x p)2 + py = 0
px (y + p)2 = 0

ha, per p = 1, la soluzione x = 1, y = 0.


Si studi la possibilit`a di esprimere il vettore (x, y) attraverso una funzione del parametro p, in prossimit`a della
dy
soluzione indicata. Si determinino inoltre dx
dp e dp per p = 1.
` chiaro che se lo vediamo come sistema nelle incognite x, y, p non `
sistema `
e lineare se consideriamo p parametro. E
e lineare.
volutamente notazioni diverse da quelle usate in precedenza, per abituare lo studente a ricordare il significato dei concetti pi`
u che
le notazioni con cui questi vengono espressi. In questo caso ho scritto (x, y) = (x(p), y(p)) per dire che x `
e funzione di p e y `
e pure funzione
di p. Non `
e diverso da scrivere (x, y) = g(p), che necessariamente significa (x, y) = (g1 (p), g2 (p)) e che dice la stessa cosa. Lunica differenza
(formale) `
e che con la prima notazione non ho dato un nome alla funzione (da R a R2 ) che esprime (x, y) in funzione di p: scrivendo x(p)
e y(p) ho evidenziato per`
o che le due componenti sono entrambe funzioni di p. Se si vuole, ho chiamato le due funzioni ancora con x e y.
10 Il

11 Uso

11

UNIVR Facolt`
a di Economia Corso di Matematica finanziaria 2008/09

Poniamo quindi
F (x, y, p) =


(x p)2 + py
.
px (y + p)2

Ovviamente F `e una funzione di R3 R2 e risulta F (1, 0, 1) = 0. Calcoliamo la derivata di F rispetto ad x, y, cio`e


la matrice Jacobiana parziale Jx,y f :
Jx,y F (x, y, p) =

2(x p)
p
p
2(y + p)

da cui

Jx,y F (1, 0, 1) =

0
1

1
2

Questa matrice `e non singolare. Il teorema della funzione implicita dice allora che `e possibile esprimere localmente
(x, y) in funzione del parametro p, che cio`e possiamo scrivere (x, y) = (p) ( `e quindi funzione da R a R2 ).
Inoltre si ha
!
 
   

dx

1
1
0
2 1
1 (1)
dp (1)

(1) =
= dy
.
=
= Jx,y F (1, 0, 1)
Jp F (1, 0, 1) =
2 (1)
0
1
1 0
dp (1)
Questo significa che in prossimit`a del valore p = 1 per un aumento unitario di p la componente x tende ad aumentare di
1. La componente y invece, in corrispondenza ad un aumento unitario di p, `e stazionaria, cio`e non presenta variazioni.
Questa volta il risultato non si pu`
o verificare facilmente risolvendo il sistema, dato che il sistema non `e lineare.