Sei sulla pagina 1di 4

Derivata di una funzione composta di più variabili

Le seguenti pagine sono tratte dal testo Analisi matematica 2 di Enrico


Giusti.
Cominciamo col dare alcune nozioni fondamentali nel seguito.
Definizione 1. Si dice che la funzione f : A ⊂ Rn → Rm è differenziabile
nel punto x0 ∈ A se esiste un’applicazione lineare L : Rn → Rm tale che
f (x0 + h) − f (x0 ) − L(h)
lim =0 (1)
h→0 |h|
Se f è differenziabile in ogni punto di A si dirà differenziabile in A.
L’applicazione L si chiama differenziale della funzione f nel punto x0 e si
indica col simbolo df (x0 ). Il numeratore del limite (1) và inteso nella norma
di Rm . Se si pone σ(x0 , h) = f (x0 + h) − f (x0 ) − L(h), la (1) è equivalente
a
|σ(x0 , h)|m
lim =0 (2)
h→0 |h|n
Indichiamo con (e1 , e2 , .., em ) la base canonica di Rm , allora f (x) = f1 (x)e1 +
f2 (x)e2 + .. + fm (x)em , ove le fi sono funzioni da A in R, inoltre L(v) =
L1 (v)e1 + L2 (v)e2 + .. + Lm (v)em , con Li applicazioni lineari da Rn in R.
Si potrà dunque scrivere che σ(x0 , h) = σ1 (x0 , h)e1 + σ2 (x0 , h)e2 + .. +
σm (x0 , h)em , dove si è posto
σi (x0 , h) = fi (x0 + h) − fi (x0 ) − Li (h) i = 1, 2, .., m
Poichè un vettore di Rm tende a zero se e solo se tutte le sue componenti
tendono a zero, la (2) è equivalente alle relazioni
σ1 (x0 , h) σ2 (x0 , h) σm (x0 , h)
lim = lim = .. = lim =0
h→0 |h|n h→0 |h|n h→0 |h|n
In altre parole la funzione f : A → Rm è differenziabile in x0 se e solo se le
sue componenti f1 , f2 , .., fm sono differenziabili in x0 .
Ricordiamo senza dimostrazione che
Xn Xn
∂fi ∂fi
dfi (x0 )v = (x0 )vk = (x0 )vk ek (3)
k=1
∂xk k=1
∂xk

Allora indicando con J(x0 ) la matrice jacobiana dell’applicazione f nel punto


x0 , di componenti
∂fi
Jik (x0 ) = (x0 ) (4)
∂xk

1
la (3) si scrive in forma compatta come

df (x0 )v = J(x0 )v

Proseguiamo ora con il teorema che ci permetterà di giungere alla regola della
chain − rule.
Siano f : A ⊂ Rn → Rm e g : Rm → Rk , indichiamo con F la funzione
composta F = g ◦ f allora vale il seguente:
Teorema 1. Sia f una funzione differenziabile in x0 ∈ A e sia g una fun-
zione differenziabile in y0 = f (x0 ); in tal caso, la funzione composta F = g◦f
è differenziabile in x0 e si ha

dF (x0 ) = dg(y0 ) · df (x0 ) (5)

Dimostrazione. Sia R un numero positivo tale che I(x0 , R) ∈ A. Se si


considera un incremento arbitrario |h|n < R, si ha

f (x0 + h) = f (x0 ) + df (x0 )h + σ(x0 , h)


g(y0 + k) = g(y0 ) + dg(y0 )k + ρ(y0 , k)

con
σ(x0 , h) ρ(y0 , k)
lim =0 e lim =0 (6)
h→0 |h|n k→0 |k|m
Poniamo

k = df (x0 )h + σ(x0 , h) (7)

Tale assunzione può essere spiegata osservando il seguente grafico per una
funzione di una variabile

f(x0+h)=y0+k
f(x0)=y0

x0 x0+h

Quindi si stà assumendo che k = f (x0 + h)− f (x0 ). In realtà k dovrebbe


essere arbitrario, tuttavia al limite per h → 0 anche l’incremento k dovrà

2
tendere a 0 altrimenti la funzione non sarebbe differenziabile, come invece ci
fornisce l’ipotesi del teorema, dunque l’errore che si commette imponendo la
(7) è nullo per h → 0. Presa ora una costante positiva Q è possibile affermare
che
|f (x0 + h) − f (x0 )|m |df (x0 )h + σ(x0 , h)|m
= ≤Q
|h|n |h|n
ovvero

|k|m ≤ Q|h|n (8)

D’altra parte si ha

F (x0 + h) = g(f (x0 + h)) =


= g(y0 + k) = g(y0 ) + dg(y0 )k + ρ(y0 , k)

Sfruttando la (7) si può proseguire con

F (x0 + h) = F (x0 ) + dg(y0 )(df (x0 )h + σ(x0 , h)) + ρ(y0 , k) =


= F (x0 ) + dg(y0 )df (x0 )h + dg(y0 )σ(x0 , h) + ρ(y0 , k)

Si ottiene infine

F (x0 + h) − F (x0 ) − dg(y0 )df (x0 )h = dg(y0 )σ(x0 , h) + ρ(y0 , k)

Quindi la condizione necessaria e sufficiente per dimostrare il teorema è

dg(y0 )σ(x0 , h) + ρ(y0 , k)


lim =
k→0 |h|n
dg(y0 )σ(x0 , h) ρ(y0 , k)
= lim + lim =0 (9)
h→0 |h|n h→0 |h|n

Il primo addendo tende a zero quando |h|n tende al vettore nullo in forza
della (6). Per quanto riguarda il secondo addendo si pone
½
ρ(y0 , k)/|k|m k 6= 0
R(y0 , k) =
0 k=0

Possiamo asserire la seguente

ρ(y0 , k) |k|m
= R(y0 , k)
|h|n |h|n

3
Sfruttando le (6) segue immediatamente

lim R(y0 , k) = 0
h→0

Quest’ultima affermazione, insieme alla (8), ci portano a concludere che

|k|m ρ(y0 , k)
R(y0 , k) ≤ QR(y0 , k) ⇒ lim =0
|h|n h→0 |h|n

E il teorema è cosı̀ provato.


Se v è un vettore di Rn , e se si pone w = df (x0 )v, si ha per la (3)

Xn
∂fi
wi = (x0 )vj ej
j=1
∂x j

quindi
m
X m ½
n X
X ¾
∂gk ∂gk ∂fi
dgk (y0 )w = (y0 )wi = (y0 ) + (x0 ) vj ej
i=1
∂yi j=1 i=1
∂yi ∂xj

ma per la (5)
n
X ∂Fk
dgk (f (x0 ))w = dgk (y0 )w = dgk (y0 )df (x0 )v = dFk (x0 )v = (x0 )vj ej
j=1
∂xj

Ottenendo infine la regola della chain − rule


m
X ∂gk
∂Fk ∂fi
(x0 ) = (y0 ) (x0 )
∂xj i=1
∂yi ∂xj

O in forma più coincisa, sfruttando la (4)

JF (x0 ) = Jg (y0 )Jf (x0 )