Sei sulla pagina 1di 42

Julio C. Carrillo E.

Profesor Escuela de Matemáticas


Universidad Industrial de Santander

Monday, November 5, 2007 at 8:44 am


(FA07.01,02)
Para uso exclusivo en el salón de clase.
2007 c Julio C. Carrillo E.

Universidad
Industrial de
Santander

Escuela de Matemáticas
Universidad Industrial de Santander
2008
Agradecimientos a todos aquellos estudiantes que con sus
preguntas ayudan a mejor los contenidos de este mate-
rial.

Definitivamente, hasta los que enseñamos también


aprendemos, si prestamos un poco de atención en cla-
se.
El Autor
Tabla de contenidos

1. Preliminares 11
1.1. El espacio euclidiano n–dimensional . . . . . . . . . . . . . . 11
1.2. Producto escalar . . . . . . . . . . . . . . . . . . . . . . . . . 12
1.3. Longitud o norma . . . . . . . . . . . . . . . . . . . . . . . . 12
1.4. Ángulo entre dos vectores . . . . . . . . . . . . . . . . . . . . 13
1.5. Ángulos directores y cosenos directores . . . . . . . . . . . . . 14
1.6. Proyecciones . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
1.7. Trabajo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
1.7.1. Con desplazamiento a lo largo de una lı́nea recta . . . 15
1.7.2. Con desplazamiento a lo largo de una trayectoria no
lineal . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
1.8. El producto cruz de vectores . . . . . . . . . . . . . . . . . . 17
1.9. Triple producto escalar de vectores . . . . . . . . . . . . . . . 18
1.10. Lı́neas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
1.11. Planos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19

2. Funciones vectoriales 21
2.1. Definición, dominio, imagen, gráfica . . . . . . . . . . . . . . 21
2.2. Operaciones algebraicas con funciones vectoriales . . . . . . . 22
2.3. Lı́mite . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
2.4. Continuidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
2.5. Derivada . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
2.6. Integral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
2.7. Movimiento curvilı́neo . . . . . . . . . . . . . . . . . . . . . . 27
2.7.1. Vector tangente, Vector tangente unitario, vector nor-
mal y plano osculador . . . . . . . . . . . . . . . . . . 27
2.7.2. Velocidad, rapidez y aceleración . . . . . . . . . . . . 29
2.7.3. Longitud de arco . . . . . . . . . . . . . . . . . . . . . 30
2.7.4. Curvatura de una curva . . . . . . . . . . . . . . . . . 33
2.7.5. Fuerzas definidas mediante funciones vectoriales . . . 34
2.7.6. Fuerzas definidas mediante campos vectoriales . . . . 38

3. Funciones de varias variables 41


3.1. Las funciones de varias variables . . . . . . . . . . . . . . . . 41
3.2. Lı́mite y continuidad . . . . . . . . . . . . . . . . . . . . . . . 45
3.2.1. Lı́mite . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
3.2.2. Continuidad . . . . . . . . . . . . . . . . . . . . . . . . 50
3.3. Derivada . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52
3.4. Gradientes y derivadas direccionales . . . . . . . . . . . . . . 67
3.5. Extremos de funciones de varias variables . . . . . . . . . . . 68
3.5.1. Extremos locales y optimización global . . . . . . . . . 69
3.5.2. Optimización con restricciones . . . . . . . . . . . . . 74

4. Integración múltiple 77
4.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77
4.2. Integrales dobles . . . . . . . . . . . . . . . . . . . . . . . . . 77
4.2.1. Integrales doble sobre dominios rectangulares . . . . . 77
4.2.2. Integrales iteradas . . . . . . . . . . . . . . . . . . . . 79
4.2.3. Integrales dobles sobre regiones mas generales . . . . . 83
4.2.4. Cambio en el orden de integración . . . . . . . . . . . 84
4.2.5. Integrales dobles en coordenadas polares . . . . . . . . 85
4.2.6. Aplicaciones de las integrales dobles . . . . . . . . . . 86
4.3. Integrales triples . . . . . . . . . . . . . . . . . . . . . . . . . 88
4.3.1. Aplicaciones de las integrales triples . . . . . . . . . . 91
4.4. Integrales triples en coordenadas cilı́ndricas y esféricas . . . . 92
4.4.1. Coordenadas cilı́ndricas . . . . . . . . . . . . . . . . . 93
4.4.2. Coordenadas esféricas . . . . . . . . . . . . . . . . . . 93
4.5. Cambio de variables . . . . . . . . . . . . . . . . . . . . . . . 94

5. Cálculo vectorial 95
5.1. Campos vectoriales . . . . . . . . . . . . . . . . . . . . . . . . 95
5.1.1. Definición de campo vectorial, y su primera clasificación 95
5.1.2. Segunda clasificación de los campos vectoriales . . . . 98
5.1.3. Lı́neas de flujo y flujos de campos vectoriales . . . . . 101
5.2. Calculo integral en el plano . . . . . . . . . . . . . . . . . . . 104
5.2.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . 104
5.2.2. Trabajo e integral de lı́nea . . . . . . . . . . . . . . . . 104
5.2.3. Curvas y parametrización de curvas . . . . . . . . . . 104
5.2.4. Teorema de Green . . . . . . . . . . . . . . . . . . . . 104
5.2.5. El Teorema de Green y campos vectoriales divergen-
tes, rotacionales y conservativos . . . . . . . . . . . . . 104
5.3. Calculo integral en el espacio . . . . . . . . . . . . . . . . . . 104
5.3.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . 104
5.3.2. Integral de lı́nea en el espacio . . . . . . . . . . . . . . 106
5.3.3. Superficies y parametrización de una superficie . . . . 106
5.3.4. Integral de superficie . . . . . . . . . . . . . . . . . . . 106
5.3.5. Trabajo e integral de superficie . . . . . . . . . . . . . 106
5.3.6. Teorema de la divergencia de Gauss . . . . . . . . . . 106

iv Julio C. Carrillo E. Para uso exclusivo en el salón de clase – UIS


5.3.7. Teorema de Stokes . . . . . . . . . . . . . . . . . . . . 106
5.3.8. Consecuencias e implicaciones del Teorema de Green
y Teorema de Stokes sobre campos vectoriales diver-
gentes, rotacionales y conservativos . . . . . . . . . . . 106
5.4. Aplicaciones fı́sicas . . . . . . . . . . . . . . . . . . . . . . . . 106
5.4.1. Dinámica . . . . . . . . . . . . . . . . . . . . . . . . . 106
5.4.2. Dinámica de fluidos . . . . . . . . . . . . . . . . . . . 106
5.4.3. Electromagnetismo . . . . . . . . . . . . . . . . . . . . 106
5.4.4. Conducción de calor . . . . . . . . . . . . . . . . . . . 106
5.4.5. Termodinámica . . . . . . . . . . . . . . . . . . . . . . 106

Para uso exclusivo en el salón de clase – UIS Cálculo en Varias Variables v


3 Funciones de varias variables

3.1. Las funciones de varias variables


Funciones de n variables, Sea D un subconjunto no vacı́o de Rn . Una función f que asigna a cada pun-
dominio, imagen y gráfica to x = (x1 , . . . , xn ) de D un número real f (x) = f (x1 , . . . , xn ) se llama una
función de n variables con dominio D y valores reales. La razón de llamarse
a f una función de n variables es simplemente por las n coordenadas que
tiene el punto x = (x1 , . . . , xn ) y la imagen f (x) = f (x1 , . . . , xn ) depende
de esas n coordenadas. Las coordenadas x1 , . . . , xn serán las variables inde-
pendientes de f y xn+1 = f (x) = f (x1 , . . . , xn ) la variable independiente.
Entonces, x = (x1 , . . . , xn ) sera la preimagen y xn+1 = f (x) = f (x1 , . . . , xn )
la imagen.
Por ejemplo,
xy
f (x, y) = + ln(x2 + y 2 )
x−y
f (x, y) = x2 + y 2
son funciones en dos variables, las independientes son x, y y la variable
dependiente es z = f (x, y). De igual modo,
f (x, y, z) = x2 + y 2 − z 2
es una función en tres variables dependientes x, y, z y la variable dependiente
es w = f (x, y, z). Un ejemplo mas general es la función polinómica en cinco
variables
f (x1 , x2 , x3 , x4 , x5 ) = x1 − 2x22 + x3 x34 x25
en la cual las cinco variables independientes son x1 , x2 , x3 , x4 , x5 y la variable
dependiente es x6 = f (x1 , x2 , x3 , x4 , x5 ).
Observación 3.1. Las funciones de n variables también se suelen denotar
de la forma f : D ⊆ Rn → R. Desde el punto de vista fı́sico, las funciones
de varias variables son llamadas campos escalares.
Sea f : D ⊆ Rn → R una función en n variables. El subconjunto D de Rn
es llamado el dominio de f y el subconjunto R de todas los valores f (x) la
imagen de f . La gráfica de f es el subconjunto de Rn+1 que consta de todos
los puntos (x, f (x)). Simbólicamente,
D f = D ⊆ Rn
If = {f (x) ∈ R | x ∈ D})
Gf = {(x, f (x)) ∈ Rn+1 | x ∈ D}

También, la imagen y gráfica de f se pueden representar en términos de


las variables independientes x1 , . . . , xn y la variable dependiente xn+1 =
f ((x1 , . . . , xn )):
If = {f (x1 , . . . , xn ) | (x1 , . . . , xn ) ∈ D}
Gf = {(x1 , . . . , xn , f (x1 , . . . , xn )) ∈ Rn+1 | (x1 , . . . , xn ) ∈ D}.
Tambien se puede considerar

Gf = {(x1 , . . . , xn , xn+1 ) ∈ Rn+1 | xn+1 = f (x1 , . . . , xn )


para algún (x1 , . . . , xn ) ∈ Df }

Una función escalar es una función en una variable. Para hacer hacer consis-
tentes las definiciones de la gráfica de funciones de una y varias variables se
debe considerar en general la gráfica f como un subconjunto de Rn+1 . Tam-
bién por esta razón las funciones de varias variables se designan mediante
letras minúsculas del alfabeto tales como f , g, etc. Desde el punto de vista
geométrico se consideran únicamente gráficas de funciones de n variables
cuando n = 1, 2. Si n = 1, la gráfica de f representa una curva en el plano
xy, y una superficie en el espacio tridimensional xyz cuando n = 3.
Por ejemplo, f (x) = x − 3 es una función en una variable. Su dominio e
imagen consiste del conjunto de los números reales y la gráfica de todos los
puntos (x, x − 3) en R2 que geométricamente representa una linea recta en
el plano xy.
A cada punto en el plano xy la función f (x, y) = x2 + y 2 le asigna un
número real no negativo. Por lo tanto, el dominio de f consiste de R2 ,
gráficamente el plano xy. La imagen consiste de todos los reales no negativos
(gráficamente la parte no negativa del eje z) y la gráfica de f de todos los
punto (x, y, x2 +y 2 ), que gráficamente representa una superficie en el espacio
tridimensional xyz llamada paraboloide.
z

x y

La función
1
f (x, y) = p ,
x − y2
2

esta definida cuando

x2 − y 2 > 0 ≡ y 2 < x2 ≡ |y| < |x| ≡ −|x| < y < |x|.

Geométricamente el dominio de f esta representado en la siguiente figura y


consiste de todos los puntos del plano xy que permanecen entre las gráficas
de y = ±|x|. La imagen es el conjunto de todos los reales positivos, y la

42 Julio C. Carrillo E. Para uso exclusivo en el salón de clase – UIS


p
gráfica el conjunto de todos los puntos (x, y, z) con z = 1/ x2 − y 2 . Es-
ta gráfica no es fácil de realizar y el uso de software gráfico apropiado es
recomendado, GnuPlot por ejemplo.

3
2
1
x
−3 −2 −1 1 2 3
−1
−2
−3

El dominio de la función

p
f (x, y) = x2 − y,

consiste de todos los puntos del plano xy tales que y ≤ x2 .

3
2
1
x
−3 −2 −1 1 2 3
−1
−2
−3

La imagen consistede todos los reales


 no negativos y la gráfica de todos los
p
2
puntos (x, y, z) = x, y, x − y . La representación de la gráfica requiere
de software.
El dominio de la función

 x  −(x2 +y2 ) 2 2
f (x, y) = 10 x3 + xy 4 − e + e−((−x−1,225) +y )
5

consiste todos los puntos del plano xy y la imagen de los números reales.
Formalmente la gráfica de f se puede definir del modo hasta ahora hecho
y esta en el espacio tridimensional xyz. La siguiente figura representa esta

Para uso exclusivo en el salón de clase – UIS Cálculo en Varias Variables 43


gráfica en el dominio [−4, 4] × [−4, 4].
z

x y

Al ser las imágenes de las funciones de varias variables números, las opera-
ciones algebraicas que se realicen con ellas se encuentran determinadas por
las operaciones algebraicas de los números reales. Adicionalmente se pueden
componer esas funciones con las funciones escalares (o de una variable) y las
funciones vectoriales que ya conocemos. A fin de evitar malentendidos con
la definición de composición de funciones, se incluye la siguiente definición
formal de la composición de funciones.
Definición de Sean A, B, C, D conjuntos no vacı́os tales que B, C son de la misma “natu-
composición de funciones raleza”, y f : A → B y g : C → D dos funciones. Si la intersección If ∩ Dg
es no vacı́a, entonces la composición de las funciones f y g, denotada por
g ◦ f , tiene sentido y esta definida por

(g ◦ f )(x) = g(f (x))

para todo x en el dominio de f tal que f (x) esta en la imagen de g.


g◦f

f g
A B C D
x f (x) ∈ Dg g(f (x))
If ∩ Dg 6= ∅

Cuando esto sucede se dice que la función composición g ◦ f tiene sentido.


Algebra de funciones de Sean f, g : D ⊆ Rn → R funciones de varias variables, h : D′ ⊆ R → R una
varias variables función real y R : I ⊆ R → Rn una función vectorial. Para todo x en D se
definen las siguientes funciones:
1. (f + g)(x) = f (x) + g(x)
2. (cf )(x) = cf (x) para toda constante c
3. (f g)(x) = f (x)g(x)
 
f f (x)
4. (x) = si g(x) 6= 0.
g g(x)

44 Julio C. Carrillo E. Para uso exclusivo en el salón de clase – UIS


5. Si la función composición h◦f tiene sentido, entonces define la función
de varias variables

(h ◦ f )(x) = h(f (x)).

6. Si la función composición f ◦R tiene sentido, entonces define la función


real

(f ◦ R)(t) = f (R(t)).

Ejemplo 3.2. Si
xy
f (x, y) = , h(t) = 2t + 1, R(t) = (t, t2 ),
x+y

entonces
 
xy 2xy
(h ◦ f )(x, y) = h(f (x, y)) = h = +1
x+y x+1
t3 t2
(f ◦ R)(t) = f (R(t)) = f (t, t2 ) = 2
= con t 6= 0.
t+t 1+t

Por lo tanto, h ◦ f es una función de dos variables y f ◦ R es una función de


una variable. El dominio de h ◦ f consiste de todos los puntos del plano xy
tales que x 6= 1, y el dominio de f ◦R de todos los números reales t diferentes
de 0 y −1. Observe además que f se puede representar como el cociente de
dos funciones de dos variables, digamos f1 (x, y) = xy y f2 (x, y) = x + y

3.2. Lı́mite y continuidad

Persona que trabaje en el campo de la fı́sica–matemática y sus


aplicaciones y no entienda de que trata el concepto de lı́mite,
tendrá una noción muy limitada de lo que realmente significa
este campo en el area de las ciencias naturales.

La noción de lı́mite esta ı́ntimamente ligada al problema de la aproximación


y continuidad en problemas del tipo causa–efecto. Matemáticamente, un
problemas causa–efecto se representa mediante una función f definida de un
conjunto no vació D ⊆ A en un conjunto B. Las causas están representadas
por los elementos de A y los efectos por elementos de B. Entonces la función
f : D ⊆ A → B, tal que f (a) = b esta en B, para algún a en D, representa
la relación funcional entre causas y efectos, y además enfatiza que el efecto b
es consecuencia o lo produce la causa a: b = f (a). El conjunto A representa
el espacio de las causas, los elementos de D las causas predecibles y los
elementos de A \ D las causas no predecibles. Similarmente, B representa el

Para uso exclusivo en el salón de clase – UIS Cálculo en Varias Variables 45


espacio de las efectos, la imagen If el espacio de las efectos predecibles, y
B \ If el de los efectos no predecibles.

A f B
If
D

a′ b′ = f (a′ )

a′′ b′′

a′′ y b′′ representan posibles causas y efectos no predecibles, respectivamente.


A la causa predecible a′ le corresponde un efecto predecible b′ = f (a′ ).

En la practica y en general, se obtienen (en el laboratorio, por ejemplo) y


con mediana certeza los “valores ideales” del efecto b y la causa a que lo
produce. Los valores reales son únicamente estimaciones de ellos y además
a puede ser eventualmente una causa no predecible. Entonces, el problema
de establecer que tan buena es una estimación de estos valores consiste de
lo siguiente:
1. Fase de aproximación: Dada un efecto aproximado, establecer la cau-
sa aproximada que lo produce. Se debe cumplir que el efecto aproximado
y debe estar cercano del valor b (i.e., y ≈ b) y ser consecuencia de una
causa x (i.e., y = f (x)), siempre que la causa x este muy cercana del
valor a, aun si no es exactamente a (i..e, x ≈ b y x 6= a). Simbólicamente,

f (x) → b cuando x → a, x 6= a,

2. Fase de cuantificación del error: En donde hay aproximaciones, hay


errores. En los conjuntos A y B se deben disponer de algún medio (ins-
trumento) para cuantificar el error en las aproximaciones entre las causas
y los efectos. El error debe entenderse como la medida de la distancia
entre el valor estimado y el valor real, sean en causas o efectos. Cuanti-
ficar el error sera el proceso de medir la distancia entre los valores reales
y estimados. Si los conjuntos A y B son subconjuntos de R, estos errores
de aproximación son obtenidos mediante el valor absoluto, y por tanto

dB (f (x), b) := |f (x) − b|, dA (x, a) := |x − a|.

representaran el error en la aproximación o distancia entre los valores


reales y estimados en los efectos y las causas, respectivamente.
En general, se supone que en los conjuntos A y B es posible definir una
forma de medir distancia de una forma similar a la anterior. Por lo tanto,
si sucede que en las causas f (x) ≈ b cuando en los efectos x ≈ b, aun si
x 6= b, entonces debe tenerse que el error en la aproximación del efecto,
dB (f (x), b), debe ser muy pequeño cuando el error en la aproximación
del efecto, dA (f (x), a), es muy pequeño, aun si x 6= a. Observe que x 6= a
si y solo si dA (x, a) > 0. Simbólicamente,

dB (f (x), b) → 0 cuando dA (x, a) → 0 aun si dA (x, a) > 0.

46 Julio C. Carrillo E. Para uso exclusivo en el salón de clase – UIS


3. Fase de estimación de la magnitud del error: Las magnitudes en el
error deben ser de cierto orden. Este es un requerimiento que es estándar
cuando se realizan estudios experimentales de problemas causa–efecto.
En este tipo de problemas es conocido o dado el orden ǫ del error en la
aproximación de los efectos (en el mundo real esto es precisamente lo que
se puede ver o determinar) y se busca entonces establecer o encontrar el
orden δ del error en la aproximación en las causas, pero de tal modo que
el error en la aproximación de los efectos sea del orden ǫ previamente
dado cuando el error en la aproximación en las causas sea del orden δ
encontrado, aun si el error en las causas no es cero,
Decir que “el error en la aproximación es de cierto orden” significa que
“el error en la aproximación es menor que el orden de aproximación”.
Por lo tanto, en el caso en discusión debemos tener lo siguiente.
Dado el orden ǫ > 0 del error en la aproximación del efecto b,
se busca establecer un orden δ > 0 del error en la aproxima-
ción de la causa a, de tal modo que dB (f (x), b) < ǫ cuando
dA (x, a) < δ, aun si dA (x, a) > 0. Simbólicamente,
Dado un ǫ > 0, se busca un δ > 0 tal que dB (f (x), b) < ǫ
cuando 0 < dA (x, a) < δ.
La notación matemática de lı́mite resume estos tres procesos:

lı́m f (x) = b.
x→a

El problema causa–efecto definido mediante f es un continuo o es continuo


cuando

lı́m f (x) = f (a).


x→a

3.2.1. Lı́mite
Lı́mite de una función de Sea f : D ⊆ Rn → R una función de varias variables y a un punto que
varias variables no necesariamente pertenece al dominio de f . Se dice que lı́mx→a f (x) = L
si dado un ǫ > 0 existe un δ > 0 tal que |f (x) − L| < ǫ siempre que
0 < kx − ak < δ.
Observe que
p
kx − ak = (x1 − a1 )2 + · · · + (xn − an )2

representa la distancia entre los puntos x y a en Rn y

|f (x) − L|

la distancia entre los números reales f (x) y L. En el siguiente sentido debe


entenderse el concepto de existencia del lı́mite L de f en a:
Cuando el punto x está suficientemente cercano de a, pero x 6=
a, entonces el valor de f (x) estará muy cercano de L. La norma
kx − ak y el valor absoluto |f (x) − L| son una medida del error
en esas aproximaciones. Cuantificado el orden ǫ del error en la
aproximación de f (x) a L, se busca entonces cuantificar el orden
δ del error en la aproximación de x a a. Por eso se suele también
denotar el lı́mite de la forma “f (x) → a cuando x → a”, y se
lee “f (x) tiende a a cuando x tiende a a”.

Para uso exclusivo en el salón de clase – UIS Cálculo en Varias Variables 47


Geométricamente, los puntos x se encuentran localizados en el interior de
una esfera n–dimensional de centro en a y radio δ, sin el punto a, y los
valores f (x) en el intervalo abierto (L − ǫ, L + ǫ).
Unicidad del lı́mite Proposición 3.3. Sea f : D ⊆ Rn → R una función de varias variables y
a un punto que no necesariamente pertenece al dominio de f . Si el lı́mite
lı́mx→a f (x) existe entonces el lı́mite es único; es decir, si lı́mx→a f (x) = L1
y lı́mx→a f (x) = L2 entonces L1 = L2 .
El contrarrecı́proco de este resultado es una herramienta valiosa para probar
que un cierto lı́mite no existe:
Si el lı́mite lı́mx→a f (x) no es único, entonces lı́mx→a f (x) no
existe.
A diferencia del calculo de funciones de una variables, en donde existen
únicamente dos direcciones para aproximar el punto al cual se toma el lı́mite,
para las funciones de varias variables existen multiplies direcciones, y además
trayectorias, para que el punto x aproxime el punto lı́mite a. Si el lı́mite
existe, entonces el lı́mite es independiente de la trayectoria que pase por el
punto. Si el lı́mite no existe, es suficiente demostrar que a lo largo de dos
trayectorias C1 y C2 que pasen por el punto a, la función f (x) tiene dos
limites distintos.
Ejemplo 3.4. Sea
xy
f (x, y) = 2 .
x + y2
El dominio de f consiste de todos los puntos del plano xy con excepción del
origen. Consideremos la ecuación y = mx de una recta de pendiente m que
pasa por el origen. Entonces
mx2 m m
f (x, y) = = → cuando x → 0, y = mx,
x2 + m2 x2 1 + m2 1 + m2
o
mx2 m
lı́m f (x, y) = lı́m = .
x→0 x→0 x2 + m2 x2 1 + m2
y=mx

Por lo tanto el lı́mite de f en el origen del plano no existe: diferentes va-


lores de m producen curvas diferentes a lo largo de las cuales f tiene limi-
tes diferentes. Para cualquier otro punto del plano xy el lı́mite de f existe
(probarlo).
Ejemplo 3.5. La función
x2 − y 2
f (x, y) =
x2 + y 2
también esta definida para todo punto del plano xy con excepción del origen.
De nuevo, observe que
x2 − 0
lı́m f (x, y) = lı́m = 1,
x→0 x→0 x2 + 0
y=0

0 − y2
lı́m f (x, y) = lı́m = −1,
x=0 y→0 0 + y 2
y→0

en donde x = 0 es una recta horizontal que pasa por el origen y y = 0 es


una recta vertical que también pasa por el origen. Por lo tanto, f no tiene
lı́mite en el origen del plano xy.

48 Julio C. Carrillo E. Para uso exclusivo en el salón de clase – UIS


Ejemplo 3.6. También la función
x4 − y 4
f (x, y) =
x2 + y 2
esta definida para todo punto del plano xy con excepción del origen. No
obstante, como el lı́mite

x4 − y 4 (x2 − y 2 )(x2 + y 2 )
lı́m = lı́m
(x,y)→(0,0) x2 + y 2 (x,y)→(0,0) x2 + y 2
= lı́m (x2 − y 2 ) = 0 − 0 = 0
(x,y)→(0,0)

e independiente de la trayectoria que pase por el origen del plano xy, enton-
ces f tiene lı́mite cero en el origen.
3x2 y
Ejemplo 3.7. Determine si el lı́mite de la función f (x, y) = 2 existe
x + y2
en (0, 0).

Solución. Como
3x2 (mx) 3mx
lı́m f (x, y) = lı́m = =0
x→0 x→0 x2 + (mx)2 1 + m2
y=mx

y
0
lı́m f (x, y) = lı́m = 0,
x=0
y→0
y→0 y2

e igual sucede tomando el lı́mite a lo largo de las parabolas y = ax2 y


x = ay 2 con a 6= 0, se puede intuir que el lı́mite vale 0. Desafortunadamente
esto no prueba que el lı́mite es 0, pues el resultado depende de la trayectoria
que pasa por el origen. Para demostrar que el lı́mite es cero se aplica la
definición de lı́mite.
Sea ǫ > 0 dado. Se debe encontrar un δ > 0 tal que
3x2 y


x2 + y 2 − 0 < ǫ siempre que 0 < k(x, y) − (0, 0)k < δ

o equivalentemente,
3x2 |y| p
< ǫ siempre que 0< x2 + y 2 < δ
x2 + y 2
Pero

x2 < x2 + y 2 , y 2 < x2 + y 2 .

Por lo tanto,
3x2 |y| p p
2 2
< 3|y| = 3 y 2 < 3 x2 + y 2 < 3δ.
x +y
Como se requiere que
3x2 |y|
< ǫ,
x2 + y 2

Para uso exclusivo en el salón de clase – UIS Cálculo en Varias Variables 49


p
es suficiente elegir 3δ = ǫ. Entonces δ = ǫ/3 y al hacer 0 < x2 + y 2 < ǫ/3
se obtiene
3x2 y
ǫ
p
2 2
x2 + y 2 − 0 ≤ 3 x + y < 3 3 = ǫ

Por consiguiente,

3x2 y
lı́m = 0.
(x,y)→(0,0) x2 + y 2

Propiedades del lı́mite Proposición 3.8. Sean f, g : D ⊆ Rn → R funciones de n variables que


poseen lı́mite en un punto a que no necesariamente pertenece a D. Entonces
las funciones f + g, cf (c un constante cualquiera), f g, f /g también poseen
lı́mite en a y además
1. lı́m (f (x) + g(x)) = lı́m f (x) + lı́m g(x)
x→a x→a x→a
2. lı́m (cf (x)) = c lı́m f (x)
x→a x→a
3. lı́m f (x)g(x) = lı́m f (x) lı́m g(x)
x→a x→a x→a

f (x) lı́m f (x)


4. lı́m = x→a si lı́m g(x) 6= 0.
x→a g(x) lı́m g(x) x→a
x→a
5. Sea h : D′ ⊆ R → R una función real tal que la función compuesta h ◦ f
esta definida. Si los lı́mites lı́m f (x)(≡ L) y lı́m h(t) existen, entonces
x→a t→L
el lı́mite de h ◦ f existe en a y además
 
lı́m h(f (x)) = h lı́m f (x) .
x→a x→a

6. Sea R : D′ ⊆ R → Rn una función vectorial tal que la función compuesta


f ◦ R esta definida. Si los lı́mites lı́m R(t)(≡ L) y lı́m f (x) existen,
t→t0 x→L
entonces el lı́mite de f ◦ R existe en t0 y además
 
lı́m f (R(t)) = f lı́m R(t) .
t→t0 t→t0

3.2.2. Continuidad
Continuidad puntual Definición 3.9. Se dice que una función de varias variables f : D ⊆ Rn →
R es continua en a si y solo si

lı́m f (x) = f (a),


x→a

o lo que es lo mismo,

lı́m f (a + h) = f (a).
h→0

En caso contrario, f se dice es discontinua en a.


Esta definición significa que f (a) y lı́mite de f en a existen, y el valor de f
y el lı́mite de f son iguales en a. De otro lado, la condición de existencia de
f (a) es equivalente a la condición que el punto a pertenezca al dominio de
f.

50 Julio C. Carrillo E. Para uso exclusivo en el salón de clase – UIS


x2 − y 2
Ejemplo 3.10. La función f (x, y) = no tiene lı́mite en el origen
x2 + y 2
del plano. Entonces f es discontinua en (0, 0). También se puede argumentar
que f no esta definida en el origen del plano.
Ejemplo 3.11. La función
 4 4
x − y si (x, y) 6= (0, 0)
f (x, y) = x + y 2
2

1 si (x, y) = (0, 0)

tiene lı́mite cero en el origen del plano y f (0, 0) = 1. Entonces f es discon-


tinua en el origen.
Propiedades de la Proposición 3.12. Sean f, g : D ⊆ Rn → R funciones de n variables
continuidad puntual que son continuas en el punto a. Entonces las funciones f + g, cf (c un
constante cualquiera), f g, f /g también continuas en a y además
1. lı́m (f (x) + g(x)) = f (a) + g(a)
x→a
2. lı́m (cf (x)) = cf (a)
x→a
3. lı́m f (x)g(x) = f (a) g(a)
x→a
f (x) f (a)
4. lı́m = si g(a) 6= 0.
x→a g(x) g(a)
5. Sea h : D′ ⊆ R → R una función de una variable tal que la función
compuesta h ◦ f esta definida. Si f es continua en a y h es continua en
f (a), entonces la función de varias variables h ◦ f es continua en a y
además
 
lı́m h(f (x)) = h lı́m f (x) .
x→a x→a

6. Sea R : D′ ⊆ R → Rn una función vectorial tal que la función compuesta


f ◦ R esta definida. Si R es continua en t0 y f es continua en R(t0 ),
entonces la función escalar f ◦ R es continua en t0 y además
lı́m f (R(t)) = f (R(t0 )).
t→t0

Continuidad global y Definición 3.13. Una función de varias variables f es continua en el un


propiedades conjunto D′ si f es continua en cada punto de D′ .
Las propiedades de continuidad de funciones de varias variables en un con-
junto de su dominio se obtienen de una manera natural de las propiedades
de continuidad puntual.
Los monomios x, y y c, con c un escalar cualquiera, se puede demostrar
fácilmente son funciones continuas en R2 :
lı́m x=a
(x,y)→(a,b)

lı́m y=b
(x,y)→(a,b)

lı́m c=c
(x,y)→(a,b)

para cualquier punto (a, b) en R2 . Por lo tanto, de las propiedades del pro-
ducto de funciones continuas el monomio cxn y m , para algún número entero
no negativo m, es también continuo en R2 :
lı́m cxm y m = cam bm
(x,y)→(a,b)

Para uso exclusivo en el salón de clase – UIS Cálculo en Varias Variables 51


para cualquier punto (a, b) en R2 . De la propiedad de la suma de funciones
continuas el polinomio p(x, y) en dos variables sera también una función
continua en R2 :

lı́m p(x, y) = p(a, b)


(x,y)→(a,b)

para todo punto (a, b) en R2 .


Ejemplo 3.14. Evaluar

lı́m (x2 y 3 − x3 y 2 + 3x + 2y).


(x,y)→(1,−2)

Solución. Como los polinomio son funciones continuas en R2 , entonces

lı́m (x2 y 3 − x3 y 2 + 3x + 2y) = −8 − 4 + 3 − 4 = −13.


(x,y)→(1,−2)

Una función racional f en dos variables es el cociente de dos polinomios, y


sera una función continua en R2 con excepción de aquellos puntos (x, y) en
donde el denominador de f se anula. Por ejemplo, la función racional
2xy + 1
f (x, y) =
x2 + y 2

esta definida en todo R2 con excepción del origen. Por tanto, f es continua
en R2 con excepción del origen.
Ejemplo 3.15. Determine la continuidad de la función

f (x, y) = ln(x2 + y 2 − 1).

Solución. La función logaritmo natural es continua para todo número real


positivo, y la función g(x, y) = x2 + y 2 − 1 es continua para todo valor de
x y y. De la propiedad de composición de funciones continuas se concluye
que la función f es continua para todos los puntos (x, y) en R2 tales que
x2 + y 2 > 1.
Ejemplo 3.16. Determine la continuidad de la función
p
1 − x2 − y 2
f (x, y) = .
x2 − y 2

Solución. De la propiedad de composición de funciones continua se tiene


que el numerador de f es continuo para todo punto (x, y) en R2 tal que
x2 + y 2 < 1. El denominador de f es continuo para todo punto (x, y) en
R2 , y es cero cuando y = ±|x|. De la propiedad del cociente de funciones
continuas se obtiene que f es continua para todo punto (x, y) en R2 tal que
x2 + y 2 < 1 y y 6= ±|x|.

3.3. Derivada
La derivada de una función escalar f (x) se puede considerar como el lı́mite
del cociente diferencias de Newton de la función a lo largo del eje x:

f (x + h) − f (x)
f ′ (x) = lı́m .
h→0 h

52 Julio C. Carrillo E. Para uso exclusivo en el salón de clase – UIS


La derivada de una función en n variables su puede considerar de igual
manera, solo que existirán n posibles alternativas (o ejes coordenados) cada
una de las cuales se llaman las derivadas parciales de la función con respecto
a la dirección considerada.
Derivadas parciales Definición 3.17. Sea f : D ⊆ Rn → R una función de n variables. Las
derivadas parciales fx1 , . . . , fxn de f con respecto a las variables x1 , . . . , xn
en el punto x = (x1 , . . . , xn ) se define en forma vectorial como
f (x + hej ) − f (x)
fxj (x) = lı́m
h→0 h
o en forma cartesiana como
f (x1 , . . . , xj + h, . . . , xn ) − f (x1 , . . . , xn )
fxj (x1 , . . . , xn ) = lı́m ,
h→0 h
para j = 1, . . . , n, si cada uno de estos limites existe. Otras notaciones de
las derivada parcial de f con respecto a la variable xj son las siguientes:
∂f
fxj (x) = fj (x) = (x) = ∂j f (x) = Dxj f (x) = Dj f (x).
∂xj
Cuando n = 2, se denota z = f (x, y) y las derivadas parciales de f también
se denotan como
∂f ∂z
fx = = = zx
∂x ∂x
∂f ∂z
fy = = = zy
∂y ∂x
Cuando n = 3, se considera w = f (x, y, z) y las derivadas parciales de f
también se denotan como
∂f ∂w
fx = = = wx
∂x ∂x
∂f ∂w
fy = = = wy
∂y ∂y
∂f ∂w
fz = = = wz
∂z ∂z
Ejemplo 3.18. Considere la función f (x, y) = x2 y. Entonces

f (x + h, y) − f (x, y) (x + h)2 y − x2 y
fx (x, y) = lı́m = lı́m
h→0 h h→0 h
(x + h)2 − x2 d(x2 )
= lı́m ·y = · y = 2xy
h→0 h dx
Similarmente,
fx (x, y) = x2 .

Al calcularse la derivada parcial de f con respecto a la variable xj como el


lı́mite de la variación de los cocientes de diferencias de Newton a lo largo de
la dirección del eje coordenado xj , ej , se mantienen fijas las restantes direc-
ciones. Por esto, en lugar de calcular la derivada parcial de f con respecto
a la variable xj mediante la definición, la derivada parcial fxj se pueden
calcular de forma directa manteniendo las otras variables fijas y derivando
con respecto a la variable xj . Las reglas ordinarias de la derivación aplican.

Para uso exclusivo en el salón de clase – UIS Cálculo en Varias Variables 53


Ejemplo 3.19. Encuentre fx y fy si f (x, y) = x3 y − x sen y.

Solución. para encontrar fx se considera y constante y se deriva con res-


pecto a x:

fx (x, y) = 3x2 y − sen y.

Similarmente, para encontrar fy se considera x constante y se deriva con


respecto a y:

fy (x, y) = x3 − x cos y.

Ejemplo 3.20. Encuentre las derivadas parciales de la función f (x, y, z) =


2 2 2
xyze−x −y −z .

Solución. Al igual que en el caso de las funciones de dos variables, cada


vez que se va a derivar con respecto a una de las variable se consideran las
otras dos como constantes y se deriva aplicando las reglas ordinarias de la
derivada. En este caso,

2
−y 2 −z 2 2
−y 2 −z 2
fx (x, y) = yze−x − 2x2 yze−x
2
−y 2 −z 2 2
−y 2 −z 2
fy (x, y) = xze−x − 2xy 2 ze−x
2
−y 2 −z 2 2
−y 2 −z 2
fz (x, y) = xye−x − 2xyz 2 e−x

Interpretación de las Considere la gráfica de función de dos variables z = f (x, y). El plano x = x0
derivadas parciales interseca la gráfica de f en la curva plana de la figura y el valor fy (x0 , y0 )
es la pendiente de la recta tangente a esta curva en el punto P .
z

b P (x0 , y0 , z0 )

(x0 , y0 , 0)
x y

También, el plano y = y0 interseca la gráfica de f en la curva plana de la


figura y el valor fx (x0 , y0 ) es la pendiente de la recta tangente a esta curva
en el punto P .

54 Julio C. Carrillo E. Para uso exclusivo en el salón de clase – UIS


z

P (x0 , y0 , z0 ) b

(x0 , y0 , 0) y
x

Ejemplo 3.21. Considere el paraboloide de ecuación f (x, y) = 9 − x2 − y 2 .


(a) El paraboloide y el plano x = 1 se intersecan en una curva C1 . Encontrar
las ecuaciones paramétricas de la recta tangente en (1, 1, 7). (b) Igualmente,
el paraboloide y el plano y = 1 se intersecan en curva C2 . Encontrar las
ecuaciones paramétricas de la recta tangente en (1, 1, 7). (c) Encuentre al
ecuación del plano tangente al paraboloide en el punto (1, 1, 7).

Solución. (a) Como fy (x, y) = −2y entonces fy (1, 1) = −2 es la pendiente


de la recta tangente a la curva en (1, 1, 7) y como esta recta tiene el vector
director d1 = (0, 1, −2), entonces
x = 1, y = 1 + t, z = 7 − 2t
representan las ecuaciones paramétricas de la recta tangente en (1, 1, −7).
(b) En este caso, fy (x, y) = −2x y fx (1, 1) = −2 es la pendiente de la
recta tangente a C2 en (1, 1, −7). Como el vector director de esta recta es
d2 = (1, 0, −2), entonces
x = 1 + t, y = 1, z = 7 − 2t
representan las ecuaciones paramétricas de la recta tangente en (1, 1, −7).
(c) El vector normal al plano tangente esta dado por

i j k

η = d1 × d2 = 0 1 −2 = (−2, −2, −1).
1 0 −2
y
−2(x − 1) − 2(y − 1) − (z + 7) = 0
representa la ecuación del plano tangente en el punto (1, 1, −7).

Derivadas parciales de Por ser las derivadas parciales de una función de varias variables otra función
segundo orden de varias variables, se puede nuevamente intentar calcular sus derivadas
parciales. Sea f : D ⊆ Rn → R una función de n variables. Las segunda
derivada parcial fxi xj de f con respecto a las variables x1 , . . . , xn en el punto
x = (x1 , . . . , xn ) se define en forma vectorial como
fxj (x + hek ) − fxj (x)
fxj xk (x) = lı́m
h→0 h

Para uso exclusivo en el salón de clase – UIS Cálculo en Varias Variables 55


para j, k = 1, . . . , n, si el lı́mite existe. Las segundas derivadas parciales de f
se suelen llamar derivadas parciales de segundo orden, y también se denotan
de la siguiente forma:

∂2f
 
 ∂ ∂f
fxj xk (x) = fxj (x) x = fjk (x) = (x) = (x)
k ∂xk ∂xj ∂xk ∂xj

Segundas derivadas Las segundas derivadas parciales fxj xk se llaman mixtas cuando j es dife-
parciales mixtas rente de k. Una función z = f (x, y) en dos variables tiene cuatro segundas
derivadas parciales, de las cuales dos son derivadas parciales mixtas:

∂2f
 
∂ ∂f
fxx = =
∂x ∂x ∂x2
∂2f
 
∂ ∂f
fxy = =
∂y ∂x ∂y∂x
∂2f
 
∂ ∂f
fyx = =
∂x ∂y ∂x∂y
∂ 2f
 
∂ ∂f
fyy = =
∂y ∂y ∂y 2
Derivadas parciales de Operativamente hablando, es fácil pensar como calcular las derivadas par-
orden superior ciales de orden m de una función de n variables. Desde el punto de vista
matemático la notación se complica un poco, pero no es sustancialmente im-
portante en la comprensión de lo que entenderemos como todas las derivadas
parciales de orden m de f .
Las derivadas parciales de orden m de una función en n variables f se pueden
denotar por
∂ mf
∂xj11 ∂xj22 · · · ∂xjnm
en donde los escalares j1 , . . . , jm son números enteros no negativos tales que
j1 + j2 + · · · + jm = m. Es decir,
  jm !
∂mf ∂ j1 +j2 +···+jm f ∂ j1 ∂ j2 ∂ f
j1 j2 jm = j1 j2 jm = j1 j2 ···
∂x1 ∂x2 · · · ∂xn ∂x1 ∂x2 · · · ∂xn ∂x1 ∂x2 ∂xjmm

Por ejemplo, si f es una función en cuatro variables x, y, z, w entonces una


derivada parcial de sexto orden de f es

∂6f ∂2
  3 
∂ ∂ f
= := f3012 := fw3 yx2
∂x2 ∂y∂w3 ∂x2 ∂y ∂w3

Derivadas parciales Las derivadas parciales de orden m de f se pueden clasificar en dos cate-
mixtas de orden superior gorı́as. Las derivadas parciales de exactamente orden m de f con respecto
a la variable xk serán
∂ mf
   
∂ ∂ ∂f
= ··· (m veces) para k = 1, . . . , n.
∂xmk ∂xk ∂xk ∂xk

Cualquier otra derivada de orden m de f que no sea con respecto únicamente


a una de las variables x1 , . . . , xn serán las derivadas parciales mixtas de
orden m de f .

56 Julio C. Carrillo E. Para uso exclusivo en el salón de clase – UIS


Ejemplo 3.22. Encuentre las terceras derivadas parciales de la función
f (x, y) = xey − 3 cos(x − y).

Solución.
fx (x, y) = ey + sen(x − y) fy (x, y) = xey − sen(x − y)
fxx (x, y) = cos(x − y) fxy (x, y) = ey − cos(x − y)
fyx (x, y) = ey − cos(x − y) fyy (x, y) = xey + cos(x − y)
fxxx (x, y) = − sen(x − y) fxxy (x, y) = sen(x − y)
fxyx (x, y) = sen(x − y) fxyy (x, y) = ey − sen(x − y)
fyxx (x, y) = sen(x − y) fyxy (x, y) = ey − sen(x − y)
fyyx (x, y) = ey − sen(x − y) fyyy (x, y) = xey + sen(x − y)

En el ejemplo anterior, las derivadas parciales mixtas de segundo y tercer or-


den son iguales: fxy = fyx , fxxy = fxyx = fyxx , fxyy = fyxy = fyyx . Leonard
Euler estableció y demostró por primera vez en 1734, en relación con sus
estudios de hidrodinámica, las condiciones que garantizaban esta igualdad.
En general, este resultado se cumple bajo las siguientes condiciones.
Proposición 3.23. Sea f : D ⊆ Rn → R una función de varias variables.
Las derivadas parciales mixtas con respecto a las mismas variables y de
orden m de f son iguales si tales derivadas parciales son continuas.
En otras palabras, si f : D ⊆ Rn → R es una función de varias variables
cuyas derivadas parciales hasta de orden m son continuas entonces las deri-
vadas parciales mixtas de f con respecto a las mismas variables y hasta de
orden m son continuas.
Problema de la no Intuitivamente, la derivada parcial de una función de dos variables no existe
existencia de las cuando la gráfica de la función tiene dobleces, esquinas, huecos, hoyos o
derivadas parciales picos. Por ejemplo, la función f (x, y) = −x2 |y| no tiene derivada parcial
con respecto a y en todo punto de la forma (x, 0), en donde x es un número
real cualquiera diferente de cero. Se observa de la figura que gráfica de f
tiene un doblez a lo largo del eje x debido a la función |y|. De acuerdo a la
definición de la derivada parcial de f ,
(
f (x, 0 + h) − f (x, 0) −x2 |h| x2 si h → 0−
fy (x, 0) = lı́m = lı́m =
h→0 h h→0 h −x2 si h → 0+
Como el lı́mite no es único para todo x diferente de cero, entonces fx (x, 0)
no existe para todos esos valores de x; no obstante, fy (0, 0) = 0. También
se puede demostrar que la derivada parcial fx (0, 0) existe y es cero.
z

x y

Para uso exclusivo en el salón de clase – UIS Cálculo en Varias Variables 57


Ejemplo 3.24. Sea f (x, y) = −x2 |y|. (a) Determine si existen un plano que
pasa por el punto (0, 0, 0) de la gráfica de f . En caso afirmativo, encuentre
la ecuación del plano. (b) ¿Es el plano tangente a la gráfica de f en (0, 0, 0)?
¿Se puede garantiza que el plano tangente a la gráfica de f en (0, 0, 0) existe?
(c) ¿Que relación se puede establecer entre la existencia de las derivadas
parciales en un punto y la existencia de un plano tangente a la gráfica de f
en ese mismo punto?

Solución. (a) Ambas derivadas parciales fx (0, 0) y fy (0, 0) existen y son


cero. Por lo tanto, los vectores directores a las rectas tangentes cuando
x = 0 y y = 0 son d1 = (0, 1, 0) = j y d2 = (1, 0, 0) = i, respectivamente.
La existencia de esto dos vectores no colineales determina la existencia del
plano que pasa por el punto (0, 0, 0) de la gráfica de f . El vector normal al
plano es η = j × i = −k y la ecuación del plano que pasa por (0, 0, 0) es
z = 0.
(b) El plano que pasa por el punto (0, 0, 0) existe, pero desafortunadamente
no es tangente a la gráfica en ese punto. Este hecho se puede observar
directamente de la gráfica de f . Formalmente, por ejemplo los dos puntos
(0, 0, 0) y (0, 2, 0) son distintos y pertenecen tanto a la gráfica de f como al
plano z = 0. Esto nos garantiza que existe un plano que pasa por el punto
(0, 0, 0) de la gráfica de f pero no es tangente a la gráfica de f en (0, 0, 0).
En consecuencia, no existe un plano tangente a la gráfica de f en (0, 0, 0).
(c) Este ejemplo permite concluir que en general la existencia de las deriva-
das parciales de una función en varias variables no garantizan la existencia
del plano tangente a la gráfica de la función. Cosa bien distinta sucede en
las funciones de una variable en donde la existencia de la derivada de la
función implica la existencia de la recta tangente a la gráfica de la función.
En conclusion, la existencia de las derivadas parciales de una función en mas
de una variable no garantiza la existencia del plano tangente a la gráfica de
la función.

Funciones suaves de Intuitivamente una función en dos variables se puede considerar “suave” si
varias variables su gráfica no tiene dobleces, esquinas, huecos, hoyos o picos. El problema es
como convertir esta noción intuitiva de suavidad en una noción matemática
que aplique a cualquier función en varias variables. Al igual que en funciones
de una variable, la clave esta en la existencia de las derivadas parciales.
Definición 3.25. Una función de varias variables f : D ⊆ Rn → R se dice
“suave” de orden k en D si las derivadas parciales de orden k de f existen
y son continuas para todo x en D. Se asume que f tiene suavidad de orden
cero si f es continua, y que f es suave si f tiene suavidad de cualquier
orden.
Ejemplo 3.26. La función f (x, y) = x|x|y 4 tiene suavidad de orden cero
y de primer orden, pero no tiene suavidad de segundo orden ni de ningún
orden mayor que dos. Claramente f es continua, y las primeras derivadas
parciales de f existen y son continuas:

fx (x, y) = 2|x|y, fy (x, y) = 4x|x|y 3 .

No obstante, la segunda derivada parcial fxx de f no existe a largo de todo

58 Julio C. Carrillo E. Para uso exclusivo en el salón de clase – UIS


punto (0, y) en el eje y, con y 6= 0:

fx (0 + h, y) − f (0, y) 2|0 + h|y − 2|0|y


fxx (0, y) = lı́m = lı́m
h→0 h h→0 h
(
|h| −2y si h → 0−
= lı́m (2y) =
h→0 h 2y si h → 0+

Por lo tanto f tiene suavidad de primer orden.


Diferenciabilidad Aparentemente la diferenciabilidad de una función f en varias variables es,
en cierto modo, una medida de que tan suave es la función. ¿Y por que tanto
ruido con la diferenciabilidad? Bien, se me ocurre explicarlo de otra manera
que no sea la del mecanismo que decide que tan suave es no una función en
varias variable, y ella es una razón practica. Aunque pueda parecer una idea
sin sentido, la diferenciabilidad de f es de gran utilidad en el campo de las
aplicaciones; en particular, desde el punto de vista computacional. Suponga
que f es una función de varias variables que involucra funciones trascen-
dentes. En la practica los valores de f (x) para un x dado, no se podrán
obtener de forma exacta; de hecho, ni las calculadoras y computadoras mas
avanzadas de hoy dı́a lo pueden hacer. Lo que se hace es recurrir a estimar
una aproximación de f (x) mediante el valor p(x) de un polinomio lineal p
en n variables. ¿Porqué un polinomio lineal? Porque ellos son los polino-
mios de menor grado en n variables que involucran las cuatro operaciones
elementales con las cuales los seres humanos y las computadoras sabemos
operar: suma, resta, multiplicación y division en sus variables.
Tratemos de entender lo que vamos a hacer. Empecemos por el caso mas
sencillo. En las funciones de una variable el valor de f (x) es aproximado por
el valor de un polinomio lineal p(x) que representa la ecuación de la recta
tangente a la gráfica de f en el punto (x0 , f (x0 )), en donde x0 un valor muy
cercano a x. Si pretendemos seguir este camino para el caso de las funciones
f en varias variables y tratamos encontrar la ecuación del plano tangente
mediante las derivadas parciales como se hizo en el Ejemplo 3.21, nos vamos
a encontrar con una seria dificultad. En el Ejemplo 3.24 se muestra el caso
de una función que tiene derivadas parciales en un punto, pero no tiene un
plano tangente a la gráfica de la función en ése punto. En ése caso la función
f no es suave, tiene un doblez a lo largo del eje x. Debemos intuir entonces
que parte de la medida que tan suave es una función f de varias variables
esta ligada a la existencia de sus derivadas parciales. Lo que no esta claro es
como esto eventualmente implique que se puedan aproximar localmente los
valores de f (x) por los valores p(x) de un polinomio lineal p en n variables
que pasa por el punto (a, f (a)).
No nos desanimemos y continuemos. Si la idea previa de encontrar la ecua-
ción de un plano tangente a la gráfica de una función en mas de una variable
con las derivadas parciales no funciona, busquemos otra manera de hacer-
lo, y además tratemos de diseñar algún instrumento (matemático) que nos
indique cuando nos vamos a enfrentar a ese dificultad.
De ser f suave alrededor de un punto (a, f (a)), esperamos (lo mismo que
sucede con funciones de una variable) que los valores f (x) de la función
en puntos x muy cercanos a a, se puedan aproximar localmente por los
valores p(x) de un polinomio lineal p en n variables que pasa por el punto
(a, f (a)). Obviamente existirá un error en esta aproximación y deberá ser

Para uso exclusivo en el salón de clase – UIS Cálculo en Varias Variables 59


posible estimarlo de la forma

|f (x) − p(x)|,

para todo x cercano a a; cercanı́a que dependerá de que tan distante se


encuentre x de a y la cual se mide por kx − ak.
Como el error en la aproximación de p(x) a f (x) depende que tan cercano
esté x de a, se requiere entonces que error en la aproximación |f (x) − p(x)|
relativo a la distancia entre x y a tienda a cero siempre que x esté muy
cercano de a; i.e.,
|f (x) − p(x)|
→0 siempre que x → a,
kx − ak
o en otras palabras
|f (x) − p(x)|
lı́m = 0.
x→a kx − ak

Si definimos el error1 (no absoluto) E(x, a) como


f (x) − p(x)
E(x, a) := ,
kx − ak
entonces tendremos que

f (x) = p(x) + E(x, a) kx − ak

donde

lı́m |E(x, a)| = 0.


x→a

Evidentemente, esto nos indica que el valor f (x) es aproximado por el valor
de p(x) y que el error E(x, a) kx − ak en esa aproximación es muy pequeño,
casi cero, en cercanı́as de a.
Nos queda aun por establecer la cuestión de como obtener el polinomio lineal
p. Del Calculo de funciones en una variable sabemos que las valores de f (x)
se pueden aproximar por los valores de la recta tangente (un polinomio lineal
en una variable) a la gráfica de f en un punto (x0 , f (x0 )), donde el valor x
esta suficientemente cercano al valor x0 . Recordemos que la pendiente de la
recta tangente en el punto (x0 , f (x0 )) esta dada por
f (x) − f (x0 )
f ′ (x0 ) = lı́m ,
x→x0 x − x0
si el lı́mite existe. Supongamos que el lı́mite existe. El lı́mite anterior significa
que existe un número m = f ′ (x0 ) tal que
|f (x) − f (x0 ) − m(x − x0 )|
lı́m = 0.
x→x0 |x − x0 |
De nuevo, al definir el error E(x, x0 ) de la forma
f (x) − f (x0 ) − m(x − x0 )
E(x, x0 ) :=
|x − x0 |
1 ¿Porque esta definición es consistente?

60 Julio C. Carrillo E. Para uso exclusivo en el salón de clase – UIS


tendremos que f es derivable en x0 si existe un número m = f ′ (x0 ) tal que

f (x) = f (x0 ) = m(x − x0 ) + E(x, x0 )|x − x0 |

donde

lı́m |E(x, x0 )| = 0.
x→x0

Es claro entonces como generalizar esta idea al problema de la aproximación


de los valores de una función en n variables mediante un polinomio lineal
en n variables.
Diferenciabilidad, Definición 3.27. Se dice que una función f en n variables es diferenciable
aproximación lineal y en a si existe un vector Df (a) en Rn tal que
plano tangente
f (x) = f (a) + Df (a) · (x − a) + E(x, a) kx − ak

donde

lı́m |E(x, a)| = 0.


x→a

El gradiente El vector Df (a) se llama la derivada o gradiente de f en a, y se suele


denotar por ∇f (a).
Si f es diferenciable en a, entonces el polinomio lineal en n variables

p(x) = f (a) + Df (a) · (x − a)

se llama la ecuación cartesiana del plano tangente a f que pasa por el punto
(a, f (a)), y ası́ la diferenciabilidad de f en a es equivalente a la existencia
de un plano en el cual el punto p(x) aproxima el valor de f (x) en el sentido
indicado anteriormente.
Observación 3.28. Al reescribir la ecuación del polinomio p en la forma
vectorial:

(Df (a), 1) · (x − a, p(x) − f (a)) = 0

concluimos que el vector (Df (a), 1) es normal a la “gráfica” de f en el punto


(a, f (a)), y que efectivamente el polinomio lineal p(x) dado es la ecuación
de un plano tangente a f en el punto (a, f (a)). ¡Voila! Podemos decir que
resolvimos nuestro problema, aún sea necesario un poco mas de formalismo
para establecer que esta conjetura es cierta (cf. Proposición ??).
Observación 3.29. Muchos problemas en la fı́sica e ingenierı́a requieren
del uso de métodos vectoriales o matriciales relacionados con funciones de
varias variables, el llamado análisis vectorial. El ejemplo mas evidente y
necesario es el de obtener una notación eficiente de la regla de la cadena.
En este caso los vectores Df (x0 ) y ∇f (a) son diferentes. Primero que todo,
se deben considerar los vectores de Rn como matrices en Rn×1 de n filas y
una columna y redefinir su producto escalar: si x y y son dos vectores de
Rn ≡ Rn×1 , entonces se define el producto escalar entre x y x por

x · y = xT y = x1 y1 + · · · + xn yn ,

donde xT representa la transpuesta de x, una matriz de orden 1 × n.


Segundo, si la función en n variables f : D ⊆ Rn → R es diferenciable en
a entonces la derivada de f en a, Df (a) existe y es una matriz de orden

Para uso exclusivo en el salón de clase – UIS Cálculo en Varias Variables 61


1 × n. El gradiente de f en a, ∇f (a), es la matriz de orden n × 1 obtenida
como la transpuesta de la derivada Df (a):

∇f (a)T = Df (a),

o viceversa: Df (a)T = ∇f (a). De acuerdo con esta notación, el polinomio


del plano tangente a la gráfica de f en (a, f (a)) tendrá la forma

p(x) = f (a) + ∇f (a) · (x − a)


= f (a) + ∇f (a)T (x − a)
= f (a) + Df (a)(x − a)

en donde x − a se considera como una matriz de orden n × 1.


Ahora el problema de aproximar los valores de f (x) mediante los valores del
polinomio p(x) se reduce a poder encontrar el gradiente (o la derivada) de f .
Vamos por partes. Al igual que en el caso de funciones en una variable, para
empezar se debe establece la unicidad de la derivada y que derivabilidad
implica continuidad.
Proposición 3.30. Si el gradiente de la función f : D ⊆ Rn → R en n
variables existe en un punto a, entonces el gradiente es único.
Entre otras cosas, este resultado nos garantiza que existe un único plano
tangente a la gráfica de f y en consecuencia existe un único polinomio p(x)
que satisface el punto (a, p(x)) y permite aproximar el valor de f (x) para
x en cercanı́a de a.
Continuidad y Proposición 3.31. Si la función f : D ⊆ Rn → R en n variables es
diferenciabilidad diferenciable en a en D, entonces f es continua en a.

Demostración. Si f es diferenciable en a,

f (x) = f (a) + ∇f (a) · (x − a) + E(x, a) kx − ak

en donde

lı́m |E(x, a)| = 0.


x→a

Por lo tanto,

0 ≤ |f (x) − f (a)| ≤ |∇f (a) · (x − a)| + |E(x, a)| kx − ak


= k∇f (a)k kx − ak | cos θ| + |E(x, a)| kx − ak
≤ k∇f (a)k kx − ak + |E(x, a)| kx − ak

en donde los términos del lado derecho de la ultima desigualdad tienden a


cero cuando x → a, y entonces

lı́m f (x) = f (a).


x→a

Por lo tanto, f es continua en a.

Diferenciabilidad y Hasta ahora seguimos sin disponer de una herramienta para encontrar el
existencia de las gradiente de una función de varias variables, y de por si la definición no es
derivadas parciales útil para hacerlo. Sin embargo, y como se vera a continuación, la diferencia-
bilidad de la función implica la existencia de sus derivadas parciales y una
forma de calcular el gradiente de la función.

62 Julio C. Carrillo E. Para uso exclusivo en el salón de clase – UIS


Proposición 3.32. Si la función de n variables f : D ⊆ Rn → R es
diferenciable en x, entonces las primeras derivadas parciales de f existen
en x y además el gradiente es el vector de esas derivadas parciales en x:
 
∂f ∂f
∇f (x) = (x), . . . , (x)
∂x1 ∂xn

Demostración. Si f es diferenciable en a, entonces

|f (x) − f (a) − ∇f (a) · (x − a)|


lı́m =0
x→a kx − ak

Sea x = a + hej . Entonces

|f (a + hej ) − f (a) − h(∇f (a))j |


lı́m =0
x→a |h|

o también,

f (a + hej ) − f (a)
lı́m − (∇f (a))j = 0.
x→a h

Esto implica que

f (a + hej ) − f (a)
lı́m = (∇f (a))j
x→a h
y por tanto,
∂f
(a) = (∇f (a))j ,
∂xj

la j–ésima componente del gradiente.

No obstante lo anterior, poder obtener el gradiente de f depende que f


sea diferenciable, cosa que aun no sabemos como establecer ni condiciones
que las garantizan. Afortunadamente el siguiente criterio nos resuelve el
problema.
Proposición 3.33. Si la función f : D ⊆ Rn → R en varias variables tiene
primeras derivadas parciales en todo punto cercano a a y si además esas
derivadas parciales son continuas en x, entonces f es diferenciable en a.
El siguiente diagrama resume los resultados anteriores.

Definición de
diferenciabilidad

Existencia de las
Parciales continuas Diferenciabilidad
derivadas parciales

Continuidad Gradiente

Obviamente este diagrama nos dice también que la existencia del gradiente
no implica que la función es continua. ¿Existe un ejemplo?

Para uso exclusivo en el salón de clase – UIS Cálculo en Varias Variables 63


Ejemplo 3.34. Mostrar que la función

x2 − y 2
f (x, y) =
x2 + y 2
es diferenciable en todos en plano xy excepto en el origen.

Solución. Las derivadas parciales de f

∂f 2x(x2 + y 2 ) − 2x(x2 − y 2 ) 4xy 2


= =
∂x (x2 + y 2 )2 (x2 + y 2 )2
2 2 2 2
∂f −2y(x + y ) − 2y(x − y ) −4x2 y
= =
∂y (x2 + y 2 )2 (x2 + y 2 )2

son continuas excepto cuando (x, y) = (0, 0). La Proposición 3.31 y su con-
trarrecı́proco garantizan que f es diferenciable en todos los puntos del plano
xy con excepción del origen. Además la Proposición 3.32 garantiza que el
gradiente de f existe y está definido por
4xy
∇f (x, y) = (y, −x)
(x2 + y 2 )2
todos los puntos del plano xy con excepción del origen.

Tenemos un asunto por resolver respecto a la diferenciabilidad de funciones


de varias variables. A la diferencial se le debe exigir que cumpla las mismas
propiedades de la derivada usual: Si f, g son funciones en varias variables y
diferenciables y c es un escalar, entonces las funciones f + g y cf deben ser
diferenciables y

D(f + g) = Df + Dg
D(cf ) = cD(f )

Es decir, D debe ser una transformación lineal, y Df (x) es un vector (W.H.


Young, 1908; M. Fréchet, 1911). A continuación se establece que las propie-
dades algebraicas del gradiente se comportan como las reglas usual de las
derivadas.
Reglas del gradiente Proposición 3.35. Supongamos de los gradiente de las funciones f y g
existen. Entonces
1. ∇(f (x) + g(x)) = ∇f (x) + ∇g(x)
2. ∇(cf (x)) = c∇f (x)
3. ∇(f (x)g(x)) = f (x)∇f (x) + g(x)∇f (x)
 
f (x) g(x)∇f (x) − f (x)∇g(x)
4. ∇ =
g(x) g 2 (x)

Demostración.
   
∂(f g) ∂(f g) ∂g ∂f ∂g ∂f
∇(f g) = ,..., = f +g ,...,f +g
∂x1 ∂xn ∂x1 ∂x1 ∂xn ∂xn
   
∂g ∂g ∂f ∂f
=f ,..., +g ,..., = f ∇g + g∇f
∂x1 ∂xn ∂x1 ∂xn
Las otras demostraciones son similares.

64 Julio C. Carrillo E. Para uso exclusivo en el salón de clase – UIS


Ejemplo 3.36. Encuentre la derivada de f si f (x, y) = (x2 − y 2 )/(x2 + y 2 ).

Solución. De las reglas de la derivada, y la Proposición 3.32 el gradiente


o derivada de f existe y esta definido por

2x(x2 + y 2 ) − 2x(x2 − y 2 ) −2y(x2 + y 2 ) − 2y(x2 − y 2 )


 
∇f (x, y) = ,
(x2 + y 2 )2 (x2 + y 2 )2
4xy 2 −4x2 y
 
= ,
(x2 + y 2 )2 (x2 + y 2 )2

para todo punto del plano con excepción del origen.

Diferenciales Si f es una función de n variables y diferenciable en a entonces

f (x) − f (a) = ∇f (a) · (x − a) + E(x, a) kx − ak

en donde

lı́m E(x, a) = 0.
x→a

Sea ∆f (x) = f (x − f (a) el incremento de f , y ∆x = x − a el incremento


en x. Entonces

∆f (x) = ∇f (a) · ∆x + E(x, a) k∆xk

en donde

lı́m E(x, a) = 0.
∆x→0

Tenemos ası́ que ∇f (a) · ∆x será una buena aproximación del incremento
∆f (x). Esto sugiere la siguiente definición.
Definición 3.37. Sea f una función diferenciable, y sea dx = (dx1 , . . . , dxn )
el vector diferencial de x (el vector de los diferenciales dx1 , . . . , dxn de
x1 , . . . , xn ). La diferencial (total) de f , denotada como df (x), se define en
forma vectorial como

df (x) = ∇f (x) · dx

o en forma cartesiana como

∂f ∂f
df (x1 , . . . , xn ) = (x1 , . . . , xn )dx1 + · · · + (x1 , . . . , xn )dxn
∂x1 ∂xn

Ejemplo 3.38. Encuentre la ecuación del plano tangente a f (x, y) = x2 +y 2


en el punto (1, 1, 2).

Solución. Observe que ∇f (x, y) = (2x, 2y). Por lo tanto

z − 2 = 2(x − 1) + 2(y − 1)

o bien

2x + 2y − z = 2

Para uso exclusivo en el salón de clase – UIS Cálculo en Varias Variables 65


El campo gradiente La diferencial con el uso adquirió el nombre de gradiente o campo gradiente,
debido a que este vector genera un campo vectorial que es tangente en cada
punto a las curvas de nivel de f . El gradiente asociado con cada punto x
en el dominio de f es el vector ∇f (x). El conjunto de todos esos vectores
en Rn se llama el campo gradiente de f . Geométricamente, el gradiente se
representa una flecha de origen en x y extremo x+ ∇f (x). Si z = 9 − x2 − y 2
entonces ∇f (x, y) = −2(x, y)
Regla de la cadena La Regla de la cadena establece condiciones para la existencia de la derivada
de la composición de funciones, y una forma de calcularla. Las funciones de
varias variables se pueden componer, hasta el momento, con una función de
una variable o una función de una variable:
h◦f

f h
D ⊆ Rn If ⊆ I ⊆ R R
x f (x) h(f (x))
o de una función vectorial con una función de varias variables
f ◦R

R f
I ⊆R IR ⊆ D ⊆ Rn R
t R(t) f (R(t))
En el primer caso la composición es una función en varias variables y en el
segundo una función escalar o de una variable.
Proposición 3.39. Sean f : I ⊆ Rn → R una función de n variables y
h : I ⊆ R → R una función escalar tales que la intersección If ∩ Dh es no
vacı́a. Se define la función compuesta v = h ◦ f como
v(t) = h(f (x)).
Si f es diferenciable es x y h es derivable en f (x) entonces v es diferenciable
en x y es igual
∇v(x) = h′ (f (x))∇f (x)
Sea t = f (x). Entonces la derivada ∇v(x) = h′ (t)∇f (x) se podrá escribir
de la forma
∂v dh ∂f
=
∂x1 dt ∂x1
Proposición 3.40. Sean R : I ⊆ R → Rn una función vectorial y f : D ⊆
Rn → R una función de n variables tales que la intersección IR ∩ Df es no
vacı́a. Se define la función compuesta u = f ◦ R como
u(t) = f (R(t)).
Si existe un punto t en el que R′ (t) existe y f es diferenciable en R(t)
entonces u′ (t) existe y es igual al producto escalar
u′ (t) = ∇f (R(t)) · R′ (t)
Las componentes de x = R(t) dependerán de t: R(t) = x = (x1 (t), . . . , xn (t)).
Entonces la derivada u′ (t) = ∇f (x) · R′ (t) se podrá escribir de la forma
du ∂f dx1 ∂f dxn
= + ··· +
dt ∂x1 dt ∂xn dt

66 Julio C. Carrillo E. Para uso exclusivo en el salón de clase – UIS


3.4. Gradientes y derivadas direccionales
Las derivadas direccionales son especialmente importantes para establecer
un sentido fı́sico y geométrico de la derivada o gradiente de una función f
en n varias variables, y en especial para demostrar que el polinomio lineal
en n variables, p(x) = f (a) + ∇f (a) · (x − a) representa efectivamente la
ecuación del plano tangente a la gráfica de f en el punto de coordenadas
(a, f (a)); asunto que aún esta por demostrar.
Derivada direccional Definición 3.41. Sea f : D ⊆ Rn → R una función de n variables. Se
define la derivada de f en a en la dirección del vector u como

f (a + hu) − f (a)
Du f (a) = lı́m ,
h→0 h
si el lı́mite existe. Si u es un vector unitario, Du f (a) se llama la derivada
direccional de f en a en la dirección u.
Diferenciabilidad y Proposición 3.42. Si f es diferenciable en a entonces
derivada direccional
Du f (x0 ) = ∇f (x0 ) · u.

Demostración. Si f es diferenciable en a las derivadas parciales de f en


a existen y además

f (x) = f (a) + ∇f (a) · (x − a) + E(x, a) kx − ak

en donde E(x, a) → 0 cuando t → 0. Supongamos que x es un punto en


la recta x = a + hu para algún escalar h. Observe que x → a si y solo si
h → 0. Por lo tanto,

f (a + hu) − f (a)
= ∇f (a) · u ± E(a + hu, a)
h
en donde E(a + hu, a) → 0 cuando h → 0. Como el lı́mite del lado izquierdo
de esta ecuación existe, entonces se concluye que Du f (a) existe. Tomando
lı́mite cuando h tiende a cero en ambos lados de la ecuación anterior se
obtiene el resultado.
Sentido geométrico del Proposición 3.43. Si ∇f (a) es diferente de cero, entonces ∇f (a) apunta
gradiente en la dirección a lo largo de la cual f crece mas rápido.

Demostración. Si u es un vector unitario entonces

Du f (a) = ∇f (a) · u = k∇f (a)k kuk cos θ = k∇f (a)k cos θ,

donde θ representa el ángulo entre u y ∇f (a). Este ángulo es máximo


cuando θ = 0; esto es, cuando u y ∇f (a) son paralelos. Se considera en la
hipótesis que ∇f (a) 6= 0, porque si ∇f (a) = 0 entonces Du f (a) = 0 para
cualquier u.

Es decir, si nos queremos mover en la dirección en la cual f crece mas


rápido, debemos hacerlo en la dirección ∇f (a). Análogamente, si deseamos
movernos en la dirección en la cual f decrece mas rápido, debemos hacerlo
en la dirección −∇f (a).
La siguiente proposición establece una relación directa entre el gradiente y
las curvas de nivel.

Para uso exclusivo en el salón de clase – UIS Cálculo en Varias Variables 67


Sentido geométrico del Proposición 3.44. Sea f : Rn → R una función con primeras derivadas
gradiente parciales continuas y a un punto en el conjunto de nivel Lk (f ) definida por
f (x) = k, para alguna constante k. Entonces ∇f (a) es normal a Lk (f ) en el
siguiente sentido: para todo vector v tangente a una trayectoria C en Lk (f )
que pasa por a se cumple que ∇f (a) · v = 0.

Demostración. Si C es una trayectoria en Lk (f ) que pasa por a y esta


definida por R(t), entonces existe un escalar t0 tal que R(t0 ) = a y además
f (R(t0 )) = k. Como v es tangente a C en a entonces v y R′ (t0 ) son colineales.
Sin pérdida de generalidad supongamos que v = R′ (t0 ). Ası́ que derivando
en ambos lados de la ecuación f (R(t0 )) = k con respecto a t y aplicando la
regla de la cadena tenemos que

d d
= ∇f (R(t)) · R′ (t)

0= f (R(t0 )) = f (R(t))
dt dt t=t0 t=t0
= ∇f (R(t0 )) · R′ (t0 ) = ∇f (a) · v

Plano tangente Definición 3.45. Sea S el conjunto de nivel n–dimensional formada por
los puntos x en Rn tales que f (x) = k, para k una constante dada. El plano
tangente a S en un punto a de S se define por la ecuación vectorial

∇f (a) · (x − a) = 0

si ∇f (a) es diferente del vector nulo.


Sentido geométrico del Proposición 3.46. Sea f una función en n variables que es diferenciable
gradiente en a. Entonces la ecuación del plano tangente a la gráfica de f en el punto
de coordenadas (a, f (a)) esta dada por el polinomio lineal en n variables,

p(x) = f (a) + ∇f (a) · (x − a).

Demostración. Consideremos el caso n = 2 y sea z = f (x, y). Sea g


la función en tres variables definida de la forma g(x, y, z) = f (x, y) − z.
Observe que la gráfica Gf de f coincide con la curva de nivel Lk (g) de g
cuando k = 0; es decir, Gf = L0 (g). Entonces tendremos que el vector
∇g(x0 , y0 , z0 ) = (fx (x0 , y0 ), fy (x0 , y0 ), −1) = (∇f (x0 , y0 ), −1) es normal a
la gráfica de f en el punto (x0 , y0 , z0 ) = (x0 , y0 , f (x0 , y0 )). En consecuencia,
éste vector y éste punto determinan un plano tangente a la gráfica de f en
tal punto, y su ecuación esta dada de la forma,

(∇f (x0 , y0 ), −1) · (x − x0 , y − y0 , z − f (x0 , y0 )) = 0;

o lo que es lo mismo,

z = f (x0 , y0 ) + ∇f (x0 , y0 ) · (x − x0 , y − y0 ).

3.5. Extremos de funciones de varias variables


Sea f : D ⊆ Rn → R una función y M un subconjunto de Rn tal que la
intersección D ∩ M es no vacı́a; usualmente se considera M es un subcon-
junto del dominio D de f . Un problema de optimización no lineal tiene la
estructura estándar dada por

mı́n{f (x) | x ∈ M }

68 Julio C. Carrillo E. Para uso exclusivo en el salón de clase – UIS


o

máx{f (x) | x ∈ M },

donde M es un subconjunto de Rn , el cual puede representar o no una


trayectoria en Rn .
Por ejemplo, M puede ser la bola n–dimensional

B(O, r) = {x ∈ Rn | kxk ≤ r}

con centro en el origen de Rn y radio positivo r; o el conjunto de nivel

Lk (g) = {x ∈ Rn | g(x) = k},

donde k es una constante apropiada. Cuando M = B(O, r), el problema se


suele llamar de optimización global, y cuando M = Lk (g) un problema de
optimización con restricciones. Ambos tipos de problemas de optimización
serán discutidos en esta sección.

3.5.1. Extremos locales y optimización global


Un problema de optimización sin restricciones (o global) consiste en el pro-
blema de encontrar los extremos locales o extremos absolutos de una cierta
función f de varias variables, donde f se considera definida en todo su
dominio. Se estudian resultados que garantizan condiciones que permiten
establecer cuales son los extremos locales de f , si ellos existen. Como ve-
remos, el criterio de la primera derivada para funciones de una variable no
se puede extender al caso de funciones de varias variables. La extension
del criterio de la segunda derivada es posible y su demostración require del
teorema de Taylor para funciones variables. Las condiciones que permiten
cuales son los extremos locales de f requieren de algunos resultados de Alge-
bra Lineal. Finalmente, es oportuno aclarar que desafortunadamente no se
pueden establecer criterios que permitan encontrar los extremos absolutos
de un problema de optimización sin restricciones.
Para a en Rn y ǫ > 0, B(a, ǫ) denota la vecindad (abierta) de a de radio ǫ
definida como

B(a, ǫ) = {x ∈ Rn | kx − ak < ǫ}

Máximos, mı́nimos y puntos de silla


Primero que todo consideremos un subconjunto M de Rn que no sea una
trayectoria.
Definición 3.47. Sea f : D ⊆ Rn → R una función de varias variables y M
un subconjunto de Rn tal que M ⊆ D. Se dice que f tiene un mı́nimo local
o relativo en un punto a de M si existe una vecindad abierta U de a en M
tal que f (x) ≥ f (a) para todo x en U . El número f (a) se llama el mı́nimo
relativo de f en M . Se dice que f tiene un mı́nimo global o absoluto en un
punto a de M si f (x) ≥ f (x) para todo x en M , y el número f (a) se llama
el máximo global/absoluto de f en M . Si las dos anteriores desigualdades se
cumplen en el sentido estricto, se dice que f tiene un mı́nimo local estricto
en M y un mı́nimo global estricto en M , respectivamente.
El máximo local o relativo y el máximo global o absoluto se definen de forma
similar.

Para uso exclusivo en el salón de clase – UIS Cálculo en Varias Variables 69


Definición 3.48. Un extremo local (absoluto) es un número que es un mı́ni-
mo local (absoluto) o un máximo (global). Por convención, un extremo sera
un extremo absoluto y un máximo o un mı́nimo serán un máximo ab-
soluto o un mı́nimo absoluto.
Las siguientes definiciones y resultados son necesarios para obtener el criterio
de la segunda derivada para funciones de varias variables.

Teorema de Taylor de segundo orden


Si f es diferenciable en a y tiene un punto crı́tico en a entonces

f (x) − f (a) = E1 (x, a) kx − ak

donde E1 (x, a) → 0 cuando x → a. Por lo tanto, se necesita mas informa-


ción de f en a en términos de E1 (x, a) kx − ak para determinar el signo
algebraico de f (x) − f (a). El Teorema de Taylor de segundo orden permite
resolver esta dificultad.
La matriz hessiana y el Definición 3.49. Sea f : D ⊆ Rn → R una función de varias variables con
hessiano segundas derivadas parciales ∂ 2 f /∂xi ∂xj continuas. La matriz hessiana
de f es la matriz de las segundas derivadas parciales de f ,
 ∂2f ∂2f ∂2 f

∂x12 (x) ∂x 1 ∂x 2
(x) · · · ∂x 1 ∂x n
(x)
2
   ∂ f (x) ∂2f ∂2 f

 2
∂ f  ∂x2 ∂x1 ∂x2 2 (x) · · · ∂x2 ∂xn (x)

(x) =  .. .. .. ..
∂xi ∂xj


 . . . .


∂2f ∂2f ∂2 f
∂xn ∂x1 (x) ∂xn ∂x2 (x) · · · n∂x2 (x)

2
y se denota como D f (x). Observemos que la matriz hessiana es una matriz
cuadrada de orden n y simétrica. El determinante de la matriz hessiana de
f se llama el hessiano de f . Además,
h      i
∂f ∂f ∂f
D2 f (x) = ∇ ∂x 1
(x) ∇ ∂x2 (x) · · · ∇ ∂xn (x)

El término “hessiana” fue acuñado por James Joseph Sylvester en honor


del matemático alemán Ludwig Otto Hesse, quien habı́a usado el término
“determinantes funcionales”.
Formula de Taylor de Proposición 3.50. Sea f : D ⊆ Rn → R una función de varias variables
segundo orden con segundas derivadas parciales ∂ 2 f /∂xi ∂xj continuas en una vecindad V
de a. Entonces para x en V se tiene

1
f (x) = f (a) + Df (a)(x − a) + (x − a)T D2 f (a)(x − a)
2!
2
+ E2 (x, a) kx − ak

en donde E2 (x, a) → 0 cuando x → a.

Demostración. Sea {a + td | t ∈ R} la ecuación de la recta que pasa por


el punto a en la dirección del vector d = x − a. Definamos la función escalar
φ(t) = f (a + td). Observe que φ tiene segundas derivadas continuas en una
vecindad de t = 0 tal que φ(0) = f (a) y φ(1) = f (x). Por el Teorema de
Taylor para funciones de una variable,
1 ′′
φ(1) = φ(0) + φ′ (0) + φ (c), donde 0 < c < 1.
2!

70 Julio C. Carrillo E. Para uso exclusivo en el salón de clase – UIS


De la regla de la cadena,

′ d
φ (0) = f (a + td) = Df (a)d = ∇f (a) · d
dt t=0

y
 
d d
φ′′ (c) =

(Df (a + td) d) = Df (a + td) d
dt t=c dt t=c
= (D2 f (a + cd)d)d ≡ dT D2 f (a + cd)d,

en notación vectorial. Ahora definamos E2 (d + a, a) por la ecuación


1 T 2
E2 (d + a, a) kdk2 = d [D f (a + cd) − D2 f (a)]d,
2!
si d 6= O, y E2 (a, O) si d = O. Entonces,
1 T 2
f (x) = f (a) + Df (a)d + d D f (a)d + E2 (a + d, a) kdk2 .
2!
Como

T 2
d [D f (a + cd) − D2 f (a)]d

n X n
∂2f ∂2f

2
X
≤ ∂xi ∂xj (a + cd) − ∂xi ∂xj (a) kdk ,

i=1 j=1

se tiene que
n n
1 X X ∂ 2 f ∂2f


|E2 (d + a, a)| ≤ (a + cd) − (a)
2! i=1 j=1 ∂xi ∂xj
∂xi ∂xj

para d no nulo. Como las segundas derivadas parciales son continuas en a,


entonces
∂ 2f ∂2f
lı́m (a + cd) = (a),
d→0 ∂xi ∂xj ∂xi ∂xj

ası́ que E2 (d + a, a) → 0 cuando d → 0. Observe que x → a cuando d → O.


Esto termina la demostración.

Condiciones para la existencia de extremos


Para dar condiciones necesarias y suficientes para la existencia de extre-
mos locales se consideran resultados de Algebra Lineal avanzada. Estos re-
sultados conciernen a los tópicos de matrices simétricas, formas bilineales,
matrices definido positivas y definido negativas, valores y vectores propios.
Este enfoque fue apropiadamente establecido por James Joseph Sylvester,
especialmente, y aunque solo se considera parte de su teorı́a, se recomienda
la lectura de libros avanzados en estos tópicos cuando se requiera realizar
aplicaciones matemáticas que involucren el problema de determinar los ex-
tremos relativos de funciones en mas de dos variables.
Condiciones necesarias de Proposición 3.51. Si f tiene primeras derivadas parciales continuas en
primer orden M y f tiene un mı́nimo local en a entonces Df (a) = O.

Para uso exclusivo en el salón de clase – UIS Cálculo en Varias Variables 71


Demostración. Supongamos que Df (a) 6= O. Entonces existe un vector
no nulo ξ en Rn tal que Dξ f (a) = Df (a) · ξ = α < 0 (Por ejemplo ξ =
−Df (a)T = −∇f (a)).
Considerando la variación de f a lo largo de la linea recta que pasa por a
en la dirección del vector ξ, se tiene la función escalar

φ(t) = f (a + tξ)

Por la regla de la cadena, φ′ (t) = Df (a + tξ)ξ. Como φ(0) = f (a) y φ es


diferenciable en t = 0, del teorema de Taylor en funciones de una variable
tenemos que si t 6= 0
 
′ ′ E1 (t, 0)|t|
φ(t) = φ(0) + φ (0)t + E1 (t, 0)|t| = φ(0) + t φ (0) +
t

Como E1 (t,0)|t|
t → 0 cuando t → 0 y φ′ (0) = Df (a)ξ = α < 0 entonces
existe un t0 tal que φ′ (0) + E1 (t,0)|t|
t ≤ α2 para todo t ∈ (0, t0 ). Entonces

1
φ(t) ≤ φ(0) + αt
2

para todo t ∈ (0, t0 ). Como α < 0 esto implica que

φ(t) < φ(0),

o lo que es igual

f (a + tξ) < f (a)

para todo t ∈ (0, t0 ). Sin embargo esto contradice que a sea un mı́nimo local
de f .

Aunque el recı́proco de este resultado no es cierto en general, el nos indica


que si una función f en varias variables es diferenciable, entonces f puede
tener un extremo local en todos aquellos puntos de su dominio en donde su
gradiente se anula. Esta observación motiva la siguiente definición.
Definición 3.52. Sea f : D ⊆ Rn → R una función de varias variables
diferenciable en a. Si ∇f (a) = 0 entonces el punto a se llama un punto
crı́tico o estacionario, de f . Un punto crı́tico de f es un punto de silla si
toda vecindad U de a contiene puntos x y x′ distintos tales que f (x) > f (a)
y f (x′ ) < f (a).
La Proposición 3.51 establece una condición necesaria para que f tenga un
punto critico en a, pero no es una condición suficiente para que f tenga un
mı́nimo local en a. Condiciones suficientes son dadas en la Proposición 3.56,
pero antes se hace necesario considerar algunos preliminares para obtener
este resultado.
Definición 3.53. Sea A una matriz simétrica de orden n × n. A es definido
positiva (negativa) si xT Ax > 0 (< 0) para todo vector no nulo x de Rn .
Se dice que A es semidefinido positiva (negativa) si xT Ax ≥ 0 (≤ 0) para
todo vector x de Rn .

72 Julio C. Carrillo E. Para uso exclusivo en el salón de clase – UIS


Sea A = [aij ] una matriz de orden n × n. Entonces A tiene n submatrices
diagonales Ak de orden k × k, para k = 1, . . . , n, definidas por
 
a11 a12 · · · a1k
a21 a22 · · · a2k 
Ak =  . .. ..  ;
 
 .. ..
. . . 
ak1 ak2 ··· akk

o por simplicidad, Ak = [aij ]k×k . Los números reales det Ak = |Ak | se


llaman los subdeterminantes diagonales de A.
Lema de Sylvester Proposición 3.54. Sea A una matriz simétrica de orden n × n.
a. A es definido positiva si y solo si |Ak | > 0 para k = 1, . . . , n.
b. A es definido negativa si y solo si |A1 | < 0, |A2 | > 0, |A3 | < 0, . . .
Condición necesaria de Proposición 3.55. Sea f : D ⊆ Rn → R una función de varias varia-
segundo orden bles con terceras derivadas parciales continuas y a un mı́nimo local de f .
Entonces Df (a) = 0 y D2 f (a) es semidefinido positiva.

Demostración. La demostración se sigue del Teorema de Taylor para fun-


ciones de varias variables y el criterio de Sylvester.

La siguiente proposición establece condiciones suficiente para la existencia


de la extremos locales.
Criterio de la segunda Proposición 3.56. Sea f : D ⊆ Rn → R una función de varias variables
derivada con terceras derivadas parciales continuas y a un punto crı́tico de f . Si
D2 f (a) es semidefinido positiva entonces f (a) es un mı́nimo local fuerte de
f.

Demostración. Del Teorema de Taylor y la hipótesis que ∇f (a) = 0 te-


nemos
1 2
f (x) = f (a) + (x − a)T D2 f (a)(x − a) + E2 (x, a) kx − ak
2
en donde E2 (x, a) → 0 cuando x → a.
Si la matriz simétrica D2 f (a) es definido positiva, entonces existe una cons-
tante positiva λ1 (que puede ser tomada como el menor valor propio de
2
D2 f (a)) tal que (x − a)T D2 f (a)(x − a) ≥ λ1 kx − ak para todo vector x
de Rn (cf. Gilbert Strang, Linear Algebra). Por lo tanto,
1 2 2
f (x) − f (a) ≥ λ1 kx − ak + E2 (x, a) kx − ak
2
en donde E2 (x, a) → 0 cuando x → a. Como la expresión del lado derecho
debe ser positiva cuando x → a, se sigue que f (x) > f (a) en alguna
vecindad de a; i.e., f (a) es un mı́nimo local fuerte de f .

En el caso de máximos locales de f la situación es totalmente análoga. Si


f tiene un máximo local en a entonces a debe ser un punto critico de f .
Si además D2 f (a) es definido negativa, entonces f (a) es un máximo local
fuerte de f . Además es fácil de demostrar que si a es un punto estacionario
de f , entonces
1. f (a) no es ni máximo local ni mı́nimo local si D2 f (a) tiene valores
propios positivos y negativos.

Para uso exclusivo en el salón de clase – UIS Cálculo en Varias Variables 73


2. f (a) puede ser o no un máximo local si D2 f (a) es semidefinido positiva.
El siguiente resultado es un caso particular de la anterior proposición.
Corolario 3.57. Sea f (x, y) una función con terceras derivadas parciales
continuas en un conjunto abierto D en R2 . Sea además (x0 , y0 ) un punto
crı́tico de f . Entonces,
2
a. Si fxx (x0 , y0 ) > 0 y fxx (x0 , y0 )fyy (x0 , y0 ) − fxy (x0 , y0 ) > 0 entonces f
tiene un mı́nimo local en (x0 , y0 ).
2
b. Si fxx (x0 , y0 ) < 0 y fxx (x0 , y0 )fyy (x0 , y0 ) − fxy (x0 , y0 ) > 0 entonces f
tiene un máximo local en (x0 , y0 ).
2
c. Si fxx (x0 , y0 )fyy (x0 , y0 ) − fxy (x0 , y0 ) < 0 entonces f tiene un punto de
silla en (x0 , y0 ).
2
d. Si fxx (x0 , y0 )fyy (x0 , y0 ) − fxy (x0 , y0 ) = 0 el criterio no decide nada.
De nuevo se aclara que el criterio de la segunda derivada garantiza condi-
ciones que permiten clasificar los puntos crı́ticos de una función en varias
variables como extremos locales. Desafortunadamente, el criterio no existe
criterio alguno que permita obtener los extremos absolutos de la función.

3.5.2. Optimización con restricciones


Un problema de optimización con restricciones consiste en el problema de
encontrar los extremos locales o extremos absolutos de una cierta función
f de varias variables en un subconjunto M de su dominio. Se considera los
casos cuando M es un conjunto cerrado y acotado y cuando M es el conjunto
de nivel de una función g en varias variables dada.

Extremos de funciones definidas en conjuntos cerrados y acotados


El siguiente resultado es un criterio para obtener los extremos de una función
en varias variables en un conjunto cerrado y acotado de su dominio.
Proposición 3.58 (Weierstrass). Sea M un subconjunto no vacı́o, cerrado
y acotado de Rn . Si f : M ⊆ Rn → R es una función continua, entonces
existen puntos a y a′ en M tal que f (a) ≤ f (x) ≤ f (a′ ) para todo x en M .
La prueba estándar se obtiene notando que si f es continua entonces la
imagen de un conjunto cerrado y acotado es también un conjunto cerrado y
acotado. Como M es cerrado y acotado, se sigue que f (M ) debe ser también
cerrado y acotado. Por tanto, f alcanza su mı́nimo absoluto y su máximo
absoluto en algunos puntos a y a′ en M , respectivamente. Esto precisamente
garantiza que f (a) ≤ f (x) ≤ f (a′ ) para todo x en M .
Como M es un conjunto es un conjunto cerrado, se puede considerar a M
como un conjunto formado por su interior y su frontera. Para encontrar
los extremos de f se procede primero a encontrar los extremos locales de
f en el interior de M mediante el criterio de la segunda derivada. Luego
se encuentran los extremos locales de f sobre su frontera. De acuerdo con
el Teorema de Weierstrass podemos garantizar que el menor y el mayor de
estos extremos locales serán los extremos de f en el conjunto M .
Ejemplo 3.59. Encuentre los extremos de la función f (x, y) = x2 − y 2 −
2xy + 1 en el conjunto [−1, 2] × [−1, 2].

Extremos de funciones a lo largo de conjuntos de nivel, multiplicadores de Lagrange


Ahora se busca resolver el problema de encontrar los extremos de una fun-
ción de varias variables f (x) cuando x tiene la restricción de pertenecer a un

74 Julio C. Carrillo E. Para uso exclusivo en el salón de clase – UIS


conjunto de nivel M en el dominio de f . Simbólicamente, se busca resolver
el problema
mı́n{f (x) | x ∈ M }

máx{f (x) | x ∈ M }
donde M ⊆ Df usualmente dado de la forma
M = {x ∈ Rn | g(x) = k}
para alguna constante apropiada k. Observe que M = Lk (g) y por tanto
la ecuación g(x) = k, llamada de igualdad, es la restricción que define a
M . Por lo tanto, se busca optimizar la función f para todo vector x en el
conjunto de nivel de g, Lk (g) con k dado.
En general, también se puede considerar
M = {x ∈ Rn | gi (x) = ki , i = 1, . . . , m}
para constantes apropiadas ki , y m < n. Es claro que el conjunto n–
dimensional M esta definido por las restricciones gi (x) = ki para i =
1, . . . , m.
Geométricamente,
Teorema de Proposición 3.60. Sean f, g : D ⊆ Rn → R dos funciones suaves dadas.
multiplicadores de Sean M el conjunto de nivel de g con valor k y a un punto en D tal que
Lagrange g(a) = k. Si ∇g(a) 6= O y f tiene un extremo en a entonces existe un
número real λ tal que
∇f (a) = λg(a).

Demostración. Sea R(t) una trayectoria en M que pasa por a. Entonces


R(t0 ) = a para algún t = t0 . Además se tendrá que ∇g(a) es tangente a M
en el punto a, en el sentido que
∇g(a) · R′ (t0 ) = 0.
De otro lado si f restringida a M tiene un máximo en a, entonces la función
en una variable f (R(t)) tiene un máximo en t = t0 . Del calculo de funciones
de una variable se tiene que
d
f (R(t0 )) = 0.
dt
De la regla de la cadena,
d
f (R(t)) = ∇f (R(t)) · R′ (t).
dt
Por lo tanto, en t = t0 se tiene que
∇f (a) · R′ (t0 ) = 0;
es decir, ∇f (a) también es perpendicular a M en a. Como el espacio tangen-
te a M en a es una recta, entonces los vectores gradientes ∇f (a) y ∇g(a)
son paralelos. Como ∇g(a) 6= O, entonces ∇f (a) es múltiplo escalar de
∇g(a).

Para uso exclusivo en el salón de clase – UIS Cálculo en Varias Variables 75


Criterio de la segunda Proposición 3.61. Sean f, g : D ⊆ Rn → R dos funciones suaves dadas
derivada para extremos (con segundas derivadas parciales continuas al menos). Sean M el conjunto
restringidos de nivel de g con valor k y a un punto en D tal que g(a) = k. Supongamos
que ∇g(a) 6= O y

∇f (a) = λ0 g(a)

para algún escalar λ0 . Se define la función auxiliar h = f − λg en n + 1


variables (λ, x) = (λ, x1 , . . . , xn ), y el punto x0 = (λ0 , a) = (λ0 , a1 , . . . , an )
en su dominio. Sea |D2 h(x0 )| el hessiano de h, el cual esta dado como sigue:

0 −gx1 −gx2 · · · −gxn

−gx1 hx1 x1 hx1 x2 · · · hx1 xn

−gx2 hx1 x2 hx2 x2 · · · hx2 xn
.. .. .. ..

..
.
. . . .
−gx hx 1 x n hx n x 2 · · · hx n x n
n

Sean D2 h(x0 )k las submatrices diagonales de D2 h(x0 ) de orden k ≥ 3.


Entonces,
a. Si los subdeterminantes |D2 h(x0 )k | son positivos para todo orden k ≥ 3
entonces f restringida a M tiene un mı́nimo local en a.
b. Si los subdeterminantes alternan los signos de la forma |D2 h(x0 )3 | > 0,
|D2 h(x0 )4 | < 0, |D2 h(x0 )5 | > 0, . . . entonces f restringida a M tiene un
máximo local en a.
c. Sea n = 2. Si |D2 h(x0 )| = 0 entonces el criterio no decide y f restrin-
gida a M puede tener un máximo local o un mı́nimo local en a o ni una
u otra cosa.
Sea n > 2. Si para k ≥ 3 alguno de los subdeterminantes |D2 h(x0 )k | es
diferente de cero y no siguen los patrones anteriores entonces f restrin-
gida a M no tiene un mı́nimo local ni un máximo local en a; tendrá un
punto de silla en a.

76 Julio C. Carrillo E. Para uso exclusivo en el salón de clase – UIS

Potrebbero piacerti anche