Funciones de Varias Variables

Julio C. Carrillo E.
Profesor Escuela de Matemáticas

Universidad Industrial de Santander
Monday, November 5, 2007 at 8:44 am

(FA07.01,02)
Para uso exclusivo en el salón de clase.
2007 c Julio C. Carrillo E.
Universidad
Industrial de
Santander
Escuela de Matemáticas
Universidad Industrial de Santander
2008
Agradecimientos a todos aquellos estudiantes que con sus
preguntas ayudan a mejor los contenidos de este mate-
rial.
Definitivamente, hasta los que enseñamos también

aprendemos, si prestamos un poco de atención en cla-
se.
El Autor
Tabla de contenidos
1. Preliminares 11
1.1. El espacio euclidiano n–dimensional . . . . . . . . . . . . . . 11
1.2. Producto escalar . . . . . . . . . . . . . . . . . . . . . . . . . 12
1.3. Longitud o norma . . . . . . . . . . . . . . . . . . . . . . . . 12
1.4. Ángulo entre dos vectores . . . . . . . . . . . . . . . . . . . . 13
1.5. Ángulos directores y cosenos directores . . . . . . . . . . . . . 14
1.6. Proyecciones . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
1.7. Trabajo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
1.7.1. Con desplazamiento a lo largo de una lı́nea recta . . . 15
1.7.2. Con desplazamiento a lo largo de una trayectoria no
lineal . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
1.8. El producto cruz de vectores . . . . . . . . . . . . . . . . . . 17
1.9. Triple producto escalar de vectores . . . . . . . . . . . . . . . 18
1.10. Lı́neas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
1.11. Planos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
2. Funciones vectoriales 21
2.1. Definición, dominio, imagen, gráfica . . . . . . . . . . . . . . 21
2.2. Operaciones algebraicas con funciones vectoriales . . . . . . . 22
2.3. Lı́mite . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
2.4. Continuidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
2.5. Derivada . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
2.6. Integral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
2.7. Movimiento curvilı́neo . . . . . . . . . . . . . . . . . . . . . . 27
2.7.1. Vector tangente, Vector tangente unitario, vector nor-
mal y plano osculador . . . . . . . . . . . . . . . . . . 27
2.7.2. Velocidad, rapidez y aceleración . . . . . . . . . . . . 29
2.7.3. Longitud de arco . . . . . . . . . . . . . . . . . . . . . 30
2.7.4. Curvatura de una curva . . . . . . . . . . . . . . . . . 33
2.7.5. Fuerzas definidas mediante funciones vectoriales . . . 34
2.7.6. Fuerzas definidas mediante campos vectoriales . . . . 38
3. Funciones de varias variables 41

3.1. Las funciones de varias variables . . . . . . . . . . . . . . . . 41
3.2. Lı́mite y continuidad . . . . . . . . . . . . . . . . . . . . . . . 45
3.2.1. Lı́mite . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
3.2.2. Continuidad . . . . . . . . . . . . . . . . . . . . . . . . 50
3.3. Derivada . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52
3.4. Gradientes y derivadas direccionales . . . . . . . . . . . . . . 67
3.5. Extremos de funciones de varias variables . . . . . . . . . . . 68
3.5.1. Extremos locales y optimización global . . . . . . . . . 69
3.5.2. Optimización con restricciones . . . . . . . . . . . . . 74
4. Integración múltiple 77
4.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77
4.2. Integrales dobles . . . . . . . . . . . . . . . . . . . . . . . . . 77
4.2.1. Integrales doble sobre dominios rectangulares . . . . . 77
4.2.2. Integrales iteradas . . . . . . . . . . . . . . . . . . . . 79
4.2.3. Integrales dobles sobre regiones mas generales . . . . . 83
4.2.4. Cambio en el orden de integración . . . . . . . . . . . 84
4.2.5. Integrales dobles en coordenadas polares . . . . . . . . 85
4.2.6. Aplicaciones de las integrales dobles . . . . . . . . . . 86
4.3. Integrales triples . . . . . . . . . . . . . . . . . . . . . . . . . 88
4.3.1. Aplicaciones de las integrales triples . . . . . . . . . . 91
4.4. Integrales triples en coordenadas cilı́ndricas y esféricas . . . . 92
4.4.1. Coordenadas cilı́ndricas . . . . . . . . . . . . . . . . . 93
4.4.2. Coordenadas esféricas . . . . . . . . . . . . . . . . . . 93
4.5. Cambio de variables . . . . . . . . . . . . . . . . . . . . . . . 94
5. Cálculo vectorial 95
5.1. Campos vectoriales . . . . . . . . . . . . . . . . . . . . . . . . 95
5.1.1. Definición de campo vectorial, y su primera clasificación 95
5.1.2. Segunda clasificación de los campos vectoriales . . . . 98
5.1.3. Lı́neas de flujo y flujos de campos vectoriales . . . . . 101
5.2. Calculo integral en el plano . . . . . . . . . . . . . . . . . . . 104
5.2.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . 104
5.2.2. Trabajo e integral de lı́nea . . . . . . . . . . . . . . . . 104
5.2.3. Curvas y parametrización de curvas . . . . . . . . . . 104
5.2.4. Teorema de Green . . . . . . . . . . . . . . . . . . . . 104
5.2.5. El Teorema de Green y campos vectoriales divergen-
tes, rotacionales y conservativos . . . . . . . . . . . . . 104
5.3. Calculo integral en el espacio . . . . . . . . . . . . . . . . . . 104
5.3.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . 104
5.3.2. Integral de lı́nea en el espacio . . . . . . . . . . . . . . 106
5.3.3. Superficies y parametrización de una superficie . . . . 106
5.3.4. Integral de superficie . . . . . . . . . . . . . . . . . . . 106
5.3.5. Trabajo e integral de superficie . . . . . . . . . . . . . 106
5.3.6. Teorema de la divergencia de Gauss . . . . . . . . . . 106
iv Julio C. Carrillo E. Para uso exclusivo en el salón de clase – UIS

5.3.7. Teorema de Stokes . . . . . . . . . . . . . . . . . . . . 106
5.3.8. Consecuencias e implicaciones del Teorema de Green
y Teorema de Stokes sobre campos vectoriales diver-
gentes, rotacionales y conservativos . . . . . . . . . . . 106
5.4. Aplicaciones fı́sicas . . . . . . . . . . . . . . . . . . . . . . . . 106
5.4.1. Dinámica . . . . . . . . . . . . . . . . . . . . . . . . . 106
5.4.2. Dinámica de fluidos . . . . . . . . . . . . . . . . . . . 106
5.4.3. Electromagnetismo . . . . . . . . . . . . . . . . . . . . 106
5.4.4. Conducción de calor . . . . . . . . . . . . . . . . . . . 106
5.4.5. Termodinámica . . . . . . . . . . . . . . . . . . . . . . 106
Para uso exclusivo en el salón de clase – UIS Cálculo en Varias Variables v

3 Funciones de varias variables
3.1. Las funciones de varias variables

Funciones de n variables, Sea D un subconjunto no vacı́o de Rn . Una función f que asigna a cada pun-
dominio, imagen y gráfica to x = (x1 , . . . , xn ) de D un número real f (x) = f (x1 , . . . , xn ) se llama una
función de n variables con dominio D y valores reales. La razón de llamarse
a f una función de n variables es simplemente por las n coordenadas que
tiene el punto x = (x1 , . . . , xn ) y la imagen f (x) = f (x1 , . . . , xn ) depende
de esas n coordenadas. Las coordenadas x1 , . . . , xn serán las variables inde-
pendientes de f y xn+1 = f (x) = f (x1 , . . . , xn ) la variable independiente.
Entonces, x = (x1 , . . . , xn ) sera la preimagen y xn+1 = f (x) = f (x1 , . . . , xn )
la imagen.
Por ejemplo,
xy
f (x, y) = + ln(x2 + y 2 )
x−y
f (x, y) = x2 + y 2
son funciones en dos variables, las independientes son x, y y la variable
dependiente es z = f (x, y). De igual modo,
f (x, y, z) = x2 + y 2 − z 2
es una función en tres variables dependientes x, y, z y la variable dependiente
es w = f (x, y, z). Un ejemplo mas general es la función polinómica en cinco
variables
f (x1 , x2 , x3 , x4 , x5 ) = x1 − 2x22 + x3 x34 x25
en la cual las cinco variables independientes son x1 , x2 , x3 , x4 , x5 y la variable
dependiente es x6 = f (x1 , x2 , x3 , x4 , x5 ).
Observación 3.1. Las funciones de n variables también se suelen denotar
de la forma f : D ⊆ Rn → R. Desde el punto de vista fı́sico, las funciones
de varias variables son llamadas campos escalares.
Sea f : D ⊆ Rn → R una función en n variables. El subconjunto D de Rn
es llamado el dominio de f y el subconjunto R de todas los valores f (x) la
imagen de f . La gráfica de f es el subconjunto de Rn+1 que consta de todos
los puntos (x, f (x)). Simbólicamente,
D f = D ⊆ Rn
If = {f (x) ∈ R | x ∈ D})
Gf = {(x, f (x)) ∈ Rn+1 | x ∈ D}
También, la imagen y gráfica de f se pueden representar en términos de

las variables independientes x1 , . . . , xn y la variable dependiente xn+1 =
f ((x1 , . . . , xn )):
If = {f (x1 , . . . , xn ) | (x1 , . . . , xn ) ∈ D}
Gf = {(x1 , . . . , xn , f (x1 , . . . , xn )) ∈ Rn+1 | (x1 , . . . , xn ) ∈ D}.
Tambien se puede considerar
Gf = {(x1 , . . . , xn , xn+1 ) ∈ Rn+1 | xn+1 = f (x1 , . . . , xn )

para algún (x1 , . . . , xn ) ∈ Df }
Una función escalar es una función en una variable. Para hacer hacer consis-
tentes las definiciones de la gráfica de funciones de una y varias variables se
debe considerar en general la gráfica f como un subconjunto de Rn+1 . Tam-
bién por esta razón las funciones de varias variables se designan mediante
letras minúsculas del alfabeto tales como f , g, etc. Desde el punto de vista
geométrico se consideran únicamente gráficas de funciones de n variables
cuando n = 1, 2. Si n = 1, la gráfica de f representa una curva en el plano
xy, y una superficie en el espacio tridimensional xyz cuando n = 3.
Por ejemplo, f (x) = x − 3 es una función en una variable. Su dominio e
imagen consiste del conjunto de los números reales y la gráfica de todos los
puntos (x, x − 3) en R2 que geométricamente representa una linea recta en
el plano xy.
A cada punto en el plano xy la función f (x, y) = x2 + y 2 le asigna un
número real no negativo. Por lo tanto, el dominio de f consiste de R2 ,
gráficamente el plano xy. La imagen consiste de todos los reales no negativos
(gráficamente la parte no negativa del eje z) y la gráfica de f de todos los
punto (x, y, x2 +y 2 ), que gráficamente representa una superficie en el espacio
tridimensional xyz llamada paraboloide.
z
x y
La función
1
f (x, y) = p ,
x − y2
2
esta definida cuando
x2 − y 2 > 0 ≡ y 2 < x2 ≡ |y| < |x| ≡ −|x| < y < |x|.
Geométricamente el dominio de f esta representado en la siguiente figura y

consiste de todos los puntos del plano xy que permanecen entre las gráficas
de y = ±|x|. La imagen es el conjunto de todos los reales positivos, y la
42 Julio C. Carrillo E. Para uso exclusivo en el salón de clase – UIS

p
gráfica el conjunto de todos los puntos (x, y, z) con z = 1/ x2 − y 2 . Es-
ta gráfica no es fácil de realizar y el uso de software gráfico apropiado es
recomendado, GnuPlot por ejemplo.
3
2
1
x
−3 −2 −1 1 2 3
−1
−2
−3
El dominio de la función
p
f (x, y) = x2 − y,
consiste de todos los puntos del plano xy tales que y ≤ x2 .
3
2
1
x
−3 −2 −1 1 2 3
−1
−2
−3
La imagen consistede todos los reales

no negativos y la gráfica de todos los
p
2
puntos (x, y, z) = x, y, x − y . La representación de la gráfica requiere
de software.
El dominio de la función
x −(x2 +y2 ) 2 2
f (x, y) = 10 x3 + xy 4 − e + e−((−x−1,225) +y )
5
consiste todos los puntos del plano xy y la imagen de los números reales.
Formalmente la gráfica de f se puede definir del modo hasta ahora hecho
y esta en el espacio tridimensional xyz. La siguiente figura representa esta
Para uso exclusivo en el salón de clase – UIS Cálculo en Varias Variables 43

gráfica en el dominio [−4, 4] × [−4, 4].
z
x y
Al ser las imágenes de las funciones de varias variables números, las opera-
ciones algebraicas que se realicen con ellas se encuentran determinadas por
las operaciones algebraicas de los números reales. Adicionalmente se pueden
componer esas funciones con las funciones escalares (o de una variable) y las
funciones vectoriales que ya conocemos. A fin de evitar malentendidos con
la definición de composición de funciones, se incluye la siguiente definición
formal de la composición de funciones.
Definición de Sean A, B, C, D conjuntos no vacı́os tales que B, C son de la misma “natu-
composición de funciones raleza”, y f : A → B y g : C → D dos funciones. Si la intersección If ∩ Dg
es no vacı́a, entonces la composición de las funciones f y g, denotada por
g ◦ f , tiene sentido y esta definida por
(g ◦ f )(x) = g(f (x))
para todo x en el dominio de f tal que f (x) esta en la imagen de g.

g◦f
f g
A B C D
x f (x) ∈ Dg g(f (x))
If ∩ Dg 6= ∅
Cuando esto sucede se dice que la función composición g ◦ f tiene sentido.

Algebra de funciones de Sean f, g : D ⊆ Rn → R funciones de varias variables, h : D′ ⊆ R → R una
varias variables función real y R : I ⊆ R → Rn una función vectorial. Para todo x en D se
definen las siguientes funciones:
1. (f + g)(x) = f (x) + g(x)
2. (cf )(x) = cf (x) para toda constante c
3. (f g)(x) = f (x)g(x)

f f (x)
4. (x) = si g(x) 6= 0.
g g(x)

5. Si la función composición h◦f tiene sentido, entonces define la función
de varias variables
(h ◦ f )(x) = h(f (x)).
6. Si la función composición f ◦R tiene sentido, entonces define la función

real
(f ◦ R)(t) = f (R(t)).
Ejemplo 3.2. Si
xy
f (x, y) = , h(t) = 2t + 1, R(t) = (t, t2 ),
x+y
entonces

xy 2xy
(h ◦ f )(x, y) = h(f (x, y)) = h = +1
x+y x+1
t3 t2
(f ◦ R)(t) = f (R(t)) = f (t, t2 ) = 2
= con t 6= 0.
t+t 1+t
Por lo tanto, h ◦ f es una función de dos variables y f ◦ R es una función de

una variable. El dominio de h ◦ f consiste de todos los puntos del plano xy
tales que x 6= 1, y el dominio de f ◦R de todos los números reales t diferentes
de 0 y −1. Observe además que f se puede representar como el cociente de
dos funciones de dos variables, digamos f1 (x, y) = xy y f2 (x, y) = x + y
3.2. Lı́mite y continuidad
Persona que trabaje en el campo de la fı́sica–matemática y sus

aplicaciones y no entienda de que trata el concepto de lı́mite,
tendrá una noción muy limitada de lo que realmente significa
este campo en el area de las ciencias naturales.
La noción de lı́mite esta ı́ntimamente ligada al problema de la aproximación

y continuidad en problemas del tipo causa–efecto. Matemáticamente, un
problemas causa–efecto se representa mediante una función f definida de un
conjunto no vació D ⊆ A en un conjunto B. Las causas están representadas
por los elementos de A y los efectos por elementos de B. Entonces la función
f : D ⊆ A → B, tal que f (a) = b esta en B, para algún a en D, representa
la relación funcional entre causas y efectos, y además enfatiza que el efecto b
es consecuencia o lo produce la causa a: b = f (a). El conjunto A representa
el espacio de las causas, los elementos de D las causas predecibles y los
elementos de A \ D las causas no predecibles. Similarmente, B representa el

espacio de las efectos, la imagen If el espacio de las efectos predecibles, y
B \ If el de los efectos no predecibles.
A f B
If
D
a′ b′ = f (a′ )
a′′ b′′
a′′ y b′′ representan posibles causas y efectos no predecibles, respectivamente.

A la causa predecible a′ le corresponde un efecto predecible b′ = f (a′ ).
En la practica y en general, se obtienen (en el laboratorio, por ejemplo) y

con mediana certeza los “valores ideales” del efecto b y la causa a que lo
produce. Los valores reales son únicamente estimaciones de ellos y además
a puede ser eventualmente una causa no predecible. Entonces, el problema
de establecer que tan buena es una estimación de estos valores consiste de
lo siguiente:
1. Fase de aproximación: Dada un efecto aproximado, establecer la cau-
sa aproximada que lo produce. Se debe cumplir que el efecto aproximado
y debe estar cercano del valor b (i.e., y ≈ b) y ser consecuencia de una
causa x (i.e., y = f (x)), siempre que la causa x este muy cercana del
valor a, aun si no es exactamente a (i..e, x ≈ b y x 6= a). Simbólicamente,
f (x) → b cuando x → a, x 6= a,
2. Fase de cuantificación del error: En donde hay aproximaciones, hay

errores. En los conjuntos A y B se deben disponer de algún medio (ins-
trumento) para cuantificar el error en las aproximaciones entre las causas
y los efectos. El error debe entenderse como la medida de la distancia
entre el valor estimado y el valor real, sean en causas o efectos. Cuanti-
ficar el error sera el proceso de medir la distancia entre los valores reales
y estimados. Si los conjuntos A y B son subconjuntos de R, estos errores
de aproximación son obtenidos mediante el valor absoluto, y por tanto
dB (f (x), b) := |f (x) − b|, dA (x, a) := |x − a|.
representaran el error en la aproximación o distancia entre los valores

reales y estimados en los efectos y las causas, respectivamente.
En general, se supone que en los conjuntos A y B es posible definir una
forma de medir distancia de una forma similar a la anterior. Por lo tanto,
si sucede que en las causas f (x) ≈ b cuando en los efectos x ≈ b, aun si
x 6= b, entonces debe tenerse que el error en la aproximación del efecto,
dB (f (x), b), debe ser muy pequeño cuando el error en la aproximación
del efecto, dA (f (x), a), es muy pequeño, aun si x 6= a. Observe que x 6= a
si y solo si dA (x, a) > 0. Simbólicamente,
dB (f (x), b) → 0 cuando dA (x, a) → 0 aun si dA (x, a) > 0.

3. Fase de estimación de la magnitud del error: Las magnitudes en el
error deben ser de cierto orden. Este es un requerimiento que es estándar
cuando se realizan estudios experimentales de problemas causa–efecto.
En este tipo de problemas es conocido o dado el orden ǫ del error en la
aproximación de los efectos (en el mundo real esto es precisamente lo que
se puede ver o determinar) y se busca entonces establecer o encontrar el
orden δ del error en la aproximación en las causas, pero de tal modo que
el error en la aproximación de los efectos sea del orden ǫ previamente
dado cuando el error en la aproximación en las causas sea del orden δ
encontrado, aun si el error en las causas no es cero,
Decir que “el error en la aproximación es de cierto orden” significa que
“el error en la aproximación es menor que el orden de aproximación”.
Por lo tanto, en el caso en discusión debemos tener lo siguiente.
Dado el orden ǫ > 0 del error en la aproximación del efecto b,
se busca establecer un orden δ > 0 del error en la aproxima-
ción de la causa a, de tal modo que dB (f (x), b) < ǫ cuando
dA (x, a) < δ, aun si dA (x, a) > 0. Simbólicamente,
Dado un ǫ > 0, se busca un δ > 0 tal que dB (f (x), b) < ǫ
cuando 0 < dA (x, a) < δ.
La notación matemática de lı́mite resume estos tres procesos:
lı́m f (x) = b.
x→a
El problema causa–efecto definido mediante f es un continuo o es continuo

cuando
lı́m f (x) = f (a).

x→a
3.2.1. Lı́mite
Lı́mite de una función de Sea f : D ⊆ Rn → R una función de varias variables y a un punto que
varias variables no necesariamente pertenece al dominio de f . Se dice que lı́mx→a f (x) = L
si dado un ǫ > 0 existe un δ > 0 tal que |f (x) − L| < ǫ siempre que
0 < kx − ak < δ.
Observe que
p
kx − ak = (x1 − a1 )2 + · · · + (xn − an )2
representa la distancia entre los puntos x y a en Rn y
|f (x) − L|
la distancia entre los números reales f (x) y L. En el siguiente sentido debe

entenderse el concepto de existencia del lı́mite L de f en a:
Cuando el punto x está suficientemente cercano de a, pero x 6=
a, entonces el valor de f (x) estará muy cercano de L. La norma
kx − ak y el valor absoluto |f (x) − L| son una medida del error
en esas aproximaciones. Cuantificado el orden ǫ del error en la
aproximación de f (x) a L, se busca entonces cuantificar el orden
δ del error en la aproximación de x a a. Por eso se suele también
denotar el lı́mite de la forma “f (x) → a cuando x → a”, y se
lee “f (x) tiende a a cuando x tiende a a”.

Geométricamente, los puntos x se encuentran localizados en el interior de
una esfera n–dimensional de centro en a y radio δ, sin el punto a, y los
valores f (x) en el intervalo abierto (L − ǫ, L + ǫ).
Unicidad del lı́mite Proposición 3.3. Sea f : D ⊆ Rn → R una función de varias variables y
a un punto que no necesariamente pertenece al dominio de f . Si el lı́mite
lı́mx→a f (x) existe entonces el lı́mite es único; es decir, si lı́mx→a f (x) = L1
y lı́mx→a f (x) = L2 entonces L1 = L2 .
El contrarrecı́proco de este resultado es una herramienta valiosa para probar
que un cierto lı́mite no existe:
Si el lı́mite lı́mx→a f (x) no es único, entonces lı́mx→a f (x) no
existe.
A diferencia del calculo de funciones de una variables, en donde existen
únicamente dos direcciones para aproximar el punto al cual se toma el lı́mite,
para las funciones de varias variables existen multiplies direcciones, y además
trayectorias, para que el punto x aproxime el punto lı́mite a. Si el lı́mite
existe, entonces el lı́mite es independiente de la trayectoria que pase por el
punto. Si el lı́mite no existe, es suficiente demostrar que a lo largo de dos
trayectorias C1 y C2 que pasen por el punto a, la función f (x) tiene dos
limites distintos.
Ejemplo 3.4. Sea
xy
f (x, y) = 2 .
x + y2
El dominio de f consiste de todos los puntos del plano xy con excepción del
origen. Consideremos la ecuación y = mx de una recta de pendiente m que
pasa por el origen. Entonces
mx2 m m
f (x, y) = = → cuando x → 0, y = mx,
x2 + m2 x2 1 + m2 1 + m2
o
mx2 m
lı́m f (x, y) = lı́m = .
x→0 x→0 x2 + m2 x2 1 + m2
y=mx
Por lo tanto el lı́mite de f en el origen del plano no existe: diferentes va-

lores de m producen curvas diferentes a lo largo de las cuales f tiene limi-
tes diferentes. Para cualquier otro punto del plano xy el lı́mite de f existe
(probarlo).
Ejemplo 3.5. La función
x2 − y 2
f (x, y) =
x2 + y 2
también esta definida para todo punto del plano xy con excepción del origen.
De nuevo, observe que
x2 − 0
lı́m f (x, y) = lı́m = 1,
x→0 x→0 x2 + 0
y=0
0 − y2
lı́m f (x, y) = lı́m = −1,
x=0 y→0 0 + y 2
y→0
en donde x = 0 es una recta horizontal que pasa por el origen y y = 0 es

una recta vertical que también pasa por el origen. Por lo tanto, f no tiene
lı́mite en el origen del plano xy.

Ejemplo 3.6. También la función
x4 − y 4
f (x, y) =
x2 + y 2
esta definida para todo punto del plano xy con excepción del origen. No
obstante, como el lı́mite
x4 − y 4 (x2 − y 2 )(x2 + y 2 )
lı́m = lı́m
(x,y)→(0,0) x2 + y 2 (x,y)→(0,0) x2 + y 2
= lı́m (x2 − y 2 ) = 0 − 0 = 0
(x,y)→(0,0)
e independiente de la trayectoria que pase por el origen del plano xy, enton-
ces f tiene lı́mite cero en el origen.
3x2 y
Ejemplo 3.7. Determine si el lı́mite de la función f (x, y) = 2 existe
x + y2
en (0, 0).
Solución. Como
3x2 (mx) 3mx
lı́m f (x, y) = lı́m = =0
x→0 x→0 x2 + (mx)2 1 + m2
y=mx
y
0
lı́m f (x, y) = lı́m = 0,
x=0
y→0
y→0 y2
e igual sucede tomando el lı́mite a lo largo de las parabolas y = ax2 y

x = ay 2 con a 6= 0, se puede intuir que el lı́mite vale 0. Desafortunadamente
esto no prueba que el lı́mite es 0, pues el resultado depende de la trayectoria
que pasa por el origen. Para demostrar que el lı́mite es cero se aplica la
definición de lı́mite.
Sea ǫ > 0 dado. Se debe encontrar un δ > 0 tal que
3x2 y

x2 + y 2 − 0 < ǫ siempre que 0 < k(x, y) − (0, 0)k < δ

o equivalentemente,
3x2 |y| p
< ǫ siempre que 0< x2 + y 2 < δ
x2 + y 2
Pero
x2 < x2 + y 2 , y 2 < x2 + y 2 .
Por lo tanto,
3x2 |y| p p
2 2
< 3|y| = 3 y 2 < 3 x2 + y 2 < 3δ.
x +y
Como se requiere que
3x2 |y|
< ǫ,
x2 + y 2

p
es suficiente elegir 3δ = ǫ. Entonces δ = ǫ/3 y al hacer 0 < x2 + y 2 < ǫ/3
se obtiene
3x2 y
ǫ
p
2 2
x2 + y 2 − 0 ≤ 3 x + y < 3 3 = ǫ

Por consiguiente,
3x2 y
lı́m = 0.
(x,y)→(0,0) x2 + y 2
Propiedades del lı́mite Proposición 3.8. Sean f, g : D ⊆ Rn → R funciones de n variables que

poseen lı́mite en un punto a que no necesariamente pertenece a D. Entonces
las funciones f + g, cf (c un constante cualquiera), f g, f /g también poseen
lı́mite en a y además
1. lı́m (f (x) + g(x)) = lı́m f (x) + lı́m g(x)
x→a x→a x→a
2. lı́m (cf (x)) = c lı́m f (x)
x→a x→a
3. lı́m f (x)g(x) = lı́m f (x) lı́m g(x)
x→a x→a x→a
f (x) lı́m f (x)

4. lı́m = x→a si lı́m g(x) 6= 0.
x→a g(x) lı́m g(x) x→a
x→a
5. Sea h : D′ ⊆ R → R una función real tal que la función compuesta h ◦ f
esta definida. Si los lı́mites lı́m f (x)(≡ L) y lı́m h(t) existen, entonces
x→a t→L
el lı́mite de h ◦ f existe en a y además

lı́m h(f (x)) = h lı́m f (x) .
x→a x→a
6. Sea R : D′ ⊆ R → Rn una función vectorial tal que la función compuesta

f ◦ R esta definida. Si los lı́mites lı́m R(t)(≡ L) y lı́m f (x) existen,
t→t0 x→L
entonces el lı́mite de f ◦ R existe en t0 y además

lı́m f (R(t)) = f lı́m R(t) .
t→t0 t→t0
3.2.2. Continuidad
Continuidad puntual Definición 3.9. Se dice que una función de varias variables f : D ⊆ Rn →
R es continua en a si y solo si
lı́m f (x) = f (a),

x→a
o lo que es lo mismo,
lı́m f (a + h) = f (a).
h→0
En caso contrario, f se dice es discontinua en a.

Esta definición significa que f (a) y lı́mite de f en a existen, y el valor de f
y el lı́mite de f son iguales en a. De otro lado, la condición de existencia de
f (a) es equivalente a la condición que el punto a pertenezca al dominio de
f.

x2 − y 2
Ejemplo 3.10. La función f (x, y) = no tiene lı́mite en el origen
x2 + y 2
del plano. Entonces f es discontinua en (0, 0). También se puede argumentar
que f no esta definida en el origen del plano.
Ejemplo 3.11. La función
 4 4
x − y si (x, y) 6= (0, 0)
f (x, y) = x + y 2
2
1 si (x, y) = (0, 0)

tiene lı́mite cero en el origen del plano y f (0, 0) = 1. Entonces f es discon-

tinua en el origen.
Propiedades de la Proposición 3.12. Sean f, g : D ⊆ Rn → R funciones de n variables
continuidad puntual que son continuas en el punto a. Entonces las funciones f + g, cf (c un
constante cualquiera), f g, f /g también continuas en a y además
1. lı́m (f (x) + g(x)) = f (a) + g(a)
x→a
2. lı́m (cf (x)) = cf (a)
x→a
3. lı́m f (x)g(x) = f (a) g(a)
x→a
f (x) f (a)
4. lı́m = si g(a) 6= 0.
x→a g(x) g(a)
5. Sea h : D′ ⊆ R → R una función de una variable tal que la función
compuesta h ◦ f esta definida. Si f es continua en a y h es continua en
f (a), entonces la función de varias variables h ◦ f es continua en a y
además

lı́m h(f (x)) = h lı́m f (x) .
x→a x→a
6. Sea R : D′ ⊆ R → Rn una función vectorial tal que la función compuesta

f ◦ R esta definida. Si R es continua en t0 y f es continua en R(t0 ),
entonces la función escalar f ◦ R es continua en t0 y además
lı́m f (R(t)) = f (R(t0 )).
t→t0
Continuidad global y Definición 3.13. Una función de varias variables f es continua en el un

propiedades conjunto D′ si f es continua en cada punto de D′ .
Las propiedades de continuidad de funciones de varias variables en un con-
junto de su dominio se obtienen de una manera natural de las propiedades
de continuidad puntual.
Los monomios x, y y c, con c un escalar cualquiera, se puede demostrar
fácilmente son funciones continuas en R2 :
lı́m x=a
(x,y)→(a,b)
lı́m y=b
(x,y)→(a,b)
lı́m c=c
(x,y)→(a,b)
para cualquier punto (a, b) en R2 . Por lo tanto, de las propiedades del pro-
ducto de funciones continuas el monomio cxn y m , para algún número entero
no negativo m, es también continuo en R2 :
lı́m cxm y m = cam bm
(x,y)→(a,b)

para cualquier punto (a, b) en R2 . De la propiedad de la suma de funciones
continuas el polinomio p(x, y) en dos variables sera también una función
continua en R2 :
lı́m p(x, y) = p(a, b)

(x,y)→(a,b)
para todo punto (a, b) en R2 .

Ejemplo 3.14. Evaluar
lı́m (x2 y 3 − x3 y 2 + 3x + 2y).

(x,y)→(1,−2)
Solución. Como los polinomio son funciones continuas en R2 , entonces
lı́m (x2 y 3 − x3 y 2 + 3x + 2y) = −8 − 4 + 3 − 4 = −13.

(x,y)→(1,−2)
Una función racional f en dos variables es el cociente de dos polinomios, y

sera una función continua en R2 con excepción de aquellos puntos (x, y) en
donde el denominador de f se anula. Por ejemplo, la función racional
2xy + 1
f (x, y) =
x2 + y 2
esta definida en todo R2 con excepción del origen. Por tanto, f es continua
en R2 con excepción del origen.
Ejemplo 3.15. Determine la continuidad de la función
f (x, y) = ln(x2 + y 2 − 1).
Solución. La función logaritmo natural es continua para todo número real

positivo, y la función g(x, y) = x2 + y 2 − 1 es continua para todo valor de
x y y. De la propiedad de composición de funciones continuas se concluye
que la función f es continua para todos los puntos (x, y) en R2 tales que
x2 + y 2 > 1.
Ejemplo 3.16. Determine la continuidad de la función
p
1 − x2 − y 2
f (x, y) = .
x2 − y 2
Solución. De la propiedad de composición de funciones continua se tiene

que el numerador de f es continuo para todo punto (x, y) en R2 tal que
x2 + y 2 < 1. El denominador de f es continuo para todo punto (x, y) en
R2 , y es cero cuando y = ±|x|. De la propiedad del cociente de funciones
continuas se obtiene que f es continua para todo punto (x, y) en R2 tal que
x2 + y 2 < 1 y y 6= ±|x|.
3.3. Derivada
La derivada de una función escalar f (x) se puede considerar como el lı́mite
del cociente diferencias de Newton de la función a lo largo del eje x:
f (x + h) − f (x)
f ′ (x) = lı́m .
h→0 h

La derivada de una función en n variables su puede considerar de igual
manera, solo que existirán n posibles alternativas (o ejes coordenados) cada
una de las cuales se llaman las derivadas parciales de la función con respecto
a la dirección considerada.
Derivadas parciales Definición 3.17. Sea f : D ⊆ Rn → R una función de n variables. Las
derivadas parciales fx1 , . . . , fxn de f con respecto a las variables x1 , . . . , xn
en el punto x = (x1 , . . . , xn ) se define en forma vectorial como
f (x + hej ) − f (x)
fxj (x) = lı́m
h→0 h
o en forma cartesiana como
f (x1 , . . . , xj + h, . . . , xn ) − f (x1 , . . . , xn )
fxj (x1 , . . . , xn ) = lı́m ,
h→0 h
para j = 1, . . . , n, si cada uno de estos limites existe. Otras notaciones de
las derivada parcial de f con respecto a la variable xj son las siguientes:
∂f
fxj (x) = fj (x) = (x) = ∂j f (x) = Dxj f (x) = Dj f (x).
∂xj
Cuando n = 2, se denota z = f (x, y) y las derivadas parciales de f también
se denotan como
∂f ∂z
fx = = = zx
∂x ∂x
∂f ∂z
fy = = = zy
∂y ∂x
Cuando n = 3, se considera w = f (x, y, z) y las derivadas parciales de f
también se denotan como
∂f ∂w
fx = = = wx
∂x ∂x
∂f ∂w
fy = = = wy
∂y ∂y
∂f ∂w
fz = = = wz
∂z ∂z
Ejemplo 3.18. Considere la función f (x, y) = x2 y. Entonces
f (x + h, y) − f (x, y) (x + h)2 y − x2 y
fx (x, y) = lı́m = lı́m
h→0 h h→0 h
(x + h)2 − x2 d(x2 )
= lı́m ·y = · y = 2xy
h→0 h dx
Similarmente,
fx (x, y) = x2 .
Al calcularse la derivada parcial de f con respecto a la variable xj como el

lı́mite de la variación de los cocientes de diferencias de Newton a lo largo de
la dirección del eje coordenado xj , ej , se mantienen fijas las restantes direc-
ciones. Por esto, en lugar de calcular la derivada parcial de f con respecto
a la variable xj mediante la definición, la derivada parcial fxj se pueden
calcular de forma directa manteniendo las otras variables fijas y derivando
con respecto a la variable xj . Las reglas ordinarias de la derivación aplican.

Ejemplo 3.19. Encuentre fx y fy si f (x, y) = x3 y − x sen y.
Solución. para encontrar fx se considera y constante y se deriva con res-

pecto a x:
fx (x, y) = 3x2 y − sen y.
Similarmente, para encontrar fy se considera x constante y se deriva con

respecto a y:
fy (x, y) = x3 − x cos y.
Ejemplo 3.20. Encuentre las derivadas parciales de la función f (x, y, z) =

2 2 2
xyze−x −y −z .
Solución. Al igual que en el caso de las funciones de dos variables, cada

vez que se va a derivar con respecto a una de las variable se consideran las
otras dos como constantes y se deriva aplicando las reglas ordinarias de la
derivada. En este caso,
2
−y 2 −z 2 2
−y 2 −z 2
fx (x, y) = yze−x − 2x2 yze−x
2
−y 2 −z 2 2
−y 2 −z 2
fy (x, y) = xze−x − 2xy 2 ze−x
2
−y 2 −z 2 2
−y 2 −z 2
fz (x, y) = xye−x − 2xyz 2 e−x
Interpretación de las Considere la gráfica de función de dos variables z = f (x, y). El plano x = x0
derivadas parciales interseca la gráfica de f en la curva plana de la figura y el valor fy (x0 , y0 )
es la pendiente de la recta tangente a esta curva en el punto P .
z
b P (x0 , y0 , z0 )
(x0 , y0 , 0)
x y
También, el plano y = y0 interseca la gráfica de f en la curva plana de la

figura y el valor fx (x0 , y0 ) es la pendiente de la recta tangente a esta curva
en el punto P .

z
P (x0 , y0 , z0 ) b
(x0 , y0 , 0) y
x
Ejemplo 3.21. Considere el paraboloide de ecuación f (x, y) = 9 − x2 − y 2 .

(a) El paraboloide y el plano x = 1 se intersecan en una curva C1 . Encontrar
las ecuaciones paramétricas de la recta tangente en (1, 1, 7). (b) Igualmente,
el paraboloide y el plano y = 1 se intersecan en curva C2 . Encontrar las
ecuaciones paramétricas de la recta tangente en (1, 1, 7). (c) Encuentre al
ecuación del plano tangente al paraboloide en el punto (1, 1, 7).
Solución. (a) Como fy (x, y) = −2y entonces fy (1, 1) = −2 es la pendiente

de la recta tangente a la curva en (1, 1, 7) y como esta recta tiene el vector
director d1 = (0, 1, −2), entonces
x = 1, y = 1 + t, z = 7 − 2t
representan las ecuaciones paramétricas de la recta tangente en (1, 1, −7).
(b) En este caso, fy (x, y) = −2x y fx (1, 1) = −2 es la pendiente de la
recta tangente a C2 en (1, 1, −7). Como el vector director de esta recta es
d2 = (1, 0, −2), entonces
x = 1 + t, y = 1, z = 7 − 2t
representan las ecuaciones paramétricas de la recta tangente en (1, 1, −7).
(c) El vector normal al plano tangente esta dado por

i j k

η = d1 × d2 = 0 1 −2 = (−2, −2, −1).
1 0 −2
y
−2(x − 1) − 2(y − 1) − (z + 7) = 0
representa la ecuación del plano tangente en el punto (1, 1, −7).
Derivadas parciales de Por ser las derivadas parciales de una función de varias variables otra función
segundo orden de varias variables, se puede nuevamente intentar calcular sus derivadas
parciales. Sea f : D ⊆ Rn → R una función de n variables. Las segunda
derivada parcial fxi xj de f con respecto a las variables x1 , . . . , xn en el punto
x = (x1 , . . . , xn ) se define en forma vectorial como
fxj (x + hek ) − fxj (x)
fxj xk (x) = lı́m
h→0 h

para j, k = 1, . . . , n, si el lı́mite existe. Las segundas derivadas parciales de f
se suelen llamar derivadas parciales de segundo orden, y también se denotan
de la siguiente forma:
∂2f

∂ ∂f
fxj xk (x) = fxj (x) x = fjk (x) = (x) = (x)
k ∂xk ∂xj ∂xk ∂xj
Segundas derivadas Las segundas derivadas parciales fxj xk se llaman mixtas cuando j es dife-
parciales mixtas rente de k. Una función z = f (x, y) en dos variables tiene cuatro segundas
derivadas parciales, de las cuales dos son derivadas parciales mixtas:
∂2f

∂ ∂f
fxx = =
∂x ∂x ∂x2
∂2f

∂ ∂f
fxy = =
∂y ∂x ∂y∂x
∂2f

∂ ∂f
fyx = =
∂x ∂y ∂x∂y
∂ 2f

∂ ∂f
fyy = =
∂y ∂y ∂y 2
Derivadas parciales de Operativamente hablando, es fácil pensar como calcular las derivadas par-
orden superior ciales de orden m de una función de n variables. Desde el punto de vista
matemático la notación se complica un poco, pero no es sustancialmente im-
portante en la comprensión de lo que entenderemos como todas las derivadas
parciales de orden m de f .
Las derivadas parciales de orden m de una función en n variables f se pueden
denotar por
∂ mf
∂xj11 ∂xj22 · · · ∂xjnm
en donde los escalares j1 , . . . , jm son números enteros no negativos tales que
j1 + j2 + · · · + jm = m. Es decir,
jm !
∂mf ∂ j1 +j2 +···+jm f ∂ j1 ∂ j2 ∂ f
j1 j2 jm = j1 j2 jm = j1 j2 ···
∂x1 ∂x2 · · · ∂xn ∂x1 ∂x2 · · · ∂xn ∂x1 ∂x2 ∂xjmm
Por ejemplo, si f es una función en cuatro variables x, y, z, w entonces una

derivada parcial de sexto orden de f es
∂6f ∂2
3
∂ ∂ f
= := f3012 := fw3 yx2
∂x2 ∂y∂w3 ∂x2 ∂y ∂w3
Derivadas parciales Las derivadas parciales de orden m de f se pueden clasificar en dos cate-
mixtas de orden superior gorı́as. Las derivadas parciales de exactamente orden m de f con respecto
a la variable xk serán
∂ mf

∂ ∂ ∂f
= ··· (m veces) para k = 1, . . . , n.
∂xmk ∂xk ∂xk ∂xk
Cualquier otra derivada de orden m de f que no sea con respecto únicamente

a una de las variables x1 , . . . , xn serán las derivadas parciales mixtas de
orden m de f .

Ejemplo 3.22. Encuentre las terceras derivadas parciales de la función
f (x, y) = xey − 3 cos(x − y).
Solución.
fx (x, y) = ey + sen(x − y) fy (x, y) = xey − sen(x − y)
fxx (x, y) = cos(x − y) fxy (x, y) = ey − cos(x − y)
fyx (x, y) = ey − cos(x − y) fyy (x, y) = xey + cos(x − y)
fxxx (x, y) = − sen(x − y) fxxy (x, y) = sen(x − y)
fxyx (x, y) = sen(x − y) fxyy (x, y) = ey − sen(x − y)
fyxx (x, y) = sen(x − y) fyxy (x, y) = ey − sen(x − y)
fyyx (x, y) = ey − sen(x − y) fyyy (x, y) = xey + sen(x − y)
En el ejemplo anterior, las derivadas parciales mixtas de segundo y tercer or-

den son iguales: fxy = fyx , fxxy = fxyx = fyxx , fxyy = fyxy = fyyx . Leonard
Euler estableció y demostró por primera vez en 1734, en relación con sus
estudios de hidrodinámica, las condiciones que garantizaban esta igualdad.
En general, este resultado se cumple bajo las siguientes condiciones.
Proposición 3.23. Sea f : D ⊆ Rn → R una función de varias variables.
Las derivadas parciales mixtas con respecto a las mismas variables y de
orden m de f son iguales si tales derivadas parciales son continuas.
En otras palabras, si f : D ⊆ Rn → R es una función de varias variables
cuyas derivadas parciales hasta de orden m son continuas entonces las deri-
vadas parciales mixtas de f con respecto a las mismas variables y hasta de
orden m son continuas.
Problema de la no Intuitivamente, la derivada parcial de una función de dos variables no existe
existencia de las cuando la gráfica de la función tiene dobleces, esquinas, huecos, hoyos o
derivadas parciales picos. Por ejemplo, la función f (x, y) = −x2 |y| no tiene derivada parcial
con respecto a y en todo punto de la forma (x, 0), en donde x es un número
real cualquiera diferente de cero. Se observa de la figura que gráfica de f
tiene un doblez a lo largo del eje x debido a la función |y|. De acuerdo a la
definición de la derivada parcial de f ,
(
f (x, 0 + h) − f (x, 0) −x2 |h| x2 si h → 0−
fy (x, 0) = lı́m = lı́m =
h→0 h h→0 h −x2 si h → 0+
Como el lı́mite no es único para todo x diferente de cero, entonces fx (x, 0)
no existe para todos esos valores de x; no obstante, fy (0, 0) = 0. También
se puede demostrar que la derivada parcial fx (0, 0) existe y es cero.
z
x y

Ejemplo 3.24. Sea f (x, y) = −x2 |y|. (a) Determine si existen un plano que
pasa por el punto (0, 0, 0) de la gráfica de f . En caso afirmativo, encuentre
la ecuación del plano. (b) ¿Es el plano tangente a la gráfica de f en (0, 0, 0)?
¿Se puede garantiza que el plano tangente a la gráfica de f en (0, 0, 0) existe?
(c) ¿Que relación se puede establecer entre la existencia de las derivadas
parciales en un punto y la existencia de un plano tangente a la gráfica de f
en ese mismo punto?
Solución. (a) Ambas derivadas parciales fx (0, 0) y fy (0, 0) existen y son

cero. Por lo tanto, los vectores directores a las rectas tangentes cuando
x = 0 y y = 0 son d1 = (0, 1, 0) = j y d2 = (1, 0, 0) = i, respectivamente.
La existencia de esto dos vectores no colineales determina la existencia del
plano que pasa por el punto (0, 0, 0) de la gráfica de f . El vector normal al
plano es η = j × i = −k y la ecuación del plano que pasa por (0, 0, 0) es
z = 0.
(b) El plano que pasa por el punto (0, 0, 0) existe, pero desafortunadamente
no es tangente a la gráfica en ese punto. Este hecho se puede observar
directamente de la gráfica de f . Formalmente, por ejemplo los dos puntos
(0, 0, 0) y (0, 2, 0) son distintos y pertenecen tanto a la gráfica de f como al
plano z = 0. Esto nos garantiza que existe un plano que pasa por el punto
(0, 0, 0) de la gráfica de f pero no es tangente a la gráfica de f en (0, 0, 0).
En consecuencia, no existe un plano tangente a la gráfica de f en (0, 0, 0).
(c) Este ejemplo permite concluir que en general la existencia de las deriva-
das parciales de una función en varias variables no garantizan la existencia
del plano tangente a la gráfica de la función. Cosa bien distinta sucede en
las funciones de una variable en donde la existencia de la derivada de la
función implica la existencia de la recta tangente a la gráfica de la función.
En conclusion, la existencia de las derivadas parciales de una función en mas
de una variable no garantiza la existencia del plano tangente a la gráfica de
la función.
Funciones suaves de Intuitivamente una función en dos variables se puede considerar “suave” si
varias variables su gráfica no tiene dobleces, esquinas, huecos, hoyos o picos. El problema es
como convertir esta noción intuitiva de suavidad en una noción matemática
que aplique a cualquier función en varias variables. Al igual que en funciones
de una variable, la clave esta en la existencia de las derivadas parciales.
Definición 3.25. Una función de varias variables f : D ⊆ Rn → R se dice
“suave” de orden k en D si las derivadas parciales de orden k de f existen
y son continuas para todo x en D. Se asume que f tiene suavidad de orden
cero si f es continua, y que f es suave si f tiene suavidad de cualquier
orden.
Ejemplo 3.26. La función f (x, y) = x|x|y 4 tiene suavidad de orden cero
y de primer orden, pero no tiene suavidad de segundo orden ni de ningún
orden mayor que dos. Claramente f es continua, y las primeras derivadas
parciales de f existen y son continuas:
fx (x, y) = 2|x|y, fy (x, y) = 4x|x|y 3 .
No obstante, la segunda derivada parcial fxx de f no existe a largo de todo

punto (0, y) en el eje y, con y 6= 0:
fx (0 + h, y) − f (0, y) 2|0 + h|y − 2|0|y

fxx (0, y) = lı́m = lı́m
h→0 h h→0 h
(
|h| −2y si h → 0−
= lı́m (2y) =
h→0 h 2y si h → 0+
Por lo tanto f tiene suavidad de primer orden.

Diferenciabilidad Aparentemente la diferenciabilidad de una función f en varias variables es,
en cierto modo, una medida de que tan suave es la función. ¿Y por que tanto
ruido con la diferenciabilidad? Bien, se me ocurre explicarlo de otra manera
que no sea la del mecanismo que decide que tan suave es no una función en
varias variable, y ella es una razón practica. Aunque pueda parecer una idea
sin sentido, la diferenciabilidad de f es de gran utilidad en el campo de las
aplicaciones; en particular, desde el punto de vista computacional. Suponga
que f es una función de varias variables que involucra funciones trascen-
dentes. En la practica los valores de f (x) para un x dado, no se podrán
obtener de forma exacta; de hecho, ni las calculadoras y computadoras mas
avanzadas de hoy dı́a lo pueden hacer. Lo que se hace es recurrir a estimar
una aproximación de f (x) mediante el valor p(x) de un polinomio lineal p
en n variables. ¿Porqué un polinomio lineal? Porque ellos son los polino-
mios de menor grado en n variables que involucran las cuatro operaciones
elementales con las cuales los seres humanos y las computadoras sabemos
operar: suma, resta, multiplicación y division en sus variables.
Tratemos de entender lo que vamos a hacer. Empecemos por el caso mas
sencillo. En las funciones de una variable el valor de f (x) es aproximado por
el valor de un polinomio lineal p(x) que representa la ecuación de la recta
tangente a la gráfica de f en el punto (x0 , f (x0 )), en donde x0 un valor muy
cercano a x. Si pretendemos seguir este camino para el caso de las funciones
f en varias variables y tratamos encontrar la ecuación del plano tangente
mediante las derivadas parciales como se hizo en el Ejemplo 3.21, nos vamos
a encontrar con una seria dificultad. En el Ejemplo 3.24 se muestra el caso
de una función que tiene derivadas parciales en un punto, pero no tiene un
plano tangente a la gráfica de la función en ése punto. En ése caso la función
f no es suave, tiene un doblez a lo largo del eje x. Debemos intuir entonces
que parte de la medida que tan suave es una función f de varias variables
esta ligada a la existencia de sus derivadas parciales. Lo que no esta claro es
como esto eventualmente implique que se puedan aproximar localmente los
valores de f (x) por los valores p(x) de un polinomio lineal p en n variables
que pasa por el punto (a, f (a)).
No nos desanimemos y continuemos. Si la idea previa de encontrar la ecua-
ción de un plano tangente a la gráfica de una función en mas de una variable
con las derivadas parciales no funciona, busquemos otra manera de hacer-
lo, y además tratemos de diseñar algún instrumento (matemático) que nos
indique cuando nos vamos a enfrentar a ese dificultad.
De ser f suave alrededor de un punto (a, f (a)), esperamos (lo mismo que
sucede con funciones de una variable) que los valores f (x) de la función
en puntos x muy cercanos a a, se puedan aproximar localmente por los
valores p(x) de un polinomio lineal p en n variables que pasa por el punto
(a, f (a)). Obviamente existirá un error en esta aproximación y deberá ser

posible estimarlo de la forma
|f (x) − p(x)|,
para todo x cercano a a; cercanı́a que dependerá de que tan distante se

encuentre x de a y la cual se mide por kx − ak.
Como el error en la aproximación de p(x) a f (x) depende que tan cercano
esté x de a, se requiere entonces que error en la aproximación |f (x) − p(x)|
relativo a la distancia entre x y a tienda a cero siempre que x esté muy
cercano de a; i.e.,
|f (x) − p(x)|
→0 siempre que x → a,
kx − ak
o en otras palabras
|f (x) − p(x)|
lı́m = 0.
x→a kx − ak
Si definimos el error1 (no absoluto) E(x, a) como

f (x) − p(x)
E(x, a) := ,
kx − ak
entonces tendremos que
f (x) = p(x) + E(x, a) kx − ak
donde
lı́m |E(x, a)| = 0.

x→a
Evidentemente, esto nos indica que el valor f (x) es aproximado por el valor
de p(x) y que el error E(x, a) kx − ak en esa aproximación es muy pequeño,
casi cero, en cercanı́as de a.
Nos queda aun por establecer la cuestión de como obtener el polinomio lineal
p. Del Calculo de funciones en una variable sabemos que las valores de f (x)
se pueden aproximar por los valores de la recta tangente (un polinomio lineal
en una variable) a la gráfica de f en un punto (x0 , f (x0 )), donde el valor x
esta suficientemente cercano al valor x0 . Recordemos que la pendiente de la
recta tangente en el punto (x0 , f (x0 )) esta dada por
f (x) − f (x0 )
f ′ (x0 ) = lı́m ,
x→x0 x − x0
si el lı́mite existe. Supongamos que el lı́mite existe. El lı́mite anterior significa
que existe un número m = f ′ (x0 ) tal que
|f (x) − f (x0 ) − m(x − x0 )|
lı́m = 0.
x→x0 |x − x0 |
De nuevo, al definir el error E(x, x0 ) de la forma
f (x) − f (x0 ) − m(x − x0 )
E(x, x0 ) :=
|x − x0 |
1 ¿Porque esta definición es consistente?

tendremos que f es derivable en x0 si existe un número m = f ′ (x0 ) tal que
f (x) = f (x0 ) = m(x − x0 ) + E(x, x0 )|x − x0 |
donde
lı́m |E(x, x0 )| = 0.
x→x0
Es claro entonces como generalizar esta idea al problema de la aproximación

de los valores de una función en n variables mediante un polinomio lineal
en n variables.
Diferenciabilidad, Definición 3.27. Se dice que una función f en n variables es diferenciable
aproximación lineal y en a si existe un vector Df (a) en Rn tal que
plano tangente
f (x) = f (a) + Df (a) · (x − a) + E(x, a) kx − ak
donde
lı́m |E(x, a)| = 0.

x→a
El gradiente El vector Df (a) se llama la derivada o gradiente de f en a, y se suele

denotar por ∇f (a).
Si f es diferenciable en a, entonces el polinomio lineal en n variables
p(x) = f (a) + Df (a) · (x − a)
se llama la ecuación cartesiana del plano tangente a f que pasa por el punto
(a, f (a)), y ası́ la diferenciabilidad de f en a es equivalente a la existencia
de un plano en el cual el punto p(x) aproxima el valor de f (x) en el sentido
indicado anteriormente.
Observación 3.28. Al reescribir la ecuación del polinomio p en la forma
vectorial:
(Df (a), 1) · (x − a, p(x) − f (a)) = 0
concluimos que el vector (Df (a), 1) es normal a la “gráfica” de f en el punto

(a, f (a)), y que efectivamente el polinomio lineal p(x) dado es la ecuación
de un plano tangente a f en el punto (a, f (a)). ¡Voila! Podemos decir que
resolvimos nuestro problema, aún sea necesario un poco mas de formalismo
para establecer que esta conjetura es cierta (cf. Proposición ??).
Observación 3.29. Muchos problemas en la fı́sica e ingenierı́a requieren
del uso de métodos vectoriales o matriciales relacionados con funciones de
varias variables, el llamado análisis vectorial. El ejemplo mas evidente y
necesario es el de obtener una notación eficiente de la regla de la cadena.
En este caso los vectores Df (x0 ) y ∇f (a) son diferentes. Primero que todo,
se deben considerar los vectores de Rn como matrices en Rn×1 de n filas y
una columna y redefinir su producto escalar: si x y y son dos vectores de
Rn ≡ Rn×1 , entonces se define el producto escalar entre x y x por
x · y = xT y = x1 y1 + · · · + xn yn ,
donde xT representa la transpuesta de x, una matriz de orden 1 × n.

Segundo, si la función en n variables f : D ⊆ Rn → R es diferenciable en
a entonces la derivada de f en a, Df (a) existe y es una matriz de orden

1 × n. El gradiente de f en a, ∇f (a), es la matriz de orden n × 1 obtenida
como la transpuesta de la derivada Df (a):
∇f (a)T = Df (a),
o viceversa: Df (a)T = ∇f (a). De acuerdo con esta notación, el polinomio

del plano tangente a la gráfica de f en (a, f (a)) tendrá la forma
p(x) = f (a) + ∇f (a) · (x − a)

= f (a) + ∇f (a)T (x − a)
= f (a) + Df (a)(x − a)
en donde x − a se considera como una matriz de orden n × 1.

Ahora el problema de aproximar los valores de f (x) mediante los valores del
polinomio p(x) se reduce a poder encontrar el gradiente (o la derivada) de f .
Vamos por partes. Al igual que en el caso de funciones en una variable, para
empezar se debe establece la unicidad de la derivada y que derivabilidad
implica continuidad.
Proposición 3.30. Si el gradiente de la función f : D ⊆ Rn → R en n
variables existe en un punto a, entonces el gradiente es único.
Entre otras cosas, este resultado nos garantiza que existe un único plano
tangente a la gráfica de f y en consecuencia existe un único polinomio p(x)
que satisface el punto (a, p(x)) y permite aproximar el valor de f (x) para
x en cercanı́a de a.
Continuidad y Proposición 3.31. Si la función f : D ⊆ Rn → R en n variables es
diferenciabilidad diferenciable en a en D, entonces f es continua en a.
Demostración. Si f es diferenciable en a,
f (x) = f (a) + ∇f (a) · (x − a) + E(x, a) kx − ak
en donde
lı́m |E(x, a)| = 0.

x→a
Por lo tanto,
0 ≤ |f (x) − f (a)| ≤ |∇f (a) · (x − a)| + |E(x, a)| kx − ak

= k∇f (a)k kx − ak | cos θ| + |E(x, a)| kx − ak
≤ k∇f (a)k kx − ak + |E(x, a)| kx − ak
en donde los términos del lado derecho de la ultima desigualdad tienden a

cero cuando x → a, y entonces
lı́m f (x) = f (a).

x→a
Por lo tanto, f es continua en a.
Diferenciabilidad y Hasta ahora seguimos sin disponer de una herramienta para encontrar el
existencia de las gradiente de una función de varias variables, y de por si la definición no es
derivadas parciales útil para hacerlo. Sin embargo, y como se vera a continuación, la diferencia-
bilidad de la función implica la existencia de sus derivadas parciales y una
forma de calcular el gradiente de la función.

Proposición 3.32. Si la función de n variables f : D ⊆ Rn → R es
diferenciable en x, entonces las primeras derivadas parciales de f existen
en x y además el gradiente es el vector de esas derivadas parciales en x:

∂f ∂f
∇f (x) = (x), . . . , (x)
∂x1 ∂xn
Demostración. Si f es diferenciable en a, entonces
|f (x) − f (a) − ∇f (a) · (x − a)|

lı́m =0
x→a kx − ak
Sea x = a + hej . Entonces
|f (a + hej ) − f (a) − h(∇f (a))j |

lı́m =0
x→a |h|
o también,

f (a + hej ) − f (a)
lı́m − (∇f (a))j = 0.
x→a h
Esto implica que
f (a + hej ) − f (a)
lı́m = (∇f (a))j
x→a h
y por tanto,
∂f
(a) = (∇f (a))j ,
∂xj
la j–ésima componente del gradiente.
No obstante lo anterior, poder obtener el gradiente de f depende que f

sea diferenciable, cosa que aun no sabemos como establecer ni condiciones
que las garantizan. Afortunadamente el siguiente criterio nos resuelve el
problema.
Proposición 3.33. Si la función f : D ⊆ Rn → R en varias variables tiene
primeras derivadas parciales en todo punto cercano a a y si además esas
derivadas parciales son continuas en x, entonces f es diferenciable en a.
El siguiente diagrama resume los resultados anteriores.
Definición de
diferenciabilidad
Existencia de las
Parciales continuas Diferenciabilidad
derivadas parciales
Continuidad Gradiente
Obviamente este diagrama nos dice también que la existencia del gradiente
no implica que la función es continua. ¿Existe un ejemplo?

Ejemplo 3.34. Mostrar que la función
x2 − y 2
f (x, y) =
x2 + y 2
es diferenciable en todos en plano xy excepto en el origen.
Solución. Las derivadas parciales de f
∂f 2x(x2 + y 2 ) − 2x(x2 − y 2 ) 4xy 2

= =
∂x (x2 + y 2 )2 (x2 + y 2 )2
2 2 2 2
∂f −2y(x + y ) − 2y(x − y ) −4x2 y
= =
∂y (x2 + y 2 )2 (x2 + y 2 )2
son continuas excepto cuando (x, y) = (0, 0). La Proposición 3.31 y su con-
trarrecı́proco garantizan que f es diferenciable en todos los puntos del plano
xy con excepción del origen. Además la Proposición 3.32 garantiza que el
gradiente de f existe y está definido por
4xy
∇f (x, y) = (y, −x)
(x2 + y 2 )2
todos los puntos del plano xy con excepción del origen.
Tenemos un asunto por resolver respecto a la diferenciabilidad de funciones

de varias variables. A la diferencial se le debe exigir que cumpla las mismas
propiedades de la derivada usual: Si f, g son funciones en varias variables y
diferenciables y c es un escalar, entonces las funciones f + g y cf deben ser
diferenciables y
D(f + g) = Df + Dg
D(cf ) = cD(f )
Es decir, D debe ser una transformación lineal, y Df (x) es un vector (W.H.

Young, 1908; M. Fréchet, 1911). A continuación se establece que las propie-
dades algebraicas del gradiente se comportan como las reglas usual de las
derivadas.
Reglas del gradiente Proposición 3.35. Supongamos de los gradiente de las funciones f y g
existen. Entonces
1. ∇(f (x) + g(x)) = ∇f (x) + ∇g(x)
2. ∇(cf (x)) = c∇f (x)
3. ∇(f (x)g(x)) = f (x)∇f (x) + g(x)∇f (x)

f (x) g(x)∇f (x) − f (x)∇g(x)
4. ∇ =
g(x) g 2 (x)
Demostración.

∂(f g) ∂(f g) ∂g ∂f ∂g ∂f
∇(f g) = ,..., = f +g ,...,f +g
∂x1 ∂xn ∂x1 ∂x1 ∂xn ∂xn

∂g ∂g ∂f ∂f
=f ,..., +g ,..., = f ∇g + g∇f
∂x1 ∂xn ∂x1 ∂xn
Las otras demostraciones son similares.

Ejemplo 3.36. Encuentre la derivada de f si f (x, y) = (x2 − y 2 )/(x2 + y 2 ).
Solución. De las reglas de la derivada, y la Proposición 3.32 el gradiente

o derivada de f existe y esta definido por
2x(x2 + y 2 ) − 2x(x2 − y 2 ) −2y(x2 + y 2 ) − 2y(x2 − y 2 )

∇f (x, y) = ,
(x2 + y 2 )2 (x2 + y 2 )2
4xy 2 −4x2 y

= ,
(x2 + y 2 )2 (x2 + y 2 )2
para todo punto del plano con excepción del origen.
Diferenciales Si f es una función de n variables y diferenciable en a entonces
f (x) − f (a) = ∇f (a) · (x − a) + E(x, a) kx − ak
en donde
lı́m E(x, a) = 0.
x→a
Sea ∆f (x) = f (x − f (a) el incremento de f , y ∆x = x − a el incremento

en x. Entonces
∆f (x) = ∇f (a) · ∆x + E(x, a) k∆xk
en donde
lı́m E(x, a) = 0.
∆x→0
Tenemos ası́ que ∇f (a) · ∆x será una buena aproximación del incremento
∆f (x). Esto sugiere la siguiente definición.
Definición 3.37. Sea f una función diferenciable, y sea dx = (dx1 , . . . , dxn )
el vector diferencial de x (el vector de los diferenciales dx1 , . . . , dxn de
x1 , . . . , xn ). La diferencial (total) de f , denotada como df (x), se define en
forma vectorial como
df (x) = ∇f (x) · dx
o en forma cartesiana como
∂f ∂f
df (x1 , . . . , xn ) = (x1 , . . . , xn )dx1 + · · · + (x1 , . . . , xn )dxn
∂x1 ∂xn
Ejemplo 3.38. Encuentre la ecuación del plano tangente a f (x, y) = x2 +y 2

en el punto (1, 1, 2).
Solución. Observe que ∇f (x, y) = (2x, 2y). Por lo tanto
z − 2 = 2(x − 1) + 2(y − 1)
o bien
2x + 2y − z = 2

El campo gradiente La diferencial con el uso adquirió el nombre de gradiente o campo gradiente,
debido a que este vector genera un campo vectorial que es tangente en cada
punto a las curvas de nivel de f . El gradiente asociado con cada punto x
en el dominio de f es el vector ∇f (x). El conjunto de todos esos vectores
en Rn se llama el campo gradiente de f . Geométricamente, el gradiente se
representa una flecha de origen en x y extremo x+ ∇f (x). Si z = 9 − x2 − y 2
entonces ∇f (x, y) = −2(x, y)
Regla de la cadena La Regla de la cadena establece condiciones para la existencia de la derivada
de la composición de funciones, y una forma de calcularla. Las funciones de
varias variables se pueden componer, hasta el momento, con una función de
una variable o una función de una variable:
h◦f
f h
D ⊆ Rn If ⊆ I ⊆ R R
x f (x) h(f (x))
o de una función vectorial con una función de varias variables
f ◦R
R f
I ⊆R IR ⊆ D ⊆ Rn R
t R(t) f (R(t))
En el primer caso la composición es una función en varias variables y en el
segundo una función escalar o de una variable.
Proposición 3.39. Sean f : I ⊆ Rn → R una función de n variables y
h : I ⊆ R → R una función escalar tales que la intersección If ∩ Dh es no
vacı́a. Se define la función compuesta v = h ◦ f como
v(t) = h(f (x)).
Si f es diferenciable es x y h es derivable en f (x) entonces v es diferenciable
en x y es igual
∇v(x) = h′ (f (x))∇f (x)
Sea t = f (x). Entonces la derivada ∇v(x) = h′ (t)∇f (x) se podrá escribir
de la forma
∂v dh ∂f
=
∂x1 dt ∂x1
Proposición 3.40. Sean R : I ⊆ R → Rn una función vectorial y f : D ⊆
Rn → R una función de n variables tales que la intersección IR ∩ Df es no
vacı́a. Se define la función compuesta u = f ◦ R como
u(t) = f (R(t)).
Si existe un punto t en el que R′ (t) existe y f es diferenciable en R(t)
entonces u′ (t) existe y es igual al producto escalar
u′ (t) = ∇f (R(t)) · R′ (t)
Las componentes de x = R(t) dependerán de t: R(t) = x = (x1 (t), . . . , xn (t)).
Entonces la derivada u′ (t) = ∇f (x) · R′ (t) se podrá escribir de la forma
du ∂f dx1 ∂f dxn
= + ··· +
dt ∂x1 dt ∂xn dt

3.4. Gradientes y derivadas direccionales
Las derivadas direccionales son especialmente importantes para establecer
un sentido fı́sico y geométrico de la derivada o gradiente de una función f
en n varias variables, y en especial para demostrar que el polinomio lineal
en n variables, p(x) = f (a) + ∇f (a) · (x − a) representa efectivamente la
ecuación del plano tangente a la gráfica de f en el punto de coordenadas
(a, f (a)); asunto que aún esta por demostrar.
Derivada direccional Definición 3.41. Sea f : D ⊆ Rn → R una función de n variables. Se
define la derivada de f en a en la dirección del vector u como
f (a + hu) − f (a)
Du f (a) = lı́m ,
h→0 h
si el lı́mite existe. Si u es un vector unitario, Du f (a) se llama la derivada
direccional de f en a en la dirección u.
Diferenciabilidad y Proposición 3.42. Si f es diferenciable en a entonces
derivada direccional
Du f (x0 ) = ∇f (x0 ) · u.
Demostración. Si f es diferenciable en a las derivadas parciales de f en

a existen y además
f (x) = f (a) + ∇f (a) · (x − a) + E(x, a) kx − ak
en donde E(x, a) → 0 cuando t → 0. Supongamos que x es un punto en

la recta x = a + hu para algún escalar h. Observe que x → a si y solo si
h → 0. Por lo tanto,
f (a + hu) − f (a)
= ∇f (a) · u ± E(a + hu, a)
h
en donde E(a + hu, a) → 0 cuando h → 0. Como el lı́mite del lado izquierdo
de esta ecuación existe, entonces se concluye que Du f (a) existe. Tomando
lı́mite cuando h tiende a cero en ambos lados de la ecuación anterior se
obtiene el resultado.
Sentido geométrico del Proposición 3.43. Si ∇f (a) es diferente de cero, entonces ∇f (a) apunta
gradiente en la dirección a lo largo de la cual f crece mas rápido.
Demostración. Si u es un vector unitario entonces
Du f (a) = ∇f (a) · u = k∇f (a)k kuk cos θ = k∇f (a)k cos θ,
donde θ representa el ángulo entre u y ∇f (a). Este ángulo es máximo

cuando θ = 0; esto es, cuando u y ∇f (a) son paralelos. Se considera en la
hipótesis que ∇f (a) 6= 0, porque si ∇f (a) = 0 entonces Du f (a) = 0 para
cualquier u.
Es decir, si nos queremos mover en la dirección en la cual f crece mas

rápido, debemos hacerlo en la dirección ∇f (a). Análogamente, si deseamos
movernos en la dirección en la cual f decrece mas rápido, debemos hacerlo
en la dirección −∇f (a).
La siguiente proposición establece una relación directa entre el gradiente y
las curvas de nivel.

Sentido geométrico del Proposición 3.44. Sea f : Rn → R una función con primeras derivadas
gradiente parciales continuas y a un punto en el conjunto de nivel Lk (f ) definida por
f (x) = k, para alguna constante k. Entonces ∇f (a) es normal a Lk (f ) en el
siguiente sentido: para todo vector v tangente a una trayectoria C en Lk (f )
que pasa por a se cumple que ∇f (a) · v = 0.
Demostración. Si C es una trayectoria en Lk (f ) que pasa por a y esta

definida por R(t), entonces existe un escalar t0 tal que R(t0 ) = a y además
f (R(t0 )) = k. Como v es tangente a C en a entonces v y R′ (t0 ) son colineales.
Sin pérdida de generalidad supongamos que v = R′ (t0 ). Ası́ que derivando
en ambos lados de la ecuación f (R(t0 )) = k con respecto a t y aplicando la
regla de la cadena tenemos que

d d
= ∇f (R(t)) · R′ (t)

0= f (R(t0 )) = f (R(t))
dt dt t=t0 t=t0
= ∇f (R(t0 )) · R′ (t0 ) = ∇f (a) · v
Plano tangente Definición 3.45. Sea S el conjunto de nivel n–dimensional formada por
los puntos x en Rn tales que f (x) = k, para k una constante dada. El plano
tangente a S en un punto a de S se define por la ecuación vectorial
∇f (a) · (x − a) = 0
si ∇f (a) es diferente del vector nulo.

Sentido geométrico del Proposición 3.46. Sea f una función en n variables que es diferenciable
gradiente en a. Entonces la ecuación del plano tangente a la gráfica de f en el punto
de coordenadas (a, f (a)) esta dada por el polinomio lineal en n variables,
p(x) = f (a) + ∇f (a) · (x − a).
Demostración. Consideremos el caso n = 2 y sea z = f (x, y). Sea g

la función en tres variables definida de la forma g(x, y, z) = f (x, y) − z.
Observe que la gráfica Gf de f coincide con la curva de nivel Lk (g) de g
cuando k = 0; es decir, Gf = L0 (g). Entonces tendremos que el vector
∇g(x0 , y0 , z0 ) = (fx (x0 , y0 ), fy (x0 , y0 ), −1) = (∇f (x0 , y0 ), −1) es normal a
la gráfica de f en el punto (x0 , y0 , z0 ) = (x0 , y0 , f (x0 , y0 )). En consecuencia,
éste vector y éste punto determinan un plano tangente a la gráfica de f en
tal punto, y su ecuación esta dada de la forma,
(∇f (x0 , y0 ), −1) · (x − x0 , y − y0 , z − f (x0 , y0 )) = 0;
o lo que es lo mismo,
z = f (x0 , y0 ) + ∇f (x0 , y0 ) · (x − x0 , y − y0 ).
3.5. Extremos de funciones de varias variables

Sea f : D ⊆ Rn → R una función y M un subconjunto de Rn tal que la
intersección D ∩ M es no vacı́a; usualmente se considera M es un subcon-
junto del dominio D de f . Un problema de optimización no lineal tiene la
estructura estándar dada por
mı́n{f (x) | x ∈ M }

o
máx{f (x) | x ∈ M },
donde M es un subconjunto de Rn , el cual puede representar o no una

trayectoria en Rn .
Por ejemplo, M puede ser la bola n–dimensional
B(O, r) = {x ∈ Rn | kxk ≤ r}
con centro en el origen de Rn y radio positivo r; o el conjunto de nivel
Lk (g) = {x ∈ Rn | g(x) = k},
donde k es una constante apropiada. Cuando M = B(O, r), el problema se

suele llamar de optimización global, y cuando M = Lk (g) un problema de
optimización con restricciones. Ambos tipos de problemas de optimización
serán discutidos en esta sección.
3.5.1. Extremos locales y optimización global

Un problema de optimización sin restricciones (o global) consiste en el pro-
blema de encontrar los extremos locales o extremos absolutos de una cierta
función f de varias variables, donde f se considera definida en todo su
dominio. Se estudian resultados que garantizan condiciones que permiten
establecer cuales son los extremos locales de f , si ellos existen. Como ve-
remos, el criterio de la primera derivada para funciones de una variable no
se puede extender al caso de funciones de varias variables. La extension
del criterio de la segunda derivada es posible y su demostración require del
teorema de Taylor para funciones variables. Las condiciones que permiten
cuales son los extremos locales de f requieren de algunos resultados de Alge-
bra Lineal. Finalmente, es oportuno aclarar que desafortunadamente no se
pueden establecer criterios que permitan encontrar los extremos absolutos
de un problema de optimización sin restricciones.
Para a en Rn y ǫ > 0, B(a, ǫ) denota la vecindad (abierta) de a de radio ǫ
definida como
B(a, ǫ) = {x ∈ Rn | kx − ak < ǫ}
Máximos, mı́nimos y puntos de silla

Primero que todo consideremos un subconjunto M de Rn que no sea una
trayectoria.
Definición 3.47. Sea f : D ⊆ Rn → R una función de varias variables y M
un subconjunto de Rn tal que M ⊆ D. Se dice que f tiene un mı́nimo local
o relativo en un punto a de M si existe una vecindad abierta U de a en M
tal que f (x) ≥ f (a) para todo x en U . El número f (a) se llama el mı́nimo
relativo de f en M . Se dice que f tiene un mı́nimo global o absoluto en un
punto a de M si f (x) ≥ f (x) para todo x en M , y el número f (a) se llama
el máximo global/absoluto de f en M . Si las dos anteriores desigualdades se
cumplen en el sentido estricto, se dice que f tiene un mı́nimo local estricto
en M y un mı́nimo global estricto en M , respectivamente.
El máximo local o relativo y el máximo global o absoluto se definen de forma
similar.

Definición 3.48. Un extremo local (absoluto) es un número que es un mı́ni-
mo local (absoluto) o un máximo (global). Por convención, un extremo sera
un extremo absoluto y un máximo o un mı́nimo serán un máximo ab-
soluto o un mı́nimo absoluto.
Las siguientes definiciones y resultados son necesarios para obtener el criterio
de la segunda derivada para funciones de varias variables.
Teorema de Taylor de segundo orden

Si f es diferenciable en a y tiene un punto crı́tico en a entonces
f (x) − f (a) = E1 (x, a) kx − ak
donde E1 (x, a) → 0 cuando x → a. Por lo tanto, se necesita mas informa-

ción de f en a en términos de E1 (x, a) kx − ak para determinar el signo
algebraico de f (x) − f (a). El Teorema de Taylor de segundo orden permite
resolver esta dificultad.
La matriz hessiana y el Definición 3.49. Sea f : D ⊆ Rn → R una función de varias variables con
hessiano segundas derivadas parciales ∂ 2 f /∂xi ∂xj continuas. La matriz hessiana
de f es la matriz de las segundas derivadas parciales de f ,
 ∂2f ∂2f ∂2 f

∂x12 (x) ∂x 1 ∂x 2
(x) · · · ∂x 1 ∂x n
(x)
2
  ∂ f (x) ∂2f ∂2 f

2
∂ f  ∂x2 ∂x1 ∂x2 2 (x) · · · ∂x2 ∂xn (x)

(x) =  .. .. .. ..
∂xi ∂xj


 . . . .


∂2f ∂2f ∂2 f
∂xn ∂x1 (x) ∂xn ∂x2 (x) · · · n∂x2 (x)
2
y se denota como D f (x). Observemos que la matriz hessiana es una matriz
cuadrada de orden n y simétrica. El determinante de la matriz hessiana de
f se llama el hessiano de f . Además,
h i
∂f ∂f ∂f
D2 f (x) = ∇ ∂x 1
(x) ∇ ∂x2 (x) · · · ∇ ∂xn (x)
El término “hessiana” fue acuñado por James Joseph Sylvester en honor

del matemático alemán Ludwig Otto Hesse, quien habı́a usado el término
“determinantes funcionales”.
Formula de Taylor de Proposición 3.50. Sea f : D ⊆ Rn → R una función de varias variables
segundo orden con segundas derivadas parciales ∂ 2 f /∂xi ∂xj continuas en una vecindad V
de a. Entonces para x en V se tiene
1
f (x) = f (a) + Df (a)(x − a) + (x − a)T D2 f (a)(x − a)
2!
2
+ E2 (x, a) kx − ak
en donde E2 (x, a) → 0 cuando x → a.
Demostración. Sea {a + td | t ∈ R} la ecuación de la recta que pasa por

el punto a en la dirección del vector d = x − a. Definamos la función escalar
φ(t) = f (a + td). Observe que φ tiene segundas derivadas continuas en una
vecindad de t = 0 tal que φ(0) = f (a) y φ(1) = f (x). Por el Teorema de
Taylor para funciones de una variable,
1 ′′
φ(1) = φ(0) + φ′ (0) + φ (c), donde 0 < c < 1.
2!

De la regla de la cadena,

′ d
φ (0) = f (a + td) = Df (a)d = ∇f (a) · d
dt t=0
y

d d
φ′′ (c) =

(Df (a + td) d) = Df (a + td) d
dt t=c dt t=c
= (D2 f (a + cd)d)d ≡ dT D2 f (a + cd)d,
en notación vectorial. Ahora definamos E2 (d + a, a) por la ecuación

1 T 2
E2 (d + a, a) kdk2 = d [D f (a + cd) − D2 f (a)]d,
2!
si d 6= O, y E2 (a, O) si d = O. Entonces,
1 T 2
f (x) = f (a) + Df (a)d + d D f (a)d + E2 (a + d, a) kdk2 .
2!
Como

T 2
d [D f (a + cd) − D2 f (a)]d

n X n
∂2f ∂2f

2
X
≤ ∂xi ∂xj (a + cd) − ∂xi ∂xj (a) kdk ,

i=1 j=1
se tiene que
n n
1 X X ∂ 2 f ∂2f

|E2 (d + a, a)| ≤ (a + cd) − (a)
2! i=1 j=1 ∂xi ∂xj
∂xi ∂xj
para d no nulo. Como las segundas derivadas parciales son continuas en a,

entonces
∂ 2f ∂2f
lı́m (a + cd) = (a),
d→0 ∂xi ∂xj ∂xi ∂xj
ası́ que E2 (d + a, a) → 0 cuando d → 0. Observe que x → a cuando d → O.

Esto termina la demostración.
Condiciones para la existencia de extremos

Para dar condiciones necesarias y suficientes para la existencia de extre-
mos locales se consideran resultados de Algebra Lineal avanzada. Estos re-
sultados conciernen a los tópicos de matrices simétricas, formas bilineales,
matrices definido positivas y definido negativas, valores y vectores propios.
Este enfoque fue apropiadamente establecido por James Joseph Sylvester,
especialmente, y aunque solo se considera parte de su teorı́a, se recomienda
la lectura de libros avanzados en estos tópicos cuando se requiera realizar
aplicaciones matemáticas que involucren el problema de determinar los ex-
tremos relativos de funciones en mas de dos variables.
Condiciones necesarias de Proposición 3.51. Si f tiene primeras derivadas parciales continuas en
primer orden M y f tiene un mı́nimo local en a entonces Df (a) = O.

Demostración. Supongamos que Df (a) 6= O. Entonces existe un vector
no nulo ξ en Rn tal que Dξ f (a) = Df (a) · ξ = α < 0 (Por ejemplo ξ =
−Df (a)T = −∇f (a)).
Considerando la variación de f a lo largo de la linea recta que pasa por a
en la dirección del vector ξ, se tiene la función escalar
φ(t) = f (a + tξ)
Por la regla de la cadena, φ′ (t) = Df (a + tξ)ξ. Como φ(0) = f (a) y φ es

diferenciable en t = 0, del teorema de Taylor en funciones de una variable
tenemos que si t 6= 0

′ ′ E1 (t, 0)|t|
φ(t) = φ(0) + φ (0)t + E1 (t, 0)|t| = φ(0) + t φ (0) +
t
Como E1 (t,0)|t|
t → 0 cuando t → 0 y φ′ (0) = Df (a)ξ = α < 0 entonces
existe un t0 tal que φ′ (0) + E1 (t,0)|t|
t ≤ α2 para todo t ∈ (0, t0 ). Entonces
1
φ(t) ≤ φ(0) + αt
2
para todo t ∈ (0, t0 ). Como α < 0 esto implica que
φ(t) < φ(0),
o lo que es igual
f (a + tξ) < f (a)
para todo t ∈ (0, t0 ). Sin embargo esto contradice que a sea un mı́nimo local
de f .
Aunque el recı́proco de este resultado no es cierto en general, el nos indica

que si una función f en varias variables es diferenciable, entonces f puede
tener un extremo local en todos aquellos puntos de su dominio en donde su
gradiente se anula. Esta observación motiva la siguiente definición.
Definición 3.52. Sea f : D ⊆ Rn → R una función de varias variables
diferenciable en a. Si ∇f (a) = 0 entonces el punto a se llama un punto
crı́tico o estacionario, de f . Un punto crı́tico de f es un punto de silla si
toda vecindad U de a contiene puntos x y x′ distintos tales que f (x) > f (a)
y f (x′ ) < f (a).
La Proposición 3.51 establece una condición necesaria para que f tenga un
punto critico en a, pero no es una condición suficiente para que f tenga un
mı́nimo local en a. Condiciones suficientes son dadas en la Proposición 3.56,
pero antes se hace necesario considerar algunos preliminares para obtener
este resultado.
Definición 3.53. Sea A una matriz simétrica de orden n × n. A es definido
positiva (negativa) si xT Ax > 0 (< 0) para todo vector no nulo x de Rn .
Se dice que A es semidefinido positiva (negativa) si xT Ax ≥ 0 (≤ 0) para
todo vector x de Rn .

Sea A = [aij ] una matriz de orden n × n. Entonces A tiene n submatrices
diagonales Ak de orden k × k, para k = 1, . . . , n, definidas por
 
a11 a12 · · · a1k
a21 a22 · · · a2k 
Ak =  . .. ..  ;
 
 .. ..
. . . 
ak1 ak2 ··· akk
o por simplicidad, Ak = [aij ]k×k . Los números reales det Ak = |Ak | se

llaman los subdeterminantes diagonales de A.
Lema de Sylvester Proposición 3.54. Sea A una matriz simétrica de orden n × n.
a. A es definido positiva si y solo si |Ak | > 0 para k = 1, . . . , n.
b. A es definido negativa si y solo si |A1 | < 0, |A2 | > 0, |A3 | < 0, . . .
Condición necesaria de Proposición 3.55. Sea f : D ⊆ Rn → R una función de varias varia-
segundo orden bles con terceras derivadas parciales continuas y a un mı́nimo local de f .
Entonces Df (a) = 0 y D2 f (a) es semidefinido positiva.
Demostración. La demostración se sigue del Teorema de Taylor para fun-

ciones de varias variables y el criterio de Sylvester.
La siguiente proposición establece condiciones suficiente para la existencia

de la extremos locales.
Criterio de la segunda Proposición 3.56. Sea f : D ⊆ Rn → R una función de varias variables
derivada con terceras derivadas parciales continuas y a un punto crı́tico de f . Si
D2 f (a) es semidefinido positiva entonces f (a) es un mı́nimo local fuerte de
f.
Demostración. Del Teorema de Taylor y la hipótesis que ∇f (a) = 0 te-

nemos
1 2
f (x) = f (a) + (x − a)T D2 f (a)(x − a) + E2 (x, a) kx − ak
2
en donde E2 (x, a) → 0 cuando x → a.
Si la matriz simétrica D2 f (a) es definido positiva, entonces existe una cons-
tante positiva λ1 (que puede ser tomada como el menor valor propio de
2
D2 f (a)) tal que (x − a)T D2 f (a)(x − a) ≥ λ1 kx − ak para todo vector x
de Rn (cf. Gilbert Strang, Linear Algebra). Por lo tanto,
1 2 2
f (x) − f (a) ≥ λ1 kx − ak + E2 (x, a) kx − ak
2
en donde E2 (x, a) → 0 cuando x → a. Como la expresión del lado derecho
debe ser positiva cuando x → a, se sigue que f (x) > f (a) en alguna
vecindad de a; i.e., f (a) es un mı́nimo local fuerte de f .
En el caso de máximos locales de f la situación es totalmente análoga. Si

f tiene un máximo local en a entonces a debe ser un punto critico de f .
Si además D2 f (a) es definido negativa, entonces f (a) es un máximo local
fuerte de f . Además es fácil de demostrar que si a es un punto estacionario
de f , entonces
1. f (a) no es ni máximo local ni mı́nimo local si D2 f (a) tiene valores
propios positivos y negativos.

2. f (a) puede ser o no un máximo local si D2 f (a) es semidefinido positiva.
El siguiente resultado es un caso particular de la anterior proposición.
Corolario 3.57. Sea f (x, y) una función con terceras derivadas parciales
continuas en un conjunto abierto D en R2 . Sea además (x0 , y0 ) un punto
crı́tico de f . Entonces,
2
a. Si fxx (x0 , y0 ) > 0 y fxx (x0 , y0 )fyy (x0 , y0 ) − fxy (x0 , y0 ) > 0 entonces f
tiene un mı́nimo local en (x0 , y0 ).
2
b. Si fxx (x0 , y0 ) < 0 y fxx (x0 , y0 )fyy (x0 , y0 ) − fxy (x0 , y0 ) > 0 entonces f
tiene un máximo local en (x0 , y0 ).
2
c. Si fxx (x0 , y0 )fyy (x0 , y0 ) − fxy (x0 , y0 ) < 0 entonces f tiene un punto de
silla en (x0 , y0 ).
2
d. Si fxx (x0 , y0 )fyy (x0 , y0 ) − fxy (x0 , y0 ) = 0 el criterio no decide nada.
De nuevo se aclara que el criterio de la segunda derivada garantiza condi-
ciones que permiten clasificar los puntos crı́ticos de una función en varias
variables como extremos locales. Desafortunadamente, el criterio no existe
criterio alguno que permita obtener los extremos absolutos de la función.
3.5.2. Optimización con restricciones

Un problema de optimización con restricciones consiste en el problema de
encontrar los extremos locales o extremos absolutos de una cierta función
f de varias variables en un subconjunto M de su dominio. Se considera los
casos cuando M es un conjunto cerrado y acotado y cuando M es el conjunto
de nivel de una función g en varias variables dada.
Extremos de funciones definidas en conjuntos cerrados y acotados

El siguiente resultado es un criterio para obtener los extremos de una función
en varias variables en un conjunto cerrado y acotado de su dominio.
Proposición 3.58 (Weierstrass). Sea M un subconjunto no vacı́o, cerrado
y acotado de Rn . Si f : M ⊆ Rn → R es una función continua, entonces
existen puntos a y a′ en M tal que f (a) ≤ f (x) ≤ f (a′ ) para todo x en M .
La prueba estándar se obtiene notando que si f es continua entonces la
imagen de un conjunto cerrado y acotado es también un conjunto cerrado y
acotado. Como M es cerrado y acotado, se sigue que f (M ) debe ser también
cerrado y acotado. Por tanto, f alcanza su mı́nimo absoluto y su máximo
absoluto en algunos puntos a y a′ en M , respectivamente. Esto precisamente
garantiza que f (a) ≤ f (x) ≤ f (a′ ) para todo x en M .
Como M es un conjunto es un conjunto cerrado, se puede considerar a M
como un conjunto formado por su interior y su frontera. Para encontrar
los extremos de f se procede primero a encontrar los extremos locales de
f en el interior de M mediante el criterio de la segunda derivada. Luego
se encuentran los extremos locales de f sobre su frontera. De acuerdo con
el Teorema de Weierstrass podemos garantizar que el menor y el mayor de
estos extremos locales serán los extremos de f en el conjunto M .
Ejemplo 3.59. Encuentre los extremos de la función f (x, y) = x2 − y 2 −
2xy + 1 en el conjunto [−1, 2] × [−1, 2].
Extremos de funciones a lo largo de conjuntos de nivel, multiplicadores de Lagrange

Ahora se busca resolver el problema de encontrar los extremos de una fun-
ción de varias variables f (x) cuando x tiene la restricción de pertenecer a un

conjunto de nivel M en el dominio de f . Simbólicamente, se busca resolver
el problema
mı́n{f (x) | x ∈ M }
máx{f (x) | x ∈ M }
donde M ⊆ Df usualmente dado de la forma
M = {x ∈ Rn | g(x) = k}
para alguna constante apropiada k. Observe que M = Lk (g) y por tanto
la ecuación g(x) = k, llamada de igualdad, es la restricción que define a
M . Por lo tanto, se busca optimizar la función f para todo vector x en el
conjunto de nivel de g, Lk (g) con k dado.
En general, también se puede considerar
M = {x ∈ Rn | gi (x) = ki , i = 1, . . . , m}
para constantes apropiadas ki , y m < n. Es claro que el conjunto n–
dimensional M esta definido por las restricciones gi (x) = ki para i =
1, . . . , m.
Geométricamente,
Teorema de Proposición 3.60. Sean f, g : D ⊆ Rn → R dos funciones suaves dadas.
multiplicadores de Sean M el conjunto de nivel de g con valor k y a un punto en D tal que
Lagrange g(a) = k. Si ∇g(a) 6= O y f tiene un extremo en a entonces existe un
número real λ tal que
∇f (a) = λg(a).
Demostración. Sea R(t) una trayectoria en M que pasa por a. Entonces

R(t0 ) = a para algún t = t0 . Además se tendrá que ∇g(a) es tangente a M
en el punto a, en el sentido que
∇g(a) · R′ (t0 ) = 0.
De otro lado si f restringida a M tiene un máximo en a, entonces la función
en una variable f (R(t)) tiene un máximo en t = t0 . Del calculo de funciones
de una variable se tiene que
d
f (R(t0 )) = 0.
dt
De la regla de la cadena,
d
f (R(t)) = ∇f (R(t)) · R′ (t).
dt
Por lo tanto, en t = t0 se tiene que
∇f (a) · R′ (t0 ) = 0;
es decir, ∇f (a) también es perpendicular a M en a. Como el espacio tangen-
te a M en a es una recta, entonces los vectores gradientes ∇f (a) y ∇g(a)
son paralelos. Como ∇g(a) 6= O, entonces ∇f (a) es múltiplo escalar de
∇g(a).

Criterio de la segunda Proposición 3.61. Sean f, g : D ⊆ Rn → R dos funciones suaves dadas
derivada para extremos (con segundas derivadas parciales continuas al menos). Sean M el conjunto
restringidos de nivel de g con valor k y a un punto en D tal que g(a) = k. Supongamos
que ∇g(a) 6= O y
∇f (a) = λ0 g(a)
para algún escalar λ0 . Se define la función auxiliar h = f − λg en n + 1

variables (λ, x) = (λ, x1 , . . . , xn ), y el punto x0 = (λ0 , a) = (λ0 , a1 , . . . , an )
en su dominio. Sea |D2 h(x0 )| el hessiano de h, el cual esta dado como sigue:

0 −gx1 −gx2 · · · −gxn

−gx1 hx1 x1 hx1 x2 · · · hx1 xn

−gx2 hx1 x2 hx2 x2 · · · hx2 xn
.. .. .. ..

..
.
. . . .
−gx hx 1 x n hx n x 2 · · · hx n x n
n
Sean D2 h(x0 )k las submatrices diagonales de D2 h(x0 ) de orden k ≥ 3.

Entonces,
a. Si los subdeterminantes |D2 h(x0 )k | son positivos para todo orden k ≥ 3
entonces f restringida a M tiene un mı́nimo local en a.
b. Si los subdeterminantes alternan los signos de la forma |D2 h(x0 )3 | > 0,
|D2 h(x0 )4 | < 0, |D2 h(x0 )5 | > 0, . . . entonces f restringida a M tiene un
máximo local en a.
c. Sea n = 2. Si |D2 h(x0 )| = 0 entonces el criterio no decide y f restrin-
gida a M puede tener un máximo local o un mı́nimo local en a o ni una
u otra cosa.
Sea n > 2. Si para k ≥ 3 alguno de los subdeterminantes |D2 h(x0 )k | es
diferente de cero y no siguen los patrones anteriores entonces f restrin-
gida a M no tiene un mı́nimo local ni un máximo local en a; tendrá un
punto de silla en a.

Funciones de Varias Variables

Caricato da

Informazioni sul documento

Copyright

Formati disponibili

Condividi questo documento

Condividi o incorpora il documento

Opzioni di condivisione

Hai trovato utile questo documento?

Questo contenuto è inappropriato?

Copyright:

Formati disponibili

Funciones de Varias Variables

Caricato da

Copyright:

Formati disponibili

Julio C. Carrillo E.

Profesor Escuela de Matemáticas

Monday, November 5, 2007 at 8:44 am

Definitivamente, hasta los que enseñamos también

3. Funciones de varias variables 41

iv Julio C. Carrillo E. Para uso exclusivo en el salón de clase – UIS

Para uso exclusivo en el salón de clase – UIS Cálculo en Varias Variables v

3.1. Las funciones de varias variables

También, la imagen y gráfica de f se pueden representar en términos de

Gf = {(x1 , . . . , xn , xn+1 ) ∈ Rn+1 | xn+1 = f (x1 , . . . , xn )

esta definida cuando

x2 − y 2 > 0 ≡ y 2 < x2 ≡ |y| < |x| ≡ −|x| < y < |x|.

Geométricamente el dominio de f esta representado en la siguiente figura y

42 Julio C. Carrillo E. Para uso exclusivo en el salón de clase – UIS

consiste de todos los puntos del plano xy tales que y ≤ x2 .

La imagen consistede todos los reales

Para uso exclusivo en el salón de clase – UIS Cálculo en Varias Variables 43

(g ◦ f )(x) = g(f (x))

para todo x en el dominio de f tal que f (x) esta en la imagen de g.

Cuando esto sucede se dice que la función composición g ◦ f tiene sentido.

44 Julio C. Carrillo E. Para uso exclusivo en el salón de clase – UIS

(h ◦ f )(x) = h(f (x)).

6. Si la función composición f ◦R tiene sentido, entonces define la función

Por lo tanto, h ◦ f es una función de dos variables y f ◦ R es una función de

3.2. Lı́mite y continuidad

Persona que trabaje en el campo de la fı́sica–matemática y sus

La noción de lı́mite esta ı́ntimamente ligada al problema de la aproximación

Para uso exclusivo en el salón de clase – UIS Cálculo en Varias Variables 45

a′′ y b′′ representan posibles causas y efectos no predecibles, respectivamente.

En la practica y en general, se obtienen (en el laboratorio, por ejemplo) y

2. Fase de cuantificación del error: En donde hay aproximaciones, hay

dB (f (x), b) := |f (x) − b|, dA (x, a) := |x − a|.

representaran el error en la aproximación o distancia entre los valores

dB (f (x), b) → 0 cuando dA (x, a) → 0 aun si dA (x, a) > 0.

46 Julio C. Carrillo E. Para uso exclusivo en el salón de clase – UIS

El problema causa–efecto definido mediante f es un continuo o es continuo

lı́m f (x) = f (a).

representa la distancia entre los puntos x y a en Rn y

la distancia entre los números reales f (x) y L. En el siguiente sentido debe

Para uso exclusivo en el salón de clase – UIS Cálculo en Varias Variables 47

Por lo tanto el lı́mite de f en el origen del plano no existe: diferentes va-

en donde x = 0 es una recta horizontal que pasa por el origen y y = 0 es

48 Julio C. Carrillo E. Para uso exclusivo en el salón de clase – UIS

e igual sucede tomando el lı́mite a lo largo de las parabolas y = ax2 y

Para uso exclusivo en el salón de clase – UIS Cálculo en Varias Variables 49

Propiedades del lı́mite Proposición 3.8. Sean f, g : D ⊆ Rn → R funciones de n variables que

f (x) lı́m f (x)

6. Sea R : D′ ⊆ R → Rn una función vectorial tal que la función compuesta

lı́m f (x) = f (a),

En caso contrario, f se dice es discontinua en a.

50 Julio C. Carrillo E. Para uso exclusivo en el salón de clase – UIS

tiene lı́mite cero en el origen del plano y f (0, 0) = 1. Entonces f es discon-

6. Sea R : D′ ⊆ R → Rn una función vectorial tal que la función compuesta

Continuidad global y Definición 3.13. Una función de varias variables f es continua en el un

Para uso exclusivo en el salón de clase – UIS Cálculo en Varias Variables 51

lı́m p(x, y) = p(a, b)

para todo punto (a, b) en R2 .

lı́m (x2 y 3 − x3 y 2 + 3x + 2y).

Solución. Como los polinomio son funciones continuas en R2 , entonces

lı́m (x2 y 3 − x3 y 2 + 3x + 2y) = −8 − 4 + 3 − 4 = −13.

Una función racional f en dos variables es el cociente de dos polinomios, y

f (x, y) = ln(x2 + y 2 − 1).

Solución. La función logaritmo natural es continua para todo número real

Solución. De la propiedad de composición de funciones continua se tiene

La imagen consistede todos los reales