J Paez Calculo III

Calculo diferencial de varias variables
Javier Paez Cardenas

Indice General
Introduccion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . i
1 El conjunto Rn 1
1.1 Para empezar, algunos ejemplos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.2 Estructura algebraica de Rn . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
1.3 Aspectos geometricos de Rn . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
1.4 Otras normas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
1.5 Topologa de Rn . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
1.5.1 Clasificaci
on de puntos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
1.5.2 Conjuntos abiertos y cerrados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
1.5.3 Otra clasificacion de puntos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
1.5.4 Conjuntos conexos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
1.6 Otros sistemas coordenados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
1.6.1 Coordenadas polares . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
1.6.2 Coordenadas cilndricas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
1.6.3 Coordenadas esfericas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43
1.7 Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
2 Funciones de Rn en Rm 53

2.1 Algebra y geometra de las funciones de Rn en Rm . . . . . . . . . . . . . . . . . . . . . . . . 53
2.2 Lmite y continuidad de funciones de Rn en Rm . . . . . . . . . . . . . . . . . . . . . . . . . . 62
2.2.1 Sucesiones en Rn . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63
2.2.2 Lmite . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68
2.2.3 Continuidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75
2.2.4 Teoremas fuertes de continuidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80
2.3 Continuidad uniforme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82
2.4 Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88
3 La derivada de funciones de R en Rn 95
3.1 Geometra y movimiento . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95
3.2 La derivada . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99
3.3 Propiedades de la derivada . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 104
3.4 Derivada y geometra . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108
3.5 Derivada y movimiento . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 119
3.6 Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 123
4 La derivada de funciones de Rn en R 129

4.1 Un interludio de Algebra Lineal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 129
4.2 La derivada direccional . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 135
4.2.1 Derivadas parciales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 142
4.3 La derivada global . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 144
4.3.1 El gradiente . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 152
4.3.2 Otras propiedades de la derivada . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 156
4.3.3 La derivada en otras coordenadas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 174

Indice General
Indice General
4.4 Derivadas direccionales de orden superior . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 179

4.5 Aproximacion polinomial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 185
4.6 Maximos y mnimos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 192
4.6.1 Breve comentario sobre formas cuadraticas . . . . . . . . . . . . . . . . . . . . . . . . 205
4.6.2 M aximos y mnimos sobre restricciones . . . . . . . . . . . . . . . . . . . . . . . . . . 206
4.7 Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 215
5 La derivada de funciones de Rn en Rm 223

5.1 La derivada . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 223
5.1.1 Elementos b asicos acerca de superficies . . . . . . . . . . . . . . . . . . . . . . . . . . . 224
5.2 Propiedades de la derivada . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 228
5.2.1 Breve comentario sobre funciones coordenadas . . . . . . . . . . . . . . . . . . . . . . 232
5.3 La regla de la cadena . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 233
5.3.1 Cambio de coordenadas y regla de la cadena . . . . . . . . . . . . . . . . . . . . . . . 235
5.4 El teorema de la funci
on implcita . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 238
5.4.1 El caso lineal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 238
5.4.2 El caso no lineal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 241
on inversa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 250
5.6 Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 265
J. P
aez
Introducci
on
El tema principal del presente texto es el referente al concepto de derivada para funciones de varias variables,
tema que constituye el n ucleo central del curso de Calculo Diferencial e Integral III que se imparte en la
Facultad de Ciencias de la Universidad Nacional Autonoma de Mexico.
En este trabajo partimos del supuesto de que el conjunto de conceptos y herramientas de Calculo Diferen-
cial e Integral que son del dominio del lector, es aquel al que coloquialmente se le conoce como C alculo de una
variable. Y como el lector seguramente tambien lo sabe, este nombre coloquial se debe a que los problemas
y situaciones que dan origen a este conjunto de conocimientos, son aquellos en los que una cantidad (o
variable) se puede poner en terminos de otra cantidad, en donde cada una de estas cantidades tiene la
particularidad de poderse medir, describir o representar con un solo n umero real. Esto mismo, dicho
de una manera un poco mas tecnica, significa que el objeto matematico sobre el cual se contruyen estos
conceptos, es el de funcion de una variable real con valores reales o simplemente funci on de los reales en los
reales.
Una vez dicho lo anterior, es entonces un poco mas sencillo establecer cual es el objetivo fundamental
de este texto: desarrollar el concepto de derivada de ese tipo de funciones en las que una cantidad (o
variable) se puede poner en terminos de otra cantidad, con la particularidad de que alguna de estas
cantidades (o ambas!) no se puede medir, describir o representar con un solo n umero real. Este
tipo de funciones son conocidas en general como funciones de varias variables, y el conjunto de conceptos y
resultados que desarrollaremos alrededor de estas es parte de lo que coloquialmente se conoce como C alculo
de varias variables.
Siguiendo este orden de ideas, los conceptos y resultados que se desarrollan en este texto se motivan
principalmente a partir de los correspondientes conceptos y resultados para el caso de funciones de los reales
en los reales, y en virtud de esta caracterstica, a lo largo de todo el texto se intenta usar un nivel adecuado
de rigor y formalismo matematico. Por lo anterior, en este trabajo se parte del supuesto de que el lector
conoce todos los temas b asicos de Calculo de una variable, de Geometra Analtica (plana y del espacio)

y de Algebra Superior. Por otra parte, dado que el primer curso de Calculo de varias variables se suele

tomar paralelamente con el primer curso de Algebra Lineal, en este trabajo se intenta hacer uso de algunos
conceptos de esta u ltima materia una vez que el lector ya los haya estudiado.
Este trabajo est a organizado en cinco captulos; a continuacion se da una somera y rapida descripcion
del contenido de cada uno de ellos.
De la misma forma que para realizar un estudio mas profundo del Calculo de una variable es necesario
empezar por estudiar con mayor detenimiento al conjunto de los n umeros reales, en el caso del Calculo
de varias variables es necesario hacer el mismo tipo de estudio del conjunto Rn . El primer captulo lo
iniciamos con una serie de ejemplos con los cuales se pretende mostrar que este conjunto resulta ser el
mas idoneo para representar a las variables (independientes y dependientes) de las funciones para las
cuales se definir
an la mayora de los conceptos de este texto. Inmediatamente despues nos damos a la tarea
de explorar las diferentes estructuras matematicas que este conjunto posee: su estructura algebraica, su
estructura geometrica y su estructura topologica. Concluimos este captulo con un rapido repaso sobre los
diferentes sistemas coordenados que se pueden establecer en el plano o en el espacio.
Una vez que en el captulo 1 se establecio que las funciones de Rn en Rm seran el principal objeto
matematico con el cual podremos describir la mayora de los problemas que dan lugar al estudio del Calculo
de varias variables, en el captulo 2 comenzamos por hacer un rapido estudio de sus aspectos algebraicos y
geometricos. Posteriormente nos damos a la tarea de introducir los conceptos de lmite y continuidad de
este tipo de funciones, para lo cual previamente desarrollamos la herramienta de las sucesiones en Rn .
i

Indice General
Indice General
A continuacion damos paso a los muy importantes teoremas fuertes de continuidad y concluimos este
captulo estudiando el concepto de continuidad uniforme.
El concepto de derivada para las funciones de Rn en Rm es el tema central de este trabajo, y a este
concepto dedicamos los restantes tres captulos. En el captulo 3 empezamos estudiando a las funciones de
R en Rn y su particular importancia en la descripcion de objetos geometricos, y en la descripcion del
movimiento de un objeto en un plano o en el espacio. Basados en estas caractersticas, que entre otras
ventajas permiten establecer cierta similitud con el caso de funciones de R en R, introducimos la derivada
para este tipo de funciones y estudiamos su uso e interpretaci on justo en estos dos contextos: el geometrico
y el cinem atico.
La derivada para funciones de Rn en R es tal vez el primer concepto de este texto cuya definicion resultara
realmente novedosa para el lector. Esta caracterstica se ve reflejada sobre todo en la necesidad de revisar
previamente algunos conceptos importantes del Algebra Lineal (bases ortonormales y funciones lineales), y
que seran necesarios para poder dar dicha definicion. El captulo 4 inicia con una revision del concepto de
base ortonormal para despues introducir la derivada direccional, la que aun guarda una estrecha relacion
con la derivada de funciones de R en R. Despues de una breve revision de la derivada de una funci on
de R en R en terminos de funciones lineales, se introduce el concepto de derivada (global) de una funci on
de Rn en R y se prueban algunos resultados b asicos. Aun y cuando la mayora de los conceptos que se
definen en este captulo se tratan de introducir de manera independiente de los sistemas coordenados mas
comunes, en este captulo se incluye una secci on en la que se deduce la forma especfica que toman conceptos
tales como el de gradiente, cuando las funciones con las que se esta trabajando se expresan en sistemas
coordenados diferentes a los euclideanos (en los casos de R2 y R3 ). Como sucede en el caso de las funciones
de R en R, muchas de las aplicaciones pr acticas del concepto de derivada de funciones de Rn en R est an
orientadas a la determinaci on de los valores maximos y mnimos de este tipo de funciones. Por esta raz on, se
introducen las derivadas direccionales (y parciales) de orden superior y los polinomios de Taylor, los cuales
son herramientas importantes para abordar estos problemas. Y justo concluimos este captulo con un analisis
general del problema de maximos y mnimos, lo que nos conduce a un breve estudio de las formas cuadraticas
(a fin de contar con una herramienta que nos permita clasificar los puntos crticos de una funci on), y a la
formulaci on del Teorema de los multiplicadores de Lagrange, una de la herramientas mas importantes que
hay para la determinaci on de maximos y mnimos de funciones sobre restricciones.
El captulo 5, con el cual concluye este trabajo, aborda el tema de la derivada de funciones de Rn en
Rm . Como es de esperarse, la definicion que se da en este captulo generaliza a las definiciones dadas en los
captulos 3 (para el caso n = 1) y 4 (para el caso m = 1) y una vez hecho esto, se prueban resultados b asicos
relacionados con este concepto. Los teoremas mas importantes de este captulo son: la Regla de la Cadena
(en su version mas general), el Teorema de la Funci on Implcita (a partir del cual se prueba el Teorema de los
multuplicadores de Lagrange), y el Teorema de la Funci on Inversa, (a partir del cual se prueba el Teorema
de la Funci on Implcita) y para cuya prueba es necesario desarrolar una serie de resultados.
Al final de cada uno de estos captulos, se incluye una lista de problemas con los cuales se pretende que
el lector refuerce, ponga a prueba, y en algunos casos amplie, los conceptos estudiados.
J. P
aez ii
Captulo 1
El conjunto Rn
As como en el caso del c

alculo diferencial de una variable empezamos por estudiar al conjunto de los n
umeros
reales R, en este captulo empezaremos por analizar mas a fondo al conjunto Rn , en virtud de que dicho
conjunto sera tanto el dominio (y en algunos casos el contradominio) de casi todas las funciones con las que
trabajaremos en este texto. El por que este tipo de conjuntos (para diferentes valores de n) es la forma mas
adecuada de representar al dominio y/o contradominio de la mayora de las funciones que se encuentran en
la base del c
alculo de varias variables, es lo que intentaremos mostrar en la primera secci
on de este captulo.
1.1 Para empezar, algunos ejemplos

Como mencionamos en la introduccion, una motivaci on para el desarrollo del Calculo de varias variables
se puede encontrar en el planteamiento de ciertas situaciones en las que una cantidad (o variable,
en general) se puede poner en terminos de otra variable, con la particularidad de que alguna de estas
variables (o ambas!) no se puede medir, describir o representar con un s olo n
umero real. Lo que
haremos en esta secci
on, sera presentar algunos ejemplos con estas caractersticas.
Ejemplo 1.1 Supongamos que tenemos la suerte de contar con un dispositivo que nos permite saber, en un
cierto instante, la temperatura en cada posici on de la habitacion en la que nos encontramos. Si queremos
pensar esta situacion en terminos mas tecnicos, lo que estamos planteando es que este dispositivo nos permite
establecer una funcion entre las distintas posiciones de la habitaci
on y la temperarura en cada una de ellas.
De esta forma, queda claro que una de nuestras variables (la independiente, como suele decirse) es
la posici
on y la otra (la dependiente) es la temperatura.
Como seguramente el lector ya lo sabe, las diferentes posiciones en una habitaci on no son suceptibles de
describirse con un s olo numero real y con toda certeza tambien sabe que para representar cada posici on
nos haran falta tres numeros reales (e incluso tambien estara conciente de que para una misma posici on
dentro de la habitacion, pueden haber diferentes ternas de n umeros que la representan, dependiendo del
sistema de referencia que elijamos!).
Finalmente, la variable dependiente (en esta caso la temperatura) s se puede describir con un s olo
numero real, por lo que la situacion que planteamos nos conduce a obtener una funci on que depende de tres
numeros reales (los que describen o representan una posici on) y que asigna otro n
umero real (el que describe
o mide la temperatura).
El ejemplo anterior permite una variante que nos lleva a obtener una funci
on con una variable inde-
pendiente diferente. Veamos de que forma.
Ejemplo 1.2 En el ejemplo anterior mencionamos que nuestro dispositivo nos permita conocer la tempera-
tura en cada posicion de una habitaci on, en un cierto instante, situacion que de inmediato nos hace
pensar en una nueva variable: el instante en que estamos midiendo la temperatura.
Como el lector estar
a de acuerdo, esta nueva variable se puede medir con un s
olo n
umero real (y tambien
estar
a de acuerdo que a un mismo instante lo podr an describir diferentes n
umeros reales, dependiendo
en donde colocamos el instante cero!).
1
Captulo 1. El conjunto Rn 1.1. Para empezar, algunos ejemplos
De esta forma, considerando esa nueva variable, la funci on que obtenemos ser a una funcion cuya
variable independiente estar
a dada por una posici on y un instante, la cual se puede describir con cua-
tro n
umeros reales (tres, que sirven para describir o representar la posici
on, y el cuarto para describir el
instante) y que asigna otro n umero real (el que describe o mide la temperatura, que es la variable
dependiente).
Ejemplo 1.3 Supongamos ahora que nos encontramos a la orilla de un ro y que dentro de este observamos
una peque na mota de polvo que se mueve como resultado de la corriente del mismo. Esta sencilla situaci on
nos lleva de manera natural a pensar en una funci on: aquella que, para cada cada instante, nos da la posici
on
de la mota de polvo.
Como seguramente el lector ya dedujo, en este caso las dos variables importantes son: por un lado el
tiempo (la variable independiente) que, como en el ejemplo anterior, podemos describir con un n umero
real, y la posici
on (la variable dependiente), que como vimos en los ejemplos anteriores, se necesitan tres
numeros reales (o dos, si el movimiento se realizara sobre un plano) para representarla.
As pues, este ejemplo nos lleva a considerar una funci on que tiene como variable independiente al
tiempo (que se puede medir con un s olo n
umero real), y como variable dependiente a una posici on, para
la cual necesitamos tres cantidades (o n umeros) para describirla.
Ejemplo 1.4 Si todava seguimos parados a la orilla del mismo ro, podemos analizar la siguiente situaci on:
si imaginamos al torrente del rio como un conjunto de moleculas de agua que se est an moviendo, pensemos
en la funcion que, en un instante dado, nos asigna la velocidad con la que va viajando cada una de las
moleculas que forman el torrente. De esta forma, nuestra funci on tendr a que ser tal que, a cada posicion
dentro del ro, le asigna una velocidad.
A estas alturas nos queda claro que cada posici on dentro del rio (la variable independiente en este
caso) la podemos describir con una terna de n umeros reales, pero la velocidad (la variable dependiente)
tal vez requiera un an alisis aparte.
Cuando un objeto se mueve en lnea recta es f acil covencerse que su velocidad en un instante se puede
medir por un s olo n
umero real, pero este no es el caso si el movimiento se da en un plano o en el espacio.
Intuitivamente, si un objeto se mueve en un plano o en el espacio, su velocidad en un instante dado se
puede representar por medio de una flecha cuyo punto inicial (u origen) se encuentra en la posici on en
la que se encuentra (en ese instante) el objeto en cuesti on; la direcci
on de la flecha indicara la direcci
on
del movimiento, y su magnitud (o longitud) indicar a la rapidez con la que lo esta haciendo.
Si ahora recordamos de nuestros cursos de Geometra Analtica que las flechas que parten de un punto
fijo se pueden representar (o describir) por una pareja (si estamos en el plano) o una terna (si estamos
en el espacio) de n umeros reales, tendremos que la variable dependiente de la funci on que describimos
anteriormente (la velocidad de cada molecula, en un instante dado) se podr a describir por medio de una
terna de numeros reales.
De esta forma, la funci on que obtenemos en este ejemplo asignar a a una terna de n umeros reales (la que
describe la posicion de una molecula en un cierto instante) otra terna de n umeros reales (la que describe la
velocidad de esa molecula en ese instante).
Como en el caso de ejemplo 1.1, el ejemplo anterior permite una variante que nos conduce a obtener una
funci
on con una variable independiente diferente.
Ejemplo 1.5 Si en el ejemplo anterior, adem as de considerar la posici

on de cada molecula del agua del ro
en un instante dado, tambien consideramos diferentes instantes, entonces obtenemos una nueva funci on cuya
variable independiente estar a dada por una posici
on y un instante, la cual, como en el caso del ejemplo 1.2
se puede describir con cuatro n umeros reales, y nos asignar
a una velocidad (su variable dependiente)
que se podra describir por tres n
umeros reales.
En el u
ltimo de nuestros ejemplos, mostraremos que las funciones (y sus variables) con las que nos
podemos topar, pueden ser de muy diversa ndole, y que estas no siempre est
an relacionadas con posiciones,
velocidades, tiempos o temperaturas.
J. P
aez 2
1.1. Para empezar, algunos ejemplos Captulo 1. El conjunto Rn
Ejemplo 1.6 Supongamos que en un laboratorio de investigaci on se encuentran realizando un experimento

en el cual, para un valor de una cierta variable x, se obtiene un valor de otra variable y (vamos a suponer
que los posibles valores de ambas variables se expresan con n umeros reales).
El experimento se realiza para k valores diferentes de la variable x, x1 , . . . , xk , ordernados de menor a
mayor (es decir: x1 < < xk ) y se obtienen k valores de la variable y, y1 , . . . , yk . De esta forma, se cuenta
con k parejas de n umeros reales (x1 , y1 ), . . . , (xk , yk ) las cuales se grafican como se muestra en la figura 1.1,
(a). Si el gr afico que se obtiene (y el fen omeno con el que se est a experimentando) sugieren que estos
datos se deben parecer a (o encajar en) una recta, un problema importante es encontrar la recta que
mejor se ajuste a estos datos.
En este momento no vamos a ver que criterios son mejores para determinar si una recta se ajusta bien
a un conjunto de datos, y s olo destacaremos que este problema nos conduce a considerar una funci on cuya
variable independiente es una recta y cuya variable dependiente ser a (como veremos m as adelante en el
captulo 4) un n umero real.
Aun y cuando a primera vista parezca un poco ex otico eso de considerar una funci on cuya variable
independiente sea una recta, no lo parecer a tanto si recordamos que toda recta (no vertical) en un plano tiene
una ecuaci on de la forma y = mx + b, de tal manera que esta queda totalmente determinada si conocemos m
(su pendiente) y b (su ordenada al origen); es decir, toda recta (no vertical) en el plano se puede representar
por medio de la pareja de n umeros reales (m, b).
Tomando en consideraci on lo anterior, podemos concluir que la funci on a la que nos condujo este problema
terminar a siendo una que asociar a a un par de n umeros reales (m, b) (que en este caso representan a una
recta, la variable independiente de la funci on) un n umero real.
Pero el ejemplo no termina aqu. C omo sera la funci on que tendramos que considerar si lo que tenemos
es que nuestro conjunto de datos se parece a (o encaja en) una par abola? (ver figura 1.1, (b)). Dado
que las parabolas (con eje vertical) tienen en general una ecuaci on de la forma y = a0 + a1 x + a2 x2 (es decir,
un polinomio de grado a lo m as 2, que est an determinados por sus coeficientes a0 , a1 y a2 ), la funci on a
considerar sera entonces una que asociara a una terna de n umeros reales (a0 , a1 , a2 ) (la cual representa a
una par abola si a2 6= 0, la variable independiente de nuestra funci on en este caso), un n umero real.
Como el lector seguramente ya lo est a imaginando, este problema lo podemos llevar mas lejos y considerar
funciones que asocien a: tetradas (si nuestros datos se parecen a (o encajan en) la gr afica de un
polinomio de grado a lo m as 3), o a quntuplas (si nuestros datos se parecen a (o encajan en) la
gr
afica de un polinomio de grado a lo m as 4), o en general, a n-adas (si nuestros datos se parecen a (o
encajan en) la gr afica de un polinomio de grado a lo m as n 1), un numero real.
Dicho de otra forma, nuestra funci on podra ser tal que su variable independiente fuera un polinomio
de grado a lo mas n 1 (los cuales se puede representar por medio de n-adas de n umeros reales).
b
(x7 , y7 ) (x7 , y7 )
b
b
(x5 , y5 ) (x5 , y5 ) (x6 , y6 )

b b b
(x3 , y3 ) (x6 , y6 )
b b (x3 , y3 ) b
b
(x4 , y4 ) (x4 , y4 )
(x1 , y1 ) (x1 , y1 )
b b b b
(x2 , y2 ) (x2 , y2 )
(a) (b)
Figura 1.1: Los datos de un experimento, representados por cada pareja (xi , yi ), sugieren que estos encajan
en una recta (a) o en una parabola (b).
3 J. P
aez
Captulo 1. El conjunto Rn 1.1. Para empezar, algunos ejemplos
Como resultado de esta larga lista de ejemplos, y de acuerdo con la intencion original de presentarlos,
resumiremos algunas de las caractersticas que tienen las variables (y/o valores) de las funciones que
describimos en ellos:
1. las variables (y/o valores) de estas funciones pueden ser de muy diversos tipos,
2. estas variables (y/o valores) siempre son suceptibles de representarse (describirse o medirse)
por una cierta cantidad de n umeros reales (dos, tres, cuatro o mas!),
3. esta representacion no es u
nica y en general depende del sistema de referencia que se elija.
Las caractersticas anteriores son muy importantes y algunas de ellas explican algunos de los terminos
que se suelen usar cuando nos referimos a la materia que nos ocupa, como es el caso del termino: C alculo
de varias variables. Este termino tiene su origen en la segunda caracterstica que mencionamos, pues las
diferentes cantidades que se necesitan para representar a la variable independiente de una funci on,
tambien se consideran variables, de ah que las funciones con las que se trabajara dependan de varias
variables.
Otra importante observaci on que se debe hacer a partir de la segunda caracterstica (sin duda la mas
importante), es que la representacion de las variables (y/o valores) de estas funciones por medio de
parejas, ternas, tetradas, o en general, n-adas de n umeros reales, es un proceso que se suele realizar en
el contexto de un concepto mas amplio, el de espacio vectorial, y del cual el conjunto de posiciones (o
flechas que parten de un mismo punto) de un plano (o las correspondientes en el espacio), o el conjunto de
polinomios de grado menor o igual a n 1 (que mencionamos en el ejemplo 1.6), son ejemplos particulares
de este tipo de espacios.
Aunque el lector posiblemente todava no este muy familiarizado con este concepto, pronto aprendera (en

su curso de Algebra Lineal I) que un espacio vectorial es un conjunto V que est a dotado de dos operaciones:
una suma y una multiplicaci on por escalares (que, cuando dichos escalares son n umeros reales, decimos
que V es un espacio vectorial sobre los n umeros reales), operaciones a las cuales se le suelen pedir ciertas
propiedades.
Tambien pronto sabra que, si = {v1 , . . . , vn } es un subconjunto de V que tiene la propiedad de que
cualquier otro elemento v V se puede escribir de manera u nica como combinaci on lineal de los elementos
de (es decir, que existen 1 , . . . , n R, unicos, tales que v = 1 v1 + + n vn ) entonces se dice que
es una base para V .
Este concepto de base es muy importante pues apoyandose en el es que se establece la representacion de
cada elemento v V por medio de una n-ada de n umeros reales (1 , . . . , n ), y hacer esta representacion
por medio de diferentes bases, es lo que est a intimamente relacionado con los diferentes sistemas de refe-
rencia que mencionamos en el inciso 3. Cuando V tiene una base de este tipo decimos que V es un espacio
vectorial (sobre los numeros reales) de dimensi on finita, especficamente de dimensi on n.
De esta ultima observacion, se desprende que las variables (independientes o dependientes) de las
funciones con las que trabajaremos en este texto, se pueden ver como elementos de un cierto espacio vectorial
(lo que por cierto tambien explica por que a todo este conjunto de conceptos y resultados relacionados con
estas funciones, tambien se les conoce con el nombre de: C alculo vectorial ).
Por lo anterior, las funciones con las que vamos a trabajar deberan de estar consideradas, en general,
como funciones definidas sobre un subconjunto de un espacio vectorial V y con contradominio sobre otro
espacio vectorial W (ambos sobre los n umeros reales y de dimensi on finita).
Sin embargo, dado que cualquier espacio vectorial de este tipo se puede representar por medio del
conjunto de n-adas de n umeros reales (aunque esta representacion no sea u nica y dependa de la base (o
sistemas de referencia) que se elija, lo que siempre habr a que recordar), a lo largo de este trabajo vamos
a suponer que nuestras funciones estar an definidas sobre alg un subconjunto de estas n-adas, y tomaran
sus valores (en general) sobre alg un conjunto de m-adas (aunque se oiga un poco feo!).
A pesar de la observacion anterior, en algunas ocasiones y para definir ciertos conceptos, no sera necesario
hacer referencia a la representacion por medio de n-adas de los elementos de un cierto espacio vectorial.
En estos casos usaremos letras del tipo x y y para denotar a estos elementos y escribiremos simplemente (no
sin cometer cierto abuso de notaci Rn o y Rn .
on) x
Y justo por lo dicho en los p arrafos anteriores, lo siguiente que haremos sera estudiar de manera mas
detallada al conjunto Rn .
J. P
aez 4
1.2. Estructura algebraica de Rn Captulo 1. El conjunto Rn
1.2 Estructura algebraica de Rn

Pensar al conjunto Rn como una forma de representar a un espacio vectorial (sobre los reales y de dimensi on
n), tiene la ventaja de que la estructura algebraica de este u ltimo se puede exportar o trasladar a Rn .
Justo esto es lo que nos proponemos hacer en esta secci on. Antes de hacerlo, recordemos que el conjunto
Rn esta formado por las n-adas ordenadas (x1 , . . . , xn ) en donde cada xi (a quien llamaremos la i-esima
coordenada de (x1 , . . . , xn )) es un n
umero real, es decir
Rn := {(x1 , . . . , xn ) | xi R, i = 1, . . . , n}
y que tambien se suele decir que este conjunto es n veces el producto cruz (de conjuntos) de R consigo mismo.
A fin de motivar las operaciones que vamos a definir en Rn , pensemos en el conjunto de todas las flechas
del plano que comparten un punto inicial fijo, al que denotaremos por 0 y que llamaremos origen. Es un
hecho conocido que en este conjunto podemos definir (geometricamente y sin necesidad de recurrir a su re-
presentacion por medio de parejas ordenadas) una operaci on de suma de flechas, y una de multiplicacion
de un escalar real por una flecha, lo que permite comprobar que dicho conjunto se puede ver como un
espacio vectorial.
Para definir la suma de las flechas (o vectores), utilizamos la llamada ley del paralelogramo que consiste
en tomar el vector y y trasladar su punto inicial al punto final del vector x , de tal forma que el vector
que parte del origen y termina en el punto final del vector y (trasladado), sera la flecha a la que llamaremos
x
+ y (ver figura 1.2, (a)).
Para la definicion del producto de un escalar R por una flecha x , que denotaremos por x, tomamos
cualquier recta real que pase por el origen 0 y que no contenga al vector x , y realizamos la construcci
on
de triangulos semejantes que se describe en la figura 1.2, (b))
x
+ y x
1
b

y 0
b

0
x
(a) (b)
Figura 1.2: La suma (a) y el producto por un escalar (b) de vectores en R2
Lo importante de haber hecho la definicion geometrica de estas operaciones es que, si ahora establecemos
un sistema de referencia que nos permita tener una representacion de estas flechas en terminos de parejas
de numeros reales, obtenemos una forma de sumar y multiplicar por un escalar dichas parejas (suma y
multiplicaci
on por un escalar de parejas con las que seguramente el lector coincidira en que es la forma mas
natural de definirlas).
Para obtener una base (o un sistema de referencia, que es como les vamos a llamar de aqu en adelante)
que nos permita representar a cualquier flecha por medio de una pareja de n umeros reales, es suficiente con
elegir dos de estas flechas (que denotaremos por v1 y v2 ) y que simplemente no se encuentren sobre la misma
recta (sin importar que el angulo que formen no sea recto, y que sean de diferente longitud) (ver figura 1.3).
Si ahora las parejas (x1 , x2 ) y (y1 , y2 ) representan, respectivamente, a la flecha x
y a la flecha y en el
sistema de referencia dado, lo que significa que
x
= x1 v1 + x2 v2 y y = y1 v1 + y2 v2
5 J. P
aez
Captulo 1. El conjunto Rn 1.2. Estructura algebraica de Rn
x
x2 v2
b
v2
b
b x1 v1
b
v1

0
Figura 1.3: Significado geometrico del hecho de que la pareja (x1 , x2 ) represente a la flecha (o vector) x
.
y que simplemente expresaremos escribiendo que x = (x1 , x2 ) y y = (y1 , y2 ), uno puede comprobar (geometri-
camente) que las flechas x + y y
x estar
an representadas, respectivamente, por las parejas (x1 + y1 , x2 + y2 )
y (x1 , x2 ), es decir que
x + y = (x1 + y1 , x2 + y2 ) y
x = (x1 , x2 )
Este procedimiento, que consiste en definir ciertos conceptos (en este caso la suma y producto por un
escalar en el conjunto de las flechas) partiendo de lo geometrico para despues determinar c
omo se expresan
dichos conceptos en terminos de la representacion por n-adas (en este caso parejas), es un procedimiento al
que recurriremos con mucha frecuencia para dotar al conjunto Rn de varias de sus estrucuturas, tanto
algebraicas como geometricas.
De hecho, con base en lo anterior definimos en el conjunto Rn un par de operaciones, una suma y un
producto por escalares (reales), de la siguiente forma:
(x1 , . . . , xn ) + (y1 , . . . , yn ) := (x1 + y1 , . . . , xn + yn )
y
(x1 , . . . , xn ) := (x1 , . . . , xn )
para R.
Es muy facil probar que todas las propiedades que tiene la suma de n
umeros reales, se heredan a esta
suma definida en Rn ; en particular, a la n-ada cuyas coordenadas son todas cero lo llamaremos el origen y
la denotaremos por 0, es decir
0 := (0, . . . , 0)
del mismo modo que si x = (x1 , . . . , xn ), denotaremos por

x a la n-ada (x1 , . . . , xn ), es decir

x := (x1 , . . . , xn ) = (1)(x1 , . . . , xn )
lo que a su vez aprovecharemos para definir la resta de elementos en Rn (la cual, como en el caso de R,
, y Rn definimos
no es mas que una suma encubierta), de la siguiente manera: si x
y := x + (
x y)
y coincide con ser la flecha

y que, si pensamos a x y y como flechas en el plano o en el espacio, la flecha x
que se obtiene uniendo el punto final de y con el punto inicial de x , trasladada al origen, como se muestra
en la figura 1.4 para el caso del plano.
on, simplemente resaltaremos el hecho de que en Rn existen dos propiedades
Para concluir esta breve secci
distributivas: el producto por un escalar distribuye a la suma de elementos en Rn , y el producto de un
elemento de Rn distribuye a la suma de escalares, es decir, si x, y Rn y , R, entonces
(
x + y) =
x +
y y ( + ) x =
x + x

J. P
aez 6
1.3. Aspectos geometricos de Rn Captulo 1. El conjunto Rn
x
b
x y
b
b
y
Figura 1.4: Construccion geometrica del vector x
1.3 etricos de Rn
Aspectos geom
Como vimos en la secci on anterior, para establecer una correspondencia entre los puntos o flechas del plano
con las parejas ordenadas de n umeros reales, no es necesario elegir un sistema de referencia en el que las
flechas que lo formen tengan que ser perpendiculares ni de la misma longitud. Tomarlas de esta forma, en
cuyo caso diremos que nuestro sistema de referencia es un sistema coordenado cartesiano 1 , es una libertad
adicional que nos podemos dar, y que nos permitira trasladar al conjunto Rn toda la estructura geometrica
que este concepto de perpendicularidad conlleva.
De esta forma, cuando a la pareja (x1 , x2 ) o a la terna (x1 , x2 , x3 ) de n
umeros reales la usamos para
designar a una flecha (o vector) de un cierto sistema coordenado cartesiano, la longitud (o magnitud) de esta
flecha es una cantidad que podemos escribir en terminos de las coordenadas correspondientes. La expresion
algebraica que representa a esta cantidad se deduce facilmente usando el Teorema de Pit agoras (como se
muestra en la figura 1.5), y est
a dada por q
x21 + x22
para el caso del plano (R2 ), y por

q
x21 + x22 + x23
para el caso del espacio (R3 ). Es importante resaltar que si la pareja o la terna designa a un punto (en lugar
de una flecha), estas expresiones lo que representan es la distancia que hay entre dicho punto y el origen.
x
2
x2
+ x2
p x21
x1
p
Figura 1.5: La cantidad x21 + x22 representa la magnitud del vector x
= (x1 , x2 ).
Tomando como base las expresiones anteriores, a cada x = (x1 , . . . , xn ) Rn (para cualquier n N) le
asociaremos un n
umero real positivo, al que llamaremos la norma (euclideana) de x , y que denotaremos por
k
xk. Este nuevo concepto est
a definido de la siguiente manera.
1 Nombrado as en recuerdo de Ren e Descartes (La Haye, Turena francesa, 31 de marzo de 1596 - Estocolmo, Suecia, 11 de
febrero de 1650), tambi en llamado Renatus Cartesius, quien fue un fil osofo, matematico y fsico franc
es, considerado como el
padre de la geometra analtica y de la filosofa moderna, as como uno de los nombres mas destacados de la revoluci on cientfica.
(fuente: Wikipedia).
7 J. P
aez
Captulo 1. El conjunto Rn 1.3. Aspectos geometricos de Rn
Definici = (x1 , . . . , xn ) Rn definimos la norma (euclideana) de x

on 1.7 Para cada x , que denotamos por
k
xk, como q
k
xk := x21 + x22 + + x2n (1.1)
Aun y cuando n sea mayor que 3, y de acuerdo con la interpretaci on como una distancia que se le da
a dicha expresion para el caso en que n = 2 o n = 3, en general diremos que el n umero k xk representa la
distancia entre el punto determinado por x y el origen 0.
A fin de explorar las propiedades del concepto que acabamos de definir, vale la pena hacer notar que si
en esta definicion tomamos n = 1 (en cuyo caso nuestro conjunto coincide con ser R), entonces la norma no
es otra cosa mas que el conocidsimo concepto de valor absoluto de los n
umeros reales, lo que por cierto, nos
permite pensar al concepto de norma como una generalizaci on a Rn del correspondiente concepto de valor
absoluto de los n umeros reales.
Es precisamente a partir de este hecho, y recordando las propiedades mas elementales del valor absoluto,
que podemos establecer la siguiente
Proposici
on 1.8 La norma (euclideana) satisface las siguientes propiedades:
1. k Rn y k
xk 0 para toda x = 0
xk = 0 si y solo si x
2. k xk para toda x Rn y para toda R
xk = || k
3. k
x + yk k y k para cualesquiera x, y Rn
xk + k (desigualdad del triangulo)
Demostraci on. Las afirmaciones de los incisos 1 y 2 son inmediatas, y la prueba del inciso 3 requiere un
nuevo concepto que desarrollaremos a continuacion.
Para poder probar el inciso tres de la proposicion 1.8 introduciremos un nuevo concepto el cual vamos a
motivar a partir de un problema geometrico muy sencillo: dados dos vectores x , y R2 , distintos de 0, cu
al
es el escalar R que hace que los vectores x y y y sean perpendiculares? (ver figura 1.6).
x

x y
y

y
Figura 1.6: Cual es el valor de que hace que los vectores x

y y y sean perpendiculares?
Supongamos que los vectores x y y tienen coordenadas (x1 , x2 ) y (y1 , y2 ), respectivamente. Dado que

deseamos que el triangulo formado por los vectores x, x y y
y sea un triangulo rectangulo, por el teorema
de Pit
agoras debemos tener que
ky k2 + k
x y k2 = k
xk2 (1.2)
lo cual, escrito en terminos de las coordenadas de los vectores, se traduce en
p 2 p 2 q 2
(y1 )2 + (y2 )2 + (x1 y1 )2 + (x2 y2 )2 = x21 + x22
Cancelando los cuadrados con las races cuadradas, desarrollando los cuadrados que se encuentran dentro
de la segunda raz cuadrada y cancelando y factorizando los terminos iguales, llegamos a que debe de
satisfacer la ecuaci
on
22 y12 + y22 2 (x1 y1 + x2 y2 ) = 0
J. P
aez 8
la cual tiene las soluciones = 0 y

x1 y1 + x2 y2 x1 y1 + x2 y2
= 2 2 = 2 (1.3)
y1 + y2 kyk
Es importante observar que la solucion = 0 no tiene mucho que ver con el problema planteado puesto
que, independientemente de la posicion de x y y, tomando este valor de siempre se satisface la ecuaci on
1.2. Por esta raz on, la segunda solucion de la ecuacion es la importante para el problema que planteamos.
La expresion x1 y1 + x2 y2 (que aparece en el numerador de la expresion del n umero que calculamos
renglones arriba) resultara ser muy relevante a la hora de precisar un concepto que hasta ahora solo podemos
manejar de una forma muy intuitiva: el angulo formado por los vectores x y y.
La sospecha de que existe una relaci on entre esta expresion y el concepto de angulo, la podemos reforzar si
en el problema que planteamos anteriormente observamos que, si los vectores x y y ya fueran perpendiculares,
la u
nica solucion sera = 0 de donde se concluye que la expresion x1 y1 +x2 y2 tendra que ser 0. Esto se puede
confirmar con algunos ejemplos, como sera el caso de los vectores (1, 0) y (0, 1), que de acuerdo con el sistema
coordenado con el que estamos trabajando, este se tomo de tal forma que dichos vectores son perpendiculares
(seguramente el lector podra verificar en muchos mas casos especficos que la perpendicularidad de dos
vectores se corresponde con el hecho de que la expresion x1 y1 + x2 y2 vale 0).
Tambien es facil verificar que, dado un vector x = (x1 , x2 ) 6= 0 entonces el vector y = (x2 , x1 ) 6= 0 es
perpendicular a x puesto que junto con el vector x y forman un triangulo rectangulo, lo que se deduce del
hecho de que dicho triangulo satisface el teorema de Pit agoras:
2 2
k
x yk = k(x1 , x2 ) (x2 , x1 )k
= (x1 + x2 )2 + (x2 x1 )2

= x21 + x22 + (x2 )2 + x21
2 2
= k
xk + k
yk
(ver figura 1.7).
x1
x y
y x2
x2 x1
Figura 1.7: Los vectores x = (x1 , x2 ) y y = (x2 , x1 ) son perpendiculares
mientras que, por otra parte, es f

acil ver que en este caso tambien se tiene que
x1 y1 + x2 y2 = x1 (x2 ) + x2 x1
=0
Ademas de hacernos sospechar que la perpendicularidad entre los vectores x y y est

a ntimamente rela-
cionada con el hecho de que la expresion x1 y1 + x2 y2 es igual a cero, de la identidad 1.3 y las figuras 1.8
deducimos que esta expresion debe ser positiva si el angulo formado por los vectores es agudo (mayor que 0
y menor que /2), y negativa si el
angulo formado por los vectores es obtuso (mayor que /2 y menor que
).
9 J. P
aez
Con el fin terminar de reforzar nuestras sospechas sobre la relacion que esta expresion tiene con el concepto
de angulo entre dos vectores, ahora vamos a resolver el problema planteado inicialmente recurriendo
justamente a este concepto, y a las funciones trigonometricas b asicas que se definen con base en este.
Si es el angulo formado por los vectores x
y y, y este es agudo (es decir que 0 < < /2), sabemos que
> 0 (ver figura 1.8 (a)) y que
kyk
cos() =
k
xk
k
yk
=
k
xk
Si es un angulo obtuso (es decir que /2 < < ), sabemos que < 0 (ver figura 1.8 (b)) y que
cos() = cos( )
kyk
=
k
xk
kyk
=
k
xk
de tal forma que en ambos casos obtenemos que
k
xk cos()
=
k
yk
x
y
x

y

y

y
(a) (b)
Figura 1.8: El calculo de usando el angulo
Si ahora igualamos los valores que hemos obtenido de por estos dos caminos, tenemos que
x1 y1 + x2 y2 k
xk cos()
2 =
k
yk k
yk
de donde
x1 y1 + x2 y2
cos() = (1.4)
kxk k
yk
Esta u ltima identidad es sin duda toda una revelaci
on en virtud de que nos proporciona una forma mas
especfica y rigurosa de medir al
angulo formado por los vectores x y y en terminos de sus coordenadas.
En efecto, de la igualdad anterior obtenemos que

1 x1 y1 + x2 y2
= cos (1.5)
kxk k
yk

x1 y1 + x2 y2
= arccos
kxk k
yk
J. P
aez 10
en donde elegimos la rama de la funci on arccos que toma sus valores en el intervalo [0, ].
Que la identidad anterior es una buena forma de medir dicho angulo se confirma si observamos, por
ejemplo, que este numero no vara, como es de esperarse, si tomamos otro par de vectores que apunten en las
mismas direcciones en las apuntan los vectores x y y, respectivamente. Esta condicion se traduce en tomar
vectores de la forma x y y , con , > 0; en este caso se tiene que, si x = (x1 , x2 ) y y = (y1 , y2 ) entonces
y = (y1 , y2 ) de tal forma que si llamamos al angulo formado por los vectores
x = (x1 , x2 ) y xy
y y lo calculamos en terminos de sus coordenadas, de acuerdo con la ecuaci on 1.5, se tiene que

(x1 )(y1 ) + (x2 )(y2 )
= cos1
k
xk kyk

(x1 y1 + x2 y2 )
= cos1
kxk kyk

x1 y1 + x2 y2
= cos1
kxk k
yk
=
Notese que este u ltimo hecho nos permite suponer que los vectores x y y tienen norma 1, puesto que si
este no fuera el caso, bastara con tomar = 1/ k xk y = 1/ k y k para que los vectores x y
y s tuvieran
norma 1 (por cierto que, cuando a un vector x 6= 0 le aplicamos este procedimiento de multiplicarlo por el
recproco de su norma, diremos que hemos normalizado al vector x ; es decir, normalizar al vector x
significara tomar el vector (1/ k xk)x, el vector que est a en la misma direcci on que x y cuya norma es 1).
Recurriremos con tanta frecuencia a este procedimiento de normalizaci on, que en lugar de escribir (1/ kxk)x
simplemente escribiremos x / k
xk.
Resumiendo toda la discusi on anterior y a partir de las identidades 1.4 y 1.5, podemos concluir que la
expresion x1 y1 + x2 y2 contiene la informacion suficiente como para poder calcular el angulo formado
por los vectores x y y, en donde (x1 , x2 ) es la pareja que representa (en un sistema coordenado cartesiano) a
x
y (y1 , y2 ) la que representa a y. Por esta raz on, y con base en esta expresion, definiremos sobre el conjunto
Rn otra operaci on (a la que llamaremos el producto punto (o el producto interior)) entre dos elementos
, y Rn , y que denotaremos por x
x y, de la siguiente manera.
Definici on 1.9 Dados x , y Rn , con x = (x1 , . . . , xn ) y y = (y1 , . . . , yn ), definimos el producto punto (o
producto interior) de x y y, que denotaremos por x y, como el n umero real dado por x1 y1 + + xn yn , es
decir
y := x1 y1 + + xn yn
x
Xn
:= xi yi
i=1
Esta nueva operaci

on tiene una serie de propiedades b
asicas, las cuales resumimos en la siguiente
Proposici , y, z Rn y R, el producto punto de vectores definido en 1.9 satisface las

on 1.10 Dados x
siguientes propiedades:
x
1. x 0 y x x
= 0 si y s = 0
olo si x
y = y x
2. x
(
3. x y + x
y + z) = x z
x) y = x (
4. ( x y)
y ) = (
Ademas de mencionar que la demostracion de estas propiedades es muy sencilla (y que por esta raz on
se deja como ejercicio al lector), es importante se
nalar que cualquier otra funci on definida de Rn Rn en R
que las satisfaga, tambien se le llamar
a un producto punto (o producto interior).
Si bien es cierto que es importante mostrar que la funci
on dada en la definicion 1.9 satisface las propiedades
de la proposicion anterior (pues con ello se prueba que dicha funci on s es un producto punto), tambien es
11 J. P
aez
importante destacar la ntima relaci

on que existe entre este producto y el concepto de norma euclideana que
definimos anteriormente, la cual queda expresada en la identidad
xk2 = x
k x
(1.6)
Pero sin lugar a dudas la propiedad mas importante que hay que destacar de esta nueva operaci on,
est
a relacionada con la identidad 1.4. En efecto, si escribimos esa misma identidad usando la notaci
on del
producto punto, esta se traduce en la siguiente identidad:
x y
cos() = (1.7)
k
xk k yk
la cual, por ahora, solo podemos dar por cierta para el caso de R2 , y sin ignorar que su demostracion
se obtiene a partir de nuestro (no muy bien definido) concepto de angulo y su relacion con las funciones
trigonometricas (las que por cierto, si est
an bien definidas).
La conclusi
on mas importante que podemos obtener de la identidad 1.7 se deduce del hecho de que los
valores de la funcion coseno se encuentran entre 1 y 1. En efecto, tomando en cuenta esto tendremos
entonces que, para cualesquiera par de vectores x , y R2 diferentes de 0, se debe cumplir que
|
x y|
1
k
xk k yk
o que
|
x y| k
xk k
yk (1.8)
para cualesquiera par de vectores x, y R2 (notese que si alguno de estos vectores fuera 0, entonces se
satisface la igualdad).
Lo interesante de la desigualdad 1.8 es que no involucra a ning
un angulo y tiene todo el sentido preguntarse
si es valida en cualquier Rn . Y lo mejor de todo es que la respuesta a esta pregunta es positiva! En efecto,
la desigualdad 1.8 es valida para cualquier par de vectores en Rn y es conocida como la desigualdad de
Cauchy-Schwarz 2 .
Esta desigualdad jugara un papel muy importante a lo largo de todo este texto, y por esta misma raz on
le concederemos el nivel de teorema.
, y Rn se sat-
Teorema 1.11 (Desigualdad de Cauchy-Schwarz) Para cualesquiera par de vectores x
isface que
|
x y| k
xk k
yk
Demostraci on. Como ya se mencion o y es el vector 0. Por esta raz

o, esta desigualdad es inmediata si x on,
supondremos que x
y y son distintos de 0. Asimismo, probar la desigualdad del enunciado es equivalente a
probrar que
x
y |
x y|
k = 1
xk k
yk k xk kyk
por lo que tambien podemos suponer que k xk = ky k = 1.
Una vez establecido lo anterior, por los incisos 1 y 3 de la proposicion 1.10 y la identidad 1.6, sabemos que
0 (
x y) (
x y)
= x x
2
x y + y y
= 2(1 x
y)
de donde concluimos que

x y 1
2 Llamada as en honor del matem atico frances Augustin Louis Cauchy (Pars, 21 de agosto de 1789 - Sceaux, 23 de mayo de
1857), quien la publico en 1821, y del matem atico alem
an Karl Hermann Amandus Schwarz (25 de enero 1843 - 30 de noviembre
1921), quien la publico en 1888. Aunque dicha desigualdad tambi en fue establecida por el matem atico ruso Viktor Yakovlevich
Bunyakovsky (Bar, Ucrania, 16 de diciembre 1804 - San Petesburgo, Rusia, 12 de diciembre 1889) en 1859. (fuente: Wikipedia).
J. P
aez 12
Con base en las mismas propiedades, tambien sabemos que
0 (x + y) (
x + y)
= x x
+ 2x y + y y
y)
= 2(1 + x
y ahora concluimos que

1 x
y
con lo que hemos probado que
1 x
y 1
o equivalentemente, que
|
x y| 1
que es lo que deseabamos demostrar.
Es importante llamar la atenci

on del lector al hecho de que en esta prueba no hubo necesidad de recurrir
a las coordenadas de los vectores x y y, y que las herramientas importantes fueron las propiedades b asicas
del producto punto y su relacion con la norma.
Lo relevante de esta observacion es que, si definimos otro producto punto sobre el conjunto Rn que
satisfaga las propiedades de la proposicion 1.10, y con base en este otro producto punto definimos otra
norma por medio de la identidad 1.6, esta otra norma satisfacer a las propiedades de la proposicion 1.8 y
la desigualdad de Cauchy-Schwarz, usando ese otro producto punto y esa otra norma, seguir a siendo
cierta!.
Como una primera muestra de la importancia y utilidad de la desigualdad de Cauchy-Schwarz, ahora
la usaremos para probar el inciso 3 de la proposicion 1.8 (la desigualdad del triangulo), junto con otra
desigualdad que tambien nos resultara muy u til a lo largo de este texto.
Proposici , y Rn se satisface que:

on 1.12 Para cualesquiera par de vectores x
1. k
x + yk k
xk + k
yk (desigualdad del tri
angulo)
2. |k
xk k
y k| k
x + yk
Demostraci on. Para la prueba de la desigualdad del triangulo (inciso 1), con base en la identidad 1.6 y la
desigualdad de Cauchy-Schwarz, tenemos que
2
k
x + yk = (
x + y) (
x + y)
x
=x x y + y y
+ 2
2 2
= k
xk + 2
x y + k
yk
2 2
k
xk + 2 k
xk k
y k + k
yk (desigualdad de Cauchy-Schwarz)
2
xk + k
= (k y k)
de modo que, sacando raz cuadrada, llegamos a la desigualdad deseada.

Para la prueba del inciso 2, dado que
kxk = k(
x + y) + (
y )k
usando el inciso anterior (la desigualdad del triangulo) y el hecho de que k
yk = k(1)
yk = k
y k (inciso 2
de la proposicion 1.8), se tiene que
k
xk = k(
x + y) + (
y )k
k
x + yk + k
yk
y por lo tanto
k
xk k
y k k
x + yk
13 J. P
aez
Captulo 1. El conjunto Rn 1.4. Otras normas
Analogamente, dado que k

y k = k(
x + y) + (
x)k, obtenemos que
k
yk = k(
x + y) + (
x)k
k
x + yk + k
xk
de donde
k
x + yk k
xk k
yk
es decir, que
k
x + yk k
xk k
y k k
x + yk
lo cual es equivalente a la desigualdad que se deseaba probar.
Para concluir esta secci on, recordemos que la desigualdad de Cauchy-Schwarz nos fue sugerida a partir
de la identidad 1.7, identidad que surge de un problema geometrico el cual, a su vez, se poda resolver a
partir del concepto de angulo. Todo ello en el plano, o en el conjunto R2 (pensando a este conjunto como
una representacion de dicho plano).
Lo importante de la prueba anterior es que esta es valida para cualquier Rn , y con base en la misma
identidad, podemos extender (y definir de manera mas precisa) el concepto de angulo entre cualquier par
de elementos (distintos de 0) de este conjunto, y por lo tanto, definir el concepto de angulo entre cualquier
par de elementos (distintos de 0) del espacio espacio vectorial representado por el conjunto Rn (como por
ejemplo, el espacio de los polinomios de grado menor o igual a n1). Por todo lo anterior, damos la siguiente
on 1.13 Sean x, y Rn distintos del 0. Definimos el

Definici angulo (agudo) entre x y y como el n
umero
dado por la f
ormula

1 y
x
:= cos
k
xk kyk

y
x
:= arccos
k
xk k yk
(donde cos1 (o arccos) es la funci

on inversa de cos que tiene como contradominio el intervalo [0, ]).
1.4 Otras normas

Como el lector habr a notado, todo lo realizado en la secci
on anterior est
a basado en lo que comunmente
conocemos como geometra euclideana. La idea de esta secci on es mostrar que, en particular el concepto
de longitud (o magnitud, o distancia al origen, o valor absoluto) de un elemento x = (x1 , . . . , xn ) Rn
se puede definir de otras formas, sin necesidad de recurrir a la geometra euclideana, y conservando las
propiedades elementales que tiene la norma euclideana (y que establecimos en la proposicion 1.8).
Sin que se pretenda profundizar en el tema, ahora es prudente mencionar que a cualquier funci on de Rn
+
en los reales no negativos (conjunto al que denotaremos por R ) que satisfaga las propiedades establecidas
en la proposicion 1.8, se le conoce con el nombre de norma. Y aunque existe (literalmente) una infinidad
de maneras de definir una norma en Rn (en realidad, muchas de ellas son muy parecidas), en esta breve
on solo abordaremos dos de ellas; la norma uno (que denotaremos por kk1 ) y la norma infinito (que
secci
denotaremos por kk ), que definimos de la siguiente manera.
Definici = (x1 , . . . , xn ) Rn , definimos:

on 1.14 Dado x
, que denotamos por k

1. la norma uno de x xk1 , como
k
xk1 := |x1 | + + |xn |
, que denotamos por k

2. la norma infinito de x xk , como
k
xk := max{|x1 | , . . . , |xn |}
J. P
aez 14
1.4. Otras normas Captulo 1. El conjunto Rn
Queda como un ejercicio para el lector probar que las funciones definidas arriba satisfacen las propiedades
enlistadas en la proposicion 1.8, con lo que de paso quedara justificado el hecho de que a dichas funciones
les llamemos normas.
Aun y cuando estas otras normas tienen algunas diferencias importantes con la norma euclideana (en
particular, para ninguna de estas normas se puede definir alg un producto punto en Rn que satisfaga lo
equivalente a la identidad 1.6), en cuanto a formas de medir la longitud (o magnitud, o distancia al origen,
o valor absoluto) de un elemento x Rn no resultan ser tan diferentes.
En efecto, en la u
nica proposicion que enunciaremos en esta secci
on, mostraremos que todas estas normas
est
an relacionadas a traves de ciertas desigualdades las cuales permitiran establecer que ciertos conceptos
tales como: estar en el interior de un conjunto, estar en el exterior de un conjunto, y estar en la
frontera de un conjunto, y para cuya definicion necesitamos de una norma, todos ellos resultaran ser iguales
sin importar que norma usemos.
Proposici Rn se satisfacen las siguientes desigualdades:

on 1.15 Para cualquier elemento x

1. k xk n k
xk k xk
2. 1 k
xk1 k
xk k
xk1
n
Demostraci
on. Dado que el cuadrado de un n
umero real siempre es no negativo, se tiene que
x2i x21 + + x2n
de modo que q
|xi | x21 + + x2n = k
xk (1.9)
y como la desigualdad anterior es valida para toda i {1, . . . , n}, concluimos que
k
xk = max{|x1 | , . . . , |xn |} k
xk
Por otra parte, como

|xi | max{|x1 | , . . . , |xn |} = k
xk
2
(para toda i {1, . . . , n}) entonces x2i k
xk de modo que
2 2 2 2
xk = x21 + + x2n k
k xk + + k
xk = n k
xk
es decir
k
xk n k
xk
con lo que concluimos la prueba de las dos desigualdades del primer inciso.
Para la primera desigualdad del segundo inciso, observese que
|x1 | + + |xn | = (1, . . . , 1) (|x1 | , . . . , |xn |)
de tal forma que, por la desigualdad de Cauchy-Schwarz, tenemos que
|x1 | + + |xn | = (1, . . . , 1) (|x1 | , . . . , |xn |)

k(1, . . . , 1)k k(|x1 | , . . . , |xn |)k
q
2 2
= n |x1 | + + |xn |
q
= n x21 + + x2n

= n k xk
Para la segunda desigualdad, observe que
x = (x1 , . . . , xn )
15 J. P
aez
Captulo 1. El conjunto Rn 1.5. Topologa de Rn
= (x1 , 0, . . . , 0) + (0, x2 , 0, . . . , 0) + + (0, 0, . . . , 0, xn )
de tal forma que, por el problema 5 de este captulo concluimos que
k
xk = k(x1 , 0, . . . , 0) + (0, x2 , 0, . . . , 0) + + (0, 0, . . . , 0, xn )k
k(x1 , 0, . . . , 0)k + + k(0, 0, . . . , 0, xn )k
= |x1 | + + |xn |
= k
xk1
que es la desigualdad que se deseaba probar.
Para concluir esta secci on mencionaremos la importancia adicional que tiene el hecho de que en Rn
podamos contar con al menos una norma (de hecho, hasta ahora en Rn tenemos tres!).
Como mencionamos anteriormente, el concepto de norma nos permite hablar de la longitud (o magnitud,
o distancia al origen, o valor absoluto) de un elemento x Rn . Si en particular pensamos a la norma como
una forma de medir la distancia que hay entre el punto representado por el elemento x Rn y el origen 0,
esta interpretacion nos permite entonces hablar de la distancia entre cualesquiera dos elementos x , y Rn ;
en efecto, dados estos dos elementos, en virtud de que a x y lo podemos pensar como la flecha que tiene
punto inicial en y y punto final en x
, la norma de este vector sera una medida de la distancia entre estos dos
puntos.
Si recordamos que en Rn hemos definido tres normas diferentes, con base en el razonamiento anterior
estamos en condiciones de establecer tres formas diferentes de medir la distancia entre elementos de Rn . Sin
embargo, y como en el caso de la norma, la distancia que usaremos a lo largo de todo este texto es aquella que
se obtiene a partir de la norma euclideana (y que por razones obvias, llamaremos la distancia euclideana).
Este concepto lo formalizamos en la siguiente
Definici , y Rn definimos la distancia (euclideana) de x

on 1.16 Dados x a y, que denotamos por d(
x, y),
como
d(x, y) := k
x yk
Un resultado muy sencillo de probar es que la distancia euclideana (y cualquier otra distancia que se
respete), cumple con las propiedades que establecemos en la siguiente proposicion3 .
Proposici
on 1.17 La distancia (euclideana) satisface las siguientes propiedades:
1. d( , y Rn , y d(
x, y) 0 para toda x x, y) = 0 si y solo si x
= y
2. d(
x, y) = d( ) para toda x, y Rn
y, x
x, y) d(
3. d( z , y) para cualesquiera x, y, z Rn
x, z) + d( (desigualdad del triangulo)
Como es de esperarse, la prueba de esta proposicion se deja al lector.
1.5 Topologa de Rn
La Topologa es un area de las matematicas muy importante que se interesa por conceptos como proximidad,
continuidad, conectividad (o conexidad), compacidad, y muchos otros mas. Para abordarlos, es necesario
establecer un cierto tipo de conjuntos (que en Topologa se les conoce como los conjuntos abiertos), y con
base en esta familia de conjuntos es posible darse a la tarea de definirlos de forma muy precisa.
Cuando en un conjunto se cuenta con una forma de medir la distancia entre cualesquiera dos de sus
elementos (como es el caso de Rn ), existe una manera de decir quienes son los conjuntos abiertos y con base
en estos, desarrollar los conceptos que mencionamos al principio de esta seccion. Eso es lo que vamos a hacer
on de Rn Rn en R+ que cumpla con estas tres propiedades se le llamar
3 De hecho, cualquier funci a una distancia en Rn .
Aun cuando en este texto podemos considerar tres diferentes distancias, con base en las tres diferentes normas que definimos,
no todas las distancias en Rn tienen que estar definidas a trav
es de una norma.
J. P
aez 16
1.5. Topologa de Rn Captulo 1. El conjunto Rn
en esta secci
on y para ello empezaremos por definir un cierto tipo de conjuntos que resultaran ser basicos en
esta tarea: el concepto de vecindad de un punto x Rn .
En Rn , este concepto de vecindad se define apoyandonos en alguna de las formas que disponemos de
medir la distancia entre elementos de Rn , que en nuestro caso sera la distancia euclideana (en los proble-
mas mostraremos que, en terminos topologicos, da lo mismo cual de estas distancias elijamos o, en u ltima
instancia, cual norma elijamos).
Algunos objetos geometricos son muy sencillos de describir en terminos del concepto de distancia, y sin
duda el mas sencillo de ellos es el formado por los puntos que se encuentran a una distancia constante r > 0
de un punto fijo x Rn , que como todos sabemos, en R2 dicho objeto es una circunferencia de radio r, y
3
en R es una esfera, tambien de radio r. Sin embargo, para nuestros objetivos, el conjunto que resultara de
mayor interes no es tanto el formado por los puntos que se encuentran a una distacia r de x Rn , sino los
que se encuentran a una distancia menor a r. En R2 este conjunto consistir a de los puntos que se encuentran
dentro de la cincunferencia de radio r, y en R3 consistir a de los que est
an dentro de la esfera, tambien
de radio r (ver figura 1.9).
Figura 1.9: Las bolas de radio r con centro en el origen (en R2 y en R3 )
Con base en lo anterior, definimos (en Rn ) el concepto de vecindad (o bola) de radio r > 0 con centro en
Rn , que denotaremos por Br (
el punto x x), de la siguiente manera.
Definicion 1.18 Dado x Rn y r > 0, definimos la vecindad (o bola) de radio r > 0 con centro en x Rn
como
Br ( y Rn | d(
x) := { x, y) = k
x yk < r}
1.5.1 Clasificaci
on de puntos
Apoyandonos en este concepto ahora nos daremos a la tarea de, dado un conjunto A Rn , clasificar a
todos los puntos de Rn en terminos de su posicion con respecto a dicho conjunto, en donde por posicion
nos referimos a algo mas profundo que el simple concepto de pertenencia. A fin de precisar esta idea de
posicion con respecto a un conjunto A, recurriremos a la figura 1.10 en R2 .
Suponiendo que el conjunto A est a formado por los puntos del area sombreada, incluyendo los puntos de
la lnea continua, y excluyendo los puntos de la lnea punteada, tenemos que los puntos x y z pertenecen al
conjunto, mientras que los puntos y y w no pertenecen a A. Sin embargo, tanto los que pertenecen como los
que no pertenecen a A, tienen una posicion diferente con respecto a este conjunto.
En efecto, mientras que en el caso del punto x existe un radio r > 0 tal que la vecindad de este radio
y centro en x est
a contenida en A (es decir, Br (x) A), en el caso del punto z no es posible encontrar un
radio con esta misma caracterstica, es decir, para todo r > 0 se tiene que Br ( z ) Ac 6= y Br (
z ) A 6= ,
c n
en donde A := R \ A (el complemento de A).
En el caso de los puntos y y w se tiene una situacion analoga; mientras que para el punto y existe un
radio r > 0 tal que la vecindad de este radio y centro en y est a contenida en Ac (es decir, Br ( y ) Ac ),
c
en el caso del punto w tambien se tiene que para todo r > 0, sucede que Br (w) A 6= y Br (w) A 6=
(ve ase la figura 1.11).
17 J. P
aez
Y
w

y
x
A
z
Figura 1.10: Las diferentes posiciones que puede tener un punto de Rn con respecto de un conjunto A
y w

A
z
X
on de los puntos de Rn con respecto al

Figura 1.11: Caracterizacion, en terminos de vecindades, de la posici
conjunto A
Resumiendo lo anterior tenemos que, dado un conjunto A Rn y x Rn , entonces se satisface una de

las siguientes condiciones (y solo una de ellas, pues seran mutuamente excluyentes):
x) A,
1. existe r > 0 tal que Br (
x) Ac , o
2. existe r > 0 tal que Br (
x) Ac 6= y Br (
3. para todo r > 0 se cumple que Br ( x) A 6= .
Como el lector estar a de acuerdo, los puntos que satisfacen la condicion 1 no solo son puntos que deben
pertenecer a A, sino que ademas est an realmente dentro (o en el interior) de A; los que cumplen la
condicion 2 no solo son puntos que no pertenecen a A, sino que ademas est an realmente fuera (o en el
exterior) de A; y finalmente los que cumplen la condicion 3, pueden o no pertenecer a A, pero lo importante
es que no est an ni dentro ni fuera, raz
on por la cual podemos decir que se encuentran en el borde (o
en la frontera) de A.
Con base en lo anterior es que ahora estamos en condiciones de, dado un conjunto A Rn , dar una
clasificacion de los puntos de Rn en terminos de su posicion con respecto de dicho conjunto, cosa que
haremos en la siguiente
on 1.19 Sean A Rn y x
Definici Rn . Decimos que:
1. x x) A. Denotamos por int(A) al conjunto

es un punto interior de A si existe r > 0 tal que Br (
formado por todos estos puntos, es decir
x Rn | x
int(A) := { es un punto interior de A}
y diremos que este conjunto es el interior de A.
J. P
aez 18
2. x x) Ac . Denotamos por ext(A) al conjunto

es un punto exterior de A si existe r > 0 tal que Br (
formado por todos estos puntos, es decir
x Rn | x
ext(A) := { es un punto exterior de A}
y diremos que este conjunto es el exterior de A.

3. x
es un punto frontera de A si para todo r > 0 se tiene que Br ( x) Ac 6= .
x) A 6= y Br (
Denotamos por Fr(A) al conjunto formado por todos estos puntos, es decir
x Rn | x
Fr(A) := { es un punto frontera de A}
y diremos que este conjunto es la frontera de A.
Como seguramente ya habr a notado (y podra probar muy facilmente), los conjuntos definidos anterior-
mente satisfacen unas propiedades muy elementales (ademas de algunas otras que veremos mas adelante) y
que dejamos expresadas en la siguiente
on 1.20 Si A Rn entonces:
Proposici
1. int(A) A
2. ext(A) Ac
3. int(A) ext(A) = int(A) Fr(A) = Fr(A) ext(A) =
4. Rn = int(A) Fr(A) ext(A)
5. int(Ac ) = ext(A) y Fr(A) = Fr(Ac )
A
un y cuando la definicion del tipo de puntos (y sus repectivos conjuntos) que acabamos de dar, la
hicimos basandonos en un subconjunto de R2 muy bonito, hay casos para los cuales dichos conjuntos no
resultan ser los que esperamos que sean (claro, si acaso tuvieramos una idea de quienes deberan de ser!).
El ejemplo que a continuacion presentamos, es uno de esos casos.
Ejemplo 1.21 Sea
A = ([0, 1] [0, 1]) (Q Q) = {(x, y) R2 | x, y Q y 0 x 1, 0 y 1}
Determinaremos quienes son el int(A), el ext(A) y la Fr(A).

Primero mostraremos que si x = (x, y) es un punto arbitrario de R2 y r es cualquier n umero real positivo,
entonces Br ( x) (R2 \ Q Q) 6= de tal forma que, como A Q Q tendremos que Br ( x) (R2 \ A) =
Br (x) Ac 6= . Sea pues x = (x, y) R2 y r cualquier n umero real positivo.
Como es de todos conocido, existe x / Q tale que x < x < x + r. De estas desigualdades concluimos que
si y = (x , y) entonces d(x, y) = k(x, y) (x , y)k = |x x | < r de modo que y Br ( x), y como y / QQ
(pues x / Q) entonces Br ( x) (R2 \ Q Q) 6= .
De lo que acabamos de probar se desprende inmediatamente que int(A) = pues si x A, no existe
forma de encontrar r > 0 tal que Br ( x) A pues cualquier vecindad, sin importar cual es su radio (e
incluso sin importar cual es su centro) interseca a Ac de tal forma que por el inciso 1 de la proposici on 1.20
tendremos que int(A) = .
El siguiente paso ser a mostrar que [0, 1] [0, 1] Fr(A). Sea x = (x, y) [0, 1] [0, 1] y r > 0. Por el
primer resultado que probamos, ya sabemos que Br ( x) Ac 6= . Restara probar que Br ( x) A 6= .
Supongamos por ahora que 0 x < 1 y 0 y < 1.Por la densidad de los n umeros
racionales sabemos
que existen x , y Q tales que x < x < min{1, x + r/ 2} y y < y
< min{1, y + r/ 2}. Tenemos entonces
que (x , y ) A y ademas, dado que |x x | < r/ 2 y |y y | < r/ 2, entonces
p
k(x, y) (x , y )k = (x x )2 + (y y )2
q
< (r/ 2)2 + (r/ 2)2
19 J. P
aez
=r
de modo que (x , y ) Br ( x) A 6= .
x), es decir, Br (
Ahora, escogiendo a x y y como en el caso anterior (siempre que se pueda), si x = 1 y y < 1 entonces
nos fijamos en la pareja (1, y ); si x < 1 y y = 1 elegimos a la pareja (x , 1), y si x = 1 y y = 1 a la pareja
(1, 1). En todos estos casos, dichas parejas pertenecen a Br ( x) A con lo cual queda probado tambien en
estos casos que Br ( x) A 6= , y por lo tanto que [0, 1] [0, 1] Fr(A).
Finalmente, probaremos que R2 \ [0, 1] [0, 1] ext(A). Sea x = (x, y) / [0, 1] [0, 1] y supongamos
por ahora que x < 0 o 1 < x (la otra posibilidad es que y < 0 o 1 < y). Si x < 0 tomamos r = |x| > 0 y
afirmamos que Br ( x) R2 \ [0, 1] [0, 1] Ac . En efecto, si (x , y ) Br (
x), por la desigualdad 1.9 se tiene
que
|x x | k(x, y) (x , y )k
<r
= |x|
= x
de modo que x < x x < x y por la primera desigualdad, concluimos que x < 0 y por lo tanto que
(x , y ) x) R2 \ [0, 1] [0, 1] Ac . Si 1 < x tomamos
/ [0, 1] [0, 1], con lo que probamos que Br (
r = x 1 > 0 y afirmamos nuevamente que Br ( x) R2 \ [0, 1] [0, 1] Ac . En efecto, si (x , y ) Br (
x),
otra vez por la desigualdad 1.9 se tiene que
|x x | k(x, y) (x , y )k
<r
=x1
de modo que 1 x < x x < x 1 y por la segunda desigualdad, concluimos que 1 < x . Por lo tanto se
tiene que (x , y ) x) R2 \ [0, 1] [0, 1] Ac . Si y < 0
/ [0, 1] [0, 1] con lo que probamos tambien que Br (
o 1 < y procedemos de forma an aloga.
Reuniendo lo que hemos probado hasta ahora, y por los incisos 3 y 4 de la proposici on 1.20, tenemos que
[0, 1] [0, 1] Fr(A) = Rn \ ext(A) [0, 1] [0, 1]
de donde concluimos que Fr(A) = [0, 1] [0, 1] y que ext(A) = Rn \ [0, 1] [0, 1].
1.5.2 Conjuntos abiertos y cerrados

Una vez que hemos hecho esta clasificacion de los puntos de Rn en relacion con un conjunto A Rn , ahora
estamos en condiciones de dar una caracterizacion de cierto tipo de subconjuntos de Rn .
Dado un conjunto A Rn , ya sabemos que int(A) A y que ext(A) Ac , pero en el caso de la Fr(A)
en general no siempre se cumple alguna de estas relaciones de contencion, y justo el conjunto A de la figura
1.11 ilustra un caso de ese tipo (lo que s sabemos en general es que A = int(A) (A Fr(A)), identidad que
siempre vale la pena recordar).
Por esta razon, los conjuntos para los cuales se cumple que Fr(A) A o Fr(A) Ac (esto u ltimo
equivalente a que Fr(A) A = ) merecen un nombre aparte.
Cuando un conjunto no tenga a ninguno de sus puntos frontera (es decir que Fr(A) A = ), diremos
que el conjunto es abierto, y si Fr(A) A diremos que el conjunto es cerrado. Esta clasificacion de conjuntos
la dejamos expresada en la siguiente
on 1.22 Sea A Rn . Decimos que:

Definici
1. A es un conjunto abierto si Fr(A) A =
2. A es un conjunto cerrado si Fr(A) A
J. P
aez 20
Una primera observaci on que es muy importante hacer con relacion a las definiciones anteriores, es que
las condiciones Fr(A) A = y Fr(A) A no son complementarias en el sentido de que una de ellas
on de la otra. Es decir, si Fr(A) A 6= esto no implica que Fr(A) A, y recprocamente, si
sea la negaci
Fr(A) " A esto no implica que Fr(A) A = .
Dicho de otra forma, y en terminos de las definiciones que acabamos de dar: si un conjunto A no es
abierto esto no implica que tenga que ser cerrado, y recprocamente, si un conjunto A no es cerrado esto
no implica que tenga que ser abierto. mas aun, y dado que las condiciones Fr(A) A 6= y Fr(A) " A
no se contraponen (es decir, que pueden pasar ambas, como sucede con el conjunto A de la figura 1.11),
confirmamos que hay conjuntos que no son abiertos y tampoco son cerrados, y que son justo aquellos que
contienen a algunos de sus puntos frontera, pero no a todos ellos.
La segunda observacion importante con relacion a las definiciones que acabamos de dar, es que estas no
son las mas comunes, razon por la cual lo primero que haremos sera probar una proposicion en la que se
establecen las equivalencias con las definiciones mas populares (o mas conocidas, si se prefiere).
on 1.23 Sea A Rn . Las siguientes afirmaciones son equivalentes:

Proposici
olo si para todo x A existe r > 0 tal que Br (

1. A es un conjunto abierto si y s x) A (es decir, si
A int(A) y por tanto que A = int(A))
olo si Ac es abierto
2. A es un conjunto cerrado si y s
Demostraci on. Inciso 1) (=) Sea x A; de acuerdo con el inciso 1 de la definicion 1.22 se tiene que

x / Fr(A) y por lo tanto, de acuerdo con el inciso 3 de la definicion 1.19, debe existir r > 0 tal que
x) A = o Br (
Br ( x) Ac = . Como x Br (
x) A la identidad que se debe cumplir es la segunda, es
c
x) A = , lo que significa que Br (
decir, que Br ( x) A (y por lo tanto que x
int(A)).
Inciso 1) (=) Dado que A = A Rn , por los incisos 2, 3 y 4 de la proposicion 1.20 se tiene que
A = A Rn = (A int(A)) (A Fr(A)) (A ext(A)) = A int(A)
de donde A int(A) (y por el inciso 1 de la misma proposicion, se tiene que A = int(A)).

Inciso 2) (=) De acuerdo con el inciso 1 de la definicion 1.22, como A es cerrado se tiene que Fr(A) A
y por tanto que Fr(A) Ac = ; dado que Fr(A) = Fr(Ac ) (inciso 5 de la proposicion 1.20) tenemos que
Fr(Ac ) Ac = y por lo tanto, de acuerdo con la defincion 1.22, se tiene que Ac es un conjunto abierto.
Inciso 2) (=) Lea hacia atras el p
arrafo anterior!
En realidad, y para ser sinceros, las condiciones de la proposicion anterior son las mas populares
porque suelen ser las mas u
tiles cuando se trata de demostrar que un conjunto es abierto o que un conjunto
es cerrado. Y como prueba de esta afirmaci on, a continuacion damos algunos ejemplos.
Ejemplo 1.24 Observe que:
1. Rn es un conjunto abierto. En efecto, n Rn se tiene que Br (

otese que para todo x x) Rn sin
importar como sea r (muy grande o muy peque no) de forma que, por el inciso 1 de la proposici
on
anterior, Rn es un conjunto abierto.
2. Rn es un conjunto cerrado. En virtud de lo anterior, tenemos que Rn = int(Rn ) de forma tal que
Fr(Rn ) = (y de hecho tambien ext(Rn ) = ) de modo que Fr(Rn ) Rn y por el inciso 2 de la
on anterior, Rn tambien es un conjunto cerrado.
proposici
on), se concluye que el conjunto tambien es
3. Por los dos incisos anteriores (y la multicitada proposici
un conjunto abierto y cerrado (lo que por cierto prueba que los conjuntos (al menos algunos de ellos)
no son como las puertas: los hay algunos que son abiertos y cerrados al mismo tiempo! El lector
podra mostrar otro ejemplo con la misma caracterstica?).
4. Para todo x Rn y toda r > 0 se tiene que Br ( x) es un conjunto abierto. Veamos que se cumple la
condici
on del inciso 1 de la susodicha proposici on. Sea y Br (
x); como se ilustra en la figura 1.12
(para el caso de R2 ), todo parece indicar que si tomamos r = r k x yk > 0 entonces se debe tener
21 J. P
aez
y ) Br (
que Br ( x). La clave para probar esta contenci
on est
a en la desigualdad del tri
angulo (inciso
1 de la proposicion 1.12) pues, con base en dicha desigualdad, tenemos que si z Br (
y ) entonces
k
x zk = k(
x y) + (
y z)k
k
x yk + k
y zk
= k
x yk + k
z yk
< k
x yk + r k
x yk
=r
y por lo tanto z Br ( y ) Br (
x), de donde Br ( x). Esto prueba que se satisface la condici
on del inciso
1 de la famosa proposici on, y por lo tanto que Br (x) es un conjunto abierto.
z
}|
yk y
{
{ b
kx }|
zb
r
x

Figura 1.12: La bola de radio r con centro en x es un conjunto abierto
Pareciera geometricamente natural esperar que si a un conjunto A le quitamos sus puntos frontera,
el conjunto que nos queda sera un conjunto abierto (el conjunto de la figura 1.12 refuerza esta sospecha).
Cuando a un conjunto A le quitamos sus puntos frontera, solo nos quedamos con los puntos interiores de A,
es decir que
A \ Fr(A) = int(A) (1.10)
de donde nuestra sospecha se traduce en que el interior de todo subconjunto A de Rn (int(A)) sera un
conjunto abierto (y por lo tanto el ext(A) tambien sera abierto dado que ext(A) = int(Ac ) (inciso 5 de la
proposicion 1.20)).
Siguiendo la misma lnea de pensamiento que en el p arrafo anterior, ahora nos podemos preguntar que
sucede si a un conjunto A, en lugar de quitarle sus puntos frontera, se los agregamos. Es decir, que tipo
de conjunto resultara ser A Fr(A)?
Pues bien, como seguramente el lector ya intua, este conjunto siempre resultara ser un conjunto cerrado
y hasta tiene un nombre que refleja esta propiedad: la cerradura de A. Este conjunto lo usaremos mucho a
lo largo de este texto, y por esta raz
on le dedicamos la siguiente
Definicion 1.25 Sea A Rn . Definimos la cerradura de A, que denotamos por A, como
A := A Fr(A)
Resumiendo lo hecho hasta aqu, dado A Rn arbitrario, hemos definido (por ahora) cuatro conjuntos
Ahora, si recordamos, por el inciso 4 de la proposicion
asociados a dicho conjunto: int(A), ext(A), Fr(A) y A.
1.20, que
(Fr(A))c = Rn \ Fr(A) = int(A) ext(A)
J. P
aez 22
todo parece indicar que el complemento de la Fr(A) sera un conjunto abierto, y por lo tanto este sera cerrado.
Es decir, de estos cuatro conjuntos, el int(A) y el ext(A) seran conjuntos abiertos, mientras que Fr(A) y
A seran conjuntos cerrados. Dada la importancia de estas propiedades, las dejaremos establecidas en la
siguiente
on 1.26 Sea A Rn arbitrario. Las siguientes afirmaciones son ciertas:

Proposici
1. el int(A) y el ext(A) son conjuntos abiertos
2. la Fr(A) y A son conjuntos cerrados
Demostraci on. Inciso 1) De acuerdo con el inciso 1 de la proposicion 1.23, necesitamos mostrar que si
int(A) entonces existe r > 0 tal que Br (
x x) int(A). Ahora, como x int(A) sabemos que existe r > 0
x) A; aseguramos que Br (
tal que Br ( x) int(A). En efecto, si y Br (
x) como se mostro en el inciso 4
del ejemplo 1.24, existe r > 0 tal que Br (
y ) Br (
x) A, lo que prueba que y int(A) y por tanto que
x) int(A).
Br (
En cuanto al ext(A), como mencionamos arriba, dado que ext(A) = int(Ac ) (inciso 5 de la proposicion
1.20), por la primera parte de este inciso tenemos que este conjunto tambien es abierto.
Inciso 2) Como tambien hicimos notar anteriormente, por el inciso 4 de la proposicion 1.20, tenemos que
(Fr(A))c = Rn \ Fr(A) = int(A) ext(A)
de tal forma que, por el inciso (a) del problema 21 concluimos que (Fr(A))c es un conjunto abierto y por
lo tanto que Fr(A) es cerrado. Con respecto a A observese que, como A = int(A) (A Fr(A)) entonces
A Fr(A) = int(A) Fr(A) y por tanto
c = Rn \ (A Fr(A)) = Rn \ (int(A) Fr(A)) = ext(A)

(A)
c es un conjunto abierto y por lo tanto A sera un conjunto cerrado.

de modo que (A)
1.5.3 Otra clasificaci

on de puntos
Si en la definicion 1.19 hicimos una clasificacion de los puntos de Rn en terminos de su posicion con respecto
de un conjunto A Rn (mas alla de su relacion de pertenencia con dicho conjunto), ahora introduciremos
una nueva clasificacion en la que trataremos de reflejar si un punto x Rn est
a pegado a (o contrariamente
n
aislado de) un conjunto A R .
Para hacer esto, nuevamente haremos uso de las vencidades (o bolas) centradas en este punto x . De
hecho, parece natural pensar que un punto x Rn est a pegado a un conjunto A Rn si cualquiera
de sus vecindades Br ( x) (es decir, sin importar el tama no de su radio) comparte muchos puntos con el
conjunto (y por lo tanto, diferentes de x , el cual ni siquiera tendra que pertenecer a A).
Con base en esta idea intuitiva es que definimos los conceptos de punto de acumulaci on y punto aislado
ltimo como lo contrario del primero) de un conjunto A Rn .
(este u
on 1.27 Sean A Rn y x
Definici Rn . Decimos que:
1. x
es un punto de acumulaci
on de A si para toda r > 0 se tiene que (Br ( x}) A 6= 4 . Al conjunto
x) \ {

formado por los puntos de acumulacion de A lo denotamos por A , es decir
A := {
x Rn | x
es punto de acumulaci
on de A}
2. x
es un punto aislado de A si x no es un punto de acumulaci
on de A, es decir, si existe r > 0 tal que
x}) A = .
x) \ {
(Br (
4 Un conjunto de la forma Br (
x) \ {
x} se dice que es una vecindad agujerada de x
.
23 J. P
aez
Es muy importante destacar que esta relacion entre un punto x y un conjunto A es completamente
independiente de la relaci
on de pertenencia que x tenga con el conjunto A. En efecto, si x es un punto de
acumulacion de A esto no significa que x
tenga que pertenecer a A, y recprocamente, aun y cuando x A,
puede suceder que x no es un punto de acumulaci on de A, es decir, puede suceder que x es un punto aislado
de A. El siguiente ejemplo ilustra (en R2 ) estos hechos.
Ejemplo 1.28 Sea A = {(x, y) R2 | x2 + y 2 < 1} {(2, 2)} = B1 ((0, 0)) {(2, 2)} (ver figura 1.13).
Afirmamos que:

1. el punto (1/ 2, 1/ 2), que no pertenece a A, es un punto de acumulaci
on de A. En efecto, observe
que dado r > 0, entonces el punto

1 r 1 r 1
, = (1, 1)
2 2(r + 1) 2 2(r + 1) 2(r + 1)
es tal que

1
r 1 r = 1

, k(1, 1)k
2 2(r + 1) 2 2(r + 1) 2(r + 1)
1
= 2
2(r + 1)
1
=
r+1
<1
y por lo tanto pertenece a A.

Por otra parte, se tiene que

1 1 1 r 1 r
0< ,
,
2 2 2 2(r + 1) 2 2(r + 1)

r r
=
,
2(r + 1) 2(r + 1)
r
= k(1, 1)k
2(r + 1)
r
= 2
2(r + 1)
r
=
(r + 1)
<r
de donde concluimos que este punto tambien pertenece al conjunto

Br ((1/ 2, 1/ 2)) \ {(1/ 2, 1/ 2)}
y por lo tanto que

Br ((1/ 2, 1/ 2)) \ {(1/ 2, 1/ 2)} A 6=

es decir, que (1/ 2, 1/ 2) es un punto de acumulaci
on de A.
2. el punto (2, 2), que es un punto que pertenece a A, es un punto aislado de A. Observese que si tomamos
la bola (o vecindad) de radio 1 con centro en este punto, entonces
(B1 ((2, 2)) \ {(2, 2)}) A =
J. P
aez 24
En efecto, si (x, y) B1 ((2, 2)) \ {(2, 2)} entonces (x, y) 6= (2, 2) y adem
as se cumplen las siguientes
desigualdades:
k(2, 2)k k(x, y)k k(2, 2) (x, y)k < 1
de modo que
k(2, 2)k 1 < k(x, y)k
y como
1 < 2 2 1 = k(2, 2)k 1 < k(x, y)k
entonces 1 < x2 + y 2 , es decir, (x, y)
/ B1 ((2, 2)) y por lo tanto (x, y)
/ A.
b
2
3 2 1 1 2
Figura 1.13: El conjunto A = {(x, y) R2 | x2 + y 2 < 1} {(2, 2)} del ejemplo 1.28
Dado un conjunto A Rn , la relacion de los puntos de acumulaci on con aquellos que se definieron en
1.19 no es muy estrecha, pues cada uno de ellos expresan una relacion diferente con dicho conjunto. Sin
embargo, existen algunas contenciones entre ellos que es importante destacar. Tal es el caso de los puntos
interiores de A, los cuales siempre resultan ser puntos de acumulaci on, es decir que int(A) A .
Tambien resulta natural que los puntos exteriores de A esten (o sean) aislados de A, es decir que A
ext(A) = , o equivalentemente, que A Rn \ ext(A) = int(A) Fr(A). Estas contenciones establecen una
relacion muy especfica entre los puntos de acumulaci on de un conjunto A y sus correspondientes puntos
interiores y exteriores, lo que no sucede con los puntos frontera.
En efecto, el conjunto A del ejemplo 1.24 nos es u til para ilustrar este hecho; en este caso, el (0, 0) es
un punto de acumulaci on de A (ya que es un punto interior de A) y no es un punto frontera de A (por la
misma raz on); sin embargo, el punto (2, 2) es un punto frontera de A y como se mostro en ese ejemplo, no
es un punto de acumulaci on de A.
Las contenciones dadas en el parrafo anterior son muy importantes y por esta razon las dejamos expresadas
en la siguiente
Proposici on 1.29 Si A Rn es un conjunto arbitrario entonces
int(A) A int(A) Fr(A)
Demostraci
on. Como es de suponerse, la prueba de esta proposicion se deja al lector.
Cuando expresamos en terminos intuitivos lo que debera de pasar para que un punto x Rn fuera un
punto de acumulaci on de un conjunto A, dijimos que cualquier vecindad Br (x) (sin importar que tan grande
o pequeno fuera r) tendra que tener muchos puntos de A.
Lo siguiente que vamos a mostrar es que, de la definicion formal que dimos, en efecto se desprende que
Rn es un punto de acumulaci
esto debe ser as: x x) A es un
on de A si y solo si para toda r > 0, Br (
conjunto infinito.
25 J. P
aez
Proposici on 1.30 Sea A Rn . Se satisface que x Rn es un punto de acumulaci

on de A si y s
olo si para
x) A es un conjunto infinito.
todo r > 0 se tiene que Br (
Demostraci on. Para probar que esta propiedad es una condicion necesaria del hecho de que x es un punto
de acumulacion de A, procederemos por el metodo de la contrapuesta.
Supongamos entonces que existe r > 0 tal que Br ( x) A es un conjunto finito.
Si (Br ( x}) A = entonces x
x) \ { es un punto aislado de A y por lo tanto ya habremos terminado.
x) \ {
Si (Br ( x}) A = { k } hacemos r = min{k
x1 , . . . , x xxi k | i {1, . . . , k}}. Es claro que r > 0 y

ademas, como r k x xi k para toda i {1, . . . , k} entonces (Br ( x}) A = con lo que de nuevo
x) \ {
concluimos que x es un punto aislado de A.
Para probar la suficiencia, basta observar que si Br ( x) A es un conjunto infinito para toda r > 0,
entonces es inmediato que (Br ( x) \ { x}) A 6= de modo que x es un punto de acumulaci on de A.
La proposicion anterior tiene un corolario muy interesante, pues establece una condicion suficiente para
que un conjunto no tenga puntos de acumulaci on (o si se prefiere, una condicion (o consecuencia) necesaria
del hecho de que un conjunto s tenga puntos de acumulaci on): si un conjunto A Rn es finito entonces

A = (o equivalentemente: si A 6= entonces A es un conjunto infinito). Escribiremos el corolario de la
segunda forma.
Corolario 1.31 Sea A Rn . Si A 6= entonces A es un conjunto infinito.
Una pregunta muy importante es si la afirmaci on recproca del corolario anterior es cierta: si A es un
conjunto infinito entonces A 6= ? La respuesta es negativa y el ejemplo es el conjunto A que se da en el
problema 25.
La siguiente pregunta es entonces: ademas de ser infinito, que otra propiedad debe tener un conjunto
A para que se pueda asegurar que al menos tiene un punto de acumulaci on? Y la clave para responder esta
pregunta nos la da el conjunto A que acabamos de usar como contraejemplo, y el resultado del problema 35.
En este problema se establece que, si un conjunto tiene al menos un punto de acumulaci on (es decir, que
A 6= ) entonces para cualquier cantidad positiva (sin importar que peque na la tomemos), deben existir un
par de elementos de A cuya distancia entre ellos es menor que esa cantidad positiva.
Es decir, sin importar que distancia elijamos, siempre debemos de poder encontrar elementos en A cuya
distancia entre ellos sea menor que la distancia elegida. Y si el lector observa con cuidado, el conjunto A
del problema 25 no satisface esta propiedad, y peor aun, en este caso tenemos que k x yk 1 para todo
, y A, x
x 6= y.
De la discusi on anterior se desprende la siguiente pregunta: que propiedad tiene el conjunto A del
problema 25, que ademas de ser infinito, permite que la distancia entre cualesquiera dos de sus elementos
sea mayor o igual que una cierta cantidad positiva fija? Pues una propiedad del conjunto A que hasta ahora
no hemos observado es que, sin importar que grande se elija un n umero M > 0, siempre podemos encontrar
un x A tal que k xk M . Mas aun, observese que dado un n umero M > 0, sin importar lo grande que
este sea, la norma de casi todos los elementos del conjunto A (es decir, todos salvo un n umero finito de ellos)
rebasa a este n umero M .
Cuando un conjunto A tiene la propiedad de que, sin importar que grande se elija un n umero M > 0,
siempre podemos encontrar un x A tal que k xk M , se dice que este conjunto es no acotado. O dicho de
manera positiva, cuando sucede lo contrario, decimos que el conjunto est a acotado.
Este concepto resultara ser muy importante para la pregunta que nos hicimos con respecto a la proposicion
recproca del corolario 1.31, y por esta raz
on lo dejamos plasmado en la siguiente
on 1.32 Sea A Rn . Decimos que A es un conjunto acotado (o simplemente que est

Definici a acotado) si
existe M > 0 tal que k
xk M para todo x
A.
En terminos geometricos, decir que un conjunto A est a acotado significa que este queda contenido en
alguna bola (o vecindad) con centro en el origen (observe que, de la definicion anterior, se desprende que
A BM+1 (0)).
Como seguramente el lector ya habr a sospechado, para que podamos asegurar que un conjunto infinito
A tiene al menos un punto de acumulaci on, sera suficiente con que este tambien sea acotado. Este es un
J. P
aez 26
resultado tan importante, que hasta tiene nombre: teorema de Bolzano-Weierstrass5. La prueba de este
teorema requiere que contemos con la versi on generalizada (a Rn ) de un conocido teorema de los n umeros
reales: el teorema de los intervalos anidados.
Por esta raz
on, primero definiremos todo lo necesario para formular dicha generalizacion, la probaremos,
y finalmente la usaremos para demostrar el teorema de Bolzano-Weierstrass.
Lo primero que haremos sera generalizar el concepto de intervalo cerrado, de la siguiente manera.
on 1.33 Dados a1 , . . . , an , b1 , . . . , bn R tales que ai bi para i = 1, . . . , n, decimos que el conjunto

Definici
R = [a1 , b1 ] [an , bn ] = {(x1 , . . . , xn ) Rn | ai xi bi , i {1, . . . , n}}
es un rect
angulo cerrado. Asimismo, definimos la diagonal de R, que denotamos por diag(R), como
diag(R) := k(b1 , . . . , bn ) (a1 , . . . , an )k
Con relaci
on a este tipo de conjuntos, estableceremos sus propiedades mas elementales en el siguiente
Lema 1.34 Sea R = [a1 , b1 ] [an , bn ] = {(x1 , . . . , xn ) Rn | ai xi bi , i = 1, . . . , n} un rect

angulo
cerrado. Se satisfacen las siguientes afirmaciones:
1. R es un conjunto cerrado
, y R entonces k
2. si x x yk diag(R)
R y diag(R) < r entonces R Br (

3. si x x)
4. si R = [a1 , b1 ] [an , bn ] se tiene que: R R si y s

olo si [ai , bi ] [ai , bi ] para toda i {1, . . . , n}
Como el lector estar a de acuerdo, todas estas propiedades son muy sencillas de probar, raz on por la cual
se deja que el las haga.
Con base en la definicion y lema anteriores, estamos en condiciones de formular y probar lo que llamaremos
el teorema de los rectangulos anidados, de la siguiente manera.
Teorema 1.35 (de los rect angulos anidados) Si {Rk } es una sucesi
on anidada de rect
angulos cerrados
(es decir, Rk+1 Rk para toda k N) entonces

\
Rk 6=
k=1
Si adem
as se tiene que limk diag(Rk ) = 0 entonces

\
Rk = {
x0 }
k=1
un x0 Rn .
para alg
5 El teorema de Bolzano-Weierstrass lleva el nombre de los matem aticos Bernard Bolzano (Bernard Placidus Johann Gonzal
Nepomuk Bolzano (Praga, Bohemia (actual Rep ublica Checa), 5 de octubre de 1781 - dem, 18 de diciembre de 1848), conocido
como Bernard Bolzano fue un matem atico, l
ogico, fil
osofo y te
ologo bohemio que escribi o en alem
an y que realiz
o importantes
contribuciones a las matem aticas y a la Teora del conocimiento), y Karl Weierstrass (Karl Theodor Wilhelm Weierstra
(escrito Weierstrass cuando no est a disponible el caracter ) (Ostenfelde, 31 de octubre de 1815 - Berln, 19 de febrero
de 1897) matem atico aleman al que se suele citar como el padre del an alisis moderno). En realidad, este teorema fue
demostrado por primera vez en 1817 por Bolzano, como un lema en la demostraci on del teorema de valor intermedio. Unos
cincuenta a nos mas tarde, el resultado fue identificado como significativo por derecho propio, y demostrado una vez m as por
Weierstrass. Desde entonces se ha convertido en un teorema fundamental del an alisis. (fuente: Wikipedia).
27 J. P
aez
Demostraci on. Esta prueba estar

a basada en el correspodiente teorema de los intervalos anidados. Supong-
amos que para cada k N se tiene que
h i h i
(k) (k)
Rk = a1 , b1 a(k)
n , bn
(k)
Por el inciso 4 del lema 1.34 sabemos que, para cada i {1, . . . , n}, la sucesion
n h io
(i) (k) (k)
Ik = ai , bi
T (i)
es una sucesion de intervalos (cerrados) anidados, de tal forma que k=1 Ik 6= . Por tanto, si para cada
T (i) T
i {1, . . . , n} elegimos xi k=1 Ik entonces se verifica que x = (x1 , . . . , xn ) k=1 Rk .
En efecto, para cada i {1, . . . , n} se tiene que
h i
(i) (k) (k)
xi Ik = ai , bi
de tal forma que h i h i

(k) (k)
= (x1 , . . . , xn ) a1 , b1 a(k)
x n , b (k)
n = Rk
T T
y como esto es valido para cada k N entonces x k=1 Rk T , es decir que k=1 Rk 6= .

Supongamos ahora que limk diag(Rk ) = 0 y que x, y k=1 Rk . Por el inciso 2 del lema 1.34 sabemos
que
0 k
x yk diag(Rk )
de tal forma que, si en las desigualdades anteriores tomamos el lmite cuando k , obtenemos que
0 k
x yk 0
T
es decir, que kx yk = 0 y por tanto que x = y. Esto prueba que todos los elementos de k=1 Rk son
iguales, lo que significa que dicho conjunto consta de un solo punto.
Ya casi todo est

a listo para poder formular y probar el teorema de Bolzano-Weierstrass y solo resta
mencionar la forma en que, en dicha demostracion, subdividiremos a un rectangulo R = [a1 , b1 ] [an , bn ].
Simplemente partimos a cada intervalo coordenado [ai , bi ] en los subintervalos [ai , (ai +bi )/2] y [(ai +bi )/2, bi ]
y construiremos todos los rectangulos que tengan como i-esimo intervalo coordenado a alguno de estos
subintervalos, para i {1, . . . , n}. Con este procedimiento obtenemos 2n rectangulos cerrados Rk cuyas
S2n
propiedades, que por ahora nos interesa destacar, son las siguientes: Rk R, R = k=1 Rk y diag(Rk ) =
diag(R)/2 (propiedades que el lector podra probar muy facilmente).
Una vez hecho lo anterior formularemos el teorema de Bolzano-Weierstrass, no sin antes mencionar que
el procedimiento que usaremos en su demostracion hasta tiene un nombre: la cacera del le on.
Teorema 1.36 (de Bolzano-Weierstrass) Si A Rn es un conjunto infinito y acotado entonces A tiene

on (es decir, A =
al menos un punto de acumulaci 6 ).
Demostraci on. Sea M > 0 tal que k xk M para toda x A. Si hacemos R = [M, M ] [M, M ]
tenemos entonces que A R. Ahora subdividimos a R en la forma que mencionamos antes.
Dado que A R, que R es la uni on de todos los rectangulos inducidos por la subdivisi
on que hicimos,
y que A es infinito, se debe tener entonces que en alguno de estos rectangulos inducidos, al que llamaremos
R1 , debe de haber una infinidad de puntos de A, es decir, R1 R es un rectangulo cerrado tal que A R1
es un conjunto infinito y
diag(R1 ) = diag(R)/2 = (2 2M )/2 = 2M
Ahora subdividimos a R1 en la forma que mencionamos antes. Dado que A R1 R1 , que R1 es la
on que le hicimos, y que A R1 es infinito, entonces
union de todos los rectangulos inducidos por la subdivisi
en alguno de estos rectangulos inducidos, al que llamaremos R2 , debe de haber una infinidad de puntos de
A R1 , es decir, R2 R1 es un rectangulo cerrado tal que
(A R1 ) R2 = A (R1 R2 ) = A R2
J. P
aez 28
es un conjunto infinito y

diag(R2 ) = diag(R1 )/2 = diag(R)/22 = (2 2M )/22 = 2M/2
Como el lector ya habra notado, este es un procedimiento que podemos seguir indefinidamente, es decir,
es un proceso inductivo. En efecto, si para una cierta k N ya hemos construido un rectangulo cerrado Rk
con las siguientes propiedades:
1. Rk Rk1 R1 R
2. A Rk es un conjunto infinito, y

2M
3. diag(Rk ) = 2k1
entonces podemos construir un rectangulo cerrado Rk+1 , que tenga las propiedades equivalentes. Como? De
la siguiente manera: subdividimos a Rk en la forma en que hemos venido haciendolo. Dado que ARk Rk ,
que Rk es la uni on de todos los rectangulos inducidos por la subdivisi on que le hicimos, y que A Rk es
infinito, en alguno de los rectangulos inducidos por esta subdivisi
on, al que llamaremos Rk+1 , debe de haber
una infinidad de puntos de A Rk , es decir, Rk+1 sera un rectangulo cerrado que satisface las propiedades
deseadas:
1. Rk+1 Rk ,
2. (A Rk ) Rk+1 = A (Rk Rk+1 ) = A Rk+1 es un conjunto infinito, y

3. diag(Rk+1 ) = diag(Rk )/2 = ( 2M/2k1 )/2 = 2M/2k
(ver figura 1.14).
M
R
R2
R3
R1
M M
Figura 1.14: La cacera del le

on
Con base en este procedimiento obtenemos entonces una sucesion (infinita) de rectangulos cerrados {Rk }
que satisfacen las propiedades que enlistamos anteriormente. De esta forma, por el teorema 1.35 (de los
rectangulos anidados), sabemos que

\
Rk = {
x0 }
k=1
29 J. P
aez
un x0 Rn .
para alg
Aseguramos que x 0 es un punto de acumulaci
on de A. Sea r > 0; como
lim diag(Rk ) = 0
k
existe N N tal que si k N entonces 0 diag(Rk ) < r. Por otra parte, como x 0 Rk para toda k N
entonces por el inciso 3 del lema 1.34 se tiene que Rk Br (
x0 ) de tal forma que A Rk A Br ( x0 ), y
como A Rk es un conjunto infinito, podemos concluir que (Br ( x0 }) A 6= y por lo tanto que x0
x0 ) \ {
es un punto de acumulaci on de A.
1.5.4 Conjuntos conexos

Concluiremos esta secci on (y este captulo!) mostrando de que forma los conceptos que hasta ahora hemos
desarrollado, se pueden usar para definir de manera muy precisa un hecho geometrico que es intuitivamente
muy claro: cu ando un conjunto est a formado de una sola pieza? Es decir, cu ando un conjunto no est a
roto?
En realidad lo que haremos sera establecer cuando se puede decir que un conjunto est a roto o separado
(y consecuentemente los conjuntos que son de una sola pieza (o conexos, como suele llam arseles) seran los
que no estan rotos o separados).
Intuitivamente, un conjunto A Rn estar a roto si se puede poner como la union de otros dos conjuntos
B y C, para los cuales hay alguna forma de decir que est an separados.
Tal vez la primera idea que se nos venga a la cabeza para decir que dos conjuntos est an separados, es que
simplemente sean ajenos (y claro, diferentes del vaco!). Desafortunadamente, aun y cuando dos conjuntos
sean ajenos, estos pueden embonar (o empatar) muy bien, de tal forma que al unirlos formen un conjunto
que no este roto.
Tal es el caso de los siguientes conjuntos: B = [0, 1/2] [0, 1] y C = (1/2, 1] [0, 1] (ver figura 1.15) los
cuales, al unirlos, nos da el conjunto A = [0, 1][0, 1] el cual no es el tipo de conjunto del que se pudiera decir
que esta roto. De hecho, cualquier conjunto A (este o no este roto, y con mas de un punto) podemos
expresarlo como la uni on de dos conjuntos ajenos; bastara con tomar un subconjunto propio B (y no vaco)
de A ( 6= B A) y C = A \ B para que el conjunto A quedara expresado de esta forma.
B C
1
1
2 1
Figura 1.15: El conjunto A = [0, 1] [0, 1], que no esta roto, es la uni
on de los conjuntos ajenos B =
[0, 1/2] [0, 1] y C = (1/2, 1] [0, 1].
Por el ejemplo (y la observacion) anterior concluimos que pedir que dos conjuntos solo sean ajenos, no
es una buena forma de decir que estos est an separados. Pero no hay que desanimarse, pues la clave de
nuestro problema se encuentra en la segunda clasificacion que hicimos de los puntos de Rn con respecto de
un conjunto A.
En efecto, como se recordara, intuitivamente los puntos de acumulaci
on de un conjunto se pueden inter-
pretar como los puntos que est
an pegados a A, de tal forma que si un conjunto no solo es ajeno a A sino
J. P
aez 30
que tampoco tiene puntos que est an pegados a A (es decir, es ajeno a A ), entonces s que podremos decir
que dicho conjunto estar a separado de A. En resumen, si B y C son dos conjuntos tales que B C = y
ademas B C = entonces podemos decir que B est a separado de C; y recprocamente, si tambien sucede
que B C = entonces podemos decir que ambos est an separados uno del otro.
Con base en la discusi on anterior definiremos lo que significa que dos conjuntos esten separados. Como
seguramente el lector ya sospecha, en esta definicion aparecer a la union de un conjunto y su correspondiente
conjunto de puntos de acumulaci on, es decir A A . Por esta razon, adelantaremos que el lector probara en
el inciso (d) del ejercicio 27 que esta union es igual a la cerradura de A, es decir que A A = A, y que es
como nos referiremos a ella en la siguiente
Definici on 1.37 Sean B, C Rn . Decimos que B y C est an separados si B C = = B C.
Si bien es cierto que en la discusi on previa a esta definicion hicimos notar que el hecho de que dos
conjuntos sean ajenos no es suficiente para que estuvieran separados, si los conjuntos son de cierto tipo,
entonces el que sean ajenos si es suficiente para que esten separados. Estos casos los dejaremos expresados
en la siguiente proposicion, cuya prueba quedara a cargo del lector.
on 1.38 Sean B, C Rn .
Proposici
1. Si B y C son abiertos, entonces B y C est
an separados si y s
olo si B y C son ajenos (es decir,
B C = )
2. Si B y C son cerrados, entonces B y C est
an separados si y s
olo si B y C son ajenos (es decir,
B C = )
Como habamos adelantado, una vez que contamos con este concepto es muy sencillo definir lo que
significa que un conjunto este roto, o que sea disconexo, que es el termino que realmente se usa.
Definicion 1.39 Sea A Rn . Decimos que A es un conjunto disconexo si existen B, C Rn , no vacos,
tales que:
1. A = B C, y
an separados, es decir B C = = B
2. B y C est C
Y como tambien ya habamos mencionado, un conjunto sera conexo si no es disconexo (o dicho con toda
propiedad, si es no disconexo), lo que formalizamos en la (casi) u
ltima definicion de este captulo.
on 1.40 Sea A Rn . Decimos que A es un conjunto conexo si A es no disconexo.
Definici
La definicion anterior amerita un comentario importante: el concepto de conexidad se define con base en
una negacion. Este es una caracterstica importante de resaltar puesto que este tipo de conceptos son un
poco mas difciles de manejar. Especficamente, si se quisiera desmostrar directamente que un conjunto A
es conexo, habra que demostrar que no existen B, C Rn , no vacos y separados, tales que A = B C.
Y como seguramente el lector a estas alturas ya habr a aprendido, demostrar que algo no existe siempre
suele ser mas difcil y casi siempre lo mas practico es suponer que ese algo si existe, para despues tratar de
llegar a una contradiccion, es decir, proceder por contradiccion.
Por esta misma raz on, encontrar condiciones suficientes y/o necesarias para que un conjunto sea conexo
adquiere particular importancia, y eso es justo lo que vamos a hacer en lo que resta de este captulo.
Y para iniciar esta tarea, empezaremos por establecer una condicion necesaria y suficiente para que un
conjunto abierto sea conexo, para lo cual nos sera u til dar la siguiente
Definici on 1.41 Sean x, y Rn . Definimos el segmento (de recta) que une a x
con y, y que denotamos por
[
x, y], como al conjunto dado por
x, y] := {
[ yx
x + t( ) = (1 t) y Rn | 0 t 1}
x + t
El primer resultado que probaremos, y que nos sera muy util en todo lo relacionado con la conexidad, es
geometricamente muy claro: si dos conjuntos B, C Rn est an separados, y tomamos un punto x B y
otro punto y C, es de esperarse que el segmento que une a estos puntos no este contenido en la union de
x, y] * B C. Este hecho lo probaremos en el siguiente
B y C, es decir que [
31 J. P
aez
Lema 1.42 Sean B, C Rn tales que x B y y C. Si B y C est an separados entonces el segmento que
une a x y y no est
a contenido en la uni x, y] * B C.
on de B y C, es decir que [
Demostraci
on. Construimos el siguiente conjunto:
S = {s [0, 1] | x yx
+ t( c para toda t [0, s]}
) (C)
Observe que este conjunto es no vaco, pues tomando s = 0 en la definicion del conjunto S obtenemos el
punto x c , en donde esta u
que pertenece a B (C) ltima contencion se cumple ya que B C = , lo cual a
su vez es cierto puesto que B y C est an separados. Por otra parte, S esta contenido en el intervalo [0, 1] y
por lo tanto est
a acotado superiormente por el 1 (e inferiormente por el 0, lo que por ahora no resulta muy
importante).
De esta forma, por la propiedad del supremo de los n umeros reales, existe R tal que = sup(S).
Dado que S [0, 1] se tiene que [0, 1] de modo que si x0 = x + (yx ) entonces x0 [
x, y]. Con
respecto a este numero es importante hacer notar que se satisface la siguiente contencion:
[0, ) S (1.11)
ya que si 0 s < , de la definicion de supremo sabemos que existe s S tal que s < s < de modo que,
por la forma en que est a definido el conjunto S, se tiene que x yx
+ t( c para toda t [0, s ] y por
) (C)
lo tanto para toda t [0, s] [0, s ], por lo que se concluye que s S.
Otro hecho que podemos asegurar es que x0 / B. En efecto, si x0 estuviera en B, dado que B (C) c
(por la raz
on que ya explicamos) entonces < 1 y x c , y como C es un conjunto cerrado (inciso 2 de
0 (C)
c es un conjunto abierto de modo que existira r > 0 tal que Br (
la proposicion 1.26) entonces (C) x0 ) (C) c.
Notese ahora que, si
1 r
r = min ,
2 x yk
2k
entonces para toda t + r se tiene que
k
x0 ( y x))k = k(
x + t( y x)) (
x + ( y x))k
x + t(
= k( t)(
yx ))k
= (t )kx yk

r k
x yk
r

2
<r
y por lo tanto x + t( yx ) Br ( c . De esta contencion, y por la contencion 1.11, concluimos que

x0 ) (C)
x yx
+ t(
) (C) para toda t [0, + r ] [0, 1] y por lo tanto que + r S, lo cual contradice el hecho
c
de que = sup(S).
0
Si x / C ya habremos terminado pues entonces x 0 / B C. Pero s puede suceder que x0 C (podra
dar el lector un ejemplo en el que esto fuera cierto?). En este caso mostraremos que podemos obtener otro
punto x0 [ 0
x, y] tal que x / B C, de la siguiente forma: si x 0 C, dado que B C = (porque B y
C estan separados) entonces 0 < y x c
0 (B) , y como este es un conjunto abierto, existe r > 0 tal que
c . Sea
x0 ) (B)
Br (
r
t = min ,
2 2k x yk
Entonces, como 0 < t < 1, si tomamos x 0 = x
+ ( t )(
yx
) [
x, y] tenemos, por la contencion
, de donde concluimos que x0
1.11, que t S y por lo tanto que x0 (C)c
/ C. Por otra parte, como
k 0 k = k(
x0 x yx
x + ( x + ( t )(
)) (( yx
)))k
= kt (
y x)k
= t k
x yk
J. P
aez 32
r

2
<r
0 Br (
se tiene que x c de donde ahora concluimos que x
x0 ) (B) 0 0
/ B. Es decir, x / B C.
Con base en este lema vamos a obtener resultados muy importantes, y con el primero de ellos lograremos
probar que una clase muy grande y muy importante de conjuntos, son conexos. Nos referimos a los llamados
conjuntos convexos, los cuales definimos a continuacion.
Definicion 1.43 Sea A Rn . Decimos que A es un conjunto convexo si para cada par de puntos x
, y A
x, y] A.
se tiene que [
Antes de probar el resultado que anunciamos, mostraremos algunos ejemplos de conjuntos convexos.
Ejemplo 1.44 Los siguientes conjuntos, son ejemplos de conjuntos convexos:
1. El espacio total Rn . Esto es un hecho inmediato, puesto que estamos hablando de el conjunto que
constituye el universo sobre el cual se est , y Rn , por supuesto
a trabajando. De esta forma, si x
x, y] Rn .
que [
2. Para todo x, y Rn el segmento que los une [ x, y]. Observe que, si tomamos x + s( ) y x + s (
y x y x
),
con s, s [0, 1], es decir x
+ s( ), x + s (
yx yx ) [
x, y], entonces se tiene que
( yx
x + s( x + s (
)) + t( y x) ( yx
x + s( + (s + t(s s))(
))) = x yx
)
+ ((1 t)s + ts )(
=x y x)
y como (1 t)s + ts [0, 1] para toda t [0, 1] concluimos que [ yx

x + s( + s (
), x yx
)] [
x, y], es
decir que [
x, y] es convexo.
0 Rn y de cualquier radio r > 0 (Br (
3. Cualquier bola (o vecindad) con centro en cualquier punto x x0 )).
En efecto, si x, y Br (
x0 ) y t [0, 1] se tiene que
k
x0 ( yx
x + t( ))k = k( x0 x0 )) (
x0 + t( yx
x + t( ))k
= k(t
x0 + (1 t)x0 ) (t
y + (1 t)
x)k
= kt(
x0 y) + (1 t)(x0 x)k
t k
x0 yk + (1 t) k
x0 x
k
< tr + (1 t)r
=r
x, y] Br (
lo que prueba que [ x0 ).
4. Cualquier rect angulo cerrado R = [a1 , b1 ] [an , bn ]. Sean x
= (x1 , . . . , xn ), y = (y1 , . . . , yn ) R y
sea t [0, 1]. Como ai xi , yi bi y t [0, 1] entonces tai tyi tbi y (1t)ai (1t)xi (1t)bi
de tal forma que
ai = tai + (1 t)ai tyi + (1 t)xi tbi + (1 t)bi = bi
es decir, tenemos que
ai tyi + (1 t)xi = xi + t(yi xi ) bi
para cada i {1, . . . , n}, y por lo tanto que x yx
+ t( ) = (x1 + t(y1 x1 ), . . . , xn + t(yn xn )) R
para toda t [0, 1], lo que significa que [x, y] R.
El resultado que probaremos a continuacion, tendra como un corolario el importante hecho de que todos
los conjuntos mencionados en el ejemplo anterior, seran conjuntos conexos.
on 1.45 Sea A Rn . Si A es convexo entonces A es conexo.

Proposici
33 J. P
aez
Demostraci on. Supongamos que A no es conexo. Entonces existen B, C Rn no vacos y separados, tales
que A = B C. Dado que B y C son no vacos, elegimos x B y y C. Por el lema 1.42 tenemos entonces
x, y] * B C = A lo cual contradice el hecho de que A es convexo. Por lo tanto, A es conexo.
que [
Una pregunta que siempre nos tenemos que hacer es si el recproco de una proposicion es cierto. En el
caso de la proposicion anterior la respuesta es negativa pero para poder dar un ejemplo de este hecho, sera
necesario ampliar la familia de conjuntos para los cuales hayamos probado que realmente son conexos. Y
justo eso es lo que haremos en la siguiente proposicion que probaremos, la cual nos proporciona una condicion
necesaria y suficiente para que un conjunto abierto sea conexo.
Para facilitar la redacci
on de su prueba, introducimos el siguiente concepto: dados x 1 , . . . , xk Rn
, y, x
diremos que el conjunto [ 1 ] [
x, x x1 , x2 ] [
xk , y] es una poligonal que une a x
con y (o que empieza en
x
y termina en y, o que tiene extremos x y y).
Proposici on 1.46 Sea A Rn abierto y no vaco. A es conexo si y s , y A,

olo si para cada par de puntos x
existen x k A tales que [
1 , . . . , x 1 ] [
x, x 2 ] [
x1 , x xk , y] A. Es decir, A es conexo si y solo si para
cada par de puntos x , y A existe una poligonal contenida en A que une a x con y.
Demostraci on. Supongamos que A es conexo y sea x0 A un punto fijo. N

otese que nuestra demostracion
se reduce a demostrar que para cualquier x A, siempre existe una poligonal que une a x 0 con x (por
que?). Para lograr esto, definimos los siguientes conjuntos:
U = {
x A | existe una poligonal contenida en A que une a x0 con x
}
y
V = {
x A | no existe una poligonal contenida en A que une a x0 con x
}
Observe que nuestro objetivo es probar que U = A.
Como se prueba f acilmente, los conjuntos U y V tienen las siguientes propiedades:
1. A = U V
2. U V =
3. U 6= (pues x
0 U )
Lo que ahora vamos a demostrar es que U y V son conjuntos abiertos. En efecto, si x U A, como A
es un conjunto abierto sabemos que existe r > 0 tal que Br ( x) A; aseguramos que Br ( x) U ya que si y
Br (x) sabemos que [ x, y] Br (x) A (las bolas son convexas) de tal forma que si [ x0 , x1 ][ 2 ] [
x1 , x xk , x
]
es una poligonal contenida en A que une a x0 con x, entonces [ 1 ] [
x0 , x x1 , x 2 ] [
xk , x] [
x, y] es una
poligonal contenida en A que une a x 0 con y, de donde tenemos que y U , es decir, Br ( x) U y por lo
tanto U es un conjunto abierto.
Analogamente, si x V A, como A es un conjunto abierto sabemos que existe r > 0 tal que Br ( x) A;
aseguramos que Br ( x) V pues de lo contrario, existira y Br ( x) A tal que y / V y por tanto se tendra
que y U en cuyo caso existira [ 1 ] [
x0 , x x1 , x2 ] [xk , y] una poligonal contenida en A que une a x0
con y, y como [ ] Br (
y, x x) A entonces [ x0 , x1 ] [
x1 , x2 ] [
xk , y] [
y , x] sera una poligonal contenida
en A que unira a x 0 con x, contradiciendo el hecho de que x V . As pues, se debe tener que Br ( x) V
con lo cual concluimos que V tambien es abierto.
Resumiendo, tenemos que A es la uni on de dos conjuntos abiertos y ajenos U y V , que por la proposicion
1.38 estan separados. Por estas razones, si ademas tambien se cumpliera que V 6= , obtendramos que A no
es conexo, lo que sera una contradiccion. De esta forma se debe tener que V = y por tanto que A = U ,
que es justo lo que se quera probar.
La condicion de suficiencia para la conexidad es una consecuencia inmediata del lema 1.42. Si A no fuera
conexo sabemos que existen B y C conjuntos no vaci os y separados tales que A = B C. De esta forma,
si elegimos x B y y C, y tomamos [ x, x1 ] [ 2 ] [
x1 , x xk , y] una poligonal que une a estos puntos,
entonces aseguramos que [ 1 ] [
x, x x1 , x2 ] [xk , y] * A.
En efecto, notese que si x i
/ A para alguna i {1, . . . , k} entonces [ x, x1 ] [x1 , x xk , y] * A.
2 ] [
Si xi A para toda i {1, . . . , k}, llamando x 0 = x y x k+1 = y podemos asegurar que existe i {0, . . . , k}
J. P
aez 34
i B y xi+1 C de tal forma que, por el lema 1.42, [

tal que x i+1 ] * B C = A. Resumiendo, si A no
xi , x
fuera conexo, no existira una poligonal contenida en A que una a x y y, lo que contradice nuestra hipotesis.
Volviendo al recproco de la proposicion 1.45, aun y cuando geometricamente es muy sencillo mostrar un
ejemplo de un conjunto que sea conexo pero no convexo (ver figura 1.16), con base en el resultado anterior
podemos probar que el siguiente ejemplo ilustra el mismo hecho.
1
b b
x
y
Figura 1.16: El conjunto A es conexo pero no es convexo ya que el segmento [

x, y] no esta contenido en A.
Ejemplo 1.47 Sea

A = R2 \ {(x, y) R2 | x 0 y y = 0}
El lector probara en el problema 16 que este conjunto es abierto. Aqu s olo mostraremos que para cualquier
= (x, y) A, el segmento que lo une con el punto x0 = (1, 0) A est
x a totalmente contenido en A (ver
figura 1.17), lo que mostrara que este conjunto satisface la condici
on de suficiencia de la proposici
on anterior
y por lo tanto sera conexo.
Dado (x, y) A, distinguimos tres casos:
x, x0 ] = [(x, 0), (1, 0)] est

1. y = 0 y x > 0. En este caso el segmento [ a dado por
{(x + t(1 x), 0) = ((1 t)x + t, 0) R2 | t [0, 1]}
y como (1 t)x + t > 0 para toda t [0, 1], se tiene que est
a contenido en A.
2. y > 0 y x R. En este caso el segmento [
x, x
0 ] = [(x, y), (1, 0)] est
a dado por
{(x + t(1 x), y ty) = ((1 t)x + t, (1 t)y) R2 | t [0, 1]}
de tal forma que, como (1 t)y > 0 para toda t [0, 1) y para t = 1 obtenemos el punto (1, 0) = x
0 ,
entonces en esta caso tambien dicho segmento est
a contenido en A.
3. y < 0 y x R. En este caso el segmento [ x, x
0 ] = [(x, y), (1, 0)] est
a dado por el mismo conjunto del
inciso anterior, solo que ahora (1 t)y < 0 para toda t [0, 1) y para t = 1 obtenemos otra vez el
punto (1, 0) = x
0 , de modo que nuevamente el segmento estar a contenido en A.
Ahora s olo nos resta probar que A no es convexo. En efecto, si tomamos los puntos x = (1, 1) y y = (1, 1)
se tiene que x, y A y sin embargo el punto (1, 0) = x + (1/2)(yx) [
x, y] no pertenece a A, es decir,
x, y] " A.
[
35 J. P
aez
b
1
x A
1 1
y
b
1
Figura 1.17: El conjunto A = R2 \ {(x, y) R2 | x 0 y y = 0} es conexo pero no es convexo ya que el

segmento [
x, y] no esta contenido en A
Concluimos esta secci on con un resultado que nos permite caracterizar a los conjuntos disconexos (y por
tanto a los conexos) en terminos de conjuntos abiertos. Aun y cuando no es la caracterizacion mas conocida
en terminos de este tipo de conjuntos (la cual podremos probar hasta el captulo 2), este caso tambien
resultara ser de gran utilidad.
on 1.48 Sea A Rn . A es disconexo si y s

Proposici olo si existen U, V Rn conjuntos abiertos tales que:
1. A U V ,
2. A U 6= y A V 6= , y
3. A U V = .
Demostracion. Si A es disconexo, sabemos que existen B, C Rn no vacos y separados tales que

A = B C. Sea U = Rn \ C y V = Rn \ B;
mostraremos que U y V satisfacen las propiedades requeridas.
Como B y C est C = = B C de tal forma que C Rn \ B
an separados sabemos que B =V y
n
B R \ C = U y de aqu que
A= B C
(Rn \ B)
(Rn \ C)
=U V
Por otra parte

A U = A (Rn \ C)
AB
=B
6=
y analogamente

A V = A (Rn \ B)
AC
=C
J. P
aez 36
1.6. Otros sistemas coordenados Captulo 1. El conjunto Rn
6=
Finalmente
(Rn \ C)
A U V = A (Rn \ B)
n
= A (R \ (B C))
C))
= (B C) (Rn \ (B
=
Para probar la implicacion recproca, tomamos B = A U y C = A V ; por los incisos 1 y 2 de la

hipotesis tenemos que B 6= , C 6= y que A = B C, de modo que solo nos restara mostrar que estos
conjuntos estan separados.
Supongamos que
B C = (A U ) (A V ) 6=
(A U ) (A V ) V , como V es abierto existe r > 0 tal que Br (
Si x x) V . Por otra parte, como
(A U ) por el inciso (a) del problema 27 sabemos que
x
6= Br (
x) (A U ) V (A U ) = A U V
lo que contradice el inciso 3 de la hip C = (A U ) (A V ) = . Analogamente se

otesis. Por tanto B
prueba que C B = (A V ) (A U ) = .
Como mencionamos anteriormente, como un corolario inmediato tenemos la siguiente caracterizacion de

los conjuntos conexos.
Corolario 1.49 Sea A Rn . A es conexo si y s

olo si no existen U, V Rn conjuntos abiertos tales que:
1. A U V ,
2. A U 6= y A V 6= , y
3. A U V = .
1.6 Otros sistemas coordenados

Al inicio de este captulo describimos situaciones las cuales nos llevaron a considerar funciones que depen-
den de la posicion de un objeto, o que asignan una flecha. En todos estos ejemplos, usamos el hecho de
que una posicion o una flecha se puede describir si se establece un sistema coordenado cartesiano, en cuyo
caso la funcion involucrada se tendra que escribir en terminos de estas coordenadas.
Hay situaciones en las que las funciones que las describen se pueden expresar de manera mas sencilla
usando otras cantidades que caracterizan a una posicion o a una flecha (como la distancia a un punto
fijo o un angulo).
En el caso particular de los puntos y/o flechas (con un punto inicial fijo) del plano o del espacio, estas
situaciones se presentan con mas frecuencia y por lo mismo existen otras formas de representar estos
objetos por medio de otro tipo de parejas o ternas ordenadas de n umeros reales. Aun y cuando no siempre
es necesario, estas otras formas de representacion se realizan con base en un sistema cartesiano establecido
previamente, que es justo como lo haremos en este texto.
1.6.1 Coordenadas polares

Para el caso del plano, si x representa un punto o una flecha, ademas de asignarle sus coordenadas (x0 , y0 )
en un sistema cartesiano dado, podemos asignarle otra pareja de n umeros (, ), a la que llamaremos unas
coordenadas polares de x , en donde es igual a la distancia que hay de x al origen (es decir, la magnitud o
norma de x), y es el
angulo (dirigido) formado por la parte positiva del eje X y la semirecta que parte del
origen y pasa por x (ver figura 1.18).
37 J. P
aez
Captulo 1. El conjunto Rn 1.6. Otros sistemas coordenados
x
b
Figura 1.18: Obtenci

on de coordenadas polares de un punto (o una flecha) x
del plano.
En analoga con la interpretacion geometrica de las coordenadas cartesianas, la cual consiste en ver a
x
como el unico punto en el que se intersectan las rectas x = x0 (paralela al eje Y , y que es justo todo el
conjunto de puntos del plano cuya coordenada cartesiana x es igual a x0 ) y y = y0 (paralela al eje X, y que
es justo todo el conjunto de puntos del plano cuya coordenada cartesiana y es igual a y0 ), sus coordenadas
polares (0 , 0 ) nos proporcionan el radio (0 ) de la u
nica circunferencia (que es justo todo el conjunto de
puntos del plano cuya coordenada polar es igual a la constante 0 ), y el angulo (0 ) de la u
nica semirecta
que parte del origen (que es justo todo el conjunto de puntos del plano cuya coordenada polar es igual a
la constante 0 ), que tienen como interseccion al punto (o vector) x (ver figura 1.19).
x
b
0 0
X
Figura 1.19: Las coordenadas polares (0 , 0 ) nos proporcionan el radio (0 ) de la unica circunferencia, y el angulo
(0 ) de la unica semirecta que parte del origen, que tienen como intersecci on al punto (o vector) x .
Otro aspecto importante que hay que hacer notar con relacion a estas nuevas coordenadases es que para
asignarlas, no es necesario recurrir a todas las parejas ordenadas de R2 ; es decir, basta con tomar las parejas
(, ) tales que 0 y 0 < 2 para que todo punto (o flecha) del plano tenga asociada una de ellas.
De hecho, salvo por el origen 0 (cuyas coordenadas polares pueden estar dadas por cualquier pareja
de la forma (0, ), con cualquier n umero real), la asignacion de unas coordenadas polares establece una
biyeccion entre un plano menos un punto (aquel que se haya elegido como el origen) y el subconjunto
(0, ) [0, 2) R2 . mas aun, n otese que el angulo siempre se puede elegir en cualquier intervalo de la
forma 0 < 0 + 2, en donde 0 es un angulo fijo.
De esta forma, un mismo punto (o vector) x tiene muchas coordenadas polares, raz on por la cual al inicio
de esta subseccion hablamos de unas coordenadas polares del punto x .
En reciprocidad con lo anterior, tambien es importante hacer notar que cualquier pareja (, ) R2
J. P
aez 38
(incluso con < 0) se puede interpretar como coordenadas polares de un punto (o vector) x del plano,
obteniendo (o construyendo) x de la siguiente manera: dada una pareja (, ) R2 , h agase una rotacion
del eje X por radianes, y sobre ese eje rotado, localice el n
umero ; este sera el punto x que le corresponda
a la pareja (, ) (ver figura 1.20).
Con base en lo anterior, n otese que podemos concluir que, si (, ) y ( , ) son coordenadas polares de
un mismo vector x del plano, entonces se debe cumplir que = y = + k para alguna k Z. mas
especficamente, se tiene que = si y solo si = + 2k para alguna k Z, y = si y solo si
= + (2k + 1) para alguna k Z.
x
b

b b
Figura 1.20: Cualquier pareja (, ) R2 (en este caso con < 0) se puede interpretar como coordenadas
polares de un punto (o vector) x
del plano, el cual se obtiene de la siguiente manera: hagase una rotaci on del eje
X por radianes, y sobre ese eje rotado, localice el numero ; este sera el punto x que le corresponda a la pareja
(, ).
Otra observaci on importante con relacion a las coordenadas polares, es que las operaciones de suma y
producto por un escalar que definimos para las parejas de R2 , ya no se corresponden con la suma y producto
por un escalar que definimos geometricamente para vectores (o flechas) del plano. Es decir, si (1 , 1 ) y
(2 , 2 ) son coordenadas polares de x 1 y x2 , respectivamente, entonces la pareja (1 + 2 , 1 + 2 ) no son
necesariamente coordenadas polares de x 1 + x 2 (en donde esta ultima suma de vectores es la que se obtiene
por medio de la ley del paralelogramo); y si R entonces la pareja (1 , 1 ) no son necesariamente
coordenadas polares de x1 . Sin duda un problema interesante consiste en encontrar coordenadas polares
para x1 + x2 y x1 en terminos de coordenadas polares de x 1 y x2 , y por lo mismo lo dejamos como un
problema para el lector.
Lo que si queremos mencionar aqu es la interpretaci on geometrica de ciertas operaciones aritmeticas
con coordenadas polares; especficamente, si (, ) son coordenadas polares de un vector x y h R entonces
(, + h) son coordenadas polares de un vector x h que se obtiene rotando h radianes a x; y ( + h, ) son
coordenadas polares de un vector x h que est
a en la misma direcci on que estax, solo modificando su magnitud
por una cierta cantidad h (y suponiendo que + h no tiene signo diferente a ; que sucede geometricamente
si y + h tienen signo diferente?) (ver figura 1.21).
Finalmente, y con base en las funciones trigonometricas, deducimos las ecuaciones que nos permiten
obtener, dadas cualesquiera coordenadas polares (, ) de un vector x , sus correspondientes coordenadas
cartesianas (x, y) (ambas consideradas sobre el mismo sistema coordenado cartesiano XY ). Estas ecuaciones
son las siguientes:
x = cos() (1.12)
y = sen()
39 J. P
aez
Y Y
( + h, ) (, + h)
x
h
h
x (, )
(, ) x
h x

X X
(a) (b)
Figura 1.21: Si un vector x

tiene coordenadas polares (, ), entonces el vector x
h de coordenadas polares (+h, )
esta en la misma direcci
on que x h de coordenadas polares
(si y + h tienen el mismo signo) (a), y el vector x
(, + h) se obtiene rotando h radianes el vector x (b).
(ver figura 1.22).
x
b

sen()

cos() X
Figura 1.22: Dadas cualesquiera coordenadas polares (, ) de un vector x

, sus correspondientes coordenadas
cartesianas son ( cos(), sen()).
Recprocamente, si conocemos las coordenadas cartesianas (x, y) de un vector x, podemos obtener unas
coordenadas polares de x de la siguiente forma: dado que representa la distancia de x al origen (es decir,
la norma de x), sabemos que
p
= x2 + y 2
(lo que tambien se puede confirmar a partir de las dos identidades anteriores).
Obtener una expresion para es un poco mas elaborado y hay que analizar algunos casos. Como ya
habamos mencionado, si x =
0, cualquier pareja de la forma (0, ) ( R) son coordenadas polares de x. Si
x = 0 y y > 0 (es decir que x
est
a en la parte positiva del eje Y ), bastara con tomar = /2 o en general

= + 2k
2
Y si x = 0 y y < 0 (es decir que x
est
a en la parte negativa del eje Y ), bastara con tomar = 3/2 o en
general
3
= + 2k
2
con k Z.
J. P
aez 40
Si x 6= 0, de las identidades 1.12 se tiene que

y sen()
=
x cos()
= tan()
de tal forma que si arctan es la rama de la funci

on inversa de la funci
on tangente que toma sus valores entre
/2 y /2 entonces, cuando se tenga x > 0, bastara con tomar = arctan(y/x) o en general
y
= arctan + 2k
x
con k Z; y si x < 0, bastara con tomar = arctan(y/x) + o en general
y
= arctan + (2k + 1)
x
con k Z.
1.6.2 Coordenadas cilndricas

Para el caso de puntos y/o flechas en el espacio, y nuevamente partiendo de un sistema cartesiano dado,
vamos a dar otra forma de asignarles ternas de n umeros que los representen, de la siguiente manera.
Si x es un punto o una flecha en el espacio cuyas coordenadas cartesianas (en el sistema XY Z dado)
son (x0 , y0 , z0 ), nos fijamos en el vector del plano XY que tiene coordenadas cartesianas (x0 , y0 ) (y que
geometricamente se obtiene de proyectar a x en el plano XY ). Si ahora la pareja (0 , 0 ) son unas
coordenadas polares del vector (x0 , y0 ), decimos entonces que la terna (0 , 0 , z0 ) son unas coordenadas
cilndricas del vector x (ver figura 1.23).
Z
b
b x
z0
b
Y
0
x0
b b
y0
X
Figura 1.23: Si la pareja (0 , 0 ) son unas coordenadas polares del vector (x0 , y0 ) del plano XY , decimos entonces
que la terna (0 , 0 , z0 ) son unas coordenadas cilndricas del vector x
.
Como en el caso de la coordenadas polares, geometricamente las coordenadas cilndricas nos proporcionan
el radio (0 ) del cilindro circular recto (paralelo al eje Z, y que es justo todo el conjunto de puntos del espacio
cuya coordenada cilndrica es igual a la constante 0 ); el angulo (0 ) (medido con respecto a la parte positiva
del eje X) del semiplano perpendicular al plano XY (y que es justo todo el conjunto de puntos del espacio
cuya coordenada cilndrica es igual a la constante 0 ) del semiplano perpendicular al plano XY ; y la altura
(z0 ) del plano paralelo al plano XY (que es justo todo el conjunto de puntos del espacio cuya coordenada
cilndrica z es igual a la constante z0 ), que tienen como interseccion u nicamente al punto (o vector) x (ver
figura 1.24).
41 J. P
aez
Figura 1.24: Las coordenadas cilndricas (0 , 0 , z0 ) de un punto x

nos proporcionan el radio 0 del cilindro
circular recto, el angulo 0 del semiplano perpendicular al eje X, y la altura z0 del plano paralelo al plano XY ,
que tienen como intersecci on
unicamente al punto x.
Nuevamente es importante hacer notar que para asociar unas coordenadas cilndricas a un vector x , no
es necesario recurrir a todas las ternas de R3 pues basta con que 0 , 0 < 2 y z R, es decir, a
todo vector en el espacio se le puede asignar unas coordenadas cilndricas de tal forma que estas esten en el
subconjunto [0, ) [0, 2) (, ) R3 , e incluso, de manera mas general, en un subconjunto de la
forma [0, ) [0 , 0 + 2) (, ) R3 , con 0 R, fijo.
No obstante lo anterior, y como en el caso de las coordenadas polares, cualquier terna (, , z) R3 se
puede interpretar como coordenadas cilndricas de un vector del espacio. Para hacer esto, basta con localizar
en el plano XY el vector que se le debe asignar a la pareja (, ) (de acuerdo con el procedimiento descrito
en la secci
on anterior) y despues elevarlo a la altura z (ver figura 1.25).
Con base en lo anterior tenemos que, si dos ternas (, , z) y ( , , z ) son coordenadas cilndricas del
mismo vector x entonces podemos asegurar que = , = + k para alguna k Z, y z = z .
x
b
b
z0
0
b
0
Y
X
Figura 1.25: Cualquier terna (0 , 0 , z0 ) R3 se puede interpretar como coordenadas cilndricas de un punto x

del espacio.
Analogamente a lo que sucede con las coordenadas polares, la aritmetica definida entre ternas no se
corresponde con la aritmetica definida geometricamente entre vectores del espacio. Sin embargo, tambien
es importante identificar geometricamente el efecto de sumar una cierta cantidad h R en una sola de estas
coordenadas.
De esta forma, si (0 , 0 , z0 ) son coodenadas cilndricas de un vector x
, entonces (0 + h, 0 , z0 ) son
J. P
aez 42
coodenadas cilndricas del vector que est a en el mismo plano que pasa por x y que contiene al eje Z (y
suponiendo que 0 + h no tiene signo diferente a 0 ; que sucede geometricamente si 0 y 0 + h tienen signo
diferente?), a la misma altura sobre el eje Z, pero con la diferencia de que su proyeccion sobre el plano
XY es un vector de norma 0 + h (|0 + h| en el caso general) (ver figura 1.26 (a)).
Si ahora consideramos (0 , 0 + h, z0 ), estas seran coordenadas cilndricas del vector que se obtiene al
rotar, con respecto el eje Z, h radianes el vector x (ver figura 1.26 (b)).
Finalmente, si ahora tomamos (0 , 0 , z0 +h), estas seran coordenadas cilndricas del vector que se obtiene
cambiando la punta del vector x a la altura z0 + h (ver figura 1.26 (c)); en particular, este vector y el
vector x tendran la misma proyeccion sobre el plano XY .
Z Z b
Z
x
h x
h
b h b
b b b
x
h x

0 b
x
h 0 b 0 b
b
x

z0 z0
z0
b
b b b
b h
b
Y b
Y b
Y
0 0 0
X X (b) X (c)
(a)
Figura 1.26: Si el vector x tiene coodenadas cilndricas (0 , 0 , z0 ) entonces, en los siguientes casos, el vector x
h
tiene coordenadas cilndricas: (a) (0 + h, 0 , z0 ); (b) (0 , 0 + h, z0 ); (c) (0 , 0 , z0 + h).
Como en el caso de la coordenadas polares, si (, , z) son cualesquiera coordenadas cilndricas de un

vector x, usando nuevamente las funciones trigonometricas, obtenemos que la terna (x, y, z), con
x = cos()
y = sen()
z=z
son las coordenadas cartesianas de x (notese que la tercera, y extra na identidad anterior, refleja el abuso
de notacion que cometemos al nombrar con la misma letra a la tercera coordenada polar y a la tercera
coordenada cartesiana del vector x, lo cual se justifica por el hecho de que ambas tienen el mismo significado
geometrico).
Recprocamente, para obtener unas coordenadas cilndricas de un vector x a partir de sus coordenadas
cartesianas (x, y, z), calculamos y procediendo justo igual que en el caso de las coordenadas polares, y
la coordenada polar z se toma igual a la coordenada cartesiana z (por las razones que ya explicamos en el
parrafo anterior).
1.6.3 Coordenadas esf

ericas
Concluimos esta breve secci on introduciendo una forma mas de asignarle una terna de n umeros reales a un
vector x del espacio.
Como en el caso anterior, partiendo de un sistema cartesiano XY Z dado, asignamos a x la terna de
n
umeros reales (, , ), de la siguiente forma: (como en el caso de las coordenadas polares) representa la
magnitud de x , es el
angulo (dirigido) formado por la parte positiva del eje X y la proyeccion del vector x

sobre el plano XY , siempre que esta proyeccion sea diferente del vector 0, y si dicha proyeccion es el vector
0, hacemos = 0; y finalmente, sera el angulo (dirigido) formado por la parte positiva del eje Z y el
vector x (6 ) (ver figura 1.27). A la terna (, , ) construida de esta forma le llamaremos unas coordenadas
esfericas del vector x .
6 En algunos textos el
angulo se toma como el
angulo (dirigido) formado por el plano XY y el vector x
.
43 J. P
aez
b x
0
Y
0
b
Figura 1.27: La terna (0 , 0 , 0 ) son unas coordenadas esfericas del vector x

.
En este caso, y desde un punto de vista geometrico, las coordenadas esfericas (0 , 0 , 0 ) de un vector (o
punto) x, nos proporcionan el radio (0 ) de una esfera (que es justo todo el conjunto de puntos del espacio
cuya coordenada esferica es igual a la constante 0 ); el angulo (0 ) (medido con respecto a la parte positiva
del eje X) de un semiplano perpendicular al plano XY (que es justo todo el conjunto de puntos del espacio
cuya coordenada esferica es igual a la constante 0 ); y el angulo (0 ) de un cono circular con vertice en el
origen (cuyo eje es el eje Z, y que es justo todo el conjunto de puntos del espacio cuya coordenada esferica
es igual a la constante 0 ), que se intersectan u
nicamente en el punto (o vector) x (ver figura 1.28).
Figura 1.28: Las coordenadas esfericas (0 , 0 , 0 ) de un punto x

nos proporcionan el radio 0 de la esfera, el
angulo 0 del semiplano perpendicular al eje X, y el angulo 0 del cono, que tienen como intersecci
on unicamente
al punto x.
De la misma forma que en los dos casos anteriores, para asignar unas coordenadas esfericas a un vector
no es necesario recurrir a todas las ternas de R3 ; como se podra notar, basta con que 0 , 0 < 2 y
x
0 , o de manera mas general, que 0 , 0 < 0 + 2 y 0 0 + , con 0 , 0 R fijos.
Tambien, como en los dos casos anteriores, toda terna (, , ) R3 se puede interpretar como coor-
denadas esfericas de un vector x del espacio, de la siguiente forma: sobre el plano XZ, y con respecto a la
parte positiva del eje Z, rotese radianes el eje Z; a continuacion, tomando como eje de rotacion el eje Z,
y con respecto a la parte positiva del eje X, rote la recta real resultante (o si prefiere todo el plano XZ)
radianes; finalmente, sobre esta ultima recta real que se obtiene, ubique el n
umero .
El vector x determinado por el procedimiento anterior, sera el vector que asociaremos a la terna (, , )
y diremos que los elementos de esta terna tambien son coordenadas esfericas de x . Todo lo anterior sin duda
J. P
aez 44
requiere de un
Ejemplo 1.50 Sea x el vector que en un sistema cartesiano dado tiene coordenas (cartesianas)(1, 1, 1). De
acuerdo con el procedimiento de asignaci on de coordenadas esfericas, tenemos que la terna ( 3, /4, /4)
nos da unas coordenadas de este tipo para x .
Por otra parte, y de acuerdo con el m
etodo de asignaci
on de un vector a una terna, n
otese que las ternas
( 3, 3/4, /4), ( 3, 3/4, 3/4), y ( 3, /4, 3/4) tambien son coordenadas esfericas de nuestro
vector x
(ver figura 1.29).

3
3 b
b
1 1
3
4
1
1
4
1
1
Z
1 1

3
b

Figura 1.29: El punto x el cual tambien tiene como coodenadas esfericas a la terna ( 3, /4, 3/4) se obtiene
de la siguiente forma: sobre el plano XZ, y con respecto a la parte positiva del eje Z, rote 3 4 radianes el eje
Z; a continuaci on, tomando como eje de rotaci on el eje Z, y con respecto a la parte positiva del eje X, rote
la
recta real resultante 4 radianes; finalmente, sobre esta ultima recta real que se obtiene, ubique el numero 3.
Aun y cuando existen diferentes coordenadas esfericas para un mismo vector x (como sucede con los otros
tipos de coordenadas que hemos visto en esta secci on), si (, , ) y ( , , ) son dos de ellas, lo que podemos
asegurar es que se debe tener que = , que = + k para alguna k Z, y que = + k (/2)

tambien para alguna k Z.

Como en los casos anteriores, la aritmetica definida entre ternas no se corresponde con la aritmetica
definida geometricamente entre vectores del espacio. Sin embargo, y como tambien hicimos en los otros
casos, es importante identificar geometricamente el efecto de sumar una cierta cantidad h R en una sola
de estas coordenadas.
De esta forma, si (, , ) son coordenadas esfericas de un vector x , entonces el vector que tenga coor-
denadas esfericas ( + h, , ) sera aquel que est a en la misma recta que tiene a x, con norma | + h| y
apuntando en la misma direcci on que (o contraria a) x, dependiendo de si y + h tienen el mismo signo (o
signo diferente); asimismo, el vector que tenga coordenadas esfericas (, + h, ) sera aquel que se obtiene
de rotar h radianes al vector x , tomando como eje de rotacion al eje Z; finalmente, el vector que tenga
coordenadas esfericas (, , + h) sera aquel que se obtiene de rotar h radianes al vector x , realizando dicha
rotacion sobre el plano que contenga a x y al eje Z (ver figura 1.30).
Finalmente, y recurriendo de nuevo a las funciones trigonometricas, si (, , ) son cualesquiera coorde-
nadas esfericas de un vector x, obtenemos que la terna (x, y, z), con
x = sen() cos() (1.13)

y = sen() sen()
z = cos()
son las coordenadas cartesianas de x

(ver figura 1.31).
45 J. P
aez
Z Z Z
x
h b
b
b
h
b b x

b
h x
h x
0
0
b
0 0 b x
h
x
h
0
0
b
b b b
b 0
b
b
Y 0
Y Y
0 0 b
X X (b) X (c)
(a)
Figura 1.30: Si el vector x tiene coodenadas esfericas (0 , 0 , 0 ) entonces, en los siguientes casos, el vector x
h
tiene coordenadas esfericas: (a) (0 + h, 0 , 0 ); (b) (0 , 0 + h, 0 ); (c) (0 , 0 , 0 + h).
x
b

cos()
Y
)
s(
en

co
( )
( )
en
b
s
sen() sen()
X
Figura 1.31: Recurriendo a las funciones trigon

ometricas, si (, , ) son coordenadas esfericas de un vector x, de-
ducimos que la terna (x, y, z) = ( sen() cos(), sen() sen(), cos()) son sus correspondientes coordenadas
cartesianas.
Para obtener unas coordenadas esfericas de un vector x a partir de sus coordenadas cartesianas (x, y, z),
procedemos de la siguiente forma: en general, por la definicion de la coordenada , tenemos que
p
= x2 + y 2 + z 2
identidad que tambien se deduce de las identidades anteriores.

Para determinar el angulo basta con analizar dos casos; en el caso en que x = 0 = y entonces hacemos
= 0 si z 0 y = si z < 0. Si x2 + y 2 > 0, nuevamente por las ecuaciones 1.13 concluimos que se debe
cumplir que
z2 ( cos())2
=
x2 + y 2 ( sen() sen())2 + ( sen() cos())2
( cos())2
=
( sen())2
= tan2 ()
J. P
aez 46
1.7. Problemas Captulo 1. El conjunto Rn
de forma que
|z|
|tan()| = p
x + y2
2
y por tanto, si z 0 bastara con tomar

!
z
= arctan p
x2 + y 2
y si z < 0 bastara con tomar !

z
= arctan p
2 x2 + y 2
on tangente que toma sus valores entre /2 y /2.
en donde nuevamente arctan es la inversa de la funci
En cuanto al angulo , si x = 0 y y 0 hacemos = /2, y si y < 0 entonces tomamos = 3/2.
Cuando x 6= 0, por las ecuaciones 1.13 debemos tener que
y cos()
=
x sen()
= tan()
de modo que, en general, podemos obtener de la misma manera en que lo hicimos para el caso de las
coordenadas polares.
1.7 Problemas
1. Pruebe las proposiciones 1.8 y 1.10.
2. Pruebe que las normas definidas en 1.14 son en efecto normas, es decir, que satisfacen las propiedades
dadas en la proposicion 1.8.
3. Pruebe que, si x = (x1 , . . . , xn ) Rn entonces |xi | kxk, |xi | k

xk1 y |xi | k
xk para i = 1, . . . , n.
n 2 n
P P
4. Sean a1 , . . . , an R. Pruebe que ai n a2i
i=1 i=1
n
5. Pruebe que si x k R entonces
1 , . . . , x
k
x1 + + x
k k k
x1 k + + k
xk k
(recuerde que en el texto, la desigualdad del triangulo solo se prob

o para dos vectores).
6. Sean x k Rn \ {
1 , . . . , x 0} tales que xi xj = 0 si i, j {1, . . . , k}, i 6= j. Pruebe que:
x1 + + xk k2 = k
k x1 k2 + + k
xk k2
(Este resultado es conocido como el teorema de Pit otese que k n. Por que?)
agoras. N
, y Rn . Pruebe que:
7. Sean x
y = 0 si y solo si k
(a) x x + yk = k
x yk
y > 0 si y solo si k
(b) x x + yk > k
x yk
y < 0 si y solo si k
(c) x x + yk < k
x yk
Interprete geometricamente estos resultados
, y Rn diferentes de
8. Sean x 0. Pruebe que:
47 J. P
aez
Captulo 1. El conjunto Rn 1.7. Problemas
(a) si k
xk = k
yk = k
x yk entonces el angulo entre x
y y es /3
(b) si k
xk = k
x yk entonces el
angulo entre x y y es igual al angulo entre y y y x
Interprete geometricamente estos resultados
9. Sean x
(a) k
x + yk = k y k si y solo si existe R, > 0, tal que x
xk + k =
y
(b) k
x yk = k
xk + ky k si y solo si existe R, < 0, tal que x
=
y
2 2 2 2

(c) k
x + yk + kx yk = 2 k xk + k yk
(d) |k
xk k
yk| k
x yk
10. Pruebe la proposicion 1.17.
, y Rn y r > 0 tales que y Br (

11. Sean x x). Si x
= (x1 , . . . , xn ) y y = (y1 , . . . , yn ), hacemos
x
i = (y1 , . . . , yi , xi+1 , . . . , xn ) y yi = (x1 , . . . , xi , yi+1 , . . . , yn )
para cada i {1, . . . , n 1}, x0 = yn = x y y0 = x

n = y. Pruebe que:
i , yi Br (
(a) x x) para cada i {1, . . . , n 1}
(b) si i = xi1 + (xi x
i1 ) y i = yi1 + ( yi yi1 ) con , (0, 1), pruebe que

i x k y xk y ki x
k ky xk
para cada i {1, . . . , n}

i , yi para el caso de R2 y R3
(c) dibuje los puntos x
(1) ()
Rn . Definimos Br (
12. Sea r > 0 y x y Rn | k
x) = { yx
k1 < r} y Br y Rn | k
x0 ) = {
( yx
k <
r}.
(1) ()
(a) describa geometricamente los conjuntos Br (0) y Br (0) cuando n = 2 y n = 3.
(1) ()
(b) en la definicion 1.19, sustituya Br (
x) por Br (
x) y por Br (x) para definir int1 (A), int (A),
ext1 (A), ext (A), Fr1 (A) y Fr (A), respectivamente. Pruebe que int1 (A) = int (A) = int(A),
ext1 (A) = ext (A) = ext(A), y Fr1 (A) = Fr (A) = Fr(A).
13. Sean A, B subconjuntos de Rn . Diga si cada una de las siguientes identidades y contensiones son
ciertas. Pruebe su respuesta.
(a) int(A B) = int(A) int(B); int(A B) = int(A) int(B)

(b) ext(A B) = ext(A) ext(B); ext(A B) = ext(A) ext(B)
(c) Fr(A B) = Fr(A) Fr(B); Fr(A B) = Fr(A) Fr(B)
(d) si A B entonces: int(A) int(B); ext(B) ext(A); Fr(A) Fr(B)
Rn . Si A = Br (
14. Sea r > 0 y x x) pruebe que:
y Rn | k
(a) { yx
k > r} ext(A)
y Rn | k
(b) { yx
k = r} Fr(A)
(c) las contensiones de los incisos anteriores son identidades
15. Pruebe que, si A Rn es un conjunto cerrado entonces int(Fr(A)) = .
16. Pruebe que el conjunto A del ejemplo 1.47 es un conjunto abierto.
J. P
aez 48
17. Sean a1 , . . . , an , b1 , . . . , bn R tales que ai < bi para i = 1, . . . , n. Pruebe que el conjunto
A = (a1 , b1 ) (an , bn )
= {(x1 , ..., xn ) Rn | ai < xi < bi , i = 1, ..., n}
es un conjunto abierto.
18. Sean a1 , . . . , an , b1 , . . . , bn R tales que ai bi para i = 1, . . . , n. Pruebe que el conjunto
A = [a1 , b1 ] [an , bn ]
= {(x1 , ..., xn ) Rn | ai < xi < bi , i = 1, ..., n}
es un conjunto cerrado.

19. Sean A, B Rn . Si A B = (
x, y) R2n | x A, y B , pruebe que:
(a) si A y B son abiertos (en Rn ) entonces A B es abierto (en R2n )

(b) si A y B son cerrados (en Rn ) entonces A B es cerrado (en R2n )
(c) si A y B son acotados (en Rn ) entonces A B es acotado (en R2n )
20. Sea U Rn un conjunto abierto no vaco y Qn := Q Q (Q multiplicado n veces). Pruebe que:
(a) U Qn 6=
(b) U se puede poner como la union de bolas (o vecindades) con centro en Qn y radio racional
21. Sean A1 , . . . , Ak subconjuntos de Rn . Pruebe que:
(a) si cada Ai es abierto entonces A1 Ak y A1 Ak son abiertos

(b) si cada Ai es cerrado entonces A1 Ak y A1 Ak son cerrados
Estas afirmaciones siguen siendo ciertas para un n umero infinito de conjuntos? Pruebe su res-
puesta.
22. Pruebe la proposicion 1.29 y muestre con un ejemplo que las contenciones que se dan ah pueden ser
propias.
23. Sean A, B subconjuntos de Rn . Diga si las siguientes afirmaciones son ciertas. Pruebe su respuesta.
(a) Si A B entonces A B
(b) (A B) = A B
(c) (A B) = A B
24. Si A = ([0, 1] [0, 1]) (Q Q) = {(x, y) R2 | x, y Q y 0 x 1, 0 y 1}

Pruebe sus respuestas.
(a) quien es A y A?
(b) A es abierto o cerrado? Pruebe sus respuestas.
25. Si A = {(m, 0) R2 | m Z}
Pruebe sus respuestas.
(a) quien es int(A), Fr(A), ext(A), A y A?
(b) A es abierto o cerrado? Pruebe sus respuestas.
(1) ()
x) por Br (
26. En la definicion 1.27, sustituya Br ( x) y por Br x) para definir A1 y A , respectivamente.
(
Pruebe que A1 = A = A .
27. Sea A un subconjunto de Rn . Pruebe que:
49 J. P
aez
A si y solo si para todo r > 0 se tiene que Br (

(a) x x) A 6=
(b) A es cerrado si y solo si A = A
(c) A es cerrado si y solo si A A
(d) A A = A
c
(e) A = ext(A)
= A
(f) int(int(A)) = int(A) y (A)
(g) Fr(A) = A (Ac )
28. Sea A un subconjunto de Rn . Pruebe que:
(a) si B A y B es abierto entonces B int(A) (es decir, de los conjuntos abiertos que est an
contenidos en A, int(A) es el mas grande)
(b) si A B y B es cerrado entonces A B (es decir, de los conjuntos cerrados que contienen a A,
A es el mas chico)
29. Sean A, B subconjuntos de Rn . Diga si las siguientes afirmaciones son ciertas. Pruebe sus respuestas.
(a) si A B entonces A B

(b) (A B) = A B
(c) (A B) A B

(d) (A B) = A B

30. Sea A Rn . Pruebe que: A es un conjunto acotado si y solo si para todo x

Rn existe M > 0 (que
depende de x) tal que k
x yk M para todo y A.
31. Pruebe que el conjunto A definido en cada uno de los problemas 17 y 18, es un conjunto acotado.
32. Sea A R, A 6= . Pruebe que si A es cerrado y acotado entonces inf(A), sup(A) A.
33. Sea A Rn un conjunto infinito. Pruebe que, si A es un conjunto cerrado y acotado entonces todo
subconjunto infinito B de A tiene un punto de acumulaci
on en A.
34. Sea {Ak } una sucesion de subconjuntos de Rn , cerrados, acotados y no vacos tales que Ak+1 Ak
para toda k N (es decir, lo que se llama una sucesion anidada de conjuntos). Pruebe que
\
Ak 6=
kN
Este resultado sigue siendo cierto si los conjuntos no son cerrados? o no son acotados? Pruebe sus
respuestas.
35. Sea A Rn tal que A 6= . Pruebe que para todo > 0 existen x
, y A tales que 0 < k
x yk < .
36. Determine si la siguiente proposicion es verdadera: si A Rn es un conjunto infinito y para todo > 0
x yk < entonces A 6= . Pruebe su respuesta.
, y A tales que 0 < k
existen x
37. Sean A Rn un conjunto infinito y c R, con c > 0. Pruebe que, si k
x yk c para todo x, y A,
entonces A es un conjunto no acotado.
38. Sea A Rn tal que A = . Pruebe que si M > 0 y AM = {
x A | k
xk M } entonces AM es finito.
39. Sean a1 , . . . , an , b1 , . . . , bn R tales que ai < bi para i = 1, . . . , n. Pruebe que el conjunto
A = (a1 , b1 ) (an , bn )
= {(x1 , . . . , xn ) Rn | ai < xi < bi , i = 1, . . . , n}
es un conjunto convexo
J. P
aez 50
40. Sea A R, A 6= . Pruebe que las siguientes afirmaciones son equivalentes:
(a) A es conexo
(b) si para todos a, b A, a < b, y c R tal que a < c < b entonces c A
(c) A es un intervalo (es decir, A es de alguna de las siguientes formas: (, b), (, b], (a, b), (a, b],
[a, b),[a, b], (a, ), o [a, ))

42. Sea 6= A ( Rn . Pruebe que:
(a) A no puede ser abierto y cerrado a la vez

(b) Fr(A) 6=
A y y Ac entonces [
(c) si x x, y] Fr(A) 6=
43. Sea A Rn abierto, A 6= . Pruebe que A es disconexo s y solo si existen B, C Rn tales que B y
C son abiertos ajenos no vacos y A = B C.
44. Sea A Rn cerrado, A 6= . Pruebe que A es disconexo si y solo si existen B, C Rn tales que B y
C son cerrados ajenos no vacos y A = B C.
45. Sean A, B, C Rn . Pruebe que si B y C est
an separados entonces C A y B A est
an separados.
46. Sean A, B, C Rn tales que 6= A B C. Pruebe que, si A es conexo y B y C est

an separados
entonces A B
o A C.
47. Sean A, D Rn conjuntos conexos tales que A D 6= . Determine si las siguientes afirmaciones son
ciertas. Pruebe su respuesta.
(a) A D es conexo
(b) A D es conexo
48. La proposicion 1.46 es cierta si A no es abierto? Pruebe su respuesta.

49. Sea A Rn . A es un conjunto estrellado si existe x 0 A tal que para todo x A se satisface que
[ ] A (en cuyo caso se dice que A es estrellado con respecto de x
x0 , x 0 ). Pruebe que todo conjunto
estrellado es conexo.
50. Sean x1 y x2 dos vectores en el plano. Si (1 , 1 ) y (2 , 2 ) son coordenadas polares de x
1 y x2 (en
un cierto sistema cartesiano dado), respectivamente, encuentre coordenadas polares para x 1 + x2 y
x1 ( R), en donde estas operaciones de suma y producto por un escalar, son las que se definieron

geometricamente en el texto. Compruebe su respuesta convirtiendo a las coordenadas cartesianas
correspondientes.
51 J. P
aez
J. P
aez 52
Captulo 2
Funciones de Rn en Rm
Al inicio del captulo anterior dimos una lista de ejemplos que plantean diversas situaciones, y nuestro objetivo
principal fue mostrar que las funciones que permiten describir cada una de estas situaciones, son funciones
cuyas variables independiente o dependiente (o ambas) pertenecen a alg un espacio vectorial, razon por la
cual estas siempre son suceptibles de representarse (describirse o medirse) por una cierta cantidad de
numeros reales (dos, tres, cuatro o mas!), es decir, por una n-ada de n umeros reales.
De esta forma, cada una de las funciones que surgen de estos ejemplos se pueden considerar, en u ltima
instancia, como funciones cuya variable independiente pertenece a alg un subconjunto de Rn y la variable
dependiente a alg un subconjunto de Rm , y las m-adas que representen a esta u ltima estar
an expresadas en
terminos de las n-adas que representen a la primera.
En el captulo anterior nos concentramos en estudiar al conjunto de las n-adas, es decir Rn , y por las
razones anteriormente expuestas, en este captulo realizaremos un analisis mas detallado de las funciones
definidas sobre subconjuntos de Rn y cuyos valores esten en Rm , sin importar (por ahora) a que espacios
vectoriales pertenezcan las variables (independientes y dependientes) representadas por estas n-adas (y
m-adas) de n umeros reales.
2.1
Algebra y geometra de las funciones de Rn en Rm
Iniciamos esta secci
on estableciendo la nomenclatura y la notaci
on con la cual trabajeremos a lo largo de
todo este texto. Casi siempre usaremos la letra f para denotar a una funci on, y si est
a definida sobre un
conjunto A Rn y toma valores en Rm , todo ello lo escribiremos de la siguiente forma:
f : A Rn Rm
Si los valores de f est an en Rm esto significa que para cada x x) Rm , raz

A se debe tener que f ( on
por la cual este valor f ( x) debe de tener m coordenadas, a las cuales denotaremos por fi ( x) R, con
i = 1, . . . , m, es decir f (
x) = (f1 (
x), . . . , fm ( on f : A Rn Rm determina
x)). De esta forma, toda funci
n
a determinada por) m funciones fi : A R R, a las cuales conoceremos con el nombre de funciones
(o est
coordenadas, y con frecuencia escribiremos que f = (f1 , . . . , fm ).
Las funciones coordenadas siempre son funciones de valores reales y veremos que tienen un papel muy
importante en los conceptos y resultados que desarrollaremos a lo largo de este texto.
La siguiente lista ejemplifica el tipo de funciones con las cuales trabajaremos.
Ejemplo 2.1 Considere las siguientes funciones:
1. f : Rn R definida como f (
x) = k
xk
2. f : [0, 2] R R2 definida como f (t) = (cos(t), sen(t))
3. f : A = [0, 2] [0, ] R2 R3 definida como f (x, y) = (cos(x) sen(y), sen(x) sen(y), cos(y))
53
Captulo 2. Funciones de Rn en Rm
2.1. Algebra y geometra de las funciones de Rn en Rm
4. f : A = R2 \ {(0, 0)} R2 R2 definida como

!
x y
f (x, y) = p ,p
x2 + y 2 x2 + y 2
5. f : A = R2 \ {(x, y) R2 | x 0 y y = 0} R2 R definida como

0 si 0 x

f (x, y) = x2 si x 0 y 0 < y

x2

si x 0 y y < 0
Otro aspecto que mencionaremos rapidamente, es el relacionado con las operaciones algebraicas entre
este tipo de funciones y con las que trabajaremos en este texto. Todas ellas las reunimos en la siguiente
on 2.2 Sean f, g : A Rn Rm , R y h : D Rm Rk . Definimos:

Definici
1. la suma de f y g, que denotamos por f + g, como (f + g)(

x) := f (
x) + g( A
x) para cada x
2. el producto del escalar por la funci
on f , que denotamos por f , como (f )(
x) := f (
x) para cada
A
x
3. el producto punto de f por g, que denotamos por f g, como (f g)( x) g(
x) := f ( A
x) para cada x
4. si m = 3, el producto cruz de f por g, que denotamos por f g, como (f g)( x) g(
x) := f ( x) para
A
cada x
5. si m = 1, el cociente de f entre g, que denotamos por f /g, como (f /g)(
x) := f (
x)/g(
x) para cada
B = {
x x A | g(
x) 6= 0}
6. la composicion de h con f , que denotamos como h f , como (h f )( x)) para cada x B =
x) := h(f (
{
x A | f (
x) D}
Aun y cuando el n
umero de variables involucradas en las funciones con las cuales vamos a trabajar impone
una limitante para recurrir a alg
un tipo de representacion geometrica, en algunos casos (sobre todo cuando
el n
umero de variables no es muy grande), existe la posibilidad de hacer un poco de geometra con ellas.
on f : A Rn Rm existen algunos conjuntos a los
Para lograr lo anterior, asociados con una funci
cuales haremos alusion a lo largo de todo este texto. El primero que definiremos, y sin importar que tan
grandes sean n y m, sera lo que llamaremos la gr
afica de f .
on 2.3 Dada f = (f1 , . . . , fm ) : A Rn Rm definimos la gr

Definici afica de f , que denotaremos por Gf ,
como el siguiente conjunto:

Gf := (x1 , . . . , xn , f1 (x1 , . . . , xn ), . . . , fm (x1 , . . . , xn )) Rn Rm = Rn+m | (x1 , . . . , xn ) A
y que con frecuencia escribiremos simplemente (para evitar expresiones muy largas, pero no sin cierto abuso
de notaci
on) como
Gf := ( x)) Rn Rm = Rn+m | x
x, f ( A
Como el lector estara de acuerdo, la gr afica de una funci on solo la podremos dibujar (y ver!) si
2 n + m 3, es decir, en muy pocos casos. Peor aun, en el caso n = 1 y m = 2 este conjunto no resulta
de mucha utilidad, y como el caso n = 1 y m = 1 ya se estudi o con mucho cuidado en los cursos previos de
c
alculo de una variable, solo en el caso n = 2 y m = 1 podremos dibujar la grafica, lo que no le quita interes
a su estudio.
De acuerdo con lo anterior, el tipo de funci
on para el cual vale la pena destacar algunas estrategias que nos
permitan darnos una idea geometrica de c omo es su grafica (independientemente de que hoy en da se cuenta
J. P
aez 54

2.1. Algebra y geometra de las funciones de Rn en Rm Captulo 2. Funciones de Rn en Rm
on f : A R2 R. En
con herramientas muy sofisticadas para dibujarlas), sera cuando tengamos una funci
este caso, la gr
afica de este tipo de funciones se puede escribir como

Gf = (x, y, z) R3 | z = f (x, y) y (x, y) A
lo que en principio establece que los elementos de la grafica deben satisfacer la ecuaci
on
z = f (x, y)
con la restriccion de que (x, y) A. De esta forma, la experiencia que el lector haya obtenido en sus cursos
de geometra analtica para visualizar conjuntos en R3 definidos a partir de una ecuaci on (la mayora de las
veces de tipo cuadratico en las variables x, y y z), le sera de gran utilidad.
Relacionado con lo anterior, y de la misma forma que no cualquier subconjunto de R2 puede ser la grafica
de una funcion de R en R, no cualquier subconjunto de R3 puede ser la grafica de una funci on de R2 en R.
2
Y as como en el caso de R se tiene el criterio geometrico que establece que la grafica de una funci on
definida de R (o de un subconjunto de R) en R debe ser un subconjunto de R2 que solo puede intersectar a
cualquier recta paralela al eje Y en a lo mas un punto, en el caso que nos ocupa hay un criterio geometrico
equivalente: la gr afica de una funci on definida de R2 (o de un subconjunto de R2 ) en R debe ser un
2
subconjunto de R que solo puede intersectar a cualquier recta paralela al eje Z en a lo mas un punto.
Como seguramente el lector recordara, lo que justifica a este criterio es el hecho de que estamos hablando
de funciones, de tal forma que a cada elemento del dominio le corresponde uno y solo un valor del contrado-
minio.
El siguiente ejemplo ilustra los hechos que mencionamos en los p arrafos anteriores.

Ejemplo 2.4 Esboce la gr on f : A R2 R, con A = (x, y) R2 | x2 + y 2 1 , definida
afica de la funci
como p
f (x, y) = 1 (x2 + y 2 )
on que hicimos anteriormente, las ternas (x, y, z) Gf deben ser tales que
Con base en la observaci
z = f (x, y) (2.1)
p
= 1 (x2 + y 2 )
de tal forma que, tomando el cuadrado en ambos lados de esta identidad (operaci
on que ser
a muy importante
recordar mas adelante), concluimos que estas ternas satisfacen la ecuaci
on
z 2 = 1 (x2 + y 2 )
o equivalentemente, la ecuaci
on
x2 + y 2 + z 2 = 1 (2.2)
que seguramente el lector reconocer a como la ecuaci on de una esfera de radio 1 con centro en el origen
(0, 0, 0).
Pero justo por la observaci on anterior a este ejemplo, dado que muchas rectas paralelas al eje Z (in-
cluyendo el propio eje) intersectan a esta esfera en m as de un punto, la gr
afica de nuestra funci
on no puede
ser toda la esfera.
Y para determinar que parte de esta esfera corresponde a la gr afica de nuestra funcion, recordemos que
la ternas que estan en la gr
afica satisfacen la ecuaci
on 2.1 de donde se deduce que la coordenada z de estas
ternas siempre es mayor o igual a 0 (a diferencia de las ternas que satisfacen la ecuaci on 2.2, de la que no
se puede deducir que la coordenada z tenga que cumplir con la misma condici on).
Como seguramente el lector ya lo habr a notado, esta perdida del signo de la coordenada z fue producto
de haber tomado el cuadrado en la ecuaci on 2.1.
Resumiendo lo anterior, concluimos que la gr afica de nuestra funci
on es la parte de la esfera unitaria que se
encuentra por arriba (y sobre) el plano XY , como se muestra en la figura 2.1.
Otro conjunto asociado a una funci on de Rn en R, y al que con frecuencia haremos referencia, es el
llamado conjunto de nivel. Su definicion formal es la siguiente.
55 J. P
aez
p
Figura 2.1: Grafica de la funcion f (x, y) = 1 (x2 + y 2 )
Definici on 2.5 Sean f : A Rn R y c R. Definimos el conjunto de nivel c de f , que denotamos por

Nc (f ), como
Nc (f ) := {
x A | f (
x) = c}
Una propiedad evidente (pero importante) de los conjuntos de nivel es que, para valores distintos de c,
estos conjuntos no se intersectan. Esto es una consecuencia inmediata del hecho de que f sea una funci
on y
la dejaremos plasmada en la siguiente
on 2.6 Dados c, d R tales que Nc (f ) 6= y Nd (f ) 6= , se tiene que

Observaci
Nc (f ) Nd (f ) = si y s
olo si c 6= d
Como es de esperarse, los conjuntos de nivel solo se pueden ver o dibujar si el dominio de nuestra
funci a contenido en R2 o R3 (lo que no reduce su importancia para dimensiones mayores). Por esta
on est
raz
on, daremos algunos ejemplos solo en estos casos.
Ejemplo 2.7 Determine los conjuntos de nivel de las siguientes funciones:

p
1. f (x, y) = x2 + y 2 con (x, y) R2 . Dado que f (x, y) 0 para toda (x, y) R2 , para c < 0 se tiene
que Nc (f ) = . Si c = 0 entonces Nc (f ) = {(0, 0)}, y si c > 0 entonces
n p o
Nc (f ) = (x, y) R2 | x2 + y 2 = f (x, y) = c
que no es m
as que la circunferencia de radio c con centro en el origen (ver figura 2.2).
2. f (x, y) = x2 + y 2 con (x, y) R2 . Como para esta funci on tambien se tiene que f (x, y) 0 para toda
(x, y) R2 , si c < 0 entonces Nc (f ) = . Asimismo, si c = 0 entonces Nc (f ) = {(0, 0)}, y si c > 0
entonces

Nc (f ) = (x, y) R2 | x2 + y 2 = f (x, y) = c

que en este caso es la circunferencia de radio c con centro en el origen (ver figura 2.2).
J. P
aez 56

p
x2 + y 2 = c
b

1 c c X
x2 + y 2 = c
p
Figura 2.2:
Curvas de nivel c de las funciones f (x, y) = x2 + y 2 y f (x, y) = x2 + y 2 , las circunferencias de
radio c y c, respectivamente.
3. f (x, y, z) = x + y + z con (x, y, z) R3 . En este caso se cumple que Nc (f ) 6= para toda c R y

Nc (f ) = (x, y, z) R3 | x + y + z = f (x, y) = c
que, como el lector reconocer

a f
acilmente, se trata de un plano con vector normal (1, 1, 1) (ver figura
2.3).
Figura 2.3: Conjunto de nivel 1 de la funcion f (x, y, z) = x + y + z
Entre otras cosas, y para el caso de R2 , este tipo de conjuntos tambien seran u
tiles para esbozar la grafica
de una funcion. En efecto, si cada conjunto de nivel Nc (f ) (o una cantidad suficiente de ellos) se traslada
paralelamente al plano XY a la altura c, obtenemos un bosquejo de la grafica de f (ver figura 2.4).
Este hecho, junto con todas las dem as tecnicas (como por ejemplo, la interseccion con los planos coor-
denados) que el lector haya aprendido en sus cursos de Geometra Analtica, le seran u tiles a la hora de
intentar visualizar la gr on de R2 en R.
afica de una funci
En realidad, los conjuntos de nivel son un caso particular de otros conjuntos con los cuales vamos a
trabajar en este mismo captulo un poco mas adelante. Dada esta relacion, la aprovechamos para definir lo
que se conoce como la imagen inversa de D bajo f , de la siguiente manera.
57 J. P
aez
p
Figura 2.4: Bosquejo de la grafica de la funcion f (x, y) = 1 (x2 + y 2 ) a partir de algunas de sus curvas de
nivel
on 2.8 Sean f : A Rn Rm y D Rm . Definimos la imagen inversa de D bajo f , que

Definici
denotamos por f 1 (D), como el conjunto dado por:
f 1 (D) := {
x A | f (
x) D}
Esperemos que la notaci on usada en esta definicion no cause confusi

on con la notaci
on de funci
on inversa;
si lo que est
a entre parentesis (el argumento) es un conjunto, nos referimos a la imagen inversa; y si es un
elemento de Rn , hablamos de la funci on inversa de f .
Observaci
on 2.9 Como el lector podr acilmente, si f : A Rn R y c R, entonces
a verificar f
Nc (f ) = f 1 ({c})
on f : A Rn Rm , dado un conjunto
Para concluir con la lista de conjuntos asociados con una funci
B A, defineremos ahora lo que se conoce como la imagen directa (o simplemente la imagen ) de B
bajo f de la siguiente manera.
on 2.10 Sean f : A Rn Rm y B A. Definimos la imagen (directa) de B bajo f , que

Definici
denotamos1 por f (B), como el conjunto dado por:
x) Rm | x
f (B) := {f ( y Rm | existe x
B} = { B tal que f (
x) = y}
Desde un punto de vista geometrico, la imagen de un conjunto bajo una funci o n f : A Rn Rm

jugara un papel relevante cuando n m. En estos casos, dado un conjunto B A sera muy importante
reconocer quien es el conjunto f (B).
De hecho, apoyados en este concepto de imagen directa (y por ahora de manera informal), si un subcon-
junto C Rm se puede obtener (todo el o en partes) como la imagen de un conjunto bajo una funci on
f : I R Rm (que cumpla con ciertas propiedades de derivabilidad que definiremos mas adelante),
diremos que es una curva en Rm .
1 Como en el caso de la imagen inversa, nuevamente esperemos que esta notaci on no cause confusi on con la notaci
on de
funci
on; si lo que est entesis es un conjunto, nos referimos a la imagen directa; y si es un elemento de Rn , hablamos
a entre par
de la funci
on evaluada en ese elemento.
J. P
aez 58

Analogamente, si un subconjunto S Rm se puede obtener (todo el o en partes) como la imagen

de un conjunto bajo una funci on f : A R2 Rm (que tambien cumpla con algunas propiedades de
derivabilidad), nos referiremos a este como una superficie en Rm .
Como es de suponer, los u nicos casos en lo que sera posible dibujar (o bosquejar) la imagen de un conjunto
bajo una funcion, seran aquellos en los que el contradominio de la funci on es R2 o R3 , es decir solo para
funciones de R en R , de R en R , de R en R , de R en R y de R en R3 .
2 3 2 2 2 3 3
En el captulo 3 vamos a estudiar con mas detalle a las funciones de R en Rn (en particular en R2 y
en R3 ), raz
on por la cual ahora solo nos concretaremos en dar ejemplos de c omo es la imagen de algunos
conjuntos bajo este tipo de funciones.
Ejemplo 2.11 Sea f : R R2 dada por f (t) = (cos(t), sen(t)). Describiremos (o bosquejaremos) los con-
juntos f ([/2, /2]), f ([t0 , t0 + 2]) y f ({t0 + k/2 | k Z}) con t0 R fijo, en ambos casos.
Para esta funcion, es importante observar que las parejas (cos(t), sen(t)) pertenecen a la circunferencia
unitaria con centro en el origen, pues satisfacen la ecuaci on x2 + y 2 = 1 para toda t R, en donde adem
as la
variable t representa el
angulo (medido en radianes) formado por la parte positiva del eje X, y la semirecta
que parte del origen, y que pasa por el punto (cos(t), sen(t)).
Tomando en consideraci on este hecho, ahora f acilmente podemos concluir que: f ([/2, /2]) es el
conjunto formado por la parte de la circunferencia unitaria con centro en el origen que se encuentra en
el semiplano derecho (figura 2.5 (a)), f ([t0 , t0 + 2)) es dicha circunferencia completa (figura 2.5 (b)), y
f ({t0 + k/2 | k Z}) es un conjunto formado s olo por cuatro puntos (figura 2.5 (c)).
b
t0
1 1 1
b
(a) (b) (c)
Figura 2.5: Los conjuntos f ([/2, /2]), f ([t0 , t0 + 2]) y f ({t0 + k/2 | k Z})
Ejemplo 2.12 Sea f : A R2 R3 , con A = [0, 2] [0, ], dada por
f (t, s) = (cos(t) sen(s), sen(t) sen(s), cos(s))
Describiremos (o bosquejaremos) los conjuntos f ({(t, s0 ) | t [0, 2]}), f ({(t0 , s) | s [0, ]}) con
s0 [0, ] y t0 [0, 2] fijos.
Como en el ejemplo anterior, ahora es importante notar que las ternas
(cos(t) sen(s), sen(t) sen(s), cos(s))
on x2 + y 2 + z 2 = 1 por lo que podemos concluir que los conjuntos que buscamos est
satisfacen la ecuaci an
contenidos en la esfera de radio 1 con centro en el origen.
Como todas las ternas f (t, s0 ) = (cos(t) sen(s0 ), sen(t) sen(s0 ), cos(s0 )) tienen la particularidad de que su
tercera coordenada es la misma, entonces satisfacen la ecuaci on del plano z = cos(s0 ) el cual es paralelo al
plano XY .
En virtud de nuestra primera observaci on, concluimos que nuestro conjunto est a contenido en la inter-
secci
on de la esfera que mencionamos y este plano (que no es m as que una circunferencia de radio sen(s0 )
59 J. P
aez
Figura 2.6: El conjunto f ({(t, s0 ) | t [0, 2]}) se obtiene al intersectar la esfera x2 + y 2 + z 2 = 1 con el plano
z = cos(s0 )
con centro en el punto (0, 0, cos(s0 ))), y dado que t [0, 2] tenemos que el conjunto buscado coincide con
esta circunferencia (ver figura 2.6).
Por otra parte, como las parejas (cos(t0 ) sen(s), sen(t0 ) sen(s)) (que son la proyecci on sobre el plano XY
de las ternas (cos(t0 ) sen(s), sen(t0 ) sen(s), cos(s)) = f (t0 , s)) pertenecen a la semirecta que parte del origen
y que forma un angulo de t0 radianes con la parte positiva del eje X (observe que sen(s) 0 para toda
s [0, ]), concluimos que el conjunto f ({(t0 , s) | s [0, ]}) est a contenido en la interseccion de la esfera
unitaria con centro en el origen y el plano cuya ecuaci on es sen(t0 )x + cos(t0 )y = 0.
Esta interseccion es una circunferencia completa, pero dado que la proyecci on de los elementos de nuestro
conjunto s olo caen en la semirecta antes descrita, inferimos que este conjunto s olo abarca la mitad de esta
circunferencia, la que une a los puntos (0, 0, 1) = f (t0 , 0) y (0, 0, 1) = f (t0 , ) y que se proyecta sobre dicha
semirecta (ver figura 2.7).
on de la esfera x2 + y 2 + z 2 = 1
Figura 2.7: El conjunto f ({(t0 , s) | s [0, ]}) esta contenido en la intersecci
con el plano z = cos(s0 ), y s
olo consta de una semicircunferencia.
Las propiedades mas importantes relacionadas con los conceptos de imagen inversa e imagen directa las
dejaremos plasmadas en la siguiente proposicion, y dada la sencillez de sus pruebas, estas quedaran a cargo
J. P
aez 60

del lector.
Proposici on 2.13 Sean f : A Rn Rm , A , B, C A, y D , D, E Rm , con I, I un conjunto de

ndices. Se cumple que:
1. si D E entonces f 1 (D) f 1 (E)

1
S S 1
2. f D = f (D )
I I

T T
3. f 1 D = f 1 (D )
I I
4. f 1 (Dc ) = (f 1 (D))c A = A \ f 1 (D)
5. si B C entonces f (B) f (C)

S S
6. f A = f (A )
I I

T T T T
7. f A f (A ) y si f es inyectiva entonces f A = f (A )
I I I I
8. f (A) \ f (B) f (A \ B) y si f es inyectiva entonces f (A \ B) = f (A) \ f (B)
9. B f 1 (f (B)) y si f es inyectiva entonces B = f 1 (f (B))
10. f (f 1 (D)) D y f (f 1 (D)) = D si y s

olo si D f (A)
Concluimos esta secci on mencionando otra forma de representar geometricamente a las funciones de
R2 en R2 y de R3 en R3 . Esta otra forma se desprende b asicamente de las dos maneras geometricas en que
podemos representar a una pareja (o terna) de n umeros reales. En efecto, como ya hemos mencionado en
muchas ocasiones, las parejas o ternas las podemos dibujar, o bien como un punto, o bien como una flecha
(o vector).
Combinando estas dos representaciones, dada una funci on f : A R2 R2 (o f : A R3 R3 ), esta
la representaremos geometricamente de la siguiente forma: a cada elemento x A lo dibujaremos como un
punto y a f (
x) como un vector colocado sobre este punto x .
A sembramos el vector f (
Otra forma de decir lo anterior, es que en el punto x x), y tal vez por esta
forma mas coloquial de decirlo, es que a este tipo de funciones (y su representacion geometrica) tambien
se les conoce con el nombre de campos vectoriales.
Es importante mencionar que en la descripcion anterior se est a suponiendo que, mientras el sistema
coordenado con base en el cual se dibuja a cada x A, es fijo, el que se usa para dibujar a f (
x) tendra como
origen al punto x y sus ejes (a menos que se indique lo contrario) seran paralelos a los ejes del primero. Es
decir, mientras que el sistema coordenado en el que representamos a los elementos del dominio A no cambia,
el que usamos para representar a los valores de f cambiara con cada punto.
Los siguientes ejemplos ilustran esta forma de representar geometricamente a este tipo de funciones.
Ejemplo 2.14 Considere las siguientes funciones.
1. f (x, y) = (x, y). En este caso, como el dominio de f es todo R2 , cada punto del plano tiene asignado
un vector, como se muestra en la figura 2.8 (a).
2. f (x, y) = (y, x). Nuevamente, como el dominio de f tambien es todo R2 , cada punto del plano tiene
asignado un vector, como se muestra en la figura 2.8 (b).
61 J. P
aez
Captulo 2. Funciones de Rn en Rm 2.2. Lmite y continuidad de funciones de Rn en Rm
f (x, y) = (y, x)
f (x, y) = (x, y)
b b
(x, y)
b b
(x, y)
b b
b b
(a) (b)
Figura 2.8: Representacion geometrica de funciones de R2 en R2 . La pareja (x, y) se representa por un punto y
el valor de f en este punto (f (x, y)) por una flecha cuyo punto inicial es el punto (x, y).
3. f : R3 \ {
0} R3 R3 dada por
!
x y z
f (x, y, z) = p ,p ,p
x2 + y 2 + z 2 x2 + y 2 + z 2 x2 + y 2 + z 2
En este caso, sobre cada punto de R3 distinto del origen, la funci

on asigna un vector que tiene la
particularidad de ser siempre de norma 1.
f (x, y, z)
b
b b
b
(x, y, z)
b b
X b
b
Y
Figura 2.9: Representacion geometrica de una funcion de R3 en R3 . La terna (x, y, z) se representa por un punto
y el valor de f en este punto (f (x, y, z)) por una flecha cuyo punto es el punto (x, y, z).
2.2 Lmite y continuidad de funciones de Rn en Rm

Como el lector seguramente recordara de su primer curso de c alculo, para el caso de las funciones de R en
R los conceptos de lmite y continuidad est an ntimamente relacionados con la idea de cercana, la cual,
tratandose de los n
umeros reales, se formaliza a traves del concepto de valor absoluto.
Para las funciones de Rn en Rm los conceptos de lmite y continuidad no cambian esencialmente y siguen
siendo una expresion de las ideas de cercana y aproximacion.
J. P
aez 62
2.2. Lmite y continuidad de funciones de Rn en Rm Captulo 2. Funciones de Rn en Rm
De esta manera, dado que en Rn contamos con varias formas de medir la distancia entre sus elementos (o
de generalizar el concepto de valor absoluto), en principio tenemos muchas maneras de definir estos conceptos
(aunque, como veremos mas adelante, y a la luz de las desigualdades de la proposicion 1.15 del captulo 1,
todas ellas seran equivalentes).
Y as como en el caso de los n umeros reales, nuestro primer acercamiento a la idea de lmite (o aproxi-
macion) lo realizamos a traves del concepto de sucesion, eso mismo haremos para el caso de Rn .
2.2.1 Sucesiones en Rn
El concepto de sucesion en Rn (o en un conjunto arbitrario) es analogo al de sucesion en R: una sucesion es
on que a cada natural le asocia un elemento de Rn . Este concepto lo formalizamos en la siguiente
una funci
Definicion 2.15 Una sucesi on en Rn es una funci on s : N Rn . Denotamos por x

k a s evaluada en k, es
decir, x on s, escribiremos {
k = s(k) y para referirnos a la funci xk }.
Como sucede con cualquier funci on, una sucesion en Rn queda totalmente determinada si se conoce la
regla de asociasion, es decir si conocemos xk para cada k N. Dado que x k Rn , esta debe tener n
2 (i)
coordenadas (a las cuales denotaremos ) por xk , es decir que

(1) (n)
x
k = xk , . . . , xk
De esta forma, toda sucesion determina (o est a determinada por) n sucesiones de n umeros reales, a las
cuales conoceremos con el nombre de sucesiones coordenadas. Las sucesiones coordenadas tendran un papel
muy importante en los conceptos y resultados que desarrollaremos en esta secci on, pues la mayora de ellos
se pueden reducir a los conceptos y resultados analogos al caso real.
Sin duda el concepto mas importante con relacion a las sucesiones en Rn es el de convergencia, el cual
deseamos que refleje la misma idea de aproximacion que se tiene para el caso real.
xk } en Rn tiende (o converge, que
En terminos intuitivos (o geometricos), diremos que una sucesion {
n
es el temino que usaremos) a un punto x0 R si los terminos de la sucesion estan cada vez mas cerca de
x
0 conforme el ndice k se va haciendo cada vez mas grande (o conforme k tiende a infinito, que es la forma
en que expresamos esta idea de que k se va haciendo cada vez mas grande).
Como se recordara, en el caso de los numeros reales esta idea de aproximacion o cercana se formaliza a
traves del concepto de valor absoluto, y dado que en Rn contamos con conceptos equivalentes, la definicion
de convergencia de una sucesion en Rn sera una copia de la definicion para sucesiones de numeros reales.
Definicion 2.16 Sea { on en Rn . Decimos que {

xk } una sucesi xk } es convergente (o que converge) si existe
n
0 R tal que para toda cantidad positiva existe un ndice N N tal que para cualquier otro ndice k N
x
se tiene que
k
xk x0 k <
es decir: si para todo > 0 existe N N tal que si k N entonces x k B (
x0 ).
En este caso decimos que la sucesion {
xk } converge a x
0 , lo que denotamos como {
xk } x
0 o
lim x
k = x
0
k
Una interpretaci on geometrica de la definicion anterior sera la siguiente: cuando una sucesion { xk }
converge a un punto x 0 se tiene que para cualquier bola que tomemos con centro en x 0 , sin importar que
peque no pueda ser su radio, esta contiene a casi todos los terminos de la sucesion (salvo quizas un n
umero
finito de ellos). La figura 2.10 ilustra este hecho en R2 .
Como seguramente el lector lo habr a pensado, una opcion para definir la convergencia de una sucesion
en Rn hubiera sido hacerlo a traves de las sucesiones coordenadas, es decir, definir que
n o
(1) (n)
x
k = xk , . . . , xk
2 En este caso usaremos un super ndice (encerrado entre parentesis) para denotar la coordenada de un elemento de Rn dado
que en este caso el subndice denota el t
ermino de la sucesi
on.
63 J. P
aez
N+1
x
b
1
x
b
N+2
x 0
x
b b
2
x
b
N
x
b
N1
x
b
Figura 2.10: Una sucesi on { 0 si para todo > 0 existe N N tal que si k N
xk } converge a un punto x
entonces xk B (
x0 ).
n o
(i)
converge si cada sucesion coordenada (de n umeros reales) xk converge (para cada i {1, . . . , n}). Y el
lector hubiera estado en lo correcto, como lo mostraremos, dada su importancia, en la primera proposicion
que formularemos con relaci on a la convergencia de sucesiones en Rn .
n o
(1) (n)
Proposici on 2.17 Sea xk = xk , . . . , xk una sucesi on en Rn . La sucesion {xk } converge si y s olo
n o
(i) (1) (n)
si la sucesi
on xk converge para cada i {1, . . . , n}. Es decir, {
xk } x
0 = x0 , . . . , x0 si y solo si
n o
(i) (i)
xk x0 para cada i {1, . . . , n}.
Demostraci on.
= (x1 , . . . , xn )
Por los incisos 1 y 2 de la proposicion 1.15 (del captulo 1) sabemos que para cualquier x
Rn se tiene que
|xi | k
xk |x1 | + + |xn |
para cada i {1, . . . , n} de tal forma que

(i) (i) (1) (1) (n) (n)
xk x0 k 0 k xk x0 + + xk x0
xk x (2.3)
para cada i {1, . . . , n} y para toda k N.

(1) (n)
Supongamos ahora que { xk } x0 = x0 , . . . , x0 . Sabemos entonces que, dado > 0, existe un
ndice N N tal que si k N entonces
k
xk x 0 k <
de tal forma que, por la primera desigualdad de 2.3, se tiene (para cada i {1, . . . , n}) que

(i) (i)
xk x0 k xk x0 k <
n o
(i) (i)
para toda k N de donde concluimos que xk x0 (para cada i {1, . . . , n}).
n o
(i) (i)
Si ahora suponemos que xk x0 para cada i {1, . . . , n}, sabemos que dado > 0, para /n > 0
y para cada i {1, . . . , n} existe un ndice Ni N tal que

(i) (i)
xk x0 <
n
para toda k Ni (y para cada i {1, . . . , n}). Por tanto, si N = max{N1 , . . . , Nn }, por la segunda
desigualdad de 2.3, si k N , como N Ni para cada i {1, . . . , n}, entonces

(1) (1) (n) (n)
k
xk x0 k xk x0 + + xk x0
J. P
aez 64

< + +
n n
=
con lo que concluimos que {

xk } x
0 .
Con base en la proposicion anterior, y dando como un hecho conocido (y probado!) que la suma y
producto de sucesiones de n umeros reales convergentes, tambien es convergente, obtenemos el siguiente
resultado (relacionado con el diferente tipo de operaciones algebraicas que podemos realizar con sucesiones
en Rn ).
Como es de suponerse, la prueba de la siguiente proposicion se deja al lector.
on 2.18 Sean {
Proposici yk } sucesiones en Rn , y R. Si {
xk }, { xk } x0 y {
yk } y0 entonces:
1. {
xk } + {
yk } := {
xk + yk } x
0 + y0
xk } := {
2. { xk }
x0
3. {
xk } {
yk } := {
xk yk } x
0 y0
4. si n = 3, {
xk } {
yk } := {
xk yk } x0 y0
Y hablando de criterios que nos permiten garantizar la convergencia de una sucesion en Rn , seguramente
el lector recordara el muy conocido criterio de convergencia de sucesiones de n umeros reales, el afamado
criterio de Cauchy.
Como en el caso de la definicion de convergencia en Rn , tambien podramos recurrir a las sucesiones
coordenadas para generalizar este concepto a las sucesiones en Rn .
Sin embargo, y al igual que hicimos con la convergencia, puesto que este concepto tambien expresa una
cierta idea de cercana (y por lo tanto de distancia), la definiremos con base al concepto (o a uno de ellos) de
distancia que hemos definido en Rn , y despues formularemos un resultado que muestra que esta definicion
resulta equivalente a que las sucesiones coordenadas tambien sean de Cauchy.
Definicion 2.19 Sea { on en Rn . Decimos que {

xk } una sucesi xk } es de Cauchy si para toda cantidad
positiva existe un ndice N N tal que para cualquier otro par de ndices k, l N se tiene que
k
xk x
l k <
es decir: si para todo > 0 existe N N tal que si k, l N entonces k

xk x
l k < .
Como mencionamos antes, la definicion anterior resulta equivalente a que las sucesiones coordenadas
tambien sean de Cauchy, lo que plasmamos en la siguiente proposicion y cuya prueba, como es de suponerse,
queda a cargo del lector.
n o
(1) (n)
Proposici on 2.20 Sea x k = xk , . . . , xk on en Rn . La sucesi
una sucesi on {
xk } es de Cauchy si y
n o
(i)
s
olo si la sucesi
on xk es de Cauchy para cada i {1, . . . , n}.
La importancia del concepto de sucesion de Cauchy radica en que dicha propiedad es una condicion
equivalente a la propiedad de ser convergente, resultado que podemos obtener como un facil corolario de la
proposicion anterior, y del correspondiente resultado para las sucesiones de n
umeros reales.
Corolario 2.21 Sea { on en Rn . La sucesi

xk } una sucesi on {
xk } es convergente si y s
olo si {
xk } es de
Cauchy.
65 J. P
aez
Es importante mencionar que el resultado anterior se puede probar sin recurrir a la proposicion 2.20,
prueba que dejamos como un problema para el lector (problema 25).
Otro concepto que resulta muy importante en relacion a las sucesiones, es el de subsucesion. Con la
misma idea bajo la cual se define el concepto de subsucesion de n umeros reales, tambien se define para el
caso de sucesiones en Rn .
Es decir, una subsucesion de una sucesion { xk } sera una nueva sucesion que se construye eligiendo
terminos de la sucesion original {
xk }, con la u
nica restriccion de que los ndices de los terminos que se elijan
vayan creciendo, es decir, que estos formen una sucesion de n umeros naturales creciente (restriccion que
no debe extra narnos, sobre todo si recordamos que lo importante de las sucesiones es lo que sucede con sus
terminos justo cuando su ndice crece (o tiende a infinito)).
La formalizacion de este concepto la damos en la siguiente
on 2.22 Sean {
Definici on en Rn y {kl } una sucesi
xk } una sucesi on de numeros naturales (es decir, una
on que al natural l, le asocia el natural kl ). Decimos que {
funci xkl } es una subsucesi
on de {
xk } si {kl } es
una sucesi
on creciente de n umeros naturales (es decir, que kl < kl+1 para toda l N).
Como dijimos antes, una subsucesion { xkl } de una sucesion {

xk } es a su vez una sucesion, y es importante
recalcar que el ndice (o variable) de esta nueva sucesion est a representado por la letra l; es decir, el decimo
termino de la sucesion {xkl } es el k10 termino de la sucesion original { xk }.
Tambien es importante hacer notar que toda sucesion es subsucesion de s misma; en efecto, si tomamos
kl = l la funcion identidad de N en N, que sin duda es creciente, entonces la subsucesion { xkl } es {xl }, es
decir la sucesion original { xk } (en donde la u nica diferencia es que cambiamos el nombre de su ndice (o
variable), l por k).
De la idea intuitiva de convergencia es de esperarse que si una sucesion { xk } converge al punto x 0 Rn
entonces cualquier subsucesion de esta tambien converja a x 0 . El recproco de la afirmaci
on anterior tambien
es cierto; es decir, si todas las subsucesiones de una sucesion { xk } convergen a un mismo punto x 0 Rn
entonces {xk } tambien converge a x0 , afirmaci on que resulta evidente puesto que, como dijimos antes, toda
sucesion es subsucesion de si misma.
Lo interesante es que, aun y cuando excluyamos a la sucesion { xk } como subsucesion de s misma, el
resultado sigue siendo cierto. Este es un hecho importante y lo dejamos plasmado en la siguiente proposicion.
Con relacion a su prueba, vale la pena mencionar que, como ya va siendo costumbre, hay dos caminos
para hacerla: usar la proposicion 2.17 y el correspondiente resultado para sucesiones de n umeros reales
(que es la que haremos aqu), o hacerla sin usar esta proposicion y probarla directamente (que es la que
dejaremos como un problema para el lector).
Proposici on 2.23 Sea {xk } una sucesi on en Rn . La sucesi

on { 0 Rn si y s
xk } converge al punto x olo si
on {
cualquier subsucesi xkl } de {
xk }, diferente de {
xk }, tambien converge a x0 .
Demostraci on. Para entender un poco mejor esta prueba, n otese que la proposicion se puede reformular
de la siguiente manera: {xk } converge al punto x 0 Rn si y solo si para cualquier sucesion creciente de
n alguna l N, se tiene
umeros naturales {kl } tal que kl 6= l para que {
xkl } tambien converge al punto x
0 .
(1) (n) (1) (n)
Supongamos que x
k = xk , . . . , xk yx
0 = x0 , . . . , x0 . Si {
xk } x
0 , por la proposicion 2.17
(i) (i)
sabemos que {xk } x0 para cada i {1, . . . , n}. Ahora, si tomamos cualquier subsucesion { xkl } =
6 {
xk },
(i) (i)
dado que {xkl } es una subsucesion de {xk } (para cada i {1, . . . , n}), por el correspondiente resultado para
(i) (i)
umeros reales sabemos que {xkl } x0 (para cada i {1, . . . , n}) de modo que, nuevamente
sucesiones de n
por la proposicion 2.17, tenemos que {
xkl } x
0 .
(1) (n)
Por otra parte, si cualquier subsucesion {
xkl } 6= {
xk } converge a x
0 = x0 , . . . , x0 entonces cualquier
n o n o
(i) (i) (i)
subsucesion xkl 6= xk converge a x0 (para cada i {1, . . . , n}) de tal forma que, de nueva cuenta
n o
(i) (i)
por el correspondiente resultado para sucesiones de n umeros reales, sabemos que xk x0 (para cada
i {1, . . . , n}) de modo que, una vez mas por la proposicion 2.17, tenemos que {
xk } x
0 .
J. P
aez 66
El resultado anterior tiene una consecuencia practica muy importante: si { xk } es una sucesion que tiene
una subsucesion que no converge, o tiene dos subsucesiones que convergen a puntos diferentes, entonces { xk }
no es convergente.
Para concluir con la lista de condiciones necesarias y suficientes (o ambas) para que una sucesion en
Rn sea convergente (sin duda el tema mas importante con relacion a estas), retomaremos la interpretaci on
geometrica que dimos al hecho de que una sucesion sea convergente.
Como se recordara, si una sucesion {xk } converge a un punto x0 entonces dada una bola con centro en
este punto, sin importar su radio, casi todos los terminos de la sucesion (salvo un numero finito de ellos) se
quedan dentro de dicha bola. Entre otras cosas, de este hecho se deduce que el conjunto formado por los
terminos de la sucesion (y que mas adelante definiremos formalmente) est a ubicado esencialmente alrededor
del punto x0 y por lo tanto sera un conjunto acotado.
El conjunto formado por los terminos de una sucesion (al que se le conoce como el rango de la sucesion) es
un conjunto que resulta ser importante, y mas aun cuando este est a acotado, razon por la cual defineremos
formalmente a este conjunto y daremos un nombre particular (que seguramente el lector ya adivina) a las
sucesiones para las cuales se cumple esta propiedad.
Definicion 2.24 Sea { on en Rn . Definimos el rango de la sucesi
xk } una sucesi on, que denotamos por
xk }), como el conjunto formado por los terminos de la sucesi
R({ on, es decir
xk | k N}
xk }) := {
R({
on 2.25 Sea {
Definici xk } una sucesi on en Rn . Decimos que {
xk } es una sucesi xk }) es
on acotada si R({
xk k M para toda k N.
un conjunto acotado, es decir, si existe M > 0 tal que k
Con base en estas definiciones, la discusi
on que hicimos previa a ellas se puede resumir en la siguiente
Proposicion 2.26 Sea { on en Rn . Si {
xk } una sucesi xk } es una sucesi
on convergente entonces {
xk } es
una sucesi
on acotada.
Demostraci on. Sea x 0 Rn tal que { xk } x0 . De acuerdo con la definicion de convergencia, sabemos
que para = 1 > 0 (o cualquier otra cantidad positiva que se nos ocurra) existe un ndice N N tal
que si k N entonces xk B1 ( x0 ), o equivalentemente, que kxk x
0 k < 1. De esta forma, si tomamos
M = max{k x1 k , . . . , k
xN 1 k , k
x0 k + 1} tenemos que k xk k M si k {1, . . . , N 1} y si k N entonces
k
xk x0 k < 1 y por lo tanto
k
xk k = k(
xk x0 ) + x
0 k
k
xk x0 k + k
x0 k
< 1 + k
x0 k
M
xk k M para toda k N, es decir, que {
con lo que concluimos que k xk } es una sucesion acotada.
El resultado anterior nos proporciona una consecuencia (o condicion) necesaria de las sucesiones conver-
gentes y suele ser muy u til cuando dicha condicion no se cumple pues nos permite concluir que la sucesion
en cuestion no es convergente (como suele suceder con todas las condiciones que son necesarias).
Desafortunadamente esta propiedad no es una condicion suficiente que garantice la convergencia de una
sucesion, como es f
acil verificarlo en el siguiente

Ejemplo 2.27 Considere la sucesi on en R2 dada por xk = (1)k , 1/k . Como
q
xk k = ((1)k )2 + (1/k)2
k
p
= 1 + 1/k 2

2
(1)
concluimos que {xk } es una sucesi
on acotada. Sin embargo, como xk = (1)k no es convergente, por la
on 2.17 tenemos que {
proposici xk } es una sucesi
on no convegente.
67 J. P
aez
A pesar del ejemplo anterior, del hecho de que una sucesion { xk } sea acotada se puede obtener un resultado
muy importante: si bien la sucesion { xk } completa puede que no sea convergente, lo que siempre sucede
es que existe al menos una subsucesion de { xk } que si converge, como sucede con la sucesion del ejemplo
2l
anterior para la cual es f umeros pares {
acil ver que la subsucesion cuyos ndices son los n x2l = (1) , 1/2l }
converge al punto (1, 0), y que la subsucesion de los ndices impares {x2l1 = (1)2l1 , 1/(2l 1) } converge
al punto (1, 0). Este importante resultado lo dejamos plasmado en el siguiente
Teorema 2.28 Sea { on en Rn . Si {

xk } una sucesi xk } est
a acotada entonces existe {
xkl }, subsucesi
on de
{
xk }, tal que {
xkl } es convergente.
Demostraci on. Existen al menos tres pruebas diferentes de este teorema (dos de las cuales se dejan como
problema al lector). La prueba que haremos aqu se basar a, como en casos anteriores, en la proposicion 2.17
y en el resultado equivalente para sucesiones de n umeros reales.
Procederemos por induccion en n, la dimensi on del espacio en el que estamos tomando la sucesion.
De esta forma, para n = 1 estamos en el caso de sucesiones en R el cual vamos a dar por probado.
Supongamos
n entonces que eloteorema es cierto para sucesiones en Rn y lo probaremos para una sucesion
(1) (n) (n+1)
xk = xk , . . . , xk , xk en Rn+1 acotada.
n o
(1) (n)
Definimos yk = xk , . . . , xk ; por el problema 22 (aplicandolo en ambos sentidos) tenemos que
yk } es una sucesion acotada en Rn de tal forma que, por hipotesis de induccion, tiene una subsucesion {
{ ykl }
que es convergente. n o n o
(n+1) (n+1)
Consideremos ahora la sucesion de n umeros reales xl = xkl ; dado que xk est
a acotada en-
tonces {xl } tambien est
a acotada
n o que, por el mismo teorema para sucesiones en R, sabemos
de tal forma
(n+1) (n+1)
que existe una subsucesion xlm = xkl de {xl } que converge.
m
n o
(1) (n)
Ahora, como yklm = xkl , . . . , xkl es una subsucesion de {
ykl }, por la proposicion 2.23 se tiene que
m m
esta tambien converge y por lo tanto (nuevamente por la proposicion 2.17, en ambos sentidos) obtenemos
que la subsucesion n o
(1) (n) (n+1)
xklm = xkl , . . . , xkl , xkl
m m m
de {
xk }, tambien converge, afirmaci
on con la que concluye nuestra prueba.
2.2.2 Lmite
Como sucede con las sucesiones en Rn , los conceptos de lmite y continuidad para funciones de Rn en Rm
expresan la misma idea de aproximacion que expresan los mismos conceptos para el caso de funciones de R
en R, y ademas se definen de manera completamente analoga a como se hace para este tipo de funciones.
Aun tomando en cuenta lo anterior, es importante hacer notar que ahora que contamos con una clasifi-
cacion mas detallada del tipo de puntos asociados a un conjunto A Rn , si este conjunto es el dominio de
una funcion f , los puntos para los cuales tendra sentido preguntarse por el lmite de f seran justo aquellos
que estan pegados a A, es decir, el tipo de punto al que nos podemos aproximar por medio de puntos
diferentes de el y que esten en A (ver inciso (b) del problema 29). Como el lector recordara, estos puntos
son aquellos que llamamos de acumulaci on de A y cuyo conjunto formado por ellos denotamos como A .
Una vez dicho lo anterior, damos la siguiente
Definici on 2.29 (de lmite por sucesiones) Sean f : A Rn Rm y x 0 A . Decimos que f tiene
lmite en x m
0 y que su lmite es l R , si para toda sucesion {
xk } contenida en A \ {
x0 } que converge a x0
on {f (
se tiene que la sucesi xk )} converge a l. En este caso escribimos que
x) = l
lim f (
x

x0
y decimos que l es el lmite de f en x0 .
J. P
aez 68
De forma analoga a lo que sucede con las sucesiones en Rn , y como una consecuencia de este hecho, si
0 A es una condicion necesaria y suficiente de
f = (f1 , . . . , fm ), la existencia del lmite de f en un punto x
la existencia del lmite (en el mismo punto) de cada una de sus funciones coordenadas fi . Este importante
resultado lo dejamos expresado en la siguiente
Proposici on 2.30 Sean f = (f1 , . . . , fm ) : A Rn Rm y x0 A . La funci on f tiene lmite en x 0 y

su lmite es l = (l1 , . . . , lm ) Rm si y s
olo si la funci
on fi tiene lmite en x
0 y su lmite es li , para cada
i {1, . . . , m}.
La prueba de esta proposicion es una consecuencia inmediata de la proposicion 2.17 y se deja como un
La proposicion anterior tiene la virtud de reducir el problema de determinar la existencia del lmite (y
en caso de existir, su calculo) de una funci on de Rn en Rm , a solo funciones de Rn en R. Por esta raz on, a
continuacion daremos una serie de ejemplos en los cuales solo consideraremos funciones de este u ltimo tipo.
Antes de dar los ejemplos, describiremos un procedimiento que consiste en experimentar con algunas
sucesiones que satisfagan la definicion 2.29 y observar que es lo que sucede con las correspondientes sucesiones
de im agenes. Los pasos a seguir despues de hacer estos experimentos dependeran de sus resultados.
Si para varias sucesiones especficas las correspondientes sucesiones de im agenes siempre convergen
al mismo valor, y el lector intuye (intuici on que seguramente desarrollar a despues de calcular muchos
lmites) que la funci
on debe de tener lmite (el cual debera de ser aquel valor al que convergieron todas las
sucesiones de im agenes con las que se experiment o), habra que hacer una demostracion de que ese valor es el
lmite de cualquier otra sucesion de imagenes {f (
xk )}, en donde sea {
xk } cualquier otra sucesion (totalmente
arbitraria) que cumpla con las condiciones de la definicion de lmite.
Por otra parte, si tenemos la suerte de encontrar sucesiones para las cuales las correspondientes sucesiones
de im agenes no convergen, o convergen a valores diferentes, entonces de acuerdo a la definicion 2.29 podemos
concluir que la funci on no tiene lmite en el punto en cuestion. Como se podra notar, cuando el problema
sea mostrar que una funci on no tiene lmite en un punto, las sucesiones son una herramienta muy u til y muy
sencilla de usar.
Ejemplo 2.31 Determinaremos si las siguientes funciones tienen lmite en el punto que se indica.
1. f (x, y) = xy/(x2 + y 2 ) en el punto (0, 0).

Observe que esta funci a definida en A = R2 \ {(0, 0)} y el (0, 0) es un punto de acumulaci
on est on de
A, de tal forma que s es v
alido preguntarse si esta funci
on tiene lmite en dicho punto.
Notese tambien que, en caso de existir el lmite, este tendra que ser 0, pues si en particular tomamos
on {
la sucesi xk = (1/k, 0)}, la cual satisface las condiciones de la definici on 2.29 ya que x k A para
(1) (2)
toda k N, y {xk } (0, 0) en virtud de que {xk = 1/k} 0 y {xk 0} 0 (la sucesi on constante
cero), entonces
(1/k)(0)
f (
xk ) =
(1/k)2 + 02
=0
para toda k N, es decir, la sucesi agenes {f (

on de im xk )} es la sucesi
on constante cero, la cual
converge a 0.
Sin embargo, si ahora consideramos { on tambien se tiene que {
xk = (1/k, 1/k)}, para esta sucesi xk }
(0, 0) y
(1/k)(1/k)
f (
xk ) =
(1/k)2 + (1/k)2
1
=
2
para toda k N, es decir, ahora la sucesi agenes {f (
on de im xk )} es la sucesi
on constante 1/2 la cual
converge a 1/2.
69 J. P
aez
Con base en el comportamiento de estas dos sucesiones, podemos concluir que la funci
on no tiene lmite
en el punto (0, 0).
p
2. f (x, y) = xy/ x2 + y 2 en el punto (0, 0).
acil ver que si {
Como en el inciso anterior, es f xk = (1/k, 0)}, {
xk = (0, 1/k)} o {
xk = (1/k, 1/k)}
entonces en todos estos casos se tiene que la correspondientes sucesiones de imagenes satisfacen que
{f (
xk )} 0.
M xk = (1/k, m/k)}, con m R, en cuyo caso los terminos x
as aun, si { k satisfacen la ecuaci
on de
la recta (en R2 ) y = mx (es decir que la sucesi
on {
xk } se aproxima al (0, 0) por (o sobre) esta
recta), entonces
(1/k)(m/k)
f (
xk ) = p
(1/k)2 + (m/k)2
m(1/k)2
=
(1/k) 1 + m2

1 m
=
k 1 + m2
de donde tambien tenemos que {f (
xk )} 0.
Los experimentos anteriores nos hacen sospechar que la funci on s tiene lmite (en cuyo caso
tendra que ser 0), y para demostrar que esta afirmaci on es cierta, recurriremos a una de las desigual-
dades que el lector prob o en el problema 3 del captulo 1 y que resultara muy u til a la hora de hacer
demostraciones de lmites.
n
En ese problema se prueba que, si x pR entonces |xi | k
= (x1 , ..., xn ) xk para cada i = 1, ..., n. De
= (x, y) entonces |x| , |y| k
esta forma, si x 2 2
xk = x + y y por tanto
xk2
|xy| k
6=
y si x 0, tenemos que

xy

|f (
x)| = p
x2 + y 2
|xy|
=
k
xk
k
xk
Sea ahora { on contenida en A = R2 \ {(0, 0)} tal que {

xk } cualquier sucesi xk } (0, 0); por la
desigualdad anterior, se tiene que
|f (
xk ) 0| = |f (
xk )|
k
xk k
Ahora, como { xk } (0, 0), por el problema 14 tenemos que {k

xk k} 0 y por la desigualdad ante-
rior (aplicando la ley del sandwich para sucesiones de n umeros reales) concluimos que la sucesi
on
{|f (
xk ) 0|} 0 y por el problema 13 tenemos que {f (
xk )} 0.
De esta forma, hemos probado que
xy
lim p =0
(x,y)(0,0) x2 + y 2
En el ejemplo anterior, inciso (2), usamos la conocida ley del sandwich para sucesiones de n umeros
reales. Este resultado lo podemos extender a las funciones de Rn en R y va a resultar ser una herramienta
muy util para el c
alculo de lmites.
J. P
aez 70
on 2.32 Sean f, g, h : A Rn R y x0 A . Si existe r > 0 tal que

Proposici
x) h(
f ( x) g(
x)
(Br (
para toda x x0 ) \ {
x0 }) A y
lim f (
x) = l = lim g(
x)
x

x0 x

x0
entonces h tiene lmite en x

0 y
lim h(
x) = l
x

x0
Esta proposicion es una consecuencia inmediata de la mencionada ley del sandwich para sucesiones de
n umeros reales y como es de suponer, su prueba se deja al lector.
Lo que si vamos a hacer, es resaltar el hecho de que la hipotesis relacionada con las desigualdades que
deben satisfacer las funciones involucradas, solo se debe de satisfacer en una vecindad del punto en donde
se va a tomar el lmite, confirmando con ello que este concepto solo depende del comportamiento local de
dichas funciones.
Otro hecho muy f acil de probar, pero no por ello menos es importante, es la relacion del concepto de
lmite con la aritmetica de las funciones. Los resultados que formularemos en la siguiente proposicion se
deducen (casi todos ellos) de las correspondientes propiedades de las sucesiones que quedaron plasmadas en
la proposicion 2.18, razon por la cual, salvo por la u
ltima afirmaci
on, la prueba se deja al lector.
on 2.33 Sean f, g : A Rn Rm , R, l, l Rm y x0 A . Si f y g tienen lmite en x
Proposici 0 y
x) = l
lim f ( y x) = l
lim g(
x

x0 x

x0
entonces:
1. la funci
on f + g tiene lmite en x0 y adem
as
lim (f + g)(
x) = lim f (
x) + lim g(
x)
x

x0 x

x0 x

x0
= l + l
2. la funci
on f tiene lmite en x
0 y adem
as
lim (f )(
x) = lim f (
x)
x

x0 x

x0
= l
on f g tiene lmite en x
3. la funci 0 y adem
as

lim (f g)(
x) = x) lim g(
lim f ( x)
x

x0 x

x0 x

x0
= l l
4. si m = 3, la funci 0 y adem
as

lim (f g)(x) = lim f (x) lim g(
x)
x

x0 x

x0 x

x0
= l l
5. si m = 1, B = { x) 6= 0} y l 6= 0 entonces x
x A | g( 0 B y adem as

f limxx0 f (
x)
lim (
x) =
x
x0 g limxx0 g(x)
l
=
l
71 J. P
aez
Demostraci on. (inciso 5). Primero probaremos que x 0 B . Como x0 A , de acuerdo con el inciso (b)
del problema 29 sabemos que existe una sucesion { xk } contenida en A \ {x0 } tal que {
xk } converge a x 0 .
De la definicion de lmite tenemos entonces que la sucesi
o n (de n
u meros reales) {g(
x k )} converge a l 6= 0

de tal forma que, para = l > 0 sabemos que existe N N tal que, si k N entonces

xk ) l < = l

g(
Notese que en la desigualdad anterior no puede ser que g( xk ) = 0 y por tanto podemos concluir que, si
k N entonces g( xk ) 6= 0 y de aqu que xk B \ { x0 } para toda k N.
Por tanto, si hacemos yl = xl+N entonces { yl } es una sucesion en B \ { x0 } que ademas de ser una
subsucesion de la sucesion { xk } (tomando kl = l + N ), se tiene que { yl } tambien converge a x0 , de modo
que, nuevamente por el inciso (b) del problema 29, concluimos que x 0 B .
Esto prueba que x0 es punto de acumulaci on del dominio de la funci on f /g; por otra parte, que esta
funci
on tiene lmite en x0 , y que su lmite es el cociente de los lmites de f y g, es una consecuencia inmediata
del correspondiente resultado para el cociente de sucesiones de n umeros reales, que aqu daremos por probado.
Como el lector habra notado, de las operaciones entre funciones mencionadas en la proposicion anterior,
no se incluye a la composicion de funciones. El motivo es que el posible resultado que se podra formular
para esta operaci 0 A , f : D Rm Rk , l D y
on no resulta cierto; es decir, si g : A Rn Rm , x
l Rk son tales que:
x) = l y limyl f (
1. limxx0 g( y ) = l , y
0 (A g 1 (D)) (esta condicion es para garantizar que x

2. x 0 sea punto de acumulaci
on del dominio
on f g)
de la funci
on f g tenga lmite en el punto x

no es posible asegurar que la funci 0 , como lo mostraremos en el siguiente
Ejemplo 2.34 Sean g(x, y) = x para (x, y) R2 y f (t) = 0 si t 6= 0 y g(0) = 1.

Lo primero que se tiene que observar en este ejemplo es que el dominio de la funci on g esta dado por
A = R2 y que (0, 0) A .
Por otra parte, si { xk } es cualquier sucesion contenida en A tal que { xk = (xk , yk )} (0, 0), como
g(xk ) = xk para toda k N, y por la proposici on 2.17 se tiene que {xk } 0, entonces {g( xk )} 0 y por
lo tanto concluimos que lim(x,y)(0,0) g(x, y) = 0.
Asi mismo, es claro que la funci a definida para toda t R y que limt0 f (t) = 0. Por tanto, la
on f est
funci on f g tambien esta definida para toda (x, y) A de modo que s es v alido preguntar si esta funci
on
tiene lmite en el punto (0, 0).
Afirmamos que dicho lmite no existe; en efecto, si tomamos la sucesi on {xk = (0, 1/k)} se tiene que
{xk } (0, 0) y por otra parte g( xk ) = g(0, 1/k) = 0 de modo que (f g)( xk ) = 1 para toda k N y por
tanto {(f g)( xk )} 1.
Si ahora elegimos la sucesi on {
yk = (1/k, 0)} entonces { yk } (0, 0) y g(
yk ) = g(1/k, 0) = 1/k 6= 0 de
modo que (f g)( yk ) = 0 para toda k N y por tanto {(f g)( yk )} 0. De esta forma, concluimos que la
funci on f g no tiene lmite en el punto (0, 0).
Mas adelante, una vez que hayamos introducido el concepto de continuidad, retomaremos el problema
de formular un resultado que relacione la composicion de funciones y el concepto de lmite.
Si bien es cierto que definir el concepto de lmite a traves de sucesiones resulta ser muy intuitivo (y muy
u
til, cuando se trata de probar que una funci on no tiene lmite en un punto), tambien es cierto que esta
definicion puede resultar un poco complicada de usar cuando se trata de probar que una funci on s tiene
lmite en un punto.
Lo que ahora vamos a hacer sera introducir otra forma de definir el concepto de lmite (la muy conocida
definicion ) que entre otras muchas virtudes, resultara ser mas sencilla de usar cuando se quiera probar
que una funci on s tiene lmite en un punto. Y como es de suponerse, probaremos que ambas definiciones
resultan ser equivalentes.
J. P
aez 72
Definici on 2.35 ( ) Sean f : A Rn Rm y x 0 A . Decimos que f tiene lmite en x 0 y que

su l
mite es
l R m
si para toda > 0 existe > 0 tal que si k
x x0 k < (y x
A \ {
x 0 }) entonces

f (
x) l < . Es decir, si para toda bola de radio > 0 (con centro en l) existe una bola de radio > 0
(con centro en x B (
0 ) tal que si x x0 )(A\{ x) B (l) (o f (B (
x0 }) entonces f ( x0 )(A\{x0 })) B (l)).
Una de las ventajas de la definicion anterior es que esta se puede ilustrar geometricamente, como se
muestra en la figura 2.11.
x f l
b
x
0 f (
x)
Figura 2.11: La funcion f tiene lmite en x0 A y su lmite es l Rm si para toda bola de radio > 0 (con
centro en l) existe una bola de radio > 0 (con centro en x 0 ) tal que si x B (
x0 ) (A \ {
x0 }) entonces
x) B (l)
f (
Probar que la definicion anterior es equivalente a la definicion 2.29 es sin duda algo que tenemos que
hacer, pero antes mostraremos por medio de un ejemplo la conveniencia de usar esta definicion, sobre todo
cuando pretendamos demostrar que una funci on s tiene lmite.
Ejemplo 2.36 Considere la funci

on
xy 2
f (x, y, z) = p
x4 + y 4 + z 2 + z 4
que esta definida para todo (x, y, z) A = R3 \ {(0, 0, 0)}. Mostraremos, usando la definici on 2.35, que esta
funcion tiene lmite en el
0 = (0, 0, 0) A y que dicho lmite es 0.
Sea pues una cantidad > 0; nuestra tarea es mostrar que existe una cantidad > 0 (que en general
depender a de la cantidad dada) para la cual se satisfaga que, si x 0 < (y x
A \ {0}) entonces
|f (
x) 0| < .
Para lograr esto, y como seguramente el lector recordar a de sus cursos anteriores de c alculo,
lo que hay
que buscar es la forma de acotar la cantidad |f ( x) 0| = |f (
x)| en terminos de la cantidad x 0 = k
xk,
y para ello habr a que echar mano de todo el acervo de desigualdades de las que disponemos.
Por ejemplo, recordemos que todo n umero elevado a una potencia par siempre es no negativo de tal forma
que
p p
x4 + y 4 + z 2 x4 + y 4 + z 2 + z 4
y por lo tanto
1 1
p p
4 4 2
x +y +z +z 4 x + y4 + z 2
4
lo cual es cierto para toda (x, y, z) A.
73 J. P
aez
p
Si por otra parte observamos que la cantidad x4 + y 4 + z 2 es la norma (euclidiana) del vector (x2 , y 2 , z)
y que esta u
ltima siempre es mayor o igual que el valor absoluto de cualquiera de sus coordenadas (problema
3 del captulo 1) es decir
p
y 2 = y 2 (x2 , y 2 , z) = x4 + y 4 + z 2
concluimos que
y2
p 1
x4 + y 4 + z 2
tambien para toda (x, y, z) A.
Por tanto, reuniendo las desigualdades anteriores tenemos que
|f (
x) 0| = |f (
x)|

xy 2

= p
x4 + y 4 + z 2 + z 4
|x| y 2
p
x4 + y 4 + z 2
y2
= |x| p
x4 + y 4 + z 2
|x|
k(x, y, z)k

= x 0

A es tal que x
de modo que, si tomamos = y x 0 < = entonces, como |f (
x) 0| x 0 ,
tenemos que |f (
x) 0| < .
De esta forma mostramos que se verifica la definicion 2.35 y concluimos nuestro ejemplo.
Una vez hecho el ejemplo anterior, mostraremos que las dos definiciones de lmite que hemos dado son
equivalentes, lo cual lo dejaremos formulado en el siguiente
Teorema 2.37 Sean f : A Rn Rm , x 0 A y l Rm . Si f y l satisfacen la definici
on 2.35 entonces
on 2.29. Y recprocamente, si f y l satisfacen la definici
satisfacen la definici on 2.29 entonces satisfacen la
definici
on 2.35.
Demostraci on. Supongamos que f y l satisfacen la definicion 2.35. Para probar que satisfacen la definicion
2.29, tomemos { xk } una sucesion contenida en A \ { x0 } tal que {
xk } x xk )} l.
0 ; mostraremos que {f (
Para probar esto u ltimo, tomamos cualquier > 0; de la definicion 2.35 sabemos que existe > 0 tal que
si x B (
x0 ) (A \ { x) B (l).
x0 }) entonces f (
Ahora, dado que { xk } x0 , para esta > 0 sabemos que existe N N tal que si k N entonces
k
xk x0 k < , es decir xk B (
x0 )(A\{ xk ) B (l),
x0 }); as, por la propiedad que tiene tenemos que f (
xk ) l < para toda k N , con lo que concluimos que {f ( xk )} l.

es decir que f (
Supongamos ahora que f y l satisfacen la definicion 2.29. En esta parte de la prueba procederemos por
el metodo de la contrapuesta, es decir, que f y l no satisfacen la definicion 2.35. Esto significa que existe
una cantidad > 0 tal que para cualquier cantidad > 0 que se tome, siempre existe x B (x0 ) (A \ {
x0 })
x)
con la propiedad de que f (
x) l .
/ B (l), es decir que f (
Aplicando lo anterior para cada k N podemos tomar x k A \ { x0 } tal que k
xk x
0 k < 1/k y
xk ) l .

f (
De esta forma obtenemos una sucesion { xk } contenida en A \ {
x0 } tal que {
xk } x
0 (problema 13) para
la cual se tiene que {f (
xk )} no converge a l (puesto que f (
xk ) l > 0 para toda k N).
Como esta propiedad es justo la negaci
on de nuestra hipotesis, con esto concluimos la prueba de la
segunda parte del teorema.
J. P
aez 74
2.2.3 Continuidad
Como en el caso de las funciones de R en R, una de las primeras aplicaciones del concepto de lmite est a en
la formalizaci on del concepto de continuidad de una funci on.
Dada una funci on f : A Rn Rm , la idea intuitiva de que esta sea continua consiste en que si x , y
son elementos de su dominio que est an cercanos entonces sus valores bajo f (f (x) y f (
y )) est
an cercanos.
Esta idea intuitiva se puede simplificar si dejamos fijo uno de estos puntos, que ahora llamaremos
x
0 , y decimos que la funci on f es continua en x 0 A si para todo x A que est a cerca de x0 se tiene
que f (x) esta cerca de f (x0 ).
Como seguramente el lector ya est a intuyendo, esta ultima expresion se puede formalizar usando el
concepto de lmite diciendo que una funci on f es continua en x0 A si tiene lmite en este punto y su
lmite es f (
x0 ) (el valor de f en x0 ), es decir si
lim f (
x) = f (
x0 ) (2.4)
x

x0
Aun cuando todo parezca indicar que hemos logrado una buena definicion de continuidad, es importante
precisar algunos aspectos.
El primero de ellos es que el concepto de continuidad se definir a para un punto y este siempre tiene que
ser un elemento de su dominio, es decir, un punto para el cual la funci on f esta definida.
El segundo aspecto tiene que ver con el uso del concepto de lmite; como se recordara, el lmite de una
funcion solo se define para los puntos de acumulaci on del dominio de esta, lo que puede ser un obstaculo ya
que, dado A Rn , en general no es cierto que todo elemento de A tiene que ser un punto de acumulaci on
de A (es decir, A * A ).
Si dado x0 A tenemos la suerte de que este sea un punto de acumulaci on de A (x0 A ), decir que f es
continua en x 0 usando la identidad 2.4 es sin duda la forma mas adecuada de hacerlo, y solo restara analizar
el caso en que x 0 no fuera un punto de acumulaci on de A (aun y cuando s pertenezca a A). N otese que en
este caso x0 sera un punto aislado de A, es decir un punto de A para el cual existe r > 0 con la propiedad
de que Br ( x0 ) A = { x0 } (ver definicion 1.27), lo que significa que el u nico punto de A que realmente est a
cerca de x 0 es el mismo!
Con base en esta observaci on y aunque parezca un poco in util tratar de definir que una funci on sea
continua en un punto aislado de su dominio (y que por cierto no tendra nada de insensato que esta
definicion fuera tal que cualquier funci on resultara siempre continua en este tipo de puntos de su dominio),
todo se ajustar a adecuadamente si escribimos la identidad 2.4 usando precisamente la definicion 2.35.
De acuerdo con esta definicion, la identidad 2.4 va a significar que, para cualquier cantidad > 0 existe una
cantidad > 0 tal que, si x A \ { x0 } tiene la propiedad de que k xx 0 k < entonces kf (
x) f (x0 )k < ,
es decir que, si x B (x0 ) (A \ {
x0 }) entonces f (x) B (f (
x0 )).
Si ahora observamos que, dado que ahora s estamos seguros de que x 0 A, y que las condiciones
anteriores se siguen cumpliendo aun y cuando x sea igual a x
0 , todo parece indicar que, independientemente
de que tipo de punto sea x 0 con respecto de A (de acumulaci on o aislado), la siguiente definicion es la mejor
opcion para expresar el hecho de que una funci on sea continua en un punto de su dominio.
Definici on 2.38 Sean f : A Rn Rm y x 0 A. Decimos que f es continua en x 0 si para cualquier

cantidad > 0 existe una cantidad > 0 tal que, si x A tiene la propiedad de que k xx 0 k < entonces
kf (
x) f ( B (
x0 )k < , es decir que, si x x0 ) A entonces f (
x) B (f (
x0 )) (o equivalentemente, que
x0 ) A) B (f (
f (B ( x0 ))).
Toda las observaciones y afirmaciones que hicimos para deducir la definicion anterior, las dejaremos
plasmadas en la siguiente proposicion, y aprovechando el teorema 2.37, incluiremos una forma equivalente de
expresar la continuidad de una funci on en un punto, en terminos de sucesiones (y que bien podra llamarse
la definici
on de continuidad por sucesiones).
on 2.39 Sean f : A Rn Rm y x
Proposici 0 A.
1. Si x0 es un punto aislado de A entonces f es continua en x

0 .
75 J. P
aez
2. Si x
0 es un punto de acumulaci
on de A se satisface que: f es continua en x
0 si y s
olo si f tiene lmite
en x
0 y ademas
lim f (
x) = f (
x0 )
x

x0
3. La funcion f es continua en x0 si y s on {
olo si para toda sucesi xk } contenida en A que converje a x0
on {f (
se tiene que la sucesi xk )} converje a f (
x0 ).
La demostracion de esta proposicion es muy sencilla y se deja como un problema para el lector.
Otro hecho que sin duda tambien resultara evidente para el lector, es la relacion que existe entre la
continuidad de una funci on f : A Rn Rm en un punto x 0 A y la de sus funciones coordenadas (en el
mismo punto).
0 A si y solo si fi es continua
En efecto, si f = (f1 , . . . , fm ) es de esperarse que f sera continua en x
0 para cada i {1, . . . , m}, propiedad que, a pesar de su predecibilidad, es muy importante y por lo
en x
mismo la dejamos expresada en la siguiente
Proposicion 2.40 Sean f : A Rn Rm y x 0 A. La funci

on f es continua en x
0 si y s
olo si fi es
0 , para cada i {1, . . . , m}.
continua en x
Con relacion a la continuidad de una funci

on, dejaremos expresadas en la siguiente proposicion la relacion
del concepto de continuidad con la aritmetica de las funciones.
Dada la cercana de este concepto con el de lmite, casi todas las afirmaciones de esta proposicion (salvo
por el inciso 6) seran una consecuencia inmediata de las correspondientes afirmaciones de la proposicion 2.33,
en virtud de lo cual su prueba, una vez mas, quedara a cargo del lector (incluyendo el inciso 6).
on 2.41 Sean f, g : A Rn Rm , R y x
Proposici 0 A. Si f y g son continuas en x
0 entonces:
1. la funci
on f + g es continua en x0
2. la funci
on f es continua en x
0
on f g es continua en x
3. la funci 0
on f g es continua en x
4. si m = 3, la funci 0
x0 ) 6= 0, la funci
5. si m = 1 y g( on f /g es continua en x0
x0 ) D Rm y h : D Rm Rk es continua en y0 entonces h f es continua en y0

6. si y0 = f (
Como el lector habr a notado, de las operaciones entre funciones que acabamos de enlistar en la proposicion
anterior, ahora s incluimos a la operacion composicion (a diferencia de la proposicion 2.33).
La razon de esto, es que el concepto de continuidad s se comporta bien con esta operaci on (a diferencia
del concepto de lmite, como vimos en el ejemplo 2.34), y lo que ahora queremos destacar es que hay un
resultado un poco mas general para el cual no se requiere que ambas funciones (las que se vayan a componer)
tengan que ser continuas en los correspondientes puntos (como se requiere en el inciso 6 de la proposicion
anterior).
Este resultado es muy importante (y muy u til) y lo dejaremos formulado en la siguiente
Proposici on 2.42 Sean g : A Rn Rm , f : D Rm Rk , x0 Rn y l Rm tales que l D y

x
x) = l y f es continua en l entonces f g tiene lmite en x
0 B , con B = A g 1 (D). Si limxx0 g( 0 y
ademas
lim (f g)(x) = f l = f lim g( x)
x

x0 x

x0
Demostraci on. Usaremos la definicion de lmite para hacer esta demostracion. Sea > 0 arbitraria.
De la definicion de continuidad sabemos que existe > 0 tal que

si y B
l D entonces f (y ) B f l (2.5)
J. P
aez 76
y de la definicion de lmite tenemos que existe > 0 tal que

si x B (
x0 ) (A \ { x) B l
x0 }) entonces g( (2.6)

Afirmamos que, si x B (
x0 ) (B \ { x) B f l
x0 }) entonces (f g)( (ver figura 2.12).
En efecto, dado que B A entonces
x0 ) (B \ {
B ( x0 }) B (
x0 ) (A \ {
x0 })
de tal forma que, B (

si x x0 ) (B \ {
x0 }) entonces x
B (
x0 ) (A \{
x0 })
de modo que por 2.6 se tiene
que g(
x) B l , y por 2.5 concluimos que (f g)( x)) B f l .
x) = f (g(
B = A g 1 (D) D
x
0
x f (g(
x))
b
g g(
x) b
f bc
f (l) b
A g(A)
Figura 2.12: Prueba geometrica de la proposici

on 2.42
Con frecuencia se suele decir coloquialmente que el resultado anterior nos asegura que el lmite se
puede meter dentro (o a traves) de una funci
on continua. Esta propiedad es de mucha utilidad cuando
nos enfrentamos al problema de mostrar que una funci on tiene lmite, como lo haremos ver en el siguiente
Ejemplo 2.43 Sea

x2 y
h(x, y) = cos
x + y2
2
Mostraremos que esta funci

on tiene lmite en el punto (0, 0) y calcularemos cu
al es su valor.
on f (t) = cos(t) es continua en R, por la proposici
Dado que la funci on 2.42 bastar a mostrar que la
funci
on
x2 y
g(x, y) = 2
x + y2
tiene lmite en el punto (0, 0) y calcular cu
anto vale este. Para ello, observese que, como
2
x y = x2 |y|

x2 + y 2 k(x, y)k
se tiene que
x2 y
x2 + y 2 k(x, y)k

para toda (x, y) 6= (0, 0) y por lo tanto que

x2 y
|g(x, y) 0| = 2
x + y2
k(x, y)k
= k(x, y) (0, 0)k
77 J. P
aez
de tal forma que, dado > 0, si tomamos = y (x, y) R2 tal que 0 < k(x, y) (0, 0)k < entonces
|g(x, y) 0| k(x, y) (0, 0)k < =
de modo que se satisface la definici

on 2.35 y concluimos que
x2 y
lim g(x, y) = lim
(x,y)(0,0) (x,y)(0,0) x2+ y2
=0
Por la proposici
on 2.42 tenemos entonces que
lim h(x, y) = lim (f g)(x, y)

(x,y)(0,0) (x,y)(0,0)

x2 y
= lim cos
(x,y)(0,0) x2 + y 2

x2 y
= cos lim
(x,y)(0,0) x2 + y 2
= cos(0)
=1
Otra pregunta que resulta interesante con relacion a la proposicion 2.42 es si las hipotesis sobre las
funciones f y g son intercambiables. Es decir, si ahora suponemos que g es continua en x0 A y f tiene
lmite en l = g(
x0 ) D , se cumple que la funci
0 ?
La respuesta a esta pregunta es negativa y el ejemplo 2.34 de la secci on anterior nos sirve como contra-
ejemplo. Sin embargo, y justo tomando en cuenta las caractersticas de ese ejemplo, podemos agregar una
hipotesis que nos permita formular una proposicion analoga.
Proposici on 2.44 Sean g : A Rn Rm , f : D Rm Rk , x 0 Rn y l Rk tales que x0 A y

y0 = g(
x0 ) D . Si g es continua en x 0 , limyy0 f ( x) 6= y0 para toda
y ) = l y existe r > 0 tal que g(
x Br (
x0 ) \ {
x0 } entonces f g tiene lmite en x 0 y adem as
x) = l
lim (f g)(
x

x0
La prueba de esta proposicion es muy parecida a la de la proposicion 2.42 y por lo mismo se deja al lector.
Por otra parte, y aun y cuando la conclusi
on de esta proposicion asegura la existencia de un lmite, se suele
usar con mas frecuencia para demostrar que una funci on no tiene lmite, como se muestra en el siguiente
Ejemplo 2.45 Sea

x2 y
f (x, y) =
x4 + y 2
Mostraremos que esta funcion no tiene lmite en el punto (0, 0).
Lo que haremos ser
a aproximarnos al punto (0, 0) a traves de diferentes curvas, las cuales definiremos
por medio de funciones de R en R2 (funciones que ser an el tema principal del captulo 3), y que tienen la
particularidad de pasar por el punto que nos interesa.
Primero consideraremos una funci on de la forma g(t) = (t, mt), con m 6= 0 arbitrario. N otese que
on claramente es continua para cualquier t R (proposici
esta funci on 2.40) y su imagen es una recta (de
pendiente m) que justo pasa por el origen (0, 0) cuando t = 0. Si ahora realizamos la composici on f g
tenemos que
t2 (mt)
(f g)(t) =
(t2 )2 + (mt)2
mt
= 2
t + m2
J. P
aez 78
para toda t R, y obtenemos que

lim (f g)(t) = 0
t0
Si adem as observamos que f (t, 0) = 0 = f (0, t) para toda t R podemos decir que f se aproxima a 0
cuando nos aproximamos al (0, 0) a traves decualquier recta.
Ahora consideremos la funci on h(t) = t, t2 . En este caso la funcion es otra vez claramente continua
para cualquier t R, describe (o recorre) la par abola y = x2 y nuevamente en t = 0 pasa por el origen
(0, 0), lo que significa que en este caso nos aproximamos al (0, 0) a traves de esta curva. Si consideramos
nuevamente la composici on f h tenemos que
t2 t2
(f h)(t) = 2
(t2 ) + (t2 )2
1
=
2
para toda t R, t 6= 0, de modo que ahora tenemos que
1
lim (f h)(t) =
t0 2
Con base en estos dos resultados y la proposici
on 2.44 podemos concluir que nuestra funci
on f no tiene
lmite en el (0, 0).
Para terminar esta subsecci on (y antes de pasar a los teoremas fuertes de continuidad), definiremos
lo que significa que una funcion sea continua en un subconjunto de su dominio (definicion que al lector le
resultara del todo natural), y probaremos una interesante y util caracterizacion de esta propiedad.
on 2.46 Sean f : A Rn Rm y B A. Decimos que f es continua en (o sobre) B si f en
Definici
B.
continua en cada punto de B, es decir, si f es continua para cada x
on 2.47 Sea f : A Rn Rm . f es continua en A si y s
Proposici olo si para todo conjunto abierto
V R existe un conjunto abierto U Rn tal que f 1 (V ) = A U .
m
Demostraci on. (=) Sea V Rm abierto y x f 1 (V ) (si f 1 (V ) = tomamos U = ). Entonces

x) V de modo que, como V es abierto, existe x > 0 tal que Bx (f (
f ( x)) V y como f es continua en x

(pues es continua en A) existe x > 0 tal que
x) A) Bx (f (
f (Bx ( x)) (2.7)
Tomamos [
U= Bx (
x)
x
f 1 (V )
Dado que las bolas (o vecindades) son conjuntos abiertos, por el problema 21 del captulo 1 sabemos que U
es un conjunto abierto, de tal forma que solo nos resta probar que f 1 (V ) = A U .
Que f 1 (V ) A U es inmediato. Sea entonces y A U ; como

[
AU =A Bx (
x)
x
f 1 (V )
[
= x) A
Bx (
x
f 1 (V )
entonces existe x f 1 (V ) tal que y Bx (

x) A de modo que, por 2.7, se tiene que f (
y ) Bx (f (
x)) V
y por lo tanto y f 1 (V ). Por lo tanto f 1 (V ) = A U con lo cual concluimos esta parte de la prueba.
(=) Sea x A y > 0. Como la bola B (f ( x)) Rm es un conjunto abierto, por hipotesis existe
n 1
U R abierto tal que f (B (f ( x))) = U A . Ahora, dado que x f 1 (B (f (
x))) = U A y U es
abierto, existe > 0 tal que B ( x) U de modo que
x) A U A = f 1 (B (f (
B ( x)))
x) A) f (f 1 (B (f (
y por lo tanto f (B ( x)))) B (f (
x)), lo que prueba que f es continua en x
.
79 J. P
aez
2.2.4 Teoremas fuertes de continuidad

Como seguramente el lector estar a de acuerdo, tratandose de funciones continuas de R en R, dos son los
resultados mas importantes relacionados con este tipo de funciones: el Teorema del Valor Intermedio, y el
Teorema del valor M aximo (y el valor Mnimo) que asegura que toda funci on continua sobre un intervalo
de la forma [a, b] (un subconjunto cerrado y acotado (adem as de conexo) de R) siempre alcanza su valor
maximo y su valor mnimo.
Sin restarles importancia a estos teoremas, lo que es mas relevante aun, son los dos resultados que
podemos probar o reformular a partir de ellos (o de los argumentos usados en su prueba).
El primero de ellos, que se prueba a partir del Teorema del Valor Intermedio, es aquel que asegura que
on continua sobre un intervalo I R (totalmente arbitrario, sin importar si I es abierto,
si se tiene funci
cerrado, acotado o no acotado) entonces su imagen f (I) R tambien es un intervalo.
nicos subconjuntos conexos de R (problema 40, captulo 1), el
Si observamos que los intervalos son los u
resultado que acabamos de mencionar se podra reformular de la siguiente manera: si f es continua sobre el
conjunto I R, e I es conexo entonces f (I) R es conexo.
Y el segundo resultado importante, que se puede probar usando los mismos argumentos que se usan para
la prueba del Teorema del valor M aximo (y el valor Mnimo), es aquel que asegura que si A R es un
conjunto cerrado y acotado (aun y cuando este conjunto A no sea de la forma [a, b]) entonces f (A) R
tambien es un conjunto cerrado y acotado.
Lo que vamos a hacer en esta subseccion, es mostrar que los resultados que acabamos de mencionar (para
funciones de R en R) se siguen cumpliendo para funciones de Rn en Rm .
Teorema 2.48 Sea f : A Rn Rm continua en A y B A. Si B es conexo entonces f (B) es conexo.
Demostraci on. En esta prueba, ademas de hacerla por el metodo de la contrapuesta, usaremos la equiva-
lencia para conjuntos disconexos probada en la proposicion 1.48 del captulo 1. Supongamos entonces que
f (B) no es conexo; por la proposicion mencionada, sabemos que existen U , V Rm conjuntos abiertos tales
que:
V ,
(a) f (B) U
6= y f (B) V 6= , y
(b) f (B) U
V = .
(c) f (B) U
) = A U y
Por la proposicion 2.47 sabemos que existen U, V Rn conjuntos abiertos tales que f 1 (U
f 1
(V ) = A V . Afirmamos que U y V satisfacen que:
(1) B U V ,
(2) B U 6= y B V 6= , y
(3) B U V = .
Para probar lo anterior, usaremos varias de las propiedades de la imagen inversa y la imagen directa
formuladas en la proposicion 2.13.
Por el inciso (a) de nuestra suposicion, sabemos que
B f 1 (f (B))
V )
f 1 (U
) f 1 (V )
= f 1 (U
= (A U ) (A V )
= A (U V )
y por lo tanto B U V , con lo cual probamos el inciso (1).
J. P
aez 80
Ahora, por el inciso (b), como f (B) U 6= entonces existe x B tal que f (x) U . Por tanto,
1
f (U ) = A U de modo que x B U , es decir, B U 6= . Analogamente se prueba que B V 6=
x
con lo cual tenemos probado el inciso (2).
Finalmente, dado que B A y B f 1 (f (B)), tenemos que
B U V = B (U A) (V A)
) f 1 (V )
= B f 1 (U
) f 1 (V )
f 1 (f (B)) f 1 (U
V )
= f 1 (f (B) U
= f 1 ()
=
de donde B U V = , con lo cual probamos el inciso (3).
Como el lector habr
a notado, los incisos (1), (2) y (3), por la misma proposicion 2.13, implican que B es
disconexo, conclusi
on con la cual terminamos la prueba.
Con base en el teorema anterior, se establece una interesante versi

on del teorema del valor intermedio
para funciones de Rn en R, resultado que dejamos plasmado en el siguiente corolario y cuya prueba se deja
al lector.
Corolario 2.49 Sean f : A Rn R continua en A, B A conexo y x 1 , x2 B tales que f (
x1 ) < f (
x2 ).
Si c R es tal que f (
x1 ) < c < f ( B tal que f (
x2 ) entonces existe x x) = c.
Como mencionamos al inicio de esta subsecci on, otro tipo de conjuntos que preservan sus caractersticas
bajo funciones continuas, son los conjuntos cerrados y acotados. Este resultado tiene consecuencias muy
importantes, en particular las relacionadas con la existencia de valores maximos y mnimos de funciones de
Rn en R, tema que trataremos ampliamente en el captulo 4.
Teorema 2.50 Sea f : A Rn Rm continua en A y B A. Si B es cerrado y acotado entonces f (B)
es cerrado y acotado.
Demostraci on. En la prueba de este teorema jugaran un papel muy importantes varios de los resultados
que probamos para sucesiones.
Primero probaremos que f (B) est a acotado y usaremos nuevamente el metodo de la contrapuesta.
Supongamos entonces que f (B) no est a acotado. Bajo este supuesto, para cada k N existe xk B
tal que kf (xk )k > k.
Dado que B est a acotado, entonces { xk } es una sucesion acotada, de modo que por el teorema 2.28 existe
una subsucesion { xkl } que converge. Si x0 Rn es tal que { xkl } x 0 (cuando l ), por el inciso (a) del
problema 29 se tiene que x 0 B y como B es un conjunto cerrado entonces B = B y por lo tanto x
0 B.
Ahora, como f es continua en x 0 se debe tener que {f ( xkl )} f ( x0 ) (cuando l ), lo cual contradice
el hecho de que kf ( xkl )k > kl para toda l N y que {kl } es una sucesion creciente de naturales.
Para probar que f (B) es un conjunto cerrado mostraremos que (f (B)) f (B). Si (f (B)) = la
contencion es inmediata. Supongamos entonces que y0 (f (B)) ; por el inciso (b) del mismo problema 29,
sabemos que existe una sucesion { yk } f (B) tal que { yk } y0 de tal forma que si xk B es tal que
xk ) = yk entonces {
f ( xk } B es una sucesion acotada.
Nuevamente, por el teorema 2.28 existe una subsucesion { xkl } que converge. Si x 0 Rn es tal que
{
xkl } x 0 (cuando l ), por el mismo argumento usado en la primera parte de esta prueba se tiene que
0 B y como f es continua en x
x 0 entonces {f (xkl ) = ykl } f ( x0 ) (cuando l ).
Por otra parte, dado que { ykl } es una subsucesion de { yk } entonces { ykl } y0 y como el punto de
convergencia de una sucesion es u nico, se tiene que y0 = f ( x0 ), lo que prueba que y0 f (B).
Como anunciamos anteriormente, con base en este teorema podemos probar un resultado muy importante
que nos proporciona condiciones suficientes para que una funci on continua de Rn en R alcance valores
maximos y mnimos sobre un conjunto.
Este resultado lo dejamos formulado en el siguiente corolario y su prueba (nuevamente!) se deja al lector.
81 J. P
aez
Captulo 2. Funciones de Rn en Rm 2.3. Continuidad uniforme
Corolario 2.51 Sean f : A Rn R continua en A y B A. Si B es cerrado y acotado entonces existen

x 2 B tales que f (
1 , x x1 ) f (
x) f ( B. Es decir, f alcanza un valor m
x2 ) para toda x aximo y un valor
mnimo sobre B.
2.3 Continuidad uniforme

Concluimos este captulo definiendo el concepto de continuidad uniforme para funciones de Rn en Rm . La
forma explcita de esta definicion es totalmente equivalente a la de las funciones de R en R y expresa la
misma propiedad de una funci on f sobre un conjunto B: a saber que, para cada cantidad > 0 existe una
cantidad > 0 tal que f (B ( x) B) B (f (
x)) para toda x B. Es decir, dada una > 0 se puede
encontrar una > 0 que sirve para cualquier x B (en el sentido de que f (B (
x) B) B (f (
x))),
propiedad que sin duda dice que, ademas de que f es continua en cada x B, esta continuidad tiene
cierta cualidad de uniformidad sobre este conjunto.
Definicion 2.52 Sean f : A Rn Rm y B A. Decimos que f es uniformemente continua sobre B

si para cada > 0 existe > 0 con la propiedad de que: si x , y B son tales que k
x yk < entonces
kf (
x) f ( x) B) B (f (
y)k < . Es decir, f (B ( x)) para toda x B.
Como ha sucedido con los conceptos de lmite y de continuidad para funciones de Rn en Rm , que se
pueden caracterizar en terminos de los conceptos correspondientes de sus funciones coordenadas, para el
caso de la continuidad uniforme sucede lo mismo, propiedad que vamos a dejar expresada en la siguiente
proposicion y cuya prueba ... (adivine el lector!).
Proposici on 2.53 Sean f = (f1 , . . . , fm ) : A Rn Rm y B A. f es uniformemente continua sobre B

olo si cada fi es uniformemente continua sobre B, para i {1, . . . , m}.
si y s
Como mencionamos en el comentario previo a la definicion 2.52, toda funci on que es uniformemente
continua sobre un conjunto B tambien es continua sobre el mismo conjunto, hecho que dejamos plasmado
en la siguiente proposicion y cuya veracidad es tan inmediatamente clara, que omitiremos su prueba.
Proposicion 2.54 Sean f : A Rn Rm y B A. Si f es uniformemente continua sobre B entonces f

es continua en B.
Como seguramente el lector tendra presente para el caso de las funciones de R en R, el recproco de la
on que se repite para las funciones de Rn en Rm , como lo mostraremos
proposicion anterior es falso, situaci
en el siguiente
Ejemplo 2.55 Sea

1
f (x, y) = p
x2 + y 2
1
=
k(x, y)k
con (x, y) A = R2 \ {(0, 0)}.

Mostraremos en general que, si B A es tal que (0, 0) B entonces f no es uniformemente continua
en B.
Este ejemplo, adem as de mostrar que el recproco de la proposici
on 2.54 no se satisface, tendr a el merito
de exhibir un metodo para probar que una funci on no es uniformemente continua sobre un conjunto.
De acuerdo con la definici on 2.52, para probar que f no es uniformemente continua sobre el conjunto B
es necesario mostrar que existe una cantidad especfica > 0 tal que para cualquier > 0, siempre se pueden
encontrar puntos x1 , x2 B tales que kx1 x2 k < y sin embargo |f (
x1 ) f (
x2 )| .
Tomemos = 1 y sea > 0 arbitrario. Como (0, 0) B existe x1 B tal que 0 < k x1 k = k
x1 (0, 0)k <
, y por la misma raz on, existe x2 B tal que
k
x2 k = k
x2 (0, 0)k
J. P
aez 82
2.3. Continuidad uniforme Captulo 2. Funciones de Rn en Rm
k
x1 k
<
k
x1 k + 1
de tal forma que 0 < k
x2 k < k
x1 k y por lo tanto

1 1
|f (
x1 ) f (
x2 )| =

k
x1 k k x2 k
1 1
=
kx2 k k x1 k
kx1 k + 1 1
>
kx1 k kx1 k
=1
que es lo que deseabamos probar.
El ejemplo anterior tambien tiene la virtud de mostrar el tipo de caractersticas que deben de tener una
funcion f y un conjunto B, si se desea mostrar que f no es uniformemente continua sobre B.
Si en el conjunto B existen puntos tan cercanos como se quiera, tales que sus im agenes bajo la funci on
f se alejan entre ellas (o permanecen a una distacia mayor que una constante), como sucede con aquellos
puntos que est an cerca del (0, 0) en el ejemplo anterior, en donde los valores de f se hacen cada vez mas
grandes (y mas alejados entre ellos) si la evaluamos en puntos cada vez mas cercanos a este punto.
Por otra parte, en el problema 61 se pide al lector probar que la misma funci on f del ejemplo anterior s
es uniformemente continua sobre cualquier subconjunto B de su dominio, siempre y cuando se satisfaga que
el (0, 0) no es punto de acumulaci on de B.
Con esta prueba se mostrara que la continuidad uniforme es un concepto que depende no solo de la
funcion que estemos tratando, sino tambien del conjunto sobre el cual la estemos considerando. La misma
funcion puede ser uniformemente continua sobre algunos conjuntos, y no serlo sobre otros. No tiene sentido
afirmar que una funci on es (o no es) uniformemente continua, si no se menciona un conjunto sobre el cual
se pretende que lo sea (o que no lo sea).
Regresando al recproco de la proposicion 2.54, dado que a la funci on involucrada no le podemos pedir
algo mas que ser continua, la opcion es pedirle algunas caractersticas al conjunto sobre el cual queremos que
esta sea uniformemente continua. Una manera de dar con estas caractersticas (que en matematicas suele dar
sus frutos), consiste en intentar hacer la prueba y sobre la marcha ubicar que es lo que se va necesitando.
Manos a la obra!
Sea f : A Rn Rm , con f continua sobre A, y una cantidad > 0 arbitraria. La continuidad de f en
cada punto de x A nos asegura que para cada uno de ellos existe x > 0 tal que f (Bx (
x) A) B (f (
x)).
Sin duda que nuestro primer impulso para encontrar una sola > 0 para la cual la contencion anterior
se cumpla, para esa y para toda x A, sera tomar la mnima (o el nfimo, para ser mas precisos) de
entre todas las x , pero a estas alturas ya sabemos que esa mnima (o el nfimo) de todas ellas no tiene
por que ser mayor que cero.
Ante esta situaci on, vale la pena observar lo siguiente: el conjunto A siempre est a contenido (o queda
cubierto) por la uni on de todas las vecindades Bx (
x), es decir
[
A Bx (
x)
x
A
Mas aun, podemos tomar la mitad de cada uno de los radios x (o la tercera parte, o la cuarta parte, o
cualquier otra cantidad menor!) y se sigue cumpliendo que
[
A B x (
x)
2
x
A
Si de entre todas estas vecindades (o bolas) se puede encontrar un n umero finito de ellas que sigan
teniendo la propiedad de que cubren a A, es decir que existen x k A tales que
1 , . . . , x
x1 ) B xk (
A B x1 ( xk )
2 2
83 J. P
aez
entonces podemos elegir = min{x1 /2, . . . , xk /2} (la cual s sera mayor que 0 puesto que ahora s estamos
tomando el mnimo de un conjunto finito), cantidad para la cual se va a satisfacer el siguiente hecho: si
, y A son tales que k
x x yk < entonces existe j {1, . . . , k} tal que
, y Bxj (
x xj )
es decir, que x
y y pertenecen a la misma vecindad.
La afirmacion anterior (que mas adelante daremos su prueba) resulta ser muy importante puesto que
xj ) A) B (f (
ahora, dado que f (Bxj ( xj )), por una sencilla aplicacion de la desigualdad del triangulo,
tendremos que
kf (
x) f (
y)k = k(f (
x) f (
xj )) (f (
xj ) f (
y ))k
kf (
x) f (
xj )k + kf (
xj ) f (
y )k
<+
= 2
y por lo tanto, ya que fue una cantidad arbitraria, podemos concluir que f es uniformemente continua!
Como seguramente el lector habr a notado, la hipotesis que resulta determinante en la argumentacion que

acabamos de dar est x) | x A
a en el supuesto de que, para cada familia (o conjunto) de vecindades Bx /2 (
que cubren al conjunto A (familia de vencindades que depende de cada cantidad > 0 que se tome), existe
una subfamilia finita que sigue teniendo la propiedad de cubrir a A.
Los conjuntos que tienen esta propiedad (o una equivalente, en donde las vecindades se sustituyen por
conjuntos abiertos arbitrarios), reciben el nombre de conjuntos compactos, los cuales introducimos en la
siguiente
on 2.56 Sean K Rn y {U Rn | I} una familia de subconjuntos abiertos de Rn indexada

Definici
por un conjunto I. Decimos que:
1. la familia de subconjuntos U ={U Rn | I} es una cubierta (abierta) de K si

[
K U
I
2. el conjunto K es un conjunto compacto si toda cubierta (abierta) U ={U Rn | I} de K tiene

una subcubierta finita, es decir, si existen 1 , . . . , k I tales que
K U1 Uk
Con base en esta definicion, ya estamos en condiciones de formular un resultado que da respuesta a la
pregunta que hicimos sobre el recproco de la proposicion 2.54, el cual dejaremos plasmado en el siguiente
Teorema 2.57 Sean f : A Rn Rm y K A. Si f es continua sobre K y K es un conjunto compacto

entonces f es uniformemente continua sobre K.
Demostraci on. Sea > 0. Como f es continua para cada x K, sabemos que existe x > 0 tal que
x) K) B/2 (f (
f (Bx ( x)). Dado que la familia de vecindades U ={Bx /2 (
x) | x
K} es una cubierta
abierta de K, sabemos que existen x 1 , . . . , xk K tales que
K B x1 (
x1 ) B xk (
xk ) (2.8)
2 2
Tomamos
x1 x
= min ,..., k >0
2 2
y sean x, y K tales que k
x yk < . Por la contencion 2.8 sabemos que existe j {1, . . . , k} tal que
B xj (
x xj )
2
J. P
aez 84
y como k
x yk < xj /2 se tiene que
k
yx
j k = k(
yx xx
) + ( j )k
kyx k + k
x xj k
xj
<+
2
xj
de donde y Bxj ( , y Bxj (

xj ). Asi, como x xj ) K concluimos que
kf (
x) f (
y)k = k(f (
x) f (
xj )) (f (
xj ) f (
y ))k
kf (
x) f (
xj )k + kf (
xj ) f (
y )k

< +
2 2
=
y por lo tanto que f es uniformemente continua sobre K.
No podemos ignorar que al lector le parecera un tanto m agica la forma en que hemos introducido el
concepto de conjunto compacto, raz on por la cual dedicaremos los ultimos resultados de esta secci
on (y de
este captulo!) a establecer una caracterizacion (en Rn ) muy importante de este tipo de conjuntos.
En efecto, existe un conocido y muy importante teorema que da una caracterizacion de los conjuntos
compactos, el teorema de Heine-Borel3 , el cual establece que en Rn , los conjuntos compactos no son mas
que nuestros muy conocidos conjuntos cerrados y acotados!
Teorema 2.58 (de Heine-Borel) Sea K Rn . K es un conjunto compacto si y s

olo si K es un conjunto
cerrado y acotado.
Demostraci on. (=) Primero mostraremos que K es un conjunto acotado. Para ello, consideremos la
familia U ={Bk (
0) | k N} de subconjuntos abiertos de Rn . Dado que
[
Bk (0) = Rn
kN
entonces U es una cubierta abierta de K, de modo que existen k1 , . . . , kl N tales que
K Bk1 (0) Bkl (0)
de tal forma que, si N = max{k1 , . . . , kl } se tiene que
K Bk1 (0) Bkl (0)

= BN (0)
de donde concluimos que K est a acotado.

Para probar que K es cerrado, mostraremos que K c := Rn \ K es un conjunto abierto. Sea x
Rn \ K y
n n
para cada k N hacemos Uk = R \ B1/k ( x); dado que B1/k ( y R | k
x) = { yxk 1/k} es un conjunto
cerrado, Uk es un conjunto abierto, y como
\
x) = {
B1/k ( x}
kN
3 Heinrich Eduard Heine (16 de marzo de 1821, Berlin21 de octubre de 1881, Halle) matem atico aleman. Heine es conocido
por sus resultados sobre funciones especiales y en analisis real. En particular, escribi
o un importante tratado sobre funciones
armonicas esfericas y funciones de Legendre. Tambien investigo series hipergeometricas b
asicas e introdujo la f
ormula Mehler
Heine.
F
elix Edouard
Justin Emile Borel (7 de enero de 18713 de Febrero 1956) fue un matem atico y poltico franc
es. Como
matem atico, es conocido por su trabajo fundacional en las
areas de teora de la medida y probabilidad. (fuente: Wikipedia).
85 J. P
aez
se tiene que
K Rn \ {
x}
\
= Rn \ B1/k (
x)
kN
[
= Rn \ B1/k (
x)
kN
[
= Uk
kN
de tal forma que U = {Uk | k N} es una cubierta abierta de K. Como K es compacto, existen k1 , . . . , kl N
tales que
K Uk1 Ukl

= Rn \ B1/k1 ( x) Rn \ B1/kl (
x)
= Rn \ B1/N (
x)
en donde N = max{k1 , . . . , kl }. Por tanto
x) B1/N (
B1/N ( x)
n
R \K
con lo que concluimos que Rn \ K es abierto y por lo tanto que K es cerrado.

(=) Supongamos ahora que K Rn es un conjunto cerrado y acotado. Para esta implicacion procede-
remos por contradiccion. Supongamos entonces que K no es comparto. Bajo este supuesto, entonces debe
existir una cubierta abierta U = {U | I} de K tal que ning umero finito de elementos de U sigue
un n
cubriendo a K.
Ahora, por el problema 20 del captulo 1, sabemos que cada U se puede expresar como la union de bolas
(o vecindades) con centro en un punto de Qn y radio racional.
Dado que Qn y los racionales (positivos) son conjuntos numerables, entonces la familia V de todas las
vecindades de este tipo que son necesarias para expresar a todos los U como union de estas, tambien
es numerable, y por lo tanto existe una sucesion { xk } de puntos en Qn y una sucesion {rk } de n umeros
xk ) | k N} satisface las siguientes condiciones:
racionales positivos tales que la familia de bolas V = {Brk (
1. para cada k N existe I tal que Brk (

xk ) U , y
2. [ [
Brk (
xk ) = U
kN I
Notese que, dado que no existen un n umero finito de elementos de U que cubra a K, por el inciso 1
tampoco existe un n umero finito de elementos de V que cubra a K; y por el inciso 2, dado que U es una
cubierta abierta de K, V tambien es una cubierta abierta de K.
Ahora, para cada k N, hacemos
Ak = (Rn \ (Br1 (
x1 ) Brk (
xk ))) K
Observese que estos conjuntos Ak satisfacen las siguientes condiciones, para cada k N:
a. Ak 6= (recuerde que no existe un n

umero finito de elementos de V que cubra a K),
x1 ) Brk (
b. Ak+1 Ak (pues Br1 ( x1 ) Brk (
xk ) Br1 ( xk ) Brk+1 (
xk+1 )), y
c. Ak es cerrado y acotado (es la interseccion de dos conjuntos cerrados, uno de los cuales, K, est
a
acotado)
J. P
aez 86
Por tanto, por el problema 34 del captulo 1, se tiene que

\
6= Ak
kN
\
= (Rn \ (Br1 (
x1 ) Brk (
xk ))) K
kN
!
\
n
= x1 ) Brk (
(R \ (Br1 ( xk ))) K
kN
!
[
n
= R \ x1 ) Brk (
(Br1 ( xk )) K
kN
!
[
n
= R \ Brk (
xk ) K
kN
xk ) | k N} tambien es una cubierta de K, se debe tener que

Por otra parte, como V = {Brk (
[
K Brk (
xk )
kN
y por tanto que !

[
n
R \ Brk (
xk ) K =
kN
Con esta contradiccion, concluimos nuestra prueba.
Como seguramente el lector recordara, los conjuntos cerrados y acotados son viejos conocidos para
nosotros, pues junto con los conjuntos conexos, son el tipo de conjuntos que preservan sus caractersticas
bajo funciones continuas, resultado que dejamos formulado en el teorema 2.50.
De esta forma, y como una consecuencia inmediata del teorema de Heine-Borel, podemos reescribir el
teorema 2.50 diciendo ahora que los conjuntos compactos tambien se preservan bajo funciones continuas.
Y aunque no hara falta hacer ninguna prueba de este hecho, haremos otra muy sencilla, en la que solo
usaremos la (singular) caracterizaci
on de la continuidad de una funci on dada en la proposicion 2.47, y
algunas propiedades elementales de la imagen inversa establecidas en la proposicion 2.13.
Teorema 2.59 Sean f : A Rn Rm continua en A y K A. Si K es un conjunto compacto entonces

f (K) es es un conjunto compacto.
Demostraci on.
Sea V = {V | I} una cubierta (de abiertos en Rm ) de f (K). Por la proposicion 2.47, sabemos que
para cada V V existe U Rn abierto tal que f 1 (V ) = U A. Ahora, dado que
K f 1 (f (K))
!
[
1
f V
I
[
= f 1 (V )
I
[
= (U A)
I
!
[
= U A
I
87 J. P
aez
Captulo 2. Funciones de Rn en Rm 2.4. Problemas
y que K A, se tiene que U = {U | I} es una cubierta abierta de K, y como K es compacto, entonces

existen 1 , . . . , k I tales que
K U1 Uk
Usando nuevamente que K A, tenemos que
K (U1 Uk ) A
= (U1 A) (Uk A)
= f 1 (V1 ) f 1 (Vk )
y por tanto

f (K) f f 1 (V1 ) f 1 (Vk )
= f (f 1 (V1 )) f (f 1 (Vk ))
V1 Vk
con lo que concluimos que f (K) es compacto.
2.4 Problemas
1. Considere las siguientes funciones definidas para algun subconjunto A R2 . En cada caso identifique
al conjunto A y haga un esbozo de su grafica.
p
i) f (x, y) = x2 + y 2 ii) f (x, y) = 1 x2 iii) f (x, y) = x2 + y 2
1
iv) f (x, y) = xy v) f (x, y) = x2 +y 2 vi) f (x, y) = x2 y 2
2. Sean g : A R2 R, k R y (x0 , y0 ) R2 . Determine el dominio (y describa o esboce la grafica) de

las siguientes funciones en terminos del dominio (de la grafica) de g:
i) f (x, y) = g(x, y) + k ii) f (x, y) = kg(x, y)
iii) f (x, y) = g(x, y) iv) f (x, y) = g(x x0 , y y0 )
3. Determine los conjuntos de nivel de cada una de las siguientes funciones:
i) f (x, y) = x2 y 2 ii) f (x, y) = 2xy iii) f (x, y, z) = x2 y 2 + z 2 iv) f (x, y, z) = yz
4. Determine cual es el conjunto f (A), si:
on f : R2 R3 est
(a) la funci a definida como f (x, y) = (x cos(y), x sen(y), x) y A = R2

on f : R2 R3 est
(b) la funci a definida como f (x, y) = x2 cos(y), x2 sen(y), x2 y A = R2

on f : R2 R3 est
(c) la funci a definida como f (x, y) = x cos(y), x sen(y), x2 y A = R2
(d) la funcion f : R2 R3 est
a definida como f (x, y) = (a cos(x), a sen(x), y), a > 0, y A =
[0, 2] R R2
on f : R2 R3 est
(e) la funci a definida como
f (x, y) = (r cos(x) sen(y), r sen(x) sen(y), r cos(y))
r > 0, y A = [0, 2] [/2, /2] R2
J. P
aez 88
2.4. Problemas Captulo 2. Funciones de Rn en Rm
on f : R2 R3 est
(f) la funci a definida como
p p
f (x, y) = x2 + 1 cosh(y), x2 + 1 senh(y), x
y A = R2

on f : R2 R3 est
(g) la funci a definida como f (x, y) = x + y, x y, x2 y 2 y A = R2
on de R2 en R3 cuya imagen coincida con el elipsoide

5. Encuentre una funci
x2 /a2 + y 2 /b2 + z 2 /c2 = 1
6. Considere las siguientes funciones:
(a) f (x, y) = (x sen(y), x cos(y)); cu

al es la imagen bajo esta funci
on de las rectas de la forma x = c
y y = d, con c y d cualesquiera n umeros reales?
(b) f (x, y) = (ex sen(y), ex cos(y)); cu
on de las rectas de la forma
x = c y y = d, con c y d cualesquiera n umeros reales?
(c) f (x, y, z) = (x cos(y), x sen(y), z); cu
on de los planos de la forma
x = c, y = d y z = k, con c, d y k cualesquiera n umeros reales?
(d) f (x, y, z) = (x sen(y) cos(z), x sen(y) sen(z), x cos(y)); cu
on de los
planos de la forma x = c, y = d y z = k, con c, d y k cualesquiera n umeros reales?
7. Sean g = (g1 , g2 ), h : R2 \ {(0, 0)} R2 definidas como sigue:

p
g1 (x, y) = x2 + y 2

arctan xy si x > 0

2 si x = 0 yy>0

g2 (x, y) = 2 si x = 0 yy<0

arctan xy +

si x < 0 yy0

arctan xy

si x < 0 yy<0
y h(x, y) = g(x, y + /2), en donde arctan toma sus valores entre /2 y /2.
(a) determine cuales son los conjuntos g(R2 \ {(0, 0)}) y h(R2 \ {(0, 0)})
(b) pruebe que (f g)(x, y) = (x, y) = (f h)(x, y) para toda (x, y) R2 \ {(0, 0)}
on definida en el inciso a. del problema 6, para cuales (x, y) R2 se satisface que
(c) si f es la funci
(g f )(x, y) = (x, y)? para cuales (x, y) R2 se satisface que (h f )(x, y) = (x, y)?
8. Pruebe la proposicion 2.13 y de ejemplos de funciones en los que las contenciones de los incisos 7, 8, 9
y 10 sean propias.
9. Sea f : A Rn R. Pruebe que para toda c R existe h : A Rn R tal que Nc (f ) = N0 (h).
10. Sea f : A Rn Rm .
(a) pruebe que existe H : A Rn Rm+n tal que Gf = H(A).
(b) pruebe que existe h : U Rm+n R tal que Gf = N0 (h) = h1 ({0}).
11. Decimos que L : Rn Rm es una funci on lineal, si L(
x + y) = L( y ) para todos , R,
x) + L(
y para todos x
89 J. P
aez
(a) L(0) =
0
on constante cero (de Rn en Rm ) es la u
(b) la funci nica funci
on constante que es lineal
(c) existe M 0 tal que kL(
x)k M k Rn
xk para toda x
(d) si L : R2 R es una funci
on lineal entonces la grafica de L es un plano que pasa por el origen
(e) cualquier plano cuya ecuaci
on sea de la forma
Ax + By + Cz = 0
con C 6= 0, coincide con ser la gr on lineal L : R2 R (de las variables x y

afica de alguna funci
y).
(f) si L : R3 R, con L diferente de la funci
on constante cero, entonces cualquier conjunto de nivel
de L es un plano
12. Determine cuales de las siguientes sucesiones convergen y su punto de convergencia (si es que convergen)
xk = (k sen(1/k), (1 + 1/k)k )}
i)) { xk = (sen(k)/k, (1 + k)1/k )}
ii) {
k k+1
xk = (ak + bk )1/k , kck , (1)k (1 + 1/k))}
iii) { xk = ((k 2 + 1)1/8 (k + 1)1/4 , k+1
iv) { k )}
13. Pruebe que una sucesion {xk } en Rn converge al punto x

0 Rn si y solo si la sucesion de n
umeros
reales {k
xk x
0 k} converge a 0.
xk } una sucesion en Rn que converge al punto x0 Rn . Pruebe que la sucesion de n

14. Sea { umeros reales
{k
xk k} converge a k 0 Rn ?
x0 k. Es cierto lo recproco para cualquier x
15. En la definicion 2.16 sustituya la norma euclideana por la norma uno y la norma infinito y pruebe que
la proposicion 2.17 sigue siendo cierta con cada una de ellas. Con base en lo anterior, pruebe que todas
estas definiciones de convergencia son equivalentes.
16. Pruebe la proposicion 2.18, usando la proposicion 2.17 y sin usar dicha proposicion.
18. En la definicion 2.19 sustituya la norma euclideana por la norma uno y la norma infinito y pruebe que
la proposicion 2.20 sigue siendo cierta con cada una de ellas. Con base en lo anterior, pruebe que todas
estas definiciones son equivalentes.
19. Pruebe, sin usar la proposicion 2.17, la proposicion 2.23 (sugerencia: recuerde (o pruebe) que si {kl }
umeros narurales (es decir que kl < kl+1 para toda l N) entonces l kl
es una sucesion creciente de n
para toda l N).
xk } una sucesion en Rn cuyo rango A es finito. Pruebe que existe y A y una subsucesion {
20. Sea { xkl }
xk } tal que xkl = y para toda l N.
de {
xk } una sucesion en Rn cuyo rango A es infinito. Pruebe que:

21. Sea {
(a) si { 0 Rn entonces x
xk } converge al punto x 0 es el u
nico punto de acumulaci
on de A.
(b) si x0 es un punto de acumulaci on de A entonces existe una subsucesion {xkl } de {
xk } que converge
a x0 .
n o
(1) (n) (i)
22. Sea x k = xk , . . . , xk una sucesion en Rn . Pruebe que: {
xk } est
a acotada si y solo si {xk } est
a
acotada para cada i {1, . . . , n}.
xk } es una sucesion de Cauchy en Rn entonces cualquier subsucesion {

23. Pruebe que, si { xkl } de {
xk },
tambien es de Cauchy.
J. P
aez 90
xk } una sucesion de Cauchy en Rn . Pruebe, directamente de la definicion, que:

24. Sea {
(a) la sucesion {
xk } est
a acotada
xk } es finito entonces existe N N tal que xk = x0 para toda k N
(b) si el rango de {
(c) si {
xkl } es una subsucesion de { 0 Rn , entonces {
xk } que converge a x xk } converge a x
0
25. Pruebe el corolario 2.21 sin usar la proposicion 2.20 (sugerencia: para probar que la condicion de
Cauchy es suficiente para la convergencia, use el problema anterior y el teorema de Bolzano-Weierstrass).
26. Determine si la siguientes proposiciones son falsas o verdaderas. Pruebe sus respuestas.
xk } en Rn es convergente entonces su rango tiene un u

(a) si una sucesion { nico punto de acumulaci
on
xk } en Rn es tal que su rango tiene un u
(b) si una sucesion { nico punto de acumulaci
on entonces
{
xk } es convergente
xk } en Rn no convergente que tiene una u
(c) existe una sucesion { nica subsucesion convergente
xk } en Rn no convergente cuyo rango tiene un u
(d) existe una sucesion { nico punto de acumulaci
on
27. Pruebe, usando el teorema de Bolzano-Weierstrass y sin usar el caso real, el teorema 2.28 (sugerencia:
analice dos casos: cuando el rango de { xk } es finito, en cuyo caso sera u
til el problema 20, y cuando el
rango de {xk } es infinito, en cuyo caso sera u
til el teorema de Bolzano-Weierstrass y el inciso (b) del
problema 21).
28. Pruebe, sin usar el teorema de Bolzano-Weierstrass y el caso real, el teorema 2.28 (sugerencia: use que
los naturales son infinitos y el teorema de los rectangulos anidados, imitando el metodo de la cacera
del le
on usado en la prueba del teorema de Bolzano-Weierstrass).
29. Sea A Rn . Pruebe que:
0 A si y solo si existe una sucesion {

(a) x xk } en A tal que {
xk } converge a x
0
0 A si y solo si existe una sucesion {
(b) x xk } en A \ {
x0 } tal que {
xk } converge a x0
0 es un punto aislado de A y {
(c) si x xk } A es una sucesion que converge a x
0 , entonces existe
N N tal que x 0 para toda k N
k = x
31. Sea f : A R Rn y x0 R.
(a) Defina el concepto de lmite lateral (por la izquierda y por la derecha) de f en x0 ; es decir, defina
lo que significa que
l Rn sea tal que
l = lim f (x)
xx+
0
o que
l = lim f (x)
xx
0
Para dar estas definiciones, que condicion es necesario que cumpla el punto x0 ? es suficiente
que x0 A ? Justifique su respuesta.
(b) Con base en las definiciones anteriores (y suponiendo que x0 satisface las condiciones que hayan
hecho falta), pruebe que
l = lim f (x) si y solo si l = lim f (x) y l = lim f (x)

xx0 +
xx0 xx0
32. Determine si las siguientes funciones tienen lmite en el punto que se indica. Pruebe su respuesta.
91 J. P
aez
x3 y 2 x3 +xy 2 x2 yy 3
i) f (x, y) = x6 +y 4 en (0, 0) ii) f (x, y) = x2 +y 2 en (0, 0)
x2 (y1) x2 y+x2
iii) f (x, y) = x4 +(y1)2 en (0, 1) iv) f (x, y) = x2 +y 2 +2y+1 en (0, 1)
xy+yz+zx
v) f (x, y, z) = x2 +y 2 +z 2 en (0, 0, 0) vi) f (x, y, z) = xy+yz+zx
2 2 2
en (0, 0, 0)
x +y +z
x3 y 4 xy 3
vii) f (x, y) = x4 +y 4 en (0, 0) viii) f (x, y) = x2 +y 6 en (0, 0)
x3 +y 4 x2 y 5
ix) f (x, y) = x2 +y 2 en (0, 0) x) f (x, y) = x2 +(y1)2 en (0, 1)
33. Determine en que puntos de su dominio son continuas las funciones g y h definidas en el problema 7.
Pruebe su respuesta.
0 A y
34. Sean f : A Rn Rm , x x) si y solo si l = limh
l Rm . Pruebe que l = limxx0 f ( 0 f (

x + h).
35. Sean f, g : A Rn Rm y x0 A . Pruebe que, si g est a acotada en una vecindad agujerada de

0 (es decir que existen r > 0 y M > 0 tales que kg(
x x)k M para toda x (Br (
x0 ) \ {
x0 }) A) y
x) =
limxx0 f ( 0 entonces limxx0 (g f )(
x) = 0.
36. Sean f : A Rn Rm y x x) = 0 si y solo si limxx0 kf (

0 A . Pruebe que limxx0 f ( x)k = 0.
37. En la definicion 2.35 sustituya la norma euclideana por las normas uno e infinito y pruebe que todas
38. Sean f, g : A Rn Rm , x
0 A y k N. Pruebe que, si
kf (
x) g(
x)k
lim k
=0
x

x0 k
x x0 k
entonces
kf (
x) g(x)k
lim s =0
x

x0 kxx 0 k
para toda s Z tal que s k.
39. Sea L : Rn Rm una funci on lineal, es decir que L( x + y) = L( y ) para todos , R,

x) + L(
, y Rn . Pruebe que, si
y para todos x

L(h)
lim =0

h 0
h
on constante cero (L 0).

entonces L es la funci
40. Sean f : A Rn Rm , x0 A y l Rm tales que l = limxx0 f (

x). Determine si las siguientes
afirmaciones son ciertas. Pruebe sus respuestas.
(a) l (f (A))
(b) si D Rm es tal que
l D y (A f 1 (D)) 6= entonces x0 (A f 1 (D))
(c) si las afirmaciones anteriores no son ciertas, de hipotesis adicionales sobre la funci
on f para que
estas s sean ciertas
41. Pruebe la proposicion 2.33, primero usando la proposicion 2.18, y despues usando solo la definicion
2.35.
42. Pruebe las proposiciones 2.39, 2.40 y 2.41.
J. P
aez 92
43. Sea f : A Rn Rm continua en x x0 ) 6= 0. Pruebe que:

0 A tal que f (
x) 6=
(a) existe > 0 tal que f ( B (
0 para toda x x0 ) A
(b) existen c > 0 y > 0 tales que kf (
x)k c para toda x x0 ) A
B (
45. Sea f : A Rn Rm . Pruebe que: f es continua en A si y solo si para todo conjunto cerrado
C Rm , existe un conjunto cerrado D Rn tal que f 1 (C) = D A.
46. Sea f : A Rn Rm . Pruebe que:

A f (B) para todo B A
(a) f es continua en A si y solo si f B
(b) f es continua en A si y solo si f (B A) f (B) para todo B A
47. Pruebe que:
(a) A = {(x, y) R2 | 1 < x2 + y} es un conjunto abierto

(b) A = {(x, y, z) R3 | (zx + zy)/(x2 + y 2 ) < 0} es un conjunto abierto
(c) A = {(x, y) R2 | y = 1/x} es un conjunto cerrado
48. Sean f : U Rn R, x
0 U , (a, b) R tal que f (U ) (a, b) y g : (a, b) R R. Definimos
: U Rn R como
g(f (x))g(f (x0 ))
f (
x)f (x0 ) x) f (
si f ( x0 ) 6= 0
(
x) =

g (f (
x0 )) x) f (
si f ( x0 ) = 0
Pruebe que, si f es continua en x

0 y g es derivable en f (
x0 ) entonces es continua en x
0 .
49. Pruebe que las siguientes funciones son continuas en su dominio:
(a) f : Rn R definida como f (

x) = k
xk
(b) f : Rn R definida como f (
x) = f (x1 , . . . , xn ) = xi , donde i {1, . . . , n}
(c) L : Rn Rm cualquier funci
on lineal
50. Sea
S n1 = {
x Rn | k
xk = 1}
Pruebe que S n1 es un conjunto cerrado.
51. Sean, A Rn un abierto, x A, y (A A )c y f : [0, 1] R Rn continua tal que f (0) = x

y
f (1) = y. Pruebe que existe t (0, 1) tal que f (t) F r(A).
52. Sea f : A Rn R continua en A, con A conexo y tal que f (

x) 6= 0 para toda x A. Pruebe que
f ( A o f (
x) > 0 para toda x A.
x) < 0 para toda x
53. Sea f : A Rn Rm continua en A, con A conexo y tal que kf ( 6 1 para toda x A. Pruebe
x)k =
que si kf ( 0 A entonces kf (
x0 )k < 1 para alguna x x)k < 1 para toda x A.
54. Sean f : A Rn R continua en A, y B A conexo, cerrado y acotado. Pruebe que existen a, b R

tales que f (B) = [a, b].
55. Sea A Rn un conjunto cerrado y acotado y y Ac . Pruebe que existe x 0 A tal que k
y
x0 k k
x
yk
para todo x A. Muestre, con un ejemplo, que esta afirmaci on no es valida si no suponemos que A es
cerrado. Esta afirmaci
on sigue siendo valida si solo suponemos que A es cerrado? Pruebe su respuesta.
93 J. P
aez
56. Sean A, B Rn conjuntos cerrados y acotados tales que A B = . Pruebe que existen x 0 A y
y0 B tales que k
y0 x
0 k kx yk para todo x
A y para todo y B. Muestre, con un ejemplo, que
esta afirmacion no es valida si no suponemos que A es cerrado. Esta afirmaci on sigue siendo valida si
solo suponemos que A es cerrado? Pruebe su respuesta.
57. Sea f : A Rn Rm continua, con A cerrado y acotado. Pruebe que existen x
0 , x1 A tales que
kf (
x0 )k kf (
x)k kf ( A.
x1 )k para toda x
58. Sea f : A Rn Rm continua e inyectiva en A, con A cerrado y acotado. Pruebe que f 1 : f (A)
Rm Rn (la funcion inversa de f ) es continua en f (A). Esta afirmaci
on se sigue cumpliendo si A no
es cerrado? Pruebe su respuesta.
59. En la definicion 2.52 sustituya la norma euclideana por las normas uno e infinito y pruebe que todas
61. Pruebe que la funci
on definida en el ejemplo 2.55 es uniformemente continua sobre cualquier subcon-
junto B R2 \ {(0, 0)} que no tenga como punto de acumulaci on al (0, 0).
62. Sea L : Rn Rm una funci
on lineal. Pruebe que L es uniformemente continua en Rn .
63. Sean f : A Rn Rm uniformemente continua en A y {
xk } A una sucesion de Cauchy. Pruebe
que {f (
xk )} es una sucesion de Cauchy.
64. Sea A Rn . Definimos fA : Rn R como fA (

x) = dist( x yk | y A} (para cada
x, A) := inf{k
Rn ). Pruebe que:
x
(a) fA ( A
x) = 0 si y solo si x
(b) fA es uniformemente continua en Rn (sugerencia: pruebe que |fA (
x) fA (
y )| k
x yk para
, y Rn )
todo x
(c) si A, B Rn est
an separados entonces existen U, V Rn abiertos tales que A U , B V y
U V = (sugerencia: considere la funci
on f ( x) fB (
x) = fA ( x))
J. P
aez 94
Captulo 3
La derivada de funciones de R en Rn
Con este breve captulo damos inicio al estudio del concepto de derivacion para funciones de varias variables,
pero a diferencia del captulo anterior, empezaremos haciendolo solo para el caso de funciones de R en Rn .
Como tambien mencionamos anteriormente, dado que lo importante de las funciones de este tipo es
su imagen, estas suelen ser utiles para describir objetos geometricos a los que (bajo ciertas condiciones)
nos referiremos como curvas; o para describir el movimiento de un objeto, raz on por la cual a estas
funciones tambien las conoceremos con el nombre de trayectorias. Y justo a partir de estos dos usos es
que motivaremos su concepto de derivada, pero previamente daremos algunos ejemplos de ambas formas
de usarlas.
3.1 Geometra y movimiento

Aun y cuando a estas alturas el lector posiblemente no conozca una definicion precisa de lo que significa la
palabra curva (definici on que precisaremos mas adelante), cualquiera que esta fuera debiera de abarcar a
objetos geometricos tan conocidos como las rectas y las c onicas en el plano.
A falta de tal definicion y a manera de ejemplo, por ahora solo nos limitaremos a mostrar que, entre otros
muchos objetos geometricos, las rectas y las c onicas se pueden obtener como la imagen de una funci on de
R en R2 . Tal es el caso de las rectas en el plano (R2 ) las cuales podemos pensar en general como un conjunto
definido de la siguiente forma:
R = {(x, y) R2 | ax + by + c = 0}
en donde a2 + b2 > 0.
on de R en R2 , consiste en observar que,
Una forma muy sencilla de ver a R como la imagen de una funci
2 2
como a + b > 0, entonces a 6= 0 o b =
6 0 de modo que si suponemos que sucede lo primero, entonces para
cualquier (x, y) R se tiene que
c by
x= (3.1)
a
de tal forma que a la pareja (x, y) la podemos escribir como

c by
,y
a
es decir, la podemos escribir en terminos de una sola variable (o de un solo par

ametro, que es el temino que se
suele usar en este contexto), de tal forma que basados en lo anterior, es facil comprobar que si consideramos
on1 : R R2 dada por
la funci
c bt
(t) = ,t
a
se tiene que (R) = R.
1 Es un que se usen letras griegas para nombrar a las funciones de R en Rn .
com
95
Captulo 3. La derivada de funciones de R en Rn 3.1. Geometra y movimiento
otese que para toda t R se tiene que

En efecto, n

c bt
a + bt + c = (c bt) + bt + c
a
=0
con lo cual concluimos que (R) R. Por otra parte, si (x, y) R, por la identidad 3.1 tenemos que bastara
tomar t = y para que se cumpla que

c by
(y) = ,y
a
= (x, y)
con lo que concluimos que R (R) y por lo tanto que (R) = R.

Aunque laborioso (pero no difcil), tambien se puede probar que la circunferencia con centro en el origen
(de un sistema coordenado cartesiano dado) de radio r > 0 dada por
Cr = {(x, y) R2 | x2 + y 2 = r2 }
on : [0, 2) R2 dada por

se puede obtener como la imagen de la funci
(t) = (r cos(t), r sen(t))
O que la elipse E R2 dada por

x2 y2
E= (x, y) R2 | + =1
a2 b2
on : [0, 2) R2 dada por

(t) = (a cos(t), b sen(t))
abola P R2 dada por

O que la par
P = {(x, y) R2 | y = x2 }
on : R R2 dada por
(t) = (t, t2 )
Aun y cuando todava no tenemos todo lo necesario para definir lo que significa que un subconjunto de
Rn sea una curva, con base en estos ejemplos ya podemos definir lo que significa que una de estas funciones
parametrice a un conjunto C Rn .
En general, si C Rn es tal que coincide con la imagen de una funcion de R en Rn , diremos que dicha
funci
on es una parametrizaci
on de C.
on 3.1 Sea C Rn . Si existe = (1 , . . . , n ) : I R Rn tal que (I) = C decimos que es

Definici
una parametrizaci
on de C. En este caso diremos que las identidades
x1 = 1 (t)
x2 = 2 (t)
..
.
xn = 2 (t)
son unas ecuaciones parametricas de C.
J. P
aez 96
3.1. Geometra y movimiento Captulo 3. La derivada de funciones de R en Rn
Con relacion a la definicion anterior, es importante llamar la atenci

on al hecho de que a la funci
on no
se le pide ninguna propiedad. Identificar los subconjuntos de Rn para los cuales existe una parametrizaci on,
es sin duda un problema interesante (y tal vez no muy difcil), pero que est a fuera de los objetivos de este
texto.
De hecho, hablando de propiedades de funciones de R en Rn , hemos definido ya lo que significa que una
de estas funciones sea continua, y sin duda otra pregunta interesante sera la siguiente: que subconjuntos
de Rn tienen una parametrizaci on que sea continua?
Este es un problema mucho mas interesante (y difcil!) que el anterior, y para los deseosos en saber algo
al respecto, les recomendamos investigar acerca de las llamadas curvas de Peano 2 .
Como seguramente el lector ya habr a notado, mas que responder estas preguntas, el objetivo de este
texto est
a centrado en desarrollar las propiedades que pueden tener este tipo de funciones, entre la cuales se
encuentra la de la derivabilidad.
Con respecto a la misma definicion 3.1, tambien vale la pena destacar el uso que se hace del artculo
una. En efecto, n otese que si I R y son como en dicha definicion, y se tiene que : J R R es
tal que (J) = I, entonces : J R Rn definida como = es tal que (J) = C y por tanto sera
otra parametrizaci on de C. Es decir, si un subconjunto C Rn tiene una parametrizaci on, entonces con
base en ella podemos obtener mas parametrizaciones del mismo conjunto.
Por esta misma raz on, lo mas adecuado es decir que
x = r cos(t)
y = r sen(t)
para t [0, 2), son unas ecuaciones parametricas de la circunferencia de radio r > 0 con centro en el
origen, y que
x = r sen(2t)
y = r cos(2t)
para t [0, 1), son otras ecuaciones parametricas de la misma circunferencia.

Otro tipo de objeto geometrico que se puede obtener como la imagen de una funci on de R en R2 es
uno con el cual el lector debe estar muy familiarizado: la grafica de una funcion de R en R. En efecto, si
f : I R R sabemos que la gr afica de f es un subconjunto de R2 definido como

Gf := (x, f (x)) R2 | x I
on : I R R2 dada por (t) = (t, f (t)) es una parametrizaci

y es muy facil comprobar que la funci on de
Gf .
Como el lector seguramente estar a de acuerdo, la observaci on anterior incrementa sustancialmente la
cantidad de subconjuntos de R2 que podemos describir como la imagen de una funci on de R en R2 . Ahora
sabemos que subconjuntos como las gr aficas de la funciones f (x) = |x| o f (x) = sen(x) se pueden obtener
de esta forma (ver figura 3.1).
Concluimos esta breve seccion mostrando c omo las funciones de R en Rn resultan ser una herramienta
adecuada para describir el camino o trayectoria seguido por un objeto. Para ello, recurriremos a un
conocido ejemplo el cual justamente se puede plantear en estos terminos de la siguiente forma: suponga que
se tiene una rueda, la cual vamos a rodar (sin resbalar) en lnea recta y sobre una superficie plana, y sobre
dicha rueda hacemos una marca.
Nuestro objetivo es encontrar una funci on que nos proporcione la posicion (una vez establecido un sis-
tema cartesiano de referencia) de dicha marca, conforme la rueda va girando. Para ello, simplificaremos el
problema sustituyendo la rueda por una circunferencia de radio r > 0, a la marca por un punto P de dicha
circunferencia, supondremos que la posicion inicial de la circunferencia es tal que su centro C se encuentra
en el punto de coordenadas (0, r) y que las correspondientes al punto P est an dadas por (0, 2r) (ver figura
3.2 (a)). Tambien supondremos que la circunferencia rueda hacia la derecha, en la direcci on positiva del eje
X.
2 Giuseppe Peano (Spinetta, 27 de agosto de 1858 Turn, 20 de abril de 1932) fue un matem
atico, l
ogico y fil
osofo italiano,
conocido por sus contribuciones a la l
ogica matem
atica y la teora de n
umeros.
97 J. P
aez
Captulo 3. La derivada de funciones de R en Rn 3.1. Geometra y movimiento
Figura 3.1: Las graficas de la funciones f (x) = |x| y f (x) = sen(x) se pueden obtener como la imagen de una
funcion R en R2 .
Una cuestion muy importante en este tipo de problemas es la eleccion de la variable (o par ametro, que es
el termino que se suele usar en estos casos) en terminos de la cual queremos expresar la posicion del punto
que nos interesa. Esta eleccion depende en general del problema que se este tratando (lo que significa que
no existen reglas para su eleccion).
En el caso que nos ocupa, una vez que la circunferencia haya rodado una cierta distancia (que supondremos
fue peque na), el punto P del cual nos interesa describir su movimiento ocupara una nueva posicion, y las
coordenadas de esta nueva posicion las vamos a determinar usando el angulo formado por la semirecta
(paralela al eje Y ) que parte del centro de la circuferencia (en direcci
on hacia arriba), y el segmento de recta
que une al centro C con el punto P , angulo que denotaremos por la letra y que de acuerdo a la observaci on
que hicimos antes, jugara el papel de par ametro (ver figura 3.2 (b)).
b
P r
b b P
Q

r b r b b
C C
(a) (b)
Figura 3.2: Deducci

on de una parametrizaci
on de la cicloide.
Lo primero que haremos sera encontrar las nuevas coordenadas del centro C de la circunferencia des-
plazada, y para ello es importante hacer notar que la distancia recorrida por dicho centro, dado que la
circunferencia rueda sin resbalar, coincide con la longitud del arco subtendido por el angulo opuesto a , la
cual est
a dada por r. De esta forma, las coordenadas del centro C son (r, r).
Si ahora observamos que para obtener las coordenadas del punto P , basta con tomar las de punto C y
sumarle la longitud de los correspondientes catetos del triangulo rectangulo formado por los puntos C, P y Q
(ver figura 3.2 (b)), concluimos que las nuevas coordenadas de P est an dadas por (r + r sen(), r + r cos()).
J. P
aez 98
3.2. La derivada Captulo 3. La derivada de funciones de R en Rn
on de R en R2 definida como
Por tanto, la funci
() = r( + sen(), 1 + cos())
describe el movimiento del punto P en terminos del angulo . En la figura 3.3 se muestra la imagen de esta
funcion para [0, 2] y representa a la trayectoria seguida por el punto P cuando la circunferencia ha
realizado una vuelta completa, trayectoria conocida con el nombre de cicloide.
b
P
2
Figura 3.3: Trayectoria seguida por el punto P cuando la circunferencia (de radio 1) ha realizado una vuelta
completa, trayectoria conocida con el nombre de cicloide.
Existen una buena cantidad de interesantes trayectorias definidas de manera analoga, pero desafortu-
nadamente no est a entre los objetivos de este libro profundizar en este tipo de ejemplos3 . Nuestro objetivo
principal en este captulo es introducir el concepto de derivada para funciones de R en Rn , y lo motivaremos
a partir del uso de estas en la geometra y en la fsica, raz
on por la cual analizamos solo estos pocos ejemplos.
3.2 La derivada
Dada una funci on : I R Rn con la cual describimos a un conjunto C Rn , si este tiene el aspecto
de una lnea doblada (como por ejemplo una c onica), nos vamos a plantear el problema de encontrar la
recta tangente a C en un punto x 0 .
Si t0 I es tal que (t0 ) = x
0 y t I es cercano a t0 , ver a la diferencia
(t) (t0 ) (3.2)
como una flecha nos da la oportunidad de obtener la recta que pasa por x 0 y que sigue la direcci on
determinada por (t) (t0 ) (ver problema 3) suponiendo, por supuesto, que esta flecha no es el vector 0.
Como se muestra en la figura 3.4 esta recta es secante a la curva C y en la medida de que t este mas
cercano a t0 , dicha secante se ver
a cada vez mas como una tangente.
La construccion anterior estara muy bien si no fuera por el hecho de que la diferencia 3.2 se parecera
cada vez mas al vector 0 en la medida de que t este mas cercano a t0 (sobre todo si es una funci on
continua, lo que seguramente sucedera en la mayora de los casos que sean de nuestro interes), con lo cual
perdemos toda oportunidad de definir una recta.
La solucion que daremos a este problema sera que, en lugar de considerar al vector 3.2, vamos a
considerar al vector dado por la expresion
1 (t) (t0 )
((t) (t0 )) = (3.3)
t t0 t t0
con el cual, si no es el vector

0, podemos seguir construyendo rectas secantes a C.
3 Para el lector interesado en conocer m
as ejemplos de este tipo, le recomendamos visitar el sitio de internet: www-
history.mcs.st-and.ac.uk/Curves/Curves.html
99 J. P
aez
Captulo 3. La derivada de funciones de R en Rn 3.2. La derivada
b b
(t0 ) b
b
(t)
Figura 3.4: Si el vector (t) (t0 ) no es el vector 0, la recta cuya direcci

on esta determinada por este y que
pasa por el punto (t0 ), es una recta secante a la curva C que tiende a ser tangente (en (t0 )) si t tiende a t0 .
Una raz on por la cual vamos a considerar al vector 3.3 es que este no solo nos sigue proporcionando
informacion de cual es la direccion que tiende a ser tangente al conjunto C en el punto x0 , sino que
ademas su norma nos da informaci on sobre la raz
on de cambio (con respecto a la distancia entre t y t0 ) de
la distancia entre los puntos (t) y (t0 ).
M as adelante, cuando veamos a como una funci on que describe el movimiento de un objeto, tambien
veremos que el vector 3.3 es la forma mas adecuada de medir la velocidad promedio de dicho objeto y,
en ultima instancia, veremos como este vector se relaciona de manera muy adecuada con el concepto de
derivada para funciones de R en R, justo del tipo que son las funciones coordenadas de .
Como seguramente el lector ya lo intuye, lo siguiente que haremos sera fijarnos en el
(t) (t0 )
lim
tt0 t t0
y en caso de que este exista (y que no sea el vector 0, lo que no siempre podemos asegurar), si a dicho lmite
lo denotamos (casualmente) por (t0 ), sin duda que la recta definida parametricamente por la expresion
(t0 ) + t (t0 )
con t R, es una recta que tiene el aspecto y las caractersticas adecuadas para ser llamada la recta
tangente a C en el punto x0 = (t0 ).
Con base en la discusi
on anterior, damos las siguientes definiciones.
on 3.2 Sea : I R Rn , con I un intervalo. Dado t0 I decimos que es derivable en t0 si
Definici
(t) (t0 )
lim
tt0 t t0

existe. Este lmite lo denotamos por (t0 ) y lo llamamos la derivada de en t0 , es decir
(t) (t0 )
(t0 ) := lim
tt0 t t0
Observaci on 3.3 En virtud de que la definici on anterior la restringimos a funciones cuyo dominio es un
intervalo, es importante senalar que en caso de que t0 I fuera un extremo de I, el lmite que se deber
a
tomar ser a el correspondiente lmite lateral y cuya definici
on fue dada por el lector en el problema 31 del
captulo 2.
Definicion 3.4 Sea C Rn y x0 C. Si : I R Rn es una parametrizaci on de C tal que (t0 ) = x0
para alguna t0 I y (t0 ) 6=
0, decimos que la recta definida (parametricamente) como
R(t) := (t0 ) + t (t0 )
es la recta tangente a C en x
0 .
J. P
aez 100
Con relaci on a esta ultima definion, es necesario hacer algunas observasiones importantes. La primera de
ellas es que, aun y cuando el aspecto geometrico del conjunto C en el punto x 0 nos de la impresion de que
existe la recta tangente, esto no significa que con cualquier parametrizaci on de C sea posible calcularla.
Esto se debe fundamentalmente al hecho de que, a pesar de que exista una parametrizaci on : I
R Rn de C tal que (t0 ) = x 0 y derivable en t0 , nada nos garantiza que se satisfaga la condicion de que
(t0 ) 6= 0. En el siguiente ejemplo mostramos un conjunto y dos parametrizaciones de este que ilustran las
dos posibilidades en el c alculo de la recta tangente.
Ejemplo 3.5 Sea C = {(x, y) R2 | y = x2 }. Considere las siguientes parametrizaciones de C.
1. Sea : R R2 dada por

(t) = (t, t2 )
Como el lector facilmente puede comprobar, es una parametriazaci
on de C y en particular en el punto
(0) = (0, 0) se tiene que
(t) (0)
(0) = lim
t0 t0
= lim (1, t)
t0
= (1, 0)
de tal forma que la recta
l(t) = (0) + t (0)

= (0, 0) + t(1, 0)
= (t, 0)
que no es mas que el eje X, es tangente a C en el punto (0, 0).

(t) = (t3 , t6 )
Como en el caso anterior, tambien es f acil comprobar que es una parametrizaci

on de C y que
(0) = (0, 0). Por otra parte, se tiene que
(t) (0)
lim = lim (t2 , t5 )
t0 t0 t0
= (0, 0)
de modo que (0) = (0, 0) y por lo tanto la parametrizaci

on no proporciona un vector que permita
construir la recta tangente a C en el (0, 0).
Otra observacion importante es que la existencia misma de (t0 ) no tiene mucho que ver con el aspecto
geometrico que tenga el conjunto C en el punto x 0 = (t0 ).
on de R en R cuando
A diferencia de lo que suceda con el aspecto geometrico de la grafica de una funci
esta era derivable en un punto, si el conjunto C tiene un pico en x 0 esto no significa que (t0 ) no exista,
como el lector puede comprobar f acilmente en el caso de la cicloide (figura 3.3), la cual tiene un pico en
el punto (, 0) = () a pesar de que () si existe (lo que se deduce de un resultado que probaremos mas
adelante).
Otra ilustraci
on de este mismo hecho lo tenemos justo con la grafica de la funci on valor absoluto, como
lo veremos en el siguiente
Ejemplo 3.6 Sea C R2 la gr on f (x) = |x|; es decir, C = {(x, |x|) R2 | x R}.

afica de la funci
Considere las siguientes parametrizaciones de C.
101 J. P
aez
Captulo 3. La derivada de funciones de R en Rn 3.2. La derivada

(t) = (t, |t|)
N
otese que para esta parametrizaci
on de C (la m un) no existe (0) pues por una parte
as com
(t) (0) 1
lim+ = lim+ (t, t)
t0 t0 t0 t
= (1, 1)
mientras que
(t) (0) 1
lim = lim (t, t)
t0 t0 t0 t
= (1, 1)
de tal forma que, por el problema 31 del captulo 2

(t) (0)
(0) = lim
t0 t0
no existe.
2. Sea ahora : R R2 dada por

(t2 , t2 ) si t 0
(t) =
(t2 , t2 )

si t 0
Tambien es f
acil ver que esta es una parametrizaci
on de C y n
otese que ahora
(t) (0) 1
t0+ t0 t0+ t
= lim+ (t, t)
t0
= (0, 0)
y
(t) (0) 1
t0 t0 t0 t
= lim (t, t)
t0
= (0, 0)
de tal forma que, por el mismo problema 31 del captulo 2, se tiene que (0) si existe y es igual al
vector (0, 0).
Con base en los ejemplos anteriores se concluye que, si C R2 es un conjunto que se puede parametrizar
por una funci on y (t) existe, si este vector es diferente del vector 0, solo entonces se podra asegurar
que C es un conjunto que no tiene un pico en el punto (t) (en cuyo caso, y por razones obvias, diremos
que el conjunto C es suave en el punto (t)). Y si (t) = 0 entonces no podemos asegurar nada sobre el
aspecto geometrico de C en el punto (t).
Para concluir con las observaciones relacionadas con la definicion de recta tangente que hemos dado, es
importante recordar que este es un concepto que el lector ya conoce para cierto tipo de conjuntos en R2 ,
especficamente aquellos que se obtienen como la grafica de una funci on de R en R.
Por otra parte, y como vimos en la primera secci on de este captulo, si f : I R R sabemos que la
grafica de f es un subconjunto de R2 definido como

Gf := (x, f (x)) R2 | x I
J. P
aez 102
on : I R R2 dada por (t) = (t, f (t)) es una parametrizaci

y que la funci on de Gf .
En el problema 8 de este captulo, el lector probar on f es derivable en t0 I, entonces
a que, si la funci
la parametrizacion tambien es derivable en t0 y ademas que la recta tangente dada en la definicion 3.4
no es mas que una forma parametrica de la recta tangente que le fue definida en su primer curso de c alculo
diferencial.
De la observacion anterior se concluye que la definicion de recta tangente dada en la defincion 3.4 amplia
a la familia de subconjuntos de R2 para los cuales ahora tenemos definido este concepto.
Lo que haremos a continuacion sera dar un ejemplo de un subconjunto de R2 el cual no se puede ver
(completo) como la gr afica de una funci on de R en R (aunque en el captulo 5 probaremos un importante
resultado que nos asegura que algunas partes de este s se pueden ver de esa forma), pero que s se puede
parametrizar y que por lo tanto, con base en la definicion 3.4, podremos calcular su recta tangente en algunos
de sus puntos.
Adicional a lo anterior, en este ejemplo tambien mostraremos c omo se puede encontrar la parametrizaci on
de un subconjunto de R2 que est a definido a traves de coordenadas polares.

Ejemplo 3.7 Sea C = x = (r, ) R2 | 0 2, r = 2(1 + cos()) , en donde la pareja (r, ) representa
coordenadas polares del punto x.
Este conjunto es conocido como la curva cardiode (ver figura 3.5).
Figura 3.5: La curva cardiode cuya ecuacion polar esta dada por r = 2(1 + cos()).
Lo primero que haremos ser a calcular una parametrizacion de C. Dado que este conjunto est a descrito
en termino de coordenadas polares, y que las operaciones de suma y producto por un escalar de vectores
(operaciones que es necesario realizar para el calculo de la derivada de una parametrizacion) no se pueden
expresar en forma sencilla en este tipo de coordenadas, lo primero que haremos ser
a describir a los elementos
de C en terminos de coordenadas cartesianas.
De esta forma, aplicando las ecuaciones de cambio de coordenadas vistas en el captulo 1, tendremos que,
si (x, y) representan las coordenadas cartesianas de x C, entonces
x = r cos()
= 2(1 + cos()) cos()
y = r sen()
= 2(1 + cos()) sen()
es decir que
C = (2(1 + cos()) cos(), 2(1 + cos()) sen()) R2 | 0 2
103 J. P
aez
Captulo 3. La derivada de funciones de R en Rn 3.3. Propiedades de la derivada
de modo que si definimos : [0, 2] R2 como

() = (2(1 + cos()) cos(), 2(1 + cos()) sen())
ser
a una parametrizacion de C expresada en terminos de las coordenadas cartesianas de sus elementos.
Ahora que ya contamos con una parametrizaci on de C, para calcular la derivada de esta, haremos uso
del primer resultado que formularemos en la siguiente seccion (proposici
on 3.8), lo que sin lugar a dudas
constituye un peque
no y breve abuso, que esperamos el lector disculpe.
Con base en este resultado, tendremos que
() = (2 sen() cos() 2(1 + cos()) sen(), 2 sen() sen() + 2(1 + cos()) cos())

= 2 sen() 4 sen() cos(), 2 cos() + 2 cos2 () sen2 ()
= (2 sen() 2 sen(2), 2 cos() + 2 cos(2))
de donde podemos concluir que, por ejemplo, la recta tangente a la cardiode en el punto (/2) = (0, 2) es
la recta parametrizada por
(/2) + t (/2) = (0, 2) + t (2, 2)
= (2t, 2t + 2)
es decir, la recta cuya ecuaci
on cartesiana es y = x + 2. An
alogamente, la recta tangente a la cardiode en el
punto (3/2) = (0, 2) es la recta parametrizada por
(3/2) + t (3/2) = (0, 2) + t (2, 2)
= (2t, 2t 2)
on cartesiana es y = x 2.
es decir, la recta cuya ecuaci
Concluimos esta secci on mencionando otra interpretaci on del concepto de derivada que hemos introducido.
Cuando a una funci on : I R Rn la utilizamos para describir el movimiento de un objeto, y en
particular el par
ametro (o la variable) t del cual depende la funci on representa al tiempo, de tal forma
que para un valor especfico t0 I, (t0 ) representa su posicion en este instante, sin duda el lector estar
a de
acuerdo en que si, t I es otro instante muy cercano a t0 , entonces el vector
1 (t) (t0 )
((t) (t0 )) =
t t0 t t0
contiene informaci on muy valiosa del movimiento descrito por cerca del instante t0 .
En efecto, este vector nos da informaci on de hacia donde se est
a moviendo nuestro objeto (a partir de
su posicion en el tiempo t0 ), y su norma nos da un promedio de la rapidez con la que se est a moviendo
cerca del instante t0 .
En virtud de lo anterior, se suele decir que este vector representa la velocidad promedio de nuestro
objeto durante el intervalo de tiempo comprendido entre t0 y t.
Como seguramente el lector ya est a imaginando, si
(t) (t0 )
lim
tt0 t t0
existe, dicho valor lmite (que tambien es un vector) se puede interpretar como la velocidad de nuestro objeto
en el instante t0 , o como se suele decir, la velocidad instant
anea de nuestro objeto, en el instante t0 .
3.3 Propiedades de la derivada

Como hicimos en el caso de los conceptos de lmite y continuidad, lo siguiente que haremos sera mostrar la
estrecha relacion que existe entre la derivada de una funci on : I R Rn y sus funciones coordenadas
1 , . . . , n (en un sistema de referencia dado), las cuales seran funciones de R en R y para las que ya conocemos
el concepto de derivada.
Como seguramente el lector ya intuye, la derivabilidad de la funci on es una condicion necesaria y
suficiente de la derivabilidad de sus funciones coordenadas, resultado que dejamos plasmado en la siguiente
J. P
aez 104
3.3. Propiedades de la derivada Captulo 3. La derivada de funciones de R en Rn
Proposici on 3.8 Sea = (1 , . . . , n ) : I R Rn y t0 I. es derivable en t0 si y s

olo si cada i es
derivable en t0 , para i {1, . . . , n}. En ambos casos se tiene que
(t0 ) = (1 (t0 ), . . . , n (t0 ))
La prueba de esta proposicion es una consecuencia inmediata de la proposicion 2.30 del captulo 2 y se
deja al lector.
Lo siguiente que haremos sera mostrar la relacion que existe entre el concepto de derivada y las operaciones
aritmeticas entre funciones de este tipo. Con base en la proposicion anterior, los correspondientes resultados
de derivacion para funciones de R en R, y la proposicion 2.33 del captulo 2, la prueba de estas propiedades
es inmediata y tambien se dejan al lector.
Proposicion 3.9 Sean , : I R Rn , t0 I y h : I R R. Si , y h son derivables en t0

entonces:
1. + es derivable en t0 y adem
as
( + ) (t0 ) = (t0 ) + (t0 )
2. h es derivable en t0 y adem
as
(h) (t0 ) = h (t0 )(t0 ) + h(t0 ) (t0 )
En particular, si h es la funci
on constante c, entonces
(c) (t0 ) = c (t0 )
3. : I R R es derivable en t0 y adem
as
( ) (t0 ) = (t0 ) (t0 ) + (t0 ) (t0 )
4. si n = 3, es derivable en t0 y adem
as
( ) (t0 ) = (t0 ) (t0 ) + (t0 ) (t0 )
Otras operaciones que podemos realizar con una funci on de R en Rn , es la composicion por la izquierda
n m
con una funcion de R en R , o por la derecha con una funci on de Rm en R.
Dado que habr a que esperar hasta los captulos 3 y 4 para contar con un concepto de derivada para
funciones de Rn en Rm (con n > 1), y que hasta este momento para funciones de Rm en R, solo sabemos
c
omo derivarlas cuando m = 1, por ahora nos vamos a conformar con formular un resultado (la primera
regla de la cadena de este texto!) que establece condiciones para que la composicion (por la derecha) de una
on de R en Rn con otra de R en R sea derivable, y una formula para calcular su derivada.
funci
Proposicion 3.10 Sean J R un intervalo, h : J R R, : I R Rn , t0 I y x0 J tales que

h(J) I y h(x0 ) = t0 . Si h es derivable en x0 y es derivable en t0 entonces h es derivable en x0 y
ademas
( h) (x0 ) = (h(x0 ))h (x0 )

= (t0 )h (x0 )
Si = (1 , . . . , n ) entonces h = (1 h, . . . , n h) de modo que la prueba de esta proposicion tambien

es una consecuencia inmediata de la proposicion 3.8 y de la regla de la cadena para funciones de R en R,
por lo que se deja al lector.
La prueba tambien se puede hacer sin recurrir a las funciones coordenadas y a la proposicion 3.8, imitando
la prueba para funciones de R en R, lo que se pide hacer en el problema 6 de este captulo.
105 J. P
aez
Captulo 3. La derivada de funciones de R en Rn 3.3. Propiedades de la derivada
ormula para calcular ( h) (x0 ) es importante mencionar que, aun y cuando para escribir
En cuanto a la f
la multiplicacion de un escalar por un vector siempre hemos puesto primero al escalar, en esta ocasion lo
hemos escrito despues del vector con la idea de conservar la forma en que se suele expresar la regla de la
cadena.
Como en el caso de las funciones de R en R, la derivabilidad de una funci on de R en Rn en un punto
t0 implica la continuidad de esta en dicho punto. Como es de esperarse, esto tambien es una consecuencia
inmediata de la proposicion 3.8 y del correspondiente resultado para el caso real, lo que dejamos expresado
en la siguiente
on 3.11 Sean : I R Rn y t0 I. Si es derivable en t0 entonces es continua en t0 .

Proposici
Aun y cuando ya mencionamos que la prueba de esta proposicion es una consecuencia inmediata de la
proposicion 3.8 y del correspondiente resultado para el caso real, esta tambien se puede hacer imitando la
prueba que se hace en este caso observando que
(t) (t0 )
(t) (t0 ) = (t t0 )
t t0
para todo t 6= t0 , de modo que
(t) (t0 )
lim ((t) (t0 )) = lim (t t0 )
tt0 tt0 t t0
= (0) (t0 )
= 0
y de donde concluimos que es continua en t0 .

Sin duda, el resultado mas importante relacionado con el concepto de derivada de funciones de R en R,
es el Teorema del Valor Medio. Lamentablemente este teorema no se puede generalizar a funciones de R en
Rn y los siguientes ejemplos ilustran tan desafortunado hecho.
Ejemplo 3.12 Considere las siguientes funciones:
1. : [1, 1] R R2 dada por

(t2 , t2 ) si 1 t 0
(t) =
(t2 , t2 )

si 0 t 1
N
otese que

2t(1, 1) si 1 t < 0

(t) = (0, 0) si t = 0

2t(1, 1) si 0 < t 1
de modo que no existe (1, 1) para el cual se satisfaga que
(1) (1) = (1 (1)) ()

= 2 ()
ultiplo escalar de (t) para

puesto que el vector (1) (1) = (1, 1) (1, 1) = (2, 0) no es un m
un valor de t (1, 1) (figura 3.6 (a)).
ning
2. : [0, 1] R R3 dada por (t) = (cos(2t), sen(2t), t). Entonces
(t) = (2 sen(2t), 2 cos(2t), 1)
J. P
aez 106
3.3. Propiedades de la derivada Captulo 3. La derivada de funciones de R en Rn
de modo que no existe (0, 1) tal que

()
(1) (0) = (2 0)
= (4 sen(), 4 cos(), 2)
puesto que (1) (0) = (0, 0, 1) y 2 6= 1. De hecho, dado que para ning un valor de t las funciones
sen(2t) y cos(2t) son simult aneamente cero (recuerde que sen2 (2t)+cos2 (2t) = 1 para toda t R),
el vector (1) (0) nunca es paralelo (o m ultiplo escalar) de (t) para ning
un valor de t (figura
3.6 (b)).
Z
Y
(1) (1)
b b
1
(1) (0)
Y
1 1 X X
(a) (b)
Figura 3.6: El teorema del Valor Medio no se puede generalizar a funciones de R en Rn . Como lo muestran
estos ejemplos, los vectores (1) (1) y (1) (0) no son paralelos a la derivada de y , respectivamente,
evaluada en algun punto intermedio.
No obstante los ejemplos anteriores, se puede formular una cierta versi on parecida al Teorema de Valor
Medio (solo para funciones de R en R2 ) que se puede probar justamente como una consecuencia del Teorema
del Valor Medio Generalizado de Cauchy para funciones de R en R, y que se deja como problema al lector
(problema 12).
Concluiremos esta seccion, introduciendo el concepto de derivada de orden superior para una funci on de
R en Rn . De forma analoga a lo que sucede en el caso de funciones de R en R, si una funci o n : I R Rn
es derivable para cada t del intervalo J I, entonces la funci on : J R Rn que a cada t J asocia la

derivada de en t, es decir t 7 (t), es nuevamente una funci on de J R en Rn .
Si esta funci
on tambien resulta ser derivable en cada punto de J, se define entonces la segunda derivada
de , que denotamos por o por (2) , como la funci
on : J R Rn dada por
(t) := ( ) (t)
(t + h) (t)
:= lim
h0 h
para cada t J.
Siguiendo este procedimiento, en general podemos dar de manera inductiva la siguiente
Definicion 3.13 Sean : I R Rn derivable para cada t del intervalo J I, y n N. Si (1) (t) := (t)
(n)
y a definida y es derivable para cada t J, definimos (inductivamente) la n + 1 derivada de en t,
est
que denotamos por (n+1) (t), como
(n+1) (t) := ( (n) ) (t)
(n) (t + h) (n) (t)
:= lim
h0 h
para cada t J.
En las siguientes secciones daremos las posibles interpretaciones que se le pueden dar a las derivadas de
orden superior, dependiendo del contexto en el que se este trabajando.
107 J. P
aez
Captulo 3. La derivada de funciones de R en Rn 3.4. Derivada y geometra
3.4 Derivada y geometra

Una vez que ya contamos con el concepto de derivada para funciones de R en Rn , tenemos todo lo necesario
para definir el concepto de curva, el cual constituye uno de los usos mas importantes de este tipo de funciones.
Definicion 3.14 Sea C Rn . Decimos que C es una curva si existe : I R Rn derivable en el
intervalo I tal que (I) = C. Si ademas (t) 6= 0 para toda t I decimos que C es una curva suave (o
regular). Como ya se menciono en la definicion 3.1, decimos que es una parametrizacion de C.
Si es una funci on derivable que parametriza a un conjunto C, ademas de proporcionarnos una forma
de encontrar una ecuaci on (parametrica) de su recta tangente en (t) (si (t) 6= 0), la derivada de nos
puede ser u til para resolver el siguiente problema geometrico: apoyados en la idea intuitiva que tengamos
de lo que es (o debiera de ser!) la longitud de C, c omo calcular esta longitud?
Para abordar este problema, vamos a suponer que la curva se puede parametrizar por una funci on
: [a, b] R Rn , la cual es derivable en el intervalo [a, b] y que ademas es inyectiva.
Es intuitivamente claro que si elegimos un n umero finito de puntos en C, digamos x 0 , . . . , x
k , de tal
forma que x0 y que x k sean sus extremos y que x i1 y xi sean consecutivos para i {1, . . . , k}, entonces
la suma
Xk
k
xi x
i1 k
i=1
es una aproximacion a la longitud de C, y que esta aproximacion sera mejor en la medida de que tomemos
mas (y muy bien distribuidos) puntos en C (ver figura 3.7).
k
x
b
b
i1
x b
i
x
C b
b
b b
0
x
Figura 3.7: La suma de las distancias entre los puntos consecutivos x

i1 y xi es una muy buena aproximaci
on a
la longitud de C.
De la suposicion de que parametriza a la curva C y que es inyectiva, al conjunto de puntos { k }

x0 , . . . , x
le corresponde una partici on P ={t0 , . . . , tk } del intervalo [a, b] tal que xi = (ti ) para i {1, . . . , k}. De
esta forma, tenemos entonces que
k
X k
X
k
xi xi1 k = k(ti ) (ti1 )k
i=1 i=1
y la suma de la derecha sera una buena aproximacion a la longitud de C si P es una partici on muy fina
del intervalo [a, b]. Ahora lo que haremos sera analizar mas de cerca c omo se puede expresarvcada vector
(ti ) (ti1 ).
Aun y cuando ya mostramos que el Teorema del Valor Medio no se cumple en general para funciones de
R en Rn , lo que s podemos asegurar es que, si = (1 , . . . , n ), aplicando el Teorema del Valor Medio (para
funciones de R en R) a cada una de estas funciones coordenadas, entonces para cada j {1, . . . , n} se sabe
(j)
que existe i (ti1 , ti ) tal que

(j)
j (ti ) j (ti1 ) = j i (ti ti1 )
de tal forma que

(ti ) (ti1 ) = (1 (ti ) 1 (ti1 ), . . . , n (ti ) n (ti1 ))
J. P
aez 108
3.4. Derivada y geometra Captulo 3. La derivada de funciones de R en Rn

(1) (n)
= 1 i (ti ti1 ), . . . , n i (ti ti1 )

(1) (n)
= 1 i , . . . , n i (ti ti1 )
Si ahora suponemos tambien que cada funci on coordenada de j es continua (lo que es equivalente a que

sea continua) en el intervalo cerrado [a, b], entonces el vector

(1) (n)
1 i , . . . , n i
a a la derivada (i ) evaluada en cualquier i (ti1 , ti ) (y este parecido sera mucho mejor

se parecer
nuevamente cuando la partici on P sea una partici on muy fina del intervalo [a, b]) de tal forma que

(1) (n)
k(ti ) (ti1 )k = 1 i , . . . , n i

(ti ti1 )
k (i )(ti ti1 )k
= k (i )k (ti ti1 )
En virtud de lo anterior, si la suma
k
X
k
xi x
i1 k
i=1
on P sea una partici
es una buena aproximacion a la longitud de C en la medida de que la partici on cada
vez mas fina del intervalo [a, b], entonces con la suma
k
X
k (i )k (ti ti1 )
i=1
sucedera lo mismo, y lo relevante de la conclusi

on anterior es que esta u ltima suma tiene la peculariedad de
ser una suma de Riemann correspondiente a la funci on f (t) = k (t)k (para t [a, b]) por lo que dicha suma
se aproxima a la integral
Zb
k (t)k dt (3.4)
a
y esta aproximacion sera mejor justo cuando P sea una partici on muy fina del intervalo [a, b]!
Resumiendo la discusi on anterior (y todas las aproximaciones que ah aparecen!), todo parece indicar
que, si C Rn es una curva que se puede parametrizar por una funci on : [a, b] R Rn , la cual es
n
derivable en el intervalo [a, b], inyectiva y ademas : [a, b] R R es continua, entonces su longitud
debera estar dada por la integral 3.4.
Con el fin de reforzar esta conclusi on, mostraremos en el siguiente ejemplo que esto sucede as, cal-
culando la integral anterior con una curva (y una parametrizaci on de ella) para la cual ya conocemos su
longitud.
Ejemplo 3.15 Sea C R2 la circunferencia de radio r > 0 con centro en un punto x
0 = (x0 , y0 ).
Mostraremos que, si tomamos la parametrizaci
on de C dada por la funci
on
(t) = (r cos(t) + x0 , r sen(t) + y0 )
con t [0, 2], y calculamos la integral dada en 3.4, dicha integral vale 2r, que como sabemos desde hace
mucho tiempo, es el permetro de la cincunferencia C.
En efecto, n otese que (t) = (r sen(t), r cos(t)) de modo que
k (t)k = r
para toda t [0, 2] y por lo tanto tenemos que
Zb Z2

k (t)k dt = rdt
a 0
= 2r
109 J. P
aez
Como mencionamos al inicio de toda esta discusi on, la realidad es que a estas alturas no contamos (salvo
por algunos casos especficos) con una definicion de longitud de una curva, y justo lo que estamos a punto
de hacer es llenar ese vaco.
En realidad definiremos (aprovechando que la integral 3.4 solo depende de la funci on ) lo que llamaremos
la longitud asociada a esta parametrizaci on y unicamente cuando cumpla con ciertas condiciones (como
por ejemplo, que sea inyectiva, salvo tal vez por un n umero finito de puntos de su dominio) dicha longitud
asociada la podremos interpretar como la longitud de la curva que est a parametriza por .
Todo ello lo recogemos en la siguiente
on 3.16 Sea : [a, b] R Rn tal que k (t)k es integrable en [a, b]. Definimos la longitud de
Definici
(que denotamos por l()) como
Zb
l() := k (t)k dt
a
Si es una funcion inyectiva en [a, b], salvo quizas por un n

umero finito de puntos, y C = ([a, b])
entonces el n
umero l() dado en la definicion anterior se puede interpretar como la longitud de C. De
hecho, con base en esta idea de longitud, podemos definir una funcion : [a, b] R R como
Zt
(t) = k (u)k du
a
cuyo valor en t [a, b] tambien se puede interpretar como la longitud del subarco de C dado por ([a, t]).
Si ademas de la inyectividad de en casi todo su dominio, tenemos que k (t)k es una funci
on continua
de t (lo que se satisface si es continua en [a, b]), por el Teorema Fundamental del Calculo sabemos que
sera una funcion derivable y que
(t) = k (t)k 0
lo que significa que siempre resulta ser una funcion no decreciente en el intervalo [a, b] cuya imagen es el
intervalo [0, l()].
on es que, si ademas (t) 6= 0 para toda t [a, b] (es decir que C = ([a, b])
Lo interesante de esta funci
es una curva suave (o regular)) entonces
(t) = k (t)k > 0
de modo que en este caso es una funci on estrictamente creciente en el intervalo [a, b], y por tanto su
funcion inversa 1 : [0, l()] R [a, b] R existe, la cual, dado que es continua y (t) 6= 0 para toda
t [a, b], por el Teorema de la Funcion Inversa (para funciones de R en R), tambien es derivable.
Lo importante de la discusi on anterior es que, si C = ([a, b]) es una curva suave (o regular), entonces a
traves de la funcion 1 podemos obtener otra parametrizaci on de C, dada por
= 1 : [0, l()] R Rn
la cual resulta tener propiedades muy relevantes.

A este tipo de parametrizaci on de C se le conoce con el nombre de parametrizaci on por longitud de arco
(para el caso de la parametrizaci on este nombre es muy adecuado puesto que su par ametro s = (t)
[0, l()] es justo la longitud del subarco ([a, t])) de C), y la ultima parte de esta seccion la dedicaremos a
mostrar algunas de sus caractersticas.
Antes de hacer esto, es importante llamar la atenci on a la forma en que construimos a la parametrizaci on
a partir de la parametrizaci on original , que es un caso particular de una relacion mas general que
puede haber entre dos parametrizaciones de una misma curva C, relacion que da lugar al concepto de
reparametrizaci on, el cual definiremos antes de estudiar las propiedades especficas de la parametrizaci
on (o
reparametrizaci on) por longitud de arco.
J. P
aez 110
Definici on 3.17 Sean C Rn una curva y : I R Rn una parametrizaci on (derivable) de C. Decimos

que : J R Rn , una funci
on derivable, es una reparametrizaci on de si existen J R y : J R R
derivable, tales que (J) = I y (s) = ( )(s) para toda s J. Si (s) 0 para toda s J decimos que
on de , y si (s) 0 para toda s J decimos que invierte la orientaci
preserva la orientaci on de .
Dada una parametrizaci on : [a, b] R Rn de una curva C Rn , una reparametrizaci on de
que siempre se puede construir, es la que se obtiene a partir de la funci on : [a, b] [a, b] dada por
(t) = a + b t. Como (a) = b y (b) = a, la funci on tiene la propiedad de que ( )(a) = (b)
y ( )(b) = (a), es decir, parametriza al conjunto C con la particularidad de que su punto inicial
( )(a) es el punto final (b) de , y su punto final ( )(b) es el punto inicial (a) de (ver figura 3.8),
raz
on por la cual a esta reparametrizaci on se le suele denotar por .
Por todo lo anterior, y dado que
() (t) = ( ) (t)
= ((t)) (t)
= (a + b t)
se tiene que recorre a C en la direcci
on contraria en que la recorre .
C C
(b) ()(a)
b b
b b
(a) ()(b)
Figura 3.8: Las parametrizaciones y de la misma curva C.
Como se mostro en los p arrafos previos a la definicion 3.17, y a diferencia de la reparametrizaci on

, la reparametrizaci on por longitud de arco solo se puede obtener si C Rn es una curva suave y
: [a, b] R Rn es una parametrizaci on de C tal que (t) es continua y diferente de 0 para toda
t [a, b].
Sin duda una propiedad muy caracterstica de la reparametrizaci on por longitud de arco de una curva
suave C, es la referente a la rapidez con que la recorre.
En efecto, como se puede observar en la reparametrizaci on que se obtiene a partir de una parametrizaci on
definida sobre un intervalo [a, b], queda definida sobre el intervalo [0, l()] de tal manera que su par ametro
s vara dentro de un intervalo que tiene la misma longitud que la curva C.
De esta forma, pareciera que para recorrer a esta curva, a la parametrizaci on le bastara con recorrer
una unidad de distancia sobre C por cada unidad de distancia que recorra el par ametro s, lo que en
terminos de rapidez, significa que esta ultima tendra que valer 1.
Esta propiedad, que mas adelante mostraremos con todo rigor que efectivamente la tiene la reparametriza-
cion , la tomaremos justo como base para definir lo que significa en general que una curva C Rn este
parametrizada por longitud de arco.
Definicion 3.18 Sea C Rn una curva y : I R Rn una parametrizaci on (derivable) de C. Decimos
on por longitud de arco de C si k (t)k = 1 para toda t I.
que es una parametrizaci
De la definicion anterior se desprende inmediatamente que si C Rn es una curva que posee una
parametrizacion por longitud de arco, entonces C es una curva suave (o regular).
Lo que a continuacion haremos sera mostrar que toda curva suave (o regular) C Rn que tenga una
parametrizacion : I R Rn que ademas de ser derivable, su derivada tambien sea continua, entonces
tiene una parametrizaci on por longitud de arco.
La forma en que construiremos esta parametrizaci on es b
asicamente la misma que usamos para contruir
la reparametrizaci on en los p
arrafos anteriores.
111 J. P
aez
Proposici on 3.19 Sea C Rn una curva suave. Si : I R Rn es una parametrizaci on de C tal que
(t) es continua y diferente de

0 para toda t I entonces C tiene una parametrizaci
on por longitud de arco.
on. Sea t0 I un punto fijo; definimos : I R R como

Demostraci
Zt
(t) = k (u)k du (3.5)
t0
Por el Teorema Fundamental del C

alculo sabemos que es derivable y que ademas
(t) = k (t)k
para toda t I. De esta forma, dado que (t) = k (t)k > 0 (adem as de ser continua), por el Teorema de
on Inversa (para funciones de R en R), sabemos que es invertible y que su inversa 1 , que est
la Funci a
definida sobre el intervalo (I), tambien es derivable.
Definimos : (I) R Rn como (s) = ( 1 )(s) para cada s (I). Claramente es una
parametrizaci on de C (puesto que es una reparametrizaci on de ), y por la regla de la cadena probada en la
proposicion 3.10, tenemos que
(s) = ( 1 ) (s)
= (1 (s))(1 ) (s)
de modo que
(s) = (1 (s))(1 ) (s)

1
= (1 (s)) 1
( (s))
1
= (1 (s)) 1
k ( (s))k

(s)k = 1
k
para cada s (I).
Con relacion a la construcci

on de la parametrizaci on por longitud de arco que se da en la prueba de la
proposicion anterior, es importante hacer dos observaciones.
La primera de ellas tiene que ver con el hecho de que no toda parametrizaci on por longitud de arco de
una curva C, se puede obtener siguiendo la misma construcci on. Aunque sutil, esto es un hecho que hay que
mencionar y que se deja al lector probarlo por medio de un ejemplo (ver problema 18).
La segunda observaci on tiene que ver justo con la construccion de la parametrizaci on que se hace en
la prueba de la proposicion. Desde un punto de vista teorico, la construcci on que ah se da es impecable;
sin embargo (y para ser sinceros), desde un punto de vista practico, obtener una expresion explcita para
puede resultar ser una tarea muy difcil (y en algunos casos imposible!).
Esta dificultad (o imposibilidad) est a relacionada con el hecho de que en la construcci on de est
a
involucrada la obtencion de la inversa de la funci on dada por la identidad 3.5, lo que no siempre se puede
hacer de manera explcita.
Para no contribuir con una posible causa de depresion de los amables lectores de este texto, daremos un
ejemplo en el que s es posible calcular .
on : R R3 dada por
Ejemplo 3.20 Sea C R3 la curva parametrizada por la funci
(t) = (cos(t), sen(t), t)
(ver figura 3.9).
J. P
aez 112
Figura 3.9: La curva (helice) del ejemplo 3.20.
on por longitud de arco de C. Definimos : R R como

Calcularemos, con base en , una parametrizaci
Zt
(t) = k (u)k du
0
Zt
= 2du
0

= 2t
Entonces, despejando la variable t de la ecuaci

on
s = (t)

= 2t
obtenemos que
s
t=
2
1
= (s)
de tal forma que
(s) = ( 1 )(s)
= (1 (s))

= (s/ 2)

= (cos(s/ 2), sen(s/ 2), s/ 2)
para s R.
Una vez que ya hemos definido lo que es una parametrizaci on por longitud de arco (y mostrado c omo
y cuando podemos obtener una de estas), lo que haremos a continuacion sera mostrar la forma en que se
puede usar para definir algunas caractersticas geometricas de las curvas.
Dado que la caracterstica principal de una parametrizacion por longitud de arco de una curva C Rn ,
es que su rapidez es constante 1 (es decir, k (s)k = 1), si podemos calcular la derivada de (es decir ),

la informaci
on que esta nos proporciona solo est on de o con la forma
a relacionada con el cambio de direcci
en que se dobla la curva C.
113 J. P
aez
De manera mas precisa, y dado que por el problema 10 ya sabemos que (s) siempre es perpendicular

a (s), la manera en que (valga la redundancia) se curva la curva C, debera estar contenida en la norma
de (s).
Que este n
umero tiene esta informacion lo podemos comprobar calculandolo para una circunferencia de
radio r, en cuyo caso, ademas de depender de r, debera ser el mismo en cualquier punto de esta.
Ejemplo 3.21 Sea C R2 la circunferencia de radio r > 0 con centro en el origen y : R R2 una
parametrizaci
on por longitud de arco de C dada por
s s
(s) = r cos , r sen
r r
Entonces tenemos que s s
(s) = sen , cos
r r
y
1 s 1 s
(s) = cos , sen
r r r r
de modo que
1
k (s)k =
r
para toda s R.
Ademas de confirmar nuestras sospechas, el ejemplo anterior ilustra un hecho geometrico muy intuitivo:
si el radio r de una circunferencia es muy grande, esta esta menos curvada, y si el radio es muy peque no
entonces la circunferencia est
a muy curvada.
umero k (s)k puesto que en el primer caso este es mas cercano a
Ambos hechos se ven reflejados en el n
0, mientras que en el segundo caso es muy grande. Con base en estos razonamientos y el ejemplo anterior,
damos la siguiente
Definici on 3.22 Sea : I R Rn una parametrizaci on por longitud de arco de una curva C Rn tal
que (s) existe para cada s I. Definimos la curvatura de C en el punto (s) C, que denotamos por
k(s), como
k(s) := k (s)k
Como ya habamos mencionado, si es una parametrizaci on por longitud de arco de una curva C Rn ,

los vectores (s) y (s) son perpendiculares, y dado que (s) es tangente a C (adem as de tener norma 1),
entonces se dice que (s) apunta en la direcci
on normal a la curva C (que es la direcci
on en la que esta
se curva).
Con base en estas observaciones, establecemos las siguientes definiciones y notaciones.
on 3.23 Sea : I R Rn una parametrizaci

Definici on por longitud de arco de una curva C Rn tal

que (s) existe para toda s I.
1. Definimos el vector tangente unitario a C en (s) (determinado por ), el cual denotamos por T (s),
como
T (s) := (s)
2. Si (s) 6=
0, definimos el vector normal unitario a C en (s), el cual denotamos por N (s), como
(s)
N (s) :=
k (s)k
3. Si (s) 6=
0, definimos el plano osculador a C en (s), el cual denotamos por s , como el plano
generado por lo vectores T (s) y N (s) que contiene al punto (s). Es decir
s := {T (s) + N (s) + (s) | , R}
J. P
aez 114
4. Si (s) 6=
0, definimos la circunferencia osculadora a C en (s), la cual denotamos por Cs , a la
circunferencia contenida en el plano osculador con centro en el punto
1
(s) + N (s)
k(s)
llamado centro de curvatura, y radio
1
k(s)
en donde a este n
umero lo llamaremos el radio de curvatura de la curva C en (s).
5. Si C R3 y (s) 6=
0, definimos el vector binormal unitario a C en (s), el cual denotamos por B(s),
como
B(s) := T (s) N (s)
No podemos dejar de mencionar que en las dos definiciones anteriores hara falta mostrar que los conceptos
ah plasmados (salvo por los vectores tangente y binormal unitarios), todos ellos son independientes de la
parametrizacion por longitud de arco que se este usando. Aunque probar esto no es muy difcil, si resultara
bastante laborioso y por lo mismo escapa a los objetivos de este texto.
Para ilustrar todos los objetos asociados a una curva suave dados en la definicion anterior, damos el
siguiente
Ejemplo 3.24 Sea C R3 la helice del ejemplo 3.20 y su parametrizaci

on por longitud de arco

(s) = (cos(s/ 2), sen(s/ 2), s/ 2)
que ah calculamos.
Tenemos entonces que:
1. el vector tangente unitario T (s) est

a dado por
T (s) = (s)

1 1 1
= sen(s/ 2), cos(s/ 2),
2 2 2
2. la curvatura k(s) est

a dada por
k(s) = k (s)k

1 1
= cos(s/ 2), sen(s/ 2), 0
2 2
1
=
2
3. el vector normal unitario N (s) est

a dado por
(s)
N (s) =
k (s)k

= cos(s/ 2), sen(s/ 2), 0
4. el plano osculador s , expresado en forma parametrica, est

a dado
s = {T (s) + N (s) + (s) | , R} (3.6)

n
= 1/ 2 sen(s/ 2) + 2(1 ) cos(s/ 2), cos(s/ 2) + 2(1 ) sen(s/ 2), + s
| , R}
115 J. P
aez
Como s est a generado por los vectores T (s) y N (s), aprovechando que estamos en R3 podemos recurrir
al vector binormal para obtener un vector normal a s y con este calcular su ecuaci on cartesiana.
De esta forma, dado que
B(s) = T (s) N (s)

1
= sen(s/ 2), cos(s/ 2), 1
2
y que s contiene al punto (s), su ecuaci
on cartesiana estara dada por

sen(s/ 2), cos(s/ 2), 1 ((x, y, z) (cos(s/ 2), sen(s/ 2), s/ 2)) = 0
la cual queda expresada como

s
sen(s/ 2)x cos(s/ 2)y + z =
2
y que, como es de esperarse, es satisfecha por las ternas dadas en la identidad 3.6.
5. finalmente, el centro de la circunferencia osculadora Cs est
a dado por
1 1
(s) + N (s) = (cos(s/ 2), sen(s/ 2), s/ 2) + cos(s/ 2), sen(s/ 2), 0
k(s) 1/ 2

= (1 2) cos(s/ 2), (1 2) sen(s/ 2), s/ 2
de modo que, como dicha circunferencia

est
a contenida en el plano generado por los vectores T (s) y
N (s), y su radio es 1/k(s) = 2, una expresi
on parametrica para Cs estara dada por

(s) + 2N (s) + 2 cos()T (s) + 2 sen()N (s)
con [0, 2].
T (s)
b
N (s)
B(s)
Figura 3.10: La curva helice y algunos de sus objetos calculados en el ejemplo 3.24, incluyendo su evoluta.
En la figura 3.10 se muestran todos los objetos que calculamos en el ejemplo anterior, incluyendo la
curva determinada por los centros de curvatura de C, la cual recibe el nombre de evoluta de la curva C y
que en este caso es nuevamente una helice.
J. P
aez 116
Una primera consecuencia interesante (e inmediata) de las definiciones 3.22 y 3.23, es la relacion existente
entre los vectores T (s) y N (s), la cual dejamos plasmada en la siguiente proposicion y cuya prueba dejamos
al lector.
on 3.25 Sea : I R Rn una parametrizaci

Proposici on por longitud de arco de una curva suave
C R . Si (s) existe y es diferente de 0 entonces
n
T (s) = k(s)N (s)
De forma analoga a la proposicion anterior, cuando nuestra curva C est a contenida en R3 se tiene que el

vector B (s) es un m ultiplo escalar del vector N (s), afirmaci
on que probamos en la siguiente proposicion y
con base en la cual introducimos el concepto de torsi on para curvas suaves contenidas en R3 .
on 3.26 Sea : I R R3 una parametrizaci

C R . Si para s I se tiene que B (s) existe entonces B (s) es un m
3
ultiplo escalar de N (s).
Demostraci
on. Dado que
kB(s)k = kT (s) N (s)k

= kT (s)k kN (s)k sen(/2)
=1
por el problema 10 de este captulo sabemos que B (s) es perpendicular a B(s), es decir B(s) B (s) = 0.
Por otra parte, de la definicion de B(s), el inciso 4 de la proposicion 3.9 y la identidad de la proposicion
3.25, tenemos que
B (s) = T (s) N (s) + T (s) N (s)

= k(s)(N (s) N (s)) + T (s) N (s)
= T (s) N (s)
de modo que B (s) tambien es perpendicular a T (s), es decir T (s) B (s) = 0.

Por tanto, dado que la terna {T (s), N (s), B(s)} es una base (ortonormal) de R3 , entonces existen , ,
R tales que
B (s) = T (s) + N (s) + B(s)
de donde obtenemos que
0 = T (s) B (s)
= T (s) (T (s) + N (s) + B(s))
=
0 = B(s) B (s)
= B(s) (T (s) + N (s) + B(s))
=
y por lo tanto que

B (s) = N (s)
que es lo deseabamos demostrar.
Como habamos mencionado, con base en la afirmaci on de la proposicion anterior, definimos el concepto
on para curvas suaves contenidas en R3 , y que desde un punto de vista geometrico, se interpreta
de torsi
como una medida de que tanto se tuerce una curva (y consecuentemente que tanto tiende a salirse de un
plano, a diferencia de lo que sucede con la curvatura, que puede curvarse sin salirse de este).
117 J. P
aez
Definici on 3.27 Sea : I R R3 una parametrizaci on por longitud de arco de una curva suave C R3 .

Si para s I se tiene que B (s) existe, definimos la torsi on de la curva C en el punto (s), que denotamos
por (s), como el n
umero real tal que
B (s) = (s)N (s)
El uso del signo negativo en la definicion anterior no tiene ning un significado especfico y obedece solo a
razones de caracter historico (al parecer, as se uso desde que se introdujo!).
Para ilustrar este concepto, calcularemos la torsion de la helice del ejemplo 3.24 aprovechando los c alculos
que ah mismo hicimos.
Ejemplo 3.28 Sea C R3 la helice del ejemplo 3.24 y su parametrizaci

on por longitud de arco

(s) = (cos(s/ 2), sen(s/ 2), s/ 2)
De ese mismo ejemplo sabemos que

N (s) = cos(s/ 2), sen(s/ 2), 0
y
1
B(s) = sen(s/ 2), cos(s/ 2), 1
2
de modo que
1
B (s) = cos(s/ 2), sen(s/ 2), 0
2
y por tanto tenemos que
1
(s) =
2
para toda s R.
Para concluir esta secci on y completar las expresiones dadas en las proposicion 3.25 y la definicion
3.27, daremos una expresion del vector N (s) para el caso de curvas suaves en R3 . Como hemos venido
mencionando, los vectores {T (s), N (s), B(s)} forman una base (ortonormal) de R3 y por esta simple raz on
el vector N (s) siempre se puede expresar como una combinaci on lineal de estos.
Lo mas interesante es que en realidad el vector N (s) solo se escribe como combinacion lineal de los
vectores T (s) y B(s), y que los coeficientes de esta combinaci an dados por k(s) y (s), respec-
on lineal est
tivamente. Este hecho es lo que probaremos en la siguiente
on 3.29 Sea : I R R3 una parametrizaci

C R . Si para s I se tiene que N (s) existe entonces
3
N (s) = k(s)T (s) + (s)B(s)
Demostraci on. De la definicion del vector B(s), y de acuerdo con la regla de la mano derecha del
producto vectorial, sabemos que
N (s) = B(s) T (s)
y por la regla de derivaci
on del producto vectorial (inciso (4) de la proposicion 3.9), tenemos que
N (s) = B (s) T (s) + B(s) T (s)
de modo que, sustituyendo las identidades de la proposicion 3.25 y la definicion 3.27, obtenemos que
N (s) = B (s) T (s) + B(s) T (s)

= ( (s)N (s)) T (s) + B(s) (k(s)N (s))
= k(s)(N (s) B(s)) + (s)(T (s) N (s))
= k(s)T (s) + (s)B(s)
J. P
aez 118
3.5. Derivada y movimiento Captulo 3. La derivada de funciones de R en Rn
Las identidades
T (s) = k(s)N (s)

N (s) = k(s)T (s) + (s)B(s)
B (s) = (s)N (s)
ormulas de Frenet-Serret 4 y tienen importantes aplicaciones en la cinem

son conocidas como las F atica.
3.5 Derivada y movimiento

Para concluir este captulo, mostraremos algunas conclusiones importantes que se pueden obtener cuando a
una funcion : I R Rn se le interpreta como una forma de describir el movimiento de un objeto.
Como ya habamos mencionado anteriormente, bajo esta interpretaci on se tiene entonces que (t) y (t)

on de dicho objeto, y r(t) = k (t)k su rapidez, todas ellas al tiempo t.
representan la velocidad y la aceleraci
Un primer resultado importante que abordaremos es aquel que nos dice cuales son las componentes de
la aceleraci
on en dos direcciones b
asicas del movimiento descrito por : la direcci
on tangente y la direcci on
normal a este movimiento.
on tangente nos la proporciona el vector (t) de tal
Como vimos en las secciones anteriores, la direcci
forma que, si hacemos (bajo el supuesto de que (t) 6= 0 para toda t I)

(t)
T (t) = (3.7)
k (t)k
(t)
=
r(t)
entonces T (t) es un vector en la direccion tangente cuya norma es constante uno, y por el problema 10
tendremos que T (t) es perpendicular a T (t) de modo que T (t) nos proporcionara la direcci
on normal al
movimiento.
De esta forma, si T (t) 6=
0, hacemos
T (t)
N (t) =
kT (t)k
y bajo todos los supuestos anteriores, lo que mostraremos en la siguiente proposicion sera la forma explcita
en que (t) se expresa como combinaci
on (lineal) de los vectores T (t) y N (t).
on 3.30 Sea : I R Rn tal que T (t) existe para toda t I. Si T (t) 6= 0 entonces
Proposici
(t) = r (t)T (t) + r2 (t)k(t)N (t) (3.8)
en donde k(t) es la curvatura (de la curva descrita por ) en el punto (t).
Demostraci
on. Por la identidad 3.7 tenemos que
(t) = r(t)T (t)
de tal forma que, usando la regla de derivaci

on del inciso 2 de la proposicion 3.9, se tiene que
(t) = r (t)T (t) + r(t)T (t)

4 Jean Fr
ederic Frenet (Perigueux, Francia, 7 de febrero de 1816 - Perigueux, Francia, 12 de junio de 1900), fue un famoso
matem atico frances que introdujo la Teora de Curvas junto a Joseph Serret.
Joseph Alfred Serret (Pars, Francia, 30 de agosto de 1819 - Versalles, Francia, 2 de marzo de 1885), m as conocido como
Joseph Serret, fue un matem atico franc
es famoso por desarrollar junto a Jean Frenet la Teora de Curvas.
(Fuente: Wikipedia)
119 J. P
aez
Captulo 3. La derivada de funciones de R en Rn 3.5. Derivada y movimiento
T (t)
= r (t)T (t) + r(t) kT (t)k
kT (t)k

= r (t)T (t) + r(t) kT (t)k N (t)
y por el inciso (a) del problema 28, tenemos que
(t) = r (t)T (t) + r2 (t)k(t)N (t)
La identidad 3.8 amerita algunos comentarios. El primero de ellos es que si la rapidez de un objeto es
constante, entonces r (t) = 0 y por lo tanto la magnitud de la componente tangencial de su aceleraci on es
cero, lo que significa que esta u
ltima act
ua solo en la direcci
on normal al movimiento, hecho que ya habamos
mencionado cuando tratamos con parametrizaciones por longitud de arco y el tema de la curvatura.
El segundo comentario es acerca de la magnitud de la componente normal de la aceleraci on, la cual es
igual al cuadrado de la rapidez del objeto multiplicado por la curvatura de la curva que este describe. Como
seguramente el lector ya se ha dado cuenta, esto explica por que un autom ovil se vuelca cuando se toma una
curva muy cerrada (curvatura grande) a una rapidez tambien muy grande.
Lo siguiente que haremos, sera mostrar un par de propiedades que deben satisfacer aquellos objetos (como
por ejemplo un planeta o un cometa) que se mueven bajo la influencia de la gravedad de un objeto de masa
muy grande (como por ejemplo una estrella).
Para ello, primero recordaremos la Ley de la Gravitaci on Universal formulada por Newton, en la que se
establece cual es la fuerza ejercida entre dos cuerpos de masas m1 y m2 separados por una distancia r.
Ley de la Gravitacion Universal

La magnitud F de la fuerza ejercida entre dos cuerpos de masas m1 y m2 que est an separa-
dos por una distancia r, es directamente proporcional al producto de sus masas e inversamente
proporcional al cuadrado de su distancia, es decir que
m1 m2
F =G
r2
La fuerza F (cuya magnitud es F ) ejercida entre ambos cuerpos act

ua en la direcci
on de la lnea
que los une. El n
umero G es conocido como la constante de la Gravitaci on Universal.
N otese que, si el centro de masa de cada uno de los cuerpos de masa m1 y m2 est a ubicado en el punto
x on F que ejerce el objeto
1 y x2 , respectivamente, y suponemos que m2 > m1 , entonces la fuerza de atracci
de masa m2 sobre el objeto de masa m1 estar a dada por
m1 m2
F = G 3 (
x2 x
1 ) (3.9)
k
x2 x
1 k
Otra ley de la fsica de la que tambien echaremos mano, es la Segunda ley del movimiento (igualmente
formulada por Newton) la cual establece que, si un objeto de masa m se mueve debido a la accion de un
campo de fuerzas (en el caso que analizaremos, el campo de fuerzas gravitatorias determinadas por una
estrella (o sol) de masa M ), entonces la fuerza ejercida sobre el objeto (en la posicion que este tenga en cada
instante t de su movimiento) tambien se puede obtener multiplicando la masa del objeto por su aceleraci on
en dicho instante.
Es decir, si : I R R3 es la funci on que nos asocia la posicion del objeto (de su centro de masa,
para ser mas exactos) en cada instante t, y denotamos por F ((t)) la fuerza ejercida sobre este en la posicion
(t), entonces
F ((t)) = ma(t)
= m (t)
J. P
aez 120
3.5. Derivada y movimiento Captulo 3. La derivada de funciones de R en Rn
Lo que probaremos en la siguiente proposicion sera que, si un objeto se mueve bajo la accion de un campo
de fuerzas como el que describimos anterioremente, entonces dicho movimiento necesariamente se tiene que
llevar a cabo sobre un plano (fijo). Este hecho es importante para probar la Primera Ley de Kepler, la cual
orbita (o curva) descrita por el objeto es una elipse5 .
establece que la
Proposici on 3.31 Si un objeto de masa m se mueve debido a la acci on de un campo de fuerzas gravitatorias
(determinadas por otro objeto de masa M que est a fijo) entonces el movimiento del primer objeto se lleva a
cabo sobre un plano fijo (al que tambien pertenece el objeto de masa M ).
Demostraci on. Fijemos un sistema cartesiano cuyo origen se encuentre en el centro de masa del objeto de
masa M , y sea : I R R3 la funci
on que nos asocia la posicion del centro de masa del objeto de masa
m en cada instante t. Mostraremos que el producto vectorial
(t) (t)
no depende de t, es decir, que es un vector constante c, de donde el movimiento descrito por se llevara
a cabo en el plano que es perpendicular a este vector. Para ello, derivaremos este producto y mostraremos
que dicha derivada es el vector 0 para toda t I.
Primero notemos que, por la Ley de Gravitaci on Universal y de acuerdo con la identidad 3.9, dado que
el origen de nuestro sistema coordenado est a ubicado en el centro de masa del segundo objeto, la fuerza
ejercida por este en cada posicion (t) est
a dada por
mM
F ((t)) = G 3 (t)
k(t)k
Por otra parte, y de acuerdo con la segunda ley del movimiento, tenemos que
F ((t)) = m (t)
de tal forma que de estas dos identidades, concluimos que (t) y (t) son vectores paralelos y por tanto que
(t) (t) = 0
para toda t I.
Ahora, derivando el producto vectorial ( )(t) = (t) (t), se tiene que
( ) (t) = (t) (t) + (t) (t)
= 0
(t) (t) = c (3.10)
para toda t I.
Para concluir esta breve secci on, y como una continuacion del analisis del movimiento de nuestro objeto
de masa m (debido a la accion del campo gravitatorio de un segundo objeto de masa M ), desarrollaremos
todo lo indispensable para probar lo que se conoce como la Segunda Ley de Kepler.
Para ello, y dando por cierto que dicho movimiento se realiza en un plano, vamos a establecer un sistema
cartesiano XY Z de tal forma que la curva descrita por el objeto este contenida en el plano XY . Daremos
tambien como un hecho que la trayectoria seguida es una curva cerrada que rodea al origen (de hecho,
una elipse, como mencionamos p arrafos arriba).
Lo importante de los supuestos anteriores es que, si recurrimos a las coordenadas polares (, ) para
describir la posicion del objeto, y escribimos a su coordenada como una funci on del angulo (es decir que
= f ()), entonces el area A encerrada por la curva descrita y dos semirectas con angulos 1 y 2 (1 < 2 )
(ver figura 3.11), esta dada por la expresion
Z2
1
A= f 2 ()d
2
1
121 J. P
aez
Captulo 3. La derivada de funciones de R en Rn 3.5. Derivada y movimiento
= f ()
b
A
b
2
Figura 3.11: La regi

on A encerrada por la curva descrita por sus coordenadas polares (, ), en donde = f (),
y las semirectas con angulos 1 y 2 (1 < 2 ).
Con base en lo anterior, podemos formular la Segunda Ley de Kepler en los siguientes terminos: si (t)
es la funci
on que nos da el
angulo del vector de posicion al tiempo t, y
Z
1
A() = f 2 (u)du (3.11)
2
0
es la funci
on del
angulo que nos da el area barrida a partir de un angulo fijo 0 , entonces la funci
on
on de cambio constante, es decir, que (A ) (t) es constante. Dicho de manera
(A )(t) = A((t)) tiene raz
menos tecnica, esto significa que el vector de posicion de nuestro objeto barre areas iguales en tiempos
iguales.
Proposicion 3.32 Si un objeto de masa m se mueve debido a la acci on de un campo de fuerzas gravitatorias
(determinadas por otro objeto de masa M ) entonces el movimiento del objeto de masa m satisface la Segunda
Ley de Kepler, es decir, el vector de posici
on del objeto barre
areas iguales en tiempos iguales.
Demostraci on. Sean : I R R3 la funcion que asigna la posicion del objeto (de masa m) al tiempo t
(y cuyo movimiento se realiza en el plano XY ), (t) la funci on que nos da el angulo del vector de posicion
(t), y f () la funci
on que determina la coordenada del vector de posicion en terminos del angulo .
Si ahora definimos
u
() = (cos(), sen(), 0)
tendremos que (t) (en coordenadas cartesianas) estar
a dada por
(t) = f ((t))
u((t))
de modo que
(t) = f ((t))
u ((t)) (t) + f ((t)) (t)
u((t))
Si ahora sustituimos las dos u
ltimas identidades en la expresion 3.10, tenemos que
c = (t) (t)
= (f ((t)) u ((t)) (t) + f ((t)) (t)
u((t))) (f ((t)) u((t)))
u ((t)) (t)) + (f ((t))
u((t))) (f ((t))
= (f ((t)) u((t))) (f ((t)) (t)
u((t)))
= f 2 ((t)) (t)( ((t)))
u((t)) u
y por tanto, dado que
((t))) = (cos((t)), sen((t)), 0) ( sen((t)), cos((t)), 0)

((t)) u
u
= (0, 0, 1)
5 Para los interesados en la prueba de las leyes de Kepler, se pueden concultar en [3].
J. P
aez 122
3.6. Problemas Captulo 3. La derivada de funciones de R en Rn
para toda t, deducimos que

ck = f 2 ((t)) (t)(
k ((t)))
u((t)) u
= f 2 ((t)) (t) k ((t))k
u((t)) u
= f 2 ((t)) (t)

kck
(t) =
f 2 ((t))
Por otra parte, por la regla de la cadena (para funciones de R en R) y el Teorema Fundamental del
Calculo, concluimos que
(A ) (t) = A ((t)) (t)

1 2 kck
= f ((t))
2 f 2 ((t))
k
ck
=
2
es decir, que (A ) (t) es constante.
Si la fuerza F que se ejerce sobre el objeto en la posicion (t) no es de tipo gravitatorio, sino que es de
la forma F ((t)) = (t)(t) (donde (t) es un escalar que depende de t), las dos u ltimas proposiciones se
siguen cumpliendo. Se dice que estos campos son de tipo central y dejamos como un problema al lector
realizar las pruebas correspondientes.
3.6 Problemas
1. Sea R R2 la recta cuya ecuaci
on cartesiana es ax + by + c = 0 (con a2 + b2 > 0). Muestre que:
(a) si x
0 = (x0 , y0 ) y x
1 = (x1 , y1 ) son dos puntos diferentes que pertenecen a R, entonces la funci
on
: R R2 dada por
(t) = x x1 x0 )
0 + t(
es una parametrizacion de R.
0 R y u = (u1 , u2 ) 6= 0 es un vector paralelo a la recta R (es decir, que au1 + bu2 = 0),
(b) si x
on : R R2 dada por
entonces la funci
(t) = x
0 + t
u
es una parametrizaci
on de R.
x+by+
2. Sea R R3 la recta determinada por la interseccion de los planos ax+by+cz +d = 0 y a cz + d =
0. Muestre que:
(a) si x
0 = (x0 , y0 , z0 ) y x
1 = (x1 , y1 , z1 ) son dos puntos diferentes que pertenecen a R, entonces la
on : R R3 dada por
funci
(t) = x x1 x0 )
0 + t(
on de R.
= (u1 , u2 , u3 ) 6= 0 es un vector paralelo a la recta R (es decir, que au1 +bu2 +cu3 = 0
0 R y u
(b) si x
ya
u1 + bu2 + cu3 = 0), entonces la funci on : R R3 dada por
(t) = x
0 + t
u
on de R.
123 J. P
aez
Captulo 3. La derivada de funciones de R en Rn 3.6. Problemas
3. Sean x
0 , x 6= 0 Rn , con n > 3.
1 Rn dos puntos diferentes y u
(a) como se define, por medio de ecuaciones cartesianas, a la recta que pasa por los puntos x
0 y
1 Rn ?
x
(b) c
omo se define, por medio de ecuaciones cartesianas, a la recta en la direcci
on del vector u
que
pasa por el punto x
0 ?
(c) c
omo definira, sin usar ecuaciones cartesianas, a la recta que pasa por los puntos x
0 y x1 , y a
la recta que pasa por el punto x 0 que est
a en la direcci
on determinada por el vector u
? (los dos
problemas anteriores le pueden dar una pista).
4. Sobre la parte exterior de una circunferencia fija de radio a rueda (sin resbalar) otra circunferencia de
radio b. Encuentre una funci on de R en R2 que describa el movimiento de un punto que se encuentre
en la circunferencia exterior.
5. Pruebe la proposicion 3.9 usando los resultados que se indican en el texto, y despues sin usar la
proposicion 3.8.
6. Pruebe la proposicion 3.10 sin usar funciones coordenadas y la proposicion 3.8.
on (t) = (sen(2t), 2 sen2 (t), 2 cos(t)) (t R) pertenece a una
7. Muestre que la curva descrita por la funci
esfera con centro en el origen. Calcule su rapidez y muestre que la proyeccion en el plano XY de su
velocidad tiene norma constante.
8. Sea f : I R R y (t) = (t, f (t)) parametrizaci
on de la grafica de f (Gf ). Pruebe que:
(a) si f es derivable en t0 I entonces la parametrizaci

on tambien es derivable en t0 y ademas
(t0 ) = (1, f (t0 ))
(b) la recta tangente a Gf en el punto (t, f (t0 )) es una parametrizaci
on de la misma recta (tangente)
dada por la ecuacion y = f (t0 )(x t0 ) + f (t0 )
9. Sea : I R Rn y t0 I. Pruebe que las siguientes afirmaciones son equivalentes:
(a) la funci
on es derivable en t0
(b) existe un vector l Rn tal que
(t) ((t0 ) + (t t0 ) l)
lim =0
tt0 t t0
(interprete geometricamente este lmite)
on lineal L : R Rn tal que
(c) existe una funci
(t) ((t0 ) + L (t t0 ))
lim =0
tt0 t t0
(identifique geometricamente al conjunto {(t0 ) + L (t t0 ) Rn | t R})
Muestre que, de la equivalencia entre los incisos (a) y (b) se concluye que l = (t0 ), de la equivalencia
entre los incisos (b) y (c) que L(1) =
l, y de la equivalencia entre los incisos (c) y (a) que (t0 ) = L(1).
10. Sea : I R Rn derivable. Pruebe que: k(t)k es constante si y solo si (t) (t) = 0 para toda
t I. Interprete geometricamente.
11. Sea : I R Rn derivable y r(t) = k(t)k. Si r(t0 ) 6= 0 y r(t0 ) es un maximo o mnimo local de r,
pruebe que (t0 ) (t0 ) = 0. Interprete geometricamente.
12. Sea = (f, g) : [a, b] R R2 continua en el intervalo [a, b] y derivable en el intervalo (a, b) tal que
(t) 6= 0 para toda t (a, b). Pruebe que existen (a, b) y R tales que
(b) (a) = ()
J. P
aez 124
13. Sea : [a, b] R Rn continua en el intervalo [a, b] y derivable en el intervalo (a, b). Pruebe que
existe (a, b) tal que
2
k(b) (a)k = (b a) () ((b) (a))
14. Sea : I R Rn .
(a) si existen x Rn tales que (t) = x

0 , u u para toda t I pruebe que k (t)k es constante.
0 + t
(b) muestre con un ejemplo que el recproco de la afirmaci
on del inciso anterior es falsa.
(c) si existen x Rn tales que (t) = x
0 , u u para toda t I, pruebe que (t) = 0 para toda
0 + t
t I.
para toda t I, pruebe que existen x
(d) si (t) = 0 Rn tales que (t) = x
0 , u 0 + t
u para toda
t I.
(e) de un ejemplo en el que la funci on parametrice una recta y para la cual se satisfaga que (t) 6= 0
para toda t I.
Interprete las afirmaciones de los incisos anteriores partiendo del hecho de que describe el
movimiento de un objeto.
15. Dada : [a, b] R Rn continua, con = (1 , . . . , n ). Defina

Z Z Z !
b b b
(t)dt = 1 (t)dt, . . . , n (t)dt
a a a
Pruebe que:
Rb Rb
(a) si c = (c1 . . . , cn ) es un vector constante, entonces a c (t)dt = c a (t)dt
(b) Z Z
b b

(t)dt k(t)k dt
a a
(sugerencia: use la desigualdad de Cauchy-Schwarz para probar que

Z b Z
b

(u) (t)dt k(u)k (t)dt
a a
para toda u [a, b]; integre con respecto de u y use la identidad del primer inciso).
Rb
(c) si tiene derivada continua, entonces k(b) (a)k a k (t)k dt = l(). Interprete geometrica-
mente.
2

16. Considere las funciones (t) = (cos(t), sen(t)), t [0, /2], y (u) = 1u 2u
1+u2 , 1+u2 , u [0, 1]. Pruebe
que es una reparametrizaci on de .
17. Sea : [a, b] R Rn una parametrizaci

on por longitud de arco de una curva C Rn .
(a) muestre que l() = b a

(b) muestre un ejemplo en el que la longitud de C no conincida con la longitud determinada por
(es decir, l()).
18. De un ejemplo de una curva C Rn y una parametrizaci on por longitud de arco de esta, que no se
pueda obtener por el metodo seguido en la prueba de la proposicion 3.19 (sugerencia: observe que el
dominio (I) de la reparametrizaci
on que se construye en la prueba de la proposicion 3.19 siempre
es tal que 0 (I)).
125 J. P
aez
19. Sea : I R Rn una parametrizaci on por longitud de arco de una curva C Rn . Pruebe que si C
a contenida en una recta, entonces k(s) = 0 para toda s I. Esta afirmaci
est on contradice lo que se
pide ejemplificar en el inciso (e) del problema 14? Justifique su respuesta.
20. Pruebe el recproco del problema anterior. Es decir, si C Rn es una curva suave y : I R Rn
es una parametrizaci on por longitud de arco de C tal que k(s) = 0 para toda s I entonces C est
a
contenida en una recta.
21. Sea : I R Rn una parametrizaci on por longitud de arco de una curva C Rn . Si T (s) es el
vector tangente unitario y (s, h) representa el angulo formado por los vectores T (s) y T (s + h), pruebe
que
(s, h)
k(s) = lim
h0 h
(sugerencia: use la ley de los cosenos).
22. Sea : I R R3 una parametrizaci on por longitud de arco de una curva C R3 . Si B(s) es el
vector binormal unitario y (s, h) representa el angulo formado por B(s) y B(s + h), pruebe que

(s, h)
(s) = lim
h0 h
23. Sea : I R R3 una parametrizacion por longitud de arco de una curva suave C R3 . Si (s) 6= 0
para toda s I, pruebe que:
[ (s) (s)] (s)
(s) = 2
k (s)k
24. Sea : I R R3 una parametrizacion por longitud de arco de una curva suave C R3 . Si (s) = 0
para toda s I entonces C est
a contenida en un plano.
25. Sea : I R R3 una parametrizaci on por longitud de arco de la curva suave C R3 . Pruebe que,
si la curvatura k(s) es constante (distinta de cero) y (s) = 0 para toda s I entonces la curva descrita
por es (o esta contenida en) una circunferencia (sugerencia: pruebe que el centro de curvatura en
(s) es el mismo para toda s I usando la expresion para N (s) probada en la proposicion 3.29).
26. Sea : I R R2 una parametrizaci on por longitud de arco de la curva suave C R2 . Pruebe que,
si la curvatura k(s) es constante (distinta de cero) en cada punto (s) entonces la curva descrita por
es (o est
a contenida en) una circunferencia (sugerencia: use el problema anterior).
27. Sea : I R Rn una parametrizaci on por longitud de arco de la curva suave C Rn . Dado t0 R
n
fijo, definimos : J R R , con J = {s R | t0 s I}, como (s) = (t0 s). Pruebe que:
(a) es una parametrizaci on por longitud de arco de C

(b) si T (s), T(s), N (s), N
(s), k(s) y k(s) son los vectores tangente unitario, normal unitario y la
curvatura, correspondientes a las parametrizaciones y , respectivamente, entonces
i) T(s) = T (t0 s) (s) = N (t0 s)

ii) N
iii) k(s) = k(t0 s)
para cada s J

(c) si n = 3 y B(s), B(s), (s) y (s) son los vectores binormal unitario y la torsion, correspondientes
a las parametrizaciones y , respectivamente, entonces

i) B(s) = B(t0 s) ii) (s) = (t0 s)
para cada s J
(d) si n = 3, se satisfacen las f
ormulas de Frenet-Serret escribiendo sus elementos en terminos de .
J. P
aez 126
28. Sea : I R R3 una curva suave C R3 . Sea T (t) = (t)/ k (t)k y bajo el supuesto de que
T (t) 6=
0 para toda t I, hacemos N (t) = T (t)/ kT (t)k y B(t) = T (t) N (t). Pruebe que:
(a) = kT (t)k entonces k(t) = k(t)/

si k(t) k (t)k (donde k(t) es la curvatura de C en el punto (t))
(b) B (t) B(t) = 0 = B (t) T (t)
(c) B (t) es un multiplo escalar de N (t)
(d) si denotamos por (t) al numero (del inciso anterior) tal que B (t) = (t)N (t), pruebe que

(t) = (t)/ k (t)k (donde (t) es la torsion de C en el punto (t))

(e) N (t) = k(t)T (t) + (t)B(t)
29. Sea : I R Rn una curva suave. Pruebe que la curvatura k en cada punto (t) est
a dada por:
1/2
2 2
k (t)k k (t)k ( (t) (t))2
k (t)k3
30. Sea : I R R3 una curva suave tal que (t) 6= 0 para toda t I. Pruebe que la curvatura k y
la torsion en cada punto (t) est
a dada por:
k (t) (t)k [ (t) (t)] (t)
i) k = 3 ii) =
k (t)k k (t) (t)k2
31. Sea : I R R3 una curva suave. Pruebe que si la curvatura k es constante (distinta de cero) y
la torsion es cero en cada punto (t) entonces la curva descrita por es (o est
a contenida en) una
circunferencia.
32. Sea f : [a, b] R una funci on dos veces derivable. Pruebe que la curvatura en el punto (x, f (x)), de
la grafica de f , est
a dada por
|f (x)|
k(x) = h i3/2
2
1 + (f (x))
33. Sea (t) = (a cos(t), a sen(t), bt), t R
(a) calcule la parametrizacion por longitud de arco de esta curva

(b) calcule los vectores T (s), N (s) y B(s) en cada punto de esta curva
(c) calcule la curvatura, el radio de curvatura y la torsion en cada punto de esta curva
34. Un objeto gira (en el sentido de las manecillas del reloj) sobre una circunferencia centrada en el origen
y de radio R con rapidez constante v. Si el objeto se desprende de la circunferencia en el punto
(R/ 2, R/ 2), en que punto y en cuanto tiempo intersecta al eje Y ? Cual debera ser la rapidez
del objeto sobre la circunferencia para que alcance el mismo punto en la mitad del tiempo?
35. Un raton se mueve con rapidez constante v sobre una circunferencia de radio R y un gato, tambien con
rapidez constante v, persigue al rat on (empezando desde el centro de la circunferencia) de tal forma
que el rat
on, el gato y el centro de la circunferencia siempre son coliniales. Alcanza el gato al rat
on?
en que punto? en que tiempo?
36. La posicion (en R3 ) de un objeto de masa m est on (t). Si la fuerza F que se
a dada por la funci
ejerce sobre el objeto en la posicion (t) (la cual produce su movimiento) es tal que F ((t)) = (t)(t)
(donde (t) es un escalar que depende de t), pruebe que:
(a) el objeto se mueve sobre un plano (sugerencia: considere el producto (t) (t) y use la segunda
ley de Newton).
(b) suponiendo que la curva descrita es cerrada, pruebe que el movimiento del objeto satisface la
Segunda Ley de Kepler (sugerencia: proceda como en la prueba de la proposicion 3.32).
127 J. P
aez
J. P
aez 128
Captulo 4
La derivada de funciones de Rn en R
El contenido de este captulo sera sin duda el primero en el que apareceran conceptos realmente novedosos
para el lector. Y aun y cuando los primeros conceptos de derivaci on que definiremos para este tipo de
funciones son muy parecidos al concepto de derivada de funciones de R en R, la definicion general de la
derivada de funciones de Rn en R abrir a un camino hacia una vision mas general de este concepto.
Antes de iniciar nuestro recorrido por estos temas, vamos a revisar algunos aspectos relacionados con los
conjuntos en donde se encuentran las variables de las funciones con las que vamos a trabajar, y la relacion
entre las varias representaciones que podemos hacer de estos por medio del conjunto Rn .
4.1
Un interludio de Algebra Lineal
Como vimos en el captulo 1, los objetos matematicos que sirven para representar a las variables (indepen-
dientes o dependientes) de las funciones que nos ocupan, pertenecen a conjuntos que suelen estar dotados
de una estructura algebraica que hacen de ellos un cierto tipo de espacio, y que se conocen con el nombre
de espacios vectoriales de dimensi on finita sobre los n umeros reales.
Como ya tambien vimos, una de las caractersticas mas importantes de este tipo de espacios con el que
vamos a trabajar, y que por ahora denotaremos en general con la letra V , es que siempre hay varias maneras
on finita de elementos de V , digamos {
de elegir una colecci v1 , . . . , vn }, con la propiedad de que para cualquier
otro elemento v V existen 1 , . . . , n R, u
nicos, tales que
v = 1 v1 + + n vn
Como mencionamos en su momento (y como seguramente el lector ya lo sabe), este tipo de colecciones
reciben el nombre de base de V , y la propiedad que las define es la que permite identificar al conjunto
V con el conjunto Rn . Esta identificacion de V con Rn tiene la ventaja de que hace corresponder
adecuadamente la estructura algebraica de V con la estructura algebraica que definimos para Rn , estructura
que por cierto, convierte a Rn en un espacio vectorial!
Ademas de lo anterior, en el captulo 1 tambien vimos que algunos tipos especficos de espacios vecto-
riales, como es el caso de las flechas (del plano o el espacio) que parten de un punto fijo, est an dotados de
estructuras geometricas (tales como el concepto de distancia o de angulo) las cuales pudimos traer a Rn ,
y consecuentemente a cualquier otro espacio vectorial que se pueda identificar con este.
Observemos que si { v1 , . . . , vn } es una base del espacio vectorial V , la nada con la que se identifica
al vector vi es aquella que tiene casi todas sus coordenadas 0, salvo por la iesima, que debera ser 1; a esta
nada la denotaremos por ei , es decir que
ei := (0, . . . , 0, 1, 0, . . . , 0)
en donde el 1 est
a en la coordenada i.
on {
Como seguramente el lector ya sabra (y si no lo podra probar muy facilmente), la colecci e1 , . . . , en }
es una base para Rn y se le conoce con el nombre de base can onica.
129
Captulo 4. La derivada de funciones de Rn en R
4.1. Un interludio de Algebra Lineal
De acuerdo con los conceptos de magnitud (norma) y de angulo (producto punto) que definimos en el
captulo 1, todos los elementos de esta base tienen magnitud 1 y son mutuamente perpendiculares, es decir
k
ei k = 1 para cada i {1, . . . , n} y ei ej = 0 para cada i, j {1, . . . , n}, con i 6= j, o lo que es lo mismo

1 si i = j
ei ej =

0 si i 6= j
para cada i, j {1, . . . , n}. En general, cuando los elementos de una base de un espacio vectorial se
indentifican con nadas cumplen con estas dos caractersticas, decimos que esta base es ortonormal .
Como ya lo habamos mencionado en el captulo 1, este tipo de bases son las que se utilizan para construir
(en el caso del plano o del espacio) un sistema de referencia cartesiano y es por esta raz on que en estos casos,
cuando se pueda dibujar los vectores (o flechas) que representen a una base de este tipo, habr a que hacerlo con
estas caractersticas (mutuamente perpendiculares, y de la misma longitud). No sin cierto abuso de notaci on,
usaremos los mismos e1 , . . . , en para nombrar a los vectores (o flechas) que representen geometricamente a
la base canonica de Rn .
Una vez establecidos los conceptos y notaciones anteriores, la situaci on principal que deseamos abordar
en esta secci on es la siguiente: supongamos que la variable independiente de una cierta funci on pertenece a
un espacio vectorial V , y que las colecciones { v1 , . . . , vn } V y { v1 , . . . , vn } V , ambas, son bases de V .
Si para identificar al espacio V con Rn lo hacemos atraves de la base { v1 , . . . , vn } (en cuyo caso cada
vector vi se correspondera con la n-ada ei ), entonces usando esta misma manera de identificar a V con Rn ,
cada vector vi se correspondera con alguna n-ada, que denotaremos por ei , y se tendra que la colecci on de
n-adas { e1 , . . . , en } sera una base (o sistema coordenado) de Rn (afirmacion que seguramente el lector ya
habra probado en su curso de Algebra Lineal).
Algo que es importante destacar es que, aun y cuando la colecci on { e1 , . . . , en } sera una base de Rn ,
esta no tiene que ser necesariamente ortonormal, aunque para los fines de este texto, supondremos que las
colecciones { v1 , . . . , vn } V y { v1 , . . . , vn } V se elegiran de tal manera que la colecci on {e1 , . . . , en }
n
siempre sera una base ortonormal (o sistema coordenado cartesiano) de R .
De esta forma, dadas las colecciones { v1 , . . . , vn } V y { v1 , . . . , vn } V , la situaci on que tendremos
(como ya lo habamos mencionado desde el captulo 1) es que habra dos formas diferentes de identificar al
espacio vectorial V con el conjunto (o espacio vectorial) Rn , doble identificacion que para nosotros se traducir a
en lo siguiente: as como para cada v V existiran dos formas de expresar a v como combinaci on lineal de
las bases { v1 , . . . , vn } y {v1 , . . . , vn }, para cada x Rn (pensando a Rn mas como un representante del
espacio vectorial V , que como un conjunto de n-adas), consideraremos dos sistemas coordenados cartesianos
en los cuales expresaremos a x .
Es decir, un vector x Rn tendra coordenadas (x1 , . . . , xn ) en el sistema coordenado cartesiano determi-
nado por la base can onica { e1 , . . . , en }, y coordenadas (x1 , . . . , xn ) en el otro sistema coordenado cartesiano
determinado por la base ortonormal { e1 , . . . , en }.
La figura 4.1 ilustra esta situaci on para el caso particular del espacio vectorial V formado por las flechas
que parten de un punto fijo O, raz on por la cual las bases { e1 , e2 } y { e1 , e2 } se fijan en el mismo punto.
En virtud de lo anterior tendremos que una misma funci on f definida para los elementos de un sunconjunto
A del espacio vectorial V (y que en un abuso de lenguaje diremos que f est a definida para los elementos
de un subconjunto A del espacio vectorial Rn ), esta se podra poner en terminos de unas ciertas variables (o
coordenadas) x1 , . . . , xn , o de otras variables (o coordenadas) x1 , . . . , xn .
Aun y cuando los conceptos de derivabilidad con los que vamos a trabajar en este captulo los definiremos
sin tener que recurrir a las coordenadas determinadas por alguna base, para efectos de la realizaci on de
c
alculos especficos s sera necesario recurrir a alguna de estas, y lo que nos proponemos en este captulo es
dejar clara la relaci on que existe entre los c alculos realizados con unas cooredenadas x1 , . . . , xn o con otras
coordenadas x1 , . . . , xn .
Para alcanzar el objetivo anterior, empezaremos por establecer la relacion que existe entre dos conjuntos
de coordenadas (cartesianas) de un mismo elemento x Rn .
Si, como dijimos antes, (x1 , . . . , xn ) son las coordenadas de x en el sistema coordenado cartesiano deter-
minado por la base can onica { e1 , . . . , en }, y (x1 , . . . , xn ) son otras coordenadas en un sistema coordenado
cartesiano determinado por una base ortonormal { e1 , . . . , en }, nuestro objetivo es mostrar c omo se obtienen
unas coordenadas a partir de las otras; es decir, si conocemos las coordenadas (x1 , . . . , xn ), c omo podemos
J. P
aez 130

4.1. Un interludio de Algebra Lineal Captulo 4. La derivada de funciones de Rn en R
x1 e1
x

2
e
x2
1
e
x1
e2 x2 e2

e2 e1
b
O e1
Figura 4.1: El vector x y sus correspondientes coordenadas (x1 , x2 ) y (x1 , x2 ) en las bases ortonormales {
e1 , e2 }

y {
e1 , e2 }, respectivamente.
obtener las coordenadas (x1 , . . . , xn ) y recprocamente, si conocemos las coordenadas (x1 , . . . , xn ), c omo
podemos obtener las coordenadas (x1 , . . . , xn ).
Como seguramente el lector ya lo sabra, cada uno de estos problemas es un problema de cambio de
coordenadas, y tambien sabra que se resuelve de la siguiente manera.
Supongamos primero que tenemos las coordenadas (x1 , . . . , xn ) de x Rn en la base ortonormal {
e1 , . . . , en }
y que deseamos conocer sus coordenadas (x1 , . . . , xn ) en la base canonica. Para ello, bastara con saber cuales
son las coordenadas de cada vector ei en la base canonica { e1 , . . . , en } (informaci
on que es con la que se
cuenta la mayora de las veces).
Si suponemos que

(i)
ei = a1 , . . . , a(i)
n
(i)
= a1 e1 + + a(i)
n e n
para cada i {1, . . . , n}, entonces
= x1 e1 + + xn en
x

(1)
= x1 a1 e1 + + a(1) n +
n e
..
.

(n)
+ xn a1 e1 + + a(n)n e n

(1) (n)
= a1 , . . . , a1 (x1 , . . . , xn )
e1 +
..
.

+ a(1) (n)
n , . . . , an (x1 , . . . , xn )
en
de donde concluimos que la i-esima coordenada del vector x en la base canonica estar
a dada por

(1) (n)
xi = ai , . . . , ai (x1 , . . . , xn )
para cada i {1, . . . , n}, o equivalentemente y escrito usando matrices, que

(1) (1)
a1 an

x1 xn = x1 xn
. .. ..
.. (4.1)
.
.
(n) (n)
a1 an
131 J. P
aez
Como el lector se podra imaginar, para resolver el problema recproco (obtener las coordenadas (x1 , . . . , xn )
a partir de las coordenadas (x1 , . . . , xn )), sera suficiente con calcular las coordenadas de cada vector ei en el
sistema cartesiano determinado por la base { e1 , . . . , en }.
Es decir, si ahora

(i)
ei = b1 , . . . , b(i) n
(i)
= b1 e1 + + b(i)
n e n
= x1 e1 + + xn en
x

(1)
= x1 b1 e1 + + b(1) n +
n e
..
.

(n)
+ xn b1 e1 + + b(n)
n e n

(1) (n)
= b1 , . . . , b1 e1 +
(x1 , . . . , xn )
..
.

+ b(1) (n)
n , . . . , bn en
(x1 , . . . , xn )
de donde concluimos que la iesima coordenada del vector x en la base { e1 , . . . , en } estar

a dada por

(1) (n)
xi = bi , . . . , bi (x1 , . . . , xn )
para cada i {1, . . . , n}, o lo que es lo mismo, escrito en forma matricial, que

(1) (1)
b1 bn

x1 xn = x1 xn
. .. ..
.. (4.2)
.
.
(n) (n)
b1 bn
Si llamamos
(1) (1)
a an
1. .. ..
..
M = .
.
(n) (n)
a1 an
y
(1) (1)
b bn

1. .. ..
M = ..
. .

(n) (n)
b1 bn
se prueba que:
1. cada matriz M y M es la inversa una de la otra (M = M 1 ),

2. la inversa de cada una de ellas es su propia transpuesta (M 1 = M t ), y
3. ambas matrices tienen determinante 1
N
otese que de las propiedades 1 y 2 se deduce que
(i) (j)
b j = ai (4.3)
J. P
aez 132

4.1. Un interludio de Algebra Lineal Captulo 4. La derivada de funciones de Rn en R
para todas i, j {1, . . . , n}.

Las matrices que tienen las caractersticas anteriores son conocidas con el nombre de matrices ortonor-
males (por razones que seguramente quedan claras), y si el lector aun no conoce la prueba de estas afirma-
ciones, muy probablemente pronto las vera en su curso de Algebra Lineal).
Resumiendo la discusi on anterior, y con base en las identidades 4.1, 4.2 y 4.3 concluimos que: si cada
(i) (i)
vector ei tiene coordenadas a1 , . . . , an (i {1, . . . , n}) en el sistema determinado por la base {
e1 , . . . , en },
y un vector x tiene coordenadas (x1 , . . . , xn ) en el mismo sistema, entonces las coordenadas (x1 , . . . , xn ) de x
(en el sistema determinado por la base { e1 , . . . , en }) est
an dadas por la identidad (escrita en forma matricial)

(1) (n)
a1 a1
. .. ..
x1 xn = x1 xn .. .
. (4.4)
(1) (n)
an an

(i) (i)
Analogamente, si cada vector ei tiene coordenadas b1 , . . . , bn (i {1, . . . , n}) en el sistema determi-
nado por la base { e1 , . . . , en }, y un vector x
tiene coordenadas (x1 , . . . , xn ) en el mismo sistema, entonces
las coordenadas (x1 , . . . , xn ) de x (en el sistema determinado por la base { e1 , . . . , en }) est
an dadas por la
identidad (escrita en forma matricial)

(1) (n)
b1 b1
. .. ..
x1 xn = x1 xn .. . .
(4.5)
(1) (n)
bn bn
N
otese que, de acuerdo con las identidades 4.3, tambien se tiene que

(1) (1)
b1 bn

x1 xn = x1 xn .

.
. .. ..
(4.6)
. .
(n) (n)
b1 bn
y
(1) (1)
a an
1. .. ..
x1 xn = x1 xn .
. . .

(4.7)
(n) (n)
a1 an
identidades que tambien nos seran muy u tiles.
Una consecuencia muy importante de las identidades anteriores tiene que ver con los conceptos de pro-
ducto punto y norma euclideana, los cuales se definieron en el captulo 1 en terminos de coordenadas.
Como se recordara, si (x1 , . . . , xn ) y (y1 , . . . , yn ) son las coordenadas de x y y en el sistema cartesiano
determinado por la base canonica { e1 , . . . , en }, respectivamente, definimos que
n
X
y = x1 y1 + + xn yn =
x xi yi
i=1
Si ahora suponemos que (x1 , . . . , xn ) y (y1 , . . . , yn ) son las coordenadas de x y y en un sistema coordenado
cartesiano determinado por otra base ortonormal { e1 , . . . , en }, respectivamente, de acuerdo con la identidad
4.4 (y denotando por Idn a la matriz identidad de n n) se tiene que

y

.1
[x1 y1 + + xn yn ] = x1 xn ..
yn
t
= x1 xn y1 yn
133 J. P
aez

t
= x1 xn yn M t
Mt y1
t t
= x1 xn M t Mt y1 yn
t
= x1 xn M tM y1 yn
t
= x1 xn M 1 M y1 yn
t
= x1 xn (Idn ) y1 yn
t
= x1 xn y1 yn

y1
= x1 xn ...

yn
= [x1 y1 + + xn yn ]
y por lo tanto que
x1 y1 + + xn yn = x1 y1 + + xn yn
De esta u ltima identidad concluimos que el valor de x y no depende del sistema coordenado cartesiano
que se este usando para identificar a los vectores x
y y, y si recordamos que

k
xk = x x
tambien concluimos que el valor de la norma de un vector x Rn no depende de las coordenadas (cartesianas)
que se usen.
Por ahora nos sera suficiente con saber lo anterior y conocer las relaciones establecidas en 4.4, 4.5, 4.6 y
4.7, y para concluir con esta seccion, daremos un
Ejemplo 4.1 En el plano, una vez establecido un origen O, considere el sistema coordenado cartesiano
determinado por dos vectores { e1 , e2 } (y que por lo mismo tendremos que dibujar mutuamente perpendiculares
y de la misma longitud), y el sistema cartesiano determinado por los vectores { e , e
}, en donde e se obtiene
de girar (en el sentido contrario a las manecillas del reloj) radianes al vector e1 , y e se obtiene de girar
(en el sentido contrario a las manecillas del reloj) /2 radianes al vector e (ver figura 4.2).
e2
e )
n(

e e2 se
co
s(
e
)
e
cos()
cos()
sen()
e1 b

b
O
e1

sen() )
s(
se
O co
n(
)
Figura 4.2: Las bases ortonormales { e , e

e1 , e2 } y { } del ejemplo 4.1.
De la manera de construir los vectores e y e

, sabemos que estos forman una base ortonormal y que
sus coordenadas en el sistema determinado por { e1 , e2 } son (cos(), sen()) para e , y ( sen(), cos()) para
e
. Es decir, se tiene que
e = cos()
e1 + sen()
e2 (4.8)
e
= sen()
e1 + cos()
e2
De esta forma, si x es un vector del plano que parte del punto O y que tiene coordenadas (x , y ) en el
sistema coordenado determinado por { e , e
}, de acuerdo con la identidad 4.1, las coordenadas (x, y) de x

en el sistema coordenado determinado por la base { e1 , e2 } estar
an dadas por la identidad de matrices

cos() sen()
x y = x y
sen() cos()
J. P
aez 134
4.2. La derivada direccional Captulo 4. La derivada de funciones de Rn en R
es decir
x = cos()x sen()y
y = sen()x + cos()y
Recprocamente, si ahora observamos que
e1 = cos() e
e sen()
e2 = sen() e
e + cos()
(identidades que podemos obtener despejando los vectores e1 y e2 de las identidades 4.8) de acuerdo con la
identidad 4.2, si (x, y) son las coordenadas de x en el sistema coordenado determinado por la base { e1 , e2 },
las coordenadas (x , y ) en el sistema coordenado determinado por { e , e
} estar
an dadas por la identidad
de matrices
cos() sen()
x y = x y
sen() cos()
o lo que es lo mismo, que
x = cos()x + sen()y
y = sen()x + cos()y
N
otese que en este ejemplo se confirma que las matrices

cos() sen() cos() sen()
M= y M =
sen() cos() sen() cos()
tienen las propiedades que habamos mencionado.
4.2 La derivada direccional

Antes de entrar de lleno en la definicion del concepto de derivada direccional, es importante mencionar que
de aqu en adelante (salvo que se diga lo contrario) supondremos que las funciones con las que trabajeremos
an definidas sobre un conjunto abierto y conexo U Rn .
est
Sea pues, f : U Rn R y x 0 U . Recordemos que el concepto de derivaci on de una funci
on f de
R en R en un punto x0 de su dominio, consiste b asicamente en los siguientes pasos: calcular el cambio
de los valores de f en x y en x0 , es decir, calcular f (x) f (x0 ), en donde x 6= x0 ; calcular el cambio que
hay entre x y x0 es decir, calcular x x0 ; calcular la razon (o proporcion) entre estas dos cantidades,
es decir
f (x) f (x0 )
;
x x0
y finalmente determinar si estas razones (o proporciones) tienen un valor lmite cuando la variable x se
aproxima (o tiende) al valor x0 .
Como seguramente el lector ya habr a notado, este procedimiento no lo podemos copiar al caso de las
funciones que nos ocupan.
En efecto, si f : U Rn R y x U , x 6= x0 , el cambio de los valores de la funci
0 , x on en x y en x0
x) f (
(es decir, f ( x0 )) y el cambio entre x y x 0 , es decir, xx 0 , son de naturaleza distinta; mientras
que la primera de estas cantidades es un n umero real (f ( x) f ( xx
x0 )), la otra ( 0 ) es un vector, de tal
forma que no tenemos una manera de calcular la razon (o proporcion) entre dichas cantidades.
Sin embargo, no todo est a perdido y la idea original de derivada la podemos adecuar de alguna manera
al tipo de funciones que nos ocupa.
Dado que estamos suponiendo que U es un conjunto abierto, si x0 U y u es un vector fijo que no sea el
vector 0, los vectores de la forma x =x 0 + hu, con h R, tienen la peculariedad de seguir perteneciendo a
U si h es suficientemente peque na, aunque cabe aclarar que esta peque nez de h tambien dependera de
135 J. P
aez
Captulo 4. La derivada de funciones de Rn en R 4.2. La derivada direccional
la magnitud del vector u. mas especficamente, sabemos que existe r > 0 tal que si k
xx
0 k < r entonces
U , de modo que si tomamos x
x =x 0 + h
u, este punto pertenecera a U si
r > k
x x0 k
= k u x0 k
x0 + h
= khuk
= |h| k
uk
es decir, si |h| < r/ k
uk.
Por otra parte, si observamos que
k
xx
0 k = |h| k
uk
vemos que la magnitud del cambio entre x y x0 est a determinada tanto por h, como por la magnitud del
vector u.
Por estas razones, si al tomar x = x
0 + hu pedimos que el vector u tenga magnitud 1, lograremos las
siguientes ventajas: primera, que la pertenencia del vector x al conjunto U solo dependera del n umero h,
(bastara con que |h| < r para que x = x
0 + hu pertenezca a la bola Br ( x0 ), la que a su vez est
a contenida
en U ); y segunda, el cambio entre x yx 0 (es decir el vector xx 0 ) estar a completamente determinado
por el numero h (no solo su magnitud! tambien su direcci
on!).
Con base en los supuestos anteriores, el cociente
f ( u) f (
x0 + h x0 )
(4.9)
h
sera una medida de la razon (o proporci on) entre el cambio de los valores de la funci on (en los puntos
x
0 + huyx 0 ) y el cambio entre dichos valores de la variable, el cual esta determinado por el n umero h.
Aqu es importante enfatizar que los puntos sobre los cuales estamos evaluando a f (para compararlos con
su valor en x 0 ) est
an restringidos a aquellos que son de la forma x 0 + h
u, es decir, solo estamos evaluando
a f sobre los puntos que est an en la recta que pasa por x 0 y cuya direcci
on esta determinada por el vector
u
(y que ademas se quedan contenidos en U !).
Por esta raz on, si existe el lmite del cociente 4.9 cuando h tiende a 0, diremos que la funci on f es
derivable en el punto x 0 en la direccion del vector u, y al valor de este lmite le llamaremos la derivada
direccional de f en x0 en la direcci on del vector u
. Toda la discusion anterior la dejamos plasmada en la
siguiente
Definicion 4.2 Sean f : U Rn R, x Rn tal que k

0 U y u uk = 1. Decimos que f es derivable en el
punto x0 en la direcci
on del vector u, si
f ( u) f (
x0 + h x0 )
lim
h0 h
existe, en cuyo caso el valor de dicho lmite lo llamaremos la derivada direccional de f en x
0 en la direcci
on
de u, y la denotaremos por Du f (
x0 ), es decir
f ( u) f (
x0 + h x0 )
Du f (
x0 ) := lim
h0 h
Aun y cuando en terminos generales este concepto de derivada es una medida de la razon de cambio
de la funci
on f sobre los puntos de la recta que pasa por x0 y cuya direcci on esta determinada por el vector
, a semejanza de lo que sucede con las funciones de R en R, en algunos casos dicha derivada tambien tiene
u
una interpretacion geometrica importante.
Para el caso particular de R2 , si nos fijamos en la curva que obtenemos al intersecar la grafica de f con el
plano perpendicular al plano XY que contenga a la recta que mencionamos anteriormente (ver figura 4.3),
la derivada direccional de f en x0 en la direcci on de u
la podemos interpretar como la pendiente de la recta
tangente a dicha curva en el punto ( x0 , f (
x0 )).
Sin duda lo siguiente que tendremos que hacer sera dar un ejemplo que ilustre este concepto, pero antes
de ello convendra hacer algunas observaciones importantes. Como el lector podra notar, en la definicion que
acabamos de dar no fue necesario recurrir a ning un sistema coordenado especfico.
J. P
aez 136
f (
x0 )
0
x
Figura 4.3: En R2 , si intersecamos la grafica de f con el plano perpendicular al plano XY que contenga a la
recta que pasa por x
0 en la direcci
on de u, obtenemos una curva, y la derivada Du f (
x0 ) la podemos interpretar
como la pendiente de la recta tangente a dicha curva en el punto (x0 , f (
x0 )).
Por otra parte, como para hacer c alculos especficos s sera necesario expresar a f en terminos de algunas
coordenadas, en el siguiente ejemplo no solo vamos a mostrar c omo se calcula la derivada direccional de f en
alg
un punto x
0 y en alguna direccion u
, sino que mostraremos que dichos c alculos son idependientes (cuando
menos para este ejemplo especfico) del sistema coordenado que usemos.
Ejemplo 4.3 Sea f : R2 R tal que, si un punto x R2 tiene coordenadas (x, y) en la base can
onica,
entonces el valor de f en x
est
a dada por
f (
x) = f (x, y)
= x2 + y 2
yx R2 que en la base can
0 , u onica tienen coordenadas (x0 , y0 ) y (u1 , u2 ), respectivamente.
Primero vamos a calcular Du f (
x0 ). De acuerdo con la definicion 4.2, tenemos que
f ( u) f (
x0 + h x0 )
Du f (
x0 ) = lim
h0 h
f (x0 + hu1 , y0 + hu2 ) f (x0 , y0 )
= lim
h0 h
(x0 + hu1 )2 + (y0 + hu2 )2 (x20 + y02 )
= lim
h0 h
2x0 hu1 + (hu1 )2 + 2y0 hu2 + (hu2 )2
= lim
h0 h

= lim 2x0 u1 + 2y0 u2 + hu21 + hu22
h0
= 2(x0 u1 + y0 u2 )
e1 , e2 } tal que el
Supongamos ahora que tenemos otro sistema coordenado determinado por una base {
cambio de coordenadas de este sistema al sistema can
onico est
a dado por la matriz

a11 a12
M=
a21 a22
es decir, si un punto x tiene coordenadas (x , y ) en la base {
e1 , e2 }, entonces sus coordenadas (x, y) en la
base canonica estar
an dadas por

a11 a12
x y = x y M = x y
a21 a22
137 J. P
aez
x = a11 x + a21 y
y = a12 x + a22 y
de tal forma que ahora el valor de f en x, expresado en terminos de sus coordenadas (x , y ), estar
a dado
por
f (x , y ) = f (
x)
= f (x, y)
= x2 + y 2
= (a11 x + a21 y )2 + (a12 x + a22 y )2

= a211 + a212 (x )2 + 2(a11 a21 + a12 a22 )x y + a221 + a222 (y )2
Si ahora recordamos que la matriz de cambio de base M es tal que

1 0
= M M 1
0 1
= MMt

a11 a12 a11 a21
=
a21 a22 a12 a22
concluimos que a211 + a212 = 1 = a221 + a222 y que a11 a21 + a12 a22 = 0, de tal forma que
x) = f (x , y )
f (
= (x )2 + (y )2
No debera causar sorpresa al lector que las expresiones de f en terminos de las coordenadas (x, y) y de
las coordenadas (x , y ) sean an alogas en este caso ya que, en terminos geometricos, f asigna a cada punto x
su norma al cuadrado (cantidad que se expresa de forma an aloga en ambos sistemas coordenados, en virtud
de que estos son ortonormales).
De esta forma, si las coordenadas del punto x 0 y del vector u en el sistema coordenado determinado por
la base { an dadas por (x0 , y0 ) y (u1 , u2 ) respectivamente, al calcular Du f (
e1 , e2 } est x0 ) usando la expresi
on
de f en este sistema y repitiendo los c alculos que hicimos al principio, obtendremos nuevamente que
x0 ) = 2(x0 u1 + y0 u2 )
Du f (
Lo que ahora mostraremos es que los dos valores que obtuvimos para Du f (
x0 ) usando la expresi
on de f
en cada uno de los sistemas coordenados, coinciden. Para ello, recordemos que las coordenadas del punto x0
y del vector u
en ambos sistemas tambien satisfacen las identidades

x0 y0 = x0 y0 M
y
u1 u2 = u1 u2 M
respectivamente, de tal forma que, usando la notaci on del producto de matrices, obtenemos que

u1
2(x0 u1 + y0 u2 ) = 2 x0 y0
u2
t
=2 x0 y0 M u1 u2 M

u1
= 2 x0 y0 (M M t )
u2

u1
= 2 x0 y0 (M M 1 )
u2
J. P
aez 138

u1
=2 x0 y0
u2
= 2(x0 u1 + y0 u2 )
Aun y cuando lo que acabamos de hacer solo muestra para un ejemplo especfico que el valor de Du f ( x0 )
no depende del sistema coordenado que usemos, parte del material que vamos a desarrollar en este captulo
sera u
til para probar que este concepto es, en general, independiente de dichos sistemas.
Dada la similitud que existe entre el concepto de derivada direccional y el de derivada para funciones de
R en R, es de suponerse que muchas de las propiedades de esta u ltima, las satisfaga la primera.
Una de estas propiedades, y que en el caso real resulta ser muy importante, es el hecho de que toda
funcion que sea derivable en un punto, tiene que ser continua en ese punto.
Dado que la derivada direccional Du f (
x0 ) solo toma en cuenta la variacion de la funci
on sobre la recta
que pasa por x 0 en la direcci
on del vector u, lo que podemos probar es que si dicha derivada direccional
existe entonces la funcion, restringida a dicha recta, sera continua en el punto x 0 .
Este hecho lo dejamos plasmado en la siguiente proposicion y su prueba la dejamos al lector.
on 4.4 Sean f : U Rn R, x
Proposici Rn tal que k
0 U y u uk = 1. Si Du f (
x0 ) existe entonces
lim f (
x0 + h
u) = f (
x0 )
h0
Otras propiedades importantes de la derivada direccional son las relacionadas con la aritmetica de las
funciones. Nuevamente, de forma analoga a lo que sucede con las funciones de R en R, ademas de que
dicha aritmetica preserva la existencia de la derivada direccional, las formulas de derivaci
on que se obtienen
resultaran ser muy u
tiles.
Proposici on 4.5 Sean f, g : U Rn R, x Rn tal que k

0 U , y u uk = 1. Si Du f (
x0 ) y Du g(
x0 )
existen entonces:
1. Du (f + g)(
x0 ) existe y adem
as
Du (f + g)(
x0 ) = Du f (
x0 ) + Du g(
x0 )
2. si R, Du (f (
x0 ) existe y adem
as
Du (f )(
x0 ) = Du f (
x0 )
3. Du (f g)(
x0 ) existe y adem
as
Du (f g)(
x0 ) = f (
x0 )Du g(
x0 ) + g(
x0 )Du f (
x0 )
4. si g es continua en x x0 ) 6= 0, Du (f /g)(
0 y g( x0 ) existe y adem
as
g( x0 ) f (
x0 )Du f ( x0 )Du g(
x0 )
Du (f /g)(
x0 ) = 2
g (
x0 )
Aun y cuando la prueba de esta proposicion tambien se deja al lector, es importante hacer un comentario
acerca de la hip
otesis de continuidad que se pide en el inciso 4.
En realidad, dicha hip otesis se incluye para seguir garantizando la condicion que nos impusimos de que
las funciones con las que vamos a trabajar a partir de este captulo, esten definidas sobre un conjunto abierto.
Notese que por el inciso (a) del problema 43 del captulo 2, y del hecho de que el dominio de g sea el abierto
U , podemos asegurar que la funci on f /g est
a definida en un abierto que contiene al punto x0 .
Para concluir con las propiedades de la derivada direccional relacionadas con las operaciones entre fun-
ciones, formularemos en una proposicion aparte, aquella que nos habla de la composicion de funciones.
El caso que va a resultar mas interesante sera cuando compongamos a f con una funci on g de R en R.
Esta propiedad, que en realidad es una consecuencia de un resultado mas general conocido como la regla
de la cadena (que probaremos mas adelante), la dejamos plasmada en la siguiente
139 J. P
aez
Proposici on 4.6 Sean f : U Rn R, x 0 U , u Rn tal que k uk = 1 y (a, b) R tal que f (U ) (a, b).
Si g : (a, b) R R es derivable en f ( x0 ) existe entonces Du (g f )(
x0 ) y Du f ( x0 ) existe y adem
as
x0 ) = g (f (
Du (g f )( x0 ))Du f (
x0 )
on. De acuerdo con la definicion de Du (g f )(

Demostraci x0 ), debemos probar que
(g f )( u) (g f )(
x0 + h x0 ) g(f ( u)) g(f (
x0 + h x0 ))
lim = lim
h0 h h0 h
existe.
Como seguramente el lector recordara de la correspondiente prueba para el caso de funciones de R en R,
si hacemos
kh = f ( u) f (
x0 + h x0 )
el lmite anterior se podra escribir como
g(f ( u)) g(f (
x0 + h x0 )) x0 ) + kh ) g(f (
g(f ( x0 ))
lim = lim
h0 h h0 h
de tal forma que si kh 6= 0 entonces
g(f ( u)) g(f (
x0 + h x0 )) x0 ) + kh ) g(f (
g(f ( x0 ))
lim = lim
h0 h h0 h

x0 ) + kh ) g(f (
g(f ( x0 )) kh
= lim
h0 kh h

x0 ) + kh ) g(f (
g(f ( x0 )) f ( u) f (
x0 + h x0 )
= lim
h0 kh h
Si ahora notamos que, por la proposicion 4.4, se tiene que kh 0 cuando h 0 puesto que
lim kh = lim (f ( u) f (
x0 + h x0 ))
h0 h0
=0
entonces
x0 ) + kh ) g(f (
g(f ( x0 ))
lim = g (f (
x0 ))
h0 kh
y obtendramos el resultado deseado.
Como seguramente el lector ya sabe, el problema con el argumento anterior es que este solo funciona si
kh 6= 0, y como tambien recordara, la solucion a este problema esta en definir una funci on auxiliar.
Definimos : (r, r) R R, con r > 0 tal que Br ( x0 ) U , de la siguiente manera:
g(f (x0 )+kh )g(f (x0 ))
kh si kh 6= 0
(h) =

g (f (
x0 )) si kh = 0
Lo primero que es importante observar (y que es muy facil de verificar) es que

x0 ) + kh ) g(f (
g(f ( x0 )) f ( u) f (
x0 + h x0 )
= (h)
h h
para toda h (r, r), h 6= 0, de tal forma que nuestro problema se reduce a demostrar que
lim (h) = g (f (
x0 ))
h0
Sea entonces > 0; dado que g es derivable en f ( x0 ) sabemos que existe > 0 tal que si |k| < (y
x0 ) + k (a, b)) entonces
f (
x0 ) + k) g(f (
g(f ( x0 ))

g (f (
x 0 ))< (4.10)
k
J. P
aez 140
Por otra parte, por la proposicion 4.4 sabemos que
lim kh = lim (f ( u) f (
x0 + h x0 ))
h0 h0
=0
y por tanto existe 0 < r tal que si |h| < entonces |kh | < . De esta forma, si |h| < , independiente-
mente de que kh 6= 0 o kh = 0, por la desigualdad 4.10 o por el valor de cuando kh = 0, en ambos casos
se tiene que
|(h) g (f (
x0 ))| <
y por lo tanto que
lim (h) = g (f (
x0 ))
h0
con lo cual concluimos la prueba.
Terminamos esta serie de proposiciones con una en la que se establece una propiedad que bien podra
interpretarse como la versi
on del Teorema del Valor Medio para la derivada direccional.
Su formulaci a, b] representa al segmento de recta que une
on es la siguiente, en donde recordamos que [
al punto a
con el punto b.
h i
on 4.7 Sean f : U Rn R, a , b U , a
6= b, tales que a, b U y u
= b a
/ b a
Rn .

Proposici
h i
, b entonces existe 0, b a tal que si = a

Si Du f ( a
x) existe para toda x + u
, se cumple que

f (b) f (
a) = b a
Du f

Demostraci on. Como es de suponerse, la hprueba

de i esta proposicion se basa en el Teorema del Valor
Medio para funciones R en R. Definimos g : 0, b a

R R como g(t) = f ( a + t
u). N
otese que g es
h i
derivable para toda t 0, b a

puesto que
g(t + h) g(t)
g (t) = lim
h0 h
f ( u) f (
a + (t + h) a + t
u)
= lim
h0 h
f ((
a + t
u) + hu) f (
a + t
u)
= lim
h0 h
= Du f (
a + t
u)

de tal forma que, por el Teorema del Valor Medio para funciones R en R, se tiene que existe 0, b a

tal que

f b f (
a) = g b a

g (0)

= b a 0 g ()

= b a

Du f (
a + u
)

= b a Du f

141 J. P
aez
4.2.1 Derivadas parciales

Si una funci
on f esta escrita en terminos de las coordenadas x1 , . . . , xn asociadas a un sistema de referencia
determinado por una base ortonormal { e1 , . . . , en } de Rn , calcular la derivada direccional de f en la direcci
on
de estos vectores b
asicos (en cualquier punto x del dominio de f ), resultara mas sencillo (y mas importante).
En efecto, si
x = x1 e1 + + xn en
= (x1 , . . . , xn )
y el valor de f en x se puede escribir en terminos de las coordenadas (x1 , . . . , xn ), es decir que
f (
x) = f (x1 , . . . , xn )
entonces el calculo de la derivada direccional de f en x , en la direcci

on de cada vector ei , se traduce en lo
siguiente.
De la definicion de la derivada direccional Dei f (
x) sabemos que
f ( ei ) f (
x + h x)
Dei f (
x) = lim
h0 h
y dado que las coordenadas del vector x
+h
ei son (x1 , . . . , xi +h, . . . , xn ), el lmite anterior escrito en terminos
de coordenadas, se convierte en
f (
x + h ei ) f (
x)
Dei f (
x) = lim
h0 h
f (x1 , . . . , xi + h, . . . , xn ) f (x1 , . . . , xn )
= lim
h0 h
Como seguramente el lector podra intuir, en el lmite anterior la u nica coordenada en la que se est a
teniendo un incremento h es en la iesima, mientras que en las otras coordenadas no hay cambios, es decir,
permanecen fijas.
En terminos mas informales, esto significa que para el c alculo de la derivada direccional Dei f (
x) bastara
con derivar la expresion f (x1 , . . . , xn ) tomando como u nica variable a xi , y considerando a las restantes
(x1 , . . . , xi1 , xi+1 , . . . , xn ) como si fueran constantes.
En el siguiente ejemplo ilustramos este hecho de manera mas clara.
Ejemplo 4.8 Sea f : R2 R la funci on cuyo valor en un punto x R2 esta dado en terminos de sus
coordenadas (x, y) (en la base can
onica, que en este caso a sus elementos los denotamos por ex y ey ) por la
expresi
on
f (x, y) = 4x5 y 2
Calcularemos Dey f (
x) para cualquier x R2 .
Si x on de la derivada direccional Dey f (
= (x, y), de acuerdo con la definici x), se tiene que
f (
x + hey ) f (
x)
Dey f (
x) = lim
h0 h
f (x, y + h) f (x, y)
= lim
h0 h
4x5 (y + h)2 4x5 y 2
= lim
h0 h
2
(y + h) y2
= lim 4x5
h0 h
(y + h)2 y 2
= 4x5 lim
h0 h
= 4x5 (2y)
= 8x5 y
J. P
aez 142
Como el lector habr a notado en este ejemplo, el calculo de la derivada direccional Dey f (
x) se redujo
a derivar la expresion 4x5 y 2 considerando solo como variable a la coordenada y, y tratando al resto de la
expresion (4x5 ) como una constante.
Una de las ventajas de lo anterior (entre otras mas!) es que podemos simplificar el c alculo de estas
derivadas direccionales usando los metodos de derivacion que aprendimos para las funciones de R en R.
Por estas caractersticas, y algunas otras que veremos mas adelante, las derivadas direccionales en la
direcci
on de los vectores de una base ortonormal, tienen un nombre y una notaci on propia, las cuales
establecemos en la siguiente
Definicion 4.9 Sean f : U Rn R, x 0 U y u Rn tal que k uk = 1. Si x1 , . . . , xn denotan las

variables (o coordenadas) determinadas por una base ortonormal { e1 , . . . , en } de Rn , definimos la derivada
f
parcial de f con respecto de la variable xi en x
0 , que denotamos por x i
(x0 ), como
f
x0 ) := Dei f (
( x0 )
xi
f ( ei ) f (
x0 + h x0 )
:= lim
h0 h
Como es de suponerse, dado que cualquier derivada parcial no es mas que una cierta derivada direccional,
las proposiciones 4.4, 4.5, 4.6, y 4.7, tienen sus correspondientes versiones para derivadas parciales, las cuales
formalizaremos a continuacion (sin probar). En todas ellas supondremos que x1 , . . . , xn son las variables (o
coordenadas) determinadas por una base ortonormal { e1 , . . . , en } de Rn .
f
Proposici 0 U . Si xi (
x0 ) existe entonces
lim f (
x0 + h
ei ) = f (
x0 )
h0
f g
Proposici on 4.11 Sean f, g : U Rn R y x
0 U . Si xi (
x0 ) y xi (
x0 ) existen para alguna i
{1, . . . , n} entonces:
(f +g)
1. xi (x0 ) existe y adem
as
(f + g) f g
(
x0 ) = (
x0 ) + (
x0 )
xi xi xi
(f )
2. si R, xi (x0 ) existe y adem
as
(f ) f
(
x0 ) = (
x0 )
xi xi
(f g)
3. xi (x0 ) existe y adem
as
(f g) g f
(
x0 ) = f (
x0 ) (
x0 ) + g(
x0 ) (
x0 )
xi xi xi
(f /g)
4. si g es continua en x x0 ) 6= 0,
0 y g( xi ( x0 ) existe y adem
as
f g
(f /g) g(
x0 ) x i
x0 ) f (
( x0 ) x i
(
x0 )
(
x0 ) =
xi g 2 (
x0 )
Proposici on 4.12 Sean f : U Rn R, x0 U y (a, b) R tal que f (U ) (a, b). Si g : (a, b) R R

es derivable en f ( f
x0 ) y x i
x0 ) existe para alguna i {1, . . . , n} entonces (gf
( )
xi ( x0 ) existe y adem
as
(g f ) f
x0 ) = g (f (
( x0 )) (
x0 )
xi xi
143 J. P
aez
Captulo 4. La derivada de funciones de Rn en R 4.3. La derivada global
h i
Proposici on 4.13 Sean f : U Rn R, a , b U , a
6= b, tales que a , b U y b a
= (b a) ei . Si para
h i
f
alguna i {1, . . . , n} se tiene que x (
x ) existe para toda x
a
, b entonces existe 0, b a

= |b a|
i
h i

tal que si = a
+ ei a
, b , se cumple que
f
f (b) f (
a) = (b a) () (4.11)
xi
En esta u ltima proposicion es importante hacer notar dos aspectos importantes: uno, que la hipotesis de
que a, b U sean tales b a
= (b a) y b (en la base {
ei , significa que las coordenadas de a e1 , . . . , en }) solo
difieren en la iesima coordenada; y dos, que en el caso en que la cantidad b a sea negativa, entonces el
vector u que se construye en la proposicion 4.7 es tal que
b a

u =

b a
ba
= ei
|b a|
= ei
de tal forma que, de acuerdo con la conclusi on de dicha proposicion (y el facil resultado que el lector probar
a
en el problema 1 de este captulo), se tiene que

f (b) f (
a) = b a

Du f ()

= |b a| Dei f ()

= (b a)(Dei f ())
f
= (b a) ()
xi
y por lo tanto la identidad 4.11 se cumple independientemente de la relacion (de orden) que guarden a y b.
4.3 La derivada global

Salvo por el caso de las derivadas direccionales, quedarnos solo con la idea de que la derivada es una forma
de medir la raz on de cambio de una funci on, es algo que dificilmente nos ayudar
a a extender el concepto
de derivada a funciones de Rn en R.
Por esta raz on, en esta secci
on empezaremos por recordar que la derivabilidad de una funci on f de R en
R en un punto x0 , ademas de proporcionarnos una medida de la raz on de cambio de f en x0 , tambien nos
ayuda a resolver un problema geometrico: encontrar la recta tangente a la grafica de la funci on en el punto
(x0 , f (x0 )).
Como el lector seguramente recordara, la derivada de una funcion f de R en R en un punto x0 (f (x0 ))
tiene la propiedad de que, si tomamos la recta con esta pendiente que pasa por el punto (x0 , f (x0 )), esta
recta es tangente a la gr afica de la funci
on en dicho punto.
Especficamente, lo anterior se traduce en lo siguiente: la recta con pendiente f (x0 ) que pasa por el
punto (x0 , f (x0 )) es aquella cuya ecuacion se puede escribir de la forma
y = f (x0 )(x x0 ) + f (x0 )
Que esta recta sea tangente a la gr

afica de f en (x0 , f (x0 )), significa no solo que pasa por ese punto, sino
que ademas se parece mucho a f cerca de x0 , donde eso de parecerse mucho a f cerca de x0 se traduce
en que
f (x) (f (x0 )(x x0 ) + f (x0 ))
lim =0
xx0 x x0
J. P
aez 144
4.3. La derivada global Captulo 4. La derivada de funciones de Rn en R
es decir, que la diferencia f (x) (f (x0 )(x x0 ) + f (x0 )) se va mas rapido a cero de lo que se va la
diferencia x x0 .
De hecho, como seguramente el lector tambien recordara, la existencia de una recta con estas carac-
tersticas garantiza la derivabilidad de la funci
on en el punto x0 . Dado que las rectas que pasan por el punto
(x0 , f (x0 )) tienen una ecuaci
on de la forma
y = m(x x0 ) + f (x0 )
si una de estas rectas tiene la propiedad de que
f (x) (m(x x0 ) + f (x0 ))

lim =0 (4.12)
xx0 x x0
entonces podemos asegurar que f es derivable en x0 y que ademas f (x0 ) = m.

En efecto, como
f (x) (m(x x0 ) + f (x0 ))

0 = lim
xx0 x x0

f (x) f (x0 )
= lim m
xx0 x x0
entonces
f (x) f (x0 )
m = lim
xx0 x x0
= f (x0 )
lo que comprueba nuestra afirmaci on.

De lo anterior concluimos que la derivabilidad de una funcion f de R en R en un punto x0 , es equivalente
a la existencia de una funci on de la forma r(x) = m(x x0 ) + f (x0 ) que satisfaga la identidad 4.12. En
realidad bastara con considerar las funciones de la forma L(x) = mx, puesto que la funci on r(x) no es mas
que, en terminos de sus graficas, la traslaci
on de L(x) (que pasa por el origen) al punto (x0 , f (x0 )) (ver
figura 4.4).
Las funciones de la forma L(x) = mx son justo el tipo de funciones de R en R conocidas con el nombre de
funciones lineales (las cuales introdujimos en el problema 39 del captulo 2 para el caso general de funciones
de Rn en Rm ), y que son las funciones L : R R que tienen las siguientes dos propiedades:
1. L(x + y) = L(x) + L(y) para todas x, y R, y
2. L(x) = L(x) para todas , x R
Es un problema sencillo mostrar que L : R R es una funci olo si existe m R tal que
on lineal si y s
L(x) = mx para toda x R (en ambas implicaciones se deduce que m = L(1)).
Como seguramente el lector ya estar a imaginando, la discusi on anterior nos sugiere la forma en que
podemos dar la definicion de derivada (global) de una funci on de Rn en R.
En terminos generales, que una funci on f de este tipo sea derivable en un punto x0 de su dominio,
significara que existe una funci on lineal L de Rn en R tal que al trasladarla para que su valor en x 0 sea
f (x0 ), esta funci
on lineal trasladada (L( x
x0 )+f (
x0 )), que recibe el nombre de funcion (o transformaci
on)
afn se parece mucho a la funci on f cerca de x
0 .
Especficamente, nuestra definicion de derivabilidad sera la siguiente.
Definici on 4.14 Sean f : U Rn R y x0 U . Decimos que f es derivable en x0 si existe una funcion

lineal L : Rn R tal que
x) (L(
f ( x x0 ) + f (
x0 ))
lim =0 (4.13)
xx0 k
xx 0 k
145 J. P
aez
(x0 , f (x0 ))
b L
x0
Figura 4.4: La funcion r(x) = m(x x0 ) + f (x0 ) es la traslacion de la funcion L(x) = mx (que pasa por el
origen) al punto (x0 , f (x0 )).
Sin duda que despues de esta definicion, sera conveniente dar un ejemplo que la ilustrara. Sin embargo,
es importante hacer notar que hasta ahora no tenemos ninguna herramienta que nos permita, dada una
funci
on (expresada en alg un sistema coordenado), proponer (o intuir) cual debera de ser la funci on lineal
que satisfaga la condicion que se le pide en esta definicion.
Por esta raz
on, primero nos enfocaremos en dar algunas propiedades relacionadas con este concepto de
derivada que, entre otras cosas, nos permitiran darnos una idea de c omo encontrar la ya famosa funci on
lineal L.
De hecho, la primera proposicion que probaremos es justo la que nos asegura que solo puede haber una
u
nica funci
on lineal que satisfaga la propiedad de la definicion 4.14.
Proposici on 4.15 Sean f : U Rn R, x0 U y L, L : Rn R funciones lineales. Si L y L

satisfacen
la condici
on 4.13 de la definici
on 4.14 entonces L y L son iguales.
Demostraci
on. Dado que por hip
otesis sabemos que
x) (L(
f ( xx
0 ) + f (
x0 ))
lim =0
x

x0 k
xx
0 k
y
f ( xx
x) (L( 0 ) + f (
x0 ))
lim =0
x

x0 k
xx
0 k
restando ambos lmites concluimos que
x x0 ) L(
L( xx
0 ) L)(
(L xx 0 )
lim = lim
x

x0 k
xx 0 k x
x0 k
xx 0 k
=0
=L
de tal forma que si hacemos L =x
L y h x es una funci
0 , entonces L on lineal para la cual se satisface
que
h)
L(
lim =0

h 0 h

es la constante cero, o lo que es lo mismo,
de tal forma que, por el problema 39 del captulo 2, se tiene que L

que L y L son iguales.
Con base en esta proposicion ya podemos completar la definicion 4.14 de la siguiente forma: si f : U
Rn R es derivable en x0 U , a la funci
on lineal que satisface la condicion 4.13, que por la proposicion
anterior sabemos que es u
nica, la denotaremos por Df (x0 ) y diremos que es la derivada de f en x0 . De esta
forma, la derivada de una funcion de Rn en R es una funci on lineal.
J. P
aez 146
Mas adelante veremos que toda funcion lineal de Rn en R se puede representar (dependiendo del sistema
coordenado que se elija) por una matriz de 1n o por un vector en Rn , de tal forma que en algunas ocasiones
diremos (abusando ciertamente del lenguaje) que la derivada de este tipo de funciones tambien es (o dicho
de manera mas correcta, que se puede representar por) una de estas matrices (o uno de estos vectores).
Y justamente, con el objetivo de poder calcular (o conocer) la derivada de una funci on en un punto
x
0 , el siguiente resultado que veremos establece una importante relacion entre la funci on lineal Df ( x0 ) (que
es la derivada en el punto x 0 ) y las derivadas direccionales en dicho punto.
En terminos generales, la siguiente proposicion que probaremos nos asegura que si una funci on es derivable
en un punto x 0 entonces la derivada direccional en x0 , en la direcci
on de cualquier vector u, tambien existe
y ademas el valor de dicha derivada direccional se obtiene evaluando la funci on lineal Df (x0 ) en el vector
u
.
Proposici on 4.16 Sean f : U Rn R, x0 U y u Rn tal que k uk = 1. Si f es derivable en x0
entonces la derivada direccional de f en x
0 en la direcci
on de u tambien existe y adem
as
Du f (
x0 ) = Df (
x0 )(
u)
Demostraci
on. De la definicion 4.14 sabemos que
x) (Df (
f ( x x0 ) + f (
x0 )( x0 )) x) f (
f ( x0 ) Df ( xx
x0 )( 0 )
lim = lim
x

x0 k
xx 0 k x
x0 kxx 0 k
=0
de tal forma que si en particular tomamos x = x
0 + h x0 si h 0 y por lo
u, tenemos entonces que x
tanto se tendra que
x) f (
f ( x0 ) Df ( xx
x0 )( 0 )
0 = lim
x
x0 kx x0 k
|f (
x) f (
x0 ) Df ( xx
x0 )( 0 )|
= lim
x
x0 kx x0 k
|f ( u) f (
x0 + h x0 ) Df ( x0 )(hu)|
= lim
h0 khuk
|f ( u) f (
x0 + h x0 ) Df ( x0 )(hu)|
= lim
h0 |h|

f (
x0 + hu) f (x0 ) hDf ( x0 )( u)
= lim
h0 h

f (
x0 + hu) f (x0 )
= lim Df ( x0 )(
u)
h0 h
lo cual es equivalente a que
f ( u) f (
x0 + h x0 )
lim = Df (
x0 )(
u)
h0 h
de donde concluimos que la derivada direccional de f en x0 en la direcci
on de u
existe y ademas que
Du f (
x0 ) = Df (
x0 )(
u)
Para abordar el problema de calcular la derivada de una funci on, es necesario establecer algunos hechos
importantes acerca de las funciones lineales, lo cual haremos a continuacion.
Es facil ver que si L : Rn R es una funci on lineal, para conocer el valor de L en cualquier punto x Rn ,
n
es suficiente con saber los valores de L en los elementos de una base de R .
En efecto, n otese que si x tiene coordenadas (x1 , . . . , xn ) en un sistema coordenado determinado por una
base = { v1 , . . . , vn }, esto significa que
= x1 v1 + + xn vn
x
147 J. P
aez
de tal forma que, por la linealidad de L se tiene que
x) = L(x1 v1 + + xn vn )
L(
v1 ) + + xn L(
= x1 L( vn )
lo que confirma que para saber el valor de L en x , es suficiente con conocer las coordenadas de x en una
base = {v1 , . . . , vn } y los valores de L en los elemento de esta base.
Si denotamos por a1i = L( vi ), se suele construir la matriz de 1 n

M = a11 a1n
y decir que la matriz M respresenta a la funcion lineal L en la base = {

v1 , . . . , vn }.
De hecho, esta representacion matricial y las operaciones entre matrices son u tiles para expresar a L(
x)
como
L(
x) = L(x1 , . . . , xn )

x1
.
= a11 a1n ..
xn

x1
= M ...

xn
En el caso particular de funciones lineales de Rn en R, tambien podemos representar a L por el vector

(L(
v1 ), . . . , L(
vn )) y usar el producto punto para expresar a L(
x) como
L(
x) = L(x1 , . . . , xn ) (4.14)
= (L(
v1 ), . . . , L(vn )) (x1 , . . . , xn )
Con base en lo anterior, si una funci on f est a expresada en terminos de las coordenadas x1 , . . . , xn
determinadas por alguna base ortonormal { e1 , . . . , en } de Rn , para encontrar la matriz que representa (en
la misma base {e1 , . . . , en }) a la derivada de f en un punto x0 de su dominio, es decir Df ( x0 ), bastara con
saber el valor Df (
x0 )( ei ) (para cada i {1, . . . , n}), y de acuerdo con lo probado en la proposicion 4.16, se
tiene que
Df ( x0 )( ei ) = Dei f (
x0 )
Y si ahora recordamos, de acuerdo con la definicion 4.9, que
f
Dei f (
x0 ) = (
x0 )
xi
entonces concluimos que para calcular (o conocer) a Df ( x0 ) basta con calcular las derivadas parciales
de f en x0 .
En cuanto a la discusion previa, es importante hacer notar que la mera existencia de las derivadas parciales
de una funci on f en un punto x0 de su dominio, no garantizan que la funci on sea derivable en dicho punto.
Lo que en el fondo est a sucediendo, es que en la proposicion 4.16 se establece que la existencia de las
derivadas direccionales (incluyendo las derivadas parciales) es una condicion (o consecuencia) necesaria de
la derivabilidad de f en x 0 , pero lo recproco no es cierto (mas adelante daremos un ejemplo que ilustra esta
afirmacion).
Sin embargo, la importancia de la discusi on anterior est a en que se muestra con toda precision cual es la
u
nica funci on lineal que podra ser la derivada de f en x 0 , lo que sin duda es un hecho de gran valor. Y una
vez aclarado lo anterior, pasamos a dar el siguiente
Ejemplo 4.17 Sea f : R2 R que est

a dada (en terminos de las coordenadas de la base can
onica) por la
expresi
on
f (x, y) = x2 + y 2 1
J. P
aez 148
Mostraremos que f es derivable en cualquier punto x0 = (x0 , y0 ) R2 y calcularemos Df (

x0 ).
De acuerdo con lo visto anteriormente, hay que calcular las derivadas parciales de f con respecto de las
variables x y y,
f f
(x, y) = 2x y (x, y) = 2y
x y
evaluarlas en x
0 = (x0 , y0 )
f f
(x0 , y0 ) = 2x0 y (x0 , y0 ) = 2y0
x y
y mostrar que la funci
on lineal (expresada en el mismo sistema coordenado)
L(
x) = L(x, y)
x
= fx (x0 , y0 )
f
y (x0 , y0 ) y

x
= 2x0 2y0
y
= 2x0 x + 2y0 y
satisface la condici
on 4.13 de la definci
on 4.14.
En efecto, sustituyendo f y L en dicha expresi
on, tenemos que
x) (L(
f ( xx 0 ) + f (
x0 )) x2 + y 2 1 (2x0 (x x0 ) + 2y0 (y y0 ) + x20 + y02 1)
lim = lim p
x

x0 k
x x0 k x
x0 (x x0 )2 + (y y0 )2
(x2 2x0 x + x20 ) + (y 2 2y0 y + y02 )
= lim p
x

x0 (x x0 )2 + (y y0 )2
(x x0 )2 + (y y0 )2
= lim p
x
x0 (x x0 )2 + (y y0 )2
p
= lim (x x0 )2 + (y y0 )2
x

x0
=0
de donde concluimos que f es derivable en x0 y que adem as Df (

x0 ) es la funci
on lineal representada (o
asociada), en el mismo sistema coordenado en que est a expresada f , por la matriz
h i
f f
x (x ,
0 0y ) y (x ,
0 0y ) = 2x0 2y0
es decir que

x
Df (
x0 )(x, y) = 2x0 2y0
y
= 2x0 x + 2y0 y
Para aprovechar el ejemplo anterior, en el cual podemos ver la grafica de la funci on f , y confirmar
la estrecha relacion que existe entre el concepto de derivada y el concepto de tangencia, observemos que la
grafica de la funci
on lineal
Df (
x0 )(x, y) = 2x0 x + 2y0 y
es un plano (que contiene al origen) y que la grafica de la funci
on
x0 )(x x0 , y y0 ) + f (x0 , y0 )
L(x, y) = Df (
= 2x0 (x x0 ) + 2y0 (y y0 ) + x20 + y02 1
es un plano (trasladado al punto (x0 , y0 , x20 + y02 1)) que se ve tangente a la grafica de la funci
on
f (x, y) = x2 + y 2 1 en este mismo punto (ver figura 4.5).
Con base en las observaciones anteriores, damos la siguiente
149 J. P
aez
(x0 , y0 , f (x0 , y0 ))
Figura 4.5: El plano tangente a la grafica de la funcion f (x, y) = x2 + y 2 1 en el punto (x0 , y0 ) = (1, 1).
Definicion 4.18 Sea f : U R2 R derivable en el punto x0 = (x0 , y0 ) U . Decimos que el plano que
tiene como ecuaci
on
f f
z= (x0 , y0 ) (x x0 ) + (x0 , y0 ) (y y0 ) + f (x0 , y0 ) (4.15)
x y
es el plano tangente a la gr
afica de f en el punto (x0 , y0 , f (x0 , y0 )).
N
otese que la ecuaci
on 4.15 se puede escribir como

f f
(x0 , y0 ), (x0 , y0 ), 1 (x x0 , y y0 , z f (x0 , y0 )) = 0 (4.16)
x y
de tal forma que el vector

f f
(x0 , y0 ), (x0 , y0 ), 1
x y
es un vector normal a este plano tangente.
De aqu en adelante escribiremos, sin duda abusando de la notaci on, que la funci
on lineal Df (
x0 ) es igual
a la matriz (de 1 n) que la representa en el sistema de referencia que se este usando, y en cuyas coordenadas
est
a expresada f .
Sin embargo, no hay que olvidar que esta matriz depende del sistema de referencia que se este usando, y
parte de lo que haremos a continuacion sera mostrar la relacion que existe entre las matrices asociadas a la
funci on lineal Df ( x0 ) en dos sistemas de referencia (ortonormales) diferentes, y c omo se puede obtener una
a partir de la otra.
Una vez dicho lo anterior, si x1 , . . . , xn denotan a las variables determinadas por una base ortonormal
{
e1 , . . . , en }, entonces escribiremos que
h i
f f
Df (
x0 ) = x 1
(
x 0 ) xn (
x 0 ) (4.17)
Rn tiene coordenadas (u1 , . . . , un ) en la base {

de tal forma que si u e1 , . . . , en }, se tiene que

h i u1
f f ..
Df (
x0 )(
u) = x1 (
x0 ) xn (
x0 ) .
un
f f
= u1 x0 ) + + un
( (
x0 )
x1 xn
J. P
aez 150
As pues, si ahora x1 , . . . , xn denotan a las variables determinadas por otra base ortonormal {
e1 , . . . , en }
n
de R , y se tiene que

(i)
ei = a1 , . . . , a(i)
n
(i)
= a1 e1 + + a(i)
n e n

f
(
x0 ) = Dei f (
x0 )
xi
= Df ( ei )
x0 ) (
(i) f f
= a1 (x0 ) + + a(i)
n (
x0 )
x1 xn
lo cual establece la forma de obtener las derivadas parciales de f , con respecto a las variables (o coordenadas)
x1 , . . . , xn , en terminos de las variables x1 , . . . , xn .
N otese que esta u ltima identidad tambien se puede obtener como una cosecuencia de la proposicion 4.16
puesto que, como ei es un vector de norma uno, y
(i)
ei = a1 e1 + + a(i)
n e n
entonces
f
(
x0 ) = Dei f (
x0 )
xi
= Df ( ei )
x0 ) (

(i)
x0 ) a1 e1 + + a(i)
= Df ( n e
n
(i)
= a1 Df ( e1 ) + + a(i)
x0 ) ( n Df (x0 ) (
en )
(i) f f
= a1 x0 ) + + a(i)
( n (
x0 )
x1 xn
Para terminar de encontrar la relacion que existe entre las matrices asociadas a la derivada Df ( x0 ) en
dos sistemas de referencia (ortonormales) diferentes, recordemos que en la base { e1 , . . . , en } esta funcion
lineal estar
a representada por la matriz
h i
f f
x0 ) x
x ( (
x0 )
1 n
de modo que las matrices (de 1 n) que representan a la funci on lineal Df ( x0 ) (en las correspondientes
e1 , . . . , en } y {
bases { e1 , . . . , en }) estan relacionadas por la identidad

(1) (n)
h i h a
i 1 a 1
f
(
x 0 ) f
(
x 0 ) = f
(
x ) f
(
x ) .. ..
.
..
(4.18)
x1
xn
x1 0 xn 0 . .
(1) (n)
an an
o por la identidad

(1) (1)
h i h i a1 an
f f f
f . .. ..
x1 (
x0 ) xn (
x0 ) = x1 (
x0 ) xn (
x0 ) .. (4.19)
.
.
(n) (n)
a1 an
las cuales, sin duda alguna, har

a que el lector recuerde las identidades 4.4 y 4.7, que son las que obtuvi-
mos cuando analizamos el problema relacionado con el cambio de coordenadas (de un mismo vector x)
determinadas por dos bases ortonormales de Rn .
151 J. P
aez
4.3.1 El gradiente
Ademas de sus implicaciones practicas para el c alculo explcito de la derivada de una funci on, la proposicion
4.16 tiene otra consecuencia importante, la que resultara muy u til para conocer el comportamiento de una
funci
on en la vecindad de un punto en el cual sea derivable.
Como asegura la proposicion 4.16, si f es derivable en un punto x 0 entonces la derivada direccional de f
en x
0 , en la direcci
on del vector (unitario) u
, se obtiene evaluando la funci on lineal Df (
x0 ) (la derivada de
f en x0 ) en u.
Si ahora recordamos que toda funci on lineal es continua (problema 62 del captulo 2) y que el conjunto
S n1 = {
u Rn | k
uk = 1}
es cerrado (problema 50 del captulo 2) y claramente acotado, por el corolario 2.51 del captulo 2 sabemos
que deben existir u 2 en S n1 tales que
1 y u
Df ( u1 ) Df (
x0 )( u) Df (
x0 )( x0 )(
u2 )
S n1 , o equivalentemente, que
para toda u
x0 ) Du f (
Du1 f ( x0 ) Du2 f (
x0 )
S n1 .
para toda u
Es decir, en terminos mas coloquiales, siempre existen direcciones u 1 y u
2 , una en la que la razon de
cambio de la funcion f es mnima (
u1 ), y otra en la que la razon de cambio de la funci on f es maxima (u2 ).
De hecho, lo siguiente que probaremos es que si la Df ( x0 ) no es la funci
on lineal constante cero (en cuyo
caso todas las derivadas direccionales valen 0), entonces u 1 y u2 son unicos y ademas u1 = u2 .
on 4.19 Sea f : U Rn R y x
Proposici 0 U . Si f es derivable en x 0 S n1 tal
0 entonces existe u
que
x0 ) Du f (
Du0 f ( x0 ) Du0 f (
x0 )
S n1 . Si la derivada Df (
para toda u x0 ) no es la constante cero entonces u
0 es u
nico.
Demostraci on. Como mencionamos anteriormente, dado que toda funci on lineal es continua, y que el
conjunto S n1 es cerrado y acotado, por el corolario 2.51 del captulo 2 sabemos que existe u0 S n1 tal
que
x0 ) Du0 f (
Du f ( x0 )
S n1 .
para toda u
Por otra parte, si u S n1 entonces
u S n1 de modo que
x0 ) Du0 f (
Du f ( x0 )
y como
Du0 f (
x0 ) = Df (
x0 )(
u0 )
= Df (x0 )(
u0 )
= Du0 f (
x0 )
Du f (
x0 )
= Df (
x0 )( u)
= Du f (
x0 )
obtenemos la otra desigualdad.

Para probar la unicidad de u 0 , supongamos ahora que Df ( x0 ) no es la constante cero (de modo que
Df ( u0 ) > 0) y que existe otro u0 S n1 , u
x0 )( 0 6= u
0 , tal que Df ( u0 ) = Df (
x0 )( x0 )(
u0 ).

Primero notemos que si u0 = u0 entonces u
0 + u 0 = 0 y por lo tanto
x0 )(0)
0 = Df (
J. P
aez 152
= Df ( u0 + u
x0 )( 0 )
= Df ( u0 ) + Df (
x0 )( x0 )(
u0 )
= 2Df (
x0 )(
u0 )
de donde se tendra que Df (

x0 )(
u0 ) = 0. Por tanto, u 0 6= 0 de modo que si tomamos
0 + u
0 + u
u 0
u = S n1
k
u0 + u0 k
entonces
1
Df (
x0 )(
u) = (Df ( u0 ) + Df (
x0 )( x0 )(
u0 ))
u0 + u
k 0 k
2
= Df (
x0 )(
u0 )
k
u0 + u0 k
Ahora, dado que u0 , u

0 S n1 y u
0 6= u
0 ,
u0 , por el inciso (b) del problema 9 del captulo 1 se tiene
que
u0 + u
k u0 k + k
0 k < k u0 k
=2
de donde
2
1<
u0
k +u0 k
y por lo tanto
2
Df (
x0 )(
u0 ) < Df (
x0 )(
u0 )
u0
k +u0 k
= Df (
x0 )(
u)
lo cual contradice la propiedad de que Df (

x0 )( x0 ) sobre el conjunto S n1 .
u0 ) es el valor maximo de Df (
Como seguramente el lector ya se estar a preguntando, el siguiente problema que abordaremos sera el
de calcular esta direcci on u
0 en la cual la derivada direccional alcanza su maximo valor. Como siempre,
este c alculo depende de que se tenga una expresion explcita de la funci on en cuestion (en algun sistema
coordenado), y de la forma en que se represente a su derivada.
Y justo en la solucion de este problema es que echaremos mano de la otra forma en que podemos
representar a una funci on lineal de Rn en R. Como se recordara, ademas de usar el lenguaje de matrices
para representar a estas funciones lineales, tambien podemos usar un vector y el producto punto en Rn ,
como lo escribimos en la expresion 4.14.
Con base en esta expresion, tenemos entonces que, si nuestra funci on f est
a expresada en terminos de las
coordenadas x1 , . . . , xn (determinadas por la base { e1 , . . . , en }) y el vector (unitario) u
tiene coordenadas
(u1 , . . . , un ), entonces podemos escribir que
Du f (
x0 ) = Df (
x0 )(
u)
= (Df (
x0 )(
e1 ), . . . , Df ( en )) (u1 , . . . , un )
x0 )(
x0 )) (u1 , . . . , un )
x0 ), . . . , Den f (
= (De1 f (

f f
= (x0 ), . . . , x0 ) (u1 , . . . , un )
( (4.20)
x1 xn
Si ahora recordamos que

f f f f
(
x0 ), . . . , x0 ) (u1 , . . . , un ) =
( (
x 0 ), . . . , (
x 0 ) k(u1 , . . . , un )k cos()
x1 xn x1 xn
153 J. P
aez

f f
=
(
x0 ), . . . , (
x0 )
cos()
x1 xn
(identidad 1.7 del captulo 1) en donde es el angulo formado por estos vectores, concluimos que el maximo
valor de Du f (
x0 ) = Df (
x0 )(
u) (suponiendo que Df (x0 ) no es la constante cero) se alcanza cuando cos() = 1,
es decir si = 0, lo que significa que el vector u
0 de la proposicion anterior estar a expresado por

f f
x1 (
x0 ), . . . , x n
(
x0 )
u
0 = (4.21)
f f
x1 (x0 ), . . . , x n
(
x )
0
Dado que siempre que tomemos un sistema de coordenadas x1 , . . . , xn (inducido por una base ortonormal
{
e1 , . . . , en }), el vector con coordenadas

f f
(
x0 ), . . . , (
x0 ) (4.22)
x1 xn
es tal que al hacerlo unitario (cuando no sea el vector 0) representa al vector cuya existencia probamos en
la proposicion 4.19, el vector 4.22 recibe un nombre especial: el gradiente de f en x
0 y lo denotaremos por
f (
x0 ), es decir
f f
f (
x0 ) := (
x0 ), . . . , (
x0 ) (4.23)
x1 xn
Es importante insistir en que, si tomamos otro sistema de coordenadas x1 , . . . , xn (inducido por otra base
e1 , . . . , en }), el vector con coordenadas
ortonormal {

f f
(
x0 ), . . . , (
x0 )
x1 xn
nuevamente es tal que

f f
x1 (
x0 ), . . . , x (
n
x0 )
u
0 =
f

f
x (
x0 ), . . . , x (
n
x0 )
1
en donde u0 es el multicitado vector cuya existencia probamos en la proposicion 4.19 (prueba que por cierto,
hicimos sin recurrir a un sistema coordenado especfico).
En virtud de lo anterior, usaremos la expresion f ( x0 ) como una forma de referirnos a este vector u 0 ,
recordando siempre que en un sistema de coordenadas especfico x1 , . . . , xn , sus coordenadas est an dadas
por 4.23, y que para obtener sus coordenadas en otro sistema x1 , . . . , xn , simplemente habr
a que recurrir a
la identidad 4.18.
Desde un punto de vista mas practico, el vector gradiente de f en x 0 tiene dos usos importantes: uno,
para representar (y expresar) a la derivada de f en x 0 (identidad 4.20), es decir que
Df ( x) = f (
x0 )( x0 ) x

para toda x Rn ; y dos, para designar la direcci

on en la que f tiene la maxima razon de cambio, es decir,
la direcci
on en la que su derivada direccional (en x 0 ) alcanza su maximo valor (identidad 4.21). Con base
en lo anterior, lo siguiente que haremos sera ilustrar con un ejemplo estos dos usos.
Ejemplo 4.20 Sea f : R2 R que est

a dada por la expresi
on
f (x, y) = 8 x2 y 2 + x y
yx
0 = (2, 1).
Tenemos entonces que
f
(x, y) = 2x + 1
x
J. P
aez 154
y
f
(x, y) = 2y 1
y
de modo que

f f
f (2, 1) = (2, 1), (2, 1)
x y
= (3, 3)
Por tanto, la derivada de f en (2, 1) (Df (2, 1)) es la funci

on lineal dada por la expresi
on
Df (2, 1)(x, y) = f (2, 1) (x, y)

= (3, 3) (x, y)
= 3x 3y
de tal forma que la funci

on afn
Df (2, 1)(x 2, y 1) + f (2, 1) = 3(x 2) 3(y 1) + 4
es la que debe satisfacer la condici

on 4.13 de la definci
on 4.14.
En efecto, se tiene que
f (x, y) (Df (2, 1)(x 2, y 1) + f (2, 1))

lim
(x,y)(2,1) k(x, y) (2, 1)k
2 2
8 x y + x y (3(x 2) 3(y 1) + 4)
= lim p
(x,y)(2,1) (x 2)2 + (y 1)2
x2 + 4x y 2 + 2y 5
= lim p
(x,y)(2,1) (x 2)2 + (y 1)2
(x 2)2 (y 1)2
= lim p
(x,y)(2,1) (x 2)2 + (y 1)2
(x 2)2 + (y 1)2
= lim p
(x,y)(2,1) (x 2)2 + (y 1)2
p
= lim (x 2)2 + (y 1)2
(x,y)(2,1)
=0
Por otra parte, se tiene que el vector
f (2, 1)
u0 =
kf (2, 1)k
1
= p (3, 3)
(3) + (3)2
2

1 1
= ,
2 2
es el vector que determina la direccion en la que, parados en el punto (2, 1), obtenemos la m axima raz
on
de cambio de la funcion f .
O en terminos geometricos, si cortamos a la grafica de f por el plano perpendicular al plano
XYque
contiene a la recta que pasa por el punto (2, 1), y cuya direcci a dada por el vector (1/ 2, 1/ 2),
on est
entonces obtenemos la curva que en el punto (2, 1, f (2, 1)) = (2, 1, 4) tiene la recta tangente de m axima
pendiente (ver figura 4.6).
155 J. P
aez
X 0
x
Figura 4.6: En el ejemplo 4.20, el plano perpendicular

al plano XY que pasa por el punto x 0 = (2, 1), y cuya
on esta dada por el vector u = (1/ 2, 1/ 2), contiene a la curva y a su recta tangente, que resulta
direcci
ser la de maxima pendiente que pasa por el punto (2, 1, f (
x0 )) = (2, 1, 4).
4.3.2 Otras propiedades de la derivada

Una vez establecidas estas importantes propiedades del gradiente, continuaremos con el analisis de las condi-
ciones necesarias y suficientes de la derivabilidad de una funci
on. La siguiente propiedad que veremos es una
condicion necesaria, y por lo tanto nos sera muy util para determinar cuando una funci
on no es derivable.
Esta condicion es una generalizacion (al tipo de funciones que estamos tratando) de la propiedad que ya
sabamos para el caso de funciones de R en R, y que simplemente nos asegura que, si una funcion es derivable
en un punto entonces debe ser continua en ese mismo punto.
on 4.21 Sea f : U Rn R. Si f es derivable en x

Proposici 0 U entonces f es continua en x0 .
Demostraci
on. Como f es derivable en x
0 sabemos que
x) (Df (
f ( xx
x0 )( 0 ) + f (
x0 ))
lim =0
x

x0 k
xx 0 k
y como
x) (Df (
f ( x x0 ) + f (
x0 )( x0 ))
x) f (
f ( x0 ) Df ( xx
x0 )( 0 ) = k
xx
0 k
k
xx 0 k
si x 6= x
0 , tenemos entonces que

x) (Df (
f ( x x0 ) + f (
x0 )( x0 ))
x) f (
lim (f ( x0 ) Df ( xx
x0 )( 0 )) = lim k
xx
0 k
x

x0 x

x0 k
xx 0 k
=0
Por otra parte, por el problema 62 del captulo 2 sabemos que toda funci
on lineal es continua, de tal
forma que
lim Df ( xx
x0 )( 0 ) = lim (Df ( x) Df (
x0 )( x0 )(
x0 ))
x

x0 x

x0
=0
J. P
aez 156
y por lo tanto
x) f (
lim (f ( x) f (
x0 )) = lim [(f ( x0 ) Df ( x x0 )) + Df (
x0 )( x x0 )]
x0 )(
x

x0 x

x0
x) f (
= lim (f ( x0 ) Df ( x x0 )) + lim Df (
x0 )( xx
x0 )( 0 )
x

x0 x

x0
=0
lo que prueba que f es continua en x

0 .
Como sucede en el caso real, la condicion anterior no es suficiente. Es decir, no es suficiente que una
funci
on sea continua en un punto x0 para que esta sea derivable en dicho punto.
El ejemplo que vamos a dar es la generalizacion del que se suele dar para ilustrar el mismo hecho en el
caso de funciones de R en R (la funci
on valor absoluto).
Ejemplo 4.22 Sea f : Rn R definida como
x) = k
f ( xk
Como sabemos, f es continua para toda x = 0. Sin embargo, mostraremos

Rn , en particular para x

que f no es derivable en 0. Para ello, primero mostraremos que en el 0 no existe la derivada direccional
Rn tal que k
para cualquier vector u uk = 1.
En efecto, por definici
on sabemos que
u) f (0)
f (0 + h
Du f (0) = lim
h0 h

kh uk 0
= lim
h0 h
|h|
= lim
h0 h
y como el lector recordar

a, este u
ltimo lmite no existe. Por lo tanto, por la proposici
on 4.16 f no es derivable
en el 0.
Y ya que estamos en los contraejemplos y aprovechando la proposicion anterior, mostraremos que el

recproco de la proposicion 4.16 no es cierto; es decir, que la existencia de todas las derivadas direccionales
de una funcion f en un punto x0 de su dominio, no es suficiente para poder asegurar que f sea derivable en
dicho punto.
Ejemplo 4.23 Sea f : R2 R definida como

x2 y
x4 +y 2 si (x, y) 6= (0, 0)
f (x, y) =

0 si (x, y) = (0, 0)
Mostraremos primero que la derivada direccional Du f (0) existe para cualquier vector u
= (u1 , u2 ) Rn
tal que k
uk = 1.
Supongamos primero que u2 6= 0. En este caso se tiene que
f (0 + hu) f (0)
Du f (0) = lim
h0 h

1 (hu1 )2 (hu2 )
= lim
h0 h (hu1 )4 + (hu2 )2

1 h3 u21 u2
= lim
h0 h h2 (h2 u41 + u22 )
157 J. P
aez
u21 u2
= lim
h0 h2 u4
1 + u2
2
2
u
= 1
u2
y si u2 = 0, es decir que u = (1, 0) = e1 , entonces
f (0 + h
u) f (0)
Du f (
0) = lim
h0 h
f (h, 0) f (0, 0)
= lim
h0 h
00
= lim
h0 h
=0
lo cual prueba que Du f ( Rn tal que k

0) existe para cualquier vector u uk = 1.
Por otra parte, si evaluamos a f en puntos de la forma (t, t2 ), con t 6= 0, se tiene que
(t)2 t2
f (t, t2 ) =
(t)4 + (t2 )2
t4
= 4
t + t4
1
=
2
de tal forma que, como (t, t2 ) (0, 0) si t 0, concluimos que f no es continua en el 0 y por la proposici
on
4.21, que f no es derivable en el 0.
Si bien es cierto que la existencia de las derivadas direccionales de una funci on f en un punto x 0 no es
suficiente para garantizar su derivabilidad en dicho punto, un analisis mas de cerca del ejemplo anterior nos
puede arrojar luz sobre cuales hip
otesis adicionales habra que considerar para poder asegurar la derivabilidad
de f en x0 .
Lo primero que haremos sera mostrar que la funci on del ejemplo anterior s es derivable en cualquier
punto x = (x, y) 6=
0. Para ello, como ya sabemos, sera necesario calcular las derivadas parciales f /x y
f /y en x y mostrar que la funci on lineal representada por la matriz
h i
f f
x (x, y) y (x, y)
satisface la condicion establecida en la definicion 4.14.

Con base en varios de los incisos de la proposicion 4.11 y en los calculos realizados en el ejemplo anterior,
tenemos que
2xy(y 2 x4 )
f

(x4 +y 2 )2 si (x, y) 6= (0, 0)
(x, y) = (4.24)
x
0 si (x, y) = (0, 0)
y
x2 (x4 y 2 )
f

(x4 +y 2 )2 si (x, y) 6= (0, 0)
(x, y) = (4.25)
y
0 si (x, y) = (0, 0)
= (x, y) R2 se tiene que
0 = (x0 , y0 ) 6= (0, 0), para cualquier otra x
Si ahora tomamos x
|f (
x) (Df ( xx
x0 )( 0 ) + f (
x0 ))|

f f
= f (x, y) f (x0 , y0 ) (x0 )(x x0 ) x0 )(y y0 )
(
x y
J. P
aez 158

f f
= f (x, y) f (x0 , y) + f (x0 , y) f (x0 , y0 )
x0 )(x x0 )
( x0 )(y y0 )
(
x y
Dado que las derivadas parciales f /x y f /y existen para toda x R2 , por la proposicion 4.13
sabemos que
f f
f (x, y) f (x0 , y) = (x x0 ) (x , y) y f (x0 , y) f (x0 , y0 ) = (y y0 ) (x0 , y )
x y
y por tanto
|f (
x) (Df ( xx
x0 )( 0 ) + f ( x0 ))|

f f
= f (x, y) f (x0 , y) + f (x0 , y) f (x0 , y0 ) x0 )(x x0 )
( x0 )(y y0 )
(
x y

f f f f
= (x x0 ) (x , y) + (y y0 ) (x0 , y ) x0 )(x x0 )
( x0 )(y y0 )
(
x y x y

f f f f
= (x , y) x0 ) (x x0 ) +
( (x0 , y ) ( x0 ) (y y0 )
x x y y

f f f f
(x , y) x0 ) |x x0 | + (x0 , y )
( (x0 ) |y y0 |
x x y y

f f f f
(x , y) x0 ) k
( x x0 k + (x0 , y ) x0 ) k
( xx 0 k
x x y y

f f f f
= (x , y) x0 ) + (x0 , y )
( (x0 ) k xx 0 k
x x y y
|f (
x) (Df ( xx
x0 )( 0 ) + f (
x0 ))|
0
k
xx 0 k

f f f f
(x , y)
x0 ) + (x0 , y )
( (
x0 )
x x y y
Si ahora notamos que, de acuerdo con las expresiones 4.24 y 4.24 de las derivadas parciales de f , estas
son continuas en cualquier punto x0 6= 0, y que los puntos (x , y) y (x0 , y ) tienden al punto (x0 , y0 ) = x
0 si
el punto x
= (x, y) tiende al punto (x0 , y0 ) = x0 , tenemos que
|f (
x) (Df ( x x0 ) + f (
x0 )( x0 ))|
0 lim
x

x0 k
xx 0 k

f f f f
lim (x , y) (x0 ) + (x0 , y ) (
x0 )
x
x0 x x y y
=0+0
=0

|f (
x) (Df ( xx
x0 )( 0 ) + f (
x0 ))|
lim =0
x

x0 k
xx 0 k
o equivalentemente que
x) (Df (
f ( xx
x0 )( 0 ) + f (
x0 ))
lim =0
x

x0 k
xx 0 k
es decir, que f es derivable en x0 .
Ojala y el lector este de acuerdo en que el arduo trabajo que nos tomamos para probar que la funci on
del ejemplo 4.23 es derivable para cualquier x 0 R2 distinto del 0, sera redituable.
En efecto, n otese que mas alla de la forma explcita de f , lo importante en la argumentacion anterior
fueron dos cosas:
159 J. P
aez
1. que las derivadas parciales de f existieron para todos los puntos de R2 , y
2. que fueron continuas en x0 .
Con respecto al punto 1, y como el lector estar

a de acuerdo (dado el caracter local de la derivada), en
el desarrollo anterior hubiera bastado con que las derivadas parciales existieran en una vecindad del punto
x
0 .
Pues bien, lo que probaremos a continuacion es que estas dos condiciones (con la modificacion propuesta
a la primera), son suficientes para poder asegurar que una funci on es derivable en un punto x0 , lo que
dejaremos formulado en la siguiente
f
Proposici on 4.24 Sean f : U Rn R, x 0 U y r > 0 tal que Br ( x0 ) U . Si x i
(
x) existe para cada
f
Br (
x x0 ) y xi es continua en x
0 (para cada i {1, . . . , n}) entonces f es derivable en x
0 .

(0) (0)
Demostraci Br (
on. Sea x x0 ), x 6= x
0 . Si x
0 = x1 , . . . , xn y x = (x1 , . . . , xn ), hacemos

(0)
i = x1 , . . . , xi , xi+1 , . . . , x(0)
x n
para cada i {1, . . . , n 1} y x n = x . Por el inciso (a) del problema 11 del captulo 1 sabemos que
i Br (
x x0 ) para cada i {1, . . . , n 1} y como Br ( x0 ) es un conjunto convexo entonces los segmentos
[ i ] Br (
xi1 , x x0 ) para cada i {1, . . . , n}.
Por otra parte, n otese que
x) f (
f ( x) f (
x0 ) = (f ( xn1 ) f (
xn1 )) + (f ( xn2 )) + + (f (
x2 ) f ( x1 ) f (
x1 )) + (f ( x0 ))
Xn
= xi ) f (
(f ( xi1 ))
i=1
Ahora, dado que

(0)
i x
x i1 = xi xi ei
por la proposicion 4.13 sabemos que existe i [

xi1 , x
i ] tal que
f
(0)
xi ) f (
f ( xi1 ) = xi xi i
xi
para cada i {1, . . . , n}, de modo que

n
X
x) f (
f ( x0 ) = xi ) f (
(f ( xi1 ))
i=1
Xn f
(0)
= xi xi i
i=1
xi

f f f
= 1 , 2 , . . . , n (
xx
0 )
x1 x2 x2
Por lo tanto
|f (
x) (Df ( xx
x0 )( 0 ) + f ( x0 ))|
= |f (x) f (
x0 ) Df ( xx
x0 )( 0 )|

f f f
= 1 , 2 , . . . , n (
xx0 ) f (x0 ) (
xx 0 )
x1 x2 x2
f
f f
= 1 , 2 , . . . , n f (
x0 ) (
xx 0 )
x1 x2 x2
J. P
aez 160

f f f

1 , 2 , . . . , n f ( k(
x0 ) xx
0 )k
x1 x2 x2
de modo que
|f (
x) (Df ( xx
x0 )( 0 ) + f ( x0 ))|
0
k
xx 0 k

f f f
1 , 2 , . . . , n f (
x 0 )
x1 x2 x2
Si ahora recordamos que por el inciso (b) del problema 11 del captulo 1 se tiene que

i x0 k
xx0 k
entonces i x0 si x
x0 de modo que, como f
xi 0 (para cada i {1, . . . , n}), tenemos
es continua en x
que
|f (
x) (Df ( xx
x0 )( 0 ) + f ( x0 ))|
0 lim
x

x0 k
xx 0 k

f f f
lim 1 , 2 , . . . , n f (
x 0 )
x
x0 x1 x2 x2
= kf (
x0 ) f (
x0 )k
=0
es decir
|f (
x) (Df ( xx
x0 )( 0 ) + f (
x0 ))|
lim =0
x

x0 k
xx 0 k
lo cual prueba que f es derivable en x0 .
Es importante hacer notar que la condicion de la proposicion anterior solo es una condicion suficiente de
la derivabilidad de f en x
0 ; es decir, si bien es cierto que la existencia de la derivada de f en x0 garantiza la
existencia de todas sus derivadas direccionales en este punto (incluyendo sus derivadas parciales), este hecho
ni siquiera garantiza que existan todas las derivadas parciales de f en todos los puntos de alguna vecindad
de x0 .
Esta u
ltima afirmacion la ilustramos en el siguiente
f (x, y) = |xy|
N
otese que
f f (h, 0) f (0, 0)
(0, 0) = lim
x h0 h
|h0| |00|
= lim
h0 h
=0
y que
f f (0, h) f (0, 0)
(0, 0) = lim
y h0 h
|0h| |00|
= lim
h0 h
161 J. P
aez
=0
Por lo tanto, tomando a Df (0, 0) como la constante 0, tenemos que
f (x, y) (Df (0, 0)((x, y) (0, 0)) + f (0, 0))

0 lim
(x,y)(0,0) k(x, y) (0, 0)k
|xy|
= lim
(x,y)(0,0) k(x, y)k
2
k(x, y)k
lim
(x,y)(0,0) k(x, y)k
= lim k(x, y)k

(x,y)(0,0)
=0
de modo que
f (x, y) (Df (0, 0)((x, y) (0, 0)) + f (0, 0))
lim =0
(x,y)(0,0) k(x, y) (0, 0)k
lo que prueba que f es derivable en el (0, 0).
otese que tomando cualquier punto de la forma (x0 , 0), con x0 6= 0, de acuerdo con la
Por otra parte, n
definici
on de derivada parcial, se tiene que
f f (x0 , h) f (x0 , 0)
(x0 , 0) = lim
y h0 h
|x0 h| 0
= lim
h0 h
|h|
= |x0 | lim
h0 h
ltimo lmite no existe, entonces f

y como este u y (x0 , 0) no existe.
alogamente, para cualquier punto de la forma (0, y0 ), con y0 6= 0, se tiene que
An
f f (h, y0 ) f (0, y0 )
(0, y0 ) = lim
x h0 h
|hy0 | 0
= lim
h0 h
|h|
= |y0 | lim
h0 h
de modo que fx (0, y0 ) tampoco existe.

f f
Por tanto, en cualquier vecindad del (0, 0) se tiene que existen puntos para los cuales x y y no existen,
que es lo que deseabamos mostrar (ver figura 4.7).
Aun y cuando el ejemplo anterior muestra sin lugar a dudas que la proposicion 4.24 solo nos proporciona
una condicion suficiente de la derivabilidad de una funci
on en un punto, nos tomaremos el trabajo de dar
otro ejemplo en el que, a diferencia del ejemplo anterior, las derivadas parciales s existen en una vecindad
del punto en cuestion, y lo u
nico que no sucede es que sean continuas en el punto en el que la funci on s es
derivable.

(x2 + y 2 ) sen 21 2

si (x, y) 6= (0, 0)
x +y
f (x, y) =

0 si (x, y) = (0, 0)
J. P
aez 162
X Y
Figura 4.7: Grafica de la funcion f (x, y) = |xy| (del ejemplo 4.25) cuyas derivadas parciales no existen en los
puntos de la forma (x, 0), con x 6= 0 y (0, y), con y 6= 0.
En este caso tenemos que

f f (h, 0) f (0, 0)
(0, 0) = lim
x h0 h

1
= lim h sen
h0 |h|
=0
y
f f (0, h) f (0, 0)
(0, 0) = lim
y h0 h

1
= lim h sen
h0 |h|
=0
y si (x, y) 6= (0, 0), con base en la proposici

on 4.11, obtenemos que

2x sen 21 2 2x 2 cos 21 2

si (x, y) 6= (0, 0)
f x +y x +y x +y
(x, y) =
x

0 si (x, y) = (0, 0)
y
1 y 1

2y sen cos si (x, y) 6= (0, 0)
f x2 +y 2 x2 +y 2 x2 +y 2
(x, y) =
y

0 si (x, y) = (0, 0)
Si ahora tomamos puntos de la forma (t, 0), con t > 0, se tiene que

f 1 1
(t, 0) = 2t sen cos
x t t
y como
1 1
lim 2t sen cos
t0 t t
163 J. P
aez
no existe, concluimos que

f
lim (x, y)
(x,y)(0,0) x
no existe, de modo que f x no es continua en el (0, 0). An alogamente, evaluando en puntos de la forma (0, t),
f
con t > 0, concluimos que y no es continua en el (0, 0).

2 2 1
(x + y ) sen
f (x, y) (Df (0, 0)((x, y) (0, 0)) + f (0, 0)) x2 +y 2
lim = lim
(x,y)(0,0) k(x, y) (0, 0)k (x,y)(0,0) k(x, y)k
!
1
= lim k(x, y)k sen p
(x,y)(0,0) x2 + y 2
=0
lo que demuestra que f s es derivable en el (0, 0).
Con el ejemplo anterior concluimos el analisis de las condiciones necesarias y suficientes relacionadas con
la derivabilidad de una funci on. Lo siguiente que haremos sera mostrar la relacion entre este concepto y la
aritmetica de las funciones, la cual dejaremos plasmada en la siguiente
on 4.27 Sean f, g : U Rn R y x
Proposici 0 U . Si f y g son derivables en x0 entonces:
1. f + g es derivable en x0 y adem
as
D(f + g)(
x0 ) = Df (
x0 ) + Dg(
x0 )
2. si R, f es derivable en x
0 y adem
as
D(f )(
x0 ) = Df (
x0 )
3. f g es derivable en x
0 y adem
as
D(f g)(
x0 ) = f (
x0 )Dg(
x0 ) + g(
x0 )Df (
x0 )
x0 ) 6= 0, f /g es derivable en x
4. si g( 0 y adem
as
1
D(f /g)(
x0 ) = (g( x0 ) f (
x0 )Df ( x0 )Dg(
x0 ))
g 2 (
x0 )
Demostraci on. A manera de ejemplo, probaremos el inciso 3 y el resto quedaran como problemas para el
lector. Una vez dicho lo anterior, n
otese que
x) (f g)(
(f g)( x0 ) [f (
x0 )Dg(
x0 ) + g(
x0 )Df ( xx
x0 )] ( 0 )
= f ( x) g(
x) [g( x0 )] + g( x) f (
x0 ) [f ( x0 )] [f (
x0 )Dg( x0 ) + g(x0 )Df ( xx
x0 )] ( 0 )
= f ( x) g(
x) [g( x0 ) Dg( xx
x0 ) ( x) f (
0 )] + [f ( x0 )] Dg( xx
x0 ) ( 0 )
+ g( x) f (
x0 ) [f ( x0 ) Df ( xx
x0 ) ( 0 )]
de tal forma que
x) (f g)(
(f g)( x0 ) (f (
x0 )Dg( x0 ) + g(
x0 )Df ( xx
x0 )) ( 0 )
kx x0 k
x) g(
g( x0 ) Dg( x x0 )
x0 ) ( Dg( x x0 )
x0 ) (
= f (x) x) f (
+ [f ( x0 )]
k
xx 0 k kxx 0 k
J. P
aez 164
x) f (
f ( x0 ) Df ( x x0 )
x0 ) (
+ g(
x0 )
kxx 0 k
Para el primer y tercer sumando que aparecen en el lado derecho de esta u ltima identidad, dado que f
y g son derivables en x0 (y por lo tanto continuas en ese mismo punto), podemos concluir que

x) g(
g( x0 ) Dg( xx
x0 ) ( 0 ) x) g(
g( x0 ) Dg( xx
x0 ) ( 0 )
lim f (
x) = lim f ( x) lim
x
x0 kxx 0 k x
x0 x
x0 k
xx 0 k
= f (
x0 )0
=0
y
x) f (
f ( x0 ) Df ( xx
x0 ) ( 0 ) x) f (
f ( x0 ) Df ( xx
x0 ) ( 0 )
lim g(
x0 ) = g(
x0 ) lim
x

x0 kx x0 k x
x0 kxx 0 k
= g(
x0 )0
=0
Por otra parte, por el inciso (c) del problema 11 del captulo 2, sabemos que existe M 0 tal que
|Df ( xx
x0 ) ( 0 )| M k
xx
0 k
Rn , y como f es continua en x
para toda x 0 , concluimos que

Dg( x x0 )
x0 ) (
0 lim [f (
x) f (
x0 )]
x
x0 kxx 0 k
M lim |f (
x) f (
x0 )|
x

x0
= M0
=0
y por lo tanto que

Dg( xx
x0 ) ( 0 )
x) f (
lim [f ( x0 )] =0
x

x0 kxx 0 k
Sumando estos lmites, concluimos que
x) (f g)(
(f g)( x0 ) (f (
x0 )Dg(
x0 ) + g(
x0 )Df ( x x0 )
x0 )) (
lim =0
x

x0 k
xx 0 k
de modo que la funci
on f g es derivable en x
0 y ademas que
D(f g)(
x0 ) = f (
x0 )Dg(
x0 ) + g(
x0 )Df (
x0 )
Para concluir con las propiedades de la derivada relacionadas con las operaciones entre funciones, formu-
laremos (en dos proposiciones separadas) aquellas que nos hablan de la composicion de funciones.
Ser
an dos proposiciones diferentes puesto que existen dos formas de componer a una funci on de Rn en R
con funciones para las cuales tambien tenemos una definicion de derivada: por la izquierda, con una funci
on
de R en R, o por la derecha, con una funci on de R en Rn .
Ambas proposiciones seran un caso particular de un resultado mas general que veremos mas adelante (y
que se le conoce con el nombre de regla de la cadena).
Proposici on 4.28 Sean f : U Rn R, x 0 U , (a, b) R tal que f (U ) (a, b) y g : (a, b) R R. Si

f es derivable en x x0 ) entonces g f es derivable en x0 y adem
0 y g es derivable en f ( as
x0 ) = g (f (
D(g f )( x0 ))Df (
x0 )
165 J. P
aez
Demostraci
on. Recordemos que, de acuerdo con la definicion 4.14, lo que tenemos que demostrar es que
(g f )( x0 ) g (f (
x) (g f )( x0 ))Df ( xx
x0 )( 0 )
lim =0
x

x0 kxx 0 k
raz
on por la cual empezaremos por buscar una expresion adecuadamente equivalente al numerador del
cociente anterior.
Para ello, definamos
x) f (
kx = f ( x0 )
y observemos que, como f es derivable en x
0 entonces f es continua en x
0 (proposicion 4.21), se tiene que
x) f (
lim kx = lim (f ( x0 ))
x

x0 x

x0
=0
En el caso en que kx 6= 0, tenemos que
(g f )(
x) (g f )( x)) g(f (
x0 ) = g(f ( x0 ))
x0 ) + kx ) g(f (
g(f ( x0 ))
= kx
kx
x0 ) + kx ) g(f (
g(f ( x0 ))
= x) f (
(f ( x0 ))
kx
x0 ) + kx ) g(f (
g(f ( x0 ))
= x) f (
(f ( x0 ) Df ( xx
x0 )( 0 ) + Df ( x x0 ))
x0 )(
kx
x0 ) + kx ) g(f (
g(f ( x0 ))
= x) f (
(f ( x0 ) Df ( xx
x0 )( 0 ))
kx
x0 ) + kx ) g(f (
g(f ( x0 ))
+ Df ( xx
x0 )( 0 )
kx
de tal manera que
(g f )( x0 ) g (f (
x) (g f )( x0 ))Df ( xx
x0 )( 0 )
x0 ) + kx ) g(f (
g(f ( x0 ))
= x) f (
(f ( x0 ) Df ( xx
x0 )( 0 ))
kx

x0 ) + kx ) g(f (
g(f ( x0 ))
+ g (f (
x0 )) Df (
x0 )(xx0 )
kx
y por lo tanto
(g f )(
x) (g f )( x0 ) g (f (
x0 ))Df ( xx
x0 )( 0 )
(4.26)
kxx 0 k

g(f (x0 ) + kx ) g(f (x0 )) f ( x) f (
x0 ) Df ( xx
x0 )( 0 )
=
kx kxx 0 k

g(f (x0 ) + kx ) g(f (
x0 )) x
x 0
+ g (f (
x0 )) Df ( x0 )
kx k
xx
0 k
Como seguramente el lector ya habr a notado, cada uno de los sumandos del lado derecho de esta u ltima
identidad tienden a 0 cuando x x 0 .
En efecto, los factores del primer sumando tienen lmite; el primero tiende a g (f (
x0 )) (puesto que g es
derivable en f (
x0 )) y el segundo tiende a 0 (puesto que f es derivable en x0 ).
En cuanto al segundo sumando, su primer factor tiende a 0 (nuevamente porque g es derivable en f ( x0 ))
mientras que para el segundo factor, por el inciso (c) del problema 11 del captulo 2, sabemos que existe
M 0 tal que
|Df ( xx
x0 ) ( 0 )| M k
xx 0 k
J. P
aez 166
de tal modo que

x
x 0
Df (
x 0 ) M
k
xx
0 k
y por lo tanto todo el sumando tiende a 0 cuando x x 0 .
Toda la argumentacion anterior es correcta bajo el supuesto de que kx = f ( x) f (
x0 ) 6= 0; lo que ahora
mostraremos es que para considerar el caso en que kx = 0, sera necesario introducir una funci on auxiliar1
n
: U R R definida de la siguiente forma
g(f (x))g(f (x0 ))
f (
x)f (x0 ) x) f (
si f ( x0 ) 6= 0
(
x) =

g (f (
x0 )) x) f (
si f ( x0 ) = 0
Lo primero que haremos notar es que la igualdad 4.26 se escribe en terminos de la funci on como

(g f )( x0 ) g (f (
x) (g f )( x0 ))Df ( xx
x0 )( 0 ) x) f (
f ( x0 ) Df ( xx
x0 )( 0 )
= (
x)
kxx 0 k kx x0 k

x
x 0
x) g (f (
+ (( x0 ))) Df (
x0 )
kxx 0 k
y que ahora esta identidad se cumple para toda x U, x
6= x
0 .
Si ahora recordamos que f es continua en x0 , y dado que g es derivable en f (
x0 ), aplicando el resultado
del problema 48 del captulo 2, sabemos que es continua en x0 y por tanto
(g f )(
x) (g f )( x0 ) g (f (
x0 ))Df ( xx
x0 )( 0 )
lim
x

x0 k
xx 0 k

f (x) f (x0 ) Df ( x0 )(x x0 ) xx 0
= lim ( x) + (( x) g (f (
x0 ))) Df (x0 )
x
x0 k
xx 0 k k
xx 0 k

x) f (
f ( x0 ) Df ( x x0 )
x0 )( x
x0
= lim ( x) + lim (( x) g (f (x0 ))) Df (x0 )
x
x0 kxx 0 k x
x0 k
x x0 k

x
x
0
= (x0 )0 + lim (( x) g (f (
x0 ))) Df ( x0 )
x
x0 kxx 0 k

x0
x
= lim (( x) g (f (
x0 ))) Df (x0 )
x
x0 kx x0 k
=0
en donde la u
ltima identidad se satisface dado que
x) g (f (
lim (( x) g (f (
x0 ))) = lim ( x0 ))
x

x0 x

x0
= (x0 ) g (f (x0 ))

x0 )) g (f (
= g (f ( x0 ))
=0
arrafos arriba, existe M 0 tal que

y que, como mencionamos p

x
x 0
Df (x0 ) M
k
xx
0 k
Rn , x
para toda x 6= x
0 .
Como afirmamos anteriormente, a una funci on f de Rn en R tambien la podemos componer (por la

on de R en Rn , y para esta composicion tambien podemos establecer una regla
derecha) con una funci
1 Esto es lo que siempre se hace en todas las pruebas de las diferentes variantes de la regla de la cadena, como seguramente
el lector ya habra notado a estas alturas.
167 J. P
aez
de la cadena, es decir, una regla que establece que bajo la hipotesis de que ambas funciones son derivables
(en los puntos adecuados), entonces dicha composicion tambien es derivable, y ademas nos da una forma de
c
omo calcular esta derivada.
En la formulaci
on (y prueba) de este resultado representaremos a la derivada de f a traves de su vector
gradiente.
Proposici on 4.29 Sean f : U Rn R, x 0 U , : (a, b) R Rn tal que (a, b) U , y t0 (a, b) tal

que (t0 ) = x 0 y es derivable en t0 entonces f es derivable en t0 y adem
0 . Si f es derivable en x as
(f ) (t0 ) = f (
x0 ) (t0 )
Demostraci on. Dado que la composicion f es una funcion de R en R, de acuerdo con la defincion de
la derivada de este tipo de funciones, debemos de mostrar que
(f )(t) (f )(t0 )
lim
tt0 t t0
existe.
De esta forma, lo primero que haremos sera escribir de manera mas adecuada a este cociente.
otese que, si (t) (t0 ) 6=
N 0, entonces
(f )(t) (f )(t0 )
t t0

k(t) (t0 )k f ((t)) f ((t0 )) f ((t0 )) ((t) (t0 )) + f ((t0 )) ((t) (t0 ))
=
t t0 k(t) (t0 )k

k(t) (t0 )k f ((t)) f ((t0 )) f ((t0 )) ((t) (t0 )) (t) (t0 )
= + f ((t0 ))
t t0 k(t) (t0 )k t t0
De esta u
ltima identidad es facil concluir que, como: (t) (t0 ) si t t0 (puesto que es continua en
t0 ya que es derivable en t0 ), que f es derivable en x0 = (t0 ), y que la expresion
k(t) (t0 )k
t t0
est
a acotada en una vecindad de t0 pues

k(t) (t0 )k (t) (t0 )
lim
= tt
lim
tt0 t t0 0 t t0
= k (t0 )k
(nuevamente porque es derivable en t0 ), de modo que

k(t) (t0 )k f ((t)) f ((t0 )) f ((t0 )) ((t) (t0 ))
lim =0
tt0 t t0 k(t) (t0 )k
Ahora, por el inciso 3 de la proposicion 2.33, se tiene que

(t) (t0 ) (t) (t0 )
lim f ((t0 )) = lim f ((t0 )) lim
tt0 t t0 tt0 tt0 t t0
= f ((t0 )) (t0 )
con lo cual obtendramos el resultado deseado.

Sin embargo (y como el lector ya habr a notado), el argumento anterior solo es correcto si (t) (t0 ) 6= 0.
Para que el razonamiento anterior sea valido incluso en el caso en el que (t) (t0 ) = 0, nuevamente
recurriremos a una funci
on auxiliar que resuelve el problema.
J. P
aez 168
Sea : (a, b) R R definida como

f ((t))f ((t0 ))f ((t0 ))((t)(t0 ))

k(t)(t0 )k si (t) (t0 ) 6= 0
(t) =

0 si (t) (t0 ) = 0
Es facil verificar que

(f )(t) (f )(t0 ) k(t) (t0 )k (t) (t0 )
= (t) + f ((t0 ))
t t0 t t0 t t0
para toda t (a, b), t 6= t0 , y por otra parte, como el lector probar a en el problema 12, es continua en t0
de tal forma que
k(t) (t0 )k
lim (t) =0
tt0 t t0
de modo que

(f )(t) (f )(t0 ) k(t) (t0 )k (t) (t0 )
lim = lim (t) + f ((t0 ))
tt0 t t0 tt0 t t0 t t0
= f ((t0 )) (t0 )
que es lo que deseabamos demostrar.
Esta ultima proposicion, ademas de proporcionarnos una regla de derivaci on, tiene dos consecuencias de
caracter practico muy importantes.
La primera de ellas se relaciona con los conjuntos de nivel de una funci on f de Rn en R y el problema de
determinar un vector que este en la direcci on normal a dicho conjunto (en un punto especfico de este).
Concretamente, mostraremos que si x 0 pertenece al conjunto de nivel Nc (f ) := {x U Rn | f (
x) = c},
entonces f (x0 ) es normal a Nc (f ) en x
0 , afirmaci
on que dejaremos formulada en el siguiente corolario y
cuya demostracion se deja al lector.
Corolario 4.30 Sea f : U Rn R derivable en x 0 U tal que f ( Si x

x0 ) 6= 0. 0 Nc (f ) (el conjunto
de nivel c de f ) entonces f ( 0 . Es decir que para cualquier : (a, b) R Rn
x0 ) es normal a Nc (f ) en x
tal que: (t) Nc (f ) para toda t (a, b), es derivable en t0 (a, b), y (t0 ) = x
0 , se tiene que
f ((t0 )) (t0 ) = 0
Como se ilustro en el captulo 2, una buena cantidad de objetos geometricos muy conocidos (sobre todo
en R2 y en R3 ) se pueden ver como conjuntos de nivel de una funcion de Rn en R. Lo interesante del corolario
anterior, es que nos proporciona los elementos suficientes para definir (de forma muy sencilla) el concepto de
recta tangente y plano tangente para el caso particular de conjuntos de nivel en R2 y en R3 , respectivamente.
Definicion 4.31 Sea f : U R2 R derivable en x x0 ) 6= 0. Decimos que la

0 = (x0 , y0 ) U tal que f (
recta (en R2 ) determinada por la ecuaci
on cartesiana
f f
x0 ) (x x0 ) +
( x0 ) (y y0 ) = 0
(
x y
es la recta tangente en x
0 del conjunto (o curva) de nivel Nf (x0 ) .
Definicion 4.32 Sea f : U R3 R derivable en x x0 ) 6= 0. Decimos que

0 = (x0 , y0 , z0 ) U tal que f (
3
el plano (en R ) determinado por la ecuaci
on cartesiana
f f f
x0 ) (x x0 ) +
( x0 ) (y y0 ) +
( x0 ) (z z0 ) = 0
(
x y z
es el plano tangente en x
0 del conjunto de nivel Nf (x0 ) .
169 J. P
aez
A continuacion, daremos un par de ejemplos en los que se muestra como se obtienen esta recta y este
plano tangente.
Ejemplo 4.33 Consideremos:
1. la curva determinada por la ecuaci

on
(x2 + y 2 2x)2 = 4(x2 + y 2 )
la cual corresponde a la ya conocida cardiode.

Lo que ahora queremos hacer notar es que la cardiode es el conjunto de nivel 0 de la funci
on
f (x, y) = (x2 + y 2 2x)2 4(x2 + y 2 )
que resultar
a muy conveniente si se quiere calcular sus rectas tangentes.
Para esta funci
on se tiene que
f
(x, y) = 2(x2 + y 2 2x) (2x 2) 8x
x
y
f
(x, y) = 2(x2 + y 2 2x) (2y) 8y
y
de tal forma que

f (x, y) = 4 (x2 + y 2 2x) (x 1) 2x, y(x2 + y 2 2x 2)

2 2
= 4 (x 1) + y 2 1 (x 1) 2 (x 1) 2, y (x 1) + y 2 3

2 2
= 4 (x 1) (x 1) + y 2 3 2, y (x 1) + y 2 3
de modo que, si f (x0 , y0 ) 6= (0, 0), este vector es normal a la curva (en el punto (x0 , y0 )) y se tiene
que la recta dada por la ecuaci on
f (x0 , y0 ) (x x0 , y y0 ) = 0
o equivalentemente
f f
(x0 , y0 )(x x0 ) + (x0 , y0 )(y y0 ) = 0
x y
es la ecuaci
on de la recta tangente a la curva (en el punto (x0 , y0 )).
Si en particular tomamos los puntos en que la cardiode intersecta al eje Y , es decir los puntos (0, 2) y
(0, 2), se tiene que
f (0, 2) = (16, 16) y f (0, 2) = (16, 16)
de modo que la ecuaci

on de las respectivas rectas tangentes est
an dadas por
16x + 16(y 2) = 0 o y =x+2
y
16x 16(y + 2) = 0 o y = x 2
lo que ya habamos obtenido en el captulo 3.
J. P
aez 170
2. Sea S R3 el conjunto definido como

2

3 x y2 z2
S = (x, y, z) R | 2 + 2 + 2 = 1
a b c
el cual corresponde a un elipsoide con centro en el (0, 0, 0) (ver figura 4.8).

Como en el caso de la cardiode, este conjunto tampoco se puede obtener (completo) como la gr
afica de
on de R2 en R.
una funci
Aun y cuando algunas partes de este conjunto s se pueden ver como una de estas gr aficas, en
terminos de los c
alculos que hay que realizar (usando la ecuaci on 4.16), resulta mucho m as f
acil
observar que se puede obtener como el conjunto de nivel 1 de la funci
on
x2 y2 z2
f (x, y, z) = 2
+ 2 + 2
a b c
y como x y z
f (x, y, z) = 2 , ,
a2 b 2 c2
si (x0 , y0 , z0 ) es cualquier punto del elipsoide, entonces f (x0 , y0 , z0 ) 6= (0, 0, 0) y por lo tanto la
ecuacion del plano tangente en este punto estar a dada por
x y z
0 0 0
f (x0 , y0 , z0 ) (x x0 , y y0 , z z0 ) = 0 = , , (x x0 , y y0 , z z0 )
a2 b 2 c2
la cual, al simplificarla, se reduce a la ecuaci
on
x y z
0 0 0
x + y + z=1
a2 b2 c2
x2 y2 z2
Figura 4.8: El elipsoide determinado por la ecuacion 8 + 3 + 5 = 1, analogo al del ejemplo 4.33.
Como el lector habra notado, en el ejemplo anterior se hace enfasis en que los conjuntos involucrados no
se pueden obtener como la gr on de R en R, para el primer inciso, o de una funci
afica de una funci on de R2
en R, para el segundo.
La raz
on de ello es que el concepto de recta tangente y plano tangente ya se tenan definidos para este
tipo de objetos, pero dada la incapacidad de verlos de esta forma, se quiso resaltar la conveniencia de
poderlos obtener como un conjunto de nivel de una cierta funci on, para as poder aplicar las definiciones
4.31 y 4.32.
171 J. P
aez
Pero si bien es cierto que no todo conjunto de nivel en R2 se puede ver como la grafica de una funci on de
R en R, ni todo conjunto de nivel en R3 se puede ver como la grafica de una funci on de R2 en R, lo recproco
s se cumple (problema 10 del captulo 2).
Pues bien, en los problemas 5 y 6 de este captulo, pedimos al lector que pruebe que los conceptos de
recta y plano tangente dados en las definiciones 4.31 y 4.32, coinciden con los conceptos correspondientes
para los de grafica de una funci on.
Mas adelante, en el captulo 5, probaremos un importante resultado (el Teorema de la Funci on Implcita)
del cual podremos deducir, bajo ciertas hip otesis, que un conjunto de nivel en R2 (o en R3 ) s se puede
obtener, cuando menos en partes, como la grafica de una funci on de R en R (de R2 en R). Apoyados en
este teorema, se podra probar entonces que la recta y plano tangente definidos en 4.31 y 4.32 tambien se
pueden obtener como la recta (o plano) tangente a la grafica de una cierta funci on de R en R (o de R2 en
R), respectivamente.
Otra interpretacion del resultado de la proposicion 4.29 que tendra un uso muy importante, es el siguiente:
si f : U Rn R, x 0 U , : (a, b) R Rn , con (a, b) U , y t0 (a, b), son tales que (t0 ) = x0 ,
es un hecho que la composicion (f )(t) = f ((t)) refleja el comportamiento de f sobre los puntos de la
curva recorrida por la funci on .
Con base en lo anterior, es f acil convencerse de que la derivada de esta composicion en t0 se puede
interpretar como la raz on de cambio de f en x 0 cuando nos aproximamos a este punto por la curva descrita
por .
Aqu es importante destacar que resulta natural que esta raz on de cambio se vea afectada por la
velocidad con la que se aproxima al punto x 0 , lo que queda evidenciado en la formula
(f ) (t0 ) = f ((t0 )) (t0 ) (4.27)
De esta manera, si lo que deseamos es interpretar a (f ) (t0 ) como la raz on de cambio de f en x0

(cuando nos acercamos a este punto por la curva descrita por la funci on ), es importante que sea tal que
(t0 ) 6= 0.
De hecho, si suponemos que es una parametrizaci on por longitud de arco, es decir que k (t)k = 1 para
cada t (a, b), para que no haya problema con la velocidad (o para ser mas exactos, con la rapidez) con la
que nos aproximamos a x 0 , la derivada de f en t0 no es mas que la derivada direccional de f en x0 , en
la direcci on del vector (t0 ) (que ahora sera de norma 1).
En efecto, si ahora usamos la notaci on Df ( x0 ) para referirnos a la derivada de f en x 0 , usando la
proposicion 4.16, se tiene que
(f ) (t0 ) = f ((t0 )) (t0 )

= Df ( x0 )( (t0 ))
= D (t0 ) f (
x0 )
y mas aun, si solo se tiene que (t0 ) 6=

0 (aunque este vector no sea de norma 1), la identidad 4.27 se puede
escribir como
(f ) (t0 ) = f ((t0 )) (t0 )

(t0 )
= k (t0 )k f ((t0 ))
k (t0 )k

(t0 )
= k (t0 )k Df (x0 )
k (t0 )k
= k (t0 )k D (t0 ) f (
x0 ) (4.28)
k (t0 )k
Que la razon de cambio de una funci on f sobre la curva descrita por una funci on en un punto x 0 sea
on de (t0 ) (normalizado) multiplicada por la rapidez
igual a la derivada direccional de f en x0 , en la direcci
con que se aproxima a x 0 , no hace mas que confirmar que el concepto de derivada es un concepto local
(simplemente recuerde el lector que, cerca del punto x 0 = (t0 ), y su recta tangente se parecen mucho).
Ilustremos la discusi
on anterior con el siguiente
J. P
aez 172
Ejemplo 4.34 Sean f : R2 \ {(0, 0)} R definida como

xy
f (x, y) =
x2 + y 2
y : R R2 definida como (t) = (r cos(t), r sen(t)).

N otese que
(f )(t) = f ((t))
(r cos(t)) (r sen(t))
=
(r cos(t))2 + (r sen(t))2
cos(t) sen(t)
=
cos2 (t) + sen2 (t)
= cos(t) sen(t)
de modo que
(f ) (t) = cos(t) sen (t) + cos (t) sen(t)

= cos2 (t) sen2 (t)

f f
f (x, y) = (x, y), (x, y)
x y
!
y x + y 2x (xy) x x2 + y 2 2y (xy)
2 2
= 2 , 2
(x2 + y 2 ) (x2 + y 2 )
!
y y 2 x2 x x2 y 2
= 2 , 2
(x2 + y 2 ) (x2 + y 2 )
y
(t) = (r sen(t), r cos(t))
de tal forma que, de acuerdo con la identidad 4.27 se debe tener que
(f ) (t)
= f ((t)) (t)

2 2 2 2
(r sen(t)) (r sen(t)) (r cos(t)) (r cos(t)) (r cos(t)) (r sen(t))
= 2 , 2 (t)
2 2
(r cos(t)) + (r sen(t))2 (r cos(t)) + (r sen(t))2
1
= sen(t) sen2 (t) cos2 (t) , cos(t) cos2 (t) sen2 (t) (r sen(t), r cos(t))
r
= cos2 (t) sen2 (t) [( sen(t), cos(t)) ( sen(t), cos(t))]
= cos2 (t) sen2 (t)
lo cual coincide con el primer c

alculo que hicimos.
La identidad
(f ) (t0 ) = k (t0 )k D (t0 ) f (
x0 )
k (t0 )k
tendra implicaciones practicas muy importantes, sobre todo en lo rela-

(bajo el supuesto de que (t0 ) 6= 0)
cionado con el calculo de la derivada de una funci on f cuando esta este descrita en terminos de coordenadas
diferentes a las cartesianas, como las que mencionamos en el captulo 1.
Y justo esto es lo que nos disponemos a desarrollar en la siguiente secci on.
173 J. P
aez
4.3.3 La derivada en otras coordenadas

En el captulo 1 introdujimos, para el caso particular de los puntos o vectores del plano o del espacio,
otros sistemas de coordenadas diferentes de las coordenadas cartesianas. En ese captulo ya describimos las
caractersticas mas importantes de esas otras coordenadas, de tal forma que aqu las vamos a usar con toda
libertad.
Nuestro objetivo en esta seccion, es encontrar una representacion de la derivada de una funci
on que est
a
dada en terminos de algunas de estas coordenadas. Para ello, es importante tener presentes los siguientes
dos hechos:
1. dado que la derivada es una funci on lineal, para tener una representacion de ella es suficiente conocer
sus valores en los elementos de una base ortonormal de R2 o R3 (dependiendo de d onde este contenido
el dominio de la funcion con la que estemos tratando), y
2. si nuestra funci on est
a expresada en terminos de algunas de estas coordenadas (polares, cilndricas
o esfericas), los u
nicos c
alculos que estaremos en condiciones de hacer, consistir
an en derivar estas
expresiones con respecto a las variables en las que esten escritas.
Empezaremos por analizar el segundo punto, y para ello supondremos que tenemos una funci on f : U
R2 R que est a expresada en terminos de las coordenadas polares (, ) de cada punto x U.
Derivar la expresion que define a la funci on f con respecto a una de sus variables, por ejemplo ,
significara que en dicha expresion solo consideraremos como variable a , y a la variable la trataremos
como una constante.
En terminos mas elementales, es decir, recordando que todo proceso de derivaci on con respecto de una
variable consiste en el c
alculo de un lmite (independientemente de que para obtener estas derivadas hagamos
uso de algunas de las reglas de derivacion que ya conocemos), lo que estaremos haciendo es obtener el siguiente
lmite:
f ( + h, ) f (, )
lim (4.29)
h0 h
Sin duda el cociente que aparece en el lmite anterior representa una raz on de cambio de la funcion f , y
lo que analizaremos con mas cuidado es sobre que puntos del dominio de f se est a calculando esta raz
on de
cambio.
Para tener una idea mas precisa de que tipo de puntos son aquellos cuyas coordenadas polares son de
la forma ( + h, ), recurriremos a las f ormulas de conversi on entre coordenadas polares y coordenadas
cartesianas que dedujimos en el captulo 1.
De esta forma, si llamamos x U al punto cuyas coordenadas polares son (, ), tenemos que las
coordenadas cartesianas de x estan dadas por la pareja ( cos(), sen()), y si llamamos x h U al punto
cuyas coordenadas polares son ( + h, ), sus coordenadas cartesianas estar an dadas por (( + h) cos(), ( +
h) sen()).
Notese entonces que
x
h = (( + h) cos(), ( + h) sen())
= ( cos(), sen()) + h(cos(), sen())
=x
+ h(cos(), sen())
lo que significa que xh siempre es un punto que est a en la recta que pasa por x , en la direcci
on del vector
(cos(), sen()) (justo la que hace un
angulo con el eje polar) (ver figura 4.9).
En virtud de lo anterior, si denotamos por e (
x) al vector de coordenadas (cartesianas) (cos(), sen()),
tenemos que el lmite 4.29 se reescribe como
f ( + h, ) f (, ) f (
x + h x)) f (
e ( x)
lim = lim
h0 h h0 h
de tal forma que, por la definicion 4.2 y la proposicion 4.16, se tiene que
f ( + h, ) f (, ) f (
x + h x)) f (
e ( x)
lim = lim
h0 h h0 h
J. P
aez 174
Y
( + h, )
x
h
(, )
x
e (
x)
sen()
b
cos() X
Figura 4.9: Si un vector x tiene coordenadas polares (, ), entonces el vector x

h de coordenadas polares (+h, )
esta en la misma direcci
on que x (si y +h tienen el mismo signo), y que el vector unitario e (
x) de coordenadas
cartesianas (cos(), sen()).
= De (x) f (
x)
= Df (
x)(
e (
x))

f ( + h, ) f (, )
Df (
x)(
e (
x)) = lim (4.30)
h0 h
Esta ultima identidad es muy afortunada ya que nos dice que el proceso de derivaci on con respecto de la
variable que describimos al inicio de esta discusi on, coincide con ser la evaluacion de la derivada de f en x

(Df (x)) en el vector unitario e (
x), lo que sin duda es de mucha ayuda para lograr nuestro objetivo (el de
obtener una expresion de Df ( x), como lo mencionamos al inicio de esta secci on).
Como seguramente el lector estar a de acuerdo, lo que ahora habr a que hacer es la otra derivada,
es decir, derivar la expresion que define a f con respecto de la variable (tratando a la variable como
constante), y esperar que esta otra derivada tambien coincida con ser la evaluacion de la derivada de f en
x
(Df (x)) en algun otro vector unitario, que junto con el vector e ( x), forme una base ortonormal de R2
(so
nar no cuesta nada!).
Aun y cuando este sue no no se nos cumplir a completo, lograremos despertar con una solucion al problema
que nos planteamos resolver en esta secci on! Manos a la obra!
Derivar la expresion que define a f con respecto de la variable (tratando a la variable como constante),
nuevamente se traduce en calcular el siguiente lmite:
f (, + h) f (, )
lim (4.31)
h0 h
Como en el caso anterior, el cociente que aparece en este lmite tambien representa una raz on de cambio
de la funci
on f , y lo que haremos otra vez, sera analizar sobre que puntos del dominio de f se est
a calculando
esta razon de cambio, para lo cual recurriremos nuevamente a las formulas de conversi on entre coordenadas
polares y coordenadas cartesianas.
Si como antes llamamos x al punto cuyas coordenadas polares son (, ), y xh ahora al de coordenadas
polares (, + h), tendremos que las correspondientes coordenadas cartesianas seran ( cos(), sen()) y
( cos( + h), sen( + h)), respectivamente.
Con base en estas coordenadas cartesianas, es facil notar ahora que x y x h son puntos que pertenecen
a la misma circunferencia (la de radio con centro en el origen), y que si h es un n umero cercano a 0,
entonces xh es un punto cercano a x (ver figura 4.10).
De esta forma, la derivada con respecto de la variable de la funcion f (que se obtiene al calcular el lmite
4.31) se puede interpretar como el c alculo de la razon de cambio de la funcion f cuando nos aproximamos a
x
por puntos de la misma circunferencia que pasa por este punto.
175 J. P
aez
(, + h)
x
h
(, )
h x
Figura 4.10: Si un vector x

tiene coordenadas polares (, ), entonces el vector x
h de coordenadas polares (, +h)
esta en la misma circunferencia (la de radio ) que x.
on : R R2 definida como
Por lo tanto, si parametrizamos esta circunferencia por la funci
(h) = ( cos( + h), sen( + h))
el lmite 4.31) tambien se puede reescribir como
f (, + h) f (, ) f ((h)) f ((0))
lim = lim
h0 h h0 h
= (f ) (0)
Como seguramente el lector recordara, la proposicion 4.29 nos asegura que
(f ) (0) = f ((0)) (0)

= f (
x) ( sen(), cos())
x) ( sen(), cos())
= f (
= Df (
x)( sen(), cos())
de tal forma que si ahora denotamos por e (x) al vector de coordenadas cartesianas ( sen(), cos()) (que
es de norma 1 y perpendicular al vector e (
x)!), tenemos que
f (, + h) f (, )
lim = Df (
x)(
e (
x))
h0 h
Aun y cuando esta u ltima identidad no nos asegura que la derivada con respecto de la variable de la
funci
on f sea exactamente igual a la derivada de f en x (Df (
x)) evaluada en alg
un vector unitario (como
sucedio en el caso anterior), si 6= 0, concluimos que
1 f (, + h) f (, )
Df (
x)(
e (
x)) = lim (4.32)
h0 h
Las identidades 4.30 y 4.32 nos proporcionan la solucion al problema que nos planteamos al incio de esta
secci
on (para el caso de las coordenadas polares): c omo encontrar una representacion de la derivada de una
funci
on que est a dada en terminos de este tipo de coordenadas.
Es fundamental que el lector tenga claro la forma en que quedo resuelto este problema. Como men-
cionamos en el punto n umero 1 al incio de esta secci on, dado que la derivada de una funci
on es una funci
on
lineal, esta queda completamente determinada si se conocen sus valores en los elementos de una base ortonor-
mal (en este caso de R2 ). Y las identidades 4.30 y 4.32 justo nos proporcionan estos valores para la base
ortonormal formada por los vectores e (x) y e (
x), que sin duda forman una de estas bases.
J. P
aez 176

x
e (
x) b
x
b

e (
x)
x )
e (
e (
x)
Figura 4.11: Cuando una funcion f esta dada en terminos de coordenadas polares, la derivada de f se expresa en
una base ortonormal que depende del punto en donde se evalue, { e ( x)} para el punto x, y {
x), e ( x ), e (
e ( x )}

para el punto x
.
Lo que es importante destacar es que estos vectores dependen del punto en el que estemos calculando
la derivada de f (lo que por cierto, explica la notaci on que usamos para representarlos); si cambiamos de
punto, cambiamos de base en la cual estamos representando a la funci on lineal Df ( x) (ver figura 4.11).
El otro aspecto importante de la solucion que encontramos a nuestro problema est a en la forma en que
est
an dados los valores de la derivada de f en x (Df ( x)) en los vectores e (
x) y e (
x): calculando lo u
nico
que podamos calcular (como lo mencionamos en el punto 2 al inicio de esta secci on), la derivada con respecto
a las variables y de la expresion que define a f , y que se obtienen por medio de los lmites que aparecen
en las identidades 4.30 y 4.32.
Estas derivadas parciales, aunque analogas a las que definimos en 4.9 no son del mismo tipo en virtud
de que no siempre resultan ser una derivada direccional. Por esta raz on, lo siguiente que haremos sera definir
este otro tipo de derivadas parciales.
Definicion 4.35 Sea f : U R2 R una funci on que est
a expresada en terminos de las coordenadas
U . Si x
polares (, ) de cada punto x 0 U tiene coordenadas polares (0 , 0 ), definimos:
f
1. la derivada parcial de f con respecto de en x0 , que denotamos por (
x0 ), como
f f (0 + h, 0 ) f (0 , 0 )
(
x0 ) := lim
h0 h
f
2. la derivada parcial de f con respecto de en x
0 , que denotamos por (
x0 ), como
f f (0 , 0 + h) f (0 , 0 )
(
x0 ) := lim
h0 h
Con base en estas definiciones podemos resumir lo obtenido hasta ahora, de la siguiente manera: si
f : U R2 R es una funci on que est a expresada en terminos de las coordenadas polares (, ) de cada
punto x U, y x
0 U , x
0 6= (0, 0), tiene coordenadas polares (0 , 0 ), la derivada de f en x
0 (Df (
x0 )) est
a
representada en la base ortonormal formada por los vectores
e (
x0 ) := (cos(0 ), sen(0 ))
e (
x0 ) := ( sen(0 ), cos(0 ))
por la matriz (de 1 2) h i
f 1 f
(
x0 ) 0 (
x0 )
o por el vector
f 1 f
(
x0 ), (
x0 )
0
177 J. P
aez

f 1 f
f (
x0 ) = (
x0 )
e (
x0 ) + (
x0 )
e (
x0 )
0
es decir que f x0 ) y 10 f
( (
x0 ) son las coordenadas del gradiente de f en x x0 )) en la base {
0 (f ( e (
x0 ), e (
x0 )}
.
Por otra parte, y de acuerdo con las identidades 4.19 y 4.18, como
e (
x0 ) = (cos(0 ), sen(0 ))
= cos(0 )
e1 + sen(0 )
e2
e (
x0 ) = ( sen(0 ), cos(0 ))
= sen(0 )
e1 + cos(0 )
e2
se tiene que
h i h i cos(0 ) sen(0 )

f f f 1 f
x (
x0 ) y (
x0 ) = (
x0 ) 0 (
x0 )
sen(0 ) cos(0 )
(4.33)
y
h i h i
f 1 f f f cos(0 ) sen(0 )
(
x0 ) 0 (
x0 ) = x (
x0 ) y (
x0 )
sen(0 ) cos(0 )
(4.34)

f f 1 f
(
x0 ) = cos(0 ) (x0 ) sen(0 ) (x0 )
x 0
f f 1 f
(
x0 ) = sen(0 ) (x0 ) + cos(0 ) (x0 )
y 0
y
f f f
(
x0 ) = cos(0 ) ( x0 ) + sen(0 ) ( x0 )
x y
f f f
x0 ) = 0 sen(0 ) (
( x0 ) + 0 cos(0 ) (x0 )
x y
en donde recuerde que (0 , 0 ) son las coordenadas polares de x0 .

Con relacion a la condicion que impusimos de que x0 6= (0, 0), como el lector ya sabra, las coordenadas
polares del origen son cualquier pareja de la forma (0, ), en donde puede ser cualquier valor. Este hecho
imposibilita la eleccion de la base ortonormal { e (
x0 ), e (
x0 )}, lo que a su vez (en algunos casos) se ve
reflejado en la imposibilidad de calcular el lado derecho de la identidad 4.32. Esto es lo que nos hace
imponer la condicion de que x 0 6= (0, 0).
El lector seguramente estar a de acuerdo en que lo siguiente que habr a que hacer es un ejemplo que ilustre
todo lo desarrollado en esta secci on. Y eso es justo lo que haremos.
on f : R2 R que est
Ejemplo 4.36 Considere la funci a expresada en terminos de las coordenadas polares
2
R por
(, ) de cada punto x
f (, ) = (2 2 cos())2 42
f
(, ) = 2(2 2 cos()) (2 2 cos()) 8

y
f
(, ) = 2(2 2 cos()) (2 sen())

J. P
aez 178
4.4. Derivadas direccionales de orden superior Captulo 4. La derivada de funciones de Rn en R
de tal forma que la derivada de f en un punto x 6= 0 cuyas coordenadas polares sean (, ), es la funci
on
x) cuya matriz asociada (de 1 2) en la base ortonormal {
lineal Df ( e (
x), e (
x)} es
h i
f 1 f
(, ) (, ) = 2(2 2 cos()) (2 2 cos()) 8 4 sen()(2 2 cos())
o la determinada por el vector que tiene coordenadas (tambien en la base { e (

x), e (
x)})

2(2 2 cos()) (2 2 cos()) 8, 4 sen()(2 2 cos())
es decir que
f (, ) = 2(2 2 cos()) (2 2 cos()) 8, 4 sen()(2 2 cos())
Si en particular tomamos el punto x0 cuyas coordenadas polares son (2, /2), tenemos que las coordenadas
del gradiente de f en x0 en la base {
e (
x0 ), e (
x0 )} est
an dadas por
f (
x0 ) = (16, 16)
Si ahora el lector observa que la funci on f de este ejemplo es la misma funcion que dimos en el inciso
1 del ejemplo 4.33 (basta con que recurra a las f ormulas de cambio de coordenadas para que compruebe este
hecho); que el punto x 0 que tiene coordenadas polares (2, /2), tiene coordenadas cartesianas (0, 2) (en la
base canonica {
e1 , e2 }); y que
e (
x0 ) = (cos(/2), sen(/2))
= (0, 1)
= 0
e1 + 1
e2
e (
x0 ) = ( sen(/2), cos(/2))
= (1, 0)
= 1
e1 + 0
e2
de acuerdo con la identidad 4.19, se debe tener que

h i
f f 0 1
x (
x0 ) y (
x0 ) = 16 16
1 0

= 16 16
o lo que es equivalente, que las coordenadas de f (x0 ) en la base can onica {

e1 , e2 } deben estar dadas por

f f
f (
x0 ) = (
x0 ), (
x0 )
x y
= (16, 16)
lo cual coincide con lo obtenido en el ejemplo mencionado.
Aun y cuando el c alculo de la derivada solo lo hicimos para funciones de R2 en R expresadas en terminos
de coordenadas polares, para funciones de R3 en R expresadas en terminos de coordenadas cilndricas o
esfericas, el analisis es completamente analogo al anterior y lo dejaremos como un par de problemas para el
lector.
4.4 Derivadas direccionales de orden superior

on f : U Rn R y un vector unitario u
Si para una funci Rn fijo, se tiene que Du f (
x) existe para todo
on de U Rn en R, es decir, Du f : U Rn R. De esta
U , entonces Du f es nuevamente una funci
x
179 J. P
aez
Captulo 4. La derivada de funciones de Rn en R 4.4. Derivadas direccionales de orden superior
forma, todos los conceptos de derivaci on que hasta ahora hemos definido para una funci
on f , los podemos
trabajar para esta nueva funcion.
En particular, podemos ahora preguntarnos por la existencia de la derivada direccional de Du f en un
on de cualquier otro vector unitario v Rn . De acuerdo con la definicion 4.2,
punto x U , en la direcci
dicha derivada se denotara por Dv (Du f )(
x) y estara dada por
Du f ( v ) Du f (
x + h x)
Dv (Du f )(
x) := lim
h0 h
Mas aun, si ahora para u y v fijos, se tiene que Dv (Du f )( U , entonces Dv (Du f )
x) existe para toda x
sera otra vez una funci on de U Rn en R y por tanto tiene sentido tomar otro vector unitario w Rn y
preguntarnos por la existencia de la derivada direccional de Dv (Du f ) en un punto x U , en la direcci
on del
vector w, es decir, si existe
Dv (Du f )( Dv (Du f )(
x + hw) x)
Dw (Dv (Du f ))(
x) := lim
h0 h
Antes de seguir por este camino, tomemos un respiro y notemos lo siguiente: seguramente a estas alturas,
y tomando en cuenta resultados como los de la proposicion 4.24, el lector ya intuye la importancia de las
derivadas direccionales de una funci on de los vectores de una base ortonormal {
on f en la direcci e1 , . . . , en },
es decir, de las derivadas parciales.
Por esta razon, y aun y cuando las ideas planteadas en los parrafos anteriores se pueden seguir trabajando
en ese contexto mas general, nos concentraremos en el caso particular de las derivadas parciales, ideas que
dejaremos expresadas en la siguiente
Definici 0 U , r > 0 tal que Br ( x0 ) U , y x1 , . . . , xn las coordenadas
f
e1 , . . . , en } de Rn . Si x
determinadas por una base ortonormal { i
(
x ) existe para toda x Br (x0 ) definimos
2f
la segunda derivada parcial de f con respecto a xi y respecto a xj en x
0 , que denotaremos por xj xi (
x0 ),
f
como la derivada parcial de la funci
on xi con respecto de xj en x
0 , es decir
f f
2f xi (
x0 ej )
+ h xi (
x0 )
(
x0 ) := lim
xj xi h0 h
2f
Si j = i, la derivada anterior la denotamos por x2i
(
x0 ) y decimos que es la segunda derivada parcial de f
con respecto de xi , en x
0 .
Como en el caso de la (primera) derivada parcial, desde un punto de vista practico el c alculo de las
segundas derivadas parciales se realiza siguiendo el mismo esquema: en cada paso, derivar solo con respecto
a una variable, suponiendo que las dem as son constantes. Como es de esperarse, lo que ahora sigue es un
ejemplo que ilustre este concepto.
Ejemplo 4.38 Sea f : R2 R dada por la expresi

on
f (x, y) = x cos(xy) + y sen(xy)
Lo que haremos ser a calcular todas las posibles segundas derivadas parciales de f (que son cuatro) para
= (x, y) R2 .
cualquier x
Para ello, notemos primero que
f
(x, y) = xy sen(xy) + cos(xy) + y 2 cos(xy)
x
y que
f
(x, y) = x2 sen(xy) + xy cos(xy) + sen(xy)
y
J. P
aez 180
Por tanto, se tiene que

f
2
f x
(x, y) = (x, y)
x2 x
= xy 2 cos(xy) y sen(xy) y sen(xy) y 3 sen(xy)
= xy 2 cos(xy) 2y sen(xy) y 3 sen(xy)
y que

f
2
f x
(x, y) = (x, y)
yx y
= x2 y cos(xy) x sen(xy) x sen(xy) xy 2 sen(xy) + 2y cos(xy)
= x2 y cos(xy) 2x sen(xy) xy 2 sen(xy) + 2y cos(xy)
Finalmente

f
2
f y
(x, y) = (x, y)
xy x
= x2 y cos(xy) 2x sen(xy) xy 2 sen(xy) + y cos(xy) + y cos(xy)
= x2 y cos(xy) 2x sen(xy) xy 2 sen(xy) + 2y cos(xy)
y

f
2
f y
(x, y) = (x, y)
y 2 y
= x3 sen(xy) x2 y sen(xy) + x cos(xy) + x cos(xy)
= x3 sen(xy) x2 y sen(xy) + 2x cos(xy)
Del ejemplo anterior es muy importante hacer dos observaciones con respecto al c alculo de las segundas
derivadas parciales en las que aparecen ambas variables (x y y), y que se les conoce con el nombre de
derivadas parciales mixtas (o cruzadas).
Una, que se refiere al orden en que se toman estas variables para calcular las correspondientes derivadas,
y que es de derecha a izquierda, seg un aparezcan en el denominador correspondiente; y dos, que en este
ejemplo, estas segundas derivadas parciales resultaron ser iguales.
De esta segunda observaci on, sin duda surge la pregunta de si dicha igualdad siempre se cumple, y la
respuesta es que no. En el problema 19 el lector encontrara un ejemplo de que esta identidad no siempre
sucede.
Por nuestra parte, lo siguiente que haremos sera justo enunciar un resultado que nos proporciona las
condiciones suficientes para que dicha igualdad s se cumpla.
Un punto importante en la prueba de este resultado tiene que ver con un hecho muy sencillo, relacionado
con los valores de una funci on sobre cualesquiera cuatro puntos de su dominio (que los podemos pensar como
cuatro vertices de un cuadril atero), y el c
alculo de ciertas diferencias tomadas a partir de estos valores.
Notese que, si x1 , x
2 , x
3 y x
4 son puntos del dominio de una funci on f , entonces se tiene que
x3 ) f (
(f ( x2 )) (f (
x4 ) f ( x3 ) f (
x1 )) = (f ( x4 )) (f (
x2 ) f (
x1 ))
Teorema 4.39 (de las parciales cruzadas) Sean f : U Rn R, x 0 U y r > 0 tal que Br (
x0 ) U .
2f 2f
Si las segundas derivadas parciales xj xi y xi xj existen para cada x Br (
x0 ) y son continuas en x0
entonces
2f 2f
(
x0 ) = (
x0 )
xj xi xi xj
181 J. P
aez
Demostraci on. Sea Br ( 0) = {(h1 , h2 ) R2 | k(h1 , h2 )k < r}. Notese que si (h1 , h2 ) Br (0) entonces
x
0 + h1 ei + h2 ej , x
0 + h1 ei y x x0 ) R , de modo que podemos definir H : Br (
0 + h2 ej pertenecen a Br ( n
0)
2
R R como
x0 + h1 ei + h2 ej ) f (
H(h1 , h2 ) = (f ( x0 + h1 ei )) (f (
x0 + h2 ej ) f (
x0 )) (4.35)
Ahora, si (h1 , h2 ) Br (
0) definimos
q q q
g : x R | |x| < r2 h22 = r2 h22 , r2 h22 R R
como
g(x) = f (x0 + xei + h2 ej ) f (
x0 + x
ei )
p p
Entonces, como h1 r2 h22 , r2 h22 , se tiene que
x0 + h1 ei + h2 ej ) f (
H(h1 , h2 ) = (f ( x0 + h1 ei )) (f (
x0 + h2 ej ) f (
x0 ))
= g(h1 ) g(0)
Por otra parte, observe que por la proposicion 4.29 g es derivable en su dominio y
f f
g (x) = ( ei + h2 ej )
x0 + x (
x0 + x
ei )
xi xi
de modo que por el Teorema de Valor Medio (para funciones de R en R), existe
q q
2 2 2
r h2 , r h2 2
tal que
H(h1 , h2 ) = g(h1 ) g(0)

= g ()h1

f f
= ( ei + h2 ej )
x0 + (
x0 +
e i ) h1
xi xi
Finalmente, como [ x0 + ei , x ei + h2 ej ] Br (
0 + x0 ) y ( ei + h2 ej ) (
x0 + x0 +
ei ) = h2 ej , por la
f
proposicion 4.13 (aplicada a la funci on x i
) se tiene que existe (0, |h 2 |) tal que

f f
H(h1 , h2 ) = ( ei + h2 ej )
x0 + (
x0 +
e i ) h1
xi xi

f
xi
= (
x0 +
ei +
ej )h1 h2
xj
2f
= (
x0 +
ei +
ej )h1 h2
xj xi
2 f
Por lo tanto, si h1 h2 6= 0, por la continuidad de xj xi 0 , y que (, ) (0, 0) si (h1 , h2 ) (0, 0),
en x
concluimos que
H(h1 , h2 ) 2f
lim = lim (
x0 +
ei +
ej )
(h1 ,h2 )(0,0) h1 h2 (,)(0,0) xj xi
2f
= (
x0 )
xj xi
J. P
aez 182
Observe ahora que para cada (h1 , h2 ) Br (0), la funci on H definida en 4.35 tambien se puede escribir
como
x0 + h1 ei + h2 ej ) f (
H(h1 , h2 ) = (f ( x0 + h2 ej )) (f (
x0 + h1 ei ) f (
x0 ))
de tal forma que si definimos
q q q
2 2 2
g : x R | |x| < r h1 = r h1 , r h1 R R
2 2 2
como
g(x) = f ( ej ) f (
x0 + h1 ei + x x0 + x
ej )
p p
dado que h2 r2 h21 , r2 h21 , se tiene que
H(h1 , h2 ) = g(h2 ) g(0)

Procediendo con la funci
p on g, se tiene que existe
on g como lo hicimos anteriormente con la funci
p
r2 h21 , r2 h21 tal que
H(h1 , h2 ) = g(h2 ) g(0)

= g ( )h2

f f
= x0 + h1 ei + ej )
( (
x0 + ej ) h2
xj xj
x0 + ej , x
y como [ 0 + h1 ei + ej ] Br (
x0 ), con (x0 + h1 ei + ej ) ( x0 + ej ) = h1 ei , nuevamente por
f
la proposicion 4.13 (aplicada a la funci on xj ) se tiene que existe (0, |h1 |) tal que

f f
H(h1 , h2 ) = x0 + h1 ei + ej )
( x0 + ej ) h2
(
xj xj

f
xj
= x0 + ei + ej )h1 h2
(
xi
2f
= x0 + ei + ej )h1 h2
(
xi xj
2f
De esta forma, si h1 h2 6= 0, por la continuidad de xi xj 0 y que ( , ) (0, 0) si (h1 , h2 ) (0, 0),
en x
concluimos que
H(h1 , h2 ) 2f
lim = lim x0 + ei + ej )
(
(h1 ,h2 )(0,0) h1 h2 ( , )(0,0) xi xj
2f
= (
x0 )
xi xj
de donde, como el lmite de cualquier funci
on, si existe, es u
nico, tenemos que
2f H(h1 , h2 )
(
x0 ) = lim
xj xi (h1 ,h2 )(0,0) h1 h2
2f
= (
x0 )
xi xj
que es la identidad que deseabamos probar.
Como mencionamos al incio de esta secci on, podemos calcular sucesivamente tantas derivadas direc-
cionales (en la misma o en diferentes direcciones) como nos lo permita la funci on con la que estemos traba-
jando.
Dado que en terminos practicos es suficiente con hacer esto para los vectores de una base canonica de
Rn , lo siguiente que haremos sera extender la definicion 4.37 para cualquier k N.
183 J. P
aez
Definicion 4.40 Sean f : U Rn R, x0 U , r > 0 tal que Br ( x0 ) U , k N y x1 , . . . , xn las

coordenadas determinadas por una base ortonormal { e1 , . . . , en } de Rn . Si i1 , . . . , ik , ik+1 {1, . . . , n} son
k
tales que xi x
f
i
( Br (
x) existe para toda x x0 ) definimos la k + 1 derivada parcial de f con respecto a
k 1
k+1 f
xi1 , . . . , xik , xik+1 , en x
0 , que denotaremos por xik+1 xik xi1 (
x0 ), como la derivada parcial con respecto de
kf
xik+1 de la funci
on xik xi1 en x
0 , es decir
kf k f
k+1 f xik xi1 ( eik+1 )
x0 + h xik xi1 (
x0 )
(
x0 ) := lim
xik+1 xik xi1 h0 h
k+1 f
Si i1 = i2 = = ik = ik+1 = i, la derivada anterior la denotamos por xk+1
(
x0 ) y decimos que es la
i
k + 1 derivada parcial de f con respecto de xi , en x
0 .
A prop osito de la notaci on usada en esta definicion, y en concordancia con la u ltima parte, en general, si
en la expresion xik xi1 existen m ndices consecutivos iguales, esta parte de la expresion la sustituiremos
por xmi , en donde xi es la variable que se repite m veces consecutivas.
Por ejemplo, la derivada parcial de orden 6
6f
(
x0 )
x3 x2 x2 x3 x1 x1
se podra escribir como
6f
(
x0 )
x3 x22 x3 x21
Dada k N, como seguramente el lector recordara de sus cursos de algebra, existen nk formas de elegir
ordenaciones (con repetici on) con elementos del conjunto {1, . . . , n}, de tal forma que existen nk derivadas
parciales de orden k para una funci on f de Rn en R.
Cuando todas estas derivadas parciales existen en los puntos de un conjunto (abierto) sobre el cual este
definida la funci
on f , y ademas son continuas en este mismo conjunto, diremos que f es una funci on de clase
C k . Este concepto jugara un papel muy importante mas adelante, y lo dejaremos plasmado en la siguiente
Definicion 4.41 Sean f : U Rn R y k N. Decimos que f es una funci on de clase C k en U si existen

todas las derivadas parciales de orden k de f en cada punto de U , y adem
as estas derivadas parciales son
continuas en cada punto de U .
El concepto anterior est

a muy relacionado con las hipotesis de la proposicion 4.24 y el teorema 4.39,
raz
on por la cual enunciaremos el siguiente par de proposiciones y dejaremos su prueba al lector.
on 4.42 Si f : U Rn R es de clase C 1 en U entonces f es derivable para toda x

Proposici U.
on 4.43 Si f : U Rn R es de clase C 2 en U entonces

Proposici
2f 2f
(
x) = (
x)
xi xj xj xi
U y para todas i, j {1, . . . , n}.

para toda x
Cuando una funci on es de clase C k , muchas de sus derivadas parciales de orden k coinciden. En efecto, si
en dos derivadas parciales de orden k de una funci on f se deriva con respecto a las mismas variables, y ademas
se deriva (con respecto de cada una de ellas y sin importar el orden) el mismo n umero de veces, entonces
estas derivadas parciales son iguales. Enunciar con toda precisi on (y probar!) la afirmaci
on anterior no est
a
dentro de los objetivos de este texto, y solo baste decir que en el fondo su prueba se basa en el teorema 4.39.
Antes de iniciar con otro tema, es importante enfatizar que conceptos hemos definido (y cuales no hemos
definido!) en esta secci
on.
J. P
aez 184
4.5. Aproximaci
on polinomial Captulo 4. La derivada de funciones de Rn en R
Como lo dice su nombre, aqu solo definimos el concepto de derivadas direccionales de orden superior de
una funci
on f , lo que no significa que hayamos definido el concepto de derivada (global) de orden superior
de f .
Como hemos venido insistiendo, la derivada de una funci on f es una funci on que a cada x del dominio
de f le asocia una funci on lineal de Rn en R que denotamos por Df ( x). Siguiendo la idea de que la
segunda derivada de una funci on f debera de ser la derivada de la derivada de f , para definir este concepto
tendramos que definir lo que significa derivar una funcion cuyo dominio est a contenido en Rn y que tiene
n
como contradominio al conjunto de las funciones lineales de R en R.
Como posiblemente el lector estar a de acuerdo, este es un tema que escapa a los objetivos de este texto.
No obstante lo anterior, con los conceptos desarrollados en esta secci on nos es suficiente para abordar
un tema muy importante relacionado con la aproximacion de una funci on cerca de un punto, tema que
abordaremos en la siguiente secci on.
4.5 Aproximaci
on polinomial
on f de Rn en R en un punto x
Como el lector recordara, el concepto de derivada (global) de una funci 0 , est
a
intimamente relacionado con el problema de aproximar a dicha funci on alrededor (o cerca) de x0 por medio
de una funcion lineal.
En terminos mas concretos, la derivabilidad de f en x
0 se reduce al hecho de que la funci
on
P (
x) = Df ( xx
x0 )( 0 ) + f (
x0 )
es la u
nica funci
on de este tipo que tiene la propiedad de que
x) P (
f ( x)
lim =0 (4.36)
x

x0 k
xx 0 k
Si ahora recordamos que

Df ( xx
x0 )( 0 ) = f (
x0 ) (
x x0 )

(0) (0)
tendremos que en un sistema de coordenadas x1 , . . . , xn , en donde x
0 = x1 , . . . , xn , la funci
on P toma
la forma
P (
x) = P (x1 , . . . , xn )
= f (
x0 ) ( x x0 ) + f (
x0 )
n
X f (0)
= (x0 ) xi xi + f (
x0 ) (4.37)
i=1
x i
de donde concluimos que P es una funci on polinomial de grado a lo mas 1 de las coodenadas (o variables)
x1 , . . . , xn con la particularidad de que P ( x0 ) = f (x0 ).
Visto de esta forma, y con base en la proposicion 4.24, podemos asegurar que si las derivadas parciales
f
xi existen en una vecindad del punto x 0 y son continuas en este (lo que se satisface sobradamente si f es
de clase C 1 en una vecindad de x 0 ), entonces el polinomio de grado a lo mas 1 en las variables x1 , . . . , xn
dado por 4.37 es el u nico polinomio que satisface la condicion 4.36.
Como seguramente el lector ya se estar a imaginando, la siguiente pregunta que nos haremos sera la
siguiente: que propiedades deber a tener una funci on f para que podamos asegurar que existe una funci on
polinomial de grado a lo mas 2 en las variables x1 , . . . , xn , con la particularidad de que valga lo mismo que
f en x 0 , tal que se parezca mucho a f alrededor de x 0 ?
Para abordar este problema, empezaremos analizando el caso de una funci on definida en R2 . Supongamos
2
entonces que f : U R R y que x 0 = (x0 , y0 ) U .
Primero notemos que una funci on P2 (x, y) polinomial en las variables x y y de grado a lo mas 2, es de la
forma
P2 (x, y) = Ax2 + By 2 + Cxy + Dx + Ey + F
185 J. P
aez
Captulo 4. La derivada de funciones de Rn en R 4.5. Aproximaci
on polinomial
y que si se desea que esta funci

on tome el valor f (
x0 ) cuando (x, y) = (x0 , y0 ) entonces debera ser de la
forma
P2 (x, y) = A(x x0 )2 + B(y y0 )2 + C(x x0 )(y y0 ) + D(x x0 ) + E(y y0 ) + f (

x0 ) (4.38)
por lo que nuestro problema se reduce a encontrar los coeficientes A, B, C, D y E.

Ahora, si el criterio para decir que P2 se parece mucho a f alrededor de x0 es que satisfaga la condicion
4.36, dado que
(x x0 )2 , (y y0 )2 , |(x x0 )(y y0 )| k 0 k2
xx
entonces
(x x0 )2 (y y0 )2 (x x0 )(y y0 )
lim = lim = lim =0
(x,y)(x0 ,y0 ) k
xx 0 k (x,y)(x0 ,y0 ) k
xx 0 k (x,y)(x0 ,y0 ) k
xx 0 k
de modo que
x) P2 (
f ( x)
0 = lim
x

x0 k
x x0 k

x) A(x x0 )2 + B(y y0 )2 + C(x x0 )(y y0 ) + D(x x0 ) + E(y y0 ) + f (
f ( x0 )
= lim
x
x0 k
xx
0 k
x) (D(x x0 ) + E(y y0 ) + f (
f ( x0 ))
= lim
x
x0 k
xx 0 k
lo cual es equivalente a que f sea derivable en el punto x

0 , y por lo tanto se debera tener que
f f
D= (
x0 ) y E= (
x0 )
x y
De esta forma, si f es derivable en x0 entonces la funci

on polinomial
f f
P2 (x, y) = A(x x0 )2 + B(y y0 )2 + C(x x0 )(y y0 ) + x0 )(x x0 ) +
( x0 )(y y0 ) + f (
( x0 ) (4.39)
x y
cumple la condicion 4.36 para cualesquiera A, B y C n umeros reales.

Y tal vez esta u
ltima parte no sea del todo una buena noticia, pues nos asegura que hay una gran cantidad
de funciones polinomiales de grado 2 que se parecen mucho a f alrededor de x 0 , lo que sin duda nos deja
con la pregunta de si de entre todas ellas no habr a alguna que sea la mejor de todas.
Lo que haremos a continuacion sera mostrar que s existe un criterio con base en el cual podemos elegir,
de entre todas las funciones polinomiales dadas por 4.39, la que se parece mas a f alrededor de x 0 . Para
ello, basta con hacer notar que una forma de interpretar la multicitada condicion 4.36, es que el n umero
x) P (
f ( x) se hace 0 mucho mas r apido que el numero k x x0 k.
2
Con base en esta interpretacion, y dado que, si k
x x0 k 1 se tiene que k
xx 0 k k xx 0 k, entonces
pedir que
x) P (
f ( x)
lim 2 =0 (4.40)
x
x0 kx x0 k
sin duda es una condicion mas fuerte que la condicion 4.36 (de hecho, por el problema 38 del captulo 2,
sabemos que si se cumple la condicion anterior entonces se cumple la condicion 4.36 (pero no lo recproco!)).
Por esta raz
on, si suponemos que una funci on polinomial de grado a lo mas 2 satisface la condicion 4.40,
podemos dar por hecho que ya es de la forma 4.39.
Supongamos entonces que P2 es una funci on polinomial como en 4.39 que satisface la condicion 4.40, es
decir, supongamos que
x) P2 (
f ( x)
lim
x
x0 k 0 k2
xx
J. P
aez 186
4.5. Aproximaci

f f
x) A(x x0 )2 + B(y y0 )2 + C(x x0 )(y y0 ) +
f ( x (
x0 )(x x0 ) + y (
x0 )(y y0 ) + f (
x0 )
= lim
x

x0 k 0 k2
xx
=0
Si nos aproximarnos a (x0 , y0 ) por puntos de la forma (x, y) = (x0 + h, y0 ), se debera tener que

f (x0 + h, y0 ) Ah2 + f x (x ,
0 0y )h + f (x ,
0 0y )
0 = lim 2
h0 h
" #
f (x0 + h, y0 ) f
x (x 0 , y0 )h f (x0 , y0 )
= lim A
h0 h2
de modo que al cociente

f
f (x0 + h, y0 ) x (x0 , y0 )h f (x0 , y0 )
h2
lo podemos tratar como un cociente de dos funciones que dependen de la variable (real) h.
Ahora, si suponemos que f y sus derivadas parciales son funciones derivables en todos los puntos de una
vecindad del punto x 0 (lo cual se puede garantizar suponiendo que f es de clase C 2 en una vecindad de
este punto), aplicando (las veces que haga falta) la regla de LHospital para este tipo de funciones (y por
supuesto la regla de la cadena probada en la proposicion 4.29), tenemos que
f f
f (x0 + h, y0 ) x (x0 , y0 )h f (x0 , y0 ) x (x0+ h, y0 ) f
x (x0 , y0 )
lim = lim
h0 h2 h0 2h
f
1 (x0 + h, y0 ) fx (x0 , y0 )
= lim x
2 h0 h
1 2f
= (x0 , y0 )
2 x2
1 2f
(x0 , y0 )
A=
2 x2
Aproximandonos a (x0 , y0 ) por puntos de la forma (x, y) = (x0 , y0 + h), por un procedimiento analogo se
concluye que
1 2f
B= (x0 , y0 )
2 y 2
Finalmente, para deducir el valor del coeficiente C, nos aproximaremos a (x0 , y0 ) por puntos de la forma
(x, y) = (x0 + h, y0 + h).
En este caso, usando nuevamente la regla de LHospital en la segunda y tercera identidad, se debera tener
que
2 2

f (x0 + h, y0 + h) 21 xf2 ( x0 )h2 + 21 yf2 (
x0 )h2 + Ch2 + f x (
x 0 )h + f
y (
x 0 )h + f (
x 0 )
0 = lim 2
h0 h
2 2

f f f
x (x0 + h, y0 + h) + y (x0 + h, y0 + h) x2 ( x0 )h + yf2 (
x0 )h + 2Ch + f x (x0 ) + f y (
x0 )
= lim
h0 2h

1 2f 2f 2f 2f
= lim (x 0 + h, y 0 + h) + (x0 + h, y 0 + h) + (x 0 + h, y 0 + h) + (x0 + h, y0 + h)
h0 2 x2 yx xy y 2
2
f 2f
(
x 0 ) + (
x0 ) + 2C
x2 y 2
2
1 f 2f
= (
x0 ) + x0 ) 2C
(
2 yx xy
187 J. P
aez
on polinomial

1 2f 2f
C= (
x0 ) + (
x0 )
2 yx xy
De lo anterior concluimos que, si existen las segundas derivadas parciales de f (en al menos una vecindad
del punto x0 y en este punto son continuas), y P2 es una funci on polinomial de grado menor o igual a 2 que
satisface la condicion 4.40, entonces necesariamente P2 est a dado por
2
1 2f 2 2f 2 f 2f
P2 (x, y) = (
x 0 )(x x0 ) + (y y 0 ) + (
x 0 ) + (
x 0 ) (x x0 )(y y 0 ) (4.41)
2 x2 y 2 yx xy
f f
+ x0 )(x x0 ) +
( x0 )(y y0 ) + f (
( x0 )
x y
Es importante enfatizar que el resultado anterior se obtuvo bajo el supuesto de que f es de clase C 2 en
una vecindad del punto x 0 , y de que existe una funci
on polinomial de grado menor o igual a 2 que satisface
la condicion 4.40. La buena noticia es que, bajo las mismas hipotesis sobre f , lo recproco tambien es cierto,
es decir la funci
on polinomial dada por 4.41 cumple la condicion 4.40.
Seguramente a esta alturas el lector ya estara empezando a vislumbrar el resultado mas general hacia el
cual estamos dirigiendo nuestros pasos. Todo parece indicar que, si f : U Rn R y x0 U son tales que
f es de clase C N en una vecindad del punto x 0 para alguna N N, entonces la funci on polinomial de grado
a lo mas N dada por
PN (
x)
n n
X f
(0)
1 X N f
(0)

(0)

= f (
x0 ) + x0 ) xi xi
( + + x0 ) xi1 xi1 xiN xiN
(
i=1
xi N ! i ,...,i =1 xi1 xiN
1 N

(0) (0)
en donde x
= (x1 , . . . , xn ) y x
0 = x1 , . . . , xn , debe ser tal que
x) PN (
f ( x)
lim =0
x

x0 x x0 kN
k
y ademas es la u
nica con esta propiedad.
Este resultado es conocido como el Teorema de Taylor , y aqu lo formularemos un poco diferente a como
lo acabamos de describir en el parrafo anterior. Tambien es importante mencionar que la prueba de este
on para funciones de R en R.
teorema se basa en el Teorema de Taylor, en su versi
Teorema 4.44 (de Taylor) Sean f : U Rn R, x 0 U , r > 0 y N N tales que f es de clase C N +1
en Br (x0 ) U . Definimos el polinomio de Taylor de grado N de la funcion f en x0 , que denotamos por
PN,f,x0 (
x), como
PN,f,x0 (
x)
n n
X f
(0)
1 X N f
(0)

(0)

= f (
x0 ) + x0 ) xi xi
( + + x0 ) xi1 xi1 xiN xiN
(
i=1
xi N ! i ,...,i =1 xiN xi1
1 N

(0) (0)
(en donde x = (x1 , . . . , xn ) y x
0 = x1 , . . . , xn ), y el residuo de orden N de f en x
0 , que denotamos por
RN,f,x0 (
x), como
RN,f,x0 ( x) PN,f,x0 (
x) = f ( x)
U . PN,f,x0 y RN,f,x0 satisfacen que:
para x
1. si x x0 ) existe [
Br ( x0 , x
] tal que
RN,f,x0 (
x)
n
1 X N +1 f
(0)

(0)

(0)

= xi1 xi1 xiN xiN xiN +1 xiN +1
(N + 1)! i xiN +1 xiN xi1
1 ,...,iN ,iN +1 =1
J. P
aez 188
4.5. Aproximaci
2.
RN,f,x0 (
x) x) PN,f,x0 (
f ( x)
lim N
= lim N
=0
x

x0 k
xx
0 k x

x0 k
xx
0 k
3. PN,f,x0 es el u
nico polinomio de grado menor o igual a N que satisface la condici
on del inciso 2.
Demostraci on. Para la prueba del inciso (1), tomamos x Br (

x0 ), x 6= x0 (el caso x = x
0 es inmediato
tomando = x
0 ), y definimos
g : (r/ k
xx
0 k , r/ k 0 k) R R
xx
como g(t) = f ( xx
x0 + t( 0 )).
Por el problema 24 (tomando h =x x0 ) sabemos que g es de clase C N +1 en su dominio de tal forma
que, por el Teorema de Taylor para funciones de R en R, tenemos que
RN,0,g (1)
1
= g (N +1) ()(1 0)
(N + 1)!
1
= g (N +1) ()
(N + 1)!
n
1 X N +1 f
(0)

(0)

(0)

(N + 1)! i ,...,i ,i =1 xiN +1 xiN xi1
1 N N +1
en donde = x x x0 ) para alguna (0, 1), de modo que [

0 + ( x0 , x
].
Por otra parte, como
RN,0,g (1) = g(1) PN,0,g (1)

N
X g (i) (0)
x)
= f ( (1 0)i
i=0
i!
1 1 (N )
x) (g(0) + g (0) +
= f ( g (0) + + g (0)
2! N!
n
X f (0)
x)
= f ( f (
x0 ) + x0 ) xi xi
( + +
i=1
xi

n
1 X N f
(0)

(0)

+ x0 ) xi1 xi1 xiN xiN
(
N ! i ,...,i =1 xiN xi1
1 N
x) PN,f,x0 (
= f ( x)
= RN,f,x0 (
x)
concluimos que
RN,f,x0 (
x)
n
1 X N +1 f
(0)

(0)

(0)

(N + 1)! i xiN +1 xiN xi1
1 ,...,iN ,iN +1 =1
para alguna [
x0 , x
].
Ahora, dado que
(0)
xi xi k
xx
0 k
|RN,f,x0 (
x)|
189 J. P
aez
on polinomial

n N +1
1 X f (0) (0) (0)
(N + 1)! i1 ,...,iN ,iN +1 =1 xiN +1 xiN xi1
n
1 X N +1 f
(0)

(0) (0)

xi1 xi1 xiN xiN xiN +1 xiN +1

(N + 1)! i ,...,i ,i =1 xiN +1 xiN xi1

1 N N +1
n
1 X N +1 f
kxx 0 k k
x x0 k k
xx 0 k
(N + 1)! i ,...,i ,i =1 xiN +1 xiN xi1
1 N N +1
N +1 n
kx x0 k X N +1 f
=
(N + 1)! i ,...,i ,i =1 xiN +1 xiN xi1
1 N N +1
de tal forma que

n
|RN,f,x0 (
x)| 1 X N +1 f
N
k
xx
0 k
(N + 1)! i N +1 xiN xi1
xi
k
xx
0 k 1 ,...,iN ,iN +1 =1
Por tanto, dado que f es de clase C N +1 en Br (

x0 ), se tiene que
N +1 f N +1 f
lim = (
x0 )
x

x0 xiN +1 xiN xi1 xiN +1 xiN xi1
para todas i1 , , iN , iN +1 {1, . . . , n}, as concluimos que
RN,f,x0 (
x)
lim =0
x

x0 x x0 kN
k
lo cual prueba el inciso (2).

Finalmente, para la prueba del inciso (3), supongamos que PN es otro polinomio de grado menor o igual
a N para el cual se satisface que
x) PN (
f ( x)
lim =0
x
x0 k x x0 kN
Dado que
x) PN,f,x0 (
f ( x) RN,f,x0 (
x)
lim N
= lim N
x

x0 k
xx
0 k x

x0 k
xx
0 k
=0
restando estos dos u

ltimos lmites tenemos que
x) PN,f,x0 (
PN ( x)
lim N
=0
x

x0 k
x x0 k
de tal forma que si hacemos P ( x) PN,f,x0 (
x) = PN ( x), se tiene que P es un polinomio de grado menor o
igual a N con la propiedad de que
P (
x)
lim N
=0
xx0 k
x x0 k
El siguiente paso sera demostrar que un polinomio con estas caracatersticas tiene que ser la funci on
constante 0.
Rn , fija. Definimos p(t) = P (
Para ello, sea x xx
x0 + t( 0 )) para t R; n
otese que p sera un polinomio
en la variable t de grado a lo mas N con la propiedad de que

p(t) |P ( xx
x0 + t( 0 ))|
lim = lim
t0 tN t0 k(
x0 + t(xx 0 )) x0 kN
J. P
aez 190
4.5. Aproximaci
=0
o equivalentemente, que
p(t)
=0 lim
tN t0
Por lo tanto, como para el caso de polinomios de una variable ya sabemos que p tiene que ser la constante
cero, concluimos que
0 = p(1)
= P (
x)
= PN (x) PN,f,x0 (
x)
x) = PN,f,x0 (
es decir, que PN ( Rn que es lo que queramos demostrar.
x) para toda x
Los polinomios de Taylor son una herramienta muy importante en el analisis del comportamiento de una
funci
on alrededor de un punto, y nos seran muy u
tiles cuando en la proxima seccion abordemos el tema de
los valores maximos y mnimos de una funci
on.
Por ahora, veremos con un ejemplo como se pueden usar para el calculo de lmites.
Ejemplo 4.45 Considere la funci

on
ln(1 + x2 ) + ln(1 + y 2 )
f (x, y) =
x2 + y 2
para (x, y) R2 , (x, y) 6= (0, 0).

Nuestro objetivo es calcular
lim f (x, y)
(x,y)(0,0)
Para ello, bastar

a con calcular el polinomio de Taylor de grado 2 en el (0, 0) de la funci
on
g(x, y) = ln(1 + x2 ) + ln(1 + y 2 )

2
dado que el denominador de f es x2 + y 2 = k(x, y)k .
Para la funci
on g se tiene que
g 2x g 2y
(x, y) = y (x, y) =
x 1 + x2 y 1 + y2
de modo que
2g 2 4x2 2g
(x, y) = y (x, y) = 0
x2 1 + x2 (1 + x2 )2 yx
y an
alogamente
2g 2g 2 4y 2
(x, y) = 0 y (x, y) = 2
xy y 2 1 + y2 (1 + y 2 )
De esta forma tenemos que

g g 1 2g 2 2g 2g 2g 2
P2,g,0 (x, y) = g(
0) + (0)x + (0)y + (0)x + (0)xy + (0)yx + (0)y
x y 2 x2 yx xy y 2
= x2 + y 2
y por lo tanto
ln(1 + x2 ) + ln(1 + y 2 )
lim f (x, y) = lim
(x,y)(0,0) (x,y)(0,0) x2 + y 2
191 J. P
aez
Captulo 4. La derivada de funciones de Rn en R 4.6. M
aximos y mnimos
g(x, y)
= lim
(x,y)(0,0) x2 + y 2
P2,g,0 (x, y) + R2,g,0 (x, y)

= lim
(x,y)(0,0) x2 + y 2
x2 + y 2 + R2,g,0 (x, y)
= lim
(x,y)(0,0) x2 + y 2
!
R2,g,0 (x, y)
= lim 1+
(x,y)(0,0) k(x, y)k2
=1+0
=1
4.6 M
aximos y mnimos
Una de las aplicaciones mas comunes de la derivada, es la localizacion de los puntos en los que una funci on
alcanza sus valores maximo y mnimo. De acuerdo con el corolario 2.51 del captulo 2, si una funci on
f : A Rn R es continua en un subconjunto B de su dominio A, y este subconjunto es cerrado y acotado
(es decir compacto), solo en este caso podemos estar seguros de que existen un par de puntos en B en los
cuales la funcion f alcanza su valor maximo y su valor mnimo, en donde ademas estos valores son maximo
y mnimo solo con respecto a los valores de f sobre los elementos del subconjunto B.
Puesto que todo conjunto B Rn que sea cerrado se puede descomponer en la union de su interior y su
frontera (B = Fr(B)int(B)), que son dos conjuntos ajenos, y dado que int(B) siempre es un conjunto abierto
y Fr(B) siempre es un conjunto cerrado (y flaco, ya que por el problema 15 se tiene que int(Fr(B)) = ),
vamos a reducir nuestro analisis a estos dos casos: cuando los puntos en los que una funci on f alcanza su
valor maximo o mnimo (o alguno de ellos) pertenecen al interior de B, y cuando estos mismos puntos (o
alguno de ellos) pertenecen a la frontera de B.
De acuerdo con el enfoque anterior, lo que haremos sera analizar en general que caractersticas especficas
satisfacen los puntos en los que una funci on f alcanza su valor maximo y su valor mnimo, dependiendo de
si estos pertenecen a un conjunto abierto (como el int(B)) o a un conjunto cerrado con interior vaco (como
la Fr(B), cuando B es cerrado).
on 4.46 Sean f : A Rn R, B A y x
Definici 0 B. Decimos que:
1. f alcanza (o tiene) un valor m

aximo (mnimo ) en x x) f (
0 sobre B si f ( x0 ) f (
x0 ) (f ( x)) para
B.
todo x
2. f alcanza (o tiene) un valor m aximo local (mnimo local) en x0 sobre B si existe r > 0 tal que
x) f (
f ( x0 ) f (
x0 ) (f ( B Br (
x)) para todo x x0 ).
Con respecto a las definiciones anteriores es importante hacer dos observaciones; una, que todo punto x0
en donde una funci on f alcance un valor maximo (mnimo) sobre un conjunto B, necesariamente en ese mismo
punto la funci on f alcanza (o tiene) un valor maximo local (mnimo local) sobre B, pero no recprocamente,
es decir, si f alcanza en x
0 un valor maximo local (mnimo local) sobre B, este no es necesariamente maximo
(mnimo) sobre todo B (ver figura 4.12).
La segunda observaci on es que, si B es un conjunto abierto, entonces f alcanza en x 0 un valor maximo
local (mnimo local) sobre B si y solo si existe r > 0 tal que f ( x) f ( x0 ) f (
x0 ) (f ( x)) para todo
Br (
x x0 ) B.
Y justo el primer resultado importante que vamos a probar en esta secci on tiene que ver con los puntos
en los que una funci on f alcanza un valor maximo (o mnimo) local sobre un conjunto abierto. Si en un
punto x0 , ademas de satisfacer la propiedad anterior, f tambien es derivable, entonces la derivada en x0
(Df (x0 )) tiene que ser la funci
on lineal constante 0 (como seguramente el lector ya est a observando, este
resultado generaliza lo que sucede para las funciones de R en R).
J. P
aez 192
4.6. M
aximos y mnimos Captulo 4. La derivada de funciones de Rn en R
x
0
x
1
Figura 4.12: En el punto x0 la funcion f tiene un maximo local pero no global, y en el punto x
1 tiene un maximo
local que tambien es global.
Proposici on 4.47 Sean f : U Rn R (U abierto) y x0 U . Si f alcanza en x 0 un valor maximo local

(mnimo local) sobre U y f es derivable en x
0 entonces Df ( x0 ) 0).
x0 ) es la constante cero (Df (
Demostraci on. Dado que la derivada de f en x 0 est

a representada (en un sistema coordenado ortonormal)
f
por la matriz de 1 n cuya iesima entrada est a dada por x i
(
x0 ), bastara con demostrar que cada uno de
estos n
umeros es 0.
Suponiendo que f alcanza en x 0 un valor maximo local sobre U (el caso del mnimo local se prueba de
manera analoga), sea r > 0 tal que f ( x) f (
x0 ) para todo x Br ( x0 ) U . Por tanto, si |h| < r tenemos
que f ( ei ) f (
x0 + h x0 ) de tal forma que
f ( ei ) f (
x0 + h x0 ) 0
Ahora, si tomamos h tal que 0 < h < r entonces
f ( ei ) f (
x0 + h x0 )
0
h
y por lo tanto
f f ( ei ) f (
x0 + h x0 )
(
x0 ) = lim
xi h0 h
0
Por otra parte, si tomamos h tal que r < h < 0 entonces
f ( ei ) f (
x0 + h x0 )
0
h
de donde
f ( ei ) f (
x0 + h x0 )
0 lim
h0 h
f
= (
x0 )
xi
de modo que
f
0 x0 ) 0
(
xi
193 J. P
aez
aximos y mnimos
y por lo tanto
f
(
x0 ) = 0
xi
Como seguramente el lector ya habr a notado, si bien la proposicion anterior es importante, esta solo nos
proporciona una condicion necesaria al hecho de que una funci on alcance en x0 un valor maximo (o mnimo)
local. Y como suele suceder con frecuencia, esta condicion no es suficiente.
En efecto, el hecho de que la derivada de una funcion f en un punto x0 sea la constante 0, no es suficiente
para que podamos asegurar que f alcance en x 0 un valor maximo (o mnimo) local.
Antes de dar un ejemplo que ilustra este hecho, mencionaremos que a pesar de todo, aquellos puntos en
que la derivada de una funci on es la constante 0 resultan ser muy importantes y reciben un nombre especial:
puntos crticos, lo cual dejamos plasmado en la siguiente
Definicion 4.48 Sean f : U Rn R y x 0 U . Si f es derivable en x0 y la derivada de f en x

0 (Df (
x0 ))
es la constante 0, decimos que x
0 es un punto crtico de f .
Con base en la definicion anterior, lo que mostraremos en el siguiente ejemplo es que los puntos crticos
de una funcion f no tienen por que ser necesariamente puntos en los que f alcance un valor maximo (o
mnimo) local.
Ejemplo 4.49 Sea f : R2 R dada por la expresi

on
f (x, y) = x2 y 2
Dado que
f f
(x, y) = 2x y (x, y) = 2y
x y
se tiene que el u
nico punto crtico de f es el (0, 0).
Sin embargo, para cualquier r > 0 se tiene que: si 0 < |x| < r entonces (x, 0) Br ((0, 0)) y
f (x, 0) = x2
>0
= f (0, 0)
Por otra parte, si 0 < |y| < r entonces (0, y) Br ((0, 0)) y
f (0, y) = y 2
<0
= f (0, 0)
lo que demuestra que f no tiene un m

aximo local ni un mnimo local en el (0, 0) (ver figura 4.13 (a)).
Aquellos puntos crticos en los que una funci on no tiene un maximo local o un mnimo local, y justo por
el aspecto geometrico del ejemplo anterior en una vecindad del (0, 0) (el de una silla de montar), reciben el
nombre de punto silla, aunque no todos los puntos silla tienen este aspecto.
Por ejemplo para la funci on f (x, y) = x3 , todos sus puntos crticos (los puntos de la forma (0, y)) son
puntos silla en el sentido de que en ellos la funci on f no tiene un maximo local o un mnimo local. Sin
embargo, geometricamente la funci on f no tiene el aspecto de una silla de montar (ver figura 4.13 (b)).
El ejemplo anterior, y el hecho de que la proposicion 4.47 es valida para maximos o mnimos locales,
nos plantea el problema de contar con un criterio que nos permita clasificar a los puntos crticos de una
funcion.
Lo que haremos a continuacion sera desarrollar un criterio analogo al criterio de la segunda derivada para
la clasificacion de puntos crticos de funciones de R en R, pero para ello sera necesario introducir el concepto
(que tomaremos prestado nuevamente del Algebra Lineal!) de: forma cuadratica.
J. P
aez 194
4.6. M
(a) (b)
Figura 4.13: La funcion f (x, y) = x2 y 2 (figura (a)) tiene un punto silla en el punto (0, 0), y la funcion
f (x, y) = x3 (figura (b)) tiene puntos silla en los puntos de la forma (0, y).
De acuerdo con el problema 27 (que es una consecuencia del teorema de Taylor), si f : U Rn R es una
funci 2
C en U , x0 U y r > 0 son tales que Br (
on de clase x0 ) U , sabemos que si h = (h1 , . . . , hn ) Rn

es tal que h < r, entonces
f ( = P2,f,x (
x0 + h)
0 x0 + h) + R2,f, x0 + h)
x0 (
n n
X f 1 X 2f
= f (
x0 ) + (
x0 )hi + x0 )hi hj + R2,f,x0 (
( x0 + h)
i=1
xi 2 i,j=1
xj xi
en donde
x0 + h)
R2,f,x0 (
lim 2 =0

h0
h
de modo que, si x
0 es un punto crtico de f , se tiene que
n
1 X 2f
x0 + h) f (
f ( x0 ) = x0 )hi hj + R2,f,x0 (
( x0 + h)
2 i,j=1 xj xi
De esta u
ltima identidad, nos detendremos a estudiar con detalle a la expresion
n
X 2f
(
x0 )hi hj (4.42)
i,j=1
xj xi
y lo primero que haremos notar es que se puede escribir en foma matricial, de la siguiente manera

n h1
2
X f
x0 )hi hj = h1 hn A ...

(
i,j=1
xj xi
hn
en donde la matriz A es
2 f 2f
x21
(
x0 ) xn x1 (
x0 )

A= .. .. ..
(4.43)
. . .
2 f 2
f
x1 xn (
x0 ) x2 ( x0 )
n
195 J. P
aez
aximos y mnimos
La ventaja de escribir a la expresion 4.42 en forma matricial es que nos permite relacionarla con un

concepto del Algebra Lineal que est
a muy bien estudiado: las formas cuadr aticas.
Las formas cuadraticas en Rn son (adem as de la funci
on constante 0, que es la u nica forma cuadratica
que es constante), las funciones polinomiales de las coordenadas x1 , . . . , xn que tienen la particularidad de
que todos los monomios que la forman son expresiones de grado 2.
Por ejemplo, en el caso de R2 , cualquier forma cuadratica en las variables x, y se escribe como
ax2 + 2bxy + cy 2 (4.44)
la cual, como en el caso de la expresion 4.42, se puede escribir en forma matricial de la siguiente manera:

2 2
a b t
ax + 2bxy + cy = x y x y
b c

a b x
= x y
b c y
En general, toda forma cuadratica en Rn se identifica con una matriz A de n n con entradas reales
(A M22 (R)) la cual es simetrica, es decir, que es igual a su traspuesta (A = At ). Y recprocamente, si A
es una de estas matrices, la funci on F : Rn R definida como
t
F (x1 , . . . , xn ) = x1 xn A x1 xn

x1
.
= x1 xn A ..
xn
claramente define una forma cuadratica en Rn .
A la matriz A dada por 4.43 se le conoce como la matriz hessiana 2 de f en x 0 , que de aqu en adelante
denotaremos por Hf ( x0 ), y a la forma cuadratica asociada a esta le llamaremos la hessiana de f en x0 . La
0 lo denotaremos por Hfx0 de tal forma que si x
hessiana de f en x = (x1 , . . . , xn ), entonces
x) = Hfx0 (x1 , . . . , xn )
Hfx0 (
t
= x1 xn Hf ( x0 ) x1 xn

x1
x0 ) ...

= x1 xn Hf (
xn
Hay una clasificacion de las formas cuadraticas que en particular resultara muy importante para el
problema de la identificaci on de los puntos crticos de una funci on. Se dice que la forma cuadratica F :
Rn R es semipositiva (an alogamente seminegativa) si F ( x) 0 (F (x) 0) para toda x Rn y si F
satisface la condicion de que F (x) = 0 si y solo si x
= 0, entonces decimos que F es no degenerada.
Lo interesante de esta clasificacion de las formas cuadraticas es que, con base en ella, podremos establecer
criterios que nos permita determinar si los puntos crticos de una funci on son puntos en los que esta alcanza
un valor maximo o mnimo, locales en ambos casos.
En efecto, lo siguiente que haremos sera probar un resultado en el que, dependiendo de que tipo de forma
cuadratica resulte ser la hessiana de f en un punto x 0 , podremos asegurar que f tiene un cierto tipo de
valor extremo (m aximo o mnimo local). Para ello, sera necesario probar antes un sencillo resultado que
formularemos en el siguiente
Lema 4.50 Si F : Rn R es una forma cuadr atica semipositiva (seminegativa) y no degenerada asociada
a una matriz A (es decir que F ( xt ) entonces existe M > 0 (m < 0) tal que
x) = xA
2 2
M
F (h)
h m
(F (h)
h )
Rn .
para toda h
2 Llamada as en honor de Ludwig Otto Hesse (22 abril 1811 - 4 agosto 1874) quien fue un matem
atico alem
an. Hesse naci
o
en K onigsberg, Prussia, y muri
o en Munich, Bavaria. Trabajo en la teora de invariantes.
J. P
aez 196
4.6. M
Demostraci on. Dado que S n1 = { x Rn | k

xk = 1} es un conjunto cerrado y acotado (compacto) y toda
forma cuadratica es una funci
on continua, por el corolario 2.51 del captulo 2 sabemos que existe un valor
mmino para F (si F es semipositiva) que llamaremos M > 0 (un valor maximo para F , si F es seminegativa,
que llamaremos m < 0) tal que
x) M
F ( x) m)
(F (
Rn .
para toda x
Por tanto, dado 6 0 y
que las desigualdades que deseamos probar se satisfacen si h = 0, si tomamos h =
hacemos x h
= h/
entonces x S
n1
y por lo tanto
M F (
x)
= xAxt
t

h h
= A

h h
1
= 2 hA h
t

h
1
= 2 F (h)

h
es decir, se tiene que

2
M
F (h)
h
2
Rn (an
para toda h m
alogamente se prueba que F (h) h Rn ).
para toda h
Una vez hecho todo lo anterior, ahora estamos en condiciones de formular un resultado que nos permitira
determinar si un punto crtico x
0 de una funci
on f es un punto en donde esta alcanza un maximo local o
un mnimo local. S
olo probaremos uno de estos casos y como es de imaginar, el otro caso quedara como un
Proposici on 4.51 Sea f : U Rn R de clase C 2 en U , y x
0 U un punto crtico de f . Se satisface lo
siguiente:
1. si la hessiana de f en x 0 es una forma cuadr
atica semipositiva y no degenerada entonces f tiene un
mnimo local en x0 , y
2. si la hessiana de f en x
0 es una forma cuadr
atica seminegativa y no degenerada entonces f tiene un
maximo local en x0 .
Demostraci on. Solo probaremos el inciso 1. Sea r0 > 0 tal que Br0 ( x0 ) U . Como ya habamos
mencionado anteriormente, por el problema 27 sabemos que, como f : U Rn R es una funcion de clase
0 U es un punto crtico de f , si h = (h1 , . . . , hn ) R2 es tal que h

C 2 en U y x < r0 , entonces
f ( = P2,f,x (
x0 + h)
0 x0 + h) + R2,f,x0 (
x0 + h)
n n
X f 1 X 2f
= f (
x0 ) + (
x0 )hi + x0 )hi hj + R2,f,x0 (
( x0 + h)
i=1
xi 2 i,j=1 xj xi
1 + R2,f,x (
= f (
x0 ) + Hfx0 (h) 0 x0 + h)
2
en donde
x0 + h)
R2,f,x0 (
lim 2 =0 (4.45)

h0
h
197 J. P
aez
aximos y mnimos
Ahora, dado que Hfx0 es semipositiva, por el lema 4.50 sabemos que existe M > 0 tal que
2
M
Hfx0 (h) h

Rn . Por tanto, por 4.45 sabemos que existe > 0 tal que si
para toda h h
< entonces

x0 + h)

R2,f,x0 ( M
2 <
2
h
y en particular que
M R2,f,x0 (
x0 + h)
0< + 2
2
h

Por lo tanto, si r = min{, r0 } y 0 < h < r, tendremos que
f ( 1
f (
x0 + h) x0 ) 0 (h)
2 Hfx + R2,f,x0 (
x0 + h)
2 = 2

h h

1 Hfx0 (h) R2,f,x0 (
x0 + h)
= 2 + 2
2
h h
M R2,f,x0 (
x0 + h)
+ 2
2
h
>0

x0 ) f (
f (
x0 + h)

si h < r, lo que demuestra que f tiene un mnimo local en x0 .

Como el lector habr a notado, el resultado anterior es una especie de equivalente (en Rn ) al criterio
de la segunda derivada para la clasificacion de puntos crticos de funciones de R en R, y como sucede en
ese caso, su recproco no se cumple, lo que ilustramos en el siguiente
f (x, y) = x4 + y 4
para cada (x, y) R2 . Como es f

acil de verificar (ver figura 4.14), el (0, 0) es el punto en el que f alcanza
su mnimo global (y por tanto tambien local) y dado que
2f 2f 2f
(x, y) = (x, y) = (x, y) = 0
x2 x2 yx
para toda (x, y) R2 , en particular se tiene que la hessiana de f en el (0, 0) es la funci

on constante 0, la
cual es la mas degenerada (en el sentido matem atico de la palabra!) de todas las formas cuadr
aticas.
A pesar del ejemplo anterior, para la proposicion 4.51 se puede establecer una proposicion casi-recproca.
Como seguramente el lector recordara, para el caso de funciones de R en R se sabe que si f tiene un maximo
(mnimo) local en un punto x0 , y f (x0 ) existe, entonces se debe cumplir que f (x0 ) 0 (f (x0 ) 0)
(resultado que por cierto nos sera de mucha utilidad en la prueba de nuestra siguiente proposicion).
J. P
aez 198
4.6. M
Y
b
Figura 4.14: La funcion f (x, y) = x4 + y 4 tiene un mnimo global (y por tanto tambien local) en el punto (0, 0),
y su forma cuadratica asociada en ese punto (su hessiana) es degenerada.
Pues bien, para una funci on f de Rn en R se extiende el resultado anterior en el sentido de que, si f
tiene un maximo (o un mnimo) local en un punto x 0 , entonces la hessiana de f en x
0 sera seminegativa (o
semipositiva), es decir, lo u
nico que no podremos asegurar es que la hessiana es no degenerada (as como en
el caso real no podemos asugurar que f (x0 ) no sea 0).
Proposici on 4.53 Sea f : U Rn R de clase C 2 en U , y x

0 U un punto crtico de f . Se satisface lo
siguiente:
1. si f tiene un mnimo local en x

0 entonces la hessiana de f en x
atica semipositiva,
y
2. si f tiene un m
aximo local en x
0 entonces la hessiana de f en x
atica seminegativa.
Demostraci on. S x0 ) U , y u
olo probaremos el inciso 2. Sean, r0 > 0 tal que Br0 ( = (u1 , . . . , un ) Rn tal
uk = 1. Definimos : (r0 , r0 ) R R como (t) = x
que k u y g : (r0 , r0 ) R R como g = f .
0 + t
Notese que, por la proposicion 4.29 sabemos que g es derivable en su dominio y que
g (t) = f ((t)) (t)

n
X f
= ((t))ui
i=1
xi
y dado que f es de clase C 2 en U , por la misma proposicion 4.29 (aplicada a cada miembro de la suma
anterior), se tiene

n n 2
X X f
g (t) = ((t))uj ui
i=1 j=1
xj x i
n
X 2f
= ((t))ui uj
i,j=1
xj xi
de tal forma que

n
X 2f
g (0) = ((0))ui uj
i,j=1
xj xi
n
X 2f
= (
x0 )ui uj
i,j=1
xj xi
199 J. P
aez
aximos y mnimos
= Hfx0 (
u)
Por otra parte, es sencillo demostrar (problema 34) que, como f tiene un maximo local en x 0 , entonces g
tiene un maximo local en t = 0, de tal forma que, por el resultado para funciones de R en R que mencionamos
previamente a esta proposicion, se debe tener que
u) = g (0)
Hfx0 (
0
6=
Por lo tanto, si x Rn , x 0, si hacemos u=x / k
xk se tendra que

x

Hfx0 (
u) = Hfx0
k
xk
1
= Hfx0 (
x)
kxk2
0
x) 0 para toda x Rn , lo que prueba que la hessiana de f en x

de donde Hfx0 ( 0 es seminegativa.
Aun y cuando hasta aqu todo parece funcionar muy bien, no podemos dejar de mencionar que el problema
de determinar si una funci on f tiene un maximo o un mnimo local (o ninguno de estos dos) en un punto
crtico x
0 , lo trasladamos al problema de determinar si la hessiana de f en este punto x0 es una funci
on
cudr atica semipositiva o seminegativa (o ninguna de estas dos).
En la siguiente seccion mencionaremos (sin probar) algunas condiciones necesarias y suficientes para
que una forma cuadratica F en Rn (en terminos de su matriz asociada) sea semipositiva o seminegativa, y

no degenerada. Estas condiciones necesarias y suficientes son un tema importante de Algebra Lineal que
desafortunadamente no podemos incluir en este texto (pero que el lector interesado puede consultar en [2])
para saber mas de este tema).
Sin embargo, para que el amable lector no se sienta muy desalentado por esta ausencia, mostraremos
y probaremos cuales son estas condiciones para el caso particular de las formas cuadraticas en R2 , las que
dejaremos plasmadas en la siguiente
on 4.54 Sea F : R2 R la forma cuadr

Proposici atica asociada a la matriz

a b
A=
b c
y que est
a dada por la expresi
on
t
F (x, y) = x y A x y

a b x
= x y
b c y
= ax2 + 2bxy + cy 2
olo si a > 0 (a < 0) y ac b2 = det(A) > 0.

F es semipositiva (seminegativa) y no degenerada si y s
Demostraci on. Supongamos que F es semipositiva (el caso en que sea seminegativa se prueba de manera
analoga) y no degenerada. Por esta u
ltima propiedad, dado que
a = F (1, 0) > 0
concluimos que a > 0. Por tanto, podemos reescribir a F como
F (x, y) = ax2 + 2bxy + cy 2
J. P
aez 200
4.6. M
2
b b2
=a x+ y + c y2
a a
2
b ac b2
=a x+ y + y2 (4.46)
a a
de tal forma que
0 < F (b/a, 1)
ac b2
=
a
y por lo tanto ac b2 > 0.
Supongamos ahora que a > 0 y ac b2 > 0. De la identidad 4.46 concluimos que F (x, y) 0 para toda
(x, y) R2 , es decir, F es semipositiva. Ahora, si (x, y) es tal que F (x, y) = 0, se tiene que

ac b2
y2 = 0
a
y
2
b
x+ y =0
a
de tal forma que de la primera identidad concluimos que y = 0, y sustituyendo esto u
ltimo en la segunda
identidad, concluimos que x = 0. Esto prueba que F es no degenerada.
Como una consecuencia inmediata de la proposicion anterior y de la proposicion 4.51, podemos formular
el siguiente resultado el cual establece criterios muy concretos para determinar si un punto crtico de una
funcion de R2 en R es un maximo o mnimo local.
on 4.55 Sea f : U R2 R de clase C 2 en U , y x0 U un punto crtico de f .

Proposici
1. Si 2
2f 2f 2f 2f
(
x0 ) > 0 y (
x 0 ) x0 )
( (
x0 ) > 0
x2 x2 y 2 yx
entonces f tiene un mnimo local en x
0 , y
2. si 2
2f 2f 2f 2f
(
x0 ) < 0 y (
x 0 ) x0 )
( (
x0 ) > 0
x2 x2 y 2 yx
entonces f tiene un m
aximo local en x
0 .
Antes de hacer unos breves comentarios adicionales acerca de las formas cuadraticas, daremos algunos
ejemplos que ilustren el trabajo realizado hasta ahora sobre el tema de maximos y mnimos.
Ejemplo 4.56
1. Sea f : R2 R dada por

f (x, y) = (x + 1)2 + y 2

y B = (x, y) R2 | k(x, y)k 2 .
De acuerdo a lo realizado hasta este momento, si los puntos en los que f alcanza un valor m aximo o
mnimo local (o global) sobre B, se encuentran en el interior de B, entonces deben ser puntos crticos
de f de modo que lo primero que se tendr a que hacer sera localizar este tipo de puntos.
Para lograr esto, hay que resolver las ecuaciones
f f
(x, y) = 0 y (x, y) = 0
x y
201 J. P
aez
aximos y mnimos
que en este caso son

2(x + 1) = 0 y 2y = 0
nico punto crtico de f (en todo R2 ).

de donde obtenemos que (1, 0) es el u
Por otra parte, dado que f (x, y) 0 para toda (x, y) R2 , que f (1, 0) = 0 y (1, 0) B, sin
necesidad de mayores c alculos podemos concluir que f alcanza su valor mnimo sobre B (de hecho,
sobre todo R2 ) en el punto (1, 0) y que dicho valor mnimo es 0.
En cuanto al valor maximo de f sobre B, dado que f no tiene m as puntos crticos, este valor m
aximo
se debe de alcanzar en alg
un punto de la frontera de B, es decir, sobre el conjunto

Fr(B) = (x, y) R2 | k(x, y)k = 2
Dado que para este tipo de conjuntos (cerrados con interior vaco) no hemos desarrollado ninguna
herramienta que nos permita resolver este problema, para este caso particular recurriremos al siguiente
hecho: la Fr(B) se puede obtener como la imagen de una funci on de R en R2 . En efecto, notese que
2
on : [0, 2] R R dada por
la funci
(t) = (2 cos(t), 2 sen(t))
on del conjunto Fr(B), es decir, ([0, 2]) = Fr(B).
on g : [0, 2] R R como
Aprovechando este hecho, si definimos la funci
g(t) = (f )(t)
= f ((t))
= (2 cos(t) + 1)2 + 4 sen2 (t)
= 4 cos(t) + 5
y encontramos los puntos del dominio de g en los que esta funci on alcanza sus valores m
aximo y
mnimo, podremos entonces localizar los valores m
aximo y mnimo de f sobre la Fr(B).
Como ya se sabe, hay que proceder de manera an aloga a lo que estamos haciendo con f ; es decir,
hay que localizar los puntos crticos de g en el intervalo abierto (0, 2), determinar si en estos puntos
crticos g alcanza un m
aximo o mnimo local, y comparar el valor de g en estos puntos con los valores
de g en los extremos del intervalo [0, 2] (que son la frontera de [0, 2]).
De esta forma, lo primero que hay que localizar son los valores de t (0, 2) para los cuales se cumple
que
g (t) = 4 sen(t)
=0
olo sucede para t = . Dado que g(t) 1 para toda t [0, 2] y que g() = 1,
y que claramente s
concluimos que g alcanza su valor mnimo en t = y que este valor mnimo es 1.
Finalmente, dado que g(0) = g(2) = 9 concluimos que el valor maximo de g sobre el intervalo [0, 2]
es 9, y que este valor lo alcanza en t = 0 y t = 2 (es decir, en la frontera de su dominio). De
todo lo anterior concluimos entonces que el valor mnimo de f sobre Fr(B) es 1 y que este valor lo
alcanza en el punto () = (2, 0), y que su valor m aximo sobre la Fr(B) lo alcanza en el punto
(0) = (2) = (2, 0) y que este valor m
aximo es 9.
Por lo tanto, comparando los valores de f en los puntos crticos que est an en el interior de B
(f (1, 0) = 0), junto con los valores m
aximo y mnimo de f sobre la Fr(B) (f (2, 0) = 1 y f (2, 0) = 9),
concluimos que los valores m aximo y mnimo de f sobre B son 0 y 9, y que estos valores se alcanzan
en los puntos (1, 0) y (2, 0), respectivamente (ver figura 4.15).
J. P
aez 202
4.6. M
(2, 0)
(1, 0)
(2, 0)
Figura
maximo y mnimo de la funcion f (x, y) = (x + 1)2 + y 2 sobre el conjunto B =
4.15: Los valores
2
(x, y) R | k(x, y)k 2 se alcanzan en los puntos (2, 0) y (1, 0), respectivamente.
2. Sea f : R2 R dada por

f (x, y) = x(x 1)2 + y 2

y B = (x, y) R2 | k(x, y)k 1 .
Nuevamente, para determinar los puntos en los que f alcanza un valor m aximo o mnimo local (o
global) sobre B, procederemos como en el inciso anterior. Primero encontraremos los puntos crticos
de f , para lo cual hay que resolver las ecuaciones
f
(x, y) = (x 1)2 + 2x(x 1)
x
= (x 1)(3x 1)
=0
y
f
(x, y) = 2y
y
=0
y cuyas soluciones son las parejas (1, 0) y (1/3, 0), en donde este u
ltimo punto es el u
nico que queda
dentro del interior de B.
Ahora ser
a necesario calcular las segundas derivadas parciales de f , las cuales resultan ser:
2f
(x, y) = 6x 4
x2
2
f
(x, y) = 0
yx
2f
(x, y) = 2
y 2
de modo que para el punto crtico (1/3, 0) se tiene que
2f
(1/3, 0) = 2
x2
2f
(1/3, 0) = 0
yx
203 J. P
aez
aximos y mnimos
2f
(1/3, 0) = 2
y 2
es decir
2
2f 2f 2f
2
(1/3, 0) 2 (1/3, 0) (1/3, 0) = 4
x y yx
<0
y por lo tanto, por el problema 41 (o el problema 40), concluimos que f tiene un punto silla en el
(1/3, 0).
Como en el inciso anterior, nos resta localizar los puntos en lo que f alcanza sus valores m
aximo y
mnimo sobre la frontera del conjunto B, que ahora es el conjunto

Fr(B) = (x, y) R2 | k(x, y)k = 1
on : [0, 2] R R2 dada por

y que, como en el inciso anterior, podemos parametrizar por la funci
(t) = (cos(t), sen(t))
Como en el caso anterior, definimos g : [0, 2] R R como
g(t) = (f )(t)
= f ((t))
= cos(t)(cos(t) 1)2 + sen2 (t)
de tal forma que
g (t) = f ((t)) (t)

= (cos(t) 1)(3 cos(t) 1)( sen(t)) + 2 sen(t) cos(t)
= sen(t) (2 cos(t) (cos(t) 1)(3 cos(t) 1))

= sen(t) 3 cos2 (t) + 6 cos(t) 1

Dado que la races de la ecuaci
on cuadr atica 3x2 + 6x 1 = 0 son 1 6/3 y 1 + 6/3, concluimos
que los puntos crticosde g en el intervalo abierto (0, 2) son , t0 , y2 t0 , en donde t0 (0, ) es
tal que cos(t0 ) = 1 6/3. Por lo tanto, como g(0) = 0, g(t0 ) = 4 6/9 = g(2 t0 ), g() = 4 y
g(2) = 0, concluimos que f alcanza su valor m aximo sobre la Fr(B) en los puntos

q q
(t0 ) = 1 6/3, 2( 6 1)/3 , (2 t0 ) = 1 6/3, 2( 6 1)/3

y este maximo es 4 6/9, mientras que su valor mnimo lo alcanza en el punto () = (1, 0) y este
valor es 4.
En resumen, comparando los valores de f en los puntos

q q
(1, 0), 1 6/3, 2( 6 1)/3 , 1 6/3, 2( 6 1)/3 , (1, 0)
(el punto crtico (1/3, 0) no lo consideramos puesto que ah la funci

on f tiene un punto silla), con-
cluimos que el valor mnimo de f sobre el conjunto B es 4 y lo alcanza en el punto (1, 0), mientras
que su valor m aximo es 4 6/9 y lo alcanza en los puntos

q q
1 6/3, 2( 6 1)/3 y 1 6/3, 2( 6 1)/3 .
J. P
aez 204
4.6. M
4.6.1 Breve comentario sobre formas cuadr

aticas
A fin de justificar intuitivamente el resultado mas conocido en el cual se establece (para el caso general
en Rn ) cuando una forma cuadratica F asociada a una matriz A es semipositiva (o seminegativa) y no
degenerada, desarrollaremos las siguientes ideas.
Sin lugar a dudas, las formas cuadraticas del tipo
F (x1 , . . . , xn ) = 1 x21 + + n x2n (4.47)
son las mas simples de analizar, pues es muy facil comprobar que F es una forma cuadratica semipositiva
(seminegativa) y no degenerada si y solo si i > 0 (i < 0) para cada i {1, . . . , n} (notese que F (
ei ) = i ).
Tambien es f
acil comprobar que

1 0
. .. .. x x t
F (x1 , . . . , xn ) = x1 xn .. . . 1 n
0 n
de tal manera que la matriz asociada a F es la matriz diagonal

1 0
D = ... .. ..

. .
0 n
Un hecho interesante de este tipo de matrices es que si definimos, para cada k {1, . . . , n},

1 0
Dk = ... .. ..

. .
0 k
entonces
det(Dk ) = 1 k
de tal forma que ahora podemos reformular la afirmaci on anterior de la siguiente manera: F es una forma
cuadratica semipositiva (seminegativa) y no degenerada si y solo si det(Dk ) > 0 (det(Dk ) < 0 si k es impar
y det(Dk ) > 0 si k es par) para cada k {1, . . . , n}.
La buena noticia es que este criterio (por medio de los determinantes de las submatrices Dk ) que se
cumple para el caso particular de F , se sigue cumpliendo en el caso general.
Es decir, si F : Rn R es una forma cuadratica que tiene asociada la matriz simetrica

a11 a1n
A = ... .. ..

. .
an1 ann
se prueba que: F es semipositiva (seminegativa) y no degenerada si y solo si det(Ak ) > 0 (det(Ak ) < 0 si k
es impar y det(Ak ) > 0 si k es par) para cada k {1, . . . , n}, en donde

a11 a1k
Ak = ... .. ..

. .
ak1 akk
Como el lector puede comprobar f acilmente, en la proposicion 4.54 se prueba esta afirmaci
on para el caso
n = 2.
Para reforzar un poco mas las ideas anteriores, resulta relevante mencionar un resultado muy importante

del Algebra Lineal (Teorema 6.20 de [2] ): si A Mnn (R) es una matriz simetrica entonces existe B
Mnn (R) una matriz ortonormal tal que BAB t es una matriz diagonal, es decir que

1 0
BAB t = ... .. ..

. . (4.48)
0 n
205 J. P
aez
aximos y mnimos
Como seguramente el lector recordara, las matrices ortonormales son justo las matrices que se obtienen
al (y que se usan para) realizar un cambio entre bases ortonormales de Rn .
De esta forma, y con base en este resultado, podemos afirmar que: si F : Rn R es una forma cuadratica
que tiene asociada la matriz simetrica A (en una base ortonormal {e1 , . . . , en }), es decir que
F (
x) = F (x1 , . . . , xn )
t
= x1 xn A x1 xn
e1 , . . . , en } tal que la matriz asociada a F en esta nueva base es una

entonces existe otra base ortonormal {
matriz diagonal.
En efecto, observe que si
b11 b1n
B = ... .. ..

. .
bn1 bnn
es la matriz ortonormal tal que BAB t es una matriz diagonal, entonces tomando
ei = bi1 e1 + + bin en
para i {1, . . . , n}, de acuerdo con la identidad 4.1, obtenemos que si x Rn tiene coordenadas (x1 , . . . , xn )

en la base { e1 , . . . , en } entonces sus coordenadas (x1 , . . . , xn ) en la base {
e1 , . . . , en }, est
an dadas por la
identidad

b11 b1n
x1 xn = x1 xn ... ..
..
. .
bn1 bnn

= x1 xn B
De esta manera, la forma cuadratica F expresada en terminos de las nuevas coordenadas x1 , . . . , xn se

escribe como
F (
x) = F (x1 , . . . , xn )
t
= x1 xn A x1 xn
t
= x1 xn B A x1 xn B
t
= x1 xn BAB t x1 xn

1 0
= x1 xn ... .. x x t
..
. . 1 n
0 k
2 2
= 1 (x1 ) + + n (xn )
e1 , . . . , en } la funci
es decir, en la base { on cuadratica F tiene la forma 4.47.
Sin duda que la parte medular de estas u ltimas ideas est
a en como, dada la matriz A, se encuentra la
matriz ortonormal B y los escalares 1 , . . . , n que satisfagan la identidad 4.48, pero este problema es justo
todo un tema de un curso de Algebra Lineal.
4.6.2 M
aximos y mnimos sobre restricciones
Como se muestra en el ejemplo 4.56, para localizar los puntos en donde una funci on f alcanza sus valores
extremos, no basta con encontrar sus puntos crticos (e incluso puede suceder que estos valores extremos no
se alcancen en este tipo de puntos, como sucede en inciso 2 de este mismo ejemplo).
on de Rn en R,
En la mayora de los casos, la localizacion de los valores extremos (globales) de una funci
requerira la localizacion de valores extremos sobre conjuntos m as peque
nos, cuya caracterstica principal
sera que son flacos (es decir, de interior vaco).
J. P
aez 206
4.6. M
En los incisos del ejemplo 4.56 estos conjuntos fueron

(x, y) R2 | k(x, y)k = 2 y (x, y) R2 | k(x, y)k = 1
que ademas de poderse parametrizar por una funci on de R en R2 (propiedad que fue fundamental para
encontrar los valores extremos sobre estos conjuntos), tambien tienen la propiedad de ser los conjuntos
de nivel de alguna funcion de R2 en R. De hecho, ambos conjuntos son conjuntos de nivel de la funci on
2 2
g(x, y) = x + y para c = 4 y c = 1, es decir N4 (g) y N1 (g), respectivamente.
Lo interesante de la observaci on anterior es que, si ahora nos fijamos en los conjuntos de nivel de la
on f (x, y) = (x + 1)2 + y 2 (la funci
funci on del inciso 1 del mencionado ejemplo) para c = 1 y c = 9 (que
son los valores extremos que alcanz o f sobre N4 (g), y que denotamos por N1 (f ) y N9 (f ), respectivamente),
notaremos que estos conjuntos de nivel se intersectan tangencialmente con el conjunto de nivel N4 (g) en
los puntos (2, 0) y (2, 0), que son justo los puntos en donde f alcanza estos valores extremos (ver figura
4.16).
N9 (f )
N4 (g)
b b b b
(4, 0) (2, 0) (2, 0)
N1 (f )
Figura 4.16: Los conjuntos de nivel N9 (f ) y N1 (f ) (de la funcion f (x, y) = (x + 1)2 + y 2 ) intersectan tangencial-
mente al conjunto de nivel N4 (g) (de la funcion g(x, y) = x2 +y 2 ) en los puntos (2, 0) y (2, 0), respectivamente.
Lo importante de este hecho geometrico es que este se puede traducir en una identidad (es decir, se
puede escribir en forma analtica).
En efecto, si ahora recordamos que el gradiente de una funci on en un punto x
0 siempre es normal al
conjunto de nivel que contiene a este punto, concluimos entonces que los vectores f (2, 0) y g(2, 0)
deben ser paralelos (es decir, uno debe ser m utiplo del otro), y lo mismo debe suceder para los vectores
f (2, 0) y g(2, 0), lo que es muy f
acil de verificar, ya que
f (x, y) = (2(x + 1), 2y) y g(x, y) = (2x, 2y)
para todo (x, y) R2 , de modo que
f (2, 0) = (6, 0) y g(2, 0) = (4, 0),
y
f (2, 0) = (2, 0) y g(2, 0) = (4, 0)
lo que comprueba que
3 1
f (2, 0) = g(2, 0) y f (2, 0) = g(2, 0)
2 2
La discusi
on anterior parece sugerir lo siguienteo: si tenemos una funci
on f para la cual queremos calcular
sus valores extremos sobre un conjunto de nivel de una funci on g (digamos Nc (g)), y localizar los puntos de
este conjunto en los cuales alcanza estos valores extremos, es suficiente con encontrar los puntos x Nc (g)
en los cuales se satisface que f (
x) y g( x) son paralelos.
207 J. P
aez
aximos y mnimos
Aprovechando que ya sabemos cuales son estos puntos para las funciones f y g del inciso 2 del ejemplo
4.56, sigamos el procedimiento descrito en el p
arrafo anterior y veamos si llegamos a las mismas soluciones.
Manos a la obra!
Como f (x, y) = x(x 1)2 + y 2 y g(x, y) = x2 + y 2 se tiene que
f (x, y) = ((x 1)2 + 2x(x 1), 2y)

= ((x 1)(3x 1), 2y)
y
g(x, y) = (2x, 2y)
de modo que nuestro problema es localizar las parejas (x, y) N1 (g) para las cuales se satisfaga que
f (x, y) = g(x, y)
para alguna R.
Lo anterior se traduce en encontrar las parejas (x, y) R2 y los n
umeros R que sesatisfagan las
siguientes ecuaciones:
f g
(x, y) = (x, y)
x x
f g
(x, y) = (x, y)
y y
g(x, y) = c
que en nuestro caso se traducen en el sistema de ecuaciones
(x 1)(3x 1) = 2x (1)
2y = 2y (2)
2 2
x +y =1 (3)
que en principio se debiera poder resolver, pues es un sistema de tres ecuaciones con tres incognitas (x, y y
).
Empecemos por observar que, si alguna solucion de las ecuaciones anteriores fuera tal que y 6= 0, entonces
de la ecuaci
on (2) deducimos que = 1, de modo que la ecuaci on (1) se convierte en la ecuacion cuadratica
(en la variable x)
3x2 6x + 1 = 0
cuyas soluciones son
p
6+62 4(3)(1)
x1 =
2(3)

6
=1+
3
y
p
662 4(3)(1)
x2 =
2(3)

6
=1
3
Si sustituimos estas soluciones en la ecuaci on (3), concluimos que solo podemos tomar el segundo valor,
obteniendo las siguientes soluciones a nuestro sistema original
s

6 2( 6 1)
(x, y) = 1 , con =1
3 3
J. P
aez 208
4.6. M
y s

6 2( 6 1)
(x, y) = 1
, con =1
3 3
Si ahora suponemos que tenemos una solucion de nuestro sistema de ecuaciones con y = 0, de la ecuaci
on
(3) de este sistema concluimos que x = 1 o x = 1, lo cual, de la ecuaci
on (1) nos conduce a las soluciones
(x, y) = (1, 0) con =0
y
(x, y) = (1, 0) con =4
Como seguramente el lector ya se percat o, con este procedimiento obtuvimos los mismos puntos que
obtuvimos anteriormente, y la buena noticia es que el procedimiento sigue siendo valido en cualquier Rn .
Es decir, aseguramos que: si f es una funci on derivable sobre un conjunto de nivel Nc (g) de una funci on
0 Nc (g) es un punto en el que la funci
derivable g, y x on f tiene un maximo o mnimo local (sobre Nc (g)),
entonces se debe cumplir que f ( x0 ) son vectores paralelos, es decir, que existe R tal que
x0 ) y g(
f (
x0 ) = g(
x0 )
La importancia de la afirmaci
on anterior es que, si deseamos localizar los puntos en los que una funcion
f alcanza sus valores extremos (incluso locales) sobre un conjunto de nivel Nc (g) de una funci on derivable
g, basta con encontrar los puntos de este conjunto para los cuales se satisface que los gradientes de f y de g
son paralelos.
on anterior con un ejemplo geometrico (en R3 ) que sin duda el lector conoce (y
Ilustraremos la afirmaci
sabe la respuesta): dado un plano P cuya ecuaci on esta dada por
Ax + By + Cz + D = 0
(con A2 + B 2 + C 2 > 0) y un punto x 0 = (x0 , y0 , z0 ) R3 , calcular la distacia del punto x0 al plano P .

Como sabemos, la distacia del punto x0 al plano P se obtiene como la mnima distacia entre el punto
x
0 y los puntos del plano P , es decir que nuestro problema lo podemos plantear de la siguiente manera:
consideramos la funci
on d que nos da la distancia entre el punto x 0 y cualquier otro punto x = (x, y, z) R3 ,
es decir p
d(x, y, z) = (x x0 )2 + (y y0 )2 + (z z0 )2
y nos planteamos el problema de localizar el mnimo valor de la funci
on d sobre el conjunto N0 (g), en donde
g la definimos como
g(x, y, z) = Ax + By + Cz + D
Para simplificar los c
alculos, y dado que el punto en N0 (g) en el que se minimiza la distacia con x
0 es el
mismo en el que se minimiza la distacia al cuadrado, trabajaremos con la funci on
f (x, y, z) = d2 (x, y, z)
= (x x0 )2 + (y y0 )2 + (z z0 )2
(esta es una simplificaci

on que el lector debera de tener siempre muy presente).
Dado que
f (x, y, z) = (2(x x0 ), 2(y y0 ), 2(z z0 ))
y
g(x, y, z) = (A, B, C)
nuestro problema se reduce a resolver el sistema de ecuaciones
2(x x0 ) = A
2(y y0 ) = B
209 J. P
aez
aximos y mnimos
2(z z0 ) = C
Ax + By + Cz + D = 0
De las primeras tres ecuaciones concluimos que
1
A + x0
x=
2
1
y = B + y0
2
1
z = C + z0
2
y si sustituimos estos valores en la cuarta ecuaci
on, obtenemos que

1 1 1
A A + x0 + B B + y0 + C C + z0 + D = 0
2 2 2
es decir que
2 (Ax0 + By0 + Cz0 + D)
= (4.49)
A2 + B 2 + C 2
Por lo tanto, sustituyendo en los valores despejados de x, y y z, el punto x p dado por la terna

Ax0 + By0 + Cz0 + D Ax0 + By0 + Cz0 + D Ax0 + By0 + Cz0 + D
p = x0 A
x , y 0 B , z 0 C
A2 + B 2 + C 2 A2 + B 2 + C 2 A2 + B 2 + C 2
Ax0 + By0 + Cz0 + D
=x 0 (A, B, C)
A2 + B 2 + C 2
es el u
nico punto del plano P para el cual se satisface que
f (
xp ) = g(
xp )
en donde est 0 P entonces xp = x
a dada por 4.49 (notese que, si x 0 , como era de esperarse!), de modo
que la distacia del punto x
0 al plano P estar
a dada por
q
d(
x0 , P ) = xp )
f (
= k
xp x
0 k

Ax0 + By0 + Cz0 + D
=
(A, B, C)
A2 + B 2 + C 2
|Ax0 + By0 + Cz0 + D|
=
k(A, B, C)k
|Ax0 + By0 + Cz0 + D|
=
A2 + B 2 + C 2
lo que sin duda el lector recordara muy bien de sus cursos de Geometra Analtica.
El ejemplo anterior no solo refuerza nuestra sospecha de que, si una funcion f alcanza un valor extremo
sobre un conjunto de nivel de otra funcion g en un punto x0 de este conjunto, entonces los vectores gradiente
de f y g en x
0 deben ser paralelos, sino que nos permite plantear un problema que nos conducira a formular
un resultado mas general que el descrito en el p arrafo anterior.
El problema ahora es el siguiente:
1. dada una recta l determinada por la interseccion de los planos P1 y P2 cuya ecuaci
on de cada uno de
ellos est
a dada por
A1 x + B1 y + C1 z + D1 = 0
A2 x + B2 y + C2 z + D2 = 0
respectivamente (con (A1 , B1 , C1 ) y (A2 , B2 , C2 ) vectores no paralelos (en particular diferentes de 0)

para que s determinen una recta), y
J. P
aez 210
4.6. M
0 = (x0 , y0 , z0 ) R3 ,
2. un punto x
calcular la distacia del punto x
0 a la recta l.
Como en el ejemplo anterior, usaremos la funcion que nos calcula la distacia al cuadrado entre el punto
x
0 y un punto de la recta l, y nuestra tarea sera localizar el punto de l en el que esta funci
on alcanza su
valor mnimo (con respecto a los puntos de la recta l).
Es decir, tomaremos la funcion
f (x, y, z) = d2 (x, y, z)
= (x x0 )2 + (y y0 )2 + (z z0 )2
y nuestro objetivo es localizar un punto xl del conjunto

S = (x, y, z) R3 | g1 (x, y, z) = 0, g2 (x, y, z) = 0
tal que f alcanza su valor mnimo (con respecto a los puntos de S) en x
l , en donde g1 y g2 est
an dadas por
g1 (x, y, z) = A1 x + B1 y + C1 z + D1
g2 (x, y, z) = A2 x + B2 y + C2 z + D2
Desde un punto de vista geometrico, si xl es el punto de la recta l que est
a mas cerca del punto x
0 , esto
significa que x
l es el u
nico punto de esta recta que pertenece al conjunto de nivel Nc (f ) de f , en donde
c = f (
xl )
2
= k
xl x
0 k

y Nc (f ) es la esfera de radio c con centro en x 0 . Dicho de otra forma, la recta l es tangente a la esfera
Nc (f ) en el punto xl .
Notese ahora que, si tomamos el vector que va de x0 a x l , que llamaremos v, este debe ser perpendicular
a la recta l, y si por otra parte recordamos que los vectores (A1 , B1 , C1 ) y (A2 , B2 , C2 ) son normales a los
planos P1 y P2 (que determinan a la recta l y que por lo tanto la contienen) tendremos que dichos vectores
tambien deber an ser perpendiculares a l (ver figura 4.17).
(A1 , B1 , C1 ) (A2 , B2 , C2 )
P1 l
P2
l
x
v
0
x
Figura 4.17: Dado que la recta l, que es la intersecci on de los planos P1 y P2 , es tangente en el punto x l a la
esfera con centro en x0 , los vectores v = xl x0 , (A1 , B1 , C1 ) y (A2 , B2 , C2 ) (los vectores normales a P1 y P2 ,
respectivamente) son perpendiculares a l, y por lo mismo pertenecen a un mismo plano.
Del razonamiento anterior concluimos que, como los vectores v, (A1 , B1 , C1 ) y (A2 , B2 , C2 ) son perpen-
diculares a la misma recta l, y estos son linealmente independientes, se debe cumplir que el vector v se puede
escribir como una combinaci on lineal de los vectores (A1 , B1 , C1 ) y (A2 , B2 , C2 ).
Finalmente, si ahora observamos:
211 J. P
aez
aximos y mnimos
1. que el vector (A1 , B1 , C1 ) coincide con ser el vector gradiente de g1 evaluado en cualquier punto del
plano P1 (en particular en x l ),
2. que lo mismo sucede con el vector (A2 , B2 , C2 ) y la funci
on g2 , y
3. que los vectores f (
xl ) y v son paralelos, pues ambos son normales a la esfera Nc (f )
concluimos que el vector f ( xl ) se debe poder expresar como una combinaci
on lineal de los vectores
g1 ( xl ), es decir, deben existir 1 , 2 R tales que
xl ) y g2 (
f (
xl ) = 1 g1 (
xl ) + 2 g2 (
xl )
Para aprovechar la discusi
on anterior, formularemos un resultado mas general que seguramente el lector
a intuyendo: si un conjunto S R3 es la interseccion de dos conjuntos de nivel (que sin perdida de
ya est
generalidad supondremos que son los conjuntos de nivel 0) de dos funciones (derivables) g1 y g2 , es decir que

S = (x, y, z) R3 | g1 (x, y, z) = 0, g2 (x, y, z) = 0
y x0 S es un punto tal que:
1. los vectores g1 (
x0 ) y g2 (
x0 ) son linealmente independientes, y
2. una funci
on f (derivable) alcanza un valor extremo (incluso local) en x
0 sobre (o con respecto a) S
entonces se debe cumplir que el vector f ( x0 ) se puede expresar como una combinaci
on lineal de los
vectores g1 ( x0 ), es decir, deben existir 1 , 2 R tales que
x0 ) y g2 (
f (
x0 ) = 1 g1 (
x0 ) + 2 g2 (
x0 )
Y si el lector ya est
a covencido de que el resultado anterior debe ser cierto, seguramente estar
a de acuerdo
en que su siguiente generalizacion (para funciones de Rn en R) tambien debe ser cierto: si g1 , . . . , gm : U
Rn R son m funciones de clase C 1 en U , con m < n, S Rn es el conjunto dado por
x U Rn | g1 (
S = { x) = 0, . . . , gm (
x) = 0}
y x0 S es un punto tal que:
1. los vectores g1 (
x0 ), . . . , gm (
x0 ) son linealmente independientes, y
on f : U Rn R de clase C 1 en U alcanza un valor extremo (incluso local) en x
2. una funci 0 sobre (o
con respecto a) S
entonces se debe cumplir que el vector f ( x0 ) se puede expresar como una combinaci
on lineal de los
vectores g1 ( x0 ), es decir, deben existir 1 , . . . , m R tales que
x0 ), . . . , gm (
f (
x0 ) = 1 g1 (
x0 ) + + m gm (
x0 )
Todo el trabajo que nos hemos tomado a lo largo de esta secci on ha sido con el u nico objetivo de llegar
al resultado anterior, el cual es conocido como el Teorema de los multiplicadores de Lagrange 3 .
Antes de formularlo de manera mas formal, conviene hacer algunas observaciones, empezando por su
nombre: el termino multiplicadores se refiere a los escalares 1 , . . . , m . Al conjunto S se le conoce con el
nombre de conjunto de restricciones y la condicion de que m sea menor a n tiene que ver con los siguientes
dos hechos: uno, que solo si m es menor o igual a n, se puede cumplir que m vectores en Rn sean linealmente
independientes, y dos, si m = n lo mas probable es que el conjunto S sea vaco, o solo contega a lo mas un
numero finito de puntos.
Finalmente, la condicion de que las funciones g1 , . . . , gm y f sean de clase C 1 en U est a directamente
relacionada con las herramientas que usaremos en su prueba, la que por cierto, daremos hasta el siguiente
captulo, pues mucha de esta herramienta la desarrollaremos hasta entonces.
La version que probaremos en este texto del teorema de los multiplicadores de Lagrange es la siguiente.
3 Joseph-Louis Lagrange, bautizado como Giuseppe Lodovico Lagrangia, tambi en llamado Giuseppe Luigi Lagrangia o La-
grange (Turn, 25 de enero de 1736 - Pars, 10 de abril de 1813), fue un fsico, matematico y astr
onomo italiano que despues
vivi
o en Prusia y Francia. Lagrange trabaj o para Federico II de Prusia, en Berln, durante veinte a nos. Lagrange demostr o
el teorema del valor medio, desarroll
o la mec anica Lagrangiana y tuvo una importante contribuci on en astronoma. (fuente:
Wikipedia)
J. P
aez 212
4.6. M
Teorema 4.57 (de los multiplicadores de Lagrange) Sean:
1. g1 , . . . , gm : U Rn R funciones de clase C 1 en U , con m < n,

2. S Rn el conjunto dado por
x U Rn | g1 (
S = { x) = 0, . . . , gm (
x) = 0}
0 S tal que g1 (
3. x x0 ), . . . , gm (
x0 ) son linealmente independientes.
Si f : U Rn R es una funci on de clase C 1 en U tal que f tiene un m
aximo o mnimo (global o
s 0 sobre S entonces existen 1 , . . . , m R tales que
olo local) en x
f (
x0 ) = 1 g1 (
x0 ) + + m gm (
x0 )
Dado que la prueba de este teorema tendra que esperar hasta el siguiente captulo, por ahora solo haremos
una importante observaci on con relaci
on a la tercera hipotesis de su enunciado. Esta observacion se relaciona
con el hecho de que un mismo conjunto de restricciones S se puede obtener usando diferentes colecciones de
funciones g1 , . . . , gm , y no en todos los casos estas colecciones satisfacen la condicion del inciso 3, la cual es
fundamental para la validez del teorema.
En el ejemplo siguiente ilustramos esta situaci on.

Ejemplo 4.58 Sea S = (t, 0, 0) R3 | t R y
2
f (x, y, z) = k(x, y, z) (0, 1, 1)k
= x2 + (y + 1)2 + (z + 1)2
(la distancia al cuadrado entre el punto (x, y, z) y el punto (0, 1, 1)).

Como seguramente el lector estara de acuerdo, se sabe que 0 = (0, 0, 0) es el punto en el cual la funci
on
f alcanza su mnimo valor (global) sobre el conjunto S y que en este punto se tiene que
f (0) = (0, 2, 2)
Primero observemos que si g1 (x, y, z) = z y g2 (x, y, z) = z + y 2 entonces el conjunto S coincide con ser

S = (x, y, z) R3 | g1 (x, y, z) = 0, g2 (x, y, z) = 0
y si g3 (x, y, z) = y tambien se tiene que

S = (x, y, z) R3 | g1 (x, y, z) = 0, g3 (x, y, z) = 0
En el primer caso se tiene que g1 (0) = (0, 0, 1) = g2 (0), es decir, no son linealmente independientes,
y el vector f (
0) = (0, 2, 2) no se puede escribir como combinaci on lineal de ellos (ver figura 4.18), mientras
que en el segundo caso se tiene que g1 (0) = (0, 0, 1) y g3 (0) = (0, 1, 0) los cuales s son linealmente
independientes y se verifica que
f (0) = 2g1 (0) + 2g3 (0)
que es lo que asegura el teorema de los multiplicadores de Lagrange (ver figura 4.19).
Finalmente, mostraremos como se usa el teorema 4.57 concluyendo el problema con el cual lo motivamos:
0 = (x0 , y0 , z0 ) R3 a una recta l, la cual est
encontrar la distacia de un punto x a determinada como la
interseccion de dos planos.
Desafortunadamente, resolver el caso general planteado inicialmente implica realizar largas y tediosas
manipulaciones algebraicas, raz
on por la cual nos limitaremos a resolver el problema para un punto y una
recta especficos.
De esta forma, tomemos el punto (1, 1, 1) R3 y la recta determinada por la interseccion de los planos
x+y1=0
213 J. P
aez
aximos y mnimos
Z
f (
0) = (0, 2, 2)
g1 (
0) = g2 (
0) = (0, 0, 1)
S
g1 (x, y, z) = 0
g2 (x, y, z) = 0
Figura 4.18: En el ejemplo 4.58, los vectores g1 (0) = g2 (0) = (0, 0, 1) no son linealmente independientes y el
vector f (0) = (0, 2, 2) no se puede escribir como combinacion lineal de ellos.
Z
f (
0) = (0, 2, 2)
g1 (
0) = (0, 0, 1)
S
g1 (x, y, z) = 0
g3 (
0) = (0, 1, 0) Y
g3 (x, y, z) = 0
Figura 4.19: En el ejemplo 4.58, los vectores g1 (0) = (0, 0, 1) y = g3 (0) = (0, 1, 0) s son linealmente
independientes y el vector f (
0) = (0, 2, 2) s se puede escribir como combinacion lineal de ellos, como asegura
el teorema de los multiplicadores de Lagrange.
yz+1=0
y calculemos el valor mnimo de la funci

on
f (x, y, z) = (x 1)2 + (y 1)2 + (z 1)2
sobre el conjunto S R3 dado por

S = (x, y, z) R3 | g1 (x, y, z) = 0, g2 (x, y, z) = 0
en donde g1 (x, y, z) = x + y 1 y g2 (x, y, z) = y z + 1.

De acuerdo con el teorema de los multiplicadores de Lagrange, si x0 = (x0 , y0 , z0 ) S es el punto en el
que f alcanza su valor mnimo (sobre S), deben existir 1 , 2 R tales que
f (
x0 ) = 1 g1 (
x0 ) + 2 g2 (
x0 )
lo que nos lleva a resolver el sistema de ecuaciones

f g1 g2
(
x0 ) = 1 (
x0 ) + 2 (
x0 )
x x x
J. P
aez 214
4.7. Problemas Captulo 4. La derivada de funciones de Rn en R
f g1 g2
(
x0 ) = 1 (
x0 ) + 2 (
x0 )
y y y
f g1 g2
(
x0 ) = 1 (
x0 ) + 2 (
x0 )
z z z
g1 (
x0 ) = 0
g2 (
x0 ) = 0
y que en el caso particular que estamos analizando, se traduce en
2(x0 1) = 1
2(y0 1) = 1 + 2
2(z0 1) = 2
x0 + y0 1 = 0
y0 z0 + 1 = 0
Para resolver este sistema, de las primeras tres ecuaciones, despejamos a x0 , y0 y z0 en terminos de 1 y
2 y los sustituimos en las u
ltimas dos ecuaciones, con lo que obtenemos el siguiente sistema en las inc
ognitas
1 y 2 :
21 + 2 = 2
1 + 22 = 2
que tiene como solucion 1 = 2/3 = 2 de tal forma que sustituyendo estos valores en las primeras tres
ecuaciones del sistema original, concluimos que
1
(x0 , y0 , z0 ) = (2, 1, 4)
3
de manera que la distancia que se estaba buscando es
s s 2 2 2
1 2 1 4
f (2, 1, 4) = 1 + 1 + 1
3 3 3 3

6
=
3
Si el lector resolvi
o problemas de este estilo en sus cursos de Geometra Analtica, seguramente noto que
en general los c
alculos son mas sencillos, ademas de que se obtuvo explcitamente cual es el punto de la recta
que est
a mas cercano al punto x 0 , lo que no se suele hacer por los metodos desarrollados en esos cursos.
4.7 Problemas
1. Sean f : U Rn R, x0 U y u Rn tal que k uk = 1. Pruebe que, si la derivada direccional
Du f (
x0 ) existe entonces la derivada direccional Du f (
x0 ) tambien existe y ademas
x0 ) = Du f (
Du f ( x0 )
2. Pruebe las proposiciones 4.4 y 4.5.
3. Sea f : U Rn R tal que f es constante sobre el conjunto abierto U . Pruebe que f es derivable
U y que ademas Df (
para toda x x) es la funci
on lineal constante 0 (Df (x) 0) para toda x U .
Se cumple lo recproco? Es necesaria otra hipotesis sobre el conjunto U ? Pruebe sus respuestas.
4. Si L : Rn R es una funci Rn y que DL(

on lineal, pruebe que L es derivable para toda x x) = L.
215 J. P
aez
Captulo 4. La derivada de funciones de Rn en R 4.7. Problemas
5. Sea f : I R R derivable en x0 I, con I un intervalo abierto. Definimos h : I R R2 R

como h(x, y) = f (x) y. Pruebe:
(a) que h es derivable en el punto (x0 , y0 ) = (x0 , f (x0 )) I R

(b) que Gf = N0 (h) y que la recta tangente al conjunto de nivel N0 (h) en el punto (x0 , f (x0 )),
calculada de acuerdo a la definicion 4.31, coincide con ser la recta tangente a la grafica de f en el
punto (x0 , f (x0 )), calculada de acuerdo a como lo haca en su primer curso de calculo.
6. Sea f : U R2 R derivable en x 0 = (x0 , y0 ) U . Definimos h : U R R3 R como

h(x, y, z) = f (x, y) z. Pruebe:
(a) que h es derivable en el punto (x0 , y0 , z0 ) = (x0 , y0 , f (x0 , y0 )) U R

(b) que Gf = N0 (h) y que el plano tangente al conjunto de nivel N0 (h) en el punto (x0 , y0 , z0 ),
calculada de acuerdo a la definicion 4.31, coincide con ser el plano tangente a la grafica de f en
el punto (x0 , y0 , z0 ), calculado de acuerdo con la definicion 4.18.
on f : R2 R que solo sea derivable en el (0, 0).

7. De un ejemplo de una funci
8. Muestre que las derivadas parciales de la funci

on definida en el ejemplo 4.23 no son continuas en el (0, 0)
(sugerencia: hay dos formas de hacer esto, uno directo, mostrando que el lmite de ambas derivadas
en el (0, 0) no existe, y una forma indirecta, usando los resultados probados en el texto).
9. Sea f : U Rn R tal que U es un conjunto abierto e i {1, . . . , n} fija. Pruebe que, si para todo
par de puntos x ei para alguna R, se tiene que f (
, y U tales que x y = x) = f (
y ) (es decir,
f
que f no depende de la variable xi ) entonces x i
existe para toda x
U y adem
a s
f
(
x) = 0
xi
Se cumple lo recproco? Es necesaria otra hipotesis sobre el conjunto U ? Pruebe sus respuestas.
f
10. Sea f : U Rn R tal que x i
existe y es continua en cada punto x U , para i {1, . . . , n}. Si
x1 , . . . , xn es otro sistema de coordenadas (inducido por otra base ortonormal { e1 , . . . , en }), pruebe
f
que x existe y es continua en cada punto x
U , para i {1, . . . , n}.
i
11. Sean f : U Rn R, x 0 U y r > 0 tal que Br (

x0 ) U . Pruebe que, si para toda i {1, . . . , n} se
f f
tiene que x i
(
x ) existe para cada x B (
x
r 0 ) y xi est
a acotada en Br (
x0 ) entonces f es continua en
x
0 .
12. Sean f : U Rn R, x 0 U , : (a, b) R Rn tal que (a, b) U , y t0 (a, b) tal que (t0 ) = x0 .
Definimos : (a, b) R R como

f ((t))f ((t0 ))f ((t0 ))((t)(t0 ))

k(t)(t0 )k si (t) (t0 ) 6= 0
(t) =

0 si (t) (t0 ) = 0
Pruebe que, si f es derivable en x

0 y es continua en t0 entonces es continua en t0 .
14. Pruebe el corolario 4.30.
15. Sea f : U R3 R una funcion que est

a expresada en terminos de las coordenadas cilndricas (, , z)
U . Si x
de cada punto x 0 U tiene coordenadas cilndricas (0 , 0 , z0 )
f f f
(a) defina , y z en el punto x
0 . Interprete el significado geometrico de estas derivadas
J. P
aez 216
f f f
(b) relacione a cada una de las derivadas , y z en el punto x0 con alguna derivada direccional
en el mismo punto
(c) para cada punto x U defina una base ortonormal de R3 en la cual se pueda expresar la derivada
de f en x
(Df (
x)) en terminos de las derivadas definidas en el inciso anterior
f f f f
(d) exprese a cada una de las derivadas , y z en el punto x
0 en terminos de las derivadas x ,
f f
y y z en el punto x
0 , y viceversa
16. Repita el problema anterior suponiendo ahora que f est

a expresada en terminos de coordenadas
esfericas (, , ).
17. Sean, f : U Rn R de clase C 2 en U , y u , v Rn vectores unitarios. Pruebe que Dv (Du f ) y
Du (Dv f ) existen y
Dv (Du f )(
x) = Du (Dv f )(
x)
para toda x U .
18. (a) Defina las derivadas parciales de orden dos en coordenadas polares (ver definicion 4.35), en coor-
denadas cilndricas (ver problema 15), y en coordenadas esfericas (ver problema 16)
(b) Pruebe que el teorema de las derivadas parciales cruzadas tambien se cumple para estas derivadas
parciales de orden dos
19. Sea xy(x2 y 2 )
x2 +y 2 si (x, y) 6= (0, 0)
f (x, y) =

0 si (x, y) = (0, 0)
f f
(a) calcule x (x, y) y y (x, y) para (x, y) 6= (0, 0)
f f
(b) pruebe que x (0, 0) =0= y (0, 0)
2f 2 f
(c) pruebe que yx (0, 0) = 1 y que xy (0, 0) =1
(d) este ejemplo contradice el 4.39? Justifique su respuesta
20. Sean F1 , . . . , Fn : U Rn R tal que Fi es de clase C 1 en U para i = 1, . . . , n, y supongase que existe

f Fi F
f : U Rn R tal que x i
(
x) = Fi ( U (i = 1, . . . , n). Pruebe que x
x) para toda x j
x) = xji (
( x)
para toda x U (i, j = 1, . . . , n).
21. Sea f : U Rn R de clase C k+1 en U . Pruebe que cualquier derivada parcial de orden k de f es
on de Rn en R) derivable en cualquier punto x
(como funci U.
22. Sea f : U Rn R. Pruebe que si f es de clase C k+1 en U entonces f es de clase C k en U (para
toda k N).
2
23. Sea f : Rn R de clase C 2 en Rn y g : R R dos veces derivable. Pruebe que x(gf )
j xi
(
x) existe para
n
R (i, j = 1, . . . , n) y de una expresion para estas derivadas parciales en terminos de f y g.
toda x
24. Sea f : U Rn R, x 0 U y r > 0 tales que f es de clase C k en Br ( x0 ) U . Si u = (u1 , . . . , un )
es tal que 0 < k
uk < r, y : (r/ k uk) R Rn est
uk , r/ k a dada por (t) = x
0 + tu, pruebe que la
funci
on
f : (r/ k uk) R R
uk , r/ k
es de clase C k en (r/ k
uk , r/ k
uk) y que ademas
n
(m)
X mf
(f ) (t) = ((t)) ui1 uim
i1 ,...,im =1
xim xi1
para cada t (r/ k

uk , r/ k
uk) y cada m {1, . . . , k}.
217 J. P
aez
25. Sean f, g : R R dos veces derivables.
(a) Definimos h : R2 R como h(x, t) = f (x at) + g(x + at) con a R una constante. Pruebe que:
2h 2h
a2 (x, t) = (x, t) para toda (x, t) R2
x2 t2
(b) Definimos h : R2 R como h(x, y) = xf (x + y) + yg(x + y). Pruebe que:
2h 2h 2h
(x, y) + (x, y) = 2 (x, y) para toda (x, y) R2
x2 y 2 yx
(c) Definimos h : R2 R como h(x, y) = f (x2 + y 2 ). Pruebe que:
2h 2
2 h h h
y2 (x, y) x (x, y) + x (x, y) y (x, y) = 0 para toda (x, y) R2
x2 y 2 x y
26. Sea f : U R2 R y x0 U .
(a) Pruebe que, si f es derivable en x

0 entonces la funci
on polinomial
f f
P2 (x, y) = A(x x0 )2 + B(y y0 )2 + C(x x0 )(y y0 ) + x0 )(x x0 ) +
( x0 )(y y0 ) + f (
( x0 )
x y
satisface que
x) P2 (
f ( x)
lim =0
x

x0 k
xx 0 k
para cualesquiera A, B y C n
umeros reales.
f f
(b) Muestre con un ejemplo que el inciso anterior es falso si solo suponemos que x (
x0 ) y y (
x0 )
existen.
27. Sea f : U Rn R de clase C N en U y x

0 U . Definimos
n n
X f 1 X N f
PN (x1 , . . . , xn ) = f (
x0 ) + x0 )xi + +
( x0 )xi1 xiN
(
i=1
xi N ! i ,...,i =1 xi1 xiN
1 N
= (h1 , . . . , hn ), pruebe que

Si h
x0 + h) PN (h)
f (
lim N =0

h0
h
(sugerencia: use la expresion del residuo vista en la demostracion del teorema de Taylor (para el caso
N 1)).
28. Use el polinomio de Taylor de grado dos de la funci
on f (x, y) = cos(x + y) para calcular (y probar) el
siguiente lmite:
1 cos(x + y)
lim
(x,y)(0,0) (x2 + y 2 )1/2
29. Sea f (x, y, z) = Ax2 + By 2 + Cz 2 + Dxy + Eyz + F xz + G. Pruebe que el residuo del polinomio de
Taylor de orden dos de esta funcion siempre vale cero (en cualquier punto). Con base en lo anterior:
(a) escriba el polinomio x2 + y 2 + z 2 en potencias de x 1, y 1 y z 3

(b) escriba el polinomio x2 2y 2 + 4z 2 + xy yz + xz + 1 en potencias de x 1, y + 1 y z
30. Usando el polinomio de Taylor de grado adecuado de la funci on et , y sin hacer demasiados c alculos,
2 2
on f (x, y) = (x2 +y 2 )ex +y
encuentre todas las derivadas parciales de orden tres, en el (0, 0), de la funci
J. P
aez 218
31. Por un procedimiento analogo al del problema anterior, encuentre el valor de todas las derivadas
on f (x, y) = (exy 1) sen(x + y)
parciales de orden tres, en el (0, 0), de la funci
32. Sean x1 , . . . , xn R y N N. Use el teorema de Taylor para probar que

N
X N
(x1 + + xn ) = xk11 xknn
k1 kn
k1 ++kn =N
0ki
donde
N N!
=
k1 kn k1 ! kn !
(este n
umero es conocido con el nombre de coeficiente multinomial ).
33. Sean f : U Rn R, H : V Rk Rn , U y V abiertos, x 0 U y y0 V tales que H( y0 ) = x0 .
Pruebe que, si f alcanza un valor maximo (mnimo) local en x 0 y H es continua en y0 entonces f H
alcanza un valor maximo (mnimo) local en y0 . Este resultado sigue siendo cierto si H no es continua
en y0 ? Pruebe su respuesta.
34. Sea f : U Rn R de clase C 2 en U , x = (u1 , . . . , un ) Rn
x0 ) U , y u
0 U y r0 > 0 tal que Br0 (
uk = 1. Definimos : (r0 , r0 ) R R como (t) = x
tal que k 0 + tu y g : (r0 , r0 ) R R como
g = f . Pruebe que, si f alcanza un valor maximo (mnimo) local en x 0 entonces g alcanza un valor
maximo (mnimo) local en 0.
35. Sea n N, n 2, y f (x, y) = axn + by n , con ab 6= 0. Muestre que el (0, 0) es el u
nico punto crtico de
f y determine su tipo en terminos de a, b y n.
36. Sea f (x, y, z) = ax2 + by 2 + cz 2 , abc 6= 0. Muestre que el (0, 0, 0) es el u
nico punto crtico de f y
determine su tipo en terminos de a, b y c.
37. Pruebe el inciso 2 de la proposicion 4.51.
38. Pruebe el inciso 1 de la proposicion 4.53.
39. Sea f una funcion de clase C 2 en una vecindad de x0 Rn . Pruebe que, si f alcanza un mnimo local
en x0 entonces
2f
x0 ) 0
(
x2i
para cada i {1, . . . , n} (sugerencia: use la proposicion 4.53).
40. Sea x
0 = (x1 , . . . , xn ) un punto crtico de una funcion f de clase C 2 en una vecindad de x0 Rn , tal
que
2f 2f
2 (
x0 ) 2 (
x0 ) < 0
xi xj
para algunas i, j {1, . . . , n}, con i 6= j. Pruebe que x
0 es un punto silla de f .
41. Sea x on f de clase C 2 en una vecindad de x
0 = (x0 , y0 ) un punto crtico de una funci 0 R2 , tal que
2
2f 2f 2f
2
( x0 )
x0 ) 2 ( (
x0 ) < 0
x y yx
Pruebe que x 0 es un punto silla de f (sugerencia: observe que la cantidad anterior est
a relacionado
con el discriminante del polinomio de grado 2 que se obtiene en la variable m al evaluar Hfx0 (1, m),
para m R).
42. Sea f : R2 R definida como f (x, y) = (y 3x2 )(y x2 ). Pruebe que:
(a) el origen es un punto crtico de f
219 J. P
aez
(b) si a, b R y g(t) = (at, bt) con t R, entonces f g tiene un mnimo local en t = 0

(c) el origen no es un mnimo local de f
43. Sea f (x, y) = (x2 1)2 (x2 y x 1)2 . Pruebe que:
(a) f solo tiene dos puntos crticos

(b) ambos puntos crticos son maximos locales
on analoga para funciones de R en R? Pruebe su respuesta.
(c) se puede presentar una situaci
44. Sea f (x, y) = 3xey x3 e3y . Pruebe que:
(a) f solo tiene un punto crtico

(b) el punto crtico es un maximo local
(c) f no tiene un maximo global
on analoga para funciones de R en R? Pruebe su respuesta.
(d) se puede presentar una situaci
on f (x, y) = xy y + x 1 sobre el conjunto

45. Encuentre el maximo y el mnimo de la funci
A = {(x, y) R2 | x2 + y 2 2}
46. Sean (x1 , y1 ), . . . , (xn , yn ) puntos en R2 con x1 < x2 < . . . < xn . Pruebe que:
(a) la funci
on
n
X
d(m, b) = (yi (mxi + b))2
i=1
2
alcanza un valor mnimo en R . Encuentre los valores m0 y b0 para los cuales se alcanza este
valor mnimo (la recta y = m0 x + b0 es la que mejor aproxima a los puntos (x1 , y1 ), . . . , (xn , yn )
y al metodo que se usa para calcular m0 y b0 se le conoce como el m etodo de los cuadrados
mnimos).
(b) si m0 y b0 son los valores del inciso anterior, pruebe que
n
X
(yi (m0 xi + b0 )) = 0
i=1
(c) si n = 2 (es decir, solo se toman dos puntos), entonces y = m0 x + b0 es la recta que pasa por
dichos puntos.
47. Encuentre los extremos de f relativos a S, donde:
(a) f (x, y) = x2 y 2 y S = {(x, cos(x)) R2 | x R}

(b) f (x, y, z) = x2 + y 2 + z 2 y S = {(x, y, z) R3 | z 2 + x2 + y 2 }
48. Escriba el n
umero 120 como suma de tres n
umeros de modo que la suma de sus productos, tomados
de dos en dos, sea maxima.
49. Una compa na planea fabricar cajas rectangulares cerradas con un volumen de 8 litros. El material
para la base y la tapa cuesta el doble que el que se usa para los lados. Encuentre las dimensiones para
las cuales el costo es mnimo.
50. Una ventana tiene la forma de un triangulo is osceles montado sobre un rectangulo. Si la base del
rectangulo mide x, su altura mide y, los angulos de la base del triangulo miden , y el permetro de
la ventana mide 4 metros, encuentre los valores de x, y y que hacen que el area de la ventana sea
maxima.
J. P
aez 220
51. Tres alelos (formas mutantes de genes) A, B y O determinan los cuatro tipos sanguneos: A (AA o
AO), B (BB o BO), O (OO) y AB. La ley de Hardy-Weinberg establece que la proporcion P de
individuos de una poblacion que llevan dos alelos diferentes es P = 2pq + 2pr + 2qr, donde p, q y r son
las proporciones de los alelos A, B y O que se presentan en dicha poblacion, respectivamente. Use el
hecho de que p + q + r = 1 para demostrar que P 2/3.
52. Sea P S = N1 (f ) R3 con f de clase C 1 en R3 . Supongase que P es un punto donde se maximiza
la distancia del origen a S. Pruebe que el vector que sale del origen y termina en P es perpendicular
a S.
53. Sea A una matriz de 3 3, simetrica diferente de la matriz cero. Definimos f (x, y, z) = 12 (A(x, y, z)t )
(x, y, z) y S = {(x, y, z) R3 | x2 + y 2 + z 2 = 1}. Pruebe que, si x 0 S es un punto en donde f
alcanza su valor maximo (o mnimo) sobre S, entonces x 0 es un vector propio de A correspondiente a
un valor propio distinto de cero, es decir, existe 6= 0 tal que A
x0 = x0 .
54. Sean a1 , . . . , ak n
umeros positivos. Use multiplicadores de Lagrange para probar que:
a1 + + ak
(a1 ak )1/k
k
55. Use multiplicadores de Lagrange para demostrar que

1/p 1/q
a1 b1 + + an bn (ap1 + + apn ) (bq1 + + bqn )
1 1
donde ai , bi 0 para i = 1, . . . , n, y p, q > 1 tales que p + q = 1 (esta desigualdad es conocida como
desigualdad de H older ).
56. Pruebe que
1/p 1/p 1/p
((a1 + b1 )p + + (an + bn )p ) (ap1 + + apn ) + (bp1 + + bpn )
donde ai , bi 0 para i = 1, . . . , n, y p 1 (esta desigualdad es conocida como desigualdad de

Minkowski).
221 J. P
aez
J. P
aez 222
Captulo 5
La derivada de funciones de Rn en Rm
En este captulo introduciremos el concepto de derivada para funciones de Rn en Rm , que entre otras cosas,
tendra que coincidir con los conceptos que hemos desarrollado en los captulos anteriores cuando n = 1 o
m = 1.
Y justo por la raz
on anterior, mucho del material que veremos ahora estara basado en las ideas y conceptos
de los captulos anteriores (sobre todo del captulo 4). Y como muestra de ello, empezaremos por hacerlo as
con la definicion de derivada.
5.1 La derivada
Como era de esperarse, la definicion de derivada de una funci on f : U Rn Rm en un punto x 0 U esta
n
basada en la misma idea que se uso para las funciones de R en R: la existencia de la mejor aproximacion
lineal a f alrededor del punto x 0 .
En efecto, como en el caso del captulo anterior, si L : Rn Rm es una funci on lineal, que al trasladarla
para que en el punto x0 coincida con el valor de f en x 0 (es decir, que construimos la funcion afn L(xx0 ) +
f (
x0 )), esta se parece mucho a f (x) alrededor de x 0 (en donde el criterio para decir que estas funciones
se parecen mucho es que la diferencia entre ellas tiende a 0 mas rapido, comparado con la rapidez con la
que el punto x se aproxime al punto x 0 ), entonces diremos que f es derivable en x 0 y que la derivada de f
en este punto es la funci on lineal L.
Lo anterior, dicho de manera mas precisa, lo dejamos plasmado en la siguiente
on 5.1 Sean f : U Rn Rm y x
Definici 0 si existe L : Rn Rm
0 U . Decimos que f es derivable en x
una funci
on lineal tal que
x) (L(
f ( x x0 ) + f (
x0 ))
lim =0
x
x0 k
xx 0 k
o lo que es equivalente (problema 36 del captulo 2), si
kf (
x) (L(
x x0 ) + f (
x0 ))k
lim =0
x

x0 k
xx 0 k
Lo que ahora procede es dar un ejemplo de c omo calcular la derivada que acabamos de definir, pero que
esta no sea de una funci
on del tipo de las que ya vimos en el captulo 3 o en el captulo 4, es decir, la derivada
de una funcion de Rn en Rm en donde n > 1 y m > 1.
Observaci on 5.2 Antes de ello, y en beneficio del propio ejemplo, conviene hacer notar que la definici on
anterior es en efecto una generalizaci on de las definiciones de derivada dadas en los captulos antes men-
cionados.
Que la definicion 4.14 del captulo 4 es un caso particular de la definici
on 5.1, es un hecho que el lector
puede verificar con s
olo leer su enunciado.
Para verificar la equivalencia entre la definicion 5.1 y la definici
on 3.2 dada en el captulo 3, el lector
tendr
a que recurrir al problema 9 de este captulo, y del cual se desprende f
acilmente lo que aqu afirmamos.
223
Captulo 5. La derivada de funciones de Rn en Rm 5.1. La derivada
Una vez dicho lo anterior, procedemos a dar el siguiente
Ejemplo 5.3 Sea f : R2 R3 definida como
f (x, y) = (x2 cos(y), x2 sen(y), x2 )
Dado que la definicion 5.1, como ya mencionamos, es una generalizaci on de los conceptos de derivada
que vimos en los captulos 3 y 4, por la proposici on 3.8 del primero de estos dos captulos, debemos sospechar
que la derivabilidad (y la derivada!) de f est a determinada por la derivabilidad (y la derivada!) de cada
una de sus funciones coordenadas, funciones que son del tipo de las que vimos en el captulo 4.
En virtud de lo anterior, todo parece indicar que para obtener la derivada de f en un punto (x0 , y0 ) R2 ,
sera necesario calcular la derivada de sus funciones coordenadas f1 (x, y) = x2 cos(y), f2 (x, y) = x2 sen(y) y
f3 (x, y) = x2 en este punto.
Ahora, por los resultados obtenidos en el captulo 4, sabemos que las funciones lineales L1 ,L2 y L3 de R2
en R asociadas a las matrices de 1 2
h i
f1 f1
x (x0 , y 0 ) y (x0 , y 0 ) = 2x0 cos(y0 ) x20 sen(y0 )
h i
f2 f2
x (x0 , y0 ) y (x0 , y0 ) = 2x0 sen(y0 ) x20 cos(y0 )
y h i
f3 f3
x (x0 , y0 ) y (x0 , y0 ) = 2x0 0
son las funciones lineales que mas se le parecen a las respectivas funciones coordenadas alrededor del punto
(x0 , y0 ).
Por esta raz on lineal L de R2 en R3 que tiene como funciones coordenadas a las funciones
on, la funci
L1 ,L2 y L3 , y cuya matriz asociada (de 3 2) est a dada por
f f1

x (x0 , y0 ) y (x0 , y0 )
1
2x0 cos(y0 ) x20 sen(y0 )
f2 f
x (x0 , y0 ) y2 (x0 , y0 ) = 2x0 sen(y0 ) x20 cos(y0 )

f3 f3 2x0 0
x (x0 , y0 ) y (x0 , y0 )
sin duda es la mejor candidata para satisfacer la condici on de la definici

on 5.1.
on 4.14 del captulo 4 sabemos que para cada i {1, 2, 3} se satisface que
En efecto, de la definici
fi (x, y) (Li (x x0 , y y0 ) + fi (x0 , y0 ))

lim =0
(x,y)(x0 ,y0 ) k(x x0 , y y0 )k
y por la proposici
on 2.30 del captulo 2 podemos concluir que
f (x, y) (L(x x0 , y y0 ) + f (x0 , y0 ))

lim =0
(x,y)(x0 ,y0 ) k(x x0 , y y0 )k
de modo que f es derivable en el punto (x0 , y0 ).
Tomaremos el ejemplo anterior como punto de partida para obtener algunas conclusiones sobre las fun-
ciones de R2 en R3 , y empezaremos por aquellas que son de car
acter geometrico.
5.1.1 Elementos b
asicos acerca de superficies
Como seguramente el lector recordara, en el captulo 2 mencionamos que desde un punto de vista geometrico,
lo importante de las funciones de R2 en R3 es su imagen. Asi mismo, recordara que el concepto de derivada
para funciones de R en R3 nos fue u til para definir la recta tangente en un punto, de un conjunto que se
puede ver como la imagen de una funci on de este tipo.
Ahora veremos que si un conjunto S R3 se puede obtener como la imagen de una funci on, que en esta
on denotaremos como : U R2 R3 , la cual es derivable en un punto x
subsecci 0 U , y esta derivada
J. P
aez 224
5.1. La derivada Captulo 5. La derivada de funciones de Rn en Rm
cumple con otra condicion que precisaremos mas adelante, entonces podremos definir lo que llamaremos el
plano tangente a S en el punto (
x0 ).
Sea pues S R3 un conjunto que se puede ver como la imagen de una funcion
= (1 , 2 , 3 ) : U R2 R3
la cual es derivable en un punto x 0 = (x0 , y0 ) U . Dado que estamos suponiendo que U es un conjunto
x0 ) U . De esta forma, podemos definir las funciones
abierto, entonces existe r > 0 tal que Br (
x , y : (r, r) R R3
como
x (t) = (x0 + t, y0 )
= (1 (x0 + t, y0 ), 2 (x0 + t, y0 ), 3 (x0 + t, y0 ))
y
y (t) = (x0 , y0 + t)
= (1 (x0 , y0 + t), 2 (x0 , y0 + t), 3 (x0 , y0 + t))
las cuales afirmamos que son derivables en t = 0.
En efecto, de acuerdo con la definicion 3.2 del captulo 3, se tiene que
x (t) x (0)
x (0) = lim
t0 t0
(1 (x0 + t, y0 ) 1 (x0 , y0 ), 2 (x0 + t, y0 ) 2 (x0 , y0 ), 3 (x0 + t, y0 ) 3 (x0 , y0 ))
= lim
t0
t
1 (x0 + t, y0 ) 1 (x0 , y0 ) 2 (x0 + t, y0 ) 2 (x0 , y0 ) 3 (x0 + t, y0 ) 3 (x0 , y0 )
= lim , ,
t0 t t t

1 2 3
= (x0 , y0 ), (x0 , y0 ), (x0 , y0 )
x x x
y
y (t) y (0)
y (0) = lim
t0 t0
(1 (x0 , y0 + t) 1 (x0 , y0 ), 2 (x0 , y0 + t) 2 (x0 , y0 ), 3 (x0 , y0 + t) 3 (x0 , y0 ))
= lim
t0
t
1 (x0 , y0 + t) 1 (x0 , y0 ) 2 (x0 , y0 + t) 2 (x0 , y0 ) 3 (x0 , y0 + t) 3 (x0 , y0 )
= lim , ,
t0 t t t

1 2 3
= (x0 , y0 ), (x0 , y0 ), (x0 , y0 )
y y y
Por lo anterior, si se satisface que

1 2 3
x (0) = (x0 , y0 ), (x0 , y0 ), (x0 , y0 ) 6= 0
x x x
y
1 2 3
y (0) = (x0 , y0 ), (x0 , y0 ), (x0 , y0 ) 6= 0
y y y
entonces x ((r, r)) y y ((r, r)) son dos curvas contenidas en S que tienen recta tengente en el punto
(
x0 ).
Ahora, si ademas los vectores x (0) y y (0) son linealmente independientes, el conjunto dado por

x0 ) + tx (0) + sy (0) R3 | t, s R
(
representa un plano el cual tiene todo el aspecto de ser tangente a S en (
x0 ) (ver figura 5.1).
Con base en la discusi
on anterior, definiremos los siguientes conceptos.
225 J. P
aez
Captulo 5. La derivada de funciones de Rn en Rm 5.1. La derivada
Z
Y
U
P
x0 )
(
b
y (0)
x (0)
0 = (x0 , y0 )
x
b
x
y
Y
X X S = (U )
Figura 5.1: Si los vectores x (0) y y (0) son linealmente independientes, entonces el plano P generado por ellos
y trasladado al punto (x0 ) es tangente a la superficie S = (U ).
on 5.4 Sea S R3 .
Definici
1. Decimos que S es una superficie, si existe = (1 , 2 , 3 ) : U R2 R3 derivable en cada punto de
U , y A U tales que (A) = S. En este caso decimos que es una parametrizaci on de S.
2. Si x0 A y los vectores
1 2 3
(
x0 ) := (
x0 ), (
x0 ), (
x0 )
x x x x
y
1 2 3
(
x0 ) := (
x0 ), (
x0 ), (
x0 )
y y y y
son linealmente independientes, decimos que el plano P R3 definido parametricamente como

P := ( x0 ) + t (
x0 ) + s x0 ) R3 | t, s R
(
x y
es el plano tangente a S en el punto (
x0 ), y que S es suave en (
x0 ).
Con relacion a esta nueva definicion de plano tangente en un punto de una superficie, es importante hacer
algunas observaciones.
La primera de ellas es que, aun y cuando una superficie S R3 es la imagen de alguna funci on derivable,
esto no significa que el conjunto S no pueda tener picos. Una prueba de este hecho nos lo proporciona la
funci
on
(x, y) = (x2 cos(y), x2 sen(y), x2 )
del ejemplo 5.3 la cual ya sabemos que es derivable en cualquier punto (x, y) R2 .
acilmente, el conjunto S = (R2 ) es la parte superior del cono determinado
Como el lector podra verificar f
on cartesiana u + v = w2 (figura 5.2) el cual claramente tiene un pico en el punto (0, 0) =
por la ecuaci 2 2
(0, 0, 0).
Una segunda observaci on es que no cualquier parametrizaci on de una superficie S R3 es u til para
calcular su plano tangente en alg un punto (del mismo modo a como sucedi o en el caso de las curvas).
El conjunto S R3 y el par de parametrizaciones de este que daremos en el siguiente ejemplo, nos
proporcionan una prueba de este hecho.
Ejemplo 5.5 Sea S R3 el siguiente conjunto:

S = (u, v, w) R3 | w = u2 + v 2
La figura 5.3 muestra un esbozo de S, el cual corresponde a un paraboloide. A continuaci
on daremos un
par de parametrizaciones de este conjunto.
J. P
aez 226
5.1. La derivada Captulo 5. La derivada de funciones de Rn en Rm
Figura 5.2: El cono determinado por la ecuacion cartesiana u2 + v 2 = w2 el cual tiene un pico en el punto
(, 0, 0, 0).
X Y
Figura 5.3: El paraboloide determinado por la ecuacion cartesiana u2 + v 2 = w tiene como plano tangente en el
punto (0, 0, 0) al plano XY .

1. Sea : R2 R3 definida como (x, y) = x, y, x2 + y 2 . Como el lector podr
a verificar f
acilmente, se
tiene que S = (R2 ).
Por otra parte, procediendo como en el ejemplo 5.3, se concluye que es derivable para cualquier
(x, y) R2 y adem
as que

(x, y) = (1, 0, 2x)
x
y

(x, y) = (0, 1, 2y)
y
Por lo tanto, para el punto (0, 0) se tiene que

(0, 0) = (1, 0, 0)
x
y

(0, 0) = (0, 1, 0)
y
los cuales son vectores linealmente independientes, de tal forma que el conjunto

P = (0, 0) + t (0, 0) + s (0, 0) R3 | t, s R
x y
227 J. P
aez
Captulo 5. La derivada de funciones de Rn en Rm 5.2. Propiedades de la derivada

= (0, 0, 0) + t (1, 0, 0) + s (0, 1, 0) R3 | t, s R

= (t, s, 0) R3 | t, s R
s resulta ser un plano (el plano XY ), que sin duda es el plano tangente a S en el punto (0, 0) =
(0, 0, 0).

2. Sea ahora : R2 R3 definida como (x, y) = x cos(y), x sen(y), x2 . Nuevamente el lector podr a
acilmente que S = (R2 ).
verificar f
on tambien es sencillo mostrar que es derivable para cualquier (x, y) R2
Por otra parte, para esta funci
y ademas que

(x, y) = (cos(y), sen(y), 2x)
x
y

(x, y) = (x sen(y), x cos(y), 0)
y
Por lo tanto, para el punto (0, 0) se tiene que

(0, 0) = (1, 0, 0)
x
y

(0, 0) = (0, 0, 0)
y
los cuales no son vectores linealmente independientes, de tal forma que el conjunto

3
P = (0, 0) + t (0, 0) + s (0, 0) R | t, s R
x y

= (0, 0, 0) + t (1, 0, 0) + s (0, 0, 0) R3 | t, s R

= (t, 0, 0) R3 | t, s R
no resulta ser un plano.
Cocluimos nuestras observaciones acerca de la definicion de plano tangente a una superficie, recordando
que en el captulo 4 se definio este mismo concepto para dos objetos geometricos diferentes; la grafica de una
funcion de R2 en R (definici on 4.18), y el conjunto de nivel de una funci on de R3 en R (definicion 4.32).
En el problema 6 de este mismo captulo, el lector prob on de R2 en R siempre
o que la grafica de una funci
3
se puede obtener como el conjunto de nivel de una cierta funci on de R en R, y que el plano tangente que
se obtiene usando cualquiera de las definiciones antes mencionadas, es el mismo.
Algo analogo probar a el lector en el problema 1 de este captulo; la grafica de una funci on de R2 en R
2 3
siempre se puede obtener como la imagen de una cierta funci on R en R , y el plano tangente que se obtiene
usando la definicion 5.4 es el mismo que se obtiene usando la definicion 4.18.
Como mencionamos en el captulo 4, en este captulo probaremos el Teorema de la Funci on Implcita
del cual podremos deducir (bajo ciertas hip otesis), que todo conjunto de nivel de una funci on de R3 en R
se puede obtener (al menos por partes) como la grafica de una funci on de R2 en R y por lo dicho en el
parrafo anterior, entonces tambien como la imagen de una cierta funci on de R2 en R3 .
En el problema 21 de este captulo el lector probar a la afirmaci
on anterior, y ademas que el plano tangente
calculado de acuerdo con la definicion 5.4 es el mismo que se obtiene usando la definicion 4.32.
5.2 Propiedades de la derivada

Como seguramente el lector estara de acuerdo, para determinar la derivabilidad de la funci
on del ejemplo 5.3
fue muy importante saber que sus funciones coordenadas eran derivables. Esto sin duda nos lleva a concluir
on de Rn en Rm en un punto, es suficiente con que
que en general, para deducir la derivabilidad de una funci
sus funciones coordenadas lo sean en ese mismo punto.
J. P
aez 228
5.2. Propiedades de la derivada Captulo 5. La derivada de funciones de Rn en Rm
La buena noticia es que la afirmaci on de Rn en Rm

on recproca tambien es cierta, es decir, si una funci
es derivable en un punto, sus funciones coordenadas tambien deben ser derivables en ese punto. Este hecho
es el primer criterio importante que veremos para determinar la derivabilidad (o no derivabilidad!) de una
funcion de Rn en Rm y lo dejamos plasmado en la siguiente
Proposicion 5.6 Sean f : U Rn Rm , x 0 U y f1 , . . . , fm : U Rn R funciones coordenadas de f

(en una base ortonormal { e1 , . . . , em } de Rm ). La funci
on f es derivable en x 0 si y s
olo si fi es derivable
0 para cada i {1, . . . , m}.
en x
Demostraci on. Sea L : Rn Rm una funci on lineal y supongamos que Li : Rn R son las funciones
coordenadas de L (por lo tanto tambien lineales) determinadas por la misma base ortonormal de Rm que
determina a las funciones coordenadas de f .
Dado que la iesima coordenada del vector
1 x) (L(
f ( xx 0 ) + f (
x0 ))
x) (L(
(f ( x x0 ) + f (
x0 ))) =
k
xx 0 k k
x x0 k
est
a dada por
x) (Li (
fi ( xx0 ) + fi (
x0 ))
kxx0 k
para cada i {1, . . . , m}, por la proposicion 2.30 (del captulo 2), se sigue que
x) (L(
f ( x x0 ) + f (
x0 ))
lim =0
x

x0 k
xx 0 k
si y solo si
x) (Li (
fi ( x x0 ) + fi (
x0 ))
lim =0
x

x0 kxx 0 k
de donde las afirmaciones de esta proposicion se concluyen inmediatamente.
Muchos resultados y propiedades de la derivada de funciones de Rn en Rm seran una consecuencia

inmediata de la proposicion anterior (y de los correspondientes resultados y propiedades para funciones de
Rn en R), y para empezar, la usaremos para probar la unicidad de la derivada de las funciones de Rn en Rm .
En efecto, como por la proposicion 4.15 del captulo 4 sabemos que la derivada de una funci on de Rn en
R es unica, por la proposicion anterior concluimos que esto mismo sucede para las funciones de Rn en Rm .
Por esta razon, de aqu en adelante hablaremos de la derivada de f en x0 y la denotamos por Df ( x0 ) (igual
que en el caso de las funciones de Rn en R); es decir, Df ( x0 ) designar a a la funci
on lineal que mejor se le
parece a f alrededor del punto x 0 .
Por otra parte, y como seguramente el lector recordara de su curso de Algebra Lineal, toda funci
on lineal
L : Rn Rm se puede representar por una matriz de m n con entradas reales (que depende de las bases
que se elijan para Rn y Rm ), y que se construye de la siguiente manera.
Si L : Rn Rm es una funci on lineal, { e1 , . . . , em } son bases ortonormales de Rn y Rm ,
e1 , . . . , en } y {
n
respectivamente, y x R es tal que
x = (x1 , . . . , xn )
= x1 e1 + + xn en
entonces
x) = L (x1 e1 + + xn en )
L(
e1 ) + + xn L (
= x1 L ( en )
de tal forma que si

ei ) = a1i e1 + + ami em
L (
229 J. P
aez
para cada i {1, . . . , n}, se tiene que

L( e1 ) + + xn L (
x) = x1 L ( en )
= x1 (a11 e1 + + am1 em ) +
..
.
+xn (a1n e1 + + amn em )
= (x1 , . . . , xn ) (a11 , . . . , a1n ) e1 +
..
.
+ (x1 , . . . , xn ) (am1 , . . . , amn ) em
de donde, usando matrices, obtenemos que

a11 a1n x1
.. .. .. ..
L(
x) = . . . .
am1 amn xn
de tal forma que la matriz

a11 a1n
.. .. ..
= . . .
am1 amn
on L (en las bases {
representa a la funci e1 , . . . , en } y {
e1 , . . . , em }).
Observese que las matrices i de 1 n dadas por

i = ai1 ain
para cada i {1, . . . , m}, representar an a sus correspondientes funciones coordenadas Li , y recprocamente,
si la matriz i representa a la funci on lineal Li , para cada i {1, . . . , m}, entonces la matriz representa a
la funci
on lineal L.
De lo anterior, y de la identidad 4.17 del captulo 4, tendremos que, si f1 , . . . , fm son las funciones
coordenadas de la funci on f (las cuales, reiteramos que dependen de la base de Rm que se elija), entonces la
derivada de f en x0 (Df ( x0 )) estar
a representada por la matriz
f1 f1
x1 ( x0 ) x n
(x0 )
.. .. ..
(5.1)
. . .
fm fm
x1 ( x0 ) xn ( x0 )
a la que se le concoce con el nombre de matriz jacobiana 1 , y no sin cierto abuso de notaci
on (nuevamente!)
escribiremos que
f1 f1
x1 ( x0 ) x n
(x0 )
Df (

x0 ) = .. .. ..
(5.2)
. . .
fm fm
x1 ( x0 ) xn ( x0 )
Sin duda una condicion que es necesaria y suficiente resulta ser muy u til (como la que se da en la
proposicion 5.6), sin embargo, las que solo son necesarias o solo son suficientes, tambien lo son. Y aprovechando
que conocemos dos de este tipo de propiedades para funciones de Rn en R, enunciaremos sus equivalentes
para funciones de Rn en Rm .
La primera de ellas es una condicion necesaria de la derivabilidad de una funci on en un punto, y es una
consecuencia inmediata de las proposiciones 5.6, 4.21 (del captulo 4) y 2.40 (del captulo 2).
1 Llamada as en honor de Carl Gustav Jacob Jacobi (10 de diciembre de 1804 en Potsdam, Prusia, actual Alemania -18 de
febrero de 1851 en Berln). Autor muy prolfico, contribuy o en varios campos de la matem atica, principalmente en el
area de
las funciones elpticas, el
algebra, la teora de numeros y las ecuaciones diferenciales. Tambi
en destaco en su labor pedagogica,
por la que se le ha considerado el profesor m as estimulante de su tiempo. (fuente: Wikipedia).
J. P
aez 230
5.2. Propiedades de la derivada Captulo 5. La derivada de funciones de Rn en Rm
on 5.7 Sea f : U Rn Rm . Si f es derivable en x0 U entonces f es continua en x

Proposici 0 .
La otra propiedad que es muy importante mencionar, y que es una condicion suficiente de la derivabilidad
de una funci
on en un punto, es una consecuencia inmediata de las proposiciones 5.6 y 4.24 (del captulo 4).
Proposici on 5.8 Sean f : U Rn Rm , x0 U y r > 0 tal que Br ( x0 ) U . Si f1 , . . . , fm son

f f
funciones coordenadas de f tales que xji ( x) existe para cada x Br (
x0 ) y xji es continua en x0 , para cada
i {1, . . . , n} y para cada j {1, . . . , m}, entonces f es derivable en x 0 .
Como vimos en el captulo 4, la hipotesis de la proposicion 4.24 (analoga a la anterior) dio lugar al
on de clase C k , concepto que jugo un papel muy importante en el tema de aproximacion
concepto de funci
polinomial, y que ahora vamos a generalizar, apoyados justo en la proposicion 5.6, a las funciones de Rn en
Rm en la siguiente
Definici on 5.9 Sean f : U Rn Rm , f1 , . . . , fm funciones coordenadas de f , y k N. Decimos que

f es una funci on de clase C k en U si cada fj es una funci on de clase C k en U , para j {1, . . . , m}. Es
decir, si existen todas las derivadas parciales de orden k de fj en cada punto de U , y adem as estas derivadas
parciales son continuas en cada punto de U , para j {1, . . . , m}.
Con respecto a la definicion anterior, hay que mencionar lo siguiente. Por el problema 10 del captulo 4
y la identidad 5.3 que probaremos en la siguiente subsecci
on, el hecho de que una funci on sea de clase C k en
un conjunto (abierto) es independiente, tanto del sistema coordenado que estemos usando para representar
a cada punto x Rn , como del que estemos usando para representar a cada punto y Rm . Es decir, este
concepto es independiente de las variables coordenadas x1 , . . . , xn y de las funciones coordenadas f1 , . . . , fm .
Como mencionamos anteriormente, con base en el concepto de funci on de clase C k (para k = 1) podemos
establecer el siguiente resultado, cuya prueba es una consecuencia inmediata de la proposicion 4.42 del
captulo 4 y de la proposicion 5.6.
on 5.10 Si f : U Rn Rm es de clase C 1 en U entonces f es derivable para toda x

Proposici U.
Las propiedades de la derivada de funciones de Rn en Rm relacionadas con la aritmetica de estas, tambien

se obtienen de manera inmediata a partir de la proposicion 5.6 y de las correspondientes propiedades para
funciones de Rn en R, raz on por la cual tampoco las probaremos y solo las dejaremos plasmadas en la
siguiente
on 5.11 Sean f, g : U Rn Rm , x
Proposici 0 U y R. Si f y g son derivables en x
0 entonces:
1. f + g es derivable en x0 y adem
as
D(f + g)(
x0 ) = Df (
x0 ) + Dg(
x0 )
2. f es derivable en x
0 y adem
as
D(f )(
x0 ) = Df (
x0 )
3. f g es derivable en x
0 y adem
as

D(f g)(
x0 ) = x0 )
f1 ( fm (
x0 ) Dg(
x0 ) + x0 )
g1 ( gm (
x0 ) Df (
x0 )
en donde f1 , . . . , fm y g1 , . . . , gm son funciones coordenadas de f y g, respectivamente.
231 J. P
aez
5.2.1 Breve comentario sobre funciones coordenadas

Si el lector revisa con cuidado los conceptos de lmite, continuidad, continuidad uniforme y derivabilidad de
una funci on f de Rn en Rm , todos ellos se han definido sin tener que recurrir a alg un sistema coordenado,
del dominio o del contradominio de la funci on. Los sistemas coordenados son necesarios e importantes para
realizar calculos especficos y por esta raz on hemos probado resultados que expresan estos conceptos en
terminos de funciones coordenadas.
As como en el captulo anterior hicimos enfasis en que la variable x Rn de nuestra funci on f se puede
describir en terminos de diferentes coordenadas, dependiendo de la base ortonormal de Rn en la que lo
estemos representando, de igual manera las funciones coordenadas asociadas a f tambien dependen de la
base ortonormal de Rm con la que se este trabajando.
En efecto, si f1 , . . . , fm son las funciones coordenadas de f para una cierta base ortonormal { e1 , . . . , em }
de Rm (lo que significa que fi ( x) es la jesima coordenada del vector f (
x) en esta base), es decir que
f (
x) = f1 ( e1 + + fm (
x) x)
em
e1 , . . . , em } es otra base ortonormal de Rm , las funciones coordenadas de f en esta nueva base, que
y {
denotaremos por f1 , . . . , fm , se podran obtener a partir de las funciones coordenadas f1 , . . . , fm a traves
de una matriz ortonormal M Mmm (R), matriz que se obtiene de la misma forma en que obtuvimos la
matriz de cambio de coordenadas M de la identidad 4.2 del captulo 4.
Esto es, si

(j)
ej = b1 , . . . , b(j)
m
(j)
= b1 e1 + + b(j)
m e m
para cada j {1, . . . , m}, entonces
f (
x) = f1 ( e1 + + fm (
x) x)
em

(1)
x) b1 e1 + + b(1)
= f1 ( m e m +
..
.

(m)
x) b1 e1 + + b(m)
+ fm ( m e m

(1) (m)
= b1 , . . . , b1 (f1 (
x), . . . , fm ( e1 +
x))
..
.

+ b(1) (m)
m , . . . , bm (f1 (
x), . . . , fm ( em
x))
de donde concluimos que la jesima coordenada del vector f ( e1 , . . . , em }, que en el p

x) en la base { arrafo

anterior dijimos que denotaramos por fj (
x), estar
a dada por
(1) (m)
fj ( x) + + bj fm (
x) = bj f1 ( x) (5.3)
para cada j {1, . . . , m}.
Equivalentemente, pero escrito en forma matricial, se tiene que

(1) (1)
b bm
1. .. ..
f1 (
x) fm (
x) = f1 (
x) fm (
x) .. . .

(m) (m)
b1 bm
en donde la matriz
(1) (1)
b bm
1. .. ..
= .
M .
. .
(m) (m)
b1 bm
J. P
aez 232
5.3. La regla de la cadena Captulo 5. La derivada de funciones de Rn en Rm
es una matriz ortonormal.

Lo relevante de la identidad 5.3 es que establece la forma sencilla en que se relacionan las diferentes
funciones coordenadas que expresan (en diferentes bases ortonormales) a la misma funci on. Es decir, si una
funci on f de Rn en Rm tiene funciones coordenadas f1 , . . . , fm en una cierta base ortonormal { e1 , . . . , em }
de Rm , y tomamos otra base ortonormal { e1 , . . . , em } de este mismo conjunto, sus funciones coordenadas
f1 , . . . , fm en esta nueva base se obtienen como una combinaci on lineal de las primeras.
Esta relaci on resulta de particular importancia para todos los conceptos que mencionamos al inicio de
esta subsecci on, pues confirma el hecho de que todos ellos son independientes del sistema coordenado de Rm
que se este usando para representar a f .
Para el caso del concepto de derivada, la identidad 5.3 resulta particularmente importante, pues si
tenemos una expresion para la derivada Df ( x0 ) en terminos de unas funciones coordenadas f1 , . . . , fm , de
esta identidad podemos deducir cual sera una expresion de esta derivada, pero ahora en terminos de las
funciones coordenadas f1 , . . . , fm .
En efecto, si escribimos a Df ( x0 ) como D f1 , . . . , fm ( x0 ) para enfatizar que estamos escribiendo a f
en terminos de las funciones coordenadas f1 , . . . , fm , de acuerdo con la identidad 5.2 se debe tener que

x0 ) = D f1 , . . . , fm (
Df ( x0 )

f1 f1
x1 ( x0 ) x n
(x0 )
=

.
.. . .. .
..

fm fm
x1 ( x0 ) xn ( x0 )
de tal forma que, de la identidad 5.3 y los incisos 1. y 2. de la proposicion 4.11 del captulo 4, concluimos
que, para cada i {1, . . . , n} y cada j {1, . . . , m}, se tiene que
fj (1) f1 (m) fm
(
x0 ) = bj x0 ) + + bj
( (x0 )
xi xi xi

(1) (m) f1 fm
= bj , . . . , bj (
x0 ), . . . , (
x0 )
xi xi

f1 f1
x1 (x0 ) xn (x0 )

D f1 , . . . , fm (

x0 ) = .. .. ..

. . .
fm fm
x1 ( x0 ) xn (x 0 )

(1) (m) f1 f1
b b1 (x0 ) xn (
x0 )
1. .. .. x1 . .. ..
= ..
. .

.. . .
(1) (m) fm fm
bm bm x1 (x0 ) xn ( x0 )
=M t D (f1 , . . . , fm ) (
x0 )
5.3 La regla de la cadena

Para concluir con las propiedades mas relevantes de la derivada de una funci on de Rn en Rm , formularemos
un resultado muy importante en el cual se establecen las condiciones para asegurar la derivabilidad de la
composicion de una funci on de Rn en Rm con una de Rm en Rk , y la formula que nos permite calcular la
derivada de esta composicion.
Esta sera la versi on mas general de la regla de la cadena que daremos en este texto, y para probarla
podramos hacer uso de la proposicion 5.6 de la siguiente manera: si f : U Rn Rm y g : V Rm Rk ,
con g1 , . . . , gm funciones coordenadas de g, son tales que f (U ) V , se tiene que la composicion g f est
a
bien definida y que las funciones gi f , para i {1, . . . , m}, son funciones coordenadas de g f .
233 J. P
aez
Captulo 5. La derivada de funciones de Rn en Rm 5.3. La regla de la cadena
De esta forma, y justo por la proposicion 5.6, para probar la derivabilidad de g f bastara con probar
la derivabilidad de cada gi f . Sin embargo, la prueba de la regla de la cadena para la composicion g f ,
suponiendo que g es una funci on de Rm en R, es casi igual a la prueba que se puede hacer suponiendo que
m k
g es una funcion de R en R , en virtud de lo cual, optaremos por esta u ltima.
Proposici on 5.12 (Regla de la cadena) Sean f : U Rn Rm , g : V Rm Rk y x 0 U tales que

f (U ) V . Si f es derivable en x x0 ) entonces g f es derivable en x0 y adem
0 y g es derivable en y0 = f ( as
se tiene que
D(g f )(
x0 ) = Dg(f (x0 )) Df (
x0 )
O equivalentemente, si pensamos a las derivadas D(g f )(
x0 ), Dg(f (
x0 )) y Df (
x0 ) como matrices, que
D(g f )(
x0 ) = Dg(f (
x0 ))Df (
x0 )
Demostraci on. La idea detras de la prueba de este resultado es completamente analoga a la seguida en
la prueba de la proposic
on 4.29 del captulo 4, en virtud de lo cual haremos con menos detalles los pasos que
seguiremos en este caso.
Como hicimos en esa proposicion, sera necesario introducir una funcion auxiliar
: U Rn Rk
definida de la siguiente forma:

g(f (
x))g(f (
x0 ))Dg(f (x0 ))(f (
x)f (
x0 ))

kf (
x)f (
x0 )k si f ( x0 ) 6= 0
x) f (
(
x) =

0 x0 ) = 0
x) f (
si f (
Como el lector podra verificar muy f

acilmente, se tiene que
x)) g(f (
g(f ( x0 )) Dg(f (x0 )) (Df ( xx
x0 ) ( 0 ))
k
xx 0 k
kf (
x) f (
x0 )k Dg(f ( x) f (
x0 )) (f ( x0 )) Dg(f ( x0 )) (Df ( xx
x0 ) ( 0 ))
= ( x) +
k
xx 0 k k
xx 0 k

kf (
x) f (
x0 )k x) f (
f ( x0 ) Df ( xx
x0 ) ( 0 )
= ( x) + Dg(f ( x0 ))
k
xx 0 k kx x0 k
U, x
para toda x 6= x0 .
Ahora, del hecho de que f es derivable en x
0 , y por los problemas 5.12 y 5.6, obtenemos las dos siguientes
conclusiones: una, que la funci
on es continua en x 0 , y dos, que la expresion
kf (
x) f (
x0 )k
k
xx 0 k
est
a acotada en una vecindad (agujerada) de x
0 , de tal forma que
kf (
x) f (
x0 )k
lim (
x) =0
x

x0 k
xx 0 k
Por otra parte, dado que f es derivable en x

0 sabemos que
x) f (
f ( x0 ) Df ( xx
x0 ) ( 0 )
=0
kxx 0 k
y como toda funci

on lineal es continua, tenemos que

x) f (
f ( x0 ) Df ( x x0 )
x0 ) (
lim Dg(f (x0 ))
x
x0 kxx 0 k
J. P
aez 234

x) f (
f ( x0 ) Df ( x x0 )
x0 ) (
= Dg(f (
x0 )) lim
x
x0 kxx 0 k

x0 )) 0
= Dg(f (
=0
de tal forma que
x)) g(f (
g(f ( x0 )) Dg(f (x0 )) (Df ( xx
x0 ) ( 0 ))
lim
x

x0 k
xx 0 k

kf (
x) f (x0 )k f (x) f (
x0 ) Df ( xx
x0 ) ( 0 )
= lim ( x) + Dg(f ( x0 ))
x
x0 k
xx 0 k kxx 0 k

=0
lo que prueba que g f es derivable en x x0 )) Df (

0 y que su derivada es Dg(f ( x0 ).
5.3.1 Cambio de coordenadas y regla de la cadena

Desde el captulo 1, y a lo largo de todo este texto, se ha venido insistiendo en ver a Rn como el representante
por excelencia (o prototipo) de los espacios vectoriales de dimensi on n sobre los n
umeros reales. Por esta
misma raz on, se ha enfatizado la posibilidad de que los elementos de Rn se pueden describir por medio
de diferentes sistemas coordenados (lo que no deja de ser un poco extra no, pues lo elementos de Rn est an
definidos en terminos de n-adas), incluyendo sistemas coordenados no cartesianos, como lo son los sistemas
coordenados polar (en R2 ), y cilndrico y esferico (en R3 ).
Con base en lo anterior, se ha puesto particular interes en mostrar que el concepto de derivada es
independiente de estos sistemas coordenados, pero al mismo tiempo se ha visto c omo se expresa en estos,
as como la manera de pasar de una expresion a otra cuando pasamos de un sistema coordenado a otro
(ejemplo de esto son las identidades 4.18, 4.19, 4.33 y 4.34). Lo que ahora deseamos mostrar es que estas
mismas identidades se pueden obtener usando la regla de la cadena que acabamos de probar.
Por ejemplo, supongamos que { e1 , . . . , en } son dos bases ortonormales de Rn , y que
e1 , . . . , en } y {

x1 , . . . , xn y x1 , . . . , xn denotan las coordenadas de un mismo punto x Rn en cada una de estas bases,
respectivamente. Si
(i)
ei = a1 e1 + + an(i) en
para cada i {1, . . . , n}, en el captulo 4 dedujimos que si (x1 , . . . , xn ) son las coordenadas de un punto
Rn en la base {
x e1 , . . . , en }, entonces las coordenas (x1 , . . . , xn ) del mismo punto en la base {
e1 , . . . , en }
est
an dadas por

(1) (1)
a1 an
. .. ..
x1 xn = x1 xn .. .
.
(n) (n)
a1 an
De esta forma, si definimos g : Rn Rn como
x) = g(x1 , . . . , xn )
g(

(1) (n)
= x1 a1 + + xn a1 , . . . , x1 a(1) (n)
n + + xn an
se tendra que g no es mas que la funci on identidad, solo que a los elementos de su dominio los estamos
expresando en la base { e1 , . . . , en }, mientras que a los de su contradominio los estamos expresando en la
base {
e1 , . . . , en }. Este tipo de funciones son conocidas como funciones de cambio de coordenadas.
Dado que g es la funci on identidad, sin duda g es derivable en todos los puntos de Rn . Por otra parte,
y de acuerdo con la identidad 5.1, tenemos que la matriz jacobiana de g (es decir Dg( x)), expresada con
235 J. P
aez
Captulo 5. La derivada de funciones de Rn en Rm 5.3. La regla de la cadena
respecto a las bases { e1 , . . . , en }, est

e1 , . . . , en } y { a dada por

(1) (n)
a a1
1. .. ..
Dg( x) = .. .
.
(1) (n)
an an
para toda x Rn , que coincide con la matriz transpuesta de la matriz de cambio de coordenadas que
obtuvimos anteriormente.
Ahora, si f : U Rn R es una funci on derivable que est
a expresada en terminos de las coordenadas
x1 , . . . , xn , dado que g es la funci on identidad, que la composicion f g est a bien definida y que en sentido
estricto (f g)( x) = f ( U (identidad que no es equivalente a escribir que f (g(x1 , . . . , xn )) =
x) para toda x
f (x1 , . . . , xn ), puesto que f no depende de las coordenadas x1 , . . . , xn ), podemos decir que f g es la misma
funci on f , pero expresada en terminos de las coordenadas x1 , . . . , xn . Este hecho es lo que justifica que nos
podamos tomar la libertad de escribir que
(f g) f
(
x) = (
x)
xi xi
para cada i {1, . . . , n} y cada x U , aun y cuando f no dependa directamente de las coordenadas
x1 , . . . , xn .
Por otra parte, y de acuerdo con la identidad (matricial) de la regla de la cadena (proposicion 5.12), se
tiene que
D(f g)(
x) = Df (g(
x))Dg(x)
= Df (
x)Dg(x) (5.4)
es decir que
h i h i
f f (f g) (f g)
xi (
x) xn (
x) = x1 (x) xn (x)

(1) (n)
h i a1 a1
f f . .. ..
= xi (
x) xn (
x) .. (5.5)
.
.
(1) (n)
an an
o equivalentemente, que para cada i {1, . . . , n} se cumple que

f (i) f f
(
x ) = a1 x) + + a(i)
( n (
x) (5.6)
xi x1 xn
n
(i) f
X
= aj (
x)
j=1
xj
Como seguramente el lector reconocer

a, la identidad 5.5 es la misma que obtuvimos en el captulo 4 (identidad
4.18).
Observaci on 5.13 Es relevante hacer notar que las identidades 5.4, 5.5 y 5.6 conllevan un cierto abuso de
notaci
on el cual puede ser inofensivo s olo si dichas identidades se escriben en terminos de x
y no de sus
correspondientes coordenadas x1 , . . . , xn .
Si deseamos poner a la identidad 5.6 en terminos de estas coordenadas, lo correcto es escribir que
(f g) (i) f f
(x1 , . . . , xn ) = a1 (g (x1 , . . . , xn )) + + a(i)
n (g (x1 , . . . , xn ))
xi x1 xn

(i) f (i) f
= a1 g (x1 , . . . , xn ) + + an g (x1 , . . . , xn )
x1 xn
Lo anterior es muy importante tenerlo presente, sobre todo si se desea calcular derivadas parciales de
on f g.
orden superior de la funci
J. P
aez 236
Para concluir esta subsecci

on, lo que ahora queremos mostrar es que se puede proceder de forma analoga al
caso anterior y obtener identidades equivalentes, aun y cuando los sistemas involucrados no sean cartesianos.
Por ejemplo, consideremos la funci on g : R2 R2 dada por
g(, ) = ( cos(), sen())
la que sin duda se puede considerar como la funci on de cambio de coordenadas polares a coordenadas carte-
sianas para puntos en R2 , y supongamos que f : R2 R es una funci on derivable que est
a expresada en
terminos de las coordenadas cartesianas x y y.
Nuevamente, por la regla de la cadena, y considerando que sin usar ningun tipo de coordenadas para x
podemos asumir que g( x) = x
, entonces
h i
(f g)
( x) (fg) (
x) = D(f g)(
x)
= Df (g(
x))Dg(x)
= Df (
x)Dg(x)
" #

h
f f
i
( cos()) ( cos())
= x ( x) y (
x)
( sen()) ( sen())
h i cos() sen()

f f
= x (
x) y (
x)
sen() cos()
de modo que, como g es la funci

on identidad, nos podemos tomar la libertad de escribir que
f (f g) f (f g)
(
x) = (
x) y (
x) = (
x)

y concluir que
h i h i
f f f f cos() sen()
(
x) (
x) = x (
x) y (
x)
sen() cos()
(5.7)
Es importante hacer notar que la matriz de 2 2 que aparece en esta ultima identidad, solo es una matriz
ortonormal (es decir, una matriz de cambio de coordenadas entre bases ortonormales) si = 1 o = 1.
Sin embargo, si tomamos 6= 0, la identidad anterior la podemos reescribir como
h i h i
f 1 f f f cos() sen()
(
x ) (
x ) = x (
x ) y (
x )
sen() cos()
y ahora la matriz de 2 2 de esta u ltima identidad (que por cierto coincide con la identidad 4.34 del captulo
4) s es una matriz que corresponde a un cambio de coordenadas entre bases ortonormales (entre la base
canonica {e1 , e2 } y la base {
e , e } dada por e = cos() e2 y e = sen()
e1 + sen() e1 + cos()
e2 ), con la
particularidad de que la base { e , e } no siempre es la misma si cambiamos de punto x .
Aun y corriendo el riesgo de parecer repetitivos, es importante insistir en que las identidades
f f f
(
x) = cos() (x) + sen() (x)
x y
y
f f f
x) = sen() (
( x) + cos() (x)
x y
que se obtienen a partir de la identidad 5.7, contienen un cierto abuso de notaci
on y que si se quieren escribir
en terminos de las coordenadas (, ) del punto x, lo correcto es escribir que
(f g) f f
(, ) = cos() (g(, )) + sen() (g(, ))
x y

f f
= cos() g (, ) + sen() g (, )
x y
237 J. P
aez
Captulo 5. La derivada de funciones de Rn en Rm 5.4. El teorema de la funci
on implcita
(f g) f f
(, ) = sen() (g(, )) + cos() (g(, ))
x y

f f
= sen() g (, ) + cos() g (, )
x y
Como ya se mencion o antes, estas identidades son las que hay que considerar si se desea calcular las
on f g.
derivadas parciales de orden superior (con respecto a las variables o ) de la funci

on implcita
Una vez que hemos desarrollado las herramientas b asicas relacionadas con el concepto de derivada para
funciones de Rn en Rm , estamos en condiciones de abordar uno de los teoremas mas importantes del calculo
diferencial de varias variables: el Teorema de la Funci
on Implcita.
5.4.1 El caso lineal

Con el fin de motivar y deducir el contenido de este teorema, empezaremos por analizar algunas propiedades
y caractersticas de las soluciones de los sistemas de ecuaciones lineales en Rn que tienen la particularidad
de tener menos ecuaciones que inc ognitas, es decir, sistemas de la forma
a11 x1 + a12 x2 + + a1n xn + b1 = 0 (5.8)

a21 x1 + a22 x2 + + a2n xn + b2 = 0
..
.
am1 x1 + am2 x2 + + amn xn + bm = 0
en donde m < n.
Sin duda el caso mas sencillo de este tipo de sistemas de ecuaciones lo tenemos en R2 , y se trata de un
sistema que consta de una sola ecuaci on de la forma
ax + by + c = 0
Como seguramente recordara el lector, si a2 + b2 > 0 la ecuaci on anterior representa una recta en el
plano, y si de obtener sus soluciones se trata, es facil probar que, si a 6= 0 entonces estas son de la forma

by c
,y
a
para cualquier y R, y si b 6= 0 entonces todas las soluciones las podemos escribir como las parejas

ax c
x,
b
ognita x es diferente de cero (a 6= 0), esta inc

Es decir, si el coeficiente de la inc ognita se puede poner en
funci
on de la otra incognita y (x = h(y) = (by c)/a) y todas las soluciones de la ecuaci on son de la forma
(h(y), y), con y R.
ognita y es diferente de cero (b 6= 0); en este caso y se puede
Sucede lo analogo si el coeficiente de la inc
poner en funci on de x (y = h(x) = (ax c)/b) y todas las soluciones de la ecuaci on son de la forma
(x, h(x)), con x R.
Para sistemas de ecuaciones en R3 , la situaci on empieza a ponerse un poco mas interesante. El primer
caso que se puede tener es el de una sola ecuaci on de la forma
ax + by + cz + d = 0 (5.9)
J. P
aez 238
5.4. El teorema de la funci
on implcita Captulo 5. La derivada de funciones de Rn en Rm
(la cual geometricamente representa a un plano si a2 + b2 + c2 > 0), y la obtencion de sus soluciones es muy
similar al caso anterior.
En efecto, n ognita x es diferente de cero (a 6= 0), entonces podemos
otese que si el coeficiente de la inc
poner a x en funci on de las inc
ognitas y y z como
x = h(y, z)
(by + cz + d)
=
a
y todas las ternas de la forma

(by + cz + d)
(h(y, z), y, z) = , y, z
a
con (y, z) R2 , son las soluciones de la ecuaci

on 5.9. Como el lector puede constatar facilmente, se tiene
on analoga si b 6= 0 o c 6= 0.
una situaci
El caso que se empieza a poner aun mas interesante es cuando tenemos un sistema de dos ecuaciones de
la forma
a11 x + a12 y + a13 z + b1 = 0 (5.10)

a21 x + a22 y + a23 z + b2 = 0
y lo primero que haremos, sera recordar que en un sistema de este tipo se pueden presentar las siguientes
situaciones.
Una posibilidad es que una de las ecuaciones sea m ultiplo de la otra, es decir, que una de ellas se puede
obtener de la otra multiplicando por un escalar, lo que significa que en realidad nuestro sistema solo consta
de una ecuaci on, caso que ya analizamos.
La segunda posibilidad es que los planos que representan cada una de las ecuaciones, sean dos planos
distintos pero paralelos, es decir, que los vectores normales a cada uno de ellos ((a11 , a12 , a13 ) y (a21 , a22 , a23 )),
sean paralelos; en este caso no existen soluciones y no hay nada mas que se pueda hacer.
La tercera y u ltima posibilidad (sin duda la mas interesante) es justo cuando los vectores (a11 , a12 , a13 )
y (a21 , a22 , a23 ) no son paralelos, y por lo tanto el conjunto de soluciones del sistema est a formado por todos
los puntos de la recta en la que se intersectan ambos planos. Del hecho de que los vectores (a11 , a12 , a13 ) y
(a21 , a22 , a23 ) no sean paralelos, podemos concluir entonces que el producto cruz de estos vectores no es el
vector 0, es decir que
(a11 , a12 , a13 ) (a21 , a22 , a23 ) = (a12 a23 a13 a22 , a13 a21 a11 a23 , a11 a22 a12 a21 ) (5.11)
6= 0
y por lo tanto tenemos tres posibilidades: a12 a23 a13 a22 6= 0, a13 a21 a11 a23 6= 0 o a11 a22 a12 a21 6= 0,
posibilidades que a continuacion nos disponemos a analizar.
Lo primero que habra que destacar es que cada una de las coordenadas del vector dado por 5.11,
resulta ser el determinante de la matriz formada por los coeficientes de algunas de las inc ognitas de nuestras
ecuaciones.
En efecto, notese que a12 a23 a13 a22 es el determinante de la matriz que se obtiene al considerar solo
los coeficientes (de ambas ecuaciones del sistema dado por 5.10) de las inc ognitas y y z; a13 a21 a11 a23
es el determinante de la matriz que se obtiene al considerar solo los coeficientes de las inc ognitas x y z,
y a11 a22 a12 a21 es el determinante de la matriz que se obtiene al considerar solo los coeficientes de las
inc
ognitas x y y.
Con base en la observaci on anterior, si por ejemplo se tiene que a12 a23 a13 a22 6= 0, todo parece indicar
que lo mas adecuado sera reescribir el sistema de ecuaciones 5.10 en la forma
a12 y + a13 z = a11 x b1

a22 y + a23 z = a21 x b2
239 J. P
aez
on implcita
o mejor aun, en la forma matricial

a12 a13 y (a11 x + b1 )
=
a22 a23 z (a21 x + b2 )
de tal manera que, si escribimos

a12 a13
M=
a22 a23
como det(M ) = a12 a23 a13 a22 6= 0, sabemos que M es invertible y por lo tanto tendremos que las inc
ognitas
y y z se pueden poner en funcion de la inc
ognita x, como

y 1 (a11 x + b1 )
=M
z (a21 x + b2 )

h1 (x)
=
h2 (x)
y que las soluciones del sistema 5.10 estaran dadas por las ternas
(x, h1 (x), h2 (x))
con x R.
Tomando en consideracion el analisis anterior, seguramente el lector estar a de acuerdo en que, si ahora lo
que se tiene es que a13 a21 a11 a23 6= 0, entonces las inc
ognitas x y z se podran poner en funci on de la inc
ognita
y (x = h1 (y) y z = h2 (y)) y que las soluciones del sistema estar an dadas por las ternas (h1 (y), y, h2 (y)) con
y R.
Y si lo que sucede es que a11 a22 a12 a21 6= 0, entonces las inc ognitas x y y se podran poner en funci on
de la incognita z (x = h1 (z) y y = h2 (z)) y que las soluciones del sistema estar an dadas por las ternas
(h1 (z), h2 (z), z), con z R.
Sin duda el caso anterior es muy ilustrativo y nos da la pauta para resolver el problema general sobre el
c
alculo de las soluciones del sistema de ecuaciones dado por 5.8. De esta manera, si por ejemplo se tiene que
la matriz de m m formada por los coeficientes de las inc ognitas x1 , . . . , xm , dada por

a11 a1m
M = ... .. ..

. .
am1 amm
tiene determinante distinto de cero (y por lo tanto tiene inversa), entonces el sistema 5.8 escrito en terminos
de la matriz M toma la forma

a11 a1m x1 a1(m+1) xm+1 + + a1n xn + b1
.. .. .. .. = ..
. . . . .

am1 amm xm am(m+1) xm+1 + + amn xn + bm
y por lo tanto las inc

ognitas x1 , . . . , xm se podran poner en funci
on de las inc
ognitas restantes xm+1 , . . . , xn
como
x1 a1(m+1) xm+1 + + a1n xn + b1
.. 1 ..
. =M .

xm am(m+1) xm+1 + + amn xn + bm
Por lo tanto, si definimos
H = (h1 , . . . , hm ) : Rnm Rm
como
a1(m+1) xm+1 + + a1n xn + b1
H(xm+1 , . . . , xn ) = M 1
..
.

am(m+1) xm+1 + + amn xn + bm
J. P
aez 240
entonces encontramos que existen h1 , . . . , hm : Rnm R tales que
xj = hj (xm+1 , . . . , xn )
para j {1, . . . , m}, y que las soluciones del sistema de ecuaciones 5.8 est
an dadas por las nadas
(h1 (xm+1 , . . . , xn ), . . . , hm (xm+1 , . . . , xn ), xm+1 , . . . , xn ) Rn
con (xm+1 , . . . , xn ) Rnm .

En el caso general se tendra que, si los ndices 1 i1 < i2 < < im n, 1 jm+1 < jm+2 < <
jn n, con {i1 , . . . , im } {jm+1 , . . . , jn } = , son tales que la matriz

a1i1 a1im
.. .. ..
. . .
ami1 amim
es invertible, entonces las inc ognitas xi1 , . . . , xim se pueden poner en funci
on de las inc
ognitas restantes
xjm+1 , . . . , xjn , es decir que existen hi1 , . . . , him : Rnm R tales que
xik = hik (xjm+1 , . . . , xjn )
para k {1, . . . , m}, y que las soluciones del sistema de ecuaciones 5.8 est an dadas por las nadas formadas
con los n n umeros reales hi1 (xjm+1 , . . . , xjn ),. . .,him (xjm+1 , . . . , xjn ),xjm+1 ,. . .,xjn , en donde hik (xjm+1 , . . . , xjn )
es la ik -esima coordenada y xjl es la jl esima coordenada, para k {1, . . . , m} y l {m + 1, . . . , n}.
5.4.2 El caso no lineal

Una vez que hemos analizado el caso de un sistema de ecuaciones lineales, el siguiente paso sera considerar
un sistema de ecuaciones, pero no necesariamente lineales, sino el determinado por m funciones g1 , . . . , gm :
Rn R dado por
g1 (x1 , . . . , xn ) = 0
g2 (x1 , . . . , xn ) = 0 (5.12)
..
.
gm (x1 , . . . , xn ) = 0
on gi es de clase C 1 en Rn .
en donde supondremos que cada funci
Denotaremos por S al conjunto de soluciones de este sistema, es decir
x = (x1 , . . . , xn ) Rn | g1 (
S = { x) = 0, . . . , gm (
x) = 0}
y nuestro objetivo no sera encontrar y caracterizar a todos los elemento de S (como hicimos en el caso del
sistema de ecuaciones lineales), lo que sin duda es un problema bastante difcil.
Nuestro objetivo es algo mas modesto y consiste en lo siguiente: si tenemos una solucion x 0 del sistema
5.12, es decir que x 0 S, es posible decir algo de las soluciones de 5.12 que est an cerca de x 0 ?
La respuesta a esta pregunta es justo el teorema de la funci on implcita, el cual nos dice algo sobre el
comportamiento de las soluciones del sistema de ecuaciones 5.12 alrededor del punto x 0 .
La idea principal detras del teorema de la funci on implcita es la siguiente: dado que nuestro objetivo es
conocer el comportamiento de las soluciones del sistema de ecuaciones 5.12 cerca o alrededor del punto
x
0 , entonces sustituyamos cada ecuaci on gi (x1 , . . . , xn ) = 0 por su mejor aproximacion lineal en x 0 , es
decir por la ecuacion
Dgi ( xx
x0 )( 0 ) + gi ( x0 ) = Dgi ( xx
x0 )( 0 ) = 0
o lo que es lo mismo, por la ecuaci
on
gi gi gi
(
x0 )x1 + x0 )x2 + +
( (
x0 )xn + bi = 0
x1 x2 xn
241 J. P
aez
on implcita
en donde bi = Dgi ( x0 ), para cada i {1, . . . , n}.

x0 )(
De esta forma, si para el sistema de ecuaciones lineales dado por
g1 g1 g1
(
x0 )x1 + x0 )x2 + +
( (
x0 )xn + b1 = 0
x1 x2 xn
g2 g2 g2
(
x0 )x1 + x0 )x2 + +
( (
x0 )xn + b2 = 0 (5.13)
x1 x2 xn
..
.
gm gm gm
(
x0 )x1 + x0 )x2 + +
( (
x0 )xn + bm = 0
x1 x2 xn
se tiene que la matriz
g1 g1
x1 (
x0 ) xm (
x0 )
.. .. ..
(5.14)
. . .
gm gm
x1 ( x0 ) xm ( x0 )
es invertible, por lo visto para el caso de los sistemas de ecuaciones lineales, sabemos que las inc ognitas
x1 , . . . , xm se pueden poner en funci ognitas xm+1 , . . . , xn , es decir que existe h : Rnm Rm tal
on de las inc
que (x1 , . . . , xm ) = h (xm+1 , . . . , xn ), y que sus soluciones est an dadas por (h (xm+1 , . . . , xn ) , xm+1 , . . . , xn )
para todo (xm+1 , . . . , xn ) Rnm .
Pues bien, como el sistema de ecuaciones dado por 5.13 se parece mucho al sistema de ecuaciones dado
por 5.12 alrededor o cerca de x0 , el teorema de la funci on implcita asegura que, alrededor o cerca
de x0 , las inc ognitas x1 , . . . , xm tambien se pueden poner en funci on de las inc
ognitas xm+1 , . . . , xn ; es decir,
si
(0) (0)
0 = x1 , . . . , x(0)
x (0)
m , xm+1 , . . . , xn
este teorema nos asegura que existen r > 0 y

(0)
h : Br xm+1 , . . . , x(0)
n Rnm Rm
de clase C 1 , tal que

(0) (0)
h xm+1 , . . . , x(0)
n = x1 , . . . , x(0)
m
y las nadas (h (xm+1 , . . . , xn ) , xm+1 , . . . , xn ) tambien son soluciones del sistema 5.12 para cada

(0)
(xm+1 , . . . , xn ) Br xm+1 , . . . , x(0)
n
es decir que
(h (xm+1 , . . . , xn ) , xm+1 , . . . , xn ) S

(0) (0)
para cada (xm+1 , . . . , xn ) Br xm+1 , . . . , xn .
Antes de dar la formulaci on mas precisa del teorema de la funci on implcita, haremos unas observaciones
importantes. La primera de ellas tiene que ver con la eleccion de la matriz dada por 5.14. Como en el caso
del sistema de ecuaciones lineales, si en general los ndices 1 i1 < i2 < < im n, 1 jm+1 < jm+2 <
< jn n, con {i1 , . . . , im } {jm+1 , . . . , jn } = , son tales que la matriz
g1 g1

xi1 ( x0 ) x im
(
x0 )

.. .. ..

. . .
gm gm
xi (x0 ) xi (
x 0 )
1 m
es invertible, entonces lo que el teorema de la funci on implcita afirma es que alrededor de x 0 S las
ognitas xi1 , . . . , xim se pueden poner en funci
inc on de las inc ognitas restantes xjm+1 , . . . , xjn , es decir que
existen r > 0 y
(0) (0)
hi1 , . . . , him : Br xjm+1 , . . . , xjn Rnm R
J. P
aez 242
tales que
(0) (0) (0)
xik = hik xjm+1 , . . . , xjn
para k {1, . . . , m}, y que las nadas formadas con los n n
umeros reales
hi1 (xjm+1 , . . . , xjn ), . . . , him (xjm+1 , . . . , xjn ), xjm+1 , . . . , xjn
en donde hik (xjm+1 , . . . , xjn ) es la ik esima coordenada y xjl es la jl esima coordenada, para k {1, . . . , m}
y l {m + 1, . . . , n}, son soluciones del sistema 5.12.
Las otras observaciones que haremos, en realidad son interpretaciones geometricas del teorema de la
on implcita para los casos de R2 y R3 . El caso mas sencillo es el de R2 , en el que solo se puede tener
funci
una restriccion de la forma
g(x, y) = 0
y que no es mas que el conjunto de nivel 0 de g (N0 (g)).
g
De acuerdo con lo visto anteriormente, hsi x0 = i(x0 , y0 ) R2 es tal que g(x0 , y0 ) = 0 y x (
x0 ) 6= 0
g
(es decir, que la matriz de 1 1 dada por x (
x0 ) es invertible!), entonces para puntos (x, y) N0 (g)
cercanos al punto x0 = (x0 , y0 ), su coordenada (o variable) x se puede poner en funci on de su coordenada
(o variable) y, es decir que existen r > 0 y h : (y0 r, y0 + r) R R tales que h(y0 ) = x0 y g(h(y), y) = 0
para toda y (y0 r, y0 + r).
g
Analogamente, si y x0 ) 6= 0 entonces para puntos de N0 (g) cercanos al punto x
( 0 = (x0 , y0 ) su
coordenada (o variable) y se puede poner en funci on de coordenada (o variable) x, es decir que existen r > 0
y h : (x0 r, x0 + r) R R tales que h(x0 ) = y0 y g(x, h(x)) = 0 para toda x (x0 r, x0 + r).
g
En terminos geometricos, lo anterior significa que si el vector g( x0 ) no es horizontal ( y x0 ) 6= 0),
(
es decir no es paralelo al eje X, entonces un sector de la curva de nivel 0 de g alrededor del punto
x
0 = (x0 , y0 ) se puede ver como la gr afica de una funci on de la forma y = h(x) (ver figura 5.4 (a)).
g
Y si el vector g(x0 ) no es vertical ( x x0 ) 6= 0), es decir no es paralelo al eje Y , entonces un sector
(
de la curva de nivel 0 de g alrededor del punto x0 = (x0 , y0 ) se puede ver como la grafica de una funci on
de la forma x = h(y) (ver figura 5.4 (b)).
Y g(
x0 ) Y
g(
x0 ) g(
x0 )
b b
g(x, y) = 0 g(x, y) = 0
g(
x0 )
X X
(a) (b)
Figura 5.4: Si el vector g( x0 ) no es horizontal (vector verde y azul en (a)), entonces un sector de la curva de
nivel 0 de g alrededor del punto x 0 se puede ver como la grafica de una funcion de la forma x = h(y). Y si el
vector g( x0 ) no es vertical (vector rojo y azul en (b)), entonces un sector de la curva de nivel alrededor
del punto x0 se puede ver como la grafica de una funcion de la forma y = h(x).
Para el caso de R3 , si solo se tiene una restriccion de la forma

g(x, y, z) = 0
g
yx0 = (x0 , y0 , z0 ) R3 es tal que g(x0 , y0 , z0 ) = 0 y x x0 ) 6= 0 (lo que significa que el vector g(
( x0 ) no est
a
en el plano Y Z), entonces para puntos (x, y, z) N0 (g) cercanos al punto x 0 , la coordenada (o variable) x
243 J. P
aez
on implcita
se puede poner en funci on de las correspondientes coordenadas (o variables) y y z, es decir que existen r > 0
y h : Br ((y0 , z0 )) R2 R tales que h(y0 , z0 ) = x0 y g(h(y, z), y, z) = 0 para toda (y, z) Br ((y0 , z0 )).
Lo anterior, nuevamente en terminos geometricos, significa que un pedazo del conjunto de nivel 0 de g
que contiene al punto x 0 = (x0 , y0 , z0 ) se puede ver como la grafica de una funci on de la forma x = h(y, z)
g g
(ver figura 5.5). Los otros casos ( y (x0 ) 6= 0 y z x0 ) 6= 0) tienen interpretaciones geometricas semejantes.
(
g(x0 , y0 , z0 ) (y0 , z0 )
g(x, y, z) = 0
g
Figura 5.5: Si x x0 ) 6= 0 (lo que significa que el vector g(
( x0 ) no esta en el plano Y Z), entonces un sector
de la superficie de nivel 0 de g alrededor del punto x 0 = (x0 , y0 , z0 ) se puede ver como la grafica de una
funcion de la forma x = h(y, z).
La otra posibilidad en R3 es cuando tenemos dos restricciones de la forma
g1 (x, y, z) = 0
g2 (x, y, z) = 0
en cuyo caso el conjunto S de soluciones de este sistema se ve como una curva.

0 = (x0 , y0 , z0 ) S, n
Si x otese que el sistema de ecuaciones dado por 5.13 se reduce al sistema de dos
ecuaciones
g1 g1 g1
(
x0 )x + (
x0 )y + x0 )z g1 (
( x0 ) x
0 = 0
x y y
g2 g2 g2
(
x0 )x + (
x0 )y + x0 )z g2 (
( x0 ) x
0 = 0
x y y
y el determinante de cada una de las tres posibles submatrices de 2 2 que se pueden construir a partir de
este sistema, coinciden (salvo posiblemente por el signo), con las coordenadas del vector
" # g1
g1 g1
y (
x 0 ) z (
x 0 ) x x0 ) g
( z
1
(
x0 )
g1 (x0 ) g2 (
x0 ) = det g2 e1 det g2 e2
x0 ) g
y ( z (
2
x0 ) x (x0 ) g
z (
2
x0 )
" #
g1
x (x0 ) g
y (
1
x0 )
+ det g2 e3
x (x0 ) g
y (
2
x0 )
De esta forma, si la matriz " #

g1 g1
y (x0 ) z (x0 )
g2 g2
y x0 )
( z x0 )
(
tiene determinante distinto de 0 (es decir, si la primera coordenada del vector g1 (
x0 ) g2 (
x0 ) es distinta
de 0, o equivalentemente, que este vector no pertenece al plano Y Z), entonces las coordenadas (o variables)
J. P
aez 244
y y z de puntos de S cercanos al punto x 0 se pueden poner en funci on de la coordenada (o variable)

x. Es decir, existen r > 0 y h1 , h2 : (x0 r, x0 + r) R R tales que h1 (x0 ) = y0 , h2 (x0 ) = z0 y
g(x, h1 (x), h2 (x)) = 0 para toda x (x0 r, x0 + r).
on de R en R3 dada por h(x) = (x, h1 (x), h2 (x)) (para x (x0 r, x0 +r))
Lo anterior significa que la funci
es una parametrizaci on de un pedazo de la curva determinada por las restricciones g1 y g2 (ver figura 5.6).
Las otras dos posibilidades, correspondientes a las otras dos matrices de 2 2 que se pueden obtener con
las derivadas parciales de g1 y g2 , se interpretan de manera analoga.
Z
g1 (x, y, z) = 0
g2 (
x0 )
0
x
b
g1 (
x0 )
X g1 (
x0 g2 (
x0 )
g2 (x, y, z) = 0
S
Y
Figura 5.6: Si la primera coordenada del vector g1 ( x0 ) g2 (

x0 ) es distinta de 0 entonces las variables y y
z alrededor del punto x 0 = (x0 , y0 , z0 ) se pueden poner en funcion de la variable x. Esto significa que un
sector de la curva S (determinada por la intersecci on de las restricciones g1 y g2 ) se puede parametrizar en
terminos de la variable x.
Las dos primeras interpretaciones geometricas que acabamos de hacer, los casos en que el conjunto S
coincide con un conjunto de nivel en R2 o uno en R3 , son justo los hechos geometricos que se mencionaron
en los comentarios que hicimos posteriores al ejemplo 4.33 del captulo 4.
En ese ejemplo calculamos la recta tangente de un cierto conjunto de nivel en R2 , y el plano tangente de un
cierto conjunto de nivel en R3 , de acuerdo con las definiciones 4.32 y 4.18. Y precisamente, adelant andonos
a las interpretaciones geometricas del teorema de la funcion implcita que acabamos de hacer, comentamos
que esa recta y ese plano tambien se podan obtener como la recta tangente a la grafica de una funci on de
R en R, y el plano tangente a la gr on de R2 en R, respectivamente.
afica de una funci
Lo que ahora nos proponemos, es tomar esos mismos conjuntos y mostrar que estas afirmaciones son
ciertas.
Ejemplo 5.14
on de clase C 1 en R2
1. Consideremos el conjunto de nivel 0 (N0 (g)) de la funci
g(x, y) = (x2 + y 2 2x)2 4(x2 + y 2 )
que, como se mencion
o en el inciso 1. del ejemplo 4.33 del captulo 4, este conjunto de nivel es la
curva cardiode.
Como
g
(x, y) = 2(x2 + y 2 2x) (2x 2) 8x
x
y
g
(x, y) = 2(x2 + y 2 2x)2y 8y
y
g
para cada (x, y) R2 , en particular para el punto (0, 2) N0 (g) se tiene que x (0, 2) = 16 6= 0 y
g
y (0, 2) = 16 6= 0.
245 J. P
aez
on implcita
Dado que ambas derivadas parciales son distintas de 0, podemos aplicar el teorema de la funci
on
implcita para los dos casos.
g
Si consideramos el hecho de que x (0, 2) 6= 0, el teorema nos asegura que existen r > 0 y
h : (2 r, 2 + r) R R
de clase C 1 tal que h (2) = 0 y

g (h (t) , t) = 0 (5.15)
para toda t (2 r, 2 + r).
Derivando esta identidad usando la regla de la cadena, obtenemos que
g g
(h (t) , t) h (t) + (h (t) , t) = 0
x y
para toda t (2 r, 2 + r), de modo que, evaluando para t = 2, se tiene que
g g
(h (2) , 2) h (2) = (0, 2) h (2)
x x
g
= (0, 2)
y
g
y por lo tanto, como x (0, 2) 6= 0, concluimos que
g
y (0, 2)
h (2) = g
(0, 2)
x
16
=
16
=1
Una vez que llegamos a este punto, es importante hacer la siguiente observaci on. En estricto sentido,
la gr on h es el conjunto de parejas de la forma (t, h (t)) R2 , que no son las parejas
afica de la funci
que pertenecen al conjunto de nivel 0 de la funci
on g.
De acuerdo con la identidad 5.15, hay que permutar las coordenadas de los elementos de la gr
afica de
h para que dichas parejas pertenezcan al conjunto N0 (g).
La explicaci
on de este hecho es que, en este caso, es la coordenada x a la que pusimos en funci on de
la coordenada y. Para ser congruentes con lo anterior y no caer en errores, al momento de escribir la
ecuacion de la recta tangente a la gr
afica de h en el punto (0, 2), habr
a que hacer lo mismo, escribir a
la coordenada x en funci on de la coordenada y, es decir, escribir que
x = h (2) (y 2) + h (2)
=y2+0
o equivalentemente
y =x+2
Procediendo de esta forma, s obtenemos la misma recta que en el inciso 1. del ejemplo 4.33 del captulo
4.
on de clase C 1 en R3
2. Consideremos el conjunto de nivel 0 (N0 (g)) de la funci
x2 y2 z2
g(x, y, z) = 2
+ 2 + 2 1
a b c
que, como se mencion
o en el inciso 2. del ejemplo 4.33 del captulo 4, este conjunto de nivel es un
elipsoide.
J. P
aez 246
g x
(x, y, z) = 2 2
x a
g y
(x, y, z) = 2 2
y b
g z
(x, y, z) = 2 2
z c
de tal forma que si elegimos el punto (0, b, 0) N0 (g), entonces
g
(0, b, 0) = 0
x
g 2
(0, b, 0) =
y b
g
(0, b, 0) = 0
z
g
Por tanto, como en este caso la y (0, b, 0) = 2b es la unica derivada parcial que es distinta de 0
en el punto (0, b, 0), el teorema de la funci on implcita s
olo nos permite asegurar que para puntos
(x, y, z) N0 (g) que est
an cercanos al punto (0, b, 0), su coordenada y se puede poner en funcion de
sus coordenadas x y z. Es decir, que existe r > 0 y h : Br (0, 0) R2 R tal que h (0, 0) = b y
g (x, h (x, z) , z) = 0
para toda (x, z) Br (0, 0).

Notese nuevamente, como en el inciso anterior, que en estricto sentido las ternas que pertenecen a
la gr
afica de la funci
on h son las de la forma (x, z, h (x, z)). Las ternas (x, h (x, z) , z) se obtienen
al hacer una permutaci on de las coordenadas de las ternas (x, z, h (x, z)) (intercambiando la segunda
coordenada con la tercera), y son las que pertenecen al conjunto N0 (g).
Dado que para calcular el plano tangente a la gr afica de la funci
on h en el punto (0, b, 0), es necesario
calcular sus derivadas parciales en el punto (0, 0), esto lo logramos nuevamente derivando la identidad
anterior por medio de la regla de la cadena.
En efecto, como el lado izquierdo de la identidad anterior es la composici
on de la funci
on
H : Br (0, 0) R2 R3
dada por
H (x, z) = (x, h (x, z) , z)
seguida de la funci
on g, y esta composici
on nos da la funci
on constante 0, aplicando la regla de la
cadena obtemos que
D (g H) (x, z) = Dg (H (x, z)) DH (x, z)

h i 1 0
g g g h (x, z) h
= x (H (x, z)) y (H (x, z)) z (H (x, z)) x z (x, z)

0 1

= 0 0
para toda (x, z) Br (0, 0).

Por lo tanto, evaluando esta identidad de matrices en el punto (0, 0) se obtiene que
g g h 2 h
0= (0, b, 0) + (0, b, 0) (0, 0) = (0, 0)
x y x b x
247 J. P
aez
on implcita
y
g h g 2 h
0= (0, b, 0) (0, 0) + (0, b, 0) = (0, 0)
y z z b z
de donde
h h
(0, 0) = 0 = (0, 0)
x z
Si ahora calculamos el plano tangente a la gr

afica de h en el punto (0, 0), de acuerdo con la definici
on
4.18 del captulo 4, y como en el inciso anterior, recordando que la coordenada y es la que se debe
escribir en terminos de las coordenadas x y z, se tiene que
h h
y= (0, 0) (x 0) + (0, 0) (z 0) + h (0, 0)
x z
=b
Como el lector podr a comprobar, esta ecuaci on es la misma que se obtiene en el inciso 2. del ejemplo
4.33 del captulo 4, tomando (x0 , y0 , z0 ) = (0, b, 0).
Una vez dicho y hecho todo lo anterior, escribiremos el tan mencionado teorema de la funci on implcita.
Con el fin de hacer sencilla su redaccion, y dado que en la primera observaci on que hicimos ya men-
on mas general, supondremos que la matriz de m m que se necesita que
cionamos cual sera su formulaci
sea invertible (como parte de las hip
otesis), es la correspondiente a las primeras m variables (la matriz dada
en 5.14). Y para simplificar aun mas esta redaccion, al espacio Rn lo escribiremos como Rm Rk .
Teorema 5.15 (de la funci on implcita) Sean g1 , . . . , gm : U Rm Rk R de clase C 1 en U . Si

S = (x, y) = (x1 , . . . , xm , y1 , . . . , yk ) Rm Rk | gi (
x, y) = 0 para i {1, . . . , m}

(0) (0) (0) (0)
y (
x0 , y0 ) = x1 , . . . , xm , y1 , . . . , yk S es tal que la matriz
g1 g1
x1x0 , y0 )
( xm (
x0 , y0 )
.. .. ..
. . .
gm gm
x1 (
x ,
0 0y
) xm (
x0 , y0 )
y0 ) Rk Rm de clase C 1 en Br (
es invertible entonces existen r > 0 y h : Br ( y0 ) tales que h (
y0 ) = x0 y
y ) , y) S para toda y Br (
(h ( y0 ).
Por razones de comodidad, la prueba de este teorema la dejaremos pendiente hasta la siguiente secci on,
en la que probaremos el teorema de la funci on inversa y con base en el cual demostraremos el teorema
anterior.
A cambio de esta prueba, y apoyados en el teorema de la funci on implcita, haremos una prueba que en
el captulo 4 dejamos pendiente: la prueba del teorema de los multiplicadores de Lagrange.
La formulaci on que daremos a continuacion de este teorema, aunque totalmente equivalente a la que
dimos en el captulo 4, la escribiremos de tal forma que este mas acorde con la formulacion que acabamos
de dar del teorema de la funci on implcita.
Teorema 5.16 (de los multiplicadores de Lagrange) Sean:
1. g1 , . . . , gm : U Rm Rk R funciones de clase C 1 en U .
2. S Rm Rk el conjunto dado por

S = (x, y) U Rm Rk | g1 (
x, y) = 0, . . . , gm (
x, y) = 0
J. P
aez 248
x0 , y0 ) S tal que g1 (
3. ( x0 , y0 ), . . . , gm (
x0 , y0 ) son linealmente independientes.
Si f : U Rm Rk R es una funci on de de clase C 1 en U tal que f tiene un m
aximo o mnimo
x0 , y0 ) sobre S entonces existen 1 , . . . , m R tales que
(local) en (
f (
x0 , y0 ) = 1 g1 (
x0 , y0 ) + + m gm (
x0 , y0 )
Demostraci on. Dado que los vectores g1 ( x0 , y0 ), . . . , gm (x0 , y0 ) son linealmente independientes, se
tiene que el rango por renglones de la matriz
g1 g1 g1
x0 , y0 ) x
x1 ( m
(x0 , y0 ) x n
(
x0 , y0 )
.. .. .. .. ..
. . . . .
gm gm gm
x0 , y0 ) xm (
x1 ( x0 , y0 ) xn ( x0 , y0 )
debe ser m, y como este debe ser igual a su rango por columnas (inciso (c) del Corolario 2 del Teorema 3.6
de la referencia [2]), dicha matriz debe tener m columnas linealmente independientes.
Supondremos, sin perdida de generalidad, que estas columnas son las primeras m de tal forma que la
matriz de m m g1
g1
x0 , y0 ) x
x1 ( m
(
x0 , y0 )
.. .. ..
. . .
gm gm
x0 , y0 ) xm (
x1 ( x0 , y0 )
sera invertible. De esta forma, por el teorema de la funci
on implcita, sabemos que existen r > 0 y
y 0 ) Rk Rm
h = (h1 , . . . , hm ) : Br (
de clase C 1 en Br (
y0 ) tales que h (
y0 ) = x
0 y (h ( y ) , y) S para toda y Br (
y0 ).
Definamos ahora la funci on
y 0 ) Rk Rm Rk
H : Br (
como H( y ) , y) la cual es de clase C 1 en Br (
y ) = (h ( y ) , y) S para toda y Br (
y0 ). Ahora, como (h ( y0 ),
se tiene que (gi H) ( y ) = 0 para toda y Br (y0 ) de modo que en particular
D(gi H) (
y0 ) = Dgi (H(
y0 )) DH(
y0 )
= Dgi (
x0 , y0 ) DH( y0 )

= 0 0 M1k (R)
es decir que el producto de matrices

h1 h1
y1 (
y0 ) yk (
y0 )

... ..
.
..
.

h i hm hm

gi gi gi gi

y1 ( y0 ) yk ( y0 )
x1 x0 , y0 )
( xm (
x0 , y0 ) y1 x0 , y0 )
( yk (
x0 , y0 ) (5.16)

1 0

.. .. ..
. . .
0 1

= 0 0 M1k (R)
para cada i {1, . . . , m}.

Si ahora definimos los vectores

h1 hm
wj = (
y0 ) , . . . , y0 ) , ej Rm Rk
(
yj yj
para j {1, . . . , k} (en donde e1 , . . . , ek Rk son los vectores canonicos), se tiene que w1 , . . . , wk son
linealmente independientes de modo que si W Rm Rk es el subespacio generado por estos vectores (es
decir que W = hw1 , . . . , wk i), entonces W es de dimensi on k (dim(W ) = k).
249 J. P
aez
on inversa
Ahora n otese que, del hecho de que el producto de matrices 5.16 sea la matriz (de 1 k) identicamente
cero, se concluye que
gi (
x0 , y0 ) wj = 0
x0 , y0 ) W (el complemento ortogonal
para cada i {1, . . . , m} y cada j {1, . . . , k}, de modo que gi (
m k
de W en R R ) para cada i {1, . . . , m}. Por otra parte, como

dim(W ) = dim Rm Rk dim (W )
=m+kk
=m
y g1 (
x0 , y0 ), . . . , gm (
x0 , y0 ) son linealmente independientes, concluimos que estos vectores son una base
de W .
Finalmente, si ahora consideramos la funci on f H (la cual est
a definida en alguna vecindad del punto
y0 Rk ), dado que f tiene un valor extremo (local) en el punto ( y0 ) entonces f H tiene un
x0 , y0 ) = H(
valor extremo (local) en el punto y0 (problema 33 del captulo 4), de modo que y0 es un punto crtico de
f H y por lo tanto
D(f H) (
y0 ) = Df (H(
y0 )) DH(
y0 )
= Df (
x0 , y0 ) DH(
y0 )

= 0 0 M1k (R)
es decir que
h1 h1
y1 (
y0 ) yk (
y0 )
.. .. ..
. . .
h i hm hm

f f f f

y1 ( y0 ) yk ( y0 )
x1 x0 , y0 )
( xm (
x0 , y0 ) y1 x0 , y0 )
( yk (
x0 , y0 )

1 0

.. .. ..
. . .
0 1

= 0 0 M1k (R)
Por tanto, tambien se tiene que

f (
x0 , y0 ) wj = 0
para cada j {1, . . . , j} de modo que f ( x0 , y0 ) tambien pertenece a W = hw1 , . . . , wk i , y como
g1 ( x0 , y0 ) son una base de W , entonces f (
x0 , y0 ), . . . , gm ( x0 , y0 ) debe ser una combinaci
on lineal de
estos vectores, es decir, existen 1 , . . . , m R tales que
f (
x0 , y0 ) = 1 g1 (
x0 , y0 ) + + m gm (
x0 , y0 )
con lo cual concluimos la prueba.

on inversa
Ademas del papel importante que juega en la prueba del teorema de la funci on implcita, el teorema de la
funci
on inversa es relevante por meritos propios. De hecho, este teorema no debe ser ajeno al lector pues el
caso particular de este teorema para funciones de R en R forma parte de los resultados importantes de un
primer curso de calculo.
En este captulo haremos uso de todo el material desarrollado en la primera secci
on de este captulo, pero
adicionalmente necesitaremos algunos resultados relacionados con las funciones lineales de Rn en Rm y su
representacion matricial, los cuales introduciremos a continuacion.
J. P
aez 250
on inversa Captulo 5. La derivada de funciones de Rn en Rm
Si f : U Rn Rm es una funci on de clase C 1 en su dominio U , sabemos que para cada x U existe la

on lineal de Rn en Rm , que esta se representa por una matriz (la
derivada de f , que la derivada es una funci
cual depende de las bases que se elijan para Rn en Rm , y a la que llamamos matriz jacobiana), y que para
cada x U esta matriz esta dada por
f1 f1
x1 (
x) xn (
x)
Df (

x) = .
.. .. ..
. .
fm fm
x1 (
x ) xn (
x)
Como se podra observar (y era de esperarse), para cada x U tenemos asociada una matriz cuyas
entradas son funciones continuas de x, y una cuestion importante es determinar de que forma se refleja este
hecho en las funciones lineales que representan estas matrices.
Para ello, observemos que si evaluamos dos de estas funciones lineales (es decir, la derivada de f en dos
puntos x 0 U ) en un punto arbitrario z = (z1 , . . . , zn ) Rn , se tiene que la diferencia entre estos valores
, x
est
a dada por
Df ( z ) Df (
x) ( x0 ) ( x) Df (
z ) = (Df ( x0 )) (
z)
f1 f1 f1 f1
x) x1 (
x1 ( x0 ) xn (
x) xn (
x0 ) z1
=
.
.. .. .. ..
. . .
fm fm fm fm
x1 (
x ) x1 (
x 0 ) xn (
x ) xn (
x 0 ) zn
x) f1 (
= ((f1 ( x0 )) z, . . . , (fm (
x) fm (
x0 )) z) (5.17)
de tal forma que su distancia satisface que
kDf ( z ) Df (
x) ( z )k = k((f1 (
x0 ) ( x) f1 (
x0 )) z, . . . , (fm (
x) fm (
x0 )) z)k
|(f1 (
x) f1 (
x0 )) z| + + |(fm (
x) fm (
x0 )) z|
kf1 (
x) f1 (x0 )k k
z k + + kfm ( x) fm (
x0 )k kzk
m
X
= kzk kfj (
x) fj ( x0 )k
j=1
v
m uX
u n fj
2
X fj
= k
zk t x)
( (
x0 )
j=1 i=1
xi xi
De lo anterior se desprende que, si

fj fj
x)
xi (
x0 ) <
(
xi
entonces
v
m uX
u n fj
2
X fj
kDf ( z ) Df (
x) ( z )k k
x0 ) ( zk t x)
( (
x0 )
j=1 i=1
xi xi
v
m uX
X u n 2
< k
zk t ( )
j=1 i=1
v
m u n
X uX
t
= k
zk 1
j=1 i=1
m
X
z k n
= k 1
j=1
251 J. P
aez
on inversa

z k m n
= k (5.18)
para toda z Rn .
Esta ultima desigualdad lo que nos dice es que, si la distancia entre las entradas correspondientes de
Df (x) y Df (x0 ) es peque
na, entonces la distancia entre los valores de Df ( x) y Df (x0 ) en cualquier
z Rn tambien es, con respecto a k
z k , proporcionalmente peque na.
, x0 U son
Lo interesante de la condicion anterior es que lo recproco tambien es cierto. Es decir, si x
tales que
kDf ( z ) Df (
x) ( z )k k
x0 ) ( zk
para toda z Rn , entonces se tiene que

fj fj

xi (
x ) (
x 0 )
xi
para cada i {1, . . . , n} y cada j {1, . . . , m}. En efecto, dado que
Df ( z ) Df (
x) ( x0 ) ( x) f1 (
z ) = ((f1 ( x0 )) z, . . . , (fm (
x) fm (
x0 )) z)
para toda z Rn , entonces para cada i {1, . . . , n} se tiene que

f1 f1 fm fm
Df ( ei ) Df (
x) ( x0 ) (
ei ) = x)
( (
x0 ), . . . , x)
( (
x0 )
xi xi xi xi
y por lo tanto

fj fj
x)
xi ( x0 ) kDf (
( ei ) Df (
x) ( x0 ) (
ei )k
xi
k
ei k
=
para cada j {1, . . . , m}.

La discusion anterior da lugar a la siguiente proposicion que nos aporta una caracterizacion de las
funciones de clase C 1 en una regi
on U .
on 5.17 Sea f = (f1 , . . . , fm ) : U Rn Rm . La funci

Proposici on f es de clase C 1 en U si y s
olo si
U, y
1. f es derivable para cada x
0 U y cada > 0 existe > 0 tal que B (
2. para cada x x0 ) U , y si x
B (
x0 ) entonces
kDf ( z ) Df (
x) ( z )k k
x0 ) ( zk
para toda z Rn .
Demostraci on. ( = ) Como f es de clase C 1 en U , por la proposicion 5.10 sabemos que f es derivable
para cada x U.
f
Sean ahora x 0 U y > 0. Como f es de clase C 1 en U , entonces xji es continua en x 0 para cada
i {1, . . . , n} y cada j {1, . . . , m}, de tal forma que existe > 0 tal que B (
x0 ) U y si x
B (
x0 ) U
entonces
fj fj 1
x)
xi (
x0 ) <
(
xi m n
1
para toda i {1, . . . , n} y toda j {1, . . . , m}. Por tanto, tomando =
m n
en la desigualdad 5.18, se
tiene que

kDf (
x) ( z ) Df ( z k m n
z )k k
x0 ) (
= k
zk
J. P
aez 252
para toda z Rn .
( = ) Recprocamente, para x
0 U y > 0 sabemos que existe > 0 tal que si x
B (
x0 ) U
entonces
kDf ( z ) Df (
x) ( z )k k
x0 ) ( zk
para toda z Rn .
Ahora, por la identidad 5.17, tomando z = ei para cada i {1, . . . , n}, se tiene que

f1 f1 fm fm
x)
( (
x0 ), . . . , x)
( (
x0 ) = Df ( ei ) Df (
x) ( x0 ) (
ei )
xi xi xi xi
de modo que

fj fj f1 f1 fm fm

xi (
x ) (
x )
0 (
x ) (
x 0 ), . . . , (
x ) (
x 0 )
xi xi xi xi xi
= kDf ( ei ) Df (
x) ( x0 ) (
ei )k
k
ei k
=
fj
para cada j {1, . . . , m}, lo que prueba que xi es continua en x0 U , y por lo tanto que f es de clase C 1
en U .
Dado que el tema de esta secci on se centra en la b

usqueda de condiciones para que una funci on f de Rn en
n
R sea invertible en la vecindad de un punto x 0 de su dominio, y que bajo ciertas condiciones de derivabilidad
de f en x0 , esta se parece mucho (en una vecindad de este punto) a una funci on lineal, empezaremos por
dar condiciones para que una funci on lineal L de Rn en Rn sea invertible.
Antes de hacer esto, como seguramente el lector recordara de su curso de Algebra Lineal, decimos
que una funci o n lineal L : R n
R n
es invertible si existe otra funci
o n lineal L : Rn Rn tal que

LL (x) = x = L L (
x) para toda x Rn , y que cuando esta funci on lineal L existe, entonces es
u
nica y que por esta razon se le suele denotar por L1 .
Tambien es oportuno tener presente que en este mismo curso de Algebra Lineal se debieron haber probado
dos condiciones necesarias y suficientes para que una funci on lineal L : Rn Rn sea invertible. Una, que
x) = 0 solo si x
dice que L es invertible si y solo si L ( = 0; y dos, que L es invertible si y solo si la matriz M
n
asociada a L (en cualesquiera bases de ambos R , el dominio y el contradominio) es invertible, lo que a su
vez es equivalente a que det(M ) 6= 0.
Una vez dicho lo anterior, lo siguiente que haremos sera formular (apoyados en algunas de las condiciones
mencionadas) otra condicion necesaria y suficiente para que una funci on lineal L : Rn Rn sea invertible.
Proposicion 5.18 Sea L : Rn Rn una funci
on lineal. L tiene inversa (o L es invertible) si y s
olo si
existe m > 0 tal que
kL (
x)k m kxk
Rn .
para toda x
Demostraci x) = 0 solo si x
on. Si L tiene inversa, sabemos que L ( = 0 de tal forma que, si consideramos
el conjunto
S n1 = {
x Rn | k xk}
entonces kL ( S n1 .
x)k > 0 para toda x
n1
Ahora, dado que S es un conjunto cerrado y acotado y L es una funci on continua (en Rn ), entonces
n1 n1
kLk alcanza su mnimo valor sobre S , es decir, existe x0 S tal que
kL (
x)k kL (
x0 )k > 0
para toda
x S n1
. Por tanto, si hacemos m = kL (
x0 )k > 0 y tomamos x 6= 0 (pues claramente
Rn , con x
L 0 = 0 = m 0 ), entonces

x

S n1
k
xk
253 J. P
aez
on inversa
y por lo tanto
x

L kL (
x0 )k = m
k
xk
de modo que
kL (
x)k m k
xk
lo cual prueba la primera implicacion.
Recprocamente, si existe m > 0 tal que
kL (
x)k m k
xk
Rn , entonces se tiene que

para toda x
kL (
x)k m k
xk > 0
6=
Rn , con x
para toda x x) = 0 solo si x = 0 lo que implica que L es invertible.
0, es decir que L (

Con lo anterior, ya tenemos las herramientas de Algebra Lineal necesarias para probar el teorema principal
de esta secci
on: el teorema de la funci
on inversa. Antes de hacer esto, e incluso antes de formular este teorema,
daremos un par de lemas con los cuales iremos preparando el terreno para enunciarlo y probarlo.
El primero de estos dos lemas nos permitira probar que, si la derivada de una funci on f (de clase C 1 en
un conjunto abierto U ) es invertible en un punto x 0 U (en donde Df ( x0 ) se toma como funci on lineal o
como matriz), entonces la derivada de f sigue siendo invertible para todo punto en una vecindad del punto
x
0 .
Lema 5.19 Sea f : U Rn Rn de clase C 1 en el conjunto abierto U , y x

0 U . Si Df (
x0 ) es invertible
x0 ) U y
entonces existen > 0 y m > 0 tales que B (
kDf ( z )k m k
x) ( zk
x0 ) y para toda z Rn .
B (
para toda x
Demostraci x0 ) es invertible sabemos que existe m > 0 tal que

on. Por la proposicion 5.18, dado que Df (
kDf ( z )k m k
x0 ) ( zk
para toda z Rn .
Por otra parte, como f es de clase C 1 en U (que es un abierto), por la proposicion 5.17, tomando
= m /2 > 0, sabemos que existe > 0 tal que B (
x0 ) U
m
kDf ( z ) Df (
x) ( z )k k
x0 ) ( zk
2
x0 ) y para toda z Rn . Por lo tanto, de la desigualdad del triangulo tenemos que
B (
para toda x
kDf ( z )k kDf (
x) ( z )k kDf (
x0 ) ( z ) Df (
x) ( x0 ) (
z )k
m
m k
z k k
zk
2
m
= k
zk
2
para toda x x0 ) U y para toda z Rn de tal manera que tomando m = m /2 > 0, obtenemos el
B (
resultado deseado.
Como una consecuencia inmediata de este lema y de la proposicion 5.18, obtenemos el siguiente
Corolario 5.20 Sea f : U Rn Rn de clase C 1 en U y x 0 U . Si Df (

x0 ) es invertible entonces existe
x0 ) U y Df (
> 0 tal que B ( x) es invertible para toda x B (
x0 ).
J. P
aez 254
El segundo lema que probaremos tambien es fundamental en la prueba del teorema de la funci on inversa,
pues a partir de este podremos asegurar que una funcion f es localmente invertible, y que la funcion inversa
que se puede definir, es continua en su dominio. Antes, solo recordemos que en el captulo 1 definimos otras
normas para los elementos de Rn , una de ellas llamada la norma infinito (que utilizaremos en la prueba del
siguiente lema), y que esta definida (y es denotada) como
k
xk := max{|x1 | , . . . , |xn |}
= (x1 , . . . , xn ) Rn , y que con relacion a la norma euclideana satisface la desigualdad

para cada x

k
xk n k xk
la cual es valida para toda x Rn .
Lema 5.21 Sea f : U Rn Rn de clase C 1 en el conjunto abierto U , y x

0 U . Si Df (
x0 ) es invertible
x0 ) U y
entonces existen > 0 y m > 0 tales que B (
m k
yx
k kf (
y ) f (
x)k (5.19)
, y B (
para toda x x0 ).
Demostraci
on. Primero recordemos que si f = (f1 , . . . , fn ) entonces
Df (
x) ( x) z, , . . . , fn (
z ) = (f1 ( x) z)
U y cada z Rn .
para cada x
Como Df (x0 ) es invertible, por la proposicion 5.18 sabemos que existe m > 0 tal que
kDf ( z )k m k
x0 ) ( zk
para toda z Rn .
Por otra parte, por la proposicion 5.17 sabemos que para m /2 n > 0 existe > 0 tal que si x

x0 ) U entonces
B (
m
kDf ( z ) Df (
x) ( zk
z )k k
x0 ) (
2 n
para toda z Rn .
Probaremos que esta > 0 y esta m = m /2 n > 0 son las cantidades para las que se satisface la
desigualdad 5.19, para toda x , y B ( x0 ) U .
Sean x, y B (
x0 ) y k {1, . . . , n} tal que kDf ( yx
x0 ) ( )k = |fk (
x0 ) (
y x)|. Entonces
|fk (
x0 ) (
yx
)| = kDf ( y x)k
x0 ) (
1
kDf ( yx
x0 ) ( )k
n
Ahora, como B (
x0 ) es un conjunto convexo, sabemos que el segmento
x, y] = {
[ ) Rn | t [0, 1]}
yx
x + t(
est
a totalmente contenido en B ( on k : [0, 1] R R definida como
x0 ) U , de tal forma que la funci
k (t) = fk ( yx
x + t( ))
es derivable para toda t [0, 1].

De esta forma, aplicando el teorema del valor medio para funciones de R en R, sabemos que existe
k (0, 1) tal que
y ) fk (
fk ( x) = k (1) k (0)
= (1 0) k (k )
255 J. P
aez
on inversa
= k (k )
= fk ( y x)) (
x + k ( yx
)
= (x1 , . . . , xn ) Rn se tiene que |xi | k

Si recordamos ahora que para x xk para toda i {1, . . . , n},
entonces tambien tenemos que
kf (
y) f ( x)k |fk (
y) fk (
x)|
y
|fk (
x) (
yx
) fk (
x0 ) (
yx
)| kDf ( yx
x0 ) ( ) Df ( yx
x) ( )k
Con base en las desigualdades anteriores (y la desigualdad del triangulo), se tiene que
kf (
y) f (
x)k |fk (
y ) fk (
x)|
= |k (k )|
= |fk ( yx
x + k ( )) (
yx
)|
|fk (
x0 ) (
yx )| |fk ( yx
x + k ( )) (
y x) fk (
x0 ) (
yx )|
1
kDf ( yx
x0 ) ( )k kDf ( yx
x + k ( )) (yx ) Df ( y x)k
x0 ) (
n
1 m
(m k y xk) k yx k
n 2 n
m
= k yx k
2 n
= m k
yx k
que es la desigualdad que se deseaba probar.
Como mencionamos anteriormente, de este lema se sigue el siguiente
Corolario 5.22 Sea f : U Rn Rn de clase C 1 en el conjunto abierto U , y x0 U . Si Df (

x0 ) es
x0 ) U , f es inyectiva en B (
invertible entonces existe > 0 tal que B ( x0 ), y adem
as
f 1 : f (B (
x0 )) Rn Rn
es uniformemente continua en su dominio.
Demostraci
on. Por el lema anterior sabemos que existen > 0 y m > 0 tales que
x ) f (
kf ( x xk
x)k m k
para todo x B (
, x x0 ) U .
Ahora, si tomamos x, x B ( , entonces
x0 ), con x 6= x
x ) f (
kf ( x xk
x)k m k
>0
de modo que f ( x ) 6= f (
x) y por lo tanto se tiene que f es inyectiva en B ( x0 ).
Por otra parte, dado > 0, si tomamos = m y y, y f (B ( y yk < , si
x0 )) tales que k
, x B (
x x0 ) son tales que y = f (x ) y y = f (
x), se tiene que
1
f ( y ) f 1 ( x x
y ) = k k
1
x ) f (
kf ( x)k
m
1
= k
y yk
m
1
<
m
J. P
aez 256
lo que prueba que f 1 es uniformemente continua (y por tanto continua) en f (B (

x0 )).
Con base en todo el trabajo realizado previamente, ya estamos en condiciones de formular y probar el
teorema de la funci
on inversa.
Teorema 5.23 (de la funci on inversa) Sea f : U Rn Rn de clase C 1 en el conjunto abierto U , y

0 U . Si Df (
x x0 ) es invertible entonces existe > 0 tal que:
x0 ) U y f es inyectiva en B (
1. B ( x0 ),
2. f 1 : f (B (
x0 )) Rn Rn es continua en f (B (
x0 )),
x0 )) Rn es un conjunto abierto, y
3. f (B (
4. f 1 es de clase C 1 en f (B (
x0 )) y adem x) f (B (
as, si y = f ( x0 )) entonces
1
Df 1 (
y ) = Df 1 (f (
x)) = (Df (
x))
Demostraci
on. Por los lemas 5.19 y 5.21 sabemos que existen > 0 y m > 0 tales que
x x
m k x ) f (
k kf ( x)k (5.20)
para toda x B (
, x x0 ) U , y que
kDf ( z )k m k
x) ( zk (5.21)
para toda x x0 ) y toda z Rn .
B (
Ahora, por el corolario 5.22 se tiene que f es inyectiva en B ( x0 ) y que f 1 es continua en f (B ( x0 )),
con lo cual se tiene la prueba de los incisos 1. y 2. del enunciado.
Probaremos ahora que f (B ( x0 )) Rn es un conjunto abierto. Sea y = f ( x ) f (B (
x0 )), con

B (
x x0 ). Como B (x0 ) es un conjunto abierto, existe > 0 tal que el conjunto
x Rn | k
A = { k }
xx
se queda contenido en B ( x0 ). Probaremos que existe r > 0 tal que Br ( y ) f (A) f (B (

x0 )).
Para justificar de manera intuitiva el valor de r que vamos a tomar, observese que si y Br ( y ) fuera
tal que y = f (
x) para alguna x A, por la desigualdad 5.20 se debera tener que

kxx k = f 1 (
y ) f 1 (
y )
1
y y k
k
m
r
<
m
A, se debera elegir r de tal forma
de tal forma que, para no caer en contradiccion con el supuesto de que x
que r/m .
Con base en el razonamiento anterior, tomamos r = m /2 > 0 y y Br ( y ). Para probar que existe
A tal que f (
x x ) = y , definimos h : U Rn R como
2
x) y k
x) = kf (
h (
x) y ) (f (
= (f ( x) y )
Dado que A U es un conjunto cerrado y acotado, y h es continua en U , sabemos que h alcanza un valor
A tal que
mnimo sobre A, es decir, que existe x
x ) y k = h (
kf ( x )
h (
x)
257 J. P
aez
on inversa
2
x) y k
= kf (
para toda x A. N otese que ahora nuestro objetivo es probar que h ( x ) = 0 pues de este hecho se concluye

que f (x ) = y .
Ahora, como x A se tiene que k x x
k de modo que, aun y cuando h alcanza un valor mnimo

en x , no podemos asegurar que este sea un punto crtico de h.
Con el fin de probar que x s es un punto crtico de h, descartaremos la posibilidad de que k
x x
k = .
Si este fuera el caso, por la desigualdad del triangulo se tendra que
x ) = kf (
h ( x ) y k
x ) y k k
kf ( y y k
x ) f (
= kf ( x )k k
y y k

m kx x k ky y k

m
> m
2
m
=
2
y y k
> k
= kf (x ) y k
x )
= h (
x ) es el valor mnimo de h sobre A.

lo que contradice el hecho de que h (
De esta forma, se debe tener que kx x k < y por tanto x es un punto crtico de h, es decir que
x ) = 2 (f (
Dh ( x ) y ) Df (
x )
= 0
y por lo tanto que
x ) y ) Df (
((f ( x )) ( x ) y ) (Df (
z ) = (f ( x ) (
z ))
=0
para toda z Rn .
Si ahora recordamos que Df ( B (
x) es invertible (y por tanto suprayectiva) para toda x x0 ), entonces
debe existir z0 Rn tal que
x ) (
Df ( x ) y
z0 ) = f (
de tal forma que en particular se tiene que
x ) y ) (Df (
0 = (f ( x ) (
z0 ))
x ) y ) (f (
= (f ( x ) y )
2
x ) y k
= kf (
y por lo tanto que f (x ) = y , lo que prueba que Br (

y ) f (B (
x0 )), es decir que f (B (
x0 )) es un conjunto
abierto.
Para probar el u ltimo inciso, nuestro primer paso sera demostrar que f 1 es derivable en todo punto

x ) f (B (
y = f ( x0 )).
Dado que Df ( x ) es invertible para toda x B (
x0 ), mostraremos que la funci on lineal
1
x ))
L = (Df (
satisface la definicion 5.1, es decir que

f 1 (
y ) f 1 (
y ) L(
y y )
lim
=0 (5.22)
y
y k
y y k
J. P
aez 258
Para ello, recurriremos a la funci x0 ) Rn Rn dada por

on g : B (

x
x L(f (x)f ( x ))

kf (
x)f (x )k si x
6= x
g (
x) =

0 si x
=x
la cual est
a bien definida puesto que f es inyectiva en la bola B ( x0 ).
Observese que la composicion g f 1 tambien est a bien definida sobre el conjunto abierto f (B ( y}
x0 ))\{
y que

g f 1 (y ) = g f 1 (
y)
1
f ( y )f 1 (y )L( y )
y

k
y y k si y 6= y
=

0 si y = y
para toda y f (B ( y }.
x0 )) \ {
En virtud de lo anterior, tenemos que
f 1 (
y ) f 1 (
y ) L(
y y )
lim = lim g f 1 (
y)
y
y y y k
k y
y
de tal forma que, como f 1 es continua en y , por el inciso 6. de la proposicion 2.41 del captulo 2, bastara
probar que g es continua en x = f 1 (
y ), lo que es equivalente a probar que
1
(Df (
x
x x )) (f ( x ))
x) f (
lim g (
x) = lim
x

x x

x kf ( x )k
x) f (
= 0
Para probar este u

ltimo lmite, n
otese que
x x L(f ( x ))
x) f (
kf (
x) f (
x )k
1
(Df (
x
x x )) (f ( x ))
x) f (
=
kf ( x )k
x) f (
1
x ))
(Df ( [Df ( x ) (
xx ) (f ( x ))]
x) f (
=
kf (x) f ( x )k

k
x x k 1 x ) Df (
x) f (
f ( x ) (
x x )
= (Df (x ))
kf (
x) f (x )k kxx k
1
x ))
de tal forma que, como (Df ( es una funci
on continua (toda funci
on lineal es continua) y f es derivable

en x
, se tiene que

x ) Df (
x) f (
f (
1 x ) (
xx )
x ))
lim (Df (
x

x kxx k

1 x) f (
f ( x ) Df ( x ) (
xx )
x ))
= (Df ( lim
x
x k xx k
1
x ))
= (Df ( 0
=
0
y como por la desigualdad 5.4 sabemos que

x x k
k 1

kf (
x) f (x )k m
259 J. P
aez
on inversa
para toda x B (
, x x0 ), con x , concluimos que
6= x
1
x
x (Df (x )) (f ( x ))
x) f (
lim
x

x kf (
x) f ( x )k

k
xx k 1 x ) Df (
x) f (
f ( x ) (
x x )
= lim (Df (
x ))
x x kf (
x) f (x )k kxx k
=0
lo que prueba que f 1 es derivable en y = f (

x ) f (B (
x0 )) y que
Df 1 (
y ) = Df 1 (f (
x ))
1
x ))
= (Df (
para toda y f (B (
x0 )).
Finalmente probaremos que f 1 es de clase C 1 en f (B ( x0 )) y para ello usaremos el criterio de la
proposicion 5.17. Antes, observemos que de la desigualdad 5.21 y el hecho de que
1
Df 1 (f (
x)) = (Df (
x)) (5.23)
B (
para toda x x0 ), se tiene que
1 1

Df (f (
x)) (
z ) = (Df (
x)) (z )
1
k
zk (5.24)
m
para toda z Rn .
Tambien notemos que, si A, B R son diferentes de 0, entonces
1 1
A1 B 1 =
A B
BA
=
AB
1 1
= (B A)
A B
= A1 (B A) B 1
es decir que
A1 B 1 = A1 (B A) B 1
Ahora observe que esta u ltima identidad sigue siendo valida si A y B son matrices de n n invertibles, de
modo que si L1 , L2 : Rn Rn son funciones lineales que tienen inversa, entonces tambien se cumple que
L1 1 1 1
1 L2 = L1 [L2 L1 ] L2
De esta u
ltima identidad, y usando 5.23 para x B (
, x x0 ), se deduce que
1
Df 1 (f (
x)) Df 1 (f ( x))1 (Df (
x )) = (Df ( x ))
1 1
= (Df (
x)) x ) Df (
[Df ( x ))
x)] (Df (
= Df 1 (f ( x ) Df (
x)) [(Df ( x))] Df 1 (f (
x ))
y por la desigualdad 5.24, se tiene que

1
Df (f ( z ) Df 1 (f (
x)) ( x )) (
z ) = Df 1 (f (
x)) [Df (x ) Df (
x)] Df 1 (f (
x )) (z )
1 1

= Df (f ( x)) [Df ( x ) Df ( x)] Df (f ( x )) (z)
J. P
aez 260
1
x ) Df (
[Df ( x)] Df 1 (f (
x )) (
z) (5.25)
m
B (
para todas x, x x0 ) y toda z Rn .
Una vez dicho lo anterior, sean y = f ( x ) f (B (x0 )) y > 0. Como f es de clase C 1 en B (x0 ),
por la proposicion 5.17 ( = ), y el hecho de que B ( x0 ) es un abierto, sabemos que existe > 0 con las
propiedades de que B ( x ) B ( x ) entonces
x0 ), y que si x B (
x ) Df (
k[Df ( z )k m2 k
x)] ( zk (5.26)
para toda z Rn .
Por tanto, como f 1 es continua en f (B ( x0 )) (que ya probamos que es un conjunto abierto), sabemos
y ) f (B (
que existe > 0 tal que B ( x0 )) y que si y = f ( y ) entonces
x) B (
1
f ( y ) f 1 (
y ) = k
xx k
<
Por lo tanto, aplicando las desigualdades 5.25, 5.26 y 5.24, concluimos que
1
Df ( z ) Df 1 (
y ) ( z ) = Df 1 (f (
y ) ( x)) (z ) Df 1 (f ( x )) (
z )
1
[Df (x ) Df ( x)] Df 1 (f ( x )) (
z)
m
1
m2 Df 1 (f ( x )) (
z )
m
= m Df 1 (f ( x )) (
z )

1
m kzk
m
= k
zk
para toda z Rn , de tal forma que nuevamente por la proposicion 5.17 ( = ) tenemos que f 1 es de clase
C 1 en f (B (
x0 )), con lo cual terminamos la prueba.
El teorema de la funcion inversa es un resultado de caracter teorico muy importante, pero tambien lo es
desde un punto de vista practico.
Como prueba de ello, mostraremos c omo se emplea en el siguiente problema de cambio de coordenadas: si
una funcion f de R3 en R est a dada en terminos de coordenadas esfericas, nuestro problema sera encontrar
la expresion de su derivada en terminos de las coordenadas cartesianas, sin necesidad de escribir a f en
terminos de estas u
ltimas.
Ejemplo 5.24 Sea g : R3 R3 definida como
g (, , ) = ( sen() cos(), sen() sen(), cos())
Como seguramente el lector estar a de acuerdo, esta funci

on es la funci
on de cambio de coordenadas
esfericas a coordenadas cartesianas para puntos de R3 .
Tambien podemos concluir con toda certeza que g es de clase C k en R3 para toda k N, y por lo tanto
derivable en todo punto de R3 , con

sen() cos() sen() sen() cos() cos()
Dg (, , ) = sen() sen() sen() cos() cos() sen()
cos() 0 sen()
Si ahora observamos que

det (Dg (, , )) = 2 sen()
tendremos que Dg (, , ) es invertible para toda (, , ) R3 , si 6= 0 y 6= k, con k Z.
261 J. P
aez
on inversa
De esta forma, el teorema de la funci on inversa nos asegura que, si (0 , 0 , 0 ) R3 es tal que 0 6= 0
y k < 0 < (k + 1) para alguna k Z entonces existe > 0 tal que la funci on g es inyectiva en la bola
on g 1 est
B (0 , 0 , 0 ), que la funci a definida en el abierto g (B (0 , 0 , 0 )) y que
1
Dg 1 (g(, , )) = (Dg (, , ))

2 sen2 () cos() 2 sen2 () sen() 2 sen() cos()
1
= 2 sen() cos() 0
sen()
sen() cos() cos() sen() cos() sen() sen2 ()

sen() cos() sen() sen() cos()
=
sen()
sen()
cos()
sen() 0

1 1 1
cos() cos() cos() sen() sen()
para toda (x, y, z) = g (, , ) g (B (0 , 0 , 0 )).

Dado que g es la funci on de cambio de coordenadas esfericas a coordenadas cartesianas, entonces g 1
sera la funci
on de cambio de coordenadas cartesianas a coordenadas esfericas, funci on que no es tan sencilla
de calcular explcitamente.
Pero aun y cuando no tengamos una expresi on explcita para g 1 , el hecho de que tengamos una expresion
para su derivada nos resulta de mucha ayuda.
En efecto, si f : U R3 R es una funci on de clase C 1 la cual est a dada en terminos de coordenadas
esfericas, de la misma forma que hicimos en la subsecci on 5.3.1 con la funci on de cambio de coordenadas
polares a cartesianas, podemos asumir que la funci on f g 1 es la misma funci on f solo que expresada en
terminos de coordenadas cartesianas.
Por tanto, recurriendo nuevamente a la regla de la cadena, tendremos que

D f g 1 ( x) = Df g 1 ( x) Dg 1 ( x)
y cometiendo el mismo abuso de notaci on al escribir que g 1 ( , y por tanto que f g 1 = f , de la

x) = x
identidad anterior obtenemos que las derivadas parciales de f con respecto a las variables cartesianas x, y y
z estar
an dadas por
f f sen() f 1 f
(
x) = sen() cos() x)
( (
x) + cos() cos() (
x)
x sen()
f f cos() f 1 f
(
x) = sen() sen() (
x) + (
x) + cos() sen() (
x)
y sen()
y
f f 1 f
(
x) = cos() x) sen()
( (
x)
z
Insistimos de nuevo en que, la forma correcta de escribir la identidad anterior en terminos de las coor-
denadas cartesianas de x, es la siguiente:

f g 1
(x, y, z)
x
f 1 sen() f 1 1 f 1
= sen() cos() g (x, y, z) g (x, y, z) + cos() cos() g (x, y, z)
sen()

f sen() f
= sen() cos() g 1 (x, y, z) g 1 (x, y, z)
sen()

1 f
+ cos() cos() g 1 (x, y, z)

f g 1
(x, y, z)
y
J. P
aez 262
f 1 cos() f 1 1 f 1
= sen() sen() g (x, y, z) + g (x, y, z) + cos() sen() g (x, y, z)
sen()

f cos() f
= sen() sen() g 1 (x, y, z) + g 1 (x, y, z)
sen()

1 f 1
+ cos() sen() g (x, y, z)

y
f g 1 f 1 1 f 1
(x, y, z) = cos() g (x, y, z) sen() g (x, y, z)
z
Notese que las identidades anteriores tambien se pueden escribir en terminos de las coordenadas esfericas,
que son de las que depende la funcion f .
En efecto, si recordamos que (x, y, z) = g (, , ), de las identidades anteriores se obtiene que
f
(, , )
x
f g 1
:= (g (, , ))
x
f sen() f 1 f
= sen() cos() (, , ) (, , ) + cos() cos() (, , )
sen()
f
(, , )
y

f g 1
:= (g (, , ))
y
f cos() f 1 f
= sen() sen() (, , ) + (, , ) + cos() sen() (, , )
sen()
y

f f g 1
(, , ) := (g (, , ))
z z
f 1 f
= cos() (, , ) sen() (, , )

Como mencionamos en la secci on anterior, con base en el teorema de la funci on inversa podemos dar la
prueba del teorema de la funcion implcita, y lo mas interesante es que tambien podemos hacer lo recproco,
es decir, probar el teorema de la funci
on inversa a partir del teorema de la funcion implcita (lo que el lector
hara en el problema 25). Este hecho muestra que ambos teoremas son equivalentes, raz on por la cual es
suficiente con dar la prueba de solo uno de ellos.
Teorema 5.25 (de la funci on implcita) Sean g1 , . . . , gm : U Rm Rk R de clase C 1 en U . Si

S = (x, y) = (x1 , . . . , xm , y1 , . . . , yk ) Rm Rk | gi (
x, y) = 0 para i {1, . . . , m}

(0) (0) (0) (0)
x0 , y0 ) = x1 , . . . , xm , y1 , . . . , yk
y ( S es tal que la matriz
g1 g1
x1x0 , y0 )
( xm (
x0 , y0 )
.. .. ..
. . .
gm gm
x1 (
x ,
0 0y
) xm (
x0 , y0 )
y0 ) Rk Rm de clase C 1 en Br (
es invertible entonces existen r > 0 y h : Br ( y0 ) tales que h (
y0 ) = x0 y
(h ( y0 ).
263 J. P
aez
on inversa
on. Definamos g : U Rm Rk Rm como

Demostraci
g (
x, y) = (g1 (
x, y) , . . . , gm (
x, y))
y f : U Rm Rk Rm Rk como
f (
x, y) = (g (
x, y) , y)
Es inmediato que f y g son de clase C 1 en U y que ademas:

x0 , y0 ) S entonces f (
1. como ( x0 , y0 ) , y0 ) = 0, y0 , y
x0 , y0 ) = (g (
2. la matriz
g1 g1 g1 g1

x1 x0 , y0 )
( xm (
x0 , y0 ) y1 x0 , y0 )
( yk (
x0 , y0 )

.. .. .. .. .. ..

. . . . . .
gm gm gm gm
(
x ,
0 0y
) (
x0 , y0 ) (
x ,
0 0y
) (
x 0, y
0 )
Df (
x0 , y0 ) = x1 xm y1 yk

0 0 1 0

.. .. .. .. .. ..
. . . . . .
0 0 0 1
es invertible.
Por tanto, por el teorema de la funci on inversa sabemos que existe > 0 tal que:

1. f es inyectiva en B ( x, y) Rm Rk | k(
x0 , y0 ) = ( x, y) (
x0 , y0 )k < r U ,
x0 , y0 )) Rm Rk es un conjunto abierto, y
2. f (B (
3. f 1 : f (B (
x0 , y0 )) Rm Rk es de clase C 1 en f (B (
x0 , y0 )).
De esta forma, como

x0 , y0 ) f (B (
0, y0 = f ( x0 , y0 ))

existe r > 0 tal que Br 0, y0 f (B (
x0 , y0 )). N
otese que, si

y Br (y0 ) = y Rk | ky y0 k < r

entonces 0, y Br 0, y0 . De esta manera, si f 1 = f11 , . . . , fm+k
1
, definimos
y 0 ) Rk Rm
h : Br (
como
y) = f11 0, y , . . . , fm
h ( 1
0, y

Dado que f 1 tambien es de clase C 1 en Br 0, y0 f (B ( x0 , y0 )), se sigue inmediatamente que h es
de clase C 1 en Br (y0 ).
Ahora mostraremos que (h ( y ) , y) S para toda y Br ( y0 ). Para ello, n otese que para toda y Br (
y0 )
se tiene que

0, y = f f 1 0, y
1
= f f11 0, y , . . . , fm1
0, y , fm+1 0, y , . . . , f 1 0, y
m+k

= f h ( 1
y ) , fm+1 1
0, y , . . . , fm+k 0, y
1
= g h ( 1
y ) , fm+1
0, y , . . . , f 1 0, y , fm+1 0, y , . . . , f 1 0, y
m+k m+k
de modo que

0 = g h ( 1
y ) , fm+1 0, y , . . . , f 1 0, y
m+k
J. P
aez 264
5.6. Problemas Captulo 5. La derivada de funciones de Rn en Rm
y
1
y = fm+1 0, y , . . . , f 1 0, y
m+k
es decir que

g (h (
y ) , y) = g h ( 1
y ) , fm+1 0, y , . . . , f 1 0, y
m+k
= 0
lo que significa que (h ( y0 ), que es lo que nos restaba probar.
Con esta prueba concluimos esta secci

on, este captulo y este texto!
5.6 Problemas
1. Sea f : U R2 R derivable en cada punto x
U . Pruebe que:
(a) la gr
afica de f (Gf ) es una superficie suave en todos sus puntos
(b) si x0 = (x0 , y0 , f (x0 , y0 )) Gf , el plano tangente a Gf en x0 calculado de acuerdo con la definicion
4.18 es el mismo que se obtiene si se calcula de acuerdo con la definicion 5.4
2. Calcule una ecuaci

on cartesiana del plano tangente en un punto, de una superficie que est
a parametrizada
on : U R2 R3 (definicion 5.4).
por una funci
3. Pruebe que la proposicion 5.6 es independiente de las funciones coordenadas de f que se tomen.
4. Sea f : U Rn Rm derivable en el punto x
0 U . Pruebe que existen r > 0 y M > 0 tales que
kf (
x) f (
x0 )k
M
k
xx 0 k
para toda x (Br (
x0 ) \ {
x0 }) U .
5. Sean f : U Rn Rm , g : V Rm R y x0 U tales que f (U ) V . Definimos : U Rn Rk
como
g(f (
x))g(f (
x0 ))Dg(f (x0 ))(f (
x)f (
x0 ))

kf (
x)f (
x0 )k si f ( x0 ) 6= 0
x) f (
(
x) =

0 x0 ) = 0
x) f (
si f (
Pruebe que, si f es continua en x
0 y g es derivable en y0 = f (
x0 ) entonces es continua en x
0 .
6. Sean f : U Rn R y g : U Rn Rm derivables en el punto x 0 U . Pruebe que la funci
on
(f g)( x) g(
x) = f ( 0 U y de una formula para la D(f g)(
x) es derivable en x x0 ).

7. Si A = a11 a12 a13 M13 (R) y

b11 b1n
B = b21 b2n M3n (R)
b31 b3n
definimos el producto cruz de la matriz A por la matriz B (que denotaremos por AB), como la matriz
de 3 n (con entradas reales) cuyas entradas de su jesima columna coinciden con las coordenadas
del vector
(a11 , a12 , a13 ) (b1j , b2j , b3j ) = (a12 b3j a13 b2j , a13 b1j a11 b3j , a11 b2j a12 b1j )
es decir que
a12 b31 a13 b21 a12 b3n a13 b2n
A B := a13 b11 a11 b31 a13 b1n a11 b3n M3n (R)
a11 b21 a12 b11 a11 b2n a12 b1n
265 J. P
aez
Captulo 5. La derivada de funciones de Rn en Rm 5.6. Problemas
Sean f = (f1 , f2 , f3 ), g = (g1 , g2 , g3 ) : U Rn R3 derivables en el punto x

0 U . Pruebe que la
on (f g)(
funci x) := f ( x) g( 0 U y de una formula para la D(f g)(
x) es derivable en x x0 ) en
terminos del producto cruz de matrices definido en el p arrafo anterior.
8. Encuentre todas las funciones f : Rn Rn tales que Df ( Rn .
x) es una matriz diagonal para toda x
Pruebe su respuesta.
9. Abusar de la notaci on (como de cualquier otra cosa) suele causar problemas. En particular, usar letras
(que casi siempre denotan variables) para referirse tambien a funciones nos puede llevar a errores. Sea
w = f (x, y, z) y z = g(x, y). Por la regla de la cadena, se tiene que:
w w x w y w z
= + +
x x x y x z x
y x
Como x y y son variables independientes, entonces x = 0 y como x = 1, se tiene que:
w w w z
= +
x x z x
As, w z
z x = 0. Si f (x, y, z) = 2x + y + 3z y g(x, y) = 5x + 18, entonces
w
z =3y z
x = 5 y por lo
tanto 0 = 15. Cual es el error?
10. Sean f y g definidas como
f (u, v) = (u cos(v), u sen(v))
con 0 < u y /2 < v < /2, y
p
g(x, y) = ( x2 + y 2 , arctan(y/x))
con 0 < x. Calcule D(f g)(x, y) y D(g f )(u, v).

11. (a) Suponga que la variable w est a en funci
on de las variables x, y, z y t (es decir: w = f (x, y, z, t)),
que x = g(u, z, t) y que z = h(u, t). Tomando en cuenta todas estas relaciones, calcule w t
(b) si
f (x, y, z, t) = 2xy + 3z + t2
g(u, z, t) = ut sen(z)
h(u, t) = 2u + t
w
calcule t para u = 1, t = 2 y y = 3
2 2
f 2f
12. Suponga que f : R2 R es tal que x (2, 1) = 3, f f f
y (2, 1) = 2, x2 (2, 1) = 0, yx (2, 1) = xy (2, 1) =
2 f 2 2 (f g)
1y y 2 (2, 1) = 2. Si g(u, v) = (u + v, uv) calcule vu (1, 1).
13. Sea f : U R2 R de clase C 2 en U tal que f x (x, y) > 0 para toda (x, y) U , y sea (x0 , y0 ) U .
Si I = {y R |(x0 , y) U }, definimos g : I R R como g(y) = f (x0 , y). Pruebe que:
(a) existe > 0 y h : (y0 , y0 + ) I R de clase C 1 tal que f (h(y), y) = f (x0 , y0 ) para toda
y (y0 , y0 + )
(b) g tiene un maximo (mnimo) local en y0 si y solo si h tiene un mnimo (m aximo) local en y0 .
2
(suponga que yf2 (x0 , y0 ) 6= 0, para que todo sea mas facil). Interprete geometricamente.
14. Sean f, g : U R2 R de clase C 1 en A. Definimos F : U R2 R2 y H : U R2 R como
F (x, y) = (f (x, y), g(x, y)) y H(x, y) = kF (x, y)k2
0 U que satisfaga las siguientes dos propiedades:

Demuestre que no existe x
(a) H tiene un maximo local en x

0
J. P
aez 266
(b) DF (
x0 ) es invertible
15. Sea f : Rn Rn derivable en un punto x 0 Rn y ademas supongase que x 0 es un punto fijo de f

(es decir: f (
x0 ) = x
0 ). Si A denota a la matriz Df ( o n g : Rn Rn
x0 ) y k N, encuentre una funci
derivable en x0 tal que Dg( x0 ) = Ak .
16. Sea f : U R3 R una funci on que esta expresada en terminos de las coordenadas cartesianas (x, y, z)
de cada punto x U . Use la funci on de cambio de coordenadas cilndricas (, , z) a coordenadas
cartesianas (x, y, z), y la regla de la cadena, para encontrar (en cada punto x U ) una base ortonormal
de R3 en la cual se pueda expresar a la derivada de f en x (Df (
x)) en terminos de las derivadas parciales
f f f
, y z . Compare con lo obtenido en el problema 15 del cap tulo 4.
17. Repita el problema anterior ahora para las coordenadas esfericas (, , ) y compare con lo obtenido
en el problema 16 del captulo 4.
18. Sean g1 , . . . , gm : U Rm Rk R, S y (
x0 , y0 ) S como en el teorema de la funci
on implcita. Si
g1 g1
x1 (
x0 , y0 ) xm (
x0 , y0 )

A= .
.. .. ..
. .
gm gm
x1 (
x ,
0 0y
) xm (
x0 , y0 )
y
g1 g1
y1 (
x0 , y0 ) yk (
x0 , y0 )

B=
.
. .. ..

. . .
gm gm
x0 , y0 )
y1 ( yk (
x 0 , y
0 )
pruebe que:
y0 ) = A1 B
Dh(
donde h es la funci
on cuya existencia es garantizada en el mencionado teorema.
19. Sea f : U Rn R de clase C 1 en U y S = { x U | f ( Rn , denotamos por x(i) el

x) = cte}. Si x
n1
elemento de R que se obtiene de x al eliminarle su iesima coordenada, con i {1, . . . , n}. Sea
(1) (n)
0 = (x0 , . . . , x0 ) S.
x
f
(a) pruebe que, si x0 ) 6=
xi ( 0 entonces existe hi : Ui Rn1 R de clase C 1 en Ui tal que
(i) (i) (i)
x
0 Ui , hi (
x0 ) = x0 y
(x1 , . . . , xi1 , hi (x1 , . . . , xi1 , xi+1 , . . . , xn ), xi+1 , . . . , xn ) S
para todo (x1 , . . . , xi1 , xi+1 , . . . , xn ) Ui

hi (i) hn (n)
(b) si hi es la funci
on del inciso anterior, calcule xi+1 (
x0 ) (para i = n calcule x1 (
x0 )) en
terminos de derivadas parciales de f
f
(c) si xi (
x0 ) 6= 0 para cada i {1, . . . , n}, pruebe que
h1 (1) h2 (2) hn1 ((n1)) hn (n)

(
x ) (
x ) (
x0 ) (
x ) = (1)n
x2 0 x3 0 xn x1 0
g
20. Sea g : U Rn R de clase C 1 (en U ) y x 0 U tal que g(
x0 ) = 0 y xn (
x0 ) 6= 0. Si v 6= 0 es tal que
v g(
x0 ) = 0, pruebe que existen > 0 y
: (, ) R Rn
derivable tal que g((t)) = 0 para toda t (, ), (0) = x0 y (0) = v. Interprete geometricamente.
267 J. P
aez
g
21. Sea g : U R3 R de clase C 1 (en U ) y x
0 = (x0 , y0 , z0 ) U tal que g(
x0 ) = 0 y z (
x0 ) 6= 0. Pruebe
que:
(a) existe V R2 abierto, y : V R2 R3 de clase C 1 en V , tales que (x0 , y0 ) V y g((x, y)) = 0

para toda (x, y) V . Interprete geometricamente
(b) el plano tangente al conjunto de nivel 0 de g (N0 (g)) calculado usando la parametrizaci
on del
inciso anterior, es el mismo si se calcula usando la definicion 4.32
22. Sean g1 , g2 : U R3 R de clase C 1 (en U ) y x0 = (x0 , y0 , z0 ) U tales que g1 (

x0 ) = g2 (
x0 ) = 0 y
g1 ( x0 ) 6=
x0 ) g2 ( 0. Pruebe que:
(a) existe > 0 y

: (, ) R Rn
0 y (0) 6= 0
derivable tal que g1 ((t)) = g1 ((t)) = 0 para toda t (, ), (0) = x
(b) la recta tangente en el punto (0) a la curva descrita por , es la misma recta que se obtiene al
intersectar al plano tangente en el punto x0 del conjunto de nivel 0 de la funcion g1 , con el plano
tangente en el punto x 0 del conjunto de nivel 0 de la funci
on g2 . Interprete geometricamente
23. Considere el conjunto de soluciones de las ecuaciones:
2x + y + 2z + u v 1 = 0
xy + z u + 2v 1 = 0
yz + xz + u2 + v = 0
(a) Muestre que, en una vecindad del punto (1, 1, 1, 1, 1), las variables x, y y z (del conjunto de
soluciones) se pueden poner en funci
on de las variables u y v.
(b) Calcule la derivada de la funci
on del inciso anterior en el punto (1, 1).
(c) Encuentre todas la ternas de variables que se puedan poner en funci
on de las restantes dos, en
una vecindad del mismo punto.
24. Sea
2 x
x sen(1/x) + 2 si x 6= 0
f (x) =

0 si x = 0
(a) calcule f (x) para toda x R

(b) pruebe que para toda > 0 existen x, y (, ) tales que f (x) < 0 y f (y) > 0
(c) pruebe que f no es invertible en ninguna vecindad del cero. Este ejemplo contradice el Teorema
de la Funci
on Inversa?
25. Pruebe el teorema de la funci

on inversa a partir del teorema de la funci
on implcita.
26. Sean f : Rn Rn de clase C 1 y c > 0 tales que para toda x
, y Rn se tiene que
kf (
x) f (
y )k c k
x yk
Pruebe que:
Rn , Df (
(a) para toda x x) es invertible
(b) f (Rn ) es abierto
(c) f (Rn ) es cerrado
(d) f es biyectiva y f 1 : Rn Rn es de clase C 1 (en Rn )
J. P
aez 268
x0 ) = 0.
27. Sea g = (g1 , . . . , gm ) : A Rn Rm de clase C 1 (en A) con n > m. Sea x0 A tal que g(
(a) Si la matriz
g1 g1
x1 (
x0 ) xm (
x0 )

M = .
.. .. ..
. .
gm gm
x1 (x0 ) xm ( x0 )
es de rango m, pruebe que existen U, V Rn abiertos y f : U V una biyeccion de clase C 1 en
U (y f 1 de clase C 1 en V ) tales que x0 V A y g(f (x1 , . . . , xn )) = (x1 , . . . , xm ) para todo
(x1 , . . . , xn ) U
(b) Describa a el conjunto (g f )1 (0)
(c) Con que teorema coincide el resultado del inciso anterior cuando n = m?
(d) Use el primer inciso para demostrar que si Dg( x0 ) tiene rango maximo (m) entonces Dg( x) tiene
rango maximo para x en una vecindad de x 0
(e) Si Dg( x0 ) no tiene rango maximo (es decir, si el rango de Dg( x0 ) es k < m) se sigue cumpliendo
un resultado analogo al del primer inciso? al del cuarto inciso? (es decir, si Dg( x0 ) tiene rango
k < m existe una vecindad de x 0 en la que Dg sigue teniendo rango k?). Pruebe sus respuestas
(f) Interprete geometricamente
28. Sea g : U Rn Rm de clase C 1 (en U ) con n > m. Pruebe que g no es inyectiva.
29. Sea f : U Rn Rm de clase C 1 (en U ) con n < m.

(0) (0)
0 = x1 , . . . , xn U es tal que Df (
(a) Si x x0 ) tiene rango n (como matriz de m n) pruebe que
m
, V R abiertos y h
existen U
: U V una biyeccion de clase C 1 en U (y h1 de clase C 1 en V )
(0) (0)
tales que x1 , . . . , xn , 0, . . . , 0 V , f (
x0 ) U y h(f (x1 , . . . , xn )) = (x1 , . . . , xn , 0, . . . , 0) Rm
para todo (x1 , . . . , xn ) f 1 (U ) tal que (x1 , . . . , xn , 0, . . . , 0) V
(b) Con que teorema coincide el resultado del inciso anterior cuando n = m?
(c) Use el primer inciso para demostrar que si Df ( x0 ) tiene rango maximo (n) entonces Df ( x) tiene
rango maximo para x en una vecindad de x 0
(d) Si Df (
x0 ) no tiene rango maximo (es decir, si el rango de Df (x0 ) es k < n) se sigue cumpliendo
un resultado equivalente al del primer inciso? al del tercer inciso? (es decir, si Df ( x0 ) tiene
rango k < n existe una vecindad de x0 en la que Df sigue teniendo rango k?). Pruebe sus
respuestas
(e) Interprete geometricamente
30. Sea f (x, y) = (ex cos(y), ex sen(y)).
(a) Pruebe que f no es inyectiva en R2
(b) Pruebe que para cualquier x = (x, y) R2 existe > 0 tal que f es invertible en B (
x)
on de R en R que tenga las dos propiedades anteriores? Pruebe su respuesta
(c) Existe una funci
31. Sean f, g : U R3 R de clase C 1 en U . Pruebe que la funci
on
F (x, y, z) = (f (x, y, z), g(x, y, z), f (x, y, z) + g(x, y, z))
es tal que, si tuviera inversa en alguna vecindad de alg
un punto de U , esta no sera derivable.
32. Sea f : U Rn Rn de clase C 1 (en U ) y A U . Pruebe que, si det(Df (
x)) 6= 0 para toda
int(A) entonces f (int(A)) int(f (A)).
x
33. Sea f : U R3 R de clase C 2 en U . Si f est a expresada en terminos de coordenadas esfericas,
2
calcule zf2 (
x) en terminos de estas mismas coordenadas (sugerencia: proceda como en el ejemplo
5.24).
269 J. P
aez
J. P
aez 270
Bibliografa
[1] Spivak, Michael, Calculus, 3a. edici

on. Editorial Reverte, Barcelona, 2012. 682 pp.
[2] Friedberg, Stephen H., Insen, Arnold J., Spence, Lawrence E. Linear algebra, 4th ed. PHI Learning, New
Delhi, 2013. 601 pp.
[3] Swokowski, Earl William, C
alculo con geometra analtica, 2a. edici
on. Grupo Editorial Iberoamerica,
Mexico, 1998. 1097 pp.
271
Indice de Materias
acumulaci on disconexo, 31
punto de, 23 estrellado, 51
afn exterior, 19
funci
on, 145 frontera, 19
aislado imagen directa de un, 58
punto, 23 imagen inversa de un, 57
arco interior, 18
longitud de, 110 parametrizaci on de un, 96
parametrizacion por longitud de, 110 conjuntos
separados, 31
base convexo
canonica, 129 conjunto, 33
ortonormal, 130 coordenada
bola funci on, 53
con centro en un punto en Rn , 17 sucesion, 63
Bolzano-Weierstrass coordenadas, 5
teorema de, 27 cilndricas, 41
esfericas, 43
cadena polares, 37
regla de la, 105, 139, 165, 168, 233 cuadrados mnimos
Cauchy metodo de los, 220
criterio de convergencia de, 65 cubierta
Cauchy-Schwarz abierta, 84
desigualdad de, 12 curva, 58
cerradura curvatura de una, 114
de un conjunto, 22 definicion de, 108
cicloide, 99 longitud de una, 110
cilndricas regular, 108
coordenadas, 41 reparametrizaci on de una, 110
circunferencia suave, 108
osculadora, 115 torsion de una curva, 117
coeficiente multinomial, 219 curvatura, 114
compacto centro de, 115
conjunto, 84 radio de, 115
conexo
conjunto, 31 derivada
conjunto de una funcion de Rn en R, 146
abierto, 16, 20 de una funcion de Rn en Rm , 223
acotado, 26 de una funcion de R en Rn , 100
cerrado, 20 direccional, 136
cerradura de un, 22 en coordenadas polares, 177
compacto, 84 parcial, 143
conexo, 31 cruzada, 181
convexo, 33 desigualdad
de nivel, 55 de Cauchy-Schwarz, 12
273

Indice de Materias
Indice de Materias
de Holder, 221 imagen

de Minkowski, 221 directa, 58
direccional inversa, 57
derivada, 136 implcita
directa teorema de la funci
on, 238, 248
imagen, 58 interior
disconexo de un conjunto, 18
conjunto, 31 punto, 18
distancia, 8 inversa
euclideana, 16 teorema de la funci
on, 257
esfericas Lagrange
coordenadas, 43 multiplicadores de, 212
euclideana teorema de los multiplicadores de, 212
distancia, 16 lineal
norma, 7 funci
on, 92
evoluta, 116 longitud
exterior de arco, 110
de un conjunto, 19 parametrizacion por, 110
punto, 19 de una curva, 110
forma cuadratica, 196 mnimo

no degenerada, 196 de una funci
on, 192
seminegativa, 196 local
semipositiva, 196 de una funcion, 192
formas cuadraticas, 205 maximo
de una funci
on, 192
Frenet-Serret
local
formulas de, 119
de una funcion, 192
frontera
matriz
de un conjunto, 19
hessiana, 196
punto, 19
jacobiana, 230
funci
on
ortonormal, 133
afn, 145
Minkowski
coordenada, 53
desigualdad de, 221
de clase C k , 184
multiplicadores de Lagrange, 212
grafica de una, 54
prueba del teorema de los, 248
mnimo de una, 192
mnimo local de una, 192 norma
maximo de una, 192 euclideana, 7
maximo local de una, 192 infinito, 14
matriz hessiana de una, 196 uno, 14
funci
on
lineal, 92 ortonormal
base, 130
grafica matriz, 133
de una funci
on, 54
gradiente parametrizaci
on
en coordenadas polares, 178 de un conjunto, 96
vector, 154 de una superficie, 226
por longitud de arco, 110, 111
H
older parcial
desigualdad de, 221 derivada, 143
hessiana plano
de una funci
on, 196 osculador, 114
J. P
aez 274

Indice de Materias
Indice de Materias
tangente, 150, 169, 225, 226 vecindad

polares agujerada, 23
coordenadas, 37 de un punto en Rn , 17
poligonal, 34 vector
polinomio binormal unitario, 115
de Taylor, 188 gradiente, 154
producto normal unitario, 114
interior, 11 tangente unitario, 114
punto, 11
punto
aislado, 23
crtico, 194
de acumulaci on, 23
exterior, 19
frontera, 19
interior, 18
silla, 194
rectangulos anidados
teorema de los, 27
recta
tangente, 169
recta tangente
a una curva, 100
regla
de la cadena, 105, 139, 165, 168, 233
reparametrizaci on, 110
sucesion
acotada, 67
coordenada, 63
en Rn , 63
rango de una, 67
superficie, 59, 226
parametrizaci on de una, 226
suave, 226
superficies, 224
tangente
plano, 150, 169, 225, 226
recta, 169
Taylor
polinomio de, 188
Teorema de, 188
teorema
de Bolzano-Weierstrass, 27
de la funcion implcita, 238, 248
prueba del, 263
de la funcion inversa, 257
prueba del, 257
de los multiplicadores de Lagrange, 212
de los rectangulos anidados, 27
de Taylor, 188
torsion
de una curva suave, 117
275 J. P
aez

J Paez Calculo III

Caricato da

Informazioni sul documento

Copyright

Formati disponibili

Condividi questo documento

Condividi o incorpora il documento

Opzioni di condivisione

Hai trovato utile questo documento?

Questo contenuto è inappropriato?

Copyright:

Formati disponibili

J Paez Calculo III

Caricato da

Copyright:

Formati disponibili

Calculo diferencial de varias variables

Javier Paez Cardenas

4 La derivada de funciones de Rn en R 129

4.4 Derivadas direccionales de orden superior . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 179

5 La derivada de funciones de Rn en Rm 223

As como en el caso del c

1.1 Para empezar, algunos ejemplos

Ejemplo 1.5 Si en el ejemplo anterior, adem as de considerar la posici

Ejemplo 1.6 Supongamos que en un laboratorio de investigaci on se encuentran realizando un experimento

(x5 , y5 ) (x5 , y5 ) (x6 , y6 )

1.2 Estructura algebraica de Rn

Figura 1.2: La suma (a) y el producto por un escalar (b) de vectores en R2

(x1 , . . . , xn ) + (y1 , . . . , yn ) := (x1 + y1 , . . . , xn + yn )

del mismo modo que si x = (x1 , . . . , xn ), denotaremos por

y coincide con ser la flecha

para el caso del plano (R2 ), y por

Definici = (x1 , . . . , xn ) Rn definimos la norma (euclideana) de x

Figura 1.6: Cual es el valor de que hace que los vectores x

la cual tiene las soluciones = 0 y

(ver figura 1.7).

Figura 1.7: Los vectores x = (x1 , x2 ) y y = (x2 , x1 ) son perpendiculares

mientras que, por otra parte, es f

Ademas de hacernos sospechar que la perpendicularidad entre los vectores x y y est

Figura 1.8: El calculo de usando el angulo

Esta nueva operaci

Proposici , y, z Rn y R, el producto punto de vectores definido en 1.9 satisface las

importante destacar la ntima relaci

Demostraci on. Como ya se mencion o y es el vector 0. Por esta raz

de donde concluimos que

Con base en las mismas propiedades, tambien sabemos que

y ahora concluimos que

Es importante llamar la atenci

Proposici , y Rn se satisface que:

de modo que, sacando raz cuadrada, llegamos a la desigualdad deseada.

Analogamente, dado que k

on 1.13 Sean x, y Rn distintos del 0. Definimos el

(donde cos1 (o arccos) es la funci

1.4 Otras normas

Definici = (x1 , . . . , xn ) Rn , definimos:

, que denotamos por k

, que denotamos por k

Proposici Rn se satisfacen las siguientes desigualdades:

x2i x21 + + x2n

Por otra parte, como

|x1 | + + |xn | = (1, . . . , 1) (|x1 | , . . . , |xn |)

de tal forma que, por la desigualdad de Cauchy-Schwarz, tenemos que

|x1 | + + |xn | = (1, . . . , 1) (|x1 | , . . . , |xn |)

Para la segunda desigualdad, observe que

= (x1 , 0, . . . , 0) + (0, x2 , 0, . . . , 0) + + (0, 0, . . . , 0, xn )

de tal forma que, por el problema 5 de este captulo concluimos que

que es la desigualdad que se deseaba probar.

Definici , y Rn definimos la distancia (euclideana) de x

Como es de esperarse, la prueba de esta proposicion se deja al lector.

Figura 1.9: Las bolas de radio r con centro en el origen (en R2 y en R3 )

on de los puntos de Rn con respecto al

Resumiendo lo anterior tenemos que, dado un conjunto A Rn y x Rn , entonces se satisface una de

1. x x) A. Denotamos por int(A) al conjunto

y diremos que este conjunto es el interior de A.

2. x x) Ac . Denotamos por ext(A) al conjunto

y diremos que este conjunto es el exterior de A.

y diremos que este conjunto es la frontera de A.

Ejemplo 1.21 Sea

A = ([0, 1] [0, 1]) (Q Q) = {(x, y) R2 | x, y Q y 0 x 1, 0 y 1}

Determinaremos quienes son el int(A), el ext(A) y la Fr(A).

y por lo tanto que