Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Compendio Matematica PDF
Compendio Matematica PDF
NÚMEROS Y FUNCIONES
Todas las matemáticas se apoyan en los números y éstos constituyen la base del cálculo. Existen distintos tipos de
números: naturales (1, 2, 3, . . . ), enteros (. . . , −3, −2,
√ −1, 0, 1, 2, 3, . . . ), racionales (1/2, 3/5, −3/8, . . . ) e
irracionales (los que no son racionales; por ejemplo, 2). La unión de todos ellos constituye el conjunto de los
números reales que se suele escribir como R.
Para representar R se utiliza una lı́nea recta, denominada recta real. En dicha recta se escoge un punto, denomi-
nado origen, que representa al cero. La dirección positiva (derecha) indica el sentido de los valores crecientes, de
tal forma que los puntos a la derecha del origen indican números positivos mientras que los puntos a la izquierda
N ÚMEROS Y FUNCIONES 7
representan números negativos. El hecho más importante es que cada número real está asociado con un único
punto en la recta real y viceversa.
Una propiedad importante de los números reales es que pueden ordenarse: el número a es menor que el número
b, y se escribe a < b, si b − a es un número positivo. En otras palabras, a < b si, y sólo si, a está a la izquierda de
b en la recta real. Esta relación < posee las siguientes propiedades:
Propiedades similares se tienen para las desigualdades >, 6 o >, las cuales se definen como sigue:
La relación de orden < permite definir unos subconjuntos especiales de R: los intervalos. Si a < c < b entonces
decimos que c está entre a y b; un intervalo determinado por los puntos a y b es el conjunto de puntos que están
entre a y b. Si en este conjunto incluimos o no los extremos (los puntos a y b) entonces tenemos los intervalos
abiertos, cerrados o semiabiertos (semicerrados). A continuación listamos las diferentes posibilidades:
(a, b) Intervalo abierto de extremos a y b es el conjunto (a, b) = {x|a < x < b}.
[a, b] Intervalo cerrado de extremos a y b es el conjunto [a, b] = {x|a 6 x 6 b}.
(a, b] [a, b) Intervalos semiabiertos (semicerrados) de extremos a y b son los conjuntos (a, b] = {x|a < x 6 b} y
[a, b) = {x|a 6 x < b}.
Los intervalos pueden ser acotados (como los anteriores) o no acotados. En este último caso pueden presentarse
las siguientes posibilidades:
(−∞, b) Intervalo abierto de extremo b no acotado inferiormente es el conjunto (−∞, b) = {x|x < b}.
(−∞, b] Intervalo cerrado de extremo b no acotado inferiormente es el conjunto (−∞, b] = {x|x 6 b}.
(a, ∞) Intervalo abierto de extremo a no acotado superiormente es el conjunto (a, ∞) = {x|x > a}.
[a, ∞) Intervalo cerrado de extremo a no acotado superiormente es el conjunto [a, ∞) = {x|x > a}.
(−∞, ∞) Intervalo abierto no acotado (ni superior ni inferiormente) es R.
Los sı́mbolos −∞ y ∞ son eso: sı́mbolos; no denotan números reales y sólo se utilizan para expresar de forma
precisa ciertas afirmaciones o ciertos conjuntos.
8 MATEM ÁTICAS
El valor absoluto de un número real a se denota por |a| y se define como sigue:
a si a > 0
|a| =
−a si a < 0
Geométricamente, |a| mide la distancia que hay entre el número a y el origen 0 en la recta numérica real (ver
Figura 1.1).
• |b|
|a| •
• •
b a
De manera similar a como hemos asociado los números reales con puntos de una recta, ahora podemos relacionar
los puntos del plano con pares ordenados de números reales. Para empezar se trazan dos rectas perpendiculares que
se cortan en un punto que denominaremos origen. Habitualmente, una de las rectas es horizontal y se denomina
eje x o eje de abcisas, y la otra recta es vertical y se denomina eje y o eje de ordenadas. Estas dos rectas dividen
al plano en cuatro partes llamadas cuadrantes.
N ÚMEROS Y FUNCIONES 9
Cualquier punto P del plano tiene asociado un par ordenado (a, b) de números reales, llamados coordenadas del
punto. La manera de conseguirlos es la siguiente: por el punto P se trazan dos rectas paralelas a los ejes las cuales
intersectan a los ejes en dos puntos que constituyen las coordenadas. El número a se denomina coordenada x o
abcisa, y el número b se llama coordenada y u ordenada (ver Figura 1.2).
6 P (a, b)
-
b 5
3
II 2
I
6
−2 −1 1 2 3 4 5
−1
a
−2
III IV
Este sistema de coordenadas fue “inventado” por el matemático francés René Descartes y, en su honor, se deno-
mina sistema de coordenadas cartesianas, aunque también es habitual el nombre de sistema de coordenadas
rectangulares.
Aunque (a, b) ha sido utilizado tanto para denotar un intervalo de la recta real como para denotar un par ordenado
de números reales, esperamos que no haya confusión, pues en cada momento sólo una interpretación será posible.
(x1 , y1 )
y1
d
|y2 − y1 |
y2 (x2 , y2 )
x1 x2
|x2 − x1 |
Figura 1.3: Distancia entre dos puntos del plano.
La distancia entre dos números reales a y b es el valor absoluto |b − a|. Para definir la distancia entre dos puntos
del plano debemos recurrir al Teorema de Pitágoras (ver Figura 1.3). La distancia entre los puntos (x1 , y1 ) y
(x2 , y2 ) del plano se define como
p
d= |x2 − x1 |2 + |y2 − y1 |2
10 MATEM ÁTICAS
La pendiente de una recta (no vertical) es el número de unidades que la recta sube (o baja) por cada unidad de
cambio horizontal de izquierda a derecha. En otras palabras, la pendiente de la recta determinada por los puntos
(x1 , y1 ) y (x2 , y2 ) viene dada por
∆y y2 − y1
m= = , x1 6= x2 .
∆x x2 − x1
El orden en que se resta no tiene importancia, siempre y cuando se siga el mismo criterio en el numerador y en el
denominador.
Para determinar la ecuación de una recta podemos seguir varios pasos, según los datos de que dispongamos.
Ecuación punto-pendiente: Si conocemos la pendiente m de la recta y un punto (a, b), entonces la ecuación es
y − b = m(x − a).
Ax + By + C = 0,
Rectas Paralelas: Dos rectas (no verticales) son paralelas si, y sólo si, sus pendientes son iguales.
Rectas Perpendiculares: Dos rectas (no verticales) son perpendiculares si, y sólo si, sus pendientes m1 y m2
son inversas y opuestas, es decir, m1 m2 = −1.
Un conjunto de elementos que poseen una determinada propiedad, y que sólo ellos la poseen, constituye un lugar
geométrico. Esta noción se utiliza habitualmente cuando estos conjuntos son una recta, una circunferencia, una
elipse, etc.
A modo de ejemplo, diremos que una ‘recta’ es el lugar geométrico de los puntos alineados con un punto dado A
y con una dirección dada v; es decir, un punto P está en la recta si, y sólo si, el vector determinado por los puntos
A y P es paralelo al vector v.
Dentro de la geometrı́a cartesiana, un punto P de coordenadas (x, y) pertenece a un lugar geométrico si, y sólo
si, sus coordenadas satisfacen una relación o ecuación. La ecuación de un lugar geométrico de puntos P de
coordenadas (x, y) es una ecuación entre las variables x e y tal que las coordenadas (x, y) de cualquier punto P
satisfacen dicha ecuación si, y sólo si, el punto P pertenece al lugar geométrico.
N ÚMEROS Y FUNCIONES 11
Una circunferencia es el lugar geométrico de los puntos del plano que equidistan de un punto fijo llamado centro.
La distancia constante al centro se denomina radio (ver Figura 1.4).
y 6
P (x, y)
•
r
•
C(a, b)
-
0 x
Para determinar la ecuación procedemos como sigue. Sea P (x, y) un punto genérico de la circunferencia de centro
ppunto C(a, b) y radio r. Entonces la ecuación geométrica d(P, C) = r se transforma en la ecuación analı́tica
el
(x − a)2 + (y − b)2 = r y elevando al cuadrado obtenemos
(x − a)2 + (y − b)2 = r 2 .
Si desarrollamos los cuadrados obtenemos la siguiente ecuación
x2 + y 2 + mx + ny + p = 0,
denominada ecuación general de la circunferencia.
Una elipse es el lugar geométrico de los puntos del plano cuya suma de distancias a dos puntos fijos, llamados
focos, es constante.
Para determinar la ecuación, denotemos por F y F 0 los focos de la elipse, y sean 2a y 2c la suma de distancias
a los focos y la distancia focal, respectivamente. Sea P (x, y) un punto genérico y denotemos por r = P F y
r 0 = P F 0 los radios vectores, de tal forma que r + r 0 = 2a. Por fijar una referencia, supongamos que los focos
son los puntos F (c, 0) y F 0 (−c, 0). Entonces
p
r = (x − c)2 + y 2 ,
p
r0 = (x + c)2 + y 2 .
Un cálculo sencillo conduce a
r = a + ex,
r0 = a − ex,
donde e = c/a es la excentricidad de la elipse. Comparando las dos expresiones para r (o r 0 ) anteriores deducimos,
después de laboriosos cálculos, que
x 2 y 2
+ = 1,
a b
siendo b2 = a2 − c2 . Esta es la ecuación reducida o canónica de la elipse (ver Figura 1.5).
12 MATEM ÁTICAS
y 6
(0, b)
•
(−a, 0)
r r0 (a, 0)
• • • • -
0 x
F F0
•
(0, −b)
Una hipérbola es el lugar geométrico de los puntos del plano cuya diferencia de distancias a dos puntos fijos,
llamados focos, es constante.
Para determinar la ecuación, denotemos por F y F 0 los focos de la hipérbola, y sean 2a y 2c la diferencia de
distancias a los focos y la distancia focal, respectivamente. Sea P (x, y) un punto genérico y denotemos por
r = P F y r 0 = P F 0 los radios vectores, de tal forma que r − r 0 = 2a. Por fijar una referencia, supongamos que
los focos son los puntos F (c, 0) y F 0 (−c, 0). Entonces
p
r = (x − c)2 + y 2 ,
0
p
r = (x + c)2 + y 2 .
r = ex + a,
r0 = ex − a,
donde e = c/a es la excentricidad de la hipérbola. Comparando las dos expresiones para r (o r 0 ) anteriores
deducimos, después de laboriosos cálculos, que
x 2 y 2
− = 1,
a b
siendo b2 = a2 − c2 . Esta es la ecuación reducida o canónica de la hipérbola (ver Figura 1.6).
Una parábola es el lugar geométrico de los puntos del plano que equidistan de un punto fijo llamado foco y de
una recta fija llamada directriz.
Consideremos como eje de abcisas a la recta que, pasando por el foco, es perpendicular a la directriz; por eje de
ordenadas se toma la recta paralela a la directriz por el punto medio O entre el foco y la directriz; esta recta se
denomina eje de la parábola. El punto O es el punto en que la parábola corta a su eje y se denomina vértice de la
parábola. Realizando un procedimiento similar a los anteriores deducimos que la ecuación reducida de la parábola
es
y 2 = 2px,
N ÚMEROS Y FUNCIONES 13
y 6
• • -
x
(−a, 0) (a, 0)
0
y 6
• -
x
O F
Una función es una correspondencia que asocia a cada elemento x de un conjunto A, denominado dominio,
exactamente otro elemento f (x) en un conjunto B. El elemento f (x) se dice que es el valor de f en x o la
imagen de x mediante f . El conjunto formado por todas las imágenes f (x) es denominado conjunto imagen o
recorrido. Si a cada valor del recorrido le corresponde exactamente un elemento en su dominio, la función se
llama inyectiva. Si el recorrido es todo el conjunto B, la función se dice que es suprayectiva o sobreyectiva.
Una función inyectiva y sobreyectiva se llama biyectiva.
Cuando pensamos en una función arbitraria f , es usual utilizar un sı́mbolo para designar un elemento arbitrario en
el dominio de f y otro sı́mbolo para un elemento del recorrido. Al primero se le denomina variable independiente
y al segundo variable dependiente. Por ejemplo, sea la función f definida en N (los números naturales) y con
valores en N que asocia a cada número natural su inmediato sucesor. Entonces es usual escribir f (x) = x + 1 o
14 MATEM ÁTICAS
bien y = x + 1, donde x denota un número natural arbitrario e y indica el número natural que le asocia la función
f.
No todos los subconjuntos de R2 son la gráfica de una determinada función f definida en R: se tiene que cumplir
que toda recta vertical debe intersecar a lo más un sola vez al subconjunto.
Una función f : R → R se dice positiva (resp. negativa) si f (x) > 0 (resp. f (x) < 0) para todo valor de x.
Geométricamente esto significa que la gráfica de la función está contenida en el semiplano superior (resp. inferior)
de R2 . En general, una función no tiene por qué ser positiva o negativa; probablemente será positiva en partes de
su dominio y negativa en otras partes.
Para dibujar una gráfica puede ser interesante conocer los tipos de simetrı́a de la ecuación que la determina. Son
los siguientes:
y 6
(−x, y) (x, y)
-
x
Simetrı́a respecto al eje OY: Cuando al sustituir x por −x queda una ecuación equivalente. Si la ecuación es
y − f (x) = 0, cuando f (−x) = f (x) para todo valor de x. Diremos que la función f es par (ver Figura
1.8).
Simetrı́a respecto al eje OX: Cuando al sustituir y por −y queda una ecuación equivalente (ver Figura 1.9).
Simetrı́a respecto al origen: Cuando al sustituir x por −x e y por −y se obtiene una ecuación equivalente. Si
la ecuación es y − f (x) = 0, cuando f (−x) = −f (x) para todo valor de x. Diremos que la función f es
impar (ver Figura 1.10).
N ÚMEROS Y FUNCIONES 15
y 6
(x, y)
-
x
(x, −y)
y 6
(x, y)
-
x
(−x, −y)
Es fácil ver que transformando la gráfica de una función podemos obtener las gráficas de otras funciones relaciona-
das con la anterior, sin necesidad de repetir el trabajo que supone realizar una gráfica. Entre las transformaciones
más usuales están las traslaciones, los alargamientos (homotecias) y las reflexiones.
16 MATEM ÁTICAS
2.5.1. Traslaciones
Existen cuatro tipos de traslación. Para describirlas, sea c > 0 el número que indica las unidades que vamos a
desplazar la gráfica original.
Otro tipo de transformación consiste en modificar la escala de los ejes: podemos alargar o achatar las gráficas con
sólo multiplicar la x o la y por una constante c > 1 apropiada. También podemos reflejar la gráfica en los ejes de
coordenadas. Estas transformaciones se pueden resumir como sigue:
Dos funciones f y g pueden combinarse para formar nuevas funciones de muy diversas maneras. A continuación
veremos que las funciones pueden sumarse, restarse, multiplicarse y dividirse de una manera similar a los números
reales. El álgebra de las funciones reales de variable real puede resumirse de la siguiente manera. Sean f y g dos
funciones con dominios A y B, respectivamente. Entonces definimos las operaciones elementales como sigue:
El concepto actual de función es fruto del esfuerzo colectivo de numerosos matemáticos de los siglos XVII y
XVIII. Los matemáticos de esa época pensaban que cualquier fenómeno fı́sico podı́a ser descrito con la ayuda de
una colección básica de funciones: las funciones elementales. Estas funciones pueden dividirse en tres bloques:
(1) algebraicas; (2) exponenciales y logarı́tmicas; y (3) trigonométricas.
Las funciones algebraicas más habituales son los polinomios, los cuales pueden escribirse en la forma
donde a0 , a1 , . . . , an son números reales. El entero positivo n se llama el grado del polinomio, an es el coeficiente
dominante y a0 es el término constante. Como casos particulares tenemos las funciones constantes (f (x) = c)
y las funciones potencia (f (x) = xn ).
√
Otras funciones básicas son las funciones raı́z (f (x) = x1/n = n x) y las funciones racionales (f (x) =
P (x)/Q(x), P y Q polinomios). En general, las funciones algebraicas son aquellas que pueden expresarse en
términos de un número finito de sumas, restas, productos, cocientes y raı́ces de polinomios.
Las funciones que no son algebraicas se llaman transcendentes. Por ejemplo, las funciones exponenciales, lo-
garı́tmicas y trigonométricas son trascendentes.
1 − r n+1
1 + r + r2 + r3 + · · · + rn =
1−r
para todo entero positivo n.
4.1. Introducción
La práctica se va a realizar con el programa de cálculo matemático DERIVE for Windows, versión 4.05, de Soft
Warehouse. DERIVE for Windows permite realizar cálculos y manipulaciones matemáticas de carácter general,
lo cual significa que realiza muchas cosas de forma aceptable aunque no tiene la potencia de otros programas
especı́ficos. No obstante, DERIVE for Windows permite realizar todos los cálculos que un usuario medio puede
necesitar.
N ÚMEROS Y FUNCIONES 19
Figura 1.11: Pantalla inicial del programa donde aparece, además del menú principal, la ‘botonera’ que permite
agilizar la introducción de las expresiones y la realización de los cálculos.
Para ejecutar el programa debemos acceder a la carpeta DERIVE for Windows y ejecutar el programa DERIVE
for Windows. Una vez en el programa, aparecerá la pantalla de la Figura 1.11, con un menú en la parte superior
que, de ahora en adelante, denominaremos menú principal.
En esta práctica nos vamos a limitar a familiarizarnos con el programa DERIVE for Windows y a la realización
de algunos cálculos elementales. Sin embargo, antes de realizar los cálculos debemos introducir los datos o
expresiones que necesitemos.
Con el término expresión queremos indicar cualquier función, constante, variable u operador que podamos in-
troducir en el programa. Las expresiones se introducen seleccionando la opción Author del menú principal.
Entonces nos aparece un menú con tres posibilidades: Expression, Vector o Matrix, que nos permite introdu-
cir una expresión, un vector o una matriz. Para agilizar la introducción de los datos, debemos recordar que existen
teclas calientes que equivalen a diversas opciones de los menús. Ası́, por ejemplo, para introducir una expresión
es suficiente con pulsar Ctrl+A y nos aparece la ventana de la Figura 1.12. Conforme vamos introduciendo las
expresiones, éstas se van numerando correlativamente y en orden creciente, de forma que en una expresión pode-
mos hacer referencia a una expresión anterior (utilizando para ello el sı́mbolo #). Una pantalla tı́pica de trabajo se
muestra en la Figura 1.13.
Para editar (y eventualmente modificar) una expresión ya introducida tenemos dos vı́as distintas. En primer lugar
20 MATEM ÁTICAS
Figura 1.13: Pantalla tı́pica del programa donde aparecen algunas instrucciones. Obs érvese que es posible intro-
ducir sentencias descriptivas que nada tienen que ver con operaciones matemáticas pero que ayudan
a seguir los cálculos.
podemos marcar la expresión (haciendo ‘click’ con el ratón en la expresión deseada o moviéndonos con las flechas:
↑ para acceder a una expresión con un número menor y ↓ para acceder a otra con un número mayor) y seleccionar
la opción Edit Expression. Otra posibilidad es elegir Edit y seguidamente Go to expression, lo cual nos
permite introducir el número de la expresión que queremos editar.
En una expresión de DERIVE for Windows están permitidas numerosas opciones: letras griegas, constantes, ope-
radores (aritméticos y lógicos) y funciones (exponenciales, logarı́tmicas, trigonométricas, hiperbólicas, complejas,
de probabilidad, estadı́sticas, de error, de cálculo financiero, de cálculo matemático, vectoriales, matriciales, y de
cálculo diferencial e integral vectorial). Por el momento, es suficiente con recordar que en las expresiones pode-
mos utilizar los siguientes elementos:
Constante Expresión
e (base de los logaritmos neperianos) #e
i (unidad imaginaria compleja) #i
π (3.1415926 . . . ) pi
∞ (infinito matemático) inf
N ÚMEROS Y FUNCIONES 21
La mejor manera de que nos aprendamos los sı́mbolos y funciones descritos anteriormente no es dedicar mucho
tiempo a memorizarlos, ya que esta tarea no es nada eficaz, además de resultarnos bastante odiosa. Lo conveniente
es realizar numerosos ejercicios, sencillos en su mayorı́a, pero que nos ayudarán a retener lo esencial.
Introducimos la expresión (3+6)(7-2)/4 o (3+6)*(7-2)/4. Entonces nos aparecerá la misma lı́nea en pan-
talla. Si queremos ver el resultado debemos simplificar (seleccionando Simplify Basic o pulsando Ctrl+B)
y obtendremos 45/4, que es el valor exacto. Si queremos obtener el valor decimal aproximado, con un número
de decimales predeterminado (por defecto, este número es 6), debemos seleccionar Simplify Approximate (o
Ctrl+G) y nos aparece la ventana de la Figura 1.14. Tras confirmar la expresión que queremos simplificar y el
número de decimales obtendremos 11.25.
Calcular eπ
Introducimos la expresión #e^pi obteniendo, después de seleccionar las opciones Simplify Approximate,
el valor de 23.1407 (6 dı́gitos). Si queremos un resultado más preciso (por ejemplo, con 12 dı́gitos), debemos
cambiar dicho número cuando seleccionemos Approximate. Entonces obtendremos el valor de 23.1406926327.
22 MATEM ÁTICAS
Elejimos Author y escribimos la expresión 15^34. Después de seleccionar las opciones Simplify Basic (o
simplemente pulsando el botón = ) nos aparecerá en pantalla el siguiente número:
9707397373664756887592375278472900390625.
Si queremos un resultado aproximado (por ejemplo, con 12 cifras exactas), seleccionamos dicha configuración
mediante Simplify Approximate y obtendremos: 9.70739737366 10^39.
Figura 1.15: El uso de la ‘botonera’ de DERIVE for Windows nos puede simplificar mucho el trabajo. Otro elemento
interesante es la existencia de ‘teclas calientes’ que nos permiten evitar los menús, con lo que se gana
en rapidez.
Antes de seguir adelante será conveniente que comentemos brevemente la ‘botonera’ de DERIVE for Windows
(ver Figura 1.15), ya que simplifica enormemente la introducción de datos y la realización de cálculos. Los boto-
nes permiten realizar las siguientes tareas (de izquierda a derecha): New (abrir una nueva hoja de trabajo), Open
(abrir una hoja de trabajo existente), Save (guardar la sesión de trabajo), Print (imprimir la sesión de trabajo),
Remove (eliminar la expresión marcada), Unremove (recuperar la última expresión eliminada), Renumber (re-
numerar las expresiones), Author expression (introducir una expresión sencilla), Author vector (introducir
un vector), Author matrix (introducir una matriz), Simplify (simplificar), Approximate (calcular un valor
aproximado), Solve (resolver algebraicamente o numéricamente una expresión), Substitute for variables
(realizar una sustitución), Calculate limit (calcular un lı́mite), Calculate derivative (calcular una deriva-
da), Calculate integral (calcular una integral), Calculate sum (calcular una suma), Calculate product
(calcular un producto), 2D-plot window (realizar un gráfico bidimensional) y 3D-plot window (realizar un
gráfico tridimensional).
Elejimos Author y tecleamos 75!. Después de pulsar el botón = se obtiene el siguiente resultado:
24809140811395398091946477116594033660926243886570122837795894512655842677572867409443
815424000000000000000000.
Si quisiéramos un valor aproximado, entonces elegirı́amos las opciones Simplify Approximate y el valor ob-
tenido serı́a 2.48091408113 10^109 (con 12 dı́gitos). Observemos que este valor tiene más de 80 cifras; como
puede ser que en nuestra pantalla sólo se visualicen hasta 80 caracteres, debemos pulsar simultáneamente las te-
clas Control y las fechas ← y → para ir visualizando el resto, o bien desplazar la ‘barra’ que se encuentra en la
parte inferior de la ventana del programa.
Escogemos Author y escribimos pi. Seleccionamos la opción de simplificar con precisión aproximada hasta 100
dı́gitos exactos y el resultado obtenido es:
3.141592653589793238462643383279502884197169399375105820974944592307816406286208998628
034825342117067.
Para no tener que copiar la solución de la pantalla lo conveniente es grabarla en un archivo o enviarla a la impresora
N ÚMEROS Y FUNCIONES 23
para tenerla por escrito. Para ello debemos seguir el camino File Save o File Print según queramos una
opción u otra. En cualquiera de los dos casos, el programa nos permite seleccionar las expresiones que deseamos
grabar en disco o imprimir. En este segundo caso, una opción muy interesante es File Print Preview, que nos
permite visualizar en pantalla lo que se va a imprimir. La Figura 1.16 muestra la sesión actual antes de ser enviada
a la impresora.
Figura 1.16: Antes de enviar una sesión de DERIVE for Windows directamente a la impresora es conveniente
visualizarla en pantalla, para comprobar que no existen errores. Cuando todo esté correcto, podremos
enviarlo a la impresora desde la pantalla Print Preview
Posteriormente, cuando queramos recuperar todo lo que hemos guardado, bastará con elegir File Load para
cargar en memoria todo el trabajo anterior.
A continuación se enuncian unos ejercicios sencillos sobre aritmética y operaciones con expresiones algebraicas.
Si el alumno encuentra alguna dificultad debe releer lo dicho hasta ahora, en particular la sintaxis de las distintas
funciones y constantes.
Una de las caracterı́sticas esenciales del programa DERIVE for Windows es la posibilidad de manipular expresio-
nes algebraicas, del tipo x3 + 5x − 7 o (1 − x − y 2 )100 . En esta sección vamos a comentar las principales opciones
24 MATEM ÁTICAS
del programa en relación con las expresiones algebraicas. La función básica es Simplify (simplificar), la cual
admite diversas variantes: Basic (Ctrl+B), Expand (Ctrl+E), Factor (Ctrl+F) y Approximate (Ctrl+G). En
los siguientes ejemplos ilustramos su uso.
x2 − 3x + 2
Simplificar la expresión
x2 − 5x + 6
Elejimos la opción Author y tecleamos x^2-3x+2 (supongamos que es la expresión 16). A continuación vol-
vemos a seleccionar Author y escribimos x^2-5x+6 (que será la expresión 17). Finalmente, seleccionando de
nuevo la opción Ctrl+A escribimos #16/#17 y nos aparecerá
x2 − 3x + 2
.
x2 − 5x + 6
Esta fracción podı́a haber sido introducida de una sola vez como sigue:
(x^2-3x+2)/(x^2-5x+6).
Debemos ser muy cuidadosos con los paréntesis y usarlos siempre, aunque en ocasiones nos parezcan innecesarios;
un buen hábito en la escritura puede evitarnos innumerables problemas. Si ahora elegimos la opción Simplify
x−1
Basic (o pulsando el botón = ) obtendremos como resultado el siguiente: .
x−3
Desarrollar (x + y)4
Introducimos la expresión (x+y)^4 y seleccionamos la opción Expand. Entonces el programa nos pregunta qué
variable queremos desarrollar: por defecto, desarrolla todas las variables que aparecen en la expresión. En nuestro
caso, el valor obtenido es: x4 + 4x3 y + 6x2 y 2 + 4xy 3 + y 4 .
Para factorizar un polinomio debemos seleccionar la opción Simplify Factor y a continuación debemos indi-
car la variable y el método (ver Figura 1.17). Existen cinco métodos de factorización: Trivial Squarefree
Rational raDical Complex, siendo los tres últimos los que más factorizan. En nuestro caso, después de in-
troducir el polinomio como x^4-2x^3-8x^2+18x-9, seleccionamos Ctrl+F y seguidamente Squarefree para
obtener (x − 1)2 (x2 − 9). Para mayor precisión, seleccionamos el método Rational (o raDical, Complex) y
obtenemos (x + 3)(x − 3)(x − 1)2 .
N ÚMEROS Y FUNCIONES 25
Figura 1.17: Ventana del programa que nos permite factorizar expresiones.
Una de las tareas más ingratas y complicadas con las que nos podemos encontrar es la determinación de los
números que satisfacen una determinada ecuación (de una o varias variables): es el problema de la resolución de
ecuaciones. Para construir una ecuación (o inecuación) se pueden utilizar los siguientes operadores:
Operador Teclear
= =
6 = /=
< <
> >
6 <=
> >=
Supongamos que queremos calcular la pendiente de la recta 5x − 8y = 13. Entonces podemos expresar la recta
en la forma y = mx + n de tal suerte que el número m es la pendiente. El programa DERIVE for Windows
nos permite determinar la pendiente como sigue. Se introduce la expresión 5x-8y=13, se eligen las opciones
Solve|Algebraically y nos aparece la ventana de la Figura 1.18. Escogemos la variable y (por defecto, el
programa nos ofrece la variable x) y como resultado obtenemos y = 5x−13
8 , por lo que la pendiente es 5/8.
Figura 1.18: Ventana del programa que nos permite resolver algebraicamente expresiones.
Calcular las raı́ces del polinomio x8 − 8x7 + 22x6 − 16x5 − 31x4 + 56x3 − 8x2 − 32x + 16
x^8-8x^7+22x^6-16x^5-31x^4+56x^3-8x^2-32x+16.
A continuación se enuncian unos ejercicios sencillos sobre resolución de ecuaciones. Si el alumno encuentra
alguna dificultad debe releer lo dicho hasta ahora, en particular la sección referente a las expresiones algebraicas
y su manipulación.
√ √
a) Resolver la ecuación 2x + 3 − x − 2 = 2.
√ √
b) Resolver la ecuación 3 x = 2x − 3.
c) Determinar las raices del polinomio x4 − 1.
d) Resolver la ecuación ax2 + bx + c = 0.
Quizás en alguno de los ejercicios anteriores hemos tenido dificultades y no hemos podido encontrar la solución.
En estos casos, la vı́a de solución consiste en representar gráficamente la ecuación y determinar un intervalo
(cuanto más pequeño mejor) que contenga la raı́z. Por ejemplo, si dibujamos la ecuación x5 − 6x4 + 11x3 −
N ÚMEROS Y FUNCIONES 27
2x2 − 12x + 8 = 0 obtenemos la Figura 1.19. Nos damos cuenta que hay raı́ces alrededor de los puntos -1, 1, 2
(en este caso, esas son las raı́ces), por lo que podrı́amos determinar el valor exacto resolviendo numéricamente la
ecuación anterior en los intervalos [-2,0], [0,2] y [1,3], respectivamente.
Para resolver numéricamente una ecuación (es decir, encontrar un valor que satisfaga dicha ecuación) debemos
elegir las opciones Solve|Numerically y nos aparece la ventana de la Figura 1.20, donde debemos introducir la
ecuación y el intervalo donde queremos que DERIVE for Windows busque la solución: Lower y Upper.
Figura 1.20: Ventana del programa que nos permite resolver numéricamente ecuaciones.
Para dibujar una función es suficiente con marcar la expresión que la define y seleccionar la opción New 2D-plot
window (o bien pulsar el botón correspondiente). Con esto conseguimos que se abra una nueva ventana gráfica; a
continuación debemos seleccionar la opción Plot!. Cada ventana gráfica está asociada a una ventana de cálculos
algebraicos, por lo que todas las representaciones gráficas de una ventana de álgebra se realizarán en la misma
ventana gráfica. En el caso de realizar varias representaciones gráficas en una misma ventana, cada gráfica irá en
un color distinto.
4.10. Bibliografı́a
C. Paulogorrón y C. Pérez. Cálculo matemático con DERIVE para PC, Ed. RA-MA, 1a Ed., 1994.
28 MATEM ÁTICAS
R.E. LARSON, R.P. HOSTETLER y B.H. EDWARDS Calculo y Geometrı́a Analı́tica, 5a ed., vol. 1. McGraw-
Hill, Madrid, 1995. Capı́tulo 1.
J. STEWART Cálculo, 2a ed. Grupo Editorial Iberoamérica, México, 1994. Capı́tulo 0.
6. PREGUNTAS DE EVALUACIÓN
E.1.1. Hallar las ecuaciones de la recta que pasa por el punto (1,3) y cumple además en cada caso:
a) Tiene pendiente −2/3.
b) Es perpendicular a la recta x + y = 0.
c) Pasa por el punto (2,4).
d) Es paralela al eje x.
√
E.1.2. Hallar la ecuación de la recta bisectriz del ángulo agudo formado por las rectas y = 3x e y = 2.
E.1.3. Un avión vuela con rumbo constante y a velocidad constante entre dos ciudades. La distancia s (en
kilómetros) que ha recorrido en t horas es s = 950t.
a) Dibujar la gráfica de esta ecuación para t > 0.
b) ¿Qué información contiene la pendiente de la recta?
E.1.4. Un empresario adquiere una máquina por 4500000 pesetas. La máquina gasta en promedio 1000 pesetas
en mantenimiento y gasoil. El operario que la maneja cobra 1850 pesetas por hora y a los clientes se les
cargan 5000 pesetas por hora.
a) Escribir una ecuación para el coste C de funcionamiento de la máquina durante t horas.
b) Idem para los ingresos R derivados de t horas de funcionamiento.
c) Hallar el punto de equilibrio de esa máquina, calculando en qué tiempo t ocurre que R = C.
N ÚMEROS Y FUNCIONES 29
ANOTACIONES
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
CAPÍTULO 2
CÁLCULO DIFERENCIAL
2.1.1. Definiciones
La noción de lı́mite es básica en todo el cálculo, por lo que es sumamente importante adquirir un buen manejo y
conocimiento de los lı́mites antes de adentrarnos en otros temas.
Sea f (x) una función y consideremos x0 un número real (no necesariamente en el dominio de f ). Si f (x) se
acerca arbitrariamente a un único valor L cuando x se aproxima a x0 por ambos lados (sin llegar nunca a ser igual
a x0 ), decimos que el lı́mite de f (x) cuando x tiende a x0 es L, y escribimos
lim f (x) = L.
x→x0
En la definición anterior observamos que sólo interesa conocer cómo está definida la función f cerca del punto
C ÁLCULO DIFERENCIAL 31
x0 . Si la función existe o no en el punto x0 no tiene importancia. La cuestión crucial aquı́ es la siguiente: ¿qué
significa que f (x) se acerca arbitrariamente a L? ¿qué ocurre si x se aproxima a x0 sólo por un lado?
El comportamiento de las funciones en relación a los lı́mites puede ser de lo más diverso. Sólo como un botón de
muestra, veamos las siguientes funciones.
√
f (x) = x/( x + 1 − 1): El lı́mite de f (x) cuando x → 0 vale 2, ya que si nos acercamos por la izquierda
obtenemos valores menores que 2 pero cada vez más próximos a 2; y si nos acercamos por la derecha
obtenemos valores mayores que 2 pero cada vez más próximos a 2. Sin embargo, la función f no está
definida en x = 0.
f (x) = |x|/x: Cuando nos acercamos a 0 por la izquierda, entonces f (x) = −1 por lo que el lı́mite vale −1.
Pero si nos acercamos por la derecha entonces f (x) = 1 y ası́ el lı́mite vale 1. Por tanto, no existe el lı́mite.
f (x) = 1/x2 : Cuando x se aproxima a 0, f (x) se va haciendo cada vez más grande, por lo que no existe ningún
número real L al cual tienda f (x). Por tanto no existe el lı́mite de f (x) cuando x → 0.
En los ejemplos anteriores hemos visto que hay funciones que se aproximan a un valor L1 cuando x se aproxima
a x0 por la izquierda y se aproximan a L2 si nos acercamos por la derecha. Este comportamiento nos lleva a
considerar las siguientes definiciones.
Sea f (x) una función y consideremos x0 un número real (no necesariamente en el dominio de f ).
(1) Si f (x) se acerca arbitrariamente a un único valor L cuando x se aproxima a x0 por la izquierda (sin llegar
nunca a ser igual a x0 ), decimos que el lı́mite por la izquierda de f (x) cuando x tiende a x0 es L, y
escribimos
lim − f (x) = L.
x→x0
(2) Si f (x) se acerca arbitrariamente a un único valor L cuando x se aproxima a x0 por la derecha (sin llegar
nunca a ser igual a x0 ), decimos que el lı́mite por la derecha de f (x) cuando x tiende a x0 es L, y
escribimos
lim + f (x) = L.
x→x0
Entonces existe el lı́mite de una función f (x) en x0 si existen los lı́mites laterales en x0 y coinciden.
Si b y c son números reales, n un entero positivo y f , g son funciones que tienen lı́mite cuando x tiende a c,
entonces son ciertas las siguientes propiedades:
Para poder calcular lı́mites sólo es necesario, además de utilizar las reglas anteriores, tener en cuenta que lim b = b
x→c
y lim x = c.
x→c
Como una consecuencia de la aplicación de las propiedades anteriores tenemos las siguientes reglas:
p(x) p(c)
lim = .
x→c q(x) q(c)
(3) Si c > 0 y n es cualquier entero positivo, o si c < 0 y n es un entero positivo impar, entonces
√ √
lim n x = n c.
x→c
(4) Si f y g son funciones tales que lim g(x) = L y lim f (x) = f (L) entonces
x→c x→L
Para finalizar este apartado vamos a enunciar la regla del bocadillo o teorema de intercalación, herramienta muy
útil que permite calcular lı́mites por comparación.
Regla del Bocadillo. Si f (x) 6 g(x) 6 h(x) para todo x en un intervalo abierto que contiene a c (no importa lo
que suceda en c) y
lim f (x) = lim h(x) = L,
x→c x→c
entonces
lim g(x) = L.
x→c
El término continuidad en matemáticas tiene exactamente el mismo significado que tiene en el lenguaje cotidiano:
una función f es continua en un punto a si su gráfica no se interrumpe en a, no tiene saltos ni huecos en ese punto.
La única diferencia que existe es en la formulación rigurosa.
Continuidad en un intervalo abierto: Una función f se dice continua en un intervalo abierto (b, c) si lo es en
todos los puntos de ese intervalo.
Si f es continua en toda la recta real (−∞, ∞) diremos simplemente que f es una función continua. Se dice que
f es discontinua en a si no es continua en dicho punto.
C ÁLCULO DIFERENCIAL 33
Existen varios tipos de discontinuidades: las evitables y las no evitables. Se dice que una discontinuidad en x = a
es evitable si la función f puede hacerse continua en a redefiniéndola en dicho punto. En caso contrario, se dirá
que la discontinuidad es no evitable.
Continuidad por la derecha: Una función f es continua por la derecha en a si se verifican las siguientes condi-
ciones:
1. f (a) está definida. 2. lim+ f (x) existe. 3. lim+ f (x) = f (a).
x→a x→a
Continuidad por la izquierda: Una función f es continua por la izquierda en a si se verifican las siguientes
condiciones:
1. f (a) está definida. 2. lim− f (x) existe. 3. lim− f (x) = f (a).
x→a x→a
Continuidad en un intervalo cerrado: Una función f se dice continua en un intervalo cerrado [b, c] si es continua
en (b, c) y también es continua por la derecha en b y por la izquierda en c.
Teniendo en cuenta que la continuidad se ha definido como un lı́mite, podemos utilizar las propiedades de los
lı́mites para comprobar inmediatamente las siguientes propiedades acerca de la continuidad.
Sean f y g dos funciones continuas en un punto a, entonces también son continuas en a las siguientes funciones:
(3) Producto: f g.
Listamos a continuación algunos de los tipos más comunes de funciones continuas en todo punto de su dominio:
Uno de los resultados que nos permitirá combinar las propiedades anteriores para probar la continuidad de funcio-
nes más complejas es el siguiente: “Si g es continua en c y f es continua en g(c) entonces la función compuesta
f ◦g es continua en c”.
Finalizamos esta sección con un teorema relativo al comportamiento de las funciones continuas en un intervalo
cerrado, cuya demostración hace uso de la ‘completitud’ de los números reales.
Teorema del valor intermedio: Si f es una función continua en [a, b] y k es cualquier valor entre f (a) y f (b),
entonces existe al menos un número c ∈ [a, b] tal que f (c) = k.
El teorema del valor intermedio es útil para localizar los ceros de una función continua en un intervalo cerrado.
Más concretamente, se tiene el siguiente resultado.
34 MATEM ÁTICAS
Teorema de Bolzano: Si f es una función en [a, b] y f (a), f (b) difieren de signo, entonces existe al menos un
número c ∈ [a, b] tal que f (c) = 0.
Es importante hacer notar que tanto en el teorema del valor intermedio como en el teorema de Bolzano es capital
que la función sea continua en el intervalo cerrado [a, b]. Pueden encontrarse ejemplos muy sencillos de funciones
discontinuas que no verifican los teoremas anteriores.
En la sección previa donde hemos definido el concepto de lı́mite L de una función f en un punto a, sólo hemos
considerado el caso en que tanto a como L fuesen números reales. Sin embargo, es posible extender el concepto
de lı́mite a otros casos, en un cierto sentido que ahora pasamos a precisar.
Se dice que f (x) crece sin tope cuando x tiende a a si para todo número real M siempre existe un intervalo I de
a tal que f (x) > M para todo punto x de I. Análogamente, se dice que f (x) decrece sin tope cuando x tiende a
a si para todo número real M siempre existe un intervalo I de a tal que f (x) < M para todo punto x de I.
Si f (x) crece sin tope cuando x tiende hacia a diremos que el lı́mite de f cuando x tiende a a es ∞ y escribiremos
lim f (x) = ∞.
x→a
Por el contrario, si f (x) decrece sin tope cuando x tiende hacia a diremos que el lı́mite de f cuando x tiende a a
es −∞ y escribiremos
lim f (x) = −∞.
x→a
El signo de igualdad en las expresiones anteriores no significa que exista un lı́mite, sino que nos dan una razón
por la que la función f no puede tener lı́mite en el punto a: porque no está acotada. Lo que de verdad se quiere
decir es que el lı́mite no existe y la función f tiene una discontinuidad no evitable (de salto infinito).
Los lı́mites infinitos por la izquierda y por la derecha se definen análogamente. Los cuatro posibles lı́mites laterales
son los siguientes:
Si alguno de los lı́mites laterales anteriores se satisface, decimos que f tiene en a una discontinuidad infinita.
En este caso, diremos que la recta x = a es una ası́ntota vertical de f . Uno de los ejemplos más tı́picos de
existencia de ası́ntotas verticales se da en las funciones racionales: “si f y g son funciones continuas en un
intervalo conteniendo a c, y se satisface f (c) 6= 0 y g(c) = 0, entonces la función racional r(x) = f (x)/g(x)
tiene una ası́ntota vertical en x = c”.
C ÁLCULO DIFERENCIAL 35
Terminamos esta sección con las siguientes propiedades de lı́mites infinitos. Si c, L son números reales y f , g son
funciones tales que
lim f (x) = ∞ y lim g(x) = L,
x→c x→c
entonces las siguientes propiedades se verifican:
(2) Múltiplo escalar: lim [λf ] = ∞, si λ > 0 y lim [λf ] = −∞, si λ < 0.
x→c x→c
(Propiedades similares son válidas para lı́mites laterales y para funciones para las cuales el lı́mite de f (x) cuando
x tiende a c es −∞).
Si f (x) tiende a L cuando x se hace arbitrariamente grande, entonces decimos que el lı́mite de f (x) cuando x
tiende a infinito es L, y escribimos
lim f (x) = L.
x→∞
Análogamente, si f (x) tiende a L cuando x se hace arbitrariamente pequeño, entonces decimos que el lı́mite de
f (x) cuando x tiende a menos infinito es L, y escribimos
lim f (x) = L.
x→−∞
En ambos casos se dice que la recta y = L es una ası́ntota horizontal de la función f . Uno de los ejemplos más
tı́picos de existencia de ası́ntotas horizontales se da en las funciones racionales: “si f y g son dos polinomios del
mismo grado, entonces la función racional r(x) = f (x)/g(x) tiene una ası́ntota horizontal en y = L, siendo L el
cociente entre los coeficientes principales de f y g”.
Terminamos esta sección con las siguientes propiedades de lı́mites infinitos. Si L1 , L2 son números reales y f , g
son funciones tales que
lim f (x) = L1 y lim g(x) = L2 ,
x→∞ x→∞
entonces las siguientes propiedades se verifican:
(Propiedades similares son válidas para lı́mites de f (x) cuando x tiende a −∞).
Las propiedades anteriores también pueden ser válidas si L1 = ±∞ o L2 = ±∞ o ambas condiciones al mismo
tiempo. No obstante, existen ciertas restricciones con el fin de evitar las indeterminaciones: ∞ − ∞, 0.∞, ∞/∞,
etc.
36 MATEM ÁTICAS
El cálculo matemático nació y se fortaleció a raı́z de cuatro clásicos problemas sobre los que los matemáticos
europeos trabajaron durante el siglo XVII. Estos problemas son:
En este capı́tulo abordaremos los tres primeros problemas, dejando el último para el capı́tulo siguiente. Cada uno
de los problemas anteriores requiere el concepto de lı́mite, ya introducido al comienzo del capı́tulo, y es por sı́
solo suficiente para motivar e introducir el cálculo.
La derivada de una función f en un punto a, que se denota por f 0 (a), se define como
f (x) − f (a) f (a + h) − f (a)
lim = lim ,
x→a x−a h→0 h
supuesto que tal lı́mite exista.
Si consideramos los puntos del plano (x, f (x)) y (a, f (a)), entonces la recta que los une tiene una pendiente m
dada por
f (x) − f (a)
m= .
x−a
En consecuencia, f 0 (a) es el lı́mite de las pendientes de las rectas secantes que unen los puntos (x, f (x)) y
(a, f (a)), y por tanto constituye la pendiente de la recta tangente a f en a (ver Figura 2.1).
Utilizando la forma punto-pendiente para expresar la ecuación de una recta, podemos decir que si f 0 (a) existe
entonces la recta tangente a la curva y = f (x) en el punto (a, f (a)) viene dada por
y − f (a) = f 0 (a)(x − a).
Una función f definida en un intervalo abierto (a, b) se dice que es derivable (o diferenciable) si existe f 0 (c) en
todo punto c del intervalo. Si f es una función derivable entonces podemos definir otra función, denominada la
derivada de f y denotada por f 0 , por la siguiente fórmula:
f (x + h) − f (x)
f 0 (x) = lim .
h→0 h
El dominio de f 0 siempre es un subconjunto del dominio de f y una de las propiedades fundamentales de la
derivada queda recogida en el siguiente teorema: “si f es derivable en x = a entonces f es continua en x = a”.
De lo anterior se deduce que podemos definir un operador en el conjunto de las funciones derivables que asocia a
cada función f (x) su derivada f 0 (x). Dicho operador se denomina la derivada y se denota por
d
dx
d df
de manera que (f ) es una notación para indicar f 0 . Asimismo, otra notación para f 0 (a) es (a).
dx dx
C ÁLCULO DIFERENCIAL 37
y 6
f (x) − f (a)
)
f (a)
x−a
-
x
0 a x
Aunque la noción de derivada se apoya en el concepto de lı́mite, no es conveniente calcular las derivadas recu-
rriendo a la definición, ya que los cálculos son engorrosos y en ocasiones difı́ciles de realizar. En esta sección
vamos a presentar una serie de reglas que nos permitirán hallar derivadas sin recurrir a la definición, de una forma
más sencilla.
d
[c] = 0.
dx
d n
[x ] = nxn−1 .
dx
d
[cf (x)] = cf 0 (x).
dx
Regla de la suma y diferencia. La derivada de una suma (o diferencia) de dos funciones derivables es la suma
(o diferencia) de sus derivadas:
d
[f (x) ± g(x)] = f 0 (x) ± g 0 (x).
dx
Regla del producto. El producto de dos funciones derivables es también derivable y su derivada viene dada por
d
[f (x)g(x)] = f 0 (x)g(x) + f (x)g 0 (x).
dx
38 MATEM ÁTICAS
Regla del cociente. El cociente de dos funciones derivables es también derivable y su derivada viene dada por
d f (x) f 0 (x)g(x) − f (x)g 0 (x)
= .
dx g(x) g(x)2
Regla de la cadena. La composición de dos funciones derivables es también derivable y su derivada viene dada
por
d
[f (g(x))] = f 0 (g(x))g 0 (x).
dx
En las secciones anteriores hemos visto cómo derivar funciones y = f (x). Sin embargo, en ocasiones las variables
x e y se hallan relacionadas por una ecuación F (x, y) = 0 que no permite despejar y en función de x. En estos
casos se utiliza la técnica de la derivación implı́cita, la cual presupone que la variable y es función de x.
Cuando queremos calcular dy/dx a partir de una ecuación F (x, y) = 0 debemos tener presente que estamos
derivando respecto de x. Por tanto, cuando derivemos términos en los que aparece y debemos utilizar la regla de
la cadena, ya que y está definida implı́citamente como una función de x.
El resultado de la derivación implı́cita dy/dx no suele ser una función que sólo depende de x, sino más bien una
nueva función que depende de x y de y.
Sea f una función definida en un intervalo I conteniendo un punto a. Entonces f (a) es el mı́nimo de f en I si
f (a) 6 f (x) para todo x en I. Análogamente, f (a) es el máximo de f en I si f (a) > f (x) para todo x en I. En
ocasiones, el máximo y el mı́nimo de una función f se denominan el máximo absoluto y el mı́nimo absoluto en
ese intervalo, respectivamente (ver Figura 2.2).
Si el intervalo I es abierto, entonces f no tiene por qué tener un máximo o un mı́nimo en dicho intervalo. Sin
embargo, si I es un intervalo cerrado [a, b], entonces f tiene un máximo M y un mı́nimo m (teorema del valor
extremo).
A veces no interesa tanto el comportamiento global de la función como el comportamiento local, es decir, el com-
portamiento en intervalos pequeños. En este caso, las definiciones anteriores pueden ser ligeramente modificadas
en el siguiente sentido.
f (a) es un mı́nimo relativo de f si f (a) 6 f (x) para todo x en un intervalo abierto I conteniendo a a.
Análogamente, f (a) es un máximo relativo de f si f (a) > f (x) para todo x en un intervalo abierto I con-
teniendo a a (ver Figura 2.2).
¿Cómo podemos utilizar el cálculo para la determinación de los extremos relativos de una función? Para ello
necesitamos introducir el concepto de punto crı́tico. Si f está definida en a, se dice que a es punto crı́tico de f si
f 0 (a) = 0. Por convenio, todos los puntos que no pertenecen al dominio de f 0 son crı́ticos.
La primera aproximación nos la da el teorema de Fermat, que dice lo siguiente: “Si f tiene un extremo relativo
en a entonces f 0 (a) = 0”. Como consecuencia de lo anterior, los extremos relativos de una función sólo pueden
aparecer en los puntos crı́ticos, lo que justifica la siguiente guı́a para determinar los extremos de una función en
un intervalo cerrado:
C ÁLCULO DIFERENCIAL 39
y 6
y = f (x)
-
0 a b c d e x
El teorema del valor extremo discutido anteriormente garantiza la existencia de extremos absolutos en las funcio-
nes continuas definidas en un intervalo cerrado, pero no sabemos si estos extremos se alcanzan en los extremos
del intervalo o en el interior. El siguiente teorema garantiza la existencia de extremos en el interior del intervalo.
Teorema de Rolle. Sea f una función continua en un intervalo cerrado [a, b] y derivable en el intervalo abierto
(a, b) tal que f (a) = f (b). Entonces existe un punto c ∈ (a, b) tal que f 0 (c) = 0.
Debemos hacer notar que todas las hipótesis son imprescindibles. Si f no es derivable en (a, b) o f (a) 6= f (b)
entonces podemos encontrar ejemplos de funciones que no satisfacen el teorema de Rolle.
Teorema del valor medio. Sea f una función continua en un intervalo cerrado [a, b] y derivable en el intervalo
abierto (a, b). Entonces existe un punto c ∈ (a, b) tal que
f (b) − f (a)
f 0 (c) = .
b−a
Geométricamente, el teorema anterior nos dice que, en las hipótesis del teorema, siempre existe un punto c tal
que la recta tangente a la curva y = f (x) en c tiene la misma pendiente que la recta secante que une los puntos
(a, f (a)) y (b, f (b)).
40 MATEM ÁTICAS
El teorema del valor medio es uno de los resultados básicos del cálculo, fundamentalmente por su utilización en
la demostración de muchos otros resultados. Una de las consecuencias más bonitas es la siguiente: “Si f 0 (x) = 0
para todo punto x ∈ (a, b) entonces f es constante en (a, b)”.
Una función f es (estrictamente) creciente en un intervalo I si para todo par de puntos x1 y x2 en I tales
que x1 < x2 se satisface f (x1 ) < f (x2 ). Análogamente, una función f es (estrictamente) decreciente en un
intervalo I si para todo par de puntos x1 y x2 en I tales que x1 < x2 se satisface f (x1 ) > f (x2 ).
Si la función f es derivable, podemos utilizar el signo de la derivada f 0 (x) para saber si una función es creciente
o decreciente:
(1) Si f 0 (x) > 0 para todo x en (a, b) entonces f es creciente en (a, b).
(2) Si f 0 (x) < 0 para todo x en (a, b) entonces f es decreciente en (a, b).
Las anteriores propiedades nos permiten elaborar la siguiente guı́a para determinar los intervalos donde una fun-
ción derivable es creciente o decreciente.
(2) Determinar el signo de f 0 en cada uno de los intervalos determinados por dos puntos crı́ticos consecutivos.
(3) Utilizar las propiedades anteriores para cada uno de los intervalos obtenidos.
Una vez determinados los intervalos de crecimiento y decrecimiento de una función f es muy fácil determinar si
los puntos crı́ticos obtenidos son máximos o mı́nimos relativos, según las siguientes reglas (ver Figura 2.3):
Si f es una función derivable en un intervalo abierto (a, b), se dice que la gráfica de f es cóncava hacia arriba
si f 0 es creciente en dicho intervalo, y cóncava hacia abajo si f 0 es decreciente en dicho intervalo. Observemos
que las definiciones anteriores significan que la gráfica de f se encuentra por arriba (resp. abajo) de todas sus
tangentes.
En ocasiones se utilizan los términos cóncava y convexa para las gráficas que son cóncavas hacia arriba y cóncavas
hacia abajo, respectivamente.
y 6
y 6
- -
0 x 0 x
La determinación de los intervalos de concavidad (hacia arriba y hacia abajo) puede obtenerse teniendo en cuenta
el signo de la derivada segunda, según la siguiente propiedad:
(1) Si f 00 (x) > 0 para todo x en (a, b) entonces la gráfica de f es cóncava hacia arriba.
(2) Si f 00 (x) < 0 para todo x en (a, b) entonces la gráfica de f es cóncava hacia abajo.
Un punto (c, f (c)) se dice que es un punto de inflexión de una curva y = f (x) si la gráfica de f cambia de
cóncava hacia arriba a cóncava hacia abajo, o viceversa, en dicho punto.
Como consecuencia de la definición, la recta tangente a la curva y = f (x) en el punto de inflexión corta a la
gráfica de f . Además, si (c, f (c)) es un punto de inflexión de la gráfica de f entonces f 00 (c) = 0 o f 00 no está
definida en x = c.
Finalizamos esta sección con el criterio de la derivada segunda para la determinación de los extremos relativos. El
criterio se basa en que en que si f 0 (c) = 0 y existe un intervalo de c donde la gráfica de f es cóncava hacia abajo
entonces f (c) es un máximo de f ; por el contrario, si la gráfica de f es cóncava hacia arriba entonces f (c) es un
mı́nimo de f .
Para realizar correctamente la gráfica de una función f es conveniente seguir los pasos que a continuación se
indican:
• Dominio
• Intersecciones con los ejes
• Simetrı́as
• Puntos de discontinuidad
• Ası́ntotas verticales
• Ası́ntotas horizontales
• Crecimiento y decrecimiento
• Extremos relativos
• Concavidad y puntos de inflexión
En ocasiones no es necesario calcular todos los apartados anteriores. Suelen ser imprescindibles el dominio, las
ası́ntotas (horizontales y verticales) y los siguientes puntos: de intersección con los ejes, extremos relativos y de
inflexión.
Una sucesión {an } es una función cuyo dominio es el conjunto de los números naturales (o enteros positivos: 1,
2, 3, . . . ). Los valores a1 , a2 , . . . se llaman los términos de la sucesión.
Es posible que conforme vaya aumentando el valor de n los correspondientes números an se vayan aproximando
a un número fijo L. Si esto ocurre, se dice que la sucesión es convergente y su lı́mite es L:
lim an = L
n→∞
La sucesión {an } es convergente con lı́mite L si para todo número > 0 existe M > 0 tal que |an − L| <
siempre que n > M .
A veces es más fácil calcular el lı́mite de una función que el de una sucesión y esto puede permitirnos, aunque no
lo parezca, resolver lı́mites de sucesiones. El siguiente resultado nos ofrece la clave.
C ÁLCULO DIFERENCIAL 43
Sea f una función de una variable real tal que lim f (x) = L. Si {an } es una sucesión tal que an = f (n)
x→∞
entonces
lim an = L.
n→∞
Los lı́mites de sucesiones satisfacen propiedades similares a los lı́mites de funciones, ya descritos en una sección
anterior. Los recordamos aquı́. Sean {an } y {bn } dos sucesiones tales que
lim an = L y lim bn = K.
n→∞ n→∞
Entonces:
(1) Si lim an = L = lim bn y existe un entero N tal que an 6 cn 6 bn para todo n > N entonces
n→∞ n→∞
lim cn = L.
n→∞
a1 6 a2 6 a 3 6 · · · 6 an 6 · · ·
o no crecientes
a 1 > a2 > a3 > · · · > an > · · ·
Una sucesión {an } se dice acotada si existe un número real positivo M tal que |an | 6 M para todo n. El número
M se denomina cota (superior) de la sucesión.
Uno de los principales resultados acerca de sucesiones acotadas y convergentes es el siguiente: “Toda sucesión
monótona y acotada es convergente ”.
44 MATEM ÁTICAS
El objetivo fundamental de esta sección es mostrar cómo se pueden utilizar polinomios para aproximar otras
funciones. Para ello, lo primero que debemos hacer es fijar un punto c alrededor del cual vamos a realizar la
aproximación. Este punto c es el centro de la aproximación y el objetivo es encontrar el polinomio (de un cierto
grado predeterminado) que mejor se aproxima (en un cierto sentido) a la función f en un entorno del punto c.
Cualquier método de aproximación tiene una utilidad relativa (más bien poca) si se desconoce el error que se
comete. Para medir la precisión al aproximar un valor f (x) por el polinomio de Taylor Pn (x) descomponemos
f (x) = Pn (x) + Rn (x), donde Rn (x) es el resto. El error cometido en la aproximación es el valor absoluto del
resto, es decir,
error = |Rn (x)| = |f (x) − Pn (x)|.
Teorema de Taylor. Si una función f es derivable hasta el orden n + 1 en un intervalo (a, b) conteniendo a c,
entonces para todo x en (a, b) existe un número z entre x y c tal que
f (n+1) (z)
f (x) = Pn (x) + Rn (x), Rn (x) = (x − c)n+1 .
(n + 1)!
La expresión anterior de Rn (x) se denomina forma de Lagrange para el resto. A la hora de utilizar el teorema
anterior no se trata de encontrar explı́citamente el valor de z si no más bien encontrar cotas para f (n+1) (z), que
nos darán una idea más o menos precisa del tamaño del resto.
donde x denota una variable. De forma general, una serie de potencias centrada en c es una serie infinita de la
forma
X∞
an (x − c)n = a0 + a1 (x − c) + a2 (x − c)2 + a3 (x − c)3 + · · · + an (x − c)n + · · ·
n=0
Para una serie de potencias centrada en c ha de ocurrir exactamente una de las tres posibilidades siguientes:
El número R se llama radio de convergencia de la serie de potencias. Si la serie converge sólo en c diremos que
el radio de convergencia es cero, y si la serie es convergente para todo x diremos que el radio de convergencia es
infinito. El conjunto de valores x donde la serie es convergente se denomina el intervalo de convergencia de la
serie de potencias.
Las operaciones básicas con series de potencias son las siguientes. Sean
∞
X ∞
X
f (x) = a n xn y g(x) = bn xn
n=0 n=0
dos series de potencias. Entonces:
∞
X
(1) f (kx) = a n k n xn
n=0
∞
X
(2) f (xm ) = an xnm
n=0
∞
X
(3) f (x) ± g(x) = (an ± bn )xn
n=0
∞
!
X X
n
(4) f (x)g(x) = am bn−m xn
n=0 m=0
P
Si f (x) = ∞ n=0 an (x − c) es una serie de potencias (convergente) entonces los coeficientes {an } de la serie
n
Una función f (x) se dice que es analı́tica si coincide con su serie de potencias en todos los puntos del dominio,
es decir, si
X∞
f (n) (c)
f (x) = (x − c)n .
n=0
n!
Algunas de las series de potencias asociadas a funciones elementales aparecen recogidas en la Tabla 2.1, junto con
los intervalos de convergencia.
46 MATEM ÁTICAS
∞
X
1
(−1)n xn −1 < x < 1
1+x n=0
X∞
(−1)n−1
ln(x) (x − 1)n 0<x62
n=1
n
X∞
xn
ex −∞ < x < ∞
n=0
n!
X∞
(−1)n x2n+1
sin(x) −∞ < x < ∞
n=0
(2n + 1)!
X∞
(−1)n x2n
cos(x) −∞ < x < ∞
n=0
(2n)!
Tabla 2.1: Series de potencias asociadas a algunas de las funciones m ás usuales.
Uno de los problemas más básicos del análisis numérico consiste en encontrar los valores x que satisfacen una de-
terminada ecuación f (x) = 0, para una función f dada. Este problema, conocido como el problema de búsqueda
de raı́ces, no es un problema trivial y prueba de ello es que sigue estando de plena actualidad. La dificultad no es-
triba en encontrar métodos para obtener soluciones, sino encontrar métodos que permitan encontrar las soluciones
en un “tiempo razonable”. En esta sección vamos a discutir tres métodos: el algoritmo de bisección, el método de
iteración del punto fijo y el método de Newton-Raphson.
La justificación teórica de este método debemos buscarla en el teorema de Bolzano: si f es una función continua
en [a, b] con signos opuestos en los extremos (es decir, f (a)f (b) < 0), entonces existe un cero de f en (a, b).
El algoritmo de bisección o método de búsqueda binaria puede describirse como sigue. Comenzamos definien-
do a1 = a y b1 = b, y sea p1 el punto medio del intervalo (a1 , b1 ). Si f (p1 ) = 0, ya hemos encontrado el cero.
De lo contrario, f (p1 ) 6= 0 y entonces puede suceder una de las dos afirmaciones siguientes:
y6
f (b) (b, f (b))
-
a p1 p2 b x
f (a)
(a, f (a))
Observemos que en cada etapa la longitud del intervalo resultante es la mitad de la longitud del intervalo prece-
dente, por lo que
1 1
L([an , bn ]) = n L([a, b]) = n (b − a)
2 2
Esto significa que, siempre que se verifiquen las condiciones del teorema de Bolzano, el método proporciona una
solución, ya que la sucesión {pn } es de Cauchy y, por tanto, convergente.
No obstante, en la práctica no se suele encontrar el valor exacto de la solución por lo que conviene introducir algún
mecanismo de paro. Algunos de los mecanismos de paro más usuales son:
Un punto fijo de una función g es un punto a tal que g(a) = a. Dada una función f , podemos considerar
la función g(x) = x ± f (x), de forma que a es un cero de f si y sólo si a es punto fijo de g. Por tanto, la
determinación de puntos fijos puede ayudar a la determinación de raı́ces.
En este punto surge un problema: ¿todas las funciones tienen puntos fijos? Si la respuesta es negativa, entonces
¿qué condiciones debe satisfacer una función para que tenga puntos fijos?
Condiciones para la existencia de puntos fijos. Si g es una función continua definida en [a, b] y con valores en el
mismo intervalo, entonces g tiene un punto fijo. Si además g es derivable en (a, b) y satisface |g 0 (x)| 6 k < 1 en
(a, b) entonces sólo existe un punto fijo.
Si g es una función que satisface el resultado anterior y p0 es un punto cualquiera del intervalo [a, b] entonces la
sucesión
pn = g(pn−1 )
48 MATEM ÁTICAS
y=x
y 6
g(p) = p
y = g(x)
a
-
p x
a b
converge al único punto fijo p de g en [a, b]. Además, una cota para el error cometido si se utiliza pn para aproximar
a p viene dada por
|pn − p| 6 kn max{p0 − a, b − p0 }.
Este método, también conocido sólo como método de Newton, es uno de los algoritmos más conocidos y poderosos
en la resolución de ecuaciones f (x) = 0. La idea del método es construir una sucesión de puntos que se aproximan
a la solución utilizando para ello las rectas tangentes a la función f .
y y = f (x)
6
•
p
p0 p2 -
p1 x
0 •
La justificación teórica del método es la siguiente. Sea p el punto fijo y consideremos un punto y próximo a p que
no es una raı́z de f 0 , es decir, f 0 (y) 6= 0. Utilizando el polinomio de Taylor de grado 1 para la función f alrededor
del punto y obtenemos
f 00 (z)
f (x) = f (y) + f 0 (y)(x − y) + (x − y)2 ,
2
donde z es un número entre x e y. Particularizando la ecuación anterior en x = p obtenemos
f 00 (z)
0 = f (y) + f 0 (y)(p − y) + (p − y)2 .
2
C ÁLCULO DIFERENCIAL 49
Si suponemos que |p − y| es pequeño, entonces (p − y)2 es despreciable frente a |p − y| por lo que la ecuación
anterior queda 0 ≈ f (y) + f 0 (y)(p − y). Despejando p es esta ecuación se obtiene
f (y)
p≈y− ,
f 0 (y)
lo que es una aproximación mejor a p que y. El método de Newton consiste en considerar la sucesión de puntos
f (pn−1 )
pn = pn−1 − , n > 1.
f 0 (pn−1 )
El problema de la interpolación polinómica consiste en determinar el polinomio de menor grado que pasa por
n + 1 puntos (x0 , y0 ), . . . , (xn , yn ) prefijados. El grado de dicho polinomio es a lo más n.
Si (x0 , y0 ), . . . , (xn , yn ) son n + 1 pares de puntos tales que sus abcisas x0 , x1 , . . . , xn son todas distintas,
entonces existe un único polinomio P , denominado polinomio interpolante de Lagrange, de grado a lo más n
con la propiedad de que
P (xk ) = yk , k = 0, 1, . . . , n.
Este polinomio está dado por
X
n
P (x) = y0 Ln,0 (x) + y1 Ln,1 (x) + . . . + yn Ln,n (x) = yk Ln,k (x)
k=0
donde
Y
n
(x − xi )
Ln,k (x) = .
(xk − xi )
i=0,i6=k
Una pregunta importante en análisis numérico es la referida al error cometido cuando se realiza una aproximación.
En este caso, el término residual o cota de error cometido en la aproximación de una función por su polinomio
interpolante viene dado en el siguiente resultado.
Cota de error. Sea f una función suficientemente derivable en el intervalo [a, b] y consideremos (x0 , y0 ), . . . ,
(xn , yn ) n + 1 pares de puntos tales que yk = f (xk ) para todo k = 0, 1, . . . , n. Entonces
f (n+1) (z)
f (x) = P (x) + (x − x0 )(x − x1 ) · · · (x − xn ),
(n + 1)!
Observemos la similitud existente entre el resto en la aproximación anterior y el resto en el polinomio de Taylor
estudiado anteriormente.
50 MATEM ÁTICAS
Ln,k (x)
- x
x0 x1
xk xk+1
xn
xk−1 xn−1
El método descrito en la sección anterior para calcular el polinomio interpolante es muy complicado y poco
práctico. En primer lugar, la precisión del polinomio no se puede determinar hasta que los cálculos han sido
completados. En segundo lugar, los cálculos realizados para la obtención de unos polinomios interpolantes no
se pueden utilizar para calcular los polinomios interpolantes de grados superiores: siempre es necesario partir de
cero. En esta sección vamos a describir un método que permite aprovechar el trabajo realizado. La justificación
teórica del método es el siguiente resultado.
Sea f una función definida en x0 , x1 , . . . , xn y supongamos que m1 , m2 , . . . , mk son k enteros distintos con
0 6 mi 6 n para cada i. El polinomio de Lagrange de grado menor que k que coincide con f en xm1 , xm2 , . . . ,
xmk se denota por Pm1 ,m2 ,...,mk . Si xj , xi son dos números distintos y
(x − xj )P0,1,...,j−1,j+1,...,k (x) − (x − xi )P0,1,...,i−1,i+1,...,k (x)
P (x) =
(xi − xj )
entonces P es el polinomio interpolante de Lagrange de grado menor o igual que k que interpola a f en x0 , x1 ,
. . . , xk .
Los métodos que nos permiten representar explı́citamente el polinomio interpolante a partir de datos tabulados se
conocen con el nombre de métodos de diferencias divididas. Sean x0 , x1 , . . . , xn puntos distintos y considere-
mos Pn el polinomio de Lagrange que interpola a f en dichos puntos. Entonces existen constantes apropiadas a0 ,
a1 , . . . , an tales que
Tales constantes pueden determinarse de la siguiente manera. En primer lugar, a0 = Pn (x0 ) = f (x0 ). Si ahora
evaluamos en x1 se obtiene f (x0 ) + a1 (x1 − x0 ) = Pn (x1 ) = f (x1 ) de donde
f (x1 ) − f (x0 )
a1 = .
x1 − x0
C ÁLCULO DIFERENCIAL 51
f [xi ] = f (xi ),
f [xi+1 ] − f [xi ]
f [xi , xi+1 ] = ,
xi+1 − xi
..
.
f [xi+1 , . . . , xi+k ] − f [xi , . . . , xi+k−1 ]
f [xi , xi+1 , . . . , xi+k−1 , xi+k ] =
xi+k − xi
ak = f [x0 , x1 , . . . , xk ], k = 0, 1, . . . , n.
2
A.2.1. Hallar la ecuación de la recta tangente a la curva y = 32x +1
en el punto (0, 3).
A.2.2. Dada la parábola de ecuación y = x2 − 8x + 12, determinar el punto donde la tangente es paralela al eje
de abscisas.
A.2.4. ¿En qué punto de la gráfica de la función f (x) = x2 − 6x + 8 la tangente es paralela al eje de abscisas?
A.2.5. Determinar los puntos de la curva y = x3 + 9x2 − 9x + 15 en los cuales la tangente es paralela a la recta
y = 12x + 5.
A.2.6. Determinar los puntos de la curva y = x4 − 7x3 + 13x2 + x + 1 que tienen la tangente formando un ángulo
de π/4 radianes con el eje de abcisas.
A.2.7. Probar que la recta tangente a la curva f (x) = log2 (x) en el punto (a, f (a)) se traza uniéndolo con el
punto (0, f (a) − 2 log a).
A.2.8. Obtener las ecuaciones de la rectas tangente y normal a la curva y = x3 en los puntos (1, 2) y (2, 8).
A.2.9. Obtener las ecuaciones de la rectas tangente y normal a la curva y = (x + 1)(3 − x)1/3 en el punto (2, 3).
A.2.10. La curva dada por y = x2 + ax + b pasa por el punto (−2, 1) y alcanza un extremo relativo en x = −3.
Hallar a y b.
A.2.11. Hallar a, b, c y d para que la curva dada por y = ax3 +bx2 +cx+d tenga un máximo en el punto (−2, 21)
y un mı́nimo en el punto (−1, 6).
A.2.12. Hallar dos números cuya suma sea 20 y su producto el mayor posible.
A.2.13. Descomponer el número 25 en dos sumandos tales que el doble del cuadrado del primero más el triple
del cuadrado del segundo sea mı́nimo.
A.2.14. Calcular las dimensiones del mayor rectángulo cuyo perı́metro es 40 metros.
A.2.15. Demostrar que la suma de un número real positivo no nulo y su inverso es mayor o igual que 2.
A.2.16. Hallar dos números cuya suma es 18, sabiendo que el producto del uno por el cuadrado del otro ha de ser
máximo.
A.2.17. Hallar las dimensiones de un campo rectangular de 3600 metros cuadrados de superficie para poderlo
cercar mediante una valla de longitud mı́nima.
52 MATEM ÁTICAS
A.2.18. Se quiere vallar un campo rectangular que está junto a un camino. Si la valla del lado del camino cuesta
800 pesetas/metro y la de los otros lados cuesta 100 pesetas/metro, hallar el área del mayor campo que se
puede cercar con 288000 pesetas.
A.2.19. Un jardinero ha de construir un parterre en forma de sector circular con perı́metro de 20 metros. ¿Cuál
será el radio que da el parterre de área máxima? ¿Cuál será la amplitud en radianes del sector?
A.2.20. Los barriles que se utilizan para almacenar petróleo tienen forma cilı́ndrica y una capacidad de 160 litros.
Hallar las dimensiones del barril para que la chapa empleada en su construcción sea mı́nima.
A.2.21. De todos los triángulos isósceles de 12 metros de perı́metro, hallar las dimensiones del que tenga área
máxima.
A.2.22. Entre todos los rectángulos inscritos en una circunferencia de 12 metros de radio, hallar las dimensiones
del que tenga área máxima.
A.2.23. Averiguar cómo ha de ser un triángulo isósceles de área máxima inscrito en una circunferencia de radio
r.
A.2.24. Entre todos los cilindros rectos de volumen fijo V , hallar el de menor superficie.
A.2.25. Una hoja de papel debe contener 18 centı́metros cuadrados de texto impreso. Los márgenes superior e
inferior deben tener 2 centı́metros cada uno y los laterales 1 centı́metro. Calcular las dimensiones de la hoja
para que el gasto de papel sea mı́nimo.
A.2.26. Hallar los puntos de la curva y 2 = 6x cuya distancia al punto (4, 0) sea mı́nima.
A.2.28. Determinar las dimensiones de una piscina no cubierta de volumen 32 m3 con un fondo cuadrado, de
manera que la superficie de sus paredes y del suelo necesiten la mı́nima cantidad de material.
A.2.29. De una lámina cuadrada de 10dm de lado se cortan cuadrados en cada uno de los vértices con el objeto
de hacer una caja abierta por arriba. Calcular el lado del cuadrado que se debe cortar para que el volumen
de la caja sea máximo.
A.2.30. Las agujas de un reloj miden 4 y 6cm. Uniendo sus extremos se forma un triángulo. Determinar el
instante entre las 12h y las 12h30m en el cual el área del triángulo es máxima.
A.2.31. La tangente en un punto a una curva es paralela al eje horizontal. ¿Qué puede decirse de su inclinación?
¿Y de su pendiente? ¿Y de la derivada de la curva en ese punto?
A.2.32. a) Calcular el polinomio de Taylor de tercer grado alrededor de x0 = 0 para f (x) = (1 + x)1/2 .
√
b) Usar el polinomio de la parte (a) para aproximar 1.1.
A.2.33. Con el polinomio de Taylor de tercer grado P3 (x) obtenido en el ejercicio anterior, aproximar f (0.1),
f (0.5), f (1), f (2) y f (10). Calcular el error cometido en cada caso.
A.2.34. Encontrar el polinomio de Taylor de grado 2 para f (x) = x2 − 3 alrededor del punto
a) x0 = 1.
b) x0 = 0.
A.2.35. Obtener el polinomio de Taylor de tercer grado para f (x) = (1 + x)−2 alrededor de x0 = 0, y usar este
polinomio para aproximar f (0.05).
A.2.36. Sea f (x) = ln(1 + x). Encontrar el polinomio de Taylor de grado 4 para f alrededor de x0 = 0, y usarlo
para aproximar ln(1.1).
A.2.37. Usando los números, o nodos, x0 = 2, x1 = 2.5 y x2 = 4, calcular el polinomio interpolante de Lagrange
de segundo grado para la función f (x) = 1/x. Usar dicho polinomio para calcular el valor de f (3) y obtener
el error cometido.
C ÁLCULO DIFERENCIAL 53
A.2.38. Usar los polinomios interpolantes de Lagrange apropiados, de grado uno, dos, tres y cuatro, para aproxi-
mar
(a) f (2.5) si
f (2) = 0.5103757, f (2.2) = 0.5207843, f (2.4) = 0.5104147,
f (2.6) = 0.4813306, f (2.8) = 0.435916.
(b) f (0) si
f (−0.3) = −0.20431, f (−0.1) = −0.08993, f (0.1) = 0.11007,
f (0.3) = 0.39569, f (0.5) = 0.79845.
(c) f (1.25) si
f (1) = 0.24255, f (1.1) = 0.48603, f (1.2) = 0.8616, f (1.3) = 1.59751, f (1.4) = 3.76155.
(d) f (0.5) si
f (0.2) = 0.9798652, f (0.4) = 0.917771, f (0.6) = 0.8080348,
f (0.8) = 0.6386093, f (1) = 0.3843735.
(e) f (0.2) si
f (0.1) = 1.2314028, f (0.3) = 1.9121188, f (0.4) = 2.3855409,
f (0.5) = 2.9682818, f (0.6) = 3.6801169.
A.2.39. Usar los valores siguientes para construir un polinomio de Lagrange de grado dos o menor. Encontrar
una aproximación para sen(0.34).
sen 0.3 = 0.29552 sen 0.32 = 0.31457 sen 0.35 = 0.3429
A.2.40. Agregar el valor sen 0.33 = 0.32402 a los datos del ejercicio anterior y construir un polinomio de La-
grange de grado tres o menor. Aproximar sen 0.34.
A.2.41. Usar los valores siguientes para construir una aproximación polinómica de Lagrange de tercer grado para
f (1.09). La función que se está aproximando es f (x) = log10 tan(x).
f (1) = 0.1924 f (1.05) = 0.2414 f (1.1) = 0.2933 f (1.15) = 0.3492
A.2.42. Usar el polinomio interpolante de Lagrange de grado tres o menor para aproximar cos 0.75 usando los
siguientes valores:
cos 0.698 = 0.7661 cos 0.733 = 0.7432
cos 0.768 = 0.7193 cos 0.803 = 0.6946
A.2.43. La función f (x) = x3 + 4x2 − 10 tiene una raı́z en [1, 2]. Utilizar el algoritmo de bisección (10 etapas)
para calcular una aproximación de la raı́z. Calcular el error sabiendo que la raı́z exacta, con nueve cifras
decimales, es p = 1.365230013.
A.2.44. Demostrar que f (x) = x3 − x − 1 tiene exactamente un cero en el intervalo [1, 2]. Aproximar el cero con
0.01 de precisión usando el algoritmo de bisección.
A.2.45. Usar el algoritmo de bisección para encontrar soluciones con una exactitud de 0.01 para x4 − 2x3 − 4x2 +
4x + 4 = 0 en
(a) [−2, 0]
(b) [0, 2]
(c) [1, 2].
A.2.46. Usar el algoritmo de bisección para encontrar una solución con una exactitud de 0.01 para x = tan x en
[4, 4.5].
A.2.47. Usar el algoritmo de bisección para encontrar todas las soluciones de x3 − 7x2 + 14x − 6 = 0 con una
precisión de 0.001.
A.2.48. Usar el método de iteración del punto fijo para determinar una solución exacta a 0.01 para 2 sen πx + x =
0 en [1, 2]. Tomar p0 = 1.
A.2.49. Resolver x3 − x − 1 = 0 para la raı́z en [1, 2] usando el método de iteración del punto fijo. Obtener una
aproximación a la raı́z exacta a 0.01.
54 MATEM ÁTICAS
A.2.50. Usar el método de iteración del punto fijo para determinar una solución exacta a 0.001 de x = tan x en
[4, 5].
A.2.51. Aproximar con 0.01 de precisión las raı́ces de las siguientes ecuaciones en los intervalos dados usando el
método de Newton y el método de la secante.
4.1. Introducción
La práctica se va a realizar con el programa de cálculo matemático DERIVE for Windows, versión 4.05, de Soft
Warehouse. DERIVE for Windows permite realizar cálculos y manipulaciones matemáticas de carácter general,
lo cual significa que realiza muchas cosas de forma aceptable aunque no tiene la potencia de otros programas
especı́ficos. No obstante, DERIVE for Windows permite realizar todos los cálculos que un usuario medio puede
necesitar.
En esta práctica nos vamos a centrar en el cálculo diferencial en una variable. Aprenderemos a calcular lı́mites
de funciones, determinaremos los máximos, mı́nimos, y puntos de inflexión de una función, lo que nos permitirá
representar gráficamente dicha función (lo cual, dicho sea de paso, hace automáticamente el programa).
Antes de comenzar la práctica será conveniente que recordemos brevemente la ‘botonera’ de DERIVE for Win-
dows (ver Figura 2.9), ya que simplifica enormemente la introducción de datos y la realización de cálculos. Los
botones permiten realizar las siguientes tareas (de izquierda a derecha): New (abrir una nueva hoja de trabajo),
Open (abrir una hoja de trabajo existente), Save (guardar la sesión de trabajo), Print (imprimir la sesión de tra-
bajo), Remove (eliminar la expresión marcada), Unremove (recuperar la última expresión eliminada), Renumber
(renumerar las expresiones), Author expression (introducir una expresión sencilla), Author vector (introdu-
cir un vector), Author matrix (introducir una matriz), Simplify (simplificar), Approximate (calcular un valor
aproximado), Solve (resolver algebraicamente o numéricamente una expresión), Substitute for variables
(realizar una sustitución), Calculate limit (calcular un lı́mite), Calculate derivative (calcular una deriva-
da), Calculate integral (calcular una integral), Calculate sum (calcular una suma), Calculate product
(calcular un producto), 2D-plot window (realizar un gráfico bidimensional) y 3D-plot window (realizar un
gráfico tridimensional).
Figura 2.9: El uso de la ‘botonera’ de DERIVE for Windows nos puede simplificar mucho el trabajo. Otro elemento
interesante es la existencia de ‘teclas calientes’ que nos permiten evitar los menús, con lo que se gana
en rapidez.
C ÁLCULO DIFERENCIAL 55
Con DERIVE for Windows podemos calcular la derivada (de cualquier orden) de una función, el lı́mite de una
función f (x) cuando x tiende a un número finito x0 o infinito, los máximos, mı́nimos y puntos de inflexión, y
también podemos utilizar la información anterior para representar gráficamente una función. Veamos mediante
ejemplos cómo hacer cada una de las tareas anteriores.
ln(1 + x) − ln(1 − x)
Hallar el siguiente lı́mite: lim
x→0 x
Figura 2.10: Ventana del programa que nos permite calcular lı́mites de funciones.
Seguimos los mismos pasos que en el ejemplo anterior. Introducimos la expresión #e^(2x+1) y seleccionamos
56 MATEM ÁTICAS
Figura 2.11: Ventana del programa que nos permite derivar funciones.
Figura 2.12: Ventana del programa que nos permite desarrollar y simplificar expresiones.
Calcular los extremos y puntos de inflexión de la función 12x5 − 105x4 + 40x3 + 840x2 − 1440x
En este caso, lo conveniente es almacenar la función. Para ello, elegimos Declare y a continuación Function
definition, y nos aparece la ventana de la Figura 2.13. El programa nos solicita el nombre, la variable (o varia-
bles) independiente y la definición de la función. Tecleamos el nombre de la función (por ejemplo, F), el nombre
de la variable (por ejemplo, x) y la definición mediante la expresión 12x^5-105x^4+40x^3+840x^2-1440x.
Para los extremos debemos calcular los ceros de la derivada; para ello, seleccionamos las opciones Calculus|
Differentiate (con los valores de x para la variable y de 1 para el orden) y obtenemos 64x4 − 420x3 +
120x2 + 1680x − 1440. A continuación determinamos los ceros de este polinomio mediante las opciones
Solve|Algebraically, obteniendo x=1, x=2, x=-2, x=6.
Para determinar el carácter de estas raı́ces, debemos calcular el valor de la derivada segunda en ellos. Para ello,
seleccionamos la expresión que contiene la definición de la función F o la expresión que contiene su derivada.
A continuación seleccionamos las opciones Calculus|Differentiate, con el valor x para la variable y 2 ó
1 para el orden (dependiendo de si hemos seleccionado la función F o su derivada). Una vez hemos calculado
la derivada segunda la almacenamos en una función, que llamaremos G, siguiendo los mismos pasos que antes
(Declare y Function definition. . . ), recordando que para copiar automáticamente la expresión seleccionada
C ÁLCULO DIFERENCIAL 57
Figura 2.13: Venta del programa que permite declarar una función. Existen ventanas similares para declarar el
valor de una variable (constante, vector o matriz).
debemos pulsar F3. Si ahora queremos calcular el valor de G en las raı́ces previamente calculadas, sólo tenemos
que introducir la expresión G(1) y pulsar Simplify (análogamente para las demás), obteniendo los siguientes
resultados : G(1)=900 (luego en x=1 hay un mı́nimo), G(2)=-960 (máximo en x=2), G(-2)=-5760 (máximo
en x=-2) y G(6)=9600 (mı́nimo en x=6). Otra posibilidad es calcular los cuatro valores al mismo tiempo; para
ello introducimos la expresión como un vector de 4 elementos como [G(1),G(2),G(-2),G(6)], y el progra-
ma nos devolverá la solución como un vector: [900, -960, -5760, 9600]. Para determinar las ordenadas
correspondientes a cada abscisa habremos de calcular F (1), F (2), F (−2) y F (6), respectivamente, resultando:
F (1) = −653, F (2) = −496, F (−2) = 3856 y F (6) = −12528.
Para calcular los puntos de inflexión debemos obtener los ceros de la derivada segunda. Si la precisión de los
cálculos es Exact entonces obtendremos la solución en forma trigonométrica. Para obtener un resultado que
podamos manejar más cómodamente es conveniente aproximar seguidamente la solución numéricamente (utili-
zando para ello las opciones Simplify|Approximate con el número de dı́gitos que nos parezca adecuado). Los
ceros de la derivada segunda que se obtienen son los siguientes (damos también la ordenada correspondiente):
(1.51, −573.59), (−0.98, 2079.11) y (4.72, −7904.16).
A continuación se enuncian unos ejercicios sobre cálculo diferencial de funciones reales de una variable. Si el
alumno encuentra alguna dificultad debe revisar detenidamente los ejemplos anteriores.
√
9n4 − n + 3
(a) Calcular el lı́mite lim .
n→0 2n2 + 3n − 1
πx
(b) Calcular el lı́mite lim (1 − x) tan( ).
x→1 2
(c) Calcular la derivada quinta de e3x ln(x).
4.4. Bibliografı́a
C. Paulogorrón y C. Pérez. Cálculo matemático con DERIVE para PC, Ed. RA-MA, 1a Ed., 1994.
58 MATEM ÁTICAS
R.L. BURDEN y J.D. FAIRES Análisis Numérico, Grupo Editorial Iberoamericana, 1985. Secciones 2.1, 2.2,
2.3, 3.2, 3.3 y 3.4.
R.E. LARSON, R.P. HOSTETLER y B.H. EDWARDS Calculo y Geometrı́a Analı́tica, 5a ed., vol. 1. McGraw-
Hill, Madrid, 1995. Capı́tulos 2,3 y 4.
J. STEWART Cálculo, 2a ed. Grupo Editorial Iberoamérica, México, 1994. Capı́tulos 1,2, y 3.
6. PREGUNTAS DE EVALUACIÓN
4x2 − 4x + 1
y= .
5x2 − 6x + 1
E.2.2. Determinar cómo ha de ser un triángulo isósceles de área máxima inscrito en una circunferencia de radio
r.
x f (x)
0 1
1 3
3 −2
5 4
E.2.4. Se dispone de un alambre de longitud L con el que hay que construir un cı́rculo y un cuadrado. ¿Cómo se
debe dividir el alambre en dos trozos para que la suma de las áreas encerradas por el cı́rculo y el cuadrado
sea mı́nima? ¿Y para que dicha suma de áreas sea máxima?
E.2.5. Utilizar algún método numérico para aproximar, con una precisión de 10−6 , el valor de x tal que la distan-
cia entre el punto (1,0) y los puntos de la parábola (x, y(x)), y(x) = x2 , se hace mı́nima.
Observación : Sea cual sea el método que se utilice, debe considerarse que un valor aproximado pn se acerca
al valor real con una precisión de 10−6 si se satisface que |pn − pn−1 | < 10−6 .
E.2.6. Un pediatra está realizando un seguimiento del peso de los niños que pasan por su consulta. Elegida una
ficha al azar de su archivo, observa los siguientes datos:
Edad (años) 1 2 4 5
Peso (Kg) 9 12 16 18
C ÁLCULO DIFERENCIAL 59
Utilizar interpolación polinómica de Lagrange para obtener una aproximación numérica del peso del niño a
los 3 años de edad.
E.2.7. Una persona se somete a una dieta de adelgazamiento durante 5 semanas. A continuación se detalla su
peso al término de cada una de esas semanas:
Al cabo de...(semanas) 1 2 3 4 5
Peso en Kg. 880 5 87 84 820 5 79
Calcular la ecuación de un polinomio de grado 4 que relacione las dos variables. Usando dicho polinomio
¿qué peso esperarı́amos que alcance esta persona si sigue la dieta dos semanas más?
E.2.8. Representar gráficamente la función f : R → R definida como sigue:
(x − 1)(x − 2)(x − 3)
f (x) = .
(x − 4)(x − 5)(x − 6)
Calcular sólo los elementos que sean indispensables para realizar una representación gráfica correcta.
E.2.9. Utilizar cualquier método numérico, de entre los que han sido explicados en las clases de teorı́a, para
calcular una raı́z de la ecuación
x3 + 2x − 1 = 0
con una cota de error de 00 001.
60 MATEM ÁTICAS
ANOTACIONES
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
CAPÍTULO 3
CÁLCULO INTEGRAL
En esta sección partimos de la base que el concepto de área es bien conocido. Esto no significa que el alumno
deba tener una idea precisa y formal de dicho concepto, si no más bien que todos poseemos una idea intuitiva que
no necesita aclaración.
El tipo de región más simple con el que nos podemos encontrar es un rectángulo, cuya área se define como
el producto de su base por su altura. A partir de esta definición podemos obtener las fórmulas para el área de
regiones más complicadas: triángulos, paralelogramos, polı́gonos regulares, etc. El gran problema se plantea
cuando se intenta calcular el área de regiones más generales que las poligonales.
Los primeros matemáticos que intentaron resolver el problema de una forma seria fueron los griegos, utilizando el
método de “exhaución”. Este método, atribuido a Arquı́medes, consiste en encajar la región entre dos polı́gonos,
uno inscrito y otro circunscrito. Si la diferencia entre las áreas de los dos polı́gonos es pequeña, entonces podemos
aproximar el área de la región por cualquier número comprendido entre el área del polı́gono inscrito y el área del
polı́gono circunscrito.
El método que emplearemos aquı́ es parecido. Se trata de aproximar la región por una unión de rectángulos de tal
62 MATEM ÁTICAS
forma que el área de la región se aproxime por la suma de las áreas de los rectángulos.
2.2.1. El sumatorio
Como hemos indicado anteriormente, el área de una región se va a obtener como una suma (posiblemente infinita)
de áreas de rectángulos. Para facilitar la escritura y comprensión de tal proceso, vamos a introducir una notación.
donde i se llama ı́ndice de la suma, ai el i-ésimo término de la suma y los lı́mites inferior y superior de la
suma son 1 y n, respectivamente. Estos lı́mites deben ser constantes con respecto al ı́ndice de la suma y la única
restricción es que el lı́mite superior debe ser cualquier entero superior (o igual) al lı́mite inferior.
X
n X
n
(1) kai = k ai , donde k es una constante que no depende del ı́ndice de la suma.
i=1 i=1
X
n X
n X
n
(2) [ai ± bi ] = ai ± bi
i=1 i=1 i=1
X
n
(1) c = cn.
i=1
X
n
n(n + 1)
(2) i= .
i=1
2
X
n
n(n + 1)(2n + 1)
(3) i2 = .
i=1
6
X
n
n2 (n + 1)2
(4) i3 = .
i=1
4
Consideremos una función f definida en el intervalo cerrado [a, b]. Una partición P de dicho intervalo es un
conjunto de números {x0 , x1 , x2 , . . . , xn } tales que
a = x0 < x1 < x2 < · · · < xn−1 < xn = b.
C ÁLCULO INTEGRAL 63
Si ∆xi es la anchura del i-ésimo subintervalo [xi−1 , xi ], es decir, ∆xi = xi − xi−1 , entonces se define la norma
de P, y se denota por ||P ||, como la longitud del subintervalo más grande. En otras palabras,
X
n
f (ci )∆xi , xi−1 6 ci 6 xi ,
i=1
se llama suma de Riemann de la función f asociada a la partición P . Entre todos los posibles valores de ci ,
podemos destacar los siguientes:
(1) ci = mi para todo i, donde f (mi ) es el valor mı́nimo de f en el i-ésimo subintervalo. Entonces la suma de
Riemann
X
n
s(f, P ) = f (mi )∆xi
i=1
y y = f (x)
6
-
x
0 a b
(2) ci = Mi para todo i, donde f (Mi ) es el valor máximo de f en el i-ésimo subintervalo. Entonces la suma
de Riemann
Xn
S(f, P ) = f (Mi )∆xi
i=1
X
n
Es fácil comprobar que s(f, P ) 6 f (ci )∆xi 6 S(f, P ) para cualquier partición P del intervalo [a, b].
i=1
Una función f definida en [a, b] se dice integrable en [a, b] si existe el lı́mite de las sumas de Riemann de f
(cuando la norma de P tiende a 0) y denotamos este lı́mite mediante
X
n Z b
lim f (ci )∆xi = f (x)dx.
||P ||→0 a
i=1
64 MATEM ÁTICAS
y = f (x)
y 6
-
x
0 a b
Dicho valor se denomina integral definida de f entre a y b. a y b son los lı́mites inferior y superior de integración,
respectivamente.
No todas las funciones son integrables. Sin embargo, el siguiente resultado nos garantiza que la familia de funcio-
nes integrables en un intervalo es muy grande: “Toda función continua en un intervalo cerrado [a, b] es integrable
en dicho intervalo ”.
La relación entre el área de una región y el concepto de integral definida queda reflejada en el siguiente resultado:
Si f es continua y no negativa en un intervalo cerrado [a, b], entonces el área de la región limitada por f , el eje x
y las lı́neas verticales x = a y x = b viene dada por
Z b
área = f (x)dx.
a
Z a
(1) f (x)dx = 0.
a
Z a Z b
(2) f (x)dx = − f (x)dx.
b a
Z b
(3) cdx = c(b − a).
a
Z b Z b Z b
(4) [f (x) ± g(x)]dx = f (x)dx ± g(x)dx.
a a a
Z b Z b
(5) cf (x)dx = c f (x)dx.
a a
C ÁLCULO INTEGRAL 65
Z b Z c Z b
(6) f (x)dx = f (x)dx + f (x)dx.
a a c
(8) Si f y g son integrables en [a, b] satisfaciendo que f (x) 6 g(x) para todo valor de x en [a, b], entonces
Z b Z b
f (x)dx 6 g(x)dx.
a a
El problema de la integración puede interpretarse como el problema dual de la derivación, y tal relación queda
claramente de manifiesto en el Teorema Fundamental del Cálculo. Antes de llegar a este teorema importantı́simo,
necesitamos introducir el concepto de primitiva (o antiderivada).
Sean f y F dos funciones. Se dice que F es una primitiva (o antiderivada) de la función f si F 0 (x) = f (x)
para todo valor posible de x.
El siguiente resultado es de una importancia crucial, ya que nos garantiza que cualquier primitiva de una función
puede ser obtenida mediante la adición de una constante a una primitiva conocida. Esta será la base del segundo
teorema del cálculo integral o Regla de Barrow.
Como consecuencia de lo anterior y de las propiedades de la derivación de funciones, se tienen las siguientes
propiedades:
Z
(1) 0dx = C.
Z
(2) kdx = kx + C.
66 MATEM ÁTICAS
Z Z
(3) kf (x) = k f (x)dx.
Z Z Z
(4) [f (x) ± g(x)]dx = f (x)dx ± g(x)dx.
Z
xn+1
(5) xn dx = + C.
n+1
Las reglas del cálculo integral descritas anteriormente permiten encontrar la integral indefinida de ciertas funcio-
nes a partir de la integral indefinida de otras funciones más elementales o básicas. Pero en último extremo, la
integral indefinida de estas funciones básicas debe obtenerse a partir de la definición. Para facilitar la búsqueda de
integrales indefinidas, en la Tabla 3.1 listamos algunas de las más elementales; la lista no es demasiado exhaustiva
y siempre se puede recurrir a cualquiera de los libros recomendados para obtener una tabla más completa.
El método de integración por sustitución o cambio de variable se apoya en el siguiente resultado teórico.
C ÁLCULO INTEGRAL 67
Z Z
xn+1
kdx = kx + C xn dx = +C
n+1
Z Z
1
dx = ln |x| + C ex dx = ex + C
x
Z Z
x ax
a dx = +C cos xdx = sen x + C
ln a
Z Z
sen xdx = − cos x + C tan xdx = − ln | cos x| + C
Z Z
cotan xdx = ln | sen x| + C sec xdx = ln | sec x + tan x| + C
Z Z
cosec xdx = − ln | cosec x + cotan x| + C sec2 xdx = tan x + C
Z Z
cosec2 xdx = − cotan x + C sec x tan xdx = sec x + C
Z Z
dx x
cosec x cotan xdx = − cotan x + C √ = arcsen + C
a 2 − x2 a
Z Z
dx 1 x dx 1 |x|
= arctan + C √ = arcsec +C
a 2 + x2 a a x x2 − a 2 a a
Z Z
cosh xdx = senh x + C senh xdx = cosh x + C
Sean f y g funciones tales que f ◦ g es una función continua en un intervalo I . Si F es una primitiva de f en I ,
entonces Z
f (g(x))g 0 (x)dx = F (g(x)) + C.
Esta técnica es especialmente útil cuando la función a integrar es un producto de funciones algebraicas o trascen-
dentes, de tal suerte que un factor se deriva fácilmente y otro factor se integra sin mucha dificultad. El método se
sustenta en el siguiente resultado teórico:
(1) Tratar de que dv sea la parte más complicada del integrando que se ajusta a una fórmula de integración
básica. Entonces u será el resto del integrando.
(2) Alternativamente, tratar de que u sea la parte del integrando cuya derivada es una función más simple que
u. Entonces dv será el factor restante del integrando.
Z Z Z
(1) xn eax dx, xn sen axdx, xn cos axdx
Considerar u = xn y dv = eax dx, sen axdx, cos axdx, respectivamente.
Z Z Z
(2) x ln xdx, x arcsen axdx, xn arctan axdx
n n
Para descomponer una función racional propia en fracciones simples debemos seguir los siguientes pasos:
(1) Factorizar el denominador. Hay que descomponer completamente el denominador Q(x) en factores de la
forma
(px + q)k
y
(ax2 + bx + c)k ,
donde ax2 + bx + c es irreducible (tiene raı́ces complejas).
(2) Factores lineales. Por cada factor de la forma (px+q)k , la descomposición en factores simples debe incluir
la siguiente suma de k fracciones simples:
A1 A2 Ak
+ + ··· + .
(px + q) (px + q)2 (px + q)k
(3) Factores cuadráticos. Por cada factor de la forma (ax2 + bx + c)k , la descomposición en factores simples
debe incluir la siguiente suma de k fracciones:
B1 x + C 1 B2 x + C2 Bk x + Ck
+ + ··· + .
(ax2 + bx + c) (ax2 + bx + c)2 (ax2 + bx + c)k
Cuando el denominador tiene factores de multiplicidad mayor que uno, entonces la obtención de la integral indefi-
nida puede ser muy laboriosa. En estos casos es recomendable utilizar el siguiente método, que también es válido
en cualquier otra situación.
y la integral queda
Z Z Z
sen x cos xdx = sen x(1 − sen x) cos xdx = tm (1 − t2 )k dt
m n m 2 k
y la integral queda
Z Z Z
senm x cosn xdx = (1 − cos2 x)k cosn x sen xdx = − tn (1 − t2 )k dt
(6) Si no se puede aplicar ninguna de las reglas anteriores, debemos intentar convertir la integral a senos y
cosenos.
Las sustituciones trigonométricas se emplean en integrales donde aparacen los siguientes radicales:
p p p
a 2 − x2 , a 2 + x2 , x2 − a 2 .
Los cambios que deben hacerse son los siguientes:
√ √
(1) Para integrales que contienen a2 − x2 , hacer x = a sen t. Entonces
a2 − x2 = a cos t.
√ √
(2) Para integrales que contienen a2 + x2 , hacer x = a tan t. Entonces a2 + x2 = a sec t.
√ √
(3) Para integrales que contienen x2 − a2 , hacer x = a sec t. Entonces a2 − x2 = ±a tan t. El signo + o
− depende de si x > a o x < −a, respectivamente.
72 MATEM ÁTICAS
Para las integrales de funciones racionales en senos y cosenos existen varios cambios de variable especiales. Se
trata de calcular la integral Z
R(sen x, cos x)dx,
donde R es una función racional. Los cambios apropiados son los siguientes:
(1) Si R es impar en sen x, es decir, R(− sen x, cos x) = −R(sen x, cos x), entonces debemos hacer t = cos x.
(2) Si R es impar en cos x, es decir, R(sen x, − cos x) = −R(sen x, cos x), entonces debemos hacer t = sen x.
(3) Si R(− sen x, − cos x) = R(sen x, cos x), entonces debemos hacer t = tan x.
(4) Si no se puede aplicar ninguno de los casos anteriores, entonces hacemos el cambio universal t = tan(x/2),
de modo que
2t
sen x = ,
1 + t2
1 − t2
cos x = ,
1 + t2
2dt
dx = .
1 + t2
No siempre es posible expresar la integral de una función irracional mediante funciones elementales. En esta
sección veremos algunos tipos de funciones irracionales que sı́ permiten expresar su integral indefinida por medio
de funciones elementales.
Z
2.4.6.1. Integrales del tipo R(x, xp1 /q1 , . . . , xpk /qk )dx
Se efectúa la sustitución
x = tm ,
siendo m el mı́nimo común múltiplo de {q1 , q2 , . . . , qk }.
Se efectúa la sustitución
ax + b
= tm ,
cx + d
siendo m el mı́nimo común múltiplo de {q1 , q2 , . . . , qk }.
C ÁLCULO INTEGRAL 73
Z p
2.4.6.3. Integrales del tipo R(x, ax2 + bx + c)dx
(2) Si ax2 + bx + c = a(x − α)(x − β), siendo α y β las raı́ces reales, entonces hacemos
p
ax2 + bx + c = (x − α)t,
de modo que
aβ − αt2
x= .
a − t2
Z
2.4.6.4. Integrales del tipo xm (a + bxn )p dx
Estas integrales se conocen con el nombre de integrales binomias, y los exponentes m, n y p deben ser números
racionales. En primer lugar se realiza el cambio de variable t = xn y la integral se transforma en la siguiente
Z Z
1
xm (a + bxn )p dx = tq (a + bt)p dt,
n
m+1
donde q = − 1. La integral anterior se puede calcular explı́citamente en los siguientes casos:
n
(1) Si p es entero entonces se desarrolla el binomio (a + bt)p o (a + bt)−p , según sea p positivo o negativo, y
se obtiene una integral irracional del tipo R(x, xp1 /q1 , . . . , xpk /qk ).
(2) Si p no es entero pero q sı́ lo es, entonces la integral se transforma en una irracional del tipo R(t, (a+bt)r/s ).
(3) Si p no es entero pero p + q sı́, entonces la integral se transforma en una integral irracional del tipo
r/s !
a + bt
R t, .
t
Ya hemos visto que el área que hay bajo una curva se puede calcular utilizando la integral definida. Con muy
escasas modificaciones podemos calcular el área que hay entre dos curvas. Consideremos dos funciones f y g
74 MATEM ÁTICAS
definidas en un intervalo [a, b] tales que f (x) > g(x) para todo valor x de [a, b]. Entonces el área de la región
limitada por las gráficas de f y g y las lı́neas rectas x = a y x = b viene dada por
Z b
A= [f (x) − g(x)]dx.
a
En general, puede ocurrir que no siempre se verifique f (x) > g(x) ni lo contrario. Entonces debemos dividir el
intervalo [a, b] en subintervalos donde sı́ ocurra, aplicar la fórmula anterior en cada subintervalo y posteriormente
sumar los resultados. En otras palabras:
El área de la región limitada por las gráficas de dos funciones f y g , y las lı́neas rectas x = a y x = b viene dada
por
Z b
A= |f (x) − g(x)|dx.
a
En esta sección vamos a calcular el volumen de un sólido tridimensional que aparece frecuentemente en ingenierı́a
y en procesos de producción. Nos estamos refiriendo a los sólidos de revolución, los cuales se obtienen al hacer
girar una región plana alrededor de una recta contenida en el mismo plano y que no corta a la región. Ejemplos de
sólidos de revolución son el cilindro circular recto, la esfera y el toro.
Para calcular el volumen de un sólido de revolución por el método de discos, debemos utilizar las siguientes
fórmulas:
En este caso estamos suponiendo que la región plana que gira es la región limitada por la gráfica de R(y),
el eje y, y las lı́neas rectas y = c y y = d. Como eje de revolución se considera el eje y.
Se utiliza este método cuando se trata de calcular el volumen de un sólido de revolución con un agujero. Este
tipo de sólidos aparecen cuando la región plana que gira y el eje de revolución no están juntos. Supongamos que
la región plana es la región determinada por las gráficas de las funciones R(x) y r(x) (con R(x) > r(x)), y las
lı́neas rectas x = a y x = b. Si se gira esta región alrededor del eje x entonces el volumen del sólido resultante es
Z b
V =π [R(x)2 − r(x)2 ]dx.
a
Si la región plana es la región determinada por las gráficas de las funciones R(y) y r(y) (con R(y) > r(y)), y las
lı́neas rectas y = c y y = d. y se gira esta región alrededor del eje y entonces el volumen del sólido resultante es
Z d
V =π [R(y)2 − r(y)2 ]dy.
c
Consideremos la región plana determinada por la gráfica de una función f (x), y las rectas x = a, x = b e y = c.
El volumen del sólido de revolución obtenido al girar dicha región alrededor de un eje vertical x = x0 viene dado
por
Z b
V = 2π p(x)h(x)dx,
a
donde p(x) es la distancia de x al eje de revolución y h(x) es la distancia entre c y f (x). Usualmente, el eje de
revolución es el eje y y la región está junto al eje x, por lo que p(x) = x y h(x) = f (x).
Si consideramos la región plana determinada por la gráfica de una función f (y), y las rectas y = c, y = d y x = a,
el volumen del sólido de revolución obtenido al girar dicha región alrededor de un eje horizontal y = y0 viene
dado por
Z d
V = 2π p(y)h(y)dy,
c
donde p(y) es la distancia de y al eje de revolución y h(y) es la distancia entre a y f (y). Cuando el eje de
revolución es el eje x y la región está junto al eje y, entonces p(y) = y y h(y) = f (y).
Analicemos ahora un sólido S cualquiera. Vamos a suponer que existe una recta, que consideraremos el eje x,
y dos planos paralelos entre sı́ y perpendiculares al eje, tales que el sólido se encuentra entre ambos planos (de
ecuaciones x = a y x = b). Cada plano x = x0 , a 6 x0 6 b, paralelo a los anteriores y perpendicular al eje
intersecciona a S según una región (denominada sección transversal) cuya área se denota por A(x0 ). Haciendo
esto para cada valor x0 en el intervalo [a, b] podemos construir una función A(x), definida en [a, b], que mide el
área de las secciones transversales. Entonces el volumen de S viene dado por
Z b
V = A(x)dx.
a
C ÁLCULO INTEGRAL 77
Casos particulares de esta fórmula han sido obtenidos en la sección anterior dedicada a los sólidos de revolución.
Un segmento de curva se dice rectificable si tiene una longitud de arco finita. El problema de determinar la lon-
gitud de una curva es muy antiguo (algunas contribuciones ya fueron realizadas por los matemáticos C. Huygens
(1629–1695) y J. Gregory (1638–1675)) y no por ello es sencillo. Una condición suficiente para que la gráfica de
una función f sea rectificable entre los puntos (a, f (a)) y (b, f (b)) es que la derivada f 0 sea una función continua
en [a, b]. Se dice entonces que la función f es continuamente derivable o de clase C 1 .
El fundamento teórico que nos permite obtener una fórmula para la longitud de arco es el siguiente. Consideremos
dos puntos xi−1 y xi en el intervalo [a, b]. Entonces por el teorema del valor medio se tiene
Si aproximamos la longitud de arco de la curva por la longitud de una poligonal que se apoya en los puntos
{(xi , f (xi ))} entonces al tomar lı́mites se obtiene
X
n p
Lba (f ) = lim (∆xi )2 + (∆yi )2
n→∞
i=1
s 2
X
n
∆yi
= lim 1+ ∆xi
n→∞
i=1
∆xi
Xn p
= lim 1 + f 0 (ci )2 ∆xi
n→∞
i=1
Z b p
= 1 + f 0 (x)2 dx
a
(1) Si la función y = f (x) representa una curva suave en el intervalo [a, b], la longitud de arco de f entre a y b
viene dada por
Z bp
Lba (f ) = 1 + f 0 (x)2 dx.
a
(2) Si la función x = g(y) representa una curva suave en el intervalo [c, d], entonces la longitud de arco de g
entre c y d es
Z dp
Ldc (g) = 1 + g 0 (y)2 dy.
c
Si se gira la gráfica de una función continua alrededor de una recta, la superficie resultante se denomina superficie
de revolución. Para calcular el área de una superficie de revolución se parte de la fórmula del área de un tronco
de cono circular recto y se aplica a los conos obtenidos al rectificar la curva por medio de una poligonal que se
apoya en los puntos {(xi , f (xi ))}. El resultado obtenido es el siguiente.
78 MATEM ÁTICAS
Si y = f (x) tiene derivada continua en el intervalo [a, b], entonces el área de la superficie de revolución S formada
al girar la gráfica de f alrededor de un eje horizontal o vertical es
Z b p
S = 2π r(x) 1 + f 0 (x)2 dx,
a
La definición de integral definida que hemos presentado requiere que el intervalo [a, b] de integración sea finito y
que la función f a integrar sea continua. Sin embargo, existen funciones que no cumplen estos requisitos (bien
porque el intervalo no es finito o bien porque la función f presenta alguna discontinuidad) y que, sin embargo,
pueden ser integradas, en un sentido que precisaremos a continuación.
y 6
y = f (x)
-
0 a x
Si los lı́mites existen, la integral correspondiente se dice que converge o que es convergente; en caso contrario,
diremos que la integral diverge o que es divergente.
En este apartado analizamos la integrales impropias que aparecen cuando existe alguna discontinuidad infinita en
los lı́mites de integración o en el interior del intervalo. Se pueden presentar las siguientes posibilidades:
y 6
y = f (x)
-
0 a c b x
(3) Si f es continua en [a, b] excepto en un punto c ∈ (a, b) donde presenta una discontinuidad infinita, entonces
Z b Z c Z b
f (x)dx = f (x)dx + f (x)dx.
a a c
Si los lı́mites existen, la integral correspondiente se dice que converge o que es convergente; en caso contrario,
diremos que la integral diverge o que es divergente.
Hay ocasiones en las que es imposible determinar explı́citamente la integral indefinida de una función, por lo
que no podemos calcular el área que hay bajo la gráfica de la función utilizando la Regla de Barrow. En estos
casos, sólo nos queda recurrir al cálculo numérico de dichas integrales, utilizando una técnica de aproximación.
A continuación describimos algunos de los métodos más sencillos.
80 MATEM ÁTICAS
Rb
Sea f una función continua en [a, b]. La regla de las sumas inferiores para aproximar a
f (x)dx viene dada por
Z
b−a X
n
b
b−a
f (x)dx ≈ f (mi ) = [f (m1 ) + f (m2 ) + · · · + f (mn )],
a n i=1 n
Rb
Sea f una función continua en [a, b]. La regla de los extremos izquierdos para aproximar a f (x)dx viene dada
por
Z b
b−a X
n
b−a
f (x)dx ≈ f (xi−1 ) = [f (x0 ) + f (x1 ) + · · · + f (xn−1 )].
a n i=1 n
Rb
Análogamente, la regla de los extremos derechos para aproximar a
f (x)dx viene dada por
Z
b−a X
n
b
b−a
f (x)dx ≈ f (xi ) = [f (x1 ) + f (x2 ) + · · · + f (xn )].
a n i=1 n
Rb
Sea f una función continua en [a, b]. La regla del punto medio para aproximar a
f (x)dx viene dada por
Z
b−a X
n
b
b−a
f (x)dx ≈ f (x̄i ) = [f (x̄1 ) + f (x̄2 ) + · · · + f (x̄n )],
a n i=1 n
donde x̄i es el punto medio del i-ésimo subintervalo [xi−1 , xi ], es decir, x̄i = 12 (xi−1 + xi ).
Rb
Sea f una función continua en [a, b]. La regla del trapecio para aproximar a
f (x)dx viene dada por
Z
b − a X f (xi−1 ) + f (xi )
n
b
b−a
f (x)dx ≈ = [f (a) + 2f (x1 ) + · · · + 2f (xn−1 ) + f (b)].
a n i=1 2 2n
C ÁLCULO INTEGRAL 81
y y = f (x)
6
-
x
0 a b
y y = f (x)
6
-
x
0 a b
La regla de los trapecios se obtiene de aproximar la curva por una poligonal, con lo que la región bajo la curva
se aproxima por una unión de trapecios. En consecuencia, el área de dicha región se aproxima por la suma de las
áreas de los trapecios. Otra posibilidad puede ser agrupar los puntos de la partición de tres en tres y aproximar la
función por segmentos parabólicos (en lugar de rectilı́neos). Entonces la integral de la función se puede aproximar
por la integral de los segmentos parabólicos.
Rb
Sea f una función continua en [a, b]. La regla de Simpson para aproximar a
f (x)dx viene dada por
Z b
b−a
f (x)dx ≈ [f (a) + 4f (x1 ) + 2f (x2 ) + 4f (x3 ) + · · · + 2f (xn−2 ) + 4f (xn−1 ) + f (b)],
a 3n
y y = f (x)
6
p(x)
a = x0 x1 x
0 b = x2
Cuando se trabaja con aproximaciones es importante conocer con qué precisión estamos calculando el valor de
la integral. Además, es posible que algún método sea sensiblemente mejor que los demás, si bien puede que sea
bajo ciertas hipótesis. A continuación enunciamos los errores que se cometen en las reglas de aproximación más
usuales.
Rb
(1) Si f tiene derivada segunda continua en [a, b], entonces el error EM cometido al aproximar a
f (x)dx por
la regla del punto medio es
M (b − a)3
|EM | 6 ,
24n2
siendo M una cota superior para |f 00 |, es decir, |f 00 (x)| 6 M para todo valor de x.
Rb
(2) Si f tiene derivada segunda continua en [a, b], entonces el error ET cometido al aproximar a
f (x)dx por
la regla del trapecio es
M (b − a)3
|ET | 6 ,
12n2
siendo M una cota superior para |f 00 |, es decir, |f 00 (x)| 6 M para todo valor de x.
Rb
(3) Si f tiene derivada cuarta continua en [a, b], entonces el error ES cometido al aproximar a
f (x)dx por la
regla de Simpson es
M (b − a)5
|ES | 6 ,
180n4
siendo M una cota superior para |f (4) |, es decir, |f (4) (x)| 6 M para todo valor de x.
Z Z Z
√ 1 1
3
xdx dx √ dx
x2 x x
Z Z Z
1
x(x2 + 3)dx (x3/2 + 2x + 1)dx dx
(2x)3
Z Z Z
3 1
(x + 2)dx (x2 − 2x + 3)dx 3
dx
Z Z √ Z 2x
√
√ 1 3 4
x+ √ dx x2 dx ( x3 + 1)dx
2 x
Z Z 3 Z 4
x − 3x2 + 3x − 1 x −1
(x2 − 2x + 1)2 dx dx dx
Z Z x2 − 2x + 1 Z √ x−1
2
x(x + 1)
(2x − 1)2 (3x + 1)dx (x2 − 1)(x + 1)dx dx
Z √ Z √ Z x5/3
x4 (x2 − 1)3 dx x5 x−4/3 (x3 − 1)dx 3(4x − 2)2 dx
3 3
Z Z Z
1 1 1
3
dx 4
dx 2
dx
Z x Z x2 Z 4x2
x +x+1 x +1
(2x + x−1/2 )dx √ dx dx
x x2
Z Z Z 2
t +2
(x + 1)(3x − 2)dx (2t2 − 1)2 dt dt
Z Z Z t2
√
(1 − 2y + 3y 3 )dy y 2 ydy (1 + 3t)t2 dt
Z Z p Z
4
2(1 + 2x) dx x 9 − x2 dx x2 (x3 − 1)4 dx
Z p Z Z
3 x2 4x
5x 1 − x2 dx dx √ dx
(1 + x3 )2 16 − x2
Z Z 3 Z
x+1 1 1 1
dx 1+ dt √ dx
(x2 + 2x − 3)2 t t2 2x
Z 2 Z Z
x + 3x + 7 2 √
√ dx t2 t − dt (9 − y) ydy
x t
A.3.4. Calcular las siguientes integrales indefinidas por el método del cambio de variable:
Z Z Z
√ √ x2 − 1
x x + 2dx x2 1 − xdx √ dx
Z Z Z 2x − 1
−x x
√ dx √ dx x(x2 + 1)3 dx
(x + 1) − x + 1 2x + 1
Z Z Z
1 1 √
√ dx √ √ dx (x − 1) 2 − xdx
2x +1 x(1 + x)2
Z Z Z p
√ √ 3
x x − 3dx x 3 x + 1dx x 4 + x2 dx
Z Z Z
−2x 2 x3 −3x+1
e dx (x − 1)2 dx e1−x dx
Z Z Z
e−x 2 e3/x
dx xeax dx dx
(1 + e−x )2 x2
Z Z Z
−x −x 2
√ ex + e−x
e (1 + e ) dx ex 1 − ex dx √ dx
Z Z Z ex + e−x
5 − ex 2
dx (ex − e−x )2 dx (3 − x)e(x−3) dx
e2x
Z Z Z
1 1 x
dx dx 2+1
dx
Z 2 1
x + Z 3 − 2x Z x
x −4 ln x (1 + ln x)2
dx dx dx
Z 2x Z 2x Z x
x −2 1 x2 + 2x + 3
dx √ dx dx
x+1 x+1 x3 + 3x2 + 9x
Z Z Z √
1 1 x
dx √ dx √ dx
x2/3 (1 + x1/3 ) 1+ x x−3
Z √ Z Z
x x(x − 2)
√ dx dx 3x dx
1−x x (x − 1)3
Z Z Z
x x2 e−x
2 dx x5 dx −x
dx
Z √ Z Z 1+e
1− x 1
√ dx √ dx 4−x dx
1+ x
Z Z 1x+ 2x Z
2 e − e−x (ln x)2
(3 − x)7(x−3) dx dx dx
ex + e−x x
Z Z Z
2 3
2 cos xdx 3x sen x dx sec2 3xdx
Z Z Z √
sec2 x
tan2 xdx (cosec x + sen x) cosec xdx √ dx
x
Z Z Z
sen x
sen2 3x cos 3xdx 4 cos2 4x sen 4xdx 2x
dx
Z Z Z cos
sec2 x
√ dx tan xdx sec xdx
tan x
Z Z Z
sec2 x sec x tan x
dx dx (sen 2x + cos 2x)2 dx
Z tan x Z sec x − 1 Z
1 − cos θ
dθ ex cos ex dx (cosec 2θ − cotan 2θ)2 dθ
Z θ − sen θ Z Z
cos t
dt e−x tan e−x dx sen 2x cos 2xdx
1 + sen t
Z Z Z
1 1 1
√ dx dx √ dx
4 − x2 2 + 9x2 2x
e −1
Z Z Z
x+2 3x2 − 2 1
√ dx dx dx
4 − x2 x2 + 4 x2 − 4x − 7
Z Z Z
1 1 x
2
dx dx √ dx
2x − 8x + 10 3x − x2 2
x −1
Z Z Z
1 1 1
dx dx √ dx
1 − 9x2 1 + 4x2 x 4x2 − 1
Z Z Z
x3 1 1
dx p dx √ dt
x2 + 1 1 − (x + 1)2 1 − t4
Z Z Z
arctan x arcsen x x
dx √ dx √ dx
1 + x2 1 − x2 1 − x2
Z Z Z
ex 1 1
√ dx dx √ dx
1 − e2x x2 − 6x + 18 x(1 + x)
Z Z Z
sen x 1 2x
dx dx dx
1 + cos2 x x2 − 2x + 2 x2 + 6x + 13
Z Z Z
1 x+2 2x − 3
√ dx √ dx √ dx
Z −x2 − 4x Z −x2 − 4x Z √4x − x
2
x 1 x−1
dx √ dx dx
x + 2x2 + 2
4 2
−16x + 16x − 3 x
Z √ Z Z
1 1
et − 3dt √ dx dx
(x − 1) x2 − 2x x2 + 6x + 13
Z Z Z
cosh x
senh(1 − 2x)dx cosh2 (x − 1) senh(x − 1)dx dx
Z Z Z senh x
x2 cosech(1/x) cotanh(1/x)
x cosech2 dx dx senh2 xdx
Z 2 Z x2 Z
1 2 x
√ √ dx √ dx dx
x 1+x 1 − 4x2 x4 + 1
Z Z Z
1 1 1
√ dx dx dx
1 + e2x 1 − 4x − 2x2 25 − x2
Z Z Z
4 3/2 1
(3x − 2) dx (−2x + 5) dx v+ dv
(3v − 1)3
Z Z Z
t2 − 3 x2 ex
dt dx dx
Z −t3 + 9t + 1 Z x−1
x
Z 1+e t 2
(1 + e )
t sen2 tdt cos xesen x dx dt
Z Z Z et
2 1
sec 3x tan 3xdx −x
dx dx
e +1 1 − cos x
Z Z Z
2t − 1 3 1
dt dt √ dx
t2 + 4 2 2
Z x x 2− 4
t +1
Z Z
−1 t sec x
p dt √ dt dx
1 − (2t − 1)2 1 − t4 4 + tan2 x
Z Z Z 3
tan(2/t) 1
dt (1 + 2x2 )2 dx x 1+ dx
t2 x
Z Z Z
3 4
(1 + ex )2 dx √ dx dx
6x − x2 4x2 + 4x + 65
Z Z Z
2
xe2x dx xex dx xe−2x dx
Z Z Z
3 x 3
x e dx x ln xdx t ln(t + 1)dt
Z Z Z
(ln x)2 xe2x
(ln x)2 dx dx dx
x (2x + 1)2
Z Z Z
√ x2
(x2 − 1)ex dx x x − 1dx √ dx
2 + 3x
Z Z Z
3 5
cos x sen xdx sen 2x cos 2xdx sen5 x cos2 xdx
Z Z Z
cos2 3xdx sen4 πxdx sen2 x cos2 xdx
Z Z Z
2 2 2
x sen xdx x sen xdx sec 3xdx
Z Z Z
sec4 5xdx sec3 πxdx tan3 (1 − x)dx
Z Z Z
tan5 (x/4)dx sec2 x tan xdx tan2 x sec2 xdx
Z Z Z
sec5 πx tan πxdx sec6 4x tan 4xdx sec3 x tan xdx
Z Z Z
3 3
tan 3x sec 3xdx cotan 2xdx cosec4 θdθ
Z Z Z
cotan2 t
dt sen 3x cos 2xdx sen θ sen 3θdθ
cosec t
C ÁLCULO INTEGRAL 87
Z Z p Z
1 1
dx x x + x2 dx dx
(25 − x2 )3/2 (1 + x2 )2
Z Z p Z
x 1
√ dx 16 − 4x2 dx √ dx
x 2+9 x 2−9
Z Z √ Z
t2 1 − x2 1
dt dx √ dx
(1 − t2 )3/2 x4 2
Z Z p Z x 4x2 + 9
x x
dx e2x 1 + e2x dx √ dx
(x2 + 3)3/2 2x − x2
Z Z Z
1 3 5−x
2
dx 2
dx dx
Z x2 − 5x + 6 Z x 2+ x − 2 Z 2x2
+x−1
x + 12x + 12 4x + 2x − 1 x4
dx dx dx
x3 − 4x x3 + x2 (x − 1)3
Z Z 2 Z
3x x −1 x2
2 − 6x + 9
dx 3
dx 4 2
dx
Z x Z 2+x
x Z x − 2x2 − 8
x x +x+2 x +5
4
dx dx dx
16x − 1 (x2 + 2)2 x − 2x2 + 4x − 8
3
Z Z Z
5x2 + 20x + 6 5x2 + 20x + 6 2x3 − 4x − 8
dx dx dx
x3 + 2x2 + x x3 + 2x2 + x (x2 − x)(x2 + 4)
Z Z Z
8x3 + 13x x2 3x + 4
dx dx dx
(x2 + 2)2 (x + 1)2
1 3
x − 2x − 4
Z Z Z 3
6x2 − 3x + 14 x(2x − 9) x − 6x2 + x − 4
dx dx dx
x3 − 2x2 + 4x − 8 x3 − 6x2 + 12x − 8 1 − x4
A.3.28. Calcular el área de la región S comprendida entre la curva de ecuación y = x2 e−x y el eje OX.
A.3.29. Hallar la constante a para que el área encerrada por a(x2 − y 2 ) + x3 = 0 sea igual a 120 unidades
cuadradas.
88 MATEM ÁTICAS
A.3.30. El plano de un triángulo móvil permanece perpendicular a un diámetro fijo de radio a; la base del triángulo
es una cuerda del cı́rculo y su vértice opuesto está en una recta paralela al diámetro fijo y a distancia h del
plano del cı́rculo. Hallar el volumen del sólido engendrado por el movimiento de este triángulo desde un
extremo al otro del diámetro.
A.3.31. La base de un sólido es la región compredida entre la curva y = sen x y las rectas x = 0, x = π/2
e y = 0. Las secciones planas del sólido perpendicular al eje OX son triángulos equiláteros. Hallar el
volumen del sólido.
A.3.32. Un leñador arranca una cuña de un árbol cilı́ndrico de radio a. Su primer corte es paralelo al suelo y llega
hasta el eje del cilindro. El segundo corte forma un ángulo α con el primero y lo intersecta en su diámetro.
Calcular el volumen de la cuña. Indicación: Situar el eje OX de forma que las secciones transversales
perpendiculares a él sean rectángulos.
A.3.33. Calcular el volumen del sólido generado al girar respecto del eje OY la región limitada por las parábolas
y = x2 y 8x = y 2 .
A.3.34. Calcular
√ el volumen del sólido generado al girar el triángulo equilátero de vértices (0, 0), (2a, 0) y
(a, a 3) alrededor del eje OX.
A.3.35. La figura limitada por la hipocicloide x2/3 + y 2/3 = α2/3 y el eje OX gira alrededor de dicho eje. Hallar
el volumen del cuerpo de revolución engendrado.
a x
A.3.36. Dada la curva de ecuación y = ln , a > 0, calcular el volumen engendrado al girar alrededor del eje
x a
OX la región limitada por dicha curva y las rectas x = a y x = a/2.
A.3.37. Sea el volumen de revolución engendrado por f (x) = x(x − a), a > 0, al girar alrededor del eje OX,
entre las rectas x = 0 y x = c, con c > a. Hallar c para que dicho volumen sea igual al volumen del cono
engendrado por el triángulo de vértices (0, 0), (c, 0) y (c, f (c)) al girar alrededor del eje OX.
A.3.38. Hallar el volumen del sólido engendrado al girar alrededor de la recta de ecuación x = 2, la región
limitada por la curva y = x2 , el eje OX y la recta x = 2.
A.3.45. Hallar la longitud de la espiral logarı́tmica ρ = emϕ entre cierto punto (ρo , ϕo ) y un punto móvil (ρ, ϕ).
A.3.46. Calcular el área de la superficie generada por la curva y = ln x desde x = 1 hasta x = 5, al girar
alrededor del eje x = 0.
A.3.47. Hallar el área de la superficie engendrada al girar alrededor del eje OX el contorno cerrado formado por
las curvas x = y 2 e y = x2 .
x3
A.3.48. Calcular el área de la superficie generada al girar alrededor del eje OX la curva y = entre los puntos
3
de abcisas x = −2 y x = 2.
A.3.49. Usar las reglas del trapecio y de Simpson para aproximar las siguientes integrales. Comparar las aproxi-
maciones con los valores reales.
Z 2 Z 0.1
a) ln xdx b) x1/3 dx
1 0
Z π/3 Z 0.4
c) (sen x)2 dx d) e3x cos 2xdx
0 0.2
Z π/4 Z 3π/4
e) tan xdx f) cot xdx
0 π/2
A.3.50. Usar los valores de abajo para encontrar una aproximación a la integral
Z 1.5
ex dx
1.1
4.1. Introducción
La práctica se va a realizar con el programa de cálculo matemático DERIVE for Windows, versión 4.05, de Soft
Warehouse. DERIVE for Windows permite realizar cálculos y manipulaciones matemáticas de carácter general,
lo cual significa que realiza muchas cosas de forma aceptable aunque no tiene la potencia de otros programas
especı́ficos. No obstante, DERIVE for Windows permite realizar todos los cálculos que un usuario medio puede
necesitar.
En esta práctica nos vamos a centrar en el cálculo integral en una variable. Veremos cómo calcular integrales
inmediatas y utilizando los distintos métodos de integración: por cambio de variable, por partes, exponenciales y
logarı́tmicas, trigonométricas, racionales y binomias. Finalizaremos la práctica analizando algunas aplicaciones
del cálculo integral al cálculo de longitudes, áreas y volúmenes.
Antes de comenzar la práctica será conveniente que recordemos brevemente la ‘botonera’ de DERIVE for Win-
dows (ver Figura 3.12), ya que simplifica enormemente la introducción de datos y la realización de cálculos. Los
botones permiten realizar las siguientes tareas (de izquierda a derecha): New (abrir una nueva hoja de trabajo),
Open (abrir una hoja de trabajo existente), Save (guardar la sesión de trabajo), Print (imprimir la sesión de tra-
bajo), Remove (eliminar la expresión marcada), Unremove (recuperar la última expresión eliminada), Renumber
90 MATEM ÁTICAS
(renumerar las expresiones), Author expression (introducir una expresión sencilla), Author vector (introdu-
cir un vector), Author matrix (introducir una matriz), Simplify (simplificar), Approximate (calcular un valor
aproximado), Solve (resolver algebraicamente o numéricamente una expresión), Substitute for variables
(realizar una sustitución), Calculate limit (calcular un lı́mite), Calculate derivative (calcular una deriva-
da), Calculate integral (calcular una integral), Calculate sum (calcular una suma), Calculate product
(calcular un producto), 2D-plot window (realizar un gráfico bidimensional) y 3D-plot window (realizar un
gráfico tridimensional).
Figura 3.12: El uso de la ‘botonera’ de DERIVE for Windows nos puede simplificar mucho el trabajo. Otro elemento
interesante es la existencia de ‘teclas calientes’ que nos permiten evitar los menús, con lo que se gana
en rapidez.
DERIVE for Windows calcula sin ayuda la mayorı́a de integrales: polinómicas, trigonométricas y racionales.
Cuando la integral no es sencilla, o bien cuando DERIVE for Windows no sabe qué hacer, podemos ayudarle de
varias formas: transformando el integrando en otro más fácil de integrar o indicándole el método de integración
que debe utilizar. En este último caso, el programa nos proporciona una serie de utilidades que pueden ser
cargadas mediante las opciones File|Load|Math o File|Load|Util. Para escribir los integrandos podemos
utilizar todas las funciones que entiende DERIVE for Windows, las cuales se presentan en la siguiente tabla.
R
Calcular (4x2 − 2x + 7)dx
4 3
x − x2 + 7x
3
C ÁLCULO INTEGRAL 91
Figura 3.13: Ventana del programa que nos permite calcular integrales de funciones.
Z
3x + 5
Calcular dx
x3 − x2 − x + 1
Rπ
Calcular 0
cos(x)dx
Seleccionamos Author y tecleamos COS(x). A continuación elegimos Calculus|Integrate con las opciones
x (variable), π (lı́mite superior) y 0 (lı́mite inferior). El resultado obtenido (si estamos trabajando con precisión
exacta) es 0.
Siguiendo los pasos anteriores, introducimos la expresión COSH(x) y a continuación seleccionamos en el menú
Calculus|Integrate con las opciones x (variable), 2 (lı́mite superior) y -2 (lı́mite inferior). El resultado
obtenido es e2 − e−2 .
Cuando la integral no es tan sencilla y el programa no consigue integrar la función debemos ayudarle indicándole
cuál de los métodos de integración debe utilizar. En los siguientes ejemplos mostramos algunos casos tı́picos.
Para poder utilizar la integración por sustitución o por partes debemos de cargar la utilidad MISC.MTH, según se
ha explicado anteriormente.
Z
ex + 1
Calcular dx
ex − 4 + 4e−x
Esta integral la podemos calcular siguiendo los mismos pasos que en los ejemplos anteriores. Sin embargo, aquı́
la vamos a calcular mediante un cambio de variable. Consideremos el cambio t = t(x) = ex , entonces la manera
de indicárselo a DERIVE for Windows es mediante la orden INT SUBST. Concretamente deberı́amos teclear
92 MATEM ÁTICAS
INT SUBST((#e^x+1)/(#e^x-4+4#e^(-x)),x,LN(x))
3
+ LN(ex − 2)
2 − ex
En general, si deseamos integrar la función f (x) mediante el cambio de variable x = g(t), debemos escribir
INT SUBST(f(x),x,g(x))
R
Calcular la integral (5x2 − 3)43x+1 dx
El programa DERIVE for Windows puede calcular la integral anterior, cuyo resultado es
10x2 2 10x 5
26x − − 2
+ .
3LN(2) LN(2) 9LN(2) 27LN(2)3
Sin embargo, las integrales de este tipo se suelen resolver por partes, ya que la función que deseamos integrar se
descompone como un producto de dos funciones, una que se deriva fácilmente (5x2 − 3) y otra que se integra
fácilmente (43x+1 ). Por este motivo, vamos a ilustrar como indicarle a DERIVE for Windows que utilice deri-
vación por partes. Una vez cargado el fichero MISC.MTH tecleamos INT PARTS(u(x),v(x),x), donde u(x) y
v(x) son las partes que se derivan e integran fácilmente, respectivamente. En nuestro ejemplo, debemos teclear
INT PARTS(5x^2-3,4^(3x+1),x).
Una de las caracterı́sticas de DERIVE for Windows es su capacidad de calcular integrales que requieren el
cómputo de otras integrales previas. Esto es lo que ocurre, por ejemplo, en la integración por reducción que se
aplica a integrales con exponentes enteros grandes. Durante el proceso se encuentra una parte integrada y una
parte sin integrar en la que aparece la misma integral inicial pero con valores de estos exponentes disminuidos.
En los ejemplos que siguen aplicamos la integral al cálculo de longitudes, áreas y volumenes.
Un cable eléctrico cuelga entre dos torres de la misma altura que están separadas 80 metros. El cable adopta la
posición de una catenaria cuya ecuación es y = 100 cosh(x/100). Calcula la longitud del cable entre las dos
torres.
Cuando tenemos una curva y = f (x), la longitud de la curva entre los puntos (a, f (a)) y (b, f (b)) es la integral
Z b p
1 + f 0 (x)2 dx.
a
En nuestro caso, la derivada es f 0 (x) = sinh(x/100) por lo que la longitud será la integral
Z 40 p
1 + sinh(x/100)2 dx,
−40
cuyo valor es 82.1506. Si cargamos la utilidad INT APPS.MTH entonces DERIVE for Windows pone a nuestra
disposición la función ARC LENGTH, con lo que podrı́amos haber calculado la longitud de la catenaria con sólo
escribir ARC LENGTH(100 COSH(x/100),x,-40,40).
C ÁLCULO INTEGRAL 93
En primer lugar debemos hallar los puntos de corte, para lo que planteamos la ecuación 2-x^2=x que resolvemos
con ayuda de la opción Solve para obtener x = −2 y x = 1. Entonces el área se calcula con la función siguiente:
AREA(x,-2,1,y,x,2-x^2) cuyo resultado es 4.5. En general, la sintaxis de la función área es
AREA(x,a,b,y,f(x),g(x)),
donde a y b son las abcisas de los puntos de corte y se supone que la función g es mayor o igual que la función f .
Calcular el área de la superficie del paraboloide z = 2 − x2 − y 2 que está sobre la región cuadrada limitada por
−1 6 x 6 1 y −1 6 y 6 1
Para el cálculo de áreas de superficies, DERIVE for Windows dispone de la función SURFACE AREA, cuya sintaxis
es la siguiente:
donde z = f (x, y) es la superficie y el recinto es el rectángulo [x1 , x2 ] × [y1 , y2 ]. En nuestro caso, basta con
escribir SURFACE AREA(2-x^2-y^2,x,-1,1,y,-1,1) para obtener como resultado el valor de 7.44625.
Dada una función z = f (x, y) definida en un recinto (rectangular o no), podemos calcular el volumen que hay
entre el recinto y la superficie z = f (x, y) definida sobre él. Para ello debemos utilizar la función VOLUME, cuya
sintaxis es
donde se supone que a1 6 x 6 a2 , b1 (x) 6 y 6 b2 (x), c1 (x, y) 6 z 6 c2 (x, y). Por tanto, el volumen de la
semiesfera es
VOLUME(x,-1,1,y,-SQRT(1-x^2),SQRT(1-x^2),z,0,SQRT(1-x^2-y^2))
cuyo resultado es 2.09439 (en precisión aproximada) o 2π/3 (en precisión exacta).
A continuación se enuncian unos ejercicios sobre cálculo integral de funciones reales de una variable. Si el alumno
encuentra alguna dificultad debe revisar detenidamente los ejemplos anteriores.
94 MATEM ÁTICAS
Z
−12
a) Calcular la integral √ dx.
x2 4 − x2
Z
sec2 t
b) Calcular la integral dx.
tan t(tan t − 1)
Z
x1/4
c) Calcular la integral dx.
1 + x1/2
Z
x4 + 2x2 + x + 1
d) Calcular la integral dx.
(x2 + 1)3
Z
1
e) Calcular la integral √ √ dx.
x(1 − cos x)
Z
x
f) Calcular la integral dx.
1 + e−2
g) Calcular el área de la región comprendida entre las gráficas de f (x) = 3x3 − x2 − 10x y g(x) = −x2 + 2x.
h) Calcular el volumen del sólido generado al girar la región limitada por f (x) = 2 − x2 y g(x) = 1 en torno
a la recta y = 1.
i) Calcular el volumen del sólido generado al girar la región acotada por las gráficas y = x2 + 1, y = 0, x = 0
y x = 1 en torno al eje y.
4.4. Bibliografı́a
C. Paulogorrón y C. Pérez. Cálculo matemático con DERIVE para PC, Ed. RA-MA, 1a Ed., 1994.
R.E. LARSON, R.P. HOSTETLER y B.H. EDWARDS Calculo y Geometrı́a Analı́tica, 5a ed., vol. 1. McGraw-
Hill, Madrid, 1995. Capı́tulos 5, 6 y 9.
J. STEWART Cálculo, 2a ed. Grupo Editorial Iberoamérica, México, 1994. Capı́tulos 4, 5, 7, y secciones 8.2 y
8.3.
6. PREGUNTAS DE EVALUACIÓN
E.3.4. Calcular el área del recinto limitado por la curva y = ex senx y por las rectas y = 0, x = 0 y x = π.
E.3.5. Un tanque está situado sobre una colina de 120 metros de altura. Lanza un proyectil que sigue una trayec-
toria dada por
y(x) = −00 05x2 + x + 120,
donde x e y se miden en metros, como muestra la siguiente figura.
y
6
120
0 - x
0
¿Cuál es la distancia recorrida por el proyectil durante su trayecto hasta impactar en el suelo?
E.3.6. Calcular la siguiente integral: Z
3x + 4
dx
x3 − 2x − 4
E.3.7. Un objeto volante sale del origen y asciende por el eje y. Al mismo tiempo un perseguidor parte del punto
(1, 0) y se dirige en todo momento hacia él con velocidad doble que la suya. La ecuación de la trayectoria
del perseguidor es
1
y = (x3/2 − 3x1/2 + 2)
3
¿Cuánta distancia ha recorrido el objeto volante en el instante de ser capturado? ¿Y cuál ha sido la distancia
recorrida por el perseguidor?
E.3.8. Resolver la integral indefinida siguiente:
Z
2x3 − 4x − 8
dx.
x4 − x3 + 4x2 − 4x
ANOTACIONES
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
CAPÍTULO 4
ECUACIONES DIFERENCIALES ORDINARIAS
Una ecuación diferencial es una ecuación en la que interviene una función incógnita y una o varias de sus deri-
vadas. Este tipo de ecuaciones aparece en el estudio de numerosos fenómenos fı́sicos y quı́micos: desintegración
radiactiva, crecimiento de poblaciones, reacciones quı́micas, problemas gravitatorios, etc. No es exagerado afir-
mar que la naturaleza se describe por medio de ecuaciones diferenciales, de modo que un conocimiento de esta
última materia nos ayudará a entender mejor los fenómenos naturales.
(1) TIPO: Si la función incógnita contiene una única variable independiente, entonces la ecuación se denomina
ecuación diferencial ordinaria, abreviadamente E.D.O. En otro caso, cuando la función incógnita contiene
dos o más variables independientes, la ecuación se dice que es una ecuación diferencial en derivadas
parciales.
(2) ORDEN: Es la derivada de orden más alto que aparece en la ecuación diferencial.
Es innecesario decir que el estudio de las ecuaciones diferenciales en derivadas parciales requiere unas técnicas
matemáticas que están fuera del alcance del alumno, por lo que nos restringiremos al análisis de las ecuaciones
diferenciales ordinarias.
F (x, y, y 0 , y 00 , . . .) = 0.
98 MATEM ÁTICAS
Diremos que una función y = f (x) es una solución de la ecuación diferencial si la ecuación se satisface al sustituir
en ella y y sus derivadas por f (x) y sus derivadas respectivas.
La solución general de una ecuación diferencial ordinaria es una función y = f (x, c1 , c2 , . . .) dependiente de
una o varias constantes tal que cualquier solución de la ecuación diferencial se obtiene dando valores especı́ficos
a una o más de las constantes. Cuando damos valores concretos a todas las constantes de la solución general,
surge una solución particular. Geométricamente, la solución general de una ecuación diferencial de primer
orden representa una familia de curvas, denominadas curvas solución, una para cada valor concreto asignado a la
constante arbitraria.
En la práctica, la determinación de las constantes que aparecen en la solución general se realiza a partir de las
condiciones iniciales del problema. Las condiciones iniciales del problema son los valores que adquiere la función
solución o sus derivadas en determinados puntos. Por ejemplo, para una ecuación diferencial de primer orden
y 0 = F (x, y),
y(x0 ) = y0 .
En consecuencia, y = f (x) es solución si f 0 (x) = F (x, f (x)) para todo valor de x en cierto intervalo, y f (x0 ) =
y0 .
y 0 = F (x, y),
donde F es una función que depende de las variables x e y. Esta clase de ecuaciones diferenciales son de las
más sencillas, y su resolución se puede realizar utilizando diversas técnicas. Describimos a continuación las más
importantes.
Una ecuación diferencial de primer orden se dice que es separable si puede escribirse en la forma
dy
M (x) + N (y) = 0,
dx
donde M (x) es una función continua que sólo depende de x y N (y) es una función continua que sólo depende
de y. Para resolver este tipo de ecuaciones se utiliza el procedimiento de separación de variables, que consiste
en situar todos los términos que contienen x a la izquierda (o la derecha) del signo de igualdad, y todos los
términos que contienen y en el lado contrario. A continuación se integran ambos miembros de la igualdad, cada
uno respecto de la variable correspondiente. En consecuencia, la solución viene dada por
Z Z
M (x)dx + N (y)dy = C.
ECUACIONES DIFERENCIALES ORDINARIAS 99
Una ecuación diferencial homogénea es cualquier ecuación diferencial que se puede escribir en la forma
donde M y N son funciones homogéneas del mismo grado. La ecuación anterior puede escribirse como
y 0 = F (x, y),
Este tipo de ecuaciones diferenciales se convierten en ecuaciones separables tras un cambio de variables. Con-
cretamente si y 0 = F (x, y) es una ecuación homogénea, entonces el cambio de variable y = vx, donde v es una
función derivable de x, transforma la ecuación anterior en una nueva ecuación diferencial en las variables x y v
que es separable.
Una ecuación diferencial lineal de primer orden es toda ecuación que se puede escribir en la forma
y 0 + P (x)y = Q(x),
La resolución de este tipo de ecuaciones se consigue utilizando la técnica de los factores integrantes. Un factor
integrante es una función u(x) tal que al multiplicarla por el lado izquierdo de la ecuación se obtiene la derivada
del producto u(x)y, es decir,
d[u(x)y]
u(x)y 0 + u(x)P (x)y = .
dx
Es fácil probar que un factor integrante es la función
R
P (x)dx
u(x) = e
Hay ecuaciones no lineales que se transforman, mediante una sustitución adecuada, en una ecuación lineal. Entre
estas ecuaciones debemos destacar la ecuación diferencial de Bernoulli, que puede escribirse como
y 0 + P (x)y = Q(x)y n .
Esta ecuación es lineal si n = 0 y de variables separables si n = 1. Para otros valores de n, el cambio de variable
z = y 1−n transforma la ecuación anterior en la siguiente ecuación lineal:
Esta sección debe estudiarse después del cálculo diferencial en varias variables, ya que se hace uso del concepto
de derivada parcial.
se dice que es una ecuación diferencial exacta si existe una función f de dos variables x e y, con derivadas
parciales continuas, tal que
∂f ∂f
(x, y) = M (x, y) y (x, y) = N (x, y).
∂x ∂y
La solución general de la ecuación es f (x, y) = C.
No toda ecuación diferencial es exacta. Entonces, ¿cómo podemos distinguir las que son de las que no lo son? El
siguiente resultado nos da la solución.
Si M y N tienen derivadas parciales continuas en un disco abierto entonces la ecuación diferencial M (x, y)dx +
N (x, y)dy = 0 es exacta si y solamente si
∂M ∂N
= .
∂y ∂x
Debemos hacer notar que la exactitud es una condición extremadamente frágil, ya que pequeñas alteraciones en
una ecuación exacta pueden hacer que se pierda dicha propiedad. Por ejemplo, la ecuación diferencial
(y 2 + 1)dx + xydy = 0
ya no es exacta.
Una ecuación diferencial lineal de segundo orden es una ecuación diferencial que puede escribirse en la forma
donde P , Q y R son funciones continuas de x en un cierto intervalo. Se dice que la ecuación es homogénea si
R(x) = 0 para todo x. En otro caso, la ecuación se dice que es no homogénea.
La resolución de las ecuaciones diferenciales de segundo orden homogéneas se apoya en dos resultados básicos:
la combinación lineal de dos soluciones es otra solución, y toda solución es combinación lineal de dos soluciones
independientes. Más concretamente, tenemos los siguientes resultados.
(1) Si y1 (x) e y2 (x) son soluciones de una ecuación diferencial homogénea y c1 y c2 son dos constantes,
entonces
y(x) = c1 y1 (x) + c2 y2 (x)
es una solución de la misma ecuación diferencial.
ECUACIONES DIFERENCIALES ORDINARIAS 101
(2) Si y1 (x) e y2 (x) son soluciones linealmente independientes (ninguna de ellas es un múltiplo de la otra) de
una ecuación diferencial homogénea de segundo orden, entonces la solución general está dada por
y(x) = c1 y1 (x) + c2 y2 (x),
donde c1 y c2 son dos constantes.
En general, encontrar las soluciones de una ecuación de segundo orden (homogénea o no homogénea) es difı́cil,
a veces imposible. Sin embargo, si las funciones P y Q son constantes, entonces siempre se pueden hallar
soluciones. En los siguientes apartados describimos cómo hacerlo.
(1) Raı́ces reales diferentes: Si r1 6= r2 son las raı́ces reales distintas de la ecuación caracterı́stica, entonces la
solución general es
y = c1 er1 x + c2 er2 x .
(2) Raı́ces reales iguales: Si r1 = r2 son las raı́ces reales iguales de la ecuación caracterı́stica, entonces la
solución general es
y = c1 er1 x + c2 xer1 x = (c1 + c2 x)er1 x .
(3) Raı́ces complejas: Si r1 = α + iβ y r2 = α − iβ son las raı́ces complejas de la ecuación caracterı́stica,
entonces la ecuación general es
y = c1 eαx cos(βx) + c2 eαx sen(βx).
El problema que se nos presenta ahora es la determinación de la solución yp (x). Describimos a continuación dos
técnicas.
102 MATEM ÁTICAS
(I) Polinómico: xn ,
entonces podemos hallar una solución particular yp (x) por el método de los coeficientes indeterminados. La clave
consiste en conjeturar que la solución yp es de una forma especial, la cual depende de la función R. Las reglas
que deben seguirse son:
(1) Si R(x) es un polinomio (tipo I), entonces se prueba con un polinomio del mismo grado.
(3) Si R(x) es trigonométrico (tipo III), entonces se prueba con A cos βx + B sen βx.
(4) Si R(x) es la suma o producto de factores anteriores, entonces se prueba con la suma o producto, respecti-
vamente, de las correspondientes soluciones particulares.
El método de los coeficientes indeterminados descrito anteriormente funciona bien si la función R(x) está formada
por polinomios, exponenciales o funciones trigonométricas (senos y cosenos). La razón hay que buscarla en que
las derivadas de este tipo de funciones no son más complicadas que las funciones originales. Esto no ocurre, por
ejemplo, con funciones como 1/x o tan x.
El método de variación de parámetros parte de la suposición que yp (x) tiene la misma forma que yh (x), excepto
que las constantes c1 y c2 se sustituyen por dos funciones u1 (x) y u2 (x). El método consiste en lo siguiente:
(2) Sustituir las constantes por funciones para formar yp (x) = u1 (x)y1 (x) + u2 (x)y2 (x).
u01 y1 + u02 y2 = 0
u01 y10 + u02 y20 = R(x)
r n + an−1 r n−1 + · · · + a1 r + a0 = 0,
Cada raı́z r de la ecuación caracterı́stica genera un término de la solución de acuerdo con las siguientes reglas:
(1) r es raı́z real: Si m es la multiplicidad de r como raı́z de la ecuación caracterı́stica, entonces r colabora a la
solución general con
y = C(x)erx ,
donde C(x) es un polinomio de grado m − 1.
En consecuencia, la solución general de la ecuación de orden n se obtiene como sigue. Sean r1 , r2 , . . . , rk , las
raı́ces reales distintas de la ecuación caracterı́stica con multiplicidades m1 , m2 , . . . , mk , respectivamente, y sean
z1 = α1 ± iβ1 , z2 = α2 ± iβ2 , . . . , z` = α` ± iβ` las raı́ces complejas distintas de la ecuación con multiplicidades
n1 , n2 , . . . , n` , respectivamente. Entonces la ecuación general de la ecuación diferencial lineal homogénea de
orden n viene dada por
X
k X̀
yh (x) = Ci (x)eri x + eαj x D1j (x) cos(βj x) + D2j (x) sen(βj x) ,
i=1 j=1
donde Ci (x) es un polinomio de grado mi − 1 para i = 1, . . . , k, y D1j (x), D2j (x) son polinomios de grado nj − 1
para j = 1, . . . , `.
Para finalizar, baste indicar que para obtener una solución particular de la ecuación diferencial de orden n no
homogénea se pueden utilizar los dos métodos descritos anteriormente para el caso de orden 2: coeficientes
indeterminados y variación de parámetros.
A.4.1. Hallar la solución general de las siguientes ecuaciones diferenciales, ası́ como la solución particular dada
por las condiciones iniciales que en cada caso se indican.
y 0 + ky = 0, k 6= 0 y(0) = 1, y 0 (0) = 0
y 0 + ky = senx y(0) = 2, y 0 (0) = 1
y + 2y 0 − 3y = 0
00
y(0) = 1, y(1) = 0
y 00 − y 0 = 0 y(0) = −3, y 0 (0) = 2
104 MATEM ÁTICAS
A.4.2. Se sabe que en un horno de cerámica, la velocidad a que se calienta un cuerpo es proporcional a 4 + T 2 ,
donde T (t) representa la temperatura del cuerpo que se calienta, medida en grados centı́grados, y t mide el
tiempo en minutos. Se√ introduce un cuerpo a temperatura inicial 2o C y se observa que al cabo de un minuto
o
su temperatura es 2 3 C. Determinar la función que nos permite expresar la temperatura del cuerpo en
función del tiempo.
A.4.3. Un grupo de biólogos ha determinado que la velocidad de aumento de una población de hormigas rojas
cabezonas es proporcional al número de individuos de dicha población. Sabiendo que al cabo de 2 meses la
población se ha duplicado, calcular cuánto tiempo tiene que transcurrir para que la población sea el triple
de la inicial.
A.4.4. Según la ley de enfriamiento de Newton, la velocidad a que se enfrı́a o calienta un cuerpo es proporcional
a la diferencia entre la temperatura del cuerpo y la temperatura del ambiente. Si un objeto se enfrı́a desde
100o C a 80o C en veinte minutos, siendo la temperatura del ambiente de 20o C, calcular el tiempo que ha de
pasar para que la temperatura del cuerpo sea de 60o C.
(1) Si la población después de 3 horas es de 104 individuos y al cabo de dos horas más es de 4 × 104
individuos, calcular cuantos individuos habı́a en un principio.
(2) Sabiendo que después de 4 horas la población se ha duplicado, ¿cuál será la población presente al cabo
de 6 horas?
A.4.6. Un barco retrasa su movimiento por la acción de la resistencia del agua, que es proporcional a la velocidad
del barco. La velocidad inicial del barco es 10 metros/segundo y al cabo de 5 segundos su velocidad es 8
metros/segundo. Calcular al cabo de cuánto tiempo su velocidad será de 1 metro/segundo.
A.4.7. El fondo de un depósito de 300 litros de capacidad está cubierto de sal. Suponiendo que la velocidad
con que se disuelve la sal es proporcional a la diferencia entre la concentración en el instante dado y la
concentración de la disolución saturada (1 kilogramo de sal para 3 litros de agua) y sabiendo que al cabo
de un minuto la cantidad de sal disuelta es 1/3 de kilogramo, hallar la cantidad de sal que contendrá la
disolución al cabo de una hora.
A.4.8. Cuando se introduce glucosa por vı́a intravenosa a velocidad constante, el cambio en la concentración
global c(t) de glucosa en sangre con respecto al tiempo viene descrito por la siguiente ecuación diferencial
dc G
= − kc,
dt 100V
ECUACIONES DIFERENCIALES ORDINARIAS 105
donde G denota la velocidad constante a que se suministra la glucosa, V es el volumen total de la sangre
en el cuerpo y k es una constante positiva que depende del paciente. Calcular la función que nos permite
expresar la concentración de glucosa en sangre en función del tiempo.
A.4.9. Una frı́a mañana comenzó a nevar y continuó nevando a velocidad constante a lo largo del dı́a. Una
máquina quitanieves comenzó a trabajar a las doce del mediodı́a, quitando nieve a velocidad constante
(volumen por unidad de tiempo). Desde la una hasta las dos avanzó solamente la mitad de lo que habı́a
avanzado desde las doce hasta la una. Calcular la hora en que empezó a nevar.
A.4.11. Según las leyes de la termodinámica, el flujo del calor a través de una superficie plana es ortogonal a las
curvas isotermas. Suponiendo que el flujo de calor describe una trayectoria dada por y = C/x, donde C es
una constante no nula, obtener las curvas isotermas.
A.4.12. La tasa de crecimiento de una población de moscas de la fruta en un instante dado es proporcional al
tamaño de la población en dicho momento. Si hay 180 moscas después del segundo dı́a del experimento y
300 moscas después del cuarto dı́a, ¿cuántas moscas habı́a originalmente?
A.4.13. El ritmo de desintegración del radio es proporcional a la cantidad presente en un instante dado. Hallar el
porcentaje de una muestra actual que quedará al cabo de 25 años si la vida media del radio es de 1600 años.
A.4.14. En una reacción quı́mica, un cierto compuesto se transforma en otra sustancia a un ritmo proporcional a
la cantidad no transformada. Si habı́a inicialmente 20gr. de la sustancia original y 16gr. tras 1 hora, ¿en qué
momento se habrá transformado el 75% de dicho compuesto?
4.1. Introducción
La práctica se va a realizar con el programa de cálculo matemático DERIVE for Windows, versión 4.05, de Soft
Warehouse. DERIVE for Windows permite realizar cálculos y manipulaciones matemáticas de carácter general,
lo cual significa que realiza muchas cosas de forma aceptable aunque no tiene la potencia de otros programas
especı́ficos. No obstante, DERIVE for Windows permite realizar todos los cálculos que un usuario medio puede
necesitar.
En esta práctica nos vamos a centrar en la resolución de ecuaciones diferenciales. DERIVE for Windows resuelve
todas las ecuaciones diferenciales de primer grado y primer orden mediante los métodos más conocidos (variables
separadas, ecuaciones diferenciales lineales, ecuaciones exactas, factores integrantes, etc.) DERIVE for Windows
proporciona, siempre que puede, la solución explı́cita de la ecuación diferencial. No obstante, es posible que
DERIVE for Windows ofrezca una solución que dependa de una integral no resoluble algebraicamente.
Antes de comenzar la práctica será conveniente que recordemos brevemente la ‘botonera’ de DERIVE for Win-
dows (ver Figura 4.1), ya que simplifica enormemente la introducción de datos y la realización de cálculos. Los
botones permiten realizar las siguientes tareas (de izquierda a derecha): New (abrir una nueva hoja de trabajo),
Open (abrir una hoja de trabajo existente), Save (guardar la sesión de trabajo), Print (imprimir la sesión de tra-
bajo), Remove (eliminar la expresión marcada), Unremove (recuperar la última expresión eliminada), Renumber
(renumerar las expresiones), Author expression (introducir una expresión sencilla), Author vector (introdu-
cir un vector), Author matrix (introducir una matriz), Simplify (simplificar), Approximate (calcular un valor
106 MATEM ÁTICAS
aproximado), Solve (resolver algebraicamente o numéricamente una expresión), Substitute for variables
(realizar una sustitución), Calculate limit (calcular un lı́mite), Calculate derivative (calcular una deriva-
da), Calculate integral (calcular una integral), Calculate sum (calcular una suma), Calculate product
(calcular un producto), 2D-plot window (realizar un gráfico bidimensional) y 3D-plot window (realizar un
gráfico tridimensional).
Figura 4.1: El uso de la ‘botonera’ de DERIVE for Windows nos puede simplificar mucho el trabajo. Otro elemento
interesante es la existencia de ‘teclas calientes’ que nos permiten evitar los menús, con lo que se gana
en rapidez.
Para poder resolver ecuaciones diferenciales de primer orden es necesario tener cargado en el ordenador la utilidad
ODE1.MTH, lo cual se consigue seleccionando las opciones File|Load|Math o File|Load|Utility. Esta utili-
dad proporciona una serie de funciones que nos permiten resolver las ecuaciones diferenciales utilizando distintos
métodos.
Resolver la ecuación y 0 = ex+y + ey y encontrar la solución que pasa por el punto (0, 1)
siendo p(x) una expresión cualquiera (no tiene por qué ser un polinomio) que no depende de y, y donde q(y) es
una expresión cualquiera que no depende de x. Entonces debemos utilizar la función de DERIVE for Windows
SEPARABLE(p,q,x,y,a,b),
donde a y b son los valores de x e y para los cuales queremos una solución particular. En nuestro caso, debemos
introducir la expresión SEPARABLE(#e^x+1,#e^y,x,y,0,1) y obtendremos como resultado e−1 − e−y = ex +
x − 1. Para obtener y en función de x debemos seleccionar las opciones Solve|Algebaically, con la opción
Variable igual a y, y obtendremos
y = 1 − ln(−ex+1 − ex + e + 1)
Observemos en primer lugar que el miembro de la izquierda coincide con la derivada de la función xy respecto
de x, por lo que parece aconsejado hacer el cambio de variable z = xy. Entonces la ecuación se transfor-
ma en la siguiente: z 0 = x−2 ln(x)z 2 , que puede resolverse por la técnica de variables separables haciendo
SEPARABLE(Ln(x)/x^2,z^2,x,z,a,b). La solución obtenida es
ln(x) ln(a) 1 1 1 1
− + − − + = 0.
x a x z a b
ECUACIONES DIFERENCIALES ORDINARIAS 107
Para obtener y en función de x debemos seleccionar las opciones Solve|Algebaically, con la opción Variable
igual a z, y obtendremos
abx
z= .
ab ln(x) − bx ln(a) + x(a − b) + ab
Como z = xy entonces la solución a nuestra ecuación es y = z/x, es decir
ab
y= .
ab ln(x) − bx ln(a) + x(a − b) + ab
Resolver la ecuación xy 0 − 4y + 2x2 + 4 = 0 y hallar la solución particular que pasa por el punto (1, 1)
La ecuación puede ponerse en la forma y 0 + p(x)y = q(x), donde p(x) y q(x) son expresiones cualesquiera que
sólo dependen de x. Entonces podemos resolver este tipo de ecuaciones mediante la orden
LINEAR1(p,q,x,y,a,b),
donde a y b son las condiciones iniciales. En nuestro caso, escribimos LINEAR1(-4/x,-2x-4/x,x,y,1,1) para
obtener como solución
y = −x4 + x2 + 1
Resolver la ecuación diferencial (x + y)dx + (y − x)dy = 0, hallando la solución que pasa por el punto (1, 1)
Este tipo de ecuación diferencial es homogénea, lo cual significa que es de la forma y 0 = r(x, y), donde r es
una función tal que r(ax, ay) = r(x, y) para todo número a. Para resolver este tipo de ecuaciones, DERIVE for
Windows dispone de la orden
HOMOGENEOUS(r,x,y,a,b),
IMP DIF(ATAN(y/x)+LN(|x|)-LN((x^2+y^2)/2)/2-pi/4-LN(x))-(x+y)/(x-y),
cuyo resultado es cero, garantizando que la solución encontrada es buena. Para utilizar la función anterior es
necesario haber cargado la utilidad DIF APPS.MTH.
Para resolver ecuaciones diferenciales de la forma y 0 = r(u), donde u es una función lineal con coeficientes
constantes de x e y (es decir, u = ax + by + c, con a, b, c constantes), DERIVE for Windows pone a nuestra
disposición el comando
Con este ejercicio vamos a ilustrar cómo resolver ecuaciones diferenciales de la forma
ax + by + c
y0 = r
px + qy + k
LIN FRAC(r,a,b,c,p,q,k,x,y,A,B)
donde (A,B) son las condiciones iniciales. En nuestro caso debemos teclear
LIN FRAC((x+y-1)/(x-y),1,1,-1,1,-1,0,x,y,0,0)
Uno de los métodos más potentes para la resolución de ecuaciones diferenciales de primer orden consiste en buscar
factores integrantes. Dada la ecuación p(x, y) + q(x, y)y 0 = 0, ésta se podrá resolver si existe una función u(x, y)
que multiplicada por la ecuación anterior la convierta en exacta. La manera de comprobar que una función u es la
candidata consiste en calcular
EXACT TEST(up,uq,x,y)
El problema en todo caso es encontrar el factor integrante. Para ayudarnos DERIVE for Windows dispone de la
siguiente función:
MONOMIAL TEST(p,q,x,y)
En nuestro caso MONOMIAL TEST(2y^3-5xy,xy^2-3x^2,x,y) proporciona como resultado x−27 y −16 . Por tan-
to la solución es
1 1
− + C = 0,
5x25 y 15 13x26 y 13
donde C es una constante apropiada.
A continuación se enuncian unos ejercicios sobre resolución de ecuaciones diferenciales. Si el alumno encuentra
alguna dificultad debe revisar detenidamente los ejemplos anteriores.
e) Resolver la ecuación y 0 (x + y ln y) = y
Para poder resolver ecuaciones diferenciales de segundo orden es necesario tener cargado en el ordenador la
utilidad ODE2.MTH, lo cual se consigue seleccionando las opciones File|Load|Math o File|Load|Utility.
Esta utilidad proporciona una serie de funciones que nos permiten resolver las ecuaciones diferenciales utilizando
distintos métodos.
La ecuación es de la forma y 00 +p(x)y 0 +q(x) = r(x), que DERIVE for Windows puede resolver en determinados
casos. El comando general que utiliza DERIVE for Windows es el siguiente
DSOLVE2(p,q,r,x,c1,c2)
DERIVE for Windows trata de encontrar la solución explı́cita general de la ecuación anterior en función de las
constantes c1 y c2. Debemos hacer notar que los dos últimos argumentos pueden omitirse o sustituirse por otros
nombres. Cuando DERIVE for Windows no puede encontrar una solución, el comando DSOLVE2 devuelve la
palabra ‘inapplicable’.
LIN2 TEST(p,q,x)
y si el resultado es una constante K, entonces podemos resolver la ecuación utilizando las siguientes funciones:
En los tres casos, se obtiene la solución general explı́cita dependiendo de dos constantes arbitrarias c1 y c2.
DSOLVE2 puede encontrar fácilmente una solución cuando p y q son constantes. Cuando q es una constante
simbólica, el resultado puede adquirir una forma complicada. La solución puede contener integrales involucrando
la función r(x). En todo caso, para comprobar que el resultado es correcto, podemos sustituirlo en la ecuación
y 00 + p(x)y 0 + q(x) − r(x) = 0.
En el caso que estamos analizando, p(x) = −3, q(x) = 2 y r(x) = ex sen x, por lo que la solución vendrá dada
por DSOLVE2(-3,2,#e^x SIN x,x).
ECUACIONES DIFERENCIALES ORDINARIAS 111
y0
Resolver la ecuación diferencial y 00 − x + 4x2 y = 4x2 sen(x2 )
En este caso, las funciones p, q y r están dadas por p(x) = −1/x, q(x) = 4x2 y r(x) = 4x2 sen(x2 ), por lo que
la solución vendrı́a dada por DSOLVE2(-1/x,4x^2,4x^2 SIN(x^2),x). Sin embargo, el programa devuelve la
palabra ‘inapplicable’, por lo que debemos resolverla de otro modo.
En primer lugar debemos ejecutar el comando LIN2 TEST(p,q,x) y si el resultado es una función dependiente
de x, entonces utilizamos la función LIN2A TEST(p,q,x). Si el resultado de este segundo test es una constante
K, podemos resolver la ecuación utilizando las siguientes funciones:
En los tres casos, se obtiene la solución general explı́cita dependiendo de dos constantes arbitrarias c1 y c2.
Para resolver las ecuaciones diferenciales de la forma y 00 = q(y), donde q(y) puede ser cualquier función de y,
DERIVE for Windows dispone de la función
AUTONOMOUS CONSERVATIVE(q,x,y,a,b,c)
donde los tres últimos argumentos son optativos. Si están presentes, entonces DERIVE for Windows determina
la solución que satisface las siguientes condiciones iniciales: x = a, y(a) = b, y 0 (a) = c. En nuestro caso, la
solución vienen dada por AUTONOMOUS CONSERVATIVE(#e^y,x,y).
Haciendo el cambio de variable v = y 0 se transforma en una ecuación de primer orden de variables separadas
(vv 0 = 1 + v 2 ) que puede resolverse utilizando la función SEPARABLE. Entonces volvemos a obtener otra ecuación
de primer orden que resolvemos utilizando el método apropiado.
Este ecuación es de tipo Liouville. En general, las ecuaciones de Liouville son de la forma
y 00 + p(x) + q(y)(y 0 )2 = 0,
112 MATEM ÁTICAS
donde p y q dependen sólo de x e y, respectivamente. DERIVE for Windows resuelve este tipo de ecuaciones
utilizando la función
LIOUVILLE(p,q,x,y,a,b).
Los dos últimos argumentos son opcionales y sirven para fijar las constantes en la solución general que se obtenga.
Si se omiten, el programa trabaja con las constantes c1 y c2. En nuestro caso p(x) = 0 y q(y) = 1/y, por lo que
la solución vienen dada por LIOUVILLE(0,1/y,x,y):
1
c2 x + y 2 − c1 = 0.
2
A continuación se enuncian unos ejercicios sobre resolución de ecuaciones diferenciales. Si el alumno encuentra
alguna dificultad debe revisar detenidamente los ejemplos anteriores.
Hay ocasiones en que no se puede obtener la solución exacta de una ecuación diferencial. En estos casos, lo
conveniente puede ser obtener una solución numérica. Para este menester, DERIVE for Windows pone a nues-
tra disposición diferentes métodos. En primer lugar debemos cargar la utilidad ODE APPR.MTH (mediante las
opciones File|Load|Math o File|Load|Util).
El método de Euler
El método de Euler es uno de los métodos más clásicos utilizados en la resolución numérica de ecuaciones dife-
renciales ordinarias de primer orden. La sintaxis general es
EULER(f,x,y,a,b,h,n)
Esta función proporciona un vector de n + 1 puntos (pares de números) solución de la ecuación y 0 = f (x, y),
con condiciones iniciales (a, b), empezando en a y con un paso h. El vector solución debe interpretarse como los
ECUACIONES DIFERENCIALES ORDINARIAS 113
puntos sobre la curva solución cuyas abcisas están separadas una distancia h. Por ejemplo, para generar 5 puntos
de una solución aproximada de la ecuación y 0 = 26/(3 + (x + y)2 ) en el intervalo [1,2] con condición inicial
(a, b) = (1, −2), deberı́amos escribir
EULER(26/(3+(x+y)^2),x,y,1,-2,0.25,4)
El resultado es:
1 −2
1.25 −0.375
1.5 1.35114
1.75 1.93520
2 2.32722
El método de Runge-Kutta
El método de Euler discutido anteriormente es el método más sencillo para resolver ecuaciones diferenciales
ordinarias, pero usualmente comete un error considerable. Sin embargo, el método clásico de Runge-Kutta es más
preciso y por tanto es preferible al método de Euler. La sintaxis general es
RK(f,v,v0,h,n)
RK utiliza el método de Runge-Kutta de orden 4 para resolver una ecuación diferencial de primer orden; también
puede utilizarse para resolver un sistema de ecuaciones diferenciales de primer orden. En la expresión anterior,
el programa calcula un vector de n + 1 puntos (pares de números) solución de la ecuación y 0 = f (v), donde
v = [x, y], con condiciones iniciales v0 = [a, b], empezando en a y con un paso h.
4.7. Bibliografı́a
C. Paulogorrón y C. Pérez. Cálculo matemático con DERIVE para PC, Ed. RA-MA, 1a Ed., 1994.
R.E. LARSON, R.P. HOSTETLER y B.H. EDWARDS Calculo y Geometrı́a Analı́tica, 5a ed., vol. 1. McGraw-
Hill, Madrid, 1995. Capı́tulo 18.
J. STEWART Cálculo, 2a ed. Grupo Editorial Iberoamérica, México, 1994. Capı́tulo 15.
6. PREGUNTAS DE EVALUACIÓN
y 00 − 6y 0 + 9y = 4e5x .
Calcular la solución particular determinada por las siguientes condiciones iniciales, y(0) = 2, y 0 (0) = 9.
y 00 − 5y 0 + 6y = 0.
Hallar la solución particular de esta ecuación determinada por las condiciones iniciales y(0) = 1, y 0 (0) = 0.
y 00 − 4y 0 + 4y = x.
Calcular la solución particular determinada por las condiciones iniciales y(0) = 1, y 0 (0) = 0.
E.4.5. Un trabajador de 30 años tiene un salario de 2.000.000 ptas anuales con un crecimiento estimado de
100.000 ptas anuales. Si realiza una inversión inicial de 100.000 ptas en un plan de pensiones que rin-
de un 8% anual, y realiza anualmente inversiones adicionales iguales al 5% de su salario, un modelo para el
capital invertido x al cabo de t años es
dx
= 00 08x + 00 05(2.000.000 + 100.000t)
dt
x(0) = 100.000
¿Cuántos años deben pasar para que acumule una inversión de 10.000.000 ptas? ¿Cuánto capital tendrá en
el plan cuando se jubile? (Se considera que 65 años es la edad de jubilación.)
y 00 − 2y 0 − 3y = e−x + 2 senx
E.4.7. Una boya cilı́ndrica, de diámetro 20cm y peso 100Kg, flota parcialmente sumergida en posición recta.
Cuando es ligeramente separada de su posición de equilibrio, la boya sube y baja según la siguiente ecuación
diferencial:
100 d2 x dx
2
= −16πx − c
g dt dt
dx
donde c es la resistencia por fricción que ofrece el agua y g es la aceleración gravitatoria.
dt
√
(1) Obtener x(t) si la constante c es igual a 15π. √
(2) Calcular c si el periodo de oscilación observado es de 54 2π.
Observación : Como valor de la constante g puede tomarse 10m/s2 .
ECUACIONES DIFERENCIALES ORDINARIAS 115
E.4.8. En un circuito eléctrico simple hay una corriente eléctrica I (en amperios), una resistencia R (en ohmios),
una inductancia L (en henrios) y una fuerza electromotriz E (en voltios), como se indica en la siguiente
figura.
E •
S
R
dI
L + RI = E.
dt
Determinar la corriente I como función del tiempo t (en segundos), siendo R y L constantes no nulas y
E(t) = sen 2t.
E.4.9. Calcular la solución general de la ecuación diferencial siguiente:
y 00 − 2y 0 − 3y = 2 sen x.
d2 y dy
(2) 2
− + 5y = 3.
dx dx
E.4.11. Una célula está suspendida dentro de una solución que contiene un soluto a una concentración constante
Cs . Se supone que la célula tiene un volumen constante V y que el área de su membrana permeable es igual
a la constante A. Por la ley de Fick (fisiólogo alemán, 1829–1901), la razón de cambio de su masa m es
directamente proporcional al área A y a la diferencia Cs − C(t), donde C(t) denota la concentración del
soluto en el interior de la célula en el instante t.
R ?
?
-
C(t)
i
1
K
Cs
ANOTACIONES
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
CAPÍTULO 5
ÁLGEBRA LINEAL Y GEOMETRÍA
• Hallar un sistema triangular que sea equivalente a • Calcular la forma Jordan de matrices de órdenes
uno dado. 2 y 3, usándola como recurso para efectuar poten-
cias n-ésimas.
• Conocer los distintos tipos de matrices y mane-
jar las distintas operaciones que se definen entre • Conocer y utilizar los conceptos de producto es-
ellas, usando correctamente sus propiedades. calar, norma y distancia en el espacio.
• Hallar el determinante de una matriz de cualquier • Identificar geométricamente el producto vectorial
orden. y el producto mixto de vectores.
• Hallar la matriz inversa de una matriz dada. • Identificar y calcular las ecuaciones de algunas
• Discutir y resolver sistemas de ecuaciones linea- secciones cónicas y superficies cuádricas.
les. • Manejar expresiones en coordenadas polares,
• Conocer y utilizar la estructura de espacio vecto- cilı́ndricas y esféricas.
rial y los conceptos de base y dimensión.
• Conocer el concepto de aplicación lineal e identi-
• Identificar cuando una matriz es diagonalizable. ficar el núcleo y la imagen de la misma.
• Calcular la matriz diagonal semejante a una ma- • Calcular la matriz asociada a una aplicación li-
triz A dada como recurso para efectuar su poten- neal y saber obtener la nueva expresión de la mis-
cia n-ésima. ma al efectuar un cambio de base.
Una ecuación lineal de n variables X1 , X2 , ..., Xn es una ecuación del tipo a1 X1 + a2 X2 + ... + an Xn = b.
Una solución de la ecuación lineal anteriormente mencionada es una n-upla de números reales (α1 , α2 , ..., αn )
tal que a1 α1 + a2 α2 + · · · + an αn = b.
Ejemplo. 3x − 2y + z = 0 es una ecuación lineal de tres variables, y (1, 1, −1) es una solución de la misma.
Nótese que la ecuación anterior tiene un número infinito de soluciones. 2
118 MATEM ÁTICAS
A un conjunto de varias ecuaciones lineales se le denomina sistema de ecuaciones lineales. Es decir un sistema
de m ecuaciones lineales y n variables o incógnitas, es una expresión del tipo
a11 X1 + a12 X2 + ... + a1n Xn = b1
a21 X1 + a22 X2 + ... + a2n Xn = b2
............................................ ...
am1 X1 + am2 X2 + ... + amn Xn = bm
Una solución de este sistema es una n-upla de números reales (α1 , α2 , ..., αn ) que sea a su vez solución de las m
ecuaciones de las que se compone el sistema.
Dos sistemas de ecuaciones lineales se dice que son equivalentes cuando tienen las mismas soluciones.
Los métodos de resolución de sistemas de ecuaciones lineales se basan en la idea de transformar el sistema original
del cual queremos encontrar sus soluciones, en otro equivalente que tenga una estructura más sencilla.
Después de lo dicho conviene aclarar qué entendemos por “estructura sencilla” y cuáles van a ser las operaciones
que van a ser válidas para transformar el sistema original en otro equivalente.
Ejemplos de sistemas sencillos de resolver, en el caso de igual número de ecuaciones que de incógnitas, son los
llamados triangulares.
Un sistema triangular de tres ecuaciones con tres incógnitas vendrı́a expresado de una manera genérica por:
a11 x + a12 y + a13 z = b1
a22 y + a23 z = b2
a33 z = b3
Intenta responder ahora a las siguientes preguntas: ¿Cómo serı́a un sistema triangular de cuatro ecuaciones y
cuatro incógnitas? ¿Sabrı́as definir el mismo concepto para un sistema de n ecuaciones y n incógnitas?
En este tipo de sistemas con n ecuaciones y n incógnitas (si ann 6= 0) se obtiene fácilmente una solución única,
despejando y sustituyendo sucesivamente de la última ecuación a la primera.
Parece claro que nuestro interés principal lo centraremos en realizar operaciones en las ecuaciones que forman el
sistema original del que queremos conocer sus soluciones, hasta transformarlo en otro que sea lo más parecido
posible a un sistema triangular. Debemos por tanto hacer referencia a las reglas u operaciones que consideramos
válidas, es decir, que transforman un sistema en otro equivalente:
(3) Sumar o restar a una ecuación el resultado de multiplicar (o dividir) otra por un número.
(4) Expresar una ecuación despejando una variable, y sustituir el resultado en las demás.
Obviamente no todos los sistemas que vamos a intentar resolver tienen el mismo número de ecuaciones y de
incógnitas. ¿Cómo procederı́amos con un sistema de este estilo?
x + 3y − z + t = 1
(Intercambiamos la 2a ec. y la 3a ec) =⇒ y−t = 0
7y + 2t = 9
x + 3y − z + t = 1
=⇒ (3 ec. − 2 ec. × 7) =⇒
a a
y−t = 0
9t = 9
1 x + 3y − z + t = 1
=⇒ (3a ec. × ) =⇒ y−t = 0
9
t = 1
x−z = −3
=⇒ (1a ec. − 2a ec. × 3) =⇒ y−t = 0
t = 1
de donde el conjunto de soluciones vendrı́a dado por
S = {(−3 + λ, 1, λ, 1) : λ ∈ R}
(1) En las operaciones que realizamos con los sistemas en realidad nos bastarı́a con hacer referencia sólo a los
coeficientes, obviando ası́ la repetición de las incógnitas. Si eliminamos estos sı́mbolos el sistema anterior
se escribirı́a como
1 3 −1 1 1
−2 1 2 0 7
0 1 0 −1 0
Esta ordenación de los coeficientes recibirá el nombre de matriz ampliada. La matriz
1 3 −1 1
−2 1 2 0
0 1 0 −1
(ver Ejemplo 1), al intentar resolverlo y por lo tanto transformarlo en uno equivalente que sea triangular,
llegaremos a un sistema representado por una matriz del tipo
0 0
a11 a12 a13 b1
0 0
0 0 0
0 a22 a23 b2
0 0
0 0 a33 b3
0
que tendrá solución única si y sólo si a33 6= 0.
ÁLGEBRA LINEAL Y GEOMETR ÍA 121
(3) En el caso representado en el Ejemplo 2, observemos que la matriz ampliada resultado de efectuar las
sucesivas transformaciones a las que hemos sometido el sistema original es
1 0 −1 0 −3
0 1 0 0 1
0 0 0 1 1
¿Qué tiene de común esta matriz con la correspondiente a un sistema triangular? Resaltamos a continuación
una caracterı́stica que podemos considerar común a las dos:
Ambas son matrices escalonadas, en el sentido de que puede trazarse una “escalera descendente”, por
debajo de cuál todos los elementos serán ceros.
Método de Gauss. El método de Gauss para la resolución de sistemas de ecuaciones lineales consiste en realizar
transformaciones en la matriz del sistema de partida hasta conseguir una matriz “escalonada”, de las caracterı́sticas
descritas anteriormente.
Como es lógico, no todos los sistemas son compatibles (determinados o indeterminados), y algunas veces nos
encontraremos con sistemas que no tengan solución. ¿Cómo los podremos identificar?
es equivalente a
1 2 −3 1
0 −5 7 −4
0 0 −27 14
0 0 0 −30
(Intenta dar los pasos pertinentes para lograr llegar a esta última expresión de un sistema equivalente). Observa
que como la última ecuación no tiene solución el sistema no tiene solución.
Observación. En general, cuando al efectuar operaciones en la matriz de un sistema, conseguimos una matriz en
la que todos los elementos de una fila son ceros menos el coeficiente que corresponde el término independiente de
la ecuación, el sistema será incompatible.
Resumimos a continuación las situaciones genéricas con las que nos encontramos al aplicar el método de elimi-
nación de Gauss.
(2) El número de ecuaciones resultantes no eliminadas y de incógnitas coincide. Entonces el sistema de partida
es compatible y determinado y la matriz ampliada se podrá transformar en una de la forma:
∗ ∗ .... ∗ ∗
0 ∗ .... ∗ ∗
... ... .... ... ...
0 0 .... ∗ ∗
(3) El número de ecuaciones resultantes no eliminadas es menor que el número de incógnitas del sistema.
Entonces el sistema es compatible e indeterminado. La matriz ampliada se podrá transformar en una de la
forma:
∗ ∗ ... ... ... ... ∗ ∗
0 ∗ ∗ ... ... ... ∗ ∗
... ... ... ... ... ... ... ...
0 0 ... ∗ ∗ ... ∗ ∗
En un sistema de ecuaciones lineales genérico cuando los términos independientes son todos nulos, lo denomina-
remos homogéneo.
a11 X1 + a12 X2 + ... + a1n Xn = 0
a X + a X + ... + a X = 0
21 1 22 2 2n n
............................................. ...
am1 X1 + am2 X2 + ... + amn Xn = 0
Piensa y demuestra que se cumplen las siguientes propiedades:
(1) Un sistema homogéneo es siempre compatible, ya que la solución trivial (0, 0, ..., 0) satisface todas y cada
una de las ecuaciones del sistema.
(2) Si (α1 , α2 , ..., αn ) es solución de un sistema homogéneo, también lo es (λα1 , λα2 , ..., λαn ) con λ ∈ R. Lo
que en general demuestra que si un sistema homogéneo tiene una solución distinta de la trivial, entonces
tiene infinitas soluciones.
Otro de los aspectos destacables dentro de la resolución de sistemas de ecuaciones lineales es el que habitualmente
se denomina como “discusión del sistema”. Entenderemos por esto decidir para qué valores de uno o varios
parámetros se tienen infinitas soluciones, solución única o ninguna solución.
1
(1) 5m − 1 = 0 ⇐⇒ m = 5 y la última ecuación se transforma en un absurso. Sistema incompatible.
ÁLGEBRA LINEAL Y GEOMETR ÍA 123
(2) 5m − 1 6= 1
5 ⇐⇒ m 6= 1
5 . Sistema compatible y determinado. 2
Ejemplo. Discute según los valores de m:
x + y + mz = 1
x + my + z = 1
mx + y + z = 1
¿Qué sucede si m 6= 1 y m 6= −2? ¿Y si m = −2? ¿Y cuando m = 1? (Es interesante que razones conveniente-
mente las respuestas a todas estas preguntas). 2
Un conjunto de m × n números reales colocados de forma rectangular en m filas y n columnas recibe el nombre
de matriz real de dimensión m × n.
Al conjunto de todas las matrices con coeficientes reales, con m filas y n columnas (dimensión m × n) lo denota-
remos por Mm×n (R). En general abusaremos del lenguaje y cuando hablemos de “matrices” entenderemos que
sus coeficientes son números reales.
A las matrices que sólo tienen una fila se les llama matrices fila. Análogamente a las que tienen sólo una columna
se les denomina matrices columna.
Dada una matriz A, se denomina traspuesta de A, denotándose t A, a la matriz que se obtiene cambiando en A
las filas por columnas.
Las matrices en las que coincide el número de filas con el de columnas se denominan matrices cuadradas.
Para una matriz cuadrada de dimensión n × n se suele decir que es de orden n. El conjunto de elementos
(a11 , a22 , ...., ann ) se denomina diagonal principal.
Una matriz cuadrada A se dice que es simétrica cuando aij = aji para todo i = 1, . . . , m y j = 1, . . . , n.
0 0
O= es un ejemplo de matriz nula de orden 2.
0 0
Matriz diagonal: Cualquier matriz cuadrada en la que los elementos que no están ubicados en la diagonal prin-
cipal son ceros.
7 0 0
D = 0 −2 0 es un ejemplo de matriz diagonal de orden 3.
0 0 −3
Matriz unidad o identidad: Se denomina ası́ a cualquier matriz diagonal en la que todos los elementos pertene-
cientes a la diagonal principal son iguales a 1. La matriz diagonal de orden n será denotada por In .
1 0 0
I3 = 0 1 0 es un ejemplo de matriz identidad de orden 3.
0 0 1
Matriz triangular: Se denomina de esta manera a toda matriz cuadrada en la que los elementos que están por
encima o por debajo de la diagonal principal son iguales a cero. Se dice triangular superior cuando los
elementos nulos están por debajo o triangular inferior si están por encima.
1 2 3
A = 0 4 −5 es un ejemplo de matriz triangular superior de orden tres.
0 0 6
Sean A, B ∈ Mm×n (R) , es decir, A = (aij )i=1...m y B = (bij )i=1...m . Definimos la matriz suma C = A + B,
j=1...n j=1...n
como C = (cij )i=1...m donde cij = aij + bij , para todo i = 1...m y j = 1...n.
j=1...n
(4) La matriz −A que denominaremos matriz opuesta y que se obtiene cambiando de signo todos los elementos
de A, cumple la siguiente propiedad: A + (−A) = O.
a11 a12 .... a1n λa11 λa12 .... λa1n
a21 a22 .... a2n λa21 λa22 .... λa2n
λ
....
=
..... .... .... .... ..... .... ....
am1 am2 .... amn λam1 λam2 .... λamn
3 2 12 8
Por ejemplo, 4 5 6 = 20 24 .
7 8 28 32
Todas estas propiedades, ası́ como las vistas anteriormente para la suma de matrices, se pueden resumir diciendo
que (Mm×n , +, .) es un espacio vectorial sobre R (cuerpo de los números reales).
Sean A, B ∈ Mm×n (R) , A = (aij )i=1...m y B = (bij )i=1...n . Definimos el producto AB como la nueva matriz
j=1...n j=1...p
C = (cij )i=1...m , tal que cij = ai1 b1j + ai2 b2j + ai3 b3j + ... + ain bnj o en expresión más reducida
j=1...p
X
n
cij = aik bkj .
k=1
Obsérvese que para que esté bien definido el producto de matrices, el número de columnas de la primera matriz
debe coincidir con el número de filas de la segunda.
Ejemplo. En el siguiente producto de matrices, el punto . denota la multiplicación en los números reales.
1 2 5 6 1.5 + 2.7 1.6 + 2.8 19 22
= =
3 4 7 8 3.5 + 4.7 3.6 + 4.8 43 30
2
(3) Si A ∈ Mm×n (R), AIn = A (donde In representa la matriz identidad de orden n) y también Im A = A.
(4) A(B + C) = AB + AC.
De todo lo anterior se deduce que Mn (R) (conjunto de matrices cuadradas de orden n, con coeficientes reales)
dotado de las operaciones suma y producto de matrices tiene estructura de anillo (no conmutativo) con elemento
unidad.
Consideremos el anillo (Mn (R), +, .) anteriormente mencionado. Dada la matriz A ∈ Mn (R) no siempre existe
otra matriz B ∈ Mn (R) tal que AB = BA = In (intenta encontrar algunos ejemplos de matrices que ilustren
esta afirmación).
En los casos en los que existe B se dice que es la matriz inversa de A y la denotaremos por A−1 .
Una matriz cuadrada A ∈ Mn (R) que posea inversa se dice que es invertible o también regular. Si no la tiene se
denomina matriz singular.
Vamos a empezar definiendo el concepto de determinante de una matriz cuadrada de orden n, A = (aij ). Para
introducir este concepto hacen falta algunas definiciones preliminares.
Dado el conjunto {1, 2, 3, ..., n}, cualquier n-upla ordenada formada por los n elementos de este conjunto diremos
que es una permutación. Denotaremos por Pn el conjunto de todas las permutaciones de {1, 2, 3, ..., n}.
Diremos que una permutación σ ∈ Pn tiene una inversión (o trasposición), cuando el orden que presentan dos
números es el contrario al que tienen los números naturales.
Ejemplo. Dado {1, 2, 3} , (1, 3, 2) es una permutación que pertenece a P3 . El número de permutaciones de P3
es 3! = 6. Son las formadas por (1, 2, 3), (2, 3, 1), (3, 1, 2), (3, 2, 1), (2, 1, 3) y (1, 3, 2). La permutación (1, 3, 2)
tiene una inversión (3 antes que 2) y (3, 2, 1) tiene 3 inversiones (3 antes que 2, 3 antes que 1 y 2 antes que 1). 2
Sea σ ∈ Pn , definimos el signo de σ como s(σ) = (−1)i(σ) , donde por i(σ) indicamos el número de inversiones
que tiene la permutación σ.
Antes de introducir la definición general de determinante, lo haremos primero para una matriz de orden 3. Consi-
deremos la matriz
a11 a12 a13
A = a21 a22 a23
a31 a32 a33
y formemos todos los posibles productos de tres elementos de dicha matriz con las siguientes restricciones:
(1) En cada producto sólo puede aparecer un elemento de cada fila y uno de cada columna.
(2) Dotaremos de un signo a cada producto que coincidirá con el signo de la permutación de P3 formada por
los segundos subı́ndices de los elementos.
Llamaremos determinante de A y lo notaremos por det(A) o por |A|, a la suma de todos estos productos. Es decir,
|A| = a11 a22 a33 + a12 a23 a31 + a13 a21 a32 − a13 a22 a31 − a12 a21 a33 − a11 a23 a32 .
Siguiendo esta misma técnica de definición podemos llegar a definir el concepto de determinante para una matriz
genérica de orden n, A = (aij ).
donde por (σ(1), σ(2), ..., σ(n)) indicamos los subı́ndices que representa la permutación σ.
Observación. En un determinante de orden n aparecen n! sumandos. Como vemos el número de sumandos crece
rápidamente en relación con el orden del determinante. No es por tanto demasiado operativo como método de
128 MATEM ÁTICAS
cálculo la definición de determinante que hemos introducido con anterioridad. Procede por tanto que introduzca-
mos un método más práctico que nos facilite el trabajo en el cálculo de determinantes.
Dada la matriz A = (aij ), llamaremos menor complementario del elemento aij al determinante de la matriz que
resulta de suprimir en A la fila i y la columna j. Lo denotaremos por Mij .
y el del 1 corresponde a
2 2 3
M11
= 0 −6 4 = 24.
0 0 −2
2.3.1. Cálculo del determinante por el desarrollo de los elementos de una fila o columna
Se puede demostrar sin demasiada dificultad (ver bibliografı́a recomendada) que dada una matriz genérica de
orden n, A = (aij ), el determinante viene dado por
A esta expresión se llama desarrollo del determinante de la matriz A por los elementos de la primera columna,
puesto que son (a11 , a21 , ..., an1 ) los elementos que forman la primera columna de la matriz A.
Esta importante propiedad se puede hacer más genérica y la expresión anterior será también válida eligiendo para
el desarrollo los elementos de cualquier fila o columna del determinante.
Por ejemplo para la fila i-ésima (ai1 , ai2 , ..., ain ) obtendrı́amos det(A) = ai1 Ai1 + ai2 Ai2 + ... + ain Ain y para
la columna j-ésima (a1j , a2j , ..., anj ) se tiene det(A) = a1j A1j + a2j A2j + ... + anj Anj .
La gran ventaja que presentan estas expresiones es que podemos reducir el cálculo de un determinante de orden n
al cálculo de otros (los adjuntos) que tienen el orden disminuido en una unidad (una fila y una columna menos).
Aplicando sucesivamente este criterio, podremos acabar reduciendo cualquier determinante a cálculos de deter-
minantes de orden 2.
Ejemplo. Desarrollando por los elementos de una lı́nea (fila o columna) vamos a calcular el valor del siguiente
determinante
1 −3 2 6
3 2 1 0
∆ =
2 1 −4 5
0 0 −4 0
ÁLGEBRA LINEAL Y GEOMETR ÍA 129
La primera cuestión que nos surge es la fila o columna que más nos conviene escoger para el posterior desarrollo.
Parece claro para este ejemplo que es la cuarta fila y en general debemos escoger aquella que tenga el mayor
número de elementos iguales a cero. Ası́
1 −3 6
Desarrollando por la −3 6 1 6
∆ = −(−4) 3 2 0 = = 4(−3 + 2 ) = 388.
2 2a fila 1 5 2 5
1 5
2
Para poder expresar mejor las siguientes propiedades usaremos la notación det(A) = det(C1 , C2 , ..., Cn ), donde
Ci indica la columna i-ésima de la matriz A.
(1) Si una columna se multiplica por un escalar λ el valor del determinante queda multiplicado por λ:
(4) det(0n ) = 0 (donde 0n es la matriz de orden n con todos sus elementos iguales a 0), det(In ) = 1.
(5) Si se intercambian dos columnas el determinante cambia de signo:
(6) Si a una columna se le suma una combinación lineal de las demás, el determinante no varı́a:
(7) Si en una matriz cambiamos filas por columnas el valor del determinante no varı́a:
det(A) = det(t A)
(8) Si A y B son matrices cuadradas del mismo orden n, det(AB) = det(A) det(B).
Observación. La propiedad (7) demuestra que en todas las propiedades anteriormente enunciadas podemos cam-
biar las referencias a columnas por filas, verificándose igualmente el enunciado resultante.
De las propiedades de los determinantes y del desarrollo de los mismos por los elementos de una fila o columna,
podemos deducir que es posible mediante operaciones elementales entre las filas o columnas (según las propieda-
des anteriormente descritas) conseguir poner ceros en el mayor número de elementos de la fila o columna por la
que vayamos a desarrollar, con la finalidad de simplificar considerablemente los cálculos.
a a a a
Restamos la 1 columna a la 2 y a la 4 y también podemos restar a la 3 columna, la 1a columna multiplicada
por 2, para obtener finalmente
1 0 0 0
2 1 0 3
∆ = .
6 1 −4 3
1 3 3 6
Observa que de la cuarta columna podemos sacar factor común 3. Ası́ tendremos
1 0 0 0
2 1 0 1
∆ = 3 .
6 1 −4 1
1 3 3 2
Desarrollando por los elementos de la primera fila obtenemos
1 0 1
∆ = 3 1 −4 1 .
3 3 2
Ahora podemos restar la 1a columna a la tercera, para obtener finalmente
1 0 0
∆ = 3 1 −4 0
3 3 −1
y desarrollando por la primera fila se tiene
−4 0
∆ = 3 = 12.
3 −1
2
Una matriz cuadrada A = (aij ) tiene inversa si y sólo si det(A) 6= 0, verificándose la siguiente igualdad
1
A−1 = Adj(A).
det(A)
Ejemplo. Como ejemplo de que se cumple la expresión anterior, puedes comprobar que
2
3 − 16 − 12 1 3 −2
A−1 = 7 3
1
− 3 donde A = −5 0
6 2 1 .
10 1
3 6 − 52 1 4 −3
2
ÁLGEBRA LINEAL Y GEOMETR ÍA 131
Según los conceptos y las operaciones introducidas con anterioridad, lo podrı́amos expresar de la siguiente forma:
a11 a12 .... a1n X1 b1
a21 a22 .... a2n X2 b2
=
.... ..... .... .... ... ...
am1 am2 .... amn Xn bn
Esta última expresión recibe el nombre de forma matricial del sistema de ecuaciones lineales.
Cuando el sistema está formado por n ecuaciones y n incógnitas y el determinante de la matriz de los coeficientes
del sistema es distinto de cero, entonces se asegura la existencia de matriz inversa y podemos obtener las soluciones
despejando la matriz columna t (X1 X2 . . . Xn ) de la siguiente forma:
−1
X1 a11 a12 .... a1n b1
X2 a21 a22 .... a2n b2
... = .... ..... .... .... ...
Xn an1 an2 .... ann bn
Esta expresión es lo que básicamente se conoce como regla de Cramer, y los sistemas con el mismo número de
ecuaciones que de incógnitas que cumplen la condición
a11 a12 .... a1n
a21 a22 .... a2n
.... ..... .... .... 6= 0
a .... ann
n1 an2
se denominan sistemas de Cramer. La regla de Cramer estamos acostumbrados a verla de otra forma, que resulta
de efectuar las operaciones matriciales correspondientes. Si llamamos
a11 a12 .... a1n
a21 a22 .... a2n
∆=
.... ..... .... ....
a .... ann
n1 an2
a11 a12 .... b1
a21 a22 .... b2
.... ..... .... ....
an1 an2 .... bn
Xn =
∆
Observación. Para obtener el valor correspondiente a la incógnita Xi , efectuamos el cociente entre el determinante
de la matriz resultado de sustituir en la matriz de los coeficientes del sistema la columna i-ésima por la columna
de los términos independientes, y el determinante ∆ de la matriz de los coeficientes.
Ejemplos.
(1) El sistema
3x + 2y − z = 1
2x − y + z = −1
x − 2y + z = 2
es un sistema de Cramer, puesto que la matriz de los coeficientes
3 2 −1
A = 2 −1 1
1 −2 1
(3) La regla de Cramer también se puede usar para resolver sistemas de ecuaciones que tengan infinitas soluciones.
Consideremos el siguiente sistema:
3x + 2y − 5z + 6t = 4
2x + y + 3z − t = 2
x − 3y + 2z + 5t = 0
si pasamos los términos en los que aparece la incógnita t al otro lado del signo igual obtendremos:
3x + 2y − 5z = 4 − 6t
2x + y + 3z = 2+t
x − 3y + 2z = −5t
Considerando como incógnitas sólo a x, y, z para cada valor de t obtendrı́amos un sistema de Cramer, puesto que
3 2 −5
∆ = 2 1 3 =
6 0
1 −3 2
ÁLGEBRA LINEAL Y GEOMETR ÍA 133
(Comprueba que es cierto lo que afirmamos). Finalmente obtendrı́amos aplicando la regla de Cramer
4 − 6t 2 −5 3 4 − 6t −5
2+t 1 3 2 2+t 3
−5t −3 2 5 1 −5t 2 3 56
x= = 1 − t, y= = + t,
∆ 3 ∆ 11 33
3 2 4 − 6t
2 1 2 + t
1 −3 −5t 1 29
z= = − + t.
∆ 11 33
Es decir, el conjunto de soluciones viene expresado por
5 3 56 1 29
S = (1 − λ, + λ, − + λ) : λ ∈ R .
3 11 33 11 33
Se han estudiado en los epı́grafes anteriores algunos conjuntos que con las operaciones definidas sobre ellos, en
virtud de las propiedades de las mismas, decı́amos que tienen estructura de espacio vectorial. Recordemos por
ejemplo el conjunto Mm×n (R) que tiene estructura de espacio vectorial sobre R con las operaciones “+” (suma
de matrices) y “.” (producto de un escalar por una matriz). Son numerosos e importantes los ejemplos en álgebra
en los que se puede observar esta estructura (ver bibliografı́a).
Todo lo expresado anteriormente se puede generalizar para un conjunto V , a cuyos elementos le llamaremos
genéricamente vectores, denotándolos por −
→
u ,−
→
v ,−
→
w , .... y con un cuerpo (ver definición en bibliografı́a) genérico
de escalares que denotaremos por K , y a sus elementos con letras griegas λ, µ, ...
(1) −
→
u +−→v =−→
v +−
→u.
(2) −
→
u + (−
→v +−
→
w) = −
→
u + (−
→
v +−
→
w ).
−→ −→ → −
(3) Existe un elemento de V que denotaremos por 0 (elemento neutro) tal que 0 + −
u =→
u.
−→ −→ −→ −
→ −
→
(4) Para todo vector u existe − u ∈ V (elemento opuesto) tal que u + (− u ) = 0 .
(5) 1.−
→
u =− →
u (1 es el elemento unidad de K).
(6) λ(µ−→
u ) = (λµ)−
→u.
(7) (λ + µ) u = λ u + µ−
−→ −
→ →
u.
(8) λ(−
→
u +−
→
v ) = λ−
→
u + λ−
→
v.
Habitualmente en el caso en que el cuerpo sea el conjunto de los números reales, diremos que V es un espacio
vectorial real.
Dos importantes conceptos relativos a vectores, las combinaciones lineales y la dependencia lineal, están estre-
chamente relacionadas con los sistemas de ecuaciones lineales.
Dado un espacio vectorial V sobre un cuerpo K decimos que un subconjunto S ⊂ V es un subespacio vectorial,
cuando tiene estructura de espacio vectorial con las operaciones que están definidas en V . Se puede demostrar
que S ⊂ V es un subespacio vectorial si y sólo si para cualquier par de vectores −
→
u ,−
→
v ∈ S y escalares λ, µ ∈ K
−
→ −
→
se tiene λ u + µ v ∈ S.
2.4.3. Subespacio engendrado por un conjunto de vectores. Sistema de generadores. Bases y dimensión de
un espacio vectorial
Sea G = {− v→ −
→ −
→
1 , v2 , ..., vn } una colección de vectores de un espacio vectorial V sobre un cuerpo K . Llamaremos
subespacio engendrado por G y lo denotaremos por L(G) al conjunto de todas las combinaciones lineales de
vectores de G. Es decir, L(G) = { λ1 − v→ −
→ −
→
1 + λ2 v 2 + · · · + λn vn | λ1 , λ2 , ..., λn ∈ K }
ÁLGEBRA LINEAL Y GEOMETR ÍA 135
Observación. Son especialmente importantes los casos de los espacios vectoriales formados por los vectores
libres del plano R2 y del espacio R3 , por la interpretación gráfica que los conceptos introducidos anteriormente
sugieren. Conceptos que seguro te son familiares, pero es fundamental que los recuerdes ahora, consultando si es
necesario la bibliografı́a recomendada.
En ocasiones es posible eliminar un vector de un sistema generador sin que el subespacio generado se altere. Pero
el vector que eliminemos no puede ser uno cualquiera, sino alguno que se pueda expresar como combinación lineal
de los restantes. La idea de quedarnos con el menor número de generadores posible de todo el espacio vectorial
es la que nos lleva a introducir el concepto de base.
En el espacio vectorial Rn existe una base que distinguimos de las demás y que llamaremos base canónica,
formada por los vectores
−e→ = (1, 0, 0, ..., 0)
1
−e→ = (0, 1, 0, ..., 0)
2
... .....................
−
e→ = (0, 0, ..., 0, 1)
n
Puedes comprobar que efectivamente se trata de un sistema de vectores linealmente independientes y generadores.
Observaciones.
• Después de lo visto anteriormente queda demostrado que la dimensión del espacio vectorial Rn es n.
• Observa que en Rn (en general en cualquier espacio vectorial de dimensión n) n vectores lineamente inde-
pendientes forman una base. Análogamente sucede con n vectores generadores. Nunca puede haber más de n
vectores linealmente independientes ni menos de n vectores generadores.
• Aunque la dimensión de Rn está clara, es muy importante para nosotros establecer algún método que nos pueda
dar la dimensión de los subespacios generados por vectores de Rn . Supongamos que tenemos el siguiente sistema
de vectores de R4 :
→ = (1, 0, 2, 3), −
−
u → = (2, 1, 4, 0), −
u → = (3, 1, −1, 2), −
u → = (−1, 1, −16, −11)
u
1 2 3 4
−
→
u 1 1 0 2 3
−
→ −
→ −→
−6
0
u 2 = u 2 − 2 u1 0 1 0 =⇒
−
→ −
→ −→ =
−7
0
u3 = u3 − 3 u 1 0 1 −7
−
→ 0
−
→ −
→
u4 = u4 + u 1 0 1 −16 −8
136 MATEM ÁTICAS
−
→
u 1 0 2 3
1
−
→ 0 0 1 0 −6
u2
−
→0 =
u
3 0 0 −7 1
−
→0 − 2−
u →0
u 0 0 0 0
4 3
Consideremos la matriz A = (aij ) ∈ Mm×n (R); en ella podemos distinguir m vectores filas pertenecientes a
Rn y n vectores columna pertenecientes a Rm . Denotemos por Fi , i = 1, 2, ...., m a los vectores fila y por Cj ,
j = 1, 2, ..., n los vectores columna. Enunciamos a continuación un resultado fundamental que hace posible la
definición del concepto de rango de la matriz A.
Dada la matriz A anteriormente introducida, se tiene que dim L(F1 , F2 , ..., Fm ) = dim L(C1 , C2 , ..., Cn ) y a este
número se le denomina rango de la matriz A, denotándose por r(A).
Es importante que recuerdes el siguiente método práctico para calcular el rango de una matriz, llamado a veces
método de los orlados. Dada la matriz A = (aij ) ∈ Mm×n (R), consideramos en ella un menor Mk de orden k.
Llamaremos orlado de Mk con la columna i y la fila j al determinante obtenido añadiendo a Mk los elementos
de la fila j que corresponden en la matriz A a las columnas de Mk y añadiendo también a su vez los elementos
de la columna i que corresponden a las filas de Mk y el elemento aji , conservando siempre el orden original que
tienen todos los elementos mencionados en la matriz A. Por ejemplo, para la matriz
1 2 −1 1
A = 2 −1 1 −2
0 5 −3 4
• Se calculan los orlados de M1 hasta que obtengamos uno que sea distinto de cero. (Si todos los orlados
valen cero se tiene que r(A) = 1).
• A partir de este momento sabemos que r(A) > 2. Procedemos como antes orlando este menor de orden 2
hasta que obtengamos uno que sea distinto de cero (Si todos los orlados valen cero se tiene r(A) = 2).
• A partir de este momento sabemos que r(A) > 3. Procedemos como antes orlando este menor de orden 3
hasta que obtengamos uno que sea distinto de cero (Si todos los orlados valen cero se tiene r(A) = 3).
También es conveniente que repases las justificaciones teóricas de este método, pudiéndolas encontrar en cualquier
libro de matemáticas generales (ver bibliografı́a recomendada).
a11 X1 + a12 X2 + ... + a1n Xn = b1
a21 X1 + a22 X2 + ... + a2n Xn = b2
.............................................. ...
am1 X1 + am2 X2 + ... + amn Xn = bm
La condición necesaria y suficiente para que tenga soluciones (sea compatible) es que el rango de la matriz de los
coeficientes A coincida con el rango de la matriz ampliada A∗ .
Una de las principales aplicaciones de este teorema es la discusión de un sistema de ecuaciones lineales en función
de uno o varios parámetros. Por ejemplo, consideremos el siguiente sistema de ecuaciones lineales y discutamos
según los valores de m.
(m + 2)x + y + z = m−1
mx + (m − 1)y + z = m − 1
(m + 1)x + (m + 1)z = m − 1
Denotamos por M la matriz de los coeficientes del sistema y por M ∗ la matriz ampliada, es decir:
m+2 1 1 m+2 1 1 m−1
M = m m−1 1 y M∗ = m m−1 1 m−1
m+1 0 m+1 m+1 0 m+1 m−1
El sistema es compatible ⇐⇒ r(M ) = r(M ∗ ). Además det(M ) = m(m + 1)(m − 1) obteniéndose lo siguiente:
Consideremos la matriz
a11 a12 ... a1n
a21 a22 ... a2n
A=
.....
,
..... ... .....
an1 an2 ... ann
entonces la matriz
t − a11 −a12 ... −a1n
−a21 t − a22 ... −a2n
tIn − A =
.....
..... ... .....
−an1 −an2 ... t − ann
se denomina matriz caracterı́stica de A. Su determinante
∆A (t) = det(tIn − A)
Se tiene que
∆A (t) = tn − (a11 + a22 + ... + ann )tn−1 + pn−2 tn−2 + · · · + p1 t + (−1)n det(A).
Para la matriz genérica A = (aij ) un escalar λ se denomina valor propio, si existe un vector (columna) no nulo −
→
v
−
→ −→
para el que A v = λ v . Todo vector que satisfaga ésta relación se denomina vector propio de A perteneciente al
ÁLGEBRA LINEAL Y GEOMETR ÍA 139
Llamaremos multiplicidad algebraica del valor propio λ a la multiplicidad de λ como raı́z del polinomio carac-
terı́stico y denominaremos multiplicidad geométrica de λ a la dimensión de Eλ .
Propiedad. La multiplicidad geométrica de un valor propio es siempre menor o igual que la multiplicidad alge-
braica.
Diremos que una matriz A es diagonalizable si existe una matriz no singular P tal que D = P −1 AP , siendo D
una matriz diagonal.
Propiedad. Una matriz de orden n es diagonalizable si y sólo si tiene n vectores propios linealmente indepen-
dientes y en ese caso los elementos diagonales de D son los valores propios correspondientes, teniéndose además
que D = P −1 AP , donde P es la matriz cuyas columnas son los vectores propios. En particular esto se cumple
cuando tiene n valores propios diferentes.
t3 − 11t2 + 39t − 45 = 0
son λ1 = 3 y λ2 = 5. Para cada valor propio calculamos las ecuaciones del subespacio propio como sigue:
1 1 −1 x 0
Eλ1 : 2 2 −2 y = 0 ,
1 1 −1 z 0
es decir,
−x + y − z = 0
x−z = 0
2x − 2z = 0 ⇒
y − 2z = 0
x + y − 3z = 0
de donde obtenemos el vector propio
−
→
w = (1, 2, 1).
La matriz A es, por tanto, diagonalizable, ya que tiene tres vectores propios linealmente independientes, obte-
niéndose
1 1 1 3 0 0
P = −1 0 2 y P −1 AP = 0 3 0 .
0 1 1 0 0 5
2
Llamaremos matriz elemental de Jordan de orden k y valor propio λ a la matriz Jk (λ) de orden k cuyos
elementos son todos cero menos los de la diagonal principal que son iguales a λ y los que están inmediatamente
ÁLGEBRA LINEAL Y GEOMETR ÍA 141
J1 (λ) = (λ),
λ 1
J2 (λ) = ,
0 λ
λ 1 0
J3 (λ) = 0 λ 1 ,
0 0 λ
λ 1 0 0
0 λ 1 0
J4 (λ) =
0 0 λ 1 ,
0 0 0 λ
··· = ···
Se llama matriz de Jordan a la matriz que se forma yuxtaponiendo matrices elementales Jordan a lo largo de la
diagonal principal, y ceros en el resto, es decir a una matriz del estilo
Jk1 (λ1 ) 0
Jk2 (λ2 )
..
.
0 Jkr (λr )
Propiedad. Toda matriz cuadrada es semejante a una matriz de Jordan (real o compleja), que se determina de
forma única salvo permutaciones de los bloques diagonales de matrices elementales Jordan que la forman.
En lo que sigue vamos a obtener las formas canónicas de Jordan para matrices de órdenes 2 y 3.
Consideremos n = 2, sabemos que si A tiene dos valores propios λ1 y λ2 distintos, entonces es diagonalizable.
El caso interesante lo tenemos cuando λ1 = λ2 .
Primero obtenemos ∆A (t) = λ2 − 1 = 0, y de aquı́ λ1 = λ2 = 2. Puedes comprobar que Eλ1 viene expresado
por las ecuaciones x = y. Es decir estarı́a generado por el vector −→
u = (1, 1). La matriz A no es por tanto
2
diagonalizable. Obsérvese que (A − λ1 I2 ) = 0 siempre que se tengan dos valores propios iguales.
Cogemos ahora un vector del plano que no esté en Eλ1 , por ejemplo − →
v = (1, 0), ya que se puede comprobar
fácilmente que
−2 2 −2 −
→
=−→
1 1
(A − λ1 I2 ) = = w 6= 0 .
0 −2 2 0 −2
La matriz P de cambio de base que conduce a la forma canónica se construye tomando los vectores −
→
w y−
→
v como
columnas respectivas (en este orden), es decir,
−2 1
P =
−2 0
2
Consideremos ahora el caso n = 3; al igual que en el caso de orden 2, la reflexión que requiere nuestro interés la
encontramos cuando la matriz A no es diagonalizable.
Se tiene que
∆A (t) = −λ3 − 2λ2 + 4λ + 8 = 0,
y de aquı́ los valores propios son:
λ1 = 2 (simple) y λ2 = −2 (doble)
Probamos con
x 0
Eλ0 2 : (A + 2I3 )2 y = 0 ,
z 0
es decir
8 8 0 x 0
8 8 0 y = 0 =⇒ x + y = 0,
−8 −8 0 z 0
que es un subespacio de dimensión 2, con base
−
v→ −
v→
1 = (1, −1, 0) y 2 = (0, 0, 1).
Como Eλ1 y Eλ0 2 llenan todo el espacio, podemos elegir ahora una base de manera conveniente para obtener la
matriz de Jordan. La forma de elegirla es la siguiente:
0 1
(2) Se coge −
→ = (A + 2I ) 0 = −1
u 2 3
1 1
ÁLGEBRA LINEAL Y GEOMETR ÍA 143
De forma análoga a como razonábamos para calcular la potencia n-ésima de una matriz diagonalizable, se puede
ahora trabajar con una matriz que sea semejante a una forma canónica de Jordan. La idea es la misma, An =
P J n P −1 , donde J indica la forma canónica de Jordan a la que reducimos la matriz A.
teniendo en cuenta para ello que basta con calcular la potencia n-ésima de cada uno de los bloques diagonales, es
n
−2 1
decir, 2n y , poniendo ceros en el resto.
0 −2
Un espacio vectorial real V se dice euclı́deo si hay una regla que asigne a cada par de vectores −
→
u ,−
→
v ∈ V un
−
→ −
→ −
→ −→
número real llamado producto escalar de los vectores u y v , que denotaremos por ( u , v ) (también a veces
por −
→
u .−→v ), de manera que se cumplan las siguientes propiedades:
• Simétrica: (−
→
u ,−
→
v ) = (−
→
v ,−
→
u ) para todo −
→
u ,−
→
v ∈ V.
• Distributiva: (−
→
u , (−
→
v +−
→
w )) = (−
→
u ,−
→
v ) + (−
→
u ,−
→
w ) para todo −
→
u ,−
→
v ,−
→
w ∈ V.
• (λ−
→
u ,−
→
v ) = λ(−
→
u ,−
→
v ) para todo −
→
u ,−
→
v ∈ V y para todo λ ∈ R.
144 MATEM ÁTICAS
• (−
→
u ,−
→
u ) > 0 para todo −
→
u ∈ V, −
→ 6 0
u =
Ejemplos.
(1) Rn se puede dotar del siguiente producto escalar (puedes comprobar las propiedades):
(2) En Rn también se pueden definir otros productos escalares. Por ejemplo, en R2 definimos
1 1
(x1 , x2 ).(y1 , y2 ) = (x1 , x2 ) (y1 , y2 ).
1 2
En V3 (espacio vectorial real de los vectores libres de R3 ) también podemos definir un producto escalar de la
siguiente manera: Si consideramos − →u = (u1 , u2 , u3) y −
→
v = (v1 , v2 , v3 ) expresiones de los vectores −
→
u y−
→
v en
la base canónica de V3 , definimos el producto escalar de esos dos vectores como
−
→
u .−
→
v = u1 v1 + u2 v2 + u3 v3 .
Un conjunto S de vectores de V3 se dice ortogonal si cualquier vector de S es ortogonal a todos los demás vectores
del conjunto.
Una propiedad muy importante para este tipo de conjuntos es la siguiente: “Sean −
→
u ,−
→
v y−
→
w vectores no nulos
ortogonales de V3 , entonces son linealmente independientes”.
Un conjunto ortogonal de vectores S se dice que es ortonormal cuando todos los vectores del conjunto tienen
norma igual a 1.
ÁLGEBRA LINEAL Y GEOMETR ÍA 145
Especial importancia tienen las llamadas bases ortonormales de V3 en las cuestiones relativas a curvas en R3 ,
que desarrollaremos posteriormente en el Capı́tulo 6.
Distancia entre dos puntos. Dados dos puntos de R3 , A(a1 , a2 , a3 ) y B(b1 , b2 , b3 ), se define la distancia entre
−→
ellos como la norma del vector AB, es decir,
−→ p
d(A, B) = AB = (b1 − a1 )2 + (b2 − a2 )2 + (b3 − a3 )2
−→
ya que AB = (b1 − a1 , b2 − a2 , b3 − a3 ).
Ejemplo. Como un sencillo ejercicio de la definición de distancia entre dos puntos, puedes comprobar que el
triángulo ABC, con A(3, −1, 2), B(0, −4, 2) y C(−3, 2, 1) es isósceles. 2
Sean − →
u ,−
→v ∈ V3 . Se llama producto vectorial de −
→
u y−
→
v y lo denotaremos por −
→
u ×−
→
v al vector libre que tiene
las siguientes propiedades:
(1) |−
→
u ×−
→
v | = |−
→
u | |−
→
v | sen(−
→
u ,−
→
v)
(2) La dirección del vector −
→
u ×−
→
v es la perpendicular a las direcciones de los vectores −
→
u y−
→
v.
(3) El sentido del vector −
→
u ×− →
v es el indicado por la siguiente regla práctica: colocamos la mano derecha
con el dedo “corazón” en posición perpendicular a los dedos “pulgar” e “ı́ndice”, de tal forma que el dedo
“pulgar” indique el sentido del vector −→
u y el dedo “ı́ndice” indique el sentido del vector −→v . Entonces el
−→ −
→
dedo “corazón” indica el sentido del vector u × v .
Figura 5.1: Regla del sacacorchos para determinar el sentido del producto vectorial.
(1) −
→
u ×−
→
v = −(−
→
v ×−
→
u ).
−→
(2) Si −
→
u y−
→
v tienen la misma dirección entonces −
→
u ×−
→
v = 0.
(3) λ−
→u ×−
→v = λ(−
→u ×−→
v ).
−
→ −
→ −
→ −→
u × λ v = λ( u × v ).
(4) −
→
u × (−
→
v +−
→
w) = −
→
u ×−
→
v +−
→
u ×−
→
w.
146 MATEM ÁTICAS
−→ −→
Consideremos el paralelogramo formado por los puntos A, B, C, D ∈ R3 , de forma que AB y DC son paralelos y
−→ −→ −→
representantes del mismo vector libre u , y análogamente BC y AD son paralelos y representan al mismo vector
libre −
→
v . En estas condiciones no es demasiado complicado demostrar (ver bibliografı́a recomendada) que el área
del paralelogramo viene expresada por |− →
u ×− →v |.
A C
α
0 B
Figura 5.2: El producto vectorial de los vectores OA y OB permite obtener el área del paralelogramo OBCA.
Ejemplo. Si −
→
u = (2, −1, 3) y −
→
v = (1, 3, 5), entonces −
→
u ×−
→
v = (−14, −7, 7). 2
Sean −
→
u ,−
→
v ,−
→
w ∈ V3 , definimos el producto mixto como la siguiente expresión:
[−
→
u ,−
→
v ,−
→
w] = −
→
u .(−
→
v ×−
→
w)
Si −
→
u ,−
→
v y−
→
w son tres vectores de V3 y λ ∈ R, se tiene:
(1) [−
→
u ,−
→
v ,−
→
w ] = [−
→
w,−
→
u ,−
→
v ] = [−
→
v ,−
→
w,−
→
u ] = −[−
→
u ,−
→
w,−
→
v ] = −[−
→
w,−
→
v ,−
→
u ].
ÁLGEBRA LINEAL Y GEOMETR ÍA 147
−→
(2) λ[−
→
u ,−
→
v ,−
→
w ] = [λ−
→
u ,−
→
v ,−
→
w ] = [−
→
u , λ−
→
v ,−
→
w ] = [−
→
u ,−
→
v , λw].
→+−
(3) [−
u 1
→, −
u → − → −→ − → − → −→ − → − →
2 v , w ] = [ u1 , v , w ] + [ u2 , v , w ] , cumpliéndose también la propiedad distributiva para las
otras dos variables.
(4) [−
→
u ,−
→
v ,−
→
w ] = 0 si y sólo si los vectores −
→
u ,−
→
v y−
→
w son linealmente independientes.
0 A
Figura 5.3: El producto mixto de OA, OB y OC permite hallar el volumen del paralelepı́pedo que determinan.
Un doble cono recto es la figura que genera una recta r al girar alrededor de otra recta s que la corta. La recta s se
denomina eje del cono, y las distintas posiciones de r generatrices del cono. El punto de intersección del eje con
las generatrices se denomina vértice del cono (ver Figura 5.4).
Toda figura que se obtiene como intersección de un doble cono recto y un plano se denomina cónica.
Según las distintas posiciones del plano las cónicas se llaman de forma diferente:
• Si el plano es perpendicular al eje del cono y no pasa por el vértice, obtenemos una circunferencia. Si el
plano pasa por el vértice se obtiene un punto.
• Si el plano no es perpendicular al eje del cono y forman entre ellos un ángulo superior al que forman el eje
del cono con cualquiera de las generatrices, obtenemos una elipse. Si el plano pasa por el vértice se obtiene
un punto (ver Figura 5.5).
• Si el plano es paralelo a alguna de las generatrices obtenemos una parábola, excepto cuando el plano pasa
por el vértice que en cuyo caso se obtiene una recta (ver Figura 5.6).
148 MATEM ÁTICAS
Figura 5.4: Doble cono cuyo vértice está situado en el origen de coordenadas.
• Cuando el ángulo que forman el plano y el eje es inferior al que forma el eje y las generatrices, obtenemos
una hipérbola, excepto cuando el plano pasa por el vértice que obtendremos dos rectas que se cortan (ver
Figura 5.7).
Los casos excepcionales que aparecen descritos con anterioridad se llaman cónicas degeneradas.
Todas las secciones cónicas anteriormente descritas verifican formas particulares de esta ecuación. Recı́procamente
la ecuación describe, salvo algunos casos particulares, sólo secciones cónicas.
Si la escribimos en la forma a11 x2 + 2a12 xy + a22 y 2 + 2a1 x + 2a2 y + a0 = 0 tiene la ventaja de poder encontrar
fácilmente la siguiente forma matricial de la ecuación:
a11 a12 a1 x
x y 1 a12 a22 a2 y = 0
a1 a2 a0 1
ÁLGEBRA LINEAL Y GEOMETR ÍA 149
La matriz
a11 a12 a1
a12 a22 a2
a1 a2 a0
se denomina matriz asociada a la cónica.
2.9.2. Cuádricas en R3
Por rotación en torno a un eje de las secciones cónicas circunferencia, elipse, parábola e hipérbola se obtienen
superficies de revolución en R3 , llamadas respectivamente superficie esférica, elipsoide, paraboloide e hiperbo-
loide.
Eligiendo de forma adecuada los ejes coordenados las ecuaciones de las mencionadas superficies satisfacen ecua-
ciones bastante sencillas:
Esfera: x2 + y 2 + z 2 = R2 .
x2 y2 z2
Elipsoide: 2
+ 2 + 2 = 1.
a b c
Paraboloide: x2 + y 2 = a2 z.
x2 y2 z2
Hiperboloide de una hoja: + − = 1.
a2 b2 c2
ÁLGEBRA LINEAL Y GEOMETR ÍA 151
Sin embargo la situación cambia considerablemente si se somete la superficie a un movimiento (traslación, giro,...)
y aparecen ecuaciones más complicadas en sus expresiones. La forma general de todas estas ecuaciones es la
siguiente:
Ax2 + By 2 + Cz 2 + Dxy + Exz + F yz + Gx + Hy + Iz + K = 0,
donde A, B, C, D, E, F, G, H, I, K ∈ R.
Análogamente a como hacı́amos con las cónicas se puede plantear la cuestión de identificar las figuras geométricas
que describe una ecuación como la anterior. Las llamaremos superficies cuádricas.
Ejemplo. La ecuación 7x2 + 6y 2 + 5z 2 − 4xy − 4yz + 14x − 8y + 10z + 6 = 0, que en forma matricial se expresa
como
7 −2 0 x x
x y z −2 6 −2 y + 2 7 −4 5 y + 6 = 0
0 −2 5 z z
mediante un giro y una traslación convenientes se puede convertir en la ecuación del elipsoide de revolución
x2 y2 z2
+ + = 1.
1 2 2/3
2
152 MATEM ÁTICAS
Un punto P de R2 queda totalmente determinado por la distancia de dicho punto al origen de coordenadas O,
que notaremos por ρ y el ángulo ϕ que forma la recta OP con el eje OX (contado en el sentido positivo). Al par
ordenado de números (ρ, ϕ) se le llaman coordenadas polares del punto P .
y ρ
0 x
Sean (x, y) las coordenadas rectangulares y (ρ, ϕ) las coordenadas polares. Entonces las relaciones entre ellas son
las siguientes:
x = ρ cos ϕ
y = ρ sen ϕ
y despejando ρ y ϕ se tiene
p
ρ = x2 + y 2
y
tan ϕ =
x
0
Consideramos el punto P (x, y, z) de R3 y P (x, y, 0) su proyección ortogonal sobre el plano XY . En dicho plano
0
el punto P está totalmente determinado por sus coordenadas polares (ρ, ϕ), en consecuencia el punto P estará
ahora totalmente determinado por (ρ, ϕ) y por el valor de la coordenada z. A la terna de números reales (ρ, ϕ, z),
se le llama coordenadas cilı́ndricas de P .
z
∂z
r ∂ϕ
z ∂r
0 y
ρ
ϕ
P0
Las relaciones entre coordenadas cilı́ndricas y cartesianas rectangulares son las ya conocidas para las coordenadas
polares en el plano.
Consideremos P un punto de R3 que no esté situado en el eje OZ. P está totalmente deteminado por la longitud
ρ de OP, el ángulo ϕ que forma el plano determinado por OZ y P con el plano OXZ y el ángulo θ que forma la
recta OP con el eje OZ. La terna de números ( ρ, ϕ, θ ) se llaman coordenadas esféricas de P respecto al sistema
de referencia polar formado por el polo O, el plano polar OXZ y el eje polar OZ. Obsérvese que ρ puede tomar
todos los valores reales positivos, ϕ ∈ [0, 2π) y θ ∈ (0, π).
z
0 y
x = ρ sen θ cos ϕ
y = ρ sen θ sen ϕ
z = ρ cos θ
Y despejando de estas expresiones las coordenadas esféricas en función de las cartesianas obtenemos:
p
ρ = x2 + y 2 + z 2
y
tan ϕ =
x
p
x2 + y 2
tan θ =
z
Ejemplo. Consideremos la superficie de ecuación en coordenadas polares sen θ(cos ϕ − 3 sen ϕ) + cos θ = 0.
Dividiendo por cos θ y usando las anteriores relaciones obtendremos
p !
x2 + y 2 x y
p − 3p +1=0
z x2 + y 2 x2 + y 2
y simplificando se tiene finalmente x − 3y + z = 0 que como sabemos expresa la ecuación de un plano que pasa
por el origen de coordenadas. 2
ÁLGEBRA LINEAL Y GEOMETR ÍA 155
Sean V y W espacios vectoriales sobre el cuerpo K. Una aplicación f : V → W se dice lineal si cumple las
siguientes propiedades:
(1) f (−
→
u +− →
v ) = f (−
→
u ) + f (−
→
v ) para todo −
→
u ,−
→
v ∈V
(2) f (λ−
→u ) = λf (−
→
u ) para todo −
→
u ∈ V y para todo λ ∈ K.
Cuando f es una aplicación lineal biyectiva diremos que es un isomorfismo. Si es inyectiva le llamaremos mono-
morfismo y si es sobreyectiva diremos que es un epimorfismo.
De manera análoga a como vimos que dada una matriz A ∈ Mm×n (R) surgı́a una aplicación lineal asociada
f : Rm → Rn , podemos pensar recı́procamente si dada una aplicación lineal existe una matriz asociada. Puesto
156 MATEM ÁTICAS
que todo espacio vectorial posee una base, un aplicación lineal f : V → W estará unı́vocamente determinada
por las imágenes de los elementos de la base. En el caso en que tratemos con espacios vectoriales de dimen-
sión finita, se puede dar una importante relación entre las aplicaciones lineales y las matrices. Supongamos que
dim V = m y dim W = n , considerando bases de los respectivos espacios vectoriales formadas por los vectores
BV = {− v→ −
→ −
→
1n, v2 , ..., vn } ⊂ V y BW o = {−→, −
w → −→
1 w2 , ..., wm } ⊂ W . Consideremos la expresión en la base BW de los
−→ −
vectores f (v1 ), f ( v→ −
→
2 ), ..., f (vn ) , es decir,
f (−
v→ −→ −→
1 ) = α11 w1 + α21 w2 + · · · + αm1 wm
−→
f (−
v→ −→ −→
2 ) = α12 w1 + α22 w2 + · · · + αm2 wm
−→
... ............................................
−→
f (vm ) = α1m − w→+α −
1
→
2m w2 + · · · + αmm wm
−→
X
m
f (−
v→
j) = αij −
→,
w i j = 1, 2, ..., n.
i=1
Te introduciremos en esta cuestión con un ejemplo. Supongamos que una aplicación lineal f : R2 → R2 tiene
asociada en la base canónica la matriz
6 −2
A=
6 −1
→ = (1, 2), −
y queremos encontrar la expresión de la matriz asociada a f en la base −
u 1
→ = (2, 3). La matriz cambio
u 2
de base (ver bibliografı́a recomendada) viene expresada por
1 2
C= .
2 3
ÁLGEBRA LINEAL Y GEOMETR ÍA 157
Esto te recordamos que quiere decir que considerados como vectores columna, por ejemplo el vector −
→
v = t (2, 5)
expresado en la base canónica, tiene como coordenadas en la nueva base, el resultado de efectuar
−1
1 2 2 −3 2 2 4
= = .
2 3 5 2 −1 5 −1
→, −
De esta forma la matriz de la aplicación lineal f expresada en la base {−
u →
1 u2 } vendrı́a dada por
−1
0 1 2 6 −2 1 2 2 0
A = = .
2 3 6 −1 2 3 0 3
y calcular A + B; C + D ; 3A − 5B ; 2C − 3D .
A.5.4. Resolver la siguiente ecuación matricial (X − A)B = C, donde B es una matriz invertible.
x y 1 1
A.5.5. Encontrar todas las matrices M de la forma M = que conmutan con la matriz A = .
x t 0 1
A.5.7. Para completar la idea del método que sugerimos en el texto para calcular la matriz inversa sin usar deter-
minantes, responder a las siguientes cuestiones:
(a) Explicar las razones en las que se basa el método descrito anteriormente para calcular la matriz inversa.
(b) Aplı́carlo en el cálculo de matrices inversas de órdenes superiores a dos. Por ejemplo demostrar que
−1 2
1 3 −2 3 − 16 − 12
−5 0 1 = 7 1
− 32
3 6
10 1
1 4 −3 3 6 − 52
A.5.8. Determinar usando determinantes si las siguientes matrices son invertibles y calcular su inversa en el caso
de que exista:
1 2 −4 1 3 −4
3 5
A= , B = −1 −1 5 , C= 1 5 −1 .
2 3
2 7 −3 3 13 −6
A.5.10. A continuación
se propone
completar el siguiente cuadro hasta obtener el determinante de una matriz
a11 a12
2 × 2, A = .
a21 a22
A.5.12. Calcular los determinantes propuestos en el ejercicio anterior, pero desarrollando esta vez por los elemen-
tos de sus filas o columnas.
A.5.13. Responder a las siguientes cuestiones:
(a) ¿Cómo se puede calcular el determinante de una matriz triangular superior? ¿Y de una inferior?
(b) Si A es una matriz con det(A) = 5 ¿Cuanto vale det(A−1 )? (Indicación: AA−1 = In , aplicar después
la propiedad (8) de los determinantes).
A.5.14. Calcular los siguientes determinantes:
5 4 2 1
1 x x2 t+3 −1 1
2 5 1 −2
1 y y2 5 t−3 1
−5 −7 −3 9
1 z z2 −6 t + 4
6 1 −2 −1 4
A.5.19. Determinar a y b para que los siguientes vectores sean linealmente dependientes:
→ = (3, −2, −1, 3), −
−
u → = (1, 0, 2, 4), −
u → = (1, −3, a, b)
u
1 2 3
A.5.20. Estudiar para qué valores de los parámetros a y b son compatibles los siguientes sistemas y resolverlos
cuando sea posible:
x + 2y + 2z = 2 ax − y + z = 2x ax + y + z = 1
2x − y + 3z = 2 x + 2ay − az = y x + ay + z = b
5x − y + az = 6 x + ay − z = 0 x + y + az = b2
A.5.21. Determinar si son o no diagonalizables cada una de las siguientes matrices, y en el caso en que lo sean
calcular la potencia n-ésima:
4 2
(a)
3 −1
5 1
(b) ,
−4 1
2 −5
(c) ,
1 −2
2 4
(d) ,
3 1
4 1 −1
(e) 2 5 −2 ,
1 1 2
−3 1 −1
(f) −7 5 −1 ,
−6 −6 −2
1 2 3
(g) 0 2 3 .
0 0 3
A.5.22. Estudiar la posibilidad de diagonalizar la matriz
a −1 1
0 1 3
0 2 2
según los distintos valores del parámetro a.
A.5.23. Determinar los valores de xn e yn , para todo n > 0, sabiendo que
xn+1 = 2xn + 4yn
yn+1 = 3xn + yn
y que x0 = 1 e y0 = 2.
160 MATEM ÁTICAS
es diagonalizable.
x2 + y 2 + z 2 − 2x − 4y − 2z + 2 = 0; 4x2 + y 2 + 4z 2 − 8x − 8y − 8z + 11 = 0.
A.5.33. Consideremos la aplicación f : R3 → R3 dada por las expresiones referidas a coordenadas en la base
canónica f (x, y, z) = (x + y, z, y − z) . Se pide:
(a) Demostrar que es una aplicación lineal y encontrar la matriz asociada en la base canónica.
(b) ¿Cuál es la expresión de la matriz asociada en la base formada por los vectores −→ = (1, 0, 1), −
u1
→=
u2
−
→
(0, 1, 1), u = (1, 0, 0)?
3
ÁLGEBRA LINEAL Y GEOMETR ÍA 161
4.1. Introducción
La práctica se va a realizar con el programa de cálculo matemático DERIVE for Windows, versión 4.05, de Soft
Warehouse. DERIVE for Windows permite realizar cálculos y manipulaciones matemáticas de carácter general,
lo cual significa que realiza muchas cosas de forma aceptable aunque no tiene la potencia de otros programas
especı́ficos. No obstante, DERIVE for Windows permite realizar todos los cálculos que un usuario medio puede
necesitar.
Antes de comenzar la práctica será conveniente que recordemos brevemente la ‘botonera’ de DERIVE for Win-
dows (ver Figura 5.14), ya que simplifica enormemente la introducción de datos y la realización de cálculos. Los
botones permiten realizar las siguientes tareas (de izquierda a derecha): New (abrir una nueva hoja de trabajo),
Open (abrir una hoja de trabajo existente), Save (guardar la sesión de trabajo), Print (imprimir la sesión de tra-
bajo), Remove (eliminar la expresión marcada), Unremove (recuperar la última expresión eliminada), Renumber
(renumerar las expresiones), Author expression (introducir una expresión sencilla), Author vector (introdu-
cir un vector), Author matrix (introducir una matriz), Simplify (simplificar), Approximate (calcular un valor
aproximado), Solve (resolver algebraicamente o numéricamente una expresión), Substitute for variables
(realizar una sustitución), Calculate limit (calcular un lı́mite), Calculate derivative (calcular una deriva-
da), Calculate integral (calcular una integral), Calculate sum (calcular una suma), Calculate product
(calcular un producto), 2D-plot window (realizar un gráfico bidimensional) y 3D-plot window (realizar un
gráfico tridimensional).
Figura 5.14: El uso de la ‘botonera’ de DERIVE for Windows nos puede simplificar mucho el trabajo. Otro elemento
interesante es la existencia de ‘teclas calientes’ que nos permiten evitar los menús, con lo que se gana
en rapidez.
En esta práctica vamos a manipular vectores y matrices de cualquier orden, resolver sistemas de ecuaciones linea-
les, operar matrices (cálculo de la matriz inversa, suma, producto) y calcular los valores y vectores propios de una
matriz. Por tanto, debemos saber en primer lugar cómo introducir estos datos en el programa. Aunque algunas
aplicaciones funcionan sin cargar ningún paquete adicional, es conveniente que para esta práctica se cargue la
utilidad VECTOR.MTH mediante las opciones File|Load|Utility.
Para introducir un vector en DERIVE for Windows tenemos dos formas: particular y general. La forma par-
ticular se obtiene seleccionando las opciones Author|Vector y nos aparece la ventana de la Figura 5.15, de-
mandándonos la dimensión del vector. Una vez introducida dicha dimensión (por ejemplo, 4) nos aparece una
nueva ventana (ver Figura 5.16) para que vayamos introduciendo los elementos del vector.
La forma general consiste en seleccionar las opciones Author|Expression e introducir un vector en la forma
[x1,x2,...,xn], donde xi son los diferentes elementos del vector. Por ejemplo, el vector (2, 1, −3) se introdu-
cirı́a como [2,1,-3]; debemos notar que los vectores deben estar delimitados por los corchetes [] y no por los
paréntesis () o las llaves {}.
Análogamente, podemos introducir una matriz de dos formas distintas. La forma particular consiste en seleccionar
las opciones Author|Matrix y nos aparece la ventana de la Figura 5.17 donde debemos indicar el número de
162 MATEM ÁTICAS
filas (Rows) y de columnas (Columns). A continuación debemos completar los elementos de la matriz (ver Figura
5.18).
La forma general consiste, como antes, en seleccionar las opciones Author|Expression e introducir la matriz
en la forma [f1,f2,...,fm], donde cada fi es una fila de la matriz. Por ejemplo, la matriz de orden 3 × 3
siguiente
1 2 3
1 4 9
1 8 27
se introducirı́a como sigue: [[1,2,3], [1,4,9], [1,8,27]]. Notemos que los delimitadores de las matrices
son también los corchetes y no los paréntesis ni las llaves.
ÁLGEBRA LINEAL Y GEOMETR ÍA 163
Como es natural, los elementos de un vector pueden ser cualquier expresión válida en DERIVE for Windows, no
sólo números. Por ejemplo, un sistema de ecuaciones lineales es un vector cuyos elementos son ecuaciones; ası́,
el sistema de ecuaciones lineales
3x + 2y = 5
4x + 3y = 2
se introducirı́a ası́: [3x+2y=5, 4x+3y=2]. Una vez introducido el sistema podemos resolverlo de dos formas
distintas: directamente o a través de menús. En el primer caso debemos introducir la expresión Solve(#1,[x,y])
(suponiendo que el sistema es la lı́nea número 1) y nos aparecerá la solución: [x=11 y=-14]. En el segundo caso,
debemos seleccionar el botón Solve de la botonera y nos aparecerá la ventana de la Figura 5.19; ahora basta pulsar
el botón Simplify .
Cuando necesitemos utilizar un vector o una matriz en varias expresiones, lo conveniente es almacenarla en una
variable. Por ejemplo, podemos escribir v:=[1,2,3] o a:=[[1,2],[3,4]].
Con DERIVE for Windows podemos sumar, restar y multiplicar matrices, siempre que las dimensiones sean
apropiadas. Pero con DERIVE for Windows podemos realizar otro tipo de productos: el producto escalar y el
producto vectorial de dos vectores. La sintaxis de estas operaciones figura en la siguiente tabla:
164 MATEM ÁTICAS
Operación Sintaxis
Suma de a y b a + b
Resta de a y b a - b
Producto de a y b a . b
Producto de a por un escalar t t*a ó ta
Producto escalar de v y w v . w
Producto vectorial de v y w CROSS(v,w)
a y b son vectores o matrices con las dimensiones apropiadas.
Observemos que para no confundir el punto decimal ‘.’ con el punto de las operaciones producto anteriores,
debemos dejar un espacio en blanco antes y después del punto; ası́, no es válido indicar el producto de a y b
como a.b ó a. b ó a .b. En relación con el producto vectorial debemos hacer una precisión: si los vectores
son tridimensionales, entonces CROSS(v,w) devuelve el producto vectorial de v y w, pero si los vectores son de
dimensión dos entonces CROSS(v,w) devuelve el determinante de v y w.
Para manipular los elementos de un vector o matriz, DERIVE for Windows dispone de numerosas funciones,
todas ellas con una sintaxis muy intuitiva. A continuación listamos las más importantes.
SUB: Es un sufijo que permite extraer un elemento de un vector o una fila de una matriz. Por ejemplo, [a,b,c]
SUB 2 aparece en pantalla como [a,b,c]2 y se simplifica a b. Sin embargo [[1,2],[3,4]] SUB 1
permite extraer la primera fila de la matriz, es decir, [1,2], por lo que [[1,2],[3,4]] SUB 1 SUB 2
identifica al segundo elemento de la primera fila, es decir, 2.
ELEMENT(v,n): Extrae el elemento n-ésimo del vector v.
ELEMENT(a,m,n): Extrae el elemento (m, n) (fila m y columna n) de la matriz a.
APPEND(v1,v2,...,vn): Concatena dos o más vectores. Por ejemplo, APPEND([3,1],[2,4]) produce como
resultado el vector [3,1,2,4]. Si a es una matriz, entonces APPEND(a) produce un vector cuyos elementos
son todos los elementos de la matriz.
DELETE ELEMENT(v,n): Elimina el elemento n-ésimo del vector v. Si v es una matriz, entonces se borra la fila
n-ésima.
INSERT ELEMENT(u,v,n): Agrega el elemento u al vector v antes del elemento n-ésimo. Por ejemplo,
INSERT ELEMENT(d,[a,b,c],2)
da lugar al vector [a,d,b,c]. Si se omite n, entonces el elemento se coloca al principio del vector, y si el
valor de n es uno más que la dimensión del vector, el nuevo elemento se colocará al final del vector.
REPLACE ELEMENT(u,v,n): Reemplaza el n-ésimo elemento del vector v por la expresión u. Por ejemplo,
REPLACE ELEMENT(d,[a,b,c],2)
da lugar al vector [a,d,c]. Si se omite n, entonces el elemento reemplazado será el primero.
REVERSE VECTOR(v): Construye un nuevo vector cambiando de orden los elementos del vector v. Ası́,
REVERSE VECTOR([1,2,3,4])
produce el vector [4,3,2,1].
SELECT(u,k,v): Produce un nuevo vector con los elementos k del vector v tales que u(k) es cierto. Por ejemplo,
SELECT(PRIME(k),k,[1,2,3,4,5,6]) produce el vector [1,2,3,5] formado por los números primos
que hay en el vector original.
SELECT(u,k,m,n,s): Permite seleccionar los elementos k de la sucesión que empieza en m, acaba en n y está
construida con un paso s tales que u(k) es cierta. Por defecto s = 1, de forma que
SELECT(PRIME(k),k,1,100)
da lugar a un vector cuyos elementos son los números primos entre 1 y 100.
Ejercicio. Generar todos los números pares entre 1 y 100 y todos los números impares entre 100 y 200. (En este
ejercicio debe utilizarse la función FLOOR(n), que genera la parte entera del número n).
Las operaciones tı́picas con matrices están disponibles en DERIVE for Windows. La sintaxis que debe utilizarse
aparece en la siguiente tabla:
Operación Sintaxis
Matriz inversa de m m ∧ −1
Matriz traspuesta de m m‘
Matriz adjunta de m ADJOINT(m)
Traza de la matriz m TRACE(m)
Determinante de la matriz m DET(m)
Producto de las matrices m y n m . n
Exponenciación de m: mk m∧k
166 MATEM ÁTICAS
Aunque no es estrictamente necesario, es conveniente calcular el polinomio caracterı́stico, ya que sus raı́ces son
los valores propios. Para ello disponemos de la función
CHARPOLY(a,t)
que desarrolla el polinomio caracterı́stico de la matriz a en términos de la variable t. Por ejemplo, CHARPOLY([[2,
3], [a, b]], t) produce t2 − (b + 2)t − 3a + 2b.
EIGENVALUES(a,t)
Cómo es muy frecuente que los polinomios de grado superior a cuatro no se puedan factorizar por métodos
racionales, y la factorización de polinomios de grado cuatro es de una complejidad enorme, la función anterior
sólo es útil para matrices de orden 2 × 2 o 3 × 3. En consecuencia, suele ser habitual calcular primero el polinomio
caracterı́stico y posteriormente utilizar métodos aproximados para determinar sus raı́ces (es decir, los valores
propios de la matriz).
Una vez determinados los valores propios de una matriz A, disponemos de dos funciones para calcular los vectores
propios asociados:
EXACT EIGENVECTOR(A,µ): Se utiliza cuando µ es un valor propio exacto de la matriz A. Cuando µ es una
aproximación a un valor propio, entonces la matriz A − µI no es singular, por lo que esta función devolverı́a
el vector cero como solución.
APPROX EIGENVECTOR(A,µ): Aproxima a un vector propio numérico de A cuyo valor propio asociado es apro-
ximado por µ y el resultado es un vector de norma uno. Naturalmente, µ no debe ser un valor propio
exacto. Para mayor generalidad, podemos multiplicar el resultado por un parámetro, por ejemplo @1. Los
parámetros en DERIVE for Windows se indican por @1, @2, @3, .... Por ejemplo, un resultado como
[@1,3@2,-5@1] es lo que usualmente se escribe como [s,3t,-5s].
ÁLGEBRA LINEAL Y GEOMETR ÍA 167
Ejercicio. Hallar el polinomio caracterı́stico, los valores propios y los vectores propios asociados de la siguiente
matriz:
−2 1 1 1 1
1 −3 −1 0 −1
1 −1 1 0 −3
1 0 0 3 0
1 −1 −3 0 2
4.8. Bibliografı́a
C. Paulogorrón y C. Pérez. Cálculo matemático con DERIVE para PC, Ed. RA-MA, 1a Ed., 1994.
J. HEINHOLD y B. RIEDMULLER Algebra Lineal y Geometrı́a Analı́tica, Ed. Reverté SA, 1981. Capı́tulos 1
y 2.
R.E. LARSON, R.P. HOSTETLER y B.H. EDWARDS Calculo y Geometrı́a Analı́tica, 5a ed., McGraw-Hill, Ma-
drid, 1995. Capı́tulos 11, 13 y 14.
J.L. MALAINA y otros Lecciones Básicas de Algebra Lineal, Universidad del Pais Vasco, 1995. Capı́tulos 1–6,
9, 11 y 12.
J. STEWART Cálculo, 2a ed. Grupo Editorial Iberoamérica, México, 1994. Capı́tulo 11.
J.R. TORREGROSA y C.JORDAN Algebra Lineal y sus Aplicaciones, serie Schaum, McGraw Hill, Madrid,
1987. Capı́tulos 1 y 2.
6. PREGUNTAS DE EVALUACIÓN
ax + by + z = 1
x + aby + z = b
x + by + az = 1
E.5.3. Encontrar la dimensión y una base del subespacio vectorial generado por los vectores −
→ = (1, 0, 0, −1),
u1
−
→ −→ −
→ −
→
u2 = (2, 1, 1, 0), u3 = (1, 1, 1, 1), u4 = (1, 2, 3, 4) y u5 = (0, 1, 2, 3). Determinar las ecuaciones
cartesianas de este subespacio.
168 MATEM ÁTICAS
E.5.4. Decidir cuáles de las siguientes matrices pueden reducirse a una matriz diagonal y encontrar matrices Pi
que hagan posible la diagonalización (P −1 Ai P = Di ):
−1 3 1
(a) A1 = −3 5 −1 ,
−3 3 1
4 −1 −1
(b) A2 = 1 2 −1 ,
1 −1 2
0 0 0 1
0 0 1 0
(c) A3 =
0 1 0 0 .
1 0 0 0
E.5.5. Calcular la forma de Jordan de
0 1 0
A= 1 0 0
0 0 2
y utilizarla para determinar A7 .
E.5.6. Hallar las ecuaciones que describen los subespacios Ker f e Im f donde f : R3 → R3 es la aplicación
lineal definida por f (x, y, z) = (x + 2y + z, −x + 2y, 2y + z).
E.5.7. ¿Qué tipo de cónica es la que viene dada por la ecuación 9x2 − 18x + 4y 2 − 24y + 9 = 0? ¿Qué tipo de
cuádrica es la que viene dada por la ecuación 4x2 + 2y 2 + z 2 − 8x − 12y − 4z + 22 = 0?
ÁLGEBRA LINEAL Y GEOMETR ÍA 169
ANOTACIONES
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
CAPÍTULO 6
CÁLCULO DIFERENCIAL EN VARIAS VARIABLES
• Calcular derivadas parciales de orden superior de • Saber interpretar y hallar las expresiones de los
funciones de varias variables. vectores que forman el triedro de Frenet.
• Entender la significación geométrica de los con-
• Calcular las ecuaciones de los planos osculador,
ceptos derivada direccional y gradiente.
normal y rectificante a una curva.
• Calcular extremos relativos y condicionados de
funciones de varias variables en casos sencillos. • Entender el concepto de superficie parametrizada
regular.
• Entender el concepto de curva parametrizada re-
gular.
• Calcular e interpretar gráficamente los coeficien-
• Saber calcular e interpretar las magnitudes curva- tes de la primera y de la segunda forma funda-
tura y torsión de una curva. mental, ası́ como la curvatura de Gauss.
donde x(t), y(t) y z(t) son funciones reales de variable real t, se dice que es una función vectorial en t.
Se puede generalizar el concepto de lı́mite de funciones reales de variable real a las funciones vectoriales de una
variable, sin más que consideremos
−
→
lim F (t) = ( lim x(t), lim y(t), lim z(t)).
x→a x→a x→a x→a
C ÁLCULO DIFERENCIAL EN VARIAS VARIABLES 171
−
→
Ejemplo. Sea F (t) = (sen2 t, ln t, arctan(3t)), entonces
−
→0
1 3
F (t) = 2 sen t cos t, , ,
t 1 + 9t2
−
→
Ejemplo. Sea F (t) = (1, sen(t + 1), et+1 ) y t = g(s) = s2 − 1. En este caso se tiene
−
→ −→
dF d F dt 2
= = 0, cos(t + 1), et+1 .2s = 0, 2s cos s2 , 2ses .
ds dt ds
Esta expresión también la habrı́amos podido haber obtenido sustituyendo t = s2 − 1 y derivando respecto de s. 2
Por aplicación directa de las propiedades de funciones reales de variable real, podemos deducir que la derivada
de la suma de dos funciones vectoriales es la suma de las derivadas. No es difı́cil deducir de igual forma (ver
bibliografı́a recomendada) el comportamiento de la derivada para las otras operaciones que se pueden realizar con
−
→ −
→
los vectores de R3 , el producto escalar y el producto vectorial. Si F (t) y G (t) son funciones derivables, se
tiene:
−→ − → 0 → −
− →0 −→0 −
→
• ( F (t). G (t)) = F (t).G (t) + F (t). G (t) (Observa que en virtud de la simetrı́a del producto escalar
no existe ningún problema en cambiar el orden de las funciones vectoriales que se ven afectadas en los
productos)
−→ −→ 0 −
→ −
→0 −
→0 −
→
• ( F (t) × G (t)) = F (t) × G (t) + F (t) × G (t) (Observa que en esta ocasión es fundamental el orden
de las funciones en los productos vectoriales)
−
→ −
→ −→ − → 0
Ejemplo. Dadas las funciones F (t) = (3t2 + 1, sen t, 0) y G (t) = (cos t, 0, et ) vamos a calcular ( F (t). G (t))
−→ −
→ 0
y ( F (t) × G (t)) . Veamos:
−→ − → 0 → −
− →0 −
→0 −
→
( F (t). G (t)) = F (t).G (t) + F (t). G (t)
= (3t2 + 1, sen t, 0).(− sen t, 0, et ) + (6t, cos t, 0).(cos t, 0, et )
= −(3t2 + 1) sen t + 6t cos t
172 MATEM ÁTICAS
−→ −
→ 0 −
→ −
→0 −
→0 −
→
( F (t) × G (t)) = F (t) × G (t) + F (t) × G (t)
− → → −
− → − → −
→ −
→
i j k i j k
2
= 3t + 1 sen t 0 + 6t cos t 0
− sen t 0 et cos t 0 et
= ((sen t + cos t)et , −(3t2 + 6t + 1)et , sen2 t − cos2 t).
2
Comprobar que estos resultados coinciden con los que se obtienen realizando antes los productos (escalar o
vectorial) y después derivando el resultado.
En muchas ocasiones los valores de las funciones que aparecen sometidas a estudio están determinados por valores
que dependen de más de una variable.
Supongamos D una colección de n-uplas de números reales. Una función f con dominio D es una regla que asigna
a cada (x1 , x2 , ..., xn ) ∈ D un número z = f (x1 , x2 , ..., xn ). El rango de la función es el conjunto de valores
que toma z. A z se le denomina variable dependiente y a x1 , x2 , ..., xn se les llama variables independientes.
p
Ejemplo. El dominio de la función f (x, y) = y − x2 es D = (x, y) ∈ R2 y > x2 y el rango viene dado por
Rango(f ) = [0, +∞). 2
Primero veamos el caso para funciones de dos variables. El lı́mite de f (x, y) cuando (x, y) → (x0 , y0 ) es el
número real L si para cada ε > 0 existe un δ > 0 tal que para todos los puntos (x, y) sucede una de las dos
siguientes situaciones equivalentes:
p
• 0< (x − x0 )2 + (y − y0 )2 < δ =⇒ |f (x, y) − L| < ε
Si los lı́mites
lim f (x, y) y lim g(x, y)
(x,y)→(x0 ,y0 ) (x,y)→(x0 ,y0 )
(1) lim (f (x, y) + g(x, y)) = lim f (x, y)+ lim g(x, y)
(x,y)→(x0 ,y0 ) (x,y)→(x0 ,y0 ) (x,y)→(x0 ,y0 )
(2) lim (f (x, y).g(x, y)) = lim f (x, y). lim g(x, y)
(x,y)→(x0 ,y0 ) (x,y)→(x0 ,y0 ) (x,y)→(x0 ,y0 )
C ÁLCULO DIFERENCIAL EN VARIAS VARIABLES 173
lim f (x, y)
f (x, y) (x,y)→(x0 ,y0 )
(4) lim = siempre que lim g(x, y) 6= 0
(x,y)→(x0 ,y0 ) g(x, y) lim g(x, y) (x,y)→(x0 ,y0 )
(x,y)→(x0 ,y0 )
Observación. El lı́mite de una función puede no existir. Al igual que cuando asegurábamos la existencia de los
lı́mites de funciones de una variable real decı́amos que debı́an coincidir los lı́mites laterales (las dos aproxima-
ciones posibles al punto al que se tendı́a en la recta real), en nuestro caso al movernos en R2 aseguramos con
la existencia del lı́mite la coincidencia de los lı́mites sobre cualquiera de las infinitas aproximaciones al punto
(x0 , y0 ) que pudiéramos tomar en el plano. Lo que dicho de otra forma quiere decir que si encontramos dos o
más aproximaciones al punto (x0 , y0 ) que obtengan valores distintos para el lı́mite, estarı́amos demostrando que
el lı́mite lim f (x, y) no existe.
(x,y)→(x0 ,y0 )
Es una consecuencia de las propiedades de los lı́mites que la suma, producto y cociente de funciones continuas es
otra función continua y esto también sucede para la composición de funciones.
Ejemplo. La función ( xy
si (x, y) 6= (0, 0)
f (x, y) = x2 + y2
0 si (x, y) = (0, 0)
2
es continua en cualquier punto de R excepto en (0, 0). Puedes comprobar que no es continua en (0, 0) aproxi-
mándote por caminos diferentes al origen (0, 0) (las recta y = mx para diferentes valores de m) y observar que
dan lı́mites distintos. 2
Observación. Todos los conceptos y propiedades introducidos anteriormente para funciones de dos variables,
son fácilmente extensibles a un número de variables genérico n. Basta tener en cuenta la definición de lı́mite de
174 MATEM ÁTICAS
f (x1 , ..., xn ) cuando (x1 , ..., xn ) → (a1 , ..., an ) como el número real L cumpliendo que para cada ε > 0 existe
un δ > 0 tal que para todos los puntos (x1 , ..., xn ) :
p
0 < (x1 − a1 )2 + · · · + (xn − an )2 < δ =⇒ |f (x1 , x2 , ..., xn ) − L| < ε
Consideremos z = f (x, y) una función real de dos variables reales. Denominaremos derivada parcial de f
respecto de x en el punto (a, b) a la derivada en x = a de la función de una variable f (x, b). Es decir,
(1) Como ocurre con las funciones reales de variable real, las derivadas parciales de z = f (x, y) respecto de x
y respecto de y se pueden calcular para diversos puntos (x, y), dando lugar por tanto a dos nuevas funciones
de dos variables reales.
(2) Por las definiciones introducidas anteriormente resulta inmediato que las reglas de derivación establecidas
para funciones reales de una variable real serán aplicables a las derivadas parciales de funciones de dos
variables.
2
Ejemplo. Si consideramos la función f (x, y) = x2 y 3 + ex y se puede comprobar fácilmente que
∂f 2
(x, y) = 2xy 3 + 2xex y,
∂x
∂f 2
(x, y) = 3x2 y 2 + ex .
∂y
2
Sea z = f (x, y) y consideremos fx (a, b), fy (a, b). La superficie z = f (x, y) la cortamos por el plano Π : x = a
y obtenemos una curva γ cuya ecuación referida a los ejes O 0 Y 0 y O 0 Z 0 es z = f (a, y) (donde O 0 es el nuevo
origen con coordenadas (a, 0, 0) y O 0 Y 0 ,O 0 Z 0 son ejes paralelos respectivamente a OY y OZ pasando por O 0 ).
La recta tangente a la curva γ en el punto P (a, b, c), donde c = f (a, b), está contenida en el plano x = a y tiene
por ecuación
z − c = fy (a, b)(y − b)
C ÁLCULO DIFERENCIAL EN VARIAS VARIABLES 175
respecto a los ejes O 0 Y 0 y O 0 Z 0 y referida al espacio es la recta determinada por intersección de los planos x = a
y z − f (a, b) = fy (a, b)(y − b).
El plano de ecuación
∂f ∂f
z − f (a, b) = (a, b)(x − a) + (a, b)(y − b)
∂x ∂y
contiene a las rectas tangentes anteriores. Cada recta tangente a una curva de la superficie se dice tangente a
la superficie. El plano que contiene a toda las rectas tangentes a la superficie en un punto se denomina plano
tangente a la superficie en ese punto. En el caso de que exista, el plano tangente en el punto P (a, b, f (a, b))
viene determinado por la ecuación anterior.
p
Ejemplo. Dada la función f (x, y) = 3 − x2 − y 2 la ecuación del plano tangente a la superficie que determina
(una esfera) en el punto P (1, 1, 1) vendrı́a expresada por z − 1 = fx (1, 1)(x − 1) + fy (1, 1)(y − 1). Simplificando
obtenemos z = −x − y + 3. 2
¿Qué sucede cuando intentamos derivar la composición de funciones de varias variables? La variedad de casos a
los que podemos enfrentarnos puede ser amplia y es conveniente que tratemos el problema de forma gradual.
Si z = f (x, y) tiene derivadas parciales continuas fx y fy y si x = x(t), y = y(t) son funciones derivables en t,
entonces la función compuesta z = f (x(t), y(t)) es derivable como función de t y cumple
df ∂f dx ∂f dy
= + .
dt ∂x dt ∂x dt
176 MATEM ÁTICAS
Ejemplo. Sea f (x, y) = xy , con x = cos t e y = sen t. En estas condiciones se obtiene aplicando la regla de la
cadena
df ∂f dx ∂f dy
= + = (sen t)(− sen t) + (cos t)(cos t) = cos2 t − sen2 t = cos 2t.
dt ∂x dt ∂x dt
Puedes obtener también este resultado sustituyendo x e y y derivando la expresión resultante respecto de t. 2
(1) Sea w = f (x, y, z) una función de tres variables con derivadas parciales continuas, y además x = x(t),
y = y(t), z = z(t) son funciones derivables en t. ¿Cuál serı́a de la regla de la cadena para dfdt ? ¿Y si
tuvieramos una función de cuatro variables? Generaliza el resultado a n variables.
(2) Aplicar las conclusiones anteriores para calcular dw
dt si w = xy + z con x = cos t , y = sen t y z = t. (La
curva sobre la que calculamos la derivada es una hélice).
Consideremos z = f (x1 , x2 , ..., xn ) una función de n variables con todas sus derivadas parciales continuas y
consideremos a su vez
x1 = ϕ1 (u1 , u2 , ..., um ),
x2 = ϕ2 (u1 , u2 , ..., um ),
.. .
. = ..
xn = ϕn (u1 , u2 , ..., um )
funciones de m variables con todas sus derivadas parciales también continuas. En estas condiciones podemos
expresar:
∂f ∂f ∂x ∂f ∂x2 ∂f ∂xn
= + + ... +
∂u1 ∂x1 ∂u1 ∂x2 ∂u1 ∂xn ∂u1
.. .
. = ..
∂f ∂f ∂x ∂f ∂x2 ∂f ∂xn
= + + ... +
∂um ∂x1 ∂um ∂x2 ∂um ∂xn ∂um
C ÁLCULO DIFERENCIAL EN VARIAS VARIABLES 177
Sea y = f (x) una función continua definida implı́citamente por la ecuación F (x, y) = 0, donde F , Fx y Fy son
funciones continuas, además con Fy (x, y) 6= 0. Entonces se cumple que
∂F
dy
= − ∂F
∂x
.
dx ∂y
Puedes intentar deducir este resultado derivando respecto de x (aplicando la regla de la cadena) en la ecuación
F (x, y) = 0.
La expresión de derivación de una función implı́cita se puede hacer extensiva para un número mayor de variables,
razonando de forma similar.
Ejemplo. Vamos a calcular la derivada en los puntos que correspondan al valor x = 1 de la función definida por
la ecuación y 3 − 3xy + 2x3 = 0. Si sustituimos x = 1 en la ecuación, obtenemos que los puntos para los que hay
que evaluar la derivada son (1, 1) y (1, −2). Para aplicar el resultado anterior basta con calcular Fx = −3y + 6x2
y Fy = 3y 2 − 3x. Particularizando en los puntos que sometemos a estudio obtenemos Fx (1, 1) = 3, Fy (1, 1) = 0,
Fx (1, −2) = 12, Fy (1, −2) = 9. De aquı́ deducimos que dx dy
(1, 1) no se puede hallar y por otro lado se tiene
∂x (1, −2)
∂F
dy 4
(1, −2) = − ∂F =−
dx ∂y (1, −2) 3
2
Ejemplo. Supongamos que la superficie dada por la ecuación F (x, y, z) = 0 define implı́citamente a la función
z = f (x, y). La ecuación del plano tangente a la mencionada superficie en el punto (a, b, c) vendrı́a expresado
por
∂f ∂f
z−c= (a, b)(x − a) + (a, b)(y − b).
∂x ∂y
Ahora bien, aplicando la regla de derivación para funciones implı́citas se tiene:
∂F ∂F
dz dz ∂y
= − ∂F
∂x
, = − ∂F
dx ∂z
dy ∂z
Sustituyendo en la ecuación del plano tangente y simplificando (quitando los denominadores Fz ) obtenemos
finalmente
∂F ∂F ∂F
(a, b, c)(x − a) + (a, b, c)(y − b) + (a, b, c)(z − c) = 0.
∂x ∂y ∂z
Expresión de la ecuación del plano tangente a una superficie que no hace referencia explı́cita de la función que la
define. 2
Sea la superficie z = f (x, y) y supongamos que las derivadas parciales fx y fy son continuas.
Consideremos el plano Π que pasa por los puntos (a, b, 0) y (x, y, 0) y es perpendicular al plano z = 0. Este plano
tiene de ecuación y − b = tan θ(x − a) o bien, en forma paramétrica
x = a + t cos θ
Π:
y = b + t sen θ
178 MATEM ÁTICAS
Es decir, z = f (a + t cos θ, b + t sen θ). Consideremos en el plano Π el nuevo sistema de ejes coordenados
O 0 T 0 Z 0 , donde O 0 (a, b, 0), O 0 T 0 es la intersección de plano Π con el plano z = 0, y el eje O 0 Z 0 es paralelo
al eje OZ pasando por el punto O 0 . En el plano Π, podemos estudiar la pendiente de la recta tangente a γ e el
punto P (a, b, c) respecto del eje O 0 T 0 , que coincide con la derivada respecto de t, es decir, aplicando la regla de
la cadena se tiene:
dz ∂f dx ∂f dy ∂f ∂f
= + = (a, b) cos θ + (a, b) sen θ
dt ∂x dt ∂y dt ∂x ∂y
La recta que pasa por el punto P (a, b, c) y tiene esta pendiente es la recta tangente a γ en el punto P . Esta recta
tangente tiene por ecuaciones paramétricas respecto a OXY Z:
x = a + t cos θ
y = b + t sen θ
z = c + ( ∂f
∂x (a, b) cos θ +
∂f
∂y (a, b) sen θ)t
∂f ∂f
z−c= (a, b)(x − a) + (a, b)(y − b).
∂x ∂y
A la expresión fx (a, b) cos θ + fy (a, b) sen θ se le llama derivada direccional de f (x, y) en (a, b) según la
−
→ −
→ −
→
dirección θ y se denota por fθ o por D−→u f donde u = cos θ i + sen θ j .
La derivada de f (x, y) en (a, b) según la dirección θ, es la pendiente de la recta tangente a la curva resultante de
la intersección de la superficie z = f (x, y) con el plano de ecuación y − b = tan θ(x − a) . A veces también se
dice de la derivada direccional que es el ritmo al que cambia f (x, y) cuando nos movemos desde el punto (a, b)
en la dirección que forma un ángulo θ con el eje OX.
Es importante que observes lo que sucede cuando θ = 0 y θ = π2 . Aplica la definición y comprueba que en estos
casos las mencionadas derivadas direccionales coinciden con las derivadas parciales.
Ejemplo. Vamos a calcular la derivada de f (x, y) = x2 y 3 en el punto (1, 2) en la dirección determinada por el
ángulo π/3. Para ello calcularemos primero las derivadas parciales fx = 2xy 3 fy = 3x2 y 2 . Particularizándolas
√ nos piden se tiene fx (1, 2) = 16 y fy (1, 2)√= 12. Habida cuenta que cos(π/3) = 1/2 y
en el punto que
sen(π/3) = 3/2, obtenemos finalmente D− →u f (1, 2) = 8 + 6 3. 2
La expresión
∂f ∂f
D−
→
u f (a, b) = (a, b) cos θ + (a, b) sen θ
∂x ∂y
se puede ver como el resultado del producto escalar de los vectores
−
→ −
→ −
→ ∂f −
→ ∂f −
→
u = cos θ i + sen θ j y (a, b) i + (a, b) j .
∂x ∂y
A este último vector se le denomina gradiente de f en (a, b) denotándose por ∇f (a, b).
−
→ −
→
En definitiva, si z = f (x, y) tiene derivadas parciales continuas fx , fy y −
→
u = cos θ i + sen θ j entonces se
cumple
−
→
D− u f = ∇f. u .
→
−
→ −
→
Por definición del producto escalar de dos vectores, tenemos D− →u f = ∇f. u = |∇f | . | u | cos α donde α es el
−
→ −→
ángulo que forman los vectores∇f y u . Pero | u | = 1 y de aquı́ deducimos D− → f = |∇f | . cos α , esto nos
u
C ÁLCULO DIFERENCIAL EN VARIAS VARIABLES 179
Ejemplo. Dada la función f (x, y) = x2 y 3 ¿cuál es la mayor derivada direccional en (2, 3) y en que dirección
se obtiene esta derivada direccional máxima? La respuesta a esta pregunta la tiene el vector gradiente. Puedes
−
→ −
→
comprobar que ∇f (2, 3) = 108 i + 108 j y por tanto el valor de la máxima derivada direccional es |∇f | =
√ −
→
108 2 y este valor se alcanza para la dirección que marca el gradiente, que serı́a en este caso −
→
u = cos(π/4) i +
−→
sen(π/4) j . 2
Ejemplo. Una interpretación igualmente gráfica como curiosa del significado del gradiente lo da el siguiente
ejemplo. Supongamos una montaña sobre el plano XY . La altitud de la superficie sobre el punto (x, y) la
denotaremos por z = f (x, y). La derivada direccional indica el ritmo al cual cambia la altitud por unidad de
cambio en distancia horizontal. El gradiente ∇f (a, b) apunta a la dirección que un montañero deberı́a seguir si
desea escalar en la dirección de mayor pendiente. El módulo |∇f | indica la mayor pendiente disponible. 2
Sea z = f (x, y), llamaremos derivada parcial segunda (o de segundo orden) de f respecto de x dos veces a la
derivada respecto de x de la derivada parcial primera respecto de x, es decir,
fx (x + h, y) − fx (x, y)
lim
h→0 h
∂ ∂f ∂ z2 ∂2f
denotándose por zxx , fxx , ∂x ( ∂x ), ∂x2 o ∂x2 .
Análogamente llamaremos derivada parcial segunda (o de segundo orden) de f respecto de y dos veces a la
derivada respecto de y de la derivada parcial primera respecto de y:
fy (x, y + h) − fy (x, y)
lim
h→0 h
∂ ∂f ∂2z ∂2f
denotándose por zyy , fyy , ∂y ( ∂y ), ∂y 2 o ∂y 2 .
Sea z = f (x, y) una función tal que existen fx , fy y fxy en un entorno U del punto (a, b) y son continuas en
(a, b), entonces existe fyx (a, b) y además fxy (a, b) = fyx (a, b).
Para la función z = f (x, y) hemos visto las cuatro derivadas segundas fxx , fyx , fxy , fyy , aunque ya sabemos
que bajo las hipótesis del Teorema de Schwartz las derivadas mixtas coinciden. Siguiendo este proceso podemos
definir las derivadas terceras fxxx , fxyx , fxxy , fxyy , fyxx , fyyx , fyxy y fyyy aunque sólo hay 4 distintas bajo las
hipótesis del Teorema de Schwartz. En general existen 2p derivadas de orden p , pero sólo p + 1 son distintas bajo
las hipótesis del mencionado teorema:
∂pf ∂pf ∂pf ∂pf ∂pf
, , , ...., y
∂xp ∂y∂xp−1 ∂y 2 ∂xp−2 ∂y p−1 ∂x ∂y p
Consideremos f : A ⊂ R2 → R una función de dos variables con valores reales, con dominio de definición en
A, que habitualmente denotamos como z = f (x, y). Consideraremos a continuación el problema de maximizar o
minimizar a la mencionada función en A.
Si existe un punto (x0 , y0 ) ∈ A tal que f (x0 , y0 ) > f (x, y ) para todo (x, y) ∈ A, entonces diremos que f tiene
un máximo absoluto en A.
Análogamente definimos el concepto de mı́nimo absoluto sin más que exigir ahora que f (x0 , y0 ) 6 f (x, y ) para
todos los puntos de A.
No siempre existe un punto en el dominio de la función que cumpla las caracterı́sticas anteriores. De hecho hay
que buscar un cierto tipo de subconjuntos de R2 que aseguran la existencia de máximos y mı́nimos absolutos, son
los llamados conjuntos compactos.
Recordemos primero (ver Capı́tulo 2 y bibliografı́a recomendada) que para funciones reales de una variable real
se define la noción de extremo relativo como un punto x0 del dominio de la función para el que existe un entorno
(puntos suficientemente próximos al valor x0 ) tal que para cualquier punto de ese entorno se cumple la condición
de máximo o mı́nimo absoluto descrita con anterioridad. Es decir hacemos un estudio “local”, entendiendo por
ello las proximidades del punto sometido a estudio.
¿Qué procederı́a hacer ahora para una función de R2 , z = f (x, y)? ¿Cómo se introducen el concepto de entorno
y de proximidad en el plano?
Las respuestas a estas dos cuestiones la hemos estudiado ya al introducir la definición de lı́mite para funciones
2
de varias variables. Debeisp recordar que el concepto de distancia entre dos puntos de R puede definirse como
2 2
d((x0 , y0 ), (x1 , y1 )) = (x1 − x0 ) + (y1 − y0 ) . Ası́ los puntos que distan
2
p menos que δ de un punto (x0 , y0 ) ∈
R , vienen expresado por los puntos (x, y) que satisfagan la inecuación (x − x0 )2 + (y − y0 )2 < δ.
¿Cómo piensas que se representarı́a graficamente esta situación en el plano? ¿Qué es ahora gráficamente un
entorno de (x0 , y0 )?
Pues bien, ahora estamos en condiciones de definir el concepto de máximo relativo (resp. mı́nimo relati-
vo) como un punto (x0 , y0 ) ∈ A tal que exista un δ > 0 verificando que para todo (x, y) ∈ A que cumpla
p
(x − x0 )2 + (y − y0 )2 < δ se tiene f (x0 , y0 ) > f (x, y) (resp. f (x0 , y0 ) 6 f (x, y)).
¿Cómo definirı́as los conceptos de máximo y mı́nimo relativo para una función de tres variables w = f (x, y, z)?
Observa que el concepto ahora depende de la definición de distancia entre dos puntos en R3 , que vendrı́a dado por
p
d((x0 , y0 , z0 ), (x1 , y1 , z1 )) = (x1 − x0 )2 + (y1 − y0 )2 + (z1 − z0 )2 .
C ÁLCULO DIFERENCIAL EN VARIAS VARIABLES 181
Puedes completar, consultando la bibliografı́a recomendada, la definición de máximo y mı́nimo de una función
w = f (x, y, z).
Para completar el estudio, ¿como piensas que se puede definir una distancia en Rn ? ¿Cómo definirı́as los con-
ceptos de máximo y mı́nimo relativos para una función de n variables w = f (x1 , x2 , ..., xn )?
Condición necesaria para la existencia de extremo: Sea w = f (x1 , x2 , ..., xn ) una función que cumple que
todas sus derivadas parciales son continuas. Si tiene un máximo o un mı́nimo relativo en un punto de su dominio
entonces las n derivadas parciales de f particularizadas en dicho punto deben ser todas iguales a cero.
Esto es, para una función z = f (x, y) se traduce en que si existe un máximo o mı́nimo relativo (extremo relativo)
en (x0 , y0 ) entonces
∂f ∂f
(x0 , y0 ) = 0 y (x0 , y0 ) = 0.
∂x ∂y
Recuerda que en funciones de una variable la condición de derivada nula venı́a a indicar la existencia de recta
tangente paralela al eje OX. Evidentemente la tradución al caso de funciones de dos variables (superficies)
vendrı́a dada por la existencia del plano tangente paralelo al plano XY .
Al igual que ocurrı́a en funciones de una variable, el recı́proco de este resultado no se cumple.
Ejemplo. Consideremos la función f (x, y) = (y − x2 )(y − 2x2 ). Se puede comprobar fácilmente que se cumple
fx (0, 0) = 0 y fy (0, 0) = 0. Ahora bien f (0, 0) = 0, pero la función toma tanto valores positivos como negativos
en cada entorno de (0, 0). ¿Cómo probarı́as esta última afirmación? 2
Dada una función w = f (x1 , x2 , ..., xn ) con derivadas parciales continuas, diremos que un punto de su dominio
es estacionario o crı́tico si todas las derivadas parciales se anulan en él. O lo que es lo mismo si el vector
gradiente es nulo. Más explı́citamente, para una función de dos variables z = f (x, y), se deberı́a cumplir que
−→
∇f (x0 , y0 ) = 0 .
Es importante, al igual que hacı́amos en el estudio local de funciones de una variable, encontrar condiciones
suficientes que nos garanticen la existencia de extremos relativos, identificando en cada caso si son máximos o
mı́nimos.
Sea z = f (x, y) una función con derivadas parciales de segundo orden fxx , fyx = fxy , fyy continuas en un punto
estacionario (x0 , y0 ) ∈ R2 y consideremos el siguiente determinante
2
∂ f (x , y ) ∂2f ∂2f ∂2f ∂2f
∂x2 0 0 ∂y∂x (x0 , y0 )
∆ = ∂2f 2 = (x 0 , y0 ) (x 0 , y0 ) − ( (x0 , y0 ))2 .
(x 0 , y0 ) ∂ f
2 (x 0 , y0 ) ∂x2 ∂y 2 ∂y∂x
∂y∂x ∂y
(3) Si ∆ < 0, f no tiene ni máximo ni mı́nimo relativo en (x0 , y0 ) (punto de silla, ver Figura 6.2).
Puedes consultar la bibliografı́a recomendada para comprobar que no es demasiado complicado a efectos prácticos,
generalizar este criterio para funciones de n variables, estudiando el signo de una sucesión de determinantes.
y x − 3y = 0. Después aplicamos el criterio de la condición suficiente que hemos descrito con anterioridad,
obteniéndose que
2
∂ f (− 3 , − 1 ) ∂2f 3 1 10 −10
∂x2 5 5 ∂y∂x (− 5 , − 5 ) = 300 > 0.
∆ = ∂2f ∂2f =
(− 3
, − 1
) 2 (− 3
, − 1
) −10 20
∂y∂x 5 5 ∂y 5 5
2
Ejemplo. Dada la función f (x, y) = (x + 1)2 + 3(y − 23 )2 − 21 9 , puedes comprobar siguiendo un procedimiento
análogo al descrito para el ejemplo anterior, que f tiene un mı́nimo en (−1, 23 ). 2
Hemos visto en el epı́grafe anterior cómo se pueden estudiar los extremos relativos de una función z = f (x, y).
Ahora bien, es posible que la ecuación de la superficie esté dada de manera implı́cita, es decir, se pueda dar por
ejemplo con una ecuación g(x, y, z) = 0, de la cual pueda ser muy complicado en la práctica despejar una variable
en función de las otras dos. Incluso podemos complicar todavı́a más la situación si pedimos estudiar los extremos
en los puntos de una curva en el espacio que se puede dar como intersección de dos superficies, que a su vez
vengan expresadas de forma implı́cita por sendas ecuaciones g1 (x, y, z) = 0 y g2 (x, y, z) = 0.
(1) Sea w = f (x, y, z) con derivadas parciales primeras y segundas continuas en un punto (x0 , y0 , z0 ).
(2) Consideremos en la función las siguientes condiciones de ligadura, es decir, condiciones a las que somete-
mos a las variables en la búsqueda de los valores extremos de la función:
En las mismas condiciones descritas anteriormente, buscamos una condición necesaria para que la función f (x, y, z)
tenga un extremo relativo (máximo o mı́nimo) restringido a las siguientes condiciones de ligadura: g1 (x, y, z) = 0,
g2 (x, y, z) = 0, . . . , gm (x, y, z) = 0. Para ello construimos la función
en donde los λi (i = 1...n) se consideran constantes (se conocen con el nombre de multiplicadores de Lagran-
ge).
C ÁLCULO DIFERENCIAL EN VARIAS VARIABLES 183
La condición de Lagrange dice que si el punto (x0 , y0 , z0 ) es un máximo o mı́nimo de la función sometida a
las condiciones de ligadura anteriormente expuestas, entonces es satisface el sistema de las m + 3 ecuaciones
siguientes:
∂L
(x, y, z) = 0,
∂x
∂L
(x, y, z) = 0,
∂y
∂L
(x, y, z) = 0,
∂z
g1 (x, y, z) = 0,
g2 (x, y, z) = 0,
.. ..
. = .
gm (x, y, z) = 0.
Observación. (1) Existe un procedimiento para distinguir cuando tenemos máximos o mı́nimos, pero en general
suele ser más útil el uso de procedimientos intuitivos (preferentemente de tipo geométrico) que nos permitan hacer
tales distinciones.
(2) El método explicado anteriormente como ejemplo para funciones de tres variables, tiene una generalización
clara para n. Bastarı́a considerar ahora m + n ecuaciones construidas de forma análoga a las anteriormente
descritas (ver bibliografı́a recomendada)
x + 2y + 3z = 6,
x + 3y + 9z = 9.
∂L
(x, y, z) = 2x + λ1 + λ2 = 0,
∂x
∂L
(x, y, z) = 2y + 2λ1 + 3λ2 = 0,
∂y
∂L
(x, y, z) = 2z + 3λ1 + 9λ2 = 0,
∂z
x + 2y + 3z = 6,
x + 3y + 9z = 9.
y finalmente
240 78
λ1 = − y λ2 = .
59 59
81 123 9
Para estos valores de los multiplicadores de Lagrange obtenemos el punto P ( 59 , 59 , 59 ) 2
Ejemplo. Puedes usar el método de Lagrange para demostrar que entre todos los paralelepı́pedos de volumen
dado, el que tiene superficie mı́nima es precisamente un cubo. 2
184 MATEM ÁTICAS
−→ −
→ −
→ −→ −
→
Una función vectorial R (t) = x(t) i + y(t) j + z(t) k definida R : I ⊂ R → R3 , donde I es un intervalo
abierto de la recta real, gráficamente describe una curva en el espacio para los distintos valores del parámetro t.
Esta representación paramétrica diremos que es regular cuando tiene las siguientes propiedades:
−
→
(1) R (t) = (x(t), y(t), z(t)) es de clase C 1 (continua y con derivada continua) en el intervalo I.
−→ −→
(2) dR
dt (t) 6= 0 para todo t de I.
Cuando en vez de clase C 1 se exige clase C n (continua y con derivadas sucesivas continuas hasta orden n) se
suele decir que es regular de clase n.
Un ejemplo significativo de una curva parametrizada en el espacio es la llamada hélice circular, cuya parametiza-
ción viene dada por:
−
→
R (t) = (a cos θt, a sen θt, bt), con a, b 6= 0, t ∈ R.
Por semejanza a la interpretación fı́sica que surge del movimiento de una partı́cula en el espacio, representado éste
−
→
por la parametrización de una curva R (t) = (x(t), y(t), z(t)), se define el concepto de velocidad como el vector
−
→
−
→v = ddtR .
A su vez también podemos definir a partir de él, otro vector que mida la variación −
→
v en función del parámetro t.
Lo llamaremos vector aceleración y se define como
−→
−
→ d−
→v d2 R d2 x −
→ d2 y −
→ d2 z −
→
a = = 2
= 2 i + 2 j + 2 k.
dt dt dt dt dt
C ÁLCULO DIFERENCIAL EN VARIAS VARIABLES 185
−
→
La longitud de arco de una curva R (t) = (x(t), y(t), z(t)) entre los valores del parámetro t = a y t = b viene
dada por la siguiente expresión:
Z b Z bp
L= |−
→
v | dt = x0 (t)2 + y 0 (t)2 + z 0 (t)2 dt
a a
−
→
Si elegimos un punto de referencia en la curva P0 = R (t0 ), y notamos la longitud de arco
Z tp
s(t) = x0 (t)2 + y 0 (t)2 + z 0 (t)2 dt
t0
−
→
Ejemplo. Vamos a calcular la longitud de una vuelta de la hélice R (t) = (cos t, sen t, t). Observemos que la
hélice da una vuelta completa cuando t varı́a de 0 a 2π. Ası́, obtenemos que el cálculo corresponde a
Z 2π p Z 2π √ √
(− sen t)2 + (cos t)2 + 12 dt = 2dt = 2π 2,
0 0
√
es decir, la longitud de una vuelta de la hélice es 2 veces la del cı́rculo unidad del plano XY en el que la hélice
se proyecta. 2
−
→
Si consideramos la curva R (t) = (x(t), y(t), z(t)) representada por una parametrización regular y la longitud de
−
→
arco s(t) medida desde un punto de referencia P0 = R (t0 ) y si además dsdt 6= 0 , podemos deducir (derivada de
la función inversa) que
dt 1
= − → .
ds |v|
Esto unido a que
−
→ −→
dR d R dt dt
= =−
→
v.
ds dt ds ds
dt
tomando módulos (no se olvide que ds es una magnitud escalar) se obtiene
− −
d→ →
R d R dt 1
= = |−
→
v| − = 1.
ds dt ds |→v|
−
→ −
→ −→
Llamaremos a ddsR el vector tangente unitario de la curva y lo denotaremos por T (o por T (s) si queremos
especificar el punto de la curva en el que calculamos el vector tangente, haciendo referencia al parámetro arco).
Cuando la parametrización de la curva no está expresada en función del parámetro longitud de arco, la manera
−
→ −
→
v
de calcular T es con la expresión |−
→
v|
.
−
→
Ejemplo. Vamos a calcular el valor del vector T para los puntos de la curva dada por la parametrización
−
→
R (t) = (cos t + t sen t, sen t − t cos t, 0).
Uno de los grandes problemas que plantea la geometrı́a es determinar y cuantificar los elementos que pueden
llevar a distinguir unas figuras de otras. Este problema se puede resolver para curvas lo suficientemente “suaves”
(es decir, con un número suficiente de derivadas sucesivas continuas). Veremos que una curva regular viene
determinada por únicamente dos magnitudes escalares que llamaremos curvatura y torsión.
−
→ −→
Supongamos que R = R (s) , donde s es el parámetro arco, es una curva regular de clase mayor o igual que
−
→ −→ −→ −
→
2. Consideremos ddsT = R00 (s). Al vector ddsT se denomina vector curvatura de la curva en el punto R (s) y
−
→ −
→
κ = ddsT . No es difı́cil demostrar que −
se denota con la expresión −
→ →
κ es un vector ortogonal a T (consecuencia
−→ −
→− →
de que T es un vector unitario y de derivar la expresión T . T = 1). Al módulo del vector curvatura |−
→
κ (s)| lo
−→
llamaremos curvatura de la curva en R (s) y lo denotaremos por κ(s). Llamaremos radio de curvatura a la
1
expresión ρ(s) = κ(s) .
La interpretación de la curvatura es la del valor del cambio de dirección de la tangente respecto de la longitud de
arco. De esta forma, una curva en la que la dirección de la tangente cambie rápidamente en relación con la longitud
de arco, tiene una curvatura grande y por tanto un radio de curvatura pequeño (piensa en una circunferencia de
radio pequeño).
Ejemplo. ¿Cuál será la curvatura y el radio de curvatura de la circunferencia de radio a dada por la parametrización
−
→
R (t) = (a cos t, a sen t, 0)? Veamos:
−
→
dR
= (−a(sen t), a(cos t), 0)
dt
−
→
y de esta forma ddtR = a. Además se tiene
−
→
dR
−
→
T = dt
→ = (− sen t, cos t, 0)
−
ddtR
y por tanto
−
→ −→ −
dT
→
dT
−
→
−
→ dT d T dt 1
κ = = = ds
= dt
−→ = − (cos t, sen t).
ds dt ds ds dR a
dt dt
El vector curvatura siempre está dirigido hacia el origen y la curvatura es constante e igual a 1/a, lo que demuestra
que el radio de curvatura coincide precisamente con el radio de la circunferencia. 2
Siempre que la curva venga parametrizada por algún parámetro t que no sea la longitud de arco se tiene
−
→
dT
−
→
κ = dt
→ .
−
ddtR
C ÁLCULO DIFERENCIAL EN VARIAS VARIABLES 187
Ejemplo. Puedes comprobar que la curvatura en cada punto de la hélice expresada por la parametrización regular
−
→
R (t) = (a cos t, a sen t, bt) con a > 0, b 6= 0 y t ∈ R viene expresada por
−
→
dT
−
→ a
κ = dt
→ = 2
− (− cos t, sen t, 0).
dR a + b2
dt
• Una curva regular de clase mayor o igual que 2 es una recta si y sólo si su curvatura es idénticamente nula.
−
→ − →
• Sea R = R (t) una representación arbitraria de una curva de clase mayor o igual que 2, entonces se tiene
−
→0 −→
R × R00
κ= −
→0 .
R
−→
Siempre y cuando −
→
κ (s) 6= 0 podremos escoger el vector unitario
−
→ −
→
κ (s)
N (s) = −
|→
κ (s)|
−
→
que se denomina vector unitario normal principal a la curva en el punto R (s).
−→ −
→
Observación. A lo largo de una recta −
→
κ (s) = 0 , luego N no estarı́a determinado.
−→
Dado un punto de la curva representado por R (s), llamaremos recta normal principal a la recta que pasa por
−
→
el mencionado punto y tiene como vector director el vector N (s). Llamaremos plano normal al plano que pasa
−
→
por el punto R (s) y es perpendicular a la recta tangente a la curva en ese punto. Plano osculador se llama al que
−
→ −
→ −→
pasa por el punto R (s) y contiene a los vectores N (s) y T (s).
z
C
B
N
x T
B
y
N x
−
→
Ejemplo. Dada la hélice R (t) = (cos t, sen t, t), vamos a calcular la ecuación de la normal principal y el plano
−
→ −
→
osculador en el punto t = π/2. Como − → −
→
κ 6= 0 para todo t se tiene que N = |− κ
→
κ|
= (− cos t, sen t, 0). La
ecuación de la normal principal vendrı́a dada por
x = 0
y = 1 − λ, λ∈R
z = π2
188 MATEM ÁTICAS
es decir,
π
x+z =
2
2
−→ −
→ −
→ −
→ −→ −→ −
→
Consideremos ahora el vector B (s) = T (s) × N (s). Observa que B es continuo y unitario, y que ( T , N , B )
−→
forma una base ortonormal positivamente orientada. B (s) recibe el nombre de vector unitario binormal a la
−
→ −→ −
→ −
→
curva en el punto R (s). ( T (s), N (s), B (s)) recibe el nombre de triedro de Frenet o triedro móvil.
Recta binormal
B
Plano normal
Plano rectificante
x N Recta normal
Plano osculador
T
Recta tangente
−
→ −
→ − →
Llamaremos plano rectificante al plano que pasa por el punto R (s) y contiene a los vectores B y T .
−
→ − →
Observa que el plano normal es el que contiene a los vectores B y N .
−
→
Ejemplo. Dada la hélice R (t) = (a cos t, a sen t, bt), puedes comprobar que el plano rectificante a la curva en el
punto correpondiente a t = π2 tiene como ecuación y = a. 2
−
→ − → −
→
Consideremos que R = R (s) es una curva regular de clase mayor o igual a 3 y que a lo largo de ella N (s) es de
−
→ −
→ −
→
clase C 1 . B (s) = T (s) × N (s), derivando esta expresión obtenemos:
−
→ −
→ −
→ −
→ −
→ −
→ −
→
B 0 (s) = T 0 (s) × N (s) + T (s) × N 0 (s)
= T (s) × N 0 (s) (∗)
−
→0 −
→ −→ → −
− →0
ya que T (s) y N (s) son proporcionales. Se tiene además que N = 1 y por tanto N y N son ortogonales y
−
→
por esta razón N 0 serı́a paralelo al plano rectificante y de aquı́
−
→ −→ −→
N 0 (s) = λ(s) T (s) + τ (s) B (s).
Sustituyendo esta expresión en (∗) y operando (con algunas consideraciones que se dejan al lector) se llega final-
mente a −
→ −
→
B 0 (s) = −τ (s). N (s) (∗∗)
−
→
A la función continua τ (s) se denomina torsión de la curva en R (s).
C ÁLCULO DIFERENCIAL EN VARIAS VARIABLES 189
−
→ −
→ −→
Si multiplicamos (∗∗) escalarmente por N se obtiene τ (s) = −B 0 (s). N (s), expresión del valor de la torsión en
un punto.
−
→
Ejemplo. Dada la hélice R (t) = (a cos t, a sen t, bt), se tiene
−
→ b sen t −b cos t a
B = √ ,√ ,√ .
2
a +b 2 2
a +b 2 a + b2
2
−
→ −→
Luego τ (s) = −B 0 (s). N (s) = b
a2 +b2 , lo que demuestra que la torsión en esta curva es siempre constante. 2
Propiedades.
−
→
• Si una curva es regular de clase mayor o igual que 3 y a lo largo de ella N es de clase C 1 , entonces se
tratará de una curva plana si y sólo si su torsión es idénticamente nula.
−
→ − → −→
• En un punto de la curva R = R (t) en el que −
→
κ 6= 0 se tiene
−→ − → −→
det(R0 , R00 , R000 )
τ= − →2
→0 −
R × R00
está contenida en un plano sin más que comprobar que su torsión es 0 en cualquier punto. 2
−
→
Ejemplo. Para la curva R (t) = (t − sen t, 1 − cos t, t) el valor de la curvatura y la torsión en el punto t = 0 es
κ(0) = 1 y τ (0) = 1 (Compruébalo). 2
El concepto intuitivo de superficie parametrizada es el de un conjunto de puntos del espacio que es parecido a una
−
→
porción de plano en un entorno de cada uno de ellos. Esto sucede cuando existe una aplicación X : U ⊂ R. → R3 ,
−
→
definida por X (u, v) = (x(u, v), y(u, v), z(u, v)) que es lo suficientemente regular.
190 MATEM ÁTICAS
−
→
Suponemos en principio que X es por lo menos de clase C 1 . Además para asegurarnos de que en todo punto
existe un plano tangente, supondremos que
∂x ∂x
−
→ −
→
∂u
∂y
∂v
∂y ∂X ∂X −→
rango ∂u ∂v = 2 ⇐⇒ × 6= 0 ,
∂z ∂z ∂u ∂v
∂x ∂y
donde consideramos
→
− →
−
∂X ∂x ∂y ∂z ∂X ∂x ∂y ∂z
= , , y = , , .
∂u ∂u ∂u ∂u ∂v ∂v ∂v ∂v
Habitualmente notaremos
−
→ −
→ −→ −→
−
→ ∂X −
→ ∂X −
→ ∂2 X −
→ ∂2 X
Xu = , Xv = , X uu = , X uv =
∂u ∂v ∂u2 ∂v∂u
y ası́ sucesivamente.
→ −
− → −
→ −
→ −→
Observa que los vectores X u y X v forman una base del plano tangente siempre y cuando X u × X v 6= 0 y que
−→ −
→
−
→ X u (u, v) × X v (u, v)
N (u, v) = −
→ −
→
X u (u, v) × X v (u, v)
−
→
representa un vector normal unitario en cada punto de la superficie. Decimos que X : U ⊂ R. → R3 es una
parametrización regular de clase C m de la superficie S si y sólo si:
−
→
(1) X ∈ C m (U ), m > 1.
−
→ −
→ −→
(2) X u × X v 6= 0 para todo (u, v) ∈ U .
Ejemplo. Vamos a hallar las ecuaciones del plano tangente y de la recta normal a la superficie representada por
−
→ −→ −
→
X (u, v) = (u, v, u2 − v 2 ) en el punto correspondiente a u = 1, v = 1. Veamos, X (1, 1) = (1, 1, 0), X u (1, 1) =
−
→
(1, 0, 2) y X v (1, 1) = (0, 1, −2). La ecuación del plano tangente vendrı́a dada por
x−1 y−1 z
1 0 2 = 0,
0 1 −2
y la ecuación de la recta normal, habida cuenta que el vector normal unitario al plano en el punto en cuestión viene
dado por:
−→ −
→
−
→ X u (1, 1) × X v (1, 1) 1
N = − → −
→ = (−2, 2, 1),
X u (1, 1) × X v (1, 1) 3
2
C ÁLCULO DIFERENCIAL EN VARIAS VARIABLES 191
Los coeficientes de la primera forma fundamental vienen dados por las siguientes expresiones:
−
→ −→ − 2
→
E(u, v) = X u (u, v). X u (u, v) = X u (u, v)
−
→ −→
F (u, v) = X u (u, v). X v (u, v)
−
→ −→ − 2
→
G(u, v) = X v (u, v). X v (u, v) = X v (u, v)
E(u, v) = 2 + v 2
F (u, v) = vu
G(u, v) = 2 + u2
2
Observemos que
−
→ −
→ E F
X u (u, v) × X v (u, v) = EG − F =
2
F G
y por tanto
−→ −
→
−
→ X u (u, v) × X v (u, v) 1 −→ −
→
N (u, v) = − = √ ( X u × X v ).
→ −
→ − 2
X u (u, v) × X v (u, v) EG F
−
→
Ejemplo. Para la superficie X (u, v) = (u + v, u − v, uv) dada en el ejemplo anterior, se tiene EG − F 2 =
4 + 2v 2 + 2u2 . Observa que el valor de esta cantidad es siempre estrictamente mayor que cero. 2
−
→ − →
Si llamamos θ al ángulo que forman los vectores X u y X v , se tiene
F −→ −
→
cos θ = √ √ ( X u × X v ).
E G
−
→ −
→
Esto quiere decir, entre otras cosas, que en una superficie parametrizada regular, X u y X v son perpendiculares
si y sólo si F = 0.
−→
→ ∂2 X
−
e = N.
∂u2
−→
→ ∂2 X
−
f = N.
∂u∂v
−→
→ ∂2 X
−
g = N.
∂v 2
192 MATEM ÁTICAS
−
→
Se llama curvatura de Gauss de una superficie parametrizada regular, en el punto X (u, v), a la expresión
e f
f g eg − f 2
K= = .
E F EG − F 2
F G
Caso elı́ptico: Se dice que un punto es elı́ptico si K > 0. Viene a expresar que el comportamiento de la función
en las proximidades del punto es el de un paraboloide elı́ptico.
Caso hiperbólico: Se dice que un punto es hiperbólico si K < 0. En este caso existen en el plano tangente dos
rectas distintas que lo dividen en cuatro regiones.
Caso parabólico: Se dice que un punto es parabólico si K = 0 y e2 + f 2 + g 2 6= 0, es decir, los coeficientes e, f
y g no son todos iguales a cero. En este caso nos encontraremos con un cilindro parabólico como se puede
ver en la figura.
Caso plano: Se dice que un punto es plano si e = f = g = 0.
curvatura por tanto siempre constante en todos los puntos de la superficie y que depende sólo del radio de la esfera.
Esto nos indicarı́a que K > 0 (caso elı́ptico), y serı́a más próxima a cero cuanto más grande fuera el radio de la
esfera, es decir, estarı́a más cerca de parecerse a un plano. 2
−
→
(a) F (x) = (xex , ln(3x), 0) y x = ln t
−
→ √
(b) F (x) = (cos( x), arctan x, 1+−1 √ ) y x = t2 + 2t + 1.
x
A.6.4. Considerando diferentes curvas de aproximación, demostrar que las siguientes funciones no tienen lı́mite
cuando (x, y) → (0, 0).
x+y
(a) .
x−y
x2 − y 2
(b) .
x2 + y 2
x
(c) p .
x + y2
2
∂f ∂f
A.6.5. Calcular ∂x y ∂y en los siguientes casos:
x
(a) f (x, y) = e cos y.
p
(b) f (x, y) = 9 − x2 − y 2 .
(c) f (x, y) = ex ln y .
x2 y2
+ + z2 = 1
4 9
√
3
en el punto (1, 0, 2 ).
A.6.8. Suponiendo que las funciones arbitrarias ϕ, ψ son diferenciables un número suficiente de veces, comprobar
las siguientes igualdades:
∂z ∂z
(a) y −x = 0, si z = ϕ(x2 + y 2 ).
∂x ∂y
∂z ∂z y2
(b) x2 − xy + y 2 = 0, si z = 3x + ϕ(xy)
∂x ∂y
A.6.9. Hallar las siguientes derivadas:
∂3w
(a) si w = x ln(xy).
∂x2 ∂y
∂6w
(b) si w = x3 sen y + y 3 sen x.
∂x3 ∂y 3
194 MATEM ÁTICAS
A.6.10. Hallar los extremos relativos de las funciones siguientes (en el caso de que existan):
(a) f (x, y) = y 2 + x2 y + x4 .
(b) f (x, y) = x2 + y 2 + x + y + xy.
(c) f (x, y) = y 2 − x3 .
(d) f (x, y) = x4 + y 4 − 2(x − y).
(ax + by + c)2
(e) f (x, y) = .
x2 + y 2 + 1
A.6.11. Entre todas las cajas de zapatos (sin tapa superior) de volumen dado, hallar la que tiene superficie mı́nima.
A.6.12. Hallar la menor distancia del punto (0, b) del eje OY a la parábola x2 − 4y = 0.
−
→
A.6.13. En cada uno de los siguientes casos, calcular el vector unitario tangente T .
−
→
(a) R (t) = (2 cos t, 2 sen t).
−
→ 3 2
(b) R (t) = ( t3 , t2 ).
−
→
(c) R (t) = (6 sen(2t), 6 cos(2t), 5t) (para t = π).
−
→
(d) R (t) = (et cos t, et sen t, et ) (para t = 0).
−
→
A.6.14. Calcular la longitud de la curva R (t) = (1, t, t2 ) desde el punto (1, 0, 0) al punto (1, 1, 1).
−
→
A.6.15. Calcular la longitud de la curva R (t) = (t, t, 4 − t2 ) desde el punto (0, 0, 4) al punto (1, 1, 3).
−
→
A.6.16. Hallar las ecuaciones de la recta tangente y del plano normal a la curva R (t) = (1 + t, −t2 , 1 + t3 ) en
t = 1.
−
→ 2 3
A.6.17. Hallar el vector curvatura y la curvatura de la curva R (t) = (t, t2 , t3 ).
−
→ −→
A.6.18. Demostrar que una curva de clase > 2 es una recta si R0 (t) y R00 (t) son linealmente dependientes para
todo valor de t.
−
→
A.6.19. Hallar el vector normal principal unitario y el binormal unitario, a lo largo de la curva R (t) = (3t −
t3 , 3t2 , 3t + t3 ).
−
→
A.6.20. Hallar la ecuación del plano osculador de la curva R (t) = (t, t2 , t3 ) en t = 1. ¿Cuál es la ecuación del
plano normal? ¿y la del plano rectificante?
A.6.21. Hallar la curvatura y la torsión en t = 0 de las siguientes curvas:
−
→
(a) R (t) = (t − sen t, 1 − cos t, t).
−
→ 1−t2
(b) R (t) = (t, 1+t
t , t ).
es parabólico si y sólo si la superficie es un cilindro circular (f (t) = a), o un cono (f (t) = at + b con
a 6= 0).
C ÁLCULO DIFERENCIAL EN VARIAS VARIABLES 195
4.1. Introducción
La práctica se va a realizar con el programa de cálculo matemático DERIVE for Windows, versión 4.05, de Soft
Warehouse. DERIVE for Windows permite realizar cálculos y manipulaciones matemáticas de carácter general,
lo cual significa que realiza muchas cosas de forma aceptable aunque no tiene la potencia de otros programas
especı́ficos. No obstante, DERIVE for Windows permite realizar todos los cálculos que un usuario medio puede
necesitar.
En esta práctica nos vamos a centrar en el cálculo (diferencial e integral) en varias variables. Veremos cómo
calcular lı́mites de funciones vectoriales y derivadas parciales, determinaremos el gradiente y el laplaciano de
una función, ası́ como la divergencia y el rotacional de un campo. Daremos también algunas aplicaciones en la
Geometrı́a de curvas y superficies, y finalizaremos calculando el potencial de un campo conservativo.
Antes de comenzar la práctica será conveniente que recordemos brevemente la ‘botonera’ de DERIVE for Win-
dows (ver Figura 6.7), ya que simplifica enormemente la introducción de datos y la realización de cálculos. Los
botones permiten realizar las siguientes tareas (de izquierda a derecha): New (abrir una nueva hoja de trabajo),
Open (abrir una hoja de trabajo existente), Save (guardar la sesión de trabajo, Print (imprimir la sesión de tra-
bajo), Remove (eliminar la expresión marcada), Unremove (recuperar la última expresión eliminada), Renumber
(renumerar las expresiones, Author expression (introducir una expresión sencilla), Author vector (introdu-
cir un vector), Author matrix (introducir un vector), Simplify (simplificar), Approximate (calcular un valor
aproximado), Solve (resolver algebraicamente o numéricamente una expresión), Substitute for variables
(realizar una sustitución), Calculate limit (calcular un lı́mite), Calculate derivative (calcular una deriva-
da), Calculate integral (calcular una integral), Calculate sum (calcular una suma), Calculate product
(calcular un producto), 2D-plot window (realizar un gráfico bidimensional) y 3D-plot window (realizar un
gráfico tridimensional).
Figura 6.7: El uso de la ‘botonera’ de DERIVE for Windows nos puede simplificar mucho el trabajo. Otro elemento
interesante es la existencia de ‘teclas calientes’ que nos permiten evitar los menús, con lo que se gana
en rapidez.
Con DERIVE for Windows podemos calcular los lı́mites iterados de funciones de dos o más variables, lo cual
puede ser de utilidad para determinar si una función es continua en un punto. Por ejemplo, supongamos que
queremos determinar los siguientes lı́mites:
p p
lim lim 16 − 4x2 − y 2 lim lim 16 − 4x2 − y 2
y→0 x→0 x→0 y→0
Figura 6.8: Venta del programa que permite calcular lı́mites de funciones de varias variables.
NOTA: Observemos que aunque los lı́mites iterados existan y coincidan, puede que el lı́mite (de ambas
variables simultáneamente) no exista.
arcsin(x/y)
f (x, y) = en (0, 1)
1 + xy
g(x, y, z) = xeyz en (2, −1, 1)
DERIVE for Windows realiza cálculo diferencial vectorial en cualquier sistema de coordenadas ortogonal. Po-
demos calcular gradientes, divergencias y rotacionales en coordenadas cartesianas, polares/cilı́ndricas o esféricas,
siendo las coordenadas cartesianas (también llamadas rectangulares) las que se utilizan por defecto. Los nombres
de las variables cartesianas son x, y, z, aunque podemos utilizar otros.
Derivadas Parciales
El cálculo de las derivadas parciales con DERIVE for Windows es sencillo, pues se sigue el mismo proceso que
para las funciones de una variable. Se seleccionan las opciones Calculus|Differentiate (o bien pulsamos el
botón ∂ ) y nos aparece la ventana de la Figura 6.9. En ella debemos introducir la función que vamos a derivar (por
defecto la que está seleccionada), la Variable respecto de la cual vamos a derivar (por defecto x) y el orden de
diferenciación (por defecto 1). Puede ser interesante almacenar las derivadas parciales en unas nuevas funciones
para poder manipularlas más cómodamente. Para ello, una vez calculada la derivada parcial, seleccionamos las
opciones Declare|Function Definition y nos aparece la ventana de la Figura 6.10. En ella debemos rellenar
el nombre de la nueva función y sus argumentos, que usualmente serán los mismos que los de la función original,
C ÁLCULO DIFERENCIAL EN VARIAS VARIABLES 197
y la definición de la nueva función (debemos recordar que pulsando la tecla de función F3 se copia la lı́nea que
está seleccionada).
Figura 6.9: Venta del programa que permite calcular las derivadas parciales de funciones de varias variables.
Figura 6.10: Venta del programa que permite declarar una función. Existen ventanas similares para declarar el
valor de una variable (constante, vector o matriz).
También es posible calcular las derivadas parciales de orden superior. Para ello sólo es necesario indicar el orden
de derivación en la casilla Order (ver la Figura 6.9).
Cuando f es una función escalar de varias variables (pensemos que está definida en R2 o en R3 ) entonces podemos
198 MATEM ÁTICAS
∇f (x, y) = (fx (x, y), fy (x, y)) o ∇f (x, y, z) = (fx (x, y, z), fy (x, y, z), fz (x, y, z))
GRAD(F(x,y)) ó GRAD(F(x,y,z))
según F sea una función de 2 o 3 variables. Debemos hacer notar que DERIVE for Windows siempre devuelve
un vector de 3 componentes: si la función depende de 2 variables, entonces la tercera componente es cero.
Si las coordenadas cartesianas con las que estamos trabajando no se llaman (x, y, z) o si trabajamos en dimensión
superior a tres, tenemos que indicárselo convenientemente. Por ejemplo, si nuestra función es g(a, b, c, d) =
a2 − b2 + c2 − d2 , entonces su gradiente se calcuları́a escribiendo
GRAD(a^2-b^2+c^2-d^2, [a,b,c,d])
El resultado es (2a,-2b,2c,-2d).
Hasta ahora hemos supuesto que nuestros sistemas de coordenadas (x, y, z) o (a, b, c, d) son ortonormales. Sin
embargo, el gradiente se puede calcular en cualquier sistema de coordenadas (sin ninguna restricción). DERIVE
for Windows, sin embargo, imponen ciertas restricciones: los sistemas de coordenadas deben ser ortogonales.
Si la matriz de la métrica (producto escalar) no es la identidad, entonces también debemos indicarlo cuando
utilicemos la función GRAD. Por ejemplo, supongamos que la matriz métrica del sistema de coordenadas (x, y, z)
fuese (1, 2, 4). Entonces el gradiente de una función f (x, y, z) se calcuları́a mediante el comando
GRAD(f(x,y,z),[[x,y,z],[1,2,4]])
GRAD(f(x1,x2,x3),[[x1,x2,x3],[g1,g2,g3]])
donde (x1,x2,x3) denota el sistema de coordendas ortogonal, (g1,g2,g3) indica la matriz de la métrica y
f(x1,x2,x3) es la función.
Si se carga la utilidad VECTOR.MTH, entonces están disponibles dos sistemas de coordenadas adicionales: las
coordenadas polares/cilı́ndricas y las coordenadas esféricas, cuyas matrices (coordenadas y métrica) están dadas
por
cylindrical := [[r,θ,z],[1,r,1]]
spherical := [[r,θ,Φ],[1,r SIN(Φ),r]]
Observación : Todos los operadores diferenciales vectoriales admiten un segundo argumento opcional consisten-
te en una matriz de dos filas: la primera fila representa el sistema de coordenadas y la segunda fila indica los
elementos de la métrica.
Un campo vectorial F se dice que es conservativo si existe alguna función diferenciable f tal que F = GRAD(f ).
La función f se llama una función potencial de F . Un criterio de campo vectorial conservativo en el plano es el
siguiente. El campo F (x, y) = (M (x, y), N (x, y)) es conservativo si, y sólo si,
∂N ∂M
=
∂x ∂y
DIF(M(x,y),y)-DIF(N(x,y),x)
El campo será conservativo si, y sólo si, la anterior expresión vale cero.
La divergencia de un campo
DIV([f1(x,y,x),f2(x,y,z),f3(x,y,z)]
donde [f1,f2,f3] es el vector de componentes del campo. Por ejemplo, DIV([y 2 z 3 , 2xyz 3 , 3xy 2 z 2 ]) da como
resultado x(6y 2 z + 2z 3 ).
Si queremos calcular la divergencia de un campo en el plano, debemos añadirle una tercera componente constante
(por ejemplo, cero) y calcular la divergencia del nuevo campo. Sea el campo G = (f (x, y), g(x, y)) definido en
el plano. Su divergencia se calcuları́a de la siguiente manera:
Ejercicio. Calcular la divergencia de los siguientes campos planos: (x2 y, y 2 − x), (xy, x3 − y 3 ).
200 MATEM ÁTICAS
El rotacional de un vector
El rotacional de un campo F (x, y, z) = (M (x, y, z), N (x, y, z), P (x, y, z)) es el campo
Para calcular el rotacional con DERIVE for Windows debemos utilizar la siguiente función:
CURL([f(x,y,z),g(x,y,z),h(x,y,z)])
Un criterio para campos conservativos en el espacio es el siguiente. Un campo vectorial F = (M, N, P ), donde
M , N y P son funciones de clase C 1 (es decir, con derivadas parciales primeras continuas) es conservativo si, y
sólo si, rotF (x, y, z) = 0.
Para calcular el laplaciano con DERIVE for Windows debemos utilizar la siguiente función:
LAPLACIAN(f(x,y,z))
Sea R(t) = (x(t), y(t), z(t)), t ∈ [a, b] una curva diferenciable en R3 . Entonces su longitud viene dada por
Z bp
L= x0 (t)2 + y 0 (t)2 + z 0 (t)2 dt
a
Si queremos utilizar DERIVE for Windows podemos hacerlo directamente siguiendo los siguientes pasos:
L(p,q) := INT(SQRT(DIF(x(t),t)^2+DIF(y(t),t)^2+DIF(z(t),t)^2),t,p,q)
Otra posible solución al problema de determinar la longitud de la curva consiste en utilizar álgebra vectorial:
L(p,q) := INT(SQRT(DIF(R(t),t).DIF(R(t),t)),t,p,q)
El problema consiste en definir dos funciones que se encarguen de calcular dichas cantidades. La función curvatura
está dada por
|R0 (t) × R00 (t)|
κ(t) =
|R0 (t)|
y la función torsión está dada por
det(R0 (t), R00 (t), R000 (t))
τ (t) =
|R0 (t) × R00 (t)|2
Dichas funciones pueden definirse en DERIVE for Windows del siguiente modo:
Dada una superficie parametrizada regular S(u, v) = (x(u, v), y(u, v), z(u, v)) se definen los coeficientes de la
primera forma fundamental como sigue:
2
E(u, v) = Su (u, v).Su (u, v) = |Su (u, v)|
F (u, v) = Su (u, v).Sv (u, v)
G(u, v) = Sv (u, v).Sv (u, v) = |Sv (u, v)|2
∂2S
e = N.
∂u2
∂2S
f = N.
∂u∂v
∂2S
g = N. 2
∂v
donde N representa el vector unitario normal a la superficie:
1
N (u, v) = √ (Su × Sv ).
EG − F 2
Para calcular estos elementos con DERIVE for Windows, definimos las siguientes funciones:
S(u,v) := [x(u,v),y(u,v),z(u,v)]
E(u,v) := DIF(S(u,v),u).DIF(S(u,v),u)
F(u,v) := DIF(S(u,v),u).DIF(S(u,v),v)
G(u,v) := DIF(S(u,v),v).DIF(S(u,v),v)
N(u,v) := SQRT(E(u,v)G(u,v)-F(u,v)^2)^(-2).CROSS(DIF(S(u,v),u),DIF(S(u,v),v))
EE(u,v) := N(u,v).DIF(S(u,v),u,2)
FF(u,v) := N(u,v).DIF((DIF(S(u,v),u)),v)
GG(u,v) := N(u,v).DIF(S(u,v),v,2)
Ejercicio. Calcular los coeficientes de la primera y de la segunda forma fundamental de la siguiente superficie
parametrizada:
S(u, v) = (cosh(u) cos(v), cosh(u) sen(v), u)
A partir de los coeficientes determinados en el apartado anterior podemos calcular la curvatura de Gauss de la
superficie como sigue:
eg − f 2
KG(u, v) =
EG − F 2
En DERIVE for Windows podemos definir la siguiente función:
Sea el campo de vectores F = (M, N, P ) y supongamos que es conservativo. Entonces existe una función
diferenciable f tal que
fx = M
fy = N
fz = P
¿Cómo determinar f ? Podemos hacerlo directamente mediante integración; sin embargo, DERIVE for Windows
pone a nuestra disposición la siguiente función:
POTENTIAL([f(x,y,z),g(x,y,z),h(x,y,z)])
Como en el cálculo de primitivas, las funciones potenciales son únicas salvo constantes. Por tanto, la función
POTENTIAL puede proporcionar un resultado diferente a uno calculado manualmente. Las constantes aditivas
pueden ser desechadas (especialmente en funciones que involucran logaritmos o funciones trigonométricas inver-
sas).
No todos los campos de vectores admiten una función potencial; no todos los campos son conservativos. En
este caso, la función POTENTIAL determina una función diferenciable cuyo gradiente no es el campo de vecto-
res original. Por tanto, antes de utilizar la función POTENTIAL es conveniente verificar primero si el campo es
conservativo.
La función POTENTIAL admite un segundo argumento opcional que es un vector especificando las coordenadas del
punto inicial para las integrales involucradas. Por defecto, este vector es el vector nulo. Una elección inapropiada
puede conducir a un potencial infinito o desconocido; si esto ocurriese es conveniente probar con otros valores.
Finalmente, la función POTENTIAL admite un tercer argumento opcional que es un vector de coordenadas cartesia-
nas o una matriz métrica (esto es, una matriz con dos filas: un vector de coordenadas y una vector con la métrica).
Por defecto, este argumento es [x,y,z].
Ejercicio. Sea el campo de vectores F (x, y, z) = (2xy, x2 + z 2 , 2zy). Probar que F es un campo conservativo y
encontrar una función potencial para F .
4.6. Bibliografı́a
C. Paulogorrón y C. Pérez. Cálculo matemático con DERIVE para PC, Ed. RA-MA, 1a Ed., 1994.
R.E. LARSON, R.P. HOSTETLER y B.H. EDWARDS Calculo y Geometrı́a Analı́tica, 5a ed., McGraw-Hill, Ma-
drid, 1995. Capı́tulo 15.
J. STEWART Cálculo, 2a ed. Grupo Editorial Iberoamérica, México, 1994. Capı́tulo 12.
204 MATEM ÁTICAS
6. PREGUNTAS DE EVALUACIÓN
Se pide:
(a) Hallar el espacio recorrido desde t = 0 hasta t = 4.
(b) Hallar un vector tangente unitario y otro normal a la curva en el punto de parámetro t = 1.
(c) ¿Cuál es el valor de la curvatura en ese punto?
E.6.2. (a) Demostrar que los vectores tangentes a lo largo de la curva
α(t) = at, bt2 , t3
−
→
(siendo 2b2 = 3a) forman un ángulo constante con el vector A = (1, 0, 1). ¿Cuál es el valor de ese ángulo?
(b) Hallar las ecuaciones de los planos osculador, normal y rectificante de la curva del apartado anterior
para a = b = 1.
E.6.3. Demostrar que la curva definida por la parámetrización
1 + t 1 − t2
α(t) = t, ,
t t
∂z ∂z
y2 + xy = xz.
∂x ∂y
x2 y2 z2
+ + = 1,
9 16 4
en los puntos que correspondan a las coordenadas x = 0 e y = 1.
E.6.6. Un palo de longitud ` se parte en tres trozos de longitudes x, y, z. Hallar x, y, z para que el producto xyz
sea máximo.
E.6.7. Demostrar que los puntos de la siguiente superficie
−
→
X (u, v) = (u, v, u2 + v 3 )
ANOTACIONES
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
CAPÍTULO 7
CÁLCULO INTEGRAL EN VARIAS VARIABLES
• Calcular integrales dobles en coordenadas carte- tesianas, cilı́ndricas y esféricas, sobre dominios
sianas y polares, sobre dominios sencillos. sencillos.
• Usar la integral doble para el cálculo de áreas.
• Usar la integral triple para el cálculo de
• Calcular integrales triples en coordenadas car- volúmenes.
Sea f (x, y) una función continua para los valores (x, y) ∈ R donde
R = (x, y) ∈ R2 a 6 x 6 b, c 6 y 6 d = [a, b] × [c, d].
Para cada y0 fijamos la función definida por F (x) = f (x, y0 ) que es continua y por lo tanto integrable es [a, b].
La integral
Zb
F (x, y)dx = G(y)
a
Definiremos la integral doble sobre el rectángulo R = [a, b] × [c, d] de la función f (x, y) como
ZZ Zd Zb
f (x, y)dxdy = f (x, y)dx dy.
R
c a
ZZ
Ejemplo. Sea R = [0, 1] × [0, 2], vamos a calcular f (x, y)dxdy donde f (x, y) = xy.
R
1
ZZ Z2 Z
xydxdy = xydx dy
R
0 0
C ÁLCULO INTEGRAL EN VARIAS VARIABLES 207
Z2 x=1
x2 y
= dy
2 x=0
0
Z2 2 y=2
y y
= dy = = 1.
2 4 y=0
0
2
Teorema de Fubini: Si R = [a, b] × [c, d] se cumple que
ZZ Zd Zb Zb Zd
f (x, y)dxdy = f (x, y)dx dy = f (x, y)dy dx,
R
c a a c
El concepto de integral doble se puede extender a conjuntos que no sean necesariamente rectángulos en R2 . Son
conjuntos acotados más generales que en algunas referencias bibliográficas se denominan conjuntos medibles
Jordan. No vamos a intentar definir e identificar matemáticamente estos conjuntos; para nuestras aplicaciones
nos bastará con saber que recintos planos D de puntos que estén limitados por una curva cerrada son conjuntos
medibles Jordan en los que tiene sentido definir la integral doble (ver Figura 7.1).
Para calcular la integral de f (x, y) en el recinto D procederemos como sigue. La recta x = x0 corta a D en dos
puntos M1 y M2 de ordenadas respectivas y1 (x0 ) e y2 (x0 ). Cuando variamos a 6 x 6 b, y1 (x) e y2 (x) son dos
funciones continuas. Ası́
ZZ Zd yZ2 (x)
f (x, y)dxdy = f (x, y)dx dy.
D
c y1 (x)
¿Qué ocurre si tomamos las rectas y = y0 y los puntos de corte con abscisas x1 (y0 ) y x2 (y0 ), siendo ambas
funciones continuas para c 6 y 6 d?
En el caso de que f (x, y) sea continua en D (caso para el que nos restringiremos en la práctica) se tiene por el
Teorema de Fubini que
ZZ Zd yZ2 (x) Zb xZ2 (y)
f (x, y)dxdy = f (x, y)dx dy = f (x, y)dy dx
D
c y1 (x) a x1 (y)
208 MATEM ÁTICAS
¿Qué ocurre cuando las rectas x = x0 (o bien y = y0 ) cortan al dominio D en más de dos puntos? La forma de
realizar en la práctica este caso es descomponer D en dominios parciales que sı́ satisfagan la condición, aunque
nosotros solo trataremos los casos más sencillos.
ZZ
Ejemplo. Vamos a calcular x2 ydxdy donde D = (x, y) ∈ R2 x2 + y 2 6 1, y > 0 (semicı́rculo superior
D
de centro el origen y radio 1)
√
ZZ Z1 Z1−x2
x2 ydxdy = x2 ydy dx
D
−1 0
Z1 y=√1−x2 Z1
x2 y 2 (1 − x2 )x2
= dx = dx
2 y=0 2
−1 −1
3
5 x=1
1 x x 2
= − =
2 3 5 x=−1 15
2
A veces, por cuestiones de facilidad en la expresión de la función o del recinto, trabajar en coordenadas polares
agiliza en gran manera los cálculos. En realidad no hay ningún problema matemático para efectuar una nueva
elección de un sistema de coordenadas (r, θ) con x = r cos θ, y = r sen θ.
ahora usando coordenadas polares. Para empezar debemos fijarnos en la ventaja evidente de que la porción del
cı́rculo unidad que indica D tiene ahora una expresión bastante más sencilla, a saber,
D = { (r, θ)| 0 6 r 6 1, 0 6 θ 6 π} .
Luego se tiene
ZZ ZZ
x2 ydxdy = r 3 (cos2 θ)(sen θ)rdrdθ
D
ZZ D
2
C ÁLCULO INTEGRAL EN VARIAS VARIABLES 209
• DadoZelZrectángulo R = (x, y) ∈ R2 a 6 x 6 b, c 6 y 6 d = [a, b] × [c, d] ¿qué significado geométrico
tiene dxdy?
R
ZZ
• Y si ahora ponemos R = (x, y) ∈ R2 x2 + y 2 6 1 ¿qué significado piensas que tiene dxdy? (Es
R
más facil que lo pienses en coordenadas polares).
Para ilustrar las reflexiones que te hemos propuesto anteriormente te presentamos el siguiente ejemplo.
Ejemplo. Vamos a calcular el área del lóbulo del folium de Descartes (ver Figura 7.2) de ecuación en coordenadas
polares
3 sen θ cos θ π
r= , 06θ6 .
sen3 θ + cos3 θ 2
En nuestro caso se tiene que el área vendrı́a expresada por la siguiente integral doble:
3 sen θ cos θ
π π
Z2 Z
sen3 θ+cos3 θ Z2 r= 3 sen θ cos θ
r2 sen3 θ+cos3 θ
rdr
dθ =
2
dθ
r=0
0 0 0
π
Z2
9 sen2 θ cos2 θ
= dθ
2(sen3 θ + cos3 θ)2
0
π
Z2
1 9 sen2 θ cos2 θ
= dθ.
2 (sen3 θ + cos3 θ)2
0
210 MATEM ÁTICAS
1
y haciendo el cambio de variable tan θ = t, dt = cos2 θ dθ, obtenemos (intentando antes simplificar algo las
expresiones):
π π
Z4 Z4
9 sen2 θ cos2 θ 9 sen2 θ cos2 θ
dθ = dθ
(sen3 θ + cos3 θ)2 cos6 θ (1 + tan3 θ)2
0 0
π
Z4
9 sen2 θ
= dθ
cos4 θ (1 + tan3 θ)2
0
Z1
t2
= 9 dt
(1 + t3 )2
0
t=1
1 3
= −3 = .
1 + t3 t=0 2
2
Procedemos de forma análoga a las integrales dobles, esta vez refiriéndonos a funciones de tres variables definidas
sobre un recinto del espacio R. Sea f (x, y, z) una función contı́nua para los valores (x, y, z) ∈ R donde
R = (x, y, z) ∈ R3 a 6 x 6 b, c 6 y 6 d, e 6 z 6 f = [a, b] × [c, d] × [e, f ].
Con las consideraciones de continuidad para f (x, y, z) y las consecuencias posteriores de integrabilidad similares
a las hechas para la integral doble, se tiene que la integral triple sobre el paralelepı́pedo R de la función f (x, y, z)
se puede expresar como
ZZZ Zf Zd Zb
f (x, y, z)dxdydz = f (x, y)dx dy dz.
R
e c a
El Teorema de Fubini también se cumple ahora. Es decir, podremos cambiar el orden de las diferentes integrales
sin que esto afecte al valor final de la integral triple.
Z3 y=2 Z3
y2 z
= dz = zdz
4 y=0
0 0
z=3
z2 9
= =
2 z=0 2
2
Siguiendo el procedimiento al que sometı́amos a la integral doble, pasamos a continuación a introducir el concepto
de integral triple sobre conjuntos acotados más generales D ⊂ R3 , los llamados conjuntos medibles Jordan.
Consideramos ahora el plano x = x0 (paralelo al plano coordenado Y Z) y supongamos además que el mencio-
nado plano corta a D en C(x0 ). En estas condiciones,supuestas las hipótesis de continuidad de la función en el
dominio y de las secciones C(x) al variar x entre [a, b], podemos calcular la integral triple de f (x, y, z) sobre D
de la siguiente forma:
ZZZ Zb "Z Z #
f (x, y, z)dxdydz = f (x, y, z)dydz dx
D C(x)
a
suponiendo que las paralelas al eje OZ cortan a C(x) en puntos en los que las cotas alcanzadas en el mencionado
eje sean z1 (x0 , y0 ) y z2 (x0 , y0 ), se tiene entonces
ZZ 2 (x)
yZ z2Z(x,y)
f (x, y, z)dydz = f (x, y, z)dz dy,
C(x)
y1 (x) z1 (x,y)
ZZZ Zb "Z Z #
f (x, y, z)dxdydz = f (x, y, z)dydz dx
D C(x)
a
Zb 2 (x)
yZ z2Z(x,y)
= f (x, y, z)dz dy dx.
a y1 (x) z1 (x,y)
212 MATEM ÁTICAS
Obsérvese que también aquı́ se puede intercambiar el orden de las integraciones, es decir, podemos partir de
secciones de D paralelas al plano XY (C(z0 )) o paralelas al plano XZ (C(y0 )), sin que esto varı́e nuestro
razonamiento en lo que al proceso se refiere.
2
Se puede pensar en intercambiar el orden de las integrales simples para intentar facilitar el proceso de cálculo.
Veamos:
ZZZ Zb "Z Z #
f (x, y, z)dxdydz = f (x, y, z)dydz dx
D C(x)
a
Zb 2 (x)
yZ z2Z(x,y)
= f (x, y, z)dz dy dx
a y1 (x) z1 (x,y)
ZZ z2Z(x,y)
= f (x, y, z)dz dxdy,
πXY (D)
z1 (x,y)
donde se puede observar que hemos empezado por una integral simple y después integramos el resultado sobre
πXY (D) que indica la proyección de D sobre el plano XY .
Naturalmente todo el anterior procedimiento se puede hacer análogamente integrando primero sobre x y des-
pués integrando sobre πY Z (D) (proyección de D sobre Y Z), o bien integrando primero sobre y y después sobre
πXZ (D).
C ÁLCULO INTEGRAL EN VARIAS VARIABLES 213
Z1
x(x2 − 1)2 1
= dx =
8 48
0
Recordemos que las coordenadas cilı́ndricas (r, θ, z) de un punto en el espacio representan con (r, θ) a las co-
ordenadas polares de la proyección del punto en el plano XY y z el valor de la coordenada en el eje OZ. En
algunas ocasiones expresar en coordenadas cilı́ndricas la función y el recinto sobre el que calculamos la integral
triple tiene notables ventajas, como veremos en el ejemplo que desarrollaremos a continuación. Sólo basta tener
en cuenta que ZZZ ZZZ
f (x, y, z)dxdydz = ϕ(r, θ, z)rdrdθdz
D D
ZZZ
= r 4 (cos2 θ)(sen θ)zdrdθ
π D
Z1 Z1 Z2
4 2
= r (cos θ)(sen θ)zdθ dr dz
0 0 0
1
Z
Z1 3
θ= π2
cos θ
= −r 4 z dr dz
3 θ=0
0 0
Z1 Z1 4
= r zdr dz
3
0 0
Z1 r=1 Z1
r5 z z 1
= dz = dz =
15 r=0 15 30
0 0
Recordemos que un punto P de R3 , está totalmente determinado por sus coordenadas esféricas (ρ, ϕ, θ) donde
ρ indica la longitud de OP, ϕ el ángulo que forma el plano determinado por OZ y P con el plano OXZ y θ el
ángulo que forma la recta OP con el eje OZ, teniéndose además las siguientes igualdades que relacionan las
coordenadas esféricas con las cartesianas rectangulares
x = ρ sen θ cos ϕ,
y = ρ sen θ sen ϕ,
z = ρ cos θ.
Al igual que sucedı́a con las coordenadas cilı́ndricas, en determinadas ocasiones, bien sea por la expresión del pro-
pio recinto o por la propia función, nos conviene usar este sistema de coordenadas en detrimento de las cartesianas
o cilı́ndricas. Tendremos no obstante que tener en cuenta lo siguiente:
ZZZ ZZZ
f (x, y, z)dxdydz = g(ρ, θ, ϕ)ρ2 sen θdρdθdϕ.
D D
donde
S = (x, y, z) ∈ R3 x2 + y 2 + z 2 6 1, x > 0, y > 0, z > 0 .
Se tiene
ZZZ ZZZ
xyzdxdydz = (ρ sen θ cos ϕ)(ρ sen θ sen ϕ)(ρ cos θ)ρ2 sen θdρdθdϕ
S
ZZZ S
Observa quela gran ventaja que presenta en este ejercicio el nuevo sistema de coordenadas es la expresión del
recinto S = (ρ, θ, ϕ)| 0 6 ρ 6 1, 0 6 θ 6 π2 , 0 6 ϕ 6 π2 , que produce el siguiente efecto a la hora de calcular
C ÁLCULO INTEGRAL EN VARIAS VARIABLES 215
la integral triple:
ZZZ
ρ5 (sen3 θ cos θ)(cos ϕ sen ϕ)dρdθdϕ =
π
π S
Z1 Z2 Z2
5 3
ρ (sen θ cos θ)(cos ϕ sen ϕ)dθ dϕ dρ =
0 0 0
π
Z1 Z2 5
ρ
cos ϕ sen ϕdϕ dρ =
4
0 0
Z1
ρ5 1
dρ = .
8 48
0
Al igual que usábamos las integrales dobles para calcular el área de determinados recintos planos, se puede utilizar
la expresión ZZZ
dxdydz
D
Ejemplo. Vamos a calcular el volumen de una esfera de centro el origen y radio R. Sabemos que podemos
expresar los puntos de la esfera que estén en el primer octante como
n π πo
S = (ρ, θ, ϕ)| 0 6 ρ 6 R, 0 6 θ 6 , 0 6 ϕ 6
2 2
(en coordenadas esféricas). Por simetrı́a, el volumen que nos piden vendrá expresado por
ZZZ ZZZ
8 dxdydz = 8 ρ2 sen θdρdθdϕ
S
π π
S
ZR Z2 Z2
= 8 ρ2 sen θdθ dϕ dρ
0 0 0
π
ZR Z2 ZR 2
ρ π 4
= 8 ρ2 dϕ dρ = 8 dρ = πR3 .
2 3
0 0 0
ZZ
(b) xydxdy donde D = (x, y) ∈ R2 0 6 x 6 3, 1 6 y 6 2
D
ZZ
(c) x2 ydxdy donde D = (x, y) ∈ R2 x + y 6 1, x > 0, y > 0
D
ZZ
(d) sen(x + y)dxdy donde D = (x, y) ∈ R2 0 6 x 6 π
2,0 6y6π
D
A.7.5. Calcular, usando la integral doble, la expresión del área encerrada por la elipse de ecuación
x2 y2
2
+ 2 = 1.
a b
exprésarlas respectivamente como una integral doble y otra triple de f (x, y) y f (x, y, z) sobre los recintos
apropiados.
A.7.8. Calcular las integrales introducidas en el ejercicio anterior para las funciones f (x, y) = ex+y y f (x, y, z) =
ex+y+z .
A.7.9. Calcular usando la integral triple una fórmula que calcule el volumen encerrado por el elipsoide de ecua-
ción
x2 y2 z2
2
+ 2 + 2 = 1.
a b c
C ÁLCULO INTEGRAL EN VARIAS VARIABLES 217
5. PREGUNTAS DE EVALUACIÓN
ZZ
E.7.1. Calcular (x2 + y 2 )dxdy donde D = (x, y) ∈ R2 x2 + y 2 6 1
D
ZZZ
E.7.2. Calcular √ 1
dxdydz donde D = (x, y, z) ∈ R3 x2 + y 2 + z 2 6 1
D x2 +y 2
E.7.3. Hallar el volumen del recinto limitado superiormente por la esfera de ecuación x2 + y 2 + z 2 = 4, inferior-
mente por el plano XY y lateralmente por el cilindro x2 + y 2 = 1.
218 MATEM ÁTICAS
ANOTACIONES
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
CAPÍTULO 8
ESTADÍSTICA DESCRIPTIVA UNIDIMENSIONAL
a) ¿Qué es la Estadı́stica?
c) ¿Cuáles son las representaciones gráficas más adecuadas para extraer conclusiones sobre el comportamiento
real de la variable estadı́stica?
d) ¿Cómo se sintetiza la información aportada por un conjunto de datos en una serie de valores que nos fijen
el comportamiento global del experimento aleatorio?
Estadı́stica: ciencia que se ocupa de recoger, clasificar, representar y resumir los datos de muestras, y de hacer
inferencias (extraer conclusiones) acerca de las poblaciones de las que éstas proceden.
1. Estadı́stica descriptiva: parte de la estadı́stica que se ocupa de recoger, clasificar, representar y resumir los
datos de las muestras.
2. Estadı́stica inferencial: parte de la estadı́stica que se ocupa de llegar a conclusiones (inferencias) acerca de
las poblaciones a partir de los datos de las muestras extraı́das de ellas.
− Población: conjunto de individuos con propiedades comunes sobre los que se realiza una investigación de
tipo estadı́stico.
220 MATEM ÁTICAS
− Variable: propiedad o cualidad que puede manifestarse bajo dos o más formas distintas en un individuo de
una población.
francés inglés francés inglés francés alemán ruso español francés inglés
francés inglés español francés español francés alemán inglés español inglés
inglés español inglés francés español ruso alemán francés inglés español
alemán inglés español francés alemán inglés inglés inglés español francés
f1 + f2 + · · · + fk = n,
h1 + h2 + · · · + hk = 1,
%1 + %2 + · · · + %k = 100,
• Distribución de frecuencias: tabla conteniendo las distintas clases y las frecuencias correspondientes a cada
una de ellas.
ESTAD ÍSTICA DESCRIPTIVA UNIDIMENSIONAL 221
clases fi hi %i
0
alemán 5 0 125 120 5
español 9 00 225 220 5
francés 11 00 275 270 5
inglés 13 00 325 320 5
ruso 2 00 050 50 0
suma 40 10 000 1000 0
14 13 3 13 7 12 13 11 13 12 11 13
7 10 12 13 14 11 13 12 4 12 10 13
9 12 13 11 13 14 10 12 11 13 15 9
12 11 13 10 13 11 12 5 9 12 13 15
Los mismos criterios usados para el caso cualitativo sirven para el caso cuantitativo discreto a la hora de presentar
tabularmente los datos. Además se pueden calcular:
La distribución de frecuencias de los datos cuantitativos discretos del ejemplo anterior es:
xi fi hi Fi Hi
3 1 00 0208 1 00 0208
4 1 00 0208 2 00 0417
5 1 00 0208 3 00 0625
7 2 00 0417 5 00 1042
9 3 00 0625 8 00 1667
10 4 00 0833 12 00 2500
11 7 00 1458 19 00 3958
12 10 00 2083 29 00 6042
13 14 00 2917 43 00 8958
14 3 00 0625 46 00 9583
15 2 00 0417 48 10 0000
Los datos procedentes de una variable continua se pueden tabular de la misma forma que los datos de una variable
discreta, pero lo usual en el caso de variables continuas es dividir el intervalo de valores posibles en intervalos
222 MATEM ÁTICAS
contiguos llamados intervalos de clase. Una vez agrupados los datos en intervalos, éstos se tabulan de forma
análoga al caso de variables discretas.
30 9 40 1 40 2 30 2 10 6
20 5 10 1 80 1 50 1 20 7
10 9 70 3 20 4 40 9 10 6
50 0 20 5 60 5 10 9 50 2
60 3 10 2 30 3 10 8 40 4
2o ) El número de intervalos de clase que podemos tomar para agrupar los datos es:
k = 1 + 30 322 log 25 = 50 64 ,
que aproximamos por el número natural siguiente: k = 6.
Como la amplitud de los intervalos la hemos tomado un poco mayor de lo que se obtiene en un principio, entonces
el nuevo recorrido es:
R0 = número de intervalos · amplitud = 6 · 10 17 = 70 02 .
Como el recorrido original es 7, entonces sobra 00 02, con lo cual repartimos este sobrante restando la mitad a la
observación mı́nima y sumando la otra mitad a la observación máxima; es decir:
xmin − 00 01, xmax + 00 01 ,
con lo que obtenemos los seis intervalos de clase determinados por los valores siguientes:
xmin − 00 01 = 10 10 − 00 01 = 10 09,
10 09 + 10 17 = 20 26,
20 26 + 10 17 = 30 43,
30 43 + 10 17 = 40 60,
40 60 + 10 17 = 50 77,
50 77 + 10 17 = 60 94,
60 94 + 10 17 = 80 11 = xmax + 00 01 .
ESTAD ÍSTICA DESCRIPTIVA UNIDIMENSIONAL 223
Los intervalos son: (10 09, 20 26], (20 26, 30 43], (30 43, 40 60], (40 60, 50 77], (50 77, 60 94], (60 94, 80 11]. Agrupamos,
pues, los datos en los intervalos anteriores y damos su distribución de frecuencias en la tabla siguiente:
(li , li+1 ] xi fi hi Fi Hi
0 0 0 0
(1 09, 2 26] 1 675 7 0 28 7 00 28
(20 26, 30 43] 20 845 6 00 24 13 00 52
(30 43, 40 60] 40 015 4 00 16 17 00 68
(40 60, 50 77] 50 185 4 00 16 21 00 84
(50 77, 60 94] 60 355 2 00 08 23 00 92
(60 94, 80 11] 70 525 2 00 08 25 10 00
La agrupación en intervalos de clase también puede hacerse con una variable discreta si el número de datos
distintos es muy grande.
1. Diagrama de barras: se sitúan en el eje horizontal las clases y sobre cada una de ellas se levanta un segmento
rectilı́neo (o un rectángulo) de altura igual a la frecuencia (absoluta o relativa) de cada clase (Figura 8.1 (a)).
2. Gráfico de sectores: se divide el área de un cı́rculo en sectores circulares de ángulos proporcionales a las
frecuencias absolutas de las clases (Figura 8.1 (b)).
ruso
5% alemán
13%
14
12
10 inglés
32%
español
23%
8
0
francés
alemán español francés inglés ruso 27%
1. Diagrama de barras: igual que en el caso de variables cualitativas (Figura 8.2 (a)).
2. Polı́gono de frecuencias: se sitúan los puntos que resultan de tomar en el eje horizontal los distintos valores
de la variable y en el eje vertical sus correspondientes frecuencias (absolutas o relativas), uniendo después
los puntos mediante segmentos rectilı́neos (Figura 8.2 (b)).
224 MATEM ÁTICAS
14
00 30
12
00 25
10
8 00 20
6 00 15
4
00 10
2
00 05
0
0 2 4 6 8 10 12 14 16 00 00
a) Diagrama de barras de frecuencias ab- 0 2 4 6 8 10 12 14 16
solutas b) Polı́gono de frecuencias relativas
50
40
30
20
10
0
0 2 4 6 8 10 12 14 16
c) Gráfico de frecuencias absolutas acumu-
ladas
Figura 8.2: Representaciones gráficas de los datos cuantitativos discretos de la sección 2.2.2.
1. Histograma de frecuencias: se sitúan en el eje horizontal los intervalos de clase y sobre cada uno se levanta
un rectángulo de área proporcional a la frecuencia absoluta.
(a) Si todos los intervalos tienen la misma amplitud, entonces basta con hacer los rectángulos con una
altura igual a la frecuencia absoluta (Figura 8.4 (a)).
(b) Si los intervalos tienen distinta amplitud, la construcción del histograma presenta una importante va-
riación. Una vez marcados sobre el eje horizontal los extremos de los intervalos, hay que calcular la
altura de los rectángulos de forma que su área sea igual o proporcional a la frecuencia absoluta del
intervalo. Veámoslo con un ejemplo.
Sea la siguiente distribución de frecuencias:
ESTAD ÍSTICA DESCRIPTIVA UNIDIMENSIONAL 225
intervalo fi
[0, 3] 11
(3, 50 5] 10
(50 5, 60 5] 2
(60 5, 8] 1
(8, 10] 1
Recordemos que la fórmula del área de un rectángulo es base × altura y consideremos que los
rectángulos del histograma van a tener un área igual a la frecuencia absoluta. Por ejemplo, para averi-
guar la altura del primer rectángulo, tenemos en cuenta que la base es igual a 3 y el área del rectángulo
ha de ser igual a 11, por lo que la altura debe ser igual a 11/3 = 30 6667. Procediendo de forma
análoga con el resto de los intervalos, se tiene que el histograma de la distribución de frecuencias dada
por la tabla anterior es la Figura 8.3.
0
0 3 50 5 60 5 8 10
2. Polı́gono de frecuencias: se sitúan los puntos que resultan de tomar en el eje horizontal las marcas de clase
de los intervalos y en el eje vertical sus correspondientes frecuencias (absolutas o relativas), uniendo después
los puntos mediante segmentos rectilı́neos (Figura 8.4 (b)).
3. Polı́gono de frecuencias acumuladas: se sitúan los puntos que resultan de tomar en el eje horizontal los ex-
tremos superiores de los intervalos de clase y en el eje vertical sus correspondientes frecuencias acumuladas
(absolutas o relativas), uniendo después los puntos mediante segmentos rectilı́neos (Figura 8.4 (c)).
Son valores que nos sirven para indicar la posición alrededor de la cual se distribuyen las observaciones. Sólo se
calculan cuando la variable es cuantitativa.
2.4.1. Moda
7 7
6 6
5 5
4 4
3 3
2 2
1 1
0 0
10 09 20 26 30 43 40 60 50 77 60 94 80 11 00 505 10 675 20 845 40 015 50 185 60 355 70 525 80 695
a) Histograma (intervalos de la misma amplitud) b) Polı́gono de frecuencias absolutas
25
20
15
10
0
10 09 20 26 30 43 40 60 50 77 60 94 80 11
c) Polı́gono de frecuencias absolutas acumuladas
Figura 8.4: Representaciones gráficas de los datos cuantitativos continuos de la sección 2.2.3.
2.4.2. Mediana
La denotaremos por Me . Es el valor que tiene la propiedad de dejar a su izquierda el 50% de las observaciones y
a su derecha el 50% restante, siempre que hayamos ordenado los datos de menor a mayor. Por tanto, la frecuencia
absoluta acumulada de la mediana es igual a n/2, siendo n el número total de datos.
13
10
60 5
0
0 2 4 6 8 10
(b) Si en la distribución de frecuencias aparece la frecuencia absoluta acumulada igual a n/2 entonces
ocurre que hay todo un intervalo [a, b) de valores cuya frecuencia absoluta acumulada es igual a n/2.
En este caso se toma como mediana el valor Me = a+b 2 .
Para que esto ocurra es necesario que n sea par; en cuyo caso también se puede calcular la mediana
ordenando los datos de menor a mayor, y luego hallando el punto medio de los dos datos centrales.
Por ejemplo, sea la distribución de frecuencias siguiente:
xi fi Fi
2 1 1
4 5 6
6 4 10
8 2 12
228 MATEM ÁTICAS
Todos los valores del intervalo [4, 6) tienen la frecuencia absoluta acumulada igual a n/2 = 6, de
forma que la mediana es Me = 4+6 2 = 5. Esto se puede observar más claramente si recurrimos al
gráfico de frecuencias absolutas acumuladas, que es la Figura 8.6.
12
10
1
0
0 2 4 6 8 10
n
2 − Fi−1
Me = `i + (`i+1 − `i ) ,
fi
donde (`i , `i+1 ] es el intervalo mediano, fi es su frecuencia absoluta y Fi−1 es la frecuencia absoluta
acumulada del intervalo anterior al mediano.
El percentil (o cuantil) al r% es aquel valor que deja a su izquierda el r% de las observaciones y a su derecha el
(100-r)% restante, siempre que hayamos ordenado los datos de menor a mayor. Se suele denotar por Pr (o por
Cr ).
El cálculo de los percentiles se hace de modo similar al cálculo de la mediana, teniendo en cuenta que el percentil
al r% verifica que su frecuencia absoluta acumulada es igual a:
nr
.
100
Cuando los datos están agrupados en intervalos de clase, la fórmula del percentil al r% es:
nr
− Fi−1
Pr = `i + 100 (`i+1 − `i ) ,
fi
donde (`i , `i+1 ] es el intervalo que contiene a Pr , fi es su frecuencia absoluta y Fi−1 es la frecuencia absoluta
acumulada del intervalo anterior.
• Cuartiles: Primer cuartil = Q1 = P25 , Segundo cuartil = Q2 = P50 = M e y Tercer cuartil = Q3 = P75 .
• Deciles: Primer decil = D1 = P10 , Segundo decil = D2 = P20 , . . ., Noveno decil = D9 = P90 .
Si los valores de los datos son x1 , x2 , . . . , xk , y ellos aparecen con frecuencias absolutas respectivas f1 , f2 , . . .,
fk (con f1 + f2 + · · · + fk = n) entonces la expresión de la media aritmética es:
X
k
xi fi
x1 f1 + x2 f2 + · · · + xk fk i=1
x= = .
n n
Si los datos están agrupados en intervalos de clase, la fórmula de la media aritmética es la misma, salvo que xi
representa la marca de clase del intervalo i−ésimo.
Dado que la media aritmética es la más común, en adelante la llamaremos sólo media.
Si disponemos de los datos de toda la población, entonces representamos la media aritmética por la letra griega µ
(que se lee mu).
Propiedades de la media
2. Si yi = xi − x, entonces y = 0.
Cálculo de la media por codificación (para datos agrupados en intervalos de la misma amplitud)
Si a es la marca de clase del intervalo central (o una de las centrales, cuando el número de ellos es par) y b es igual
a la amplitud de los intervalos, entonces realizamos la transformación siguiente:
xi − a
zi = ,
b
para todas las marcas de clase xi , y luego hallamos la media z. Como xi = a + bzi entonces por la propiedad 3
se cumple que la media deseada es x = a + bz.
De los otros tipos de medias, la de mayor interés práctico es la media ponderada. Ésta consiste en asignar a cada
valor xi de los datos un peso pi que depende de su importancia relativa bajo algún criterio. La definición de la
230 MATEM ÁTICAS
Si los datos de la muestra son x1 , x2 , . . . , xk y ellos aparecen con frecuencias absolutas respectivas f1 , f2 , . . ., fk
(con f1 + f2 + · · · + fk = n), entonces se definen:
• Media geométrica:
q
n
xg = xf11 xf22 · · · xfkk .
• Media cuadrática: v
u k
uX
r u x2i fi
u
x21 f1 + x22 f2 + · · · + x2k fk t i=1
xc = = .
n n
• Media armónica:
n n
xa = = k .
f1
+
f2
+ ···+
fk X fi
x1 x2 xk x
i=1 i
En las tres definiciones anteriores, si los datos están agrupados en intervalos entonces xi representa la marca de
clase del intervalo i-ésimo.
xa 6 xg 6 x 6 xc .
Son valores que miden el grado de separación de las observaciones entre sı́ o con respecto a ciertas medidas de
posición. Sólo se calculan cuando la variable es cuantitativa.
2.5.1. Recorrido
Es una medida de dispersión global que se define como la diferencia entre la observación mayor, xmax , y la
observación menor, xmin , y se denota por R; es decir:
R = xmax − xmin .
Se denota por RI y se define como la diferencia entre el tercer cuartil y el primer cuartil; es decir:
RI = Q3 − Q1 .
Si el recorrido intercuartı́lico es pequeño entonces los datos están cerca de la mediana; en caso contrario, los datos
están alejados de ella.
Si los datos de la muestra son x1 , x2 , . . . , xk y ellos aparecen con frecuencias absolutas respectivas f1 , f2 , . . ., fk
(con f1 + f2 + · · · + fk = n), entonces:
X
k
|xi − Me |fi
i=1
DMe = .
n
Si los datos están agrupados en intervalos, xi representa la marca de clase del intervalo i−ésimo.
Cuando DMe es pequeña, entonces los datos están cerca de la mediana. En caso contrario, los datos están alejados
de la mediana.
La mediana de las desviaciones absolutas respecto de la mediana (M DA) es la mediana de los valores absolutos
de las diferencias entre los valores de la muestra y la mediana de todos los datos. Para determinar M DA se calcula
la mediana de todos los datos (Me ); se hallan las desviaciones de los datos respecto de la mediana:
x1 − Me , x2 − Me , . . . , xn − Me ,
Cuando M DA es pequeña, entonces los datos están cerca de la mediana. En caso contrario, los datos están
alejados de la mediana.
Si los datos están agrupados en intervalos, en vez de calcular M DA se calcula DMe , pues su interpretación
descriptiva es la misma.
232 MATEM ÁTICAS
Si los datos de la muestra son x1 , x2 , . . . , xk y ellos aparecen con frecuencias absolutas respectivas f1 , f2 , . . ., fk
(con f1 + f2 + · · · + fk = n), entonces:
X
k
|xi − x|fi
i=1
Dx = .
n
Si los datos están agrupados en intervalos, xi representa la marca de clase del intervalo i−ésimo.
Cuando Dx es pequeña, entonces los datos están cerca de la media. En caso contrario, los datos están alejados de
la media.
Si los datos de la muestra son x1 , x2 , . . . , xk y ellos aparecen con frecuencias absolutas respectivas f1 , f2 , . . ., fk
(con f1 + f2 + · · · + fk = n), entonces se definen:
X
k X
k
(xi − x)2 fi x2i fi
s2x = i=1
= i=1
− x2 .
n n
• Cuasivarianza (algunos autores la llaman varianza insesgada, varianza corregida o sólo varianza):
!
Xk Xk
2 2
(xi − x) fi xi fi − nx2
Sx2 = i=1
= i=1
.
n−1 n−1
(n − 1)Sx2 = ns2x ,
Si los datos están agrupados en intervalos de clase, las fórmulas anteriores son las mismas, salvo que xi representa
la marca de clase del intervalo i−ésimo.
Cuando la desviación tı́pica (o la cuasidesviación tı́pica) es pequeña, entonces los datos están cerca de la media.
En caso contrario, los datos están alejados de la media.
Si disponemos de los datos de toda la población, la varianza se denota por σ 2 y la desviación tı́pica por σ (letra
griega que se lee sigma).
Propiedad de la varianza
Si yi = a + bxi , siendo a y b constantes, entonces la varianza de la nueva variable es s2y = b2 s2x y por tanto la
desviación tı́pica es sy = |b|sx .
Cálculo de la varianza por codificación (para datos agrupados en intervalos de la misma amplitud)
Si a es la marca de clase del intervalo central (o una de las centrales, cuando el número de ellos es par) y b es igual
a la amplitud de los intervalos, entonces realizamos la transformación siguiente:
xi − a
zi =
b
y después calculamos la varianza de la nueva variable, s2z . Como xi = a + bzi entonces la varianza deseada es
s2x = b2 s2z y por tanto la desviación tı́pica es sx = |b|sz .
sx sx
CV = ó CV = 100% .
|x| |x|
Algunos autores sustituyen sx por Sx en la fórmula anterior. Este coeficiente nos sirve para comparar la disper-
sión relativa de dos muestras distintas. La muestra que tenga un coeficiente de variación más grande es la más
heterogénea (sus datos están más dispersos).
2.6. Momentos
Si los datos de la muestra son x1 , x2 , . . . , xk y ellos aparecen con frecuencias absolutas respectivas f1 , f2 , . . ., fk
(con f1 + f2 + · · · + fk = n), entonces se definen:
a1 = x = media.
m1 = 0.
m2 = s2x = varianza.
Desarrollando el binomio (xi − x)k se puede comprobar que existe una relación entre los momentos respecto al
origen y los momentos respecto de la media; por ejemplo:
m2 = a2 − a21
m3 = a3 − 3a2 a1 + 2a31
m4 = a4 − 4a3 a1 + 6a2 a21 − 3a41
A través de las representaciones gráficas (histogramas, diagramas de barras, etc.) podemos hacernos una idea
sobre la forma de las distribuciones, pero también resulta importante cuantificar esta caracterı́stica a través de las
medidas de forma.
Las caracterı́sticas bajo-ancho, alto-estrecho se miden respecto de una curva modelo llamada curva Normal (véase
la Figura 8.7). Esta curva es la representación gráfica de la siguiente función:
1 1 x−µ 2
y= √ e− 2 ( σ )
σ 2π
donde x, µ y σ son números reales, siendo además σ > 0; e es la base de los logaritmos neperianos (e =
20 718281829 . . .) y π es la relación de la longitud de una circunferencia a su diámetro (π = 30 141592654 . . .).
Para cada par de valores de µ y σ tendremos una curva Normal distinta. Es decir, tenemos una familia de curvas.
Pero todas ellas coinciden en algunas propiedades, como, por ejemplo:
c) Se acerca asintóticamente al eje horizontal. En otras palabras, se acerca más y más a ese eje, tanto por la
derecha como por la izquierda, sin llegar a tocarlo en ningún punto.
ESTAD ÍSTICA DESCRIPTIVA UNIDIMENSIONAL 235
2.7.1. Asimetrı́a
Se dice que una distribución presenta una asimetrı́a positiva o por la derecha cuando su polı́gono de frecuencias
(absolutas o relativas) es similar a la Figura 8.8 (a). Análogamente, se dice que una distribución presenta una
asimetrı́a negativa o por la izquierda cuando su polı́gono de frecuencias (absolutas o relativas) tiene una forma
parecida a la Figura 8.8 (b). Diremos que una distribución presenta simetrı́a cuando su polı́gono de frecuencias
(absolutas o relativas) es similar a la Figura 8.7.
(a) Distribución asimétrica por la derecha (b) Distribución asimétrica por la izquierda
Para las distribuciones unimodales, como medida de asimetrı́a se suele utilizar el coeficiente de asimetrı́a de
Pearson, que se define por la expresión:
x − Mo
CA = ,
sx
que permite distinguir los casos:
a) CA = 0 (distribución simétrica),
Cuando la distribución no es unimodal no se puede emplear el anterior coeficiente, por lo que se introduce el
coeficiente de asimetrı́a de Fisher, que viene dado por:
m3
g1 = ,
s3x
a) g1 = 0 (distribución simétrica),
2.7.2. Apuntamiento
Si el polı́gono de frecuencias (absolutas o relativas) es análogo a la curva Normal, entonces se dice que la dis-
tribución es mesocúrtica (véase la Figura 8.7); si es más elevado y estrecho que la curva Normal, entonces se
llama distribución leptocúrtica (véase la Figura 8.9 (a)); y si es menos elevado y más ancho que la curva Normal,
entonces se llama distribución platicúrtica (véase la Figura 8.9 (b)).
236 MATEM ÁTICAS
(a) Distribución muy apuntada o leptocúrtica (b) Distribución poco apuntada o platicúrtica
a) g2 = 0 (distribución mesocúrtica),
b) g2 > 0 (distribución leptocúrtica),
c) g2 < 0 (distribución platicúrtica).
A.8.1. La tabla siguiente muestra la puntuación obtenida por los alumnos de primero de una facultad en un examen
“tipo test” realizado en una determinada asignatura:
60 3 70 2 60 8 70 4 80 2 90 3 40 6 50 3 50 9 60 7
70 6 60 8 50 8 40 9 40 7 40 6 50 7 60 8 70 8 90 1
30 9 40 8 50 6 50 8 70 1 80 4 90 1 40 8 50 5 60 3
40 8 50 7 60 8 70 3 70 5 70 6 80 1 80 8 70 5 90 5
50 7 60 6 70 3 50 6 40 7 30 9 30 8 40 7 50 1 50 8
70 3 60 5 60 8 60 9 50 8 50 3 60 7 70 8 60 9 40 7
a) Agrupar los datos en los siguientes intervalos: [0,5) (suspenso), [5,7) (aprobado), [7,9) (notable) y
[9,10) (sobresaliente). A partir de esta agrupación hacer lo siguiente:
b) Dibujar el histograma de frecuencias absolutas.
c) Hallar la moda, la media y la mediana.
A.8.2. La tabla siguiente muestra los salarios de 34 trabajadores elegidos al azar en una determinada empresa.
A.8.3. Los varones entre 20 y 60 años que contrajeron matrimonio durante el año 1961 en España presentan la
siguiente distribución por edades.
Dibujar el polı́gono de frecuencias acumuladas absolutas. Calcular la moda, la mediana, los cuartiles, el
segundo decil y el percentil al 37 por ciento. Calcular la desviación media y deducir si los datos están cerca
de la media.
A.8.4. Se ha revisado un lote de 1000 piezas esmaltadas, obteniéndose el número de defectos de cada pieza, lo
que se indica en la siguiente tabla:
no de defectos frecuencia
0 600
1 310
2 75
3 13
4 2
Hacer el polı́gono de frecuencias absolutas. Determinar la media y la desviación tı́pica. Deducir si los datos
están cerca de la media.
A.8.5. Un fabricante de calzado quiere conocer la distribución de las tallas de los zapatos demandados por los
hombres. Elige una muestra aleatoria de 50 hombres obteniendo los siguientes resultados.
Se desea obtener:
A.8.6. Un alumno “muy previsor”quiere escoger una asignatura de la que dan clases dos profesores diferentes
A y B. Según datos del pasado año, la nota media de los alumnos que tuvieron el profesor A fue de 60 1
y la desviación tı́pica fue 00 95. En el curso del profesor B, la media fue 50 2 y la desviación tı́pica 20 2.
Suponiendo que puede elegir al profesor ¿qué profesor debe elegir y por qué, según desee:
a) aprobar “sin demasiadas complicaciones’”?
b) conseguir la nota más alta?
A.8.7. A una competición de tiro concurren seis tiradores, A, B, C, D, E y F, en tres modalidades de tiro, que
llamaremos 1, 2 y 3. El número de blancos obtenidos por cada uno, en cada modalidad de tiro, puede verse
en la siguiente tabla.
tirador 1 2 3
A 44 29 12
B 44 27 13
C 46 28 13
D 43 27 17
E 47 25 14
F 46 26 15
Aparte de haber un primer premio en cada modalidad, el jurado debe conceder un premio especial al tirador
que considere “globalmente mejor”, lo cual es motivo de arduas discusiones (¿por qué?). Un miembro del
jurado dice que “basándose en Estadı́stica” este premio debe ser para el tirador D. ¿Por qué?
A.8.8. Una empresa debe cubrir un cierto número de puestos de trabajo de dos tipos, A y B. Se somete a los
aspirantes a dos pruebas, ambas puntuadas de 0 a 50, diseñadas para valorar sus aptitudes en uno y en otro
tipo de trabajo. En la prueba A la media de calificaciones ha sido 28 y la desviación tı́pica 30 4. En la prueba
B la media ha sido 24 y la desviación tı́pica 20 1. ¿Qué tipo de puesto de trabajo asignaremos a un aspirante
que hubiese obtenido 33 puntos en la prueba A y 28 en la B?
A.8.9. a) Sea {x1 , x2 , . . . , x100 } una muestra de media aritmética 21’5 y sean x101 = 22, x102 = 19, x103 =
200 5 tres observaciones más. Calcular la media aritmética de la nueva muestra {x1 , x2 , . . . , x100 , x101 , x102 , x1
b) Sea x̄ la media aritmética de la muestra {x1 , x2 , . . . , xn } y sea ȳ la media aritmética de la muestra
{y1 , y2 , . . . , ym }. ¿Cuál será la media aritmética de la unión de ambas muestras?
A.8.10. Se preguntó a varias personas, elegidas al azar, el número de periódicos distintos que leı́an trimestralmen-
te, y se obtuvieron las siguientes respuestas:
Número de periódicos 0 1 2 3 4 5 6 7
Número de personas 7 13 18 15 11 6 4 2
Agrupar los datos en intervalos de la misma amplitud. Con los datos agrupados en intervalos: determinar
la distribución de frecuencias absolutas, relativas, acumuladas absolutas y acumuladas relativas. Hacer
el histograma de frecuencias absolutas, el polı́gono de frecuencias relativas y el polı́gono de frecuencias
acumuladas absolutas. Hallar las medidas de posición, dispersión y forma e interpretar los resultados.
ESTAD ÍSTICA DESCRIPTIVA UNIDIMENSIONAL 239
A.8.12. A continuación se dan los datos correspondientes al tiempo de espera (en minutos) hasta que son atendidos
40 personas que visitan una determinada caja de ahorros:
11 13 15 20 21 24 17 9 10 12
20 18 16 14 13 11 10 13 15 19
24 20 21 22 18 16 11 14 8 6
15 18 19 20 17 15 16 13 12 14
Agrupar los datos en intervalos. Con los datos agrupados en intervalos: determinar la distribución de fre-
cuencias absolutas, relativas, acumuladas absolutas y acumuladas relativas. Hacer el histograma de frecuen-
cias absolutas y el polı́gono de frecuencias acumuladas relativas. Hallar las medidas de posición, dispersión
y forma e interpretar los resultados.
A.8.13. Los datos siguientes corresponden al sueldo (en miles de pesetas) de una muestra de 25 empleados de
una determinada empresa.
sueldo número de
(en miles de pesetas) empleados
[90,100] 12
(100,110] 7
(110,120] 4
(120,130] 2
4.1. Introducción
La práctica se va a realizar con el programa STATISTIX for Windows, versión 1.0 (en inglés). Para ejecutar el
programa debemos acceder a la carpeta STATISTIX y ejecutar el programa STATISTIX. Una vez en el programa,
aparecerá la pantalla de la Figura 8.10, con un menú en la parte superior que, de ahora en adelante, denominaremos
menú principal (File Edit Data Statistics Preferences Window Help).
Todas las opciones del menú principal son ellas mismas menús, los cuales ofrecen variadas posibilidades de
manipulación de datos y de procedimientos estadı́sticos.
El menú File incluye procedimientos para abrir y grabar ficheros de datos, ası́ como la posibilidad de importar
datos de otros programas o exportar datos en un formato predeterminado. El menú Data proporciona muchas fun-
ciones para manipular la hoja de datos, incluyendo las transformaciones de variables. El menú Statistics lista
varios menús que nos permiten realizar análisis estadı́sticos básicos y avanzados. Por último, el menú Windows
lista las ventanas abiertas dentro de STATISTIX, que incluye la hoja de datos y las ventanas de resultados.
Para salir del programa debe seleccionarse la opción Exit del menú File. Los usuarios de Windows 95 o
Windows NT pueden abandonar el programa pulsando el botón de la esquina superior derecha de la ventana
(botón × ).
240 MATEM ÁTICAS
Figura 8.10: Pantalla inicial del programa donde aparece, además del menú principal del programa, una tabla en
blanco donde introduciremos los datos.
Antes de realizar ninguna operación es necesario tener un conjunto de datos en uso, para lo cual podemos pro-
ceder de dos formas distintas: o introducirlos directamente a través del teclado o recuperar un fichero con datos
previamente almacenado.
Los datos en STATISTIX pueden ser considerados tablas de datos, donde las columnas se denominan varia-
bles y las filas casos. En primer lugar debemos declarar las variables, para lo que seleccionamos las opciones
Data|Insert|Variables. Antes de seguir adelante convendrı́a hacer una aclaración: cuando digamos que se
seleccionan varias opciones, como acabamos de hacer, se sobreentenderá que cada opción se encuentra en el
menú correspondiente a la opción anterior, salvo la primera opción que se encuentra en el menú principal. Una
vez elegidas las opciones anteriores aparece la ventana de introducción de variables (ver Figura 8.11).
En el recuadro New Variable Names debemos escribir los nombres de las variables y su tipo, ya que STATISTIX
distingue cuatro clases de datos: números reales, números enteros, fechas y cadenas de caracteres. Para indicar
ESTAD ÍSTICA DESCRIPTIVA UNIDIMENSIONAL 241
los tres últimos tipos, el nombre de la variable se acompaña (entre paréntesis) de las letras I, D o Sxx, donde xx
denota un número que indica la longitud máxima de las cadenas.
El nombre de una variable es una cadena de caracteres con una longitud variable entre uno y nueve caracteres,
debe comenzar con una letra y sólo puede estar formado por letras, números y el carácter de subrayado. Solamente
hay unas pocas palabras (como CASE, PI, RANDOM, etc.) que no se pueden utilizar como nombres de variables ya
que están reservadas para otras tareas.
Supongamos que queremos introducir los datos de la siguiente tabla, que corresponde a una muestra de 25 alumnos
procedentes de la población formada por todos los alumnos matriculados en la asignatura “Estadı́stica” de una
determinada licenciatura de la Universidad de Murcia.
Se ha realizado un experimento consistente en averiguar, de cada uno de los alumnos de la muestra, los siguientes
datos:
En el recuadro New Variable Names podemos declarar más de una variable, pero hemos de tener presente que
los nombres de las variables deben ir separados entre sı́ por un espacio en blanco. Entonces una forma posible de
declarar las variables anteriores serı́a la siguiente:
Aparece entonces en la tabla de la pantalla los nombres de nuestras variables situados en la primera fila. Debajo
de cada una de las variables, excepto de las cadenas de caracteres, aparece una letra M mayúscula, indicando que
debemos completar dicha casilla. Para desplazarnos por la tabla de datos podemos utilizar la tecla de entrada
( ) o las flechas: ↑ y ↓ para desplazarnos por las columnas, y ← y → para hacerlo en la misma fila. Una vez
rellena, tendremos una tabla de datos como en la Figura 8.12.
Una vez introducidos los datos, éstos pueden guardarse en un fichero para poder ser utilizados en cualquier otro
momento. En realidad, los datos deberı́an guardarse muy a menudo, no sólo cuando hayamos terminado de
introducirlos todos (¿Qué pasarı́a si tenemos que introducir 1000 datos y cuando ya hemos introducido 950 se
produce un corte de energı́a eléctrica?)
Para grabar los datos se seleccionan las opciones File|Save o File|Save As. Por defecto, el programa nos
ofrece almacenar el fichero en el directorio del programa (usualmente c:\sxw), pero podemos cambiar de direc-
torio y guardarlo donde deseemos. Para distinguir los archivos creados con STATISTIX debemos recordar que
tiene la extensión sx. Guardemos los datos anteriores en un archivo con nombre Datos1.sx para poder utilizarlos
en las prácticas siguientes.
Para leer unos datos previamente almacenados debemos seleccionar las opciones File|Open. Aparece una ven-
tana en la que hay que seleccionar la unidad, el directorio y el nombre del archivo que queremos leer. Una vez
realizado lo anterior volvemos a tener disponibles los datos (ver Figura 8.12).
Figura 8.12: Pantalla del programa donde aparece la tabla de datos Datos1.
ESTAD ÍSTICA DESCRIPTIVA UNIDIMENSIONAL 243
Una vez que tenemos disponibles los datos del archivo Datos1.sx, es posible que detectemos un error, o bien
que deseemos añadir nuevos datos y reorganizarlos. Todas estas operaciones se realizan seleccionando la opción
Data del menú principal.
Para modificar un dato nos situaremos sobre él con el ratón o bien utilizando las teclas ↑, ↓, ← y →. Este quedará
recuadrado y podremos modificarlo. Después de realizar cualquier modificación no hay que olvidar volver a
grabar nuestra tabla de datos. Cualquier modificación de un dato no surge efecto hasta que no es pulsada la tecla
de entrada ( ); en cualquier momento podemos abandonar la edición de una dato pulsando la tecla de escape
(ESC).
Si queremos añadir una nueva fila de datos (lo que denominamos un nuevo caso) basta con que nos situemos en
la primera fila disponible y comencemos a rellenar las diferentes casillas. Por el contrario, si deseamos borrar una
fila completa de la tabla, o varias filas, podemos proceder de dos formas distintas. La manera rápida de hacerlo es
seleccionar con el ratón las filas que deseamos eliminar (que deben ser contiguas) y pulsar la tecla Ctrl+X. La otra
forma de hacerlo es seleccionar las opciones Data|Delete|Cases y nos aparece una ventana (ver Figura 8.13)
solicitándonos los números de los casos primero y último que deseamos eliminar (se borrarán todos los casos entre
el primero y el último, ambos incluidos). Una vez han sido borrados los casos, se vuelven a renumerar los casos,
de forma que siempre sean consecutivos.
Figura 8.13: Pantalla del programa donde aparecen los casos que deseamos borrar. Debemos recordar que esto
mismo se puede realizar con el uso de teclas calientes; concretamente debemos marcar las filas y
pulsar Ctrl+X.
¿Qué ocurre si nos equivocamos al borrar los casos? Si no hemos guardado el archivo en el disco, podemos
volver a leer el archivo original de datos. Sin embargo, si las modificaciones ya han sido almacenadas entonces
sólo podemos insertar nuevos casos (lı́neas de la tabla) y volver a introducir los datos. Esto se consigue con las
opciones Data|Insert|Cases con lo cual el programa nos solicita que introduzcamos el número de casos que
queremos insertar y el caso por el que queremos comenzar (ver Figura 8.14).
Figura 8.14: Pantalla del programa que nos permite insertar nuevos casos.
Los datos numéricos se pueden introducir de muchas maneras y con diferentes grados de exactitud. Pensemos,
por ejemplo, en la altura. Como estamos considerando el metro como unidad de medida, es posible que aparezcan
datos de la forma 2, 1.8, 1.75 o incluso 1.625. Sin embargo, lo razonable es que todos los datos tengan un
formato común, por ejemplo 2 decimales. Esto se puede conseguir con las opciones Data|Column Formats
(ver Figura 8.15), que nos permite modificar el formato de las diferentes columnas, tanto numéricas como de
244 MATEM ÁTICAS
caracteres. En el caso de la variable ALTURA lo razonable es seleccionar el formato numérico Decimal con 3
dı́gitos significativos (Significant Digits).
Figura 8.15: Pantalla del programa que nos permite modificar el formato de las diferentes columnas (tanto
numéricas como de caracteres).
Otro problema que se nos puede plantear con los datos es la utilización de abreviaturas. Por ejemplo, en la columna
OPINION hemos utilizado 0, 1, 2, 3 y 4 para referirnos a ‘Mala’, ‘Regular’, ‘Normal’, ‘Buena’ y ‘Excelente’; sin
embargo, dentro de varios meses es posible que pensemos que dichos números se refieren a otros datos. Por tanto,
serı́a conveniente poder asignarle a cada valor de la variable su significado; en nuestro caso, 0=Mala, 1=Regular,
2=Normal y ası́ sucesivamente. Para ello debemos seleccionar las opciones Data|Labels|Value Labels y
rellenar los campos que nos ofrece (ver Figura 8.16). Por ejemplo, dentro de Define Label ponemos 4 en
Value y ‘Excelente’ en Label; para que la asignación sea efectiva debemos pulsar el botón I , con lo que se
almacena en la columna Value Labels.
Figura 8.16: Pantalla del programa que nos permite asignar etiquetas a los diferentes valores num éricos de una
variable. Esta posibilidad no está presente para variables de fechas y de caracteres.
ESTAD ÍSTICA DESCRIPTIVA UNIDIMENSIONAL 245
Hay ocasiones en que los datos están correctos pero no nos termina de convencer el nombre que le hemos dado
a las variables. También puede ocurrir que nos haya faltado una variable o, por el contrario, que hayamos intro-
ducido una variable de más. Para solucionar estos problemas se utilizan las opciones Data|Rename Variables,
Data|Insert|Variables y Data|Delete|Variables (ver Figuras 8.11 y 8.17).
Figura 8.17: Pantallas del programa que permiten renombrar o borrar una variable.
Sin embargo, el nombre de las variables no refleja toda la información necesaria. Por ejemplo, el peso no indica
(aunque se sobreentiende) que está computado en kilogramos y la altura está, como es fácil deducir, en metros.
Puede haber ejemplos en los que no sea tan fácil deducirlo; en estos casos, lo conveniente es ‘etiquetar’ las
variables. Para ello seleccionamos las opciones Data|Labels|Variable Labels y añadimos en metros y en
kilogramos a las variables ALTURA y PESO, respectivamente (ver Figura 8.18).
Figura 8.18: Pantalla del programa que permite etiquetar una variable.
Finalmente, otra modificación que podemos hacer con las variables es reordenarlas. Para ello seleccionamos las
opciones Data|Reorder Variables y nos aparece una ventana similar a la ventana Delete Variables de la
Figura 8.17. Ahora sólo es necesario ir seleccionando las variables en el nuevo orden.
246 MATEM ÁTICAS
Exponenciación A^B
Multiplicación A * B
División A / B
Suma A + B
Resta A - B
En la Tabla 8.1 se encuentran recogidas las expresiones aritméticas que están permitidas. Debemos tener presente
que las operaciones se evalúan de izquierda a derecha. Todas las expresiones entre paréntesis se evalúan antes que
las que están fuera de los paréntesis y ante varios operadores en el mismo nivel, el orden de preferencia (de mayor
a menor) es el que figura en la Tabla 8.1.
Para construir una nueva variable mediante transformaciones de otras ya existentes, debemos seleccionar las op-
ciones Data|Transformations (basta pulsar Ctrl+T) y nos aparece la pantalla de la Figura 8.19. En esta
ventana tenemos tres partes fundamentales: a la izquierda aparece la lista de variables existentes, a la derecha
aparecen las funciones internas, y en el centro está el lugar destinado a la definición de la nueva variable.
Figura 8.19: Pantalla del programa que permite definir nuevas variables (o modificar variables ya existentes) me-
diante operaciones.
La expresión de la transformación debe ser tecleada manualmente y sólo podemos hacer uso de las variables y de
las funciones internas para insertarlas en los lugares adecuados (pulsando los correspondientes botones I y J ).
Sólo está permitida una transformación, aunque ésta puede ocupar varias lı́neas.
Una vez hemos terminado de teclear la expresión, pulsamos en Go. Si STATISTIX encuentra un error en nuestra
expresión nos lo indica convenientemente. Entonces debemos editar nuestra expresión y corregir el error, pulsando
la tecla Go de nuevo.
Supongamos que la variable NUEVAVAR es la variable que queremos crear para que almacene la transformación.
Si la transformación consiste en la suma de otras tres variables (por ejemplo, A, B y C) entonces debemos escri-
bir dentro del recuadro Transformation Expression la instrucción NUEVAVAR = A+B+C. Como STATISTIX
admite cuatro tipos de variables, podemos indicar el tipo de NUEVAVAR de la forma usual.
Por ejemplo, con datos1.sx vamos a crear una nueva variable, que llamaremos PesoTip con los pesos tipifica-
dos. La transformación llamada tipificación consiste en restar a cada dato la media aritmética y después dividir por
la desviación tı́pica (o por la cuasidesviación tı́pica). Para ello, en el recuadro Transformation Expression
ESTAD ÍSTICA DESCRIPTIVA UNIDIMENSIONAL 247
escribimos: PesoTip=( Peso- MEAn( Peso ) )/ SD( Peso ). Cuando la expresión utiliza una variable, se puede es-
cribir su nombre o se puede trasladar dicho nombre desde el recuadro Variables. Análogamente, las expresiones
como MEAn (media aritmética) o SD (cuasidesviación tı́pica) se pueden teclear o se pueden seleccionar haciendo
doble clic sobre la expresión del recuadro Functions.
En primer lugar leemos el archivo que contiene los datos (datos1.sx) utilizando las opciones File|Open. En-
tonces nos aparece la tabla de datos de la Figura 8.20.
Figura 8.20: Pantalla del programa donde aparece la tabla de datos Datos1.
Para poder obtener las medidas descriptivas de una muestra de datos cuantitativos debemos seleccionar las opcio-
nes Statistics|Summary Statistics|Descriptive Statistics. Entonces nos aparece la ventana mos-
trada en la Figura 8.21.
Figura 8.21: Pantalla del programa que permite elegir las variables a las que vamos a calcular sus principales
medidas descriptivas.
248 MATEM ÁTICAS
En el recuadro Descriptive Variables seleccionamos las variables de las cuales queremos hallar las medidas
descriptivas y en el recuadro Statistics to Report seleccionamos las medidas descriptivas que queremos
calcular. El significado de las medidas descriptivas que aparecen viene dado en la Tabla 8.2.
Tabla 8.2: Significado de las medidas descriptivas que aparecen en el recuadro Statistics to Report de la
ventana Descriptive Statistics.
Figura 8.22: Pantalla del programa que muestra las medidas descriptivas seleccionadas de las variables elegidas.
Ejercicio. Calcula el número total de observaciones, la suma de todos los datos, la media aritmética, la cuasides-
viación tı́pica, la cuasivarianza , el coeficiente de variación modificado, la mediana, los valores máximo
y mı́nimo, los cuartiles y la varianza de la variable ALTURA. En la Figura 8.23 aparece la solución.
Una opción interesante consiste en calcular las medidas descriptivas de un subconjunto de datos de la muestra
original. Esto se consigue seleccionando la variable por la que queremos agrupar los datos, para lo cual debemos
escribir dicha variable en el recuadro Groupin Variable (0pt). En el ejercicio anterior podemos agrupar
según la variable OPINION y el resultado obtenido (seleccionando las medidas Mean, Median y Biased var.)
aparece en la Figura 8.24.
El programa nos permite calcular cualquier percentil, medida descriptiva que generaliza a la mediana. Para ello
debemos seleccionar las opciones Statistics|Summary Statistics|Percentiles. Posteriormente debe-
ESTAD ÍSTICA DESCRIPTIVA UNIDIMENSIONAL 249
Figura 8.23: Pantalla del programa que muestra las medidas descriptivas seleccionadas de la variable ALTURA.
mos indicar, en el recuadro Percentiles Variables, las variables a las cuales vamos a calcular los percentiles
y, en el recuadro Percentiles, aquellos que queremos determinar (ver Figura 8.25).
Ejercicio. Calcula el primer cuartil, el tercer cuartil y el segundo decil de la variable PESO.
Con STATISTIX podemos calcular las distribuciones de frecuencias para una variable estadı́stica discreta o conti-
nua. El programa determina la frecuencia absoluta, el porcentaje (y por tanto la frecuencia relativa), la frecuencia
acumulada absoluta y el porcentaje acumulado (y por tanto la frecuencia relativa acumulada). Para conseguir la
distribución de frecuencias debemos seleccionar las opciones Statistics|Summary Statistics|Frequency
Distribution y nos aparece una ventana para seleccionar las variables estadı́sticas de las cuales queremos calcu-
lar sus distribuciones de frecuencias (ver Figura 8.26).
Si queremos agrupar los datos en intervalos de la misma amplitud, en el recuadro Bin Size (Optional) se
especifica el valor mı́nimo de las observaciones (Low), el valor máximo (High) y la amplitud de los intervalos
(Step). Hay que indicar que los intervalos son cerrados por la izquierda y abiertos por la derecha, salvo el último
que es cerrado por ambos lados. Si el recuadro Bin Size (Optional) se deja en blanco, entonces los datos no
se agruparán en intervalos. En la Figura 8.27 se muestra la distribución de frecuencias de la variable ALTURA (con
datos sin agrupar en intervalos).
Ejercicio. Determina la distribución de frecuencias de la variable PESO cuando los datos se agrupan en intervalos
de longitud 5 kilogramos comenzando en el valor 45 kilogramos.
Las posibilidades gráficas del programa STATISTIX son muy reducidas: sólo permite dibujar histogramas de fre-
cuencias absolutas y polı́gono de porcentajes acumulados, ya que trata las variables cuantitativas como si fuesen
250 MATEM ÁTICAS
Figura 8.24: Pantalla del programa que muestra las medidas descriptivas seleccionadas de la variable ALTURA pero
agrupadas según la variable OPINION.
continuas (aunque sean discretas). Para conseguir las representaciones gráficas debemos seleccionar las opcio-
nes Statistics|Summary Statistics|Histogram y nos aparece una ventana para seleccionar la variable
estadı́stica de la cual queremos representar gráficamente su histograma (ver Figura 8.28).
En el recuadro X-Axis (Optional) el usuario puede especificar el valor mı́nimo (Low), el valor máximo (High)
y la amplitud de los intervalos (Step) que se van a utilizar en el histograma. En el recuadro Graph Type podemos
seleccionar Histogram o Cumulative Distribution, según queramos dibujar el histograma de frecuencias
absolutas o el polı́gono de porcentajes acumulados, respectivamente. Finalmente, si queremos que se superponga
la gráfica de la curva normal, debemos seleccionar la opción Display Normal Curve. En la Figura 8.29 se
muestra el histograma de frecuencias absolutas para la variable EDAD.
CANDEL, J.; MARIN, A. y RUIZ, J.M. Estadı́stica aplicada I: Estadı́stica descriptiva. Barcelona: DM–PPU,
1991. Lecciones 1 y 2.
6. PREGUNTAS DE EVALUACIÓN
E.8.1. Para obtener información acerca del porcentaje de albúmina en el suero proteico de personas normales, se
analizaron muestras de 40 personas, entre 2 y 40 años de edad, con los siguientes resultados:
ESTAD ÍSTICA DESCRIPTIVA UNIDIMENSIONAL 251
Figura 8.25: Pantalla del programa que permite seleccionar las variables estadı́sticas para las que vamos a calcular
determinados percentiles.
Figura 8.26: Pantalla del programa que permite seleccionar las variables para las que vamos a calcular las distri-
buciones de frecuencias.
700 2 620 4 620 8 680 4 650 2 660 3 700 7 720 8 680 7 710 9
640 4 600 4 670 0 620 9 650 9 670 5 660 6 670 8 730 5 630 1
720 3 730 4 700 1 700 0 680 3 650 0 720 1 660 1 650 5 620 0
630 3 720 4 690 4 710 3 700 2 700 4 640 1 690 1 660 4 650 2
a) Agrupar los datos en intervalos de la misma amplitud aplicando la regla de Sturges. Hay que es-
pecificar los extremos de los intervalos, la marca de clase, frecuencia absoluta, frecuencia relativa,
frecuencia acumulada absoluta y frecuencia acumulada relativa. Calcular la media y la desviación
tı́pica, directamente y mediante codificación.
b) Agrupar de nuevo los datos sabiendo que la amplitud de los intervalos es 1.
E.8.2. Los siguientes datos corresponden al nivel de glucosa en sangre de diez niños:
56 62 63 65 65 65 65 68 70 72
Figura 8.27: Pantalla del programa que muestra la distribución de frecuencias de la variable ALTURA.
Figura 8.28: Pantalla del programa que permite seleccionar la variable para la que vamos a representar su histo-
grama.
E.8.3. En un mismo examen de una asignatura, pasado a dos clases de 40 alumnos, se han registrado las siguientes
calificaciones:
2 3 7 5 4 6 7 5 6 7
clase 8 4 3 7 5 6 9 5 7 2
A 7 4 8 5 6 5 7 8 5 3
6 5 8 4 2 5 4 5 6 7
2 5 3 4 7 9 5 2 7 4
clase 8 3 5 8 7 9 3 2 4 1
B 10 9 4 8 6 9 3 3 7 1
2 8 6 7 3 6 9 7 4 8
Realizar un estudio estadı́stico de las calificaciones en cada clase y decir qué conclusiones pueden sacarse
de dicho estudio. ¿Son ambas clases muy similares por lo que respecta a la variable calificación, o por el
contrario son muy diferentes?
ESTAD ÍSTICA DESCRIPTIVA UNIDIMENSIONAL 253
Histogram
15
10
Frequency
0
18 19 20 21 22 23 24 25
EDAD
Figura 8.29: Pantalla del programa que muestra el histograma de frecuencias de la variable EDAD.
E.8.4. Los siguientes datos corresponden a los precios (en cientos de pesetas) de una colección de 30 libros.
27 40 12 3 30 16 20 21 30 12
45 18 25 22 35 24 37 12 21 7
35 17 21 27 14 15 25 45 12 24
a) Agrupar los datos en intervalos de la misma amplitud (mediante la regla de Sturges) y clasificarlos
en una nueva tabla que contenga la marca de clase, la frecuencia absoluta, la frecuencia relativa y la
frecuencia acumulada. Dibujar el histograma de frecuencias absolutas.
b) Calcular el séptimo decil. Compararlo con el valor que resultarı́a si lo hallásemos a partir de los datos
agrupados en intervalos.
c) Calcular un coeficiente de asimetrı́a e interpretarlo.
E.8.5. El número de veces que fueron consultados 30 artı́culos de investigación archivados en una hemeroteca
(durante el año pasado) viene dado por la siguiente tabla.
18 25 20 24 19 23 21 22 20 22
23 19 21 24 21 22 20 21 22 21
20 24 21 19 23 21 22 23 22 23
a) Calcular la mediana y la mediana de las desviaciones respecto de la mediana. Deducir si los datos
están cerca de la mediana.
b) Calcular la media y la desviación tı́pica. Deducir si los datos están cerca de la media.
E.8.6. a) Agrupar los datos del ejercicio anterior en intervalos de la misma amplitud y clasificarlos en una
nueva tabla en la que aparezca la marca de clase, la frecuencia absoluta y la frecuencia acumulada.
b) A partir de la agrupación en intervalos anterior, calcular de nuevo la media y la mediana. Comparar
estos dos nuevos valores con los resultados obtenidos en el ejercicio anterior (datos no agrupados en
intervalos).
E.8.7. El número de personas que visitan diariamente un centro de información fue observado durante 74 dı́as
elegidos al azar, y los resultados fueron:
254 MATEM ÁTICAS
no de personas 47 59 62 64 71 76 78 80
no de dı́as 4 6 10 17 16 10 7 4
E.8.8. Las personas que aprobaron una determinada oposición tienen la siguiente distribución por edades:
ANOTACIONES
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
CAPÍTULO 9
ESTADÍSTICA DESCRIPTIVA BIDIMENSIONAL
a) Cuando sobre cada individuo se observan simultáneamente dos caracterı́sticas cuantitativas ¿cómo se orga-
nizan y representan gráficamente esos datos bidimensionales?
b) ¿Cómo se puede saber si dos variables estadı́sticas están relacionadas de forma lineal, exponencial, potencial
o parabólica?
c) ¿Se puede predecir el valor de una variable sabiendo el valor de otra variable que está relacionada con ella
de forma lineal, exponencial, potencial o parabólica?
Cuando sobre cada individuo de una población se observan simultáneamente dos caracterı́sticas cuantitativas, que
unidimensionalmente podrı́amos representar separadamente por las variables X e Y , entonces se dice que se está
observando una variable estadı́stica bidimensional y se representa por (X, Y ).
El conjunto de valores bidimensionales de la variable junto con sus frecuencias asociadas dará lugar a la corres-
pondiente distribución bidimensional de frecuencias.
Si el número de datos bidimensionales es pequeño, los datos se disponen en dos columnas (o en dos filas)
sobre las que se emparejan los correspondientes valores unidimensionales de una misma realización de la
variable bidimensional, como se expresa en la tabla siguiente:
variable X variable Y
x1 y1
x2 y2
.. ..
. .
xn yn
ESTAD ÍSTICA DESCRIPTIVA BIDIMENSIONAL 257
fij
hij = . (9.1)
n
Supongamos que tenemos los datos bidimensionales organizados en una tabla de doble entrada como la Tabla 9.1.
La suma de las frecuencias absolutas conjuntas de la fila i−ésima, fi∗ , es igual al número de individuos en la clase
Ai de la variable X, independientemente del valor de Y , y se llama frecuencia absoluta marginal de la clase Ai
de la variable X:
fi∗ = fi1 + fi2 + · · · + fik .
Análogamente, la suma de las frecuencias absolutas conjuntas de la columna j−ésima, f∗j , es igual al número
de individuos en la categorı́a Bj de la variable Y , y se llama frecuencia absoluta marginal de la clase Bj de la
variable Y :
f∗j
h∗j = . (9.3)
n
258 MATEM ÁTICAS
Si de la Tabla 9.1 consideramos la primera y la última columna obtenemos la distribución marginal de frecuencias
absolutas de la variable X:
X fi∗
A1 f1∗
.. ..
. .
Ai fi∗
.. ..
. .
Ar fr∗
suma n
Análogamente, si consideramos la primera y la última fila de la Tabla 9.1, obtenemos la distribución marginal de
frecuencias absolutas de la variable Y :
Y f∗j
B1 f∗1
.. ..
. .
Bj f∗j
.. ..
. .
Bk f∗k
suma n
Denotaremos por X/yj a la variable X condicionada a que Y tome el valor yj . La distribución de frecuencias
absolutas condicionadas de X/yj se obtiene de la Tabla 9.1 considerando la primera columna y la columna de la
clase Bj ; es decir:
X/yj fij
A1 f1j
.. ..
. .
Ai fij
.. ..
. .
Ar frj
suma f∗j
fij
hi/j = . (9.4)
f∗j
Análogamente, denotaremos por Y /xi a la variable Y condicionada a que X tome el valor xi . La distribución de
frecuencias absolutas condicionadas de Y /xi se obtiene de la Tabla 9.1 considerando la primera fila y la fila de la
clase Ai ; es decir:
ESTAD ÍSTICA DESCRIPTIVA BIDIMENSIONAL 259
Y /xi fij
B1 fi1
.. ..
. .
Bj fij
.. ..
. .
Bk fik
suma fi∗
fij
hj/i = . (9.5)
fi∗
lo que es equivalente a:
fi1 fi2 fij fik
= = ··· = = ··· = ∀i ,
f∗1 f∗2 f∗j f∗k
y por tanto:
fij fi1 + fi2 + · · · + fij + · · · + fik
= ∀i, j ,
f∗j f∗1 + f∗2 + · · · + f∗j + · · · + f∗k
fi∗ f∗j
fij = ∀i, j ,
n
o su equivalente:
hij = hi∗ h∗j , ∀i, j ,
es decir, las frecuencias relativas conjuntas son iguales al producto de las correspondientes frecuencias relativas
marginales.
260 MATEM ÁTICAS
Los métodos para determinar la existencia y el grado de relación entre dos variables cuantitativas deben ser capaces
también de discriminar entre los tipos generales de relación que hay:
a) Se dice que dos variables cuantitativas X e Y mantienen una relación directa cuando los valores altos en
Y tienden a emparejarse con valores altos en X, los valores intermedios en Y tienden a emparejarse con
valores intermedios en X, y los valores bajos en Y tienden a emparejarse con valores bajos en X.
b) Se dice que dos variables cuantitativas X e Y mantienen una relación inversa cuando los valores altos en
Y tienden a emparejarse con valores bajos en X, los valores intermedios en Y tienden a emparejarse con
valores intermedios en X, y los valores bajos en Y tienden a emparejarse con valores altos en X.
c) Se dice que no hay relación entre dos variables cuantitativas cuando no existe un emparejamiento sistemático
entre ellas en función de sus valores.
En una buena representación gráfica conjunta de dos variables estadı́sticas cuantitativas debe apreciarse fácilmente
si existe relación entre las variables y de qué tipo es. Una representación gráfica que cumple esta condición es el
diagrama de dispersión, que también se puede llamar nube de puntos.
• Si los datos no están agrupados en intervalos (como en la tabla siguiente), entonces el diagrama de dispersión se
hace como se muestra en la Figura 9.1.
35
30
25
20
15
10
0 X
60 70 80 90 100 110 120 130
• Si los datos están agrupados en intervalos (como en la tabla siguiente), entonces el diagrama de dispersión se
hace como se muestra en la Figura 9.2.
50
40
30
20
10
0 X
25 75 125 175 225 275 325
2.4. Covarianza
A partir de las distribuciones marginales de X y de Y se pueden calcular las medidas descriptivas de las variables
X eY.
De entre las medidas descriptivas bidimensionales, la más utilizada es la Covarianza entre X e Y que se calcula
de la siguiente forma:
1) Si los datos se tabulan en dos columnas (o dos filas), la covarianza entre X e Y es:
X
n X
n
(xi − x)(yi − y) xi yi
i=1 i=1
sxy = = − xy.
n n
2) Si los datos se organizan en una tabla de doble entrada como la Tabla 9.1, la covarianza entre X e Y es:
X
r X
k X
r X
k
(xi − x)(yj − y)fij xi yj fij
i=1 j=1 i=1 j=1
sxy = = − x y,
n n
donde xi es la marca de clase de la clase Ai , yj es la marca de clase de la clase Bj y fij es la frecuencia
absoluta conjunta de la clase bidimensional Ai × Bj .
1) Si los datos se tabulan en dos columnas (o dos filas), la cuasicovarianza entre X e Y es:
X
n
(xi − x)(yi − y)
i=1
Sxy = .
n−1
262 MATEM ÁTICAS
2) Si los datos se organizan en una tabla de doble entrada como la Tabla 9.1, la cuasicovarianza entre X e Y
es:
Xr X k
(xi − x)(yj − y)fij
i=1 j=1
Sxy = ,
n−1
donde xi es la marca de clase de la clase Ai , yj es la marca de clase de la clase Bj y fij es la frecuencia
absoluta conjunta de la clase bidimensional Ai × Bj .
La covarianza (y, por tanto, la cuasicovarianza) es capaz de discriminar entre los dos tipos de relación lineal pues:
La regresión consiste en sustituir la nube de puntos correspondiente a una distribución bidimensional por la función
matemática que mejor se ajuste a la nube de puntos. La correlación estima la “fuerza” con que las variables están
relacionadas.
La curva de regresión es la curva ideal hacia la que tienden los puntos del diagrama de dispersión.
Si tenemos una nube de puntos {(xi , yi ), i = 1, 2, . . . , n} y queremos ajustarle una curva cualquiera y =
f (x, a, b, . . .) con parámetros a, b, . . ., la determinación de éstos se hace minimizando la siguiente expresión:
X
n
D= [yi − f (xi , a, b, . . .)]2
i=1
Para saber si la curva y = f (x, a, b, . . .) se ajusta a los puntos {(xi , yi ), i = 1, 2, . . . , n} calculamos el coeficiente
de determinación:
X n
[yi − f (xi )]2
R2 = 1 − i=1
.
Xn
2
(yi − y)
i=1
Este coeficiente verifica:
1) 0 6 R2 6 1.
2) Si R2 = 1, entonces el ajuste es perfecto.
3) Si R2 = 0, entonces la función y = f (x) no se ajusta en absoluto a los puntos.
4) Cuanto más se aproxime R2 a 1, mejor es el ajuste.
ESTAD ÍSTICA DESCRIPTIVA BIDIMENSIONAL 263
La covarianza carece de unos valores máximo y mı́nimo estables, comunes a todos los casos, que permitan su
interpretación directa. La solución a este problema consiste en dividir la covarianza por el producto de las desvia-
ciones tı́picas marginales. Este ı́ndice se conoce con el nombre de coeficiente de correlación lineal de Pearson, y
se denota por la letra r; o sea:
sxy
r= , (9.6)
sx sy
donde sx es la desviación tı́pica de la variable X y sy es la desviación tı́pica de la variable Y .
Si la tabulación de los datos se ha hecho en dos columnas, entonces una fórmula alternativa equivalente a la
expresión 9.6 es la siguiente:
! n !
Xn Xn X
n xi yi − xi yi
r=v i=1
!2 v
i=1 i=1
!2 .
u n u n
u X X
n u X X
n
tn x2i − xi tn yi2 − yi
i=1 i=1 i=1 i=1
La razón principal por la que la covarianza no puede considerarse un ı́ndice de dependencia lineal entre dos
variables es la dificultad de su valoración dado que carece de un máximo y un mı́nimo estables. Pero el coeficiente
de correlación lineal no tiene esa dificultad ya que este ı́ndice no puede valer más de 1 ni menos de −1, es decir:
−1 6 r 6 1 .
a) Si r = 1 entonces existe una dependencia lineal directa exacta entre las variables X e Y . Los puntos del
diagrama de dispersión están sobre una lı́nea recta de pendiente positiva.
b) Si r = −1 entonces existe dependencia lineal inversa exacta entre X e Y . Los puntos del diagrama de
dispersión están sobre una lı́nea recta de pendiente negativa.
c) Si r = 0 entonces no existe dependencia lineal entre X e Y .
d) Cuanto más se aproxime r a −1 o a 1, más dependencia lineal existe entre X e Y . Cuando esto ocurra, el
diagrama de dispersión se aproxima a una lı́nea recta.
e) Cuanto más se aproxime r a 0, más independencia lineal existe entre X e Y . Cuando esto ocurra, el
diagrama de dispersión no se aproxima a una recta.
f) Si r es positivo, entonces al aumentar el valor de la variable X, aumenta el valor de la variable Y .
g) Si r es negativo, entonces al aumentar el valor de la variable X, disminuye el valor de la variable Y .
La recta de regresión mı́nimo cuadrática de Y sobre X es la recta Ŷ = A + BX que mejor se ajusta (por el
método de mı́nimos cuadrados) a los puntos del diagrama de dispersión {(xi , yi ), i = 1, 2, . . . , n}. Esta recta nos
permitirá predecir Y a partir de los valores de X.
264 MATEM ÁTICAS
Igualando a cero las derivadas parciales de D respecto de A y de B obtenemos las siguientes ecuaciones normales:
P P
y = B xi + nA
P i P P
xi yi = B x2i + A xi
Si los datos están tabulados en dos columnas, las fórmulas de los coeficientes A y B que hacen mı́nima la expresión
9.7 son las siguientes:
! n !
X n Xn X
n xi yi − xi yi
i=1 i=1 i=1
B = !2 ,
X
n X
n
n x2i − xi
i=1 i=1
A = y − Bx.
Estas fórmulas son equivalentes a las siguientes:
sxy sy
B = =r ,
s2x sx
A = y − Bx.
Estas últimas fórmulas se pueden aplicar tanto si los datos están organizados en una tabla de dos columnas como
si lo están en una tabla de doble entrada.
En el caso del ajuste lineal (ajuste a una recta), el coeficiente de determinación es igual a:
s2xy
R2 = .
s2x s2y
Por tanto, (sólo en el caso del ajuste lineal) se cumple que el coeficiente de determinación es igual al cuadrado del
coeficiente de correlación lineal (R2 = r 2 ).
Si el coeficiente de correlación lineal está próximo a 1 o a −1 sabemos que existe bastante relación lineal entre las
variables X e Y y por tanto los puntos del diagrama de dispersión están próximos a la recta de regresión mı́nimo
cuadrática. En este caso, a partir de la ecuación de la recta de regresión de Y sobre X se puede calcular, de forma
aproximada, el valor de la variable Y cuando se conoce el valor de la variable X. Esta aproximación se conoce
también por el nombre de estimación, predicción o pronóstico. Similarmente, a partir de la ecuación de la recta
de regresión de X sobre Y se pueden predecir los valores de la variable X cuando se conocen los valores de la
variable Y .
Si el coeficiente de correlación lineal no está próximo a 1 o a −1, las ecuaciones de las rectas de regresión no nos
sirven para predecir los valores de una de las variables cuando se conocen los valores de la otra, pues los puntos
del diagrama de dispersión no están próximos a la recta de regresión mı́nimo cuadrática.
ESTAD ÍSTICA DESCRIPTIVA BIDIMENSIONAL 265
Se hace el cambio: Y 0 = ln Y , A0 = ln A. Entonces Y 0 = A0 + BX, con lo que se reduce a un ajuste lineal entre
las variables Y 0 y X (se pueden utilizar las ecuaciones normales). La bondad del ajuste nos lo da el coeficiente de
determinación, que coincide con el cuadrado del coeficiente de correlación lineal entre Y 0 y X.
Simplificando se obtiene:
P P P
P yi = An + B xi + C x2i
P P 2 P
xi yi = A xi + B xi + C x3i
P P P P
x2i yi = A x2i + B x3i + C x4i
A.9.1. Se está estudiando la relación existente entre los años de estudios realizados por los padres (X) y los años
de estudios realizados por los hijos (Y ). En una muestra de tamaño 7 se obtienen los siguientes resultados:
266 MATEM ÁTICAS
xi yi
12 12
10 8
6 6
16 11
8 10
9 8
12 11
Dibujar el diagrama de dispersión o nube de puntos. Hallar la covarianza, sxy , entre las dos variables. Hallar
el coeficiente de correlación lineal r. Hallar la ecuación de la recta de regresión mı́nimo cuadrática de Y
sobre X. Predecir el número de años de estudio de un hijo cuyo padre ha estudiado 14 años. Decir si esta
predicción es fiable. Hallar la ecuación de la recta de regresión mı́nimo cuadrática de X sobre Y . Predecir
el número de años de estudio de un padre cuyo hijo ha estudiado 15 años.
A.9.2. Determinar el grado de dependencia existente entre los años de estudio completados (X) y las faltas de
ortografı́a cometidas en un dictado (Y ) tal y como se encontró en la siguiente muestra de 10 entrevistados.
xi 10 3 12 11 6 8 14 9 10 2
yi 1 7 2 3 5 4 1 2 3 10
¿Cuántas faltas ortográficas tendrı́a un entrevistado que hubiese completado 13 años de estudio? ¿Es fiable
esta predicción?
A.9.3. Una factorı́a de una cierta marca de refrescos ha tomado al azar 18 semanas de un año, observando la
temperatura media, en grados centı́grados (X) correspondiente a cada una de ellas y la cantidad de refrescos
pedidos durante cada uno de dichos perı́odos, en miles (Y ). La información obtenida es la siguiente:
xi 10 28 12 31 30 19 24 5 9 15
yi 21 65 19 72 75 39 67 11 12 24
A.9.4. Se está estudiando la relación existente entre la edad de los hombres (X) y de las mujeres (Y ) a la hora de
contraer matrimonio. Se recogen los datos del año 1971 en la tabla siguiente:
¿Existe una dependencia lineal fuerte entre la edad de los hombres y la edad de las mujeres a la hora de
contraer matrimonio? Hacer una predicción de la edad de la esposa cuyo esposo tiene 25 años. ¿Es fiable
esta predicción? Hacer el diagrama de dispersión.
A.9.5. El precio, en pesetas, (X) y el número de páginas (Y ) de los libros contenidos en un catálogo vienen dados
por:
ESTAD ÍSTICA DESCRIPTIVA BIDIMENSIONAL 267
xi yi xi yi xi yi xi yi
19.950 496 27.500 392 21.000 240 12.000 342
9.950 208 12.500 200 15.000 278 21.000 340
17.500 300 25.000 280 27.500 420 17.000 207
15.000 448 8.000 120 10.500 128 35.000 440
12.000 200 5.950 220 9.950 249 7.500 88
30.000 288 9.950 200 35.000 392 21.000 351
32.500 324 32.500 468 20.000 400 25.000 292
35.000 525 24.000 539 27.500 300 37.250 464
37.500 384 30.000 400 15.000 240 24.000 344
25.000 250 30.000 320 16.000 230 12.500 130
18.000 200 35.000 736 12.000 144 22.500 382
15.000 224 22.000 516 38.000 336 25.000 403
30.000 384 37.500 700 37.750 550 20.000 249
25.000 256 20.000 400 30.000 478 18.000 182
17.500 215 30.000 656 17.250 437 38.500 458
17.000 278 9.500 191 9.950 288 3.500 63
20.000 376 19.500 464 18.500 496 30.000 400
22.500 421 20.500 348 18.000 236 21.500 278
32.500 450 30.000 352 12.000 143 27.500 508
30.000 243 32.500 598 17.000 284 16.000 256
12.000 202 27.500 392 28.000 520 30.500 368
15.000 251 24.000 472 38.500 758 15.000 275
21.000 320 36.500 591 25.000 413 12.500 112
35.000 460 14.500 282 27.500 394 38.000 458
12.000 342 21.000 340 17.000 207 7.500 83
Agrupar los datos de ambas variables en intervalos de clase. Determinar la distribución bidimensional de
frecuencias, ası́ como las distribuciones marginales de X y de Y . Hallar el coeficiente de correlación lineal.
Predecir el precio de un libro que tuviera 205 páginas. Decir si esta predicción es fiable.
A.9.6. Las calificaciones obtenidas por un grupo de alumnos en Biologı́a y Fı́sica son:
Biologı́a 3 4 6 7 5 8 7 3 5 4 8 5 5 8 8 8 5
Fı́sica 5 5 8 7 7 9 10 4 7 4 10 5 7 9 10 5 7
A.9.7. Se han tomado cinco muestras de glucógeno, de una cantidad fija cada una. Se les ha aplicado una can-
tidad X de glucogensa (en milimoles/litro) anotando en cada caso la velocidad de reacción Y , medida en
micromoles/minuto, obteniéndose los siguientes datos:
X 1 2 3 0’2 0’5
Y 18 35 60 8 10
a) ¿Se puede deducir que la velocidad de reacción aumenta con la concentración de glucogensa? Justifi-
car la respuesta.
b) Si a una de las muestras le hubiésemos aplicado una concentración de glucogensa de 20 5 milimo-
les/litro ¿cuál hubiese sido la velocidad de reacción? ¿Con qué grado de predicción?
A.9.8. Un psicólogo afirma en base a los datos obtenidos, que a medida que un niño crece, menor es el número
de respuestas inadecuadas que da. Los datos son:
268 MATEM ÁTICAS
X 2 3 4 4 5 5 6 7 7 9 9 10 11 11 12
Y 11 12 10 13 11 9 10 7 12 8 7 3 6 5 5
X Y 4 7 10 13 16 17
0 0
1 0 03 0 04 00 03 0 0 0
2 0 00 07 00 09 00 04 0 0
3 0 0 00 04 00 12 00 04 0
4 0 0 00 04 00 12 00 04 0
5 0 00 07 00 09 00 04 0 0
6 00 03 00 04 00 03 0 0 0
Calcular:
a) Distribuciones marginales de frecuencias absolutas.
b) Medias y varianzas marginales.
c) Recta de regresión de Y sobre X.
d) Coeficiente de correlación lineal.
A.9.10. Los datos de la tabla siguiente representan el resultado de un experimento consistente en exponer bacte-
rias, en perı́odos de 1 a 15 intervalos de 6 minutos, a la radiación de rayos X a 200 kilovoltios y contabilizar
el número de bacterias supervivientes. (X representa el número de intervalos de 6 minutos, e Y representa
los cientos de bacterias supervivientes).
X 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
Y 355 211 197 166 142 106 104 60 56 38 36 32 21 19 15
Ajustar a los datos una curva exponencial; representar gráficamente el resultado y comprobar la bondad del
ajuste.
A.9.11. Los datos de la tabla siguiente son el resultado de un estudio del efecto de la temperatura de cristalización
primaria (medida en grados centı́grados) de una solución, xi , sobre el contenido en fósforo (medido en
gramos por litro), yi .
xi yi
25 100 9
20 90 3
15 80 2
12 70 5
9 60 2
6 50 8
3 40 2
0 30 9
−3 20 8
−6 20 0
a) Representar gráficamente la nube de puntos. Determinar el modelo de curva adecuado para representar
la relación entre las variables y encontrar, por el método de mı́nimos cuadrados, los parámetros de la
curva.
ESTAD ÍSTICA DESCRIPTIVA BIDIMENSIONAL 269
A.9.12. Los datos de la tabla siguiente pertenecen a la medida de la temperatura (X) y la presión (Y ) en diferentes
lugares del Himalaya.
xi yi xi yi xi yi
290 211 2100 8 200 480 1930 4 160 959 1840 1
280 559 2100 2 200 212 1930 6 160 881 1840 6
270 972 2080 4 190 758 1910 4 160 817 1840 1
240 697 2020 5 190 490 1910 1 160 385 1830 2
230 726 2000 6 190 386 1900 6 160 235 1820 4
230 369 2000 1 180 869 1890 5 160 106 1810 9
230 030 1990 5 180 356 1880 8 150 928 1810 9
210 892 1970 0 180 507 1880 5 150 919 1810 0
210 928 1960 4 170 267 1850 7 150 376 1800 6
210 654 1960 3 170 221 1860 0
210 605 1950 6 170 062 1850 6
Explicar la presión en función de la temperatura mediante una parábola (por el método de mı́nimos cuadra-
dos).
Para una variable estadı́stica bidimensional, el gráfico más utilizado es el diagrama de dispersión. El progra-
ma dibuja estos diagramas si seleccionamos las opciones Statistics|Summary Statistics|Scatter Plot.
Entonces nos aparece una ventana como en la Figura 9.3 donde debemos seleccionar las variables implicadas
(X-Axis Variable e Y-Axis variable). Si deseamos agrupar los datos en intervalos (de una variable o de las
dos) entonces debemos rellenar los recuadros X-Axis (Optional) o Y-Axis (Optional), según la variable
que queramos agrupar.
Para una variable bidimensional es interesante hallar la matriz de varianzas y covarianzas corregidas. Dicha matriz
es la siguiente: 2
Sx Sxy
,
Sxy Sy2
donde Sx2 denota la cuasivarianza de X, Sy2 indica la cuasivarianza de Y , y Sxy representa la cuasicovarian-
za entre X e Y . La matriz de varianzas y covarianzas corregidas se puede obtener seleccionando las opciones
Statistics|Linear Models|Variance-Covariance. Entonces aparece una ventana (ver Figura 9.4) en la
que debemos seleccionar las variables estadı́sticas de las cuales queremos calcular su matriz de covarianzas corre-
gidas (en el recuadro Var-Covar Variables).
270 MATEM ÁTICAS
Figura 9.3: Pantalla del programa que permite seleccionar las variables para las que vamos a dibujar el diagrama
de dispersión.
Figura 9.4: Pantalla del programa que permite seleccionar las variables para las que vamos a calcular la matriz de
covarianzas.
Ejercicio. Calcula la matriz de varianzas y covarianzas corregidas de la variable bidimensional (PESO, ALTURA).
Para calcular el coeficiente de correlación lineal de Pearson entre dos variables estadı́sticas debemos seleccionar
las opciones Statistics|Linear Models|Correlations (Pearson) y nos aparece una ventana como en la
Figura 9.5. Tras pulsar el botón OK surge la ventana de resultados, con los coeficientes de correlación lineal entre
todas las variables seleccionadas. En nuestro ejemplo (ver Figura 9.6) el coeficiente entre las variables PESO y
ALTURA es de 00 9384, lo que significa que existe una dependencia lineal fuerte.
Ejercicio. Determina el coeficiente de correlación lineal de Pearson entre las variables ALTURA y PESO.
ESTAD ÍSTICA DESCRIPTIVA BIDIMENSIONAL 271
Figura 9.5: Pantalla del programa que permite calcular el coeficiente de correlación lineal de Pearson.
Figura 9.6: Pantalla con los resultados para la correlación entre el PESO y la ALTURA.
La recta de regresión permite estimar el valor de una variable estadı́stica conocido el valor de otra variable, siem-
pre que entre las dos variables estadı́sticas exista dependencia lineal. Cuanto mayor sea esta dependencia lineal,
mejor será la aproximación que nos da la recta de regresión. Para calcular la ecuación de la recta de regre-
sión mı́nimo cuadrática debemos seleccionar las opciones Statistics|Linear Models|Linear Regression
y nos aparece una ventana como en la Figura 9.7. En el recuadro Dependent Variable debemos poner la varia-
ble dependiente (la que está representada en el eje vertical) y en el recuadro Independent Variables la variable
independiente (la que está representada en el eje horizontal).
Por ejemplo, si en la variable dependiente ponemos ALTURA y en la variable independiente colocamos EDAD,
entonces se supone que queremos predecir la altura de un individuo conociendo su edad. La ventana de resultados
se muestra en la Figura 9.8. En dicha figura aparecen muchos valores que no estamos en condiciones de explicar
en este momento, ya que pertenecen a la parte de Estadı́stica Inferencial. Si la ecuación de la recta de regresión
de ALTURA sobre EDAD es ALTURA = A + B EDAD, entonces A = 10 40089 y B = 00 01306.
Para hacer una predicción debemos seleccionar las opciones Results|Prediction, escribiendo en el recuadro
Predictor Values el valor de la variable independiente para el cual queremos estimar el correspondiente va-
lor de la variable dependiente. En la casilla Specification Method debemos seleccionar la opción Valued
Method (ver Figura 9.9). Ası́, para una edad de 24.5 años el valor correspondiente de la altura es de 1.7207
metros.
Una vez hemos calculado la recta de regresión podemos realizar una representación gráfica de la misma. Para
272 MATEM ÁTICAS
Figura 9.7: Pantalla del programa que permite seleccionar las variables para las que vamos a calcular la recta de
regresión.
Figura 9.8: Pantalla del programa que muestra la recta de regresión de ALTURA sobre EDAD.
ello seleccionamos las opciones Results|Plots|Simple Regression Plot. En el gráfico resultante aparece
el diagrama de dispersión (con cruces), la recta de regresión (en color azul) y dos curvas (en color rojo), una por
cada lado de la recta de regresión, que delimitan una zona de confianza para los valores de la variable dependiente
(ver Figura 9.10).
Ejercicio. Halla la ecuación de la recta de regresión mı́nimo cuadrática de ALTURA sobre PESO. Represéntala
gráficamente y predice la altura de un alumno que pesa 60 kilogramos.
CANDEL, J.; MARIN, A. y RUIZ, J.M. Estadı́stica aplicada I: Estadı́stica descriptiva. Barcelona: DM–PPU,
1991. Secciones 3.1, 3.3, 4.1, 4.2, 4.3, 4.4, 4.6.
ESTAD ÍSTICA DESCRIPTIVA BIDIMENSIONAL 273
Figura 9.9: Pantalla del programa que permite estimar el valor de ALTURA para un valor de EDAD.
1.74
ALTURA
1.69
1.64
1.59
18 20 22 24 26
EDAD
ALTURA = 1.4009 + 0.0131 * EDAD 95% conf and pred intervals
Figura 9.10: Pantalla del programa que representa la recta de regresión de ALTURA sobre EDAD.
6. PREGUNTAS DE EVALUACIÓN
E.9.2. En una determinada empresa se ha realizado un estudio para determinar si la edad de los empleados está
relacionada con el número de dı́as de ausencia en el trabajo. Estos son los resultados:
Edad (X)
Dı́as de ausencia (Y ) (20,29] (29,38] (38,47] (47,56] (56,65]
(44,50] 0 1 8 7 16
(50,56] 2 6 10 2 4
(56,62] 5 9 5 0 1
(62,68] 14 6 2 2 0
E.9.3. Una empresa nacional dedicada a la producción de videojuegos pretende sacar al mercado dos nuevos
productos: uno para el segmento de 13 a 15 años y otro para el segmento de 16 a 18 años. Antes de fijar
el precio, la empresa contacta con un centro de estudios sociológicos para conocer la asignación semanal
de los jóvenes. Para ello, el centro extrae una muestra de 10 jóvenes y, entre otros datos, se les pregunta la
edad (X, en años) y su asignación semanal (Y , en miles de pesetas), obteniendo los siguientes datos:
Edad (X) 17 16 16 15 14 13 16 18 17 13
Asignación (Y ) 3 4 3 4 1 2 2 5 4 0
E.9.4. Un equipo investigador está analizando el comportamiento de los jóvenes españoles respecto del matri-
monio. Para ello extrae una muestra de 10 jóvenes parejas y les pasa un cuestionario. Entre las muchas
preguntas del cuestionario figura la edad a la que contrajeron matrimonio, obteniéndose los siguientes da-
tos:
X: Edad de la mujer 26 25 25 24 23 22 25 27 26 22
Y : Edad del hombre 26 27 26 27 24 25 25 28 27 23
E.9.5. Una editorial está interesada en conocer los hábitos de lectura de los españoles y determinar si existe alguna
relación con otras variables (nivel cultural, nivel económico, edad, etc.). Para ello se extrae una muestra de
10 personas y, entre otros datos, se les pregunta por el número de años de estudio (X) y por el número de
libros que suelen comprar cada trimestre (Y ). Los datos son los que recoge la siguiente tabla:
X 11 10 10 9 8 7 10 12 11 7
Y 3 4 3 4 1 2 2 5 4 0