Compendio Matematica PDF

CAPÍTULO 1
NÚMEROS Y FUNCIONES
1. INTERROGANTES CENTRALES DEL CAPÍTULO
• Números racionales o irracionales. • Ecuaciones de circunferencias, parábolas, elipses

• Recta (numérica) real. e hipérbolas.
• Intervalos abiertos y cerrados. • Función: Dominio y recorrido.
• Reglas de las desigualdades. • Variables independiente y dependiente.
• Valor absoluto de un número. • Gráfica de una función.
• Propiedades del valor absoluto.
• Función par, función impar.
• Desigualdad del triángulo.
• Traslaciones (horizontales y verticales) de fun-
• Sistemas de coordenadas rectangulares.
ciones.
• Fórmula de la distancia.
• Alargamiento y reflexión de funciones.
• Pendiente de una recta.
• Forma punto-pendiente de una recta. • Operaciones con funciones: +, -, *, /
• Forma pendiente-intersección de una recta. • Composición de funciones.
• Relación entre las pendientes de rectas paralelas • Funciones polinómicas, algebraicas y transcen-
y perpendiculares. dentes.
2. CONTENIDOS FUNDAMENTALES DEL CAPÍTULO
2.1. Números, desigualdades y valores absolutos
2.1.1. Los números reales
Todas las matemáticas se apoyan en los números y éstos constituyen la base del cálculo. Existen distintos tipos de
números: naturales (1, 2, 3, . . . ), enteros (. . . , −3, −2,
√ −1, 0, 1, 2, 3, . . . ), racionales (1/2, 3/5, −3/8, . . . ) e
irracionales (los que no son racionales; por ejemplo, 2). La unión de todos ellos constituye el conjunto de los
números reales que se suele escribir como R.
Para representar R se utiliza una lı́nea recta, denominada recta real. En dicha recta se escoge un punto, denomi-
nado origen, que representa al cero. La dirección positiva (derecha) indica el sentido de los valores crecientes, de
tal forma que los puntos a la derecha del origen indican números positivos mientras que los puntos a la izquierda
N ÚMEROS Y FUNCIONES 7
representan números negativos. El hecho más importante es que cada número real está asociado con un único
punto en la recta real y viceversa.
Una propiedad importante de los números reales es que pueden ordenarse: el número a es menor que el número
b, y se escribe a < b, si b − a es un número positivo. En otras palabras, a < b si, y sólo si, a está a la izquierda de
b en la recta real. Esta relación < posee las siguientes propiedades:
(1) Si a < b y b < c entonces a < c (propiedad transitiva).

(2) Si a < b y c < d entonces a + c < b + d.
(3) Si a < b entonces a + c < b + c.
(4) Si a < b y c > 0 entonces ac < bc.
(5) Si a < b y c < 0 entonces ac > bc.
Propiedades similares se tienen para las desigualdades >, 6 o >, las cuales se definen como sigue:
(1) El número a es mayor que el número b, y se escribe a > b, si a − b es un número positivo.

(2) El número a es menor o igual que el número b, y se escribe a 6 b, si a = b o b − a es un número positivo.
(3) El número a es mayor o igual que el número b, y se escribe a > b, si a = b o a − b es un número positivo.
2.1.2. Los intervalos
La relación de orden < permite definir unos subconjuntos especiales de R: los intervalos. Si a < c < b entonces
decimos que c está entre a y b; un intervalo determinado por los puntos a y b es el conjunto de puntos que están
entre a y b. Si en este conjunto incluimos o no los extremos (los puntos a y b) entonces tenemos los intervalos
abiertos, cerrados o semiabiertos (semicerrados). A continuación listamos las diferentes posibilidades:
(a, b) Intervalo abierto de extremos a y b es el conjunto (a, b) = {x|a < x < b}.
[a, b] Intervalo cerrado de extremos a y b es el conjunto [a, b] = {x|a 6 x 6 b}.
(a, b] [a, b) Intervalos semiabiertos (semicerrados) de extremos a y b son los conjuntos (a, b] = {x|a < x 6 b} y
[a, b) = {x|a 6 x < b}.
Los intervalos pueden ser acotados (como los anteriores) o no acotados. En este último caso pueden presentarse
las siguientes posibilidades:
(−∞, b) Intervalo abierto de extremo b no acotado inferiormente es el conjunto (−∞, b) = {x|x < b}.
(−∞, b] Intervalo cerrado de extremo b no acotado inferiormente es el conjunto (−∞, b] = {x|x 6 b}.
(a, ∞) Intervalo abierto de extremo a no acotado superiormente es el conjunto (a, ∞) = {x|x > a}.
[a, ∞) Intervalo cerrado de extremo a no acotado superiormente es el conjunto [a, ∞) = {x|x > a}.
(−∞, ∞) Intervalo abierto no acotado (ni superior ni inferiormente) es R.
Los sı́mbolos −∞ y ∞ son eso: sı́mbolos; no denotan números reales y sólo se utilizan para expresar de forma
precisa ciertas afirmaciones o ciertos conjuntos.
8 MATEM ÁTICAS
2.1.3. El valor absoluto
El valor absoluto de un número real a se denota por |a| y se define como sigue:

a si a > 0
|a| =
−a si a < 0
Geométricamente, |a| mide la distancia que hay entre el número a y el origen 0 en la recta numérica real (ver
Figura 1.1).
• |b|
|a| •
• •
b a
Figura 1.1: Representación del valor absoluto.
El valor absoluto satisface las siguientes propiedades:
(1) |ab| = |a||b|

a |a|

(2) = , b 6= 0
b |b|
√
(3) |a| = a2
(4) |an | = |a|n
(5) −|a| 6 a 6 |a|
(6) |a| 6 r si, y sólo si, −r 6 a 6 r
(7) r 6 |a| si, y sólo si, r 6 a o a 6 −r
(8) |a + b| 6 |a| + |b| (desigualdad triangular)
2.2. Geometrı́a plana: coordenadas y rectas
2.2.1. El plano cartesiano
De manera similar a como hemos asociado los números reales con puntos de una recta, ahora podemos relacionar
los puntos del plano con pares ordenados de números reales. Para empezar se trazan dos rectas perpendiculares que
se cortan en un punto que denominaremos origen. Habitualmente, una de las rectas es horizontal y se denomina
eje x o eje de abcisas, y la otra recta es vertical y se denomina eje y o eje de ordenadas. Estas dos rectas dividen
al plano en cuatro partes llamadas cuadrantes.
Cualquier punto P del plano tiene asociado un par ordenado (a, b) de números reales, llamados coordenadas del
punto. La manera de conseguirlos es la siguiente: por el punto P se trazan dos rectas paralelas a los ejes las cuales
intersectan a los ejes en dos puntos que constituyen las coordenadas. El número a se denomina coordenada x o
abcisa, y el número b se llama coordenada y u ordenada (ver Figura 1.2).
6 P (a, b)
-
b 5
3
II 2
I
6
−2 −1 1 2 3 4 5
−1
a
−2
III IV
Figura 1.2: Representación de las coordenadas de un punto.
Este sistema de coordenadas fue “inventado” por el matemático francés René Descartes y, en su honor, se deno-
mina sistema de coordenadas cartesianas, aunque también es habitual el nombre de sistema de coordenadas
rectangulares.
Aunque (a, b) ha sido utilizado tanto para denotar un intervalo de la recta real como para denotar un par ordenado
de números reales, esperamos que no haya confusión, pues en cada momento sólo una interpretación será posible.
(x1 , y1 )
y1
d
|y2 − y1 |
y2 (x2 , y2 )
x1 x2
|x2 − x1 |
Figura 1.3: Distancia entre dos puntos del plano.
La distancia entre dos números reales a y b es el valor absoluto |b − a|. Para definir la distancia entre dos puntos
del plano debemos recurrir al Teorema de Pitágoras (ver Figura 1.3). La distancia entre los puntos (x1 , y1 ) y
(x2 , y2 ) del plano se define como
p
d= |x2 − x1 |2 + |y2 − y1 |2
10 MATEM ÁTICAS
2.2.2. Rectas en el plano
La pendiente de una recta (no vertical) es el número de unidades que la recta sube (o baja) por cada unidad de
cambio horizontal de izquierda a derecha. En otras palabras, la pendiente de la recta determinada por los puntos
(x1 , y1 ) y (x2 , y2 ) viene dada por
∆y y2 − y1
m= = , x1 6= x2 .
∆x x2 − x1
El orden en que se resta no tiene importancia, siempre y cuando se siga el mismo criterio en el numerador y en el
denominador.
Para determinar la ecuación de una recta podemos seguir varios pasos, según los datos de que dispongamos.
Ecuación punto-pendiente: Si conocemos la pendiente m de la recta y un punto (a, b), entonces la ecuación es
y − b = m(x − a).
Ecuación pendiente-intersección: Si conocemos la pendiente m y el punto de corte b con el eje de ordenadas,

entonces la ecuación es
y = mx + b.
Ecuación general: Toda recta admite una ecuación de la forma
Ax + By + C = 0,
donde A, B, C son constantes.
Utilizando la pendiente podemos saber si dos rectas son paralelas o perpendiculares.
Rectas Paralelas: Dos rectas (no verticales) son paralelas si, y sólo si, sus pendientes son iguales.
Rectas Perpendiculares: Dos rectas (no verticales) son perpendiculares si, y sólo si, sus pendientes m1 y m2
son inversas y opuestas, es decir, m1 m2 = −1.
2.3. Gráficas de ecuaciones de segundo grado
Un conjunto de elementos que poseen una determinada propiedad, y que sólo ellos la poseen, constituye un lugar
geométrico. Esta noción se utiliza habitualmente cuando estos conjuntos son una recta, una circunferencia, una
elipse, etc.
A modo de ejemplo, diremos que una ‘recta’ es el lugar geométrico de los puntos alineados con un punto dado A
y con una dirección dada v; es decir, un punto P está en la recta si, y sólo si, el vector determinado por los puntos
A y P es paralelo al vector v.
Dentro de la geometrı́a cartesiana, un punto P de coordenadas (x, y) pertenece a un lugar geométrico si, y sólo
si, sus coordenadas satisfacen una relación o ecuación. La ecuación de un lugar geométrico de puntos P de
coordenadas (x, y) es una ecuación entre las variables x e y tal que las coordenadas (x, y) de cualquier punto P
satisfacen dicha ecuación si, y sólo si, el punto P pertenece al lugar geométrico.
2.3.1. Circunferencias: (x − a)2 + (y − b)2 = r 2
Una circunferencia es el lugar geométrico de los puntos del plano que equidistan de un punto fijo llamado centro.
La distancia constante al centro se denomina radio (ver Figura 1.4).
y 6
P (x, y)
•
r
•
C(a, b)
-
0 x
Figura 1.4: Representación de una circunferencia.
Para determinar la ecuación procedemos como sigue. Sea P (x, y) un punto genérico de la circunferencia de centro
ppunto C(a, b) y radio r. Entonces la ecuación geométrica d(P, C) = r se transforma en la ecuación analı́tica
el
(x − a)2 + (y − b)2 = r y elevando al cuadrado obtenemos
(x − a)2 + (y − b)2 = r 2 .
Si desarrollamos los cuadrados obtenemos la siguiente ecuación
x2 + y 2 + mx + ny + p = 0,
denominada ecuación general de la circunferencia.
2.3.2. Elipses: (x/a)2 + (y/b)2 = 1
Una elipse es el lugar geométrico de los puntos del plano cuya suma de distancias a dos puntos fijos, llamados
focos, es constante.
Para determinar la ecuación, denotemos por F y F 0 los focos de la elipse, y sean 2a y 2c la suma de distancias
a los focos y la distancia focal, respectivamente. Sea P (x, y) un punto genérico y denotemos por r = P F y
r 0 = P F 0 los radios vectores, de tal forma que r + r 0 = 2a. Por fijar una referencia, supongamos que los focos
son los puntos F (c, 0) y F 0 (−c, 0). Entonces
p
r = (x − c)2 + y 2 ,
p
r0 = (x + c)2 + y 2 .
Un cálculo sencillo conduce a
r = a + ex,
r0 = a − ex,
donde e = c/a es la excentricidad de la elipse. Comparando las dos expresiones para r (o r 0 ) anteriores deducimos,
después de laboriosos cálculos, que
x 2 y 2
+ = 1,
a b
siendo b2 = a2 − c2 . Esta es la ecuación reducida o canónica de la elipse (ver Figura 1.5).
12 MATEM ÁTICAS
y 6
(0, b)
•
(−a, 0)
r r0 (a, 0)
• • • • -
0 x
F F0
•
(0, −b)
Figura 1.5: Representación gráfica de una elipse.
2.3.3. Hipérbolas: (x/a)2 − (y/b)2 = 1
Una hipérbola es el lugar geométrico de los puntos del plano cuya diferencia de distancias a dos puntos fijos,
llamados focos, es constante.
Para determinar la ecuación, denotemos por F y F 0 los focos de la hipérbola, y sean 2a y 2c la diferencia de
distancias a los focos y la distancia focal, respectivamente. Sea P (x, y) un punto genérico y denotemos por
r = P F y r 0 = P F 0 los radios vectores, de tal forma que r − r 0 = 2a. Por fijar una referencia, supongamos que
los focos son los puntos F (c, 0) y F 0 (−c, 0). Entonces
p
r = (x − c)2 + y 2 ,
0
p
r = (x + c)2 + y 2 .
Un cálculo sencillo conduce a
r = ex + a,
r0 = ex − a,
donde e = c/a es la excentricidad de la hipérbola. Comparando las dos expresiones para r (o r 0 ) anteriores
deducimos, después de laboriosos cálculos, que
x 2 y 2
− = 1,
a b
siendo b2 = a2 − c2 . Esta es la ecuación reducida o canónica de la hipérbola (ver Figura 1.6).
2.3.4. Parábolas: y = ax2
Una parábola es el lugar geométrico de los puntos del plano que equidistan de un punto fijo llamado foco y de
una recta fija llamada directriz.
Consideremos como eje de abcisas a la recta que, pasando por el foco, es perpendicular a la directriz; por eje de
ordenadas se toma la recta paralela a la directriz por el punto medio O entre el foco y la directriz; esta recta se
denomina eje de la parábola. El punto O es el punto en que la parábola corta a su eje y se denomina vértice de la
parábola. Realizando un procedimiento similar a los anteriores deducimos que la ecuación reducida de la parábola
es
y 2 = 2px,
y 6
• • -
x
(−a, 0) (a, 0)
0
Figura 1.6: Representación gráfica de una hipérbola.
y 6
• -
x
O F
Figura 1.7: Representación gráfica de una parábola.
siendo p la distancia del foco a la directriz.
Otras posibles ecuaciones de una parábola son las siguientes:
• x2 = 2py: El eje de la parábola es el eje OY y el vértice es el origen.

• y = ax2 + bx + c: El eje de la parábola es paralelo al eje OY pero el vértice no es el origen.
• x = ay 2 + by + c: El eje de la parábola es paralelo al eje OX pero el vértice no es el origen.
2.4. Funciones y sus gráficas
Una función es una correspondencia que asocia a cada elemento x de un conjunto A, denominado dominio,
exactamente otro elemento f (x) en un conjunto B. El elemento f (x) se dice que es el valor de f en x o la
imagen de x mediante f . El conjunto formado por todas las imágenes f (x) es denominado conjunto imagen o
recorrido. Si a cada valor del recorrido le corresponde exactamente un elemento en su dominio, la función se
llama inyectiva. Si el recorrido es todo el conjunto B, la función se dice que es suprayectiva o sobreyectiva.
Una función inyectiva y sobreyectiva se llama biyectiva.
Cuando pensamos en una función arbitraria f , es usual utilizar un sı́mbolo para designar un elemento arbitrario en
el dominio de f y otro sı́mbolo para un elemento del recorrido. Al primero se le denomina variable independiente
y al segundo variable dependiente. Por ejemplo, sea la función f definida en N (los números naturales) y con
valores en N que asocia a cada número natural su inmediato sucesor. Entonces es usual escribir f (x) = x + 1 o
14 MATEM ÁTICAS
bien y = x + 1, donde x denota un número natural arbitrario e y indica el número natural que le asocia la función
f.
El grafo o gráfica de una función f es el conjunto de pares ordenados dado por

{(x, f (x))|x ∈ A}.
Por ejemplo, para la función anterior la gráfica serı́a el subconjunto de puntos de R2 definido por
{(x, x + 1)|x ∈ N}.
No todos los subconjuntos de R2 son la gráfica de una determinada función f definida en R: se tiene que cumplir
que toda recta vertical debe intersecar a lo más un sola vez al subconjunto.
Una función f : R → R se dice positiva (resp. negativa) si f (x) > 0 (resp. f (x) < 0) para todo valor de x.
Geométricamente esto significa que la gráfica de la función está contenida en el semiplano superior (resp. inferior)
de R2 . En general, una función no tiene por qué ser positiva o negativa; probablemente será positiva en partes de
su dominio y negativa en otras partes.
2.4.1. Simetrı́as de una gráfica
Para dibujar una gráfica puede ser interesante conocer los tipos de simetrı́a de la ecuación que la determina. Son
los siguientes:
y 6
(−x, y) (x, y)
-
x
Figura 1.8: Gráfica simétrica respecto al eje OY .
Simetrı́a respecto al eje OY: Cuando al sustituir x por −x queda una ecuación equivalente. Si la ecuación es
y − f (x) = 0, cuando f (−x) = f (x) para todo valor de x. Diremos que la función f es par (ver Figura
1.8).
Simetrı́a respecto al eje OX: Cuando al sustituir y por −y queda una ecuación equivalente (ver Figura 1.9).
Simetrı́a respecto al origen: Cuando al sustituir x por −x e y por −y se obtiene una ecuación equivalente. Si
la ecuación es y − f (x) = 0, cuando f (−x) = −f (x) para todo valor de x. Diremos que la función f es
impar (ver Figura 1.10).
y 6
(x, y)
-
x
(x, −y)
Figura 1.9: Gráfica simétrica respecto al eje OX.
y 6
(x, y)
-
x
(−x, −y)
Figura 1.10: Gráfica simétrica respecto al origen.
2.5. Transformaciones y operaciones con funciones
Es fácil ver que transformando la gráfica de una función podemos obtener las gráficas de otras funciones relaciona-
das con la anterior, sin necesidad de repetir el trabajo que supone realizar una gráfica. Entre las transformaciones
más usuales están las traslaciones, los alargamientos (homotecias) y las reflexiones.
16 MATEM ÁTICAS
2.5.1. Traslaciones
Existen cuatro tipos de traslación. Para describirlas, sea c > 0 el número que indica las unidades que vamos a
desplazar la gráfica original.
Traslación a la derecha: y = f (x − c).
Traslación a la izquierda: y = f (x + c).
Traslación hacia arriba: y = f (x) + c.
Traslación hacia abajo: y = f (x) − c.
2.5.2. Alargamientos y reflexiones
Otro tipo de transformación consiste en modificar la escala de los ejes: podemos alargar o achatar las gráficas con
sólo multiplicar la x o la y por una constante c > 1 apropiada. También podemos reflejar la gráfica en los ejes de
coordenadas. Estas transformaciones se pueden resumir como sigue:
Alargamiento vertical: y = cf (x).
Estrechamiento vertical: y = c−1 f (x).
Alargamiento horizontal: y = f (x/c).
Estrechamiento horizontal: y = f (cx).
Reflexión respecto OX: y = −f (x).
Reflexión respecto OY: y = f (−x).
2.5.3. Operaciones con funciones
Dos funciones f y g pueden combinarse para formar nuevas funciones de muy diversas maneras. A continuación
veremos que las funciones pueden sumarse, restarse, multiplicarse y dividirse de una manera similar a los números
reales. El álgebra de las funciones reales de variable real puede resumirse de la siguiente manera. Sean f y g dos
funciones con dominios A y B, respectivamente. Entonces definimos las operaciones elementales como sigue:
Suma: (f + g)(x) = f (x) + g(x), dominio=A ∩ B.
Resta: (f − g)(x) = f (x) − g(x), dominio=A ∩ B.
Producto: (f g)(x) = f (x)g(x), dominio=A ∩ B.
Cociente: (f /g)(x) = f (x)/g(x), dominio={x ∈ A ∩ B|g(x) 6= 0}.
Composición: (g ◦f )(x) = g(f (x)), dominio={x ∈ A|f (x) ∈ B}.

2.6. Clasificaciones de funciones
El concepto actual de función es fruto del esfuerzo colectivo de numerosos matemáticos de los siglos XVII y
XVIII. Los matemáticos de esa época pensaban que cualquier fenómeno fı́sico podı́a ser descrito con la ayuda de
una colección básica de funciones: las funciones elementales. Estas funciones pueden dividirse en tres bloques:
(1) algebraicas; (2) exponenciales y logarı́tmicas; y (3) trigonométricas.
Las funciones algebraicas más habituales son los polinomios, los cuales pueden escribirse en la forma
f (x) = an xn + an−1 xn−1 + · · · + a1 x + a0 ,
donde a0 , a1 , . . . , an son números reales. El entero positivo n se llama el grado del polinomio, an es el coeficiente
dominante y a0 es el término constante. Como casos particulares tenemos las funciones constantes (f (x) = c)
y las funciones potencia (f (x) = xn ).
√
Otras funciones básicas son las funciones raı́z (f (x) = x1/n = n x) y las funciones racionales (f (x) =
P (x)/Q(x), P y Q polinomios). En general, las funciones algebraicas son aquellas que pueden expresarse en
términos de un número finito de sumas, restas, productos, cocientes y raı́ces de polinomios.
Las funciones que no son algebraicas se llaman transcendentes. Por ejemplo, las funciones exponenciales, lo-
garı́tmicas y trigonométricas son trascendentes.
3. ACTIVIDADES DE APLICACIÓN DE LOS CONOCIMIENTOS
A.1.1. Probar que

n(n + 1)
1 + 2 + 3 + ··· + n =
2
para todo entero positivo n.
A.1.2. Probar que

1 1 1 1 1
+ 2 + 3 + ··· + n = 1 − n
21 2 2 2 2
A.1.3. Probar que n! > 3n para n suficientemente grande.
A.1.4. Suponiendo cierta la desigualdad triangular, probar
|x1 + x2 + · · · + xn | 6 |x1 | + |x2 | + · · · + |xn |,
A.1.5. Probar que si r 6= 1 entonces
1 − r n+1
1 + r + r2 + r3 + · · · + rn =
1−r
A.1.6. Probar que

2 2 2 2 1
+ 2 + 3 + ··· + n = 1 − n
31 3 3 3 3
para todos los enteros positivos n.
A.1.7. Probar que 2n > n2 para n suficientemente grande.

18 MATEM ÁTICAS
A.1.8. Hallar el dominio y el recorrido de las siguientes funciones:

a) f (x) = x2 .
√
b) f (x) = x + 4.
1
c) f (x) = √ .
1−x
√
d) f (x) = x − 1.
A.1.9. Determinar si las funciones siguientes son o no biyectivas:

a) f (x) = (x − 3)(x − 5)
b) f (x) = x3
c) f (x) = |x|x2
1
d) f (x) = x +
x
A.1.10. Determinar si las siguientes funciones son pares o impares:
a) f (x) = x3
b) f (x) = x(x − 1)
1
c) f (x) = x +
x
d) f (x) = x(x2 + 1)
A.1.11. Hallar las composiciones (f ◦ g)(x) y (g ◦ f )(x) de las siguientes funciones:

a) f (x) = x + 1; g(x) = x2 .
1
b) f (x) = x2 − 5; g(x) = + 1.
x
√
c) f (x) = x; g(x) = x2 − 1.
d) f (x) = x2 + 5; g(x) = x(x − 1).
A.1.12. Hallar las funciones inversas de las siguientes, especificando su dominio:

a) f (x) = x3
b) f (x) = 1 + 3x3
c) f (x) = (4x − 1)3
1
d) f (x) =
x
4. ACTIVIDADES PRÁCTICAS DEL CAPÍTULO
4.1. Introducción
La práctica se va a realizar con el programa de cálculo matemático DERIVE for Windows, versión 4.05, de Soft
Warehouse. DERIVE for Windows permite realizar cálculos y manipulaciones matemáticas de carácter general,
lo cual significa que realiza muchas cosas de forma aceptable aunque no tiene la potencia de otros programas
especı́ficos. No obstante, DERIVE for Windows permite realizar todos los cálculos que un usuario medio puede
necesitar.
Figura 1.11: Pantalla inicial del programa donde aparece, además del menú principal, la ‘botonera’ que permite
agilizar la introducción de las expresiones y la realización de los cálculos.
Para ejecutar el programa debemos acceder a la carpeta DERIVE for Windows y ejecutar el programa DERIVE
for Windows. Una vez en el programa, aparecerá la pantalla de la Figura 1.11, con un menú en la parte superior
que, de ahora en adelante, denominaremos menú principal.
En esta práctica nos vamos a limitar a familiarizarnos con el programa DERIVE for Windows y a la realización
de algunos cálculos elementales. Sin embargo, antes de realizar los cálculos debemos introducir los datos o
expresiones que necesitemos.
4.2. Introducción y edición de expresiones
Con el término expresión queremos indicar cualquier función, constante, variable u operador que podamos in-
troducir en el programa. Las expresiones se introducen seleccionando la opción Author del menú principal.
Entonces nos aparece un menú con tres posibilidades: Expression, Vector o Matrix, que nos permite introdu-
cir una expresión, un vector o una matriz. Para agilizar la introducción de los datos, debemos recordar que existen
teclas calientes que equivalen a diversas opciones de los menús. Ası́, por ejemplo, para introducir una expresión
es suficiente con pulsar Ctrl+A y nos aparece la ventana de la Figura 1.12. Conforme vamos introduciendo las
expresiones, éstas se van numerando correlativamente y en orden creciente, de forma que en una expresión pode-
mos hacer referencia a una expresión anterior (utilizando para ello el sı́mbolo #). Una pantalla tı́pica de trabajo se
muestra en la Figura 1.13.
Figura 1.12: Ventana del programa para introducir las expresiones.
Para editar (y eventualmente modificar) una expresión ya introducida tenemos dos vı́as distintas. En primer lugar
20 MATEM ÁTICAS
Figura 1.13: Pantalla tı́pica del programa donde aparecen algunas instrucciones. Obs érvese que es posible intro-
ducir sentencias descriptivas que nada tienen que ver con operaciones matemáticas pero que ayudan
a seguir los cálculos.
podemos marcar la expresión (haciendo ‘click’ con el ratón en la expresión deseada o moviéndonos con las flechas:
↑ para acceder a una expresión con un número menor y ↓ para acceder a otra con un número mayor) y seleccionar
la opción Edit Expression. Otra posibilidad es elegir Edit y seguidamente Go to expression, lo cual nos
permite introducir el número de la expresión que queremos editar.
4.3. ¿Qué cosas pueden aparecer en las expresiones?
En una expresión de DERIVE for Windows están permitidas numerosas opciones: letras griegas, constantes, ope-
radores (aritméticos y lógicos) y funciones (exponenciales, logarı́tmicas, trigonométricas, hiperbólicas, complejas,
de probabilidad, estadı́sticas, de error, de cálculo financiero, de cálculo matemático, vectoriales, matriciales, y de
cálculo diferencial e integral vectorial). Por el momento, es suficiente con recordar que en las expresiones pode-
mos utilizar los siguientes elementos:
Constante Expresión
e (base de los logaritmos neperianos) #e
i (unidad imaginaria compleja) #i
π (3.1415926 . . . ) pi
∞ (infinito matemático) inf
Función Expresión Operador Expresión

Raiz cuadrada SQRT(x) Menos -x
Exponencial EXP(x) Suma x+y
Logaritmo neperiano LN(x) ó LOG(x) Resta x-y
Logaritmo en base w LOG(z,w) Producto x*y ó xy
Seno SIN(x) Cociente x/y
Coseno COS(x) Exponenciación xˆy
Tangente TAN(x) Tanto por ciento x%
Valor absoluto ABS(x) Factorial x!
4.4. Las primeras experiencias
La mejor manera de que nos aprendamos los sı́mbolos y funciones descritos anteriormente no es dedicar mucho
tiempo a memorizarlos, ya que esta tarea no es nada eficaz, además de resultarnos bastante odiosa. Lo conveniente
es realizar numerosos ejercicios, sencillos en su mayorı́a, pero que nos ayudarán a retener lo esencial.
Calcular (3 + 6)(7 − 2)/4
Introducimos la expresión (3+6)(7-2)/4 o (3+6)*(7-2)/4. Entonces nos aparecerá la misma lı́nea en pan-
talla. Si queremos ver el resultado debemos simplificar (seleccionando Simplify Basic o pulsando Ctrl+B)
y obtendremos 45/4, que es el valor exacto. Si queremos obtener el valor decimal aproximado, con un número
de decimales predeterminado (por defecto, este número es 6), debemos seleccionar Simplify Approximate (o
Ctrl+G) y nos aparece la ventana de la Figura 1.14. Tras confirmar la expresión que queremos simplificar y el
número de decimales obtendremos 11.25.
Figura 1.14: Ventana del programa para calcular aproximaciones de expresiones.
Calcular eπ
Introducimos la expresión #e^pi obteniendo, después de seleccionar las opciones Simplify Approximate,
el valor de 23.1407 (6 dı́gitos). Si queremos un resultado más preciso (por ejemplo, con 12 dı́gitos), debemos
cambiar dicho número cuando seleccionemos Approximate. Entonces obtendremos el valor de 23.1406926327.
22 MATEM ÁTICAS
Calcular 1534 de forma exacta
Elejimos Author y escribimos la expresión 15^34. Después de seleccionar las opciones Simplify Basic (o
simplemente pulsando el botón = ) nos aparecerá en pantalla el siguiente número:
9707397373664756887592375278472900390625.
Si queremos un resultado aproximado (por ejemplo, con 12 cifras exactas), seleccionamos dicha configuración
mediante Simplify Approximate y obtendremos: 9.70739737366 10^39.
Figura 1.15: El uso de la ‘botonera’ de DERIVE for Windows nos puede simplificar mucho el trabajo. Otro elemento
interesante es la existencia de ‘teclas calientes’ que nos permiten evitar los menús, con lo que se gana
en rapidez.
Antes de seguir adelante será conveniente que comentemos brevemente la ‘botonera’ de DERIVE for Windows
(ver Figura 1.15), ya que simplifica enormemente la introducción de datos y la realización de cálculos. Los boto-
nes permiten realizar las siguientes tareas (de izquierda a derecha): New (abrir una nueva hoja de trabajo), Open
(abrir una hoja de trabajo existente), Save (guardar la sesión de trabajo), Print (imprimir la sesión de trabajo),
Remove (eliminar la expresión marcada), Unremove (recuperar la última expresión eliminada), Renumber (re-
numerar las expresiones), Author expression (introducir una expresión sencilla), Author vector (introducir
un vector), Author matrix (introducir una matriz), Simplify (simplificar), Approximate (calcular un valor
aproximado), Solve (resolver algebraicamente o numéricamente una expresión), Substitute for variables
(realizar una sustitución), Calculate limit (calcular un lı́mite), Calculate derivative (calcular una deriva-
da), Calculate integral (calcular una integral), Calculate sum (calcular una suma), Calculate product
(calcular un producto), 2D-plot window (realizar un gráfico bidimensional) y 3D-plot window (realizar un
gráfico tridimensional).
Calcular el factorial de 75 en forma exacta y aproximada
Elejimos Author y tecleamos 75!. Después de pulsar el botón = se obtiene el siguiente resultado:
24809140811395398091946477116594033660926243886570122837795894512655842677572867409443
815424000000000000000000.
Si quisiéramos un valor aproximado, entonces elegirı́amos las opciones Simplify Approximate y el valor ob-
tenido serı́a 2.48091408113 10^109 (con 12 dı́gitos). Observemos que este valor tiene más de 80 cifras; como
puede ser que en nuestra pantalla sólo se visualicen hasta 80 caracteres, debemos pulsar simultáneamente las te-
clas Control y las fechas ← y → para ir visualizando el resto, o bien desplazar la ‘barra’ que se encuentra en la
parte inferior de la ventana del programa.
Obtener el número π con 100 decimales y grabarlo en un fichero
Escogemos Author y escribimos pi. Seleccionamos la opción de simplificar con precisión aproximada hasta 100
dı́gitos exactos y el resultado obtenido es:
3.141592653589793238462643383279502884197169399375105820974944592307816406286208998628
034825342117067.
Para no tener que copiar la solución de la pantalla lo conveniente es grabarla en un archivo o enviarla a la impresora
para tenerla por escrito. Para ello debemos seguir el camino File Save o File Print según queramos una
opción u otra. En cualquiera de los dos casos, el programa nos permite seleccionar las expresiones que deseamos
grabar en disco o imprimir. En este segundo caso, una opción muy interesante es File Print Preview, que nos
permite visualizar en pantalla lo que se va a imprimir. La Figura 1.16 muestra la sesión actual antes de ser enviada
a la impresora.
Figura 1.16: Antes de enviar una sesión de DERIVE for Windows directamente a la impresora es conveniente
visualizarla en pantalla, para comprobar que no existen errores. Cuando todo esté correcto, podremos
enviarlo a la impresora desde la pantalla Print Preview
Posteriormente, cuando queramos recuperar todo lo que hemos guardado, bastará con elegir File Load para
cargar en memoria todo el trabajo anterior.
4.5. Ejercicios de aplicación
A continuación se enuncian unos ejercicios sencillos sobre aritmética y operaciones con expresiones algebraicas.
Si el alumno encuentra alguna dificultad debe releer lo dicho hasta ahora, en particular la sintaxis de las distintas
funciones y constantes.
a) Calcular 11/24 + 5/36 + 17/46 en forma exacta y con 7 decimales exactos.

b) Calcular 2342 en forma exacta y con 25 cifras exactas.
c) Calcular la raı́z cuadrada de 3972049.
d) Calcular π con 200 decimales exactos.
p √
e) Calcular 8 + 53 7 en forma aproximada.
4.6. Operaciones con expresiones algebraicas
Una de las caracterı́sticas esenciales del programa DERIVE for Windows es la posibilidad de manipular expresio-
nes algebraicas, del tipo x3 + 5x − 7 o (1 − x − y 2 )100 . En esta sección vamos a comentar las principales opciones
24 MATEM ÁTICAS
del programa en relación con las expresiones algebraicas. La función básica es Simplify (simplificar), la cual
admite diversas variantes: Basic (Ctrl+B), Expand (Ctrl+E), Factor (Ctrl+F) y Approximate (Ctrl+G). En
los siguientes ejemplos ilustramos su uso.
x2 − 3x + 2
Simplificar la expresión
x2 − 5x + 6
Elejimos la opción Author y tecleamos x^2-3x+2 (supongamos que es la expresión 16). A continuación vol-
vemos a seleccionar Author y escribimos x^2-5x+6 (que será la expresión 17). Finalmente, seleccionando de
nuevo la opción Ctrl+A escribimos #16/#17 y nos aparecerá
x2 − 3x + 2
.
x2 − 5x + 6
Esta fracción podı́a haber sido introducida de una sola vez como sigue:
(x^2-3x+2)/(x^2-5x+6).
Debemos ser muy cuidadosos con los paréntesis y usarlos siempre, aunque en ocasiones nos parezcan innecesarios;
un buen hábito en la escritura puede evitarnos innumerables problemas. Si ahora elegimos la opción Simplify
x−1
Basic (o pulsando el botón = ) obtendremos como resultado el siguiente: .
x−3
Simplificar x2 − (x + (y + 2)100 )(x − (y + 2)100 )
Introducimos la expresión x^2-(x+(y+2)^(100))(x-(y+2)^(100)) y seleccionamos la opción Simplify para

obtener (y + 2)200 .
Desarrollar (x + y)4
Introducimos la expresión (x+y)^4 y seleccionamos la opción Expand. Entonces el programa nos pregunta qué
variable queremos desarrollar: por defecto, desarrolla todas las variables que aparecen en la expresión. En nuestro
caso, el valor obtenido es: x4 + 4x3 y + 6x2 y 2 + 4xy 3 + y 4 .
Factorizar x4 − 2x3 − 8x2 + 18x − 9
Para factorizar un polinomio debemos seleccionar la opción Simplify Factor y a continuación debemos indi-
car la variable y el método (ver Figura 1.17). Existen cinco métodos de factorización: Trivial Squarefree
Rational raDical Complex, siendo los tres últimos los que más factorizan. En nuestro caso, después de in-
troducir el polinomio como x^4-2x^3-8x^2+18x-9, seleccionamos Ctrl+F y seguidamente Squarefree para
obtener (x − 1)2 (x2 − 9). Para mayor precisión, seleccionamos el método Rational (o raDical, Complex) y
obtenemos (x + 3)(x − 3)(x − 1)2 .
Figura 1.17: Ventana del programa que nos permite factorizar expresiones.
4.7. Resolución de ecuaciones
Una de las tareas más ingratas y complicadas con las que nos podemos encontrar es la determinación de los
números que satisfacen una determinada ecuación (de una o varias variables): es el problema de la resolución de
ecuaciones. Para construir una ecuación (o inecuación) se pueden utilizar los siguientes operadores:
Operador Teclear
= =
6 = /=
< <
> >
6 <=
> >=
Cálculo de la pendiente de una recta
Supongamos que queremos calcular la pendiente de la recta 5x − 8y = 13. Entonces podemos expresar la recta
en la forma y = mx + n de tal suerte que el número m es la pendiente. El programa DERIVE for Windows
nos permite determinar la pendiente como sigue. Se introduce la expresión 5x-8y=13, se eligen las opciones
Solve|Algebraically y nos aparece la ventana de la Figura 1.18. Escogemos la variable y (por defecto, el
programa nos ofrece la variable x) y como resultado obtenemos y = 5x−13
8 , por lo que la pendiente es 5/8.
Resolver la ecuación (x + 3)2 + (x − 2)2 = 53
Introducimos la ecuación como (x+3)^2+(x-2)^2=53 y seleccionamos las opciones Solve|Algebraically.

El resultado obtenido es: x = 4, x = −5.
26 MATEM ÁTICAS
Figura 1.18: Ventana del programa que nos permite resolver algebraicamente expresiones.
Calcular las raı́ces del polinomio x8 − 8x7 + 22x6 − 16x5 − 31x4 + 56x3 − 8x2 − 32x + 16
Elegimos la opción Author y escribimos el polinomio como
x^8-8x^7+22x^6-16x^5-31x^4+56x^3-8x^2-32x+16.
Se eligen las opciones Solve|Algebraically y obtenemos como soluciones: x = 1, x = −1, x = 2. Pe-

ro, ¿cuáles son sus multiplicidades? Para determinarlas, dividimos el polinomio original entre (x − 1)(x +
1)(x − 2) obteniendo como resultado x5 − 6x4 + 11x3 − 2x2 − 12x + 8. Volvemos a seleccionar las opcio-
nes Solve|Algebraically y obtenemos de nuevo x = 1, x = −1, x = 2. Si volvemos a dividir x5 − 6x4 +
11x3 − 2x2 − 12x + 8 entre (x − 1)(x + 1)(x − 2) obtenemos (x − 2)2 , por lo que podemos deducir que las raı́ces
x = 1 y x = −1 son dobles mientras que la raı́z x = 2 es cuádruple.
A continuación se enuncian unos ejercicios sencillos sobre resolución de ecuaciones. Si el alumno encuentra
alguna dificultad debe releer lo dicho hasta ahora, en particular la sección referente a las expresiones algebraicas
y su manipulación.
√ √
a) Resolver la ecuación 2x + 3 − x − 2 = 2.
√ √
b) Resolver la ecuación 3 x = 2x − 3.
c) Determinar las raices del polinomio x4 − 1.
d) Resolver la ecuación ax2 + bx + c = 0.
4.9. Realizar gráficas de funciones
Quizás en alguno de los ejercicios anteriores hemos tenido dificultades y no hemos podido encontrar la solución.
En estos casos, la vı́a de solución consiste en representar gráficamente la ecuación y determinar un intervalo
(cuanto más pequeño mejor) que contenga la raı́z. Por ejemplo, si dibujamos la ecuación x5 − 6x4 + 11x3 −
2x2 − 12x + 8 = 0 obtenemos la Figura 1.19. Nos damos cuenta que hay raı́ces alrededor de los puntos -1, 1, 2
(en este caso, esas son las raı́ces), por lo que podrı́amos determinar el valor exacto resolviendo numéricamente la
ecuación anterior en los intervalos [-2,0], [0,2] y [1,3], respectivamente.
Figura 1.19: Gráfica de la función x5 − 6x4 + 11x3 − 2x2 − 12x + 8 = 0
Para resolver numéricamente una ecuación (es decir, encontrar un valor que satisfaga dicha ecuación) debemos
elegir las opciones Solve|Numerically y nos aparece la ventana de la Figura 1.20, donde debemos introducir la
ecuación y el intervalo donde queremos que DERIVE for Windows busque la solución: Lower y Upper.
Figura 1.20: Ventana del programa que nos permite resolver numéricamente ecuaciones.
Para dibujar una función es suficiente con marcar la expresión que la define y seleccionar la opción New 2D-plot
window (o bien pulsar el botón correspondiente). Con esto conseguimos que se abra una nueva ventana gráfica; a
continuación debemos seleccionar la opción Plot!. Cada ventana gráfica está asociada a una ventana de cálculos
algebraicos, por lo que todas las representaciones gráficas de una ventana de álgebra se realizarán en la misma
ventana gráfica. En el caso de realizar varias representaciones gráficas en una misma ventana, cada gráfica irá en
un color distinto.
4.10. Bibliografı́a
C. Paulogorrón y C. Pérez. Cálculo matemático con DERIVE para PC, Ed. RA-MA, 1a Ed., 1994.
28 MATEM ÁTICAS
5. BIBLIOGRAFÍA DEL CAPÍTULO
R.E. LARSON, R.P. HOSTETLER y B.H. EDWARDS Calculo y Geometrı́a Analı́tica, 5a ed., vol. 1. McGraw-
Hill, Madrid, 1995. Capı́tulo 1.
J. STEWART Cálculo, 2a ed. Grupo Editorial Iberoamérica, México, 1994. Capı́tulo 0.
6. PREGUNTAS DE EVALUACIÓN
E.1.1. Hallar las ecuaciones de la recta que pasa por el punto (1,3) y cumple además en cada caso:
a) Tiene pendiente −2/3.
b) Es perpendicular a la recta x + y = 0.
c) Pasa por el punto (2,4).
d) Es paralela al eje x.
√
E.1.2. Hallar la ecuación de la recta bisectriz del ángulo agudo formado por las rectas y = 3x e y = 2.
E.1.3. Un avión vuela con rumbo constante y a velocidad constante entre dos ciudades. La distancia s (en
kilómetros) que ha recorrido en t horas es s = 950t.
a) Dibujar la gráfica de esta ecuación para t > 0.
b) ¿Qué información contiene la pendiente de la recta?
E.1.4. Un empresario adquiere una máquina por 4500000 pesetas. La máquina gasta en promedio 1000 pesetas
en mantenimiento y gasoil. El operario que la maneja cobra 1850 pesetas por hora y a los clientes se les
cargan 5000 pesetas por hora.
a) Escribir una ecuación para el coste C de funcionamiento de la máquina durante t horas.
b) Idem para los ingresos R derivados de t horas de funcionamiento.
c) Hallar el punto de equilibrio de esa máquina, calculando en qué tiempo t ocurre que R = C.
ANOTACIONES
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
CAPÍTULO 2
CÁLCULO DIFERENCIAL
• Lı́mite de una función • Máximos y mı́nimos relativos

• Lı́mites laterales • Polinomios de Taylor
• Reglas para el cálculo de lı́mites • Series de potencias
• Regla del ‘bocadillo’
• Teorema de Taylor
• Continuidad de una función
• Algoritmo de bisección
• Propiedades de las funciones continuas
• Método de iteración del punto fijo
• Teorema del valor intermedio
• Método de Newton-Raphson
• Derivada de una función
• Interpretación geométrica de la derivada • Polinomio interpolante de Lagrange
• Teorema de Rolle • Método de interpolación iterada
• Teorema del valor medio • Método de diferencias divididas
2.1. Lı́mite de una función
2.1.1. Definiciones
La noción de lı́mite es básica en todo el cálculo, por lo que es sumamente importante adquirir un buen manejo y
conocimiento de los lı́mites antes de adentrarnos en otros temas.
Sea f (x) una función y consideremos x0 un número real (no necesariamente en el dominio de f ). Si f (x) se
acerca arbitrariamente a un único valor L cuando x se aproxima a x0 por ambos lados (sin llegar nunca a ser igual
a x0 ), decimos que el lı́mite de f (x) cuando x tiende a x0 es L, y escribimos
lim f (x) = L.
x→x0
En la definición anterior observamos que sólo interesa conocer cómo está definida la función f cerca del punto
C ÁLCULO DIFERENCIAL 31
x0 . Si la función existe o no en el punto x0 no tiene importancia. La cuestión crucial aquı́ es la siguiente: ¿qué
significa que f (x) se acerca arbitrariamente a L? ¿qué ocurre si x se aproxima a x0 sólo por un lado?
El comportamiento de las funciones en relación a los lı́mites puede ser de lo más diverso. Sólo como un botón de
muestra, veamos las siguientes funciones.
√
f (x) = x/( x + 1 − 1): El lı́mite de f (x) cuando x → 0 vale 2, ya que si nos acercamos por la izquierda
obtenemos valores menores que 2 pero cada vez más próximos a 2; y si nos acercamos por la derecha
obtenemos valores mayores que 2 pero cada vez más próximos a 2. Sin embargo, la función f no está
definida en x = 0.
f (x) = |x|/x: Cuando nos acercamos a 0 por la izquierda, entonces f (x) = −1 por lo que el lı́mite vale −1.
Pero si nos acercamos por la derecha entonces f (x) = 1 y ası́ el lı́mite vale 1. Por tanto, no existe el lı́mite.
f (x) = 1/x2 : Cuando x se aproxima a 0, f (x) se va haciendo cada vez más grande, por lo que no existe ningún
número real L al cual tienda f (x). Por tanto no existe el lı́mite de f (x) cuando x → 0.
En los ejemplos anteriores hemos visto que hay funciones que se aproximan a un valor L1 cuando x se aproxima
a x0 por la izquierda y se aproximan a L2 si nos acercamos por la derecha. Este comportamiento nos lleva a
considerar las siguientes definiciones.
Sea f (x) una función y consideremos x0 un número real (no necesariamente en el dominio de f ).
(1) Si f (x) se acerca arbitrariamente a un único valor L cuando x se aproxima a x0 por la izquierda (sin llegar
nunca a ser igual a x0 ), decimos que el lı́mite por la izquierda de f (x) cuando x tiende a x0 es L, y
escribimos
lim − f (x) = L.
x→x0
(2) Si f (x) se acerca arbitrariamente a un único valor L cuando x se aproxima a x0 por la derecha (sin llegar
nunca a ser igual a x0 ), decimos que el lı́mite por la derecha de f (x) cuando x tiende a x0 es L, y
escribimos
lim + f (x) = L.
x→x0
Entonces existe el lı́mite de una función f (x) en x0 si existen los lı́mites laterales en x0 y coinciden.
2.1.2. Reglas para el cálculo de lı́mites
Si b y c son números reales, n un entero positivo y f , g son funciones que tienen lı́mite cuando x tiende a c,
entonces son ciertas las siguientes propiedades:
(1) Múltiplo escalar: lim [bf (x)] = b[ lim f (x)]

x→c x→c
(2) Suma/Diferencia: lim [f (x) ± g(x)] = lim f (x) ± lim g(x)

x→c x→c x→c
(3) Producto: lim [f (x)g(x)] = lim f (x) lim g(x)

x→c x→c x→c
f (x) limx→c f (x)

(4) Cociente: lim [ ]= , siempre que limx→c g(x) 6= 0.
x→c g(x) limx→c g(x)
32 MATEM ÁTICAS
(5) Potencia: lim [f (x)]n = [ lim f (x)]n

x→c x→c
p q
(6) Raı́z: lim n f (x) = n lim f (x). Si n es par suponemos que lim f (x) es no negativo.
x→c x→c x→c
Para poder calcular lı́mites sólo es necesario, además de utilizar las reglas anteriores, tener en cuenta que lim b = b
x→c
y lim x = c.
x→c
Como una consecuencia de la aplicación de las propiedades anteriores tenemos las siguientes reglas:
(1) Si p(x) es un polinomio entonces

lim p(x) = p(c).
x→c
(2) Si r(x) = p(x)/q(x), q(c) 6= 0, es una función racional entonces
p(x) p(c)
lim = .
x→c q(x) q(c)
(3) Si c > 0 y n es cualquier entero positivo, o si c < 0 y n es un entero positivo impar, entonces
√ √
lim n x = n c.
x→c
(4) Si f y g son funciones tales que lim g(x) = L y lim f (x) = f (L) entonces
x→c x→L
lim f (g(x)) = f (L).

x→c
Para finalizar este apartado vamos a enunciar la regla del bocadillo o teorema de intercalación, herramienta muy
útil que permite calcular lı́mites por comparación.
Regla del Bocadillo. Si f (x) 6 g(x) 6 h(x) para todo x en un intervalo abierto que contiene a c (no importa lo
que suceda en c) y
lim f (x) = lim h(x) = L,
x→c x→c
entonces
lim g(x) = L.
x→c
2.2. Continuidad de una función
El término continuidad en matemáticas tiene exactamente el mismo significado que tiene en el lenguaje cotidiano:
una función f es continua en un punto a si su gráfica no se interrumpe en a, no tiene saltos ni huecos en ese punto.
La única diferencia que existe es en la formulación rigurosa.
Continuidad en un punto: Una función f es continua en a si se verifican las siguientes condiciones:

1. f (a) está definida. 2. lim f (x) existe. 3. lim f (x) = f (a).
x→a x→a
Continuidad en un intervalo abierto: Una función f se dice continua en un intervalo abierto (b, c) si lo es en
todos los puntos de ese intervalo.
Si f es continua en toda la recta real (−∞, ∞) diremos simplemente que f es una función continua. Se dice que
f es discontinua en a si no es continua en dicho punto.
Existen varios tipos de discontinuidades: las evitables y las no evitables. Se dice que una discontinuidad en x = a
es evitable si la función f puede hacerse continua en a redefiniéndola en dicho punto. En caso contrario, se dirá
que la discontinuidad es no evitable.
Continuidad por la derecha: Una función f es continua por la derecha en a si se verifican las siguientes condi-
ciones:
1. f (a) está definida. 2. lim+ f (x) existe. 3. lim+ f (x) = f (a).
x→a x→a
Continuidad por la izquierda: Una función f es continua por la izquierda en a si se verifican las siguientes
condiciones:
1. f (a) está definida. 2. lim− f (x) existe. 3. lim− f (x) = f (a).
x→a x→a
Continuidad en un intervalo cerrado: Una función f se dice continua en un intervalo cerrado [b, c] si es continua
en (b, c) y también es continua por la derecha en b y por la izquierda en c.
2.2.1. Propiedades de las funciones continuas
Teniendo en cuenta que la continuidad se ha definido como un lı́mite, podemos utilizar las propiedades de los
lı́mites para comprobar inmediatamente las siguientes propiedades acerca de la continuidad.
Sean f y g dos funciones continuas en un punto a, entonces también son continuas en a las siguientes funciones:
(1) Suma y diferencia: f ± g.
(2) Múltiplo escalar: λf , siendo λ un número real.
(3) Producto: f g.
(4) Cociente: f /g siempre que g(a) 6= 0.
Listamos a continuación algunos de los tipos más comunes de funciones continuas en todo punto de su dominio:
(1) Funciones polinómicas: p(x) = an xn + an−1 xn−1 + · · · + a1 x + a0
(2) Funciones racionales: r(x) = p(x)/q(x), si q(x) 6= 0.

p
(3) Funciones radicales: f (x) = n p(x), si p(x) > 0 cuando n es par.
Uno de los resultados que nos permitirá combinar las propiedades anteriores para probar la continuidad de funcio-
nes más complejas es el siguiente: “Si g es continua en c y f es continua en g(c) entonces la función compuesta
f ◦g es continua en c”.
Finalizamos esta sección con un teorema relativo al comportamiento de las funciones continuas en un intervalo
cerrado, cuya demostración hace uso de la ‘completitud’ de los números reales.
Teorema del valor intermedio: Si f es una función continua en [a, b] y k es cualquier valor entre f (a) y f (b),
entonces existe al menos un número c ∈ [a, b] tal que f (c) = k.
El teorema del valor intermedio es útil para localizar los ceros de una función continua en un intervalo cerrado.
Más concretamente, se tiene el siguiente resultado.
34 MATEM ÁTICAS
Teorema de Bolzano: Si f es una función en [a, b] y f (a), f (b) difieren de signo, entonces existe al menos un
número c ∈ [a, b] tal que f (c) = 0.
Es importante hacer notar que tanto en el teorema del valor intermedio como en el teorema de Bolzano es capital
que la función sea continua en el intervalo cerrado [a, b]. Pueden encontrarse ejemplos muy sencillos de funciones
discontinuas que no verifican los teoremas anteriores.
2.3. Lı́mites infinitos
En la sección previa donde hemos definido el concepto de lı́mite L de una función f en un punto a, sólo hemos
considerado el caso en que tanto a como L fuesen números reales. Sin embargo, es posible extender el concepto
de lı́mite a otros casos, en un cierto sentido que ahora pasamos a precisar.
2.3.1. Lı́mites infinitos cuando a es un número real
Se dice que f (x) crece sin tope cuando x tiende a a si para todo número real M siempre existe un intervalo I de
a tal que f (x) > M para todo punto x de I. Análogamente, se dice que f (x) decrece sin tope cuando x tiende a
a si para todo número real M siempre existe un intervalo I de a tal que f (x) < M para todo punto x de I.
Si f (x) crece sin tope cuando x tiende hacia a diremos que el lı́mite de f cuando x tiende a a es ∞ y escribiremos
lim f (x) = ∞.
x→a
Por el contrario, si f (x) decrece sin tope cuando x tiende hacia a diremos que el lı́mite de f cuando x tiende a a
es −∞ y escribiremos
lim f (x) = −∞.
x→a
El signo de igualdad en las expresiones anteriores no significa que exista un lı́mite, sino que nos dan una razón
por la que la función f no puede tener lı́mite en el punto a: porque no está acotada. Lo que de verdad se quiere
decir es que el lı́mite no existe y la función f tiene una discontinuidad no evitable (de salto infinito).
Los lı́mites infinitos por la izquierda y por la derecha se definen análogamente. Los cuatro posibles lı́mites laterales
son los siguientes:
(1) lim− f (x) = −∞,

x→a
(2) lim− f (x) = ∞,

x→a
(3) lim+ f (x) = −∞,

x→a
(4) lim+ f (x) = ∞.

x→a
Si alguno de los lı́mites laterales anteriores se satisface, decimos que f tiene en a una discontinuidad infinita.
En este caso, diremos que la recta x = a es una ası́ntota vertical de f . Uno de los ejemplos más tı́picos de
existencia de ası́ntotas verticales se da en las funciones racionales: “si f y g son funciones continuas en un
intervalo conteniendo a c, y se satisface f (c) 6= 0 y g(c) = 0, entonces la función racional r(x) = f (x)/g(x)
tiene una ası́ntota vertical en x = c”.
Terminamos esta sección con las siguientes propiedades de lı́mites infinitos. Si c, L son números reales y f , g son
funciones tales que
lim f (x) = ∞ y lim g(x) = L,
x→c x→c
entonces las siguientes propiedades se verifican:
(1) Suma y diferencia: lim [f ± g] = ∞.

x→c
(2) Múltiplo escalar: lim [λf ] = ∞, si λ > 0 y lim [λf ] = −∞, si λ < 0.
x→c x→c
(3) Producto: lim [f g] = ∞ si L > 0 y lim [f g] = −∞ si L < 0.

x→c x→c
(4) Cociente: lim [g/f ] = 0.

x→c
(Propiedades similares son válidas para lı́mites laterales y para funciones para las cuales el lı́mite de f (x) cuando
x tiende a c es −∞).
2.3.2. Lı́mites infinitos cuando L es un número real
Si f (x) tiende a L cuando x se hace arbitrariamente grande, entonces decimos que el lı́mite de f (x) cuando x
tiende a infinito es L, y escribimos
lim f (x) = L.
x→∞
Análogamente, si f (x) tiende a L cuando x se hace arbitrariamente pequeño, entonces decimos que el lı́mite de
f (x) cuando x tiende a menos infinito es L, y escribimos
lim f (x) = L.
x→−∞
En ambos casos se dice que la recta y = L es una ası́ntota horizontal de la función f . Uno de los ejemplos más
tı́picos de existencia de ası́ntotas horizontales se da en las funciones racionales: “si f y g son dos polinomios del
mismo grado, entonces la función racional r(x) = f (x)/g(x) tiene una ası́ntota horizontal en y = L, siendo L el
cociente entre los coeficientes principales de f y g”.
Terminamos esta sección con las siguientes propiedades de lı́mites infinitos. Si L1 , L2 son números reales y f , g
son funciones tales que
lim f (x) = L1 y lim g(x) = L2 ,
x→∞ x→∞
entonces las siguientes propiedades se verifican:
(1) Suma y diferencia: lim [f ± g] = L1 ± L2 .

x→∞
(2) Múltiplo escalar: lim [λf ] = λL1 .

x→∞
(3) Producto: lim [f g] = L1 L2 .

x→∞
(4) Cociente: lim [f /g] = L1 /L2 si L2 6= 0.

x→∞
(Propiedades similares son válidas para lı́mites de f (x) cuando x tiende a −∞).
Las propiedades anteriores también pueden ser válidas si L1 = ±∞ o L2 = ±∞ o ambas condiciones al mismo
tiempo. No obstante, existen ciertas restricciones con el fin de evitar las indeterminaciones: ∞ − ∞, 0.∞, ∞/∞,
etc.
36 MATEM ÁTICAS
2.4. Derivada de una función
El cálculo matemático nació y se fortaleció a raı́z de cuatro clásicos problemas sobre los que los matemáticos
europeos trabajaron durante el siglo XVII. Estos problemas son:
(1) El problema de la recta tangente.

(2) El problema de la velocidad y la aceleración.
(3) El problema de los máximos y mı́nimos.
(4) El problema del área.
En este capı́tulo abordaremos los tres primeros problemas, dejando el último para el capı́tulo siguiente. Cada uno
de los problemas anteriores requiere el concepto de lı́mite, ya introducido al comienzo del capı́tulo, y es por sı́
solo suficiente para motivar e introducir el cálculo.
La derivada de una función f en un punto a, que se denota por f 0 (a), se define como
f (x) − f (a) f (a + h) − f (a)
lim = lim ,
x→a x−a h→0 h
supuesto que tal lı́mite exista.
2.4.1. Interpretación geométrica: Recta tangente
Si consideramos los puntos del plano (x, f (x)) y (a, f (a)), entonces la recta que los une tiene una pendiente m
dada por
f (x) − f (a)
m= .
x−a
En consecuencia, f 0 (a) es el lı́mite de las pendientes de las rectas secantes que unen los puntos (x, f (x)) y
(a, f (a)), y por tanto constituye la pendiente de la recta tangente a f en a (ver Figura 2.1).
Utilizando la forma punto-pendiente para expresar la ecuación de una recta, podemos decir que si f 0 (a) existe
entonces la recta tangente a la curva y = f (x) en el punto (a, f (a)) viene dada por
y − f (a) = f 0 (a)(x − a).
Una función f definida en un intervalo abierto (a, b) se dice que es derivable (o diferenciable) si existe f 0 (c) en
todo punto c del intervalo. Si f es una función derivable entonces podemos definir otra función, denominada la
derivada de f y denotada por f 0 , por la siguiente fórmula:
f (x + h) − f (x)
f 0 (x) = lim .
h→0 h
El dominio de f 0 siempre es un subconjunto del dominio de f y una de las propiedades fundamentales de la
derivada queda recogida en el siguiente teorema: “si f es derivable en x = a entonces f es continua en x = a”.
De lo anterior se deduce que podemos definir un operador en el conjunto de las funciones derivables que asocia a
cada función f (x) su derivada f 0 (x). Dicho operador se denomina la derivada y se denota por
d
dx
d df
de manera que (f ) es una notación para indicar f 0 . Asimismo, otra notación para f 0 (a) es (a).
dx dx
y 6
f (x) − f (a)
)
f (a)
x−a
-
x
0 a x
Figura 2.1: Interpretación geométrica de la derivada.
2.4.2. Reglas de derivación
Aunque la noción de derivada se apoya en el concepto de lı́mite, no es conveniente calcular las derivadas recu-
rriendo a la definición, ya que los cálculos son engorrosos y en ocasiones difı́ciles de realizar. En esta sección
vamos a presentar una serie de reglas que nos permitirán hallar derivadas sin recurrir a la definición, de una forma
más sencilla.
Regla de la constante. La derivada de una constante c es cero:
d
[c] = 0.
dx
Regla de las potencias. Si n es un número racional,
d n
[x ] = nxn−1 .
dx
Regla del múltiplo constante. Si c es un número real,
d
[cf (x)] = cf 0 (x).
dx
Regla de la suma y diferencia. La derivada de una suma (o diferencia) de dos funciones derivables es la suma
(o diferencia) de sus derivadas:
d
[f (x) ± g(x)] = f 0 (x) ± g 0 (x).
dx
Regla del producto. El producto de dos funciones derivables es también derivable y su derivada viene dada por
d
[f (x)g(x)] = f 0 (x)g(x) + f (x)g 0 (x).
dx
38 MATEM ÁTICAS
Regla del cociente. El cociente de dos funciones derivables es también derivable y su derivada viene dada por

d f (x) f 0 (x)g(x) − f (x)g 0 (x)
= .
dx g(x) g(x)2
Regla de la cadena. La composición de dos funciones derivables es también derivable y su derivada viene dada
por
d
[f (g(x))] = f 0 (g(x))g 0 (x).
dx
2.4.3. Derivación implı́cita
En las secciones anteriores hemos visto cómo derivar funciones y = f (x). Sin embargo, en ocasiones las variables
x e y se hallan relacionadas por una ecuación F (x, y) = 0 que no permite despejar y en función de x. En estos
casos se utiliza la técnica de la derivación implı́cita, la cual presupone que la variable y es función de x.
Cuando queremos calcular dy/dx a partir de una ecuación F (x, y) = 0 debemos tener presente que estamos
derivando respecto de x. Por tanto, cuando derivemos términos en los que aparece y debemos utilizar la regla de
la cadena, ya que y está definida implı́citamente como una función de x.
El resultado de la derivación implı́cita dy/dx no suele ser una función que sólo depende de x, sino más bien una
nueva función que depende de x y de y.
2.4.4. Extremos (absolutos y relativos)
Sea f una función definida en un intervalo I conteniendo un punto a. Entonces f (a) es el mı́nimo de f en I si
f (a) 6 f (x) para todo x en I. Análogamente, f (a) es el máximo de f en I si f (a) > f (x) para todo x en I. En
ocasiones, el máximo y el mı́nimo de una función f se denominan el máximo absoluto y el mı́nimo absoluto en
ese intervalo, respectivamente (ver Figura 2.2).
Si el intervalo I es abierto, entonces f no tiene por qué tener un máximo o un mı́nimo en dicho intervalo. Sin
embargo, si I es un intervalo cerrado [a, b], entonces f tiene un máximo M y un mı́nimo m (teorema del valor
extremo).
A veces no interesa tanto el comportamiento global de la función como el comportamiento local, es decir, el com-
portamiento en intervalos pequeños. En este caso, las definiciones anteriores pueden ser ligeramente modificadas
en el siguiente sentido.
f (a) es un mı́nimo relativo de f si f (a) 6 f (x) para todo x en un intervalo abierto I conteniendo a a.
Análogamente, f (a) es un máximo relativo de f si f (a) > f (x) para todo x en un intervalo abierto I con-
teniendo a a (ver Figura 2.2).
¿Cómo podemos utilizar el cálculo para la determinación de los extremos relativos de una función? Para ello
necesitamos introducir el concepto de punto crı́tico. Si f está definida en a, se dice que a es punto crı́tico de f si
f 0 (a) = 0. Por convenio, todos los puntos que no pertenecen al dominio de f 0 son crı́ticos.
La primera aproximación nos la da el teorema de Fermat, que dice lo siguiente: “Si f tiene un extremo relativo
en a entonces f 0 (a) = 0”. Como consecuencia de lo anterior, los extremos relativos de una función sólo pueden
aparecer en los puntos crı́ticos, lo que justifica la siguiente guı́a para determinar los extremos de una función en
un intervalo cerrado:
y 6
y = f (x)
-
0 a b c d e x
Figura 2.2: Máximos y mı́nimos de una función.
(1) Determinar los puntos crı́ticos de f .
(2) Evaluar f en sus puntos crı́ticos.
(3) Calcular f (a) y f (b).
(4) El menor de los valores anteriores es el mı́nimo; el mayor es el máximo.
2.4.5. Teoremas de Rolle y del valor medio
El teorema del valor extremo discutido anteriormente garantiza la existencia de extremos absolutos en las funcio-
nes continuas definidas en un intervalo cerrado, pero no sabemos si estos extremos se alcanzan en los extremos
del intervalo o en el interior. El siguiente teorema garantiza la existencia de extremos en el interior del intervalo.
Teorema de Rolle. Sea f una función continua en un intervalo cerrado [a, b] y derivable en el intervalo abierto
(a, b) tal que f (a) = f (b). Entonces existe un punto c ∈ (a, b) tal que f 0 (c) = 0.
Debemos hacer notar que todas las hipótesis son imprescindibles. Si f no es derivable en (a, b) o f (a) 6= f (b)
entonces podemos encontrar ejemplos de funciones que no satisfacen el teorema de Rolle.
Como una generalización del teorema anterior tenemos el siguiente resultado.
Teorema del valor medio. Sea f una función continua en un intervalo cerrado [a, b] y derivable en el intervalo
abierto (a, b). Entonces existe un punto c ∈ (a, b) tal que
f (b) − f (a)
f 0 (c) = .
b−a
Geométricamente, el teorema anterior nos dice que, en las hipótesis del teorema, siempre existe un punto c tal
que la recta tangente a la curva y = f (x) en c tiene la misma pendiente que la recta secante que une los puntos
(a, f (a)) y (b, f (b)).
40 MATEM ÁTICAS
El teorema del valor medio es uno de los resultados básicos del cálculo, fundamentalmente por su utilización en
la demostración de muchos otros resultados. Una de las consecuencias más bonitas es la siguiente: “Si f 0 (x) = 0
para todo punto x ∈ (a, b) entonces f es constante en (a, b)”.
2.4.6. Funciones crecientes y decrecientes
Una función f es (estrictamente) creciente en un intervalo I si para todo par de puntos x1 y x2 en I tales
que x1 < x2 se satisface f (x1 ) < f (x2 ). Análogamente, una función f es (estrictamente) decreciente en un
intervalo I si para todo par de puntos x1 y x2 en I tales que x1 < x2 se satisface f (x1 ) > f (x2 ).
Si la función f es derivable, podemos utilizar el signo de la derivada f 0 (x) para saber si una función es creciente
o decreciente:
(1) Si f 0 (x) > 0 para todo x en (a, b) entonces f es creciente en (a, b).
(2) Si f 0 (x) < 0 para todo x en (a, b) entonces f es decreciente en (a, b).
(3) Si f 0 (x) = 0 para todo x en (a, b) entonces f es constante en (a, b).
Figura 2.3: Crecimiento y decrecimiento de una función.
Las anteriores propiedades nos permiten elaborar la siguiente guı́a para determinar los intervalos donde una fun-
ción derivable es creciente o decreciente.
(1) Localizar los puntos crı́ticos de f
(2) Determinar el signo de f 0 en cada uno de los intervalos determinados por dos puntos crı́ticos consecutivos.
(3) Utilizar las propiedades anteriores para cada uno de los intervalos obtenidos.
Una vez determinados los intervalos de crecimiento y decrecimiento de una función f es muy fácil determinar si
los puntos crı́ticos obtenidos son máximos o mı́nimos relativos, según las siguientes reglas (ver Figura 2.3):
(1) Si f 0 cambia de negativa a positiva en c entonces f (c) es un mı́nimo relativo de f .
(2) Si f 0 cambia de positiva a negativa en c entonces f (c) es un máximo relativo de f .
(3) Si f 0 no cambia de signo en c entonces f (c) no es ni máximo ni mı́nimo relativo.

2.4.7. Concavidad y puntos de inflexión
Si f es una función derivable en un intervalo abierto (a, b), se dice que la gráfica de f es cóncava hacia arriba
si f 0 es creciente en dicho intervalo, y cóncava hacia abajo si f 0 es decreciente en dicho intervalo. Observemos
que las definiciones anteriores significan que la gráfica de f se encuentra por arriba (resp. abajo) de todas sus
tangentes.
En ocasiones se utilizan los términos cóncava y convexa para las gráficas que son cóncavas hacia arriba y cóncavas
hacia abajo, respectivamente.
y 6
y 6
- -
0 x 0 x
Figura 2.4: Concavidad de una función.
La determinación de los intervalos de concavidad (hacia arriba y hacia abajo) puede obtenerse teniendo en cuenta
el signo de la derivada segunda, según la siguiente propiedad:
(1) Si f 00 (x) > 0 para todo x en (a, b) entonces la gráfica de f es cóncava hacia arriba.
(2) Si f 00 (x) < 0 para todo x en (a, b) entonces la gráfica de f es cóncava hacia abajo.
(3) Si f 00 (x) = 0 para todo x en (a, b) entonces f es una función lineal.
Un punto (c, f (c)) se dice que es un punto de inflexión de una curva y = f (x) si la gráfica de f cambia de
cóncava hacia arriba a cóncava hacia abajo, o viceversa, en dicho punto.
Como consecuencia de la definición, la recta tangente a la curva y = f (x) en el punto de inflexión corta a la
gráfica de f . Además, si (c, f (c)) es un punto de inflexión de la gráfica de f entonces f 00 (c) = 0 o f 00 no está
definida en x = c.
Finalizamos esta sección con el criterio de la derivada segunda para la determinación de los extremos relativos. El
criterio se basa en que en que si f 0 (c) = 0 y existe un intervalo de c donde la gráfica de f es cóncava hacia abajo
entonces f (c) es un máximo de f ; por el contrario, si la gráfica de f es cóncava hacia arriba entonces f (c) es un
mı́nimo de f .
(1) Si f 00 (c) > 0 entonces f (c) es un mı́nimo relativo.
(2) Si f 00 (c) < 0 entonces f (c) es un máximo relativo.
(3) Si f 00 (c) = 0 entonces el criterio no decide.

42 MATEM ÁTICAS
2.4.8. Representación de funciones
Para realizar correctamente la gráfica de una función f es conveniente seguir los pasos que a continuación se
indican:
• Dominio
• Intersecciones con los ejes
• Simetrı́as
• Puntos de discontinuidad
• Ası́ntotas verticales
• Ası́ntotas horizontales
• Crecimiento y decrecimiento
• Extremos relativos
• Concavidad y puntos de inflexión
En ocasiones no es necesario calcular todos los apartados anteriores. Suelen ser imprescindibles el dominio, las
ası́ntotas (horizontales y verticales) y los siguientes puntos: de intersección con los ejes, extremos relativos y de
inflexión.
2.5. Teorema de Taylor
2.5.1. Sucesiones y lı́mites de sucesiones
Una sucesión {an } es una función cuyo dominio es el conjunto de los números naturales (o enteros positivos: 1,
2, 3, . . . ). Los valores a1 , a2 , . . . se llaman los términos de la sucesión.
2.5.1.1. Lı́mites de sucesiones
Es posible que conforme vaya aumentando el valor de n los correspondientes números an se vayan aproximando
a un número fijo L. Si esto ocurre, se dice que la sucesión es convergente y su lı́mite es L:
lim an = L
n→∞
En caso contrario diremos que la sucesión es divergente. La definición rigurosa es la siguiente:
La sucesión {an } es convergente con lı́mite L si para todo número > 0 existe M > 0 tal que |an − L| <
siempre que n > M .
A veces es más fácil calcular el lı́mite de una función que el de una sucesión y esto puede permitirnos, aunque no
lo parezca, resolver lı́mites de sucesiones. El siguiente resultado nos ofrece la clave.
Sea f una función de una variable real tal que lim f (x) = L. Si {an } es una sucesión tal que an = f (n)
x→∞
entonces
lim an = L.
n→∞
Los lı́mites de sucesiones satisfacen propiedades similares a los lı́mites de funciones, ya descritos en una sección
anterior. Los recordamos aquı́. Sean {an } y {bn } dos sucesiones tales que
lim an = L y lim bn = K.
n→∞ n→∞
Entonces:
(1) lim (an ± bn ) = L ± K.

n→∞
(2) lim (can ) = cL.

n→∞
(3) lim (an bn ) = LK.

n→∞
(4) lim (an /bn ) = L/K, si bn 6= 0 y K 6= 0.

n→∞
Otras propiedades importantes de los lı́mites de sucesiones son las siguientes.
(1) Si lim an = L = lim bn y existe un entero N tal que an 6 cn 6 bn para todo n > N entonces
n→∞ n→∞
lim cn = L.
n→∞
(2) Si lim |an | = 0 entonces lim an = 0.

n→∞ n→∞
2.5.1.2. Tipos de sucesiones
Una sucesión {an } se dice monótona si sus términos son no decrecientes
a1 6 a2 6 a 3 6 · · · 6 an 6 · · ·
o no crecientes
a 1 > a2 > a3 > · · · > an > · · ·
Una sucesión {an } se dice acotada si existe un número real positivo M tal que |an | 6 M para todo n. El número
M se denomina cota (superior) de la sucesión.
Uno de los principales resultados acerca de sucesiones acotadas y convergentes es el siguiente: “Toda sucesión
monótona y acotada es convergente ”.
44 MATEM ÁTICAS
2.5.2. Polinomios de Taylor y aproximación
El objetivo fundamental de esta sección es mostrar cómo se pueden utilizar polinomios para aproximar otras
funciones. Para ello, lo primero que debemos hacer es fijar un punto c alrededor del cual vamos a realizar la
aproximación. Este punto c es el centro de la aproximación y el objetivo es encontrar el polinomio (de un cierto
grado predeterminado) que mejor se aproxima (en un cierto sentido) a la función f en un entorno del punto c.
Si f tiene n derivadas en c, el polinomio
f 00 (c) f (n) (c)

Pn (x) = f (c) + f 0 (c)(x − c) + (x − c)2 + · · · + (x − c)n
2! n!
se denomina el n-ésimo polinomio de Taylor de f centrado en c. Si c = 0, entonces el polinomio anterior se
denomina el n-ésimo polinomio de Maclaurin de f .
Cualquier método de aproximación tiene una utilidad relativa (más bien poca) si se desconoce el error que se
comete. Para medir la precisión al aproximar un valor f (x) por el polinomio de Taylor Pn (x) descomponemos
f (x) = Pn (x) + Rn (x), donde Rn (x) es el resto. El error cometido en la aproximación es el valor absoluto del
resto, es decir,
error = |Rn (x)| = |f (x) − Pn (x)|.
El siguiente teorema estima el error anterior.
Teorema de Taylor. Si una función f es derivable hasta el orden n + 1 en un intervalo (a, b) conteniendo a c,
entonces para todo x en (a, b) existe un número z entre x y c tal que
f (n+1) (z)
f (x) = Pn (x) + Rn (x), Rn (x) = (x − c)n+1 .
(n + 1)!
La expresión anterior de Rn (x) se denomina forma de Lagrange para el resto. A la hora de utilizar el teorema
anterior no se trata de encontrar explı́citamente el valor de z si no más bien encontrar cotas para f (n+1) (z), que
nos darán una idea más o menos precisa del tamaño del resto.
2.5.3. Series de potencias: coeficientes y radio de convergencia
Una serie de potencias es una serie infinita de la forma

∞
X
a n xn = a 0 + a 1 x + a 2 x2 + a 3 x3 + · · · + a n xn + · · ·
n=0
donde x denota una variable. De forma general, una serie de potencias centrada en c es una serie infinita de la
forma
X∞
an (x − c)n = a0 + a1 (x − c) + a2 (x − c)2 + a3 (x − c)3 + · · · + an (x − c)n + · · ·
n=0
Los números {an } se denominan los coeficientes de la serie.
Para una serie de potencias centrada en c ha de ocurrir exactamente una de las tres posibilidades siguientes:
1. La serie converge sólo en c.

2. Existe un número real R > 0 tal que la serie converge (absolutamente) si |x−c| < R y diverge si |x−c| > R.
3. La serie converge para todo x.
El número R se llama radio de convergencia de la serie de potencias. Si la serie converge sólo en c diremos que
el radio de convergencia es cero, y si la serie es convergente para todo x diremos que el radio de convergencia es
infinito. El conjunto de valores x donde la serie es convergente se denomina el intervalo de convergencia de la
serie de potencias.
2.5.4. Operaciones con series de potencias
Las operaciones básicas con series de potencias son las siguientes. Sean
∞
X ∞
X
f (x) = a n xn y g(x) = bn xn
n=0 n=0
dos series de potencias. Entonces:
∞
X
(1) f (kx) = a n k n xn
n=0
∞
X
(2) f (xm ) = an xnm
n=0
∞
X
(3) f (x) ± g(x) = (an ± bn )xn
n=0
∞
!
X X
n
(4) f (x)g(x) = am bn−m xn
n=0 m=0
2.5.5. Series de Taylor y de Maclaurin
P
Si f (x) = ∞ n=0 an (x − c) es una serie de potencias (convergente) entonces los coeficientes {an } de la serie
n
quedan determinados por

f (n) (c)
an = .
n!
Como consecuencia, si una función f (x) admite un desarrollo en serie de potencias, tal desarrollo tiene que ser
necesariamente el siguiente:
X∞
f (n) (c)
(x − c)n .
n=0
n!
La serie anterior se denomina serie de Taylor en c. Cuando c = 0, tal serie se conoce con el nombre de serie de
Maclaurin de f .
Una función f (x) se dice que es analı́tica si coincide con su serie de potencias en todos los puntos del dominio,
es decir, si
X∞
f (n) (c)
f (x) = (x − c)n .
n=0
n!
Algunas de las series de potencias asociadas a funciones elementales aparecen recogidas en la Tabla 2.1, junto con
los intervalos de convergencia.
46 MATEM ÁTICAS
Función Serie Intervalo
∞
X
1
(−1)n xn −1 < x < 1
1+x n=0
X∞
(−1)n−1
ln(x) (x − 1)n 0<x62
n=1
n
X∞
xn
ex −∞ < x < ∞
n=0
n!
X∞
(−1)n x2n+1
sin(x) −∞ < x < ∞
n=0
(2n + 1)!
X∞
(−1)n x2n
cos(x) −∞ < x < ∞
n=0
(2n)!
Tabla 2.1: Series de potencias asociadas a algunas de las funciones m ás usuales.
2.6. Cálculo Numérico
2.6.1. Métodos numéricos de resolución de ecuaciones
Uno de los problemas más básicos del análisis numérico consiste en encontrar los valores x que satisfacen una de-
terminada ecuación f (x) = 0, para una función f dada. Este problema, conocido como el problema de búsqueda
de raı́ces, no es un problema trivial y prueba de ello es que sigue estando de plena actualidad. La dificultad no es-
triba en encontrar métodos para obtener soluciones, sino encontrar métodos que permitan encontrar las soluciones
en un “tiempo razonable”. En esta sección vamos a discutir tres métodos: el algoritmo de bisección, el método de
iteración del punto fijo y el método de Newton-Raphson.
2.6.1.1. Algoritmo de bisección
La justificación teórica de este método debemos buscarla en el teorema de Bolzano: si f es una función continua
en [a, b] con signos opuestos en los extremos (es decir, f (a)f (b) < 0), entonces existe un cero de f en (a, b).
El algoritmo de bisección o método de búsqueda binaria puede describirse como sigue. Comenzamos definien-
do a1 = a y b1 = b, y sea p1 el punto medio del intervalo (a1 , b1 ). Si f (p1 ) = 0, ya hemos encontrado el cero.
De lo contrario, f (p1 ) 6= 0 y entonces puede suceder una de las dos afirmaciones siguientes:
1. f (p1 )f (a1 ) < 0. En este caso tomamos a2 = a1 y b2 = p1 .
2. f (p1 )f (b1 ) < 0. En este caso tomamos a2 = p1 y b2 = b1 .
Ahora repetimos el proceso anterior al intervalo [a2 , b2 ].

y6
f (b) (b, f (b))
-
a p1 p2 b x
f (a)
(a, f (a))
Figura 2.5: Algoritmo de bisección.
Observemos que en cada etapa la longitud del intervalo resultante es la mitad de la longitud del intervalo prece-
dente, por lo que
1 1
L([an , bn ]) = n L([a, b]) = n (b − a)
2 2
Esto significa que, siempre que se verifiquen las condiciones del teorema de Bolzano, el método proporciona una
solución, ya que la sucesión {pn } es de Cauchy y, por tanto, convergente.
No obstante, en la práctica no se suele encontrar el valor exacto de la solución por lo que conviene introducir algún
mecanismo de paro. Algunos de los mecanismos de paro más usuales son:
(1) Fijar un número máximo n0 de iteraciones.
(2) Seguir hasta que |pn − pn−1 | < .

|pn − pn−1 |
(3) Seguir hasta que < con pn 6= 0. Este mecanismo es el mejor criterio de paro, ya que mide el
|pn |
error relativo.
(4) Seguir hasta que |f (pn )| < .
2.6.1.2. Método de iteración del punto fijo
Un punto fijo de una función g es un punto a tal que g(a) = a. Dada una función f , podemos considerar
la función g(x) = x ± f (x), de forma que a es un cero de f si y sólo si a es punto fijo de g. Por tanto, la
determinación de puntos fijos puede ayudar a la determinación de raı́ces.
En este punto surge un problema: ¿todas las funciones tienen puntos fijos? Si la respuesta es negativa, entonces
¿qué condiciones debe satisfacer una función para que tenga puntos fijos?
Condiciones para la existencia de puntos fijos. Si g es una función continua definida en [a, b] y con valores en el
mismo intervalo, entonces g tiene un punto fijo. Si además g es derivable en (a, b) y satisface |g 0 (x)| 6 k < 1 en
(a, b) entonces sólo existe un punto fijo.
Si g es una función que satisface el resultado anterior y p0 es un punto cualquiera del intervalo [a, b] entonces la
sucesión
pn = g(pn−1 )
48 MATEM ÁTICAS
y=x
y 6
g(p) = p
y = g(x)
a
-
p x
a b
Figura 2.6: Método de iteración del punto fijo.
converge al único punto fijo p de g en [a, b]. Además, una cota para el error cometido si se utiliza pn para aproximar
a p viene dada por
|pn − p| 6 kn max{p0 − a, b − p0 }.
2.6.1.3. Método de Newton-Raphson
Este método, también conocido sólo como método de Newton, es uno de los algoritmos más conocidos y poderosos
en la resolución de ecuaciones f (x) = 0. La idea del método es construir una sucesión de puntos que se aproximan
a la solución utilizando para ello las rectas tangentes a la función f .
y y = f (x)
6
•
p
p0 p2 -
p1 x
0 •
Figura 2.7: Esquema del método de Newton.
La justificación teórica del método es la siguiente. Sea p el punto fijo y consideremos un punto y próximo a p que
no es una raı́z de f 0 , es decir, f 0 (y) 6= 0. Utilizando el polinomio de Taylor de grado 1 para la función f alrededor
del punto y obtenemos
f 00 (z)
f (x) = f (y) + f 0 (y)(x − y) + (x − y)2 ,
2
donde z es un número entre x e y. Particularizando la ecuación anterior en x = p obtenemos
f 00 (z)
0 = f (y) + f 0 (y)(p − y) + (p − y)2 .
2
Si suponemos que |p − y| es pequeño, entonces (p − y)2 es despreciable frente a |p − y| por lo que la ecuación
anterior queda 0 ≈ f (y) + f 0 (y)(p − y). Despejando p es esta ecuación se obtiene
f (y)
p≈y− ,
f 0 (y)
lo que es una aproximación mejor a p que y. El método de Newton consiste en considerar la sucesión de puntos
f (pn−1 )
pn = pn−1 − , n > 1.
f 0 (pn−1 )
En consecuencia, el método no puede seguir aplicándose cuando f 0 (pn−1 ) = 0 para algún n.
2.6.2. Interpolación polinómica
El problema de la interpolación polinómica consiste en determinar el polinomio de menor grado que pasa por
n + 1 puntos (x0 , y0 ), . . . , (xn , yn ) prefijados. El grado de dicho polinomio es a lo más n.
2.6.2.1. Polinomio de interpolación de Lagrange
Si (x0 , y0 ), . . . , (xn , yn ) son n + 1 pares de puntos tales que sus abcisas x0 , x1 , . . . , xn son todas distintas,
entonces existe un único polinomio P , denominado polinomio interpolante de Lagrange, de grado a lo más n
con la propiedad de que
P (xk ) = yk , k = 0, 1, . . . , n.
Este polinomio está dado por
X
n
P (x) = y0 Ln,0 (x) + y1 Ln,1 (x) + . . . + yn Ln,n (x) = yk Ln,k (x)
k=0
donde
Y
n
(x − xi )
Ln,k (x) = .
(xk − xi )
i=0,i6=k
Una pregunta importante en análisis numérico es la referida al error cometido cuando se realiza una aproximación.
En este caso, el término residual o cota de error cometido en la aproximación de una función por su polinomio
interpolante viene dado en el siguiente resultado.
Cota de error. Sea f una función suficientemente derivable en el intervalo [a, b] y consideremos (x0 , y0 ), . . . ,
(xn , yn ) n + 1 pares de puntos tales que yk = f (xk ) para todo k = 0, 1, . . . , n. Entonces
f (n+1) (z)
f (x) = P (x) + (x − x0 )(x − x1 ) · · · (x − xn ),
(n + 1)!
con z ∈ (a, b), donde P es el polinomio interpolante de Lagrange.
Observemos la similitud existente entre el resto en la aproximación anterior y el resto en el polinomio de Taylor
estudiado anteriormente.
50 MATEM ÁTICAS
Ln,k (x)
- x
x0 x1
xk xk+1
xn
xk−1 xn−1
Figura 2.8: Polinomio interpolante de Lagrange.
2.6.2.2. Método de interpolación iterada
El método descrito en la sección anterior para calcular el polinomio interpolante es muy complicado y poco
práctico. En primer lugar, la precisión del polinomio no se puede determinar hasta que los cálculos han sido
completados. En segundo lugar, los cálculos realizados para la obtención de unos polinomios interpolantes no
se pueden utilizar para calcular los polinomios interpolantes de grados superiores: siempre es necesario partir de
cero. En esta sección vamos a describir un método que permite aprovechar el trabajo realizado. La justificación
teórica del método es el siguiente resultado.
Sea f una función definida en x0 , x1 , . . . , xn y supongamos que m1 , m2 , . . . , mk son k enteros distintos con
0 6 mi 6 n para cada i. El polinomio de Lagrange de grado menor que k que coincide con f en xm1 , xm2 , . . . ,
xmk se denota por Pm1 ,m2 ,...,mk . Si xj , xi son dos números distintos y
(x − xj )P0,1,...,j−1,j+1,...,k (x) − (x − xi )P0,1,...,i−1,i+1,...,k (x)
P (x) =
(xi − xj )
entonces P es el polinomio interpolante de Lagrange de grado menor o igual que k que interpola a f en x0 , x1 ,
. . . , xk .
2.6.2.3. Método de diferencias divididas
Los métodos que nos permiten representar explı́citamente el polinomio interpolante a partir de datos tabulados se
conocen con el nombre de métodos de diferencias divididas. Sean x0 , x1 , . . . , xn puntos distintos y considere-
mos Pn el polinomio de Lagrange que interpola a f en dichos puntos. Entonces existen constantes apropiadas a0 ,
a1 , . . . , an tales que
Pn (x) = a0 + a1 (x − x0 ) + a2 (x − x0 )(x − x1 ) + · · · + an (x − x0 ) · · · (x − xn−1 ).
Tales constantes pueden determinarse de la siguiente manera. En primer lugar, a0 = Pn (x0 ) = f (x0 ). Si ahora
evaluamos en x1 se obtiene f (x0 ) + a1 (x1 − x0 ) = Pn (x1 ) = f (x1 ) de donde
f (x1 ) − f (x0 )
a1 = .
x1 − x0
Para determinar el resto de constantes vamos a introducir la siguiente notación.
f [xi ] = f (xi ),
f [xi+1 ] − f [xi ]
f [xi , xi+1 ] = ,
xi+1 − xi
..
.
f [xi+1 , . . . , xi+k ] − f [xi , . . . , xi+k−1 ]
f [xi , xi+1 , . . . , xi+k−1 , xi+k ] =
xi+k − xi
Ahora es un mero ejercicio de manipulación algebraica deducir que
ak = f [x0 , x1 , . . . , xk ], k = 0, 1, . . . , n.
2
A.2.1. Hallar la ecuación de la recta tangente a la curva y = 32x +1
en el punto (0, 3).
A.2.2. Dada la parábola de ecuación y = x2 − 8x + 12, determinar el punto donde la tangente es paralela al eje
de abscisas.
A.2.3. Escribir la ecuación de la recta tangente a la hipérbola xy = 1 en el punto de abscisa x = 3.
A.2.4. ¿En qué punto de la gráfica de la función f (x) = x2 − 6x + 8 la tangente es paralela al eje de abscisas?
A.2.5. Determinar los puntos de la curva y = x3 + 9x2 − 9x + 15 en los cuales la tangente es paralela a la recta
y = 12x + 5.
A.2.6. Determinar los puntos de la curva y = x4 − 7x3 + 13x2 + x + 1 que tienen la tangente formando un ángulo
de π/4 radianes con el eje de abcisas.
A.2.7. Probar que la recta tangente a la curva f (x) = log2 (x) en el punto (a, f (a)) se traza uniéndolo con el
punto (0, f (a) − 2 log a).
A.2.8. Obtener las ecuaciones de la rectas tangente y normal a la curva y = x3 en los puntos (1, 2) y (2, 8).
A.2.9. Obtener las ecuaciones de la rectas tangente y normal a la curva y = (x + 1)(3 − x)1/3 en el punto (2, 3).
A.2.10. La curva dada por y = x2 + ax + b pasa por el punto (−2, 1) y alcanza un extremo relativo en x = −3.
Hallar a y b.
A.2.11. Hallar a, b, c y d para que la curva dada por y = ax3 +bx2 +cx+d tenga un máximo en el punto (−2, 21)
y un mı́nimo en el punto (−1, 6).
A.2.12. Hallar dos números cuya suma sea 20 y su producto el mayor posible.
A.2.13. Descomponer el número 25 en dos sumandos tales que el doble del cuadrado del primero más el triple
del cuadrado del segundo sea mı́nimo.
A.2.14. Calcular las dimensiones del mayor rectángulo cuyo perı́metro es 40 metros.
A.2.15. Demostrar que la suma de un número real positivo no nulo y su inverso es mayor o igual que 2.
A.2.16. Hallar dos números cuya suma es 18, sabiendo que el producto del uno por el cuadrado del otro ha de ser
máximo.
A.2.17. Hallar las dimensiones de un campo rectangular de 3600 metros cuadrados de superficie para poderlo
cercar mediante una valla de longitud mı́nima.
52 MATEM ÁTICAS
A.2.18. Se quiere vallar un campo rectangular que está junto a un camino. Si la valla del lado del camino cuesta
800 pesetas/metro y la de los otros lados cuesta 100 pesetas/metro, hallar el área del mayor campo que se
puede cercar con 288000 pesetas.
A.2.19. Un jardinero ha de construir un parterre en forma de sector circular con perı́metro de 20 metros. ¿Cuál
será el radio que da el parterre de área máxima? ¿Cuál será la amplitud en radianes del sector?
A.2.20. Los barriles que se utilizan para almacenar petróleo tienen forma cilı́ndrica y una capacidad de 160 litros.
Hallar las dimensiones del barril para que la chapa empleada en su construcción sea mı́nima.
A.2.21. De todos los triángulos isósceles de 12 metros de perı́metro, hallar las dimensiones del que tenga área
máxima.
A.2.22. Entre todos los rectángulos inscritos en una circunferencia de 12 metros de radio, hallar las dimensiones
del que tenga área máxima.
A.2.23. Averiguar cómo ha de ser un triángulo isósceles de área máxima inscrito en una circunferencia de radio
r.
A.2.24. Entre todos los cilindros rectos de volumen fijo V , hallar el de menor superficie.
A.2.25. Una hoja de papel debe contener 18 centı́metros cuadrados de texto impreso. Los márgenes superior e
inferior deben tener 2 centı́metros cada uno y los laterales 1 centı́metro. Calcular las dimensiones de la hoja
para que el gasto de papel sea mı́nimo.
A.2.26. Hallar los puntos de la curva y 2 = 6x cuya distancia al punto (4, 0) sea mı́nima.
A.2.27. Determinar la distancia mı́nima del origen a la curva xy = 1.
A.2.28. Determinar las dimensiones de una piscina no cubierta de volumen 32 m3 con un fondo cuadrado, de
manera que la superficie de sus paredes y del suelo necesiten la mı́nima cantidad de material.
A.2.29. De una lámina cuadrada de 10dm de lado se cortan cuadrados en cada uno de los vértices con el objeto
de hacer una caja abierta por arriba. Calcular el lado del cuadrado que se debe cortar para que el volumen
de la caja sea máximo.
A.2.30. Las agujas de un reloj miden 4 y 6cm. Uniendo sus extremos se forma un triángulo. Determinar el
instante entre las 12h y las 12h30m en el cual el área del triángulo es máxima.
A.2.31. La tangente en un punto a una curva es paralela al eje horizontal. ¿Qué puede decirse de su inclinación?
¿Y de su pendiente? ¿Y de la derivada de la curva en ese punto?
A.2.32. a) Calcular el polinomio de Taylor de tercer grado alrededor de x0 = 0 para f (x) = (1 + x)1/2 .
√
b) Usar el polinomio de la parte (a) para aproximar 1.1.
A.2.33. Con el polinomio de Taylor de tercer grado P3 (x) obtenido en el ejercicio anterior, aproximar f (0.1),
f (0.5), f (1), f (2) y f (10). Calcular el error cometido en cada caso.
A.2.34. Encontrar el polinomio de Taylor de grado 2 para f (x) = x2 − 3 alrededor del punto
a) x0 = 1.
b) x0 = 0.
A.2.35. Obtener el polinomio de Taylor de tercer grado para f (x) = (1 + x)−2 alrededor de x0 = 0, y usar este
polinomio para aproximar f (0.05).
A.2.36. Sea f (x) = ln(1 + x). Encontrar el polinomio de Taylor de grado 4 para f alrededor de x0 = 0, y usarlo
para aproximar ln(1.1).
A.2.37. Usando los números, o nodos, x0 = 2, x1 = 2.5 y x2 = 4, calcular el polinomio interpolante de Lagrange
de segundo grado para la función f (x) = 1/x. Usar dicho polinomio para calcular el valor de f (3) y obtener
el error cometido.
A.2.38. Usar los polinomios interpolantes de Lagrange apropiados, de grado uno, dos, tres y cuatro, para aproxi-
mar
(a) f (2.5) si
f (2) = 0.5103757, f (2.2) = 0.5207843, f (2.4) = 0.5104147,
f (2.6) = 0.4813306, f (2.8) = 0.435916.
(b) f (0) si
f (−0.3) = −0.20431, f (−0.1) = −0.08993, f (0.1) = 0.11007,
f (0.3) = 0.39569, f (0.5) = 0.79845.
(c) f (1.25) si
f (1) = 0.24255, f (1.1) = 0.48603, f (1.2) = 0.8616, f (1.3) = 1.59751, f (1.4) = 3.76155.
(d) f (0.5) si
f (0.2) = 0.9798652, f (0.4) = 0.917771, f (0.6) = 0.8080348,
f (0.8) = 0.6386093, f (1) = 0.3843735.
(e) f (0.2) si
f (0.1) = 1.2314028, f (0.3) = 1.9121188, f (0.4) = 2.3855409,
f (0.5) = 2.9682818, f (0.6) = 3.6801169.
A.2.39. Usar los valores siguientes para construir un polinomio de Lagrange de grado dos o menor. Encontrar
una aproximación para sen(0.34).
sen 0.3 = 0.29552 sen 0.32 = 0.31457 sen 0.35 = 0.3429
A.2.40. Agregar el valor sen 0.33 = 0.32402 a los datos del ejercicio anterior y construir un polinomio de La-
grange de grado tres o menor. Aproximar sen 0.34.
A.2.41. Usar los valores siguientes para construir una aproximación polinómica de Lagrange de tercer grado para
f (1.09). La función que se está aproximando es f (x) = log10 tan(x).
f (1) = 0.1924 f (1.05) = 0.2414 f (1.1) = 0.2933 f (1.15) = 0.3492
A.2.42. Usar el polinomio interpolante de Lagrange de grado tres o menor para aproximar cos 0.75 usando los
siguientes valores:
cos 0.698 = 0.7661 cos 0.733 = 0.7432
cos 0.768 = 0.7193 cos 0.803 = 0.6946
A.2.43. La función f (x) = x3 + 4x2 − 10 tiene una raı́z en [1, 2]. Utilizar el algoritmo de bisección (10 etapas)
para calcular una aproximación de la raı́z. Calcular el error sabiendo que la raı́z exacta, con nueve cifras
decimales, es p = 1.365230013.
A.2.44. Demostrar que f (x) = x3 − x − 1 tiene exactamente un cero en el intervalo [1, 2]. Aproximar el cero con
0.01 de precisión usando el algoritmo de bisección.
A.2.45. Usar el algoritmo de bisección para encontrar soluciones con una exactitud de 0.01 para x4 − 2x3 − 4x2 +
4x + 4 = 0 en
(a) [−2, 0]
(b) [0, 2]
(c) [1, 2].
A.2.46. Usar el algoritmo de bisección para encontrar una solución con una exactitud de 0.01 para x = tan x en
[4, 4.5].
A.2.47. Usar el algoritmo de bisección para encontrar todas las soluciones de x3 − 7x2 + 14x − 6 = 0 con una
precisión de 0.001.
A.2.48. Usar el método de iteración del punto fijo para determinar una solución exacta a 0.01 para 2 sen πx + x =
0 en [1, 2]. Tomar p0 = 1.
A.2.49. Resolver x3 − x − 1 = 0 para la raı́z en [1, 2] usando el método de iteración del punto fijo. Obtener una
aproximación a la raı́z exacta a 0.01.
54 MATEM ÁTICAS
A.2.50. Usar el método de iteración del punto fijo para determinar una solución exacta a 0.001 de x = tan x en
[4, 5].
A.2.51. Aproximar con 0.01 de precisión las raı́ces de las siguientes ecuaciones en los intervalos dados usando el
método de Newton y el método de la secante.
(a) x3 − 2x2 − 5 = 0 en [1, 4].
(b) x3 + 3x2 − 1 = 0 en [−4, 0].
(c) x − cos x = 0 en [0, π/2].
(d) x − 0.8 − 0.2 sen x = 0 en [0, π/2].
4.1. Introducción
necesitar.
En esta práctica nos vamos a centrar en el cálculo diferencial en una variable. Aprenderemos a calcular lı́mites
de funciones, determinaremos los máximos, mı́nimos, y puntos de inflexión de una función, lo que nos permitirá
representar gráficamente dicha función (lo cual, dicho sea de paso, hace automáticamente el programa).
Antes de comenzar la práctica será conveniente que recordemos brevemente la ‘botonera’ de DERIVE for Win-
dows (ver Figura 2.9), ya que simplifica enormemente la introducción de datos y la realización de cálculos. Los
botones permiten realizar las siguientes tareas (de izquierda a derecha): New (abrir una nueva hoja de trabajo),
Open (abrir una hoja de trabajo existente), Save (guardar la sesión de trabajo), Print (imprimir la sesión de tra-
bajo), Remove (eliminar la expresión marcada), Unremove (recuperar la última expresión eliminada), Renumber
(renumerar las expresiones), Author expression (introducir una expresión sencilla), Author vector (introdu-
cir un vector), Author matrix (introducir una matriz), Simplify (simplificar), Approximate (calcular un valor
en rapidez.
4.2. Ejemplos de ilustración
Con DERIVE for Windows podemos calcular la derivada (de cualquier orden) de una función, el lı́mite de una
función f (x) cuando x tiende a un número finito x0 o infinito, los máximos, mı́nimos y puntos de inflexión, y
también podemos utilizar la información anterior para representar gráficamente una función. Veamos mediante
ejemplos cómo hacer cada una de las tareas anteriores.
ln(1 + x) − ln(1 − x)
Hallar el siguiente lı́mite: lim
x→0 x
Elejimos Author y escribimos (ln(1+x)-ln(1-x))/x. Después de seleccionar las opciones Calculus|Limit

(o bien pulsamos el botón lim ) nos aparece la ventana de la Figura 2.10. El programa nos solicita la función,
la variable, el punto que utilizaremos para el cálculo del lı́mite y el tipo de aproximación: Left (lı́mite por la
izquierda), Right (lı́mite por la derecha) y Both (lı́mite ordinario). En nuestro caso, seleccionamos x, 0 y Both.
Finalmente para obtener el resultado debemos pulsar la tecla Simplify, con lo que el programa nos devuelve
como valor del lı́mite el número 2.
Figura 2.10: Ventana del programa que nos permite calcular lı́mites de funciones.
Calcular la derivada de (3x2 + 5x − 1)4
Elejimos Author e introducimos la expresión (3x^2+5x-1)^4. A continuación seleccionamos las opciones

Calculus|Differentiate (o bien pulsamos el botón ∂ ) y nos aparece la ventana de la Figura 2.11. Entonces
el programa nos ofrece la expresión que queremos derivar (por defecto la que estaba seleccionada), la variable de
derivación (por defecto x) y el orden de la derivada que queremos calcular (por defecto 1). Tras pulsar la tecla
obtenemos 4(6x + 5)(3x2 + 5x − 1)3 . Si queremos desarrollar la expresión anterior deberemos seleccionar las
opciones Simplify|Expand (o simplemente teclear Ctrl+B) y nos aparece la ventana de la Figura 2.12. Tras
pulsar el botón Expand obtendremos el siguiente polinomio: 648x7 + 3780x6 + 7452x5 + 4800x4 − 884x3 −
960x2 + 276x − 20.
Calcular la derivada décima de e2x+1
Seguimos los mismos pasos que en el ejemplo anterior. Introducimos la expresión #e^(2x+1) y seleccionamos
56 MATEM ÁTICAS
Figura 2.11: Ventana del programa que nos permite derivar funciones.
Figura 2.12: Ventana del programa que nos permite desarrollar y simplificar expresiones.
las opciones Calculus|Differentiate. La variable de derivación es x y el orden de derivación es 10. Después

de desarrollar el resultado (pulsando la tecla Simplify) se obtiene 1024e2x+1 .
Calcular los extremos y puntos de inflexión de la función 12x5 − 105x4 + 40x3 + 840x2 − 1440x
En este caso, lo conveniente es almacenar la función. Para ello, elegimos Declare y a continuación Function
definition, y nos aparece la ventana de la Figura 2.13. El programa nos solicita el nombre, la variable (o varia-
bles) independiente y la definición de la función. Tecleamos el nombre de la función (por ejemplo, F), el nombre
de la variable (por ejemplo, x) y la definición mediante la expresión 12x^5-105x^4+40x^3+840x^2-1440x.
Para los extremos debemos calcular los ceros de la derivada; para ello, seleccionamos las opciones Calculus|
Differentiate (con los valores de x para la variable y de 1 para el orden) y obtenemos 64x4 − 420x3 +
120x2 + 1680x − 1440. A continuación determinamos los ceros de este polinomio mediante las opciones
Solve|Algebraically, obteniendo x=1, x=2, x=-2, x=6.
Para determinar el carácter de estas raı́ces, debemos calcular el valor de la derivada segunda en ellos. Para ello,
seleccionamos la expresión que contiene la definición de la función F o la expresión que contiene su derivada.
A continuación seleccionamos las opciones Calculus|Differentiate, con el valor x para la variable y 2 ó
1 para el orden (dependiendo de si hemos seleccionado la función F o su derivada). Una vez hemos calculado
la derivada segunda la almacenamos en una función, que llamaremos G, siguiendo los mismos pasos que antes
(Declare y Function definition. . . ), recordando que para copiar automáticamente la expresión seleccionada
Figura 2.13: Venta del programa que permite declarar una función. Existen ventanas similares para declarar el
valor de una variable (constante, vector o matriz).
debemos pulsar F3. Si ahora queremos calcular el valor de G en las raı́ces previamente calculadas, sólo tenemos
que introducir la expresión G(1) y pulsar Simplify (análogamente para las demás), obteniendo los siguientes
resultados : G(1)=900 (luego en x=1 hay un mı́nimo), G(2)=-960 (máximo en x=2), G(-2)=-5760 (máximo
en x=-2) y G(6)=9600 (mı́nimo en x=6). Otra posibilidad es calcular los cuatro valores al mismo tiempo; para
ello introducimos la expresión como un vector de 4 elementos como [G(1),G(2),G(-2),G(6)], y el progra-
ma nos devolverá la solución como un vector: [900, -960, -5760, 9600]. Para determinar las ordenadas
correspondientes a cada abscisa habremos de calcular F (1), F (2), F (−2) y F (6), respectivamente, resultando:
F (1) = −653, F (2) = −496, F (−2) = 3856 y F (6) = −12528.
Para calcular los puntos de inflexión debemos obtener los ceros de la derivada segunda. Si la precisión de los
cálculos es Exact entonces obtendremos la solución en forma trigonométrica. Para obtener un resultado que
podamos manejar más cómodamente es conveniente aproximar seguidamente la solución numéricamente (utili-
zando para ello las opciones Simplify|Approximate con el número de dı́gitos que nos parezca adecuado). Los
ceros de la derivada segunda que se obtienen son los siguientes (damos también la ordenada correspondiente):
(1.51, −573.59), (−0.98, 2079.11) y (4.72, −7904.16).
A continuación se enuncian unos ejercicios sobre cálculo diferencial de funciones reales de una variable. Si el
alumno encuentra alguna dificultad debe revisar detenidamente los ejemplos anteriores.
√
9n4 − n + 3
(a) Calcular el lı́mite lim .
n→0 2n2 + 3n − 1
πx
(b) Calcular el lı́mite lim (1 − x) tan( ).
x→1 2
(c) Calcular la derivada quinta de e3x ln(x).
(d) Calcular los extremos y los puntos de inflexión de la función x4 − 2x2 .
58 MATEM ÁTICAS
R.L. BURDEN y J.D. FAIRES Análisis Numérico, Grupo Editorial Iberoamericana, 1985. Secciones 2.1, 2.2,
2.3, 3.2, 3.3 y 3.4.
Hill, Madrid, 1995. Capı́tulos 2,3 y 4.
J. STEWART Cálculo, 2a ed. Grupo Editorial Iberoamérica, México, 1994. Capı́tulos 1,2, y 3.
E.2.1. Representar gráficamente la función dada por
4x2 − 4x + 1
y= .
5x2 − 6x + 1
E.2.2. Determinar cómo ha de ser un triángulo isósceles de área máxima inscrito en una circunferencia de radio
r.
E.2.3. Se considera la siguiente tabla de datos:
x f (x)
0 1
1 3
3 −2
5 4
Utilizar interpolación polinómica para calcular una aproximación a f (2).
E.2.4. Se dispone de un alambre de longitud L con el que hay que construir un cı́rculo y un cuadrado. ¿Cómo se
debe dividir el alambre en dos trozos para que la suma de las áreas encerradas por el cı́rculo y el cuadrado
sea mı́nima? ¿Y para que dicha suma de áreas sea máxima?
E.2.5. Utilizar algún método numérico para aproximar, con una precisión de 10−6 , el valor de x tal que la distan-
cia entre el punto (1,0) y los puntos de la parábola (x, y(x)), y(x) = x2 , se hace mı́nima.
Observación : Sea cual sea el método que se utilice, debe considerarse que un valor aproximado pn se acerca
al valor real con una precisión de 10−6 si se satisface que |pn − pn−1 | < 10−6 .
E.2.6. Un pediatra está realizando un seguimiento del peso de los niños que pasan por su consulta. Elegida una
ficha al azar de su archivo, observa los siguientes datos:
Edad (años) 1 2 4 5
Peso (Kg) 9 12 16 18
Utilizar interpolación polinómica de Lagrange para obtener una aproximación numérica del peso del niño a
los 3 años de edad.
E.2.7. Una persona se somete a una dieta de adelgazamiento durante 5 semanas. A continuación se detalla su
peso al término de cada una de esas semanas:
Al cabo de...(semanas) 1 2 3 4 5
Peso en Kg. 880 5 87 84 820 5 79
Calcular la ecuación de un polinomio de grado 4 que relacione las dos variables. Usando dicho polinomio
¿qué peso esperarı́amos que alcance esta persona si sigue la dieta dos semanas más?
E.2.8. Representar gráficamente la función f : R → R definida como sigue:
(x − 1)(x − 2)(x − 3)
f (x) = .
(x − 4)(x − 5)(x − 6)
Calcular sólo los elementos que sean indispensables para realizar una representación gráfica correcta.
E.2.9. Utilizar cualquier método numérico, de entre los que han sido explicados en las clases de teorı́a, para
calcular una raı́z de la ecuación
x3 + 2x − 1 = 0
con una cota de error de 00 001.
60 MATEM ÁTICAS
ANOTACIONES
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
CAPÍTULO 3
CÁLCULO INTEGRAL
• Concepto de área • Integración de funciones trigonométricas

• Sumas de Riemann • Integrales irracionales
• Integral definida • Area de la región entre dos curvas
• Propiedades de la integral definida • Volumen de un sólido de revolución
• Integral indefinida • Longitud de arco de una curva
• Propiedades de la integral indefinida • Area de una superficie de revolución
• Teorema Fundamental del Cálculo Integral • Integral impropia
• Integración por cambio de variable • Regla del punto medio
• Integración por partes • Regla del trapecio
• Integración de funciones racionales • Regla de Simpson
2.1. El problema del área
En esta sección partimos de la base que el concepto de área es bien conocido. Esto no significa que el alumno
deba tener una idea precisa y formal de dicho concepto, si no más bien que todos poseemos una idea intuitiva que
no necesita aclaración.
El tipo de región más simple con el que nos podemos encontrar es un rectángulo, cuya área se define como
el producto de su base por su altura. A partir de esta definición podemos obtener las fórmulas para el área de
regiones más complicadas: triángulos, paralelogramos, polı́gonos regulares, etc. El gran problema se plantea
cuando se intenta calcular el área de regiones más generales que las poligonales.
Los primeros matemáticos que intentaron resolver el problema de una forma seria fueron los griegos, utilizando el
método de “exhaución”. Este método, atribuido a Arquı́medes, consiste en encajar la región entre dos polı́gonos,
uno inscrito y otro circunscrito. Si la diferencia entre las áreas de los dos polı́gonos es pequeña, entonces podemos
aproximar el área de la región por cualquier número comprendido entre el área del polı́gono inscrito y el área del
polı́gono circunscrito.
El método que emplearemos aquı́ es parecido. Se trata de aproximar la región por una unión de rectángulos de tal
62 MATEM ÁTICAS
forma que el área de la región se aproxime por la suma de las áreas de los rectángulos.
2.2. La integral definida
2.2.1. El sumatorio
Como hemos indicado anteriormente, el área de una región se va a obtener como una suma (posiblemente infinita)
de áreas de rectángulos. Para facilitar la escritura y comprensión de tal proceso, vamos a introducir una notación.
La suma de n términos a1 , a2 , . . . , an se denota por

X
n
ai = a1 + a2 + · · · + an ,
i=1
donde i se llama ı́ndice de la suma, ai el i-ésimo término de la suma y los lı́mites inferior y superior de la
suma son 1 y n, respectivamente. Estos lı́mites deben ser constantes con respecto al ı́ndice de la suma y la única
restricción es que el lı́mite superior debe ser cualquier entero superior (o igual) al lı́mite inferior.
El sumatorio posee las siguientes propiedades:
X
n X
n
(1) kai = k ai , donde k es una constante que no depende del ı́ndice de la suma.
i=1 i=1
X
n X
n X
n
(2) [ai ± bi ] = ai ± bi
i=1 i=1 i=1
Por ejemplo, algunas fórmulas de suma importantes son las siguientes:
X
n
(1) c = cn.
i=1
X
n
n(n + 1)
(2) i= .
i=1
2
X
n
n(n + 1)(2n + 1)
(3) i2 = .
i=1
6
X
n
n2 (n + 1)2
(4) i3 = .
i=1
4
2.2.2. Sumas de Riemann
Consideremos una función f definida en el intervalo cerrado [a, b]. Una partición P de dicho intervalo es un
conjunto de números {x0 , x1 , x2 , . . . , xn } tales que
a = x0 < x1 < x2 < · · · < xn−1 < xn = b.
C ÁLCULO INTEGRAL 63
Si ∆xi es la anchura del i-ésimo subintervalo [xi−1 , xi ], es decir, ∆xi = xi − xi−1 , entonces se define la norma
de P, y se denota por ||P ||, como la longitud del subintervalo más grande. En otras palabras,
||P || = max {∆xi } = max{∆x1 , ∆x2 , . . . , ∆xn }.

16i6n
Si ci es cualquier punto del subintervalo i-ésimo, entonces la suma
X
n
f (ci )∆xi , xi−1 6 ci 6 xi ,
i=1
se llama suma de Riemann de la función f asociada a la partición P . Entre todos los posibles valores de ci ,
podemos destacar los siguientes:
(1) ci = mi para todo i, donde f (mi ) es el valor mı́nimo de f en el i-ésimo subintervalo. Entonces la suma de
Riemann
X
n
s(f, P ) = f (mi )∆xi
i=1
se denomina suma inferior de f asociada a P (ver Figura 3.1).
y y = f (x)
6
-
x
0 a b
Figura 3.1: Suma inferior de Riemann.
(2) ci = Mi para todo i, donde f (Mi ) es el valor máximo de f en el i-ésimo subintervalo. Entonces la suma
de Riemann
Xn
S(f, P ) = f (Mi )∆xi
i=1
se denomina suma superior de f asociada a P (ver Figura 3.2).
X
n
Es fácil comprobar que s(f, P ) 6 f (ci )∆xi 6 S(f, P ) para cualquier partición P del intervalo [a, b].
i=1
Una función f definida en [a, b] se dice integrable en [a, b] si existe el lı́mite de las sumas de Riemann de f
(cuando la norma de P tiende a 0) y denotamos este lı́mite mediante
X
n Z b
lim f (ci )∆xi = f (x)dx.
||P ||→0 a
i=1
64 MATEM ÁTICAS
y = f (x)
y 6
-
x
0 a b
Figura 3.2: Suma superior de Riemann.
Dicho valor se denomina integral definida de f entre a y b. a y b son los lı́mites inferior y superior de integración,
respectivamente.
No todas las funciones son integrables. Sin embargo, el siguiente resultado nos garantiza que la familia de funcio-
nes integrables en un intervalo es muy grande: “Toda función continua en un intervalo cerrado [a, b] es integrable
en dicho intervalo ”.
La relación entre el área de una región y el concepto de integral definida queda reflejada en el siguiente resultado:
Si f es continua y no negativa en un intervalo cerrado [a, b], entonces el área de la región limitada por f , el eje x
y las lı́neas verticales x = a y x = b viene dada por
Z b
área = f (x)dx.
a
2.2.3. Propiedades de la integral definida
La integral definida de una función f satisface las siguientes propiedades:
Z a
(1) f (x)dx = 0.
a
Z a Z b
(2) f (x)dx = − f (x)dx.
b a
Z b
(3) cdx = c(b − a).
a
Z b Z b Z b
(4) [f (x) ± g(x)]dx = f (x)dx ± g(x)dx.
a a a
Z b Z b
(5) cf (x)dx = c f (x)dx.
a a
Z b Z c Z b
(6) f (x)dx = f (x)dx + f (x)dx.
a a c
(7) Si f es no negativa en el intervalo cerrado [a, b] entonces

Z b
f (x)dx > 0.
a
(8) Si f y g son integrables en [a, b] satisfaciendo que f (x) 6 g(x) para todo valor de x en [a, b], entonces
Z b Z b
f (x)dx 6 g(x)dx.
a a
(9) Si m 6 f (x) 6 M para todo valor de x en [a, b] entonces

Z b
m(b − a) 6 f (x)dx 6 M (b − a).
a
Z Z
b b

(10) f (x)dx 6 |f (x)|dx.
a a
2.3. La integral indefinida
El problema de la integración puede interpretarse como el problema dual de la derivación, y tal relación queda
claramente de manifiesto en el Teorema Fundamental del Cálculo. Antes de llegar a este teorema importantı́simo,
necesitamos introducir el concepto de primitiva (o antiderivada).
Sean f y F dos funciones. Se dice que F es una primitiva (o antiderivada) de la función f si F 0 (x) = f (x)
para todo valor posible de x.
El siguiente resultado es de una importancia crucial, ya que nos garantiza que cualquier primitiva de una función
puede ser obtenida mediante la adición de una constante a una primitiva conocida. Esta será la base del segundo
teorema del cálculo integral o Regla de Barrow.
Si F es una primitiva de f en un intervalo I , entonces G es también una primitiva de F en el intervalo I si y sólo

si
G(x) = F (x) + C
para todo valor de x, siendo C una constante.
Como una notación, cualquier primitiva de la función f se indicará por

Z
f (x)dx,
y se denominará, genéricamente, integral indefinida de f .
Como consecuencia de lo anterior y de las propiedades de la derivación de funciones, se tienen las siguientes
propiedades:
Z
(1) 0dx = C.
Z
(2) kdx = kx + C.
66 MATEM ÁTICAS
Z Z
(3) kf (x) = k f (x)dx.
Z Z Z
(4) [f (x) ± g(x)]dx = f (x)dx ± g(x)dx.
Z
xn+1
(5) xn dx = + C.
n+1
2.3.1. Primer Teorema Fundamental del Cálculo Integral
Si f es una función continua en [a, b], entonces la función F definida por

Z x
F (x) = f (t)dt
a
es continua en [a, b], diferenciable en (a, b) y satisface que F 0 (x) = f (x).
2.3.2. Segundo Teorema Fundamental del Cálculo Integral
Si f es una función continua en [a, b] entonces

Z b
f (x)dx = F (b) − F (a)
a
donde F es cualquier primitiva de f en el intervalo [a, b].
2.4. Métodos de integración
2.4.1. Integrales de las funciones elementales
Las reglas del cálculo integral descritas anteriormente permiten encontrar la integral indefinida de ciertas funcio-
nes a partir de la integral indefinida de otras funciones más elementales o básicas. Pero en último extremo, la
integral indefinida de estas funciones básicas debe obtenerse a partir de la definición. Para facilitar la búsqueda de
integrales indefinidas, en la Tabla 3.1 listamos algunas de las más elementales; la lista no es demasiado exhaustiva
y siempre se puede recurrir a cualquiera de los libros recomendados para obtener una tabla más completa.
2.4.2. Integración por cambio de variable
El método de integración por sustitución o cambio de variable se apoya en el siguiente resultado teórico.
Z Z
xn+1
kdx = kx + C xn dx = +C
n+1
Z Z
1
dx = ln |x| + C ex dx = ex + C
x
Z Z
x ax
a dx = +C cos xdx = sen x + C
ln a
Z Z
sen xdx = − cos x + C tan xdx = − ln | cos x| + C
Z Z
cotan xdx = ln | sen x| + C sec xdx = ln | sec x + tan x| + C
Z Z
cosec xdx = − ln | cosec x + cotan x| + C sec2 xdx = tan x + C
Z Z
cosec2 xdx = − cotan x + C sec x tan xdx = sec x + C
Z Z
dx x
cosec x cotan xdx = − cotan x + C √ = arcsen + C
a 2 − x2 a
Z Z
dx 1 x dx 1 |x|
= arctan + C √ = arcsec +C
a 2 + x2 a a x x2 − a 2 a a
Z Z
cosh xdx = senh x + C senh xdx = cosh x + C
Tabla 3.1: Fórmulas básicas de integración.

68 MATEM ÁTICAS
Sean f y g funciones tales que f ◦ g es una función continua en un intervalo I . Si F es una primitiva de f en I ,
entonces Z
f (g(x))g 0 (x)dx = F (g(x)) + C.
Como consecuencia de lo anterior, podemos utilizar la siguiente estrategia:
(1) Escoger una sustitución u = g(x) adecuada.
(2) Hallar du = g 0 (x)dx.
(3) Reescribir la integral en términos de la nueva variable u.
(4) Calcular la integral resultante en términos de u.
(5) Cambiar u por g(x) para obtener la primitiva en términos de x.
2.4.3. Integración por partes
Esta técnica es especialmente útil cuando la función a integrar es un producto de funciones algebraicas o trascen-
dentes, de tal suerte que un factor se deriva fácilmente y otro factor se integra sin mucha dificultad. El método se
sustenta en el siguiente resultado teórico:
Si u y v son funciones de x y tienen derivadas continuas, entonces

Z Z
udv = uv − vdu.
La estrategia que debe utilizarse para utilizar este método es la siguiente:
(1) Tratar de que dv sea la parte más complicada del integrando que se ajusta a una fórmula de integración
básica. Entonces u será el resto del integrando.
(2) Alternativamente, tratar de que u sea la parte del integrando cuya derivada es una función más simple que
u. Entonces dv será el factor restante del integrando.
Algunas de las integrales por partes más comunes se ofrecen a continuación:
Z Z Z
(1) xn eax dx, xn sen axdx, xn cos axdx
Considerar u = xn y dv = eax dx, sen axdx, cos axdx, respectivamente.
Z Z Z
(2) x ln xdx, x arcsen axdx, xn arctan axdx
n n
Considerar u = ln x, arcsen ax, arctan ax y dv = xn dx, respectivamente.

Z Z
(3) eax cos bxdx, eax sen bxdx
Tomar u = cos bx, sen bx y dv = eax dx, respectivamente.
2.4.4. Integración de funciones racionales
La integración de funciones racionales se apoya en la técnica de la descomposición en fracciones simples, cuya

integración es más sencilla. Sea la función racional R(x), donde
P (x) b0 + b1 x + · · · + bn xn
R(x) = = .
Q(x) a 0 + a 1 x + · · · + a m xm
R es una función racional propia si el grado del denominador es mayor que el grado del numerador, es decir m >
n. En caso contrario, la función R se dice que es impropia. Podemos restringirnos, sin pérdida de generalidad, al
caso de funciones racionales propias, ya que de no ser ası́ siempre podemos dividir el polinomio P entre Q para
obtener
S(x)
R(x) = C(x) + ,
Q(x)
donde la función racional S(x)/Q(x) ya es propia.
Para descomponer una función racional propia en fracciones simples debemos seguir los siguientes pasos:
(1) Factorizar el denominador. Hay que descomponer completamente el denominador Q(x) en factores de la
forma
(px + q)k
y
(ax2 + bx + c)k ,
donde ax2 + bx + c es irreducible (tiene raı́ces complejas).
(2) Factores lineales. Por cada factor de la forma (px+q)k , la descomposición en factores simples debe incluir
la siguiente suma de k fracciones simples:
A1 A2 Ak
+ + ··· + .
(px + q) (px + q)2 (px + q)k
(3) Factores cuadráticos. Por cada factor de la forma (ax2 + bx + c)k , la descomposición en factores simples
debe incluir la siguiente suma de k fracciones:
B1 x + C 1 B2 x + C2 Bk x + Ck
+ + ··· + .
(ax2 + bx + c) (ax2 + bx + c)2 (ax2 + bx + c)k
Cuando el denominador tiene factores de multiplicidad mayor que uno, entonces la obtención de la integral indefi-
nida puede ser muy laboriosa. En estos casos es recomendable utilizar el siguiente método, que también es válido
en cualquier otra situación.
2.4.4.1. Método de Hermite-Ostrogradski
Consideremos la función racional R = P/Q, entonces

Z Z
P (x) X(x) Y (x)
dx = + dx,
Q(x) Q1 (x) Q2 (x)
donde Q1 (x) es el máximo común divisor de Q(x) y de su derivada Q0 (x), Q2 (x) es el cociente Q(x)/Q1 (x),
y los polinomios X(x) e Y (x) son polinomios con coeficientes indeterminados cuyos grados son inferiores en
una unidad a los grados de Q1 (x) y Q2 (x), respectivamente. Los polinomios X e Y se calculan derivando en la
igualdad anterior, de forma que se tiene
P (x) X 0 (x)Q1 (x) − Q01 (x)X(x) Y (x)
= + .
Q(x) Q1 (x)2 Q2 (x)
70 MATEM ÁTICAS
2.4.5. Integración de funciones trigonométricas
2.4.5.1. Integrales de senos y cosenos
En este apartado vamos a resolver las integrales de la forma

Z
senm x cosn xdx,
siendo m o n un entero positivo. Se deben seguir las siguientes reglas:
(1) Si n = 2k + 1 es impar, n > 1, entonces se utilizan las igualdades siguientes:
cosn x = cosn−1 x cos x

cos2 x = 1 − sen2 x
y la integral queda
Z Z Z
sen x cos xdx = sen x(1 − sen x) cos xdx = tm (1 − t2 )k dt
m n m 2 k
donde la última igualdad se obtiene tras realizar el cambio de variable t = sen x.

(2) Si m = 2k + 1 es impar, m > 1, entonces se utilizan las igualdades siguientes:
senm x = senm−1 x sen x

sen2 x = 1 − cos2 x
y la integral queda
Z Z Z
senm x cosn xdx = (1 − cos2 x)k cosn x sen xdx = − tn (1 − t2 )k dt
donde la última igualdad se obtiene tras realizar el cambio de variable t = cos x.

(3) Si m y n son pares y no negativos entonces se utilizan las siguientes fórmulas de reducción:
1
sen x cos x = sen 2x
2
1
sen2 x = (1 − cos 2x)
2
1
cos2 x = (1 + cos 2x)
2
2.4.5.2. Integrales de secantes y tangentes
En este apartado vamos a resolver las integrales de la forma

Z
secm x tann xdx,
siendo m o n un entero positivo. Se deben seguir las siguientes reglas:

(1) Si m = 2k es positivo y par, entonces utilizamos la igualdad

sec2 x = 1 + tan2 x
y la integral queda:
Z Z
m n
sec x tan xdx = (sec2 x)k−1 tann x sec2 xdx
Z
= (1 + tan2 x)k−1 tann x sec2 xdx
Z
= (1 + u2 )k−1 un du
donde la ultima igualdad se obtiene mediante el cambio de variable u = tan x.

(2) Si n = 2k + 1 es positivo e impar, entonces utilizamos la igualdad
tan2 x = sec2 x − 1
y la integral queda:
Z Z
secm x tann xdx = secm−1 x(tan2 x)k sec x tan xdx
Z
= secm−1 x(sec2 x − 1)k sec x tan xdx
Z
= um−1 (u2 − 1)k du
donde la ultima igualdad se obtiene mediante el cambio de variable u = sec x.

(3) Si m y n son impares, se transforma un factor tan2 x en sec2 x − 1 y se aplican los casos anteriores. Si es
necesario, se vuelve a aplicar esta transformación.
(4) Si n = 0 y m es impar y positivo, entonces se utiliza integración por partes:
u = secm−2 x
dv = sec2 xdx
(5) Si n = 0 y m es par y positivo, se utiliza el cambio de variable t = tan x y la integral queda

Z Z Z Z
m−2 m−2 m−2
secm xdx = (sec2 x) 2 sec2 x = (1 + tan2 x) 2 sec2 xdx = (1 + t2 ) 2 dt
(6) Si no se puede aplicar ninguna de las reglas anteriores, debemos intentar convertir la integral a senos y
cosenos.
2.4.5.3. Cambios de variable trigonométricos
Las sustituciones trigonométricas se emplean en integrales donde aparacen los siguientes radicales:
p p p
a 2 − x2 , a 2 + x2 , x2 − a 2 .
Los cambios que deben hacerse son los siguientes:
√ √
(1) Para integrales que contienen a2 − x2 , hacer x = a sen t. Entonces
a2 − x2 = a cos t.
√ √
(2) Para integrales que contienen a2 + x2 , hacer x = a tan t. Entonces a2 + x2 = a sec t.
√ √
(3) Para integrales que contienen x2 − a2 , hacer x = a sec t. Entonces a2 − x2 = ±a tan t. El signo + o
− depende de si x > a o x < −a, respectivamente.
72 MATEM ÁTICAS
2.4.5.4. Funciones racionales de senos y cosenos
Para las integrales de funciones racionales en senos y cosenos existen varios cambios de variable especiales. Se
trata de calcular la integral Z
R(sen x, cos x)dx,
donde R es una función racional. Los cambios apropiados son los siguientes:
(1) Si R es impar en sen x, es decir, R(− sen x, cos x) = −R(sen x, cos x), entonces debemos hacer t = cos x.
(2) Si R es impar en cos x, es decir, R(sen x, − cos x) = −R(sen x, cos x), entonces debemos hacer t = sen x.
(3) Si R(− sen x, − cos x) = R(sen x, cos x), entonces debemos hacer t = tan x.
(4) Si no se puede aplicar ninguno de los casos anteriores, entonces hacemos el cambio universal t = tan(x/2),
de modo que
2t
sen x = ,
1 + t2
1 − t2
cos x = ,
1 + t2
2dt
dx = .
1 + t2
2.4.6. Integrales irracionales
No siempre es posible expresar la integral de una función irracional mediante funciones elementales. En esta
sección veremos algunos tipos de funciones irracionales que sı́ permiten expresar su integral indefinida por medio
de funciones elementales.
Z
2.4.6.1. Integrales del tipo R(x, xp1 /q1 , . . . , xpk /qk )dx
Se efectúa la sustitución
x = tm ,
siendo m el mı́nimo común múltiplo de {q1 , q2 , . . . , qk }.
Z p1 /q1 pk /qk

ax + b ax + b
2.4.6.2. Integrales del tipo R(x, ,..., )dx
cx + d cx + d
Se efectúa la sustitución
ax + b
= tm ,
cx + d
siendo m el mı́nimo común múltiplo de {q1 , q2 , . . . , qk }.
Z p
2.4.6.3. Integrales del tipo R(x, ax2 + bx + c)dx
Se efectúan las siguientes sustituciones:
(1) Si a > 0 entonces hacemos p √

ax2 + bx + c = ± ax + t,
con lo que
t2 − c
x= √ .
b − 2 at
(2) Si ax2 + bx + c = a(x − α)(x − β), siendo α y β las raı́ces reales, entonces hacemos
p
ax2 + bx + c = (x − α)t,
de modo que
aβ − αt2
x= .
a − t2
Z
2.4.6.4. Integrales del tipo xm (a + bxn )p dx
Estas integrales se conocen con el nombre de integrales binomias, y los exponentes m, n y p deben ser números
racionales. En primer lugar se realiza el cambio de variable t = xn y la integral se transforma en la siguiente
Z Z
1
xm (a + bxn )p dx = tq (a + bt)p dt,
n
m+1
donde q = − 1. La integral anterior se puede calcular explı́citamente en los siguientes casos:
n
(1) Si p es entero entonces se desarrolla el binomio (a + bt)p o (a + bt)−p , según sea p positivo o negativo, y
se obtiene una integral irracional del tipo R(x, xp1 /q1 , . . . , xpk /qk ).
(2) Si p no es entero pero q sı́ lo es, entonces la integral se transforma en una irracional del tipo R(t, (a+bt)r/s ).
(3) Si p no es entero pero p + q sı́, entonces la integral se transforma en una integral irracional del tipo
r/s !
a + bt
R t, .
t
2.5. Aplicaciones del cálculo integral
2.5.1. Area de la región entre dos curvas
Ya hemos visto que el área que hay bajo una curva se puede calcular utilizando la integral definida. Con muy
escasas modificaciones podemos calcular el área que hay entre dos curvas. Consideremos dos funciones f y g
74 MATEM ÁTICAS
definidas en un intervalo [a, b] tales que f (x) > g(x) para todo valor x de [a, b]. Entonces el área de la región
limitada por las gráficas de f y g y las lı́neas rectas x = a y x = b viene dada por
Z b
A= [f (x) − g(x)]dx.
a
Figura 3.3: Area de la región comprendida entre dos gráficas.
En general, puede ocurrir que no siempre se verifique f (x) > g(x) ni lo contrario. Entonces debemos dividir el
intervalo [a, b] en subintervalos donde sı́ ocurra, aplicar la fórmula anterior en cada subintervalo y posteriormente
sumar los resultados. En otras palabras:
El área de la región limitada por las gráficas de dos funciones f y g , y las lı́neas rectas x = a y x = b viene dada
por
Z b
A= |f (x) − g(x)|dx.
a
2.5.2. Cálculo de volúmenes de los sólidos de revolución
En esta sección vamos a calcular el volumen de un sólido tridimensional que aparece frecuentemente en ingenierı́a
y en procesos de producción. Nos estamos refiriendo a los sólidos de revolución, los cuales se obtienen al hacer
girar una región plana alrededor de una recta contenida en el mismo plano y que no corta a la región. Ejemplos de
sólidos de revolución son el cilindro circular recto, la esfera y el toro.
2.5.2.1. Método de discos
Para calcular el volumen de un sólido de revolución por el método de discos, debemos utilizar las siguientes
fórmulas:
(1) Si el eje de revolución es horizontal:

Z b
V =π [R(x)]2 dx.
a
En este caso estamos suponiendo que la región plana que gira es la región limitada por la gráfica de R(x),
el eje x, y las lı́neas rectas x = a y x = b. Como eje de revolución se considera el eje x.
Figura 3.4: Método de discos para el cálculo de volúmenes.
(2) Si el eje de revolución es vertical:

Z d
V =π [R(y)]2 dy.
c
En este caso estamos suponiendo que la región plana que gira es la región limitada por la gráfica de R(y),
el eje y, y las lı́neas rectas y = c y y = d. Como eje de revolución se considera el eje y.
2.5.2.2. Método de arandelas
Se utiliza este método cuando se trata de calcular el volumen de un sólido de revolución con un agujero. Este
tipo de sólidos aparecen cuando la región plana que gira y el eje de revolución no están juntos. Supongamos que
la región plana es la región determinada por las gráficas de las funciones R(x) y r(x) (con R(x) > r(x)), y las
lı́neas rectas x = a y x = b. Si se gira esta región alrededor del eje x entonces el volumen del sólido resultante es
Z b
V =π [R(x)2 − r(x)2 ]dx.
a
Si la región plana es la región determinada por las gráficas de las funciones R(y) y r(y) (con R(y) > r(y)), y las
Figura 3.5: Método de arandelas para el cálculo de volúmenes.

76 MATEM ÁTICAS
lı́neas rectas y = c y y = d. y se gira esta región alrededor del eje y entonces el volumen del sólido resultante es
Z d
V =π [R(y)2 − r(y)2 ]dy.
c
2.5.2.3. Método de capas
Consideremos la región plana determinada por la gráfica de una función f (x), y las rectas x = a, x = b e y = c.
El volumen del sólido de revolución obtenido al girar dicha región alrededor de un eje vertical x = x0 viene dado
por
Z b
V = 2π p(x)h(x)dx,
a
donde p(x) es la distancia de x al eje de revolución y h(x) es la distancia entre c y f (x). Usualmente, el eje de
revolución es el eje y y la región está junto al eje x, por lo que p(x) = x y h(x) = f (x).
Figura 3.6: Método de capas para el cálculo de volúmenes.
Si consideramos la región plana determinada por la gráfica de una función f (y), y las rectas y = c, y = d y x = a,
el volumen del sólido de revolución obtenido al girar dicha región alrededor de un eje horizontal y = y0 viene
dado por
Z d
V = 2π p(y)h(y)dy,
c
donde p(y) es la distancia de y al eje de revolución y h(y) es la distancia entre a y f (y). Cuando el eje de
revolución es el eje x y la región está junto al eje y, entonces p(y) = y y h(y) = f (y).
2.5.3. Cálculo de volúmenes
Analicemos ahora un sólido S cualquiera. Vamos a suponer que existe una recta, que consideraremos el eje x,
y dos planos paralelos entre sı́ y perpendiculares al eje, tales que el sólido se encuentra entre ambos planos (de
ecuaciones x = a y x = b). Cada plano x = x0 , a 6 x0 6 b, paralelo a los anteriores y perpendicular al eje
intersecciona a S según una región (denominada sección transversal) cuya área se denota por A(x0 ). Haciendo
esto para cada valor x0 en el intervalo [a, b] podemos construir una función A(x), definida en [a, b], que mide el
área de las secciones transversales. Entonces el volumen de S viene dado por
Z b
V = A(x)dx.
a
Casos particulares de esta fórmula han sido obtenidos en la sección anterior dedicada a los sólidos de revolución.
2.5.4. Longitudes de curvas
Un segmento de curva se dice rectificable si tiene una longitud de arco finita. El problema de determinar la lon-
gitud de una curva es muy antiguo (algunas contribuciones ya fueron realizadas por los matemáticos C. Huygens
(1629–1695) y J. Gregory (1638–1675)) y no por ello es sencillo. Una condición suficiente para que la gráfica de
una función f sea rectificable entre los puntos (a, f (a)) y (b, f (b)) es que la derivada f 0 sea una función continua
en [a, b]. Se dice entonces que la función f es continuamente derivable o de clase C 1 .
El fundamento teórico que nos permite obtener una fórmula para la longitud de arco es el siguiente. Consideremos
dos puntos xi−1 y xi en el intervalo [a, b]. Entonces por el teorema del valor medio se tiene
f (xi ) − f (xi−1 ) = f 0 (ci )(xi − xi−1 ), ci ∈ (xi−1 , xi ).
Si aproximamos la longitud de arco de la curva por la longitud de una poligonal que se apoya en los puntos
{(xi , f (xi ))} entonces al tomar lı́mites se obtiene
X
n p
Lba (f ) = lim (∆xi )2 + (∆yi )2
n→∞
i=1
s 2
X
n
∆yi
= lim 1+ ∆xi
n→∞
i=1
∆xi
Xn p
= lim 1 + f 0 (ci )2 ∆xi
n→∞
i=1
Z b p
= 1 + f 0 (x)2 dx
a
donde ∆xi = xi − xi−1 y ∆yi = f (xi ) − f (xi−1 ).
En consecuencia, obtenemos las siguientes fórmulas:
(1) Si la función y = f (x) representa una curva suave en el intervalo [a, b], la longitud de arco de f entre a y b
viene dada por
Z bp
Lba (f ) = 1 + f 0 (x)2 dx.
a
(2) Si la función x = g(y) representa una curva suave en el intervalo [c, d], entonces la longitud de arco de g
entre c y d es
Z dp
Ldc (g) = 1 + g 0 (y)2 dy.
c
2.5.5. Areas de superficies de revolución
Si se gira la gráfica de una función continua alrededor de una recta, la superficie resultante se denomina superficie
de revolución. Para calcular el área de una superficie de revolución se parte de la fórmula del área de un tronco
de cono circular recto y se aplica a los conos obtenidos al rectificar la curva por medio de una poligonal que se
apoya en los puntos {(xi , f (xi ))}. El resultado obtenido es el siguiente.
78 MATEM ÁTICAS
Si y = f (x) tiene derivada continua en el intervalo [a, b], entonces el área de la superficie de revolución S formada
al girar la gráfica de f alrededor de un eje horizontal o vertical es
Z b p
S = 2π r(x) 1 + f 0 (x)2 dx,
a
donde r(x) es la distancia entre la gráfica de f y el eje de revolución correspondiente.
2.6. Integrales impropias
La definición de integral definida que hemos presentado requiere que el intervalo [a, b] de integración sea finito y
que la función f a integrar sea continua. Sin embargo, existen funciones que no cumplen estos requisitos (bien
porque el intervalo no es finito o bien porque la función f presenta alguna discontinuidad) y que, sin embargo,
pueden ser integradas, en un sentido que precisaremos a continuación.
2.6.1. Intervalos infinitos
Cuando el intervalo de integración es infinito, se pueden presentar las siguientes posibilidades:
y 6
y = f (x)
-
0 a x
Figura 3.7: Integrales impropias de primera clase.
(1) Si f es continua en [a, ∞), entonces

Z ∞ Z b
f (x)dx = lim f (x)dx.
a b→∞ a
(2) Si f es continua en (−∞, b], entonces

Z b Z b
f (x)dx = lim f (x)dx.
−∞ a→−∞ a
(3) Si f es continua en (−∞, ∞) = R, entonces

Z ∞ Z c Z ∞
f (x)dx = f (x)dx + f (x)dx.
−∞ −∞ c
para cualquier número real c.

Si los lı́mites existen, la integral correspondiente se dice que converge o que es convergente; en caso contrario,
diremos que la integral diverge o que es divergente.
2.6.2. Integrandos discontinuos
En este apartado analizamos la integrales impropias que aparecen cuando existe alguna discontinuidad infinita en
los lı́mites de integración o en el interior del intervalo. Se pueden presentar las siguientes posibilidades:
y 6
y = f (x)
-
0 a c b x
Figura 3.8: Integrales impropias de segunda clase.
(1) Si f es continua en [a, b) y presenta una discontinuidad infinita en b, entonces

Z b Z c
f (x)dx = lim− f (x)dx.
a c→b a
(2) Si f es continua en (a, b] y presenta una discontinuidad infinita en a, entonces

Z b Z b
f (x)dx = lim+ f (x)dx.
a c→a c
(3) Si f es continua en [a, b] excepto en un punto c ∈ (a, b) donde presenta una discontinuidad infinita, entonces
Z b Z c Z b
f (x)dx = f (x)dx + f (x)dx.
a a c
Si los lı́mites existen, la integral correspondiente se dice que converge o que es convergente; en caso contrario,
diremos que la integral diverge o que es divergente.
2.7. Integración numérica
Hay ocasiones en las que es imposible determinar explı́citamente la integral indefinida de una función, por lo
que no podemos calcular el área que hay bajo la gráfica de la función utilizando la Regla de Barrow. En estos
casos, sólo nos queda recurrir al cálculo numérico de dichas integrales, utilizando una técnica de aproximación.
A continuación describimos algunos de los métodos más sencillos.
80 MATEM ÁTICAS
2.7.1. Regla de las sumas inferiores y superiores
Rb
Sea f una función continua en [a, b]. La regla de las sumas inferiores para aproximar a
f (x)dx viene dada por
Z
b−a X
n
b
b−a
f (x)dx ≈ f (mi ) = [f (m1 ) + f (m2 ) + · · · + f (mn )],
a n i=1 n
donde f (mi ) es el valor mı́nimo de f en el i-ésimo subintervalo [xi−1 , xi ].

Rb
Análogamente, la regla de las sumas superiores para aproximar a
Z
b−aX
n
b
b−a
f (x)dx ≈ f (Mi ) = [f (M1 ) + f (M2 ) + · · · + f (Mn )],
a n i=1 n
donde f (Mi ) es el valor máximo de f en el i-ésimo subintervalo [xi−1 , xi ].
2.7.2. Regla de los extremos izquierdos y derechos
Rb
Sea f una función continua en [a, b]. La regla de los extremos izquierdos para aproximar a f (x)dx viene dada
por
Z b
b−a X
n
b−a
f (x)dx ≈ f (xi−1 ) = [f (x0 ) + f (x1 ) + · · · + f (xn−1 )].
a n i=1 n
Rb
Análogamente, la regla de los extremos derechos para aproximar a
Z
b−a X
n
b
b−a
f (x)dx ≈ f (xi ) = [f (x1 ) + f (x2 ) + · · · + f (xn )].
a n i=1 n
2.7.3. Regla del punto medio
Rb
Sea f una función continua en [a, b]. La regla del punto medio para aproximar a
Z
b−a X
n
b
b−a
f (x)dx ≈ f (x̄i ) = [f (x̄1 ) + f (x̄2 ) + · · · + f (x̄n )],
a n i=1 n
donde x̄i es el punto medio del i-ésimo subintervalo [xi−1 , xi ], es decir, x̄i = 12 (xi−1 + xi ).
2.7.4. Regla del trapecio
Rb
Sea f una función continua en [a, b]. La regla del trapecio para aproximar a
Z
b − a X f (xi−1 ) + f (xi )
n
b
b−a
f (x)dx ≈ = [f (a) + 2f (x1 ) + · · · + 2f (xn−1 ) + f (b)].
a n i=1 2 2n
y y = f (x)
6
-
x
0 a b
Figura 3.9: Regla del punto medio para la integración numérica.
y y = f (x)
6
-
x
0 a b
Figura 3.10: Regla del trapecio para la integración numérica.
2.7.5. Regla de Simpson
La regla de los trapecios se obtiene de aproximar la curva por una poligonal, con lo que la región bajo la curva
se aproxima por una unión de trapecios. En consecuencia, el área de dicha región se aproxima por la suma de las
áreas de los trapecios. Otra posibilidad puede ser agrupar los puntos de la partición de tres en tres y aproximar la
función por segmentos parabólicos (en lugar de rectilı́neos). Entonces la integral de la función se puede aproximar
por la integral de los segmentos parabólicos.
Rb
Sea f una función continua en [a, b]. La regla de Simpson para aproximar a
Z b
b−a
f (x)dx ≈ [f (a) + 4f (x1 ) + 2f (x2 ) + 4f (x3 ) + · · · + 2f (xn−2 ) + 4f (xn−1 ) + f (b)],
a 3n
siendo n un número par.

82 MATEM ÁTICAS
y y = f (x)
6
p(x)
a = x0 x1 x
0 b = x2
Figura 3.11: Regla de Simpson para la integración numérica.
2.7.6. Estimación de errores
Cuando se trabaja con aproximaciones es importante conocer con qué precisión estamos calculando el valor de
la integral. Además, es posible que algún método sea sensiblemente mejor que los demás, si bien puede que sea
bajo ciertas hipótesis. A continuación enunciamos los errores que se cometen en las reglas de aproximación más
usuales.
Rb
(1) Si f tiene derivada segunda continua en [a, b], entonces el error EM cometido al aproximar a
f (x)dx por
la regla del punto medio es
M (b − a)3
|EM | 6 ,
24n2
siendo M una cota superior para |f 00 |, es decir, |f 00 (x)| 6 M para todo valor de x.
Rb
(2) Si f tiene derivada segunda continua en [a, b], entonces el error ET cometido al aproximar a
f (x)dx por
la regla del trapecio es
M (b − a)3
|ET | 6 ,
12n2
siendo M una cota superior para |f 00 |, es decir, |f 00 (x)| 6 M para todo valor de x.
Rb
(3) Si f tiene derivada cuarta continua en [a, b], entonces el error ES cometido al aproximar a
f (x)dx por la
regla de Simpson es
M (b − a)5
|ES | 6 ,
180n4
siendo M una cota superior para |f (4) |, es decir, |f (4) (x)| 6 M para todo valor de x.
A.3.1. Hallar la integral indefinida y comprobar el resultado por derivación:

Z Z Z
√ 1 1
3
xdx dx √ dx
x2 x x
Z Z Z
1
x(x2 + 3)dx (x3/2 + 2x + 1)dx dx
(2x)3
Z Z Z
3 1
(x + 2)dx (x2 − 2x + 3)dx 3
dx
Z Z √ Z 2x
√
√ 1 3 4
x+ √ dx x2 dx ( x3 + 1)dx
2 x
Z Z 3 Z 4
x − 3x2 + 3x − 1 x −1
(x2 − 2x + 1)2 dx dx dx
Z Z x2 − 2x + 1 Z √ x−1
2
x(x + 1)
(2x − 1)2 (3x + 1)dx (x2 − 1)(x + 1)dx dx
Z √ Z √ Z x5/3
x4 (x2 − 1)3 dx x5 x−4/3 (x3 − 1)dx 3(4x − 2)2 dx
3 3
Z Z Z
1 1 1
3
dx 4
dx 2
dx
Z x Z x2 Z 4x2
x +x+1 x +1
(2x + x−1/2 )dx √ dx dx
x x2
Z Z Z 2
t +2
(x + 1)(3x − 2)dx (2t2 − 1)2 dt dt
Z Z Z t2
√
(1 − 2y + 3y 3 )dy y 2 ydy (1 + 3t)t2 dt
Z Z p Z
4
2(1 + 2x) dx x 9 − x2 dx x2 (x3 − 1)4 dx
Z p Z Z
3 x2 4x
5x 1 − x2 dx dx √ dx
(1 + x3 )2 16 − x2
Z Z 3 Z
x+1 1 1 1
dx 1+ dt √ dx
(x2 + 2x − 3)2 t t2 2x
Z 2 Z Z
x + 3x + 7 2 √
√ dx t2 t − dt (9 − y) ydy
x t
A.3.4. Calcular las siguientes integrales indefinidas por el método del cambio de variable:
Z Z Z
√ √ x2 − 1
x x + 2dx x2 1 − xdx √ dx
Z Z Z 2x − 1
−x x
√ dx √ dx x(x2 + 1)3 dx
(x + 1) − x + 1 2x + 1
Z Z Z
1 1 √
√ dx √ √ dx (x − 1) 2 − xdx
2x +1 x(1 + x)2
Z Z Z p
√ √ 3
x x − 3dx x 3 x + 1dx x 4 + x2 dx
A.3.5. Calcular las siguientes integrales:

84 MATEM ÁTICAS
Z Z Z
−2x 2 x3 −3x+1
e dx (x − 1)2 dx e1−x dx
Z Z Z
e−x 2 e3/x
dx xeax dx dx
(1 + e−x )2 x2
Z Z Z
−x −x 2
√ ex + e−x
e (1 + e ) dx ex 1 − ex dx √ dx
Z Z Z ex + e−x
5 − ex 2
dx (ex − e−x )2 dx (3 − x)e(x−3) dx
e2x
Z Z Z
1 1 x
dx dx 2+1
dx
Z 2 1
x + Z 3 − 2x Z x
x −4 ln x (1 + ln x)2
dx dx dx
Z 2x Z 2x Z x
x −2 1 x2 + 2x + 3
dx √ dx dx
x+1 x+1 x3 + 3x2 + 9x
Z Z Z √
1 1 x
dx √ dx √ dx
x2/3 (1 + x1/3 ) 1+ x x−3
Z √ Z Z
x x(x − 2)
√ dx dx 3x dx
1−x x (x − 1)3
Z Z Z
x x2 e−x
2 dx x5 dx −x
dx
Z √ Z Z 1+e
1− x 1
√ dx √ dx 4−x dx
1+ x
Z Z 1x+ 2x Z
2 e − e−x (ln x)2
(3 − x)7(x−3) dx dx dx
ex + e−x x
A.3.8. Calcular las siguientes integrales trigonométricas:
Z Z Z
2 3
2 cos xdx 3x sen x dx sec2 3xdx
Z Z Z √
sec2 x
tan2 xdx (cosec x + sen x) cosec xdx √ dx
x
Z Z Z
sen x
sen2 3x cos 3xdx 4 cos2 4x sen 4xdx 2x
dx
Z Z Z cos
sec2 x
√ dx tan xdx sec xdx
tan x

Z Z Z
(2 sen x + 3 cos x)dx (t2 − sen t)dt (1 − cosec t cotan t)dt
Z Z Z
(sec2 θ − sen θ)dθ sen(2x)dx x cos(x2 )dx
Z Z Z
x 2 cosec2 x
sec dx 3 dx cotan2 xdx
Z 2 Z cotan x Z
tan4 x sec2 xdx cotan πxdx cosec 2xdx
Z Z Z
sec2 x sec x tan x
dx dx (sen 2x + cos 2x)2 dx
Z tan x Z sec x − 1 Z
1 − cos θ
dθ ex cos ex dx (cosec 2θ − cotan 2θ)2 dθ
Z θ − sen θ Z Z
cos t
dt e−x tan e−x dx sen 2x cos 2xdx
1 + sen t
A.3.11. Calcular las siguientes integrales de las funciones trigonométricas inversas:
Z Z Z
1 1 1
√ dx dx √ dx
4 − x2 2 + 9x2 2x
e −1
Z Z Z
x+2 3x2 − 2 1
√ dx dx dx
4 − x2 x2 + 4 x2 − 4x − 7
Z Z Z
1 1 x
2
dx dx √ dx
2x − 8x + 10 3x − x2 2
x −1
Z Z Z
1 1 1
dx dx √ dx
1 − 9x2 1 + 4x2 x 4x2 − 1
Z Z Z
x3 1 1
dx p dx √ dt
x2 + 1 1 − (x + 1)2 1 − t4
Z Z Z
arctan x arcsen x x
dx √ dx √ dx
1 + x2 1 − x2 1 − x2
Z Z Z
ex 1 1
√ dx dx √ dx
1 − e2x x2 − 6x + 18 x(1 + x)
Z Z Z
sen x 1 2x
dx dx dx
1 + cos2 x x2 − 2x + 2 x2 + 6x + 13
Z Z Z
1 x+2 2x − 3
√ dx √ dx √ dx
Z −x2 − 4x Z −x2 − 4x Z √4x − x
2
x 1 x−1
dx √ dx dx
x + 2x2 + 2
4 2
−16x + 16x − 3 x
Z √ Z Z
1 1
et − 3dt √ dx dx
(x − 1) x2 − 2x x2 + 6x + 13
A.3.14. Calcular las siguientes integrales de funciones hiperbólicas:
Z Z Z
cosh x
senh(1 − 2x)dx cosh2 (x − 1) senh(x − 1)dx dx
Z Z Z senh x
x2 cosech(1/x) cotanh(1/x)
x cosech2 dx dx senh2 xdx
Z 2 Z x2 Z
1 2 x
√ √ dx √ dx dx
x 1+x 1 − 4x2 x4 + 1
Z Z Z
1 1 1
√ dx dx dx
1 + e2x 1 − 4x − 2x2 25 − x2

86 MATEM ÁTICAS
Z Z Z
4 3/2 1
(3x − 2) dx (−2x + 5) dx v+ dv
(3v − 1)3
Z Z Z
t2 − 3 x2 ex
dt dx dx
Z −t3 + 9t + 1 Z x−1
x
Z 1+e t 2
(1 + e )
t sen2 tdt cos xesen x dx dt
Z Z Z et
2 1
sec 3x tan 3xdx −x
dx dx
e +1 1 − cos x
Z Z Z
2t − 1 3 1
dt dt √ dx
t2 + 4 2 2
Z x x 2− 4
t +1
Z Z
−1 t sec x
p dt √ dt dx
1 − (2t − 1)2 1 − t4 4 + tan2 x
Z Z Z 3
tan(2/t) 1
dt (1 + 2x2 )2 dx x 1+ dx
t2 x
Z Z Z
3 4
(1 + ex )2 dx √ dx dx
6x − x2 4x2 + 4x + 65
Z Z Z
2
xe2x dx xex dx xe−2x dx
Z Z Z
3 x 3
x e dx x ln xdx t ln(t + 1)dt
Z Z Z
(ln x)2 xe2x
(ln x)2 dx dx dx
x (2x + 1)2
Z Z Z
√ x2
(x2 − 1)ex dx x x − 1dx √ dx
2 + 3x
Z Z Z
3 5
cos x sen xdx sen 2x cos 2xdx sen5 x cos2 xdx
Z Z Z
cos2 3xdx sen4 πxdx sen2 x cos2 xdx
Z Z Z
2 2 2
x sen xdx x sen xdx sec 3xdx
Z Z Z
sec4 5xdx sec3 πxdx tan3 (1 − x)dx
Z Z Z
tan5 (x/4)dx sec2 x tan xdx tan2 x sec2 xdx
Z Z Z
sec5 πx tan πxdx sec6 4x tan 4xdx sec3 x tan xdx
Z Z Z
3 3
tan 3x sec 3xdx cotan 2xdx cosec4 θdθ
Z Z Z
cotan2 t
dt sen 3x cos 2xdx sen θ sen 3θdθ
cosec t
Z Z p Z
1 1
dx x x + x2 dx dx
(25 − x2 )3/2 (1 + x2 )2
Z Z p Z
x 1
√ dx 16 − 4x2 dx √ dx
x 2+9 x 2−9
Z Z √ Z
t2 1 − x2 1
dt dx √ dx
(1 − t2 )3/2 x4 2
Z Z p Z x 4x2 + 9
x x
dx e2x 1 + e2x dx √ dx
(x2 + 3)3/2 2x − x2
Z Z Z
1 3 5−x
2
dx 2
dx dx
Z x2 − 5x + 6 Z x 2+ x − 2 Z 2x2
+x−1
x + 12x + 12 4x + 2x − 1 x4
dx dx dx
x3 − 4x x3 + x2 (x − 1)3
Z Z 2 Z
3x x −1 x2
2 − 6x + 9
dx 3
dx 4 2
dx
Z x Z 2+x
x Z x − 2x2 − 8
x x +x+2 x +5
4
dx dx dx
16x − 1 (x2 + 2)2 x − 2x2 + 4x − 8
3
Z Z Z
5x2 + 20x + 6 5x2 + 20x + 6 2x3 − 4x − 8
dx dx dx
x3 + 2x2 + x x3 + 2x2 + x (x2 − x)(x2 + 4)
Z Z Z
8x3 + 13x x2 3x + 4
dx dx dx
(x2 + 2)2 (x + 1)2
1 3
x − 2x − 4
Z Z Z 3
6x2 − 3x + 14 x(2x − 9) x − 6x2 + x − 4
dx dx dx
x3 − 2x2 + 4x − 8 x3 − 6x2 + 12x − 8 1 − x4
A.3.23. Hallar el área comprendida entre la curva y = 6x − x2 y el eje OX.

√
A.3.24. Hacer un esquema de la región acotada superiormente por la curva y = x e inferiormente por la curva
x
y = , y determinar su área.
4
A.3.25. Hallar el área de la región comprendida entre las curvas y = x2 e y = x1/3 para x ∈ [−1, 1].
1 dy 1
A.3.26. Una curva que pasa por el punto (4, ) posee una pendiente variable de =− √ √ .
3 dx 2 x(1 + x)2
a) Hallar la ecuación de la curva.
b) Representar gráficamente la curva.
c) Calcular el área bajo la curva en el intervalo [0, 1].
1 1
A.3.27. Hallar el área de la región comprendida entre las curvas y = ey= 3
x2 − x x −x
a) en el intervalo [2, 3].
b) a la derecha de x = 3.
A.3.28. Calcular el área de la región S comprendida entre la curva de ecuación y = x2 e−x y el eje OX.
A.3.29. Hallar la constante a para que el área encerrada por a(x2 − y 2 ) + x3 = 0 sea igual a 120 unidades
cuadradas.
88 MATEM ÁTICAS
A.3.30. El plano de un triángulo móvil permanece perpendicular a un diámetro fijo de radio a; la base del triángulo
es una cuerda del cı́rculo y su vértice opuesto está en una recta paralela al diámetro fijo y a distancia h del
plano del cı́rculo. Hallar el volumen del sólido engendrado por el movimiento de este triángulo desde un
extremo al otro del diámetro.
A.3.31. La base de un sólido es la región compredida entre la curva y = sen x y las rectas x = 0, x = π/2
e y = 0. Las secciones planas del sólido perpendicular al eje OX son triángulos equiláteros. Hallar el
volumen del sólido.
A.3.32. Un leñador arranca una cuña de un árbol cilı́ndrico de radio a. Su primer corte es paralelo al suelo y llega
hasta el eje del cilindro. El segundo corte forma un ángulo α con el primero y lo intersecta en su diámetro.
Calcular el volumen de la cuña. Indicación: Situar el eje OX de forma que las secciones transversales
perpendiculares a él sean rectángulos.
A.3.33. Calcular el volumen del sólido generado al girar respecto del eje OY la región limitada por las parábolas
y = x2 y 8x = y 2 .
A.3.34. Calcular
√ el volumen del sólido generado al girar el triángulo equilátero de vértices (0, 0), (2a, 0) y
(a, a 3) alrededor del eje OX.
A.3.35. La figura limitada por la hipocicloide x2/3 + y 2/3 = α2/3 y el eje OX gira alrededor de dicho eje. Hallar
el volumen del cuerpo de revolución engendrado.
a x
A.3.36. Dada la curva de ecuación y = ln , a > 0, calcular el volumen engendrado al girar alrededor del eje
x a
OX la región limitada por dicha curva y las rectas x = a y x = a/2.
A.3.37. Sea el volumen de revolución engendrado por f (x) = x(x − a), a > 0, al girar alrededor del eje OX,
entre las rectas x = 0 y x = c, con c > a. Hallar c para que dicho volumen sea igual al volumen del cono
engendrado por el triángulo de vértices (0, 0), (c, 0) y (c, f (c)) al girar alrededor del eje OX.
A.3.38. Hallar el volumen del sólido engendrado al girar alrededor de la recta de ecuación x = 2, la región
limitada por la curva y = x2 , el eje OX y la recta x = 2.
A.3.39. Calcular la longitud del arco de la curva y 2 = x3 ,

a) entre los puntos (0, 0) y (4, 8).
4
b) entre dicha curva y la recta x = .
3
√ √
A.3.40. Calcular la longitud del arco de la curva f (x) = ln x desde el punto x = 3 hasta x = 8.
ex + 1
A.3.41. Calcular la longitud de la curva y = ln entre los valores x1 = a y x2 = b.
ex − 1
A.3.42. Calcular la longitud del arco de la involuta de un cı́rculo

x = a(cos t + t sen t)
y = a(sen t − t cos t)
desde t = 0 hasta t = 2π.
A.3.43. Calcular la longitud de arco de la curva


t6 
x= 

6 


t4 

y =2−
4
entre los puntos de intersección de dicha curva con los ejes coordenados.
A.3.44. Hallar la longitud de la primera espira de la espiral de Arquı́medes ρ = aϕ.

A.3.45. Hallar la longitud de la espiral logarı́tmica ρ = emϕ entre cierto punto (ρo , ϕo ) y un punto móvil (ρ, ϕ).
A.3.46. Calcular el área de la superficie generada por la curva y = ln x desde x = 1 hasta x = 5, al girar
alrededor del eje x = 0.
A.3.47. Hallar el área de la superficie engendrada al girar alrededor del eje OX el contorno cerrado formado por
las curvas x = y 2 e y = x2 .
x3
A.3.48. Calcular el área de la superficie generada al girar alrededor del eje OX la curva y = entre los puntos
3
de abcisas x = −2 y x = 2.
A.3.49. Usar las reglas del trapecio y de Simpson para aproximar las siguientes integrales. Comparar las aproxi-
maciones con los valores reales.
Z 2 Z 0.1
a) ln xdx b) x1/3 dx
1 0
Z π/3 Z 0.4
c) (sen x)2 dx d) e3x cos 2xdx
0 0.2
Z π/4 Z 3π/4
e) tan xdx f) cot xdx
0 π/2
A.3.50. Usar los valores de abajo para encontrar una aproximación a la integral
Z 1.5
ex dx
1.1
usando los métodos siguientes:

a) la regla del trapecio con x0 = 1.1 y x1 = 1.5;
b) la regla de Simpson con x0 = 1.1, x1 = 1.3 y x2 = 1.5.
exp(1.1) = 3.0042 exp(1.3) = 3.6693 exp(1.5) = 4.4817
4.1. Introducción
necesitar.
En esta práctica nos vamos a centrar en el cálculo integral en una variable. Veremos cómo calcular integrales
inmediatas y utilizando los distintos métodos de integración: por cambio de variable, por partes, exponenciales y
logarı́tmicas, trigonométricas, racionales y binomias. Finalizaremos la práctica analizando algunas aplicaciones
del cálculo integral al cálculo de longitudes, áreas y volúmenes.
90 MATEM ÁTICAS
en rapidez.
4.2. Ejemplos de ilustración
DERIVE for Windows calcula sin ayuda la mayorı́a de integrales: polinómicas, trigonométricas y racionales.
Cuando la integral no es sencilla, o bien cuando DERIVE for Windows no sabe qué hacer, podemos ayudarle de
varias formas: transformando el integrando en otro más fácil de integrar o indicándole el método de integración
que debe utilizar. En este último caso, el programa nos proporciona una serie de utilidades que pueden ser
cargadas mediante las opciones File|Load|Math o File|Load|Util. Para escribir los integrandos podemos
utilizar todas las funciones que entiende DERIVE for Windows, las cuales se presentan en la siguiente tabla.
Función Teclear Función Teclear Función Teclear

√
x SQRT(x) ex EXP(x) ln(x) LN(x)
logb (x) LOG(x,b) sen(x) SIN(x) cos(x) COS(x)
tan(x) TAN(x) cotan(x) COT(x) sec(x) SEC(x)
cosec(x) CSC(x) arctan(x) ATAN(x) arccot(x) ACOT(x)
arcsen(x) ASIN(x) arcos(x) ACOS(x) arcsec(x) ASEC(x)
arcosec(x) ACSC(x) senh(x) SINH(x) cosh(x) COSH(x)
tanh(x) TANH(x) cotanh(x) COTH(x) sech(x) SECH(x)
cosech(x) CSCH(x) arcsenh(x) ASINH(x) arcosh(x) ACOSH(x)
arctanh(x) ATANH(x) arccoth(x) ACOTH(x) arcsech(x) ASECH(x)
arcosech(x) ACSCH(x)
R
Calcular (4x2 − 2x + 7)dx
Introducimos la expresión 4x^2-2x+7 y seleccionamos Calculus|Integrate con la opción variable igual a x,

por defecto (ver Figura 3.13). El programa está preparado para calcular integrales indefinidas (por defecto) y
definidas. En el primer caso, el programa admite una constante de integración (por defecto, 0). Para obtener la
solución debemos pulsar la tecla Simplify y resultará:
4 3
x − x2 + 7x
3
Figura 3.13: Ventana del programa que nos permite calcular integrales de funciones.
Z
3x + 5
Calcular dx
x3 − x2 − x + 1
Escribimos la expresión (3x+5)/(x^3-x^2-x+1) y procedemos exactamente igual que en el ejemplo anterior.

El resultado obtenido es
LN(x-1) LN(x+1) 4
− + −
2 2 x-1
Rπ
Calcular 0
cos(x)dx
Seleccionamos Author y tecleamos COS(x). A continuación elegimos Calculus|Integrate con las opciones
x (variable), π (lı́mite superior) y 0 (lı́mite inferior). El resultado obtenido (si estamos trabajando con precisión
exacta) es 0.
Calcula el área bajo la curva y = cosh(x) entre −2 y 2
Siguiendo los pasos anteriores, introducimos la expresión COSH(x) y a continuación seleccionamos en el menú
Calculus|Integrate con las opciones x (variable), 2 (lı́mite superior) y -2 (lı́mite inferior). El resultado
obtenido es e2 − e−2 .
Cuando la integral no es tan sencilla y el programa no consigue integrar la función debemos ayudarle indicándole
cuál de los métodos de integración debe utilizar. En los siguientes ejemplos mostramos algunos casos tı́picos.
Para poder utilizar la integración por sustitución o por partes debemos de cargar la utilidad MISC.MTH, según se
ha explicado anteriormente.
Z
ex + 1
Calcular dx
ex − 4 + 4e−x
Esta integral la podemos calcular siguiendo los mismos pasos que en los ejemplos anteriores. Sin embargo, aquı́
la vamos a calcular mediante un cambio de variable. Consideremos el cambio t = t(x) = ex , entonces la manera
de indicárselo a DERIVE for Windows es mediante la orden INT SUBST. Concretamente deberı́amos teclear
92 MATEM ÁTICAS
INT SUBST((#e^x+1)/(#e^x-4+4#e^(-x)),x,LN(x))
y obtendrı́amos como resultado el valor de
3
+ LN(ex − 2)
2 − ex
En general, si deseamos integrar la función f (x) mediante el cambio de variable x = g(t), debemos escribir
INT SUBST(f(x),x,g(x))
R
Calcular la integral (5x2 − 3)43x+1 dx
El programa DERIVE for Windows puede calcular la integral anterior, cuyo resultado es

10x2 2 10x 5
26x − − 2
+ .
3LN(2) LN(2) 9LN(2) 27LN(2)3
Sin embargo, las integrales de este tipo se suelen resolver por partes, ya que la función que deseamos integrar se
descompone como un producto de dos funciones, una que se deriva fácilmente (5x2 − 3) y otra que se integra
fácilmente (43x+1 ). Por este motivo, vamos a ilustrar como indicarle a DERIVE for Windows que utilice deri-
vación por partes. Una vez cargado el fichero MISC.MTH tecleamos INT PARTS(u(x),v(x),x), donde u(x) y
v(x) son las partes que se derivan e integran fácilmente, respectivamente. En nuestro ejemplo, debemos teclear
INT PARTS(5x^2-3,4^(3x+1),x).
Una de las caracterı́sticas de DERIVE for Windows es su capacidad de calcular integrales que requieren el
cómputo de otras integrales previas. Esto es lo que ocurre, por ejemplo, en la integración por reducción que se
aplica a integrales con exponentes enteros grandes. Durante el proceso se encuentra una parte integrada y una
parte sin integrar en la que aparece la misma integral inicial pero con valores de estos exponentes disminuidos.
En los ejemplos que siguen aplicamos la integral al cálculo de longitudes, áreas y volumenes.
Un cable eléctrico cuelga entre dos torres de la misma altura que están separadas 80 metros. El cable adopta la
posición de una catenaria cuya ecuación es y = 100 cosh(x/100). Calcula la longitud del cable entre las dos
torres.
Cuando tenemos una curva y = f (x), la longitud de la curva entre los puntos (a, f (a)) y (b, f (b)) es la integral
Z b p
1 + f 0 (x)2 dx.
a
En nuestro caso, la derivada es f 0 (x) = sinh(x/100) por lo que la longitud será la integral
Z 40 p
1 + sinh(x/100)2 dx,
−40
cuyo valor es 82.1506. Si cargamos la utilidad INT APPS.MTH entonces DERIVE for Windows pone a nuestra
disposición la función ARC LENGTH, con lo que podrı́amos haber calculado la longitud de la catenaria con sólo
escribir ARC LENGTH(100 COSH(x/100),x,-40,40).
Calcular el área de la región limitada por las curvas f (x) = 2 − x2 y g(x) = x
En primer lugar debemos hallar los puntos de corte, para lo que planteamos la ecuación 2-x^2=x que resolvemos
con ayuda de la opción Solve para obtener x = −2 y x = 1. Entonces el área se calcula con la función siguiente:
AREA(x,-2,1,y,x,2-x^2) cuyo resultado es 4.5. En general, la sintaxis de la función área es
AREA(x,a,b,y,f(x),g(x)),
donde a y b son las abcisas de los puntos de corte y se supone que la función g es mayor o igual que la función f .
Calcular el área de la superficie del paraboloide z = 2 − x2 − y 2 que está sobre la región cuadrada limitada por
−1 6 x 6 1 y −1 6 y 6 1
Para el cálculo de áreas de superficies, DERIVE for Windows dispone de la función SURFACE AREA, cuya sintaxis
es la siguiente:
SURFACE AREA(f(x,y),x,x 1,x 2,y,y 1,y 2),
donde z = f (x, y) es la superficie y el recinto es el rectángulo [x1 , x2 ] × [y1 , y2 ]. En nuestro caso, basta con
escribir SURFACE AREA(2-x^2-y^2,x,-1,1,y,-1,1) para obtener como resultado el valor de 7.44625.
Calcular el volumen de la semiesfera de radio 1
Dada una función z = f (x, y) definida en un recinto (rectangular o no), podemos calcular el volumen que hay
entre el recinto y la superficie z = f (x, y) definida sobre él. Para ello debemos utilizar la función VOLUME, cuya
sintaxis es
VOLUME(x,a 1,a 2,y,b 1(x),b 2(x),z,c 1(x,y),c 2(x,y)),
donde se supone que a1 6 x 6 a2 , b1 (x) 6 y 6 b2 (x), c1 (x, y) 6 z 6 c2 (x, y). Por tanto, el volumen de la
semiesfera es
VOLUME(x,-1,1,y,-SQRT(1-x^2),SQRT(1-x^2),z,0,SQRT(1-x^2-y^2))
cuyo resultado es 2.09439 (en precisión aproximada) o 2π/3 (en precisión exacta).
A continuación se enuncian unos ejercicios sobre cálculo integral de funciones reales de una variable. Si el alumno
encuentra alguna dificultad debe revisar detenidamente los ejemplos anteriores.
94 MATEM ÁTICAS
Z
−12
a) Calcular la integral √ dx.
x2 4 − x2
Z
sec2 t
b) Calcular la integral dx.
tan t(tan t − 1)
Z
x1/4
c) Calcular la integral dx.
1 + x1/2
Z
x4 + 2x2 + x + 1
d) Calcular la integral dx.
(x2 + 1)3
Z
1
e) Calcular la integral √ √ dx.
x(1 − cos x)
Z
x
f) Calcular la integral dx.
1 + e−2
g) Calcular el área de la región comprendida entre las gráficas de f (x) = 3x3 − x2 − 10x y g(x) = −x2 + 2x.
h) Calcular el volumen del sólido generado al girar la región limitada por f (x) = 2 − x2 y g(x) = 1 en torno
a la recta y = 1.
i) Calcular el volumen del sólido generado al girar la región acotada por las gráficas y = x2 + 1, y = 0, x = 0
y x = 1 en torno al eje y.
Hill, Madrid, 1995. Capı́tulos 5, 6 y 9.
J. STEWART Cálculo, 2a ed. Grupo Editorial Iberoamérica, México, 1994. Capı́tulos 4, 5, 7, y secciones 8.2 y
8.3.
E.3.1. Calcular las siguientes integrales indefinidas

Z Z √
ln(x2 + x + 1) 4 − x2
dx dx.
x2 x
E.3.2. Calcular el volumen

p del sólido de revolución generado al girar alrededor del eje OX el recinto limitado por
la curva y = ex sen(3x) entre x = 0 y x = π/3.
E.3.3. Calcular la siguiente integral indefinida

Z √
16 − x2
dx.
x3
E.3.4. Calcular el área del recinto limitado por la curva y = ex senx y por las rectas y = 0, x = 0 y x = π.
E.3.5. Un tanque está situado sobre una colina de 120 metros de altura. Lanza un proyectil que sigue una trayec-
toria dada por
y(x) = −00 05x2 + x + 120,
donde x e y se miden en metros, como muestra la siguiente figura.
y
6
120
0 - x
0
¿Cuál es la distancia recorrida por el proyectil durante su trayecto hasta impactar en el suelo?
E.3.6. Calcular la siguiente integral: Z
3x + 4
dx
x3 − 2x − 4
E.3.7. Un objeto volante sale del origen y asciende por el eje y. Al mismo tiempo un perseguidor parte del punto
(1, 0) y se dirige en todo momento hacia él con velocidad doble que la suya. La ecuación de la trayectoria
del perseguidor es
1
y = (x3/2 − 3x1/2 + 2)
3
¿Cuánta distancia ha recorrido el objeto volante en el instante de ser capturado? ¿Y cuál ha sido la distancia
recorrida por el perseguidor?
E.3.8. Resolver la integral indefinida siguiente:
Z
2x3 − 4x − 8
dx.
x4 − x3 + 4x2 − 4x
E.3.9. Resolver la integral indefinida siguiente:

Z
dx
.
(x3 − 1)2
96 MATEM ÁTICAS
ANOTACIONES
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
CAPÍTULO 4
ECUACIONES DIFERENCIALES ORDINARIAS
• Tipo y orden de una ecuación diferencial • Ecuaciones de primer orden exactas

• Solución de una ecuación diferencial • Ecuaciones lineales de segundo orden
• Ecuaciones de primer orden separables • Método de los coeficientes indeterminados
• Ecuaciones de primer orden homogéneas • Método de variación de parámetros
• Ecuaciones de primer orden lineales • Ecuaciones lineales de orden superior
2.1. Definiciones y conceptos básicos
Una ecuación diferencial es una ecuación en la que interviene una función incógnita y una o varias de sus deri-
vadas. Este tipo de ecuaciones aparece en el estudio de numerosos fenómenos fı́sicos y quı́micos: desintegración
radiactiva, crecimiento de poblaciones, reacciones quı́micas, problemas gravitatorios, etc. No es exagerado afir-
mar que la naturaleza se describe por medio de ecuaciones diferenciales, de modo que un conocimiento de esta
última materia nos ayudará a entender mejor los fenómenos naturales.
Las ecuaciones diferenciales se pueden clasificar, básicamente, atendiendo a dos criterios:
(1) TIPO: Si la función incógnita contiene una única variable independiente, entonces la ecuación se denomina
ecuación diferencial ordinaria, abreviadamente E.D.O. En otro caso, cuando la función incógnita contiene
dos o más variables independientes, la ecuación se dice que es una ecuación diferencial en derivadas
parciales.
(2) ORDEN: Es la derivada de orden más alto que aparece en la ecuación diferencial.
Es innecesario decir que el estudio de las ecuaciones diferenciales en derivadas parciales requiere unas técnicas
matemáticas que están fuera del alcance del alumno, por lo que nos restringiremos al análisis de las ecuaciones
diferenciales ordinarias.
Consideremos una ecuación diferencial ordinaria
F (x, y, y 0 , y 00 , . . .) = 0.
98 MATEM ÁTICAS
Diremos que una función y = f (x) es una solución de la ecuación diferencial si la ecuación se satisface al sustituir
en ella y y sus derivadas por f (x) y sus derivadas respectivas.
La solución general de una ecuación diferencial ordinaria es una función y = f (x, c1 , c2 , . . .) dependiente de
una o varias constantes tal que cualquier solución de la ecuación diferencial se obtiene dando valores especı́ficos
a una o más de las constantes. Cuando damos valores concretos a todas las constantes de la solución general,
surge una solución particular. Geométricamente, la solución general de una ecuación diferencial de primer
orden representa una familia de curvas, denominadas curvas solución, una para cada valor concreto asignado a la
constante arbitraria.
En la práctica, la determinación de las constantes que aparecen en la solución general se realiza a partir de las
condiciones iniciales del problema. Las condiciones iniciales del problema son los valores que adquiere la función
solución o sus derivadas en determinados puntos. Por ejemplo, para una ecuación diferencial de primer orden
y 0 = F (x, y),
una condición inicial se expresarı́a en la forma
y(x0 ) = y0 .
En consecuencia, y = f (x) es solución si f 0 (x) = F (x, f (x)) para todo valor de x en cierto intervalo, y f (x0 ) =
y0 .
2.2. Ecuaciones diferenciales de primer orden
Una ecuación diferencial ordinaria de primer orden es una ecuación de la forma
y 0 = F (x, y),
donde F es una función que depende de las variables x e y. Esta clase de ecuaciones diferenciales son de las
más sencillas, y su resolución se puede realizar utilizando diversas técnicas. Describimos a continuación las más
importantes.
2.2.1. Ecuaciones separables
Una ecuación diferencial de primer orden se dice que es separable si puede escribirse en la forma
dy
M (x) + N (y) = 0,
dx
donde M (x) es una función continua que sólo depende de x y N (y) es una función continua que sólo depende
de y. Para resolver este tipo de ecuaciones se utiliza el procedimiento de separación de variables, que consiste
en situar todos los términos que contienen x a la izquierda (o la derecha) del signo de igualdad, y todos los
términos que contienen y en el lado contrario. A continuación se integran ambos miembros de la igualdad, cada
uno respecto de la variable correspondiente. En consecuencia, la solución viene dada por
Z Z
M (x)dx + N (y)dy = C.
ECUACIONES DIFERENCIALES ORDINARIAS 99
2.2.2. Ecuaciones homogéneas
Una función z = f (x, y) se dice que es homogénea de grado n si
f (tx, ty) = tn f (x, y),
donde n es un número real.
Una ecuación diferencial homogénea es cualquier ecuación diferencial que se puede escribir en la forma
M (x, y)dx + N (x, y)dy = 0,
donde M y N son funciones homogéneas del mismo grado. La ecuación anterior puede escribirse como
y 0 = F (x, y),
donde la función F satisface F (tx, ty) = F (x, y).
Este tipo de ecuaciones diferenciales se convierten en ecuaciones separables tras un cambio de variables. Con-
cretamente si y 0 = F (x, y) es una ecuación homogénea, entonces el cambio de variable y = vx, donde v es una
función derivable de x, transforma la ecuación anterior en una nueva ecuación diferencial en las variables x y v
que es separable.
2.2.3. Ecuaciones lineales
Una ecuación diferencial lineal de primer orden es toda ecuación que se puede escribir en la forma
y 0 + P (x)y = Q(x),
donde P y Q son funciones continuas de x.
La resolución de este tipo de ecuaciones se consigue utilizando la técnica de los factores integrantes. Un factor
integrante es una función u(x) tal que al multiplicarla por el lado izquierdo de la ecuación se obtiene la derivada
del producto u(x)y, es decir,
d[u(x)y]
u(x)y 0 + u(x)P (x)y = .
dx
Es fácil probar que un factor integrante es la función
R
P (x)dx
u(x) = e
Entonces la solución de la ecuación diferencial es

R
Z R
− P (x)dx P (x)dx
y=e Q(x)e dx + C.
Hay ecuaciones no lineales que se transforman, mediante una sustitución adecuada, en una ecuación lineal. Entre
estas ecuaciones debemos destacar la ecuación diferencial de Bernoulli, que puede escribirse como
y 0 + P (x)y = Q(x)y n .
Esta ecuación es lineal si n = 0 y de variables separables si n = 1. Para otros valores de n, el cambio de variable
z = y 1−n transforma la ecuación anterior en la siguiente ecuación lineal:
z 0 + (1 − n)P (x)z = (1 − n)Q(x).

100 MATEM ÁTICAS
2.2.4. Ecuaciones exactas
Esta sección debe estudiarse después del cálculo diferencial en varias variables, ya que se hace uso del concepto
de derivada parcial.
Una ecuación diferencial de la forma
M (x, y)dx + N (x, y)dy = 0
se dice que es una ecuación diferencial exacta si existe una función f de dos variables x e y, con derivadas
parciales continuas, tal que
∂f ∂f
(x, y) = M (x, y) y (x, y) = N (x, y).
∂x ∂y
La solución general de la ecuación es f (x, y) = C.
No toda ecuación diferencial es exacta. Entonces, ¿cómo podemos distinguir las que son de las que no lo son? El
siguiente resultado nos da la solución.
Si M y N tienen derivadas parciales continuas en un disco abierto entonces la ecuación diferencial M (x, y)dx +
N (x, y)dy = 0 es exacta si y solamente si
∂M ∂N
= .
∂y ∂x
Debemos hacer notar que la exactitud es una condición extremadamente frágil, ya que pequeñas alteraciones en
una ecuación exacta pueden hacer que se pierda dicha propiedad. Por ejemplo, la ecuación diferencial
(xy 2 + x)dx + yx2 dy = 0
es exacta, pero si dividimos por x, entonces la ecuación resultante
(y 2 + 1)dx + xydy = 0
ya no es exacta.
2.3. Ecuaciones lineales de segundo orden
Una ecuación diferencial lineal de segundo orden es una ecuación diferencial que puede escribirse en la forma
y 00 + P (x)y 0 + Q(x)y = R(x),
donde P , Q y R son funciones continuas de x en un cierto intervalo. Se dice que la ecuación es homogénea si
R(x) = 0 para todo x. En otro caso, la ecuación se dice que es no homogénea.
La resolución de las ecuaciones diferenciales de segundo orden homogéneas se apoya en dos resultados básicos:
la combinación lineal de dos soluciones es otra solución, y toda solución es combinación lineal de dos soluciones
independientes. Más concretamente, tenemos los siguientes resultados.
(1) Si y1 (x) e y2 (x) son soluciones de una ecuación diferencial homogénea y c1 y c2 son dos constantes,
entonces
y(x) = c1 y1 (x) + c2 y2 (x)
es una solución de la misma ecuación diferencial.
(2) Si y1 (x) e y2 (x) son soluciones linealmente independientes (ninguna de ellas es un múltiplo de la otra) de
una ecuación diferencial homogénea de segundo orden, entonces la solución general está dada por
y(x) = c1 y1 (x) + c2 y2 (x),
donde c1 y c2 son dos constantes.
En general, encontrar las soluciones de una ecuación de segundo orden (homogénea o no homogénea) es difı́cil,
a veces imposible. Sin embargo, si las funciones P y Q son constantes, entonces siempre se pueden hallar
soluciones. En los siguientes apartados describimos cómo hacerlo.
2.3.1. Ecuaciones lineales de coeficientes constantes homogéneas
Consideremos la ecuación de segundo orden con coeficientes constantes siguiente:

y 00 + ay 0 + by = 0.
Las soluciones de dicha ecuación se determinan a partir de las raı́ces de la ecuación
r 2 + ar + b = 0,
denominada ecuación caracterı́stica. Se pueden presentar las siguientes tres posibilidades:
(1) Raı́ces reales diferentes: Si r1 6= r2 son las raı́ces reales distintas de la ecuación caracterı́stica, entonces la
solución general es
y = c1 er1 x + c2 er2 x .
(2) Raı́ces reales iguales: Si r1 = r2 son las raı́ces reales iguales de la ecuación caracterı́stica, entonces la
solución general es
y = c1 er1 x + c2 xer1 x = (c1 + c2 x)er1 x .
(3) Raı́ces complejas: Si r1 = α + iβ y r2 = α − iβ son las raı́ces complejas de la ecuación caracterı́stica,
entonces la ecuación general es
y = c1 eαx cos(βx) + c2 eαx sen(βx).
2.3.2. Ecuaciones lineales de coeficientes constantes no homogéneas
Consideremos la ecuación de segundo orden con coeficientes constantes siguiente:

y 00 + ay 0 + by = R(x).
En la búsqueda de las soluciones de dicha ecuación, juega un papel importante la solución de la ecuación
y 00 + ay 0 + by = 0
denominada ecuación homogénea asociada. El siguiente resultado nos resuelve la ecuación.
La solución general de la ecuación y 00 + ay 0 + by = R(x) se puede escribir como

y(x) = yh (x) + yp (x),
en donde yh (x) es la solución general de la ecuación homogénea asociada e yp (x) es una solución particular.
El problema que se nos presenta ahora es la determinación de la solución yp (x). Describimos a continuación dos
técnicas.
102 MATEM ÁTICAS
2.3.2.1. Método de los coeficientes indeterminados
Si la función R(x) consiste en la suma o producto de factores de los siguientes tipos:
(I) Polinómico: xn ,
(II) Exponencial: erx ,
(III) Trigonométrico: cos βx, sen βx,
entonces podemos hallar una solución particular yp (x) por el método de los coeficientes indeterminados. La clave
consiste en conjeturar que la solución yp es de una forma especial, la cual depende de la función R. Las reglas
que deben seguirse son:
(1) Si R(x) es un polinomio (tipo I), entonces se prueba con un polinomio del mismo grado.
(2) Si R(x) es exponencial (tipo II), entonces se prueba con Aerx .
(3) Si R(x) es trigonométrico (tipo III), entonces se prueba con A cos βx + B sen βx.
(4) Si R(x) es la suma o producto de factores anteriores, entonces se prueba con la suma o producto, respecti-
vamente, de las correspondientes soluciones particulares.
(5) Si cualquier término de yp es solución de la ecuación homogénea asociada, se multiplica yp por x (o x2 si

es necesario).
2.3.2.2. Método de variación de parámetros
El método de los coeficientes indeterminados descrito anteriormente funciona bien si la función R(x) está formada
por polinomios, exponenciales o funciones trigonométricas (senos y cosenos). La razón hay que buscarla en que
las derivadas de este tipo de funciones no son más complicadas que las funciones originales. Esto no ocurre, por
ejemplo, con funciones como 1/x o tan x.
El método de variación de parámetros parte de la suposición que yp (x) tiene la misma forma que yh (x), excepto
que las constantes c1 y c2 se sustituyen por dos funciones u1 (x) y u2 (x). El método consiste en lo siguiente:
(1) Hallar la solución general yh (x) = c1 y1 (x) + c2 y2 (x).
(2) Sustituir las constantes por funciones para formar yp (x) = u1 (x)y1 (x) + u2 (x)y2 (x).
(3) Resolver el siguiente sistema para u01 y u02 :
u01 y1 + u02 y2 = 0
u01 y10 + u02 y20 = R(x)
(4) Integrar para hallar u1 y u2 .

2.4. Ecuaciones lineales de orden superior con coeficientes constantes
Consideremos la ecuación de orden n con coeficientes constantes siguiente:
y (n) + an−1 y (n−1) + · · · + a1 y 0 + a0 y = 0.
Las soluciones de dicha ecuación se determinan a partir de las raı́ces de la ecuación
r n + an−1 r n−1 + · · · + a1 r + a0 = 0,
denominada ecuación caracterı́stica.
Cada raı́z r de la ecuación caracterı́stica genera un término de la solución de acuerdo con las siguientes reglas:
(1) r es raı́z real: Si m es la multiplicidad de r como raı́z de la ecuación caracterı́stica, entonces r colabora a la
solución general con
y = C(x)erx ,
donde C(x) es un polinomio de grado m − 1.
(2) r = α ± iβ es raı́z compleja: Si m es la multiplicidad de r como raı́z de la ecuación caracterı́stica, entonces

r colabora a la solución general con
y = eαx (C1 (x) cos(βx) + C2 (x) sen(βx)) ,
donde C1 (x) y C2 (x) son polinomios de grado m − 1.
En consecuencia, la solución general de la ecuación de orden n se obtiene como sigue. Sean r1 , r2 , . . . , rk , las
raı́ces reales distintas de la ecuación caracterı́stica con multiplicidades m1 , m2 , . . . , mk , respectivamente, y sean
z1 = α1 ± iβ1 , z2 = α2 ± iβ2 , . . . , z` = α` ± iβ` las raı́ces complejas distintas de la ecuación con multiplicidades
n1 , n2 , . . . , n` , respectivamente. Entonces la ecuación general de la ecuación diferencial lineal homogénea de
orden n viene dada por
X
k X̀
yh (x) = Ci (x)eri x + eαj x D1j (x) cos(βj x) + D2j (x) sen(βj x) ,
i=1 j=1
donde Ci (x) es un polinomio de grado mi − 1 para i = 1, . . . , k, y D1j (x), D2j (x) son polinomios de grado nj − 1
para j = 1, . . . , `.
Para finalizar, baste indicar que para obtener una solución particular de la ecuación diferencial de orden n no
homogénea se pueden utilizar los dos métodos descritos anteriormente para el caso de orden 2: coeficientes
indeterminados y variación de parámetros.
A.4.1. Hallar la solución general de las siguientes ecuaciones diferenciales, ası́ como la solución particular dada
por las condiciones iniciales que en cada caso se indican.
y 0 + ky = 0, k 6= 0 y(0) = 1, y 0 (0) = 0
y 0 + ky = senx y(0) = 2, y 0 (0) = 1
y + 2y 0 − 3y = 0
00
y(0) = 1, y(1) = 0
y 00 − y 0 = 0 y(0) = −3, y 0 (0) = 2
104 MATEM ÁTICAS
y 00 + ω 2 y = 0, ω 6= 0 y(0) = −2, y 0 (0) = 1

y 00 + 2y 0 − 3y = 6 y(0) = 1, y 0 (0) = −1
y 00 − y 0 = 2senx y(0) = 1, y 0 (0) = 0
y − 3y 0 + 2y = 5ex
00
y(0) = 0, y 0 (0) = −1
y 00 − 6y 0 + 9y = e3x y(1) = 1, y(2) = −2
y 00 − y 0 = 5ex − sen(2x) y(0) = 1, y 0 (0) = 0
y 00 + 4y = tanx y(0) = 1, y 0 (0) = 0
y + 2y 0 + y = ex
00
y(0) = 0, y(1) = −3
y 000 − 3y 00 + 2y 0 = 0 y(0) = 1, y 0 (0) = 0, y 00 (0) = 1
y 000 − y = 0 y(0) = 1, y 0 (0) = −1, y 00 (0) = 0
y 000 + 3y 00 − 4y = xe−2x y(0) = 0, y 0 (0) = 1, y 00 (0) = 2
y 000 + y 0 = cosecx
y (4) − 16y = 0
y (4) + y = x + 1
A.4.2. Se sabe que en un horno de cerámica, la velocidad a que se calienta un cuerpo es proporcional a 4 + T 2 ,
donde T (t) representa la temperatura del cuerpo que se calienta, medida en grados centı́grados, y t mide el
tiempo en minutos. Se√ introduce un cuerpo a temperatura inicial 2o C y se observa que al cabo de un minuto
o
su temperatura es 2 3 C. Determinar la función que nos permite expresar la temperatura del cuerpo en
función del tiempo.
A.4.3. Un grupo de biólogos ha determinado que la velocidad de aumento de una población de hormigas rojas
cabezonas es proporcional al número de individuos de dicha población. Sabiendo que al cabo de 2 meses la
población se ha duplicado, calcular cuánto tiempo tiene que transcurrir para que la población sea el triple
de la inicial.
A.4.4. Según la ley de enfriamiento de Newton, la velocidad a que se enfrı́a o calienta un cuerpo es proporcional
a la diferencia entre la temperatura del cuerpo y la temperatura del ambiente. Si un objeto se enfrı́a desde
100o C a 80o C en veinte minutos, siendo la temperatura del ambiente de 20o C, calcular el tiempo que ha de
pasar para que la temperatura del cuerpo sea de 60o C.
A.4.5. En cierto cultivo de bacterias, la velocidad de crecimiento de la población es proporcional al cuadrado de

la población presente.
(1) Si la población después de 3 horas es de 104 individuos y al cabo de dos horas más es de 4 × 104
individuos, calcular cuantos individuos habı́a en un principio.
(2) Sabiendo que después de 4 horas la población se ha duplicado, ¿cuál será la población presente al cabo
de 6 horas?
A.4.6. Un barco retrasa su movimiento por la acción de la resistencia del agua, que es proporcional a la velocidad
del barco. La velocidad inicial del barco es 10 metros/segundo y al cabo de 5 segundos su velocidad es 8
metros/segundo. Calcular al cabo de cuánto tiempo su velocidad será de 1 metro/segundo.
A.4.7. El fondo de un depósito de 300 litros de capacidad está cubierto de sal. Suponiendo que la velocidad
con que se disuelve la sal es proporcional a la diferencia entre la concentración en el instante dado y la
concentración de la disolución saturada (1 kilogramo de sal para 3 litros de agua) y sabiendo que al cabo
de un minuto la cantidad de sal disuelta es 1/3 de kilogramo, hallar la cantidad de sal que contendrá la
disolución al cabo de una hora.
A.4.8. Cuando se introduce glucosa por vı́a intravenosa a velocidad constante, el cambio en la concentración
global c(t) de glucosa en sangre con respecto al tiempo viene descrito por la siguiente ecuación diferencial
dc G
= − kc,
dt 100V
donde G denota la velocidad constante a que se suministra la glucosa, V es el volumen total de la sangre
en el cuerpo y k es una constante positiva que depende del paciente. Calcular la función que nos permite
expresar la concentración de glucosa en sangre en función del tiempo.
A.4.9. Una frı́a mañana comenzó a nevar y continuó nevando a velocidad constante a lo largo del dı́a. Una
máquina quitanieves comenzó a trabajar a las doce del mediodı́a, quitando nieve a velocidad constante
(volumen por unidad de tiempo). Desde la una hasta las dos avanzó solamente la mitad de lo que habı́a
avanzado desde las doce hasta la una. Calcular la hora en que empezó a nevar.
A.4.10. En la conservación de alimentos, el azúcar de caña sufre un proceso de inversión y se transforma en

glucosa y fructosa. En soluciones diluidas, el ritmo de inversión es proporcional a la concentración y(t) del
azúcar inalterada. Si la concentración es 1/50 cuando t = 0 y 1/200 tras 3 horas, hallar la concentración del
azúcar inalterada después de 6 y 12 horas.
A.4.11. Según las leyes de la termodinámica, el flujo del calor a través de una superficie plana es ortogonal a las
curvas isotermas. Suponiendo que el flujo de calor describe una trayectoria dada por y = C/x, donde C es
una constante no nula, obtener las curvas isotermas.
A.4.12. La tasa de crecimiento de una población de moscas de la fruta en un instante dado es proporcional al
tamaño de la población en dicho momento. Si hay 180 moscas después del segundo dı́a del experimento y
300 moscas después del cuarto dı́a, ¿cuántas moscas habı́a originalmente?
A.4.13. El ritmo de desintegración del radio es proporcional a la cantidad presente en un instante dado. Hallar el
porcentaje de una muestra actual que quedará al cabo de 25 años si la vida media del radio es de 1600 años.
A.4.14. En una reacción quı́mica, un cierto compuesto se transforma en otra sustancia a un ritmo proporcional a
la cantidad no transformada. Si habı́a inicialmente 20gr. de la sustancia original y 16gr. tras 1 hora, ¿en qué
momento se habrá transformado el 75% de dicho compuesto?
4.1. Introducción
necesitar.
En esta práctica nos vamos a centrar en la resolución de ecuaciones diferenciales. DERIVE for Windows resuelve
todas las ecuaciones diferenciales de primer grado y primer orden mediante los métodos más conocidos (variables
separadas, ecuaciones diferenciales lineales, ecuaciones exactas, factores integrantes, etc.) DERIVE for Windows
proporciona, siempre que puede, la solución explı́cita de la ecuación diferencial. No obstante, es posible que
DERIVE for Windows ofrezca una solución que dependa de una integral no resoluble algebraicamente.
106 MATEM ÁTICAS
en rapidez.
4.2. Ecuaciones diferenciales de primer orden
Para poder resolver ecuaciones diferenciales de primer orden es necesario tener cargado en el ordenador la utilidad
ODE1.MTH, lo cual se consigue seleccionando las opciones File|Load|Math o File|Load|Utility. Esta utili-
dad proporciona una serie de funciones que nos permiten resolver las ecuaciones diferenciales utilizando distintos
métodos.
Resolver la ecuación y 0 = ex+y + ey y encontrar la solución que pasa por el punto (0, 1)
La ecuación diferencial es de la forma

y 0 = p(x)q(y),
siendo p(x) una expresión cualquiera (no tiene por qué ser un polinomio) que no depende de y, y donde q(y) es
una expresión cualquiera que no depende de x. Entonces debemos utilizar la función de DERIVE for Windows
SEPARABLE(p,q,x,y,a,b),
donde a y b son los valores de x e y para los cuales queremos una solución particular. En nuestro caso, debemos
introducir la expresión SEPARABLE(#e^x+1,#e^y,x,y,0,1) y obtendremos como resultado e−1 − e−y = ex +
x − 1. Para obtener y en función de x debemos seleccionar las opciones Solve|Algebaically, con la opción
Variable igual a y, y obtendremos
y = 1 − ln(−ex+1 − ex + e + 1)
Resolver la ecuación diferencial xy 0 + y = y 2 ln(x)
Observemos en primer lugar que el miembro de la izquierda coincide con la derivada de la función xy respecto
de x, por lo que parece aconsejado hacer el cambio de variable z = xy. Entonces la ecuación se transfor-
ma en la siguiente: z 0 = x−2 ln(x)z 2 , que puede resolverse por la técnica de variables separables haciendo
SEPARABLE(Ln(x)/x^2,z^2,x,z,a,b). La solución obtenida es
ln(x) ln(a) 1 1 1 1
− + − − + = 0.
x a x z a b
Para obtener y en función de x debemos seleccionar las opciones Solve|Algebaically, con la opción Variable
igual a z, y obtendremos
abx
z= .
ab ln(x) − bx ln(a) + x(a − b) + ab
Como z = xy entonces la solución a nuestra ecuación es y = z/x, es decir
ab
y= .
ab ln(x) − bx ln(a) + x(a − b) + ab
Resolver la ecuación xy 0 − 4y + 2x2 + 4 = 0 y hallar la solución particular que pasa por el punto (1, 1)
La ecuación puede ponerse en la forma y 0 + p(x)y = q(x), donde p(x) y q(x) son expresiones cualesquiera que
sólo dependen de x. Entonces podemos resolver este tipo de ecuaciones mediante la orden
LINEAR1(p,q,x,y,a,b),
donde a y b son las condiciones iniciales. En nuestro caso, escribimos LINEAR1(-4/x,-2x-4/x,x,y,1,1) para
obtener como solución
y = −x4 + x2 + 1
Resolver la ecuación diferencial (x + y)dx + (y − x)dy = 0, hallando la solución que pasa por el punto (1, 1)
Este tipo de ecuación diferencial es homogénea, lo cual significa que es de la forma y 0 = r(x, y), donde r es
una función tal que r(ax, ay) = r(x, y) para todo número a. Para resolver este tipo de ecuaciones, DERIVE for
Windows dispone de la orden
HOMOGENEOUS(r,x,y,a,b),
donde a y b son las condiciones iniciales. En nuestro caso, escribimos HOMOGENEOUS((x+y)/(x-y),x,y,1,1)

y obtenemos
y 2
LN( x +y
2
) π
2
ATAN + LN(|x|) − − = LN(x)
x 2 4
Para comprobar que la solución hallada es la correcta, podemos utilizar la función
IMP DIF(ATAN(y/x)+LN(|x|)-LN((x^2+y^2)/2)/2-pi/4-LN(x))-(x+y)/(x-y),
cuyo resultado es cero, garantizando que la solución encontrada es buena. Para utilizar la función anterior es
necesario haber cargado la utilidad DIF APPS.MTH.
En ocasiones no sabemos si la función r es homogénea, quizás por su complicación al no estar lo bastante

simplificada. Para estos casos, DERIVE for Windows dispone de la función HOMOGENEOUS TEST(r,x,y).
Si el resultado es una función que no depende de x, entonces r es una función homogénea. En nuestro caso
HOMOGENEOUS TEST((x+y)/(x-y),x,y) es igual a y − e−y .
108 MATEM ÁTICAS
Resolver la ecuación y 0 = 1 + sec(1 + x + y)
Para resolver ecuaciones diferenciales de la forma y 0 = r(u), donde u es una función lineal con coeficientes
constantes de x e y (es decir, u = ax + by + c, con a, b, c constantes), DERIVE for Windows pone a nuestra
disposición el comando
FUN LIN CCF(r,a,b,c,x,y,p,q),
donde p y q son las condiciones iniciales. En nuestro caso, escribimos
FUN LIN CCF(1+SEC(1+y+x),1,1,1,x,y,p,q)
y la solución general obtenida es:

√ √
√ 3 cos(x + y + 1) − sen(x + y + 1) + 3
3 ln √ √
3 cos(x + y + 1) + sen(x + y + 1) + 3
√ 6 √
√ 3 cos(p + q + 1) − sen(p + q + 1) + 3
3 ln √ √
3 cos(p + q + 1) + sen(p + q + 1) + 3
−
6
x+y−p−q
+ = x−p
2
En este caso resulta imposible despejar y como función explı́cita de x.
Resolver la ecuación y 0 = (x + y − 1)/(x − y)
Con este ejercicio vamos a ilustrar cómo resolver ecuaciones diferenciales de la forma

ax + by + c
y0 = r
px + qy + k
donde a, b, c, p, q, k son constantes que cumplen la condición aq − bp 6= 0, ya que de lo contrario estarı́amos en

el caso lineal. DERIVE for Windows resuelve este tipo de ecuaciones utilizando la siguiente función
LIN FRAC(r,a,b,c,p,q,k,x,y,A,B)
donde (A,B) son las condiciones iniciales. En nuestro caso debemos teclear
LIN FRAC((x+y-1)/(x-y),1,1,-1,1,-1,0,x,y,0,0)
y obtenemos la siguiente solución en forma implı́cita:

2y − 1 1 π
ATAN + LN(|2x − 1|) − LN(2x2 − 2x + 2y 2 − 2y + 1) − = LN(2x − 1) − πi
2x − 1 2 4
Resolver la ecuación diferencial 2y 3 − 5xy + (xy 2 − 3x2 )y 0 = 0
Uno de los métodos más potentes para la resolución de ecuaciones diferenciales de primer orden consiste en buscar
factores integrantes. Dada la ecuación p(x, y) + q(x, y)y 0 = 0, ésta se podrá resolver si existe una función u(x, y)
que multiplicada por la ecuación anterior la convierta en exacta. La manera de comprobar que una función u es la
candidata consiste en calcular
EXACT TEST(up,uq,x,y)
Si el resultado es cero, entonces la solución implı́cita viene dada por
USE INTEG FCTR(u,p,q,x,y,a,b).
donde (a,b) son las condiciones iniciales.
El problema en todo caso es encontrar el factor integrante. Para ayudarnos DERIVE for Windows dispone de la
siguiente función:
MONOMIAL TEST(p,q,x,y)
Si el resultado es del tipo xm y n entonces
USE INTEG FCTR((x^m)(y^n),p,q,x,y,a,b)
nos da la solución general de la ecuación.
En nuestro caso MONOMIAL TEST(2y^3-5xy,xy^2-3x^2,x,y) proporciona como resultado x−27 y −16 . Por tan-
to la solución es
1 1
− + C = 0,
5x25 y 15 13x26 y 13
donde C es una constante apropiada.
A continuación se enuncian unos ejercicios sobre resolución de ecuaciones diferenciales. Si el alumno encuentra
alguna dificultad debe revisar detenidamente los ejemplos anteriores.
a) Hallar la curva solución de la ecuación

p y 02
y 1 + y 02 − y p =a
1 + y 02
que pasa por el punto (0, a).

b) Resolver la ecuación 3y 2 y 0 − ay 3 = x + 1
c) Resolver la ecuación y 0 xe1/x = −x + ye1/x
110 MATEM ÁTICAS
d) Resolver la ecuación y 0 = (3x + y)/(x − 2y)
e) Resolver la ecuación y 0 (x + y ln y) = y
f) Resolver la ecuación 4xy + 3y 2 − x + (x2 + 2xy)y 0 = 0
4.4. Ecuaciones diferenciales de segundo orden
Para poder resolver ecuaciones diferenciales de segundo orden es necesario tener cargado en el ordenador la
utilidad ODE2.MTH, lo cual se consigue seleccionando las opciones File|Load|Math o File|Load|Utility.
Esta utilidad proporciona una serie de funciones que nos permiten resolver las ecuaciones diferenciales utilizando
distintos métodos.
Resolver la ecuación diferencial y 00 − 3y 0 + 2y = ex sen x
La ecuación es de la forma y 00 +p(x)y 0 +q(x) = r(x), que DERIVE for Windows puede resolver en determinados
casos. El comando general que utiliza DERIVE for Windows es el siguiente
DSOLVE2(p,q,r,x,c1,c2)
DERIVE for Windows trata de encontrar la solución explı́cita general de la ecuación anterior en función de las
constantes c1 y c2. Debemos hacer notar que los dos últimos argumentos pueden omitirse o sustituirse por otros
nombres. Cuando DERIVE for Windows no puede encontrar una solución, el comando DSOLVE2 devuelve la
palabra ‘inapplicable’.
En estos casos, podemos ejecutar el comando
LIN2 TEST(p,q,x)
y si el resultado es una constante K, entonces podemos resolver la ecuación utilizando las siguientes funciones:
• Si K > 0, la solución vendrá dada por LIN2 POS(p,q,r,x).
• Si K < 0, la solución vendrá dada por LIN2 NEG(p,q,r,x).
• Si K = 0, la solución vendrá dada por LIN2 0(p,q,r,x).
En los tres casos, se obtiene la solución general explı́cita dependiendo de dos constantes arbitrarias c1 y c2.
DSOLVE2 puede encontrar fácilmente una solución cuando p y q son constantes. Cuando q es una constante
simbólica, el resultado puede adquirir una forma complicada. La solución puede contener integrales involucrando
la función r(x). En todo caso, para comprobar que el resultado es correcto, podemos sustituirlo en la ecuación
y 00 + p(x)y 0 + q(x) − r(x) = 0.
En el caso que estamos analizando, p(x) = −3, q(x) = 2 y r(x) = ex sen x, por lo que la solución vendrá dada
por DSOLVE2(-3,2,#e^x SIN x,x).
y0
Resolver la ecuación diferencial y 00 − x + 4x2 y = 4x2 sen(x2 )
En este caso, las funciones p, q y r están dadas por p(x) = −1/x, q(x) = 4x2 y r(x) = 4x2 sen(x2 ), por lo que
la solución vendrı́a dada por DSOLVE2(-1/x,4x^2,4x^2 SIN(x^2),x). Sin embargo, el programa devuelve la
palabra ‘inapplicable’, por lo que debemos resolverla de otro modo.
En primer lugar debemos ejecutar el comando LIN2 TEST(p,q,x) y si el resultado es una función dependiente
de x, entonces utilizamos la función LIN2A TEST(p,q,x). Si el resultado de este segundo test es una constante
K, podemos resolver la ecuación utilizando las siguientes funciones:
• Si K > 0, la solución vendrá dada por LIN2A POS(p,q,r,x).

• Si K < 0, la solución vendrá dada por LIN2A NEG(p,q,r,x).
• Si K = 0, la solución vendrá dada por LIN2A 0(p,q,r,x).
En los tres casos, se obtiene la solución general explı́cita dependiendo de dos constantes arbitrarias c1 y c2.
En nuestro caso la solución de la ecuación diferencial es la siguiente:

1
(2a + 1) sen(x2 ) − (x2 + b) cos(x2 )
2
Resolver la ecuación diferencial y 00 − ey = 0
Para resolver las ecuaciones diferenciales de la forma y 00 = q(y), donde q(y) puede ser cualquier función de y,
DERIVE for Windows dispone de la función
AUTONOMOUS CONSERVATIVE(q,x,y,a,b,c)
donde los tres últimos argumentos son optativos. Si están presentes, entonces DERIVE for Windows determina
la solución que satisface las siguientes condiciones iniciales: x = a, y(a) = b, y 0 (a) = c. En nuestro caso, la
solución vienen dada por AUTONOMOUS CONSERVATIVE(#e^y,x,y).
Resolver la ecuación diferencial y 0 y 00 = 1 + y 02
Haciendo el cambio de variable v = y 0 se transforma en una ecuación de primer orden de variables separadas
(vv 0 = 1 + v 2 ) que puede resolverse utilizando la función SEPARABLE. Entonces volvemos a obtener otra ecuación
de primer orden que resolvemos utilizando el método apropiado.
Resolver la ecuación diferencial yy 00 + y 02 = 0
Este ecuación es de tipo Liouville. En general, las ecuaciones de Liouville son de la forma
y 00 + p(x) + q(y)(y 0 )2 = 0,
112 MATEM ÁTICAS
donde p y q dependen sólo de x e y, respectivamente. DERIVE for Windows resuelve este tipo de ecuaciones
utilizando la función
LIOUVILLE(p,q,x,y,a,b).
Los dos últimos argumentos son opcionales y sirven para fijar las constantes en la solución general que se obtenga.
Si se omiten, el programa trabaja con las constantes c1 y c2. En nuestro caso p(x) = 0 y q(y) = 1/y, por lo que
la solución vienen dada por LIOUVILLE(0,1/y,x,y):
1
c2 x + y 2 − c1 = 0.
2
A continuación se enuncian unos ejercicios sobre resolución de ecuaciones diferenciales. Si el alumno encuentra
alguna dificultad debe revisar detenidamente los ejemplos anteriores.
a) Resolver la ecuación y 00 − 2y 0 − 3y = 2 sen x.

b) Resolver la ecuación y 00 − 2y 0 = x + 2ex .
ex
c) Resolver la ecuación y 00 − 2y 0 + y = .
2x
d) Resolver la ecuación y 00 − sen y = 0.
e) Resolver la ecuación y 00 + xy 0 = y 02 .
f) Resolver la ecuación y 00 + yy 0 = y.
4.6. Métodos numéricos de resolución de ecuaciones de primer orden
Hay ocasiones en que no se puede obtener la solución exacta de una ecuación diferencial. En estos casos, lo
conveniente puede ser obtener una solución numérica. Para este menester, DERIVE for Windows pone a nues-
tra disposición diferentes métodos. En primer lugar debemos cargar la utilidad ODE APPR.MTH (mediante las
opciones File|Load|Math o File|Load|Util).
El método de Euler
El método de Euler es uno de los métodos más clásicos utilizados en la resolución numérica de ecuaciones dife-
renciales ordinarias de primer orden. La sintaxis general es
EULER(f,x,y,a,b,h,n)
Esta función proporciona un vector de n + 1 puntos (pares de números) solución de la ecuación y 0 = f (x, y),
con condiciones iniciales (a, b), empezando en a y con un paso h. El vector solución debe interpretarse como los
puntos sobre la curva solución cuyas abcisas están separadas una distancia h. Por ejemplo, para generar 5 puntos
de una solución aproximada de la ecuación y 0 = 26/(3 + (x + y)2 ) en el intervalo [1,2] con condición inicial
(a, b) = (1, −2), deberı́amos escribir
EULER(26/(3+(x+y)^2),x,y,1,-2,0.25,4)
El resultado es:  
1 −2
 1.25 −0.375 
 
 
 1.5 1.35114 
 
 1.75 1.93520 
2 2.32722
El método de Runge-Kutta
El método de Euler discutido anteriormente es el método más sencillo para resolver ecuaciones diferenciales
ordinarias, pero usualmente comete un error considerable. Sin embargo, el método clásico de Runge-Kutta es más
preciso y por tanto es preferible al método de Euler. La sintaxis general es
RK(f,v,v0,h,n)
RK utiliza el método de Runge-Kutta de orden 4 para resolver una ecuación diferencial de primer orden; también
puede utilizarse para resolver un sistema de ecuaciones diferenciales de primer orden. En la expresión anterior,
el programa calcula un vector de n + 1 puntos (pares de números) solución de la ecuación y 0 = f (v), donde
v = [x, y], con condiciones iniciales v0 = [a, b], empezando en a y con un paso h.
Hill, Madrid, 1995. Capı́tulo 18.
E.4.1. Calcular la solución general de la siguiente ecuación diferencial,

y 00 − 6y 0 + 9y = 0.
Calcular la solución particular que alcanza un máximo relativo en x = 0 con y(0) = 1.
114 MATEM ÁTICAS
E.4.2. Calcular la solución general de la siguiente ecuación diferencial,
y 00 − 6y 0 + 9y = 4e5x .
Calcular la solución particular determinada por las siguientes condiciones iniciales, y(0) = 2, y 0 (0) = 9.
E.4.3. Hallar la solución general de la siguiente ecuación diferencial
y 00 − 5y 0 + 6y = 0.
Hallar la solución particular de esta ecuación determinada por las condiciones iniciales y(0) = 1, y 0 (0) = 0.
E.4.4. Calcular la solución general de la siguiente ecuación diferencial
y 00 − 4y 0 + 4y = x.
Calcular la solución particular determinada por las condiciones iniciales y(0) = 1, y 0 (0) = 0.
E.4.5. Un trabajador de 30 años tiene un salario de 2.000.000 ptas anuales con un crecimiento estimado de
100.000 ptas anuales. Si realiza una inversión inicial de 100.000 ptas en un plan de pensiones que rin-
de un 8% anual, y realiza anualmente inversiones adicionales iguales al 5% de su salario, un modelo para el
capital invertido x al cabo de t años es
dx
= 00 08x + 00 05(2.000.000 + 100.000t)
dt
x(0) = 100.000
¿Cuántos años deben pasar para que acumule una inversión de 10.000.000 ptas? ¿Cuánto capital tendrá en
el plan cuando se jubile? (Se considera que 65 años es la edad de jubilación.)
E.4.6. Encontrar la solución general de la siguiente ecuación diferencial:
y 00 − 2y 0 − 3y = e−x + 2 senx
Determinar las constantes para que y 0 (0) = 1 e y(0) = −1.
E.4.7. Una boya cilı́ndrica, de diámetro 20cm y peso 100Kg, flota parcialmente sumergida en posición recta.
Cuando es ligeramente separada de su posición de equilibrio, la boya sube y baja según la siguiente ecuación
diferencial:
100 d2 x dx
2
= −16πx − c
g dt dt
dx
donde c es la resistencia por fricción que ofrece el agua y g es la aceleración gravitatoria.
dt
√
(1) Obtener x(t) si la constante c es igual a 15π. √
(2) Calcular c si el periodo de oscilación observado es de 54 2π.
Observación : Como valor de la constante g puede tomarse 10m/s2 .
E.4.8. En un circuito eléctrico simple hay una corriente eléctrica I (en amperios), una resistencia R (en ohmios),
una inductancia L (en henrios) y una fuerza electromotriz E (en voltios), como se indica en la siguiente
figura.
E •
S
R
De acuerdo con la segunda ley de Kirchoff, si se cierra el interruptor S en t = 0, la fuerza electromotriz

aplicada (potencial) es igual a la suma de las caı́das de potencial en el resto del circuito. En otras palabras,
esto significa que la corriente I satisface la siguiente ecuación diferencial:
dI
L + RI = E.
dt
Determinar la corriente I como función del tiempo t (en segundos), siendo R y L constantes no nulas y
E(t) = sen 2t.
E.4.9. Calcular la solución general de la ecuación diferencial siguiente:
y 00 − 2y 0 − 3y = 2 sen x.
Determinar el valor de las constantes si se verifican las siguientes condiciones:
y(0) = 1/5, y(π) = 0.
E.4.10. Resolver las siguientes ecuaciones diferenciales:

1
(1) xdx − ydx = xy 2 dx (usar como factor integrante y 2 ).
d2 y dy
(2) 2
− + 5y = 3.
dx dx
E.4.11. Una célula está suspendida dentro de una solución que contiene un soluto a una concentración constante
Cs . Se supone que la célula tiene un volumen constante V y que el área de su membrana permeable es igual
a la constante A. Por la ley de Fick (fisiólogo alemán, 1829–1901), la razón de cambio de su masa m es
directamente proporcional al área A y a la diferencia Cs − C(t), donde C(t) denota la concentración del
soluto en el interior de la célula en el instante t.
R ?
?
-
C(t)
i
1
K

Cs
Determinar la función C(t) suponiendo que m = V C(t) y C(0) = C0 .

116 MATEM ÁTICAS
ANOTACIONES
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
CAPÍTULO 5
ÁLGEBRA LINEAL Y GEOMETRÍA
• Hallar un sistema triangular que sea equivalente a • Calcular la forma Jordan de matrices de órdenes
uno dado. 2 y 3, usándola como recurso para efectuar poten-
cias n-ésimas.
• Conocer los distintos tipos de matrices y mane-
jar las distintas operaciones que se definen entre • Conocer y utilizar los conceptos de producto es-
ellas, usando correctamente sus propiedades. calar, norma y distancia en el espacio.
• Hallar el determinante de una matriz de cualquier • Identificar geométricamente el producto vectorial
orden. y el producto mixto de vectores.
• Hallar la matriz inversa de una matriz dada. • Identificar y calcular las ecuaciones de algunas
• Discutir y resolver sistemas de ecuaciones linea- secciones cónicas y superficies cuádricas.
les. • Manejar expresiones en coordenadas polares,
• Conocer y utilizar la estructura de espacio vecto- cilı́ndricas y esféricas.
rial y los conceptos de base y dimensión.
• Conocer el concepto de aplicación lineal e identi-
• Identificar cuando una matriz es diagonalizable. ficar el núcleo y la imagen de la misma.
• Calcular la matriz diagonal semejante a una ma- • Calcular la matriz asociada a una aplicación li-
triz A dada como recurso para efectuar su poten- neal y saber obtener la nueva expresión de la mis-
cia n-ésima. ma al efectuar un cambio de base.
2.1. Sistemas de ecuaciones lineales
Una ecuación lineal de n variables X1 , X2 , ..., Xn es una ecuación del tipo a1 X1 + a2 X2 + ... + an Xn = b.
Los números ai (i = 1, ..., n) se denominan coeficientes y a b se le llama término independiente.
Una solución de la ecuación lineal anteriormente mencionada es una n-upla de números reales (α1 , α2 , ..., αn )
tal que a1 α1 + a2 α2 + · · · + an αn = b.
Ejemplo. 3x − 2y + z = 0 es una ecuación lineal de tres variables, y (1, 1, −1) es una solución de la misma.
Nótese que la ecuación anterior tiene un número infinito de soluciones. 2
118 MATEM ÁTICAS
A un conjunto de varias ecuaciones lineales se le denomina sistema de ecuaciones lineales. Es decir un sistema
de m ecuaciones lineales y n variables o incógnitas, es una expresión del tipo



a11 X1 + a12 X2 + ... + a1n Xn = b1

a21 X1 + a22 X2 + ... + a2n Xn = b2

 ............................................ ...

am1 X1 + am2 X2 + ... + amn Xn = bm
Una solución de este sistema es una n-upla de números reales (α1 , α2 , ..., αn ) que sea a su vez solución de las m
ecuaciones de las que se compone el sistema.
Ejemplo. En el siguiente sistema de 2 ecuaciones y 3 incógnitas

3x − 2y + z = 1
x + 3y − 2z = 5

la terna 13 14
11 , 11 , 0 es una solución del sistema, ya que lo es de cada una de las ecuaciones que lo forman. La terna
(4, 6, 1) no es solución del mismo ya que aunque es solución de la primera ecuación no lo es de la segunda. Se
puede demostrar que este sistema de ecuaciones lineales tiene infinitas soluciones. 2
Atendiendo a la existencia o no de soluciones y a su número (finito o infinito), los sistemas de ecuaciones lineales
se clasifican de la siguiente manera:
 

  Determinado (Solución única)



 Compatible (existe solución) 
s.e.l. Indeterminado (Infinitas soluciones)






Incompatible (No existe solución)
2.1.1. Reglas de equivalencia de sistemas
Dos sistemas de ecuaciones lineales se dice que son equivalentes cuando tienen las mismas soluciones.
Los métodos de resolución de sistemas de ecuaciones lineales se basan en la idea de transformar el sistema original
del cual queremos encontrar sus soluciones, en otro equivalente que tenga una estructura más sencilla.
Después de lo dicho conviene aclarar qué entendemos por “estructura sencilla” y cuáles van a ser las operaciones
que van a ser válidas para transformar el sistema original en otro equivalente.
Ejemplos de sistemas sencillos de resolver, en el caso de igual número de ecuaciones que de incógnitas, son los
llamados triangulares.
Un sistema triangular de tres ecuaciones con tres incógnitas vendrı́a expresado de una manera genérica por:

 a11 x + a12 y + a13 z = b1
a22 y + a23 z = b2

a33 z = b3
Obsérvese que a21 = a31 = a32 = 0.

ÁLGEBRA LINEAL Y GEOMETR ÍA 119
Intenta responder ahora a las siguientes preguntas: ¿Cómo serı́a un sistema triangular de cuatro ecuaciones y
cuatro incógnitas? ¿Sabrı́as definir el mismo concepto para un sistema de n ecuaciones y n incógnitas?
En este tipo de sistemas con n ecuaciones y n incógnitas (si ann 6= 0) se obtiene fácilmente una solución única,
despejando y sustituyendo sucesivamente de la última ecuación a la primera.
Parece claro que nuestro interés principal lo centraremos en realizar operaciones en las ecuaciones que forman el
sistema original del que queremos conocer sus soluciones, hasta transformarlo en otro que sea lo más parecido
posible a un sistema triangular. Debemos por tanto hacer referencia a las reglas u operaciones que consideramos
válidas, es decir, que transforman un sistema en otro equivalente:
(1) Intercambiar dos ecuaciones.
(2) Multiplicar (o dividir) una ecuación por un número distinto de cero.
(3) Sumar o restar a una ecuación el resultado de multiplicar (o dividir) otra por un número.
(4) Expresar una ecuación despejando una variable, y sustituir el resultado en las demás.
Ejemplo 1. Vamos a obtener un sistema triangular equivalente a:


 2x + 3y − 4z = 1
3x − 2y + 5z = 3

7x + 4y − 3z = 5

 2x + 3y − 4z = 1
2 ec. × 2 + 1 ec. × (−3)
a a
V V −13y + 22z = 3
3a ec. × 2 + 1a ec. × (−7) 
−13y + 22z = 3

 2x + 3y − 4z = 1
2x + 3y − 4z = 1
V (3a ec. + 2a ec. × (−1)) V −13y + 22z = 3 V
 −13y + 22z = 3
0.z = 3

Despejando y en la segunda x = 11 7
13 − 13 z
V V
ecuación y sustituyendo y = − 13 + 22
3
13 z
y el conjunto de soluciones viene expresado por:

11 7 3 22
S= − λ, − + λ, λ : λ ∈ R
13 13 13 13
Como vemos el sistema tiene infinitas soluciones.
Obviamente no todos los sistemas que vamos a intentar resolver tienen el mismo número de ecuaciones y de
incógnitas. ¿Cómo procederı́amos con un sistema de este estilo?
Ejemplo 2. Vamos a triangular el siguiente sistema de ecuaciones:


 x + 3y − z + t = 1
−2x + y + 2z = 7

y−t = 0

 x + 3y − z + t = 1
=⇒ (2a ec. + 1a ec. × 2) =⇒ 7y + 2t = 9 =⇒

y−t = 0
120 MATEM ÁTICAS

 x + 3y − z + t = 1
(Intercambiamos la 2a ec. y la 3a ec) =⇒ y−t = 0

7y + 2t = 9

 x + 3y − z + t = 1
=⇒ (3 ec. − 2 ec. × 7) =⇒
a a
y−t = 0

9t = 9

1  x + 3y − z + t = 1
=⇒ (3a ec. × ) =⇒ y−t = 0
9 
t = 1

 x−z = −3
=⇒ (1a ec. − 2a ec. × 3) =⇒ y−t = 0

t = 1
de donde el conjunto de soluciones vendrı́a dado por
S = {(−3 + λ, 1, λ, 1) : λ ∈ R}
¿Sabrı́as explicar por qué?
Observaciones. Debemos extraer algunas conclusiones de los ejemplos anteriores.
(1) En las operaciones que realizamos con los sistemas en realidad nos bastarı́a con hacer referencia sólo a los
coeficientes, obviando ası́ la repetición de las incógnitas. Si eliminamos estos sı́mbolos el sistema anterior
se escribirı́a como  
1 3 −1 1 1
 −2 1 2 0 7 
0 1 0 −1 0
Esta ordenación de los coeficientes recibirá el nombre de matriz ampliada. La matriz
 
1 3 −1 1
 −2 1 2 0 
0 1 0 −1
recibe el nombre de matriz de los coeficientes del sistema.

Las operaciones que hemos realizado sobre las ecuaciones se realizarán ahora sobre las filas de esta última
matriz, sin más que sustituir la palabra “ecuación” por la de “fila”.
(2) Dada la matriz genérica de un sistema de tres ecuaciones y tres incógnitas

 
a11 a12 a13 b1

 a21 a22 a23 b2 

a31 a32 a33 b
3
(ver Ejemplo 1), al intentar resolverlo y por lo tanto transformarlo en uno equivalente que sea triangular,
llegaremos a un sistema representado por una matriz del tipo
 0 0 
a11 a12 a13 b1
0 0
 0 0 0 
 0 a22 a23 b2 
0 0
0 0 a33 b3
0
que tendrá solución única si y sólo si a33 6= 0.
(3) En el caso representado en el Ejemplo 2, observemos que la matriz ampliada resultado de efectuar las
sucesivas transformaciones a las que hemos sometido el sistema original es
 
1 0 −1 0 −3
 0 1 0 0 1 
0 0 0 1 1
¿Qué tiene de común esta matriz con la correspondiente a un sistema triangular? Resaltamos a continuación
una caracterı́stica que podemos considerar común a las dos:
Ambas son matrices escalonadas, en el sentido de que puede trazarse una “escalera descendente”, por
debajo de cuál todos los elementos serán ceros.
Método de Gauss. El método de Gauss para la resolución de sistemas de ecuaciones lineales consiste en realizar
transformaciones en la matriz del sistema de partida hasta conseguir una matriz “escalonada”, de las caracterı́sticas
descritas anteriormente.
Como es lógico, no todos los sistemas son compatibles (determinados o indeterminados), y algunas veces nos
encontraremos con sistemas que no tengan solución. ¿Cómo los podremos identificar?
Ejemplo 3. El sistema de ecuaciones


 x + 2y − 3z = 1


2x − y + z = −2

 3x + 2y + 2z = −3

7x + 5y − 3z = 3
es equivalente a
 
1 2 −3 1

 0 −5 7 −4 
 
 0 0 −27 14 
0 0 0 −30
(Intenta dar los pasos pertinentes para lograr llegar a esta última expresión de un sistema equivalente). Observa
que como la última ecuación no tiene solución el sistema no tiene solución.
Observación. En general, cuando al efectuar operaciones en la matriz de un sistema, conseguimos una matriz en
la que todos los elementos de una fila son ceros menos el coeficiente que corresponde el término independiente de
la ecuación, el sistema será incompatible.
Resumimos a continuación las situaciones genéricas con las que nos encontramos al aplicar el método de elimi-
nación de Gauss.
(1) Obtenemos una solución imposible y el sistema de partida es incompatible.
(2) El número de ecuaciones resultantes no eliminadas y de incógnitas coincide. Entonces el sistema de partida
es compatible y determinado y la matriz ampliada se podrá transformar en una de la forma:
 
∗ ∗ .... ∗ ∗

 0 ∗ .... ∗ ∗ 
 
 ... ... .... ... ... 
0 0 .... ∗ ∗
(donde con ∗ expresamos cualquier valor posible de los coeficientes)

122 MATEM ÁTICAS
(3) El número de ecuaciones resultantes no eliminadas es menor que el número de incógnitas del sistema.
Entonces el sistema es compatible e indeterminado. La matriz ampliada se podrá transformar en una de la
forma:  
∗ ∗ ... ... ... ... ∗ ∗

 0 ∗ ∗ ... ... ... ∗ ∗ 
 
 ... ... ... ... ... ... ... ... 

0 0 ... ∗ ∗ ... ∗ ∗
2.1.2. Un caso notable: los sistemas de ecuaciones lineales homogéneos
En un sistema de ecuaciones lineales genérico cuando los términos independientes son todos nulos, lo denomina-
remos homogéneo.



a11 X1 + a12 X2 + ... + a1n Xn = 0
 a X + a X + ... + a X = 0
21 1 22 2 2n n

 ............................................. ...

am1 X1 + am2 X2 + ... + amn Xn = 0
Piensa y demuestra que se cumplen las siguientes propiedades:
(1) Un sistema homogéneo es siempre compatible, ya que la solución trivial (0, 0, ..., 0) satisface todas y cada
una de las ecuaciones del sistema.
(2) Si (α1 , α2 , ..., αn ) es solución de un sistema homogéneo, también lo es (λα1 , λα2 , ..., λαn ) con λ ∈ R. Lo
que en general demuestra que si un sistema homogéneo tiene una solución distinta de la trivial, entonces
tiene infinitas soluciones.
2.1.3. Discusión de sistemas de ecuaciones lineales en función de los valores de parámetros
Otro de los aspectos destacables dentro de la resolución de sistemas de ecuaciones lineales es el que habitualmente
se denomina como “discusión del sistema”. Entenderemos por esto decidir para qué valores de uno o varios
parámetros se tienen infinitas soluciones, solución única o ninguna solución.
Ejemplo. Discute según los valores de m el siguiente sistema de ecuaciones:


 x + 2y + z = 2
−x + 3y + z = 0

−x + y + mz = 1
   
1 2 1 2 1 2 1 2

 −1 3 1 0  V (Sumando la 2a fila a la 3a y la 1a a la 2a ) V  0 5 2 2 

−1 1 m 1 0 3 m+1 3
 
1 2 1 2
V (Multiplicando la 3a fila por 5 y la 2a por 3) V  0 15 6 6 
0 0 5m − 1 9
En función de los valores de m distinguiremos los siguientes casos:
1
(1) 5m − 1 = 0 ⇐⇒ m = 5 y la última ecuación se transforma en un absurso. Sistema incompatible.
(2) 5m − 1 6= 1
5 ⇐⇒ m 6= 1
5 . Sistema compatible y determinado. 2
Ejemplo. Discute según los valores de m:

 x + y + mz = 1
x + my + z = 1

mx + y + z = 1
Debes transformar esta ecuación en:

 
1 1 m 1

 0 m−1 1−m 0 

0 0 (1 − m)(2 + m) 1−m
¿Qué transformaciones son necesarias? La discusión surge de la ecuación (1 − m)(2 + m) = 0.
¿Qué sucede si m 6= 1 y m 6= −2? ¿Y si m = −2? ¿Y cuando m = 1? (Es interesante que razones conveniente-
mente las respuestas a todas estas preguntas). 2
2.2. Operaciones con matrices
Un conjunto de m × n números reales colocados de forma rectangular en m filas y n columnas recibe el nombre
de matriz real de dimensión m × n.
De forma genérica notaremos

 
a11 a12 .... a1n
 a21 a22 .... a2n 
A=
 ....

..... .... .... 
am1 am2 .... amn
Con la notación aij significamos el elemento de la matriz A que ocupa el lugar perteneciente a la fila i y a la
columna j. De forma abreviada también notaremos A = (aij )i=1...m
j=1...n
Al conjunto de todas las matrices con coeficientes reales, con m filas y n columnas (dimensión m × n) lo denota-
remos por Mm×n (R). En general abusaremos del lenguaje y cuando hablemos de “matrices” entenderemos que
sus coeficientes son números reales.
A las matrices que sólo tienen una fila se les llama matrices fila. Análogamente a las que tienen sólo una columna
se les denomina matrices columna.
Dada una matriz A, se denomina traspuesta de A, denotándose t A, a la matriz que se obtiene cambiando en A
las filas por columnas.
Las matrices en las que coincide el número de filas con el de columnas se denominan matrices cuadradas.
Para una matriz cuadrada de dimensión n × n se suele decir que es de orden n. El conjunto de elementos
(a11 , a22 , ...., ann ) se denomina diagonal principal.
Una matriz cuadrada A se dice que es simétrica cuando aij = aji para todo i = 1, . . . , m y j = 1, . . . , n.
Otros tipos especiales de matrices son:
Matriz nula: Aquella en que todos sus elementos son cero.

124 MATEM ÁTICAS

0 0
O= es un ejemplo de matriz nula de orden 2.
0 0
Matriz diagonal: Cualquier matriz cuadrada en la que los elementos que no están ubicados en la diagonal prin-
cipal son ceros.
 
7 0 0
D =  0 −2 0  es un ejemplo de matriz diagonal de orden 3.
0 0 −3
Matriz unidad o identidad: Se denomina ası́ a cualquier matriz diagonal en la que todos los elementos pertene-
cientes a la diagonal principal son iguales a 1. La matriz diagonal de orden n será denotada por In .
 
1 0 0
I3 =  0 1 0  es un ejemplo de matriz identidad de orden 3.
0 0 1
Matriz triangular: Se denomina de esta manera a toda matriz cuadrada en la que los elementos que están por
encima o por debajo de la diagonal principal son iguales a cero. Se dice triangular superior cuando los
elementos nulos están por debajo o triangular inferior si están por encima.
 
1 2 3
A =  0 4 −5  es un ejemplo de matriz triangular superior de orden tres.
0 0 6
2.2.1. Suma de matrices
Sean A, B ∈ Mm×n (R) , es decir, A = (aij )i=1...m y B = (bij )i=1...m . Definimos la matriz suma C = A + B,
j=1...n j=1...n
como C = (cij )i=1...m donde cij = aij + bij , para todo i = 1...m y j = 1...n.
j=1...n
Mas explı́citamente podemos expresar

 
a11 + b11 a12 + b12 .... a1n + b1n
 a21 + b21 a22 + b22 .... a2n + b2n 
C =A+B =
 ...............

............... .... ............... 
am1 + bm1 ............... .... amn + bmn
2.2.2. Propiedades de la Suma
(1) A + (B + C) = (A + B) + C (propiedad asociativa).
(2) A + B = B + A (propiedad conmutativa).
(3) A + O = A (Por O indicamos la matriz nula).
(4) La matriz −A que denominaremos matriz opuesta y que se obtiene cambiando de signo todos los elementos
de A, cumple la siguiente propiedad: A + (−A) = O.
Estas propiedades dotan a (Mm×n , +) de la estructura de grupo abeliano.

2.2.3. Producto de un escalar (número real) por una matriz
Sea A ∈ Mm×n (R) , A = (aij )i=1...m y λ ∈ R , definimos λA = (λaij )i=1...m , es decir:

j=1...n j=1...n
   
a11 a12 .... a1n λa11 λa12 .... λa1n
 a21 a22 .... a2n   λa21 λa22 .... λa2n 
λ
 ....
= 
..... .... ....   .... ..... .... .... 
am1 am2 .... amn λam1 λam2 .... λamn
   
3 2 12 8
Por ejemplo, 4  5 6  =  20 24 .
7 8 28 32
Para cualquier λ, µ ∈ R y A, B ∈ Mm×n (R), se verifican las siguientes propiedades:
(1) λ(A + B) = λA + λB.

(2) (λ + µ)A = λA + µB.
(3) λ(µA) = (λµ)A.
(4) 1A = A.
Todas estas propiedades, ası́ como las vistas anteriormente para la suma de matrices, se pueden resumir diciendo
que (Mm×n , +, .) es un espacio vectorial sobre R (cuerpo de los números reales).
2.2.4. Producto de matrices
Sean A, B ∈ Mm×n (R) , A = (aij )i=1...m y B = (bij )i=1...n . Definimos el producto AB como la nueva matriz
j=1...n j=1...p
C = (cij )i=1...m , tal que cij = ai1 b1j + ai2 b2j + ai3 b3j + ... + ain bnj o en expresión más reducida
j=1...p
X
n
cij = aik bkj .
k=1
Obsérvese que para que esté bien definido el producto de matrices, el número de columnas de la primera matriz
debe coincidir con el número de filas de la segunda.
Ejemplo. En el siguiente producto de matrices, el punto . denota la multiplicación en los números reales.

1 2 5 6 1.5 + 2.7 1.6 + 2.8 19 22
= =
3 4 7 8 3.5 + 4.7 3.6 + 4.8 43 30
2
2.2.5. Propiedades del producto de matrices
(1) A(BC) = (AB)C.

(2) AB 6= BA en general. ¿Puedes encontrar algún ejemplo que demuestre esta afirmación?
126 MATEM ÁTICAS
(3) Si A ∈ Mm×n (R), AIn = A (donde In representa la matriz identidad de orden n) y también Im A = A.
(4) A(B + C) = AB + AC.
De todo lo anterior se deduce que Mn (R) (conjunto de matrices cuadradas de orden n, con coeficientes reales)
dotado de las operaciones suma y producto de matrices tiene estructura de anillo (no conmutativo) con elemento
unidad.
2.2.6. Algunas matrices relevantes: las matrices invertibles
Consideremos el anillo (Mn (R), +, .) anteriormente mencionado. Dada la matriz A ∈ Mn (R) no siempre existe
otra matriz B ∈ Mn (R) tal que AB = BA = In (intenta encontrar algunos ejemplos de matrices que ilustren
esta afirmación).
En los casos en los que existe B se dice que es la matriz inversa de A y la denotaremos por A−1 .
Una matriz cuadrada A ∈ Mn (R) que posea inversa se dice que es invertible o también regular. Si no la tiene se
denomina matriz singular.
2.2.7. Un método sencillo para calcular la matriz inversa
Intentemos calcular la matriz inversa de la siguiente matriz de orden 2 × 2:

0 1
A= .
4 2
Procedemos de la siguiente manera. Ampliamos con la matriz identidad por la derecha

0 1 1 0
4 2 0 1
y seguidamente realizamos operaciones elementales (justo aquellas que fueron mencionadas en el método de
Gauss), con las filas de la matriz hasta conseguir:

1 0 ∗ ∗
.
0 1 ∗ ∗
Lo que resulta a la derecha en el lugar de las anteriores es justo la matriz inversa que buscábamos.
Veamos cómo se calcula la inversa para la matriz propuesta en el ejemplo.

0 1 1 0 1 −2 0 1 − 12
⇒ (2 fila × (− )) + 1 fila) ⇒
a a
⇒
4 2 0 1 2 4 2 0 1

−2 0 1 − 12
(1 fila × 2)) + 2 fila) ⇒
a a
⇒ (1a f ila × 2)) + 2a f ila) ⇒
0 2 2 0

1 0 − 12 41
0 1 1 0
Después de los anteriores cálculos y según lo expresado al comienzo concluiremos que
1 1
−2 4
A−1 = .
1 0
2.3. Determinantes: definición, propiedades, reglas de cálculo y aplicaciones
Vamos a empezar definiendo el concepto de determinante de una matriz cuadrada de orden n, A = (aij ). Para
introducir este concepto hacen falta algunas definiciones preliminares.
Dado el conjunto {1, 2, 3, ..., n}, cualquier n-upla ordenada formada por los n elementos de este conjunto diremos
que es una permutación. Denotaremos por Pn el conjunto de todas las permutaciones de {1, 2, 3, ..., n}.
Diremos que una permutación σ ∈ Pn tiene una inversión (o trasposición), cuando el orden que presentan dos
números es el contrario al que tienen los números naturales.
Ejemplo. Dado {1, 2, 3} , (1, 3, 2) es una permutación que pertenece a P3 . El número de permutaciones de P3
es 3! = 6. Son las formadas por (1, 2, 3), (2, 3, 1), (3, 1, 2), (3, 2, 1), (2, 1, 3) y (1, 3, 2). La permutación (1, 3, 2)
tiene una inversión (3 antes que 2) y (3, 2, 1) tiene 3 inversiones (3 antes que 2, 3 antes que 1 y 2 antes que 1). 2
Sea σ ∈ Pn , definimos el signo de σ como s(σ) = (−1)i(σ) , donde por i(σ) indicamos el número de inversiones
que tiene la permutación σ.
Antes de introducir la definición general de determinante, lo haremos primero para una matriz de orden 3. Consi-
deremos la matriz  
a11 a12 a13
A =  a21 a22 a23 
a31 a32 a33
y formemos todos los posibles productos de tres elementos de dicha matriz con las siguientes restricciones:
(1) En cada producto sólo puede aparecer un elemento de cada fila y uno de cada columna.
(2) Dotaremos de un signo a cada producto que coincidirá con el signo de la permutación de P3 formada por
los segundos subı́ndices de los elementos.
Permutación Número de inversiones Producto

123 0 +a11 a22 a33
231 2 +a12 a23 a31
312 2 +a13 a21 a32
321 3 −a13 a22 a31
213 1 −a12 a21 a33
132 1 −a11 a23 a32
Llamaremos determinante de A y lo notaremos por det(A) o por |A|, a la suma de todos estos productos. Es decir,
|A| = a11 a22 a33 + a12 a23 a31 + a13 a21 a32 − a13 a22 a31 − a12 a21 a33 − a11 a23 a32 .
Siguiendo esta misma técnica de definición podemos llegar a definir el concepto de determinante para una matriz
genérica de orden n, A = (aij ).
Definimos el determinante de A por la expresión

X
det(A) = (−1)s(σ) a1σ(1) a2σ(2) ...anσ(n)
σ∈Pn
donde por (σ(1), σ(2), ..., σ(n)) indicamos los subı́ndices que representa la permutación σ.
Observación. En un determinante de orden n aparecen n! sumandos. Como vemos el número de sumandos crece
rápidamente en relación con el orden del determinante. No es por tanto demasiado operativo como método de
128 MATEM ÁTICAS
cálculo la definición de determinante que hemos introducido con anterioridad. Procede por tanto que introduzca-
mos un método más práctico que nos facilite el trabajo en el cálculo de determinantes.
Dada la matriz A = (aij ), llamaremos menor complementario del elemento aij al determinante de la matriz que
resulta de suprimir en A la fila i y la columna j. Lo denotaremos por Mij .
Llamaremos adjunto de aij a la expresión Aij = (−1)i+j Mij .
Ejemplo. Dada la matriz

 
1 2 3 4
 0 2 2 3 
A= 
 0 0 −6 −4 
0 0 0 −2
el menor complementario de 4 es
0 2 2

M44 = 0 0 −6 =0

0 0 0
y el del 1 corresponde a
2 2 3

M11
= 0 −6 4 = 24.

0 0 −2
Los adjuntos son A11 = (−1)1+1 M11 = 24 y A44 = (−1)4+4 M44 = 0. 2
2.3.1. Cálculo del determinante por el desarrollo de los elementos de una fila o columna
Se puede demostrar sin demasiada dificultad (ver bibliografı́a recomendada) que dada una matriz genérica de
orden n, A = (aij ), el determinante viene dado por
det(A) = a11 A11 + a21 A21 + ... + an1 An1 .
A esta expresión se llama desarrollo del determinante de la matriz A por los elementos de la primera columna,
puesto que son (a11 , a21 , ..., an1 ) los elementos que forman la primera columna de la matriz A.
Esta importante propiedad se puede hacer más genérica y la expresión anterior será también válida eligiendo para
el desarrollo los elementos de cualquier fila o columna del determinante.
Por ejemplo para la fila i-ésima (ai1 , ai2 , ..., ain ) obtendrı́amos det(A) = ai1 Ai1 + ai2 Ai2 + ... + ain Ain y para
la columna j-ésima (a1j , a2j , ..., anj ) se tiene det(A) = a1j A1j + a2j A2j + ... + anj Anj .
La gran ventaja que presentan estas expresiones es que podemos reducir el cálculo de un determinante de orden n
al cálculo de otros (los adjuntos) que tienen el orden disminuido en una unidad (una fila y una columna menos).
Aplicando sucesivamente este criterio, podremos acabar reduciendo cualquier determinante a cálculos de deter-
minantes de orden 2.
Ejemplo. Desarrollando por los elementos de una lı́nea (fila o columna) vamos a calcular el valor del siguiente
determinante
1 −3 2 6

3 2 1 0
∆ =
2 1 −4 5
0 0 −4 0
La primera cuestión que nos surge es la fila o columna que más nos conviene escoger para el posterior desarrollo.
Parece claro para este ejemplo que es la cuarta fila y en general debemos escoger aquella que tenga el mayor
número de elementos iguales a cero. Ası́

1 −3 6
Desarrollando por la −3 6 1 6
∆ = −(−4) 3 2 0 = = 4(−3 + 2 ) = 388.
2 2a fila 1 5 2 5
1 5
2
2.3.2. Propiedades de los determinantes
Para poder expresar mejor las siguientes propiedades usaremos la notación det(A) = det(C1 , C2 , ..., Cn ), donde
Ci indica la columna i-ésima de la matriz A.
(1) Si una columna se multiplica por un escalar λ el valor del determinante queda multiplicado por λ:
det(C1 , ..., λCi , ..., Cn ) = λ det(C1 , ..., Ci , ..., Cn )

0 0
(2) det(C1 , ..., Ci + Ci , ..., Cn ) = det(C1 , ..., Ci , ..., Cn ) + det(C1 , ..., Ci , ..., Cn )
(3) El determinante de una matriz que tenga dos columnas iguales vale cero:
det(C1 , ..., Ci , ..., Ci , ..., Cn ) = 0
(4) det(0n ) = 0 (donde 0n es la matriz de orden n con todos sus elementos iguales a 0), det(In ) = 1.
(5) Si se intercambian dos columnas el determinante cambia de signo:
det(C1 , ..., Ci , ..., Cj , ..., Cn ) = − det(C1 , ..., Cj , ..., Ci , ..., Cn )
(6) Si a una columna se le suma una combinación lineal de las demás, el determinante no varı́a:
det(C1 , ..., Cn ) = det(C1 + λ2 C2 + λ3 C3 + ... + λn Cn , C2 , ..., Cn )
(7) Si en una matriz cambiamos filas por columnas el valor del determinante no varı́a:
det(A) = det(t A)
(8) Si A y B son matrices cuadradas del mismo orden n, det(AB) = det(A) det(B).
Observación. La propiedad (7) demuestra que en todas las propiedades anteriormente enunciadas podemos cam-
biar las referencias a columnas por filas, verificándose igualmente el enunciado resultante.
De las propiedades de los determinantes y del desarrollo de los mismos por los elementos de una fila o columna,
podemos deducir que es posible mediante operaciones elementales entre las filas o columnas (según las propieda-
des anteriormente descritas) conseguir poner ceros en el mayor número de elementos de la fila o columna por la
que vayamos a desarrollar, con la finalidad de simplificar considerablemente los cálculos.
Ejemplo. Calculemos el valor de

1 1 2 1

2 3 4 5
∆ = .

6 7 8 9
1 4 5 7
130 MATEM ÁTICAS
a a a a
Restamos la 1 columna a la 2 y a la 4 y también podemos restar a la 3 columna, la 1a columna multiplicada
por 2, para obtener finalmente

1 0 0 0

2 1 0 3
∆ = .
6 1 −4 3
1 3 3 6
Observa que de la cuarta columna podemos sacar factor común 3. Ası́ tendremos

1 0 0 0

2 1 0 1
∆ = 3 .
6 1 −4 1
1 3 3 2
Desarrollando por los elementos de la primera fila obtenemos

1 0 1

∆ = 3 1 −4 1 .
3 3 2
Ahora podemos restar la 1a columna a la tercera, para obtener finalmente

1 0 0

∆ = 3 1 −4 0
3 3 −1
y desarrollando por la primera fila se tiene

−4 0
∆ = 3 = 12.
3 −1
2
2.3.3. Aplicación de determinantes al cálculo de la matriz inversa
Llamaremos matriz adjunta de A = (aij ) a la matriz

 
A11 A21 .... An1
 A12 A22 .... An2 
Adj(A) =   ....
,
..... .... .... 
A1n A2n .... Ann
donde por Aij entendemos el adjunto del elemento aij concepto que ya hemos introducido con anterioridad.
Una matriz cuadrada A = (aij ) tiene inversa si y sólo si det(A) 6= 0, verificándose la siguiente igualdad
1
A−1 = Adj(A).
det(A)
Ejemplo. Como ejemplo de que se cumple la expresión anterior, puedes comprobar que
 2   
3 − 16 − 12 1 3 −2
A−1 =  7 3
1
− 3  donde A =  −5 0
6 2 1 .
10 1
3 6 − 52 1 4 −3
2
2.3.4. Forma matricial de un sistema de ecuaciones. Regla de Cramer
Consideremos el siguiente sistema de ecuaciones




a11 X1 + a12 X2 + ... + a1n Xn = b1

a21 X1 + a22 X2 + ... + a2n Xn = b2

 .............................................. ...

am1 X1 + am2 X2 + ... + amn Xn = bm
Según los conceptos y las operaciones introducidas con anterioridad, lo podrı́amos expresar de la siguiente forma:
    
a11 a12 .... a1n X1 b1
 a21 a22 .... a2n   X2   b2 
  = 
 .... ..... .... ....   ...   ... 
am1 am2 .... amn Xn bn
Esta última expresión recibe el nombre de forma matricial del sistema de ecuaciones lineales.
Cuando el sistema está formado por n ecuaciones y n incógnitas y el determinante de la matriz de los coeficientes
del sistema es distinto de cero, entonces se asegura la existencia de matriz inversa y podemos obtener las soluciones
despejando la matriz columna t (X1 X2 . . . Xn ) de la siguiente forma:
   −1  
X1 a11 a12 .... a1n b1
 X2   a21 a22 .... a2n   b2 
     
 ...  =  .... ..... .... ....   ... 
Xn an1 an2 .... ann bn
Esta expresión es lo que básicamente se conoce como regla de Cramer, y los sistemas con el mismo número de
ecuaciones que de incógnitas que cumplen la condición

a11 a12 .... a1n

a21 a22 .... a2n

.... ..... .... .... 6= 0

a .... ann
n1 an2
se denominan sistemas de Cramer. La regla de Cramer estamos acostumbrados a verla de otra forma, que resulta
de efectuar las operaciones matriciales correspondientes. Si llamamos

a11 a12 .... a1n

a21 a22 .... a2n
∆=

.... ..... .... ....
a .... ann
n1 an2
obtendremos las siguientes expresiones:

b1 a12 .... a1n

b2 a22 .... a2n

.... ..... .... ....

bn an2 .... ann
X1 = ,
∆

a11 b1 .... a1n

a21 b2 .... a2n

.... ..... .... ....

an1 bn .... ann
X2 = , ...
∆
132 MATEM ÁTICAS

a11 a12 .... b1

a21 a22 .... b2

.... ..... .... ....

an1 an2 .... bn
Xn =
∆
Observación. Para obtener el valor correspondiente a la incógnita Xi , efectuamos el cociente entre el determinante
de la matriz resultado de sustituir en la matriz de los coeficientes del sistema la columna i-ésima por la columna
de los términos independientes, y el determinante ∆ de la matriz de los coeficientes.
Ejemplos.
(1) El sistema

 3x + 2y − z = 1
2x − y + z = −1

x − 2y + z = 2
es un sistema de Cramer, puesto que la matriz de los coeficientes
 
3 2 −1
A =  2 −1 1 
1 −2 1
tiene por determinante |A| = 4. Aplicando la regla de Cramer se tiene:

1 2 −1 3 1 −1 3 2 1

−1 −1 1 2 −1 1 2 −1 −1

2 −2 1 3 1 2 1 15 1 −2 −2 25
x= = , y= = , z= =−
4 4 4 4 4 4
(2) El sistema homogéneo


 3x + 2y − z = 0
2x − y + z = 0

x − 2y + z = 0
admite sólo la solución trivial x = y = z = 0, ya que la matriz de los coeficientes coincide con la del sistema
anterior y es por tanto un sistema de Cramer.
(3) La regla de Cramer también se puede usar para resolver sistemas de ecuaciones que tengan infinitas soluciones.
Consideremos el siguiente sistema:

 3x + 2y − 5z + 6t = 4
2x + y + 3z − t = 2

x − 3y + 2z + 5t = 0
si pasamos los términos en los que aparece la incógnita t al otro lado del signo igual obtendremos:

 3x + 2y − 5z = 4 − 6t
2x + y + 3z = 2+t

x − 3y + 2z = −5t
Considerando como incógnitas sólo a x, y, z para cada valor de t obtendrı́amos un sistema de Cramer, puesto que

3 2 −5

∆ = 2 1 3 =
6 0
1 −3 2
(Comprueba que es cierto lo que afirmamos). Finalmente obtendrı́amos aplicando la regla de Cramer

4 − 6t 2 −5 3 4 − 6t −5

2+t 1 3 2 2+t 3

−5t −3 2 5 1 −5t 2 3 56
x= = 1 − t, y= = + t,
∆ 3 ∆ 11 33

3 2 4 − 6t

2 1 2 + t

1 −3 −5t 1 29
z= = − + t.
∆ 11 33
Es decir, el conjunto de soluciones viene expresado por

5 3 56 1 29
S = (1 − λ, + λ, − + λ) : λ ∈ R .
3 11 33 11 33
2.4. Espacios vectoriales: base y dimensión
Se han estudiado en los epı́grafes anteriores algunos conjuntos que con las operaciones definidas sobre ellos, en
virtud de las propiedades de las mismas, decı́amos que tienen estructura de espacio vectorial. Recordemos por
ejemplo el conjunto Mm×n (R) que tiene estructura de espacio vectorial sobre R con las operaciones “+” (suma
de matrices) y “.” (producto de un escalar por una matriz). Son numerosos e importantes los ejemplos en álgebra
en los que se puede observar esta estructura (ver bibliografı́a).
Todo lo expresado anteriormente se puede generalizar para un conjunto V , a cuyos elementos le llamaremos
genéricamente vectores, denotándolos por −
→
u ,−
→
v ,−
→
w , .... y con un cuerpo (ver definición en bibliografı́a) genérico
de escalares que denotaremos por K , y a sus elementos con letras griegas λ, µ, ...
Consideramos definidas en V dos operaciones, una interna: − →

u +− →v (suma de dos vectores que da otro vector)
−
→
y otra externa: λ u (producto de un escalar por un vector que da otro vector). Las propiedades verificadas para
todos los vectores de V y todos los escalares de K , que hacen de V con las operaciones anteriormente citadas un
espacio vectorial son las siguientes:
(1) −
→
u +−→v =−→
v +−
→u.
(2) −
→
u + (−
→v +−
→
w) = −
→
u + (−
→
v +−
→
w ).
−→ −→ → −
(3) Existe un elemento de V que denotaremos por 0 (elemento neutro) tal que 0 + −
u =→
u.
−→ −→ −→ −
→ −
→
(4) Para todo vector u existe − u ∈ V (elemento opuesto) tal que u + (− u ) = 0 .
(5) 1.−
→
u =− →
u (1 es el elemento unidad de K).
(6) λ(µ−→
u ) = (λµ)−
→u.
(7) (λ + µ) u = λ u + µ−
−→ −
→ →
u.
(8) λ(−
→
u +−
→
v ) = λ−
→
u + λ−
→
v.
Habitualmente en el caso en que el cuerpo sea el conjunto de los números reales, diremos que V es un espacio
vectorial real.
Ejemplo. El conjunto Rn = {(x1 , x2 , ..., xn ) : xi ∈ R con i = 1, ..., n} con las operaciones:

(1) (x1 , x2 , ..., xn ) + (y1 , y2 , ..., yn ) = (x1 + y1 , x2 + y2 , ..., xn + yn )
(2) λ(x1 , x2 , ..., xn ) = (λx1 , λx2 , ..., λxn )
es un espacio vectorial sobre R (Compruébalo). 2
134 MATEM ÁTICAS
2.4.1. Vectores y ecuaciones lineales
Dos importantes conceptos relativos a vectores, las combinaciones lineales y la dependencia lineal, están estre-
chamente relacionadas con los sistemas de ecuaciones lineales.
Combinación lineal. Un vector − →v es combinación lineal de los vectores −

v→ −
→ −
→
1 , v2 , ..., vn si existen escalares
−→ −→ −→ −
→
λ1 , λ2 , ..., λn tales que v = λ1 v1 + λ2 v2 + ... + λn vn .
Dependencia lineal. Los vectores − v→ −
→ −
→
1 , v2 , ..., vn se dice que son linealmente dependientes si existe alguna com-
−→ −→ −→ −→
binación lineal λ1 v1 +λ2 v2 +...+λn vn = 0 , en la que alguno de los coeficientes escalares λi es distinto
de 0. En el caso en que esto no sea posible los vectores se dicen linealmente independientes.
Consideremos el siguiente sistema homogéneo de m ecuaciones con n incógnitas:


 a11 X1 + a12 X2 + · · · + a1n Xn = 0


a21 X1 + a22 X2 + · · · + a2n Xn = 0
 ...............................................
 ...

am1 X1 + am2 X2 + · · · + amn Xn = 0
Este sistema se puede plantear equivalentemente por la siguiente ecuación vectorial:

       
a11 a12 a1n 0
 a21   a22   a2n   0 
       
 ...  X1 +  ...  X2 + · · · +  ...  Xn =  ... 
am1 am2 amn 0
Esto es,
 
a1i
→ − →  a2i 
X1 −
v→ −→ −
1 + X2 v2 + · · · + Xn vn = 0 , donde −
→
vi =  
 ...  , i = 1, ..., n.
ami
Después de los conceptos introducidos anteriormente te proponemos que contestes a las siguientes preguntas.
¿Cómo son los vectores −
v→ −
→ −
→
1 , v2 , ..., vn si el sistema homogéneo tiene alguna solución no nula? ¿Y si tiene sólo la
solución nula?
2.4.2. Subespacios vectoriales
Dado un espacio vectorial V sobre un cuerpo K decimos que un subconjunto S ⊂ V es un subespacio vectorial,
cuando tiene estructura de espacio vectorial con las operaciones que están definidas en V . Se puede demostrar
que S ⊂ V es un subespacio vectorial si y sólo si para cualquier par de vectores −
→
u ,−
→
v ∈ S y escalares λ, µ ∈ K
−
→ −
→
se tiene λ u + µ v ∈ S.
2.4.3. Subespacio engendrado por un conjunto de vectores. Sistema de generadores. Bases y dimensión de
un espacio vectorial
Sea G = {− v→ −
→ −
→
1 , v2 , ..., vn } una colección de vectores de un espacio vectorial V sobre un cuerpo K . Llamaremos
subespacio engendrado por G y lo denotaremos por L(G) al conjunto de todas las combinaciones lineales de
vectores de G. Es decir, L(G) = { λ1 − v→ −
→ −
→
1 + λ2 v 2 + · · · + λn vn | λ1 , λ2 , ..., λn ∈ K }
Se dice que G es un sistema de vectores generadores de V si L(G) = V .
Observación. Son especialmente importantes los casos de los espacios vectoriales formados por los vectores
libres del plano R2 y del espacio R3 , por la interpretación gráfica que los conceptos introducidos anteriormente
sugieren. Conceptos que seguro te son familiares, pero es fundamental que los recuerdes ahora, consultando si es
necesario la bibliografı́a recomendada.
En ocasiones es posible eliminar un vector de un sistema generador sin que el subespacio generado se altere. Pero
el vector que eliminemos no puede ser uno cualquiera, sino alguno que se pueda expresar como combinación lineal
de los restantes. La idea de quedarnos con el menor número de generadores posible de todo el espacio vectorial
es la que nos lleva a introducir el concepto de base.
Un sistema de vectores generadores y linealmente independientes de un espacio vectorial recibe el nombre de

base. Se puede demostrar que en todo espacio vectorial existe una base.
En el espacio vectorial Rn existe una base que distinguimos de las demás y que llamaremos base canónica,
formada por los vectores
−e→ = (1, 0, 0, ..., 0)
1
−e→ = (0, 1, 0, ..., 0)
2
... .....................
−
e→ = (0, 0, ..., 0, 1)
n
Puedes comprobar que efectivamente se trata de un sistema de vectores linealmente independientes y generadores.
Ejemplo. Los vectores −v→ −

→ −→ 3
1 = (1, 1, 1), v2 = (1, 1, 0) y v3 = (1, 0, 0) forman una base de R . No sucede lo
−→
−
→ −
→ −
→ −→ −→ −
→
mismo con los vectores u1 = (1, 1, 1), u2 = (2, −1, 3), u3 = (1, −5, 3) ya que 3 u1 − 2 u2 + u3 = 0 . 2
En un espacio vectorial dado V , todas las bases tienen el mismo número de elementos, a ese número se le llama
dimensión del espacio vectorial, la denotaremos por dim V .
Observaciones.
• Después de lo visto anteriormente queda demostrado que la dimensión del espacio vectorial Rn es n.
• Observa que en Rn (en general en cualquier espacio vectorial de dimensión n) n vectores lineamente inde-
pendientes forman una base. Análogamente sucede con n vectores generadores. Nunca puede haber más de n
vectores linealmente independientes ni menos de n vectores generadores.
• Aunque la dimensión de Rn está clara, es muy importante para nosotros establecer algún método que nos pueda
dar la dimensión de los subespacios generados por vectores de Rn . Supongamos que tenemos el siguiente sistema
de vectores de R4 :
→ = (1, 0, 2, 3), −
−
u → = (2, 1, 4, 0), −
u → = (3, 1, −1, 2), −
u → = (−1, 1, −16, −11)
u
1 2 3 4
Queremos calcular dim L({− →, −

u → − → − →
1 u2 , u3 , u4 }). La dimensión de este subespacio será la misma, si sustituimos en
el sistema de vectores generadores, cualquier vector por una combinación lineal de los vectores generadores en
la que necesariamente aparezca él. Esto se traduce en que podemos hacer operaciones elementales (las que ya
hacı́amos con el método de Gauss y para la resolución de los determinantes) sin que la dimensión varı́e. Es decir,
en nuestro caso particular, poniendo las coordenadas de los vectores como filas de una matriz obtenemos:
 −
→   
u 1 1 0 2 3
−
→
 u2   2 1 4 0 
 =  =⇒
 −
→
u 3
  3 1 −1 2 
−
→
u −1 1 −16 −11
4
 −
→   
u 1 1 0 2 3
 −
→ −
→ −→  
−6 
0
 u 2 = u 2 − 2 u1   0 1 0  =⇒
 −
→ −
→ −→ =
−7 
0
 u3 = u3 − 3 u 1  0 1 −7
−
→ 0
−
→ −
→
u4 = u4 + u 1 0 1 −16 −8
136 MATEM ÁTICAS
   
−
→
u 1 0 2 3
1
 −
→ 0   0 1 0 −6 
 u2   
 −
→0 =
 u
3  0 0 −7 1 
−
→0 − 2−
u →0
u 0 0 0 0
4 3
Como vemos, se puede deducir fácilmente que la dimensión del subespacio es

→, −
dim L({−
u → − → − → −→ − →0 − →0 − →0 −→0
1 u2 , u 3 , u4 }) = dim L({ u1 , u2 , u3 , u4 − 2 u3 }) = 3.
2.4.4. Rango de una matriz. Teorema de Rouché-Frobenius
Consideremos la matriz A = (aij ) ∈ Mm×n (R); en ella podemos distinguir m vectores filas pertenecientes a
Rn y n vectores columna pertenecientes a Rm . Denotemos por Fi , i = 1, 2, ...., m a los vectores fila y por Cj ,
j = 1, 2, ..., n los vectores columna. Enunciamos a continuación un resultado fundamental que hace posible la
definición del concepto de rango de la matriz A.
Dada la matriz A anteriormente introducida, se tiene que dim L(F1 , F2 , ..., Fm ) = dim L(C1 , C2 , ..., Cn ) y a este
número se le denomina rango de la matriz A, denotándose por r(A).
Ejemplo. Puede comprobarse que la matriz

 
1 2 −1 1
A =  2 −1 1 −2 
0 5 −3 4
tiene rango r(A) = 2. 2
2.4.5. Una método para calcular el rango: los orlados
Es importante que recuerdes el siguiente método práctico para calcular el rango de una matriz, llamado a veces
método de los orlados. Dada la matriz A = (aij ) ∈ Mm×n (R), consideramos en ella un menor Mk de orden k.
Llamaremos orlado de Mk con la columna i y la fila j al determinante obtenido añadiendo a Mk los elementos
de la fila j que corresponden en la matriz A a las columnas de Mk y añadiendo también a su vez los elementos
de la columna i que corresponden a las filas de Mk y el elemento aji , conservando siempre el orden original que
tienen todos los elementos mencionados en la matriz A. Por ejemplo, para la matriz
 
1 2 −1 1
A =  2 −1 1 −2 
0 5 −3 4
y dado el menor de orden 2

1 2
M2 = ,

2 −1
el orlado de M2 con la fila 3 y la columna 4 es el determinante

1 2 1

2 −1 −2 .

0 5 4
El método de los orlados consiste en lo siguiente:

• Tomamos en A un elemento no nulo (menor M1 de orden 1).
• Se calculan los orlados de M1 hasta que obtengamos uno que sea distinto de cero. (Si todos los orlados
valen cero se tiene que r(A) = 1).
• A partir de este momento sabemos que r(A) > 2. Procedemos como antes orlando este menor de orden 2
hasta que obtengamos uno que sea distinto de cero (Si todos los orlados valen cero se tiene r(A) = 2).
• A partir de este momento sabemos que r(A) > 3. Procedemos como antes orlando este menor de orden 3
hasta que obtengamos uno que sea distinto de cero (Si todos los orlados valen cero se tiene r(A) = 3).
• Ası́ sucesivamente hasta obtener el rango de la matriz A.
También es conveniente que repases las justificaciones teóricas de este método, pudiéndolas encontrar en cualquier
libro de matemáticas generales (ver bibliografı́a recomendada).
2.4.5.1. Teorema de Rouché-Frobenius
Consideremos el siguiente sistema de ecuaciones lineales



a11 X1 + a12 X2 + ... + a1n Xn = b1

a21 X1 + a22 X2 + ... + a2n Xn = b2

 .............................................. ...

am1 X1 + am2 X2 + ... + amn Xn = bm
La condición necesaria y suficiente para que tenga soluciones (sea compatible) es que el rango de la matriz de los
coeficientes A coincida con el rango de la matriz ampliada A∗ .
Una de las principales aplicaciones de este teorema es la discusión de un sistema de ecuaciones lineales en función
de uno o varios parámetros. Por ejemplo, consideremos el siguiente sistema de ecuaciones lineales y discutamos
según los valores de m.

 (m + 2)x + y + z = m−1
mx + (m − 1)y + z = m − 1

(m + 1)x + (m + 1)z = m − 1
Denotamos por M la matriz de los coeficientes del sistema y por M ∗ la matriz ampliada, es decir:
   
m+2 1 1 m+2 1 1 m−1
M = m m−1 1  y M∗ =  m m−1 1 m−1 
m+1 0 m+1 m+1 0 m+1 m−1
El sistema es compatible ⇐⇒ r(M ) = r(M ∗ ). Además det(M ) = m(m + 1)(m − 1) obteniéndose lo siguiente:
Si m 6= 0 y m 6= 1 y m 6= −1 ⇒ rango(M ) = 3 = rango(M ∗ ) y el sistema es compatible y determinado. (Se

deja al lector continuar con la discusión del sistema, examinando qué sucede con los rangos r(M ) , r(M ∗ ) en los
demás casos).
138 MATEM ÁTICAS
2.5. Valores y vectores propios de una matriz
Consideremos la matriz  
a11 a12 ... a1n
 a21 a22 ... a2n 
A=
 .....
,
..... ... ..... 
an1 an2 ... ann
entonces la matriz  
t − a11 −a12 ... −a1n
 −a21 t − a22 ... −a2n 
tIn − A = 
 .....


..... ... .....
−an1 −an2 ... t − ann
se denomina matriz caracterı́stica de A. Su determinante
∆A (t) = det(tIn − A)
lo denominaremos polinomio caracterı́stico.
Se tiene que
∆A (t) = tn − (a11 + a22 + ... + ann )tn−1 + pn−2 tn−2 + · · · + p1 t + (−1)n det(A).
Teorema de Cayley-Hamilton. Toda matriz es un cero de su polinomio caracterı́stico.
Ejemplo. Sea la matriz

1 2
A= ,
5 4
entonces se tiene ∆A (t) = t2 − 5t − 6. Puedes comprobar que efectivamente se cumple

0 0
A2 − 5A − 6I2 = .
0 0
2
Dos matrices cuadradas de orden n se dicen semejantes cuando existe una matriz no singular (que tiene inversa)
P tal que B = P −1 AP .
Propiedad. Dos matrices semejantes tienen el mismo polinomio caracterı́stico.
Veamos explı́citamente el polinomio caracterı́stico para una matriz de orden 2 y 3. Si n = 2 entonces:

a11 a12
2
∆A (t) = t − (a11 + a22 )t +
a21 a22
mientras que si n = 3 se satisface:

a11 a12 a13

∆A (t) = t3 − (a11 + a22 + a33 )t2 + (M11 + M22 + M33 )t − a21 a22 a23

a a32 a33
31
donde por Mij notamos el menor del elemento de la fila i y la columna j.
Para la matriz genérica A = (aij ) un escalar λ se denomina valor propio, si existe un vector (columna) no nulo −
→
v
−
→ −→
para el que A v = λ v . Todo vector que satisfaga ésta relación se denomina vector propio de A perteneciente al
valor propio λ. Es fácil ver que cada múltiplo k−

→
v de un vector propio es a su vez otro vector propio. El conjunto
Eλ de todos los vectores propios pertenecientes a λ es un subespacio de Rn , que se denomina espacio propio de
λ.
Propiedad. Sea A ∈ Mn (R). Los siguientes enunciados son equivalentes:

(a) λ es un valor propio de A.
(b) La matriz caracterı́stica tIn − A es no singular.
(c) λ es una raı́z de ∆A (t).
−→ − → −→
El espacio propio Eλ será el espacio solución del sistema homogéneo (λIn − A) X = 0 o bien (A − λIn ) X =
−
→
0.
Llamaremos multiplicidad algebraica del valor propio λ a la multiplicidad de λ como raı́z del polinomio carac-
terı́stico y denominaremos multiplicidad geométrica de λ a la dimensión de Eλ .
Propiedad. La multiplicidad geométrica de un valor propio es siempre menor o igual que la multiplicidad alge-
braica.
2.6. Diagonalización y formas canónicas de matrices
Diremos que una matriz A es diagonalizable si existe una matriz no singular P tal que D = P −1 AP , siendo D
una matriz diagonal.
Propiedad. Una matriz de orden n es diagonalizable si y sólo si tiene n vectores propios linealmente indepen-
dientes y en ese caso los elementos diagonales de D son los valores propios correspondientes, teniéndose además
que D = P −1 AP , donde P es la matriz cuyas columnas son los vectores propios. En particular esto se cumple
cuando tiene n valores propios diferentes.
Ejemplo. Sea la matriz

 
4 1 1
A= 2 5 −2  ,
1 1 −2
entonces se tiene que
∆A (t) = det(tI3 − A) = t3 − 11t2 + 39t − 45 = (t − 3)2 (t − 5).
Los valores propios soluciones de la ecuación caracterı́stica
t3 − 11t2 + 39t − 45 = 0
son λ1 = 3 y λ2 = 5. Para cada valor propio calculamos las ecuaciones del subespacio propio como sigue:
    
1 1 −1 x 0
Eλ1 :  2 2 −2   y  =  0  ,
1 1 −1 z 0
es decir, x + y − z = 0, de donde obtenemos dos vectores propios linealmente independientes

−
→
u = (1, −1, 0) y −
→v = (1, 0, 1).
    
−1 1 −1 x 0
Eλ2 :  2 0 −2   y  =  0  ,
1 1 −3 z 0
140 MATEM ÁTICAS
es decir, 
 −x + y − z = 0
x−z = 0
2x − 2z = 0 ⇒
 y − 2z = 0
x + y − 3z = 0
de donde obtenemos el vector propio
−
→
w = (1, 2, 1).
La matriz A es, por tanto, diagonalizable, ya que tiene tres vectores propios linealmente independientes, obte-
niéndose    
1 1 1 3 0 0
P =  −1 0 2  y P −1 AP =  0 3 0  .
0 1 1 0 0 5
2
2.6.1. Potencia n-ésima de una matriz diagonalizable
Si A es una matriz diagonalizable con P −1 AP = D , despejando tenemos que A = P DP −1 . Si queremos

calcular A2 = (P DP −1 )(P DP −1 ) = P D2 P −1 . Algo parecido ocurre con A3 = A2 A = P D2 P −1 P DP −1 =
P D3 P −1 . Razonando por inducción se tiene que An = P Dn P −1 , con la enorme ventaja que supone el reducir
el problema al cálculo de la potencia n-ésima de una matriz diagonal, que como sabemos se calcula elevando a n
todos los elementos de la diagonal principal.
Como ejemplificación de lo anteriormente expuesto vamos a calcular An con

 
4 1 1
A= 2 5 −2  .
1 1 −2
Para ello tendremos que calcular la matriz inversa de

 
1 1 1
P =  −1 0 2 ,
0 1 1
obteniendo que está dada por

 
1 0 −1
P −1 =  − 12 − 12 3
2

1 1
2 2 − 12
y por tanto
  n  
1 1 1 3 0 0 1 0 −1
An = P Dn P −1 =  −1 0 2  0 3n 0   − 12 − 12 3
2
.
1 1 1
0 1 1 0 0 5 n
2 2 −2
2.6.2. Formas canónicas de matrices
Llamaremos matriz elemental de Jordan de orden k y valor propio λ a la matriz Jk (λ) de orden k cuyos
elementos son todos cero menos los de la diagonal principal que son iguales a λ y los que están inmediatamente
por encima de la diagonal principal que son iguales a 1. Es decir,
J1 (λ) = (λ),

λ 1
J2 (λ) = ,
0 λ
 
λ 1 0
J3 (λ) =  0 λ 1  ,
0 0 λ
 
λ 1 0 0
 0 λ 1 0 
J4 (λ) = 
 0 0 λ 1 ,

0 0 0 λ
··· = ···
Se llama matriz de Jordan a la matriz que se forma yuxtaponiendo matrices elementales Jordan a lo largo de la
diagonal principal, y ceros en el resto, es decir a una matriz del estilo
 
Jk1 (λ1 ) 0
 Jk2 (λ2 ) 
 
 .. 
 . 
0 Jkr (λr )
Propiedad. Toda matriz cuadrada es semejante a una matriz de Jordan (real o compleja), que se determina de
forma única salvo permutaciones de los bloques diagonales de matrices elementales Jordan que la forman.
En lo que sigue vamos a obtener las formas canónicas de Jordan para matrices de órdenes 2 y 3.
Consideremos n = 2, sabemos que si A tiene dos valores propios λ1 y λ2 distintos, entonces es diagonalizable.
El caso interesante lo tenemos cuando λ1 = λ2 .
Ejemplo. Vamos a calcular la forma de Jordan de la matriz

0 2
A= .
−2 4
Primero obtenemos ∆A (t) = λ2 − 1 = 0, y de aquı́ λ1 = λ2 = 2. Puedes comprobar que Eλ1 viene expresado
por las ecuaciones x = y. Es decir estarı́a generado por el vector −→
u = (1, 1). La matriz A no es por tanto
2
diagonalizable. Obsérvese que (A − λ1 I2 ) = 0 siempre que se tengan dos valores propios iguales.
Cogemos ahora un vector del plano que no esté en Eλ1 , por ejemplo − →
v = (1, 0), ya que se puede comprobar
fácilmente que
−2 2 −2 −
→
=−→
1 1
(A − λ1 I2 ) = = w 6= 0 .
0 −2 2 0 −2
La matriz P de cambio de base que conduce a la forma canónica se construye tomando los vectores −
→
w y−
→
v como
columnas respectivas (en este orden), es decir,

−2 1
P =
−2 0
y ası́ se puede comprobar fácilmente que

−1
2 1 −2 1 0 2 −2 1
= .
0 2 −2 0 −2 4 −2 0
142 MATEM ÁTICAS
2
Consideremos ahora el caso n = 3; al igual que en el caso de orden 2, la reflexión que requiere nuestro interés la
encontramos cuando la matriz A no es diagonalizable.
Ejemplo. Vamos a calcular la forma canónica de Jordan de la matriz

 
0 3 1
A =  2 −1 −1  .
−2 −1 −1
Se tiene que
∆A (t) = −λ3 − 2λ2 + 4λ + 8 = 0,
y de aquı́ los valores propios son:
λ1 = 2 (simple) y λ2 = −2 (doble)
Procediendo como en el ejemplo anterior obtenemos

2x − 3y − z = 0
E λ1 : ,
−4y − 4z = 0
subespacio de dimensión 1, del que podemos extraer al vector

−
→ = (1, 1, −1)
u 1
como base del mismo. Por otro lado

2x + 3y + z = 0
E λ2 :
−2y − 2z = 0
y de aquı́ observamos que −

→
v = (1, −1, 1) serı́a una base del mismo. Es claro que la matriz no es diagonalizable,
ya que no podemos obtener una base de todo el espacio. Para obtener la forma de Jordan procedemos como sigue.
Probamos con  
 
x 0
Eλ0 2 : (A + 2I3 )2  y  =  0  ,
z 0
es decir     
8 8 0 x 0
 8 8 0   y  =  0  =⇒ x + y = 0,
−8 −8 0 z 0
que es un subespacio de dimensión 2, con base
−
v→ −
v→
1 = (1, −1, 0) y 2 = (0, 0, 1).
Como Eλ1 y Eλ0 2 llenan todo el espacio, podemos elegir ahora una base de manera conveniente para obtener la
matriz de Jordan. La forma de elegirla es la siguiente:
(1) Cogemos un vector de Eλ0 2 que no esté en Eλ2 , por ejemplo −

→ = (0, 0, 1)
u 3
 
 
0 1
(2) Se coge −
→ = (A + 2I )  0  =  −1 
u 2 3
1 1
(3) La base formada por los vectores {−→, −

u → − →
1 u2 , u3 } es la que posibilita el cambio de base para obtener la matriz
de Jordan. En otras palabras las columnas de la matriz P son las coordenadas de los vectores − →, −
u → − →
1 u2 , u3 ,
obteniéndose
   −1   
2 0 0 1 1 0 0 3 1 1 1 0
 0 −2 1  =  1 −1 0   2 −1 −1   1 −1 0  .
0 0 −2 −1 1 1 −2 −1 −1 −1 1 1
2.6.3. Potencia n-ésima de una matriz usando la forma canónica de Jordan
De forma análoga a como razonábamos para calcular la potencia n-ésima de una matriz diagonalizable, se puede
ahora trabajar con una matriz que sea semejante a una forma canónica de Jordan. La idea es la misma, An =
P J n P −1 , donde J indica la forma canónica de Jordan a la que reducimos la matriz A.
Para calcular An en el ejemplo anterior se procederı́a como sigue:

 n   n  −1
0 3 1 1 1 0 2 0 0 1 1 0
 2 −1 −1  =  1 −1 0   0 −2 1   1 −1 0 
−2 −1 −1 −1 1 1 0 0 −2 −1 1 1
Dejamos para el lector la obtención final de la expresión

 n
2 0 0
 0 −2 1  ,
0 0 −2
teniendo en cuenta para ello que basta con calcular la potencia n-ésima de cada uno de los bloques diagonales, es
n
−2 1
decir, 2n y , poniendo ceros en el resto.
0 −2
2.7. Los espacios euclı́deos R2 y R3 . Producto escalar. Normas y distancias.
La posibilidad de medir longitudes de segmentos y ángulos no se da en un espacio vectorial genérico. Para

introducir estos conceptos (longitud de un vector, ángulo entre dos vectores,. . . ) se debe dar la definición de un
producto escalar (una regla que asocie a cada par de vectores un escalar y que cumpla un serie de propiedades).
Más concretemente precisamos a continuación la definición genérica de espacio euclı́deo.
Un espacio vectorial real V se dice euclı́deo si hay una regla que asigne a cada par de vectores −
→
u ,−
→
v ∈ V un
−
→ −
→ −
→ −→
número real llamado producto escalar de los vectores u y v , que denotaremos por ( u , v ) (también a veces
por −
→
u .−→v ), de manera que se cumplan las siguientes propiedades:
• Simétrica: (−
→
u ,−
→
v ) = (−
→
v ,−
→
u ) para todo −
→
u ,−
→
v ∈ V.
• Distributiva: (−
→
u , (−
→
v +−
→
w )) = (−
→
u ,−
→
v ) + (−
→
u ,−
→
w ) para todo −
→
u ,−
→
v ,−
→
w ∈ V.
• (λ−
→
u ,−
→
v ) = λ(−
→
u ,−
→
v ) para todo −
→
u ,−
→
v ∈ V y para todo λ ∈ R.
144 MATEM ÁTICAS
• (−
→
u ,−
→
u ) > 0 para todo −
→
u ∈ V, −
→ 6 0
u =
Ejemplos.
(1) Rn se puede dotar del siguiente producto escalar (puedes comprobar las propiedades):
(x1 , x2 , ..., xn ).(y1 , y2 , ..., yn)= x1 y1 + x2 y2 + .... + xn yn
(2) En Rn también se pueden definir otros productos escalares. Por ejemplo, en R2 definimos

1 1
(x1 , x2 ).(y1 , y2 ) = (x1 , x2 ) (y1 , y2 ).
1 2
Comprueba que cumple todas las propiedades del producto escalar.
En V3 (espacio vectorial real de los vectores libres de R3 ) también podemos definir un producto escalar de la
siguiente manera: Si consideramos − →u = (u1 , u2 , u3) y −
→
v = (v1 , v2 , v3 ) expresiones de los vectores −
→
u y−
→
v en
la base canónica de V3 , definimos el producto escalar de esos dos vectores como
−
→
u .−
→
v = u1 v1 + u2 v2 + u3 v3 .
La norma o longitud de un vector − →

u en un espacio euclı́deo de define como
√
k−uk= −
→ →
u .−→
u.
√→ −
(Obsérvese que − u .→u tiene sentido debido a la propiedad cuarta del producto escalar). Si consideramos −
→
u =
−→ −
→ −→
u1 e1 + u2 e2 + u3 e3 la expresión del vector en la base canónica, entonces
q
k−→u k = u21 + u22 + u23 .
El ángulo que forman dos vectores −

→ v ∈ V3 está determinado por cos(−
u ,−
→ →
u ,−
→ −
→u .−
→
v
v)= |−
→
u ||−
→v|
.
En particular, dos vectores ortogonales −

→
u y−
→
v (forman un ángulo de 90o ) se caracterizan por la condición nece-
−→ −
→
saria y suficiente u . v = 0.
Ejemplo. Dados los vectores −

→u = (−1, 2, p) y −→v = (4, p, −3), ¿qué valor tendrı́a que tener el parámetro p para
que fueran ortogonales? Parece claro que según lo dicho anteriormente la condición es que −→u .−→
v = 0 y de aquı́
deducimos que deber ser p = −4. 2
2.7.1. Sistemas de vectores ortogonales y ortonormales
Un conjunto S de vectores de V3 se dice ortogonal si cualquier vector de S es ortogonal a todos los demás vectores
del conjunto.
Por ejemplo, los vectores −

→
u = (2, 1, −1), −
→
v = (−1, 4, 2) y −
→
w = (2, −1, 3) forman un sistema ortogonal.
Una propiedad muy importante para este tipo de conjuntos es la siguiente: “Sean −
→
u ,−
→
v y−
→
w vectores no nulos
ortogonales de V3 , entonces son linealmente independientes”.
Un conjunto ortogonal de vectores S se dice que es ortonormal cuando todos los vectores del conjunto tienen
norma igual a 1.
Especial importancia tienen las llamadas bases ortonormales de V3 en las cuestiones relativas a curvas en R3 ,
que desarrollaremos posteriormente en el Capı́tulo 6.
Distancia entre dos puntos. Dados dos puntos de R3 , A(a1 , a2 , a3 ) y B(b1 , b2 , b3 ), se define la distancia entre
−→
ellos como la norma del vector AB, es decir,
−→ p

d(A, B) = AB = (b1 − a1 )2 + (b2 − a2 )2 + (b3 − a3 )2
−→
ya que AB = (b1 − a1 , b2 − a2 , b3 − a3 ).
Ejemplo. Como un sencillo ejercicio de la definición de distancia entre dos puntos, puedes comprobar que el
triángulo ABC, con A(3, −1, 2), B(0, −4, 2) y C(−3, 2, 1) es isósceles. 2
2.8. Producto vectorial y producto mixto (o triple)
Sean − →
u ,−
→v ∈ V3 . Se llama producto vectorial de −
→
u y−
→
v y lo denotaremos por −
→
u ×−
→
v al vector libre que tiene
las siguientes propiedades:
(1) |−
→
u ×−
→
v | = |−
→
u | |−
→
v | sen(−
→
u ,−
→
v)
(2) La dirección del vector −
→
u ×−
→
v es la perpendicular a las direcciones de los vectores −
→
u y−
→
v.
(3) El sentido del vector −
→
u ×− →
v es el indicado por la siguiente regla práctica: colocamos la mano derecha
con el dedo “corazón” en posición perpendicular a los dedos “pulgar” e “ı́ndice”, de tal forma que el dedo
“pulgar” indique el sentido del vector −→
u y el dedo “ı́ndice” indique el sentido del vector −→v . Entonces el
−→ −
→
dedo “corazón” indica el sentido del vector u × v .
Figura 5.1: Regla del sacacorchos para determinar el sentido del producto vectorial.
2.8.1. Propiedades del producto vectorial
(1) −
→
u ×−
→
v = −(−
→
v ×−
→
u ).
−→
(2) Si −
→
u y−
→
v tienen la misma dirección entonces −
→
u ×−
→
v = 0.
(3) λ−
→u ×−
→v = λ(−
→u ×−→
v ).
−
→ −
→ −
→ −→
u × λ v = λ( u × v ).
(4) −
→
u × (−
→
v +−
→
w) = −
→
u ×−
→
v +−
→
u ×−
→
w.
146 MATEM ÁTICAS
2.8.2. Área de un paralelogramo
−→ −→
Consideremos el paralelogramo formado por los puntos A, B, C, D ∈ R3 , de forma que AB y DC son paralelos y
−→ −→ −→
representantes del mismo vector libre u , y análogamente BC y AD son paralelos y representan al mismo vector
libre −
→
v . En estas condiciones no es demasiado complicado demostrar (ver bibliografı́a recomendada) que el área
del paralelogramo viene expresada por |− →
u ×− →v |.
A C
α
0 B
Figura 5.2: El producto vectorial de los vectores OA y OB permite obtener el área del paralelogramo OBCA.
2.8.3. Expresión del producto vectorial en coordenadas cartesianas
Dados los vectores −→

u ,−
→v ∈ V3 , con coordenadas en la base canónica − →
u = (u1 , u2 , u3 ) y −
→
v = (v1 , v2 , v3 ) ,
−
→ −
→
las coordenadas en esa misma base del vector u × v vienen expresadas por el desarrollo formal del siguiente
determinante, en donde −
e→ −
→ − →
1 , e2 , e3 representan a los vectores de la base canónica de V3 :
−
e→1
−
e→
2
−
e→
3
−
→ −
→ u2 u 3 u1 u3 u1 u2

u × v = u1 u2 u3 = ,− ,
v v2 v3 v1 v3 v1 v2
1 v2 v3
Ejemplo. Si −
→
u = (2, −1, 3) y −
→
v = (1, 3, 5), entonces −
→
u ×−
→
v = (−14, −7, 7). 2
Sean −
→
u ,−
→
v ,−
→
w ∈ V3 , definimos el producto mixto como la siguiente expresión:
[−
→
u ,−
→
v ,−
→
w] = −
→
u .(−
→
v ×−
→
w)
Dados los vectores −

→u ,− →
v y− w ∈ V3 , con coordenadas en la base canónica −
→ →
u = (u1 , u2 , u3 ), −
→
v = (v1 , v2 , v3 )
−
→
y w = (w1 , w2 , w3 ) el valor del producto mixto de los tres vectores viene expresado por:

u1 u2 u3
−
→
u .(−
→v ×− →
w ) = v1 v2 v3
w w w
1 2 3
2.8.4. Propiedades del producto mixto
Si −
→
u ,−
→
v y−
→
w son tres vectores de V3 y λ ∈ R, se tiene:
(1) [−
→
u ,−
→
v ,−
→
w ] = [−
→
w,−
→
u ,−
→
v ] = [−
→
v ,−
→
w,−
→
u ] = −[−
→
u ,−
→
w,−
→
v ] = −[−
→
w,−
→
v ,−
→
u ].
−→
(2) λ[−
→
u ,−
→
v ,−
→
w ] = [λ−
→
u ,−
→
v ,−
→
w ] = [−
→
u , λ−
→
v ,−
→
w ] = [−
→
u ,−
→
v , λw].
→+−
(3) [−
u 1
→, −
u → − → −→ − → − → −→ − → − →
2 v , w ] = [ u1 , v , w ] + [ u2 , v , w ] , cumpliéndose también la propiedad distributiva para las
otras dos variables.
(4) [−
→
u ,−
→
v ,−
→
w ] = 0 si y sólo si los vectores −
→
u ,−
→
v y−
→
w son linealmente independientes.
2.8.5. Volumen de un paralepı́pedo
Tres vectores de V3 linealmente independientes −→

u ,−
→
v y− →
w determinan un paralepı́pedo de vértices O, A, B,
−→ −→ −→ −→
C, D, E, F , G, de forma que OA, CF , ED y CF son vectores que representen a la clase del vector libre − →u.
−→ −→ −→ −−→ −→ −→ −→ −→ −→ −
→
Análogamente OC, AF , GD, BE para v y OB, AG, F D, CE para w . En estas condiciones se puede probar
que [−
→u ,−
→
v ,−
→w ] determina el volumen del mencionado paralepı́pedo.
0 A
Figura 5.3: El producto mixto de OA, OB y OC permite hallar el volumen del paralelepı́pedo que determinan.
2.9. Cónicas en R2 y cuádricas en R3
Un doble cono recto es la figura que genera una recta r al girar alrededor de otra recta s que la corta. La recta s se
denomina eje del cono, y las distintas posiciones de r generatrices del cono. El punto de intersección del eje con
las generatrices se denomina vértice del cono (ver Figura 5.4).
Toda figura que se obtiene como intersección de un doble cono recto y un plano se denomina cónica.
Según las distintas posiciones del plano las cónicas se llaman de forma diferente:
• Si el plano es perpendicular al eje del cono y no pasa por el vértice, obtenemos una circunferencia. Si el
plano pasa por el vértice se obtiene un punto.
• Si el plano no es perpendicular al eje del cono y forman entre ellos un ángulo superior al que forman el eje
del cono con cualquiera de las generatrices, obtenemos una elipse. Si el plano pasa por el vértice se obtiene
un punto (ver Figura 5.5).
• Si el plano es paralelo a alguna de las generatrices obtenemos una parábola, excepto cuando el plano pasa
por el vértice que en cuyo caso se obtiene una recta (ver Figura 5.6).
148 MATEM ÁTICAS
Figura 5.4: Doble cono cuyo vértice está situado en el origen de coordenadas.
• Cuando el ángulo que forman el plano y el eje es inferior al que forma el eje y las generatrices, obtenemos
una hipérbola, excepto cuando el plano pasa por el vértice que obtendremos dos rectas que se cortan (ver
Figura 5.7).
Los casos excepcionales que aparecen descritos con anterioridad se llaman cónicas degeneradas.
2.9.1. Ecuación general de una cónica
Una ecuación de la forma

Ax2 + By 2 + Cxy + Dx + Ey + F = 0
donde A, B, C, D, E, F ∈ R se denomina ecuación general de una cónica.
Todas las secciones cónicas anteriormente descritas verifican formas particulares de esta ecuación. Recı́procamente
la ecuación describe, salvo algunos casos particulares, sólo secciones cónicas.
Si la escribimos en la forma a11 x2 + 2a12 xy + a22 y 2 + 2a1 x + 2a2 y + a0 = 0 tiene la ventaja de poder encontrar
fácilmente la siguiente forma matricial de la ecuación:
  
a11 a12 a1 x
x y 1  a12 a22 a2   y  = 0
a1 a2 a0 1
Figura 5.5: Una elipse como intersección de un cono y un plano.
Figura 5.6: Una parábola como intersección de un cono y un plano.
La matriz  
a11 a12 a1
 a12 a22 a2 
a1 a2 a0
se denomina matriz asociada a la cónica.
Ejemplo. La ecuación 2x2 + 2y 2 − 4x + 6y + 3 = 0 expresada en forma matricial como

  
2 0 −2 x
x y 1  0 2 3   y  = 0,
−2 3 3 1
√
representa una circunferencia de centro C(1, − 23 ) y radio R = 2
7
2
150 MATEM ÁTICAS
Figura 5.7: Una hipérbola como intersección de un cono y un plano.
2.9.2. Cuádricas en R3
Por rotación en torno a un eje de las secciones cónicas circunferencia, elipse, parábola e hipérbola se obtienen
superficies de revolución en R3 , llamadas respectivamente superficie esférica, elipsoide, paraboloide e hiperbo-
loide.
Eligiendo de forma adecuada los ejes coordenados las ecuaciones de las mencionadas superficies satisfacen ecua-
ciones bastante sencillas:
Esfera: x2 + y 2 + z 2 = R2 .
x2 y2 z2
Elipsoide: 2
+ 2 + 2 = 1.
a b c
Figura 5.8: Un elipsoide en R 3 .
Paraboloide: x2 + y 2 = a2 z.
x2 y2 z2
Hiperboloide de una hoja: + − = 1.
a2 b2 c2
Figura 5.9: Un paraboloide en R 3 .
Sin embargo la situación cambia considerablemente si se somete la superficie a un movimiento (traslación, giro,...)
y aparecen ecuaciones más complicadas en sus expresiones. La forma general de todas estas ecuaciones es la
siguiente:
Ax2 + By 2 + Cz 2 + Dxy + Exz + F yz + Gx + Hy + Iz + K = 0,
donde A, B, C, D, E, F, G, H, I, K ∈ R.
Análogamente a como hacı́amos con las cónicas se puede plantear la cuestión de identificar las figuras geométricas
que describe una ecuación como la anterior. Las llamaremos superficies cuádricas.
Si expresamos la ecuación general de las cuádricas de la siguiente forma:
a11 x2 + 2a12 xy + a22 y 2 + 2a13 xz + 2a23 yz + a33 z 2 + 2a1 x + 2a2 y + 2a3 z + a0 = 0
tenemos la ventaja de poder traducirla fácilmente a forma matricial:

    
a11 a12 a13 x x
x y z  a12 a22 a23   y  + 2 a1 a2 a3  y  + a0 = 0
a13 a23 a33 z z
Ejemplo. La ecuación 7x2 + 6y 2 + 5z 2 − 4xy − 4yz + 14x − 8y + 10z + 6 = 0, que en forma matricial se expresa
como     
7 −2 0 x x
x y z  −2 6 −2   y  + 2 7 −4 5  y  + 6 = 0
0 −2 5 z z
mediante un giro y una traslación convenientes se puede convertir en la ecuación del elipsoide de revolución
x2 y2 z2
+ + = 1.
1 2 2/3
2
152 MATEM ÁTICAS
Figura 5.10: Hiperboloides de una hoja y de dos hojas.
2.10. Coordenadas polares, cilı́ndricas y esféricas
2.10.1. Coordenadas polares
Un punto P de R2 queda totalmente determinado por la distancia de dicho punto al origen de coordenadas O,
que notaremos por ρ y el ángulo ϕ que forma la recta OP con el eje OX (contado en el sentido positivo). Al par
ordenado de números (ρ, ϕ) se le llaman coordenadas polares del punto P .
y ρ
0 x
Figura 5.11: Sistema de coordenadas polares en el plano.

2.10.2. Relación entre coordenadas polares y cartesianas rectangulares
Sean (x, y) las coordenadas rectangulares y (ρ, ϕ) las coordenadas polares. Entonces las relaciones entre ellas son
las siguientes:
x = ρ cos ϕ
y = ρ sen ϕ
y despejando ρ y ϕ se tiene
p
ρ = x2 + y 2
y
tan ϕ =
x
2.10.3. Coordenadas cilı́ndricas
0
Consideramos el punto P (x, y, z) de R3 y P (x, y, 0) su proyección ortogonal sobre el plano XY . En dicho plano
0
el punto P está totalmente determinado por sus coordenadas polares (ρ, ϕ), en consecuencia el punto P estará
ahora totalmente determinado por (ρ, ϕ) y por el valor de la coordenada z. A la terna de números reales (ρ, ϕ, z),
se le llama coordenadas cilı́ndricas de P .
z
∂z
r ∂ϕ
z ∂r
0 y
ρ
ϕ
P0
Figura 5.12: Sistema de coordenadas cilı́ndricas en el espacio.
Las relaciones entre coordenadas cilı́ndricas y cartesianas rectangulares son las ya conocidas para las coordenadas
polares en el plano.
Ejemplo. Consideremos la superficie dada por su ecuación en coordenadas cilı́ndricas r2 + z 2 = c2 , donde c

es una constante. La transformación a coordenadas rectangulares es x2 + y 2 + z 2 = c2 , que como sabemos
representa a una esfera. 2
154 MATEM ÁTICAS
2.10.4. Coordenadas esféricas
Consideremos P un punto de R3 que no esté situado en el eje OZ. P está totalmente deteminado por la longitud
ρ de OP, el ángulo ϕ que forma el plano determinado por OZ y P con el plano OXZ y el ángulo θ que forma la
recta OP con el eje OZ. La terna de números ( ρ, ϕ, θ ) se llaman coordenadas esféricas de P respecto al sistema
de referencia polar formado por el polo O, el plano polar OXZ y el eje polar OZ. Obsérvese que ρ puede tomar
todos los valores reales positivos, ϕ ∈ [0, 2π) y θ ∈ (0, π).
z
0 y
Figura 5.13: Sistema de coordenadas esféricas en el espacio.
2.10.5. Relación entre coordenadas esféricas y cartesianas rectangulares
Si consideramos el punto P (x, y, z) , se tienen las siguientes igualdades:
x = ρ sen θ cos ϕ
y = ρ sen θ sen ϕ
z = ρ cos θ
Y despejando de estas expresiones las coordenadas esféricas en función de las cartesianas obtenemos:
p
ρ = x2 + y 2 + z 2
y
tan ϕ =
x
p
x2 + y 2
tan θ =
z
Ejemplo. Consideremos la superficie de ecuación en coordenadas polares sen θ(cos ϕ − 3 sen ϕ) + cos θ = 0.
Dividiendo por cos θ y usando las anteriores relaciones obtendremos
p !
x2 + y 2 x y
p − 3p +1=0
z x2 + y 2 x2 + y 2
y simplificando se tiene finalmente x − 3y + z = 0 que como sabemos expresa la ecuación de un plano que pasa
por el origen de coordenadas. 2
2.11. Aplicaciones lineales
Sean V y W espacios vectoriales sobre el cuerpo K. Una aplicación f : V → W se dice lineal si cumple las
siguientes propiedades:
(1) f (−
→
u +− →
v ) = f (−
→
u ) + f (−
→
v ) para todo −
→
u ,−
→
v ∈V
(2) f (λ−
→u ) = λf (−
→
u ) para todo −
→
u ∈ V y para todo λ ∈ K.
Cuando f es una aplicación lineal biyectiva diremos que es un isomorfismo. Si es inyectiva le llamaremos mono-
morfismo y si es sobreyectiva diremos que es un epimorfismo.
Ejemplo. Si consideramos la matriz A ∈ Mm×n (R) la aplicación f : Rm → Rn definida por

 
x1
 x2 
f ((x1 , x2 , ..., xn )) = A  
 ... 
xn
es lineal. Habitualmente se le denomina aplicación lineal asociada a la matriz A. 2
Observación. Consideremos la aplicación lineal f : V → W , se verifica:
−
→ −→
(1) f ( 0 ) = 0 .
(2) f (−−→u ) = −f (−
→
u ) para todo −
→
u ∈V.
2.11.1. Núcleo e imagen de una aplicación lineal
Consideremos la aplicación lineal f : V → W , denominaremos núcleo de f al conjunto de vectores de V cuya

−→
imagen por f es el vector 0 de W . Es decir,
n →o
−
Ker f = −→
u ∈ V | f (−
→
u)= 0
Denominaremos imágen de f al siguiente conjunto:

Im f = { f (−
→
u )| −
→
u ∈V}
Se verifican las siguientes propiedades:
(1) Ker f es un subespacio de V y análogamente Im f es un subespacio de W .

(2) Si −
v→ −
→ −
→ −→ −→ −→
1 , v2 , ..., vn es una base de V , se tiene que f ( v1 ), f ( v2 ), ..., f ( vn ) es un sistema de generadores de
Im f.
(3) dim(Ker f ) + dim(Im f ) = dim V
−
→
(4) La aplicación lineal f es monomorfismo si y sólo si Ker f = { 0 }
2.11.2. Matriz asociada a una aplicación lineal
De manera análoga a como vimos que dada una matriz A ∈ Mm×n (R) surgı́a una aplicación lineal asociada
f : Rm → Rn , podemos pensar recı́procamente si dada una aplicación lineal existe una matriz asociada. Puesto
156 MATEM ÁTICAS
que todo espacio vectorial posee una base, un aplicación lineal f : V → W estará unı́vocamente determinada
por las imágenes de los elementos de la base. En el caso en que tratemos con espacios vectoriales de dimen-
sión finita, se puede dar una importante relación entre las aplicaciones lineales y las matrices. Supongamos que
dim V = m y dim W = n , considerando bases de los respectivos espacios vectoriales formadas por los vectores
BV = {− v→ −
→ −
→
1n, v2 , ..., vn } ⊂ V y BW o = {−→, −
w → −→
1 w2 , ..., wm } ⊂ W . Consideremos la expresión en la base BW de los
−→ −
vectores f (v1 ), f ( v→ −
→
2 ), ..., f (vn ) , es decir,
f (−
v→ −→ −→
1 ) = α11 w1 + α21 w2 + · · · + αm1 wm
−→
f (−
v→ −→ −→
2 ) = α12 w1 + α22 w2 + · · · + αm2 wm
−→
... ............................................
−→
f (vm ) = α1m − w→+α −
1
→
2m w2 + · · · + αmm wm
−→
Estas igualdades las podemos escribir en notación más abreviada como
X
m
f (−
v→
j) = αij −
→,
w i j = 1, 2, ..., n.
i=1
Después de esto diremos que la matriz

 
α11 α12 .... α1n
 α21 α22 .... α2n 
A=
 ....

..... .... .... 
αm1 αm2 .... αmn
es la matriz de f con respecto a las bases BV y BW .
Ejemplo. (1) Consideremos la aplicación f : R2 → R3 dada por f (−

→
u ) = (x + y, 2(x + y), 3x − y) para cualquier
−
→ 2
u = (x, y) ∈ R . Puedes comprobar fácilmente que la matriz asociada a f con respecto a las bases canónicas
serı́a  
1 1
A= 2 2 
3 −1
(2) Una rotación Rα (rotación de ángulo α en el plano alrededor del origen en sentido positivo) es una aplicación
lineal Rα : R2 → R2 , que tiene como matriz asociada

cos α − sen α
.
sen α cos α
2
Parece claro que la expresión de la matriz asociada a una aplicación lineal cambia si cambiamos las bases que
prefijamos en los dos espacios vectoriales. Pero ¿sabrı́amos encontrar una relación entre dos matrices asociadas
a una misma aplicación lineal, aunque referidas a bases distintas?
Te introduciremos en esta cuestión con un ejemplo. Supongamos que una aplicación lineal f : R2 → R2 tiene
asociada en la base canónica la matriz
6 −2
A=
6 −1
→ = (1, 2), −
y queremos encontrar la expresión de la matriz asociada a f en la base −
u 1
→ = (2, 3). La matriz cambio
u 2
de base (ver bibliografı́a recomendada) viene expresada por

1 2
C= .
2 3
Esto te recordamos que quiere decir que considerados como vectores columna, por ejemplo el vector −
→
v = t (2, 5)
expresado en la base canónica, tiene como coordenadas en la nueva base, el resultado de efectuar
−1
1 2 2 −3 2 2 4
= = .
2 3 5 2 −1 5 −1
→, −
De esta forma la matriz de la aplicación lineal f expresada en la base {−
u →
1 u2 } vendrı́a dada por
−1
0 1 2 6 −2 1 2 2 0
A = = .
2 3 6 −1 2 3 0 3
Intenta razonar por qué (consulta la bibliografı́a recomendada).
A.5.1. Utilizar el método de Gauss en los siguientes sistemas:

  
 2x + y − 4z = 14  −x − y − z = 2  3x + 2y − 5z + 6t = 4
−x + 5y − z = 1 −5x + 5y − z = 1 2x + y + 3z − t = 2
  
2x − 4y − z = 13 2x − 4y + 5z = 13 x − 3y + 2z + 5t = 0
A.5.2. Considerar las siguientes matrices:

1 2 3 1 −1 2 1 −2 3 3 0 2
A= ,B = ,C = ,D =
4 5 6 0 3 −5 4 5 −6 −7 1 8
y calcular A + B; C + D ; 3A − 5B ; 2C − 3D .
A.5.3. Calcular AB y BA (cuando sea posible) siendo A y B las siguientes matrices:

1 3 2 0 −4
(a) A = yB=
2 −1 3 −2 6
 
2 −1
  1 −2 −5
(b) A = 1 0 yB=
3 4 0
−3 4
 
2 −1 0 6
2 3 −1
(c) A = yB= 1 3 −5 1 
4 −2 5
4 1 −2 2
A.5.4. Resolver la siguiente ecuación matricial (X − A)B = C, donde B es una matriz invertible.

x y 1 1
A.5.5. Encontrar todas las matrices M de la forma M = que conmutan con la matriz A = .
x t 0 1
A.5.6. Determinar las matrices A y B, tales que


 2 −3

 3A − 2B =
4 1


 6 2
 2A + 7B =
4 5
158 MATEM ÁTICAS
A.5.7. Para completar la idea del método que sugerimos en el texto para calcular la matriz inversa sin usar deter-
minantes, responder a las siguientes cuestiones:
(a) Explicar las razones en las que se basa el método descrito anteriormente para calcular la matriz inversa.
(b) Aplı́carlo en el cálculo de matrices inversas de órdenes superiores a dos. Por ejemplo demostrar que
 −1  2 
1 3 −2 3 − 16 − 12
 −5 0 1  = 7 1
− 32 
3 6
10 1
1 4 −3 3 6 − 52
A.5.8. Determinar usando determinantes si las siguientes matrices son invertibles y calcular su inversa en el caso
de que exista:
   
1 2 −4 1 3 −4
3 5
A= , B =  −1 −1 5 , C= 1 5 −1  .
2 3
2 7 −3 3 13 −6
A.5.9. Calcular An para las siguientes matrices:

   
a 0 0 0 a b
a 2
A= , A= 0 b 0 , A= 0 0 a 
0 a
0 0 c 0 0 0
A.5.10. A continuación
se propone
completar el siguiente cuadro hasta obtener el determinante de una matriz
a11 a12
2 × 2, A = .
a21 a22
Permutaciones No de inversiones Producto

12
21
A.5.11. Demostrar usando la Regla de Sarrus que

1 2 3 4
1 4 1
0 2 2 3
2 0 5 = −178 y = 24
0 0 −6 −4
−5
2 9 0 0 0 −2
A.5.12. Calcular los determinantes propuestos en el ejercicio anterior, pero desarrollando esta vez por los elemen-
tos de sus filas o columnas.
A.5.13. Responder a las siguientes cuestiones:
(a) ¿Cómo se puede calcular el determinante de una matriz triangular superior? ¿Y de una inferior?
(b) Si A es una matriz con det(A) = 5 ¿Cuanto vale det(A−1 )? (Indicación: AA−1 = In , aplicar después
la propiedad (8) de los determinantes).
A.5.14. Calcular los siguientes determinantes:

5 4 2 1
1 x x2 t+3 −1 1
2 5 1 −2
1 y y2 5 t−3 1
−5 −7 −3 9
1 z z2 −6 t + 4
6 1 −2 −1 4
A.5.15. Consideremos los vectores de R3 , −

→ = (1, 1, 1), −
u 1
→ = (1, 2, 3) y −
u2
→ = (2, −1, 1). Escribir el vector
u3
−
→
u = (1, −2, 5) como combinación lineal de los anteriores.
A.5.16. Determinar si los vectores −

→ = (1, 1, 1), −
u1
→ = (2, −1, 3), −
u2
→ = (1, −5, 3) son linealmente dependientes
u3
o independientes.
−→
A.5.17. Demostrar que cualquier conjunto de vectores que contenga el vector 0 es linealmente dependiente.
A.5.18. Determinar si los siguientes vectores son linealmente independientes y en caso de no serlo expresar uno
de ellos como combinación lineal de los otros:
→ = (1, 0, 1), −
(a) −
u1
→ = (1, 2, 3), −
u 2
→ = (3, 2, 5).
u 3
→ = (1, 0, 1), −
(b) −
u 1
→ = (1, 1, 1), −
u2
→ = (0, 1, 1).
u3
A.5.19. Determinar a y b para que los siguientes vectores sean linealmente dependientes:
→ = (3, −2, −1, 3), −
−
u → = (1, 0, 2, 4), −
u → = (1, −3, a, b)
u
1 2 3
A.5.20. Estudiar para qué valores de los parámetros a y b son compatibles los siguientes sistemas y resolverlos
cuando sea posible:
  
 x + 2y + 2z = 2  ax − y + z = 2x  ax + y + z = 1
2x − y + 3z = 2 x + 2ay − az = y x + ay + z = b
  
5x − y + az = 6 x + ay − z = 0 x + y + az = b2
A.5.21. Determinar si son o no diagonalizables cada una de las siguientes matrices, y en el caso en que lo sean
calcular la potencia n-ésima:

4 2
(a)
3 −1

5 1
(b) ,
−4 1

2 −5
(c) ,
1 −2

2 4
(d) ,
3 1
 
4 1 −1
(e)  2 5 −2 ,
1 1 2
 
−3 1 −1
(f)  −7 5 −1 ,
−6 −6 −2
 
1 2 3
(g)  0 2 3 .
0 0 3
A.5.22. Estudiar la posibilidad de diagonalizar la matriz
 
a −1 1
 0 1 3 
0 2 2
según los distintos valores del parámetro a.
A.5.23. Determinar los valores de xn e yn , para todo n > 0, sabiendo que
xn+1 = 2xn + 4yn
yn+1 = 3xn + yn
y que x0 = 1 e y0 = 2.
160 MATEM ÁTICAS
A.5.24. Calcular la forma de Jordan de las matrices

   
−1 2 −3 0 1 −1
A= 0 1 −1  y B= 1 0 1 
1 −1 2 1 −1 2
indicando la matriz P de cambio de base.
A.5.25. Estudiar si la matriz

 
0 1 0
A= 1 0 0 
0 0 2
es diagonalizable.
A.5.26. Dada la matriz

 
a 1 1
A= 1 a 1 
1 1 a
estudiar para que valores de a es diagonalizable.
A.5.27. Resolver los siguientes sistemas de ecuaciones diferenciales:

2(D − 2)y1 + (D − 1)y2 = ex
(a)
(D + 3)y1 + y2 = 0

 (D + 6)y1 + 3y2 − 14y3 = 0
(b) −4y1 + (D − 3)y2 + 8y3 = 0

2y1 + y2 + (D − 5)y3 = sen t
A.5.28. Demostrar que el producto definido en V3 por − →

u .−→v = (u1 − u2 )(v1 − v2 ) + u2 v2 + a3 b3 , −
→
u =
−→ −
→
(u1 , u2 , u3 ) y v = (v1 , v2 , v3 ) es un producto escalar. ¿Cuánto vale k u k con este producto?
√
A.5.29. Sabiendo que ABCD es un cuadrado, con A(2, 0, 2), B(1, 1, 0) y C(0, y, z), hallar las coordenadas
que faltan en C.
0 0 0 0 0
A.5.30. Sea ABCDA B C D un paralepı́pedo. Sabiendo que A(0, 1, 1), B(−2, 1, 0), C(1, 1, 3) y A (2, 0, 1),
hallar los vértices restantes y el volumen del mencionado paralepı́pedo.
A.5.31. ¿Qué tipo de cónica representan las siguientes ecuaciones?
x2 + y 2 − 4x + 2y − 4 = 0; 4x2 + 9y 2 − 8x + 36y − 104 = 0.
A.5.32. ¿Qué tipo de cuádrica representan las siguientes ecuaciones?
x2 + y 2 + z 2 − 2x − 4y − 2z + 2 = 0; 4x2 + y 2 + 4z 2 − 8x − 8y − 8z + 11 = 0.
A.5.33. Consideremos la aplicación f : R3 → R3 dada por las expresiones referidas a coordenadas en la base
canónica f (x, y, z) = (x + y, z, y − z) . Se pide:
(a) Demostrar que es una aplicación lineal y encontrar la matriz asociada en la base canónica.
(b) ¿Cuál es la expresión de la matriz asociada en la base formada por los vectores −→ = (1, 0, 1), −
u1
→=
u2
−
→
(0, 1, 1), u = (1, 0, 0)?
3
4.1. Introducción
necesitar.
en rapidez.
En esta práctica vamos a manipular vectores y matrices de cualquier orden, resolver sistemas de ecuaciones linea-
les, operar matrices (cálculo de la matriz inversa, suma, producto) y calcular los valores y vectores propios de una
matriz. Por tanto, debemos saber en primer lugar cómo introducir estos datos en el programa. Aunque algunas
aplicaciones funcionan sin cargar ningún paquete adicional, es conveniente que para esta práctica se cargue la
utilidad VECTOR.MTH mediante las opciones File|Load|Utility.
4.2. Introducción de vectores y matrices
Para introducir un vector en DERIVE for Windows tenemos dos formas: particular y general. La forma par-
ticular se obtiene seleccionando las opciones Author|Vector y nos aparece la ventana de la Figura 5.15, de-
mandándonos la dimensión del vector. Una vez introducida dicha dimensión (por ejemplo, 4) nos aparece una
nueva ventana (ver Figura 5.16) para que vayamos introduciendo los elementos del vector.
La forma general consiste en seleccionar las opciones Author|Expression e introducir un vector en la forma
[x1,x2,...,xn], donde xi son los diferentes elementos del vector. Por ejemplo, el vector (2, 1, −3) se introdu-
cirı́a como [2,1,-3]; debemos notar que los vectores deben estar delimitados por los corchetes [] y no por los
paréntesis () o las llaves {}.
Análogamente, podemos introducir una matriz de dos formas distintas. La forma particular consiste en seleccionar
las opciones Author|Matrix y nos aparece la ventana de la Figura 5.17 donde debemos indicar el número de
162 MATEM ÁTICAS
Figura 5.15: Ventana para introducir la dimensión de un vector.
Figura 5.16: Ventana para introducir los elementos de un vector.
filas (Rows) y de columnas (Columns). A continuación debemos completar los elementos de la matriz (ver Figura
5.18).
Figura 5.17: Ventana para introducir las dimensiones de una matriz.
La forma general consiste, como antes, en seleccionar las opciones Author|Expression e introducir la matriz
en la forma [f1,f2,...,fm], donde cada fi es una fila de la matriz. Por ejemplo, la matriz de orden 3 × 3
siguiente
 
1 2 3
 1 4 9 
1 8 27
se introducirı́a como sigue: [[1,2,3], [1,4,9], [1,8,27]]. Notemos que los delimitadores de las matrices
son también los corchetes y no los paréntesis ni las llaves.
Figura 5.18: Ventana para introducir los elementos de una matriz.
Ejercicio. Introducir los siguientes vectores y matrices:

2 −1 −3
(−1, x , a) (3/5, 0.15, x − y)
4 −x
4.3. Sistemas de ecuaciones lineales
Como es natural, los elementos de un vector pueden ser cualquier expresión válida en DERIVE for Windows, no
sólo números. Por ejemplo, un sistema de ecuaciones lineales es un vector cuyos elementos son ecuaciones; ası́,
el sistema de ecuaciones lineales
3x + 2y = 5
4x + 3y = 2
se introducirı́a ası́: [3x+2y=5, 4x+3y=2]. Una vez introducido el sistema podemos resolverlo de dos formas
distintas: directamente o a través de menús. En el primer caso debemos introducir la expresión Solve(#1,[x,y])
(suponiendo que el sistema es la lı́nea número 1) y nos aparecerá la solución: [x=11 y=-14]. En el segundo caso,
debemos seleccionar el botón Solve de la botonera y nos aparecerá la ventana de la Figura 5.19; ahora basta pulsar
el botón Simplify .
Cuando necesitemos utilizar un vector o una matriz en varias expresiones, lo conveniente es almacenarla en una
variable. Por ejemplo, podemos escribir v:=[1,2,3] o a:=[[1,2],[3,4]].
Ejercicio. Resolver los siguientes sistemas de ecuaciones lineales:


 3x + 4y − 2z = 5
2x + 3y = 12
4x − 3y + 9z = −3
4x − 7y = −3 
5x − 4y + 2z = 1
4.4. Operaciones básicas con vectores y matrices
Con DERIVE for Windows podemos sumar, restar y multiplicar matrices, siempre que las dimensiones sean
apropiadas. Pero con DERIVE for Windows podemos realizar otro tipo de productos: el producto escalar y el
producto vectorial de dos vectores. La sintaxis de estas operaciones figura en la siguiente tabla:
164 MATEM ÁTICAS
Figura 5.19: Ventana para resolver un sistema de ecuaciones lineales.
Operación Sintaxis
Suma de a y b a + b
Resta de a y b a - b
Producto de a y b a . b
Producto de a por un escalar t t*a ó ta
Producto escalar de v y w v . w
Producto vectorial de v y w CROSS(v,w)
a y b son vectores o matrices con las dimensiones apropiadas.
Observemos que para no confundir el punto decimal ‘.’ con el punto de las operaciones producto anteriores,
debemos dejar un espacio en blanco antes y después del punto; ası́, no es válido indicar el producto de a y b
como a.b ó a. b ó a .b. En relación con el producto vectorial debemos hacer una precisión: si los vectores
son tridimensionales, entonces CROSS(v,w) devuelve el producto vectorial de v y w, pero si los vectores son de
dimensión dos entonces CROSS(v,w) devuelve el determinante de v y w.
Ejercicio. Calcular las siguientes operaciones:

• (1, 2, 3) + (2, 4, 6), (2, 4, 8) − (4, 9, 13)
• El producto escalar de (5(−1, 3, 5) + 2(3, 2, 1)) y (−1, −3, −5).
• El producto vectorial de (3, 8, −1) y (3, 1, 10).
4.5. Funciones de manipulación
Para manipular los elementos de un vector o matriz, DERIVE for Windows dispone de numerosas funciones,
todas ellas con una sintaxis muy intuitiva. A continuación listamos las más importantes.
IDENTITY MATRIX(n): Construye la matriz identidad de orden n.

DIMENSION(a): Determina el número de elementos o el número de filas de a, según a sea un vector o una matriz.
Por ejemplo, DIMENSION([x,y,z]) es 3.
SUB: Es un sufijo que permite extraer un elemento de un vector o una fila de una matriz. Por ejemplo, [a,b,c]
SUB 2 aparece en pantalla como [a,b,c]2 y se simplifica a b. Sin embargo [[1,2],[3,4]] SUB 1
permite extraer la primera fila de la matriz, es decir, [1,2], por lo que [[1,2],[3,4]] SUB 1 SUB 2
identifica al segundo elemento de la primera fila, es decir, 2.
ELEMENT(v,n): Extrae el elemento n-ésimo del vector v.
ELEMENT(a,m,n): Extrae el elemento (m, n) (fila m y columna n) de la matriz a.
APPEND(v1,v2,...,vn): Concatena dos o más vectores. Por ejemplo, APPEND([3,1],[2,4]) produce como
resultado el vector [3,1,2,4]. Si a es una matriz, entonces APPEND(a) produce un vector cuyos elementos
son todos los elementos de la matriz.
DELETE ELEMENT(v,n): Elimina el elemento n-ésimo del vector v. Si v es una matriz, entonces se borra la fila
n-ésima.
INSERT ELEMENT(u,v,n): Agrega el elemento u al vector v antes del elemento n-ésimo. Por ejemplo,
INSERT ELEMENT(d,[a,b,c],2)
da lugar al vector [a,d,b,c]. Si se omite n, entonces el elemento se coloca al principio del vector, y si el
valor de n es uno más que la dimensión del vector, el nuevo elemento se colocará al final del vector.
REPLACE ELEMENT(u,v,n): Reemplaza el n-ésimo elemento del vector v por la expresión u. Por ejemplo,
REPLACE ELEMENT(d,[a,b,c],2)
da lugar al vector [a,d,c]. Si se omite n, entonces el elemento reemplazado será el primero.
REVERSE VECTOR(v): Construye un nuevo vector cambiando de orden los elementos del vector v. Ası́,
REVERSE VECTOR([1,2,3,4])
produce el vector [4,3,2,1].
SELECT(u,k,v): Produce un nuevo vector con los elementos k del vector v tales que u(k) es cierto. Por ejemplo,
SELECT(PRIME(k),k,[1,2,3,4,5,6]) produce el vector [1,2,3,5] formado por los números primos
que hay en el vector original.
SELECT(u,k,m,n,s): Permite seleccionar los elementos k de la sucesión que empieza en m, acaba en n y está
construida con un paso s tales que u(k) es cierta. Por defecto s = 1, de forma que
SELECT(PRIME(k),k,1,100)
da lugar a un vector cuyos elementos son los números primos entre 1 y 100.
Ejercicio. Generar todos los números pares entre 1 y 100 y todos los números impares entre 100 y 200. (En este
ejercicio debe utilizarse la función FLOOR(n), que genera la parte entera del número n).
4.6. Operaciones con matrices
Las operaciones tı́picas con matrices están disponibles en DERIVE for Windows. La sintaxis que debe utilizarse
aparece en la siguiente tabla:
Operación Sintaxis
Matriz inversa de m m ∧ −1
Matriz traspuesta de m m‘
Matriz adjunta de m ADJOINT(m)
Traza de la matriz m TRACE(m)
Determinante de la matriz m DET(m)
Producto de las matrices m y n m . n
Exponenciación de m: mk m∧k
166 MATEM ÁTICAS
Ejercicio. Se consideran las siguentes matrices:

   
1 2 3 1 2 3
a =  −1 2 −3  b= 5 7 11 
3 5 7 13 17 19
Calcular a−1 , at + b, (a + bt )−1 , (a10 − b−5 )3 , det(a2 + b2 ).
Ejercicio. Resolver la siguiente ecuación:

x 2 3

1 2 3 = 0.

4 4 6
4.7. Cálculo de los valores y vectores propios
Aunque no es estrictamente necesario, es conveniente calcular el polinomio caracterı́stico, ya que sus raı́ces son
los valores propios. Para ello disponemos de la función
CHARPOLY(a,t)
que desarrolla el polinomio caracterı́stico de la matriz a en términos de la variable t. Por ejemplo, CHARPOLY([[2,
3], [a, b]], t) produce t2 − (b + 2)t − 3a + 2b.
Para el cálculo de los valores propios disponemos de la función
EIGENVALUES(a,t)
que determina los valores propios de la matriz a en términos de la variable t.
Cómo es muy frecuente que los polinomios de grado superior a cuatro no se puedan factorizar por métodos
racionales, y la factorización de polinomios de grado cuatro es de una complejidad enorme, la función anterior
sólo es útil para matrices de orden 2 × 2 o 3 × 3. En consecuencia, suele ser habitual calcular primero el polinomio
caracterı́stico y posteriormente utilizar métodos aproximados para determinar sus raı́ces (es decir, los valores
propios de la matriz).
Una vez determinados los valores propios de una matriz A, disponemos de dos funciones para calcular los vectores
propios asociados:
EXACT EIGENVECTOR(A,µ): Se utiliza cuando µ es un valor propio exacto de la matriz A. Cuando µ es una
aproximación a un valor propio, entonces la matriz A − µI no es singular, por lo que esta función devolverı́a
el vector cero como solución.
APPROX EIGENVECTOR(A,µ): Aproxima a un vector propio numérico de A cuyo valor propio asociado es apro-
ximado por µ y el resultado es un vector de norma uno. Naturalmente, µ no debe ser un valor propio
exacto. Para mayor generalidad, podemos multiplicar el resultado por un parámetro, por ejemplo @1. Los
parámetros en DERIVE for Windows se indican por @1, @2, @3, .... Por ejemplo, un resultado como
[@1,3@2,-5@1] es lo que usualmente se escribe como [s,3t,-5s].
Ejercicio. Hallar el polinomio caracterı́stico, los valores propios y los vectores propios asociados de la siguiente
matriz:  
−2 1 1 1 1
 1 −3 −1 0 −1 
 
 
 1 −1 1 0 −3 
 
 1 0 0 3 0 
1 −1 −3 0 2
J. HEINHOLD y B. RIEDMULLER Algebra Lineal y Geometrı́a Analı́tica, Ed. Reverté SA, 1981. Capı́tulos 1
y 2.
R.E. LARSON, R.P. HOSTETLER y B.H. EDWARDS Calculo y Geometrı́a Analı́tica, 5a ed., McGraw-Hill, Ma-
drid, 1995. Capı́tulos 11, 13 y 14.
J.L. MALAINA y otros Lecciones Básicas de Algebra Lineal, Universidad del Pais Vasco, 1995. Capı́tulos 1–6,
9, 11 y 12.
J.R. TORREGROSA y C.JORDAN Algebra Lineal y sus Aplicaciones, serie Schaum, McGraw Hill, Madrid,
1987. Capı́tulos 1 y 2.
E.5.1. Discutir el siguiente sistema de ecuaciones según los valores de a y b:
ax + by + z = 1
x + aby + z = b
x + by + az = 1
E.5.2. Hallar la inversa de la siguiente matriz siempre que sea posible:

 
x 1 0 0
 0 x 1 0 
A= 
 0 0 x 1 
0 0 0 x
E.5.3. Encontrar la dimensión y una base del subespacio vectorial generado por los vectores −
→ = (1, 0, 0, −1),
u1
−
→ −→ −
→ −
→
u2 = (2, 1, 1, 0), u3 = (1, 1, 1, 1), u4 = (1, 2, 3, 4) y u5 = (0, 1, 2, 3). Determinar las ecuaciones
cartesianas de este subespacio.
168 MATEM ÁTICAS
E.5.4. Decidir cuáles de las siguientes matrices pueden reducirse a una matriz diagonal y encontrar matrices Pi
que hagan posible la diagonalización (P −1 Ai P = Di ):
 
−1 3 1
(a) A1 =  −3 5 −1 ,
−3 3 1
 
4 −1 −1
(b) A2 =  1 2 −1 ,
1 −1 2
 
0 0 0 1
 0 0 1 0 
(c) A3 = 
 0 1 0 0 .

1 0 0 0
E.5.5. Calcular la forma de Jordan de  
0 1 0
A= 1 0 0 
0 0 2
y utilizarla para determinar A7 .
E.5.6. Hallar las ecuaciones que describen los subespacios Ker f e Im f donde f : R3 → R3 es la aplicación
lineal definida por f (x, y, z) = (x + 2y + z, −x + 2y, 2y + z).
E.5.7. ¿Qué tipo de cónica es la que viene dada por la ecuación 9x2 − 18x + 4y 2 − 24y + 9 = 0? ¿Qué tipo de
cuádrica es la que viene dada por la ecuación 4x2 + 2y 2 + z 2 − 8x − 12y − 4z + 22 = 0?
ANOTACIONES
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
CAPÍTULO 6
CÁLCULO DIFERENCIAL EN VARIAS VARIABLES
• Calcular derivadas parciales de orden superior de • Saber interpretar y hallar las expresiones de los
funciones de varias variables. vectores que forman el triedro de Frenet.
• Entender la significación geométrica de los con-
• Calcular las ecuaciones de los planos osculador,
ceptos derivada direccional y gradiente.
normal y rectificante a una curva.
• Calcular extremos relativos y condicionados de
funciones de varias variables en casos sencillos. • Entender el concepto de superficie parametrizada
regular.
• Entender el concepto de curva parametrizada re-
gular.
• Calcular e interpretar gráficamente los coeficien-
• Saber calcular e interpretar las magnitudes curva- tes de la primera y de la segunda forma funda-
tura y torsión de una curva. mental, ası́ como la curvatura de Gauss.
2.1. Funciones vectoriales de una variable
Consideremos la base canónica para los vectores de R3 formada por

−
→
i = (1, 0, 0),
−
→
j = (0, 1, 0),
−
→
k = (0, 0, 1).
Una función definida por

−
→ −
→ −
→ −
→
F (t) = x(t) i + y(t) j + z(t) k = (x(t), y(t), z(t))
donde x(t), y(t) y z(t) son funciones reales de variable real t, se dice que es una función vectorial en t.
Se puede generalizar el concepto de lı́mite de funciones reales de variable real a las funciones vectoriales de una
variable, sin más que consideremos
−
→
lim F (t) = ( lim x(t), lim y(t), lim z(t)).
x→a x→a x→a x→a
C ÁLCULO DIFERENCIAL EN VARIAS VARIABLES 171
Esto también nos lleva a extender otros conceptos, como el de derivada.

−
→ −
→ −→ −
→
Una función vectorial F (t) = x(t) i + y(t) j + z(t) k es derivable en x = a si y sólo si cada una de sus
funciones componentes es derivable en t = a. En estas condiciones se tiene
−
→0 0 0 0
F (a) = (x (a), y (a), z (a)).
−
→
Ejemplo. Sea F (t) = (sen2 t, ln t, arctan(3t)), entonces
−
→0
1 3
F (t) = 2 sen t cos t, , ,
t 1 + 9t2
expresión válida para todos los números reales menos el cero. 2

−
→ −
→ −
→ −
→
Sea F (t) = x(t) i + y(t) j + z(t) k una función diferenciable de t, y t = g(s) una función diferenciable de
−
→
s, entonces la función compuesta F (g(s)) es una función diferenciable de s y se tiene
−
→ − →0
dF 0
= F (g(s))g (s).
ds
−
→
Ejemplo. Sea F (t) = (1, sen(t + 1), et+1 ) y t = g(s) = s2 − 1. En este caso se tiene
−
→ −→
dF d F dt 2
= = 0, cos(t + 1), et+1 .2s = 0, 2s cos s2 , 2ses .
ds dt ds
Esta expresión también la habrı́amos podido haber obtenido sustituyendo t = s2 − 1 y derivando respecto de s. 2
2.2. Derivadas de los productos de vectores
Por aplicación directa de las propiedades de funciones reales de variable real, podemos deducir que la derivada
de la suma de dos funciones vectoriales es la suma de las derivadas. No es difı́cil deducir de igual forma (ver
bibliografı́a recomendada) el comportamiento de la derivada para las otras operaciones que se pueden realizar con
−
→ −
→
los vectores de R3 , el producto escalar y el producto vectorial. Si F (t) y G (t) son funciones derivables, se
tiene:
−→ − → 0 → −
− →0 −→0 −
→
• ( F (t). G (t)) = F (t).G (t) + F (t). G (t) (Observa que en virtud de la simetrı́a del producto escalar
no existe ningún problema en cambiar el orden de las funciones vectoriales que se ven afectadas en los
productos)
−→ −→ 0 −
→ −
→0 −
→0 −
→
• ( F (t) × G (t)) = F (t) × G (t) + F (t) × G (t) (Observa que en esta ocasión es fundamental el orden
de las funciones en los productos vectoriales)
−
→ −
→ −→ − → 0
Ejemplo. Dadas las funciones F (t) = (3t2 + 1, sen t, 0) y G (t) = (cos t, 0, et ) vamos a calcular ( F (t). G (t))
−→ −
→ 0
y ( F (t) × G (t)) . Veamos:
−→ − → 0 → −
− →0 −
→0 −
→
( F (t). G (t)) = F (t).G (t) + F (t). G (t)
= (3t2 + 1, sen t, 0).(− sen t, 0, et ) + (6t, cos t, 0).(cos t, 0, et )
= −(3t2 + 1) sen t + 6t cos t
172 MATEM ÁTICAS
−→ −
→ 0 −
→ −
→0 −
→0 −
→
( F (t) × G (t)) = F (t) × G (t) + F (t) × G (t)
− → → −
− → − → −
→ −
→

i j k i j k
2
= 3t + 1 sen t 0 + 6t cos t 0

− sen t 0 et cos t 0 et
= ((sen t + cos t)et , −(3t2 + 6t + 1)et , sen2 t − cos2 t).
2
Comprobar que estos resultados coinciden con los que se obtienen realizando antes los productos (escalar o
vectorial) y después derivando el resultado.
2.3. Funciones de varias variables
En muchas ocasiones los valores de las funciones que aparecen sometidas a estudio están determinados por valores
que dependen de más de una variable.
Supongamos D una colección de n-uplas de números reales. Una función f con dominio D es una regla que asigna
a cada (x1 , x2 , ..., xn ) ∈ D un número z = f (x1 , x2 , ..., xn ). El rango de la función es el conjunto de valores
que toma z. A z se le denomina variable dependiente y a x1 , x2 , ..., xn se les llama variables independientes.
p
Ejemplo. El dominio de la función f (x, y) = y − x2 es D = (x, y) ∈ R2 y > x2 y el rango viene dado por
Rango(f ) = [0, +∞). 2
2.3.1. Lı́mites y continuidad
Primero veamos el caso para funciones de dos variables. El lı́mite de f (x, y) cuando (x, y) → (x0 , y0 ) es el
número real L si para cada ε > 0 existe un δ > 0 tal que para todos los puntos (x, y) sucede una de las dos
siguientes situaciones equivalentes:
p
• 0< (x − x0 )2 + (y − y0 )2 < δ =⇒ |f (x, y) − L| < ε
• 0 < |x − x0 | < δ y 0 < |y − y0 | < δ =⇒ |f (x, y) − L| < ε
2.3.1.1. Propiedades de los lı́mites
Si los lı́mites
lim f (x, y) y lim g(x, y)
(x,y)→(x0 ,y0 ) (x,y)→(x0 ,y0 )
existen y son finitos, entonces se verifican las siguientes propiedades:
(1) lim (f (x, y) + g(x, y)) = lim f (x, y)+ lim g(x, y)
(x,y)→(x0 ,y0 ) (x,y)→(x0 ,y0 ) (x,y)→(x0 ,y0 )
(2) lim (f (x, y).g(x, y)) = lim f (x, y). lim g(x, y)
(x,y)→(x0 ,y0 ) (x,y)→(x0 ,y0 ) (x,y)→(x0 ,y0 )
(3) lim (λf (x, y)) = λ lim f (x, y) para todo λ ∈ R

(x,y)→(x0 ,y0 ) (x,y)→(x0 ,y0 )
lim f (x, y)
f (x, y) (x,y)→(x0 ,y0 )
(4) lim = siempre que lim g(x, y) 6= 0
(x,y)→(x0 ,y0 ) g(x, y) lim g(x, y) (x,y)→(x0 ,y0 )
(x,y)→(x0 ,y0 )
Observación. El lı́mite de una función puede no existir. Al igual que cuando asegurábamos la existencia de los
lı́mites de funciones de una variable real decı́amos que debı́an coincidir los lı́mites laterales (las dos aproxima-
ciones posibles al punto al que se tendı́a en la recta real), en nuestro caso al movernos en R2 aseguramos con
la existencia del lı́mite la coincidencia de los lı́mites sobre cualquiera de las infinitas aproximaciones al punto
(x0 , y0 ) que pudiéramos tomar en el plano. Lo que dicho de otra forma quiere decir que si encontramos dos o
más aproximaciones al punto (x0 , y0 ) que obtengan valores distintos para el lı́mite, estarı́amos demostrando que
el lı́mite lim f (x, y) no existe.
(x,y)→(x0 ,y0 )
Ejemplo. Podemos demostrar que el lı́mite

x2 y
lim
(x,y)→(0,0) x4 + y2
no existe calculando las aproximaciones de f (x, y) sobre la recta y = x y sobre la parábola y = x2 .
x2 x x
lim = lim = lim = 0.
(x,y)→(0,0) x4 + x2 (x,y)→(0,0) x2 + 1
(x, y) → (0, 0)
sobre y = x
Por otra parte

x2 x2 1
lim = lim = .
(x,y)→(0,0) x4 + x4 2
(x, y) → (0, 0)
sobre y = x2
Luego efectivamente el lı́mite lim x2 y

4
(x,y)→(0,0) x +y
2 no existe. 2
Una función f (x, y) se dice que es continua en el punto (x0 , y0 ) si:
(1) f está definida en (x0 , y0 ).

(2) lim f (x, y) existe.
(x,y)→(x0 ,y0 )
(3) lim f (x, y) = f (x0 , y0 ).

(x,y)→(x0 ,y0 )
Es una consecuencia de las propiedades de los lı́mites que la suma, producto y cociente de funciones continuas es
otra función continua y esto también sucede para la composición de funciones.
Ejemplo. La función ( xy
si (x, y) 6= (0, 0)
f (x, y) = x2 + y2
0 si (x, y) = (0, 0)
2
es continua en cualquier punto de R excepto en (0, 0). Puedes comprobar que no es continua en (0, 0) aproxi-
mándote por caminos diferentes al origen (0, 0) (las recta y = mx para diferentes valores de m) y observar que
dan lı́mites distintos. 2
Observación. Todos los conceptos y propiedades introducidos anteriormente para funciones de dos variables,
son fácilmente extensibles a un número de variables genérico n. Basta tener en cuenta la definición de lı́mite de
174 MATEM ÁTICAS
f (x1 , ..., xn ) cuando (x1 , ..., xn ) → (a1 , ..., an ) como el número real L cumpliendo que para cada ε > 0 existe
un δ > 0 tal que para todos los puntos (x1 , ..., xn ) :
p
0 < (x1 − a1 )2 + · · · + (xn − an )2 < δ =⇒ |f (x1 , x2 , ..., xn ) − L| < ε
2.3.2. Derivadas parciales de primer orden
Consideremos z = f (x, y) una función real de dos variables reales. Denominaremos derivada parcial de f
respecto de x en el punto (a, b) a la derivada en x = a de la función de una variable f (x, b). Es decir,
f (a + h, b) − f (a, b) f (x, b) − f (a, b)

lim = lim
h→0 h x→a x−a
denotándose por fx (a, b),f1 (a, b), zx (a, b), ∂f

∂x (a, b) o
∂z
∂x (a, b).
Análogamente definimos la derivada parcial de f respecto de y,
f (a, b + h) − f (a, b) f (a, y) − f (a, b)

lim =lim
h→0 h y→b y−b
denotándose por fy (a, b),f2 (a, b), zy (a, b), ∂f

∂y (a, b) o
∂z
∂y (a, b).
(1) Como ocurre con las funciones reales de variable real, las derivadas parciales de z = f (x, y) respecto de x
y respecto de y se pueden calcular para diversos puntos (x, y), dando lugar por tanto a dos nuevas funciones
de dos variables reales.
(2) Por las definiciones introducidas anteriormente resulta inmediato que las reglas de derivación establecidas
para funciones reales de una variable real serán aplicables a las derivadas parciales de funciones de dos
variables.
2
Ejemplo. Si consideramos la función f (x, y) = x2 y 3 + ex y se puede comprobar fácilmente que
∂f 2
(x, y) = 2xy 3 + 2xex y,
∂x
∂f 2
(x, y) = 3x2 y 2 + ex .
∂y
2
2.3.3. Interpretación geométrica
Sea z = f (x, y) y consideremos fx (a, b), fy (a, b). La superficie z = f (x, y) la cortamos por el plano Π : x = a
y obtenemos una curva γ cuya ecuación referida a los ejes O 0 Y 0 y O 0 Z 0 es z = f (a, y) (donde O 0 es el nuevo
origen con coordenadas (a, 0, 0) y O 0 Y 0 ,O 0 Z 0 son ejes paralelos respectivamente a OY y OZ pasando por O 0 ).
La recta tangente a la curva γ en el punto P (a, b, c), donde c = f (a, b), está contenida en el plano x = a y tiene
por ecuación
z − c = fy (a, b)(y − b)
Figura 6.1: Interpretación geométrica de la derivada parcial.
respecto a los ejes O 0 Y 0 y O 0 Z 0 y referida al espacio es la recta determinada por intersección de los planos x = a
y z − f (a, b) = fy (a, b)(y − b).
Análogamente la tangente a la curva

y=b
z = f (x, y)
en el punto (a, b, f (a, b)) es la recta

y=b
∂x (a, b)(x − a).
z − f (a, b) = ∂f
El plano de ecuación
∂f ∂f
z − f (a, b) = (a, b)(x − a) + (a, b)(y − b)
∂x ∂y
contiene a las rectas tangentes anteriores. Cada recta tangente a una curva de la superficie se dice tangente a
la superficie. El plano que contiene a toda las rectas tangentes a la superficie en un punto se denomina plano
tangente a la superficie en ese punto. En el caso de que exista, el plano tangente en el punto P (a, b, f (a, b))
viene determinado por la ecuación anterior.
p
Ejemplo. Dada la función f (x, y) = 3 − x2 − y 2 la ecuación del plano tangente a la superficie que determina
(una esfera) en el punto P (1, 1, 1) vendrı́a expresada por z − 1 = fx (1, 1)(x − 1) + fy (1, 1)(y − 1). Simplificando
obtenemos z = −x − y + 3. 2
2.3.4. Regla de la cadena para funciones de varias variables
¿Qué sucede cuando intentamos derivar la composición de funciones de varias variables? La variedad de casos a
los que podemos enfrentarnos puede ser amplia y es conveniente que tratemos el problema de forma gradual.
Si z = f (x, y) tiene derivadas parciales continuas fx y fy y si x = x(t), y = y(t) son funciones derivables en t,
entonces la función compuesta z = f (x(t), y(t)) es derivable como función de t y cumple
df ∂f dx ∂f dy
= + .
dt ∂x dt ∂x dt
176 MATEM ÁTICAS
Ejemplo. Sea f (x, y) = xy , con x = cos t e y = sen t. En estas condiciones se obtiene aplicando la regla de la
cadena
df ∂f dx ∂f dy
= + = (sen t)(− sen t) + (cos t)(cos t) = cos2 t − sen2 t = cos 2t.
dt ∂x dt ∂x dt
Puedes obtener también este resultado sustituyendo x e y y derivando la expresión resultante respecto de t. 2
(1) Sea w = f (x, y, z) una función de tres variables con derivadas parciales continuas, y además x = x(t),
y = y(t), z = z(t) son funciones derivables en t. ¿Cuál serı́a de la regla de la cadena para dfdt ? ¿Y si
tuvieramos una función de cuatro variables? Generaliza el resultado a n variables.
(2) Aplicar las conclusiones anteriores para calcular dw
dt si w = xy + z con x = cos t , y = sen t y z = t. (La
curva sobre la que calculamos la derivada es una hélice).
Supongamos ahora que tenemos la siguiente situación:
• w = f (x, y, z) función de tres variables con derivadas parciales continuas.

• x = x(u, v), y = y(u, v), z = z(u, v) funciones de dos variables con derivadas parciales continuas.
En estas condiciones obtenemos

∂f ∂f ∂x ∂f ∂y ∂f ∂z
= + +
∂u ∂x ∂u ∂y ∂u ∂z ∂u
∂f ∂f ∂x ∂f ∂y ∂f ∂z
= + +
∂v ∂x ∂v ∂y ∂v ∂z ∂v
Ejemplo. Sea f (x, y, z) = x + 2y + z 2 y

 u
 x = v
y = u2 + ev

z = 2u
Aplicando la regla de la cadena obtenemos
∂f 1 ∂f u
= + 12v, = − 2 + 2eu .
∂u u ∂v v
2
Las mismas condiciones de derivabilidad y continuidad expuestas anteriormente para los distintos casos, se pueden
expresar de forma genérica como sigue:
Consideremos z = f (x1 , x2 , ..., xn ) una función de n variables con todas sus derivadas parciales continuas y
consideremos a su vez
x1 = ϕ1 (u1 , u2 , ..., um ),
x2 = ϕ2 (u1 , u2 , ..., um ),
.. .
. = ..
xn = ϕn (u1 , u2 , ..., um )
funciones de m variables con todas sus derivadas parciales también continuas. En estas condiciones podemos
expresar:
∂f ∂f ∂x ∂f ∂x2 ∂f ∂xn
= + + ... +
∂u1 ∂x1 ∂u1 ∂x2 ∂u1 ∂xn ∂u1
.. .
. = ..
∂f ∂f ∂x ∂f ∂x2 ∂f ∂xn
= + + ... +
∂um ∂x1 ∂um ∂x2 ∂um ∂xn ∂um
2.3.5. Derivación de funciones implı́citas
Sea y = f (x) una función continua definida implı́citamente por la ecuación F (x, y) = 0, donde F , Fx y Fy son
funciones continuas, además con Fy (x, y) 6= 0. Entonces se cumple que
∂F
dy
= − ∂F
∂x
.
dx ∂y
Puedes intentar deducir este resultado derivando respecto de x (aplicando la regla de la cadena) en la ecuación
F (x, y) = 0.
La expresión de derivación de una función implı́cita se puede hacer extensiva para un número mayor de variables,
razonando de forma similar.
Ejemplo. Vamos a calcular la derivada en los puntos que correspondan al valor x = 1 de la función definida por
la ecuación y 3 − 3xy + 2x3 = 0. Si sustituimos x = 1 en la ecuación, obtenemos que los puntos para los que hay
que evaluar la derivada son (1, 1) y (1, −2). Para aplicar el resultado anterior basta con calcular Fx = −3y + 6x2
y Fy = 3y 2 − 3x. Particularizando en los puntos que sometemos a estudio obtenemos Fx (1, 1) = 3, Fy (1, 1) = 0,
Fx (1, −2) = 12, Fy (1, −2) = 9. De aquı́ deducimos que dx dy
(1, 1) no se puede hallar y por otro lado se tiene
∂x (1, −2)
∂F
dy 4
(1, −2) = − ∂F =−
dx ∂y (1, −2) 3
2
Ejemplo. Supongamos que la superficie dada por la ecuación F (x, y, z) = 0 define implı́citamente a la función
z = f (x, y). La ecuación del plano tangente a la mencionada superficie en el punto (a, b, c) vendrı́a expresado
por
∂f ∂f
z−c= (a, b)(x − a) + (a, b)(y − b).
∂x ∂y
Ahora bien, aplicando la regla de derivación para funciones implı́citas se tiene:
∂F ∂F
dz dz ∂y
= − ∂F
∂x
, = − ∂F
dx ∂z
dy ∂z
Sustituyendo en la ecuación del plano tangente y simplificando (quitando los denominadores Fz ) obtenemos
finalmente
∂F ∂F ∂F
(a, b, c)(x − a) + (a, b, c)(y − b) + (a, b, c)(z − c) = 0.
∂x ∂y ∂z
Expresión de la ecuación del plano tangente a una superficie que no hace referencia explı́cita de la función que la
define. 2
2.3.6. Gradientes y derivadas direccionales
Sea la superficie z = f (x, y) y supongamos que las derivadas parciales fx y fy son continuas.
Consideremos el plano Π que pasa por los puntos (a, b, 0) y (x, y, 0) y es perpendicular al plano z = 0. Este plano
tiene de ecuación y − b = tan θ(x − a) o bien, en forma paramétrica

x = a + t cos θ
Π:
y = b + t sen θ
178 MATEM ÁTICAS
Este plano corta a la superficie según una curva γ de ecuación


 z = f (x, y)
γ: x = a + t cos θ

y = b + t sen θ
Es decir, z = f (a + t cos θ, b + t sen θ). Consideremos en el plano Π el nuevo sistema de ejes coordenados
O 0 T 0 Z 0 , donde O 0 (a, b, 0), O 0 T 0 es la intersección de plano Π con el plano z = 0, y el eje O 0 Z 0 es paralelo
al eje OZ pasando por el punto O 0 . En el plano Π, podemos estudiar la pendiente de la recta tangente a γ e el
punto P (a, b, c) respecto del eje O 0 T 0 , que coincide con la derivada respecto de t, es decir, aplicando la regla de
la cadena se tiene:
dz ∂f dx ∂f dy ∂f ∂f
= + = (a, b) cos θ + (a, b) sen θ
dt ∂x dt ∂y dt ∂x ∂y
La recta que pasa por el punto P (a, b, c) y tiene esta pendiente es la recta tangente a γ en el punto P . Esta recta
tangente tiene por ecuaciones paramétricas respecto a OXY Z:
x = a + t cos θ
y = b + t sen θ
z = c + ( ∂f
∂x (a, b) cos θ +
∂f
∂y (a, b) sen θ)t
y está contenida en el plano tangente a la superficie en el punto P (a, b, c) de ecuación
∂f ∂f
z−c= (a, b)(x − a) + (a, b)(y − b).
∂x ∂y
A la expresión fx (a, b) cos θ + fy (a, b) sen θ se le llama derivada direccional de f (x, y) en (a, b) según la
−
→ −
→ −
→
dirección θ y se denota por fθ o por D−→u f donde u = cos θ i + sen θ j .
La derivada de f (x, y) en (a, b) según la dirección θ, es la pendiente de la recta tangente a la curva resultante de
la intersección de la superficie z = f (x, y) con el plano de ecuación y − b = tan θ(x − a) . A veces también se
dice de la derivada direccional que es el ritmo al que cambia f (x, y) cuando nos movemos desde el punto (a, b)
en la dirección que forma un ángulo θ con el eje OX.
Es importante que observes lo que sucede cuando θ = 0 y θ = π2 . Aplica la definición y comprueba que en estos
casos las mencionadas derivadas direccionales coinciden con las derivadas parciales.
Ejemplo. Vamos a calcular la derivada de f (x, y) = x2 y 3 en el punto (1, 2) en la dirección determinada por el
ángulo π/3. Para ello calcularemos primero las derivadas parciales fx = 2xy 3 fy = 3x2 y 2 . Particularizándolas
√ nos piden se tiene fx (1, 2) = 16 y fy (1, 2)√= 12. Habida cuenta que cos(π/3) = 1/2 y
en el punto que
sen(π/3) = 3/2, obtenemos finalmente D− →u f (1, 2) = 8 + 6 3. 2
La expresión
∂f ∂f
D−
→
u f (a, b) = (a, b) cos θ + (a, b) sen θ
∂x ∂y
se puede ver como el resultado del producto escalar de los vectores
−
→ −
→ −
→ ∂f −
→ ∂f −
→
u = cos θ i + sen θ j y (a, b) i + (a, b) j .
∂x ∂y
A este último vector se le denomina gradiente de f en (a, b) denotándose por ∇f (a, b).
−
→ −
→
En definitiva, si z = f (x, y) tiene derivadas parciales continuas fx , fy y −
→
u = cos θ i + sen θ j entonces se
cumple
−
→
D− u f = ∇f. u .
→
−
→ −
→
Por definición del producto escalar de dos vectores, tenemos D− →u f = ∇f. u = |∇f | . | u | cos α donde α es el
−
→ −→
ángulo que forman los vectores∇f y u . Pero | u | = 1 y de aquı́ deducimos D− → f = |∇f | . cos α , esto nos
u
u f coincide con |∇f | y además la dirección del

lleva a deducir que el valor máximo de la derivada direccional D−
→
vector gradiente es la que indica la mayor derivada direccional.
Ejemplo. Dada la función f (x, y) = x2 y 3 ¿cuál es la mayor derivada direccional en (2, 3) y en que dirección
se obtiene esta derivada direccional máxima? La respuesta a esta pregunta la tiene el vector gradiente. Puedes
−
→ −
→
comprobar que ∇f (2, 3) = 108 i + 108 j y por tanto el valor de la máxima derivada direccional es |∇f | =
√ −
→
108 2 y este valor se alcanza para la dirección que marca el gradiente, que serı́a en este caso −
→
u = cos(π/4) i +
−→
sen(π/4) j . 2
Ejemplo. Una interpretación igualmente gráfica como curiosa del significado del gradiente lo da el siguiente
ejemplo. Supongamos una montaña sobre el plano XY . La altitud de la superficie sobre el punto (x, y) la
denotaremos por z = f (x, y). La derivada direccional indica el ritmo al cual cambia la altitud por unidad de
cambio en distancia horizontal. El gradiente ∇f (a, b) apunta a la dirección que un montañero deberı́a seguir si
desea escalar en la dirección de mayor pendiente. El módulo |∇f | indica la mayor pendiente disponible. 2
2.3.7. Derivadas parciales de orden superior
Sea z = f (x, y), llamaremos derivada parcial segunda (o de segundo orden) de f respecto de x dos veces a la
derivada respecto de x de la derivada parcial primera respecto de x, es decir,
fx (x + h, y) − fx (x, y)
lim
h→0 h
∂ ∂f ∂ z2 ∂2f
denotándose por zxx , fxx , ∂x ( ∂x ), ∂x2 o ∂x2 .
Análogamente llamaremos derivada parcial segunda (o de segundo orden) de f respecto de y dos veces a la
derivada respecto de y de la derivada parcial primera respecto de y:
fy (x, y + h) − fy (x, y)
lim
h→0 h
∂ ∂f ∂2z ∂2f
denotándose por zyy , fyy , ∂y ( ∂y ), ∂y 2 o ∂y 2 .
Se llama derivada segunda de f respecto de y y respecto de x, a la derivada parcial respecto de x de la derivada

∂ ∂f ∂2z ∂2f
parcial de f respecto de y, denotándose por zyx , fyx , ∂y ( ∂y ), ∂x∂y o ∂x∂y .
Ejemplo. Para la función f (x, y) = y cos(xy) se tiene

∂f
= −y 2 sen(xy),
∂x
∂f
= cos(xy) − yx sen(xy),
∂y
∂2f
= −y 3 cos(xy),
∂x2
∂2f
= −2x sen(xy) − yx2 cos(xy),
∂y 2
∂2f ∂2f
= = −2y sen(xy) − xy 2 cos(xy)
∂x∂y ∂y∂x
2
En el ejemplo anterior hemos observado que las derivadas mixtas coinciden, ¿en qué casos esto vuelve a suceder?
La respuesta a esta pregunta la da el Teorema de Schwartz (ver bibliografı́a recomendada) que se enuncia en los
siguientes términos:
180 MATEM ÁTICAS
Sea z = f (x, y) una función tal que existen fx , fy y fxy en un entorno U del punto (a, b) y son continuas en
(a, b), entonces existe fyx (a, b) y además fxy (a, b) = fyx (a, b).
Para la función z = f (x, y) hemos visto las cuatro derivadas segundas fxx , fyx , fxy , fyy , aunque ya sabemos
que bajo las hipótesis del Teorema de Schwartz las derivadas mixtas coinciden. Siguiendo este proceso podemos
definir las derivadas terceras fxxx , fxyx , fxxy , fxyy , fyxx , fyyx , fyxy y fyyy aunque sólo hay 4 distintas bajo las
hipótesis del Teorema de Schwartz. En general existen 2p derivadas de orden p , pero sólo p + 1 son distintas bajo
las hipótesis del mencionado teorema:
∂pf ∂pf ∂pf ∂pf ∂pf
, , , ...., y
∂xp ∂y∂xp−1 ∂y 2 ∂xp−2 ∂y p−1 ∂x ∂y p
2.3.8. Extremos relativos y absolutos
Consideremos f : A ⊂ R2 → R una función de dos variables con valores reales, con dominio de definición en
A, que habitualmente denotamos como z = f (x, y). Consideraremos a continuación el problema de maximizar o
minimizar a la mencionada función en A.
Si existe un punto (x0 , y0 ) ∈ A tal que f (x0 , y0 ) > f (x, y ) para todo (x, y) ∈ A, entonces diremos que f tiene
un máximo absoluto en A.
Análogamente definimos el concepto de mı́nimo absoluto sin más que exigir ahora que f (x0 , y0 ) 6 f (x, y ) para
todos los puntos de A.
No siempre existe un punto en el dominio de la función que cumpla las caracterı́sticas anteriores. De hecho hay
que buscar un cierto tipo de subconjuntos de R2 que aseguran la existencia de máximos y mı́nimos absolutos, son
los llamados conjuntos compactos.
Recordemos primero (ver Capı́tulo 2 y bibliografı́a recomendada) que para funciones reales de una variable real
se define la noción de extremo relativo como un punto x0 del dominio de la función para el que existe un entorno
(puntos suficientemente próximos al valor x0 ) tal que para cualquier punto de ese entorno se cumple la condición
de máximo o mı́nimo absoluto descrita con anterioridad. Es decir hacemos un estudio “local”, entendiendo por
ello las proximidades del punto sometido a estudio.
¿Qué procederı́a hacer ahora para una función de R2 , z = f (x, y)? ¿Cómo se introducen el concepto de entorno
y de proximidad en el plano?
Las respuestas a estas dos cuestiones la hemos estudiado ya al introducir la definición de lı́mite para funciones
2
de varias variables. Debeisp recordar que el concepto de distancia entre dos puntos de R puede definirse como
2 2
d((x0 , y0 ), (x1 , y1 )) = (x1 − x0 ) + (y1 − y0 ) . Ası́ los puntos que distan
2
p menos que δ de un punto (x0 , y0 ) ∈
R , vienen expresado por los puntos (x, y) que satisfagan la inecuación (x − x0 )2 + (y − y0 )2 < δ.
¿Cómo piensas que se representarı́a graficamente esta situación en el plano? ¿Qué es ahora gráficamente un
entorno de (x0 , y0 )?
Pues bien, ahora estamos en condiciones de definir el concepto de máximo relativo (resp. mı́nimo relati-
vo) como un punto (x0 , y0 ) ∈ A tal que exista un δ > 0 verificando que para todo (x, y) ∈ A que cumpla
p
(x − x0 )2 + (y − y0 )2 < δ se tiene f (x0 , y0 ) > f (x, y) (resp. f (x0 , y0 ) 6 f (x, y)).
¿Cómo definirı́as los conceptos de máximo y mı́nimo relativo para una función de tres variables w = f (x, y, z)?
Observa que el concepto ahora depende de la definición de distancia entre dos puntos en R3 , que vendrı́a dado por
p
d((x0 , y0 , z0 ), (x1 , y1 , z1 )) = (x1 − x0 )2 + (y1 − y0 )2 + (z1 − z0 )2 .
¿Cómo se representarı́a con esta distancia un entorno en el espacio R3 de un punto (x0 , y0 , z0 )?
Puedes completar, consultando la bibliografı́a recomendada, la definición de máximo y mı́nimo de una función
w = f (x, y, z).
Para completar el estudio, ¿como piensas que se puede definir una distancia en Rn ? ¿Cómo definirı́as los con-
ceptos de máximo y mı́nimo relativos para una función de n variables w = f (x1 , x2 , ..., xn )?
Condición necesaria para la existencia de extremo: Sea w = f (x1 , x2 , ..., xn ) una función que cumple que
todas sus derivadas parciales son continuas. Si tiene un máximo o un mı́nimo relativo en un punto de su dominio
entonces las n derivadas parciales de f particularizadas en dicho punto deben ser todas iguales a cero.
Esto es, para una función z = f (x, y) se traduce en que si existe un máximo o mı́nimo relativo (extremo relativo)
en (x0 , y0 ) entonces
∂f ∂f
(x0 , y0 ) = 0 y (x0 , y0 ) = 0.
∂x ∂y
Recuerda que en funciones de una variable la condición de derivada nula venı́a a indicar la existencia de recta
tangente paralela al eje OX. Evidentemente la tradución al caso de funciones de dos variables (superficies)
vendrı́a dada por la existencia del plano tangente paralelo al plano XY .
Al igual que ocurrı́a en funciones de una variable, el recı́proco de este resultado no se cumple.
Ejemplo. Consideremos la función f (x, y) = (y − x2 )(y − 2x2 ). Se puede comprobar fácilmente que se cumple
fx (0, 0) = 0 y fy (0, 0) = 0. Ahora bien f (0, 0) = 0, pero la función toma tanto valores positivos como negativos
en cada entorno de (0, 0). ¿Cómo probarı́as esta última afirmación? 2
Dada una función w = f (x1 , x2 , ..., xn ) con derivadas parciales continuas, diremos que un punto de su dominio
es estacionario o crı́tico si todas las derivadas parciales se anulan en él. O lo que es lo mismo si el vector
gradiente es nulo. Más explı́citamente, para una función de dos variables z = f (x, y), se deberı́a cumplir que
−→
∇f (x0 , y0 ) = 0 .
Es importante, al igual que hacı́amos en el estudio local de funciones de una variable, encontrar condiciones
suficientes que nos garanticen la existencia de extremos relativos, identificando en cada caso si son máximos o
mı́nimos.
Sea z = f (x, y) una función con derivadas parciales de segundo orden fxx , fyx = fxy , fyy continuas en un punto
estacionario (x0 , y0 ) ∈ R2 y consideremos el siguiente determinante
2
∂ f (x , y ) ∂2f ∂2f ∂2f ∂2f
∂x2 0 0 ∂y∂x (x0 , y0 )
∆ = ∂2f 2 = (x 0 , y0 ) (x 0 , y0 ) − ( (x0 , y0 ))2 .
(x 0 , y0 ) ∂ f
2 (x 0 , y0 ) ∂x2 ∂y 2 ∂y∂x
∂y∂x ∂y
Entonces se verifica lo siguiente:
(1) Si ∆ > 0 y fxx (x0 , y0 ) > 0, f tiene un mı́nimo relativo en (x0 , y0 ).
(2) Si ∆ > 0 y fxx (x0 , y0 ) < 0, f tiene un máximo relativo en (x0 , y0 ).
(3) Si ∆ < 0, f no tiene ni máximo ni mı́nimo relativo en (x0 , y0 ) (punto de silla, ver Figura 6.2).
Puedes consultar la bibliografı́a recomendada para comprobar que no es demasiado complicado a efectos prácticos,
generalizar este criterio para funciones de n variables, estudiando el signo de una sucesión de determinantes.
Ejemplo. La función f (x, y) = (2x − y + 1)2 + (x − 3y)2 + 1 alcanza un mı́nimo en el punto (− 53 , − 15 ),

conclusión que podemos sacar de igualar las derivadas parciales a cero, obteniendo las ecuaciones 2x − y + 1 = 0
182 MATEM ÁTICAS
Figura 6.2: La superficie de la figure tiene un punto de silla en el origen.
y x − 3y = 0. Después aplicamos el criterio de la condición suficiente que hemos descrito con anterioridad,
obteniéndose que
2
∂ f (− 3 , − 1 ) ∂2f 3 1 10 −10
∂x2 5 5 ∂y∂x (− 5 , − 5 ) = 300 > 0.
∆ = ∂2f ∂2f =
(− 3
, − 1
) 2 (− 3
, − 1
) −10 20
∂y∂x 5 5 ∂y 5 5
2
Ejemplo. Dada la función f (x, y) = (x + 1)2 + 3(y − 23 )2 − 21 9 , puedes comprobar siguiendo un procedimiento
análogo al descrito para el ejemplo anterior, que f tiene un mı́nimo en (−1, 23 ). 2
2.3.9. Extremos condicionados
Hemos visto en el epı́grafe anterior cómo se pueden estudiar los extremos relativos de una función z = f (x, y).
Ahora bien, es posible que la ecuación de la superficie esté dada de manera implı́cita, es decir, se pueda dar por
ejemplo con una ecuación g(x, y, z) = 0, de la cual pueda ser muy complicado en la práctica despejar una variable
en función de las otras dos. Incluso podemos complicar todavı́a más la situación si pedimos estudiar los extremos
en los puntos de una curva en el espacio que se puede dar como intersección de dos superficies, que a su vez
vengan expresadas de forma implı́cita por sendas ecuaciones g1 (x, y, z) = 0 y g2 (x, y, z) = 0.
En el caso de tres variables, el problema se podrı́a exponer de la manera siguiente:
(1) Sea w = f (x, y, z) con derivadas parciales primeras y segundas continuas en un punto (x0 , y0 , z0 ).
(2) Consideremos en la función las siguientes condiciones de ligadura, es decir, condiciones a las que somete-
mos a las variables en la búsqueda de los valores extremos de la función:
g1 (x, y, z) = 0, g2 (x, y, z) = 0, . . . , gm (x, y, z) = 0.
En las mismas condiciones descritas anteriormente, buscamos una condición necesaria para que la función f (x, y, z)
tenga un extremo relativo (máximo o mı́nimo) restringido a las siguientes condiciones de ligadura: g1 (x, y, z) = 0,
g2 (x, y, z) = 0, . . . , gm (x, y, z) = 0. Para ello construimos la función
L(x, y, z) = f (x, y, z) + λ1 g1 (x, y, z) + λ2 g2 (x, y, z) + · · · + λm gm (x, y, z),
en donde los λi (i = 1...n) se consideran constantes (se conocen con el nombre de multiplicadores de Lagran-
ge).
La condición de Lagrange dice que si el punto (x0 , y0 , z0 ) es un máximo o mı́nimo de la función sometida a
las condiciones de ligadura anteriormente expuestas, entonces es satisface el sistema de las m + 3 ecuaciones
siguientes:
∂L
(x, y, z) = 0,
∂x
∂L
(x, y, z) = 0,
∂y
∂L
(x, y, z) = 0,
∂z
g1 (x, y, z) = 0,
g2 (x, y, z) = 0,
.. ..
. = .
gm (x, y, z) = 0.
Observación. (1) Existe un procedimiento para distinguir cuando tenemos máximos o mı́nimos, pero en general
suele ser más útil el uso de procedimientos intuitivos (preferentemente de tipo geométrico) que nos permitan hacer
tales distinciones.
(2) El método explicado anteriormente como ejemplo para funciones de tres variables, tiene una generalización
clara para n. Bastarı́a considerar ahora m + n ecuaciones construidas de forma análoga a las anteriormente
descritas (ver bibliografı́a recomendada)
Ejemplo. Vamos a minimizar la función f (x, y, z) = x2 + y 2 + z 2 sujeta a las condiciones
x + 2y + 3z = 6,
x + 3y + 9z = 9.
Para ello construimos la función L(x, y, z) = x2 + y 2 + z 2 + λ1 (x + 2y + 3z − 6) + λ2 (x + 3y + 9z − 9) y de

aquı́ obtenemos el sistema formado por las siguientes ecuaciones:
∂L
(x, y, z) = 2x + λ1 + λ2 = 0,
∂x
∂L
(x, y, z) = 2y + 2λ1 + 3λ2 = 0,
∂y
∂L
(x, y, z) = 2z + 3λ1 + 9λ2 = 0,
∂z
x + 2y + 3z = 6,
x + 3y + 9z = 9.
Despejamos x, y, z en las tres primeras y sustituimos en las dos últimas obteniendo:
14λ1 + 34λ2 = −12

34λ1 + 91λ2 = −18
y finalmente
240 78
λ1 = − y λ2 = .
59 59
81 123 9
Para estos valores de los multiplicadores de Lagrange obtenemos el punto P ( 59 , 59 , 59 ) 2
Ejemplo. Puedes usar el método de Lagrange para demostrar que entre todos los paralelepı́pedos de volumen
dado, el que tiene superficie mı́nima es precisamente un cubo. 2
184 MATEM ÁTICAS
2.4. Curvas parametrizadas en R3
2.4.1. Parametrización regular. Vectores velocidad y aceleración
−→ −
→ −
→ −→ −
→
Una función vectorial R (t) = x(t) i + y(t) j + z(t) k definida R : I ⊂ R → R3 , donde I es un intervalo
abierto de la recta real, gráficamente describe una curva en el espacio para los distintos valores del parámetro t.
Esta representación paramétrica diremos que es regular cuando tiene las siguientes propiedades:
−
→
(1) R (t) = (x(t), y(t), z(t)) es de clase C 1 (continua y con derivada continua) en el intervalo I.
−→ −→
(2) dR
dt (t) 6= 0 para todo t de I.
Cuando en vez de clase C 1 se exige clase C n (continua y con derivadas sucesivas continuas hasta orden n) se
suele decir que es regular de clase n.
Un ejemplo significativo de una curva parametrizada en el espacio es la llamada hélice circular, cuya parametiza-
ción viene dada por:
−
→
R (t) = (a cos θt, a sen θt, bt), con a, b 6= 0, t ∈ R.
Figura 6.3: Hélice circular.
Por semejanza a la interpretación fı́sica que surge del movimiento de una partı́cula en el espacio, representado éste
−
→
por la parametrización de una curva R (t) = (x(t), y(t), z(t)), se define el concepto de velocidad como el vector
−
→
−
→v = ddtR .
A su vez también podemos definir a partir de él, otro vector que mida la variación −
→
v en función del parámetro t.
Lo llamaremos vector aceleración y se define como
−→
−
→ d−
→v d2 R d2 x −
→ d2 y −
→ d2 z −
→
a = = 2
= 2 i + 2 j + 2 k.
dt dt dt dt dt
2.4.2. Longitud de arco para curvas en el espacio. El vector unitario tangente
−
→
La longitud de arco de una curva R (t) = (x(t), y(t), z(t)) entre los valores del parámetro t = a y t = b viene
dada por la siguiente expresión:
Z b Z bp
L= |−
→
v | dt = x0 (t)2 + y 0 (t)2 + z 0 (t)2 dt
a a
−
→
Si elegimos un punto de referencia en la curva P0 = R (t0 ), y notamos la longitud de arco
Z tp
s(t) = x0 (t)2 + y 0 (t)2 + z 0 (t)2 dt
t0
el teorema fundamental del cálculo integral nos lleva a deducir que

ds p 0 2
= x (t) + y 0 (t)2 + z 0 (t)2 = |−
→
v |.
dt
−
→
Ejemplo. Vamos a calcular la longitud de una vuelta de la hélice R (t) = (cos t, sen t, t). Observemos que la
hélice da una vuelta completa cuando t varı́a de 0 a 2π. Ası́, obtenemos que el cálculo corresponde a
Z 2π p Z 2π √ √
(− sen t)2 + (cos t)2 + 12 dt = 2dt = 2π 2,
0 0
√
es decir, la longitud de una vuelta de la hélice es 2 veces la del cı́rculo unidad del plano XY en el que la hélice
se proyecta. 2
−
→
Si consideramos la curva R (t) = (x(t), y(t), z(t)) representada por una parametrización regular y la longitud de
−
→
arco s(t) medida desde un punto de referencia P0 = R (t0 ) y si además dsdt 6= 0 , podemos deducir (derivada de
la función inversa) que
dt 1
= − → .
ds |v|
Esto unido a que
−
→ −→
dR d R dt dt
= =−
→
v.
ds dt ds ds
dt
tomando módulos (no se olvide que ds es una magnitud escalar) se obtiene
− −
d→ →
R d R dt 1
= = |−
→
v| − = 1.
ds dt ds |→v|
−
→ −
→ −→
Llamaremos a ddsR el vector tangente unitario de la curva y lo denotaremos por T (o por T (s) si queremos
especificar el punto de la curva en el que calculamos el vector tangente, haciendo referencia al parámetro arco).
Cuando la parametrización de la curva no está expresada en función del parámetro longitud de arco, la manera
−
→ −
→
v
de calcular T es con la expresión |−
→
v|
.
−
→
Ejemplo. Vamos a calcular el valor del vector T para los puntos de la curva dada por la parametrización
−
→
R (t) = (cos t + t sen t, sen t − t cos t, 0).
Para esta curva (que está contenida en el plano XY ) se obtiene

−
→
v = (− sen t + t cos t + sen t, cos t + t sen t − cos t, 0)
−
→
y de aquı́ |−
→
v | = t. De esta forma concluimos que T = (cos t, sen t, 0). 2
186 MATEM ÁTICAS
2.4.3. Curvatura y torsión de una curva. El triedro de Frenet
Uno de los grandes problemas que plantea la geometrı́a es determinar y cuantificar los elementos que pueden
llevar a distinguir unas figuras de otras. Este problema se puede resolver para curvas lo suficientemente “suaves”
(es decir, con un número suficiente de derivadas sucesivas continuas). Veremos que una curva regular viene
determinada por únicamente dos magnitudes escalares que llamaremos curvatura y torsión.
−
→ −→
Supongamos que R = R (s) , donde s es el parámetro arco, es una curva regular de clase mayor o igual que
−
→ −→ −→ −
→
2. Consideremos ddsT = R00 (s). Al vector ddsT se denomina vector curvatura de la curva en el punto R (s) y
−
→ −
→
κ = ddsT . No es difı́cil demostrar que −
se denota con la expresión −
→ →
κ es un vector ortogonal a T (consecuencia
−→ −
→− →
de que T es un vector unitario y de derivar la expresión T . T = 1). Al módulo del vector curvatura |−
→
κ (s)| lo
−→
llamaremos curvatura de la curva en R (s) y lo denotaremos por κ(s). Llamaremos radio de curvatura a la
1
expresión ρ(s) = κ(s) .
Figura 6.4: Curvatura de una curva en el espacio.
La interpretación de la curvatura es la del valor del cambio de dirección de la tangente respecto de la longitud de
arco. De esta forma, una curva en la que la dirección de la tangente cambie rápidamente en relación con la longitud
de arco, tiene una curvatura grande y por tanto un radio de curvatura pequeño (piensa en una circunferencia de
radio pequeño).
Ejemplo. ¿Cuál será la curvatura y el radio de curvatura de la circunferencia de radio a dada por la parametrización
−
→
R (t) = (a cos t, a sen t, 0)? Veamos:
−
→
dR
= (−a(sen t), a(cos t), 0)
dt
−
→
y de esta forma ddtR = a. Además se tiene
−
→
dR
−
→
T = dt
→ = (− sen t, cos t, 0)
−
ddtR
y por tanto
−
→ −→ −
dT
→
dT
−
→
−
→ dT d T dt 1
κ = = = ds
= dt
−→ = − (cos t, sen t).
ds dt ds ds dR a
dt dt
El vector curvatura siempre está dirigido hacia el origen y la curvatura es constante e igual a 1/a, lo que demuestra
que el radio de curvatura coincide precisamente con el radio de la circunferencia. 2
Siempre que la curva venga parametrizada por algún parámetro t que no sea la longitud de arco se tiene
−
→
dT
−
→
κ = dt
→ .
−
ddtR
Ejemplo. Puedes comprobar que la curvatura en cada punto de la hélice expresada por la parametrización regular
−
→
R (t) = (a cos t, a sen t, bt) con a > 0, b 6= 0 y t ∈ R viene expresada por
−
→
dT
−
→ a
κ = dt
→ = 2
− (− cos t, sen t, 0).
dR a + b2
dt
Observa que el vector −

→
κ es paralelo al plano XY y está dirigido hacia el origen. La curvatura es constante e igual
a
a a2 +b2 . 2
Propiedades.
• Una curva regular de clase mayor o igual que 2 es una recta si y sólo si su curvatura es idénticamente nula.
−
→ − →
• Sea R = R (t) una representación arbitraria de una curva de clase mayor o igual que 2, entonces se tiene
−
→0 −→
R × R00
κ= −
→0 .
R
−→
Siempre y cuando −
→
κ (s) 6= 0 podremos escoger el vector unitario
−
→ −
→
κ (s)
N (s) = −
|→
κ (s)|
−
→
que se denomina vector unitario normal principal a la curva en el punto R (s).
−→ −
→
Observación. A lo largo de una recta −
→
κ (s) = 0 , luego N no estarı́a determinado.
−→
Dado un punto de la curva representado por R (s), llamaremos recta normal principal a la recta que pasa por
−
→
el mencionado punto y tiene como vector director el vector N (s). Llamaremos plano normal al plano que pasa
−
→
por el punto R (s) y es perpendicular a la recta tangente a la curva en ese punto. Plano osculador se llama al que
−
→ −
→ −→
pasa por el punto R (s) y contiene a los vectores N (s) y T (s).
z
C
B
N
x T
B
y
N x
−
→
Ejemplo. Dada la hélice R (t) = (cos t, sen t, t), vamos a calcular la ecuación de la normal principal y el plano
−
→ −
→
osculador en el punto t = π/2. Como − → −
→
κ 6= 0 para todo t se tiene que N = |− κ
→
κ|
= (− cos t, sen t, 0). La
ecuación de la normal principal vendrı́a dada por

 x = 0
y = 1 − λ, λ∈R

z = π2
188 MATEM ÁTICAS
La ecuación del plano osculador saldrı́a de resolver

x y − 1 z − π2

− √1 √1

0 = 0,
2 2
0 −1 0
es decir,
π
x+z =
2
2
−→ −
→ −
→ −
→ −→ −→ −
→
Consideremos ahora el vector B (s) = T (s) × N (s). Observa que B es continuo y unitario, y que ( T , N , B )
−→
forma una base ortonormal positivamente orientada. B (s) recibe el nombre de vector unitario binormal a la
−
→ −→ −
→ −
→
curva en el punto R (s). ( T (s), N (s), B (s)) recibe el nombre de triedro de Frenet o triedro móvil.
Recta binormal
B
Plano normal
Plano rectificante
x N Recta normal
Plano osculador
T
Recta tangente
Figura 6.5: Rectas y planos asociados a una curva en el espacio.
−
→ −
→ − →
Llamaremos plano rectificante al plano que pasa por el punto R (s) y contiene a los vectores B y T .
−
→ − →
Observa que el plano normal es el que contiene a los vectores B y N .
−
→
Ejemplo. Dada la hélice R (t) = (a cos t, a sen t, bt), puedes comprobar que el plano rectificante a la curva en el
punto correpondiente a t = π2 tiene como ecuación y = a. 2
−
→ − → −
→
Consideremos que R = R (s) es una curva regular de clase mayor o igual a 3 y que a lo largo de ella N (s) es de
−
→ −
→ −
→
clase C 1 . B (s) = T (s) × N (s), derivando esta expresión obtenemos:
−
→ −
→ −
→ −
→ −
→ −
→ −
→
B 0 (s) = T 0 (s) × N (s) + T (s) × N 0 (s)
= T (s) × N 0 (s) (∗)
−
→0 −
→ −→ → −
− →0
ya que T (s) y N (s) son proporcionales. Se tiene además que N = 1 y por tanto N y N son ortogonales y
−
→
por esta razón N 0 serı́a paralelo al plano rectificante y de aquı́
−
→ −→ −→
N 0 (s) = λ(s) T (s) + τ (s) B (s).
Sustituyendo esta expresión en (∗) y operando (con algunas consideraciones que se dejan al lector) se llega final-
mente a −
→ −
→
B 0 (s) = −τ (s). N (s) (∗∗)
−
→
A la función continua τ (s) se denomina torsión de la curva en R (s).
−
→ −
→ −→
Si multiplicamos (∗∗) escalarmente por N se obtiene τ (s) = −B 0 (s). N (s), expresión del valor de la torsión en
un punto.
−
→
Ejemplo. Dada la hélice R (t) = (a cos t, a sen t, bt), se tiene

−
→ b sen t −b cos t a
B = √ ,√ ,√ .
2
a +b 2 2
a +b 2 a + b2
2
De aquı́ deducimos que

−
→ −
→
dB
dB b cos t b sen t
= −→ =
dt
√ ,√ ,0 .
ds ddtR a2 + b2 a2 + b2
−
→ −→
Luego τ (s) = −B 0 (s). N (s) = b
a2 +b2 , lo que demuestra que la torsión en esta curva es siempre constante. 2
Propiedades.
−
→
• Si una curva es regular de clase mayor o igual que 3 y a lo largo de ella N es de clase C 1 , entonces se
tratará de una curva plana si y sólo si su torsión es idénticamente nula.
−
→ − → −→
• En un punto de la curva R = R (t) en el que −
→
κ 6= 0 se tiene
−→ − → −→
det(R0 , R00 , R000 )
τ= − →2
→0 −
R × R00
• Se verifican las siguientes expresiones (fórmulas de Frenet):

−→
dT −
→
= κN
ds
−→
dN −→ −→
= −κ T + τ B
ds
−→
dB −
→
= −τ N
ds
Ejemplo. Se puede demostrar que la curva

−
→ 1 + t 1 − t2
R (t) = t, ,
t t
está contenida en un plano sin más que comprobar que su torsión es 0 en cualquier punto. 2
−
→
Ejemplo. Para la curva R (t) = (t − sen t, 1 − cos t, t) el valor de la curvatura y la torsión en el punto t = 0 es
κ(0) = 1 y τ (0) = 1 (Compruébalo). 2
2.5. Superficies parametrizadas en R3
El concepto intuitivo de superficie parametrizada es el de un conjunto de puntos del espacio que es parecido a una
−
→
porción de plano en un entorno de cada uno de ellos. Esto sucede cuando existe una aplicación X : U ⊂ R. → R3 ,
−
→
definida por X (u, v) = (x(u, v), y(u, v), z(u, v)) que es lo suficientemente regular.
190 MATEM ÁTICAS
−
→
Suponemos en principio que X es por lo menos de clase C 1 . Además para asegurarnos de que en todo punto
existe un plano tangente, supondremos que
 
∂x ∂x
−
→ −
→
 ∂u
∂y
∂v
∂y  ∂X ∂X −→
rango  ∂u ∂v  = 2 ⇐⇒ × 6= 0 ,
∂z ∂z ∂u ∂v
∂x ∂y
donde consideramos
→
− →
−
∂X ∂x ∂y ∂z ∂X ∂x ∂y ∂z
= , , y = , , .
∂u ∂u ∂u ∂u ∂v ∂v ∂v ∂v
Habitualmente notaremos
−
→ −
→ −→ −→
−
→ ∂X −
→ ∂X −
→ ∂2 X −
→ ∂2 X
Xu = , Xv = , X uu = , X uv =
∂u ∂v ∂u2 ∂v∂u
y ası́ sucesivamente.
→ −
− → −
→ −
→ −→
Observa que los vectores X u y X v forman una base del plano tangente siempre y cuando X u × X v 6= 0 y que
−→ −
→
−
→ X u (u, v) × X v (u, v)
N (u, v) = −
→ −
→
X u (u, v) × X v (u, v)
−
→
representa un vector normal unitario en cada punto de la superficie. Decimos que X : U ⊂ R. → R3 es una
parametrización regular de clase C m de la superficie S si y sólo si:
−
→
(1) X ∈ C m (U ), m > 1.
−
→ −
→ −→
(2) X u × X v 6= 0 para todo (u, v) ∈ U .
Ejemplo. Vamos a hallar las ecuaciones del plano tangente y de la recta normal a la superficie representada por
−
→ −→ −
→
X (u, v) = (u, v, u2 − v 2 ) en el punto correspondiente a u = 1, v = 1. Veamos, X (1, 1) = (1, 1, 0), X u (1, 1) =
−
→
(1, 0, 2) y X v (1, 1) = (0, 1, −2). La ecuación del plano tangente vendrı́a dada por

x−1 y−1 z

1 0 2 = 0,

0 1 −2
y la ecuación de la recta normal, habida cuenta que el vector normal unitario al plano en el punto en cuestión viene
dado por:
−→ −
→
−
→ X u (1, 1) × X v (1, 1) 1
N = − → −
→ = (−2, 2, 1),

X u (1, 1) × X v (1, 1) 3
se expresa en forma paramétrica como


 x = 1 − 2λ
y = 1 + 2λ, λ∈R

z = λ
2
2.5.1. Coeficientes de la primera y segunda forma fundamental
Los coeficientes de la primera forma fundamental vienen dados por las siguientes expresiones:
−
→ −→ − 2
→
E(u, v) = X u (u, v). X u (u, v) = X u (u, v)
−
→ −→
F (u, v) = X u (u, v). X v (u, v)
−
→ −→ − 2
→
G(u, v) = X v (u, v). X v (u, v) = X v (u, v)
Ejemplo. Consideremos la superficie parametrizada por

−
→
X (u, v) = (u + v, u − v, uv).
Los coeficientes de la primera forma fundamental vendrı́an dados por
E(u, v) = 2 + v 2
F (u, v) = vu
G(u, v) = 2 + u2
2
Observemos que
−
→ −
→ E F
X u (u, v) × X v (u, v) = EG − F =
2
F G
y por tanto
−→ −
→
−
→ X u (u, v) × X v (u, v) 1 −→ −
→
N (u, v) = − = √ ( X u × X v ).
→ −
→ − 2
X u (u, v) × X v (u, v) EG F
−
→
Ejemplo. Para la superficie X (u, v) = (u + v, u − v, uv) dada en el ejemplo anterior, se tiene EG − F 2 =
4 + 2v 2 + 2u2 . Observa que el valor de esta cantidad es siempre estrictamente mayor que cero. 2
−
→ − →
Si llamamos θ al ángulo que forman los vectores X u y X v , se tiene
F −→ −
→
cos θ = √ √ ( X u × X v ).
E G
−
→ −
→
Esto quiere decir, entre otras cosas, que en una superficie parametrizada regular, X u y X v son perpendiculares
si y sólo si F = 0.
Pasamos ahora a introducir los llamados coeficientes de la segunda forma fundamental:
−→
→ ∂2 X
−
e = N.
∂u2
−→
→ ∂2 X
−
f = N.
∂u∂v
−→
→ ∂2 X
−
g = N.
∂v 2
192 MATEM ÁTICAS
−
→
Se llama curvatura de Gauss de una superficie parametrizada regular, en el punto X (u, v), a la expresión

e f

f g eg − f 2
K= = .
E F EG − F 2

F G
Observa que EG − F 2 > 0 siempre, con lo que el signo de K depende directamente de eg − f 2 .
Distinguiremos cuatro casos que dependen del discriminante eg − f 2 .
Figura 6.6: Distintos tipos de puntos en relación con su curvatura de Gauss.
Caso elı́ptico: Se dice que un punto es elı́ptico si K > 0. Viene a expresar que el comportamiento de la función
en las proximidades del punto es el de un paraboloide elı́ptico.
Caso hiperbólico: Se dice que un punto es hiperbólico si K < 0. En este caso existen en el plano tangente dos
rectas distintas que lo dividen en cuatro regiones.
Caso parabólico: Se dice que un punto es parabólico si K = 0 y e2 + f 2 + g 2 6= 0, es decir, los coeficientes e, f
y g no son todos iguales a cero. En este caso nos encontraremos con un cilindro parabólico como se puede
ver en la figura.
Caso plano: Se dice que un punto es plano si e = f = g = 0.
Ejemplo. Dada la parametrización regular de la esfera de centro (0, 0, 0) y radio a:

−
→
X (u, v) = (a(cos u)(sen v), a(sen u)(sen v), a cos v)
se puede comprobar fácilmente (se deja para el lector) que

e f

f g eg − f 2 1
K= = = 2,
E F EG − F 2 a

F G
curvatura por tanto siempre constante en todos los puntos de la superficie y que depende sólo del radio de la esfera.
Esto nos indicarı́a que K > 0 (caso elı́ptico), y serı́a más próxima a cero cuanto más grande fuera el radio de la
esfera, es decir, estarı́a más cerca de parecerse a un plano. 2

−
→
A.6.1. Calcular F 0 (t) si :
−
→
(a) F (x) = (xex , ln(3x), 0) y x = ln t
−
→ √
(b) F (x) = (cos( x), arctan x, 1+−1 √ ) y x = t2 + 2t + 1.
x
A.6.2. Calcular el dominio y el rango de las siguientes funciones de dos variables:

√
(a) f (x, y) = x + y.
p
(b) f (x, y) = 4 − x2 − y 2 .
(c) f (x, y) = √1 .
x+y
A.6.3. Calcular los lı́mites (si existen) en los siguientes casos:

3x2 − y 2 + 5
(a) lim .
(x,y)→(0,0) x2 + y 2 + 2
x2 − 2xy + y 2
(b) lim .
(x,y)→(1,1) x−y
xy + y − 2x − 2
(c) lim .
(x,y)→(−2,2) x+1
A.6.4. Considerando diferentes curvas de aproximación, demostrar que las siguientes funciones no tienen lı́mite
cuando (x, y) → (0, 0).
x+y
(a) .
x−y
x2 − y 2
(b) .
x2 + y 2
x
(c) p .
x + y2
2
∂f ∂f
A.6.5. Calcular ∂x y ∂y en los siguientes casos:
x
(a) f (x, y) = e cos y.
p
(b) f (x, y) = 9 − x2 − y 2 .
(c) f (x, y) = ex ln y .
A.6.6. Sea w = f (x, y, z) = x2 + y 2 + z 2 , z = g(x, y) = x2 + y 2 . Calcular ∂w

∂x .
A.6.7. Calcular la ecuación del plano tangente al elipsoide de ecuación
x2 y2
+ + z2 = 1
4 9
√
3
en el punto (1, 0, 2 ).
A.6.8. Suponiendo que las funciones arbitrarias ϕ, ψ son diferenciables un número suficiente de veces, comprobar
las siguientes igualdades:
∂z ∂z
(a) y −x = 0, si z = ϕ(x2 + y 2 ).
∂x ∂y
∂z ∂z y2
(b) x2 − xy + y 2 = 0, si z = 3x + ϕ(xy)
∂x ∂y
A.6.9. Hallar las siguientes derivadas:
∂3w
(a) si w = x ln(xy).
∂x2 ∂y
∂6w
(b) si w = x3 sen y + y 3 sen x.
∂x3 ∂y 3
194 MATEM ÁTICAS
A.6.10. Hallar los extremos relativos de las funciones siguientes (en el caso de que existan):
(a) f (x, y) = y 2 + x2 y + x4 .
(b) f (x, y) = x2 + y 2 + x + y + xy.
(c) f (x, y) = y 2 − x3 .
(d) f (x, y) = x4 + y 4 − 2(x − y).
(ax + by + c)2
(e) f (x, y) = .
x2 + y 2 + 1
A.6.11. Entre todas las cajas de zapatos (sin tapa superior) de volumen dado, hallar la que tiene superficie mı́nima.
A.6.12. Hallar la menor distancia del punto (0, b) del eje OY a la parábola x2 − 4y = 0.
−
→
A.6.13. En cada uno de los siguientes casos, calcular el vector unitario tangente T .
−
→
(a) R (t) = (2 cos t, 2 sen t).
−
→ 3 2
(b) R (t) = ( t3 , t2 ).
−
→
(c) R (t) = (6 sen(2t), 6 cos(2t), 5t) (para t = π).
−
→
(d) R (t) = (et cos t, et sen t, et ) (para t = 0).
−
→
A.6.14. Calcular la longitud de la curva R (t) = (1, t, t2 ) desde el punto (1, 0, 0) al punto (1, 1, 1).
−
→
A.6.15. Calcular la longitud de la curva R (t) = (t, t, 4 − t2 ) desde el punto (0, 0, 4) al punto (1, 1, 3).
−
→
A.6.16. Hallar las ecuaciones de la recta tangente y del plano normal a la curva R (t) = (1 + t, −t2 , 1 + t3 ) en
t = 1.
−
→ 2 3
A.6.17. Hallar el vector curvatura y la curvatura de la curva R (t) = (t, t2 , t3 ).
−
→ −→
A.6.18. Demostrar que una curva de clase > 2 es una recta si R0 (t) y R00 (t) son linealmente dependientes para
todo valor de t.
−
→
A.6.19. Hallar el vector normal principal unitario y el binormal unitario, a lo largo de la curva R (t) = (3t −
t3 , 3t2 , 3t + t3 ).
−
→
A.6.20. Hallar la ecuación del plano osculador de la curva R (t) = (t, t2 , t3 ) en t = 1. ¿Cuál es la ecuación del
plano normal? ¿y la del plano rectificante?
A.6.21. Hallar la curvatura y la torsión en t = 0 de las siguientes curvas:
−
→
(a) R (t) = (t − sen t, 1 − cos t, t).
−
→ 1−t2
(b) R (t) = (t, 1+t
t , t ).
A.6.22. Demostrar las fórmulas de Frenet.

A.6.23. Calcular los coeficientes de la primera y segunda forma fundamental y la curvatura de Gauss para el punto
u = 0, v = 0 de las siguientes superficies:
−
→
(a) X (u, v) = (u, v, u2 − v 2 ).
−
→
(b) X (u, v) = (u, v, u2 + v 2 ).
−
→
(c) X (u, v) = (cosh u cos v, cosh u sen v, u).
−
→ 3 3
(d) X (u, v) = (u − v3 + uv 2 , v − v3 + vu2 , u2 − v 2 ).
A.6.24. Demostrar que cualquier punto de la superficie
−→
X (u, v) = (f (t) cos θ, f (t) sen θ, t), f (t) > 0,
es parabólico si y sólo si la superficie es un cilindro circular (f (t) = a), o un cono (f (t) = at + b con
a 6= 0).
4.1. Introducción
necesitar.
En esta práctica nos vamos a centrar en el cálculo (diferencial e integral) en varias variables. Veremos cómo
calcular lı́mites de funciones vectoriales y derivadas parciales, determinaremos el gradiente y el laplaciano de
una función, ası́ como la divergencia y el rotacional de un campo. Daremos también algunas aplicaciones en la
Geometrı́a de curvas y superficies, y finalizaremos calculando el potencial de un campo conservativo.
Open (abrir una hoja de trabajo existente), Save (guardar la sesión de trabajo, Print (imprimir la sesión de tra-
(renumerar las expresiones, Author expression (introducir una expresión sencilla), Author vector (introdu-
cir un vector), Author matrix (introducir un vector), Simplify (simplificar), Approximate (calcular un valor
en rapidez.
4.2. Lı́mites y continuidad de funciones vectoriales
Con DERIVE for Windows podemos calcular los lı́mites iterados de funciones de dos o más variables, lo cual
puede ser de utilidad para determinar si una función es continua en un punto. Por ejemplo, supongamos que
queremos determinar los siguientes lı́mites:
p p
lim lim 16 − 4x2 − y 2 lim lim 16 − 4x2 − y 2
y→0 x→0 x→0 y→0
En primer lugar, definimos una apropiada función F , introduciendo la expresión F(x,y):=SQRT(16-4x^2-y^2).

Seleccionando las opciones Calculus|Limit nos aparece la ventana de la Figura 6.8. Debemos seleccionar la
Variable (x o y), el punto lı́mite (Limit Point) y el tipo de lı́mite (Approach Form): por la izquierda, por la
derecha o por ambos lados. En nuestro caso, ambos lı́mites iterados valen 4.
196 MATEM ÁTICAS
Figura 6.8: Venta del programa que permite calcular lı́mites de funciones de varias variables.
Ejercicio. Calcular los lı́mites iterados en (0,0) de la función

2
x2 − y 2
f (x, y) =
x2 + y 2
NOTA: Observemos que aunque los lı́mites iterados existan y coincidan, puede que el lı́mite (de ambas
variables simultáneamente) no exista.
Ejercicio. Calcular los lı́mites iterados de las siguientes funciones:
arcsin(x/y)
f (x, y) = en (0, 1)
1 + xy
g(x, y, z) = xeyz en (2, −1, 1)
4.3. Cálculo diferencial vectorial
DERIVE for Windows realiza cálculo diferencial vectorial en cualquier sistema de coordenadas ortogonal. Po-
demos calcular gradientes, divergencias y rotacionales en coordenadas cartesianas, polares/cilı́ndricas o esféricas,
siendo las coordenadas cartesianas (también llamadas rectangulares) las que se utilizan por defecto. Los nombres
de las variables cartesianas son x, y, z, aunque podemos utilizar otros.
Derivadas Parciales
El cálculo de las derivadas parciales con DERIVE for Windows es sencillo, pues se sigue el mismo proceso que
para las funciones de una variable. Se seleccionan las opciones Calculus|Differentiate (o bien pulsamos el
botón ∂ ) y nos aparece la ventana de la Figura 6.9. En ella debemos introducir la función que vamos a derivar (por
defecto la que está seleccionada), la Variable respecto de la cual vamos a derivar (por defecto x) y el orden de
diferenciación (por defecto 1). Puede ser interesante almacenar las derivadas parciales en unas nuevas funciones
para poder manipularlas más cómodamente. Para ello, una vez calculada la derivada parcial, seleccionamos las
opciones Declare|Function Definition y nos aparece la ventana de la Figura 6.10. En ella debemos rellenar
el nombre de la nueva función y sus argumentos, que usualmente serán los mismos que los de la función original,
y la definición de la nueva función (debemos recordar que pulsando la tecla de función F3 se copia la lı́nea que
está seleccionada).
Figura 6.9: Venta del programa que permite calcular las derivadas parciales de funciones de varias variables.
Figura 6.10: Venta del programa que permite declarar una función. Existen ventanas similares para declarar el
valor de una variable (constante, vector o matriz).
Ejercicio. Calcular las derivadas parciales de la siguiente función

p
f (x, y) = 9 − x2 − y 2
y almacenarlas en dos funciones distintas (por ejemplo, FX y FY).
También es posible calcular las derivadas parciales de orden superior. Para ello sólo es necesario indicar el orden
de derivación en la casilla Order (ver la Figura 6.9).
Ejercicio. Calcular las derivadas parciales segundas de la función

h(x, y) = 3xy 2 − 2y + 5x2 y 2
¿Cuánto vale fxy (−1, 2)?
NOTA: Para encontrar el valor de una expresión cuando particularizamos a un punto (x0 , y0 ) debemos
utilizar las opciones Simplify|Substitute For|Variables.
Gradiente de una función
Cuando f es una función escalar de varias variables (pensemos que está definida en R2 o en R3 ) entonces podemos
198 MATEM ÁTICAS
calcular su gradiente como el vector
∇f (x, y) = (fx (x, y), fy (x, y)) o ∇f (x, y, z) = (fx (x, y, z), fy (x, y, z), fz (x, y, z))
DERIVE for Windows permite calcular los gradientes utilizando la función
GRAD(F(x,y)) ó GRAD(F(x,y,z))
según F sea una función de 2 o 3 variables. Debemos hacer notar que DERIVE for Windows siempre devuelve
un vector de 3 componentes: si la función depende de 2 variables, entonces la tercera componente es cero.
Ejercicio. Calcular el gradiente de la función f (x, y) = 20 − 4x2 − y 2 en el punto (2, −3).
Si las coordenadas cartesianas con las que estamos trabajando no se llaman (x, y, z) o si trabajamos en dimensión
superior a tres, tenemos que indicárselo convenientemente. Por ejemplo, si nuestra función es g(a, b, c, d) =
a2 − b2 + c2 − d2 , entonces su gradiente se calcuları́a escribiendo
GRAD(a^2-b^2+c^2-d^2, [a,b,c,d])
El resultado es (2a,-2b,2c,-2d).
Hasta ahora hemos supuesto que nuestros sistemas de coordenadas (x, y, z) o (a, b, c, d) son ortonormales. Sin
embargo, el gradiente se puede calcular en cualquier sistema de coordenadas (sin ninguna restricción). DERIVE
for Windows, sin embargo, imponen ciertas restricciones: los sistemas de coordenadas deben ser ortogonales.
Si la matriz de la métrica (producto escalar) no es la identidad, entonces también debemos indicarlo cuando
utilicemos la función GRAD. Por ejemplo, supongamos que la matriz métrica del sistema de coordenadas (x, y, z)
fuese (1, 2, 4). Entonces el gradiente de una función f (x, y, z) se calcuları́a mediante el comando
GRAD(f(x,y,z),[[x,y,z],[1,2,4]])
En general, la sintaxis del comando GRAD es la siguiente:
GRAD(f(x1,x2,x3),[[x1,x2,x3],[g1,g2,g3]])
donde (x1,x2,x3) denota el sistema de coordendas ortogonal, (g1,g2,g3) indica la matriz de la métrica y
f(x1,x2,x3) es la función.
Si se carga la utilidad VECTOR.MTH, entonces están disponibles dos sistemas de coordenadas adicionales: las
coordenadas polares/cilı́ndricas y las coordenadas esféricas, cuyas matrices (coordenadas y métrica) están dadas
por
cylindrical := [[r,θ,z],[1,r,1]]
spherical := [[r,θ,Φ],[1,r SIN(Φ),r]]
Por ejemplo GRAD(r SIN(θ) COS(Φ), spherical) da como resultado el vector
[COS(Φ) SIN(θ), COT(Φ) COS(θ), -SIN(Φ) SIN(θ)].

Observación : Todos los operadores diferenciales vectoriales admiten un segundo argumento opcional consisten-
te en una matriz de dos filas: la primera fila representa el sistema de coordenadas y la segunda fila indica los
elementos de la métrica.
Un campo vectorial F se dice que es conservativo si existe alguna función diferenciable f tal que F = GRAD(f ).
La función f se llama una función potencial de F . Un criterio de campo vectorial conservativo en el plano es el
siguiente. El campo F (x, y) = (M (x, y), N (x, y)) es conservativo si, y sólo si,
∂N ∂M
=
∂x ∂y
Con DERIVE for Windows podemos realizar el siguiente cálculo:
DIF(M(x,y),y)-DIF(N(x,y),x)
El campo será conservativo si, y sólo si, la anterior expresión vale cero.
Ejercicio. Determinar si los siguientes campos son conservativos:

(a) F (x, y) = (x2 y, xy)
(b) F (x, y) = (2x, y)
(c) F (x, y) = (2xy, x2 − y)
La divergencia de un campo
La divergencia de un campo de vectores X = (f1 , f2 , f3 ), donde fi es una función diferenciable definida en R3 ,

es la función diferenciable dada por div(X) = (f1 )x + (f2 )y + (f3 )x . Para calcular la divergencia, DERIVE for
Windows dispone de la función
DIV([f1(x,y,x),f2(x,y,z),f3(x,y,z)]
donde [f1,f2,f3] es el vector de componentes del campo. Por ejemplo, DIV([y 2 z 3 , 2xyz 3 , 3xy 2 z 2 ]) da como
resultado x(6y 2 z + 2z 3 ).
Ejercicio. Calcular la divergencia de los siguientes campos de vectores:

2 2 2
(a) X = (xp yz, (y − 1) cos z, (y + 1) cos(xy))
(b) Y = ( x + y + z , x − y 3 , x + y 2 + z 3 )
2 2 2 2
Si queremos calcular la divergencia de un campo en el plano, debemos añadirle una tercera componente constante
(por ejemplo, cero) y calcular la divergencia del nuevo campo. Sea el campo G = (f (x, y), g(x, y)) definido en
el plano. Su divergencia se calcuları́a de la siguiente manera:
• Consideramos el campo G:=[f,g,0] en R3 .

• Calculamos su divergencia: DIV(G).
Ejercicio. Calcular la divergencia de los siguientes campos planos: (x2 y, y 2 − x), (xy, x3 − y 3 ).
200 MATEM ÁTICAS
El rotacional de un vector
El rotacional de un campo F (x, y, z) = (M (x, y, z), N (x, y, z), P (x, y, z)) es el campo
rotF (x, y, z) = (∇ × F )(x, y, z)

∂P ∂N ∂P ∂M ∂N ∂M
= − i− − j+ − k
∂y ∂z ∂x ∂z ∂x ∂y
donde ∇ = (∂x , ∂y , ∂z ). Cuando rot(F ) = 0 decimos que el campo F es irrotacional.
Para calcular el rotacional con DERIVE for Windows debemos utilizar la siguiente función:
CURL([f(x,y,z),g(x,y,z),h(x,y,z)])
donde (f, g, h) son las componentes del campo de vectores.
Ejercicio. Hallar el rotacional del campo (2xy, x2 + z 2 , 2zy)
Un criterio para campos conservativos en el espacio es el siguiente. Un campo vectorial F = (M, N, P ), donde
M , N y P son funciones de clase C 1 (es decir, con derivadas parciales primeras continuas) es conservativo si, y
sólo si, rotF (x, y, z) = 0.
Ejercicio. ¿Es conservativo el campo de vectores (x3 y 2 z, x2 z, x2 y)?
El laplaciano de una función
El laplaciano de una función diferenciable f (x, y, z) es la nueva función dada por
∂2f ∂2f ∂2f

∆f (x, y, z) = + +
∂x2 ∂y 2 ∂z 2
Para calcular el laplaciano con DERIVE for Windows debemos utilizar la siguiente función:
LAPLACIAN(f(x,y,z))
La función f puede ser de dos variables.
Ejercicio. Calcular el laplaciano de las siguientes funciones:

(a) f (x, y) = x2 + y 2 p
(b) f (x, y, z) = x3 + y 3 + x + y + z 4
4.4. Aplicaciones a la Geometrı́a Diferencial
4.4.1. Longitud de una curva
Sea R(t) = (x(t), y(t), z(t)), t ∈ [a, b] una curva diferenciable en R3 . Entonces su longitud viene dada por
Z bp
L= x0 (t)2 + y 0 (t)2 + z 0 (t)2 dt
a
Si queremos utilizar DERIVE for Windows podemos hacerlo directamente siguiendo los siguientes pasos:
(1) Definimos las funciones x(t), y(t) y z(t).

(2) Definimos la función longitud como sigue:
L(p,q) := INT(SQRT(DIF(x(t),t)^2+DIF(y(t),t)^2+DIF(z(t),t)^2),t,p,q)
(3) Introducimos la expresión L(a,b) para obtener el resultado final.
Ejercicio. Calcular la longitud de una vuelta de la hélice circular cuya parametrización es

R(t) = (A cos θt, A sen θt, Bt), A, B ∈ R
Otra posible solución al problema de determinar la longitud de la curva consiste en utilizar álgebra vectorial:
(1) Definimos un vector R(t) por R(t):=[X(t),Y(t),Z(t)].

(2) Definimos la función longitud como sigue:
L(p,q) := INT(SQRT(DIF(R(t),t).DIF(R(t),t)),t,p,q)
4.4.2. Cálculo de la curvatura y la torsión de una curva
El problema consiste en definir dos funciones que se encarguen de calcular dichas cantidades. La función curvatura
está dada por
|R0 (t) × R00 (t)|
κ(t) =
|R0 (t)|
y la función torsión está dada por
det(R0 (t), R00 (t), R000 (t))
τ (t) =
|R0 (t) × R00 (t)|2
Dichas funciones pueden definirse en DERIVE for Windows del siguiente modo:
K(t) := ABS(CROSS(R0 (t),R00 (t)))/ABS(R0 (t))
T(t) := DET([R0 (t),R00 (t),R000 (t)])/ABS(CROSS(R0 (t),R00 (t)))^2
Ejercicio. Calcular la curvatura y torsión de la hélice circular cuya parametrización es

R(t) = (A cos θt, A sen θt, Bt), A, B ∈ R
202 MATEM ÁTICAS
4.4.3. Coeficientes de la primera y segunda forma fundamental
Dada una superficie parametrizada regular S(u, v) = (x(u, v), y(u, v), z(u, v)) se definen los coeficientes de la
primera forma fundamental como sigue:
2
E(u, v) = Su (u, v).Su (u, v) = |Su (u, v)|
F (u, v) = Su (u, v).Sv (u, v)
G(u, v) = Sv (u, v).Sv (u, v) = |Sv (u, v)|2
y los coeficientes de la segunda forma fundamental son:
∂2S
e = N.
∂u2
∂2S
f = N.
∂u∂v
∂2S
g = N. 2
∂v
donde N representa el vector unitario normal a la superficie:
1
N (u, v) = √ (Su × Sv ).
EG − F 2
Para calcular estos elementos con DERIVE for Windows, definimos las siguientes funciones:
S(u,v) := [x(u,v),y(u,v),z(u,v)]
E(u,v) := DIF(S(u,v),u).DIF(S(u,v),u)
F(u,v) := DIF(S(u,v),u).DIF(S(u,v),v)
G(u,v) := DIF(S(u,v),v).DIF(S(u,v),v)
N(u,v) := SQRT(E(u,v)G(u,v)-F(u,v)^2)^(-2).CROSS(DIF(S(u,v),u),DIF(S(u,v),v))
EE(u,v) := N(u,v).DIF(S(u,v),u,2)
FF(u,v) := N(u,v).DIF((DIF(S(u,v),u)),v)
GG(u,v) := N(u,v).DIF(S(u,v),v,2)
Ejercicio. Calcular los coeficientes de la primera y de la segunda forma fundamental de la siguiente superficie
parametrizada:
S(u, v) = (cosh(u) cos(v), cosh(u) sen(v), u)
4.4.4. Curvatura de Gauss
A partir de los coeficientes determinados en el apartado anterior podemos calcular la curvatura de Gauss de la
superficie como sigue:
eg − f 2
KG(u, v) =
EG − F 2
En DERIVE for Windows podemos definir la siguiente función:
KG(u, v) := (EE(u,v).GG(u, v)-FF(u, v)^2)/(E(u,v).G(u,v)-F(u,v)^2)
Ejercicio. Calcular la curvatura de Gauss de la superficie parametrizada del ejercicio anterior.

4.5. Cálculo integral vectorial
Sea el campo de vectores F = (M, N, P ) y supongamos que es conservativo. Entonces existe una función
diferenciable f tal que
fx = M
fy = N
fz = P
¿Cómo determinar f ? Podemos hacerlo directamente mediante integración; sin embargo, DERIVE for Windows
pone a nuestra disposición la siguiente función:
POTENTIAL([f(x,y,z),g(x,y,z),h(x,y,z)])
donde (f, g, h) son las componentes del campo de vectores.
Como en el cálculo de primitivas, las funciones potenciales son únicas salvo constantes. Por tanto, la función
POTENTIAL puede proporcionar un resultado diferente a uno calculado manualmente. Las constantes aditivas
pueden ser desechadas (especialmente en funciones que involucran logaritmos o funciones trigonométricas inver-
sas).
No todos los campos de vectores admiten una función potencial; no todos los campos son conservativos. En
este caso, la función POTENTIAL determina una función diferenciable cuyo gradiente no es el campo de vecto-
res original. Por tanto, antes de utilizar la función POTENTIAL es conveniente verificar primero si el campo es
conservativo.
La función POTENTIAL admite un segundo argumento opcional que es un vector especificando las coordenadas del
punto inicial para las integrales involucradas. Por defecto, este vector es el vector nulo. Una elección inapropiada
puede conducir a un potencial infinito o desconocido; si esto ocurriese es conveniente probar con otros valores.
Finalmente, la función POTENTIAL admite un tercer argumento opcional que es un vector de coordenadas cartesia-
nas o una matriz métrica (esto es, una matriz con dos filas: un vector de coordenadas y una vector con la métrica).
Por defecto, este argumento es [x,y,z].
Ejercicio. Sea el campo de vectores F (x, y, z) = (2xy, x2 + z 2 , 2zy). Probar que F es un campo conservativo y
encontrar una función potencial para F .
drid, 1995. Capı́tulo 15.
204 MATEM ÁTICAS
E.6.1. La posición de un punto en un instante t viene dada por la función vectorial

1 2 1 3
R(t) = t , (6t + 9) 2 .
2 9
Se pide:
(a) Hallar el espacio recorrido desde t = 0 hasta t = 4.
(b) Hallar un vector tangente unitario y otro normal a la curva en el punto de parámetro t = 1.
(c) ¿Cuál es el valor de la curvatura en ese punto?
E.6.2. (a) Demostrar que los vectores tangentes a lo largo de la curva

α(t) = at, bt2 , t3
−
→
(siendo 2b2 = 3a) forman un ángulo constante con el vector A = (1, 0, 1). ¿Cuál es el valor de ese ángulo?
(b) Hallar las ecuaciones de los planos osculador, normal y rectificante de la curva del apartado anterior
para a = b = 1.
E.6.3. Demostrar que la curva definida por la parámetrización

1 + t 1 − t2
α(t) = t, ,
t t
está contenida en un plano.

E.6.4. Comprobar que z = yf (x2 − y 2 ), donde f es una función diferenciable arbitraria, satisface la ecuación
∂z ∂z
y2 + xy = xz.
∂x ∂y
E.6.5. Calcular la ecuación del plano tangente al elipsoide de ecuación
x2 y2 z2
+ + = 1,
9 16 4
en los puntos que correspondan a las coordenadas x = 0 e y = 1.
E.6.6. Un palo de longitud ` se parte en tres trozos de longitudes x, y, z. Hallar x, y, z para que el producto xyz
sea máximo.
E.6.7. Demostrar que los puntos de la siguiente superficie
−
→
X (u, v) = (u, v, u2 + v 3 )
son elı́pticos si v > 0, hiperbólicos si v < 0 y parabólicos si v = 0.

ANOTACIONES
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
CAPÍTULO 7
CÁLCULO INTEGRAL EN VARIAS VARIABLES
• Calcular integrales dobles en coordenadas carte- tesianas, cilı́ndricas y esféricas, sobre dominios
sianas y polares, sobre dominios sencillos. sencillos.
• Usar la integral doble para el cálculo de áreas.
• Usar la integral triple para el cálculo de
• Calcular integrales triples en coordenadas car- volúmenes.
2.1. Integrales dobles sobre dominios sencillos
Sea f (x, y) una función continua para los valores (x, y) ∈ R donde

R = (x, y) ∈ R2 a 6 x 6 b, c 6 y 6 d = [a, b] × [c, d].
Para cada y0 fijamos la función definida por F (x) = f (x, y0 ) que es continua y por lo tanto integrable es [a, b].
La integral
Zb
F (x, y)dx = G(y)
a
es una función continua y como consecuencia integrable en [c, d].
Definiremos la integral doble sobre el rectángulo R = [a, b] × [c, d] de la función f (x, y) como
 
ZZ Zd Zb
f (x, y)dxdy =  f (x, y)dx dy.
R
c a
ZZ
Ejemplo. Sea R = [0, 1] × [0, 2], vamos a calcular f (x, y)dxdy donde f (x, y) = xy.
R
 1 
ZZ Z2 Z
xydxdy =  xydx dy
R
0 0
C ÁLCULO INTEGRAL EN VARIAS VARIABLES 207
Z2 x=1
x2 y
= dy
2 x=0
0
Z2 2 y=2
y y
= dy = = 1.
2 4 y=0
0
2
Teorema de Fubini: Si R = [a, b] × [c, d] se cumple que
   
ZZ Zd Zb Zb Zd
f (x, y)dxdy =  f (x, y)dx dy =  f (x, y)dy  dx,
R
c a a c
expresión válida siempre que f (x, y) sea continua en R.
El concepto de integral doble se puede extender a conjuntos que no sean necesariamente rectángulos en R2 . Son
conjuntos acotados más generales que en algunas referencias bibliográficas se denominan conjuntos medibles
Jordan. No vamos a intentar definir e identificar matemáticamente estos conjuntos; para nuestras aplicaciones
nos bastará con saber que recintos planos D de puntos que estén limitados por una curva cerrada son conjuntos
medibles Jordan en los que tiene sentido definir la integral doble (ver Figura 7.1).
Figura 7.1: Conjunto medible Jordan.
Para calcular la integral de f (x, y) en el recinto D procederemos como sigue. La recta x = x0 corta a D en dos
puntos M1 y M2 de ordenadas respectivas y1 (x0 ) e y2 (x0 ). Cuando variamos a 6 x 6 b, y1 (x) e y2 (x) son dos
funciones continuas. Ası́  
ZZ Zd yZ2 (x)
 
f (x, y)dxdy =  f (x, y)dx dy.
D
c y1 (x)
¿Qué ocurre si tomamos las rectas y = y0 y los puntos de corte con abscisas x1 (y0 ) y x2 (y0 ), siendo ambas
funciones continuas para c 6 y 6 d?
En el caso de que f (x, y) sea continua en D (caso para el que nos restringiremos en la práctica) se tiene por el
Teorema de Fubini que
   
ZZ Zd yZ2 (x) Zb xZ2 (y)
   
f (x, y)dxdy =  f (x, y)dx dy =  f (x, y)dy  dx
D
c y1 (x) a x1 (y)
208 MATEM ÁTICAS
¿Qué ocurre cuando las rectas x = x0 (o bien y = y0 ) cortan al dominio D en más de dos puntos? La forma de
realizar en la práctica este caso es descomponer D en dominios parciales que sı́ satisfagan la condición, aunque
nosotros solo trataremos los casos más sencillos.
ZZ

Ejemplo. Vamos a calcular x2 ydxdy donde D = (x, y) ∈ R2 x2 + y 2 6 1, y > 0 (semicı́rculo superior
D
de centro el origen y radio 1)
√ 
ZZ Z1 Z1−x2
 
x2 ydxdy =  x2 ydy  dx
D
−1 0
Z1 y=√1−x2 Z1
x2 y 2 (1 − x2 )x2
= dx = dx
2 y=0 2
−1 −1
3

5 x=1
1 x x 2
= − =
2 3 5 x=−1 15
2
2.1.1. Integrales dobles en coordenadas polares
A veces, por cuestiones de facilidad en la expresión de la función o del recinto, trabajar en coordenadas polares
agiliza en gran manera los cálculos. En realidad no hay ningún problema matemático para efectuar una nueva
elección de un sistema de coordenadas (r, θ) con x = r cos θ, y = r sen θ.
Ejemplo. Vamos a calcular de nuevo la integral de f (x, y) = x2 y en el recinto

D = (x, y) ∈ R2 x2 + y 2 6 1, y > 0 ,
ahora usando coordenadas polares. Para empezar debemos fijarnos en la ventaja evidente de que la porción del
cı́rculo unidad que indica D tiene ahora una expresión bastante más sencilla, a saber,
D = { (r, θ)| 0 6 r 6 1, 0 6 θ 6 π} .
Luego se tiene
ZZ ZZ
x2 ydxdy = r 3 (cos2 θ)(sen θ)rdrdθ
D
ZZ D
= r 4 (cos2 θ)(sen θ)drdθ

D 
Z1 Zπ
=  r 4 (cos2 θ)(sen θ)dθ  dr
0 0
Z1 θ=π
cos3 θ
= −r 4 dr
3 θ=0
0
Z1 r=1
2r 4 1 r5 2
= dr = =
3 2 5 r=0 15
0
2
2.1.2. Cálculo de áreas usando integrales dobles
Conviene reflexionar sobre el significado geométrico de la expresión

ZZ
dxdy.
D

• DadoZelZrectángulo R = (x, y) ∈ R2 a 6 x 6 b, c 6 y 6 d = [a, b] × [c, d] ¿qué significado geométrico
tiene dxdy?
R
ZZ

• Y si ahora ponemos R = (x, y) ∈ R2 x2 + y 2 6 1 ¿qué significado piensas que tiene dxdy? (Es
R
más facil que lo pienses en coordenadas polares).
• Finalmente generaliza los resultados obtenidos al caso de un recinto D.
Para ilustrar las reflexiones que te hemos propuesto anteriormente te presentamos el siguiente ejemplo.
Ejemplo. Vamos a calcular el área del lóbulo del folium de Descartes (ver Figura 7.2) de ecuación en coordenadas
polares
3 sen θ cos θ π
r= , 06θ6 .
sen3 θ + cos3 θ 2
Figura 7.2: Folium de Descartes.
En nuestro caso se tiene que el área vendrı́a expresada por la siguiente integral doble:
 3 sen θ cos θ

π π
Z2 Z
sen3 θ+cos3 θ Z2 r= 3 sen θ cos θ
  r2 sen3 θ+cos3 θ
 rdr 
  dθ =
2
dθ
r=0
0 0 0
π
Z2
9 sen2 θ cos2 θ
= dθ
2(sen3 θ + cos3 θ)2
0
π
Z2
1 9 sen2 θ cos2 θ
= dθ.
2 (sen3 θ + cos3 θ)2
0
210 MATEM ÁTICAS
Observa que por la simetrı́a del recinto se tiene

π π
Z2 Z4
1 9 sen2 θ cos2 θ 9 sen2 θ cos2 θ
dθ = dθ
2 (sen3 θ + cos3 θ) (sen3 θ + cos3 θ)
0 0
1
y haciendo el cambio de variable tan θ = t, dt = cos2 θ dθ, obtenemos (intentando antes simplificar algo las
expresiones):
π π
Z4 Z4
9 sen2 θ cos2 θ 9 sen2 θ cos2 θ
dθ = dθ
(sen3 θ + cos3 θ)2 cos6 θ (1 + tan3 θ)2
0 0
π
Z4
9 sen2 θ
= dθ
cos4 θ (1 + tan3 θ)2
0
Z1
t2
= 9 dt
(1 + t3 )2
0
t=1
1 3
= −3 = .
1 + t3 t=0 2
2
2.2. Integrales triples
Procedemos de forma análoga a las integrales dobles, esta vez refiriéndonos a funciones de tres variables definidas
sobre un recinto del espacio R. Sea f (x, y, z) una función contı́nua para los valores (x, y, z) ∈ R donde

R = (x, y, z) ∈ R3 a 6 x 6 b, c 6 y 6 d, e 6 z 6 f = [a, b] × [c, d] × [e, f ].
Con las consideraciones de continuidad para f (x, y, z) y las consecuencias posteriores de integrabilidad similares
a las hechas para la integral doble, se tiene que la integral triple sobre el paralelepı́pedo R de la función f (x, y, z)
se puede expresar como
   
ZZZ Zf Zd Zb
f (x, y, z)dxdydz =   f (x, y)dx dy  dz.
R
e c a
El Teorema de Fubini también se cumple ahora. Es decir, podremos cambiar el orden de las diferentes integrales
sin que esto afecte al valor final de la integral triple.
Ejemplo. Sea R = [0, 1] × [0, 2] × [0, 3] y f (x, y, z) = xyz. Entonces

   
ZZZ Z3 Z2 Z1
xyzdxdydz =   xyzdx dy  dz
R
0 0 0
 
Z3 Z2 2 x=1
 x yz
= dy  dz
2 x=0
0 0
 
Z3 Z2
=  yz dy  dz
2
0 0
Z3 y=2 Z3
y2 z
= dz = zdz
4 y=0
0 0
z=3
z2 9
= =
2 z=0 2
2
Siguiendo el procedimiento al que sometı́amos a la integral doble, pasamos a continuación a introducir el concepto
de integral triple sobre conjuntos acotados más generales D ⊂ R3 , los llamados conjuntos medibles Jordan.
Figura 7.3: Conjunto medible Jordan.
Consideramos ahora el plano x = x0 (paralelo al plano coordenado Y Z) y supongamos además que el mencio-
nado plano corta a D en C(x0 ). En estas condiciones,supuestas las hipótesis de continuidad de la función en el
dominio y de las secciones C(x) al variar x entre [a, b], podemos calcular la integral triple de f (x, y, z) sobre D
de la siguiente forma:
ZZZ Zb "Z Z #
f (x, y, z)dxdydz = f (x, y, z)dydz dx
D C(x)
a
Si desarrollamos el cálculo de la integral

ZZ
f (x, y, z)dydz,
C(x)
suponiendo que las paralelas al eje OZ cortan a C(x) en puntos en los que las cotas alcanzadas en el mencionado
eje sean z1 (x0 , y0 ) y z2 (x0 , y0 ), se tiene entonces
 
ZZ 2 (x)
yZ z2Z(x,y)
 
f (x, y, z)dydz =  f (x, y, z)dz  dy,
C(x)
y1 (x) z1 (x,y)
de donde finalmente tendremos que
ZZZ Zb "Z Z #
D C(x)
a
   
Zb 2 (x)
yZ z2Z(x,y)
   
=   f (x, y, z)dz  dy  dx.
a y1 (x) z1 (x,y)
212 MATEM ÁTICAS
Obsérvese que también aquı́ se puede intercambiar el orden de las integraciones, es decir, podemos partir de
secciones de D paralelas al plano XY (C(z0 )) o paralelas al plano XZ (C(y0 )), sin que esto varı́e nuestro
razonamiento en lo que al proceso se refiere.
Ejemplo. Vamos a calcular ZZZ

x2 yzdxdydz,
D
siendo
D = (x, y, z) ∈ R3 x2 + y 2 6 1, 0 6 z 6 1, x > 0, y > 0
(la parte del cilindro de base el cı́rculo de centro el origen y radio 1 y de altura igual a 1, que está contenida
en el primer octante). Consideremos ahora secciones C(z0 ) por planos paralelos al XY , de ecuaciones z = z0 ,
variando z en el intervalo [0, 1]. Ası́ obtenemos lo siguiente:
ZZZ Z1 "Z Z #
2 2
x yzdxdydz = x yzdxdy dz
D C(z)
0
 √  
Z1 Z1 Z1−x2
   
=   x2 yzdy  dx dz
0 0 0
 
Z1 Z1 2 2 y=√1−x2
 x y z
= dy  dz
2 y=0
0 0
 1 
Z Z
1
2 2
 (1 − x )x z
= dx dz
2
0 0
 
Z1 Z1 3
5 x=1
 z x x  dz
= −
2 3 5 x=0
0 0
Z1 z=1
z 1 z2 1 1 1
= dz = = =
15 15 2 z=0 15 2 30
0
2
Se puede pensar en intercambiar el orden de las integrales simples para intentar facilitar el proceso de cálculo.
Veamos:
ZZZ Zb "Z Z #
D C(x)
a
   
Zb 2 (x)
yZ z2Z(x,y)
   
=   f (x, y, z)dz  dy  dx
a y1 (x) z1 (x,y)
 
ZZ z2Z(x,y)
 
=  f (x, y, z)dz  dxdy,
πXY (D)
z1 (x,y)
donde se puede observar que hemos empezado por una integral simple y después integramos el resultado sobre
πXY (D) que indica la proyección de D sobre el plano XY .
Naturalmente todo el anterior procedimiento se puede hacer análogamente integrando primero sobre x y des-
pués integrando sobre πY Z (D) (proyección de D sobre Y Z), o bien integrando primero sobre y y después sobre
πXZ (D).

xyzdxdydz
S
donde
S = (x, y, z) ∈ R3 x2 + y 2 + z 2 6 1, x > 0, y > 0, z > 0
(la parte de la esfera de centro en el origen de coordenadas y radio 1 que está contenida en el primer octante).
Veamos: primero integramos sobre z y después sobre la proyección
de S en el plano XY , πXY (S) que en este
caso coincidirá con S 0 = (x, y)| x2 + y 2 6 1, x > 0, y > 0 . De esta forma se tiene
√ 
1−x2 −y 2
ZZZ ZZ Z
 
xyzdxdydz =  xyzdz  dxdy
 
S S0
0
√
ZZ z= 1−x2 −y 2
xyz 2
= dxdy
S0 2 z=0
ZZ
xy(1 − x − y 2 )
2
= dxdy
0 2
S √ 
Z1 Z1−x2
 xy(1 − x2 − y 2 ) 
=  dy  dx
2
0 0
Z1
x(x2 − 1)2 1
= dx =
8 48
0
2.2.1. Integrales triples en coordenadas cilı́ndricas
Recordemos que las coordenadas cilı́ndricas (r, θ, z) de un punto en el espacio representan con (r, θ) a las co-
ordenadas polares de la proyección del punto en el plano XY y z el valor de la coordenada en el eje OZ. En
algunas ocasiones expresar en coordenadas cilı́ndricas la función y el recinto sobre el que calculamos la integral
triple tiene notables ventajas, como veremos en el ejemplo que desarrollaremos a continuación. Sólo basta tener
en cuenta que ZZZ ZZZ
f (x, y, z)dxdydz = ϕ(r, θ, z)rdrdθdz
D D
Ejemplo. Vamos a calcular empleando el cambio a coordenadas cilı́ndricas la integral triple

ZZZ
x2 yzdxdydz,
D

siendo D = (x, y, z) ∈ R3 x2 + y 2 6 1, 0 6 z 6 1, x > 0, y > 0 .
Primero de todo conviene observar la evidente

ventaja que proporciona el nuevo sistema
de coordenadas en la
expresión del recinto, ya que se tiene D = (r, θ, z)| 0 6 r 6 1, 0 6 θ 6 π2 , 0 6 z 6 1 , presentando las mismas
ventajas operativas para la integral triple que presentaba el paralelepı́pedo (el caso más simple con el que nos
podı́amos encontrar). Ya solo nos queda efectuar el cambio de variable recordando que x = r cos θ, y = r sen θ.
Veamos:
ZZZ ZZZ
x2 yzdxdydz = r 3 (cos2 θ)(sen θ)zrdrdθdz
D D
214 MATEM ÁTICAS
ZZZ
= r 4 (cos2 θ)(sen θ)zdrdθ
  π D
 
Z1 Z1 Z2
  4 2  
=   r (cos θ)(sen θ)zdθ  dr  dz
0 0 0
 1 
Z
Z1 3
θ= π2
 cos θ
= −r 4 z dr  dz
3 θ=0
0 0
 
Z1 Z1 4
=  r zdr  dz
3
0 0
Z1 r=1 Z1
r5 z z 1
= dz = dz =
15 r=0 15 30
0 0
2.2.2. Integrales triples en coordenadas esféricas
Recordemos que un punto P de R3 , está totalmente determinado por sus coordenadas esféricas (ρ, ϕ, θ) donde
ρ indica la longitud de OP, ϕ el ángulo que forma el plano determinado por OZ y P con el plano OXZ y θ el
ángulo que forma la recta OP con el eje OZ, teniéndose además las siguientes igualdades que relacionan las
coordenadas esféricas con las cartesianas rectangulares
x = ρ sen θ cos ϕ,
y = ρ sen θ sen ϕ,
z = ρ cos θ.
Al igual que sucedı́a con las coordenadas cilı́ndricas, en determinadas ocasiones, bien sea por la expresión del pro-
pio recinto o por la propia función, nos conviene usar este sistema de coordenadas en detrimento de las cartesianas
o cilı́ndricas. Tendremos no obstante que tener en cuenta lo siguiente:
ZZZ ZZZ
f (x, y, z)dxdydz = g(ρ, θ, ϕ)ρ2 sen θdρdθdϕ.
D D

xyzdxdydz
S
donde

S = (x, y, z) ∈ R3 x2 + y 2 + z 2 6 1, x > 0, y > 0, z > 0 .
Se tiene
ZZZ ZZZ
xyzdxdydz = (ρ sen θ cos ϕ)(ρ sen θ sen ϕ)(ρ cos θ)ρ2 sen θdρdθdϕ
S
ZZZ S
= ρ5 (sen3 θ cos θ)(cos ϕ sen ϕ)dρdθdϕ.

S
Observa quela gran ventaja que presenta en este ejercicio el nuevo sistema de coordenadas es la expresión del
recinto S = (ρ, θ, ϕ)| 0 6 ρ 6 1, 0 6 θ 6 π2 , 0 6 ϕ 6 π2 , que produce el siguiente efecto a la hora de calcular
la integral triple:
ZZZ
ρ5 (sen3 θ cos θ)(cos ϕ sen ϕ)dρdθdϕ =

π
 π S
 
Z1 Z2 Z2
  5 3  
  ρ (sen θ cos θ)(cos ϕ sen ϕ)dθ  dϕ dρ =
0 0 0
 π 
Z1 Z2 5
 ρ 
 cos ϕ sen ϕdϕ dρ =
4
0 0
Z1
ρ5 1
dρ = .
8 48
0
2.2.3. Cálculo de volúmenes usando integrales triples
Al igual que usábamos las integrales dobles para calcular el área de determinados recintos planos, se puede utilizar
la expresión ZZZ
dxdydz
D
para calcular el volumen de un recinto D ⊂ R3 .
Ejemplo. Vamos a calcular el volumen de una esfera de centro el origen y radio R. Sabemos que podemos
expresar los puntos de la esfera que estén en el primer octante como
n π πo
S = (ρ, θ, ϕ)| 0 6 ρ 6 R, 0 6 θ 6 , 0 6 ϕ 6
2 2
(en coordenadas esféricas). Por simetrı́a, el volumen que nos piden vendrá expresado por
ZZZ ZZZ
8 dxdydz = 8 ρ2 sen θdρdθdϕ
S
 π π
S
 
ZR Z2 Z2
   
= 8   ρ2 sen θdθ  dϕ dρ
0 0 0
 π 
ZR Z2 ZR 2
  ρ π 4
= 8  ρ2 dϕ dρ = 8 dρ = πR3 .
2 3
0 0 0
A.7.1. Calcular las siguientes integrales dobles:

ZZ

(a) sen2 x cos ydxdy donde D = (x, y) ∈ R2 0 6 x 6 π, 0 6 y 6 π
D
216 MATEM ÁTICAS
ZZ

(b) xydxdy donde D = (x, y) ∈ R2 0 6 x 6 3, 1 6 y 6 2
D
ZZ

(c) x2 ydxdy donde D = (x, y) ∈ R2 x + y 6 1, x > 0, y > 0
D
ZZ

(d) sen(x + y)dxdy donde D = (x, y) ∈ R2 0 6 x 6 π
2,0 6y6π
D

ZZ n o
2
xydxdy donde D = (x, y) ∈ R2 x > 0, y > 0, xa2 + yb2 6 1
2
(a)
ZZ D n o
2 2
(b) (x2 − y 2 )dxdy donde D = (x, y) ∈ R2 xa2 + yb2 6 1
ZZ D
1

2

(c) (x+y)2 dxdy donde D = (x, y) ∈ R x > 2, y > 2, x + y 6 3
D
ZZ
A.7.3. Calcular xydxdy donde D es el triángulo de vértices A(0, −1), B(1, 0) y C(0, 3).
D

ZZ

2 2 2

1+x2 +y 2 dxdy donde D = (x, y) ∈ R x 6 1, y 6 1, x + y > 1
xy
(a)
ZZ D
1

2

(b) (1+x+y)2 dxdy donde D = (x, y) ∈ R x > 0, y > 0, x + y 6 1
ZZ D p

(c) xy x2 + 4y 2 dxdy donde D = (x, y) ∈ R2 x > 0, y > 0, x2 + y 2 6 1
D
A.7.5. Calcular, usando la integral doble, la expresión del área encerrada por la elipse de ecuación
x2 y2
2
+ 2 = 1.
a b
A.7.6. Calcular las siguientes integrales triples:

ZZZ

(a) zdxdydz donde D = (x, y, z) ∈ R3 x + z 6 1, x > 0, z > y 2 , y > 0
ZZZ D

(b) yzdxdydz donde D = (x, y, z) ∈ R3 y > x2 , z > 0, y + z 6 1
ZZZ D n o
2 2
xyzdxdydz donde D = (x, y, z) ∈ R3 xa2 + yb2 + zc2 6 1
2
(c)
ZZZ D

(d) z 2 dxdydz donde D = (x, y, z) ∈ R3 x2 + y 2 + z 2 6 1
D
A.7.7. Dadas la integrales sucesivas

     
Z1 Z2x Z1 Zx x+y
Z
 f (x, y)dy  dx y   f (x, y, z)dz  dy  dx,
0 x 0 0 0
exprésarlas respectivamente como una integral doble y otra triple de f (x, y) y f (x, y, z) sobre los recintos
apropiados.
A.7.8. Calcular las integrales introducidas en el ejercicio anterior para las funciones f (x, y) = ex+y y f (x, y, z) =
ex+y+z .
A.7.9. Calcular usando la integral triple una fórmula que calcule el volumen encerrado por el elipsoide de ecua-
ción
x2 y2 z2
2
+ 2 + 2 = 1.
a b c
J. DE BURGOS Cálculo Infinitesimal, Editorial Alhambra. Capı́tulo 6.

drid, 1995. Capı́tulo 16.
E. LINES Principios de Análisis Matemático, Editorial Reverté SA. Capı́tulo 31.
J. RIVAUD Ejercicios de Análisis, Editorial Aguilar. Capı́tulo 9.
ZZ

E.7.1. Calcular (x2 + y 2 )dxdy donde D = (x, y) ∈ R2 x2 + y 2 6 1
D
ZZZ

E.7.2. Calcular √ 1
dxdydz donde D = (x, y, z) ∈ R3 x2 + y 2 + z 2 6 1
D x2 +y 2
E.7.3. Hallar el volumen del recinto limitado superiormente por la esfera de ecuación x2 + y 2 + z 2 = 4, inferior-
mente por el plano XY y lateralmente por el cilindro x2 + y 2 = 1.
218 MATEM ÁTICAS
ANOTACIONES
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
CAPÍTULO 8
ESTADÍSTICA DESCRIPTIVA UNIDIMENSIONAL
a) ¿Qué es la Estadı́stica?
b) ¿Cómo se organizan los datos de una muestra extraı́da de una población?
c) ¿Cuáles son las representaciones gráficas más adecuadas para extraer conclusiones sobre el comportamiento
real de la variable estadı́stica?
d) ¿Cómo se sintetiza la información aportada por un conjunto de datos en una serie de valores que nos fijen
el comportamiento global del experimento aleatorio?
2.1. Introducción a la Estadı́stica
2.1.1. Definición de Estadı́stica
Estadı́stica: ciencia que se ocupa de recoger, clasificar, representar y resumir los datos de muestras, y de hacer
inferencias (extraer conclusiones) acerca de las poblaciones de las que éstas proceden.
1. Estadı́stica descriptiva: parte de la estadı́stica que se ocupa de recoger, clasificar, representar y resumir los
datos de las muestras.
2. Estadı́stica inferencial: parte de la estadı́stica que se ocupa de llegar a conclusiones (inferencias) acerca de
las poblaciones a partir de los datos de las muestras extraı́das de ellas.
2.1.2. Conceptos generales
− Población: conjunto de individuos con propiedades comunes sobre los que se realiza una investigación de
tipo estadı́stico.
220 MATEM ÁTICAS
− Muestra: subconjunto de la población.
− Tamaño muestral: número de individuos que forman la muestra.
− Muestreo: proceso de obtención de muestras representativas de la población.
− Variable: propiedad o cualidad que puede manifestarse bajo dos o más formas distintas en un individuo de
una población.
− Modalidades, categorı́as o clases: distintas formas en que se manifiesta una variable.
− Las variables se clasifican en:
1. Cuantitativas: se expresan numéricamente. Se clasifican en:

(a) Discretas: toman valores numéricos aislados, por lo que, fijados dos consecutivos, no pueden
tomar ningún valor intermedio.
(b) Continuas: pueden tomar cualquier valor dentro de unos lı́mites, por lo que entre dos valores
cualesquiera, por próximos que sean, siempre pueden encontrarse valores intermedios.
2. Cualitativas: no se expresan numéricamente. Se clasifican en:
(a) Ordinales: admiten una ordenación de menor a mayor aunque sus resultados no son numéricos.
(b) Nominales: no admiten una ordenación de menor a mayor.
2.2. Tabulación de los datos
2.2.1. Variables cualitativas
Ejemplo de recogida (no ordenada) de unos datos cualitativos:
francés inglés francés inglés francés alemán ruso español francés inglés
francés inglés español francés español francés alemán inglés español inglés
inglés español inglés francés español ruso alemán francés inglés español
alemán inglés español francés alemán inglés inglés inglés español francés
• Frecuencia absoluta de la clase i-ésima: fi =número de observaciones contenidas dentro de ella.

fi
• Frecuencia relativa de la clase i-ésima: hi = , siendo n el número total de observaciones.
n
• Porcentaje de la clase i-ésima: %i = 100 hi .
• Se verifican las propiedades siguientes:
f1 + f2 + · · · + fk = n,
h1 + h2 + · · · + hk = 1,
%1 + %2 + · · · + %k = 100,
siendo k el número de clases.
• Distribución de frecuencias: tabla conteniendo las distintas clases y las frecuencias correspondientes a cada
una de ellas.
ESTAD ÍSTICA DESCRIPTIVA UNIDIMENSIONAL 221
La distribución de frecuencias de los datos cualitativos del ejemplo anterior es:
clases fi hi %i
0
alemán 5 0 125 120 5
español 9 00 225 220 5
francés 11 00 275 270 5
inglés 13 00 325 320 5
ruso 2 00 050 50 0
suma 40 10 000 1000 0
2.2.2. Variables discretas
Ejemplo de recogida (no ordenada) de unos datos cuantitativos discretos:
14 13 3 13 7 12 13 11 13 12 11 13
7 10 12 13 14 11 13 12 4 12 10 13
9 12 13 11 13 14 10 12 11 13 15 9
12 11 13 10 13 11 12 5 9 12 13 15
Los mismos criterios usados para el caso cualitativo sirven para el caso cuantitativo discreto a la hora de presentar
tabularmente los datos. Además se pueden calcular:
• Frecuencia absoluta acumulada de la clase i-ésima: Fi = f1 + f2 + · · · + fi =número de individuos que

caen dentro de dicha clase o cualquier clase anterior (una vez ordenadas las clases de menor a mayor).
Fi
• Frecuencia relativa acumulada de la clase i-ésima: Hi = h1 + h2 + · · · + hi = .
n
La distribución de frecuencias de los datos cuantitativos discretos del ejemplo anterior es:
xi fi hi Fi Hi
3 1 00 0208 1 00 0208
4 1 00 0208 2 00 0417
5 1 00 0208 3 00 0625
7 2 00 0417 5 00 1042
9 3 00 0625 8 00 1667
10 4 00 0833 12 00 2500
11 7 00 1458 19 00 3958
12 10 00 2083 29 00 6042
13 14 00 2917 43 00 8958
14 3 00 0625 46 00 9583
15 2 00 0417 48 10 0000
2.2.3. Variables continuas
Los datos procedentes de una variable continua se pueden tabular de la misma forma que los datos de una variable
discreta, pero lo usual en el caso de variables continuas es dividir el intervalo de valores posibles en intervalos
222 MATEM ÁTICAS
contiguos llamados intervalos de clase. Una vez agrupados los datos en intervalos, éstos se tabulan de forma
análoga al caso de variables discretas.
• Número adecuado de intervalos (Regla de Sturges):

k = 1 + 30 322 log n,
siendo n el número total de observaciones.
• Amplitud del intervalo de clase (ì , ì+1 ): d = ì+1 − ì .
ì + ì+1
• Marca de clase del intervalo (ì , ì+1 ): xi = .
2
Ejemplo de recogida (no ordenada) de unos datos cuantitativos continuos:
30 9 40 1 40 2 30 2 10 6
20 5 10 1 80 1 50 1 20 7
10 9 70 3 20 4 40 9 10 6
50 0 20 5 60 5 10 9 50 2
60 3 10 2 30 3 10 8 40 4
Pasos para la agrupación en intervalos de clase de igual amplitud:
1o ) Se calcula el recorrido de las observaciones (ver el apartado 2.5.1.):

R = xmax − xmin = 80 1 − 10 1 = 7 .
2o ) El número de intervalos de clase que podemos tomar para agrupar los datos es:
k = 1 + 30 322 log 25 = 50 64 ,
que aproximamos por el número natural siguiente: k = 6.
3o ) Por tanto, la amplitud de cada intervalo es:

R 7
d== = 10 1667 .
k 6
Al no ser exacta, aproximamos la cantidad anterior a un número ligeramente superior; por ejemplo, d =
10 17.
Como la amplitud de los intervalos la hemos tomado un poco mayor de lo que se obtiene en un principio, entonces
el nuevo recorrido es:
R0 = número de intervalos · amplitud = 6 · 10 17 = 70 02 .
Como el recorrido original es 7, entonces sobra 00 02, con lo cual repartimos este sobrante restando la mitad a la
observación mı́nima y sumando la otra mitad a la observación máxima; es decir:
xmin − 00 01, xmax + 00 01 ,
con lo que obtenemos los seis intervalos de clase determinados por los valores siguientes:
xmin − 00 01 = 10 10 − 00 01 = 10 09,
10 09 + 10 17 = 20 26,
20 26 + 10 17 = 30 43,
30 43 + 10 17 = 40 60,
40 60 + 10 17 = 50 77,
50 77 + 10 17 = 60 94,
60 94 + 10 17 = 80 11 = xmax + 00 01 .
Los intervalos son: (10 09, 20 26], (20 26, 30 43], (30 43, 40 60], (40 60, 50 77], (50 77, 60 94], (60 94, 80 11]. Agrupamos,
pues, los datos en los intervalos anteriores y damos su distribución de frecuencias en la tabla siguiente:
(li , li+1 ] xi fi hi Fi Hi
0 0 0 0
(1 09, 2 26] 1 675 7 0 28 7 00 28
(20 26, 30 43] 20 845 6 00 24 13 00 52
(30 43, 40 60] 40 015 4 00 16 17 00 68
(40 60, 50 77] 50 185 4 00 16 21 00 84
(50 77, 60 94] 60 355 2 00 08 23 00 92
(60 94, 80 11] 70 525 2 00 08 25 10 00
La agrupación en intervalos de clase también puede hacerse con una variable discreta si el número de datos
distintos es muy grande.
2.3. Representaciones gráficas
2.3.1. Variables cualitativas
1. Diagrama de barras: se sitúan en el eje horizontal las clases y sobre cada una de ellas se levanta un segmento
rectilı́neo (o un rectángulo) de altura igual a la frecuencia (absoluta o relativa) de cada clase (Figura 8.1 (a)).
2. Gráfico de sectores: se divide el área de un cı́rculo en sectores circulares de ángulos proporcionales a las
frecuencias absolutas de las clases (Figura 8.1 (b)).
ruso
5% alemán
13%
14
12
10 inglés
32%
español
23%
8
0
francés
alemán español francés inglés ruso 27%
a) Diagrama de barras de frecuencias absolutas b) Gráfico de sectores
Figura 8.1: Representaciones gráficas de los datos cualitativos de la sección 2.2.1.
2.3.2. Variables cuantitativas con datos no agrupados en intervalos
1. Diagrama de barras: igual que en el caso de variables cualitativas (Figura 8.2 (a)).
2. Polı́gono de frecuencias: se sitúan los puntos que resultan de tomar en el eje horizontal los distintos valores
de la variable y en el eje vertical sus correspondientes frecuencias (absolutas o relativas), uniendo después
los puntos mediante segmentos rectilı́neos (Figura 8.2 (b)).
224 MATEM ÁTICAS
3. Gráfico de frecuencias acumuladas: es la representación gráfica de las frecuencias acumuladas (absolutas

o relativas), para todo valor numérico. Indiquemos que la frecuencia acumulada (absoluta o relativa) de
un valor numérico que no aparezca en la distribución de frecuencias es igual a la frecuencia acumulada
(absoluta o relativa) de la observación inmediatamente anterior (ordenadas de menor a mayor). Por tanto, el
gráfico de frecuencias acumuladas siempre tiene forma de “escalera” (Figura 8.2 (c)).
14
00 30
12
00 25
10
8 00 20
6 00 15
4
00 10
2
00 05
0
0 2 4 6 8 10 12 14 16 00 00
a) Diagrama de barras de frecuencias ab- 0 2 4 6 8 10 12 14 16
solutas b) Polı́gono de frecuencias relativas
50
40
30
20
10
0
0 2 4 6 8 10 12 14 16
c) Gráfico de frecuencias absolutas acumu-
ladas
Figura 8.2: Representaciones gráficas de los datos cuantitativos discretos de la sección 2.2.2.
2.3.3. Variables cuantitativas con datos agrupados en intervalos
1. Histograma de frecuencias: se sitúan en el eje horizontal los intervalos de clase y sobre cada uno se levanta
un rectángulo de área proporcional a la frecuencia absoluta.
(a) Si todos los intervalos tienen la misma amplitud, entonces basta con hacer los rectángulos con una
altura igual a la frecuencia absoluta (Figura 8.4 (a)).
(b) Si los intervalos tienen distinta amplitud, la construcción del histograma presenta una importante va-
riación. Una vez marcados sobre el eje horizontal los extremos de los intervalos, hay que calcular la
altura de los rectángulos de forma que su área sea igual o proporcional a la frecuencia absoluta del
intervalo. Veámoslo con un ejemplo.
Sea la siguiente distribución de frecuencias:
intervalo fi
[0, 3] 11
(3, 50 5] 10
(50 5, 60 5] 2
(60 5, 8] 1
(8, 10] 1
Recordemos que la fórmula del área de un rectángulo es base × altura y consideremos que los
rectángulos del histograma van a tener un área igual a la frecuencia absoluta. Por ejemplo, para averi-
guar la altura del primer rectángulo, tenemos en cuenta que la base es igual a 3 y el área del rectángulo
ha de ser igual a 11, por lo que la altura debe ser igual a 11/3 = 30 6667. Procediendo de forma
análoga con el resto de los intervalos, se tiene que el histograma de la distribución de frecuencias dada
por la tabla anterior es la Figura 8.3.
0
0 3 50 5 60 5 8 10
Figura 8.3: Histograma (intervalos de distinta amplitud)
2. Polı́gono de frecuencias: se sitúan los puntos que resultan de tomar en el eje horizontal las marcas de clase
de los intervalos y en el eje vertical sus correspondientes frecuencias (absolutas o relativas), uniendo después
los puntos mediante segmentos rectilı́neos (Figura 8.4 (b)).
3. Polı́gono de frecuencias acumuladas: se sitúan los puntos que resultan de tomar en el eje horizontal los ex-
tremos superiores de los intervalos de clase y en el eje vertical sus correspondientes frecuencias acumuladas
(absolutas o relativas), uniendo después los puntos mediante segmentos rectilı́neos (Figura 8.4 (c)).
2.4. Medidas de posición
Son valores que nos sirven para indicar la posición alrededor de la cual se distribuyen las observaciones. Sólo se
calculan cuando la variable es cuantitativa.
2.4.1. Moda
La denotaremos por Mo . No tiene que ser única.

226 MATEM ÁTICAS
7 7
6 6
5 5
4 4
3 3
2 2
1 1
0 0
10 09 20 26 30 43 40 60 50 77 60 94 80 11 00 505 10 675 20 845 40 015 50 185 60 355 70 525 80 695
a) Histograma (intervalos de la misma amplitud) b) Polı́gono de frecuencias absolutas
25
20
15
10
0
10 09 20 26 30 43 40 60 50 77 60 94 80 11
c) Polı́gono de frecuencias absolutas acumuladas
Figura 8.4: Representaciones gráficas de los datos cuantitativos continuos de la sección 2.2.3.
1. Datos no agrupados en intervalos.

Mo es el dato (o datos) con mayor frecuencia absoluta.
2. Datos agrupados en intervalos.
Intervalo modal: el que tiene mayor frecuencia absoluta. No tiene que ser único.
(a) Intervalo modal no único.

Las modas son las marcas de clase de los intervalos modales.
(b) Intervalo modal único.
• Intervalos de la misma amplitud.
fi − fi−1
Mo = ì + (ì+1 − ì ) ,
2fi − fi−1 − fi+1
donde (ì , ì+1 ] es el intervalo modal, fi es su frecuencia absoluta, fi−1 es la frecuencia absoluta
del intervalo anterior al modal, y fi+1 es la frecuencia absoluta del intervalo posterior al modal.
• Intervalos de distinta amplitud.
ki − ki−1
Mo = ì + (ì+1 − ì ) ,
2ki − ki−1 − ki+1
donde (ì , ì+1 ] es el intervalo modal, ki es la altura del rectángulo del histograma que tiene
de base al intervalo modal, ki−1 es la altura del rectángulo del histograma que tiene de base al
intervalo anterior al modal, y ki+1 es la altura del rectángulo del histograma que tiene de base al
intervalo posterior al modal.
2.4.2. Mediana
La denotaremos por Me . Es el valor que tiene la propiedad de dejar a su izquierda el 50% de las observaciones y
a su derecha el 50% restante, siempre que hayamos ordenado los datos de menor a mayor. Por tanto, la frecuencia
absoluta acumulada de la mediana es igual a n/2, siendo n el número total de datos.
1. Datos no agrupados en intervalos.

(a) Si en la distribución de frecuencias no aparece ninguna frecuencia absoluta acumulada igual a n/2
entonces se toma como mediana el valor cuya frecuencia absoluta acumulada sea la más próxima a
n/2 por exceso. Un caso en que esto ocurre es cuando el número total de datos es impar; en cuyo caso
también se puede hallar la mediana como el dato central, una vez que los datos están ordenados de
menor a mayor.
Por ejemplo, sea la distribución de frecuencias siguiente:
xi fi Fi
2 2 2
4 3 5
6 5 10
8 3 13
En este caso se verifica que n/2 = 13/2 = 60 5, por lo que no hay ningún dato cuya frecuencia
acumulada sea igual a n/2. Entonces, se toma como mediana el siguiente dato; es decir, el dato cuya
frecuencia acumulada es 10. Por tanto, Me = 6. Esto se puede observar más claramente si recurrimos
al gráfico de frecuencias absolutas acumuladas, que es la Figura 8.5.
13
10
60 5
0
0 2 4 6 8 10
Figura 8.5: Gráfico de frecuencias absolutas acumuladas
(b) Si en la distribución de frecuencias aparece la frecuencia absoluta acumulada igual a n/2 entonces
ocurre que hay todo un intervalo [a, b) de valores cuya frecuencia absoluta acumulada es igual a n/2.
En este caso se toma como mediana el valor Me = a+b 2 .
Para que esto ocurra es necesario que n sea par; en cuyo caso también se puede calcular la mediana
ordenando los datos de menor a mayor, y luego hallando el punto medio de los dos datos centrales.
Por ejemplo, sea la distribución de frecuencias siguiente:
xi fi Fi
2 1 1
4 5 6
6 4 10
8 2 12
228 MATEM ÁTICAS
Todos los valores del intervalo [4, 6) tienen la frecuencia absoluta acumulada igual a n/2 = 6, de
forma que la mediana es Me = 4+6 2 = 5. Esto se puede observar más claramente si recurrimos al
gráfico de frecuencias absolutas acumuladas, que es la Figura 8.6.
12
10
1
0
0 2 4 6 8 10
Figura 8.6: Gráfico de frecuencias absolutas acumuladas
2. Datos agrupados en intervalos.

Intervalo mediano: intervalo que contiene a la mediana. Es el primer intervalo cuya frecuencia absoluta
acumulada (Fi ) es igual o mayor que n/2.
n
2 − Fi−1
Me = ì + (ì+1 − ì ) ,
fi
donde (ì , ì+1 ] es el intervalo mediano, fi es su frecuencia absoluta y Fi−1 es la frecuencia absoluta
acumulada del intervalo anterior al mediano.
2.4.3. Percentil o cuantil
El percentil (o cuantil) al r% es aquel valor que deja a su izquierda el r% de las observaciones y a su derecha el
(100-r)% restante, siempre que hayamos ordenado los datos de menor a mayor. Se suele denotar por Pr (o por
Cr ).
El cálculo de los percentiles se hace de modo similar al cálculo de la mediana, teniendo en cuenta que el percentil
al r% verifica que su frecuencia absoluta acumulada es igual a:
nr
.
100
Cuando los datos están agrupados en intervalos de clase, la fórmula del percentil al r% es:
nr
− Fi−1
Pr = ì + 100 (ì+1 − ì ) ,
fi
donde (ì , ì+1 ] es el intervalo que contiene a Pr , fi es su frecuencia absoluta y Fi−1 es la frecuencia absoluta
acumulada del intervalo anterior.
Algunos percentiles especiales son:

• Cuartiles: Primer cuartil = Q1 = P25 , Segundo cuartil = Q2 = P50 = M e y Tercer cuartil = Q3 = P75 .
• Deciles: Primer decil = D1 = P10 , Segundo decil = D2 = P20 , . . ., Noveno decil = D9 = P90 .
2.4.4. Media aritmética
Si x1 , x2 , . . . , xn son los n valores de la muestra, su media aritmética es:

x1 + x 2 + · · · + x n
x= .
n
Si los valores de los datos son x1 , x2 , . . . , xk , y ellos aparecen con frecuencias absolutas respectivas f1 , f2 , . . .,
fk (con f1 + f2 + · · · + fk = n) entonces la expresión de la media aritmética es:
X
k
xi fi
x1 f1 + x2 f2 + · · · + xk fk i=1
x= = .
n n
Si los datos están agrupados en intervalos de clase, la fórmula de la media aritmética es la misma, salvo que xi
representa la marca de clase del intervalo i−ésimo.
Dado que la media aritmética es la más común, en adelante la llamaremos sólo media.
Si disponemos de los datos de toda la población, entonces representamos la media aritmética por la letra griega µ
(que se lee mu).
Propiedades de la media
1. Si yi = a + bxi , siendo a y b constantes, entonces la media de la nueva variable es y = a + bx.
2. Si yi = xi − x, entonces y = 0.
Cálculo de la media por codificación (para datos agrupados en intervalos de la misma amplitud)
Si a es la marca de clase del intervalo central (o una de las centrales, cuando el número de ellos es par) y b es igual
a la amplitud de los intervalos, entonces realizamos la transformación siguiente:
xi − a
zi = ,
b
para todas las marcas de clase xi , y luego hallamos la media z. Como xi = a + bzi entonces por la propiedad 3
se cumple que la media deseada es x = a + bz.
2.4.5. Otras medias
De los otros tipos de medias, la de mayor interés práctico es la media ponderada. Ésta consiste en asignar a cada
valor xi de los datos un peso pi que depende de su importancia relativa bajo algún criterio. La definición de la
230 MATEM ÁTICAS
media ponderada es:

X
k
xi p i
x1 p 1 + x 2 p 2 + · · · + xk p k i=1
xp = = k .
p1 + p2 + · · · + pk X
pi
i=1
Si los datos de la muestra son x1 , x2 , . . . , xk y ellos aparecen con frecuencias absolutas respectivas f1 , f2 , . . ., fk
(con f1 + f2 + · · · + fk = n), entonces se definen:
• Media geométrica:
q
n
xg = xf11 xf22 · · · xfkk .
• Media cuadrática: v
u k
uX
r u x2i fi
u
x21 f1 + x22 f2 + · · · + x2k fk t i=1
xc = = .
n n
• Media armónica:
n n
xa = = k .
f1
+
f2
+ ···+
fk X fi
x1 x2 xk x
i=1 i
En las tres definiciones anteriores, si los datos están agrupados en intervalos entonces xi representa la marca de
clase del intervalo i-ésimo.
Fijada una muestra cualquiera, siempre se verifica:
xa 6 xg 6 x 6 xc .
2.5. Medidas de dispersión
Son valores que miden el grado de separación de las observaciones entre sı́ o con respecto a ciertas medidas de
posición. Sólo se calculan cuando la variable es cuantitativa.
2.5.1. Recorrido
Es una medida de dispersión global que se define como la diferencia entre la observación mayor, xmax , y la
observación menor, xmin , y se denota por R; es decir:
R = xmax − xmin .
Si el recorrido es pequeño entonces los datos están poco dispersos.

2.5.2. Recorrido intercuartı́lico
Se denota por RI y se define como la diferencia entre el tercer cuartil y el primer cuartil; es decir:
RI = Q3 − Q1 .
Si el recorrido intercuartı́lico es pequeño entonces los datos están cerca de la mediana; en caso contrario, los datos
están alejados de ella.
2.5.3. Desviación mediana
(con f1 + f2 + · · · + fk = n), entonces:
X
k
|xi − Me |fi
i=1
DMe = .
n
Si los datos están agrupados en intervalos, xi representa la marca de clase del intervalo i−ésimo.
Cuando DMe es pequeña, entonces los datos están cerca de la mediana. En caso contrario, los datos están alejados
de la mediana.
2.5.4. Mediana de las desviaciones absolutas respecto de la mediana
La mediana de las desviaciones absolutas respecto de la mediana (M DA) es la mediana de los valores absolutos
de las diferencias entre los valores de la muestra y la mediana de todos los datos. Para determinar M DA se calcula
la mediana de todos los datos (Me ); se hallan las desviaciones de los datos respecto de la mediana:
x1 − Me , x2 − Me , . . . , xn − Me ,
se toman los valores absolutos para eliminar los signos:
|x1 − Me |, |x2 − Me |, . . . , |xn − Me | ,
y luego se calcula la mediana de estos valores.
Cuando M DA es pequeña, entonces los datos están cerca de la mediana. En caso contrario, los datos están
alejados de la mediana.
Si los datos están agrupados en intervalos, en vez de calcular M DA se calcula DMe , pues su interpretación
descriptiva es la misma.
232 MATEM ÁTICAS
2.5.5. Desviación media
(con f1 + f2 + · · · + fk = n), entonces:
X
k
|xi − x|fi
i=1
Dx = .
n
Si los datos están agrupados en intervalos, xi representa la marca de clase del intervalo i−ésimo.
Cuando Dx es pequeña, entonces los datos están cerca de la media. En caso contrario, los datos están alejados de
la media.
2.5.6. Varianza y desviación tı́pica
• Varianza (algunos autores la llaman varianza sesgada):
X
k X
k
(xi − x)2 fi x2i fi
s2x = i=1
= i=1
− x2 .
n n
• Desviación tı́pica: raı́z cuadrada de la varianza:

v v
u k u k
uX uX
u 2
(xi − x) fi u x2i fi
u u
t i=1 t i=1
sx = = − x2 .
n n
• Cuasivarianza (algunos autores la llaman varianza insesgada, varianza corregida o sólo varianza):
!
Xk Xk
2 2
(xi − x) fi xi fi − nx2
Sx2 = i=1
= i=1
.
n−1 n−1
• Cuasidesviación tı́pica: raı́z cuadrada de la cuasivarianza:

v v !
u k u k
uX u X
u 2
(xi − x) fi u 2
xi fi − nx2
u u
t i=1 t i=1
Sx = = .
n−1 n−1
En consecuencia, la varianza y la cuasivarianza están relacionadas de la siguiente forma:
(n − 1)Sx2 = ns2x ,
por lo cual se puede calcular una de ellas a partir de la otra.

Si los datos están agrupados en intervalos de clase, las fórmulas anteriores son las mismas, salvo que xi representa
la marca de clase del intervalo i−ésimo.
Cuando la desviación tı́pica (o la cuasidesviación tı́pica) es pequeña, entonces los datos están cerca de la media.
En caso contrario, los datos están alejados de la media.
Si disponemos de los datos de toda la población, la varianza se denota por σ 2 y la desviación tı́pica por σ (letra
griega que se lee sigma).
Propiedad de la varianza
Si yi = a + bxi , siendo a y b constantes, entonces la varianza de la nueva variable es s2y = b2 s2x y por tanto la
desviación tı́pica es sy = |b|sx .
Cálculo de la varianza por codificación (para datos agrupados en intervalos de la misma amplitud)
Si a es la marca de clase del intervalo central (o una de las centrales, cuando el número de ellos es par) y b es igual
a la amplitud de los intervalos, entonces realizamos la transformación siguiente:
xi − a
zi =
b
y después calculamos la varianza de la nueva variable, s2z . Como xi = a + bzi entonces la varianza deseada es
s2x = b2 s2z y por tanto la desviación tı́pica es sx = |b|sz .
2.5.7. Coeficiente de variación
sx sx
CV = ó CV = 100% .
|x| |x|
Algunos autores sustituyen sx por Sx en la fórmula anterior. Este coeficiente nos sirve para comparar la disper-
sión relativa de dos muestras distintas. La muestra que tenga un coeficiente de variación más grande es la más
heterogénea (sus datos están más dispersos).
2.6. Momentos
• Momento de orden k respecto del origen:

X
k
xki fi
i=1
ak = para k = 1, 2, 3, . . . .
n
• Momento de orden k respecto de la media:

X
k
(xi − x)k fi
i=1
mk = para k = 1, 2, 3, . . . .
n
234 MATEM ÁTICAS
Algunos casos particulares son:
a1 = x = media.
m1 = 0.
m2 = s2x = varianza.
Desarrollando el binomio (xi − x)k se puede comprobar que existe una relación entre los momentos respecto al
origen y los momentos respecto de la media; por ejemplo:
m2 = a2 − a21
m3 = a3 − 3a2 a1 + 2a31
m4 = a4 − 4a3 a1 + 6a2 a21 − 3a41
2.7. Medidas de forma
A través de las representaciones gráficas (histogramas, diagramas de barras, etc.) podemos hacernos una idea
sobre la forma de las distribuciones, pero también resulta importante cuantificar esta caracterı́stica a través de las
medidas de forma.
Figura 8.7: Curva normal
Las caracterı́sticas bajo-ancho, alto-estrecho se miden respecto de una curva modelo llamada curva Normal (véase
la Figura 8.7). Esta curva es la representación gráfica de la siguiente función:
1 1 x−µ 2
y= √ e− 2 ( σ )
σ 2π
donde x, µ y σ son números reales, siendo además σ > 0; e es la base de los logaritmos neperianos (e =
20 718281829 . . .) y π es la relación de la longitud de una circunferencia a su diámetro (π = 30 141592654 . . .).
Para cada par de valores de µ y σ tendremos una curva Normal distinta. Es decir, tenemos una familia de curvas.
Pero todas ellas coinciden en algunas propiedades, como, por ejemplo:
a) Tiene un único máximo para x = µ.
b) Es simétrica respecto al eje vertical que pasa por x = µ.
c) Se acerca asintóticamente al eje horizontal. En otras palabras, se acerca más y más a ese eje, tanto por la
derecha como por la izquierda, sin llegar a tocarlo en ningún punto.
2.7.1. Asimetrı́a
Se dice que una distribución presenta una asimetrı́a positiva o por la derecha cuando su polı́gono de frecuencias
(absolutas o relativas) es similar a la Figura 8.8 (a). Análogamente, se dice que una distribución presenta una
asimetrı́a negativa o por la izquierda cuando su polı́gono de frecuencias (absolutas o relativas) tiene una forma
parecida a la Figura 8.8 (b). Diremos que una distribución presenta simetrı́a cuando su polı́gono de frecuencias
(absolutas o relativas) es similar a la Figura 8.7.
(a) Distribución asimétrica por la derecha (b) Distribución asimétrica por la izquierda
Figura 8.8: Asimetrı́a
Para las distribuciones unimodales, como medida de asimetrı́a se suele utilizar el coeficiente de asimetrı́a de
Pearson, que se define por la expresión:
x − Mo
CA = ,
sx
que permite distinguir los casos:
a) CA = 0 (distribución simétrica),
b) CA > 0 (distribución asimétrica por la derecha),
c) CA < 0 (distribución asimétrica por la izquierda).
Cuando la distribución no es unimodal no se puede emplear el anterior coeficiente, por lo que se introduce el
coeficiente de asimetrı́a de Fisher, que viene dado por:
m3
g1 = ,
s3x
que permite distinguir los casos:
a) g1 = 0 (distribución simétrica),
b) g1 > 0 (distribución asimétrica por la derecha),
c) g1 < 0 (distribución asimétrica por la izquierda).
2.7.2. Apuntamiento
Si el polı́gono de frecuencias (absolutas o relativas) es análogo a la curva Normal, entonces se dice que la dis-
tribución es mesocúrtica (véase la Figura 8.7); si es más elevado y estrecho que la curva Normal, entonces se
llama distribución leptocúrtica (véase la Figura 8.9 (a)); y si es menos elevado y más ancho que la curva Normal,
entonces se llama distribución platicúrtica (véase la Figura 8.9 (b)).
236 MATEM ÁTICAS
(a) Distribución muy apuntada o leptocúrtica (b) Distribución poco apuntada o platicúrtica
Figura 8.9: Apuntamiento
Como medida del apuntamiento se utiliza el coeficiente de curtosis, dado por:

m4
g2 = − 3,
s4x
permitiendo distinguir los casos:
a) g2 = 0 (distribución mesocúrtica),
b) g2 > 0 (distribución leptocúrtica),
c) g2 < 0 (distribución platicúrtica).
A.8.1. La tabla siguiente muestra la puntuación obtenida por los alumnos de primero de una facultad en un examen
“tipo test” realizado en una determinada asignatura:
60 3 70 2 60 8 70 4 80 2 90 3 40 6 50 3 50 9 60 7
70 6 60 8 50 8 40 9 40 7 40 6 50 7 60 8 70 8 90 1
30 9 40 8 50 6 50 8 70 1 80 4 90 1 40 8 50 5 60 3
40 8 50 7 60 8 70 3 70 5 70 6 80 1 80 8 70 5 90 5
50 7 60 6 70 3 50 6 40 7 30 9 30 8 40 7 50 1 50 8
70 3 60 5 60 8 60 9 50 8 50 3 60 7 70 8 60 9 40 7
a) Agrupar los datos en los siguientes intervalos: [0,5) (suspenso), [5,7) (aprobado), [7,9) (notable) y
[9,10) (sobresaliente). A partir de esta agrupación hacer lo siguiente:
b) Dibujar el histograma de frecuencias absolutas.
c) Hallar la moda, la media y la mediana.
A.8.2. La tabla siguiente muestra los salarios de 34 trabajadores elegidos al azar en una determinada empresa.
salario mensual (en pts) número de trabajadores

20000 1
30000 3
40000 3
50000 15
60000 6
70000 2
80000 4
Hacer el diagrama de barras de frecuencias absolutas y el gráfico de frecuencias acumuladas absolutas.

Calcular la mediana y la desviación mediana. ¿Están los datos cerca de la mediana?
A.8.3. Los varones entre 20 y 60 años que contrajeron matrimonio durante el año 1961 en España presentan la
siguiente distribución por edades.
edad número de varones

[20,25] 41000
(25,30] 123000
(30,35] 44000
(35,40] 13000
(40,50] 7000
(50,60] 3000
Dibujar el polı́gono de frecuencias acumuladas absolutas. Calcular la moda, la mediana, los cuartiles, el
segundo decil y el percentil al 37 por ciento. Calcular la desviación media y deducir si los datos están cerca
de la media.
A.8.4. Se ha revisado un lote de 1000 piezas esmaltadas, obteniéndose el número de defectos de cada pieza, lo
que se indica en la siguiente tabla:
no de defectos frecuencia
0 600
1 310
2 75
3 13
4 2
Hacer el polı́gono de frecuencias absolutas. Determinar la media y la desviación tı́pica. Deducir si los datos
están cerca de la media.
A.8.5. Un fabricante de calzado quiere conocer la distribución de las tallas de los zapatos demandados por los
hombres. Elige una muestra aleatoria de 50 hombres obteniendo los siguientes resultados.
talla número de hombres

37 2
38 3
39 5
40 8
41 11
42 7
43 6
44 5
45 3
Se desea obtener:
a) El diagrama de barras y el gráfico de frecuencias acumuladas.

b) La media, moda y mediana.
c) La mediana de las desviaciones absolutas respecto de la mediana. ¿Están los datos cerca de la media-
na?
d) La desviación tı́pica. ¿Están los datos cerca de la media?
e) El coeficiente de asimetrı́a de Pearson.
238 MATEM ÁTICAS
A.8.6. Un alumno “muy previsor”quiere escoger una asignatura de la que dan clases dos profesores diferentes
A y B. Según datos del pasado año, la nota media de los alumnos que tuvieron el profesor A fue de 60 1
y la desviación tı́pica fue 00 95. En el curso del profesor B, la media fue 50 2 y la desviación tı́pica 20 2.
Suponiendo que puede elegir al profesor ¿qué profesor debe elegir y por qué, según desee:
a) aprobar “sin demasiadas complicaciones’”?
b) conseguir la nota más alta?
A.8.7. A una competición de tiro concurren seis tiradores, A, B, C, D, E y F, en tres modalidades de tiro, que
llamaremos 1, 2 y 3. El número de blancos obtenidos por cada uno, en cada modalidad de tiro, puede verse
en la siguiente tabla.
tirador 1 2 3
A 44 29 12
B 44 27 13
C 46 28 13
D 43 27 17
E 47 25 14
F 46 26 15
Aparte de haber un primer premio en cada modalidad, el jurado debe conceder un premio especial al tirador
que considere “globalmente mejor”, lo cual es motivo de arduas discusiones (¿por qué?). Un miembro del
jurado dice que “basándose en Estadı́stica” este premio debe ser para el tirador D. ¿Por qué?
A.8.8. Una empresa debe cubrir un cierto número de puestos de trabajo de dos tipos, A y B. Se somete a los
aspirantes a dos pruebas, ambas puntuadas de 0 a 50, diseñadas para valorar sus aptitudes en uno y en otro
tipo de trabajo. En la prueba A la media de calificaciones ha sido 28 y la desviación tı́pica 30 4. En la prueba
B la media ha sido 24 y la desviación tı́pica 20 1. ¿Qué tipo de puesto de trabajo asignaremos a un aspirante
que hubiese obtenido 33 puntos en la prueba A y 28 en la B?
A.8.9. a) Sea {x1 , x2 , . . . , x100 } una muestra de media aritmética 21’5 y sean x101 = 22, x102 = 19, x103 =
200 5 tres observaciones más. Calcular la media aritmética de la nueva muestra {x1 , x2 , . . . , x100 , x101 , x102 , x1
b) Sea x̄ la media aritmética de la muestra {x1 , x2 , . . . , xn } y sea ȳ la media aritmética de la muestra
{y1 , y2 , . . . , ym }. ¿Cuál será la media aritmética de la unión de ambas muestras?
A.8.10. Se preguntó a varias personas, elegidas al azar, el número de periódicos distintos que leı́an trimestralmen-
te, y se obtuvieron las siguientes respuestas:
Número de periódicos 0 1 2 3 4 5 6 7
Número de personas 7 13 18 15 11 6 4 2
Determinar la distribución de frecuencias relativas, acumuladas absolutas y acumuladas relativas. Hacer el

diagrama de barras de frecuencias absolutas, el polı́gono de frecuencias relativas y el gráfico de frecuencias
acumuladas absolutas. Hallar las medidas de posición, dispersión y forma e interpretar los resultados.
A.8.11. Se considera la variable cuantitativa peso, en kilogramos, de una muestra de 25 alumnos de una determi-
nada facultad:
530 5 550 5 530 0 760 5 520 5
510 5 560 0 730 5 510 0 490 5
570 0 530 0 720 0 520 5 510 5
680 5 680 0 650 0 530 0 680 5
530 5 550 5 530 0 510 5 530 0
Agrupar los datos en intervalos de la misma amplitud. Con los datos agrupados en intervalos: determinar
la distribución de frecuencias absolutas, relativas, acumuladas absolutas y acumuladas relativas. Hacer
el histograma de frecuencias absolutas, el polı́gono de frecuencias relativas y el polı́gono de frecuencias
acumuladas absolutas. Hallar las medidas de posición, dispersión y forma e interpretar los resultados.
A.8.12. A continuación se dan los datos correspondientes al tiempo de espera (en minutos) hasta que son atendidos
40 personas que visitan una determinada caja de ahorros:
11 13 15 20 21 24 17 9 10 12
20 18 16 14 13 11 10 13 15 19
24 20 21 22 18 16 11 14 8 6
15 18 19 20 17 15 16 13 12 14
Agrupar los datos en intervalos. Con los datos agrupados en intervalos: determinar la distribución de fre-
cuencias absolutas, relativas, acumuladas absolutas y acumuladas relativas. Hacer el histograma de frecuen-
cias absolutas y el polı́gono de frecuencias acumuladas relativas. Hallar las medidas de posición, dispersión
y forma e interpretar los resultados.
A.8.13. Los datos siguientes corresponden al sueldo (en miles de pesetas) de una muestra de 25 empleados de
una determinada empresa.
sueldo número de
(en miles de pesetas) empleados
[90,100] 12
(100,110] 7
(110,120] 4
(120,130] 2
Determinar la distribución de frecuencias relativas, acumuladas absolutas y acumuladas relativas. Hacer el

histograma de frecuencias absolutas y el polı́gono de frecuencias relativas. Hallar las medidas de posición,
dispersión y forma e interpretar los resultados.
4.1. Introducción
La práctica se va a realizar con el programa STATISTIX for Windows, versión 1.0 (en inglés). Para ejecutar el
programa debemos acceder a la carpeta STATISTIX y ejecutar el programa STATISTIX. Una vez en el programa,
aparecerá la pantalla de la Figura 8.10, con un menú en la parte superior que, de ahora en adelante, denominaremos
menú principal (File Edit Data Statistics Preferences Window Help).
Todas las opciones del menú principal son ellas mismas menús, los cuales ofrecen variadas posibilidades de
manipulación de datos y de procedimientos estadı́sticos.
El menú File incluye procedimientos para abrir y grabar ficheros de datos, ası́ como la posibilidad de importar
datos de otros programas o exportar datos en un formato predeterminado. El menú Data proporciona muchas fun-
ciones para manipular la hoja de datos, incluyendo las transformaciones de variables. El menú Statistics lista
varios menús que nos permiten realizar análisis estadı́sticos básicos y avanzados. Por último, el menú Windows
lista las ventanas abiertas dentro de STATISTIX, que incluye la hoja de datos y las ventanas de resultados.
Para salir del programa debe seleccionarse la opción Exit del menú File. Los usuarios de Windows 95 o
Windows NT pueden abandonar el programa pulsando el botón de la esquina superior derecha de la ventana
(botón × ).
240 MATEM ÁTICAS
Figura 8.10: Pantalla inicial del programa donde aparece, además del menú principal del programa, una tabla en
blanco donde introduciremos los datos.
Antes de realizar ninguna operación es necesario tener un conjunto de datos en uso, para lo cual podemos pro-
ceder de dos formas distintas: o introducirlos directamente a través del teclado o recuperar un fichero con datos
previamente almacenado.
4.2. Entrada de datos a través del teclado
Los datos en STATISTIX pueden ser considerados tablas de datos, donde las columnas se denominan varia-
bles y las filas casos. En primer lugar debemos declarar las variables, para lo que seleccionamos las opciones
Data|Insert|Variables. Antes de seguir adelante convendrı́a hacer una aclaración: cuando digamos que se
seleccionan varias opciones, como acabamos de hacer, se sobreentenderá que cada opción se encuentra en el
menú correspondiente a la opción anterior, salvo la primera opción que se encuentra en el menú principal. Una
vez elegidas las opciones anteriores aparece la ventana de introducción de variables (ver Figura 8.11).
Figura 8.11: Pantalla de STATISTIX para la introducción de nuevas variables.
En el recuadro New Variable Names debemos escribir los nombres de las variables y su tipo, ya que STATISTIX
distingue cuatro clases de datos: números reales, números enteros, fechas y cadenas de caracteres. Para indicar
los tres últimos tipos, el nombre de la variable se acompaña (entre paréntesis) de las letras I, D o Sxx, donde xx
denota un número que indica la longitud máxima de las cadenas.
El nombre de una variable es una cadena de caracteres con una longitud variable entre uno y nueve caracteres,
debe comenzar con una letra y sólo puede estar formado por letras, números y el carácter de subrayado. Solamente
hay unas pocas palabras (como CASE, PI, RANDOM, etc.) que no se pueden utilizar como nombres de variables ya
que están reservadas para otras tareas.
Supongamos que queremos introducir los datos de la siguiente tabla, que corresponde a una muestra de 25 alumnos
procedentes de la población formada por todos los alumnos matriculados en la asignatura “Estadı́stica” de una
determinada licenciatura de la Universidad de Murcia.
Fecha de Nacimiento Sexo Opinión Edad Altura Peso Nota

15/02/79 M 2 18 1.62 53.5 3.9
17/09/78 M 3 19 1.64 55.5 4.1
23/05/77 M 1 20 1.63 53.0 4.2
02/01/72 V 1 25 1.78 76.5 3.2
31/10/75 M 0 22 1.62 52.5 1.6
12/09/77 M 1 20 1.65 51.5 2.5
09/11/77 M 1 20 1.64 56.0 1.1
21/12/78 V 4 19 1.74 73.5 8.1
16/06/78 M 3 19 1.63 51.0 5.1
12/07/78 M 2 19 1.61 49.5 2.7
05/08/77 M 1 20 1.64 57.0 1.9
03/04/78 M 3 19 1.62 53.0 7.3
19/02/76 V 2 21 1.75 72.0 2.4
14/05/78 M 3 19 1.66 52.5 4.9
29/06/77 M 2 20 1.63 51.5 1.6
17/09/78 V 4 19 1.70 68.5 5.0
23/03/73 V 2 24 1.72 68.0 2.5
22/10/78 V 3 19 1.74 65.0 6.5
01/09/78 M 1 19 1.66 53.0 1.9
09/07/78 V 3 19 1.71 68.5 5.2
12/10/78 M 3 19 1.65 53.5 6.3
13/11/74 M 2 23 1.66 55.5 1.2
25/04/77 M 2 20 1.64 53.0 3.3
28/07/78 M 3 19 1.60 51.5 1.8
15/11/78 M 2 19 1.61 53.0 4.4
Se ha realizado un experimento consistente en averiguar, de cada uno de los alumnos de la muestra, los siguientes
datos:
Fecha de Nacimiento: Está en el formato dd/mm/aa (dı́a/mes/año).

Sexo: M=Mujer, V=Varón.
Opinión: La opinión del alumno respecto de la asignatura está indicada según la siguiente equivalencia: 0=Mala,
1=Regular, 2=Normal, 3=Buena, 4=Excelente.
Edad: En años.
Altura: En metros.
Peso: En kilogramos.
242 MATEM ÁTICAS
Nota: La nota final de la asignatura es un número comprendido entre 0 y 10.
En el recuadro New Variable Names podemos declarar más de una variable, pero hemos de tener presente que
los nombres de las variables deben ir separados entre sı́ por un espacio en blanco. Entonces una forma posible de
declarar las variables anteriores serı́a la siguiente:
FechaNac(d) Sexo(s1) Opinion(i) Edad(i) Altura Peso Nota
Aparece entonces en la tabla de la pantalla los nombres de nuestras variables situados en la primera fila. Debajo
de cada una de las variables, excepto de las cadenas de caracteres, aparece una letra M mayúscula, indicando que
debemos completar dicha casilla. Para desplazarnos por la tabla de datos podemos utilizar la tecla de entrada
( ) o las flechas: ↑ y ↓ para desplazarnos por las columnas, y ← y → para hacerlo en la misma fila. Una vez
rellena, tendremos una tabla de datos como en la Figura 8.12.
4.3. Grabación y lectura de ficheros de datos
Una vez introducidos los datos, éstos pueden guardarse en un fichero para poder ser utilizados en cualquier otro
momento. En realidad, los datos deberı́an guardarse muy a menudo, no sólo cuando hayamos terminado de
introducirlos todos (¿Qué pasarı́a si tenemos que introducir 1000 datos y cuando ya hemos introducido 950 se
produce un corte de energı́a eléctrica?)
Para grabar los datos se seleccionan las opciones File|Save o File|Save As. Por defecto, el programa nos
ofrece almacenar el fichero en el directorio del programa (usualmente c:\sxw), pero podemos cambiar de direc-
torio y guardarlo donde deseemos. Para distinguir los archivos creados con STATISTIX debemos recordar que
tiene la extensión sx. Guardemos los datos anteriores en un archivo con nombre Datos1.sx para poder utilizarlos
en las prácticas siguientes.
Para leer unos datos previamente almacenados debemos seleccionar las opciones File|Open. Aparece una ven-
tana en la que hay que seleccionar la unidad, el directorio y el nombre del archivo que queremos leer. Una vez
realizado lo anterior volvemos a tener disponibles los datos (ver Figura 8.12).
Figura 8.12: Pantalla del programa donde aparece la tabla de datos Datos1.
4.4. Edición y modificación de los datos
Una vez que tenemos disponibles los datos del archivo Datos1.sx, es posible que detectemos un error, o bien
que deseemos añadir nuevos datos y reorganizarlos. Todas estas operaciones se realizan seleccionando la opción
Data del menú principal.
Para modificar un dato nos situaremos sobre él con el ratón o bien utilizando las teclas ↑, ↓, ← y →. Este quedará
recuadrado y podremos modificarlo. Después de realizar cualquier modificación no hay que olvidar volver a
grabar nuestra tabla de datos. Cualquier modificación de un dato no surge efecto hasta que no es pulsada la tecla
de entrada ( ); en cualquier momento podemos abandonar la edición de una dato pulsando la tecla de escape
(ESC).
Si queremos añadir una nueva fila de datos (lo que denominamos un nuevo caso) basta con que nos situemos en
la primera fila disponible y comencemos a rellenar las diferentes casillas. Por el contrario, si deseamos borrar una
fila completa de la tabla, o varias filas, podemos proceder de dos formas distintas. La manera rápida de hacerlo es
seleccionar con el ratón las filas que deseamos eliminar (que deben ser contiguas) y pulsar la tecla Ctrl+X. La otra
forma de hacerlo es seleccionar las opciones Data|Delete|Cases y nos aparece una ventana (ver Figura 8.13)
solicitándonos los números de los casos primero y último que deseamos eliminar (se borrarán todos los casos entre
el primero y el último, ambos incluidos). Una vez han sido borrados los casos, se vuelven a renumerar los casos,
de forma que siempre sean consecutivos.
Figura 8.13: Pantalla del programa donde aparecen los casos que deseamos borrar. Debemos recordar que esto
mismo se puede realizar con el uso de teclas calientes; concretamente debemos marcar las filas y
pulsar Ctrl+X.
¿Qué ocurre si nos equivocamos al borrar los casos? Si no hemos guardado el archivo en el disco, podemos
volver a leer el archivo original de datos. Sin embargo, si las modificaciones ya han sido almacenadas entonces
sólo podemos insertar nuevos casos (lı́neas de la tabla) y volver a introducir los datos. Esto se consigue con las
opciones Data|Insert|Cases con lo cual el programa nos solicita que introduzcamos el número de casos que
queremos insertar y el caso por el que queremos comenzar (ver Figura 8.14).
Figura 8.14: Pantalla del programa que nos permite insertar nuevos casos.
Los datos numéricos se pueden introducir de muchas maneras y con diferentes grados de exactitud. Pensemos,
por ejemplo, en la altura. Como estamos considerando el metro como unidad de medida, es posible que aparezcan
datos de la forma 2, 1.8, 1.75 o incluso 1.625. Sin embargo, lo razonable es que todos los datos tengan un
formato común, por ejemplo 2 decimales. Esto se puede conseguir con las opciones Data|Column Formats
(ver Figura 8.15), que nos permite modificar el formato de las diferentes columnas, tanto numéricas como de
244 MATEM ÁTICAS
caracteres. En el caso de la variable ALTURA lo razonable es seleccionar el formato numérico Decimal con 3
dı́gitos significativos (Significant Digits).
Figura 8.15: Pantalla del programa que nos permite modificar el formato de las diferentes columnas (tanto
numéricas como de caracteres).
Otro problema que se nos puede plantear con los datos es la utilización de abreviaturas. Por ejemplo, en la columna
OPINION hemos utilizado 0, 1, 2, 3 y 4 para referirnos a ‘Mala’, ‘Regular’, ‘Normal’, ‘Buena’ y ‘Excelente’; sin
embargo, dentro de varios meses es posible que pensemos que dichos números se refieren a otros datos. Por tanto,
serı́a conveniente poder asignarle a cada valor de la variable su significado; en nuestro caso, 0=Mala, 1=Regular,
2=Normal y ası́ sucesivamente. Para ello debemos seleccionar las opciones Data|Labels|Value Labels y
rellenar los campos que nos ofrece (ver Figura 8.16). Por ejemplo, dentro de Define Label ponemos 4 en
Value y ‘Excelente’ en Label; para que la asignación sea efectiva debemos pulsar el botón I , con lo que se
almacena en la columna Value Labels.
Figura 8.16: Pantalla del programa que nos permite asignar etiquetas a los diferentes valores num éricos de una
variable. Esta posibilidad no está presente para variables de fechas y de caracteres.
4.5. Edición y modificación de las variables
Hay ocasiones en que los datos están correctos pero no nos termina de convencer el nombre que le hemos dado
a las variables. También puede ocurrir que nos haya faltado una variable o, por el contrario, que hayamos intro-
ducido una variable de más. Para solucionar estos problemas se utilizan las opciones Data|Rename Variables,
Data|Insert|Variables y Data|Delete|Variables (ver Figuras 8.11 y 8.17).
Figura 8.17: Pantallas del programa que permiten renombrar o borrar una variable.
Sin embargo, el nombre de las variables no refleja toda la información necesaria. Por ejemplo, el peso no indica
(aunque se sobreentiende) que está computado en kilogramos y la altura está, como es fácil deducir, en metros.
Puede haber ejemplos en los que no sea tan fácil deducirlo; en estos casos, lo conveniente es ‘etiquetar’ las
variables. Para ello seleccionamos las opciones Data|Labels|Variable Labels y añadimos en metros y en
kilogramos a las variables ALTURA y PESO, respectivamente (ver Figura 8.18).
Figura 8.18: Pantalla del programa que permite etiquetar una variable.
Finalmente, otra modificación que podemos hacer con las variables es reordenarlas. Para ello seleccionamos las
opciones Data|Reorder Variables y nos aparece una ventana similar a la ventana Delete Variables de la
Figura 8.17. Ahora sólo es necesario ir seleccionando las variables en el nuevo orden.
246 MATEM ÁTICAS
Exponenciación A^B
Multiplicación A * B
División A / B
Suma A + B
Resta A - B
Tabla 8.1: Operaciones aritméticas que se pueden realizar con STATISTIX.
4.6. Transformación aritmética de variables
En la Tabla 8.1 se encuentran recogidas las expresiones aritméticas que están permitidas. Debemos tener presente
que las operaciones se evalúan de izquierda a derecha. Todas las expresiones entre paréntesis se evalúan antes que
las que están fuera de los paréntesis y ante varios operadores en el mismo nivel, el orden de preferencia (de mayor
a menor) es el que figura en la Tabla 8.1.
Para construir una nueva variable mediante transformaciones de otras ya existentes, debemos seleccionar las op-
ciones Data|Transformations (basta pulsar Ctrl+T) y nos aparece la pantalla de la Figura 8.19. En esta
ventana tenemos tres partes fundamentales: a la izquierda aparece la lista de variables existentes, a la derecha
aparecen las funciones internas, y en el centro está el lugar destinado a la definición de la nueva variable.
Figura 8.19: Pantalla del programa que permite definir nuevas variables (o modificar variables ya existentes) me-
diante operaciones.
La expresión de la transformación debe ser tecleada manualmente y sólo podemos hacer uso de las variables y de
las funciones internas para insertarlas en los lugares adecuados (pulsando los correspondientes botones I y J ).
Sólo está permitida una transformación, aunque ésta puede ocupar varias lı́neas.
Una vez hemos terminado de teclear la expresión, pulsamos en Go. Si STATISTIX encuentra un error en nuestra
expresión nos lo indica convenientemente. Entonces debemos editar nuestra expresión y corregir el error, pulsando
la tecla Go de nuevo.
Supongamos que la variable NUEVAVAR es la variable que queremos crear para que almacene la transformación.
Si la transformación consiste en la suma de otras tres variables (por ejemplo, A, B y C) entonces debemos escri-
bir dentro del recuadro Transformation Expression la instrucción NUEVAVAR = A+B+C. Como STATISTIX
admite cuatro tipos de variables, podemos indicar el tipo de NUEVAVAR de la forma usual.
Por ejemplo, con datos1.sx vamos a crear una nueva variable, que llamaremos PesoTip con los pesos tipifica-
dos. La transformación llamada tipificación consiste en restar a cada dato la media aritmética y después dividir por
la desviación tı́pica (o por la cuasidesviación tı́pica). Para ello, en el recuadro Transformation Expression
escribimos: PesoTip=( Peso- MEAn( Peso ) )/ SD( Peso ). Cuando la expresión utiliza una variable, se puede es-
cribir su nombre o se puede trasladar dicho nombre desde el recuadro Variables. Análogamente, las expresiones
como MEAn (media aritmética) o SD (cuasidesviación tı́pica) se pueden teclear o se pueden seleccionar haciendo
doble clic sobre la expresión del recuadro Functions.
4.7. Medidas descriptivas de los datos
En primer lugar leemos el archivo que contiene los datos (datos1.sx) utilizando las opciones File|Open. En-
tonces nos aparece la tabla de datos de la Figura 8.20.
Figura 8.20: Pantalla del programa donde aparece la tabla de datos Datos1.
Para poder obtener las medidas descriptivas de una muestra de datos cuantitativos debemos seleccionar las opcio-
nes Statistics|Summary Statistics|Descriptive Statistics. Entonces nos aparece la ventana mos-
trada en la Figura 8.21.
Figura 8.21: Pantalla del programa que permite elegir las variables a las que vamos a calcular sus principales
medidas descriptivas.
248 MATEM ÁTICAS
En el recuadro Descriptive Variables seleccionamos las variables de las cuales queremos hallar las medidas
descriptivas y en el recuadro Statistics to Report seleccionamos las medidas descriptivas que queremos
calcular. El significado de las medidas descriptivas que aparecen viene dado en la Tabla 8.2.
N Número total de observaciones (n)

Missing Número de casos en los que se omite el valor de la variable
P
Sum Suma de todos los datos ( xi )
Mean Media aritmética (x)
SD Cuasidesviación tı́pica (S)
Variance Cuasivarianza (S 2 )
√
SE Mean S/ n
Conf. int. Intervalo de confianza para la media (no estudiado)
C.V. Coeficiente de variación modificado (S/|x|)
Median Mediana (Me )
Min/max Mı́nimo/máximo valor de la variable
Quartiles Cuartiles (Q1 y Q3 )
MAD Mediana de las desviaciones absolutas respecto de la mediana
Biased var. Varianza (s2 )
Skew Coeficiente de asimetrı́a
Kurtosis Coeficiente de curtosis o apuntamiento
Tabla 8.2: Significado de las medidas descriptivas que aparecen en el recuadro Statistics to Report de la
ventana Descriptive Statistics.
Figura 8.22: Pantalla del programa que muestra las medidas descriptivas seleccionadas de las variables elegidas.
Ejercicio. Calcula el número total de observaciones, la suma de todos los datos, la media aritmética, la cuasides-
viación tı́pica, la cuasivarianza , el coeficiente de variación modificado, la mediana, los valores máximo
y mı́nimo, los cuartiles y la varianza de la variable ALTURA. En la Figura 8.23 aparece la solución.
Una opción interesante consiste en calcular las medidas descriptivas de un subconjunto de datos de la muestra
original. Esto se consigue seleccionando la variable por la que queremos agrupar los datos, para lo cual debemos
escribir dicha variable en el recuadro Groupin Variable (0pt). En el ejercicio anterior podemos agrupar
según la variable OPINION y el resultado obtenido (seleccionando las medidas Mean, Median y Biased var.)
aparece en la Figura 8.24.
El programa nos permite calcular cualquier percentil, medida descriptiva que generaliza a la mediana. Para ello
debemos seleccionar las opciones Statistics|Summary Statistics|Percentiles. Posteriormente debe-
Figura 8.23: Pantalla del programa que muestra las medidas descriptivas seleccionadas de la variable ALTURA.
mos indicar, en el recuadro Percentiles Variables, las variables a las cuales vamos a calcular los percentiles
y, en el recuadro Percentiles, aquellos que queremos determinar (ver Figura 8.25).
Ejercicio. Calcula el primer cuartil, el tercer cuartil y el segundo decil de la variable PESO.
4.8. Distribuciones de frecuencias
Con STATISTIX podemos calcular las distribuciones de frecuencias para una variable estadı́stica discreta o conti-
nua. El programa determina la frecuencia absoluta, el porcentaje (y por tanto la frecuencia relativa), la frecuencia
acumulada absoluta y el porcentaje acumulado (y por tanto la frecuencia relativa acumulada). Para conseguir la
distribución de frecuencias debemos seleccionar las opciones Statistics|Summary Statistics|Frequency
Distribution y nos aparece una ventana para seleccionar las variables estadı́sticas de las cuales queremos calcu-
lar sus distribuciones de frecuencias (ver Figura 8.26).
Si queremos agrupar los datos en intervalos de la misma amplitud, en el recuadro Bin Size (Optional) se
especifica el valor mı́nimo de las observaciones (Low), el valor máximo (High) y la amplitud de los intervalos
(Step). Hay que indicar que los intervalos son cerrados por la izquierda y abiertos por la derecha, salvo el último
que es cerrado por ambos lados. Si el recuadro Bin Size (Optional) se deja en blanco, entonces los datos no
se agruparán en intervalos. En la Figura 8.27 se muestra la distribución de frecuencias de la variable ALTURA (con
datos sin agrupar en intervalos).
Ejercicio. Determina la distribución de frecuencias de la variable PESO cuando los datos se agrupan en intervalos
de longitud 5 kilogramos comenzando en el valor 45 kilogramos.
Las posibilidades gráficas del programa STATISTIX son muy reducidas: sólo permite dibujar histogramas de fre-
cuencias absolutas y polı́gono de porcentajes acumulados, ya que trata las variables cuantitativas como si fuesen
250 MATEM ÁTICAS
Figura 8.24: Pantalla del programa que muestra las medidas descriptivas seleccionadas de la variable ALTURA pero
agrupadas según la variable OPINION.
continuas (aunque sean discretas). Para conseguir las representaciones gráficas debemos seleccionar las opcio-
nes Statistics|Summary Statistics|Histogram y nos aparece una ventana para seleccionar la variable
estadı́stica de la cual queremos representar gráficamente su histograma (ver Figura 8.28).
En el recuadro X-Axis (Optional) el usuario puede especificar el valor mı́nimo (Low), el valor máximo (High)
y la amplitud de los intervalos (Step) que se van a utilizar en el histograma. En el recuadro Graph Type podemos
seleccionar Histogram o Cumulative Distribution, según queramos dibujar el histograma de frecuencias
absolutas o el polı́gono de porcentajes acumulados, respectivamente. Finalmente, si queremos que se superponga
la gráfica de la curva normal, debemos seleccionar la opción Display Normal Curve. En la Figura 8.29 se
muestra el histograma de frecuencias absolutas para la variable EDAD.
Ejercicio. Dibuja el histograma de frecuencias absolutas y el polı́gono de porcentajes acumulados de la variable

ALTURA.
CANDEL, J.; MARIN, A. y RUIZ, J.M. Estadı́stica aplicada I: Estadı́stica descriptiva. Barcelona: DM–PPU,
1991. Lecciones 1 y 2.
E.8.1. Para obtener información acerca del porcentaje de albúmina en el suero proteico de personas normales, se
analizaron muestras de 40 personas, entre 2 y 40 años de edad, con los siguientes resultados:
Figura 8.25: Pantalla del programa que permite seleccionar las variables estadı́sticas para las que vamos a calcular
determinados percentiles.
Figura 8.26: Pantalla del programa que permite seleccionar las variables para las que vamos a calcular las distri-
buciones de frecuencias.
700 2 620 4 620 8 680 4 650 2 660 3 700 7 720 8 680 7 710 9
640 4 600 4 670 0 620 9 650 9 670 5 660 6 670 8 730 5 630 1
720 3 730 4 700 1 700 0 680 3 650 0 720 1 660 1 650 5 620 0
630 3 720 4 690 4 710 3 700 2 700 4 640 1 690 1 660 4 650 2
a) Agrupar los datos en intervalos de la misma amplitud aplicando la regla de Sturges. Hay que es-
pecificar los extremos de los intervalos, la marca de clase, frecuencia absoluta, frecuencia relativa,
frecuencia acumulada absoluta y frecuencia acumulada relativa. Calcular la media y la desviación
tı́pica, directamente y mediante codificación.
b) Agrupar de nuevo los datos sabiendo que la amplitud de los intervalos es 1.
E.8.2. Los siguientes datos corresponden al nivel de glucosa en sangre de diez niños:
56 62 63 65 65 65 65 68 70 72
a) Calcular la media, mediana y moda.

b) Calcular la desviación media e interpretar el resultado.
252 MATEM ÁTICAS
Figura 8.27: Pantalla del programa que muestra la distribución de frecuencias de la variable ALTURA.
Figura 8.28: Pantalla del programa que permite seleccionar la variable para la que vamos a representar su histo-
grama.
c) Calcular la desviación mediana e interpretar el resultado.
E.8.3. En un mismo examen de una asignatura, pasado a dos clases de 40 alumnos, se han registrado las siguientes
calificaciones:
2 3 7 5 4 6 7 5 6 7
clase 8 4 3 7 5 6 9 5 7 2
A 7 4 8 5 6 5 7 8 5 3
6 5 8 4 2 5 4 5 6 7
2 5 3 4 7 9 5 2 7 4
clase 8 3 5 8 7 9 3 2 4 1
B 10 9 4 8 6 9 3 3 7 1
2 8 6 7 3 6 9 7 4 8
Realizar un estudio estadı́stico de las calificaciones en cada clase y decir qué conclusiones pueden sacarse
de dicho estudio. ¿Son ambas clases muy similares por lo que respecta a la variable calificación, o por el
contrario son muy diferentes?
Histogram
15
10
Frequency
0
18 19 20 21 22 23 24 25
EDAD
Figura 8.29: Pantalla del programa que muestra el histograma de frecuencias de la variable EDAD.
E.8.4. Los siguientes datos corresponden a los precios (en cientos de pesetas) de una colección de 30 libros.
27 40 12 3 30 16 20 21 30 12
45 18 25 22 35 24 37 12 21 7
35 17 21 27 14 15 25 45 12 24
a) Agrupar los datos en intervalos de la misma amplitud (mediante la regla de Sturges) y clasificarlos
en una nueva tabla que contenga la marca de clase, la frecuencia absoluta, la frecuencia relativa y la
frecuencia acumulada. Dibujar el histograma de frecuencias absolutas.
b) Calcular el séptimo decil. Compararlo con el valor que resultarı́a si lo hallásemos a partir de los datos
agrupados en intervalos.
c) Calcular un coeficiente de asimetrı́a e interpretarlo.
E.8.5. El número de veces que fueron consultados 30 artı́culos de investigación archivados en una hemeroteca
(durante el año pasado) viene dado por la siguiente tabla.
18 25 20 24 19 23 21 22 20 22
23 19 21 24 21 22 20 21 22 21
20 24 21 19 23 21 22 23 22 23
a) Calcular la mediana y la mediana de las desviaciones respecto de la mediana. Deducir si los datos
están cerca de la mediana.
b) Calcular la media y la desviación tı́pica. Deducir si los datos están cerca de la media.
E.8.6. a) Agrupar los datos del ejercicio anterior en intervalos de la misma amplitud y clasificarlos en una
nueva tabla en la que aparezca la marca de clase, la frecuencia absoluta y la frecuencia acumulada.
b) A partir de la agrupación en intervalos anterior, calcular de nuevo la media y la mediana. Comparar
estos dos nuevos valores con los resultados obtenidos en el ejercicio anterior (datos no agrupados en
intervalos).
E.8.7. El número de personas que visitan diariamente un centro de información fue observado durante 74 dı́as
elegidos al azar, y los resultados fueron:
254 MATEM ÁTICAS
no de personas 47 59 62 64 71 76 78 80
no de dı́as 4 6 10 17 16 10 7 4
a) Hacer el gráfico de frecuencias acumuladas absolutas.

b) Hallar la moda, la mediana y el recorrido intercuartı́lico. ¿Están los datos cerca de la mediana?
c) Calcular el coeficiente de curtosis e interpretar el resultado.
E.8.8. Las personas que aprobaron una determinada oposición tienen la siguiente distribución por edades:
edad [20,25] (25,30] (30,35] (35,40] (40,50] (50,60]

frecuencia 41 123 44 13 7 3
a) Calcular la edad media. ¿Es representativa de todos los datos?

b) Calcular la mediana. ¿Es representativa de todos los datos?
c) Hacer el polı́gono de frecuencias acumuladas absolutas.
ANOTACIONES
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
CAPÍTULO 9
ESTADÍSTICA DESCRIPTIVA BIDIMENSIONAL
a) Cuando sobre cada individuo se observan simultáneamente dos caracterı́sticas cuantitativas ¿cómo se orga-
nizan y representan gráficamente esos datos bidimensionales?
b) ¿Cómo se puede saber si dos variables estadı́sticas están relacionadas de forma lineal, exponencial, potencial
o parabólica?
c) ¿Se puede predecir el valor de una variable sabiendo el valor de otra variable que está relacionada con ella
de forma lineal, exponencial, potencial o parabólica?
2.1. Tabulación de los datos
Cuando sobre cada individuo de una población se observan simultáneamente dos caracterı́sticas cuantitativas, que
unidimensionalmente podrı́amos representar separadamente por las variables X e Y , entonces se dice que se está
observando una variable estadı́stica bidimensional y se representa por (X, Y ).
El conjunto de valores bidimensionales de la variable junto con sus frecuencias asociadas dará lugar a la corres-
pondiente distribución bidimensional de frecuencias.
En el caso de variables bidimensionales podemos distinguir dos tipos principales de tablas:
a) Tabulación en dos columnas (o en dos filas)
Si el número de datos bidimensionales es pequeño, los datos se disponen en dos columnas (o en dos filas)
sobre las que se emparejan los correspondientes valores unidimensionales de una misma realización de la
variable bidimensional, como se expresa en la tabla siguiente:
variable X variable Y
x1 y1
x2 y2
.. ..
. .
xn yn
ESTAD ÍSTICA DESCRIPTIVA BIDIMENSIONAL 257
X Y B1 B2 ··· Bj ··· Bk suma

A1 f11 f12 ··· f1j ··· f1k f1∗
A2 f21 f22 ··· f2j ··· f2k f2∗
.. .. .. .. .. ..
. . . . . .
Ai fi1 fi2 ··· fij ··· fik fi∗
.. .. .. .. .. ..
. . . . . .
Ar fr1 fr2 ··· frj ··· frk fr∗
suma f∗1 f∗2 ··· f∗j ··· f∗k n
Tabla 9.1: Tabla de doble entrada o de contingencia
b) Tabla de doble entrada o de contingencia
Si el número de observaciones bidimensionales es grande, clasificamos los n individuos de la muestra en

r clases (A1 , . . . , Ar ) respecto de la variable X, y en k clases (B1 , . . . , Bk ) respecto de la variable Y .
Entonces los datos suelen organizarse en una tabla como la Tabla 9.1, que se denomina tabla de doble
entrada o de contingencia.
En la Tabla 9.1, fij es el número de individuos que pertenecen a la clase Ai de la variable X y a la clase Bj
de la variable Y y se llama frecuencia absoluta conjunta de la clase Ai × Bj de la variable bidimensional
(X, Y ).
La frecuencia relativa conjunta de la clase bidimensional Ai × Bj es igual a:
fij
hij = . (9.1)
n
2.2. Distribuciones marginales y condicionadas. Independencia de variables
Supongamos que tenemos los datos bidimensionales organizados en una tabla de doble entrada como la Tabla 9.1.
La suma de las frecuencias absolutas conjuntas de la fila i−ésima, fi∗ , es igual al número de individuos en la clase
Ai de la variable X, independientemente del valor de Y , y se llama frecuencia absoluta marginal de la clase Ai
de la variable X:
fi∗ = fi1 + fi2 + · · · + fik .
La frecuencia relativa marginal de la clase unidimensional Ai es igual a:

fi∗
hi∗ = . (9.2)
n
Análogamente, la suma de las frecuencias absolutas conjuntas de la columna j−ésima, f∗j , es igual al número
de individuos en la categorı́a Bj de la variable Y , y se llama frecuencia absoluta marginal de la clase Bj de la
variable Y :
f∗j = f1j + f2j + · · · + frj .
La frecuencia relativa marginal de la clase unidimensional Bj es igual a:
f∗j
h∗j = . (9.3)
n
258 MATEM ÁTICAS
Si de la Tabla 9.1 consideramos la primera y la última columna obtenemos la distribución marginal de frecuencias
absolutas de la variable X:
X fi∗
A1 f1∗
.. ..
. .
Ai fi∗
.. ..
. .
Ar fr∗
suma n
Análogamente, si consideramos la primera y la última fila de la Tabla 9.1, obtenemos la distribución marginal de
frecuencias absolutas de la variable Y :
Y f∗j
B1 f∗1
.. ..
. .
Bj f∗j
.. ..
. .
Bk f∗k
suma n
Denotaremos por X/yj a la variable X condicionada a que Y tome el valor yj . La distribución de frecuencias
absolutas condicionadas de X/yj se obtiene de la Tabla 9.1 considerando la primera columna y la columna de la
clase Bj ; es decir:
X/yj fij
A1 f1j
.. ..
. .
Ai fij
.. ..
. .
Ar frj
suma f∗j
Por tanto, la frecuencia relativa de X ∈ Ai condicionada a que Y tome el valor yj es:
fij
hi/j = . (9.4)
f∗j
Análogamente, denotaremos por Y /xi a la variable Y condicionada a que X tome el valor xi . La distribución de
frecuencias absolutas condicionadas de Y /xi se obtiene de la Tabla 9.1 considerando la primera fila y la fila de la
clase Ai ; es decir:
Y /xi fij
B1 fi1
.. ..
. .
Bj fij
.. ..
. .
Bk fik
suma fi∗
En consecuencia, la frecuencia relativa de Y ∈ Bj condicionada a que X tome el valor xi es:
fij
hj/i = . (9.5)
fi∗
Teniendo en cuenta las fórmulas 9.4 y 9.5 se obtiene:
fij = hi/j f∗j = hj/i fi∗ .
Dividiendo por n tenemos:

fij f∗j fi∗
= hi/j = hj/i .
n n n
Y teniendo en cuenta 9.1, 9.2 y 9.3 se tiene:
hij = hi/j h∗j = hj/i hi∗ .
La variable X es independiente de la variable Y si las distribuciones de frecuencias relativas de X condicionada

a cualquier valor de Y son todas idénticas; es decir, no dependen del valor que tome la variable condicionante Y ;
es decir:
hi/1 = hi/2 = · · · = hi/k ∀i ,
lo que es equivalente a:
fi1 fi2 fij fik
= = ··· = = ··· = ∀i ,
f∗1 f∗2 f∗j f∗k
y por tanto:
fij fi1 + fi2 + · · · + fij + · · · + fik
= ∀i, j ,
f∗j f∗1 + f∗2 + · · · + f∗j + · · · + f∗k
lo que también se puede escribir como:

fij fi∗
= ∀i, j .
f∗j n
En consecuencia, la definición de independencia entre las variables X e Y es equivalente a la siguiente propiedad:
fi∗ f∗j
fij = ∀i, j ,
n
o su equivalente:
hij = hi∗ h∗j , ∀i, j ,
es decir, las frecuencias relativas conjuntas son iguales al producto de las correspondientes frecuencias relativas
marginales.
260 MATEM ÁTICAS
Los métodos para determinar la existencia y el grado de relación entre dos variables cuantitativas deben ser capaces
también de discriminar entre los tipos generales de relación que hay:
a) Se dice que dos variables cuantitativas X e Y mantienen una relación directa cuando los valores altos en
Y tienden a emparejarse con valores altos en X, los valores intermedios en Y tienden a emparejarse con
valores intermedios en X, y los valores bajos en Y tienden a emparejarse con valores bajos en X.
b) Se dice que dos variables cuantitativas X e Y mantienen una relación inversa cuando los valores altos en
Y tienden a emparejarse con valores bajos en X, los valores intermedios en Y tienden a emparejarse con
valores intermedios en X, y los valores bajos en Y tienden a emparejarse con valores altos en X.
c) Se dice que no hay relación entre dos variables cuantitativas cuando no existe un emparejamiento sistemático
entre ellas en función de sus valores.
En una buena representación gráfica conjunta de dos variables estadı́sticas cuantitativas debe apreciarse fácilmente
si existe relación entre las variables y de qué tipo es. Una representación gráfica que cumple esta condición es el
diagrama de dispersión, que también se puede llamar nube de puntos.
• Si los datos no están agrupados en intervalos (como en la tabla siguiente), entonces el diagrama de dispersión se
hace como se muestra en la Figura 9.1.
xi 61 118 57 123 125 122 122 85 85 85 83 78 76 76 73 70 97 107

yi 15 28 15 30 31 30 30 23 22 22 23 23 23 21 21 21 25 29
35
30
25
20
15
10
0 X
60 70 80 90 100 110 120 130
Figura 9.1: Diagrama de dispersión para datos no agrupados en intervalos
• Si los datos están agrupados en intervalos (como en la tabla siguiente), entonces el diagrama de dispersión se
hace como se muestra en la Figura 9.2.
X Y (0,10] (10,20] (20,30] (30,40] (40,50] suma

(25,75] 13 3 16
(75,125] 4 9 5 1 19
(125,175] 11 16 4 31
(175,225] 2 11 9 22
(225,275] 1 5 3 1 10
(275,325] 1 5 6
suma 17 26 38 22 1 104
50
40
30
20
10
0 X
25 75 125 175 225 275 325
Figura 9.2: Diagrama de dispersión para datos agrupados en intervalos
2.4. Covarianza
A partir de las distribuciones marginales de X y de Y se pueden calcular las medidas descriptivas de las variables
X eY.
De entre las medidas descriptivas bidimensionales, la más utilizada es la Covarianza entre X e Y que se calcula
de la siguiente forma:
1) Si los datos se tabulan en dos columnas (o dos filas), la covarianza entre X e Y es:
X
n X
n
(xi − x)(yi − y) xi yi
i=1 i=1
sxy = = − xy.
n n
2) Si los datos se organizan en una tabla de doble entrada como la Tabla 9.1, la covarianza entre X e Y es:
X
r X
k X
r X
k
(xi − x)(yj − y)fij xi yj fij
i=1 j=1 i=1 j=1
sxy = = − x y,
n n
donde xi es la marca de clase de la clase Ai , yj es la marca de clase de la clase Bj y fij es la frecuencia
absoluta conjunta de la clase bidimensional Ai × Bj .
Si en lugar de dividir por n dividimos por (n − 1) tenemos la la Cuasicovarianza o Covarianza modificada o

corregida entre X e Y ; cuya definición, por tanto, es la siguiente:
1) Si los datos se tabulan en dos columnas (o dos filas), la cuasicovarianza entre X e Y es:
X
n
(xi − x)(yi − y)
i=1
Sxy = .
n−1
262 MATEM ÁTICAS
2) Si los datos se organizan en una tabla de doble entrada como la Tabla 9.1, la cuasicovarianza entre X e Y
es:
Xr X k
(xi − x)(yj − y)fij
i=1 j=1
Sxy = ,
n−1
donde xi es la marca de clase de la clase Ai , yj es la marca de clase de la clase Bj y fij es la frecuencia
absoluta conjunta de la clase bidimensional Ai × Bj .
En consecuencia, la covarianza y la cuasicovarianza están relacionadas de la siguiente forma:

(n − 1)Sxy = nsxy .
Por tanto, se puede calcular una de ellas a partir de la otra.
La covarianza (y, por tanto, la cuasicovarianza) es capaz de discriminar entre los dos tipos de relación lineal pues:
a) si sxy > 0 entonces hay relación lineal directa entre X e Y ,

b) si sxy < 0 entonces hay relación lineal inversa entre X e Y , y
c) si sxy = 0 entonces no hay relación lineal entre X e Y .
2.5. Regresión y correlación. Coeficiente de determinación
La regresión consiste en sustituir la nube de puntos correspondiente a una distribución bidimensional por la función
matemática que mejor se ajuste a la nube de puntos. La correlación estima la “fuerza” con que las variables están
relacionadas.
La curva de regresión es la curva ideal hacia la que tienden los puntos del diagrama de dispersión.
El ajuste por el método de mı́nimos cuadrados consiste en lo siguiente:
Si tenemos una nube de puntos {(xi , yi ), i = 1, 2, . . . , n} y queremos ajustarle una curva cualquiera y =
f (x, a, b, . . .) con parámetros a, b, . . ., la determinación de éstos se hace minimizando la siguiente expresión:
X
n
D= [yi − f (xi , a, b, . . .)]2
i=1
Para saber si la curva y = f (x, a, b, . . .) se ajusta a los puntos {(xi , yi ), i = 1, 2, . . . , n} calculamos el coeficiente
de determinación:
X n
[yi − f (xi )]2
R2 = 1 − i=1
.
Xn
2
(yi − y)
i=1
Este coeficiente verifica:
1) 0 6 R2 6 1.
2) Si R2 = 1, entonces el ajuste es perfecto.
3) Si R2 = 0, entonces la función y = f (x) no se ajusta en absoluto a los puntos.
4) Cuanto más se aproxime R2 a 1, mejor es el ajuste.
2.6. Regresión y correlación lineal
2.6.1. Coeficiente de correlación lineal de Pearson
La covarianza carece de unos valores máximo y mı́nimo estables, comunes a todos los casos, que permitan su
interpretación directa. La solución a este problema consiste en dividir la covarianza por el producto de las desvia-
ciones tı́picas marginales. Este ı́ndice se conoce con el nombre de coeficiente de correlación lineal de Pearson, y
se denota por la letra r; o sea:
sxy
r= , (9.6)
sx sy
donde sx es la desviación tı́pica de la variable X y sy es la desviación tı́pica de la variable Y .
Si la tabulación de los datos se ha hecho en dos columnas, entonces una fórmula alternativa equivalente a la
expresión 9.6 es la siguiente:
! n !
Xn Xn X
n xi yi − xi yi
r=v i=1
!2 v
i=1 i=1
!2 .
u n u n
u X X
n u X X
n
tn x2i − xi tn yi2 − yi
i=1 i=1 i=1 i=1
La razón principal por la que la covarianza no puede considerarse un ı́ndice de dependencia lineal entre dos
variables es la dificultad de su valoración dado que carece de un máximo y un mı́nimo estables. Pero el coeficiente
de correlación lineal no tiene esa dificultad ya que este ı́ndice no puede valer más de 1 ni menos de −1, es decir:
−1 6 r 6 1 .
Además, la interpretación descriptiva de r es la siguiente:
a) Si r = 1 entonces existe una dependencia lineal directa exacta entre las variables X e Y . Los puntos del
diagrama de dispersión están sobre una lı́nea recta de pendiente positiva.
b) Si r = −1 entonces existe dependencia lineal inversa exacta entre X e Y . Los puntos del diagrama de
dispersión están sobre una lı́nea recta de pendiente negativa.
c) Si r = 0 entonces no existe dependencia lineal entre X e Y .
d) Cuanto más se aproxime r a −1 o a 1, más dependencia lineal existe entre X e Y . Cuando esto ocurra, el
diagrama de dispersión se aproxima a una lı́nea recta.
e) Cuanto más se aproxime r a 0, más independencia lineal existe entre X e Y . Cuando esto ocurra, el
diagrama de dispersión no se aproxima a una recta.
f) Si r es positivo, entonces al aumentar el valor de la variable X, aumenta el valor de la variable Y .
g) Si r es negativo, entonces al aumentar el valor de la variable X, disminuye el valor de la variable Y .
2.6.2. Recta de regresión mı́nimo cuadrática
La recta de regresión mı́nimo cuadrática de Y sobre X es la recta Ŷ = A + BX que mejor se ajusta (por el
método de mı́nimos cuadrados) a los puntos del diagrama de dispersión {(xi , yi ), i = 1, 2, . . . , n}. Esta recta nos
permitirá predecir Y a partir de los valores de X.
264 MATEM ÁTICAS
Tenemos que minimizar la expresión:

X
n
D(A, B) = [yi − (A + Bxi )]2 . (9.7)
i=1
Igualando a cero las derivadas parciales de D respecto de A y de B obtenemos las siguientes ecuaciones normales:
P P
y = B xi + nA
P i P P
xi yi = B x2i + A xi
Si los datos están tabulados en dos columnas, las fórmulas de los coeficientes A y B que hacen mı́nima la expresión
9.7 son las siguientes:
! n !
X n Xn X
n xi yi − xi yi
i=1 i=1 i=1
B = !2 ,
X
n X
n
n x2i − xi
i=1 i=1
A = y − Bx.
Estas fórmulas son equivalentes a las siguientes:
sxy sy
B = =r ,
s2x sx
A = y − Bx.
Estas últimas fórmulas se pueden aplicar tanto si los datos están organizados en una tabla de dos columnas como
si lo están en una tabla de doble entrada.
Análogamente, la ecuación de la recta de regresión mı́nimo cuadrática de X sobre Y es:

sxy sx
X̂ = A∗ + B ∗ Y, donde B∗ = 2 = r , A∗ = x − B ∗ y .
sy sy
2.6.3. Coeficiente de determinación y coeficiente de correlación lineal. Predicción
En el caso del ajuste lineal (ajuste a una recta), el coeficiente de determinación es igual a:
s2xy
R2 = .
s2x s2y
Por tanto, (sólo en el caso del ajuste lineal) se cumple que el coeficiente de determinación es igual al cuadrado del
coeficiente de correlación lineal (R2 = r 2 ).
Si el coeficiente de correlación lineal está próximo a 1 o a −1 sabemos que existe bastante relación lineal entre las
variables X e Y y por tanto los puntos del diagrama de dispersión están próximos a la recta de regresión mı́nimo
cuadrática. En este caso, a partir de la ecuación de la recta de regresión de Y sobre X se puede calcular, de forma
aproximada, el valor de la variable Y cuando se conoce el valor de la variable X. Esta aproximación se conoce
también por el nombre de estimación, predicción o pronóstico. Similarmente, a partir de la ecuación de la recta
de regresión de X sobre Y se pueden predecir los valores de la variable X cuando se conocen los valores de la
variable Y .
Si el coeficiente de correlación lineal no está próximo a 1 o a −1, las ecuaciones de las rectas de regresión no nos
sirven para predecir los valores de una de las variables cuando se conocen los valores de la otra, pues los puntos
del diagrama de dispersión no están próximos a la recta de regresión mı́nimo cuadrática.
2.7. Regresión exponencial
Ajuste a la curva Y = AeBX por el método de mı́nimos cuadrados.
Tomando logaritmos neperianos: ln Y = ln A + BX.
Se hace el cambio: Y 0 = ln Y , A0 = ln A. Entonces Y 0 = A0 + BX, con lo que se reduce a un ajuste lineal entre
las variables Y 0 y X (se pueden utilizar las ecuaciones normales). La bondad del ajuste nos lo da el coeficiente de
determinación, que coincide con el cuadrado del coeficiente de correlación lineal entre Y 0 y X.
2.8. Regresión potencial
Ajuste a la curva Y = AX B por el método de mı́nimos cuadrados.
Tomando logaritmos decimales: log Y = log A + B log X.
Se hace el cambio: Y 0 = log Y , A0 = log A , X 0 = log X. Entonces Y 0 = A0 + BX 0 , con lo que se reduce

a un ajuste lineal entre Y 0 y X 0 (se pueden utilizar las ecuaciones normales). La bondad del ajuste nos lo da el
coeficiente de determinación, que coincide con el cuadrado del coeficiente de correlación lineal entre Y 0 y X 0 .
2.9. Regresión parabólica
Ajuste a la curva Y = A + BX + CX 2 por el método de mı́nimos cuadrados.

P
Minimizar D(A, B, C) = [yi − (A + Bxi + Cx2i )]2 .
Simplificando se obtiene:
 P P P
 P yi = An + B xi + C x2i
P P 2 P
xi yi = A xi + B xi + C x3i
 P P P P
x2i yi = A x2i + B x3i + C x4i
La bondad del ajuste a la curva Y = A + BX + CX 2 nos lo da el coeficiente de determinación:

P
2 [yi − (A + Bxi + Cx2i )]2
R =1− P .
(yi − y)2
A.9.1. Se está estudiando la relación existente entre los años de estudios realizados por los padres (X) y los años
de estudios realizados por los hijos (Y ). En una muestra de tamaño 7 se obtienen los siguientes resultados:
266 MATEM ÁTICAS
xi yi
12 12
10 8
6 6
16 11
8 10
9 8
12 11
Dibujar el diagrama de dispersión o nube de puntos. Hallar la covarianza, sxy , entre las dos variables. Hallar
el coeficiente de correlación lineal r. Hallar la ecuación de la recta de regresión mı́nimo cuadrática de Y
sobre X. Predecir el número de años de estudio de un hijo cuyo padre ha estudiado 14 años. Decir si esta
predicción es fiable. Hallar la ecuación de la recta de regresión mı́nimo cuadrática de X sobre Y . Predecir
el número de años de estudio de un padre cuyo hijo ha estudiado 15 años.
A.9.2. Determinar el grado de dependencia existente entre los años de estudio completados (X) y las faltas de
ortografı́a cometidas en un dictado (Y ) tal y como se encontró en la siguiente muestra de 10 entrevistados.
xi 10 3 12 11 6 8 14 9 10 2
yi 1 7 2 3 5 4 1 2 3 10
¿Cuántas faltas ortográficas tendrı́a un entrevistado que hubiese completado 13 años de estudio? ¿Es fiable
esta predicción?
A.9.3. Una factorı́a de una cierta marca de refrescos ha tomado al azar 18 semanas de un año, observando la
temperatura media, en grados centı́grados (X) correspondiente a cada una de ellas y la cantidad de refrescos
pedidos durante cada uno de dichos perı́odos, en miles (Y ). La información obtenida es la siguiente:
xi 10 28 12 31 30 19 24 5 9 15
yi 21 65 19 72 75 39 67 11 12 24
Dibujar el diagrama de dispersión. Hallar el coeficiente de correlación lineal r. Predecir la temperatura

media de un semana en la que se hubiesen pedido 50.000 refrescos. Decir si esta predicción es fiable.
Predecir el número de refrescos pedidos en una semana en la que la temperatura media fuese de 20 grados
centı́grados.
A.9.4. Se está estudiando la relación existente entre la edad de los hombres (X) y de las mujeres (Y ) a la hora de
contraer matrimonio. Se recogen los datos del año 1971 en la tabla siguiente:
X Y [10,20] (20,25] (25,30] (30,35] (35,40] (40,50] (50,60] (60,80]

[10,20] 4.187 16.272 7.401 864 175 127 5
(20,25] 1.125 55.505 69.151 8.138 1.358 354 26 2
(25,30] 134 8.731 37.480 11.668 2.715 779 64 10
(30,35] 16 485 2.845 4.142 2.602 1.153 120 21
(35,40] 3 104 517 1.110 1.886 1.871 266 57
(40,50] 5 31 142 327 730 2.265 1.176 410
(50,60] 4 12 32 56 314 867 792
(60,80] 1 2 6 33 151 828
¿Existe una dependencia lineal fuerte entre la edad de los hombres y la edad de las mujeres a la hora de
contraer matrimonio? Hacer una predicción de la edad de la esposa cuyo esposo tiene 25 años. ¿Es fiable
esta predicción? Hacer el diagrama de dispersión.
A.9.5. El precio, en pesetas, (X) y el número de páginas (Y ) de los libros contenidos en un catálogo vienen dados
por:
xi yi xi yi xi yi xi yi
19.950 496 27.500 392 21.000 240 12.000 342
9.950 208 12.500 200 15.000 278 21.000 340
17.500 300 25.000 280 27.500 420 17.000 207
15.000 448 8.000 120 10.500 128 35.000 440
12.000 200 5.950 220 9.950 249 7.500 88
30.000 288 9.950 200 35.000 392 21.000 351
32.500 324 32.500 468 20.000 400 25.000 292
35.000 525 24.000 539 27.500 300 37.250 464
37.500 384 30.000 400 15.000 240 24.000 344
25.000 250 30.000 320 16.000 230 12.500 130
18.000 200 35.000 736 12.000 144 22.500 382
15.000 224 22.000 516 38.000 336 25.000 403
30.000 384 37.500 700 37.750 550 20.000 249
25.000 256 20.000 400 30.000 478 18.000 182
17.500 215 30.000 656 17.250 437 38.500 458
17.000 278 9.500 191 9.950 288 3.500 63
20.000 376 19.500 464 18.500 496 30.000 400
22.500 421 20.500 348 18.000 236 21.500 278
32.500 450 30.000 352 12.000 143 27.500 508
30.000 243 32.500 598 17.000 284 16.000 256
12.000 202 27.500 392 28.000 520 30.500 368
15.000 251 24.000 472 38.500 758 15.000 275
21.000 320 36.500 591 25.000 413 12.500 112
35.000 460 14.500 282 27.500 394 38.000 458
12.000 342 21.000 340 17.000 207 7.500 83
Agrupar los datos de ambas variables en intervalos de clase. Determinar la distribución bidimensional de
frecuencias, ası́ como las distribuciones marginales de X y de Y . Hallar el coeficiente de correlación lineal.
Predecir el precio de un libro que tuviera 205 páginas. Decir si esta predicción es fiable.
A.9.6. Las calificaciones obtenidas por un grupo de alumnos en Biologı́a y Fı́sica son:
Biologı́a 3 4 6 7 5 8 7 3 5 4 8 5 5 8 8 8 5
Fı́sica 5 5 8 7 7 9 10 4 7 4 10 5 7 9 10 5 7
a) Escribir la tabla de doble entrada de frecuencias absolutas.

b) Hallar las distribuciones marginales, ası́ como la media y la varianza de dichas distribuciones unidi-
mensionales.
c) ¿Existe relación lineal entre las calificaciones de Biologı́a y Fı́sica?
A.9.7. Se han tomado cinco muestras de glucógeno, de una cantidad fija cada una. Se les ha aplicado una can-
tidad X de glucogensa (en milimoles/litro) anotando en cada caso la velocidad de reacción Y , medida en
micromoles/minuto, obteniéndose los siguientes datos:
X 1 2 3 0’2 0’5
Y 18 35 60 8 10
a) ¿Se puede deducir que la velocidad de reacción aumenta con la concentración de glucogensa? Justifi-
car la respuesta.
b) Si a una de las muestras le hubiésemos aplicado una concentración de glucogensa de 20 5 milimo-
les/litro ¿cuál hubiese sido la velocidad de reacción? ¿Con qué grado de predicción?
A.9.8. Un psicólogo afirma en base a los datos obtenidos, que a medida que un niño crece, menor es el número
de respuestas inadecuadas que da. Los datos son:
268 MATEM ÁTICAS
X 2 3 4 4 5 5 6 7 7 9 9 10 11 11 12
Y 11 12 10 13 11 9 10 7 12 8 7 3 6 5 5
donde X representa la edad en años, e Y representa el número de respuestas inadecuadas.

a) Determinar la validez de esta conclusión.
b) Si Alberto, de diez años y medio, participa en el experimento ¿cuál será el número de respuestas
inadecuadas que dará?
A.9.9. Dada una variable bidimensional (X, Y ), cuya tabla de frecuencias relativas es:
X Y 4 7 10 13 16 17
0 0
1 0 03 0 04 00 03 0 0 0
2 0 00 07 00 09 00 04 0 0
3 0 0 00 04 00 12 00 04 0
4 0 0 00 04 00 12 00 04 0
5 0 00 07 00 09 00 04 0 0
6 00 03 00 04 00 03 0 0 0
Calcular:
a) Distribuciones marginales de frecuencias absolutas.
b) Medias y varianzas marginales.
c) Recta de regresión de Y sobre X.
d) Coeficiente de correlación lineal.
A.9.10. Los datos de la tabla siguiente representan el resultado de un experimento consistente en exponer bacte-
rias, en perı́odos de 1 a 15 intervalos de 6 minutos, a la radiación de rayos X a 200 kilovoltios y contabilizar
el número de bacterias supervivientes. (X representa el número de intervalos de 6 minutos, e Y representa
los cientos de bacterias supervivientes).
X 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
Y 355 211 197 166 142 106 104 60 56 38 36 32 21 19 15
Ajustar a los datos una curva exponencial; representar gráficamente el resultado y comprobar la bondad del
ajuste.
A.9.11. Los datos de la tabla siguiente son el resultado de un estudio del efecto de la temperatura de cristalización
primaria (medida en grados centı́grados) de una solución, xi , sobre el contenido en fósforo (medido en
gramos por litro), yi .
xi yi
25 100 9
20 90 3
15 80 2
12 70 5
9 60 2
6 50 8
3 40 2
0 30 9
−3 20 8
−6 20 0
a) Representar gráficamente la nube de puntos. Determinar el modelo de curva adecuado para representar
la relación entre las variables y encontrar, por el método de mı́nimos cuadrados, los parámetros de la
curva.
b) ¿El ajuste anterior es bueno?
A.9.12. Los datos de la tabla siguiente pertenecen a la medida de la temperatura (X) y la presión (Y ) en diferentes
lugares del Himalaya.
xi yi xi yi xi yi
290 211 2100 8 200 480 1930 4 160 959 1840 1
280 559 2100 2 200 212 1930 6 160 881 1840 6
270 972 2080 4 190 758 1910 4 160 817 1840 1
240 697 2020 5 190 490 1910 1 160 385 1830 2
230 726 2000 6 190 386 1900 6 160 235 1820 4
230 369 2000 1 180 869 1890 5 160 106 1810 9
230 030 1990 5 180 356 1880 8 150 928 1810 9
210 892 1970 0 180 507 1880 5 150 919 1810 0
210 928 1960 4 170 267 1850 7 150 376 1800 6
210 654 1960 3 170 221 1860 0
210 605 1950 6 170 062 1850 6
Explicar la presión en función de la temperatura mediante una parábola (por el método de mı́nimos cuadra-
dos).
4.1. Diagrama de dispersión
Para una variable estadı́stica bidimensional, el gráfico más utilizado es el diagrama de dispersión. El progra-
ma dibuja estos diagramas si seleccionamos las opciones Statistics|Summary Statistics|Scatter Plot.
Entonces nos aparece una ventana como en la Figura 9.3 donde debemos seleccionar las variables implicadas
(X-Axis Variable e Y-Axis variable). Si deseamos agrupar los datos en intervalos (de una variable o de las
dos) entonces debemos rellenar los recuadros X-Axis (Optional) o Y-Axis (Optional), según la variable
que queramos agrupar.
Ejercicio. Dibuja el diagrama de dispersión de la variable estadı́stica bidimensional (PESO,ALTURA).
4.2. Covarianza y coeficiente de correlación lineal
Para una variable bidimensional es interesante hallar la matriz de varianzas y covarianzas corregidas. Dicha matriz
es la siguiente: 2
Sx Sxy
,
Sxy Sy2
donde Sx2 denota la cuasivarianza de X, Sy2 indica la cuasivarianza de Y , y Sxy representa la cuasicovarian-
za entre X e Y . La matriz de varianzas y covarianzas corregidas se puede obtener seleccionando las opciones
Statistics|Linear Models|Variance-Covariance. Entonces aparece una ventana (ver Figura 9.4) en la
que debemos seleccionar las variables estadı́sticas de las cuales queremos calcular su matriz de covarianzas corre-
gidas (en el recuadro Var-Covar Variables).
270 MATEM ÁTICAS
Figura 9.3: Pantalla del programa que permite seleccionar las variables para las que vamos a dibujar el diagrama
de dispersión.
Figura 9.4: Pantalla del programa que permite seleccionar las variables para las que vamos a calcular la matriz de
covarianzas.
Ejercicio. Calcula la matriz de varianzas y covarianzas corregidas de la variable bidimensional (PESO, ALTURA).
Para calcular el coeficiente de correlación lineal de Pearson entre dos variables estadı́sticas debemos seleccionar
las opciones Statistics|Linear Models|Correlations (Pearson) y nos aparece una ventana como en la
Figura 9.5. Tras pulsar el botón OK surge la ventana de resultados, con los coeficientes de correlación lineal entre
todas las variables seleccionadas. En nuestro ejemplo (ver Figura 9.6) el coeficiente entre las variables PESO y
ALTURA es de 00 9384, lo que significa que existe una dependencia lineal fuerte.
Ejercicio. Determina el coeficiente de correlación lineal de Pearson entre las variables ALTURA y PESO.
Figura 9.5: Pantalla del programa que permite calcular el coeficiente de correlación lineal de Pearson.
Figura 9.6: Pantalla con los resultados para la correlación entre el PESO y la ALTURA.
4.3. Recta de regresión. Predicción
La recta de regresión permite estimar el valor de una variable estadı́stica conocido el valor de otra variable, siem-
pre que entre las dos variables estadı́sticas exista dependencia lineal. Cuanto mayor sea esta dependencia lineal,
mejor será la aproximación que nos da la recta de regresión. Para calcular la ecuación de la recta de regre-
sión mı́nimo cuadrática debemos seleccionar las opciones Statistics|Linear Models|Linear Regression
y nos aparece una ventana como en la Figura 9.7. En el recuadro Dependent Variable debemos poner la varia-
ble dependiente (la que está representada en el eje vertical) y en el recuadro Independent Variables la variable
independiente (la que está representada en el eje horizontal).
Por ejemplo, si en la variable dependiente ponemos ALTURA y en la variable independiente colocamos EDAD,
entonces se supone que queremos predecir la altura de un individuo conociendo su edad. La ventana de resultados
se muestra en la Figura 9.8. En dicha figura aparecen muchos valores que no estamos en condiciones de explicar
en este momento, ya que pertenecen a la parte de Estadı́stica Inferencial. Si la ecuación de la recta de regresión
de ALTURA sobre EDAD es ALTURA = A + B EDAD, entonces A = 10 40089 y B = 00 01306.
Para hacer una predicción debemos seleccionar las opciones Results|Prediction, escribiendo en el recuadro
Predictor Values el valor de la variable independiente para el cual queremos estimar el correspondiente va-
lor de la variable dependiente. En la casilla Specification Method debemos seleccionar la opción Valued
Method (ver Figura 9.9). Ası́, para una edad de 24.5 años el valor correspondiente de la altura es de 1.7207
metros.
Una vez hemos calculado la recta de regresión podemos realizar una representación gráfica de la misma. Para
272 MATEM ÁTICAS
Figura 9.7: Pantalla del programa que permite seleccionar las variables para las que vamos a calcular la recta de
regresión.
Figura 9.8: Pantalla del programa que muestra la recta de regresión de ALTURA sobre EDAD.
ello seleccionamos las opciones Results|Plots|Simple Regression Plot. En el gráfico resultante aparece
el diagrama de dispersión (con cruces), la recta de regresión (en color azul) y dos curvas (en color rojo), una por
cada lado de la recta de regresión, que delimitan una zona de confianza para los valores de la variable dependiente
(ver Figura 9.10).
Ejercicio. Halla la ecuación de la recta de regresión mı́nimo cuadrática de ALTURA sobre PESO. Represéntala
gráficamente y predice la altura de un alumno que pesa 60 kilogramos.
CANDEL, J.; MARIN, A. y RUIZ, J.M. Estadı́stica aplicada I: Estadı́stica descriptiva. Barcelona: DM–PPU,
1991. Secciones 3.1, 3.3, 4.1, 4.2, 4.3, 4.4, 4.6.
Figura 9.9: Pantalla del programa que permite estimar el valor de ALTURA para un valor de EDAD.
Simple Regression Plot

1.79
1.74
ALTURA
1.69
1.64
1.59
18 20 22 24 26
EDAD
ALTURA = 1.4009 + 0.0131 * EDAD 95% conf and pred intervals
Figura 9.10: Pantalla del programa que representa la recta de regresión de ALTURA sobre EDAD.
E.9.1. En un grupo de alumnos de la Universidad de Murcia, se estudia el número de asignaturas aprobadas en

Junio (X) y el número de horas semanales dedicadas al estudio (Y). La información obtenida es la siguiente:
X Y (0, 10] (10, 20] (20, 30] (30, 40]

0 6 2 0 0
1 3 6 2 1
2 1 10 8 3
3 0 10 12 8
4 1 5 10 15
5 0 2 16 10
274 MATEM ÁTICAS
a) Obtener la distribución marginal de frecuencias absolutas de Y. ¿Cuál es el tiempo medio semanal

dedicado al estudio? ¿Cuál es el tiempo semanal de horas de estudio que deja por debajo el 50 por
ciento de los tiempos semanales y por encima el 50 por ciento restante?
b) Obtener la distribución marginal de frecuencias absolutas de X. ¿Cuál es el número más habitual
de asignaturas aprobadas por los alumnos? ¿Cuál es el número medio de asignaturas aprobadas?
Calcular e interpretar la varianza de X. Dibujar un polı́gono acumulativo para la variable X y calcular
su recorrido intercuartı́lico.
c) Obtener la distribución de frecuencias absolutas de Y condicionada a X= 1. ¿Cuál es el tiempo medio
semanal dedicado al estudio por los alumnos que han aprobado una asignatura? ¿Cuál es el tiempo
semanal más habitual en los alumnos que han aprobado una asignatura? Calcular la mediana de esta
distribución.
E.9.2. En una determinada empresa se ha realizado un estudio para determinar si la edad de los empleados está
relacionada con el número de dı́as de ausencia en el trabajo. Estos son los resultados:
Edad (X)
Dı́as de ausencia (Y ) (20,29] (29,38] (38,47] (47,56] (56,65]
(44,50] 0 1 8 7 16
(50,56] 2 6 10 2 4
(56,62] 5 9 5 0 1
(62,68] 14 6 2 2 0
a) Obtener la distribución marginal de frecuencias absolutas y frecuencias acumuladas absolutas de X.

Hallar la mediana, la media y la desviación tı́pica de X.
b) Obtener la distribución marginal de frecuencias absolutas de Y . Hallar la moda, la media y la desvia-
ción tı́pica de Y .
c) Determinar el coeficiente de correlación lineal entre X e Y . ¿Existe una fuerte dependencia lineal
entre X e Y ?
E.9.3. Una empresa nacional dedicada a la producción de videojuegos pretende sacar al mercado dos nuevos
productos: uno para el segmento de 13 a 15 años y otro para el segmento de 16 a 18 años. Antes de fijar
el precio, la empresa contacta con un centro de estudios sociológicos para conocer la asignación semanal
de los jóvenes. Para ello, el centro extrae una muestra de 10 jóvenes y, entre otros datos, se les pregunta la
edad (X, en años) y su asignación semanal (Y , en miles de pesetas), obteniendo los siguientes datos:
Edad (X) 17 16 16 15 14 13 16 18 17 13
Asignación (Y ) 3 4 3 4 1 2 2 5 4 0
a) Calcular recorrido intercuartı́lico y coeficiente de variación de la asignación semanal.

b) ¿Cuál es la asignación semanal estimada para un joven de 16 años? ¿Es fiable dicha predicción?
E.9.4. Un equipo investigador está analizando el comportamiento de los jóvenes españoles respecto del matri-
monio. Para ello extrae una muestra de 10 jóvenes parejas y les pasa un cuestionario. Entre las muchas
preguntas del cuestionario figura la edad a la que contrajeron matrimonio, obteniéndose los siguientes da-
tos:
X: Edad de la mujer 26 25 25 24 23 22 25 27 26 22
Y : Edad del hombre 26 27 26 27 24 25 25 28 27 23
a) Calcular los cuartiles Q1 , Q2 y Q3 de la variable X.

b) Calcular el coeficiente de variación de la variable Y .
c) Calcular la recta de regresión de Y sobre X. Si en una pareja de jóvenes, la mujer tenı́a 28 años
cuando contrajo matrimonio, ¿cuál es la edad estimada del hombre? ¿es fiable esta predicción?
E.9.5. Una editorial está interesada en conocer los hábitos de lectura de los españoles y determinar si existe alguna
relación con otras variables (nivel cultural, nivel económico, edad, etc.). Para ello se extrae una muestra de
10 personas y, entre otros datos, se les pregunta por el número de años de estudio (X) y por el número de
libros que suelen comprar cada trimestre (Y ). Los datos son los que recoge la siguiente tabla:
X 11 10 10 9 8 7 10 12 11 7
Y 3 4 3 4 1 2 2 5 4 0
a) Calcular la media y la mediana de Y .

b) Calcular la desviación media y la desviación mediana de Y .
c) Si una persona suele comprar 2 libros al trimestre, calcular una estimación para el número de años de
estudio. ¿Es fiable dicha predicción?

Compendio Matematica PDF

Caricato da

Informazioni sul documento

Titolo originale

Copyright

Formati disponibili

Condividi questo documento

Condividi o incorpora il documento

Opzioni di condivisione

Hai trovato utile questo documento?

Questo contenuto è inappropriato?

Copyright:

Formati disponibili

Compendio Matematica PDF

Caricato da

Copyright:

Formati disponibili

CAPÍTULO 1

1. INTERROGANTES CENTRALES DEL CAPÍTULO

• Números racionales o irracionales. • Ecuaciones de circunferencias, parábolas, elipses

2. CONTENIDOS FUNDAMENTALES DEL CAPÍTULO

2.1. Números, desigualdades y valores absolutos

2.1.1. Los números reales

(1) Si a < b y b < c entonces a < c (propiedad transitiva).

(1) El número a es mayor que el número b, y se escribe a > b, si a − b es un número positivo.

2.1.2. Los intervalos

2.1.3. El valor absoluto

Figura 1.1: Representación del valor absoluto.

El valor absoluto satisface las siguientes propiedades:

(1) |ab| = |a||b|

(4) |an | = |a|n

(5) −|a| 6 a 6 |a|

(6) |a| 6 r si, y sólo si, −r 6 a 6 r

(7) r 6 |a| si, y sólo si, r 6 a o a 6 −r

(8) |a + b| 6 |a| + |b| (desigualdad triangular)

2.2. Geometrı́a plana: coordenadas y rectas

2.2.1. El plano cartesiano

Figura 1.2: Representación de las coordenadas de un punto.

2.2.2. Rectas en el plano

Ecuación pendiente-intersección: Si conocemos la pendiente m y el punto de corte b con el eje de ordenadas,

Ecuación general: Toda recta admite una ecuación de la forma

donde A, B, C son constantes.

Utilizando la pendiente podemos saber si dos rectas son paralelas o perpendiculares.

2.3. Gráficas de ecuaciones de segundo grado

2.3.1. Circunferencias: (x − a)2 + (y − b)2 = r 2

Figura 1.4: Representación de una circunferencia.

2.3.2. Elipses: (x/a)2 + (y/b)2 = 1

Figura 1.5: Representación gráfica de una elipse.

2.3.3. Hipérbolas: (x/a)2 − (y/b)2 = 1

Un cálculo sencillo conduce a

2.3.4. Parábolas: y = ax2

Figura 1.6: Representación gráfica de una hipérbola.

Figura 1.7: Representación gráfica de una parábola.

siendo p la distancia del foco a la directriz.

Otras posibles ecuaciones de una parábola son las siguientes:

• x2 = 2py: El eje de la parábola es el eje OY y el vértice es el origen.

2.4. Funciones y sus gráficas

El grafo o gráfica de una función f es el conjunto de pares ordenados dado por

2.4.1. Simetrı́as de una gráfica

Figura 1.8: Gráfica simétrica respecto al eje OY .

Figura 1.9: Gráfica simétrica respecto al eje OX.

Figura 1.10: Gráfica simétrica respecto al origen.

2.5. Transformaciones y operaciones con funciones

Traslación a la derecha: y = f (x − c).

Traslación a la izquierda: y = f (x + c).

Traslación hacia arriba: y = f (x) + c.

Traslación hacia abajo: y = f (x) − c.

2.5.2. Alargamientos y reflexiones

Alargamiento vertical: y = cf (x).

Estrechamiento vertical: y = c−1 f (x).

Alargamiento horizontal: y = f (x/c).

Estrechamiento horizontal: y = f (cx).

Reflexión respecto OX: y = −f (x).

Reflexión respecto OY: y = f (−x).

2.5.3. Operaciones con funciones

Suma: (f + g)(x) = f (x) + g(x), dominio=A ∩ B.

Resta: (f − g)(x) = f (x) − g(x), dominio=A ∩ B.

Producto: (f g)(x) = f (x)g(x), dominio=A ∩ B.

Cociente: (f /g)(x) = f (x)/g(x), dominio={x ∈ A ∩ B|g(x) 6= 0}.

Composición: (g ◦f )(x) = g(f (x)), dominio={x ∈ A|f (x) ∈ B}.