Sei sulla pagina 1di 270

CAPÍTULO 1

NÚMEROS Y FUNCIONES

1. INTERROGANTES CENTRALES DEL CAPÍTULO

• Números racionales o irracionales. • Ecuaciones de circunferencias, parábolas, elipses


• Recta (numérica) real. e hipérbolas.
• Intervalos abiertos y cerrados. • Función: Dominio y recorrido.
• Reglas de las desigualdades. • Variables independiente y dependiente.
• Valor absoluto de un número. • Gráfica de una función.
• Propiedades del valor absoluto.
• Función par, función impar.
• Desigualdad del triángulo.
• Traslaciones (horizontales y verticales) de fun-
• Sistemas de coordenadas rectangulares.
ciones.
• Fórmula de la distancia.
• Alargamiento y reflexión de funciones.
• Pendiente de una recta.
• Forma punto-pendiente de una recta. • Operaciones con funciones: +, -, *, /
• Forma pendiente-intersección de una recta. • Composición de funciones.
• Relación entre las pendientes de rectas paralelas • Funciones polinómicas, algebraicas y transcen-
y perpendiculares. dentes.

2. CONTENIDOS FUNDAMENTALES DEL CAPÍTULO

2.1. Números, desigualdades y valores absolutos

2.1.1. Los números reales

Todas las matemáticas se apoyan en los números y éstos constituyen la base del cálculo. Existen distintos tipos de
números: naturales (1, 2, 3, . . . ), enteros (. . . , −3, −2,
√ −1, 0, 1, 2, 3, . . . ), racionales (1/2, 3/5, −3/8, . . . ) e
irracionales (los que no son racionales; por ejemplo, 2). La unión de todos ellos constituye el conjunto de los
números reales que se suele escribir como R.

Para representar R se utiliza una lı́nea recta, denominada recta real. En dicha recta se escoge un punto, denomi-
nado origen, que representa al cero. La dirección positiva (derecha) indica el sentido de los valores crecientes, de
tal forma que los puntos a la derecha del origen indican números positivos mientras que los puntos a la izquierda
N ÚMEROS Y FUNCIONES 7

representan números negativos. El hecho más importante es que cada número real está asociado con un único
punto en la recta real y viceversa.

Una propiedad importante de los números reales es que pueden ordenarse: el número a es menor que el número
b, y se escribe a < b, si b − a es un número positivo. En otras palabras, a < b si, y sólo si, a está a la izquierda de
b en la recta real. Esta relación < posee las siguientes propiedades:

(1) Si a < b y b < c entonces a < c (propiedad transitiva).


(2) Si a < b y c < d entonces a + c < b + d.
(3) Si a < b entonces a + c < b + c.
(4) Si a < b y c > 0 entonces ac < bc.
(5) Si a < b y c < 0 entonces ac > bc.

Propiedades similares se tienen para las desigualdades >, 6 o >, las cuales se definen como sigue:

(1) El número a es mayor que el número b, y se escribe a > b, si a − b es un número positivo.


(2) El número a es menor o igual que el número b, y se escribe a 6 b, si a = b o b − a es un número positivo.
(3) El número a es mayor o igual que el número b, y se escribe a > b, si a = b o a − b es un número positivo.

2.1.2. Los intervalos

La relación de orden < permite definir unos subconjuntos especiales de R: los intervalos. Si a < c < b entonces
decimos que c está entre a y b; un intervalo determinado por los puntos a y b es el conjunto de puntos que están
entre a y b. Si en este conjunto incluimos o no los extremos (los puntos a y b) entonces tenemos los intervalos
abiertos, cerrados o semiabiertos (semicerrados). A continuación listamos las diferentes posibilidades:

(a, b) Intervalo abierto de extremos a y b es el conjunto (a, b) = {x|a < x < b}.
[a, b] Intervalo cerrado de extremos a y b es el conjunto [a, b] = {x|a 6 x 6 b}.
(a, b] [a, b) Intervalos semiabiertos (semicerrados) de extremos a y b son los conjuntos (a, b] = {x|a < x 6 b} y
[a, b) = {x|a 6 x < b}.

Los intervalos pueden ser acotados (como los anteriores) o no acotados. En este último caso pueden presentarse
las siguientes posibilidades:

(−∞, b) Intervalo abierto de extremo b no acotado inferiormente es el conjunto (−∞, b) = {x|x < b}.
(−∞, b] Intervalo cerrado de extremo b no acotado inferiormente es el conjunto (−∞, b] = {x|x 6 b}.
(a, ∞) Intervalo abierto de extremo a no acotado superiormente es el conjunto (a, ∞) = {x|x > a}.
[a, ∞) Intervalo cerrado de extremo a no acotado superiormente es el conjunto [a, ∞) = {x|x > a}.
(−∞, ∞) Intervalo abierto no acotado (ni superior ni inferiormente) es R.

Los sı́mbolos −∞ y ∞ son eso: sı́mbolos; no denotan números reales y sólo se utilizan para expresar de forma
precisa ciertas afirmaciones o ciertos conjuntos.
8 MATEM ÁTICAS

2.1.3. El valor absoluto

El valor absoluto de un número real a se denota por |a| y se define como sigue:

a si a > 0
|a| =
−a si a < 0

Geométricamente, |a| mide la distancia que hay entre el número a y el origen 0 en la recta numérica real (ver
Figura 1.1).

• |b|
|a| •

• •
b a

Figura 1.1: Representación del valor absoluto.

El valor absoluto satisface las siguientes propiedades:

(1) |ab| = |a||b|


a |a|

(2) = , b 6= 0
b |b|

(3) |a| = a2

(4) |an | = |a|n

(5) −|a| 6 a 6 |a|

(6) |a| 6 r si, y sólo si, −r 6 a 6 r

(7) r 6 |a| si, y sólo si, r 6 a o a 6 −r

(8) |a + b| 6 |a| + |b| (desigualdad triangular)

2.2. Geometrı́a plana: coordenadas y rectas

2.2.1. El plano cartesiano

De manera similar a como hemos asociado los números reales con puntos de una recta, ahora podemos relacionar
los puntos del plano con pares ordenados de números reales. Para empezar se trazan dos rectas perpendiculares que
se cortan en un punto que denominaremos origen. Habitualmente, una de las rectas es horizontal y se denomina
eje x o eje de abcisas, y la otra recta es vertical y se denomina eje y o eje de ordenadas. Estas dos rectas dividen
al plano en cuatro partes llamadas cuadrantes.
N ÚMEROS Y FUNCIONES 9

Cualquier punto P del plano tiene asociado un par ordenado (a, b) de números reales, llamados coordenadas del
punto. La manera de conseguirlos es la siguiente: por el punto P se trazan dos rectas paralelas a los ejes las cuales
intersectan a los ejes en dos puntos que constituyen las coordenadas. El número a se denomina coordenada x o
abcisa, y el número b se llama coordenada y u ordenada (ver Figura 1.2).

6 P (a, b)
-
b 5

3
II 2
I

6
−2 −1 1 2 3 4 5
−1
a
−2
III IV

Figura 1.2: Representación de las coordenadas de un punto.

Este sistema de coordenadas fue “inventado” por el matemático francés René Descartes y, en su honor, se deno-
mina sistema de coordenadas cartesianas, aunque también es habitual el nombre de sistema de coordenadas
rectangulares.

Aunque (a, b) ha sido utilizado tanto para denotar un intervalo de la recta real como para denotar un par ordenado
de números reales, esperamos que no haya confusión, pues en cada momento sólo una interpretación será posible.

(x1 , y1 )
y1

d
|y2 − y1 |

y2 (x2 , y2 )

x1 x2
|x2 − x1 |
Figura 1.3: Distancia entre dos puntos del plano.

La distancia entre dos números reales a y b es el valor absoluto |b − a|. Para definir la distancia entre dos puntos
del plano debemos recurrir al Teorema de Pitágoras (ver Figura 1.3). La distancia entre los puntos (x1 , y1 ) y
(x2 , y2 ) del plano se define como

p
d= |x2 − x1 |2 + |y2 − y1 |2
10 MATEM ÁTICAS

2.2.2. Rectas en el plano

La pendiente de una recta (no vertical) es el número de unidades que la recta sube (o baja) por cada unidad de
cambio horizontal de izquierda a derecha. En otras palabras, la pendiente de la recta determinada por los puntos
(x1 , y1 ) y (x2 , y2 ) viene dada por
∆y y2 − y1
m= = , x1 6= x2 .
∆x x2 − x1

El orden en que se resta no tiene importancia, siempre y cuando se siga el mismo criterio en el numerador y en el
denominador.

Para determinar la ecuación de una recta podemos seguir varios pasos, según los datos de que dispongamos.

Ecuación punto-pendiente: Si conocemos la pendiente m de la recta y un punto (a, b), entonces la ecuación es

y − b = m(x − a).

Ecuación pendiente-intersección: Si conocemos la pendiente m y el punto de corte b con el eje de ordenadas,


entonces la ecuación es
y = mx + b.

Ecuación general: Toda recta admite una ecuación de la forma

Ax + By + C = 0,

donde A, B, C son constantes.

Utilizando la pendiente podemos saber si dos rectas son paralelas o perpendiculares.

Rectas Paralelas: Dos rectas (no verticales) son paralelas si, y sólo si, sus pendientes son iguales.

Rectas Perpendiculares: Dos rectas (no verticales) son perpendiculares si, y sólo si, sus pendientes m1 y m2
son inversas y opuestas, es decir, m1 m2 = −1.

2.3. Gráficas de ecuaciones de segundo grado

Un conjunto de elementos que poseen una determinada propiedad, y que sólo ellos la poseen, constituye un lugar
geométrico. Esta noción se utiliza habitualmente cuando estos conjuntos son una recta, una circunferencia, una
elipse, etc.

A modo de ejemplo, diremos que una ‘recta’ es el lugar geométrico de los puntos alineados con un punto dado A
y con una dirección dada v; es decir, un punto P está en la recta si, y sólo si, el vector determinado por los puntos
A y P es paralelo al vector v.

Dentro de la geometrı́a cartesiana, un punto P de coordenadas (x, y) pertenece a un lugar geométrico si, y sólo
si, sus coordenadas satisfacen una relación o ecuación. La ecuación de un lugar geométrico de puntos P de
coordenadas (x, y) es una ecuación entre las variables x e y tal que las coordenadas (x, y) de cualquier punto P
satisfacen dicha ecuación si, y sólo si, el punto P pertenece al lugar geométrico.
N ÚMEROS Y FUNCIONES 11

2.3.1. Circunferencias: (x − a)2 + (y − b)2 = r 2

Una circunferencia es el lugar geométrico de los puntos del plano que equidistan de un punto fijo llamado centro.
La distancia constante al centro se denomina radio (ver Figura 1.4).

y 6

P (x, y)

r

C(a, b)

-
0 x

Figura 1.4: Representación de una circunferencia.

Para determinar la ecuación procedemos como sigue. Sea P (x, y) un punto genérico de la circunferencia de centro
ppunto C(a, b) y radio r. Entonces la ecuación geométrica d(P, C) = r se transforma en la ecuación analı́tica
el
(x − a)2 + (y − b)2 = r y elevando al cuadrado obtenemos
(x − a)2 + (y − b)2 = r 2 .
Si desarrollamos los cuadrados obtenemos la siguiente ecuación
x2 + y 2 + mx + ny + p = 0,
denominada ecuación general de la circunferencia.

2.3.2. Elipses: (x/a)2 + (y/b)2 = 1

Una elipse es el lugar geométrico de los puntos del plano cuya suma de distancias a dos puntos fijos, llamados
focos, es constante.

Para determinar la ecuación, denotemos por F y F 0 los focos de la elipse, y sean 2a y 2c la suma de distancias
a los focos y la distancia focal, respectivamente. Sea P (x, y) un punto genérico y denotemos por r = P F y
r 0 = P F 0 los radios vectores, de tal forma que r + r 0 = 2a. Por fijar una referencia, supongamos que los focos
son los puntos F (c, 0) y F 0 (−c, 0). Entonces
p
r = (x − c)2 + y 2 ,
p
r0 = (x + c)2 + y 2 .
Un cálculo sencillo conduce a
r = a + ex,
r0 = a − ex,
donde e = c/a es la excentricidad de la elipse. Comparando las dos expresiones para r (o r 0 ) anteriores deducimos,
después de laboriosos cálculos, que
 x 2  y 2
+ = 1,
a b
siendo b2 = a2 − c2 . Esta es la ecuación reducida o canónica de la elipse (ver Figura 1.5).
12 MATEM ÁTICAS

y 6
(0, b)

(−a, 0)
r r0 (a, 0)
• • • • -
0 x
F F0


(0, −b)

Figura 1.5: Representación gráfica de una elipse.

2.3.3. Hipérbolas: (x/a)2 − (y/b)2 = 1

Una hipérbola es el lugar geométrico de los puntos del plano cuya diferencia de distancias a dos puntos fijos,
llamados focos, es constante.

Para determinar la ecuación, denotemos por F y F 0 los focos de la hipérbola, y sean 2a y 2c la diferencia de
distancias a los focos y la distancia focal, respectivamente. Sea P (x, y) un punto genérico y denotemos por
r = P F y r 0 = P F 0 los radios vectores, de tal forma que r − r 0 = 2a. Por fijar una referencia, supongamos que
los focos son los puntos F (c, 0) y F 0 (−c, 0). Entonces
p
r = (x − c)2 + y 2 ,
0
p
r = (x + c)2 + y 2 .

Un cálculo sencillo conduce a

r = ex + a,
r0 = ex − a,

donde e = c/a es la excentricidad de la hipérbola. Comparando las dos expresiones para r (o r 0 ) anteriores
deducimos, después de laboriosos cálculos, que
 x 2  y 2
− = 1,
a b
siendo b2 = a2 − c2 . Esta es la ecuación reducida o canónica de la hipérbola (ver Figura 1.6).

2.3.4. Parábolas: y = ax2

Una parábola es el lugar geométrico de los puntos del plano que equidistan de un punto fijo llamado foco y de
una recta fija llamada directriz.

Consideremos como eje de abcisas a la recta que, pasando por el foco, es perpendicular a la directriz; por eje de
ordenadas se toma la recta paralela a la directriz por el punto medio O entre el foco y la directriz; esta recta se
denomina eje de la parábola. El punto O es el punto en que la parábola corta a su eje y se denomina vértice de la
parábola. Realizando un procedimiento similar a los anteriores deducimos que la ecuación reducida de la parábola
es
y 2 = 2px,
N ÚMEROS Y FUNCIONES 13

y 6

• • -
x
(−a, 0) (a, 0)
0

Figura 1.6: Representación gráfica de una hipérbola.

y 6

• -
x
O F

Figura 1.7: Representación gráfica de una parábola.

siendo p la distancia del foco a la directriz.

Otras posibles ecuaciones de una parábola son las siguientes:

• x2 = 2py: El eje de la parábola es el eje OY y el vértice es el origen.


• y = ax2 + bx + c: El eje de la parábola es paralelo al eje OY pero el vértice no es el origen.
• x = ay 2 + by + c: El eje de la parábola es paralelo al eje OX pero el vértice no es el origen.

2.4. Funciones y sus gráficas

Una función es una correspondencia que asocia a cada elemento x de un conjunto A, denominado dominio,
exactamente otro elemento f (x) en un conjunto B. El elemento f (x) se dice que es el valor de f en x o la
imagen de x mediante f . El conjunto formado por todas las imágenes f (x) es denominado conjunto imagen o
recorrido. Si a cada valor del recorrido le corresponde exactamente un elemento en su dominio, la función se
llama inyectiva. Si el recorrido es todo el conjunto B, la función se dice que es suprayectiva o sobreyectiva.
Una función inyectiva y sobreyectiva se llama biyectiva.

Cuando pensamos en una función arbitraria f , es usual utilizar un sı́mbolo para designar un elemento arbitrario en
el dominio de f y otro sı́mbolo para un elemento del recorrido. Al primero se le denomina variable independiente
y al segundo variable dependiente. Por ejemplo, sea la función f definida en N (los números naturales) y con
valores en N que asocia a cada número natural su inmediato sucesor. Entonces es usual escribir f (x) = x + 1 o
14 MATEM ÁTICAS

bien y = x + 1, donde x denota un número natural arbitrario e y indica el número natural que le asocia la función
f.

El grafo o gráfica de una función f es el conjunto de pares ordenados dado por


{(x, f (x))|x ∈ A}.
Por ejemplo, para la función anterior la gráfica serı́a el subconjunto de puntos de R2 definido por
{(x, x + 1)|x ∈ N}.

No todos los subconjuntos de R2 son la gráfica de una determinada función f definida en R: se tiene que cumplir
que toda recta vertical debe intersecar a lo más un sola vez al subconjunto.

Una función f : R → R se dice positiva (resp. negativa) si f (x) > 0 (resp. f (x) < 0) para todo valor de x.
Geométricamente esto significa que la gráfica de la función está contenida en el semiplano superior (resp. inferior)
de R2 . En general, una función no tiene por qué ser positiva o negativa; probablemente será positiva en partes de
su dominio y negativa en otras partes.

2.4.1. Simetrı́as de una gráfica

Para dibujar una gráfica puede ser interesante conocer los tipos de simetrı́a de la ecuación que la determina. Son
los siguientes:

y 6

(−x, y) (x, y)

-
x

Figura 1.8: Gráfica simétrica respecto al eje OY .

Simetrı́a respecto al eje OY: Cuando al sustituir x por −x queda una ecuación equivalente. Si la ecuación es
y − f (x) = 0, cuando f (−x) = f (x) para todo valor de x. Diremos que la función f es par (ver Figura
1.8).
Simetrı́a respecto al eje OX: Cuando al sustituir y por −y queda una ecuación equivalente (ver Figura 1.9).
Simetrı́a respecto al origen: Cuando al sustituir x por −x e y por −y se obtiene una ecuación equivalente. Si
la ecuación es y − f (x) = 0, cuando f (−x) = −f (x) para todo valor de x. Diremos que la función f es
impar (ver Figura 1.10).
N ÚMEROS Y FUNCIONES 15

y 6

(x, y)

-
x

(x, −y)

Figura 1.9: Gráfica simétrica respecto al eje OX.

y 6

(x, y)

-
x

(−x, −y)

Figura 1.10: Gráfica simétrica respecto al origen.

2.5. Transformaciones y operaciones con funciones

Es fácil ver que transformando la gráfica de una función podemos obtener las gráficas de otras funciones relaciona-
das con la anterior, sin necesidad de repetir el trabajo que supone realizar una gráfica. Entre las transformaciones
más usuales están las traslaciones, los alargamientos (homotecias) y las reflexiones.
16 MATEM ÁTICAS

2.5.1. Traslaciones

Existen cuatro tipos de traslación. Para describirlas, sea c > 0 el número que indica las unidades que vamos a
desplazar la gráfica original.

Traslación a la derecha: y = f (x − c).

Traslación a la izquierda: y = f (x + c).

Traslación hacia arriba: y = f (x) + c.

Traslación hacia abajo: y = f (x) − c.

2.5.2. Alargamientos y reflexiones

Otro tipo de transformación consiste en modificar la escala de los ejes: podemos alargar o achatar las gráficas con
sólo multiplicar la x o la y por una constante c > 1 apropiada. También podemos reflejar la gráfica en los ejes de
coordenadas. Estas transformaciones se pueden resumir como sigue:

Alargamiento vertical: y = cf (x).

Estrechamiento vertical: y = c−1 f (x).

Alargamiento horizontal: y = f (x/c).

Estrechamiento horizontal: y = f (cx).

Reflexión respecto OX: y = −f (x).

Reflexión respecto OY: y = f (−x).

2.5.3. Operaciones con funciones

Dos funciones f y g pueden combinarse para formar nuevas funciones de muy diversas maneras. A continuación
veremos que las funciones pueden sumarse, restarse, multiplicarse y dividirse de una manera similar a los números
reales. El álgebra de las funciones reales de variable real puede resumirse de la siguiente manera. Sean f y g dos
funciones con dominios A y B, respectivamente. Entonces definimos las operaciones elementales como sigue:

Suma: (f + g)(x) = f (x) + g(x), dominio=A ∩ B.

Resta: (f − g)(x) = f (x) − g(x), dominio=A ∩ B.

Producto: (f g)(x) = f (x)g(x), dominio=A ∩ B.

Cociente: (f /g)(x) = f (x)/g(x), dominio={x ∈ A ∩ B|g(x) 6= 0}.

Composición: (g ◦f )(x) = g(f (x)), dominio={x ∈ A|f (x) ∈ B}.


N ÚMEROS Y FUNCIONES 17

2.6. Clasificaciones de funciones

El concepto actual de función es fruto del esfuerzo colectivo de numerosos matemáticos de los siglos XVII y
XVIII. Los matemáticos de esa época pensaban que cualquier fenómeno fı́sico podı́a ser descrito con la ayuda de
una colección básica de funciones: las funciones elementales. Estas funciones pueden dividirse en tres bloques:
(1) algebraicas; (2) exponenciales y logarı́tmicas; y (3) trigonométricas.

Las funciones algebraicas más habituales son los polinomios, los cuales pueden escribirse en la forma

f (x) = an xn + an−1 xn−1 + · · · + a1 x + a0 ,

donde a0 , a1 , . . . , an son números reales. El entero positivo n se llama el grado del polinomio, an es el coeficiente
dominante y a0 es el término constante. Como casos particulares tenemos las funciones constantes (f (x) = c)
y las funciones potencia (f (x) = xn ).

Otras funciones básicas son las funciones raı́z (f (x) = x1/n = n x) y las funciones racionales (f (x) =
P (x)/Q(x), P y Q polinomios). En general, las funciones algebraicas son aquellas que pueden expresarse en
términos de un número finito de sumas, restas, productos, cocientes y raı́ces de polinomios.

Las funciones que no son algebraicas se llaman transcendentes. Por ejemplo, las funciones exponenciales, lo-
garı́tmicas y trigonométricas son trascendentes.

3. ACTIVIDADES DE APLICACIÓN DE LOS CONOCIMIENTOS

A.1.1. Probar que


n(n + 1)
1 + 2 + 3 + ··· + n =
2
para todo entero positivo n.

A.1.2. Probar que


1 1 1 1 1
+ 2 + 3 + ··· + n = 1 − n
21 2 2 2 2
para todo entero positivo n.

A.1.3. Probar que n! > 3n para n suficientemente grande.

A.1.4. Suponiendo cierta la desigualdad triangular, probar

|x1 + x2 + · · · + xn | 6 |x1 | + |x2 | + · · · + |xn |,

para todo entero positivo n.

A.1.5. Probar que si r 6= 1 entonces

1 − r n+1
1 + r + r2 + r3 + · · · + rn =
1−r
para todo entero positivo n.

A.1.6. Probar que


2 2 2 2 1
+ 2 + 3 + ··· + n = 1 − n
31 3 3 3 3
para todos los enteros positivos n.

A.1.7. Probar que 2n > n2 para n suficientemente grande.


18 MATEM ÁTICAS

A.1.8. Hallar el dominio y el recorrido de las siguientes funciones:


a) f (x) = x2 .

b) f (x) = x + 4.
1
c) f (x) = √ .
1−x

d) f (x) = x − 1.

A.1.9. Determinar si las funciones siguientes son o no biyectivas:


a) f (x) = (x − 3)(x − 5)
b) f (x) = x3
c) f (x) = |x|x2
1
d) f (x) = x +
x
A.1.10. Determinar si las siguientes funciones son pares o impares:
a) f (x) = x3
b) f (x) = x(x − 1)
1
c) f (x) = x +
x
d) f (x) = x(x2 + 1)

A.1.11. Hallar las composiciones (f ◦ g)(x) y (g ◦ f )(x) de las siguientes funciones:


a) f (x) = x + 1; g(x) = x2 .
1
b) f (x) = x2 − 5; g(x) = + 1.
x

c) f (x) = x; g(x) = x2 − 1.
d) f (x) = x2 + 5; g(x) = x(x − 1).

A.1.12. Hallar las funciones inversas de las siguientes, especificando su dominio:


a) f (x) = x3
b) f (x) = 1 + 3x3
c) f (x) = (4x − 1)3
1
d) f (x) =
x

4. ACTIVIDADES PRÁCTICAS DEL CAPÍTULO

4.1. Introducción

La práctica se va a realizar con el programa de cálculo matemático DERIVE for Windows, versión 4.05, de Soft
Warehouse. DERIVE for Windows permite realizar cálculos y manipulaciones matemáticas de carácter general,
lo cual significa que realiza muchas cosas de forma aceptable aunque no tiene la potencia de otros programas
especı́ficos. No obstante, DERIVE for Windows permite realizar todos los cálculos que un usuario medio puede
necesitar.
N ÚMEROS Y FUNCIONES 19

Figura 1.11: Pantalla inicial del programa donde aparece, además del menú principal, la ‘botonera’ que permite
agilizar la introducción de las expresiones y la realización de los cálculos.

Para ejecutar el programa debemos acceder a la carpeta DERIVE for Windows y ejecutar el programa DERIVE
for Windows. Una vez en el programa, aparecerá la pantalla de la Figura 1.11, con un menú en la parte superior
que, de ahora en adelante, denominaremos menú principal.

En esta práctica nos vamos a limitar a familiarizarnos con el programa DERIVE for Windows y a la realización
de algunos cálculos elementales. Sin embargo, antes de realizar los cálculos debemos introducir los datos o
expresiones que necesitemos.

4.2. Introducción y edición de expresiones

Con el término expresión queremos indicar cualquier función, constante, variable u operador que podamos in-
troducir en el programa. Las expresiones se introducen seleccionando la opción Author del menú principal.
Entonces nos aparece un menú con tres posibilidades: Expression, Vector o Matrix, que nos permite introdu-
cir una expresión, un vector o una matriz. Para agilizar la introducción de los datos, debemos recordar que existen
teclas calientes que equivalen a diversas opciones de los menús. Ası́, por ejemplo, para introducir una expresión
es suficiente con pulsar Ctrl+A y nos aparece la ventana de la Figura 1.12. Conforme vamos introduciendo las
expresiones, éstas se van numerando correlativamente y en orden creciente, de forma que en una expresión pode-
mos hacer referencia a una expresión anterior (utilizando para ello el sı́mbolo #). Una pantalla tı́pica de trabajo se
muestra en la Figura 1.13.

Figura 1.12: Ventana del programa para introducir las expresiones.

Para editar (y eventualmente modificar) una expresión ya introducida tenemos dos vı́as distintas. En primer lugar
20 MATEM ÁTICAS

Figura 1.13: Pantalla tı́pica del programa donde aparecen algunas instrucciones. Obs érvese que es posible intro-
ducir sentencias descriptivas que nada tienen que ver con operaciones matemáticas pero que ayudan
a seguir los cálculos.

podemos marcar la expresión (haciendo ‘click’ con el ratón en la expresión deseada o moviéndonos con las flechas:
↑ para acceder a una expresión con un número menor y ↓ para acceder a otra con un número mayor) y seleccionar
la opción Edit Expression. Otra posibilidad es elegir Edit y seguidamente Go to expression, lo cual nos
permite introducir el número de la expresión que queremos editar.

4.3. ¿Qué cosas pueden aparecer en las expresiones?

En una expresión de DERIVE for Windows están permitidas numerosas opciones: letras griegas, constantes, ope-
radores (aritméticos y lógicos) y funciones (exponenciales, logarı́tmicas, trigonométricas, hiperbólicas, complejas,
de probabilidad, estadı́sticas, de error, de cálculo financiero, de cálculo matemático, vectoriales, matriciales, y de
cálculo diferencial e integral vectorial). Por el momento, es suficiente con recordar que en las expresiones pode-
mos utilizar los siguientes elementos:

Constante Expresión
e (base de los logaritmos neperianos) #e
i (unidad imaginaria compleja) #i
π (3.1415926 . . . ) pi
∞ (infinito matemático) inf
N ÚMEROS Y FUNCIONES 21

Función Expresión Operador Expresión


Raiz cuadrada SQRT(x) Menos -x
Exponencial EXP(x) Suma x+y
Logaritmo neperiano LN(x) ó LOG(x) Resta x-y
Logaritmo en base w LOG(z,w) Producto x*y ó xy
Seno SIN(x) Cociente x/y
Coseno COS(x) Exponenciación xˆy
Tangente TAN(x) Tanto por ciento x%
Valor absoluto ABS(x) Factorial x!

4.4. Las primeras experiencias

La mejor manera de que nos aprendamos los sı́mbolos y funciones descritos anteriormente no es dedicar mucho
tiempo a memorizarlos, ya que esta tarea no es nada eficaz, además de resultarnos bastante odiosa. Lo conveniente
es realizar numerosos ejercicios, sencillos en su mayorı́a, pero que nos ayudarán a retener lo esencial.

Calcular (3 + 6)(7 − 2)/4

Introducimos la expresión (3+6)(7-2)/4 o (3+6)*(7-2)/4. Entonces nos aparecerá la misma lı́nea en pan-
talla. Si queremos ver el resultado debemos simplificar (seleccionando Simplify Basic o pulsando Ctrl+B)
y obtendremos 45/4, que es el valor exacto. Si queremos obtener el valor decimal aproximado, con un número
de decimales predeterminado (por defecto, este número es 6), debemos seleccionar Simplify Approximate (o
Ctrl+G) y nos aparece la ventana de la Figura 1.14. Tras confirmar la expresión que queremos simplificar y el
número de decimales obtendremos 11.25.

Figura 1.14: Ventana del programa para calcular aproximaciones de expresiones.

Calcular eπ

Introducimos la expresión #e^pi obteniendo, después de seleccionar las opciones Simplify Approximate,
el valor de 23.1407 (6 dı́gitos). Si queremos un resultado más preciso (por ejemplo, con 12 dı́gitos), debemos
cambiar dicho número cuando seleccionemos Approximate. Entonces obtendremos el valor de 23.1406926327.
22 MATEM ÁTICAS

Calcular 1534 de forma exacta

Elejimos Author y escribimos la expresión 15^34. Después de seleccionar las opciones Simplify Basic (o
simplemente pulsando el botón = ) nos aparecerá en pantalla el siguiente número:

9707397373664756887592375278472900390625.

Si queremos un resultado aproximado (por ejemplo, con 12 cifras exactas), seleccionamos dicha configuración
mediante Simplify Approximate y obtendremos: 9.70739737366 10^39.

Figura 1.15: El uso de la ‘botonera’ de DERIVE for Windows nos puede simplificar mucho el trabajo. Otro elemento
interesante es la existencia de ‘teclas calientes’ que nos permiten evitar los menús, con lo que se gana
en rapidez.

Antes de seguir adelante será conveniente que comentemos brevemente la ‘botonera’ de DERIVE for Windows
(ver Figura 1.15), ya que simplifica enormemente la introducción de datos y la realización de cálculos. Los boto-
nes permiten realizar las siguientes tareas (de izquierda a derecha): New (abrir una nueva hoja de trabajo), Open
(abrir una hoja de trabajo existente), Save (guardar la sesión de trabajo), Print (imprimir la sesión de trabajo),
Remove (eliminar la expresión marcada), Unremove (recuperar la última expresión eliminada), Renumber (re-
numerar las expresiones), Author expression (introducir una expresión sencilla), Author vector (introducir
un vector), Author matrix (introducir una matriz), Simplify (simplificar), Approximate (calcular un valor
aproximado), Solve (resolver algebraicamente o numéricamente una expresión), Substitute for variables
(realizar una sustitución), Calculate limit (calcular un lı́mite), Calculate derivative (calcular una deriva-
da), Calculate integral (calcular una integral), Calculate sum (calcular una suma), Calculate product
(calcular un producto), 2D-plot window (realizar un gráfico bidimensional) y 3D-plot window (realizar un
gráfico tridimensional).

Calcular el factorial de 75 en forma exacta y aproximada

Elejimos Author y tecleamos 75!. Después de pulsar el botón = se obtiene el siguiente resultado:
24809140811395398091946477116594033660926243886570122837795894512655842677572867409443
815424000000000000000000.
Si quisiéramos un valor aproximado, entonces elegirı́amos las opciones Simplify Approximate y el valor ob-
tenido serı́a 2.48091408113 10^109 (con 12 dı́gitos). Observemos que este valor tiene más de 80 cifras; como
puede ser que en nuestra pantalla sólo se visualicen hasta 80 caracteres, debemos pulsar simultáneamente las te-
clas Control y las fechas ← y → para ir visualizando el resto, o bien desplazar la ‘barra’ que se encuentra en la
parte inferior de la ventana del programa.

Obtener el número π con 100 decimales y grabarlo en un fichero

Escogemos Author y escribimos pi. Seleccionamos la opción de simplificar con precisión aproximada hasta 100
dı́gitos exactos y el resultado obtenido es:
3.141592653589793238462643383279502884197169399375105820974944592307816406286208998628
034825342117067.
Para no tener que copiar la solución de la pantalla lo conveniente es grabarla en un archivo o enviarla a la impresora
N ÚMEROS Y FUNCIONES 23

para tenerla por escrito. Para ello debemos seguir el camino File Save o File Print según queramos una
opción u otra. En cualquiera de los dos casos, el programa nos permite seleccionar las expresiones que deseamos
grabar en disco o imprimir. En este segundo caso, una opción muy interesante es File Print Preview, que nos
permite visualizar en pantalla lo que se va a imprimir. La Figura 1.16 muestra la sesión actual antes de ser enviada
a la impresora.

Figura 1.16: Antes de enviar una sesión de DERIVE for Windows directamente a la impresora es conveniente
visualizarla en pantalla, para comprobar que no existen errores. Cuando todo esté correcto, podremos
enviarlo a la impresora desde la pantalla Print Preview

Posteriormente, cuando queramos recuperar todo lo que hemos guardado, bastará con elegir File Load para
cargar en memoria todo el trabajo anterior.

4.5. Ejercicios de aplicación

A continuación se enuncian unos ejercicios sencillos sobre aritmética y operaciones con expresiones algebraicas.
Si el alumno encuentra alguna dificultad debe releer lo dicho hasta ahora, en particular la sintaxis de las distintas
funciones y constantes.

a) Calcular 11/24 + 5/36 + 17/46 en forma exacta y con 7 decimales exactos.


b) Calcular 2342 en forma exacta y con 25 cifras exactas.
c) Calcular la raı́z cuadrada de 3972049.
d) Calcular π con 200 decimales exactos.
p √
e) Calcular 8 + 53 7 en forma aproximada.

4.6. Operaciones con expresiones algebraicas

Una de las caracterı́sticas esenciales del programa DERIVE for Windows es la posibilidad de manipular expresio-
nes algebraicas, del tipo x3 + 5x − 7 o (1 − x − y 2 )100 . En esta sección vamos a comentar las principales opciones
24 MATEM ÁTICAS

del programa en relación con las expresiones algebraicas. La función básica es Simplify (simplificar), la cual
admite diversas variantes: Basic (Ctrl+B), Expand (Ctrl+E), Factor (Ctrl+F) y Approximate (Ctrl+G). En
los siguientes ejemplos ilustramos su uso.

x2 − 3x + 2
Simplificar la expresión
x2 − 5x + 6

Elejimos la opción Author y tecleamos x^2-3x+2 (supongamos que es la expresión 16). A continuación vol-
vemos a seleccionar Author y escribimos x^2-5x+6 (que será la expresión 17). Finalmente, seleccionando de
nuevo la opción Ctrl+A escribimos #16/#17 y nos aparecerá

x2 − 3x + 2
.
x2 − 5x + 6

Esta fracción podı́a haber sido introducida de una sola vez como sigue:

(x^2-3x+2)/(x^2-5x+6).

Debemos ser muy cuidadosos con los paréntesis y usarlos siempre, aunque en ocasiones nos parezcan innecesarios;
un buen hábito en la escritura puede evitarnos innumerables problemas. Si ahora elegimos la opción Simplify
x−1
Basic (o pulsando el botón = ) obtendremos como resultado el siguiente: .
x−3

Simplificar x2 − (x + (y + 2)100 )(x − (y + 2)100 )

Introducimos la expresión x^2-(x+(y+2)^(100))(x-(y+2)^(100)) y seleccionamos la opción Simplify para


obtener (y + 2)200 .

Desarrollar (x + y)4

Introducimos la expresión (x+y)^4 y seleccionamos la opción Expand. Entonces el programa nos pregunta qué
variable queremos desarrollar: por defecto, desarrolla todas las variables que aparecen en la expresión. En nuestro
caso, el valor obtenido es: x4 + 4x3 y + 6x2 y 2 + 4xy 3 + y 4 .

Factorizar x4 − 2x3 − 8x2 + 18x − 9

Para factorizar un polinomio debemos seleccionar la opción Simplify Factor y a continuación debemos indi-
car la variable y el método (ver Figura 1.17). Existen cinco métodos de factorización: Trivial Squarefree
Rational raDical Complex, siendo los tres últimos los que más factorizan. En nuestro caso, después de in-
troducir el polinomio como x^4-2x^3-8x^2+18x-9, seleccionamos Ctrl+F y seguidamente Squarefree para
obtener (x − 1)2 (x2 − 9). Para mayor precisión, seleccionamos el método Rational (o raDical, Complex) y
obtenemos (x + 3)(x − 3)(x − 1)2 .
N ÚMEROS Y FUNCIONES 25

Figura 1.17: Ventana del programa que nos permite factorizar expresiones.

4.7. Resolución de ecuaciones

Una de las tareas más ingratas y complicadas con las que nos podemos encontrar es la determinación de los
números que satisfacen una determinada ecuación (de una o varias variables): es el problema de la resolución de
ecuaciones. Para construir una ecuación (o inecuación) se pueden utilizar los siguientes operadores:

Operador Teclear
= =
6 = /=
< <
> >
6 <=
> >=

Cálculo de la pendiente de una recta

Supongamos que queremos calcular la pendiente de la recta 5x − 8y = 13. Entonces podemos expresar la recta
en la forma y = mx + n de tal suerte que el número m es la pendiente. El programa DERIVE for Windows
nos permite determinar la pendiente como sigue. Se introduce la expresión 5x-8y=13, se eligen las opciones
Solve|Algebraically y nos aparece la ventana de la Figura 1.18. Escogemos la variable y (por defecto, el
programa nos ofrece la variable x) y como resultado obtenemos y = 5x−13
8 , por lo que la pendiente es 5/8.

Resolver la ecuación (x + 3)2 + (x − 2)2 = 53

Introducimos la ecuación como (x+3)^2+(x-2)^2=53 y seleccionamos las opciones Solve|Algebraically.


El resultado obtenido es: x = 4, x = −5.
26 MATEM ÁTICAS

Figura 1.18: Ventana del programa que nos permite resolver algebraicamente expresiones.

Calcular las raı́ces del polinomio x8 − 8x7 + 22x6 − 16x5 − 31x4 + 56x3 − 8x2 − 32x + 16

Elegimos la opción Author y escribimos el polinomio como

x^8-8x^7+22x^6-16x^5-31x^4+56x^3-8x^2-32x+16.

Se eligen las opciones Solve|Algebraically y obtenemos como soluciones: x = 1, x = −1, x = 2. Pe-


ro, ¿cuáles son sus multiplicidades? Para determinarlas, dividimos el polinomio original entre (x − 1)(x +
1)(x − 2) obteniendo como resultado x5 − 6x4 + 11x3 − 2x2 − 12x + 8. Volvemos a seleccionar las opcio-
nes Solve|Algebraically y obtenemos de nuevo x = 1, x = −1, x = 2. Si volvemos a dividir x5 − 6x4 +
11x3 − 2x2 − 12x + 8 entre (x − 1)(x + 1)(x − 2) obtenemos (x − 2)2 , por lo que podemos deducir que las raı́ces
x = 1 y x = −1 son dobles mientras que la raı́z x = 2 es cuádruple.

4.8. Ejercicios de aplicación

A continuación se enuncian unos ejercicios sencillos sobre resolución de ecuaciones. Si el alumno encuentra
alguna dificultad debe releer lo dicho hasta ahora, en particular la sección referente a las expresiones algebraicas
y su manipulación.

√ √
a) Resolver la ecuación 2x + 3 − x − 2 = 2.
√ √
b) Resolver la ecuación 3 x = 2x − 3.
c) Determinar las raices del polinomio x4 − 1.
d) Resolver la ecuación ax2 + bx + c = 0.

4.9. Realizar gráficas de funciones

Quizás en alguno de los ejercicios anteriores hemos tenido dificultades y no hemos podido encontrar la solución.
En estos casos, la vı́a de solución consiste en representar gráficamente la ecuación y determinar un intervalo
(cuanto más pequeño mejor) que contenga la raı́z. Por ejemplo, si dibujamos la ecuación x5 − 6x4 + 11x3 −
N ÚMEROS Y FUNCIONES 27

2x2 − 12x + 8 = 0 obtenemos la Figura 1.19. Nos damos cuenta que hay raı́ces alrededor de los puntos -1, 1, 2
(en este caso, esas son las raı́ces), por lo que podrı́amos determinar el valor exacto resolviendo numéricamente la
ecuación anterior en los intervalos [-2,0], [0,2] y [1,3], respectivamente.

Figura 1.19: Gráfica de la función x5 − 6x4 + 11x3 − 2x2 − 12x + 8 = 0

Para resolver numéricamente una ecuación (es decir, encontrar un valor que satisfaga dicha ecuación) debemos
elegir las opciones Solve|Numerically y nos aparece la ventana de la Figura 1.20, donde debemos introducir la
ecuación y el intervalo donde queremos que DERIVE for Windows busque la solución: Lower y Upper.

Figura 1.20: Ventana del programa que nos permite resolver numéricamente ecuaciones.

Para dibujar una función es suficiente con marcar la expresión que la define y seleccionar la opción New 2D-plot
window (o bien pulsar el botón correspondiente). Con esto conseguimos que se abra una nueva ventana gráfica; a
continuación debemos seleccionar la opción Plot!. Cada ventana gráfica está asociada a una ventana de cálculos
algebraicos, por lo que todas las representaciones gráficas de una ventana de álgebra se realizarán en la misma
ventana gráfica. En el caso de realizar varias representaciones gráficas en una misma ventana, cada gráfica irá en
un color distinto.

4.10. Bibliografı́a

C. Paulogorrón y C. Pérez. Cálculo matemático con DERIVE para PC, Ed. RA-MA, 1a Ed., 1994.
28 MATEM ÁTICAS

5. BIBLIOGRAFÍA DEL CAPÍTULO

R.E. LARSON, R.P. HOSTETLER y B.H. EDWARDS Calculo y Geometrı́a Analı́tica, 5a ed., vol. 1. McGraw-
Hill, Madrid, 1995. Capı́tulo 1.
J. STEWART Cálculo, 2a ed. Grupo Editorial Iberoamérica, México, 1994. Capı́tulo 0.

6. PREGUNTAS DE EVALUACIÓN

E.1.1. Hallar las ecuaciones de la recta que pasa por el punto (1,3) y cumple además en cada caso:
a) Tiene pendiente −2/3.
b) Es perpendicular a la recta x + y = 0.
c) Pasa por el punto (2,4).
d) Es paralela al eje x.

E.1.2. Hallar la ecuación de la recta bisectriz del ángulo agudo formado por las rectas y = 3x e y = 2.
E.1.3. Un avión vuela con rumbo constante y a velocidad constante entre dos ciudades. La distancia s (en
kilómetros) que ha recorrido en t horas es s = 950t.
a) Dibujar la gráfica de esta ecuación para t > 0.
b) ¿Qué información contiene la pendiente de la recta?
E.1.4. Un empresario adquiere una máquina por 4500000 pesetas. La máquina gasta en promedio 1000 pesetas
en mantenimiento y gasoil. El operario que la maneja cobra 1850 pesetas por hora y a los clientes se les
cargan 5000 pesetas por hora.
a) Escribir una ecuación para el coste C de funcionamiento de la máquina durante t horas.
b) Idem para los ingresos R derivados de t horas de funcionamiento.
c) Hallar el punto de equilibrio de esa máquina, calculando en qué tiempo t ocurre que R = C.
N ÚMEROS Y FUNCIONES 29

ANOTACIONES

....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
CAPÍTULO 2
CÁLCULO DIFERENCIAL

1. INTERROGANTES CENTRALES DEL CAPÍTULO

• Lı́mite de una función • Máximos y mı́nimos relativos


• Lı́mites laterales • Polinomios de Taylor
• Reglas para el cálculo de lı́mites • Series de potencias
• Regla del ‘bocadillo’
• Teorema de Taylor
• Continuidad de una función
• Algoritmo de bisección
• Propiedades de las funciones continuas
• Método de iteración del punto fijo
• Teorema del valor intermedio
• Método de Newton-Raphson
• Derivada de una función
• Interpretación geométrica de la derivada • Polinomio interpolante de Lagrange
• Teorema de Rolle • Método de interpolación iterada
• Teorema del valor medio • Método de diferencias divididas

2. CONTENIDOS FUNDAMENTALES DEL CAPÍTULO

2.1. Lı́mite de una función

2.1.1. Definiciones

La noción de lı́mite es básica en todo el cálculo, por lo que es sumamente importante adquirir un buen manejo y
conocimiento de los lı́mites antes de adentrarnos en otros temas.

Sea f (x) una función y consideremos x0 un número real (no necesariamente en el dominio de f ). Si f (x) se
acerca arbitrariamente a un único valor L cuando x se aproxima a x0 por ambos lados (sin llegar nunca a ser igual
a x0 ), decimos que el lı́mite de f (x) cuando x tiende a x0 es L, y escribimos

lim f (x) = L.
x→x0

En la definición anterior observamos que sólo interesa conocer cómo está definida la función f cerca del punto
C ÁLCULO DIFERENCIAL 31

x0 . Si la función existe o no en el punto x0 no tiene importancia. La cuestión crucial aquı́ es la siguiente: ¿qué
significa que f (x) se acerca arbitrariamente a L? ¿qué ocurre si x se aproxima a x0 sólo por un lado?

El comportamiento de las funciones en relación a los lı́mites puede ser de lo más diverso. Sólo como un botón de
muestra, veamos las siguientes funciones.


f (x) = x/( x + 1 − 1): El lı́mite de f (x) cuando x → 0 vale 2, ya que si nos acercamos por la izquierda
obtenemos valores menores que 2 pero cada vez más próximos a 2; y si nos acercamos por la derecha
obtenemos valores mayores que 2 pero cada vez más próximos a 2. Sin embargo, la función f no está
definida en x = 0.

f (x) = |x|/x: Cuando nos acercamos a 0 por la izquierda, entonces f (x) = −1 por lo que el lı́mite vale −1.
Pero si nos acercamos por la derecha entonces f (x) = 1 y ası́ el lı́mite vale 1. Por tanto, no existe el lı́mite.

f (x) = 1/x2 : Cuando x se aproxima a 0, f (x) se va haciendo cada vez más grande, por lo que no existe ningún
número real L al cual tienda f (x). Por tanto no existe el lı́mite de f (x) cuando x → 0.

En los ejemplos anteriores hemos visto que hay funciones que se aproximan a un valor L1 cuando x se aproxima
a x0 por la izquierda y se aproximan a L2 si nos acercamos por la derecha. Este comportamiento nos lleva a
considerar las siguientes definiciones.

Sea f (x) una función y consideremos x0 un número real (no necesariamente en el dominio de f ).

(1) Si f (x) se acerca arbitrariamente a un único valor L cuando x se aproxima a x0 por la izquierda (sin llegar
nunca a ser igual a x0 ), decimos que el lı́mite por la izquierda de f (x) cuando x tiende a x0 es L, y
escribimos
lim − f (x) = L.
x→x0

(2) Si f (x) se acerca arbitrariamente a un único valor L cuando x se aproxima a x0 por la derecha (sin llegar
nunca a ser igual a x0 ), decimos que el lı́mite por la derecha de f (x) cuando x tiende a x0 es L, y
escribimos
lim + f (x) = L.
x→x0

Entonces existe el lı́mite de una función f (x) en x0 si existen los lı́mites laterales en x0 y coinciden.

2.1.2. Reglas para el cálculo de lı́mites

Si b y c son números reales, n un entero positivo y f , g son funciones que tienen lı́mite cuando x tiende a c,
entonces son ciertas las siguientes propiedades:

(1) Múltiplo escalar: lim [bf (x)] = b[ lim f (x)]


x→c x→c

(2) Suma/Diferencia: lim [f (x) ± g(x)] = lim f (x) ± lim g(x)


x→c x→c x→c

(3) Producto: lim [f (x)g(x)] = lim f (x) lim g(x)


x→c x→c x→c

f (x) limx→c f (x)


(4) Cociente: lim [ ]= , siempre que limx→c g(x) 6= 0.
x→c g(x) limx→c g(x)
32 MATEM ÁTICAS

(5) Potencia: lim [f (x)]n = [ lim f (x)]n


x→c x→c
p q
(6) Raı́z: lim n f (x) = n lim f (x). Si n es par suponemos que lim f (x) es no negativo.
x→c x→c x→c

Para poder calcular lı́mites sólo es necesario, además de utilizar las reglas anteriores, tener en cuenta que lim b = b
x→c
y lim x = c.
x→c

Como una consecuencia de la aplicación de las propiedades anteriores tenemos las siguientes reglas:

(1) Si p(x) es un polinomio entonces


lim p(x) = p(c).
x→c

(2) Si r(x) = p(x)/q(x), q(c) 6= 0, es una función racional entonces

p(x) p(c)
lim = .
x→c q(x) q(c)

(3) Si c > 0 y n es cualquier entero positivo, o si c < 0 y n es un entero positivo impar, entonces
√ √
lim n x = n c.
x→c

(4) Si f y g son funciones tales que lim g(x) = L y lim f (x) = f (L) entonces
x→c x→L

lim f (g(x)) = f (L).


x→c

Para finalizar este apartado vamos a enunciar la regla del bocadillo o teorema de intercalación, herramienta muy
útil que permite calcular lı́mites por comparación.

Regla del Bocadillo. Si f (x) 6 g(x) 6 h(x) para todo x en un intervalo abierto que contiene a c (no importa lo
que suceda en c) y
lim f (x) = lim h(x) = L,
x→c x→c
entonces
lim g(x) = L.
x→c

2.2. Continuidad de una función

El término continuidad en matemáticas tiene exactamente el mismo significado que tiene en el lenguaje cotidiano:
una función f es continua en un punto a si su gráfica no se interrumpe en a, no tiene saltos ni huecos en ese punto.
La única diferencia que existe es en la formulación rigurosa.

Continuidad en un punto: Una función f es continua en a si se verifican las siguientes condiciones:


1. f (a) está definida. 2. lim f (x) existe. 3. lim f (x) = f (a).
x→a x→a

Continuidad en un intervalo abierto: Una función f se dice continua en un intervalo abierto (b, c) si lo es en
todos los puntos de ese intervalo.

Si f es continua en toda la recta real (−∞, ∞) diremos simplemente que f es una función continua. Se dice que
f es discontinua en a si no es continua en dicho punto.
C ÁLCULO DIFERENCIAL 33

Existen varios tipos de discontinuidades: las evitables y las no evitables. Se dice que una discontinuidad en x = a
es evitable si la función f puede hacerse continua en a redefiniéndola en dicho punto. En caso contrario, se dirá
que la discontinuidad es no evitable.

Continuidad por la derecha: Una función f es continua por la derecha en a si se verifican las siguientes condi-
ciones:
1. f (a) está definida. 2. lim+ f (x) existe. 3. lim+ f (x) = f (a).
x→a x→a

Continuidad por la izquierda: Una función f es continua por la izquierda en a si se verifican las siguientes
condiciones:
1. f (a) está definida. 2. lim− f (x) existe. 3. lim− f (x) = f (a).
x→a x→a

Continuidad en un intervalo cerrado: Una función f se dice continua en un intervalo cerrado [b, c] si es continua
en (b, c) y también es continua por la derecha en b y por la izquierda en c.

2.2.1. Propiedades de las funciones continuas

Teniendo en cuenta que la continuidad se ha definido como un lı́mite, podemos utilizar las propiedades de los
lı́mites para comprobar inmediatamente las siguientes propiedades acerca de la continuidad.

Sean f y g dos funciones continuas en un punto a, entonces también son continuas en a las siguientes funciones:

(1) Suma y diferencia: f ± g.

(2) Múltiplo escalar: λf , siendo λ un número real.

(3) Producto: f g.

(4) Cociente: f /g siempre que g(a) 6= 0.

Listamos a continuación algunos de los tipos más comunes de funciones continuas en todo punto de su dominio:

(1) Funciones polinómicas: p(x) = an xn + an−1 xn−1 + · · · + a1 x + a0

(2) Funciones racionales: r(x) = p(x)/q(x), si q(x) 6= 0.


p
(3) Funciones radicales: f (x) = n p(x), si p(x) > 0 cuando n es par.

Uno de los resultados que nos permitirá combinar las propiedades anteriores para probar la continuidad de funcio-
nes más complejas es el siguiente: “Si g es continua en c y f es continua en g(c) entonces la función compuesta
f ◦g es continua en c”.

Finalizamos esta sección con un teorema relativo al comportamiento de las funciones continuas en un intervalo
cerrado, cuya demostración hace uso de la ‘completitud’ de los números reales.

Teorema del valor intermedio: Si f es una función continua en [a, b] y k es cualquier valor entre f (a) y f (b),
entonces existe al menos un número c ∈ [a, b] tal que f (c) = k.

El teorema del valor intermedio es útil para localizar los ceros de una función continua en un intervalo cerrado.
Más concretamente, se tiene el siguiente resultado.
34 MATEM ÁTICAS

Teorema de Bolzano: Si f es una función en [a, b] y f (a), f (b) difieren de signo, entonces existe al menos un
número c ∈ [a, b] tal que f (c) = 0.

Es importante hacer notar que tanto en el teorema del valor intermedio como en el teorema de Bolzano es capital
que la función sea continua en el intervalo cerrado [a, b]. Pueden encontrarse ejemplos muy sencillos de funciones
discontinuas que no verifican los teoremas anteriores.

2.3. Lı́mites infinitos

En la sección previa donde hemos definido el concepto de lı́mite L de una función f en un punto a, sólo hemos
considerado el caso en que tanto a como L fuesen números reales. Sin embargo, es posible extender el concepto
de lı́mite a otros casos, en un cierto sentido que ahora pasamos a precisar.

2.3.1. Lı́mites infinitos cuando a es un número real

Se dice que f (x) crece sin tope cuando x tiende a a si para todo número real M siempre existe un intervalo I de
a tal que f (x) > M para todo punto x de I. Análogamente, se dice que f (x) decrece sin tope cuando x tiende a
a si para todo número real M siempre existe un intervalo I de a tal que f (x) < M para todo punto x de I.

Si f (x) crece sin tope cuando x tiende hacia a diremos que el lı́mite de f cuando x tiende a a es ∞ y escribiremos

lim f (x) = ∞.
x→a

Por el contrario, si f (x) decrece sin tope cuando x tiende hacia a diremos que el lı́mite de f cuando x tiende a a
es −∞ y escribiremos
lim f (x) = −∞.
x→a

El signo de igualdad en las expresiones anteriores no significa que exista un lı́mite, sino que nos dan una razón
por la que la función f no puede tener lı́mite en el punto a: porque no está acotada. Lo que de verdad se quiere
decir es que el lı́mite no existe y la función f tiene una discontinuidad no evitable (de salto infinito).

Los lı́mites infinitos por la izquierda y por la derecha se definen análogamente. Los cuatro posibles lı́mites laterales
son los siguientes:

(1) lim− f (x) = −∞,


x→a

(2) lim− f (x) = ∞,


x→a

(3) lim+ f (x) = −∞,


x→a

(4) lim+ f (x) = ∞.


x→a

Si alguno de los lı́mites laterales anteriores se satisface, decimos que f tiene en a una discontinuidad infinita.
En este caso, diremos que la recta x = a es una ası́ntota vertical de f . Uno de los ejemplos más tı́picos de
existencia de ası́ntotas verticales se da en las funciones racionales: “si f y g son funciones continuas en un
intervalo conteniendo a c, y se satisface f (c) 6= 0 y g(c) = 0, entonces la función racional r(x) = f (x)/g(x)
tiene una ası́ntota vertical en x = c”.
C ÁLCULO DIFERENCIAL 35

Terminamos esta sección con las siguientes propiedades de lı́mites infinitos. Si c, L son números reales y f , g son
funciones tales que
lim f (x) = ∞ y lim g(x) = L,
x→c x→c
entonces las siguientes propiedades se verifican:

(1) Suma y diferencia: lim [f ± g] = ∞.


x→c

(2) Múltiplo escalar: lim [λf ] = ∞, si λ > 0 y lim [λf ] = −∞, si λ < 0.
x→c x→c

(3) Producto: lim [f g] = ∞ si L > 0 y lim [f g] = −∞ si L < 0.


x→c x→c

(4) Cociente: lim [g/f ] = 0.


x→c

(Propiedades similares son válidas para lı́mites laterales y para funciones para las cuales el lı́mite de f (x) cuando
x tiende a c es −∞).

2.3.2. Lı́mites infinitos cuando L es un número real

Si f (x) tiende a L cuando x se hace arbitrariamente grande, entonces decimos que el lı́mite de f (x) cuando x
tiende a infinito es L, y escribimos
lim f (x) = L.
x→∞

Análogamente, si f (x) tiende a L cuando x se hace arbitrariamente pequeño, entonces decimos que el lı́mite de
f (x) cuando x tiende a menos infinito es L, y escribimos
lim f (x) = L.
x→−∞

En ambos casos se dice que la recta y = L es una ası́ntota horizontal de la función f . Uno de los ejemplos más
tı́picos de existencia de ası́ntotas horizontales se da en las funciones racionales: “si f y g son dos polinomios del
mismo grado, entonces la función racional r(x) = f (x)/g(x) tiene una ası́ntota horizontal en y = L, siendo L el
cociente entre los coeficientes principales de f y g”.

Terminamos esta sección con las siguientes propiedades de lı́mites infinitos. Si L1 , L2 son números reales y f , g
son funciones tales que
lim f (x) = L1 y lim g(x) = L2 ,
x→∞ x→∞
entonces las siguientes propiedades se verifican:

(1) Suma y diferencia: lim [f ± g] = L1 ± L2 .


x→∞

(2) Múltiplo escalar: lim [λf ] = λL1 .


x→∞

(3) Producto: lim [f g] = L1 L2 .


x→∞

(4) Cociente: lim [f /g] = L1 /L2 si L2 6= 0.


x→∞

(Propiedades similares son válidas para lı́mites de f (x) cuando x tiende a −∞).

Las propiedades anteriores también pueden ser válidas si L1 = ±∞ o L2 = ±∞ o ambas condiciones al mismo
tiempo. No obstante, existen ciertas restricciones con el fin de evitar las indeterminaciones: ∞ − ∞, 0.∞, ∞/∞,
etc.
36 MATEM ÁTICAS

2.4. Derivada de una función

El cálculo matemático nació y se fortaleció a raı́z de cuatro clásicos problemas sobre los que los matemáticos
europeos trabajaron durante el siglo XVII. Estos problemas son:

(1) El problema de la recta tangente.


(2) El problema de la velocidad y la aceleración.
(3) El problema de los máximos y mı́nimos.
(4) El problema del área.

En este capı́tulo abordaremos los tres primeros problemas, dejando el último para el capı́tulo siguiente. Cada uno
de los problemas anteriores requiere el concepto de lı́mite, ya introducido al comienzo del capı́tulo, y es por sı́
solo suficiente para motivar e introducir el cálculo.

La derivada de una función f en un punto a, que se denota por f 0 (a), se define como
f (x) − f (a) f (a + h) − f (a)
lim = lim ,
x→a x−a h→0 h
supuesto que tal lı́mite exista.

2.4.1. Interpretación geométrica: Recta tangente

Si consideramos los puntos del plano (x, f (x)) y (a, f (a)), entonces la recta que los une tiene una pendiente m
dada por
f (x) − f (a)
m= .
x−a
En consecuencia, f 0 (a) es el lı́mite de las pendientes de las rectas secantes que unen los puntos (x, f (x)) y
(a, f (a)), y por tanto constituye la pendiente de la recta tangente a f en a (ver Figura 2.1).

Utilizando la forma punto-pendiente para expresar la ecuación de una recta, podemos decir que si f 0 (a) existe
entonces la recta tangente a la curva y = f (x) en el punto (a, f (a)) viene dada por
y − f (a) = f 0 (a)(x − a).

Una función f definida en un intervalo abierto (a, b) se dice que es derivable (o diferenciable) si existe f 0 (c) en
todo punto c del intervalo. Si f es una función derivable entonces podemos definir otra función, denominada la
derivada de f y denotada por f 0 , por la siguiente fórmula:
f (x + h) − f (x)
f 0 (x) = lim .
h→0 h
El dominio de f 0 siempre es un subconjunto del dominio de f y una de las propiedades fundamentales de la
derivada queda recogida en el siguiente teorema: “si f es derivable en x = a entonces f es continua en x = a”.

De lo anterior se deduce que podemos definir un operador en el conjunto de las funciones derivables que asocia a
cada función f (x) su derivada f 0 (x). Dicho operador se denomina la derivada y se denota por
d
dx
d df
de manera que (f ) es una notación para indicar f 0 . Asimismo, otra notación para f 0 (a) es (a).
dx dx
C ÁLCULO DIFERENCIAL 37

y 6

f (x) − f (a)
)

f (a)
x−a

-
x
0 a x

Figura 2.1: Interpretación geométrica de la derivada.

2.4.2. Reglas de derivación

Aunque la noción de derivada se apoya en el concepto de lı́mite, no es conveniente calcular las derivadas recu-
rriendo a la definición, ya que los cálculos son engorrosos y en ocasiones difı́ciles de realizar. En esta sección
vamos a presentar una serie de reglas que nos permitirán hallar derivadas sin recurrir a la definición, de una forma
más sencilla.

Regla de la constante. La derivada de una constante c es cero:

d
[c] = 0.
dx

Regla de las potencias. Si n es un número racional,

d n
[x ] = nxn−1 .
dx

Regla del múltiplo constante. Si c es un número real,

d
[cf (x)] = cf 0 (x).
dx

Regla de la suma y diferencia. La derivada de una suma (o diferencia) de dos funciones derivables es la suma
(o diferencia) de sus derivadas:

d
[f (x) ± g(x)] = f 0 (x) ± g 0 (x).
dx

Regla del producto. El producto de dos funciones derivables es también derivable y su derivada viene dada por

d
[f (x)g(x)] = f 0 (x)g(x) + f (x)g 0 (x).
dx
38 MATEM ÁTICAS

Regla del cociente. El cociente de dos funciones derivables es también derivable y su derivada viene dada por
 
d f (x) f 0 (x)g(x) − f (x)g 0 (x)
= .
dx g(x) g(x)2

Regla de la cadena. La composición de dos funciones derivables es también derivable y su derivada viene dada
por
d
[f (g(x))] = f 0 (g(x))g 0 (x).
dx

2.4.3. Derivación implı́cita

En las secciones anteriores hemos visto cómo derivar funciones y = f (x). Sin embargo, en ocasiones las variables
x e y se hallan relacionadas por una ecuación F (x, y) = 0 que no permite despejar y en función de x. En estos
casos se utiliza la técnica de la derivación implı́cita, la cual presupone que la variable y es función de x.

Cuando queremos calcular dy/dx a partir de una ecuación F (x, y) = 0 debemos tener presente que estamos
derivando respecto de x. Por tanto, cuando derivemos términos en los que aparece y debemos utilizar la regla de
la cadena, ya que y está definida implı́citamente como una función de x.

El resultado de la derivación implı́cita dy/dx no suele ser una función que sólo depende de x, sino más bien una
nueva función que depende de x y de y.

2.4.4. Extremos (absolutos y relativos)

Sea f una función definida en un intervalo I conteniendo un punto a. Entonces f (a) es el mı́nimo de f en I si
f (a) 6 f (x) para todo x en I. Análogamente, f (a) es el máximo de f en I si f (a) > f (x) para todo x en I. En
ocasiones, el máximo y el mı́nimo de una función f se denominan el máximo absoluto y el mı́nimo absoluto en
ese intervalo, respectivamente (ver Figura 2.2).

Si el intervalo I es abierto, entonces f no tiene por qué tener un máximo o un mı́nimo en dicho intervalo. Sin
embargo, si I es un intervalo cerrado [a, b], entonces f tiene un máximo M y un mı́nimo m (teorema del valor
extremo).

A veces no interesa tanto el comportamiento global de la función como el comportamiento local, es decir, el com-
portamiento en intervalos pequeños. En este caso, las definiciones anteriores pueden ser ligeramente modificadas
en el siguiente sentido.

f (a) es un mı́nimo relativo de f si f (a) 6 f (x) para todo x en un intervalo abierto I conteniendo a a.
Análogamente, f (a) es un máximo relativo de f si f (a) > f (x) para todo x en un intervalo abierto I con-
teniendo a a (ver Figura 2.2).

¿Cómo podemos utilizar el cálculo para la determinación de los extremos relativos de una función? Para ello
necesitamos introducir el concepto de punto crı́tico. Si f está definida en a, se dice que a es punto crı́tico de f si
f 0 (a) = 0. Por convenio, todos los puntos que no pertenecen al dominio de f 0 son crı́ticos.

La primera aproximación nos la da el teorema de Fermat, que dice lo siguiente: “Si f tiene un extremo relativo
en a entonces f 0 (a) = 0”. Como consecuencia de lo anterior, los extremos relativos de una función sólo pueden
aparecer en los puntos crı́ticos, lo que justifica la siguiente guı́a para determinar los extremos de una función en
un intervalo cerrado:
C ÁLCULO DIFERENCIAL 39

y 6

y = f (x)

-
0 a b c d e x

Figura 2.2: Máximos y mı́nimos de una función.

(1) Determinar los puntos crı́ticos de f .

(2) Evaluar f en sus puntos crı́ticos.

(3) Calcular f (a) y f (b).

(4) El menor de los valores anteriores es el mı́nimo; el mayor es el máximo.

2.4.5. Teoremas de Rolle y del valor medio

El teorema del valor extremo discutido anteriormente garantiza la existencia de extremos absolutos en las funcio-
nes continuas definidas en un intervalo cerrado, pero no sabemos si estos extremos se alcanzan en los extremos
del intervalo o en el interior. El siguiente teorema garantiza la existencia de extremos en el interior del intervalo.

Teorema de Rolle. Sea f una función continua en un intervalo cerrado [a, b] y derivable en el intervalo abierto
(a, b) tal que f (a) = f (b). Entonces existe un punto c ∈ (a, b) tal que f 0 (c) = 0.

Debemos hacer notar que todas las hipótesis son imprescindibles. Si f no es derivable en (a, b) o f (a) 6= f (b)
entonces podemos encontrar ejemplos de funciones que no satisfacen el teorema de Rolle.

Como una generalización del teorema anterior tenemos el siguiente resultado.

Teorema del valor medio. Sea f una función continua en un intervalo cerrado [a, b] y derivable en el intervalo
abierto (a, b). Entonces existe un punto c ∈ (a, b) tal que

f (b) − f (a)
f 0 (c) = .
b−a

Geométricamente, el teorema anterior nos dice que, en las hipótesis del teorema, siempre existe un punto c tal
que la recta tangente a la curva y = f (x) en c tiene la misma pendiente que la recta secante que une los puntos
(a, f (a)) y (b, f (b)).
40 MATEM ÁTICAS

El teorema del valor medio es uno de los resultados básicos del cálculo, fundamentalmente por su utilización en
la demostración de muchos otros resultados. Una de las consecuencias más bonitas es la siguiente: “Si f 0 (x) = 0
para todo punto x ∈ (a, b) entonces f es constante en (a, b)”.

2.4.6. Funciones crecientes y decrecientes

Una función f es (estrictamente) creciente en un intervalo I si para todo par de puntos x1 y x2 en I tales
que x1 < x2 se satisface f (x1 ) < f (x2 ). Análogamente, una función f es (estrictamente) decreciente en un
intervalo I si para todo par de puntos x1 y x2 en I tales que x1 < x2 se satisface f (x1 ) > f (x2 ).

Si la función f es derivable, podemos utilizar el signo de la derivada f 0 (x) para saber si una función es creciente
o decreciente:

(1) Si f 0 (x) > 0 para todo x en (a, b) entonces f es creciente en (a, b).

(2) Si f 0 (x) < 0 para todo x en (a, b) entonces f es decreciente en (a, b).

(3) Si f 0 (x) = 0 para todo x en (a, b) entonces f es constante en (a, b).

Figura 2.3: Crecimiento y decrecimiento de una función.

Las anteriores propiedades nos permiten elaborar la siguiente guı́a para determinar los intervalos donde una fun-
ción derivable es creciente o decreciente.

(1) Localizar los puntos crı́ticos de f

(2) Determinar el signo de f 0 en cada uno de los intervalos determinados por dos puntos crı́ticos consecutivos.

(3) Utilizar las propiedades anteriores para cada uno de los intervalos obtenidos.

Una vez determinados los intervalos de crecimiento y decrecimiento de una función f es muy fácil determinar si
los puntos crı́ticos obtenidos son máximos o mı́nimos relativos, según las siguientes reglas (ver Figura 2.3):

(1) Si f 0 cambia de negativa a positiva en c entonces f (c) es un mı́nimo relativo de f .

(2) Si f 0 cambia de positiva a negativa en c entonces f (c) es un máximo relativo de f .

(3) Si f 0 no cambia de signo en c entonces f (c) no es ni máximo ni mı́nimo relativo.


C ÁLCULO DIFERENCIAL 41

2.4.7. Concavidad y puntos de inflexión

Si f es una función derivable en un intervalo abierto (a, b), se dice que la gráfica de f es cóncava hacia arriba
si f 0 es creciente en dicho intervalo, y cóncava hacia abajo si f 0 es decreciente en dicho intervalo. Observemos
que las definiciones anteriores significan que la gráfica de f se encuentra por arriba (resp. abajo) de todas sus
tangentes.

En ocasiones se utilizan los términos cóncava y convexa para las gráficas que son cóncavas hacia arriba y cóncavas
hacia abajo, respectivamente.

y 6
y 6

- -
0 x 0 x

Figura 2.4: Concavidad de una función.

La determinación de los intervalos de concavidad (hacia arriba y hacia abajo) puede obtenerse teniendo en cuenta
el signo de la derivada segunda, según la siguiente propiedad:

(1) Si f 00 (x) > 0 para todo x en (a, b) entonces la gráfica de f es cóncava hacia arriba.

(2) Si f 00 (x) < 0 para todo x en (a, b) entonces la gráfica de f es cóncava hacia abajo.

(3) Si f 00 (x) = 0 para todo x en (a, b) entonces f es una función lineal.

Un punto (c, f (c)) se dice que es un punto de inflexión de una curva y = f (x) si la gráfica de f cambia de
cóncava hacia arriba a cóncava hacia abajo, o viceversa, en dicho punto.

Como consecuencia de la definición, la recta tangente a la curva y = f (x) en el punto de inflexión corta a la
gráfica de f . Además, si (c, f (c)) es un punto de inflexión de la gráfica de f entonces f 00 (c) = 0 o f 00 no está
definida en x = c.

Finalizamos esta sección con el criterio de la derivada segunda para la determinación de los extremos relativos. El
criterio se basa en que en que si f 0 (c) = 0 y existe un intervalo de c donde la gráfica de f es cóncava hacia abajo
entonces f (c) es un máximo de f ; por el contrario, si la gráfica de f es cóncava hacia arriba entonces f (c) es un
mı́nimo de f .

(1) Si f 00 (c) > 0 entonces f (c) es un mı́nimo relativo.

(2) Si f 00 (c) < 0 entonces f (c) es un máximo relativo.

(3) Si f 00 (c) = 0 entonces el criterio no decide.


42 MATEM ÁTICAS

2.4.8. Representación de funciones

Para realizar correctamente la gráfica de una función f es conveniente seguir los pasos que a continuación se
indican:

• Dominio
• Intersecciones con los ejes
• Simetrı́as
• Puntos de discontinuidad
• Ası́ntotas verticales
• Ası́ntotas horizontales
• Crecimiento y decrecimiento
• Extremos relativos
• Concavidad y puntos de inflexión

En ocasiones no es necesario calcular todos los apartados anteriores. Suelen ser imprescindibles el dominio, las
ası́ntotas (horizontales y verticales) y los siguientes puntos: de intersección con los ejes, extremos relativos y de
inflexión.

2.5. Teorema de Taylor

2.5.1. Sucesiones y lı́mites de sucesiones

Una sucesión {an } es una función cuyo dominio es el conjunto de los números naturales (o enteros positivos: 1,
2, 3, . . . ). Los valores a1 , a2 , . . . se llaman los términos de la sucesión.

2.5.1.1. Lı́mites de sucesiones

Es posible que conforme vaya aumentando el valor de n los correspondientes números an se vayan aproximando
a un número fijo L. Si esto ocurre, se dice que la sucesión es convergente y su lı́mite es L:

lim an = L
n→∞

En caso contrario diremos que la sucesión es divergente. La definición rigurosa es la siguiente:

La sucesión {an } es convergente con lı́mite L si para todo número  > 0 existe M > 0 tal que |an − L| < 
siempre que n > M .

A veces es más fácil calcular el lı́mite de una función que el de una sucesión y esto puede permitirnos, aunque no
lo parezca, resolver lı́mites de sucesiones. El siguiente resultado nos ofrece la clave.
C ÁLCULO DIFERENCIAL 43

Sea f una función de una variable real tal que lim f (x) = L. Si {an } es una sucesión tal que an = f (n)
x→∞
entonces
lim an = L.
n→∞

Los lı́mites de sucesiones satisfacen propiedades similares a los lı́mites de funciones, ya descritos en una sección
anterior. Los recordamos aquı́. Sean {an } y {bn } dos sucesiones tales que

lim an = L y lim bn = K.
n→∞ n→∞

Entonces:

(1) lim (an ± bn ) = L ± K.


n→∞

(2) lim (can ) = cL.


n→∞

(3) lim (an bn ) = LK.


n→∞

(4) lim (an /bn ) = L/K, si bn 6= 0 y K 6= 0.


n→∞

Otras propiedades importantes de los lı́mites de sucesiones son las siguientes.

(1) Si lim an = L = lim bn y existe un entero N tal que an 6 cn 6 bn para todo n > N entonces
n→∞ n→∞

lim cn = L.
n→∞

(2) Si lim |an | = 0 entonces lim an = 0.


n→∞ n→∞

2.5.1.2. Tipos de sucesiones

Una sucesión {an } se dice monótona si sus términos son no decrecientes

a1 6 a2 6 a 3 6 · · · 6 an 6 · · ·

o no crecientes
a 1 > a2 > a3 > · · · > an > · · ·

Una sucesión {an } se dice acotada si existe un número real positivo M tal que |an | 6 M para todo n. El número
M se denomina cota (superior) de la sucesión.

Uno de los principales resultados acerca de sucesiones acotadas y convergentes es el siguiente: “Toda sucesión
monótona y acotada es convergente ”.
44 MATEM ÁTICAS

2.5.2. Polinomios de Taylor y aproximación

El objetivo fundamental de esta sección es mostrar cómo se pueden utilizar polinomios para aproximar otras
funciones. Para ello, lo primero que debemos hacer es fijar un punto c alrededor del cual vamos a realizar la
aproximación. Este punto c es el centro de la aproximación y el objetivo es encontrar el polinomio (de un cierto
grado predeterminado) que mejor se aproxima (en un cierto sentido) a la función f en un entorno del punto c.

Si f tiene n derivadas en c, el polinomio

f 00 (c) f (n) (c)


Pn (x) = f (c) + f 0 (c)(x − c) + (x − c)2 + · · · + (x − c)n
2! n!
se denomina el n-ésimo polinomio de Taylor de f centrado en c. Si c = 0, entonces el polinomio anterior se
denomina el n-ésimo polinomio de Maclaurin de f .

Cualquier método de aproximación tiene una utilidad relativa (más bien poca) si se desconoce el error que se
comete. Para medir la precisión al aproximar un valor f (x) por el polinomio de Taylor Pn (x) descomponemos
f (x) = Pn (x) + Rn (x), donde Rn (x) es el resto. El error cometido en la aproximación es el valor absoluto del
resto, es decir,
error = |Rn (x)| = |f (x) − Pn (x)|.

El siguiente teorema estima el error anterior.

Teorema de Taylor. Si una función f es derivable hasta el orden n + 1 en un intervalo (a, b) conteniendo a c,
entonces para todo x en (a, b) existe un número z entre x y c tal que

f (n+1) (z)
f (x) = Pn (x) + Rn (x), Rn (x) = (x − c)n+1 .
(n + 1)!

La expresión anterior de Rn (x) se denomina forma de Lagrange para el resto. A la hora de utilizar el teorema
anterior no se trata de encontrar explı́citamente el valor de z si no más bien encontrar cotas para f (n+1) (z), que
nos darán una idea más o menos precisa del tamaño del resto.

2.5.3. Series de potencias: coeficientes y radio de convergencia

Una serie de potencias es una serie infinita de la forma



X
a n xn = a 0 + a 1 x + a 2 x2 + a 3 x3 + · · · + a n xn + · · ·
n=0

donde x denota una variable. De forma general, una serie de potencias centrada en c es una serie infinita de la
forma
X∞
an (x − c)n = a0 + a1 (x − c) + a2 (x − c)2 + a3 (x − c)3 + · · · + an (x − c)n + · · ·
n=0

Los números {an } se denominan los coeficientes de la serie.

Para una serie de potencias centrada en c ha de ocurrir exactamente una de las tres posibilidades siguientes:

1. La serie converge sólo en c.


2. Existe un número real R > 0 tal que la serie converge (absolutamente) si |x−c| < R y diverge si |x−c| > R.
C ÁLCULO DIFERENCIAL 45

3. La serie converge para todo x.

El número R se llama radio de convergencia de la serie de potencias. Si la serie converge sólo en c diremos que
el radio de convergencia es cero, y si la serie es convergente para todo x diremos que el radio de convergencia es
infinito. El conjunto de valores x donde la serie es convergente se denomina el intervalo de convergencia de la
serie de potencias.

2.5.4. Operaciones con series de potencias

Las operaciones básicas con series de potencias son las siguientes. Sean

X ∞
X
f (x) = a n xn y g(x) = bn xn
n=0 n=0
dos series de potencias. Entonces:


X
(1) f (kx) = a n k n xn
n=0

X
(2) f (xm ) = an xnm
n=0

X
(3) f (x) ± g(x) = (an ± bn )xn
n=0

!
X X
n
(4) f (x)g(x) = am bn−m xn
n=0 m=0

2.5.5. Series de Taylor y de Maclaurin

P
Si f (x) = ∞ n=0 an (x − c) es una serie de potencias (convergente) entonces los coeficientes {an } de la serie
n

quedan determinados por


f (n) (c)
an = .
n!
Como consecuencia, si una función f (x) admite un desarrollo en serie de potencias, tal desarrollo tiene que ser
necesariamente el siguiente:
X∞
f (n) (c)
(x − c)n .
n=0
n!
La serie anterior se denomina serie de Taylor en c. Cuando c = 0, tal serie se conoce con el nombre de serie de
Maclaurin de f .

Una función f (x) se dice que es analı́tica si coincide con su serie de potencias en todos los puntos del dominio,
es decir, si
X∞
f (n) (c)
f (x) = (x − c)n .
n=0
n!

Algunas de las series de potencias asociadas a funciones elementales aparecen recogidas en la Tabla 2.1, junto con
los intervalos de convergencia.
46 MATEM ÁTICAS

Función Serie Intervalo


X
1
(−1)n xn −1 < x < 1
1+x n=0
X∞
(−1)n−1
ln(x) (x − 1)n 0<x62
n=1
n
X∞
xn
ex −∞ < x < ∞
n=0
n!
X∞
(−1)n x2n+1
sin(x) −∞ < x < ∞
n=0
(2n + 1)!
X∞
(−1)n x2n
cos(x) −∞ < x < ∞
n=0
(2n)!

Tabla 2.1: Series de potencias asociadas a algunas de las funciones m ás usuales.

2.6. Cálculo Numérico

2.6.1. Métodos numéricos de resolución de ecuaciones

Uno de los problemas más básicos del análisis numérico consiste en encontrar los valores x que satisfacen una de-
terminada ecuación f (x) = 0, para una función f dada. Este problema, conocido como el problema de búsqueda
de raı́ces, no es un problema trivial y prueba de ello es que sigue estando de plena actualidad. La dificultad no es-
triba en encontrar métodos para obtener soluciones, sino encontrar métodos que permitan encontrar las soluciones
en un “tiempo razonable”. En esta sección vamos a discutir tres métodos: el algoritmo de bisección, el método de
iteración del punto fijo y el método de Newton-Raphson.

2.6.1.1. Algoritmo de bisección

La justificación teórica de este método debemos buscarla en el teorema de Bolzano: si f es una función continua
en [a, b] con signos opuestos en los extremos (es decir, f (a)f (b) < 0), entonces existe un cero de f en (a, b).

El algoritmo de bisección o método de búsqueda binaria puede describirse como sigue. Comenzamos definien-
do a1 = a y b1 = b, y sea p1 el punto medio del intervalo (a1 , b1 ). Si f (p1 ) = 0, ya hemos encontrado el cero.
De lo contrario, f (p1 ) 6= 0 y entonces puede suceder una de las dos afirmaciones siguientes:

1. f (p1 )f (a1 ) < 0. En este caso tomamos a2 = a1 y b2 = p1 .

2. f (p1 )f (b1 ) < 0. En este caso tomamos a2 = p1 y b2 = b1 .

Ahora repetimos el proceso anterior al intervalo [a2 , b2 ].


C ÁLCULO DIFERENCIAL 47

y6
f (b) (b, f (b))

-
a p1 p2 b x

f (a)
(a, f (a))

Figura 2.5: Algoritmo de bisección.

Observemos que en cada etapa la longitud del intervalo resultante es la mitad de la longitud del intervalo prece-
dente, por lo que
1 1
L([an , bn ]) = n L([a, b]) = n (b − a)
2 2
Esto significa que, siempre que se verifiquen las condiciones del teorema de Bolzano, el método proporciona una
solución, ya que la sucesión {pn } es de Cauchy y, por tanto, convergente.

No obstante, en la práctica no se suele encontrar el valor exacto de la solución por lo que conviene introducir algún
mecanismo de paro. Algunos de los mecanismos de paro más usuales son:

(1) Fijar un número máximo n0 de iteraciones.

(2) Seguir hasta que |pn − pn−1 | < .


|pn − pn−1 |
(3) Seguir hasta que <  con pn 6= 0. Este mecanismo es el mejor criterio de paro, ya que mide el
|pn |
error relativo.

(4) Seguir hasta que |f (pn )| < .

2.6.1.2. Método de iteración del punto fijo

Un punto fijo de una función g es un punto a tal que g(a) = a. Dada una función f , podemos considerar
la función g(x) = x ± f (x), de forma que a es un cero de f si y sólo si a es punto fijo de g. Por tanto, la
determinación de puntos fijos puede ayudar a la determinación de raı́ces.

En este punto surge un problema: ¿todas las funciones tienen puntos fijos? Si la respuesta es negativa, entonces
¿qué condiciones debe satisfacer una función para que tenga puntos fijos?

Condiciones para la existencia de puntos fijos. Si g es una función continua definida en [a, b] y con valores en el
mismo intervalo, entonces g tiene un punto fijo. Si además g es derivable en (a, b) y satisface |g 0 (x)| 6 k < 1 en
(a, b) entonces sólo existe un punto fijo.

Si g es una función que satisface el resultado anterior y p0 es un punto cualquiera del intervalo [a, b] entonces la
sucesión
pn = g(pn−1 )
48 MATEM ÁTICAS

y=x
y 6

g(p) = p
y = g(x)
a
-

p x
a b

Figura 2.6: Método de iteración del punto fijo.

converge al único punto fijo p de g en [a, b]. Además, una cota para el error cometido si se utiliza pn para aproximar
a p viene dada por
|pn − p| 6 kn max{p0 − a, b − p0 }.

2.6.1.3. Método de Newton-Raphson

Este método, también conocido sólo como método de Newton, es uno de los algoritmos más conocidos y poderosos
en la resolución de ecuaciones f (x) = 0. La idea del método es construir una sucesión de puntos que se aproximan
a la solución utilizando para ello las rectas tangentes a la función f .

y y = f (x)
6


p
p0 p2 -

p1 x
0 •

Figura 2.7: Esquema del método de Newton.

La justificación teórica del método es la siguiente. Sea p el punto fijo y consideremos un punto y próximo a p que
no es una raı́z de f 0 , es decir, f 0 (y) 6= 0. Utilizando el polinomio de Taylor de grado 1 para la función f alrededor
del punto y obtenemos
f 00 (z)
f (x) = f (y) + f 0 (y)(x − y) + (x − y)2 ,
2
donde z es un número entre x e y. Particularizando la ecuación anterior en x = p obtenemos

f 00 (z)
0 = f (y) + f 0 (y)(p − y) + (p − y)2 .
2
C ÁLCULO DIFERENCIAL 49

Si suponemos que |p − y| es pequeño, entonces (p − y)2 es despreciable frente a |p − y| por lo que la ecuación
anterior queda 0 ≈ f (y) + f 0 (y)(p − y). Despejando p es esta ecuación se obtiene

f (y)
p≈y− ,
f 0 (y)

lo que es una aproximación mejor a p que y. El método de Newton consiste en considerar la sucesión de puntos

f (pn−1 )
pn = pn−1 − , n > 1.
f 0 (pn−1 )

En consecuencia, el método no puede seguir aplicándose cuando f 0 (pn−1 ) = 0 para algún n.

2.6.2. Interpolación polinómica

El problema de la interpolación polinómica consiste en determinar el polinomio de menor grado que pasa por
n + 1 puntos (x0 , y0 ), . . . , (xn , yn ) prefijados. El grado de dicho polinomio es a lo más n.

2.6.2.1. Polinomio de interpolación de Lagrange

Si (x0 , y0 ), . . . , (xn , yn ) son n + 1 pares de puntos tales que sus abcisas x0 , x1 , . . . , xn son todas distintas,
entonces existe un único polinomio P , denominado polinomio interpolante de Lagrange, de grado a lo más n
con la propiedad de que
P (xk ) = yk , k = 0, 1, . . . , n.
Este polinomio está dado por

X
n
P (x) = y0 Ln,0 (x) + y1 Ln,1 (x) + . . . + yn Ln,n (x) = yk Ln,k (x)
k=0

donde
Y
n
(x − xi )
Ln,k (x) = .
(xk − xi )
i=0,i6=k

Una pregunta importante en análisis numérico es la referida al error cometido cuando se realiza una aproximación.
En este caso, el término residual o cota de error cometido en la aproximación de una función por su polinomio
interpolante viene dado en el siguiente resultado.

Cota de error. Sea f una función suficientemente derivable en el intervalo [a, b] y consideremos (x0 , y0 ), . . . ,
(xn , yn ) n + 1 pares de puntos tales que yk = f (xk ) para todo k = 0, 1, . . . , n. Entonces

f (n+1) (z)
f (x) = P (x) + (x − x0 )(x − x1 ) · · · (x − xn ),
(n + 1)!

con z ∈ (a, b), donde P es el polinomio interpolante de Lagrange.

Observemos la similitud existente entre el resto en la aproximación anterior y el resto en el polinomio de Taylor
estudiado anteriormente.
50 MATEM ÁTICAS

Ln,k (x)

- x
x0 x1 
xk xk+1 
xn
xk−1 xn−1

Figura 2.8: Polinomio interpolante de Lagrange.

2.6.2.2. Método de interpolación iterada

El método descrito en la sección anterior para calcular el polinomio interpolante es muy complicado y poco
práctico. En primer lugar, la precisión del polinomio no se puede determinar hasta que los cálculos han sido
completados. En segundo lugar, los cálculos realizados para la obtención de unos polinomios interpolantes no
se pueden utilizar para calcular los polinomios interpolantes de grados superiores: siempre es necesario partir de
cero. En esta sección vamos a describir un método que permite aprovechar el trabajo realizado. La justificación
teórica del método es el siguiente resultado.

Sea f una función definida en x0 , x1 , . . . , xn y supongamos que m1 , m2 , . . . , mk son k enteros distintos con
0 6 mi 6 n para cada i. El polinomio de Lagrange de grado menor que k que coincide con f en xm1 , xm2 , . . . ,
xmk se denota por Pm1 ,m2 ,...,mk . Si xj , xi son dos números distintos y
(x − xj )P0,1,...,j−1,j+1,...,k (x) − (x − xi )P0,1,...,i−1,i+1,...,k (x)
P (x) =
(xi − xj )
entonces P es el polinomio interpolante de Lagrange de grado menor o igual que k que interpola a f en x0 , x1 ,
. . . , xk .

2.6.2.3. Método de diferencias divididas

Los métodos que nos permiten representar explı́citamente el polinomio interpolante a partir de datos tabulados se
conocen con el nombre de métodos de diferencias divididas. Sean x0 , x1 , . . . , xn puntos distintos y considere-
mos Pn el polinomio de Lagrange que interpola a f en dichos puntos. Entonces existen constantes apropiadas a0 ,
a1 , . . . , an tales que

Pn (x) = a0 + a1 (x − x0 ) + a2 (x − x0 )(x − x1 ) + · · · + an (x − x0 ) · · · (x − xn−1 ).

Tales constantes pueden determinarse de la siguiente manera. En primer lugar, a0 = Pn (x0 ) = f (x0 ). Si ahora
evaluamos en x1 se obtiene f (x0 ) + a1 (x1 − x0 ) = Pn (x1 ) = f (x1 ) de donde
f (x1 ) − f (x0 )
a1 = .
x1 − x0
C ÁLCULO DIFERENCIAL 51

Para determinar el resto de constantes vamos a introducir la siguiente notación.

f [xi ] = f (xi ),
f [xi+1 ] − f [xi ]
f [xi , xi+1 ] = ,
xi+1 − xi
..
.
f [xi+1 , . . . , xi+k ] − f [xi , . . . , xi+k−1 ]
f [xi , xi+1 , . . . , xi+k−1 , xi+k ] =
xi+k − xi

Ahora es un mero ejercicio de manipulación algebraica deducir que

ak = f [x0 , x1 , . . . , xk ], k = 0, 1, . . . , n.

3. ACTIVIDADES DE APLICACIÓN DE LOS CONOCIMIENTOS

2
A.2.1. Hallar la ecuación de la recta tangente a la curva y = 32x +1
en el punto (0, 3).

A.2.2. Dada la parábola de ecuación y = x2 − 8x + 12, determinar el punto donde la tangente es paralela al eje
de abscisas.

A.2.3. Escribir la ecuación de la recta tangente a la hipérbola xy = 1 en el punto de abscisa x = 3.

A.2.4. ¿En qué punto de la gráfica de la función f (x) = x2 − 6x + 8 la tangente es paralela al eje de abscisas?

A.2.5. Determinar los puntos de la curva y = x3 + 9x2 − 9x + 15 en los cuales la tangente es paralela a la recta
y = 12x + 5.

A.2.6. Determinar los puntos de la curva y = x4 − 7x3 + 13x2 + x + 1 que tienen la tangente formando un ángulo
de π/4 radianes con el eje de abcisas.

A.2.7. Probar que la recta tangente a la curva f (x) = log2 (x) en el punto (a, f (a)) se traza uniéndolo con el
punto (0, f (a) − 2 log a).

A.2.8. Obtener las ecuaciones de la rectas tangente y normal a la curva y = x3 en los puntos (1, 2) y (2, 8).

A.2.9. Obtener las ecuaciones de la rectas tangente y normal a la curva y = (x + 1)(3 − x)1/3 en el punto (2, 3).

A.2.10. La curva dada por y = x2 + ax + b pasa por el punto (−2, 1) y alcanza un extremo relativo en x = −3.
Hallar a y b.

A.2.11. Hallar a, b, c y d para que la curva dada por y = ax3 +bx2 +cx+d tenga un máximo en el punto (−2, 21)
y un mı́nimo en el punto (−1, 6).

A.2.12. Hallar dos números cuya suma sea 20 y su producto el mayor posible.

A.2.13. Descomponer el número 25 en dos sumandos tales que el doble del cuadrado del primero más el triple
del cuadrado del segundo sea mı́nimo.

A.2.14. Calcular las dimensiones del mayor rectángulo cuyo perı́metro es 40 metros.

A.2.15. Demostrar que la suma de un número real positivo no nulo y su inverso es mayor o igual que 2.

A.2.16. Hallar dos números cuya suma es 18, sabiendo que el producto del uno por el cuadrado del otro ha de ser
máximo.

A.2.17. Hallar las dimensiones de un campo rectangular de 3600 metros cuadrados de superficie para poderlo
cercar mediante una valla de longitud mı́nima.
52 MATEM ÁTICAS

A.2.18. Se quiere vallar un campo rectangular que está junto a un camino. Si la valla del lado del camino cuesta
800 pesetas/metro y la de los otros lados cuesta 100 pesetas/metro, hallar el área del mayor campo que se
puede cercar con 288000 pesetas.

A.2.19. Un jardinero ha de construir un parterre en forma de sector circular con perı́metro de 20 metros. ¿Cuál
será el radio que da el parterre de área máxima? ¿Cuál será la amplitud en radianes del sector?

A.2.20. Los barriles que se utilizan para almacenar petróleo tienen forma cilı́ndrica y una capacidad de 160 litros.
Hallar las dimensiones del barril para que la chapa empleada en su construcción sea mı́nima.

A.2.21. De todos los triángulos isósceles de 12 metros de perı́metro, hallar las dimensiones del que tenga área
máxima.

A.2.22. Entre todos los rectángulos inscritos en una circunferencia de 12 metros de radio, hallar las dimensiones
del que tenga área máxima.

A.2.23. Averiguar cómo ha de ser un triángulo isósceles de área máxima inscrito en una circunferencia de radio
r.

A.2.24. Entre todos los cilindros rectos de volumen fijo V , hallar el de menor superficie.

A.2.25. Una hoja de papel debe contener 18 centı́metros cuadrados de texto impreso. Los márgenes superior e
inferior deben tener 2 centı́metros cada uno y los laterales 1 centı́metro. Calcular las dimensiones de la hoja
para que el gasto de papel sea mı́nimo.

A.2.26. Hallar los puntos de la curva y 2 = 6x cuya distancia al punto (4, 0) sea mı́nima.

A.2.27. Determinar la distancia mı́nima del origen a la curva xy = 1.

A.2.28. Determinar las dimensiones de una piscina no cubierta de volumen 32 m3 con un fondo cuadrado, de
manera que la superficie de sus paredes y del suelo necesiten la mı́nima cantidad de material.

A.2.29. De una lámina cuadrada de 10dm de lado se cortan cuadrados en cada uno de los vértices con el objeto
de hacer una caja abierta por arriba. Calcular el lado del cuadrado que se debe cortar para que el volumen
de la caja sea máximo.

A.2.30. Las agujas de un reloj miden 4 y 6cm. Uniendo sus extremos se forma un triángulo. Determinar el
instante entre las 12h y las 12h30m en el cual el área del triángulo es máxima.

A.2.31. La tangente en un punto a una curva es paralela al eje horizontal. ¿Qué puede decirse de su inclinación?
¿Y de su pendiente? ¿Y de la derivada de la curva en ese punto?

A.2.32. a) Calcular el polinomio de Taylor de tercer grado alrededor de x0 = 0 para f (x) = (1 + x)1/2 .

b) Usar el polinomio de la parte (a) para aproximar 1.1.

A.2.33. Con el polinomio de Taylor de tercer grado P3 (x) obtenido en el ejercicio anterior, aproximar f (0.1),
f (0.5), f (1), f (2) y f (10). Calcular el error cometido en cada caso.

A.2.34. Encontrar el polinomio de Taylor de grado 2 para f (x) = x2 − 3 alrededor del punto
a) x0 = 1.
b) x0 = 0.

A.2.35. Obtener el polinomio de Taylor de tercer grado para f (x) = (1 + x)−2 alrededor de x0 = 0, y usar este
polinomio para aproximar f (0.05).

A.2.36. Sea f (x) = ln(1 + x). Encontrar el polinomio de Taylor de grado 4 para f alrededor de x0 = 0, y usarlo
para aproximar ln(1.1).

A.2.37. Usando los números, o nodos, x0 = 2, x1 = 2.5 y x2 = 4, calcular el polinomio interpolante de Lagrange
de segundo grado para la función f (x) = 1/x. Usar dicho polinomio para calcular el valor de f (3) y obtener
el error cometido.
C ÁLCULO DIFERENCIAL 53

A.2.38. Usar los polinomios interpolantes de Lagrange apropiados, de grado uno, dos, tres y cuatro, para aproxi-
mar

(a) f (2.5) si
f (2) = 0.5103757, f (2.2) = 0.5207843, f (2.4) = 0.5104147,
f (2.6) = 0.4813306, f (2.8) = 0.435916.
(b) f (0) si
f (−0.3) = −0.20431, f (−0.1) = −0.08993, f (0.1) = 0.11007,
f (0.3) = 0.39569, f (0.5) = 0.79845.
(c) f (1.25) si
f (1) = 0.24255, f (1.1) = 0.48603, f (1.2) = 0.8616, f (1.3) = 1.59751, f (1.4) = 3.76155.
(d) f (0.5) si
f (0.2) = 0.9798652, f (0.4) = 0.917771, f (0.6) = 0.8080348,
f (0.8) = 0.6386093, f (1) = 0.3843735.
(e) f (0.2) si
f (0.1) = 1.2314028, f (0.3) = 1.9121188, f (0.4) = 2.3855409,
f (0.5) = 2.9682818, f (0.6) = 3.6801169.

A.2.39. Usar los valores siguientes para construir un polinomio de Lagrange de grado dos o menor. Encontrar
una aproximación para sen(0.34).
sen 0.3 = 0.29552 sen 0.32 = 0.31457 sen 0.35 = 0.3429

A.2.40. Agregar el valor sen 0.33 = 0.32402 a los datos del ejercicio anterior y construir un polinomio de La-
grange de grado tres o menor. Aproximar sen 0.34.

A.2.41. Usar los valores siguientes para construir una aproximación polinómica de Lagrange de tercer grado para
f (1.09). La función que se está aproximando es f (x) = log10 tan(x).
f (1) = 0.1924 f (1.05) = 0.2414 f (1.1) = 0.2933 f (1.15) = 0.3492

A.2.42. Usar el polinomio interpolante de Lagrange de grado tres o menor para aproximar cos 0.75 usando los
siguientes valores:
cos 0.698 = 0.7661 cos 0.733 = 0.7432
cos 0.768 = 0.7193 cos 0.803 = 0.6946

A.2.43. La función f (x) = x3 + 4x2 − 10 tiene una raı́z en [1, 2]. Utilizar el algoritmo de bisección (10 etapas)
para calcular una aproximación de la raı́z. Calcular el error sabiendo que la raı́z exacta, con nueve cifras
decimales, es p = 1.365230013.

A.2.44. Demostrar que f (x) = x3 − x − 1 tiene exactamente un cero en el intervalo [1, 2]. Aproximar el cero con
0.01 de precisión usando el algoritmo de bisección.

A.2.45. Usar el algoritmo de bisección para encontrar soluciones con una exactitud de 0.01 para x4 − 2x3 − 4x2 +
4x + 4 = 0 en
(a) [−2, 0]
(b) [0, 2]
(c) [1, 2].

A.2.46. Usar el algoritmo de bisección para encontrar una solución con una exactitud de 0.01 para x = tan x en
[4, 4.5].

A.2.47. Usar el algoritmo de bisección para encontrar todas las soluciones de x3 − 7x2 + 14x − 6 = 0 con una
precisión de 0.001.

A.2.48. Usar el método de iteración del punto fijo para determinar una solución exacta a 0.01 para 2 sen πx + x =
0 en [1, 2]. Tomar p0 = 1.

A.2.49. Resolver x3 − x − 1 = 0 para la raı́z en [1, 2] usando el método de iteración del punto fijo. Obtener una
aproximación a la raı́z exacta a 0.01.
54 MATEM ÁTICAS

A.2.50. Usar el método de iteración del punto fijo para determinar una solución exacta a 0.001 de x = tan x en
[4, 5].

A.2.51. Aproximar con 0.01 de precisión las raı́ces de las siguientes ecuaciones en los intervalos dados usando el
método de Newton y el método de la secante.

(a) x3 − 2x2 − 5 = 0 en [1, 4].

(b) x3 + 3x2 − 1 = 0 en [−4, 0].

(c) x − cos x = 0 en [0, π/2].

(d) x − 0.8 − 0.2 sen x = 0 en [0, π/2].

4. ACTIVIDADES PRÁCTICAS DEL CAPÍTULO

4.1. Introducción

La práctica se va a realizar con el programa de cálculo matemático DERIVE for Windows, versión 4.05, de Soft
Warehouse. DERIVE for Windows permite realizar cálculos y manipulaciones matemáticas de carácter general,
lo cual significa que realiza muchas cosas de forma aceptable aunque no tiene la potencia de otros programas
especı́ficos. No obstante, DERIVE for Windows permite realizar todos los cálculos que un usuario medio puede
necesitar.

En esta práctica nos vamos a centrar en el cálculo diferencial en una variable. Aprenderemos a calcular lı́mites
de funciones, determinaremos los máximos, mı́nimos, y puntos de inflexión de una función, lo que nos permitirá
representar gráficamente dicha función (lo cual, dicho sea de paso, hace automáticamente el programa).

Antes de comenzar la práctica será conveniente que recordemos brevemente la ‘botonera’ de DERIVE for Win-
dows (ver Figura 2.9), ya que simplifica enormemente la introducción de datos y la realización de cálculos. Los
botones permiten realizar las siguientes tareas (de izquierda a derecha): New (abrir una nueva hoja de trabajo),
Open (abrir una hoja de trabajo existente), Save (guardar la sesión de trabajo), Print (imprimir la sesión de tra-
bajo), Remove (eliminar la expresión marcada), Unremove (recuperar la última expresión eliminada), Renumber
(renumerar las expresiones), Author expression (introducir una expresión sencilla), Author vector (introdu-
cir un vector), Author matrix (introducir una matriz), Simplify (simplificar), Approximate (calcular un valor
aproximado), Solve (resolver algebraicamente o numéricamente una expresión), Substitute for variables
(realizar una sustitución), Calculate limit (calcular un lı́mite), Calculate derivative (calcular una deriva-
da), Calculate integral (calcular una integral), Calculate sum (calcular una suma), Calculate product
(calcular un producto), 2D-plot window (realizar un gráfico bidimensional) y 3D-plot window (realizar un
gráfico tridimensional).

Figura 2.9: El uso de la ‘botonera’ de DERIVE for Windows nos puede simplificar mucho el trabajo. Otro elemento
interesante es la existencia de ‘teclas calientes’ que nos permiten evitar los menús, con lo que se gana
en rapidez.
C ÁLCULO DIFERENCIAL 55

4.2. Ejemplos de ilustración

Con DERIVE for Windows podemos calcular la derivada (de cualquier orden) de una función, el lı́mite de una
función f (x) cuando x tiende a un número finito x0 o infinito, los máximos, mı́nimos y puntos de inflexión, y
también podemos utilizar la información anterior para representar gráficamente una función. Veamos mediante
ejemplos cómo hacer cada una de las tareas anteriores.

ln(1 + x) − ln(1 − x)
Hallar el siguiente lı́mite: lim
x→0 x

Elejimos Author y escribimos (ln(1+x)-ln(1-x))/x. Después de seleccionar las opciones Calculus|Limit


(o bien pulsamos el botón lim ) nos aparece la ventana de la Figura 2.10. El programa nos solicita la función,
la variable, el punto que utilizaremos para el cálculo del lı́mite y el tipo de aproximación: Left (lı́mite por la
izquierda), Right (lı́mite por la derecha) y Both (lı́mite ordinario). En nuestro caso, seleccionamos x, 0 y Both.
Finalmente para obtener el resultado debemos pulsar la tecla Simplify, con lo que el programa nos devuelve
como valor del lı́mite el número 2.

Figura 2.10: Ventana del programa que nos permite calcular lı́mites de funciones.

Calcular la derivada de (3x2 + 5x − 1)4

Elejimos Author e introducimos la expresión (3x^2+5x-1)^4. A continuación seleccionamos las opciones


Calculus|Differentiate (o bien pulsamos el botón ∂ ) y nos aparece la ventana de la Figura 2.11. Entonces
el programa nos ofrece la expresión que queremos derivar (por defecto la que estaba seleccionada), la variable de
derivación (por defecto x) y el orden de la derivada que queremos calcular (por defecto 1). Tras pulsar la tecla
obtenemos 4(6x + 5)(3x2 + 5x − 1)3 . Si queremos desarrollar la expresión anterior deberemos seleccionar las
opciones Simplify|Expand (o simplemente teclear Ctrl+B) y nos aparece la ventana de la Figura 2.12. Tras
pulsar el botón Expand obtendremos el siguiente polinomio: 648x7 + 3780x6 + 7452x5 + 4800x4 − 884x3 −
960x2 + 276x − 20.

Calcular la derivada décima de e2x+1

Seguimos los mismos pasos que en el ejemplo anterior. Introducimos la expresión #e^(2x+1) y seleccionamos
56 MATEM ÁTICAS

Figura 2.11: Ventana del programa que nos permite derivar funciones.

Figura 2.12: Ventana del programa que nos permite desarrollar y simplificar expresiones.

las opciones Calculus|Differentiate. La variable de derivación es x y el orden de derivación es 10. Después


de desarrollar el resultado (pulsando la tecla Simplify) se obtiene 1024e2x+1 .

Calcular los extremos y puntos de inflexión de la función 12x5 − 105x4 + 40x3 + 840x2 − 1440x

En este caso, lo conveniente es almacenar la función. Para ello, elegimos Declare y a continuación Function
definition, y nos aparece la ventana de la Figura 2.13. El programa nos solicita el nombre, la variable (o varia-
bles) independiente y la definición de la función. Tecleamos el nombre de la función (por ejemplo, F), el nombre
de la variable (por ejemplo, x) y la definición mediante la expresión 12x^5-105x^4+40x^3+840x^2-1440x.
Para los extremos debemos calcular los ceros de la derivada; para ello, seleccionamos las opciones Calculus|
Differentiate (con los valores de x para la variable y de 1 para el orden) y obtenemos 64x4 − 420x3 +
120x2 + 1680x − 1440. A continuación determinamos los ceros de este polinomio mediante las opciones
Solve|Algebraically, obteniendo x=1, x=2, x=-2, x=6.

Para determinar el carácter de estas raı́ces, debemos calcular el valor de la derivada segunda en ellos. Para ello,
seleccionamos la expresión que contiene la definición de la función F o la expresión que contiene su derivada.
A continuación seleccionamos las opciones Calculus|Differentiate, con el valor x para la variable y 2 ó
1 para el orden (dependiendo de si hemos seleccionado la función F o su derivada). Una vez hemos calculado
la derivada segunda la almacenamos en una función, que llamaremos G, siguiendo los mismos pasos que antes
(Declare y Function definition. . . ), recordando que para copiar automáticamente la expresión seleccionada
C ÁLCULO DIFERENCIAL 57

Figura 2.13: Venta del programa que permite declarar una función. Existen ventanas similares para declarar el
valor de una variable (constante, vector o matriz).

debemos pulsar F3. Si ahora queremos calcular el valor de G en las raı́ces previamente calculadas, sólo tenemos
que introducir la expresión G(1) y pulsar Simplify (análogamente para las demás), obteniendo los siguientes
resultados : G(1)=900 (luego en x=1 hay un mı́nimo), G(2)=-960 (máximo en x=2), G(-2)=-5760 (máximo
en x=-2) y G(6)=9600 (mı́nimo en x=6). Otra posibilidad es calcular los cuatro valores al mismo tiempo; para
ello introducimos la expresión como un vector de 4 elementos como [G(1),G(2),G(-2),G(6)], y el progra-
ma nos devolverá la solución como un vector: [900, -960, -5760, 9600]. Para determinar las ordenadas
correspondientes a cada abscisa habremos de calcular F (1), F (2), F (−2) y F (6), respectivamente, resultando:
F (1) = −653, F (2) = −496, F (−2) = 3856 y F (6) = −12528.

Para calcular los puntos de inflexión debemos obtener los ceros de la derivada segunda. Si la precisión de los
cálculos es Exact entonces obtendremos la solución en forma trigonométrica. Para obtener un resultado que
podamos manejar más cómodamente es conveniente aproximar seguidamente la solución numéricamente (utili-
zando para ello las opciones Simplify|Approximate con el número de dı́gitos que nos parezca adecuado). Los
ceros de la derivada segunda que se obtienen son los siguientes (damos también la ordenada correspondiente):
(1.51, −573.59), (−0.98, 2079.11) y (4.72, −7904.16).

4.3. Ejercicios de aplicación

A continuación se enuncian unos ejercicios sobre cálculo diferencial de funciones reales de una variable. Si el
alumno encuentra alguna dificultad debe revisar detenidamente los ejemplos anteriores.


9n4 − n + 3
(a) Calcular el lı́mite lim .
n→0 2n2 + 3n − 1

πx
(b) Calcular el lı́mite lim (1 − x) tan( ).
x→1 2
(c) Calcular la derivada quinta de e3x ln(x).

(d) Calcular los extremos y los puntos de inflexión de la función x4 − 2x2 .

4.4. Bibliografı́a

C. Paulogorrón y C. Pérez. Cálculo matemático con DERIVE para PC, Ed. RA-MA, 1a Ed., 1994.
58 MATEM ÁTICAS

5. BIBLIOGRAFÍA DEL CAPÍTULO

R.L. BURDEN y J.D. FAIRES Análisis Numérico, Grupo Editorial Iberoamericana, 1985. Secciones 2.1, 2.2,
2.3, 3.2, 3.3 y 3.4.

R.E. LARSON, R.P. HOSTETLER y B.H. EDWARDS Calculo y Geometrı́a Analı́tica, 5a ed., vol. 1. McGraw-
Hill, Madrid, 1995. Capı́tulos 2,3 y 4.

J. STEWART Cálculo, 2a ed. Grupo Editorial Iberoamérica, México, 1994. Capı́tulos 1,2, y 3.

6. PREGUNTAS DE EVALUACIÓN

E.2.1. Representar gráficamente la función dada por

4x2 − 4x + 1
y= .
5x2 − 6x + 1

E.2.2. Determinar cómo ha de ser un triángulo isósceles de área máxima inscrito en una circunferencia de radio
r.

E.2.3. Se considera la siguiente tabla de datos:

x f (x)
0 1
1 3
3 −2
5 4

Utilizar interpolación polinómica para calcular una aproximación a f (2).

E.2.4. Se dispone de un alambre de longitud L con el que hay que construir un cı́rculo y un cuadrado. ¿Cómo se
debe dividir el alambre en dos trozos para que la suma de las áreas encerradas por el cı́rculo y el cuadrado
sea mı́nima? ¿Y para que dicha suma de áreas sea máxima?

E.2.5. Utilizar algún método numérico para aproximar, con una precisión de 10−6 , el valor de x tal que la distan-
cia entre el punto (1,0) y los puntos de la parábola (x, y(x)), y(x) = x2 , se hace mı́nima.

Observación : Sea cual sea el método que se utilice, debe considerarse que un valor aproximado pn se acerca
al valor real con una precisión de 10−6 si se satisface que |pn − pn−1 | < 10−6 .

E.2.6. Un pediatra está realizando un seguimiento del peso de los niños que pasan por su consulta. Elegida una
ficha al azar de su archivo, observa los siguientes datos:

Edad (años) 1 2 4 5
Peso (Kg) 9 12 16 18
C ÁLCULO DIFERENCIAL 59

Utilizar interpolación polinómica de Lagrange para obtener una aproximación numérica del peso del niño a
los 3 años de edad.
E.2.7. Una persona se somete a una dieta de adelgazamiento durante 5 semanas. A continuación se detalla su
peso al término de cada una de esas semanas:

Al cabo de...(semanas) 1 2 3 4 5
Peso en Kg. 880 5 87 84 820 5 79

Calcular la ecuación de un polinomio de grado 4 que relacione las dos variables. Usando dicho polinomio
¿qué peso esperarı́amos que alcance esta persona si sigue la dieta dos semanas más?
E.2.8. Representar gráficamente la función f : R → R definida como sigue:

(x − 1)(x − 2)(x − 3)
f (x) = .
(x − 4)(x − 5)(x − 6)

Calcular sólo los elementos que sean indispensables para realizar una representación gráfica correcta.
E.2.9. Utilizar cualquier método numérico, de entre los que han sido explicados en las clases de teorı́a, para
calcular una raı́z de la ecuación
x3 + 2x − 1 = 0
con una cota de error de 00 001.
60 MATEM ÁTICAS

ANOTACIONES

....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
CAPÍTULO 3
CÁLCULO INTEGRAL

1. INTERROGANTES CENTRALES DEL CAPÍTULO

• Concepto de área • Integración de funciones trigonométricas


• Sumas de Riemann • Integrales irracionales
• Integral definida • Area de la región entre dos curvas
• Propiedades de la integral definida • Volumen de un sólido de revolución
• Integral indefinida • Longitud de arco de una curva
• Propiedades de la integral indefinida • Area de una superficie de revolución
• Teorema Fundamental del Cálculo Integral • Integral impropia
• Integración por cambio de variable • Regla del punto medio
• Integración por partes • Regla del trapecio
• Integración de funciones racionales • Regla de Simpson

2. CONTENIDOS FUNDAMENTALES DEL CAPÍTULO

2.1. El problema del área

En esta sección partimos de la base que el concepto de área es bien conocido. Esto no significa que el alumno
deba tener una idea precisa y formal de dicho concepto, si no más bien que todos poseemos una idea intuitiva que
no necesita aclaración.

El tipo de región más simple con el que nos podemos encontrar es un rectángulo, cuya área se define como
el producto de su base por su altura. A partir de esta definición podemos obtener las fórmulas para el área de
regiones más complicadas: triángulos, paralelogramos, polı́gonos regulares, etc. El gran problema se plantea
cuando se intenta calcular el área de regiones más generales que las poligonales.

Los primeros matemáticos que intentaron resolver el problema de una forma seria fueron los griegos, utilizando el
método de “exhaución”. Este método, atribuido a Arquı́medes, consiste en encajar la región entre dos polı́gonos,
uno inscrito y otro circunscrito. Si la diferencia entre las áreas de los dos polı́gonos es pequeña, entonces podemos
aproximar el área de la región por cualquier número comprendido entre el área del polı́gono inscrito y el área del
polı́gono circunscrito.

El método que emplearemos aquı́ es parecido. Se trata de aproximar la región por una unión de rectángulos de tal
62 MATEM ÁTICAS

forma que el área de la región se aproxime por la suma de las áreas de los rectángulos.

2.2. La integral definida

2.2.1. El sumatorio

Como hemos indicado anteriormente, el área de una región se va a obtener como una suma (posiblemente infinita)
de áreas de rectángulos. Para facilitar la escritura y comprensión de tal proceso, vamos a introducir una notación.

La suma de n términos a1 , a2 , . . . , an se denota por


X
n
ai = a1 + a2 + · · · + an ,
i=1

donde i se llama ı́ndice de la suma, ai el i-ésimo término de la suma y los lı́mites inferior y superior de la
suma son 1 y n, respectivamente. Estos lı́mites deben ser constantes con respecto al ı́ndice de la suma y la única
restricción es que el lı́mite superior debe ser cualquier entero superior (o igual) al lı́mite inferior.

El sumatorio posee las siguientes propiedades:

X
n X
n
(1) kai = k ai , donde k es una constante que no depende del ı́ndice de la suma.
i=1 i=1

X
n X
n X
n
(2) [ai ± bi ] = ai ± bi
i=1 i=1 i=1

Por ejemplo, algunas fórmulas de suma importantes son las siguientes:

X
n
(1) c = cn.
i=1

X
n
n(n + 1)
(2) i= .
i=1
2

X
n
n(n + 1)(2n + 1)
(3) i2 = .
i=1
6

X
n
n2 (n + 1)2
(4) i3 = .
i=1
4

2.2.2. Sumas de Riemann

Consideremos una función f definida en el intervalo cerrado [a, b]. Una partición P de dicho intervalo es un
conjunto de números {x0 , x1 , x2 , . . . , xn } tales que
a = x0 < x1 < x2 < · · · < xn−1 < xn = b.
C ÁLCULO INTEGRAL 63

Si ∆xi es la anchura del i-ésimo subintervalo [xi−1 , xi ], es decir, ∆xi = xi − xi−1 , entonces se define la norma
de P, y se denota por ||P ||, como la longitud del subintervalo más grande. En otras palabras,

||P || = max {∆xi } = max{∆x1 , ∆x2 , . . . , ∆xn }.


16i6n

Si ci es cualquier punto del subintervalo i-ésimo, entonces la suma

X
n
f (ci )∆xi , xi−1 6 ci 6 xi ,
i=1

se llama suma de Riemann de la función f asociada a la partición P . Entre todos los posibles valores de ci ,
podemos destacar los siguientes:

(1) ci = mi para todo i, donde f (mi ) es el valor mı́nimo de f en el i-ésimo subintervalo. Entonces la suma de
Riemann
X
n
s(f, P ) = f (mi )∆xi
i=1

se denomina suma inferior de f asociada a P (ver Figura 3.1).

y y = f (x)
6

-
x
0 a b

Figura 3.1: Suma inferior de Riemann.

(2) ci = Mi para todo i, donde f (Mi ) es el valor máximo de f en el i-ésimo subintervalo. Entonces la suma
de Riemann
Xn
S(f, P ) = f (Mi )∆xi
i=1

se denomina suma superior de f asociada a P (ver Figura 3.2).

X
n
Es fácil comprobar que s(f, P ) 6 f (ci )∆xi 6 S(f, P ) para cualquier partición P del intervalo [a, b].
i=1

Una función f definida en [a, b] se dice integrable en [a, b] si existe el lı́mite de las sumas de Riemann de f
(cuando la norma de P tiende a 0) y denotamos este lı́mite mediante

X
n Z b
lim f (ci )∆xi = f (x)dx.
||P ||→0 a
i=1
64 MATEM ÁTICAS

y = f (x)
y 6

-
x
0 a b

Figura 3.2: Suma superior de Riemann.

Dicho valor se denomina integral definida de f entre a y b. a y b son los lı́mites inferior y superior de integración,
respectivamente.

No todas las funciones son integrables. Sin embargo, el siguiente resultado nos garantiza que la familia de funcio-
nes integrables en un intervalo es muy grande: “Toda función continua en un intervalo cerrado [a, b] es integrable
en dicho intervalo ”.

La relación entre el área de una región y el concepto de integral definida queda reflejada en el siguiente resultado:
Si f es continua y no negativa en un intervalo cerrado [a, b], entonces el área de la región limitada por f , el eje x
y las lı́neas verticales x = a y x = b viene dada por
Z b
área = f (x)dx.
a

2.2.3. Propiedades de la integral definida

La integral definida de una función f satisface las siguientes propiedades:

Z a
(1) f (x)dx = 0.
a
Z a Z b
(2) f (x)dx = − f (x)dx.
b a
Z b
(3) cdx = c(b − a).
a
Z b Z b Z b
(4) [f (x) ± g(x)]dx = f (x)dx ± g(x)dx.
a a a
Z b Z b
(5) cf (x)dx = c f (x)dx.
a a
C ÁLCULO INTEGRAL 65

Z b Z c Z b
(6) f (x)dx = f (x)dx + f (x)dx.
a a c

(7) Si f es no negativa en el intervalo cerrado [a, b] entonces


Z b
f (x)dx > 0.
a

(8) Si f y g son integrables en [a, b] satisfaciendo que f (x) 6 g(x) para todo valor de x en [a, b], entonces
Z b Z b
f (x)dx 6 g(x)dx.
a a

(9) Si m 6 f (x) 6 M para todo valor de x en [a, b] entonces


Z b
m(b − a) 6 f (x)dx 6 M (b − a).
a
Z Z
b b

(10) f (x)dx 6 |f (x)|dx.
a a

2.3. La integral indefinida

El problema de la integración puede interpretarse como el problema dual de la derivación, y tal relación queda
claramente de manifiesto en el Teorema Fundamental del Cálculo. Antes de llegar a este teorema importantı́simo,
necesitamos introducir el concepto de primitiva (o antiderivada).

Sean f y F dos funciones. Se dice que F es una primitiva (o antiderivada) de la función f si F 0 (x) = f (x)
para todo valor posible de x.

El siguiente resultado es de una importancia crucial, ya que nos garantiza que cualquier primitiva de una función
puede ser obtenida mediante la adición de una constante a una primitiva conocida. Esta será la base del segundo
teorema del cálculo integral o Regla de Barrow.

Si F es una primitiva de f en un intervalo I , entonces G es también una primitiva de F en el intervalo I si y sólo


si
G(x) = F (x) + C
para todo valor de x, siendo C una constante.

Como una notación, cualquier primitiva de la función f se indicará por


Z
f (x)dx,

y se denominará, genéricamente, integral indefinida de f .

Como consecuencia de lo anterior y de las propiedades de la derivación de funciones, se tienen las siguientes
propiedades:

Z
(1) 0dx = C.
Z
(2) kdx = kx + C.
66 MATEM ÁTICAS

Z Z
(3) kf (x) = k f (x)dx.
Z Z Z
(4) [f (x) ± g(x)]dx = f (x)dx ± g(x)dx.
Z
xn+1
(5) xn dx = + C.
n+1

2.3.1. Primer Teorema Fundamental del Cálculo Integral

Si f es una función continua en [a, b], entonces la función F definida por


Z x
F (x) = f (t)dt
a

es continua en [a, b], diferenciable en (a, b) y satisface que F 0 (x) = f (x).

2.3.2. Segundo Teorema Fundamental del Cálculo Integral

Si f es una función continua en [a, b] entonces


Z b
f (x)dx = F (b) − F (a)
a

donde F es cualquier primitiva de f en el intervalo [a, b].

2.4. Métodos de integración

2.4.1. Integrales de las funciones elementales

Las reglas del cálculo integral descritas anteriormente permiten encontrar la integral indefinida de ciertas funcio-
nes a partir de la integral indefinida de otras funciones más elementales o básicas. Pero en último extremo, la
integral indefinida de estas funciones básicas debe obtenerse a partir de la definición. Para facilitar la búsqueda de
integrales indefinidas, en la Tabla 3.1 listamos algunas de las más elementales; la lista no es demasiado exhaustiva
y siempre se puede recurrir a cualquiera de los libros recomendados para obtener una tabla más completa.

2.4.2. Integración por cambio de variable

El método de integración por sustitución o cambio de variable se apoya en el siguiente resultado teórico.
C ÁLCULO INTEGRAL 67

Z Z
xn+1
kdx = kx + C xn dx = +C
n+1

Z Z
1
dx = ln |x| + C ex dx = ex + C
x

Z Z
x ax
a dx = +C cos xdx = sen x + C
ln a

Z Z
sen xdx = − cos x + C tan xdx = − ln | cos x| + C

Z Z
cotan xdx = ln | sen x| + C sec xdx = ln | sec x + tan x| + C

Z Z
cosec xdx = − ln | cosec x + cotan x| + C sec2 xdx = tan x + C

Z Z
cosec2 xdx = − cotan x + C sec x tan xdx = sec x + C

Z Z
dx x
cosec x cotan xdx = − cotan x + C √ = arcsen + C
a 2 − x2 a

Z Z
dx 1 x dx 1 |x|
= arctan + C √ = arcsec +C
a 2 + x2 a a x x2 − a 2 a a

Z Z
cosh xdx = senh x + C senh xdx = cosh x + C

Tabla 3.1: Fórmulas básicas de integración.


68 MATEM ÁTICAS

Sean f y g funciones tales que f ◦ g es una función continua en un intervalo I . Si F es una primitiva de f en I ,
entonces Z
f (g(x))g 0 (x)dx = F (g(x)) + C.

Como consecuencia de lo anterior, podemos utilizar la siguiente estrategia:

(1) Escoger una sustitución u = g(x) adecuada.

(2) Hallar du = g 0 (x)dx.

(3) Reescribir la integral en términos de la nueva variable u.

(4) Calcular la integral resultante en términos de u.

(5) Cambiar u por g(x) para obtener la primitiva en términos de x.

2.4.3. Integración por partes

Esta técnica es especialmente útil cuando la función a integrar es un producto de funciones algebraicas o trascen-
dentes, de tal suerte que un factor se deriva fácilmente y otro factor se integra sin mucha dificultad. El método se
sustenta en el siguiente resultado teórico:

Si u y v son funciones de x y tienen derivadas continuas, entonces


Z Z
udv = uv − vdu.

La estrategia que debe utilizarse para utilizar este método es la siguiente:

(1) Tratar de que dv sea la parte más complicada del integrando que se ajusta a una fórmula de integración
básica. Entonces u será el resto del integrando.

(2) Alternativamente, tratar de que u sea la parte del integrando cuya derivada es una función más simple que
u. Entonces dv será el factor restante del integrando.

Algunas de las integrales por partes más comunes se ofrecen a continuación:

Z Z Z
(1) xn eax dx, xn sen axdx, xn cos axdx
Considerar u = xn y dv = eax dx, sen axdx, cos axdx, respectivamente.
Z Z Z
(2) x ln xdx, x arcsen axdx, xn arctan axdx
n n

Considerar u = ln x, arcsen ax, arctan ax y dv = xn dx, respectivamente.


Z Z
(3) eax cos bxdx, eax sen bxdx
Tomar u = cos bx, sen bx y dv = eax dx, respectivamente.
C ÁLCULO INTEGRAL 69

2.4.4. Integración de funciones racionales

La integración de funciones racionales se apoya en la técnica de la descomposición en fracciones simples, cuya


integración es más sencilla. Sea la función racional R(x), donde
P (x) b0 + b1 x + · · · + bn xn
R(x) = = .
Q(x) a 0 + a 1 x + · · · + a m xm
R es una función racional propia si el grado del denominador es mayor que el grado del numerador, es decir m >
n. En caso contrario, la función R se dice que es impropia. Podemos restringirnos, sin pérdida de generalidad, al
caso de funciones racionales propias, ya que de no ser ası́ siempre podemos dividir el polinomio P entre Q para
obtener
S(x)
R(x) = C(x) + ,
Q(x)
donde la función racional S(x)/Q(x) ya es propia.

Para descomponer una función racional propia en fracciones simples debemos seguir los siguientes pasos:

(1) Factorizar el denominador. Hay que descomponer completamente el denominador Q(x) en factores de la
forma
(px + q)k
y
(ax2 + bx + c)k ,
donde ax2 + bx + c es irreducible (tiene raı́ces complejas).
(2) Factores lineales. Por cada factor de la forma (px+q)k , la descomposición en factores simples debe incluir
la siguiente suma de k fracciones simples:
A1 A2 Ak
+ + ··· + .
(px + q) (px + q)2 (px + q)k

(3) Factores cuadráticos. Por cada factor de la forma (ax2 + bx + c)k , la descomposición en factores simples
debe incluir la siguiente suma de k fracciones:
B1 x + C 1 B2 x + C2 Bk x + Ck
+ + ··· + .
(ax2 + bx + c) (ax2 + bx + c)2 (ax2 + bx + c)k

Cuando el denominador tiene factores de multiplicidad mayor que uno, entonces la obtención de la integral indefi-
nida puede ser muy laboriosa. En estos casos es recomendable utilizar el siguiente método, que también es válido
en cualquier otra situación.

2.4.4.1. Método de Hermite-Ostrogradski

Consideremos la función racional R = P/Q, entonces


Z Z
P (x) X(x) Y (x)
dx = + dx,
Q(x) Q1 (x) Q2 (x)
donde Q1 (x) es el máximo común divisor de Q(x) y de su derivada Q0 (x), Q2 (x) es el cociente Q(x)/Q1 (x),
y los polinomios X(x) e Y (x) son polinomios con coeficientes indeterminados cuyos grados son inferiores en
una unidad a los grados de Q1 (x) y Q2 (x), respectivamente. Los polinomios X e Y se calculan derivando en la
igualdad anterior, de forma que se tiene
P (x) X 0 (x)Q1 (x) − Q01 (x)X(x) Y (x)
= + .
Q(x) Q1 (x)2 Q2 (x)
70 MATEM ÁTICAS

2.4.5. Integración de funciones trigonométricas

2.4.5.1. Integrales de senos y cosenos

En este apartado vamos a resolver las integrales de la forma


Z
senm x cosn xdx,

siendo m o n un entero positivo. Se deben seguir las siguientes reglas:

(1) Si n = 2k + 1 es impar, n > 1, entonces se utilizan las igualdades siguientes:

cosn x = cosn−1 x cos x


cos2 x = 1 − sen2 x

y la integral queda
Z Z Z
sen x cos xdx = sen x(1 − sen x) cos xdx = tm (1 − t2 )k dt
m n m 2 k

donde la última igualdad se obtiene tras realizar el cambio de variable t = sen x.


(2) Si m = 2k + 1 es impar, m > 1, entonces se utilizan las igualdades siguientes:

senm x = senm−1 x sen x


sen2 x = 1 − cos2 x

y la integral queda
Z Z Z
senm x cosn xdx = (1 − cos2 x)k cosn x sen xdx = − tn (1 − t2 )k dt

donde la última igualdad se obtiene tras realizar el cambio de variable t = cos x.


(3) Si m y n son pares y no negativos entonces se utilizan las siguientes fórmulas de reducción:
1
sen x cos x = sen 2x
2
1
sen2 x = (1 − cos 2x)
2
1
cos2 x = (1 + cos 2x)
2

2.4.5.2. Integrales de secantes y tangentes

En este apartado vamos a resolver las integrales de la forma


Z
secm x tann xdx,

siendo m o n un entero positivo. Se deben seguir las siguientes reglas:


C ÁLCULO INTEGRAL 71

(1) Si m = 2k es positivo y par, entonces utilizamos la igualdad


sec2 x = 1 + tan2 x
y la integral queda:
Z Z
m n
sec x tan xdx = (sec2 x)k−1 tann x sec2 xdx
Z
= (1 + tan2 x)k−1 tann x sec2 xdx
Z
= (1 + u2 )k−1 un du

donde la ultima igualdad se obtiene mediante el cambio de variable u = tan x.


(2) Si n = 2k + 1 es positivo e impar, entonces utilizamos la igualdad
tan2 x = sec2 x − 1
y la integral queda:
Z Z
secm x tann xdx = secm−1 x(tan2 x)k sec x tan xdx
Z
= secm−1 x(sec2 x − 1)k sec x tan xdx
Z
= um−1 (u2 − 1)k du

donde la ultima igualdad se obtiene mediante el cambio de variable u = sec x.


(3) Si m y n son impares, se transforma un factor tan2 x en sec2 x − 1 y se aplican los casos anteriores. Si es
necesario, se vuelve a aplicar esta transformación.
(4) Si n = 0 y m es impar y positivo, entonces se utiliza integración por partes:
u = secm−2 x
dv = sec2 xdx

(5) Si n = 0 y m es par y positivo, se utiliza el cambio de variable t = tan x y la integral queda


Z Z Z Z
m−2 m−2 m−2
secm xdx = (sec2 x) 2 sec2 x = (1 + tan2 x) 2 sec2 xdx = (1 + t2 ) 2 dt

(6) Si no se puede aplicar ninguna de las reglas anteriores, debemos intentar convertir la integral a senos y
cosenos.

2.4.5.3. Cambios de variable trigonométricos

Las sustituciones trigonométricas se emplean en integrales donde aparacen los siguientes radicales:
p p p
a 2 − x2 , a 2 + x2 , x2 − a 2 .
Los cambios que deben hacerse son los siguientes:

√ √
(1) Para integrales que contienen a2 − x2 , hacer x = a sen t. Entonces
a2 − x2 = a cos t.
√ √
(2) Para integrales que contienen a2 + x2 , hacer x = a tan t. Entonces a2 + x2 = a sec t.
√ √
(3) Para integrales que contienen x2 − a2 , hacer x = a sec t. Entonces a2 − x2 = ±a tan t. El signo + o
− depende de si x > a o x < −a, respectivamente.
72 MATEM ÁTICAS

2.4.5.4. Funciones racionales de senos y cosenos

Para las integrales de funciones racionales en senos y cosenos existen varios cambios de variable especiales. Se
trata de calcular la integral Z
R(sen x, cos x)dx,

donde R es una función racional. Los cambios apropiados son los siguientes:

(1) Si R es impar en sen x, es decir, R(− sen x, cos x) = −R(sen x, cos x), entonces debemos hacer t = cos x.

(2) Si R es impar en cos x, es decir, R(sen x, − cos x) = −R(sen x, cos x), entonces debemos hacer t = sen x.

(3) Si R(− sen x, − cos x) = R(sen x, cos x), entonces debemos hacer t = tan x.

(4) Si no se puede aplicar ninguno de los casos anteriores, entonces hacemos el cambio universal t = tan(x/2),
de modo que
2t
sen x = ,
1 + t2
1 − t2
cos x = ,
1 + t2
2dt
dx = .
1 + t2

2.4.6. Integrales irracionales

No siempre es posible expresar la integral de una función irracional mediante funciones elementales. En esta
sección veremos algunos tipos de funciones irracionales que sı́ permiten expresar su integral indefinida por medio
de funciones elementales.

Z
2.4.6.1. Integrales del tipo R(x, xp1 /q1 , . . . , xpk /qk )dx

Se efectúa la sustitución
x = tm ,
siendo m el mı́nimo común múltiplo de {q1 , q2 , . . . , qk }.

Z  p1 /q1  pk /qk


ax + b ax + b
2.4.6.2. Integrales del tipo R(x, ,..., )dx
cx + d cx + d

Se efectúa la sustitución
ax + b
= tm ,
cx + d
siendo m el mı́nimo común múltiplo de {q1 , q2 , . . . , qk }.
C ÁLCULO INTEGRAL 73

Z p
2.4.6.3. Integrales del tipo R(x, ax2 + bx + c)dx

Se efectúan las siguientes sustituciones:

(1) Si a > 0 entonces hacemos p √


ax2 + bx + c = ± ax + t,
con lo que
t2 − c
x= √ .
b − 2 at

(2) Si ax2 + bx + c = a(x − α)(x − β), siendo α y β las raı́ces reales, entonces hacemos
p
ax2 + bx + c = (x − α)t,

de modo que
aβ − αt2
x= .
a − t2

Z
2.4.6.4. Integrales del tipo xm (a + bxn )p dx

Estas integrales se conocen con el nombre de integrales binomias, y los exponentes m, n y p deben ser números
racionales. En primer lugar se realiza el cambio de variable t = xn y la integral se transforma en la siguiente
Z Z
1
xm (a + bxn )p dx = tq (a + bt)p dt,
n
m+1
donde q = − 1. La integral anterior se puede calcular explı́citamente en los siguientes casos:
n

(1) Si p es entero entonces se desarrolla el binomio (a + bt)p o (a + bt)−p , según sea p positivo o negativo, y
se obtiene una integral irracional del tipo R(x, xp1 /q1 , . . . , xpk /qk ).
(2) Si p no es entero pero q sı́ lo es, entonces la integral se transforma en una irracional del tipo R(t, (a+bt)r/s ).
(3) Si p no es entero pero p + q sı́, entonces la integral se transforma en una integral irracional del tipo
 r/s !
a + bt
R t, .
t

2.5. Aplicaciones del cálculo integral

2.5.1. Area de la región entre dos curvas

Ya hemos visto que el área que hay bajo una curva se puede calcular utilizando la integral definida. Con muy
escasas modificaciones podemos calcular el área que hay entre dos curvas. Consideremos dos funciones f y g
74 MATEM ÁTICAS

definidas en un intervalo [a, b] tales que f (x) > g(x) para todo valor x de [a, b]. Entonces el área de la región
limitada por las gráficas de f y g y las lı́neas rectas x = a y x = b viene dada por
Z b
A= [f (x) − g(x)]dx.
a

Figura 3.3: Area de la región comprendida entre dos gráficas.

En general, puede ocurrir que no siempre se verifique f (x) > g(x) ni lo contrario. Entonces debemos dividir el
intervalo [a, b] en subintervalos donde sı́ ocurra, aplicar la fórmula anterior en cada subintervalo y posteriormente
sumar los resultados. En otras palabras:

El área de la región limitada por las gráficas de dos funciones f y g , y las lı́neas rectas x = a y x = b viene dada
por
Z b
A= |f (x) − g(x)|dx.
a

2.5.2. Cálculo de volúmenes de los sólidos de revolución

En esta sección vamos a calcular el volumen de un sólido tridimensional que aparece frecuentemente en ingenierı́a
y en procesos de producción. Nos estamos refiriendo a los sólidos de revolución, los cuales se obtienen al hacer
girar una región plana alrededor de una recta contenida en el mismo plano y que no corta a la región. Ejemplos de
sólidos de revolución son el cilindro circular recto, la esfera y el toro.

2.5.2.1. Método de discos

Para calcular el volumen de un sólido de revolución por el método de discos, debemos utilizar las siguientes
fórmulas:

(1) Si el eje de revolución es horizontal:


Z b
V =π [R(x)]2 dx.
a
En este caso estamos suponiendo que la región plana que gira es la región limitada por la gráfica de R(x),
el eje x, y las lı́neas rectas x = a y x = b. Como eje de revolución se considera el eje x.
C ÁLCULO INTEGRAL 75

Figura 3.4: Método de discos para el cálculo de volúmenes.

(2) Si el eje de revolución es vertical:


Z d
V =π [R(y)]2 dy.
c

En este caso estamos suponiendo que la región plana que gira es la región limitada por la gráfica de R(y),
el eje y, y las lı́neas rectas y = c y y = d. Como eje de revolución se considera el eje y.

2.5.2.2. Método de arandelas

Se utiliza este método cuando se trata de calcular el volumen de un sólido de revolución con un agujero. Este
tipo de sólidos aparecen cuando la región plana que gira y el eje de revolución no están juntos. Supongamos que
la región plana es la región determinada por las gráficas de las funciones R(x) y r(x) (con R(x) > r(x)), y las
lı́neas rectas x = a y x = b. Si se gira esta región alrededor del eje x entonces el volumen del sólido resultante es
Z b
V =π [R(x)2 − r(x)2 ]dx.
a

Si la región plana es la región determinada por las gráficas de las funciones R(y) y r(y) (con R(y) > r(y)), y las

Figura 3.5: Método de arandelas para el cálculo de volúmenes.


76 MATEM ÁTICAS

lı́neas rectas y = c y y = d. y se gira esta región alrededor del eje y entonces el volumen del sólido resultante es
Z d
V =π [R(y)2 − r(y)2 ]dy.
c

2.5.2.3. Método de capas

Consideremos la región plana determinada por la gráfica de una función f (x), y las rectas x = a, x = b e y = c.
El volumen del sólido de revolución obtenido al girar dicha región alrededor de un eje vertical x = x0 viene dado
por
Z b
V = 2π p(x)h(x)dx,
a
donde p(x) es la distancia de x al eje de revolución y h(x) es la distancia entre c y f (x). Usualmente, el eje de
revolución es el eje y y la región está junto al eje x, por lo que p(x) = x y h(x) = f (x).

Figura 3.6: Método de capas para el cálculo de volúmenes.

Si consideramos la región plana determinada por la gráfica de una función f (y), y las rectas y = c, y = d y x = a,
el volumen del sólido de revolución obtenido al girar dicha región alrededor de un eje horizontal y = y0 viene
dado por
Z d
V = 2π p(y)h(y)dy,
c
donde p(y) es la distancia de y al eje de revolución y h(y) es la distancia entre a y f (y). Cuando el eje de
revolución es el eje x y la región está junto al eje y, entonces p(y) = y y h(y) = f (y).

2.5.3. Cálculo de volúmenes

Analicemos ahora un sólido S cualquiera. Vamos a suponer que existe una recta, que consideraremos el eje x,
y dos planos paralelos entre sı́ y perpendiculares al eje, tales que el sólido se encuentra entre ambos planos (de
ecuaciones x = a y x = b). Cada plano x = x0 , a 6 x0 6 b, paralelo a los anteriores y perpendicular al eje
intersecciona a S según una región (denominada sección transversal) cuya área se denota por A(x0 ). Haciendo
esto para cada valor x0 en el intervalo [a, b] podemos construir una función A(x), definida en [a, b], que mide el
área de las secciones transversales. Entonces el volumen de S viene dado por
Z b
V = A(x)dx.
a
C ÁLCULO INTEGRAL 77

Casos particulares de esta fórmula han sido obtenidos en la sección anterior dedicada a los sólidos de revolución.

2.5.4. Longitudes de curvas

Un segmento de curva se dice rectificable si tiene una longitud de arco finita. El problema de determinar la lon-
gitud de una curva es muy antiguo (algunas contribuciones ya fueron realizadas por los matemáticos C. Huygens
(1629–1695) y J. Gregory (1638–1675)) y no por ello es sencillo. Una condición suficiente para que la gráfica de
una función f sea rectificable entre los puntos (a, f (a)) y (b, f (b)) es que la derivada f 0 sea una función continua
en [a, b]. Se dice entonces que la función f es continuamente derivable o de clase C 1 .

El fundamento teórico que nos permite obtener una fórmula para la longitud de arco es el siguiente. Consideremos
dos puntos xi−1 y xi en el intervalo [a, b]. Entonces por el teorema del valor medio se tiene

f (xi ) − f (xi−1 ) = f 0 (ci )(xi − xi−1 ), ci ∈ (xi−1 , xi ).

Si aproximamos la longitud de arco de la curva por la longitud de una poligonal que se apoya en los puntos
{(xi , f (xi ))} entonces al tomar lı́mites se obtiene

X
n p
Lba (f ) = lim (∆xi )2 + (∆yi )2
n→∞
i=1
s  2
X
n
∆yi
= lim 1+ ∆xi
n→∞
i=1
∆xi
Xn p
= lim 1 + f 0 (ci )2 ∆xi
n→∞
i=1
Z b p
= 1 + f 0 (x)2 dx
a

donde ∆xi = xi − xi−1 y ∆yi = f (xi ) − f (xi−1 ).

En consecuencia, obtenemos las siguientes fórmulas:

(1) Si la función y = f (x) representa una curva suave en el intervalo [a, b], la longitud de arco de f entre a y b
viene dada por
Z bp
Lba (f ) = 1 + f 0 (x)2 dx.
a

(2) Si la función x = g(y) representa una curva suave en el intervalo [c, d], entonces la longitud de arco de g
entre c y d es
Z dp
Ldc (g) = 1 + g 0 (y)2 dy.
c

2.5.5. Areas de superficies de revolución

Si se gira la gráfica de una función continua alrededor de una recta, la superficie resultante se denomina superficie
de revolución. Para calcular el área de una superficie de revolución se parte de la fórmula del área de un tronco
de cono circular recto y se aplica a los conos obtenidos al rectificar la curva por medio de una poligonal que se
apoya en los puntos {(xi , f (xi ))}. El resultado obtenido es el siguiente.
78 MATEM ÁTICAS

Si y = f (x) tiene derivada continua en el intervalo [a, b], entonces el área de la superficie de revolución S formada
al girar la gráfica de f alrededor de un eje horizontal o vertical es
Z b p
S = 2π r(x) 1 + f 0 (x)2 dx,
a

donde r(x) es la distancia entre la gráfica de f y el eje de revolución correspondiente.

2.6. Integrales impropias

La definición de integral definida que hemos presentado requiere que el intervalo [a, b] de integración sea finito y
que la función f a integrar sea continua. Sin embargo, existen funciones que no cumplen estos requisitos (bien
porque el intervalo no es finito o bien porque la función f presenta alguna discontinuidad) y que, sin embargo,
pueden ser integradas, en un sentido que precisaremos a continuación.

2.6.1. Intervalos infinitos

Cuando el intervalo de integración es infinito, se pueden presentar las siguientes posibilidades:

y 6

y = f (x)

-
0 a x

Figura 3.7: Integrales impropias de primera clase.

(1) Si f es continua en [a, ∞), entonces


Z ∞ Z b
f (x)dx = lim f (x)dx.
a b→∞ a

(2) Si f es continua en (−∞, b], entonces


Z b Z b
f (x)dx = lim f (x)dx.
−∞ a→−∞ a

(3) Si f es continua en (−∞, ∞) = R, entonces


Z ∞ Z c Z ∞
f (x)dx = f (x)dx + f (x)dx.
−∞ −∞ c

para cualquier número real c.


C ÁLCULO INTEGRAL 79

Si los lı́mites existen, la integral correspondiente se dice que converge o que es convergente; en caso contrario,
diremos que la integral diverge o que es divergente.

2.6.2. Integrandos discontinuos

En este apartado analizamos la integrales impropias que aparecen cuando existe alguna discontinuidad infinita en
los lı́mites de integración o en el interior del intervalo. Se pueden presentar las siguientes posibilidades:

y 6

y = f (x)

-
0 a c b x

Figura 3.8: Integrales impropias de segunda clase.

(1) Si f es continua en [a, b) y presenta una discontinuidad infinita en b, entonces


Z b Z c
f (x)dx = lim− f (x)dx.
a c→b a

(2) Si f es continua en (a, b] y presenta una discontinuidad infinita en a, entonces


Z b Z b
f (x)dx = lim+ f (x)dx.
a c→a c

(3) Si f es continua en [a, b] excepto en un punto c ∈ (a, b) donde presenta una discontinuidad infinita, entonces
Z b Z c Z b
f (x)dx = f (x)dx + f (x)dx.
a a c

Si los lı́mites existen, la integral correspondiente se dice que converge o que es convergente; en caso contrario,
diremos que la integral diverge o que es divergente.

2.7. Integración numérica

Hay ocasiones en las que es imposible determinar explı́citamente la integral indefinida de una función, por lo
que no podemos calcular el área que hay bajo la gráfica de la función utilizando la Regla de Barrow. En estos
casos, sólo nos queda recurrir al cálculo numérico de dichas integrales, utilizando una técnica de aproximación.
A continuación describimos algunos de los métodos más sencillos.
80 MATEM ÁTICAS

2.7.1. Regla de las sumas inferiores y superiores

Rb
Sea f una función continua en [a, b]. La regla de las sumas inferiores para aproximar a
f (x)dx viene dada por
Z
b−a X
n
b
b−a
f (x)dx ≈ f (mi ) = [f (m1 ) + f (m2 ) + · · · + f (mn )],
a n i=1 n

donde f (mi ) es el valor mı́nimo de f en el i-ésimo subintervalo [xi−1 , xi ].


Rb
Análogamente, la regla de las sumas superiores para aproximar a
f (x)dx viene dada por
Z
b−aX
n
b
b−a
f (x)dx ≈ f (Mi ) = [f (M1 ) + f (M2 ) + · · · + f (Mn )],
a n i=1 n

donde f (Mi ) es el valor máximo de f en el i-ésimo subintervalo [xi−1 , xi ].

2.7.2. Regla de los extremos izquierdos y derechos

Rb
Sea f una función continua en [a, b]. La regla de los extremos izquierdos para aproximar a f (x)dx viene dada
por
Z b
b−a X
n
b−a
f (x)dx ≈ f (xi−1 ) = [f (x0 ) + f (x1 ) + · · · + f (xn−1 )].
a n i=1 n

Rb
Análogamente, la regla de los extremos derechos para aproximar a
f (x)dx viene dada por
Z
b−a X
n
b
b−a
f (x)dx ≈ f (xi ) = [f (x1 ) + f (x2 ) + · · · + f (xn )].
a n i=1 n

2.7.3. Regla del punto medio

Rb
Sea f una función continua en [a, b]. La regla del punto medio para aproximar a
f (x)dx viene dada por
Z
b−a X
n
b
b−a
f (x)dx ≈ f (x̄i ) = [f (x̄1 ) + f (x̄2 ) + · · · + f (x̄n )],
a n i=1 n

donde x̄i es el punto medio del i-ésimo subintervalo [xi−1 , xi ], es decir, x̄i = 12 (xi−1 + xi ).

2.7.4. Regla del trapecio

Rb
Sea f una función continua en [a, b]. La regla del trapecio para aproximar a
f (x)dx viene dada por
Z
b − a X f (xi−1 ) + f (xi )
n
b
b−a
f (x)dx ≈ = [f (a) + 2f (x1 ) + · · · + 2f (xn−1 ) + f (b)].
a n i=1 2 2n
C ÁLCULO INTEGRAL 81

y y = f (x)
6

-
x
0 a b

Figura 3.9: Regla del punto medio para la integración numérica.

y y = f (x)
6

-
x
0 a b

Figura 3.10: Regla del trapecio para la integración numérica.

2.7.5. Regla de Simpson

La regla de los trapecios se obtiene de aproximar la curva por una poligonal, con lo que la región bajo la curva
se aproxima por una unión de trapecios. En consecuencia, el área de dicha región se aproxima por la suma de las
áreas de los trapecios. Otra posibilidad puede ser agrupar los puntos de la partición de tres en tres y aproximar la
función por segmentos parabólicos (en lugar de rectilı́neos). Entonces la integral de la función se puede aproximar
por la integral de los segmentos parabólicos.
Rb
Sea f una función continua en [a, b]. La regla de Simpson para aproximar a
f (x)dx viene dada por

Z b
b−a
f (x)dx ≈ [f (a) + 4f (x1 ) + 2f (x2 ) + 4f (x3 ) + · · · + 2f (xn−2 ) + 4f (xn−1 ) + f (b)],
a 3n

siendo n un número par.


82 MATEM ÁTICAS

y y = f (x)
6

p(x)

a = x0 x1 x
0 b = x2

Figura 3.11: Regla de Simpson para la integración numérica.

2.7.6. Estimación de errores

Cuando se trabaja con aproximaciones es importante conocer con qué precisión estamos calculando el valor de
la integral. Además, es posible que algún método sea sensiblemente mejor que los demás, si bien puede que sea
bajo ciertas hipótesis. A continuación enunciamos los errores que se cometen en las reglas de aproximación más
usuales.

Rb
(1) Si f tiene derivada segunda continua en [a, b], entonces el error EM cometido al aproximar a
f (x)dx por
la regla del punto medio es
M (b − a)3
|EM | 6 ,
24n2
siendo M una cota superior para |f 00 |, es decir, |f 00 (x)| 6 M para todo valor de x.
Rb
(2) Si f tiene derivada segunda continua en [a, b], entonces el error ET cometido al aproximar a
f (x)dx por
la regla del trapecio es
M (b − a)3
|ET | 6 ,
12n2
siendo M una cota superior para |f 00 |, es decir, |f 00 (x)| 6 M para todo valor de x.
Rb
(3) Si f tiene derivada cuarta continua en [a, b], entonces el error ES cometido al aproximar a
f (x)dx por la
regla de Simpson es
M (b − a)5
|ES | 6 ,
180n4
siendo M una cota superior para |f (4) |, es decir, |f (4) (x)| 6 M para todo valor de x.

3. ACTIVIDADES DE APLICACIÓN DE LOS CONOCIMIENTOS

A.3.1. Hallar la integral indefinida y comprobar el resultado por derivación:


C ÁLCULO INTEGRAL 83

Z Z Z
√ 1 1
3
xdx dx √ dx
x2 x x
Z Z Z
1
x(x2 + 3)dx (x3/2 + 2x + 1)dx dx
(2x)3
Z Z Z
3 1
(x + 2)dx (x2 − 2x + 3)dx 3
dx
Z   Z √ Z 2x

√ 1 3 4
x+ √ dx x2 dx ( x3 + 1)dx
2 x
Z Z 3 Z 4
x − 3x2 + 3x − 1 x −1
(x2 − 2x + 1)2 dx dx dx
Z Z x2 − 2x + 1 Z √ x−1
2
x(x + 1)
(2x − 1)2 (3x + 1)dx (x2 − 1)(x + 1)dx dx
Z √ Z √ Z x5/3
x4 (x2 − 1)3 dx x5 x−4/3 (x3 − 1)dx 3(4x − 2)2 dx
3 3

A.3.2. Hallar la integral indefinida y comprobar el resultado por derivación:

Z Z Z
1 1 1
3
dx 4
dx 2
dx
Z x Z x2 Z 4x2
x +x+1 x +1
(2x + x−1/2 )dx √ dx dx
x x2
Z Z Z 2
t +2
(x + 1)(3x − 2)dx (2t2 − 1)2 dt dt
Z Z Z t2

(1 − 2y + 3y 3 )dy y 2 ydy (1 + 3t)t2 dt

A.3.3. Hallar la integral indefinida y comprobar el resultado por derivación:

Z Z p Z
4
2(1 + 2x) dx x 9 − x2 dx x2 (x3 − 1)4 dx
Z p Z Z
3 x2 4x
5x 1 − x2 dx dx √ dx
(1 + x3 )2 16 − x2
Z Z  3 Z
x+1 1 1 1
dx 1+ dt √ dx
(x2 + 2x − 3)2 t t2 2x
Z 2 Z   Z
x + 3x + 7 2 √
√ dx t2 t − dt (9 − y) ydy
x t

A.3.4. Calcular las siguientes integrales indefinidas por el método del cambio de variable:

Z Z Z
√ √ x2 − 1
x x + 2dx x2 1 − xdx √ dx
Z Z Z 2x − 1
−x x
√ dx √ dx x(x2 + 1)3 dx
(x + 1) − x + 1 2x + 1
Z Z Z
1 1 √
√ dx √ √ dx (x − 1) 2 − xdx
2x +1 x(1 + x)2
Z Z Z p
√ √ 3
x x − 3dx x 3 x + 1dx x 4 + x2 dx

A.3.5. Calcular las siguientes integrales:


84 MATEM ÁTICAS

Z Z Z
−2x 2 x3 −3x+1
e dx (x − 1)2 dx e1−x dx
Z Z Z
e−x 2 e3/x
dx xeax dx dx
(1 + e−x )2 x2
Z Z Z
−x −x 2
√ ex + e−x
e (1 + e ) dx ex 1 − ex dx √ dx
Z Z Z ex + e−x
5 − ex 2
dx (ex − e−x )2 dx (3 − x)e(x−3) dx
e2x

A.3.6. Calcular las siguientes integrales:

Z Z Z
1 1 x
dx dx 2+1
dx
Z 2 1
x + Z 3 − 2x Z x
x −4 ln x (1 + ln x)2
dx dx dx
Z 2x Z 2x Z x
x −2 1 x2 + 2x + 3
dx √ dx dx
x+1 x+1 x3 + 3x2 + 9x
Z Z Z √
1 1 x
dx √ dx √ dx
x2/3 (1 + x1/3 ) 1+ x x−3

A.3.7. Calcular las siguientes integrales:

Z √ Z Z
x x(x − 2)
√ dx dx 3x dx
1−x x (x − 1)3
Z Z Z
x x2 e−x
2 dx x5 dx −x
dx
Z √ Z Z 1+e
1− x 1
√ dx √ dx 4−x dx
1+ x
Z Z 1x+ 2x Z
2 e − e−x (ln x)2
(3 − x)7(x−3) dx dx dx
ex + e−x x

A.3.8. Calcular las siguientes integrales trigonométricas:

Z Z Z
2 3
2 cos xdx 3x sen x dx sec2 3xdx
Z Z Z √
sec2 x
tan2 xdx (cosec x + sen x) cosec xdx √ dx
x
Z Z Z
sen x
sen2 3x cos 3xdx 4 cos2 4x sen 4xdx 2x
dx
Z Z Z cos
sec2 x
√ dx tan xdx sec xdx
tan x

A.3.9. Calcular las siguientes integrales trigonométricas:


Z Z Z
(2 sen x + 3 cos x)dx (t2 − sen t)dt (1 − cosec t cotan t)dt
Z Z Z
(sec2 θ − sen θ)dθ sen(2x)dx x cos(x2 )dx
Z Z Z
x 2 cosec2 x
sec dx 3 dx cotan2 xdx
Z 2 Z cotan x Z
tan4 x sec2 xdx cotan πxdx cosec 2xdx
C ÁLCULO INTEGRAL 85

A.3.10. Calcular las siguientes integrales trigonométricas:

Z Z Z
sec2 x sec x tan x
dx dx (sen 2x + cos 2x)2 dx
Z tan x Z sec x − 1 Z
1 − cos θ
dθ ex cos ex dx (cosec 2θ − cotan 2θ)2 dθ
Z θ − sen θ Z Z
cos t
dt e−x tan e−x dx sen 2x cos 2xdx
1 + sen t

A.3.11. Calcular las siguientes integrales de las funciones trigonométricas inversas:

Z Z Z
1 1 1
√ dx dx √ dx
4 − x2 2 + 9x2 2x
e −1
Z Z Z
x+2 3x2 − 2 1
√ dx dx dx
4 − x2 x2 + 4 x2 − 4x − 7
Z Z Z
1 1 x
2
dx dx √ dx
2x − 8x + 10 3x − x2 2
x −1
Z Z Z
1 1 1
dx dx √ dx
1 − 9x2 1 + 4x2 x 4x2 − 1

A.3.12. Calcular las siguientes integrales:

Z Z Z
x3 1 1
dx p dx √ dt
x2 + 1 1 − (x + 1)2 1 − t4
Z Z Z
arctan x arcsen x x
dx √ dx √ dx
1 + x2 1 − x2 1 − x2
Z Z Z
ex 1 1
√ dx dx √ dx
1 − e2x x2 − 6x + 18 x(1 + x)
Z Z Z
sen x 1 2x
dx dx dx
1 + cos2 x x2 − 2x + 2 x2 + 6x + 13

A.3.13. Calcular las siguientes integrales:

Z Z Z
1 x+2 2x − 3
√ dx √ dx √ dx
Z −x2 − 4x Z −x2 − 4x Z √4x − x
2

x 1 x−1
dx √ dx dx
x + 2x2 + 2
4 2
−16x + 16x − 3 x
Z √ Z Z
1 1
et − 3dt √ dx dx
(x − 1) x2 − 2x x2 + 6x + 13

A.3.14. Calcular las siguientes integrales de funciones hiperbólicas:

Z Z Z
cosh x
senh(1 − 2x)dx cosh2 (x − 1) senh(x − 1)dx dx
Z Z Z senh x
x2 cosech(1/x) cotanh(1/x)
x cosech2 dx dx senh2 xdx
Z 2 Z x2 Z
1 2 x
√ √ dx √ dx dx
x 1+x 1 − 4x2 x4 + 1
Z Z Z
1 1 1
√ dx dx dx
1 + e2x 1 − 4x − 2x2 25 − x2

A.3.15. Calcular las siguientes integrales:


86 MATEM ÁTICAS

Z Z Z  
4 3/2 1
(3x − 2) dx (−2x + 5) dx v+ dv
(3v − 1)3
Z Z Z
t2 − 3 x2 ex
dt dx dx
Z −t3 + 9t + 1 Z x−1
x
Z 1+e t 2
(1 + e )
t sen2 tdt cos xesen x dx dt
Z Z Z et
2 1
sec 3x tan 3xdx −x
dx dx
e +1 1 − cos x

A.3.16. Calcular las siguientes integrales:

Z Z Z
2t − 1 3 1
dt dt √ dx
t2 + 4 2 2
Z x x 2− 4
t +1
Z Z
−1 t sec x
p dt √ dt dx
1 − (2t − 1)2 1 − t4 4 + tan2 x
Z Z Z  3
tan(2/t) 1
dt (1 + 2x2 )2 dx x 1+ dx
t2 x
Z Z Z
3 4
(1 + ex )2 dx √ dx dx
6x − x2 4x2 + 4x + 65

A.3.17. Calcular las siguientes integrales:

Z Z Z
2
xe2x dx xex dx xe−2x dx
Z Z Z
3 x 3
x e dx x ln xdx t ln(t + 1)dt
Z Z Z
(ln x)2 xe2x
(ln x)2 dx dx dx
x (2x + 1)2
Z Z Z
√ x2
(x2 − 1)ex dx x x − 1dx √ dx
2 + 3x

A.3.18. Calcular las siguientes integrales:

Z Z Z
3 5
cos x sen xdx sen 2x cos 2xdx sen5 x cos2 xdx
Z Z Z
cos2 3xdx sen4 πxdx sen2 x cos2 xdx
Z Z Z
2 2 2
x sen xdx x sen xdx sec 3xdx
Z Z Z
sec4 5xdx sec3 πxdx tan3 (1 − x)dx

A.3.19. Calcular las siguientes integrales:

Z Z Z
tan5 (x/4)dx sec2 x tan xdx tan2 x sec2 xdx
Z Z Z
sec5 πx tan πxdx sec6 4x tan 4xdx sec3 x tan xdx
Z Z Z
3 3
tan 3x sec 3xdx cotan 2xdx cosec4 θdθ
Z Z Z
cotan2 t
dt sen 3x cos 2xdx sen θ sen 3θdθ
cosec t
C ÁLCULO INTEGRAL 87

A.3.20. Calcular las siguientes integrales:

Z Z p Z
1 1
dx x x + x2 dx dx
(25 − x2 )3/2 (1 + x2 )2
Z Z p Z
x 1
√ dx 16 − 4x2 dx √ dx
x 2+9 x 2−9
Z Z √ Z
t2 1 − x2 1
dt dx √ dx
(1 − t2 )3/2 x4 2
Z Z p Z x 4x2 + 9
x x
dx e2x 1 + e2x dx √ dx
(x2 + 3)3/2 2x − x2

A.3.21. Calcular las siguientes integrales:

Z Z Z
1 3 5−x
2
dx 2
dx dx
Z x2 − 5x + 6 Z x 2+ x − 2 Z 2x2
+x−1
x + 12x + 12 4x + 2x − 1 x4
dx dx dx
x3 − 4x x3 + x2 (x − 1)3
Z Z 2 Z
3x x −1 x2
2 − 6x + 9
dx 3
dx 4 2
dx
Z x Z 2+x
x Z x − 2x2 − 8
x x +x+2 x +5
4
dx dx dx
16x − 1 (x2 + 2)2 x − 2x2 + 4x − 8
3

A.3.22. Calcular las siguientes integrales:

Z Z Z
5x2 + 20x + 6 5x2 + 20x + 6 2x3 − 4x − 8
dx dx dx
x3 + 2x2 + x x3 + 2x2 + x (x2 − x)(x2 + 4)
Z Z Z
8x3 + 13x x2 3x + 4
dx dx dx
(x2 + 2)2 (x + 1)2
1 3
x − 2x − 4
Z Z Z 3
6x2 − 3x + 14 x(2x − 9) x − 6x2 + x − 4
dx dx dx
x3 − 2x2 + 4x − 8 x3 − 6x2 + 12x − 8 1 − x4

A.3.23. Hallar el área comprendida entre la curva y = 6x − x2 y el eje OX.



A.3.24. Hacer un esquema de la región acotada superiormente por la curva y = x e inferiormente por la curva
x
y = , y determinar su área.
4
A.3.25. Hallar el área de la región comprendida entre las curvas y = x2 e y = x1/3 para x ∈ [−1, 1].
1 dy 1
A.3.26. Una curva que pasa por el punto (4, ) posee una pendiente variable de =− √ √ .
3 dx 2 x(1 + x)2
a) Hallar la ecuación de la curva.
b) Representar gráficamente la curva.
c) Calcular el área bajo la curva en el intervalo [0, 1].
1 1
A.3.27. Hallar el área de la región comprendida entre las curvas y = ey= 3
x2 − x x −x
a) en el intervalo [2, 3].
b) a la derecha de x = 3.

A.3.28. Calcular el área de la región S comprendida entre la curva de ecuación y = x2 e−x y el eje OX.

A.3.29. Hallar la constante a para que el área encerrada por a(x2 − y 2 ) + x3 = 0 sea igual a 120 unidades
cuadradas.
88 MATEM ÁTICAS

A.3.30. El plano de un triángulo móvil permanece perpendicular a un diámetro fijo de radio a; la base del triángulo
es una cuerda del cı́rculo y su vértice opuesto está en una recta paralela al diámetro fijo y a distancia h del
plano del cı́rculo. Hallar el volumen del sólido engendrado por el movimiento de este triángulo desde un
extremo al otro del diámetro.

A.3.31. La base de un sólido es la región compredida entre la curva y = sen x y las rectas x = 0, x = π/2
e y = 0. Las secciones planas del sólido perpendicular al eje OX son triángulos equiláteros. Hallar el
volumen del sólido.

A.3.32. Un leñador arranca una cuña de un árbol cilı́ndrico de radio a. Su primer corte es paralelo al suelo y llega
hasta el eje del cilindro. El segundo corte forma un ángulo α con el primero y lo intersecta en su diámetro.
Calcular el volumen de la cuña. Indicación: Situar el eje OX de forma que las secciones transversales
perpendiculares a él sean rectángulos.

A.3.33. Calcular el volumen del sólido generado al girar respecto del eje OY la región limitada por las parábolas
y = x2 y 8x = y 2 .

A.3.34. Calcular
√ el volumen del sólido generado al girar el triángulo equilátero de vértices (0, 0), (2a, 0) y
(a, a 3) alrededor del eje OX.

A.3.35. La figura limitada por la hipocicloide x2/3 + y 2/3 = α2/3 y el eje OX gira alrededor de dicho eje. Hallar
el volumen del cuerpo de revolución engendrado.
a x
A.3.36. Dada la curva de ecuación y = ln , a > 0, calcular el volumen engendrado al girar alrededor del eje
x a
OX la región limitada por dicha curva y las rectas x = a y x = a/2.

A.3.37. Sea el volumen de revolución engendrado por f (x) = x(x − a), a > 0, al girar alrededor del eje OX,
entre las rectas x = 0 y x = c, con c > a. Hallar c para que dicho volumen sea igual al volumen del cono
engendrado por el triángulo de vértices (0, 0), (c, 0) y (c, f (c)) al girar alrededor del eje OX.

A.3.38. Hallar el volumen del sólido engendrado al girar alrededor de la recta de ecuación x = 2, la región
limitada por la curva y = x2 , el eje OX y la recta x = 2.

A.3.39. Calcular la longitud del arco de la curva y 2 = x3 ,


a) entre los puntos (0, 0) y (4, 8).
4
b) entre dicha curva y la recta x = .
3
√ √
A.3.40. Calcular la longitud del arco de la curva f (x) = ln x desde el punto x = 3 hasta x = 8.
ex + 1
A.3.41. Calcular la longitud de la curva y = ln entre los valores x1 = a y x2 = b.
ex − 1
A.3.42. Calcular la longitud del arco de la involuta de un cı́rculo

x = a(cos t + t sen t)
y = a(sen t − t cos t)

desde t = 0 hasta t = 2π.

A.3.43. Calcular la longitud de arco de la curva



t6 
x= 

6 


t4 

y =2−
4
entre los puntos de intersección de dicha curva con los ejes coordenados.

A.3.44. Hallar la longitud de la primera espira de la espiral de Arquı́medes ρ = aϕ.


C ÁLCULO INTEGRAL 89

A.3.45. Hallar la longitud de la espiral logarı́tmica ρ = emϕ entre cierto punto (ρo , ϕo ) y un punto móvil (ρ, ϕ).
A.3.46. Calcular el área de la superficie generada por la curva y = ln x desde x = 1 hasta x = 5, al girar
alrededor del eje x = 0.
A.3.47. Hallar el área de la superficie engendrada al girar alrededor del eje OX el contorno cerrado formado por
las curvas x = y 2 e y = x2 .
x3
A.3.48. Calcular el área de la superficie generada al girar alrededor del eje OX la curva y = entre los puntos
3
de abcisas x = −2 y x = 2.
A.3.49. Usar las reglas del trapecio y de Simpson para aproximar las siguientes integrales. Comparar las aproxi-
maciones con los valores reales.
Z 2 Z 0.1
a) ln xdx b) x1/3 dx
1 0
Z π/3 Z 0.4
c) (sen x)2 dx d) e3x cos 2xdx
0 0.2
Z π/4 Z 3π/4
e) tan xdx f) cot xdx
0 π/2

A.3.50. Usar los valores de abajo para encontrar una aproximación a la integral
Z 1.5
ex dx
1.1

usando los métodos siguientes:


a) la regla del trapecio con x0 = 1.1 y x1 = 1.5;
b) la regla de Simpson con x0 = 1.1, x1 = 1.3 y x2 = 1.5.
exp(1.1) = 3.0042 exp(1.3) = 3.6693 exp(1.5) = 4.4817

4. ACTIVIDADES PRÁCTICAS DEL CAPÍTULO

4.1. Introducción

La práctica se va a realizar con el programa de cálculo matemático DERIVE for Windows, versión 4.05, de Soft
Warehouse. DERIVE for Windows permite realizar cálculos y manipulaciones matemáticas de carácter general,
lo cual significa que realiza muchas cosas de forma aceptable aunque no tiene la potencia de otros programas
especı́ficos. No obstante, DERIVE for Windows permite realizar todos los cálculos que un usuario medio puede
necesitar.

En esta práctica nos vamos a centrar en el cálculo integral en una variable. Veremos cómo calcular integrales
inmediatas y utilizando los distintos métodos de integración: por cambio de variable, por partes, exponenciales y
logarı́tmicas, trigonométricas, racionales y binomias. Finalizaremos la práctica analizando algunas aplicaciones
del cálculo integral al cálculo de longitudes, áreas y volúmenes.

Antes de comenzar la práctica será conveniente que recordemos brevemente la ‘botonera’ de DERIVE for Win-
dows (ver Figura 3.12), ya que simplifica enormemente la introducción de datos y la realización de cálculos. Los
botones permiten realizar las siguientes tareas (de izquierda a derecha): New (abrir una nueva hoja de trabajo),
Open (abrir una hoja de trabajo existente), Save (guardar la sesión de trabajo), Print (imprimir la sesión de tra-
bajo), Remove (eliminar la expresión marcada), Unremove (recuperar la última expresión eliminada), Renumber
90 MATEM ÁTICAS

(renumerar las expresiones), Author expression (introducir una expresión sencilla), Author vector (introdu-
cir un vector), Author matrix (introducir una matriz), Simplify (simplificar), Approximate (calcular un valor
aproximado), Solve (resolver algebraicamente o numéricamente una expresión), Substitute for variables
(realizar una sustitución), Calculate limit (calcular un lı́mite), Calculate derivative (calcular una deriva-
da), Calculate integral (calcular una integral), Calculate sum (calcular una suma), Calculate product
(calcular un producto), 2D-plot window (realizar un gráfico bidimensional) y 3D-plot window (realizar un
gráfico tridimensional).

Figura 3.12: El uso de la ‘botonera’ de DERIVE for Windows nos puede simplificar mucho el trabajo. Otro elemento
interesante es la existencia de ‘teclas calientes’ que nos permiten evitar los menús, con lo que se gana
en rapidez.

4.2. Ejemplos de ilustración

DERIVE for Windows calcula sin ayuda la mayorı́a de integrales: polinómicas, trigonométricas y racionales.
Cuando la integral no es sencilla, o bien cuando DERIVE for Windows no sabe qué hacer, podemos ayudarle de
varias formas: transformando el integrando en otro más fácil de integrar o indicándole el método de integración
que debe utilizar. En este último caso, el programa nos proporciona una serie de utilidades que pueden ser
cargadas mediante las opciones File|Load|Math o File|Load|Util. Para escribir los integrandos podemos
utilizar todas las funciones que entiende DERIVE for Windows, las cuales se presentan en la siguiente tabla.

Función Teclear Función Teclear Función Teclear



x SQRT(x) ex EXP(x) ln(x) LN(x)
logb (x) LOG(x,b) sen(x) SIN(x) cos(x) COS(x)
tan(x) TAN(x) cotan(x) COT(x) sec(x) SEC(x)
cosec(x) CSC(x) arctan(x) ATAN(x) arccot(x) ACOT(x)
arcsen(x) ASIN(x) arcos(x) ACOS(x) arcsec(x) ASEC(x)
arcosec(x) ACSC(x) senh(x) SINH(x) cosh(x) COSH(x)
tanh(x) TANH(x) cotanh(x) COTH(x) sech(x) SECH(x)
cosech(x) CSCH(x) arcsenh(x) ASINH(x) arcosh(x) ACOSH(x)
arctanh(x) ATANH(x) arccoth(x) ACOTH(x) arcsech(x) ASECH(x)
arcosech(x) ACSCH(x)

R
Calcular (4x2 − 2x + 7)dx

Introducimos la expresión 4x^2-2x+7 y seleccionamos Calculus|Integrate con la opción variable igual a x,


por defecto (ver Figura 3.13). El programa está preparado para calcular integrales indefinidas (por defecto) y
definidas. En el primer caso, el programa admite una constante de integración (por defecto, 0). Para obtener la
solución debemos pulsar la tecla Simplify y resultará:

4 3
x − x2 + 7x
3
C ÁLCULO INTEGRAL 91

Figura 3.13: Ventana del programa que nos permite calcular integrales de funciones.

Z
3x + 5
Calcular dx
x3 − x2 − x + 1

Escribimos la expresión (3x+5)/(x^3-x^2-x+1) y procedemos exactamente igual que en el ejemplo anterior.


El resultado obtenido es
LN(x-1) LN(x+1) 4
− + −
2 2 x-1


Calcular 0
cos(x)dx

Seleccionamos Author y tecleamos COS(x). A continuación elegimos Calculus|Integrate con las opciones
x (variable), π (lı́mite superior) y 0 (lı́mite inferior). El resultado obtenido (si estamos trabajando con precisión
exacta) es 0.

Calcula el área bajo la curva y = cosh(x) entre −2 y 2

Siguiendo los pasos anteriores, introducimos la expresión COSH(x) y a continuación seleccionamos en el menú
Calculus|Integrate con las opciones x (variable), 2 (lı́mite superior) y -2 (lı́mite inferior). El resultado
obtenido es e2 − e−2 .

Cuando la integral no es tan sencilla y el programa no consigue integrar la función debemos ayudarle indicándole
cuál de los métodos de integración debe utilizar. En los siguientes ejemplos mostramos algunos casos tı́picos.
Para poder utilizar la integración por sustitución o por partes debemos de cargar la utilidad MISC.MTH, según se
ha explicado anteriormente.

Z
ex + 1
Calcular dx
ex − 4 + 4e−x

Esta integral la podemos calcular siguiendo los mismos pasos que en los ejemplos anteriores. Sin embargo, aquı́
la vamos a calcular mediante un cambio de variable. Consideremos el cambio t = t(x) = ex , entonces la manera
de indicárselo a DERIVE for Windows es mediante la orden INT SUBST. Concretamente deberı́amos teclear
92 MATEM ÁTICAS

INT SUBST((#e^x+1)/(#e^x-4+4#e^(-x)),x,LN(x))

y obtendrı́amos como resultado el valor de

3
+ LN(ex − 2)
2 − ex

En general, si deseamos integrar la función f (x) mediante el cambio de variable x = g(t), debemos escribir

INT SUBST(f(x),x,g(x))

R
Calcular la integral (5x2 − 3)43x+1 dx

El programa DERIVE for Windows puede calcular la integral anterior, cuyo resultado es
 
10x2 2 10x 5
26x − − 2
+ .
3LN(2) LN(2) 9LN(2) 27LN(2)3

Sin embargo, las integrales de este tipo se suelen resolver por partes, ya que la función que deseamos integrar se
descompone como un producto de dos funciones, una que se deriva fácilmente (5x2 − 3) y otra que se integra
fácilmente (43x+1 ). Por este motivo, vamos a ilustrar como indicarle a DERIVE for Windows que utilice deri-
vación por partes. Una vez cargado el fichero MISC.MTH tecleamos INT PARTS(u(x),v(x),x), donde u(x) y
v(x) son las partes que se derivan e integran fácilmente, respectivamente. En nuestro ejemplo, debemos teclear
INT PARTS(5x^2-3,4^(3x+1),x).

Una de las caracterı́sticas de DERIVE for Windows es su capacidad de calcular integrales que requieren el
cómputo de otras integrales previas. Esto es lo que ocurre, por ejemplo, en la integración por reducción que se
aplica a integrales con exponentes enteros grandes. Durante el proceso se encuentra una parte integrada y una
parte sin integrar en la que aparece la misma integral inicial pero con valores de estos exponentes disminuidos.

En los ejemplos que siguen aplicamos la integral al cálculo de longitudes, áreas y volumenes.

Un cable eléctrico cuelga entre dos torres de la misma altura que están separadas 80 metros. El cable adopta la
posición de una catenaria cuya ecuación es y = 100 cosh(x/100). Calcula la longitud del cable entre las dos
torres.

Cuando tenemos una curva y = f (x), la longitud de la curva entre los puntos (a, f (a)) y (b, f (b)) es la integral
Z b p
1 + f 0 (x)2 dx.
a

En nuestro caso, la derivada es f 0 (x) = sinh(x/100) por lo que la longitud será la integral
Z 40 p
1 + sinh(x/100)2 dx,
−40

cuyo valor es 82.1506. Si cargamos la utilidad INT APPS.MTH entonces DERIVE for Windows pone a nuestra
disposición la función ARC LENGTH, con lo que podrı́amos haber calculado la longitud de la catenaria con sólo
escribir ARC LENGTH(100 COSH(x/100),x,-40,40).
C ÁLCULO INTEGRAL 93

Calcular el área de la región limitada por las curvas f (x) = 2 − x2 y g(x) = x

En primer lugar debemos hallar los puntos de corte, para lo que planteamos la ecuación 2-x^2=x que resolvemos
con ayuda de la opción Solve para obtener x = −2 y x = 1. Entonces el área se calcula con la función siguiente:
AREA(x,-2,1,y,x,2-x^2) cuyo resultado es 4.5. En general, la sintaxis de la función área es

AREA(x,a,b,y,f(x),g(x)),

donde a y b son las abcisas de los puntos de corte y se supone que la función g es mayor o igual que la función f .

Calcular el área de la superficie del paraboloide z = 2 − x2 − y 2 que está sobre la región cuadrada limitada por
−1 6 x 6 1 y −1 6 y 6 1

Para el cálculo de áreas de superficies, DERIVE for Windows dispone de la función SURFACE AREA, cuya sintaxis
es la siguiente:

SURFACE AREA(f(x,y),x,x 1,x 2,y,y 1,y 2),

donde z = f (x, y) es la superficie y el recinto es el rectángulo [x1 , x2 ] × [y1 , y2 ]. En nuestro caso, basta con
escribir SURFACE AREA(2-x^2-y^2,x,-1,1,y,-1,1) para obtener como resultado el valor de 7.44625.

Calcular el volumen de la semiesfera de radio 1

Dada una función z = f (x, y) definida en un recinto (rectangular o no), podemos calcular el volumen que hay
entre el recinto y la superficie z = f (x, y) definida sobre él. Para ello debemos utilizar la función VOLUME, cuya
sintaxis es

VOLUME(x,a 1,a 2,y,b 1(x),b 2(x),z,c 1(x,y),c 2(x,y)),

donde se supone que a1 6 x 6 a2 , b1 (x) 6 y 6 b2 (x), c1 (x, y) 6 z 6 c2 (x, y). Por tanto, el volumen de la
semiesfera es

VOLUME(x,-1,1,y,-SQRT(1-x^2),SQRT(1-x^2),z,0,SQRT(1-x^2-y^2))

cuyo resultado es 2.09439 (en precisión aproximada) o 2π/3 (en precisión exacta).

4.3. Ejercicios de aplicación

A continuación se enuncian unos ejercicios sobre cálculo integral de funciones reales de una variable. Si el alumno
encuentra alguna dificultad debe revisar detenidamente los ejemplos anteriores.
94 MATEM ÁTICAS

Z
−12
a) Calcular la integral √ dx.
x2 4 − x2
Z
sec2 t
b) Calcular la integral dx.
tan t(tan t − 1)
Z
x1/4
c) Calcular la integral dx.
1 + x1/2
Z
x4 + 2x2 + x + 1
d) Calcular la integral dx.
(x2 + 1)3
Z
1
e) Calcular la integral √ √ dx.
x(1 − cos x)
Z
x
f) Calcular la integral dx.
1 + e−2

g) Calcular el área de la región comprendida entre las gráficas de f (x) = 3x3 − x2 − 10x y g(x) = −x2 + 2x.

h) Calcular el volumen del sólido generado al girar la región limitada por f (x) = 2 − x2 y g(x) = 1 en torno
a la recta y = 1.

i) Calcular el volumen del sólido generado al girar la región acotada por las gráficas y = x2 + 1, y = 0, x = 0
y x = 1 en torno al eje y.

4.4. Bibliografı́a

C. Paulogorrón y C. Pérez. Cálculo matemático con DERIVE para PC, Ed. RA-MA, 1a Ed., 1994.

5. BIBLIOGRAFÍA DEL CAPÍTULO

R.E. LARSON, R.P. HOSTETLER y B.H. EDWARDS Calculo y Geometrı́a Analı́tica, 5a ed., vol. 1. McGraw-
Hill, Madrid, 1995. Capı́tulos 5, 6 y 9.

J. STEWART Cálculo, 2a ed. Grupo Editorial Iberoamérica, México, 1994. Capı́tulos 4, 5, 7, y secciones 8.2 y
8.3.

6. PREGUNTAS DE EVALUACIÓN

E.3.1. Calcular las siguientes integrales indefinidas


Z Z √
ln(x2 + x + 1) 4 − x2
dx dx.
x2 x

E.3.2. Calcular el volumen


p del sólido de revolución generado al girar alrededor del eje OX el recinto limitado por
la curva y = ex sen(3x) entre x = 0 y x = π/3.
C ÁLCULO INTEGRAL 95

E.3.3. Calcular la siguiente integral indefinida


Z √
16 − x2
dx.
x3

E.3.4. Calcular el área del recinto limitado por la curva y = ex senx y por las rectas y = 0, x = 0 y x = π.
E.3.5. Un tanque está situado sobre una colina de 120 metros de altura. Lanza un proyectil que sigue una trayec-
toria dada por
y(x) = −00 05x2 + x + 120,
donde x e y se miden en metros, como muestra la siguiente figura.
y
6

120

0 - x
0
¿Cuál es la distancia recorrida por el proyectil durante su trayecto hasta impactar en el suelo?
E.3.6. Calcular la siguiente integral: Z
3x + 4
dx
x3 − 2x − 4
E.3.7. Un objeto volante sale del origen y asciende por el eje y. Al mismo tiempo un perseguidor parte del punto
(1, 0) y se dirige en todo momento hacia él con velocidad doble que la suya. La ecuación de la trayectoria
del perseguidor es
1
y = (x3/2 − 3x1/2 + 2)
3

¿Cuánta distancia ha recorrido el objeto volante en el instante de ser capturado? ¿Y cuál ha sido la distancia
recorrida por el perseguidor?
E.3.8. Resolver la integral indefinida siguiente:
Z
2x3 − 4x − 8
dx.
x4 − x3 + 4x2 − 4x

E.3.9. Resolver la integral indefinida siguiente:


Z
dx
.
(x3 − 1)2
96 MATEM ÁTICAS

ANOTACIONES

....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
CAPÍTULO 4
ECUACIONES DIFERENCIALES ORDINARIAS

1. INTERROGANTES CENTRALES DEL CAPÍTULO

• Tipo y orden de una ecuación diferencial • Ecuaciones de primer orden exactas


• Solución de una ecuación diferencial • Ecuaciones lineales de segundo orden
• Ecuaciones de primer orden separables • Método de los coeficientes indeterminados
• Ecuaciones de primer orden homogéneas • Método de variación de parámetros
• Ecuaciones de primer orden lineales • Ecuaciones lineales de orden superior

2. CONTENIDOS FUNDAMENTALES DEL CAPÍTULO

2.1. Definiciones y conceptos básicos

Una ecuación diferencial es una ecuación en la que interviene una función incógnita y una o varias de sus deri-
vadas. Este tipo de ecuaciones aparece en el estudio de numerosos fenómenos fı́sicos y quı́micos: desintegración
radiactiva, crecimiento de poblaciones, reacciones quı́micas, problemas gravitatorios, etc. No es exagerado afir-
mar que la naturaleza se describe por medio de ecuaciones diferenciales, de modo que un conocimiento de esta
última materia nos ayudará a entender mejor los fenómenos naturales.

Las ecuaciones diferenciales se pueden clasificar, básicamente, atendiendo a dos criterios:

(1) TIPO: Si la función incógnita contiene una única variable independiente, entonces la ecuación se denomina
ecuación diferencial ordinaria, abreviadamente E.D.O. En otro caso, cuando la función incógnita contiene
dos o más variables independientes, la ecuación se dice que es una ecuación diferencial en derivadas
parciales.
(2) ORDEN: Es la derivada de orden más alto que aparece en la ecuación diferencial.

Es innecesario decir que el estudio de las ecuaciones diferenciales en derivadas parciales requiere unas técnicas
matemáticas que están fuera del alcance del alumno, por lo que nos restringiremos al análisis de las ecuaciones
diferenciales ordinarias.

Consideremos una ecuación diferencial ordinaria

F (x, y, y 0 , y 00 , . . .) = 0.
98 MATEM ÁTICAS

Diremos que una función y = f (x) es una solución de la ecuación diferencial si la ecuación se satisface al sustituir
en ella y y sus derivadas por f (x) y sus derivadas respectivas.

La solución general de una ecuación diferencial ordinaria es una función y = f (x, c1 , c2 , . . .) dependiente de
una o varias constantes tal que cualquier solución de la ecuación diferencial se obtiene dando valores especı́ficos
a una o más de las constantes. Cuando damos valores concretos a todas las constantes de la solución general,
surge una solución particular. Geométricamente, la solución general de una ecuación diferencial de primer
orden representa una familia de curvas, denominadas curvas solución, una para cada valor concreto asignado a la
constante arbitraria.

En la práctica, la determinación de las constantes que aparecen en la solución general se realiza a partir de las
condiciones iniciales del problema. Las condiciones iniciales del problema son los valores que adquiere la función
solución o sus derivadas en determinados puntos. Por ejemplo, para una ecuación diferencial de primer orden

y 0 = F (x, y),

una condición inicial se expresarı́a en la forma

y(x0 ) = y0 .

En consecuencia, y = f (x) es solución si f 0 (x) = F (x, f (x)) para todo valor de x en cierto intervalo, y f (x0 ) =
y0 .

2.2. Ecuaciones diferenciales de primer orden

Una ecuación diferencial ordinaria de primer orden es una ecuación de la forma

y 0 = F (x, y),

donde F es una función que depende de las variables x e y. Esta clase de ecuaciones diferenciales son de las
más sencillas, y su resolución se puede realizar utilizando diversas técnicas. Describimos a continuación las más
importantes.

2.2.1. Ecuaciones separables

Una ecuación diferencial de primer orden se dice que es separable si puede escribirse en la forma

dy
M (x) + N (y) = 0,
dx

donde M (x) es una función continua que sólo depende de x y N (y) es una función continua que sólo depende
de y. Para resolver este tipo de ecuaciones se utiliza el procedimiento de separación de variables, que consiste
en situar todos los términos que contienen x a la izquierda (o la derecha) del signo de igualdad, y todos los
términos que contienen y en el lado contrario. A continuación se integran ambos miembros de la igualdad, cada
uno respecto de la variable correspondiente. En consecuencia, la solución viene dada por
Z Z
M (x)dx + N (y)dy = C.
ECUACIONES DIFERENCIALES ORDINARIAS 99

2.2.2. Ecuaciones homogéneas

Una función z = f (x, y) se dice que es homogénea de grado n si

f (tx, ty) = tn f (x, y),

donde n es un número real.

Una ecuación diferencial homogénea es cualquier ecuación diferencial que se puede escribir en la forma

M (x, y)dx + N (x, y)dy = 0,

donde M y N son funciones homogéneas del mismo grado. La ecuación anterior puede escribirse como

y 0 = F (x, y),

donde la función F satisface F (tx, ty) = F (x, y).

Este tipo de ecuaciones diferenciales se convierten en ecuaciones separables tras un cambio de variables. Con-
cretamente si y 0 = F (x, y) es una ecuación homogénea, entonces el cambio de variable y = vx, donde v es una
función derivable de x, transforma la ecuación anterior en una nueva ecuación diferencial en las variables x y v
que es separable.

2.2.3. Ecuaciones lineales

Una ecuación diferencial lineal de primer orden es toda ecuación que se puede escribir en la forma

y 0 + P (x)y = Q(x),

donde P y Q son funciones continuas de x.

La resolución de este tipo de ecuaciones se consigue utilizando la técnica de los factores integrantes. Un factor
integrante es una función u(x) tal que al multiplicarla por el lado izquierdo de la ecuación se obtiene la derivada
del producto u(x)y, es decir,
d[u(x)y]
u(x)y 0 + u(x)P (x)y = .
dx
Es fácil probar que un factor integrante es la función
R
P (x)dx
u(x) = e

Entonces la solución de la ecuación diferencial es


R
Z R
− P (x)dx P (x)dx
y=e Q(x)e dx + C.

Hay ecuaciones no lineales que se transforman, mediante una sustitución adecuada, en una ecuación lineal. Entre
estas ecuaciones debemos destacar la ecuación diferencial de Bernoulli, que puede escribirse como

y 0 + P (x)y = Q(x)y n .

Esta ecuación es lineal si n = 0 y de variables separables si n = 1. Para otros valores de n, el cambio de variable
z = y 1−n transforma la ecuación anterior en la siguiente ecuación lineal:

z 0 + (1 − n)P (x)z = (1 − n)Q(x).


100 MATEM ÁTICAS

2.2.4. Ecuaciones exactas

Esta sección debe estudiarse después del cálculo diferencial en varias variables, ya que se hace uso del concepto
de derivada parcial.

Una ecuación diferencial de la forma

M (x, y)dx + N (x, y)dy = 0

se dice que es una ecuación diferencial exacta si existe una función f de dos variables x e y, con derivadas
parciales continuas, tal que
∂f ∂f
(x, y) = M (x, y) y (x, y) = N (x, y).
∂x ∂y
La solución general de la ecuación es f (x, y) = C.

No toda ecuación diferencial es exacta. Entonces, ¿cómo podemos distinguir las que son de las que no lo son? El
siguiente resultado nos da la solución.

Si M y N tienen derivadas parciales continuas en un disco abierto entonces la ecuación diferencial M (x, y)dx +
N (x, y)dy = 0 es exacta si y solamente si
∂M ∂N
= .
∂y ∂x

Debemos hacer notar que la exactitud es una condición extremadamente frágil, ya que pequeñas alteraciones en
una ecuación exacta pueden hacer que se pierda dicha propiedad. Por ejemplo, la ecuación diferencial

(xy 2 + x)dx + yx2 dy = 0

es exacta, pero si dividimos por x, entonces la ecuación resultante

(y 2 + 1)dx + xydy = 0

ya no es exacta.

2.3. Ecuaciones lineales de segundo orden

Una ecuación diferencial lineal de segundo orden es una ecuación diferencial que puede escribirse en la forma

y 00 + P (x)y 0 + Q(x)y = R(x),

donde P , Q y R son funciones continuas de x en un cierto intervalo. Se dice que la ecuación es homogénea si
R(x) = 0 para todo x. En otro caso, la ecuación se dice que es no homogénea.

La resolución de las ecuaciones diferenciales de segundo orden homogéneas se apoya en dos resultados básicos:
la combinación lineal de dos soluciones es otra solución, y toda solución es combinación lineal de dos soluciones
independientes. Más concretamente, tenemos los siguientes resultados.

(1) Si y1 (x) e y2 (x) son soluciones de una ecuación diferencial homogénea y c1 y c2 son dos constantes,
entonces
y(x) = c1 y1 (x) + c2 y2 (x)
es una solución de la misma ecuación diferencial.
ECUACIONES DIFERENCIALES ORDINARIAS 101

(2) Si y1 (x) e y2 (x) son soluciones linealmente independientes (ninguna de ellas es un múltiplo de la otra) de
una ecuación diferencial homogénea de segundo orden, entonces la solución general está dada por
y(x) = c1 y1 (x) + c2 y2 (x),
donde c1 y c2 son dos constantes.

En general, encontrar las soluciones de una ecuación de segundo orden (homogénea o no homogénea) es difı́cil,
a veces imposible. Sin embargo, si las funciones P y Q son constantes, entonces siempre se pueden hallar
soluciones. En los siguientes apartados describimos cómo hacerlo.

2.3.1. Ecuaciones lineales de coeficientes constantes homogéneas

Consideremos la ecuación de segundo orden con coeficientes constantes siguiente:


y 00 + ay 0 + by = 0.
Las soluciones de dicha ecuación se determinan a partir de las raı́ces de la ecuación
r 2 + ar + b = 0,
denominada ecuación caracterı́stica. Se pueden presentar las siguientes tres posibilidades:

(1) Raı́ces reales diferentes: Si r1 6= r2 son las raı́ces reales distintas de la ecuación caracterı́stica, entonces la
solución general es
y = c1 er1 x + c2 er2 x .
(2) Raı́ces reales iguales: Si r1 = r2 son las raı́ces reales iguales de la ecuación caracterı́stica, entonces la
solución general es
y = c1 er1 x + c2 xer1 x = (c1 + c2 x)er1 x .
(3) Raı́ces complejas: Si r1 = α + iβ y r2 = α − iβ son las raı́ces complejas de la ecuación caracterı́stica,
entonces la ecuación general es
y = c1 eαx cos(βx) + c2 eαx sen(βx).

2.3.2. Ecuaciones lineales de coeficientes constantes no homogéneas

Consideremos la ecuación de segundo orden con coeficientes constantes siguiente:


y 00 + ay 0 + by = R(x).
En la búsqueda de las soluciones de dicha ecuación, juega un papel importante la solución de la ecuación
y 00 + ay 0 + by = 0
denominada ecuación homogénea asociada. El siguiente resultado nos resuelve la ecuación.

La solución general de la ecuación y 00 + ay 0 + by = R(x) se puede escribir como


y(x) = yh (x) + yp (x),
en donde yh (x) es la solución general de la ecuación homogénea asociada e yp (x) es una solución particular.

El problema que se nos presenta ahora es la determinación de la solución yp (x). Describimos a continuación dos
técnicas.
102 MATEM ÁTICAS

2.3.2.1. Método de los coeficientes indeterminados

Si la función R(x) consiste en la suma o producto de factores de los siguientes tipos:

(I) Polinómico: xn ,

(II) Exponencial: erx ,

(III) Trigonométrico: cos βx, sen βx,

entonces podemos hallar una solución particular yp (x) por el método de los coeficientes indeterminados. La clave
consiste en conjeturar que la solución yp es de una forma especial, la cual depende de la función R. Las reglas
que deben seguirse son:

(1) Si R(x) es un polinomio (tipo I), entonces se prueba con un polinomio del mismo grado.

(2) Si R(x) es exponencial (tipo II), entonces se prueba con Aerx .

(3) Si R(x) es trigonométrico (tipo III), entonces se prueba con A cos βx + B sen βx.

(4) Si R(x) es la suma o producto de factores anteriores, entonces se prueba con la suma o producto, respecti-
vamente, de las correspondientes soluciones particulares.

(5) Si cualquier término de yp es solución de la ecuación homogénea asociada, se multiplica yp por x (o x2 si


es necesario).

2.3.2.2. Método de variación de parámetros

El método de los coeficientes indeterminados descrito anteriormente funciona bien si la función R(x) está formada
por polinomios, exponenciales o funciones trigonométricas (senos y cosenos). La razón hay que buscarla en que
las derivadas de este tipo de funciones no son más complicadas que las funciones originales. Esto no ocurre, por
ejemplo, con funciones como 1/x o tan x.

El método de variación de parámetros parte de la suposición que yp (x) tiene la misma forma que yh (x), excepto
que las constantes c1 y c2 se sustituyen por dos funciones u1 (x) y u2 (x). El método consiste en lo siguiente:

(1) Hallar la solución general yh (x) = c1 y1 (x) + c2 y2 (x).

(2) Sustituir las constantes por funciones para formar yp (x) = u1 (x)y1 (x) + u2 (x)y2 (x).

(3) Resolver el siguiente sistema para u01 y u02 :

u01 y1 + u02 y2 = 0
u01 y10 + u02 y20 = R(x)

(4) Integrar para hallar u1 y u2 .


ECUACIONES DIFERENCIALES ORDINARIAS 103

2.4. Ecuaciones lineales de orden superior con coeficientes constantes

Consideremos la ecuación de orden n con coeficientes constantes siguiente:

y (n) + an−1 y (n−1) + · · · + a1 y 0 + a0 y = 0.

Las soluciones de dicha ecuación se determinan a partir de las raı́ces de la ecuación

r n + an−1 r n−1 + · · · + a1 r + a0 = 0,

denominada ecuación caracterı́stica.

Cada raı́z r de la ecuación caracterı́stica genera un término de la solución de acuerdo con las siguientes reglas:

(1) r es raı́z real: Si m es la multiplicidad de r como raı́z de la ecuación caracterı́stica, entonces r colabora a la
solución general con
y = C(x)erx ,
donde C(x) es un polinomio de grado m − 1.

(2) r = α ± iβ es raı́z compleja: Si m es la multiplicidad de r como raı́z de la ecuación caracterı́stica, entonces


r colabora a la solución general con

y = eαx (C1 (x) cos(βx) + C2 (x) sen(βx)) ,

donde C1 (x) y C2 (x) son polinomios de grado m − 1.

En consecuencia, la solución general de la ecuación de orden n se obtiene como sigue. Sean r1 , r2 , . . . , rk , las
raı́ces reales distintas de la ecuación caracterı́stica con multiplicidades m1 , m2 , . . . , mk , respectivamente, y sean
z1 = α1 ± iβ1 , z2 = α2 ± iβ2 , . . . , z` = α` ± iβ` las raı́ces complejas distintas de la ecuación con multiplicidades
n1 , n2 , . . . , n` , respectivamente. Entonces la ecuación general de la ecuación diferencial lineal homogénea de
orden n viene dada por

X
k X̀  
yh (x) = Ci (x)eri x + eαj x D1j (x) cos(βj x) + D2j (x) sen(βj x) ,
i=1 j=1

donde Ci (x) es un polinomio de grado mi − 1 para i = 1, . . . , k, y D1j (x), D2j (x) son polinomios de grado nj − 1
para j = 1, . . . , `.

Para finalizar, baste indicar que para obtener una solución particular de la ecuación diferencial de orden n no
homogénea se pueden utilizar los dos métodos descritos anteriormente para el caso de orden 2: coeficientes
indeterminados y variación de parámetros.

3. ACTIVIDADES DE APLICACIÓN DE LOS CONOCIMIENTOS

A.4.1. Hallar la solución general de las siguientes ecuaciones diferenciales, ası́ como la solución particular dada
por las condiciones iniciales que en cada caso se indican.

y 0 + ky = 0, k 6= 0 y(0) = 1, y 0 (0) = 0
y 0 + ky = senx y(0) = 2, y 0 (0) = 1
y + 2y 0 − 3y = 0
00
y(0) = 1, y(1) = 0
y 00 − y 0 = 0 y(0) = −3, y 0 (0) = 2
104 MATEM ÁTICAS

y 00 + ω 2 y = 0, ω 6= 0 y(0) = −2, y 0 (0) = 1


y 00 + 2y 0 − 3y = 6 y(0) = 1, y 0 (0) = −1
y 00 − y 0 = 2senx y(0) = 1, y 0 (0) = 0
y − 3y 0 + 2y = 5ex
00
y(0) = 0, y 0 (0) = −1
y 00 − 6y 0 + 9y = e3x y(1) = 1, y(2) = −2
y 00 − y 0 = 5ex − sen(2x) y(0) = 1, y 0 (0) = 0
y 00 + 4y = tanx y(0) = 1, y 0 (0) = 0
y + 2y 0 + y = ex
00
y(0) = 0, y(1) = −3
y 000 − 3y 00 + 2y 0 = 0 y(0) = 1, y 0 (0) = 0, y 00 (0) = 1
y 000 − y = 0 y(0) = 1, y 0 (0) = −1, y 00 (0) = 0
y 000 + 3y 00 − 4y = xe−2x y(0) = 0, y 0 (0) = 1, y 00 (0) = 2
y 000 + y 0 = cosecx
y (4) − 16y = 0
y (4) + y = x + 1

A.4.2. Se sabe que en un horno de cerámica, la velocidad a que se calienta un cuerpo es proporcional a 4 + T 2 ,
donde T (t) representa la temperatura del cuerpo que se calienta, medida en grados centı́grados, y t mide el
tiempo en minutos. Se√ introduce un cuerpo a temperatura inicial 2o C y se observa que al cabo de un minuto
o
su temperatura es 2 3 C. Determinar la función que nos permite expresar la temperatura del cuerpo en
función del tiempo.

A.4.3. Un grupo de biólogos ha determinado que la velocidad de aumento de una población de hormigas rojas
cabezonas es proporcional al número de individuos de dicha población. Sabiendo que al cabo de 2 meses la
población se ha duplicado, calcular cuánto tiempo tiene que transcurrir para que la población sea el triple
de la inicial.

A.4.4. Según la ley de enfriamiento de Newton, la velocidad a que se enfrı́a o calienta un cuerpo es proporcional
a la diferencia entre la temperatura del cuerpo y la temperatura del ambiente. Si un objeto se enfrı́a desde
100o C a 80o C en veinte minutos, siendo la temperatura del ambiente de 20o C, calcular el tiempo que ha de
pasar para que la temperatura del cuerpo sea de 60o C.

A.4.5. En cierto cultivo de bacterias, la velocidad de crecimiento de la población es proporcional al cuadrado de


la población presente.

(1) Si la población después de 3 horas es de 104 individuos y al cabo de dos horas más es de 4 × 104
individuos, calcular cuantos individuos habı́a en un principio.
(2) Sabiendo que después de 4 horas la población se ha duplicado, ¿cuál será la población presente al cabo
de 6 horas?

A.4.6. Un barco retrasa su movimiento por la acción de la resistencia del agua, que es proporcional a la velocidad
del barco. La velocidad inicial del barco es 10 metros/segundo y al cabo de 5 segundos su velocidad es 8
metros/segundo. Calcular al cabo de cuánto tiempo su velocidad será de 1 metro/segundo.

A.4.7. El fondo de un depósito de 300 litros de capacidad está cubierto de sal. Suponiendo que la velocidad
con que se disuelve la sal es proporcional a la diferencia entre la concentración en el instante dado y la
concentración de la disolución saturada (1 kilogramo de sal para 3 litros de agua) y sabiendo que al cabo
de un minuto la cantidad de sal disuelta es 1/3 de kilogramo, hallar la cantidad de sal que contendrá la
disolución al cabo de una hora.

A.4.8. Cuando se introduce glucosa por vı́a intravenosa a velocidad constante, el cambio en la concentración
global c(t) de glucosa en sangre con respecto al tiempo viene descrito por la siguiente ecuación diferencial

dc G
= − kc,
dt 100V
ECUACIONES DIFERENCIALES ORDINARIAS 105

donde G denota la velocidad constante a que se suministra la glucosa, V es el volumen total de la sangre
en el cuerpo y k es una constante positiva que depende del paciente. Calcular la función que nos permite
expresar la concentración de glucosa en sangre en función del tiempo.

A.4.9. Una frı́a mañana comenzó a nevar y continuó nevando a velocidad constante a lo largo del dı́a. Una
máquina quitanieves comenzó a trabajar a las doce del mediodı́a, quitando nieve a velocidad constante
(volumen por unidad de tiempo). Desde la una hasta las dos avanzó solamente la mitad de lo que habı́a
avanzado desde las doce hasta la una. Calcular la hora en que empezó a nevar.

A.4.10. En la conservación de alimentos, el azúcar de caña sufre un proceso de inversión y se transforma en


glucosa y fructosa. En soluciones diluidas, el ritmo de inversión es proporcional a la concentración y(t) del
azúcar inalterada. Si la concentración es 1/50 cuando t = 0 y 1/200 tras 3 horas, hallar la concentración del
azúcar inalterada después de 6 y 12 horas.

A.4.11. Según las leyes de la termodinámica, el flujo del calor a través de una superficie plana es ortogonal a las
curvas isotermas. Suponiendo que el flujo de calor describe una trayectoria dada por y = C/x, donde C es
una constante no nula, obtener las curvas isotermas.

A.4.12. La tasa de crecimiento de una población de moscas de la fruta en un instante dado es proporcional al
tamaño de la población en dicho momento. Si hay 180 moscas después del segundo dı́a del experimento y
300 moscas después del cuarto dı́a, ¿cuántas moscas habı́a originalmente?

A.4.13. El ritmo de desintegración del radio es proporcional a la cantidad presente en un instante dado. Hallar el
porcentaje de una muestra actual que quedará al cabo de 25 años si la vida media del radio es de 1600 años.

A.4.14. En una reacción quı́mica, un cierto compuesto se transforma en otra sustancia a un ritmo proporcional a
la cantidad no transformada. Si habı́a inicialmente 20gr. de la sustancia original y 16gr. tras 1 hora, ¿en qué
momento se habrá transformado el 75% de dicho compuesto?

4. ACTIVIDADES PRÁCTICAS DEL CAPÍTULO

4.1. Introducción

La práctica se va a realizar con el programa de cálculo matemático DERIVE for Windows, versión 4.05, de Soft
Warehouse. DERIVE for Windows permite realizar cálculos y manipulaciones matemáticas de carácter general,
lo cual significa que realiza muchas cosas de forma aceptable aunque no tiene la potencia de otros programas
especı́ficos. No obstante, DERIVE for Windows permite realizar todos los cálculos que un usuario medio puede
necesitar.

En esta práctica nos vamos a centrar en la resolución de ecuaciones diferenciales. DERIVE for Windows resuelve
todas las ecuaciones diferenciales de primer grado y primer orden mediante los métodos más conocidos (variables
separadas, ecuaciones diferenciales lineales, ecuaciones exactas, factores integrantes, etc.) DERIVE for Windows
proporciona, siempre que puede, la solución explı́cita de la ecuación diferencial. No obstante, es posible que
DERIVE for Windows ofrezca una solución que dependa de una integral no resoluble algebraicamente.

Antes de comenzar la práctica será conveniente que recordemos brevemente la ‘botonera’ de DERIVE for Win-
dows (ver Figura 4.1), ya que simplifica enormemente la introducción de datos y la realización de cálculos. Los
botones permiten realizar las siguientes tareas (de izquierda a derecha): New (abrir una nueva hoja de trabajo),
Open (abrir una hoja de trabajo existente), Save (guardar la sesión de trabajo), Print (imprimir la sesión de tra-
bajo), Remove (eliminar la expresión marcada), Unremove (recuperar la última expresión eliminada), Renumber
(renumerar las expresiones), Author expression (introducir una expresión sencilla), Author vector (introdu-
cir un vector), Author matrix (introducir una matriz), Simplify (simplificar), Approximate (calcular un valor
106 MATEM ÁTICAS

aproximado), Solve (resolver algebraicamente o numéricamente una expresión), Substitute for variables
(realizar una sustitución), Calculate limit (calcular un lı́mite), Calculate derivative (calcular una deriva-
da), Calculate integral (calcular una integral), Calculate sum (calcular una suma), Calculate product
(calcular un producto), 2D-plot window (realizar un gráfico bidimensional) y 3D-plot window (realizar un
gráfico tridimensional).

Figura 4.1: El uso de la ‘botonera’ de DERIVE for Windows nos puede simplificar mucho el trabajo. Otro elemento
interesante es la existencia de ‘teclas calientes’ que nos permiten evitar los menús, con lo que se gana
en rapidez.

4.2. Ecuaciones diferenciales de primer orden

Para poder resolver ecuaciones diferenciales de primer orden es necesario tener cargado en el ordenador la utilidad
ODE1.MTH, lo cual se consigue seleccionando las opciones File|Load|Math o File|Load|Utility. Esta utili-
dad proporciona una serie de funciones que nos permiten resolver las ecuaciones diferenciales utilizando distintos
métodos.

Resolver la ecuación y 0 = ex+y + ey y encontrar la solución que pasa por el punto (0, 1)

La ecuación diferencial es de la forma


y 0 = p(x)q(y),

siendo p(x) una expresión cualquiera (no tiene por qué ser un polinomio) que no depende de y, y donde q(y) es
una expresión cualquiera que no depende de x. Entonces debemos utilizar la función de DERIVE for Windows

SEPARABLE(p,q,x,y,a,b),

donde a y b son los valores de x e y para los cuales queremos una solución particular. En nuestro caso, debemos
introducir la expresión SEPARABLE(#e^x+1,#e^y,x,y,0,1) y obtendremos como resultado e−1 − e−y = ex +
x − 1. Para obtener y en función de x debemos seleccionar las opciones Solve|Algebaically, con la opción
Variable igual a y, y obtendremos

y = 1 − ln(−ex+1 − ex + e + 1)

Resolver la ecuación diferencial xy 0 + y = y 2 ln(x)

Observemos en primer lugar que el miembro de la izquierda coincide con la derivada de la función xy respecto
de x, por lo que parece aconsejado hacer el cambio de variable z = xy. Entonces la ecuación se transfor-
ma en la siguiente: z 0 = x−2 ln(x)z 2 , que puede resolverse por la técnica de variables separables haciendo
SEPARABLE(Ln(x)/x^2,z^2,x,z,a,b). La solución obtenida es

ln(x) ln(a) 1 1 1 1
− + − − + = 0.
x a x z a b
ECUACIONES DIFERENCIALES ORDINARIAS 107

Para obtener y en función de x debemos seleccionar las opciones Solve|Algebaically, con la opción Variable
igual a z, y obtendremos
abx
z= .
ab ln(x) − bx ln(a) + x(a − b) + ab
Como z = xy entonces la solución a nuestra ecuación es y = z/x, es decir

ab
y= .
ab ln(x) − bx ln(a) + x(a − b) + ab

Resolver la ecuación xy 0 − 4y + 2x2 + 4 = 0 y hallar la solución particular que pasa por el punto (1, 1)

La ecuación puede ponerse en la forma y 0 + p(x)y = q(x), donde p(x) y q(x) son expresiones cualesquiera que
sólo dependen de x. Entonces podemos resolver este tipo de ecuaciones mediante la orden

LINEAR1(p,q,x,y,a,b),

donde a y b son las condiciones iniciales. En nuestro caso, escribimos LINEAR1(-4/x,-2x-4/x,x,y,1,1) para
obtener como solución
y = −x4 + x2 + 1

Resolver la ecuación diferencial (x + y)dx + (y − x)dy = 0, hallando la solución que pasa por el punto (1, 1)

Este tipo de ecuación diferencial es homogénea, lo cual significa que es de la forma y 0 = r(x, y), donde r es
una función tal que r(ax, ay) = r(x, y) para todo número a. Para resolver este tipo de ecuaciones, DERIVE for
Windows dispone de la orden

HOMOGENEOUS(r,x,y,a,b),

donde a y b son las condiciones iniciales. En nuestro caso, escribimos HOMOGENEOUS((x+y)/(x-y),x,y,1,1)


y obtenemos
y 2
LN( x +y
2
) π
2
ATAN + LN(|x|) − − = LN(x)
x 2 4
Para comprobar que la solución hallada es la correcta, podemos utilizar la función

IMP DIF(ATAN(y/x)+LN(|x|)-LN((x^2+y^2)/2)/2-pi/4-LN(x))-(x+y)/(x-y),

cuyo resultado es cero, garantizando que la solución encontrada es buena. Para utilizar la función anterior es
necesario haber cargado la utilidad DIF APPS.MTH.

En ocasiones no sabemos si la función r es homogénea, quizás por su complicación al no estar lo bastante


simplificada. Para estos casos, DERIVE for Windows dispone de la función HOMOGENEOUS TEST(r,x,y).
Si el resultado es una función que no depende de x, entonces r es una función homogénea. En nuestro caso
HOMOGENEOUS TEST((x+y)/(x-y),x,y) es igual a y − e−y .
108 MATEM ÁTICAS

Resolver la ecuación y 0 = 1 + sec(1 + x + y)

Para resolver ecuaciones diferenciales de la forma y 0 = r(u), donde u es una función lineal con coeficientes
constantes de x e y (es decir, u = ax + by + c, con a, b, c constantes), DERIVE for Windows pone a nuestra
disposición el comando

FUN LIN CCF(r,a,b,c,x,y,p,q),

donde p y q son las condiciones iniciales. En nuestro caso, escribimos

FUN LIN CCF(1+SEC(1+y+x),1,1,1,x,y,p,q)

y la solución general obtenida es:


√ √
√ 3 cos(x + y + 1) − sen(x + y + 1) + 3
3 ln √ √
3 cos(x + y + 1) + sen(x + y + 1) + 3
√ 6 √
√ 3 cos(p + q + 1) − sen(p + q + 1) + 3
3 ln √ √
3 cos(p + q + 1) + sen(p + q + 1) + 3

6
x+y−p−q
+ = x−p
2
En este caso resulta imposible despejar y como función explı́cita de x.

Resolver la ecuación y 0 = (x + y − 1)/(x − y)

Con este ejercicio vamos a ilustrar cómo resolver ecuaciones diferenciales de la forma
 
ax + by + c
y0 = r
px + qy + k

donde a, b, c, p, q, k son constantes que cumplen la condición aq − bp 6= 0, ya que de lo contrario estarı́amos en


el caso lineal. DERIVE for Windows resuelve este tipo de ecuaciones utilizando la siguiente función

LIN FRAC(r,a,b,c,p,q,k,x,y,A,B)

donde (A,B) son las condiciones iniciales. En nuestro caso debemos teclear

LIN FRAC((x+y-1)/(x-y),1,1,-1,1,-1,0,x,y,0,0)

y obtenemos la siguiente solución en forma implı́cita:


 
2y − 1 1 π
ATAN + LN(|2x − 1|) − LN(2x2 − 2x + 2y 2 − 2y + 1) − = LN(2x − 1) − πi
2x − 1 2 4
ECUACIONES DIFERENCIALES ORDINARIAS 109

Resolver la ecuación diferencial 2y 3 − 5xy + (xy 2 − 3x2 )y 0 = 0

Uno de los métodos más potentes para la resolución de ecuaciones diferenciales de primer orden consiste en buscar
factores integrantes. Dada la ecuación p(x, y) + q(x, y)y 0 = 0, ésta se podrá resolver si existe una función u(x, y)
que multiplicada por la ecuación anterior la convierta en exacta. La manera de comprobar que una función u es la
candidata consiste en calcular

EXACT TEST(up,uq,x,y)

Si el resultado es cero, entonces la solución implı́cita viene dada por

USE INTEG FCTR(u,p,q,x,y,a,b).

donde (a,b) son las condiciones iniciales.

El problema en todo caso es encontrar el factor integrante. Para ayudarnos DERIVE for Windows dispone de la
siguiente función:

MONOMIAL TEST(p,q,x,y)

Si el resultado es del tipo xm y n entonces

USE INTEG FCTR((x^m)(y^n),p,q,x,y,a,b)

nos da la solución general de la ecuación.

En nuestro caso MONOMIAL TEST(2y^3-5xy,xy^2-3x^2,x,y) proporciona como resultado x−27 y −16 . Por tan-
to la solución es
1 1
− + C = 0,
5x25 y 15 13x26 y 13
donde C es una constante apropiada.

4.3. Ejercicios de aplicación

A continuación se enuncian unos ejercicios sobre resolución de ecuaciones diferenciales. Si el alumno encuentra
alguna dificultad debe revisar detenidamente los ejemplos anteriores.

a) Hallar la curva solución de la ecuación


p y 02
y 1 + y 02 − y p =a
1 + y 02

que pasa por el punto (0, a).


b) Resolver la ecuación 3y 2 y 0 − ay 3 = x + 1
c) Resolver la ecuación y 0 xe1/x = −x + ye1/x
110 MATEM ÁTICAS

d) Resolver la ecuación y 0 = (3x + y)/(x − 2y)

e) Resolver la ecuación y 0 (x + y ln y) = y

f) Resolver la ecuación 4xy + 3y 2 − x + (x2 + 2xy)y 0 = 0

4.4. Ecuaciones diferenciales de segundo orden

Para poder resolver ecuaciones diferenciales de segundo orden es necesario tener cargado en el ordenador la
utilidad ODE2.MTH, lo cual se consigue seleccionando las opciones File|Load|Math o File|Load|Utility.
Esta utilidad proporciona una serie de funciones que nos permiten resolver las ecuaciones diferenciales utilizando
distintos métodos.

Resolver la ecuación diferencial y 00 − 3y 0 + 2y = ex sen x

La ecuación es de la forma y 00 +p(x)y 0 +q(x) = r(x), que DERIVE for Windows puede resolver en determinados
casos. El comando general que utiliza DERIVE for Windows es el siguiente

DSOLVE2(p,q,r,x,c1,c2)

DERIVE for Windows trata de encontrar la solución explı́cita general de la ecuación anterior en función de las
constantes c1 y c2. Debemos hacer notar que los dos últimos argumentos pueden omitirse o sustituirse por otros
nombres. Cuando DERIVE for Windows no puede encontrar una solución, el comando DSOLVE2 devuelve la
palabra ‘inapplicable’.

En estos casos, podemos ejecutar el comando

LIN2 TEST(p,q,x)

y si el resultado es una constante K, entonces podemos resolver la ecuación utilizando las siguientes funciones:

• Si K > 0, la solución vendrá dada por LIN2 POS(p,q,r,x).

• Si K < 0, la solución vendrá dada por LIN2 NEG(p,q,r,x).

• Si K = 0, la solución vendrá dada por LIN2 0(p,q,r,x).

En los tres casos, se obtiene la solución general explı́cita dependiendo de dos constantes arbitrarias c1 y c2.

DSOLVE2 puede encontrar fácilmente una solución cuando p y q son constantes. Cuando q es una constante
simbólica, el resultado puede adquirir una forma complicada. La solución puede contener integrales involucrando
la función r(x). En todo caso, para comprobar que el resultado es correcto, podemos sustituirlo en la ecuación
y 00 + p(x)y 0 + q(x) − r(x) = 0.

En el caso que estamos analizando, p(x) = −3, q(x) = 2 y r(x) = ex sen x, por lo que la solución vendrá dada
por DSOLVE2(-3,2,#e^x SIN x,x).
ECUACIONES DIFERENCIALES ORDINARIAS 111

y0
Resolver la ecuación diferencial y 00 − x + 4x2 y = 4x2 sen(x2 )

En este caso, las funciones p, q y r están dadas por p(x) = −1/x, q(x) = 4x2 y r(x) = 4x2 sen(x2 ), por lo que
la solución vendrı́a dada por DSOLVE2(-1/x,4x^2,4x^2 SIN(x^2),x). Sin embargo, el programa devuelve la
palabra ‘inapplicable’, por lo que debemos resolverla de otro modo.

En primer lugar debemos ejecutar el comando LIN2 TEST(p,q,x) y si el resultado es una función dependiente
de x, entonces utilizamos la función LIN2A TEST(p,q,x). Si el resultado de este segundo test es una constante
K, podemos resolver la ecuación utilizando las siguientes funciones:

• Si K > 0, la solución vendrá dada por LIN2A POS(p,q,r,x).


• Si K < 0, la solución vendrá dada por LIN2A NEG(p,q,r,x).
• Si K = 0, la solución vendrá dada por LIN2A 0(p,q,r,x).

En los tres casos, se obtiene la solución general explı́cita dependiendo de dos constantes arbitrarias c1 y c2.

En nuestro caso la solución de la ecuación diferencial es la siguiente:


1
(2a + 1) sen(x2 ) − (x2 + b) cos(x2 )
2

Resolver la ecuación diferencial y 00 − ey = 0

Para resolver las ecuaciones diferenciales de la forma y 00 = q(y), donde q(y) puede ser cualquier función de y,
DERIVE for Windows dispone de la función

AUTONOMOUS CONSERVATIVE(q,x,y,a,b,c)

donde los tres últimos argumentos son optativos. Si están presentes, entonces DERIVE for Windows determina
la solución que satisface las siguientes condiciones iniciales: x = a, y(a) = b, y 0 (a) = c. En nuestro caso, la
solución vienen dada por AUTONOMOUS CONSERVATIVE(#e^y,x,y).

Resolver la ecuación diferencial y 0 y 00 = 1 + y 02

Haciendo el cambio de variable v = y 0 se transforma en una ecuación de primer orden de variables separadas
(vv 0 = 1 + v 2 ) que puede resolverse utilizando la función SEPARABLE. Entonces volvemos a obtener otra ecuación
de primer orden que resolvemos utilizando el método apropiado.

Resolver la ecuación diferencial yy 00 + y 02 = 0

Este ecuación es de tipo Liouville. En general, las ecuaciones de Liouville son de la forma

y 00 + p(x) + q(y)(y 0 )2 = 0,
112 MATEM ÁTICAS

donde p y q dependen sólo de x e y, respectivamente. DERIVE for Windows resuelve este tipo de ecuaciones
utilizando la función

LIOUVILLE(p,q,x,y,a,b).

Los dos últimos argumentos son opcionales y sirven para fijar las constantes en la solución general que se obtenga.
Si se omiten, el programa trabaja con las constantes c1 y c2. En nuestro caso p(x) = 0 y q(y) = 1/y, por lo que
la solución vienen dada por LIOUVILLE(0,1/y,x,y):
1
c2 x + y 2 − c1 = 0.
2

4.5. Ejercicios de aplicación

A continuación se enuncian unos ejercicios sobre resolución de ecuaciones diferenciales. Si el alumno encuentra
alguna dificultad debe revisar detenidamente los ejemplos anteriores.

a) Resolver la ecuación y 00 − 2y 0 − 3y = 2 sen x.


b) Resolver la ecuación y 00 − 2y 0 = x + 2ex .
ex
c) Resolver la ecuación y 00 − 2y 0 + y = .
2x
d) Resolver la ecuación y 00 − sen y = 0.
e) Resolver la ecuación y 00 + xy 0 = y 02 .
f) Resolver la ecuación y 00 + yy 0 = y.

4.6. Métodos numéricos de resolución de ecuaciones de primer orden

Hay ocasiones en que no se puede obtener la solución exacta de una ecuación diferencial. En estos casos, lo
conveniente puede ser obtener una solución numérica. Para este menester, DERIVE for Windows pone a nues-
tra disposición diferentes métodos. En primer lugar debemos cargar la utilidad ODE APPR.MTH (mediante las
opciones File|Load|Math o File|Load|Util).

El método de Euler

El método de Euler es uno de los métodos más clásicos utilizados en la resolución numérica de ecuaciones dife-
renciales ordinarias de primer orden. La sintaxis general es

EULER(f,x,y,a,b,h,n)

Esta función proporciona un vector de n + 1 puntos (pares de números) solución de la ecuación y 0 = f (x, y),
con condiciones iniciales (a, b), empezando en a y con un paso h. El vector solución debe interpretarse como los
ECUACIONES DIFERENCIALES ORDINARIAS 113

puntos sobre la curva solución cuyas abcisas están separadas una distancia h. Por ejemplo, para generar 5 puntos
de una solución aproximada de la ecuación y 0 = 26/(3 + (x + y)2 ) en el intervalo [1,2] con condición inicial
(a, b) = (1, −2), deberı́amos escribir

EULER(26/(3+(x+y)^2),x,y,1,-2,0.25,4)

El resultado es:  
1 −2
 1.25 −0.375 
 
 
 1.5 1.35114 
 
 1.75 1.93520 
2 2.32722

El método de Runge-Kutta

El método de Euler discutido anteriormente es el método más sencillo para resolver ecuaciones diferenciales
ordinarias, pero usualmente comete un error considerable. Sin embargo, el método clásico de Runge-Kutta es más
preciso y por tanto es preferible al método de Euler. La sintaxis general es

RK(f,v,v0,h,n)

RK utiliza el método de Runge-Kutta de orden 4 para resolver una ecuación diferencial de primer orden; también
puede utilizarse para resolver un sistema de ecuaciones diferenciales de primer orden. En la expresión anterior,
el programa calcula un vector de n + 1 puntos (pares de números) solución de la ecuación y 0 = f (v), donde
v = [x, y], con condiciones iniciales v0 = [a, b], empezando en a y con un paso h.

4.7. Bibliografı́a

C. Paulogorrón y C. Pérez. Cálculo matemático con DERIVE para PC, Ed. RA-MA, 1a Ed., 1994.

5. BIBLIOGRAFÍA DEL CAPÍTULO

R.E. LARSON, R.P. HOSTETLER y B.H. EDWARDS Calculo y Geometrı́a Analı́tica, 5a ed., vol. 1. McGraw-
Hill, Madrid, 1995. Capı́tulo 18.
J. STEWART Cálculo, 2a ed. Grupo Editorial Iberoamérica, México, 1994. Capı́tulo 15.

6. PREGUNTAS DE EVALUACIÓN

E.4.1. Calcular la solución general de la siguiente ecuación diferencial,


y 00 − 6y 0 + 9y = 0.
Calcular la solución particular que alcanza un máximo relativo en x = 0 con y(0) = 1.
114 MATEM ÁTICAS

E.4.2. Calcular la solución general de la siguiente ecuación diferencial,

y 00 − 6y 0 + 9y = 4e5x .

Calcular la solución particular determinada por las siguientes condiciones iniciales, y(0) = 2, y 0 (0) = 9.

E.4.3. Hallar la solución general de la siguiente ecuación diferencial

y 00 − 5y 0 + 6y = 0.

Hallar la solución particular de esta ecuación determinada por las condiciones iniciales y(0) = 1, y 0 (0) = 0.

E.4.4. Calcular la solución general de la siguiente ecuación diferencial

y 00 − 4y 0 + 4y = x.

Calcular la solución particular determinada por las condiciones iniciales y(0) = 1, y 0 (0) = 0.

E.4.5. Un trabajador de 30 años tiene un salario de 2.000.000 ptas anuales con un crecimiento estimado de
100.000 ptas anuales. Si realiza una inversión inicial de 100.000 ptas en un plan de pensiones que rin-
de un 8% anual, y realiza anualmente inversiones adicionales iguales al 5% de su salario, un modelo para el
capital invertido x al cabo de t años es

dx
= 00 08x + 00 05(2.000.000 + 100.000t)
dt
x(0) = 100.000

¿Cuántos años deben pasar para que acumule una inversión de 10.000.000 ptas? ¿Cuánto capital tendrá en
el plan cuando se jubile? (Se considera que 65 años es la edad de jubilación.)

E.4.6. Encontrar la solución general de la siguiente ecuación diferencial:

y 00 − 2y 0 − 3y = e−x + 2 senx

Determinar las constantes para que y 0 (0) = 1 e y(0) = −1.

E.4.7. Una boya cilı́ndrica, de diámetro 20cm y peso 100Kg, flota parcialmente sumergida en posición recta.
Cuando es ligeramente separada de su posición de equilibrio, la boya sube y baja según la siguiente ecuación
diferencial:
100 d2 x dx
2
= −16πx − c
g dt dt
dx
donde c es la resistencia por fricción que ofrece el agua y g es la aceleración gravitatoria.
dt


(1) Obtener x(t) si la constante c es igual a 15π. √
(2) Calcular c si el periodo de oscilación observado es de 54 2π.
Observación : Como valor de la constante g puede tomarse 10m/s2 .
ECUACIONES DIFERENCIALES ORDINARIAS 115

E.4.8. En un circuito eléctrico simple hay una corriente eléctrica I (en amperios), una resistencia R (en ohmios),
una inductancia L (en henrios) y una fuerza electromotriz E (en voltios), como se indica en la siguiente
figura.

E •
S
R

De acuerdo con la segunda ley de Kirchoff, si se cierra el interruptor S en t = 0, la fuerza electromotriz


aplicada (potencial) es igual a la suma de las caı́das de potencial en el resto del circuito. En otras palabras,
esto significa que la corriente I satisface la siguiente ecuación diferencial:

dI
L + RI = E.
dt
Determinar la corriente I como función del tiempo t (en segundos), siendo R y L constantes no nulas y
E(t) = sen 2t.
E.4.9. Calcular la solución general de la ecuación diferencial siguiente:

y 00 − 2y 0 − 3y = 2 sen x.

Determinar el valor de las constantes si se verifican las siguientes condiciones:

y(0) = 1/5, y(π) = 0.

E.4.10. Resolver las siguientes ecuaciones diferenciales:


1
(1) xdx − ydx = xy 2 dx (usar como factor integrante y 2 ).

d2 y dy
(2) 2
− + 5y = 3.
dx dx
E.4.11. Una célula está suspendida dentro de una solución que contiene un soluto a una concentración constante
Cs . Se supone que la célula tiene un volumen constante V y que el área de su membrana permeable es igual
a la constante A. Por la ley de Fick (fisiólogo alemán, 1829–1901), la razón de cambio de su masa m es
directamente proporcional al área A y a la diferencia Cs − C(t), donde C(t) denota la concentración del
soluto en el interior de la célula en el instante t.

R ?
?
- 
C(t)
i
1
K

Cs

Determinar la función C(t) suponiendo que m = V C(t) y C(0) = C0 .


116 MATEM ÁTICAS

ANOTACIONES

....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
CAPÍTULO 5
ÁLGEBRA LINEAL Y GEOMETRÍA

1. INTERROGANTES CENTRALES DEL CAPÍTULO

• Hallar un sistema triangular que sea equivalente a • Calcular la forma Jordan de matrices de órdenes
uno dado. 2 y 3, usándola como recurso para efectuar poten-
cias n-ésimas.
• Conocer los distintos tipos de matrices y mane-
jar las distintas operaciones que se definen entre • Conocer y utilizar los conceptos de producto es-
ellas, usando correctamente sus propiedades. calar, norma y distancia en el espacio.
• Hallar el determinante de una matriz de cualquier • Identificar geométricamente el producto vectorial
orden. y el producto mixto de vectores.
• Hallar la matriz inversa de una matriz dada. • Identificar y calcular las ecuaciones de algunas
• Discutir y resolver sistemas de ecuaciones linea- secciones cónicas y superficies cuádricas.
les. • Manejar expresiones en coordenadas polares,
• Conocer y utilizar la estructura de espacio vecto- cilı́ndricas y esféricas.
rial y los conceptos de base y dimensión.
• Conocer el concepto de aplicación lineal e identi-
• Identificar cuando una matriz es diagonalizable. ficar el núcleo y la imagen de la misma.
• Calcular la matriz diagonal semejante a una ma- • Calcular la matriz asociada a una aplicación li-
triz A dada como recurso para efectuar su poten- neal y saber obtener la nueva expresión de la mis-
cia n-ésima. ma al efectuar un cambio de base.

2. CONTENIDOS FUNDAMENTALES DEL CAPÍTULO

2.1. Sistemas de ecuaciones lineales

Una ecuación lineal de n variables X1 , X2 , ..., Xn es una ecuación del tipo a1 X1 + a2 X2 + ... + an Xn = b.

Los números ai (i = 1, ..., n) se denominan coeficientes y a b se le llama término independiente.

Una solución de la ecuación lineal anteriormente mencionada es una n-upla de números reales (α1 , α2 , ..., αn )
tal que a1 α1 + a2 α2 + · · · + an αn = b.

Ejemplo. 3x − 2y + z = 0 es una ecuación lineal de tres variables, y (1, 1, −1) es una solución de la misma.
Nótese que la ecuación anterior tiene un número infinito de soluciones. 2
118 MATEM ÁTICAS

A un conjunto de varias ecuaciones lineales se le denomina sistema de ecuaciones lineales. Es decir un sistema
de m ecuaciones lineales y n variables o incógnitas, es una expresión del tipo




a11 X1 + a12 X2 + ... + a1n Xn = b1

a21 X1 + a22 X2 + ... + a2n Xn = b2

 ............................................ ...

am1 X1 + am2 X2 + ... + amn Xn = bm

Una solución de este sistema es una n-upla de números reales (α1 , α2 , ..., αn ) que sea a su vez solución de las m
ecuaciones de las que se compone el sistema.

Ejemplo. En el siguiente sistema de 2 ecuaciones y 3 incógnitas



3x − 2y + z = 1
x + 3y − 2z = 5

la terna 13 14
11 , 11 , 0 es una solución del sistema, ya que lo es de cada una de las ecuaciones que lo forman. La terna
(4, 6, 1) no es solución del mismo ya que aunque es solución de la primera ecuación no lo es de la segunda. Se
puede demostrar que este sistema de ecuaciones lineales tiene infinitas soluciones. 2
Atendiendo a la existencia o no de soluciones y a su número (finito o infinito), los sistemas de ecuaciones lineales
se clasifican de la siguiente manera:
 

  Determinado (Solución única)



 Compatible (existe solución) 
s.e.l. Indeterminado (Infinitas soluciones)






Incompatible (No existe solución)

2.1.1. Reglas de equivalencia de sistemas

Dos sistemas de ecuaciones lineales se dice que son equivalentes cuando tienen las mismas soluciones.

Los métodos de resolución de sistemas de ecuaciones lineales se basan en la idea de transformar el sistema original
del cual queremos encontrar sus soluciones, en otro equivalente que tenga una estructura más sencilla.

Después de lo dicho conviene aclarar qué entendemos por “estructura sencilla” y cuáles van a ser las operaciones
que van a ser válidas para transformar el sistema original en otro equivalente.

Ejemplos de sistemas sencillos de resolver, en el caso de igual número de ecuaciones que de incógnitas, son los
llamados triangulares.

Un sistema triangular de tres ecuaciones con tres incógnitas vendrı́a expresado de una manera genérica por:


 a11 x + a12 y + a13 z = b1
a22 y + a23 z = b2

a33 z = b3

Obsérvese que a21 = a31 = a32 = 0.


ÁLGEBRA LINEAL Y GEOMETR ÍA 119

Intenta responder ahora a las siguientes preguntas: ¿Cómo serı́a un sistema triangular de cuatro ecuaciones y
cuatro incógnitas? ¿Sabrı́as definir el mismo concepto para un sistema de n ecuaciones y n incógnitas?

En este tipo de sistemas con n ecuaciones y n incógnitas (si ann 6= 0) se obtiene fácilmente una solución única,
despejando y sustituyendo sucesivamente de la última ecuación a la primera.

Parece claro que nuestro interés principal lo centraremos en realizar operaciones en las ecuaciones que forman el
sistema original del que queremos conocer sus soluciones, hasta transformarlo en otro que sea lo más parecido
posible a un sistema triangular. Debemos por tanto hacer referencia a las reglas u operaciones que consideramos
válidas, es decir, que transforman un sistema en otro equivalente:

(1) Intercambiar dos ecuaciones.

(2) Multiplicar (o dividir) una ecuación por un número distinto de cero.

(3) Sumar o restar a una ecuación el resultado de multiplicar (o dividir) otra por un número.

(4) Expresar una ecuación despejando una variable, y sustituir el resultado en las demás.

Ejemplo 1. Vamos a obtener un sistema triangular equivalente a:



 2x + 3y − 4z = 1
3x − 2y + 5z = 3

7x + 4y − 3z = 5

   2x + 3y − 4z = 1
2 ec. × 2 + 1 ec. × (−3)
a a
V V −13y + 22z = 3
3a ec. × 2 + 1a ec. × (−7) 
−13y + 22z = 3

 2x + 3y − 4z = 1 
2x + 3y − 4z = 1
V (3a ec. + 2a ec. × (−1)) V −13y + 22z = 3 V
 −13y + 22z = 3
0.z = 3
  
Despejando y en la segunda x = 11 7
13 − 13 z
V V
ecuación y sustituyendo y = − 13 + 22
3
13 z

y el conjunto de soluciones viene expresado por:


  
11 7 3 22
S= − λ, − + λ, λ : λ ∈ R
13 13 13 13

Como vemos el sistema tiene infinitas soluciones.

Obviamente no todos los sistemas que vamos a intentar resolver tienen el mismo número de ecuaciones y de
incógnitas. ¿Cómo procederı́amos con un sistema de este estilo?

Ejemplo 2. Vamos a triangular el siguiente sistema de ecuaciones:



 x + 3y − z + t = 1
−2x + y + 2z = 7

y−t = 0

 x + 3y − z + t = 1
=⇒ (2a ec. + 1a ec. × 2) =⇒ 7y + 2t = 9 =⇒

y−t = 0
120 MATEM ÁTICAS


 x + 3y − z + t = 1
(Intercambiamos la 2a ec. y la 3a ec) =⇒ y−t = 0

7y + 2t = 9

 x + 3y − z + t = 1
=⇒ (3 ec. − 2 ec. × 7) =⇒
a a
y−t = 0

9t = 9

1  x + 3y − z + t = 1
=⇒ (3a ec. × ) =⇒ y−t = 0
9 
t = 1

 x−z = −3
=⇒ (1a ec. − 2a ec. × 3) =⇒ y−t = 0

t = 1
de donde el conjunto de soluciones vendrı́a dado por

S = {(−3 + λ, 1, λ, 1) : λ ∈ R}

¿Sabrı́as explicar por qué?

Observaciones. Debemos extraer algunas conclusiones de los ejemplos anteriores.

(1) En las operaciones que realizamos con los sistemas en realidad nos bastarı́a con hacer referencia sólo a los
coeficientes, obviando ası́ la repetición de las incógnitas. Si eliminamos estos sı́mbolos el sistema anterior
se escribirı́a como  
1 3 −1 1 1
 −2 1 2 0 7 
0 1 0 −1 0
Esta ordenación de los coeficientes recibirá el nombre de matriz ampliada. La matriz
 
1 3 −1 1
 −2 1 2 0 
0 1 0 −1

recibe el nombre de matriz de los coeficientes del sistema.


Las operaciones que hemos realizado sobre las ecuaciones se realizarán ahora sobre las filas de esta última
matriz, sin más que sustituir la palabra “ecuación” por la de “fila”.

(2) Dada la matriz genérica de un sistema de tres ecuaciones y tres incógnitas


 
a11 a12 a13 b1

 a21 a22 a23 b2 

a31 a32 a33 b
3

(ver Ejemplo 1), al intentar resolverlo y por lo tanto transformarlo en uno equivalente que sea triangular,
llegaremos a un sistema representado por una matriz del tipo
 0 0 
a11 a12 a13 b1
0 0

 0 0 0 
 0 a22 a23 b2 
0 0
0 0 a33 b3
0
que tendrá solución única si y sólo si a33 6= 0.
ÁLGEBRA LINEAL Y GEOMETR ÍA 121

(3) En el caso representado en el Ejemplo 2, observemos que la matriz ampliada resultado de efectuar las
sucesivas transformaciones a las que hemos sometido el sistema original es
 
1 0 −1 0 −3
 0 1 0 0 1 
0 0 0 1 1

¿Qué tiene de común esta matriz con la correspondiente a un sistema triangular? Resaltamos a continuación
una caracterı́stica que podemos considerar común a las dos:
Ambas son matrices escalonadas, en el sentido de que puede trazarse una “escalera descendente”, por
debajo de cuál todos los elementos serán ceros.

Método de Gauss. El método de Gauss para la resolución de sistemas de ecuaciones lineales consiste en realizar
transformaciones en la matriz del sistema de partida hasta conseguir una matriz “escalonada”, de las caracterı́sticas
descritas anteriormente.

Como es lógico, no todos los sistemas son compatibles (determinados o indeterminados), y algunas veces nos
encontraremos con sistemas que no tengan solución. ¿Cómo los podremos identificar?

Ejemplo 3. El sistema de ecuaciones



 x + 2y − 3z = 1


2x − y + z = −2

 3x + 2y + 2z = −3

7x + 5y − 3z = 3

es equivalente a
 
1 2 −3 1

 0 −5 7 −4 
 
 0 0 −27 14 
0 0 0 −30

(Intenta dar los pasos pertinentes para lograr llegar a esta última expresión de un sistema equivalente). Observa
que como la última ecuación no tiene solución el sistema no tiene solución.

Observación. En general, cuando al efectuar operaciones en la matriz de un sistema, conseguimos una matriz en
la que todos los elementos de una fila son ceros menos el coeficiente que corresponde el término independiente de
la ecuación, el sistema será incompatible.

Resumimos a continuación las situaciones genéricas con las que nos encontramos al aplicar el método de elimi-
nación de Gauss.

(1) Obtenemos una solución imposible y el sistema de partida es incompatible.

(2) El número de ecuaciones resultantes no eliminadas y de incógnitas coincide. Entonces el sistema de partida
es compatible y determinado y la matriz ampliada se podrá transformar en una de la forma:
 
∗ ∗ .... ∗ ∗

 0 ∗ .... ∗ ∗ 
 
 ... ... .... ... ... 
0 0 .... ∗ ∗

(donde con ∗ expresamos cualquier valor posible de los coeficientes)


122 MATEM ÁTICAS

(3) El número de ecuaciones resultantes no eliminadas es menor que el número de incógnitas del sistema.
Entonces el sistema es compatible e indeterminado. La matriz ampliada se podrá transformar en una de la
forma:  
∗ ∗ ... ... ... ... ∗ ∗

 0 ∗ ∗ ... ... ... ∗ ∗ 
 
 ... ... ... ... ... ... ... ... 

0 0 ... ∗ ∗ ... ∗ ∗

2.1.2. Un caso notable: los sistemas de ecuaciones lineales homogéneos

En un sistema de ecuaciones lineales genérico cuando los términos independientes son todos nulos, lo denomina-
remos homogéneo.



a11 X1 + a12 X2 + ... + a1n Xn = 0
 a X + a X + ... + a X = 0
21 1 22 2 2n n

 ............................................. ...

am1 X1 + am2 X2 + ... + amn Xn = 0
Piensa y demuestra que se cumplen las siguientes propiedades:

(1) Un sistema homogéneo es siempre compatible, ya que la solución trivial (0, 0, ..., 0) satisface todas y cada
una de las ecuaciones del sistema.
(2) Si (α1 , α2 , ..., αn ) es solución de un sistema homogéneo, también lo es (λα1 , λα2 , ..., λαn ) con λ ∈ R. Lo
que en general demuestra que si un sistema homogéneo tiene una solución distinta de la trivial, entonces
tiene infinitas soluciones.

2.1.3. Discusión de sistemas de ecuaciones lineales en función de los valores de parámetros

Otro de los aspectos destacables dentro de la resolución de sistemas de ecuaciones lineales es el que habitualmente
se denomina como “discusión del sistema”. Entenderemos por esto decidir para qué valores de uno o varios
parámetros se tienen infinitas soluciones, solución única o ninguna solución.

Ejemplo. Discute según los valores de m el siguiente sistema de ecuaciones:



 x + 2y + z = 2
−x + 3y + z = 0

−x + y + mz = 1
   
1 2 1 2 1 2 1 2

 −1 3 1 0  V (Sumando la 2a fila a la 3a y la 1a a la 2a ) V  0 5 2 2 

−1 1 m 1 0 3 m+1 3
 
1 2 1 2
V (Multiplicando la 3a fila por 5 y la 2a por 3) V  0 15 6 6 
0 0 5m − 1 9

En función de los valores de m distinguiremos los siguientes casos:

1
(1) 5m − 1 = 0 ⇐⇒ m = 5 y la última ecuación se transforma en un absurso. Sistema incompatible.
ÁLGEBRA LINEAL Y GEOMETR ÍA 123

(2) 5m − 1 6= 1
5 ⇐⇒ m 6= 1
5 . Sistema compatible y determinado. 2
Ejemplo. Discute según los valores de m:

 x + y + mz = 1
x + my + z = 1

mx + y + z = 1

Debes transformar esta ecuación en:


 
1 1 m 1

 0 m−1 1−m 0 

0 0 (1 − m)(2 + m) 1−m

¿Qué transformaciones son necesarias? La discusión surge de la ecuación (1 − m)(2 + m) = 0.

¿Qué sucede si m 6= 1 y m 6= −2? ¿Y si m = −2? ¿Y cuando m = 1? (Es interesante que razones conveniente-
mente las respuestas a todas estas preguntas). 2

2.2. Operaciones con matrices

Un conjunto de m × n números reales colocados de forma rectangular en m filas y n columnas recibe el nombre
de matriz real de dimensión m × n.

De forma genérica notaremos


 
a11 a12 .... a1n
 a21 a22 .... a2n 
A=
 ....

..... .... .... 
am1 am2 .... amn
Con la notación aij significamos el elemento de la matriz A que ocupa el lugar perteneciente a la fila i y a la
columna j. De forma abreviada también notaremos A = (aij )i=1...m
j=1...n

Al conjunto de todas las matrices con coeficientes reales, con m filas y n columnas (dimensión m × n) lo denota-
remos por Mm×n (R). En general abusaremos del lenguaje y cuando hablemos de “matrices” entenderemos que
sus coeficientes son números reales.

A las matrices que sólo tienen una fila se les llama matrices fila. Análogamente a las que tienen sólo una columna
se les denomina matrices columna.

Dada una matriz A, se denomina traspuesta de A, denotándose t A, a la matriz que se obtiene cambiando en A
las filas por columnas.

Las matrices en las que coincide el número de filas con el de columnas se denominan matrices cuadradas.

Para una matriz cuadrada de dimensión n × n se suele decir que es de orden n. El conjunto de elementos
(a11 , a22 , ...., ann ) se denomina diagonal principal.

Una matriz cuadrada A se dice que es simétrica cuando aij = aji para todo i = 1, . . . , m y j = 1, . . . , n.

Otros tipos especiales de matrices son:

Matriz nula: Aquella en que todos sus elementos son cero.


124 MATEM ÁTICAS

 
0 0
O= es un ejemplo de matriz nula de orden 2.
0 0

Matriz diagonal: Cualquier matriz cuadrada en la que los elementos que no están ubicados en la diagonal prin-
cipal son ceros.
 
7 0 0
D =  0 −2 0  es un ejemplo de matriz diagonal de orden 3.
0 0 −3

Matriz unidad o identidad: Se denomina ası́ a cualquier matriz diagonal en la que todos los elementos pertene-
cientes a la diagonal principal son iguales a 1. La matriz diagonal de orden n será denotada por In .
 
1 0 0
I3 =  0 1 0  es un ejemplo de matriz identidad de orden 3.
0 0 1

Matriz triangular: Se denomina de esta manera a toda matriz cuadrada en la que los elementos que están por
encima o por debajo de la diagonal principal son iguales a cero. Se dice triangular superior cuando los
elementos nulos están por debajo o triangular inferior si están por encima.
 
1 2 3
A =  0 4 −5  es un ejemplo de matriz triangular superior de orden tres.
0 0 6

2.2.1. Suma de matrices

Sean A, B ∈ Mm×n (R) , es decir, A = (aij )i=1...m y B = (bij )i=1...m . Definimos la matriz suma C = A + B,
j=1...n j=1...n
como C = (cij )i=1...m donde cij = aij + bij , para todo i = 1...m y j = 1...n.
j=1...n

Mas explı́citamente podemos expresar


 
a11 + b11 a12 + b12 .... a1n + b1n
 a21 + b21 a22 + b22 .... a2n + b2n 
C =A+B =
 ...............

............... .... ............... 
am1 + bm1 ............... .... amn + bmn

2.2.2. Propiedades de la Suma

(1) A + (B + C) = (A + B) + C (propiedad asociativa).

(2) A + B = B + A (propiedad conmutativa).

(3) A + O = A (Por O indicamos la matriz nula).

(4) La matriz −A que denominaremos matriz opuesta y que se obtiene cambiando de signo todos los elementos
de A, cumple la siguiente propiedad: A + (−A) = O.

Estas propiedades dotan a (Mm×n , +) de la estructura de grupo abeliano.


ÁLGEBRA LINEAL Y GEOMETR ÍA 125

2.2.3. Producto de un escalar (número real) por una matriz

Sea A ∈ Mm×n (R) , A = (aij )i=1...m y λ ∈ R , definimos λA = (λaij )i=1...m , es decir:


j=1...n j=1...n

   
a11 a12 .... a1n λa11 λa12 .... λa1n
 a21 a22 .... a2n   λa21 λa22 .... λa2n 
λ
 ....
= 
..... .... ....   .... ..... .... .... 
am1 am2 .... amn λam1 λam2 .... λamn
   
3 2 12 8
Por ejemplo, 4  5 6  =  20 24 .
7 8 28 32

Para cualquier λ, µ ∈ R y A, B ∈ Mm×n (R), se verifican las siguientes propiedades:

(1) λ(A + B) = λA + λB.


(2) (λ + µ)A = λA + µB.
(3) λ(µA) = (λµ)A.
(4) 1A = A.

Todas estas propiedades, ası́ como las vistas anteriormente para la suma de matrices, se pueden resumir diciendo
que (Mm×n , +, .) es un espacio vectorial sobre R (cuerpo de los números reales).

2.2.4. Producto de matrices

Sean A, B ∈ Mm×n (R) , A = (aij )i=1...m y B = (bij )i=1...n . Definimos el producto AB como la nueva matriz
j=1...n j=1...p
C = (cij )i=1...m , tal que cij = ai1 b1j + ai2 b2j + ai3 b3j + ... + ain bnj o en expresión más reducida
j=1...p

X
n
cij = aik bkj .
k=1

Obsérvese que para que esté bien definido el producto de matrices, el número de columnas de la primera matriz
debe coincidir con el número de filas de la segunda.

Ejemplo. En el siguiente producto de matrices, el punto . denota la multiplicación en los números reales.
      
1 2 5 6 1.5 + 2.7 1.6 + 2.8 19 22
= =
3 4 7 8 3.5 + 4.7 3.6 + 4.8 43 30
2

2.2.5. Propiedades del producto de matrices

(1) A(BC) = (AB)C.


(2) AB 6= BA en general. ¿Puedes encontrar algún ejemplo que demuestre esta afirmación?
126 MATEM ÁTICAS

(3) Si A ∈ Mm×n (R), AIn = A (donde In representa la matriz identidad de orden n) y también Im A = A.
(4) A(B + C) = AB + AC.

De todo lo anterior se deduce que Mn (R) (conjunto de matrices cuadradas de orden n, con coeficientes reales)
dotado de las operaciones suma y producto de matrices tiene estructura de anillo (no conmutativo) con elemento
unidad.

2.2.6. Algunas matrices relevantes: las matrices invertibles

Consideremos el anillo (Mn (R), +, .) anteriormente mencionado. Dada la matriz A ∈ Mn (R) no siempre existe
otra matriz B ∈ Mn (R) tal que AB = BA = In (intenta encontrar algunos ejemplos de matrices que ilustren
esta afirmación).

En los casos en los que existe B se dice que es la matriz inversa de A y la denotaremos por A−1 .

Una matriz cuadrada A ∈ Mn (R) que posea inversa se dice que es invertible o también regular. Si no la tiene se
denomina matriz singular.

2.2.7. Un método sencillo para calcular la matriz inversa

Intentemos calcular la matriz inversa de la siguiente matriz de orden 2 × 2:


 
0 1
A= .
4 2
Procedemos de la siguiente manera. Ampliamos con la matriz identidad por la derecha
 
0 1 1 0
4 2 0 1
y seguidamente realizamos operaciones elementales (justo aquellas que fueron mencionadas en el método de
Gauss), con las filas de la matriz hasta conseguir:
 
1 0 ∗ ∗
.
0 1 ∗ ∗
Lo que resulta a la derecha en el lugar de las anteriores es justo la matriz inversa que buscábamos.

Veamos cómo se calcula la inversa para la matriz propuesta en el ejemplo.


   
0 1 1 0 1 −2 0 1 − 12
⇒ (2 fila × (− )) + 1 fila) ⇒
a a

4 2 0 1 2 4 2 0 1
 
−2 0 1 − 12
(1 fila × 2)) + 2 fila) ⇒
a a
⇒ (1a f ila × 2)) + 2a f ila) ⇒
0 2 2 0
 
1 0 − 12 41
0 1 1 0
Después de los anteriores cálculos y según lo expresado al comienzo concluiremos que
 1 1 
−2 4
A−1 = .
1 0
ÁLGEBRA LINEAL Y GEOMETR ÍA 127

2.3. Determinantes: definición, propiedades, reglas de cálculo y aplicaciones

Vamos a empezar definiendo el concepto de determinante de una matriz cuadrada de orden n, A = (aij ). Para
introducir este concepto hacen falta algunas definiciones preliminares.

Dado el conjunto {1, 2, 3, ..., n}, cualquier n-upla ordenada formada por los n elementos de este conjunto diremos
que es una permutación. Denotaremos por Pn el conjunto de todas las permutaciones de {1, 2, 3, ..., n}.

Diremos que una permutación σ ∈ Pn tiene una inversión (o trasposición), cuando el orden que presentan dos
números es el contrario al que tienen los números naturales.

Ejemplo. Dado {1, 2, 3} , (1, 3, 2) es una permutación que pertenece a P3 . El número de permutaciones de P3
es 3! = 6. Son las formadas por (1, 2, 3), (2, 3, 1), (3, 1, 2), (3, 2, 1), (2, 1, 3) y (1, 3, 2). La permutación (1, 3, 2)
tiene una inversión (3 antes que 2) y (3, 2, 1) tiene 3 inversiones (3 antes que 2, 3 antes que 1 y 2 antes que 1). 2

Sea σ ∈ Pn , definimos el signo de σ como s(σ) = (−1)i(σ) , donde por i(σ) indicamos el número de inversiones
que tiene la permutación σ.

Antes de introducir la definición general de determinante, lo haremos primero para una matriz de orden 3. Consi-
deremos la matriz  
a11 a12 a13
A =  a21 a22 a23 
a31 a32 a33
y formemos todos los posibles productos de tres elementos de dicha matriz con las siguientes restricciones:

(1) En cada producto sólo puede aparecer un elemento de cada fila y uno de cada columna.
(2) Dotaremos de un signo a cada producto que coincidirá con el signo de la permutación de P3 formada por
los segundos subı́ndices de los elementos.

Permutación Número de inversiones Producto


123 0 +a11 a22 a33
231 2 +a12 a23 a31
312 2 +a13 a21 a32
321 3 −a13 a22 a31
213 1 −a12 a21 a33
132 1 −a11 a23 a32

Llamaremos determinante de A y lo notaremos por det(A) o por |A|, a la suma de todos estos productos. Es decir,
|A| = a11 a22 a33 + a12 a23 a31 + a13 a21 a32 − a13 a22 a31 − a12 a21 a33 − a11 a23 a32 .

Siguiendo esta misma técnica de definición podemos llegar a definir el concepto de determinante para una matriz
genérica de orden n, A = (aij ).

Definimos el determinante de A por la expresión


X
det(A) = (−1)s(σ) a1σ(1) a2σ(2) ...anσ(n)
σ∈Pn

donde por (σ(1), σ(2), ..., σ(n)) indicamos los subı́ndices que representa la permutación σ.

Observación. En un determinante de orden n aparecen n! sumandos. Como vemos el número de sumandos crece
rápidamente en relación con el orden del determinante. No es por tanto demasiado operativo como método de
128 MATEM ÁTICAS

cálculo la definición de determinante que hemos introducido con anterioridad. Procede por tanto que introduzca-
mos un método más práctico que nos facilite el trabajo en el cálculo de determinantes.

Dada la matriz A = (aij ), llamaremos menor complementario del elemento aij al determinante de la matriz que
resulta de suprimir en A la fila i y la columna j. Lo denotaremos por Mij .

Llamaremos adjunto de aij a la expresión Aij = (−1)i+j Mij .

Ejemplo. Dada la matriz


 
1 2 3 4
 0 2 2 3 
A= 
 0 0 −6 −4 
0 0 0 −2
el menor complementario de 4 es
0 2 2

M44 = 0 0 −6 =0

0 0 0

y el del 1 corresponde a
2 2 3

M11
= 0 −6 4 = 24.

0 0 −2

Los adjuntos son A11 = (−1)1+1 M11 = 24 y A44 = (−1)4+4 M44 = 0. 2

2.3.1. Cálculo del determinante por el desarrollo de los elementos de una fila o columna

Se puede demostrar sin demasiada dificultad (ver bibliografı́a recomendada) que dada una matriz genérica de
orden n, A = (aij ), el determinante viene dado por

det(A) = a11 A11 + a21 A21 + ... + an1 An1 .

A esta expresión se llama desarrollo del determinante de la matriz A por los elementos de la primera columna,
puesto que son (a11 , a21 , ..., an1 ) los elementos que forman la primera columna de la matriz A.

Esta importante propiedad se puede hacer más genérica y la expresión anterior será también válida eligiendo para
el desarrollo los elementos de cualquier fila o columna del determinante.

Por ejemplo para la fila i-ésima (ai1 , ai2 , ..., ain ) obtendrı́amos det(A) = ai1 Ai1 + ai2 Ai2 + ... + ain Ain y para
la columna j-ésima (a1j , a2j , ..., anj ) se tiene det(A) = a1j A1j + a2j A2j + ... + anj Anj .

La gran ventaja que presentan estas expresiones es que podemos reducir el cálculo de un determinante de orden n
al cálculo de otros (los adjuntos) que tienen el orden disminuido en una unidad (una fila y una columna menos).

Aplicando sucesivamente este criterio, podremos acabar reduciendo cualquier determinante a cálculos de deter-
minantes de orden 2.

Ejemplo. Desarrollando por los elementos de una lı́nea (fila o columna) vamos a calcular el valor del siguiente
determinante
1 −3 2 6

3 2 1 0
∆ =
2 1 −4 5
0 0 −4 0
ÁLGEBRA LINEAL Y GEOMETR ÍA 129

La primera cuestión que nos surge es la fila o columna que más nos conviene escoger para el posterior desarrollo.
Parece claro para este ejemplo que es la cuarta fila y en general debemos escoger aquella que tenga el mayor
número de elementos iguales a cero. Ası́

1 −3 6  
Desarrollando por la −3 6 1 6
∆ = −(−4) 3 2 0 = = 4(−3 + 2 ) = 388.
2 2a fila 1 5 2 5
1 5
2

2.3.2. Propiedades de los determinantes

Para poder expresar mejor las siguientes propiedades usaremos la notación det(A) = det(C1 , C2 , ..., Cn ), donde
Ci indica la columna i-ésima de la matriz A.

(1) Si una columna se multiplica por un escalar λ el valor del determinante queda multiplicado por λ:

det(C1 , ..., λCi , ..., Cn ) = λ det(C1 , ..., Ci , ..., Cn )


0 0
(2) det(C1 , ..., Ci + Ci , ..., Cn ) = det(C1 , ..., Ci , ..., Cn ) + det(C1 , ..., Ci , ..., Cn )
(3) El determinante de una matriz que tenga dos columnas iguales vale cero:

det(C1 , ..., Ci , ..., Ci , ..., Cn ) = 0

(4) det(0n ) = 0 (donde 0n es la matriz de orden n con todos sus elementos iguales a 0), det(In ) = 1.
(5) Si se intercambian dos columnas el determinante cambia de signo:

det(C1 , ..., Ci , ..., Cj , ..., Cn ) = − det(C1 , ..., Cj , ..., Ci , ..., Cn )

(6) Si a una columna se le suma una combinación lineal de las demás, el determinante no varı́a:

det(C1 , ..., Cn ) = det(C1 + λ2 C2 + λ3 C3 + ... + λn Cn , C2 , ..., Cn )

(7) Si en una matriz cambiamos filas por columnas el valor del determinante no varı́a:

det(A) = det(t A)

(8) Si A y B son matrices cuadradas del mismo orden n, det(AB) = det(A) det(B).

Observación. La propiedad (7) demuestra que en todas las propiedades anteriormente enunciadas podemos cam-
biar las referencias a columnas por filas, verificándose igualmente el enunciado resultante.

De las propiedades de los determinantes y del desarrollo de los mismos por los elementos de una fila o columna,
podemos deducir que es posible mediante operaciones elementales entre las filas o columnas (según las propieda-
des anteriormente descritas) conseguir poner ceros en el mayor número de elementos de la fila o columna por la
que vayamos a desarrollar, con la finalidad de simplificar considerablemente los cálculos.

Ejemplo. Calculemos el valor de



1 1 2 1

2 3 4 5
∆ = .

6 7 8 9
1 4 5 7
130 MATEM ÁTICAS

a a a a
Restamos la 1 columna a la 2 y a la 4 y también podemos restar a la 3 columna, la 1a columna multiplicada
por 2, para obtener finalmente

1 0 0 0

2 1 0 3
∆ = .
6 1 −4 3
1 3 3 6
Observa que de la cuarta columna podemos sacar factor común 3. Ası́ tendremos

1 0 0 0

2 1 0 1
∆ = 3 .
6 1 −4 1
1 3 3 2
Desarrollando por los elementos de la primera fila obtenemos

1 0 1

∆ = 3 1 −4 1 .
3 3 2
Ahora podemos restar la 1a columna a la tercera, para obtener finalmente

1 0 0

∆ = 3 1 −4 0
3 3 −1
y desarrollando por la primera fila se tiene

−4 0
∆ = 3 = 12.
3 −1
2

2.3.3. Aplicación de determinantes al cálculo de la matriz inversa

Llamaremos matriz adjunta de A = (aij ) a la matriz


 
A11 A21 .... An1
 A12 A22 .... An2 
Adj(A) =   ....
,
..... .... .... 
A1n A2n .... Ann
donde por Aij entendemos el adjunto del elemento aij concepto que ya hemos introducido con anterioridad.

Una matriz cuadrada A = (aij ) tiene inversa si y sólo si det(A) 6= 0, verificándose la siguiente igualdad
1
A−1 = Adj(A).
det(A)

Ejemplo. Como ejemplo de que se cumple la expresión anterior, puedes comprobar que
 2   
3 − 16 − 12 1 3 −2
A−1 =  7 3
1
− 3  donde A =  −5 0
6 2 1 .
10 1
3 6 − 52 1 4 −3
2
ÁLGEBRA LINEAL Y GEOMETR ÍA 131

2.3.4. Forma matricial de un sistema de ecuaciones. Regla de Cramer

Consideremos el siguiente sistema de ecuaciones





a11 X1 + a12 X2 + ... + a1n Xn = b1

a21 X1 + a22 X2 + ... + a2n Xn = b2

 .............................................. ...

am1 X1 + am2 X2 + ... + amn Xn = bm

Según los conceptos y las operaciones introducidas con anterioridad, lo podrı́amos expresar de la siguiente forma:
    
a11 a12 .... a1n X1 b1
 a21 a22 .... a2n   X2   b2 
  = 
 .... ..... .... ....   ...   ... 
am1 am2 .... amn Xn bn

Esta última expresión recibe el nombre de forma matricial del sistema de ecuaciones lineales.

Cuando el sistema está formado por n ecuaciones y n incógnitas y el determinante de la matriz de los coeficientes
del sistema es distinto de cero, entonces se asegura la existencia de matriz inversa y podemos obtener las soluciones
despejando la matriz columna t (X1 X2 . . . Xn ) de la siguiente forma:
   −1  
X1 a11 a12 .... a1n b1
 X2   a21 a22 .... a2n   b2 
     
 ...  =  .... ..... .... ....   ... 
Xn an1 an2 .... ann bn

Esta expresión es lo que básicamente se conoce como regla de Cramer, y los sistemas con el mismo número de
ecuaciones que de incógnitas que cumplen la condición

a11 a12 .... a1n

a21 a22 .... a2n

.... ..... .... .... 6= 0

a .... ann
n1 an2

se denominan sistemas de Cramer. La regla de Cramer estamos acostumbrados a verla de otra forma, que resulta
de efectuar las operaciones matriciales correspondientes. Si llamamos

a11 a12 .... a1n

a21 a22 .... a2n
∆=

.... ..... .... ....
a .... ann
n1 an2

obtendremos las siguientes expresiones:



b1 a12 .... a1n

b2 a22 .... a2n

.... ..... .... ....

bn an2 .... ann
X1 = ,


a11 b1 .... a1n

a21 b2 .... a2n

.... ..... .... ....

an1 bn .... ann
X2 = , ...

132 MATEM ÁTICAS


a11 a12 .... b1

a21 a22 .... b2

.... ..... .... ....

an1 an2 .... bn
Xn =

Observación. Para obtener el valor correspondiente a la incógnita Xi , efectuamos el cociente entre el determinante
de la matriz resultado de sustituir en la matriz de los coeficientes del sistema la columna i-ésima por la columna
de los términos independientes, y el determinante ∆ de la matriz de los coeficientes.

Ejemplos.

(1) El sistema

 3x + 2y − z = 1
2x − y + z = −1

x − 2y + z = 2
es un sistema de Cramer, puesto que la matriz de los coeficientes
 
3 2 −1
A =  2 −1 1 
1 −2 1

tiene por determinante |A| = 4. Aplicando la regla de Cramer se tiene:



1 2 −1 3 1 −1 3 2 1

−1 −1 1 2 −1 1 2 −1 −1

2 −2 1 3 1 2 1 15 1 −2 −2 25
x= = , y= = , z= =−
4 4 4 4 4 4

(2) El sistema homogéneo



 3x + 2y − z = 0
2x − y + z = 0

x − 2y + z = 0
admite sólo la solución trivial x = y = z = 0, ya que la matriz de los coeficientes coincide con la del sistema
anterior y es por tanto un sistema de Cramer.

(3) La regla de Cramer también se puede usar para resolver sistemas de ecuaciones que tengan infinitas soluciones.
Consideremos el siguiente sistema:

 3x + 2y − 5z + 6t = 4
2x + y + 3z − t = 2

x − 3y + 2z + 5t = 0
si pasamos los términos en los que aparece la incógnita t al otro lado del signo igual obtendremos:

 3x + 2y − 5z = 4 − 6t
2x + y + 3z = 2+t

x − 3y + 2z = −5t

Considerando como incógnitas sólo a x, y, z para cada valor de t obtendrı́amos un sistema de Cramer, puesto que

3 2 −5

∆ = 2 1 3 =
6 0
1 −3 2
ÁLGEBRA LINEAL Y GEOMETR ÍA 133

(Comprueba que es cierto lo que afirmamos). Finalmente obtendrı́amos aplicando la regla de Cramer

4 − 6t 2 −5 3 4 − 6t −5

2+t 1 3 2 2+t 3

−5t −3 2 5 1 −5t 2 3 56
x= = 1 − t, y= = + t,
∆ 3 ∆ 11 33

3 2 4 − 6t

2 1 2 + t

1 −3 −5t 1 29
z= = − + t.
∆ 11 33
Es decir, el conjunto de soluciones viene expresado por
 
5 3 56 1 29
S = (1 − λ, + λ, − + λ) : λ ∈ R .
3 11 33 11 33

2.4. Espacios vectoriales: base y dimensión

Se han estudiado en los epı́grafes anteriores algunos conjuntos que con las operaciones definidas sobre ellos, en
virtud de las propiedades de las mismas, decı́amos que tienen estructura de espacio vectorial. Recordemos por
ejemplo el conjunto Mm×n (R) que tiene estructura de espacio vectorial sobre R con las operaciones “+” (suma
de matrices) y “.” (producto de un escalar por una matriz). Son numerosos e importantes los ejemplos en álgebra
en los que se puede observar esta estructura (ver bibliografı́a).

Todo lo expresado anteriormente se puede generalizar para un conjunto V , a cuyos elementos le llamaremos
genéricamente vectores, denotándolos por −

u ,−

v ,−

w , .... y con un cuerpo (ver definición en bibliografı́a) genérico
de escalares que denotaremos por K , y a sus elementos con letras griegas λ, µ, ...

Consideramos definidas en V dos operaciones, una interna: − →


u +− →v (suma de dos vectores que da otro vector)


y otra externa: λ u (producto de un escalar por un vector que da otro vector). Las propiedades verificadas para
todos los vectores de V y todos los escalares de K , que hacen de V con las operaciones anteriormente citadas un
espacio vectorial son las siguientes:

(1) −

u +−→v =−→
v +−
→u.
(2) −

u + (−
→v +−

w) = −

u + (−

v +−

w ).
−→ −→ → −
(3) Existe un elemento de V que denotaremos por 0 (elemento neutro) tal que 0 + −
u =→
u.
−→ −→ −→ −
→ −

(4) Para todo vector u existe − u ∈ V (elemento opuesto) tal que u + (− u ) = 0 .
(5) 1.−

u =− →
u (1 es el elemento unidad de K).
(6) λ(µ−→
u ) = (λµ)−
→u.
(7) (λ + µ) u = λ u + µ−
−→ −
→ →
u.
(8) λ(−

u +−

v ) = λ−

u + λ−

v.

Habitualmente en el caso en que el cuerpo sea el conjunto de los números reales, diremos que V es un espacio
vectorial real.

Ejemplo. El conjunto Rn = {(x1 , x2 , ..., xn ) : xi ∈ R con i = 1, ..., n} con las operaciones:


(1) (x1 , x2 , ..., xn ) + (y1 , y2 , ..., yn ) = (x1 + y1 , x2 + y2 , ..., xn + yn )
(2) λ(x1 , x2 , ..., xn ) = (λx1 , λx2 , ..., λxn )
es un espacio vectorial sobre R (Compruébalo). 2
134 MATEM ÁTICAS

2.4.1. Vectores y ecuaciones lineales

Dos importantes conceptos relativos a vectores, las combinaciones lineales y la dependencia lineal, están estre-
chamente relacionadas con los sistemas de ecuaciones lineales.

Combinación lineal. Un vector − →v es combinación lineal de los vectores −


v→ −
→ −

1 , v2 , ..., vn si existen escalares
−→ −→ −→ −

λ1 , λ2 , ..., λn tales que v = λ1 v1 + λ2 v2 + ... + λn vn .
Dependencia lineal. Los vectores − v→ −
→ −

1 , v2 , ..., vn se dice que son linealmente dependientes si existe alguna com-
−→ −→ −→ −→
binación lineal λ1 v1 +λ2 v2 +...+λn vn = 0 , en la que alguno de los coeficientes escalares λi es distinto
de 0. En el caso en que esto no sea posible los vectores se dicen linealmente independientes.

Consideremos el siguiente sistema homogéneo de m ecuaciones con n incógnitas:



 a11 X1 + a12 X2 + · · · + a1n Xn = 0


a21 X1 + a22 X2 + · · · + a2n Xn = 0
 ...............................................
 ...

am1 X1 + am2 X2 + · · · + amn Xn = 0

Este sistema se puede plantear equivalentemente por la siguiente ecuación vectorial:


       
a11 a12 a1n 0
 a21   a22   a2n   0 
       
 ...  X1 +  ...  X2 + · · · +  ...  Xn =  ... 
am1 am2 amn 0
Esto es,
 
a1i
→ − →  a2i 
X1 −
v→ −→ −
1 + X2 v2 + · · · + Xn vn = 0 , donde −

vi =  
 ...  , i = 1, ..., n.
ami
Después de los conceptos introducidos anteriormente te proponemos que contestes a las siguientes preguntas.
¿Cómo son los vectores −
v→ −
→ −

1 , v2 , ..., vn si el sistema homogéneo tiene alguna solución no nula? ¿Y si tiene sólo la
solución nula?

2.4.2. Subespacios vectoriales

Dado un espacio vectorial V sobre un cuerpo K decimos que un subconjunto S ⊂ V es un subespacio vectorial,
cuando tiene estructura de espacio vectorial con las operaciones que están definidas en V . Se puede demostrar
que S ⊂ V es un subespacio vectorial si y sólo si para cualquier par de vectores −

u ,−

v ∈ S y escalares λ, µ ∈ K

→ −

se tiene λ u + µ v ∈ S.

2.4.3. Subespacio engendrado por un conjunto de vectores. Sistema de generadores. Bases y dimensión de
un espacio vectorial

Sea G = {− v→ −
→ −

1 , v2 , ..., vn } una colección de vectores de un espacio vectorial V sobre un cuerpo K . Llamaremos
subespacio engendrado por G y lo denotaremos por L(G) al conjunto de todas las combinaciones lineales de
vectores de G. Es decir, L(G) = { λ1 − v→ −
→ −

1 + λ2 v 2 + · · · + λn vn | λ1 , λ2 , ..., λn ∈ K }
ÁLGEBRA LINEAL Y GEOMETR ÍA 135

Se dice que G es un sistema de vectores generadores de V si L(G) = V .

Observación. Son especialmente importantes los casos de los espacios vectoriales formados por los vectores
libres del plano R2 y del espacio R3 , por la interpretación gráfica que los conceptos introducidos anteriormente
sugieren. Conceptos que seguro te son familiares, pero es fundamental que los recuerdes ahora, consultando si es
necesario la bibliografı́a recomendada.

En ocasiones es posible eliminar un vector de un sistema generador sin que el subespacio generado se altere. Pero
el vector que eliminemos no puede ser uno cualquiera, sino alguno que se pueda expresar como combinación lineal
de los restantes. La idea de quedarnos con el menor número de generadores posible de todo el espacio vectorial
es la que nos lleva a introducir el concepto de base.

Un sistema de vectores generadores y linealmente independientes de un espacio vectorial recibe el nombre de


base. Se puede demostrar que en todo espacio vectorial existe una base.

En el espacio vectorial Rn existe una base que distinguimos de las demás y que llamaremos base canónica,
formada por los vectores
−e→ = (1, 0, 0, ..., 0)
1
−e→ = (0, 1, 0, ..., 0)
2
... .....................

e→ = (0, 0, ..., 0, 1)
n

Puedes comprobar que efectivamente se trata de un sistema de vectores linealmente independientes y generadores.

Ejemplo. Los vectores −v→ −


→ −→ 3
1 = (1, 1, 1), v2 = (1, 1, 0) y v3 = (1, 0, 0) forman una base de R . No sucede lo
−→

→ −
→ −
→ −→ −→ −

mismo con los vectores u1 = (1, 1, 1), u2 = (2, −1, 3), u3 = (1, −5, 3) ya que 3 u1 − 2 u2 + u3 = 0 . 2
En un espacio vectorial dado V , todas las bases tienen el mismo número de elementos, a ese número se le llama
dimensión del espacio vectorial, la denotaremos por dim V .

Observaciones.
• Después de lo visto anteriormente queda demostrado que la dimensión del espacio vectorial Rn es n.
• Observa que en Rn (en general en cualquier espacio vectorial de dimensión n) n vectores lineamente inde-
pendientes forman una base. Análogamente sucede con n vectores generadores. Nunca puede haber más de n
vectores linealmente independientes ni menos de n vectores generadores.
• Aunque la dimensión de Rn está clara, es muy importante para nosotros establecer algún método que nos pueda
dar la dimensión de los subespacios generados por vectores de Rn . Supongamos que tenemos el siguiente sistema
de vectores de R4 :
→ = (1, 0, 2, 3), −

u → = (2, 1, 4, 0), −
u → = (3, 1, −1, 2), −
u → = (−1, 1, −16, −11)
u
1 2 3 4

Queremos calcular dim L({− →, −


u → − → − →
1 u2 , u3 , u4 }). La dimensión de este subespacio será la misma, si sustituimos en
el sistema de vectores generadores, cualquier vector por una combinación lineal de los vectores generadores en
la que necesariamente aparezca él. Esto se traduce en que podemos hacer operaciones elementales (las que ya
hacı́amos con el método de Gauss y para la resolución de los determinantes) sin que la dimensión varı́e. Es decir,
en nuestro caso particular, poniendo las coordenadas de los vectores como filas de una matriz obtenemos:
 −
→   
u 1 1 0 2 3


 u2   2 1 4 0 
 =  =⇒
 −

u 3
  3 1 −1 2 


u −1 1 −16 −11
4

 −
→   
u 1 1 0 2 3
 −
→ −
→ −→  
−6 
0
 u 2 = u 2 − 2 u1   0 1 0  =⇒
 −
→ −
→ −→ =
−7 
0
 u3 = u3 − 3 u 1  0 1 −7

→ 0

→ −

u4 = u4 + u 1 0 1 −16 −8
136 MATEM ÁTICAS

   


u 1 0 2 3
1
 −
→ 0   0 1 0 −6 
 u2   
 −
→0 =
 u
3  0 0 −7 1 

→0 − 2−
u →0
u 0 0 0 0
4 3

Como vemos, se puede deducir fácilmente que la dimensión del subespacio es


→, −
dim L({−
u → − → − → −→ − →0 − →0 − →0 −→0
1 u2 , u 3 , u4 }) = dim L({ u1 , u2 , u3 , u4 − 2 u3 }) = 3.

2.4.4. Rango de una matriz. Teorema de Rouché-Frobenius

Consideremos la matriz A = (aij ) ∈ Mm×n (R); en ella podemos distinguir m vectores filas pertenecientes a
Rn y n vectores columna pertenecientes a Rm . Denotemos por Fi , i = 1, 2, ...., m a los vectores fila y por Cj ,
j = 1, 2, ..., n los vectores columna. Enunciamos a continuación un resultado fundamental que hace posible la
definición del concepto de rango de la matriz A.

Dada la matriz A anteriormente introducida, se tiene que dim L(F1 , F2 , ..., Fm ) = dim L(C1 , C2 , ..., Cn ) y a este
número se le denomina rango de la matriz A, denotándose por r(A).

Ejemplo. Puede comprobarse que la matriz


 
1 2 −1 1
A =  2 −1 1 −2 
0 5 −3 4

tiene rango r(A) = 2. 2

2.4.5. Una método para calcular el rango: los orlados

Es importante que recuerdes el siguiente método práctico para calcular el rango de una matriz, llamado a veces
método de los orlados. Dada la matriz A = (aij ) ∈ Mm×n (R), consideramos en ella un menor Mk de orden k.
Llamaremos orlado de Mk con la columna i y la fila j al determinante obtenido añadiendo a Mk los elementos
de la fila j que corresponden en la matriz A a las columnas de Mk y añadiendo también a su vez los elementos
de la columna i que corresponden a las filas de Mk y el elemento aji , conservando siempre el orden original que
tienen todos los elementos mencionados en la matriz A. Por ejemplo, para la matriz
 
1 2 −1 1
A =  2 −1 1 −2 
0 5 −3 4

y dado el menor de orden 2


1 2
M2 = ,

2 −1
el orlado de M2 con la fila 3 y la columna 4 es el determinante

1 2 1

2 −1 −2 .

0 5 4

El método de los orlados consiste en lo siguiente:


ÁLGEBRA LINEAL Y GEOMETR ÍA 137

• Tomamos en A un elemento no nulo (menor M1 de orden 1).

• Se calculan los orlados de M1 hasta que obtengamos uno que sea distinto de cero. (Si todos los orlados
valen cero se tiene que r(A) = 1).

• A partir de este momento sabemos que r(A) > 2. Procedemos como antes orlando este menor de orden 2
hasta que obtengamos uno que sea distinto de cero (Si todos los orlados valen cero se tiene r(A) = 2).

• A partir de este momento sabemos que r(A) > 3. Procedemos como antes orlando este menor de orden 3
hasta que obtengamos uno que sea distinto de cero (Si todos los orlados valen cero se tiene r(A) = 3).

• Ası́ sucesivamente hasta obtener el rango de la matriz A.

También es conveniente que repases las justificaciones teóricas de este método, pudiéndolas encontrar en cualquier
libro de matemáticas generales (ver bibliografı́a recomendada).

2.4.5.1. Teorema de Rouché-Frobenius

Consideremos el siguiente sistema de ecuaciones lineales




a11 X1 + a12 X2 + ... + a1n Xn = b1

a21 X1 + a22 X2 + ... + a2n Xn = b2

 .............................................. ...

am1 X1 + am2 X2 + ... + amn Xn = bm

La condición necesaria y suficiente para que tenga soluciones (sea compatible) es que el rango de la matriz de los
coeficientes A coincida con el rango de la matriz ampliada A∗ .

Una de las principales aplicaciones de este teorema es la discusión de un sistema de ecuaciones lineales en función
de uno o varios parámetros. Por ejemplo, consideremos el siguiente sistema de ecuaciones lineales y discutamos
según los valores de m.

 (m + 2)x + y + z = m−1
mx + (m − 1)y + z = m − 1

(m + 1)x + (m + 1)z = m − 1

Denotamos por M la matriz de los coeficientes del sistema y por M ∗ la matriz ampliada, es decir:

   
m+2 1 1 m+2 1 1 m−1
M = m m−1 1  y M∗ =  m m−1 1 m−1 
m+1 0 m+1 m+1 0 m+1 m−1

El sistema es compatible ⇐⇒ r(M ) = r(M ∗ ). Además det(M ) = m(m + 1)(m − 1) obteniéndose lo siguiente:

Si m 6= 0 y m 6= 1 y m 6= −1 ⇒ rango(M ) = 3 = rango(M ∗ ) y el sistema es compatible y determinado. (Se


deja al lector continuar con la discusión del sistema, examinando qué sucede con los rangos r(M ) , r(M ∗ ) en los
demás casos).
138 MATEM ÁTICAS

2.5. Valores y vectores propios de una matriz

Consideremos la matriz  
a11 a12 ... a1n
 a21 a22 ... a2n 
A=
 .....
,
..... ... ..... 
an1 an2 ... ann
entonces la matriz  
t − a11 −a12 ... −a1n
 −a21 t − a22 ... −a2n 
tIn − A = 
 .....


..... ... .....
−an1 −an2 ... t − ann
se denomina matriz caracterı́stica de A. Su determinante

∆A (t) = det(tIn − A)

lo denominaremos polinomio caracterı́stico.

Se tiene que

∆A (t) = tn − (a11 + a22 + ... + ann )tn−1 + pn−2 tn−2 + · · · + p1 t + (−1)n det(A).

Teorema de Cayley-Hamilton. Toda matriz es un cero de su polinomio caracterı́stico.

Ejemplo. Sea la matriz  


1 2
A= ,
5 4
entonces se tiene ∆A (t) = t2 − 5t − 6. Puedes comprobar que efectivamente se cumple
 
0 0
A2 − 5A − 6I2 = .
0 0
2
Dos matrices cuadradas de orden n se dicen semejantes cuando existe una matriz no singular (que tiene inversa)
P tal que B = P −1 AP .

Propiedad. Dos matrices semejantes tienen el mismo polinomio caracterı́stico.

Veamos explı́citamente el polinomio caracterı́stico para una matriz de orden 2 y 3. Si n = 2 entonces:



a11 a12
2
∆A (t) = t − (a11 + a22 )t +
a21 a22

mientras que si n = 3 se satisface:



a11 a12 a13

∆A (t) = t3 − (a11 + a22 + a33 )t2 + (M11 + M22 + M33 )t − a21 a22 a23

a a32 a33
31

donde por Mij notamos el menor del elemento de la fila i y la columna j.

Para la matriz genérica A = (aij ) un escalar λ se denomina valor propio, si existe un vector (columna) no nulo −

v

→ −→
para el que A v = λ v . Todo vector que satisfaga ésta relación se denomina vector propio de A perteneciente al
ÁLGEBRA LINEAL Y GEOMETR ÍA 139

valor propio λ. Es fácil ver que cada múltiplo k−



v de un vector propio es a su vez otro vector propio. El conjunto
Eλ de todos los vectores propios pertenecientes a λ es un subespacio de Rn , que se denomina espacio propio de
λ.

Propiedad. Sea A ∈ Mn (R). Los siguientes enunciados son equivalentes:


(a) λ es un valor propio de A.
(b) La matriz caracterı́stica tIn − A es no singular.
(c) λ es una raı́z de ∆A (t).
−→ − → −→
El espacio propio Eλ será el espacio solución del sistema homogéneo (λIn − A) X = 0 o bien (A − λIn ) X =


0.

Llamaremos multiplicidad algebraica del valor propio λ a la multiplicidad de λ como raı́z del polinomio carac-
terı́stico y denominaremos multiplicidad geométrica de λ a la dimensión de Eλ .

Propiedad. La multiplicidad geométrica de un valor propio es siempre menor o igual que la multiplicidad alge-
braica.

2.6. Diagonalización y formas canónicas de matrices

Diremos que una matriz A es diagonalizable si existe una matriz no singular P tal que D = P −1 AP , siendo D
una matriz diagonal.

Propiedad. Una matriz de orden n es diagonalizable si y sólo si tiene n vectores propios linealmente indepen-
dientes y en ese caso los elementos diagonales de D son los valores propios correspondientes, teniéndose además
que D = P −1 AP , donde P es la matriz cuyas columnas son los vectores propios. En particular esto se cumple
cuando tiene n valores propios diferentes.

Ejemplo. Sea la matriz


 
4 1 1
A= 2 5 −2  ,
1 1 −2
entonces se tiene que

∆A (t) = det(tI3 − A) = t3 − 11t2 + 39t − 45 = (t − 3)2 (t − 5).

Los valores propios soluciones de la ecuación caracterı́stica

t3 − 11t2 + 39t − 45 = 0

son λ1 = 3 y λ2 = 5. Para cada valor propio calculamos las ecuaciones del subespacio propio como sigue:
    
1 1 −1 x 0
Eλ1 :  2 2 −2   y  =  0  ,
1 1 −1 z 0

es decir, x + y − z = 0, de donde obtenemos dos vectores propios linealmente independientes




u = (1, −1, 0) y −
→v = (1, 0, 1).
    
−1 1 −1 x 0
Eλ2 :  2 0 −2   y  =  0  ,
1 1 −3 z 0
140 MATEM ÁTICAS

es decir, 
 −x + y − z = 0 
x−z = 0
2x − 2z = 0 ⇒
 y − 2z = 0
x + y − 3z = 0
de donde obtenemos el vector propio


w = (1, 2, 1).
La matriz A es, por tanto, diagonalizable, ya que tiene tres vectores propios linealmente independientes, obte-
niéndose    
1 1 1 3 0 0
P =  −1 0 2  y P −1 AP =  0 3 0  .
0 1 1 0 0 5
2

2.6.1. Potencia n-ésima de una matriz diagonalizable

Si A es una matriz diagonalizable con P −1 AP = D , despejando tenemos que A = P DP −1 . Si queremos


calcular A2 = (P DP −1 )(P DP −1 ) = P D2 P −1 . Algo parecido ocurre con A3 = A2 A = P D2 P −1 P DP −1 =
P D3 P −1 . Razonando por inducción se tiene que An = P Dn P −1 , con la enorme ventaja que supone el reducir
el problema al cálculo de la potencia n-ésima de una matriz diagonal, que como sabemos se calcula elevando a n
todos los elementos de la diagonal principal.

Como ejemplificación de lo anteriormente expuesto vamos a calcular An con


 
4 1 1
A= 2 5 −2  .
1 1 −2

Para ello tendremos que calcular la matriz inversa de


 
1 1 1
P =  −1 0 2 ,
0 1 1

obteniendo que está dada por


 
1 0 −1
P −1 =  − 12 − 12 3
2

1 1
2 2 − 12
y por tanto
  n  
1 1 1 3 0 0 1 0 −1
An = P Dn P −1 =  −1 0 2  0 3n 0   − 12 − 12 3
2
.
1 1 1
0 1 1 0 0 5 n
2 2 −2

2.6.2. Formas canónicas de matrices

Llamaremos matriz elemental de Jordan de orden k y valor propio λ a la matriz Jk (λ) de orden k cuyos
elementos son todos cero menos los de la diagonal principal que son iguales a λ y los que están inmediatamente
ÁLGEBRA LINEAL Y GEOMETR ÍA 141

por encima de la diagonal principal que son iguales a 1. Es decir,

J1 (λ) = (λ),
 
λ 1
J2 (λ) = ,
0 λ
 
λ 1 0
J3 (λ) =  0 λ 1  ,
0 0 λ
 
λ 1 0 0
 0 λ 1 0 
J4 (λ) = 
 0 0 λ 1 ,

0 0 0 λ
··· = ···

Se llama matriz de Jordan a la matriz que se forma yuxtaponiendo matrices elementales Jordan a lo largo de la
diagonal principal, y ceros en el resto, es decir a una matriz del estilo
 
Jk1 (λ1 ) 0
 Jk2 (λ2 ) 
 
 .. 
 . 
0 Jkr (λr )

Propiedad. Toda matriz cuadrada es semejante a una matriz de Jordan (real o compleja), que se determina de
forma única salvo permutaciones de los bloques diagonales de matrices elementales Jordan que la forman.

En lo que sigue vamos a obtener las formas canónicas de Jordan para matrices de órdenes 2 y 3.

Consideremos n = 2, sabemos que si A tiene dos valores propios λ1 y λ2 distintos, entonces es diagonalizable.
El caso interesante lo tenemos cuando λ1 = λ2 .

Ejemplo. Vamos a calcular la forma de Jordan de la matriz


 
0 2
A= .
−2 4

Primero obtenemos ∆A (t) = λ2 − 1 = 0, y de aquı́ λ1 = λ2 = 2. Puedes comprobar que Eλ1 viene expresado
por las ecuaciones x = y. Es decir estarı́a generado por el vector −→
u = (1, 1). La matriz A no es por tanto
2
diagonalizable. Obsérvese que (A − λ1 I2 ) = 0 siempre que se tengan dos valores propios iguales.

Cogemos ahora un vector del plano que no esté en Eλ1 , por ejemplo − →
v = (1, 0), ya que se puede comprobar
fácilmente que       
−2 2 −2 −

=−→
1 1
(A − λ1 I2 ) = = w 6= 0 .
0 −2 2 0 −2
La matriz P de cambio de base que conduce a la forma canónica se construye tomando los vectores −

w y−

v como
columnas respectivas (en este orden), es decir,
 
−2 1
P =
−2 0

y ası́ se puede comprobar fácilmente que


   −1   
2 1 −2 1 0 2 −2 1
= .
0 2 −2 0 −2 4 −2 0
142 MATEM ÁTICAS

2
Consideremos ahora el caso n = 3; al igual que en el caso de orden 2, la reflexión que requiere nuestro interés la
encontramos cuando la matriz A no es diagonalizable.

Ejemplo. Vamos a calcular la forma canónica de Jordan de la matriz


 
0 3 1
A =  2 −1 −1  .
−2 −1 −1

Se tiene que
∆A (t) = −λ3 − 2λ2 + 4λ + 8 = 0,
y de aquı́ los valores propios son:

λ1 = 2 (simple) y λ2 = −2 (doble)

Procediendo como en el ejemplo anterior obtenemos



2x − 3y − z = 0
E λ1 : ,
−4y − 4z = 0

subespacio de dimensión 1, del que podemos extraer al vector



→ = (1, 1, −1)
u 1

como base del mismo. Por otro lado



2x + 3y + z = 0
E λ2 :
−2y − 2z = 0

y de aquı́ observamos que −



v = (1, −1, 1) serı́a una base del mismo. Es claro que la matriz no es diagonalizable,
ya que no podemos obtener una base de todo el espacio. Para obtener la forma de Jordan procedemos como sigue.

Probamos con  
 
x 0
Eλ0 2 : (A + 2I3 )2  y  =  0  ,
z 0
es decir     
8 8 0 x 0
 8 8 0   y  =  0  =⇒ x + y = 0,
−8 −8 0 z 0
que es un subespacio de dimensión 2, con base

v→ −
v→
1 = (1, −1, 0) y 2 = (0, 0, 1).

Como Eλ1 y Eλ0 2 llenan todo el espacio, podemos elegir ahora una base de manera conveniente para obtener la
matriz de Jordan. La forma de elegirla es la siguiente:

(1) Cogemos un vector de Eλ0 2 que no esté en Eλ2 , por ejemplo −


→ = (0, 0, 1)
u 3

 
 
0 1
(2) Se coge −
→ = (A + 2I )  0  =  −1 
u 2 3
1 1
ÁLGEBRA LINEAL Y GEOMETR ÍA 143

(3) La base formada por los vectores {−→, −


u → − →
1 u2 , u3 } es la que posibilita el cambio de base para obtener la matriz
de Jordan. En otras palabras las columnas de la matriz P son las coordenadas de los vectores − →, −
u → − →
1 u2 , u3 ,
obteniéndose
   −1   
2 0 0 1 1 0 0 3 1 1 1 0
 0 −2 1  =  1 −1 0   2 −1 −1   1 −1 0  .
0 0 −2 −1 1 1 −2 −1 −1 −1 1 1

2.6.3. Potencia n-ésima de una matriz usando la forma canónica de Jordan

De forma análoga a como razonábamos para calcular la potencia n-ésima de una matriz diagonalizable, se puede
ahora trabajar con una matriz que sea semejante a una forma canónica de Jordan. La idea es la misma, An =
P J n P −1 , donde J indica la forma canónica de Jordan a la que reducimos la matriz A.

Para calcular An en el ejemplo anterior se procederı́a como sigue:


 n   n  −1
0 3 1 1 1 0 2 0 0 1 1 0
 2 −1 −1  =  1 −1 0   0 −2 1   1 −1 0 
−2 −1 −1 −1 1 1 0 0 −2 −1 1 1

Dejamos para el lector la obtención final de la expresión


 n
2 0 0
 0 −2 1  ,
0 0 −2

teniendo en cuenta para ello que basta con calcular la potencia n-ésima de cada uno de los bloques diagonales, es
 n
−2 1
decir, 2n y , poniendo ceros en el resto.
0 −2

2.7. Los espacios euclı́deos R2 y R3 . Producto escalar. Normas y distancias.

La posibilidad de medir longitudes de segmentos y ángulos no se da en un espacio vectorial genérico. Para


introducir estos conceptos (longitud de un vector, ángulo entre dos vectores,. . . ) se debe dar la definición de un
producto escalar (una regla que asocie a cada par de vectores un escalar y que cumpla un serie de propiedades).

Más concretemente precisamos a continuación la definición genérica de espacio euclı́deo.

Un espacio vectorial real V se dice euclı́deo si hay una regla que asigne a cada par de vectores −

u ,−

v ∈ V un

→ −
→ −
→ −→
número real llamado producto escalar de los vectores u y v , que denotaremos por ( u , v ) (también a veces
por −

u .−→v ), de manera que se cumplan las siguientes propiedades:

• Simétrica: (−

u ,−

v ) = (−

v ,−

u ) para todo −

u ,−

v ∈ V.
• Distributiva: (−

u , (−

v +−

w )) = (−

u ,−

v ) + (−

u ,−

w ) para todo −

u ,−

v ,−

w ∈ V.
• (λ−

u ,−

v ) = λ(−

u ,−

v ) para todo −

u ,−

v ∈ V y para todo λ ∈ R.
144 MATEM ÁTICAS

• (−

u ,−

u ) > 0 para todo −

u ∈ V, −
→ 6 0
u =

Ejemplos.

(1) Rn se puede dotar del siguiente producto escalar (puedes comprobar las propiedades):

(x1 , x2 , ..., xn ).(y1 , y2 , ..., yn)= x1 y1 + x2 y2 + .... + xn yn

(2) En Rn también se pueden definir otros productos escalares. Por ejemplo, en R2 definimos
 
1 1
(x1 , x2 ).(y1 , y2 ) = (x1 , x2 ) (y1 , y2 ).
1 2

Comprueba que cumple todas las propiedades del producto escalar.

En V3 (espacio vectorial real de los vectores libres de R3 ) también podemos definir un producto escalar de la
siguiente manera: Si consideramos − →u = (u1 , u2 , u3) y −

v = (v1 , v2 , v3 ) expresiones de los vectores −

u y−

v en
la base canónica de V3 , definimos el producto escalar de esos dos vectores como


u .−

v = u1 v1 + u2 v2 + u3 v3 .

La norma o longitud de un vector − →


u en un espacio euclı́deo de define como

k−uk= −
→ →
u .−→
u.
√→ −
(Obsérvese que − u .→u tiene sentido debido a la propiedad cuarta del producto escalar). Si consideramos −

u =
−→ −
→ −→
u1 e1 + u2 e2 + u3 e3 la expresión del vector en la base canónica, entonces
q
k−→u k = u21 + u22 + u23 .

El ángulo que forman dos vectores −


→ v ∈ V3 está determinado por cos(−
u ,−
→ →
u ,−
→ −
→u .−

v
v)= |−

u ||−
→v|
.

En particular, dos vectores ortogonales −



u y−

v (forman un ángulo de 90o ) se caracterizan por la condición nece-
−→ −

saria y suficiente u . v = 0.

Ejemplo. Dados los vectores −


→u = (−1, 2, p) y −→v = (4, p, −3), ¿qué valor tendrı́a que tener el parámetro p para
que fueran ortogonales? Parece claro que según lo dicho anteriormente la condición es que −→u .−→
v = 0 y de aquı́
deducimos que deber ser p = −4. 2

2.7.1. Sistemas de vectores ortogonales y ortonormales

Un conjunto S de vectores de V3 se dice ortogonal si cualquier vector de S es ortogonal a todos los demás vectores
del conjunto.

Por ejemplo, los vectores −



u = (2, 1, −1), −

v = (−1, 4, 2) y −

w = (2, −1, 3) forman un sistema ortogonal.

Una propiedad muy importante para este tipo de conjuntos es la siguiente: “Sean −

u ,−

v y−

w vectores no nulos
ortogonales de V3 , entonces son linealmente independientes”.

Un conjunto ortogonal de vectores S se dice que es ortonormal cuando todos los vectores del conjunto tienen
norma igual a 1.
ÁLGEBRA LINEAL Y GEOMETR ÍA 145

Especial importancia tienen las llamadas bases ortonormales de V3 en las cuestiones relativas a curvas en R3 ,
que desarrollaremos posteriormente en el Capı́tulo 6.

Distancia entre dos puntos. Dados dos puntos de R3 , A(a1 , a2 , a3 ) y B(b1 , b2 , b3 ), se define la distancia entre
−→
ellos como la norma del vector AB, es decir,
−→ p

d(A, B) = AB = (b1 − a1 )2 + (b2 − a2 )2 + (b3 − a3 )2

−→
ya que AB = (b1 − a1 , b2 − a2 , b3 − a3 ).

Ejemplo. Como un sencillo ejercicio de la definición de distancia entre dos puntos, puedes comprobar que el
triángulo ABC, con A(3, −1, 2), B(0, −4, 2) y C(−3, 2, 1) es isósceles. 2

2.8. Producto vectorial y producto mixto (o triple)

Sean − →
u ,−
→v ∈ V3 . Se llama producto vectorial de −

u y−

v y lo denotaremos por −

u ×−

v al vector libre que tiene
las siguientes propiedades:

(1) |−

u ×−

v | = |−

u | |−

v | sen(−

u ,−

v)
(2) La dirección del vector −

u ×−

v es la perpendicular a las direcciones de los vectores −

u y−

v.
(3) El sentido del vector −

u ×− →
v es el indicado por la siguiente regla práctica: colocamos la mano derecha
con el dedo “corazón” en posición perpendicular a los dedos “pulgar” e “ı́ndice”, de tal forma que el dedo
“pulgar” indique el sentido del vector −→
u y el dedo “ı́ndice” indique el sentido del vector −→v . Entonces el
−→ −

dedo “corazón” indica el sentido del vector u × v .

Figura 5.1: Regla del sacacorchos para determinar el sentido del producto vectorial.

2.8.1. Propiedades del producto vectorial

(1) −

u ×−

v = −(−

v ×−

u ).
−→
(2) Si −

u y−

v tienen la misma dirección entonces −

u ×−

v = 0.
(3) λ−
→u ×−
→v = λ(−
→u ×−→
v ).

→ −
→ −
→ −→
u × λ v = λ( u × v ).
(4) −

u × (−

v +−

w) = −

u ×−

v +−

u ×−

w.
146 MATEM ÁTICAS

2.8.2. Área de un paralelogramo

−→ −→
Consideremos el paralelogramo formado por los puntos A, B, C, D ∈ R3 , de forma que AB y DC son paralelos y
−→ −→ −→
representantes del mismo vector libre u , y análogamente BC y AD son paralelos y representan al mismo vector
libre −

v . En estas condiciones no es demasiado complicado demostrar (ver bibliografı́a recomendada) que el área
del paralelogramo viene expresada por |− →
u ×− →v |.

A C

α
0 B

Figura 5.2: El producto vectorial de los vectores OA y OB permite obtener el área del paralelogramo OBCA.

2.8.3. Expresión del producto vectorial en coordenadas cartesianas

Dados los vectores −→


u ,−
→v ∈ V3 , con coordenadas en la base canónica − →
u = (u1 , u2 , u3 ) y −

v = (v1 , v2 , v3 ) ,

→ −

las coordenadas en esa misma base del vector u × v vienen expresadas por el desarrollo formal del siguiente
determinante, en donde −
e→ −
→ − →
1 , e2 , e3 representan a los vectores de la base canónica de V3 :

e→1

e→
2

e→
3  

→ −
→ u2 u 3 u1 u3 u1 u2

u × v = u1 u2 u3 = ,− ,
v v2 v3 v1 v3 v1 v2
1 v2 v3

Ejemplo. Si −

u = (2, −1, 3) y −

v = (1, 3, 5), entonces −

u ×−

v = (−14, −7, 7). 2
Sean −

u ,−

v ,−

w ∈ V3 , definimos el producto mixto como la siguiente expresión:

[−

u ,−

v ,−

w] = −

u .(−

v ×−

w)

Dados los vectores −


→u ,− →
v y− w ∈ V3 , con coordenadas en la base canónica −
→ →
u = (u1 , u2 , u3 ), −

v = (v1 , v2 , v3 )


y w = (w1 , w2 , w3 ) el valor del producto mixto de los tres vectores viene expresado por:

u1 u2 u3


u .(−
→v ×− →
w ) = v1 v2 v3
w w w
1 2 3

2.8.4. Propiedades del producto mixto

Si −

u ,−

v y−

w son tres vectores de V3 y λ ∈ R, se tiene:

(1) [−

u ,−

v ,−

w ] = [−

w,−

u ,−

v ] = [−

v ,−

w,−

u ] = −[−

u ,−

w,−

v ] = −[−

w,−

v ,−

u ].
ÁLGEBRA LINEAL Y GEOMETR ÍA 147

−→
(2) λ[−

u ,−

v ,−

w ] = [λ−

u ,−

v ,−

w ] = [−

u , λ−

v ,−

w ] = [−

u ,−

v , λw].
→+−
(3) [−
u 1
→, −
u → − → −→ − → − → −→ − → − →
2 v , w ] = [ u1 , v , w ] + [ u2 , v , w ] , cumpliéndose también la propiedad distributiva para las
otras dos variables.

(4) [−

u ,−

v ,−

w ] = 0 si y sólo si los vectores −

u ,−

v y−

w son linealmente independientes.

2.8.5. Volumen de un paralepı́pedo

Tres vectores de V3 linealmente independientes −→


u ,−

v y− →
w determinan un paralepı́pedo de vértices O, A, B,
−→ −→ −→ −→
C, D, E, F , G, de forma que OA, CF , ED y CF son vectores que representen a la clase del vector libre − →u.
−→ −→ −→ −−→ −→ −→ −→ −→ −→ −

Análogamente OC, AF , GD, BE para v y OB, AG, F D, CE para w . En estas condiciones se puede probar
que [−
→u ,−

v ,−
→w ] determina el volumen del mencionado paralepı́pedo.

0 A

Figura 5.3: El producto mixto de OA, OB y OC permite hallar el volumen del paralelepı́pedo que determinan.

2.9. Cónicas en R2 y cuádricas en R3

Un doble cono recto es la figura que genera una recta r al girar alrededor de otra recta s que la corta. La recta s se
denomina eje del cono, y las distintas posiciones de r generatrices del cono. El punto de intersección del eje con
las generatrices se denomina vértice del cono (ver Figura 5.4).

Toda figura que se obtiene como intersección de un doble cono recto y un plano se denomina cónica.

Según las distintas posiciones del plano las cónicas se llaman de forma diferente:

• Si el plano es perpendicular al eje del cono y no pasa por el vértice, obtenemos una circunferencia. Si el
plano pasa por el vértice se obtiene un punto.

• Si el plano no es perpendicular al eje del cono y forman entre ellos un ángulo superior al que forman el eje
del cono con cualquiera de las generatrices, obtenemos una elipse. Si el plano pasa por el vértice se obtiene
un punto (ver Figura 5.5).

• Si el plano es paralelo a alguna de las generatrices obtenemos una parábola, excepto cuando el plano pasa
por el vértice que en cuyo caso se obtiene una recta (ver Figura 5.6).
148 MATEM ÁTICAS

Figura 5.4: Doble cono cuyo vértice está situado en el origen de coordenadas.

• Cuando el ángulo que forman el plano y el eje es inferior al que forma el eje y las generatrices, obtenemos
una hipérbola, excepto cuando el plano pasa por el vértice que obtendremos dos rectas que se cortan (ver
Figura 5.7).

Los casos excepcionales que aparecen descritos con anterioridad se llaman cónicas degeneradas.

2.9.1. Ecuación general de una cónica

Una ecuación de la forma


Ax2 + By 2 + Cxy + Dx + Ey + F = 0

donde A, B, C, D, E, F ∈ R se denomina ecuación general de una cónica.

Todas las secciones cónicas anteriormente descritas verifican formas particulares de esta ecuación. Recı́procamente
la ecuación describe, salvo algunos casos particulares, sólo secciones cónicas.

Si la escribimos en la forma a11 x2 + 2a12 xy + a22 y 2 + 2a1 x + 2a2 y + a0 = 0 tiene la ventaja de poder encontrar
fácilmente la siguiente forma matricial de la ecuación:
  
 a11 a12 a1 x
x y 1  a12 a22 a2   y  = 0
a1 a2 a0 1
ÁLGEBRA LINEAL Y GEOMETR ÍA 149

Figura 5.5: Una elipse como intersección de un cono y un plano.

Figura 5.6: Una parábola como intersección de un cono y un plano.

La matriz  
a11 a12 a1
 a12 a22 a2 
a1 a2 a0
se denomina matriz asociada a la cónica.

Ejemplo. La ecuación 2x2 + 2y 2 − 4x + 6y + 3 = 0 expresada en forma matricial como


  
 2 0 −2 x
x y 1  0 2 3   y  = 0,
−2 3 3 1

representa una circunferencia de centro C(1, − 23 ) y radio R = 2
7
2
150 MATEM ÁTICAS

Figura 5.7: Una hipérbola como intersección de un cono y un plano.

2.9.2. Cuádricas en R3

Por rotación en torno a un eje de las secciones cónicas circunferencia, elipse, parábola e hipérbola se obtienen
superficies de revolución en R3 , llamadas respectivamente superficie esférica, elipsoide, paraboloide e hiperbo-
loide.

Eligiendo de forma adecuada los ejes coordenados las ecuaciones de las mencionadas superficies satisfacen ecua-
ciones bastante sencillas:

Esfera: x2 + y 2 + z 2 = R2 .
x2 y2 z2
Elipsoide: 2
+ 2 + 2 = 1.
a b c

Figura 5.8: Un elipsoide en R 3 .

Paraboloide: x2 + y 2 = a2 z.
x2 y2 z2
Hiperboloide de una hoja: + − = 1.
a2 b2 c2
ÁLGEBRA LINEAL Y GEOMETR ÍA 151

Figura 5.9: Un paraboloide en R 3 .

Sin embargo la situación cambia considerablemente si se somete la superficie a un movimiento (traslación, giro,...)
y aparecen ecuaciones más complicadas en sus expresiones. La forma general de todas estas ecuaciones es la
siguiente:
Ax2 + By 2 + Cz 2 + Dxy + Exz + F yz + Gx + Hy + Iz + K = 0,
donde A, B, C, D, E, F, G, H, I, K ∈ R.

Análogamente a como hacı́amos con las cónicas se puede plantear la cuestión de identificar las figuras geométricas
que describe una ecuación como la anterior. Las llamaremos superficies cuádricas.

Si expresamos la ecuación general de las cuádricas de la siguiente forma:

a11 x2 + 2a12 xy + a22 y 2 + 2a13 xz + 2a23 yz + a33 z 2 + 2a1 x + 2a2 y + 2a3 z + a0 = 0

tenemos la ventaja de poder traducirla fácilmente a forma matricial:


    
 a11 a12 a13 x  x
x y z  a12 a22 a23   y  + 2 a1 a2 a3  y  + a0 = 0
a13 a23 a33 z z

Ejemplo. La ecuación 7x2 + 6y 2 + 5z 2 − 4xy − 4yz + 14x − 8y + 10z + 6 = 0, que en forma matricial se expresa
como     
 7 −2 0 x  x
x y z  −2 6 −2   y  + 2 7 −4 5  y  + 6 = 0
0 −2 5 z z
mediante un giro y una traslación convenientes se puede convertir en la ecuación del elipsoide de revolución
x2 y2 z2
+ + = 1.
1 2 2/3
2
152 MATEM ÁTICAS

Figura 5.10: Hiperboloides de una hoja y de dos hojas.

2.10. Coordenadas polares, cilı́ndricas y esféricas

2.10.1. Coordenadas polares

Un punto P de R2 queda totalmente determinado por la distancia de dicho punto al origen de coordenadas O,
que notaremos por ρ y el ángulo ϕ que forma la recta OP con el eje OX (contado en el sentido positivo). Al par
ordenado de números (ρ, ϕ) se le llaman coordenadas polares del punto P .

y ρ

0 x

Figura 5.11: Sistema de coordenadas polares en el plano.


ÁLGEBRA LINEAL Y GEOMETR ÍA 153

2.10.2. Relación entre coordenadas polares y cartesianas rectangulares

Sean (x, y) las coordenadas rectangulares y (ρ, ϕ) las coordenadas polares. Entonces las relaciones entre ellas son
las siguientes:

x = ρ cos ϕ
y = ρ sen ϕ

y despejando ρ y ϕ se tiene
p
ρ = x2 + y 2
y
tan ϕ =
x

2.10.3. Coordenadas cilı́ndricas

0
Consideramos el punto P (x, y, z) de R3 y P (x, y, 0) su proyección ortogonal sobre el plano XY . En dicho plano
0
el punto P está totalmente determinado por sus coordenadas polares (ρ, ϕ), en consecuencia el punto P estará
ahora totalmente determinado por (ρ, ϕ) y por el valor de la coordenada z. A la terna de números reales (ρ, ϕ, z),
se le llama coordenadas cilı́ndricas de P .

z
∂z

r ∂ϕ

z ∂r

0 y
ρ
ϕ

P0

Figura 5.12: Sistema de coordenadas cilı́ndricas en el espacio.

Las relaciones entre coordenadas cilı́ndricas y cartesianas rectangulares son las ya conocidas para las coordenadas
polares en el plano.

Ejemplo. Consideremos la superficie dada por su ecuación en coordenadas cilı́ndricas r2 + z 2 = c2 , donde c


es una constante. La transformación a coordenadas rectangulares es x2 + y 2 + z 2 = c2 , que como sabemos
representa a una esfera. 2
154 MATEM ÁTICAS

2.10.4. Coordenadas esféricas

Consideremos P un punto de R3 que no esté situado en el eje OZ. P está totalmente deteminado por la longitud
ρ de OP, el ángulo ϕ que forma el plano determinado por OZ y P con el plano OXZ y el ángulo θ que forma la
recta OP con el eje OZ. La terna de números ( ρ, ϕ, θ ) se llaman coordenadas esféricas de P respecto al sistema
de referencia polar formado por el polo O, el plano polar OXZ y el eje polar OZ. Obsérvese que ρ puede tomar
todos los valores reales positivos, ϕ ∈ [0, 2π) y θ ∈ (0, π).
z

0 y

Figura 5.13: Sistema de coordenadas esféricas en el espacio.

2.10.5. Relación entre coordenadas esféricas y cartesianas rectangulares

Si consideramos el punto P (x, y, z) , se tienen las siguientes igualdades:

x = ρ sen θ cos ϕ
y = ρ sen θ sen ϕ
z = ρ cos θ

Y despejando de estas expresiones las coordenadas esféricas en función de las cartesianas obtenemos:
p
ρ = x2 + y 2 + z 2
y
tan ϕ =
x
p
x2 + y 2
tan θ =
z

Ejemplo. Consideremos la superficie de ecuación en coordenadas polares sen θ(cos ϕ − 3 sen ϕ) + cos θ = 0.
Dividiendo por cos θ y usando las anteriores relaciones obtendremos
p !
x2 + y 2 x y
p − 3p +1=0
z x2 + y 2 x2 + y 2

y simplificando se tiene finalmente x − 3y + z = 0 que como sabemos expresa la ecuación de un plano que pasa
por el origen de coordenadas. 2
ÁLGEBRA LINEAL Y GEOMETR ÍA 155

2.11. Aplicaciones lineales

Sean V y W espacios vectoriales sobre el cuerpo K. Una aplicación f : V → W se dice lineal si cumple las
siguientes propiedades:

(1) f (−

u +− →
v ) = f (−

u ) + f (−

v ) para todo −

u ,−

v ∈V
(2) f (λ−
→u ) = λf (−

u ) para todo −

u ∈ V y para todo λ ∈ K.

Cuando f es una aplicación lineal biyectiva diremos que es un isomorfismo. Si es inyectiva le llamaremos mono-
morfismo y si es sobreyectiva diremos que es un epimorfismo.

Ejemplo. Si consideramos la matriz A ∈ Mm×n (R) la aplicación f : Rm → Rn definida por


 
x1
 x2 
f ((x1 , x2 , ..., xn )) = A  
 ... 
xn
es lineal. Habitualmente se le denomina aplicación lineal asociada a la matriz A. 2
Observación. Consideremos la aplicación lineal f : V → W , se verifica:

→ −→
(1) f ( 0 ) = 0 .
(2) f (−−→u ) = −f (−

u ) para todo −

u ∈V.

2.11.1. Núcleo e imagen de una aplicación lineal

Consideremos la aplicación lineal f : V → W , denominaremos núcleo de f al conjunto de vectores de V cuya


−→
imagen por f es el vector 0 de W . Es decir,
n →o

Ker f = −→
u ∈ V | f (−

u)= 0

Denominaremos imágen de f al siguiente conjunto:


Im f = { f (−

u )| −

u ∈V}
Se verifican las siguientes propiedades:

(1) Ker f es un subespacio de V y análogamente Im f es un subespacio de W .


(2) Si −
v→ −
→ −
→ −→ −→ −→
1 , v2 , ..., vn es una base de V , se tiene que f ( v1 ), f ( v2 ), ..., f ( vn ) es un sistema de generadores de
Im f.
(3) dim(Ker f ) + dim(Im f ) = dim V


(4) La aplicación lineal f es monomorfismo si y sólo si Ker f = { 0 }

2.11.2. Matriz asociada a una aplicación lineal

De manera análoga a como vimos que dada una matriz A ∈ Mm×n (R) surgı́a una aplicación lineal asociada
f : Rm → Rn , podemos pensar recı́procamente si dada una aplicación lineal existe una matriz asociada. Puesto
156 MATEM ÁTICAS

que todo espacio vectorial posee una base, un aplicación lineal f : V → W estará unı́vocamente determinada
por las imágenes de los elementos de la base. En el caso en que tratemos con espacios vectoriales de dimen-
sión finita, se puede dar una importante relación entre las aplicaciones lineales y las matrices. Supongamos que
dim V = m y dim W = n , considerando bases de los respectivos espacios vectoriales formadas por los vectores
BV = {− v→ −
→ −

1n, v2 , ..., vn } ⊂ V y BW o = {−→, −
w → −→
1 w2 , ..., wm } ⊂ W . Consideremos la expresión en la base BW de los
−→ −
vectores f (v1 ), f ( v→ −

2 ), ..., f (vn ) , es decir,

f (−
v→ −→ −→
1 ) = α11 w1 + α21 w2 + · · · + αm1 wm
−→
f (−
v→ −→ −→
2 ) = α12 w1 + α22 w2 + · · · + αm2 wm
−→
... ............................................
−→
f (vm ) = α1m − w→+α −
1

2m w2 + · · · + αmm wm
−→

Estas igualdades las podemos escribir en notación más abreviada como

X
m
f (−
v→
j) = αij −
→,
w i j = 1, 2, ..., n.
i=1

Después de esto diremos que la matriz


 
α11 α12 .... α1n
 α21 α22 .... α2n 
A=
 ....

..... .... .... 
αm1 αm2 .... αmn

es la matriz de f con respecto a las bases BV y BW .

Ejemplo. (1) Consideremos la aplicación f : R2 → R3 dada por f (−



u ) = (x + y, 2(x + y), 3x − y) para cualquier

→ 2
u = (x, y) ∈ R . Puedes comprobar fácilmente que la matriz asociada a f con respecto a las bases canónicas
serı́a  
1 1
A= 2 2 
3 −1
(2) Una rotación Rα (rotación de ángulo α en el plano alrededor del origen en sentido positivo) es una aplicación
lineal Rα : R2 → R2 , que tiene como matriz asociada
 
cos α − sen α
.
sen α cos α
2
Parece claro que la expresión de la matriz asociada a una aplicación lineal cambia si cambiamos las bases que
prefijamos en los dos espacios vectoriales. Pero ¿sabrı́amos encontrar una relación entre dos matrices asociadas
a una misma aplicación lineal, aunque referidas a bases distintas?

Te introduciremos en esta cuestión con un ejemplo. Supongamos que una aplicación lineal f : R2 → R2 tiene
asociada en la base canónica la matriz  
6 −2
A=
6 −1
→ = (1, 2), −
y queremos encontrar la expresión de la matriz asociada a f en la base −
u 1
→ = (2, 3). La matriz cambio
u 2
de base (ver bibliografı́a recomendada) viene expresada por
 
1 2
C= .
2 3
ÁLGEBRA LINEAL Y GEOMETR ÍA 157

Esto te recordamos que quiere decir que considerados como vectores columna, por ejemplo el vector −

v = t (2, 5)
expresado en la base canónica, tiene como coordenadas en la nueva base, el resultado de efectuar
 −1       
1 2 2 −3 2 2 4
= = .
2 3 5 2 −1 5 −1

→, −
De esta forma la matriz de la aplicación lineal f expresada en la base {−
u →
1 u2 } vendrı́a dada por

 −1     
0 1 2 6 −2 1 2 2 0
A = = .
2 3 6 −1 2 3 0 3

Intenta razonar por qué (consulta la bibliografı́a recomendada).

3. ACTIVIDADES DE APLICACIÓN DE LOS CONOCIMIENTOS

A.5.1. Utilizar el método de Gauss en los siguientes sistemas:


  
 2x + y − 4z = 14  −x − y − z = 2  3x + 2y − 5z + 6t = 4
−x + 5y − z = 1 −5x + 5y − z = 1 2x + y + 3z − t = 2
  
2x − 4y − z = 13 2x − 4y + 5z = 13 x − 3y + 2z + 5t = 0

A.5.2. Considerar las siguientes matrices:


       
1 2 3 1 −1 2 1 −2 3 3 0 2
A= ,B = ,C = ,D =
4 5 6 0 3 −5 4 5 −6 −7 1 8

y calcular A + B; C + D ; 3A − 5B ; 2C − 3D .

A.5.3. Calcular AB y BA (cuando sea posible) siendo A y B las siguientes matrices:


   
1 3 2 0 −4
(a) A = yB=
2 −1 3 −2 6
 
2 −1  
  1 −2 −5
(b) A = 1 0 yB=
3 4 0
−3 4
 
  2 −1 0 6
2 3 −1
(c) A = yB= 1 3 −5 1 
4 −2 5
4 1 −2 2

A.5.4. Resolver la siguiente ecuación matricial (X − A)B = C, donde B es una matriz invertible.
   
x y 1 1
A.5.5. Encontrar todas las matrices M de la forma M = que conmutan con la matriz A = .
x t 0 1

A.5.6. Determinar las matrices A y B, tales que


  
 2 −3

 3A − 2B =
4 1
 

 6 2
 2A + 7B =
4 5
158 MATEM ÁTICAS

A.5.7. Para completar la idea del método que sugerimos en el texto para calcular la matriz inversa sin usar deter-
minantes, responder a las siguientes cuestiones:
(a) Explicar las razones en las que se basa el método descrito anteriormente para calcular la matriz inversa.
(b) Aplı́carlo en el cálculo de matrices inversas de órdenes superiores a dos. Por ejemplo demostrar que
 −1  2 
1 3 −2 3 − 16 − 12
 −5 0 1  = 7 1
− 32 
3 6
10 1
1 4 −3 3 6 − 52

A.5.8. Determinar usando determinantes si las siguientes matrices son invertibles y calcular su inversa en el caso
de que exista:
   
  1 2 −4 1 3 −4
3 5
A= , B =  −1 −1 5 , C= 1 5 −1  .
2 3
2 7 −3 3 13 −6

A.5.9. Calcular An para las siguientes matrices:


   
  a 0 0 0 a b
a 2
A= , A= 0 b 0 , A= 0 0 a 
0 a
0 0 c 0 0 0

A.5.10. A continuación
 se propone
 completar el siguiente cuadro hasta obtener el determinante de una matriz
a11 a12
2 × 2, A = .
a21 a22

Permutaciones No de inversiones Producto


12
21

A.5.11. Demostrar usando la Regla de Sarrus que



1 2 3 4
1 4 1
0 2 2 3
2 0 5 = −178 y = 24
0 0 −6 −4
−5
2 9 0 0 0 −2

A.5.12. Calcular los determinantes propuestos en el ejercicio anterior, pero desarrollando esta vez por los elemen-
tos de sus filas o columnas.
A.5.13. Responder a las siguientes cuestiones:
(a) ¿Cómo se puede calcular el determinante de una matriz triangular superior? ¿Y de una inferior?
(b) Si A es una matriz con det(A) = 5 ¿Cuanto vale det(A−1 )? (Indicación: AA−1 = In , aplicar después
la propiedad (8) de los determinantes).
A.5.14. Calcular los siguientes determinantes:

5 4 2 1
1 x x2 t+3 −1 1
2 5 1 −2
1 y y2 5 t−3 1
−5 −7 −3 9
1 z z2 −6 t + 4
6 1 −2 −1 4

A.5.15. Consideremos los vectores de R3 , −


→ = (1, 1, 1), −
u 1
→ = (1, 2, 3) y −
u2
→ = (2, −1, 1). Escribir el vector
u3


u = (1, −2, 5) como combinación lineal de los anteriores.
ÁLGEBRA LINEAL Y GEOMETR ÍA 159

A.5.16. Determinar si los vectores −


→ = (1, 1, 1), −
u1
→ = (2, −1, 3), −
u2
→ = (1, −5, 3) son linealmente dependientes
u3
o independientes.
−→
A.5.17. Demostrar que cualquier conjunto de vectores que contenga el vector 0 es linealmente dependiente.
A.5.18. Determinar si los siguientes vectores son linealmente independientes y en caso de no serlo expresar uno
de ellos como combinación lineal de los otros:
→ = (1, 0, 1), −
(a) −
u1
→ = (1, 2, 3), −
u 2
→ = (3, 2, 5).
u 3
→ = (1, 0, 1), −
(b) −
u 1
→ = (1, 1, 1), −
u2
→ = (0, 1, 1).
u3

A.5.19. Determinar a y b para que los siguientes vectores sean linealmente dependientes:
→ = (3, −2, −1, 3), −

u → = (1, 0, 2, 4), −
u → = (1, −3, a, b)
u
1 2 3

A.5.20. Estudiar para qué valores de los parámetros a y b son compatibles los siguientes sistemas y resolverlos
cuando sea posible:
  
 x + 2y + 2z = 2  ax − y + z = 2x  ax + y + z = 1
2x − y + 3z = 2 x + 2ay − az = y x + ay + z = b
  
5x − y + az = 6 x + ay − z = 0 x + y + az = b2

A.5.21. Determinar si son o no diagonalizables cada una de las siguientes matrices, y en el caso en que lo sean
calcular la potencia n-ésima:
 
4 2
(a)
3 −1
 
5 1
(b) ,
−4 1
 
2 −5
(c) ,
1 −2
 
2 4
(d) ,
3 1
 
4 1 −1
(e)  2 5 −2 ,
1 1 2
 
−3 1 −1
(f)  −7 5 −1 ,
−6 −6 −2
 
1 2 3
(g)  0 2 3 .
0 0 3
A.5.22. Estudiar la posibilidad de diagonalizar la matriz
 
a −1 1
 0 1 3 
0 2 2
según los distintos valores del parámetro a.
A.5.23. Determinar los valores de xn e yn , para todo n > 0, sabiendo que
xn+1 = 2xn + 4yn
yn+1 = 3xn + yn
y que x0 = 1 e y0 = 2.
160 MATEM ÁTICAS

A.5.24. Calcular la forma de Jordan de las matrices


   
−1 2 −3 0 1 −1
A= 0 1 −1  y B= 1 0 1 
1 −1 2 1 −1 2

indicando la matriz P de cambio de base.

A.5.25. Estudiar si la matriz


 
0 1 0
A= 1 0 0 
0 0 2

es diagonalizable.

A.5.26. Dada la matriz


 
a 1 1
A= 1 a 1 
1 1 a

estudiar para que valores de a es diagonalizable.

A.5.27. Resolver los siguientes sistemas de ecuaciones diferenciales:



2(D − 2)y1 + (D − 1)y2 = ex
(a)
(D + 3)y1 + y2 = 0

 (D + 6)y1 + 3y2 − 14y3 = 0
(b) −4y1 + (D − 3)y2 + 8y3 = 0

2y1 + y2 + (D − 5)y3 = sen t

A.5.28. Demostrar que el producto definido en V3 por − →


u .−→v = (u1 − u2 )(v1 − v2 ) + u2 v2 + a3 b3 , −

u =
−→ −

(u1 , u2 , u3 ) y v = (v1 , v2 , v3 ) es un producto escalar. ¿Cuánto vale k u k con este producto?

A.5.29. Sabiendo que ABCD es un cuadrado, con A(2, 0, 2), B(1, 1, 0) y C(0, y, z), hallar las coordenadas
que faltan en C.
0 0 0 0 0
A.5.30. Sea ABCDA B C D un paralepı́pedo. Sabiendo que A(0, 1, 1), B(−2, 1, 0), C(1, 1, 3) y A (2, 0, 1),
hallar los vértices restantes y el volumen del mencionado paralepı́pedo.

A.5.31. ¿Qué tipo de cónica representan las siguientes ecuaciones?

x2 + y 2 − 4x + 2y − 4 = 0; 4x2 + 9y 2 − 8x + 36y − 104 = 0.

A.5.32. ¿Qué tipo de cuádrica representan las siguientes ecuaciones?

x2 + y 2 + z 2 − 2x − 4y − 2z + 2 = 0; 4x2 + y 2 + 4z 2 − 8x − 8y − 8z + 11 = 0.

A.5.33. Consideremos la aplicación f : R3 → R3 dada por las expresiones referidas a coordenadas en la base
canónica f (x, y, z) = (x + y, z, y − z) . Se pide:
(a) Demostrar que es una aplicación lineal y encontrar la matriz asociada en la base canónica.
(b) ¿Cuál es la expresión de la matriz asociada en la base formada por los vectores −→ = (1, 0, 1), −
u1
→=
u2


(0, 1, 1), u = (1, 0, 0)?
3
ÁLGEBRA LINEAL Y GEOMETR ÍA 161

4. ACTIVIDADES PRÁCTICAS DEL CAPÍTULO

4.1. Introducción

La práctica se va a realizar con el programa de cálculo matemático DERIVE for Windows, versión 4.05, de Soft
Warehouse. DERIVE for Windows permite realizar cálculos y manipulaciones matemáticas de carácter general,
lo cual significa que realiza muchas cosas de forma aceptable aunque no tiene la potencia de otros programas
especı́ficos. No obstante, DERIVE for Windows permite realizar todos los cálculos que un usuario medio puede
necesitar.

Antes de comenzar la práctica será conveniente que recordemos brevemente la ‘botonera’ de DERIVE for Win-
dows (ver Figura 5.14), ya que simplifica enormemente la introducción de datos y la realización de cálculos. Los
botones permiten realizar las siguientes tareas (de izquierda a derecha): New (abrir una nueva hoja de trabajo),
Open (abrir una hoja de trabajo existente), Save (guardar la sesión de trabajo), Print (imprimir la sesión de tra-
bajo), Remove (eliminar la expresión marcada), Unremove (recuperar la última expresión eliminada), Renumber
(renumerar las expresiones), Author expression (introducir una expresión sencilla), Author vector (introdu-
cir un vector), Author matrix (introducir una matriz), Simplify (simplificar), Approximate (calcular un valor
aproximado), Solve (resolver algebraicamente o numéricamente una expresión), Substitute for variables
(realizar una sustitución), Calculate limit (calcular un lı́mite), Calculate derivative (calcular una deriva-
da), Calculate integral (calcular una integral), Calculate sum (calcular una suma), Calculate product
(calcular un producto), 2D-plot window (realizar un gráfico bidimensional) y 3D-plot window (realizar un
gráfico tridimensional).

Figura 5.14: El uso de la ‘botonera’ de DERIVE for Windows nos puede simplificar mucho el trabajo. Otro elemento
interesante es la existencia de ‘teclas calientes’ que nos permiten evitar los menús, con lo que se gana
en rapidez.

En esta práctica vamos a manipular vectores y matrices de cualquier orden, resolver sistemas de ecuaciones linea-
les, operar matrices (cálculo de la matriz inversa, suma, producto) y calcular los valores y vectores propios de una
matriz. Por tanto, debemos saber en primer lugar cómo introducir estos datos en el programa. Aunque algunas
aplicaciones funcionan sin cargar ningún paquete adicional, es conveniente que para esta práctica se cargue la
utilidad VECTOR.MTH mediante las opciones File|Load|Utility.

4.2. Introducción de vectores y matrices

Para introducir un vector en DERIVE for Windows tenemos dos formas: particular y general. La forma par-
ticular se obtiene seleccionando las opciones Author|Vector y nos aparece la ventana de la Figura 5.15, de-
mandándonos la dimensión del vector. Una vez introducida dicha dimensión (por ejemplo, 4) nos aparece una
nueva ventana (ver Figura 5.16) para que vayamos introduciendo los elementos del vector.

La forma general consiste en seleccionar las opciones Author|Expression e introducir un vector en la forma
[x1,x2,...,xn], donde xi son los diferentes elementos del vector. Por ejemplo, el vector (2, 1, −3) se introdu-
cirı́a como [2,1,-3]; debemos notar que los vectores deben estar delimitados por los corchetes [] y no por los
paréntesis () o las llaves {}.

Análogamente, podemos introducir una matriz de dos formas distintas. La forma particular consiste en seleccionar
las opciones Author|Matrix y nos aparece la ventana de la Figura 5.17 donde debemos indicar el número de
162 MATEM ÁTICAS

Figura 5.15: Ventana para introducir la dimensión de un vector.

Figura 5.16: Ventana para introducir los elementos de un vector.

filas (Rows) y de columnas (Columns). A continuación debemos completar los elementos de la matriz (ver Figura
5.18).

Figura 5.17: Ventana para introducir las dimensiones de una matriz.

La forma general consiste, como antes, en seleccionar las opciones Author|Expression e introducir la matriz
en la forma [f1,f2,...,fm], donde cada fi es una fila de la matriz. Por ejemplo, la matriz de orden 3 × 3
siguiente
 
1 2 3
 1 4 9 
1 8 27

se introducirı́a como sigue: [[1,2,3], [1,4,9], [1,8,27]]. Notemos que los delimitadores de las matrices
son también los corchetes y no los paréntesis ni las llaves.
ÁLGEBRA LINEAL Y GEOMETR ÍA 163

Figura 5.18: Ventana para introducir los elementos de una matriz.

Ejercicio. Introducir los siguientes vectores y matrices:


 
2 −1 −3
(−1, x , a) (3/5, 0.15, x − y)
4 −x

4.3. Sistemas de ecuaciones lineales

Como es natural, los elementos de un vector pueden ser cualquier expresión válida en DERIVE for Windows, no
sólo números. Por ejemplo, un sistema de ecuaciones lineales es un vector cuyos elementos son ecuaciones; ası́,
el sistema de ecuaciones lineales
3x + 2y = 5
4x + 3y = 2
se introducirı́a ası́: [3x+2y=5, 4x+3y=2]. Una vez introducido el sistema podemos resolverlo de dos formas
distintas: directamente o a través de menús. En el primer caso debemos introducir la expresión Solve(#1,[x,y])
(suponiendo que el sistema es la lı́nea número 1) y nos aparecerá la solución: [x=11 y=-14]. En el segundo caso,
debemos seleccionar el botón Solve de la botonera y nos aparecerá la ventana de la Figura 5.19; ahora basta pulsar
el botón Simplify .

Cuando necesitemos utilizar un vector o una matriz en varias expresiones, lo conveniente es almacenarla en una
variable. Por ejemplo, podemos escribir v:=[1,2,3] o a:=[[1,2],[3,4]].

Ejercicio. Resolver los siguientes sistemas de ecuaciones lineales:



  3x + 4y − 2z = 5
2x + 3y = 12
4x − 3y + 9z = −3
4x − 7y = −3 
5x − 4y + 2z = 1

4.4. Operaciones básicas con vectores y matrices

Con DERIVE for Windows podemos sumar, restar y multiplicar matrices, siempre que las dimensiones sean
apropiadas. Pero con DERIVE for Windows podemos realizar otro tipo de productos: el producto escalar y el
producto vectorial de dos vectores. La sintaxis de estas operaciones figura en la siguiente tabla:
164 MATEM ÁTICAS

Figura 5.19: Ventana para resolver un sistema de ecuaciones lineales.

Operación Sintaxis
Suma de a y b a + b
Resta de a y b a - b
Producto de a y b a . b
Producto de a por un escalar t t*a ó ta
Producto escalar de v y w v . w
Producto vectorial de v y w CROSS(v,w)
a y b son vectores o matrices con las dimensiones apropiadas.

Observemos que para no confundir el punto decimal ‘.’ con el punto de las operaciones producto anteriores,
debemos dejar un espacio en blanco antes y después del punto; ası́, no es válido indicar el producto de a y b
como a.b ó a. b ó a .b. En relación con el producto vectorial debemos hacer una precisión: si los vectores
son tridimensionales, entonces CROSS(v,w) devuelve el producto vectorial de v y w, pero si los vectores son de
dimensión dos entonces CROSS(v,w) devuelve el determinante de v y w.

Ejercicio. Calcular las siguientes operaciones:


• (1, 2, 3) + (2, 4, 6), (2, 4, 8) − (4, 9, 13)
• El producto escalar de (5(−1, 3, 5) + 2(3, 2, 1)) y (−1, −3, −5).
• El producto vectorial de (3, 8, −1) y (3, 1, 10).

4.5. Funciones de manipulación

Para manipular los elementos de un vector o matriz, DERIVE for Windows dispone de numerosas funciones,
todas ellas con una sintaxis muy intuitiva. A continuación listamos las más importantes.

IDENTITY MATRIX(n): Construye la matriz identidad de orden n.


DIMENSION(a): Determina el número de elementos o el número de filas de a, según a sea un vector o una matriz.
Por ejemplo, DIMENSION([x,y,z]) es 3.
ÁLGEBRA LINEAL Y GEOMETR ÍA 165

SUB: Es un sufijo que permite extraer un elemento de un vector o una fila de una matriz. Por ejemplo, [a,b,c]
SUB 2 aparece en pantalla como [a,b,c]2 y se simplifica a b. Sin embargo [[1,2],[3,4]] SUB 1
permite extraer la primera fila de la matriz, es decir, [1,2], por lo que [[1,2],[3,4]] SUB 1 SUB 2
identifica al segundo elemento de la primera fila, es decir, 2.
ELEMENT(v,n): Extrae el elemento n-ésimo del vector v.
ELEMENT(a,m,n): Extrae el elemento (m, n) (fila m y columna n) de la matriz a.
APPEND(v1,v2,...,vn): Concatena dos o más vectores. Por ejemplo, APPEND([3,1],[2,4]) produce como
resultado el vector [3,1,2,4]. Si a es una matriz, entonces APPEND(a) produce un vector cuyos elementos
son todos los elementos de la matriz.
DELETE ELEMENT(v,n): Elimina el elemento n-ésimo del vector v. Si v es una matriz, entonces se borra la fila
n-ésima.
INSERT ELEMENT(u,v,n): Agrega el elemento u al vector v antes del elemento n-ésimo. Por ejemplo,
INSERT ELEMENT(d,[a,b,c],2)
da lugar al vector [a,d,b,c]. Si se omite n, entonces el elemento se coloca al principio del vector, y si el
valor de n es uno más que la dimensión del vector, el nuevo elemento se colocará al final del vector.
REPLACE ELEMENT(u,v,n): Reemplaza el n-ésimo elemento del vector v por la expresión u. Por ejemplo,
REPLACE ELEMENT(d,[a,b,c],2)
da lugar al vector [a,d,c]. Si se omite n, entonces el elemento reemplazado será el primero.
REVERSE VECTOR(v): Construye un nuevo vector cambiando de orden los elementos del vector v. Ası́,
REVERSE VECTOR([1,2,3,4])
produce el vector [4,3,2,1].
SELECT(u,k,v): Produce un nuevo vector con los elementos k del vector v tales que u(k) es cierto. Por ejemplo,
SELECT(PRIME(k),k,[1,2,3,4,5,6]) produce el vector [1,2,3,5] formado por los números primos
que hay en el vector original.
SELECT(u,k,m,n,s): Permite seleccionar los elementos k de la sucesión que empieza en m, acaba en n y está
construida con un paso s tales que u(k) es cierta. Por defecto s = 1, de forma que
SELECT(PRIME(k),k,1,100)
da lugar a un vector cuyos elementos son los números primos entre 1 y 100.

Ejercicio. Generar todos los números pares entre 1 y 100 y todos los números impares entre 100 y 200. (En este
ejercicio debe utilizarse la función FLOOR(n), que genera la parte entera del número n).

4.6. Operaciones con matrices

Las operaciones tı́picas con matrices están disponibles en DERIVE for Windows. La sintaxis que debe utilizarse
aparece en la siguiente tabla:

Operación Sintaxis
Matriz inversa de m m ∧ −1
Matriz traspuesta de m m‘
Matriz adjunta de m ADJOINT(m)
Traza de la matriz m TRACE(m)
Determinante de la matriz m DET(m)
Producto de las matrices m y n m . n
Exponenciación de m: mk m∧k
166 MATEM ÁTICAS

Ejercicio. Se consideran las siguentes matrices:


   
1 2 3 1 2 3
a =  −1 2 −3  b= 5 7 11 
3 5 7 13 17 19

Calcular a−1 , at + b, (a + bt )−1 , (a10 − b−5 )3 , det(a2 + b2 ).

Ejercicio. Resolver la siguiente ecuación:



x 2 3

1 2 3 = 0.

4 4 6

4.7. Cálculo de los valores y vectores propios

Aunque no es estrictamente necesario, es conveniente calcular el polinomio caracterı́stico, ya que sus raı́ces son
los valores propios. Para ello disponemos de la función

CHARPOLY(a,t)

que desarrolla el polinomio caracterı́stico de la matriz a en términos de la variable t. Por ejemplo, CHARPOLY([[2,
3], [a, b]], t) produce t2 − (b + 2)t − 3a + 2b.

Para el cálculo de los valores propios disponemos de la función

EIGENVALUES(a,t)

que determina los valores propios de la matriz a en términos de la variable t.

Cómo es muy frecuente que los polinomios de grado superior a cuatro no se puedan factorizar por métodos
racionales, y la factorización de polinomios de grado cuatro es de una complejidad enorme, la función anterior
sólo es útil para matrices de orden 2 × 2 o 3 × 3. En consecuencia, suele ser habitual calcular primero el polinomio
caracterı́stico y posteriormente utilizar métodos aproximados para determinar sus raı́ces (es decir, los valores
propios de la matriz).

Una vez determinados los valores propios de una matriz A, disponemos de dos funciones para calcular los vectores
propios asociados:

EXACT EIGENVECTOR(A,µ): Se utiliza cuando µ es un valor propio exacto de la matriz A. Cuando µ es una
aproximación a un valor propio, entonces la matriz A − µI no es singular, por lo que esta función devolverı́a
el vector cero como solución.

APPROX EIGENVECTOR(A,µ): Aproxima a un vector propio numérico de A cuyo valor propio asociado es apro-
ximado por µ y el resultado es un vector de norma uno. Naturalmente, µ no debe ser un valor propio
exacto. Para mayor generalidad, podemos multiplicar el resultado por un parámetro, por ejemplo @1. Los
parámetros en DERIVE for Windows se indican por @1, @2, @3, .... Por ejemplo, un resultado como
[@1,3@2,-5@1] es lo que usualmente se escribe como [s,3t,-5s].
ÁLGEBRA LINEAL Y GEOMETR ÍA 167

Ejercicio. Hallar el polinomio caracterı́stico, los valores propios y los vectores propios asociados de la siguiente
matriz:  
−2 1 1 1 1
 1 −3 −1 0 −1 
 
 
 1 −1 1 0 −3 
 
 1 0 0 3 0 
1 −1 −3 0 2

4.8. Bibliografı́a

C. Paulogorrón y C. Pérez. Cálculo matemático con DERIVE para PC, Ed. RA-MA, 1a Ed., 1994.

5. BIBLIOGRAFÍA DEL CAPÍTULO

J. HEINHOLD y B. RIEDMULLER Algebra Lineal y Geometrı́a Analı́tica, Ed. Reverté SA, 1981. Capı́tulos 1
y 2.

R.E. LARSON, R.P. HOSTETLER y B.H. EDWARDS Calculo y Geometrı́a Analı́tica, 5a ed., McGraw-Hill, Ma-
drid, 1995. Capı́tulos 11, 13 y 14.

J.L. MALAINA y otros Lecciones Básicas de Algebra Lineal, Universidad del Pais Vasco, 1995. Capı́tulos 1–6,
9, 11 y 12.

J. STEWART Cálculo, 2a ed. Grupo Editorial Iberoamérica, México, 1994. Capı́tulo 11.

J.R. TORREGROSA y C.JORDAN Algebra Lineal y sus Aplicaciones, serie Schaum, McGraw Hill, Madrid,
1987. Capı́tulos 1 y 2.

6. PREGUNTAS DE EVALUACIÓN

E.5.1. Discutir el siguiente sistema de ecuaciones según los valores de a y b:

ax + by + z = 1
x + aby + z = b
x + by + az = 1

E.5.2. Hallar la inversa de la siguiente matriz siempre que sea posible:


 
x 1 0 0
 0 x 1 0 
A= 
 0 0 x 1 
0 0 0 x

E.5.3. Encontrar la dimensión y una base del subespacio vectorial generado por los vectores −
→ = (1, 0, 0, −1),
u1

→ −→ −
→ −

u2 = (2, 1, 1, 0), u3 = (1, 1, 1, 1), u4 = (1, 2, 3, 4) y u5 = (0, 1, 2, 3). Determinar las ecuaciones
cartesianas de este subespacio.
168 MATEM ÁTICAS

E.5.4. Decidir cuáles de las siguientes matrices pueden reducirse a una matriz diagonal y encontrar matrices Pi
que hagan posible la diagonalización (P −1 Ai P = Di ):
 
−1 3 1
(a) A1 =  −3 5 −1 ,
−3 3 1
 
4 −1 −1
(b) A2 =  1 2 −1 ,
1 −1 2
 
0 0 0 1
 0 0 1 0 
(c) A3 = 
 0 1 0 0 .

1 0 0 0
E.5.5. Calcular la forma de Jordan de  
0 1 0
A= 1 0 0 
0 0 2
y utilizarla para determinar A7 .
E.5.6. Hallar las ecuaciones que describen los subespacios Ker f e Im f donde f : R3 → R3 es la aplicación
lineal definida por f (x, y, z) = (x + 2y + z, −x + 2y, 2y + z).
E.5.7. ¿Qué tipo de cónica es la que viene dada por la ecuación 9x2 − 18x + 4y 2 − 24y + 9 = 0? ¿Qué tipo de
cuádrica es la que viene dada por la ecuación 4x2 + 2y 2 + z 2 − 8x − 12y − 4z + 22 = 0?
ÁLGEBRA LINEAL Y GEOMETR ÍA 169

ANOTACIONES

....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
CAPÍTULO 6
CÁLCULO DIFERENCIAL EN VARIAS VARIABLES

1. INTERROGANTES CENTRALES DEL CAPÍTULO

• Calcular derivadas parciales de orden superior de • Saber interpretar y hallar las expresiones de los
funciones de varias variables. vectores que forman el triedro de Frenet.
• Entender la significación geométrica de los con-
• Calcular las ecuaciones de los planos osculador,
ceptos derivada direccional y gradiente.
normal y rectificante a una curva.
• Calcular extremos relativos y condicionados de
funciones de varias variables en casos sencillos. • Entender el concepto de superficie parametrizada
regular.
• Entender el concepto de curva parametrizada re-
gular.
• Calcular e interpretar gráficamente los coeficien-
• Saber calcular e interpretar las magnitudes curva- tes de la primera y de la segunda forma funda-
tura y torsión de una curva. mental, ası́ como la curvatura de Gauss.

2. CONTENIDOS FUNDAMENTALES DEL CAPÍTULO

2.1. Funciones vectoriales de una variable

Consideremos la base canónica para los vectores de R3 formada por




i = (1, 0, 0),


j = (0, 1, 0),


k = (0, 0, 1).

Una función definida por



→ −
→ −
→ −

F (t) = x(t) i + y(t) j + z(t) k = (x(t), y(t), z(t))

donde x(t), y(t) y z(t) son funciones reales de variable real t, se dice que es una función vectorial en t.

Se puede generalizar el concepto de lı́mite de funciones reales de variable real a las funciones vectoriales de una
variable, sin más que consideremos


lim F (t) = ( lim x(t), lim y(t), lim z(t)).
x→a x→a x→a x→a
C ÁLCULO DIFERENCIAL EN VARIAS VARIABLES 171

Esto también nos lleva a extender otros conceptos, como el de derivada.



→ −
→ −→ −

Una función vectorial F (t) = x(t) i + y(t) j + z(t) k es derivable en x = a si y sólo si cada una de sus
funciones componentes es derivable en t = a. En estas condiciones se tiene

→0 0 0 0
F (a) = (x (a), y (a), z (a)).



Ejemplo. Sea F (t) = (sen2 t, ln t, arctan(3t)), entonces

→0  
1 3
F (t) = 2 sen t cos t, , ,
t 1 + 9t2

expresión válida para todos los números reales menos el cero. 2



→ −
→ −
→ −

Sea F (t) = x(t) i + y(t) j + z(t) k una función diferenciable de t, y t = g(s) una función diferenciable de


s, entonces la función compuesta F (g(s)) es una función diferenciable de s y se tiene

→ − →0
dF 0
= F (g(s))g (s).
ds



Ejemplo. Sea F (t) = (1, sen(t + 1), et+1 ) y t = g(s) = s2 − 1. En este caso se tiene

→ −→  
dF d F dt  2
= = 0, cos(t + 1), et+1 .2s = 0, 2s cos s2 , 2ses .
ds dt ds
Esta expresión también la habrı́amos podido haber obtenido sustituyendo t = s2 − 1 y derivando respecto de s. 2

2.2. Derivadas de los productos de vectores

Por aplicación directa de las propiedades de funciones reales de variable real, podemos deducir que la derivada
de la suma de dos funciones vectoriales es la suma de las derivadas. No es difı́cil deducir de igual forma (ver
bibliografı́a recomendada) el comportamiento de la derivada para las otras operaciones que se pueden realizar con

→ −

los vectores de R3 , el producto escalar y el producto vectorial. Si F (t) y G (t) son funciones derivables, se
tiene:

−→ − → 0 → −
− →0 −→0 −

• ( F (t). G (t)) = F (t).G (t) + F (t). G (t) (Observa que en virtud de la simetrı́a del producto escalar
no existe ningún problema en cambiar el orden de las funciones vectoriales que se ven afectadas en los
productos)
−→ −→ 0 −
→ −
→0 −
→0 −

• ( F (t) × G (t)) = F (t) × G (t) + F (t) × G (t) (Observa que en esta ocasión es fundamental el orden
de las funciones en los productos vectoriales)


→ −
→ −→ − → 0
Ejemplo. Dadas las funciones F (t) = (3t2 + 1, sen t, 0) y G (t) = (cos t, 0, et ) vamos a calcular ( F (t). G (t))
−→ −
→ 0
y ( F (t) × G (t)) . Veamos:

−→ − → 0 → −
− →0 −
→0 −

( F (t). G (t)) = F (t).G (t) + F (t). G (t)
= (3t2 + 1, sen t, 0).(− sen t, 0, et ) + (6t, cos t, 0).(cos t, 0, et )
= −(3t2 + 1) sen t + 6t cos t
172 MATEM ÁTICAS

−→ −
→ 0 −
→ −
→0 −
→0 −

( F (t) × G (t)) = F (t) × G (t) + F (t) × G (t)
− → → −
− → − → −
→ −


i j k i j k
2
= 3t + 1 sen t 0 + 6t cos t 0

− sen t 0 et cos t 0 et
= ((sen t + cos t)et , −(3t2 + 6t + 1)et , sen2 t − cos2 t).

2
Comprobar que estos resultados coinciden con los que se obtienen realizando antes los productos (escalar o
vectorial) y después derivando el resultado.

2.3. Funciones de varias variables

En muchas ocasiones los valores de las funciones que aparecen sometidas a estudio están determinados por valores
que dependen de más de una variable.

Supongamos D una colección de n-uplas de números reales. Una función f con dominio D es una regla que asigna
a cada (x1 , x2 , ..., xn ) ∈ D un número z = f (x1 , x2 , ..., xn ). El rango de la función es el conjunto de valores
que toma z. A z se le denomina variable dependiente y a x1 , x2 , ..., xn se les llama variables independientes.
p 
Ejemplo. El dominio de la función f (x, y) = y − x2 es D = (x, y) ∈ R2 y > x2 y el rango viene dado por
Rango(f ) = [0, +∞). 2

2.3.1. Lı́mites y continuidad

Primero veamos el caso para funciones de dos variables. El lı́mite de f (x, y) cuando (x, y) → (x0 , y0 ) es el
número real L si para cada ε > 0 existe un δ > 0 tal que para todos los puntos (x, y) sucede una de las dos
siguientes situaciones equivalentes:

p
• 0< (x − x0 )2 + (y − y0 )2 < δ =⇒ |f (x, y) − L| < ε

• 0 < |x − x0 | < δ y 0 < |y − y0 | < δ =⇒ |f (x, y) − L| < ε

2.3.1.1. Propiedades de los lı́mites

Si los lı́mites
lim f (x, y) y lim g(x, y)
(x,y)→(x0 ,y0 ) (x,y)→(x0 ,y0 )

existen y son finitos, entonces se verifican las siguientes propiedades:

(1) lim (f (x, y) + g(x, y)) = lim f (x, y)+ lim g(x, y)
(x,y)→(x0 ,y0 ) (x,y)→(x0 ,y0 ) (x,y)→(x0 ,y0 )

(2) lim (f (x, y).g(x, y)) = lim f (x, y). lim g(x, y)
(x,y)→(x0 ,y0 ) (x,y)→(x0 ,y0 ) (x,y)→(x0 ,y0 )
C ÁLCULO DIFERENCIAL EN VARIAS VARIABLES 173

(3) lim (λf (x, y)) = λ lim f (x, y) para todo λ ∈ R


(x,y)→(x0 ,y0 ) (x,y)→(x0 ,y0 )

lim f (x, y)
f (x, y) (x,y)→(x0 ,y0 )
(4) lim = siempre que lim g(x, y) 6= 0
(x,y)→(x0 ,y0 ) g(x, y) lim g(x, y) (x,y)→(x0 ,y0 )
(x,y)→(x0 ,y0 )

Observación. El lı́mite de una función puede no existir. Al igual que cuando asegurábamos la existencia de los
lı́mites de funciones de una variable real decı́amos que debı́an coincidir los lı́mites laterales (las dos aproxima-
ciones posibles al punto al que se tendı́a en la recta real), en nuestro caso al movernos en R2 aseguramos con
la existencia del lı́mite la coincidencia de los lı́mites sobre cualquiera de las infinitas aproximaciones al punto
(x0 , y0 ) que pudiéramos tomar en el plano. Lo que dicho de otra forma quiere decir que si encontramos dos o
más aproximaciones al punto (x0 , y0 ) que obtengan valores distintos para el lı́mite, estarı́amos demostrando que
el lı́mite lim f (x, y) no existe.
(x,y)→(x0 ,y0 )

Ejemplo. Podemos demostrar que el lı́mite


x2 y
lim
(x,y)→(0,0) x4 + y2
no existe calculando las aproximaciones de f (x, y) sobre la recta y = x y sobre la parábola y = x2 .
x2 x x
lim = lim = lim = 0.
(x,y)→(0,0) x4 + x2 (x,y)→(0,0) x2 + 1
(x, y) → (0, 0)
sobre y = x

Por otra parte


x2 x2 1
lim = lim = .
(x,y)→(0,0) x4 + x4 2
(x, y) → (0, 0)
sobre y = x2

Luego efectivamente el lı́mite lim x2 y


4
(x,y)→(0,0) x +y
2 no existe. 2

Una función f (x, y) se dice que es continua en el punto (x0 , y0 ) si:

(1) f está definida en (x0 , y0 ).


(2) lim f (x, y) existe.
(x,y)→(x0 ,y0 )

(3) lim f (x, y) = f (x0 , y0 ).


(x,y)→(x0 ,y0 )

Es una consecuencia de las propiedades de los lı́mites que la suma, producto y cociente de funciones continuas es
otra función continua y esto también sucede para la composición de funciones.

Ejemplo. La función ( xy
si (x, y) 6= (0, 0)
f (x, y) = x2 + y2
0 si (x, y) = (0, 0)
2
es continua en cualquier punto de R excepto en (0, 0). Puedes comprobar que no es continua en (0, 0) aproxi-
mándote por caminos diferentes al origen (0, 0) (las recta y = mx para diferentes valores de m) y observar que
dan lı́mites distintos. 2
Observación. Todos los conceptos y propiedades introducidos anteriormente para funciones de dos variables,
son fácilmente extensibles a un número de variables genérico n. Basta tener en cuenta la definición de lı́mite de
174 MATEM ÁTICAS

f (x1 , ..., xn ) cuando (x1 , ..., xn ) → (a1 , ..., an ) como el número real L cumpliendo que para cada ε > 0 existe
un δ > 0 tal que para todos los puntos (x1 , ..., xn ) :
p
0 < (x1 − a1 )2 + · · · + (xn − an )2 < δ =⇒ |f (x1 , x2 , ..., xn ) − L| < ε

2.3.2. Derivadas parciales de primer orden

Consideremos z = f (x, y) una función real de dos variables reales. Denominaremos derivada parcial de f
respecto de x en el punto (a, b) a la derivada en x = a de la función de una variable f (x, b). Es decir,

f (a + h, b) − f (a, b) f (x, b) − f (a, b)


lim = lim
h→0 h x→a x−a

denotándose por fx (a, b),f1 (a, b), zx (a, b), ∂f


∂x (a, b) o
∂z
∂x (a, b).

Análogamente definimos la derivada parcial de f respecto de y,

f (a, b + h) − f (a, b) f (a, y) − f (a, b)


lim =lim
h→0 h y→b y−b

denotándose por fy (a, b),f2 (a, b), zy (a, b), ∂f


∂y (a, b) o
∂z
∂y (a, b).

(1) Como ocurre con las funciones reales de variable real, las derivadas parciales de z = f (x, y) respecto de x
y respecto de y se pueden calcular para diversos puntos (x, y), dando lugar por tanto a dos nuevas funciones
de dos variables reales.
(2) Por las definiciones introducidas anteriormente resulta inmediato que las reglas de derivación establecidas
para funciones reales de una variable real serán aplicables a las derivadas parciales de funciones de dos
variables.

2
Ejemplo. Si consideramos la función f (x, y) = x2 y 3 + ex y se puede comprobar fácilmente que

∂f 2
(x, y) = 2xy 3 + 2xex y,
∂x
∂f 2
(x, y) = 3x2 y 2 + ex .
∂y
2

2.3.3. Interpretación geométrica

Sea z = f (x, y) y consideremos fx (a, b), fy (a, b). La superficie z = f (x, y) la cortamos por el plano Π : x = a
y obtenemos una curva γ cuya ecuación referida a los ejes O 0 Y 0 y O 0 Z 0 es z = f (a, y) (donde O 0 es el nuevo
origen con coordenadas (a, 0, 0) y O 0 Y 0 ,O 0 Z 0 son ejes paralelos respectivamente a OY y OZ pasando por O 0 ).

La recta tangente a la curva γ en el punto P (a, b, c), donde c = f (a, b), está contenida en el plano x = a y tiene
por ecuación
z − c = fy (a, b)(y − b)
C ÁLCULO DIFERENCIAL EN VARIAS VARIABLES 175

Figura 6.1: Interpretación geométrica de la derivada parcial.

respecto a los ejes O 0 Y 0 y O 0 Z 0 y referida al espacio es la recta determinada por intersección de los planos x = a
y z − f (a, b) = fy (a, b)(y − b).

Análogamente la tangente a la curva



y=b
z = f (x, y)

en el punto (a, b, f (a, b)) es la recta



y=b
∂x (a, b)(x − a).
z − f (a, b) = ∂f

El plano de ecuación
∂f ∂f
z − f (a, b) = (a, b)(x − a) + (a, b)(y − b)
∂x ∂y
contiene a las rectas tangentes anteriores. Cada recta tangente a una curva de la superficie se dice tangente a
la superficie. El plano que contiene a toda las rectas tangentes a la superficie en un punto se denomina plano
tangente a la superficie en ese punto. En el caso de que exista, el plano tangente en el punto P (a, b, f (a, b))
viene determinado por la ecuación anterior.
p
Ejemplo. Dada la función f (x, y) = 3 − x2 − y 2 la ecuación del plano tangente a la superficie que determina
(una esfera) en el punto P (1, 1, 1) vendrı́a expresada por z − 1 = fx (1, 1)(x − 1) + fy (1, 1)(y − 1). Simplificando
obtenemos z = −x − y + 3. 2

2.3.4. Regla de la cadena para funciones de varias variables

¿Qué sucede cuando intentamos derivar la composición de funciones de varias variables? La variedad de casos a
los que podemos enfrentarnos puede ser amplia y es conveniente que tratemos el problema de forma gradual.

Si z = f (x, y) tiene derivadas parciales continuas fx y fy y si x = x(t), y = y(t) son funciones derivables en t,
entonces la función compuesta z = f (x(t), y(t)) es derivable como función de t y cumple

df ∂f dx ∂f dy
= + .
dt ∂x dt ∂x dt
176 MATEM ÁTICAS

Ejemplo. Sea f (x, y) = xy , con x = cos t e y = sen t. En estas condiciones se obtiene aplicando la regla de la
cadena
df ∂f dx ∂f dy
= + = (sen t)(− sen t) + (cos t)(cos t) = cos2 t − sen2 t = cos 2t.
dt ∂x dt ∂x dt
Puedes obtener también este resultado sustituyendo x e y y derivando la expresión resultante respecto de t. 2
(1) Sea w = f (x, y, z) una función de tres variables con derivadas parciales continuas, y además x = x(t),
y = y(t), z = z(t) son funciones derivables en t. ¿Cuál serı́a de la regla de la cadena para dfdt ? ¿Y si
tuvieramos una función de cuatro variables? Generaliza el resultado a n variables.
(2) Aplicar las conclusiones anteriores para calcular dw
dt si w = xy + z con x = cos t , y = sen t y z = t. (La
curva sobre la que calculamos la derivada es una hélice).

Supongamos ahora que tenemos la siguiente situación:

• w = f (x, y, z) función de tres variables con derivadas parciales continuas.


• x = x(u, v), y = y(u, v), z = z(u, v) funciones de dos variables con derivadas parciales continuas.

En estas condiciones obtenemos


∂f ∂f ∂x ∂f ∂y ∂f ∂z
= + +
∂u ∂x ∂u ∂y ∂u ∂z ∂u
∂f ∂f ∂x ∂f ∂y ∂f ∂z
= + +
∂v ∂x ∂v ∂y ∂v ∂z ∂v

Ejemplo. Sea f (x, y, z) = x + 2y + z 2 y


 u
 x = v
y = u2 + ev

z = 2u
Aplicando la regla de la cadena obtenemos
∂f 1 ∂f u
= + 12v, = − 2 + 2eu .
∂u u ∂v v
2
Las mismas condiciones de derivabilidad y continuidad expuestas anteriormente para los distintos casos, se pueden
expresar de forma genérica como sigue:

Consideremos z = f (x1 , x2 , ..., xn ) una función de n variables con todas sus derivadas parciales continuas y
consideremos a su vez
x1 = ϕ1 (u1 , u2 , ..., um ),
x2 = ϕ2 (u1 , u2 , ..., um ),
.. .
. = ..
xn = ϕn (u1 , u2 , ..., um )
funciones de m variables con todas sus derivadas parciales también continuas. En estas condiciones podemos
expresar:
∂f ∂f ∂x ∂f ∂x2 ∂f ∂xn
= + + ... +
∂u1 ∂x1 ∂u1 ∂x2 ∂u1 ∂xn ∂u1
.. .
. = ..
∂f ∂f ∂x ∂f ∂x2 ∂f ∂xn
= + + ... +
∂um ∂x1 ∂um ∂x2 ∂um ∂xn ∂um
C ÁLCULO DIFERENCIAL EN VARIAS VARIABLES 177

2.3.5. Derivación de funciones implı́citas

Sea y = f (x) una función continua definida implı́citamente por la ecuación F (x, y) = 0, donde F , Fx y Fy son
funciones continuas, además con Fy (x, y) 6= 0. Entonces se cumple que
∂F
dy
= − ∂F
∂x
.
dx ∂y

Puedes intentar deducir este resultado derivando respecto de x (aplicando la regla de la cadena) en la ecuación
F (x, y) = 0.

La expresión de derivación de una función implı́cita se puede hacer extensiva para un número mayor de variables,
razonando de forma similar.

Ejemplo. Vamos a calcular la derivada en los puntos que correspondan al valor x = 1 de la función definida por
la ecuación y 3 − 3xy + 2x3 = 0. Si sustituimos x = 1 en la ecuación, obtenemos que los puntos para los que hay
que evaluar la derivada son (1, 1) y (1, −2). Para aplicar el resultado anterior basta con calcular Fx = −3y + 6x2
y Fy = 3y 2 − 3x. Particularizando en los puntos que sometemos a estudio obtenemos Fx (1, 1) = 3, Fy (1, 1) = 0,
Fx (1, −2) = 12, Fy (1, −2) = 9. De aquı́ deducimos que dx dy
(1, 1) no se puede hallar y por otro lado se tiene

∂x (1, −2)
∂F
dy 4
(1, −2) = − ∂F =−
dx ∂y (1, −2) 3

2
Ejemplo. Supongamos que la superficie dada por la ecuación F (x, y, z) = 0 define implı́citamente a la función
z = f (x, y). La ecuación del plano tangente a la mencionada superficie en el punto (a, b, c) vendrı́a expresado
por
∂f ∂f
z−c= (a, b)(x − a) + (a, b)(y − b).
∂x ∂y
Ahora bien, aplicando la regla de derivación para funciones implı́citas se tiene:

∂F ∂F
dz dz ∂y
= − ∂F
∂x
, = − ∂F
dx ∂z
dy ∂z

Sustituyendo en la ecuación del plano tangente y simplificando (quitando los denominadores Fz ) obtenemos
finalmente
∂F ∂F ∂F
(a, b, c)(x − a) + (a, b, c)(y − b) + (a, b, c)(z − c) = 0.
∂x ∂y ∂z
Expresión de la ecuación del plano tangente a una superficie que no hace referencia explı́cita de la función que la
define. 2

2.3.6. Gradientes y derivadas direccionales

Sea la superficie z = f (x, y) y supongamos que las derivadas parciales fx y fy son continuas.

Consideremos el plano Π que pasa por los puntos (a, b, 0) y (x, y, 0) y es perpendicular al plano z = 0. Este plano
tiene de ecuación y − b = tan θ(x − a) o bien, en forma paramétrica

x = a + t cos θ
Π:
y = b + t sen θ
178 MATEM ÁTICAS

Este plano corta a la superficie según una curva γ de ecuación



 z = f (x, y)
γ: x = a + t cos θ

y = b + t sen θ

Es decir, z = f (a + t cos θ, b + t sen θ). Consideremos en el plano Π el nuevo sistema de ejes coordenados
O 0 T 0 Z 0 , donde O 0 (a, b, 0), O 0 T 0 es la intersección de plano Π con el plano z = 0, y el eje O 0 Z 0 es paralelo
al eje OZ pasando por el punto O 0 . En el plano Π, podemos estudiar la pendiente de la recta tangente a γ e el
punto P (a, b, c) respecto del eje O 0 T 0 , que coincide con la derivada respecto de t, es decir, aplicando la regla de
la cadena se tiene:
dz ∂f dx ∂f dy ∂f ∂f
= + = (a, b) cos θ + (a, b) sen θ
dt ∂x dt ∂y dt ∂x ∂y
La recta que pasa por el punto P (a, b, c) y tiene esta pendiente es la recta tangente a γ en el punto P . Esta recta
tangente tiene por ecuaciones paramétricas respecto a OXY Z:

x = a + t cos θ
y = b + t sen θ
z = c + ( ∂f
∂x (a, b) cos θ +
∂f
∂y (a, b) sen θ)t

y está contenida en el plano tangente a la superficie en el punto P (a, b, c) de ecuación

∂f ∂f
z−c= (a, b)(x − a) + (a, b)(y − b).
∂x ∂y

A la expresión fx (a, b) cos θ + fy (a, b) sen θ se le llama derivada direccional de f (x, y) en (a, b) según la

→ −
→ −

dirección θ y se denota por fθ o por D−→u f donde u = cos θ i + sen θ j .

La derivada de f (x, y) en (a, b) según la dirección θ, es la pendiente de la recta tangente a la curva resultante de
la intersección de la superficie z = f (x, y) con el plano de ecuación y − b = tan θ(x − a) . A veces también se
dice de la derivada direccional que es el ritmo al que cambia f (x, y) cuando nos movemos desde el punto (a, b)
en la dirección que forma un ángulo θ con el eje OX.

Es importante que observes lo que sucede cuando θ = 0 y θ = π2 . Aplica la definición y comprueba que en estos
casos las mencionadas derivadas direccionales coinciden con las derivadas parciales.

Ejemplo. Vamos a calcular la derivada de f (x, y) = x2 y 3 en el punto (1, 2) en la dirección determinada por el
ángulo π/3. Para ello calcularemos primero las derivadas parciales fx = 2xy 3 fy = 3x2 y 2 . Particularizándolas
√ nos piden se tiene fx (1, 2) = 16 y fy (1, 2)√= 12. Habida cuenta que cos(π/3) = 1/2 y
en el punto que
sen(π/3) = 3/2, obtenemos finalmente D− →u f (1, 2) = 8 + 6 3. 2
La expresión
∂f ∂f
D−

u f (a, b) = (a, b) cos θ + (a, b) sen θ
∂x ∂y
se puede ver como el resultado del producto escalar de los vectores


→ −
→ −
→ ∂f −
→ ∂f −

u = cos θ i + sen θ j y (a, b) i + (a, b) j .
∂x ∂y

A este último vector se le denomina gradiente de f en (a, b) denotándose por ∇f (a, b).

→ −

En definitiva, si z = f (x, y) tiene derivadas parciales continuas fx , fy y −

u = cos θ i + sen θ j entonces se
cumple


D− u f = ∇f. u .


→ −

Por definición del producto escalar de dos vectores, tenemos D− →u f = ∇f. u = |∇f | . | u | cos α donde α es el

→ −→
ángulo que forman los vectores∇f y u . Pero | u | = 1 y de aquı́ deducimos D− → f = |∇f | . cos α , esto nos
u
C ÁLCULO DIFERENCIAL EN VARIAS VARIABLES 179

u f coincide con |∇f | y además la dirección del


lleva a deducir que el valor máximo de la derivada direccional D−

vector gradiente es la que indica la mayor derivada direccional.

Ejemplo. Dada la función f (x, y) = x2 y 3 ¿cuál es la mayor derivada direccional en (2, 3) y en que dirección
se obtiene esta derivada direccional máxima? La respuesta a esta pregunta la tiene el vector gradiente. Puedes

→ −

comprobar que ∇f (2, 3) = 108 i + 108 j y por tanto el valor de la máxima derivada direccional es |∇f | =
√ −

108 2 y este valor se alcanza para la dirección que marca el gradiente, que serı́a en este caso −

u = cos(π/4) i +
−→
sen(π/4) j . 2
Ejemplo. Una interpretación igualmente gráfica como curiosa del significado del gradiente lo da el siguiente
ejemplo. Supongamos una montaña sobre el plano XY . La altitud de la superficie sobre el punto (x, y) la
denotaremos por z = f (x, y). La derivada direccional indica el ritmo al cual cambia la altitud por unidad de
cambio en distancia horizontal. El gradiente ∇f (a, b) apunta a la dirección que un montañero deberı́a seguir si
desea escalar en la dirección de mayor pendiente. El módulo |∇f | indica la mayor pendiente disponible. 2

2.3.7. Derivadas parciales de orden superior

Sea z = f (x, y), llamaremos derivada parcial segunda (o de segundo orden) de f respecto de x dos veces a la
derivada respecto de x de la derivada parcial primera respecto de x, es decir,
fx (x + h, y) − fx (x, y)
lim
h→0 h
∂ ∂f ∂ z2 ∂2f
denotándose por zxx , fxx , ∂x ( ∂x ), ∂x2 o ∂x2 .

Análogamente llamaremos derivada parcial segunda (o de segundo orden) de f respecto de y dos veces a la
derivada respecto de y de la derivada parcial primera respecto de y:
fy (x, y + h) − fy (x, y)
lim
h→0 h
∂ ∂f ∂2z ∂2f
denotándose por zyy , fyy , ∂y ( ∂y ), ∂y 2 o ∂y 2 .

Se llama derivada segunda de f respecto de y y respecto de x, a la derivada parcial respecto de x de la derivada


∂ ∂f ∂2z ∂2f
parcial de f respecto de y, denotándose por zyx , fyx , ∂y ( ∂y ), ∂x∂y o ∂x∂y .

Ejemplo. Para la función f (x, y) = y cos(xy) se tiene


∂f
= −y 2 sen(xy),
∂x
∂f
= cos(xy) − yx sen(xy),
∂y
∂2f
= −y 3 cos(xy),
∂x2
∂2f
= −2x sen(xy) − yx2 cos(xy),
∂y 2
∂2f ∂2f
= = −2y sen(xy) − xy 2 cos(xy)
∂x∂y ∂y∂x
2
En el ejemplo anterior hemos observado que las derivadas mixtas coinciden, ¿en qué casos esto vuelve a suceder?
La respuesta a esta pregunta la da el Teorema de Schwartz (ver bibliografı́a recomendada) que se enuncia en los
siguientes términos:
180 MATEM ÁTICAS

Sea z = f (x, y) una función tal que existen fx , fy y fxy en un entorno U del punto (a, b) y son continuas en
(a, b), entonces existe fyx (a, b) y además fxy (a, b) = fyx (a, b).

Para la función z = f (x, y) hemos visto las cuatro derivadas segundas fxx , fyx , fxy , fyy , aunque ya sabemos
que bajo las hipótesis del Teorema de Schwartz las derivadas mixtas coinciden. Siguiendo este proceso podemos
definir las derivadas terceras fxxx , fxyx , fxxy , fxyy , fyxx , fyyx , fyxy y fyyy aunque sólo hay 4 distintas bajo las
hipótesis del Teorema de Schwartz. En general existen 2p derivadas de orden p , pero sólo p + 1 son distintas bajo
las hipótesis del mencionado teorema:
∂pf ∂pf ∂pf ∂pf ∂pf
, , , ...., y
∂xp ∂y∂xp−1 ∂y 2 ∂xp−2 ∂y p−1 ∂x ∂y p

2.3.8. Extremos relativos y absolutos

Consideremos f : A ⊂ R2 → R una función de dos variables con valores reales, con dominio de definición en
A, que habitualmente denotamos como z = f (x, y). Consideraremos a continuación el problema de maximizar o
minimizar a la mencionada función en A.

Si existe un punto (x0 , y0 ) ∈ A tal que f (x0 , y0 ) > f (x, y ) para todo (x, y) ∈ A, entonces diremos que f tiene
un máximo absoluto en A.

Análogamente definimos el concepto de mı́nimo absoluto sin más que exigir ahora que f (x0 , y0 ) 6 f (x, y ) para
todos los puntos de A.

No siempre existe un punto en el dominio de la función que cumpla las caracterı́sticas anteriores. De hecho hay
que buscar un cierto tipo de subconjuntos de R2 que aseguran la existencia de máximos y mı́nimos absolutos, son
los llamados conjuntos compactos.

Recordemos primero (ver Capı́tulo 2 y bibliografı́a recomendada) que para funciones reales de una variable real
se define la noción de extremo relativo como un punto x0 del dominio de la función para el que existe un entorno
(puntos suficientemente próximos al valor x0 ) tal que para cualquier punto de ese entorno se cumple la condición
de máximo o mı́nimo absoluto descrita con anterioridad. Es decir hacemos un estudio “local”, entendiendo por
ello las proximidades del punto sometido a estudio.

¿Qué procederı́a hacer ahora para una función de R2 , z = f (x, y)? ¿Cómo se introducen el concepto de entorno
y de proximidad en el plano?

Las respuestas a estas dos cuestiones la hemos estudiado ya al introducir la definición de lı́mite para funciones
2
de varias variables. Debeisp recordar que el concepto de distancia entre dos puntos de R puede definirse como
2 2
d((x0 , y0 ), (x1 , y1 )) = (x1 − x0 ) + (y1 − y0 ) . Ası́ los puntos que distan
2
p menos que δ de un punto (x0 , y0 ) ∈
R , vienen expresado por los puntos (x, y) que satisfagan la inecuación (x − x0 )2 + (y − y0 )2 < δ.

¿Cómo piensas que se representarı́a graficamente esta situación en el plano? ¿Qué es ahora gráficamente un
entorno de (x0 , y0 )?

Pues bien, ahora estamos en condiciones de definir el concepto de máximo relativo (resp. mı́nimo relati-
vo) como un punto (x0 , y0 ) ∈ A tal que exista un δ > 0 verificando que para todo (x, y) ∈ A que cumpla
p
(x − x0 )2 + (y − y0 )2 < δ se tiene f (x0 , y0 ) > f (x, y) (resp. f (x0 , y0 ) 6 f (x, y)).

¿Cómo definirı́as los conceptos de máximo y mı́nimo relativo para una función de tres variables w = f (x, y, z)?

Observa que el concepto ahora depende de la definición de distancia entre dos puntos en R3 , que vendrı́a dado por
p
d((x0 , y0 , z0 ), (x1 , y1 , z1 )) = (x1 − x0 )2 + (y1 − y0 )2 + (z1 − z0 )2 .
C ÁLCULO DIFERENCIAL EN VARIAS VARIABLES 181

¿Cómo se representarı́a con esta distancia un entorno en el espacio R3 de un punto (x0 , y0 , z0 )?

Puedes completar, consultando la bibliografı́a recomendada, la definición de máximo y mı́nimo de una función
w = f (x, y, z).

Para completar el estudio, ¿como piensas que se puede definir una distancia en Rn ? ¿Cómo definirı́as los con-
ceptos de máximo y mı́nimo relativos para una función de n variables w = f (x1 , x2 , ..., xn )?

Condición necesaria para la existencia de extremo: Sea w = f (x1 , x2 , ..., xn ) una función que cumple que
todas sus derivadas parciales son continuas. Si tiene un máximo o un mı́nimo relativo en un punto de su dominio
entonces las n derivadas parciales de f particularizadas en dicho punto deben ser todas iguales a cero.

Esto es, para una función z = f (x, y) se traduce en que si existe un máximo o mı́nimo relativo (extremo relativo)
en (x0 , y0 ) entonces
∂f ∂f
(x0 , y0 ) = 0 y (x0 , y0 ) = 0.
∂x ∂y
Recuerda que en funciones de una variable la condición de derivada nula venı́a a indicar la existencia de recta
tangente paralela al eje OX. Evidentemente la tradución al caso de funciones de dos variables (superficies)
vendrı́a dada por la existencia del plano tangente paralelo al plano XY .

Al igual que ocurrı́a en funciones de una variable, el recı́proco de este resultado no se cumple.

Ejemplo. Consideremos la función f (x, y) = (y − x2 )(y − 2x2 ). Se puede comprobar fácilmente que se cumple
fx (0, 0) = 0 y fy (0, 0) = 0. Ahora bien f (0, 0) = 0, pero la función toma tanto valores positivos como negativos
en cada entorno de (0, 0). ¿Cómo probarı́as esta última afirmación? 2
Dada una función w = f (x1 , x2 , ..., xn ) con derivadas parciales continuas, diremos que un punto de su dominio
es estacionario o crı́tico si todas las derivadas parciales se anulan en él. O lo que es lo mismo si el vector
gradiente es nulo. Más explı́citamente, para una función de dos variables z = f (x, y), se deberı́a cumplir que
−→
∇f (x0 , y0 ) = 0 .

Es importante, al igual que hacı́amos en el estudio local de funciones de una variable, encontrar condiciones
suficientes que nos garanticen la existencia de extremos relativos, identificando en cada caso si son máximos o
mı́nimos.

Sea z = f (x, y) una función con derivadas parciales de segundo orden fxx , fyx = fxy , fyy continuas en un punto
estacionario (x0 , y0 ) ∈ R2 y consideremos el siguiente determinante
2
∂ f (x , y ) ∂2f ∂2f ∂2f ∂2f
∂x2 0 0 ∂y∂x (x0 , y0 )
∆ = ∂2f 2 = (x 0 , y0 ) (x 0 , y0 ) − ( (x0 , y0 ))2 .
(x 0 , y0 ) ∂ f
2 (x 0 , y0 ) ∂x2 ∂y 2 ∂y∂x
∂y∂x ∂y

Entonces se verifica lo siguiente:

(1) Si ∆ > 0 y fxx (x0 , y0 ) > 0, f tiene un mı́nimo relativo en (x0 , y0 ).

(2) Si ∆ > 0 y fxx (x0 , y0 ) < 0, f tiene un máximo relativo en (x0 , y0 ).

(3) Si ∆ < 0, f no tiene ni máximo ni mı́nimo relativo en (x0 , y0 ) (punto de silla, ver Figura 6.2).

Puedes consultar la bibliografı́a recomendada para comprobar que no es demasiado complicado a efectos prácticos,
generalizar este criterio para funciones de n variables, estudiando el signo de una sucesión de determinantes.

Ejemplo. La función f (x, y) = (2x − y + 1)2 + (x − 3y)2 + 1 alcanza un mı́nimo en el punto (− 53 , − 15 ),


conclusión que podemos sacar de igualar las derivadas parciales a cero, obteniendo las ecuaciones 2x − y + 1 = 0
182 MATEM ÁTICAS

Figura 6.2: La superficie de la figure tiene un punto de silla en el origen.

y x − 3y = 0. Después aplicamos el criterio de la condición suficiente que hemos descrito con anterioridad,
obteniéndose que
2
∂ f (− 3 , − 1 ) ∂2f 3 1 10 −10
∂x2 5 5 ∂y∂x (− 5 , − 5 ) = 300 > 0.
∆ = ∂2f ∂2f =
(− 3
, − 1
) 2 (− 3
, − 1
) −10 20
∂y∂x 5 5 ∂y 5 5

2
Ejemplo. Dada la función f (x, y) = (x + 1)2 + 3(y − 23 )2 − 21 9 , puedes comprobar siguiendo un procedimiento
análogo al descrito para el ejemplo anterior, que f tiene un mı́nimo en (−1, 23 ). 2

2.3.9. Extremos condicionados

Hemos visto en el epı́grafe anterior cómo se pueden estudiar los extremos relativos de una función z = f (x, y).
Ahora bien, es posible que la ecuación de la superficie esté dada de manera implı́cita, es decir, se pueda dar por
ejemplo con una ecuación g(x, y, z) = 0, de la cual pueda ser muy complicado en la práctica despejar una variable
en función de las otras dos. Incluso podemos complicar todavı́a más la situación si pedimos estudiar los extremos
en los puntos de una curva en el espacio que se puede dar como intersección de dos superficies, que a su vez
vengan expresadas de forma implı́cita por sendas ecuaciones g1 (x, y, z) = 0 y g2 (x, y, z) = 0.

En el caso de tres variables, el problema se podrı́a exponer de la manera siguiente:

(1) Sea w = f (x, y, z) con derivadas parciales primeras y segundas continuas en un punto (x0 , y0 , z0 ).

(2) Consideremos en la función las siguientes condiciones de ligadura, es decir, condiciones a las que somete-
mos a las variables en la búsqueda de los valores extremos de la función:

g1 (x, y, z) = 0, g2 (x, y, z) = 0, . . . , gm (x, y, z) = 0.

En las mismas condiciones descritas anteriormente, buscamos una condición necesaria para que la función f (x, y, z)
tenga un extremo relativo (máximo o mı́nimo) restringido a las siguientes condiciones de ligadura: g1 (x, y, z) = 0,
g2 (x, y, z) = 0, . . . , gm (x, y, z) = 0. Para ello construimos la función

L(x, y, z) = f (x, y, z) + λ1 g1 (x, y, z) + λ2 g2 (x, y, z) + · · · + λm gm (x, y, z),

en donde los λi (i = 1...n) se consideran constantes (se conocen con el nombre de multiplicadores de Lagran-
ge).
C ÁLCULO DIFERENCIAL EN VARIAS VARIABLES 183

La condición de Lagrange dice que si el punto (x0 , y0 , z0 ) es un máximo o mı́nimo de la función sometida a
las condiciones de ligadura anteriormente expuestas, entonces es satisface el sistema de las m + 3 ecuaciones
siguientes:

∂L
(x, y, z) = 0,
∂x
∂L
(x, y, z) = 0,
∂y
∂L
(x, y, z) = 0,
∂z
g1 (x, y, z) = 0,
g2 (x, y, z) = 0,
.. ..
. = .
gm (x, y, z) = 0.

Observación. (1) Existe un procedimiento para distinguir cuando tenemos máximos o mı́nimos, pero en general
suele ser más útil el uso de procedimientos intuitivos (preferentemente de tipo geométrico) que nos permitan hacer
tales distinciones.
(2) El método explicado anteriormente como ejemplo para funciones de tres variables, tiene una generalización
clara para n. Bastarı́a considerar ahora m + n ecuaciones construidas de forma análoga a las anteriormente
descritas (ver bibliografı́a recomendada)

Ejemplo. Vamos a minimizar la función f (x, y, z) = x2 + y 2 + z 2 sujeta a las condiciones

x + 2y + 3z = 6,
x + 3y + 9z = 9.

Para ello construimos la función L(x, y, z) = x2 + y 2 + z 2 + λ1 (x + 2y + 3z − 6) + λ2 (x + 3y + 9z − 9) y de


aquı́ obtenemos el sistema formado por las siguientes ecuaciones:

∂L
(x, y, z) = 2x + λ1 + λ2 = 0,
∂x
∂L
(x, y, z) = 2y + 2λ1 + 3λ2 = 0,
∂y
∂L
(x, y, z) = 2z + 3λ1 + 9λ2 = 0,
∂z
x + 2y + 3z = 6,
x + 3y + 9z = 9.

Despejamos x, y, z en las tres primeras y sustituimos en las dos últimas obteniendo:

14λ1 + 34λ2 = −12


34λ1 + 91λ2 = −18

y finalmente
240 78
λ1 = − y λ2 = .
59 59
81 123 9
Para estos valores de los multiplicadores de Lagrange obtenemos el punto P ( 59 , 59 , 59 ) 2
Ejemplo. Puedes usar el método de Lagrange para demostrar que entre todos los paralelepı́pedos de volumen
dado, el que tiene superficie mı́nima es precisamente un cubo. 2
184 MATEM ÁTICAS

2.4. Curvas parametrizadas en R3

2.4.1. Parametrización regular. Vectores velocidad y aceleración

−→ −
→ −
→ −→ −

Una función vectorial R (t) = x(t) i + y(t) j + z(t) k definida R : I ⊂ R → R3 , donde I es un intervalo
abierto de la recta real, gráficamente describe una curva en el espacio para los distintos valores del parámetro t.
Esta representación paramétrica diremos que es regular cuando tiene las siguientes propiedades:



(1) R (t) = (x(t), y(t), z(t)) es de clase C 1 (continua y con derivada continua) en el intervalo I.

−→ −→
(2) dR
dt (t) 6= 0 para todo t de I.

Cuando en vez de clase C 1 se exige clase C n (continua y con derivadas sucesivas continuas hasta orden n) se
suele decir que es regular de clase n.

Un ejemplo significativo de una curva parametrizada en el espacio es la llamada hélice circular, cuya parametiza-
ción viene dada por:


R (t) = (a cos θt, a sen θt, bt), con a, b 6= 0, t ∈ R.

Figura 6.3: Hélice circular.

Por semejanza a la interpretación fı́sica que surge del movimiento de una partı́cula en el espacio, representado éste


por la parametrización de una curva R (t) = (x(t), y(t), z(t)), se define el concepto de velocidad como el vector



→v = ddtR .

A su vez también podemos definir a partir de él, otro vector que mida la variación −

v en función del parámetro t.
Lo llamaremos vector aceleración y se define como

−→

→ d−
→v d2 R d2 x −
→ d2 y −
→ d2 z −

a = = 2
= 2 i + 2 j + 2 k.
dt dt dt dt dt
C ÁLCULO DIFERENCIAL EN VARIAS VARIABLES 185

2.4.2. Longitud de arco para curvas en el espacio. El vector unitario tangente



La longitud de arco de una curva R (t) = (x(t), y(t), z(t)) entre los valores del parámetro t = a y t = b viene
dada por la siguiente expresión:
Z b Z bp
L= |−

v | dt = x0 (t)2 + y 0 (t)2 + z 0 (t)2 dt
a a


Si elegimos un punto de referencia en la curva P0 = R (t0 ), y notamos la longitud de arco
Z tp
s(t) = x0 (t)2 + y 0 (t)2 + z 0 (t)2 dt
t0

el teorema fundamental del cálculo integral nos lleva a deducir que


ds p 0 2
= x (t) + y 0 (t)2 + z 0 (t)2 = |−

v |.
dt



Ejemplo. Vamos a calcular la longitud de una vuelta de la hélice R (t) = (cos t, sen t, t). Observemos que la
hélice da una vuelta completa cuando t varı́a de 0 a 2π. Ası́, obtenemos que el cálculo corresponde a
Z 2π p Z 2π √ √
(− sen t)2 + (cos t)2 + 12 dt = 2dt = 2π 2,
0 0

es decir, la longitud de una vuelta de la hélice es 2 veces la del cı́rculo unidad del plano XY en el que la hélice
se proyecta. 2


Si consideramos la curva R (t) = (x(t), y(t), z(t)) representada por una parametrización regular y la longitud de


arco s(t) medida desde un punto de referencia P0 = R (t0 ) y si además dsdt 6= 0 , podemos deducir (derivada de
la función inversa) que
dt 1
= − → .
ds |v|
Esto unido a que

→ −→
dR d R dt dt
= =−

v.
ds dt ds ds
dt
tomando módulos (no se olvide que ds es una magnitud escalar) se obtiene
− −
d→ →
R d R dt 1
= = |−

v| − = 1.
ds dt ds |→v|

→ −
→ −→
Llamaremos a ddsR el vector tangente unitario de la curva y lo denotaremos por T (o por T (s) si queremos
especificar el punto de la curva en el que calculamos el vector tangente, haciendo referencia al parámetro arco).

Cuando la parametrización de la curva no está expresada en función del parámetro longitud de arco, la manera

→ −

v
de calcular T es con la expresión |−

v|
.



Ejemplo. Vamos a calcular el valor del vector T para los puntos de la curva dada por la parametrización


R (t) = (cos t + t sen t, sen t − t cos t, 0).

Para esta curva (que está contenida en el plano XY ) se obtiene




v = (− sen t + t cos t + sen t, cos t + t sen t − cos t, 0)


y de aquı́ |−

v | = t. De esta forma concluimos que T = (cos t, sen t, 0). 2
186 MATEM ÁTICAS

2.4.3. Curvatura y torsión de una curva. El triedro de Frenet

Uno de los grandes problemas que plantea la geometrı́a es determinar y cuantificar los elementos que pueden
llevar a distinguir unas figuras de otras. Este problema se puede resolver para curvas lo suficientemente “suaves”
(es decir, con un número suficiente de derivadas sucesivas continuas). Veremos que una curva regular viene
determinada por únicamente dos magnitudes escalares que llamaremos curvatura y torsión.

→ −→
Supongamos que R = R (s) , donde s es el parámetro arco, es una curva regular de clase mayor o igual que

→ −→ −→ −

2. Consideremos ddsT = R00 (s). Al vector ddsT se denomina vector curvatura de la curva en el punto R (s) y

→ −

κ = ddsT . No es difı́cil demostrar que −
se denota con la expresión −
→ →
κ es un vector ortogonal a T (consecuencia
−→ −
→− →
de que T es un vector unitario y de derivar la expresión T . T = 1). Al módulo del vector curvatura |−

κ (s)| lo
−→
llamaremos curvatura de la curva en R (s) y lo denotaremos por κ(s). Llamaremos radio de curvatura a la
1
expresión ρ(s) = κ(s) .

Figura 6.4: Curvatura de una curva en el espacio.

La interpretación de la curvatura es la del valor del cambio de dirección de la tangente respecto de la longitud de
arco. De esta forma, una curva en la que la dirección de la tangente cambie rápidamente en relación con la longitud
de arco, tiene una curvatura grande y por tanto un radio de curvatura pequeño (piensa en una circunferencia de
radio pequeño).

Ejemplo. ¿Cuál será la curvatura y el radio de curvatura de la circunferencia de radio a dada por la parametrización


R (t) = (a cos t, a sen t, 0)? Veamos:


dR
= (−a(sen t), a(cos t), 0)
dt


y de esta forma ddtR = a. Además se tiene


dR


T = dt
→ = (− sen t, cos t, 0)

ddtR
y por tanto

→ −→ −
dT

dT



→ dT d T dt 1
κ = = = ds
= dt
−→ = − (cos t, sen t).
ds dt ds ds dR a
dt dt
El vector curvatura siempre está dirigido hacia el origen y la curvatura es constante e igual a 1/a, lo que demuestra
que el radio de curvatura coincide precisamente con el radio de la circunferencia. 2
Siempre que la curva venga parametrizada por algún parámetro t que no sea la longitud de arco se tiene


dT


κ = dt
→ .

ddtR
C ÁLCULO DIFERENCIAL EN VARIAS VARIABLES 187

Ejemplo. Puedes comprobar que la curvatura en cada punto de la hélice expresada por la parametrización regular


R (t) = (a cos t, a sen t, bt) con a > 0, b 6= 0 y t ∈ R viene expresada por


dT

→ a
κ = dt
→ = 2
− (− cos t, sen t, 0).
dR a + b2
dt

Observa que el vector −



κ es paralelo al plano XY y está dirigido hacia el origen. La curvatura es constante e igual
a
a a2 +b2 . 2
Propiedades.

• Una curva regular de clase mayor o igual que 2 es una recta si y sólo si su curvatura es idénticamente nula.

→ − →
• Sea R = R (t) una representación arbitraria de una curva de clase mayor o igual que 2, entonces se tiene

→0 −→
R × R00
κ= −
→0 .
R

−→
Siempre y cuando −

κ (s) 6= 0 podremos escoger el vector unitario


→ −

κ (s)
N (s) = −
|→
κ (s)|


que se denomina vector unitario normal principal a la curva en el punto R (s).
−→ −

Observación. A lo largo de una recta −

κ (s) = 0 , luego N no estarı́a determinado.
−→
Dado un punto de la curva representado por R (s), llamaremos recta normal principal a la recta que pasa por


el mencionado punto y tiene como vector director el vector N (s). Llamaremos plano normal al plano que pasa


por el punto R (s) y es perpendicular a la recta tangente a la curva en ese punto. Plano osculador se llama al que

→ −
→ −→
pasa por el punto R (s) y contiene a los vectores N (s) y T (s).
z
C

B
N

x T
B
y

N x



Ejemplo. Dada la hélice R (t) = (cos t, sen t, t), vamos a calcular la ecuación de la normal principal y el plano

→ −

osculador en el punto t = π/2. Como − → −

κ 6= 0 para todo t se tiene que N = |− κ

κ|
= (− cos t, sen t, 0). La
ecuación de la normal principal vendrı́a dada por

 x = 0
y = 1 − λ, λ∈R

z = π2
188 MATEM ÁTICAS

La ecuación del plano osculador saldrı́a de resolver



x y − 1 z − π2

− √1 √1

0 = 0,
2 2
0 −1 0

es decir,
π
x+z =
2
2
−→ −
→ −
→ −
→ −→ −→ −

Consideremos ahora el vector B (s) = T (s) × N (s). Observa que B es continuo y unitario, y que ( T , N , B )
−→
forma una base ortonormal positivamente orientada. B (s) recibe el nombre de vector unitario binormal a la

→ −→ −
→ −

curva en el punto R (s). ( T (s), N (s), B (s)) recibe el nombre de triedro de Frenet o triedro móvil.

Recta binormal

B
Plano normal

Plano rectificante
x N Recta normal

Plano osculador
T

Recta tangente

Figura 6.5: Rectas y planos asociados a una curva en el espacio.


→ −
→ − →
Llamaremos plano rectificante al plano que pasa por el punto R (s) y contiene a los vectores B y T .

→ − →
Observa que el plano normal es el que contiene a los vectores B y N .


Ejemplo. Dada la hélice R (t) = (a cos t, a sen t, bt), puedes comprobar que el plano rectificante a la curva en el
punto correpondiente a t = π2 tiene como ecuación y = a. 2

→ − → −

Consideremos que R = R (s) es una curva regular de clase mayor o igual a 3 y que a lo largo de ella N (s) es de

→ −
→ −

clase C 1 . B (s) = T (s) × N (s), derivando esta expresión obtenemos:

→ −
→ −
→ −
→ −
→ −
→ −

B 0 (s) = T 0 (s) × N (s) + T (s) × N 0 (s)
= T (s) × N 0 (s) (∗)

→0 −
→ −→ → −
− →0
ya que T (s) y N (s) son proporcionales. Se tiene además que N = 1 y por tanto N y N son ortogonales y


por esta razón N 0 serı́a paralelo al plano rectificante y de aquı́

→ −→ −→
N 0 (s) = λ(s) T (s) + τ (s) B (s).

Sustituyendo esta expresión en (∗) y operando (con algunas consideraciones que se dejan al lector) se llega final-
mente a −
→ −

B 0 (s) = −τ (s). N (s) (∗∗)


A la función continua τ (s) se denomina torsión de la curva en R (s).
C ÁLCULO DIFERENCIAL EN VARIAS VARIABLES 189


→ −
→ −→
Si multiplicamos (∗∗) escalarmente por N se obtiene τ (s) = −B 0 (s). N (s), expresión del valor de la torsión en
un punto.


Ejemplo. Dada la hélice R (t) = (a cos t, a sen t, bt), se tiene
 

→ b sen t −b cos t a
B = √ ,√ ,√ .
2
a +b 2 2
a +b 2 a + b2
2

De aquı́ deducimos que



→ −

dB  
dB b cos t b sen t
= −→ =
dt
√ ,√ ,0 .
ds ddtR a2 + b2 a2 + b2


→ −→
Luego τ (s) = −B 0 (s). N (s) = b
a2 +b2 , lo que demuestra que la torsión en esta curva es siempre constante. 2
Propiedades.



• Si una curva es regular de clase mayor o igual que 3 y a lo largo de ella N es de clase C 1 , entonces se
tratará de una curva plana si y sólo si su torsión es idénticamente nula.

→ − → −→
• En un punto de la curva R = R (t) en el que −

κ 6= 0 se tiene
−→ − → −→
det(R0 , R00 , R000 )
τ= − → 2
→0 −
R × R00

• Se verifican las siguientes expresiones (fórmulas de Frenet):


−→
dT −

= κN
ds
−→
dN −→ −→
= −κ T + τ B
ds
−→
dB −

= −τ N
ds

Ejemplo. Se puede demostrar que la curva


 

→ 1 + t 1 − t2
R (t) = t, ,
t t

está contenida en un plano sin más que comprobar que su torsión es 0 en cualquier punto. 2


Ejemplo. Para la curva R (t) = (t − sen t, 1 − cos t, t) el valor de la curvatura y la torsión en el punto t = 0 es
κ(0) = 1 y τ (0) = 1 (Compruébalo). 2

2.5. Superficies parametrizadas en R3

El concepto intuitivo de superficie parametrizada es el de un conjunto de puntos del espacio que es parecido a una


porción de plano en un entorno de cada uno de ellos. Esto sucede cuando existe una aplicación X : U ⊂ R. → R3 ,


definida por X (u, v) = (x(u, v), y(u, v), z(u, v)) que es lo suficientemente regular.
190 MATEM ÁTICAS



Suponemos en principio que X es por lo menos de clase C 1 . Además para asegurarnos de que en todo punto
existe un plano tangente, supondremos que
 
∂x ∂x

→ −

 ∂u
∂y
∂v
∂y  ∂X ∂X −→
rango  ∂u ∂v  = 2 ⇐⇒ × 6= 0 ,
∂z ∂z ∂u ∂v
∂x ∂y

donde consideramos
→ 
−  → 
− 
∂X ∂x ∂y ∂z ∂X ∂x ∂y ∂z
= , , y = , , .
∂u ∂u ∂u ∂u ∂v ∂v ∂v ∂v

Habitualmente notaremos

→ −
→ −→ −→

→ ∂X −
→ ∂X −
→ ∂2 X −
→ ∂2 X
Xu = , Xv = , X uu = , X uv =
∂u ∂v ∂u2 ∂v∂u

y ası́ sucesivamente.
→ −
− → −
→ −
→ −→
Observa que los vectores X u y X v forman una base del plano tangente siempre y cuando X u × X v 6= 0 y que
−→ −


→ X u (u, v) × X v (u, v)
N (u, v) = −
→ −

X u (u, v) × X v (u, v)



representa un vector normal unitario en cada punto de la superficie. Decimos que X : U ⊂ R. → R3 es una
parametrización regular de clase C m de la superficie S si y sólo si:



(1) X ∈ C m (U ), m > 1.


→ −
→ −→
(2) X u × X v 6= 0 para todo (u, v) ∈ U .

Ejemplo. Vamos a hallar las ecuaciones del plano tangente y de la recta normal a la superficie representada por

→ −→ −

X (u, v) = (u, v, u2 − v 2 ) en el punto correspondiente a u = 1, v = 1. Veamos, X (1, 1) = (1, 1, 0), X u (1, 1) =


(1, 0, 2) y X v (1, 1) = (0, 1, −2). La ecuación del plano tangente vendrı́a dada por

x−1 y−1 z

1 0 2 = 0,

0 1 −2

y la ecuación de la recta normal, habida cuenta que el vector normal unitario al plano en el punto en cuestión viene
dado por:
−→ −


→ X u (1, 1) × X v (1, 1) 1
N = − → −
→ = (−2, 2, 1),

X u (1, 1) × X v (1, 1) 3

se expresa en forma paramétrica como



 x = 1 − 2λ
y = 1 + 2λ, λ∈R

z = λ

2
C ÁLCULO DIFERENCIAL EN VARIAS VARIABLES 191

2.5.1. Coeficientes de la primera y segunda forma fundamental

Los coeficientes de la primera forma fundamental vienen dados por las siguientes expresiones:


→ −→ − 2

E(u, v) = X u (u, v). X u (u, v) = X u (u, v)

→ −→
F (u, v) = X u (u, v). X v (u, v)

→ −→ − 2

G(u, v) = X v (u, v). X v (u, v) = X v (u, v)

Ejemplo. Consideremos la superficie parametrizada por




X (u, v) = (u + v, u − v, uv).

Los coeficientes de la primera forma fundamental vendrı́an dados por

E(u, v) = 2 + v 2
F (u, v) = vu
G(u, v) = 2 + u2

2
Observemos que

→ −
→ E F
X u (u, v) × X v (u, v) = EG − F =
2
F G
y por tanto
−→ −


→ X u (u, v) × X v (u, v) 1 −→ −

N (u, v) = − = √ ( X u × X v ).
→ −
→ − 2
X u (u, v) × X v (u, v) EG F



Ejemplo. Para la superficie X (u, v) = (u + v, u − v, uv) dada en el ejemplo anterior, se tiene EG − F 2 =
4 + 2v 2 + 2u2 . Observa que el valor de esta cantidad es siempre estrictamente mayor que cero. 2

→ − →
Si llamamos θ al ángulo que forman los vectores X u y X v , se tiene

F −→ −

cos θ = √ √ ( X u × X v ).
E G

→ −

Esto quiere decir, entre otras cosas, que en una superficie parametrizada regular, X u y X v son perpendiculares
si y sólo si F = 0.

Pasamos ahora a introducir los llamados coeficientes de la segunda forma fundamental:

−→
→ ∂2 X

e = N.
∂u2
−→
→ ∂2 X

f = N.
∂u∂v
−→
→ ∂2 X

g = N.
∂v 2
192 MATEM ÁTICAS



Se llama curvatura de Gauss de una superficie parametrizada regular, en el punto X (u, v), a la expresión

e f

f g eg − f 2
K= = .
E F EG − F 2

F G

Observa que EG − F 2 > 0 siempre, con lo que el signo de K depende directamente de eg − f 2 .

Distinguiremos cuatro casos que dependen del discriminante eg − f 2 .

Figura 6.6: Distintos tipos de puntos en relación con su curvatura de Gauss.

Caso elı́ptico: Se dice que un punto es elı́ptico si K > 0. Viene a expresar que el comportamiento de la función
en las proximidades del punto es el de un paraboloide elı́ptico.
Caso hiperbólico: Se dice que un punto es hiperbólico si K < 0. En este caso existen en el plano tangente dos
rectas distintas que lo dividen en cuatro regiones.
Caso parabólico: Se dice que un punto es parabólico si K = 0 y e2 + f 2 + g 2 6= 0, es decir, los coeficientes e, f
y g no son todos iguales a cero. En este caso nos encontraremos con un cilindro parabólico como se puede
ver en la figura.
Caso plano: Se dice que un punto es plano si e = f = g = 0.

Ejemplo. Dada la parametrización regular de la esfera de centro (0, 0, 0) y radio a:




X (u, v) = (a(cos u)(sen v), a(sen u)(sen v), a cos v)

se puede comprobar fácilmente (se deja para el lector) que



e f

f g eg − f 2 1
K= = = 2,
E F EG − F 2 a

F G

curvatura por tanto siempre constante en todos los puntos de la superficie y que depende sólo del radio de la esfera.
Esto nos indicarı́a que K > 0 (caso elı́ptico), y serı́a más próxima a cero cuanto más grande fuera el radio de la
esfera, es decir, estarı́a más cerca de parecerse a un plano. 2

3. ACTIVIDADES DE APLICACIÓN DE LOS CONOCIMIENTOS




A.6.1. Calcular F 0 (t) si :
C ÁLCULO DIFERENCIAL EN VARIAS VARIABLES 193



(a) F (x) = (xex , ln(3x), 0) y x = ln t

→ √
(b) F (x) = (cos( x), arctan x, 1+−1 √ ) y x = t2 + 2t + 1.
x

A.6.2. Calcular el dominio y el rango de las siguientes funciones de dos variables:



(a) f (x, y) = x + y.
p
(b) f (x, y) = 4 − x2 − y 2 .
(c) f (x, y) = √1 .
x+y

A.6.3. Calcular los lı́mites (si existen) en los siguientes casos:


3x2 − y 2 + 5
(a) lim .
(x,y)→(0,0) x2 + y 2 + 2
x2 − 2xy + y 2
(b) lim .
(x,y)→(1,1) x−y
xy + y − 2x − 2
(c) lim .
(x,y)→(−2,2) x+1

A.6.4. Considerando diferentes curvas de aproximación, demostrar que las siguientes funciones no tienen lı́mite
cuando (x, y) → (0, 0).
x+y
(a) .
x−y
x2 − y 2
(b) .
x2 + y 2
x
(c) p .
x + y2
2

∂f ∂f
A.6.5. Calcular ∂x y ∂y en los siguientes casos:
x
(a) f (x, y) = e cos y.
p
(b) f (x, y) = 9 − x2 − y 2 .
(c) f (x, y) = ex ln y .

A.6.6. Sea w = f (x, y, z) = x2 + y 2 + z 2 , z = g(x, y) = x2 + y 2 . Calcular ∂w


∂x .

A.6.7. Calcular la ecuación del plano tangente al elipsoide de ecuación

x2 y2
+ + z2 = 1
4 9

3
en el punto (1, 0, 2 ).

A.6.8. Suponiendo que las funciones arbitrarias ϕ, ψ son diferenciables un número suficiente de veces, comprobar
las siguientes igualdades:
∂z ∂z
(a) y −x = 0, si z = ϕ(x2 + y 2 ).
∂x ∂y
∂z ∂z y2
(b) x2 − xy + y 2 = 0, si z = 3x + ϕ(xy)
∂x ∂y
A.6.9. Hallar las siguientes derivadas:
∂3w
(a) si w = x ln(xy).
∂x2 ∂y
∂6w
(b) si w = x3 sen y + y 3 sen x.
∂x3 ∂y 3
194 MATEM ÁTICAS

A.6.10. Hallar los extremos relativos de las funciones siguientes (en el caso de que existan):
(a) f (x, y) = y 2 + x2 y + x4 .
(b) f (x, y) = x2 + y 2 + x + y + xy.
(c) f (x, y) = y 2 − x3 .
(d) f (x, y) = x4 + y 4 − 2(x − y).
(ax + by + c)2
(e) f (x, y) = .
x2 + y 2 + 1
A.6.11. Entre todas las cajas de zapatos (sin tapa superior) de volumen dado, hallar la que tiene superficie mı́nima.
A.6.12. Hallar la menor distancia del punto (0, b) del eje OY a la parábola x2 − 4y = 0.


A.6.13. En cada uno de los siguientes casos, calcular el vector unitario tangente T .


(a) R (t) = (2 cos t, 2 sen t).

→ 3 2
(b) R (t) = ( t3 , t2 ).


(c) R (t) = (6 sen(2t), 6 cos(2t), 5t) (para t = π).


(d) R (t) = (et cos t, et sen t, et ) (para t = 0).


A.6.14. Calcular la longitud de la curva R (t) = (1, t, t2 ) desde el punto (1, 0, 0) al punto (1, 1, 1).


A.6.15. Calcular la longitud de la curva R (t) = (t, t, 4 − t2 ) desde el punto (0, 0, 4) al punto (1, 1, 3).


A.6.16. Hallar las ecuaciones de la recta tangente y del plano normal a la curva R (t) = (1 + t, −t2 , 1 + t3 ) en
t = 1.

→ 2 3
A.6.17. Hallar el vector curvatura y la curvatura de la curva R (t) = (t, t2 , t3 ).

→ −→
A.6.18. Demostrar que una curva de clase > 2 es una recta si R0 (t) y R00 (t) son linealmente dependientes para
todo valor de t.


A.6.19. Hallar el vector normal principal unitario y el binormal unitario, a lo largo de la curva R (t) = (3t −
t3 , 3t2 , 3t + t3 ).


A.6.20. Hallar la ecuación del plano osculador de la curva R (t) = (t, t2 , t3 ) en t = 1. ¿Cuál es la ecuación del
plano normal? ¿y la del plano rectificante?
A.6.21. Hallar la curvatura y la torsión en t = 0 de las siguientes curvas:


(a) R (t) = (t − sen t, 1 − cos t, t).

→ 1−t2
(b) R (t) = (t, 1+t
t , t ).

A.6.22. Demostrar las fórmulas de Frenet.


A.6.23. Calcular los coeficientes de la primera y segunda forma fundamental y la curvatura de Gauss para el punto
u = 0, v = 0 de las siguientes superficies:


(a) X (u, v) = (u, v, u2 − v 2 ).


(b) X (u, v) = (u, v, u2 + v 2 ).


(c) X (u, v) = (cosh u cos v, cosh u sen v, u).

→ 3 3
(d) X (u, v) = (u − v3 + uv 2 , v − v3 + vu2 , u2 − v 2 ).
A.6.24. Demostrar que cualquier punto de la superficie
−→
X (u, v) = (f (t) cos θ, f (t) sen θ, t), f (t) > 0,

es parabólico si y sólo si la superficie es un cilindro circular (f (t) = a), o un cono (f (t) = at + b con
a 6= 0).
C ÁLCULO DIFERENCIAL EN VARIAS VARIABLES 195

4. ACTIVIDADES PRÁCTICAS DEL CAPÍTULO

4.1. Introducción

La práctica se va a realizar con el programa de cálculo matemático DERIVE for Windows, versión 4.05, de Soft
Warehouse. DERIVE for Windows permite realizar cálculos y manipulaciones matemáticas de carácter general,
lo cual significa que realiza muchas cosas de forma aceptable aunque no tiene la potencia de otros programas
especı́ficos. No obstante, DERIVE for Windows permite realizar todos los cálculos que un usuario medio puede
necesitar.

En esta práctica nos vamos a centrar en el cálculo (diferencial e integral) en varias variables. Veremos cómo
calcular lı́mites de funciones vectoriales y derivadas parciales, determinaremos el gradiente y el laplaciano de
una función, ası́ como la divergencia y el rotacional de un campo. Daremos también algunas aplicaciones en la
Geometrı́a de curvas y superficies, y finalizaremos calculando el potencial de un campo conservativo.

Antes de comenzar la práctica será conveniente que recordemos brevemente la ‘botonera’ de DERIVE for Win-
dows (ver Figura 6.7), ya que simplifica enormemente la introducción de datos y la realización de cálculos. Los
botones permiten realizar las siguientes tareas (de izquierda a derecha): New (abrir una nueva hoja de trabajo),
Open (abrir una hoja de trabajo existente), Save (guardar la sesión de trabajo, Print (imprimir la sesión de tra-
bajo), Remove (eliminar la expresión marcada), Unremove (recuperar la última expresión eliminada), Renumber
(renumerar las expresiones, Author expression (introducir una expresión sencilla), Author vector (introdu-
cir un vector), Author matrix (introducir un vector), Simplify (simplificar), Approximate (calcular un valor
aproximado), Solve (resolver algebraicamente o numéricamente una expresión), Substitute for variables
(realizar una sustitución), Calculate limit (calcular un lı́mite), Calculate derivative (calcular una deriva-
da), Calculate integral (calcular una integral), Calculate sum (calcular una suma), Calculate product
(calcular un producto), 2D-plot window (realizar un gráfico bidimensional) y 3D-plot window (realizar un
gráfico tridimensional).

Figura 6.7: El uso de la ‘botonera’ de DERIVE for Windows nos puede simplificar mucho el trabajo. Otro elemento
interesante es la existencia de ‘teclas calientes’ que nos permiten evitar los menús, con lo que se gana
en rapidez.

4.2. Lı́mites y continuidad de funciones vectoriales

Con DERIVE for Windows podemos calcular los lı́mites iterados de funciones de dos o más variables, lo cual
puede ser de utilidad para determinar si una función es continua en un punto. Por ejemplo, supongamos que
queremos determinar los siguientes lı́mites:
p p
lim lim 16 − 4x2 − y 2 lim lim 16 − 4x2 − y 2
y→0 x→0 x→0 y→0

En primer lugar, definimos una apropiada función F , introduciendo la expresión F(x,y):=SQRT(16-4x^2-y^2).


Seleccionando las opciones Calculus|Limit nos aparece la ventana de la Figura 6.8. Debemos seleccionar la
Variable (x o y), el punto lı́mite (Limit Point) y el tipo de lı́mite (Approach Form): por la izquierda, por la
derecha o por ambos lados. En nuestro caso, ambos lı́mites iterados valen 4.
196 MATEM ÁTICAS

Figura 6.8: Venta del programa que permite calcular lı́mites de funciones de varias variables.

Ejercicio. Calcular los lı́mites iterados en (0,0) de la función


 2
x2 − y 2
f (x, y) =
x2 + y 2

NOTA: Observemos que aunque los lı́mites iterados existan y coincidan, puede que el lı́mite (de ambas
variables simultáneamente) no exista.

Ejercicio. Calcular los lı́mites iterados de las siguientes funciones:

arcsin(x/y)
f (x, y) = en (0, 1)
1 + xy
g(x, y, z) = xeyz en (2, −1, 1)

4.3. Cálculo diferencial vectorial

DERIVE for Windows realiza cálculo diferencial vectorial en cualquier sistema de coordenadas ortogonal. Po-
demos calcular gradientes, divergencias y rotacionales en coordenadas cartesianas, polares/cilı́ndricas o esféricas,
siendo las coordenadas cartesianas (también llamadas rectangulares) las que se utilizan por defecto. Los nombres
de las variables cartesianas son x, y, z, aunque podemos utilizar otros.

Derivadas Parciales

El cálculo de las derivadas parciales con DERIVE for Windows es sencillo, pues se sigue el mismo proceso que
para las funciones de una variable. Se seleccionan las opciones Calculus|Differentiate (o bien pulsamos el
botón ∂ ) y nos aparece la ventana de la Figura 6.9. En ella debemos introducir la función que vamos a derivar (por
defecto la que está seleccionada), la Variable respecto de la cual vamos a derivar (por defecto x) y el orden de
diferenciación (por defecto 1). Puede ser interesante almacenar las derivadas parciales en unas nuevas funciones
para poder manipularlas más cómodamente. Para ello, una vez calculada la derivada parcial, seleccionamos las
opciones Declare|Function Definition y nos aparece la ventana de la Figura 6.10. En ella debemos rellenar
el nombre de la nueva función y sus argumentos, que usualmente serán los mismos que los de la función original,
C ÁLCULO DIFERENCIAL EN VARIAS VARIABLES 197

y la definición de la nueva función (debemos recordar que pulsando la tecla de función F3 se copia la lı́nea que
está seleccionada).

Figura 6.9: Venta del programa que permite calcular las derivadas parciales de funciones de varias variables.

Figura 6.10: Venta del programa que permite declarar una función. Existen ventanas similares para declarar el
valor de una variable (constante, vector o matriz).

Ejercicio. Calcular las derivadas parciales de la siguiente función


p
f (x, y) = 9 − x2 − y 2
y almacenarlas en dos funciones distintas (por ejemplo, FX y FY).

También es posible calcular las derivadas parciales de orden superior. Para ello sólo es necesario indicar el orden
de derivación en la casilla Order (ver la Figura 6.9).

Ejercicio. Calcular las derivadas parciales segundas de la función


h(x, y) = 3xy 2 − 2y + 5x2 y 2
¿Cuánto vale fxy (−1, 2)?
NOTA: Para encontrar el valor de una expresión cuando particularizamos a un punto (x0 , y0 ) debemos
utilizar las opciones Simplify|Substitute For|Variables.

Gradiente de una función

Cuando f es una función escalar de varias variables (pensemos que está definida en R2 o en R3 ) entonces podemos
198 MATEM ÁTICAS

calcular su gradiente como el vector

∇f (x, y) = (fx (x, y), fy (x, y)) o ∇f (x, y, z) = (fx (x, y, z), fy (x, y, z), fz (x, y, z))

DERIVE for Windows permite calcular los gradientes utilizando la función

GRAD(F(x,y)) ó GRAD(F(x,y,z))

según F sea una función de 2 o 3 variables. Debemos hacer notar que DERIVE for Windows siempre devuelve
un vector de 3 componentes: si la función depende de 2 variables, entonces la tercera componente es cero.

Ejercicio. Calcular el gradiente de la función f (x, y) = 20 − 4x2 − y 2 en el punto (2, −3).

Si las coordenadas cartesianas con las que estamos trabajando no se llaman (x, y, z) o si trabajamos en dimensión
superior a tres, tenemos que indicárselo convenientemente. Por ejemplo, si nuestra función es g(a, b, c, d) =
a2 − b2 + c2 − d2 , entonces su gradiente se calcuları́a escribiendo

GRAD(a^2-b^2+c^2-d^2, [a,b,c,d])

El resultado es (2a,-2b,2c,-2d).

Hasta ahora hemos supuesto que nuestros sistemas de coordenadas (x, y, z) o (a, b, c, d) son ortonormales. Sin
embargo, el gradiente se puede calcular en cualquier sistema de coordenadas (sin ninguna restricción). DERIVE
for Windows, sin embargo, imponen ciertas restricciones: los sistemas de coordenadas deben ser ortogonales.
Si la matriz de la métrica (producto escalar) no es la identidad, entonces también debemos indicarlo cuando
utilicemos la función GRAD. Por ejemplo, supongamos que la matriz métrica del sistema de coordenadas (x, y, z)
fuese (1, 2, 4). Entonces el gradiente de una función f (x, y, z) se calcuları́a mediante el comando

GRAD(f(x,y,z),[[x,y,z],[1,2,4]])

En general, la sintaxis del comando GRAD es la siguiente:

GRAD(f(x1,x2,x3),[[x1,x2,x3],[g1,g2,g3]])

donde (x1,x2,x3) denota el sistema de coordendas ortogonal, (g1,g2,g3) indica la matriz de la métrica y
f(x1,x2,x3) es la función.

Si se carga la utilidad VECTOR.MTH, entonces están disponibles dos sistemas de coordenadas adicionales: las
coordenadas polares/cilı́ndricas y las coordenadas esféricas, cuyas matrices (coordenadas y métrica) están dadas
por

cylindrical := [[r,θ,z],[1,r,1]]
spherical := [[r,θ,Φ],[1,r SIN(Φ),r]]

Por ejemplo GRAD(r SIN(θ) COS(Φ), spherical) da como resultado el vector

[COS(Φ) SIN(θ), COT(Φ) COS(θ), -SIN(Φ) SIN(θ)].


C ÁLCULO DIFERENCIAL EN VARIAS VARIABLES 199

Observación : Todos los operadores diferenciales vectoriales admiten un segundo argumento opcional consisten-
te en una matriz de dos filas: la primera fila representa el sistema de coordenadas y la segunda fila indica los
elementos de la métrica.

Un campo vectorial F se dice que es conservativo si existe alguna función diferenciable f tal que F = GRAD(f ).
La función f se llama una función potencial de F . Un criterio de campo vectorial conservativo en el plano es el
siguiente. El campo F (x, y) = (M (x, y), N (x, y)) es conservativo si, y sólo si,

∂N ∂M
=
∂x ∂y

Con DERIVE for Windows podemos realizar el siguiente cálculo:

DIF(M(x,y),y)-DIF(N(x,y),x)

El campo será conservativo si, y sólo si, la anterior expresión vale cero.

Ejercicio. Determinar si los siguientes campos son conservativos:


(a) F (x, y) = (x2 y, xy)
(b) F (x, y) = (2x, y)
(c) F (x, y) = (2xy, x2 − y)

La divergencia de un campo

La divergencia de un campo de vectores X = (f1 , f2 , f3 ), donde fi es una función diferenciable definida en R3 ,


es la función diferenciable dada por div(X) = (f1 )x + (f2 )y + (f3 )x . Para calcular la divergencia, DERIVE for
Windows dispone de la función

DIV([f1(x,y,x),f2(x,y,z),f3(x,y,z)]

donde [f1,f2,f3] es el vector de componentes del campo. Por ejemplo, DIV([y 2 z 3 , 2xyz 3 , 3xy 2 z 2 ]) da como
resultado x(6y 2 z + 2z 3 ).

Ejercicio. Calcular la divergencia de los siguientes campos de vectores:


2 2 2
(a) X = (xp yz, (y − 1) cos z, (y + 1) cos(xy))
(b) Y = ( x + y + z , x − y 3 , x + y 2 + z 3 )
2 2 2 2

Si queremos calcular la divergencia de un campo en el plano, debemos añadirle una tercera componente constante
(por ejemplo, cero) y calcular la divergencia del nuevo campo. Sea el campo G = (f (x, y), g(x, y)) definido en
el plano. Su divergencia se calcuları́a de la siguiente manera:

• Consideramos el campo G:=[f,g,0] en R3 .


• Calculamos su divergencia: DIV(G).

Ejercicio. Calcular la divergencia de los siguientes campos planos: (x2 y, y 2 − x), (xy, x3 − y 3 ).
200 MATEM ÁTICAS

El rotacional de un vector

El rotacional de un campo F (x, y, z) = (M (x, y, z), N (x, y, z), P (x, y, z)) es el campo

rotF (x, y, z) = (∇ × F )(x, y, z)


     
∂P ∂N ∂P ∂M ∂N ∂M
= − i− − j+ − k
∂y ∂z ∂x ∂z ∂x ∂y

donde ∇ = (∂x , ∂y , ∂z ). Cuando rot(F ) = 0 decimos que el campo F es irrotacional.

Para calcular el rotacional con DERIVE for Windows debemos utilizar la siguiente función:

CURL([f(x,y,z),g(x,y,z),h(x,y,z)])

donde (f, g, h) son las componentes del campo de vectores.

Ejercicio. Hallar el rotacional del campo (2xy, x2 + z 2 , 2zy)

Un criterio para campos conservativos en el espacio es el siguiente. Un campo vectorial F = (M, N, P ), donde
M , N y P son funciones de clase C 1 (es decir, con derivadas parciales primeras continuas) es conservativo si, y
sólo si, rotF (x, y, z) = 0.

Ejercicio. ¿Es conservativo el campo de vectores (x3 y 2 z, x2 z, x2 y)?

El laplaciano de una función

El laplaciano de una función diferenciable f (x, y, z) es la nueva función dada por

∂2f ∂2f ∂2f


∆f (x, y, z) = + +
∂x2 ∂y 2 ∂z 2

Para calcular el laplaciano con DERIVE for Windows debemos utilizar la siguiente función:

LAPLACIAN(f(x,y,z))

La función f puede ser de dos variables.

Ejercicio. Calcular el laplaciano de las siguientes funciones:


(a) f (x, y) = x2 + y 2 p
(b) f (x, y, z) = x3 + y 3 + x + y + z 4
C ÁLCULO DIFERENCIAL EN VARIAS VARIABLES 201

4.4. Aplicaciones a la Geometrı́a Diferencial

4.4.1. Longitud de una curva

Sea R(t) = (x(t), y(t), z(t)), t ∈ [a, b] una curva diferenciable en R3 . Entonces su longitud viene dada por
Z bp
L= x0 (t)2 + y 0 (t)2 + z 0 (t)2 dt
a

Si queremos utilizar DERIVE for Windows podemos hacerlo directamente siguiendo los siguientes pasos:

(1) Definimos las funciones x(t), y(t) y z(t).


(2) Definimos la función longitud como sigue:

L(p,q) := INT(SQRT(DIF(x(t),t)^2+DIF(y(t),t)^2+DIF(z(t),t)^2),t,p,q)

(3) Introducimos la expresión L(a,b) para obtener el resultado final.

Ejercicio. Calcular la longitud de una vuelta de la hélice circular cuya parametrización es


R(t) = (A cos θt, A sen θt, Bt), A, B ∈ R

Otra posible solución al problema de determinar la longitud de la curva consiste en utilizar álgebra vectorial:

(1) Definimos un vector R(t) por R(t):=[X(t),Y(t),Z(t)].


(2) Definimos la función longitud como sigue:

L(p,q) := INT(SQRT(DIF(R(t),t).DIF(R(t),t)),t,p,q)

4.4.2. Cálculo de la curvatura y la torsión de una curva

El problema consiste en definir dos funciones que se encarguen de calcular dichas cantidades. La función curvatura
está dada por
|R0 (t) × R00 (t)|
κ(t) =
|R0 (t)|
y la función torsión está dada por
det(R0 (t), R00 (t), R000 (t))
τ (t) =
|R0 (t) × R00 (t)|2
Dichas funciones pueden definirse en DERIVE for Windows del siguiente modo:

K(t) := ABS(CROSS(R0 (t),R00 (t)))/ABS(R0 (t))

T(t) := DET([R0 (t),R00 (t),R000 (t)])/ABS(CROSS(R0 (t),R00 (t)))^2

Ejercicio. Calcular la curvatura y torsión de la hélice circular cuya parametrización es


R(t) = (A cos θt, A sen θt, Bt), A, B ∈ R
202 MATEM ÁTICAS

4.4.3. Coeficientes de la primera y segunda forma fundamental

Dada una superficie parametrizada regular S(u, v) = (x(u, v), y(u, v), z(u, v)) se definen los coeficientes de la
primera forma fundamental como sigue:
2
E(u, v) = Su (u, v).Su (u, v) = |Su (u, v)|
F (u, v) = Su (u, v).Sv (u, v)
G(u, v) = Sv (u, v).Sv (u, v) = |Sv (u, v)|2

y los coeficientes de la segunda forma fundamental son:

∂2S
e = N.
∂u2
∂2S
f = N.
∂u∂v
∂2S
g = N. 2
∂v
donde N representa el vector unitario normal a la superficie:
1
N (u, v) = √ (Su × Sv ).
EG − F 2

Para calcular estos elementos con DERIVE for Windows, definimos las siguientes funciones:

S(u,v) := [x(u,v),y(u,v),z(u,v)]
E(u,v) := DIF(S(u,v),u).DIF(S(u,v),u)
F(u,v) := DIF(S(u,v),u).DIF(S(u,v),v)
G(u,v) := DIF(S(u,v),v).DIF(S(u,v),v)
N(u,v) := SQRT(E(u,v)G(u,v)-F(u,v)^2)^(-2).CROSS(DIF(S(u,v),u),DIF(S(u,v),v))
EE(u,v) := N(u,v).DIF(S(u,v),u,2)
FF(u,v) := N(u,v).DIF((DIF(S(u,v),u)),v)
GG(u,v) := N(u,v).DIF(S(u,v),v,2)

Ejercicio. Calcular los coeficientes de la primera y de la segunda forma fundamental de la siguiente superficie
parametrizada:
S(u, v) = (cosh(u) cos(v), cosh(u) sen(v), u)

4.4.4. Curvatura de Gauss

A partir de los coeficientes determinados en el apartado anterior podemos calcular la curvatura de Gauss de la
superficie como sigue:
eg − f 2
KG(u, v) =
EG − F 2
En DERIVE for Windows podemos definir la siguiente función:

KG(u, v) := (EE(u,v).GG(u, v)-FF(u, v)^2)/(E(u,v).G(u,v)-F(u,v)^2)

Ejercicio. Calcular la curvatura de Gauss de la superficie parametrizada del ejercicio anterior.


C ÁLCULO DIFERENCIAL EN VARIAS VARIABLES 203

4.5. Cálculo integral vectorial

Sea el campo de vectores F = (M, N, P ) y supongamos que es conservativo. Entonces existe una función
diferenciable f tal que

fx = M
fy = N
fz = P

¿Cómo determinar f ? Podemos hacerlo directamente mediante integración; sin embargo, DERIVE for Windows
pone a nuestra disposición la siguiente función:

POTENTIAL([f(x,y,z),g(x,y,z),h(x,y,z)])

donde (f, g, h) son las componentes del campo de vectores.

Como en el cálculo de primitivas, las funciones potenciales son únicas salvo constantes. Por tanto, la función
POTENTIAL puede proporcionar un resultado diferente a uno calculado manualmente. Las constantes aditivas
pueden ser desechadas (especialmente en funciones que involucran logaritmos o funciones trigonométricas inver-
sas).

No todos los campos de vectores admiten una función potencial; no todos los campos son conservativos. En
este caso, la función POTENTIAL determina una función diferenciable cuyo gradiente no es el campo de vecto-
res original. Por tanto, antes de utilizar la función POTENTIAL es conveniente verificar primero si el campo es
conservativo.

La función POTENTIAL admite un segundo argumento opcional que es un vector especificando las coordenadas del
punto inicial para las integrales involucradas. Por defecto, este vector es el vector nulo. Una elección inapropiada
puede conducir a un potencial infinito o desconocido; si esto ocurriese es conveniente probar con otros valores.

Finalmente, la función POTENTIAL admite un tercer argumento opcional que es un vector de coordenadas cartesia-
nas o una matriz métrica (esto es, una matriz con dos filas: un vector de coordenadas y una vector con la métrica).
Por defecto, este argumento es [x,y,z].

Ejercicio. Sea el campo de vectores F (x, y, z) = (2xy, x2 + z 2 , 2zy). Probar que F es un campo conservativo y
encontrar una función potencial para F .

4.6. Bibliografı́a

C. Paulogorrón y C. Pérez. Cálculo matemático con DERIVE para PC, Ed. RA-MA, 1a Ed., 1994.

5. BIBLIOGRAFÍA DEL CAPÍTULO

R.E. LARSON, R.P. HOSTETLER y B.H. EDWARDS Calculo y Geometrı́a Analı́tica, 5a ed., McGraw-Hill, Ma-
drid, 1995. Capı́tulo 15.

J. STEWART Cálculo, 2a ed. Grupo Editorial Iberoamérica, México, 1994. Capı́tulo 12.
204 MATEM ÁTICAS

6. PREGUNTAS DE EVALUACIÓN

E.6.1. La posición de un punto en un instante t viene dada por la función vectorial


 
1 2 1 3
R(t) = t , (6t + 9) 2 .
2 9

Se pide:
(a) Hallar el espacio recorrido desde t = 0 hasta t = 4.
(b) Hallar un vector tangente unitario y otro normal a la curva en el punto de parámetro t = 1.
(c) ¿Cuál es el valor de la curvatura en ese punto?
E.6.2. (a) Demostrar que los vectores tangentes a lo largo de la curva

α(t) = at, bt2 , t3


(siendo 2b2 = 3a) forman un ángulo constante con el vector A = (1, 0, 1). ¿Cuál es el valor de ese ángulo?
(b) Hallar las ecuaciones de los planos osculador, normal y rectificante de la curva del apartado anterior
para a = b = 1.
E.6.3. Demostrar que la curva definida por la parámetrización
 
1 + t 1 − t2
α(t) = t, ,
t t

está contenida en un plano.


E.6.4. Comprobar que z = yf (x2 − y 2 ), donde f es una función diferenciable arbitraria, satisface la ecuación

∂z ∂z
y2 + xy = xz.
∂x ∂y

E.6.5. Calcular la ecuación del plano tangente al elipsoide de ecuación

x2 y2 z2
+ + = 1,
9 16 4
en los puntos que correspondan a las coordenadas x = 0 e y = 1.
E.6.6. Un palo de longitud ` se parte en tres trozos de longitudes x, y, z. Hallar x, y, z para que el producto xyz
sea máximo.
E.6.7. Demostrar que los puntos de la siguiente superficie


X (u, v) = (u, v, u2 + v 3 )

son elı́pticos si v > 0, hiperbólicos si v < 0 y parabólicos si v = 0.


C ÁLCULO DIFERENCIAL EN VARIAS VARIABLES 205

ANOTACIONES

....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
CAPÍTULO 7
CÁLCULO INTEGRAL EN VARIAS VARIABLES

1. INTERROGANTES CENTRALES DEL CAPÍTULO

• Calcular integrales dobles en coordenadas carte- tesianas, cilı́ndricas y esféricas, sobre dominios
sianas y polares, sobre dominios sencillos. sencillos.
• Usar la integral doble para el cálculo de áreas.
• Usar la integral triple para el cálculo de
• Calcular integrales triples en coordenadas car- volúmenes.

2. CONTENIDOS FUNDAMENTALES DEL CAPÍTULO

2.1. Integrales dobles sobre dominios sencillos

Sea f (x, y) una función continua para los valores (x, y) ∈ R donde

R = (x, y) ∈ R2 a 6 x 6 b, c 6 y 6 d = [a, b] × [c, d].

Para cada y0 fijamos la función definida por F (x) = f (x, y0 ) que es continua y por lo tanto integrable es [a, b].
La integral
Zb
F (x, y)dx = G(y)
a

es una función continua y como consecuencia integrable en [c, d].

Definiremos la integral doble sobre el rectángulo R = [a, b] × [c, d] de la función f (x, y) como
 
ZZ Zd Zb
f (x, y)dxdy =  f (x, y)dx dy.
R
c a

ZZ
Ejemplo. Sea R = [0, 1] × [0, 2], vamos a calcular f (x, y)dxdy donde f (x, y) = xy.
R
 1 
ZZ Z2 Z
xydxdy =  xydx dy
R
0 0
C ÁLCULO INTEGRAL EN VARIAS VARIABLES 207

Z2  x=1
x2 y
= dy
2 x=0
0
Z2  2 y=2
y y
= dy = = 1.
2 4 y=0
0

2
Teorema de Fubini: Si R = [a, b] × [c, d] se cumple que
   
ZZ Zd Zb Zb Zd
f (x, y)dxdy =  f (x, y)dx dy =  f (x, y)dy  dx,
R
c a a c

expresión válida siempre que f (x, y) sea continua en R.

El concepto de integral doble se puede extender a conjuntos que no sean necesariamente rectángulos en R2 . Son
conjuntos acotados más generales que en algunas referencias bibliográficas se denominan conjuntos medibles
Jordan. No vamos a intentar definir e identificar matemáticamente estos conjuntos; para nuestras aplicaciones
nos bastará con saber que recintos planos D de puntos que estén limitados por una curva cerrada son conjuntos
medibles Jordan en los que tiene sentido definir la integral doble (ver Figura 7.1).

Figura 7.1: Conjunto medible Jordan.

Para calcular la integral de f (x, y) en el recinto D procederemos como sigue. La recta x = x0 corta a D en dos
puntos M1 y M2 de ordenadas respectivas y1 (x0 ) e y2 (x0 ). Cuando variamos a 6 x 6 b, y1 (x) e y2 (x) son dos
funciones continuas. Ası́  
ZZ Zd yZ2 (x)
 
f (x, y)dxdy =  f (x, y)dx dy.
D
c y1 (x)

¿Qué ocurre si tomamos las rectas y = y0 y los puntos de corte con abscisas x1 (y0 ) y x2 (y0 ), siendo ambas
funciones continuas para c 6 y 6 d?

En el caso de que f (x, y) sea continua en D (caso para el que nos restringiremos en la práctica) se tiene por el
Teorema de Fubini que
   
ZZ Zd yZ2 (x) Zb xZ2 (y)
   
f (x, y)dxdy =  f (x, y)dx dy =  f (x, y)dy  dx
D
c y1 (x) a x1 (y)
208 MATEM ÁTICAS

¿Qué ocurre cuando las rectas x = x0 (o bien y = y0 ) cortan al dominio D en más de dos puntos? La forma de
realizar en la práctica este caso es descomponer D en dominios parciales que sı́ satisfagan la condición, aunque
nosotros solo trataremos los casos más sencillos.
ZZ

Ejemplo. Vamos a calcular x2 ydxdy donde D = (x, y) ∈ R2 x2 + y 2 6 1, y > 0 (semicı́rculo superior
D
de centro el origen y radio 1)

√ 
ZZ Z1 Z1−x2
 
x2 ydxdy =  x2 ydy  dx
D
−1 0

Z1  y=√1−x2 Z1
x2 y 2 (1 − x2 )x2
= dx = dx
2 y=0 2
−1 −1
 3

5 x=1
1 x x 2
= − =
2 3 5 x=−1 15
2

2.1.1. Integrales dobles en coordenadas polares

A veces, por cuestiones de facilidad en la expresión de la función o del recinto, trabajar en coordenadas polares
agiliza en gran manera los cálculos. En realidad no hay ningún problema matemático para efectuar una nueva
elección de un sistema de coordenadas (r, θ) con x = r cos θ, y = r sen θ.

Ejemplo. Vamos a calcular de nuevo la integral de f (x, y) = x2 y en el recinto



D = (x, y) ∈ R2 x2 + y 2 6 1, y > 0 ,

ahora usando coordenadas polares. Para empezar debemos fijarnos en la ventaja evidente de que la porción del
cı́rculo unidad que indica D tiene ahora una expresión bastante más sencilla, a saber,

D = { (r, θ)| 0 6 r 6 1, 0 6 θ 6 π} .

Luego se tiene
ZZ ZZ
x2 ydxdy = r 3 (cos2 θ)(sen θ)rdrdθ
D
ZZ D

= r 4 (cos2 θ)(sen θ)drdθ


D 
Z1 Zπ
=  r 4 (cos2 θ)(sen θ)dθ  dr
0 0
Z1  θ=π
cos3 θ
= −r 4 dr
3 θ=0
0
Z1  r=1
2r 4 1 r5 2
= dr = =
3 2 5 r=0 15
0

2
C ÁLCULO INTEGRAL EN VARIAS VARIABLES 209

2.1.2. Cálculo de áreas usando integrales dobles

Conviene reflexionar sobre el significado geométrico de la expresión


ZZ
dxdy.
D


• DadoZelZrectángulo R = (x, y) ∈ R2 a 6 x 6 b, c 6 y 6 d = [a, b] × [c, d] ¿qué significado geométrico
tiene dxdy?
R
ZZ

• Y si ahora ponemos R = (x, y) ∈ R2 x2 + y 2 6 1 ¿qué significado piensas que tiene dxdy? (Es
R
más facil que lo pienses en coordenadas polares).

• Finalmente generaliza los resultados obtenidos al caso de un recinto D.

Para ilustrar las reflexiones que te hemos propuesto anteriormente te presentamos el siguiente ejemplo.

Ejemplo. Vamos a calcular el área del lóbulo del folium de Descartes (ver Figura 7.2) de ecuación en coordenadas
polares
3 sen θ cos θ π
r= , 06θ6 .
sen3 θ + cos3 θ 2

Figura 7.2: Folium de Descartes.

En nuestro caso se tiene que el área vendrı́a expresada por la siguiente integral doble:
 3 sen θ cos θ

π π
Z2 Z
sen3 θ+cos3 θ Z2  r= 3 sen θ cos θ
  r2 sen3 θ+cos3 θ
 rdr 
  dθ =
2

r=0
0 0 0
π
Z2
9 sen2 θ cos2 θ
= dθ
2(sen3 θ + cos3 θ)2
0
π
Z2
1 9 sen2 θ cos2 θ
= dθ.
2 (sen3 θ + cos3 θ)2
0
210 MATEM ÁTICAS

Observa que por la simetrı́a del recinto se tiene


π π
Z2 Z4
1 9 sen2 θ cos2 θ 9 sen2 θ cos2 θ
dθ = dθ
2 (sen3 θ + cos3 θ) (sen3 θ + cos3 θ)
0 0

1
y haciendo el cambio de variable tan θ = t, dt = cos2 θ dθ, obtenemos (intentando antes simplificar algo las
expresiones):
π π
Z4 Z4
9 sen2 θ cos2 θ 9 sen2 θ cos2 θ
dθ = dθ
(sen3 θ + cos3 θ)2 cos6 θ (1 + tan3 θ)2
0 0
π
Z4
9 sen2 θ
= dθ
cos4 θ (1 + tan3 θ)2
0
Z1
t2
= 9 dt
(1 + t3 )2
0
 t=1
1 3
= −3 = .
1 + t3 t=0 2
2

2.2. Integrales triples

Procedemos de forma análoga a las integrales dobles, esta vez refiriéndonos a funciones de tres variables definidas
sobre un recinto del espacio R. Sea f (x, y, z) una función contı́nua para los valores (x, y, z) ∈ R donde

R = (x, y, z) ∈ R3 a 6 x 6 b, c 6 y 6 d, e 6 z 6 f = [a, b] × [c, d] × [e, f ].

Con las consideraciones de continuidad para f (x, y, z) y las consecuencias posteriores de integrabilidad similares
a las hechas para la integral doble, se tiene que la integral triple sobre el paralelepı́pedo R de la función f (x, y, z)
se puede expresar como
   
ZZZ Zf Zd Zb
f (x, y, z)dxdydz =   f (x, y)dx dy  dz.
R
e c a

El Teorema de Fubini también se cumple ahora. Es decir, podremos cambiar el orden de las diferentes integrales
sin que esto afecte al valor final de la integral triple.

Ejemplo. Sea R = [0, 1] × [0, 2] × [0, 3] y f (x, y, z) = xyz. Entonces


   
ZZZ Z3 Z2 Z1
xyzdxdydz =   xyzdx dy  dz
R
0 0 0
 
Z3 Z2  2 x=1
 x yz
= dy  dz
2 x=0
0 0
 
Z3 Z2
=  yz dy  dz
2
0 0
C ÁLCULO INTEGRAL EN VARIAS VARIABLES 211

Z3  y=2 Z3
y2 z
= dz = zdz
4 y=0
0 0
 z=3
z2 9
= =
2 z=0 2
2
Siguiendo el procedimiento al que sometı́amos a la integral doble, pasamos a continuación a introducir el concepto
de integral triple sobre conjuntos acotados más generales D ⊂ R3 , los llamados conjuntos medibles Jordan.

Figura 7.3: Conjunto medible Jordan.

Consideramos ahora el plano x = x0 (paralelo al plano coordenado Y Z) y supongamos además que el mencio-
nado plano corta a D en C(x0 ). En estas condiciones,supuestas las hipótesis de continuidad de la función en el
dominio y de las secciones C(x) al variar x entre [a, b], podemos calcular la integral triple de f (x, y, z) sobre D
de la siguiente forma:

ZZZ Zb "Z Z #
f (x, y, z)dxdydz = f (x, y, z)dydz dx
D C(x)
a

Si desarrollamos el cálculo de la integral


ZZ
f (x, y, z)dydz,
C(x)

suponiendo que las paralelas al eje OZ cortan a C(x) en puntos en los que las cotas alcanzadas en el mencionado
eje sean z1 (x0 , y0 ) y z2 (x0 , y0 ), se tiene entonces
 
ZZ 2 (x)
yZ z2Z(x,y)
 
f (x, y, z)dydz =  f (x, y, z)dz  dy,
C(x)
y1 (x) z1 (x,y)

de donde finalmente tendremos que

ZZZ Zb "Z Z #
f (x, y, z)dxdydz = f (x, y, z)dydz dx
D C(x)
a
   
Zb 2 (x)
yZ z2Z(x,y)
   
=   f (x, y, z)dz  dy  dx.
a y1 (x) z1 (x,y)
212 MATEM ÁTICAS

Obsérvese que también aquı́ se puede intercambiar el orden de las integraciones, es decir, podemos partir de
secciones de D paralelas al plano XY (C(z0 )) o paralelas al plano XZ (C(y0 )), sin que esto varı́e nuestro
razonamiento en lo que al proceso se refiere.

Ejemplo. Vamos a calcular ZZZ


x2 yzdxdydz,
D
siendo 
D = (x, y, z) ∈ R3 x2 + y 2 6 1, 0 6 z 6 1, x > 0, y > 0
(la parte del cilindro de base el cı́rculo de centro el origen y radio 1 y de altura igual a 1, que está contenida
en el primer octante). Consideremos ahora secciones C(z0 ) por planos paralelos al XY , de ecuaciones z = z0 ,
variando z en el intervalo [0, 1]. Ası́ obtenemos lo siguiente:
ZZZ Z1 "Z Z #
2 2
x yzdxdydz = x yzdxdy dz
D C(z)
0
 √  
Z1 Z1 Z1−x2
   
=   x2 yzdy  dx dz
0 0 0
 
Z1 Z1  2 2 y=√1−x2
 x y z
= dy  dz
2 y=0
0 0
 1 
Z Z
1
2 2
 (1 − x )x z
= dx dz
2
0 0
 
Z1 Z1  3 
5 x=1
 z x x  dz
= −
2 3 5 x=0
0 0
Z1  z=1
z 1 z2 1 1 1
= dz = = =
15 15 2 z=0 15 2 30
0

2
Se puede pensar en intercambiar el orden de las integrales simples para intentar facilitar el proceso de cálculo.
Veamos:
ZZZ Zb "Z Z #
f (x, y, z)dxdydz = f (x, y, z)dydz dx
D C(x)
a
   
Zb 2 (x)
yZ z2Z(x,y)
   
=   f (x, y, z)dz  dy  dx
a y1 (x) z1 (x,y)
 
ZZ z2Z(x,y)
 
=  f (x, y, z)dz  dxdy,
πXY (D)
z1 (x,y)

donde se puede observar que hemos empezado por una integral simple y después integramos el resultado sobre
πXY (D) que indica la proyección de D sobre el plano XY .

Naturalmente todo el anterior procedimiento se puede hacer análogamente integrando primero sobre x y des-
pués integrando sobre πY Z (D) (proyección de D sobre Y Z), o bien integrando primero sobre y y después sobre
πXZ (D).
C ÁLCULO INTEGRAL EN VARIAS VARIABLES 213

Ejemplo. Vamos a calcular ZZZ


xyzdxdydz
S
donde 
S = (x, y, z) ∈ R3 x2 + y 2 + z 2 6 1, x > 0, y > 0, z > 0
(la parte de la esfera de centro en el origen de coordenadas y radio 1 que está contenida en el primer octante).
Veamos: primero integramos  sobre z y después sobre la proyección
de S en el plano XY , πXY (S) que en este
caso coincidirá con S 0 = (x, y)| x2 + y 2 6 1, x > 0, y > 0 . De esta forma se tiene
√ 
1−x2 −y 2
ZZZ ZZ Z
 
xyzdxdydz =  xyzdz  dxdy
 
S S0
0

ZZ  z= 1−x2 −y 2
xyz 2
= dxdy
S0 2 z=0
ZZ
xy(1 − x − y 2 )
2
= dxdy
0 2
S √ 
Z1 Z1−x2
 xy(1 − x2 − y 2 ) 
=  dy  dx
2
0 0

Z1
x(x2 − 1)2 1
= dx =
8 48
0

2.2.1. Integrales triples en coordenadas cilı́ndricas

Recordemos que las coordenadas cilı́ndricas (r, θ, z) de un punto en el espacio representan con (r, θ) a las co-
ordenadas polares de la proyección del punto en el plano XY y z el valor de la coordenada en el eje OZ. En
algunas ocasiones expresar en coordenadas cilı́ndricas la función y el recinto sobre el que calculamos la integral
triple tiene notables ventajas, como veremos en el ejemplo que desarrollaremos a continuación. Sólo basta tener
en cuenta que ZZZ ZZZ
f (x, y, z)dxdydz = ϕ(r, θ, z)rdrdθdz
D D

Ejemplo. Vamos a calcular empleando el cambio a coordenadas cilı́ndricas la integral triple


ZZZ
x2 yzdxdydz,
D

siendo D = (x, y, z) ∈ R3 x2 + y 2 6 1, 0 6 z 6 1, x > 0, y > 0 .

Primero de todo conviene observar la evidente


 ventaja que proporciona el nuevo sistema
de coordenadas en la
expresión del recinto, ya que se tiene D = (r, θ, z)| 0 6 r 6 1, 0 6 θ 6 π2 , 0 6 z 6 1 , presentando las mismas
ventajas operativas para la integral triple que presentaba el paralelepı́pedo (el caso más simple con el que nos
podı́amos encontrar). Ya solo nos queda efectuar el cambio de variable recordando que x = r cos θ, y = r sen θ.
Veamos:
ZZZ ZZZ
x2 yzdxdydz = r 3 (cos2 θ)(sen θ)zrdrdθdz
D D
214 MATEM ÁTICAS

ZZZ
= r 4 (cos2 θ)(sen θ)zdrdθ
  π D
 
Z1 Z1 Z2
  4 2  
=   r (cos θ)(sen θ)zdθ  dr  dz
0 0 0
 1 
Z 
Z1 3
θ= π2
 cos θ
= −r 4 z dr  dz
3 θ=0
0 0
 
Z1 Z1 4
=  r zdr  dz
3
0 0
Z1  r=1 Z1
r5 z z 1
= dz = dz =
15 r=0 15 30
0 0

2.2.2. Integrales triples en coordenadas esféricas

Recordemos que un punto P de R3 , está totalmente determinado por sus coordenadas esféricas (ρ, ϕ, θ) donde
ρ indica la longitud de OP, ϕ el ángulo que forma el plano determinado por OZ y P con el plano OXZ y θ el
ángulo que forma la recta OP con el eje OZ, teniéndose además las siguientes igualdades que relacionan las
coordenadas esféricas con las cartesianas rectangulares

x = ρ sen θ cos ϕ,
y = ρ sen θ sen ϕ,
z = ρ cos θ.

Al igual que sucedı́a con las coordenadas cilı́ndricas, en determinadas ocasiones, bien sea por la expresión del pro-
pio recinto o por la propia función, nos conviene usar este sistema de coordenadas en detrimento de las cartesianas
o cilı́ndricas. Tendremos no obstante que tener en cuenta lo siguiente:
ZZZ ZZZ
f (x, y, z)dxdydz = g(ρ, θ, ϕ)ρ2 sen θdρdθdϕ.
D D

Ejemplo. Vamos a calcular ZZZ


xyzdxdydz
S

donde

S = (x, y, z) ∈ R3 x2 + y 2 + z 2 6 1, x > 0, y > 0, z > 0 .
Se tiene
ZZZ ZZZ
xyzdxdydz = (ρ sen θ cos ϕ)(ρ sen θ sen ϕ)(ρ cos θ)ρ2 sen θdρdθdϕ
S
ZZZ S

= ρ5 (sen3 θ cos θ)(cos ϕ sen ϕ)dρdθdϕ.


S

Observa quela gran ventaja que presenta en este ejercicio el nuevo sistema de coordenadas es la expresión del
recinto S = (ρ, θ, ϕ)| 0 6 ρ 6 1, 0 6 θ 6 π2 , 0 6 ϕ 6 π2 , que produce el siguiente efecto a la hora de calcular
C ÁLCULO INTEGRAL EN VARIAS VARIABLES 215

la integral triple:
ZZZ
ρ5 (sen3 θ cos θ)(cos ϕ sen ϕ)dρdθdϕ =

π
 π S
 
Z1 Z2 Z2
  5 3  
  ρ (sen θ cos θ)(cos ϕ sen ϕ)dθ  dϕ dρ =
0 0 0
 π 
Z1 Z2 5
 ρ 
 cos ϕ sen ϕdϕ dρ =
4
0 0

Z1
ρ5 1
dρ = .
8 48
0

2.2.3. Cálculo de volúmenes usando integrales triples

Al igual que usábamos las integrales dobles para calcular el área de determinados recintos planos, se puede utilizar
la expresión ZZZ
dxdydz
D

para calcular el volumen de un recinto D ⊂ R3 .

Ejemplo. Vamos a calcular el volumen de una esfera de centro el origen y radio R. Sabemos que podemos
expresar los puntos de la esfera que estén en el primer octante como
n π πo
S = (ρ, θ, ϕ)| 0 6 ρ 6 R, 0 6 θ 6 , 0 6 ϕ 6
2 2
(en coordenadas esféricas). Por simetrı́a, el volumen que nos piden vendrá expresado por
ZZZ ZZZ
8 dxdydz = 8 ρ2 sen θdρdθdϕ
S
 π π
S
 
ZR Z2 Z2
   
= 8   ρ2 sen θdθ  dϕ dρ
0 0 0
 π 
ZR Z2 ZR 2
  ρ π 4
= 8  ρ2 dϕ dρ = 8 dρ = πR3 .
2 3
0 0 0

3. ACTIVIDADES DE APLICACIÓN DE LOS CONOCIMIENTOS

A.7.1. Calcular las siguientes integrales dobles:


ZZ

(a) sen2 x cos ydxdy donde D = (x, y) ∈ R2 0 6 x 6 π, 0 6 y 6 π
D
216 MATEM ÁTICAS

ZZ

(b) xydxdy donde D = (x, y) ∈ R2 0 6 x 6 3, 1 6 y 6 2
D
ZZ

(c) x2 ydxdy donde D = (x, y) ∈ R2 x + y 6 1, x > 0, y > 0
D
ZZ

(d) sen(x + y)dxdy donde D = (x, y) ∈ R2 0 6 x 6 π
2,0 6y6π
D

A.7.2. Calcular las siguientes integrales dobles:


ZZ n o
2
xydxdy donde D = (x, y) ∈ R2 x > 0, y > 0, xa2 + yb2 6 1
2
(a)
ZZ D n o
2 2
(b) (x2 − y 2 )dxdy donde D = (x, y) ∈ R2 xa2 + yb2 6 1
ZZ D
1

2

(c) (x+y)2 dxdy donde D = (x, y) ∈ R x > 2, y > 2, x + y 6 3
D
ZZ
A.7.3. Calcular xydxdy donde D es el triángulo de vértices A(0, −1), B(1, 0) y C(0, 3).
D

A.7.4. Calcular las siguientes integrales dobles:


ZZ

2 2 2

1+x2 +y 2 dxdy donde D = (x, y) ∈ R x 6 1, y 6 1, x + y > 1
xy
(a)
ZZ D
1

2

(b) (1+x+y)2 dxdy donde D = (x, y) ∈ R x > 0, y > 0, x + y 6 1
ZZ D p

(c) xy x2 + 4y 2 dxdy donde D = (x, y) ∈ R2 x > 0, y > 0, x2 + y 2 6 1
D

A.7.5. Calcular, usando la integral doble, la expresión del área encerrada por la elipse de ecuación

x2 y2
2
+ 2 = 1.
a b

A.7.6. Calcular las siguientes integrales triples:


ZZZ

(a) zdxdydz donde D = (x, y, z) ∈ R3 x + z 6 1, x > 0, z > y 2 , y > 0
ZZZ D

(b) yzdxdydz donde D = (x, y, z) ∈ R3 y > x2 , z > 0, y + z 6 1
ZZZ D n o
2 2
xyzdxdydz donde D = (x, y, z) ∈ R3 xa2 + yb2 + zc2 6 1
2
(c)
ZZZ D

(d) z 2 dxdydz donde D = (x, y, z) ∈ R3 x2 + y 2 + z 2 6 1
D

A.7.7. Dadas la integrales sucesivas


     
Z1 Z2x Z1 Zx x+y
Z
 f (x, y)dy  dx y   f (x, y, z)dz  dy  dx,
0 x 0 0 0

exprésarlas respectivamente como una integral doble y otra triple de f (x, y) y f (x, y, z) sobre los recintos
apropiados.
A.7.8. Calcular las integrales introducidas en el ejercicio anterior para las funciones f (x, y) = ex+y y f (x, y, z) =
ex+y+z .
A.7.9. Calcular usando la integral triple una fórmula que calcule el volumen encerrado por el elipsoide de ecua-
ción
x2 y2 z2
2
+ 2 + 2 = 1.
a b c
C ÁLCULO INTEGRAL EN VARIAS VARIABLES 217

4. BIBLIOGRAFÍA DEL CAPÍTULO

J. DE BURGOS Cálculo Infinitesimal, Editorial Alhambra. Capı́tulo 6.


R.E. LARSON, R.P. HOSTETLER y B.H. EDWARDS Calculo y Geometrı́a Analı́tica, 5a ed., McGraw-Hill, Ma-
drid, 1995. Capı́tulo 16.
E. LINES Principios de Análisis Matemático, Editorial Reverté SA. Capı́tulo 31.
J. RIVAUD Ejercicios de Análisis, Editorial Aguilar. Capı́tulo 9.
J. STEWART Cálculo, 2a ed. Grupo Editorial Iberoamérica, México, 1994. Capı́tulo 13.

5. PREGUNTAS DE EVALUACIÓN
ZZ

E.7.1. Calcular (x2 + y 2 )dxdy donde D = (x, y) ∈ R2 x2 + y 2 6 1
D
ZZZ

E.7.2. Calcular √ 1
dxdydz donde D = (x, y, z) ∈ R3 x2 + y 2 + z 2 6 1
D x2 +y 2

E.7.3. Hallar el volumen del recinto limitado superiormente por la esfera de ecuación x2 + y 2 + z 2 = 4, inferior-
mente por el plano XY y lateralmente por el cilindro x2 + y 2 = 1.
218 MATEM ÁTICAS

ANOTACIONES

....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
CAPÍTULO 8
ESTADÍSTICA DESCRIPTIVA UNIDIMENSIONAL

1. INTERROGANTES CENTRALES DEL CAPÍTULO

a) ¿Qué es la Estadı́stica?

b) ¿Cómo se organizan los datos de una muestra extraı́da de una población?

c) ¿Cuáles son las representaciones gráficas más adecuadas para extraer conclusiones sobre el comportamiento
real de la variable estadı́stica?

d) ¿Cómo se sintetiza la información aportada por un conjunto de datos en una serie de valores que nos fijen
el comportamiento global del experimento aleatorio?

2. CONTENIDOS FUNDAMENTALES DEL CAPÍTULO

2.1. Introducción a la Estadı́stica

2.1.1. Definición de Estadı́stica

Estadı́stica: ciencia que se ocupa de recoger, clasificar, representar y resumir los datos de muestras, y de hacer
inferencias (extraer conclusiones) acerca de las poblaciones de las que éstas proceden.

1. Estadı́stica descriptiva: parte de la estadı́stica que se ocupa de recoger, clasificar, representar y resumir los
datos de las muestras.

2. Estadı́stica inferencial: parte de la estadı́stica que se ocupa de llegar a conclusiones (inferencias) acerca de
las poblaciones a partir de los datos de las muestras extraı́das de ellas.

2.1.2. Conceptos generales

− Población: conjunto de individuos con propiedades comunes sobre los que se realiza una investigación de
tipo estadı́stico.
220 MATEM ÁTICAS

− Muestra: subconjunto de la población.

− Tamaño muestral: número de individuos que forman la muestra.

− Muestreo: proceso de obtención de muestras representativas de la población.

− Variable: propiedad o cualidad que puede manifestarse bajo dos o más formas distintas en un individuo de
una población.

− Modalidades, categorı́as o clases: distintas formas en que se manifiesta una variable.

− Las variables se clasifican en:

1. Cuantitativas: se expresan numéricamente. Se clasifican en:


(a) Discretas: toman valores numéricos aislados, por lo que, fijados dos consecutivos, no pueden
tomar ningún valor intermedio.
(b) Continuas: pueden tomar cualquier valor dentro de unos lı́mites, por lo que entre dos valores
cualesquiera, por próximos que sean, siempre pueden encontrarse valores intermedios.
2. Cualitativas: no se expresan numéricamente. Se clasifican en:
(a) Ordinales: admiten una ordenación de menor a mayor aunque sus resultados no son numéricos.
(b) Nominales: no admiten una ordenación de menor a mayor.

2.2. Tabulación de los datos

2.2.1. Variables cualitativas

Ejemplo de recogida (no ordenada) de unos datos cualitativos:

francés inglés francés inglés francés alemán ruso español francés inglés
francés inglés español francés español francés alemán inglés español inglés
inglés español inglés francés español ruso alemán francés inglés español
alemán inglés español francés alemán inglés inglés inglés español francés

• Frecuencia absoluta de la clase i-ésima: fi =número de observaciones contenidas dentro de ella.


fi
• Frecuencia relativa de la clase i-ésima: hi = , siendo n el número total de observaciones.
n
• Porcentaje de la clase i-ésima: %i = 100 hi .

• Se verifican las propiedades siguientes:

f1 + f2 + · · · + fk = n,
h1 + h2 + · · · + hk = 1,
%1 + %2 + · · · + %k = 100,

siendo k el número de clases.

• Distribución de frecuencias: tabla conteniendo las distintas clases y las frecuencias correspondientes a cada
una de ellas.
ESTAD ÍSTICA DESCRIPTIVA UNIDIMENSIONAL 221

La distribución de frecuencias de los datos cualitativos del ejemplo anterior es:

clases fi hi %i
0
alemán 5 0 125 120 5
español 9 00 225 220 5
francés 11 00 275 270 5
inglés 13 00 325 320 5
ruso 2 00 050 50 0
suma 40 10 000 1000 0

2.2.2. Variables discretas

Ejemplo de recogida (no ordenada) de unos datos cuantitativos discretos:

14 13 3 13 7 12 13 11 13 12 11 13
7 10 12 13 14 11 13 12 4 12 10 13
9 12 13 11 13 14 10 12 11 13 15 9
12 11 13 10 13 11 12 5 9 12 13 15

Los mismos criterios usados para el caso cualitativo sirven para el caso cuantitativo discreto a la hora de presentar
tabularmente los datos. Además se pueden calcular:

• Frecuencia absoluta acumulada de la clase i-ésima: Fi = f1 + f2 + · · · + fi =número de individuos que


caen dentro de dicha clase o cualquier clase anterior (una vez ordenadas las clases de menor a mayor).
Fi
• Frecuencia relativa acumulada de la clase i-ésima: Hi = h1 + h2 + · · · + hi = .
n

La distribución de frecuencias de los datos cuantitativos discretos del ejemplo anterior es:

xi fi hi Fi Hi
3 1 00 0208 1 00 0208
4 1 00 0208 2 00 0417
5 1 00 0208 3 00 0625
7 2 00 0417 5 00 1042
9 3 00 0625 8 00 1667
10 4 00 0833 12 00 2500
11 7 00 1458 19 00 3958
12 10 00 2083 29 00 6042
13 14 00 2917 43 00 8958
14 3 00 0625 46 00 9583
15 2 00 0417 48 10 0000

2.2.3. Variables continuas

Los datos procedentes de una variable continua se pueden tabular de la misma forma que los datos de una variable
discreta, pero lo usual en el caso de variables continuas es dividir el intervalo de valores posibles en intervalos
222 MATEM ÁTICAS

contiguos llamados intervalos de clase. Una vez agrupados los datos en intervalos, éstos se tabulan de forma
análoga al caso de variables discretas.

• Número adecuado de intervalos (Regla de Sturges):


k = 1 + 30 322 log n,
siendo n el número total de observaciones.
• Amplitud del intervalo de clase (`i , `i+1 ): d = `i+1 − `i .
`i + `i+1
• Marca de clase del intervalo (`i , `i+1 ): xi = .
2

Ejemplo de recogida (no ordenada) de unos datos cuantitativos continuos:

30 9 40 1 40 2 30 2 10 6
20 5 10 1 80 1 50 1 20 7
10 9 70 3 20 4 40 9 10 6
50 0 20 5 60 5 10 9 50 2
60 3 10 2 30 3 10 8 40 4

Pasos para la agrupación en intervalos de clase de igual amplitud:

1o ) Se calcula el recorrido de las observaciones (ver el apartado 2.5.1.):


R = xmax − xmin = 80 1 − 10 1 = 7 .

2o ) El número de intervalos de clase que podemos tomar para agrupar los datos es:
k = 1 + 30 322 log 25 = 50 64 ,
que aproximamos por el número natural siguiente: k = 6.

3o ) Por tanto, la amplitud de cada intervalo es:


R 7
d== = 10 1667 .
k 6
Al no ser exacta, aproximamos la cantidad anterior a un número ligeramente superior; por ejemplo, d =
10 17.

Como la amplitud de los intervalos la hemos tomado un poco mayor de lo que se obtiene en un principio, entonces
el nuevo recorrido es:
R0 = número de intervalos · amplitud = 6 · 10 17 = 70 02 .
Como el recorrido original es 7, entonces sobra 00 02, con lo cual repartimos este sobrante restando la mitad a la
observación mı́nima y sumando la otra mitad a la observación máxima; es decir:
xmin − 00 01, xmax + 00 01 ,
con lo que obtenemos los seis intervalos de clase determinados por los valores siguientes:
xmin − 00 01 = 10 10 − 00 01 = 10 09,
10 09 + 10 17 = 20 26,
20 26 + 10 17 = 30 43,
30 43 + 10 17 = 40 60,
40 60 + 10 17 = 50 77,
50 77 + 10 17 = 60 94,
60 94 + 10 17 = 80 11 = xmax + 00 01 .
ESTAD ÍSTICA DESCRIPTIVA UNIDIMENSIONAL 223

Los intervalos son: (10 09, 20 26], (20 26, 30 43], (30 43, 40 60], (40 60, 50 77], (50 77, 60 94], (60 94, 80 11]. Agrupamos,
pues, los datos en los intervalos anteriores y damos su distribución de frecuencias en la tabla siguiente:

(li , li+1 ] xi fi hi Fi Hi
0 0 0 0
(1 09, 2 26] 1 675 7 0 28 7 00 28
(20 26, 30 43] 20 845 6 00 24 13 00 52
(30 43, 40 60] 40 015 4 00 16 17 00 68
(40 60, 50 77] 50 185 4 00 16 21 00 84
(50 77, 60 94] 60 355 2 00 08 23 00 92
(60 94, 80 11] 70 525 2 00 08 25 10 00

La agrupación en intervalos de clase también puede hacerse con una variable discreta si el número de datos
distintos es muy grande.

2.3. Representaciones gráficas

2.3.1. Variables cualitativas

1. Diagrama de barras: se sitúan en el eje horizontal las clases y sobre cada una de ellas se levanta un segmento
rectilı́neo (o un rectángulo) de altura igual a la frecuencia (absoluta o relativa) de cada clase (Figura 8.1 (a)).
2. Gráfico de sectores: se divide el área de un cı́rculo en sectores circulares de ángulos proporcionales a las
frecuencias absolutas de las clases (Figura 8.1 (b)).

ruso
5% alemán
13%

14

12

10 inglés
32%
español
23%
8

0
francés
alemán español francés inglés ruso 27%

a) Diagrama de barras de frecuencias absolutas b) Gráfico de sectores

Figura 8.1: Representaciones gráficas de los datos cualitativos de la sección 2.2.1.

2.3.2. Variables cuantitativas con datos no agrupados en intervalos

1. Diagrama de barras: igual que en el caso de variables cualitativas (Figura 8.2 (a)).
2. Polı́gono de frecuencias: se sitúan los puntos que resultan de tomar en el eje horizontal los distintos valores
de la variable y en el eje vertical sus correspondientes frecuencias (absolutas o relativas), uniendo después
los puntos mediante segmentos rectilı́neos (Figura 8.2 (b)).
224 MATEM ÁTICAS

3. Gráfico de frecuencias acumuladas: es la representación gráfica de las frecuencias acumuladas (absolutas


o relativas), para todo valor numérico. Indiquemos que la frecuencia acumulada (absoluta o relativa) de
un valor numérico que no aparezca en la distribución de frecuencias es igual a la frecuencia acumulada
(absoluta o relativa) de la observación inmediatamente anterior (ordenadas de menor a mayor). Por tanto, el
gráfico de frecuencias acumuladas siempre tiene forma de “escalera” (Figura 8.2 (c)).

14
00 30
12
00 25
10

8 00 20

6 00 15
4
00 10
2
00 05
0
0 2 4 6 8 10 12 14 16 00 00
a) Diagrama de barras de frecuencias ab- 0 2 4 6 8 10 12 14 16
solutas b) Polı́gono de frecuencias relativas
50

40

30

20

10

0
0 2 4 6 8 10 12 14 16
c) Gráfico de frecuencias absolutas acumu-
ladas

Figura 8.2: Representaciones gráficas de los datos cuantitativos discretos de la sección 2.2.2.

2.3.3. Variables cuantitativas con datos agrupados en intervalos

1. Histograma de frecuencias: se sitúan en el eje horizontal los intervalos de clase y sobre cada uno se levanta
un rectángulo de área proporcional a la frecuencia absoluta.

(a) Si todos los intervalos tienen la misma amplitud, entonces basta con hacer los rectángulos con una
altura igual a la frecuencia absoluta (Figura 8.4 (a)).
(b) Si los intervalos tienen distinta amplitud, la construcción del histograma presenta una importante va-
riación. Una vez marcados sobre el eje horizontal los extremos de los intervalos, hay que calcular la
altura de los rectángulos de forma que su área sea igual o proporcional a la frecuencia absoluta del
intervalo. Veámoslo con un ejemplo.
Sea la siguiente distribución de frecuencias:
ESTAD ÍSTICA DESCRIPTIVA UNIDIMENSIONAL 225

intervalo fi
[0, 3] 11
(3, 50 5] 10
(50 5, 60 5] 2
(60 5, 8] 1
(8, 10] 1

Recordemos que la fórmula del área de un rectángulo es base × altura y consideremos que los
rectángulos del histograma van a tener un área igual a la frecuencia absoluta. Por ejemplo, para averi-
guar la altura del primer rectángulo, tenemos en cuenta que la base es igual a 3 y el área del rectángulo
ha de ser igual a 11, por lo que la altura debe ser igual a 11/3 = 30 6667. Procediendo de forma
análoga con el resto de los intervalos, se tiene que el histograma de la distribución de frecuencias dada
por la tabla anterior es la Figura 8.3.

0
0 3 50 5 60 5 8 10

Figura 8.3: Histograma (intervalos de distinta amplitud)

2. Polı́gono de frecuencias: se sitúan los puntos que resultan de tomar en el eje horizontal las marcas de clase
de los intervalos y en el eje vertical sus correspondientes frecuencias (absolutas o relativas), uniendo después
los puntos mediante segmentos rectilı́neos (Figura 8.4 (b)).

3. Polı́gono de frecuencias acumuladas: se sitúan los puntos que resultan de tomar en el eje horizontal los ex-
tremos superiores de los intervalos de clase y en el eje vertical sus correspondientes frecuencias acumuladas
(absolutas o relativas), uniendo después los puntos mediante segmentos rectilı́neos (Figura 8.4 (c)).

2.4. Medidas de posición

Son valores que nos sirven para indicar la posición alrededor de la cual se distribuyen las observaciones. Sólo se
calculan cuando la variable es cuantitativa.

2.4.1. Moda

La denotaremos por Mo . No tiene que ser única.


226 MATEM ÁTICAS

7 7

6 6

5 5

4 4

3 3

2 2

1 1

0 0
10 09 20 26 30 43 40 60 50 77 60 94 80 11 00 505 10 675 20 845 40 015 50 185 60 355 70 525 80 695
a) Histograma (intervalos de la misma amplitud) b) Polı́gono de frecuencias absolutas
25

20

15

10

0
10 09 20 26 30 43 40 60 50 77 60 94 80 11
c) Polı́gono de frecuencias absolutas acumuladas

Figura 8.4: Representaciones gráficas de los datos cuantitativos continuos de la sección 2.2.3.

1. Datos no agrupados en intervalos.


Mo es el dato (o datos) con mayor frecuencia absoluta.
2. Datos agrupados en intervalos.
Intervalo modal: el que tiene mayor frecuencia absoluta. No tiene que ser único.

(a) Intervalo modal no único.


Las modas son las marcas de clase de los intervalos modales.
(b) Intervalo modal único.
• Intervalos de la misma amplitud.
fi − fi−1
Mo = `i + (`i+1 − `i ) ,
2fi − fi−1 − fi+1
donde (`i , `i+1 ] es el intervalo modal, fi es su frecuencia absoluta, fi−1 es la frecuencia absoluta
del intervalo anterior al modal, y fi+1 es la frecuencia absoluta del intervalo posterior al modal.
• Intervalos de distinta amplitud.
ki − ki−1
Mo = `i + (`i+1 − `i ) ,
2ki − ki−1 − ki+1
donde (`i , `i+1 ] es el intervalo modal, ki es la altura del rectángulo del histograma que tiene
de base al intervalo modal, ki−1 es la altura del rectángulo del histograma que tiene de base al
intervalo anterior al modal, y ki+1 es la altura del rectángulo del histograma que tiene de base al
intervalo posterior al modal.
ESTAD ÍSTICA DESCRIPTIVA UNIDIMENSIONAL 227

2.4.2. Mediana

La denotaremos por Me . Es el valor que tiene la propiedad de dejar a su izquierda el 50% de las observaciones y
a su derecha el 50% restante, siempre que hayamos ordenado los datos de menor a mayor. Por tanto, la frecuencia
absoluta acumulada de la mediana es igual a n/2, siendo n el número total de datos.

1. Datos no agrupados en intervalos.


(a) Si en la distribución de frecuencias no aparece ninguna frecuencia absoluta acumulada igual a n/2
entonces se toma como mediana el valor cuya frecuencia absoluta acumulada sea la más próxima a
n/2 por exceso. Un caso en que esto ocurre es cuando el número total de datos es impar; en cuyo caso
también se puede hallar la mediana como el dato central, una vez que los datos están ordenados de
menor a mayor.
Por ejemplo, sea la distribución de frecuencias siguiente:
xi fi Fi
2 2 2
4 3 5
6 5 10
8 3 13
En este caso se verifica que n/2 = 13/2 = 60 5, por lo que no hay ningún dato cuya frecuencia
acumulada sea igual a n/2. Entonces, se toma como mediana el siguiente dato; es decir, el dato cuya
frecuencia acumulada es 10. Por tanto, Me = 6. Esto se puede observar más claramente si recurrimos
al gráfico de frecuencias absolutas acumuladas, que es la Figura 8.5.

13

10

60 5

0
0 2 4 6 8 10

Figura 8.5: Gráfico de frecuencias absolutas acumuladas

(b) Si en la distribución de frecuencias aparece la frecuencia absoluta acumulada igual a n/2 entonces
ocurre que hay todo un intervalo [a, b) de valores cuya frecuencia absoluta acumulada es igual a n/2.
En este caso se toma como mediana el valor Me = a+b 2 .
Para que esto ocurra es necesario que n sea par; en cuyo caso también se puede calcular la mediana
ordenando los datos de menor a mayor, y luego hallando el punto medio de los dos datos centrales.
Por ejemplo, sea la distribución de frecuencias siguiente:
xi fi Fi
2 1 1
4 5 6
6 4 10
8 2 12
228 MATEM ÁTICAS

Todos los valores del intervalo [4, 6) tienen la frecuencia absoluta acumulada igual a n/2 = 6, de
forma que la mediana es Me = 4+6 2 = 5. Esto se puede observar más claramente si recurrimos al
gráfico de frecuencias absolutas acumuladas, que es la Figura 8.6.

12

10

1
0
0 2 4 6 8 10

Figura 8.6: Gráfico de frecuencias absolutas acumuladas

2. Datos agrupados en intervalos.


Intervalo mediano: intervalo que contiene a la mediana. Es el primer intervalo cuya frecuencia absoluta
acumulada (Fi ) es igual o mayor que n/2.

n
2 − Fi−1
Me = `i + (`i+1 − `i ) ,
fi

donde (`i , `i+1 ] es el intervalo mediano, fi es su frecuencia absoluta y Fi−1 es la frecuencia absoluta
acumulada del intervalo anterior al mediano.

2.4.3. Percentil o cuantil

El percentil (o cuantil) al r% es aquel valor que deja a su izquierda el r% de las observaciones y a su derecha el
(100-r)% restante, siempre que hayamos ordenado los datos de menor a mayor. Se suele denotar por Pr (o por
Cr ).

El cálculo de los percentiles se hace de modo similar al cálculo de la mediana, teniendo en cuenta que el percentil
al r% verifica que su frecuencia absoluta acumulada es igual a:
nr
.
100
Cuando los datos están agrupados en intervalos de clase, la fórmula del percentil al r% es:
nr
− Fi−1
Pr = `i + 100 (`i+1 − `i ) ,
fi

donde (`i , `i+1 ] es el intervalo que contiene a Pr , fi es su frecuencia absoluta y Fi−1 es la frecuencia absoluta
acumulada del intervalo anterior.

Algunos percentiles especiales son:


ESTAD ÍSTICA DESCRIPTIVA UNIDIMENSIONAL 229

• Cuartiles: Primer cuartil = Q1 = P25 , Segundo cuartil = Q2 = P50 = M e y Tercer cuartil = Q3 = P75 .

• Deciles: Primer decil = D1 = P10 , Segundo decil = D2 = P20 , . . ., Noveno decil = D9 = P90 .

2.4.4. Media aritmética

Si x1 , x2 , . . . , xn son los n valores de la muestra, su media aritmética es:


x1 + x 2 + · · · + x n
x= .
n

Si los valores de los datos son x1 , x2 , . . . , xk , y ellos aparecen con frecuencias absolutas respectivas f1 , f2 , . . .,
fk (con f1 + f2 + · · · + fk = n) entonces la expresión de la media aritmética es:

X
k
xi fi
x1 f1 + x2 f2 + · · · + xk fk i=1
x= = .
n n

Si los datos están agrupados en intervalos de clase, la fórmula de la media aritmética es la misma, salvo que xi
representa la marca de clase del intervalo i−ésimo.

Dado que la media aritmética es la más común, en adelante la llamaremos sólo media.

Si disponemos de los datos de toda la población, entonces representamos la media aritmética por la letra griega µ
(que se lee mu).

Propiedades de la media

1. Si yi = a + bxi , siendo a y b constantes, entonces la media de la nueva variable es y = a + bx.

2. Si yi = xi − x, entonces y = 0.

Cálculo de la media por codificación (para datos agrupados en intervalos de la misma amplitud)

Si a es la marca de clase del intervalo central (o una de las centrales, cuando el número de ellos es par) y b es igual
a la amplitud de los intervalos, entonces realizamos la transformación siguiente:
xi − a
zi = ,
b
para todas las marcas de clase xi , y luego hallamos la media z. Como xi = a + bzi entonces por la propiedad 3
se cumple que la media deseada es x = a + bz.

2.4.5. Otras medias

De los otros tipos de medias, la de mayor interés práctico es la media ponderada. Ésta consiste en asignar a cada
valor xi de los datos un peso pi que depende de su importancia relativa bajo algún criterio. La definición de la
230 MATEM ÁTICAS

media ponderada es:


X
k
xi p i
x1 p 1 + x 2 p 2 + · · · + xk p k i=1
xp = = k .
p1 + p2 + · · · + pk X
pi
i=1

Si los datos de la muestra son x1 , x2 , . . . , xk y ellos aparecen con frecuencias absolutas respectivas f1 , f2 , . . ., fk
(con f1 + f2 + · · · + fk = n), entonces se definen:

• Media geométrica:
q
n
xg = xf11 xf22 · · · xfkk .

• Media cuadrática: v
u k
uX
r u x2i fi
u
x21 f1 + x22 f2 + · · · + x2k fk t i=1
xc = = .
n n

• Media armónica:
n n
xa = = k .
f1
+
f2
+ ···+
fk X fi
x1 x2 xk x
i=1 i

En las tres definiciones anteriores, si los datos están agrupados en intervalos entonces xi representa la marca de
clase del intervalo i-ésimo.

Fijada una muestra cualquiera, siempre se verifica:

xa 6 xg 6 x 6 xc .

2.5. Medidas de dispersión

Son valores que miden el grado de separación de las observaciones entre sı́ o con respecto a ciertas medidas de
posición. Sólo se calculan cuando la variable es cuantitativa.

2.5.1. Recorrido

Es una medida de dispersión global que se define como la diferencia entre la observación mayor, xmax , y la
observación menor, xmin , y se denota por R; es decir:

R = xmax − xmin .

Si el recorrido es pequeño entonces los datos están poco dispersos.


ESTAD ÍSTICA DESCRIPTIVA UNIDIMENSIONAL 231

2.5.2. Recorrido intercuartı́lico

Se denota por RI y se define como la diferencia entre el tercer cuartil y el primer cuartil; es decir:

RI = Q3 − Q1 .

Si el recorrido intercuartı́lico es pequeño entonces los datos están cerca de la mediana; en caso contrario, los datos
están alejados de ella.

2.5.3. Desviación mediana

Si los datos de la muestra son x1 , x2 , . . . , xk y ellos aparecen con frecuencias absolutas respectivas f1 , f2 , . . ., fk
(con f1 + f2 + · · · + fk = n), entonces:

X
k
|xi − Me |fi
i=1
DMe = .
n

Si los datos están agrupados en intervalos, xi representa la marca de clase del intervalo i−ésimo.

Cuando DMe es pequeña, entonces los datos están cerca de la mediana. En caso contrario, los datos están alejados
de la mediana.

2.5.4. Mediana de las desviaciones absolutas respecto de la mediana

La mediana de las desviaciones absolutas respecto de la mediana (M DA) es la mediana de los valores absolutos
de las diferencias entre los valores de la muestra y la mediana de todos los datos. Para determinar M DA se calcula
la mediana de todos los datos (Me ); se hallan las desviaciones de los datos respecto de la mediana:

x1 − Me , x2 − Me , . . . , xn − Me ,

se toman los valores absolutos para eliminar los signos:

|x1 − Me |, |x2 − Me |, . . . , |xn − Me | ,

y luego se calcula la mediana de estos valores.

Cuando M DA es pequeña, entonces los datos están cerca de la mediana. En caso contrario, los datos están
alejados de la mediana.

Si los datos están agrupados en intervalos, en vez de calcular M DA se calcula DMe , pues su interpretación
descriptiva es la misma.
232 MATEM ÁTICAS

2.5.5. Desviación media

Si los datos de la muestra son x1 , x2 , . . . , xk y ellos aparecen con frecuencias absolutas respectivas f1 , f2 , . . ., fk
(con f1 + f2 + · · · + fk = n), entonces:

X
k
|xi − x|fi
i=1
Dx = .
n
Si los datos están agrupados en intervalos, xi representa la marca de clase del intervalo i−ésimo.

Cuando Dx es pequeña, entonces los datos están cerca de la media. En caso contrario, los datos están alejados de
la media.

2.5.6. Varianza y desviación tı́pica

Si los datos de la muestra son x1 , x2 , . . . , xk y ellos aparecen con frecuencias absolutas respectivas f1 , f2 , . . ., fk
(con f1 + f2 + · · · + fk = n), entonces se definen:

• Varianza (algunos autores la llaman varianza sesgada):

X
k X
k
(xi − x)2 fi x2i fi
s2x = i=1
= i=1
− x2 .
n n

• Desviación tı́pica: raı́z cuadrada de la varianza:


v v
u k u k
uX uX
u 2
(xi − x) fi u x2i fi
u u
t i=1 t i=1
sx = = − x2 .
n n

• Cuasivarianza (algunos autores la llaman varianza insesgada, varianza corregida o sólo varianza):
!
Xk Xk
2 2
(xi − x) fi xi fi − nx2
Sx2 = i=1
= i=1
.
n−1 n−1

• Cuasidesviación tı́pica: raı́z cuadrada de la cuasivarianza:


v v !
u k u k
uX u X
u 2
(xi − x) fi u 2
xi fi − nx2
u u
t i=1 t i=1
Sx = = .
n−1 n−1

En consecuencia, la varianza y la cuasivarianza están relacionadas de la siguiente forma:

(n − 1)Sx2 = ns2x ,

por lo cual se puede calcular una de ellas a partir de la otra.


ESTAD ÍSTICA DESCRIPTIVA UNIDIMENSIONAL 233

Si los datos están agrupados en intervalos de clase, las fórmulas anteriores son las mismas, salvo que xi representa
la marca de clase del intervalo i−ésimo.

Cuando la desviación tı́pica (o la cuasidesviación tı́pica) es pequeña, entonces los datos están cerca de la media.
En caso contrario, los datos están alejados de la media.

Si disponemos de los datos de toda la población, la varianza se denota por σ 2 y la desviación tı́pica por σ (letra
griega que se lee sigma).

Propiedad de la varianza

Si yi = a + bxi , siendo a y b constantes, entonces la varianza de la nueva variable es s2y = b2 s2x y por tanto la
desviación tı́pica es sy = |b|sx .

Cálculo de la varianza por codificación (para datos agrupados en intervalos de la misma amplitud)

Si a es la marca de clase del intervalo central (o una de las centrales, cuando el número de ellos es par) y b es igual
a la amplitud de los intervalos, entonces realizamos la transformación siguiente:
xi − a
zi =
b
y después calculamos la varianza de la nueva variable, s2z . Como xi = a + bzi entonces la varianza deseada es
s2x = b2 s2z y por tanto la desviación tı́pica es sx = |b|sz .

2.5.7. Coeficiente de variación

sx sx
CV = ó CV = 100% .
|x| |x|

Algunos autores sustituyen sx por Sx en la fórmula anterior. Este coeficiente nos sirve para comparar la disper-
sión relativa de dos muestras distintas. La muestra que tenga un coeficiente de variación más grande es la más
heterogénea (sus datos están más dispersos).

2.6. Momentos

Si los datos de la muestra son x1 , x2 , . . . , xk y ellos aparecen con frecuencias absolutas respectivas f1 , f2 , . . ., fk
(con f1 + f2 + · · · + fk = n), entonces se definen:

• Momento de orden k respecto del origen:


X
k
xki fi
i=1
ak = para k = 1, 2, 3, . . . .
n

• Momento de orden k respecto de la media:


X
k
(xi − x)k fi
i=1
mk = para k = 1, 2, 3, . . . .
n
234 MATEM ÁTICAS

Algunos casos particulares son:

a1 = x = media.
m1 = 0.
m2 = s2x = varianza.

Desarrollando el binomio (xi − x)k se puede comprobar que existe una relación entre los momentos respecto al
origen y los momentos respecto de la media; por ejemplo:

m2 = a2 − a21
m3 = a3 − 3a2 a1 + 2a31
m4 = a4 − 4a3 a1 + 6a2 a21 − 3a41

2.7. Medidas de forma

A través de las representaciones gráficas (histogramas, diagramas de barras, etc.) podemos hacernos una idea
sobre la forma de las distribuciones, pero también resulta importante cuantificar esta caracterı́stica a través de las
medidas de forma.

Figura 8.7: Curva normal

Las caracterı́sticas bajo-ancho, alto-estrecho se miden respecto de una curva modelo llamada curva Normal (véase
la Figura 8.7). Esta curva es la representación gráfica de la siguiente función:

1 1 x−µ 2
y= √ e− 2 ( σ )
σ 2π

donde x, µ y σ son números reales, siendo además σ > 0; e es la base de los logaritmos neperianos (e =
20 718281829 . . .) y π es la relación de la longitud de una circunferencia a su diámetro (π = 30 141592654 . . .).

Para cada par de valores de µ y σ tendremos una curva Normal distinta. Es decir, tenemos una familia de curvas.
Pero todas ellas coinciden en algunas propiedades, como, por ejemplo:

a) Tiene un único máximo para x = µ.

b) Es simétrica respecto al eje vertical que pasa por x = µ.

c) Se acerca asintóticamente al eje horizontal. En otras palabras, se acerca más y más a ese eje, tanto por la
derecha como por la izquierda, sin llegar a tocarlo en ningún punto.
ESTAD ÍSTICA DESCRIPTIVA UNIDIMENSIONAL 235

2.7.1. Asimetrı́a

Se dice que una distribución presenta una asimetrı́a positiva o por la derecha cuando su polı́gono de frecuencias
(absolutas o relativas) es similar a la Figura 8.8 (a). Análogamente, se dice que una distribución presenta una
asimetrı́a negativa o por la izquierda cuando su polı́gono de frecuencias (absolutas o relativas) tiene una forma
parecida a la Figura 8.8 (b). Diremos que una distribución presenta simetrı́a cuando su polı́gono de frecuencias
(absolutas o relativas) es similar a la Figura 8.7.

(a) Distribución asimétrica por la derecha (b) Distribución asimétrica por la izquierda

Figura 8.8: Asimetrı́a

Para las distribuciones unimodales, como medida de asimetrı́a se suele utilizar el coeficiente de asimetrı́a de
Pearson, que se define por la expresión:
x − Mo
CA = ,
sx
que permite distinguir los casos:

a) CA = 0 (distribución simétrica),

b) CA > 0 (distribución asimétrica por la derecha),

c) CA < 0 (distribución asimétrica por la izquierda).

Cuando la distribución no es unimodal no se puede emplear el anterior coeficiente, por lo que se introduce el
coeficiente de asimetrı́a de Fisher, que viene dado por:
m3
g1 = ,
s3x

que permite distinguir los casos:

a) g1 = 0 (distribución simétrica),

b) g1 > 0 (distribución asimétrica por la derecha),

c) g1 < 0 (distribución asimétrica por la izquierda).

2.7.2. Apuntamiento

Si el polı́gono de frecuencias (absolutas o relativas) es análogo a la curva Normal, entonces se dice que la dis-
tribución es mesocúrtica (véase la Figura 8.7); si es más elevado y estrecho que la curva Normal, entonces se
llama distribución leptocúrtica (véase la Figura 8.9 (a)); y si es menos elevado y más ancho que la curva Normal,
entonces se llama distribución platicúrtica (véase la Figura 8.9 (b)).
236 MATEM ÁTICAS

(a) Distribución muy apuntada o leptocúrtica (b) Distribución poco apuntada o platicúrtica

Figura 8.9: Apuntamiento

Como medida del apuntamiento se utiliza el coeficiente de curtosis, dado por:


m4
g2 = − 3,
s4x
permitiendo distinguir los casos:

a) g2 = 0 (distribución mesocúrtica),
b) g2 > 0 (distribución leptocúrtica),
c) g2 < 0 (distribución platicúrtica).

3. ACTIVIDADES DE APLICACIÓN DE LOS CONOCIMIENTOS

A.8.1. La tabla siguiente muestra la puntuación obtenida por los alumnos de primero de una facultad en un examen
“tipo test” realizado en una determinada asignatura:

60 3 70 2 60 8 70 4 80 2 90 3 40 6 50 3 50 9 60 7
70 6 60 8 50 8 40 9 40 7 40 6 50 7 60 8 70 8 90 1
30 9 40 8 50 6 50 8 70 1 80 4 90 1 40 8 50 5 60 3
40 8 50 7 60 8 70 3 70 5 70 6 80 1 80 8 70 5 90 5
50 7 60 6 70 3 50 6 40 7 30 9 30 8 40 7 50 1 50 8
70 3 60 5 60 8 60 9 50 8 50 3 60 7 70 8 60 9 40 7

a) Agrupar los datos en los siguientes intervalos: [0,5) (suspenso), [5,7) (aprobado), [7,9) (notable) y
[9,10) (sobresaliente). A partir de esta agrupación hacer lo siguiente:
b) Dibujar el histograma de frecuencias absolutas.
c) Hallar la moda, la media y la mediana.

A.8.2. La tabla siguiente muestra los salarios de 34 trabajadores elegidos al azar en una determinada empresa.

salario mensual (en pts) número de trabajadores


20000 1
30000 3
40000 3
50000 15
60000 6
70000 2
80000 4
ESTAD ÍSTICA DESCRIPTIVA UNIDIMENSIONAL 237

Hacer el diagrama de barras de frecuencias absolutas y el gráfico de frecuencias acumuladas absolutas.


Calcular la mediana y la desviación mediana. ¿Están los datos cerca de la mediana?

A.8.3. Los varones entre 20 y 60 años que contrajeron matrimonio durante el año 1961 en España presentan la
siguiente distribución por edades.

edad número de varones


[20,25] 41000
(25,30] 123000
(30,35] 44000
(35,40] 13000
(40,50] 7000
(50,60] 3000

Dibujar el polı́gono de frecuencias acumuladas absolutas. Calcular la moda, la mediana, los cuartiles, el
segundo decil y el percentil al 37 por ciento. Calcular la desviación media y deducir si los datos están cerca
de la media.

A.8.4. Se ha revisado un lote de 1000 piezas esmaltadas, obteniéndose el número de defectos de cada pieza, lo
que se indica en la siguiente tabla:

no de defectos frecuencia
0 600
1 310
2 75
3 13
4 2

Hacer el polı́gono de frecuencias absolutas. Determinar la media y la desviación tı́pica. Deducir si los datos
están cerca de la media.

A.8.5. Un fabricante de calzado quiere conocer la distribución de las tallas de los zapatos demandados por los
hombres. Elige una muestra aleatoria de 50 hombres obteniendo los siguientes resultados.

talla número de hombres


37 2
38 3
39 5
40 8
41 11
42 7
43 6
44 5
45 3

Se desea obtener:

a) El diagrama de barras y el gráfico de frecuencias acumuladas.


b) La media, moda y mediana.
c) La mediana de las desviaciones absolutas respecto de la mediana. ¿Están los datos cerca de la media-
na?
d) La desviación tı́pica. ¿Están los datos cerca de la media?
e) El coeficiente de asimetrı́a de Pearson.
238 MATEM ÁTICAS

A.8.6. Un alumno “muy previsor”quiere escoger una asignatura de la que dan clases dos profesores diferentes
A y B. Según datos del pasado año, la nota media de los alumnos que tuvieron el profesor A fue de 60 1
y la desviación tı́pica fue 00 95. En el curso del profesor B, la media fue 50 2 y la desviación tı́pica 20 2.
Suponiendo que puede elegir al profesor ¿qué profesor debe elegir y por qué, según desee:
a) aprobar “sin demasiadas complicaciones’”?
b) conseguir la nota más alta?
A.8.7. A una competición de tiro concurren seis tiradores, A, B, C, D, E y F, en tres modalidades de tiro, que
llamaremos 1, 2 y 3. El número de blancos obtenidos por cada uno, en cada modalidad de tiro, puede verse
en la siguiente tabla.

tirador 1 2 3
A 44 29 12
B 44 27 13
C 46 28 13
D 43 27 17
E 47 25 14
F 46 26 15

Aparte de haber un primer premio en cada modalidad, el jurado debe conceder un premio especial al tirador
que considere “globalmente mejor”, lo cual es motivo de arduas discusiones (¿por qué?). Un miembro del
jurado dice que “basándose en Estadı́stica” este premio debe ser para el tirador D. ¿Por qué?
A.8.8. Una empresa debe cubrir un cierto número de puestos de trabajo de dos tipos, A y B. Se somete a los
aspirantes a dos pruebas, ambas puntuadas de 0 a 50, diseñadas para valorar sus aptitudes en uno y en otro
tipo de trabajo. En la prueba A la media de calificaciones ha sido 28 y la desviación tı́pica 30 4. En la prueba
B la media ha sido 24 y la desviación tı́pica 20 1. ¿Qué tipo de puesto de trabajo asignaremos a un aspirante
que hubiese obtenido 33 puntos en la prueba A y 28 en la B?
A.8.9. a) Sea {x1 , x2 , . . . , x100 } una muestra de media aritmética 21’5 y sean x101 = 22, x102 = 19, x103 =
200 5 tres observaciones más. Calcular la media aritmética de la nueva muestra {x1 , x2 , . . . , x100 , x101 , x102 , x1
b) Sea x̄ la media aritmética de la muestra {x1 , x2 , . . . , xn } y sea ȳ la media aritmética de la muestra
{y1 , y2 , . . . , ym }. ¿Cuál será la media aritmética de la unión de ambas muestras?

A.8.10. Se preguntó a varias personas, elegidas al azar, el número de periódicos distintos que leı́an trimestralmen-
te, y se obtuvieron las siguientes respuestas:

Número de periódicos 0 1 2 3 4 5 6 7
Número de personas 7 13 18 15 11 6 4 2

Determinar la distribución de frecuencias relativas, acumuladas absolutas y acumuladas relativas. Hacer el


diagrama de barras de frecuencias absolutas, el polı́gono de frecuencias relativas y el gráfico de frecuencias
acumuladas absolutas. Hallar las medidas de posición, dispersión y forma e interpretar los resultados.
A.8.11. Se considera la variable cuantitativa peso, en kilogramos, de una muestra de 25 alumnos de una determi-
nada facultad:
530 5 550 5 530 0 760 5 520 5
510 5 560 0 730 5 510 0 490 5
570 0 530 0 720 0 520 5 510 5
680 5 680 0 650 0 530 0 680 5
530 5 550 5 530 0 510 5 530 0

Agrupar los datos en intervalos de la misma amplitud. Con los datos agrupados en intervalos: determinar
la distribución de frecuencias absolutas, relativas, acumuladas absolutas y acumuladas relativas. Hacer
el histograma de frecuencias absolutas, el polı́gono de frecuencias relativas y el polı́gono de frecuencias
acumuladas absolutas. Hallar las medidas de posición, dispersión y forma e interpretar los resultados.
ESTAD ÍSTICA DESCRIPTIVA UNIDIMENSIONAL 239

A.8.12. A continuación se dan los datos correspondientes al tiempo de espera (en minutos) hasta que son atendidos
40 personas que visitan una determinada caja de ahorros:

11 13 15 20 21 24 17 9 10 12
20 18 16 14 13 11 10 13 15 19
24 20 21 22 18 16 11 14 8 6
15 18 19 20 17 15 16 13 12 14

Agrupar los datos en intervalos. Con los datos agrupados en intervalos: determinar la distribución de fre-
cuencias absolutas, relativas, acumuladas absolutas y acumuladas relativas. Hacer el histograma de frecuen-
cias absolutas y el polı́gono de frecuencias acumuladas relativas. Hallar las medidas de posición, dispersión
y forma e interpretar los resultados.

A.8.13. Los datos siguientes corresponden al sueldo (en miles de pesetas) de una muestra de 25 empleados de
una determinada empresa.

sueldo número de
(en miles de pesetas) empleados
[90,100] 12
(100,110] 7
(110,120] 4
(120,130] 2

Determinar la distribución de frecuencias relativas, acumuladas absolutas y acumuladas relativas. Hacer el


histograma de frecuencias absolutas y el polı́gono de frecuencias relativas. Hallar las medidas de posición,
dispersión y forma e interpretar los resultados.

4. ACTIVIDADES PRÁCTICAS DEL CAPÍTULO

4.1. Introducción

La práctica se va a realizar con el programa STATISTIX for Windows, versión 1.0 (en inglés). Para ejecutar el
programa debemos acceder a la carpeta STATISTIX y ejecutar el programa STATISTIX. Una vez en el programa,
aparecerá la pantalla de la Figura 8.10, con un menú en la parte superior que, de ahora en adelante, denominaremos
menú principal (File Edit Data Statistics Preferences Window Help).

Todas las opciones del menú principal son ellas mismas menús, los cuales ofrecen variadas posibilidades de
manipulación de datos y de procedimientos estadı́sticos.

El menú File incluye procedimientos para abrir y grabar ficheros de datos, ası́ como la posibilidad de importar
datos de otros programas o exportar datos en un formato predeterminado. El menú Data proporciona muchas fun-
ciones para manipular la hoja de datos, incluyendo las transformaciones de variables. El menú Statistics lista
varios menús que nos permiten realizar análisis estadı́sticos básicos y avanzados. Por último, el menú Windows
lista las ventanas abiertas dentro de STATISTIX, que incluye la hoja de datos y las ventanas de resultados.

Para salir del programa debe seleccionarse la opción Exit del menú File. Los usuarios de Windows 95 o
Windows NT pueden abandonar el programa pulsando el botón de la esquina superior derecha de la ventana
(botón × ).
240 MATEM ÁTICAS

Figura 8.10: Pantalla inicial del programa donde aparece, además del menú principal del programa, una tabla en
blanco donde introduciremos los datos.

Antes de realizar ninguna operación es necesario tener un conjunto de datos en uso, para lo cual podemos pro-
ceder de dos formas distintas: o introducirlos directamente a través del teclado o recuperar un fichero con datos
previamente almacenado.

4.2. Entrada de datos a través del teclado

Los datos en STATISTIX pueden ser considerados tablas de datos, donde las columnas se denominan varia-
bles y las filas casos. En primer lugar debemos declarar las variables, para lo que seleccionamos las opciones
Data|Insert|Variables. Antes de seguir adelante convendrı́a hacer una aclaración: cuando digamos que se
seleccionan varias opciones, como acabamos de hacer, se sobreentenderá que cada opción se encuentra en el
menú correspondiente a la opción anterior, salvo la primera opción que se encuentra en el menú principal. Una
vez elegidas las opciones anteriores aparece la ventana de introducción de variables (ver Figura 8.11).

Figura 8.11: Pantalla de STATISTIX para la introducción de nuevas variables.

En el recuadro New Variable Names debemos escribir los nombres de las variables y su tipo, ya que STATISTIX
distingue cuatro clases de datos: números reales, números enteros, fechas y cadenas de caracteres. Para indicar
ESTAD ÍSTICA DESCRIPTIVA UNIDIMENSIONAL 241

los tres últimos tipos, el nombre de la variable se acompaña (entre paréntesis) de las letras I, D o Sxx, donde xx
denota un número que indica la longitud máxima de las cadenas.

El nombre de una variable es una cadena de caracteres con una longitud variable entre uno y nueve caracteres,
debe comenzar con una letra y sólo puede estar formado por letras, números y el carácter de subrayado. Solamente
hay unas pocas palabras (como CASE, PI, RANDOM, etc.) que no se pueden utilizar como nombres de variables ya
que están reservadas para otras tareas.

Supongamos que queremos introducir los datos de la siguiente tabla, que corresponde a una muestra de 25 alumnos
procedentes de la población formada por todos los alumnos matriculados en la asignatura “Estadı́stica” de una
determinada licenciatura de la Universidad de Murcia.

Fecha de Nacimiento Sexo Opinión Edad Altura Peso Nota


15/02/79 M 2 18 1.62 53.5 3.9
17/09/78 M 3 19 1.64 55.5 4.1
23/05/77 M 1 20 1.63 53.0 4.2
02/01/72 V 1 25 1.78 76.5 3.2
31/10/75 M 0 22 1.62 52.5 1.6
12/09/77 M 1 20 1.65 51.5 2.5
09/11/77 M 1 20 1.64 56.0 1.1
21/12/78 V 4 19 1.74 73.5 8.1
16/06/78 M 3 19 1.63 51.0 5.1
12/07/78 M 2 19 1.61 49.5 2.7
05/08/77 M 1 20 1.64 57.0 1.9
03/04/78 M 3 19 1.62 53.0 7.3
19/02/76 V 2 21 1.75 72.0 2.4
14/05/78 M 3 19 1.66 52.5 4.9
29/06/77 M 2 20 1.63 51.5 1.6
17/09/78 V 4 19 1.70 68.5 5.0
23/03/73 V 2 24 1.72 68.0 2.5
22/10/78 V 3 19 1.74 65.0 6.5
01/09/78 M 1 19 1.66 53.0 1.9
09/07/78 V 3 19 1.71 68.5 5.2
12/10/78 M 3 19 1.65 53.5 6.3
13/11/74 M 2 23 1.66 55.5 1.2
25/04/77 M 2 20 1.64 53.0 3.3
28/07/78 M 3 19 1.60 51.5 1.8
15/11/78 M 2 19 1.61 53.0 4.4

Se ha realizado un experimento consistente en averiguar, de cada uno de los alumnos de la muestra, los siguientes
datos:

Fecha de Nacimiento: Está en el formato dd/mm/aa (dı́a/mes/año).


Sexo: M=Mujer, V=Varón.
Opinión: La opinión del alumno respecto de la asignatura está indicada según la siguiente equivalencia: 0=Mala,
1=Regular, 2=Normal, 3=Buena, 4=Excelente.
Edad: En años.
Altura: En metros.
Peso: En kilogramos.
242 MATEM ÁTICAS

Nota: La nota final de la asignatura es un número comprendido entre 0 y 10.

En el recuadro New Variable Names podemos declarar más de una variable, pero hemos de tener presente que
los nombres de las variables deben ir separados entre sı́ por un espacio en blanco. Entonces una forma posible de
declarar las variables anteriores serı́a la siguiente:

FechaNac(d) Sexo(s1) Opinion(i) Edad(i) Altura Peso Nota

Aparece entonces en la tabla de la pantalla los nombres de nuestras variables situados en la primera fila. Debajo
de cada una de las variables, excepto de las cadenas de caracteres, aparece una letra M mayúscula, indicando que
debemos completar dicha casilla. Para desplazarnos por la tabla de datos podemos utilizar la tecla de entrada
( ) o las flechas: ↑ y ↓ para desplazarnos por las columnas, y ← y → para hacerlo en la misma fila. Una vez
rellena, tendremos una tabla de datos como en la Figura 8.12.

4.3. Grabación y lectura de ficheros de datos

Una vez introducidos los datos, éstos pueden guardarse en un fichero para poder ser utilizados en cualquier otro
momento. En realidad, los datos deberı́an guardarse muy a menudo, no sólo cuando hayamos terminado de
introducirlos todos (¿Qué pasarı́a si tenemos que introducir 1000 datos y cuando ya hemos introducido 950 se
produce un corte de energı́a eléctrica?)

Para grabar los datos se seleccionan las opciones File|Save o File|Save As. Por defecto, el programa nos
ofrece almacenar el fichero en el directorio del programa (usualmente c:\sxw), pero podemos cambiar de direc-
torio y guardarlo donde deseemos. Para distinguir los archivos creados con STATISTIX debemos recordar que
tiene la extensión sx. Guardemos los datos anteriores en un archivo con nombre Datos1.sx para poder utilizarlos
en las prácticas siguientes.

Para leer unos datos previamente almacenados debemos seleccionar las opciones File|Open. Aparece una ven-
tana en la que hay que seleccionar la unidad, el directorio y el nombre del archivo que queremos leer. Una vez
realizado lo anterior volvemos a tener disponibles los datos (ver Figura 8.12).

Figura 8.12: Pantalla del programa donde aparece la tabla de datos Datos1.
ESTAD ÍSTICA DESCRIPTIVA UNIDIMENSIONAL 243

4.4. Edición y modificación de los datos

Una vez que tenemos disponibles los datos del archivo Datos1.sx, es posible que detectemos un error, o bien
que deseemos añadir nuevos datos y reorganizarlos. Todas estas operaciones se realizan seleccionando la opción
Data del menú principal.

Para modificar un dato nos situaremos sobre él con el ratón o bien utilizando las teclas ↑, ↓, ← y →. Este quedará
recuadrado y podremos modificarlo. Después de realizar cualquier modificación no hay que olvidar volver a
grabar nuestra tabla de datos. Cualquier modificación de un dato no surge efecto hasta que no es pulsada la tecla
de entrada ( ); en cualquier momento podemos abandonar la edición de una dato pulsando la tecla de escape
(ESC).

Si queremos añadir una nueva fila de datos (lo que denominamos un nuevo caso) basta con que nos situemos en
la primera fila disponible y comencemos a rellenar las diferentes casillas. Por el contrario, si deseamos borrar una
fila completa de la tabla, o varias filas, podemos proceder de dos formas distintas. La manera rápida de hacerlo es
seleccionar con el ratón las filas que deseamos eliminar (que deben ser contiguas) y pulsar la tecla Ctrl+X. La otra
forma de hacerlo es seleccionar las opciones Data|Delete|Cases y nos aparece una ventana (ver Figura 8.13)
solicitándonos los números de los casos primero y último que deseamos eliminar (se borrarán todos los casos entre
el primero y el último, ambos incluidos). Una vez han sido borrados los casos, se vuelven a renumerar los casos,
de forma que siempre sean consecutivos.

Figura 8.13: Pantalla del programa donde aparecen los casos que deseamos borrar. Debemos recordar que esto
mismo se puede realizar con el uso de teclas calientes; concretamente debemos marcar las filas y
pulsar Ctrl+X.

¿Qué ocurre si nos equivocamos al borrar los casos? Si no hemos guardado el archivo en el disco, podemos
volver a leer el archivo original de datos. Sin embargo, si las modificaciones ya han sido almacenadas entonces
sólo podemos insertar nuevos casos (lı́neas de la tabla) y volver a introducir los datos. Esto se consigue con las
opciones Data|Insert|Cases con lo cual el programa nos solicita que introduzcamos el número de casos que
queremos insertar y el caso por el que queremos comenzar (ver Figura 8.14).

Figura 8.14: Pantalla del programa que nos permite insertar nuevos casos.

Los datos numéricos se pueden introducir de muchas maneras y con diferentes grados de exactitud. Pensemos,
por ejemplo, en la altura. Como estamos considerando el metro como unidad de medida, es posible que aparezcan
datos de la forma 2, 1.8, 1.75 o incluso 1.625. Sin embargo, lo razonable es que todos los datos tengan un
formato común, por ejemplo 2 decimales. Esto se puede conseguir con las opciones Data|Column Formats
(ver Figura 8.15), que nos permite modificar el formato de las diferentes columnas, tanto numéricas como de
244 MATEM ÁTICAS

caracteres. En el caso de la variable ALTURA lo razonable es seleccionar el formato numérico Decimal con 3
dı́gitos significativos (Significant Digits).

Figura 8.15: Pantalla del programa que nos permite modificar el formato de las diferentes columnas (tanto
numéricas como de caracteres).

Otro problema que se nos puede plantear con los datos es la utilización de abreviaturas. Por ejemplo, en la columna
OPINION hemos utilizado 0, 1, 2, 3 y 4 para referirnos a ‘Mala’, ‘Regular’, ‘Normal’, ‘Buena’ y ‘Excelente’; sin
embargo, dentro de varios meses es posible que pensemos que dichos números se refieren a otros datos. Por tanto,
serı́a conveniente poder asignarle a cada valor de la variable su significado; en nuestro caso, 0=Mala, 1=Regular,
2=Normal y ası́ sucesivamente. Para ello debemos seleccionar las opciones Data|Labels|Value Labels y
rellenar los campos que nos ofrece (ver Figura 8.16). Por ejemplo, dentro de Define Label ponemos 4 en
Value y ‘Excelente’ en Label; para que la asignación sea efectiva debemos pulsar el botón I , con lo que se
almacena en la columna Value Labels.

Figura 8.16: Pantalla del programa que nos permite asignar etiquetas a los diferentes valores num éricos de una
variable. Esta posibilidad no está presente para variables de fechas y de caracteres.
ESTAD ÍSTICA DESCRIPTIVA UNIDIMENSIONAL 245

4.5. Edición y modificación de las variables

Hay ocasiones en que los datos están correctos pero no nos termina de convencer el nombre que le hemos dado
a las variables. También puede ocurrir que nos haya faltado una variable o, por el contrario, que hayamos intro-
ducido una variable de más. Para solucionar estos problemas se utilizan las opciones Data|Rename Variables,
Data|Insert|Variables y Data|Delete|Variables (ver Figuras 8.11 y 8.17).

Figura 8.17: Pantallas del programa que permiten renombrar o borrar una variable.

Sin embargo, el nombre de las variables no refleja toda la información necesaria. Por ejemplo, el peso no indica
(aunque se sobreentiende) que está computado en kilogramos y la altura está, como es fácil deducir, en metros.
Puede haber ejemplos en los que no sea tan fácil deducirlo; en estos casos, lo conveniente es ‘etiquetar’ las
variables. Para ello seleccionamos las opciones Data|Labels|Variable Labels y añadimos en metros y en
kilogramos a las variables ALTURA y PESO, respectivamente (ver Figura 8.18).

Figura 8.18: Pantalla del programa que permite etiquetar una variable.

Finalmente, otra modificación que podemos hacer con las variables es reordenarlas. Para ello seleccionamos las
opciones Data|Reorder Variables y nos aparece una ventana similar a la ventana Delete Variables de la
Figura 8.17. Ahora sólo es necesario ir seleccionando las variables en el nuevo orden.
246 MATEM ÁTICAS

Exponenciación A^B
Multiplicación A * B
División A / B
Suma A + B
Resta A - B

Tabla 8.1: Operaciones aritméticas que se pueden realizar con STATISTIX.

4.6. Transformación aritmética de variables

En la Tabla 8.1 se encuentran recogidas las expresiones aritméticas que están permitidas. Debemos tener presente
que las operaciones se evalúan de izquierda a derecha. Todas las expresiones entre paréntesis se evalúan antes que
las que están fuera de los paréntesis y ante varios operadores en el mismo nivel, el orden de preferencia (de mayor
a menor) es el que figura en la Tabla 8.1.

Para construir una nueva variable mediante transformaciones de otras ya existentes, debemos seleccionar las op-
ciones Data|Transformations (basta pulsar Ctrl+T) y nos aparece la pantalla de la Figura 8.19. En esta
ventana tenemos tres partes fundamentales: a la izquierda aparece la lista de variables existentes, a la derecha
aparecen las funciones internas, y en el centro está el lugar destinado a la definición de la nueva variable.

Figura 8.19: Pantalla del programa que permite definir nuevas variables (o modificar variables ya existentes) me-
diante operaciones.

La expresión de la transformación debe ser tecleada manualmente y sólo podemos hacer uso de las variables y de
las funciones internas para insertarlas en los lugares adecuados (pulsando los correspondientes botones I y J ).
Sólo está permitida una transformación, aunque ésta puede ocupar varias lı́neas.

Una vez hemos terminado de teclear la expresión, pulsamos en Go. Si STATISTIX encuentra un error en nuestra
expresión nos lo indica convenientemente. Entonces debemos editar nuestra expresión y corregir el error, pulsando
la tecla Go de nuevo.

Supongamos que la variable NUEVAVAR es la variable que queremos crear para que almacene la transformación.
Si la transformación consiste en la suma de otras tres variables (por ejemplo, A, B y C) entonces debemos escri-
bir dentro del recuadro Transformation Expression la instrucción NUEVAVAR = A+B+C. Como STATISTIX
admite cuatro tipos de variables, podemos indicar el tipo de NUEVAVAR de la forma usual.

Por ejemplo, con datos1.sx vamos a crear una nueva variable, que llamaremos PesoTip con los pesos tipifica-
dos. La transformación llamada tipificación consiste en restar a cada dato la media aritmética y después dividir por
la desviación tı́pica (o por la cuasidesviación tı́pica). Para ello, en el recuadro Transformation Expression
ESTAD ÍSTICA DESCRIPTIVA UNIDIMENSIONAL 247

escribimos: PesoTip=( Peso- MEAn( Peso ) )/ SD( Peso ). Cuando la expresión utiliza una variable, se puede es-
cribir su nombre o se puede trasladar dicho nombre desde el recuadro Variables. Análogamente, las expresiones
como MEAn (media aritmética) o SD (cuasidesviación tı́pica) se pueden teclear o se pueden seleccionar haciendo
doble clic sobre la expresión del recuadro Functions.

4.7. Medidas descriptivas de los datos

En primer lugar leemos el archivo que contiene los datos (datos1.sx) utilizando las opciones File|Open. En-
tonces nos aparece la tabla de datos de la Figura 8.20.

Figura 8.20: Pantalla del programa donde aparece la tabla de datos Datos1.

Para poder obtener las medidas descriptivas de una muestra de datos cuantitativos debemos seleccionar las opcio-
nes Statistics|Summary Statistics|Descriptive Statistics. Entonces nos aparece la ventana mos-
trada en la Figura 8.21.

Figura 8.21: Pantalla del programa que permite elegir las variables a las que vamos a calcular sus principales
medidas descriptivas.
248 MATEM ÁTICAS

En el recuadro Descriptive Variables seleccionamos las variables de las cuales queremos hallar las medidas
descriptivas y en el recuadro Statistics to Report seleccionamos las medidas descriptivas que queremos
calcular. El significado de las medidas descriptivas que aparecen viene dado en la Tabla 8.2.

N Número total de observaciones (n)


Missing Número de casos en los que se omite el valor de la variable
P
Sum Suma de todos los datos ( xi )
Mean Media aritmética (x)
SD Cuasidesviación tı́pica (S)
Variance Cuasivarianza (S 2 )

SE Mean S/ n
Conf. int. Intervalo de confianza para la media (no estudiado)
C.V. Coeficiente de variación modificado (S/|x|)
Median Mediana (Me )
Min/max Mı́nimo/máximo valor de la variable
Quartiles Cuartiles (Q1 y Q3 )
MAD Mediana de las desviaciones absolutas respecto de la mediana
Biased var. Varianza (s2 )
Skew Coeficiente de asimetrı́a
Kurtosis Coeficiente de curtosis o apuntamiento

Tabla 8.2: Significado de las medidas descriptivas que aparecen en el recuadro Statistics to Report de la
ventana Descriptive Statistics.

Figura 8.22: Pantalla del programa que muestra las medidas descriptivas seleccionadas de las variables elegidas.

Ejercicio. Calcula el número total de observaciones, la suma de todos los datos, la media aritmética, la cuasides-
viación tı́pica, la cuasivarianza , el coeficiente de variación modificado, la mediana, los valores máximo
y mı́nimo, los cuartiles y la varianza de la variable ALTURA. En la Figura 8.23 aparece la solución.

Una opción interesante consiste en calcular las medidas descriptivas de un subconjunto de datos de la muestra
original. Esto se consigue seleccionando la variable por la que queremos agrupar los datos, para lo cual debemos
escribir dicha variable en el recuadro Groupin Variable (0pt). En el ejercicio anterior podemos agrupar
según la variable OPINION y el resultado obtenido (seleccionando las medidas Mean, Median y Biased var.)
aparece en la Figura 8.24.

El programa nos permite calcular cualquier percentil, medida descriptiva que generaliza a la mediana. Para ello
debemos seleccionar las opciones Statistics|Summary Statistics|Percentiles. Posteriormente debe-
ESTAD ÍSTICA DESCRIPTIVA UNIDIMENSIONAL 249

Figura 8.23: Pantalla del programa que muestra las medidas descriptivas seleccionadas de la variable ALTURA.

mos indicar, en el recuadro Percentiles Variables, las variables a las cuales vamos a calcular los percentiles
y, en el recuadro Percentiles, aquellos que queremos determinar (ver Figura 8.25).

Ejercicio. Calcula el primer cuartil, el tercer cuartil y el segundo decil de la variable PESO.

4.8. Distribuciones de frecuencias

Con STATISTIX podemos calcular las distribuciones de frecuencias para una variable estadı́stica discreta o conti-
nua. El programa determina la frecuencia absoluta, el porcentaje (y por tanto la frecuencia relativa), la frecuencia
acumulada absoluta y el porcentaje acumulado (y por tanto la frecuencia relativa acumulada). Para conseguir la
distribución de frecuencias debemos seleccionar las opciones Statistics|Summary Statistics|Frequency
Distribution y nos aparece una ventana para seleccionar las variables estadı́sticas de las cuales queremos calcu-
lar sus distribuciones de frecuencias (ver Figura 8.26).

Si queremos agrupar los datos en intervalos de la misma amplitud, en el recuadro Bin Size (Optional) se
especifica el valor mı́nimo de las observaciones (Low), el valor máximo (High) y la amplitud de los intervalos
(Step). Hay que indicar que los intervalos son cerrados por la izquierda y abiertos por la derecha, salvo el último
que es cerrado por ambos lados. Si el recuadro Bin Size (Optional) se deja en blanco, entonces los datos no
se agruparán en intervalos. En la Figura 8.27 se muestra la distribución de frecuencias de la variable ALTURA (con
datos sin agrupar en intervalos).

Ejercicio. Determina la distribución de frecuencias de la variable PESO cuando los datos se agrupan en intervalos
de longitud 5 kilogramos comenzando en el valor 45 kilogramos.

4.9. Representaciones gráficas

Las posibilidades gráficas del programa STATISTIX son muy reducidas: sólo permite dibujar histogramas de fre-
cuencias absolutas y polı́gono de porcentajes acumulados, ya que trata las variables cuantitativas como si fuesen
250 MATEM ÁTICAS

Figura 8.24: Pantalla del programa que muestra las medidas descriptivas seleccionadas de la variable ALTURA pero
agrupadas según la variable OPINION.

continuas (aunque sean discretas). Para conseguir las representaciones gráficas debemos seleccionar las opcio-
nes Statistics|Summary Statistics|Histogram y nos aparece una ventana para seleccionar la variable
estadı́stica de la cual queremos representar gráficamente su histograma (ver Figura 8.28).

En el recuadro X-Axis (Optional) el usuario puede especificar el valor mı́nimo (Low), el valor máximo (High)
y la amplitud de los intervalos (Step) que se van a utilizar en el histograma. En el recuadro Graph Type podemos
seleccionar Histogram o Cumulative Distribution, según queramos dibujar el histograma de frecuencias
absolutas o el polı́gono de porcentajes acumulados, respectivamente. Finalmente, si queremos que se superponga
la gráfica de la curva normal, debemos seleccionar la opción Display Normal Curve. En la Figura 8.29 se
muestra el histograma de frecuencias absolutas para la variable EDAD.

Ejercicio. Dibuja el histograma de frecuencias absolutas y el polı́gono de porcentajes acumulados de la variable


ALTURA.

5. BIBLIOGRAFÍA DEL CAPÍTULO

CANDEL, J.; MARIN, A. y RUIZ, J.M. Estadı́stica aplicada I: Estadı́stica descriptiva. Barcelona: DM–PPU,
1991. Lecciones 1 y 2.

6. PREGUNTAS DE EVALUACIÓN

E.8.1. Para obtener información acerca del porcentaje de albúmina en el suero proteico de personas normales, se
analizaron muestras de 40 personas, entre 2 y 40 años de edad, con los siguientes resultados:
ESTAD ÍSTICA DESCRIPTIVA UNIDIMENSIONAL 251

Figura 8.25: Pantalla del programa que permite seleccionar las variables estadı́sticas para las que vamos a calcular
determinados percentiles.

Figura 8.26: Pantalla del programa que permite seleccionar las variables para las que vamos a calcular las distri-
buciones de frecuencias.

700 2 620 4 620 8 680 4 650 2 660 3 700 7 720 8 680 7 710 9
640 4 600 4 670 0 620 9 650 9 670 5 660 6 670 8 730 5 630 1
720 3 730 4 700 1 700 0 680 3 650 0 720 1 660 1 650 5 620 0
630 3 720 4 690 4 710 3 700 2 700 4 640 1 690 1 660 4 650 2

a) Agrupar los datos en intervalos de la misma amplitud aplicando la regla de Sturges. Hay que es-
pecificar los extremos de los intervalos, la marca de clase, frecuencia absoluta, frecuencia relativa,
frecuencia acumulada absoluta y frecuencia acumulada relativa. Calcular la media y la desviación
tı́pica, directamente y mediante codificación.
b) Agrupar de nuevo los datos sabiendo que la amplitud de los intervalos es 1.

E.8.2. Los siguientes datos corresponden al nivel de glucosa en sangre de diez niños:

56 62 63 65 65 65 65 68 70 72

a) Calcular la media, mediana y moda.


b) Calcular la desviación media e interpretar el resultado.
252 MATEM ÁTICAS

Figura 8.27: Pantalla del programa que muestra la distribución de frecuencias de la variable ALTURA.

Figura 8.28: Pantalla del programa que permite seleccionar la variable para la que vamos a representar su histo-
grama.

c) Calcular la desviación mediana e interpretar el resultado.

E.8.3. En un mismo examen de una asignatura, pasado a dos clases de 40 alumnos, se han registrado las siguientes
calificaciones:

2 3 7 5 4 6 7 5 6 7
clase 8 4 3 7 5 6 9 5 7 2
A 7 4 8 5 6 5 7 8 5 3
6 5 8 4 2 5 4 5 6 7
2 5 3 4 7 9 5 2 7 4
clase 8 3 5 8 7 9 3 2 4 1
B 10 9 4 8 6 9 3 3 7 1
2 8 6 7 3 6 9 7 4 8

Realizar un estudio estadı́stico de las calificaciones en cada clase y decir qué conclusiones pueden sacarse
de dicho estudio. ¿Son ambas clases muy similares por lo que respecta a la variable calificación, o por el
contrario son muy diferentes?
ESTAD ÍSTICA DESCRIPTIVA UNIDIMENSIONAL 253

Histogram
15

10
Frequency

0
18 19 20 21 22 23 24 25

EDAD

Figura 8.29: Pantalla del programa que muestra el histograma de frecuencias de la variable EDAD.

E.8.4. Los siguientes datos corresponden a los precios (en cientos de pesetas) de una colección de 30 libros.

27 40 12 3 30 16 20 21 30 12
45 18 25 22 35 24 37 12 21 7
35 17 21 27 14 15 25 45 12 24

a) Agrupar los datos en intervalos de la misma amplitud (mediante la regla de Sturges) y clasificarlos
en una nueva tabla que contenga la marca de clase, la frecuencia absoluta, la frecuencia relativa y la
frecuencia acumulada. Dibujar el histograma de frecuencias absolutas.
b) Calcular el séptimo decil. Compararlo con el valor que resultarı́a si lo hallásemos a partir de los datos
agrupados en intervalos.
c) Calcular un coeficiente de asimetrı́a e interpretarlo.

E.8.5. El número de veces que fueron consultados 30 artı́culos de investigación archivados en una hemeroteca
(durante el año pasado) viene dado por la siguiente tabla.

18 25 20 24 19 23 21 22 20 22
23 19 21 24 21 22 20 21 22 21
20 24 21 19 23 21 22 23 22 23

a) Calcular la mediana y la mediana de las desviaciones respecto de la mediana. Deducir si los datos
están cerca de la mediana.
b) Calcular la media y la desviación tı́pica. Deducir si los datos están cerca de la media.

E.8.6. a) Agrupar los datos del ejercicio anterior en intervalos de la misma amplitud y clasificarlos en una
nueva tabla en la que aparezca la marca de clase, la frecuencia absoluta y la frecuencia acumulada.
b) A partir de la agrupación en intervalos anterior, calcular de nuevo la media y la mediana. Comparar
estos dos nuevos valores con los resultados obtenidos en el ejercicio anterior (datos no agrupados en
intervalos).

E.8.7. El número de personas que visitan diariamente un centro de información fue observado durante 74 dı́as
elegidos al azar, y los resultados fueron:
254 MATEM ÁTICAS

no de personas 47 59 62 64 71 76 78 80
no de dı́as 4 6 10 17 16 10 7 4

a) Hacer el gráfico de frecuencias acumuladas absolutas.


b) Hallar la moda, la mediana y el recorrido intercuartı́lico. ¿Están los datos cerca de la mediana?
c) Calcular el coeficiente de curtosis e interpretar el resultado.

E.8.8. Las personas que aprobaron una determinada oposición tienen la siguiente distribución por edades:

edad [20,25] (25,30] (30,35] (35,40] (40,50] (50,60]


frecuencia 41 123 44 13 7 3

a) Calcular la edad media. ¿Es representativa de todos los datos?


b) Calcular la mediana. ¿Es representativa de todos los datos?
c) Hacer el polı́gono de frecuencias acumuladas absolutas.
ESTAD ÍSTICA DESCRIPTIVA UNIDIMENSIONAL 255

ANOTACIONES

....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
CAPÍTULO 9
ESTADÍSTICA DESCRIPTIVA BIDIMENSIONAL

1. INTERROGANTES CENTRALES DEL CAPÍTULO

a) Cuando sobre cada individuo se observan simultáneamente dos caracterı́sticas cuantitativas ¿cómo se orga-
nizan y representan gráficamente esos datos bidimensionales?
b) ¿Cómo se puede saber si dos variables estadı́sticas están relacionadas de forma lineal, exponencial, potencial
o parabólica?
c) ¿Se puede predecir el valor de una variable sabiendo el valor de otra variable que está relacionada con ella
de forma lineal, exponencial, potencial o parabólica?

2. CONTENIDOS FUNDAMENTALES DEL CAPÍTULO

2.1. Tabulación de los datos

Cuando sobre cada individuo de una población se observan simultáneamente dos caracterı́sticas cuantitativas, que
unidimensionalmente podrı́amos representar separadamente por las variables X e Y , entonces se dice que se está
observando una variable estadı́stica bidimensional y se representa por (X, Y ).

El conjunto de valores bidimensionales de la variable junto con sus frecuencias asociadas dará lugar a la corres-
pondiente distribución bidimensional de frecuencias.

En el caso de variables bidimensionales podemos distinguir dos tipos principales de tablas:

a) Tabulación en dos columnas (o en dos filas)

Si el número de datos bidimensionales es pequeño, los datos se disponen en dos columnas (o en dos filas)
sobre las que se emparejan los correspondientes valores unidimensionales de una misma realización de la
variable bidimensional, como se expresa en la tabla siguiente:

variable X variable Y
x1 y1
x2 y2
.. ..
. .
xn yn
ESTAD ÍSTICA DESCRIPTIVA BIDIMENSIONAL 257

X Y B1 B2 ··· Bj ··· Bk suma


A1 f11 f12 ··· f1j ··· f1k f1∗
A2 f21 f22 ··· f2j ··· f2k f2∗
.. .. .. .. .. ..
. . . . . .
Ai fi1 fi2 ··· fij ··· fik fi∗
.. .. .. .. .. ..
. . . . . .
Ar fr1 fr2 ··· frj ··· frk fr∗
suma f∗1 f∗2 ··· f∗j ··· f∗k n

Tabla 9.1: Tabla de doble entrada o de contingencia

b) Tabla de doble entrada o de contingencia

Si el número de observaciones bidimensionales es grande, clasificamos los n individuos de la muestra en


r clases (A1 , . . . , Ar ) respecto de la variable X, y en k clases (B1 , . . . , Bk ) respecto de la variable Y .
Entonces los datos suelen organizarse en una tabla como la Tabla 9.1, que se denomina tabla de doble
entrada o de contingencia.
En la Tabla 9.1, fij es el número de individuos que pertenecen a la clase Ai de la variable X y a la clase Bj
de la variable Y y se llama frecuencia absoluta conjunta de la clase Ai × Bj de la variable bidimensional
(X, Y ).
La frecuencia relativa conjunta de la clase bidimensional Ai × Bj es igual a:

fij
hij = . (9.1)
n

2.2. Distribuciones marginales y condicionadas. Independencia de variables

Supongamos que tenemos los datos bidimensionales organizados en una tabla de doble entrada como la Tabla 9.1.

La suma de las frecuencias absolutas conjuntas de la fila i−ésima, fi∗ , es igual al número de individuos en la clase
Ai de la variable X, independientemente del valor de Y , y se llama frecuencia absoluta marginal de la clase Ai
de la variable X:
fi∗ = fi1 + fi2 + · · · + fik .

La frecuencia relativa marginal de la clase unidimensional Ai es igual a:


fi∗
hi∗ = . (9.2)
n

Análogamente, la suma de las frecuencias absolutas conjuntas de la columna j−ésima, f∗j , es igual al número
de individuos en la categorı́a Bj de la variable Y , y se llama frecuencia absoluta marginal de la clase Bj de la
variable Y :

f∗j = f1j + f2j + · · · + frj .

La frecuencia relativa marginal de la clase unidimensional Bj es igual a:

f∗j
h∗j = . (9.3)
n
258 MATEM ÁTICAS

Si de la Tabla 9.1 consideramos la primera y la última columna obtenemos la distribución marginal de frecuencias
absolutas de la variable X:

X fi∗
A1 f1∗
.. ..
. .
Ai fi∗
.. ..
. .
Ar fr∗
suma n

Análogamente, si consideramos la primera y la última fila de la Tabla 9.1, obtenemos la distribución marginal de
frecuencias absolutas de la variable Y :

Y f∗j
B1 f∗1
.. ..
. .
Bj f∗j
.. ..
. .
Bk f∗k
suma n

Denotaremos por X/yj a la variable X condicionada a que Y tome el valor yj . La distribución de frecuencias
absolutas condicionadas de X/yj se obtiene de la Tabla 9.1 considerando la primera columna y la columna de la
clase Bj ; es decir:

X/yj fij
A1 f1j
.. ..
. .
Ai fij
.. ..
. .
Ar frj
suma f∗j

Por tanto, la frecuencia relativa de X ∈ Ai condicionada a que Y tome el valor yj es:

fij
hi/j = . (9.4)
f∗j

Análogamente, denotaremos por Y /xi a la variable Y condicionada a que X tome el valor xi . La distribución de
frecuencias absolutas condicionadas de Y /xi se obtiene de la Tabla 9.1 considerando la primera fila y la fila de la
clase Ai ; es decir:
ESTAD ÍSTICA DESCRIPTIVA BIDIMENSIONAL 259

Y /xi fij
B1 fi1
.. ..
. .
Bj fij
.. ..
. .
Bk fik
suma fi∗

En consecuencia, la frecuencia relativa de Y ∈ Bj condicionada a que X tome el valor xi es:

fij
hj/i = . (9.5)
fi∗

Teniendo en cuenta las fórmulas 9.4 y 9.5 se obtiene:

fij = hi/j f∗j = hj/i fi∗ .

Dividiendo por n tenemos:


fij f∗j fi∗
= hi/j = hj/i .
n n n
Y teniendo en cuenta 9.1, 9.2 y 9.3 se tiene:

hij = hi/j h∗j = hj/i hi∗ .

La variable X es independiente de la variable Y si las distribuciones de frecuencias relativas de X condicionada


a cualquier valor de Y son todas idénticas; es decir, no dependen del valor que tome la variable condicionante Y ;
es decir:
hi/1 = hi/2 = · · · = hi/k ∀i ,

lo que es equivalente a:
fi1 fi2 fij fik
= = ··· = = ··· = ∀i ,
f∗1 f∗2 f∗j f∗k
y por tanto:
fij fi1 + fi2 + · · · + fij + · · · + fik
= ∀i, j ,
f∗j f∗1 + f∗2 + · · · + f∗j + · · · + f∗k

lo que también se puede escribir como:


fij fi∗
= ∀i, j .
f∗j n

En consecuencia, la definición de independencia entre las variables X e Y es equivalente a la siguiente propiedad:

fi∗ f∗j
fij = ∀i, j ,
n

o su equivalente:
hij = hi∗ h∗j , ∀i, j ,

es decir, las frecuencias relativas conjuntas son iguales al producto de las correspondientes frecuencias relativas
marginales.
260 MATEM ÁTICAS

2.3. Representaciones gráficas

Los métodos para determinar la existencia y el grado de relación entre dos variables cuantitativas deben ser capaces
también de discriminar entre los tipos generales de relación que hay:

a) Se dice que dos variables cuantitativas X e Y mantienen una relación directa cuando los valores altos en
Y tienden a emparejarse con valores altos en X, los valores intermedios en Y tienden a emparejarse con
valores intermedios en X, y los valores bajos en Y tienden a emparejarse con valores bajos en X.
b) Se dice que dos variables cuantitativas X e Y mantienen una relación inversa cuando los valores altos en
Y tienden a emparejarse con valores bajos en X, los valores intermedios en Y tienden a emparejarse con
valores intermedios en X, y los valores bajos en Y tienden a emparejarse con valores altos en X.
c) Se dice que no hay relación entre dos variables cuantitativas cuando no existe un emparejamiento sistemático
entre ellas en función de sus valores.

En una buena representación gráfica conjunta de dos variables estadı́sticas cuantitativas debe apreciarse fácilmente
si existe relación entre las variables y de qué tipo es. Una representación gráfica que cumple esta condición es el
diagrama de dispersión, que también se puede llamar nube de puntos.

• Si los datos no están agrupados en intervalos (como en la tabla siguiente), entonces el diagrama de dispersión se
hace como se muestra en la Figura 9.1.

xi 61 118 57 123 125 122 122 85 85 85 83 78 76 76 73 70 97 107


yi 15 28 15 30 31 30 30 23 22 22 23 23 23 21 21 21 25 29

35

30

25

20

15

10

0 X
60 70 80 90 100 110 120 130

Figura 9.1: Diagrama de dispersión para datos no agrupados en intervalos

• Si los datos están agrupados en intervalos (como en la tabla siguiente), entonces el diagrama de dispersión se
hace como se muestra en la Figura 9.2.

X Y (0,10] (10,20] (20,30] (30,40] (40,50] suma


(25,75] 13 3 16
(75,125] 4 9 5 1 19
(125,175] 11 16 4 31
(175,225] 2 11 9 22
(225,275] 1 5 3 1 10
(275,325] 1 5 6
suma 17 26 38 22 1 104
ESTAD ÍSTICA DESCRIPTIVA BIDIMENSIONAL 261

50

40

30

20

10

0 X
25 75 125 175 225 275 325

Figura 9.2: Diagrama de dispersión para datos agrupados en intervalos

2.4. Covarianza

A partir de las distribuciones marginales de X y de Y se pueden calcular las medidas descriptivas de las variables
X eY.

De entre las medidas descriptivas bidimensionales, la más utilizada es la Covarianza entre X e Y que se calcula
de la siguiente forma:

1) Si los datos se tabulan en dos columnas (o dos filas), la covarianza entre X e Y es:
X
n X
n
(xi − x)(yi − y) xi yi
i=1 i=1
sxy = = − xy.
n n

2) Si los datos se organizan en una tabla de doble entrada como la Tabla 9.1, la covarianza entre X e Y es:

X
r X
k X
r X
k
(xi − x)(yj − y)fij xi yj fij
i=1 j=1 i=1 j=1
sxy = = − x y,
n n
donde xi es la marca de clase de la clase Ai , yj es la marca de clase de la clase Bj y fij es la frecuencia
absoluta conjunta de la clase bidimensional Ai × Bj .

Si en lugar de dividir por n dividimos por (n − 1) tenemos la la Cuasicovarianza o Covarianza modificada o


corregida entre X e Y ; cuya definición, por tanto, es la siguiente:

1) Si los datos se tabulan en dos columnas (o dos filas), la cuasicovarianza entre X e Y es:
X
n
(xi − x)(yi − y)
i=1
Sxy = .
n−1
262 MATEM ÁTICAS

2) Si los datos se organizan en una tabla de doble entrada como la Tabla 9.1, la cuasicovarianza entre X e Y
es:
Xr X k
(xi − x)(yj − y)fij
i=1 j=1
Sxy = ,
n−1
donde xi es la marca de clase de la clase Ai , yj es la marca de clase de la clase Bj y fij es la frecuencia
absoluta conjunta de la clase bidimensional Ai × Bj .

En consecuencia, la covarianza y la cuasicovarianza están relacionadas de la siguiente forma:


(n − 1)Sxy = nsxy .
Por tanto, se puede calcular una de ellas a partir de la otra.

La covarianza (y, por tanto, la cuasicovarianza) es capaz de discriminar entre los dos tipos de relación lineal pues:

a) si sxy > 0 entonces hay relación lineal directa entre X e Y ,


b) si sxy < 0 entonces hay relación lineal inversa entre X e Y , y
c) si sxy = 0 entonces no hay relación lineal entre X e Y .

2.5. Regresión y correlación. Coeficiente de determinación

La regresión consiste en sustituir la nube de puntos correspondiente a una distribución bidimensional por la función
matemática que mejor se ajuste a la nube de puntos. La correlación estima la “fuerza” con que las variables están
relacionadas.

La curva de regresión es la curva ideal hacia la que tienden los puntos del diagrama de dispersión.

El ajuste por el método de mı́nimos cuadrados consiste en lo siguiente:

Si tenemos una nube de puntos {(xi , yi ), i = 1, 2, . . . , n} y queremos ajustarle una curva cualquiera y =
f (x, a, b, . . .) con parámetros a, b, . . ., la determinación de éstos se hace minimizando la siguiente expresión:
X
n
D= [yi − f (xi , a, b, . . .)]2
i=1

Para saber si la curva y = f (x, a, b, . . .) se ajusta a los puntos {(xi , yi ), i = 1, 2, . . . , n} calculamos el coeficiente
de determinación:
X n
[yi − f (xi )]2
R2 = 1 − i=1
.
Xn
2
(yi − y)
i=1
Este coeficiente verifica:

1) 0 6 R2 6 1.
2) Si R2 = 1, entonces el ajuste es perfecto.
3) Si R2 = 0, entonces la función y = f (x) no se ajusta en absoluto a los puntos.
4) Cuanto más se aproxime R2 a 1, mejor es el ajuste.
ESTAD ÍSTICA DESCRIPTIVA BIDIMENSIONAL 263

2.6. Regresión y correlación lineal

2.6.1. Coeficiente de correlación lineal de Pearson

La covarianza carece de unos valores máximo y mı́nimo estables, comunes a todos los casos, que permitan su
interpretación directa. La solución a este problema consiste en dividir la covarianza por el producto de las desvia-
ciones tı́picas marginales. Este ı́ndice se conoce con el nombre de coeficiente de correlación lineal de Pearson, y
se denota por la letra r; o sea:
sxy
r= , (9.6)
sx sy
donde sx es la desviación tı́pica de la variable X y sy es la desviación tı́pica de la variable Y .

Si la tabulación de los datos se ha hecho en dos columnas, entonces una fórmula alternativa equivalente a la
expresión 9.6 es la siguiente:
! n !
Xn Xn X
n xi yi − xi yi
r=v i=1
!2 v
i=1 i=1
!2 .
u n u n
u X X
n u X X
n
tn x2i − xi tn yi2 − yi
i=1 i=1 i=1 i=1

La razón principal por la que la covarianza no puede considerarse un ı́ndice de dependencia lineal entre dos
variables es la dificultad de su valoración dado que carece de un máximo y un mı́nimo estables. Pero el coeficiente
de correlación lineal no tiene esa dificultad ya que este ı́ndice no puede valer más de 1 ni menos de −1, es decir:

−1 6 r 6 1 .

Además, la interpretación descriptiva de r es la siguiente:

a) Si r = 1 entonces existe una dependencia lineal directa exacta entre las variables X e Y . Los puntos del
diagrama de dispersión están sobre una lı́nea recta de pendiente positiva.
b) Si r = −1 entonces existe dependencia lineal inversa exacta entre X e Y . Los puntos del diagrama de
dispersión están sobre una lı́nea recta de pendiente negativa.
c) Si r = 0 entonces no existe dependencia lineal entre X e Y .
d) Cuanto más se aproxime r a −1 o a 1, más dependencia lineal existe entre X e Y . Cuando esto ocurra, el
diagrama de dispersión se aproxima a una lı́nea recta.
e) Cuanto más se aproxime r a 0, más independencia lineal existe entre X e Y . Cuando esto ocurra, el
diagrama de dispersión no se aproxima a una recta.
f) Si r es positivo, entonces al aumentar el valor de la variable X, aumenta el valor de la variable Y .
g) Si r es negativo, entonces al aumentar el valor de la variable X, disminuye el valor de la variable Y .

2.6.2. Recta de regresión mı́nimo cuadrática

La recta de regresión mı́nimo cuadrática de Y sobre X es la recta Ŷ = A + BX que mejor se ajusta (por el
método de mı́nimos cuadrados) a los puntos del diagrama de dispersión {(xi , yi ), i = 1, 2, . . . , n}. Esta recta nos
permitirá predecir Y a partir de los valores de X.
264 MATEM ÁTICAS

Tenemos que minimizar la expresión:


X
n
D(A, B) = [yi − (A + Bxi )]2 . (9.7)
i=1

Igualando a cero las derivadas parciales de D respecto de A y de B obtenemos las siguientes ecuaciones normales:
 P P
y = B xi + nA
P i P P
xi yi = B x2i + A xi
Si los datos están tabulados en dos columnas, las fórmulas de los coeficientes A y B que hacen mı́nima la expresión
9.7 son las siguientes:
! n !
X n Xn X
n xi yi − xi yi
i=1 i=1 i=1
B = !2 ,
X
n X
n
n x2i − xi
i=1 i=1

A = y − Bx.
Estas fórmulas son equivalentes a las siguientes:
sxy sy
B = =r ,
s2x sx

A = y − Bx.
Estas últimas fórmulas se pueden aplicar tanto si los datos están organizados en una tabla de dos columnas como
si lo están en una tabla de doble entrada.

Análogamente, la ecuación de la recta de regresión mı́nimo cuadrática de X sobre Y es:


sxy sx
X̂ = A∗ + B ∗ Y, donde B∗ = 2 = r , A∗ = x − B ∗ y .
sy sy

2.6.3. Coeficiente de determinación y coeficiente de correlación lineal. Predicción

En el caso del ajuste lineal (ajuste a una recta), el coeficiente de determinación es igual a:
s2xy
R2 = .
s2x s2y

Por tanto, (sólo en el caso del ajuste lineal) se cumple que el coeficiente de determinación es igual al cuadrado del
coeficiente de correlación lineal (R2 = r 2 ).

Si el coeficiente de correlación lineal está próximo a 1 o a −1 sabemos que existe bastante relación lineal entre las
variables X e Y y por tanto los puntos del diagrama de dispersión están próximos a la recta de regresión mı́nimo
cuadrática. En este caso, a partir de la ecuación de la recta de regresión de Y sobre X se puede calcular, de forma
aproximada, el valor de la variable Y cuando se conoce el valor de la variable X. Esta aproximación se conoce
también por el nombre de estimación, predicción o pronóstico. Similarmente, a partir de la ecuación de la recta
de regresión de X sobre Y se pueden predecir los valores de la variable X cuando se conocen los valores de la
variable Y .

Si el coeficiente de correlación lineal no está próximo a 1 o a −1, las ecuaciones de las rectas de regresión no nos
sirven para predecir los valores de una de las variables cuando se conocen los valores de la otra, pues los puntos
del diagrama de dispersión no están próximos a la recta de regresión mı́nimo cuadrática.
ESTAD ÍSTICA DESCRIPTIVA BIDIMENSIONAL 265

2.7. Regresión exponencial

Ajuste a la curva Y = AeBX por el método de mı́nimos cuadrados.

Tomando logaritmos neperianos: ln Y = ln A + BX.

Se hace el cambio: Y 0 = ln Y , A0 = ln A. Entonces Y 0 = A0 + BX, con lo que se reduce a un ajuste lineal entre
las variables Y 0 y X (se pueden utilizar las ecuaciones normales). La bondad del ajuste nos lo da el coeficiente de
determinación, que coincide con el cuadrado del coeficiente de correlación lineal entre Y 0 y X.

2.8. Regresión potencial

Ajuste a la curva Y = AX B por el método de mı́nimos cuadrados.

Tomando logaritmos decimales: log Y = log A + B log X.

Se hace el cambio: Y 0 = log Y , A0 = log A , X 0 = log X. Entonces Y 0 = A0 + BX 0 , con lo que se reduce


a un ajuste lineal entre Y 0 y X 0 (se pueden utilizar las ecuaciones normales). La bondad del ajuste nos lo da el
coeficiente de determinación, que coincide con el cuadrado del coeficiente de correlación lineal entre Y 0 y X 0 .

2.9. Regresión parabólica

Ajuste a la curva Y = A + BX + CX 2 por el método de mı́nimos cuadrados.


P
Minimizar D(A, B, C) = [yi − (A + Bxi + Cx2i )]2 .

Simplificando se obtiene:
 P P P
 P yi = An + B xi + C x2i
P P 2 P
xi yi = A xi + B xi + C x3i
 P P P P
x2i yi = A x2i + B x3i + C x4i

La bondad del ajuste a la curva Y = A + BX + CX 2 nos lo da el coeficiente de determinación:


P
2 [yi − (A + Bxi + Cx2i )]2
R =1− P .
(yi − y)2

3. ACTIVIDADES DE APLICACIÓN DE LOS CONOCIMIENTOS

A.9.1. Se está estudiando la relación existente entre los años de estudios realizados por los padres (X) y los años
de estudios realizados por los hijos (Y ). En una muestra de tamaño 7 se obtienen los siguientes resultados:
266 MATEM ÁTICAS

xi yi
12 12
10 8
6 6
16 11
8 10
9 8
12 11

Dibujar el diagrama de dispersión o nube de puntos. Hallar la covarianza, sxy , entre las dos variables. Hallar
el coeficiente de correlación lineal r. Hallar la ecuación de la recta de regresión mı́nimo cuadrática de Y
sobre X. Predecir el número de años de estudio de un hijo cuyo padre ha estudiado 14 años. Decir si esta
predicción es fiable. Hallar la ecuación de la recta de regresión mı́nimo cuadrática de X sobre Y . Predecir
el número de años de estudio de un padre cuyo hijo ha estudiado 15 años.

A.9.2. Determinar el grado de dependencia existente entre los años de estudio completados (X) y las faltas de
ortografı́a cometidas en un dictado (Y ) tal y como se encontró en la siguiente muestra de 10 entrevistados.

xi 10 3 12 11 6 8 14 9 10 2
yi 1 7 2 3 5 4 1 2 3 10

¿Cuántas faltas ortográficas tendrı́a un entrevistado que hubiese completado 13 años de estudio? ¿Es fiable
esta predicción?

A.9.3. Una factorı́a de una cierta marca de refrescos ha tomado al azar 18 semanas de un año, observando la
temperatura media, en grados centı́grados (X) correspondiente a cada una de ellas y la cantidad de refrescos
pedidos durante cada uno de dichos perı́odos, en miles (Y ). La información obtenida es la siguiente:

xi 10 28 12 31 30 19 24 5 9 15
yi 21 65 19 72 75 39 67 11 12 24

Dibujar el diagrama de dispersión. Hallar el coeficiente de correlación lineal r. Predecir la temperatura


media de un semana en la que se hubiesen pedido 50.000 refrescos. Decir si esta predicción es fiable.
Predecir el número de refrescos pedidos en una semana en la que la temperatura media fuese de 20 grados
centı́grados.

A.9.4. Se está estudiando la relación existente entre la edad de los hombres (X) y de las mujeres (Y ) a la hora de
contraer matrimonio. Se recogen los datos del año 1971 en la tabla siguiente:

X Y [10,20] (20,25] (25,30] (30,35] (35,40] (40,50] (50,60] (60,80]


[10,20] 4.187 16.272 7.401 864 175 127 5
(20,25] 1.125 55.505 69.151 8.138 1.358 354 26 2
(25,30] 134 8.731 37.480 11.668 2.715 779 64 10
(30,35] 16 485 2.845 4.142 2.602 1.153 120 21
(35,40] 3 104 517 1.110 1.886 1.871 266 57
(40,50] 5 31 142 327 730 2.265 1.176 410
(50,60] 4 12 32 56 314 867 792
(60,80] 1 2 6 33 151 828

¿Existe una dependencia lineal fuerte entre la edad de los hombres y la edad de las mujeres a la hora de
contraer matrimonio? Hacer una predicción de la edad de la esposa cuyo esposo tiene 25 años. ¿Es fiable
esta predicción? Hacer el diagrama de dispersión.

A.9.5. El precio, en pesetas, (X) y el número de páginas (Y ) de los libros contenidos en un catálogo vienen dados
por:
ESTAD ÍSTICA DESCRIPTIVA BIDIMENSIONAL 267

xi yi xi yi xi yi xi yi
19.950 496 27.500 392 21.000 240 12.000 342
9.950 208 12.500 200 15.000 278 21.000 340
17.500 300 25.000 280 27.500 420 17.000 207
15.000 448 8.000 120 10.500 128 35.000 440
12.000 200 5.950 220 9.950 249 7.500 88
30.000 288 9.950 200 35.000 392 21.000 351
32.500 324 32.500 468 20.000 400 25.000 292
35.000 525 24.000 539 27.500 300 37.250 464
37.500 384 30.000 400 15.000 240 24.000 344
25.000 250 30.000 320 16.000 230 12.500 130
18.000 200 35.000 736 12.000 144 22.500 382
15.000 224 22.000 516 38.000 336 25.000 403
30.000 384 37.500 700 37.750 550 20.000 249
25.000 256 20.000 400 30.000 478 18.000 182
17.500 215 30.000 656 17.250 437 38.500 458
17.000 278 9.500 191 9.950 288 3.500 63
20.000 376 19.500 464 18.500 496 30.000 400
22.500 421 20.500 348 18.000 236 21.500 278
32.500 450 30.000 352 12.000 143 27.500 508
30.000 243 32.500 598 17.000 284 16.000 256
12.000 202 27.500 392 28.000 520 30.500 368
15.000 251 24.000 472 38.500 758 15.000 275
21.000 320 36.500 591 25.000 413 12.500 112
35.000 460 14.500 282 27.500 394 38.000 458
12.000 342 21.000 340 17.000 207 7.500 83

Agrupar los datos de ambas variables en intervalos de clase. Determinar la distribución bidimensional de
frecuencias, ası́ como las distribuciones marginales de X y de Y . Hallar el coeficiente de correlación lineal.
Predecir el precio de un libro que tuviera 205 páginas. Decir si esta predicción es fiable.

A.9.6. Las calificaciones obtenidas por un grupo de alumnos en Biologı́a y Fı́sica son:

Biologı́a 3 4 6 7 5 8 7 3 5 4 8 5 5 8 8 8 5
Fı́sica 5 5 8 7 7 9 10 4 7 4 10 5 7 9 10 5 7

a) Escribir la tabla de doble entrada de frecuencias absolutas.


b) Hallar las distribuciones marginales, ası́ como la media y la varianza de dichas distribuciones unidi-
mensionales.
c) ¿Existe relación lineal entre las calificaciones de Biologı́a y Fı́sica?

A.9.7. Se han tomado cinco muestras de glucógeno, de una cantidad fija cada una. Se les ha aplicado una can-
tidad X de glucogensa (en milimoles/litro) anotando en cada caso la velocidad de reacción Y , medida en
micromoles/minuto, obteniéndose los siguientes datos:

X 1 2 3 0’2 0’5
Y 18 35 60 8 10

a) ¿Se puede deducir que la velocidad de reacción aumenta con la concentración de glucogensa? Justifi-
car la respuesta.
b) Si a una de las muestras le hubiésemos aplicado una concentración de glucogensa de 20 5 milimo-
les/litro ¿cuál hubiese sido la velocidad de reacción? ¿Con qué grado de predicción?

A.9.8. Un psicólogo afirma en base a los datos obtenidos, que a medida que un niño crece, menor es el número
de respuestas inadecuadas que da. Los datos son:
268 MATEM ÁTICAS

X 2 3 4 4 5 5 6 7 7 9 9 10 11 11 12
Y 11 12 10 13 11 9 10 7 12 8 7 3 6 5 5

donde X representa la edad en años, e Y representa el número de respuestas inadecuadas.


a) Determinar la validez de esta conclusión.
b) Si Alberto, de diez años y medio, participa en el experimento ¿cuál será el número de respuestas
inadecuadas que dará?
A.9.9. Dada una variable bidimensional (X, Y ), cuya tabla de frecuencias relativas es:

X Y 4 7 10 13 16 17
0 0
1 0 03 0 04 00 03 0 0 0
2 0 00 07 00 09 00 04 0 0
3 0 0 00 04 00 12 00 04 0
4 0 0 00 04 00 12 00 04 0
5 0 00 07 00 09 00 04 0 0
6 00 03 00 04 00 03 0 0 0

Calcular:
a) Distribuciones marginales de frecuencias absolutas.
b) Medias y varianzas marginales.
c) Recta de regresión de Y sobre X.
d) Coeficiente de correlación lineal.
A.9.10. Los datos de la tabla siguiente representan el resultado de un experimento consistente en exponer bacte-
rias, en perı́odos de 1 a 15 intervalos de 6 minutos, a la radiación de rayos X a 200 kilovoltios y contabilizar
el número de bacterias supervivientes. (X representa el número de intervalos de 6 minutos, e Y representa
los cientos de bacterias supervivientes).

X 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
Y 355 211 197 166 142 106 104 60 56 38 36 32 21 19 15

Ajustar a los datos una curva exponencial; representar gráficamente el resultado y comprobar la bondad del
ajuste.
A.9.11. Los datos de la tabla siguiente son el resultado de un estudio del efecto de la temperatura de cristalización
primaria (medida en grados centı́grados) de una solución, xi , sobre el contenido en fósforo (medido en
gramos por litro), yi .

xi yi
25 100 9
20 90 3
15 80 2
12 70 5
9 60 2
6 50 8
3 40 2
0 30 9
−3 20 8
−6 20 0

a) Representar gráficamente la nube de puntos. Determinar el modelo de curva adecuado para representar
la relación entre las variables y encontrar, por el método de mı́nimos cuadrados, los parámetros de la
curva.
ESTAD ÍSTICA DESCRIPTIVA BIDIMENSIONAL 269

b) ¿El ajuste anterior es bueno?

A.9.12. Los datos de la tabla siguiente pertenecen a la medida de la temperatura (X) y la presión (Y ) en diferentes
lugares del Himalaya.

xi yi xi yi xi yi
290 211 2100 8 200 480 1930 4 160 959 1840 1
280 559 2100 2 200 212 1930 6 160 881 1840 6
270 972 2080 4 190 758 1910 4 160 817 1840 1
240 697 2020 5 190 490 1910 1 160 385 1830 2
230 726 2000 6 190 386 1900 6 160 235 1820 4
230 369 2000 1 180 869 1890 5 160 106 1810 9
230 030 1990 5 180 356 1880 8 150 928 1810 9
210 892 1970 0 180 507 1880 5 150 919 1810 0
210 928 1960 4 170 267 1850 7 150 376 1800 6
210 654 1960 3 170 221 1860 0
210 605 1950 6 170 062 1850 6

Explicar la presión en función de la temperatura mediante una parábola (por el método de mı́nimos cuadra-
dos).

4. ACTIVIDADES PRÁCTICAS DEL CAPÍTULO

4.1. Diagrama de dispersión

Para una variable estadı́stica bidimensional, el gráfico más utilizado es el diagrama de dispersión. El progra-
ma dibuja estos diagramas si seleccionamos las opciones Statistics|Summary Statistics|Scatter Plot.
Entonces nos aparece una ventana como en la Figura 9.3 donde debemos seleccionar las variables implicadas
(X-Axis Variable e Y-Axis variable). Si deseamos agrupar los datos en intervalos (de una variable o de las
dos) entonces debemos rellenar los recuadros X-Axis (Optional) o Y-Axis (Optional), según la variable
que queramos agrupar.

Ejercicio. Dibuja el diagrama de dispersión de la variable estadı́stica bidimensional (PESO,ALTURA).

4.2. Covarianza y coeficiente de correlación lineal

Para una variable bidimensional es interesante hallar la matriz de varianzas y covarianzas corregidas. Dicha matriz
es la siguiente:  2 
Sx Sxy
,
Sxy Sy2
donde Sx2 denota la cuasivarianza de X, Sy2 indica la cuasivarianza de Y , y Sxy representa la cuasicovarian-
za entre X e Y . La matriz de varianzas y covarianzas corregidas se puede obtener seleccionando las opciones
Statistics|Linear Models|Variance-Covariance. Entonces aparece una ventana (ver Figura 9.4) en la
que debemos seleccionar las variables estadı́sticas de las cuales queremos calcular su matriz de covarianzas corre-
gidas (en el recuadro Var-Covar Variables).
270 MATEM ÁTICAS

Figura 9.3: Pantalla del programa que permite seleccionar las variables para las que vamos a dibujar el diagrama
de dispersión.

Figura 9.4: Pantalla del programa que permite seleccionar las variables para las que vamos a calcular la matriz de
covarianzas.

Ejercicio. Calcula la matriz de varianzas y covarianzas corregidas de la variable bidimensional (PESO, ALTURA).

Para calcular el coeficiente de correlación lineal de Pearson entre dos variables estadı́sticas debemos seleccionar
las opciones Statistics|Linear Models|Correlations (Pearson) y nos aparece una ventana como en la
Figura 9.5. Tras pulsar el botón OK surge la ventana de resultados, con los coeficientes de correlación lineal entre
todas las variables seleccionadas. En nuestro ejemplo (ver Figura 9.6) el coeficiente entre las variables PESO y
ALTURA es de 00 9384, lo que significa que existe una dependencia lineal fuerte.

Ejercicio. Determina el coeficiente de correlación lineal de Pearson entre las variables ALTURA y PESO.
ESTAD ÍSTICA DESCRIPTIVA BIDIMENSIONAL 271

Figura 9.5: Pantalla del programa que permite calcular el coeficiente de correlación lineal de Pearson.

Figura 9.6: Pantalla con los resultados para la correlación entre el PESO y la ALTURA.

4.3. Recta de regresión. Predicción

La recta de regresión permite estimar el valor de una variable estadı́stica conocido el valor de otra variable, siem-
pre que entre las dos variables estadı́sticas exista dependencia lineal. Cuanto mayor sea esta dependencia lineal,
mejor será la aproximación que nos da la recta de regresión. Para calcular la ecuación de la recta de regre-
sión mı́nimo cuadrática debemos seleccionar las opciones Statistics|Linear Models|Linear Regression
y nos aparece una ventana como en la Figura 9.7. En el recuadro Dependent Variable debemos poner la varia-
ble dependiente (la que está representada en el eje vertical) y en el recuadro Independent Variables la variable
independiente (la que está representada en el eje horizontal).

Por ejemplo, si en la variable dependiente ponemos ALTURA y en la variable independiente colocamos EDAD,
entonces se supone que queremos predecir la altura de un individuo conociendo su edad. La ventana de resultados
se muestra en la Figura 9.8. En dicha figura aparecen muchos valores que no estamos en condiciones de explicar
en este momento, ya que pertenecen a la parte de Estadı́stica Inferencial. Si la ecuación de la recta de regresión
de ALTURA sobre EDAD es ALTURA = A + B EDAD, entonces A = 10 40089 y B = 00 01306.

Para hacer una predicción debemos seleccionar las opciones Results|Prediction, escribiendo en el recuadro
Predictor Values el valor de la variable independiente para el cual queremos estimar el correspondiente va-
lor de la variable dependiente. En la casilla Specification Method debemos seleccionar la opción Valued
Method (ver Figura 9.9). Ası́, para una edad de 24.5 años el valor correspondiente de la altura es de 1.7207
metros.

Una vez hemos calculado la recta de regresión podemos realizar una representación gráfica de la misma. Para
272 MATEM ÁTICAS

Figura 9.7: Pantalla del programa que permite seleccionar las variables para las que vamos a calcular la recta de
regresión.

Figura 9.8: Pantalla del programa que muestra la recta de regresión de ALTURA sobre EDAD.

ello seleccionamos las opciones Results|Plots|Simple Regression Plot. En el gráfico resultante aparece
el diagrama de dispersión (con cruces), la recta de regresión (en color azul) y dos curvas (en color rojo), una por
cada lado de la recta de regresión, que delimitan una zona de confianza para los valores de la variable dependiente
(ver Figura 9.10).

Ejercicio. Halla la ecuación de la recta de regresión mı́nimo cuadrática de ALTURA sobre PESO. Represéntala
gráficamente y predice la altura de un alumno que pesa 60 kilogramos.

5. BIBLIOGRAFÍA DEL CAPÍTULO

CANDEL, J.; MARIN, A. y RUIZ, J.M. Estadı́stica aplicada I: Estadı́stica descriptiva. Barcelona: DM–PPU,
1991. Secciones 3.1, 3.3, 4.1, 4.2, 4.3, 4.4, 4.6.
ESTAD ÍSTICA DESCRIPTIVA BIDIMENSIONAL 273

Figura 9.9: Pantalla del programa que permite estimar el valor de ALTURA para un valor de EDAD.

Simple Regression Plot


1.79

1.74
ALTURA

1.69

1.64

1.59

18 20 22 24 26

EDAD
ALTURA = 1.4009 + 0.0131 * EDAD 95% conf and pred intervals

Figura 9.10: Pantalla del programa que representa la recta de regresión de ALTURA sobre EDAD.

6. PREGUNTAS DE EVALUACIÓN

E.9.1. En un grupo de alumnos de la Universidad de Murcia, se estudia el número de asignaturas aprobadas en


Junio (X) y el número de horas semanales dedicadas al estudio (Y). La información obtenida es la siguiente:

X Y (0, 10] (10, 20] (20, 30] (30, 40]


0 6 2 0 0
1 3 6 2 1
2 1 10 8 3
3 0 10 12 8
4 1 5 10 15
5 0 2 16 10
274 MATEM ÁTICAS

a) Obtener la distribución marginal de frecuencias absolutas de Y. ¿Cuál es el tiempo medio semanal


dedicado al estudio? ¿Cuál es el tiempo semanal de horas de estudio que deja por debajo el 50 por
ciento de los tiempos semanales y por encima el 50 por ciento restante?
b) Obtener la distribución marginal de frecuencias absolutas de X. ¿Cuál es el número más habitual
de asignaturas aprobadas por los alumnos? ¿Cuál es el número medio de asignaturas aprobadas?
Calcular e interpretar la varianza de X. Dibujar un polı́gono acumulativo para la variable X y calcular
su recorrido intercuartı́lico.
c) Obtener la distribución de frecuencias absolutas de Y condicionada a X= 1. ¿Cuál es el tiempo medio
semanal dedicado al estudio por los alumnos que han aprobado una asignatura? ¿Cuál es el tiempo
semanal más habitual en los alumnos que han aprobado una asignatura? Calcular la mediana de esta
distribución.

E.9.2. En una determinada empresa se ha realizado un estudio para determinar si la edad de los empleados está
relacionada con el número de dı́as de ausencia en el trabajo. Estos son los resultados:

Edad (X)
Dı́as de ausencia (Y ) (20,29] (29,38] (38,47] (47,56] (56,65]
(44,50] 0 1 8 7 16
(50,56] 2 6 10 2 4
(56,62] 5 9 5 0 1
(62,68] 14 6 2 2 0

a) Obtener la distribución marginal de frecuencias absolutas y frecuencias acumuladas absolutas de X.


Hallar la mediana, la media y la desviación tı́pica de X.
b) Obtener la distribución marginal de frecuencias absolutas de Y . Hallar la moda, la media y la desvia-
ción tı́pica de Y .
c) Determinar el coeficiente de correlación lineal entre X e Y . ¿Existe una fuerte dependencia lineal
entre X e Y ?

E.9.3. Una empresa nacional dedicada a la producción de videojuegos pretende sacar al mercado dos nuevos
productos: uno para el segmento de 13 a 15 años y otro para el segmento de 16 a 18 años. Antes de fijar
el precio, la empresa contacta con un centro de estudios sociológicos para conocer la asignación semanal
de los jóvenes. Para ello, el centro extrae una muestra de 10 jóvenes y, entre otros datos, se les pregunta la
edad (X, en años) y su asignación semanal (Y , en miles de pesetas), obteniendo los siguientes datos:

Edad (X) 17 16 16 15 14 13 16 18 17 13
Asignación (Y ) 3 4 3 4 1 2 2 5 4 0

a) Calcular recorrido intercuartı́lico y coeficiente de variación de la asignación semanal.


b) ¿Cuál es la asignación semanal estimada para un joven de 16 años? ¿Es fiable dicha predicción?

E.9.4. Un equipo investigador está analizando el comportamiento de los jóvenes españoles respecto del matri-
monio. Para ello extrae una muestra de 10 jóvenes parejas y les pasa un cuestionario. Entre las muchas
preguntas del cuestionario figura la edad a la que contrajeron matrimonio, obteniéndose los siguientes da-
tos:

X: Edad de la mujer 26 25 25 24 23 22 25 27 26 22
Y : Edad del hombre 26 27 26 27 24 25 25 28 27 23

a) Calcular los cuartiles Q1 , Q2 y Q3 de la variable X.


b) Calcular el coeficiente de variación de la variable Y .
c) Calcular la recta de regresión de Y sobre X. Si en una pareja de jóvenes, la mujer tenı́a 28 años
cuando contrajo matrimonio, ¿cuál es la edad estimada del hombre? ¿es fiable esta predicción?
ESTAD ÍSTICA DESCRIPTIVA BIDIMENSIONAL 275

E.9.5. Una editorial está interesada en conocer los hábitos de lectura de los españoles y determinar si existe alguna
relación con otras variables (nivel cultural, nivel económico, edad, etc.). Para ello se extrae una muestra de
10 personas y, entre otros datos, se les pregunta por el número de años de estudio (X) y por el número de
libros que suelen comprar cada trimestre (Y ). Los datos son los que recoge la siguiente tabla:

X 11 10 10 9 8 7 10 12 11 7
Y 3 4 3 4 1 2 2 5 4 0

a) Calcular la media y la mediana de Y .


b) Calcular la desviación media y la desviación mediana de Y .
c) Si una persona suele comprar 2 libros al trimestre, calcular una estimación para el número de años de
estudio. ¿Es fiable dicha predicción?

Potrebbero piacerti anche